KR20200010322A - O-당단백질에 대한 프로테아제 및 결합 폴리펩티드 - Google Patents
O-당단백질에 대한 프로테아제 및 결합 폴리펩티드 Download PDFInfo
- Publication number
- KR20200010322A KR20200010322A KR1020197036837A KR20197036837A KR20200010322A KR 20200010322 A KR20200010322 A KR 20200010322A KR 1020197036837 A KR1020197036837 A KR 1020197036837A KR 20197036837 A KR20197036837 A KR 20197036837A KR 20200010322 A KR20200010322 A KR 20200010322A
- Authority
- KR
- South Korea
- Prior art keywords
- gly
- ala
- leu
- lys
- asp
- Prior art date
Links
- 108090000765 processed proteins & peptides Proteins 0.000 title claims description 339
- 102000004196 processed proteins & peptides Human genes 0.000 title claims description 320
- 229920001184 polypeptide Polymers 0.000 title claims description 296
- 230000027455 binding Effects 0.000 title claims description 58
- 238000009739 binding Methods 0.000 title claims description 56
- 102000035195 Peptidases Human genes 0.000 title description 17
- 108091005804 Peptidases Proteins 0.000 title description 17
- 239000004365 Protease Substances 0.000 title description 15
- 101710118538 Protease Proteins 0.000 claims abstract description 68
- 102000003886 Glycoproteins Human genes 0.000 claims abstract description 52
- 108090000288 Glycoproteins Proteins 0.000 claims abstract description 52
- 230000002829 reductive effect Effects 0.000 claims abstract description 25
- 230000003301 hydrolyzing effect Effects 0.000 claims abstract description 12
- 230000000694 effects Effects 0.000 claims description 114
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 106
- 108090000623 proteins and genes Proteins 0.000 claims description 92
- 238000000034 method Methods 0.000 claims description 86
- 102000004169 proteins and genes Human genes 0.000 claims description 84
- 150000001413 amino acids Chemical class 0.000 claims description 78
- 102000005348 Neuraminidase Human genes 0.000 claims description 74
- 108010006232 Neuraminidase Proteins 0.000 claims description 74
- 239000000203 mixture Substances 0.000 claims description 64
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 claims description 49
- 238000004458 analytical method Methods 0.000 claims description 36
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 claims description 33
- 229930182817 methionine Natural products 0.000 claims description 32
- 239000012634 fragment Substances 0.000 claims description 29
- 102000005741 Metalloproteases Human genes 0.000 claims description 28
- 108010006035 Metalloproteases Proteins 0.000 claims description 28
- 239000004202 carbamide Substances 0.000 claims description 25
- 238000004949 mass spectrometry Methods 0.000 claims description 21
- 239000000872 buffer Substances 0.000 claims description 20
- 238000003776 cleavage reaction Methods 0.000 claims description 19
- 230000007062 hydrolysis Effects 0.000 claims description 19
- 238000006460 hydrolysis reaction Methods 0.000 claims description 19
- 229910052698 phosphorus Inorganic materials 0.000 claims description 18
- 230000007017 scission Effects 0.000 claims description 18
- 108091006033 O-glycosylated proteins Proteins 0.000 claims description 17
- 229910052799 carbon Inorganic materials 0.000 claims description 17
- 229910052720 vanadium Inorganic materials 0.000 claims description 17
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 claims description 16
- 229910052757 nitrogen Inorganic materials 0.000 claims description 14
- 108010015899 Glycopeptides Proteins 0.000 claims description 10
- 102000002068 Glycopeptides Human genes 0.000 claims description 10
- 108090001090 Lectins Proteins 0.000 claims description 10
- 102000004856 Lectins Human genes 0.000 claims description 10
- 239000002523 lectin Substances 0.000 claims description 10
- 239000000463 material Substances 0.000 claims description 9
- 239000003599 detergent Substances 0.000 claims description 8
- 230000013595 glycosylation Effects 0.000 claims description 8
- 238000006206 glycosylation reaction Methods 0.000 claims description 8
- DQJCDTNMLBYVAY-ZXXIYAEKSA-N (2S,5R,10R,13R)-16-{[(2R,3S,4R,5R)-3-{[(2S,3R,4R,5S,6R)-3-acetamido-4,5-dihydroxy-6-(hydroxymethyl)oxan-2-yl]oxy}-5-(ethylamino)-6-hydroxy-2-(hydroxymethyl)oxan-4-yl]oxy}-5-(4-aminobutyl)-10-carbamoyl-2,13-dimethyl-4,7,12,15-tetraoxo-3,6,11,14-tetraazaheptadecan-1-oic acid Chemical compound NCCCC[C@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)CC[C@H](C(N)=O)NC(=O)[C@@H](C)NC(=O)C(C)O[C@@H]1[C@@H](NCC)C(O)O[C@H](CO)[C@H]1O[C@H]1[C@H](NC(C)=O)[C@@H](O)[C@H](O)[C@@H](CO)O1 DQJCDTNMLBYVAY-ZXXIYAEKSA-N 0.000 claims description 7
- 238000001514 detection method Methods 0.000 claims description 7
- 238000001042 affinity chromatography Methods 0.000 claims description 6
- 238000003556 assay Methods 0.000 claims description 6
- 238000004128 high performance liquid chromatography Methods 0.000 claims description 4
- 230000002209 hydrophobic effect Effects 0.000 claims description 4
- 238000002965 ELISA Methods 0.000 claims description 3
- 229910052721 tungsten Inorganic materials 0.000 claims description 3
- 229910052727 yttrium Inorganic materials 0.000 claims description 3
- 238000002955 isolation Methods 0.000 abstract description 6
- 238000011160 research Methods 0.000 abstract description 3
- 235000001014 amino acid Nutrition 0.000 description 73
- 235000018102 proteins Nutrition 0.000 description 70
- 239000000523 sample Substances 0.000 description 64
- 239000011347 resin Substances 0.000 description 60
- 229920005989 resin Polymers 0.000 description 60
- 108010008165 Etanercept Proteins 0.000 description 55
- 229960000403 etanercept Drugs 0.000 description 48
- 239000000758 substrate Substances 0.000 description 41
- 102000003951 Erythropoietin Human genes 0.000 description 36
- 108090000394 Erythropoietin Proteins 0.000 description 36
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 36
- 229940105423 erythropoietin Drugs 0.000 description 36
- 239000002953 phosphate buffered saline Substances 0.000 description 36
- OXCMYAYHXIHQOA-UHFFFAOYSA-N potassium;[2-butyl-5-chloro-3-[[4-[2-(1,2,4-triaza-3-azanidacyclopenta-1,4-dien-5-yl)phenyl]phenyl]methyl]imidazol-4-yl]methanol Chemical compound [K+].CCCCC1=NC(Cl)=C(CO)N1CC1=CC=C(C=2C(=CC=CC=2)C2=N[N-]N=N2)C=C1 OXCMYAYHXIHQOA-UHFFFAOYSA-N 0.000 description 36
- 102000004190 Enzymes Human genes 0.000 description 33
- 108090000790 Enzymes Proteins 0.000 description 33
- 229940088598 enzyme Drugs 0.000 description 33
- 108010050848 glycylleucine Proteins 0.000 description 33
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 28
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 28
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 28
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 26
- SQVRNKJHWKZAKO-UHFFFAOYSA-N beta-N-Acetyl-D-neuraminic acid Natural products CC(=O)NC1C(O)CC(O)(C(O)=O)OC1C(O)C(O)CO SQVRNKJHWKZAKO-UHFFFAOYSA-N 0.000 description 26
- 238000007792 addition Methods 0.000 description 25
- 230000000875 corresponding effect Effects 0.000 description 25
- 108010047495 alanylglycine Proteins 0.000 description 24
- 238000011534 incubation Methods 0.000 description 24
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 23
- SQVRNKJHWKZAKO-OQPLDHBCSA-N sialic acid Chemical compound CC(=O)N[C@@H]1[C@@H](O)C[C@@](O)(C(O)=O)OC1[C@H](O)[C@H](O)CO SQVRNKJHWKZAKO-OQPLDHBCSA-N 0.000 description 20
- 108010047857 aspartylglycine Proteins 0.000 description 19
- 108010089804 glycyl-threonine Proteins 0.000 description 19
- 108010015792 glycyllysine Proteins 0.000 description 19
- 108010034529 leucyl-lysine Proteins 0.000 description 19
- 238000006467 substitution reaction Methods 0.000 description 19
- 108010068265 aspartyltyrosine Proteins 0.000 description 18
- 239000000047 product Substances 0.000 description 18
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 18
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 16
- 210000004899 c-terminal region Anatomy 0.000 description 16
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 16
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 16
- 108010070643 prolylglutamic acid Proteins 0.000 description 16
- 108010070944 alanylhistidine Proteins 0.000 description 15
- 210000004027 cell Anatomy 0.000 description 15
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 14
- 108060003951 Immunoglobulin Proteins 0.000 description 14
- 108010092854 aspartyllysine Proteins 0.000 description 14
- 102000018358 immunoglobulin Human genes 0.000 description 14
- 108091033319 polynucleotide Proteins 0.000 description 14
- 239000002157 polynucleotide Substances 0.000 description 14
- 102000040430 polynucleotide Human genes 0.000 description 14
- 238000000746 purification Methods 0.000 description 14
- 239000011780 sodium chloride Substances 0.000 description 14
- 108010061238 threonyl-glycine Proteins 0.000 description 14
- 238000002474 experimental method Methods 0.000 description 13
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 13
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 13
- 108010054155 lysyllysine Proteins 0.000 description 13
- 238000000926 separation method Methods 0.000 description 13
- 108010051110 tyrosyl-lysine Proteins 0.000 description 13
- 241000588724 Escherichia coli Species 0.000 description 12
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 12
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 12
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 11
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 11
- 229920002684 Sepharose Polymers 0.000 description 11
- 108090000631 Trypsin Proteins 0.000 description 11
- 102000004142 Trypsin Human genes 0.000 description 11
- 108010078144 glutaminyl-glycine Proteins 0.000 description 11
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 11
- 108010010147 glycylglutamine Proteins 0.000 description 11
- 108010092114 histidylphenylalanine Proteins 0.000 description 11
- 108010051242 phenylalanylserine Proteins 0.000 description 11
- 108010026333 seryl-proline Proteins 0.000 description 11
- 239000012588 trypsin Substances 0.000 description 11
- 239000013598 vector Substances 0.000 description 11
- 108020004414 DNA Proteins 0.000 description 10
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 10
- 241000880493 Leptailurus serval Species 0.000 description 10
- 108010079364 N-glycylalanine Proteins 0.000 description 10
- HIINQLBHPIQYHN-JTQLQIEISA-N Tyr-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HIINQLBHPIQYHN-JTQLQIEISA-N 0.000 description 10
- 108010077245 asparaginyl-proline Proteins 0.000 description 10
- 125000004093 cyano group Chemical group *C#N 0.000 description 10
- 238000010828 elution Methods 0.000 description 10
- 239000000499 gel Substances 0.000 description 10
- 150000004676 glycans Chemical class 0.000 description 10
- 108010003700 lysyl aspartic acid Proteins 0.000 description 10
- 108010009298 lysylglutamic acid Proteins 0.000 description 10
- 108010073969 valyllysine Proteins 0.000 description 10
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 9
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 9
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 9
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 9
- 230000004989 O-glycosylation Effects 0.000 description 9
- 108010005233 alanylglutamic acid Proteins 0.000 description 9
- 108010008355 arginyl-glutamine Proteins 0.000 description 9
- 108010038633 aspartylglutamate Proteins 0.000 description 9
- 239000012148 binding buffer Substances 0.000 description 9
- 229940098773 bovine serum albumin Drugs 0.000 description 9
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Chemical compound NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 9
- 108010037850 glycylvaline Proteins 0.000 description 9
- 150000007523 nucleic acids Chemical class 0.000 description 9
- 235000019419 proteases Nutrition 0.000 description 9
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 9
- 210000002966 serum Anatomy 0.000 description 9
- 238000012360 testing method Methods 0.000 description 9
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 8
- LBYMZCVBOKYZNS-CIUDSAMLSA-N Ala-Leu-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O LBYMZCVBOKYZNS-CIUDSAMLSA-N 0.000 description 8
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 8
- 102000005744 Glycoside Hydrolases Human genes 0.000 description 8
- 108010031186 Glycoside Hydrolases Proteins 0.000 description 8
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 8
- YDDDRTIPNTWGIG-SRVKXCTJSA-N Lys-Lys-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O YDDDRTIPNTWGIG-SRVKXCTJSA-N 0.000 description 8
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 8
- 241000194025 Streptococcus oralis Species 0.000 description 8
- 239000007983 Tris buffer Substances 0.000 description 8
- 108010044940 alanylglutamine Proteins 0.000 description 8
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 8
- 108010036413 histidylglycine Proteins 0.000 description 8
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 8
- 239000003656 tris buffered saline Substances 0.000 description 8
- 241000702462 Akkermansia muciniphila Species 0.000 description 7
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 7
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 7
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 7
- 239000004471 Glycine Substances 0.000 description 7
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 7
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 7
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 7
- CDBXVDXSLPLFMD-BPNCWPANSA-N Tyr-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDBXVDXSLPLFMD-BPNCWPANSA-N 0.000 description 7
- DJEVQCWNMQOABE-RCOVLWMOSA-N Val-Gly-Asp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N DJEVQCWNMQOABE-RCOVLWMOSA-N 0.000 description 7
- 108010011559 alanylphenylalanine Proteins 0.000 description 7
- 108010087924 alanylproline Proteins 0.000 description 7
- 108010013835 arginine glutamate Proteins 0.000 description 7
- 108010068380 arginylarginine Proteins 0.000 description 7
- 108010062796 arginyllysine Proteins 0.000 description 7
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 7
- 238000001739 density measurement Methods 0.000 description 7
- 229940073621 enbrel Drugs 0.000 description 7
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 7
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 7
- 108010073628 glutamyl-valyl-phenylalanine Proteins 0.000 description 7
- 108010079547 glutamylmethionine Proteins 0.000 description 7
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 7
- 108010087810 leucyl-seryl-glutamyl-leucine Proteins 0.000 description 7
- 108010064235 lysylglycine Proteins 0.000 description 7
- 102000039446 nucleic acids Human genes 0.000 description 7
- 108020004707 nucleic acids Proteins 0.000 description 7
- 239000002773 nucleotide Substances 0.000 description 7
- 125000003729 nucleotide group Chemical group 0.000 description 7
- 238000004366 reverse phase liquid chromatography Methods 0.000 description 7
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 6
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 6
- PZXPWHFYZXTFBI-YUMQZZPRSA-N Asp-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PZXPWHFYZXTFBI-YUMQZZPRSA-N 0.000 description 6
- OFPWCBGRYAOLMU-AVGNSLFASA-N Gln-Asp-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O OFPWCBGRYAOLMU-AVGNSLFASA-N 0.000 description 6
- LVNILKSSFHCSJZ-IHRRRGAJSA-N Gln-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N LVNILKSSFHCSJZ-IHRRRGAJSA-N 0.000 description 6
- MFYLRRCYBBJYPI-JYJNAYRXSA-N Glu-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O MFYLRRCYBBJYPI-JYJNAYRXSA-N 0.000 description 6
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 6
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 6
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 6
- RGPWUJOMKFYFSR-QWRGUYRKSA-N His-Gly-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O RGPWUJOMKFYFSR-QWRGUYRKSA-N 0.000 description 6
- PELCGFMHLZXWBQ-BJDJZHNGSA-N Ile-Ser-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)O)N PELCGFMHLZXWBQ-BJDJZHNGSA-N 0.000 description 6
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 6
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 6
- BPANDPNDMJHFEV-CIUDSAMLSA-N Leu-Asp-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O BPANDPNDMJHFEV-CIUDSAMLSA-N 0.000 description 6
- KAFOIVJDVSZUMD-DCAQKATOSA-N Leu-Gln-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-DCAQKATOSA-N 0.000 description 6
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 6
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 6
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 6
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 6
- IUVYJBMTHARMIP-PCBIJLKTSA-N Phe-Asp-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O IUVYJBMTHARMIP-PCBIJLKTSA-N 0.000 description 6
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 6
- QIVPZSWBBHRNBA-JYJNAYRXSA-N Val-Pro-Phe Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O QIVPZSWBBHRNBA-JYJNAYRXSA-N 0.000 description 6
- 108010060035 arginylproline Proteins 0.000 description 6
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 6
- 238000005119 centrifugation Methods 0.000 description 6
- 230000029087 digestion Effects 0.000 description 6
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 6
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 6
- 102000035122 glycosylated proteins Human genes 0.000 description 6
- 108091005608 glycosylated proteins Proteins 0.000 description 6
- 108010081551 glycylphenylalanine Proteins 0.000 description 6
- 108010077515 glycylproline Proteins 0.000 description 6
- 230000003993 interaction Effects 0.000 description 6
- 108010060857 isoleucyl-valyl-tyrosine Proteins 0.000 description 6
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 6
- 108010057821 leucylproline Proteins 0.000 description 6
- 108010017391 lysylvaline Proteins 0.000 description 6
- 108010029020 prolylglycine Proteins 0.000 description 6
- 125000005629 sialic acid group Chemical group 0.000 description 6
- 229920000936 Agarose Polymers 0.000 description 5
- BUANFPRKJKJSRR-ACZMJKKPSA-N Ala-Ala-Gln Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CCC(N)=O BUANFPRKJKJSRR-ACZMJKKPSA-N 0.000 description 5
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 5
- RMAWDDRDTRSZIR-ZLUOBGJFSA-N Ala-Ser-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RMAWDDRDTRSZIR-ZLUOBGJFSA-N 0.000 description 5
- PGNNQOJOEGFAOR-KWQFWETISA-N Ala-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 PGNNQOJOEGFAOR-KWQFWETISA-N 0.000 description 5
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 5
- JLNFZLNDHONLND-GARJFASQSA-N Asn-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N JLNFZLNDHONLND-GARJFASQSA-N 0.000 description 5
- KHBLRHKVXICFMY-GUBZILKMSA-N Asp-Glu-Lys Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O KHBLRHKVXICFMY-GUBZILKMSA-N 0.000 description 5
- 241000193468 Clostridium perfringens Species 0.000 description 5
- 108020004705 Codon Proteins 0.000 description 5
- AAOBFSKXAVIORT-GUBZILKMSA-N Gln-Asn-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O AAOBFSKXAVIORT-GUBZILKMSA-N 0.000 description 5
- JFSNBQJNDMXMQF-XHNCKOQMSA-N Gln-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O JFSNBQJNDMXMQF-XHNCKOQMSA-N 0.000 description 5
- UTKUTMJSWKKHEM-WDSKDSINSA-N Glu-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O UTKUTMJSWKKHEM-WDSKDSINSA-N 0.000 description 5
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 5
- LURCIJSJAKFCRO-QWRGUYRKSA-N Gly-Asn-Tyr Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LURCIJSJAKFCRO-QWRGUYRKSA-N 0.000 description 5
- TZOVVRJYUDETQG-RCOVLWMOSA-N Gly-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN TZOVVRJYUDETQG-RCOVLWMOSA-N 0.000 description 5
- IUZGUFAJDBHQQV-YUMQZZPRSA-N Gly-Leu-Asn Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IUZGUFAJDBHQQV-YUMQZZPRSA-N 0.000 description 5
- WDEHMRNSGHVNOH-VHSXEESVSA-N Gly-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)CN)C(=O)O WDEHMRNSGHVNOH-VHSXEESVSA-N 0.000 description 5
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 5
- ULXYQAJWJGLCNR-YUMQZZPRSA-N Leu-Asp-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 5
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 5
- JGKHAFUAPZCCDU-BZSNNMDCSA-N Leu-Tyr-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=C(O)C=C1 JGKHAFUAPZCCDU-BZSNNMDCSA-N 0.000 description 5
- FLCMXEFCTLXBTL-DCAQKATOSA-N Lys-Asp-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N FLCMXEFCTLXBTL-DCAQKATOSA-N 0.000 description 5
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 5
- IUWMQCZOTYRXPL-ZPFDUUQYSA-N Lys-Ile-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O IUWMQCZOTYRXPL-ZPFDUUQYSA-N 0.000 description 5
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 5
- CNGOEHJCLVCJHN-SRVKXCTJSA-N Lys-Pro-Glu Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O CNGOEHJCLVCJHN-SRVKXCTJSA-N 0.000 description 5
- WZVSHTFTCYOFPL-GARJFASQSA-N Lys-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N)C(=O)O WZVSHTFTCYOFPL-GARJFASQSA-N 0.000 description 5
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 5
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 5
- 102000012404 Orosomucoid Human genes 0.000 description 5
- 108010061952 Orosomucoid Proteins 0.000 description 5
- LGBVMDMZZFYSFW-HJWJTTGWSA-N Phe-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CC=CC=C1)N LGBVMDMZZFYSFW-HJWJTTGWSA-N 0.000 description 5
- SMFGCTXUBWEPKM-KBPBESRZSA-N Phe-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 SMFGCTXUBWEPKM-KBPBESRZSA-N 0.000 description 5
- BPIMVBKDLSBKIJ-FCLVOEFKSA-N Phe-Thr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 BPIMVBKDLSBKIJ-FCLVOEFKSA-N 0.000 description 5
- 108010076504 Protein Sorting Signals Proteins 0.000 description 5
- MUARUIBTKQJKFY-WHFBIAKZSA-N Ser-Gly-Asp Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MUARUIBTKQJKFY-WHFBIAKZSA-N 0.000 description 5
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 5
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 5
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 5
- 241000194017 Streptococcus Species 0.000 description 5
- MFEBUIFJVPNZLO-OLHMAJIHSA-N Thr-Asp-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O MFEBUIFJVPNZLO-OLHMAJIHSA-N 0.000 description 5
- KZTLZZQTJMCGIP-ZJDVBMNYSA-N Thr-Val-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KZTLZZQTJMCGIP-ZJDVBMNYSA-N 0.000 description 5
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 5
- 239000004473 Threonine Substances 0.000 description 5
- DXYWRYQRKPIGGU-BPNCWPANSA-N Tyr-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DXYWRYQRKPIGGU-BPNCWPANSA-N 0.000 description 5
- RWOGENDAOGMHLX-DCAQKATOSA-N Val-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N RWOGENDAOGMHLX-DCAQKATOSA-N 0.000 description 5
- 108010038211 Vicia lectins Proteins 0.000 description 5
- 238000001261 affinity purification Methods 0.000 description 5
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 5
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 5
- 238000013459 approach Methods 0.000 description 5
- 108010093581 aspartyl-proline Proteins 0.000 description 5
- 230000008859 change Effects 0.000 description 5
- 239000003795 chemical substances by application Substances 0.000 description 5
- 239000012149 elution buffer Substances 0.000 description 5
- 108010049041 glutamylalanine Proteins 0.000 description 5
- 108010087823 glycyltyrosine Proteins 0.000 description 5
- 108010091871 leucylmethionine Proteins 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 5
- 108010053725 prolylvaline Proteins 0.000 description 5
- -1 promoters Substances 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- 108010080629 tryptophan-leucine Proteins 0.000 description 5
- 108010020532 tyrosyl-proline Proteins 0.000 description 5
- 238000005406 washing Methods 0.000 description 5
- 108010000998 wheylin-2 peptide Proteins 0.000 description 5
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 4
- AAQGRPOPTAUUBM-ZLUOBGJFSA-N Ala-Ala-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O AAQGRPOPTAUUBM-ZLUOBGJFSA-N 0.000 description 4
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 4
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 4
- WGDNWOMKBUXFHR-BQBZGAKWSA-N Ala-Gly-Arg Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N WGDNWOMKBUXFHR-BQBZGAKWSA-N 0.000 description 4
- VNYMOTCMNHJGTG-JBDRJPRFSA-N Ala-Ile-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O VNYMOTCMNHJGTG-JBDRJPRFSA-N 0.000 description 4
- OMFMCIVBKCEMAK-CYDGBPFRSA-N Ala-Leu-Val-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O OMFMCIVBKCEMAK-CYDGBPFRSA-N 0.000 description 4
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 4
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 4
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 4
- OMSKGWFGWCQFBD-KZVJFYERSA-N Ala-Val-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OMSKGWFGWCQFBD-KZVJFYERSA-N 0.000 description 4
- XEPSCVXTCUUHDT-AVGNSLFASA-N Arg-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCN=C(N)N XEPSCVXTCUUHDT-AVGNSLFASA-N 0.000 description 4
- PBSOQGZLPFVXPU-YUMQZZPRSA-N Arg-Glu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PBSOQGZLPFVXPU-YUMQZZPRSA-N 0.000 description 4
- MSILNNHVVMMTHZ-UWVGGRQHSA-N Arg-His-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CN=CN1 MSILNNHVVMMTHZ-UWVGGRQHSA-N 0.000 description 4
- LJUOLNXOWSWGKF-ACZMJKKPSA-N Asn-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N LJUOLNXOWSWGKF-ACZMJKKPSA-N 0.000 description 4
- BHQQRVARKXWXPP-ACZMJKKPSA-N Asn-Asp-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N BHQQRVARKXWXPP-ACZMJKKPSA-N 0.000 description 4
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 4
- SPCONPVIDFMDJI-QSFUFRPTSA-N Asn-Ile-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O SPCONPVIDFMDJI-QSFUFRPTSA-N 0.000 description 4
- QNNBHTFDFFFHGC-KKUMJFAQSA-N Asn-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QNNBHTFDFFFHGC-KKUMJFAQSA-N 0.000 description 4
- XEGZSHSPQNDNRH-JRQIVUDYSA-N Asn-Tyr-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XEGZSHSPQNDNRH-JRQIVUDYSA-N 0.000 description 4
- RGKKALNPOYURGE-ZKWXMUAHSA-N Asp-Ala-Val Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O RGKKALNPOYURGE-ZKWXMUAHSA-N 0.000 description 4
- SDHFVYLZFBDSQT-DCAQKATOSA-N Asp-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N SDHFVYLZFBDSQT-DCAQKATOSA-N 0.000 description 4
- VHQOCWWKXIOAQI-WDSKDSINSA-N Asp-Gln-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VHQOCWWKXIOAQI-WDSKDSINSA-N 0.000 description 4
- PMEHKVHZQKJACS-PEFMBERDSA-N Asp-Gln-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PMEHKVHZQKJACS-PEFMBERDSA-N 0.000 description 4
- OVPHVTCDVYYTHN-AVGNSLFASA-N Asp-Glu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OVPHVTCDVYYTHN-AVGNSLFASA-N 0.000 description 4
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 4
- YIDFBWRHIYOYAA-LKXGYXEUSA-N Asp-Ser-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YIDFBWRHIYOYAA-LKXGYXEUSA-N 0.000 description 4
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 4
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 4
- 241000194033 Enterococcus Species 0.000 description 4
- RGRMOYQUIJVQQD-SRVKXCTJSA-N Gln-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N RGRMOYQUIJVQQD-SRVKXCTJSA-N 0.000 description 4
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 4
- VZRAXPGTUNDIDK-GUBZILKMSA-N Gln-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N VZRAXPGTUNDIDK-GUBZILKMSA-N 0.000 description 4
- ZSWGJYOZWBHROQ-RWRJDSDZSA-N Glu-Ile-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSWGJYOZWBHROQ-RWRJDSDZSA-N 0.000 description 4
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 4
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 4
- KJBGAZSLZAQDPV-KKUMJFAQSA-N Glu-Phe-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N KJBGAZSLZAQDPV-KKUMJFAQSA-N 0.000 description 4
- NNQDRRUXFJYCCJ-NHCYSSNCSA-N Glu-Pro-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O NNQDRRUXFJYCCJ-NHCYSSNCSA-N 0.000 description 4
- LZEUDRYSAZAJIO-AUTRQRHGSA-N Glu-Val-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZEUDRYSAZAJIO-AUTRQRHGSA-N 0.000 description 4
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 4
- WKJKBELXHCTHIJ-WPRPVWTQSA-N Gly-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N WKJKBELXHCTHIJ-WPRPVWTQSA-N 0.000 description 4
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 4
- MHZXESQPPXOING-KBPBESRZSA-N Gly-Lys-Phe Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MHZXESQPPXOING-KBPBESRZSA-N 0.000 description 4
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 4
- DBJYVKDPGIFXFO-BQBZGAKWSA-N Gly-Met-Ala Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O DBJYVKDPGIFXFO-BQBZGAKWSA-N 0.000 description 4
- OHUKZZYSJBKFRR-WHFBIAKZSA-N Gly-Ser-Asp Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O OHUKZZYSJBKFRR-WHFBIAKZSA-N 0.000 description 4
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 4
- FFALDIDGPLUDKV-ZDLURKLDSA-N Gly-Thr-Ser Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O FFALDIDGPLUDKV-ZDLURKLDSA-N 0.000 description 4
- HQSKKSLNLSTONK-JTQLQIEISA-N Gly-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 HQSKKSLNLSTONK-JTQLQIEISA-N 0.000 description 4
- STOOMQFEJUVAKR-KKUMJFAQSA-N His-His-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CNC=N1 STOOMQFEJUVAKR-KKUMJFAQSA-N 0.000 description 4
- AIPUZFXMXAHZKY-QWRGUYRKSA-N His-Leu-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AIPUZFXMXAHZKY-QWRGUYRKSA-N 0.000 description 4
- NKRWVZQTPXPNRZ-SRVKXCTJSA-N His-Met-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC1=CN=CN1 NKRWVZQTPXPNRZ-SRVKXCTJSA-N 0.000 description 4
- MKWFGXSFLYNTKC-XIRDDKMYSA-N His-Trp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC3=CN=CN3)N MKWFGXSFLYNTKC-XIRDDKMYSA-N 0.000 description 4
- ISQOVWDWRUONJH-YESZJQIVSA-N His-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CN=CN3)N)C(=O)O ISQOVWDWRUONJH-YESZJQIVSA-N 0.000 description 4
- VAXBXNPRXPHGHG-BJDJZHNGSA-N Ile-Ala-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)O)N VAXBXNPRXPHGHG-BJDJZHNGSA-N 0.000 description 4
- MTONDYJJCIBZTK-PEDHHIEDSA-N Ile-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(=O)O)N MTONDYJJCIBZTK-PEDHHIEDSA-N 0.000 description 4
- 108010065920 Insulin Lispro Proteins 0.000 description 4
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 4
- VBZOAGIPCULURB-QWRGUYRKSA-N Leu-Gly-His Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N VBZOAGIPCULURB-QWRGUYRKSA-N 0.000 description 4
- SEMUSFOBZGKBGW-YTFOTSKYSA-N Leu-Ile-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SEMUSFOBZGKBGW-YTFOTSKYSA-N 0.000 description 4
- FLNPJLDPGMLWAU-UWVGGRQHSA-N Leu-Met-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(C)C FLNPJLDPGMLWAU-UWVGGRQHSA-N 0.000 description 4
- BTSXLXFPMZXVPR-DLOVCJGASA-N Lys-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCCN)N BTSXLXFPMZXVPR-DLOVCJGASA-N 0.000 description 4
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 4
- VQXAVLQBQJMENB-SRVKXCTJSA-N Lys-Glu-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O VQXAVLQBQJMENB-SRVKXCTJSA-N 0.000 description 4
- UQRZFMQQXXJTTF-AVGNSLFASA-N Lys-Lys-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O UQRZFMQQXXJTTF-AVGNSLFASA-N 0.000 description 4
- RSOMVHWMIAZNLE-HJWJTTGWSA-N Met-Phe-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RSOMVHWMIAZNLE-HJWJTTGWSA-N 0.000 description 4
- LUYURUYVNYGKGM-RCWTZXSCSA-N Met-Pro-Thr Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O LUYURUYVNYGKGM-RCWTZXSCSA-N 0.000 description 4
- PXHVJJICTQNCMI-UHFFFAOYSA-N Nickel Chemical compound [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 4
- CYZBFPYMSJGBRL-DRZSPHRISA-N Phe-Ala-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CYZBFPYMSJGBRL-DRZSPHRISA-N 0.000 description 4
- QPVFUAUFEBPIPT-CDMKHQONSA-N Phe-Gly-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O QPVFUAUFEBPIPT-CDMKHQONSA-N 0.000 description 4
- CMHTUJQZQXFNTQ-OEAJRASXSA-N Phe-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O CMHTUJQZQXFNTQ-OEAJRASXSA-N 0.000 description 4
- DNAXXTQSTKOHFO-QEJZJMRPSA-N Phe-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 DNAXXTQSTKOHFO-QEJZJMRPSA-N 0.000 description 4
- AUJWXNGCAQWLEI-KBPBESRZSA-N Phe-Lys-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O AUJWXNGCAQWLEI-KBPBESRZSA-N 0.000 description 4
- GCFNFKNPCMBHNT-IRXDYDNUSA-N Phe-Tyr-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)NCC(=O)O)N GCFNFKNPCMBHNT-IRXDYDNUSA-N 0.000 description 4
- UTAUEDINXUMHLG-FXQIFTODSA-N Pro-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 UTAUEDINXUMHLG-FXQIFTODSA-N 0.000 description 4
- DEDANIDYQAPTFI-IHRRRGAJSA-N Pro-Asp-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O DEDANIDYQAPTFI-IHRRRGAJSA-N 0.000 description 4
- DMKWYMWNEKIPFC-IUCAKERBSA-N Pro-Gly-Arg Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O DMKWYMWNEKIPFC-IUCAKERBSA-N 0.000 description 4
- HAAQQNHQZBOWFO-LURJTMIESA-N Pro-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H]1CCCN1 HAAQQNHQZBOWFO-LURJTMIESA-N 0.000 description 4
- POQFNPILEQEODH-FXQIFTODSA-N Pro-Ser-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O POQFNPILEQEODH-FXQIFTODSA-N 0.000 description 4
- JDJMFMVVJHLWDP-UNQGMJICSA-N Pro-Thr-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JDJMFMVVJHLWDP-UNQGMJICSA-N 0.000 description 4
- ZMLRZBWCXPQADC-TUAOUCFPSA-N Pro-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ZMLRZBWCXPQADC-TUAOUCFPSA-N 0.000 description 4
- 241000589516 Pseudomonas Species 0.000 description 4
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 4
- NLQUOHDCLSFABG-GUBZILKMSA-N Ser-Arg-Arg Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NLQUOHDCLSFABG-GUBZILKMSA-N 0.000 description 4
- KCFKKAQKRZBWJB-ZLUOBGJFSA-N Ser-Cys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O KCFKKAQKRZBWJB-ZLUOBGJFSA-N 0.000 description 4
- BPMRXBZYPGYPJN-WHFBIAKZSA-N Ser-Gly-Asn Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BPMRXBZYPGYPJN-WHFBIAKZSA-N 0.000 description 4
- WSTIOCFMWXNOCX-YUMQZZPRSA-N Ser-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N WSTIOCFMWXNOCX-YUMQZZPRSA-N 0.000 description 4
- XXNYYSXNXCJYKX-DCAQKATOSA-N Ser-Leu-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O XXNYYSXNXCJYKX-DCAQKATOSA-N 0.000 description 4
- MQUZANJDFOQOBX-SRVKXCTJSA-N Ser-Phe-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O MQUZANJDFOQOBX-SRVKXCTJSA-N 0.000 description 4
- FLONGDPORFIVQW-XGEHTFHBSA-N Ser-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FLONGDPORFIVQW-XGEHTFHBSA-N 0.000 description 4
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 4
- UKBSDLHIKIXJKH-HJGDQZAQSA-N Thr-Arg-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UKBSDLHIKIXJKH-HJGDQZAQSA-N 0.000 description 4
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 4
- JWQNAFHCXKVZKZ-UVOCVTCTSA-N Thr-Lys-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWQNAFHCXKVZKZ-UVOCVTCTSA-N 0.000 description 4
- KERCOYANYUPLHJ-XGEHTFHBSA-N Thr-Pro-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O KERCOYANYUPLHJ-XGEHTFHBSA-N 0.000 description 4
- PWONLXBUSVIZPH-RHYQMDGZSA-N Thr-Val-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O PWONLXBUSVIZPH-RHYQMDGZSA-N 0.000 description 4
- PXQPYPMSLBQHJJ-WFBYXXMGSA-N Trp-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N PXQPYPMSLBQHJJ-WFBYXXMGSA-N 0.000 description 4
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 4
- 102000000852 Tumor Necrosis Factor-alpha Human genes 0.000 description 4
- GAYLGYUVTDMLKC-UWJYBYFXSA-N Tyr-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GAYLGYUVTDMLKC-UWJYBYFXSA-N 0.000 description 4
- LOOCQRRBKZTPKO-AVGNSLFASA-N Tyr-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 LOOCQRRBKZTPKO-AVGNSLFASA-N 0.000 description 4
- CNLKDWSAORJEMW-KWQFWETISA-N Tyr-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O CNLKDWSAORJEMW-KWQFWETISA-N 0.000 description 4
- JKUZFODWJGEQAP-KBPBESRZSA-N Tyr-Gly-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O JKUZFODWJGEQAP-KBPBESRZSA-N 0.000 description 4
- QAYSODICXVZUIA-WLTAIBSBSA-N Tyr-Gly-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O QAYSODICXVZUIA-WLTAIBSBSA-N 0.000 description 4
- SCZJKZLFSSPJDP-ACRUOGEOSA-N Tyr-Phe-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O SCZJKZLFSSPJDP-ACRUOGEOSA-N 0.000 description 4
- LIQJSDDOULTANC-QSFUFRPTSA-N Val-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N LIQJSDDOULTANC-QSFUFRPTSA-N 0.000 description 4
- SCBITHMBEJNRHC-LSJOCFKGSA-N Val-Asp-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N SCBITHMBEJNRHC-LSJOCFKGSA-N 0.000 description 4
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 4
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 4
- FMQGYTMERWBMSI-HJWJTTGWSA-N Val-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C(C)C)N FMQGYTMERWBMSI-HJWJTTGWSA-N 0.000 description 4
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 4
- ZXYPHBKIZLAQTL-QXEWZRGKSA-N Val-Pro-Asp Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N ZXYPHBKIZLAQTL-QXEWZRGKSA-N 0.000 description 4
- UGFMVXRXULGLNO-XPUUQOCRSA-N Val-Ser-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O UGFMVXRXULGLNO-XPUUQOCRSA-N 0.000 description 4
- QZKVWWIUSQGWMY-IHRRRGAJSA-N Val-Ser-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QZKVWWIUSQGWMY-IHRRRGAJSA-N 0.000 description 4
- DVLWZWNAQUBZBC-ZNSHCXBVSA-N Val-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N)O DVLWZWNAQUBZBC-ZNSHCXBVSA-N 0.000 description 4
- GTACFKZDQFTVAI-STECZYCISA-N Val-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=C(O)C=C1 GTACFKZDQFTVAI-STECZYCISA-N 0.000 description 4
- PTFCDOFLOPIGGS-UHFFFAOYSA-N Zinc dication Chemical compound [Zn+2] PTFCDOFLOPIGGS-UHFFFAOYSA-N 0.000 description 4
- 108010041407 alanylaspartic acid Proteins 0.000 description 4
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 4
- 230000001580 bacterial effect Effects 0.000 description 4
- 229960002685 biotin Drugs 0.000 description 4
- 235000020958 biotin Nutrition 0.000 description 4
- 239000011616 biotin Substances 0.000 description 4
- 230000002255 enzymatic effect Effects 0.000 description 4
- 239000013604 expression vector Substances 0.000 description 4
- 229930182830 galactose Natural products 0.000 description 4
- 235000013922 glutamic acid Nutrition 0.000 description 4
- 239000004220 glutamic acid Substances 0.000 description 4
- 229940022353 herceptin Drugs 0.000 description 4
- 108010028295 histidylhistidine Proteins 0.000 description 4
- 108010025306 histidylleucine Proteins 0.000 description 4
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 4
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 4
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 4
- 238000011068 loading method Methods 0.000 description 4
- 108010056582 methionylglutamic acid Proteins 0.000 description 4
- 108010005942 methionylglycine Proteins 0.000 description 4
- 238000002156 mixing Methods 0.000 description 4
- 108010072637 phenylalanyl-arginyl-phenylalanine Proteins 0.000 description 4
- 108010024607 phenylalanylalanine Proteins 0.000 description 4
- 108010012581 phenylalanylglutamate Proteins 0.000 description 4
- 239000013612 plasmid Substances 0.000 description 4
- 239000013641 positive control Substances 0.000 description 4
- 108010031719 prolyl-serine Proteins 0.000 description 4
- 108010079317 prolyl-tyrosine Proteins 0.000 description 4
- 230000027756 respiratory electron transport chain Effects 0.000 description 4
- 239000007787 solid Substances 0.000 description 4
- 230000009870 specific binding Effects 0.000 description 4
- 108010005652 splenotritin Proteins 0.000 description 4
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 4
- 229960000575 trastuzumab Drugs 0.000 description 4
- 108010038745 tryptophylglycine Proteins 0.000 description 4
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 3
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 3
- WQVFQXXBNHHPLX-ZKWXMUAHSA-N Ala-Ala-His Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O WQVFQXXBNHHPLX-ZKWXMUAHSA-N 0.000 description 3
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 3
- KVWLTGNCJYDJET-LSJOCFKGSA-N Ala-Arg-His Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KVWLTGNCJYDJET-LSJOCFKGSA-N 0.000 description 3
- CVGNCMIULZNYES-WHFBIAKZSA-N Ala-Asn-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CVGNCMIULZNYES-WHFBIAKZSA-N 0.000 description 3
- BTYTYHBSJKQBQA-GCJQMDKQSA-N Ala-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N)O BTYTYHBSJKQBQA-GCJQMDKQSA-N 0.000 description 3
- WCBVQNZTOKJWJS-ACZMJKKPSA-N Ala-Cys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O WCBVQNZTOKJWJS-ACZMJKKPSA-N 0.000 description 3
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 3
- GRPHQEMIFDPKOE-HGNGGELXSA-N Ala-His-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GRPHQEMIFDPKOE-HGNGGELXSA-N 0.000 description 3
- VGMNWQOPSFBBBG-XUXIUFHCSA-N Ala-Leu-Leu-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O VGMNWQOPSFBBBG-XUXIUFHCSA-N 0.000 description 3
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 3
- AJBVYEYZVYPFCF-CIUDSAMLSA-N Ala-Lys-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O AJBVYEYZVYPFCF-CIUDSAMLSA-N 0.000 description 3
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 3
- OINVDEKBKBCPLX-JXUBOQSCSA-N Ala-Lys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OINVDEKBKBCPLX-JXUBOQSCSA-N 0.000 description 3
- AWNAEZICPNGAJK-FXQIFTODSA-N Ala-Met-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O AWNAEZICPNGAJK-FXQIFTODSA-N 0.000 description 3
- AUFACLFHBAGZEN-ZLUOBGJFSA-N Ala-Ser-Cys Chemical compound N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O AUFACLFHBAGZEN-ZLUOBGJFSA-N 0.000 description 3
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 3
- RWWPBOUMKFBHAL-FXQIFTODSA-N Arg-Asn-Cys Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(O)=O RWWPBOUMKFBHAL-FXQIFTODSA-N 0.000 description 3
- NONSEUUPKITYQT-BQBZGAKWSA-N Arg-Asn-Gly Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N)CN=C(N)N NONSEUUPKITYQT-BQBZGAKWSA-N 0.000 description 3
- KMSHNDWHPWXPEC-BQBZGAKWSA-N Arg-Asp-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KMSHNDWHPWXPEC-BQBZGAKWSA-N 0.000 description 3
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 3
- UBCPNBUIQNMDNH-NAKRPEOUSA-N Arg-Ile-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O UBCPNBUIQNMDNH-NAKRPEOUSA-N 0.000 description 3
- OOIMKQRCPJBGPD-XUXIUFHCSA-N Arg-Ile-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O OOIMKQRCPJBGPD-XUXIUFHCSA-N 0.000 description 3
- YBZMTKUDWXZLIX-UWVGGRQHSA-N Arg-Leu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YBZMTKUDWXZLIX-UWVGGRQHSA-N 0.000 description 3
- OGSQONVYSTZIJB-WDSOQIARSA-N Arg-Leu-Trp Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCN=C(N)N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O OGSQONVYSTZIJB-WDSOQIARSA-N 0.000 description 3
- JPAWCMXVNZPJLO-IHRRRGAJSA-N Arg-Ser-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JPAWCMXVNZPJLO-IHRRRGAJSA-N 0.000 description 3
- QCTOLCVIGRLMQS-HRCADAONSA-N Arg-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O QCTOLCVIGRLMQS-HRCADAONSA-N 0.000 description 3
- HZPSDHRYYIORKR-WHFBIAKZSA-N Asn-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O HZPSDHRYYIORKR-WHFBIAKZSA-N 0.000 description 3
- ACRYGQFHAQHDSF-ZLUOBGJFSA-N Asn-Asn-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ACRYGQFHAQHDSF-ZLUOBGJFSA-N 0.000 description 3
- AYZAWXAPBAYCHO-CIUDSAMLSA-N Asn-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N AYZAWXAPBAYCHO-CIUDSAMLSA-N 0.000 description 3
- FJIRXKVEDFLLOQ-SRVKXCTJSA-N Asn-Cys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)N)N FJIRXKVEDFLLOQ-SRVKXCTJSA-N 0.000 description 3
- HJRBIWRXULGMOA-ACZMJKKPSA-N Asn-Gln-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HJRBIWRXULGMOA-ACZMJKKPSA-N 0.000 description 3
- CTQIOCMSIJATNX-WHFBIAKZSA-N Asn-Gly-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O CTQIOCMSIJATNX-WHFBIAKZSA-N 0.000 description 3
- GJFYPBDMUGGLFR-NKWVEPMBSA-N Asn-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC(=O)N)N)C(=O)O GJFYPBDMUGGLFR-NKWVEPMBSA-N 0.000 description 3
- MOHUTCNYQLMARY-GUBZILKMSA-N Asn-His-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N MOHUTCNYQLMARY-GUBZILKMSA-N 0.000 description 3
- XVBDDUPJVQXDSI-PEFMBERDSA-N Asn-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N XVBDDUPJVQXDSI-PEFMBERDSA-N 0.000 description 3
- PBVLJOIPOGUQQP-CIUDSAMLSA-N Asp-Ala-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O PBVLJOIPOGUQQP-CIUDSAMLSA-N 0.000 description 3
- CXBOKJPLEYUPGB-FXQIFTODSA-N Asp-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)O)N CXBOKJPLEYUPGB-FXQIFTODSA-N 0.000 description 3
- HMQDRBKQMLRCCG-GMOBBJLQSA-N Asp-Arg-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HMQDRBKQMLRCCG-GMOBBJLQSA-N 0.000 description 3
- UGIBTKGQVWFTGX-BIIVOSGPSA-N Asp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O UGIBTKGQVWFTGX-BIIVOSGPSA-N 0.000 description 3
- FANQWNCPNFEPGZ-WHFBIAKZSA-N Asp-Asp-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FANQWNCPNFEPGZ-WHFBIAKZSA-N 0.000 description 3
- XJQRWGXKUSDEFI-ACZMJKKPSA-N Asp-Glu-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XJQRWGXKUSDEFI-ACZMJKKPSA-N 0.000 description 3
- PAYPSKIBMDHZPI-CIUDSAMLSA-N Asp-Leu-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PAYPSKIBMDHZPI-CIUDSAMLSA-N 0.000 description 3
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 3
- HICVMZCGVFKTPM-BQBZGAKWSA-N Asp-Pro-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HICVMZCGVFKTPM-BQBZGAKWSA-N 0.000 description 3
- BKOIIURTQAJHAT-GUBZILKMSA-N Asp-Pro-Pro Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 BKOIIURTQAJHAT-GUBZILKMSA-N 0.000 description 3
- KNDCWFXCFKSEBM-AVGNSLFASA-N Asp-Tyr-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O KNDCWFXCFKSEBM-AVGNSLFASA-N 0.000 description 3
- VIRYODQIWJNWNU-NRPADANISA-N Cys-Glu-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CS)N VIRYODQIWJNWNU-NRPADANISA-N 0.000 description 3
- 108010090461 DFG peptide Proteins 0.000 description 3
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 3
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 3
- SNLOOPZHAQDMJG-CIUDSAMLSA-N Gln-Glu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SNLOOPZHAQDMJG-CIUDSAMLSA-N 0.000 description 3
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 3
- GXMBDEGTXHQBAO-NKIYYHGXSA-N Gln-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)N)N)O GXMBDEGTXHQBAO-NKIYYHGXSA-N 0.000 description 3
- XFAUJGNLHIGXET-AVGNSLFASA-N Gln-Leu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XFAUJGNLHIGXET-AVGNSLFASA-N 0.000 description 3
- KSKFIECUYMYWNS-AVGNSLFASA-N Gln-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N KSKFIECUYMYWNS-AVGNSLFASA-N 0.000 description 3
- CELXWPDNIGWCJN-WDCWCFNPSA-N Gln-Lys-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CELXWPDNIGWCJN-WDCWCFNPSA-N 0.000 description 3
- BBFCMGBMYIAGRS-AUTRQRHGSA-N Gln-Val-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BBFCMGBMYIAGRS-AUTRQRHGSA-N 0.000 description 3
- WOMUDRVDJMHTCV-DCAQKATOSA-N Glu-Arg-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WOMUDRVDJMHTCV-DCAQKATOSA-N 0.000 description 3
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 3
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 3
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 3
- KRGZZKWSBGPLKL-IUCAKERBSA-N Glu-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N KRGZZKWSBGPLKL-IUCAKERBSA-N 0.000 description 3
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 3
- XNOWYPDMSLSRKP-GUBZILKMSA-N Glu-Met-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(O)=O XNOWYPDMSLSRKP-GUBZILKMSA-N 0.000 description 3
- YTRBQAQSUDSIQE-FHWLQOOXSA-N Glu-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 YTRBQAQSUDSIQE-FHWLQOOXSA-N 0.000 description 3
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 3
- OCDLPQDYTJPWNG-YUMQZZPRSA-N Gly-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN OCDLPQDYTJPWNG-YUMQZZPRSA-N 0.000 description 3
- CQZDZKRHFWJXDF-WDSKDSINSA-N Gly-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CN CQZDZKRHFWJXDF-WDSKDSINSA-N 0.000 description 3
- AQLHORCVPGXDJW-IUCAKERBSA-N Gly-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN AQLHORCVPGXDJW-IUCAKERBSA-N 0.000 description 3
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 3
- XMPXVJIDADUOQB-RCOVLWMOSA-N Gly-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 3
- QPCVIQJVRGXUSA-LURJTMIESA-N Gly-Gly-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QPCVIQJVRGXUSA-LURJTMIESA-N 0.000 description 3
- KAJAOGBVWCYGHZ-JTQLQIEISA-N Gly-Gly-Phe Chemical compound [NH3+]CC(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KAJAOGBVWCYGHZ-JTQLQIEISA-N 0.000 description 3
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 3
- UPADCCSMVOQAGF-LBPRGKRZSA-N Gly-Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CNC(=O)CN)C(O)=O)=CNC2=C1 UPADCCSMVOQAGF-LBPRGKRZSA-N 0.000 description 3
- ADZGCWWDPFDHCY-ZETCQYMHSA-N Gly-His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 ADZGCWWDPFDHCY-ZETCQYMHSA-N 0.000 description 3
- CQIIXEHDSZUSAG-QWRGUYRKSA-N Gly-His-His Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 CQIIXEHDSZUSAG-QWRGUYRKSA-N 0.000 description 3
- SXJHOPPTOJACOA-QXEWZRGKSA-N Gly-Ile-Arg Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SXJHOPPTOJACOA-QXEWZRGKSA-N 0.000 description 3
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 3
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 3
- CLNSYANKYVMZNM-UWVGGRQHSA-N Gly-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CLNSYANKYVMZNM-UWVGGRQHSA-N 0.000 description 3
- PDUHNKAFQXQNLH-ZETCQYMHSA-N Gly-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)NCC(O)=O PDUHNKAFQXQNLH-ZETCQYMHSA-N 0.000 description 3
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 3
- YKJUITHASJAGHO-HOTGVXAUSA-N Gly-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)CN YKJUITHASJAGHO-HOTGVXAUSA-N 0.000 description 3
- HHRODZSXDXMUHS-LURJTMIESA-N Gly-Met-Gly Chemical compound CSCC[C@H](NC(=O)C[NH3+])C(=O)NCC([O-])=O HHRODZSXDXMUHS-LURJTMIESA-N 0.000 description 3
- POJJAZJHBGXEGM-YUMQZZPRSA-N Gly-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN POJJAZJHBGXEGM-YUMQZZPRSA-N 0.000 description 3
- FOKISINOENBSDM-WLTAIBSBSA-N Gly-Thr-Tyr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O FOKISINOENBSDM-WLTAIBSBSA-N 0.000 description 3
- GULGDABMYTYMJZ-STQMWFEESA-N Gly-Trp-Asp Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(O)=O)C(O)=O GULGDABMYTYMJZ-STQMWFEESA-N 0.000 description 3
- LKJCZEPXHOIAIW-HOTGVXAUSA-N Gly-Trp-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)CN LKJCZEPXHOIAIW-HOTGVXAUSA-N 0.000 description 3
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 3
- JWLWNCVBBSBCEM-NKIYYHGXSA-N His-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N)O JWLWNCVBBSBCEM-NKIYYHGXSA-N 0.000 description 3
- 108010093488 His-His-His-His-His-His Proteins 0.000 description 3
- CCUSLCQWVMWTIS-IXOXFDKPSA-N His-Thr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O CCUSLCQWVMWTIS-IXOXFDKPSA-N 0.000 description 3
- QSPLUJGYOPZINY-ZPFDUUQYSA-N Ile-Asp-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QSPLUJGYOPZINY-ZPFDUUQYSA-N 0.000 description 3
- IOVUXUSIGXCREV-DKIMLUQUSA-N Ile-Leu-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IOVUXUSIGXCREV-DKIMLUQUSA-N 0.000 description 3
- AKOYRLRUFBZOSP-BJDJZHNGSA-N Ile-Lys-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N AKOYRLRUFBZOSP-BJDJZHNGSA-N 0.000 description 3
- ZDNNDIJTUHQCAM-MXAVVETBSA-N Ile-Ser-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N ZDNNDIJTUHQCAM-MXAVVETBSA-N 0.000 description 3
- RWHRUZORDWZESH-ZQINRCPSSA-N Ile-Trp-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RWHRUZORDWZESH-ZQINRCPSSA-N 0.000 description 3
- QSXSHZIRKTUXNG-STECZYCISA-N Ile-Val-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QSXSHZIRKTUXNG-STECZYCISA-N 0.000 description 3
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 3
- UGTHTQWIQKEDEH-BQBZGAKWSA-N L-alanyl-L-prolylglycine zwitterion Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UGTHTQWIQKEDEH-BQBZGAKWSA-N 0.000 description 3
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 3
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 3
- TWQIYNGNYNJUFM-NHCYSSNCSA-N Leu-Asn-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TWQIYNGNYNJUFM-NHCYSSNCSA-N 0.000 description 3
- KTFHTMHHKXUYPW-ZPFDUUQYSA-N Leu-Asp-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KTFHTMHHKXUYPW-ZPFDUUQYSA-N 0.000 description 3
- ZYLJULGXQDNXDK-GUBZILKMSA-N Leu-Gln-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ZYLJULGXQDNXDK-GUBZILKMSA-N 0.000 description 3
- FIYMBBHGYNQFOP-IUCAKERBSA-N Leu-Gly-Gln Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N FIYMBBHGYNQFOP-IUCAKERBSA-N 0.000 description 3
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 3
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 3
- MPSBSKHOWJQHBS-IHRRRGAJSA-N Leu-His-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCSC)C(=O)O)N MPSBSKHOWJQHBS-IHRRRGAJSA-N 0.000 description 3
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 3
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 3
- UCNNZELZXFXXJQ-BZSNNMDCSA-N Leu-Leu-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UCNNZELZXFXXJQ-BZSNNMDCSA-N 0.000 description 3
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 3
- RTIRBWJPYJYTLO-MELADBBJSA-N Leu-Lys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N RTIRBWJPYJYTLO-MELADBBJSA-N 0.000 description 3
- JVTYXRRFZCEPPK-RHYQMDGZSA-N Leu-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC(C)C)N)O JVTYXRRFZCEPPK-RHYQMDGZSA-N 0.000 description 3
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 3
- ICYRCNICGBJLGM-HJGDQZAQSA-N Leu-Thr-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 3
- LCNASHSOFMRYFO-WDCWCFNPSA-N Leu-Thr-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O LCNASHSOFMRYFO-WDCWCFNPSA-N 0.000 description 3
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 3
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 3
- KLSUAWUZBMAZCL-RHYQMDGZSA-N Leu-Thr-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O KLSUAWUZBMAZCL-RHYQMDGZSA-N 0.000 description 3
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 3
- MVJRBCJCRYGCKV-GVXVVHGQSA-N Leu-Val-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MVJRBCJCRYGCKV-GVXVVHGQSA-N 0.000 description 3
- WSXTWLJHTLRFLW-SRVKXCTJSA-N Lys-Ala-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O WSXTWLJHTLRFLW-SRVKXCTJSA-N 0.000 description 3
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 3
- NCTDKZKNBDZDOL-GARJFASQSA-N Lys-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N)C(=O)O NCTDKZKNBDZDOL-GARJFASQSA-N 0.000 description 3
- WGCKDDHUFPQSMZ-ZPFDUUQYSA-N Lys-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCCN WGCKDDHUFPQSMZ-ZPFDUUQYSA-N 0.000 description 3
- NTBFKPBULZGXQL-KKUMJFAQSA-N Lys-Asp-Tyr Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NTBFKPBULZGXQL-KKUMJFAQSA-N 0.000 description 3
- GPJGFSFYBJGYRX-YUMQZZPRSA-N Lys-Gly-Asp Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O GPJGFSFYBJGYRX-YUMQZZPRSA-N 0.000 description 3
- OWRUUFUVXFREBD-KKUMJFAQSA-N Lys-His-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O OWRUUFUVXFREBD-KKUMJFAQSA-N 0.000 description 3
- ZMMDPRTXLAEMOD-BZSNNMDCSA-N Lys-His-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZMMDPRTXLAEMOD-BZSNNMDCSA-N 0.000 description 3
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 3
- DNWBUCHHMRQWCZ-GUBZILKMSA-N Lys-Ser-Gln Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O DNWBUCHHMRQWCZ-GUBZILKMSA-N 0.000 description 3
- PLOUVAYOMTYJRG-JXUBOQSCSA-N Lys-Thr-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PLOUVAYOMTYJRG-JXUBOQSCSA-N 0.000 description 3
- TVHCDSBMFQYPNA-RHYQMDGZSA-N Lys-Thr-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TVHCDSBMFQYPNA-RHYQMDGZSA-N 0.000 description 3
- NROQVSYLPRLJIP-PMVMPFDFSA-N Lys-Trp-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NROQVSYLPRLJIP-PMVMPFDFSA-N 0.000 description 3
- RQILLQOQXLZTCK-KBPBESRZSA-N Lys-Tyr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O RQILLQOQXLZTCK-KBPBESRZSA-N 0.000 description 3
- MUYQDMBLDFEVRJ-LSJOCFKGSA-N Met-Ala-His Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 MUYQDMBLDFEVRJ-LSJOCFKGSA-N 0.000 description 3
- IYXDSYWCVVXSKB-CIUDSAMLSA-N Met-Asn-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O IYXDSYWCVVXSKB-CIUDSAMLSA-N 0.000 description 3
- WGBMNLCRYKSWAR-DCAQKATOSA-N Met-Asp-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN WGBMNLCRYKSWAR-DCAQKATOSA-N 0.000 description 3
- OOSPRDCGTLQLBP-NHCYSSNCSA-N Met-Glu-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OOSPRDCGTLQLBP-NHCYSSNCSA-N 0.000 description 3
- FYRUJIJAUPHUNB-IUCAKERBSA-N Met-Gly-Arg Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N FYRUJIJAUPHUNB-IUCAKERBSA-N 0.000 description 3
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 3
- 108091006036 N-glycosylated proteins Proteins 0.000 description 3
- 108010066427 N-valyltryptophan Proteins 0.000 description 3
- HTTYNOXBBOWZTB-SRVKXCTJSA-N Phe-Asn-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N HTTYNOXBBOWZTB-SRVKXCTJSA-N 0.000 description 3
- DVOCGBNHAUHKHJ-DKIMLUQUSA-N Phe-Ile-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O DVOCGBNHAUHKHJ-DKIMLUQUSA-N 0.000 description 3
- RYQWALWYQWBUKN-FHWLQOOXSA-N Phe-Phe-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RYQWALWYQWBUKN-FHWLQOOXSA-N 0.000 description 3
- IPFXYNKCXYGSSV-KKUMJFAQSA-N Phe-Ser-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N IPFXYNKCXYGSSV-KKUMJFAQSA-N 0.000 description 3
- GKRCCTYAGQPMMP-IHRRRGAJSA-N Phe-Ser-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O GKRCCTYAGQPMMP-IHRRRGAJSA-N 0.000 description 3
- MVIJMIZJPHQGEN-IHRRRGAJSA-N Phe-Ser-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@H](CO)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 MVIJMIZJPHQGEN-IHRRRGAJSA-N 0.000 description 3
- AGTHXWTYCLLYMC-FHWLQOOXSA-N Phe-Tyr-Glu Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 AGTHXWTYCLLYMC-FHWLQOOXSA-N 0.000 description 3
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 3
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 3
- JARJPEMLQAWNBR-GUBZILKMSA-N Pro-Asp-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JARJPEMLQAWNBR-GUBZILKMSA-N 0.000 description 3
- CJZTUKSFZUSNCC-FXQIFTODSA-N Pro-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 CJZTUKSFZUSNCC-FXQIFTODSA-N 0.000 description 3
- XZONQWUEBAFQPO-HJGDQZAQSA-N Pro-Gln-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XZONQWUEBAFQPO-HJGDQZAQSA-N 0.000 description 3
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 3
- JMVQDLDPDBXAAX-YUMQZZPRSA-N Pro-Gly-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 JMVQDLDPDBXAAX-YUMQZZPRSA-N 0.000 description 3
- AFXCXDQNRXTSBD-FJXKBIBVSA-N Pro-Gly-Thr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O AFXCXDQNRXTSBD-FJXKBIBVSA-N 0.000 description 3
- HOTVCUAVDQHUDB-UFYCRDLUSA-N Pro-Phe-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 HOTVCUAVDQHUDB-UFYCRDLUSA-N 0.000 description 3
- CNUIHOAISPKQPY-HSHDSVGOSA-N Pro-Thr-Trp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O CNUIHOAISPKQPY-HSHDSVGOSA-N 0.000 description 3
- VAIZFHMTBFYJIA-ACZMJKKPSA-N Ser-Asp-Gln Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O VAIZFHMTBFYJIA-ACZMJKKPSA-N 0.000 description 3
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 3
- BTPAWKABYQMKKN-LKXGYXEUSA-N Ser-Asp-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BTPAWKABYQMKKN-LKXGYXEUSA-N 0.000 description 3
- IXUGADGDCQDLSA-FXQIFTODSA-N Ser-Gln-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N IXUGADGDCQDLSA-FXQIFTODSA-N 0.000 description 3
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 3
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 3
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 3
- YIUWWXVTYLANCJ-NAKRPEOUSA-N Ser-Ile-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O YIUWWXVTYLANCJ-NAKRPEOUSA-N 0.000 description 3
- FPCGZYMRFFIYIH-CIUDSAMLSA-N Ser-Lys-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O FPCGZYMRFFIYIH-CIUDSAMLSA-N 0.000 description 3
- IFLVBVIYADZIQO-DCAQKATOSA-N Ser-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N IFLVBVIYADZIQO-DCAQKATOSA-N 0.000 description 3
- XKFJENWJGHMDLI-QWRGUYRKSA-N Ser-Phe-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O XKFJENWJGHMDLI-QWRGUYRKSA-N 0.000 description 3
- WNDUPCKKKGSKIQ-CIUDSAMLSA-N Ser-Pro-Gln Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O WNDUPCKKKGSKIQ-CIUDSAMLSA-N 0.000 description 3
- FZXOPYUEQGDGMS-ACZMJKKPSA-N Ser-Ser-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZXOPYUEQGDGMS-ACZMJKKPSA-N 0.000 description 3
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 3
- MQCPGOZXFSYJPS-KZVJFYERSA-N Thr-Ala-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MQCPGOZXFSYJPS-KZVJFYERSA-N 0.000 description 3
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 3
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 3
- RKDFEMGVMMYYNG-WDCWCFNPSA-N Thr-Gln-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O RKDFEMGVMMYYNG-WDCWCFNPSA-N 0.000 description 3
- RRRRCRYTLZVCEN-HJGDQZAQSA-N Thr-Leu-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O RRRRCRYTLZVCEN-HJGDQZAQSA-N 0.000 description 3
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 3
- GYUUYCIXELGTJS-MEYUZBJRSA-N Thr-Phe-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O GYUUYCIXELGTJS-MEYUZBJRSA-N 0.000 description 3
- MXDOAJQRJBMGMO-FJXKBIBVSA-N Thr-Pro-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O MXDOAJQRJBMGMO-FJXKBIBVSA-N 0.000 description 3
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 3
- QNXZCKMXHPULME-ZNSHCXBVSA-N Thr-Val-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O QNXZCKMXHPULME-ZNSHCXBVSA-N 0.000 description 3
- XLMDWQNAOKLKCP-XDTLVQLUSA-N Tyr-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N XLMDWQNAOKLKCP-XDTLVQLUSA-N 0.000 description 3
- TVOGEPLDNYTAHD-CQDKDKBSSA-N Tyr-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TVOGEPLDNYTAHD-CQDKDKBSSA-N 0.000 description 3
- MICSYKFECRFCTJ-IHRRRGAJSA-N Tyr-Arg-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O MICSYKFECRFCTJ-IHRRRGAJSA-N 0.000 description 3
- DANHCMVVXDXOHN-SRVKXCTJSA-N Tyr-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DANHCMVVXDXOHN-SRVKXCTJSA-N 0.000 description 3
- HVHJYXDXRIWELT-RYUDHWBXSA-N Tyr-Glu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O HVHJYXDXRIWELT-RYUDHWBXSA-N 0.000 description 3
- AXWBYOVVDRBOGU-SIUGBPQLSA-N Tyr-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N AXWBYOVVDRBOGU-SIUGBPQLSA-N 0.000 description 3
- JAGGEZACYAAMIL-CQDKDKBSSA-N Tyr-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CC=C(C=C1)O)N JAGGEZACYAAMIL-CQDKDKBSSA-N 0.000 description 3
- VPEFOFYNHBWFNQ-UFYCRDLUSA-N Tyr-Pro-Tyr Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 VPEFOFYNHBWFNQ-UFYCRDLUSA-N 0.000 description 3
- LDKDSFQSEUOCOO-RPTUDFQQSA-N Tyr-Thr-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LDKDSFQSEUOCOO-RPTUDFQQSA-N 0.000 description 3
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 3
- QPZMOUMNTGTEFR-ZKWXMUAHSA-N Val-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N QPZMOUMNTGTEFR-ZKWXMUAHSA-N 0.000 description 3
- CGGVNFJRZJUVAE-BYULHYEWSA-N Val-Asp-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CGGVNFJRZJUVAE-BYULHYEWSA-N 0.000 description 3
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 3
- BVWPHWLFGRCECJ-JSGCOSHPSA-N Val-Gly-Tyr Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N BVWPHWLFGRCECJ-JSGCOSHPSA-N 0.000 description 3
- JZWZACGUZVCQPS-RNJOBUHISA-N Val-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N JZWZACGUZVCQPS-RNJOBUHISA-N 0.000 description 3
- MJFSRZZJQWZHFQ-SRVKXCTJSA-N Val-Met-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)O)N MJFSRZZJQWZHFQ-SRVKXCTJSA-N 0.000 description 3
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 3
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 3
- 235000004279 alanine Nutrition 0.000 description 3
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 3
- 108010080488 arginyl-arginyl-leucine Proteins 0.000 description 3
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 3
- 108010029539 arginyl-prolyl-proline Proteins 0.000 description 3
- 210000004900 c-terminal fragment Anatomy 0.000 description 3
- 239000007795 chemical reaction product Substances 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000001186 cumulative effect Effects 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 239000003085 diluting agent Substances 0.000 description 3
- 238000001437 electrospray ionisation time-of-flight quadrupole detection Methods 0.000 description 3
- 108020001507 fusion proteins Proteins 0.000 description 3
- 102000037865 fusion proteins Human genes 0.000 description 3
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 3
- 229930195712 glutamate Natural products 0.000 description 3
- 125000000291 glutamic acid group Chemical group N[C@@H](CCC(O)=O)C(=O)* 0.000 description 3
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 3
- 108010020688 glycylhistidine Proteins 0.000 description 3
- 229960000789 guanidine hydrochloride Drugs 0.000 description 3
- PJJJBBJSCAKJQF-UHFFFAOYSA-N guanidinium chloride Chemical compound [Cl-].NC(N)=[NH2+] PJJJBBJSCAKJQF-UHFFFAOYSA-N 0.000 description 3
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 3
- 230000003100 immobilizing effect Effects 0.000 description 3
- 150000002500 ions Chemical class 0.000 description 3
- 108010078274 isoleucylvaline Proteins 0.000 description 3
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 3
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 3
- 239000006249 magnetic particle Substances 0.000 description 3
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000002703 mutagenesis Methods 0.000 description 3
- 231100000350 mutagenesis Toxicity 0.000 description 3
- 210000004898 n-terminal fragment Anatomy 0.000 description 3
- 108010084525 phenylalanyl-phenylalanyl-glycine Proteins 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 108010048818 seryl-histidine Proteins 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 108010084932 tryptophyl-proline Proteins 0.000 description 3
- 108010009962 valyltyrosine Proteins 0.000 description 3
- 230000003612 virological effect Effects 0.000 description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- 241000702460 Akkermansia Species 0.000 description 2
- XQGIRPGAVLFKBJ-CIUDSAMLSA-N Ala-Asn-Lys Chemical compound N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)O XQGIRPGAVLFKBJ-CIUDSAMLSA-N 0.000 description 2
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 2
- WXERCAHAIKMTKX-ZLUOBGJFSA-N Ala-Asp-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O WXERCAHAIKMTKX-ZLUOBGJFSA-N 0.000 description 2
- ZIWWTZWAKYBUOB-CIUDSAMLSA-N Ala-Asp-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O ZIWWTZWAKYBUOB-CIUDSAMLSA-N 0.000 description 2
- LSLIRHLIUDVNBN-CIUDSAMLSA-N Ala-Asp-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LSLIRHLIUDVNBN-CIUDSAMLSA-N 0.000 description 2
- ZODMADSIQZZBSQ-FXQIFTODSA-N Ala-Gln-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZODMADSIQZZBSQ-FXQIFTODSA-N 0.000 description 2
- AWAXZRDKUHOPBO-GUBZILKMSA-N Ala-Gln-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O AWAXZRDKUHOPBO-GUBZILKMSA-N 0.000 description 2
- KXEVYGKATAMXJJ-ACZMJKKPSA-N Ala-Glu-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KXEVYGKATAMXJJ-ACZMJKKPSA-N 0.000 description 2
- BGNLUHXLSAQYRQ-FXQIFTODSA-N Ala-Glu-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O BGNLUHXLSAQYRQ-FXQIFTODSA-N 0.000 description 2
- GGNHBHYDMUDXQB-KBIXCLLPSA-N Ala-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)N GGNHBHYDMUDXQB-KBIXCLLPSA-N 0.000 description 2
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 2
- NHLAEBFGWPXFGI-WHFBIAKZSA-N Ala-Gly-Asn Chemical compound C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N NHLAEBFGWPXFGI-WHFBIAKZSA-N 0.000 description 2
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 2
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 2
- JDIQCVUDDFENPU-ZKWXMUAHSA-N Ala-His-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CNC=N1 JDIQCVUDDFENPU-ZKWXMUAHSA-N 0.000 description 2
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 2
- LNNSWWRRYJLGNI-NAKRPEOUSA-N Ala-Ile-Val Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O LNNSWWRRYJLGNI-NAKRPEOUSA-N 0.000 description 2
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 2
- SDZRIBWEVVRDQI-CIUDSAMLSA-N Ala-Lys-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O SDZRIBWEVVRDQI-CIUDSAMLSA-N 0.000 description 2
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 2
- CNQAFFMNJIQYGX-DRZSPHRISA-N Ala-Phe-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 CNQAFFMNJIQYGX-DRZSPHRISA-N 0.000 description 2
- JAQNUEWEJWBVAY-WBAXXEDZSA-N Ala-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 JAQNUEWEJWBVAY-WBAXXEDZSA-N 0.000 description 2
- BTRULDJUUVGRNE-DCAQKATOSA-N Ala-Pro-Lys Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O BTRULDJUUVGRNE-DCAQKATOSA-N 0.000 description 2
- YHBDGLZYNIARKJ-GUBZILKMSA-N Ala-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N YHBDGLZYNIARKJ-GUBZILKMSA-N 0.000 description 2
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 2
- MMLHRUJLOUSRJX-CIUDSAMLSA-N Ala-Ser-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN MMLHRUJLOUSRJX-CIUDSAMLSA-N 0.000 description 2
- OMCKWYSDUQBYCN-FXQIFTODSA-N Ala-Ser-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O OMCKWYSDUQBYCN-FXQIFTODSA-N 0.000 description 2
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 2
- HCBKAOZYACJUEF-XQXXSGGOSA-N Ala-Thr-Gln Chemical compound N[C@@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(N)=O)C(=O)O HCBKAOZYACJUEF-XQXXSGGOSA-N 0.000 description 2
- AAWLEICNDUHIJM-MBLNEYKQSA-N Ala-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C)N)O AAWLEICNDUHIJM-MBLNEYKQSA-N 0.000 description 2
- AOAKQKVICDWCLB-UWJYBYFXSA-N Ala-Tyr-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N AOAKQKVICDWCLB-UWJYBYFXSA-N 0.000 description 2
- QRIYOHQJRDHFKF-UWJYBYFXSA-N Ala-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 QRIYOHQJRDHFKF-UWJYBYFXSA-N 0.000 description 2
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 2
- 102000013918 Apolipoproteins E Human genes 0.000 description 2
- 108010025628 Apolipoproteins E Proteins 0.000 description 2
- SGYSTDWPNPKJPP-GUBZILKMSA-N Arg-Ala-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SGYSTDWPNPKJPP-GUBZILKMSA-N 0.000 description 2
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 2
- QAODJPUKWNNNRP-DCAQKATOSA-N Arg-Glu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QAODJPUKWNNNRP-DCAQKATOSA-N 0.000 description 2
- OHYQKYUTLIPFOX-ZPFDUUQYSA-N Arg-Glu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OHYQKYUTLIPFOX-ZPFDUUQYSA-N 0.000 description 2
- VRZDJJWOFXMFRO-ZFWWWQNUSA-N Arg-Gly-Trp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O VRZDJJWOFXMFRO-ZFWWWQNUSA-N 0.000 description 2
- AGVNTAUPLWIQEN-ZPFDUUQYSA-N Arg-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AGVNTAUPLWIQEN-ZPFDUUQYSA-N 0.000 description 2
- LKDHUGLXOHYINY-XUXIUFHCSA-N Arg-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LKDHUGLXOHYINY-XUXIUFHCSA-N 0.000 description 2
- HJDNZFIYILEIKR-OSUNSFLBSA-N Arg-Ile-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HJDNZFIYILEIKR-OSUNSFLBSA-N 0.000 description 2
- YKZJPIPFKGYHKY-DCAQKATOSA-N Arg-Leu-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKZJPIPFKGYHKY-DCAQKATOSA-N 0.000 description 2
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 2
- CVXXSWQORBZAAA-SRVKXCTJSA-N Arg-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N CVXXSWQORBZAAA-SRVKXCTJSA-N 0.000 description 2
- VEAIMHJZTIDCIH-KKUMJFAQSA-N Arg-Phe-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VEAIMHJZTIDCIH-KKUMJFAQSA-N 0.000 description 2
- MNBHKGYCLBUIBC-UFYCRDLUSA-N Arg-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CCCNC(N)=N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 MNBHKGYCLBUIBC-UFYCRDLUSA-N 0.000 description 2
- WKPXXXUSUHAXDE-SRVKXCTJSA-N Arg-Pro-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O WKPXXXUSUHAXDE-SRVKXCTJSA-N 0.000 description 2
- DNLQVHBBMPZUGJ-BQBZGAKWSA-N Arg-Ser-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O DNLQVHBBMPZUGJ-BQBZGAKWSA-N 0.000 description 2
- AIFHRTPABBBHKU-RCWTZXSCSA-N Arg-Thr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AIFHRTPABBBHKU-RCWTZXSCSA-N 0.000 description 2
- PSUXEQYPYZLNER-QXEWZRGKSA-N Arg-Val-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PSUXEQYPYZLNER-QXEWZRGKSA-N 0.000 description 2
- QTAIIXQCOPUNBQ-QXEWZRGKSA-N Arg-Val-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QTAIIXQCOPUNBQ-QXEWZRGKSA-N 0.000 description 2
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 2
- QEYJFBMTSMLPKZ-ZKWXMUAHSA-N Asn-Ala-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O QEYJFBMTSMLPKZ-ZKWXMUAHSA-N 0.000 description 2
- PIWWUBYJNONVTJ-ZLUOBGJFSA-N Asn-Asp-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N PIWWUBYJNONVTJ-ZLUOBGJFSA-N 0.000 description 2
- WQSCVMQDZYTFQU-FXQIFTODSA-N Asn-Cys-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WQSCVMQDZYTFQU-FXQIFTODSA-N 0.000 description 2
- NNMUHYLAYUSTTN-FXQIFTODSA-N Asn-Gln-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O NNMUHYLAYUSTTN-FXQIFTODSA-N 0.000 description 2
- QNJIRRVTOXNGMH-GUBZILKMSA-N Asn-Gln-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC(N)=O QNJIRRVTOXNGMH-GUBZILKMSA-N 0.000 description 2
- OLGCWMNDJTWQAG-GUBZILKMSA-N Asn-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(N)=O OLGCWMNDJTWQAG-GUBZILKMSA-N 0.000 description 2
- KLKHFFMNGWULBN-VKHMYHEASA-N Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)NCC(O)=O KLKHFFMNGWULBN-VKHMYHEASA-N 0.000 description 2
- IICZCLFBILYRCU-WHFBIAKZSA-N Asn-Gly-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IICZCLFBILYRCU-WHFBIAKZSA-N 0.000 description 2
- OLVIPTLKNSAYRJ-YUMQZZPRSA-N Asn-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N OLVIPTLKNSAYRJ-YUMQZZPRSA-N 0.000 description 2
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 2
- GQRDIVQPSMPQME-ZPFDUUQYSA-N Asn-Ile-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O GQRDIVQPSMPQME-ZPFDUUQYSA-N 0.000 description 2
- RCFGLXMZDYNRSC-CIUDSAMLSA-N Asn-Lys-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O RCFGLXMZDYNRSC-CIUDSAMLSA-N 0.000 description 2
- COWITDLVHMZSIW-CIUDSAMLSA-N Asn-Lys-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O COWITDLVHMZSIW-CIUDSAMLSA-N 0.000 description 2
- MYVBTYXSWILFCG-BQBZGAKWSA-N Asn-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N MYVBTYXSWILFCG-BQBZGAKWSA-N 0.000 description 2
- QGABLMITFKUQDF-DCAQKATOSA-N Asn-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N QGABLMITFKUQDF-DCAQKATOSA-N 0.000 description 2
- GKKUBLFXKRDMFC-BQBZGAKWSA-N Asn-Pro-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O GKKUBLFXKRDMFC-BQBZGAKWSA-N 0.000 description 2
- WLVLIYYBPPONRJ-GCJQMDKQSA-N Asn-Thr-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O WLVLIYYBPPONRJ-GCJQMDKQSA-N 0.000 description 2
- ZUFPUBYQYWCMDB-NUMRIWBASA-N Asn-Thr-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZUFPUBYQYWCMDB-NUMRIWBASA-N 0.000 description 2
- JBDLMLZNDRLDIX-HJGDQZAQSA-N Asn-Thr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O JBDLMLZNDRLDIX-HJGDQZAQSA-N 0.000 description 2
- JZLFYAAGGYMRIK-BYULHYEWSA-N Asn-Val-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O JZLFYAAGGYMRIK-BYULHYEWSA-N 0.000 description 2
- HPNDBHLITCHRSO-WHFBIAKZSA-N Asp-Ala-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)NCC(O)=O HPNDBHLITCHRSO-WHFBIAKZSA-N 0.000 description 2
- XPGVTUBABLRGHY-BIIVOSGPSA-N Asp-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N XPGVTUBABLRGHY-BIIVOSGPSA-N 0.000 description 2
- BLQBMRNMBAYREH-UWJYBYFXSA-N Asp-Ala-Tyr Chemical compound N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O BLQBMRNMBAYREH-UWJYBYFXSA-N 0.000 description 2
- GWTLRDMPMJCNMH-WHFBIAKZSA-N Asp-Asn-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GWTLRDMPMJCNMH-WHFBIAKZSA-N 0.000 description 2
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 2
- NAPNAGZWHQHZLG-ZLUOBGJFSA-N Asp-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N NAPNAGZWHQHZLG-ZLUOBGJFSA-N 0.000 description 2
- WCFCYFDBMNFSPA-ACZMJKKPSA-N Asp-Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O WCFCYFDBMNFSPA-ACZMJKKPSA-N 0.000 description 2
- QXHVOUSPVAWEMX-ZLUOBGJFSA-N Asp-Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXHVOUSPVAWEMX-ZLUOBGJFSA-N 0.000 description 2
- BFOYULZBKYOKAN-OLHMAJIHSA-N Asp-Asp-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFOYULZBKYOKAN-OLHMAJIHSA-N 0.000 description 2
- NYQHSUGFEWDWPD-ACZMJKKPSA-N Asp-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N NYQHSUGFEWDWPD-ACZMJKKPSA-N 0.000 description 2
- WLKVEEODTPQPLI-ACZMJKKPSA-N Asp-Gln-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O WLKVEEODTPQPLI-ACZMJKKPSA-N 0.000 description 2
- VAWNQIGQPUOPQW-ACZMJKKPSA-N Asp-Glu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VAWNQIGQPUOPQW-ACZMJKKPSA-N 0.000 description 2
- JUWZKMBALYLZCK-WHFBIAKZSA-N Asp-Gly-Asn Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O JUWZKMBALYLZCK-WHFBIAKZSA-N 0.000 description 2
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 2
- SVABRQFIHCSNCI-FOHZUACHSA-N Asp-Gly-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SVABRQFIHCSNCI-FOHZUACHSA-N 0.000 description 2
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 2
- HJCGDIGVVWETRO-ZPFDUUQYSA-N Asp-Lys-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O)C(O)=O HJCGDIGVVWETRO-ZPFDUUQYSA-N 0.000 description 2
- QJHOOKBAHRJPPX-QWRGUYRKSA-N Asp-Phe-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 QJHOOKBAHRJPPX-QWRGUYRKSA-N 0.000 description 2
- AHWRSSLYSGLBGD-CIUDSAMLSA-N Asp-Pro-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AHWRSSLYSGLBGD-CIUDSAMLSA-N 0.000 description 2
- ZBYLEBZCVKLPCY-FXQIFTODSA-N Asp-Ser-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZBYLEBZCVKLPCY-FXQIFTODSA-N 0.000 description 2
- ZVGRHIRJLWBWGJ-ACZMJKKPSA-N Asp-Ser-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZVGRHIRJLWBWGJ-ACZMJKKPSA-N 0.000 description 2
- KGHLGJAXYSVNJP-WHFBIAKZSA-N Asp-Ser-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O KGHLGJAXYSVNJP-WHFBIAKZSA-N 0.000 description 2
- HCOQNGIHSXICCB-IHRRRGAJSA-N Asp-Tyr-Arg Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)O HCOQNGIHSXICCB-IHRRRGAJSA-N 0.000 description 2
- AWPWHMVCSISSQK-QWRGUYRKSA-N Asp-Tyr-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O AWPWHMVCSISSQK-QWRGUYRKSA-N 0.000 description 2
- GGBQDSHTXKQSLP-NHCYSSNCSA-N Asp-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N GGBQDSHTXKQSLP-NHCYSSNCSA-N 0.000 description 2
- 241000186000 Bifidobacterium Species 0.000 description 2
- 102000004506 Blood Proteins Human genes 0.000 description 2
- 108010017384 Blood Proteins Proteins 0.000 description 2
- 108090000317 Chymotrypsin Proteins 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- YZFCGHIBLBDZDA-ZLUOBGJFSA-N Cys-Asp-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YZFCGHIBLBDZDA-ZLUOBGJFSA-N 0.000 description 2
- UVZFZTWNHOQWNK-NAKRPEOUSA-N Cys-Ile-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UVZFZTWNHOQWNK-NAKRPEOUSA-N 0.000 description 2
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 2
- 108091006020 Fc-tagged proteins Proteins 0.000 description 2
- BDAGIHXWWSANSR-UHFFFAOYSA-M Formate Chemical compound [O-]C=O BDAGIHXWWSANSR-UHFFFAOYSA-M 0.000 description 2
- 102000002464 Galactosidases Human genes 0.000 description 2
- 108010093031 Galactosidases Proteins 0.000 description 2
- 108091020100 Gingipain Cysteine Endopeptidases Proteins 0.000 description 2
- REJJNXODKSHOKA-ACZMJKKPSA-N Gln-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N REJJNXODKSHOKA-ACZMJKKPSA-N 0.000 description 2
- NUMFTVCBONFQIQ-DRZSPHRISA-N Gln-Ala-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NUMFTVCBONFQIQ-DRZSPHRISA-N 0.000 description 2
- SHERTACNJPYHAR-ACZMJKKPSA-N Gln-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O SHERTACNJPYHAR-ACZMJKKPSA-N 0.000 description 2
- XXLBHPPXDUWYAG-XQXXSGGOSA-N Gln-Ala-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XXLBHPPXDUWYAG-XQXXSGGOSA-N 0.000 description 2
- WMOMPXKOKASNBK-PEFMBERDSA-N Gln-Asn-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WMOMPXKOKASNBK-PEFMBERDSA-N 0.000 description 2
- RMOCFPBLHAOTDU-ACZMJKKPSA-N Gln-Asn-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RMOCFPBLHAOTDU-ACZMJKKPSA-N 0.000 description 2
- NXPXQIZKDOXIHH-JSGCOSHPSA-N Gln-Gly-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N NXPXQIZKDOXIHH-JSGCOSHPSA-N 0.000 description 2
- IHSGESFHTMFHRB-GUBZILKMSA-N Gln-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O IHSGESFHTMFHRB-GUBZILKMSA-N 0.000 description 2
- FNAJNWPDTIXYJN-CIUDSAMLSA-N Gln-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O FNAJNWPDTIXYJN-CIUDSAMLSA-N 0.000 description 2
- PIUPHASDUFSHTF-CIUDSAMLSA-N Gln-Pro-Asn Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O PIUPHASDUFSHTF-CIUDSAMLSA-N 0.000 description 2
- NYCVMJGIJYQWDO-CIUDSAMLSA-N Gln-Ser-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NYCVMJGIJYQWDO-CIUDSAMLSA-N 0.000 description 2
- PAOHIZNRJNIXQY-XQXXSGGOSA-N Gln-Thr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PAOHIZNRJNIXQY-XQXXSGGOSA-N 0.000 description 2
- HLRLXVPRJJITSK-IFFSRLJSSA-N Gln-Thr-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HLRLXVPRJJITSK-IFFSRLJSSA-N 0.000 description 2
- ZZLDMBMFKZFQMU-NRPADANISA-N Gln-Val-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O ZZLDMBMFKZFQMU-NRPADANISA-N 0.000 description 2
- FHPXTPQBODWBIY-CIUDSAMLSA-N Glu-Ala-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHPXTPQBODWBIY-CIUDSAMLSA-N 0.000 description 2
- NCWOMXABNYEPLY-NRPADANISA-N Glu-Ala-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O NCWOMXABNYEPLY-NRPADANISA-N 0.000 description 2
- AKJRHDMTEJXTPV-ACZMJKKPSA-N Glu-Asn-Ala Chemical compound C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AKJRHDMTEJXTPV-ACZMJKKPSA-N 0.000 description 2
- YKLNMGJYMNPBCP-ACZMJKKPSA-N Glu-Asn-Asp Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YKLNMGJYMNPBCP-ACZMJKKPSA-N 0.000 description 2
- QPRZKNOOOBWXSU-CIUDSAMLSA-N Glu-Asp-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N QPRZKNOOOBWXSU-CIUDSAMLSA-N 0.000 description 2
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 2
- WATXSTJXNBOHKD-LAEOZQHASA-N Glu-Asp-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O WATXSTJXNBOHKD-LAEOZQHASA-N 0.000 description 2
- HNVFSTLPVJWIDV-CIUDSAMLSA-N Glu-Glu-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HNVFSTLPVJWIDV-CIUDSAMLSA-N 0.000 description 2
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 2
- UHVIQGKBMXEVGN-WDSKDSINSA-N Glu-Gly-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O UHVIQGKBMXEVGN-WDSKDSINSA-N 0.000 description 2
- RAUDKMVXNOWDLS-WDSKDSINSA-N Glu-Gly-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O RAUDKMVXNOWDLS-WDSKDSINSA-N 0.000 description 2
- CXRWMMRLEMVSEH-PEFMBERDSA-N Glu-Ile-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CXRWMMRLEMVSEH-PEFMBERDSA-N 0.000 description 2
- ZHNHJYYFCGUZNQ-KBIXCLLPSA-N Glu-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O ZHNHJYYFCGUZNQ-KBIXCLLPSA-N 0.000 description 2
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 2
- IRXNJYPKBVERCW-DCAQKATOSA-N Glu-Leu-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IRXNJYPKBVERCW-DCAQKATOSA-N 0.000 description 2
- WNRZUESNGGDCJX-JYJNAYRXSA-N Glu-Leu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WNRZUESNGGDCJX-JYJNAYRXSA-N 0.000 description 2
- SJJHXJDSNQJMMW-SRVKXCTJSA-N Glu-Lys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SJJHXJDSNQJMMW-SRVKXCTJSA-N 0.000 description 2
- BCYGDJXHAGZNPQ-DCAQKATOSA-N Glu-Lys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O BCYGDJXHAGZNPQ-DCAQKATOSA-N 0.000 description 2
- YKBUCXNNBYZYAY-MNXVOIDGSA-N Glu-Lys-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YKBUCXNNBYZYAY-MNXVOIDGSA-N 0.000 description 2
- FMBWLLMUPXTXFC-SDDRHHMPSA-N Glu-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N)C(=O)O FMBWLLMUPXTXFC-SDDRHHMPSA-N 0.000 description 2
- RBXSZQRSEGYDFG-GUBZILKMSA-N Glu-Lys-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O RBXSZQRSEGYDFG-GUBZILKMSA-N 0.000 description 2
- SOEPMWQCTJITPZ-SRVKXCTJSA-N Glu-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N SOEPMWQCTJITPZ-SRVKXCTJSA-N 0.000 description 2
- YRMZCZIRHYCNHX-RYUDHWBXSA-N Glu-Phe-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O YRMZCZIRHYCNHX-RYUDHWBXSA-N 0.000 description 2
- KXTAGESXNQEZKB-DZKIICNBSA-N Glu-Phe-Val Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 KXTAGESXNQEZKB-DZKIICNBSA-N 0.000 description 2
- GPSHCSTUYOQPAI-JHEQGTHGSA-N Glu-Thr-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O GPSHCSTUYOQPAI-JHEQGTHGSA-N 0.000 description 2
- CQGBSALYGOXQPE-HTUGSXCWSA-N Glu-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O CQGBSALYGOXQPE-HTUGSXCWSA-N 0.000 description 2
- QVXWAFZDWRLXTI-NWLDYVSISA-N Glu-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O QVXWAFZDWRLXTI-NWLDYVSISA-N 0.000 description 2
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 2
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 2
- LERGJIVJIIODPZ-ZANVPECISA-N Gly-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)CN)C)C(O)=O)=CNC2=C1 LERGJIVJIIODPZ-ZANVPECISA-N 0.000 description 2
- UPOJUWHGMDJUQZ-IUCAKERBSA-N Gly-Arg-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UPOJUWHGMDJUQZ-IUCAKERBSA-N 0.000 description 2
- UXJHNZODTMHWRD-WHFBIAKZSA-N Gly-Asn-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O UXJHNZODTMHWRD-WHFBIAKZSA-N 0.000 description 2
- GGEJHJIXRBTJPD-BYPYZUCNSA-N Gly-Asn-Gly Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GGEJHJIXRBTJPD-BYPYZUCNSA-N 0.000 description 2
- XRTDOIOIBMAXCT-NKWVEPMBSA-N Gly-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)CN)C(=O)O XRTDOIOIBMAXCT-NKWVEPMBSA-N 0.000 description 2
- LXXANCRPFBSSKS-IUCAKERBSA-N Gly-Gln-Leu Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LXXANCRPFBSSKS-IUCAKERBSA-N 0.000 description 2
- QPDUVFSVVAOUHE-XVKPBYJWSA-N Gly-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)CN)C(O)=O QPDUVFSVVAOUHE-XVKPBYJWSA-N 0.000 description 2
- FIQQRCFQXGLOSZ-WDSKDSINSA-N Gly-Glu-Asp Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FIQQRCFQXGLOSZ-WDSKDSINSA-N 0.000 description 2
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 2
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 2
- MBOAPAXLTUSMQI-JHEQGTHGSA-N Gly-Glu-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MBOAPAXLTUSMQI-JHEQGTHGSA-N 0.000 description 2
- KMSGYZQRXPUKGI-BYPYZUCNSA-N Gly-Gly-Asn Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(N)=O KMSGYZQRXPUKGI-BYPYZUCNSA-N 0.000 description 2
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 2
- QITBQGJOXQYMOA-ZETCQYMHSA-N Gly-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QITBQGJOXQYMOA-ZETCQYMHSA-N 0.000 description 2
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 2
- HAXARWKYFIIHKD-ZKWXMUAHSA-N Gly-Ile-Ser Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HAXARWKYFIIHKD-ZKWXMUAHSA-N 0.000 description 2
- COVXELOAORHTND-LSJOCFKGSA-N Gly-Ile-Val Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O COVXELOAORHTND-LSJOCFKGSA-N 0.000 description 2
- TWTPDFFBLQEBOE-IUCAKERBSA-N Gly-Leu-Gln Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O TWTPDFFBLQEBOE-IUCAKERBSA-N 0.000 description 2
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 2
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 2
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 2
- CVFOYJJOZYYEPE-KBPBESRZSA-N Gly-Lys-Tyr Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CVFOYJJOZYYEPE-KBPBESRZSA-N 0.000 description 2
- FJWSJWACLMTDMI-WPRPVWTQSA-N Gly-Met-Val Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O FJWSJWACLMTDMI-WPRPVWTQSA-N 0.000 description 2
- IXHQLZIWBCQBLQ-STQMWFEESA-N Gly-Pro-Phe Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IXHQLZIWBCQBLQ-STQMWFEESA-N 0.000 description 2
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 2
- TVTZEOHWHUVYCG-KYNKHSRBSA-N Gly-Thr-Thr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O TVTZEOHWHUVYCG-KYNKHSRBSA-N 0.000 description 2
- JKSMZVCGQWVTBW-STQMWFEESA-N Gly-Trp-Asn Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O JKSMZVCGQWVTBW-STQMWFEESA-N 0.000 description 2
- GWCJMBNBFYBQCV-XPUUQOCRSA-N Gly-Val-Ala Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O GWCJMBNBFYBQCV-XPUUQOCRSA-N 0.000 description 2
- IZVICCORZOSGPT-JSGCOSHPSA-N Gly-Val-Tyr Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IZVICCORZOSGPT-JSGCOSHPSA-N 0.000 description 2
- 108060003393 Granulin Proteins 0.000 description 2
- CIWILNZNBPIHEU-DCAQKATOSA-N His-Arg-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O CIWILNZNBPIHEU-DCAQKATOSA-N 0.000 description 2
- VYMGAXSNYUFVCK-GUBZILKMSA-N His-Gln-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N VYMGAXSNYUFVCK-GUBZILKMSA-N 0.000 description 2
- HQKADFMLECZIQJ-HVTMNAMFSA-N His-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N HQKADFMLECZIQJ-HVTMNAMFSA-N 0.000 description 2
- FIMNVXRZGUAGBI-AVGNSLFASA-N His-Glu-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FIMNVXRZGUAGBI-AVGNSLFASA-N 0.000 description 2
- YAALVYQFVJNXIV-KKUMJFAQSA-N His-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 YAALVYQFVJNXIV-KKUMJFAQSA-N 0.000 description 2
- RWIKBYVJQAJYDP-BJDJZHNGSA-N Ile-Ala-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RWIKBYVJQAJYDP-BJDJZHNGSA-N 0.000 description 2
- BOTVMTSMOUSDRW-GMOBBJLQSA-N Ile-Arg-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O BOTVMTSMOUSDRW-GMOBBJLQSA-N 0.000 description 2
- ATXGFMOBVKSOMK-PEDHHIEDSA-N Ile-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N ATXGFMOBVKSOMK-PEDHHIEDSA-N 0.000 description 2
- DMHGKBGOUAJRHU-UHFFFAOYSA-N Ile-Arg-Pro Natural products CCC(C)C(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O DMHGKBGOUAJRHU-UHFFFAOYSA-N 0.000 description 2
- NULSANWBUWLTKN-NAKRPEOUSA-N Ile-Arg-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N NULSANWBUWLTKN-NAKRPEOUSA-N 0.000 description 2
- AZEYWPUCOYXFOE-CYDGBPFRSA-N Ile-Arg-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C(C)C)C(=O)O)N AZEYWPUCOYXFOE-CYDGBPFRSA-N 0.000 description 2
- OVPYIUNCVSOVNF-ZPFDUUQYSA-N Ile-Gln-Pro Natural products CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O OVPYIUNCVSOVNF-ZPFDUUQYSA-N 0.000 description 2
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 2
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 2
- HPCFRQWLTRDGHT-AJNGGQMLSA-N Ile-Leu-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O HPCFRQWLTRDGHT-AJNGGQMLSA-N 0.000 description 2
- YSGBJIQXTIVBHZ-AJNGGQMLSA-N Ile-Lys-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O YSGBJIQXTIVBHZ-AJNGGQMLSA-N 0.000 description 2
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 2
- OWSWUWDMSNXTNE-GMOBBJLQSA-N Ile-Pro-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N OWSWUWDMSNXTNE-GMOBBJLQSA-N 0.000 description 2
- NLZVTPYXYXMCIP-XUXIUFHCSA-N Ile-Pro-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O NLZVTPYXYXMCIP-XUXIUFHCSA-N 0.000 description 2
- JNLSTRPWUXOORL-MMWGEVLESA-N Ile-Ser-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N JNLSTRPWUXOORL-MMWGEVLESA-N 0.000 description 2
- ZUWSVOYKBCHLRR-MGHWNKPDSA-N Ile-Tyr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZUWSVOYKBCHLRR-MGHWNKPDSA-N 0.000 description 2
- ZGKVPOSSTGHJAF-HJPIBITLSA-N Ile-Tyr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CO)C(=O)O)N ZGKVPOSSTGHJAF-HJPIBITLSA-N 0.000 description 2
- NXRNRBOKDBIVKQ-CXTHYWKRSA-N Ile-Tyr-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N NXRNRBOKDBIVKQ-CXTHYWKRSA-N 0.000 description 2
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 2
- 108090001061 Insulin Proteins 0.000 description 2
- 102000004877 Insulin Human genes 0.000 description 2
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 2
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 2
- 125000002842 L-seryl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])O[H] 0.000 description 2
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 2
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 2
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 2
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 2
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 2
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 2
- KSZCCRIGNVSHFH-UWVGGRQHSA-N Leu-Arg-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O KSZCCRIGNVSHFH-UWVGGRQHSA-N 0.000 description 2
- WGNOPSQMIQERPK-GARJFASQSA-N Leu-Asn-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N WGNOPSQMIQERPK-GARJFASQSA-N 0.000 description 2
- DLFAACQHIRSQGG-CIUDSAMLSA-N Leu-Asp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DLFAACQHIRSQGG-CIUDSAMLSA-N 0.000 description 2
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 2
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 2
- QDSKNVXKLPQNOJ-GVXVVHGQSA-N Leu-Gln-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QDSKNVXKLPQNOJ-GVXVVHGQSA-N 0.000 description 2
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 2
- PRZVBIAOPFGAQF-SRVKXCTJSA-N Leu-Glu-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O PRZVBIAOPFGAQF-SRVKXCTJSA-N 0.000 description 2
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 2
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 2
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 2
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 2
- QNTJIDXQHWUBKC-BZSNNMDCSA-N Leu-Lys-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNTJIDXQHWUBKC-BZSNNMDCSA-N 0.000 description 2
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 2
- ZDBMWELMUCLUPL-QEJZJMRPSA-N Leu-Phe-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ZDBMWELMUCLUPL-QEJZJMRPSA-N 0.000 description 2
- BIZNDKMFQHDOIE-KKUMJFAQSA-N Leu-Phe-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 BIZNDKMFQHDOIE-KKUMJFAQSA-N 0.000 description 2
- PTRKPHUGYULXPU-KKUMJFAQSA-N Leu-Phe-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O PTRKPHUGYULXPU-KKUMJFAQSA-N 0.000 description 2
- YWKNKRAKOCLOLH-OEAJRASXSA-N Leu-Phe-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YWKNKRAKOCLOLH-OEAJRASXSA-N 0.000 description 2
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 2
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 2
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 2
- MUCIDQMDOYQYBR-IHRRRGAJSA-N Leu-Pro-His Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N MUCIDQMDOYQYBR-IHRRRGAJSA-N 0.000 description 2
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 2
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 2
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 2
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 2
- AKVBOOKXVAMKSS-GUBZILKMSA-N Leu-Ser-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O AKVBOOKXVAMKSS-GUBZILKMSA-N 0.000 description 2
- MVHXGBZUJLWZOH-BJDJZHNGSA-N Leu-Ser-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVHXGBZUJLWZOH-BJDJZHNGSA-N 0.000 description 2
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 2
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 2
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 2
- URHJPNHRQMQGOZ-RHYQMDGZSA-N Leu-Thr-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O URHJPNHRQMQGOZ-RHYQMDGZSA-N 0.000 description 2
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 2
- CNWDWAMPKVYJJB-NUTKFTJISA-N Leu-Trp-Ala Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 CNWDWAMPKVYJJB-NUTKFTJISA-N 0.000 description 2
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 2
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 2
- SJNZALDHDUYDBU-IHRRRGAJSA-N Lys-Arg-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(O)=O SJNZALDHDUYDBU-IHRRRGAJSA-N 0.000 description 2
- FUKDBQGFSJUXGX-RWMBFGLXSA-N Lys-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)C(=O)O FUKDBQGFSJUXGX-RWMBFGLXSA-N 0.000 description 2
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 2
- QUCDKEKDPYISNX-HJGDQZAQSA-N Lys-Asn-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QUCDKEKDPYISNX-HJGDQZAQSA-N 0.000 description 2
- QIJVAFLRMVBHMU-KKUMJFAQSA-N Lys-Asp-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QIJVAFLRMVBHMU-KKUMJFAQSA-N 0.000 description 2
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 2
- DRCILAJNUJKAHC-SRVKXCTJSA-N Lys-Glu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DRCILAJNUJKAHC-SRVKXCTJSA-N 0.000 description 2
- VEGLGAOVLFODGC-GUBZILKMSA-N Lys-Glu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VEGLGAOVLFODGC-GUBZILKMSA-N 0.000 description 2
- GQZMPWBZQALKJO-UWVGGRQHSA-N Lys-Gly-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O GQZMPWBZQALKJO-UWVGGRQHSA-N 0.000 description 2
- ISHNZELVUVPCHY-ZETCQYMHSA-N Lys-Gly-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O ISHNZELVUVPCHY-ZETCQYMHSA-N 0.000 description 2
- WAIHHELKYSFIQN-XUXIUFHCSA-N Lys-Ile-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O WAIHHELKYSFIQN-XUXIUFHCSA-N 0.000 description 2
- VMTYLUGCXIEDMV-QWRGUYRKSA-N Lys-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN VMTYLUGCXIEDMV-QWRGUYRKSA-N 0.000 description 2
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 2
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 2
- OIQSIMFSVLLWBX-VOAKCMCISA-N Lys-Leu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OIQSIMFSVLLWBX-VOAKCMCISA-N 0.000 description 2
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 2
- BXPHMHQHYHILBB-BZSNNMDCSA-N Lys-Lys-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BXPHMHQHYHILBB-BZSNNMDCSA-N 0.000 description 2
- QQPSCXKFDSORFT-IHRRRGAJSA-N Lys-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN QQPSCXKFDSORFT-IHRRRGAJSA-N 0.000 description 2
- URGPVYGVWLIRGT-DCAQKATOSA-N Lys-Met-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O URGPVYGVWLIRGT-DCAQKATOSA-N 0.000 description 2
- SVSQSPICRKBMSZ-SRVKXCTJSA-N Lys-Pro-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O SVSQSPICRKBMSZ-SRVKXCTJSA-N 0.000 description 2
- MGKFCQFVPKOWOL-CIUDSAMLSA-N Lys-Ser-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N MGKFCQFVPKOWOL-CIUDSAMLSA-N 0.000 description 2
- SBQDRNOLGSYHQA-YUMQZZPRSA-N Lys-Ser-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SBQDRNOLGSYHQA-YUMQZZPRSA-N 0.000 description 2
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 2
- JHNOXVASMSXSNB-WEDXCCLWSA-N Lys-Thr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JHNOXVASMSXSNB-WEDXCCLWSA-N 0.000 description 2
- BDFHWFUAQLIMJO-KXNHARMFSA-N Lys-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N)O BDFHWFUAQLIMJO-KXNHARMFSA-N 0.000 description 2
- CAVRAQIDHUPECU-UVOCVTCTSA-N Lys-Thr-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAVRAQIDHUPECU-UVOCVTCTSA-N 0.000 description 2
- SEZADXQOJJTXPG-VFAJRCTISA-N Lys-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCCN)N)O SEZADXQOJJTXPG-VFAJRCTISA-N 0.000 description 2
- IEIHKHYMBIYQTH-YESZJQIVSA-N Lys-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCCN)N)C(=O)O IEIHKHYMBIYQTH-YESZJQIVSA-N 0.000 description 2
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 2
- 101001018085 Lysobacter enzymogenes Lysyl endopeptidase Proteins 0.000 description 2
- YRAWWKUTNBILNT-FXQIFTODSA-N Met-Ala-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YRAWWKUTNBILNT-FXQIFTODSA-N 0.000 description 2
- HAQLBBVZAGMESV-IHRRRGAJSA-N Met-Lys-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O HAQLBBVZAGMESV-IHRRRGAJSA-N 0.000 description 2
- IHRFZLQEQVHXFA-RHYQMDGZSA-N Met-Thr-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCCN IHRFZLQEQVHXFA-RHYQMDGZSA-N 0.000 description 2
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 2
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- DFEVBOYEUQJGER-JURCDPSOSA-N Phe-Ala-Ile Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O DFEVBOYEUQJGER-JURCDPSOSA-N 0.000 description 2
- BBDSZDHUCPSYAC-QEJZJMRPSA-N Phe-Ala-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BBDSZDHUCPSYAC-QEJZJMRPSA-N 0.000 description 2
- MPGJIHFJCXTVEX-KKUMJFAQSA-N Phe-Arg-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O MPGJIHFJCXTVEX-KKUMJFAQSA-N 0.000 description 2
- GNUCSNWOCQFMMC-UFYCRDLUSA-N Phe-Arg-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 GNUCSNWOCQFMMC-UFYCRDLUSA-N 0.000 description 2
- SWZKMTDPQXLQRD-XVSYOHENSA-N Phe-Asp-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWZKMTDPQXLQRD-XVSYOHENSA-N 0.000 description 2
- JWQWPTLEOFNCGX-AVGNSLFASA-N Phe-Glu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 JWQWPTLEOFNCGX-AVGNSLFASA-N 0.000 description 2
- FXPZZKBHNOMLGA-HJWJTTGWSA-N Phe-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N FXPZZKBHNOMLGA-HJWJTTGWSA-N 0.000 description 2
- QRUOLOPKCOEZKU-HJWJTTGWSA-N Phe-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=CC=C1)N QRUOLOPKCOEZKU-HJWJTTGWSA-N 0.000 description 2
- RVEVENLSADZUMS-IHRRRGAJSA-N Phe-Pro-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O RVEVENLSADZUMS-IHRRRGAJSA-N 0.000 description 2
- FZBGMXYQPACKNC-HJWJTTGWSA-N Phe-Pro-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FZBGMXYQPACKNC-HJWJTTGWSA-N 0.000 description 2
- XOHJOMKCRLHGCY-UNQGMJICSA-N Phe-Pro-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOHJOMKCRLHGCY-UNQGMJICSA-N 0.000 description 2
- BPCLGWHVPVTTFM-QWRGUYRKSA-N Phe-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O BPCLGWHVPVTTFM-QWRGUYRKSA-N 0.000 description 2
- 108010004729 Phycoerythrin Proteins 0.000 description 2
- APKRGYLBSCWJJP-FXQIFTODSA-N Pro-Ala-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O APKRGYLBSCWJJP-FXQIFTODSA-N 0.000 description 2
- AJLVKXCNXIJHDV-CIUDSAMLSA-N Pro-Ala-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O AJLVKXCNXIJHDV-CIUDSAMLSA-N 0.000 description 2
- FZHBZMDRDASUHN-NAKRPEOUSA-N Pro-Ala-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1)C(O)=O FZHBZMDRDASUHN-NAKRPEOUSA-N 0.000 description 2
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 2
- NHDVNAKDACFHPX-GUBZILKMSA-N Pro-Arg-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O NHDVNAKDACFHPX-GUBZILKMSA-N 0.000 description 2
- WWAQEUOYCYMGHB-FXQIFTODSA-N Pro-Asn-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 WWAQEUOYCYMGHB-FXQIFTODSA-N 0.000 description 2
- XROLYVMNVIKVEM-BQBZGAKWSA-N Pro-Asn-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O XROLYVMNVIKVEM-BQBZGAKWSA-N 0.000 description 2
- TUYWCHPXKQTISF-LPEHRKFASA-N Pro-Cys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N2CCC[C@@H]2C(=O)O TUYWCHPXKQTISF-LPEHRKFASA-N 0.000 description 2
- NXEYSLRNNPWCRN-SRVKXCTJSA-N Pro-Glu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXEYSLRNNPWCRN-SRVKXCTJSA-N 0.000 description 2
- LGSANCBHSMDFDY-GARJFASQSA-N Pro-Glu-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O LGSANCBHSMDFDY-GARJFASQSA-N 0.000 description 2
- UUHXBJHVTVGSKM-BQBZGAKWSA-N Pro-Gly-Asn Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O UUHXBJHVTVGSKM-BQBZGAKWSA-N 0.000 description 2
- VYWNORHENYEQDW-YUMQZZPRSA-N Pro-Gly-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 VYWNORHENYEQDW-YUMQZZPRSA-N 0.000 description 2
- GURGCNUWVSDYTP-SRVKXCTJSA-N Pro-Leu-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GURGCNUWVSDYTP-SRVKXCTJSA-N 0.000 description 2
- XQPHBAKJJJZOBX-SRVKXCTJSA-N Pro-Lys-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O XQPHBAKJJJZOBX-SRVKXCTJSA-N 0.000 description 2
- WOIFYRZPIORBRY-AVGNSLFASA-N Pro-Lys-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O WOIFYRZPIORBRY-AVGNSLFASA-N 0.000 description 2
- WHNJMTHJGCEKGA-ULQDDVLXSA-N Pro-Phe-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WHNJMTHJGCEKGA-ULQDDVLXSA-N 0.000 description 2
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 2
- KIDXAAQVMNLJFQ-KZVJFYERSA-N Pro-Thr-Ala Chemical compound C[C@@H](O)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](C)C(O)=O KIDXAAQVMNLJFQ-KZVJFYERSA-N 0.000 description 2
- DLZBBDSPTJBOOD-BPNCWPANSA-N Pro-Tyr-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O DLZBBDSPTJBOOD-BPNCWPANSA-N 0.000 description 2
- 241001240958 Pseudomonas aeruginosa PAO1 Species 0.000 description 2
- SRTCFKGBYBZRHA-ACZMJKKPSA-N Ser-Ala-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SRTCFKGBYBZRHA-ACZMJKKPSA-N 0.000 description 2
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 2
- HQTKVSCNCDLXSX-BQBZGAKWSA-N Ser-Arg-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O HQTKVSCNCDLXSX-BQBZGAKWSA-N 0.000 description 2
- OOKCGAYXSNJBGQ-ZLUOBGJFSA-N Ser-Asn-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OOKCGAYXSNJBGQ-ZLUOBGJFSA-N 0.000 description 2
- UBRXAVQWXOWRSJ-ZLUOBGJFSA-N Ser-Asn-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N)C(=O)N UBRXAVQWXOWRSJ-ZLUOBGJFSA-N 0.000 description 2
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 2
- TYYBJUYSTWJHGO-ZKWXMUAHSA-N Ser-Asn-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TYYBJUYSTWJHGO-ZKWXMUAHSA-N 0.000 description 2
- FTVRVZNYIYWJGB-ACZMJKKPSA-N Ser-Asp-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FTVRVZNYIYWJGB-ACZMJKKPSA-N 0.000 description 2
- HEQPKICPPDOSIN-SRVKXCTJSA-N Ser-Asp-Tyr Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HEQPKICPPDOSIN-SRVKXCTJSA-N 0.000 description 2
- INCNPLPRPOYTJI-JBDRJPRFSA-N Ser-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CO)N INCNPLPRPOYTJI-JBDRJPRFSA-N 0.000 description 2
- CRZRTKAVUUGKEQ-ACZMJKKPSA-N Ser-Gln-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CRZRTKAVUUGKEQ-ACZMJKKPSA-N 0.000 description 2
- HVKMTOIAYDOJPL-NRPADANISA-N Ser-Gln-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVKMTOIAYDOJPL-NRPADANISA-N 0.000 description 2
- KDGARKCAKHBEDB-NKWVEPMBSA-N Ser-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CO)N)C(=O)O KDGARKCAKHBEDB-NKWVEPMBSA-N 0.000 description 2
- SFTZTYBXIXLRGQ-JBDRJPRFSA-N Ser-Ile-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SFTZTYBXIXLRGQ-JBDRJPRFSA-N 0.000 description 2
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 2
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 2
- PPNPDKGQRFSCAC-CIUDSAMLSA-N Ser-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPNPDKGQRFSCAC-CIUDSAMLSA-N 0.000 description 2
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 2
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 2
- DYEGLQRVMBWQLD-IXOXFDKPSA-N Ser-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CO)N)O DYEGLQRVMBWQLD-IXOXFDKPSA-N 0.000 description 2
- NERYDXBVARJIQS-JYBASQMISA-N Ser-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N)O NERYDXBVARJIQS-JYBASQMISA-N 0.000 description 2
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 2
- 108090000794 Streptopain Proteins 0.000 description 2
- DGDCHPCRMWEOJR-FQPOAREZSA-N Thr-Ala-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 DGDCHPCRMWEOJR-FQPOAREZSA-N 0.000 description 2
- VFEHSAJCWWHDBH-RHYQMDGZSA-N Thr-Arg-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VFEHSAJCWWHDBH-RHYQMDGZSA-N 0.000 description 2
- SWIKDOUVROTZCW-GCJQMDKQSA-N Thr-Asn-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O SWIKDOUVROTZCW-GCJQMDKQSA-N 0.000 description 2
- PZVGOVRNGKEFCB-KKHAAJSZSA-N Thr-Asn-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N)O PZVGOVRNGKEFCB-KKHAAJSZSA-N 0.000 description 2
- VXMHQKHDKCATDV-VEVYYDQMSA-N Thr-Asp-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VXMHQKHDKCATDV-VEVYYDQMSA-N 0.000 description 2
- DCCGCVLVVSAJFK-NUMRIWBASA-N Thr-Asp-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O DCCGCVLVVSAJFK-NUMRIWBASA-N 0.000 description 2
- JEDIEMIJYSRUBB-FOHZUACHSA-N Thr-Asp-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 2
- QILPDQCTQZDHFM-HJGDQZAQSA-N Thr-Gln-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QILPDQCTQZDHFM-HJGDQZAQSA-N 0.000 description 2
- GUZGCDIZVGODML-NKIYYHGXSA-N Thr-Gln-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O GUZGCDIZVGODML-NKIYYHGXSA-N 0.000 description 2
- CQNFRKAKGDSJFR-NUMRIWBASA-N Thr-Glu-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CQNFRKAKGDSJFR-NUMRIWBASA-N 0.000 description 2
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 2
- VYEHBMMAJFVTOI-JHEQGTHGSA-N Thr-Gly-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O VYEHBMMAJFVTOI-JHEQGTHGSA-N 0.000 description 2
- MPUMPERGHHJGRP-WEDXCCLWSA-N Thr-Gly-Lys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O MPUMPERGHHJGRP-WEDXCCLWSA-N 0.000 description 2
- XYFISNXATOERFZ-OSUNSFLBSA-N Thr-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XYFISNXATOERFZ-OSUNSFLBSA-N 0.000 description 2
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 2
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 2
- MGJLBZFUXUGMML-VOAKCMCISA-N Thr-Lys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MGJLBZFUXUGMML-VOAKCMCISA-N 0.000 description 2
- MCDVZTRGHNXTGK-HJGDQZAQSA-N Thr-Met-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O MCDVZTRGHNXTGK-HJGDQZAQSA-N 0.000 description 2
- DOBIBIXIHJKVJF-XKBZYTNZSA-N Thr-Ser-Gln Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O DOBIBIXIHJKVJF-XKBZYTNZSA-N 0.000 description 2
- BJJRNAVDQGREGC-HOUAVDHOSA-N Thr-Trp-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O BJJRNAVDQGREGC-HOUAVDHOSA-N 0.000 description 2
- XGUAUKUYQHBUNY-SWRJLBSHSA-N Thr-Trp-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(O)=O XGUAUKUYQHBUNY-SWRJLBSHSA-N 0.000 description 2
- XEVHXNLPUBVQEX-DVJZZOLTSA-N Thr-Trp-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)NCC(=O)O)N)O XEVHXNLPUBVQEX-DVJZZOLTSA-N 0.000 description 2
- IJKNKFJZOJCKRR-GBALPHGKSA-N Thr-Trp-Ser Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 IJKNKFJZOJCKRR-GBALPHGKSA-N 0.000 description 2
- ZEJBJDHSQPOVJV-UAXMHLISSA-N Thr-Trp-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZEJBJDHSQPOVJV-UAXMHLISSA-N 0.000 description 2
- LXXCHJKHJYRMIY-FQPOAREZSA-N Thr-Tyr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O LXXCHJKHJYRMIY-FQPOAREZSA-N 0.000 description 2
- DIHPMRTXPYMDJZ-KAOXEZKKSA-N Thr-Tyr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N)O DIHPMRTXPYMDJZ-KAOXEZKKSA-N 0.000 description 2
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 2
- BPGDJSUFQKWUBK-KJEVXHAQSA-N Thr-Val-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BPGDJSUFQKWUBK-KJEVXHAQSA-N 0.000 description 2
- VYVBSMCZNHOZGD-RCWTZXSCSA-N Thr-Val-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O VYVBSMCZNHOZGD-RCWTZXSCSA-N 0.000 description 2
- OETOOJXFNSEYHQ-WFBYXXMGSA-N Trp-Ala-Asp Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O)=CNC2=C1 OETOOJXFNSEYHQ-WFBYXXMGSA-N 0.000 description 2
- UTQBQJNSNXJNIH-IHPCNDPISA-N Trp-Asn-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N UTQBQJNSNXJNIH-IHPCNDPISA-N 0.000 description 2
- DVIIYMVCSUQOJG-QEJZJMRPSA-N Trp-Glu-Asp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DVIIYMVCSUQOJG-QEJZJMRPSA-N 0.000 description 2
- FEZASNVQLJQBHW-CABZTGNLSA-N Trp-Gly-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O)=CNC2=C1 FEZASNVQLJQBHW-CABZTGNLSA-N 0.000 description 2
- JEYRCNVVYHTZMY-SZMVWBNQSA-N Trp-Pro-Val Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JEYRCNVVYHTZMY-SZMVWBNQSA-N 0.000 description 2
- ADMHZNPMMVKGJW-BPUTZDHNSA-N Trp-Ser-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N ADMHZNPMMVKGJW-BPUTZDHNSA-N 0.000 description 2
- KXFYAQUYJKOQMI-QEJZJMRPSA-N Trp-Ser-Gln Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 KXFYAQUYJKOQMI-QEJZJMRPSA-N 0.000 description 2
- WBZOZLNLXVBCNW-LTHWPDAASA-N Trp-Thr-Ile Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)CC)C(O)=O)[C@@H](C)O)=CNC2=C1 WBZOZLNLXVBCNW-LTHWPDAASA-N 0.000 description 2
- YCQKQFKXBPJXRY-PMVMPFDFSA-N Trp-Tyr-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)N[C@@H](CCCCN)C(=O)O)N YCQKQFKXBPJXRY-PMVMPFDFSA-N 0.000 description 2
- AKFLVKKWVZMFOT-IHRRRGAJSA-N Tyr-Arg-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O AKFLVKKWVZMFOT-IHRRRGAJSA-N 0.000 description 2
- IXTQGBGHWQEEDE-AVGNSLFASA-N Tyr-Asp-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IXTQGBGHWQEEDE-AVGNSLFASA-N 0.000 description 2
- WVRUKYLYMFGKAN-IHRRRGAJSA-N Tyr-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 WVRUKYLYMFGKAN-IHRRRGAJSA-N 0.000 description 2
- AKLNEFNQWLHIGY-QWRGUYRKSA-N Tyr-Gly-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N)O AKLNEFNQWLHIGY-QWRGUYRKSA-N 0.000 description 2
- GIOBXJSONRQHKQ-RYUDHWBXSA-N Tyr-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O GIOBXJSONRQHKQ-RYUDHWBXSA-N 0.000 description 2
- BYAKMYBZADCNMN-JYJNAYRXSA-N Tyr-Lys-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O BYAKMYBZADCNMN-JYJNAYRXSA-N 0.000 description 2
- VTCKHZJKWQENKX-KBPBESRZSA-N Tyr-Lys-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O VTCKHZJKWQENKX-KBPBESRZSA-N 0.000 description 2
- FMXFHNSFABRVFZ-BZSNNMDCSA-N Tyr-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FMXFHNSFABRVFZ-BZSNNMDCSA-N 0.000 description 2
- BGFCXQXETBDEHP-BZSNNMDCSA-N Tyr-Phe-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O BGFCXQXETBDEHP-BZSNNMDCSA-N 0.000 description 2
- FDKDGFGTHGJKNV-FHWLQOOXSA-N Tyr-Phe-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N FDKDGFGTHGJKNV-FHWLQOOXSA-N 0.000 description 2
- BIWVVOHTKDLRMP-ULQDDVLXSA-N Tyr-Pro-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O BIWVVOHTKDLRMP-ULQDDVLXSA-N 0.000 description 2
- SOAUMCDLIUGXJJ-SRVKXCTJSA-N Tyr-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O SOAUMCDLIUGXJJ-SRVKXCTJSA-N 0.000 description 2
- GQVZBMROTPEPIF-SRVKXCTJSA-N Tyr-Ser-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GQVZBMROTPEPIF-SRVKXCTJSA-N 0.000 description 2
- ZPFLBLFITJCBTP-QWRGUYRKSA-N Tyr-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O ZPFLBLFITJCBTP-QWRGUYRKSA-N 0.000 description 2
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 2
- LUMQYLVYUIRHHU-YJRXYDGGSA-N Tyr-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LUMQYLVYUIRHHU-YJRXYDGGSA-N 0.000 description 2
- RIVVDNTUSRVTQT-IRIUXVKKSA-N Tyr-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O RIVVDNTUSRVTQT-IRIUXVKKSA-N 0.000 description 2
- FZSPNKUFROZBSG-ZKWXMUAHSA-N Val-Ala-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O FZSPNKUFROZBSG-ZKWXMUAHSA-N 0.000 description 2
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 2
- CVUDMNSZAIZFAE-TUAOUCFPSA-N Val-Arg-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N CVUDMNSZAIZFAE-TUAOUCFPSA-N 0.000 description 2
- CVUDMNSZAIZFAE-UHFFFAOYSA-N Val-Arg-Pro Natural products NC(N)=NCCCC(NC(=O)C(N)C(C)C)C(=O)N1CCCC1C(O)=O CVUDMNSZAIZFAE-UHFFFAOYSA-N 0.000 description 2
- ZMDCGGKHRKNWKD-LAEOZQHASA-N Val-Asn-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZMDCGGKHRKNWKD-LAEOZQHASA-N 0.000 description 2
- JLFKWDAZBRYCGX-ZKWXMUAHSA-N Val-Asn-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N JLFKWDAZBRYCGX-ZKWXMUAHSA-N 0.000 description 2
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 2
- HZYOWMGWKKRMBZ-BYULHYEWSA-N Val-Asp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZYOWMGWKKRMBZ-BYULHYEWSA-N 0.000 description 2
- YODDULVCGFQRFZ-ZKWXMUAHSA-N Val-Asp-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YODDULVCGFQRFZ-ZKWXMUAHSA-N 0.000 description 2
- HURRXSNHCCSJHA-AUTRQRHGSA-N Val-Gln-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HURRXSNHCCSJHA-AUTRQRHGSA-N 0.000 description 2
- XGJLNBNZNMVJRS-NRPADANISA-N Val-Glu-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O XGJLNBNZNMVJRS-NRPADANISA-N 0.000 description 2
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 2
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 2
- WNZSAUMKZQXHNC-UKJIMTQDSA-N Val-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N WNZSAUMKZQXHNC-UKJIMTQDSA-N 0.000 description 2
- DJQIUOKSNRBTSV-CYDGBPFRSA-N Val-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](C(C)C)N DJQIUOKSNRBTSV-CYDGBPFRSA-N 0.000 description 2
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 2
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 2
- UZFNHAXYMICTBU-DZKIICNBSA-N Val-Phe-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UZFNHAXYMICTBU-DZKIICNBSA-N 0.000 description 2
- HJSLDXZAZGFPDK-ULQDDVLXSA-N Val-Phe-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C(C)C)N HJSLDXZAZGFPDK-ULQDDVLXSA-N 0.000 description 2
- USLVEJAHTBLSIL-CYDGBPFRSA-N Val-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C USLVEJAHTBLSIL-CYDGBPFRSA-N 0.000 description 2
- QTPQHINADBYBNA-DCAQKATOSA-N Val-Ser-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN QTPQHINADBYBNA-DCAQKATOSA-N 0.000 description 2
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 2
- PQSNETRGCRUOGP-KKHAAJSZSA-N Val-Thr-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O PQSNETRGCRUOGP-KKHAAJSZSA-N 0.000 description 2
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 2
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 230000002378 acidificating effect Effects 0.000 description 2
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 2
- 230000006229 amino acid addition Effects 0.000 description 2
- 108010089975 arginyl-glycyl-aspartyl-serine Proteins 0.000 description 2
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 2
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 2
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 2
- 125000003118 aryl group Chemical group 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 238000005251 capillar electrophoresis Methods 0.000 description 2
- 150000001720 carbohydrates Chemical class 0.000 description 2
- 235000014633 carbohydrates Nutrition 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 125000003636 chemical group Chemical group 0.000 description 2
- 229960002376 chymotrypsin Drugs 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000004925 denaturation Methods 0.000 description 2
- 230000036425 denaturation Effects 0.000 description 2
- 231100000673 dose–response relationship Toxicity 0.000 description 2
- 238000002330 electrospray ionisation mass spectrometry Methods 0.000 description 2
- 102000013361 fetuin Human genes 0.000 description 2
- 108060002885 fetuin Proteins 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000001502 gel electrophoresis Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 108010013768 glutamyl-aspartyl-proline Proteins 0.000 description 2
- 108010040856 glutamyl-cysteinyl-alanine Proteins 0.000 description 2
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 2
- 108010075431 glycyl-alanyl-phenylalanine Proteins 0.000 description 2
- 108010072405 glycyl-aspartyl-glycine Proteins 0.000 description 2
- 108010062266 glycyl-glycyl-argininal Proteins 0.000 description 2
- 108010084264 glycyl-glycyl-cysteine Proteins 0.000 description 2
- 108010084389 glycyltryptophan Proteins 0.000 description 2
- 229940072221 immunoglobulins Drugs 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 229940125396 insulin Drugs 0.000 description 2
- 108010053037 kyotorphin Proteins 0.000 description 2
- 238000011005 laboratory method Methods 0.000 description 2
- 108010076756 leucyl-alanyl-phenylalanine Proteins 0.000 description 2
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 2
- 108010012058 leucyltyrosine Proteins 0.000 description 2
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 229910052759 nickel Inorganic materials 0.000 description 2
- 108010074082 phenylalanyl-alanyl-lysine Proteins 0.000 description 2
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 2
- 108010025488 pinealon Proteins 0.000 description 2
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 2
- 108010093296 prolyl-prolyl-alanine Proteins 0.000 description 2
- 108010015796 prolylisoleucine Proteins 0.000 description 2
- 235000019833 protease Nutrition 0.000 description 2
- 230000035484 reaction time Effects 0.000 description 2
- 108020003175 receptors Proteins 0.000 description 2
- 102000005962 receptors Human genes 0.000 description 2
- 238000003259 recombinant expression Methods 0.000 description 2
- 108010071207 serylmethionine Proteins 0.000 description 2
- 239000000377 silicon dioxide Substances 0.000 description 2
- 239000007790 solid phase Substances 0.000 description 2
- 238000004611 spectroscopical analysis Methods 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 108010033670 threonyl-aspartyl-tyrosine Proteins 0.000 description 2
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 2
- 108010029384 tryptophyl-histidine Proteins 0.000 description 2
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 2
- 239000011701 zinc Substances 0.000 description 2
- PKOHVHWNGUHYRE-ZFWWWQNUSA-N (2s)-1-[2-[[(2s)-2-amino-3-(1h-indol-3-yl)propanoyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound O=C([C@H](CC=1C2=CC=CC=C2NC=1)N)NCC(=O)N1CCC[C@H]1C(O)=O PKOHVHWNGUHYRE-ZFWWWQNUSA-N 0.000 description 1
- IGXNPQWXIRIGBF-KEOOTSPTSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoic acid Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IGXNPQWXIRIGBF-KEOOTSPTSA-N 0.000 description 1
- VWWKKDNCCLAGRM-GVXVVHGQSA-N (2s)-2-[[2-[[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]propanoyl]amino]acetyl]amino]-3-methylbutanoic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O VWWKKDNCCLAGRM-GVXVVHGQSA-N 0.000 description 1
- HZKLCOYAVAAQRD-VGMNWLOBSA-N (3s)-3-[[2-[[(2s)-2-amino-5-(diaminomethylideneamino)pentanoyl]amino]acetyl]amino]-4-[[(1r)-1-carboxyethyl]amino]-4-oxobutanoic acid Chemical compound OC(=O)[C@@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N HZKLCOYAVAAQRD-VGMNWLOBSA-N 0.000 description 1
- NNRFRJQMBSBXGO-CIUDSAMLSA-N (3s)-3-[[2-[[(2s)-2-amino-5-(diaminomethylideneamino)pentanoyl]amino]acetyl]amino]-4-[[(1s)-1-carboxy-2-hydroxyethyl]amino]-4-oxobutanoic acid Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O NNRFRJQMBSBXGO-CIUDSAMLSA-N 0.000 description 1
- 125000003088 (fluoren-9-ylmethoxy)carbonyl group Chemical group 0.000 description 1
- BHNQPLPANNDEGL-UHFFFAOYSA-N 2-(4-octylphenoxy)ethanol Chemical compound CCCCCCCCC1=CC=C(OCCO)C=C1 BHNQPLPANNDEGL-UHFFFAOYSA-N 0.000 description 1
- SKPQXOSVPKPXML-ULQDDVLXSA-N 2-[[(2s)-1-[(2s)-3-phenyl-2-[[(2s)-pyrrolidine-2-carbonyl]amino]propanoyl]pyrrolidine-2-carbonyl]amino]acetic acid Chemical compound OC(=O)CNC(=O)[C@@H]1CCCN1C(=O)[C@@H](NC(=O)[C@H]1NCCC1)CC1=CC=CC=C1 SKPQXOSVPKPXML-ULQDDVLXSA-N 0.000 description 1
- UMCMPZBLKLEWAF-BCTGSCMUSA-N 3-[(3-cholamidopropyl)dimethylammonio]propane-1-sulfonate Chemical compound C([C@H]1C[C@H]2O)[C@H](O)CC[C@]1(C)[C@@H]1[C@@H]2[C@@H]2CC[C@H]([C@@H](CCC(=O)NCCC[N+](C)(C)CCCS([O-])(=O)=O)C)[C@@]2(C)[C@@H](O)C1 UMCMPZBLKLEWAF-BCTGSCMUSA-N 0.000 description 1
- QFVHZQCOUORWEI-UHFFFAOYSA-N 4-[(4-anilino-5-sulfonaphthalen-1-yl)diazenyl]-5-hydroxynaphthalene-2,7-disulfonic acid Chemical compound C=12C(O)=CC(S(O)(=O)=O)=CC2=CC(S(O)(=O)=O)=CC=1N=NC(C1=CC=CC(=C11)S(O)(=O)=O)=CC=C1NC1=CC=CC=C1 QFVHZQCOUORWEI-UHFFFAOYSA-N 0.000 description 1
- DKJPOZOEBONHFS-ZLUOBGJFSA-N Ala-Ala-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O DKJPOZOEBONHFS-ZLUOBGJFSA-N 0.000 description 1
- UWQJHXKARZWDIJ-ZLUOBGJFSA-N Ala-Ala-Cys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(O)=O UWQJHXKARZWDIJ-ZLUOBGJFSA-N 0.000 description 1
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 1
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 1
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 1
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 1
- UGLPMYSCWHTZQU-AUTRQRHGSA-N Ala-Ala-Tyr Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UGLPMYSCWHTZQU-AUTRQRHGSA-N 0.000 description 1
- QDRGPQWIVZNJQD-CIUDSAMLSA-N Ala-Arg-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O QDRGPQWIVZNJQD-CIUDSAMLSA-N 0.000 description 1
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 1
- UCIYCBSJBQGDGM-LPEHRKFASA-N Ala-Arg-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N UCIYCBSJBQGDGM-LPEHRKFASA-N 0.000 description 1
- TTXMOJWKNRJWQJ-FXQIFTODSA-N Ala-Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N TTXMOJWKNRJWQJ-FXQIFTODSA-N 0.000 description 1
- JAMAWBXXKFGFGX-KZVJFYERSA-N Ala-Arg-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JAMAWBXXKFGFGX-KZVJFYERSA-N 0.000 description 1
- DWINFPQUSSHSFS-UVBJJODRSA-N Ala-Arg-Trp Chemical compound N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C12)C(=O)O DWINFPQUSSHSFS-UVBJJODRSA-N 0.000 description 1
- WYPUMLRSQMKIJU-BPNCWPANSA-N Ala-Arg-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O WYPUMLRSQMKIJU-BPNCWPANSA-N 0.000 description 1
- YAXNATKKPOWVCP-ZLUOBGJFSA-N Ala-Asn-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O YAXNATKKPOWVCP-ZLUOBGJFSA-N 0.000 description 1
- LBJYAILUMSUTAM-ZLUOBGJFSA-N Ala-Asn-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O LBJYAILUMSUTAM-ZLUOBGJFSA-N 0.000 description 1
- ZEXDYVGDZJBRMO-ACZMJKKPSA-N Ala-Asn-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZEXDYVGDZJBRMO-ACZMJKKPSA-N 0.000 description 1
- MCGGOMKMWPPXKQ-JBDRJPRFSA-N Ala-Asn-Gln-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MCGGOMKMWPPXKQ-JBDRJPRFSA-N 0.000 description 1
- JYEBJTDTPNKQJG-FXQIFTODSA-N Ala-Asn-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N JYEBJTDTPNKQJG-FXQIFTODSA-N 0.000 description 1
- SHYYAQLDNVHPFT-DLOVCJGASA-N Ala-Asn-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SHYYAQLDNVHPFT-DLOVCJGASA-N 0.000 description 1
- XCVRVWZTXPCYJT-BIIVOSGPSA-N Ala-Asn-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N XCVRVWZTXPCYJT-BIIVOSGPSA-N 0.000 description 1
- MCKSLROAGSDNFC-ACZMJKKPSA-N Ala-Asp-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MCKSLROAGSDNFC-ACZMJKKPSA-N 0.000 description 1
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 1
- GWFSQQNGMPGBEF-GHCJXIJMSA-N Ala-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N GWFSQQNGMPGBEF-GHCJXIJMSA-N 0.000 description 1
- MKZCBYZBCINNJN-DLOVCJGASA-N Ala-Asp-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MKZCBYZBCINNJN-DLOVCJGASA-N 0.000 description 1
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 1
- NFDVJAKFMXHJEQ-HERUPUMHSA-N Ala-Asp-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N NFDVJAKFMXHJEQ-HERUPUMHSA-N 0.000 description 1
- HFBFSOAKPUZCCO-ZLUOBGJFSA-N Ala-Cys-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N HFBFSOAKPUZCCO-ZLUOBGJFSA-N 0.000 description 1
- DAEFQZCYZKRTLR-ZLUOBGJFSA-N Ala-Cys-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O DAEFQZCYZKRTLR-ZLUOBGJFSA-N 0.000 description 1
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 1
- CXQODNIBUNQWAS-CIUDSAMLSA-N Ala-Gln-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CXQODNIBUNQWAS-CIUDSAMLSA-N 0.000 description 1
- NKJBKNVQHBZUIX-ACZMJKKPSA-N Ala-Gln-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKJBKNVQHBZUIX-ACZMJKKPSA-N 0.000 description 1
- BLGHHPHXVJWCNK-GUBZILKMSA-N Ala-Gln-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BLGHHPHXVJWCNK-GUBZILKMSA-N 0.000 description 1
- JPGBXANAQYHTLA-DRZSPHRISA-N Ala-Gln-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JPGBXANAQYHTLA-DRZSPHRISA-N 0.000 description 1
- YIGLXQRFQVWFEY-NRPADANISA-N Ala-Gln-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O YIGLXQRFQVWFEY-NRPADANISA-N 0.000 description 1
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 1
- WKOBSJOZRJJVRZ-FXQIFTODSA-N Ala-Glu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WKOBSJOZRJJVRZ-FXQIFTODSA-N 0.000 description 1
- XYTNPQNAZREREP-XQXXSGGOSA-N Ala-Glu-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XYTNPQNAZREREP-XQXXSGGOSA-N 0.000 description 1
- YEVZMOUUZINZCK-LKTVYLICSA-N Ala-Glu-Trp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O YEVZMOUUZINZCK-LKTVYLICSA-N 0.000 description 1
- WMYJZJRILUVVRG-WDSKDSINSA-N Ala-Gly-Gln Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O WMYJZJRILUVVRG-WDSKDSINSA-N 0.000 description 1
- BEMGNWZECGIJOI-WDSKDSINSA-N Ala-Gly-Glu Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O BEMGNWZECGIJOI-WDSKDSINSA-N 0.000 description 1
- LMFXXZPPZDCPTA-ZKWXMUAHSA-N Ala-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N LMFXXZPPZDCPTA-ZKWXMUAHSA-N 0.000 description 1
- QHASENCZLDHBGX-ONGXEEELSA-N Ala-Gly-Phe Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QHASENCZLDHBGX-ONGXEEELSA-N 0.000 description 1
- NIZKGBJVCMRDKO-KWQFWETISA-N Ala-Gly-Tyr Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NIZKGBJVCMRDKO-KWQFWETISA-N 0.000 description 1
- SHKGHIFSEAGTNL-DLOVCJGASA-N Ala-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 SHKGHIFSEAGTNL-DLOVCJGASA-N 0.000 description 1
- IFKQPMZRDQZSHI-GHCJXIJMSA-N Ala-Ile-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O IFKQPMZRDQZSHI-GHCJXIJMSA-N 0.000 description 1
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 1
- NMXKFWOEASXOGB-QSFUFRPTSA-N Ala-Ile-His Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NMXKFWOEASXOGB-QSFUFRPTSA-N 0.000 description 1
- OKIKVSXTXVVFDV-MMWGEVLESA-N Ala-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N OKIKVSXTXVVFDV-MMWGEVLESA-N 0.000 description 1
- LXAARTARZJJCMB-CIQUZCHMSA-N Ala-Ile-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LXAARTARZJJCMB-CIQUZCHMSA-N 0.000 description 1
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 1
- ZKEHTYWGPMMGBC-XUXIUFHCSA-N Ala-Leu-Leu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O ZKEHTYWGPMMGBC-XUXIUFHCSA-N 0.000 description 1
- QPBSRMDNJOTFAL-AICCOOGYSA-N Ala-Leu-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QPBSRMDNJOTFAL-AICCOOGYSA-N 0.000 description 1
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 1
- UWIQWPWWZUHBAO-ZLIFDBKOSA-N Ala-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)CC(C)C)C(O)=O)=CNC2=C1 UWIQWPWWZUHBAO-ZLIFDBKOSA-N 0.000 description 1
- QUIGLPSHIFPEOV-CIUDSAMLSA-N Ala-Lys-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O QUIGLPSHIFPEOV-CIUDSAMLSA-N 0.000 description 1
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 1
- XHNLCGXYBXNRIS-BJDJZHNGSA-N Ala-Lys-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XHNLCGXYBXNRIS-BJDJZHNGSA-N 0.000 description 1
- PMQXMXAASGFUDX-SRVKXCTJSA-N Ala-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCCN PMQXMXAASGFUDX-SRVKXCTJSA-N 0.000 description 1
- FUKFQILQFQKHLE-DCAQKATOSA-N Ala-Lys-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O FUKFQILQFQKHLE-DCAQKATOSA-N 0.000 description 1
- KQESEZXHYOUIIM-CQDKDKBSSA-N Ala-Lys-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KQESEZXHYOUIIM-CQDKDKBSSA-N 0.000 description 1
- MDNAVFBZPROEHO-DCAQKATOSA-N Ala-Lys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MDNAVFBZPROEHO-DCAQKATOSA-N 0.000 description 1
- RAAWHFXHAACDFT-FXQIFTODSA-N Ala-Met-Asn Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CC(N)=O)C(O)=O RAAWHFXHAACDFT-FXQIFTODSA-N 0.000 description 1
- OMDNCNKNEGFOMM-BQBZGAKWSA-N Ala-Met-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O OMDNCNKNEGFOMM-BQBZGAKWSA-N 0.000 description 1
- IHRGVZXPTIQNIP-NAKRPEOUSA-N Ala-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C)N IHRGVZXPTIQNIP-NAKRPEOUSA-N 0.000 description 1
- GFEDXKNBZMPEDM-KZVJFYERSA-N Ala-Met-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GFEDXKNBZMPEDM-KZVJFYERSA-N 0.000 description 1
- DRARURMRLANNLS-GUBZILKMSA-N Ala-Met-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O DRARURMRLANNLS-GUBZILKMSA-N 0.000 description 1
- XRUJOVRWNMBAAA-NHCYSSNCSA-N Ala-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 XRUJOVRWNMBAAA-NHCYSSNCSA-N 0.000 description 1
- BFMIRJBURUXDRG-DLOVCJGASA-N Ala-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 BFMIRJBURUXDRG-DLOVCJGASA-N 0.000 description 1
- DHBKYZYFEXXUAK-ONGXEEELSA-N Ala-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 DHBKYZYFEXXUAK-ONGXEEELSA-N 0.000 description 1
- RNHKOQHGYMTHFR-UBHSHLNASA-N Ala-Phe-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 RNHKOQHGYMTHFR-UBHSHLNASA-N 0.000 description 1
- YCRAFFCYWOUEOF-DLOVCJGASA-N Ala-Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 YCRAFFCYWOUEOF-DLOVCJGASA-N 0.000 description 1
- DXTYEWAQOXYRHZ-KKXDTOCCSA-N Ala-Phe-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N DXTYEWAQOXYRHZ-KKXDTOCCSA-N 0.000 description 1
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 1
- XAXHGSOBFPIRFG-LSJOCFKGSA-N Ala-Pro-His Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O XAXHGSOBFPIRFG-LSJOCFKGSA-N 0.000 description 1
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 1
- OLVCTPPSXNRGKV-GUBZILKMSA-N Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OLVCTPPSXNRGKV-GUBZILKMSA-N 0.000 description 1
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 1
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 1
- YYAVDNKUWLAFCV-ACZMJKKPSA-N Ala-Ser-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYAVDNKUWLAFCV-ACZMJKKPSA-N 0.000 description 1
- MSWSRLGNLKHDEI-ACZMJKKPSA-N Ala-Ser-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O MSWSRLGNLKHDEI-ACZMJKKPSA-N 0.000 description 1
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 1
- NZGRHTKZFSVPAN-BIIVOSGPSA-N Ala-Ser-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N NZGRHTKZFSVPAN-BIIVOSGPSA-N 0.000 description 1
- SYIFFFHSXBNPMC-UWJYBYFXSA-N Ala-Ser-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N SYIFFFHSXBNPMC-UWJYBYFXSA-N 0.000 description 1
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 1
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 1
- SAHQGRZIQVEJPF-JXUBOQSCSA-N Ala-Thr-Lys Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN SAHQGRZIQVEJPF-JXUBOQSCSA-N 0.000 description 1
- ISCYZXFOCXWUJU-KZVJFYERSA-N Ala-Thr-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O ISCYZXFOCXWUJU-KZVJFYERSA-N 0.000 description 1
- QOIGKCBMXUCDQU-KDXUFGMBSA-N Ala-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N)O QOIGKCBMXUCDQU-KDXUFGMBSA-N 0.000 description 1
- KTXKIYXZQFWJKB-VZFHVOOUSA-N Ala-Thr-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O KTXKIYXZQFWJKB-VZFHVOOUSA-N 0.000 description 1
- UBTKNYUAMYRMKE-GOPGUHFVSA-N Ala-Trp-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N UBTKNYUAMYRMKE-GOPGUHFVSA-N 0.000 description 1
- TVUFMYKTYXTRPY-HERUPUMHSA-N Ala-Trp-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O TVUFMYKTYXTRPY-HERUPUMHSA-N 0.000 description 1
- QDGMZAOSMNGBLP-MRFFXTKBSA-N Ala-Trp-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)N QDGMZAOSMNGBLP-MRFFXTKBSA-N 0.000 description 1
- AENHOIXXHKNIQL-AUTRQRHGSA-N Ala-Tyr-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H]([NH3+])C)CC1=CC=C(O)C=C1 AENHOIXXHKNIQL-AUTRQRHGSA-N 0.000 description 1
- YCTIYBUTCKNOTI-UWJYBYFXSA-N Ala-Tyr-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCTIYBUTCKNOTI-UWJYBYFXSA-N 0.000 description 1
- ZJLORAAXDAJLDC-CQDKDKBSSA-N Ala-Tyr-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O ZJLORAAXDAJLDC-CQDKDKBSSA-N 0.000 description 1
- JPOQZCHGOTWRTM-FQPOAREZSA-N Ala-Tyr-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPOQZCHGOTWRTM-FQPOAREZSA-N 0.000 description 1
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 1
- ZCUFMRIQCPNOHZ-NRPADANISA-N Ala-Val-Gln Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZCUFMRIQCPNOHZ-NRPADANISA-N 0.000 description 1
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 1
- CLOMBHBBUKAUBP-LSJOCFKGSA-N Ala-Val-His Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N CLOMBHBBUKAUBP-LSJOCFKGSA-N 0.000 description 1
- LYILPUNCKACNGF-NAKRPEOUSA-N Ala-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)N LYILPUNCKACNGF-NAKRPEOUSA-N 0.000 description 1
- 235000017060 Arachis glabrata Nutrition 0.000 description 1
- 235000010777 Arachis hypogaea Nutrition 0.000 description 1
- 244000105624 Arachis hypogaea Species 0.000 description 1
- 235000018262 Arachis monticola Nutrition 0.000 description 1
- OTOXOKCIIQLMFH-KZVJFYERSA-N Arg-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N OTOXOKCIIQLMFH-KZVJFYERSA-N 0.000 description 1
- VWVPYNGMOCSSGK-GUBZILKMSA-N Arg-Arg-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O VWVPYNGMOCSSGK-GUBZILKMSA-N 0.000 description 1
- BHSYMWWMVRPCPA-CYDGBPFRSA-N Arg-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCN=C(N)N BHSYMWWMVRPCPA-CYDGBPFRSA-N 0.000 description 1
- JTKLCCFLSLCCST-SZMVWBNQSA-N Arg-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(O)=O)=CNC2=C1 JTKLCCFLSLCCST-SZMVWBNQSA-N 0.000 description 1
- WOPFJPHVBWKZJH-SRVKXCTJSA-N Arg-Arg-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O WOPFJPHVBWKZJH-SRVKXCTJSA-N 0.000 description 1
- DCGLNNVKIZXQOJ-FXQIFTODSA-N Arg-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N DCGLNNVKIZXQOJ-FXQIFTODSA-N 0.000 description 1
- NUBPTCMEOCKWDO-DCAQKATOSA-N Arg-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N NUBPTCMEOCKWDO-DCAQKATOSA-N 0.000 description 1
- GHNDBBVSWOWYII-LPEHRKFASA-N Arg-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O GHNDBBVSWOWYII-LPEHRKFASA-N 0.000 description 1
- PQWTZSNVWSOFFK-FXQIFTODSA-N Arg-Asp-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)CN=C(N)N PQWTZSNVWSOFFK-FXQIFTODSA-N 0.000 description 1
- DXQIQUIQYAGRCC-CIUDSAMLSA-N Arg-Asp-Gln Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)CN=C(N)N DXQIQUIQYAGRCC-CIUDSAMLSA-N 0.000 description 1
- TTXYKSADPSNOIF-IHRRRGAJSA-N Arg-Asp-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O TTXYKSADPSNOIF-IHRRRGAJSA-N 0.000 description 1
- HKRXJBBCQBAGIM-FXQIFTODSA-N Arg-Asp-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N HKRXJBBCQBAGIM-FXQIFTODSA-N 0.000 description 1
- GDVDRMUYICMNFJ-CIUDSAMLSA-N Arg-Cys-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O GDVDRMUYICMNFJ-CIUDSAMLSA-N 0.000 description 1
- SNBHMYQRNCJSOJ-CIUDSAMLSA-N Arg-Gln-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SNBHMYQRNCJSOJ-CIUDSAMLSA-N 0.000 description 1
- KBBKCNHWCDJPGN-GUBZILKMSA-N Arg-Gln-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KBBKCNHWCDJPGN-GUBZILKMSA-N 0.000 description 1
- ZEAYJGRKRUBDOB-GARJFASQSA-N Arg-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ZEAYJGRKRUBDOB-GARJFASQSA-N 0.000 description 1
- MTANSHNQTWPZKP-KKUMJFAQSA-N Arg-Gln-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)O MTANSHNQTWPZKP-KKUMJFAQSA-N 0.000 description 1
- LMPKCSXZJSXBBL-NHCYSSNCSA-N Arg-Gln-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O LMPKCSXZJSXBBL-NHCYSSNCSA-N 0.000 description 1
- HPKSHFSEXICTLI-CIUDSAMLSA-N Arg-Glu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HPKSHFSEXICTLI-CIUDSAMLSA-N 0.000 description 1
- XLWSGICNBZGYTA-CIUDSAMLSA-N Arg-Glu-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XLWSGICNBZGYTA-CIUDSAMLSA-N 0.000 description 1
- PNQWAUXQDBIJDY-GUBZILKMSA-N Arg-Glu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNQWAUXQDBIJDY-GUBZILKMSA-N 0.000 description 1
- SKTGPBFTMNLIHQ-KKUMJFAQSA-N Arg-Glu-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SKTGPBFTMNLIHQ-KKUMJFAQSA-N 0.000 description 1
- GOWZVQXTHUCNSQ-NHCYSSNCSA-N Arg-Glu-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GOWZVQXTHUCNSQ-NHCYSSNCSA-N 0.000 description 1
- CYXCAHZVPFREJD-LURJTMIESA-N Arg-Gly-Gly Chemical compound NC(=N)NCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O CYXCAHZVPFREJD-LURJTMIESA-N 0.000 description 1
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 1
- PHHRSPBBQUFULD-UWVGGRQHSA-N Arg-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N PHHRSPBBQUFULD-UWVGGRQHSA-N 0.000 description 1
- KRQSPVKUISQQFS-FJXKBIBVSA-N Arg-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N KRQSPVKUISQQFS-FJXKBIBVSA-N 0.000 description 1
- JTZUZBADHGISJD-SRVKXCTJSA-N Arg-His-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JTZUZBADHGISJD-SRVKXCTJSA-N 0.000 description 1
- PCQXGEUALSFGIA-WDSOQIARSA-N Arg-His-Trp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O PCQXGEUALSFGIA-WDSOQIARSA-N 0.000 description 1
- ITHMWNNUDPJJER-ULQDDVLXSA-N Arg-His-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ITHMWNNUDPJJER-ULQDDVLXSA-N 0.000 description 1
- NVUIWHJLPSZZQC-CYDGBPFRSA-N Arg-Ile-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NVUIWHJLPSZZQC-CYDGBPFRSA-N 0.000 description 1
- YQGZIRIYGHNSQO-ZPFDUUQYSA-N Arg-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YQGZIRIYGHNSQO-ZPFDUUQYSA-N 0.000 description 1
- UAOSDDXCTBIPCA-QXEWZRGKSA-N Arg-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UAOSDDXCTBIPCA-QXEWZRGKSA-N 0.000 description 1
- OKKMBOSPBDASEP-CYDGBPFRSA-N Arg-Ile-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(O)=O OKKMBOSPBDASEP-CYDGBPFRSA-N 0.000 description 1
- GNYUVVJYGJFKHN-RVMXOQNASA-N Arg-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N GNYUVVJYGJFKHN-RVMXOQNASA-N 0.000 description 1
- RTDZQOFEGPWSJD-AVGNSLFASA-N Arg-Leu-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O RTDZQOFEGPWSJD-AVGNSLFASA-N 0.000 description 1
- SSZGOKWBHLOCHK-DCAQKATOSA-N Arg-Lys-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N SSZGOKWBHLOCHK-DCAQKATOSA-N 0.000 description 1
- BTJVOUQWFXABOI-IHRRRGAJSA-N Arg-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCNC(N)=N BTJVOUQWFXABOI-IHRRRGAJSA-N 0.000 description 1
- NPAVRDPEFVKELR-DCAQKATOSA-N Arg-Lys-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NPAVRDPEFVKELR-DCAQKATOSA-N 0.000 description 1
- PAPSMOYMQDWIOR-AVGNSLFASA-N Arg-Lys-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PAPSMOYMQDWIOR-AVGNSLFASA-N 0.000 description 1
- JOADBFCFJGNIKF-GUBZILKMSA-N Arg-Met-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O JOADBFCFJGNIKF-GUBZILKMSA-N 0.000 description 1
- PYZPXCZNQSEHDT-GUBZILKMSA-N Arg-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N PYZPXCZNQSEHDT-GUBZILKMSA-N 0.000 description 1
- INXWADWANGLMPJ-JYJNAYRXSA-N Arg-Phe-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)CC1=CC=CC=C1 INXWADWANGLMPJ-JYJNAYRXSA-N 0.000 description 1
- GSUFZRURORXYTM-STQMWFEESA-N Arg-Phe-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 GSUFZRURORXYTM-STQMWFEESA-N 0.000 description 1
- UGZUVYDKAYNCII-ULQDDVLXSA-N Arg-Phe-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UGZUVYDKAYNCII-ULQDDVLXSA-N 0.000 description 1
- HGKHPCFTRQDHCU-IUCAKERBSA-N Arg-Pro-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HGKHPCFTRQDHCU-IUCAKERBSA-N 0.000 description 1
- YCYXHLZRUSJITQ-SRVKXCTJSA-N Arg-Pro-Pro Chemical compound NC(=N)NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 YCYXHLZRUSJITQ-SRVKXCTJSA-N 0.000 description 1
- AWMAZIIEFPFHCP-RCWTZXSCSA-N Arg-Pro-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O AWMAZIIEFPFHCP-RCWTZXSCSA-N 0.000 description 1
- AMIQZQAAYGYKOP-FXQIFTODSA-N Arg-Ser-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O AMIQZQAAYGYKOP-FXQIFTODSA-N 0.000 description 1
- URAUIUGLHBRPMF-NAKRPEOUSA-N Arg-Ser-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O URAUIUGLHBRPMF-NAKRPEOUSA-N 0.000 description 1
- KMFPQTITXUKJOV-DCAQKATOSA-N Arg-Ser-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O KMFPQTITXUKJOV-DCAQKATOSA-N 0.000 description 1
- BECXEHHOZNFFFX-IHRRRGAJSA-N Arg-Ser-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BECXEHHOZNFFFX-IHRRRGAJSA-N 0.000 description 1
- SYFHFLGAROUHNT-VEVYYDQMSA-N Arg-Thr-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SYFHFLGAROUHNT-VEVYYDQMSA-N 0.000 description 1
- WCZXPVPHUMYLMS-VEVYYDQMSA-N Arg-Thr-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O WCZXPVPHUMYLMS-VEVYYDQMSA-N 0.000 description 1
- MOGMYRUNTKYZFB-UNQGMJICSA-N Arg-Thr-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MOGMYRUNTKYZFB-UNQGMJICSA-N 0.000 description 1
- ZJBUILVYSXQNSW-YTWAJWBKSA-N Arg-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ZJBUILVYSXQNSW-YTWAJWBKSA-N 0.000 description 1
- ZPWMEWYQBWSGAO-ZJDVBMNYSA-N Arg-Thr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZPWMEWYQBWSGAO-ZJDVBMNYSA-N 0.000 description 1
- XRNXPIGJPQHCPC-RCWTZXSCSA-N Arg-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)O)C(O)=O XRNXPIGJPQHCPC-RCWTZXSCSA-N 0.000 description 1
- LOVIQNMIPQVIGT-BVSLBCMMSA-N Arg-Trp-Phe Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CCCN=C(N)N)N)C(O)=O)C1=CC=CC=C1 LOVIQNMIPQVIGT-BVSLBCMMSA-N 0.000 description 1
- ZCSHHTFOZULVLN-SZMVWBNQSA-N Arg-Trp-Val Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N)=CNC2=C1 ZCSHHTFOZULVLN-SZMVWBNQSA-N 0.000 description 1
- NVPHRWNWTKYIST-BPNCWPANSA-N Arg-Tyr-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 NVPHRWNWTKYIST-BPNCWPANSA-N 0.000 description 1
- BWMMKQPATDUYKB-IHRRRGAJSA-N Arg-Tyr-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=C(O)C=C1 BWMMKQPATDUYKB-IHRRRGAJSA-N 0.000 description 1
- CGWVCWFQGXOUSJ-ULQDDVLXSA-N Arg-Tyr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O CGWVCWFQGXOUSJ-ULQDDVLXSA-N 0.000 description 1
- QHUOOCKNNURZSL-IHRRRGAJSA-N Arg-Tyr-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O QHUOOCKNNURZSL-IHRRRGAJSA-N 0.000 description 1
- LLQIAIUAKGNOSE-NHCYSSNCSA-N Arg-Val-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N LLQIAIUAKGNOSE-NHCYSSNCSA-N 0.000 description 1
- VYZBPPBKFCHCIS-WPRPVWTQSA-N Arg-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N VYZBPPBKFCHCIS-WPRPVWTQSA-N 0.000 description 1
- FMYQECOAIFGQGU-CYDGBPFRSA-N Arg-Val-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMYQECOAIFGQGU-CYDGBPFRSA-N 0.000 description 1
- WOZDCBHUGJVJPL-AVGNSLFASA-N Arg-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WOZDCBHUGJVJPL-AVGNSLFASA-N 0.000 description 1
- QLSRIZIDQXDQHK-RCWTZXSCSA-N Arg-Val-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QLSRIZIDQXDQHK-RCWTZXSCSA-N 0.000 description 1
- PFOYSEIHFVKHNF-FXQIFTODSA-N Asn-Ala-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PFOYSEIHFVKHNF-FXQIFTODSA-N 0.000 description 1
- RZVVKNIACROXRM-ZLUOBGJFSA-N Asn-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N RZVVKNIACROXRM-ZLUOBGJFSA-N 0.000 description 1
- BRCVLJZIIFBSPF-ZLUOBGJFSA-N Asn-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N BRCVLJZIIFBSPF-ZLUOBGJFSA-N 0.000 description 1
- LEFKSBYHUGUWLP-ACZMJKKPSA-N Asn-Ala-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LEFKSBYHUGUWLP-ACZMJKKPSA-N 0.000 description 1
- SLKLLQWZQHXYSV-CIUDSAMLSA-N Asn-Ala-Lys Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O SLKLLQWZQHXYSV-CIUDSAMLSA-N 0.000 description 1
- QQEWINYJRFBLNN-DLOVCJGASA-N Asn-Ala-Phe Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QQEWINYJRFBLNN-DLOVCJGASA-N 0.000 description 1
- IARGXWMWRFOQPG-GCJQMDKQSA-N Asn-Ala-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IARGXWMWRFOQPG-GCJQMDKQSA-N 0.000 description 1
- NTXNUXPCNRDMAF-WFBYXXMGSA-N Asn-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CC(N)=O)C)C(O)=O)=CNC2=C1 NTXNUXPCNRDMAF-WFBYXXMGSA-N 0.000 description 1
- BDMIFVIWCNLDCT-CIUDSAMLSA-N Asn-Arg-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O BDMIFVIWCNLDCT-CIUDSAMLSA-N 0.000 description 1
- MEFGKQUUYZOLHM-GMOBBJLQSA-N Asn-Arg-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MEFGKQUUYZOLHM-GMOBBJLQSA-N 0.000 description 1
- DQTIWTULBGLJBL-DCAQKATOSA-N Asn-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N DQTIWTULBGLJBL-DCAQKATOSA-N 0.000 description 1
- GOVUDFOGXOONFT-VEVYYDQMSA-N Asn-Arg-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GOVUDFOGXOONFT-VEVYYDQMSA-N 0.000 description 1
- JEPNYDRDYNSFIU-QXEWZRGKSA-N Asn-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(N)=O)C(O)=O JEPNYDRDYNSFIU-QXEWZRGKSA-N 0.000 description 1
- ZZXMOQIUIJJOKZ-ZLUOBGJFSA-N Asn-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O ZZXMOQIUIJJOKZ-ZLUOBGJFSA-N 0.000 description 1
- HAJWYALLJIATCX-FXQIFTODSA-N Asn-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N HAJWYALLJIATCX-FXQIFTODSA-N 0.000 description 1
- DAPLJWATMAXPPZ-CIUDSAMLSA-N Asn-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O DAPLJWATMAXPPZ-CIUDSAMLSA-N 0.000 description 1
- DXZNJWFECGJCQR-FXQIFTODSA-N Asn-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N DXZNJWFECGJCQR-FXQIFTODSA-N 0.000 description 1
- XSGBIBGAMKTHMY-WHFBIAKZSA-N Asn-Asp-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O XSGBIBGAMKTHMY-WHFBIAKZSA-N 0.000 description 1
- UGXVKHRDGLYFKR-CIUDSAMLSA-N Asn-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(N)=O UGXVKHRDGLYFKR-CIUDSAMLSA-N 0.000 description 1
- FANGHKQYFPYDNB-UBHSHLNASA-N Asn-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N FANGHKQYFPYDNB-UBHSHLNASA-N 0.000 description 1
- PAXHINASXXXILC-SRVKXCTJSA-N Asn-Asp-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N)O PAXHINASXXXILC-SRVKXCTJSA-N 0.000 description 1
- IYVSIZAXNLOKFQ-BYULHYEWSA-N Asn-Asp-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IYVSIZAXNLOKFQ-BYULHYEWSA-N 0.000 description 1
- UPALZCBCKAMGIY-PEFMBERDSA-N Asn-Gln-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UPALZCBCKAMGIY-PEFMBERDSA-N 0.000 description 1
- KUYKVGODHGHFDI-ACZMJKKPSA-N Asn-Gln-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O KUYKVGODHGHFDI-ACZMJKKPSA-N 0.000 description 1
- JREOBWLIZLXRIS-GUBZILKMSA-N Asn-Glu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JREOBWLIZLXRIS-GUBZILKMSA-N 0.000 description 1
- ASCGFDYEKSRNPL-CIUDSAMLSA-N Asn-Glu-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O ASCGFDYEKSRNPL-CIUDSAMLSA-N 0.000 description 1
- COUZKSSMBFADSB-AVGNSLFASA-N Asn-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N COUZKSSMBFADSB-AVGNSLFASA-N 0.000 description 1
- GFFRWIJAFFMQGM-NUMRIWBASA-N Asn-Glu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GFFRWIJAFFMQGM-NUMRIWBASA-N 0.000 description 1
- DMLSCRJBWUEALP-LAEOZQHASA-N Asn-Glu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O DMLSCRJBWUEALP-LAEOZQHASA-N 0.000 description 1
- DDPXDCKYWDGZAL-BQBZGAKWSA-N Asn-Gly-Arg Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N DDPXDCKYWDGZAL-BQBZGAKWSA-N 0.000 description 1
- DXVMJJNAOVECBA-WHFBIAKZSA-N Asn-Gly-Asn Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O DXVMJJNAOVECBA-WHFBIAKZSA-N 0.000 description 1
- WONGRTVAMHFGBE-WDSKDSINSA-N Asn-Gly-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N WONGRTVAMHFGBE-WDSKDSINSA-N 0.000 description 1
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 1
- PBSQFBAJKPLRJY-BYULHYEWSA-N Asn-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N PBSQFBAJKPLRJY-BYULHYEWSA-N 0.000 description 1
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 1
- GURLOFOJBHRPJN-AAEUAGOBSA-N Asn-Gly-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N GURLOFOJBHRPJN-AAEUAGOBSA-N 0.000 description 1
- UDSVWSUXKYXSTR-QWRGUYRKSA-N Asn-Gly-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UDSVWSUXKYXSTR-QWRGUYRKSA-N 0.000 description 1
- ZKDGORKGHPCZOV-DCAQKATOSA-N Asn-His-Arg Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZKDGORKGHPCZOV-DCAQKATOSA-N 0.000 description 1
- ODBSSLHUFPJRED-CIUDSAMLSA-N Asn-His-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N ODBSSLHUFPJRED-CIUDSAMLSA-N 0.000 description 1
- SGAUXNZEFIEAAI-GARJFASQSA-N Asn-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC(=O)N)N)C(=O)O SGAUXNZEFIEAAI-GARJFASQSA-N 0.000 description 1
- NKLRWRRVYGQNIH-GHCJXIJMSA-N Asn-Ile-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O NKLRWRRVYGQNIH-GHCJXIJMSA-N 0.000 description 1
- ANPFQTJEPONRPL-UGYAYLCHSA-N Asn-Ile-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O ANPFQTJEPONRPL-UGYAYLCHSA-N 0.000 description 1
- XLZCLJRGGMBKLR-PCBIJLKTSA-N Asn-Ile-Phe Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XLZCLJRGGMBKLR-PCBIJLKTSA-N 0.000 description 1
- LTZIRYMWOJHRCH-GUDRVLHUSA-N Asn-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N LTZIRYMWOJHRCH-GUDRVLHUSA-N 0.000 description 1
- NLRJGXZWTKXRHP-DCAQKATOSA-N Asn-Leu-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NLRJGXZWTKXRHP-DCAQKATOSA-N 0.000 description 1
- HFPXZWPUVFVNLL-GUBZILKMSA-N Asn-Leu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HFPXZWPUVFVNLL-GUBZILKMSA-N 0.000 description 1
- HDHZCEDPLTVHFZ-GUBZILKMSA-N Asn-Leu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O HDHZCEDPLTVHFZ-GUBZILKMSA-N 0.000 description 1
- YVXRYLVELQYAEQ-SRVKXCTJSA-N Asn-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N YVXRYLVELQYAEQ-SRVKXCTJSA-N 0.000 description 1
- JEEFEQCRXKPQHC-KKUMJFAQSA-N Asn-Leu-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JEEFEQCRXKPQHC-KKUMJFAQSA-N 0.000 description 1
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 1
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 1
- KHCNTVRVAYCPQE-CIUDSAMLSA-N Asn-Lys-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O KHCNTVRVAYCPQE-CIUDSAMLSA-N 0.000 description 1
- FTSAJSADJCMDHH-CIUDSAMLSA-N Asn-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N FTSAJSADJCMDHH-CIUDSAMLSA-N 0.000 description 1
- FBODFHMLALOPHP-GUBZILKMSA-N Asn-Lys-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O FBODFHMLALOPHP-GUBZILKMSA-N 0.000 description 1
- NYGILGUOUOXGMJ-YUMQZZPRSA-N Asn-Lys-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O NYGILGUOUOXGMJ-YUMQZZPRSA-N 0.000 description 1
- ORJQQZIXTOYGGH-SRVKXCTJSA-N Asn-Lys-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ORJQQZIXTOYGGH-SRVKXCTJSA-N 0.000 description 1
- GIQCDTKOIPUDSG-GARJFASQSA-N Asn-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N)C(=O)O GIQCDTKOIPUDSG-GARJFASQSA-N 0.000 description 1
- AYOAHKWVQLNPDM-HJGDQZAQSA-N Asn-Lys-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AYOAHKWVQLNPDM-HJGDQZAQSA-N 0.000 description 1
- NLDNNZKUSLAYFW-NHCYSSNCSA-N Asn-Lys-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O NLDNNZKUSLAYFW-NHCYSSNCSA-N 0.000 description 1
- NNDSLVWAQAUPPP-GUBZILKMSA-N Asn-Met-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N NNDSLVWAQAUPPP-GUBZILKMSA-N 0.000 description 1
- VITDJIPIJZAVGC-VEVYYDQMSA-N Asn-Met-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VITDJIPIJZAVGC-VEVYYDQMSA-N 0.000 description 1
- KAZKWIKPEPABOO-IHRRRGAJSA-N Asn-Met-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N KAZKWIKPEPABOO-IHRRRGAJSA-N 0.000 description 1
- LSJQOMAZIKQMTJ-SRVKXCTJSA-N Asn-Phe-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LSJQOMAZIKQMTJ-SRVKXCTJSA-N 0.000 description 1
- PPCORQFLAZWUNO-QWRGUYRKSA-N Asn-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N PPCORQFLAZWUNO-QWRGUYRKSA-N 0.000 description 1
- MVXJBVVLACEGCG-PCBIJLKTSA-N Asn-Phe-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVXJBVVLACEGCG-PCBIJLKTSA-N 0.000 description 1
- YUUIAUXBNOHFRJ-IHRRRGAJSA-N Asn-Phe-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O YUUIAUXBNOHFRJ-IHRRRGAJSA-N 0.000 description 1
- PLTGTJAZQRGMPP-FXQIFTODSA-N Asn-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(N)=O PLTGTJAZQRGMPP-FXQIFTODSA-N 0.000 description 1
- QXOPPIDJKPEKCW-GUBZILKMSA-N Asn-Pro-Arg Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O QXOPPIDJKPEKCW-GUBZILKMSA-N 0.000 description 1
- YRTOMUMWSTUQAX-FXQIFTODSA-N Asn-Pro-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O YRTOMUMWSTUQAX-FXQIFTODSA-N 0.000 description 1
- OSZBYGVKAFZWKC-FXQIFTODSA-N Asn-Pro-Cys Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(O)=O OSZBYGVKAFZWKC-FXQIFTODSA-N 0.000 description 1
- YUOXLJYVSZYPBJ-CIUDSAMLSA-N Asn-Pro-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O YUOXLJYVSZYPBJ-CIUDSAMLSA-N 0.000 description 1
- NJSNXIOKBHPFMB-GMOBBJLQSA-N Asn-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)N)N NJSNXIOKBHPFMB-GMOBBJLQSA-N 0.000 description 1
- BYLSYQASFJJBCL-DCAQKATOSA-N Asn-Pro-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O BYLSYQASFJJBCL-DCAQKATOSA-N 0.000 description 1
- IDUUACUJKUXKKD-VEVYYDQMSA-N Asn-Pro-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O IDUUACUJKUXKKD-VEVYYDQMSA-N 0.000 description 1
- SUIJFTJDTJKSRK-IHRRRGAJSA-N Asn-Pro-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SUIJFTJDTJKSRK-IHRRRGAJSA-N 0.000 description 1
- VWADICJNCPFKJS-ZLUOBGJFSA-N Asn-Ser-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O VWADICJNCPFKJS-ZLUOBGJFSA-N 0.000 description 1
- JWQWPRCDYWNVNM-ACZMJKKPSA-N Asn-Ser-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N JWQWPRCDYWNVNM-ACZMJKKPSA-N 0.000 description 1
- UGXYFDQFLVCDFC-CIUDSAMLSA-N Asn-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O UGXYFDQFLVCDFC-CIUDSAMLSA-N 0.000 description 1
- HNXWVVHIGTZTBO-LKXGYXEUSA-N Asn-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O HNXWVVHIGTZTBO-LKXGYXEUSA-N 0.000 description 1
- MYTHOBCLNIOFBL-SRVKXCTJSA-N Asn-Ser-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MYTHOBCLNIOFBL-SRVKXCTJSA-N 0.000 description 1
- JXMREEPBRANWBY-VEVYYDQMSA-N Asn-Thr-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JXMREEPBRANWBY-VEVYYDQMSA-N 0.000 description 1
- QUMKPKWYDVMGNT-NUMRIWBASA-N Asn-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QUMKPKWYDVMGNT-NUMRIWBASA-N 0.000 description 1
- PUUPMDXIHCOPJU-HJGDQZAQSA-N Asn-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O PUUPMDXIHCOPJU-HJGDQZAQSA-N 0.000 description 1
- XIDSGDJNUJRUHE-VEVYYDQMSA-N Asn-Thr-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O XIDSGDJNUJRUHE-VEVYYDQMSA-N 0.000 description 1
- PIABYSIYPGLLDQ-XVSYOHENSA-N Asn-Thr-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PIABYSIYPGLLDQ-XVSYOHENSA-N 0.000 description 1
- WUQXMTITJLFXAU-JIOCBJNQSA-N Asn-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N)O WUQXMTITJLFXAU-JIOCBJNQSA-N 0.000 description 1
- UXHYOWXTJLBEPG-GSSVUCPTSA-N Asn-Thr-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UXHYOWXTJLBEPG-GSSVUCPTSA-N 0.000 description 1
- KZYSHAMXEBPJBD-JRQIVUDYSA-N Asn-Thr-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KZYSHAMXEBPJBD-JRQIVUDYSA-N 0.000 description 1
- RDLYUKRPEJERMM-XIRDDKMYSA-N Asn-Trp-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O RDLYUKRPEJERMM-XIRDDKMYSA-N 0.000 description 1
- NSTBNYOKCZKOMI-AVGNSLFASA-N Asn-Tyr-Glu Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O NSTBNYOKCZKOMI-AVGNSLFASA-N 0.000 description 1
- YSYTWUMRHSFODC-QWRGUYRKSA-N Asn-Tyr-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O YSYTWUMRHSFODC-QWRGUYRKSA-N 0.000 description 1
- DATSKXOXPUAOLK-KKUMJFAQSA-N Asn-Tyr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DATSKXOXPUAOLK-KKUMJFAQSA-N 0.000 description 1
- CGYKCTPUGXFPMG-IHPCNDPISA-N Asn-Tyr-Trp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O CGYKCTPUGXFPMG-IHPCNDPISA-N 0.000 description 1
- DPSUVAPLRQDWAO-YDHLFZDLSA-N Asn-Tyr-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(=O)N)N DPSUVAPLRQDWAO-YDHLFZDLSA-N 0.000 description 1
- SYZWMVSXBZCOBZ-QXEWZRGKSA-N Asn-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N SYZWMVSXBZCOBZ-QXEWZRGKSA-N 0.000 description 1
- KBQOUDLMWYWXNP-YDHLFZDLSA-N Asn-Val-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)N)N KBQOUDLMWYWXNP-YDHLFZDLSA-N 0.000 description 1
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 1
- KDFQZBWWPYQBEN-ZLUOBGJFSA-N Asp-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N KDFQZBWWPYQBEN-ZLUOBGJFSA-N 0.000 description 1
- WSWYMRLTJVKRCE-ZLUOBGJFSA-N Asp-Ala-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O WSWYMRLTJVKRCE-ZLUOBGJFSA-N 0.000 description 1
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 1
- VPPXTHJNTYDNFJ-CIUDSAMLSA-N Asp-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N VPPXTHJNTYDNFJ-CIUDSAMLSA-N 0.000 description 1
- NJIKKGUVGUBICV-ZLUOBGJFSA-N Asp-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O NJIKKGUVGUBICV-ZLUOBGJFSA-N 0.000 description 1
- KVMPVNGOKHTUHZ-GCJQMDKQSA-N Asp-Ala-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KVMPVNGOKHTUHZ-GCJQMDKQSA-N 0.000 description 1
- OERMIMJQPQUIPK-FXQIFTODSA-N Asp-Arg-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O OERMIMJQPQUIPK-FXQIFTODSA-N 0.000 description 1
- GVPSCJQLUGIKAM-GUBZILKMSA-N Asp-Arg-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GVPSCJQLUGIKAM-GUBZILKMSA-N 0.000 description 1
- AXXCUABIFZPKPM-BQBZGAKWSA-N Asp-Arg-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O AXXCUABIFZPKPM-BQBZGAKWSA-N 0.000 description 1
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 1
- DBWYWXNMZZYIRY-LPEHRKFASA-N Asp-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O DBWYWXNMZZYIRY-LPEHRKFASA-N 0.000 description 1
- XYBJLTKSGFBLCS-QXEWZRGKSA-N Asp-Arg-Val Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC(O)=O XYBJLTKSGFBLCS-QXEWZRGKSA-N 0.000 description 1
- YNQIDCRRTWGHJD-ZLUOBGJFSA-N Asp-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(O)=O YNQIDCRRTWGHJD-ZLUOBGJFSA-N 0.000 description 1
- XACXDSRQIXRMNS-OLHMAJIHSA-N Asp-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)O XACXDSRQIXRMNS-OLHMAJIHSA-N 0.000 description 1
- TVVYVAUGRHNTGT-UGYAYLCHSA-N Asp-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O TVVYVAUGRHNTGT-UGYAYLCHSA-N 0.000 description 1
- LKIYSIYBKYLKPU-BIIVOSGPSA-N Asp-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O LKIYSIYBKYLKPU-BIIVOSGPSA-N 0.000 description 1
- MJKBOVWWADWLHV-ZLUOBGJFSA-N Asp-Cys-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)C(=O)O MJKBOVWWADWLHV-ZLUOBGJFSA-N 0.000 description 1
- RSMIHCFQDCVVBR-CIUDSAMLSA-N Asp-Gln-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N RSMIHCFQDCVVBR-CIUDSAMLSA-N 0.000 description 1
- KIJLEFNHWSXHRU-NUMRIWBASA-N Asp-Gln-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KIJLEFNHWSXHRU-NUMRIWBASA-N 0.000 description 1
- UFAQGGZUXVLONR-AVGNSLFASA-N Asp-Gln-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N)O UFAQGGZUXVLONR-AVGNSLFASA-N 0.000 description 1
- XAJRHVUUVUPFQL-ACZMJKKPSA-N Asp-Glu-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XAJRHVUUVUPFQL-ACZMJKKPSA-N 0.000 description 1
- VFUXXFVCYZPOQG-WDSKDSINSA-N Asp-Glu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VFUXXFVCYZPOQG-WDSKDSINSA-N 0.000 description 1
- QCLHLXDWRKOHRR-GUBZILKMSA-N Asp-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N QCLHLXDWRKOHRR-GUBZILKMSA-N 0.000 description 1
- VILLWIDTHYPSLC-PEFMBERDSA-N Asp-Glu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VILLWIDTHYPSLC-PEFMBERDSA-N 0.000 description 1
- DTNUIAJCPRMNBT-WHFBIAKZSA-N Asp-Gly-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O DTNUIAJCPRMNBT-WHFBIAKZSA-N 0.000 description 1
- WBDWQKRLTVCDSY-WHFBIAKZSA-N Asp-Gly-Asp Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O WBDWQKRLTVCDSY-WHFBIAKZSA-N 0.000 description 1
- VIRHEUMYXXLCBF-WDSKDSINSA-N Asp-Gly-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O VIRHEUMYXXLCBF-WDSKDSINSA-N 0.000 description 1
- QCVXMEHGFUMKCO-YUMQZZPRSA-N Asp-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O QCVXMEHGFUMKCO-YUMQZZPRSA-N 0.000 description 1
- KHGPWGKPYHPOIK-QWRGUYRKSA-N Asp-Gly-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KHGPWGKPYHPOIK-QWRGUYRKSA-N 0.000 description 1
- POTCZYQVVNXUIG-BQBZGAKWSA-N Asp-Gly-Pro Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O POTCZYQVVNXUIG-BQBZGAKWSA-N 0.000 description 1
- NRIFEOUAFLTMFJ-AAEUAGOBSA-N Asp-Gly-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O NRIFEOUAFLTMFJ-AAEUAGOBSA-N 0.000 description 1
- QNFRBNZGVVKBNJ-PEFMBERDSA-N Asp-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N QNFRBNZGVVKBNJ-PEFMBERDSA-N 0.000 description 1
- NHSDEZURHWEZPN-SXTJYALSSA-N Asp-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC(=O)O)N NHSDEZURHWEZPN-SXTJYALSSA-N 0.000 description 1
- YFSLJHLQOALGSY-ZPFDUUQYSA-N Asp-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N YFSLJHLQOALGSY-ZPFDUUQYSA-N 0.000 description 1
- LDLZOAJRXXBVGF-GMOBBJLQSA-N Asp-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)O)N LDLZOAJRXXBVGF-GMOBBJLQSA-N 0.000 description 1
- UZNSWMFLKVKJLI-VHWLVUOQSA-N Asp-Ile-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O UZNSWMFLKVKJLI-VHWLVUOQSA-N 0.000 description 1
- RTXQQDVBACBSCW-CFMVVWHZSA-N Asp-Ile-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RTXQQDVBACBSCW-CFMVVWHZSA-N 0.000 description 1
- ORRJQLIATJDMQM-HJGDQZAQSA-N Asp-Leu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O ORRJQLIATJDMQM-HJGDQZAQSA-N 0.000 description 1
- QNMKWNONJGKJJC-NHCYSSNCSA-N Asp-Leu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O QNMKWNONJGKJJC-NHCYSSNCSA-N 0.000 description 1
- XWSIYTYNLKCLJB-CIUDSAMLSA-N Asp-Lys-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O XWSIYTYNLKCLJB-CIUDSAMLSA-N 0.000 description 1
- CTWCFPWFIGRAEP-CIUDSAMLSA-N Asp-Lys-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O CTWCFPWFIGRAEP-CIUDSAMLSA-N 0.000 description 1
- VSMYBNPOHYAXSD-GUBZILKMSA-N Asp-Lys-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O VSMYBNPOHYAXSD-GUBZILKMSA-N 0.000 description 1
- NVFSJIXJZCDICF-SRVKXCTJSA-N Asp-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N NVFSJIXJZCDICF-SRVKXCTJSA-N 0.000 description 1
- NZWDWXSWUQCNMG-GARJFASQSA-N Asp-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)C(=O)O NZWDWXSWUQCNMG-GARJFASQSA-N 0.000 description 1
- DPNWSMBUYCLEDG-CIUDSAMLSA-N Asp-Lys-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O DPNWSMBUYCLEDG-CIUDSAMLSA-N 0.000 description 1
- DONWIPDSZZJHHK-HJGDQZAQSA-N Asp-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)O DONWIPDSZZJHHK-HJGDQZAQSA-N 0.000 description 1
- ZXRQJQCXPSMNMR-XIRDDKMYSA-N Asp-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N ZXRQJQCXPSMNMR-XIRDDKMYSA-N 0.000 description 1
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 1
- IOXWDLNHXZOXQP-FXQIFTODSA-N Asp-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N IOXWDLNHXZOXQP-FXQIFTODSA-N 0.000 description 1
- IDDMGSKZQDEDGA-SRVKXCTJSA-N Asp-Phe-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 IDDMGSKZQDEDGA-SRVKXCTJSA-N 0.000 description 1
- PCJOFZYFFMBZKC-PCBIJLKTSA-N Asp-Phe-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PCJOFZYFFMBZKC-PCBIJLKTSA-N 0.000 description 1
- UCHSVZYJKJLPHF-BZSNNMDCSA-N Asp-Phe-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O UCHSVZYJKJLPHF-BZSNNMDCSA-N 0.000 description 1
- RPUYTJJZXQBWDT-SRVKXCTJSA-N Asp-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N RPUYTJJZXQBWDT-SRVKXCTJSA-N 0.000 description 1
- KOWYNSKRPUWSFG-IHPCNDPISA-N Asp-Phe-Trp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)NC(=O)[C@H](CC(=O)O)N KOWYNSKRPUWSFG-IHPCNDPISA-N 0.000 description 1
- KPSHWSWFPUDEGF-FXQIFTODSA-N Asp-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(O)=O KPSHWSWFPUDEGF-FXQIFTODSA-N 0.000 description 1
- YFGUZQQCSDZRBN-DCAQKATOSA-N Asp-Pro-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O YFGUZQQCSDZRBN-DCAQKATOSA-N 0.000 description 1
- FAUPLTGRUBTXNU-FXQIFTODSA-N Asp-Pro-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O FAUPLTGRUBTXNU-FXQIFTODSA-N 0.000 description 1
- RVMXMLSYBTXCAV-VEVYYDQMSA-N Asp-Pro-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMXMLSYBTXCAV-VEVYYDQMSA-N 0.000 description 1
- GGRSYTUJHAZTFN-IHRRRGAJSA-N Asp-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O GGRSYTUJHAZTFN-IHRRRGAJSA-N 0.000 description 1
- NBKLEMWHDLAUEM-CIUDSAMLSA-N Asp-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N NBKLEMWHDLAUEM-CIUDSAMLSA-N 0.000 description 1
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 1
- VNXQRBXEQXLERQ-CIUDSAMLSA-N Asp-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N VNXQRBXEQXLERQ-CIUDSAMLSA-N 0.000 description 1
- ZQFRDAZBTSFGGW-SRVKXCTJSA-N Asp-Ser-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZQFRDAZBTSFGGW-SRVKXCTJSA-N 0.000 description 1
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 1
- OZBXOELNJBSJOA-UBHSHLNASA-N Asp-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N OZBXOELNJBSJOA-UBHSHLNASA-N 0.000 description 1
- GWWSUMLEWKQHLR-NUMRIWBASA-N Asp-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O GWWSUMLEWKQHLR-NUMRIWBASA-N 0.000 description 1
- JJQGZGOEDSSHTE-FOHZUACHSA-N Asp-Thr-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JJQGZGOEDSSHTE-FOHZUACHSA-N 0.000 description 1
- KBJVTFWQWXCYCQ-IUKAMOBKSA-N Asp-Thr-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KBJVTFWQWXCYCQ-IUKAMOBKSA-N 0.000 description 1
- NAAAPCLFJPURAM-HJGDQZAQSA-N Asp-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O NAAAPCLFJPURAM-HJGDQZAQSA-N 0.000 description 1
- PDIYGFYAMZZFCW-JIOCBJNQSA-N Asp-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N)O PDIYGFYAMZZFCW-JIOCBJNQSA-N 0.000 description 1
- GCACQYDBDHRVGE-LKXGYXEUSA-N Asp-Thr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC(O)=O GCACQYDBDHRVGE-LKXGYXEUSA-N 0.000 description 1
- KCOPOPKJRHVGPE-AQZXSJQPSA-N Asp-Thr-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O KCOPOPKJRHVGPE-AQZXSJQPSA-N 0.000 description 1
- JDDYEZGPYBBPBN-JRQIVUDYSA-N Asp-Thr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JDDYEZGPYBBPBN-JRQIVUDYSA-N 0.000 description 1
- ITGFVUYOLWBPQW-KKHAAJSZSA-N Asp-Thr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O ITGFVUYOLWBPQW-KKHAAJSZSA-N 0.000 description 1
- XOASPVGNFAMYBD-WFBYXXMGSA-N Asp-Trp-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O XOASPVGNFAMYBD-WFBYXXMGSA-N 0.000 description 1
- DKQCWCQRAMAFLN-UBHSHLNASA-N Asp-Trp-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(O)=O)C(O)=O DKQCWCQRAMAFLN-UBHSHLNASA-N 0.000 description 1
- LLRJPYJQNBMOOO-QEJZJMRPSA-N Asp-Trp-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N LLRJPYJQNBMOOO-QEJZJMRPSA-N 0.000 description 1
- FIRWLDUOFOULCA-XIRDDKMYSA-N Asp-Trp-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N FIRWLDUOFOULCA-XIRDDKMYSA-N 0.000 description 1
- BOXNGMVEVOGXOJ-UBHSHLNASA-N Asp-Trp-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N BOXNGMVEVOGXOJ-UBHSHLNASA-N 0.000 description 1
- GHAHOJDCBRXAKC-IHPCNDPISA-N Asp-Trp-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N GHAHOJDCBRXAKC-IHPCNDPISA-N 0.000 description 1
- PLNJUJGNLDSFOP-UWJYBYFXSA-N Asp-Tyr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PLNJUJGNLDSFOP-UWJYBYFXSA-N 0.000 description 1
- USENATHVGFXRNO-SRVKXCTJSA-N Asp-Tyr-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 USENATHVGFXRNO-SRVKXCTJSA-N 0.000 description 1
- NWAHPBGBDIFUFD-KKUMJFAQSA-N Asp-Tyr-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O NWAHPBGBDIFUFD-KKUMJFAQSA-N 0.000 description 1
- VHUKCUHLFMRHOD-MELADBBJSA-N Asp-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O VHUKCUHLFMRHOD-MELADBBJSA-N 0.000 description 1
- CZIVKMOEXPILDK-SRVKXCTJSA-N Asp-Tyr-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O CZIVKMOEXPILDK-SRVKXCTJSA-N 0.000 description 1
- XWKPSMRPIKKDDU-RCOVLWMOSA-N Asp-Val-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O XWKPSMRPIKKDDU-RCOVLWMOSA-N 0.000 description 1
- UXRVDHVARNBOIO-QSFUFRPTSA-N Asp-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(=O)O)N UXRVDHVARNBOIO-QSFUFRPTSA-N 0.000 description 1
- SFJUYBCDQBAYAJ-YDHLFZDLSA-N Asp-Val-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SFJUYBCDQBAYAJ-YDHLFZDLSA-N 0.000 description 1
- QPDUWAUSSWGJSB-NGZCFLSTSA-N Asp-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N QPDUWAUSSWGJSB-NGZCFLSTSA-N 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 241000606123 Bacteroides thetaiotaomicron Species 0.000 description 1
- 102100021277 Beta-secretase 2 Human genes 0.000 description 1
- 101710150190 Beta-secretase 2 Proteins 0.000 description 1
- 241000186016 Bifidobacterium bifidum Species 0.000 description 1
- 102000003846 Carbonic anhydrases Human genes 0.000 description 1
- 108090000209 Carbonic anhydrases Proteins 0.000 description 1
- 241000193403 Clostridium Species 0.000 description 1
- 102000008186 Collagen Human genes 0.000 description 1
- 108010035532 Collagen Proteins 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 238000011537 Coomassie blue staining Methods 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- TVYMKYUSZSVOAG-ZLUOBGJFSA-N Cys-Ala-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O TVYMKYUSZSVOAG-ZLUOBGJFSA-N 0.000 description 1
- GRNOCLDFUNCIDW-ACZMJKKPSA-N Cys-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N GRNOCLDFUNCIDW-ACZMJKKPSA-N 0.000 description 1
- NOCCABSVTRONIN-CIUDSAMLSA-N Cys-Ala-Leu Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CS)N NOCCABSVTRONIN-CIUDSAMLSA-N 0.000 description 1
- PRXCTTWKGJAPMT-ZLUOBGJFSA-N Cys-Ala-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O PRXCTTWKGJAPMT-ZLUOBGJFSA-N 0.000 description 1
- BYALSSDCQYHKMY-XGEHTFHBSA-N Cys-Arg-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CS)N)O BYALSSDCQYHKMY-XGEHTFHBSA-N 0.000 description 1
- KIHRUISMQZVCNO-ZLUOBGJFSA-N Cys-Asp-Asp Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KIHRUISMQZVCNO-ZLUOBGJFSA-N 0.000 description 1
- SMYXEYRYCLIPIL-ZLUOBGJFSA-N Cys-Cys-Cys Chemical compound SC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(O)=O SMYXEYRYCLIPIL-ZLUOBGJFSA-N 0.000 description 1
- DZLQXIFVQFTFJY-BYPYZUCNSA-N Cys-Gly-Gly Chemical compound SC[C@H](N)C(=O)NCC(=O)NCC(O)=O DZLQXIFVQFTFJY-BYPYZUCNSA-N 0.000 description 1
- NLDWTJBJFVWBDQ-KKUMJFAQSA-N Cys-Lys-Phe Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CS)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 NLDWTJBJFVWBDQ-KKUMJFAQSA-N 0.000 description 1
- UIKLEGZPIOXFHJ-DLOVCJGASA-N Cys-Phe-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O UIKLEGZPIOXFHJ-DLOVCJGASA-N 0.000 description 1
- GGRDJANMZPGMNS-CIUDSAMLSA-N Cys-Ser-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O GGRDJANMZPGMNS-CIUDSAMLSA-N 0.000 description 1
- IXPSSIBVVKSOIE-SRVKXCTJSA-N Cys-Ser-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N)O IXPSSIBVVKSOIE-SRVKXCTJSA-N 0.000 description 1
- 241000194032 Enterococcus faecalis Species 0.000 description 1
- 102000010911 Enzyme Precursors Human genes 0.000 description 1
- 108010062466 Enzyme Precursors Proteins 0.000 description 1
- 108010010803 Gelatin Proteins 0.000 description 1
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 1
- WUAYFMZULZDSLB-ACZMJKKPSA-N Gln-Ala-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O WUAYFMZULZDSLB-ACZMJKKPSA-N 0.000 description 1
- LKUWAWGNJYJODH-KBIXCLLPSA-N Gln-Ala-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LKUWAWGNJYJODH-KBIXCLLPSA-N 0.000 description 1
- MLZRSFQRBDNJON-GUBZILKMSA-N Gln-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MLZRSFQRBDNJON-GUBZILKMSA-N 0.000 description 1
- OVQXQLWWJSNYFV-XEGUGMAKSA-N Gln-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCC(N)=O)C)C(O)=O)=CNC2=C1 OVQXQLWWJSNYFV-XEGUGMAKSA-N 0.000 description 1
- JSYULGSPLTZDHM-NRPADANISA-N Gln-Ala-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O JSYULGSPLTZDHM-NRPADANISA-N 0.000 description 1
- MWLYSLMKFXWZPW-ZPFDUUQYSA-N Gln-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCC(N)=O MWLYSLMKFXWZPW-ZPFDUUQYSA-N 0.000 description 1
- ZFADFBPRMSBPOT-KKUMJFAQSA-N Gln-Arg-Phe Chemical compound N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O ZFADFBPRMSBPOT-KKUMJFAQSA-N 0.000 description 1
- PHZYLYASFWHLHJ-FXQIFTODSA-N Gln-Asn-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PHZYLYASFWHLHJ-FXQIFTODSA-N 0.000 description 1
- ZPDVKYLJTOFQJV-WDSKDSINSA-N Gln-Asn-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ZPDVKYLJTOFQJV-WDSKDSINSA-N 0.000 description 1
- CKNUKHBRCSMKMO-XHNCKOQMSA-N Gln-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O CKNUKHBRCSMKMO-XHNCKOQMSA-N 0.000 description 1
- CYTSBCIIEHUPDU-ACZMJKKPSA-N Gln-Asp-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O CYTSBCIIEHUPDU-ACZMJKKPSA-N 0.000 description 1
- WQWMZOIPXWSZNE-WDSKDSINSA-N Gln-Asp-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O WQWMZOIPXWSZNE-WDSKDSINSA-N 0.000 description 1
- DHNWZLGBTPUTQQ-QEJZJMRPSA-N Gln-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N DHNWZLGBTPUTQQ-QEJZJMRPSA-N 0.000 description 1
- ALUBSZXSNSPDQV-WDSKDSINSA-N Gln-Cys-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O ALUBSZXSNSPDQV-WDSKDSINSA-N 0.000 description 1
- VVWWRZZMPSPVQU-KBIXCLLPSA-N Gln-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)N)N VVWWRZZMPSPVQU-KBIXCLLPSA-N 0.000 description 1
- LPYPANUXJGFMGV-FXQIFTODSA-N Gln-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N LPYPANUXJGFMGV-FXQIFTODSA-N 0.000 description 1
- XFKUFUJECJUQTQ-CIUDSAMLSA-N Gln-Gln-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XFKUFUJECJUQTQ-CIUDSAMLSA-N 0.000 description 1
- NVEASDQHBRZPSU-BQBZGAKWSA-N Gln-Gln-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O NVEASDQHBRZPSU-BQBZGAKWSA-N 0.000 description 1
- AJDMYLOISOCHHC-YVNDNENWSA-N Gln-Gln-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AJDMYLOISOCHHC-YVNDNENWSA-N 0.000 description 1
- MADFVRSKEIEZHZ-DCAQKATOSA-N Gln-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N MADFVRSKEIEZHZ-DCAQKATOSA-N 0.000 description 1
- RBWKVOSARCFSQQ-FXQIFTODSA-N Gln-Gln-Ser Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O RBWKVOSARCFSQQ-FXQIFTODSA-N 0.000 description 1
- KCJJFESQRXGTGC-BQBZGAKWSA-N Gln-Glu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O KCJJFESQRXGTGC-BQBZGAKWSA-N 0.000 description 1
- LLRJEFPKIIBGJP-DCAQKATOSA-N Gln-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N LLRJEFPKIIBGJP-DCAQKATOSA-N 0.000 description 1
- KDXKFBSNIJYNNR-YVNDNENWSA-N Gln-Glu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDXKFBSNIJYNNR-YVNDNENWSA-N 0.000 description 1
- VSXBYIJUAXPAAL-WDSKDSINSA-N Gln-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O VSXBYIJUAXPAAL-WDSKDSINSA-N 0.000 description 1
- IKFZXRLDMYWNBU-YUMQZZPRSA-N Gln-Gly-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N IKFZXRLDMYWNBU-YUMQZZPRSA-N 0.000 description 1
- GNMQDOGFWYWPNM-LAEOZQHASA-N Gln-Gly-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)CNC(=O)[C@@H](N)CCC(N)=O)C(O)=O GNMQDOGFWYWPNM-LAEOZQHASA-N 0.000 description 1
- FGYPOQPQTUNESW-IUCAKERBSA-N Gln-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N FGYPOQPQTUNESW-IUCAKERBSA-N 0.000 description 1
- VGTDBGYFVWOQTI-RYUDHWBXSA-N Gln-Gly-Phe Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VGTDBGYFVWOQTI-RYUDHWBXSA-N 0.000 description 1
- SMLDOQHTOAAFJQ-WDSKDSINSA-N Gln-Gly-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SMLDOQHTOAAFJQ-WDSKDSINSA-N 0.000 description 1
- ORYMMTRPKVTGSJ-XVKPBYJWSA-N Gln-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O ORYMMTRPKVTGSJ-XVKPBYJWSA-N 0.000 description 1
- NROSLUJMIQGFKS-IUCAKERBSA-N Gln-His-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N NROSLUJMIQGFKS-IUCAKERBSA-N 0.000 description 1
- KQOPMGBHNQBCEL-HVTMNAMFSA-N Gln-His-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KQOPMGBHNQBCEL-HVTMNAMFSA-N 0.000 description 1
- NNXIQPMZGZUFJJ-AVGNSLFASA-N Gln-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N NNXIQPMZGZUFJJ-AVGNSLFASA-N 0.000 description 1
- XQEAVUJIRZRLQQ-SZMVWBNQSA-N Gln-His-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC3=CN=CN3)NC(=O)[C@H](CCC(=O)N)N XQEAVUJIRZRLQQ-SZMVWBNQSA-N 0.000 description 1
- HXOLDXKNWKLDMM-YVNDNENWSA-N Gln-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HXOLDXKNWKLDMM-YVNDNENWSA-N 0.000 description 1
- YRWWJCDWLVXTHN-LAEOZQHASA-N Gln-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N YRWWJCDWLVXTHN-LAEOZQHASA-N 0.000 description 1
- MTCXQQINVAFZKW-MNXVOIDGSA-N Gln-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MTCXQQINVAFZKW-MNXVOIDGSA-N 0.000 description 1
- MWERYIXRDZDXOA-QEWYBTABSA-N Gln-Ile-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MWERYIXRDZDXOA-QEWYBTABSA-N 0.000 description 1
- ZNTDJIMJKNNSLR-RWRJDSDZSA-N Gln-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZNTDJIMJKNNSLR-RWRJDSDZSA-N 0.000 description 1
- FFVXLVGUJBCKRX-UKJIMTQDSA-N Gln-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCC(=O)N)N FFVXLVGUJBCKRX-UKJIMTQDSA-N 0.000 description 1
- HYPVLWGNBIYTNA-GUBZILKMSA-N Gln-Leu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HYPVLWGNBIYTNA-GUBZILKMSA-N 0.000 description 1
- QBLMTCRYYTVUQY-GUBZILKMSA-N Gln-Leu-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QBLMTCRYYTVUQY-GUBZILKMSA-N 0.000 description 1
- VUVKKXPCKILIBD-AVGNSLFASA-N Gln-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N VUVKKXPCKILIBD-AVGNSLFASA-N 0.000 description 1
- SHAUZYVSXAMYAZ-JYJNAYRXSA-N Gln-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SHAUZYVSXAMYAZ-JYJNAYRXSA-N 0.000 description 1
- YPMDZWPZFOZYFG-GUBZILKMSA-N Gln-Leu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YPMDZWPZFOZYFG-GUBZILKMSA-N 0.000 description 1
- QDXMSSWCEVYOLZ-SZMVWBNQSA-N Gln-Leu-Trp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCC(=O)N)N QDXMSSWCEVYOLZ-SZMVWBNQSA-N 0.000 description 1
- HSHCEAUPUPJPTE-JYJNAYRXSA-N Gln-Leu-Tyr Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HSHCEAUPUPJPTE-JYJNAYRXSA-N 0.000 description 1
- IOFDDSNZJDIGPB-GVXVVHGQSA-N Gln-Leu-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IOFDDSNZJDIGPB-GVXVVHGQSA-N 0.000 description 1
- GURIQZQSTBBHRV-SRVKXCTJSA-N Gln-Lys-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GURIQZQSTBBHRV-SRVKXCTJSA-N 0.000 description 1
- HPCOBEHVEHWREJ-DCAQKATOSA-N Gln-Lys-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HPCOBEHVEHWREJ-DCAQKATOSA-N 0.000 description 1
- LURQDGKYBFWWJA-MNXVOIDGSA-N Gln-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N LURQDGKYBFWWJA-MNXVOIDGSA-N 0.000 description 1
- JRHPEMVLTRADLJ-AVGNSLFASA-N Gln-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JRHPEMVLTRADLJ-AVGNSLFASA-N 0.000 description 1
- JUUNNOLZGVYCJT-JYJNAYRXSA-N Gln-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JUUNNOLZGVYCJT-JYJNAYRXSA-N 0.000 description 1
- OZEQPCDLCDRCGY-SOUVJXGZSA-N Gln-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCC(=O)N)N)C(=O)O OZEQPCDLCDRCGY-SOUVJXGZSA-N 0.000 description 1
- ZVQZXPADLZIQFF-FHWLQOOXSA-N Gln-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@H](CCC(N)=O)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 ZVQZXPADLZIQFF-FHWLQOOXSA-N 0.000 description 1
- DOQUICBEISTQHE-CIUDSAMLSA-N Gln-Pro-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O DOQUICBEISTQHE-CIUDSAMLSA-N 0.000 description 1
- OREPWMPAUWIIAM-ZPFDUUQYSA-N Gln-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N OREPWMPAUWIIAM-ZPFDUUQYSA-N 0.000 description 1
- MQJDLNRXBOELJW-KKUMJFAQSA-N Gln-Pro-Phe Chemical compound N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O MQJDLNRXBOELJW-KKUMJFAQSA-N 0.000 description 1
- UWMDGPFFTKDUIY-HJGDQZAQSA-N Gln-Pro-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O UWMDGPFFTKDUIY-HJGDQZAQSA-N 0.000 description 1
- DCWNCMRZIZSZBL-KKUMJFAQSA-N Gln-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)N)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O DCWNCMRZIZSZBL-KKUMJFAQSA-N 0.000 description 1
- RWQCWSGOOOEGPB-FXQIFTODSA-N Gln-Ser-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O RWQCWSGOOOEGPB-FXQIFTODSA-N 0.000 description 1
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 1
- KPNWAJMEMRCLAL-GUBZILKMSA-N Gln-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N KPNWAJMEMRCLAL-GUBZILKMSA-N 0.000 description 1
- JILRMFFFCHUUTJ-ACZMJKKPSA-N Gln-Ser-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O JILRMFFFCHUUTJ-ACZMJKKPSA-N 0.000 description 1
- OTQSTOXRUBVWAP-NRPADANISA-N Gln-Ser-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OTQSTOXRUBVWAP-NRPADANISA-N 0.000 description 1
- DYVMTEWCGAVKSE-HJGDQZAQSA-N Gln-Thr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O DYVMTEWCGAVKSE-HJGDQZAQSA-N 0.000 description 1
- ININBLZFFVOQIO-JHEQGTHGSA-N Gln-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O ININBLZFFVOQIO-JHEQGTHGSA-N 0.000 description 1
- UEILCTONAMOGBR-RWRJDSDZSA-N Gln-Thr-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UEILCTONAMOGBR-RWRJDSDZSA-N 0.000 description 1
- NHMRJKKAVMENKJ-WDCWCFNPSA-N Gln-Thr-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NHMRJKKAVMENKJ-WDCWCFNPSA-N 0.000 description 1
- CTJRFALAOYAJBX-NWLDYVSISA-N Gln-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCC(=O)N)N)O CTJRFALAOYAJBX-NWLDYVSISA-N 0.000 description 1
- WTJIWXMJESRHMM-XDTLVQLUSA-N Gln-Tyr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O WTJIWXMJESRHMM-XDTLVQLUSA-N 0.000 description 1
- OACQOWPRWGNKTP-AVGNSLFASA-N Gln-Tyr-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O OACQOWPRWGNKTP-AVGNSLFASA-N 0.000 description 1
- SGVGIVDZLSHSEN-RYUDHWBXSA-N Gln-Tyr-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O SGVGIVDZLSHSEN-RYUDHWBXSA-N 0.000 description 1
- AKDOUBMVLRCHBD-SIUGBPQLSA-N Gln-Tyr-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AKDOUBMVLRCHBD-SIUGBPQLSA-N 0.000 description 1
- ICRKQMRFXYDYMK-LAEOZQHASA-N Gln-Val-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ICRKQMRFXYDYMK-LAEOZQHASA-N 0.000 description 1
- VDMABHYXBULDGN-LAEOZQHASA-N Gln-Val-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O VDMABHYXBULDGN-LAEOZQHASA-N 0.000 description 1
- FITIQFSXXBKFFM-NRPADANISA-N Gln-Val-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FITIQFSXXBKFFM-NRPADANISA-N 0.000 description 1
- HNAUFGBKJLTWQE-IFFSRLJSSA-N Gln-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)N)N)O HNAUFGBKJLTWQE-IFFSRLJSSA-N 0.000 description 1
- WZZSKAJIHTUUSG-ACZMJKKPSA-N Glu-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O WZZSKAJIHTUUSG-ACZMJKKPSA-N 0.000 description 1
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 1
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 1
- FYBSCGZLICNOBA-XQXXSGGOSA-N Glu-Ala-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FYBSCGZLICNOBA-XQXXSGGOSA-N 0.000 description 1
- KBKGRMNVKPSQIF-XDTLVQLUSA-N Glu-Ala-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KBKGRMNVKPSQIF-XDTLVQLUSA-N 0.000 description 1
- RCCDHXSRMWCOOY-GUBZILKMSA-N Glu-Arg-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O RCCDHXSRMWCOOY-GUBZILKMSA-N 0.000 description 1
- OJGLIOXAKGFFDW-SRVKXCTJSA-N Glu-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N OJGLIOXAKGFFDW-SRVKXCTJSA-N 0.000 description 1
- KEBACWCLVOXFNC-DCAQKATOSA-N Glu-Arg-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O KEBACWCLVOXFNC-DCAQKATOSA-N 0.000 description 1
- GLWXKFRTOHKGIT-ACZMJKKPSA-N Glu-Asn-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GLWXKFRTOHKGIT-ACZMJKKPSA-N 0.000 description 1
- MLCPTRRNICEKIS-FXQIFTODSA-N Glu-Asn-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLCPTRRNICEKIS-FXQIFTODSA-N 0.000 description 1
- AFODTOLGSZQDSL-PEFMBERDSA-N Glu-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N AFODTOLGSZQDSL-PEFMBERDSA-N 0.000 description 1
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 1
- IESFZVCAVACGPH-PEFMBERDSA-N Glu-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 1
- CKOFNWCLWRYUHK-XHNCKOQMSA-N Glu-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CKOFNWCLWRYUHK-XHNCKOQMSA-N 0.000 description 1
- PBFGQTGPSKWHJA-QEJZJMRPSA-N Glu-Asp-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O PBFGQTGPSKWHJA-QEJZJMRPSA-N 0.000 description 1
- SAEBUDRWKUXLOM-ACZMJKKPSA-N Glu-Cys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCC(O)=O SAEBUDRWKUXLOM-ACZMJKKPSA-N 0.000 description 1
- OXEMJGCAJFFREE-FXQIFTODSA-N Glu-Gln-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O OXEMJGCAJFFREE-FXQIFTODSA-N 0.000 description 1
- HUFCEIHAFNVSNR-IHRRRGAJSA-N Glu-Gln-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUFCEIHAFNVSNR-IHRRRGAJSA-N 0.000 description 1
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 1
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 1
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 1
- OGNJZUXUTPQVBR-BQBZGAKWSA-N Glu-Gly-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OGNJZUXUTPQVBR-BQBZGAKWSA-N 0.000 description 1
- OAGVHWYIBZMWLA-YFKPBYRVSA-N Glu-Gly-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)NCC(O)=O OAGVHWYIBZMWLA-YFKPBYRVSA-N 0.000 description 1
- CAVMESABQIKFKT-IUCAKERBSA-N Glu-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N CAVMESABQIKFKT-IUCAKERBSA-N 0.000 description 1
- OPAINBJQDQTGJY-JGVFFNPUSA-N Glu-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)O)N)C(=O)O OPAINBJQDQTGJY-JGVFFNPUSA-N 0.000 description 1
- GGJOGFJIPPGNRK-JSGCOSHPSA-N Glu-Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)N)C(O)=O)=CNC2=C1 GGJOGFJIPPGNRK-JSGCOSHPSA-N 0.000 description 1
- BRKUZSLQMPNVFN-SRVKXCTJSA-N Glu-His-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BRKUZSLQMPNVFN-SRVKXCTJSA-N 0.000 description 1
- XOFYVODYSNKPDK-AVGNSLFASA-N Glu-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XOFYVODYSNKPDK-AVGNSLFASA-N 0.000 description 1
- NJPQBTJSYCKCNS-HVTMNAMFSA-N Glu-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N NJPQBTJSYCKCNS-HVTMNAMFSA-N 0.000 description 1
- WDTAKCUOIKHCTB-NKIYYHGXSA-N Glu-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N)O WDTAKCUOIKHCTB-NKIYYHGXSA-N 0.000 description 1
- QIQABBIDHGQXGA-ZPFDUUQYSA-N Glu-Ile-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QIQABBIDHGQXGA-ZPFDUUQYSA-N 0.000 description 1
- ZCOJVESMNGBGLF-GRLWGSQLSA-N Glu-Ile-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZCOJVESMNGBGLF-GRLWGSQLSA-N 0.000 description 1
- GXMXPCXXKVWOSM-KQXIARHKSA-N Glu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N GXMXPCXXKVWOSM-KQXIARHKSA-N 0.000 description 1
- VMKCPNBBPGGQBJ-GUBZILKMSA-N Glu-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N VMKCPNBBPGGQBJ-GUBZILKMSA-N 0.000 description 1
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 1
- DWBBKNPKDHXIAC-SRVKXCTJSA-N Glu-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCC(O)=O DWBBKNPKDHXIAC-SRVKXCTJSA-N 0.000 description 1
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 1
- SWRVAQHFBRZVNX-GUBZILKMSA-N Glu-Lys-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SWRVAQHFBRZVNX-GUBZILKMSA-N 0.000 description 1
- OHWJUIXZHVIXJJ-GUBZILKMSA-N Glu-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N OHWJUIXZHVIXJJ-GUBZILKMSA-N 0.000 description 1
- YGLCLCMAYUYZSG-AVGNSLFASA-N Glu-Lys-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 YGLCLCMAYUYZSG-AVGNSLFASA-N 0.000 description 1
- QDMVXRNLOPTPIE-WDCWCFNPSA-N Glu-Lys-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QDMVXRNLOPTPIE-WDCWCFNPSA-N 0.000 description 1
- AQNYKMCFCCZEEL-JYJNAYRXSA-N Glu-Lys-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AQNYKMCFCCZEEL-JYJNAYRXSA-N 0.000 description 1
- SUIAHERNFYRBDZ-GVXVVHGQSA-N Glu-Lys-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O SUIAHERNFYRBDZ-GVXVVHGQSA-N 0.000 description 1
- HOIPREWORBVRLD-XIRDDKMYSA-N Glu-Met-Trp Chemical compound CSCC[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O HOIPREWORBVRLD-XIRDDKMYSA-N 0.000 description 1
- PMSMKNYRZCKVMC-DRZSPHRISA-N Glu-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCC(=O)O)N PMSMKNYRZCKVMC-DRZSPHRISA-N 0.000 description 1
- FQFWFZWOHOEVMZ-IHRRRGAJSA-N Glu-Phe-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O FQFWFZWOHOEVMZ-IHRRRGAJSA-N 0.000 description 1
- JZJGEKDPWVJOLD-QEWYBTABSA-N Glu-Phe-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JZJGEKDPWVJOLD-QEWYBTABSA-N 0.000 description 1
- ZIYGTCDTJJCDDP-JYJNAYRXSA-N Glu-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZIYGTCDTJJCDDP-JYJNAYRXSA-N 0.000 description 1
- CBWKURKPYSLMJV-SOUVJXGZSA-N Glu-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CBWKURKPYSLMJV-SOUVJXGZSA-N 0.000 description 1
- UDEPRBFQTWGLCW-CIUDSAMLSA-N Glu-Pro-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O UDEPRBFQTWGLCW-CIUDSAMLSA-N 0.000 description 1
- DXVOKNVIKORTHQ-GUBZILKMSA-N Glu-Pro-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O DXVOKNVIKORTHQ-GUBZILKMSA-N 0.000 description 1
- CQAHWYDHKUWYIX-YUMQZZPRSA-N Glu-Pro-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O CQAHWYDHKUWYIX-YUMQZZPRSA-N 0.000 description 1
- BFEZQZKEPRKKHV-SRVKXCTJSA-N Glu-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O BFEZQZKEPRKKHV-SRVKXCTJSA-N 0.000 description 1
- ARIORLIIMJACKZ-KKUMJFAQSA-N Glu-Pro-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ARIORLIIMJACKZ-KKUMJFAQSA-N 0.000 description 1
- ZAPFAWQHBOHWLL-GUBZILKMSA-N Glu-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N ZAPFAWQHBOHWLL-GUBZILKMSA-N 0.000 description 1
- QOXDAWODGSIDDI-GUBZILKMSA-N Glu-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N QOXDAWODGSIDDI-GUBZILKMSA-N 0.000 description 1
- HMJULNMJWOZNFI-XHNCKOQMSA-N Glu-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N)C(=O)O HMJULNMJWOZNFI-XHNCKOQMSA-N 0.000 description 1
- BDISFWMLMNBTGP-NUMRIWBASA-N Glu-Thr-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O BDISFWMLMNBTGP-NUMRIWBASA-N 0.000 description 1
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 1
- MXJYXYDREQWUMS-XKBZYTNZSA-N Glu-Thr-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O MXJYXYDREQWUMS-XKBZYTNZSA-N 0.000 description 1
- ZQNCUVODKOBSSO-XEGUGMAKSA-N Glu-Trp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O ZQNCUVODKOBSSO-XEGUGMAKSA-N 0.000 description 1
- ZNOHKCPYDAYYDA-BPUTZDHNSA-N Glu-Trp-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZNOHKCPYDAYYDA-BPUTZDHNSA-N 0.000 description 1
- ZTNHPMZHAILHRB-JSGCOSHPSA-N Glu-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)NCC(O)=O)=CNC2=C1 ZTNHPMZHAILHRB-JSGCOSHPSA-N 0.000 description 1
- HGJREIGJLUQBTJ-SZMVWBNQSA-N Glu-Trp-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O HGJREIGJLUQBTJ-SZMVWBNQSA-N 0.000 description 1
- HHSKZJZWQFPSKN-AVGNSLFASA-N Glu-Tyr-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O HHSKZJZWQFPSKN-AVGNSLFASA-N 0.000 description 1
- QEJKKJNDDDPSMU-KKUMJFAQSA-N Glu-Tyr-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCSC)C(O)=O QEJKKJNDDDPSMU-KKUMJFAQSA-N 0.000 description 1
- BKMOHWJHXQLFEX-IRIUXVKKSA-N Glu-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)O)N)O BKMOHWJHXQLFEX-IRIUXVKKSA-N 0.000 description 1
- HBMRTXJZQDVRFT-DZKIICNBSA-N Glu-Tyr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O HBMRTXJZQDVRFT-DZKIICNBSA-N 0.000 description 1
- YPHPEHMXOYTEQG-LAEOZQHASA-N Glu-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O YPHPEHMXOYTEQG-LAEOZQHASA-N 0.000 description 1
- HQTDNEZTGZUWSY-XVKPBYJWSA-N Glu-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)NCC(O)=O HQTDNEZTGZUWSY-XVKPBYJWSA-N 0.000 description 1
- NTNUEBVGKMVANB-NHCYSSNCSA-N Glu-Val-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O NTNUEBVGKMVANB-NHCYSSNCSA-N 0.000 description 1
- FVGOGEGGQLNZGH-DZKIICNBSA-N Glu-Val-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FVGOGEGGQLNZGH-DZKIICNBSA-N 0.000 description 1
- RMWAOBGCZZSJHE-UMNHJUIQSA-N Glu-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N RMWAOBGCZZSJHE-UMNHJUIQSA-N 0.000 description 1
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 1
- 102100036263 Glutamyl-tRNA(Gln) amidotransferase subunit C, mitochondrial Human genes 0.000 description 1
- BRFJMRSRMOMIMU-WHFBIAKZSA-N Gly-Ala-Asn Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O BRFJMRSRMOMIMU-WHFBIAKZSA-N 0.000 description 1
- GZUKEVBTYNNUQF-WDSKDSINSA-N Gly-Ala-Gln Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GZUKEVBTYNNUQF-WDSKDSINSA-N 0.000 description 1
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 1
- FKJQNJCQTKUBCD-XPUUQOCRSA-N Gly-Ala-His Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O FKJQNJCQTKUBCD-XPUUQOCRSA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- JBRBACJPBZNFMF-YUMQZZPRSA-N Gly-Ala-Lys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN JBRBACJPBZNFMF-YUMQZZPRSA-N 0.000 description 1
- QIZJOTQTCAGKPU-KWQFWETISA-N Gly-Ala-Tyr Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 QIZJOTQTCAGKPU-KWQFWETISA-N 0.000 description 1
- JXYMPBCYRKWJEE-BQBZGAKWSA-N Gly-Arg-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O JXYMPBCYRKWJEE-BQBZGAKWSA-N 0.000 description 1
- XUDLUKYPXQDCRX-BQBZGAKWSA-N Gly-Arg-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O XUDLUKYPXQDCRX-BQBZGAKWSA-N 0.000 description 1
- KFMBRBPXHVMDFN-UWVGGRQHSA-N Gly-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCNC(N)=N KFMBRBPXHVMDFN-UWVGGRQHSA-N 0.000 description 1
- DTPOVRRYXPJJAZ-FJXKBIBVSA-N Gly-Arg-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N DTPOVRRYXPJJAZ-FJXKBIBVSA-N 0.000 description 1
- XUORRGAFUQIMLC-STQMWFEESA-N Gly-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN)O XUORRGAFUQIMLC-STQMWFEESA-N 0.000 description 1
- DJTXYXZNNDDEOU-WHFBIAKZSA-N Gly-Asn-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN)C(=O)N DJTXYXZNNDDEOU-WHFBIAKZSA-N 0.000 description 1
- WJZLEENECIOOSA-WDSKDSINSA-N Gly-Asn-Gln Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)O WJZLEENECIOOSA-WDSKDSINSA-N 0.000 description 1
- BGVYNAQWHSTTSP-BYULHYEWSA-N Gly-Asn-Ile Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BGVYNAQWHSTTSP-BYULHYEWSA-N 0.000 description 1
- GNBMOZPQUXTCRW-STQMWFEESA-N Gly-Asn-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)CN)C(O)=O)=CNC2=C1 GNBMOZPQUXTCRW-STQMWFEESA-N 0.000 description 1
- KQDMENMTYNBWMR-WHFBIAKZSA-N Gly-Asp-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KQDMENMTYNBWMR-WHFBIAKZSA-N 0.000 description 1
- IWAXHBCACVWNHT-BQBZGAKWSA-N Gly-Asp-Arg Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IWAXHBCACVWNHT-BQBZGAKWSA-N 0.000 description 1
- XQHSBNVACKQWAV-WHFBIAKZSA-N Gly-Asp-Asn Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XQHSBNVACKQWAV-WHFBIAKZSA-N 0.000 description 1
- FUTAPPOITCCWTH-WHFBIAKZSA-N Gly-Asp-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FUTAPPOITCCWTH-WHFBIAKZSA-N 0.000 description 1
- XEJTYSCIXKYSHR-WDSKDSINSA-N Gly-Asp-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN XEJTYSCIXKYSHR-WDSKDSINSA-N 0.000 description 1
- QSTLUOIOYLYLLF-WDSKDSINSA-N Gly-Asp-Glu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QSTLUOIOYLYLLF-WDSKDSINSA-N 0.000 description 1
- FZQLXNIMCPJVJE-YUMQZZPRSA-N Gly-Asp-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FZQLXNIMCPJVJE-YUMQZZPRSA-N 0.000 description 1
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 1
- QCTLGOYODITHPQ-WHFBIAKZSA-N Gly-Cys-Ser Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O QCTLGOYODITHPQ-WHFBIAKZSA-N 0.000 description 1
- BULIVUZUDBHKKZ-WDSKDSINSA-N Gly-Gln-Asn Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O BULIVUZUDBHKKZ-WDSKDSINSA-N 0.000 description 1
- JMQFHZWESBGPFC-WDSKDSINSA-N Gly-Gln-Asp Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O JMQFHZWESBGPFC-WDSKDSINSA-N 0.000 description 1
- VOCMRCVMAPSSAL-IUCAKERBSA-N Gly-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN VOCMRCVMAPSSAL-IUCAKERBSA-N 0.000 description 1
- GNPVTZJUUBPZKW-WDSKDSINSA-N Gly-Gln-Ser Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GNPVTZJUUBPZKW-WDSKDSINSA-N 0.000 description 1
- MOJKRXIRAZPZLW-WDSKDSINSA-N Gly-Glu-Ala Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MOJKRXIRAZPZLW-WDSKDSINSA-N 0.000 description 1
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 1
- HDNXXTBKOJKWNN-WDSKDSINSA-N Gly-Glu-Asn Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O HDNXXTBKOJKWNN-WDSKDSINSA-N 0.000 description 1
- QSVCIFZPGLOZGH-WDSKDSINSA-N Gly-Glu-Ser Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QSVCIFZPGLOZGH-WDSKDSINSA-N 0.000 description 1
- HQRHFUYMGCHHJS-LURJTMIESA-N Gly-Gly-Arg Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-LURJTMIESA-N 0.000 description 1
- IDOGEHIWMJMAHT-BYPYZUCNSA-N Gly-Gly-Cys Chemical compound NCC(=O)NCC(=O)N[C@@H](CS)C(O)=O IDOGEHIWMJMAHT-BYPYZUCNSA-N 0.000 description 1
- QPTNELDXWKRIFX-YFKPBYRVSA-N Gly-Gly-Gln Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O QPTNELDXWKRIFX-YFKPBYRVSA-N 0.000 description 1
- GDOZQTNZPCUARW-YFKPBYRVSA-N Gly-Gly-Glu Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O GDOZQTNZPCUARW-YFKPBYRVSA-N 0.000 description 1
- INLIXXRWNUKVCF-JTQLQIEISA-N Gly-Gly-Tyr Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 INLIXXRWNUKVCF-JTQLQIEISA-N 0.000 description 1
- AYBKPDHHVADEDA-YUMQZZPRSA-N Gly-His-Asn Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O AYBKPDHHVADEDA-YUMQZZPRSA-N 0.000 description 1
- IVSWQHKONQIOHA-YUMQZZPRSA-N Gly-His-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN IVSWQHKONQIOHA-YUMQZZPRSA-N 0.000 description 1
- QSVMIMFAAZPCAQ-PMVVWTBXSA-N Gly-His-Thr Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QSVMIMFAAZPCAQ-PMVVWTBXSA-N 0.000 description 1
- ALOBJFDJTMQQPW-ONGXEEELSA-N Gly-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)CN ALOBJFDJTMQQPW-ONGXEEELSA-N 0.000 description 1
- DGKBSGNCMCLDSL-BYULHYEWSA-N Gly-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN DGKBSGNCMCLDSL-BYULHYEWSA-N 0.000 description 1
- UTYGDAHJBBDPBA-BYULHYEWSA-N Gly-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN UTYGDAHJBBDPBA-BYULHYEWSA-N 0.000 description 1
- HMHRTKOWRUPPNU-RCOVLWMOSA-N Gly-Ile-Gly Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O HMHRTKOWRUPPNU-RCOVLWMOSA-N 0.000 description 1
- DENRBIYENOKSEX-PEXQALLHSA-N Gly-Ile-His Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 DENRBIYENOKSEX-PEXQALLHSA-N 0.000 description 1
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 1
- ZOTGXWMKUFSKEU-QXEWZRGKSA-N Gly-Ile-Met Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(O)=O ZOTGXWMKUFSKEU-QXEWZRGKSA-N 0.000 description 1
- FCKPEGOCSVZPNC-WHOFXGATSA-N Gly-Ile-Phe Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FCKPEGOCSVZPNC-WHOFXGATSA-N 0.000 description 1
- BHPQOIPBLYJNAW-NGZCFLSTSA-N Gly-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN BHPQOIPBLYJNAW-NGZCFLSTSA-N 0.000 description 1
- LIXWIUAORXJNBH-QWRGUYRKSA-N Gly-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)CN LIXWIUAORXJNBH-QWRGUYRKSA-N 0.000 description 1
- LRQXRHGQEVWGPV-NHCYSSNCSA-N Gly-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN LRQXRHGQEVWGPV-NHCYSSNCSA-N 0.000 description 1
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 1
- LLZXNUUIBOALNY-QWRGUYRKSA-N Gly-Leu-Lys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN LLZXNUUIBOALNY-QWRGUYRKSA-N 0.000 description 1
- MIIVFRCYJABHTQ-ONGXEEELSA-N Gly-Leu-Val Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O MIIVFRCYJABHTQ-ONGXEEELSA-N 0.000 description 1
- BXICSAQLIHFDDL-YUMQZZPRSA-N Gly-Lys-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BXICSAQLIHFDDL-YUMQZZPRSA-N 0.000 description 1
- LOEANKRDMMVOGZ-YUMQZZPRSA-N Gly-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O LOEANKRDMMVOGZ-YUMQZZPRSA-N 0.000 description 1
- IUKIDFVOUHZRAK-QWRGUYRKSA-N Gly-Lys-His Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IUKIDFVOUHZRAK-QWRGUYRKSA-N 0.000 description 1
- PTIIBFKSLCYQBO-NHCYSSNCSA-N Gly-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)CN PTIIBFKSLCYQBO-NHCYSSNCSA-N 0.000 description 1
- WMGHDYWNHNLGBV-ONGXEEELSA-N Gly-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 WMGHDYWNHNLGBV-ONGXEEELSA-N 0.000 description 1
- FXLVSYVJDPCIHH-STQMWFEESA-N Gly-Phe-Arg Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FXLVSYVJDPCIHH-STQMWFEESA-N 0.000 description 1
- MTBIKIMYHUWBRX-QWRGUYRKSA-N Gly-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN MTBIKIMYHUWBRX-QWRGUYRKSA-N 0.000 description 1
- GAFKBWKVXNERFA-QWRGUYRKSA-N Gly-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 GAFKBWKVXNERFA-QWRGUYRKSA-N 0.000 description 1
- YLEIWGJJBFBFHC-KBPBESRZSA-N Gly-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 YLEIWGJJBFBFHC-KBPBESRZSA-N 0.000 description 1
- FEUPVVCGQLNXNP-IRXDYDNUSA-N Gly-Phe-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 FEUPVVCGQLNXNP-IRXDYDNUSA-N 0.000 description 1
- IEGFSKKANYKBDU-QWHCGFSZSA-N Gly-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)CN)C(=O)O IEGFSKKANYKBDU-QWHCGFSZSA-N 0.000 description 1
- WNZOCXUOGVYYBJ-CDMKHQONSA-N Gly-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)CN)O WNZOCXUOGVYYBJ-CDMKHQONSA-N 0.000 description 1
- NZOAFWHVAFJERA-OALUTQOASA-N Gly-Phe-Trp Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O NZOAFWHVAFJERA-OALUTQOASA-N 0.000 description 1
- GGLIDLCEPDHEJO-BQBZGAKWSA-N Gly-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)CN GGLIDLCEPDHEJO-BQBZGAKWSA-N 0.000 description 1
- WDXLKVQATNEAJQ-BQBZGAKWSA-N Gly-Pro-Asp Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WDXLKVQATNEAJQ-BQBZGAKWSA-N 0.000 description 1
- HJARVELKOSZUEW-YUMQZZPRSA-N Gly-Pro-Gln Chemical compound [H]NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O HJARVELKOSZUEW-YUMQZZPRSA-N 0.000 description 1
- JJGBXTYGTKWGAT-YUMQZZPRSA-N Gly-Pro-Glu Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O JJGBXTYGTKWGAT-YUMQZZPRSA-N 0.000 description 1
- HAOUOFNNJJLVNS-BQBZGAKWSA-N Gly-Pro-Ser Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O HAOUOFNNJJLVNS-BQBZGAKWSA-N 0.000 description 1
- JNGHLWWFPGIJER-STQMWFEESA-N Gly-Pro-Tyr Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JNGHLWWFPGIJER-STQMWFEESA-N 0.000 description 1
- CSMYMGFCEJWALV-WDSKDSINSA-N Gly-Ser-Gln Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O CSMYMGFCEJWALV-WDSKDSINSA-N 0.000 description 1
- VNNRLUNBJSWZPF-ZKWXMUAHSA-N Gly-Ser-Ile Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNNRLUNBJSWZPF-ZKWXMUAHSA-N 0.000 description 1
- JSLVAHYTAJJEQH-QWRGUYRKSA-N Gly-Ser-Phe Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JSLVAHYTAJJEQH-QWRGUYRKSA-N 0.000 description 1
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 1
- IMRNSEPSPFQNHF-STQMWFEESA-N Gly-Ser-Trp Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=CC=CC=C12)C(=O)O IMRNSEPSPFQNHF-STQMWFEESA-N 0.000 description 1
- FKYQEVBRZSFAMJ-QWRGUYRKSA-N Gly-Ser-Tyr Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FKYQEVBRZSFAMJ-QWRGUYRKSA-N 0.000 description 1
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 1
- FFJQHWKSGAWSTJ-BFHQHQDPSA-N Gly-Thr-Ala Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O FFJQHWKSGAWSTJ-BFHQHQDPSA-N 0.000 description 1
- YXTFLTJYLIAZQG-FJXKBIBVSA-N Gly-Thr-Arg Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YXTFLTJYLIAZQG-FJXKBIBVSA-N 0.000 description 1
- CQMFNTVQVLQRLT-JHEQGTHGSA-N Gly-Thr-Gln Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CQMFNTVQVLQRLT-JHEQGTHGSA-N 0.000 description 1
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 1
- HUFUVTYGPOUCBN-MBLNEYKQSA-N Gly-Thr-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HUFUVTYGPOUCBN-MBLNEYKQSA-N 0.000 description 1
- XHVONGZZVUUORG-WEDXCCLWSA-N Gly-Thr-Lys Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN XHVONGZZVUUORG-WEDXCCLWSA-N 0.000 description 1
- LLWQVJNHMYBLLK-CDMKHQONSA-N Gly-Thr-Phe Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LLWQVJNHMYBLLK-CDMKHQONSA-N 0.000 description 1
- MYXNLWDWWOTERK-BHNWBGBOSA-N Gly-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN)O MYXNLWDWWOTERK-BHNWBGBOSA-N 0.000 description 1
- WSWWTQYHFCBKBT-DVJZZOLTSA-N Gly-Thr-Trp Chemical compound C[C@@H](O)[C@H](NC(=O)CN)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O WSWWTQYHFCBKBT-DVJZZOLTSA-N 0.000 description 1
- FXTUGWXZTFMTIV-GJZGRUSLSA-N Gly-Trp-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)CN FXTUGWXZTFMTIV-GJZGRUSLSA-N 0.000 description 1
- PYFHPYDQHCEVIT-KBPBESRZSA-N Gly-Trp-Gln Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(O)=O PYFHPYDQHCEVIT-KBPBESRZSA-N 0.000 description 1
- PYFIQROSWQERAS-LBPRGKRZSA-N Gly-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)CN)C(=O)NCC(O)=O)=CNC2=C1 PYFIQROSWQERAS-LBPRGKRZSA-N 0.000 description 1
- UVTSZKIATYSKIR-RYUDHWBXSA-N Gly-Tyr-Glu Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O UVTSZKIATYSKIR-RYUDHWBXSA-N 0.000 description 1
- LYZYGGWCBLBDMC-QWHCGFSZSA-N Gly-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)CN)C(=O)O LYZYGGWCBLBDMC-QWHCGFSZSA-N 0.000 description 1
- DUAWRXXTOQOECJ-JSGCOSHPSA-N Gly-Tyr-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O DUAWRXXTOQOECJ-JSGCOSHPSA-N 0.000 description 1
- GJHWILMUOANXTG-WPRPVWTQSA-N Gly-Val-Arg Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GJHWILMUOANXTG-WPRPVWTQSA-N 0.000 description 1
- YDIDLLVFCYSXNY-RCOVLWMOSA-N Gly-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN YDIDLLVFCYSXNY-RCOVLWMOSA-N 0.000 description 1
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 1
- NGRPGJGKJMUGDM-XVKPBYJWSA-N Gly-Val-Gln Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NGRPGJGKJMUGDM-XVKPBYJWSA-N 0.000 description 1
- ZVXMEWXHFBYJPI-LSJOCFKGSA-N Gly-Val-Ile Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZVXMEWXHFBYJPI-LSJOCFKGSA-N 0.000 description 1
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 1
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 1
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 1
- 102000002268 Hexosaminidases Human genes 0.000 description 1
- 108010000540 Hexosaminidases Proteins 0.000 description 1
- VSLXGYMEHVAJBH-DLOVCJGASA-N His-Ala-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O VSLXGYMEHVAJBH-DLOVCJGASA-N 0.000 description 1
- VCDNHBNNPCDBKV-DLOVCJGASA-N His-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N VCDNHBNNPCDBKV-DLOVCJGASA-N 0.000 description 1
- FLUVGKKRRMLNPU-CQDKDKBSSA-N His-Ala-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FLUVGKKRRMLNPU-CQDKDKBSSA-N 0.000 description 1
- HTZKFIYQMHJWSQ-INTQDDNPSA-N His-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N HTZKFIYQMHJWSQ-INTQDDNPSA-N 0.000 description 1
- PDSUIXMZYNURGI-AVGNSLFASA-N His-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC1=CN=CN1 PDSUIXMZYNURGI-AVGNSLFASA-N 0.000 description 1
- JHVCZQFWRLHUQR-DCAQKATOSA-N His-Arg-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N JHVCZQFWRLHUQR-DCAQKATOSA-N 0.000 description 1
- AVQOSMRPITVTRB-CIUDSAMLSA-N His-Asn-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N AVQOSMRPITVTRB-CIUDSAMLSA-N 0.000 description 1
- WMKXFMUJRCEGRP-SRVKXCTJSA-N His-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N WMKXFMUJRCEGRP-SRVKXCTJSA-N 0.000 description 1
- JWTKVPMQCCRPQY-SRVKXCTJSA-N His-Asn-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JWTKVPMQCCRPQY-SRVKXCTJSA-N 0.000 description 1
- VIVSWEBJUHXCDS-DCAQKATOSA-N His-Asn-Met Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O VIVSWEBJUHXCDS-DCAQKATOSA-N 0.000 description 1
- WGVPDSNCHDEDBP-KKUMJFAQSA-N His-Asp-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WGVPDSNCHDEDBP-KKUMJFAQSA-N 0.000 description 1
- JFFAPRNXXLRINI-NHCYSSNCSA-N His-Asp-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O JFFAPRNXXLRINI-NHCYSSNCSA-N 0.000 description 1
- LBCAQRFTWMMWRR-CIUDSAMLSA-N His-Cys-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O LBCAQRFTWMMWRR-CIUDSAMLSA-N 0.000 description 1
- UPGJWSUYENXOPV-HGNGGELXSA-N His-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N UPGJWSUYENXOPV-HGNGGELXSA-N 0.000 description 1
- LIEIYPBMQJLASB-SRVKXCTJSA-N His-Gln-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CN=CN1 LIEIYPBMQJLASB-SRVKXCTJSA-N 0.000 description 1
- HVCRQRQPIIRNLY-IUCAKERBSA-N His-Gln-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)NCC(=O)O)N HVCRQRQPIIRNLY-IUCAKERBSA-N 0.000 description 1
- NWGXCPUKPVISSJ-AVGNSLFASA-N His-Gln-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N NWGXCPUKPVISSJ-AVGNSLFASA-N 0.000 description 1
- DVHGLDYMGWTYKW-GUBZILKMSA-N His-Gln-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DVHGLDYMGWTYKW-GUBZILKMSA-N 0.000 description 1
- HIAHVKLTHNOENC-HGNGGELXSA-N His-Glu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HIAHVKLTHNOENC-HGNGGELXSA-N 0.000 description 1
- YADRBUZBKHHDAO-XPUUQOCRSA-N His-Gly-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](C)C(O)=O YADRBUZBKHHDAO-XPUUQOCRSA-N 0.000 description 1
- PYNUBZSXKQKAHL-UWVGGRQHSA-N His-Gly-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O PYNUBZSXKQKAHL-UWVGGRQHSA-N 0.000 description 1
- FDQYIRHBVVUTJF-ZETCQYMHSA-N His-Gly-Gly Chemical compound [O-]C(=O)CNC(=O)CNC(=O)[C@@H]([NH3+])CC1=CN=CN1 FDQYIRHBVVUTJF-ZETCQYMHSA-N 0.000 description 1
- SYIPVNMWBZXKMU-HJPIBITLSA-N His-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CN=CN2)N SYIPVNMWBZXKMU-HJPIBITLSA-N 0.000 description 1
- FSOXZQBMPBQKGJ-QSFUFRPTSA-N His-Ile-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]([NH3+])CC1=CN=CN1 FSOXZQBMPBQKGJ-QSFUFRPTSA-N 0.000 description 1
- QMUHTRISZMFKAY-MXAVVETBSA-N His-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N QMUHTRISZMFKAY-MXAVVETBSA-N 0.000 description 1
- ORERHHPZDDEMSC-VGDYDELISA-N His-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N ORERHHPZDDEMSC-VGDYDELISA-N 0.000 description 1
- VYUXYMRNGALHEA-DLOVCJGASA-N His-Leu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O VYUXYMRNGALHEA-DLOVCJGASA-N 0.000 description 1
- JENKOCSDMSVWPY-SRVKXCTJSA-N His-Leu-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O JENKOCSDMSVWPY-SRVKXCTJSA-N 0.000 description 1
- BXOLYFJYQQRQDJ-MXAVVETBSA-N His-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CN=CN1)N BXOLYFJYQQRQDJ-MXAVVETBSA-N 0.000 description 1
- LVXFNTIIGOQBMD-SRVKXCTJSA-N His-Leu-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O LVXFNTIIGOQBMD-SRVKXCTJSA-N 0.000 description 1
- TWROVBNEHJSXDG-IHRRRGAJSA-N His-Leu-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O TWROVBNEHJSXDG-IHRRRGAJSA-N 0.000 description 1
- QEYUCKCWTMIERU-SRVKXCTJSA-N His-Lys-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N QEYUCKCWTMIERU-SRVKXCTJSA-N 0.000 description 1
- XKIYNCLILDLGRS-QWRGUYRKSA-N His-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 XKIYNCLILDLGRS-QWRGUYRKSA-N 0.000 description 1
- UXSATKFPUVZVDK-KKUMJFAQSA-N His-Lys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CN=CN1)N UXSATKFPUVZVDK-KKUMJFAQSA-N 0.000 description 1
- BKOVCRUIXDIWFV-IXOXFDKPSA-N His-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CN=CN1 BKOVCRUIXDIWFV-IXOXFDKPSA-N 0.000 description 1
- MIHTTYXBXIRRGV-AVGNSLFASA-N His-Met-Arg Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N MIHTTYXBXIRRGV-AVGNSLFASA-N 0.000 description 1
- YXXKBPJEIYFGOD-MGHWNKPDSA-N His-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC2=CN=CN2)N YXXKBPJEIYFGOD-MGHWNKPDSA-N 0.000 description 1
- JSQIXEHORHLQEE-MEYUZBJRSA-N His-Phe-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JSQIXEHORHLQEE-MEYUZBJRSA-N 0.000 description 1
- BZAQOPHNBFOOJS-DCAQKATOSA-N His-Pro-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O BZAQOPHNBFOOJS-DCAQKATOSA-N 0.000 description 1
- QCBYAHHNOHBXIH-UWVGGRQHSA-N His-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CN=CN1 QCBYAHHNOHBXIH-UWVGGRQHSA-N 0.000 description 1
- VIJMRAIWYWRXSR-CIUDSAMLSA-N His-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 VIJMRAIWYWRXSR-CIUDSAMLSA-N 0.000 description 1
- FBVHRDXSCYELMI-PBCZWWQYSA-N His-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O FBVHRDXSCYELMI-PBCZWWQYSA-N 0.000 description 1
- XHQYFGPIRUHQIB-PBCZWWQYSA-N His-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CN=CN1 XHQYFGPIRUHQIB-PBCZWWQYSA-N 0.000 description 1
- DEMIXZCKUXVEBO-BWAGICSOSA-N His-Thr-Tyr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)O DEMIXZCKUXVEBO-BWAGICSOSA-N 0.000 description 1
- JATYGDHMDRAISQ-KKUMJFAQSA-N His-Tyr-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O JATYGDHMDRAISQ-KKUMJFAQSA-N 0.000 description 1
- CKONPJHGMIDMJP-IHRRRGAJSA-N His-Val-His Chemical compound C([C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 CKONPJHGMIDMJP-IHRRRGAJSA-N 0.000 description 1
- GGXUJBKENKVYNV-ULQDDVLXSA-N His-Val-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N GGXUJBKENKVYNV-ULQDDVLXSA-N 0.000 description 1
- XGBVLRJLHUVCNK-DCAQKATOSA-N His-Val-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O XGBVLRJLHUVCNK-DCAQKATOSA-N 0.000 description 1
- 101001001786 Homo sapiens Glutamyl-tRNA(Gln) amidotransferase subunit C, mitochondrial Proteins 0.000 description 1
- 101000611183 Homo sapiens Tumor necrosis factor Proteins 0.000 description 1
- VSZALHITQINTGC-GHCJXIJMSA-N Ile-Ala-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VSZALHITQINTGC-GHCJXIJMSA-N 0.000 description 1
- JRHFQUPIZOYKQP-KBIXCLLPSA-N Ile-Ala-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O JRHFQUPIZOYKQP-KBIXCLLPSA-N 0.000 description 1
- WUEIUSDAECDLQO-NAKRPEOUSA-N Ile-Ala-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)O)N WUEIUSDAECDLQO-NAKRPEOUSA-N 0.000 description 1
- HERITAGIPLEJMT-GVARAGBVSA-N Ile-Ala-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HERITAGIPLEJMT-GVARAGBVSA-N 0.000 description 1
- HLYBGMZJVDHJEO-CYDGBPFRSA-N Ile-Arg-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HLYBGMZJVDHJEO-CYDGBPFRSA-N 0.000 description 1
- ASCFJMSGKUIRDU-ZPFDUUQYSA-N Ile-Arg-Gln Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O ASCFJMSGKUIRDU-ZPFDUUQYSA-N 0.000 description 1
- FVEWRQXNISSYFO-ZPFDUUQYSA-N Ile-Arg-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FVEWRQXNISSYFO-ZPFDUUQYSA-N 0.000 description 1
- QLRMMMQNCWBNPQ-QXEWZRGKSA-N Ile-Arg-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)O)N QLRMMMQNCWBNPQ-QXEWZRGKSA-N 0.000 description 1
- LVQDUPQUJZWKSU-PYJNHQTQSA-N Ile-Arg-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LVQDUPQUJZWKSU-PYJNHQTQSA-N 0.000 description 1
- WECYRWOMWSCWNX-XUXIUFHCSA-N Ile-Arg-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O WECYRWOMWSCWNX-XUXIUFHCSA-N 0.000 description 1
- YOTNPRLPIPHQSB-XUXIUFHCSA-N Ile-Arg-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOTNPRLPIPHQSB-XUXIUFHCSA-N 0.000 description 1
- DMHGKBGOUAJRHU-RVMXOQNASA-N Ile-Arg-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N DMHGKBGOUAJRHU-RVMXOQNASA-N 0.000 description 1
- QTUSJASXLGLJSR-OSUNSFLBSA-N Ile-Arg-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N QTUSJASXLGLJSR-OSUNSFLBSA-N 0.000 description 1
- CWJQMCPYXNVMBS-STECZYCISA-N Ile-Arg-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N CWJQMCPYXNVMBS-STECZYCISA-N 0.000 description 1
- SCHZQZPYHBWYEQ-PEFMBERDSA-N Ile-Asn-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SCHZQZPYHBWYEQ-PEFMBERDSA-N 0.000 description 1
- XENGULNPUDGALZ-ZPFDUUQYSA-N Ile-Asn-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N XENGULNPUDGALZ-ZPFDUUQYSA-N 0.000 description 1
- QYOGJYIRKACXEP-SLBDDTMCSA-N Ile-Asn-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N QYOGJYIRKACXEP-SLBDDTMCSA-N 0.000 description 1
- HVWXAQVMRBKKFE-UGYAYLCHSA-N Ile-Asp-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HVWXAQVMRBKKFE-UGYAYLCHSA-N 0.000 description 1
- LLZLRXBTOOFODM-QSFUFRPTSA-N Ile-Asp-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N LLZLRXBTOOFODM-QSFUFRPTSA-N 0.000 description 1
- GECLQMBTZCPAFY-PEFMBERDSA-N Ile-Gln-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GECLQMBTZCPAFY-PEFMBERDSA-N 0.000 description 1
- LJKDGRWXYUTRSH-YVNDNENWSA-N Ile-Gln-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LJKDGRWXYUTRSH-YVNDNENWSA-N 0.000 description 1
- OVPYIUNCVSOVNF-KQXIARHKSA-N Ile-Gln-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N OVPYIUNCVSOVNF-KQXIARHKSA-N 0.000 description 1
- YBJWJQQBWRARLT-KBIXCLLPSA-N Ile-Gln-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O YBJWJQQBWRARLT-KBIXCLLPSA-N 0.000 description 1
- KIMHKBDJQQYLHU-PEFMBERDSA-N Ile-Glu-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KIMHKBDJQQYLHU-PEFMBERDSA-N 0.000 description 1
- DFJJAVZIHDFOGQ-MNXVOIDGSA-N Ile-Glu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DFJJAVZIHDFOGQ-MNXVOIDGSA-N 0.000 description 1
- JXMSHKFPDIUYGS-SIUGBPQLSA-N Ile-Glu-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N JXMSHKFPDIUYGS-SIUGBPQLSA-N 0.000 description 1
- NZOCIWKZUVUNDW-ZKWXMUAHSA-N Ile-Gly-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O NZOCIWKZUVUNDW-ZKWXMUAHSA-N 0.000 description 1
- KFVUBLZRFSVDGO-BYULHYEWSA-N Ile-Gly-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O KFVUBLZRFSVDGO-BYULHYEWSA-N 0.000 description 1
- PDTMWFVVNZYWTR-NHCYSSNCSA-N Ile-Gly-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O PDTMWFVVNZYWTR-NHCYSSNCSA-N 0.000 description 1
- ODPKZZLRDNXTJZ-WHOFXGATSA-N Ile-Gly-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N ODPKZZLRDNXTJZ-WHOFXGATSA-N 0.000 description 1
- KOPIAUWNLKKELG-SIGLWIIPSA-N Ile-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N KOPIAUWNLKKELG-SIGLWIIPSA-N 0.000 description 1
- CMNMPCTVCWWYHY-MXAVVETBSA-N Ile-His-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(C)C)C(=O)O)N CMNMPCTVCWWYHY-MXAVVETBSA-N 0.000 description 1
- CCYGNFBYUNHFSC-MGHWNKPDSA-N Ile-His-Phe Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O CCYGNFBYUNHFSC-MGHWNKPDSA-N 0.000 description 1
- URWXDJAEEGBADB-TUBUOCAGSA-N Ile-His-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N URWXDJAEEGBADB-TUBUOCAGSA-N 0.000 description 1
- GTSAALPQZASLPW-KJYZGMDISA-N Ile-His-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N GTSAALPQZASLPW-KJYZGMDISA-N 0.000 description 1
- APDIECQNNDGFPD-PYJNHQTQSA-N Ile-His-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C(C)C)C(=O)O)N APDIECQNNDGFPD-PYJNHQTQSA-N 0.000 description 1
- TWPSALMCEHCIOY-YTFOTSKYSA-N Ile-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(=O)O)N TWPSALMCEHCIOY-YTFOTSKYSA-N 0.000 description 1
- KLBVGHCGHUNHEA-BJDJZHNGSA-N Ile-Leu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)O)N KLBVGHCGHUNHEA-BJDJZHNGSA-N 0.000 description 1
- GAZGFPOZOLEYAJ-YTFOTSKYSA-N Ile-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N GAZGFPOZOLEYAJ-YTFOTSKYSA-N 0.000 description 1
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 1
- UIEZQYNXCYHMQS-BJDJZHNGSA-N Ile-Lys-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)O)N UIEZQYNXCYHMQS-BJDJZHNGSA-N 0.000 description 1
- NZGTYCMLUGYMCV-XUXIUFHCSA-N Ile-Lys-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N NZGTYCMLUGYMCV-XUXIUFHCSA-N 0.000 description 1
- PARSHQDZROHERM-NHCYSSNCSA-N Ile-Lys-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)O)N PARSHQDZROHERM-NHCYSSNCSA-N 0.000 description 1
- XDUVMJCBYUKNFJ-MXAVVETBSA-N Ile-Lys-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N XDUVMJCBYUKNFJ-MXAVVETBSA-N 0.000 description 1
- MASWXTFJVNRZPT-NAKRPEOUSA-N Ile-Met-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)O)N MASWXTFJVNRZPT-NAKRPEOUSA-N 0.000 description 1
- UFRXVQGGPNSJRY-CYDGBPFRSA-N Ile-Met-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N UFRXVQGGPNSJRY-CYDGBPFRSA-N 0.000 description 1
- NPAYJTAXWXJKLO-NAKRPEOUSA-N Ile-Met-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N NPAYJTAXWXJKLO-NAKRPEOUSA-N 0.000 description 1
- HQEPKOFULQTSFV-JURCDPSOSA-N Ile-Phe-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)O)N HQEPKOFULQTSFV-JURCDPSOSA-N 0.000 description 1
- IITVUURPOYGCTD-NAKRPEOUSA-N Ile-Pro-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IITVUURPOYGCTD-NAKRPEOUSA-N 0.000 description 1
- XHBYEMIUENPZLY-GMOBBJLQSA-N Ile-Pro-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O XHBYEMIUENPZLY-GMOBBJLQSA-N 0.000 description 1
- BATWGBRIZANGPN-ZPFDUUQYSA-N Ile-Pro-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BATWGBRIZANGPN-ZPFDUUQYSA-N 0.000 description 1
- IVXJIMGDOYRLQU-XUXIUFHCSA-N Ile-Pro-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O IVXJIMGDOYRLQU-XUXIUFHCSA-N 0.000 description 1
- CAHCWMVNBZJVAW-NAKRPEOUSA-N Ile-Pro-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)O)N CAHCWMVNBZJVAW-NAKRPEOUSA-N 0.000 description 1
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 1
- JZNVOBUNTWNZPW-GHCJXIJMSA-N Ile-Ser-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N JZNVOBUNTWNZPW-GHCJXIJMSA-N 0.000 description 1
- FBGXMKUWQFPHFB-JBDRJPRFSA-N Ile-Ser-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N FBGXMKUWQFPHFB-JBDRJPRFSA-N 0.000 description 1
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 1
- QQVXERGIFIRCGW-NAKRPEOUSA-N Ile-Ser-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)O)N QQVXERGIFIRCGW-NAKRPEOUSA-N 0.000 description 1
- RQJUKVXWAKJDBW-SVSWQMSJSA-N Ile-Ser-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N RQJUKVXWAKJDBW-SVSWQMSJSA-N 0.000 description 1
- WLRJHVNFGAOYPS-HJPIBITLSA-N Ile-Ser-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N WLRJHVNFGAOYPS-HJPIBITLSA-N 0.000 description 1
- HXIDVIFHRYRXLZ-NAKRPEOUSA-N Ile-Ser-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)O)N HXIDVIFHRYRXLZ-NAKRPEOUSA-N 0.000 description 1
- CNMOKANDJMLAIF-CIQUZCHMSA-N Ile-Thr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O CNMOKANDJMLAIF-CIQUZCHMSA-N 0.000 description 1
- YBKKLDBBPFIXBQ-MBLNEYKQSA-N Ile-Thr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)O)N YBKKLDBBPFIXBQ-MBLNEYKQSA-N 0.000 description 1
- HJDZMPFEXINXLO-QPHKQPEJSA-N Ile-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N HJDZMPFEXINXLO-QPHKQPEJSA-N 0.000 description 1
- QGXQHJQPAPMACW-PPCPHDFISA-N Ile-Thr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QGXQHJQPAPMACW-PPCPHDFISA-N 0.000 description 1
- JJQQGCMKLOEGAV-OSUNSFLBSA-N Ile-Thr-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)O)N JJQQGCMKLOEGAV-OSUNSFLBSA-N 0.000 description 1
- ANTFEOSJMAUGIB-KNZXXDILSA-N Ile-Thr-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N ANTFEOSJMAUGIB-KNZXXDILSA-N 0.000 description 1
- QHUREMVLLMNUAX-OSUNSFLBSA-N Ile-Thr-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)O)N QHUREMVLLMNUAX-OSUNSFLBSA-N 0.000 description 1
- OAQJOXZPGHTJNA-NGTWOADLSA-N Ile-Trp-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N OAQJOXZPGHTJNA-NGTWOADLSA-N 0.000 description 1
- YJRSIJZUIUANHO-NAKRPEOUSA-N Ile-Val-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(=O)O)N YJRSIJZUIUANHO-NAKRPEOUSA-N 0.000 description 1
- YWCJXQKATPNPOE-UKJIMTQDSA-N Ile-Val-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YWCJXQKATPNPOE-UKJIMTQDSA-N 0.000 description 1
- KXUKTDGKLAOCQK-LSJOCFKGSA-N Ile-Val-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O KXUKTDGKLAOCQK-LSJOCFKGSA-N 0.000 description 1
- UYODHPPSCXBNCS-XUXIUFHCSA-N Ile-Val-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C UYODHPPSCXBNCS-XUXIUFHCSA-N 0.000 description 1
- RQZFWBLDTBDEOF-RNJOBUHISA-N Ile-Val-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N RQZFWBLDTBDEOF-RNJOBUHISA-N 0.000 description 1
- JZBVBOKASHNXAD-NAKRPEOUSA-N Ile-Val-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N JZBVBOKASHNXAD-NAKRPEOUSA-N 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 108010058683 Immobilized Proteins Proteins 0.000 description 1
- 108010091135 Immunoglobulin Fc Fragments Proteins 0.000 description 1
- 102000018071 Immunoglobulin Fc Fragments Human genes 0.000 description 1
- 102000017727 Immunoglobulin Variable Region Human genes 0.000 description 1
- 108010067060 Immunoglobulin Variable Region Proteins 0.000 description 1
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 1
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 1
- DQPQTXMIRBUWKO-DCAQKATOSA-N Leu-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(C)C)N DQPQTXMIRBUWKO-DCAQKATOSA-N 0.000 description 1
- XIRYQRLFHWWWTC-QEJZJMRPSA-N Leu-Ala-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XIRYQRLFHWWWTC-QEJZJMRPSA-N 0.000 description 1
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 1
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 1
- JUWJEAPUNARGCF-DCAQKATOSA-N Leu-Arg-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O JUWJEAPUNARGCF-DCAQKATOSA-N 0.000 description 1
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 1
- CUXRXAIAVYLVFD-ULQDDVLXSA-N Leu-Arg-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CUXRXAIAVYLVFD-ULQDDVLXSA-N 0.000 description 1
- DBVWMYGBVFCRBE-CIUDSAMLSA-N Leu-Asn-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DBVWMYGBVFCRBE-CIUDSAMLSA-N 0.000 description 1
- VCSBGUACOYUIGD-CIUDSAMLSA-N Leu-Asn-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VCSBGUACOYUIGD-CIUDSAMLSA-N 0.000 description 1
- KKXDHFKZWKLYGB-GUBZILKMSA-N Leu-Asn-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKXDHFKZWKLYGB-GUBZILKMSA-N 0.000 description 1
- OXKYZSRZKBTVEY-ZPFDUUQYSA-N Leu-Asn-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OXKYZSRZKBTVEY-ZPFDUUQYSA-N 0.000 description 1
- FIJMQLGQLBLBOL-HJGDQZAQSA-N Leu-Asn-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FIJMQLGQLBLBOL-HJGDQZAQSA-N 0.000 description 1
- WXHFZJFZWNCDNB-KKUMJFAQSA-N Leu-Asn-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WXHFZJFZWNCDNB-KKUMJFAQSA-N 0.000 description 1
- ZURHXHNAEJJRNU-CIUDSAMLSA-N Leu-Asp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZURHXHNAEJJRNU-CIUDSAMLSA-N 0.000 description 1
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 1
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 1
- XVSJMWYYLHPDKY-DCAQKATOSA-N Leu-Asp-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O XVSJMWYYLHPDKY-DCAQKATOSA-N 0.000 description 1
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 1
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 1
- ZTLGVASZOIKNIX-DCAQKATOSA-N Leu-Gln-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZTLGVASZOIKNIX-DCAQKATOSA-N 0.000 description 1
- RSFGIMMPWAXNML-MNXVOIDGSA-N Leu-Gln-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RSFGIMMPWAXNML-MNXVOIDGSA-N 0.000 description 1
- CQGSYZCULZMEDE-SRVKXCTJSA-N Leu-Gln-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CQGSYZCULZMEDE-SRVKXCTJSA-N 0.000 description 1
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 1
- HFBCHNRFRYLZNV-GUBZILKMSA-N Leu-Glu-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HFBCHNRFRYLZNV-GUBZILKMSA-N 0.000 description 1
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 1
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 1
- HPBCTWSUJOGJSH-MNXVOIDGSA-N Leu-Glu-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HPBCTWSUJOGJSH-MNXVOIDGSA-N 0.000 description 1
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 1
- LAGPXKYZCCTSGQ-JYJNAYRXSA-N Leu-Glu-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LAGPXKYZCCTSGQ-JYJNAYRXSA-N 0.000 description 1
- LLBQJYDYOLIQAI-JYJNAYRXSA-N Leu-Glu-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LLBQJYDYOLIQAI-JYJNAYRXSA-N 0.000 description 1
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 1
- QPXBPQUGXHURGP-UWVGGRQHSA-N Leu-Gly-Met Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CCSC)C(=O)O)N QPXBPQUGXHURGP-UWVGGRQHSA-N 0.000 description 1
- UCDHVOALNXENLC-KBPBESRZSA-N Leu-Gly-Tyr Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UCDHVOALNXENLC-KBPBESRZSA-N 0.000 description 1
- BKTXKJMNTSMJDQ-AVGNSLFASA-N Leu-His-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BKTXKJMNTSMJDQ-AVGNSLFASA-N 0.000 description 1
- KVOFSTUWVSQMDK-KKUMJFAQSA-N Leu-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CN=CN1 KVOFSTUWVSQMDK-KKUMJFAQSA-N 0.000 description 1
- SGIIOQQGLUUMDQ-IHRRRGAJSA-N Leu-His-Val Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C(C)C)C(=O)O)N SGIIOQQGLUUMDQ-IHRRRGAJSA-N 0.000 description 1
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 1
- ORWTWZXGDBYVCP-BJDJZHNGSA-N Leu-Ile-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(C)C ORWTWZXGDBYVCP-BJDJZHNGSA-N 0.000 description 1
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 1
- HRTRLSRYZZKPCO-BJDJZHNGSA-N Leu-Ile-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HRTRLSRYZZKPCO-BJDJZHNGSA-N 0.000 description 1
- JKSIBWITFMQTOA-XUXIUFHCSA-N Leu-Ile-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O JKSIBWITFMQTOA-XUXIUFHCSA-N 0.000 description 1
- IFMPDNRWZZEZSL-SRVKXCTJSA-N Leu-Leu-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(O)=O IFMPDNRWZZEZSL-SRVKXCTJSA-N 0.000 description 1
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 1
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 1
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 1
- UBZGNBKMIJHOHL-BZSNNMDCSA-N Leu-Leu-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 UBZGNBKMIJHOHL-BZSNNMDCSA-N 0.000 description 1
- FOBUGKUBUJOWAD-IHPCNDPISA-N Leu-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 FOBUGKUBUJOWAD-IHPCNDPISA-N 0.000 description 1
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 1
- WXUOJXIGOPMDJM-SRVKXCTJSA-N Leu-Lys-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O WXUOJXIGOPMDJM-SRVKXCTJSA-N 0.000 description 1
- REPBGZHJKYWFMJ-KKUMJFAQSA-N Leu-Lys-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N REPBGZHJKYWFMJ-KKUMJFAQSA-N 0.000 description 1
- FIICHHJDINDXKG-IHPCNDPISA-N Leu-Lys-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O FIICHHJDINDXKG-IHPCNDPISA-N 0.000 description 1
- LZHJZLHSRGWBBE-IHRRRGAJSA-N Leu-Lys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LZHJZLHSRGWBBE-IHRRRGAJSA-N 0.000 description 1
- NJMXCOOEFLMZSR-AVGNSLFASA-N Leu-Met-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O NJMXCOOEFLMZSR-AVGNSLFASA-N 0.000 description 1
- GCXGCIYIHXSKAY-ULQDDVLXSA-N Leu-Phe-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GCXGCIYIHXSKAY-ULQDDVLXSA-N 0.000 description 1
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 1
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 1
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 1
- MJWVXZABPOKJJF-ACRUOGEOSA-N Leu-Phe-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MJWVXZABPOKJJF-ACRUOGEOSA-N 0.000 description 1
- RRVCZCNFXIFGRA-DCAQKATOSA-N Leu-Pro-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O RRVCZCNFXIFGRA-DCAQKATOSA-N 0.000 description 1
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 1
- XXXXOVFBXRERQL-ULQDDVLXSA-N Leu-Pro-Phe Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XXXXOVFBXRERQL-ULQDDVLXSA-N 0.000 description 1
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 1
- HWMQRQIFVGEAPH-XIRDDKMYSA-N Leu-Ser-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 HWMQRQIFVGEAPH-XIRDDKMYSA-N 0.000 description 1
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 1
- RNYLNYTYMXACRI-VFAJRCTISA-N Leu-Thr-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O RNYLNYTYMXACRI-VFAJRCTISA-N 0.000 description 1
- HGLKOTPFWOMPOB-MEYUZBJRSA-N Leu-Thr-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HGLKOTPFWOMPOB-MEYUZBJRSA-N 0.000 description 1
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 1
- LSLUTXRANSUGFY-XIRDDKMYSA-N Leu-Trp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(O)=O)C(O)=O LSLUTXRANSUGFY-XIRDDKMYSA-N 0.000 description 1
- SNOUHRPNNCAOPI-SZMVWBNQSA-N Leu-Trp-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N SNOUHRPNNCAOPI-SZMVWBNQSA-N 0.000 description 1
- WGAZVKFCPHXZLO-SZMVWBNQSA-N Leu-Trp-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N WGAZVKFCPHXZLO-SZMVWBNQSA-N 0.000 description 1
- URJUVJDTPXCQFL-IHPCNDPISA-N Leu-Trp-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N URJUVJDTPXCQFL-IHPCNDPISA-N 0.000 description 1
- SUYRAPCRSCCPAK-VFAJRCTISA-N Leu-Trp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SUYRAPCRSCCPAK-VFAJRCTISA-N 0.000 description 1
- RIHIGSWBLHSGLV-CQDKDKBSSA-N Leu-Tyr-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O RIHIGSWBLHSGLV-CQDKDKBSSA-N 0.000 description 1
- UCRJTSIIAYHOHE-ULQDDVLXSA-N Leu-Tyr-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UCRJTSIIAYHOHE-ULQDDVLXSA-N 0.000 description 1
- ISSAURVGLGAPDK-KKUMJFAQSA-N Leu-Tyr-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O ISSAURVGLGAPDK-KKUMJFAQSA-N 0.000 description 1
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 1
- BTEMNFBEAAOGBR-BZSNNMDCSA-N Leu-Tyr-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BTEMNFBEAAOGBR-BZSNNMDCSA-N 0.000 description 1
- RDFIVFHPOSOXMW-ACRUOGEOSA-N Leu-Tyr-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RDFIVFHPOSOXMW-ACRUOGEOSA-N 0.000 description 1
- BGGTYDNTOYRTTR-MEYUZBJRSA-N Leu-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(C)C)N)O BGGTYDNTOYRTTR-MEYUZBJRSA-N 0.000 description 1
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 1
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 1
- FMFNIDICDKEMOE-XUXIUFHCSA-N Leu-Val-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMFNIDICDKEMOE-XUXIUFHCSA-N 0.000 description 1
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 1
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 1
- 102000004317 Lyases Human genes 0.000 description 1
- 108090000856 Lyases Proteins 0.000 description 1
- MPGHETGWWWUHPY-CIUDSAMLSA-N Lys-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN MPGHETGWWWUHPY-CIUDSAMLSA-N 0.000 description 1
- JCFYLFOCALSNLQ-GUBZILKMSA-N Lys-Ala-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JCFYLFOCALSNLQ-GUBZILKMSA-N 0.000 description 1
- PNPYKQFJGRFYJE-GUBZILKMSA-N Lys-Ala-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNPYKQFJGRFYJE-GUBZILKMSA-N 0.000 description 1
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 1
- VHXMZJGOKIMETG-CQDKDKBSSA-N Lys-Ala-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCCCN)N VHXMZJGOKIMETG-CQDKDKBSSA-N 0.000 description 1
- IRNSXVOWSXSULE-DCAQKATOSA-N Lys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN IRNSXVOWSXSULE-DCAQKATOSA-N 0.000 description 1
- WXJKFRMKJORORD-DCAQKATOSA-N Lys-Arg-Ala Chemical compound NC(=N)NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CCCCN WXJKFRMKJORORD-DCAQKATOSA-N 0.000 description 1
- VHNOAIFVYUQOOY-XUXIUFHCSA-N Lys-Arg-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VHNOAIFVYUQOOY-XUXIUFHCSA-N 0.000 description 1
- CKSXSQUVEYCDIW-AVGNSLFASA-N Lys-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N CKSXSQUVEYCDIW-AVGNSLFASA-N 0.000 description 1
- DGAAQRAUOFHBFJ-CIUDSAMLSA-N Lys-Asn-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O DGAAQRAUOFHBFJ-CIUDSAMLSA-N 0.000 description 1
- DNEJSAIMVANNPA-DCAQKATOSA-N Lys-Asn-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DNEJSAIMVANNPA-DCAQKATOSA-N 0.000 description 1
- ABHIXYDMILIUKV-CIUDSAMLSA-N Lys-Asn-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ABHIXYDMILIUKV-CIUDSAMLSA-N 0.000 description 1
- 108010062166 Lys-Asn-Asp Proteins 0.000 description 1
- BYPMOIFBQPEWOH-CIUDSAMLSA-N Lys-Asn-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N BYPMOIFBQPEWOH-CIUDSAMLSA-N 0.000 description 1
- QYOXSYXPHUHOJR-GUBZILKMSA-N Lys-Asn-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QYOXSYXPHUHOJR-GUBZILKMSA-N 0.000 description 1
- MKBIVWXCFINCLE-SRVKXCTJSA-N Lys-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N MKBIVWXCFINCLE-SRVKXCTJSA-N 0.000 description 1
- QUYCUALODHJQLK-CIUDSAMLSA-N Lys-Asp-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUYCUALODHJQLK-CIUDSAMLSA-N 0.000 description 1
- HIIZIQUUHIXUJY-GUBZILKMSA-N Lys-Asp-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HIIZIQUUHIXUJY-GUBZILKMSA-N 0.000 description 1
- AAORVPFVUIHEAB-YUMQZZPRSA-N Lys-Asp-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O AAORVPFVUIHEAB-YUMQZZPRSA-N 0.000 description 1
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 1
- YEIYAQQKADPIBJ-GARJFASQSA-N Lys-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O YEIYAQQKADPIBJ-GARJFASQSA-N 0.000 description 1
- NRQRKMYZONPCTM-CIUDSAMLSA-N Lys-Asp-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O NRQRKMYZONPCTM-CIUDSAMLSA-N 0.000 description 1
- PHHYNOUOUWYQRO-XIRDDKMYSA-N Lys-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N PHHYNOUOUWYQRO-XIRDDKMYSA-N 0.000 description 1
- GKFNXYMAMKJSKD-NHCYSSNCSA-N Lys-Asp-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GKFNXYMAMKJSKD-NHCYSSNCSA-N 0.000 description 1
- SFQPJNQDUUYCLA-BJDJZHNGSA-N Lys-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCCN)N SFQPJNQDUUYCLA-BJDJZHNGSA-N 0.000 description 1
- SSYOBDBNBQBSQE-SRVKXCTJSA-N Lys-Cys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O SSYOBDBNBQBSQE-SRVKXCTJSA-N 0.000 description 1
- XFBBBRDEQIPGNR-KATARQTJSA-N Lys-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCCN)N)O XFBBBRDEQIPGNR-KATARQTJSA-N 0.000 description 1
- GGNOBVSOZPHLCE-GUBZILKMSA-N Lys-Gln-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O GGNOBVSOZPHLCE-GUBZILKMSA-N 0.000 description 1
- HEWWNLVEWBJBKA-WDCWCFNPSA-N Lys-Gln-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCCN HEWWNLVEWBJBKA-WDCWCFNPSA-N 0.000 description 1
- LLSUNJYOSCOOEB-GUBZILKMSA-N Lys-Glu-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O LLSUNJYOSCOOEB-GUBZILKMSA-N 0.000 description 1
- KZOHPCYVORJBLG-AVGNSLFASA-N Lys-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N KZOHPCYVORJBLG-AVGNSLFASA-N 0.000 description 1
- PAMDBWYMLWOELY-SDDRHHMPSA-N Lys-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O PAMDBWYMLWOELY-SDDRHHMPSA-N 0.000 description 1
- WGLAORUKDGRINI-WDCWCFNPSA-N Lys-Glu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGLAORUKDGRINI-WDCWCFNPSA-N 0.000 description 1
- ODUQLUADRKMHOZ-JYJNAYRXSA-N Lys-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N)O ODUQLUADRKMHOZ-JYJNAYRXSA-N 0.000 description 1
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 1
- UETQMSASAVBGJY-QWRGUYRKSA-N Lys-Gly-His Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 UETQMSASAVBGJY-QWRGUYRKSA-N 0.000 description 1
- DTUZCYRNEJDKSR-NHCYSSNCSA-N Lys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN DTUZCYRNEJDKSR-NHCYSSNCSA-N 0.000 description 1
- JZMGVXLDOQOKAH-UWVGGRQHSA-N Lys-Gly-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O JZMGVXLDOQOKAH-UWVGGRQHSA-N 0.000 description 1
- ZASPELYMPSACER-HOCLYGCPSA-N Lys-Gly-Trp Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ZASPELYMPSACER-HOCLYGCPSA-N 0.000 description 1
- NNKLKUUGESXCBS-KBPBESRZSA-N Lys-Gly-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NNKLKUUGESXCBS-KBPBESRZSA-N 0.000 description 1
- HAUUXTXKJNVIFY-ONGXEEELSA-N Lys-Gly-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAUUXTXKJNVIFY-ONGXEEELSA-N 0.000 description 1
- KZJQUYFDSCFSCO-DLOVCJGASA-N Lys-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCCN)N KZJQUYFDSCFSCO-DLOVCJGASA-N 0.000 description 1
- DAOSYIZXRCOKII-SRVKXCTJSA-N Lys-His-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O DAOSYIZXRCOKII-SRVKXCTJSA-N 0.000 description 1
- GTAXSKOXPIISBW-AVGNSLFASA-N Lys-His-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N GTAXSKOXPIISBW-AVGNSLFASA-N 0.000 description 1
- IVFUVMSKSFSFBT-NHCYSSNCSA-N Lys-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN IVFUVMSKSFSFBT-NHCYSSNCSA-N 0.000 description 1
- YWJQHDDBFAXNIR-MXAVVETBSA-N Lys-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCCN)N YWJQHDDBFAXNIR-MXAVVETBSA-N 0.000 description 1
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 1
- OVAOHZIOUBEQCJ-IHRRRGAJSA-N Lys-Leu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OVAOHZIOUBEQCJ-IHRRRGAJSA-N 0.000 description 1
- NJNRBRKHOWSGMN-SRVKXCTJSA-N Lys-Leu-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O NJNRBRKHOWSGMN-SRVKXCTJSA-N 0.000 description 1
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 1
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 1
- RIJCHEVHFWMDKD-SRVKXCTJSA-N Lys-Lys-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O RIJCHEVHFWMDKD-SRVKXCTJSA-N 0.000 description 1
- PYFNONMJYNJENN-AVGNSLFASA-N Lys-Lys-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PYFNONMJYNJENN-AVGNSLFASA-N 0.000 description 1
- YUAXTFMFMOIMAM-QWRGUYRKSA-N Lys-Lys-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O YUAXTFMFMOIMAM-QWRGUYRKSA-N 0.000 description 1
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 1
- VSTNAUBHKQPVJX-IHRRRGAJSA-N Lys-Met-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O VSTNAUBHKQPVJX-IHRRRGAJSA-N 0.000 description 1
- MTBBHUKKPWKXBT-ULQDDVLXSA-N Lys-Met-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MTBBHUKKPWKXBT-ULQDDVLXSA-N 0.000 description 1
- XFOAWKDQMRMCDN-ULQDDVLXSA-N Lys-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)CC1=CC=CC=C1 XFOAWKDQMRMCDN-ULQDDVLXSA-N 0.000 description 1
- TWPCWKVOZDUYAA-KKUMJFAQSA-N Lys-Phe-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O TWPCWKVOZDUYAA-KKUMJFAQSA-N 0.000 description 1
- BPDXWKVZNCKUGG-BZSNNMDCSA-N Lys-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCCN)N BPDXWKVZNCKUGG-BZSNNMDCSA-N 0.000 description 1
- LUAJJLPHUXPQLH-KKUMJFAQSA-N Lys-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCCN)N LUAJJLPHUXPQLH-KKUMJFAQSA-N 0.000 description 1
- BOJYMMBYBNOOGG-DCAQKATOSA-N Lys-Pro-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BOJYMMBYBNOOGG-DCAQKATOSA-N 0.000 description 1
- PDIDTSZKKFEDMB-UWVGGRQHSA-N Lys-Pro-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PDIDTSZKKFEDMB-UWVGGRQHSA-N 0.000 description 1
- QBHGXFQJFPWJIH-XUXIUFHCSA-N Lys-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN QBHGXFQJFPWJIH-XUXIUFHCSA-N 0.000 description 1
- YTJFXEDRUOQGSP-DCAQKATOSA-N Lys-Pro-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O YTJFXEDRUOQGSP-DCAQKATOSA-N 0.000 description 1
- WQDKIVRHTQYJSN-DCAQKATOSA-N Lys-Ser-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N WQDKIVRHTQYJSN-DCAQKATOSA-N 0.000 description 1
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 1
- UIJVKVHLCQSPOJ-XIRDDKMYSA-N Lys-Ser-Trp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O UIJVKVHLCQSPOJ-XIRDDKMYSA-N 0.000 description 1
- GIKFNMZSGYAPEJ-HJGDQZAQSA-N Lys-Thr-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O GIKFNMZSGYAPEJ-HJGDQZAQSA-N 0.000 description 1
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 1
- JMENHIOOENGKIL-JGFWFPDNSA-N Lys-Thr-Trp-Tyr Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)[C@H](O)C)C(O)=O)C1=CC=C(O)C=C1 JMENHIOOENGKIL-JGFWFPDNSA-N 0.000 description 1
- YFQSSOAGMZGXFT-MEYUZBJRSA-N Lys-Thr-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YFQSSOAGMZGXFT-MEYUZBJRSA-N 0.000 description 1
- BVRNWWHJYNPJDG-XIRDDKMYSA-N Lys-Trp-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N BVRNWWHJYNPJDG-XIRDDKMYSA-N 0.000 description 1
- KXYLFJIQDIMURW-IHPCNDPISA-N Lys-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CCCCN)=CNC2=C1 KXYLFJIQDIMURW-IHPCNDPISA-N 0.000 description 1
- SUZVLFWOCKHWET-CQDKDKBSSA-N Lys-Tyr-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O SUZVLFWOCKHWET-CQDKDKBSSA-N 0.000 description 1
- XATKLFSXFINPSB-JYJNAYRXSA-N Lys-Tyr-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O XATKLFSXFINPSB-JYJNAYRXSA-N 0.000 description 1
- WINFHLHJTRGLCV-BZSNNMDCSA-N Lys-Tyr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=C(O)C=C1 WINFHLHJTRGLCV-BZSNNMDCSA-N 0.000 description 1
- LMMBAXJRYSXCOQ-ACRUOGEOSA-N Lys-Tyr-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O LMMBAXJRYSXCOQ-ACRUOGEOSA-N 0.000 description 1
- SQRLLZAQNOQCEG-KKUMJFAQSA-N Lys-Tyr-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 SQRLLZAQNOQCEG-KKUMJFAQSA-N 0.000 description 1
- PPNCMJARTHYNEC-MEYUZBJRSA-N Lys-Tyr-Thr Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)CC1=CC=C(O)C=C1 PPNCMJARTHYNEC-MEYUZBJRSA-N 0.000 description 1
- FPQMQEOVSKMVMA-ACRUOGEOSA-N Lys-Tyr-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)NC(=O)[C@H](CCCCN)N)O FPQMQEOVSKMVMA-ACRUOGEOSA-N 0.000 description 1
- OHXUUQDOBQKSNB-AVGNSLFASA-N Lys-Val-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OHXUUQDOBQKSNB-AVGNSLFASA-N 0.000 description 1
- QLFAPXUXEBAWEK-NHCYSSNCSA-N Lys-Val-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QLFAPXUXEBAWEK-NHCYSSNCSA-N 0.000 description 1
- UGCIQUYEJIEHKX-GVXVVHGQSA-N Lys-Val-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O UGCIQUYEJIEHKX-GVXVVHGQSA-N 0.000 description 1
- VKCPHIOZDWUFSW-ONGXEEELSA-N Lys-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN VKCPHIOZDWUFSW-ONGXEEELSA-N 0.000 description 1
- GILLQRYAWOMHED-DCAQKATOSA-N Lys-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN GILLQRYAWOMHED-DCAQKATOSA-N 0.000 description 1
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 1
- LMKSBGIUPVRHEH-FXQIFTODSA-N Met-Ala-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(N)=O LMKSBGIUPVRHEH-FXQIFTODSA-N 0.000 description 1
- QEVRUYFHWJJUHZ-DCAQKATOSA-N Met-Ala-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(C)C QEVRUYFHWJJUHZ-DCAQKATOSA-N 0.000 description 1
- WYEXWKAWMNJKPN-UBHSHLNASA-N Met-Ala-Phe Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCSC)N WYEXWKAWMNJKPN-UBHSHLNASA-N 0.000 description 1
- HUKLXYYPZWPXCC-KZVJFYERSA-N Met-Ala-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HUKLXYYPZWPXCC-KZVJFYERSA-N 0.000 description 1
- CTVJSFRHUOSCQQ-DCAQKATOSA-N Met-Arg-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O CTVJSFRHUOSCQQ-DCAQKATOSA-N 0.000 description 1
- DSWOTZCVCBEPOU-IUCAKERBSA-N Met-Arg-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCNC(N)=N DSWOTZCVCBEPOU-IUCAKERBSA-N 0.000 description 1
- NKDSBBBPGIVWEI-RCWTZXSCSA-N Met-Arg-Thr Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NKDSBBBPGIVWEI-RCWTZXSCSA-N 0.000 description 1
- FRWZTWWOORIIBA-FXQIFTODSA-N Met-Asn-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N FRWZTWWOORIIBA-FXQIFTODSA-N 0.000 description 1
- HDNOQCZWJGGHSS-VEVYYDQMSA-N Met-Asn-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HDNOQCZWJGGHSS-VEVYYDQMSA-N 0.000 description 1
- QWTGQXGNNMIUCW-BPUTZDHNSA-N Met-Asn-Trp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O QWTGQXGNNMIUCW-BPUTZDHNSA-N 0.000 description 1
- UZVWDRPUTHXQAM-FXQIFTODSA-N Met-Asp-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O UZVWDRPUTHXQAM-FXQIFTODSA-N 0.000 description 1
- JYCQGAGDJQYEDB-GUBZILKMSA-N Met-Gln-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O JYCQGAGDJQYEDB-GUBZILKMSA-N 0.000 description 1
- FWTBMGAKKPSTBT-GUBZILKMSA-N Met-Gln-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FWTBMGAKKPSTBT-GUBZILKMSA-N 0.000 description 1
- NCVJJAJVWILAGI-SRVKXCTJSA-N Met-Gln-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N NCVJJAJVWILAGI-SRVKXCTJSA-N 0.000 description 1
- DGNZGCQSVGGYJS-BQBZGAKWSA-N Met-Gly-Asp Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O DGNZGCQSVGGYJS-BQBZGAKWSA-N 0.000 description 1
- UZWMJZSOXGOVIN-LURJTMIESA-N Met-Gly-Gly Chemical compound CSCC[C@H](N)C(=O)NCC(=O)NCC(O)=O UZWMJZSOXGOVIN-LURJTMIESA-N 0.000 description 1
- LRALLISKBZNSKN-BQBZGAKWSA-N Met-Gly-Ser Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LRALLISKBZNSKN-BQBZGAKWSA-N 0.000 description 1
- RKIIYGUHIQJCBW-SRVKXCTJSA-N Met-His-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RKIIYGUHIQJCBW-SRVKXCTJSA-N 0.000 description 1
- NHDMNXBBSGVYGP-PYJNHQTQSA-N Met-His-Ile Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)CC)C(O)=O)CC1=CN=CN1 NHDMNXBBSGVYGP-PYJNHQTQSA-N 0.000 description 1
- AEQVPPGEJJBFEE-CYDGBPFRSA-N Met-Ile-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEQVPPGEJJBFEE-CYDGBPFRSA-N 0.000 description 1
- KMSMNUFBNCHMII-IHRRRGAJSA-N Met-Leu-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN KMSMNUFBNCHMII-IHRRRGAJSA-N 0.000 description 1
- UNPGTBHYKJOCCZ-DCAQKATOSA-N Met-Lys-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O UNPGTBHYKJOCCZ-DCAQKATOSA-N 0.000 description 1
- JCMMNFZUKMMECJ-DCAQKATOSA-N Met-Lys-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O JCMMNFZUKMMECJ-DCAQKATOSA-N 0.000 description 1
- WPTHAGXMYDRPFD-SRVKXCTJSA-N Met-Lys-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O WPTHAGXMYDRPFD-SRVKXCTJSA-N 0.000 description 1
- AXHNAGAYRGCDLG-UWVGGRQHSA-N Met-Lys-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O AXHNAGAYRGCDLG-UWVGGRQHSA-N 0.000 description 1
- WTHGNAAQXISJHP-AVGNSLFASA-N Met-Lys-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O WTHGNAAQXISJHP-AVGNSLFASA-N 0.000 description 1
- VAGCEUUEMMXFEX-GUBZILKMSA-N Met-Met-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(O)=O VAGCEUUEMMXFEX-GUBZILKMSA-N 0.000 description 1
- GRKPXCKLOOUDFG-UFYCRDLUSA-N Met-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@@H](N)CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 GRKPXCKLOOUDFG-UFYCRDLUSA-N 0.000 description 1
- YLDSJJOGQNEQJK-AVGNSLFASA-N Met-Pro-Leu Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O YLDSJJOGQNEQJK-AVGNSLFASA-N 0.000 description 1
- FNYBIOGBMWFQRJ-SRVKXCTJSA-N Met-Pro-Met Chemical compound CSCC[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)O)N FNYBIOGBMWFQRJ-SRVKXCTJSA-N 0.000 description 1
- BJPQKNHZHUCQNQ-SRVKXCTJSA-N Met-Pro-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCSC)N BJPQKNHZHUCQNQ-SRVKXCTJSA-N 0.000 description 1
- CIDICGYKRUTYLE-FXQIFTODSA-N Met-Ser-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O CIDICGYKRUTYLE-FXQIFTODSA-N 0.000 description 1
- LXCSZPUQKMTXNW-BQBZGAKWSA-N Met-Ser-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O LXCSZPUQKMTXNW-BQBZGAKWSA-N 0.000 description 1
- MNGBICITWAPGAS-BPUTZDHNSA-N Met-Ser-Trp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O MNGBICITWAPGAS-BPUTZDHNSA-N 0.000 description 1
- SOAYQFDWEIWPPR-IHRRRGAJSA-N Met-Ser-Tyr Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O SOAYQFDWEIWPPR-IHRRRGAJSA-N 0.000 description 1
- GGXZOTSDJJTDGB-GUBZILKMSA-N Met-Ser-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O GGXZOTSDJJTDGB-GUBZILKMSA-N 0.000 description 1
- XLTSAUGGDYRFLS-UMPQAUOISA-N Met-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCSC)N)O XLTSAUGGDYRFLS-UMPQAUOISA-N 0.000 description 1
- TUZSWDCTCGTVDJ-PJODQICGSA-N Met-Trp-Ala Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCSC)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 TUZSWDCTCGTVDJ-PJODQICGSA-N 0.000 description 1
- KLGIQJRMFHIGCQ-ZFWWWQNUSA-N Met-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCSC)C(=O)NCC(O)=O)=CNC2=C1 KLGIQJRMFHIGCQ-ZFWWWQNUSA-N 0.000 description 1
- CULGJGUDIJATIP-STQMWFEESA-N Met-Tyr-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 CULGJGUDIJATIP-STQMWFEESA-N 0.000 description 1
- VWFHWJGVLVZVIS-QXEWZRGKSA-N Met-Val-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O VWFHWJGVLVZVIS-QXEWZRGKSA-N 0.000 description 1
- CNFMPVYIVQUJOO-NHCYSSNCSA-N Met-Val-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O CNFMPVYIVQUJOO-NHCYSSNCSA-N 0.000 description 1
- FSTWDRPCQQUJIT-NHCYSSNCSA-N Met-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCSC)N FSTWDRPCQQUJIT-NHCYSSNCSA-N 0.000 description 1
- QAVZUKIPOMBLMC-AVGNSLFASA-N Met-Val-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C QAVZUKIPOMBLMC-AVGNSLFASA-N 0.000 description 1
- WYBVBIHNJWOLCJ-UHFFFAOYSA-N N-L-arginyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCCN=C(N)N WYBVBIHNJWOLCJ-UHFFFAOYSA-N 0.000 description 1
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 1
- OVRNDRQMDRJTHS-UHFFFAOYSA-N N-acelyl-D-glucosamine Natural products CC(=O)NC1C(O)OC(CO)C(O)C1O OVRNDRQMDRJTHS-UHFFFAOYSA-N 0.000 description 1
- OVRNDRQMDRJTHS-KEWYIRBNSA-N N-acetyl-D-galactosamine Chemical compound CC(=O)N[C@H]1C(O)O[C@H](CO)[C@H](O)[C@@H]1O OVRNDRQMDRJTHS-KEWYIRBNSA-N 0.000 description 1
- MBLBDJOUHNCFQT-UHFFFAOYSA-N N-acetyl-D-galactosamine Natural products CC(=O)NC(C=O)C(O)C(O)C(O)CO MBLBDJOUHNCFQT-UHFFFAOYSA-N 0.000 description 1
- OVRNDRQMDRJTHS-RTRLPJTCSA-N N-acetyl-D-glucosamine Chemical compound CC(=O)N[C@H]1C(O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-RTRLPJTCSA-N 0.000 description 1
- MBLBDJOUHNCFQT-LXGUWJNJSA-N N-acetylglucosamine Natural products CC(=O)N[C@@H](C=O)[C@@H](O)[C@H](O)[C@H](O)CO MBLBDJOUHNCFQT-LXGUWJNJSA-N 0.000 description 1
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 1
- 102400000108 N-terminal peptide Human genes 0.000 description 1
- 108010047562 NGR peptide Proteins 0.000 description 1
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 1
- 101150026476 PAO1 gene Proteins 0.000 description 1
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- LSXGADJXBDFXQU-DLOVCJGASA-N Phe-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 LSXGADJXBDFXQU-DLOVCJGASA-N 0.000 description 1
- NOFBJKKOPKJDCO-KKXDTOCCSA-N Phe-Ala-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NOFBJKKOPKJDCO-KKXDTOCCSA-N 0.000 description 1
- YYRCPTVAPLQRNC-ULQDDVLXSA-N Phe-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CC1=CC=CC=C1 YYRCPTVAPLQRNC-ULQDDVLXSA-N 0.000 description 1
- LJUUGSWZPQOJKD-JYJNAYRXSA-N Phe-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O LJUUGSWZPQOJKD-JYJNAYRXSA-N 0.000 description 1
- MRNRMSDVVSKPGM-AVGNSLFASA-N Phe-Asn-Gln Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MRNRMSDVVSKPGM-AVGNSLFASA-N 0.000 description 1
- AWAYOWOUGVZXOB-BZSNNMDCSA-N Phe-Asn-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 AWAYOWOUGVZXOB-BZSNNMDCSA-N 0.000 description 1
- JIYJYFIXQTYDNF-YDHLFZDLSA-N Phe-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N JIYJYFIXQTYDNF-YDHLFZDLSA-N 0.000 description 1
- WMGVYPPIMZPWPN-SRVKXCTJSA-N Phe-Asp-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N WMGVYPPIMZPWPN-SRVKXCTJSA-N 0.000 description 1
- RIYZXJVARWJLKS-KKUMJFAQSA-N Phe-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 RIYZXJVARWJLKS-KKUMJFAQSA-N 0.000 description 1
- FRPVPGRXUKFEQE-YDHLFZDLSA-N Phe-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O FRPVPGRXUKFEQE-YDHLFZDLSA-N 0.000 description 1
- ZBYHVSHBZYHQBW-SRVKXCTJSA-N Phe-Cys-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ZBYHVSHBZYHQBW-SRVKXCTJSA-N 0.000 description 1
- KOUUGTKGEQZRHV-KKUMJFAQSA-N Phe-Gln-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O KOUUGTKGEQZRHV-KKUMJFAQSA-N 0.000 description 1
- SXJGROGVINAYSH-AVGNSLFASA-N Phe-Gln-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SXJGROGVINAYSH-AVGNSLFASA-N 0.000 description 1
- KAGCQPSEVAETCA-JYJNAYRXSA-N Phe-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N KAGCQPSEVAETCA-JYJNAYRXSA-N 0.000 description 1
- HOYQLNNGMHXZDW-KKUMJFAQSA-N Phe-Glu-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HOYQLNNGMHXZDW-KKUMJFAQSA-N 0.000 description 1
- FMMIYCMOVGXZIP-AVGNSLFASA-N Phe-Glu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O FMMIYCMOVGXZIP-AVGNSLFASA-N 0.000 description 1
- PSKRILMFHNIUAO-JYJNAYRXSA-N Phe-Glu-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N PSKRILMFHNIUAO-JYJNAYRXSA-N 0.000 description 1
- UAMFZRNCIFFMLE-FHWLQOOXSA-N Phe-Glu-Tyr Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N UAMFZRNCIFFMLE-FHWLQOOXSA-N 0.000 description 1
- APJPXSFJBMMOLW-KBPBESRZSA-N Phe-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 APJPXSFJBMMOLW-KBPBESRZSA-N 0.000 description 1
- HBGFEEQFVBWYJQ-KBPBESRZSA-N Phe-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HBGFEEQFVBWYJQ-KBPBESRZSA-N 0.000 description 1
- SWCOXQLDICUYOL-ULQDDVLXSA-N Phe-His-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SWCOXQLDICUYOL-ULQDDVLXSA-N 0.000 description 1
- RVRRHFPCEOVRKQ-KKUMJFAQSA-N Phe-His-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CC(=O)N)C(=O)O)N RVRRHFPCEOVRKQ-KKUMJFAQSA-N 0.000 description 1
- ZKSLXIGKRJMALF-MGHWNKPDSA-N Phe-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=CC=C2)N ZKSLXIGKRJMALF-MGHWNKPDSA-N 0.000 description 1
- GYEPCBNTTRORKW-PCBIJLKTSA-N Phe-Ile-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O GYEPCBNTTRORKW-PCBIJLKTSA-N 0.000 description 1
- GXDPQJUBLBZKDY-IAVJCBSLSA-N Phe-Ile-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GXDPQJUBLBZKDY-IAVJCBSLSA-N 0.000 description 1
- WEMYTDDMDBLPMI-DKIMLUQUSA-N Phe-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N WEMYTDDMDBLPMI-DKIMLUQUSA-N 0.000 description 1
- CWFGECHCRMGPPT-MXAVVETBSA-N Phe-Ile-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O CWFGECHCRMGPPT-MXAVVETBSA-N 0.000 description 1
- JQLQUPIYYJXZLJ-ZEWNOJEFSA-N Phe-Ile-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 JQLQUPIYYJXZLJ-ZEWNOJEFSA-N 0.000 description 1
- LRBSWBVUCLLRLU-BZSNNMDCSA-N Phe-Leu-Lys Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1ccccc1)C(=O)N[C@@H](CCCCN)C(O)=O LRBSWBVUCLLRLU-BZSNNMDCSA-N 0.000 description 1
- KPEIBEPEUAZWNS-ULQDDVLXSA-N Phe-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KPEIBEPEUAZWNS-ULQDDVLXSA-N 0.000 description 1
- YCCUXNNKXDGMAM-KKUMJFAQSA-N Phe-Leu-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YCCUXNNKXDGMAM-KKUMJFAQSA-N 0.000 description 1
- INHMISZWLJZQGH-ULQDDVLXSA-N Phe-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 INHMISZWLJZQGH-ULQDDVLXSA-N 0.000 description 1
- OQTDZEJJWWAGJT-KKUMJFAQSA-N Phe-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O OQTDZEJJWWAGJT-KKUMJFAQSA-N 0.000 description 1
- WLYPRKLMRIYGPP-JYJNAYRXSA-N Phe-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 WLYPRKLMRIYGPP-JYJNAYRXSA-N 0.000 description 1
- DOXQMJCSSYZSNM-BZSNNMDCSA-N Phe-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O DOXQMJCSSYZSNM-BZSNNMDCSA-N 0.000 description 1
- XZQYIJALMGEUJD-OEAJRASXSA-N Phe-Lys-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XZQYIJALMGEUJD-OEAJRASXSA-N 0.000 description 1
- GPSMLZQVIIYLDK-ULQDDVLXSA-N Phe-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O GPSMLZQVIIYLDK-ULQDDVLXSA-N 0.000 description 1
- YOFKMVUAZGPFCF-IHRRRGAJSA-N Phe-Met-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(O)=O YOFKMVUAZGPFCF-IHRRRGAJSA-N 0.000 description 1
- LYCOGHUNJCETDK-JYJNAYRXSA-N Phe-Met-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N LYCOGHUNJCETDK-JYJNAYRXSA-N 0.000 description 1
- JKJSIYKSGIDHPM-WBAXXEDZSA-N Phe-Phe-Ala Chemical compound C[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O JKJSIYKSGIDHPM-WBAXXEDZSA-N 0.000 description 1
- KAJLHCWRWDSROH-BZSNNMDCSA-N Phe-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=CC=C1 KAJLHCWRWDSROH-BZSNNMDCSA-N 0.000 description 1
- IWZRODDWOSIXPZ-IRXDYDNUSA-N Phe-Phe-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)NCC(O)=O)C1=CC=CC=C1 IWZRODDWOSIXPZ-IRXDYDNUSA-N 0.000 description 1
- MGLBSROLWAWCKN-FCLVOEFKSA-N Phe-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MGLBSROLWAWCKN-FCLVOEFKSA-N 0.000 description 1
- DSXPMZMSJHOKKK-HJOGWXRNSA-N Phe-Phe-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O DSXPMZMSJHOKKK-HJOGWXRNSA-N 0.000 description 1
- WEQJQNWXCSUVMA-RYUDHWBXSA-N Phe-Pro Chemical compound C([C@H]([NH3+])C(=O)N1[C@@H](CCC1)C([O-])=O)C1=CC=CC=C1 WEQJQNWXCSUVMA-RYUDHWBXSA-N 0.000 description 1
- WWPAHTZOWURIMR-ULQDDVLXSA-N Phe-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 WWPAHTZOWURIMR-ULQDDVLXSA-N 0.000 description 1
- NJJBATPLUQHRBM-IHRRRGAJSA-N Phe-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CO)C(=O)O NJJBATPLUQHRBM-IHRRRGAJSA-N 0.000 description 1
- AFNJAQVMTIQTCB-DLOVCJGASA-N Phe-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 AFNJAQVMTIQTCB-DLOVCJGASA-N 0.000 description 1
- YMIZSYUAZJSOFL-SRVKXCTJSA-N Phe-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O YMIZSYUAZJSOFL-SRVKXCTJSA-N 0.000 description 1
- IAOZOFPONWDXNT-IXOXFDKPSA-N Phe-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IAOZOFPONWDXNT-IXOXFDKPSA-N 0.000 description 1
- LTAWNJXSRUCFAN-UNQGMJICSA-N Phe-Thr-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LTAWNJXSRUCFAN-UNQGMJICSA-N 0.000 description 1
- JHSRGEODDALISP-XVSYOHENSA-N Phe-Thr-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O JHSRGEODDALISP-XVSYOHENSA-N 0.000 description 1
- KLYYKKGCPOGDPE-OEAJRASXSA-N Phe-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O KLYYKKGCPOGDPE-OEAJRASXSA-N 0.000 description 1
- SHUFSZDAIPLZLF-BEAPCOKYSA-N Phe-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O SHUFSZDAIPLZLF-BEAPCOKYSA-N 0.000 description 1
- YFXXRYFWJFQAFW-JHYOHUSXSA-N Phe-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O YFXXRYFWJFQAFW-JHYOHUSXSA-N 0.000 description 1
- ZVJGAXNBBKPYOE-HKUYNNGSSA-N Phe-Trp-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)NCC(O)=O)C1=CC=CC=C1 ZVJGAXNBBKPYOE-HKUYNNGSSA-N 0.000 description 1
- QTDBZORPVYTRJU-KKXDTOCCSA-N Phe-Tyr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O QTDBZORPVYTRJU-KKXDTOCCSA-N 0.000 description 1
- FRMKIPSIZSFTTE-HJOGWXRNSA-N Phe-Tyr-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FRMKIPSIZSFTTE-HJOGWXRNSA-N 0.000 description 1
- GOUWCZRDTWTODO-YDHLFZDLSA-N Phe-Val-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O GOUWCZRDTWTODO-YDHLFZDLSA-N 0.000 description 1
- GNZCMRRSXOBHLC-JYJNAYRXSA-N Phe-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N GNZCMRRSXOBHLC-JYJNAYRXSA-N 0.000 description 1
- VDTYRPWRWRCROL-UFYCRDLUSA-N Phe-Val-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 VDTYRPWRWRCROL-UFYCRDLUSA-N 0.000 description 1
- VIIRRNQMMIHYHQ-XHSDSOJGSA-N Phe-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N VIIRRNQMMIHYHQ-XHSDSOJGSA-N 0.000 description 1
- IEIFEYBAYFSRBQ-IHRRRGAJSA-N Phe-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N IEIFEYBAYFSRBQ-IHRRRGAJSA-N 0.000 description 1
- GAMLAXHLYGLQBJ-UFYCRDLUSA-N Phe-Val-Tyr Chemical compound N[C@H](C(=O)N[C@H](C(=O)N[C@H](C(=O)O)CC1=CC=C(C=C1)O)C(C)C)CC1=CC=CC=C1 GAMLAXHLYGLQBJ-UFYCRDLUSA-N 0.000 description 1
- APZNYJFGVAGFCF-JYJNAYRXSA-N Phe-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccccc1)C(C)C)C(O)=O APZNYJFGVAGFCF-JYJNAYRXSA-N 0.000 description 1
- 108010051456 Plasminogen Proteins 0.000 description 1
- 102000013566 Plasminogen Human genes 0.000 description 1
- 229920001213 Polysorbate 20 Polymers 0.000 description 1
- 239000004793 Polystyrene Substances 0.000 description 1
- 241000605862 Porphyromonas gingivalis Species 0.000 description 1
- KIZQGKLMXKGDIV-BQBZGAKWSA-N Pro-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 KIZQGKLMXKGDIV-BQBZGAKWSA-N 0.000 description 1
- CQZNGNCAIXMAIQ-UBHSHLNASA-N Pro-Ala-Phe Chemical compound C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O CQZNGNCAIXMAIQ-UBHSHLNASA-N 0.000 description 1
- XQLBWXHVZVBNJM-FXQIFTODSA-N Pro-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 XQLBWXHVZVBNJM-FXQIFTODSA-N 0.000 description 1
- ONPFOYPPPOHMNH-UVBJJODRSA-N Pro-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@@H]3CCCN3 ONPFOYPPPOHMNH-UVBJJODRSA-N 0.000 description 1
- LCRSGSIRKLXZMZ-BPNCWPANSA-N Pro-Ala-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LCRSGSIRKLXZMZ-BPNCWPANSA-N 0.000 description 1
- OOLOTUZJUBOMAX-GUBZILKMSA-N Pro-Ala-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O OOLOTUZJUBOMAX-GUBZILKMSA-N 0.000 description 1
- QBFONMUYNSNKIX-AVGNSLFASA-N Pro-Arg-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O QBFONMUYNSNKIX-AVGNSLFASA-N 0.000 description 1
- ORPZXBQTEHINPB-SRVKXCTJSA-N Pro-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H]1CCCN1)C(O)=O ORPZXBQTEHINPB-SRVKXCTJSA-N 0.000 description 1
- UVKNEILZSJMKSR-FXQIFTODSA-N Pro-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 UVKNEILZSJMKSR-FXQIFTODSA-N 0.000 description 1
- MLQVJYMFASXBGZ-IHRRRGAJSA-N Pro-Asn-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O MLQVJYMFASXBGZ-IHRRRGAJSA-N 0.000 description 1
- SGCZFWSQERRKBD-BQBZGAKWSA-N Pro-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 SGCZFWSQERRKBD-BQBZGAKWSA-N 0.000 description 1
- GDXZRWYXJSGWIV-GMOBBJLQSA-N Pro-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 GDXZRWYXJSGWIV-GMOBBJLQSA-N 0.000 description 1
- SFECXGVELZFBFJ-VEVYYDQMSA-N Pro-Asp-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SFECXGVELZFBFJ-VEVYYDQMSA-N 0.000 description 1
- ODPIUQVTULPQEP-CIUDSAMLSA-N Pro-Gln-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@@H]1CCCN1 ODPIUQVTULPQEP-CIUDSAMLSA-N 0.000 description 1
- LANQLYHLMYDWJP-SRVKXCTJSA-N Pro-Gln-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O LANQLYHLMYDWJP-SRVKXCTJSA-N 0.000 description 1
- KTFZQPLSPLWLKN-KKUMJFAQSA-N Pro-Gln-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KTFZQPLSPLWLKN-KKUMJFAQSA-N 0.000 description 1
- UAYHMOIGIQZLFR-NHCYSSNCSA-N Pro-Gln-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UAYHMOIGIQZLFR-NHCYSSNCSA-N 0.000 description 1
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 1
- WVOXLKUUVCCCSU-ZPFDUUQYSA-N Pro-Glu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVOXLKUUVCCCSU-ZPFDUUQYSA-N 0.000 description 1
- VOZIBWWZSBIXQN-SRVKXCTJSA-N Pro-Glu-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O VOZIBWWZSBIXQN-SRVKXCTJSA-N 0.000 description 1
- WFHYFCWBLSKEMS-KKUMJFAQSA-N Pro-Glu-Phe Chemical compound N([C@@H](CCC(=O)O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 WFHYFCWBLSKEMS-KKUMJFAQSA-N 0.000 description 1
- UEHYFUCOGHWASA-HJGDQZAQSA-N Pro-Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 UEHYFUCOGHWASA-HJGDQZAQSA-N 0.000 description 1
- QGOZJLYCGRYYRW-KKUMJFAQSA-N Pro-Glu-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QGOZJLYCGRYYRW-KKUMJFAQSA-N 0.000 description 1
- VPEVBAUSTBWQHN-NHCYSSNCSA-N Pro-Glu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O VPEVBAUSTBWQHN-NHCYSSNCSA-N 0.000 description 1
- FEPSEIDIPBMIOS-QXEWZRGKSA-N Pro-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEPSEIDIPBMIOS-QXEWZRGKSA-N 0.000 description 1
- UIMCLYYSUCIUJM-UWVGGRQHSA-N Pro-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 UIMCLYYSUCIUJM-UWVGGRQHSA-N 0.000 description 1
- QEWBZBLXDKIQPS-STQMWFEESA-N Pro-Gly-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QEWBZBLXDKIQPS-STQMWFEESA-N 0.000 description 1
- SSWJYJHXQOYTSP-SRVKXCTJSA-N Pro-His-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O SSWJYJHXQOYTSP-SRVKXCTJSA-N 0.000 description 1
- STASJMBVVHNWCG-IHRRRGAJSA-N Pro-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 STASJMBVVHNWCG-IHRRRGAJSA-N 0.000 description 1
- KWMUAKQOVYCQJQ-ZPFDUUQYSA-N Pro-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@@H]1CCCN1 KWMUAKQOVYCQJQ-ZPFDUUQYSA-N 0.000 description 1
- XYHMFGGWNOFUOU-QXEWZRGKSA-N Pro-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 XYHMFGGWNOFUOU-QXEWZRGKSA-N 0.000 description 1
- LXLFEIHKWGHJJB-XUXIUFHCSA-N Pro-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 LXLFEIHKWGHJJB-XUXIUFHCSA-N 0.000 description 1
- FMLRRBDLBJLJIK-DCAQKATOSA-N Pro-Leu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FMLRRBDLBJLJIK-DCAQKATOSA-N 0.000 description 1
- YXHYJEPDKSYPSQ-AVGNSLFASA-N Pro-Leu-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 YXHYJEPDKSYPSQ-AVGNSLFASA-N 0.000 description 1
- CLJLVCYFABNTHP-DCAQKATOSA-N Pro-Leu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O CLJLVCYFABNTHP-DCAQKATOSA-N 0.000 description 1
- FXGIMYRVJJEIIM-UWVGGRQHSA-N Pro-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FXGIMYRVJJEIIM-UWVGGRQHSA-N 0.000 description 1
- FYPGHGXAOZTOBO-IHRRRGAJSA-N Pro-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 FYPGHGXAOZTOBO-IHRRRGAJSA-N 0.000 description 1
- XYSXOCIWCPFOCG-IHRRRGAJSA-N Pro-Leu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XYSXOCIWCPFOCG-IHRRRGAJSA-N 0.000 description 1
- DRKAXLDECUGLFE-ULQDDVLXSA-N Pro-Leu-Phe Chemical compound CC(C)C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O DRKAXLDECUGLFE-ULQDDVLXSA-N 0.000 description 1
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 1
- SRBFGSGDNNQABI-FHWLQOOXSA-N Pro-Leu-Trp Chemical compound N([C@@H](CC(C)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C(=O)[C@@H]1CCCN1 SRBFGSGDNNQABI-FHWLQOOXSA-N 0.000 description 1
- OFGUOWQVEGTVNU-DCAQKATOSA-N Pro-Lys-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OFGUOWQVEGTVNU-DCAQKATOSA-N 0.000 description 1
- ZLXKLMHAMDENIO-DCAQKATOSA-N Pro-Lys-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLXKLMHAMDENIO-DCAQKATOSA-N 0.000 description 1
- ULWBBFKQBDNGOY-RWMBFGLXSA-N Pro-Lys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N2CCC[C@@H]2C(=O)O ULWBBFKQBDNGOY-RWMBFGLXSA-N 0.000 description 1
- WFIVLLFYUZZWOD-RHYQMDGZSA-N Pro-Lys-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WFIVLLFYUZZWOD-RHYQMDGZSA-N 0.000 description 1
- WCNVGGZRTNHOOS-ULQDDVLXSA-N Pro-Lys-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O WCNVGGZRTNHOOS-ULQDDVLXSA-N 0.000 description 1
- NTXFLJULRHQMDC-GUBZILKMSA-N Pro-Met-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@@H]1CCCN1 NTXFLJULRHQMDC-GUBZILKMSA-N 0.000 description 1
- QCMYJBKTMIWZAP-AVGNSLFASA-N Pro-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 QCMYJBKTMIWZAP-AVGNSLFASA-N 0.000 description 1
- AUYKOPJPKUCYHE-SRVKXCTJSA-N Pro-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@@H]1CCCN1 AUYKOPJPKUCYHE-SRVKXCTJSA-N 0.000 description 1
- GNADVDLLGVSXLS-ULQDDVLXSA-N Pro-Phe-His Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O GNADVDLLGVSXLS-ULQDDVLXSA-N 0.000 description 1
- SPLBRAKYXGOFSO-UNQGMJICSA-N Pro-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@@H]2CCCN2)O SPLBRAKYXGOFSO-UNQGMJICSA-N 0.000 description 1
- XYAFCOJKICBRDU-JYJNAYRXSA-N Pro-Phe-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O XYAFCOJKICBRDU-JYJNAYRXSA-N 0.000 description 1
- KDBHVPXBQADZKY-GUBZILKMSA-N Pro-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KDBHVPXBQADZKY-GUBZILKMSA-N 0.000 description 1
- GFHOSBYCLACKEK-GUBZILKMSA-N Pro-Pro-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O GFHOSBYCLACKEK-GUBZILKMSA-N 0.000 description 1
- SVXXJYJCRNKDDE-AVGNSLFASA-N Pro-Pro-His Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CN=CN1 SVXXJYJCRNKDDE-AVGNSLFASA-N 0.000 description 1
- KBUAPZAZPWNYSW-SRVKXCTJSA-N Pro-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KBUAPZAZPWNYSW-SRVKXCTJSA-N 0.000 description 1
- GOMUXSCOIWIJFP-GUBZILKMSA-N Pro-Ser-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GOMUXSCOIWIJFP-GUBZILKMSA-N 0.000 description 1
- OWQXAJQZLWHPBH-FXQIFTODSA-N Pro-Ser-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O OWQXAJQZLWHPBH-FXQIFTODSA-N 0.000 description 1
- SEZGGSHLMROBFX-CIUDSAMLSA-N Pro-Ser-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O SEZGGSHLMROBFX-CIUDSAMLSA-N 0.000 description 1
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 1
- IURWWZYKYPEANQ-HJGDQZAQSA-N Pro-Thr-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O IURWWZYKYPEANQ-HJGDQZAQSA-N 0.000 description 1
- DCHQYSOGURGJST-FJXKBIBVSA-N Pro-Thr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O DCHQYSOGURGJST-FJXKBIBVSA-N 0.000 description 1
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 1
- AIOWVDNPESPXRB-YTWAJWBKSA-N Pro-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2)O AIOWVDNPESPXRB-YTWAJWBKSA-N 0.000 description 1
- RMJZWERKFFNNNS-XGEHTFHBSA-N Pro-Thr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMJZWERKFFNNNS-XGEHTFHBSA-N 0.000 description 1
- CXGLFEOYCJFKPR-RCWTZXSCSA-N Pro-Thr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O CXGLFEOYCJFKPR-RCWTZXSCSA-N 0.000 description 1
- VGFFUEVZKRNRHT-ULQDDVLXSA-N Pro-Trp-Glu Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CCC(=O)O)C(=O)O VGFFUEVZKRNRHT-ULQDDVLXSA-N 0.000 description 1
- CWZUFLWPEFHWEI-IHRRRGAJSA-N Pro-Tyr-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O CWZUFLWPEFHWEI-IHRRRGAJSA-N 0.000 description 1
- LZHHZYDPMZEMRX-STQMWFEESA-N Pro-Tyr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O LZHHZYDPMZEMRX-STQMWFEESA-N 0.000 description 1
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 1
- ZAUHSLVPDLNTRZ-QXEWZRGKSA-N Pro-Val-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZAUHSLVPDLNTRZ-QXEWZRGKSA-N 0.000 description 1
- KHRLUIPIMIQFGT-AVGNSLFASA-N Pro-Val-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHRLUIPIMIQFGT-AVGNSLFASA-N 0.000 description 1
- IIRBTQHFVNGPMQ-AVGNSLFASA-N Pro-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 IIRBTQHFVNGPMQ-AVGNSLFASA-N 0.000 description 1
- VDHGTOHMHHQSKG-JYJNAYRXSA-N Pro-Val-Phe Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O VDHGTOHMHHQSKG-JYJNAYRXSA-N 0.000 description 1
- PGSWNLRYYONGPE-JYJNAYRXSA-N Pro-Val-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PGSWNLRYYONGPE-JYJNAYRXSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 108010026552 Proteome Proteins 0.000 description 1
- 241000589517 Pseudomonas aeruginosa Species 0.000 description 1
- 108010079005 RDV peptide Proteins 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- MMGJPDWSIOAGTH-ACZMJKKPSA-N Ser-Ala-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MMGJPDWSIOAGTH-ACZMJKKPSA-N 0.000 description 1
- WTWGOQRNRFHFQD-JBDRJPRFSA-N Ser-Ala-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WTWGOQRNRFHFQD-JBDRJPRFSA-N 0.000 description 1
- WTUJZHKANPDPIN-CIUDSAMLSA-N Ser-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N WTUJZHKANPDPIN-CIUDSAMLSA-N 0.000 description 1
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 1
- QEDMOZUJTGEIBF-FXQIFTODSA-N Ser-Arg-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O QEDMOZUJTGEIBF-FXQIFTODSA-N 0.000 description 1
- KYKKKSWGEPFUMR-NAKRPEOUSA-N Ser-Arg-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KYKKKSWGEPFUMR-NAKRPEOUSA-N 0.000 description 1
- QGMLKFGTGXWAHF-IHRRRGAJSA-N Ser-Arg-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QGMLKFGTGXWAHF-IHRRRGAJSA-N 0.000 description 1
- OYEDZGNMSBZCIM-XGEHTFHBSA-N Ser-Arg-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OYEDZGNMSBZCIM-XGEHTFHBSA-N 0.000 description 1
- YMEXHZTVKDAKIY-GHCJXIJMSA-N Ser-Asn-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO)C(O)=O YMEXHZTVKDAKIY-GHCJXIJMSA-N 0.000 description 1
- FIDMVVBUOCMMJG-CIUDSAMLSA-N Ser-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO FIDMVVBUOCMMJG-CIUDSAMLSA-N 0.000 description 1
- UGJRQLURDVGULT-LKXGYXEUSA-N Ser-Asn-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UGJRQLURDVGULT-LKXGYXEUSA-N 0.000 description 1
- KNZQGAUEYZJUSQ-ZLUOBGJFSA-N Ser-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N KNZQGAUEYZJUSQ-ZLUOBGJFSA-N 0.000 description 1
- OHKLFYXEOGGGCK-ZLUOBGJFSA-N Ser-Asp-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OHKLFYXEOGGGCK-ZLUOBGJFSA-N 0.000 description 1
- MESDJCNHLZBMEP-ZLUOBGJFSA-N Ser-Asp-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MESDJCNHLZBMEP-ZLUOBGJFSA-N 0.000 description 1
- MMAPOBOTRUVNKJ-ZLUOBGJFSA-N Ser-Asp-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O MMAPOBOTRUVNKJ-ZLUOBGJFSA-N 0.000 description 1
- SWSRFJZZMNLMLY-ZKWXMUAHSA-N Ser-Asp-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O SWSRFJZZMNLMLY-ZKWXMUAHSA-N 0.000 description 1
- ULVMNZOKDBHKKI-ACZMJKKPSA-N Ser-Gln-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ULVMNZOKDBHKKI-ACZMJKKPSA-N 0.000 description 1
- XWCYBVBLJRWOFR-WDSKDSINSA-N Ser-Gln-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O XWCYBVBLJRWOFR-WDSKDSINSA-N 0.000 description 1
- DGHFNYXVIXNNMC-GUBZILKMSA-N Ser-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N DGHFNYXVIXNNMC-GUBZILKMSA-N 0.000 description 1
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 1
- VMVNCJDKFOQOHM-GUBZILKMSA-N Ser-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N VMVNCJDKFOQOHM-GUBZILKMSA-N 0.000 description 1
- BQWCDDAISCPDQV-XHNCKOQMSA-N Ser-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N)C(=O)O BQWCDDAISCPDQV-XHNCKOQMSA-N 0.000 description 1
- DGPGKMKUNGKHPK-QEJZJMRPSA-N Ser-Gln-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N DGPGKMKUNGKHPK-QEJZJMRPSA-N 0.000 description 1
- SMIDBHKWSYUBRZ-ACZMJKKPSA-N Ser-Glu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O SMIDBHKWSYUBRZ-ACZMJKKPSA-N 0.000 description 1
- UOLGINIHBRIECN-FXQIFTODSA-N Ser-Glu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UOLGINIHBRIECN-FXQIFTODSA-N 0.000 description 1
- YRBGKVIWMNEVCZ-WDSKDSINSA-N Ser-Glu-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YRBGKVIWMNEVCZ-WDSKDSINSA-N 0.000 description 1
- QKQDTEYDEIJPNK-GUBZILKMSA-N Ser-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO QKQDTEYDEIJPNK-GUBZILKMSA-N 0.000 description 1
- GRSLLFZTTLBOQX-CIUDSAMLSA-N Ser-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N GRSLLFZTTLBOQX-CIUDSAMLSA-N 0.000 description 1
- GZBKRJVCRMZAST-XKBZYTNZSA-N Ser-Glu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZBKRJVCRMZAST-XKBZYTNZSA-N 0.000 description 1
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 1
- AEGUWTFAQQWVLC-BQBZGAKWSA-N Ser-Gly-Arg Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEGUWTFAQQWVLC-BQBZGAKWSA-N 0.000 description 1
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 1
- IXCHOHLPHNGFTJ-YUMQZZPRSA-N Ser-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N IXCHOHLPHNGFTJ-YUMQZZPRSA-N 0.000 description 1
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 1
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 1
- RJHJPZQOMKCSTP-CIUDSAMLSA-N Ser-His-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O RJHJPZQOMKCSTP-CIUDSAMLSA-N 0.000 description 1
- IOVBCLGAJJXOHK-SRVKXCTJSA-N Ser-His-His Chemical compound C([C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IOVBCLGAJJXOHK-SRVKXCTJSA-N 0.000 description 1
- CICQXRWZNVXFCU-SRVKXCTJSA-N Ser-His-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O CICQXRWZNVXFCU-SRVKXCTJSA-N 0.000 description 1
- BKZYBLLIBOBOOW-GHCJXIJMSA-N Ser-Ile-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O BKZYBLLIBOBOOW-GHCJXIJMSA-N 0.000 description 1
- CJINPXGSKSZQNE-KBIXCLLPSA-N Ser-Ile-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O CJINPXGSKSZQNE-KBIXCLLPSA-N 0.000 description 1
- RIAKPZVSNBBNRE-BJDJZHNGSA-N Ser-Ile-Leu Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O RIAKPZVSNBBNRE-BJDJZHNGSA-N 0.000 description 1
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 1
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 1
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 1
- UBRMZSHOOIVJPW-SRVKXCTJSA-N Ser-Leu-Lys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O UBRMZSHOOIVJPW-SRVKXCTJSA-N 0.000 description 1
- VZQRNAYURWAEFE-KKUMJFAQSA-N Ser-Leu-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VZQRNAYURWAEFE-KKUMJFAQSA-N 0.000 description 1
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 1
- GVIGVIOEYBOTCB-XIRDDKMYSA-N Ser-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC(C)C)C(O)=O)=CNC2=C1 GVIGVIOEYBOTCB-XIRDDKMYSA-N 0.000 description 1
- GZSZPKSBVAOGIE-CIUDSAMLSA-N Ser-Lys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O GZSZPKSBVAOGIE-CIUDSAMLSA-N 0.000 description 1
- JLPMFVAIQHCBDC-CIUDSAMLSA-N Ser-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N JLPMFVAIQHCBDC-CIUDSAMLSA-N 0.000 description 1
- OWCVUSJMEBGMOK-YUMQZZPRSA-N Ser-Lys-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O OWCVUSJMEBGMOK-YUMQZZPRSA-N 0.000 description 1
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 1
- PTWIYDNFWPXQSD-GARJFASQSA-N Ser-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N)C(=O)O PTWIYDNFWPXQSD-GARJFASQSA-N 0.000 description 1
- PMCMLDNPAZUYGI-DCAQKATOSA-N Ser-Lys-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMCMLDNPAZUYGI-DCAQKATOSA-N 0.000 description 1
- ZGFRMNZZTOVBOU-CIUDSAMLSA-N Ser-Met-Gln Chemical compound N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)O ZGFRMNZZTOVBOU-CIUDSAMLSA-N 0.000 description 1
- ZSLFCBHEINFXRS-LPEHRKFASA-N Ser-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ZSLFCBHEINFXRS-LPEHRKFASA-N 0.000 description 1
- JJUNLJTUIKFPRF-BPUTZDHNSA-N Ser-Met-Trp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CO)N JJUNLJTUIKFPRF-BPUTZDHNSA-N 0.000 description 1
- FZEUTKVQGMVGHW-AVGNSLFASA-N Ser-Phe-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZEUTKVQGMVGHW-AVGNSLFASA-N 0.000 description 1
- NUEHQDHDLDXCRU-GUBZILKMSA-N Ser-Pro-Arg Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NUEHQDHDLDXCRU-GUBZILKMSA-N 0.000 description 1
- JLKWJWPDXPKKHI-FXQIFTODSA-N Ser-Pro-Asn Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CC(=O)N)C(=O)O JLKWJWPDXPKKHI-FXQIFTODSA-N 0.000 description 1
- PJIQEIFXZPCWOJ-FXQIFTODSA-N Ser-Pro-Asp Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O PJIQEIFXZPCWOJ-FXQIFTODSA-N 0.000 description 1
- BSXKBOUZDAZXHE-CIUDSAMLSA-N Ser-Pro-Glu Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O BSXKBOUZDAZXHE-CIUDSAMLSA-N 0.000 description 1
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 1
- GYDFRTRSSXOZCR-ACZMJKKPSA-N Ser-Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GYDFRTRSSXOZCR-ACZMJKKPSA-N 0.000 description 1
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 1
- JCLAFVNDBJMLBC-JBDRJPRFSA-N Ser-Ser-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JCLAFVNDBJMLBC-JBDRJPRFSA-N 0.000 description 1
- AABIBDJHSKIMJK-FXQIFTODSA-N Ser-Ser-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O AABIBDJHSKIMJK-FXQIFTODSA-N 0.000 description 1
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 1
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 1
- SZRNDHWMVSFPSP-XKBZYTNZSA-N Ser-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N)O SZRNDHWMVSFPSP-XKBZYTNZSA-N 0.000 description 1
- KKKVOZNCLALMPV-XKBZYTNZSA-N Ser-Thr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KKKVOZNCLALMPV-XKBZYTNZSA-N 0.000 description 1
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 1
- QNBVFKZSSRYNFX-CUJWVEQBSA-N Ser-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N)O QNBVFKZSSRYNFX-CUJWVEQBSA-N 0.000 description 1
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 1
- BDMWLJLPPUCLNV-XGEHTFHBSA-N Ser-Thr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BDMWLJLPPUCLNV-XGEHTFHBSA-N 0.000 description 1
- WMZVVNLPHFSUPA-BPUTZDHNSA-N Ser-Trp-Arg Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 WMZVVNLPHFSUPA-BPUTZDHNSA-N 0.000 description 1
- FVFUOQIYDPAIJR-XIRDDKMYSA-N Ser-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N FVFUOQIYDPAIJR-XIRDDKMYSA-N 0.000 description 1
- XPVIVVLLLOFBRH-XIRDDKMYSA-N Ser-Trp-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](Cc1c[nH]c2ccccc12)NC(=O)[C@@H](N)CO)C(O)=O XPVIVVLLLOFBRH-XIRDDKMYSA-N 0.000 description 1
- HAUVENOGHPECML-BPUTZDHNSA-N Ser-Trp-Val Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CO)=CNC2=C1 HAUVENOGHPECML-BPUTZDHNSA-N 0.000 description 1
- PQEQXWRVHQAAKS-SRVKXCTJSA-N Ser-Tyr-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CO)N)CC1=CC=C(O)C=C1 PQEQXWRVHQAAKS-SRVKXCTJSA-N 0.000 description 1
- UBTNVMGPMYDYIU-HJPIBITLSA-N Ser-Tyr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UBTNVMGPMYDYIU-HJPIBITLSA-N 0.000 description 1
- VVKVHAOOUGNDPJ-SRVKXCTJSA-N Ser-Tyr-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VVKVHAOOUGNDPJ-SRVKXCTJSA-N 0.000 description 1
- HAYADTTXNZFUDM-IHRRRGAJSA-N Ser-Tyr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O HAYADTTXNZFUDM-IHRRRGAJSA-N 0.000 description 1
- PCMZJFMUYWIERL-ZKWXMUAHSA-N Ser-Val-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PCMZJFMUYWIERL-ZKWXMUAHSA-N 0.000 description 1
- LLSLRQOEAFCZLW-NRPADANISA-N Ser-Val-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LLSLRQOEAFCZLW-NRPADANISA-N 0.000 description 1
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 1
- RCOUFINCYASMDN-GUBZILKMSA-N Ser-Val-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O RCOUFINCYASMDN-GUBZILKMSA-N 0.000 description 1
- HNDMFDBQXYZSRM-IHRRRGAJSA-N Ser-Val-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HNDMFDBQXYZSRM-IHRRRGAJSA-N 0.000 description 1
- SIEBDTCABMZCLF-XGEHTFHBSA-N Ser-Val-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SIEBDTCABMZCLF-XGEHTFHBSA-N 0.000 description 1
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 1
- VMHLLURERBWHNL-UHFFFAOYSA-M Sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 241000194048 Streptococcus equi Species 0.000 description 1
- 241000193998 Streptococcus pneumoniae Species 0.000 description 1
- 241000193996 Streptococcus pyogenes Species 0.000 description 1
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 1
- DDPVJPIGACCMEH-XQXXSGGOSA-N Thr-Ala-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DDPVJPIGACCMEH-XQXXSGGOSA-N 0.000 description 1
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 1
- TYVAWPFQYFPSBR-BFHQHQDPSA-N Thr-Ala-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)NCC(O)=O TYVAWPFQYFPSBR-BFHQHQDPSA-N 0.000 description 1
- PXQUBKWZENPDGE-CIQUZCHMSA-N Thr-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)O)N PXQUBKWZENPDGE-CIQUZCHMSA-N 0.000 description 1
- CAGTXGDOIFXLPC-KZVJFYERSA-N Thr-Arg-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CCCN=C(N)N CAGTXGDOIFXLPC-KZVJFYERSA-N 0.000 description 1
- NAXBBCLCEOTAIG-RHYQMDGZSA-N Thr-Arg-Lys Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O NAXBBCLCEOTAIG-RHYQMDGZSA-N 0.000 description 1
- UTSWGQNAQRIHAI-UNQGMJICSA-N Thr-Arg-Phe Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 UTSWGQNAQRIHAI-UNQGMJICSA-N 0.000 description 1
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 1
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 1
- IRKWVRSEQFTGGV-VEVYYDQMSA-N Thr-Asn-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IRKWVRSEQFTGGV-VEVYYDQMSA-N 0.000 description 1
- YLXAMFZYJTZXFH-OLHMAJIHSA-N Thr-Asn-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O YLXAMFZYJTZXFH-OLHMAJIHSA-N 0.000 description 1
- QGXCWPNQVCYJEL-NUMRIWBASA-N Thr-Asn-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGXCWPNQVCYJEL-NUMRIWBASA-N 0.000 description 1
- TZKPNGDGUVREEB-FOHZUACHSA-N Thr-Asn-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O TZKPNGDGUVREEB-FOHZUACHSA-N 0.000 description 1
- JTEICXDKGWKRRV-HJGDQZAQSA-N Thr-Asn-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O JTEICXDKGWKRRV-HJGDQZAQSA-N 0.000 description 1
- PQLXHSACXPGWPD-GSSVUCPTSA-N Thr-Asn-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PQLXHSACXPGWPD-GSSVUCPTSA-N 0.000 description 1
- JVTHIXKSVYEWNI-JRQIVUDYSA-N Thr-Asn-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JVTHIXKSVYEWNI-JRQIVUDYSA-N 0.000 description 1
- LMMDEZPNUTZJAY-GCJQMDKQSA-N Thr-Asp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O LMMDEZPNUTZJAY-GCJQMDKQSA-N 0.000 description 1
- KRPKYGOFYUNIGM-XVSYOHENSA-N Thr-Asp-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O KRPKYGOFYUNIGM-XVSYOHENSA-N 0.000 description 1
- OHAJHDJOCKKJLV-LKXGYXEUSA-N Thr-Asp-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OHAJHDJOCKKJLV-LKXGYXEUSA-N 0.000 description 1
- VUKVQVNKIIZBPO-HOUAVDHOSA-N Thr-Asp-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O VUKVQVNKIIZBPO-HOUAVDHOSA-N 0.000 description 1
- DCLBXIWHLVEPMQ-JRQIVUDYSA-N Thr-Asp-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 DCLBXIWHLVEPMQ-JRQIVUDYSA-N 0.000 description 1
- KZUJCMPVNXOBAF-LKXGYXEUSA-N Thr-Cys-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O KZUJCMPVNXOBAF-LKXGYXEUSA-N 0.000 description 1
- OYTNZCBFDXGQGE-XQXXSGGOSA-N Thr-Gln-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O OYTNZCBFDXGQGE-XQXXSGGOSA-N 0.000 description 1
- LAFLAXHTDVNVEL-WDCWCFNPSA-N Thr-Gln-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O LAFLAXHTDVNVEL-WDCWCFNPSA-N 0.000 description 1
- KGKWKSSSQGGYAU-SUSMZKCASA-N Thr-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KGKWKSSSQGGYAU-SUSMZKCASA-N 0.000 description 1
- DXNUZQGVOMCGNS-SWRJLBSHSA-N Thr-Gln-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O DXNUZQGVOMCGNS-SWRJLBSHSA-N 0.000 description 1
- VGYBYGQXZJDZJU-XQXXSGGOSA-N Thr-Glu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VGYBYGQXZJDZJU-XQXXSGGOSA-N 0.000 description 1
- FHDLKMFZKRUQCE-HJGDQZAQSA-N Thr-Glu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHDLKMFZKRUQCE-HJGDQZAQSA-N 0.000 description 1
- UDQBCBUXAQIZAK-GLLZPBPUSA-N Thr-Glu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDQBCBUXAQIZAK-GLLZPBPUSA-N 0.000 description 1
- SHOMROOOQBDGRL-JHEQGTHGSA-N Thr-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SHOMROOOQBDGRL-JHEQGTHGSA-N 0.000 description 1
- KBLYJPQSNGTDIU-LOKLDPHHSA-N Thr-Glu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O KBLYJPQSNGTDIU-LOKLDPHHSA-N 0.000 description 1
- ONNSECRQFSTMCC-XKBZYTNZSA-N Thr-Glu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ONNSECRQFSTMCC-XKBZYTNZSA-N 0.000 description 1
- XOTBWOCSLMBGMF-SUSMZKCASA-N Thr-Glu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOTBWOCSLMBGMF-SUSMZKCASA-N 0.000 description 1
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 1
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 1
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 1
- KBBRNEDOYWMIJP-KYNKHSRBSA-N Thr-Gly-Thr Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KBBRNEDOYWMIJP-KYNKHSRBSA-N 0.000 description 1
- AYCQVUUPIJHJTA-IXOXFDKPSA-N Thr-His-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O AYCQVUUPIJHJTA-IXOXFDKPSA-N 0.000 description 1
- FKIGTIXHSRNKJU-IXOXFDKPSA-N Thr-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@H](O)C)CC1=CN=CN1 FKIGTIXHSRNKJU-IXOXFDKPSA-N 0.000 description 1
- KLCCPYZXGXHAGS-QTKMDUPCSA-N Thr-His-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCSC)C(=O)O)N)O KLCCPYZXGXHAGS-QTKMDUPCSA-N 0.000 description 1
- YUPVPKZBKCLFLT-QTKMDUPCSA-N Thr-His-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C(C)C)C(=O)O)N)O YUPVPKZBKCLFLT-QTKMDUPCSA-N 0.000 description 1
- FQPDRTDDEZXCEC-SVSWQMSJSA-N Thr-Ile-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O FQPDRTDDEZXCEC-SVSWQMSJSA-N 0.000 description 1
- GXUWHVZYDAHFSV-FLBSBUHZSA-N Thr-Ile-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GXUWHVZYDAHFSV-FLBSBUHZSA-N 0.000 description 1
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 1
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 1
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 1
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 1
- ISLDRLHVPXABBC-IEGACIPQSA-N Thr-Leu-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ISLDRLHVPXABBC-IEGACIPQSA-N 0.000 description 1
- KRDSCBLRHORMRK-JXUBOQSCSA-N Thr-Lys-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O KRDSCBLRHORMRK-JXUBOQSCSA-N 0.000 description 1
- TZJSEJOXAIWOST-RHYQMDGZSA-N Thr-Lys-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N TZJSEJOXAIWOST-RHYQMDGZSA-N 0.000 description 1
- BDGBHYCAZJPLHX-HJGDQZAQSA-N Thr-Lys-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BDGBHYCAZJPLHX-HJGDQZAQSA-N 0.000 description 1
- ZSPQUTWLWGWTPS-HJGDQZAQSA-N Thr-Lys-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZSPQUTWLWGWTPS-HJGDQZAQSA-N 0.000 description 1
- QNCFWHZVRNXAKW-OEAJRASXSA-N Thr-Lys-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNCFWHZVRNXAKW-OEAJRASXSA-N 0.000 description 1
- QFCQNHITJPRQTB-IEGACIPQSA-N Thr-Lys-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O QFCQNHITJPRQTB-IEGACIPQSA-N 0.000 description 1
- UJQVSMNQMQHVRY-KZVJFYERSA-N Thr-Met-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O UJQVSMNQMQHVRY-KZVJFYERSA-N 0.000 description 1
- PCMDGXKXVMBIFP-VEVYYDQMSA-N Thr-Met-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(O)=O PCMDGXKXVMBIFP-VEVYYDQMSA-N 0.000 description 1
- KZURUCDWKDEAFZ-XVSYOHENSA-N Thr-Phe-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O KZURUCDWKDEAFZ-XVSYOHENSA-N 0.000 description 1
- BIBYEFRASCNLAA-CDMKHQONSA-N Thr-Phe-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 BIBYEFRASCNLAA-CDMKHQONSA-N 0.000 description 1
- VEIKMWOMUYMMMK-FCLVOEFKSA-N Thr-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 VEIKMWOMUYMMMK-FCLVOEFKSA-N 0.000 description 1
- MEBDIIKMUUNBSB-RPTUDFQQSA-N Thr-Phe-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MEBDIIKMUUNBSB-RPTUDFQQSA-N 0.000 description 1
- WTMPKZWHRCMMMT-KZVJFYERSA-N Thr-Pro-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WTMPKZWHRCMMMT-KZVJFYERSA-N 0.000 description 1
- NYQIZWROIMIQSL-VEVYYDQMSA-N Thr-Pro-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O NYQIZWROIMIQSL-VEVYYDQMSA-N 0.000 description 1
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 1
- MROIJTGJGIDEEJ-RCWTZXSCSA-N Thr-Pro-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 MROIJTGJGIDEEJ-RCWTZXSCSA-N 0.000 description 1
- IWAVRIPRTCJAQO-HSHDSVGOSA-N Thr-Pro-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IWAVRIPRTCJAQO-HSHDSVGOSA-N 0.000 description 1
- YGCDFAJJCRVQKU-RCWTZXSCSA-N Thr-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O YGCDFAJJCRVQKU-RCWTZXSCSA-N 0.000 description 1
- FWTFAZKJORVTIR-VZFHVOOUSA-N Thr-Ser-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O FWTFAZKJORVTIR-VZFHVOOUSA-N 0.000 description 1
- STUAPCLEDMKXKL-LKXGYXEUSA-N Thr-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O STUAPCLEDMKXKL-LKXGYXEUSA-N 0.000 description 1
- NQQMWWVVGIXUOX-SVSWQMSJSA-N Thr-Ser-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NQQMWWVVGIXUOX-SVSWQMSJSA-N 0.000 description 1
- IQPWNQRRAJHOKV-KATARQTJSA-N Thr-Ser-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN IQPWNQRRAJHOKV-KATARQTJSA-N 0.000 description 1
- VUXIQSUQQYNLJP-XAVMHZPKSA-N Thr-Ser-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N)O VUXIQSUQQYNLJP-XAVMHZPKSA-N 0.000 description 1
- WPSKTVVMQCXPRO-BWBBJGPYSA-N Thr-Ser-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WPSKTVVMQCXPRO-BWBBJGPYSA-N 0.000 description 1
- GQPQJNMVELPZNQ-GBALPHGKSA-N Thr-Ser-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O GQPQJNMVELPZNQ-GBALPHGKSA-N 0.000 description 1
- HUPLKEHTTQBXSC-YJRXYDGGSA-N Thr-Ser-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUPLKEHTTQBXSC-YJRXYDGGSA-N 0.000 description 1
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 1
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 1
- NHQVWACSJZJCGJ-FLBSBUHZSA-N Thr-Thr-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NHQVWACSJZJCGJ-FLBSBUHZSA-N 0.000 description 1
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 1
- CSNBWOJOEOPYIJ-UVOCVTCTSA-N Thr-Thr-Lys Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O CSNBWOJOEOPYIJ-UVOCVTCTSA-N 0.000 description 1
- QJIODPFLAASXJC-JHYOHUSXSA-N Thr-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O QJIODPFLAASXJC-JHYOHUSXSA-N 0.000 description 1
- ZESGVALRVJIVLZ-VFCFLDTKSA-N Thr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O ZESGVALRVJIVLZ-VFCFLDTKSA-N 0.000 description 1
- VEENWOSZGWWKHW-SZZJOZGLSA-N Thr-Trp-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N)O VEENWOSZGWWKHW-SZZJOZGLSA-N 0.000 description 1
- PELIQFPESHBTMA-WLTAIBSBSA-N Thr-Tyr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 PELIQFPESHBTMA-WLTAIBSBSA-N 0.000 description 1
- RPECVQBNONKZAT-WZLNRYEVSA-N Thr-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H]([C@@H](C)O)N RPECVQBNONKZAT-WZLNRYEVSA-N 0.000 description 1
- JAWUQFCGNVEDRN-MEYUZBJRSA-N Thr-Tyr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O JAWUQFCGNVEDRN-MEYUZBJRSA-N 0.000 description 1
- CJEHCEOXPLASCK-MEYUZBJRSA-N Thr-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@H](O)C)CC1=CC=C(O)C=C1 CJEHCEOXPLASCK-MEYUZBJRSA-N 0.000 description 1
- XVHAUVJXBFGUPC-RPTUDFQQSA-N Thr-Tyr-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XVHAUVJXBFGUPC-RPTUDFQQSA-N 0.000 description 1
- CYCGARJWIQWPQM-YJRXYDGGSA-N Thr-Tyr-Ser Chemical compound C[C@@H](O)[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CO)C([O-])=O)CC1=CC=C(O)C=C1 CYCGARJWIQWPQM-YJRXYDGGSA-N 0.000 description 1
- LVRFMARKDGGZMX-IZPVPAKOSA-N Thr-Tyr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=C(O)C=C1 LVRFMARKDGGZMX-IZPVPAKOSA-N 0.000 description 1
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 1
- XGFYGMKZKFRGAI-RCWTZXSCSA-N Thr-Val-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XGFYGMKZKFRGAI-RCWTZXSCSA-N 0.000 description 1
- BKIOKSLLAAZYTC-KKHAAJSZSA-N Thr-Val-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O BKIOKSLLAAZYTC-KKHAAJSZSA-N 0.000 description 1
- KPMIQCXJDVKWKO-IFFSRLJSSA-N Thr-Val-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KPMIQCXJDVKWKO-IFFSRLJSSA-N 0.000 description 1
- BKVICMPZWRNWOC-RHYQMDGZSA-N Thr-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O BKVICMPZWRNWOC-RHYQMDGZSA-N 0.000 description 1
- 239000013504 Triton X-100 Substances 0.000 description 1
- 229920004890 Triton X-100 Polymers 0.000 description 1
- NMCBVGFGWSIGSB-NUTKFTJISA-N Trp-Ala-Leu Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NMCBVGFGWSIGSB-NUTKFTJISA-N 0.000 description 1
- AVYVKJMBNLPWRX-WFBYXXMGSA-N Trp-Ala-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 AVYVKJMBNLPWRX-WFBYXXMGSA-N 0.000 description 1
- DXDMNBJJEXYMLA-UBHSHLNASA-N Trp-Asn-Asp Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O)=CNC2=C1 DXDMNBJJEXYMLA-UBHSHLNASA-N 0.000 description 1
- BXKWZPXTTSCOMX-AQZXSJQPSA-N Trp-Asn-Thr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BXKWZPXTTSCOMX-AQZXSJQPSA-N 0.000 description 1
- IQGJAHMZWBTRIF-UBHSHLNASA-N Trp-Asp-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N IQGJAHMZWBTRIF-UBHSHLNASA-N 0.000 description 1
- VKMOGXREKGVZAF-QEJZJMRPSA-N Trp-Asp-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VKMOGXREKGVZAF-QEJZJMRPSA-N 0.000 description 1
- CZSMNLQMRWPGQF-XEGUGMAKSA-N Trp-Gln-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CZSMNLQMRWPGQF-XEGUGMAKSA-N 0.000 description 1
- DQDXHYIEITXNJY-BPUTZDHNSA-N Trp-Gln-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N DQDXHYIEITXNJY-BPUTZDHNSA-N 0.000 description 1
- WPSYJHFHZYJXMW-JSGCOSHPSA-N Trp-Gln-Gly Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O WPSYJHFHZYJXMW-JSGCOSHPSA-N 0.000 description 1
- LGEPIBQBGZTBHL-SXNHZJKMSA-N Trp-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N LGEPIBQBGZTBHL-SXNHZJKMSA-N 0.000 description 1
- MDDYTWOFHZFABW-SZMVWBNQSA-N Trp-Gln-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 MDDYTWOFHZFABW-SZMVWBNQSA-N 0.000 description 1
- GWQUSADRQCTMHN-NWLDYVSISA-N Trp-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O GWQUSADRQCTMHN-NWLDYVSISA-N 0.000 description 1
- LJCLHMPCYYXVPR-VJBMBRPKSA-N Trp-Gln-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O)N LJCLHMPCYYXVPR-VJBMBRPKSA-N 0.000 description 1
- OENGVSDBQHHGBU-QEJZJMRPSA-N Trp-Glu-Asn Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OENGVSDBQHHGBU-QEJZJMRPSA-N 0.000 description 1
- OBAMASZCXDIXSS-SZMVWBNQSA-N Trp-Glu-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N OBAMASZCXDIXSS-SZMVWBNQSA-N 0.000 description 1
- HRKOLWXWQSDMSK-XIRDDKMYSA-N Trp-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N HRKOLWXWQSDMSK-XIRDDKMYSA-N 0.000 description 1
- SNJAPSVIPKUMCK-NWLDYVSISA-N Trp-Glu-Thr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SNJAPSVIPKUMCK-NWLDYVSISA-N 0.000 description 1
- FNOQJVHFVLVMOS-AAEUAGOBSA-N Trp-Gly-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N FNOQJVHFVLVMOS-AAEUAGOBSA-N 0.000 description 1
- RPVDDQYNBOVWLR-HOCLYGCPSA-N Trp-Gly-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O RPVDDQYNBOVWLR-HOCLYGCPSA-N 0.000 description 1
- WSGPBCAGEGHKQJ-BBRMVZONSA-N Trp-Gly-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CNC2=CC=CC=C21)N WSGPBCAGEGHKQJ-BBRMVZONSA-N 0.000 description 1
- PGPCENKYTLDIFM-SZMVWBNQSA-N Trp-His-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O PGPCENKYTLDIFM-SZMVWBNQSA-N 0.000 description 1
- QEJHHFFFCUDPDV-WDSOQIARSA-N Trp-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N QEJHHFFFCUDPDV-WDSOQIARSA-N 0.000 description 1
- WNZRNOGHEONFMS-PXDAIIFMSA-N Trp-Ile-Tyr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O WNZRNOGHEONFMS-PXDAIIFMSA-N 0.000 description 1
- CXPJPTFWKXNDKV-NUTKFTJISA-N Trp-Leu-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 CXPJPTFWKXNDKV-NUTKFTJISA-N 0.000 description 1
- VPRHDRKAPYZMHL-SZMVWBNQSA-N Trp-Leu-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 VPRHDRKAPYZMHL-SZMVWBNQSA-N 0.000 description 1
- UKWSFUSPGPBJGU-VFAJRCTISA-N Trp-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O UKWSFUSPGPBJGU-VFAJRCTISA-N 0.000 description 1
- WMBFONUKQXGLMU-WDSOQIARSA-N Trp-Leu-Val Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N WMBFONUKQXGLMU-WDSOQIARSA-N 0.000 description 1
- NLLARHRWSFNEMH-NUTKFTJISA-N Trp-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NLLARHRWSFNEMH-NUTKFTJISA-N 0.000 description 1
- KRCPXGSWDOGHAM-XIRDDKMYSA-N Trp-Lys-Asp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O KRCPXGSWDOGHAM-XIRDDKMYSA-N 0.000 description 1
- NWQCKAPDGQMZQN-IHPCNDPISA-N Trp-Lys-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O NWQCKAPDGQMZQN-IHPCNDPISA-N 0.000 description 1
- LFMLXCJYCFZBKE-IHPCNDPISA-N Trp-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N LFMLXCJYCFZBKE-IHPCNDPISA-N 0.000 description 1
- OTJDEIZGUFRGLL-WIRXVTQYSA-N Trp-Phe-Trp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)NC(=O)[C@H](CC4=CNC5=CC=CC=C54)N OTJDEIZGUFRGLL-WIRXVTQYSA-N 0.000 description 1
- WSMVEHPVOYXPAQ-XIRDDKMYSA-N Trp-Ser-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N WSMVEHPVOYXPAQ-XIRDDKMYSA-N 0.000 description 1
- HHPSUFUXXBOFQY-AQZXSJQPSA-N Trp-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O HHPSUFUXXBOFQY-AQZXSJQPSA-N 0.000 description 1
- DYIXEGROAOVQPK-VFAJRCTISA-N Trp-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O DYIXEGROAOVQPK-VFAJRCTISA-N 0.000 description 1
- SGQSAIFDESQBRA-IHPCNDPISA-N Trp-Tyr-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SGQSAIFDESQBRA-IHPCNDPISA-N 0.000 description 1
- ZKVANNIVSDOQMG-HKUYNNGSSA-N Trp-Tyr-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)NCC(=O)O)N ZKVANNIVSDOQMG-HKUYNNGSSA-N 0.000 description 1
- XQMGDVVKFRLQKH-BBRMVZONSA-N Trp-Val-Gly Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O)=CNC2=C1 XQMGDVVKFRLQKH-BBRMVZONSA-N 0.000 description 1
- VNRTXOUAOUZCFW-WDSOQIARSA-N Trp-Val-His Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O VNRTXOUAOUZCFW-WDSOQIARSA-N 0.000 description 1
- SWSUXOKZKQRADK-FDARSICLSA-N Trp-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N SWSUXOKZKQRADK-FDARSICLSA-N 0.000 description 1
- MXKUGFHWYYKVDV-SZMVWBNQSA-N Trp-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(C)C)C(O)=O MXKUGFHWYYKVDV-SZMVWBNQSA-N 0.000 description 1
- 101710162629 Trypsin inhibitor Proteins 0.000 description 1
- 229940122618 Trypsin inhibitor Drugs 0.000 description 1
- 101800000716 Tumor necrosis factor, membrane form Proteins 0.000 description 1
- 102400000700 Tumor necrosis factor, membrane form Human genes 0.000 description 1
- IELISNUVHBKYBX-XDTLVQLUSA-N Tyr-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IELISNUVHBKYBX-XDTLVQLUSA-N 0.000 description 1
- DLZKEQQWXODGGZ-KWQFWETISA-N Tyr-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DLZKEQQWXODGGZ-KWQFWETISA-N 0.000 description 1
- LGEYOIQBBIPHQN-UWJYBYFXSA-N Tyr-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 LGEYOIQBBIPHQN-UWJYBYFXSA-N 0.000 description 1
- NOXKHHXSHQFSGJ-FQPOAREZSA-N Tyr-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NOXKHHXSHQFSGJ-FQPOAREZSA-N 0.000 description 1
- FBVGQXJIXFZKSQ-GMVOTWDCSA-N Tyr-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N FBVGQXJIXFZKSQ-GMVOTWDCSA-N 0.000 description 1
- IIJWXEUNETVJPV-IHRRRGAJSA-N Tyr-Arg-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N)O IIJWXEUNETVJPV-IHRRRGAJSA-N 0.000 description 1
- CKKFTIQYURNSEI-IHRRRGAJSA-N Tyr-Asn-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CKKFTIQYURNSEI-IHRRRGAJSA-N 0.000 description 1
- OEVJGIHPQOXYFE-SRVKXCTJSA-N Tyr-Asn-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O OEVJGIHPQOXYFE-SRVKXCTJSA-N 0.000 description 1
- AYHSJESDFKREAR-KKUMJFAQSA-N Tyr-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AYHSJESDFKREAR-KKUMJFAQSA-N 0.000 description 1
- AYPAIRCDLARHLM-KKUMJFAQSA-N Tyr-Asn-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O AYPAIRCDLARHLM-KKUMJFAQSA-N 0.000 description 1
- NRFTYDWKWGJLAR-MELADBBJSA-N Tyr-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O NRFTYDWKWGJLAR-MELADBBJSA-N 0.000 description 1
- FGJWNBBFAUHBEP-IHPCNDPISA-N Tyr-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N FGJWNBBFAUHBEP-IHPCNDPISA-N 0.000 description 1
- CRHFOYCJGVJPLE-AVGNSLFASA-N Tyr-Gln-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CRHFOYCJGVJPLE-AVGNSLFASA-N 0.000 description 1
- RYSNTWVRSLCAJZ-RYUDHWBXSA-N Tyr-Gln-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RYSNTWVRSLCAJZ-RYUDHWBXSA-N 0.000 description 1
- NQJDICVXXIMMMB-XDTLVQLUSA-N Tyr-Glu-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O NQJDICVXXIMMMB-XDTLVQLUSA-N 0.000 description 1
- XQYHLZNPOTXRMQ-KKUMJFAQSA-N Tyr-Glu-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XQYHLZNPOTXRMQ-KKUMJFAQSA-N 0.000 description 1
- LHTGRUZSZOIAKM-SOUVJXGZSA-N Tyr-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O LHTGRUZSZOIAKM-SOUVJXGZSA-N 0.000 description 1
- ZRPLVTZTKPPSBT-AVGNSLFASA-N Tyr-Glu-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZRPLVTZTKPPSBT-AVGNSLFASA-N 0.000 description 1
- JWGXUKHIKXZWNG-RYUDHWBXSA-N Tyr-Gly-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O JWGXUKHIKXZWNG-RYUDHWBXSA-N 0.000 description 1
- OLWFDNLLBWQWCP-STQMWFEESA-N Tyr-Gly-Met Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O OLWFDNLLBWQWCP-STQMWFEESA-N 0.000 description 1
- NOOMDULIORCDNF-IRXDYDNUSA-N Tyr-Gly-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NOOMDULIORCDNF-IRXDYDNUSA-N 0.000 description 1
- AZGZDDNKFFUDEH-QWRGUYRKSA-N Tyr-Gly-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AZGZDDNKFFUDEH-QWRGUYRKSA-N 0.000 description 1
- ULHJJQYGMWONTD-HKUYNNGSSA-N Tyr-Gly-Trp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ULHJJQYGMWONTD-HKUYNNGSSA-N 0.000 description 1
- USYGMBIIUDLYHJ-GVARAGBVSA-N Tyr-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 USYGMBIIUDLYHJ-GVARAGBVSA-N 0.000 description 1
- ILTXFANLDMJWPR-SIUGBPQLSA-N Tyr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N ILTXFANLDMJWPR-SIUGBPQLSA-N 0.000 description 1
- DZKFGCNKEVMXFA-JUKXBJQTSA-N Tyr-Ile-His Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O DZKFGCNKEVMXFA-JUKXBJQTSA-N 0.000 description 1
- WSFXJLFSJSXGMQ-MGHWNKPDSA-N Tyr-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N WSFXJLFSJSXGMQ-MGHWNKPDSA-N 0.000 description 1
- OHOVFPKXPZODHS-SJWGOKEGSA-N Tyr-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OHOVFPKXPZODHS-SJWGOKEGSA-N 0.000 description 1
- MVFQLSPDMMFCMW-KKUMJFAQSA-N Tyr-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O MVFQLSPDMMFCMW-KKUMJFAQSA-N 0.000 description 1
- DWAMXBFJNZIHMC-KBPBESRZSA-N Tyr-Leu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O DWAMXBFJNZIHMC-KBPBESRZSA-N 0.000 description 1
- PRONOHBTMLNXCZ-BZSNNMDCSA-N Tyr-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PRONOHBTMLNXCZ-BZSNNMDCSA-N 0.000 description 1
- DAOREBHZAKCOEN-ULQDDVLXSA-N Tyr-Leu-Met Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O DAOREBHZAKCOEN-ULQDDVLXSA-N 0.000 description 1
- CDKZJGMPZHPAJC-ULQDDVLXSA-N Tyr-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDKZJGMPZHPAJC-ULQDDVLXSA-N 0.000 description 1
- AOLHUMAVONBBEZ-STQMWFEESA-N Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AOLHUMAVONBBEZ-STQMWFEESA-N 0.000 description 1
- WOAQYWUEUYMVGK-ULQDDVLXSA-N Tyr-Lys-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WOAQYWUEUYMVGK-ULQDDVLXSA-N 0.000 description 1
- GITNQBVCEQBDQC-KKUMJFAQSA-N Tyr-Lys-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O GITNQBVCEQBDQC-KKUMJFAQSA-N 0.000 description 1
- ZOBLBMGJKVJVEV-BZSNNMDCSA-N Tyr-Lys-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O ZOBLBMGJKVJVEV-BZSNNMDCSA-N 0.000 description 1
- SINRIKQYQJRGDQ-MEYUZBJRSA-N Tyr-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 SINRIKQYQJRGDQ-MEYUZBJRSA-N 0.000 description 1
- VUVVMFSDLYKHPA-PMVMPFDFSA-N Tyr-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC3=CC=C(C=C3)O)N VUVVMFSDLYKHPA-PMVMPFDFSA-N 0.000 description 1
- SBLZVFCEOCWRLS-BPNCWPANSA-N Tyr-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=C(C=C1)O)N SBLZVFCEOCWRLS-BPNCWPANSA-N 0.000 description 1
- OFHKXNKJXURPSY-ULQDDVLXSA-N Tyr-Met-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O OFHKXNKJXURPSY-ULQDDVLXSA-N 0.000 description 1
- QQCCSDWLVIEPSF-BVSLBCMMSA-N Tyr-Met-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=C(O)C=C1 QQCCSDWLVIEPSF-BVSLBCMMSA-N 0.000 description 1
- UPODKYBYUBTWSV-BZSNNMDCSA-N Tyr-Phe-Cys Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CS)C(O)=O)C1=CC=C(O)C=C1 UPODKYBYUBTWSV-BZSNNMDCSA-N 0.000 description 1
- MNWINJDPGBNOED-ULQDDVLXSA-N Tyr-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=C(O)C=C1 MNWINJDPGBNOED-ULQDDVLXSA-N 0.000 description 1
- VXFXIBCCVLJCJT-JYJNAYRXSA-N Tyr-Pro-Pro Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N1CCC[C@H]1C(O)=O VXFXIBCCVLJCJT-JYJNAYRXSA-N 0.000 description 1
- VYQQQIRHIFALGE-UWJYBYFXSA-N Tyr-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 VYQQQIRHIFALGE-UWJYBYFXSA-N 0.000 description 1
- XYBNMHRFAUKPAW-IHRRRGAJSA-N Tyr-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CC=C(C=C1)O)N XYBNMHRFAUKPAW-IHRRRGAJSA-N 0.000 description 1
- PWKMJDQXKCENMF-MEYUZBJRSA-N Tyr-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O PWKMJDQXKCENMF-MEYUZBJRSA-N 0.000 description 1
- NAHUCETZGZZSEX-IHPCNDPISA-N Tyr-Trp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N NAHUCETZGZZSEX-IHPCNDPISA-N 0.000 description 1
- KSGKJSFPWSMJHK-JNPHEJMOSA-N Tyr-Tyr-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KSGKJSFPWSMJHK-JNPHEJMOSA-N 0.000 description 1
- UUJHRSTVQCFDPA-UFYCRDLUSA-N Tyr-Tyr-Val Chemical compound C([C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 UUJHRSTVQCFDPA-UFYCRDLUSA-N 0.000 description 1
- NWEGIYMHTZXVBP-JSGCOSHPSA-N Tyr-Val-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O NWEGIYMHTZXVBP-JSGCOSHPSA-N 0.000 description 1
- IZFVRRYRMQFVGX-NRPADANISA-N Val-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N IZFVRRYRMQFVGX-NRPADANISA-N 0.000 description 1
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 1
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 1
- LABUITCFCAABSV-BPNCWPANSA-N Val-Ala-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 LABUITCFCAABSV-BPNCWPANSA-N 0.000 description 1
- LABUITCFCAABSV-UHFFFAOYSA-N Val-Ala-Tyr Natural products CC(C)C(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LABUITCFCAABSV-UHFFFAOYSA-N 0.000 description 1
- UUYCNAXCCDNULB-QXEWZRGKSA-N Val-Arg-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O UUYCNAXCCDNULB-QXEWZRGKSA-N 0.000 description 1
- KKHRWGYHBZORMQ-NHCYSSNCSA-N Val-Arg-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKHRWGYHBZORMQ-NHCYSSNCSA-N 0.000 description 1
- COYSIHFOCOMGCF-WPRPVWTQSA-N Val-Arg-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-WPRPVWTQSA-N 0.000 description 1
- CWOSXNKDOACNJN-BZSNNMDCSA-N Val-Arg-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N CWOSXNKDOACNJN-BZSNNMDCSA-N 0.000 description 1
- WITCOKQIPFWQQD-FSPLSTOPSA-N Val-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O WITCOKQIPFWQQD-FSPLSTOPSA-N 0.000 description 1
- UDLYXGYWTVOIKU-QXEWZRGKSA-N Val-Asn-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UDLYXGYWTVOIKU-QXEWZRGKSA-N 0.000 description 1
- GXAZTLJYINLMJL-LAEOZQHASA-N Val-Asn-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N GXAZTLJYINLMJL-LAEOZQHASA-N 0.000 description 1
- UDNYEPLJTRDMEJ-RCOVLWMOSA-N Val-Asn-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N UDNYEPLJTRDMEJ-RCOVLWMOSA-N 0.000 description 1
- OGNMURQZFMHFFD-NHCYSSNCSA-N Val-Asn-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N OGNMURQZFMHFFD-NHCYSSNCSA-N 0.000 description 1
- NWDOPHYLSORNEX-QXEWZRGKSA-N Val-Asn-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N NWDOPHYLSORNEX-QXEWZRGKSA-N 0.000 description 1
- ISERLACIZUGCDX-ZKWXMUAHSA-N Val-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N ISERLACIZUGCDX-ZKWXMUAHSA-N 0.000 description 1
- XQVRMLRMTAGSFJ-QXEWZRGKSA-N Val-Asp-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XQVRMLRMTAGSFJ-QXEWZRGKSA-N 0.000 description 1
- VUTHNLMCXKLLFI-LAEOZQHASA-N Val-Asp-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VUTHNLMCXKLLFI-LAEOZQHASA-N 0.000 description 1
- XLDYBRXERHITNH-QSFUFRPTSA-N Val-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)C(C)C XLDYBRXERHITNH-QSFUFRPTSA-N 0.000 description 1
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 1
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 1
- COSLEEOIYRPTHD-YDHLFZDLSA-N Val-Asp-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 COSLEEOIYRPTHD-YDHLFZDLSA-N 0.000 description 1
- CWSIBTLMMQLPPZ-FXQIFTODSA-N Val-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N CWSIBTLMMQLPPZ-FXQIFTODSA-N 0.000 description 1
- XTAUQCGQFJQGEJ-NHCYSSNCSA-N Val-Gln-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XTAUQCGQFJQGEJ-NHCYSSNCSA-N 0.000 description 1
- YCMXFKWYJFZFKS-LAEOZQHASA-N Val-Gln-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCMXFKWYJFZFKS-LAEOZQHASA-N 0.000 description 1
- VFOHXOLPLACADK-GVXVVHGQSA-N Val-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N VFOHXOLPLACADK-GVXVVHGQSA-N 0.000 description 1
- AGKDVLSDNSTLFA-UMNHJUIQSA-N Val-Gln-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N AGKDVLSDNSTLFA-UMNHJUIQSA-N 0.000 description 1
- OXVPMZVGCAPFIG-BQFCYCMXSA-N Val-Gln-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N OXVPMZVGCAPFIG-BQFCYCMXSA-N 0.000 description 1
- BRPKEERLGYNCNC-NHCYSSNCSA-N Val-Glu-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N BRPKEERLGYNCNC-NHCYSSNCSA-N 0.000 description 1
- VVZDBPBZHLQPPB-XVKPBYJWSA-N Val-Glu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VVZDBPBZHLQPPB-XVKPBYJWSA-N 0.000 description 1
- ROLGIBMFNMZANA-GVXVVHGQSA-N Val-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N ROLGIBMFNMZANA-GVXVVHGQSA-N 0.000 description 1
- WDIGUPHXPBMODF-UMNHJUIQSA-N Val-Glu-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N WDIGUPHXPBMODF-UMNHJUIQSA-N 0.000 description 1
- CELJCNRXKZPTCX-XPUUQOCRSA-N Val-Gly-Ala Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O CELJCNRXKZPTCX-XPUUQOCRSA-N 0.000 description 1
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 1
- PMDOQZFYGWZSTK-LSJOCFKGSA-N Val-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C PMDOQZFYGWZSTK-LSJOCFKGSA-N 0.000 description 1
- URIRWLJVWHYLET-ONGXEEELSA-N Val-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C URIRWLJVWHYLET-ONGXEEELSA-N 0.000 description 1
- MDYSKHBSPXUOPV-JSGCOSHPSA-N Val-Gly-Phe Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N MDYSKHBSPXUOPV-JSGCOSHPSA-N 0.000 description 1
- XXROXFHCMVXETG-UWVGGRQHSA-N Val-Gly-Val Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXROXFHCMVXETG-UWVGGRQHSA-N 0.000 description 1
- FEFZWCSXEMVSPO-LSJOCFKGSA-N Val-His-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](C)C(O)=O FEFZWCSXEMVSPO-LSJOCFKGSA-N 0.000 description 1
- RHYOAUJXSRWVJT-GVXVVHGQSA-N Val-His-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RHYOAUJXSRWVJT-GVXVVHGQSA-N 0.000 description 1
- ZIGZPYJXIWLQFC-QTKMDUPCSA-N Val-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C(C)C)N)O ZIGZPYJXIWLQFC-QTKMDUPCSA-N 0.000 description 1
- JPPXDMBGXJBTIB-ULQDDVLXSA-N Val-His-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N JPPXDMBGXJBTIB-ULQDDVLXSA-N 0.000 description 1
- VXDSPJJQUQDCKH-UKJIMTQDSA-N Val-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N VXDSPJJQUQDCKH-UKJIMTQDSA-N 0.000 description 1
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 1
- HGJRMXOWUWVUOA-GVXVVHGQSA-N Val-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N HGJRMXOWUWVUOA-GVXVVHGQSA-N 0.000 description 1
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 1
- DIOSYUIWOQCXNR-ONGXEEELSA-N Val-Lys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O DIOSYUIWOQCXNR-ONGXEEELSA-N 0.000 description 1
- QRVPEKJBBRYISE-XUXIUFHCSA-N Val-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N QRVPEKJBBRYISE-XUXIUFHCSA-N 0.000 description 1
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 1
- HPANGHISDXDUQY-ULQDDVLXSA-N Val-Lys-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N HPANGHISDXDUQY-ULQDDVLXSA-N 0.000 description 1
- CXWJFWAZIVWBOS-XQQFMLRXSA-N Val-Lys-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CXWJFWAZIVWBOS-XQQFMLRXSA-N 0.000 description 1
- JAKHAONCJJZVHT-DCAQKATOSA-N Val-Lys-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N JAKHAONCJJZVHT-DCAQKATOSA-N 0.000 description 1
- VPGCVZRRBYOGCD-AVGNSLFASA-N Val-Lys-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O VPGCVZRRBYOGCD-AVGNSLFASA-N 0.000 description 1
- MBGFDZDWMDLXHQ-GUBZILKMSA-N Val-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N MBGFDZDWMDLXHQ-GUBZILKMSA-N 0.000 description 1
- ILMVQSHENUZYIZ-JYJNAYRXSA-N Val-Met-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N ILMVQSHENUZYIZ-JYJNAYRXSA-N 0.000 description 1
- NZGOVKLVQNOEKP-YDHLFZDLSA-N Val-Phe-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NZGOVKLVQNOEKP-YDHLFZDLSA-N 0.000 description 1
- VCIYTVOBLZHFSC-XHSDSOJGSA-N Val-Phe-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N VCIYTVOBLZHFSC-XHSDSOJGSA-N 0.000 description 1
- YKNOJPJWNVHORX-UNQGMJICSA-N Val-Phe-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YKNOJPJWNVHORX-UNQGMJICSA-N 0.000 description 1
- MJOUSKQHAIARKI-JYJNAYRXSA-N Val-Phe-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 MJOUSKQHAIARKI-JYJNAYRXSA-N 0.000 description 1
- YTNGABPUXFEOGU-SRVKXCTJSA-N Val-Pro-Arg Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O YTNGABPUXFEOGU-SRVKXCTJSA-N 0.000 description 1
- LGXUZJIQCGXKGZ-QXEWZRGKSA-N Val-Pro-Asn Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)N)C(=O)O)N LGXUZJIQCGXKGZ-QXEWZRGKSA-N 0.000 description 1
- RYQUMYBMOJYYDK-NHCYSSNCSA-N Val-Pro-Glu Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RYQUMYBMOJYYDK-NHCYSSNCSA-N 0.000 description 1
- SJRUJQFQVLMZFW-WPRPVWTQSA-N Val-Pro-Gly Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SJRUJQFQVLMZFW-WPRPVWTQSA-N 0.000 description 1
- SSYBNWFXCFNRFN-GUBZILKMSA-N Val-Pro-Ser Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O SSYBNWFXCFNRFN-GUBZILKMSA-N 0.000 description 1
- AJNUKMZFHXUBMK-GUBZILKMSA-N Val-Ser-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N AJNUKMZFHXUBMK-GUBZILKMSA-N 0.000 description 1
- LTTQCQRTSHJPPL-ZKWXMUAHSA-N Val-Ser-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N LTTQCQRTSHJPPL-ZKWXMUAHSA-N 0.000 description 1
- PGQUDQYHWICSAB-NAKRPEOUSA-N Val-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N PGQUDQYHWICSAB-NAKRPEOUSA-N 0.000 description 1
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 1
- UJMCYJKPDFQLHX-XGEHTFHBSA-N Val-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N)O UJMCYJKPDFQLHX-XGEHTFHBSA-N 0.000 description 1
- DLRZGNXCXUGIDG-KKHAAJSZSA-N Val-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O DLRZGNXCXUGIDG-KKHAAJSZSA-N 0.000 description 1
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 1
- WUFHZIRMAZZWRS-OSUNSFLBSA-N Val-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C(C)C)N WUFHZIRMAZZWRS-OSUNSFLBSA-N 0.000 description 1
- USXYVSTVPHELAF-RCWTZXSCSA-N Val-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](C(C)C)N)O USXYVSTVPHELAF-RCWTZXSCSA-N 0.000 description 1
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 1
- YLBNZCJFSVJDRJ-KJEVXHAQSA-N Val-Thr-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O YLBNZCJFSVJDRJ-KJEVXHAQSA-N 0.000 description 1
- LNWSJGJCLFUNTN-ZOBUZTSGSA-N Val-Trp-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LNWSJGJCLFUNTN-ZOBUZTSGSA-N 0.000 description 1
- SVLAAUGFIHSJPK-JYJNAYRXSA-N Val-Trp-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CO)C(=O)O)N SVLAAUGFIHSJPK-JYJNAYRXSA-N 0.000 description 1
- VTIAEOKFUJJBTC-YDHLFZDLSA-N Val-Tyr-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VTIAEOKFUJJBTC-YDHLFZDLSA-N 0.000 description 1
- GUIYPEKUEMQBIK-JSGCOSHPSA-N Val-Tyr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)NCC(O)=O GUIYPEKUEMQBIK-JSGCOSHPSA-N 0.000 description 1
- JXWGBRRVTRAZQA-ULQDDVLXSA-N Val-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N JXWGBRRVTRAZQA-ULQDDVLXSA-N 0.000 description 1
- PDASTHRLDFOZMG-JYJNAYRXSA-N Val-Tyr-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=C(O)C=C1 PDASTHRLDFOZMG-JYJNAYRXSA-N 0.000 description 1
- IECQJCJNPJVUSB-IHRRRGAJSA-N Val-Tyr-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CO)C(O)=O IECQJCJNPJVUSB-IHRRRGAJSA-N 0.000 description 1
- BGTDGENDNWGMDQ-KJEVXHAQSA-N Val-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N)O BGTDGENDNWGMDQ-KJEVXHAQSA-N 0.000 description 1
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 1
- AOILQMZPNLUXCM-AVGNSLFASA-N Val-Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN AOILQMZPNLUXCM-AVGNSLFASA-N 0.000 description 1
- 241000607626 Vibrio cholerae Species 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 239000004480 active ingredient Substances 0.000 description 1
- 108010087049 alanyl-alanyl-prolyl-valine Proteins 0.000 description 1
- 108010045350 alanyl-tyrosyl-alanine Proteins 0.000 description 1
- 108010070783 alanyltyrosine Proteins 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 1
- 108010086780 arginyl-glycyl-aspartyl-alanine Proteins 0.000 description 1
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 229940002008 bifidobacterium bifidum Drugs 0.000 description 1
- 239000011230 binding agent Substances 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 150000001768 cations Chemical class 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 235000010980 cellulose Nutrition 0.000 description 1
- 239000000919 ceramic Substances 0.000 description 1
- 229960005395 cetuximab Drugs 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000013522 chelant Substances 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 229920001436 collagen Polymers 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 108010016616 cysteinylglycine Proteins 0.000 description 1
- 108010060199 cysteinylproline Proteins 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000010217 densitometric analysis Methods 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 108010060455 des-Tyr- beta-casomorphin Proteins 0.000 description 1
- 238000011033 desalting Methods 0.000 description 1
- 230000001079 digestive effect Effects 0.000 description 1
- 238000011143 downstream manufacturing Methods 0.000 description 1
- 239000003480 eluent Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 229940032049 enterococcus faecalis Drugs 0.000 description 1
- 238000011067 equilibration Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 1
- MHMNJMPURVTYEJ-UHFFFAOYSA-N fluorescein-5-isothiocyanate Chemical compound O1C(=O)C2=CC(N=C=S)=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 MHMNJMPURVTYEJ-UHFFFAOYSA-N 0.000 description 1
- 238000004108 freeze drying Methods 0.000 description 1
- 239000008273 gelatin Substances 0.000 description 1
- 229920000159 gelatin Polymers 0.000 description 1
- 235000019322 gelatine Nutrition 0.000 description 1
- 235000011852 gelatine desserts Nutrition 0.000 description 1
- 230000004077 genetic alteration Effects 0.000 description 1
- 231100000118 genetic alteration Toxicity 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-L glutamate group Chemical group N[C@@H](CCC(=O)[O-])C(=O)[O-] WHUUTDBJXJRKMK-VKHMYHEASA-L 0.000 description 1
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 1
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 1
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 1
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010033719 glycyl-histidyl-glycine Proteins 0.000 description 1
- NRRWQFGMQBIGRJ-AXGRSTHOSA-N glycyl-l-lysyl-l-prolyl-l-arginyl-l-prolyl-l-tyrosyl-l-seryl-l-prolyl-l-arginyl-l-prolyl-l-threonyl-l-seryl-l-histidyl-l-prolyl-l-arginyl-l-prolyl-l-isoleucyl-l-arginyl-l-valine Chemical compound NC(=N)NCCC[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H]1N(C(=O)[C@H](CC=2NC=NC=2)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H]2N(CCC2)C(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H]2N(CCC2)C(=O)[C@H](CO)NC(=O)[C@H](CC=2C=CC(O)=CC=2)NC(=O)[C@H]2N(CCC2)C(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H]2N(CCC2)C(=O)[C@H](CCCCN)NC(=O)CN)[C@@H](C)O)CCC1 NRRWQFGMQBIGRJ-AXGRSTHOSA-N 0.000 description 1
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 1
- 108010048994 glycyl-tyrosyl-alanine Proteins 0.000 description 1
- 108010045126 glycyl-tyrosyl-glycine Proteins 0.000 description 1
- 108010085325 histidylproline Proteins 0.000 description 1
- 108010018006 histidylserine Proteins 0.000 description 1
- 102000057041 human TNF Human genes 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000003999 initiator Substances 0.000 description 1
- 229910010272 inorganic material Inorganic materials 0.000 description 1
- 239000011147 inorganic material Substances 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- PGLTVOMIXTUURA-UHFFFAOYSA-N iodoacetamide Chemical compound NC(=O)CI PGLTVOMIXTUURA-UHFFFAOYSA-N 0.000 description 1
- JEIPFZHSYJVQDO-UHFFFAOYSA-N iron(III) oxide Inorganic materials O=[Fe]O[Fe]=O JEIPFZHSYJVQDO-UHFFFAOYSA-N 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 108010009932 leucyl-alanyl-glycyl-valine Proteins 0.000 description 1
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 108020001756 ligand binding domains Proteins 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 1
- 239000002122 magnetic nanoparticle Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 108010085203 methionylmethionine Proteins 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 101150006061 neur gene Proteins 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 230000009871 nonspecific binding Effects 0.000 description 1
- 239000002853 nucleic acid probe Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 235000020232 peanut Nutrition 0.000 description 1
- 239000001814 pectin Substances 0.000 description 1
- 235000010987 pectin Nutrition 0.000 description 1
- 229920001277 pectin Polymers 0.000 description 1
- 238000010647 peptide synthesis reaction Methods 0.000 description 1
- 239000012071 phase Substances 0.000 description 1
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 1
- 108010089198 phenylalanyl-prolyl-arginine Proteins 0.000 description 1
- 108010084572 phenylalanyl-valine Proteins 0.000 description 1
- 108010073101 phenylalanylleucine Proteins 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 1
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 1
- 229920002223 polystyrene Polymers 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 230000002335 preservative effect Effects 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 1
- 108010025826 prolyl-leucyl-arginine Proteins 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- 108010090894 prolylleucine Proteins 0.000 description 1
- 230000013777 protein digestion Effects 0.000 description 1
- 230000009145 protein modification Effects 0.000 description 1
- 239000012521 purified sample Substances 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 1
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 239000001632 sodium acetate Substances 0.000 description 1
- 235000017281 sodium acetate Nutrition 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 229910000162 sodium phosphate Inorganic materials 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 229940031000 streptococcus pneumoniae Drugs 0.000 description 1
- 238000009662 stress testing Methods 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 239000004094 surface-active agent Substances 0.000 description 1
- 238000010189 synthetic method Methods 0.000 description 1
- 229920001059 synthetic polymer Polymers 0.000 description 1
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- 229910052722 tritium Inorganic materials 0.000 description 1
- 239000002753 trypsin inhibitor Substances 0.000 description 1
- 108010005834 tyrosyl-alanyl-glycine Proteins 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/48—Hydrolases (3) acting on peptide bonds (3.4)
- C12N9/50—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
- C12N9/52—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from bacteria or Archaea
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/84—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving inorganic compounds or pH
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y304/00—Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
- C12Y304/24—Metalloendopeptidases (3.4.24)
- C12Y304/24057—O-Sialoglycoprotein endopeptidase (3.4.24.57), i.e. glycoprotease
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2333/00—Assays involving biological materials from specific organisms or of a specific nature
- G01N2333/90—Enzymes; Proenzymes
- G01N2333/914—Hydrolases (3)
- G01N2333/924—Hydrolases (3) acting on glycosyl compounds (3.2)
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2333/00—Assays involving biological materials from specific organisms or of a specific nature
- G01N2333/90—Enzymes; Proenzymes
- G01N2333/914—Hydrolases (3)
- G01N2333/948—Hydrolases (3) acting on peptide bonds (3.4)
- G01N2333/95—Proteinases, i.e. endopeptidases (3.4.21-3.4.99)
- G01N2333/952—Proteinases, i.e. endopeptidases (3.4.21-3.4.99) derived from bacteria
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Wood Science & Technology (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- Medicinal Chemistry (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- General Health & Medical Sciences (AREA)
- Urology & Nephrology (AREA)
- Hematology (AREA)
- Immunology (AREA)
- General Engineering & Computer Science (AREA)
- Cell Biology (AREA)
- Pathology (AREA)
- Food Science & Technology (AREA)
- Physics & Mathematics (AREA)
- Analytical Chemistry (AREA)
- General Physics & Mathematics (AREA)
- Inorganic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Peptides Or Proteins (AREA)
- Enzymes And Modification Thereof (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
Abstract
본 발명은 O-연결 당단백질에 결합하지만 가수분해 활성이 없거나 감소된 신규한 엔도프로테아제, 이의 돌연변이체, 및 이의 연구 및 단리 방법에서의 용도에 관한 것이다.
Description
본 발명은 O-연결 당단백질에 결합하지만 가수분해 활성이 없거나 감소된 신규한 엔도프로테아제, 이의 돌연변이체, 및 이의 연구 및 단리 방법에서의 용도에 관한 것이다.
최근, 생물학적 기능에 대한 글리코실화의 영향, 특히 O-연결 글리칸에 대한 관심이 증가하고 있다. 그러나, 이러한 중요한 단백질 변형에 대한 관심이 재개되고 있지만, 글리칸, 및 당단백질을 효율적으로 연구하기 위한 도구는 부족하다.
천연 단백질로부터 O-연결 글리칸 제거 및 글리칸 서열분석 둘 모두에 매우 유용한 몇몇 엑소- 및 엔도글리코시다제가 개발되었다. 이러한 둘 모두의 접근법은 당단백질의 이질성을 감소시키기 위해 개별적으로 사용될 수 있으며, 따라서, 질량 분석에서 단백질 및 이의 단편화된 펩티드의 분석을 용이하게 할 수 있다. 가수분해에 의해 영향을 받는 기능의 하류 분석에 의한 글리칸의 생물학적 효과의 보다 효율적인 분석이 또한 수행될 수 있다. 그러나, 이러한 도구는, 예컨대 O-연결 당단백질의 식별, 글리코실화 부위의 결정 및 O-연결 글리코펩티드의 정제를 용이하게 하는데 효율적이지 않다.
O-글리칸에 결합하고 주로 글리칸에 근접한 R-N-결합을 가수분해하는 최초의O-당단백질-특이적 엔도프로테아제가 1991/1992년에 보고되었다(Abdullah et al., J Bacteriol 173, 5597-5603 (1991); Abdullah et al., Infect Immun 60, 56-62 (1992)). 그러나, 이러한 효소는 시알산을 포함하는 O-글리칸(대부분이지만 모두 O-연결 글리칸과는 거리가 먼)에 대해서만 특이적이고 특정한 아미노산 요구를 가지므로 일반적으로 낮은 가수분해 수준을 야기하기 때문에 의약 및 생명공학에 대한 유용성이 제한적이다. O-연결 당단백질을 연구하기 위한 보다 우수한 도구가 필요하다.
본 발명자들은 본원에서 LS로 지칭되는 아커만시아 뮤시니필라(Akkermansia muciniphila)로부터의 신규한 폴리펩티드를 확인, 식별 및 특성을 분석하였다. 상기 폴리펩티드는 엔도프로테아제, 구체적으로 특정 아미노산 서열에 대한 특이성 또는 제한을 나타내지 않으면서 O-연결 글리칸에 대해 아미노산 결합 N 말단 및 이의 근접한 곳을 절단/가수분해하는 작용을 한다.
본 발명자들은 또한 LS의 서열을 변형시키고 O-연결 글리칸에 결합할 수 있지만 당단백질을 가수분해하는 능력이 없거나 감소된 돌연변이체를 식별하였다. 이러한 돌연변이체는 유리 O-글리칸, O-글리코펩티드 및/또는 O-당단백질의 선택적 제거, 농축 또는 정제에 사용될 수 있다.
따라서, 본 발명의 제1 양태에서, 다음을 포함하는 O-글리코실화된 단백질에 특이적인 엔도프로테아제 활성을 갖는 폴리펩티드가 제공된다:
(a) 서열번호 1의 아미노산 서열;
(b) 서열번호 1의 아미노산 서열과 적어도 85% 동일한 아미노산 서열; 또는
(c) 서열번호 1의 서열의 단편인 아미노산 서열 또는 서열번호 1의 아미노산 서열과 85% 동일한 아미노산 서열의 단편.
본 발명은 또한 O-당단백질을 가수분해하는 방법을 제공하며, 여기서, 상기 방법은 단백질을 포함하는 샘플을 본 발명의 폴리펩티드와 접촉시키는 단계 및 선택적으로 가수분해 생성물의 검출 또는 분석을 추가로 포함하는 단계를 포함한다.
추가로, 단백질을 포함하는 샘플을 본 발명의 폴리펩티드와 접촉시키고 생성된 생성물을 검출 및/또는 분석하는 단계를 포함하는, 단백질의 글리코실화 상태를 평가하는 방법이 제공되며, 선택적으로, 절단 생성물의 존재 또는 부재는 샘플에서 O-당단백질의 존재 또는 부재를 결정하는데 사용되고/되거나, 상기 분석은 O-글리칸 쇄 및/또는 이의 O-당단백질의 부착 위치를 식별하기 위해 수행된다.
본 발명의 제2 양태에서, 다음을 포함하는, O-글리칸, O-글리코펩티드 및/또는 O-당단백질에 결합할 수 있고 O-글리코실화된 단백질에 특이적인 엔도프로테아제 활성이 없거나 감소된 폴리펩티드가 제공된다:
(a) 서열번호 5의 아미노산 서열;
(b) 서열번호 5 또는 서열번호 20의 아미노산 서열과 적어도 85% 동일한 아미노산 서열; 또는
(c) 서열번호 5 또는 서열번호 20의 절편인 아미노산 서열, 또는 서열번호 5 또는 서열번호 20의 아미노산 서열과 85% 동일한 아미노산 서열의 단편.
본 발명은 또한 O-글리칸, O-글리코펩티드 및/또는 O-당단백질에 결합하는 방법을 제공하며, 여기서 상기 방법은 O-글리칸, O-글리코펩티드 및/또는 O-당단백질을 포함하는 샘플을 본 발명의 폴리펩티드와 접촉시키고, 선택적으로 O-글리칸, O-글리코펩티드 또는 O-당단백질이 결합되었는지 여부를 결정하고/하거나 O-글리칸 및 임의의 연결된 당단백질, O-글리코펩티드 또는 O-당단백질을 생성된 혼합물로부터 분리하는 단계를 포함한다.
추가로, 단백질을 포함하는 샘플을 본 발명의 폴리펩티드와 접촉시키고 단백질이 상기 폴리펩티드에 의해 결합되는지 여부를 결정하는 단계를 포함하는, 단백질의 글리코실화 상태를 평가하는 방법이 제공된다.
또한, 샘플 중의 O-글리코펩티드 및/또는 O-당단백질의 검출 방법이 제공되며, 여기서, 상기 방법은 다음의 단계를 포함한다:
(a) 상기 샘플을 본 발명의 폴리펩티드와 접촉시켜 본 발명의 폴리펩티드와 O-연결 글리코펩티드 및/또는 O- 당단백질 사이에 복합체를 형성하도록 하는 단계(O-연결 글리코펩티드/단백질-폴리펩티드 복합체);
(b) 선택적으로 접촉된 샘플로부터 상기 폴리펩티드를 분리하는 단계; 및
(c) 분리된 폴리펩티드가 O-연결 글리코펩티드 또는 당단백질에 결합했는지 여부를 결정하여 샘플 중의 O-연결 글리코펩티드 또는 당단백질의 존재 또는 부재를 결정하는 단계.
도 1: LS 발현 및 정제. LS를 pET21(a)+ 벡터에서 C-말단 His-태그가 있는 융합 단백질로서 발현시켰다. BL21(DE3) Star로 형질전환시킨 후에, 4개의 개별적인 클론을 발현시키고 His GravityFlow 컬럼에서 균질하게 정제하였다. 정제된 샘플 중의 단백질의 총 양 및 SDS-PAGE에 기반한 순도에 기초하여, 조사된 4개 클론 모두가 동일하게 잘 발현되었다.
도 2: LS는 특히 O-글리칸을 함유하는 단백질에 작용한다 - 도는 SDS-PAGE에 의해 분석된 생성물을 나타낸다. LS를 IgG 또는 IgA와 함께 항온 처리하면 IgA의 특이적 분해가 발생하지만, IgG(허셉틴/트라스투주맙)에 대한 가시적인 활성은 없었다. 모든 항온 처리는 PBS에서 37℃에서 밤새 이루어졌다. 이러한 조건 동안 시알리다제(Am0707)의 첨가는 LS의 활성에 필요하지 않았다.
도 3: 최적의 효소 조건. LS는 넓은 pH 범위에서 활성이고(A), NaCl을 잘 견뎌내지만(B), EDTA에 대해 매우 민감하며(C, D), Zn2+에 의해 부분적으로 억제된다(D). 모든 실험(pH 분석 제외)은 37℃에서 PBS에서 밤새 수행하였다. pH 최적 측정을 위해, 효소를 20 mM Tris-HCl (pH 6.8-8.8) 또는 50 mM 아세트산 (pH 5.6)에서 항온 처리하였다.
도 4: LS의 활성은 글리칸 조성에 의해 조절된다. (A) LS로 30분 동안 가수분해 하기 전에 특정 글리칸을 순차적으로 제거한 결과 시알릴화된 단백질에서 활성이 매우 낮고, 비시알릴화된 단백질에서 활성이 높고, 갈락토스가 제거된 샘플에서는 활성이 없었다. (S) 시알리다제, (SG) 시알리다제 및 갈락토시다제, (LS) LS. (B) 완전히 글리코실화된(엔브렐) 또는 시알리다제 처리된(엔브릴(S)) 당단백질의 연장된 항온 처리(밤새)는 두 샘플 모두에서 완전한 가수분해를 초래하였다. 엔브렐은 본원에서 에타너셉트(etanercept)로도 지칭될 수 있다. (C) 에타너셉트(TNFαR)의 TNFα 결합 부분을 시알리다제("시알리다제"), O-글리코시다제/시알리다제("O-glyc"), 또는 PNGaseF("N-glyc")로 전처리하여 시알산, O-글리칸, 및 N-글리칸을 각각 제거하였다. LS를 샘플에 첨가하고, 분석 전에 항온 처리를 밤새 지속하였다. LS는 O-글리코시다제로 처리된 샘플을 제외한 모든 샘플에서 활성을 가졌다.
도 5: LS가 O-글리칸의 당단백질 N-말단을 가수분해한다는 것을 보여주는 검색 결과. LS를 사용하여 단편으로 가수분해되고, 이어서 O-글리코시다제 처리로 탈글리코실화된 에타너셉트를 질량 분석(LC/MS 및 MS/MS)하였다. 확인된 펩티드(백색 및 해칭 박스)를 m/z 값 및 MS/MS 데이터에 기초하여 에타너셉트의 서열에 맞추고, y' 및 b' 이온을 작은 회색 박스로 표시하였다. 모든 백색 및 해칭 박스(예컨데, 펩티드)는 T 또는 S에서 직접 시작하며, 여기에 O-글리칸이 부착된다. 선행 아미노산은 다양하고(P, S, H, T, G), 가수분해에 영향을 미치지 않는 것으로 보인다. (A) S/T-펩티다제로 생성된 펩티드를 구체적으로 검색하는, 편향 접근접을 사용한 분석. (B) 비편향 접근법을 사용한 분석.
도 6: 불활성화된 LS는 O-연결 당단백질에 특이적으로 결합한다. 메탈로프로테아제 활성 부위를 돌연변이시켜 기질 친화성 또는 상호작용에 영향을 미치지 않으면서 촉매능을 제거하였다. 구체적으로 이는 E를 A로 교환하여 클론 "LSmut"(LSE206A로도 지칭됨)를 생성함으로써 이루어졌다. (A) LS는 시알리다제의 존재 하에 엔브렐을 가수분해 할 수 있었지만, 불활성화된 Lsmut는 시험된 조건 하에 엔브렐을 가수분해할 수 없었다. 활성의 상실을 SDS-PAGE 상에서 확인하였다. (B) 가수분해 활성이 상실되었지만, LSmut는 여전히 O-당단백질에 결합할 수 있었다. 특이적 결합을 고정된 LSE206A를 갖는 스핀 컬럼에서 확인하였으며, O-연결 당단백질에 대한 특이적 친화성을 입증하였다. 세파로스에 LSmut를 고정시킴으로써, IgA를 친화성 정제할 수 있었다. O-글리칸이 없는 허셉틴(트라스투주맙), 및 O-글리코시다제 처리된 IgA는 컬럼에 결합하지 않았지만, 통과물(flowthrough, FT)에서 검출될 수 있다. Neur = 뉴라미니다제/시알리다제 0707.
도 7: α2-3 결합된 시알산은 LS의 효율을 제한한다. 엔브렐을 당단백질 기질로 사용하여 30분 내지 20시간 동안 다양한 시알리다제 세트와 LS를 동시 항온 처리하면 α2-3 특이적 시알리다제 1757의 존재 하에, 또는 혼합물(0707 + 1757)과 함께 더 높은 효율을 나타낸 반면, 넓은 범위의 시알리다제 0707은 LS의 전체 활성에 필요한 것은 아니므로 α2-6 (및 α2-8) 결합은 LS 활성에 대한 우려가 아님을 시사한다.
도 8: LS 활성의 개략도. LS는 O-연결 GalNAc에 부착된 말단 갈락토스를 우선적으로 결합시켜 글리칸이 부착된 세린 또는 트레오닌의 N-말단 가수분해를 초래한다. 시알산의 존재는 LS의 효율을 감소시키지만, 이를 억제하지는 않을 것이다. N-연결 글리칸에서는 활성을 보이지 않는다.
도 9: 에리스로포이에틴을 상이한 조합의 LS, N-글리칸을 제거하기 위한 PNGaseF, 시알산을 제거하기 위한 시알리다제, 및 O-글리칸을 제거하기 위한 O-글리코시다제로 절단한 실험 결과. 반응 생성물을 SDS-PAGE, RPLC 및 ESI 질량 분석법으로 분석하였다 (A) SDS-PAGE 분석 결과: 레인 1 = PNGaseF 및 시알리다제로 처리된 EPO; 레인 2 = PNGaseF 및 시알리다제 + LS로 처리한 EPO; 레인 3 = PNGaseF + LS로 처리한 EPO; 레인 4 = LS로 처리하기 전에 PNGaseF, 시알리다제, O-글리코시다제로 처리한 EPO; 레인 5 = 효소 대조군. 밴드 X = 비절단된 EPO; 밴드 Y = LS에 의해 소화된 EPO의 N 말단 단편; 밴드 Z = LS에 의해 소화된 EPO의 C 말단 단편. 레인 2 및 3은 시알산이 제거된 곳 및 시알산이 손상되지 않은 곳에서 LS가 EPO를 절단한다는 것을 보여준다. 레인 2 및 3은 N-글리칸이 PNGaseF로 제거된 곳에서 LS가 EPO를 또한 절단한다는 것을 보여준다. 레인 4는 O-글리칸이 제거된 곳에서 LS가 EPO를 절단하지 않는다는 것을 보여준다. (B) UV 크로마토그램은 PNGaseF 및 시알리다제 + LS로 처리된 EPO에 대한 RPLC 분리의 결과를 보여준다. 도시된 바와 같이 2개의 주요 피크가 확인되었다. 피크 1은 LS에 의해 소화된 EPO의 C 말단 단편이다; 피크 2는 LS에 의해 소화된 EPO의 N 말단 단편이다; (C, D)는 질량 분석법 분석 결과를 나타낸다. 도 C는 (현재 N 말단) 세린에 여전히 부착된 O-글리칸을 갖는 EPO의 C 말단 단편의 질량을 나타낸다(사각형 = GlcNAc, 원 = 갈락토스). 질량의 차이는 샘플 일부분에서 O-글리칸의 분해 차이(말단 갈락토스 손실)에 기인하며, 이는 MS 기구의 이온화 에너지에 의해 야기될 수 있다; 도 D는 글리칸이 결여된 EPO의 N 말단 단편과, 글리칸이 여전히 부착된 소화되지 않은 EPO를 보여준다.
도 10: LSE206A가 일부 활성을 보유하는 반면 LSH205A/E206A(LS HE206AA로도 지칭될 수 있음)가 완전히 비활성화된 실험 결과. LS 돌연변이체 LSE206A (A) 및 LSH205A/E206A (B)의 활성을 야생형 LS 효소와 비교하여, 에타너셉트의 TNFα 결합 부분(TNFaR2; 본원에서 TNFaR로도 지칭될 수 있음) 및 에타너셉트 그 자체(에타너셉트)를 포함하여 비시알릴화된 O-글리코실화된 기질에 대해 평가하였다. 상이한 농도의 LS 돌연변이체를 1 μg 기질(1:1 내지 15;1, 효소:기질)에 첨가하고, SDS-PAGE 상에서 분석하기 전에 37℃에서 밤새 항온 처리하였다.
A) 레인 1: 비시알릴화된 기질 단독; 레인 2: LS 단독, 레인 3: 0.5 μg LSE206A, 레인 4: 5 μg LSE206A, 레인 5: TNFaR2 + LS(1:1 비율), 레인 6: TNFaR2 + LSE206A(1:1 비율).
B) 레인 1: 비시알릴화된 기질 단독; 레인 2: LSH205A/E206A + 에타너셉트(15:1 비율), 레인 3: LSH205A/E206A + 에타너셉트(5:1 비율), 레인 4: LSH205A/E206A + 에타너셉트(1:1 비율), 레인 5: LS + 에타너셉트(1:1 비율), 레인 6: LSH205A/E206A
도 11: 수지에 고정화된 LSH205A/E206A가 단백질을 함유하는 O-글리칸에 특이적으로 결합함을 보여주는 실험 결과. 도는 각각의 경우에 시작/로딩 물질, 통과물(FT) 및 용리물(E)에 대한 SDS-PAGE 분석을 나타낸다 ( A ) 샘플은 BSA(소 혈청 알부민), 에타너셉트, IgA, 및 IgG를 포함함, 도시된 바와 같이 천연 또는 시알리다제 혼합물 +/- O-글리코시다제로 전처리됨. ( B ) 샘플은 O-글리코실화된 단백질(TNFaR 및 ApoE), N-글리코실화된 단백질(애플리버셉트, AGP (알파-1-산 당단백질), IgG Fc (IgG의 Fc 도메인) 및 비-글리코실화된 단백질(BSA)의 혼합물을 포함함, 시알리다제 혼합물로 전처리됨. ( C ) 샘플은 N-글리코실화된 단백질(세툭시맙, 애플리버셉트, AGP) 및 비-글리코실화된 단백질(BSA, 탄산 무수화효소)의 혼합물을 포함함, 시알리다제 혼합물로 전처리함.
도 12: 고정된 LSH205A/E206A가 O-당단백질의 결합에 대한 농도 의존능을 갖는다는 것을 보여주는 실험 결과. 비시알릴화된 에타너셉트(50~250 μg; 100 μl PBS 중)를 상이한 고정화 조건의 LSH205A/E206A(5~15 mg/mL)를 포함하는 50 μl PBS-평형화된 LSH205A/E206A 수지에 첨가하였다. 단백질을 엔드-오버-엔드 회전으로 실온에서 2시간 동안 수지에 결합하게 하였다. 수지를 PBS(350 μl)로 3회 세척한 다음 8 M 우레아(50 μl, 5분 항온 처리; 2회 반복)를 첨가하여 용리하였다. 결합에서 우레아 및 구아니딘 히드로클로리드(GHCl)의 효과를 연구하기 위해, 결합 완충액에 50 μg의 비시알릴화된 에타너셉트와 함께 포함시켰지만, 다른 것은 동일하게 취급하였다. (A) 모든 샘플을 SDS-PAGE에서 분리하고 GelDoc EZ 및 소프트웨어 ImageLab을 사용하여 밀도 측정법을 통해 밴드 강도를 결정하였다. 언급된 퍼센트는 대조군과 비교하여 밴드 강도를 나타낸다. (B) 밴드 강도에 의해 결정된 단백질 결합 능력을 고정된 LSH205A/E206A의 양에 대해 플롯팅하였다.
도 13: LSH205A/E206A가 약 3 mg의 에타너셉트/mL 수지를 친화성 정제할 수 있음을 보여주는 실험 결과. 비시알릴화된 에타너셉트(10~200 μg; PBS 중의 100 μl)를 50 μl PBS-평형화된 LSH205A/E206A 수지에 첨가하였다. 단백질을 엔드-오버-엔드 회전으로 실온에서 2시간 동안 수지에 결합하게 하였다. 수지를 PBS(350 μl)로 3회 세척한 다음 8 M 우레아(50 μl, 5분 항온 처리; 2회 반복)를 첨가하여 용리하였다. 모든 샘플을 SDS-PAGE에서 분리하고 GelDoc EZ 및 소프트웨어 ImageLab을 사용하여 밀도 측정법을 통해 밴드 강도를 결정하였다. 언급된 퍼센트는 대조군과 비교하여 밴드 강도를 나타낸다.
도 14: LSH205A/E206A-기질 상호작용이 높은 이온 강도 및 완충액 부피/유형의 차이에 둔감하고, 넓은 pH 범위에서 작동함을 보여주는 실험 결과. (A) 비시알릴화된 에타너셉트, 50 μg; 도시된 바와 같은 농도에서 첨가된 NaCl을 포함하는 PBS 중의 100 μl (B) 비시알릴화된 에타너셉트, 50 μg; 도시된 바와 같이 PBS 중의 100~300 μl; (C) 비시알릴화된 에타너셉트(50 μg) 및 도시된 바와 같이 상이한 pH에서 상이한 완충액 중의 BSA(50 μg)의 샘플로부터의 통과물; (D) C 샘플로부터의 용리물.
도 15: 변성 또는 세제의 첨가가 LSH205A/E206A에 결합된 O-당단백질을 용리한다는 것을 보여주는 실험 결과. 비시알릴화된 에타너셉트(50 μg; PBS 중의 100 μl)를 50 μl의 PBS-평형화된 LSH205A/E206A 수지에 첨가하였다. 단백질을 엔드-오버-엔드 회전으로 실온에서 2시간 동안 수지에 결합하게 하였다. 수지를 PBS(350 μl)로 3회 세척한 다음 (A) 1~8 M 우레아 또는 (B) 1.25~10% SDS (50 μl, 5분 항온 처리; 2회 반복)를 첨가하여 용리하였다. 모든 샘플을 분석을 위해 SDS-PAGE 상에서 분리하였다.
도 16a: LS를 이용한 LSH205A/E206A-결합 O-당단백질의 효소 용리를 보여주는 실험 결과. 비시알릴화된 아바타셉트(10 μg, PBS 중의 100 μl) 및 에타너셉트 (50 μg; PBS 중의 100 μl)를 50 μl PBS-평형화된 LSH205A/E206A 수지에 첨가하였다. 단백질을 엔드-오버-엔드 회전으로 실온에서 2시간 동안 수지에 결합하게 하였다. 100 μl PBS의 총 부피 중의 50 유닛 LS를 첨가하기 전에 수지를 결합 완충액(350 μl)으로 3회 세척하였다. 샘플을 진탕(450 rpm)하면서 37℃에서 추가의 6 내지 24시간 동안 항온 처리하였다. 8 M 우레아(50 μl, 5 분 인큐베이션; 2회 반복)를 첨가하여 컬럼을 최종적으로 용리하기 전에 원심분리(1000 g, 1 분)를 통해 LS 방출 O-당단백질/글리코펩티드를 수집하였다. 모든 샘플을 분석을 위해 SDS-PAGE 상에서 분리하였다.
도 16b: LS로 용리된 에타너셉트의 질량 분석(LC/MS 및 MS/MS)의 결과. 확인된 펩티드(도 16b.1)는 에타너셉트(도 16b.2)의 LS 소화에서 생성된 것과 일치하였다. m/z 값 및 MS/MS 데이터를 기초로 확인된 펩티드(흰색 박스)를 에타너셉트의 서열에 맞추었으며, y' 및 b' 이온은 작은 회색 박스로 표시하였다. 모든 흰색 박스(예컨대 펩티드)는 O-글리칸이 부착된 T 또는 S에서 직접 시작한다.
도 17: O-글리코실화된 혈청 단백질의 친화성 정제 및 농축을 입증하는 결과. (A) 비시알릴화된 혈청(20 μl; PBS 중의 100 μl )을 50 μl PBS 평형화된 LSH205A/E206A 수지에 첨가하였다. 단백질을 엔드-오버-엔드 회전으로 실온에서 2시간 동안 수지에 결합하게 하였다. 수지를 결합 완충액(350 μl)으로 3회 세척한 다음 8 M 우레아를 첨가하여 용리하였다. (B) 상호작용에 대한 글리칸의 영향을 조사하기 위해, 샘플을 시알리다제 혼합물 +/- O-글리코시다제로 전처리하였다. 하류 정제를 상기와 같이 수행하였다. (C) 혈청 (40 μl)을 PBS (최대 100 μl) 및 시알리다제 혼합물(50~500 유닛)과 혼합하고 PBS 평형화된 컬럼에 첨가하고, 엔드-오버-엔드 회전으로 실온에서 2시간 동안 항온 처리한 후, 샘플을 상기와 같이 세척하고 용리하였다. 모든 샘플을 분석을 위해 SDS-PAGE 상에서 분리하였다.
도 18: 인간 혈청으로부터 O-당단백질을 농축한 결과. PBS 중에서 2.5x로 희석하여 100 μl로 희석된 인간 혈청을 스핀 컬럼 중의 50 μl PBS 평형화된 LSH205A/E206A 수지에 적용하였다. 50~500 유닛의 시알리다제 혼합물을 첨가하고 실온에서 2시간 동안 수지 상에서 동시 항온 처리하였다. 통과물을 수집하고, 수지를 PBS로 5~10회 세척하였다. 결합된 단백질을 8 M 우레아 중에서 용리한 후 5 mM DTT를 첨가하여 변성 및 환원을 수행하고 37℃에서 60분 동안 항온 처리하였다. 환원된 시스테인을 실온의 어두운 곳에서 30분 동안 15 mM 요오도아세트아미드로 알킬화 하였다. 스핀 탈염 컬럼에서 샘플을 50 mM Tris pH 8.0으로 완충액 교환하였다. 트립신(2.5 μg)을 용액에 첨가하고 소화를 37℃에서 밤새 수행하였다. 펩티드를 분리하고 45 ℃에서 MQ 중의 0.1%FA : 95% ACN 중의 0.1%FA 구배 및 0.2 ml/분의 유속에서 C18 컬럼 상에서 RP-LC MS/MS를 사용하여 분석하였다. ESI-Q-TOF에서 검출하였다. 데이터를 mgf 포맷 파일로 변환하고 Swiss Prot 데이터베이스에 대해 검색하였다. (A) O-글리코실화된 단백질 또는 비-O-글리코실화된 것으로 주석이 붙은 단백질로부터 유래한 확인된 펩티드. >6의 매칭 펩티드 및 >200의 MASCOT 점수를 갖는 단백질만 포함시켰다. (B) 상이한 세척 단계는 확인된 펩티드의 변화뿐만 아니라, O-글리코실화된 단백질 대 비-O-글리코실화된 단백질의 변화된 비를 초래하였다. (C). Sia = 시알리다제 처리된 것; Sia Pre = 시알리다제 전처리 된 것.
도 19: 고정화된 이중-돌연변이체가 또한 보다 짧은 O-글리코펩티드에 결합한다는 것을 보여주는 실험 결과. 도 19a는 O-글리코실화된 펩티드(글리코드로소신 (GD)) 및 몇몇 비-글리코실화된 펩티드(H2686, H4062 H8390 및 인슐린 산화된 베타 쇄(IOB))의 제조된 혼합물에 대한 결합의 LC/MS 분석에 대한 대표적인 결과를 나타낸다. 도 19b는 트립신 소화가 단일 O-글리코실화된 펩티드를 생성할 것임을 나타내는 IgA의 개략도를 보여준다. 도 19c는 IgA의 트립신 소화에 결합하는 LC/MS 분석에 대한 대표적인 결과를 보여준다.
도 20: 고정화된 이중-돌연변이체가 다른 상업적으로 입수가능한 O-당단백질 결합 매트릭스와 유리하게 비교됨을 보여주는 실험 결과. 도 20a는 도시된 바와 같이 상이한 고정화된 렉틴 또는 LS 이중 돌연변이체와의 항온 처리 후 통과물(FT) 또는 용리물(E)에서 에타너셉트 또는 비시알릴화된 에타너셉트(에타너셉트(S))의 존재를 비교하는 대표적인 SDS-PAGE 겔을 나타낸다. 도 20b는 1.5 μg의 직접적으로 로딩된 기질의 양성 대조군에 대한 겔의 밀도 측정 분석을 보여준다.
서열의 간단한 설명
서열번호 1은 O-당단백질-특이적 엔도프로테아제 활성을 갖는 폴리펩티드의 아미노산 서열이다.
서열번호 2는 O-당단백질-특이적 엔도프로테아제 활성을 갖는 본 발명의 예시적인 폴리펩티드의 아미노산 서열이다. 서열번호 1과 비교하여, 이는 추가의 N 말단 메티오닌 및 C-말단 링커 + His6 태그를 포함한다. 이러한 서열로 이루어진 폴리펩티드는 본원에서 LS로 지칭될 수 있다.
서열번호 3은 서열번호 2의 서열을 갖는 폴리펩티드를 인코딩하는 뉴클레오티드 서열이다.
서열번호 4는 O-당단백질-특이적 엔도프로테아제 활성을 갖는 아커만시아 뮤시니필라로부터 단리된 폴리펩티드의 야생형 아미노산 서열이다. 서열번호 1과 비교하여, 이는 N-말단에서 신호 모티프를 포함한다.
서열번호 5는 O-글리칸에는 결합할 수 있지만 O-당단백질-특이적 엔도프로테아제 활성은 없거나 감소된 폴리펩티드의 아미노산 서열이다.
서열번호 6은 O-글리칸에는 결합할 수 있지만 O-당단백질-특이적 엔도프로테아제 활성은 없거나 감소된 예시적인 폴리펩티드의 아미노산 서열이다. 서열번호 5와 비교하여, 이는 추가의 N 말단 메티오닌 및 C-말단 링커 + His6 태그를 포함한다. 이러한 서열로 이루어진 폴리펩티드는 본원에서 LSE206A로 지칭될 수 있다.
서열번호 7은 서열번호 6의 서열을 갖는 폴리펩티드를 인코딩하는 뉴클레오티드 서열이다.
서열번호 8은 O-당단백질-특이적 엔도프로테아제 활성을 갖는 본 발명의 예시적인 폴리펩티드의 메탈로프로테아제 도메인 모티프이다.
서열번호 9는 아커만시아 뮤시니필라로부터 단리된, 시알리다제 Am1757의 야생형 아미노산 서열이다. 이는 N 말단에 신호 모티프를 포함한다.
서열번호 10은 서열번호 9와 비교하여 N 말단에 신호 모티프가 결여된, 시알리다제 Am1757의 야생형 아미노산 서열이다.
서열번호 11은 예시적인 시알리다제 Am1757의 아미노산 서열이다. 서열번호 10과 비교하여, 이는 추가의 N 말단 메티오닌 및 C-말단 링커 + His6 태그를 포함한다.
서열번호 12는 아커만시아 뮤시니필라로부터 단리된, 시알리다제 Am0707의 야생형 아미노산 서열이다. 이는 N 말단에 신호 모티프를 포함한다.
서열번호 13은 서열번호 12와 비교하여 N 말단에 신호 모티프가 결여된, 시알리다제 Am0707의 야생형 아미노산 서열이다.
서열번호 14는 예시적인 시알리다제 Am0707의 아미노산 서열이다. 서열번호 13과 비교하여, 이는 추가의 N 말단 메티오닌 및 C-말단 링커 + His6 태그를 포함한다.
서열번호 15는 S. 오랄리스(oralis)로부터 단리된 O-글리코시다제의 아미노산 서열이다.
서열번호 16 및 17은 프라이머 서열이다.
서열번호 18은 EPO의 아미노산 서열을 나타낸다.
서열번호 20은 O-글리칸에는 결합할 수 있지만 O-당단백질-특이적 엔도프로테아제 활성이 없거나 감소된 폴리펩티드의 아미노산 서열이다.
서열번호 21은 O-글리칸에는 결합할 수 있지만 O-당단백질-특이적 엔도프로테아제 활성이 없거나 감소된 본 발명의 예시적인 폴리펩티드의 아미노산 서열이다. 서열번호 20과 비교하여, 이는 추가의 N 말단 메티오닌 및 C-말단 링커 + His6 태그를 포함한다. 이러한 서열로 이루어진 폴리펩티드는 본원에서 LSHE206AA 또는 LSH205A/E206A로 지칭될 수 있다.
서열번호 22는 서열번호 21의 서열을 갖는 폴리펩티드를 인코딩하는 뉴클레오티드 서열이다.
서열번호 23, 24 및 25는 각각이 O-글리칸에는 결합할 수 있지만 O-당단백질-특이적 엔도프로테아제 활성이 없거나 감소된 본 발명의 폴리펩티드의 파괴된 메탈로프로테아제 도메인 모티프의 서열이다.
서열번호 26, 27 및 28은 각각이 O-당단백질-특이적 엔도프로테아제 활성을 갖는 폴리펩티드의 아미노산 서열이다.
서열번호 29, 30 및 31은 O-당단백질-특이적 엔도프로테아제 활성을 갖는 예시적인 폴리펩티드의 아미노산 서열이다. 각각 서열번호 26, 27 및 28과 비교하여, 서열번호 29, 30 및 31 각각은 추가의 N 말단 메티오닌 및 C-말단 링커 + His6 태그를 포함한다.
서열번호 32, 33 및 34는 O-당단백질-특이적 엔도프로테아제 활성을 갖는 폴리펩티드의 야생형 아미노산 서열이며, 이는 각각 슈도모나스 에루지노사 PAO1, 박테리오데스 테타이오타오미크론 VPI-5482, 및 클로스트리디움 퍼프린젠스로부터 단리되었다. 각각 서열번호 26, 27 및 28과 비교하여, 각각은 N 말단에 신호 모티프를 포함한다.
서열번호 35, 36 및 37은 각각 O-글리칸에는 결합할 수 있지만 O-당단백질-특이적 엔도프로테아제 활성이 없거나 감소된 폴리펩티드의 아미노산 서열이다.
서열번호 38, 39, 및 40은 각각 O-글리칸에는 결합할 수 있지만 O-당단백질-특이적 엔도프로테아제 활성이 없거나 감소된 본 발명의 예시적인 폴리펩티드의 아미노산 서열이다. 각각 서열번호 35, 36 및 37과 비교하여, 서열번호 38, 39 및 40은 각각 추가의 N 말단 메티오닌 및 C-말단 링커 + His6 태그를 포함한다.
서열번호 41 내지 43은 O-당단백질-특이적 엔도프로테아제의 대표적인 메탈로프로테아제 모티프의 아미노산 서열이다.
서열번호 44 내지 46은 O-글리칸에는 결합할 수 있지만 O-당단백질-특이적 엔도프로테아제 활성이 없거나 감소된 폴리펩티드의 대표적인 파괴된 메탈로프로테아제 모티프의 아미노산 서열이다.
서열번호 47은 글리코드로소신 펩티드의 아미노산 서열이다. T 잔기에 O-글리코실화 부위가 있다.
서열번호 48 내지 50은 O-글리코실화 되지 않은 펩티드의 아미노산 서열이다.
도 2: LS는 특히 O-글리칸을 함유하는 단백질에 작용한다 - 도는 SDS-PAGE에 의해 분석된 생성물을 나타낸다. LS를 IgG 또는 IgA와 함께 항온 처리하면 IgA의 특이적 분해가 발생하지만, IgG(허셉틴/트라스투주맙)에 대한 가시적인 활성은 없었다. 모든 항온 처리는 PBS에서 37℃에서 밤새 이루어졌다. 이러한 조건 동안 시알리다제(Am0707)의 첨가는 LS의 활성에 필요하지 않았다.
도 3: 최적의 효소 조건. LS는 넓은 pH 범위에서 활성이고(A), NaCl을 잘 견뎌내지만(B), EDTA에 대해 매우 민감하며(C, D), Zn2+에 의해 부분적으로 억제된다(D). 모든 실험(pH 분석 제외)은 37℃에서 PBS에서 밤새 수행하였다. pH 최적 측정을 위해, 효소를 20 mM Tris-HCl (pH 6.8-8.8) 또는 50 mM 아세트산 (pH 5.6)에서 항온 처리하였다.
도 4: LS의 활성은 글리칸 조성에 의해 조절된다. (A) LS로 30분 동안 가수분해 하기 전에 특정 글리칸을 순차적으로 제거한 결과 시알릴화된 단백질에서 활성이 매우 낮고, 비시알릴화된 단백질에서 활성이 높고, 갈락토스가 제거된 샘플에서는 활성이 없었다. (S) 시알리다제, (SG) 시알리다제 및 갈락토시다제, (LS) LS. (B) 완전히 글리코실화된(엔브렐) 또는 시알리다제 처리된(엔브릴(S)) 당단백질의 연장된 항온 처리(밤새)는 두 샘플 모두에서 완전한 가수분해를 초래하였다. 엔브렐은 본원에서 에타너셉트(etanercept)로도 지칭될 수 있다. (C) 에타너셉트(TNFαR)의 TNFα 결합 부분을 시알리다제("시알리다제"), O-글리코시다제/시알리다제("O-glyc"), 또는 PNGaseF("N-glyc")로 전처리하여 시알산, O-글리칸, 및 N-글리칸을 각각 제거하였다. LS를 샘플에 첨가하고, 분석 전에 항온 처리를 밤새 지속하였다. LS는 O-글리코시다제로 처리된 샘플을 제외한 모든 샘플에서 활성을 가졌다.
도 5: LS가 O-글리칸의 당단백질 N-말단을 가수분해한다는 것을 보여주는 검색 결과. LS를 사용하여 단편으로 가수분해되고, 이어서 O-글리코시다제 처리로 탈글리코실화된 에타너셉트를 질량 분석(LC/MS 및 MS/MS)하였다. 확인된 펩티드(백색 및 해칭 박스)를 m/z 값 및 MS/MS 데이터에 기초하여 에타너셉트의 서열에 맞추고, y' 및 b' 이온을 작은 회색 박스로 표시하였다. 모든 백색 및 해칭 박스(예컨데, 펩티드)는 T 또는 S에서 직접 시작하며, 여기에 O-글리칸이 부착된다. 선행 아미노산은 다양하고(P, S, H, T, G), 가수분해에 영향을 미치지 않는 것으로 보인다. (A) S/T-펩티다제로 생성된 펩티드를 구체적으로 검색하는, 편향 접근접을 사용한 분석. (B) 비편향 접근법을 사용한 분석.
도 6: 불활성화된 LS는 O-연결 당단백질에 특이적으로 결합한다. 메탈로프로테아제 활성 부위를 돌연변이시켜 기질 친화성 또는 상호작용에 영향을 미치지 않으면서 촉매능을 제거하였다. 구체적으로 이는 E를 A로 교환하여 클론 "LSmut"(LSE206A로도 지칭됨)를 생성함으로써 이루어졌다. (A) LS는 시알리다제의 존재 하에 엔브렐을 가수분해 할 수 있었지만, 불활성화된 Lsmut는 시험된 조건 하에 엔브렐을 가수분해할 수 없었다. 활성의 상실을 SDS-PAGE 상에서 확인하였다. (B) 가수분해 활성이 상실되었지만, LSmut는 여전히 O-당단백질에 결합할 수 있었다. 특이적 결합을 고정된 LSE206A를 갖는 스핀 컬럼에서 확인하였으며, O-연결 당단백질에 대한 특이적 친화성을 입증하였다. 세파로스에 LSmut를 고정시킴으로써, IgA를 친화성 정제할 수 있었다. O-글리칸이 없는 허셉틴(트라스투주맙), 및 O-글리코시다제 처리된 IgA는 컬럼에 결합하지 않았지만, 통과물(flowthrough, FT)에서 검출될 수 있다. Neur = 뉴라미니다제/시알리다제 0707.
도 7: α2-3 결합된 시알산은 LS의 효율을 제한한다. 엔브렐을 당단백질 기질로 사용하여 30분 내지 20시간 동안 다양한 시알리다제 세트와 LS를 동시 항온 처리하면 α2-3 특이적 시알리다제 1757의 존재 하에, 또는 혼합물(0707 + 1757)과 함께 더 높은 효율을 나타낸 반면, 넓은 범위의 시알리다제 0707은 LS의 전체 활성에 필요한 것은 아니므로 α2-6 (및 α2-8) 결합은 LS 활성에 대한 우려가 아님을 시사한다.
도 8: LS 활성의 개략도. LS는 O-연결 GalNAc에 부착된 말단 갈락토스를 우선적으로 결합시켜 글리칸이 부착된 세린 또는 트레오닌의 N-말단 가수분해를 초래한다. 시알산의 존재는 LS의 효율을 감소시키지만, 이를 억제하지는 않을 것이다. N-연결 글리칸에서는 활성을 보이지 않는다.
도 9: 에리스로포이에틴을 상이한 조합의 LS, N-글리칸을 제거하기 위한 PNGaseF, 시알산을 제거하기 위한 시알리다제, 및 O-글리칸을 제거하기 위한 O-글리코시다제로 절단한 실험 결과. 반응 생성물을 SDS-PAGE, RPLC 및 ESI 질량 분석법으로 분석하였다 (A) SDS-PAGE 분석 결과: 레인 1 = PNGaseF 및 시알리다제로 처리된 EPO; 레인 2 = PNGaseF 및 시알리다제 + LS로 처리한 EPO; 레인 3 = PNGaseF + LS로 처리한 EPO; 레인 4 = LS로 처리하기 전에 PNGaseF, 시알리다제, O-글리코시다제로 처리한 EPO; 레인 5 = 효소 대조군. 밴드 X = 비절단된 EPO; 밴드 Y = LS에 의해 소화된 EPO의 N 말단 단편; 밴드 Z = LS에 의해 소화된 EPO의 C 말단 단편. 레인 2 및 3은 시알산이 제거된 곳 및 시알산이 손상되지 않은 곳에서 LS가 EPO를 절단한다는 것을 보여준다. 레인 2 및 3은 N-글리칸이 PNGaseF로 제거된 곳에서 LS가 EPO를 또한 절단한다는 것을 보여준다. 레인 4는 O-글리칸이 제거된 곳에서 LS가 EPO를 절단하지 않는다는 것을 보여준다. (B) UV 크로마토그램은 PNGaseF 및 시알리다제 + LS로 처리된 EPO에 대한 RPLC 분리의 결과를 보여준다. 도시된 바와 같이 2개의 주요 피크가 확인되었다. 피크 1은 LS에 의해 소화된 EPO의 C 말단 단편이다; 피크 2는 LS에 의해 소화된 EPO의 N 말단 단편이다; (C, D)는 질량 분석법 분석 결과를 나타낸다. 도 C는 (현재 N 말단) 세린에 여전히 부착된 O-글리칸을 갖는 EPO의 C 말단 단편의 질량을 나타낸다(사각형 = GlcNAc, 원 = 갈락토스). 질량의 차이는 샘플 일부분에서 O-글리칸의 분해 차이(말단 갈락토스 손실)에 기인하며, 이는 MS 기구의 이온화 에너지에 의해 야기될 수 있다; 도 D는 글리칸이 결여된 EPO의 N 말단 단편과, 글리칸이 여전히 부착된 소화되지 않은 EPO를 보여준다.
도 10: LSE206A가 일부 활성을 보유하는 반면 LSH205A/E206A(LS HE206AA로도 지칭될 수 있음)가 완전히 비활성화된 실험 결과. LS 돌연변이체 LSE206A (A) 및 LSH205A/E206A (B)의 활성을 야생형 LS 효소와 비교하여, 에타너셉트의 TNFα 결합 부분(TNFaR2; 본원에서 TNFaR로도 지칭될 수 있음) 및 에타너셉트 그 자체(에타너셉트)를 포함하여 비시알릴화된 O-글리코실화된 기질에 대해 평가하였다. 상이한 농도의 LS 돌연변이체를 1 μg 기질(1:1 내지 15;1, 효소:기질)에 첨가하고, SDS-PAGE 상에서 분석하기 전에 37℃에서 밤새 항온 처리하였다.
A) 레인 1: 비시알릴화된 기질 단독; 레인 2: LS 단독, 레인 3: 0.5 μg LSE206A, 레인 4: 5 μg LSE206A, 레인 5: TNFaR2 + LS(1:1 비율), 레인 6: TNFaR2 + LSE206A(1:1 비율).
B) 레인 1: 비시알릴화된 기질 단독; 레인 2: LSH205A/E206A + 에타너셉트(15:1 비율), 레인 3: LSH205A/E206A + 에타너셉트(5:1 비율), 레인 4: LSH205A/E206A + 에타너셉트(1:1 비율), 레인 5: LS + 에타너셉트(1:1 비율), 레인 6: LSH205A/E206A
도 11: 수지에 고정화된 LSH205A/E206A가 단백질을 함유하는 O-글리칸에 특이적으로 결합함을 보여주는 실험 결과. 도는 각각의 경우에 시작/로딩 물질, 통과물(FT) 및 용리물(E)에 대한 SDS-PAGE 분석을 나타낸다 ( A ) 샘플은 BSA(소 혈청 알부민), 에타너셉트, IgA, 및 IgG를 포함함, 도시된 바와 같이 천연 또는 시알리다제 혼합물 +/- O-글리코시다제로 전처리됨. ( B ) 샘플은 O-글리코실화된 단백질(TNFaR 및 ApoE), N-글리코실화된 단백질(애플리버셉트, AGP (알파-1-산 당단백질), IgG Fc (IgG의 Fc 도메인) 및 비-글리코실화된 단백질(BSA)의 혼합물을 포함함, 시알리다제 혼합물로 전처리됨. ( C ) 샘플은 N-글리코실화된 단백질(세툭시맙, 애플리버셉트, AGP) 및 비-글리코실화된 단백질(BSA, 탄산 무수화효소)의 혼합물을 포함함, 시알리다제 혼합물로 전처리함.
도 12: 고정된 LSH205A/E206A가 O-당단백질의 결합에 대한 농도 의존능을 갖는다는 것을 보여주는 실험 결과. 비시알릴화된 에타너셉트(50~250 μg; 100 μl PBS 중)를 상이한 고정화 조건의 LSH205A/E206A(5~15 mg/mL)를 포함하는 50 μl PBS-평형화된 LSH205A/E206A 수지에 첨가하였다. 단백질을 엔드-오버-엔드 회전으로 실온에서 2시간 동안 수지에 결합하게 하였다. 수지를 PBS(350 μl)로 3회 세척한 다음 8 M 우레아(50 μl, 5분 항온 처리; 2회 반복)를 첨가하여 용리하였다. 결합에서 우레아 및 구아니딘 히드로클로리드(GHCl)의 효과를 연구하기 위해, 결합 완충액에 50 μg의 비시알릴화된 에타너셉트와 함께 포함시켰지만, 다른 것은 동일하게 취급하였다. (A) 모든 샘플을 SDS-PAGE에서 분리하고 GelDoc EZ 및 소프트웨어 ImageLab을 사용하여 밀도 측정법을 통해 밴드 강도를 결정하였다. 언급된 퍼센트는 대조군과 비교하여 밴드 강도를 나타낸다. (B) 밴드 강도에 의해 결정된 단백질 결합 능력을 고정된 LSH205A/E206A의 양에 대해 플롯팅하였다.
도 13: LSH205A/E206A가 약 3 mg의 에타너셉트/mL 수지를 친화성 정제할 수 있음을 보여주는 실험 결과. 비시알릴화된 에타너셉트(10~200 μg; PBS 중의 100 μl)를 50 μl PBS-평형화된 LSH205A/E206A 수지에 첨가하였다. 단백질을 엔드-오버-엔드 회전으로 실온에서 2시간 동안 수지에 결합하게 하였다. 수지를 PBS(350 μl)로 3회 세척한 다음 8 M 우레아(50 μl, 5분 항온 처리; 2회 반복)를 첨가하여 용리하였다. 모든 샘플을 SDS-PAGE에서 분리하고 GelDoc EZ 및 소프트웨어 ImageLab을 사용하여 밀도 측정법을 통해 밴드 강도를 결정하였다. 언급된 퍼센트는 대조군과 비교하여 밴드 강도를 나타낸다.
도 14: LSH205A/E206A-기질 상호작용이 높은 이온 강도 및 완충액 부피/유형의 차이에 둔감하고, 넓은 pH 범위에서 작동함을 보여주는 실험 결과. (A) 비시알릴화된 에타너셉트, 50 μg; 도시된 바와 같은 농도에서 첨가된 NaCl을 포함하는 PBS 중의 100 μl (B) 비시알릴화된 에타너셉트, 50 μg; 도시된 바와 같이 PBS 중의 100~300 μl; (C) 비시알릴화된 에타너셉트(50 μg) 및 도시된 바와 같이 상이한 pH에서 상이한 완충액 중의 BSA(50 μg)의 샘플로부터의 통과물; (D) C 샘플로부터의 용리물.
도 15: 변성 또는 세제의 첨가가 LSH205A/E206A에 결합된 O-당단백질을 용리한다는 것을 보여주는 실험 결과. 비시알릴화된 에타너셉트(50 μg; PBS 중의 100 μl)를 50 μl의 PBS-평형화된 LSH205A/E206A 수지에 첨가하였다. 단백질을 엔드-오버-엔드 회전으로 실온에서 2시간 동안 수지에 결합하게 하였다. 수지를 PBS(350 μl)로 3회 세척한 다음 (A) 1~8 M 우레아 또는 (B) 1.25~10% SDS (50 μl, 5분 항온 처리; 2회 반복)를 첨가하여 용리하였다. 모든 샘플을 분석을 위해 SDS-PAGE 상에서 분리하였다.
도 16a: LS를 이용한 LSH205A/E206A-결합 O-당단백질의 효소 용리를 보여주는 실험 결과. 비시알릴화된 아바타셉트(10 μg, PBS 중의 100 μl) 및 에타너셉트 (50 μg; PBS 중의 100 μl)를 50 μl PBS-평형화된 LSH205A/E206A 수지에 첨가하였다. 단백질을 엔드-오버-엔드 회전으로 실온에서 2시간 동안 수지에 결합하게 하였다. 100 μl PBS의 총 부피 중의 50 유닛 LS를 첨가하기 전에 수지를 결합 완충액(350 μl)으로 3회 세척하였다. 샘플을 진탕(450 rpm)하면서 37℃에서 추가의 6 내지 24시간 동안 항온 처리하였다. 8 M 우레아(50 μl, 5 분 인큐베이션; 2회 반복)를 첨가하여 컬럼을 최종적으로 용리하기 전에 원심분리(1000 g, 1 분)를 통해 LS 방출 O-당단백질/글리코펩티드를 수집하였다. 모든 샘플을 분석을 위해 SDS-PAGE 상에서 분리하였다.
도 16b: LS로 용리된 에타너셉트의 질량 분석(LC/MS 및 MS/MS)의 결과. 확인된 펩티드(도 16b.1)는 에타너셉트(도 16b.2)의 LS 소화에서 생성된 것과 일치하였다. m/z 값 및 MS/MS 데이터를 기초로 확인된 펩티드(흰색 박스)를 에타너셉트의 서열에 맞추었으며, y' 및 b' 이온은 작은 회색 박스로 표시하였다. 모든 흰색 박스(예컨대 펩티드)는 O-글리칸이 부착된 T 또는 S에서 직접 시작한다.
도 17: O-글리코실화된 혈청 단백질의 친화성 정제 및 농축을 입증하는 결과. (A) 비시알릴화된 혈청(20 μl; PBS 중의 100 μl )을 50 μl PBS 평형화된 LSH205A/E206A 수지에 첨가하였다. 단백질을 엔드-오버-엔드 회전으로 실온에서 2시간 동안 수지에 결합하게 하였다. 수지를 결합 완충액(350 μl)으로 3회 세척한 다음 8 M 우레아를 첨가하여 용리하였다. (B) 상호작용에 대한 글리칸의 영향을 조사하기 위해, 샘플을 시알리다제 혼합물 +/- O-글리코시다제로 전처리하였다. 하류 정제를 상기와 같이 수행하였다. (C) 혈청 (40 μl)을 PBS (최대 100 μl) 및 시알리다제 혼합물(50~500 유닛)과 혼합하고 PBS 평형화된 컬럼에 첨가하고, 엔드-오버-엔드 회전으로 실온에서 2시간 동안 항온 처리한 후, 샘플을 상기와 같이 세척하고 용리하였다. 모든 샘플을 분석을 위해 SDS-PAGE 상에서 분리하였다.
도 18: 인간 혈청으로부터 O-당단백질을 농축한 결과. PBS 중에서 2.5x로 희석하여 100 μl로 희석된 인간 혈청을 스핀 컬럼 중의 50 μl PBS 평형화된 LSH205A/E206A 수지에 적용하였다. 50~500 유닛의 시알리다제 혼합물을 첨가하고 실온에서 2시간 동안 수지 상에서 동시 항온 처리하였다. 통과물을 수집하고, 수지를 PBS로 5~10회 세척하였다. 결합된 단백질을 8 M 우레아 중에서 용리한 후 5 mM DTT를 첨가하여 변성 및 환원을 수행하고 37℃에서 60분 동안 항온 처리하였다. 환원된 시스테인을 실온의 어두운 곳에서 30분 동안 15 mM 요오도아세트아미드로 알킬화 하였다. 스핀 탈염 컬럼에서 샘플을 50 mM Tris pH 8.0으로 완충액 교환하였다. 트립신(2.5 μg)을 용액에 첨가하고 소화를 37℃에서 밤새 수행하였다. 펩티드를 분리하고 45 ℃에서 MQ 중의 0.1%FA : 95% ACN 중의 0.1%FA 구배 및 0.2 ml/분의 유속에서 C18 컬럼 상에서 RP-LC MS/MS를 사용하여 분석하였다. ESI-Q-TOF에서 검출하였다. 데이터를 mgf 포맷 파일로 변환하고 Swiss Prot 데이터베이스에 대해 검색하였다. (A) O-글리코실화된 단백질 또는 비-O-글리코실화된 것으로 주석이 붙은 단백질로부터 유래한 확인된 펩티드. >6의 매칭 펩티드 및 >200의 MASCOT 점수를 갖는 단백질만 포함시켰다. (B) 상이한 세척 단계는 확인된 펩티드의 변화뿐만 아니라, O-글리코실화된 단백질 대 비-O-글리코실화된 단백질의 변화된 비를 초래하였다. (C). Sia = 시알리다제 처리된 것; Sia Pre = 시알리다제 전처리 된 것.
도 19: 고정화된 이중-돌연변이체가 또한 보다 짧은 O-글리코펩티드에 결합한다는 것을 보여주는 실험 결과. 도 19a는 O-글리코실화된 펩티드(글리코드로소신 (GD)) 및 몇몇 비-글리코실화된 펩티드(H2686, H4062 H8390 및 인슐린 산화된 베타 쇄(IOB))의 제조된 혼합물에 대한 결합의 LC/MS 분석에 대한 대표적인 결과를 나타낸다. 도 19b는 트립신 소화가 단일 O-글리코실화된 펩티드를 생성할 것임을 나타내는 IgA의 개략도를 보여준다. 도 19c는 IgA의 트립신 소화에 결합하는 LC/MS 분석에 대한 대표적인 결과를 보여준다.
도 20: 고정화된 이중-돌연변이체가 다른 상업적으로 입수가능한 O-당단백질 결합 매트릭스와 유리하게 비교됨을 보여주는 실험 결과. 도 20a는 도시된 바와 같이 상이한 고정화된 렉틴 또는 LS 이중 돌연변이체와의 항온 처리 후 통과물(FT) 또는 용리물(E)에서 에타너셉트 또는 비시알릴화된 에타너셉트(에타너셉트(S))의 존재를 비교하는 대표적인 SDS-PAGE 겔을 나타낸다. 도 20b는 1.5 μg의 직접적으로 로딩된 기질의 양성 대조군에 대한 겔의 밀도 측정 분석을 보여준다.
서열의 간단한 설명
서열번호 1은 O-당단백질-특이적 엔도프로테아제 활성을 갖는 폴리펩티드의 아미노산 서열이다.
서열번호 2는 O-당단백질-특이적 엔도프로테아제 활성을 갖는 본 발명의 예시적인 폴리펩티드의 아미노산 서열이다. 서열번호 1과 비교하여, 이는 추가의 N 말단 메티오닌 및 C-말단 링커 + His6 태그를 포함한다. 이러한 서열로 이루어진 폴리펩티드는 본원에서 LS로 지칭될 수 있다.
서열번호 3은 서열번호 2의 서열을 갖는 폴리펩티드를 인코딩하는 뉴클레오티드 서열이다.
서열번호 4는 O-당단백질-특이적 엔도프로테아제 활성을 갖는 아커만시아 뮤시니필라로부터 단리된 폴리펩티드의 야생형 아미노산 서열이다. 서열번호 1과 비교하여, 이는 N-말단에서 신호 모티프를 포함한다.
서열번호 5는 O-글리칸에는 결합할 수 있지만 O-당단백질-특이적 엔도프로테아제 활성은 없거나 감소된 폴리펩티드의 아미노산 서열이다.
서열번호 6은 O-글리칸에는 결합할 수 있지만 O-당단백질-특이적 엔도프로테아제 활성은 없거나 감소된 예시적인 폴리펩티드의 아미노산 서열이다. 서열번호 5와 비교하여, 이는 추가의 N 말단 메티오닌 및 C-말단 링커 + His6 태그를 포함한다. 이러한 서열로 이루어진 폴리펩티드는 본원에서 LSE206A로 지칭될 수 있다.
서열번호 7은 서열번호 6의 서열을 갖는 폴리펩티드를 인코딩하는 뉴클레오티드 서열이다.
서열번호 8은 O-당단백질-특이적 엔도프로테아제 활성을 갖는 본 발명의 예시적인 폴리펩티드의 메탈로프로테아제 도메인 모티프이다.
서열번호 9는 아커만시아 뮤시니필라로부터 단리된, 시알리다제 Am1757의 야생형 아미노산 서열이다. 이는 N 말단에 신호 모티프를 포함한다.
서열번호 10은 서열번호 9와 비교하여 N 말단에 신호 모티프가 결여된, 시알리다제 Am1757의 야생형 아미노산 서열이다.
서열번호 11은 예시적인 시알리다제 Am1757의 아미노산 서열이다. 서열번호 10과 비교하여, 이는 추가의 N 말단 메티오닌 및 C-말단 링커 + His6 태그를 포함한다.
서열번호 12는 아커만시아 뮤시니필라로부터 단리된, 시알리다제 Am0707의 야생형 아미노산 서열이다. 이는 N 말단에 신호 모티프를 포함한다.
서열번호 13은 서열번호 12와 비교하여 N 말단에 신호 모티프가 결여된, 시알리다제 Am0707의 야생형 아미노산 서열이다.
서열번호 14는 예시적인 시알리다제 Am0707의 아미노산 서열이다. 서열번호 13과 비교하여, 이는 추가의 N 말단 메티오닌 및 C-말단 링커 + His6 태그를 포함한다.
서열번호 15는 S. 오랄리스(oralis)로부터 단리된 O-글리코시다제의 아미노산 서열이다.
서열번호 16 및 17은 프라이머 서열이다.
서열번호 18은 EPO의 아미노산 서열을 나타낸다.
서열번호 20은 O-글리칸에는 결합할 수 있지만 O-당단백질-특이적 엔도프로테아제 활성이 없거나 감소된 폴리펩티드의 아미노산 서열이다.
서열번호 21은 O-글리칸에는 결합할 수 있지만 O-당단백질-특이적 엔도프로테아제 활성이 없거나 감소된 본 발명의 예시적인 폴리펩티드의 아미노산 서열이다. 서열번호 20과 비교하여, 이는 추가의 N 말단 메티오닌 및 C-말단 링커 + His6 태그를 포함한다. 이러한 서열로 이루어진 폴리펩티드는 본원에서 LSHE206AA 또는 LSH205A/E206A로 지칭될 수 있다.
서열번호 22는 서열번호 21의 서열을 갖는 폴리펩티드를 인코딩하는 뉴클레오티드 서열이다.
서열번호 23, 24 및 25는 각각이 O-글리칸에는 결합할 수 있지만 O-당단백질-특이적 엔도프로테아제 활성이 없거나 감소된 본 발명의 폴리펩티드의 파괴된 메탈로프로테아제 도메인 모티프의 서열이다.
서열번호 26, 27 및 28은 각각이 O-당단백질-특이적 엔도프로테아제 활성을 갖는 폴리펩티드의 아미노산 서열이다.
서열번호 29, 30 및 31은 O-당단백질-특이적 엔도프로테아제 활성을 갖는 예시적인 폴리펩티드의 아미노산 서열이다. 각각 서열번호 26, 27 및 28과 비교하여, 서열번호 29, 30 및 31 각각은 추가의 N 말단 메티오닌 및 C-말단 링커 + His6 태그를 포함한다.
서열번호 32, 33 및 34는 O-당단백질-특이적 엔도프로테아제 활성을 갖는 폴리펩티드의 야생형 아미노산 서열이며, 이는 각각 슈도모나스 에루지노사 PAO1, 박테리오데스 테타이오타오미크론 VPI-5482, 및 클로스트리디움 퍼프린젠스로부터 단리되었다. 각각 서열번호 26, 27 및 28과 비교하여, 각각은 N 말단에 신호 모티프를 포함한다.
서열번호 35, 36 및 37은 각각 O-글리칸에는 결합할 수 있지만 O-당단백질-특이적 엔도프로테아제 활성이 없거나 감소된 폴리펩티드의 아미노산 서열이다.
서열번호 38, 39, 및 40은 각각 O-글리칸에는 결합할 수 있지만 O-당단백질-특이적 엔도프로테아제 활성이 없거나 감소된 본 발명의 예시적인 폴리펩티드의 아미노산 서열이다. 각각 서열번호 35, 36 및 37과 비교하여, 서열번호 38, 39 및 40은 각각 추가의 N 말단 메티오닌 및 C-말단 링커 + His6 태그를 포함한다.
서열번호 41 내지 43은 O-당단백질-특이적 엔도프로테아제의 대표적인 메탈로프로테아제 모티프의 아미노산 서열이다.
서열번호 44 내지 46은 O-글리칸에는 결합할 수 있지만 O-당단백질-특이적 엔도프로테아제 활성이 없거나 감소된 폴리펩티드의 대표적인 파괴된 메탈로프로테아제 모티프의 아미노산 서열이다.
서열번호 47은 글리코드로소신 펩티드의 아미노산 서열이다. T 잔기에 O-글리코실화 부위가 있다.
서열번호 48 내지 50은 O-글리코실화 되지 않은 펩티드의 아미노산 서열이다.
개시된 생성물과 방법의 상이한 적용은 기술 분야의 특정한 필요에 따라 변경될 수 있는 것으로 이해된다. 또한, 본원에서 사용된 용어는 오직 발명의 특정 구현예를 설명하기 위한 목적으로 이해되고. 제한하는 것을 의도하지 않는다. 위쪽 또는 아래쪽의 본원에서 인용된 모든 간행물, 특허 및 특허 출원은 그 전체가 참조로서 본 명세서에 포함된다.
본 명세서와 첨부된 청구 범위에서 사용된, 단수 형태인 "하나의"("a", "an"), 및 "그"("the")는 달리 명시적으로 지시하고 있지 않는 한 복수의 지시 대상을 포함한다. 따라서, 예를 들어, "하나의 폴리펩티드"는 "폴리펩티드들"을 지칭하며 기타 등등도 그러하다.
일반적인 폴리펩티드 특징
"폴리펩티드"는 본원에서 광의의 의미로 사용되어 2개 이상의 서브유닛 아미노산, 아미노산 유사체, 또는 다른 펩티드 모방체의 화합물을 지칭한다. 용어 "폴리펩티드"는 따라서 짧은 펩티드 서열 및 보다 긴 폴리펩티드 및 단백질을 또한 포함한다. 용어 "단백질", "펩티드" 및 "폴리펩티드"는 상호교환적으로 사용될 수 있다. 본원에서 사용된 바와 같이, 용어 "아미노산"은 D 또는 L 광학 이성질체를 포함하여, 천연 및/또는 비천연 또는 합성 아미노산, 및 아미노산 유사체 및 펩티드 모방체를 지칭한다.
폴리펩티드는 재조합 또는 합성 방법을 포함하여, 적합한 방법에 의해 생성될 수 있다. 예를 들어, 폴리펩티드는 당업계에 공지된 표준 기술, 예컨대 Fmoc 고상 화학, Boc 고상 화학을 사용하여 직접적으로, 또는 용액상 펩티드 합성에 의해 합성될 수 있다. 대안적으로, 폴리펩티드는 핵산 분자 또는 상기 폴리펩티드를 인코딩하고 있는 벡터를 포함하는 세포, 전형적으로 박테리아 세포를 형질전환시켜 생성될 수 있다. 박테리아 숙주 세포에서 발현에 의한 폴리펩티드의 생성은 아래에서 기술되며 실시예에서 설명된다. 본 발명은 본 발명의 폴리펩티드를 인코딩하는 핵산 분자 및 벡터를 제공한다. 본 발명은 또한 이러한 핵산 또는 벡터를 포함하는 숙주 세포를 제공한다. 본원에 개시된 폴리펩티드를 인코딩하는 예시적인 폴리뉴클레오티드 분자는 서열번호 3 및 7로 제공된다. 이들 서열 각각은 5' 말단에서 N 말단 메티오닌(ATG)에 대한 코돈, 3' 말단에서 정지 코돈(TAA) 앞에, Gly-Ser-Gly 링커 및 6x His 태그에 대한 코돈을 포함하며, 이는 선택적으로 제외될 수 있다. 추가의 메티오닌 및 태그의 선택적인 포함은 아래에서 보다 상세하게 논의된다.
용어 "핵산 분자" 및 "폴리뉴클레오티드"는 본원에서 상호교환적으로 사용되며 임의의 길이의 뉴클레오티드의 중합체 형태, 디옥시리보뉴클레오티드 또는 리보뉴클레오티드, 또는 이의 유사체를 지칭한다. 폴리뉴클레오티드의 비-제한적인 예는 유전자, 유전자 단편, 메신저 RAN(mRNA), cDNA, 재조합 폴리뉴클레오티드, 플라스미드, 벡터, 임의의 서열의 단리된 DNA, 임의의 서열의 단리된 RNA, 핵산 프로브, 및 프라이머를 포함한다. 본 발명의 폴리뉴클레오티드는 본 발명의 폴리펩티드를 인코딩하고 단리되거나 실질적으로 단리된 형태로 제공될 수 있다. 실질적으로 단리되는 것은, 임의의 주변 매질로부터 폴리펩티드를 실질적이지만 완전히 단리되지 않을 수 있음을 의미한다. 폴리뉴클레오티드는 의도된 용도를 방해하지 않고 담체 또는 희석제와 혼합될 수 있으며 여전히 실질적으로 단리된 것으로 간주된다. 선택된 폴리펩티드를 "인코딩"하는 핵산 서열은 적절한 조절 서열의 제어 하에 놓였을 때, 예컨대 발현 벡터에서, 생체 내에서 전사(DNA의 경우)되고 번역(mNRA의 경우)되어 폴리펩티드가 되는 핵산 분자이다. 코딩 서열의 경계는 5' (아미노) 말단의 시작 코돈과 3'(카복시) 말단의 번역 정지 코돈에 의해 결정된다. 본 발명의 목적에서, 이러한 핵산 서열은, 비제한적으로 바이러스, 원핵 또는 진핵 mRNA로부터의 cDNA, 바이러스 또는 원핵 DNA 또는 RNA로부터의 게놈 서열, 및 심지어는 합성 DNA 서열을 포함할 수 있다. 전사 종결 서열은 코딩 서열의 3'에 위치할 수 있다.
Sambrook et al (1989, Molecular Cloning - a laboratory manual; Cold Spring Harbor Press)에 예시로서 기술된 바와 같이, 폴리뉴클레오티드는 당업계에 잘 알려진 방법에 따라 합성될 수 있다. 본 발명의 핵산 분자는 삽입된 서열에 작동적으로 연결된 조절 서열을 포함하는 발현 카세트의 형태로 제공될 수 있으므로, 생체 내에서(예컨대, 원핵 또는 진핵 발현 시스템에서) 본 발명의 폴리펩티드가 발현될 수 있다. 차례로, 이러한 발현 카세트는 전형적으로 벡터(예컨대, 플라스미드 또는 재조합 바이러스 벡터) 내에 제공된다. 이러한 발현 카세트는 숙주 대상에 직접적으로 투여될 수 있다. 대안적으로, 본 발명의 폴리뉴클레오티드를 포함하는 벡터는 숙주 대상에 투여될 수 있다. 바람직하게는, 폴리뉴클레오티드는 유전자 벡터를 이용하여 제조 및/또는 투여될 수 있다. 적합한 벡터는 충분한 양의 유전자 정보를 보유할 수 있고, 본 발명의 폴리펩티드를 발현시킬 수 있는 임의의 벡터일 수 있다.
따라서, 본 발명은 이러한 폴리뉴클레오티드 서열을 포함하는 발현 벡터를 포함한다. 이러한 발현 벡터는 분자 생물학 분야에서 통상적으로 구축되고 예컨대 플라스미드 DNA 및 적합한 개시제, 프로모터, 인핸서 및 기타 요소, 예컨대 필요할 수 있고 본 발명의 펩티드의 발현을 가능케 하기 위해 올바른 배향으로 위치한 폴리아데닐화 신호의 사용을 포함할 수 있다. 다른 적합한 벡터는 당업자에게 명백할 것이다. 이와 관련하여 추가의 예로 우리는 Sambrook et al을 참조한다.
본 발명은 또한 본 발명의 폴리펩티드를 발현시키기 위해 변형된 세포를 포함한다. 이러한 세포는 전형적으로 원핵 세포, 예컨대 박테리아 세포, 예컨대 대장균을 포함한다. 이러한 세포는 본 발명의 폴리펩티드를 생성하기 위한 일상적인 방법을 사용하여 배양될 수 있다.
폴리펩티드는 이의 생산, 단리 또는 정제를 돕기 위해 유도체화 되거나 변형될 수 있다. 예컨대, 본 발명의 폴리펩티드가 박테리아 숙주 세포에서 재조합 발현에 의해 생산되는 경우, 폴리펩티드의 서열은 발현을 향상시키기 위해 N 말단에 추가의 메티오닌(M) 잔기를 포함할 수 있다. 또 다른 예로, 본 발명의 폴리펩티드는 분리 수단에 직접적으로 및 특이적으로 결합할 수 있는 리간드의 추가에 의해 다양화되거나 변형될 수 있다. 대안적으로, 폴리펩티드는 결합 쌍의 하나의 구성원의 첨가에 의해 유도체화 또는 변형될 수 있고 분리 수단은 결합 쌍의 또 다른 구성원의 첨가에 의해 유도체화 또는 변형된 시약을 포함한다. 임의의 적합한 결합 쌍이 사용될 수 있다. 바람직한 구현예에서, 본 발명에서 사용하기 위한 폴리펩티드가 결합 쌍의 하나의 구성원의 추가에 의해 유도체화되거나 변형되는 경우, 폴리펩티드는 바람직하게는 히스티딘-태깅되거나 비오틴-태깅된다. 전형적으로, 히스티딘 또는 비오틴 태그의 아미노산 코딩 서열은 유전자 수준에서 포함되고 폴리펩티드는 대장균에서 재조합적으로 발현된다. 히스티딘 또는 비오틴 태그는 전형적으로 폴리펩티드의 말단에, 바람직하게는 C-말단에 있다. 이는 폴리펩티드에 직접 연결되거나 3, 4, 또는 5개의 글리신 잔기, 또는 글리신과 세린 잔기의 혼합물과 같은 임의의 적합한 링커 서열에 의해 간접적으로 연결될 수 있다. 히스티딘 태그는 전형적으로 6개의 히스티딘 잔기로 이루어지지만, 이보다 길거나, 전형적으로 7, 8, 9, 10 또는 20개 이하의 아미노산, 또는 더 짧게, 예컨대 5, 4, 3, 2 또는 1개의 아미노산으로 이루어질 수 있다.
폴리펩티드는 실질적으로 단리된 또는 정제된 형태로 제공될 수 있다. 즉, 폴리펩티드가 발현되었던 세포로부터의 세포 추출물에 존재하는 대부분의 다른 성분으로부터 단리되었다. 실질적으로 정제함으로써, 폴리펩티드는 적어도 50%, 60%, 70%, 80% 또는 바람직하게는 적어도 90% 균질하게 정제되는 것으로 이해될 것이다. 순도 수준은 임의의 적합한 수단에 의해 평가될 수 있지만, 전형적으로 샘플의 SDS-PAGE 분석 후, 쿠마시 블루 검출을 포함한다. 폴리펩티드는 폴리펩티드의 의도된 목적을 방해하지 않고 담체, 희석제 또는 보존제와 혼합될 수 있으며 여전히 실질적으로 단리 또는 정제된 것으로 간주된다. 폴리펩티드가 다른 폴리펩티드와 같은 추가의 활성 성분을 갖는 조성물로 제공되는 경우, 각각의 상기 폴리펩티드는 각각의 의도된 목적에 적합한 비율로 혼합하기 전에 높은 수준의 균질성으로 개별적으로 정제될 것이다. 예컨대, 2개의 폴리펩티드는 1:1 비로 조합하기 전에 각각 적어도 90% 균질성으로 정제될 수 있다.
폴리펩티드(또는 이의 혼합물)는 사용 전에 수용액에서 재구성에 적합한, 동결건조된 형태로 제공될 수 있다. 동결건조된 조성물은 폴리펩티드의 더 긴 저장을 가능하게 하는 개선된 안정성을 갖는다. Tris-완충 식염수(TBS)와 같은 적합한 완충액으로 상기 폴리펩티드(또는 혼합물)를 동결건조시키는 단계를 포함하는, 동결건조된 형태로 폴리펩티드(또는 이의 혼합물)를 제조하는 방법이 본원에서 제공된다. 폴리펩티드는 전형적으로 동결 건조 전에 실질적으로 정제된다. 동결건조된 형태의 생성된 폴리펩티드(또는 혼합물)가 또한 제공된다. 동결건조된 형태로 폴리펩티드(또는 혼합물)를 제공하는 단계 및 적합한 담체 또는 희석제, 예컨대 물로 재구성하는 단계를 포함하는, 폴리펩티드(또는 혼합물) 용액을 제조하는 방법이 또한 제공된다.
폴리펩티드는 예컨대 Datta S et al., Enzyme immobilization: an overview on techniques and support materials, 3 Biotech, 3(1):1-9 (2013)에 기술된 바와 같이, 당업계에 공지된 방법을 사용하여 고정화될 수 있다. 예컨대, 폴리펩티드는 흡착, 공유 결합, 친화성 고정화 또는 포획에 의해 고정화될 수 있다. 지지체로서 사용될 수 있는 재료는 비제한적으로, 예컨대 천연 지지체 예컨대 아가로스, 콜라겐, 젤라틴, 셀룰로스, 펙틴, 세파로스, 무기 재료 예컨대 세라믹, 실리카, 유리, 활성탄소 또는 숯, 또는 합성 중합체를 포함한다. 예컨대, 폴리펩티드는 선택적으로 수지로서 제공되는, 세파로스 또는 아가로스 상에 고정될 수 있다.
엔도프로테아제 활성을 갖는 폴리펩티드
엔도프로테아제 활성을 갖는 폴리펩티드의 기능적 특성
일 구현예에서, 본 발명은 O-글리코실화된 단백질에 특이적인 엔도프로테아제 활성을 갖는 폴리펩티드에 관한 것이다. 즉, 폴리펩티드는 O-당단백질-특이적 엔도프로테아제 활성을 갖는다. 폴리펩티드는 임의의 O-연결 당단백질, 바람직하게는 임의의 인간 O-연결 당단백질을 절단한다. O-연결 당단백질의 예는 전장 항체, Fc 단편 및 Fc 융합 단백질, 특히, IgA, IgD 및 IgG3 이소형의 것들을 포함하여 면역글로불린의 전부 또는 일부를 포함하거나 이로 이루어진 임의의 단백질을 포함한다. O-연결 당단백질의 또 다른 예는 에타너셉트이며, 이는 수많은 O-글리코실화 부위를 갖는, IgG1의 Fc 부분에 연결된 인간 TNFα 수용체 2의 리간드 결합 도메인의 융합 단백질이다. O-연결 당단백질의 다른 예는 에리스로포이에틴(EPO), TNFα 수용체, 페투인, 및 플라스미노겐을 포함한다.
기질 당단백질의 가수분해(즉, 절단)는 전형적으로 O-글리코실화 세린 또는 트레오닌에 부근에 가까운 펩티드 결합 N-말단에서 높은 특이성으로 발생하며, O-글리칸 의존적이다. 본 발명의 폴리펩티드는 바람직하게는 기질 당단백질의 모든 O-글리코실화 부위에 근접하여 이러한 펩티드 결합을 절단할 수 있다. 반응은 바람직하게는 임의의 아미노산 특이성 또는 제한을 나타내지 않으며, 특히, 임의의 특정 아미노산이 O-글리코실화 세린 또는 트레오닌에 대해 N-말단에 존재할 필요는 없다. 표준 질량 분석법 파라미터를 사용하여 평가할 때, 절단 부위는 일반적으로 각각의 O-글리코실화 잔기에 대해 바로 N 말단의 펩티드 결합에 있는 것으로 일반적으로 관찰된다.
주어진 폴리펩티드의 엔도프로테아제 활성 및 특이성은 적합한 분석법의 수단에 의해 결정될 수 있다. 예컨대, 표준 O-당단백질 기질, 예컨대 IgA 분자 또는 에리스로포이에틴(EPO)이 시험 폴리펩티드와 함께 항온 처리될 수 있다. 이어서 시작 물질 및 반응 생성물이 SDS-PAGE 및/또는 질량 분석법에 의해 분석되어 절단 생성물(임의의 존재하는 것)의 존재를 결정하고 필요한 경우 이들 생성물을 추가로 특성분석할 수 있다. O-글리코실화되지 않은 당단백질 기질, 예컨대 IgG1 분자는 음성 대조군으로 사용될 수 있다. 결과는 기질이 서열번호 2의 아미노산 서열로 이루어진 폴리펩티드와 같이, 본 발명의 예시적인 폴리펩티드와 접촉될 때 동일한 분석에서 얻어진 것들과 비교될 수 있다. 서열번호 2의 폴리펩티드의 1 유닛은 SDS-PAGE에 의해 모니터링 되는 바와 같이, 37℃에서 밤새 20 mM Tris 완충액 pH 6.8에서 시알리다제 혼합물의 1 유닛과 조합하여 1 μg의 에리스로포이에틴(EPO)을 90% 초과로 소화하는데 필요한 양으로 정의된다(바람직한 시알리다제 혼합물이 아래 추가로 기술되어 있음). 시험 폴리펩티드는 바람직하게는 동일한 양으로 존재할 때 유사한 수준의 활성을 달성한다. 예시적인 분석법이 또한 실시예에 기술되어 있다.
엔도프로테아제 활성을 갖는 폴리펩티드의 구조적 특징
본 섹션은 이전의 섹션에 기술된 기능적 특징에 추가하여 적용되는, 이러한 구현예에 따른 폴리펩티드의 구조적 특징을 설명한다.
폴리펩티드는 전형적으로 적어도 150, 200, 250, 275, 280, 290, 300, 310, 320, 330, 340, 350 또는 360 아미노산 길이이다. 폴리펩티드는 전형적으로 400, 395, 390, 385, 380, 375, 370 또는 365 아미노산 길이 이하이다. 폴리펩티드 길이에 대한 범위를 제공하기 위해 상기 열거된 상한 중 임의의 것과 조합될 수 있음을 이해할 것이다. 예컨대, 폴리펩티드는 150 내지 400 아미노산 길이, 또는 280 내지 380 아미노산 길이일 수 있다. 폴리펩티드는 바람직하게는 340 내지 380 아미노산 길이, 가장 바람직하게는 360 내지 375 아미노산 길이이다.
폴리펩티드의 1차 구조(아미노산 서열)는 아커만시아 뮤니시필라의 Amuc1119 유전자에 의해 인코딩된 폴리펩티드의 1차 구조에 기초한다. 이러한 폴리펩티드의 전체 서열이 서열번호 4에 제시되어 있으며, 이는 1-24 위치에 신호 모티프를 포함한다. 신호 모티프가 제거된 서열이 서열번호 1에 제시되어 있다.
본 발명의 폴리펩티드는 서열번호 1의 서열을 포함하거나, 이로 본질적으로 이루어지거나, 이로 이루어질 수 있다.
대안적으로, 본 발명의 폴리펩테드는 서열번호 1의 아미노산 서열과 적어도 50% 동일한 서열번호 1의 아미노산 서열의 변이체를 포함하거나, 이로 본질적으로 이루어지거나, 이로 이루어질 수 있다. 변이체 서열은 서열번호 1의 서열과 적어도 60%, 적어도 70%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일할 수 있다. 동일 수준은 바람직하게는 적어도 85% 이상이다. 서열번호 1의 서열에 대한 동일성은 서열번호 1에 나타낸 서열의 적어도 100, 적어도 200, 적어도 300 또는 적어도 350개 이상의 인접 아미노산 영역에 걸쳐 측정될 수 있거나, 보다 바람직하게는 서열번호 1의 전장에 걸쳐 측정될 수 있다. 변이체는 전형적으로 참조 서열보다 길거나 짧은 50개 이하 아미노산 길이이고, 바람직하게는 참조 서열과 대략(또는 정확하게) 동일한 길이이다.
아미노산 동일성은 임의의 적합한 알고리즘을 사용하여 계산될 수 있다. 예컨대, PILEUP 및 BLAST 알고리즘이 예를 들어 Altschul S. F. (1993) J Mol Evol 36:290-300; Altschul, S, F et al (1990) J Mol Biol 215:403-10에 기술된 것과 같이, 동일성 또는 라인업 서열(예컨대, 동일하거나 상응하는 서열을 식별하는 것(전형적으로 기본 설정))을 계산하기 위해 사용될 수 있다. BLAST 분석을 수행하기 위한 소프트웨어는 국립 생명공학 정보 센터(National Center for Biotechnology Information)(http://www.ncbi.nlm.nih.gov/)를 통해 공개적으로 이용가능하다. 이러한 알고리즘은 데이터베이스 서열에서 동일한 길이의 단어와 정렬될 때 일부 양의 값의 임계 점수 T와 일치하거나 만족하는 쿼리 서열에서 길이 W의 짧은 단어를 식별하여 우선 높은 점수의 서열 쌍(HSP)을 식별한다. T는 이웃 단어 점수 임계값으로 지칭된다(위의 Altschul et al.). 이러한 초기 이웃 단어 적중은 이를 포함하는 HSP를 찾기 위한 검색을 시작하기 위한 시드 역할을 한다. 누적 정렬 점수가 증가될 수 있는 한, 단어 적중은 각 서열을 따라 양방향으로 확장된다. 각 방향으로의 단어 적중에 대한 확장은 다음과 같은 경우에 중지된다: 누적 정렬 점수가 최대 달성 값으로부터 수량 X만큼 떨어지는 경우; 하나 이상의 음의-점수의 잔기 정렬의 축적으로 인해 누적 점수가 0 이하로 되는 경우; 또는 서열의 끝에 도달한 경우. BALST 알고리즘 파라미터 W, T 및 X는 정렬의 감도와 속도를 결정한다. BLAST 프로그램은 11의 단어 길이(W), BLOSUM62 점수 매트릭스(Henikoff and Henikoff (1992) Proc. Natl. Acad. Sci. USA 89: 10915-10919 참조) 50의 정렬(B), 10의 기대값(E), M=5, N=4, 및 두 가닥의 비교를 기본 값으로 사용한다.
BLAST 알고리즘은 두 서열 간의 유사성에 대한 통계적인 분석을 수행한다; 예컨대, Karlin 및 Altschul (1993) Proc. Natl. Acad. Sci. USA 90: 5873-5787을 참조한다. BLAST 알고리즘에 의해 제공되는 유사성의 한 척도는 가장 작은 합 확률(P(N))이며, 이는 두 폴리뉴클레오티드 또는 아미노산 서열 간의 일치가 우연히 발생할 확률의 지표를 제공한다. 예를 들어, 제1서열과 제2서열의 비교에서 가장 작은 합 확률이 약 1 미만, 바람직하게는 약 0.1 미만, 보다 바람직하게는 약 0.01 미만, 및 가장 바람직하게는 약 0.001 미만인 경우 서열은 또 다른 서열과 유사한 것으로 간주된다. 대안적으로, UWGCG Package는 동일성을 계산하는데 사용될 수 있는 BESTFIT 프로그램을 제공한다(예컨대, 기본 설정에 사용)(Devereux et al (1984) Nucleic Acids Research 12, 387-395).
본 발명의 폴리펩티드 서열은 서열번호 1의 아미노산 서열의 변이체를 포함할 수 있으며, 여기서, 아미노산 첨가, 결실 또는 치환과 같은 변형이 서열번호 1의 서열에 대해 이루어진다. 달리 명시되지 않는 한, 변형은 바람직하게는 보존적 아미노산 치환이다. 보존적 치환은 아미노산이 유사한 화학적 구조, 유사한 화학적 특성 또는 유사한 측쇄 부피의 또 다른 아미노산과 대체된다. 도입된 아미노산은 이들이 대체하는 아미노산과 유사한 극성, 친수성, 소수성, 염기성, 산성, 중성 또는 전하를 가질 수 있다. 대안적으로, 보존적 치환은 기존의 방향족 또는 지방족 아미노산에 대신에 방향족 또는 지방족인 또 다른 아미노산을 도입할 수 있다. 보존적 아미노산 변화는 당업계에 잘 알려져 있고 아래 표 A1에 정의된 바와 같은 20개 주요 아미노산의 특성에 따라 선택될 수 있다. 아미노산이 유사한 극성을 갖는 경우, 이는 표 A2의 아미노산 측쇄에 대한 소수성 스케일을 참조하여 결정될 수 있다. 본 발명의 폴리펩티드 서열은 최대 10, 20, 30, 40, 50 또는 60개의 보존적 치환이 이루어진 서열번호 1의 아미노산 서열의 변이체를 포함할 수 있다.
표 A1 - 아미노산의 화학적 특성
표 A2 - 소수성 스케일
본 발명의 폴리펩티드의 아미노산 서열은 상기 서열번호 1의 아미노산 서열의 변이체를 포함할 수 있다. 그러나, 서열번호 1의 아미노산 서열 중의 특정 잔기는 바람직하게는 상기 변이체 서열 내에 유지된다. 예를 들어, 상기 변이체 서열은 전형적으로 엔도프로테아제 활성을 위해 요구되는 것으로 공지된 특정 잔기를 보유한다. 따라서, 서열번호 1의 위치 182(서열번호 4의 위치 206에 상응함)에서의 글루타메이트는 바람직하게는 본 발명의 폴리펩티드의 아미노산 서열에 유지된다. 이러한 잔기는 활성 부위에서의 전자 이동에 필요한 것으로 생각된다. 따라서, 본 발명의 폴리펩티드는 전형적으로 서열번호 1의 위치 182에 상응하는 상기 변이체 서열 중의 위치에 글루타메이트(E)를 갖는 서열번호 1의 아미노산 서열의 변이체를 포함한다. 유사하게, 서열번호 1의 위치 181(서열번호 4의 위치 205에 상응함)의 히스티딘은 바람직하게는 본 발명의 폴리펩티드의 아미노산 서열에 유지된다. 이러한 잔기는 아연 이온 보조-인자에 결합하기 위해 필요한 것으로 생각된다.
상기 글루타메이트 및 상기 히스티딘 잔기는 둘 모두 전형적으로 모티프 HEbbH를 갖는 메탈로프로테아제 도메인 내에 포함되며, 여기서, b는 전하가 없는 아미노산, 예컨대 아미노산 A, C, F, G, I, L, M, N, P, Q, S, T, V 또는 W이다. 이러한 도메인의 바람직한 예는 서열 HELGH(서열번호 41)을 가지며, 이는 서열번호 1의 위치 181 내지 185(서열번호 4의 위치 205 내지 209)에 상응한다. 따라서, 본 발명의 폴리펩티드는 전형적으로 서열번호 1의 위치 181 내지 185에 상응하는 위치에, 모티프 HEbbH(예컨대 HEIGH(서열번호 42) 또는 HELGH, 바람직하게는 HELGH)를 포함하는, 서열번호 1의 아미노산 서열의 변이체를 포함한다. 본 발명의 폴리펩티드는 전형적으로 메탈로프로테아제 도메인에 대한 C-말단에 위치한 O-글리칸 특이적 결합 도메인을 포함한다.
모티프 HEbbH는 모티프 abxHEbbHbc를 갖는 보다 큰 메탈로프로테아제 도메인 내에 포함될 수 있으며, 여기서, a는 아미노산 V, T 또는 G이고, b는 전하가 없는 아미노산, 예컨대 아미노산 A, C, F, G, I, L, M, N, P, Q, S, T, V 또는 W이고, x는 임의의 아미노산이고, c는 소수성 아미노산 예컨대 A, C, F, I, L, M, P, V, W 또는 Y이다. 이러한 도메인의 바람직한 예는 서열 GMAHELGHGL(서열번호 8)을 가지며, 이는 서열번호 1의 위치 178 내지 187(서열번호 4의 위치 202 내지 211)에 상응한다. 다른 예는 GVAHELGHNF(서열번호 43)를 포함한다. 따라서, 본 발명의 폴리펩티드는 바람직하게는 서열번호 1의 178 내지 187의 위치에 상응하는 위치에 모티프 abxHEbbHbc, (예컨대 GMAHELGHGL 또는 GVAHELGHNF, 바람직하게는 GMAHELGHGL)를 포함하는 서열번호 1의 아미노산 서열의 변이체를 포함한다. 본 발명의 폴리펩티드는 전형적으로 메탈로프로테아제 도메인의 C-말단에 위치한 O-글리칸 특이적 결합 도메인을 포함한다.
대안적으로, 본 발명의 폴리펩티드는 상기 서열번호 1의 보다 짧은 단편 또는 이의 변이체를 포함하거나, 이로 본질적으로 이루어지거나, 이루어질 수 있다. 단편은 O-당단백질 특이적-엔도프로테아제 활성을 보유하는 서열번호 1의 절단된 형태로서 기술될 수 있다. 이러한 단편은 서열번호 1보다 짧으며 전형적으로 적어도 100, 150 또는 200 아미노산 길이이다. 단편은 전형적으로 서열번호 1의 위치 182에 상응하는 위치에 글루탐산 잔기(E) 및 서열번호 1의 위치 181에 상응하는 위치에 히스티딘 잔기(H), 및 메탈로프로테아제 도메인의 C-말단에 위치한 O-글리칸 특이적 결합 도메인을 포함하여, 서열번호 1의 위치 178 내지 187에 상응하는 위치에 메탈로프로테아제 도메인을 포함한다.
서열번호 1 또는 이의 변이체, 또는 이들 중 하나의 단편을 포함하는 본 발명의 임의의 폴리펩티드는 선택적으로 N 말단에 추가의 메티오닌 및/또는 C 말단에 히스티딘 또는 다른 태그를 포함할 수 있다. 이러한 추가의 서열은 발현 및/또는 정제를 도울 수 있다. 히스티딘 태그는 바람직하게는 6개의 히스티딘 잔기로 구성된다. 히스티딘 태그는 바람직하게는 링커에 의해 C 말단에 연결되며, 이는 전형적으로 짧은 아미노산 서열, 예컨대 3 내지 5 아미노산이다. 링커는 전형적으로 주로 글리신 및 세린 잔기로 이루어지고, 바람직하게는 서열 GSG를 포함할 수 있다. 예컨대 GSG 및 GSGLE가 적합한 링커이다.
따라서 요약하면, 본 발명의 폴리펩티드는 다음을 포함하는 O-당단백질-특이적 엔도프로테아제 활성을 갖는 폴리펩티드이다:
(a) 서열번호 1의 아미노산 서열;
(b) 서열번호 1의 아미노산 서열과 적어도 85% 동일한 아미노산 서열 또는
(c) 서열번호 1의 서열의 단편인 아미노산 서열 또는 서열번호 1의 아미노산 서열과 85% 동일한 아미노산의 단편;
선택적으로, 상기 폴리펩티드는 N 말단에 추가의 메티오닌 및/또는 C 말단에 히스티딘 태그를 포함하며, 상기 태그는 링커에 의해 C 말단에 결합될 수 있다.
본 발명의 예시적인 폴리펩티드 서열은 서열번호 2로서 제공된다. 폴리펩티드는 서열번호 2의 아미노산 서열을 포함하거나 이로 구성될 수 있다. 이러한 폴리펩티드를 인코딩하는 예시적인 폴리뉴클레오티드 서열이 서열번호 3에 제시되어 있다.
O-당단백질-특이적 엔도프로테아제 활성을 갖는 대안적인 폴리펩티드는 슈도모나스 에루지노사 PAO1, 박테리오데스 테타이오타오미크론 VPI-5482, 및 클로스트리디움 퍼프린젠스에서 동정되었다(Noach et al; PNAS 2017, pE679-688 및 지지 부록, 특히, Materials and Methods for Cloning, Protein Expression and Purification에 기술된 3개의 펩티다제 참조). 이러한 폴리펩티드의 전장 서열이 서열번호 32, 33 및 34로 제공된다. 이러한 서열 각각은 상기와 같이 모티프 HEbbH를 갖는 메탈로프로테아제 도메인을 포함한다. 클로스트리디움 퍼프린젠스 서열은 상기와 같은 모티프 abxHEbbHbc를 갖는 보다 긴 메탈로프로테아제 도메인을 또한 갖는다. 이러한 서열 각각은 존재할 수 있는 임의의 신호 서열 또는 프로-효소 서열을 제거하고/하거나 N 말단에 추가의 메티오닌 및/또는 C 말단에 히스티딘 또는 다른 태그를 포함하기 위해 선택적으로 변형될 수 있다. 이러한 추가의 서열은 발현(예컨대 대장균에서) 및/또는 정제를 도울 수 있다. 신호 및 다른 미성숙 서열이 제거된 상응하는 서열은 서열번호 26, 27 및 28로 제공된다. 대장균에서의 발현 및 후속 정제에 최적화된 (N 말단에서 추가의 메티오닌 및 C 말단에서 히스티딘 태그를 포함시킴으로써) 이러한 서열의 버전은 서열번호 29, 30 및 31로 제공된다. O-당단백질-특이적 엔도프로테아제 활성을 갖는 본 발명의 폴리펩티드의 사용에 대해 본원에서 기술된 방법에서, 본 발명의 폴리펩티드는 이러한 폴리펩티드들 중 하나와 선택적으로 대체될 수 있다. 따라서, 이러한 방법에서 사용하기 위한 바람직한 폴리펩티드는 서열번호 26 내지 31 중 임의의 하나를 포함하거나, 이로 본질적으로 이루어지거나, 이로 이루어진다.
폴리펩티드의 엔도프로테아제 활성을 사용하는 방법
본 발명은 또한 O-당단백질을 가수분해하는 방법을 제공하며, 여기서, 상기 방법은 O-당단백질-특이적 엔도프로테아제 활성을 갖는 본 발명의 폴리펩티드를 상기 단백질 샘플과 접촉시키는 단계를 포함하고 선택적으로 가수분해 산물을 검출하는 단계를 추가로 포함한다.
본 발명은 또한 O-당단백질-특이적 엔도프로테아제 활성을 갖는 본 발명의 폴리펩티드를 상기 샘플과 접촉시키는 단계 및 생성된 산물을 분석하는 단계를 포함하는, 단백질의 글리코실화 상태를 평가하는 방법을 포함할 수 있다. 절단 산물의 존재는 상기 샘플 중의 단백질이 O-글리코실화된 것을 나타내며, 따라서, 상기 방법은 또한 O-당단백질의 검출에 사용될 수 있다. 절단 산물은 선택적으로 글리칸 쇄 및 단백질에 대한 부착 위치를 확인하기 위해 추가로 분석될 수 있다.
이러한 방법에서, 샘플은 폴리펩티드가 샘플에서 임의의 단백질과 상호작용하고 가수분해/절단 반응(엔도프로테아제 활성)이 발생하기에 적합한 조건 하에서 본 발명의 폴리펩티드와 접촉된다. 적합한 조건은 본 발명의 폴리펩티드와 함께 적어도 20 분, 30 분, 40 분, 50 분, 60 분, 70 분, 80 분, 90 분 또는 120 분, 3 시간, 5 시간, 10 시간 동안, 또는 밤새 항온 처리하는 것을 포함한다. 항온 처리는 바람직하게는 실온, 보다 바람직하게는 약 20℃, 25℃, 30℃, 35℃, 40℃ 또는 45℃, 및 가장 바람직하게는 약 37℃에서 일어난다. 상기 방법은 임의의 적합한 pH 하에 수행될 수 있다. 적합한 pH 값은, 예컨대 약 3.0, 3.5, 4, 4.5, 5, 5.5, 6, 6.5, 7, 7.5, 8, 8.5, 9 또는 9.5의 pH를 포함한다. 본 발명의 폴리펩티드 활성을 위해 바람직한 pH는 5.6 내지 6.8 범위 이내이다. 상기 방법은 임의의 적합한 완충액, 예컨대 Tris 완충 식염수(TBS) 또는 인산염 완충된 식염수(PBS)에서 수행될 수 있다. 본 발명의 폴리펩티드 대 샘플의 단백질 함량의 대략적인 비(효소:기질)는 1:1, 2:1, 4:1, 6:1, 10:1, 15:1, 20:1, 1:2, 1:4, 또는 1:6, 1:10, 1:15, 1:20, 1:40, 1:100, 1: 200 또는 1:400일 수 있다. 바람직한 비는 1:20이다. 더 짧은 반응 시간이 요구되거나, O-당단백질이 많이 시알릴화된 경우 기질에 대한 효소의 비율이 높아질 수 있다. 대안적으로, 초기 또는 동시 시알리다제 항온 처리 단계는 아래에서 더 상세히 논의되는 바와 같이 시알산 함량을 감소시키기 위해 사용될 수 있다. 기질은 전형적으로 0.1mg/ml 내지 10mg/ml, 바람직하게는 약 0.1 내지 2mg/ml의 농도로 존재한다.
생성된 생성물의 검출 또는 분석은 임의의 적합한 분석적 방법, 예컨대 비제한적으로 질량 분석법, HPLC, 친화성 크로마토그래피, 겔 전기영동, SDS-PAGE, ELISA, 렉틴 블롯팅, 분광법, 모세관 전기영동 및 단백질 분석을 위한 다른 표준 실험실 기법에 의해 평가될 수 있다.
상기 방법 중 임의의 것에서의 샘플은 환자, 바람직하게는 인간 환자로부터 채취된 샘플일 수 있다. 얻어진 결과는 진단 목적, 예컨대 O-연결 글리코실화를 포함하는 암의 존재를 검출하기 위해 사용될 수 있다. 이러한 용도는 환자로부터 얻은 결과와 건강한 대조군으로부터 얻은 샘플을 사용하여 얻은 결과의 비교를 포함할 수 있다.
본 발명의 임의의 방법에서, 폴리펩티드는 프로테아제 또는 글리코시다제와 같은 또 다른 효소와 조합하여 사용될 수 있다. 추가의 프로테아제 또는 글리코시다제는 전형적으로 기질 단백질을 추가로 소화할 것이며, 이는 본 발명의 폴리펩티드의 활성을 향상시키고/시키거나 생성물의 보다 쉽고 보다 상세한 분석을 허용할 수 있다.
예를 들어, 본 발명자들은 기질 단백질의 O-글리칸이 시알산을 제거하기 위해 먼저 변형된다면 본 발명의 폴리펩티드가 개선된 엔도프로테아제 활성을 나타내는 것으로 결정하였다. 따라서, 본 발명의 바람직한 방법에서, 샘플은 시알산을 제거하기 위해 제제와 접촉된다. 상기 제제는 바람직하게는 시알리다제 효소 또는 이러한 효소의 혼합물일 수 있으며, 이는 적합한 완충액, 예컨대 TBS 또는 PBS 중에 존재할 수 있다. 완충액은 바람직하게는 저농도, 전형적으로 300mM, 250mM, 200mM, 또는 150mM 이하의 NaCl을 포함한다. NaCl 농도는 바람직하게는 약 150mM, 예컨대 125mM 내지 175mM이다. 시알리다제(또는 뉴라미니다제)는 당단백질 상의 복합체 탄수화물로부터 말단 시알산의 절단을 촉매하고 고도의 특이성을 나타낸다. 이러한 효소는 O-당단백질 내에서 통상적으로 발견되는 3개의 별개의 시알산 결합, 즉, α2-3, α2-6 및 α2-8 결합을 표적화한다. 기술된 방법에서 사용하기에 적합한 시알리다제는 α2-3, α2-6, 또는 α2-8 결합 모두를 표적화하는 광범위한 스펙트럼의 시알리다제, 및 전형적으로 하나의 유형의 결합만을 표적화하는 좁은 스펙트럼의 시알리다제를 포함한다. α2-3 결합이 인간 당단백질에서 가장 흔하므로, 좁은 스펙트럼의 시알리다제가 사용되는 경우 이 결합을 표적으로 하는 것이 바람직하다. 적합한 시알리다제는 바이러스 또는 포유류 시알리다제를 포함할 수 있지만 바람직하게는 시알리다제는 비제한적으로 클로스트리디움 퍼프린젠스, 아스로박터 우레아페시언스, 스트렙토코커스 뉴모니아, 비브리오 콜레라 및 아커만시아 뮤니시필라의 균주를 포함하여, 박테리아로부터 단리된다.
바람직한 좁은 스펙트럼의 시알리다제는 아커만시아 뮤시니필라로부터 단리된 Am1757이다. Am1757은 α2-3 결합에 대해 특이적 활성을 갖는다. Am1757의 야생형 서열은 신호 서열을 포함하는 서열번호 9로 제공된다. 신호 서열이 없는 Am1757의 야생형 서열은 서열번호 10으로 제공된다. 이러한 서열은 N 말단에 추가의 메티오닌 및/또는 C 말단에 히스티딘 또는 다른 태그를 포함하기 위해 선택적으로 변형될 수 있다. 이러한 추가의 서열은 발현(예컨대 대장균에서) 및/또는 정제를 도울 수 있다. 히스티딘 태그는 바람직하게는 6개의 히스티딘 잔기로 구성된다. 히스티딘 태그는 바람직하게는 링커에 의해 C 말단에 연결되고, 이는 전형적으로 짧은 아미노산 서열, 예컨대 3 내지 5 아미노산 서열이다. 링커는 전형적으로 주로 글리신 및 세린 잔기로 이루어지고, 바람직하게는 서열 GSG를 포함할 수 있다. 예컨대, GSG 및 GSGLE가 적합한 링커이다. N 말단에 추가의 메티오닌을 갖고 C 말단에 GSGLE 링커 및 His6 태그를 갖는 예시적인 Am1757 서열이 서열번호 11로 제공된다. 본 개시 내용에서 Am1757에 대한 임의의 언급은 서열번호 9, 10 또는 11 중 임의의 것을 의미할 수 있지만, 바람직하게는 서열번호 10의 아미노산 서열을 포함하거나 이로 이루어진 폴리펩티드를 지칭한다. 가장 바람직한 것은 서열번호 11의 아미노t산 서열로 이루어진 폴리펩티드이다.
바람직한 광범위한 스펙트럼 시알리다제는 아커만시아 뮤시니필라로부터 단리된 Am0707이다. Am0707은 α2-3, α2-6 및 α2-8 결합에 대해 활성을 갖는다. Am0707의 야생형 서열이 서열번호 12로 제공되며, 이는 신호 서열을 포함한다. 신호 서열이 없는 Am0707의 야생형 서열이 서열번호 13으로 제공된다. 이러한 서열은 N 말단에 추가의 메티오닌 및/또는 C 말단에 히스티딘 또는 다른 태그를 포함하도록 선택적으로 변형될 수 있다. 이러한 추가의 서열은 발현 및/또는 정제를 도울 수 있다. 히스티딘 태그는 바람직하게는 6개의 히스티딘 잔기로 구성된다. 히스티딘 태그는 바람직하게는 링커에 의해 C 말단에 연결되며, 이는 전형적으로 짧은 아미노산 서열, 예컨대 3 내지 5개 아미노산이다. 링커는 전형적으로 주로 글리신 및 세린 잔기로 이루어져 있으며, 바람직하게는 서열 GSG를 포함할 수 있다. 예컨대, GSG 및 GSGLE가 적합한 링커이다. N 말단에 추가의 메티오닌 및 C 말단에 GSGLE 링커 및 His6 태그를 가진 예시적인 Am0707 서열이 서열번호 14로 제공된다. 본 개시에서 Am0707에 대한 임의의 언급은 서열번호 12, 13 또는 14 중 임의의 것을 의미할 수 있지만, 바람직하게는 서열번호 13의 아미노산 서열을 포함하거나 이로 이루어진 폴리펩티드를 지칭한다. 가장 바람직한 것은 서열번호 14의 아미노산 서열로 이루어진 폴리펩티드이다.
모든 시알산 결합을 가수분해 할 수 있는 바람직한 시알리다제 혼합물은 아커만시아 뮤시니필라로부터 단리된 Am1757 및 Am0707을 포함한다. Am1757 및 Am0707의 혼합물은 전형적으로 1:1 비율이다. 특히 바람직한 혼합물은 서열번호 11의 아미노산로 이루어진 폴리펩티드 및 서열번호 14의 아미노산 서열로 이루어진 폴리펩티드를 포함할 수 있다.
본 발명의 방법은 바람직하게는 시알리다제의 활성에 적합한 조건 하에, 샘플을 본 발명의 폴리펩티드와 항온 처리하기 이전에 또는 동시에 Am1757과 또는 Am1757 및 Am0707의 혼합물과 항온 처리하는 단계를 포함할 수 있다. 본 발명은 또한 본 발명의 폴리펩티드 및 Am1757 또는 Am1757 및 Am0707의 혼합물을 포함하는 조성물(동결건조되거나 용액 형태)을 제공한다. 이러한 조성물은 바람직하게는 약 pH 7.6일 수 있는 Tris 완충 식염수에서 동결건조될 수 있다. 이러한 조성물에서, Am1757 및 Am0707은 바람직하게는 서로 1:1 비율로 존재할 것이며, 총 시알리다제 함량(Am1757+Am0707)이 또한 본 발명의 폴리펩티드에 대해 1:1 비율로 존재한다. 예컨대, 조성물이 본 발명의 2000 유닛의 폴리펩티드를 포함하는 경우, 이는 또한 2000 유닛의 시알리다제를 포함할 것이며, 상기 2000 유닛의 시알리다제는 1000 유닛의 Am1757 및 1000 유닛의 Am0707을 포함한다. 시알리다제 혼합물의 1 유닛은 전형적으로 SDS-PAGE에 의해 모니터링 될 때 37℃에서 2시간 동안 37℃에서 20 mM Tris pH 6.8에서 항온 처리될 때 1 μg 당단백질(페투인)의 90% 이상으로부터 시알산을 가수분해하는데 필요한 양이다. 본 발명의 폴리펩티드 1 유닛은 전형적으로 SDS-PAGE에 의해 모니터링 될 때 37℃에서 1 유닛의 시알리다제 혼합물과 함께 밤새, 20 mM Tris 완충액 pH 6.8에서 항온 처리될 때 1 μg의 에리스로포이에틴(EPO)의 90% 초과를 소화시키는데 필요한 양이다.
본 발명은 또한 상이한 효소의 병용에 대한 지침과 함께, Am1757 또는 Am1757 및 Am0707의 혼합물로부터 별도의 용기에 본 발명의 폴리펩티드를 포함하는 키트를 제공한다.
또 다른 예시로서, 본원에 기술된 임의의 방법에서, 샘플은 표적 단백질로부터 N-글리칸을 제거하기 위해, 샘플을 본 발명의 폴리펩티드와 접촉하기 이전에, 접촉과 동시에, 또는 접촉한 후에, 샘플은 N-글리코시다제와 함께 항온 처리될 수 있다. 예시적인 N-글리코시다제는 PNGaseF이다. 샘플이 면역글로불린을 포함할 때 사용될 수 있는 다른 N-글리코시다제는 EndoS(WO2008071418의 서열번호 1 참조) 또는 EndoS2(EndoS49로 지칭될 수 있음 - WO2013037824의 서열번호 1 참조)이다. 이러한 효소 각각은 IgG1의 Asn-297로부터 N-연결 당단백질을 제거한다. 특정 구현예에서, 샘플은 본 발명의 폴리펩티드 외에 N-글리코시다제 및 시알리다제(또는 이들의 혼합물)과 접촉될 수 있다. 이러한 방법에서, 시알리다제(또는 혼합물)는 N-글리코시다제 및 본 발명의 폴리펩티드의 동시 첨가 전에 먼저 적용될 수 있다. 이러한 방법은 특히 O-글리코실화 부위의 후속 평가에 적합하며, 전형적으로 예컨대 RPLC를 사용하여 생성물을 분리한 후 예컨대 질량 분석법을 사용하여 상이한 분획을 분석하여 달성될 수 있다.
또 다른 예로서, 본원에 기술된 임의의 방법에서, 샘플은 표적 단백질을 추가로 소화하기 위해, 샘플을 본 발명의 폴리펩티드와 접촉하기 전에, 접촉과 동시에, 또는 접촉 후에 샘플은 프로테아제와 함께 항온 처리될 수 있다. 적합한 일반적인 프로테아제는 트립신, 키모트립신, Lys-C, Asp-N, Glu-C, Arg-C 또는 유사한 엔도프로테아제, 또는 포르피로모나스 진지발리스(Porphyromonas gingivalis)의 Arg-진지페인(gingipain)(RgpB)을 포함한다.
샘플이 면역글로불린을 포함하는 경우, 면역글로불린 프로테아제는 SpeB(WO2015040125의 서열 참조), S. 피오게네스(pyogenes)의 면역글로불린 G-분해 효소(IdeS - WO2015040125의 서열 참조), S. 에퀴(equi) 아종 주에피데미쿠스(zooepidemicus)(IdeZ)의 면역글로불린 G-분해 효소, 포르피로모나스 진지발리스의 Lys-진지페인(Kgp), 및 S. 아갈락티애(agalactiae)의 면역글로불린 G-분해 효소(IgdEagalactiae - PCT/EP2017/052463의 서열번호 3 참조)와 같은 것이 사용될 수 있다. 본 발명의 방법에서 이러한 프로테아제의 임의의 조합의 사용은 예컨대 질량분석법(중간 다운 접근법)을 사용하여 모노클로날 항체 및 이의 서브유닛 상의 O-글리코실화 부위의 결정을 도울 수 있다.
또 다른 예로서, 본원에 기술된 임의의 방법에서, 샘플이 본 발명의 폴리펩티드와 접촉한 후에 샘플은 O-글리코시다제와 함께 항온 처리될 수 있다. 예컨대, 생성된 생성물의 분석을 단순화하기 위해, 임의의 적합한 방법에 의한 추가 분석 전에 O-글리칸을 제거하기 위해 생성물은 O-글리코시다제에 의해 소화된다. 적합한 O-글리코시다제는 엔테로코커스 패컬리스(Enterococcus faecalis), 스트렙토코커스 오랄리스(Streptococcus oralis), 또는 비피도박테리움 비피덤(Bifidobacterium bifidum), 바람직하게는 엔테로코커스 패컬리스 또는 스트렙토코커스 오랄리스, 가장 바람직하게는 스트렙토코커스 오랄리스의 균주로부터 수득될 수 있다. 스트렙토코커스 오랄리스로부터의 예시적인 O-글리코시다제의 서열이 서열번호 15로 제공된다.
O-연결 당단백질에 결합하지만 엔도프로테아제 활성이 없거나 감소된 폴리펩티드
엔도프로테아제 활성이 없는 폴리펩티드의 기능적 특성
일 구현예에서, 본 발명은 엔도프로테아제 활성이 없거나 감소되었지만, O-글리칸에 결합할 수 있는 능력이 있는 폴리펩티드에 관한 것이다. 즉, 폴리펩티드는 상기 글리칸이 부착된 당단백질을 상당히 가수분해하지 않는 O-글리칸-특이적 결합제로서 기술될 수 있다.
O-당단백질 엔도프로테아제 활성은 임의의 적합한 방법을 사용하여 결정될 수 있지만, 전형적으로 이러한 활성을 지닌 본 발명의 폴리펩티드에 대해 상기된 바와 동일한 방법을 사용할 수 있다. 시험 폴리펩티드에서의 활성 결여는 O-당단백질 기질과 항온 처리 후 절단 생성물의 부재로 표시될 것이다. 서열번호 1의 아미노산 서열을 포함하는 폴리펩티드에 의한 동일한 기질의 절단은 양성 대조군으로서 사용될 수 있다. 시험 폴리펩티드에서의 활성 감소는 동일한 대조군과 비교하여 결정될 수 있다. 본 발명의 폴리펩티드는 전형적으로 서열번호 1의 아미노산 서열을 포함하는 폴리펩티드의 활성에 비해 감소된 O-당단백질 엔도프로테아제 활성을 갖는다. 본 발명의 폴리펩티드는 전형적으로 서열번호 1의 아미노산 서열을 포함하는 폴리펩티드의 활성에 비해 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%, 50%, 45%, 40%, 35%, 30%, 25%, 20%, 15%, 10% 또는 5% 미만인 O-당단백질 엔도프로테아제 활성을 갖는다.
O-글리칸 또는 O-당단백질에 결합하는 폴리펩티드의 능력은 또한 임의의 적합한 방법에 의해 평가될 수 있다. 하나의 이러한 방법은 예컨대 스핀 컬럼에서 세파로스 상에 시험 폴리펩티드를 고정시킨 다음 O-당단백질 및/또는 O-글리칸을 함유하는 샘플과 함께 항온 처리하는 것을 포함한다. 시험 폴리펩티드가 O-글리칸 및/또는 O-당단백질 결합 능력을 갖는 경우, O-당단백질 및/또는 O-글리칸은 컬럼에 부착되어 또는 후속 용리에서 검출될 것이다. 바람직하게는, 폴리펩티드는 서열번호 1의 아미노산 서열을 포함하는 폴리펩티드에 의해 가수분해될 수 있는 모든 O-당단백질에 결합할 수 있다.
이러한 유형의 예시적인 분석법이 실시예에 기술되어 있다.
엔도프로테아제 활성이 없는 폴리펩티드의 구조적 특징
본 섹션은 이러한 구현예에 따른 폴리펩티드의 구조적 특정을 기술하며, 이는 이전 섹션에 기술된 기능적 특징에 추가로 적용된다. 본 발명의 구현예에 따른 폴리펩티드는 아미노산 서열이 하나 이상의 아미노산 첨가, 결실 또는 치환에 의해 변형되어 상기 활성이 감소 또는 제거된 것을 제외하고, 엔도프로테아제 활성을 갖는 폴리펩티드와 관련하여 상기된 바와 동일한 구조적 특징을 가질 수 있다. 전형적으로, 본 발명의 이러한 구현예에 따른 폴리펩티드는 HEbbH 또는 abxHEbbHbc의 무손상 메탈로프로테아제 모티프를 포함하지 않을 것이다. 상기 모티프는 첨가, 결실 또는 치환에 의해 파괴될 수 있지만, 바람직하게는 적어도 하나의 아미노산 치환에 의해 파괴된다. 바람직하게는, 치환은 상기 모티프의 글루탐산(E) 잔기를 대안적인 아미노산으로 치환하고/하거나 보다 짧은 모티프의 첫 번째 위치(보다 긴 모티프의 4번째 위치)에 상응하는 위치에서 히스티딘(H) 잔기의 치환 및/또는 보다 짧은 모티프의 5번째 위치(보다 긴 모티프의 8번째 위치)에 상응하는 위치에서 히스티딘(H) 잔기의 치환을 포함한다. 바람직하게는, 상기 3개의 치환 중 하나 또는 둘, 또는 모두는 비-보존적이다. E 잔기의 치환은 전자 이동을 감소시키거나 제거해야 한다. H 잔기 중 하나의 치환은 아연 이온 보조-인자 결합을 감소시키거나 제거해야 한다. E 잔기는 따라서 바람직하게는 비-극성 또는 비하전 아미노산, 예컨대 , C, F, G, I, L, M, N, P, Q, S, T, V 또는 W로 치환되지만, 가장 바람직하게는 알라닌(A) 또는 글리신(G)으로 치환된다. H 잔기는 임의의 비-H 아미노산으로 각각 개별적으로 치환될 수 있지만, 비-극성 아미노산 예컨대 A 및 G가 더 바람직하다.
따라서, 본 발명의 폴리펩티드는 바람직하게는, 서열번호 1의 위치 182에 상응하는 위치에서 글루탐산 잔기의 치환 및/또는 서열번호 1의 위치 181에 상응하는 히스티딘 잔기의 대안적인 아미노산으로의 치환 및/또는 서열번호 1의 위치 185에 상응하는 히스티딘 잔기의 대안적인 아미노산으로의 치환에 의해, HEbbH 또는 abxHEbbHbc의 메탈로프로테아제 모티프가 파괴된 서열번호 1의 아미노산 서열을 포함하거나, 이로 본질적으로 이루어지거나 이로 이루어질 수 있다. 즉, 폴리펩티드는 메탈로프로테아제 모티프 HEbbH를 포함하지 않고 바람직하게는 상기 모티프의 파괴된 버전을 포함하는 것을 포함하여 다음과 같이 기술될 수 있다:
(a) 첫 번째 위치의 H가 대안적인 아미노산, 바람직하게는 A 또는 G로 치환됨; 및/또는
(b) 두 번째 위치의 E가 비하전 아미노산, 선택적으로 A, C, F, G, I, L, M, N, P, Q, S, T, V 또는 W, 바람직하게는 A 또는 G로 치환됨; 및/또는
(c) 5번째 위치의 H가 대안적인 아미노산, 바람직하게는 A 또는 G로 대체됨
이때, 상기 모티프의 b는 비하전 아미노산, 선택적으로 A, C, F, G, I, L, M, N, P, Q, S, T, V 또는 W이다.
따라서 상기 폴리펩티드는 모티프 xbbbx를 포함하는 것으로 기술될 수 있고, 여기서:
(a) x는 바람직하게는 H를 제외한 임의의 아미노산이고, 바람직하게는 A 또는 G이다; 및/또는
(b) b는 비하전 아미노산, 선택적으로 A, C, F, G, I, L, M, N, P, Q, S, T, V 또는 W이고, 바람직하게는 A 또는 G이다;
선택적으로, 이때, 상기 모티프는 서열번호 1의 위치 181 내지 185에 상응하는 위치에서 상기 폴리펩티드에 존재한다.
따라서 상기 폴리펩티드는 예컨대 다음의 서열 중 임의의 하나를 갖는 파괴된 메탈로프로테아제 모티프를 포함할 수 있다: HALGH(서열번호 44), AELGH(서열번호 45) 또는 가장 바람직하게는 AALGH(서열번호 46). 서열번호 1에 대한 이러한 유형의 특이적 변화를 포함하는 서열은 서열번호 5 및 서열번호 20에 제시되어 있다. 즉, 따라서, 본 발명의 이러한 구현예의 폴리펩티드는 서열번호 5 또는 서열번호 20의 아미노산 서열을 포함하거나, 이로 본질적으로 이루어지거나, 이로 이루어질 수 있다.
상기 폴리펩티드는 모티프 abxxbbbxbc를 포함하는 것으로 대안적으로 기술될 수 있으며, 여기서:
(a) a는 아마노산 V, T 또는 G이고;
(b) b는 비하전 아미노산, 선택적으로 A, C, F, G, I, L, M, N, P, Q, S, T, V 또는 W, 바람직하게는 A 또는 G이고;
(c) x는 모티프의 4번째 및/또는 8번째 위치의 아미노산이 바람직하게는 H가 아닌 것을 제외하고 임의의 아미노산, 바람직하게는 A 또는 G이고;
(d) c는 소수성 아미노산, 선택적으로 A, C, F, I, L, M, P, V, W 또는 Y이다;
선택적으로, 여기서, 상기 모티프는 서열번호 1의 178 내지 187의 위치에 해당하는 위치에서 상기 폴리펩티드에 존재한다.
따라서 상기 폴리펩티드는 예컨대 다음 서열 중 임의의 하나를 갖는 파괴된 메탈로프로테아제 모티프를 포함할 수 있다: GMAHALGHGL(서열번호 23), GMAAELGHGL(서열번호 24) 또는 가장 바람직하게는 GMAAALGHGL(서열번호 25). 서열번호 1에 대한 이러한 유형의 특이적 변화를 포함하는 서열은 서열번호 5 및 서열번호 20에 제시되어 있다. 즉, 따라서, 본 발명의 이러한 구현예의 폴리펩티드는 서열번호 5 또는 서열번호 20의 아미노산 서열을 포함하거나, 이로 본질적으로 이루어지거나, 이로 이루어질 수 있다.
대안적으로, 본 발명의 폴리펩티드는, 글루탐산 잔기가 서열번호 1의 위치 182에 상응하는 위치에 도입되지 않고/않거나 히스티딘 잔기가 서열번호 1의 위치 181에 상응하는 위치에 도입되지 않고/않거나 히스티딘 잔기가 서열번호 1의 위치 185에 상응하는 위치에 도입되지 않는다면, 서열번호 5의 아미노산 서열과 적어도 50% 동일한 서열번호 5 또는 서열번호 20의 아미노산 서열의 변이체를 포함하거나, 이로 본질적으로 이루어지거나, 이로 이루어질 수 있다.
변이체 서열은 서열번호 5의 서열과 적어도 60%, 적어도 70%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일할 수 있다. 동일성 수준은 바람직하게는 적어도 85% 이상이다. 서열번호 5 또는 서열번호 20의 서열에 대한 동일성은 서열번호 5 또는 서열번호 20에 제시된 서열의 적어도 100, 적어도 200, 적어도 300 또는 적어도 350개 이상의 인접 아미노산의 영역에 걸쳐, 보다 바람직하게는 서열번호 5 또는 서열번호 20의 전장에 걸쳐 측정될 수 있다. 본 발명의 폴리펩티드 서열은 서열번호 5 또는 서열번호 20의 아미노산 서열의 변이체를 포함할 수 있으며, 여기서, 10, 20, 30, 40, 50 또는 60개 이하의 보존적 치환이 이루어진다. 서열 동일성의 결정 및 보존적 및 비-보존적 치환에 대한 설명은 엔도프로테아제 활성을 갖는 폴리펩티드에 관한 섹션에서 제공되며 여기에서도 동일하게 적용된다.
대안적으로, 본 발명의 폴리펩티드는 서열번호 5 또는 서열번호 20의 보다 짧은 단편, 또는 상기된 바와 같은 이의 변이체를 포함하거나, 이로 본질적으로 이루어지거나, 이로 이루어질 수 있다. 단편은 O-당단백질 결합 활성을 보유하는 서열번호 5 또는 서열번호 20의 절단된 형태로서 기술될 수 있다. 이러한 단편은 서열번호 1보다 짧고 전형적으로 적어도 100, 150 또는 200 아미노산 길이이다.
서열번호 5 또는 서열번호 20을 포함하는 본 발명의 폴리펩티드는, 또는 이의 변이체, 또는 이들 중 하나의 단편은 선택적으로 N 말단에 추가의 메티오닌 및/또는 C 말단에 히스티딘 또는 다른 태그를 포함할 수 있다. 이러한 추가의 서열은 발현 및/또는 정제를 도울 수 있다. 히스티딘 태그는 바람직하게는 6개의 히스티딘 잔기로 이루어진다. 히스티딘 태그는 바람직하게는 3 내지 5개 아미노산과 같이 전형적으로 짧은 아미노산 서열인 링커에 의해 C 말단에 연결된다. 링커는 전형적으로 주로 글리신 및 세린 잔기로 이루어지며, 바람직하게는 GSG를 포함할 수 있다. 예컨대, GSG 및 GSGLE가 적합한 링커이다.
따라서 요약하면, 본 발명의 폴리펩티드는 O-당단백질 결합 활성을 갖지만 O-당단백질-특이적 엔도프로테아제 활성이 없거나 감소된 폴리펩티드이며, 다음을 포함한다:
(a) 서열번호 5 또는 서열번호 20의 아미노산 서열;
(b) 서열번호 5 또는 서열번호 20의 아미노산 서열과 적어도 85% 동일한 아미노산 서열;
(c) 서열번호 5 또는 서열번호 20의 서열 단편인 아미노산 서열, 또는 서열번호 5 또는 서열번호 20의 아미노산 서열과 85% 동일한 아미노산 단편;
선택적으로 여기서, 상기 폴리펩티드는 N 말단에 추가의 메티오닌 및/또는 C 말단에 히스티딘 태그를 포함하며, 상기 태그는 링커에 의해 C 말단에 결합될 수 있다.
본 발명의 예시적인 폴리펩티드 서열은 서열번호 6으로 제공된다. 폴리펩티드는 서열번호 6의 아미노산 서열을 포함하거나 이로 이루어질 수 있다. 이러한 폴리펩티드를 인코딩하는 예시적인 폴리뉴클레오티드 서열이 서열번호 7에 제시되어 있다. 본 발명의 또 다른 예시적인 폴리펩티드 서열이 서열번호 21로 제공된다. 폴리펩티드는 서열번호 21의 아미노산 서열을 포함하거나 이로 이루어질 수 있다. 이러한 폴리펩티드를 인코딩하는 예시적인 폴리뉴클레오티드가 서열번호 22에 제시되어 있다.
상기 폴리펩티드는 바람직하게는 선택적으로 수지로서 제공된 아가로스 또는 세파로스와 같이 고정화된 형태로 제공된다.
O-당단백질 결합 활성은 갖지만 O-당단백질-특이적 엔도프로테아제 활성이 없거나 감소된 본 발명의 추가의 폴리펩티드는 이러한 모티프를 포함하는 O-당단백질-특이적 엔도프로테아제 활성을 갖는 임의의 다른 폴리펩티드 중의 메탈로프로테아제 도메인 모티프 HEbbH 또는 abxHEbbHbc를 파괴함으로써 생성될 수 있다. 엔도프로테아제 활성이 없거나 감소된 본 발명의 폴리펩티드의 용도에 대해 본원에 기술된 방법에서, 본 발명의 폴리펩티드에 대한 언급은 이러한 폴리펩티드를 포함한다. 상기 모티프의 파괴는 바람직하게는 상기와 같이 달성되어 다음과 같다:
(a) 첫 번째 위치의 H가 대안적인 아미노산, 바람직하게는 A 또는 G로 치환됨; 및/또는
(b) 두 번째 위치의 E가 비하전 아미노산, 선택적으로 A, C, F, G, I, L, M, N, P, Q, S, T, V 또는 W, 바람직하게는 A 또는 G로 치환됨; 및/또는
(c) 다섯 번째 위치의 H가 대안적인 아미노산, 바람직하게는 A 또는 G로 치환됨
여기서, 상기 모티프 중의 b는 비하전 아미노산, 선택적으로 A, C, F, G, I, L, M, N, P, Q, S, T, V 또는 W이다.
따라서 상기 폴리펩티드는 모티프 xbbbx를 포함하는 것으로 기술될 수 있으며, 여기서:
(a) x는 바람직하게는 H를 제외한 임의의 아미노산이고, 바람직하게는 A 또는 G이고/이거나;
(b) b는 비하전 아미노산, 선택적으로 A, C, F, G, I, L, M, N, P, Q, S, T, V 또는 W, 바람직하게는 A 또는 G이다;
O-당단백질-특이적 엔도프로테아제 활성을 갖고 이러한 방식으로 파괴될 수 있는 다른 폴리펩티드는 슈도모나스 에루지노사 PAO1, 박테리오데스 테타이오타오미크론 VPI-5482, 및 클로스트리디움 퍼프린젠스(Noach et al; PNAS 2017, pE679-688 및 지원 부록, 특히 Materials and Methods for Cloning, Protein Expression and Purification에 기술된 3개의 펩티다제 참조)에서 확인된 것으로 상기되어 있다. 이러한 폴리펩티드의 전장 서열이 서열번호 32, 33 및 34로 제공된다. 상응하는 성숙 서열(예컨대 신호 및 다른 서열이 제거된 것)이 서열번호 26, 27 및 28로 제공된다. 대장균에서 발현하도록 최적화되고 후속 정제된(N 말단에 추가의 메티오닌 및 C 말단에 히스티딘 태그를 포함시킴으로써) 이러한 서열의 버전이 서열번호 29, 30 및 31로 제공된다. 따라서, 서열번호 26 내지 34 각각은 본 발명의 추가의 폴리펩티드를 생산하기 위해, 파괴되어 상기와 같은 모티프 xbbx를 생성할 수 있는 모티프 HEbbH를 갖는 메탈로프로테아제 도메인을 포함한다. HEbbH 모티프가 파괴된 서열번호 26, 27 및 28의 버전이 서열번호 35, 36 및 37로 제공된다. 대장균에서 발현하도록 최적화되고 후속 정제된(N 말단에 추가의 메티오닌 및 C 말단에 히스티딘 태그를 포함시킴으로써) 이러한 서열의 버전이 서열번호 38, 39 및 40으로 제공된다. O-당단백질-특이적 엔도프로테아제 활성이 없거나 감소된 본 발명의 폴리펩티드는 서열번호 35, 36, 37, 38, 39 또는 40 중 임의의 하나를 포함하거나, 이로 본질적으로 이루어지거나, 이로 이루어질 수 있다.
엔도프로테아제 활성이 없거나 감소된 LS 돌연변이체의 사용 방법
본 발명은 또한 O-글리칸에 대한 결합 방법을 제공하며, 여기서 상기 방법은 O-글리칸에 결합할 수 있고 O-글리코실화된 단백질에 대해 특이적인 엔도프로테아제 활성이 없거나 감소된 본 발명의 폴리펩티드를 O-글리칸을 포함하는 샘플과 접촉시키는 단계를 포함한다. 상기 방법은 선택적으로 O-글리칸이 결합되었는지 여부를 결정하는 단계 및/또는 생성된 혼합물로부터 O-글리칸 및 임의의 연결된 당단백질이 분리하는 단계를 추가로 포함한다.
본 발명은 또한 O-글리칸에 결합할 수 있고 O-글리코실화된 단백질에 특이적인 엔도프로테아제 활성이 없거나 감소된 본 발명의 폴리펩티드를 상기 샘플과 접촉시키는 단계, 및 단백질이 상기 폴리펩티드에 결합되었는지 여부를 결정하는 단계를 포함하는, 단백질의 글리코실화 상태를 평가하는 방법을 포함할 수 있다.
본 발명은 또한 샘플에서 O-연결 당단백질을 검출하는 방법을 포함할 수 있으며, 여기서, 상기 방법은 O-글리칸에 결합할 수 있고 O-글리코실화된 단백질에 특이적인 엔도프로테아제 활성이 없거나 감소된 본 발명의 폴리펩티드를 상기 샘플과 접촉시켜, O-연결 당단백질-폴리펩티드 복합체를 형성하도록 하는 단계를 포함한다. 상기 방법은 선택적으로 접촉된 샘플로부터의 상기 폴리펩티드를 분리하는 단계 및 분리된 폴리펩티드가 O-연결 당단백질에 결합되었는지 여부를 결정함으로써 샘플 중에 O-연결 당단백질의 존재 또는 부재를 결정하는 단계가 따라서 결정될 수 있는 것을 포함할 수 있다. 상기 방법은 또한 O-글리칸 또는 O-연결 당단백질을 함유하는 샘플로부터 O-글리칸 또는 O-연결 당단백질을 단리하기 위해 사용될 수 있다.
이러한 방법에서, 폴리펩티드가 샘플 중의 임의의 O-글리칸 또는 단백질과 상호작용하고 결합이 일어나기에 적합한 조건 하에서 샘플은 본 발명의 폴리펩티드와 접촉된다. 적합한 조건은 적어도 20 분, 30 분, 40 분, 50 분, 60 분, 70 분, 80 분, 90 분 또는 120 분, 3 시간, 5 시간, 10 시간 동안, 또는 밤새, 전형적으로 혼합 예컨대 엔드-오버-엔드 혼합하며, 본 발명의 폴리펩티드와 함께 항온 처리하는 것을 포함한다. 항온 처리는 바람직하게는 실온에서, 보다 바람직하게는 약 20℃, 25℃, 30℃, 35℃, 40℃ 또는 45℃, 가장 바람직하게는 약 37℃에서 발생한다. 상기 방법은 임의의 적합한 pH 하에서 수행될 수 있다. 적합한 pH 값은 예컨대 약 3.0, 3.5, 4, 4.5, 5, 5.5, 6, 6.5, 7, 7.5, 8, 8.5, 9 또는 9.5의 pH를 포함한다. 본 발명의 폴리펩티드의 활성에 대해 바람직한 pH는 5.6 내지 6.8의 범위이다. 상기 방법은 임의의 적합한 완충액, 예컨대 Tris 완충 식염수(TBS) 또는 인산염 완충된 식염수(PBS)에서 수행될 수 있다. 본 발명의 폴리펩티드 대 샘플의 단백질 함량의 대략적인 비는 1:1, 2:1, 4:1, 6:1, 10:1, 15:1, 20:1, 1:2, 1:4, or 1:6, 1:10, 1:15, 1:20, 1:40, 1:100, 1: 200 또는 1:400 (중량:중량)일 수 있다. 바람직한 비는 1:1(중량:중량)이다. 보다 짧은 반응 시간이 요구되는 경우, 또는 O-당단백질이 많이 시알릴화된 경우 폴리펩티드 대 기질의 보다 높은 비율이 유리할 수 있다. 대안적으로, 초기 또는 동시 시알리다제 항온 처리 단계가 아래 보다 상세히 논의되는 바와 같이 시알산 함량을 감소시키기 위해 사용될 수 있다. 기질은 전형적으로 약 0.01 mg/ml 내지 10 mg/ml, 바람직하게는 약 0.1 mg/ml 내지 10 mg/ml, 약 0.01 mg/ml 내지 2 mg/ml, 또는 약 0.1 mg/ml 내지 2 mg/ml의 함량으로 존재한다.
O-글리칸 또는 O-연결 당단백질이 결합되었는지 여부를 결정하기 위한 샘플의 검출 또는 분석이 임의의 적합한 분석적 방법, 예컨대 비제한적으로 질량 분석법, HPLC, 친화성 크로마토그래피, 겔 전기영동, SDS-PAGE, ELISA, 렉틴 블롯팅, 분광법, 모세관 전기영동 및 단백질의 분석을 위한 다른 표준 실험실 기법에 의해 평가될 수 있다. 예컨대, 폴리펩티드의 분자량이 분석될 수 있다. O-글리칸 또는 O-연결 당단백질에 결합된 본 발명의 폴리펩티드는 O-글리칸 또는 O-연결 당단백질이 결합되지 않은 폴리펩티드보다 높은 분자량을 가질 것이다.
결합된 O-글리칸 또는 O-연결 당단백질 및 본 발명의 폴리펩티드의 분리는 임의의 적합한 분리 수단에 의해 수행될 수 있다. 예컨대, 분리 수단은 자성 나노파티클의 집단을 포함할 수 있다. 이들은 자기장 분리, 바람직하게는 고-구배 자기장 분리를 사용하여 샘플로부터 분리될 수 있다. 시약 또는 분리 수단의 예는 본 발명의 폴리펩티드에 결합할 수 있는 자기 입자 집단이다. 예컨대, 폴리펩티드가 히스티딘 태그로 유도체화되는 경우, 자기 입자는 니켈, 구리 또는 아연 이온을 운반하는 표면 킬레이트 기를 함유한다. 대안적으로, 폴리펩티드가 비오틴 태그로 유도체화되는 경우, 자기 입자는 이의 표면 스트렙타비딘을 함유한다.
분리 수단은 또한 본 발명의 폴리펩티드가 고정화된 고체 지지체를 포함할 수 있다. 고체 지지체의 예는 이전 섹션에 기술된 것들을 포함하고, 아가로스 또는 세파로스 수지, 가교된 아가로스 비드, 또는 유사한 것을 포함할 수 있다. 지지체는 친화성 크로마토그래피 컬럼에서 매트릭스로서 사용될 수 있다. 대안적으로 고체 지지체는 적합한 실리카-기반 물질 또는 폴리스티렌, 또는 본 발명의 폴리펩티드가 직접적으로 흡착될 수 있는 플라스틱 용기 예컨대 마이크로타이터 플레이트 또는 등가물을 포함할 수 있다.
대안적인 분리 수단은 본 발명의 폴리펩티드에 특이적인 항체를 포함하는 시약을 포함하며, 이는 당업계의 표준 방법에 의해 생성될 수 있다. 이러한 의미의 항체는 모노클로날 항체, 폴리클로날 항체, 단일쇄 항체, 키메라 항체, CDR-그래프팅된 항체 또는 인간화 항체를 포함한다. 항체는 무손상 면역글로불린 분자 또는 이의 단편 예컨대 Fab, F(ab')2 또는 Fv 단편일 수 있다. 하나 이상의 항체가 존재하는 경우, 항체는 바람직하게는 상이한 비-중첩 결정인자를 가지므로 본 발명의 폴리펩티드에 동시에 결합할 수 있다. 항체는 고체 지지체에 결합될 수 있거나 또 다른 화학 기 또는 분자에 표지 또는 접합되어 이의 분리 또는 단리를 도울 수 있다. 예컨대, 전형적인 화학 기는 형광 표지 예컨대 플루오레세인(FITC) 또는 피코에리스린(PE), 또는 비오틴과 같은 태그를 포함한다.
다른 적합한 분리 수단은 접촉된 샘플로부터의 폴리펩티드를 적합한 용리 완충액과 접촉시켜 (전형적으로 고정화된) 폴리펩티드로부터 단백질을 용리하는 것을 포함한다. 용리 완충액의 선택은 단백질의 산-민감도에 의존할 수 있다. 바람직한 용리 완충액은 높은 몰 농도의 우레아(전형적으로 적어도 5, 6, 7 또는 가장 바람직하게는 적어도 8M)또는 고농도의 세제(전형적으로 적어도 약 1%, 5% 또는 10%)를 포함할 수 있다. 적합한 세제는 Nonidet P40, Triton X-100, Tween 20, CHAPS, 소듐 디옥시콜레이트, 및 RapiGest SF 계면활성제를 포함하지만, 소듐 도데실 설페이트(SDS)가 바람직하다. 높은 몰의 우레아가 세제보다 바람직한데 그 이유는 하류 공정이 세제의 존재에 대해 보다 민감할 수 있기 때문이다.
또 다른 바람직한 용리 완충액은 O-당단백질 엔도프로테아제 활성을 갖는 적합한 농도의 본 발명의 폴리펩티드, 예컨대 서열번호 1의 폴리펩티드를 포함한다. 이러한 폴리펩티드에 의한 O-글리칸에서의 절단은 결합된 O-당단백질을 방출하여 우레아 또는 세제-기반 용리의 필요성을 제거할 것이다.
본 발명의 고정된 폴리펩티드로부터 O-당단백질을 용리하는 바람직한 방법이 실시예에서 입증된다.
임의의 상기 방법에서의 샘플은 환자, 바람직하게는 인간 환자로부터 취해진 샘플일 수 있다. 수득된 결과는 진단 목적, 예컨대 O-연결 글리코실화와 관련된 암의 존재를 검출하기 위해 사용될 수 있다. 이러한 용도는 건강한 대조군으로부터 수득된 샘플을 사용하여 수득된 것에 대해 환자의 샘플로부터 수득된 결과를 비교하는 것을 포함할 수 있다.
본 발명의 임의의 방법에서, 폴리펩티드는 프로테아제 또는 글리코시다제와 같은 또 다른 효소와 조합하여 사용될 수 있다. 추가의 프로테아제 또는 글리코시다제는 전형적으로 기질 단백질 또는 글리칸을 추가로 소화할 것이고, 이는 생성물의 보다 쉽고 보다 상세한 분석을 허용할 것이다.
예컨대, 본 발명의 폴리펩티드는 시알산을 제거하기 위한 제제와 조합하여 사용될 수 있다. 상기 제제는 바람직하게는 시알리다제 효소 또는 상기 섹션에 기술된 바와 같은 이러한 효소의 혼합물일 수 있다. 본 발명은 또한 본 발명의 폴리펩티드 및 Am1757 또는 Am1757 및 Am0707의 혼합물을 포함하는 조성물(동결건조되거나 용액 형태)을 제공한다. 본 발명은 또한 상이한 효소의 병용에 대한 지침과 함께, Am1757 또는 Am1757 및 Am0707의 혼합물로부터 별도의 용기에 본 발명의 폴리펩티드를 포함하는 키트를 제공한다.
또 다른 예시로서, 본원에 기술된 임의의 방법에서, 샘플은 표적 단백질로부터 N-글리칸을 제거하기 위해, 샘플을 본 발명의 폴리펩티드와 접촉하기 이전에, 접촉과 동시에, 또는 접촉한 후에, 샘플은 N-글리코시다제와 함께 항온 처리될 수 있다. 예시적인 N-글리코시다제는 PNGaseF이다. 샘플이 면역글로불린을 포함할 때 사용될 수 있는 다른 N-글리코시다제는 EndoS(WO2008071418의 서열번호 1 참조) 또는 EndoS2(EndoS49로 지칭될 수 있음 - WO2013037824의 서열번호 1 참조)이다. 이러한 효소 각각은 IgG1의 Asn-297로부터 N-연결 당단백질을 제거한다. 샘플은 본 발명의 폴리펩티드 외에 N-글리코시다제 및 시알리다제(또는 이들의 혼합물)과 접촉될 수 있다. 이러한 방법에서, 시알리다제(또는 혼합물)는 N-글리코시다제 및 본 발명의 폴리펩티드의 동시 첨가 전에 먼저 적용될 수 있다.
또 다른 예로서, 본원에 기술된 임의의 방법에서, 샘플은 표적 단백질을 추가로 소화하기 위해, 샘플을 본 발명의 폴리펩티드와 접촉하기 전에, 접촉과 동시에, 또는 접촉 후에 샘플은 프로테아제와 함께 항온 처리될 수 있다. 적합한 일반적인 프로테아제는 트립신, 키모트립신, Lys-C, Asp-N, Glu-C, Arg-C 또는 유사한 엔도프로테아제, 또는 포르피로모나스 진지발리스의 Arg-진지페인(gingipain)(RgpB)을 포함한다.
샘플이 면역글로불린을 포함하는 경우, 면역글로불린 프로테아제는 SpeB(WO2015040125의 서열 참조), S. 피오게네스의 면역글로불린 G-분해 효소(IdeS - WO2015040125의 서열 참조), S. 에퀴 아종 주에피데미쿠스(IdeZ)의 면역글로불린 G-분해 효소, 포르피로모나스 진지발리스의 Lys-진지페인(Kgp), 및 S. 아갈락티애의 면역글로불린 G-분해 효소(IgdEagalactiae - PCT/EP2017/052463의 서열번호 3 참조)와 같은 것이 사용될 수 있다. 본 발명의 방법에서 이러한 프로테아제의 임의의 조합의 사용은 예컨대 질량분석법을 사용하여 기질 단백질 또는 글리칸의 분석을 도울 수 있다.
또 다른 예로서, 본원에 기술된 임의의 방법에서, 임의의 적합한 방법에 의한 추가 분석 전에 O-글리칸을 제거하기 위해 단리된 O-연결 당단백질은 O-글리코시다제와 함께 항온 처리될 수 있다. 적합한 O-글리코시다제는 엔테로코커스 패컬리스, 스트렙토코커스 오랄리스, 또는 비피도박테리움 비피덤, 바람직하게는 엔테로코커스 패컬리스 또는 스트렙토코커스 오랄리스, 가장 바람직하게는 스트렙토코커스 오랄리스의 균주로부터 수득될 수 있다. 스트렙토코커스 오랄리스로부터의 예시적인 O-글리코시다제의 서열이 서열번호 15로 제공된다.
다음의 실시예가 본 발명을 설명한다:
실시예 1:
재료 및 방법
LS의 돌연변이 유발
프라이머 E206A_fwd 5'-ATGGCGCACGC GCTGGGCCACG-3' 및 5'-GCCACCGTAC CATTTCGTC-3' (rev)을 사용하여 제조사의 지시(어닐링 온도 68℃, 3분 신장)에 따라 Q5(NEB)를 사용하여 부위-지시된 돌연변이 유발을 수행하였다; 따라서, 돌연변이체 Amuc1119E206A (LSE206A)를 생성하기 위해 아커만시아 뮤시니필라로부터 Amuc1119 유전자 중의 글루탐산을 알라닌으로 변환시켰다. 구축물을 DH5α 대장균에 형질전환시키고, 단리하고 서열분석(GATC Biotech)을 사용하여 검증하였다.
LS 및 LS
E206A
의 재조합 발현
아커만시아 뮤시니필라 ATCC BAA-835로부터의 유전자 Amuc1119, 및 돌연변이체 Amuc1119E206A(Amuc1119 - LS; Amuc1119E206A - LSE206A)를 대장균(DNA 2.0)에서 발현시키기 위해 코돈 최적화 하고 융합 단백질의 부분으로서 C-말단 6xHis-태그를 가진 발현 벡터에 클로닝하였다.
코돈-최적화된 유전자를 BL21(DE3) Star 세포에 형질전환 하였다. 대장균을 일상적으로 37℃에서 180 rpm으로 LB에서 배양하였다. 플라스미드의 존재 하에, 50 ug/mL 가나마이신을 첨가하였다. 밤새 항온 처리 한 후에, 배양물을 신선한 LB(kana)에서 1:20으로 희석하고, OD620 ~ 0.7-0.8까지 성장시킨 후 1 mM IPTG를 첨가하여 재조합 단백질 발현을 유도하고, 6시간 동안 계속해서 발현시키고 세포를 수집하고 동결하였다. 동결 세포를 해동하고 His 결합 완충액(20 mM NaP pH 7.4, 500 mM NaCl, 20 mM 이미다졸)에서 분해하고, 세포 내 단백질을 방출시키기 위해 초음파처리 하였다. 세포 파편을 원심분리로 제거하였다. 멸균 여과된 상등액을 니켈 컬럼 상에서 친화성 정제하고, PD-25 컬럼에서 20 mM Tris-HCl pH 8.0에 재-완충하였다. 단백질의 농도를 Nanodrop을 사용하여 결정하고, SDS-PAGE를 통해 순도를 예측하였다.
단백질 기질을 사용한 활성 평가
TNFαR을 2:1 비로 LS와 함께 혼합하고 37℃에서 15 내지 60분 동안 항온 처리한 후 단백질을 4-20% Novex 구배 SDS-PAGE 상에서 분리하였다. LS 활성에 대한 NaCl (0-1 M), 2가 양이온, EDTA, 및 pH의 영향을 조사하고, Gel Doc EZ (BioRad)를 사용하여 밀도 측정 분석을 통해 생성된 가수분해 단편의 차이를 조사하였다.
활성의 시간 및 용량 의존성
TNFαR (0.5 μg)을 PBS에서 37℃에서 15 또는 60분 동안 다양한 용량의 LS와 함께 항온 처리한 후 단백질을 4~20% Novex 구배 SDS-PAGE 상에서 분리하였다. 생성된 단편의 강도(밀도측정)를 사용하여 효율적인 항온 처리 조건을 위한 최적의 용량 및 시간을 결정하였다.
기질 특이성
LS를 2:1(기질:효소)의 비로 37℃에서 밤새 다양한 N- 및 O-연결 기질과 함께 항온 처리하였다. LS를 50:1의 비로 EPO(0.3mg/ml)와 함께 항온 처리하였다. 단백질을 4~20% Novex 구배 SDS-PAGE 겔 상에서 분리하고 분석하였다.
LS
E206A
의 고정화
LSE206A를 커플링 완충액(0.2 M NaHCO3, 0.5 M NaCl pH 8.3)에 재현탁하고 20 mg/ml로 농축하였다. NHS-활성화된 세파로스 4 Fast Flow (GE Healthcare)를 제조사의 지침에 따라 커플링을 위해 제조하였다(예컨대, HCl 세척 및 커플링 완충액의 평형화). LSE206A를 4℃에서 세파로스와 함께 밤새 항온 처리하고 일정한 혼합을 위해 천천히 흔들면서 고정하였다. 0.1 M Tris pH 8.5를 첨가하여 세파로스를 블로킹하고 0.1 M Tris pH 8.5 / 0.1 M NaAc, 0.5 M NaCl pH 5.0의 3회 반복으로 세척하고, 사용하기 전까지 EtOH에 저장하였다.
LS
E206A
의 결합 친화성
PBS에서 평형화된 50 μl 고정화된 LSE206A(예컨대 약 50 ug 단백질)를 갖는 스핀 컬럼을 시알리다제 혼합물(Am0707:Am1757) 또는 시알리다제 및 스트렙토코커스 오랄리스 엔도-α-N-아세틸-갈락토사미니다제(예컨대 O-글리코시다제)의 조합으로 전처리된 10 μg 당단백질과 함께 항온 처리하였다. 샘플을 37℃에서 2시간 동안 항온 처리한 후 컬럼을 PBS (10 부피; 100 g, 30 초)로 세척하고 0.1 M 글리신 pH 3.0으로 용리하였다. 분획을 SDS-PAGE 상에서 분석하였다.
질량 분석
에타너셉트(엔브렐®)는 TNFα에 결합하는 임상적으로 승인된 Fc-융합 단백질이다. 에타너셉트는 여러 O-글리칸을 함유한다. 효소적 절단 특이성을 시험하기 위해, 엔도프로테아제를 에타너셉트와 함께 37℃에서 항온 처리하였다. 질량 분석을 단순화하기 위해, 시알리다제 및 O-글리코시다제(밤새, PBS에서 1:40 비의 모든 단일 효소)를 사용하여 나머지 O-글리칸을 제거하기 위해 2차 효소 처리를 수행하였다. 생성된 펩티드는 C18 역상 액체 크로마토그래피에 의해 펩티드를 분리한 후 MS/MS로 분석하였다.
결과
LS는 추정 메탈로프로테아제이다
서열 및 도메인 유사성에 기초하여, LS는 추정 활성 부위 서열 GMAHELGHGL을 함유하는 몇몇 메탈로프로테아제와 상동성을 공유하고, 일반적인 메탈로프로테아제 서열 abxHEbbHbc(a = V/T, b = 전하 없음, c = 소수성)와 유사성을 공유한다. 히스티딘은 일반적으로 기질 결합 및 Zn2+ 친화성에 관여하는 반면, 글루탐산은 히스티딘과 함께 전자 이동을 매개하여 가수분해 효과를 나타낸다. 효소를 추가적으로 특성분석하기 위해, 본 발명자들은 기질에 결합할 수 있지만 E를 A로 변경함으로써 가수분해 능력이 없거나 감소된 LSE206A 돌연변이체를 구축하였다. 완전한 비활성 상태를 유지하려면 추가 수정(예컨대 H를 A로 변경)이 필요할 수 있다. 두 구축물 모두 잘 발현되었고, His-태그에 기초한 친화성 크로마토그래피를 사용하여 용이하게 정제되었다(도 1).
LS는 O-글리칸이 있는 당단백질을 특이적으로 가수분해한다
LS의 기질 특이성을 조사하기 위해, 프로테아제를 다양한 단백질과 함께 항온 처리하였다. 도 2에 제시된 바와 같이, LS를 IgA 및 허셉틴(트라스투주맙)과 함께 항온 처리하였다. LS는 IgA와 같은 O-연결 글리칸을 갖는 단백질에만 작용할 수 있었다. 말단 시알산의 존재는 부분적으로 LS의 활성을 억제하는 것으로 보이지만, 시알산의 부재는 가수분해의 전제 조건이 아니다(도 4).
LS는 다양한 조건에서 O-연결 당단백질에 작용할 수 있다
LS의 효소적 특성을 평가하기 위해 SDS-PAGE 겔의 밀도 측정 분석을 수행하였다. LS는 대부분의 조건 하에서 활성이며, 약간 산성의 pH 및 낮은 NaCl 농도를 선호한다(도 3a 및 3b). Mg2+ 및 Ca2+ 이온 모두 LS의 가수분해 활성에 긍정적인 영향을 미쳤지만, Zn2+의 존재는 활성을 현저히 낮추었고, EDTA는 이를 완전히 없앴다(도 3c 및 3d).
O-연결 갈락토시다제 잔기는 LS 활성에 중요하다
말단 시알산이 없는 상태에서 증가된 활성을 갖지만, LS의 활성에 대한 O-글리칸에서의 다른 탄수화물의 중요성은 완전히 이해되지 않았다. LS의 활성은 말단 시알산이 없는 상태에서 현저히 증가하지만, 갈락토스의 제거는 LS의 활성을 완전히 억제한다(도 4a). 또한, 시알릴화된 단백질에 대한 LS의 낮은 활성은 밤새 항온 처리한 후의 완전한 가수분해에 의해 입증되는 바와 같이, 시알산의 존재 하에서 결합을 가수분해 할 수 없기 때문은 아니다(도 4b). LS의 활성은 O-글리칸에 전적으로 의존하는데, N-글리칸의 제거는 LS에 의한 가수분해에 영향을 미치지 않기 때문이다(도 4c).
O-연결 글리칸은 LS의 절단 부위를 지시한다
O-글리칸이 활성에 중요하다는 것을 입증한 후, 본 발명자들은 다음으로 LS의 특이적 절단 부위를 조사하고자 하였다. 질량 분석법을 사용하여, 본 발명자들은 이의 유형과 관계 없이, LS가 O-글리코실화된 Ser/Thr 및 이의 N-말단 아미노산 사이의 아미노 결합을 가수분해한다는 것을 입증할 수 있었다(예컨대, 프롤린은 가수분해를 억제하지 않는 것으로 보인다)(도 5).
O-연결 글리칸이 풍부하기 때문에 에타너셉트를 모델 단백질로 사용하여, 당단백질을 LS로 처리한 후, 질량 분석을 용이하게 하기 위해 후속하여 O-글리코시다제로 처리하였다. MS/MS 데이터와 함께 조합하여, 질량분석에서 생성된 m/z 값을 에타너셉트에 맞추었다. 모든 확인된 펩티드는 N-말단 세린 또는 트레오닌을 가졌으며, O-글리칸의 바로 N-말단을 절단하는 LS와 일치하였다(도 5). 분석은 지시된 검색(파라미터에서 S/T 가수분해를 정의함; 도 5a), 및 비편향 접근법(도 5b) 둘 모두에서 펩티드를 확인하였다.
LS의 가수분해 비활성 변이체는 O-글리칸 함유 단백질에 특이적으로 결합한다
LS가 O-글리칸에 결합하고 글리칸 옆에(예컨대, Ser/Thr 옆에) 아미노산 결합을 가수분해하는 능력으로, 본 발명자들은 LS의 E206A 돌연변이체는 가수분해 활성은 없지만 결합력은 유지한다는 가설을 세웠다. 이러한 도구는 a) O-연결 당단백질의 확인, b) 제거 또는 연구를 위한 O-연결 글리코펩티드의 친화성 정제, 및 c) O-글리칸의 친화성-정제에 특히 유용할 것이다.
도 6a는 돌연변이체 LS가 검출가능한 가수분해 활성을 갖지 않았음을 보여준다. LS가 시알리다제의 존재 하에 에타너셉트를 가수분해 할 수 있었지만, LSmut는 에타너셉트를 가수분해 할 수 없었으며, 시험된 조건 하에서 유전적 변경이 실제로 O-글리코프로테아제를 불활성화시킨다는 것을 확인하였다.
LSE206A를 세파로스에 고정시키고 보다 용이한 취급을 위해 스핀 컬럼에 첨가하였다. 중요하게도, 상이한 기질에 대한 LSE206A의 결합은 LS의 가수분해 활성과 완벽하게 상관관계가 있었다(도 6b). LSE206A(LSmut로 표지됨)는 O-연결 당단백질에 대한 특이적 친화성을 입증하였다. 세파로스 상에 LSmut를 고정시킴으로써, 본 발명자들은 IgA를 친화성 정제할 수 있었다. 그러나, 본 발명자들은 강한 친화성으로 인해 단백질을 용리할 수 없었다. IgA로 처리된 O-글리코시다제뿐만 아니라 O-글리칸이 없는 허셉틴(트라스투주맙)은 컬럼에 결합하지 않았지만, 통과물(FT)에서 검출될 수 있었다.
2-3 시알 결합은 완전한 LS 활성을 제거하기 위해 중요하다
우리는 최근에 엔도프로테아제 활성이 특정 시알산 결합에 의존하여 완전한 효과를 위해 2~3 및 2~6 연결된 시알산 둘 모두의 제거를 필요로 한다는 것을 결정하였다. LS의 활성에 대한 특정 시알산 결합의 개별적인 역할을 결정하기 위해, 우리는 30분 내지 20 시간 동안 LS와 조합하여 상이한 시알리다제와 함께 엔브렐을 항온 처리하였다. LS에 의한 가수분해에 2~3 결합 제거가 충분해 보였다(도 7).
LS는 에리스로포이에틴(EPO)을 절단한다
EPO를 PNGaseF, 시알리다제(Smix, Am0707 및 Am1757을 포함함) 및/또는 O-글리코시다제로 처리하고 LS와 함께 항온 처리하였다.
이어서 생성된 생성물을 SDS-PAGE 및 쿠마시 블루 염색뿐만 아니라, RPLC 및 질량분석법으로 분석하였다. SDS-PAGE 결과가 도 9a에 제시되어 있으며, 이는 시알산이 제거되고 이들이 손상되지 않았을 때 LS가 EPO를 절단한다는 것을 보여준다. 또한, LS는 또한 N-글리칸이 PNGaseF로 제거되었을 때 EPO를 소화시켜 LS 활성이 N-글리칸 제거에 영향을 받지 않는다는 것을 확인한다. 그러나, O-글리칸이 O-글리코시다제로 제거될 때 LS는 EPO를 절단하지 않았으며, 이는 LS가 단백질을 절단하기 위해 O-글리칸이 필요함을 보여준다. 10:1, 5:1 및 2:1(기질:효소)의 비율에서 동등한 결과가 관찰되었다(데이터는 제시되지 않음).
PNGaseF, Smix 및 LS와 함께 항온 처리한 후 샘플 혼합물을 역상 액체 크로마토그래피로 분리하고 효소 처리 후 반응 생성물의 식별을 위해 ESI 질량 분석법으로 분석하였다.
도 9b는 RPLC로부터의 UV 크로마토그램을 나타낸다. 예상한 바와 같이, EPO가 하나의 제안된 O-글리칸 위치(아래의 서열번호 14의 예측된 위치 참조)를 가지면, 크로마토그램은 LS에 의한 절단으로 인한 2개의 단편에 상응하는 2개의 피크를 나타낸다.
이러한 단편을 MS에 의해 추가로 분석하고(도 9c 및 d 참조) 아래와 같이 확인하였다:
SAAPLRTITADTFRKLFRVYSNFLRGKLKLYTGEACRTGD (질량 = 4900.5868Da - 절단 지점에 대한 서열 C 말단에 상응하고 따라서 N 말단 세린에 여전히 연결된 O-글리칸을 포함함); 및
APPRLICDSRVLERYLLEAKEAEDITTGCAEHCSLDENITVPDTKVDFYAWKRMEVGQQAVEVWQGLALLSEAVLRGQALLVNSSQPWEPLQLHVDKAVSGLRSLTTLLRALGAQKEAISPPDAA (질량 = 13714.1199Da, 절단 지점에 대한 서열 N 말단에 상응함).
따라서, PNgaseF, 시알리다제 혼합물 및 LS의 병용은 EPO에서 O-글리칸-함유 세린의 단리 및 정확한 확인을 허용하였다. 이러한 유형의 방법은 임의의 O-당단백질에 적용할 수 있으며 O-글리칸 부착 위치를 신속하게 식별할 수 있도록 한다.
실시예 2
도입
실시예 1에 기술된 LSE206A 돌연변이체는 LS의 활성 부위(abxHEbbHbc 내지 abxHAbbHbc)의 부위-지향적 돌연변이를 통합하여, 효소 분열의 전자 전달 능력을 제거한다. 하기에 추가로 설명되는 바와 같이, 추가의 스트레스 시험에서, 이러한 변화는 야생형 서열에 비해 O-글리코프로테아제 활성을 감소시켰지만 이를 완전히 제거하지 않는다는 것을 발견하였다. 따라서, 본 발명자들은 효소 분열에 추가 치환을 포함하는 또 다른 돌연변이체를 개발하고 특성분석하였다. 구체적으로, 보조-인자 아연 이온의 배향에 중요한 His 잔기를 Ala로 치환하였다. 생성된 이중-돌연변이체를 H205A/E206A(abxHEbbHbc 내지 abxAAbbHbc)로 지칭한다.
2.1 이중-돌연변이체의 생성
표준 프로토콜(예컨대 실시예 1에서와 같이)을 사용하는 부위-지향적 돌연변이 유발은 아커만시아 뮤시니필라의 Amuc1119 유전자와 관련하여 히스티딘 및 글루탐산 둘 모두를 알라닌으로 변화시켜 이중 돌연변이체 Amuc1119H205A/E206A(LSH205A/E206A)를 생성하였다. 구축물을 대장균에 형질전환시키고, 실시예 1에서와 같이 서열분석을 사용하여 단리 및 확인하였다. 대장균에서의 발현을 실시예 1에 기술된 바와 같이 수행하였다. 발현된 단백질의 서열이 서열번호 21로 제공된다.
2.2 이중-돌연변이체의 특성
2.2.1 이중 돌연변이체는 LS의 활성을 완전히 비활성화시킨다
실시예 1에 나타낸 바와 같이, 단일 돌연변이체 LSE206A는 2 시간 이내에 O-당단백질을 가수분해할 수 없기 때문에 비활성인 것으로 나타났다. 그러나, 스트레스 테스트에서 O-글리코프로테아제 활성이 완전히 폐지되지는 않았지만, 더 높은 비율의 효소:O-당단백질 및 더 긴 항온 처리 시간에서 일부 활성이 관찰되었다는 점에서 다소 감소된 것으로만 확인되었다.
LSE206A : 비시알릴화된 O-당단백질에 대해 1:1(중량:중량) 비율로 24시간 동안 항온 처리하면 기질의 상당한 가수분해가 나타났으나, 야생형 LS와 같은 정도는 아니었다(도 10a). 대조적으로, 이중-돌연변이체 LSH205A/E206A는 밤새 항온 처리한 후 효소:O-당단백질에 대해 15:1(중량:중량) 비율에서도 가수분해의 임의의 증거를 나타내지 않았으며(도 10b), 이는 효소가 두 번째 돌연변이의 추가로 완전히 비활성화되었음을 시사한다.
2.2.2 이중 돌연변이체는 O-당단백질에 특이적으로 결합한다
상이한 단백질에 대한 결합을 평가하기 위해, 고정화된 LSH205A/E206A(50 μl 수지) (실시예 1과 동일한 프로토콜을 사용하여 제조함)를 PBS에서 평형화시킨 후, 50 μg의 상이한 단백질 샘플을 0.5 mg/mL의 농도로 첨가하고 실온에서 2시간 동안 엔드-오버-엔드 회전으로 항온 처리하였다. 통과물을 원심분리(200 g, 1분)를 통해 수집하고 수지를 350 μl PBS로 3회 세척하였다. 결합된 단백질의 50 μl 8 M 우레와와 함께 2회 연속 5분 항온 처리한 후 원심분리(1000 g, 1분)로 용리하였다. 모든 샘플을 동일한 부피로 로딩하였다. SDS-PAGE에 의해 시작/로딩 물질, 통과물, 및 용리물을 평가하였다.
첫 번째 실험에서(도 11a 참조), 글리코실화된 또는 비-글리코실화된 단백질을 시알리다제 혼합물(Am0707:Am1757)로, 또는 시알리다제 혼합물과 스트렙토코커스 오랄리스 엔도-α-N-아세틸-갈락토사미니다제(예컨대 O-글리코시다제)의 조합으로 전처리하고 수지와 함께 항온 처리하고, 세척하고 용리하였다. 샘플(시알리다제 혼합물 +/- O-글리코시다제)의 전처리를 제조사의 지시에 따라 수행하였다. 시알산이 없는 경우 친화성이 증가된 O-글리칸을 갖는 단백질만이 수지에 결합하였다. O-글리코시다제로 처리한 후 상호작용이 없는 것으로 나타난 바와 같이, O-글리칸의 존재는 임의의 결합이 일어나기 위해 필수적이었다.
두 번째 실험에서(도 11b 참조), N-글리코실화된, O-글리코실화된 및 비-글리코실화된 단백질 혼합물을 LS 이중 돌연변이체 수지와 함께 항온 처리하였다. O-글리코실화된 단백질(TNFαR 및 ApoE)만이 매트릭스에 결합되었고 8 M 우레아로 용리되었다. N-글리코실화된(애플리버셉트, AGP (알파-1-산 당단백질), IgG의 Fc 도메인(IgG Fc) 및 비-글리코실화(BSA)는 LS 이중 돌연변이체 수지에 결합하지 않았고 통과물에서 발견되었다. 따라서, 이중 돌연변이체 수지는 샘플이 N-, O- 및 비-글리코실화된 단백질의 혼합물을 함유할 때 O-글리코실화된 단백질에만 특이적으로 결합한다.
세 번째 실험에서(도 11c 참조), N-글리코실화된 및 비-글리코실화된 단백질의 혼합물을 LS 이중 돌연변이체 수지와 함께 항온 처리하였다. O-당단백질로부터 가능한 경쟁이 없을 때에도(아무것도 존재하지 않음) 비-특이적 결합이 없었다. 용리물에서 단백질이 발견되지 않았다. 따라서, 이중 돌연변이체 수지는 O-글리칸이 없는 단백질에 결합하지 않는다.
2.2.3 이중 돌연변이체는 용량을 향상시키기 위해 상이한 농도로 수지에 고정될 수 있다
더 많은 O-글리코실화된 단백질에 결합하는 고정화된 이중-돌연변이체 수지의 용량을 향상시키는 능력을 조사하기 위해, 상이한 농도의 이중 돌연변이체(5 내지 15 mg/mL)를 수지에 고정시키는 동안 사용하였다. 대표적인 겔이 도 12a에 제시되어 있다. 도시된 %는 양성 대조군에 대한 결합 수준이며 겔의 밀도측정 분석에 의해 결정되었다. 결과를 도 12b의 그래프에 나타냈다. 고정화 동안 더 높은 농도의 이중 돌연변이체를 사용하는 경우, 더 높은 O-당단백질 결합능을 갖는 용량-의존적 증가가 관찰되었다. 15 mg/mL의 고정화된 이중 돌연변이체를 사용하여 추가 실험을 계속하였다. 또한, 1 M 우레아 및 1 M GHCl의 존재 하에서도 높은 수준의 O-당단백질 결합이 유지되었지만, 후자는 결합 효율을 상당히 감소시켰다.
2.2.4 이중 돌연변이체의 친화성 정제 능력은 약 3 mg 당단백질/mL 수지이다
이중-돌연변이체 수지가 O-당단백질을 친화성 정제하는 능력, 및 이러한 능력의 샘플에 대한 농도의 영향을 구체적으로 조사하기 위해, 상이한 양 및 농도의 비시알릴화된 에타너셉트를 수지에 첨가하였다. 개별적인 컬럼(50 μl의 이중 돌연변이체 수지 함유)은 150 μg의 O-당단백질(즉 3 mg O-당단백질/mL 수지)와 결합하는 능력을 가졌다. 도 13은 대표적인 겔을 나타낸다.
2.2.5 이중-돌연변이체에 대한 O-당단백질의 결합은 이온 강도 또는 완충액 부피/유형에 의해 유의하게 영향을 받지 않으며, 넓은 pH 범위에서 작동한다
샘플 단백질을 상이한 조건의 범위 하에서 엔드-오버-엔드 회전으로 실온에서 2시간 동안 이중-돌연변이 수지에 결합시켜 이온 강도, 완충액 부피/유형 및 pH가 수지의 결합 능력에 미치는 영향을 시험하였다. 각각의 경우에, 이어서 수지를 각각의 결합 완충액(350 μl)으로 3회 세척하고 이어서 8 M 우레아(50 μl, 5분 항온 처리; 2회 반복)를 첨가하여 용리하였다. 이어서 모든 샘플을 SDS-PAGE로 분석하였다.
첫 번째 실험에서(도 14a 참조), 다양한 이온 강도를 갖는 완충액에서 상호작용의 안정성을 조사하기 위해, 샘플은 비시알릴화된 에타너셉트로 이루어져 있으며, 이를 0 내지 4 M NaCl에서 이중-돌연변이체-수지와 함께 항온 처리하고, 각각의 NaCl 농도로 모두 세척 단계를 수행하였다. NaCl의 첨가는 비시알릴화된 에타너셉트의 결합에 유의한 영향을 미치지 않았다.
두 번째 실험에서(도 14b 참조), 샘플은 상이한 부피의 PBS 범위에서 비시알릴화된 에타너셉트로 이루어져 있다. 세척 단계는 PBS를 사용하였다. 100 내지 300 μl 사이에서 기질 부피를 변화시키는 것은 효율에 유의한 영향을 미치지 않았다.
세 번째 실험에서(도 14c 및 d 참조), 샘플은 상이한 pH(pH 4-9)에서 상이한 완충액(100 mM 소듐 아세테이트, 50 mM 소듐 포스페이트 및 50 mM Tris) 중의 비시알릴화된 에타너셉트 및 BSA로 이루어져 있었다. 세척 단계는 맞는 완충액을 사용하였다. pH 6~8이 가장 잘 작동하는 것으로 밝혀진 반면 pH 4는 모두 작동하지 않았고 pH 9는 pH 8보다 약간 덜 효율적이었다. 임의의 O-글리칸을 함유하지 않았던 BSA는 임의의 결합 조건 하에서 수지에 결합하지 않았다.
2.2.6 우레아 및 SDS는 친화성-결합된 O-당단백질을 용리할 수 있다
이중 돌연변이체와 이의 O-당단백질 기질 사이의 높은 친화성에 기초하여, 본 발명자들은 이온 강도에 기초하지 않고, 수지로부터 결합된 단백질을 용리하기 위한 상이한 수단을 조사하였다. 우레아는 용량 의존적 용리를 가졌으며, 8 M 우레아를 사용하여 100%에 가까운 용리를 나타냈다(도 15a). 고농도의 SDS(예컨대 5~10%)도 또한 대부분의 결합된 단백질을 용리하였다(도 15b). 그러나, 다수의 하류 적용은 세제의 존재에 민감하기 때문에, 높은 수준의 우레아를 사용하는 것은 결합된 단백질/펩티드의 비-효소적 방출에 대한 것보다 실질적으로 유용할 것으로 보인다.
2.2.7 야생형 LS를 사용하여 이중-돌연변이체-결합된 O-당단백질을 용리할 수 있다
본 발명자들은 이중-돌연변이체 결합된 단백질에 LS의 첨가가 이의 방출을 초래할 수 있고, 따라서, 용리를 위해 우레아의 첨가를 필요로 하지 않는다고 추측하였다. 아바타셉트 및 에타너셉트 둘 모두는 6시간 내에 LS에 의해 이중-돌연변이체-수지로부터 가수분해되고 용리될 수 있지만, 24시간 후에 약간 더 완전한 용출을 가졌다(도 16a). 이후 우레아의 첨가는 매우 적은 O-당단백질이 친화성 매트릭스에 부착된 채로 남아 LS의 용리 전략이 매우 효율적이라는 것을 보여주었다.
LS로 용리된 에타너셉트는 또한 질량 분석(LC/MS 및 MS/MS)에 적용되었다, 확인된 펩티드(도 16b.1)는 에타너셉트의 LS 소화에서 생성된 것들과 일치하였다(도 16b.2). 이러한 실험의 추가 MS 데이터가 다음 표에 제시되어 있다:
2.2.8 이중 돌연변이체를 사용하여 복합체 샘플로부터 O-당단백질을 친화성-정제할 수 있다
시스템이 단순화된 시스템뿐만 아니라 복합 배지에서 O-글리코실화된 단백질에 대한 일반적인 친화성 매트릭스로서 기능할 수 있다는 개념의 증거로서, 본 발명자들은 이중-돌연변이체가 인간 혈청으로부터 O-당단백질을 정제하는 능력을 조사하였다. 인간 혈청은 주로 비-글리코실화된(BSA) 단백질 및 N-글리코실화된(IgG) 단백질로 이루어져 있으며, 총 혈청 프로테옴의 일부만이 O-글리코실화되어있다.
50 μl의 고정화된 이중-돌연변이체 수지 컬럼에 20 μl 시알리다제 처리된 혈청(약 1.2 mg 단백질)을 적용하면 거의 모든 비-글리코실화된 단백질 및 N-글리코실화된 단백질을 제거하면서, 일부 선택된 단백질을 용리할 수 있다(도 17a). 시알리다제 및 O-글리코시다제의 전처리 또는 비처리된 다량의 혈청(예컨대, 2.5 mg 단백질)을 첨가함으로써, 상호작용이 O-글리칸 및 말단 시알산의 제거에 의존적임을 입증하였다(도 17b). 또한, 시알리다제로 전처리하면 비-시알리다제-처리된 샘플에 비해 결합된 O-당단백질의 양을 유의하게 증가시킨다고 결론지었다. 50 U 시알리다제 혼합물(Am0707:Am1757)의 첨가는 친화성 정제된 O-당단백질의 양을 향상시키기에 충분하였다(도 17c).
질량 분석법으로 분석함으로써, 대부분의 친화성 정제된 혈청 단백질은 O-글리코실화된 단백질로 주석이 달릴 수 있다(도 18a, 및 아래 표에서 굵은-이탤릭 으로 된 명칭). 비-O-당단백질 펩티드와 관련하여 확인된 O-당단백질 펩티드의 수는 확인된 펩티드의 총 수의 측면(도 18b)뿐만 아니라 O-당단백질 펩티드 대 비-당단백질 펩티드의 비율(도 18c) 둘 모두에서 세척 단계에서 상이한 엄격성에 의해 영향을 받을 수 있다. 따라서, 친화성 수지는 O-당단백질을 특이적이고 선택적으로 친화성 정제 및 농축하는 능력이 매우 효율적이라는 것이 명백하다. 이러한 실험의 추가 MS 데이터가 아래 표에 제시되어 있다.
2.2.9 고정화된 이중-돌연변이체는 또한 더 짧은 O-
글리코펩티드에
결합한다
O-글리코펩티드에 대해서도 LS 이중 돌연변이체의 특이성을 입증하기 위해 일련의 실험을 수행하였다. 첫 번째 실험에서, O-글리코실화된 펩티드(트레오닌 상에 핵심 1 O-글리칸이 있는 글리코드로소신 (GD) = GKPRPYSPRPTSHPRPIRV (서열번호 47)) 및 몇몇 비-글리코실화된 펩티드(H2686, H4062 H8390 및 인슐린 산화된 베타 쇄(IOB))의 혼합물을 LS 이중 돌연변이체 수지와 함께 항온 처리하였다. (H2686 = YIYGSFK (서열번호 48), H4062 = KKLVFFA (서열번호 49), H8390 = FLPLILGKLVKGLL (서열번호 50)).
펩티드 혼합물을 엔드-오버-엔드 회전으로 실온에서 2시간 동안 50 μl의 고정화된 이중-돌연변이체 수지에 결합하도록 하였다. 수지를 결합 완충액(300 μl)으로 5회 세척한 다음 8 M 우레아를 첨가하여 용리하였다. 로딩, 통과물 및 용리물 중의 펩티드를 LC/MS로 분석하였다. RP-LC C18 컬럼(Agilent의 Advance BioPeptide Map 2.1x100 2.7μm) 상에서 분리를 수행하고 ESI-Q-TOF Bruker Impact II로 검출하였다. 결과를 도 19a에 나타냈다. O-GalNAcGal을 함유한 혼합물에서 유일한 펩티드인 글리코드로소신을 주로 용리된 분획과 통과물 분획 중의 비-글리코실화된 펩티드에서 발견되었다.
두 번째 실험에서, LS 이중-돌연변이체가 트립신 단백질 소화(예컨대, 상이한 유형의 펩티드 혼합물)로부터 O-글리코실화된 펩티드를 풍부하게 할 수 있는지 여부를 조사하였다.
IgA를 소화 표적으로 선택하였다. 트립신 부위 및 IgA의 보고된 O-글리코실화 부위에 기초하여, 트립신 소화는 IgA의 위치 89-126에 상응하는 단일 O-글리코실화된 펩티드만을 초래해야 한다(도 19b의 개략도 참조).
트립신 소화물을 생성하기 위해, IgA를 6M 우레아 및 5 mM DTT와 함께 혼합한 후 37 ℃에서 1시간 동안 항온 처리하였다. IAM을 15 mM 첨가한 후 어두운 곳에서 30분 동안 실온에서 항온 처리하였다. 이어서 샘플을 Zeba spin 7000 K 컬럼 상에서 50 mM Tris, pH 8.0으로 완충액을 교환하였다. 이어서 트립신을 1:20으로 첨가하고 37℃에서 밤새 항온 처리하였다. 트립신 억제제 1 mg/mg을 첨가한 후 실온에서 20분 동안 항온 처리하였다. 시알리다제 혼합물 및 NaCl을 첨가하여 트립신 소화물을 생성하였다. 혼합물을 엔드-오버-엔드 회전으로 실온에서 2시간 동안 수지에 결합하도록 하였다. 수지를 PBS 완충액 (300 μl)으로 10회 세척한 다음 8 M 우레아(50 μl, 2분, 2회 반복)를 첨가하여 용리하였다.
로딩, 통과물 및 용리물의 펩티드를 45℃에서 MQ 중의 0.1%FA:95% ACN 중의 0.1%FA 구배 및 0.2 ml/분의 유속에서 C18 컬럼(Agilent Technologies의 Advance BioPeptide Plus 2.1 × 150 mm 2.7 μm)에서 RP-LC MSMS를 사용하여 분리하고 분석하였다. 검출은 ESI-Q-TOF Bruker Impact II 기기에서 이루어졌다. 결과를 도 19c에 나타냈다. O-글리코실화된 펩티드 89-126은 용리액이 상당히 풍부하였고, 특정 O-글리코펩티드 89-126은 무손상 질량으로 확인되었다.
2.2.10 고정화된 이중-돌연변이체는 다른 O-당단백질 결합 매트릭스와 유리하게 비교한다
본 발명자들은 다른 상업적으로 이용가능한 O-당단백질 결합 매트릭스, 특히 렉틴 Peanut 응집체(PNA), 및 비시아 빌로사 렉틴(Vicia villosa lectin, VVA)과 비교하여 O-당단백질을 친화성 정제하는 이중-돌연변이체의 능력을 평가하였다. 에타너셉트 및 비시알릴화된 에타너셉트를 모델 기질로 사용하였다.
50 μg 기질을 PBS(PNA 및 LS 이중 돌연변이체) 또는 렉틴 결합 완충액(VVA)에 각각의 완충액 중의 미리-평형화된 50 μl 부피의 상이한 고정화된 렉틴 또는 LS 이중-돌연변이체 수지에 첨가하였다(총 100 μl). (렉틴 결합 완충액은 20 mM Tris-HCl pH 7.4, 150 mM NaCl, 1 mM 각각의 MgCl2, CaCl2, ZnCl2, 및 MnCl2이다). 기질을 실온에서 엔드-오버-엔드 혼합으로 2시간 동안 수지와 함께 상호작용 시켰다. 비-결합된 단백질을 PBS 또는 렉틴 결합 완충액으로 각각 세척하였다(100 g, 1 분; 3 회). 수지를 원심분리(1000 g, 1분)로 건조시켰다. 8 M 우레아(PNA 및 LS 이중 돌연변이체 수지의 경우) 또는 제조사에 따른 VVA 용리 완충액(VVA 수지의 경우)(50 μl, 5분 처리 후 1000 g 1분; 2회 원심분리)을 첨가하여 결합된 단백질을 용리하고, 통과물(FT) 및 용리물(E) 둘 모두를 SDS-PAGE 상에서 분석하였다. 양성 대조군으로서 1.5 μg 기질을 각각의 겔(예컨대 3 μl)에 첨가하고 100% 효율을 가정한 1.5 μg 로딩된 기질에 대한 수지의 효율을 평가하기 위해 밀도측정 분석을 수행하였다. 에타너셉트 및 비시알릴화된 에타너셉트(에타너셉트 S)에 대한 대표적인 겔을 도 20a에 나타냈다. 밀도측정 분석의 결과를 도 20b에 나타냈다. LSH205A/E206A 이중 돌연변이체는 비시알릴화된 기질의 정제 효율을 위해 적어도 최고의 상용 렉틴뿐만 아니라 성능도 수행한다.
서열
SEQUENCE LISTING
<110> GENOVIS AB
<120> Protease and binding polypeptide for O-glycoproteins
<130> N410795WO
<150> GB1708471.6
<151> 2017-05-26
<150> GB1708476.5
<151> 2017-05-26
<150> GB1806655.5
<151> 2018-04-24
<160> 50
<170> PatentIn version 3.5
<210> 1
<211> 361
<212> PRT
<213> Akkermansia muciniphila
<400> 1
Glu Val Thr Val Pro Asp Ala Leu Lys Asp Arg Ile Ala Leu Lys Lys
1 5 10 15
Thr Ala Arg Gln Leu Asn Ile Val Tyr Phe Leu Gly Ser Asp Thr Glu
20 25 30
Pro Val Pro Asp Tyr Glu Arg Arg Leu Ser Glu Leu Leu Leu Tyr Leu
35 40 45
Gln Gln Phe Tyr Gly Lys Glu Met Gln Arg His Gly Tyr Gly Ala Arg
50 55 60
Ser Phe Gly Leu Asp Ile Lys Ser Pro Gly Arg Val Asn Ile Ile Glu
65 70 75 80
Tyr Lys Ala Lys Asn Pro Ala Ala His Tyr Pro Tyr Glu Asn Gly Gly
85 90 95
Gly Trp Lys Ala Ala Gln Glu Leu Asp Glu Phe Phe Lys Ala His Pro
100 105 110
Asp Arg Lys Lys Ser Gln His Thr Leu Ile Ile Met Pro Thr Trp Asn
115 120 125
Asp Glu Lys Asn Gly Pro Asp Asn Pro Gly Gly Val Pro Phe Tyr Gly
130 135 140
Met Gly Arg Asn Cys Phe Ala Leu Asp Tyr Pro Ala Phe Asp Ile Lys
145 150 155 160
His Leu Gly Gln Lys Thr Arg Glu Gly Arg Leu Leu Thr Lys Trp Tyr
165 170 175
Gly Gly Met Ala His Glu Leu Gly His Gly Leu Asn Leu Pro His Asn
180 185 190
His Gln Thr Ala Ser Asp Gly Lys Lys Tyr Gly Thr Ala Leu Met Gly
195 200 205
Ser Gly Asn Tyr Thr Phe Gly Thr Ser Pro Thr Phe Leu Thr Pro Ala
210 215 220
Ser Cys Ala Leu Leu Asp Ala Cys Glu Val Phe Ser Val Thr Pro Ser
225 230 235 240
Gln Gln Phe Tyr Glu Gly Lys Pro Glu Val Glu Val Gly Asp Val Ala
245 250 255
Ile Ser Phe Lys Gly Asp Gln Ile Leu Val Ser Gly Asn Tyr Lys Ser
260 265 270
Pro Gln Thr Val Lys Ala Leu Asn Val Tyr Ile Gln Asp Pro Pro Tyr
275 280 285
Ala Val Asn Gln Asp Tyr Asp Ala Val Ser Phe Ser Arg Arg Leu Gly
290 295 300
Lys Lys Ser Gly Lys Phe Ser Met Lys Ile Asp Lys Lys Glu Leu Glu
305 310 315 320
Gly Leu Asn Asn Asn Glu Phe Arg Ile Ser Leu Met Phe Ile Leu Ala
325 330 335
Asn Gly Leu His Met Gln Lys His Phe Thr Phe His Trp Asp Ala Leu
340 345 350
Gln Asp Tyr Arg Asp Gly Ser Lys Ser
355 360
<210> 2
<211> 371
<212> PRT
<213> Artificial Sequence
<220>
<223> LS (N terminal methionine and a C-terminal linker + His6 tag)
<400> 2
Met Glu Val Thr Val Pro Asp Ala Leu Lys Asp Arg Ile Ala Leu Lys
1 5 10 15
Lys Thr Ala Arg Gln Leu Asn Ile Val Tyr Phe Leu Gly Ser Asp Thr
20 25 30
Glu Pro Val Pro Asp Tyr Glu Arg Arg Leu Ser Glu Leu Leu Leu Tyr
35 40 45
Leu Gln Gln Phe Tyr Gly Lys Glu Met Gln Arg His Gly Tyr Gly Ala
50 55 60
Arg Ser Phe Gly Leu Asp Ile Lys Ser Pro Gly Arg Val Asn Ile Ile
65 70 75 80
Glu Tyr Lys Ala Lys Asn Pro Ala Ala His Tyr Pro Tyr Glu Asn Gly
85 90 95
Gly Gly Trp Lys Ala Ala Gln Glu Leu Asp Glu Phe Phe Lys Ala His
100 105 110
Pro Asp Arg Lys Lys Ser Gln His Thr Leu Ile Ile Met Pro Thr Trp
115 120 125
Asn Asp Glu Lys Asn Gly Pro Asp Asn Pro Gly Gly Val Pro Phe Tyr
130 135 140
Gly Met Gly Arg Asn Cys Phe Ala Leu Asp Tyr Pro Ala Phe Asp Ile
145 150 155 160
Lys His Leu Gly Gln Lys Thr Arg Glu Gly Arg Leu Leu Thr Lys Trp
165 170 175
Tyr Gly Gly Met Ala His Glu Leu Gly His Gly Leu Asn Leu Pro His
180 185 190
Asn His Gln Thr Ala Ser Asp Gly Lys Lys Tyr Gly Thr Ala Leu Met
195 200 205
Gly Ser Gly Asn Tyr Thr Phe Gly Thr Ser Pro Thr Phe Leu Thr Pro
210 215 220
Ala Ser Cys Ala Leu Leu Asp Ala Cys Glu Val Phe Ser Val Thr Pro
225 230 235 240
Ser Gln Gln Phe Tyr Glu Gly Lys Pro Glu Val Glu Val Gly Asp Val
245 250 255
Ala Ile Ser Phe Lys Gly Asp Gln Ile Leu Val Ser Gly Asn Tyr Lys
260 265 270
Ser Pro Gln Thr Val Lys Ala Leu Asn Val Tyr Ile Gln Asp Pro Pro
275 280 285
Tyr Ala Val Asn Gln Asp Tyr Asp Ala Val Ser Phe Ser Arg Arg Leu
290 295 300
Gly Lys Lys Ser Gly Lys Phe Ser Met Lys Ile Asp Lys Lys Glu Leu
305 310 315 320
Glu Gly Leu Asn Asn Asn Glu Phe Arg Ile Ser Leu Met Phe Ile Leu
325 330 335
Ala Asn Gly Leu His Met Gln Lys His Phe Thr Phe His Trp Asp Ala
340 345 350
Leu Gln Asp Tyr Arg Asp Gly Ser Lys Ser Gly Ser Gly His His His
355 360 365
His His His
370
<210> 3
<211> 1116
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleotide sequence of LS
<400> 3
atggaagtca ctgtgccgga cgccctgaaa gatcgcatcg cgctgaagaa aaccgctcgt 60
cagctgaata tcgtctactt cctgggttct gataccgaac cggttccgga ctacgagcgc 120
cgtctgagcg agctgctgtt gtatctgcag caattctatg gtaaagaaat gcagcgccat 180
ggctatggcg cacgcagctt tggtctggac attaagtcac cgggtcgtgt gaacattatc 240
gagtacaaag cgaagaaccc ggcagcgcat tacccgtatg agaatggtgg cggctggaaa 300
gctgcacaag aactggacga atttttcaag gcccatccag accgcaagaa aagccagcac 360
accctgatca tcatgcctac ctggaatgat gagaaaaatg gtcctgacaa tccgggtggc 420
gttccgttct atggtatggg tcgtaattgt tttgcgttgg actacccggc gtttgatatc 480
aagcacctgg gtcagaaaac gcgtgagggt cgtctgctga cgaaatggta cggtggcatg 540
gcgcacgaac tgggccacgg cctgaatctg ccgcacaatc accagaccgc gagcgatggc 600
aagaaatatg gcaccgccct gatgggtagc ggcaactaca cgttcggtac cagcccgacg 660
ttcctgaccc cggcgagctg tgcgctgctg gatgcctgcg aagtgttcag cgttaccccg 720
agccaacagt tttatgaggg taagccagaa gtcgaggttg gtgatgttgc aatttccttc 780
aagggtgatc aaatcttggt cagcggtaac tacaagagcc cgcaaaccgt gaaagctctg 840
aacgtttaca ttcaggatcc gccgtacgcc gtgaaccaag actacgatgc agtgagcttt 900
agccgtcgtc tgggcaaaaa gtccggtaag tttagcatga agattgacaa aaaagaactg 960
gaaggcctga ataacaacga attccgtatt tccttgatgt tcattctggc aaacggctta 1020
cacatgcaga agcactttac gtttcactgg gatgcgctgc aagactaccg tgacggtagc 1080
aaatctggtt cgggtcatca tcaccaccat cactga 1116
<210> 4
<211> 385
<212> PRT
<213> Akkermansia muciniphila
<400> 4
Met Leu Lys Arg Leu Leu Ser Ala Phe Phe Ser Leu Phe Phe Leu Gly
1 5 10 15
Ala Ala Ser Gly Thr Ser Phe Ala Glu Val Thr Val Pro Asp Ala Leu
20 25 30
Lys Asp Arg Ile Ala Leu Lys Lys Thr Ala Arg Gln Leu Asn Ile Val
35 40 45
Tyr Phe Leu Gly Ser Asp Thr Glu Pro Val Pro Asp Tyr Glu Arg Arg
50 55 60
Leu Ser Glu Leu Leu Leu Tyr Leu Gln Gln Phe Tyr Gly Lys Glu Met
65 70 75 80
Gln Arg His Gly Tyr Gly Ala Arg Ser Phe Gly Leu Asp Ile Lys Ser
85 90 95
Pro Gly Arg Val Asn Ile Ile Glu Tyr Lys Ala Lys Asn Pro Ala Ala
100 105 110
His Tyr Pro Tyr Glu Asn Gly Gly Gly Trp Lys Ala Ala Gln Glu Leu
115 120 125
Asp Glu Phe Phe Lys Ala His Pro Asp Arg Lys Lys Ser Gln His Thr
130 135 140
Leu Ile Ile Met Pro Thr Trp Asn Asp Glu Lys Asn Gly Pro Asp Asn
145 150 155 160
Pro Gly Gly Val Pro Phe Tyr Gly Met Gly Arg Asn Cys Phe Ala Leu
165 170 175
Asp Tyr Pro Ala Phe Asp Ile Lys His Leu Gly Gln Lys Thr Arg Glu
180 185 190
Gly Arg Leu Leu Thr Lys Trp Tyr Gly Gly Met Ala His Glu Leu Gly
195 200 205
His Gly Leu Asn Leu Pro His Asn His Gln Thr Ala Ser Asp Gly Lys
210 215 220
Lys Tyr Gly Thr Ala Leu Met Gly Ser Gly Asn Tyr Thr Phe Gly Thr
225 230 235 240
Ser Pro Thr Phe Leu Thr Pro Ala Ser Cys Ala Leu Leu Asp Ala Cys
245 250 255
Glu Val Phe Ser Val Thr Pro Ser Gln Gln Phe Tyr Glu Gly Lys Pro
260 265 270
Glu Val Glu Val Gly Asp Val Ala Ile Ser Phe Lys Gly Asp Gln Ile
275 280 285
Leu Val Ser Gly Asn Tyr Lys Ser Pro Gln Thr Val Lys Ala Leu Asn
290 295 300
Val Tyr Ile Gln Asp Pro Pro Tyr Ala Val Asn Gln Asp Tyr Asp Ala
305 310 315 320
Val Ser Phe Ser Arg Arg Leu Gly Lys Lys Ser Gly Lys Phe Ser Met
325 330 335
Lys Ile Asp Lys Lys Glu Leu Glu Gly Leu Asn Asn Asn Glu Phe Arg
340 345 350
Ile Ser Leu Met Phe Ile Leu Ala Asn Gly Leu His Met Gln Lys His
355 360 365
Phe Thr Phe His Trp Asp Ala Leu Gln Asp Tyr Arg Asp Gly Ser Lys
370 375 380
Ser
385
<210> 5
<211> 361
<212> PRT
<213> Artificial Sequence
<220>
<223> Polypeptide capable of binding to O-glycans but lacks or has
reduced O-glycoprotein-specific endoprotease activity
<400> 5
Glu Val Thr Val Pro Asp Ala Leu Lys Asp Arg Ile Ala Leu Lys Lys
1 5 10 15
Thr Ala Arg Gln Leu Asn Ile Val Tyr Phe Leu Gly Ser Asp Thr Glu
20 25 30
Pro Val Pro Asp Tyr Glu Arg Arg Leu Ser Glu Leu Leu Leu Tyr Leu
35 40 45
Gln Gln Phe Tyr Gly Lys Glu Met Gln Arg His Gly Tyr Gly Ala Arg
50 55 60
Ser Phe Gly Leu Asp Ile Lys Ser Pro Gly Arg Val Asn Ile Ile Glu
65 70 75 80
Tyr Lys Ala Lys Asn Pro Ala Ala His Tyr Pro Tyr Glu Asn Gly Gly
85 90 95
Gly Trp Lys Ala Ala Gln Glu Leu Asp Glu Phe Phe Lys Ala His Pro
100 105 110
Asp Arg Lys Lys Ser Gln His Thr Leu Ile Ile Met Pro Thr Trp Asn
115 120 125
Asp Glu Lys Asn Gly Pro Asp Asn Pro Gly Gly Val Pro Phe Tyr Gly
130 135 140
Met Gly Arg Asn Cys Phe Ala Leu Asp Tyr Pro Ala Phe Asp Ile Lys
145 150 155 160
His Leu Gly Gln Lys Thr Arg Glu Gly Arg Leu Leu Thr Lys Trp Tyr
165 170 175
Gly Gly Met Ala His Ala Leu Gly His Gly Leu Asn Leu Pro His Asn
180 185 190
His Gln Thr Ala Ser Asp Gly Lys Lys Tyr Gly Thr Ala Leu Met Gly
195 200 205
Ser Gly Asn Tyr Thr Phe Gly Thr Ser Pro Thr Phe Leu Thr Pro Ala
210 215 220
Ser Cys Ala Leu Leu Asp Ala Cys Glu Val Phe Ser Val Thr Pro Ser
225 230 235 240
Gln Gln Phe Tyr Glu Gly Lys Pro Glu Val Glu Val Gly Asp Val Ala
245 250 255
Ile Ser Phe Lys Gly Asp Gln Ile Leu Val Ser Gly Asn Tyr Lys Ser
260 265 270
Pro Gln Thr Val Lys Ala Leu Asn Val Tyr Ile Gln Asp Pro Pro Tyr
275 280 285
Ala Val Asn Gln Asp Tyr Asp Ala Val Ser Phe Ser Arg Arg Leu Gly
290 295 300
Lys Lys Ser Gly Lys Phe Ser Met Lys Ile Asp Lys Lys Glu Leu Glu
305 310 315 320
Gly Leu Asn Asn Asn Glu Phe Arg Ile Ser Leu Met Phe Ile Leu Ala
325 330 335
Asn Gly Leu His Met Gln Lys His Phe Thr Phe His Trp Asp Ala Leu
340 345 350
Gln Asp Tyr Arg Asp Gly Ser Lys Ser
355 360
<210> 6
<211> 371
<212> PRT
<213> Artificial Sequence
<220>
<223> LS E206A (N-terminal methionine and a C-terminal linker + His6
tag)
<400> 6
Met Glu Val Thr Val Pro Asp Ala Leu Lys Asp Arg Ile Ala Leu Lys
1 5 10 15
Lys Thr Ala Arg Gln Leu Asn Ile Val Tyr Phe Leu Gly Ser Asp Thr
20 25 30
Glu Pro Val Pro Asp Tyr Glu Arg Arg Leu Ser Glu Leu Leu Leu Tyr
35 40 45
Leu Gln Gln Phe Tyr Gly Lys Glu Met Gln Arg His Gly Tyr Gly Ala
50 55 60
Arg Ser Phe Gly Leu Asp Ile Lys Ser Pro Gly Arg Val Asn Ile Ile
65 70 75 80
Glu Tyr Lys Ala Lys Asn Pro Ala Ala His Tyr Pro Tyr Glu Asn Gly
85 90 95
Gly Gly Trp Lys Ala Ala Gln Glu Leu Asp Glu Phe Phe Lys Ala His
100 105 110
Pro Asp Arg Lys Lys Ser Gln His Thr Leu Ile Ile Met Pro Thr Trp
115 120 125
Asn Asp Glu Lys Asn Gly Pro Asp Asn Pro Gly Gly Val Pro Phe Tyr
130 135 140
Gly Met Gly Arg Asn Cys Phe Ala Leu Asp Tyr Pro Ala Phe Asp Ile
145 150 155 160
Lys His Leu Gly Gln Lys Thr Arg Glu Gly Arg Leu Leu Thr Lys Trp
165 170 175
Tyr Gly Gly Met Ala His Ala Leu Gly His Gly Leu Asn Leu Pro His
180 185 190
Asn His Gln Thr Ala Ser Asp Gly Lys Lys Tyr Gly Thr Ala Leu Met
195 200 205
Gly Ser Gly Asn Tyr Thr Phe Gly Thr Ser Pro Thr Phe Leu Thr Pro
210 215 220
Ala Ser Cys Ala Leu Leu Asp Ala Cys Glu Val Phe Ser Val Thr Pro
225 230 235 240
Ser Gln Gln Phe Tyr Glu Gly Lys Pro Glu Val Glu Val Gly Asp Val
245 250 255
Ala Ile Ser Phe Lys Gly Asp Gln Ile Leu Val Ser Gly Asn Tyr Lys
260 265 270
Ser Pro Gln Thr Val Lys Ala Leu Asn Val Tyr Ile Gln Asp Pro Pro
275 280 285
Tyr Ala Val Asn Gln Asp Tyr Asp Ala Val Ser Phe Ser Arg Arg Leu
290 295 300
Gly Lys Lys Ser Gly Lys Phe Ser Met Lys Ile Asp Lys Lys Glu Leu
305 310 315 320
Glu Gly Leu Asn Asn Asn Glu Phe Arg Ile Ser Leu Met Phe Ile Leu
325 330 335
Ala Asn Gly Leu His Met Gln Lys His Phe Thr Phe His Trp Asp Ala
340 345 350
Leu Gln Asp Tyr Arg Asp Gly Ser Lys Ser Gly Ser Gly His His His
355 360 365
His His His
370
<210> 7
<211> 1116
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleotide sequence encoding LS E206A
<400> 7
atggaagtca ctgtgccgga cgccctgaaa gatcgcatcg cgctgaagaa aaccgctcgt 60
cagctgaata tcgtctactt cctgggttct gataccgaac cggttccgga ctacgagcgc 120
cgtctgagcg agctgctgtt gtatctgcag caattctatg gtaaagaaat gcagcgccat 180
ggctatggcg cacgcagctt tggtctggac attaagtcac cgggtcgtgt gaacattatc 240
gagtacaaag cgaagaaccc ggcagcgcat tacccgtatg agaatggtgg cggctggaaa 300
gctgcacaag aactggacga atttttcaag gcccatccag accgcaagaa aagccagcac 360
accctgatca tcatgcctac ctggaatgat gagaaaaatg gtcctgacaa tccgggtggc 420
gttccgttct atggtatggg tcgtaattgt tttgcgttgg actacccggc gtttgatatc 480
aagcacctgg gtcagaaaac gcgtgagggt cgtctgctga cgaaatggta cggtggcatg 540
gcgcacgcgc tgggccacgg cctgaatctg ccgcacaatc accagaccgc gagcgatggc 600
aagaaatatg gcaccgccct gatgggtagc ggcaactaca cgttcggtac cagcccgacg 660
ttcctgaccc cggcgagctg tgcgctgctg gatgcctgcg aagtgttcag cgttaccccg 720
agccaacagt tttatgaggg taagccagaa gtcgaggttg gtgatgttgc aatttccttc 780
aagggtgatc aaatcttggt cagcggtaac tacaagagcc cgcaaaccgt gaaagctctg 840
aacgtttaca ttcaggatcc gccgtacgcc gtgaaccaag actacgatgc agtgagcttt 900
agccgtcgtc tgggcaaaaa gtccggtaag tttagcatga agattgacaa aaaagaactg 960
gaaggcctga ataacaacga attccgtatt tccttgatgt tcattctggc aaacggctta 1020
cacatgcaga agcactttac gtttcactgg gatgcgctgc aagactaccg tgacggtagc 1080
aaatctggtt cgggtcatca tcaccaccat cactga 1116
<210> 8
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> Metalloprotease domain motif
<400> 8
Gly Met Ala His Glu Leu Gly His Gly Leu
1 5 10
<210> 9
<211> 595
<212> PRT
<213> Akkermansia muciniphila
<400> 9
Met Lys Asn Leu Leu Phe Ala Leu Leu Thr Gly Ser Phe Cys Cys Cys
1 5 10 15
Tyr Ala Gln Gln Lys Ala Ala Pro Val Pro Glu Pro Glu Val Val Ala
20 25 30
Thr Pro Pro Ala Asp Ala Gly Arg Gly Leu Ile Arg Val Asp Ser Arg
35 40 45
Glu Ile Arg His Tyr Ser Gly Thr Arg Lys Glu Pro Asp Tyr Leu Val
50 55 60
Ser Arg Asp Asn Gly Lys Thr Trp Glu Met Lys Ala Ala Pro Ala Gly
65 70 75 80
Tyr Pro Pro Asn Tyr Gly Gly Ile Pro Lys Glu Ser Pro Ala Ile Val
85 90 95
Arg Asn Pro Leu Thr Arg Glu Phe Ile Arg Val Gln Pro Ile Gly Gly
100 105 110
Phe Val Phe Leu Ser Arg Gly Gly Leu Asp Gly Lys Trp Leu Ala Val
115 120 125
Thr Asn Asp Gly Lys Leu Glu Glu Asp Trp Lys Asp Pro Glu Lys Arg
130 135 140
Lys Asn Leu Lys Lys Leu Gly Gly Ile Met Arg Thr Pro Val Phe Val
145 150 155 160
Asn Lys Gly Arg Arg Val Ile Val Pro Phe His Asn Met Gly Gly Gly
165 170 175
Thr Lys Phe His Ile Ser Asp Asp Gly Gly Leu Thr Trp His Val Ser
180 185 190
Arg Asn Gly Val Thr Ser Pro Arg His Glu Ala Arg Pro Pro His Gln
195 200 205
Gly Val Arg Trp Phe Asn Asn Ala Val Glu Ala Thr Val Leu Glu Met
210 215 220
Lys Asp Gly Thr Leu Trp Ala Leu Ala Arg Thr Ser Gln Asp Gln Ala
225 230 235 240
Trp Gln Ala Phe Ser Lys Asp Tyr Gly Glu Thr Trp Ser Lys Pro Glu
245 250 255
Pro Ser Arg Phe Phe Gly Thr Leu Thr Met Asn Thr Leu Gly Arg Leu
260 265 270
Asp Asp Gly Thr Ile Val Ser Leu Trp Thr Asn Thr Met Ala Leu Pro
275 280 285
Glu Asn Ala Thr Ala Gly Asn Gly Thr Trp Glu Asp Val Phe Thr Asn
290 295 300
Arg Asp Ser His His Ile Ala Met Ser Gly Asp Glu Gly Lys Thr Trp
305 310 315 320
Tyr Gly Phe Arg Glu Ile Ile Leu Asp Glu His Arg Asn His Pro Gly
325 330 335
Tyr Ala Thr Leu Asp Gly Pro Glu Asp Arg Gly Lys His Gln Ser Glu
340 345 350
Met Val Gln Leu Asp Lys Asn Arg Ile Leu Ile Ser Leu Gly Gln His
355 360 365
Lys Asn His Arg Arg Leu Val Ile Val Asp Arg Arg Trp Val Gly Ala
370 375 380
Lys Thr Arg Ala Thr Gln Thr Gly Lys Asp Leu Asp Ser Gln Trp Thr
385 390 395 400
Ile His Thr Tyr Ile Pro Gln Lys Lys Gly His Cys Ser Tyr Asn Arg
405 410 415
Lys Pro Ser Ala Glu Leu Val Gln Asp Pro Ser Gly Gly Thr Lys Lys
420 425 430
Val Leu Gln Ile Lys Arg Leu Asp Asp Pro Glu Leu Val Asn Glu Lys
435 440 445
Ser Asn Val Asp Tyr Arg Asn Gly Gly Ala Thr Trp Asn Phe Pro Asn
450 455 460
Gly Thr Thr Gly Leu Val Lys Phe Arg Phe Arg Val Val Asp Gly Glu
465 470 475 480
Gln Ala Asp Asp Ser Gly Leu Gln Val Ser Leu Thr Asp Arg Leu Phe
485 490 495
Asn Ala Cys Asp Ser Thr Thr Lys Asp Tyr Ala Leu Phe Thr Phe Pro
500 505 510
Ile Arg Leu Lys Pro Ala Pro His Leu Leu Leu Gly Met Lys Lys Val
515 520 525
Pro Phe Thr Pro Gly Ala Trp His Glu Ile Ser Leu Leu Trp Gln Gly
530 535 540
Gly Gln Ala Val Val Ser Leu Asp Gly Lys Lys Ala Gly Thr Leu Lys
545 550 555 560
Met Ala Asn Lys Ser Pro Asn Gly Ala Ser Tyr Ile His Phe Ile Ser
565 570 575
Thr Gly Ser Gln Pro Asp Ala Gly Ile Leu Leu Asp Thr Val Asn Ala
580 585 590
Arg Val Lys
595
<210> 10
<211> 577
<212> PRT
<213> Akkermansia muciniphila
<400> 10
Gln Gln Lys Ala Ala Pro Val Pro Glu Pro Glu Val Val Ala Thr Pro
1 5 10 15
Pro Ala Asp Ala Gly Arg Gly Leu Ile Arg Val Asp Ser Arg Glu Ile
20 25 30
Arg His Tyr Ser Gly Thr Arg Lys Glu Pro Asp Tyr Leu Val Ser Arg
35 40 45
Asp Asn Gly Lys Thr Trp Glu Met Lys Ala Ala Pro Ala Gly Tyr Pro
50 55 60
Pro Asn Tyr Gly Gly Ile Pro Lys Glu Ser Pro Ala Ile Val Arg Asn
65 70 75 80
Pro Leu Thr Arg Glu Phe Ile Arg Val Gln Pro Ile Gly Gly Phe Val
85 90 95
Phe Leu Ser Arg Gly Gly Leu Asp Gly Lys Trp Leu Ala Val Thr Asn
100 105 110
Asp Gly Lys Leu Glu Glu Asp Trp Lys Asp Pro Glu Lys Arg Lys Asn
115 120 125
Leu Lys Lys Leu Gly Gly Ile Met Arg Thr Pro Val Phe Val Asn Lys
130 135 140
Gly Arg Arg Val Ile Val Pro Phe His Asn Met Gly Gly Gly Thr Lys
145 150 155 160
Phe His Ile Ser Asp Asp Gly Gly Leu Thr Trp His Val Ser Arg Asn
165 170 175
Gly Val Thr Ser Pro Arg His Glu Ala Arg Pro Pro His Gln Gly Val
180 185 190
Arg Trp Phe Asn Asn Ala Val Glu Ala Thr Val Leu Glu Met Lys Asp
195 200 205
Gly Thr Leu Trp Ala Leu Ala Arg Thr Ser Gln Asp Gln Ala Trp Gln
210 215 220
Ala Phe Ser Lys Asp Tyr Gly Glu Thr Trp Ser Lys Pro Glu Pro Ser
225 230 235 240
Arg Phe Phe Gly Thr Leu Thr Met Asn Thr Leu Gly Arg Leu Asp Asp
245 250 255
Gly Thr Ile Val Ser Leu Trp Thr Asn Thr Met Ala Leu Pro Glu Asn
260 265 270
Ala Thr Ala Gly Asn Gly Thr Trp Glu Asp Val Phe Thr Asn Arg Asp
275 280 285
Ser His His Ile Ala Met Ser Gly Asp Glu Gly Lys Thr Trp Tyr Gly
290 295 300
Phe Arg Glu Ile Ile Leu Asp Glu His Arg Asn His Pro Gly Tyr Ala
305 310 315 320
Thr Leu Asp Gly Pro Glu Asp Arg Gly Lys His Gln Ser Glu Met Val
325 330 335
Gln Leu Asp Lys Asn Arg Ile Leu Ile Ser Leu Gly Gln His Lys Asn
340 345 350
His Arg Arg Leu Val Ile Val Asp Arg Arg Trp Val Gly Ala Lys Thr
355 360 365
Arg Ala Thr Gln Thr Gly Lys Asp Leu Asp Ser Gln Trp Thr Ile His
370 375 380
Thr Tyr Ile Pro Gln Lys Lys Gly His Cys Ser Tyr Asn Arg Lys Pro
385 390 395 400
Ser Ala Glu Leu Val Gln Asp Pro Ser Gly Gly Thr Lys Lys Val Leu
405 410 415
Gln Ile Lys Arg Leu Asp Asp Pro Glu Leu Val Asn Glu Lys Ser Asn
420 425 430
Val Asp Tyr Arg Asn Gly Gly Ala Thr Trp Asn Phe Pro Asn Gly Thr
435 440 445
Thr Gly Leu Val Lys Phe Arg Phe Arg Val Val Asp Gly Glu Gln Ala
450 455 460
Asp Asp Ser Gly Leu Gln Val Ser Leu Thr Asp Arg Leu Phe Asn Ala
465 470 475 480
Cys Asp Ser Thr Thr Lys Asp Tyr Ala Leu Phe Thr Phe Pro Ile Arg
485 490 495
Leu Lys Pro Ala Pro His Leu Leu Leu Gly Met Lys Lys Val Pro Phe
500 505 510
Thr Pro Gly Ala Trp His Glu Ile Ser Leu Leu Trp Gln Gly Gly Gln
515 520 525
Ala Val Val Ser Leu Asp Gly Lys Lys Ala Gly Thr Leu Lys Met Ala
530 535 540
Asn Lys Ser Pro Asn Gly Ala Ser Tyr Ile His Phe Ile Ser Thr Gly
545 550 555 560
Ser Gln Pro Asp Ala Gly Ile Leu Leu Asp Thr Val Asn Ala Arg Val
565 570 575
Lys
<210> 11
<211> 589
<212> PRT
<213> Artificial Sequence
<220>
<223> Am1757 (N-terminal methionine and a C-terminal linker + His6 tag)
<400> 11
Met Gln Gln Lys Ala Ala Pro Val Pro Glu Pro Glu Val Val Ala Thr
1 5 10 15
Pro Pro Ala Asp Ala Gly Arg Gly Leu Ile Arg Val Asp Ser Arg Glu
20 25 30
Ile Arg His Tyr Ser Gly Thr Arg Lys Glu Pro Asp Tyr Leu Val Ser
35 40 45
Arg Asp Asn Gly Lys Thr Trp Glu Met Lys Ala Ala Pro Ala Gly Tyr
50 55 60
Pro Pro Asn Tyr Gly Gly Ile Pro Lys Glu Ser Pro Ala Ile Val Arg
65 70 75 80
Asn Pro Leu Thr Arg Glu Phe Ile Arg Val Gln Pro Ile Gly Gly Phe
85 90 95
Val Phe Leu Ser Arg Gly Gly Leu Asp Gly Lys Trp Leu Ala Val Thr
100 105 110
Asn Asp Gly Lys Leu Glu Glu Asp Trp Lys Asp Pro Glu Lys Arg Lys
115 120 125
Asn Leu Lys Lys Leu Gly Gly Ile Met Arg Thr Pro Val Phe Val Asn
130 135 140
Lys Gly Arg Arg Val Ile Val Pro Phe His Asn Met Gly Gly Gly Thr
145 150 155 160
Lys Phe His Ile Ser Asp Asp Gly Gly Leu Thr Trp His Val Ser Arg
165 170 175
Asn Gly Val Thr Ser Pro Arg His Glu Ala Arg Pro Pro His Gln Gly
180 185 190
Val Arg Trp Phe Asn Asn Ala Val Glu Ala Thr Val Leu Glu Met Lys
195 200 205
Asp Gly Thr Leu Trp Ala Leu Ala Arg Thr Ser Gln Asp Gln Ala Trp
210 215 220
Gln Ala Phe Ser Lys Asp Tyr Gly Glu Thr Trp Ser Lys Pro Glu Pro
225 230 235 240
Ser Arg Phe Phe Gly Thr Leu Thr Met Asn Thr Leu Gly Arg Leu Asp
245 250 255
Asp Gly Thr Ile Val Ser Leu Trp Thr Asn Thr Met Ala Leu Pro Glu
260 265 270
Asn Ala Thr Ala Gly Asn Gly Thr Trp Glu Asp Val Phe Thr Asn Arg
275 280 285
Asp Ser His His Ile Ala Met Ser Gly Asp Glu Gly Lys Thr Trp Tyr
290 295 300
Gly Phe Arg Glu Ile Ile Leu Asp Glu His Arg Asn His Pro Gly Tyr
305 310 315 320
Ala Thr Leu Asp Gly Pro Glu Asp Arg Gly Lys His Gln Ser Glu Met
325 330 335
Val Gln Leu Asp Lys Asn Arg Ile Leu Ile Ser Leu Gly Gln His Lys
340 345 350
Asn His Arg Arg Leu Val Ile Val Asp Arg Arg Trp Val Gly Ala Lys
355 360 365
Thr Arg Ala Thr Gln Thr Gly Lys Asp Leu Asp Ser Gln Trp Thr Ile
370 375 380
His Thr Tyr Ile Pro Gln Lys Lys Gly His Cys Ser Tyr Asn Arg Lys
385 390 395 400
Pro Ser Ala Glu Leu Val Gln Asp Pro Ser Gly Gly Thr Lys Lys Val
405 410 415
Leu Gln Ile Lys Arg Leu Asp Asp Pro Glu Leu Val Asn Glu Lys Ser
420 425 430
Asn Val Asp Tyr Arg Asn Gly Gly Ala Thr Trp Asn Phe Pro Asn Gly
435 440 445
Thr Thr Gly Leu Val Lys Phe Arg Phe Arg Val Val Asp Gly Glu Gln
450 455 460
Ala Asp Asp Ser Gly Leu Gln Val Ser Leu Thr Asp Arg Leu Phe Asn
465 470 475 480
Ala Cys Asp Ser Thr Thr Lys Asp Tyr Ala Leu Phe Thr Phe Pro Ile
485 490 495
Arg Leu Lys Pro Ala Pro His Leu Leu Leu Gly Met Lys Lys Val Pro
500 505 510
Phe Thr Pro Gly Ala Trp His Glu Ile Ser Leu Leu Trp Gln Gly Gly
515 520 525
Gln Ala Val Val Ser Leu Asp Gly Lys Lys Ala Gly Thr Leu Lys Met
530 535 540
Ala Asn Lys Ser Pro Asn Gly Ala Ser Tyr Ile His Phe Ile Ser Thr
545 550 555 560
Gly Ser Gln Pro Asp Ala Gly Ile Leu Leu Asp Thr Val Asn Ala Arg
565 570 575
Val Lys Gly Ser Gly Leu Glu His His His His His His
580 585
<210> 12
<211> 419
<212> PRT
<213> Akkermansia muciniphila
<400> 12
Met Thr Trp Leu Leu Cys Gly Arg Gly Lys Trp Asn Lys Val Lys Arg
1 5 10 15
Met Met Asn Ser Val Phe Lys Cys Leu Met Ser Ala Val Cys Ala Val
20 25 30
Ala Leu Pro Ala Phe Gly Gln Glu Glu Lys Thr Gly Phe Pro Thr Asp
35 40 45
Arg Ala Val Thr Val Phe Ser Ala Gly Glu Gly Asn Pro Tyr Ala Ser
50 55 60
Ile Arg Ile Pro Ala Leu Leu Ser Ile Gly Lys Gly Gln Leu Leu Ala
65 70 75 80
Phe Ala Glu Gly Arg Tyr Lys Asn Thr Asp Gln Gly Glu Asn Asp Ile
85 90 95
Ile Met Ser Val Ser Lys Asn Gly Gly Lys Thr Trp Ser Arg Pro Arg
100 105 110
Ala Ile Ala Lys Ala His Gly Ala Thr Phe Asn Asn Pro Cys Pro Val
115 120 125
Tyr Asp Ala Lys Thr Arg Thr Val Thr Val Val Phe Gln Arg Tyr Pro
130 135 140
Ala Gly Val Lys Glu Arg Gln Pro Asn Ile Pro Asp Gly Trp Asp Asp
145 150 155 160
Glu Lys Cys Ile Arg Asn Phe Met Ile Gln Ser Arg Asn Gly Gly Ser
165 170 175
Ser Trp Thr Lys Pro Gln Glu Ile Thr Lys Thr Thr Lys Arg Pro Ser
180 185 190
Gly Val Asp Ile Met Ala Ser Gly Pro Asn Ala Gly Thr Gln Leu Lys
195 200 205
Ser Gly Ala His Lys Gly Arg Leu Val Ile Pro Met Asn Glu Gly Pro
210 215 220
Phe Gly Lys Trp Val Ile Ser Cys Ile Tyr Ser Asp Asp Gly Gly Lys
225 230 235 240
Ser Trp Lys Leu Gly Gln Pro Thr Ala Asn Met Lys Gly Met Val Asn
245 250 255
Glu Thr Ser Ile Ala Glu Thr Asp Asn Gly Gly Val Val Met Val Ala
260 265 270
Arg His Trp Gly Ala Gly Asn Cys Arg Arg Ile Ala Trp Ser Gln Asp
275 280 285
Gly Gly Glu Thr Trp Gly Gln Val Glu Asp Ala Pro Glu Leu Phe Cys
290 295 300
Asp Ser Thr Gln Asn Ser Leu Met Thr Tyr Ser Leu Ser Asp Gln Pro
305 310 315 320
Ala Tyr Gly Gly Lys Ser Arg Ile Leu Phe Ser Gly Pro Ser Ala Gly
325 330 335
Arg Arg Ile Lys Gly Gln Val Ala Met Ser Tyr Asp Asn Gly Lys Thr
340 345 350
Trp Pro Val Lys Lys Leu Leu Gly Glu Gly Gly Phe Ala Tyr Ser Ser
355 360 365
Leu Ala Met Val Glu Pro Gly Ile Val Gly Val Leu Tyr Glu Glu Asn
370 375 380
Gln Glu His Ile Lys Lys Leu Lys Phe Val Pro Ile Thr Met Glu Trp
385 390 395 400
Leu Thr Asp Gly Glu Asp Thr Gly Leu Ala Pro Gly Lys Lys Ala Pro
405 410 415
Val Leu Lys
<210> 13
<211> 381
<212> PRT
<213> Akkermansia muciniphila
<400> 13
Gln Glu Glu Lys Thr Gly Phe Pro Thr Asp Arg Ala Val Thr Val Phe
1 5 10 15
Ser Ala Gly Glu Gly Asn Pro Tyr Ala Ser Ile Arg Ile Pro Ala Leu
20 25 30
Leu Ser Ile Gly Lys Gly Gln Leu Leu Ala Phe Ala Glu Gly Arg Tyr
35 40 45
Lys Asn Thr Asp Gln Gly Glu Asn Asp Ile Ile Met Ser Val Ser Lys
50 55 60
Asn Gly Gly Lys Thr Trp Ser Arg Pro Arg Ala Ile Ala Lys Ala His
65 70 75 80
Gly Ala Thr Phe Asn Asn Pro Cys Pro Val Tyr Asp Ala Lys Thr Arg
85 90 95
Thr Val Thr Val Val Phe Gln Arg Tyr Pro Ala Gly Val Lys Glu Arg
100 105 110
Gln Pro Asn Ile Pro Asp Gly Trp Asp Asp Glu Lys Cys Ile Arg Asn
115 120 125
Phe Met Ile Gln Ser Arg Asn Gly Gly Ser Ser Trp Thr Lys Pro Gln
130 135 140
Glu Ile Thr Lys Thr Thr Lys Arg Pro Ser Gly Val Asp Ile Met Ala
145 150 155 160
Ser Gly Pro Asn Ala Gly Thr Gln Leu Lys Ser Gly Ala His Lys Gly
165 170 175
Arg Leu Val Ile Pro Met Asn Glu Gly Pro Phe Gly Lys Trp Val Ile
180 185 190
Ser Cys Ile Tyr Ser Asp Asp Gly Gly Lys Ser Trp Lys Leu Gly Gln
195 200 205
Pro Thr Ala Asn Met Lys Gly Met Val Asn Glu Thr Ser Ile Ala Glu
210 215 220
Thr Asp Asn Gly Gly Val Val Met Val Ala Arg His Trp Gly Ala Gly
225 230 235 240
Asn Cys Arg Arg Ile Ala Trp Ser Gln Asp Gly Gly Glu Thr Trp Gly
245 250 255
Gln Val Glu Asp Ala Pro Glu Leu Phe Cys Asp Ser Thr Gln Asn Ser
260 265 270
Leu Met Thr Tyr Ser Leu Ser Asp Gln Pro Ala Tyr Gly Gly Lys Ser
275 280 285
Arg Ile Leu Phe Ser Gly Pro Ser Ala Gly Arg Arg Ile Lys Gly Gln
290 295 300
Val Ala Met Ser Tyr Asp Asn Gly Lys Thr Trp Pro Val Lys Lys Leu
305 310 315 320
Leu Gly Glu Gly Gly Phe Ala Tyr Ser Ser Leu Ala Met Val Glu Pro
325 330 335
Gly Ile Val Gly Val Leu Tyr Glu Glu Asn Gln Glu His Ile Lys Lys
340 345 350
Leu Lys Phe Val Pro Ile Thr Met Glu Trp Leu Thr Asp Gly Glu Asp
355 360 365
Thr Gly Leu Ala Pro Gly Lys Lys Ala Pro Val Leu Lys
370 375 380
<210> 14
<211> 393
<212> PRT
<213> Artificial Sequence
<220>
<223> Am0707 (including N-terminal methionine and a C-terminal linker +
His6 tag)
<400> 14
Met Gln Glu Glu Lys Thr Gly Phe Pro Thr Asp Arg Ala Val Thr Val
1 5 10 15
Phe Ser Ala Gly Glu Gly Asn Pro Tyr Ala Ser Ile Arg Ile Pro Ala
20 25 30
Leu Leu Ser Ile Gly Lys Gly Gln Leu Leu Ala Phe Ala Glu Gly Arg
35 40 45
Tyr Lys Asn Thr Asp Gln Gly Glu Asn Asp Ile Ile Met Ser Val Ser
50 55 60
Lys Asn Gly Gly Lys Thr Trp Ser Arg Pro Arg Ala Ile Ala Lys Ala
65 70 75 80
His Gly Ala Thr Phe Asn Asn Pro Cys Pro Val Tyr Asp Ala Lys Thr
85 90 95
Arg Thr Val Thr Val Val Phe Gln Arg Tyr Pro Ala Gly Val Lys Glu
100 105 110
Arg Gln Pro Asn Ile Pro Asp Gly Trp Asp Asp Glu Lys Cys Ile Arg
115 120 125
Asn Phe Met Ile Gln Ser Arg Asn Gly Gly Ser Ser Trp Thr Lys Pro
130 135 140
Gln Glu Ile Thr Lys Thr Thr Lys Arg Pro Ser Gly Val Asp Ile Met
145 150 155 160
Ala Ser Gly Pro Asn Ala Gly Thr Gln Leu Lys Ser Gly Ala His Lys
165 170 175
Gly Arg Leu Val Ile Pro Met Asn Glu Gly Pro Phe Gly Lys Trp Val
180 185 190
Ile Ser Cys Ile Tyr Ser Asp Asp Gly Gly Lys Ser Trp Lys Leu Gly
195 200 205
Gln Pro Thr Ala Asn Met Lys Gly Met Val Asn Glu Thr Ser Ile Ala
210 215 220
Glu Thr Asp Asn Gly Gly Val Val Met Val Ala Arg His Trp Gly Ala
225 230 235 240
Gly Asn Cys Arg Arg Ile Ala Trp Ser Gln Asp Gly Gly Glu Thr Trp
245 250 255
Gly Gln Val Glu Asp Ala Pro Glu Leu Phe Cys Asp Ser Thr Gln Asn
260 265 270
Ser Leu Met Thr Tyr Ser Leu Ser Asp Gln Pro Ala Tyr Gly Gly Lys
275 280 285
Ser Arg Ile Leu Phe Ser Gly Pro Ser Ala Gly Arg Arg Ile Lys Gly
290 295 300
Gln Val Ala Met Ser Tyr Asp Asn Gly Lys Thr Trp Pro Val Lys Lys
305 310 315 320
Leu Leu Gly Glu Gly Gly Phe Ala Tyr Ser Ser Leu Ala Met Val Glu
325 330 335
Pro Gly Ile Val Gly Val Leu Tyr Glu Glu Asn Gln Glu His Ile Lys
340 345 350
Lys Leu Lys Phe Val Pro Ile Thr Met Glu Trp Leu Thr Asp Gly Glu
355 360 365
Asp Thr Gly Leu Ala Pro Gly Lys Lys Ala Pro Val Leu Lys Gly Ser
370 375 380
Gly Leu Glu His His His His His His
385 390
<210> 15
<211> 2133
<212> PRT
<213> Streptococcus oralis
<400> 15
Met Asp Lys Arg Phe Phe Glu Lys Arg Cys Lys Phe Ser Ile Arg Lys
1 5 10 15
Phe Thr Leu Gly Val Ala Ser Val Met Ile Gly Ala Thr Phe Phe Ala
20 25 30
Ala Ser Pro Val Leu Ala Asp Gln Ala Arg Val Gly Ser Thr Asp Asn
35 40 45
Leu Pro Ser Glu Leu Ala Asp Leu Asp Lys Lys Ala Ser Asp Glu Gly
50 55 60
His Asp Phe Asp Lys Glu Ala Ala Ala Gln Asn Pro Gly Ser Ala Glu
65 70 75 80
Thr Thr Glu Gly Pro Gln Thr Glu Glu Glu Leu Leu Ala Gln Glu Lys
85 90 95
Glu Lys Ser Glu Lys Pro Ser Asn Leu Pro Lys Glu Leu Glu Asp Lys
100 105 110
Leu Glu Lys Ala Glu Asp Asn Gly Arg Glu Val Asp Lys Asp Gln Leu
115 120 125
Ala Gln Asp Thr Gly Lys Leu Val Pro Glu Asp Val Ala Lys Thr Thr
130 135 140
Asn Gly Glu Leu Asn Tyr Gly Ala Thr Val Lys Ile Lys Thr Pro Ser
145 150 155 160
Gly Glu Gly Ser Gly Ile Val Val Ala Lys Asp Leu Val Leu Thr Val
165 170 175
Ser His Asn Phe Ile Lys Asp Ser Gln Glu Gly Asn Ile Arg Lys Val
180 185 190
Val Asp Asn Asp Gln Gly Asp Gly Asp Ile Tyr Ser Ile Ser Tyr Pro
195 200 205
Gly Leu Pro Asp Val Lys Phe Ser Lys Lys Asp Ile Ile His Trp Asp
210 215 220
Arg Glu Gly Tyr Leu Lys Gly Phe Lys Asn Asp Leu Ala Leu Val Arg
225 230 235 240
Leu Arg Thr Val Leu Glu Asn Thr Pro Val Glu Val Thr Lys Lys Pro
245 250 255
Val Val Lys Lys Ile Gly Asp Lys Leu His Val Phe Gly Tyr Pro Glu
260 265 270
Gly Lys Leu Asn Pro Ile Val Asn Thr Thr Val Asp Phe Ala Glu Pro
275 280 285
Tyr Gly Glu Gly Val Gln Gly Ile Gly Tyr Gln Gly Gly Lys Pro Gly
290 295 300
Ala Ser Gly Gly Gly Ile Phe Asp Thr Glu Gly Lys Leu Val Gly Val
305 310 315 320
His Gln Asn Gly Val Val Gly Lys Arg Ser Gly Gly Ile Leu Phe Ser
325 330 335
Pro Ala Gln Leu Lys Trp Ile Gln Asp His Met Gln Gly Ile Ser Ser
340 345 350
Val Lys Pro Ala Asp Leu Glu Glu Lys Glu Lys Pro Ala Glu Glu Lys
355 360 365
Pro Lys Glu Asp Lys Pro Ala Ala Ala Lys Pro Glu Thr Pro Lys Ala
370 375 380
Val Thr Pro Glu Trp Gln Thr Val Ala Asn Lys Glu Gln Gln Gly Thr
385 390 395 400
Val Thr Ile Arg Glu Glu Lys Gly Val Arg Tyr Asn Gln Leu Ser Ser
405 410 415
Thr Ala Gln Asn Asp Asn Asp Gly Lys Pro Ala Leu Phe Glu Lys Gln
420 425 430
Gly Leu Thr Val Asp Ala Asn Gly Asn Ala Thr Val Asp Leu Thr Phe
435 440 445
Lys Asp Asp Ser Glu Lys Gly Lys Ser Arg Phe Gly Val Phe Leu Lys
450 455 460
Phe Lys Asp Thr Lys Asn Asn Val Phe Val Gly Tyr Asp Gln Gly Gly
465 470 475 480
Trp Phe Trp Glu Tyr Lys Thr Pro Gly Asn Ser Thr Trp Tyr Lys Gly
485 490 495
Asn Arg Val Ala Ala Pro Glu Pro Gly Ser Val Asn Arg Leu Ser Ile
500 505 510
Thr Leu Lys Ser Asp Gly Gln Leu Asn Ala Ser Asn Asn Asp Val Asn
515 520 525
Leu Phe Asp Thr Val Thr Leu Pro Gly Ala Val Asn Glu Asn Leu Lys
530 535 540
Asn Glu Lys Lys Ile Leu Leu Lys Ala Gly Thr Tyr Ser Asn Asp Arg
545 550 555 560
Thr Val Val Ser Val Lys Thr Asp Asn Gln Glu Gly Val Lys Ala Asp
565 570 575
Asp Thr Pro Ala Gln Lys Glu Thr Gly Pro Ala Val Asp Asp Ser Lys
580 585 590
Val Thr Tyr Asp Thr Ile Gln Ser Lys Val Leu Lys Ala Val Ile Asp
595 600 605
Gln Ala Phe Pro Arg Val Lys Glu Tyr Thr Leu Asn Gly His Thr Leu
610 615 620
Pro Gly Gln Val Gln Gln Phe Asn Gln Val Phe Ile Asn Asn His Arg
625 630 635 640
Ile Thr Pro Glu Val Thr Tyr Lys Lys Ile Asn Glu Thr Thr Ala Glu
645 650 655
Tyr Leu Met Lys Leu Arg Asp Asp Ala His Leu Ile Asn Ala Glu Met
660 665 670
Thr Val Arg Leu Gln Val Val Asp Asn Gln Leu His Phe Asp Val Thr
675 680 685
Lys Ile Val Asn His Asn Gln Val Thr Pro Gly Gln Lys Ile Asp Asp
690 695 700
Glu Arg Lys Leu Leu Ser Thr Ile Ser Phe Leu Gly Asn Ala Leu Val
705 710 715 720
Ser Val Ser Ser Asp Gln Ala Gly Ala Lys Phe Asp Gly Ala Thr Met
725 730 735
Ser Asn Asn Thr His Val Ser Gly Asp Asp His Ile Asp Val Thr Asn
740 745 750
Pro Met Lys Asp Leu Ala Lys Gly Tyr Met Tyr Gly Phe Val Ser Thr
755 760 765
Asp Lys Leu Ala Ala Gly Val Trp Ser Asn Ser Gln Asn Ser Tyr Gly
770 775 780
Gly Gly Ser Asn Asp Trp Thr Arg Leu Thr Ala Tyr Lys Glu Thr Val
785 790 795 800
Gly Asn Ala Asn Tyr Val Gly Ile His Ser Ser Glu Trp Gln Trp Glu
805 810 815
Lys Ala Tyr Lys Gly Ile Val Phe Pro Glu Tyr Thr Lys Glu Leu Pro
820 825 830
Ser Ala Lys Val Val Ile Thr Glu Asp Ala Asn Ala Asp Asn Lys Val
835 840 845
Asp Trp Gln Asp Gly Ala Ile Ala Tyr Arg Ser Ile Met Asn Asn Pro
850 855 860
Gln Gly Trp Glu Lys Val Lys Asp Ile Thr Ala Tyr Arg Ile Ala Met
865 870 875 880
Asn Phe Gly Ser Gln Ala Gln Asn Pro Phe Leu Met Thr Leu Asp Gly
885 890 895
Ile Lys Lys Ile Asn Leu His Thr Asp Gly Leu Gly Gln Gly Val Leu
900 905 910
Leu Lys Gly Tyr Gly Ser Glu Gly His Asp Ser Gly His Leu Asn Tyr
915 920 925
Ala Asp Ile Gly Lys Arg Ile Gly Gly Val Glu Asp Phe Lys Thr Leu
930 935 940
Ile Glu Lys Ala Lys Lys Tyr Gly Ala His Leu Gly Ile His Val Asn
945 950 955 960
Ala Ser Glu Thr Tyr Pro Glu Ser Lys Tyr Phe Asn Glu Asn Ile Leu
965 970 975
Arg Lys Asn Pro Asp Gly Ser Tyr Ser Tyr Gly Trp Asn Trp Leu Asp
980 985 990
Gln Gly Ile Asn Ile Asp Ala Ala Tyr Asp Leu Ala His Gly Arg Leu
995 1000 1005
Ala Arg Trp Glu Asp Leu Lys Lys Lys Leu Gly Glu Gly Leu Asp
1010 1015 1020
Phe Ile Tyr Val Asp Val Trp Gly Asn Gly Gln Ser Gly Asp Asn
1025 1030 1035
Gly Ala Trp Ala Thr His Val Leu Ala Lys Glu Ile Asn Lys Gln
1040 1045 1050
Gly Trp Arg Phe Ala Ile Glu Trp Gly His Gly Gly Glu Tyr Asp
1055 1060 1065
Ser Thr Phe Gln His Trp Ala Ala Asp Leu Thr Tyr Gly Gly Tyr
1070 1075 1080
Thr Asn Lys Gly Ile Asn Ser Ala Ile Thr Arg Phe Ile Arg Asn
1085 1090 1095
His Gln Lys Asp Ser Trp Val Gly Asp Tyr Arg Ser Tyr Gly Gly
1100 1105 1110
Ala Ala Asn Tyr Pro Leu Leu Gly Gly Tyr Ser Met Lys Asp Phe
1115 1120 1125
Glu Gly Trp Gln Gly Arg Ser Asp Tyr Asn Gly Tyr Val Thr Asn
1130 1135 1140
Leu Phe Ala His Asp Val Met Thr Lys Tyr Phe Gln His Phe Thr
1145 1150 1155
Val Ser Lys Trp Glu Asn Gly Thr Pro Val Thr Met Thr Asp Asn
1160 1165 1170
Gly Ser Thr Tyr Lys Trp Thr Pro Glu Met Lys Val Glu Leu Val
1175 1180 1185
Asp Ala Ala Gly Asn Lys Val Val Val Thr Arg Lys Ser Asn Asp
1190 1195 1200
Val Asn Ser Pro Gln Tyr Arg Glu Arg Thr Val Thr Leu Asn Gly
1205 1210 1215
Arg Val Ile Gln Asp Gly Ser Ala Tyr Leu Thr Pro Trp Asn Trp
1220 1225 1230
Asp Ala Asn Gly Lys Lys Leu Pro Thr Glu Lys Glu Lys Met Tyr
1235 1240 1245
Tyr Phe Asn Thr Gln Ala Gly Ala Thr Thr Trp Thr Leu Pro Ser
1250 1255 1260
Asp Trp Ala Asn Ser Lys Val Tyr Leu Tyr Lys Leu Thr Asp Gln
1265 1270 1275
Gly Lys Thr Glu Glu Gln Glu Leu Thr Val Thr Asp Gly Lys Ile
1280 1285 1290
Thr Leu Asp Leu Leu Ala Asn Gln Pro Tyr Val Leu Tyr Arg Ser
1295 1300 1305
Lys Gln Thr Asn Pro Glu Met Ser Trp Ser Glu Gly Met His Ile
1310 1315 1320
Tyr Asp Gln Gly Phe Asn Ser Gly Thr Leu Lys His Trp Thr Ile
1325 1330 1335
Ser Gly Asp Ala Ser Lys Ala Glu Ile Val Lys Ser Gln Gly Ala
1340 1345 1350
Asn Glu Met Leu Arg Ile Gln Gly Asn Lys Ser Lys Val Ser Leu
1355 1360 1365
Thr Gln Lys Leu Thr Gly Leu Lys Pro Asn Thr Lys Tyr Ala Val
1370 1375 1380
Tyr Val Gly Val Asp Asn Arg Ser Asn Ala Lys Ala Ser Ile Thr
1385 1390 1395
Val Asn Thr Gly Glu Lys Glu Val Thr Thr Tyr Thr Asn Lys Ser
1400 1405 1410
Leu Ala Leu Asn Tyr Ile Lys Ala Tyr Ala His Asn Asn Arg Arg
1415 1420 1425
Glu Asn Ala Thr Val Asp Asp Thr Ser Tyr Phe Gln Asn Met Tyr
1430 1435 1440
Ala Phe Phe Thr Thr Gly Ser Asp Val Ser Asn Val Thr Leu Thr
1445 1450 1455
Leu Ser Arg Glu Ala Gly Asp Glu Ala Thr Tyr Phe Asp Glu Ile
1460 1465 1470
Arg Thr Phe Glu Asn Asn Ser Ser Met Tyr Gly Asp Lys His Asp
1475 1480 1485
Thr Gly Gln Gly Thr Phe Lys Gln Asp Phe Glu Asn Val Ala Gln
1490 1495 1500
Gly Ile Phe Pro Phe Val Val Gly Gly Val Glu Gly Val Glu Asp
1505 1510 1515
Asn Arg Thr His Leu Ser Glu Lys His Asp Pro Tyr Thr Gln Arg
1520 1525 1530
Gly Trp Asn Gly Lys Lys Val Asp Asp Val Ile Glu Gly Asn Trp
1535 1540 1545
Ser Leu Lys Thr Asn Gly Leu Val Ser Arg Arg Asn Leu Val Tyr
1550 1555 1560
Gln Thr Ile Pro Gln Asn Phe Arg Phe Glu Ala Gly Lys Thr Tyr
1565 1570 1575
Arg Val Thr Phe Glu Tyr Glu Ala Gly Ser Asp Asn Thr Tyr Ala
1580 1585 1590
Phe Val Val Gly Lys Gly Glu Phe Gln Ser Gly Arg Arg Gly Thr
1595 1600 1605
Gln Ala Ser Asn Leu Glu Met His Glu Leu Pro Asn Thr Trp Thr
1610 1615 1620
Asp Ser Lys Lys Ala Lys Lys Val Thr Phe Leu Val Thr Gly Ala
1625 1630 1635
Glu Thr Gly Asp Thr Trp Val Gly Ile Tyr Ser Thr Gly Asn Ala
1640 1645 1650
Ser Asn Thr Arg Gly Asp Ala Gly Gly Asn Ala Asn Phe Arg Gly
1655 1660 1665
Tyr Asn Asp Phe Met Met Asp Asn Leu Gln Ile Glu Glu Ile Thr
1670 1675 1680
Leu Thr Gly Lys Met Leu Thr Glu Asn Ala Leu Lys Asn Tyr Leu
1685 1690 1695
Pro Thr Val Ala Met Thr Asn Tyr Thr Lys Glu Ser Met Asp Ala
1700 1705 1710
Leu Lys Glu Ala Val Phe Asn Leu Ser Gln Ala Asp Asp Asp Ile
1715 1720 1725
Ser Val Glu Glu Ala Arg Ala Glu Ile Ala Lys Ile Glu Ala Leu
1730 1735 1740
Lys Asn Ala Leu Val Gln Lys Lys Thr Ala Leu Val Ala Glu Asp
1745 1750 1755
Phe Glu Ser Leu Asp Ala Pro Ala Gln Pro Gly Glu Gly Leu Glu
1760 1765 1770
Asn Ala Phe Asp Gly Asn Val Ser Ser Leu Trp His Thr Ser Trp
1775 1780 1785
Asn Gly Gly Asp Val Gly Lys Pro Ala Thr Met Val Leu Lys Glu
1790 1795 1800
Pro Thr Glu Ile Thr Gly Leu Arg Tyr Val Pro Arg Ala Ser Asp
1805 1810 1815
Ser Asn Gly Asn Leu Arg Asp Val Lys Leu Val Val Thr Asp Glu
1820 1825 1830
Ser Gly Lys Glu His Thr Phe Asn Val Thr Asp Trp Pro Asn Asn
1835 1840 1845
Asn Lys Pro Lys Asp Ile Asp Phe Gly Lys Thr Ile Lys Ala Lys
1850 1855 1860
Lys Ile Val Leu Thr Gly Thr Lys Thr Tyr Gly Asp Gly Gly Asp
1865 1870 1875
Lys Tyr Gln Ser Ala Ala Glu Leu Ile Phe Thr Arg Pro Gln Val
1880 1885 1890
Ala Glu Thr Pro Leu Asp Leu Ser Gly Tyr Glu Ala Ala Leu Ala
1895 1900 1905
Lys Ala Gln Lys Leu Thr Asp Lys Asp Asn Gln Glu Glu Val Ala
1910 1915 1920
Ser Val Gln Ala Ser Met Lys Tyr Ala Thr Asp Asn His Leu Leu
1925 1930 1935
Thr Glu Arg Met Val Ala Tyr Phe Ala Asp Tyr Leu Asn Gln Leu
1940 1945 1950
Lys Asp Ser Ala Thr Lys Pro Asp Ala Pro Thr Ser Ser Lys Gly
1955 1960 1965
Glu Glu Gln Pro Pro Val Leu Asp Val Pro Glu Phe Lys Gly Gly
1970 1975 1980
Val Asn Ala Thr Glu Ala Ala Val His Glu Val Pro Glu Phe Lys
1985 1990 1995
Gly Gly Val Asn Ala Val Gln Ala Leu Val His Glu Leu Pro Glu
2000 2005 2010
Tyr Lys Gly Gly Ala Asn Ala Val Leu Ala Ala Ala Asn Glu Val
2015 2020 2025
Pro Glu Tyr Lys Gly Gly Ala Asn Ala Val Glu Ala Leu Val Asn
2030 2035 2040
Glu Lys Pro Ala Tyr Thr Gly Val Leu Ala Thr Ala Gly Asp Gln
2045 2050 2055
Ala Ala Pro Thr Val Glu Lys Pro Glu Tyr Pro Leu Thr Pro Ser
2060 2065 2070
Pro Val Ala Asp Thr Lys Thr Pro Gly Ala Lys Asp Glu Glu Lys
2075 2080 2085
Leu Pro Ala Thr Gly Glu His Ser Ser Glu Val Ala Leu Phe Leu
2090 2095 2100
Ala Ser Val Ser Ile Ala Leu Ser Ala Ala Val Leu Ala Thr Lys
2105 2110 2115
Arg Lys Glu Glu Gly Ser Gly Leu Glu His His His His His His
2120 2125 2130
<210> 16
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> E206A forward primer
<400> 16
atggcgcacg cgctgggcca cg 22
<210> 17
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> E206A reverse primer
<400> 17
gccaccgtac catttcgtc 19
<210> 18
<211> 166
<212> PRT
<213> Artificial Sequence
<220>
<223> EPO
<400> 18
Ala Pro Pro Arg Leu Ile Cys Asp Ser Arg Val Leu Glu Arg Tyr Leu
1 5 10 15
Leu Glu Ala Lys Glu Ala Glu Asp Ile Thr Thr Gly Cys Ala Glu His
20 25 30
Cys Ser Leu Asp Glu Asn Ile Thr Val Pro Asp Thr Lys Val Asp Phe
35 40 45
Tyr Ala Trp Lys Arg Met Glu Val Gly Gln Gln Ala Val Glu Val Trp
50 55 60
Gln Gly Leu Ala Leu Leu Ser Glu Ala Val Leu Arg Gly Gln Ala Leu
65 70 75 80
Leu Val Asn Ser Ser Gln Pro Trp Glu Pro Leu Gln Leu His Val Asp
85 90 95
Lys Ala Val Ser Gly Leu Arg Ser Leu Thr Thr Leu Leu Arg Ala Leu
100 105 110
Gly Ala Gln Lys Glu Ala Ile Ser Pro Pro Asp Ala Ala Ser Ala Ala
115 120 125
Pro Leu Arg Thr Ile Thr Ala Asp Thr Phe Arg Lys Leu Phe Arg Val
130 135 140
Tyr Ser Asn Phe Leu Arg Gly Lys Leu Lys Leu Tyr Thr Gly Glu Ala
145 150 155 160
Cys Arg Thr Gly Asp Arg
165
<210> 19
<400> 19
000
<210> 20
<211> 361
<212> PRT
<213> Artificial Sequence
<220>
<223> Polypeptide capable of binding to O-glycans but lacks or has
reduced O-glycoprotein-specific endoprotease activity
<400> 20
Glu Val Thr Val Pro Asp Ala Leu Lys Asp Arg Ile Ala Leu Lys Lys
1 5 10 15
Thr Ala Arg Gln Leu Asn Ile Val Tyr Phe Leu Gly Ser Asp Thr Glu
20 25 30
Pro Val Pro Asp Tyr Glu Arg Arg Leu Ser Glu Leu Leu Leu Tyr Leu
35 40 45
Gln Gln Phe Tyr Gly Lys Glu Met Gln Arg His Gly Tyr Gly Ala Arg
50 55 60
Ser Phe Gly Leu Asp Ile Lys Ser Pro Gly Arg Val Asn Ile Ile Glu
65 70 75 80
Tyr Lys Ala Lys Asn Pro Ala Ala His Tyr Pro Tyr Glu Asn Gly Gly
85 90 95
Gly Trp Lys Ala Ala Gln Glu Leu Asp Glu Phe Phe Lys Ala His Pro
100 105 110
Asp Arg Lys Lys Ser Gln His Thr Leu Ile Ile Met Pro Thr Trp Asn
115 120 125
Asp Glu Lys Asn Gly Pro Asp Asn Pro Gly Gly Val Pro Phe Tyr Gly
130 135 140
Met Gly Arg Asn Cys Phe Ala Leu Asp Tyr Pro Ala Phe Asp Ile Lys
145 150 155 160
His Leu Gly Gln Lys Thr Arg Glu Gly Arg Leu Leu Thr Lys Trp Tyr
165 170 175
Gly Gly Met Ala Ala Ala Leu Gly His Gly Leu Asn Leu Pro His Asn
180 185 190
His Gln Thr Ala Ser Asp Gly Lys Lys Tyr Gly Thr Ala Leu Met Gly
195 200 205
Ser Gly Asn Tyr Thr Phe Gly Thr Ser Pro Thr Phe Leu Thr Pro Ala
210 215 220
Ser Cys Ala Leu Leu Asp Ala Cys Glu Val Phe Ser Val Thr Pro Ser
225 230 235 240
Gln Gln Phe Tyr Glu Gly Lys Pro Glu Val Glu Val Gly Asp Val Ala
245 250 255
Ile Ser Phe Lys Gly Asp Gln Ile Leu Val Ser Gly Asn Tyr Lys Ser
260 265 270
Pro Gln Thr Val Lys Ala Leu Asn Val Tyr Ile Gln Asp Pro Pro Tyr
275 280 285
Ala Val Asn Gln Asp Tyr Asp Ala Val Ser Phe Ser Arg Arg Leu Gly
290 295 300
Lys Lys Ser Gly Lys Phe Ser Met Lys Ile Asp Lys Lys Glu Leu Glu
305 310 315 320
Gly Leu Asn Asn Asn Glu Phe Arg Ile Ser Leu Met Phe Ile Leu Ala
325 330 335
Asn Gly Leu His Met Gln Lys His Phe Thr Phe His Trp Asp Ala Leu
340 345 350
Gln Asp Tyr Arg Asp Gly Ser Lys Ser
355 360
<210> 21
<211> 371
<212> PRT
<213> Artificial Sequence
<220>
<223> LS HE206AA or LS H205A/E206A (including N-terminal methionine
and C-terminal linker)
<400> 21
Met Glu Val Thr Val Pro Asp Ala Leu Lys Asp Arg Ile Ala Leu Lys
1 5 10 15
Lys Thr Ala Arg Gln Leu Asn Ile Val Tyr Phe Leu Gly Ser Asp Thr
20 25 30
Glu Pro Val Pro Asp Tyr Glu Arg Arg Leu Ser Glu Leu Leu Leu Tyr
35 40 45
Leu Gln Gln Phe Tyr Gly Lys Glu Met Gln Arg His Gly Tyr Gly Ala
50 55 60
Arg Ser Phe Gly Leu Asp Ile Lys Ser Pro Gly Arg Val Asn Ile Ile
65 70 75 80
Glu Tyr Lys Ala Lys Asn Pro Ala Ala His Tyr Pro Tyr Glu Asn Gly
85 90 95
Gly Gly Trp Lys Ala Ala Gln Glu Leu Asp Glu Phe Phe Lys Ala His
100 105 110
Pro Asp Arg Lys Lys Ser Gln His Thr Leu Ile Ile Met Pro Thr Trp
115 120 125
Asn Asp Glu Lys Asn Gly Pro Asp Asn Pro Gly Gly Val Pro Phe Tyr
130 135 140
Gly Met Gly Arg Asn Cys Phe Ala Leu Asp Tyr Pro Ala Phe Asp Ile
145 150 155 160
Lys His Leu Gly Gln Lys Thr Arg Glu Gly Arg Leu Leu Thr Lys Trp
165 170 175
Tyr Gly Gly Met Ala Ala Ala Leu Gly His Gly Leu Asn Leu Pro His
180 185 190
Asn His Gln Thr Ala Ser Asp Gly Lys Lys Tyr Gly Thr Ala Leu Met
195 200 205
Gly Ser Gly Asn Tyr Thr Phe Gly Thr Ser Pro Thr Phe Leu Thr Pro
210 215 220
Ala Ser Cys Ala Leu Leu Asp Ala Cys Glu Val Phe Ser Val Thr Pro
225 230 235 240
Ser Gln Gln Phe Tyr Glu Gly Lys Pro Glu Val Glu Val Gly Asp Val
245 250 255
Ala Ile Ser Phe Lys Gly Asp Gln Ile Leu Val Ser Gly Asn Tyr Lys
260 265 270
Ser Pro Gln Thr Val Lys Ala Leu Asn Val Tyr Ile Gln Asp Pro Pro
275 280 285
Tyr Ala Val Asn Gln Asp Tyr Asp Ala Val Ser Phe Ser Arg Arg Leu
290 295 300
Gly Lys Lys Ser Gly Lys Phe Ser Met Lys Ile Asp Lys Lys Glu Leu
305 310 315 320
Glu Gly Leu Asn Asn Asn Glu Phe Arg Ile Ser Leu Met Phe Ile Leu
325 330 335
Ala Asn Gly Leu His Met Gln Lys His Phe Thr Phe His Trp Asp Ala
340 345 350
Leu Gln Asp Tyr Arg Asp Gly Ser Lys Ser Gly Ser Gly His His His
355 360 365
His His His
370
<210> 22
<211> 1116
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleotide sequence encoding LS HE206AA or LS H205A/E206A
<400> 22
atggaagtca ctgtgccgga cgccctgaaa gatcgcatcg cgctgaagaa aaccgctcgt 60
cagctgaata tcgtctactt cctgggttct gataccgaac cggttccgga ctacgagcgc 120
cgtctgagcg agctgctgtt gtatctgcag caattctatg gtaaagaaat gcagcgccat 180
ggctatggcg cacgcagctt tggtctggac attaagtcac cgggtcgtgt gaacattatc 240
gagtacaaag cgaagaaccc ggcagcgcat tacccgtatg agaatggtgg cggctggaaa 300
gctgcacaag aactggacga atttttcaag gcccatccag accgcaagaa aagccagcac 360
accctgatca tcatgcctac ctggaatgat gagaaaaatg gtcctgacaa tccgggtggc 420
gttccgttct atggtatggg tcgtaattgt tttgcgttgg actacccggc gtttgatatc 480
aagcacctgg gtcagaaaac gcgtgagggt cgtctgctga cgaaatggta cggtggcatg 540
gcggccgcgc tgggccacgg cctgaatctg ccgcacaatc accagaccgc gagcgatggc 600
aagaaatatg gcaccgccct gatgggtagc ggcaactaca cgttcggtac cagcccgacg 660
ttcctgaccc cggcgagctg tgcgctgctg gatgcctgcg aagtgttcag cgttaccccg 720
agccaacagt tttatgaggg taagccagaa gtcgaggttg gtgatgttgc aatttccttc 780
aagggtgatc aaatcttggt cagcggtaac tacaagagcc cgcaaaccgt gaaagctctg 840
aacgtttaca ttcaggatcc gccgtacgcc gtgaaccaag actacgatgc agtgagcttt 900
agccgtcgtc tgggcaaaaa gtccggtaag tttagcatga agattgacaa aaaagaactg 960
gaaggcctga ataacaacga attccgtatt tccttgatgt tcattctggc aaacggctta 1020
cacatgcaga agcactttac gtttcactgg gatgcgctgc aagactaccg tgacggtagc 1080
aaatctggtt cgggtcatca tcaccaccat cactga 1116
<210> 23
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> disrupted metalloprotease motif
<400> 23
Gly Met Ala His Ala Leu Gly His Gly Leu
1 5 10
<210> 24
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> disrupted metalloprotease motif
<400> 24
Gly Met Ala Ala Glu Leu Gly His Gly Leu
1 5 10
<210> 25
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> disrupted metalloprotease motif
<400> 25
Gly Met Ala Ala Ala Leu Gly His Gly Leu
1 5 10
<210> 26
<211> 882
<212> PRT
<213> Pseudomonas aeruginosa
<400> 26
Ala Thr Gln Glu Glu Ile Leu Asp Ala Ala Leu Val Ser Gly Asp Ser
1 5 10 15
Ser Gln Leu Thr Asp Ser His Leu Val Ala Leu Arg Leu Gln Gln Gln
20 25 30
Val Glu Arg Ile Arg Gln Thr Arg Thr Gln Leu Leu Asp Gly Leu Tyr
35 40 45
Gln Asn Leu Ser Gln Ala Tyr Asp Pro Gly Ala Ala Ser Met Trp Val
50 55 60
Leu Pro Ala Asn Pro Asp Asn Thr Leu Pro Phe Leu Ile Gly Asp Lys
65 70 75 80
Gly Arg Val Leu Ala Ser Leu Ser Leu Glu Ala Gly Gly Arg Gly Leu
85 90 95
Ala Tyr Gly Thr Asn Val Leu Thr Gln Leu Ser Gly Thr Asn Ala Ala
100 105 110
His Ala Pro Leu Leu Lys Arg Ala Val Gln Trp Leu Val Asn Gly Asp
115 120 125
Pro Gly Ala Ala Thr Ala Lys Asp Phe Lys Val Ser Val Val Gly Val
130 135 140
Asp Lys Thr Ala Ala Leu Asn Gly Leu Lys Ser Ala Gly Leu Gln Pro
145 150 155 160
Ala Asp Ala Ala Cys Asn Ala Leu Thr Asp Ala Ser Cys Ala Ser Thr
165 170 175
Ser Lys Leu Leu Val Leu Gly Asn Gly Ala Ser Ala Ala Ser Leu Ser
180 185 190
Ala Thr Val Arg Ala Arg Leu Gln Ala Gly Leu Pro Ile Leu Phe Val
195 200 205
His Thr Asn Gly Trp Asn Gln Ser Ser Thr Gly Gln Gln Ile Leu Ala
210 215 220
Gly Leu Gly Leu Gln Glu Gly Pro Tyr Gly Gly Asn Tyr Trp Asp Lys
225 230 235 240
Asp Arg Val Pro Ser Ser Arg Thr Arg Thr Arg Ser Val Glu Leu Gly
245 250 255
Gly Ala Tyr Gly Gln Asp Pro Ala Leu Val Gln Gln Ile Val Asp Gly
260 265 270
Ser Trp Arg Thr Asp Tyr Asp Trp Ser Lys Cys Thr Ser Tyr Val Gly
275 280 285
Arg Thr Thr Cys Asp Asp Val Pro Gly Leu Ser Asp Phe Ser Lys Arg
290 295 300
Val Asp Val Leu Lys Gly Ala Leu Asp Ala Tyr Asn Gln Lys Ala Gln
305 310 315 320
Asn Leu Phe Ala Leu Pro Gly Thr Thr Ser Leu Arg Leu Trp Leu Leu
325 330 335
Trp Ala Asp Ala Val Arg Gln Asn Ile Arg Tyr Pro Met Asp Lys Ala
340 345 350
Ala Asp Thr Ala Arg Phe Gln Glu Thr Phe Val Ala Asp Ala Ile Val
355 360 365
Gly Tyr Val Arg Glu Ala Gly Ala Ala Gln Lys Glu Leu Gly Ser Tyr
370 375 380
Ala Gly Gln Arg Gln Gln Ser Met Pro Val Ser Gly Ser Glu Glu Thr
385 390 395 400
Leu Thr Leu Thr Leu Pro Ser Ala Gln Gly Phe Thr Ala Ile Gly Arg
405 410 415
Met Ala Ala Pro Gly Lys Arg Leu Ser Ile Arg Ile Glu Asp Ala Gly
420 425 430
Gln Ala Ser Leu Ala Val Gly Leu Asn Thr Gln Arg Ile Gly Ser Thr
435 440 445
Arg Leu Trp Asn Thr Arg Gln Tyr Asp Arg Pro Arg Phe Leu Lys Ser
450 455 460
Pro Asp Ile Lys Leu Gln Ala Asn Gln Ser Val Ala Leu Val Ser Pro
465 470 475 480
Tyr Gly Gly Leu Leu Gln Leu Val Tyr Ser Gly Ala Thr Pro Gly Gln
485 490 495
Thr Val Thr Val Lys Val Thr Gly Ala Ala Ser Gln Pro Phe Leu Asp
500 505 510
Ile Gln Pro Gly Glu Asp Ser Ser Gln Ala Ile Ala Asp Phe Ile Gln
515 520 525
Ala Leu Asp Ala Asp Lys Ala Asp Trp Leu Glu Ile Arg Ser Gly Ser
530 535 540
Val Glu Val His Ala Lys Val Glu Lys Val Arg Gly Ser Ile Asp Lys
545 550 555 560
Asp Tyr Gly Gly Asp Val Gln Arg Phe Ile Arg Glu Leu Asn Glu Val
565 570 575
Phe Ile Asp Asp Ala Tyr Thr Leu Ala Gly Phe Ala Ile Pro Asn Gln
580 585 590
Ala Lys Thr Pro Ala Ile Gln Gln Glu Cys Ala Ala Arg Gly Trp Asp
595 600 605
Cys Asp Ser Glu Thr Leu His Lys Leu Pro Gly Thr Gln His Ile Asn
610 615 620
Val Asp Gln Tyr Ala Gln Cys Gly Gly Gly Cys Ser Gly Asn Pro Tyr
625 630 635 640
Asp Gln Thr Trp Gly Leu Asn Pro Arg Gly Trp Gly Glu Ser His Glu
645 650 655
Leu Gly His Asn Leu Gln Val Asn Arg Leu Lys Val Tyr Gly Gly Arg
660 665 670
Ser Gly Glu Ile Ser Asn Gln Ile Phe Pro Leu His Lys Asp Trp Arg
675 680 685
Val Leu Arg Glu Phe Gly Gln Asn Leu Asp Asp Thr Arg Val Asn Tyr
690 695 700
Arg Asn Ala Tyr Asn Leu Ile Val Ala Gly Arg Ala Glu Ala Asp Pro
705 710 715 720
Leu Ala Gly Val Tyr Lys Arg Leu Trp Glu Asp Pro Gly Thr Tyr Ala
725 730 735
Leu Asn Gly Glu Arg Met Ala Phe Tyr Thr Gln Trp Val His Tyr Trp
740 745 750
Ala Asp Leu Lys Asn Asp Pro Leu Gln Gly Trp Asp Ile Trp Thr Leu
755 760 765
Leu Tyr Leu His Gln Arg Gln Val Asp Lys Ser Asp Trp Asp Ala Asn
770 775 780
Lys Ala Ala Leu Gly Tyr Gly Thr Tyr Ala Gln Arg Pro Gly Asn Ser
785 790 795 800
Gly Asp Ala Ser Ser Thr Asp Gly Asn Asp Asn Leu Leu Leu Gly Leu
805 810 815
Ser Trp Leu Thr Gln Arg Asp Gln Arg Pro Thr Phe Ala Leu Trp Gly
820 825 830
Ile Arg Thr Ser Ala Ala Ala Gln Ala Gln Val Ala Ala Tyr Gly Phe
835 840 845
Ala Glu Gln Pro Ala Phe Phe Tyr Ala Asn Asn Arg Thr Asn Glu Tyr
850 855 860
Ser Thr Val Lys Leu Leu Asp Met Ser Gln Gly Ser Pro Ala Trp Pro
865 870 875 880
Phe Pro
<210> 27
<211> 536
<212> PRT
<213> Bacteroides thetaiotaomicron
<400> 27
Asp Lys Trp Glu Lys Glu Phe Arg Ile Arg Ser Tyr Glu Pro Tyr Ser
1 5 10 15
Asn Ile Ala Glu Trp Ala Asp Lys Leu Met Thr Lys Lys Tyr Ser Asp
20 25 30
Leu Asp Asn Pro Thr Gly Ile Ser Val Lys Ala Gly Asp Asp Ile Ile
35 40 45
Val Leu Val Gly Asp Thr Tyr Gly Gln Asn Ile Ser Met Gln Cys Ile
50 55 60
Trp Glu Thr Gly Thr Glu Tyr Lys Gln Thr Ala Ser Ser Gly Asp Val
65 70 75 80
Tyr Met Leu Asn Pro Gly Val Asn Lys Leu Thr Met Lys Gly Glu Gly
85 90 95
Gln Leu Phe Val Met Tyr Asn Thr Glu Leu Thr Ser Asn Thr Ala Lys
100 105 110
Pro Ile Lys Ile His Ile Pro Leu Gly Ser Gly Thr Val Asn Gly Phe
115 120 125
Phe Asp Leu Lys Glu His Lys Thr Asp Glu Lys Tyr Ala Glu Leu Leu
130 135 140
Lys Lys Ser Thr His Lys Tyr Phe Cys Ile Arg Gly Glu Lys Ile Met
145 150 155 160
Phe Tyr Phe His Arg Asn Lys Leu Leu Glu Tyr Val Pro Asn Asn Ile
165 170 175
Leu Ser Ala Ile His Leu Trp Asp Asn Ile Val Gly Trp Gln Gln Glu
180 185 190
Leu Met Gly Ile Asp Asp Val Arg Pro Ser Gln Val Asn Asn His Leu
195 200 205
Phe Ala Ile Ser Pro Glu Gly Ser Tyr Met Trp Ala Ser Asp Tyr Gln
210 215 220
Ile Gly Phe Val Tyr Thr Tyr Leu Gly Asn Ile Leu Leu Glu Asp Asn
225 230 235 240
Val Met Ala Ala Glu Asp Asn Ala Trp Gly Pro Ala His Glu Ile Gly
245 250 255
His Val His Gln Ala Ala Ile Asn Trp Ala Ser Ser Thr Glu Ser Ser
260 265 270
Asn Asn Leu Phe Ser Asn Phe Ile Ile Tyr Lys Leu Gly Lys Tyr Lys
275 280 285
Ser Arg Gly Asn Gly Leu Gly Ser Val Ala Thr Ala Arg Tyr Ala Asn
290 295 300
Gly Gln Ala Trp Tyr Asn Met Gly Asp Ala Thr His Gln Asn Glu Asp
305 310 315 320
Thr Glu Thr His Met Arg Met Asn Trp Gln Leu Trp Ile Tyr Tyr His
325 330 335
Arg Cys Glu Tyr Lys Thr Asp Phe Trp Gln Thr Leu Phe Lys Leu Met
340 345 350
Arg Glu Val Asn Met Thr Glu Gly Glu Asp Pro Gly Lys Lys Gln Leu
355 360 365
Glu Phe Ala Lys Met Ala Ser Lys Ala Ala Asn Gln Asn Leu Thr Asp
370 375 380
Phe Phe Glu Met Trp Gly Phe Phe Glu Pro Val Asn Thr Thr Ile Glu
385 390 395 400
Gln Tyr Gly Thr Tyr Lys Tyr Tyr Val Ser Asp Ala Met Ile Arg Glu
405 410 415
Ala Lys Glu Tyr Met Ala Gln Phe Pro Ala Pro Lys His Ala Phe Gln
420 425 430
Tyr Ile Glu Asp Arg Lys Lys Ser Glu Phe Pro Ser Asn Asp Tyr Arg
435 440 445
Tyr Ser Ala Val Gly Asp Val Gly Tyr Tyr Thr Gln Phe Lys Glu Asn
450 455 460
Gln Lys Ile Thr Lys Ala Ile Thr Ala Glu Leu Ala Gly Arg Lys Val
465 470 475 480
Ser Ile Gln Asn Gly Asp Glu Ala Val Ala Phe Glu Leu Arg Glu Asn
485 490 495
Asp Glu Asn Gly Lys Leu Leu Tyr Phe Ser Thr Phe Thr Thr Phe Glu
500 505 510
Ile Pro Ser Ser Ile Leu Met Val Asn Ala Lys Leu Tyr Ala Val Gln
515 520 525
Ala Asp Gly Lys Arg Ile Leu Leu
530 535
<210> 28
<211> 507
<212> PRT
<213> Clostridium perfringens
<400> 28
Val Leu Glu Leu Glu Met Arg Gly Asp Ser Ile Ser Glu Ala Lys Lys
1 5 10 15
Arg Lys Val Trp Asn Phe Gln Asp Trp Gln Ile Thr Gly Leu Ser Ala
20 25 30
Arg Ala Gly Asp Lys Ile Thr Val Tyr Val Asp Val Ala Glu Gly Asp
35 40 45
Pro Thr Pro Thr Leu Leu Tyr Lys Gln Ser Leu Thr Gln His Gly Gly
50 55 60
Ala Thr Ser Phe Gln Leu Lys Pro Gly Lys Asn Glu Ile Thr Ile Pro
65 70 75 80
Glu Ile Asn Tyr Glu Ser Asn Gly Ile Pro Lys Asp Val Ile Gln Gly
85 90 95
Gly Asp Leu Phe Phe Thr Asn Tyr Lys Ser Asp Ser Gln Lys Arg Ala
100 105 110
Pro Lys Val Arg Ile Glu Gly Ala Ser Lys Tyr Pro Val Phe Ile Leu
115 120 125
Gly Lys Ser Asp Glu Asn Glu Val Met Lys Glu Leu Glu Ala Tyr Val
130 135 140
Glu Lys Ile Lys Ala Glu Pro Lys Thr Thr Pro Asn Ile Phe Ala Val
145 150 155 160
Ser Ser Asn Lys Ser Leu Glu Phe Val Gln Ala Thr Tyr Ala Leu Asp
165 170 175
Trp Tyr Lys Lys Asn Asn Lys Thr Pro Lys Tyr Thr Ala Glu Gln Trp
180 185 190
Asp Gln Tyr Ile Ala Asp Ala Met Gly Phe Trp Gly Phe Asp Asn Ser
195 200 205
Lys Asp Val Asn Ser Asp Phe Asn Phe Arg Ile Met Pro Met Val Lys
210 215 220
Asn Leu Ser Gly Gly Ala Phe Met Asn Ala Gly Asn Gly Val Ile Gly
225 230 235 240
Ile Arg Pro Gly Asn Gln Asp Ala Ile Leu Ala Ala Asn Lys Gly Trp
245 250 255
Gly Val Ala His Glu Leu Gly His Asn Phe Asp Thr Gly Gly Arg Thr
260 265 270
Ile Val Glu Val Thr Asn Asn Met Met Pro Leu Phe Phe Glu Ser Lys
275 280 285
Tyr Lys Thr Lys Thr Arg Ile Thr Asp Gln Asn Ile Trp Glu Asn Asn
290 295 300
Thr Tyr Pro Lys Val Gly Leu Asp Asp Tyr Ser Asn Asn Glu Leu Tyr
305 310 315 320
Asn Lys Ala Asp Ser Thr His Leu Ala Gln Leu Ala Pro Leu Trp Gln
325 330 335
Leu Tyr Leu Tyr Asp Asn Thr Phe Tyr Gly Lys Phe Glu Arg Gln Phe
340 345 350
Arg Glu Arg Asp Phe Gly Asn Lys Asn Arg Glu Asp Ile Tyr Lys Ser
355 360 365
Trp Val Val Ala Ala Ser Asp Ala Met Glu Leu Asp Leu Thr Glu Phe
370 375 380
Phe Ala Arg His Gly Ile Arg Val Asp Asp Lys Val Lys Glu Asp Leu
385 390 395 400
Ala Lys Tyr Pro Lys Pro Asp Lys Lys Ile Tyr Tyr Leu Asn Asp Leu
405 410 415
Ala Met Asn Tyr Lys Gly Asp Gly Phe Thr Glu Asn Ala Lys Val Ser
420 425 430
Val Ser Thr Ser Gly Ser Asn Gly Asn Ile Lys Leu Ser Phe Ser Val
435 440 445
Asp Asp Glu Asn Lys Asp Asn Ile Leu Gly Tyr Glu Ile Arg Arg Asp
450 455 460
Gly Lys Tyr Val Gly Phe Thr Ser Asn Asp Ser Phe Val Asp Thr Lys
465 470 475 480
Ser Asn Leu Asp Glu Asp Gly Val Tyr Val Val Thr Pro Tyr Asp Arg
485 490 495
Lys Leu Asn Thr Leu Asn Pro Ile Glu Val Asn
500 505
<210> 29
<211> 892
<212> PRT
<213> Artificial Sequence
<220>
<223> polypeptide having O-glycoprotein-specific endoprotease activity
(including N-terminal methionine and a C-terminal linker + His6
tag)
<400> 29
Met Ala Thr Gln Glu Glu Ile Leu Asp Ala Ala Leu Val Ser Gly Asp
1 5 10 15
Ser Ser Gln Leu Thr Asp Ser His Leu Val Ala Leu Arg Leu Gln Gln
20 25 30
Gln Val Glu Arg Ile Arg Gln Thr Arg Thr Gln Leu Leu Asp Gly Leu
35 40 45
Tyr Gln Asn Leu Ser Gln Ala Tyr Asp Pro Gly Ala Ala Ser Met Trp
50 55 60
Val Leu Pro Ala Asn Pro Asp Asn Thr Leu Pro Phe Leu Ile Gly Asp
65 70 75 80
Lys Gly Arg Val Leu Ala Ser Leu Ser Leu Glu Ala Gly Gly Arg Gly
85 90 95
Leu Ala Tyr Gly Thr Asn Val Leu Thr Gln Leu Ser Gly Thr Asn Ala
100 105 110
Ala His Ala Pro Leu Leu Lys Arg Ala Val Gln Trp Leu Val Asn Gly
115 120 125
Asp Pro Gly Ala Ala Thr Ala Lys Asp Phe Lys Val Ser Val Val Gly
130 135 140
Val Asp Lys Thr Ala Ala Leu Asn Gly Leu Lys Ser Ala Gly Leu Gln
145 150 155 160
Pro Ala Asp Ala Ala Cys Asn Ala Leu Thr Asp Ala Ser Cys Ala Ser
165 170 175
Thr Ser Lys Leu Leu Val Leu Gly Asn Gly Ala Ser Ala Ala Ser Leu
180 185 190
Ser Ala Thr Val Arg Ala Arg Leu Gln Ala Gly Leu Pro Ile Leu Phe
195 200 205
Val His Thr Asn Gly Trp Asn Gln Ser Ser Thr Gly Gln Gln Ile Leu
210 215 220
Ala Gly Leu Gly Leu Gln Glu Gly Pro Tyr Gly Gly Asn Tyr Trp Asp
225 230 235 240
Lys Asp Arg Val Pro Ser Ser Arg Thr Arg Thr Arg Ser Val Glu Leu
245 250 255
Gly Gly Ala Tyr Gly Gln Asp Pro Ala Leu Val Gln Gln Ile Val Asp
260 265 270
Gly Ser Trp Arg Thr Asp Tyr Asp Trp Ser Lys Cys Thr Ser Tyr Val
275 280 285
Gly Arg Thr Thr Cys Asp Asp Val Pro Gly Leu Ser Asp Phe Ser Lys
290 295 300
Arg Val Asp Val Leu Lys Gly Ala Leu Asp Ala Tyr Asn Gln Lys Ala
305 310 315 320
Gln Asn Leu Phe Ala Leu Pro Gly Thr Thr Ser Leu Arg Leu Trp Leu
325 330 335
Leu Trp Ala Asp Ala Val Arg Gln Asn Ile Arg Tyr Pro Met Asp Lys
340 345 350
Ala Ala Asp Thr Ala Arg Phe Gln Glu Thr Phe Val Ala Asp Ala Ile
355 360 365
Val Gly Tyr Val Arg Glu Ala Gly Ala Ala Gln Lys Glu Leu Gly Ser
370 375 380
Tyr Ala Gly Gln Arg Gln Gln Ser Met Pro Val Ser Gly Ser Glu Glu
385 390 395 400
Thr Leu Thr Leu Thr Leu Pro Ser Ala Gln Gly Phe Thr Ala Ile Gly
405 410 415
Arg Met Ala Ala Pro Gly Lys Arg Leu Ser Ile Arg Ile Glu Asp Ala
420 425 430
Gly Gln Ala Ser Leu Ala Val Gly Leu Asn Thr Gln Arg Ile Gly Ser
435 440 445
Thr Arg Leu Trp Asn Thr Arg Gln Tyr Asp Arg Pro Arg Phe Leu Lys
450 455 460
Ser Pro Asp Ile Lys Leu Gln Ala Asn Gln Ser Val Ala Leu Val Ser
465 470 475 480
Pro Tyr Gly Gly Leu Leu Gln Leu Val Tyr Ser Gly Ala Thr Pro Gly
485 490 495
Gln Thr Val Thr Val Lys Val Thr Gly Ala Ala Ser Gln Pro Phe Leu
500 505 510
Asp Ile Gln Pro Gly Glu Asp Ser Ser Gln Ala Ile Ala Asp Phe Ile
515 520 525
Gln Ala Leu Asp Ala Asp Lys Ala Asp Trp Leu Glu Ile Arg Ser Gly
530 535 540
Ser Val Glu Val His Ala Lys Val Glu Lys Val Arg Gly Ser Ile Asp
545 550 555 560
Lys Asp Tyr Gly Gly Asp Val Gln Arg Phe Ile Arg Glu Leu Asn Glu
565 570 575
Val Phe Ile Asp Asp Ala Tyr Thr Leu Ala Gly Phe Ala Ile Pro Asn
580 585 590
Gln Ala Lys Thr Pro Ala Ile Gln Gln Glu Cys Ala Ala Arg Gly Trp
595 600 605
Asp Cys Asp Ser Glu Thr Leu His Lys Leu Pro Gly Thr Gln His Ile
610 615 620
Asn Val Asp Gln Tyr Ala Gln Cys Gly Gly Gly Cys Ser Gly Asn Pro
625 630 635 640
Tyr Asp Gln Thr Trp Gly Leu Asn Pro Arg Gly Trp Gly Glu Ser His
645 650 655
Glu Leu Gly His Asn Leu Gln Val Asn Arg Leu Lys Val Tyr Gly Gly
660 665 670
Arg Ser Gly Glu Ile Ser Asn Gln Ile Phe Pro Leu His Lys Asp Trp
675 680 685
Arg Val Leu Arg Glu Phe Gly Gln Asn Leu Asp Asp Thr Arg Val Asn
690 695 700
Tyr Arg Asn Ala Tyr Asn Leu Ile Val Ala Gly Arg Ala Glu Ala Asp
705 710 715 720
Pro Leu Ala Gly Val Tyr Lys Arg Leu Trp Glu Asp Pro Gly Thr Tyr
725 730 735
Ala Leu Asn Gly Glu Arg Met Ala Phe Tyr Thr Gln Trp Val His Tyr
740 745 750
Trp Ala Asp Leu Lys Asn Asp Pro Leu Gln Gly Trp Asp Ile Trp Thr
755 760 765
Leu Leu Tyr Leu His Gln Arg Gln Val Asp Lys Ser Asp Trp Asp Ala
770 775 780
Asn Lys Ala Ala Leu Gly Tyr Gly Thr Tyr Ala Gln Arg Pro Gly Asn
785 790 795 800
Ser Gly Asp Ala Ser Ser Thr Asp Gly Asn Asp Asn Leu Leu Leu Gly
805 810 815
Leu Ser Trp Leu Thr Gln Arg Asp Gln Arg Pro Thr Phe Ala Leu Trp
820 825 830
Gly Ile Arg Thr Ser Ala Ala Ala Gln Ala Gln Val Ala Ala Tyr Gly
835 840 845
Phe Ala Glu Gln Pro Ala Phe Phe Tyr Ala Asn Asn Arg Thr Asn Glu
850 855 860
Tyr Ser Thr Val Lys Leu Leu Asp Met Ser Gln Gly Ser Pro Ala Trp
865 870 875 880
Pro Phe Pro Gly Ser Gly His His His His His His
885 890
<210> 30
<211> 546
<212> PRT
<213> Artificial Sequence
<220>
<223> polypeptide having O-glycoprotein-specific endoprotease activity
(including N-terminal methionine and a C-terminal linker + His6
tag)
<400> 30
Met Asp Lys Trp Glu Lys Glu Phe Arg Ile Arg Ser Tyr Glu Pro Tyr
1 5 10 15
Ser Asn Ile Ala Glu Trp Ala Asp Lys Leu Met Thr Lys Lys Tyr Ser
20 25 30
Asp Leu Asp Asn Pro Thr Gly Ile Ser Val Lys Ala Gly Asp Asp Ile
35 40 45
Ile Val Leu Val Gly Asp Thr Tyr Gly Gln Asn Ile Ser Met Gln Cys
50 55 60
Ile Trp Glu Thr Gly Thr Glu Tyr Lys Gln Thr Ala Ser Ser Gly Asp
65 70 75 80
Val Tyr Met Leu Asn Pro Gly Val Asn Lys Leu Thr Met Lys Gly Glu
85 90 95
Gly Gln Leu Phe Val Met Tyr Asn Thr Glu Leu Thr Ser Asn Thr Ala
100 105 110
Lys Pro Ile Lys Ile His Ile Pro Leu Gly Ser Gly Thr Val Asn Gly
115 120 125
Phe Phe Asp Leu Lys Glu His Lys Thr Asp Glu Lys Tyr Ala Glu Leu
130 135 140
Leu Lys Lys Ser Thr His Lys Tyr Phe Cys Ile Arg Gly Glu Lys Ile
145 150 155 160
Met Phe Tyr Phe His Arg Asn Lys Leu Leu Glu Tyr Val Pro Asn Asn
165 170 175
Ile Leu Ser Ala Ile His Leu Trp Asp Asn Ile Val Gly Trp Gln Gln
180 185 190
Glu Leu Met Gly Ile Asp Asp Val Arg Pro Ser Gln Val Asn Asn His
195 200 205
Leu Phe Ala Ile Ser Pro Glu Gly Ser Tyr Met Trp Ala Ser Asp Tyr
210 215 220
Gln Ile Gly Phe Val Tyr Thr Tyr Leu Gly Asn Ile Leu Leu Glu Asp
225 230 235 240
Asn Val Met Ala Ala Glu Asp Asn Ala Trp Gly Pro Ala His Glu Ile
245 250 255
Gly His Val His Gln Ala Ala Ile Asn Trp Ala Ser Ser Thr Glu Ser
260 265 270
Ser Asn Asn Leu Phe Ser Asn Phe Ile Ile Tyr Lys Leu Gly Lys Tyr
275 280 285
Lys Ser Arg Gly Asn Gly Leu Gly Ser Val Ala Thr Ala Arg Tyr Ala
290 295 300
Asn Gly Gln Ala Trp Tyr Asn Met Gly Asp Ala Thr His Gln Asn Glu
305 310 315 320
Asp Thr Glu Thr His Met Arg Met Asn Trp Gln Leu Trp Ile Tyr Tyr
325 330 335
His Arg Cys Glu Tyr Lys Thr Asp Phe Trp Gln Thr Leu Phe Lys Leu
340 345 350
Met Arg Glu Val Asn Met Thr Glu Gly Glu Asp Pro Gly Lys Lys Gln
355 360 365
Leu Glu Phe Ala Lys Met Ala Ser Lys Ala Ala Asn Gln Asn Leu Thr
370 375 380
Asp Phe Phe Glu Met Trp Gly Phe Phe Glu Pro Val Asn Thr Thr Ile
385 390 395 400
Glu Gln Tyr Gly Thr Tyr Lys Tyr Tyr Val Ser Asp Ala Met Ile Arg
405 410 415
Glu Ala Lys Glu Tyr Met Ala Gln Phe Pro Ala Pro Lys His Ala Phe
420 425 430
Gln Tyr Ile Glu Asp Arg Lys Lys Ser Glu Phe Pro Ser Asn Asp Tyr
435 440 445
Arg Tyr Ser Ala Val Gly Asp Val Gly Tyr Tyr Thr Gln Phe Lys Glu
450 455 460
Asn Gln Lys Ile Thr Lys Ala Ile Thr Ala Glu Leu Ala Gly Arg Lys
465 470 475 480
Val Ser Ile Gln Asn Gly Asp Glu Ala Val Ala Phe Glu Leu Arg Glu
485 490 495
Asn Asp Glu Asn Gly Lys Leu Leu Tyr Phe Ser Thr Phe Thr Thr Phe
500 505 510
Glu Ile Pro Ser Ser Ile Leu Met Val Asn Ala Lys Leu Tyr Ala Val
515 520 525
Gln Ala Asp Gly Lys Arg Ile Leu Leu Gly Ser Gly His His His His
530 535 540
His His
545
<210> 31
<211> 517
<212> PRT
<213> Artificial Sequence
<220>
<223> polypeptide having O-glycoprotein-specific endoprotease activity
(including N-terminal methionine and a C-terminal linker + His6
tag)
<400> 31
Met Val Leu Glu Leu Glu Met Arg Gly Asp Ser Ile Ser Glu Ala Lys
1 5 10 15
Lys Arg Lys Val Trp Asn Phe Gln Asp Trp Gln Ile Thr Gly Leu Ser
20 25 30
Ala Arg Ala Gly Asp Lys Ile Thr Val Tyr Val Asp Val Ala Glu Gly
35 40 45
Asp Pro Thr Pro Thr Leu Leu Tyr Lys Gln Ser Leu Thr Gln His Gly
50 55 60
Gly Ala Thr Ser Phe Gln Leu Lys Pro Gly Lys Asn Glu Ile Thr Ile
65 70 75 80
Pro Glu Ile Asn Tyr Glu Ser Asn Gly Ile Pro Lys Asp Val Ile Gln
85 90 95
Gly Gly Asp Leu Phe Phe Thr Asn Tyr Lys Ser Asp Ser Gln Lys Arg
100 105 110
Ala Pro Lys Val Arg Ile Glu Gly Ala Ser Lys Tyr Pro Val Phe Ile
115 120 125
Leu Gly Lys Ser Asp Glu Asn Glu Val Met Lys Glu Leu Glu Ala Tyr
130 135 140
Val Glu Lys Ile Lys Ala Glu Pro Lys Thr Thr Pro Asn Ile Phe Ala
145 150 155 160
Val Ser Ser Asn Lys Ser Leu Glu Phe Val Gln Ala Thr Tyr Ala Leu
165 170 175
Asp Trp Tyr Lys Lys Asn Asn Lys Thr Pro Lys Tyr Thr Ala Glu Gln
180 185 190
Trp Asp Gln Tyr Ile Ala Asp Ala Met Gly Phe Trp Gly Phe Asp Asn
195 200 205
Ser Lys Asp Val Asn Ser Asp Phe Asn Phe Arg Ile Met Pro Met Val
210 215 220
Lys Asn Leu Ser Gly Gly Ala Phe Met Asn Ala Gly Asn Gly Val Ile
225 230 235 240
Gly Ile Arg Pro Gly Asn Gln Asp Ala Ile Leu Ala Ala Asn Lys Gly
245 250 255
Trp Gly Val Ala His Glu Leu Gly His Asn Phe Asp Thr Gly Gly Arg
260 265 270
Thr Ile Val Glu Val Thr Asn Asn Met Met Pro Leu Phe Phe Glu Ser
275 280 285
Lys Tyr Lys Thr Lys Thr Arg Ile Thr Asp Gln Asn Ile Trp Glu Asn
290 295 300
Asn Thr Tyr Pro Lys Val Gly Leu Asp Asp Tyr Ser Asn Asn Glu Leu
305 310 315 320
Tyr Asn Lys Ala Asp Ser Thr His Leu Ala Gln Leu Ala Pro Leu Trp
325 330 335
Gln Leu Tyr Leu Tyr Asp Asn Thr Phe Tyr Gly Lys Phe Glu Arg Gln
340 345 350
Phe Arg Glu Arg Asp Phe Gly Asn Lys Asn Arg Glu Asp Ile Tyr Lys
355 360 365
Ser Trp Val Val Ala Ala Ser Asp Ala Met Glu Leu Asp Leu Thr Glu
370 375 380
Phe Phe Ala Arg His Gly Ile Arg Val Asp Asp Lys Val Lys Glu Asp
385 390 395 400
Leu Ala Lys Tyr Pro Lys Pro Asp Lys Lys Ile Tyr Tyr Leu Asn Asp
405 410 415
Leu Ala Met Asn Tyr Lys Gly Asp Gly Phe Thr Glu Asn Ala Lys Val
420 425 430
Ser Val Ser Thr Ser Gly Ser Asn Gly Asn Ile Lys Leu Ser Phe Ser
435 440 445
Val Asp Asp Glu Asn Lys Asp Asn Ile Leu Gly Tyr Glu Ile Arg Arg
450 455 460
Asp Gly Lys Tyr Val Gly Phe Thr Ser Asn Asp Ser Phe Val Asp Thr
465 470 475 480
Lys Ser Asn Leu Asp Glu Asp Gly Val Tyr Val Val Thr Pro Tyr Asp
485 490 495
Arg Lys Leu Asn Thr Leu Asn Pro Ile Glu Val Asn Gly Ser Gly His
500 505 510
His His His His His
515
<210> 32
<211> 923
<212> PRT
<213> Pseudomonas aeruginosa
<400> 32
Met Ser Leu Ser Thr Thr Ala Phe Pro Ser Leu Gln Gly Glu Asn Met
1 5 10 15
Ser Arg Ser Pro Ile Pro Arg His Arg Ala Leu Leu Ala Gly Phe Cys
20 25 30
Leu Ala Gly Ala Leu Ser Ala Gln Ala Ala Thr Gln Glu Glu Ile Leu
35 40 45
Asp Ala Ala Leu Val Ser Gly Asp Ser Ser Gln Leu Thr Asp Ser His
50 55 60
Leu Val Ala Leu Arg Leu Gln Gln Gln Val Glu Arg Ile Arg Gln Thr
65 70 75 80
Arg Thr Gln Leu Leu Asp Gly Leu Tyr Gln Asn Leu Ser Gln Ala Tyr
85 90 95
Asp Pro Gly Ala Ala Ser Met Trp Val Leu Pro Ala Asn Pro Asp Asn
100 105 110
Thr Leu Pro Phe Leu Ile Gly Asp Lys Gly Arg Val Leu Ala Ser Leu
115 120 125
Ser Leu Glu Ala Gly Gly Arg Gly Leu Ala Tyr Gly Thr Asn Val Leu
130 135 140
Thr Gln Leu Ser Gly Thr Asn Ala Ala His Ala Pro Leu Leu Lys Arg
145 150 155 160
Ala Val Gln Trp Leu Val Asn Gly Asp Pro Gly Ala Ala Thr Ala Lys
165 170 175
Asp Phe Lys Val Ser Val Val Gly Val Asp Lys Thr Ala Ala Leu Asn
180 185 190
Gly Leu Lys Ser Ala Gly Leu Gln Pro Ala Asp Ala Ala Cys Asn Ala
195 200 205
Leu Thr Asp Ala Ser Cys Ala Ser Thr Ser Lys Leu Leu Val Leu Gly
210 215 220
Asn Gly Ala Ser Ala Ala Ser Leu Ser Ala Thr Val Arg Ala Arg Leu
225 230 235 240
Gln Ala Gly Leu Pro Ile Leu Phe Val His Thr Asn Gly Trp Asn Gln
245 250 255
Ser Ser Thr Gly Gln Gln Ile Leu Ala Gly Leu Gly Leu Gln Glu Gly
260 265 270
Pro Tyr Gly Gly Asn Tyr Trp Asp Lys Asp Arg Val Pro Ser Ser Arg
275 280 285
Thr Arg Thr Arg Ser Val Glu Leu Gly Gly Ala Tyr Gly Gln Asp Pro
290 295 300
Ala Leu Val Gln Gln Ile Val Asp Gly Ser Trp Arg Thr Asp Tyr Asp
305 310 315 320
Trp Ser Lys Cys Thr Ser Tyr Val Gly Arg Thr Thr Cys Asp Asp Val
325 330 335
Pro Gly Leu Ser Asp Phe Ser Lys Arg Val Asp Val Leu Lys Gly Ala
340 345 350
Leu Asp Ala Tyr Asn Gln Lys Ala Gln Asn Leu Phe Ala Leu Pro Gly
355 360 365
Thr Thr Ser Leu Arg Leu Trp Leu Leu Trp Ala Asp Ala Val Arg Gln
370 375 380
Asn Ile Arg Tyr Pro Met Asp Lys Ala Ala Asp Thr Ala Arg Phe Gln
385 390 395 400
Glu Thr Phe Val Ala Asp Ala Ile Val Gly Tyr Val Arg Glu Ala Gly
405 410 415
Ala Ala Gln Lys Glu Leu Gly Ser Tyr Ala Gly Gln Arg Gln Gln Ser
420 425 430
Met Pro Val Ser Gly Ser Glu Glu Thr Leu Thr Leu Thr Leu Pro Ser
435 440 445
Ala Gln Gly Phe Thr Ala Ile Gly Arg Met Ala Ala Pro Gly Lys Arg
450 455 460
Leu Ser Ile Arg Ile Glu Asp Ala Gly Gln Ala Ser Leu Ala Val Gly
465 470 475 480
Leu Asn Thr Gln Arg Ile Gly Ser Thr Arg Leu Trp Asn Thr Arg Gln
485 490 495
Tyr Asp Arg Pro Arg Phe Leu Lys Ser Pro Asp Ile Lys Leu Gln Ala
500 505 510
Asn Gln Ser Val Ala Leu Val Ser Pro Tyr Gly Gly Leu Leu Gln Leu
515 520 525
Val Tyr Ser Gly Ala Thr Pro Gly Gln Thr Val Thr Val Lys Val Thr
530 535 540
Gly Ala Ala Ser Gln Pro Phe Leu Asp Ile Gln Pro Gly Glu Asp Ser
545 550 555 560
Ser Gln Ala Ile Ala Asp Phe Ile Gln Ala Leu Asp Ala Asp Lys Ala
565 570 575
Asp Trp Leu Glu Ile Arg Ser Gly Ser Val Glu Val His Ala Lys Val
580 585 590
Glu Lys Val Arg Gly Ser Ile Asp Lys Asp Tyr Gly Gly Asp Val Gln
595 600 605
Arg Phe Ile Arg Glu Leu Asn Glu Val Phe Ile Asp Asp Ala Tyr Thr
610 615 620
Leu Ala Gly Phe Ala Ile Pro Asn Gln Ala Lys Thr Pro Ala Ile Gln
625 630 635 640
Gln Glu Cys Ala Ala Arg Gly Trp Asp Cys Asp Ser Glu Thr Leu His
645 650 655
Lys Leu Pro Gly Thr Gln His Ile Asn Val Asp Gln Tyr Ala Gln Cys
660 665 670
Gly Gly Gly Cys Ser Gly Asn Pro Tyr Asp Gln Thr Trp Gly Leu Asn
675 680 685
Pro Arg Gly Trp Gly Glu Ser His Glu Leu Gly His Asn Leu Gln Val
690 695 700
Asn Arg Leu Lys Val Tyr Gly Gly Arg Ser Gly Glu Ile Ser Asn Gln
705 710 715 720
Ile Phe Pro Leu His Lys Asp Trp Arg Val Leu Arg Glu Phe Gly Gln
725 730 735
Asn Leu Asp Asp Thr Arg Val Asn Tyr Arg Asn Ala Tyr Asn Leu Ile
740 745 750
Val Ala Gly Arg Ala Glu Ala Asp Pro Leu Ala Gly Val Tyr Lys Arg
755 760 765
Leu Trp Glu Asp Pro Gly Thr Tyr Ala Leu Asn Gly Glu Arg Met Ala
770 775 780
Phe Tyr Thr Gln Trp Val His Tyr Trp Ala Asp Leu Lys Asn Asp Pro
785 790 795 800
Leu Gln Gly Trp Asp Ile Trp Thr Leu Leu Tyr Leu His Gln Arg Gln
805 810 815
Val Asp Lys Ser Asp Trp Asp Ala Asn Lys Ala Ala Leu Gly Tyr Gly
820 825 830
Thr Tyr Ala Gln Arg Pro Gly Asn Ser Gly Asp Ala Ser Ser Thr Asp
835 840 845
Gly Asn Asp Asn Leu Leu Leu Gly Leu Ser Trp Leu Thr Gln Arg Asp
850 855 860
Gln Arg Pro Thr Phe Ala Leu Trp Gly Ile Arg Thr Ser Ala Ala Ala
865 870 875 880
Gln Ala Gln Val Ala Ala Tyr Gly Phe Ala Glu Gln Pro Ala Phe Phe
885 890 895
Tyr Ala Asn Asn Arg Thr Asn Glu Tyr Ser Thr Val Lys Leu Leu Asp
900 905 910
Met Ser Gln Gly Ser Pro Ala Trp Pro Phe Pro
915 920
<210> 33
<211> 857
<212> PRT
<213> Bacteroides thetaiotaomicron
<400> 33
Met Thr Ile Lys Arg Phe Ile Thr Asn Leu Leu Ala Leu Phe Thr Leu
1 5 10 15
Phe Thr Val Ser Leu Ala Cys Lys Asp Thr Glu Lys Ser Ile Ile Asn
20 25 30
Ser Ser Phe Ser Ile Ser Glu Glu Tyr Leu Ile Gln Asn Leu Asp Lys
35 40 45
Ser Ser Thr Ser Val Gln Ile Pro Ile Asn Thr Ser Met Glu Leu Ala
50 55 60
Gln Trp Ser Val Ser Tyr Glu Ala Asn Trp Leu Gln Cys Ser Lys Gln
65 70 75 80
Lys Thr Ala Ala Glu Gly Thr Phe Leu Arg Ile Thr Val Asn Glu Asn
85 90 95
Thr Gly Glu Thr Lys Arg Thr Ala Asn Ile Lys Val Thr Ser Thr Thr
100 105 110
Ala Thr Tyr Thr Ile Thr Val Asn Gln Tyr Ala Lys Gly Glu Val Ile
115 120 125
Val Glu Gly Asp Ile Lys Val Thr Pro Thr Gly Gly Lys Ala Ser Glu
130 135 140
His Gln Glu Gly Gln Asp Ile Glu Asn Thr Tyr Asp Gly Lys Phe Ser
145 150 155 160
Thr Asp Gly Ala Ala Pro Phe His Thr Pro Trp Gly Gln Ser Ala Lys
165 170 175
Phe Pro Val Thr Leu Glu Tyr Tyr Phe Lys Gly Asp Thr Glu Ile Asp
180 185 190
Tyr Leu Ile Tyr Tyr Thr Arg Ser Gly Asn Gly Asn Phe Gly Lys Val
195 200 205
Lys Val Tyr Thr Thr Thr Asn Pro Asp Arg Ser Asp Tyr Thr Leu Gln
210 215 220
Gly Glu Tyr Asp Phe Lys Glu Gln Asn Ala Pro Ser Lys Val Ser Phe
225 230 235 240
Ser Glu Gly Ile Lys Ala Thr Gly Ile Lys Phe Glu Val Leu Ser Gly
245 250 255
Leu Gly Asp Phe Val Ser Cys Asp Glu Met Glu Phe Tyr Lys Thr Asn
260 265 270
Thr Asp Lys Thr Leu Asp Lys Gln Leu Leu Thr Val Phe Thr Asp Ile
275 280 285
Thr Cys Thr Glu Ile Lys Asn Asn Val Thr Asn Glu Gln Ile Gln Ala
290 295 300
Leu Pro Asp Tyr Phe Val Arg Ile Ala Glu Ala Val Arg Asp Asn Thr
305 310 315 320
Tyr Asp Lys Trp Glu Lys Glu Phe Arg Ile Arg Ser Tyr Glu Pro Tyr
325 330 335
Ser Asn Ile Ala Glu Trp Ala Asp Lys Leu Met Thr Lys Lys Tyr Ser
340 345 350
Asp Leu Asp Asn Pro Thr Gly Ile Ser Val Lys Ala Gly Asp Asp Ile
355 360 365
Ile Val Leu Val Gly Asp Thr Tyr Gly Gln Asn Ile Ser Met Gln Cys
370 375 380
Ile Trp Glu Thr Gly Thr Glu Tyr Lys Gln Thr Ala Ser Ser Gly Asp
385 390 395 400
Val Tyr Met Leu Asn Pro Gly Val Asn Lys Leu Thr Met Lys Gly Glu
405 410 415
Gly Gln Leu Phe Val Met Tyr Asn Thr Glu Leu Thr Ser Asn Thr Ala
420 425 430
Lys Pro Ile Lys Ile His Ile Pro Leu Gly Ser Gly Thr Val Asn Gly
435 440 445
Phe Phe Asp Leu Lys Glu His Lys Thr Asp Glu Lys Tyr Ala Glu Leu
450 455 460
Leu Lys Lys Ser Thr His Lys Tyr Phe Cys Ile Arg Gly Glu Lys Ile
465 470 475 480
Met Phe Tyr Phe His Arg Asn Lys Leu Leu Glu Tyr Val Pro Asn Asn
485 490 495
Ile Leu Ser Ala Ile His Leu Trp Asp Asn Ile Val Gly Trp Gln Gln
500 505 510
Glu Leu Met Gly Ile Asp Asp Val Arg Pro Ser Gln Val Asn Asn His
515 520 525
Leu Phe Ala Ile Ser Pro Glu Gly Ser Tyr Met Trp Ala Ser Asp Tyr
530 535 540
Gln Ile Gly Phe Val Tyr Thr Tyr Leu Gly Asn Ile Leu Leu Glu Asp
545 550 555 560
Asn Val Met Ala Ala Glu Asp Asn Ala Trp Gly Pro Ala His Glu Ile
565 570 575
Gly His Val His Gln Ala Ala Ile Asn Trp Ala Ser Ser Thr Glu Ser
580 585 590
Ser Asn Asn Leu Phe Ser Asn Phe Ile Ile Tyr Lys Leu Gly Lys Tyr
595 600 605
Lys Ser Arg Gly Asn Gly Leu Gly Ser Val Ala Thr Ala Arg Tyr Ala
610 615 620
Asn Gly Gln Ala Trp Tyr Asn Met Gly Asp Ala Thr His Gln Asn Glu
625 630 635 640
Asp Thr Glu Thr His Met Arg Met Asn Trp Gln Leu Trp Ile Tyr Tyr
645 650 655
His Arg Cys Glu Tyr Lys Thr Asp Phe Trp Gln Thr Leu Phe Lys Leu
660 665 670
Met Arg Glu Val Asn Met Thr Glu Gly Glu Asp Pro Gly Lys Lys Gln
675 680 685
Leu Glu Phe Ala Lys Met Ala Ser Lys Ala Ala Asn Gln Asn Leu Thr
690 695 700
Asp Phe Phe Glu Met Trp Gly Phe Phe Glu Pro Val Asn Thr Thr Ile
705 710 715 720
Glu Gln Tyr Gly Thr Tyr Lys Tyr Tyr Val Ser Asp Ala Met Ile Arg
725 730 735
Glu Ala Lys Glu Tyr Met Ala Gln Phe Pro Ala Pro Lys His Ala Phe
740 745 750
Gln Tyr Ile Glu Asp Arg Lys Lys Ser Glu Phe Pro Ser Asn Asp Tyr
755 760 765
Arg Tyr Ser Ala Val Gly Asp Val Gly Tyr Tyr Thr Gln Phe Lys Glu
770 775 780
Asn Gln Lys Ile Thr Lys Ala Ile Thr Ala Glu Leu Ala Gly Arg Lys
785 790 795 800
Val Ser Ile Gln Asn Gly Asp Glu Ala Val Ala Phe Glu Leu Arg Glu
805 810 815
Asn Asp Glu Asn Gly Lys Leu Leu Tyr Phe Ser Thr Phe Thr Thr Phe
820 825 830
Glu Ile Pro Ser Ser Ile Leu Met Val Asn Ala Lys Leu Tyr Ala Val
835 840 845
Gln Ala Asp Gly Lys Arg Ile Leu Leu
850 855
<210> 34
<211> 1687
<212> PRT
<213> Clostridium perfringens
<400> 34
Met Asn Lys Arg Lys Ile Ala Ala Ile Ile Leu Ala Thr Met Ile Thr
1 5 10 15
Asn Leu Ser Ala Thr Thr Ile Asp Val Leu Ala Gln Glu Leu Asn Thr
20 25 30
Lys Asn Asn Ser Lys Val Glu Val Ser His Asp Asp Glu Ser His Gln
35 40 45
Ala Arg Val Ser Lys Phe Asp Leu Tyr Asn Ser Asp Lys Leu Asp Ala
50 55 60
Tyr Asn Gln Glu Phe Gln Val Ser Arg Ser Asn Ile Lys Ser Ile Asn
65 70 75 80
Asn Asn Gly Gly Lys Tyr Asn Ser Ser Thr Ile Asp Lys Ala Ile Asp
85 90 95
Gly Asn Leu Glu Thr His Trp Glu Thr Gly Lys Pro Asn Asp Ala Asn
100 105 110
Phe Thr Asn Glu Val Val Val Thr Phe Asn Glu Ile Thr Asn Ile Asp
115 120 125
Arg Ile Val Tyr Ser Ala Arg Arg Asp Ser Ala Arg Gly Lys Gly Phe
130 135 140
Ala Lys Glu Phe Glu Ile Tyr Ala Ser Leu Lys Asp Glu Gly Asp Asp
145 150 155 160
Phe Asn Leu Val Ser Ser Gly Glu Tyr Thr Glu Ser Thr Arg Asp Leu
165 170 175
Val Glu Ile Lys Phe Asn Pro Thr Asp Phe Lys Arg Leu Lys Phe Lys
180 185 190
Phe Lys Lys Ala Asp Gln Asn Trp Ala Ser Ala Ala Glu Phe Met Phe
195 200 205
Tyr Lys Glu Asp Lys Leu Asn Glu Lys Phe Asn Gly Leu Phe Thr Asp
210 215 220
Ser Ser Met Asn Lys Val Ser Glu Glu Phe Asn Thr Leu Glu Lys Leu
225 230 235 240
Asn Ala Phe Glu Asn Glu Leu Lys Asp His Pro Ile Tyr Asp Leu Tyr
245 250 255
Lys Glu Gly Leu Asn Asn Ala Arg Ala Ile Leu Thr Glu Thr Ser Glu
260 265 270
Asn Pro Thr Lys Ala Thr Leu Gly Gln Ile Thr Tyr Asn Leu Asn Asp
275 280 285
Asp Tyr Asn Asn Gln Tyr Arg Met Pro Tyr Lys Asn Ile Lys Ala Ile
290 295 300
Lys Asn Asn Gly Arg His Tyr Ala Ala Gln Asn Ile Glu Lys Ala Ile
305 310 315 320
Asp Asn Asp Val Asn Thr Tyr Trp Glu Thr Gly Thr Leu Asn Ser Ser
325 330 335
Ser Phe Asn Asn Glu Val Glu Val Glu Phe Asn Asp Leu Val Thr Leu
340 345 350
Asp Arg Ile Val Tyr Gly Ser Arg Gln Ser Asp Leu Lys Gly Phe Ala
355 360 365
Glu Glu Val Tyr Ile Tyr Ala Ser Arg Thr Ser Lys Gly Asp Thr Tyr
370 375 380
Lys Leu Val Ala Thr Gly Ala His Glu Ala Thr Lys Gly Leu Val Glu
385 390 395 400
Ala Lys Phe Glu Pro Thr Glu Phe Lys Arg Val Lys Phe Lys Phe Lys
405 410 415
Lys Ser Lys Gln Asn Ser Ala Thr Leu Asn Glu Leu Met Phe Tyr Lys
420 425 430
Pro Asp Glu Val Tyr Ser Ser Ile Pro Lys Leu Phe Thr Asp Gly Thr
435 440 445
Met Ser Glu Leu Ser Glu Glu Phe Asn Ser Leu Glu Lys Ile Asn Ala
450 455 460
Phe Lys Glu Lys Ala Lys Asn His Pro Leu Tyr Asn Asp Phe Asn Glu
465 470 475 480
Thr Ile Glu Leu Ala Glu Ser Leu Ile Ser Asn Pro Arg Lys Glu Asp
485 490 495
Val Leu Glu Leu Glu Met Arg Gly Asp Ser Ile Ser Glu Ala Lys Lys
500 505 510
Arg Lys Val Trp Asn Phe Gln Asp Trp Gln Ile Thr Gly Leu Ser Ala
515 520 525
Arg Ala Gly Asp Lys Ile Thr Val Tyr Val Asp Val Ala Glu Gly Asp
530 535 540
Pro Thr Pro Thr Leu Leu Tyr Lys Gln Ser Leu Thr Gln His Gly Gly
545 550 555 560
Ala Thr Ser Phe Gln Leu Lys Pro Gly Lys Asn Glu Ile Thr Ile Pro
565 570 575
Glu Ile Asn Tyr Glu Ser Asn Gly Ile Pro Lys Asp Val Ile Gln Gly
580 585 590
Gly Asp Leu Phe Phe Thr Asn Tyr Lys Ser Asp Ser Gln Lys Arg Ala
595 600 605
Pro Lys Val Arg Ile Glu Gly Ala Ser Lys Tyr Pro Val Phe Ile Leu
610 615 620
Gly Lys Ser Asp Glu Asn Glu Val Met Lys Glu Leu Glu Ala Tyr Val
625 630 635 640
Glu Lys Ile Lys Ala Glu Pro Lys Thr Thr Pro Asn Ile Phe Ala Val
645 650 655
Ser Ser Asn Lys Ser Leu Glu Phe Val Gln Ala Thr Tyr Ala Leu Asp
660 665 670
Trp Tyr Lys Lys Asn Asn Lys Thr Pro Lys Tyr Thr Ala Glu Gln Trp
675 680 685
Asp Gln Tyr Ile Ala Asp Ala Met Gly Phe Trp Gly Phe Asp Asn Ser
690 695 700
Lys Asp Val Asn Ser Asp Phe Asn Phe Arg Ile Met Pro Met Val Lys
705 710 715 720
Asn Leu Ser Gly Gly Ala Phe Met Asn Ala Gly Asn Gly Val Ile Gly
725 730 735
Ile Arg Pro Gly Asn Gln Asp Ala Ile Leu Ala Ala Asn Lys Gly Trp
740 745 750
Gly Val Ala His Glu Leu Gly His Asn Phe Asp Thr Gly Gly Arg Thr
755 760 765
Ile Val Glu Val Thr Asn Asn Met Met Pro Leu Phe Phe Glu Ser Lys
770 775 780
Tyr Lys Thr Lys Thr Arg Ile Thr Asp Gln Asn Ile Trp Glu Asn Asn
785 790 795 800
Thr Tyr Pro Lys Val Gly Leu Asp Asp Tyr Ser Asn Asn Glu Leu Tyr
805 810 815
Asn Lys Ala Asp Ser Thr His Leu Ala Gln Leu Ala Pro Leu Trp Gln
820 825 830
Leu Tyr Leu Tyr Asp Asn Thr Phe Tyr Gly Lys Phe Glu Arg Gln Phe
835 840 845
Arg Glu Arg Asp Phe Gly Asn Lys Asn Arg Glu Asp Ile Tyr Lys Ser
850 855 860
Trp Val Val Ala Ala Ser Asp Ala Met Glu Leu Asp Leu Thr Glu Phe
865 870 875 880
Phe Ala Arg His Gly Ile Arg Val Asp Asp Lys Val Lys Glu Asp Leu
885 890 895
Ala Lys Tyr Pro Lys Pro Asp Lys Lys Ile Tyr Tyr Leu Asn Asp Leu
900 905 910
Ala Met Asn Tyr Lys Gly Asp Gly Phe Thr Glu Asn Ala Lys Val Ser
915 920 925
Val Ser Thr Ser Gly Ser Asn Gly Asn Ile Lys Leu Ser Phe Ser Val
930 935 940
Asp Asp Glu Asn Lys Asp Asn Ile Leu Gly Tyr Glu Ile Arg Arg Asp
945 950 955 960
Gly Lys Tyr Val Gly Phe Thr Ser Asn Asp Ser Phe Val Asp Thr Lys
965 970 975
Ser Asn Leu Asp Glu Asp Gly Val Tyr Val Val Thr Pro Tyr Asp Arg
980 985 990
Lys Leu Asn Thr Leu Asn Pro Ile Glu Val Asn Ala Leu Gln Pro Thr
995 1000 1005
Leu Ser Val Asn Pro Val Ile Thr Leu Ala Leu Gly Glu Glu Phe
1010 1015 1020
Asn Glu Glu Glu Tyr Ile Val Ala Lys Asp Ile Lys Gly Asn Ser
1025 1030 1035
Leu Ser Glu Ser Val Lys Val Lys Ser Ser Asn Val Asn Thr Ser
1040 1045 1050
Lys Val Gly Glu Tyr Glu Val Leu Tyr Ser Leu Glu Asp Ser Lys
1055 1060 1065
Gly Asn Glu Tyr Thr Lys Thr Ser Lys Val Asn Val Val Ser Arg
1070 1075 1080
Lys Glu Tyr Met Ser Asp Leu Thr Pro Lys Gln Ser Ser Asn Gly
1085 1090 1095
Trp Gly Thr Val Arg Lys Asp Lys Ser Ile Ser Gly Gly Val Ile
1100 1105 1110
Gly Leu Thr Arg Asp Gly Asp Phe Val Asp Tyr Asn Lys Gly Leu
1115 1120 1125
Gly Leu His Ser Asn Ala Glu Tyr Val Tyr Asp Leu Glu Gly Lys
1130 1135 1140
Asp Tyr Asp Tyr Phe Glu Ser Tyr Val Gly Val Asp Lys Ala Met
1145 1150 1155
Ser Ser Arg Pro Ala Ser Ser Val Ile Phe Lys Val Leu Val Asp
1160 1165 1170
Gly Glu Glu Lys Phe Asn Ser Gly Val Met Arg Ser Thr Thr Pro
1175 1180 1185
Gln Lys Tyr Val Lys Val Asp Val Lys Asn Ala Lys Glu Leu Lys
1190 1195 1200
Leu Ile Val Asn Asp Ala Gly Asp Gly Asp Ser Ser Asp His Ala
1205 1210 1215
Ser Phe Gly Asp Ala Lys Leu Ala Thr Leu Ser Ser Lys Pro Ile
1220 1225 1230
Ile Lys Gly Glu Asn Leu Ala Tyr Ser Met Asp Glu Lys Val Asp
1235 1240 1245
Leu Met Lys Gly Ile Thr Ala Thr Asp Ile Glu Asp Gly Asn Ile
1250 1255 1260
Thr Ser Lys Val Gln Ile Lys Ser Ser Asp Phe Val Glu Gly Lys
1265 1270 1275
Ser Gly Ile Phe Thr Val Val Tyr Ser Val Thr Asp Ser Asp Gly
1280 1285 1290
Leu Thr Ser Glu Cys Ser Arg Thr Ile Ala Val Thr Asp Lys Glu
1295 1300 1305
Thr Gln Leu Ser Asp Leu Asn Trp Lys Ser Ala Thr Ile Gly Ser
1310 1315 1320
Gly Ser Val Arg Lys Asp Arg Ala Val Ser Gly Asn Gln Ile Arg
1325 1330 1335
Leu Leu Asn Glu Asp Asn Ser Val Glu Thr Phe Ala Lys Gly Ile
1340 1345 1350
Gly Thr His Ser Tyr Ser Glu Ile Val Tyr Asn Ser Glu Gly Tyr
1355 1360 1365
Asp Ile Phe Asp Thr Trp Val Gly Ile Asp Arg His Val Ala Asp
1370 1375 1380
Lys Lys Val Ser Ser Val Lys Phe Lys Val Tyr Val Asp Gly Glu
1385 1390 1395
Leu Lys Ala Glu Thr Asp Val Met Arg Ile Asp Thr Pro Lys Lys
1400 1405 1410
Arg Leu Val Val Asp Val Arg Asn Ser Lys Glu Ile Lys Leu Val
1415 1420 1425
Val Asp Val Ala Asp Asn Gly Asn Asn Trp Asp His Ala Asp Trp
1430 1435 1440
Ala Asp Ala Lys Phe Arg Asn Leu Ala Glu Tyr Asp Ala Ser Glu
1445 1450 1455
Leu Asn Lys Ala Ile Glu Glu Ala Lys Lys Leu Asp Leu Asn Asn
1460 1465 1470
Tyr Thr Glu Glu Ser Ser Glu Ala Leu Lys Asn Ala Ile Ser Lys
1475 1480 1485
Gly Glu Glu Ala Leu Leu Ser Lys Asp Lys Glu Thr Ile Asn Ser
1490 1495 1500
Ala Leu Glu Glu Leu Asn Lys Glu Met Asn Ser Leu Val Lys Val
1505 1510 1515
Asp Leu Asn Ala Val Ile Asn Ile Pro Asp Lys Tyr Leu Leu Lys
1520 1525 1530
Ser Ile Gln Asn Gln Leu Asn Lys Thr Gly Asp Ile Thr Leu Gly
1535 1540 1545
Asp Met Tyr Ser Leu Thr Thr Leu Thr Leu Ser Gly Val Glu Asp
1550 1555 1560
Leu Thr Gly Leu Glu Asn Ala Lys Asn Leu Glu Thr Leu Asn Met
1565 1570 1575
Asp Tyr Asn Glu Val Lys Asp Leu Arg Pro Leu Ser Lys Leu Lys
1580 1585 1590
Lys Leu Asn Thr Leu Asn Ala Gln Glu Gln Phe Ile Ala Ala Gly
1595 1600 1605
Glu Leu Lys Pro Ser Asn Gly Lys Val Ile Gly Asp Ser Lys Val
1610 1615 1620
Tyr Asn Arg Glu Gly Lys Asn Val Ala Lys Thr Ile Arg Val Val
1625 1630 1635
Asp Lys Asn Gly Asn Thr Ile Leu Glu Gln Asp Ala Lys Asp Glu
1640 1645 1650
Phe Thr Ile Asn Thr Lys Asp Leu Ser Ser Gly Leu Tyr Gly Val
1655 1660 1665
His Val Leu Phe Glu Asp Glu Gly Phe Ser Gly Val Met Phe Tyr
1670 1675 1680
Leu Phe Asn Val
1685
<210> 35
<211> 882
<212> PRT
<213> Artificial Sequence
<220>
<223> Polypeptide capable of binding to O-glycans but lack or has
reduced O-glycoprotein-specific endoprotease activity -
Pseudomonas aeruginosa PAO1 (double mutant with removed signal
sequence)
<400> 35
Ala Thr Gln Glu Glu Ile Leu Asp Ala Ala Leu Val Ser Gly Asp Ser
1 5 10 15
Ser Gln Leu Thr Asp Ser His Leu Val Ala Leu Arg Leu Gln Gln Gln
20 25 30
Val Glu Arg Ile Arg Gln Thr Arg Thr Gln Leu Leu Asp Gly Leu Tyr
35 40 45
Gln Asn Leu Ser Gln Ala Tyr Asp Pro Gly Ala Ala Ser Met Trp Val
50 55 60
Leu Pro Ala Asn Pro Asp Asn Thr Leu Pro Phe Leu Ile Gly Asp Lys
65 70 75 80
Gly Arg Val Leu Ala Ser Leu Ser Leu Glu Ala Gly Gly Arg Gly Leu
85 90 95
Ala Tyr Gly Thr Asn Val Leu Thr Gln Leu Ser Gly Thr Asn Ala Ala
100 105 110
His Ala Pro Leu Leu Lys Arg Ala Val Gln Trp Leu Val Asn Gly Asp
115 120 125
Pro Gly Ala Ala Thr Ala Lys Asp Phe Lys Val Ser Val Val Gly Val
130 135 140
Asp Lys Thr Ala Ala Leu Asn Gly Leu Lys Ser Ala Gly Leu Gln Pro
145 150 155 160
Ala Asp Ala Ala Cys Asn Ala Leu Thr Asp Ala Ser Cys Ala Ser Thr
165 170 175
Ser Lys Leu Leu Val Leu Gly Asn Gly Ala Ser Ala Ala Ser Leu Ser
180 185 190
Ala Thr Val Arg Ala Arg Leu Gln Ala Gly Leu Pro Ile Leu Phe Val
195 200 205
His Thr Asn Gly Trp Asn Gln Ser Ser Thr Gly Gln Gln Ile Leu Ala
210 215 220
Gly Leu Gly Leu Gln Glu Gly Pro Tyr Gly Gly Asn Tyr Trp Asp Lys
225 230 235 240
Asp Arg Val Pro Ser Ser Arg Thr Arg Thr Arg Ser Val Glu Leu Gly
245 250 255
Gly Ala Tyr Gly Gln Asp Pro Ala Leu Val Gln Gln Ile Val Asp Gly
260 265 270
Ser Trp Arg Thr Asp Tyr Asp Trp Ser Lys Cys Thr Ser Tyr Val Gly
275 280 285
Arg Thr Thr Cys Asp Asp Val Pro Gly Leu Ser Asp Phe Ser Lys Arg
290 295 300
Val Asp Val Leu Lys Gly Ala Leu Asp Ala Tyr Asn Gln Lys Ala Gln
305 310 315 320
Asn Leu Phe Ala Leu Pro Gly Thr Thr Ser Leu Arg Leu Trp Leu Leu
325 330 335
Trp Ala Asp Ala Val Arg Gln Asn Ile Arg Tyr Pro Met Asp Lys Ala
340 345 350
Ala Asp Thr Ala Arg Phe Gln Glu Thr Phe Val Ala Asp Ala Ile Val
355 360 365
Gly Tyr Val Arg Glu Ala Gly Ala Ala Gln Lys Glu Leu Gly Ser Tyr
370 375 380
Ala Gly Gln Arg Gln Gln Ser Met Pro Val Ser Gly Ser Glu Glu Thr
385 390 395 400
Leu Thr Leu Thr Leu Pro Ser Ala Gln Gly Phe Thr Ala Ile Gly Arg
405 410 415
Met Ala Ala Pro Gly Lys Arg Leu Ser Ile Arg Ile Glu Asp Ala Gly
420 425 430
Gln Ala Ser Leu Ala Val Gly Leu Asn Thr Gln Arg Ile Gly Ser Thr
435 440 445
Arg Leu Trp Asn Thr Arg Gln Tyr Asp Arg Pro Arg Phe Leu Lys Ser
450 455 460
Pro Asp Ile Lys Leu Gln Ala Asn Gln Ser Val Ala Leu Val Ser Pro
465 470 475 480
Tyr Gly Gly Leu Leu Gln Leu Val Tyr Ser Gly Ala Thr Pro Gly Gln
485 490 495
Thr Val Thr Val Lys Val Thr Gly Ala Ala Ser Gln Pro Phe Leu Asp
500 505 510
Ile Gln Pro Gly Glu Asp Ser Ser Gln Ala Ile Ala Asp Phe Ile Gln
515 520 525
Ala Leu Asp Ala Asp Lys Ala Asp Trp Leu Glu Ile Arg Ser Gly Ser
530 535 540
Val Glu Val His Ala Lys Val Glu Lys Val Arg Gly Ser Ile Asp Lys
545 550 555 560
Asp Tyr Gly Gly Asp Val Gln Arg Phe Ile Arg Glu Leu Asn Glu Val
565 570 575
Phe Ile Asp Asp Ala Tyr Thr Leu Ala Gly Phe Ala Ile Pro Asn Gln
580 585 590
Ala Lys Thr Pro Ala Ile Gln Gln Glu Cys Ala Ala Arg Gly Trp Asp
595 600 605
Cys Asp Ser Glu Thr Leu His Lys Leu Pro Gly Thr Gln His Ile Asn
610 615 620
Val Asp Gln Tyr Ala Gln Cys Gly Gly Gly Cys Ser Gly Asn Pro Tyr
625 630 635 640
Asp Gln Thr Trp Gly Leu Asn Pro Arg Gly Trp Gly Glu Ser Ala Ala
645 650 655
Leu Gly His Asn Leu Gln Val Asn Arg Leu Lys Val Tyr Gly Gly Arg
660 665 670
Ser Gly Glu Ile Ser Asn Gln Ile Phe Pro Leu His Lys Asp Trp Arg
675 680 685
Val Leu Arg Glu Phe Gly Gln Asn Leu Asp Asp Thr Arg Val Asn Tyr
690 695 700
Arg Asn Ala Tyr Asn Leu Ile Val Ala Gly Arg Ala Glu Ala Asp Pro
705 710 715 720
Leu Ala Gly Val Tyr Lys Arg Leu Trp Glu Asp Pro Gly Thr Tyr Ala
725 730 735
Leu Asn Gly Glu Arg Met Ala Phe Tyr Thr Gln Trp Val His Tyr Trp
740 745 750
Ala Asp Leu Lys Asn Asp Pro Leu Gln Gly Trp Asp Ile Trp Thr Leu
755 760 765
Leu Tyr Leu His Gln Arg Gln Val Asp Lys Ser Asp Trp Asp Ala Asn
770 775 780
Lys Ala Ala Leu Gly Tyr Gly Thr Tyr Ala Gln Arg Pro Gly Asn Ser
785 790 795 800
Gly Asp Ala Ser Ser Thr Asp Gly Asn Asp Asn Leu Leu Leu Gly Leu
805 810 815
Ser Trp Leu Thr Gln Arg Asp Gln Arg Pro Thr Phe Ala Leu Trp Gly
820 825 830
Ile Arg Thr Ser Ala Ala Ala Gln Ala Gln Val Ala Ala Tyr Gly Phe
835 840 845
Ala Glu Gln Pro Ala Phe Phe Tyr Ala Asn Asn Arg Thr Asn Glu Tyr
850 855 860
Ser Thr Val Lys Leu Leu Asp Met Ser Gln Gly Ser Pro Ala Trp Pro
865 870 875 880
Phe Pro
<210> 36
<211> 536
<212> PRT
<213> Artificial Sequence
<220>
<223> Polypeptide capable of binding to O-glycans but lack or has
reduced O-glycoprotein-specific endoprotease activity -
Bacteroides thetaiotaomicron VPI-5482 (double mutant with removed
signal and other immature sequences)
<400> 36
Asp Lys Trp Glu Lys Glu Phe Arg Ile Arg Ser Tyr Glu Pro Tyr Ser
1 5 10 15
Asn Ile Ala Glu Trp Ala Asp Lys Leu Met Thr Lys Lys Tyr Ser Asp
20 25 30
Leu Asp Asn Pro Thr Gly Ile Ser Val Lys Ala Gly Asp Asp Ile Ile
35 40 45
Val Leu Val Gly Asp Thr Tyr Gly Gln Asn Ile Ser Met Gln Cys Ile
50 55 60
Trp Glu Thr Gly Thr Glu Tyr Lys Gln Thr Ala Ser Ser Gly Asp Val
65 70 75 80
Tyr Met Leu Asn Pro Gly Val Asn Lys Leu Thr Met Lys Gly Glu Gly
85 90 95
Gln Leu Phe Val Met Tyr Asn Thr Glu Leu Thr Ser Asn Thr Ala Lys
100 105 110
Pro Ile Lys Ile His Ile Pro Leu Gly Ser Gly Thr Val Asn Gly Phe
115 120 125
Phe Asp Leu Lys Glu His Lys Thr Asp Glu Lys Tyr Ala Glu Leu Leu
130 135 140
Lys Lys Ser Thr His Lys Tyr Phe Cys Ile Arg Gly Glu Lys Ile Met
145 150 155 160
Phe Tyr Phe His Arg Asn Lys Leu Leu Glu Tyr Val Pro Asn Asn Ile
165 170 175
Leu Ser Ala Ile His Leu Trp Asp Asn Ile Val Gly Trp Gln Gln Glu
180 185 190
Leu Met Gly Ile Asp Asp Val Arg Pro Ser Gln Val Asn Asn His Leu
195 200 205
Phe Ala Ile Ser Pro Glu Gly Ser Tyr Met Trp Ala Ser Asp Tyr Gln
210 215 220
Ile Gly Phe Val Tyr Thr Tyr Leu Gly Asn Ile Leu Leu Glu Asp Asn
225 230 235 240
Val Met Ala Ala Glu Asp Asn Ala Trp Gly Pro Ala Ala Ala Ile Gly
245 250 255
His Val His Gln Ala Ala Ile Asn Trp Ala Ser Ser Thr Glu Ser Ser
260 265 270
Asn Asn Leu Phe Ser Asn Phe Ile Ile Tyr Lys Leu Gly Lys Tyr Lys
275 280 285
Ser Arg Gly Asn Gly Leu Gly Ser Val Ala Thr Ala Arg Tyr Ala Asn
290 295 300
Gly Gln Ala Trp Tyr Asn Met Gly Asp Ala Thr His Gln Asn Glu Asp
305 310 315 320
Thr Glu Thr His Met Arg Met Asn Trp Gln Leu Trp Ile Tyr Tyr His
325 330 335
Arg Cys Glu Tyr Lys Thr Asp Phe Trp Gln Thr Leu Phe Lys Leu Met
340 345 350
Arg Glu Val Asn Met Thr Glu Gly Glu Asp Pro Gly Lys Lys Gln Leu
355 360 365
Glu Phe Ala Lys Met Ala Ser Lys Ala Ala Asn Gln Asn Leu Thr Asp
370 375 380
Phe Phe Glu Met Trp Gly Phe Phe Glu Pro Val Asn Thr Thr Ile Glu
385 390 395 400
Gln Tyr Gly Thr Tyr Lys Tyr Tyr Val Ser Asp Ala Met Ile Arg Glu
405 410 415
Ala Lys Glu Tyr Met Ala Gln Phe Pro Ala Pro Lys His Ala Phe Gln
420 425 430
Tyr Ile Glu Asp Arg Lys Lys Ser Glu Phe Pro Ser Asn Asp Tyr Arg
435 440 445
Tyr Ser Ala Val Gly Asp Val Gly Tyr Tyr Thr Gln Phe Lys Glu Asn
450 455 460
Gln Lys Ile Thr Lys Ala Ile Thr Ala Glu Leu Ala Gly Arg Lys Val
465 470 475 480
Ser Ile Gln Asn Gly Asp Glu Ala Val Ala Phe Glu Leu Arg Glu Asn
485 490 495
Asp Glu Asn Gly Lys Leu Leu Tyr Phe Ser Thr Phe Thr Thr Phe Glu
500 505 510
Ile Pro Ser Ser Ile Leu Met Val Asn Ala Lys Leu Tyr Ala Val Gln
515 520 525
Ala Asp Gly Lys Arg Ile Leu Leu
530 535
<210> 37
<211> 507
<212> PRT
<213> Artificial Sequence
<220>
<223> Polypeptide capable of binding to O-glycans but lack or has
reduced O-glycoprotein-specific endoprotease activity -
Clostridium perfringens (double mutant with removed signal and
other immature sequences)
<400> 37
Val Leu Glu Leu Glu Met Arg Gly Asp Ser Ile Ser Glu Ala Lys Lys
1 5 10 15
Arg Lys Val Trp Asn Phe Gln Asp Trp Gln Ile Thr Gly Leu Ser Ala
20 25 30
Arg Ala Gly Asp Lys Ile Thr Val Tyr Val Asp Val Ala Glu Gly Asp
35 40 45
Pro Thr Pro Thr Leu Leu Tyr Lys Gln Ser Leu Thr Gln His Gly Gly
50 55 60
Ala Thr Ser Phe Gln Leu Lys Pro Gly Lys Asn Glu Ile Thr Ile Pro
65 70 75 80
Glu Ile Asn Tyr Glu Ser Asn Gly Ile Pro Lys Asp Val Ile Gln Gly
85 90 95
Gly Asp Leu Phe Phe Thr Asn Tyr Lys Ser Asp Ser Gln Lys Arg Ala
100 105 110
Pro Lys Val Arg Ile Glu Gly Ala Ser Lys Tyr Pro Val Phe Ile Leu
115 120 125
Gly Lys Ser Asp Glu Asn Glu Val Met Lys Glu Leu Glu Ala Tyr Val
130 135 140
Glu Lys Ile Lys Ala Glu Pro Lys Thr Thr Pro Asn Ile Phe Ala Val
145 150 155 160
Ser Ser Asn Lys Ser Leu Glu Phe Val Gln Ala Thr Tyr Ala Leu Asp
165 170 175
Trp Tyr Lys Lys Asn Asn Lys Thr Pro Lys Tyr Thr Ala Glu Gln Trp
180 185 190
Asp Gln Tyr Ile Ala Asp Ala Met Gly Phe Trp Gly Phe Asp Asn Ser
195 200 205
Lys Asp Val Asn Ser Asp Phe Asn Phe Arg Ile Met Pro Met Val Lys
210 215 220
Asn Leu Ser Gly Gly Ala Phe Met Asn Ala Gly Asn Gly Val Ile Gly
225 230 235 240
Ile Arg Pro Gly Asn Gln Asp Ala Ile Leu Ala Ala Asn Lys Gly Trp
245 250 255
Gly Val Ala Ala Ala Leu Gly His Asn Phe Asp Thr Gly Gly Arg Thr
260 265 270
Ile Val Glu Val Thr Asn Asn Met Met Pro Leu Phe Phe Glu Ser Lys
275 280 285
Tyr Lys Thr Lys Thr Arg Ile Thr Asp Gln Asn Ile Trp Glu Asn Asn
290 295 300
Thr Tyr Pro Lys Val Gly Leu Asp Asp Tyr Ser Asn Asn Glu Leu Tyr
305 310 315 320
Asn Lys Ala Asp Ser Thr His Leu Ala Gln Leu Ala Pro Leu Trp Gln
325 330 335
Leu Tyr Leu Tyr Asp Asn Thr Phe Tyr Gly Lys Phe Glu Arg Gln Phe
340 345 350
Arg Glu Arg Asp Phe Gly Asn Lys Asn Arg Glu Asp Ile Tyr Lys Ser
355 360 365
Trp Val Val Ala Ala Ser Asp Ala Met Glu Leu Asp Leu Thr Glu Phe
370 375 380
Phe Ala Arg His Gly Ile Arg Val Asp Asp Lys Val Lys Glu Asp Leu
385 390 395 400
Ala Lys Tyr Pro Lys Pro Asp Lys Lys Ile Tyr Tyr Leu Asn Asp Leu
405 410 415
Ala Met Asn Tyr Lys Gly Asp Gly Phe Thr Glu Asn Ala Lys Val Ser
420 425 430
Val Ser Thr Ser Gly Ser Asn Gly Asn Ile Lys Leu Ser Phe Ser Val
435 440 445
Asp Asp Glu Asn Lys Asp Asn Ile Leu Gly Tyr Glu Ile Arg Arg Asp
450 455 460
Gly Lys Tyr Val Gly Phe Thr Ser Asn Asp Ser Phe Val Asp Thr Lys
465 470 475 480
Ser Asn Leu Asp Glu Asp Gly Val Tyr Val Val Thr Pro Tyr Asp Arg
485 490 495
Lys Leu Asn Thr Leu Asn Pro Ile Glu Val Asn
500 505
<210> 38
<211> 892
<212> PRT
<213> Artificial Sequence
<220>
<223> Polypeptide capable of binding to O-glycans but lack or has
reduced O-glycoprotein-specific endoprotease activity -
Pseudomonas aeruginosa PAO1 (double mutant with removed signal
sequence, with N-term Met, C-term linker/tag)
<400> 38
Met Ala Thr Gln Glu Glu Ile Leu Asp Ala Ala Leu Val Ser Gly Asp
1 5 10 15
Ser Ser Gln Leu Thr Asp Ser His Leu Val Ala Leu Arg Leu Gln Gln
20 25 30
Gln Val Glu Arg Ile Arg Gln Thr Arg Thr Gln Leu Leu Asp Gly Leu
35 40 45
Tyr Gln Asn Leu Ser Gln Ala Tyr Asp Pro Gly Ala Ala Ser Met Trp
50 55 60
Val Leu Pro Ala Asn Pro Asp Asn Thr Leu Pro Phe Leu Ile Gly Asp
65 70 75 80
Lys Gly Arg Val Leu Ala Ser Leu Ser Leu Glu Ala Gly Gly Arg Gly
85 90 95
Leu Ala Tyr Gly Thr Asn Val Leu Thr Gln Leu Ser Gly Thr Asn Ala
100 105 110
Ala His Ala Pro Leu Leu Lys Arg Ala Val Gln Trp Leu Val Asn Gly
115 120 125
Asp Pro Gly Ala Ala Thr Ala Lys Asp Phe Lys Val Ser Val Val Gly
130 135 140
Val Asp Lys Thr Ala Ala Leu Asn Gly Leu Lys Ser Ala Gly Leu Gln
145 150 155 160
Pro Ala Asp Ala Ala Cys Asn Ala Leu Thr Asp Ala Ser Cys Ala Ser
165 170 175
Thr Ser Lys Leu Leu Val Leu Gly Asn Gly Ala Ser Ala Ala Ser Leu
180 185 190
Ser Ala Thr Val Arg Ala Arg Leu Gln Ala Gly Leu Pro Ile Leu Phe
195 200 205
Val His Thr Asn Gly Trp Asn Gln Ser Ser Thr Gly Gln Gln Ile Leu
210 215 220
Ala Gly Leu Gly Leu Gln Glu Gly Pro Tyr Gly Gly Asn Tyr Trp Asp
225 230 235 240
Lys Asp Arg Val Pro Ser Ser Arg Thr Arg Thr Arg Ser Val Glu Leu
245 250 255
Gly Gly Ala Tyr Gly Gln Asp Pro Ala Leu Val Gln Gln Ile Val Asp
260 265 270
Gly Ser Trp Arg Thr Asp Tyr Asp Trp Ser Lys Cys Thr Ser Tyr Val
275 280 285
Gly Arg Thr Thr Cys Asp Asp Val Pro Gly Leu Ser Asp Phe Ser Lys
290 295 300
Arg Val Asp Val Leu Lys Gly Ala Leu Asp Ala Tyr Asn Gln Lys Ala
305 310 315 320
Gln Asn Leu Phe Ala Leu Pro Gly Thr Thr Ser Leu Arg Leu Trp Leu
325 330 335
Leu Trp Ala Asp Ala Val Arg Gln Asn Ile Arg Tyr Pro Met Asp Lys
340 345 350
Ala Ala Asp Thr Ala Arg Phe Gln Glu Thr Phe Val Ala Asp Ala Ile
355 360 365
Val Gly Tyr Val Arg Glu Ala Gly Ala Ala Gln Lys Glu Leu Gly Ser
370 375 380
Tyr Ala Gly Gln Arg Gln Gln Ser Met Pro Val Ser Gly Ser Glu Glu
385 390 395 400
Thr Leu Thr Leu Thr Leu Pro Ser Ala Gln Gly Phe Thr Ala Ile Gly
405 410 415
Arg Met Ala Ala Pro Gly Lys Arg Leu Ser Ile Arg Ile Glu Asp Ala
420 425 430
Gly Gln Ala Ser Leu Ala Val Gly Leu Asn Thr Gln Arg Ile Gly Ser
435 440 445
Thr Arg Leu Trp Asn Thr Arg Gln Tyr Asp Arg Pro Arg Phe Leu Lys
450 455 460
Ser Pro Asp Ile Lys Leu Gln Ala Asn Gln Ser Val Ala Leu Val Ser
465 470 475 480
Pro Tyr Gly Gly Leu Leu Gln Leu Val Tyr Ser Gly Ala Thr Pro Gly
485 490 495
Gln Thr Val Thr Val Lys Val Thr Gly Ala Ala Ser Gln Pro Phe Leu
500 505 510
Asp Ile Gln Pro Gly Glu Asp Ser Ser Gln Ala Ile Ala Asp Phe Ile
515 520 525
Gln Ala Leu Asp Ala Asp Lys Ala Asp Trp Leu Glu Ile Arg Ser Gly
530 535 540
Ser Val Glu Val His Ala Lys Val Glu Lys Val Arg Gly Ser Ile Asp
545 550 555 560
Lys Asp Tyr Gly Gly Asp Val Gln Arg Phe Ile Arg Glu Leu Asn Glu
565 570 575
Val Phe Ile Asp Asp Ala Tyr Thr Leu Ala Gly Phe Ala Ile Pro Asn
580 585 590
Gln Ala Lys Thr Pro Ala Ile Gln Gln Glu Cys Ala Ala Arg Gly Trp
595 600 605
Asp Cys Asp Ser Glu Thr Leu His Lys Leu Pro Gly Thr Gln His Ile
610 615 620
Asn Val Asp Gln Tyr Ala Gln Cys Gly Gly Gly Cys Ser Gly Asn Pro
625 630 635 640
Tyr Asp Gln Thr Trp Gly Leu Asn Pro Arg Gly Trp Gly Glu Ser Ala
645 650 655
Ala Leu Gly His Asn Leu Gln Val Asn Arg Leu Lys Val Tyr Gly Gly
660 665 670
Arg Ser Gly Glu Ile Ser Asn Gln Ile Phe Pro Leu His Lys Asp Trp
675 680 685
Arg Val Leu Arg Glu Phe Gly Gln Asn Leu Asp Asp Thr Arg Val Asn
690 695 700
Tyr Arg Asn Ala Tyr Asn Leu Ile Val Ala Gly Arg Ala Glu Ala Asp
705 710 715 720
Pro Leu Ala Gly Val Tyr Lys Arg Leu Trp Glu Asp Pro Gly Thr Tyr
725 730 735
Ala Leu Asn Gly Glu Arg Met Ala Phe Tyr Thr Gln Trp Val His Tyr
740 745 750
Trp Ala Asp Leu Lys Asn Asp Pro Leu Gln Gly Trp Asp Ile Trp Thr
755 760 765
Leu Leu Tyr Leu His Gln Arg Gln Val Asp Lys Ser Asp Trp Asp Ala
770 775 780
Asn Lys Ala Ala Leu Gly Tyr Gly Thr Tyr Ala Gln Arg Pro Gly Asn
785 790 795 800
Ser Gly Asp Ala Ser Ser Thr Asp Gly Asn Asp Asn Leu Leu Leu Gly
805 810 815
Leu Ser Trp Leu Thr Gln Arg Asp Gln Arg Pro Thr Phe Ala Leu Trp
820 825 830
Gly Ile Arg Thr Ser Ala Ala Ala Gln Ala Gln Val Ala Ala Tyr Gly
835 840 845
Phe Ala Glu Gln Pro Ala Phe Phe Tyr Ala Asn Asn Arg Thr Asn Glu
850 855 860
Tyr Ser Thr Val Lys Leu Leu Asp Met Ser Gln Gly Ser Pro Ala Trp
865 870 875 880
Pro Phe Pro Gly Ser Gly His His His His His His
885 890
<210> 39
<211> 546
<212> PRT
<213> Artificial Sequence
<220>
<223> Polypeptide capable of binding to O-glycans but lack or has
reduced O-glycoprotein-specific endoprotease activity -
Bacteroides thetaiotaomicron VPI-5482 (double mutant with removed
signal and other sequences from immature protein, with N-term
<400> 39
Met Asp Lys Trp Glu Lys Glu Phe Arg Ile Arg Ser Tyr Glu Pro Tyr
1 5 10 15
Ser Asn Ile Ala Glu Trp Ala Asp Lys Leu Met Thr Lys Lys Tyr Ser
20 25 30
Asp Leu Asp Asn Pro Thr Gly Ile Ser Val Lys Ala Gly Asp Asp Ile
35 40 45
Ile Val Leu Val Gly Asp Thr Tyr Gly Gln Asn Ile Ser Met Gln Cys
50 55 60
Ile Trp Glu Thr Gly Thr Glu Tyr Lys Gln Thr Ala Ser Ser Gly Asp
65 70 75 80
Val Tyr Met Leu Asn Pro Gly Val Asn Lys Leu Thr Met Lys Gly Glu
85 90 95
Gly Gln Leu Phe Val Met Tyr Asn Thr Glu Leu Thr Ser Asn Thr Ala
100 105 110
Lys Pro Ile Lys Ile His Ile Pro Leu Gly Ser Gly Thr Val Asn Gly
115 120 125
Phe Phe Asp Leu Lys Glu His Lys Thr Asp Glu Lys Tyr Ala Glu Leu
130 135 140
Leu Lys Lys Ser Thr His Lys Tyr Phe Cys Ile Arg Gly Glu Lys Ile
145 150 155 160
Met Phe Tyr Phe His Arg Asn Lys Leu Leu Glu Tyr Val Pro Asn Asn
165 170 175
Ile Leu Ser Ala Ile His Leu Trp Asp Asn Ile Val Gly Trp Gln Gln
180 185 190
Glu Leu Met Gly Ile Asp Asp Val Arg Pro Ser Gln Val Asn Asn His
195 200 205
Leu Phe Ala Ile Ser Pro Glu Gly Ser Tyr Met Trp Ala Ser Asp Tyr
210 215 220
Gln Ile Gly Phe Val Tyr Thr Tyr Leu Gly Asn Ile Leu Leu Glu Asp
225 230 235 240
Asn Val Met Ala Ala Glu Asp Asn Ala Trp Gly Pro Ala Ala Ala Ile
245 250 255
Gly His Val His Gln Ala Ala Ile Asn Trp Ala Ser Ser Thr Glu Ser
260 265 270
Ser Asn Asn Leu Phe Ser Asn Phe Ile Ile Tyr Lys Leu Gly Lys Tyr
275 280 285
Lys Ser Arg Gly Asn Gly Leu Gly Ser Val Ala Thr Ala Arg Tyr Ala
290 295 300
Asn Gly Gln Ala Trp Tyr Asn Met Gly Asp Ala Thr His Gln Asn Glu
305 310 315 320
Asp Thr Glu Thr His Met Arg Met Asn Trp Gln Leu Trp Ile Tyr Tyr
325 330 335
His Arg Cys Glu Tyr Lys Thr Asp Phe Trp Gln Thr Leu Phe Lys Leu
340 345 350
Met Arg Glu Val Asn Met Thr Glu Gly Glu Asp Pro Gly Lys Lys Gln
355 360 365
Leu Glu Phe Ala Lys Met Ala Ser Lys Ala Ala Asn Gln Asn Leu Thr
370 375 380
Asp Phe Phe Glu Met Trp Gly Phe Phe Glu Pro Val Asn Thr Thr Ile
385 390 395 400
Glu Gln Tyr Gly Thr Tyr Lys Tyr Tyr Val Ser Asp Ala Met Ile Arg
405 410 415
Glu Ala Lys Glu Tyr Met Ala Gln Phe Pro Ala Pro Lys His Ala Phe
420 425 430
Gln Tyr Ile Glu Asp Arg Lys Lys Ser Glu Phe Pro Ser Asn Asp Tyr
435 440 445
Arg Tyr Ser Ala Val Gly Asp Val Gly Tyr Tyr Thr Gln Phe Lys Glu
450 455 460
Asn Gln Lys Ile Thr Lys Ala Ile Thr Ala Glu Leu Ala Gly Arg Lys
465 470 475 480
Val Ser Ile Gln Asn Gly Asp Glu Ala Val Ala Phe Glu Leu Arg Glu
485 490 495
Asn Asp Glu Asn Gly Lys Leu Leu Tyr Phe Ser Thr Phe Thr Thr Phe
500 505 510
Glu Ile Pro Ser Ser Ile Leu Met Val Asn Ala Lys Leu Tyr Ala Val
515 520 525
Gln Ala Asp Gly Lys Arg Ile Leu Leu Gly Ser Gly His His His His
530 535 540
His His
545
<210> 40
<211> 517
<212> PRT
<213> Artificial Sequence
<220>
<223> Polypeptide capable of binding to O-glycans but lack or has
reduced O-glycoprotein-specific endoprotease activity -
Clostridium perfringens (double mutant with removed signal and
other sequences from immature protein, with N-term Met, C-term
<400> 40
Met Val Leu Glu Leu Glu Met Arg Gly Asp Ser Ile Ser Glu Ala Lys
1 5 10 15
Lys Arg Lys Val Trp Asn Phe Gln Asp Trp Gln Ile Thr Gly Leu Ser
20 25 30
Ala Arg Ala Gly Asp Lys Ile Thr Val Tyr Val Asp Val Ala Glu Gly
35 40 45
Asp Pro Thr Pro Thr Leu Leu Tyr Lys Gln Ser Leu Thr Gln His Gly
50 55 60
Gly Ala Thr Ser Phe Gln Leu Lys Pro Gly Lys Asn Glu Ile Thr Ile
65 70 75 80
Pro Glu Ile Asn Tyr Glu Ser Asn Gly Ile Pro Lys Asp Val Ile Gln
85 90 95
Gly Gly Asp Leu Phe Phe Thr Asn Tyr Lys Ser Asp Ser Gln Lys Arg
100 105 110
Ala Pro Lys Val Arg Ile Glu Gly Ala Ser Lys Tyr Pro Val Phe Ile
115 120 125
Leu Gly Lys Ser Asp Glu Asn Glu Val Met Lys Glu Leu Glu Ala Tyr
130 135 140
Val Glu Lys Ile Lys Ala Glu Pro Lys Thr Thr Pro Asn Ile Phe Ala
145 150 155 160
Val Ser Ser Asn Lys Ser Leu Glu Phe Val Gln Ala Thr Tyr Ala Leu
165 170 175
Asp Trp Tyr Lys Lys Asn Asn Lys Thr Pro Lys Tyr Thr Ala Glu Gln
180 185 190
Trp Asp Gln Tyr Ile Ala Asp Ala Met Gly Phe Trp Gly Phe Asp Asn
195 200 205
Ser Lys Asp Val Asn Ser Asp Phe Asn Phe Arg Ile Met Pro Met Val
210 215 220
Lys Asn Leu Ser Gly Gly Ala Phe Met Asn Ala Gly Asn Gly Val Ile
225 230 235 240
Gly Ile Arg Pro Gly Asn Gln Asp Ala Ile Leu Ala Ala Asn Lys Gly
245 250 255
Trp Gly Val Ala Ala Ala Leu Gly His Asn Phe Asp Thr Gly Gly Arg
260 265 270
Thr Ile Val Glu Val Thr Asn Asn Met Met Pro Leu Phe Phe Glu Ser
275 280 285
Lys Tyr Lys Thr Lys Thr Arg Ile Thr Asp Gln Asn Ile Trp Glu Asn
290 295 300
Asn Thr Tyr Pro Lys Val Gly Leu Asp Asp Tyr Ser Asn Asn Glu Leu
305 310 315 320
Tyr Asn Lys Ala Asp Ser Thr His Leu Ala Gln Leu Ala Pro Leu Trp
325 330 335
Gln Leu Tyr Leu Tyr Asp Asn Thr Phe Tyr Gly Lys Phe Glu Arg Gln
340 345 350
Phe Arg Glu Arg Asp Phe Gly Asn Lys Asn Arg Glu Asp Ile Tyr Lys
355 360 365
Ser Trp Val Val Ala Ala Ser Asp Ala Met Glu Leu Asp Leu Thr Glu
370 375 380
Phe Phe Ala Arg His Gly Ile Arg Val Asp Asp Lys Val Lys Glu Asp
385 390 395 400
Leu Ala Lys Tyr Pro Lys Pro Asp Lys Lys Ile Tyr Tyr Leu Asn Asp
405 410 415
Leu Ala Met Asn Tyr Lys Gly Asp Gly Phe Thr Glu Asn Ala Lys Val
420 425 430
Ser Val Ser Thr Ser Gly Ser Asn Gly Asn Ile Lys Leu Ser Phe Ser
435 440 445
Val Asp Asp Glu Asn Lys Asp Asn Ile Leu Gly Tyr Glu Ile Arg Arg
450 455 460
Asp Gly Lys Tyr Val Gly Phe Thr Ser Asn Asp Ser Phe Val Asp Thr
465 470 475 480
Lys Ser Asn Leu Asp Glu Asp Gly Val Tyr Val Val Thr Pro Tyr Asp
485 490 495
Arg Lys Leu Asn Thr Leu Asn Pro Ile Glu Val Asn Gly Ser Gly His
500 505 510
His His His His His
515
<210> 41
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Metalloprotease motif
<400> 41
His Glu Leu Gly His
1 5
<210> 42
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Metalloprotease motif
<400> 42
His Glu Ile Gly His
1 5
<210> 43
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> Metalloprotease motif
<400> 43
Gly Val Ala His Glu Leu Gly His Asn Phe
1 5 10
<210> 44
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> disrupted metalloprotease motif
<400> 44
His Ala Leu Gly His
1 5
<210> 45
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> disrupted metalloprotease motif
<400> 45
Ala Glu Leu Gly His
1 5
<210> 46
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> disrupted metalloprotease motif
<400> 46
Ala Ala Leu Gly His
1 5
<210> 47
<211> 19
<212> PRT
<213> Artificial Sequence
<220>
<223> glycodrosocin peptide with O-gly site on the T
<400> 47
Gly Lys Pro Arg Pro Tyr Ser Pro Arg Pro Thr Ser His Pro Arg Pro
1 5 10 15
Ile Arg Val
<210> 48
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Non-O-glycosylated peptide
<400> 48
Tyr Ile Tyr Gly Ser Phe Lys
1 5
<210> 49
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Non-O-glycosylated peptide
<400> 49
Lys Lys Leu Val Phe Phe Ala
1 5
<210> 50
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> Non-O-glycosylated peptide
<400> 50
Phe Leu Pro Leu Ile Leu Gly Lys Leu Val Lys Gly Leu Leu
1 5 10
Claims (20)
- 다음을 포함하는 O-글리코실화된 단백질에 대해 특이적인 엔도프로테아제 활성을 갖는 폴리펩티드:
(a) 서열번호 1의 아미노산 서열
(b) 서열번호 1의 아미노산 서열과 적어도 85% 동일한 아미노산 서열 또는
(c) 서열번호 1의 서열의 단편인 아미노산 서열 또는 서열번호 1의 아미노산 서열과 85% 동일한 아미노산 서열의 단편. - 제1항에 있어서, 서열번호 1의 아미노산 서열과 적어도 85% 동일한 아미노산 서열, 또는 이의 단편이 모티프 HEbbH를 포함하며, 여기서, b는 비하전 아미노산, 선택적으로 A, C, F, G, I, L, M, N, P, Q, S, T, V 또는 W이고, 선택적으로 상기 모티프는 서열번호 1의 위치 181 내지 185에 상응하는 위치에서 상기 폴리펩티드에 존재하는 폴리펩티드.
- 제2항에 있어서, 상기 모티프가 서열 HEIGH 또는 HELGH, 바람직하게는 HELGH을 포함하는 폴리펩티드.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 모티프 abxHEbbHbc를 포함하고 여기서,
(a) a는 아미노산 V, T 또는 G이고;
(b) b는 비하전 아미노산, 선택적으로 A, C, F, G, I, L, M, N, P, Q, S, T, V 또는 W이고,
(c) x는 임의의 아미노산이고;
(d) c는 소수성 아미노산, 선택적으로 A, C, F, I, L, M, P, V, W 또는 Y이고,
선택적으로 상기 모티프가 서열 GMAHELGHGL 또는 GVAHELGHNF, 바람직하게는 GMAHELGHGL을 포함하는 폴리펩티드. - 제1항 내지 제4항 중 어느 한 항에 있어서, N 말단에 추가의 메티오닌 및/또는 C 말단에 His 태그를 포함하고, 상기 태그는 링커에 의해 C 말단에 결합될 수 있고, 선택적으로 상기 폴리펩티드는 서열번호 2의 아미노산 서열을 포함하거나 이로 이루어진 폴리펩티드.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 폴리펩티드가 용액, 동결건조, 또는 고정화되어 제공되고, 선택적으로, 상기 폴리펩티드가 시알리다제, 바람직하게는 Am1757 또는 Am1757 및 Am0707의 혼합물과 함께 제공되고, 여기서 Am1757는 서열번호 11로 이루어지고/지거나 Am0707은 서열번호 14로 이루어지는 폴리펩티드.
- O-당단백질의 가수분해 방법으로서, 상기 방법은 단백질을 포함하는 샘플을 제1항 내지 제6항 중 어느 한 항에 따른 폴리펩티드와 접촉시키는 단계 및 선택적으로 가수분해 생성물의 검출 또는 분석하는 단계를 더 포함하는 방법.
- 단백질의 글리코실화 상태를 평가하는 방법으로서, 단백질을 포함하는 샘플을 제1항 내지 제6항 중 어느 한 항에 따른 폴리펩티드와 접촉시키는 단계 및/또는 생성된 산물을 검출 및/또는 분석하는 단계를 포함하며, 선택적으로, 절단 생성물의 존재 또는 부재가 샘플 중의 O-당단백질의 존재 또는 부재를 결정하기 위해 사용되고/되거나, 상기 분석이 O-글리칸 쇄의 유형 및/또는 O-당단백질에 대한 이의 부착 위치를 식별하기 위해 수행되는 방법.
- 제7항 또는 제8항에 있어서, 분석 또는 검출이 친화성 크로마토그래피, SDS-PAGE, HPLC 또는 질량 분석법에 의해 수행되는 방법.
- 제7항 내지 제9항 중 어느 한 항에 있어서, 단백질 또는 샘플을 제1항 내지 제6항의 폴리펩티드와 접촉시키기 전에 또는 접촉과 동시에 샘플을 시알리다제와 함께 항온 처리하는 방법으로서, 상기 시알리다제가 Am1757 또는 Am1757 및 Am0707의 혼합물인 방법.
- 제10항에 있어서, Am1757이 서열번호 11로 이루어지고/지거나 Am0707이 서열번호 14로 이루어지는 폴리펩티드인 방법.
- O-글리칸 또는 O-당단백질에 결합할 수 있고 O-글리코실화된 단백질에 특이적인 엔도프로테아제 활성이 없거나 감소된 폴리펩티드로서, 다음을 포함하는 폴리펩티드:
(a) 서열번호 5 또는 서열번호 20의 아미노산 서열;
(b) 서열번호 5 또는 서열번호 20의 아미노산 서열과 적어도 85% 동일한 아미노산 서열; 또는
(c) 서열번호 5 또는 서열번호 20의 서열의 단편인 아미노산 서열 또는 서열번호 5 또는 서열번호 20의 아미노산 서열과 85% 동일한 아미노산의 단편. - 제12항에 있어서, 서열번호 5 또는 서열번호 20의 아미노산 서열과 적어도 85% 동일한 아미노산 서열, 또는 이의 단편이 메탈로프로테아제 모티프 HEbbH를 포함하지 않고 바람직하게는 다음과 같은 상기 모티프의 파괴된 버전을 포함하는 폴리펩티드:
(a) 첫 번째 위치의 H가 대안적인 아미노산, 바람직하게는 A 또는 G로 치환된다; 및/또는
(b) 두 번째 위치의 E가 비하전 아미노산, 선택적으로 A, C, F, G, I, L, M, N, P, Q, S, T, V 또는 W, 바람직하게는 A 또는 G로 치환된다; 및/또는
(c) 다섯 번째 위치의 H가 대안적인 아미노산, 바람직하게는 A 또는 G로 치환된다
여기서 상기 모티프의 b는 비하전 아미노산, 선택적으로 A, C, F, G, I, L, M, N, P, Q, S, T, V 또는 W이다. - 제12항 또는 제13항에 있어서, N 말단에 추가의 메티오닌을 포함하고/하거나 C 말단에 His 태그를 포함하는 폴리펩티드로서, 상기 태그는 링커에 의해 C 말단에 결합될 수 있고, 선택적으로 상기 폴리펩티드는 서열번호 6 또는 21의 아미노산 서열을 포함하거나 이로 이루어지는 폴리펩티드.
- 제12항 내지 제14항 중 어느 한 항에 있어서, 폴리펩티드가 용액, 동결건조, 또는 고정화되어 제공되며, 선택적으로 상기 폴리펩티드가 시알리다제, 바람직하게는 Am1757 또는 Am1757 및 Am0707의 혼합물과 함께 제공되는 폴리펩티드.
- O-글리칸, O-글리코펩티드 및/또는 O-당단백질에 결합 방법으로서, 상기 방법은 O-글리칸, O-글리코펩티드 및/또는 O-당단백질을 포함하는 샘플을 제12항 내지 제15항 중 어느 한 항에 따른 폴리펩티드와 접촉시키는 단계, 및 선택적으로 O-글리칸, O-글리코펩티드 및/또는 O-당단백질이 결합되었는지 여부를 결정하고/하거나 생성된 혼합물로부터 O-글리칸 및 임의의 연결된 당단백질, O-글리코펩티드 또는 O-당단백질을 분리하는 단계를 포함하는 방법으로서; 선택적으로 상기 방법은 샘플로부터 O-글리칸 또는 연결된 당단백질, O-글리코펩티드 또는 O-당단백질을 단리하기 위한 목적인 방법.
- 단백질을 포함하는 샘플을 제12항 내지 제15항 중 어느 한 항에 따른 폴리펩티드와 접촉시키는 단계 및 단백질이 상기 폴리펩티드에 의해 결합되었는지 여부를 결정하는 단계를 포함하는, 단백질의 글리코실화 상태를 평가하기 위한 방법.
- 다음의 단계를 포함하는, 샘플에서 O-글리코펩티드 및/또는 O-당단백질을 검출하는 방법:
(a) 상기 샘플을 제12항 내지 제15항 중 어느 한 항에 따른 폴리펩티드와 접촉시켜 O-글리코펩티드 및/또는 O-당단백질 및 상기 폴리펩티드 사이에 복합체를 형성하도록 하는 단계;
(b) 선택적으로 접촉된 샘플로부터 상기 폴리펩티드를 분리하는 단계; 및
(c) 분리된 폴리펩티드가 O-연결 당단백질 또는 글리코펩티드에 부착되었는지 여부를 결정하여 샘플에서 O-연결 글리코펩티드 또는 당단백질의 존재 또는 부재를 결정하는 단계. - 제16항 내지 제18항 중 어느 한 항에 있어서, 상기 결정 및/또는 분리 단계가 친화성 크로마토그래피, SDS-PAGE, HPLC, 렉틴 블롯팅, ELISA 또는 질량 분석법에 의해 수행되는 방법.
- 제16항 내지 제19항 중 어느 한 항에 있어서, 다음을 포함하는 완충액으로 제12항 내지 제15항 중 어느 한 항의 폴리펩티드로부터 결합된 물질을 용리하는 단계를 추가로 포함하는 방법:
(a) 고 몰 농도의 우레아;
(b) 고농도의 세제; 또는
(c) 제1항 내지 제5항 중 어느 한 항에 따른 폴리펩티드.
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB1708471.6 | 2017-05-26 | ||
GBGB1708476.5A GB201708476D0 (en) | 2017-05-26 | 2017-05-26 | Tools for glycan analysis |
GB1708476.5 | 2017-05-26 | ||
GBGB1708471.6A GB201708471D0 (en) | 2017-05-26 | 2017-05-26 | Polypeptide |
GB1806655.5 | 2018-04-24 | ||
GBGB1806655.5A GB201806655D0 (en) | 2018-04-24 | 2018-04-24 | Polypeptide |
PCT/EP2018/063832 WO2018215656A1 (en) | 2017-05-26 | 2018-05-25 | Protease and binding polypeptide for o-glycoproteins |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20200010322A true KR20200010322A (ko) | 2020-01-30 |
KR102609790B1 KR102609790B1 (ko) | 2023-12-04 |
Family
ID=62492612
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020197036837A KR102609790B1 (ko) | 2017-05-26 | 2018-05-25 | O-당단백질에 대한 프로테아제 및 결합 폴리펩티드 |
KR1020197036845A KR102608876B1 (ko) | 2017-05-26 | 2018-05-25 | 글리칸 분석을 위한 효소 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020197036845A KR102608876B1 (ko) | 2017-05-26 | 2018-05-25 | 글리칸 분석을 위한 효소 |
Country Status (13)
Country | Link |
---|---|
US (3) | US11584922B2 (ko) |
EP (2) | EP3630967B8 (ko) |
JP (3) | JP7195008B2 (ko) |
KR (2) | KR102609790B1 (ko) |
CN (2) | CN111183220B (ko) |
AU (2) | AU2018272400B2 (ko) |
CA (2) | CA3063828A1 (ko) |
DK (2) | DK3630967T3 (ko) |
FI (2) | FI3630968T3 (ko) |
IL (2) | IL270949A (ko) |
PL (1) | PL3630968T3 (ko) |
PT (2) | PT3630968T (ko) |
WO (2) | WO2018215656A1 (ko) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7195008B2 (ja) * | 2017-05-26 | 2022-12-23 | ジェノビス エービー | グリカン分析のための酵素 |
CN112795583A (zh) * | 2020-11-16 | 2021-05-14 | 上海大学 | 重组唾液酸外切酶的制备方法、表达基因、重组表达载体及构建方法 |
EP4448782A1 (en) * | 2021-12-15 | 2024-10-23 | Danisco US Inc. | Compositions and methods involving proteases specific for mannose-modified proteins |
WO2024118481A1 (en) * | 2022-11-28 | 2024-06-06 | Amgen Inc. | Method of processing etanercept |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6720165B2 (en) | 2001-06-14 | 2004-04-13 | Zyomix, Inc. | Methods for making antibody fragments and compositions resulting therefrom |
US7807174B2 (en) * | 2002-11-22 | 2010-10-05 | Nexbio, Inc. | Class of therapeutic protein based molecules |
GB0624874D0 (en) | 2006-12-13 | 2007-01-24 | Hansa Medical Ab | Treatment |
WO2009129086A2 (en) | 2008-04-18 | 2009-10-22 | New England Biolabs, Inc. | Endoglycosidases that cleave o-linked glycans |
EP2166085A1 (en) | 2008-07-16 | 2010-03-24 | Suomen Punainen Risti Veripalvelu | Divalent modified cells |
US8603792B2 (en) * | 2009-03-27 | 2013-12-10 | Life Technologies Corporation | Conjugates of biomolecules to nanoparticles |
GB201115841D0 (en) | 2011-09-13 | 2011-10-26 | Genovis Ab | Protein and method |
GB201316744D0 (en) | 2013-09-20 | 2013-11-06 | Genovis Ab | Method |
US10080787B2 (en) | 2014-07-02 | 2018-09-25 | New England Biolabs, Inc. | Universal N-glycan binding reagent |
WO2017052433A1 (en) | 2015-09-24 | 2017-03-30 | Saab Ab | A modular fluid actuator system |
KR102704583B1 (ko) | 2016-02-04 | 2024-09-06 | 게노비스 에이비 | 신규한 스트렙토코커스 프로테아제 |
JP7195008B2 (ja) * | 2017-05-26 | 2022-12-23 | ジェノビス エービー | グリカン分析のための酵素 |
-
2018
- 2018-05-25 JP JP2019565188A patent/JP7195008B2/ja active Active
- 2018-05-25 DK DK18728576.2T patent/DK3630967T3/da active
- 2018-05-25 FI FIEP18728577.0T patent/FI3630968T3/fi active
- 2018-05-25 CN CN201880050240.9A patent/CN111183220B/zh active Active
- 2018-05-25 US US16/616,827 patent/US11584922B2/en active Active
- 2018-05-25 AU AU2018272400A patent/AU2018272400B2/en active Active
- 2018-05-25 AU AU2018272984A patent/AU2018272984B2/en active Active
- 2018-05-25 KR KR1020197036837A patent/KR102609790B1/ko active IP Right Grant
- 2018-05-25 PL PL18728577.0T patent/PL3630968T3/pl unknown
- 2018-05-25 WO PCT/EP2018/063832 patent/WO2018215656A1/en unknown
- 2018-05-25 JP JP2019565178A patent/JP2020521460A/ja active Pending
- 2018-05-25 CN CN201880050251.7A patent/CN111183221B/zh active Active
- 2018-05-25 PT PT187285770T patent/PT3630968T/pt unknown
- 2018-05-25 EP EP18728576.2A patent/EP3630967B8/en active Active
- 2018-05-25 CA CA3063828A patent/CA3063828A1/en active Pending
- 2018-05-25 KR KR1020197036845A patent/KR102608876B1/ko active IP Right Grant
- 2018-05-25 PT PT187285762T patent/PT3630967T/pt unknown
- 2018-05-25 US US16/616,872 patent/US20200087643A1/en active Pending
- 2018-05-25 WO PCT/EP2018/063833 patent/WO2018215657A1/en unknown
- 2018-05-25 DK DK18728577.0T patent/DK3630968T3/da active
- 2018-05-25 EP EP18728577.0A patent/EP3630968B8/en active Active
- 2018-05-25 FI FIEP18728576.2T patent/FI3630967T3/fi active
- 2018-05-25 CA CA3063815A patent/CA3063815A1/en active Pending
-
2019
- 2019-11-26 IL IL270949A patent/IL270949A/en unknown
- 2019-11-26 IL IL270950A patent/IL270950A/en unknown
-
2022
- 2022-12-22 US US18/145,807 patent/US20230212543A1/en active Pending
-
2023
- 2023-04-13 JP JP2023065981A patent/JP7557896B2/ja active Active
Non-Patent Citations (2)
Title |
---|
JOURNAL OF VISUALIZED EXPERIMENTS, no. 58, p1-5(2011-12-26)* * |
NCBI Reference Sequence WP_012420160.1, ‘hypothetical protein [Akkermansia muciniphila]’, 2013.07.12.* * |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7557896B2 (ja) | O-糖タンパク質のためのプロテアーゼ及び結合ポリペプチド | |
CA2848230C (en) | Endoglycosidase from streptococcus pyogenes and methods using it | |
Kollmann et al. | Identification of novel lysosomal matrix proteins by proteome analysis | |
EP4219705A1 (en) | Method for producing a recombinant factor c, method for mitigating reaction inhibition in endotoxin assays, and method for measuring endotoxin | |
Dahl et al. | Carica papaya glutamine cyclotransferase belongs to a novel plant enzyme subfamily: cloning and characterization of the recombinant enzyme | |
Strydom et al. | An Angiogenic Protein from Bovine Serum and Milk—Purification and Primary Structure of Angiogenin‐2 | |
WO2002056025A2 (en) | Methods for systematic identification of protein - protein interactions | |
WO2008002157A1 (en) | Apyrases and uses thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |