KR20240010007A - 나노기공 프로테오믹스 - Google Patents
나노기공 프로테오믹스 Download PDFInfo
- Publication number
- KR20240010007A KR20240010007A KR1020237043541A KR20237043541A KR20240010007A KR 20240010007 A KR20240010007 A KR 20240010007A KR 1020237043541 A KR1020237043541 A KR 1020237043541A KR 20237043541 A KR20237043541 A KR 20237043541A KR 20240010007 A KR20240010007 A KR 20240010007A
- Authority
- KR
- South Korea
- Prior art keywords
- gly
- ala
- leu
- ser
- val
- Prior art date
Links
- 101000777504 Actinia fragacea DELTA-actitoxin-Afr1a Proteins 0.000 claims abstract description 68
- 150000001413 amino acids Chemical class 0.000 claims abstract description 46
- 239000012634 fragment Substances 0.000 claims abstract description 30
- 238000006467 substitution reaction Methods 0.000 claims abstract description 24
- 101000606032 Pomacea maculata Perivitellin-2 31 kDa subunit Proteins 0.000 claims abstract description 19
- 101000606027 Pomacea maculata Perivitellin-2 67 kDa subunit Proteins 0.000 claims abstract description 19
- 229920001222 biopolymer Polymers 0.000 claims abstract description 9
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 240
- 239000011148 porous material Substances 0.000 claims description 167
- 230000035772 mutation Effects 0.000 claims description 108
- 108090000623 proteins and genes Proteins 0.000 claims description 108
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 105
- 102000004169 proteins and genes Human genes 0.000 claims description 105
- 239000012491 analyte Substances 0.000 claims description 99
- 125000003118 aryl group Chemical group 0.000 claims description 76
- 238000000034 method Methods 0.000 claims description 75
- 238000001514 detection method Methods 0.000 claims description 60
- 238000004458 analytical method Methods 0.000 claims description 53
- 239000012528 membrane Substances 0.000 claims description 51
- 230000002378 acidificating effect Effects 0.000 claims description 42
- 230000001965 increasing effect Effects 0.000 claims description 37
- -1 HmgIII Proteins 0.000 claims description 33
- 239000000178 monomer Substances 0.000 claims description 29
- 230000001747 exhibiting effect Effects 0.000 claims description 28
- 108010033276 Peptide Fragments Proteins 0.000 claims description 18
- 102000007079 Peptide Fragments Human genes 0.000 claims description 18
- 238000003556 assay Methods 0.000 claims description 12
- 239000002502 liposome Substances 0.000 claims description 12
- 229920001184 polypeptide Polymers 0.000 claims description 11
- 102000004190 Enzymes Human genes 0.000 claims description 10
- 108090000790 Enzymes Proteins 0.000 claims description 10
- 230000005945 translocation Effects 0.000 claims description 10
- 108091005804 Peptidases Proteins 0.000 claims description 9
- 239000004365 Protease Substances 0.000 claims description 9
- 101000777484 Actinia fragacea DELTA-actitoxin-Afr1c Proteins 0.000 claims description 8
- 101000777500 Actinia fragacea DELTA-actitoxin-Afr1e Proteins 0.000 claims description 8
- 239000000463 material Substances 0.000 claims description 8
- 238000012163 sequencing technique Methods 0.000 claims description 8
- 239000004094 surface-active agent Substances 0.000 claims description 8
- 101000777489 Actinia equina DELTA-actitoxin-Aeq1b Proteins 0.000 claims description 6
- 101000777491 Actinia equina DELTA-actitoxin-Aeq1c Proteins 0.000 claims description 6
- 101000777487 Actinia fragacea DELTA-actitoxin-Afr1b Proteins 0.000 claims description 6
- 101000856324 Anemonia viridis U-actitoxin-Avd12a Proteins 0.000 claims description 6
- 238000007080 aromatic substitution reaction Methods 0.000 claims description 6
- 239000012530 fluid Substances 0.000 claims description 6
- 230000005684 electric field Effects 0.000 claims description 5
- 230000002209 hydrophobic effect Effects 0.000 claims description 5
- 230000026731 phosphorylation Effects 0.000 claims description 5
- 238000006366 phosphorylation reaction Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 5
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 claims description 4
- 101000720083 Actinia equina DELTA-actitoxin-Aeq1a Proteins 0.000 claims description 4
- 101000777502 Actinia fragacea DELTA-actitoxin-Afr1d Proteins 0.000 claims description 4
- 101100291031 Caenorhabditis elegans gly-13 gene Proteins 0.000 claims description 4
- 101000777490 Heteractis magnifica DELTA-stichotoxin-Hmg2a Proteins 0.000 claims description 4
- 244000184734 Pyrus japonica Species 0.000 claims description 4
- 101000720078 Sagartia rosea DELTA-sagatoxin-Srs1a Proteins 0.000 claims description 4
- 230000013595 glycosylation Effects 0.000 claims description 4
- 238000006206 glycosylation reaction Methods 0.000 claims description 4
- 230000004481 post-translational protein modification Effects 0.000 claims description 4
- 101000720019 Actineria villosa DELTA-thalatoxin-Avl1a Proteins 0.000 claims description 3
- 101000834293 Heteractis crispa DELTA-stichotoxin-Hcr4b Proteins 0.000 claims description 3
- 102000015636 Oligopeptides Human genes 0.000 claims description 3
- 108010038807 Oligopeptides Proteins 0.000 claims description 3
- 101000720077 Phyllodiscus semoni DELTA-alicitoxin-Pse1a Proteins 0.000 claims description 3
- 125000000539 amino acid group Chemical group 0.000 claims description 3
- 102220104762 rs763302555 Human genes 0.000 claims description 3
- 101000654311 Androctonus australis Alpha-mammal toxin AaH2 Proteins 0.000 claims description 2
- 101000583076 Anemonia sulcata Delta-actitoxin-Avd1c Proteins 0.000 claims description 2
- 101000761697 Hemachatus haemachatus Short neurotoxin 1 Proteins 0.000 claims description 2
- 101000588937 Heteractis magnifica Delta-stichotoxin-Rpa1a Proteins 0.000 claims description 2
- 101000800755 Naja oxiana Alpha-elapitoxin-Nno2a Proteins 0.000 claims description 2
- 101000640206 Tityus serrulatus Alpha-mammal toxin Ts2 Proteins 0.000 claims description 2
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 claims 2
- 101000777492 Stichodactyla helianthus DELTA-stichotoxin-She4b Proteins 0.000 claims 2
- 229910052698 phosphorus Inorganic materials 0.000 claims 2
- 239000011574 phosphorus Substances 0.000 claims 2
- 101000720020 Anthopleura asiatica DELTA-actitoxin-Aas1a Proteins 0.000 claims 1
- 101100002951 Caenorhabditis elegans asp-17 gene Proteins 0.000 claims 1
- 101100285688 Caenorhabditis elegans hrg-7 gene Proteins 0.000 claims 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 claims 1
- 150000001875 compounds Chemical class 0.000 abstract description 3
- 235000018102 proteins Nutrition 0.000 description 98
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 67
- WCUXLLCKKVVCTQ-UHFFFAOYSA-M Potassium chloride Chemical compound [Cl-].[K+] WCUXLLCKKVVCTQ-UHFFFAOYSA-M 0.000 description 66
- 235000001014 amino acid Nutrition 0.000 description 65
- 239000000203 mixture Substances 0.000 description 61
- 229940024606 amino acid Drugs 0.000 description 57
- 102000016943 Muramidase Human genes 0.000 description 49
- 108010014251 Muramidase Proteins 0.000 description 49
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 49
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 49
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 47
- 229960000274 lysozyme Drugs 0.000 description 47
- 239000004325 lysozyme Substances 0.000 description 47
- 235000010335 lysozyme Nutrition 0.000 description 47
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 45
- 238000001228 spectrum Methods 0.000 description 44
- 238000005259 measurement Methods 0.000 description 37
- 108010050848 glycylleucine Proteins 0.000 description 36
- 108090000631 Trypsin Proteins 0.000 description 32
- 102000004142 Trypsin Human genes 0.000 description 32
- 239000001103 potassium chloride Substances 0.000 description 32
- 235000011164 potassium chloride Nutrition 0.000 description 32
- 239000012588 trypsin Substances 0.000 description 32
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 31
- 230000000903 blocking effect Effects 0.000 description 30
- 230000000875 corresponding effect Effects 0.000 description 30
- 210000004027 cell Anatomy 0.000 description 29
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 29
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 28
- 150000002500 ions Chemical class 0.000 description 27
- 239000000523 sample Substances 0.000 description 25
- 239000007983 Tris buffer Substances 0.000 description 24
- 108010014387 aerolysin Proteins 0.000 description 23
- 108091006146 Channels Proteins 0.000 description 22
- 239000011780 sodium chloride Substances 0.000 description 22
- 241000880493 Leptailurus serval Species 0.000 description 21
- OFBQJSOFQDEBGM-UHFFFAOYSA-N Pentane Chemical compound CCCCC OFBQJSOFQDEBGM-UHFFFAOYSA-N 0.000 description 21
- 230000029087 digestion Effects 0.000 description 20
- 108010062796 arginyllysine Proteins 0.000 description 19
- HHKZCCWKTZRCCL-UHFFFAOYSA-N bis-tris propane Chemical compound OCC(CO)(CO)NCCCNC(CO)(CO)CO HHKZCCWKTZRCCL-UHFFFAOYSA-N 0.000 description 18
- 239000007989 BIS-Tris Propane buffer Substances 0.000 description 17
- 238000005070 sampling Methods 0.000 description 17
- 239000000126 substance Substances 0.000 description 17
- 238000002474 experimental method Methods 0.000 description 16
- 239000000243 solution Substances 0.000 description 16
- 108010047857 aspartylglycine Proteins 0.000 description 15
- LLZXNUUIBOALNY-QWRGUYRKSA-N Gly-Leu-Lys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN LLZXNUUIBOALNY-QWRGUYRKSA-N 0.000 description 14
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 14
- UCDHVOALNXENLC-KBPBESRZSA-N Leu-Gly-Tyr Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UCDHVOALNXENLC-KBPBESRZSA-N 0.000 description 14
- 101710174798 Lysenin Proteins 0.000 description 14
- 150000003839 salts Chemical class 0.000 description 14
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 13
- PTRKPHUGYULXPU-KKUMJFAQSA-N Leu-Phe-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O PTRKPHUGYULXPU-KKUMJFAQSA-N 0.000 description 13
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 13
- 102100028467 Perforin-1 Human genes 0.000 description 13
- YCQXZDHDSUHUSG-FJHTZYQYSA-N Trp-Thr-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 YCQXZDHDSUHUSG-FJHTZYQYSA-N 0.000 description 13
- 239000000872 buffer Substances 0.000 description 13
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 12
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 12
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 12
- ODRREERHVHMIPT-OEAJRASXSA-N Leu-Thr-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ODRREERHVHMIPT-OEAJRASXSA-N 0.000 description 12
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 12
- SOAUMCDLIUGXJJ-SRVKXCTJSA-N Tyr-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O SOAUMCDLIUGXJJ-SRVKXCTJSA-N 0.000 description 12
- 108010047495 alanylglycine Proteins 0.000 description 12
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 12
- UBKOVSLDWIHYSY-ACZMJKKPSA-N Asn-Glu-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UBKOVSLDWIHYSY-ACZMJKKPSA-N 0.000 description 11
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 11
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 11
- 108010056995 Perforin Proteins 0.000 description 11
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 11
- 241000191967 Staphylococcus aureus Species 0.000 description 11
- XXROXFHCMVXETG-UWVGGRQHSA-N Val-Gly-Val Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXROXFHCMVXETG-UWVGGRQHSA-N 0.000 description 11
- VXDSPJJQUQDCKH-UKJIMTQDSA-N Val-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N VXDSPJJQUQDCKH-UKJIMTQDSA-N 0.000 description 11
- 108010077245 asparaginyl-proline Proteins 0.000 description 11
- 238000012512 characterization method Methods 0.000 description 11
- 230000004907 flux Effects 0.000 description 11
- 108010015792 glycyllysine Proteins 0.000 description 11
- 108010017391 lysylvaline Proteins 0.000 description 11
- 239000003053 toxin Substances 0.000 description 11
- WIGDGIGALMYEBW-LLINQDLYSA-N 2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]propanoyl]amino]-3-hydroxypropanoyl]amino]-4-methylpentanoyl]amino]acetic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIGDGIGALMYEBW-LLINQDLYSA-N 0.000 description 10
- LYILPUNCKACNGF-NAKRPEOUSA-N Ala-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)N LYILPUNCKACNGF-NAKRPEOUSA-N 0.000 description 10
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 10
- NJLLRXWFPQQPHV-SRVKXCTJSA-N Asp-Tyr-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O NJLLRXWFPQQPHV-SRVKXCTJSA-N 0.000 description 10
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 10
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 10
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 10
- WXEQUSQNDDJEDZ-NYVOZVTQSA-N Trp-Trp-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)N[C@@H](CC(=O)N)C(=O)O)N WXEQUSQNDDJEDZ-NYVOZVTQSA-N 0.000 description 10
- 229940098773 bovine serum albumin Drugs 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 10
- 108010082683 kemptide Proteins 0.000 description 10
- 150000002632 lipids Chemical class 0.000 description 10
- 231100000765 toxin Toxicity 0.000 description 10
- 108700012359 toxins Proteins 0.000 description 10
- 241000242760 Actinia equina Species 0.000 description 9
- 108020004414 DNA Proteins 0.000 description 9
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 9
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 9
- 239000000232 Lipid Bilayer Substances 0.000 description 9
- 101001018085 Lysobacter enzymogenes Lysyl endopeptidase Proteins 0.000 description 9
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 9
- JEGFCFLCRSJCMA-IHRRRGAJSA-N Phe-Arg-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N JEGFCFLCRSJCMA-IHRRRGAJSA-N 0.000 description 9
- GMXIJHCBTZDAPD-QPHKQPEJSA-N Thr-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N GMXIJHCBTZDAPD-QPHKQPEJSA-N 0.000 description 9
- 108010022394 Threonine synthase Proteins 0.000 description 9
- 238000005119 centrifugation Methods 0.000 description 9
- 102000004419 dihydrofolate reductase Human genes 0.000 description 9
- NLEBIOOXCVAHBD-QKMCSOCLSA-N dodecyl beta-D-maltoside Chemical compound O[C@@H]1[C@@H](O)[C@H](OCCCCCCCCCCCC)O[C@H](CO)[C@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 NLEBIOOXCVAHBD-QKMCSOCLSA-N 0.000 description 9
- 238000005370 electroosmosis Methods 0.000 description 9
- 229940088598 enzyme Drugs 0.000 description 9
- KWGKDLIKAYFUFQ-UHFFFAOYSA-M lithium chloride Chemical compound [Li+].[Cl-] KWGKDLIKAYFUFQ-UHFFFAOYSA-M 0.000 description 9
- 230000014759 maintenance of location Effects 0.000 description 9
- 238000004949 mass spectrometry Methods 0.000 description 9
- 239000002609 medium Substances 0.000 description 9
- 101710092462 Alpha-hemolysin Proteins 0.000 description 8
- AQLHORCVPGXDJW-IUCAKERBSA-N Gly-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN AQLHORCVPGXDJW-IUCAKERBSA-N 0.000 description 8
- RIUZKUJUPVFAGY-HOTGVXAUSA-N Gly-Trp-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)NC(=O)CN RIUZKUJUPVFAGY-HOTGVXAUSA-N 0.000 description 8
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 8
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 8
- VUBIPAHVHMZHCM-KKUMJFAQSA-N Leu-Tyr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 VUBIPAHVHMZHCM-KKUMJFAQSA-N 0.000 description 8
- XTSBLBXAUIBMLW-KKUMJFAQSA-N Met-Tyr-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N XTSBLBXAUIBMLW-KKUMJFAQSA-N 0.000 description 8
- 102000035195 Peptidases Human genes 0.000 description 8
- MFQXSDWKUXTOPZ-DZKIICNBSA-N Phe-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N MFQXSDWKUXTOPZ-DZKIICNBSA-N 0.000 description 8
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 8
- 239000004809 Teflon Substances 0.000 description 8
- 229920006362 Teflon® Polymers 0.000 description 8
- 108010064997 VPY tripeptide Proteins 0.000 description 8
- 229960000723 ampicillin Drugs 0.000 description 8
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 8
- 108010068265 aspartyltyrosine Proteins 0.000 description 8
- 239000011324 bead Substances 0.000 description 8
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 8
- 108010081551 glycylphenylalanine Proteins 0.000 description 8
- PGLTVOMIXTUURA-UHFFFAOYSA-N iodoacetamide Chemical compound NC(=O)CI PGLTVOMIXTUURA-UHFFFAOYSA-N 0.000 description 8
- 108010064235 lysylglycine Proteins 0.000 description 8
- 230000004048 modification Effects 0.000 description 8
- 238000012986 modification Methods 0.000 description 8
- 238000002703 mutagenesis Methods 0.000 description 8
- 231100000350 mutagenesis Toxicity 0.000 description 8
- 230000007935 neutral effect Effects 0.000 description 8
- 229960005190 phenylalanine Drugs 0.000 description 8
- 229920000410 poly[9,9-bis((6'-N,N,N-trimethylammonium)hexyl)fluorenylene phenylene dibromide] polymer Polymers 0.000 description 8
- 108010061238 threonyl-glycine Proteins 0.000 description 8
- 108010073969 valyllysine Proteins 0.000 description 8
- GJLXVWOMRRWCIB-MERZOTPQSA-N (2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-acetamido-5-(diaminomethylideneamino)pentanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanamide Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=C(O)C=C1 GJLXVWOMRRWCIB-MERZOTPQSA-N 0.000 description 7
- 241000915772 Actinia fragacea Species 0.000 description 7
- 241001270131 Agaricus moelleri Species 0.000 description 7
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 7
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 7
- HAVKMRGWNXMCDR-STQMWFEESA-N Arg-Gly-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HAVKMRGWNXMCDR-STQMWFEESA-N 0.000 description 7
- KZYSHAMXEBPJBD-JRQIVUDYSA-N Asn-Thr-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KZYSHAMXEBPJBD-JRQIVUDYSA-N 0.000 description 7
- CBHVAFXKOYAHOY-NHCYSSNCSA-N Asn-Val-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O CBHVAFXKOYAHOY-NHCYSSNCSA-N 0.000 description 7
- ZELQAFZSJOBEQS-ACZMJKKPSA-N Asp-Asn-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZELQAFZSJOBEQS-ACZMJKKPSA-N 0.000 description 7
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 7
- AIGROOHQXCACHL-WDSKDSINSA-N Glu-Gly-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O AIGROOHQXCACHL-WDSKDSINSA-N 0.000 description 7
- KFMBRBPXHVMDFN-UWVGGRQHSA-N Gly-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCNC(N)=N KFMBRBPXHVMDFN-UWVGGRQHSA-N 0.000 description 7
- MKWSZEHGHSLNPF-NAKRPEOUSA-N Ile-Ala-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O)N MKWSZEHGHSLNPF-NAKRPEOUSA-N 0.000 description 7
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 7
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 7
- SUPVSFFZWVOEOI-CQDKDKBSSA-N Leu-Ala-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-CQDKDKBSSA-N 0.000 description 7
- SUPVSFFZWVOEOI-UHFFFAOYSA-N Leu-Ala-Tyr Natural products CC(C)CC(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-UHFFFAOYSA-N 0.000 description 7
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 7
- URLZCHNOLZSCCA-VABKMULXSA-N Leu-enkephalin Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)CNC(=O)CNC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=CC=C1 URLZCHNOLZSCCA-VABKMULXSA-N 0.000 description 7
- VHTOGMKQXXJOHG-RHYQMDGZSA-N Lys-Thr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O VHTOGMKQXXJOHG-RHYQMDGZSA-N 0.000 description 7
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 7
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 7
- AYHSJESDFKREAR-KKUMJFAQSA-N Tyr-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AYHSJESDFKREAR-KKUMJFAQSA-N 0.000 description 7
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 7
- QWCZXKIFPWPQHR-JYJNAYRXSA-N Val-Pro-Tyr Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QWCZXKIFPWPQHR-JYJNAYRXSA-N 0.000 description 7
- SYELZBGXAIXKHU-UHFFFAOYSA-N dodecyldimethylamine N-oxide Chemical compound CCCCCCCCCCCC[N+](C)(C)[O-] SYELZBGXAIXKHU-UHFFFAOYSA-N 0.000 description 7
- 230000007831 electrophysiology Effects 0.000 description 7
- 238000002001 electrophysiology Methods 0.000 description 7
- 108010078144 glutaminyl-glycine Proteins 0.000 description 7
- 108010084389 glycyltryptophan Proteins 0.000 description 7
- 108010037850 glycylvaline Proteins 0.000 description 7
- DCAYPVUWAIABOU-UHFFFAOYSA-N hexadecane Chemical compound CCCCCCCCCCCCCCCC DCAYPVUWAIABOU-UHFFFAOYSA-N 0.000 description 7
- 108010034529 leucyl-lysine Proteins 0.000 description 7
- 108010057821 leucylproline Proteins 0.000 description 7
- 235000018977 lysine Nutrition 0.000 description 7
- 239000008188 pellet Substances 0.000 description 7
- 108010071207 serylmethionine Proteins 0.000 description 7
- 230000003595 spectral effect Effects 0.000 description 7
- 239000006228 supernatant Substances 0.000 description 7
- 108010003137 tyrosyltyrosine Proteins 0.000 description 7
- ZHUJMSMQIPIPTF-IBURTVSXSA-N (2r)-2-[[(2s)-2-[[2-[[(2r)-2-[[(2s)-2-amino-3-(4-hydroxyphenyl)propanoyl]amino]propanoyl]amino]acetyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoic acid Chemical compound C([C@@H](C(=O)N[C@H](CC(C)C)C(O)=O)NC(=O)CNC(=O)[C@@H](C)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=CC=C1 ZHUJMSMQIPIPTF-IBURTVSXSA-N 0.000 description 6
- UCHGVQMTIJAUOM-RSGBUPOYSA-N (2s)-2-[[(2s)-1-[(2s)-2-[[(2s,3s)-2-[[(2s)-2-amino-3-(4-hydroxyphenyl)propanoyl]amino]-3-methylpentanoyl]amino]-3-(1h-imidazol-5-yl)propanoyl]pyrrolidine-2-carbonyl]amino]-3-phenylpropanoic acid Chemical compound C([C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 UCHGVQMTIJAUOM-RSGBUPOYSA-N 0.000 description 6
- UKDDQGWMHWQMBI-UHFFFAOYSA-O 1,2-diphytanoyl-sn-glycero-3-phosphocholine Chemical compound CC(C)CCCC(C)CCCC(C)CCCC(C)CC(=O)OCC(COP(O)(=O)OCC[N+](C)(C)C)OC(=O)CC(C)CCCC(C)CCCC(C)CCCC(C)C UKDDQGWMHWQMBI-UHFFFAOYSA-O 0.000 description 6
- MCKSLROAGSDNFC-ACZMJKKPSA-N Ala-Asp-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MCKSLROAGSDNFC-ACZMJKKPSA-N 0.000 description 6
- CFPQUJZTLUQUTJ-HTFCKZLJSA-N Ala-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](C)N CFPQUJZTLUQUTJ-HTFCKZLJSA-N 0.000 description 6
- BNYNOWJESJJIOI-XUXIUFHCSA-N Arg-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N BNYNOWJESJJIOI-XUXIUFHCSA-N 0.000 description 6
- GURLOFOJBHRPJN-AAEUAGOBSA-N Asn-Gly-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N GURLOFOJBHRPJN-AAEUAGOBSA-N 0.000 description 6
- GWTLRDMPMJCNMH-WHFBIAKZSA-N Asp-Asn-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GWTLRDMPMJCNMH-WHFBIAKZSA-N 0.000 description 6
- DTNUIAJCPRMNBT-WHFBIAKZSA-N Asp-Gly-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O DTNUIAJCPRMNBT-WHFBIAKZSA-N 0.000 description 6
- JJQGZGOEDSSHTE-FOHZUACHSA-N Asp-Thr-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JJQGZGOEDSSHTE-FOHZUACHSA-N 0.000 description 6
- 102100021277 Beta-secretase 2 Human genes 0.000 description 6
- 241001158289 Cribrinopsis japonica Species 0.000 description 6
- HLRLXVPRJJITSK-IFFSRLJSSA-N Gln-Thr-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HLRLXVPRJJITSK-IFFSRLJSSA-N 0.000 description 6
- BKRQSECBKKCCKW-HVTMNAMFSA-N Glu-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N BKRQSECBKKCCKW-HVTMNAMFSA-N 0.000 description 6
- JBRBACJPBZNFMF-YUMQZZPRSA-N Gly-Ala-Lys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN JBRBACJPBZNFMF-YUMQZZPRSA-N 0.000 description 6
- XQHSBNVACKQWAV-WHFBIAKZSA-N Gly-Asp-Asn Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XQHSBNVACKQWAV-WHFBIAKZSA-N 0.000 description 6
- FFALDIDGPLUDKV-ZDLURKLDSA-N Gly-Thr-Ser Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O FFALDIDGPLUDKV-ZDLURKLDSA-N 0.000 description 6
- HQSKKSLNLSTONK-JTQLQIEISA-N Gly-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 HQSKKSLNLSTONK-JTQLQIEISA-N 0.000 description 6
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 6
- 241000746758 Heteractis crispa Species 0.000 description 6
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical group OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 6
- 125000000510 L-tryptophano group Chemical group [H]C1=C([H])C([H])=C2N([H])C([H])=C(C([H])([H])[C@@]([H])(C(O[H])=O)N([H])[*])C2=C1[H] 0.000 description 6
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 6
- MUCIDQMDOYQYBR-IHRRRGAJSA-N Leu-Pro-His Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N MUCIDQMDOYQYBR-IHRRRGAJSA-N 0.000 description 6
- WUHBLPVELFTPQK-KKUMJFAQSA-N Leu-Tyr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O WUHBLPVELFTPQK-KKUMJFAQSA-N 0.000 description 6
- 108010022337 Leucine Enkephalin Proteins 0.000 description 6
- PRSBSVAVOQOAMI-BJDJZHNGSA-N Lys-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN PRSBSVAVOQOAMI-BJDJZHNGSA-N 0.000 description 6
- 239000004472 Lysine Substances 0.000 description 6
- GWADARYJIJDYRC-XGEHTFHBSA-N Met-Thr-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GWADARYJIJDYRC-XGEHTFHBSA-N 0.000 description 6
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 6
- 108010079364 N-glycylalanine Proteins 0.000 description 6
- QUGRFWPMPVIAPW-IHRRRGAJSA-N Ser-Pro-Phe Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QUGRFWPMPVIAPW-IHRRRGAJSA-N 0.000 description 6
- ANOQEBQWIAYIMV-AEJSXWLSSA-N Ser-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ANOQEBQWIAYIMV-AEJSXWLSSA-N 0.000 description 6
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 6
- ZPFLBLFITJCBTP-QWRGUYRKSA-N Tyr-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O ZPFLBLFITJCBTP-QWRGUYRKSA-N 0.000 description 6
- 108010045350 alanyl-tyrosyl-alanine Proteins 0.000 description 6
- 108010044940 alanylglutamine Proteins 0.000 description 6
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 6
- 108010091092 arginyl-glycyl-proline Proteins 0.000 description 6
- 108010092854 aspartyllysine Proteins 0.000 description 6
- 235000018417 cysteine Nutrition 0.000 description 6
- 238000009826 distribution Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 239000008103 glucose Substances 0.000 description 6
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 6
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 6
- 150000004676 glycans Chemical class 0.000 description 6
- 108010089804 glycyl-threonine Proteins 0.000 description 6
- 108010087823 glycyltyrosine Proteins 0.000 description 6
- 125000003588 lysine group Chemical class [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 6
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 6
- 108010012581 phenylalanylglutamate Proteins 0.000 description 6
- 239000013612 plasmid Substances 0.000 description 6
- 238000000746 purification Methods 0.000 description 6
- 108010045269 tryptophyltryptophan Proteins 0.000 description 6
- 239000013598 vector Substances 0.000 description 6
- 239000011534 wash buffer Substances 0.000 description 6
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 5
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 5
- 101800000734 Angiotensin-1 Proteins 0.000 description 5
- AKEBUSZTMQLNIX-UWJYBYFXSA-N Asn-Ala-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N AKEBUSZTMQLNIX-UWJYBYFXSA-N 0.000 description 5
- BZMWJLLUAKSIMH-FXQIFTODSA-N Asn-Glu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BZMWJLLUAKSIMH-FXQIFTODSA-N 0.000 description 5
- IPAQILGYEQFCFO-NYVOZVTQSA-N Asn-Trp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O)NC(=O)[C@H](CC(=O)N)N IPAQILGYEQFCFO-NYVOZVTQSA-N 0.000 description 5
- QNNBHTFDFFFHGC-KKUMJFAQSA-N Asn-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QNNBHTFDFFFHGC-KKUMJFAQSA-N 0.000 description 5
- UXRVDHVARNBOIO-QSFUFRPTSA-N Asp-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(=O)O)N UXRVDHVARNBOIO-QSFUFRPTSA-N 0.000 description 5
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 5
- 150000008574 D-amino acids Chemical class 0.000 description 5
- 241000588724 Escherichia coli Species 0.000 description 5
- 241000287828 Gallus gallus Species 0.000 description 5
- IOUQWHIEQYQVFD-JYJNAYRXSA-N Glu-Leu-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IOUQWHIEQYQVFD-JYJNAYRXSA-N 0.000 description 5
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 5
- KMSGYZQRXPUKGI-BYPYZUCNSA-N Gly-Gly-Asn Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(N)=O KMSGYZQRXPUKGI-BYPYZUCNSA-N 0.000 description 5
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 5
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 5
- TVTZEOHWHUVYCG-KYNKHSRBSA-N Gly-Thr-Thr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O TVTZEOHWHUVYCG-KYNKHSRBSA-N 0.000 description 5
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 5
- AQCUAZTZSPQJFF-ZKWXMUAHSA-N Ile-Ala-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O AQCUAZTZSPQJFF-ZKWXMUAHSA-N 0.000 description 5
- QICVAHODWHIWIS-HTFCKZLJSA-N Ile-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N QICVAHODWHIWIS-HTFCKZLJSA-N 0.000 description 5
- NZGTYCMLUGYMCV-XUXIUFHCSA-N Ile-Lys-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N NZGTYCMLUGYMCV-XUXIUFHCSA-N 0.000 description 5
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 5
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 5
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 5
- 239000006142 Luria-Bertani Agar Substances 0.000 description 5
- LLSUNJYOSCOOEB-GUBZILKMSA-N Lys-Glu-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O LLSUNJYOSCOOEB-GUBZILKMSA-N 0.000 description 5
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 5
- CAODKDAPYGUMLK-FXQIFTODSA-N Met-Asn-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CAODKDAPYGUMLK-FXQIFTODSA-N 0.000 description 5
- 108010021466 Mutant Proteins Proteins 0.000 description 5
- 102000008300 Mutant Proteins Human genes 0.000 description 5
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 5
- 108010013381 Porins Proteins 0.000 description 5
- 102000017033 Porins Human genes 0.000 description 5
- SXMSEHDMNIUTSP-DCAQKATOSA-N Pro-Lys-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SXMSEHDMNIUTSP-DCAQKATOSA-N 0.000 description 5
- 108010054530 RGDN peptide Proteins 0.000 description 5
- LVVBAKCGXXUHFO-ZLUOBGJFSA-N Ser-Ala-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O LVVBAKCGXXUHFO-ZLUOBGJFSA-N 0.000 description 5
- CTLVSHXLRVEILB-UBHSHLNASA-N Ser-Asn-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N CTLVSHXLRVEILB-UBHSHLNASA-N 0.000 description 5
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 5
- SNVIOQXAHVORQM-WDSKDSINSA-N Ser-Gly-Gln Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O SNVIOQXAHVORQM-WDSKDSINSA-N 0.000 description 5
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 5
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 5
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 5
- YEDSOSIKVUMIJE-DCAQKATOSA-N Ser-Val-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O YEDSOSIKVUMIJE-DCAQKATOSA-N 0.000 description 5
- 241000242730 Stichodactyla helianthus Species 0.000 description 5
- JKGGPMOUIAAJAA-YEPSODPASA-N Thr-Gly-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O JKGGPMOUIAAJAA-YEPSODPASA-N 0.000 description 5
- CDHQEOXPWBDFPL-QWRGUYRKSA-N Tyr-Gly-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDHQEOXPWBDFPL-QWRGUYRKSA-N 0.000 description 5
- LGXUZJIQCGXKGZ-QXEWZRGKSA-N Val-Pro-Asn Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)N)C(=O)O)N LGXUZJIQCGXKGZ-QXEWZRGKSA-N 0.000 description 5
- AJNUKMZFHXUBMK-GUBZILKMSA-N Val-Ser-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N AJNUKMZFHXUBMK-GUBZILKMSA-N 0.000 description 5
- 125000003275 alpha amino acid group Chemical group 0.000 description 5
- ORWYRWWVDCYOMK-HBZPZAIKSA-N angiotensin I Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O)C(C)C)C1=CC=C(O)C=C1 ORWYRWWVDCYOMK-HBZPZAIKSA-N 0.000 description 5
- 108010060559 angiotensin pentapeptide Proteins 0.000 description 5
- 150000001450 anions Chemical class 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 5
- 239000012149 elution buffer Substances 0.000 description 5
- 239000010408 film Substances 0.000 description 5
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 5
- 108010036413 histidylglycine Proteins 0.000 description 5
- 230000003993 interaction Effects 0.000 description 5
- 239000010410 layer Substances 0.000 description 5
- URLZCHNOLZSCCA-UHFFFAOYSA-N leu-enkephalin Chemical compound C=1C=C(O)C=CC=1CC(N)C(=O)NCC(=O)NCC(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 URLZCHNOLZSCCA-UHFFFAOYSA-N 0.000 description 5
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 5
- 108010054155 lysyllysine Proteins 0.000 description 5
- 108010068488 methionylphenylalanine Proteins 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 5
- 108010083979 proaerolysin Proteins 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 108010051110 tyrosyl-lysine Proteins 0.000 description 5
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 4
- ZIBWKCRKNFYTPT-ZKWXMUAHSA-N Ala-Asn-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZIBWKCRKNFYTPT-ZKWXMUAHSA-N 0.000 description 4
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 4
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 4
- AWNAEZICPNGAJK-FXQIFTODSA-N Ala-Met-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O AWNAEZICPNGAJK-FXQIFTODSA-N 0.000 description 4
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 4
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 4
- QRIYOHQJRDHFKF-UWJYBYFXSA-N Ala-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 QRIYOHQJRDHFKF-UWJYBYFXSA-N 0.000 description 4
- XKHLBBQNPSOGPI-GUBZILKMSA-N Ala-Val-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)N XKHLBBQNPSOGPI-GUBZILKMSA-N 0.000 description 4
- 102400000344 Angiotensin-1 Human genes 0.000 description 4
- 101800000738 Angiotensin-3 Proteins 0.000 description 4
- 101800000737 Angiotensin-4 Proteins 0.000 description 4
- 108090001067 Angiotensinogen Proteins 0.000 description 4
- 241000323100 Anthopleura nigrescens Species 0.000 description 4
- HKRXJBBCQBAGIM-FXQIFTODSA-N Arg-Asp-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N HKRXJBBCQBAGIM-FXQIFTODSA-N 0.000 description 4
- DNLQVHBBMPZUGJ-BQBZGAKWSA-N Arg-Ser-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O DNLQVHBBMPZUGJ-BQBZGAKWSA-N 0.000 description 4
- HPBNLFLSSQDFQW-WHFBIAKZSA-N Asn-Ser-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O HPBNLFLSSQDFQW-WHFBIAKZSA-N 0.000 description 4
- JBDLMLZNDRLDIX-HJGDQZAQSA-N Asn-Thr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O JBDLMLZNDRLDIX-HJGDQZAQSA-N 0.000 description 4
- LGCVSPFCFXWUEY-IHPCNDPISA-N Asn-Trp-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N LGCVSPFCFXWUEY-IHPCNDPISA-N 0.000 description 4
- HMQDRBKQMLRCCG-GMOBBJLQSA-N Asp-Arg-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HMQDRBKQMLRCCG-GMOBBJLQSA-N 0.000 description 4
- RSMIHCFQDCVVBR-CIUDSAMLSA-N Asp-Gln-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N RSMIHCFQDCVVBR-CIUDSAMLSA-N 0.000 description 4
- HOBNTSHITVVNBN-ZPFDUUQYSA-N Asp-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N HOBNTSHITVVNBN-ZPFDUUQYSA-N 0.000 description 4
- MYOHQBFRJQFIDZ-KKUMJFAQSA-N Asp-Leu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MYOHQBFRJQFIDZ-KKUMJFAQSA-N 0.000 description 4
- GGBQDSHTXKQSLP-NHCYSSNCSA-N Asp-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N GGBQDSHTXKQSLP-NHCYSSNCSA-N 0.000 description 4
- ZUNMTUPRQMWMHX-LSJOCFKGSA-N Asp-Val-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O ZUNMTUPRQMWMHX-LSJOCFKGSA-N 0.000 description 4
- 101710150190 Beta-secretase 2 Proteins 0.000 description 4
- 108050004280 Epsilon toxin Proteins 0.000 description 4
- WMOMPXKOKASNBK-PEFMBERDSA-N Gln-Asn-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WMOMPXKOKASNBK-PEFMBERDSA-N 0.000 description 4
- VSXBYIJUAXPAAL-WDSKDSINSA-N Gln-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O VSXBYIJUAXPAAL-WDSKDSINSA-N 0.000 description 4
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 4
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 4
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 4
- KXTAGESXNQEZKB-DZKIICNBSA-N Glu-Phe-Val Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 KXTAGESXNQEZKB-DZKIICNBSA-N 0.000 description 4
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 4
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 4
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 4
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 4
- BMWFDYIYBAFROD-WPRPVWTQSA-N Gly-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN BMWFDYIYBAFROD-WPRPVWTQSA-N 0.000 description 4
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 4
- PMMMQRVUMVURGJ-XUXIUFHCSA-N Ile-Leu-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O PMMMQRVUMVURGJ-XUXIUFHCSA-N 0.000 description 4
- JHNJNTMTZHEDLJ-NAKRPEOUSA-N Ile-Ser-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JHNJNTMTZHEDLJ-NAKRPEOUSA-N 0.000 description 4
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 4
- FMEICTQWUKNAGC-YUMQZZPRSA-N Leu-Gly-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O FMEICTQWUKNAGC-YUMQZZPRSA-N 0.000 description 4
- LAPSXOAUPNOINL-YUMQZZPRSA-N Leu-Gly-Asp Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O LAPSXOAUPNOINL-YUMQZZPRSA-N 0.000 description 4
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 4
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 4
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 4
- QONKWXNJRRNTBV-AVGNSLFASA-N Leu-Pro-Met Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)O)N QONKWXNJRRNTBV-AVGNSLFASA-N 0.000 description 4
- UCXQIIIFOOGYEM-ULQDDVLXSA-N Leu-Pro-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UCXQIIIFOOGYEM-ULQDDVLXSA-N 0.000 description 4
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 4
- SLQJJFAVWSZLBL-BJDJZHNGSA-N Lys-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN SLQJJFAVWSZLBL-BJDJZHNGSA-N 0.000 description 4
- YRNRVKTYDSLKMD-KKUMJFAQSA-N Lys-Ser-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YRNRVKTYDSLKMD-KKUMJFAQSA-N 0.000 description 4
- TVHCDSBMFQYPNA-RHYQMDGZSA-N Lys-Thr-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TVHCDSBMFQYPNA-RHYQMDGZSA-N 0.000 description 4
- RDLSEGZJMYGFNS-FXQIFTODSA-N Met-Ser-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RDLSEGZJMYGFNS-FXQIFTODSA-N 0.000 description 4
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 4
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 4
- MVIJMIZJPHQGEN-IHRRRGAJSA-N Phe-Ser-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@H](CO)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 MVIJMIZJPHQGEN-IHRRRGAJSA-N 0.000 description 4
- AWQGDZBKQTYNMN-IHRRRGAJSA-N Pro-Phe-Asp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC(=O)O)C(=O)O AWQGDZBKQTYNMN-IHRRRGAJSA-N 0.000 description 4
- RMJZWERKFFNNNS-XGEHTFHBSA-N Pro-Thr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMJZWERKFFNNNS-XGEHTFHBSA-N 0.000 description 4
- IIRBTQHFVNGPMQ-AVGNSLFASA-N Pro-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 IIRBTQHFVNGPMQ-AVGNSLFASA-N 0.000 description 4
- 108010003201 RGH 0205 Proteins 0.000 description 4
- GXXTUIUYTWGPMV-FXQIFTODSA-N Ser-Arg-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O GXXTUIUYTWGPMV-FXQIFTODSA-N 0.000 description 4
- GZSZPKSBVAOGIE-CIUDSAMLSA-N Ser-Lys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O GZSZPKSBVAOGIE-CIUDSAMLSA-N 0.000 description 4
- FPCGZYMRFFIYIH-CIUDSAMLSA-N Ser-Lys-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O FPCGZYMRFFIYIH-CIUDSAMLSA-N 0.000 description 4
- GXUWHVZYDAHFSV-FLBSBUHZSA-N Thr-Ile-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GXUWHVZYDAHFSV-FLBSBUHZSA-N 0.000 description 4
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 4
- KRDSCBLRHORMRK-JXUBOQSCSA-N Thr-Lys-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O KRDSCBLRHORMRK-JXUBOQSCSA-N 0.000 description 4
- UUSQVWOVUYMLJA-PPCPHDFISA-N Thr-Lys-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UUSQVWOVUYMLJA-PPCPHDFISA-N 0.000 description 4
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 4
- OGPKMBOPMDTEDM-IHRRRGAJSA-N Tyr-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N OGPKMBOPMDTEDM-IHRRRGAJSA-N 0.000 description 4
- IGXLNVIYDYONFB-UFYCRDLUSA-N Tyr-Phe-Arg Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CC=C(O)C=C1 IGXLNVIYDYONFB-UFYCRDLUSA-N 0.000 description 4
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 4
- CPGJELLYDQEDRK-NAKRPEOUSA-N Val-Ile-Ala Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C)C(O)=O CPGJELLYDQEDRK-NAKRPEOUSA-N 0.000 description 4
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 4
- KTEZUXISLQTDDQ-NHCYSSNCSA-N Val-Lys-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KTEZUXISLQTDDQ-NHCYSSNCSA-N 0.000 description 4
- RSGHLMMKXJGCMK-JYJNAYRXSA-N Val-Met-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N RSGHLMMKXJGCMK-JYJNAYRXSA-N 0.000 description 4
- RLVTVHSDKHBFQP-ULQDDVLXSA-N Val-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=C(O)C=C1 RLVTVHSDKHBFQP-ULQDDVLXSA-N 0.000 description 4
- 229930003779 Vitamin B12 Natural products 0.000 description 4
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 4
- 108010087924 alanylproline Proteins 0.000 description 4
- 125000000129 anionic group Chemical group 0.000 description 4
- 108010013835 arginine glutamate Proteins 0.000 description 4
- 108010060035 arginylproline Proteins 0.000 description 4
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 4
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 4
- 210000003050 axon Anatomy 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 4
- 150000001768 cations Chemical class 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- AGVAZMGAQJOSFJ-WZHZPDAFSA-M cobalt(2+);[(2r,3s,4r,5s)-5-(5,6-dimethylbenzimidazol-1-yl)-4-hydroxy-2-(hydroxymethyl)oxolan-3-yl] [(2r)-1-[3-[(1r,2r,3r,4z,7s,9z,12s,13s,14z,17s,18s,19r)-2,13,18-tris(2-amino-2-oxoethyl)-7,12,17-tris(3-amino-3-oxopropyl)-3,5,8,8,13,15,18,19-octamethyl-2 Chemical compound [Co+2].N#[C-].[N-]([C@@H]1[C@H](CC(N)=O)[C@@]2(C)CCC(=O)NC[C@@H](C)OP(O)(=O)O[C@H]3[C@H]([C@H](O[C@@H]3CO)N3C4=CC(C)=C(C)C=C4N=C3)O)\C2=C(C)/C([C@H](C\2(C)C)CCC(N)=O)=N/C/2=C\C([C@H]([C@@]/2(CC(N)=O)C)CCC(N)=O)=N\C\2=C(C)/C2=N[C@]1(C)[C@@](C)(CC(N)=O)[C@@H]2CCC(N)=O AGVAZMGAQJOSFJ-WZHZPDAFSA-M 0.000 description 4
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 4
- 125000000151 cysteine group Chemical class N[C@@H](CS)C(=O)* 0.000 description 4
- 238000004925 denaturation Methods 0.000 description 4
- 230000036425 denaturation Effects 0.000 description 4
- 108010049041 glutamylalanine Proteins 0.000 description 4
- 108010045126 glycyl-tyrosyl-glycine Proteins 0.000 description 4
- 108010059898 glycyl-tyrosyl-lysine Proteins 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 239000012139 lysis buffer Substances 0.000 description 4
- 108010003700 lysyl aspartic acid Proteins 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 239000002243 precursor Substances 0.000 description 4
- 230000013777 protein digestion Effects 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 238000002864 sequence alignment Methods 0.000 description 4
- 150000003384 small molecules Chemical class 0.000 description 4
- 108010038745 tryptophylglycine Proteins 0.000 description 4
- 229960004441 tyrosine Drugs 0.000 description 4
- 235000019163 vitamin B12 Nutrition 0.000 description 4
- 239000011715 vitamin B12 Substances 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- ZHUJMSMQIPIPTF-IMNFJDCFSA-N (2s)-2-[[(2s)-2-[[2-[[(2s)-2-[[(2s)-2-amino-3-(4-hydroxyphenyl)propanoyl]amino]propanoyl]amino]acetyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoic acid Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=CC=C1 ZHUJMSMQIPIPTF-IMNFJDCFSA-N 0.000 description 3
- AMBKWKJGMIHTJR-UHFFFAOYSA-N 2-[2-[2-[(2-azaniumyl-3-methylbutanoyl)amino]propanoylamino]propanoylamino]-3-phenylpropanoate Chemical compound CC(C)C(N)C(=O)NC(C)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=CC=C1 AMBKWKJGMIHTJR-UHFFFAOYSA-N 0.000 description 3
- WGDNWOMKBUXFHR-BQBZGAKWSA-N Ala-Gly-Arg Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N WGDNWOMKBUXFHR-BQBZGAKWSA-N 0.000 description 3
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 3
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 3
- TZDNWXDLYFIFPT-BJDJZHNGSA-N Ala-Ile-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O TZDNWXDLYFIFPT-BJDJZHNGSA-N 0.000 description 3
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 3
- PMQXMXAASGFUDX-SRVKXCTJSA-N Ala-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCCN PMQXMXAASGFUDX-SRVKXCTJSA-N 0.000 description 3
- RAAWHFXHAACDFT-FXQIFTODSA-N Ala-Met-Asn Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CC(N)=O)C(O)=O RAAWHFXHAACDFT-FXQIFTODSA-N 0.000 description 3
- FVNAUOZKIPAYNA-BPNCWPANSA-N Ala-Met-Tyr Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FVNAUOZKIPAYNA-BPNCWPANSA-N 0.000 description 3
- MUGAESARFRGOTQ-IGNZVWTISA-N Ala-Tyr-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N MUGAESARFRGOTQ-IGNZVWTISA-N 0.000 description 3
- QSBGWDDCOJYQGY-KOQODJNWSA-N Angiotensin IV Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)NC(=O)[C@@H](N)C(C)C)C1=CC=C(O)C=C1 QSBGWDDCOJYQGY-KOQODJNWSA-N 0.000 description 3
- 102400000348 Angiotensin-3 Human genes 0.000 description 3
- 102400000349 Angiotensin-4 Human genes 0.000 description 3
- 102000004881 Angiotensinogen Human genes 0.000 description 3
- 241000323096 Anthopleura asiatica Species 0.000 description 3
- AQPVUEJJARLJHB-BQBZGAKWSA-N Arg-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N AQPVUEJJARLJHB-BQBZGAKWSA-N 0.000 description 3
- NYDIVDKTULRINZ-AVGNSLFASA-N Arg-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NYDIVDKTULRINZ-AVGNSLFASA-N 0.000 description 3
- ICRHGPYYXMWHIE-LPEHRKFASA-N Arg-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ICRHGPYYXMWHIE-LPEHRKFASA-N 0.000 description 3
- 239000004475 Arginine Substances 0.000 description 3
- YNDLOUMBVDVALC-ZLUOBGJFSA-N Asn-Ala-Ala Chemical compound C[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC(=O)N)N YNDLOUMBVDVALC-ZLUOBGJFSA-N 0.000 description 3
- DXVMJJNAOVECBA-WHFBIAKZSA-N Asn-Gly-Asn Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O DXVMJJNAOVECBA-WHFBIAKZSA-N 0.000 description 3
- NVWJMQNYLYWVNQ-BYULHYEWSA-N Asn-Ile-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O NVWJMQNYLYWVNQ-BYULHYEWSA-N 0.000 description 3
- XFJKRRCWLTZIQA-XIRDDKMYSA-N Asn-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N XFJKRRCWLTZIQA-XIRDDKMYSA-N 0.000 description 3
- RTFWCVDISAMGEQ-SRVKXCTJSA-N Asn-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N RTFWCVDISAMGEQ-SRVKXCTJSA-N 0.000 description 3
- LMIWYCWRJVMAIQ-NHCYSSNCSA-N Asn-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N LMIWYCWRJVMAIQ-NHCYSSNCSA-N 0.000 description 3
- AXXCUABIFZPKPM-BQBZGAKWSA-N Asp-Arg-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O AXXCUABIFZPKPM-BQBZGAKWSA-N 0.000 description 3
- JUWZKMBALYLZCK-WHFBIAKZSA-N Asp-Gly-Asn Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O JUWZKMBALYLZCK-WHFBIAKZSA-N 0.000 description 3
- HAFCJCDJGIOYPW-WDSKDSINSA-N Asp-Gly-Gln Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O HAFCJCDJGIOYPW-WDSKDSINSA-N 0.000 description 3
- SEMWSADZTMJELF-BYULHYEWSA-N Asp-Ile-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O SEMWSADZTMJELF-BYULHYEWSA-N 0.000 description 3
- KLYPOCBLKMPBIQ-GHCJXIJMSA-N Asp-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N KLYPOCBLKMPBIQ-GHCJXIJMSA-N 0.000 description 3
- KYQNAIMCTRZLNP-QSFUFRPTSA-N Asp-Ile-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O KYQNAIMCTRZLNP-QSFUFRPTSA-N 0.000 description 3
- CTWCFPWFIGRAEP-CIUDSAMLSA-N Asp-Lys-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O CTWCFPWFIGRAEP-CIUDSAMLSA-N 0.000 description 3
- PLNJUJGNLDSFOP-UWJYBYFXSA-N Asp-Tyr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PLNJUJGNLDSFOP-UWJYBYFXSA-N 0.000 description 3
- GIKOVDMXBAFXDF-NHCYSSNCSA-N Asp-Val-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GIKOVDMXBAFXDF-NHCYSSNCSA-N 0.000 description 3
- RKXVTTIQNKPCHU-KKHAAJSZSA-N Asp-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O RKXVTTIQNKPCHU-KKHAAJSZSA-N 0.000 description 3
- 108091035707 Consensus sequence Proteins 0.000 description 3
- CITDWMLWXNUQKD-FXQIFTODSA-N Gln-Gln-Asn Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CITDWMLWXNUQKD-FXQIFTODSA-N 0.000 description 3
- ZNZPKVQURDQFFS-FXQIFTODSA-N Gln-Glu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZNZPKVQURDQFFS-FXQIFTODSA-N 0.000 description 3
- IHSGESFHTMFHRB-GUBZILKMSA-N Gln-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O IHSGESFHTMFHRB-GUBZILKMSA-N 0.000 description 3
- JNENSVNAUWONEZ-GUBZILKMSA-N Gln-Lys-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O JNENSVNAUWONEZ-GUBZILKMSA-N 0.000 description 3
- SWDSRANUCKNBLA-AVGNSLFASA-N Gln-Phe-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SWDSRANUCKNBLA-AVGNSLFASA-N 0.000 description 3
- OKARHJKJTKFQBM-ACZMJKKPSA-N Gln-Ser-Asn Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OKARHJKJTKFQBM-ACZMJKKPSA-N 0.000 description 3
- VEYGCDYMOXHJLS-GVXVVHGQSA-N Gln-Val-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VEYGCDYMOXHJLS-GVXVVHGQSA-N 0.000 description 3
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 3
- YKBUCXNNBYZYAY-MNXVOIDGSA-N Glu-Lys-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YKBUCXNNBYZYAY-MNXVOIDGSA-N 0.000 description 3
- HRBYTAIBKPNZKQ-AVGNSLFASA-N Glu-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O HRBYTAIBKPNZKQ-AVGNSLFASA-N 0.000 description 3
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 3
- RGJKYNUINKGPJN-RWRJDSDZSA-N Glu-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(=O)O)N RGJKYNUINKGPJN-RWRJDSDZSA-N 0.000 description 3
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 3
- BRFJMRSRMOMIMU-WHFBIAKZSA-N Gly-Ala-Asn Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O BRFJMRSRMOMIMU-WHFBIAKZSA-N 0.000 description 3
- JRDYDYXZKFNNRQ-XPUUQOCRSA-N Gly-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN JRDYDYXZKFNNRQ-XPUUQOCRSA-N 0.000 description 3
- BGVYNAQWHSTTSP-BYULHYEWSA-N Gly-Asn-Ile Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BGVYNAQWHSTTSP-BYULHYEWSA-N 0.000 description 3
- BULIVUZUDBHKKZ-WDSKDSINSA-N Gly-Gln-Asn Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O BULIVUZUDBHKKZ-WDSKDSINSA-N 0.000 description 3
- MOJKRXIRAZPZLW-WDSKDSINSA-N Gly-Glu-Ala Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MOJKRXIRAZPZLW-WDSKDSINSA-N 0.000 description 3
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 3
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 3
- UTYGDAHJBBDPBA-BYULHYEWSA-N Gly-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN UTYGDAHJBBDPBA-BYULHYEWSA-N 0.000 description 3
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 3
- ZOTGXWMKUFSKEU-QXEWZRGKSA-N Gly-Ile-Met Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(O)=O ZOTGXWMKUFSKEU-QXEWZRGKSA-N 0.000 description 3
- CLNSYANKYVMZNM-UWVGGRQHSA-N Gly-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CLNSYANKYVMZNM-UWVGGRQHSA-N 0.000 description 3
- MTBIKIMYHUWBRX-QWRGUYRKSA-N Gly-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN MTBIKIMYHUWBRX-QWRGUYRKSA-N 0.000 description 3
- GAFKBWKVXNERFA-QWRGUYRKSA-N Gly-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 GAFKBWKVXNERFA-QWRGUYRKSA-N 0.000 description 3
- IBYOLNARKHMLBG-WHOFXGATSA-N Gly-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IBYOLNARKHMLBG-WHOFXGATSA-N 0.000 description 3
- MXIULRKNFSCJHT-STQMWFEESA-N Gly-Phe-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 MXIULRKNFSCJHT-STQMWFEESA-N 0.000 description 3
- PYFIQROSWQERAS-LBPRGKRZSA-N Gly-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)CN)C(=O)NCC(O)=O)=CNC2=C1 PYFIQROSWQERAS-LBPRGKRZSA-N 0.000 description 3
- SYOJVRNQCXYEOV-XVKPBYJWSA-N Gly-Val-Glu Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SYOJVRNQCXYEOV-XVKPBYJWSA-N 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 241001517044 Heteractis magnifica Species 0.000 description 3
- ATXGFMOBVKSOMK-PEDHHIEDSA-N Ile-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N ATXGFMOBVKSOMK-PEDHHIEDSA-N 0.000 description 3
- UMYZBHKAVTXWIW-GMOBBJLQSA-N Ile-Asp-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UMYZBHKAVTXWIW-GMOBBJLQSA-N 0.000 description 3
- NBJAAWYRLGCJOF-UGYAYLCHSA-N Ile-Asp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NBJAAWYRLGCJOF-UGYAYLCHSA-N 0.000 description 3
- PWDSHAAAFXISLE-SXTJYALSSA-N Ile-Ile-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O PWDSHAAAFXISLE-SXTJYALSSA-N 0.000 description 3
- RMNMUUCYTMLWNA-ZPFDUUQYSA-N Ile-Lys-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RMNMUUCYTMLWNA-ZPFDUUQYSA-N 0.000 description 3
- UDBPXJNOEWDBDF-XUXIUFHCSA-N Ile-Lys-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)O)N UDBPXJNOEWDBDF-XUXIUFHCSA-N 0.000 description 3
- WLRJHVNFGAOYPS-HJPIBITLSA-N Ile-Ser-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N WLRJHVNFGAOYPS-HJPIBITLSA-N 0.000 description 3
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 3
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 3
- 125000002435 L-phenylalanyl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])C1=C([H])C([H])=C([H])C([H])=C1[H] 0.000 description 3
- 125000003798 L-tyrosyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C([H])([H])C1=C([H])C([H])=C(O[H])C([H])=C1[H] 0.000 description 3
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 3
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 3
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 3
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 3
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 3
- UCNNZELZXFXXJQ-BZSNNMDCSA-N Leu-Leu-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UCNNZELZXFXXJQ-BZSNNMDCSA-N 0.000 description 3
- VVQJGYPTIYOFBR-IHRRRGAJSA-N Leu-Lys-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)O)N VVQJGYPTIYOFBR-IHRRRGAJSA-N 0.000 description 3
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 3
- ADJWHHZETYAAAX-SRVKXCTJSA-N Leu-Ser-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ADJWHHZETYAAAX-SRVKXCTJSA-N 0.000 description 3
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 3
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 3
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 3
- BTEMNFBEAAOGBR-BZSNNMDCSA-N Leu-Tyr-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BTEMNFBEAAOGBR-BZSNNMDCSA-N 0.000 description 3
- BGGTYDNTOYRTTR-MEYUZBJRSA-N Leu-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(C)C)N)O BGGTYDNTOYRTTR-MEYUZBJRSA-N 0.000 description 3
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 3
- CLBGMWIYPYAZPR-AVGNSLFASA-N Lys-Arg-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O CLBGMWIYPYAZPR-AVGNSLFASA-N 0.000 description 3
- DGAAQRAUOFHBFJ-CIUDSAMLSA-N Lys-Asn-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O DGAAQRAUOFHBFJ-CIUDSAMLSA-N 0.000 description 3
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 3
- YEIYAQQKADPIBJ-GARJFASQSA-N Lys-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O YEIYAQQKADPIBJ-GARJFASQSA-N 0.000 description 3
- ITWQLSZTLBKWJM-YUMQZZPRSA-N Lys-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCCN ITWQLSZTLBKWJM-YUMQZZPRSA-N 0.000 description 3
- VVURYEVJJTXWNE-ULQDDVLXSA-N Lys-Tyr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O VVURYEVJJTXWNE-ULQDDVLXSA-N 0.000 description 3
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 3
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 3
- MIXPUVSPPOWTCR-FXQIFTODSA-N Met-Ser-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MIXPUVSPPOWTCR-FXQIFTODSA-N 0.000 description 3
- RMLWDZINJUDMEB-IHRRRGAJSA-N Met-Tyr-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N RMLWDZINJUDMEB-IHRRRGAJSA-N 0.000 description 3
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 3
- CUMXHKAOHNWRFQ-BZSNNMDCSA-N Phe-Asp-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 CUMXHKAOHNWRFQ-BZSNNMDCSA-N 0.000 description 3
- RJYBHZVWJPUSLB-QEWYBTABSA-N Phe-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N RJYBHZVWJPUSLB-QEWYBTABSA-N 0.000 description 3
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 3
- 241000915746 Sagartia elegans Species 0.000 description 3
- QFBNNYNWKYKVJO-DCAQKATOSA-N Ser-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N QFBNNYNWKYKVJO-DCAQKATOSA-N 0.000 description 3
- BTPAWKABYQMKKN-LKXGYXEUSA-N Ser-Asp-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BTPAWKABYQMKKN-LKXGYXEUSA-N 0.000 description 3
- AEGUWTFAQQWVLC-BQBZGAKWSA-N Ser-Gly-Arg Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEGUWTFAQQWVLC-BQBZGAKWSA-N 0.000 description 3
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 3
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 3
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 3
- 229910021607 Silver chloride Inorganic materials 0.000 description 3
- PZVGOVRNGKEFCB-KKHAAJSZSA-N Thr-Asn-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N)O PZVGOVRNGKEFCB-KKHAAJSZSA-N 0.000 description 3
- ZUUDNCOCILSYAM-KKHAAJSZSA-N Thr-Asp-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZUUDNCOCILSYAM-KKHAAJSZSA-N 0.000 description 3
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 3
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 3
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 3
- KZSYAEWQMJEGRZ-RHYQMDGZSA-N Thr-Leu-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O KZSYAEWQMJEGRZ-RHYQMDGZSA-N 0.000 description 3
- KZURUCDWKDEAFZ-XVSYOHENSA-N Thr-Phe-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O KZURUCDWKDEAFZ-XVSYOHENSA-N 0.000 description 3
- FWTFAZKJORVTIR-VZFHVOOUSA-N Thr-Ser-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O FWTFAZKJORVTIR-VZFHVOOUSA-N 0.000 description 3
- IVDFVBVIVLJJHR-LKXGYXEUSA-N Thr-Ser-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IVDFVBVIVLJJHR-LKXGYXEUSA-N 0.000 description 3
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 3
- ZEJBJDHSQPOVJV-UAXMHLISSA-N Thr-Trp-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZEJBJDHSQPOVJV-UAXMHLISSA-N 0.000 description 3
- KZTLZZQTJMCGIP-ZJDVBMNYSA-N Thr-Val-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KZTLZZQTJMCGIP-ZJDVBMNYSA-N 0.000 description 3
- XZSJDSBPEJBEFZ-QRTARXTBSA-N Trp-Asn-Val Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O XZSJDSBPEJBEFZ-QRTARXTBSA-N 0.000 description 3
- PVRRBEROBJQPJX-SZMVWBNQSA-N Trp-His-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PVRRBEROBJQPJX-SZMVWBNQSA-N 0.000 description 3
- COLXBVRHSKPKIE-NYVOZVTQSA-N Trp-Trp-Asp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(O)=O)C(O)=O COLXBVRHSKPKIE-NYVOZVTQSA-N 0.000 description 3
- SGFIXFAHVWJKTD-KJEVXHAQSA-N Tyr-Arg-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SGFIXFAHVWJKTD-KJEVXHAQSA-N 0.000 description 3
- JRXKIVGWMMIIOF-YDHLFZDLSA-N Tyr-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N JRXKIVGWMMIIOF-YDHLFZDLSA-N 0.000 description 3
- KCPFDGNYAMKZQP-KBPBESRZSA-N Tyr-Gly-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O KCPFDGNYAMKZQP-KBPBESRZSA-N 0.000 description 3
- VTCKHZJKWQENKX-KBPBESRZSA-N Tyr-Lys-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O VTCKHZJKWQENKX-KBPBESRZSA-N 0.000 description 3
- 241000191954 Urticina crassicornis Species 0.000 description 3
- HZYOWMGWKKRMBZ-BYULHYEWSA-N Val-Asp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZYOWMGWKKRMBZ-BYULHYEWSA-N 0.000 description 3
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 3
- QRVPEKJBBRYISE-XUXIUFHCSA-N Val-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N QRVPEKJBBRYISE-XUXIUFHCSA-N 0.000 description 3
- VPGCVZRRBYOGCD-AVGNSLFASA-N Val-Lys-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O VPGCVZRRBYOGCD-AVGNSLFASA-N 0.000 description 3
- VSCIANXXVZOYOC-AVGNSLFASA-N Val-Pro-His Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N VSCIANXXVZOYOC-AVGNSLFASA-N 0.000 description 3
- QIVPZSWBBHRNBA-JYJNAYRXSA-N Val-Pro-Phe Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O QIVPZSWBBHRNBA-JYJNAYRXSA-N 0.000 description 3
- IECQJCJNPJVUSB-IHRRRGAJSA-N Val-Tyr-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CO)C(O)=O IECQJCJNPJVUSB-IHRRRGAJSA-N 0.000 description 3
- AOILQMZPNLUXCM-AVGNSLFASA-N Val-Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN AOILQMZPNLUXCM-AVGNSLFASA-N 0.000 description 3
- 102220567335 Vasopressin V2 receptor_S126F_mutation Human genes 0.000 description 3
- 108010011559 alanylphenylalanine Proteins 0.000 description 3
- 238000005349 anion exchange Methods 0.000 description 3
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 3
- 235000003704 aspartic acid Nutrition 0.000 description 3
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 3
- 239000012472 biological sample Substances 0.000 description 3
- 239000004202 carbamide Substances 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 210000000991 chicken egg Anatomy 0.000 description 3
- 238000005315 distribution function Methods 0.000 description 3
- 235000014103 egg white Nutrition 0.000 description 3
- 238000001962 electrophoresis Methods 0.000 description 3
- 238000004520 electroporation Methods 0.000 description 3
- 238000010828 elution Methods 0.000 description 3
- 108010056732 factor EF-P Proteins 0.000 description 3
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 3
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 3
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 3
- 108010074027 glycyl-seryl-phenylalanine Proteins 0.000 description 3
- 108010077515 glycylproline Proteins 0.000 description 3
- 108010018006 histidylserine Proteins 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000000338 in vitro Methods 0.000 description 3
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 3
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 3
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 238000001819 mass spectrum Methods 0.000 description 3
- 108091005601 modified peptides Proteins 0.000 description 3
- 108020004707 nucleic acids Proteins 0.000 description 3
- 102000039446 nucleic acids Human genes 0.000 description 3
- 150000007523 nucleic acids Chemical class 0.000 description 3
- 238000006384 oligomerization reaction Methods 0.000 description 3
- 150000003904 phospholipids Chemical class 0.000 description 3
- 238000001742 protein purification Methods 0.000 description 3
- 230000006172 rhamnosylation Effects 0.000 description 3
- HKZLPVFGJNLROG-UHFFFAOYSA-M silver monochloride Chemical compound [Cl-].[Ag+] HKZLPVFGJNLROG-UHFFFAOYSA-M 0.000 description 3
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 3
- 238000000527 sonication Methods 0.000 description 3
- 238000004611 spectroscopical analysis Methods 0.000 description 3
- 239000010409 thin film Substances 0.000 description 3
- 108010000998 wheylin-2 peptide Proteins 0.000 description 3
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 2
- WIGDGIGALMYEBW-UHFFFAOYSA-N 2-[[2-[[2-[2-[[2-[[2-[(2-amino-4-methylpentanoyl)amino]-5-(diaminomethylideneamino)pentanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]propanoylamino]-3-hydroxypropanoyl]amino]-4-methylpentanoyl]amino]acetic acid Chemical compound CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)NC(CCCN=C(N)N)C(=O)NC(C)C(=O)NC(CO)C(=O)NC(CC(C)C)C(=O)NCC(O)=O WIGDGIGALMYEBW-UHFFFAOYSA-N 0.000 description 2
- QCVGEOXPDFCNHA-UHFFFAOYSA-N 5,5-dimethyl-2,4-dioxo-1,3-oxazolidine-3-carboxamide Chemical compound CC1(C)OC(=O)N(C(N)=O)C1=O QCVGEOXPDFCNHA-UHFFFAOYSA-N 0.000 description 2
- 241000316148 Actineria villosa Species 0.000 description 2
- 241000607528 Aeromonas hydrophila Species 0.000 description 2
- 229920001817 Agar Polymers 0.000 description 2
- FXKNPWNXPQZLES-ZLUOBGJFSA-N Ala-Asn-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FXKNPWNXPQZLES-ZLUOBGJFSA-N 0.000 description 2
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 2
- IKKVASZHTMKJIR-ZKWXMUAHSA-N Ala-Asp-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IKKVASZHTMKJIR-ZKWXMUAHSA-N 0.000 description 2
- BEMGNWZECGIJOI-WDSKDSINSA-N Ala-Gly-Glu Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O BEMGNWZECGIJOI-WDSKDSINSA-N 0.000 description 2
- OKEWAFFWMHBGPT-XPUUQOCRSA-N Ala-His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 OKEWAFFWMHBGPT-XPUUQOCRSA-N 0.000 description 2
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 2
- WUHJHHGYVVJMQE-BJDJZHNGSA-N Ala-Leu-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WUHJHHGYVVJMQE-BJDJZHNGSA-N 0.000 description 2
- NLOMBWNGESDVJU-GUBZILKMSA-N Ala-Met-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NLOMBWNGESDVJU-GUBZILKMSA-N 0.000 description 2
- KYDYGANDJHFBCW-DRZSPHRISA-N Ala-Phe-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N KYDYGANDJHFBCW-DRZSPHRISA-N 0.000 description 2
- ZBLQIYPCUWZSRZ-QEJZJMRPSA-N Ala-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 ZBLQIYPCUWZSRZ-QEJZJMRPSA-N 0.000 description 2
- YCRAFFCYWOUEOF-DLOVCJGASA-N Ala-Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 YCRAFFCYWOUEOF-DLOVCJGASA-N 0.000 description 2
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 2
- LSMDIAAALJJLRO-XQXXSGGOSA-N Ala-Thr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LSMDIAAALJJLRO-XQXXSGGOSA-N 0.000 description 2
- KTXKIYXZQFWJKB-VZFHVOOUSA-N Ala-Thr-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O KTXKIYXZQFWJKB-VZFHVOOUSA-N 0.000 description 2
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 2
- AENHOIXXHKNIQL-AUTRQRHGSA-N Ala-Tyr-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H]([NH3+])C)CC1=CC=C(O)C=C1 AENHOIXXHKNIQL-AUTRQRHGSA-N 0.000 description 2
- XAXMJQUMRJAFCH-CQDKDKBSSA-N Ala-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 XAXMJQUMRJAFCH-CQDKDKBSSA-N 0.000 description 2
- JNJHNBXBGNJESC-KKXDTOCCSA-N Ala-Tyr-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JNJHNBXBGNJESC-KKXDTOCCSA-N 0.000 description 2
- OTUQSEPIIVBYEM-IHRRRGAJSA-N Arg-Asn-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OTUQSEPIIVBYEM-IHRRRGAJSA-N 0.000 description 2
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 2
- FBLMOFHNVQBKRR-IHRRRGAJSA-N Arg-Asp-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FBLMOFHNVQBKRR-IHRRRGAJSA-N 0.000 description 2
- ZATRYQNPUHGXCU-DTWKUNHWSA-N Arg-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ZATRYQNPUHGXCU-DTWKUNHWSA-N 0.000 description 2
- AUZAXCPWMDBWEE-HJGDQZAQSA-N Arg-Thr-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O AUZAXCPWMDBWEE-HJGDQZAQSA-N 0.000 description 2
- LEFKSBYHUGUWLP-ACZMJKKPSA-N Asn-Ala-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LEFKSBYHUGUWLP-ACZMJKKPSA-N 0.000 description 2
- QEYJFBMTSMLPKZ-ZKWXMUAHSA-N Asn-Ala-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O QEYJFBMTSMLPKZ-ZKWXMUAHSA-N 0.000 description 2
- GXMSVVBIAMWMKO-BQBZGAKWSA-N Asn-Arg-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N GXMSVVBIAMWMKO-BQBZGAKWSA-N 0.000 description 2
- ACRYGQFHAQHDSF-ZLUOBGJFSA-N Asn-Asn-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ACRYGQFHAQHDSF-ZLUOBGJFSA-N 0.000 description 2
- KSBHCUSPLWRVEK-ZLUOBGJFSA-N Asn-Asn-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KSBHCUSPLWRVEK-ZLUOBGJFSA-N 0.000 description 2
- PAXHINASXXXILC-SRVKXCTJSA-N Asn-Asp-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N)O PAXHINASXXXILC-SRVKXCTJSA-N 0.000 description 2
- WPOLSNAQGVHROR-GUBZILKMSA-N Asn-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N WPOLSNAQGVHROR-GUBZILKMSA-N 0.000 description 2
- OLGCWMNDJTWQAG-GUBZILKMSA-N Asn-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(N)=O OLGCWMNDJTWQAG-GUBZILKMSA-N 0.000 description 2
- IICZCLFBILYRCU-WHFBIAKZSA-N Asn-Gly-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IICZCLFBILYRCU-WHFBIAKZSA-N 0.000 description 2
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 2
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 2
- TZFQICWZWFNIKU-KKUMJFAQSA-N Asn-Leu-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 TZFQICWZWFNIKU-KKUMJFAQSA-N 0.000 description 2
- FTSAJSADJCMDHH-CIUDSAMLSA-N Asn-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N FTSAJSADJCMDHH-CIUDSAMLSA-N 0.000 description 2
- ZVUMKOMKQCANOM-AVGNSLFASA-N Asn-Phe-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZVUMKOMKQCANOM-AVGNSLFASA-N 0.000 description 2
- NJSNXIOKBHPFMB-GMOBBJLQSA-N Asn-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)N)N NJSNXIOKBHPFMB-GMOBBJLQSA-N 0.000 description 2
- SUIJFTJDTJKSRK-IHRRRGAJSA-N Asn-Pro-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SUIJFTJDTJKSRK-IHRRRGAJSA-N 0.000 description 2
- SNYCNNPOFYBCEK-ZLUOBGJFSA-N Asn-Ser-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O SNYCNNPOFYBCEK-ZLUOBGJFSA-N 0.000 description 2
- PUUPMDXIHCOPJU-HJGDQZAQSA-N Asn-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O PUUPMDXIHCOPJU-HJGDQZAQSA-N 0.000 description 2
- ATHZHGQSAIJHQU-XIRDDKMYSA-N Asn-Trp-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ATHZHGQSAIJHQU-XIRDDKMYSA-N 0.000 description 2
- DATSKXOXPUAOLK-KKUMJFAQSA-N Asn-Tyr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DATSKXOXPUAOLK-KKUMJFAQSA-N 0.000 description 2
- DPSUVAPLRQDWAO-YDHLFZDLSA-N Asn-Tyr-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(=O)N)N DPSUVAPLRQDWAO-YDHLFZDLSA-N 0.000 description 2
- WQAOZCVOOYUWKG-LSJOCFKGSA-N Asn-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC(=O)N)N WQAOZCVOOYUWKG-LSJOCFKGSA-N 0.000 description 2
- VHQOCWWKXIOAQI-WDSKDSINSA-N Asp-Gln-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VHQOCWWKXIOAQI-WDSKDSINSA-N 0.000 description 2
- IJHUZMGJRGNXIW-CIUDSAMLSA-N Asp-Glu-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IJHUZMGJRGNXIW-CIUDSAMLSA-N 0.000 description 2
- KHBLRHKVXICFMY-GUBZILKMSA-N Asp-Glu-Lys Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O KHBLRHKVXICFMY-GUBZILKMSA-N 0.000 description 2
- KQBVNNAPIURMPD-PEFMBERDSA-N Asp-Ile-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KQBVNNAPIURMPD-PEFMBERDSA-N 0.000 description 2
- QBJCJWAZOPCNIX-JPLJXNOCSA-N Asp-Leu-Phe-Val Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 QBJCJWAZOPCNIX-JPLJXNOCSA-N 0.000 description 2
- YWLDTBBUHZJQHW-KKUMJFAQSA-N Asp-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N YWLDTBBUHZJQHW-KKUMJFAQSA-N 0.000 description 2
- ZXRQJQCXPSMNMR-XIRDDKMYSA-N Asp-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N ZXRQJQCXPSMNMR-XIRDDKMYSA-N 0.000 description 2
- WQSXAPPYLGNMQL-IHRRRGAJSA-N Asp-Met-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N WQSXAPPYLGNMQL-IHRRRGAJSA-N 0.000 description 2
- RVMXMLSYBTXCAV-VEVYYDQMSA-N Asp-Pro-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMXMLSYBTXCAV-VEVYYDQMSA-N 0.000 description 2
- JSHWXQIZOCVWIA-ZKWXMUAHSA-N Asp-Ser-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JSHWXQIZOCVWIA-ZKWXMUAHSA-N 0.000 description 2
- MRYDJCIIVRXVGG-QEJZJMRPSA-N Asp-Trp-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(O)=O MRYDJCIIVRXVGG-QEJZJMRPSA-N 0.000 description 2
- QOJJMJKTMKNFEF-ZKWXMUAHSA-N Asp-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O QOJJMJKTMKNFEF-ZKWXMUAHSA-N 0.000 description 2
- 241000193755 Bacillus cereus Species 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- 108090000317 Chymotrypsin Proteins 0.000 description 2
- 101710112752 Cytotoxin Proteins 0.000 description 2
- CKLJMWTZIZZHCS-UHFFFAOYSA-N D-OH-Asp Natural products OC(=O)C(N)CC(O)=O CKLJMWTZIZZHCS-UHFFFAOYSA-N 0.000 description 2
- CKLJMWTZIZZHCS-UWTATZPHSA-N D-aspartic acid Chemical compound OC(=O)[C@H](N)CC(O)=O CKLJMWTZIZZHCS-UWTATZPHSA-N 0.000 description 2
- 101150109497 D10R gene Proteins 0.000 description 2
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 2
- 102000002322 Egg Proteins Human genes 0.000 description 2
- 108010000912 Egg Proteins Proteins 0.000 description 2
- 241000243686 Eisenia fetida Species 0.000 description 2
- 108010092674 Enkephalins Proteins 0.000 description 2
- RMOCFPBLHAOTDU-ACZMJKKPSA-N Gln-Asn-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RMOCFPBLHAOTDU-ACZMJKKPSA-N 0.000 description 2
- GMGKDVVBSVVKCT-NUMRIWBASA-N Gln-Asn-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GMGKDVVBSVVKCT-NUMRIWBASA-N 0.000 description 2
- OTQSTOXRUBVWAP-NRPADANISA-N Gln-Ser-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OTQSTOXRUBVWAP-NRPADANISA-N 0.000 description 2
- UEILCTONAMOGBR-RWRJDSDZSA-N Gln-Thr-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UEILCTONAMOGBR-RWRJDSDZSA-N 0.000 description 2
- WPJDPEOQUIXXOY-AVGNSLFASA-N Gln-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O WPJDPEOQUIXXOY-AVGNSLFASA-N 0.000 description 2
- FITIQFSXXBKFFM-NRPADANISA-N Gln-Val-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FITIQFSXXBKFFM-NRPADANISA-N 0.000 description 2
- ILGFBUGLBSAQQB-GUBZILKMSA-N Glu-Glu-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ILGFBUGLBSAQQB-GUBZILKMSA-N 0.000 description 2
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 2
- QIQABBIDHGQXGA-ZPFDUUQYSA-N Glu-Ile-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QIQABBIDHGQXGA-ZPFDUUQYSA-N 0.000 description 2
- WNRZUESNGGDCJX-JYJNAYRXSA-N Glu-Leu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WNRZUESNGGDCJX-JYJNAYRXSA-N 0.000 description 2
- RBXSZQRSEGYDFG-GUBZILKMSA-N Glu-Lys-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O RBXSZQRSEGYDFG-GUBZILKMSA-N 0.000 description 2
- GPSHCSTUYOQPAI-JHEQGTHGSA-N Glu-Thr-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O GPSHCSTUYOQPAI-JHEQGTHGSA-N 0.000 description 2
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 2
- XUDLUKYPXQDCRX-BQBZGAKWSA-N Gly-Arg-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O XUDLUKYPXQDCRX-BQBZGAKWSA-N 0.000 description 2
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 2
- GGEJHJIXRBTJPD-BYPYZUCNSA-N Gly-Asn-Gly Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GGEJHJIXRBTJPD-BYPYZUCNSA-N 0.000 description 2
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 2
- GRIRDMVMJJDZKV-RCOVLWMOSA-N Gly-Asn-Val Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O GRIRDMVMJJDZKV-RCOVLWMOSA-N 0.000 description 2
- QITBQGJOXQYMOA-ZETCQYMHSA-N Gly-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QITBQGJOXQYMOA-ZETCQYMHSA-N 0.000 description 2
- FQKKPCWTZZEDIC-XPUUQOCRSA-N Gly-His-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 FQKKPCWTZZEDIC-XPUUQOCRSA-N 0.000 description 2
- TVDHVLGFJSHPAX-UWVGGRQHSA-N Gly-His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 TVDHVLGFJSHPAX-UWVGGRQHSA-N 0.000 description 2
- QSVMIMFAAZPCAQ-PMVVWTBXSA-N Gly-His-Thr Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QSVMIMFAAZPCAQ-PMVVWTBXSA-N 0.000 description 2
- PTIIBFKSLCYQBO-NHCYSSNCSA-N Gly-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)CN PTIIBFKSLCYQBO-NHCYSSNCSA-N 0.000 description 2
- OMOZPGCHVWOXHN-BQBZGAKWSA-N Gly-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)CN OMOZPGCHVWOXHN-BQBZGAKWSA-N 0.000 description 2
- GGLIDLCEPDHEJO-BQBZGAKWSA-N Gly-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)CN GGLIDLCEPDHEJO-BQBZGAKWSA-N 0.000 description 2
- JNGHLWWFPGIJER-STQMWFEESA-N Gly-Pro-Tyr Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JNGHLWWFPGIJER-STQMWFEESA-N 0.000 description 2
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 2
- FFJQHWKSGAWSTJ-BFHQHQDPSA-N Gly-Thr-Ala Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O FFJQHWKSGAWSTJ-BFHQHQDPSA-N 0.000 description 2
- NVTPVQLIZCOJFK-FOHZUACHSA-N Gly-Thr-Asp Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O NVTPVQLIZCOJFK-FOHZUACHSA-N 0.000 description 2
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 2
- PNUFMLXHOLFRLD-KBPBESRZSA-N Gly-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 PNUFMLXHOLFRLD-KBPBESRZSA-N 0.000 description 2
- ZVXMEWXHFBYJPI-LSJOCFKGSA-N Gly-Val-Ile Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZVXMEWXHFBYJPI-LSJOCFKGSA-N 0.000 description 2
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 2
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 2
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 239000007995 HEPES buffer Substances 0.000 description 2
- PDSUIXMZYNURGI-AVGNSLFASA-N His-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC1=CN=CN1 PDSUIXMZYNURGI-AVGNSLFASA-N 0.000 description 2
- HQKADFMLECZIQJ-HVTMNAMFSA-N His-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N HQKADFMLECZIQJ-HVTMNAMFSA-N 0.000 description 2
- JCOSMKPAOYDKRO-AVGNSLFASA-N His-Glu-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N JCOSMKPAOYDKRO-AVGNSLFASA-N 0.000 description 2
- LDFWDDVELNOGII-MXAVVETBSA-N His-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CN=CN1)N LDFWDDVELNOGII-MXAVVETBSA-N 0.000 description 2
- TVMNTHXFRSXZGR-IHRRRGAJSA-N His-Lys-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O TVMNTHXFRSXZGR-IHRRRGAJSA-N 0.000 description 2
- UOYGZBIPZYKGSH-SRVKXCTJSA-N His-Ser-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N UOYGZBIPZYKGSH-SRVKXCTJSA-N 0.000 description 2
- PUFNQIPSRXVLQJ-IHRRRGAJSA-N His-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N PUFNQIPSRXVLQJ-IHRRRGAJSA-N 0.000 description 2
- GBMSSORHVHAYLU-QTKMDUPCSA-N His-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CN=CN1)N)O GBMSSORHVHAYLU-QTKMDUPCSA-N 0.000 description 2
- 108700039609 IRW peptide Proteins 0.000 description 2
- SPQWWEZBHXHUJN-KBIXCLLPSA-N Ile-Glu-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O SPQWWEZBHXHUJN-KBIXCLLPSA-N 0.000 description 2
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 2
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 2
- PDTMWFVVNZYWTR-NHCYSSNCSA-N Ile-Gly-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O PDTMWFVVNZYWTR-NHCYSSNCSA-N 0.000 description 2
- VOBYAKCXGQQFLR-LSJOCFKGSA-N Ile-Gly-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O VOBYAKCXGQQFLR-LSJOCFKGSA-N 0.000 description 2
- CSQNHSGHAPRGPQ-YTFOTSKYSA-N Ile-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)O)N CSQNHSGHAPRGPQ-YTFOTSKYSA-N 0.000 description 2
- YGDWPQCLFJNMOL-MNXVOIDGSA-N Ile-Leu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YGDWPQCLFJNMOL-MNXVOIDGSA-N 0.000 description 2
- PHRWFSFCNJPWRO-PPCPHDFISA-N Ile-Leu-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N PHRWFSFCNJPWRO-PPCPHDFISA-N 0.000 description 2
- YSGBJIQXTIVBHZ-AJNGGQMLSA-N Ile-Lys-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O YSGBJIQXTIVBHZ-AJNGGQMLSA-N 0.000 description 2
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 2
- IVXJIMGDOYRLQU-XUXIUFHCSA-N Ile-Pro-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O IVXJIMGDOYRLQU-XUXIUFHCSA-N 0.000 description 2
- CIJLNXXMDUOFPH-HJWJTTGWSA-N Ile-Pro-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 CIJLNXXMDUOFPH-HJWJTTGWSA-N 0.000 description 2
- DGTOKVBDZXJHNZ-WZLNRYEVSA-N Ile-Thr-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N DGTOKVBDZXJHNZ-WZLNRYEVSA-N 0.000 description 2
- QHUREMVLLMNUAX-OSUNSFLBSA-N Ile-Thr-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)O)N QHUREMVLLMNUAX-OSUNSFLBSA-N 0.000 description 2
- 108010065920 Insulin Lispro Proteins 0.000 description 2
- 102220624589 Kelch repeat and BTB domain-containing protein 3_K20D_mutation Human genes 0.000 description 2
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 2
- 125000000570 L-alpha-aspartyl group Chemical group [H]OC(=O)C([H])([H])[C@]([H])(N([H])[H])C(*)=O 0.000 description 2
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 2
- 108090001090 Lectins Proteins 0.000 description 2
- 102000004856 Lectins Human genes 0.000 description 2
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 2
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 2
- MMEDVBWCMGRKKC-GARJFASQSA-N Leu-Asp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N MMEDVBWCMGRKKC-GARJFASQSA-N 0.000 description 2
- CIVKXGPFXDIQBV-WDCWCFNPSA-N Leu-Gln-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CIVKXGPFXDIQBV-WDCWCFNPSA-N 0.000 description 2
- FIYMBBHGYNQFOP-IUCAKERBSA-N Leu-Gly-Gln Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N FIYMBBHGYNQFOP-IUCAKERBSA-N 0.000 description 2
- QPXBPQUGXHURGP-UWVGGRQHSA-N Leu-Gly-Met Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CCSC)C(=O)O)N QPXBPQUGXHURGP-UWVGGRQHSA-N 0.000 description 2
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 2
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 2
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 2
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 2
- SEOXPEFQEOYURL-PMVMPFDFSA-N Leu-Tyr-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O SEOXPEFQEOYURL-PMVMPFDFSA-N 0.000 description 2
- YIRIDPUGZKHMHT-ACRUOGEOSA-N Leu-Tyr-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YIRIDPUGZKHMHT-ACRUOGEOSA-N 0.000 description 2
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 2
- 108010014603 Leukocidins Proteins 0.000 description 2
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 2
- MPOHDJKRBLVGCT-CIUDSAMLSA-N Lys-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N MPOHDJKRBLVGCT-CIUDSAMLSA-N 0.000 description 2
- UWKNTTJNVSYXPC-CIUDSAMLSA-N Lys-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN UWKNTTJNVSYXPC-CIUDSAMLSA-N 0.000 description 2
- DNEJSAIMVANNPA-DCAQKATOSA-N Lys-Asn-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DNEJSAIMVANNPA-DCAQKATOSA-N 0.000 description 2
- LZWNAOIMTLNMDW-NHCYSSNCSA-N Lys-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N LZWNAOIMTLNMDW-NHCYSSNCSA-N 0.000 description 2
- HKCCVDWHHTVVPN-CIUDSAMLSA-N Lys-Asp-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O HKCCVDWHHTVVPN-CIUDSAMLSA-N 0.000 description 2
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 2
- GPJGFSFYBJGYRX-YUMQZZPRSA-N Lys-Gly-Asp Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O GPJGFSFYBJGYRX-YUMQZZPRSA-N 0.000 description 2
- PBLLTSKBTAHDNA-KBPBESRZSA-N Lys-Gly-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PBLLTSKBTAHDNA-KBPBESRZSA-N 0.000 description 2
- CANPXOLVTMKURR-WEDXCCLWSA-N Lys-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN CANPXOLVTMKURR-WEDXCCLWSA-N 0.000 description 2
- XREQQOATSMMAJP-MGHWNKPDSA-N Lys-Ile-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XREQQOATSMMAJP-MGHWNKPDSA-N 0.000 description 2
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 2
- BXPHMHQHYHILBB-BZSNNMDCSA-N Lys-Lys-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BXPHMHQHYHILBB-BZSNNMDCSA-N 0.000 description 2
- HKXSZKJMDBHOTG-CIUDSAMLSA-N Lys-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN HKXSZKJMDBHOTG-CIUDSAMLSA-N 0.000 description 2
- WQDKIVRHTQYJSN-DCAQKATOSA-N Lys-Ser-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N WQDKIVRHTQYJSN-DCAQKATOSA-N 0.000 description 2
- ZUGVARDEGWMMLK-SRVKXCTJSA-N Lys-Ser-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN ZUGVARDEGWMMLK-SRVKXCTJSA-N 0.000 description 2
- MEQLGHAMAUPOSJ-DCAQKATOSA-N Lys-Ser-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O MEQLGHAMAUPOSJ-DCAQKATOSA-N 0.000 description 2
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 2
- RMOKGALPSPOYKE-KATARQTJSA-N Lys-Thr-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMOKGALPSPOYKE-KATARQTJSA-N 0.000 description 2
- GILLQRYAWOMHED-DCAQKATOSA-N Lys-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN GILLQRYAWOMHED-DCAQKATOSA-N 0.000 description 2
- QEVRUYFHWJJUHZ-DCAQKATOSA-N Met-Ala-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(C)C QEVRUYFHWJJUHZ-DCAQKATOSA-N 0.000 description 2
- FRWZTWWOORIIBA-FXQIFTODSA-N Met-Asn-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N FRWZTWWOORIIBA-FXQIFTODSA-N 0.000 description 2
- DRXODWRPPUFIAY-DCAQKATOSA-N Met-Asn-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN DRXODWRPPUFIAY-DCAQKATOSA-N 0.000 description 2
- SQUTUWHAAWJYES-GUBZILKMSA-N Met-Asp-Arg Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SQUTUWHAAWJYES-GUBZILKMSA-N 0.000 description 2
- FVKRQMQQFGBXHV-QXEWZRGKSA-N Met-Asp-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O FVKRQMQQFGBXHV-QXEWZRGKSA-N 0.000 description 2
- BEZJTLKUMFMITF-AVGNSLFASA-N Met-Lys-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCNC(N)=N BEZJTLKUMFMITF-AVGNSLFASA-N 0.000 description 2
- AXHNAGAYRGCDLG-UWVGGRQHSA-N Met-Lys-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O AXHNAGAYRGCDLG-UWVGGRQHSA-N 0.000 description 2
- JQHYVIKEFYETEW-IHRRRGAJSA-N Met-Phe-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=CC=C1 JQHYVIKEFYETEW-IHRRRGAJSA-N 0.000 description 2
- PCTFVQATEGYHJU-FXQIFTODSA-N Met-Ser-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O PCTFVQATEGYHJU-FXQIFTODSA-N 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 102220530042 N-chimaerin_D10R_mutation Human genes 0.000 description 2
- 241000969937 Oulactis orientalis Species 0.000 description 2
- 101710203389 Outer membrane porin F Proteins 0.000 description 2
- 101710203388 Outer membrane porin G Proteins 0.000 description 2
- CGOMLCQJEMWMCE-STQMWFEESA-N Phe-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CGOMLCQJEMWMCE-STQMWFEESA-N 0.000 description 2
- JIYJYFIXQTYDNF-YDHLFZDLSA-N Phe-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N JIYJYFIXQTYDNF-YDHLFZDLSA-N 0.000 description 2
- UEEVBGHEGJMDDV-AVGNSLFASA-N Phe-Asp-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UEEVBGHEGJMDDV-AVGNSLFASA-N 0.000 description 2
- OJUMUUXGSXUZJZ-SRVKXCTJSA-N Phe-Asp-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OJUMUUXGSXUZJZ-SRVKXCTJSA-N 0.000 description 2
- OPEVYHFJXLCCRT-AVGNSLFASA-N Phe-Gln-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O OPEVYHFJXLCCRT-AVGNSLFASA-N 0.000 description 2
- AUJWXNGCAQWLEI-KBPBESRZSA-N Phe-Lys-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O AUJWXNGCAQWLEI-KBPBESRZSA-N 0.000 description 2
- YOFKMVUAZGPFCF-IHRRRGAJSA-N Phe-Met-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(O)=O YOFKMVUAZGPFCF-IHRRRGAJSA-N 0.000 description 2
- FUAIIFPQELBNJF-ULQDDVLXSA-N Phe-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N FUAIIFPQELBNJF-ULQDDVLXSA-N 0.000 description 2
- IPFXYNKCXYGSSV-KKUMJFAQSA-N Phe-Ser-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N IPFXYNKCXYGSSV-KKUMJFAQSA-N 0.000 description 2
- QSWKNJAPHQDAAS-MELADBBJSA-N Phe-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O QSWKNJAPHQDAAS-MELADBBJSA-N 0.000 description 2
- LTAWNJXSRUCFAN-UNQGMJICSA-N Phe-Thr-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LTAWNJXSRUCFAN-UNQGMJICSA-N 0.000 description 2
- GOUWCZRDTWTODO-YDHLFZDLSA-N Phe-Val-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O GOUWCZRDTWTODO-YDHLFZDLSA-N 0.000 description 2
- RGMLUHANLDVMPB-ULQDDVLXSA-N Phe-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N RGMLUHANLDVMPB-ULQDDVLXSA-N 0.000 description 2
- VIIRRNQMMIHYHQ-XHSDSOJGSA-N Phe-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N VIIRRNQMMIHYHQ-XHSDSOJGSA-N 0.000 description 2
- 241000365268 Phyllodiscus semoni Species 0.000 description 2
- 239000002202 Polyethylene glycol Substances 0.000 description 2
- TXPUNZXZDVJUJQ-LPEHRKFASA-N Pro-Asn-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O TXPUNZXZDVJUJQ-LPEHRKFASA-N 0.000 description 2
- CJZTUKSFZUSNCC-FXQIFTODSA-N Pro-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 CJZTUKSFZUSNCC-FXQIFTODSA-N 0.000 description 2
- WFHYFCWBLSKEMS-KKUMJFAQSA-N Pro-Glu-Phe Chemical compound N([C@@H](CCC(=O)O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 WFHYFCWBLSKEMS-KKUMJFAQSA-N 0.000 description 2
- AQSMZTIEJMZQEC-DCAQKATOSA-N Pro-His-Ser Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CO)C(=O)O AQSMZTIEJMZQEC-DCAQKATOSA-N 0.000 description 2
- UREQLMJCKFLLHM-NAKRPEOUSA-N Pro-Ile-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UREQLMJCKFLLHM-NAKRPEOUSA-N 0.000 description 2
- CGSOWZUPLOKYOR-AVGNSLFASA-N Pro-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 CGSOWZUPLOKYOR-AVGNSLFASA-N 0.000 description 2
- ITUDDXVFGFEKPD-NAKRPEOUSA-N Pro-Ser-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ITUDDXVFGFEKPD-NAKRPEOUSA-N 0.000 description 2
- QKDIHFHGHBYTKB-IHRRRGAJSA-N Pro-Ser-Phe Chemical compound N([C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 QKDIHFHGHBYTKB-IHRRRGAJSA-N 0.000 description 2
- ZYJMLBCDFPIGNL-JYJNAYRXSA-N Pro-Tyr-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@H](Cc1ccc(O)cc1)NC(=O)[C@@H]1CCCN1)C(O)=O ZYJMLBCDFPIGNL-JYJNAYRXSA-N 0.000 description 2
- CWZUFLWPEFHWEI-IHRRRGAJSA-N Pro-Tyr-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O CWZUFLWPEFHWEI-IHRRRGAJSA-N 0.000 description 2
- LZHHZYDPMZEMRX-STQMWFEESA-N Pro-Tyr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O LZHHZYDPMZEMRX-STQMWFEESA-N 0.000 description 2
- YDTUEBLEAVANFH-RCWTZXSCSA-N Pro-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 YDTUEBLEAVANFH-RCWTZXSCSA-N 0.000 description 2
- FIXILCYTSAUERA-FXQIFTODSA-N Ser-Ala-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FIXILCYTSAUERA-FXQIFTODSA-N 0.000 description 2
- BRKHVZNDAOMAHX-BIIVOSGPSA-N Ser-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N BRKHVZNDAOMAHX-BIIVOSGPSA-N 0.000 description 2
- FCRMLGJMPXCAHD-FXQIFTODSA-N Ser-Arg-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O FCRMLGJMPXCAHD-FXQIFTODSA-N 0.000 description 2
- HQTKVSCNCDLXSX-BQBZGAKWSA-N Ser-Arg-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O HQTKVSCNCDLXSX-BQBZGAKWSA-N 0.000 description 2
- KAAPNMOKUUPKOE-SRVKXCTJSA-N Ser-Asn-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KAAPNMOKUUPKOE-SRVKXCTJSA-N 0.000 description 2
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 2
- SWSRFJZZMNLMLY-ZKWXMUAHSA-N Ser-Asp-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O SWSRFJZZMNLMLY-ZKWXMUAHSA-N 0.000 description 2
- DSGYZICNAMEJOC-AVGNSLFASA-N Ser-Glu-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DSGYZICNAMEJOC-AVGNSLFASA-N 0.000 description 2
- OHKFXGKHSJKKAL-NRPADANISA-N Ser-Glu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OHKFXGKHSJKKAL-NRPADANISA-N 0.000 description 2
- IXCHOHLPHNGFTJ-YUMQZZPRSA-N Ser-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N IXCHOHLPHNGFTJ-YUMQZZPRSA-N 0.000 description 2
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 2
- WSTIOCFMWXNOCX-YUMQZZPRSA-N Ser-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N WSTIOCFMWXNOCX-YUMQZZPRSA-N 0.000 description 2
- HMRAQFJFTOLDKW-GUBZILKMSA-N Ser-His-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O HMRAQFJFTOLDKW-GUBZILKMSA-N 0.000 description 2
- IFPBAGJBHSNYPR-ZKWXMUAHSA-N Ser-Ile-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O IFPBAGJBHSNYPR-ZKWXMUAHSA-N 0.000 description 2
- RIAKPZVSNBBNRE-BJDJZHNGSA-N Ser-Ile-Leu Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O RIAKPZVSNBBNRE-BJDJZHNGSA-N 0.000 description 2
- UIPXCLNLUUAMJU-JBDRJPRFSA-N Ser-Ile-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UIPXCLNLUUAMJU-JBDRJPRFSA-N 0.000 description 2
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 2
- UBRMZSHOOIVJPW-SRVKXCTJSA-N Ser-Leu-Lys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O UBRMZSHOOIVJPW-SRVKXCTJSA-N 0.000 description 2
- OWCVUSJMEBGMOK-YUMQZZPRSA-N Ser-Lys-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O OWCVUSJMEBGMOK-YUMQZZPRSA-N 0.000 description 2
- LRWBCWGEUCKDTN-BJDJZHNGSA-N Ser-Lys-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LRWBCWGEUCKDTN-BJDJZHNGSA-N 0.000 description 2
- GDUZTEQRAOXYJS-SRVKXCTJSA-N Ser-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GDUZTEQRAOXYJS-SRVKXCTJSA-N 0.000 description 2
- MQUZANJDFOQOBX-SRVKXCTJSA-N Ser-Phe-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O MQUZANJDFOQOBX-SRVKXCTJSA-N 0.000 description 2
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 2
- KQNDIKOYWZTZIX-FXQIFTODSA-N Ser-Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQNDIKOYWZTZIX-FXQIFTODSA-N 0.000 description 2
- NERYDXBVARJIQS-JYBASQMISA-N Ser-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N)O NERYDXBVARJIQS-JYBASQMISA-N 0.000 description 2
- FHXGMDRKJHKLKW-QWRGUYRKSA-N Ser-Tyr-Gly Chemical compound OC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 FHXGMDRKJHKLKW-QWRGUYRKSA-N 0.000 description 2
- UKKROEYWYIHWBD-ZKWXMUAHSA-N Ser-Val-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O UKKROEYWYIHWBD-ZKWXMUAHSA-N 0.000 description 2
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 2
- TYVAWPFQYFPSBR-BFHQHQDPSA-N Thr-Ala-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)NCC(O)=O TYVAWPFQYFPSBR-BFHQHQDPSA-N 0.000 description 2
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 2
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 2
- JMZKMSTYXHFYAK-VEVYYDQMSA-N Thr-Arg-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O JMZKMSTYXHFYAK-VEVYYDQMSA-N 0.000 description 2
- YLXAMFZYJTZXFH-OLHMAJIHSA-N Thr-Asn-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O YLXAMFZYJTZXFH-OLHMAJIHSA-N 0.000 description 2
- ZQUKYJOKQBRBCS-GLLZPBPUSA-N Thr-Gln-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O ZQUKYJOKQBRBCS-GLLZPBPUSA-N 0.000 description 2
- SIMKLINEDYOTKL-MBLNEYKQSA-N Thr-His-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C)C(=O)O)N)O SIMKLINEDYOTKL-MBLNEYKQSA-N 0.000 description 2
- YDWLCDQXLCILCZ-BWAGICSOSA-N Thr-His-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YDWLCDQXLCILCZ-BWAGICSOSA-N 0.000 description 2
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 2
- BIBYEFRASCNLAA-CDMKHQONSA-N Thr-Phe-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 BIBYEFRASCNLAA-CDMKHQONSA-N 0.000 description 2
- YGCDFAJJCRVQKU-RCWTZXSCSA-N Thr-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O YGCDFAJJCRVQKU-RCWTZXSCSA-N 0.000 description 2
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 2
- GRIUMVXCJDKVPI-IZPVPAKOSA-N Thr-Thr-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GRIUMVXCJDKVPI-IZPVPAKOSA-N 0.000 description 2
- REJRKTOJTCPDPO-IRIUXVKKSA-N Thr-Tyr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O REJRKTOJTCPDPO-IRIUXVKKSA-N 0.000 description 2
- XVHAUVJXBFGUPC-RPTUDFQQSA-N Thr-Tyr-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XVHAUVJXBFGUPC-RPTUDFQQSA-N 0.000 description 2
- BKVICMPZWRNWOC-RHYQMDGZSA-N Thr-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O BKVICMPZWRNWOC-RHYQMDGZSA-N 0.000 description 2
- PWONLXBUSVIZPH-RHYQMDGZSA-N Thr-Val-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O PWONLXBUSVIZPH-RHYQMDGZSA-N 0.000 description 2
- OBAMASZCXDIXSS-SZMVWBNQSA-N Trp-Glu-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N OBAMASZCXDIXSS-SZMVWBNQSA-N 0.000 description 2
- UPOGHWJJZAZNSW-XIRDDKMYSA-N Trp-His-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O UPOGHWJJZAZNSW-XIRDDKMYSA-N 0.000 description 2
- GFUOTIPYXKAPAH-BVSLBCMMSA-N Trp-Pro-Phe Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GFUOTIPYXKAPAH-BVSLBCMMSA-N 0.000 description 2
- MTEQZJFSEMXXRK-CFMVVWHZSA-N Tyr-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N MTEQZJFSEMXXRK-CFMVVWHZSA-N 0.000 description 2
- IUQDEKCCHWRHRW-IHPCNDPISA-N Tyr-Asn-Trp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IUQDEKCCHWRHRW-IHPCNDPISA-N 0.000 description 2
- NSTPFWRAIDTNGH-BZSNNMDCSA-N Tyr-Asn-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NSTPFWRAIDTNGH-BZSNNMDCSA-N 0.000 description 2
- JWHOIHCOHMZSAR-QWRGUYRKSA-N Tyr-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JWHOIHCOHMZSAR-QWRGUYRKSA-N 0.000 description 2
- TZXFLDNBYYGLKA-BZSNNMDCSA-N Tyr-Asp-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 TZXFLDNBYYGLKA-BZSNNMDCSA-N 0.000 description 2
- ARPONUQDNWLXOZ-KKUMJFAQSA-N Tyr-Gln-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ARPONUQDNWLXOZ-KKUMJFAQSA-N 0.000 description 2
- UNUZEBFXGWVAOP-DZKIICNBSA-N Tyr-Glu-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UNUZEBFXGWVAOP-DZKIICNBSA-N 0.000 description 2
- BSCBBPKDVOZICB-KKUMJFAQSA-N Tyr-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BSCBBPKDVOZICB-KKUMJFAQSA-N 0.000 description 2
- GITNQBVCEQBDQC-KKUMJFAQSA-N Tyr-Lys-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O GITNQBVCEQBDQC-KKUMJFAQSA-N 0.000 description 2
- PGEFRHBWGOJPJT-KKUMJFAQSA-N Tyr-Lys-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O PGEFRHBWGOJPJT-KKUMJFAQSA-N 0.000 description 2
- BIVIUZRBCAUNPW-JRQIVUDYSA-N Tyr-Thr-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O BIVIUZRBCAUNPW-JRQIVUDYSA-N 0.000 description 2
- 101100008576 Vaccinia virus (strain Western Reserve) VACWR115 gene Proteins 0.000 description 2
- PFNZJEPSCBAVGX-CYDGBPFRSA-N Val-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](C(C)C)N PFNZJEPSCBAVGX-CYDGBPFRSA-N 0.000 description 2
- UDLYXGYWTVOIKU-QXEWZRGKSA-N Val-Asn-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UDLYXGYWTVOIKU-QXEWZRGKSA-N 0.000 description 2
- PWRITNSESKQTPW-NRPADANISA-N Val-Gln-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N PWRITNSESKQTPW-NRPADANISA-N 0.000 description 2
- XGJLNBNZNMVJRS-NRPADANISA-N Val-Glu-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O XGJLNBNZNMVJRS-NRPADANISA-N 0.000 description 2
- CVIXTAITYJQMPE-LAEOZQHASA-N Val-Glu-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CVIXTAITYJQMPE-LAEOZQHASA-N 0.000 description 2
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 2
- PMDOQZFYGWZSTK-LSJOCFKGSA-N Val-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C PMDOQZFYGWZSTK-LSJOCFKGSA-N 0.000 description 2
- OACSGBOREVRSME-NHCYSSNCSA-N Val-His-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CC(N)=O)C(O)=O OACSGBOREVRSME-NHCYSSNCSA-N 0.000 description 2
- WNZSAUMKZQXHNC-UKJIMTQDSA-N Val-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N WNZSAUMKZQXHNC-UKJIMTQDSA-N 0.000 description 2
- KNYHAWKHFQRYOX-PYJNHQTQSA-N Val-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N KNYHAWKHFQRYOX-PYJNHQTQSA-N 0.000 description 2
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 2
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 2
- RFKJNTRMXGCKFE-FHWLQOOXSA-N Val-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC(C)C)C(O)=O)=CNC2=C1 RFKJNTRMXGCKFE-FHWLQOOXSA-N 0.000 description 2
- GVJUTBOZZBTBIG-AVGNSLFASA-N Val-Lys-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N GVJUTBOZZBTBIG-AVGNSLFASA-N 0.000 description 2
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 2
- XPKCFQZDQGVJCX-RHYQMDGZSA-N Val-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N)O XPKCFQZDQGVJCX-RHYQMDGZSA-N 0.000 description 2
- PHZGFLFMGLXCFG-FHWLQOOXSA-N Val-Lys-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N PHZGFLFMGLXCFG-FHWLQOOXSA-N 0.000 description 2
- VENKIVFKIPGEJN-NHCYSSNCSA-N Val-Met-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N VENKIVFKIPGEJN-NHCYSSNCSA-N 0.000 description 2
- HWNYVQMOLCYHEA-IHRRRGAJSA-N Val-Ser-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N HWNYVQMOLCYHEA-IHRRRGAJSA-N 0.000 description 2
- UQMPYVLTQCGRSK-IFFSRLJSSA-N Val-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N)O UQMPYVLTQCGRSK-IFFSRLJSSA-N 0.000 description 2
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 2
- 108010041407 alanylaspartic acid Proteins 0.000 description 2
- 108010005233 alanylglutamic acid Proteins 0.000 description 2
- KLOHDWPABZXLGI-YWUHCJSESA-M ampicillin sodium Chemical compound [Na+].C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C([O-])=O)(C)C)=CC=CC=C1 KLOHDWPABZXLGI-YWUHCJSESA-M 0.000 description 2
- 239000007864 aqueous solution Substances 0.000 description 2
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 2
- 108010008355 arginyl-glutamine Proteins 0.000 description 2
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 2
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 239000000090 biomarker Substances 0.000 description 2
- 210000004556 brain Anatomy 0.000 description 2
- 239000007853 buffer solution Substances 0.000 description 2
- 150000003841 chloride salts Chemical class 0.000 description 2
- 229960002376 chymotrypsin Drugs 0.000 description 2
- 239000007979 citrate buffer Substances 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 238000005094 computer simulation Methods 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 239000013078 crystal Substances 0.000 description 2
- RMRCNWBMXRMIRW-BYFNXCQMSA-M cyanocobalamin Chemical compound N#C[Co+]N([C@]1([H])[C@H](CC(N)=O)[C@]\2(CCC(=O)NC[C@H](C)OP(O)(=O)OC3[C@H]([C@H](O[C@@H]3CO)N3C4=CC(C)=C(C)C=C4N=C3)O)C)C/2=C(C)\C([C@H](C/2(C)C)CCC(N)=O)=N\C\2=C\C([C@H]([C@@]/2(CC(N)=O)C)CCC(N)=O)=N\C\2=C(C)/C2=N[C@]1(C)[C@@](C)(CC(N)=O)[C@@H]2CCC(N)=O RMRCNWBMXRMIRW-BYFNXCQMSA-M 0.000 description 2
- 231100000599 cytotoxic agent Toxicity 0.000 description 2
- 239000002619 cytotoxin Substances 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000000502 dialysis Methods 0.000 description 2
- 238000009792 diffusion process Methods 0.000 description 2
- 238000000132 electrospray ionisation Methods 0.000 description 2
- 238000002330 electrospray ionisation mass spectrometry Methods 0.000 description 2
- 230000007717 exclusion Effects 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 150000002211 flavins Chemical class 0.000 description 2
- 238000013467 fragmentation Methods 0.000 description 2
- 238000006062 fragmentation reaction Methods 0.000 description 2
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 2
- 108010010147 glycylglutamine Proteins 0.000 description 2
- 230000005484 gravity Effects 0.000 description 2
- 230000002949 hemolytic effect Effects 0.000 description 2
- 108010085325 histidylproline Proteins 0.000 description 2
- 238000000126 in silico method Methods 0.000 description 2
- 239000002608 ionic liquid Substances 0.000 description 2
- 239000002523 lectin Substances 0.000 description 2
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 2
- 108010012058 leucyltyrosine Proteins 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 239000006166 lysate Substances 0.000 description 2
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 2
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 2
- 108010056582 methionylglutamic acid Proteins 0.000 description 2
- 230000000869 mutational effect Effects 0.000 description 2
- 108010014203 outer membrane phospholipase A Proteins 0.000 description 2
- 210000000496 pancreas Anatomy 0.000 description 2
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 2
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 2
- 229920001223 polyethylene glycol Polymers 0.000 description 2
- 108010004914 prolylarginine Proteins 0.000 description 2
- 108010090894 prolylleucine Proteins 0.000 description 2
- 238000002331 protein detection Methods 0.000 description 2
- 230000002797 proteolythic effect Effects 0.000 description 2
- 239000011347 resin Substances 0.000 description 2
- 229920005989 resin Polymers 0.000 description 2
- 108010029895 rubimetide Proteins 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 229910052709 silver Inorganic materials 0.000 description 2
- 239000004332 silver Substances 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 125000001424 substituent group Chemical group 0.000 description 2
- 108010065722 thiamine binding protein Proteins 0.000 description 2
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- MQAYPFVXSPHGJM-UHFFFAOYSA-M trimethyl(phenyl)azanium;chloride Chemical compound [Cl-].C[N+](C)(C)C1=CC=CC=C1 MQAYPFVXSPHGJM-UHFFFAOYSA-M 0.000 description 2
- 108010058119 tryptophyl-glycyl-glycine Proteins 0.000 description 2
- 108010044292 tryptophyltyrosine Proteins 0.000 description 2
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 239000011782 vitamin Substances 0.000 description 2
- 235000013343 vitamin Nutrition 0.000 description 2
- 229930003231 vitamin Natural products 0.000 description 2
- 229940088594 vitamin Drugs 0.000 description 2
- YYTDJPUFAVPHQA-VKHMYHEASA-N (2s)-2-amino-3-(2,3,4,5,6-pentafluorophenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=C(F)C(F)=C(F)C(F)=C1F YYTDJPUFAVPHQA-VKHMYHEASA-N 0.000 description 1
- PEMUHKUIQHFMTH-QMMMGPOBSA-N (2s)-2-amino-3-(4-bromophenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=C(Br)C=C1 PEMUHKUIQHFMTH-QMMMGPOBSA-N 0.000 description 1
- JSXMFBNJRFXRCX-NSHDSACASA-N (2s)-2-amino-3-(4-prop-2-ynoxyphenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=C(OCC#C)C=C1 JSXMFBNJRFXRCX-NSHDSACASA-N 0.000 description 1
- NEMHIKRLROONTL-QMMMGPOBSA-N (2s)-2-azaniumyl-3-(4-azidophenyl)propanoate Chemical compound OC(=O)[C@@H](N)CC1=CC=C(N=[N+]=[N-])C=C1 NEMHIKRLROONTL-QMMMGPOBSA-N 0.000 description 1
- ZXSBHXZKWRIEIA-JTQLQIEISA-N (2s)-3-(4-acetylphenyl)-2-azaniumylpropanoate Chemical compound CC(=O)C1=CC=C(C[C@H](N)C(O)=O)C=C1 ZXSBHXZKWRIEIA-JTQLQIEISA-N 0.000 description 1
- LNAACUNIBFSGKG-NIHJDLRZSA-N (3S)-3-amino-4-[(2S)-5-carbamimidamido-1-[(2S)-1-[(2S)-1-[(2S,3S)-1-[(2S)-1-[(2S)-2-[N-[(2S)-1-[(2S)-1-[(2S)-1-[(2S)-1-[(2S,3S)-1-[(1S)-1-carboxy-2-(1H-imidazol-5-yl)ethyl]imino-1-hydroxy-3-methylpentan-2-yl]imino-1-hydroxy-3-methylbutan-2-yl]imino-1-hydroxy-4-methylpentan-2-yl]imino-1-hydroxy-3-(1H-imidazol-5-yl)propan-2-yl]imino-1-hydroxy-3-phenylpropan-2-yl]-C-hydroxycarbonimidoyl]pyrrolidin-1-yl]-3-(1H-imidazol-5-yl)-1-oxopropan-2-yl]imino-1-hydroxy-3-methylpentan-2-yl]imino-1-hydroxy-3-(4-hydroxyphenyl)propan-2-yl]imino-1-hydroxy-3-methylbutan-2-yl]imino-1-hydroxypentan-2-yl]imino-4-hydroxybutanoic acid Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CC(O)=O)C(C)C)C1=CC=C(O)C=C1 LNAACUNIBFSGKG-NIHJDLRZSA-N 0.000 description 1
- BMQZYMYBQZGEEY-UHFFFAOYSA-M 1-ethyl-3-methylimidazolium chloride Chemical compound [Cl-].CCN1C=C[N+](C)=C1 BMQZYMYBQZGEEY-UHFFFAOYSA-M 0.000 description 1
- UQTZMGFTRHFAAM-ZETCQYMHSA-N 3-iodo-L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C(I)=C1 UQTZMGFTRHFAAM-ZETCQYMHSA-N 0.000 description 1
- JZRBSTONIYRNRI-VIFPVBQESA-N 3-methylphenylalanine Chemical compound CC1=CC=CC(C[C@H](N)C(O)=O)=C1 JZRBSTONIYRNRI-VIFPVBQESA-N 0.000 description 1
- FBTSQILOGYXGMD-LURJTMIESA-N 3-nitro-L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C([N+]([O-])=O)=C1 FBTSQILOGYXGMD-LURJTMIESA-N 0.000 description 1
- IRZQDMYEJPNDEN-UHFFFAOYSA-N 3-phenyl-2-aminobutanoic acid Natural products OC(=O)C(N)C(C)C1=CC=CC=C1 IRZQDMYEJPNDEN-UHFFFAOYSA-N 0.000 description 1
- CMUHFUGDYMFHEI-QMMMGPOBSA-N 4-amino-L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(N)C=C1 CMUHFUGDYMFHEI-QMMMGPOBSA-N 0.000 description 1
- PZNQZSRPDOEBMS-QMMMGPOBSA-N 4-iodo-L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(I)C=C1 PZNQZSRPDOEBMS-QMMMGPOBSA-N 0.000 description 1
- INPQIVHQSQUEAJ-UHFFFAOYSA-N 5-fluorotryptophan Chemical compound C1=C(F)C=C2C(CC(N)C(O)=O)=CNC2=C1 INPQIVHQSQUEAJ-UHFFFAOYSA-N 0.000 description 1
- LDCYZAJDBXYCGN-VIFPVBQESA-N 5-hydroxy-L-tryptophan Chemical compound C1=C(O)C=C2C(C[C@H](N)C(O)=O)=CNC2=C1 LDCYZAJDBXYCGN-VIFPVBQESA-N 0.000 description 1
- 229940000681 5-hydroxytryptophan Drugs 0.000 description 1
- KVNPSKDDJARYKK-JTQLQIEISA-N 5-methoxytryptophan Chemical compound COC1=CC=C2NC=C(C[C@H](N)C(O)=O)C2=C1 KVNPSKDDJARYKK-JTQLQIEISA-N 0.000 description 1
- HUNCSWANZMJLPM-UHFFFAOYSA-N 5-methyltryptophan Chemical compound CC1=CC=C2NC=C(CC(N)C(O)=O)C2=C1 HUNCSWANZMJLPM-UHFFFAOYSA-N 0.000 description 1
- 241000242759 Actiniaria Species 0.000 description 1
- AAQGRPOPTAUUBM-ZLUOBGJFSA-N Ala-Ala-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O AAQGRPOPTAUUBM-ZLUOBGJFSA-N 0.000 description 1
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 1
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 1
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 1
- SSSROGPPPVTHLX-FXQIFTODSA-N Ala-Arg-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSROGPPPVTHLX-FXQIFTODSA-N 0.000 description 1
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 1
- UCIYCBSJBQGDGM-LPEHRKFASA-N Ala-Arg-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N UCIYCBSJBQGDGM-LPEHRKFASA-N 0.000 description 1
- CVGNCMIULZNYES-WHFBIAKZSA-N Ala-Asn-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CVGNCMIULZNYES-WHFBIAKZSA-N 0.000 description 1
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 1
- XQGIRPGAVLFKBJ-CIUDSAMLSA-N Ala-Asn-Lys Chemical compound N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)O XQGIRPGAVLFKBJ-CIUDSAMLSA-N 0.000 description 1
- GWFSQQNGMPGBEF-GHCJXIJMSA-N Ala-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N GWFSQQNGMPGBEF-GHCJXIJMSA-N 0.000 description 1
- CSAHOYQKNHGDHX-ACZMJKKPSA-N Ala-Gln-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CSAHOYQKNHGDHX-ACZMJKKPSA-N 0.000 description 1
- OQCPATDFWYYDDX-HGNGGELXSA-N Ala-Gln-His Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O OQCPATDFWYYDDX-HGNGGELXSA-N 0.000 description 1
- FVSOUJZKYWEFOB-KBIXCLLPSA-N Ala-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)N FVSOUJZKYWEFOB-KBIXCLLPSA-N 0.000 description 1
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 1
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 1
- GGNHBHYDMUDXQB-KBIXCLLPSA-N Ala-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)N GGNHBHYDMUDXQB-KBIXCLLPSA-N 0.000 description 1
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 1
- PUBLUECXJRHTBK-ACZMJKKPSA-N Ala-Glu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O PUBLUECXJRHTBK-ACZMJKKPSA-N 0.000 description 1
- WMYJZJRILUVVRG-WDSKDSINSA-N Ala-Gly-Gln Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O WMYJZJRILUVVRG-WDSKDSINSA-N 0.000 description 1
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 1
- QHASENCZLDHBGX-ONGXEEELSA-N Ala-Gly-Phe Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QHASENCZLDHBGX-ONGXEEELSA-N 0.000 description 1
- FDAZDMAFZYTHGS-XVYDVKMFSA-N Ala-His-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O FDAZDMAFZYTHGS-XVYDVKMFSA-N 0.000 description 1
- 108010076441 Ala-His-His Proteins 0.000 description 1
- XCZXVTHYGSMQGH-NAKRPEOUSA-N Ala-Ile-Met Chemical compound C[C@H]([NH3+])C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C([O-])=O XCZXVTHYGSMQGH-NAKRPEOUSA-N 0.000 description 1
- LXAARTARZJJCMB-CIQUZCHMSA-N Ala-Ile-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LXAARTARZJJCMB-CIQUZCHMSA-N 0.000 description 1
- LBYMZCVBOKYZNS-CIUDSAMLSA-N Ala-Leu-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O LBYMZCVBOKYZNS-CIUDSAMLSA-N 0.000 description 1
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 1
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 1
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 1
- FUKFQILQFQKHLE-DCAQKATOSA-N Ala-Lys-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O FUKFQILQFQKHLE-DCAQKATOSA-N 0.000 description 1
- OINVDEKBKBCPLX-JXUBOQSCSA-N Ala-Lys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OINVDEKBKBCPLX-JXUBOQSCSA-N 0.000 description 1
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 1
- GKAZXNDATBWNBI-DCAQKATOSA-N Ala-Met-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)O)N GKAZXNDATBWNBI-DCAQKATOSA-N 0.000 description 1
- XRUJOVRWNMBAAA-NHCYSSNCSA-N Ala-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 XRUJOVRWNMBAAA-NHCYSSNCSA-N 0.000 description 1
- WEZNQZHACPSMEF-QEJZJMRPSA-N Ala-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 WEZNQZHACPSMEF-QEJZJMRPSA-N 0.000 description 1
- FQNILRVJOJBFFC-FXQIFTODSA-N Ala-Pro-Asp Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N FQNILRVJOJBFFC-FXQIFTODSA-N 0.000 description 1
- XWFWAXPOLRTDFZ-FXQIFTODSA-N Ala-Pro-Ser Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O XWFWAXPOLRTDFZ-FXQIFTODSA-N 0.000 description 1
- FFZJHQODAYHGPO-KZVJFYERSA-N Ala-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N FFZJHQODAYHGPO-KZVJFYERSA-N 0.000 description 1
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 1
- YYAVDNKUWLAFCV-ACZMJKKPSA-N Ala-Ser-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYAVDNKUWLAFCV-ACZMJKKPSA-N 0.000 description 1
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 1
- XQNRANMFRPCFFW-GCJQMDKQSA-N Ala-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C)N)O XQNRANMFRPCFFW-GCJQMDKQSA-N 0.000 description 1
- JJHBEVZAZXZREW-LFSVMHDDSA-N Ala-Thr-Phe Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O JJHBEVZAZXZREW-LFSVMHDDSA-N 0.000 description 1
- AOAKQKVICDWCLB-UWJYBYFXSA-N Ala-Tyr-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N AOAKQKVICDWCLB-UWJYBYFXSA-N 0.000 description 1
- PGNNQOJOEGFAOR-KWQFWETISA-N Ala-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 PGNNQOJOEGFAOR-KWQFWETISA-N 0.000 description 1
- JPOQZCHGOTWRTM-FQPOAREZSA-N Ala-Tyr-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPOQZCHGOTWRTM-FQPOAREZSA-N 0.000 description 1
- SSQHYGLFYWZWDV-UVBJJODRSA-N Ala-Val-Trp Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O SSQHYGLFYWZWDV-UVBJJODRSA-N 0.000 description 1
- QMMRCKSBBNJCMR-KMZPNFOHSA-N Angiotensin III Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CCCN=C(N)N)C(C)C)C1=CC=C(O)C=C1 QMMRCKSBBNJCMR-KMZPNFOHSA-N 0.000 description 1
- 102400000345 Angiotensin-2 Human genes 0.000 description 1
- 101800000733 Angiotensin-2 Proteins 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- SGYSTDWPNPKJPP-GUBZILKMSA-N Arg-Ala-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SGYSTDWPNPKJPP-GUBZILKMSA-N 0.000 description 1
- DFCIPNHFKOQAME-FXQIFTODSA-N Arg-Ala-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DFCIPNHFKOQAME-FXQIFTODSA-N 0.000 description 1
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 1
- VBFJESQBIWCWRL-DCAQKATOSA-N Arg-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCNC(N)=N VBFJESQBIWCWRL-DCAQKATOSA-N 0.000 description 1
- GIVATXIGCXFQQA-FXQIFTODSA-N Arg-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N GIVATXIGCXFQQA-FXQIFTODSA-N 0.000 description 1
- DCGLNNVKIZXQOJ-FXQIFTODSA-N Arg-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N DCGLNNVKIZXQOJ-FXQIFTODSA-N 0.000 description 1
- BVBKBQRPOJFCQM-DCAQKATOSA-N Arg-Asn-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BVBKBQRPOJFCQM-DCAQKATOSA-N 0.000 description 1
- ITVINTQUZMQWJR-QXEWZRGKSA-N Arg-Asn-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ITVINTQUZMQWJR-QXEWZRGKSA-N 0.000 description 1
- NTAZNGWBXRVEDJ-FXQIFTODSA-N Arg-Asp-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NTAZNGWBXRVEDJ-FXQIFTODSA-N 0.000 description 1
- KMSHNDWHPWXPEC-BQBZGAKWSA-N Arg-Asp-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KMSHNDWHPWXPEC-BQBZGAKWSA-N 0.000 description 1
- YUGFLWBWAJFGKY-BQBZGAKWSA-N Arg-Cys-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O YUGFLWBWAJFGKY-BQBZGAKWSA-N 0.000 description 1
- BEXGZLUHRXTZCC-CIUDSAMLSA-N Arg-Gln-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N BEXGZLUHRXTZCC-CIUDSAMLSA-N 0.000 description 1
- DJAIOAKQIOGULM-DCAQKATOSA-N Arg-Glu-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O DJAIOAKQIOGULM-DCAQKATOSA-N 0.000 description 1
- PNIGSVZJNVUVJA-BQBZGAKWSA-N Arg-Gly-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O PNIGSVZJNVUVJA-BQBZGAKWSA-N 0.000 description 1
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 1
- ZZZWQALDSQQBEW-STQMWFEESA-N Arg-Gly-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZZZWQALDSQQBEW-STQMWFEESA-N 0.000 description 1
- LLUGJARLJCGLAR-CYDGBPFRSA-N Arg-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LLUGJARLJCGLAR-CYDGBPFRSA-N 0.000 description 1
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 1
- CLICCYPMVFGUOF-IHRRRGAJSA-N Arg-Lys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O CLICCYPMVFGUOF-IHRRRGAJSA-N 0.000 description 1
- YLVGUOGAFAJMKP-JYJNAYRXSA-N Arg-Met-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YLVGUOGAFAJMKP-JYJNAYRXSA-N 0.000 description 1
- HNJNAMGZQZPSRE-GUBZILKMSA-N Arg-Pro-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O HNJNAMGZQZPSRE-GUBZILKMSA-N 0.000 description 1
- AWMAZIIEFPFHCP-RCWTZXSCSA-N Arg-Pro-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O AWMAZIIEFPFHCP-RCWTZXSCSA-N 0.000 description 1
- VUGWHBXPMAHEGZ-SRVKXCTJSA-N Arg-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N VUGWHBXPMAHEGZ-SRVKXCTJSA-N 0.000 description 1
- LFAUVOXPCGJKTB-DCAQKATOSA-N Arg-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N LFAUVOXPCGJKTB-DCAQKATOSA-N 0.000 description 1
- KMFPQTITXUKJOV-DCAQKATOSA-N Arg-Ser-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O KMFPQTITXUKJOV-DCAQKATOSA-N 0.000 description 1
- JOTRDIXZHNQYGP-DCAQKATOSA-N Arg-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N JOTRDIXZHNQYGP-DCAQKATOSA-N 0.000 description 1
- OGZBJJLRKQZRHL-KJEVXHAQSA-N Arg-Thr-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OGZBJJLRKQZRHL-KJEVXHAQSA-N 0.000 description 1
- XRNXPIGJPQHCPC-RCWTZXSCSA-N Arg-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)O)C(O)=O XRNXPIGJPQHCPC-RCWTZXSCSA-N 0.000 description 1
- DRDWXKWUSIKKOB-PJODQICGSA-N Arg-Trp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O DRDWXKWUSIKKOB-PJODQICGSA-N 0.000 description 1
- FSPQNLYOFCXUCE-BPUTZDHNSA-N Arg-Trp-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FSPQNLYOFCXUCE-BPUTZDHNSA-N 0.000 description 1
- UGJLILSJKSBVIR-ZFWWWQNUSA-N Arg-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)N)C(=O)NCC(O)=O)=CNC2=C1 UGJLILSJKSBVIR-ZFWWWQNUSA-N 0.000 description 1
- QJWLLRZTJFPCHA-STECZYCISA-N Arg-Tyr-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O QJWLLRZTJFPCHA-STECZYCISA-N 0.000 description 1
- CGWVCWFQGXOUSJ-ULQDDVLXSA-N Arg-Tyr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O CGWVCWFQGXOUSJ-ULQDDVLXSA-N 0.000 description 1
- QCTOLCVIGRLMQS-HRCADAONSA-N Arg-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O QCTOLCVIGRLMQS-HRCADAONSA-N 0.000 description 1
- JWCCFNZJIRZUCL-AVGNSLFASA-N Arg-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N JWCCFNZJIRZUCL-AVGNSLFASA-N 0.000 description 1
- WHLDJYNHXOMGMU-JYJNAYRXSA-N Arg-Val-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WHLDJYNHXOMGMU-JYJNAYRXSA-N 0.000 description 1
- ANAHQDPQQBDOBM-UHFFFAOYSA-N Arg-Val-Tyr Natural products CC(C)C(NC(=O)C(N)CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O ANAHQDPQQBDOBM-UHFFFAOYSA-N 0.000 description 1
- RZVVKNIACROXRM-ZLUOBGJFSA-N Asn-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N RZVVKNIACROXRM-ZLUOBGJFSA-N 0.000 description 1
- PDQBXRSOSCTGKY-ACZMJKKPSA-N Asn-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PDQBXRSOSCTGKY-ACZMJKKPSA-N 0.000 description 1
- HOIFSHOLNKQCSA-FXQIFTODSA-N Asn-Arg-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O HOIFSHOLNKQCSA-FXQIFTODSA-N 0.000 description 1
- RCENDENBBJFJHZ-ACZMJKKPSA-N Asn-Asn-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RCENDENBBJFJHZ-ACZMJKKPSA-N 0.000 description 1
- LJUOLNXOWSWGKF-ACZMJKKPSA-N Asn-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N LJUOLNXOWSWGKF-ACZMJKKPSA-N 0.000 description 1
- QHBMKQWOIYJYMI-BYULHYEWSA-N Asn-Asn-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QHBMKQWOIYJYMI-BYULHYEWSA-N 0.000 description 1
- XSGBIBGAMKTHMY-WHFBIAKZSA-N Asn-Asp-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O XSGBIBGAMKTHMY-WHFBIAKZSA-N 0.000 description 1
- AYKKKGFJXIDYLX-ACZMJKKPSA-N Asn-Gln-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O AYKKKGFJXIDYLX-ACZMJKKPSA-N 0.000 description 1
- QNJIRRVTOXNGMH-GUBZILKMSA-N Asn-Gln-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC(N)=O QNJIRRVTOXNGMH-GUBZILKMSA-N 0.000 description 1
- KUYKVGODHGHFDI-ACZMJKKPSA-N Asn-Gln-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O KUYKVGODHGHFDI-ACZMJKKPSA-N 0.000 description 1
- JREOBWLIZLXRIS-GUBZILKMSA-N Asn-Glu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JREOBWLIZLXRIS-GUBZILKMSA-N 0.000 description 1
- DMLSCRJBWUEALP-LAEOZQHASA-N Asn-Glu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O DMLSCRJBWUEALP-LAEOZQHASA-N 0.000 description 1
- OLVIPTLKNSAYRJ-YUMQZZPRSA-N Asn-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N OLVIPTLKNSAYRJ-YUMQZZPRSA-N 0.000 description 1
- OWUCNXMFJRFOFI-BQBZGAKWSA-N Asn-Gly-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O OWUCNXMFJRFOFI-BQBZGAKWSA-N 0.000 description 1
- JQSWHKKUZMTOIH-QWRGUYRKSA-N Asn-Gly-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N JQSWHKKUZMTOIH-QWRGUYRKSA-N 0.000 description 1
- UDSVWSUXKYXSTR-QWRGUYRKSA-N Asn-Gly-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UDSVWSUXKYXSTR-QWRGUYRKSA-N 0.000 description 1
- QUAWOKPCAKCHQL-SRVKXCTJSA-N Asn-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N QUAWOKPCAKCHQL-SRVKXCTJSA-N 0.000 description 1
- AITGTTNYKAWKDR-CIUDSAMLSA-N Asn-His-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O AITGTTNYKAWKDR-CIUDSAMLSA-N 0.000 description 1
- XVBDDUPJVQXDSI-PEFMBERDSA-N Asn-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N XVBDDUPJVQXDSI-PEFMBERDSA-N 0.000 description 1
- GQRDIVQPSMPQME-ZPFDUUQYSA-N Asn-Ile-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O GQRDIVQPSMPQME-ZPFDUUQYSA-N 0.000 description 1
- ACKNRKFVYUVWAC-ZPFDUUQYSA-N Asn-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ACKNRKFVYUVWAC-ZPFDUUQYSA-N 0.000 description 1
- XLZCLJRGGMBKLR-PCBIJLKTSA-N Asn-Ile-Phe Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XLZCLJRGGMBKLR-PCBIJLKTSA-N 0.000 description 1
- PNHQRQTVBRDIEF-CIUDSAMLSA-N Asn-Leu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(=O)N)N PNHQRQTVBRDIEF-CIUDSAMLSA-N 0.000 description 1
- BZWRLDPIWKOVKB-ZPFDUUQYSA-N Asn-Leu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BZWRLDPIWKOVKB-ZPFDUUQYSA-N 0.000 description 1
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 1
- RCFGLXMZDYNRSC-CIUDSAMLSA-N Asn-Lys-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O RCFGLXMZDYNRSC-CIUDSAMLSA-N 0.000 description 1
- KHCNTVRVAYCPQE-CIUDSAMLSA-N Asn-Lys-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O KHCNTVRVAYCPQE-CIUDSAMLSA-N 0.000 description 1
- JWKDQOORUCYUIW-ZPFDUUQYSA-N Asn-Lys-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JWKDQOORUCYUIW-ZPFDUUQYSA-N 0.000 description 1
- WXVGISRWSYGEDK-KKUMJFAQSA-N Asn-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N WXVGISRWSYGEDK-KKUMJFAQSA-N 0.000 description 1
- COWITDLVHMZSIW-CIUDSAMLSA-N Asn-Lys-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O COWITDLVHMZSIW-CIUDSAMLSA-N 0.000 description 1
- NTWOPSIUJBMNRI-KKUMJFAQSA-N Asn-Lys-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NTWOPSIUJBMNRI-KKUMJFAQSA-N 0.000 description 1
- MDDXKBHIMYYJLW-FXQIFTODSA-N Asn-Met-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N MDDXKBHIMYYJLW-FXQIFTODSA-N 0.000 description 1
- VITDJIPIJZAVGC-VEVYYDQMSA-N Asn-Met-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VITDJIPIJZAVGC-VEVYYDQMSA-N 0.000 description 1
- MVXJBVVLACEGCG-PCBIJLKTSA-N Asn-Phe-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVXJBVVLACEGCG-PCBIJLKTSA-N 0.000 description 1
- RVHGJNGNKGDCPX-KKUMJFAQSA-N Asn-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N RVHGJNGNKGDCPX-KKUMJFAQSA-N 0.000 description 1
- YUOXLJYVSZYPBJ-CIUDSAMLSA-N Asn-Pro-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O YUOXLJYVSZYPBJ-CIUDSAMLSA-N 0.000 description 1
- SZNGQSBRHFMZLT-IHRRRGAJSA-N Asn-Pro-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SZNGQSBRHFMZLT-IHRRRGAJSA-N 0.000 description 1
- GMUOCGCDOYYWPD-FXQIFTODSA-N Asn-Pro-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O GMUOCGCDOYYWPD-FXQIFTODSA-N 0.000 description 1
- OOXUBGLNDRGOKT-FXQIFTODSA-N Asn-Ser-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OOXUBGLNDRGOKT-FXQIFTODSA-N 0.000 description 1
- VLDRQOHCMKCXLY-SRVKXCTJSA-N Asn-Ser-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VLDRQOHCMKCXLY-SRVKXCTJSA-N 0.000 description 1
- HPNDKUOLNRVRAY-BIIVOSGPSA-N Asn-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N)C(=O)O HPNDKUOLNRVRAY-BIIVOSGPSA-N 0.000 description 1
- QYRMBFWDSFGSFC-OLHMAJIHSA-N Asn-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QYRMBFWDSFGSFC-OLHMAJIHSA-N 0.000 description 1
- HPASIOLTWSNMFB-OLHMAJIHSA-N Asn-Thr-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O HPASIOLTWSNMFB-OLHMAJIHSA-N 0.000 description 1
- XIDSGDJNUJRUHE-VEVYYDQMSA-N Asn-Thr-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O XIDSGDJNUJRUHE-VEVYYDQMSA-N 0.000 description 1
- PIABYSIYPGLLDQ-XVSYOHENSA-N Asn-Thr-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PIABYSIYPGLLDQ-XVSYOHENSA-N 0.000 description 1
- BCADFFUQHIMQAA-KKHAAJSZSA-N Asn-Thr-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BCADFFUQHIMQAA-KKHAAJSZSA-N 0.000 description 1
- DAYDURRBMDCCFL-AAEUAGOBSA-N Asn-Trp-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N DAYDURRBMDCCFL-AAEUAGOBSA-N 0.000 description 1
- ULZOQOKFYMXHPZ-AQZXSJQPSA-N Asn-Trp-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ULZOQOKFYMXHPZ-AQZXSJQPSA-N 0.000 description 1
- YQPSDMUGFKJZHR-QRTARXTBSA-N Asn-Trp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC(=O)N)N YQPSDMUGFKJZHR-QRTARXTBSA-N 0.000 description 1
- DXHINQUXBZNUCF-MELADBBJSA-N Asn-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O DXHINQUXBZNUCF-MELADBBJSA-N 0.000 description 1
- DPWDPEVGACCWTC-SRVKXCTJSA-N Asn-Tyr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O DPWDPEVGACCWTC-SRVKXCTJSA-N 0.000 description 1
- JZLFYAAGGYMRIK-BYULHYEWSA-N Asn-Val-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O JZLFYAAGGYMRIK-BYULHYEWSA-N 0.000 description 1
- LTDGPJKGJDIBQD-LAEOZQHASA-N Asn-Val-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LTDGPJKGJDIBQD-LAEOZQHASA-N 0.000 description 1
- KBQOUDLMWYWXNP-YDHLFZDLSA-N Asn-Val-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)N)N KBQOUDLMWYWXNP-YDHLFZDLSA-N 0.000 description 1
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 1
- KDFQZBWWPYQBEN-ZLUOBGJFSA-N Asp-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N KDFQZBWWPYQBEN-ZLUOBGJFSA-N 0.000 description 1
- VTYQAQFKMQTKQD-ACZMJKKPSA-N Asp-Ala-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O VTYQAQFKMQTKQD-ACZMJKKPSA-N 0.000 description 1
- VPPXTHJNTYDNFJ-CIUDSAMLSA-N Asp-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N VPPXTHJNTYDNFJ-CIUDSAMLSA-N 0.000 description 1
- NECWUSYTYSIFNC-DLOVCJGASA-N Asp-Ala-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 NECWUSYTYSIFNC-DLOVCJGASA-N 0.000 description 1
- RGKKALNPOYURGE-ZKWXMUAHSA-N Asp-Ala-Val Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O RGKKALNPOYURGE-ZKWXMUAHSA-N 0.000 description 1
- ZLGKHJHFYSRUBH-FXQIFTODSA-N Asp-Arg-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLGKHJHFYSRUBH-FXQIFTODSA-N 0.000 description 1
- HOQGTAIGQSDCHR-SRVKXCTJSA-N Asp-Asn-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HOQGTAIGQSDCHR-SRVKXCTJSA-N 0.000 description 1
- RYEWQKQXRJCHIO-SRVKXCTJSA-N Asp-Asn-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 RYEWQKQXRJCHIO-SRVKXCTJSA-N 0.000 description 1
- BFOYULZBKYOKAN-OLHMAJIHSA-N Asp-Asp-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFOYULZBKYOKAN-OLHMAJIHSA-N 0.000 description 1
- NYQHSUGFEWDWPD-ACZMJKKPSA-N Asp-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N NYQHSUGFEWDWPD-ACZMJKKPSA-N 0.000 description 1
- HRGGPWBIMIQANI-GUBZILKMSA-N Asp-Gln-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HRGGPWBIMIQANI-GUBZILKMSA-N 0.000 description 1
- SNAWMGHSCHKSDK-GUBZILKMSA-N Asp-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N SNAWMGHSCHKSDK-GUBZILKMSA-N 0.000 description 1
- DXQOQMCLWWADMU-ACZMJKKPSA-N Asp-Gln-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DXQOQMCLWWADMU-ACZMJKKPSA-N 0.000 description 1
- KIJLEFNHWSXHRU-NUMRIWBASA-N Asp-Gln-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KIJLEFNHWSXHRU-NUMRIWBASA-N 0.000 description 1
- UFAQGGZUXVLONR-AVGNSLFASA-N Asp-Gln-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N)O UFAQGGZUXVLONR-AVGNSLFASA-N 0.000 description 1
- PZXPWHFYZXTFBI-YUMQZZPRSA-N Asp-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PZXPWHFYZXTFBI-YUMQZZPRSA-N 0.000 description 1
- NRIFEOUAFLTMFJ-AAEUAGOBSA-N Asp-Gly-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O NRIFEOUAFLTMFJ-AAEUAGOBSA-N 0.000 description 1
- PGUYEUCYVNZGGV-QWRGUYRKSA-N Asp-Gly-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PGUYEUCYVNZGGV-QWRGUYRKSA-N 0.000 description 1
- KTTCQQNRRLCIBC-GHCJXIJMSA-N Asp-Ile-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O KTTCQQNRRLCIBC-GHCJXIJMSA-N 0.000 description 1
- CYCKJEFVFNRWEZ-UGYAYLCHSA-N Asp-Ile-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CYCKJEFVFNRWEZ-UGYAYLCHSA-N 0.000 description 1
- CJUKAWUWBZCTDQ-SRVKXCTJSA-N Asp-Leu-Lys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O CJUKAWUWBZCTDQ-SRVKXCTJSA-N 0.000 description 1
- UZFHNLYQWMGUHU-DCAQKATOSA-N Asp-Lys-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UZFHNLYQWMGUHU-DCAQKATOSA-N 0.000 description 1
- XWSIYTYNLKCLJB-CIUDSAMLSA-N Asp-Lys-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O XWSIYTYNLKCLJB-CIUDSAMLSA-N 0.000 description 1
- QNIACYURSSCLRP-GUBZILKMSA-N Asp-Lys-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O QNIACYURSSCLRP-GUBZILKMSA-N 0.000 description 1
- VSMYBNPOHYAXSD-GUBZILKMSA-N Asp-Lys-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O VSMYBNPOHYAXSD-GUBZILKMSA-N 0.000 description 1
- HJCGDIGVVWETRO-ZPFDUUQYSA-N Asp-Lys-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O)C(O)=O HJCGDIGVVWETRO-ZPFDUUQYSA-N 0.000 description 1
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 1
- DPNWSMBUYCLEDG-CIUDSAMLSA-N Asp-Lys-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O DPNWSMBUYCLEDG-CIUDSAMLSA-N 0.000 description 1
- DONWIPDSZZJHHK-HJGDQZAQSA-N Asp-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)O DONWIPDSZZJHHK-HJGDQZAQSA-N 0.000 description 1
- GYWQGGUCMDCUJE-DLOVCJGASA-N Asp-Phe-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O GYWQGGUCMDCUJE-DLOVCJGASA-N 0.000 description 1
- RPUYTJJZXQBWDT-SRVKXCTJSA-N Asp-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N RPUYTJJZXQBWDT-SRVKXCTJSA-N 0.000 description 1
- WMLFFCRUSPNENW-ZLUOBGJFSA-N Asp-Ser-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O WMLFFCRUSPNENW-ZLUOBGJFSA-N 0.000 description 1
- CUQDCPXNZPDYFQ-ZLUOBGJFSA-N Asp-Ser-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O CUQDCPXNZPDYFQ-ZLUOBGJFSA-N 0.000 description 1
- ZQFRDAZBTSFGGW-SRVKXCTJSA-N Asp-Ser-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZQFRDAZBTSFGGW-SRVKXCTJSA-N 0.000 description 1
- GCACQYDBDHRVGE-LKXGYXEUSA-N Asp-Thr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC(O)=O GCACQYDBDHRVGE-LKXGYXEUSA-N 0.000 description 1
- ITGFVUYOLWBPQW-KKHAAJSZSA-N Asp-Thr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O ITGFVUYOLWBPQW-KKHAAJSZSA-N 0.000 description 1
- LLRJPYJQNBMOOO-QEJZJMRPSA-N Asp-Trp-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N LLRJPYJQNBMOOO-QEJZJMRPSA-N 0.000 description 1
- LTARLVHGOGBRHN-AAEUAGOBSA-N Asp-Trp-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(O)=O LTARLVHGOGBRHN-AAEUAGOBSA-N 0.000 description 1
- OYSYWMMZGJSQRB-AVGNSLFASA-N Asp-Tyr-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O OYSYWMMZGJSQRB-AVGNSLFASA-N 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 241000193738 Bacillus anthracis Species 0.000 description 1
- 101800001415 Bri23 peptide Proteins 0.000 description 1
- 102400000107 C-terminal peptide Human genes 0.000 description 1
- 101800000655 C-terminal peptide Proteins 0.000 description 1
- 101100289894 Caenorhabditis elegans lys-7 gene Proteins 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- 108010076119 Caseins Proteins 0.000 description 1
- 102000011632 Caseins Human genes 0.000 description 1
- 108010031896 Cell Cycle Proteins Proteins 0.000 description 1
- 102000005483 Cell Cycle Proteins Human genes 0.000 description 1
- KABHAOSDMIYXTR-GUBZILKMSA-N Cys-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CS)N KABHAOSDMIYXTR-GUBZILKMSA-N 0.000 description 1
- KXUKWRVYDYIPSQ-CIUDSAMLSA-N Cys-Leu-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O KXUKWRVYDYIPSQ-CIUDSAMLSA-N 0.000 description 1
- 102000018832 Cytochromes Human genes 0.000 description 1
- 108010052832 Cytochromes Proteins 0.000 description 1
- QNAYBMKLOCPYGJ-UWTATZPHSA-N D-alanine Chemical compound C[C@@H](N)C(O)=O QNAYBMKLOCPYGJ-UWTATZPHSA-N 0.000 description 1
- ROHFNLRQFUQHCH-RXMQYKEDSA-N D-leucine Chemical compound CC(C)C[C@@H](N)C(O)=O ROHFNLRQFUQHCH-RXMQYKEDSA-N 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 229920004943 Delrin® Polymers 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 101000760806 Eisenia fetida Lysenin Proteins 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 101000878139 Escherichia coli (strain K12) Ferrichrome outer membrane transporter/phage receptor Proteins 0.000 description 1
- 241001198387 Escherichia coli BL21(DE3) Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 101710118234 Gamma-hemolysin component B Proteins 0.000 description 1
- 241000206672 Gelidium Species 0.000 description 1
- NNQHEEQNPQYPGL-FXQIFTODSA-N Gln-Ala-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NNQHEEQNPQYPGL-FXQIFTODSA-N 0.000 description 1
- KJRXLVZYJJLUCV-DCAQKATOSA-N Gln-Arg-Met Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O KJRXLVZYJJLUCV-DCAQKATOSA-N 0.000 description 1
- QYTKAVBFRUGYAU-ACZMJKKPSA-N Gln-Asp-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QYTKAVBFRUGYAU-ACZMJKKPSA-N 0.000 description 1
- WQWMZOIPXWSZNE-WDSKDSINSA-N Gln-Asp-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O WQWMZOIPXWSZNE-WDSKDSINSA-N 0.000 description 1
- NPTGGVQJYRSMCM-GLLZPBPUSA-N Gln-Gln-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPTGGVQJYRSMCM-GLLZPBPUSA-N 0.000 description 1
- FGYPOQPQTUNESW-IUCAKERBSA-N Gln-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N FGYPOQPQTUNESW-IUCAKERBSA-N 0.000 description 1
- QQAPDATZKKTBIY-YUMQZZPRSA-N Gln-Gly-Met Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O QQAPDATZKKTBIY-YUMQZZPRSA-N 0.000 description 1
- PODFFOWWLUPNMN-DCAQKATOSA-N Gln-His-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O PODFFOWWLUPNMN-DCAQKATOSA-N 0.000 description 1
- TWTWUBHEWQPMQW-ZPFDUUQYSA-N Gln-Ile-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWTWUBHEWQPMQW-ZPFDUUQYSA-N 0.000 description 1
- GIVHPCWYVWUUSG-HVTMNAMFSA-N Gln-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N GIVHPCWYVWUUSG-HVTMNAMFSA-N 0.000 description 1
- MTCXQQINVAFZKW-MNXVOIDGSA-N Gln-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MTCXQQINVAFZKW-MNXVOIDGSA-N 0.000 description 1
- LGIKBBLQVSWUGK-DCAQKATOSA-N Gln-Leu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGIKBBLQVSWUGK-DCAQKATOSA-N 0.000 description 1
- SHAUZYVSXAMYAZ-JYJNAYRXSA-N Gln-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SHAUZYVSXAMYAZ-JYJNAYRXSA-N 0.000 description 1
- HSHCEAUPUPJPTE-JYJNAYRXSA-N Gln-Leu-Tyr Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HSHCEAUPUPJPTE-JYJNAYRXSA-N 0.000 description 1
- IOFDDSNZJDIGPB-GVXVVHGQSA-N Gln-Leu-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IOFDDSNZJDIGPB-GVXVVHGQSA-N 0.000 description 1
- LURQDGKYBFWWJA-MNXVOIDGSA-N Gln-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N LURQDGKYBFWWJA-MNXVOIDGSA-N 0.000 description 1
- FKXCBKCOSVIGCT-AVGNSLFASA-N Gln-Lys-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FKXCBKCOSVIGCT-AVGNSLFASA-N 0.000 description 1
- LVRKAFPPFJRIOF-GARJFASQSA-N Gln-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N LVRKAFPPFJRIOF-GARJFASQSA-N 0.000 description 1
- OSCLNNWLKKIQJM-WDSKDSINSA-N Gln-Ser-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O OSCLNNWLKKIQJM-WDSKDSINSA-N 0.000 description 1
- QENSHQJGWGRPQS-QEJZJMRPSA-N Gln-Ser-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CO)NC(=O)[C@H](CCC(N)=O)N)C(O)=O)=CNC2=C1 QENSHQJGWGRPQS-QEJZJMRPSA-N 0.000 description 1
- VOUSELYGTNGEPB-NUMRIWBASA-N Gln-Thr-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O VOUSELYGTNGEPB-NUMRIWBASA-N 0.000 description 1
- NSEKYCAADBNQFE-XIRDDKMYSA-N Gln-Trp-Arg Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(N)=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 NSEKYCAADBNQFE-XIRDDKMYSA-N 0.000 description 1
- RNPGPFAVRLERPP-QEJZJMRPSA-N Gln-Trp-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O RNPGPFAVRLERPP-QEJZJMRPSA-N 0.000 description 1
- OEIDWQHTRYEYGG-QEJZJMRPSA-N Gln-Trp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N OEIDWQHTRYEYGG-QEJZJMRPSA-N 0.000 description 1
- GTBXHETZPUURJE-KKUMJFAQSA-N Gln-Tyr-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GTBXHETZPUURJE-KKUMJFAQSA-N 0.000 description 1
- SJMJMEWQMBJYPR-DZKIICNBSA-N Gln-Tyr-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)N)N SJMJMEWQMBJYPR-DZKIICNBSA-N 0.000 description 1
- SOEXCCGNHQBFPV-DLOVCJGASA-N Gln-Val-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SOEXCCGNHQBFPV-DLOVCJGASA-N 0.000 description 1
- UTKUTMJSWKKHEM-WDSKDSINSA-N Glu-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O UTKUTMJSWKKHEM-WDSKDSINSA-N 0.000 description 1
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 1
- NLKVNZUFDPWPNL-YUMQZZPRSA-N Glu-Arg-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O NLKVNZUFDPWPNL-YUMQZZPRSA-N 0.000 description 1
- PBEQPAZRHDVJQI-SRVKXCTJSA-N Glu-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N PBEQPAZRHDVJQI-SRVKXCTJSA-N 0.000 description 1
- DYFJZDDQPNIPAB-NHCYSSNCSA-N Glu-Arg-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O DYFJZDDQPNIPAB-NHCYSSNCSA-N 0.000 description 1
- FLLRAEJOLZPSMN-CIUDSAMLSA-N Glu-Asn-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FLLRAEJOLZPSMN-CIUDSAMLSA-N 0.000 description 1
- SVZIKUHLRKVZIF-GUBZILKMSA-N Glu-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N SVZIKUHLRKVZIF-GUBZILKMSA-N 0.000 description 1
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 1
- RJONUNZIMUXUOI-GUBZILKMSA-N Glu-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N RJONUNZIMUXUOI-GUBZILKMSA-N 0.000 description 1
- RDDSZZJOKDVPAE-ACZMJKKPSA-N Glu-Asn-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDDSZZJOKDVPAE-ACZMJKKPSA-N 0.000 description 1
- XXCDTYBVGMPIOA-FXQIFTODSA-N Glu-Asp-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XXCDTYBVGMPIOA-FXQIFTODSA-N 0.000 description 1
- IESFZVCAVACGPH-PEFMBERDSA-N Glu-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 1
- GZWOBWMOMPFPCD-CIUDSAMLSA-N Glu-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N GZWOBWMOMPFPCD-CIUDSAMLSA-N 0.000 description 1
- UMIRPYLZFKOEOH-YVNDNENWSA-N Glu-Gln-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UMIRPYLZFKOEOH-YVNDNENWSA-N 0.000 description 1
- CGOHAEBMDSEKFB-FXQIFTODSA-N Glu-Glu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O CGOHAEBMDSEKFB-FXQIFTODSA-N 0.000 description 1
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 1
- IQACOVZVOMVILH-FXQIFTODSA-N Glu-Glu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O IQACOVZVOMVILH-FXQIFTODSA-N 0.000 description 1
- PHONAZGUEGIOEM-GLLZPBPUSA-N Glu-Glu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PHONAZGUEGIOEM-GLLZPBPUSA-N 0.000 description 1
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 1
- XMPAXPSENRSOSV-RYUDHWBXSA-N Glu-Gly-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XMPAXPSENRSOSV-RYUDHWBXSA-N 0.000 description 1
- LGYCLOCORAEQSZ-PEFMBERDSA-N Glu-Ile-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O LGYCLOCORAEQSZ-PEFMBERDSA-N 0.000 description 1
- ITBHUUMCJJQUSC-LAEOZQHASA-N Glu-Ile-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O ITBHUUMCJJQUSC-LAEOZQHASA-N 0.000 description 1
- XTZDZAXYPDISRR-MNXVOIDGSA-N Glu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XTZDZAXYPDISRR-MNXVOIDGSA-N 0.000 description 1
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 1
- SJJHXJDSNQJMMW-SRVKXCTJSA-N Glu-Lys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SJJHXJDSNQJMMW-SRVKXCTJSA-N 0.000 description 1
- SWRVAQHFBRZVNX-GUBZILKMSA-N Glu-Lys-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SWRVAQHFBRZVNX-GUBZILKMSA-N 0.000 description 1
- CUPSDFQZTVVTSK-GUBZILKMSA-N Glu-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O CUPSDFQZTVVTSK-GUBZILKMSA-N 0.000 description 1
- SUIAHERNFYRBDZ-GVXVVHGQSA-N Glu-Lys-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O SUIAHERNFYRBDZ-GVXVVHGQSA-N 0.000 description 1
- JDUKCSSHWNIQQZ-IHRRRGAJSA-N Glu-Phe-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JDUKCSSHWNIQQZ-IHRRRGAJSA-N 0.000 description 1
- ZIYGTCDTJJCDDP-JYJNAYRXSA-N Glu-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZIYGTCDTJJCDDP-JYJNAYRXSA-N 0.000 description 1
- ALMBZBOCGSVSAI-ACZMJKKPSA-N Glu-Ser-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ALMBZBOCGSVSAI-ACZMJKKPSA-N 0.000 description 1
- QOXDAWODGSIDDI-GUBZILKMSA-N Glu-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N QOXDAWODGSIDDI-GUBZILKMSA-N 0.000 description 1
- CAQXJMUDOLSBPF-SUSMZKCASA-N Glu-Thr-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAQXJMUDOLSBPF-SUSMZKCASA-N 0.000 description 1
- QEJKKJNDDDPSMU-KKUMJFAQSA-N Glu-Tyr-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCSC)C(O)=O QEJKKJNDDDPSMU-KKUMJFAQSA-N 0.000 description 1
- PMSDOVISAARGAV-FHWLQOOXSA-N Glu-Tyr-Phe Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 PMSDOVISAARGAV-FHWLQOOXSA-N 0.000 description 1
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 1
- YPHPEHMXOYTEQG-LAEOZQHASA-N Glu-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O YPHPEHMXOYTEQG-LAEOZQHASA-N 0.000 description 1
- LZEUDRYSAZAJIO-AUTRQRHGSA-N Glu-Val-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZEUDRYSAZAJIO-AUTRQRHGSA-N 0.000 description 1
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 1
- PUUYVMYCMIWHFE-BQBZGAKWSA-N Gly-Ala-Arg Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PUUYVMYCMIWHFE-BQBZGAKWSA-N 0.000 description 1
- YMUFWNJHVPQNQD-ZKWXMUAHSA-N Gly-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN YMUFWNJHVPQNQD-ZKWXMUAHSA-N 0.000 description 1
- UPOJUWHGMDJUQZ-IUCAKERBSA-N Gly-Arg-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UPOJUWHGMDJUQZ-IUCAKERBSA-N 0.000 description 1
- CLODWIOAKCSBAN-BQBZGAKWSA-N Gly-Arg-Asp Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O CLODWIOAKCSBAN-BQBZGAKWSA-N 0.000 description 1
- RQZGFWKQLPJOEQ-YUMQZZPRSA-N Gly-Arg-Gln Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)CN)CN=C(N)N RQZGFWKQLPJOEQ-YUMQZZPRSA-N 0.000 description 1
- OGCIHJPYKVSMTE-YUMQZZPRSA-N Gly-Arg-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O OGCIHJPYKVSMTE-YUMQZZPRSA-N 0.000 description 1
- UXJHNZODTMHWRD-WHFBIAKZSA-N Gly-Asn-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O UXJHNZODTMHWRD-WHFBIAKZSA-N 0.000 description 1
- CIMULJZTTOBOPN-WHFBIAKZSA-N Gly-Asn-Asn Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CIMULJZTTOBOPN-WHFBIAKZSA-N 0.000 description 1
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 1
- XRTDOIOIBMAXCT-NKWVEPMBSA-N Gly-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)CN)C(=O)O XRTDOIOIBMAXCT-NKWVEPMBSA-N 0.000 description 1
- QSTLUOIOYLYLLF-WDSKDSINSA-N Gly-Asp-Glu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QSTLUOIOYLYLLF-WDSKDSINSA-N 0.000 description 1
- FZQLXNIMCPJVJE-YUMQZZPRSA-N Gly-Asp-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FZQLXNIMCPJVJE-YUMQZZPRSA-N 0.000 description 1
- MHHUEAIBJZWDBH-YUMQZZPRSA-N Gly-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN MHHUEAIBJZWDBH-YUMQZZPRSA-N 0.000 description 1
- JMQFHZWESBGPFC-WDSKDSINSA-N Gly-Gln-Asp Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O JMQFHZWESBGPFC-WDSKDSINSA-N 0.000 description 1
- BYYNJRSNDARRBX-YFKPBYRVSA-N Gly-Gln-Gly Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O BYYNJRSNDARRBX-YFKPBYRVSA-N 0.000 description 1
- QPDUVFSVVAOUHE-XVKPBYJWSA-N Gly-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)CN)C(O)=O QPDUVFSVVAOUHE-XVKPBYJWSA-N 0.000 description 1
- STVHDEHTKFXBJQ-LAEOZQHASA-N Gly-Glu-Ile Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STVHDEHTKFXBJQ-LAEOZQHASA-N 0.000 description 1
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 1
- IDOGEHIWMJMAHT-BYPYZUCNSA-N Gly-Gly-Cys Chemical compound NCC(=O)NCC(=O)N[C@@H](CS)C(O)=O IDOGEHIWMJMAHT-BYPYZUCNSA-N 0.000 description 1
- QPTNELDXWKRIFX-YFKPBYRVSA-N Gly-Gly-Gln Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O QPTNELDXWKRIFX-YFKPBYRVSA-N 0.000 description 1
- LPCKHUXOGVNZRS-YUMQZZPRSA-N Gly-His-Ser Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O LPCKHUXOGVNZRS-YUMQZZPRSA-N 0.000 description 1
- XVYKMNXXJXQKME-XEGUGMAKSA-N Gly-Ile-Tyr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XVYKMNXXJXQKME-XEGUGMAKSA-N 0.000 description 1
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 1
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 1
- LRQXRHGQEVWGPV-NHCYSSNCSA-N Gly-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN LRQXRHGQEVWGPV-NHCYSSNCSA-N 0.000 description 1
- LOEANKRDMMVOGZ-YUMQZZPRSA-N Gly-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O LOEANKRDMMVOGZ-YUMQZZPRSA-N 0.000 description 1
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 1
- OQQKUTVULYLCDG-ONGXEEELSA-N Gly-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)CN)C(O)=O OQQKUTVULYLCDG-ONGXEEELSA-N 0.000 description 1
- LPHQAFLNEHWKFF-QXEWZRGKSA-N Gly-Met-Ile Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LPHQAFLNEHWKFF-QXEWZRGKSA-N 0.000 description 1
- ZWRDOVYMQAAISL-UWVGGRQHSA-N Gly-Met-Lys Chemical compound CSCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CCCCN ZWRDOVYMQAAISL-UWVGGRQHSA-N 0.000 description 1
- UWQDKRIZSROAKS-FJXKBIBVSA-N Gly-Met-Thr Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UWQDKRIZSROAKS-FJXKBIBVSA-N 0.000 description 1
- MDKCBHZLQJZOCJ-STQMWFEESA-N Gly-Met-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)CN MDKCBHZLQJZOCJ-STQMWFEESA-N 0.000 description 1
- JPVGHHQGKPQYIL-KBPBESRZSA-N Gly-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 JPVGHHQGKPQYIL-KBPBESRZSA-N 0.000 description 1
- WNZOCXUOGVYYBJ-CDMKHQONSA-N Gly-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)CN)O WNZOCXUOGVYYBJ-CDMKHQONSA-N 0.000 description 1
- QAMMIGULQSIRCD-IRXDYDNUSA-N Gly-Phe-Tyr Chemical compound C([C@H](NC(=O)C[NH3+])C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C([O-])=O)C1=CC=CC=C1 QAMMIGULQSIRCD-IRXDYDNUSA-N 0.000 description 1
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 1
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 1
- VNNRLUNBJSWZPF-ZKWXMUAHSA-N Gly-Ser-Ile Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNNRLUNBJSWZPF-ZKWXMUAHSA-N 0.000 description 1
- YABRDIBSPZONIY-BQBZGAKWSA-N Gly-Ser-Met Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O YABRDIBSPZONIY-BQBZGAKWSA-N 0.000 description 1
- JSLVAHYTAJJEQH-QWRGUYRKSA-N Gly-Ser-Phe Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JSLVAHYTAJJEQH-QWRGUYRKSA-N 0.000 description 1
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 1
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 1
- CQMFNTVQVLQRLT-JHEQGTHGSA-N Gly-Thr-Gln Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CQMFNTVQVLQRLT-JHEQGTHGSA-N 0.000 description 1
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 1
- WSWWTQYHFCBKBT-DVJZZOLTSA-N Gly-Thr-Trp Chemical compound C[C@@H](O)[C@H](NC(=O)CN)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O WSWWTQYHFCBKBT-DVJZZOLTSA-N 0.000 description 1
- RCHFYMASWAZQQZ-ZANVPECISA-N Gly-Trp-Ala Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)CN)=CNC2=C1 RCHFYMASWAZQQZ-ZANVPECISA-N 0.000 description 1
- YJDALMUYJIENAG-QWRGUYRKSA-N Gly-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN)O YJDALMUYJIENAG-QWRGUYRKSA-N 0.000 description 1
- GNNJKUYDWFIBTK-QWRGUYRKSA-N Gly-Tyr-Asp Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O GNNJKUYDWFIBTK-QWRGUYRKSA-N 0.000 description 1
- IHDKKJVBLGXLEL-STQMWFEESA-N Gly-Tyr-Met Chemical compound CSCC[C@H](NC(=O)[C@H](Cc1ccc(O)cc1)NC(=O)CN)C(O)=O IHDKKJVBLGXLEL-STQMWFEESA-N 0.000 description 1
- DNAZKGFYFRGZIH-QWRGUYRKSA-N Gly-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 DNAZKGFYFRGZIH-QWRGUYRKSA-N 0.000 description 1
- DKJWUIYLMLUBDX-XPUUQOCRSA-N Gly-Val-Cys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)O DKJWUIYLMLUBDX-XPUUQOCRSA-N 0.000 description 1
- MUGLKCQHTUFLGF-WPRPVWTQSA-N Gly-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)CN MUGLKCQHTUFLGF-WPRPVWTQSA-N 0.000 description 1
- BNMRSWQOHIQTFL-JSGCOSHPSA-N Gly-Val-Phe Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 BNMRSWQOHIQTFL-JSGCOSHPSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 102000002068 Glycopeptides Human genes 0.000 description 1
- 108010015899 Glycopeptides Proteins 0.000 description 1
- 241000606768 Haemophilus influenzae Species 0.000 description 1
- 241000208818 Helianthus Species 0.000 description 1
- KZTLOHBDLMIFSH-XVYDVKMFSA-N His-Ala-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O KZTLOHBDLMIFSH-XVYDVKMFSA-N 0.000 description 1
- AWASVTXPTOLPPP-MBLNEYKQSA-N His-Ala-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AWASVTXPTOLPPP-MBLNEYKQSA-N 0.000 description 1
- HDXNWVLQSQFJOX-SRVKXCTJSA-N His-Arg-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HDXNWVLQSQFJOX-SRVKXCTJSA-N 0.000 description 1
- LYSVCKOXIDKEEL-SRVKXCTJSA-N His-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CN=CN1 LYSVCKOXIDKEEL-SRVKXCTJSA-N 0.000 description 1
- JWLWNCVBBSBCEM-NKIYYHGXSA-N His-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N)O JWLWNCVBBSBCEM-NKIYYHGXSA-N 0.000 description 1
- IMCHNUANCIGUKS-SRVKXCTJSA-N His-Glu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IMCHNUANCIGUKS-SRVKXCTJSA-N 0.000 description 1
- OEROYDLRVAYIMQ-YUMQZZPRSA-N His-Gly-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O OEROYDLRVAYIMQ-YUMQZZPRSA-N 0.000 description 1
- RGPWUJOMKFYFSR-QWRGUYRKSA-N His-Gly-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O RGPWUJOMKFYFSR-QWRGUYRKSA-N 0.000 description 1
- 108010093488 His-His-His-His-His-His Proteins 0.000 description 1
- WTJBVCUCLWFGAH-JUKXBJQTSA-N His-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N WTJBVCUCLWFGAH-JUKXBJQTSA-N 0.000 description 1
- XKIYNCLILDLGRS-QWRGUYRKSA-N His-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 XKIYNCLILDLGRS-QWRGUYRKSA-N 0.000 description 1
- UMBKDWGQESDCTO-KKUMJFAQSA-N His-Lys-Lys Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O UMBKDWGQESDCTO-KKUMJFAQSA-N 0.000 description 1
- CKRJBQJIGOEKMC-SRVKXCTJSA-N His-Lys-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O CKRJBQJIGOEKMC-SRVKXCTJSA-N 0.000 description 1
- XIGFLVCAVQQGNS-IHRRRGAJSA-N His-Pro-His Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 XIGFLVCAVQQGNS-IHRRRGAJSA-N 0.000 description 1
- OWYIDJCNRWRSJY-QTKMDUPCSA-N His-Pro-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O OWYIDJCNRWRSJY-QTKMDUPCSA-N 0.000 description 1
- DGLAHESNTJWGDO-SRVKXCTJSA-N His-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N DGLAHESNTJWGDO-SRVKXCTJSA-N 0.000 description 1
- CUEQQFOGARVNHU-VGDYDELISA-N His-Ser-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUEQQFOGARVNHU-VGDYDELISA-N 0.000 description 1
- PZAJPILZRFPYJJ-SRVKXCTJSA-N His-Ser-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O PZAJPILZRFPYJJ-SRVKXCTJSA-N 0.000 description 1
- XVZJRZQIHJMUBG-TUBUOCAGSA-N His-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CC1=CN=CN1)N XVZJRZQIHJMUBG-TUBUOCAGSA-N 0.000 description 1
- CCUSLCQWVMWTIS-IXOXFDKPSA-N His-Thr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O CCUSLCQWVMWTIS-IXOXFDKPSA-N 0.000 description 1
- JUCZDDVZBMPKRT-IXOXFDKPSA-N His-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O JUCZDDVZBMPKRT-IXOXFDKPSA-N 0.000 description 1
- VXZZUXWAOMWWJH-QTKMDUPCSA-N His-Thr-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O VXZZUXWAOMWWJH-QTKMDUPCSA-N 0.000 description 1
- YERBCFWVWITTEJ-NAZCDGGXSA-N His-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC3=CN=CN3)N)O YERBCFWVWITTEJ-NAZCDGGXSA-N 0.000 description 1
- CZGUSIXMZVURDU-JZXHSEFVSA-N Ile(5)-angiotensin II Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C([O-])=O)NC(=O)[C@@H](NC(=O)[C@H](CCCNC(N)=[NH2+])NC(=O)[C@@H]([NH3+])CC([O-])=O)C(C)C)C1=CC=C(O)C=C1 CZGUSIXMZVURDU-JZXHSEFVSA-N 0.000 description 1
- NKVZTQVGUNLLQW-JBDRJPRFSA-N Ile-Ala-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)O)N NKVZTQVGUNLLQW-JBDRJPRFSA-N 0.000 description 1
- VAXBXNPRXPHGHG-BJDJZHNGSA-N Ile-Ala-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)O)N VAXBXNPRXPHGHG-BJDJZHNGSA-N 0.000 description 1
- HERITAGIPLEJMT-GVARAGBVSA-N Ile-Ala-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HERITAGIPLEJMT-GVARAGBVSA-N 0.000 description 1
- QTUSJASXLGLJSR-OSUNSFLBSA-N Ile-Arg-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N QTUSJASXLGLJSR-OSUNSFLBSA-N 0.000 description 1
- ZXJFURYTPZMUNY-VKOGCVSHSA-N Ile-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 ZXJFURYTPZMUNY-VKOGCVSHSA-N 0.000 description 1
- CWJQMCPYXNVMBS-STECZYCISA-N Ile-Arg-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N CWJQMCPYXNVMBS-STECZYCISA-N 0.000 description 1
- AZEYWPUCOYXFOE-CYDGBPFRSA-N Ile-Arg-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C(C)C)C(=O)O)N AZEYWPUCOYXFOE-CYDGBPFRSA-N 0.000 description 1
- YKRIXHPEIZUDDY-GMOBBJLQSA-N Ile-Asn-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKRIXHPEIZUDDY-GMOBBJLQSA-N 0.000 description 1
- FJWYJQRCVNGEAQ-ZPFDUUQYSA-N Ile-Asn-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N FJWYJQRCVNGEAQ-ZPFDUUQYSA-N 0.000 description 1
- LEDRIAHEWDJRMF-CFMVVWHZSA-N Ile-Asn-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 LEDRIAHEWDJRMF-CFMVVWHZSA-N 0.000 description 1
- HVWXAQVMRBKKFE-UGYAYLCHSA-N Ile-Asp-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HVWXAQVMRBKKFE-UGYAYLCHSA-N 0.000 description 1
- MTFVYKQRLXYAQN-LAEOZQHASA-N Ile-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O MTFVYKQRLXYAQN-LAEOZQHASA-N 0.000 description 1
- UBHUJPVCJHPSEU-GRLWGSQLSA-N Ile-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N UBHUJPVCJHPSEU-GRLWGSQLSA-N 0.000 description 1
- DFJJAVZIHDFOGQ-MNXVOIDGSA-N Ile-Glu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DFJJAVZIHDFOGQ-MNXVOIDGSA-N 0.000 description 1
- NZOCIWKZUVUNDW-ZKWXMUAHSA-N Ile-Gly-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O NZOCIWKZUVUNDW-ZKWXMUAHSA-N 0.000 description 1
- NHJKZMDIMMTVCK-QXEWZRGKSA-N Ile-Gly-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N NHJKZMDIMMTVCK-QXEWZRGKSA-N 0.000 description 1
- KFVUBLZRFSVDGO-BYULHYEWSA-N Ile-Gly-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O KFVUBLZRFSVDGO-BYULHYEWSA-N 0.000 description 1
- MQFGXJNSUJTXDT-QSFUFRPTSA-N Ile-Gly-Ile Chemical compound N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)O MQFGXJNSUJTXDT-QSFUFRPTSA-N 0.000 description 1
- RWYCOSAAAJBJQL-KCTSRDHCSA-N Ile-Gly-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N RWYCOSAAAJBJQL-KCTSRDHCSA-N 0.000 description 1
- TWPSALMCEHCIOY-YTFOTSKYSA-N Ile-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(=O)O)N TWPSALMCEHCIOY-YTFOTSKYSA-N 0.000 description 1
- TVYWVSJGSHQWMT-AJNGGQMLSA-N Ile-Leu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N TVYWVSJGSHQWMT-AJNGGQMLSA-N 0.000 description 1
- OVDKXUDMKXAZIV-ZPFDUUQYSA-N Ile-Lys-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OVDKXUDMKXAZIV-ZPFDUUQYSA-N 0.000 description 1
- XDUVMJCBYUKNFJ-MXAVVETBSA-N Ile-Lys-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N XDUVMJCBYUKNFJ-MXAVVETBSA-N 0.000 description 1
- FFAUOCITXBMRBT-YTFOTSKYSA-N Ile-Lys-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FFAUOCITXBMRBT-YTFOTSKYSA-N 0.000 description 1
- CKRFDMPBSWYOBT-PPCPHDFISA-N Ile-Lys-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CKRFDMPBSWYOBT-PPCPHDFISA-N 0.000 description 1
- BKPPWVSPSIUXHZ-OSUNSFLBSA-N Ile-Met-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N BKPPWVSPSIUXHZ-OSUNSFLBSA-N 0.000 description 1
- OWSWUWDMSNXTNE-GMOBBJLQSA-N Ile-Pro-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N OWSWUWDMSNXTNE-GMOBBJLQSA-N 0.000 description 1
- BATWGBRIZANGPN-ZPFDUUQYSA-N Ile-Pro-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BATWGBRIZANGPN-ZPFDUUQYSA-N 0.000 description 1
- KCTIFOCXAIUQQK-QXEWZRGKSA-N Ile-Pro-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O KCTIFOCXAIUQQK-QXEWZRGKSA-N 0.000 description 1
- CZWANIQKACCEKW-CYDGBPFRSA-N Ile-Pro-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)O)N CZWANIQKACCEKW-CYDGBPFRSA-N 0.000 description 1
- XOZOSAUOGRPCES-STECZYCISA-N Ile-Pro-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XOZOSAUOGRPCES-STECZYCISA-N 0.000 description 1
- MLSUZXHSNRBDCI-CYDGBPFRSA-N Ile-Pro-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)O)N MLSUZXHSNRBDCI-CYDGBPFRSA-N 0.000 description 1
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 1
- HXIDVIFHRYRXLZ-NAKRPEOUSA-N Ile-Ser-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)O)N HXIDVIFHRYRXLZ-NAKRPEOUSA-N 0.000 description 1
- YBKKLDBBPFIXBQ-MBLNEYKQSA-N Ile-Thr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)O)N YBKKLDBBPFIXBQ-MBLNEYKQSA-N 0.000 description 1
- BQIIHAGJIYOQBP-YFYLHZKVSA-N Ile-Trp-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N3CCC[C@@H]3C(=O)O)N BQIIHAGJIYOQBP-YFYLHZKVSA-N 0.000 description 1
- JSLIXOUMAOUGBN-JUKXBJQTSA-N Ile-Tyr-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N JSLIXOUMAOUGBN-JUKXBJQTSA-N 0.000 description 1
- ZGKVPOSSTGHJAF-HJPIBITLSA-N Ile-Tyr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CO)C(=O)O)N ZGKVPOSSTGHJAF-HJPIBITLSA-N 0.000 description 1
- NGKPIPCGMLWHBX-WZLNRYEVSA-N Ile-Tyr-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N NGKPIPCGMLWHBX-WZLNRYEVSA-N 0.000 description 1
- KXUKTDGKLAOCQK-LSJOCFKGSA-N Ile-Val-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O KXUKTDGKLAOCQK-LSJOCFKGSA-N 0.000 description 1
- UYODHPPSCXBNCS-XUXIUFHCSA-N Ile-Val-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C UYODHPPSCXBNCS-XUXIUFHCSA-N 0.000 description 1
- 102220475716 Immunoglobulin kappa variable 2-24_T21K_mutation Human genes 0.000 description 1
- WTDRDQBEARUVNC-LURJTMIESA-N L-DOPA Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C(O)=C1 WTDRDQBEARUVNC-LURJTMIESA-N 0.000 description 1
- WTDRDQBEARUVNC-UHFFFAOYSA-N L-Dopa Natural products OC(=O)C(N)CC1=CC=C(O)C(O)=C1 WTDRDQBEARUVNC-UHFFFAOYSA-N 0.000 description 1
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 1
- ZGUNAGUHMKGQNY-ZETCQYMHSA-N L-alpha-phenylglycine zwitterion Chemical compound OC(=O)[C@@H](N)C1=CC=CC=C1 ZGUNAGUHMKGQNY-ZETCQYMHSA-N 0.000 description 1
- 125000002059 L-arginyl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])C([H])([H])C([H])([H])N([H])C(=N[H])N([H])[H] 0.000 description 1
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 1
- 125000001176 L-lysyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C([H])([H])C([H])([H])C([H])([H])C(N([H])[H])([H])[H] 0.000 description 1
- XUIIKFGFIJCVMT-LBPRGKRZSA-N L-thyroxine Chemical compound IC1=CC(C[C@H]([NH3+])C([O-])=O)=CC(I)=C1OC1=CC(I)=C(O)C(I)=C1 XUIIKFGFIJCVMT-LBPRGKRZSA-N 0.000 description 1
- 101150118523 LYS4 gene Proteins 0.000 description 1
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 1
- QPRQGENIBFLVEB-BJDJZHNGSA-N Leu-Ala-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O QPRQGENIBFLVEB-BJDJZHNGSA-N 0.000 description 1
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 1
- FJUKMPUELVROGK-IHRRRGAJSA-N Leu-Arg-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N FJUKMPUELVROGK-IHRRRGAJSA-N 0.000 description 1
- IBMVEYRWAWIOTN-RWMBFGLXSA-N Leu-Arg-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(O)=O IBMVEYRWAWIOTN-RWMBFGLXSA-N 0.000 description 1
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 1
- QDSKNVXKLPQNOJ-GVXVVHGQSA-N Leu-Gln-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QDSKNVXKLPQNOJ-GVXVVHGQSA-N 0.000 description 1
- HPBCTWSUJOGJSH-MNXVOIDGSA-N Leu-Glu-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HPBCTWSUJOGJSH-MNXVOIDGSA-N 0.000 description 1
- KEVYYIMVELOXCT-KBPBESRZSA-N Leu-Gly-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KEVYYIMVELOXCT-KBPBESRZSA-N 0.000 description 1
- DBSLVQBXKVKDKJ-BJDJZHNGSA-N Leu-Ile-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O DBSLVQBXKVKDKJ-BJDJZHNGSA-N 0.000 description 1
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 1
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 1
- AUBMZAMQCOYSIC-MNXVOIDGSA-N Leu-Ile-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O AUBMZAMQCOYSIC-MNXVOIDGSA-N 0.000 description 1
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 1
- JKSIBWITFMQTOA-XUXIUFHCSA-N Leu-Ile-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O JKSIBWITFMQTOA-XUXIUFHCSA-N 0.000 description 1
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 1
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 1
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 1
- CPONGMJGVIAWEH-DCAQKATOSA-N Leu-Met-Ala Chemical compound CSCC[C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](C)C(O)=O CPONGMJGVIAWEH-DCAQKATOSA-N 0.000 description 1
- ARRIJPQRBWRNLT-DCAQKATOSA-N Leu-Met-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ARRIJPQRBWRNLT-DCAQKATOSA-N 0.000 description 1
- ZDBMWELMUCLUPL-QEJZJMRPSA-N Leu-Phe-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ZDBMWELMUCLUPL-QEJZJMRPSA-N 0.000 description 1
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 1
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 1
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 1
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 1
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 1
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 1
- KZZCOWMDDXDKSS-CIUDSAMLSA-N Leu-Ser-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KZZCOWMDDXDKSS-CIUDSAMLSA-N 0.000 description 1
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 1
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 1
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 1
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 1
- UCRJTSIIAYHOHE-ULQDDVLXSA-N Leu-Tyr-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UCRJTSIIAYHOHE-ULQDDVLXSA-N 0.000 description 1
- VHTIZYYHIUHMCA-JYJNAYRXSA-N Leu-Tyr-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VHTIZYYHIUHMCA-JYJNAYRXSA-N 0.000 description 1
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 1
- WFCKERTZVCQXKH-KBPBESRZSA-N Leu-Tyr-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O WFCKERTZVCQXKH-KBPBESRZSA-N 0.000 description 1
- 108090001030 Lipoproteins Proteins 0.000 description 1
- 102000004895 Lipoproteins Human genes 0.000 description 1
- 241001625930 Luria Species 0.000 description 1
- 239000006137 Luria-Bertani broth Substances 0.000 description 1
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 1
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 1
- WXJKFRMKJORORD-DCAQKATOSA-N Lys-Arg-Ala Chemical compound NC(=N)NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CCCCN WXJKFRMKJORORD-DCAQKATOSA-N 0.000 description 1
- NQCJGQHHYZNUDK-DCAQKATOSA-N Lys-Arg-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CCCN=C(N)N NQCJGQHHYZNUDK-DCAQKATOSA-N 0.000 description 1
- ZQCVMVCVPFYXHZ-SRVKXCTJSA-N Lys-Asn-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN ZQCVMVCVPFYXHZ-SRVKXCTJSA-N 0.000 description 1
- YVSHZSUKQHNDHD-KKUMJFAQSA-N Lys-Asn-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N YVSHZSUKQHNDHD-KKUMJFAQSA-N 0.000 description 1
- FLCMXEFCTLXBTL-DCAQKATOSA-N Lys-Asp-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N FLCMXEFCTLXBTL-DCAQKATOSA-N 0.000 description 1
- OVIVOCSURJYCTM-GUBZILKMSA-N Lys-Asp-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O OVIVOCSURJYCTM-GUBZILKMSA-N 0.000 description 1
- NRQRKMYZONPCTM-CIUDSAMLSA-N Lys-Asp-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O NRQRKMYZONPCTM-CIUDSAMLSA-N 0.000 description 1
- KWUKZRFFKPLUPE-HJGDQZAQSA-N Lys-Asp-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWUKZRFFKPLUPE-HJGDQZAQSA-N 0.000 description 1
- NTBFKPBULZGXQL-KKUMJFAQSA-N Lys-Asp-Tyr Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NTBFKPBULZGXQL-KKUMJFAQSA-N 0.000 description 1
- MRWXLRGAFDOILG-DCAQKATOSA-N Lys-Gln-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MRWXLRGAFDOILG-DCAQKATOSA-N 0.000 description 1
- HEWWNLVEWBJBKA-WDCWCFNPSA-N Lys-Gln-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCCN HEWWNLVEWBJBKA-WDCWCFNPSA-N 0.000 description 1
- DRCILAJNUJKAHC-SRVKXCTJSA-N Lys-Glu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DRCILAJNUJKAHC-SRVKXCTJSA-N 0.000 description 1
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 1
- GCMWRRQAKQXDED-IUCAKERBSA-N Lys-Glu-Gly Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)N[C@@H](CCC([O-])=O)C(=O)NCC([O-])=O GCMWRRQAKQXDED-IUCAKERBSA-N 0.000 description 1
- JZMGVXLDOQOKAH-UWVGGRQHSA-N Lys-Gly-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O JZMGVXLDOQOKAH-UWVGGRQHSA-N 0.000 description 1
- HAUUXTXKJNVIFY-ONGXEEELSA-N Lys-Gly-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAUUXTXKJNVIFY-ONGXEEELSA-N 0.000 description 1
- QBEPTBMRQALPEV-MNXVOIDGSA-N Lys-Ile-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN QBEPTBMRQALPEV-MNXVOIDGSA-N 0.000 description 1
- IVFUVMSKSFSFBT-NHCYSSNCSA-N Lys-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN IVFUVMSKSFSFBT-NHCYSSNCSA-N 0.000 description 1
- JYXBNQOKPRQNQS-YTFOTSKYSA-N Lys-Ile-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JYXBNQOKPRQNQS-YTFOTSKYSA-N 0.000 description 1
- CBNMHRCLYBJIIZ-XUXIUFHCSA-N Lys-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCCN)N CBNMHRCLYBJIIZ-XUXIUFHCSA-N 0.000 description 1
- NCZIQZYZPUPMKY-PPCPHDFISA-N Lys-Ile-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NCZIQZYZPUPMKY-PPCPHDFISA-N 0.000 description 1
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 1
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 1
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 1
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 1
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 1
- YDDDRTIPNTWGIG-SRVKXCTJSA-N Lys-Lys-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O YDDDRTIPNTWGIG-SRVKXCTJSA-N 0.000 description 1
- WKUXWMWQTOYTFI-SRVKXCTJSA-N Lys-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N WKUXWMWQTOYTFI-SRVKXCTJSA-N 0.000 description 1
- MTBBHUKKPWKXBT-ULQDDVLXSA-N Lys-Met-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MTBBHUKKPWKXBT-ULQDDVLXSA-N 0.000 description 1
- WLXGMVVHTIUPHE-ULQDDVLXSA-N Lys-Phe-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O WLXGMVVHTIUPHE-ULQDDVLXSA-N 0.000 description 1
- GHKXHCMRAUYLBS-CIUDSAMLSA-N Lys-Ser-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O GHKXHCMRAUYLBS-CIUDSAMLSA-N 0.000 description 1
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 1
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 1
- SQXZLVXQXWILKW-KKUMJFAQSA-N Lys-Ser-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQXZLVXQXWILKW-KKUMJFAQSA-N 0.000 description 1
- DIBZLYZXTSVGLN-CIUDSAMLSA-N Lys-Ser-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O DIBZLYZXTSVGLN-CIUDSAMLSA-N 0.000 description 1
- CUHGAUZONORRIC-HJGDQZAQSA-N Lys-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N)O CUHGAUZONORRIC-HJGDQZAQSA-N 0.000 description 1
- GIKFNMZSGYAPEJ-HJGDQZAQSA-N Lys-Thr-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O GIKFNMZSGYAPEJ-HJGDQZAQSA-N 0.000 description 1
- RPWTZTBIFGENIA-VOAKCMCISA-N Lys-Thr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RPWTZTBIFGENIA-VOAKCMCISA-N 0.000 description 1
- YCJCEMKOZOYBEF-OEAJRASXSA-N Lys-Thr-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YCJCEMKOZOYBEF-OEAJRASXSA-N 0.000 description 1
- SEZADXQOJJTXPG-VFAJRCTISA-N Lys-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCCN)N)O SEZADXQOJJTXPG-VFAJRCTISA-N 0.000 description 1
- CFOLERIRBUAYAD-HOCLYGCPSA-N Lys-Trp-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(O)=O CFOLERIRBUAYAD-HOCLYGCPSA-N 0.000 description 1
- AWMMBHDKERMOID-YTQUADARSA-N Lys-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CCCCN)N)C(=O)O AWMMBHDKERMOID-YTQUADARSA-N 0.000 description 1
- PELXPRPDQRFBGQ-KKUMJFAQSA-N Lys-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N)O PELXPRPDQRFBGQ-KKUMJFAQSA-N 0.000 description 1
- IEIHKHYMBIYQTH-YESZJQIVSA-N Lys-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCCN)N)C(=O)O IEIHKHYMBIYQTH-YESZJQIVSA-N 0.000 description 1
- 102000018697 Membrane Proteins Human genes 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- WXHHTBVYQOSYSL-FXQIFTODSA-N Met-Ala-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O WXHHTBVYQOSYSL-FXQIFTODSA-N 0.000 description 1
- RJEFZSIVBHGRQJ-SRVKXCTJSA-N Met-Arg-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O RJEFZSIVBHGRQJ-SRVKXCTJSA-N 0.000 description 1
- HDNOQCZWJGGHSS-VEVYYDQMSA-N Met-Asn-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HDNOQCZWJGGHSS-VEVYYDQMSA-N 0.000 description 1
- OSOLWRWQADPDIQ-DCAQKATOSA-N Met-Asp-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OSOLWRWQADPDIQ-DCAQKATOSA-N 0.000 description 1
- UOENBSHXYCHSAU-YUMQZZPRSA-N Met-Gln-Gly Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O UOENBSHXYCHSAU-YUMQZZPRSA-N 0.000 description 1
- AWOMRHGUWFBDNU-ZPFDUUQYSA-N Met-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCSC)N AWOMRHGUWFBDNU-ZPFDUUQYSA-N 0.000 description 1
- NCVJJAJVWILAGI-SRVKXCTJSA-N Met-Gln-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N NCVJJAJVWILAGI-SRVKXCTJSA-N 0.000 description 1
- YORIKIDJCPKBON-YUMQZZPRSA-N Met-Glu-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YORIKIDJCPKBON-YUMQZZPRSA-N 0.000 description 1
- GVIVXNFKJQFTCE-YUMQZZPRSA-N Met-Gly-Gln Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O GVIVXNFKJQFTCE-YUMQZZPRSA-N 0.000 description 1
- PPHLBTXVBJNKOB-FDARSICLSA-N Met-Ile-Trp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O PPHLBTXVBJNKOB-FDARSICLSA-N 0.000 description 1
- LCPUWQLULVXROY-RHYQMDGZSA-N Met-Lys-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LCPUWQLULVXROY-RHYQMDGZSA-N 0.000 description 1
- YLDSJJOGQNEQJK-AVGNSLFASA-N Met-Pro-Leu Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O YLDSJJOGQNEQJK-AVGNSLFASA-N 0.000 description 1
- CIDICGYKRUTYLE-FXQIFTODSA-N Met-Ser-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O CIDICGYKRUTYLE-FXQIFTODSA-N 0.000 description 1
- FXBKQTOGURNXSL-HJGDQZAQSA-N Met-Thr-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O FXBKQTOGURNXSL-HJGDQZAQSA-N 0.000 description 1
- TWEWRDAAIYBJTO-ULQDDVLXSA-N Met-Tyr-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N TWEWRDAAIYBJTO-ULQDDVLXSA-N 0.000 description 1
- PNHRPOWKRRJATF-IHRRRGAJSA-N Met-Tyr-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 PNHRPOWKRRJATF-IHRRRGAJSA-N 0.000 description 1
- GHQFLTYXGUETFD-UFYCRDLUSA-N Met-Tyr-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N GHQFLTYXGUETFD-UFYCRDLUSA-N 0.000 description 1
- 101100231592 Mus musculus Hnmt gene Proteins 0.000 description 1
- 241000187480 Mycobacterium smegmatis Species 0.000 description 1
- OKIZCWYLBDKLSU-UHFFFAOYSA-M N,N,N-Trimethylmethanaminium chloride Chemical compound [Cl-].C[N+](C)(C)C OKIZCWYLBDKLSU-UHFFFAOYSA-M 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- 241000588653 Neisseria Species 0.000 description 1
- GEYBMYRBIABFTA-VIFPVBQESA-N O-methyl-L-tyrosine Chemical compound COC1=CC=C(C[C@H](N)C(O)=O)C=C1 GEYBMYRBIABFTA-VIFPVBQESA-N 0.000 description 1
- 102220475893 Oligophrenin-1_K128Y_mutation Human genes 0.000 description 1
- 101710116435 Outer membrane protein Proteins 0.000 description 1
- FPTXMUIBLMGTQH-ONGXEEELSA-N Phe-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 FPTXMUIBLMGTQH-ONGXEEELSA-N 0.000 description 1
- UHRNIXJAGGLKHP-DLOVCJGASA-N Phe-Ala-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O UHRNIXJAGGLKHP-DLOVCJGASA-N 0.000 description 1
- NOFBJKKOPKJDCO-KKXDTOCCSA-N Phe-Ala-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NOFBJKKOPKJDCO-KKXDTOCCSA-N 0.000 description 1
- LGBVMDMZZFYSFW-HJWJTTGWSA-N Phe-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CC=CC=C1)N LGBVMDMZZFYSFW-HJWJTTGWSA-N 0.000 description 1
- MECSIDWUTYRHRJ-KKUMJFAQSA-N Phe-Asn-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O MECSIDWUTYRHRJ-KKUMJFAQSA-N 0.000 description 1
- WGXOKDLDIWSOCV-MELADBBJSA-N Phe-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O WGXOKDLDIWSOCV-MELADBBJSA-N 0.000 description 1
- LXVFHIBXOWJTKZ-BZSNNMDCSA-N Phe-Asn-Tyr Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O LXVFHIBXOWJTKZ-BZSNNMDCSA-N 0.000 description 1
- DJPXNKUDJKGQEE-BZSNNMDCSA-N Phe-Asp-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DJPXNKUDJKGQEE-BZSNNMDCSA-N 0.000 description 1
- FRPVPGRXUKFEQE-YDHLFZDLSA-N Phe-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O FRPVPGRXUKFEQE-YDHLFZDLSA-N 0.000 description 1
- ABQFNJAFONNUTH-FHWLQOOXSA-N Phe-Gln-Tyr Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N ABQFNJAFONNUTH-FHWLQOOXSA-N 0.000 description 1
- MGECUMGTSHYHEJ-QEWYBTABSA-N Phe-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MGECUMGTSHYHEJ-QEWYBTABSA-N 0.000 description 1
- JWQWPTLEOFNCGX-AVGNSLFASA-N Phe-Glu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 JWQWPTLEOFNCGX-AVGNSLFASA-N 0.000 description 1
- QPVFUAUFEBPIPT-CDMKHQONSA-N Phe-Gly-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O QPVFUAUFEBPIPT-CDMKHQONSA-N 0.000 description 1
- VZFPYFRVHMSSNA-JURCDPSOSA-N Phe-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=CC=C1 VZFPYFRVHMSSNA-JURCDPSOSA-N 0.000 description 1
- GYEPCBNTTRORKW-PCBIJLKTSA-N Phe-Ile-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O GYEPCBNTTRORKW-PCBIJLKTSA-N 0.000 description 1
- WEMYTDDMDBLPMI-DKIMLUQUSA-N Phe-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N WEMYTDDMDBLPMI-DKIMLUQUSA-N 0.000 description 1
- CWFGECHCRMGPPT-MXAVVETBSA-N Phe-Ile-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O CWFGECHCRMGPPT-MXAVVETBSA-N 0.000 description 1
- BYAIIACBWBOJCU-URLPEUOOSA-N Phe-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BYAIIACBWBOJCU-URLPEUOOSA-N 0.000 description 1
- KXUZHWXENMYOHC-QEJZJMRPSA-N Phe-Leu-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O KXUZHWXENMYOHC-QEJZJMRPSA-N 0.000 description 1
- OSBADCBXAMSPQD-YESZJQIVSA-N Phe-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N OSBADCBXAMSPQD-YESZJQIVSA-N 0.000 description 1
- YCCUXNNKXDGMAM-KKUMJFAQSA-N Phe-Leu-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YCCUXNNKXDGMAM-KKUMJFAQSA-N 0.000 description 1
- KNYPNEYICHHLQL-ACRUOGEOSA-N Phe-Leu-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 KNYPNEYICHHLQL-ACRUOGEOSA-N 0.000 description 1
- SCKXGHWQPPURGT-KKUMJFAQSA-N Phe-Lys-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O SCKXGHWQPPURGT-KKUMJFAQSA-N 0.000 description 1
- GPLWGAYGROGDEN-BZSNNMDCSA-N Phe-Phe-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O GPLWGAYGROGDEN-BZSNNMDCSA-N 0.000 description 1
- JXQVYPWVGUOIDV-MXAVVETBSA-N Phe-Ser-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JXQVYPWVGUOIDV-MXAVVETBSA-N 0.000 description 1
- GNRMAQSIROFNMI-IXOXFDKPSA-N Phe-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GNRMAQSIROFNMI-IXOXFDKPSA-N 0.000 description 1
- APMXLWHMIVWLLR-BZSNNMDCSA-N Phe-Tyr-Ser Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(O)=O)C1=CC=CC=C1 APMXLWHMIVWLLR-BZSNNMDCSA-N 0.000 description 1
- IPVPGAADZXRZSH-RNXOBYDBSA-N Phe-Tyr-Trp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IPVPGAADZXRZSH-RNXOBYDBSA-N 0.000 description 1
- KUSYCSMTTHSZOA-DZKIICNBSA-N Phe-Val-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N KUSYCSMTTHSZOA-DZKIICNBSA-N 0.000 description 1
- 102220510109 Phospholipid scramblase 3_T21D_mutation Human genes 0.000 description 1
- OCSACVPBMIYNJE-GUBZILKMSA-N Pro-Arg-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O OCSACVPBMIYNJE-GUBZILKMSA-N 0.000 description 1
- INXAPZFIOVGHSV-CIUDSAMLSA-N Pro-Asn-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 INXAPZFIOVGHSV-CIUDSAMLSA-N 0.000 description 1
- XROLYVMNVIKVEM-BQBZGAKWSA-N Pro-Asn-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O XROLYVMNVIKVEM-BQBZGAKWSA-N 0.000 description 1
- SWXSLPHTJVAWDF-VEVYYDQMSA-N Pro-Asn-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWXSLPHTJVAWDF-VEVYYDQMSA-N 0.000 description 1
- GLEOIKLQBZNKJZ-WDSKDSINSA-N Pro-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 GLEOIKLQBZNKJZ-WDSKDSINSA-N 0.000 description 1
- WPQKSRHDTMRSJM-CIUDSAMLSA-N Pro-Asp-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 WPQKSRHDTMRSJM-CIUDSAMLSA-N 0.000 description 1
- KPDRZQUWJKTMBP-DCAQKATOSA-N Pro-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 KPDRZQUWJKTMBP-DCAQKATOSA-N 0.000 description 1
- HXOLCSYHGRNXJJ-IHRRRGAJSA-N Pro-Asp-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HXOLCSYHGRNXJJ-IHRRRGAJSA-N 0.000 description 1
- DIFXZGPHVCIVSQ-CIUDSAMLSA-N Pro-Gln-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DIFXZGPHVCIVSQ-CIUDSAMLSA-N 0.000 description 1
- VPEVBAUSTBWQHN-NHCYSSNCSA-N Pro-Glu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O VPEVBAUSTBWQHN-NHCYSSNCSA-N 0.000 description 1
- VYWNORHENYEQDW-YUMQZZPRSA-N Pro-Gly-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 VYWNORHENYEQDW-YUMQZZPRSA-N 0.000 description 1
- UIMCLYYSUCIUJM-UWVGGRQHSA-N Pro-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 UIMCLYYSUCIUJM-UWVGGRQHSA-N 0.000 description 1
- FEVDNIBDCRKMER-IUCAKERBSA-N Pro-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEVDNIBDCRKMER-IUCAKERBSA-N 0.000 description 1
- AFXCXDQNRXTSBD-FJXKBIBVSA-N Pro-Gly-Thr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O AFXCXDQNRXTSBD-FJXKBIBVSA-N 0.000 description 1
- LCUOTSLIVGSGAU-AVGNSLFASA-N Pro-His-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LCUOTSLIVGSGAU-AVGNSLFASA-N 0.000 description 1
- AQGUSRZKDZYGGV-GMOBBJLQSA-N Pro-Ile-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O AQGUSRZKDZYGGV-GMOBBJLQSA-N 0.000 description 1
- XYHMFGGWNOFUOU-QXEWZRGKSA-N Pro-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 XYHMFGGWNOFUOU-QXEWZRGKSA-N 0.000 description 1
- FMLRRBDLBJLJIK-DCAQKATOSA-N Pro-Leu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FMLRRBDLBJLJIK-DCAQKATOSA-N 0.000 description 1
- SUENWIFTSTWUKD-AVGNSLFASA-N Pro-Leu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SUENWIFTSTWUKD-AVGNSLFASA-N 0.000 description 1
- INDVYIOKMXFQFM-SRVKXCTJSA-N Pro-Lys-Gln Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O INDVYIOKMXFQFM-SRVKXCTJSA-N 0.000 description 1
- MLKVIVZCFYRTIR-KKUMJFAQSA-N Pro-Phe-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLKVIVZCFYRTIR-KKUMJFAQSA-N 0.000 description 1
- JIWJRKNYLSHONY-KKUMJFAQSA-N Pro-Phe-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JIWJRKNYLSHONY-KKUMJFAQSA-N 0.000 description 1
- SWRNSCMUXRLHCR-ULQDDVLXSA-N Pro-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 SWRNSCMUXRLHCR-ULQDDVLXSA-N 0.000 description 1
- POQFNPILEQEODH-FXQIFTODSA-N Pro-Ser-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O POQFNPILEQEODH-FXQIFTODSA-N 0.000 description 1
- KWMZPPWYBVZIER-XGEHTFHBSA-N Pro-Ser-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWMZPPWYBVZIER-XGEHTFHBSA-N 0.000 description 1
- WVXQQUWOKUZIEG-VEVYYDQMSA-N Pro-Thr-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O WVXQQUWOKUZIEG-VEVYYDQMSA-N 0.000 description 1
- DCHQYSOGURGJST-FJXKBIBVSA-N Pro-Thr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O DCHQYSOGURGJST-FJXKBIBVSA-N 0.000 description 1
- CHYAYDLYYIJCKY-OSUNSFLBSA-N Pro-Thr-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CHYAYDLYYIJCKY-OSUNSFLBSA-N 0.000 description 1
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 1
- ZMLRZBWCXPQADC-TUAOUCFPSA-N Pro-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ZMLRZBWCXPQADC-TUAOUCFPSA-N 0.000 description 1
- PGSWNLRYYONGPE-JYJNAYRXSA-N Pro-Val-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PGSWNLRYYONGPE-JYJNAYRXSA-N 0.000 description 1
- 229940124158 Protease/peptidase inhibitor Drugs 0.000 description 1
- 101000624394 Pseudomonas entomophila (strain L48) Monalysin Proteins 0.000 description 1
- CVBNMWXECPZOLM-UHFFFAOYSA-N Rhamnetin Natural products COc1cc(O)c2C(=O)C(=C(Oc2c1)c3ccc(O)c(O)c3O)O CVBNMWXECPZOLM-UHFFFAOYSA-N 0.000 description 1
- MWMKFWJYRRGXOR-ZLUOBGJFSA-N Ser-Ala-Asn Chemical compound N[C@H](C(=O)N[C@H](C(=O)N[C@H](C(=O)O)CC(N)=O)C)CO MWMKFWJYRRGXOR-ZLUOBGJFSA-N 0.000 description 1
- MMGJPDWSIOAGTH-ACZMJKKPSA-N Ser-Ala-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MMGJPDWSIOAGTH-ACZMJKKPSA-N 0.000 description 1
- SRTCFKGBYBZRHA-ACZMJKKPSA-N Ser-Ala-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SRTCFKGBYBZRHA-ACZMJKKPSA-N 0.000 description 1
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 1
- DWUIECHTAMYEFL-XVYDVKMFSA-N Ser-Ala-His Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 DWUIECHTAMYEFL-XVYDVKMFSA-N 0.000 description 1
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 1
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 1
- PZZJMBYSYAKYPK-UWJYBYFXSA-N Ser-Ala-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PZZJMBYSYAKYPK-UWJYBYFXSA-N 0.000 description 1
- QVOGDCQNGLBNCR-FXQIFTODSA-N Ser-Arg-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O QVOGDCQNGLBNCR-FXQIFTODSA-N 0.000 description 1
- OYEDZGNMSBZCIM-XGEHTFHBSA-N Ser-Arg-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OYEDZGNMSBZCIM-XGEHTFHBSA-N 0.000 description 1
- XVAUJOAYHWWNQF-ZLUOBGJFSA-N Ser-Asn-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O XVAUJOAYHWWNQF-ZLUOBGJFSA-N 0.000 description 1
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 1
- DKKGAAJTDKHWOD-BIIVOSGPSA-N Ser-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)C(=O)O DKKGAAJTDKHWOD-BIIVOSGPSA-N 0.000 description 1
- UGJRQLURDVGULT-LKXGYXEUSA-N Ser-Asn-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UGJRQLURDVGULT-LKXGYXEUSA-N 0.000 description 1
- CNIIKZQXBBQHCX-FXQIFTODSA-N Ser-Asp-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O CNIIKZQXBBQHCX-FXQIFTODSA-N 0.000 description 1
- OHKLFYXEOGGGCK-ZLUOBGJFSA-N Ser-Asp-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OHKLFYXEOGGGCK-ZLUOBGJFSA-N 0.000 description 1
- MMAPOBOTRUVNKJ-ZLUOBGJFSA-N Ser-Asp-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O MMAPOBOTRUVNKJ-ZLUOBGJFSA-N 0.000 description 1
- HEQPKICPPDOSIN-SRVKXCTJSA-N Ser-Asp-Tyr Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HEQPKICPPDOSIN-SRVKXCTJSA-N 0.000 description 1
- YPUSXTWURJANKF-KBIXCLLPSA-N Ser-Gln-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YPUSXTWURJANKF-KBIXCLLPSA-N 0.000 description 1
- KJMOINFQVCCSDX-XKBZYTNZSA-N Ser-Gln-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KJMOINFQVCCSDX-XKBZYTNZSA-N 0.000 description 1
- VDVYTKZBMFADQH-AVGNSLFASA-N Ser-Gln-Tyr Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 VDVYTKZBMFADQH-AVGNSLFASA-N 0.000 description 1
- PVDTYLHUWAEYGY-CIUDSAMLSA-N Ser-Glu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PVDTYLHUWAEYGY-CIUDSAMLSA-N 0.000 description 1
- QKQDTEYDEIJPNK-GUBZILKMSA-N Ser-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO QKQDTEYDEIJPNK-GUBZILKMSA-N 0.000 description 1
- GZBKRJVCRMZAST-XKBZYTNZSA-N Ser-Glu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZBKRJVCRMZAST-XKBZYTNZSA-N 0.000 description 1
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 1
- JFWDJFULOLKQFY-QWRGUYRKSA-N Ser-Gly-Phe Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JFWDJFULOLKQFY-QWRGUYRKSA-N 0.000 description 1
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 1
- BXLYSRPHVMCOPS-ACZMJKKPSA-N Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CO BXLYSRPHVMCOPS-ACZMJKKPSA-N 0.000 description 1
- BKZYBLLIBOBOOW-GHCJXIJMSA-N Ser-Ile-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O BKZYBLLIBOBOOW-GHCJXIJMSA-N 0.000 description 1
- DJACUBDEDBZKLQ-KBIXCLLPSA-N Ser-Ile-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O DJACUBDEDBZKLQ-KBIXCLLPSA-N 0.000 description 1
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 1
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 1
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 1
- LRZLZIUXQBIWTB-KATARQTJSA-N Ser-Lys-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRZLZIUXQBIWTB-KATARQTJSA-N 0.000 description 1
- PMCMLDNPAZUYGI-DCAQKATOSA-N Ser-Lys-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMCMLDNPAZUYGI-DCAQKATOSA-N 0.000 description 1
- VIIJCAQMJBHSJH-FXQIFTODSA-N Ser-Met-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O VIIJCAQMJBHSJH-FXQIFTODSA-N 0.000 description 1
- WOJYIMBIKTWKJO-KKUMJFAQSA-N Ser-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CO)N WOJYIMBIKTWKJO-KKUMJFAQSA-N 0.000 description 1
- KZPRPBLHYMZIMH-MXAVVETBSA-N Ser-Phe-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZPRPBLHYMZIMH-MXAVVETBSA-N 0.000 description 1
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 1
- JLKWJWPDXPKKHI-FXQIFTODSA-N Ser-Pro-Asn Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CC(=O)N)C(=O)O JLKWJWPDXPKKHI-FXQIFTODSA-N 0.000 description 1
- QPPYAWVLAVXISR-DCAQKATOSA-N Ser-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O QPPYAWVLAVXISR-DCAQKATOSA-N 0.000 description 1
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 1
- ZKOKTQPHFMRSJP-YJRXYDGGSA-N Ser-Thr-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKOKTQPHFMRSJP-YJRXYDGGSA-N 0.000 description 1
- YXEYTHXDRDAIOJ-CWRNSKLLSA-N Ser-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CO)N)C(=O)O YXEYTHXDRDAIOJ-CWRNSKLLSA-N 0.000 description 1
- PQEQXWRVHQAAKS-SRVKXCTJSA-N Ser-Tyr-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CO)N)CC1=CC=C(O)C=C1 PQEQXWRVHQAAKS-SRVKXCTJSA-N 0.000 description 1
- VEVYMLNYMULSMS-AVGNSLFASA-N Ser-Tyr-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VEVYMLNYMULSMS-AVGNSLFASA-N 0.000 description 1
- HKHCTNFKZXAMIF-KKUMJFAQSA-N Ser-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CC=C(O)C=C1 HKHCTNFKZXAMIF-KKUMJFAQSA-N 0.000 description 1
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 1
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Chemical group OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 241000242736 Stichodactyla Species 0.000 description 1
- 241000582785 Stichodactyla gigantea Species 0.000 description 1
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 1
- IRKWVRSEQFTGGV-VEVYYDQMSA-N Thr-Asn-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IRKWVRSEQFTGGV-VEVYYDQMSA-N 0.000 description 1
- CTONFVDJYCAMQM-IUKAMOBKSA-N Thr-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H]([C@@H](C)O)N CTONFVDJYCAMQM-IUKAMOBKSA-N 0.000 description 1
- PQLXHSACXPGWPD-GSSVUCPTSA-N Thr-Asn-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PQLXHSACXPGWPD-GSSVUCPTSA-N 0.000 description 1
- VBPDMBAFBRDZSK-HOUAVDHOSA-N Thr-Asn-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O VBPDMBAFBRDZSK-HOUAVDHOSA-N 0.000 description 1
- JVTHIXKSVYEWNI-JRQIVUDYSA-N Thr-Asn-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JVTHIXKSVYEWNI-JRQIVUDYSA-N 0.000 description 1
- VXMHQKHDKCATDV-VEVYYDQMSA-N Thr-Asp-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VXMHQKHDKCATDV-VEVYYDQMSA-N 0.000 description 1
- GKMYGVQDGVYCPC-IUKAMOBKSA-N Thr-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H]([C@@H](C)O)N GKMYGVQDGVYCPC-IUKAMOBKSA-N 0.000 description 1
- OYTNZCBFDXGQGE-XQXXSGGOSA-N Thr-Gln-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O OYTNZCBFDXGQGE-XQXXSGGOSA-N 0.000 description 1
- WLDUCKSCDRIVLJ-NUMRIWBASA-N Thr-Gln-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O WLDUCKSCDRIVLJ-NUMRIWBASA-N 0.000 description 1
- LHEZGZQRLDBSRR-WDCWCFNPSA-N Thr-Glu-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LHEZGZQRLDBSRR-WDCWCFNPSA-N 0.000 description 1
- BNGDYRRHRGOPHX-IFFSRLJSSA-N Thr-Glu-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O BNGDYRRHRGOPHX-IFFSRLJSSA-N 0.000 description 1
- XFTYVCHLARBHBQ-FOHZUACHSA-N Thr-Gly-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XFTYVCHLARBHBQ-FOHZUACHSA-N 0.000 description 1
- NIEWSKWFURSECR-FOHZUACHSA-N Thr-Gly-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NIEWSKWFURSECR-FOHZUACHSA-N 0.000 description 1
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 1
- CYVQBKQYQGEELV-NKIYYHGXSA-N Thr-His-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O CYVQBKQYQGEELV-NKIYYHGXSA-N 0.000 description 1
- ADPHPKGWVDHWML-PPCPHDFISA-N Thr-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N ADPHPKGWVDHWML-PPCPHDFISA-N 0.000 description 1
- YJCVECXVYHZOBK-KNZXXDILSA-N Thr-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H]([C@@H](C)O)N YJCVECXVYHZOBK-KNZXXDILSA-N 0.000 description 1
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 1
- RRRRCRYTLZVCEN-HJGDQZAQSA-N Thr-Leu-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O RRRRCRYTLZVCEN-HJGDQZAQSA-N 0.000 description 1
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 1
- TZJSEJOXAIWOST-RHYQMDGZSA-N Thr-Lys-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N TZJSEJOXAIWOST-RHYQMDGZSA-N 0.000 description 1
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 1
- JLNMFGCJODTXDH-WEDXCCLWSA-N Thr-Lys-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O JLNMFGCJODTXDH-WEDXCCLWSA-N 0.000 description 1
- SPVHQURZJCUDQC-VOAKCMCISA-N Thr-Lys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O SPVHQURZJCUDQC-VOAKCMCISA-N 0.000 description 1
- MGJLBZFUXUGMML-VOAKCMCISA-N Thr-Lys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MGJLBZFUXUGMML-VOAKCMCISA-N 0.000 description 1
- KKPOGALELPLJTL-MEYUZBJRSA-N Thr-Lys-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKPOGALELPLJTL-MEYUZBJRSA-N 0.000 description 1
- PUEWAXRPXOEQOW-HJGDQZAQSA-N Thr-Met-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(O)=O PUEWAXRPXOEQOW-HJGDQZAQSA-N 0.000 description 1
- VGYVVSQFSSKZRJ-OEAJRASXSA-N Thr-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@H](O)C)CC1=CC=CC=C1 VGYVVSQFSSKZRJ-OEAJRASXSA-N 0.000 description 1
- BDYBHQWMHYDRKJ-UNQGMJICSA-N Thr-Phe-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)O)N)O BDYBHQWMHYDRKJ-UNQGMJICSA-N 0.000 description 1
- NWECYMJLJGCBOD-UNQGMJICSA-N Thr-Phe-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O NWECYMJLJGCBOD-UNQGMJICSA-N 0.000 description 1
- WTMPKZWHRCMMMT-KZVJFYERSA-N Thr-Pro-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WTMPKZWHRCMMMT-KZVJFYERSA-N 0.000 description 1
- NYQIZWROIMIQSL-VEVYYDQMSA-N Thr-Pro-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O NYQIZWROIMIQSL-VEVYYDQMSA-N 0.000 description 1
- NDXSOKGYKCGYKT-VEVYYDQMSA-N Thr-Pro-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O NDXSOKGYKCGYKT-VEVYYDQMSA-N 0.000 description 1
- MXDOAJQRJBMGMO-FJXKBIBVSA-N Thr-Pro-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O MXDOAJQRJBMGMO-FJXKBIBVSA-N 0.000 description 1
- GFRIEEKFXOVPIR-RHYQMDGZSA-N Thr-Pro-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O GFRIEEKFXOVPIR-RHYQMDGZSA-N 0.000 description 1
- IQPWNQRRAJHOKV-KATARQTJSA-N Thr-Ser-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN IQPWNQRRAJHOKV-KATARQTJSA-N 0.000 description 1
- HUPLKEHTTQBXSC-YJRXYDGGSA-N Thr-Ser-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUPLKEHTTQBXSC-YJRXYDGGSA-N 0.000 description 1
- YRJOLUDFVAUXLI-GSSVUCPTSA-N Thr-Thr-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O YRJOLUDFVAUXLI-GSSVUCPTSA-N 0.000 description 1
- CSNBWOJOEOPYIJ-UVOCVTCTSA-N Thr-Thr-Lys Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O CSNBWOJOEOPYIJ-UVOCVTCTSA-N 0.000 description 1
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 1
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 1
- KAJRRNHOVMZYBL-IRIUXVKKSA-N Thr-Tyr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAJRRNHOVMZYBL-IRIUXVKKSA-N 0.000 description 1
- PELIQFPESHBTMA-WLTAIBSBSA-N Thr-Tyr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 PELIQFPESHBTMA-WLTAIBSBSA-N 0.000 description 1
- CYCGARJWIQWPQM-YJRXYDGGSA-N Thr-Tyr-Ser Chemical compound C[C@@H](O)[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CO)C([O-])=O)CC1=CC=C(O)C=C1 CYCGARJWIQWPQM-YJRXYDGGSA-N 0.000 description 1
- YOPQYBJJNSIQGZ-JNPHEJMOSA-N Thr-Tyr-Tyr Chemical compound C([C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 YOPQYBJJNSIQGZ-JNPHEJMOSA-N 0.000 description 1
- SPIFGZFZMVLPHN-UNQGMJICSA-N Thr-Val-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SPIFGZFZMVLPHN-UNQGMJICSA-N 0.000 description 1
- QNXZCKMXHPULME-ZNSHCXBVSA-N Thr-Val-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O QNXZCKMXHPULME-ZNSHCXBVSA-N 0.000 description 1
- VYVBSMCZNHOZGD-RCWTZXSCSA-N Thr-Val-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O VYVBSMCZNHOZGD-RCWTZXSCSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- AUYYCJSJGJYCDS-LBPRGKRZSA-N Thyrolar Chemical compound IC1=CC(C[C@H](N)C(O)=O)=CC(I)=C1OC1=CC=C(O)C(I)=C1 AUYYCJSJGJYCDS-LBPRGKRZSA-N 0.000 description 1
- 108010031133 Transferrin-Binding Protein A Proteins 0.000 description 1
- BRBCKMMXKONBAA-KWBADKCTSA-N Trp-Ala-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 BRBCKMMXKONBAA-KWBADKCTSA-N 0.000 description 1
- CXUFDWZBHKUGKK-CABZTGNLSA-N Trp-Ala-Gly Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O)=CNC2=C1 CXUFDWZBHKUGKK-CABZTGNLSA-N 0.000 description 1
- XKGZEDNYGPNJAR-XIRDDKMYSA-N Trp-Asn-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N XKGZEDNYGPNJAR-XIRDDKMYSA-N 0.000 description 1
- QNTBGBCOEYNAPV-CWRNSKLLSA-N Trp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O QNTBGBCOEYNAPV-CWRNSKLLSA-N 0.000 description 1
- DEZKIRSBKKXUEV-NYVOZVTQSA-N Trp-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O)N DEZKIRSBKKXUEV-NYVOZVTQSA-N 0.000 description 1
- RERIQEJUYCLJQI-QRTARXTBSA-N Trp-Asp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RERIQEJUYCLJQI-QRTARXTBSA-N 0.000 description 1
- HXMJXDNSFVNSEH-IHPCNDPISA-N Trp-Cys-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)N HXMJXDNSFVNSEH-IHPCNDPISA-N 0.000 description 1
- LGEPIBQBGZTBHL-SXNHZJKMSA-N Trp-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N LGEPIBQBGZTBHL-SXNHZJKMSA-N 0.000 description 1
- MDDYTWOFHZFABW-SZMVWBNQSA-N Trp-Gln-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 MDDYTWOFHZFABW-SZMVWBNQSA-N 0.000 description 1
- HXNVJPQADLRHGR-JBACZVJFSA-N Trp-Glu-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)N HXNVJPQADLRHGR-JBACZVJFSA-N 0.000 description 1
- WSGPBCAGEGHKQJ-BBRMVZONSA-N Trp-Gly-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CNC2=CC=CC=C21)N WSGPBCAGEGHKQJ-BBRMVZONSA-N 0.000 description 1
- ORQGVWIUHICVKE-KCTSRDHCSA-N Trp-His-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O ORQGVWIUHICVKE-KCTSRDHCSA-N 0.000 description 1
- PGPCENKYTLDIFM-SZMVWBNQSA-N Trp-His-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O PGPCENKYTLDIFM-SZMVWBNQSA-N 0.000 description 1
- GQHAIUPYZPTADF-FDARSICLSA-N Trp-Ile-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 GQHAIUPYZPTADF-FDARSICLSA-N 0.000 description 1
- YPBYQWFZAAQMGW-XIRDDKMYSA-N Trp-Lys-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N YPBYQWFZAAQMGW-XIRDDKMYSA-N 0.000 description 1
- RZRDCZDUYHBGDT-BVSLBCMMSA-N Trp-Met-Tyr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RZRDCZDUYHBGDT-BVSLBCMMSA-N 0.000 description 1
- OJKVFAWXPGCJMF-BPUTZDHNSA-N Trp-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)N[C@@H](CO)C(=O)O OJKVFAWXPGCJMF-BPUTZDHNSA-N 0.000 description 1
- WSMVEHPVOYXPAQ-XIRDDKMYSA-N Trp-Ser-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N WSMVEHPVOYXPAQ-XIRDDKMYSA-N 0.000 description 1
- AGSYHLPWNXGVSG-NYVOZVTQSA-N Trp-Trp-Cys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)N[C@@H](CS)C(=O)O)N AGSYHLPWNXGVSG-NYVOZVTQSA-N 0.000 description 1
- CRCHQCUINSOGFD-JBACZVJFSA-N Trp-Tyr-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N CRCHQCUINSOGFD-JBACZVJFSA-N 0.000 description 1
- CYLQUSBOSWCHTO-BPUTZDHNSA-N Trp-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N CYLQUSBOSWCHTO-BPUTZDHNSA-N 0.000 description 1
- XQMGDVVKFRLQKH-BBRMVZONSA-N Trp-Val-Gly Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O)=CNC2=C1 XQMGDVVKFRLQKH-BBRMVZONSA-N 0.000 description 1
- SWSUXOKZKQRADK-FDARSICLSA-N Trp-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N SWSUXOKZKQRADK-FDARSICLSA-N 0.000 description 1
- DLZKEQQWXODGGZ-KWQFWETISA-N Tyr-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DLZKEQQWXODGGZ-KWQFWETISA-N 0.000 description 1
- FBVGQXJIXFZKSQ-GMVOTWDCSA-N Tyr-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N FBVGQXJIXFZKSQ-GMVOTWDCSA-N 0.000 description 1
- AKXBNSZMYAOGLS-STQMWFEESA-N Tyr-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AKXBNSZMYAOGLS-STQMWFEESA-N 0.000 description 1
- CRWOSTCODDFEKZ-HRCADAONSA-N Tyr-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O CRWOSTCODDFEKZ-HRCADAONSA-N 0.000 description 1
- DKKHULUSOSWGHS-UWJYBYFXSA-N Tyr-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N DKKHULUSOSWGHS-UWJYBYFXSA-N 0.000 description 1
- GFHYISDTIWZUSU-QWRGUYRKSA-N Tyr-Asn-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GFHYISDTIWZUSU-QWRGUYRKSA-N 0.000 description 1
- GAYLGYUVTDMLKC-UWJYBYFXSA-N Tyr-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GAYLGYUVTDMLKC-UWJYBYFXSA-N 0.000 description 1
- BEIGSKUPTIFYRZ-SRVKXCTJSA-N Tyr-Asp-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O BEIGSKUPTIFYRZ-SRVKXCTJSA-N 0.000 description 1
- RCLOWEZASFJFEX-KKUMJFAQSA-N Tyr-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RCLOWEZASFJFEX-KKUMJFAQSA-N 0.000 description 1
- YRBHLWWGSSQICE-IHRRRGAJSA-N Tyr-Asp-Met Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O YRBHLWWGSSQICE-IHRRRGAJSA-N 0.000 description 1
- MNMYOSZWCKYEDI-JRQIVUDYSA-N Tyr-Asp-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MNMYOSZWCKYEDI-JRQIVUDYSA-N 0.000 description 1
- YLRLHDFMMWDYTK-KKUMJFAQSA-N Tyr-Cys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 YLRLHDFMMWDYTK-KKUMJFAQSA-N 0.000 description 1
- UXUFNBVCPAWACG-SIUGBPQLSA-N Tyr-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N UXUFNBVCPAWACG-SIUGBPQLSA-N 0.000 description 1
- TWAVEIJGFCBWCG-JYJNAYRXSA-N Tyr-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N TWAVEIJGFCBWCG-JYJNAYRXSA-N 0.000 description 1
- WZQZUVWEPMGIMM-JYJNAYRXSA-N Tyr-Gln-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O WZQZUVWEPMGIMM-JYJNAYRXSA-N 0.000 description 1
- HKYTWJOWZTWBQB-AVGNSLFASA-N Tyr-Glu-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HKYTWJOWZTWBQB-AVGNSLFASA-N 0.000 description 1
- WVRUKYLYMFGKAN-IHRRRGAJSA-N Tyr-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 WVRUKYLYMFGKAN-IHRRRGAJSA-N 0.000 description 1
- NZFCWALTLNFHHC-JYJNAYRXSA-N Tyr-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NZFCWALTLNFHHC-JYJNAYRXSA-N 0.000 description 1
- ZRPLVTZTKPPSBT-AVGNSLFASA-N Tyr-Glu-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZRPLVTZTKPPSBT-AVGNSLFASA-N 0.000 description 1
- NJLQMKZSXYQRTO-FHWLQOOXSA-N Tyr-Glu-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 NJLQMKZSXYQRTO-FHWLQOOXSA-N 0.000 description 1
- PMDWYLVWHRTJIW-STQMWFEESA-N Tyr-Gly-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PMDWYLVWHRTJIW-STQMWFEESA-N 0.000 description 1
- HIINQLBHPIQYHN-JTQLQIEISA-N Tyr-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HIINQLBHPIQYHN-JTQLQIEISA-N 0.000 description 1
- KEANSLVUGJADPN-LKTVYLICSA-N Tyr-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=C(C=C2)O)N KEANSLVUGJADPN-LKTVYLICSA-N 0.000 description 1
- ADECJAKCRKPSOR-ULQDDVLXSA-N Tyr-His-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O ADECJAKCRKPSOR-ULQDDVLXSA-N 0.000 description 1
- GFJXBLSZOFWHAW-JYJNAYRXSA-N Tyr-His-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GFJXBLSZOFWHAW-JYJNAYRXSA-N 0.000 description 1
- DWAMXBFJNZIHMC-KBPBESRZSA-N Tyr-Leu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O DWAMXBFJNZIHMC-KBPBESRZSA-N 0.000 description 1
- PRONOHBTMLNXCZ-BZSNNMDCSA-N Tyr-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PRONOHBTMLNXCZ-BZSNNMDCSA-N 0.000 description 1
- ARJASMXQBRNAGI-YESZJQIVSA-N Tyr-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N ARJASMXQBRNAGI-YESZJQIVSA-N 0.000 description 1
- JAGGEZACYAAMIL-CQDKDKBSSA-N Tyr-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CC=C(C=C1)O)N JAGGEZACYAAMIL-CQDKDKBSSA-N 0.000 description 1
- GYKDRHDMGQUZPU-MGHWNKPDSA-N Tyr-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CC=C(C=C1)O)N GYKDRHDMGQUZPU-MGHWNKPDSA-N 0.000 description 1
- SBLZVFCEOCWRLS-BPNCWPANSA-N Tyr-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=C(C=C1)O)N SBLZVFCEOCWRLS-BPNCWPANSA-N 0.000 description 1
- KZOZXAYPVKKDIO-UFYCRDLUSA-N Tyr-Met-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 KZOZXAYPVKKDIO-UFYCRDLUSA-N 0.000 description 1
- JXGUUJMPCRXMSO-HJOGWXRNSA-N Tyr-Phe-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 JXGUUJMPCRXMSO-HJOGWXRNSA-N 0.000 description 1
- PHKQVWWHRYUCJL-HJOGWXRNSA-N Tyr-Phe-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PHKQVWWHRYUCJL-HJOGWXRNSA-N 0.000 description 1
- FGVFBDZSGQTYQX-UFYCRDLUSA-N Tyr-Phe-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O FGVFBDZSGQTYQX-UFYCRDLUSA-N 0.000 description 1
- VPEFOFYNHBWFNQ-UFYCRDLUSA-N Tyr-Pro-Tyr Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 VPEFOFYNHBWFNQ-UFYCRDLUSA-N 0.000 description 1
- IEWKKXZRJLTIOV-AVGNSLFASA-N Tyr-Ser-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O IEWKKXZRJLTIOV-AVGNSLFASA-N 0.000 description 1
- XYBNMHRFAUKPAW-IHRRRGAJSA-N Tyr-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CC=C(C=C1)O)N XYBNMHRFAUKPAW-IHRRRGAJSA-N 0.000 description 1
- UMSZZGTXGKHTFJ-SRVKXCTJSA-N Tyr-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 UMSZZGTXGKHTFJ-SRVKXCTJSA-N 0.000 description 1
- RIVVDNTUSRVTQT-IRIUXVKKSA-N Tyr-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O RIVVDNTUSRVTQT-IRIUXVKKSA-N 0.000 description 1
- VSYROIRKNBCULO-BWAGICSOSA-N Tyr-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)O VSYROIRKNBCULO-BWAGICSOSA-N 0.000 description 1
- XFEMMSGONWQACR-KJEVXHAQSA-N Tyr-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O XFEMMSGONWQACR-KJEVXHAQSA-N 0.000 description 1
- ZYVAAYAOTVJBSS-GMVOTWDCSA-N Tyr-Trp-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O ZYVAAYAOTVJBSS-GMVOTWDCSA-N 0.000 description 1
- MWUYSCVVPVITMW-IGNZVWTISA-N Tyr-Tyr-Ala Chemical compound C([C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 MWUYSCVVPVITMW-IGNZVWTISA-N 0.000 description 1
- OJCISMMNNUNNJA-BZSNNMDCSA-N Tyr-Tyr-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=C(O)C=C1 OJCISMMNNUNNJA-BZSNNMDCSA-N 0.000 description 1
- WYOBRXPIZVKNMF-IRXDYDNUSA-N Tyr-Tyr-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)NCC(O)=O)C1=CC=C(O)C=C1 WYOBRXPIZVKNMF-IRXDYDNUSA-N 0.000 description 1
- AFWXOGHZEKARFH-ACRUOGEOSA-N Tyr-Tyr-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=C(O)C=C1 AFWXOGHZEKARFH-ACRUOGEOSA-N 0.000 description 1
- HZDQUVQEVVYDDA-ACRUOGEOSA-N Tyr-Tyr-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HZDQUVQEVVYDDA-ACRUOGEOSA-N 0.000 description 1
- BUPRFDPUIJNOLS-UFYCRDLUSA-N Tyr-Tyr-Met Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCSC)C(O)=O BUPRFDPUIJNOLS-UFYCRDLUSA-N 0.000 description 1
- AGDDLOQMXUQPDY-BZSNNMDCSA-N Tyr-Tyr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O AGDDLOQMXUQPDY-BZSNNMDCSA-N 0.000 description 1
- RMRFSFXLFWWAJZ-HJOGWXRNSA-N Tyr-Tyr-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 RMRFSFXLFWWAJZ-HJOGWXRNSA-N 0.000 description 1
- ABSXSJZNRAQDDI-KJEVXHAQSA-N Tyr-Val-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ABSXSJZNRAQDDI-KJEVXHAQSA-N 0.000 description 1
- YKBUNNNRNZZUID-UFYCRDLUSA-N Tyr-Val-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YKBUNNNRNZZUID-UFYCRDLUSA-N 0.000 description 1
- REJBPZVUHYNMEN-LSJOCFKGSA-N Val-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N REJBPZVUHYNMEN-LSJOCFKGSA-N 0.000 description 1
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 1
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 1
- AUMNPAUHKUNHHN-BYULHYEWSA-N Val-Asn-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N AUMNPAUHKUNHHN-BYULHYEWSA-N 0.000 description 1
- OGNMURQZFMHFFD-NHCYSSNCSA-N Val-Asn-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N OGNMURQZFMHFFD-NHCYSSNCSA-N 0.000 description 1
- CGGVNFJRZJUVAE-BYULHYEWSA-N Val-Asp-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CGGVNFJRZJUVAE-BYULHYEWSA-N 0.000 description 1
- VUTHNLMCXKLLFI-LAEOZQHASA-N Val-Asp-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VUTHNLMCXKLLFI-LAEOZQHASA-N 0.000 description 1
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 1
- SCBITHMBEJNRHC-LSJOCFKGSA-N Val-Asp-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N SCBITHMBEJNRHC-LSJOCFKGSA-N 0.000 description 1
- CFSSLXZJEMERJY-NRPADANISA-N Val-Gln-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CFSSLXZJEMERJY-NRPADANISA-N 0.000 description 1
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 1
- CELJCNRXKZPTCX-XPUUQOCRSA-N Val-Gly-Ala Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O CELJCNRXKZPTCX-XPUUQOCRSA-N 0.000 description 1
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 1
- BEGDZYNDCNEGJZ-XVKPBYJWSA-N Val-Gly-Gln Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O BEGDZYNDCNEGJZ-XVKPBYJWSA-N 0.000 description 1
- WFENBJPLZMPVAX-XVKPBYJWSA-N Val-Gly-Glu Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O WFENBJPLZMPVAX-XVKPBYJWSA-N 0.000 description 1
- JVYIGCARISMLMV-HOCLYGCPSA-N Val-Gly-Trp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N JVYIGCARISMLMV-HOCLYGCPSA-N 0.000 description 1
- WJVLTYSHNXRCLT-NHCYSSNCSA-N Val-His-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WJVLTYSHNXRCLT-NHCYSSNCSA-N 0.000 description 1
- KDKLLPMFFGYQJD-CYDGBPFRSA-N Val-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N KDKLLPMFFGYQJD-CYDGBPFRSA-N 0.000 description 1
- BZMIYHIJVVJPCK-QSFUFRPTSA-N Val-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N BZMIYHIJVVJPCK-QSFUFRPTSA-N 0.000 description 1
- LKUDRJSNRWVGMS-QSFUFRPTSA-N Val-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LKUDRJSNRWVGMS-QSFUFRPTSA-N 0.000 description 1
- FTKXYXACXYOHND-XUXIUFHCSA-N Val-Ile-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O FTKXYXACXYOHND-XUXIUFHCSA-N 0.000 description 1
- SDUBQHUJJWQTEU-XUXIUFHCSA-N Val-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C(C)C)N SDUBQHUJJWQTEU-XUXIUFHCSA-N 0.000 description 1
- BZWUSZGQOILYEU-STECZYCISA-N Val-Ile-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BZWUSZGQOILYEU-STECZYCISA-N 0.000 description 1
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 1
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 1
- RWOGENDAOGMHLX-DCAQKATOSA-N Val-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N RWOGENDAOGMHLX-DCAQKATOSA-N 0.000 description 1
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 1
- SSYBNWFXCFNRFN-GUBZILKMSA-N Val-Pro-Ser Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O SSYBNWFXCFNRFN-GUBZILKMSA-N 0.000 description 1
- VIKZGAUAKQZDOF-NRPADANISA-N Val-Ser-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O VIKZGAUAKQZDOF-NRPADANISA-N 0.000 description 1
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 1
- MNSSBIHFEUUXNW-RCWTZXSCSA-N Val-Thr-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N MNSSBIHFEUUXNW-RCWTZXSCSA-N 0.000 description 1
- GVNLOVJNNDZUHS-RHYQMDGZSA-N Val-Thr-Lys Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O GVNLOVJNNDZUHS-RHYQMDGZSA-N 0.000 description 1
- PDDJTOSAVNRJRH-UNQGMJICSA-N Val-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](C(C)C)N)O PDDJTOSAVNRJRH-UNQGMJICSA-N 0.000 description 1
- DVLWZWNAQUBZBC-ZNSHCXBVSA-N Val-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N)O DVLWZWNAQUBZBC-ZNSHCXBVSA-N 0.000 description 1
- UEXPMFIAZZHEAD-HSHDSVGOSA-N Val-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](C(C)C)N)O UEXPMFIAZZHEAD-HSHDSVGOSA-N 0.000 description 1
- YLBNZCJFSVJDRJ-KJEVXHAQSA-N Val-Thr-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O YLBNZCJFSVJDRJ-KJEVXHAQSA-N 0.000 description 1
- JXCOEPXCBVCTRD-JYJNAYRXSA-N Val-Tyr-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N JXCOEPXCBVCTRD-JYJNAYRXSA-N 0.000 description 1
- GUIYPEKUEMQBIK-JSGCOSHPSA-N Val-Tyr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)NCC(O)=O GUIYPEKUEMQBIK-JSGCOSHPSA-N 0.000 description 1
- PGBMPFKFKXYROZ-UFYCRDLUSA-N Val-Tyr-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N PGBMPFKFKXYROZ-UFYCRDLUSA-N 0.000 description 1
- 238000002441 X-ray diffraction Methods 0.000 description 1
- UKDDQGWMHWQMBI-SOFRWFQSSA-N [(2R)-2,3-bis(3,7,11,15-tetramethylhexadecanoyloxy)propyl] 2-(trimethylazaniumyl)ethyl phosphate Chemical compound CC(C)CCCC(C)CCCC(C)CCCC(C)CC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CC(C)CCCC(C)CCCC(C)CCCC(C)C UKDDQGWMHWQMBI-SOFRWFQSSA-N 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 235000010419 agar Nutrition 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 1
- 108010070944 alanylhistidine Proteins 0.000 description 1
- 108010070783 alanyltyrosine Proteins 0.000 description 1
- GZCGUPFRVQAUEE-SLPGGIOYSA-N aldehydo-D-glucose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C=O GZCGUPFRVQAUEE-SLPGGIOYSA-N 0.000 description 1
- 229910052783 alkali metal Inorganic materials 0.000 description 1
- 229910001514 alkali metal chloride Inorganic materials 0.000 description 1
- 230000029936 alkylation Effects 0.000 description 1
- 238000005804 alkylation reaction Methods 0.000 description 1
- 108010078482 alpha(S1)-casein (90-94) Proteins 0.000 description 1
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 210000004381 amniotic fluid Anatomy 0.000 description 1
- 238000005571 anion exchange chromatography Methods 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 1
- 108010072041 arginyl-glycyl-aspartic acid Proteins 0.000 description 1
- 108010038850 arginyl-isoleucyl-tyrosine Proteins 0.000 description 1
- 108010084758 arginyl-tyrosyl-aspartic acid Proteins 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 229940009098 aspartate Drugs 0.000 description 1
- 108010057995 aspartyl-arginyl-valyl-tyrosyl-isoleucyl-histidyl-prolyl-phenylalanyl-histidyl-leucyl-valyl-isoleucyl-histidine Proteins 0.000 description 1
- 108010038633 aspartylglutamate Proteins 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 244000052616 bacterial pathogen Species 0.000 description 1
- 239000002585 base Substances 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- OWMVSZAMULFTJU-UHFFFAOYSA-N bis-tris Chemical group OCCN(CCO)C(CO)(CO)CO OWMVSZAMULFTJU-UHFFFAOYSA-N 0.000 description 1
- 229920001400 block copolymer Polymers 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000006172 buffering agent Substances 0.000 description 1
- 210000004900 c-terminal fragment Anatomy 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000003196 chaotropic effect Effects 0.000 description 1
- 239000002800 charge carrier Substances 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 235000000639 cyanocobalamin Nutrition 0.000 description 1
- 239000011666 cyanocobalamin Substances 0.000 description 1
- 229960002104 cyanocobalamin Drugs 0.000 description 1
- 108010016616 cysteinylglycine Proteins 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 238000004141 dimensional analysis Methods 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 239000003651 drinking water Substances 0.000 description 1
- 235000020188 drinking water Nutrition 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 239000008151 electrolyte solution Substances 0.000 description 1
- 238000001493 electron microscopy Methods 0.000 description 1
- 238000003372 electrophysiological method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 230000000763 evoking effect Effects 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 230000005669 field effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-L glutamate group Chemical group N[C@@H](CCC(=O)[O-])C(=O)[O-] WHUUTDBJXJRKMK-VKHMYHEASA-L 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 125000000404 glutamine group Chemical group N[C@@H](CCC(N)=O)C(=O)* 0.000 description 1
- 108010079547 glutamylmethionine Proteins 0.000 description 1
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 1
- 108010090037 glycyl-alanyl-isoleucine Proteins 0.000 description 1
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 1
- 108010081985 glycyl-cystinyl-aspartic acid Proteins 0.000 description 1
- 108010023364 glycyl-histidyl-arginine Proteins 0.000 description 1
- 108010028188 glycyl-histidyl-serine Proteins 0.000 description 1
- 108010020688 glycylhistidine Proteins 0.000 description 1
- 229940047650 haemophilus influenzae Drugs 0.000 description 1
- 229910052736 halogen Inorganic materials 0.000 description 1
- 125000005843 halogen group Chemical group 0.000 description 1
- 108010040030 histidinoalanine Proteins 0.000 description 1
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 108010025306 histidylleucine Proteins 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 238000002169 hydrotherapy Methods 0.000 description 1
- 238000002847 impedance measurement Methods 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 108010031424 isoleucyl-prolyl-proline Proteins 0.000 description 1
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 1
- 238000009533 lab test Methods 0.000 description 1
- 108010077158 leucinyl-arginyl-tryptophan Proteins 0.000 description 1
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 1
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 1
- 229950008325 levothyroxine Drugs 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000001972 liquid chromatography-electrospray ionisation mass spectrometry Methods 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 210000002751 lymph Anatomy 0.000 description 1
- 230000001320 lysogenic effect Effects 0.000 description 1
- 108010057952 lysyl-phenylalanyl-lysine Proteins 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 108010005942 methionylglycine Proteins 0.000 description 1
- 125000000250 methylamino group Chemical group [H]N(*)C([H])([H])[H] 0.000 description 1
- 125000000325 methylidene group Chemical group [H]C([H])=* 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000007479 molecular analysis Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 210000003097 mucus Anatomy 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 230000009438 off-target cleavage Effects 0.000 description 1
- LDCYZAJDBXYCGN-UHFFFAOYSA-N oxitriptan Natural products C1=C(O)C=C2C(CC(N)C(O)=O)=CNC2=C1 LDCYZAJDBXYCGN-UHFFFAOYSA-N 0.000 description 1
- TVIDEEHSOPHZBR-AWEZNQCLSA-N para-(benzoyl)-phenylalanine Chemical compound C1=CC(C[C@H](N)C(O)=O)=CC=C1C(=O)C1=CC=CC=C1 TVIDEEHSOPHZBR-AWEZNQCLSA-N 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 1
- 238000010647 peptide synthesis reaction Methods 0.000 description 1
- 150000002989 phenols Chemical class 0.000 description 1
- 150000002993 phenylalanine derivatives Chemical class 0.000 description 1
- 108010024607 phenylalanylalanine Proteins 0.000 description 1
- 108010018625 phenylalanylarginine Proteins 0.000 description 1
- 108010073101 phenylalanylleucine Proteins 0.000 description 1
- 239000008363 phosphate buffer Substances 0.000 description 1
- DCWXELXMIBXGTH-QMMMGPOBSA-N phosphonotyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(OP(O)(O)=O)C=C1 DCWXELXMIBXGTH-QMMMGPOBSA-N 0.000 description 1
- 108091005981 phosphorylated proteins Proteins 0.000 description 1
- 230000001766 physiological effect Effects 0.000 description 1
- 210000002381 plasma Anatomy 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 108091033319 polynucleotide Proteins 0.000 description 1
- 102000040430 polynucleotide Human genes 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 239000000276 potassium ferrocyanide Substances 0.000 description 1
- 238000012257 pre-denaturation Methods 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000011045 prefiltration Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 108010053725 prolylvaline Proteins 0.000 description 1
- 230000020978 protein processing Effects 0.000 description 1
- 238000000734 protein sequencing Methods 0.000 description 1
- 230000005588 protonation Effects 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000027756 respiratory electron transport chain Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 102220014646 rs150075979 Human genes 0.000 description 1
- 102220231438 rs1555979601 Human genes 0.000 description 1
- 239000012146 running buffer Substances 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 238000005464 sample preparation method Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000013535 sea water Substances 0.000 description 1
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 108010048818 seryl-histidine Proteins 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 150000003431 steroids Chemical class 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 239000012536 storage buffer Substances 0.000 description 1
- 210000004243 sweat Anatomy 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- XOGGUFAVLNCTRS-UHFFFAOYSA-N tetrapotassium;iron(2+);hexacyanide Chemical compound [K+].[K+].[K+].[K+].[Fe+2].N#[C-].N#[C-].N#[C-].N#[C-].N#[C-].N#[C-] XOGGUFAVLNCTRS-UHFFFAOYSA-N 0.000 description 1
- 125000000341 threoninyl group Chemical group [H]OC([H])(C([H])([H])[H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 1
- 102000035160 transmembrane proteins Human genes 0.000 description 1
- 108091005703 transmembrane proteins Proteins 0.000 description 1
- STCOOQWBFONSKY-UHFFFAOYSA-N tributyl phosphate Chemical compound CCCCOP(=O)(OCCCC)OCCCC STCOOQWBFONSKY-UHFFFAOYSA-N 0.000 description 1
- 229940035722 triiodothyronine Drugs 0.000 description 1
- 108700004896 tripeptide FEG Proteins 0.000 description 1
- 125000000430 tryptophan group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C2=C([H])C([H])=C([H])C([H])=C12 0.000 description 1
- 108010084932 tryptophyl-proline Proteins 0.000 description 1
- 230000005641 tunneling Effects 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 108010005834 tyrosyl-alanyl-glycine Proteins 0.000 description 1
- 108010020532 tyrosyl-proline Proteins 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 1
- 108010009962 valyltyrosine Proteins 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
- 108010027345 wheylin-1 peptide Proteins 0.000 description 1
- 235000021247 β-casein Nutrition 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/43504—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
- C07K14/43595—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from coelenteratae, e.g. medusae
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/01—Preparation of mutants without inserting foreign genetic material therein; Screening processes therefor
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6803—General methods of protein analysis not limited to specific proteins or families of proteins
- G01N33/6818—Sequencing of polypeptides
Abstract
본 발명은 유전자 조작된 나노기공 분야, 및 생체고분자와 기타 (생물학적) 화합물을 분석하는데 있어서 이의 용도에 관한 것이다. 돌연변이 기공 형성 독소 또는 이의 기공 형성 단편을 포함하는 단백질성 나노기공으로서, 상기 기공 형성 독소 또는 이의 단편의 내강-대면 인식 영역이, 프라가세아톡신 C (FraC)의 아미노산 10-20에 상응하는 인식 영역에서 내강-대면 아미노산(들)의 천연 또는 비천연 방향족 아미노산 잔기로의 하나 이상의 치환(들)을 포함하는 것인, 단백질성 나노기공이 제공된다.
Description
본 발명은 일반적으로 나노기공(nanopore) 분야, 및 생체고분자와 기타 (생물학적) 화합물을 분석하는데 있어서 이의 용도에 관한 것이다. 특히, 본 발명은 유전자 조작된 나노기공, 및 펩타이드 포획과 인식에 있어서 이들의 성능 향상에 관한 것이다.
나노기공은 저렴하고, 고속대용량이며/이거나 휴대가능한 단백질 검출기의 잠재적인 후보물질이 되었다. 최근 수년간, 이들은 폴리에틸렌 글리콜(PEG)과 같은 모델 분석물 뿐만 아니라 펩타이드 및 단백질과 같은 생체 고분자에 대해서도 질량 분석기와 유사하게 작동하는 것으로 나타났다 (Robertson et al. Proc Natl Acad Sci U S A. 2007). 생물학적 나노기공은 분석물이 나노기공의 인식 부위를 통해 전위될 때에 이들이 생성하는 신호를 기반으로 저분자의 검출과 식별에 특히 적합한 것으로 나타났다. 나노기공 분광법 (Chavis et al., ACS Sens, 2017)으로 알려진 이 방법은, 공극 표면과 분석물 간의 상호작용에 따라 달라진다.
기공 형성 단백질 (PFP)은 α-PFP와 β-PFP의 2가지 주요 그룹으로 대략적으로 분류될 수 있는데, 이들은 각각 α-나선의 다발 또는 막횡단 β-배럴에 의해 기공을 형성한다. 두 PFP 그룹의 구성원들은 공통적인 기공 형성 방식을 공유하지만, 진화적으로 관련이 없는 수개의 계열들은 이들의 가용성 단량체의 구조에 따라 구별될 수 있다.
말미잘 (악티노포린)에 의해 생성된 α-나선형 기공 형성 독소 계열은 대략 20 kDa의 질량을 갖는 기공 형성 단백질이다 (Anderluh et al. Toxicon, 2002). 악티노포린 계열의 서열 동일성은 높으며 (60-80%) (Garcia-Ortega et al. Biochim Biophys Acta, 2011), 기공 형성 메커니즘은 대체로 유사한 것으로 생각되는데, 이때 기공 형성은 지질 이중층의 스핑고미엘린의 존재에 의존하는 경우가 많다. 악티노포린의 활성은 첫 30-32개의 아미노산에 의해 형성된 이들의 α-나선형 막횡단 영역에서 추적할 수 있다 (도 1a) (Ros et al. Biochimie, 2015). 이 영역은 기공의 가장 협소한 지점 - 수축 부위- 도 포함한다 (Huang et al. Nat Commun, 2019).
악티노포린 프라가세아톡신 C (FraC)의 생리학적 특성 - 전기-삼투압류 (electro-osmotic flow, EOF) 및 인식 부피 (Huang et al. Nat Commun, 2017: Huang et al. Nat Commun, 2019)는 - 조작이 가능하기 때문에, FraC는 단일 분자 나노기공 분광법을 위해 개발할 주요 표적이 된다. 그러나, 기공과 생물학적 분석물의 상호작용은 잘 알려져 있지 않다.
β-PFP의 3가지 주요 계열은 황색포도상구균 (Staphylococcus aureus)에서 주로 발견되는 α-용혈소 (hemolysin) 계열, MACPF/CDC 단백질 상과계열, 및 병원성 박테리아인 A. 하이드로필라 (hydrophila)로부터 익히 연구된 독소인 에어로라이신 (aerolysin)과 유사성을 나타내는 PFP이다.
생물학적 나노기공을 사용한 분석물의 검출과 DNA의 염기서열분석은 최근 수년간 큰 진전을 이루었다. 그러나, 나노기공을 사용한 단백질의 검출과 염기서열분석은 폴리펩타이드의 복잡한 물리화학적 구조와 나노기공에 의한 폴리펩타이드의 포획과 인식 메커니즘에 대한 이해의 부족으로 인해 단순하지는 않다.
야생형 FraC (WtFraC)의 결정 구조는 8개의 동일한 서브유닛 (옥타머)으로 형성된 올리고머 기공을 나타낸다 (Tanaka et al., Nat Commun, 2015). 이전 연구에서, 본 발명자들은 FraC가 뚜렷한 기공 부피와 검출 가능한 펩타이드 범위를 갖는 다양한 올리고머 형태 - 가장 눈에띄는 것은 옥타머 (T1)와 헵타머 (T2)를 형성할 수 있음을 밝혀냈다 (WO2020/055246; Huang et al. Nat Commun, 2019). 동일한 연구에서, 본 발명자들은 WtFraC를 통한 펩타이드 전위에서 관찰된 전류가 1M KCl 중 pH 3.8에서 펩타이드의 질량과 상관관계가 있음을 입증하기도 했다. 그러나, 펩타이드 차단은 수 마이크로초 정도로 빨라서 (안지오텐신 1의 평균 체류 시간은 0.15 ± 0.04 ms) (Huang et al. Nat Commun, 2019), 대부분의 전위 사건들은 감지되지 않았고 감지된 사건들의 특성 분석도 부정확하였다.
따라서, 본 발명의 목적은 나노기공 센서에 의해 개별적으로 포획된 펩타이드 특성분석의 정확도를 향상시키는 것이다. 상기 목적을 위해, 본 발명자들은 표지되지 않은 펩타이드의 포획을 개선하고, 나노기공 센서에서 펩타이드의 상주 (체류 시간)을 증가시키며, 펩타이드 종들 간의 식별을 개선하기 위해서 단백질성 나노기공을 설계했다. 본 발명에서, 우리는 펩타이드 검출에 최적화된 낮은 pH 조건 하에서 펩타이드 감지를 개선하기 위해서도 단백질 나노기공을 설계했다.
놀랍게도, 나노기공의 내강 (lumen) 내의 정확한 위치에 하나 이상의 "부피가 큰 (bulky)"/방향족 아미노산을 도입하였더니, 펩타이드의 포획 빈도가 증가할 뿐 아니라 펩타이드들 간의 식별력도 크게 향상될 수 있다는 사실이 발견되었다. 예를 들어, 티로신, 페닐알라닌 또는 트립토판 잔기가 내강-대면 (lumen-facing) 영역에 도입된 서브유닛을 포함하는 프라가세아톡신 C (FraC) 나노기공은 해당 기공에서 펩타이드의 체류 시간이 증가된 것으로 밝혀졌다. 게다가, 이러한 "커다란 방향족이 변형된" 나노기공은 라이소자임의 트립신 소화물에 있는 펩타이드를 검출하여 측정할 수도 있다. 또한, 개별 단백질들의 고유한 개별 스펙트럼은 스펙트럼 매칭과 같은 고급 분석 방법을 사용하여 할당할 수 있다. 또한, 본 발명자들은 우리의 돌연변이 조작기술 공학의 발견과 검출 조건들의 조합을, 구조는 매우 다르지만 나노기공 내강의 크기 인식 영역이 비슷한 다른 나노기공 계열 (예컨대, 베타-배럴형 기공)에 적용하였는데, 펩타이드 특성화의 개선이 보편적임을 발견하였다.
이러한 발견들은 변형된 나노기공이 무표지 단백질 검출 및 핑거프린팅이 가능한 단일 분자 검출기로 사용될 수 있다는 개념 증명을 제공한다. 이는 펩타이드 인식과 식별을 위한 실시간의 단일 분자 부피 분석기를 개발하는데 중요한, 나노기공에 의한 인식을 개선하고 펩타이드의 포획을 증가시키는 기초를 제공한다.
따라서, 본 발명은, 예를 들어 악티노포린 계열의 돌연변이 (또는 "변형된") 막횡단 기공 형성 독소, 또는 이의 기공 형성 단편을 포함하는 단백질성 나노기공으로서, 기공 형성 단백질 또는 이의 단편의 내강-대면 인식 영역이 천연 또는 비천연 방향족 아미노산 잔기로의 하나 이상의 돌연변이를 포함하는 것인, 단백질성 나노기공에 관한 것이다. 기공 형성 독소는 일반적으로 올리고머이다. 기공은 바람직하게는 수개의 반복되는 서브유닛, 예컨대 6, 7 또는 8개의 서브유닛으로 구성된다. 기공은, 예를 들어 전위를 막에 인가하는 경우에, 이온이 흐를 수 있는 상기 막에 삽입될 때에 중앙 채널을 포함한다. 기공의 서브유닛은 일반적으로 중심 축을 둘러싸며 막횡단 α-나선 다발 또는 채널에 가닥을 제공한다. 따라서, 본 발명에 따른 변형된 단백질성 나노기공은 악티노포린 계열의 돌연변이 기공 형성 알파-나선형 기공 형성 서브유닛의 올리고머 (또는 "조립체"), 또는 이의 기공 형성 단편의 올리고머를 포함한다.
본원에서 기공의 "인식 영역" 또는 "수-대면 (water-facing) 영역"으로도 언급되는 "내강-대면 인식 영역"은 해당 기공을 통과하는 분석물의 감지에 관여하는 나노기공의 일부를 의미하고자 한 것이다. 인식 영역은 일반적으로 지질 이중층과 같은 막에 삽입될 때 시스에서 트랜스로 나노기공을 통해 형성되는, 물이 채워진 중앙 채널 (내강)의 일부이다. 인식 영역은 일반적으로 중앙 채널의 치수에 따라 구조적으로 식별될 수 있다. 적절한 구조 또는 구조 모델은 실험적 X-선 회절 구조, 전자 현미경 구조 및 컴퓨터 모델링을 비롯한 당업계에 공지된 방법에 의해 얻거나 구축할 수 있다. 인식 영역은 전기장 선이 집중되고 분석물의 존재가 인가된 전위 하에서 나노기공을 통해 흐르는 이온 전류를 가장 많이 방해하는 나노기공을 통한 채널 영역이 될 것이다. 작은 펩타이드 검출을 위해, 인식 영역은 바람직하게는 내부 직경이 2 나노미터 미만, 바람직하게는 1 나노미터 미만인 나노기공 채널의 섹션(들)을 포함하여, 분석물 상호작용 동안 이온 전류의 상당한 편향과 충분한 상주/체류 시간을 제공할 것이다. 많은 나노기공들은 더 긴 인식 영역 내에서 작은 내부 직경 (수축)의 하나 이상의 협소한 섹션들을 가질 수 있다. 분석물에 대한 최대 감도/이온 전류 편향은 일반적으로 분석물이 수축부 또는 그 부근의 나노기공과 상호작용할 때 달성된다. 따라서, 분석물 검출에 대한 최대한의 제어는 수축부를 포함하는 잔기들 또는 그 부근에서 단백질 돌연변이 유발/조작을 통해 달성할 수 있는 경우가 많다.
다르게는, (예를 들어 상동성 검색 또는 실험적 결정에 의해) 나노기공인 것으로 공지되어 있으나 적절한 구조 모델을 갖지 못한 단백질의 경우, 인식 영역은 당업계에 공지된 수단을 사용하여 컴퓨터 모델링 및/또는 기타 알려진 인식 영역에 대한 상동성 맵핑에 의해 측정될 수 있는 경우가 많다. 예를 들어, 인식 영역은 막-단백질 나노기공의 막횡단 섹션 (예컨대, 베타-배럴 또는 알파-나선형 올리고머로 구성된 막횡단 섹션)을 포함하거나 전체가 그 안에 존재하는 경우가 많다. 막횡단 베타-배럴 및 알파-나선은, 예를 들어 알려진 다른 기공들과의 상동성 비교와 같은 방법 및 양친매성 수치료법 (hydropathy) 지도와 같은 특징을 통해 식별할 수 있다. 또한, 나노기공 인식 영역은 당업계에 잘 알려진 수단을 사용하여 돌연변이 유발에 의해 실험적으로 측정 및/또는 확인될 수도 있다. 예를 들어, 후보 인식 영역에서 서로 다른 표적화 돌연변이를 갖는 서로 다른 나노기공의 이온 전류 특성은 막에 삽입된 나노기공의 전기생리학 실험에서 비교할 수 있다. 돌연변이의 위치를 변경하고, 선택적으로는 대조군 분석물에 대한 반응의 차이를 측정함으로써, 인식 영역을 맵핑하고 특성 분석할 수 있다.
본 발명의 기공은 특히, 기공의 내강-대면 인식 영역을 (하나 이상의 천연 또는 비천연 아미노산 치환에 의해) 조작하여, 해당 기공의 내부 치수/소수성/방향족성을 조작하는 것으로써, 나노기공을 통과하는 펩타이드의 체류 시간과 분해능을 증가시키는 것을 특징으로 한다.
따라서, 본 발명은 하기 단계를 포함하는 막횡단 (알파-나선형 또는 베타-배럴형) 단백질 기공을 통해 펩타이드 분석물의 전위 속도를 감소시키는 방법을 제공한다:
(a) 하나 이상의 비방향족 아미노산을 하나 이상의 방향족 아미노산으로 치환함으로써 기공 내강의 순 방향족성을 증가시키는 단계 (바람직하게는, 상기 치환으로 인해 본원에 개시된 단백질성 나노기공을 생성함); 및 (b) 폴리펩타이드를 상기 기공으로 통과시키는 단계로서, 이때 순 방향족성을 증가시키는 것이 상기 기공을 통한 폴리펩타이드의 전위 속도를 감소시키는 것인, 단계.
당업자가 이해하는 바와 같이, 본 발명의 하나 이상의 돌연변이를 나노기공 또는 이의 기능성 기공 형성 단편에 여러가지 배열로 도입하여, 조립된 나노기공의 인식 영역에서 원하는 변화(들)를 생성할 수 있다. 예를 들어, 다수 (예를 들어, 4, 5, 6, 7, 8개 이상)의 단량체 단위로 구성된 올리고머 나노기공의 경우, 나노기공을 조립하는데 사용되는 모든 단량체들에 대해 하나 이상의 돌연변이를 만들어, 조립된 나노기공이 막과 동일 평면에 있고 분석물 통과 방향에 직교하는 인식 영역에서 다수의 동일한 돌연변이의 고리를 포함하도록 한다. 다르게는, 돌연변이된 단량체들은 나노기공 올리고머화 동안에 돌연변이를 함유하지 않거나 다른 돌연변이들을 함유하는 단량체들과 혼합되어, 제어된 수의 돌연변이를 갖는 조립된 "헤테로-올리고머" 나노기공을 생성할 수도 있다. 따라서, 조립된 기공은 올리고머 단위의 수에 따라 1, 2, 3, 4, 5, 6, 7, 8, 9개 또는 그 이상의 본 발명의 돌연변이체 단량체를 포함할 수 있다. 돌연변이된 단위의 수를 제어하는 것은 인식 영역에 대한 변화의 정도/규모를 감소시키거나 아니면 조절하는데 유용할 수 있다. 혼합물로부터 원하는 수의 돌연변이를 갖는 헤테로-올리고머 나노기공의 집단을 선택적으로 정제하는 수단은 당업계에 공지되어 있다 (예컨대, Gouaux, et al. Proc Natl Acad Sci U S A 1994). 조립된 형태로 인식 영역에 모두 기여하는 한 종류 이상의 단량체 단위를 포함하는 올리고머 나노기공의 경우 (예컨대, 2성분 류코시딘, Spaan et al. Nat Rev Microbiol 2017), 돌연변이는 단량체 종들 중 하나 또는 양자 모두에 이루어질 수 있다. 예를 들어, 이합체의 경우 (Hammerstein et al, J Biol Chem 2011), (예컨대, 유전적으로 또는 다른 화학적 접합 수단에 의해) 단량체가 함께 융합되는 기공에서, 당업자라면 누구나 얼마나 많은 수의 단량체 단위를 변형시킬 것인지를 선택함으로써 원하는 수의 돌연변이를 최종 조립체에 도입할 수 있다. 단일 단백질 가닥이 막횡단 채널을 구성하는 단량체성 단백질 나노기공 (예컨대, 외막 포린)의 경우, 특정 간격의 거리로 서열을 따라 돌연변이를 수행하여, 조립된 나노기공 채널이 바람직하게는 기공의 막횡단 섹션의 다수의 베타-가닥 상에서, 가장 바람직하게는 모든 베타-가닥 유닛 상에서 필요한 수의 수-대면 돌연변이를 포함하여, 동종-올리고머 나노기공에서 형성된 것과 유사한 돌연변이의 고리-유사 형태를 생성할 수 있음이 이해된다. 베타-배럴 기반 나노기공의 경우, 돌연변이가 하향 가닥이거나 상향 가닥이거나 양자 모두에 도입될 수 있는 것으로 이해된다. 예를 들어, 본 발명의 방향족 또는 산성 치환체를 베타-배럴의 상향 및 하향 가닥 모두에 첨가하여, 이들이 대략 동일 평면상 (나노기공에서 동일한 수직 위치)에 있게 함으로써, 인식 영역에서 더 강한 효과를 만들어낼 수 있다. 다른 실시형태에서, 본 발명의 다수의 돌연변이들은, 예를 들어 인식 영역에 더 강한 변경을 만들어내기 위해 올리고머 기공 또는 이의 단편의 단량체의 알파-나선 또는 베타-가닥을 따라 (막에 대해 수직으로) 만들어질 수 있다.
천연 및 비천연 방향족 아미노산 잔기들은 당업계에 공지되어 있다. 한 실시형태에서, 비천연 방향족 아미노산은 3,4-디하이드록시-L-페닐알라닌, 3-요오도-L-티로신, 트리요오드티로닌, L-티록신, 페닐글리신 (Phg) 또는 노르-티로신 (norTyr)으로 이루어진 군으로부터 선택된다. Phg 및 norTyr. 적절한 비천연 아미노산에는 D-아미노산, 호모-아미노산 (메틸렌), 베타-호모-아미노산, N-메틸 아미노산, 알파-메틸 아미노산이 포함될 수 있다. 바람직하게는 유도체화된 Phe/Tyr/Trp 아미노산, 가장 바람직하게는 고리 치환된 Phe/Tyr/Trp 아미노산을 포함하는, 익히 알려진 광범위한 비천연 아미노산들이 당업계에 공지되어 있다. 예를 들어, 할로겐, -CH3, OH, -CH2NH3, -C(O)H, -CH2CH3,-CN, -CH2CH2CH3, -SH 또는 다른 기에 의해 치환된 Phe, Tyr 및 Trp의 유도체들도 포함된다. 예시적인 비천연 방향족 아미노산에는, 이에 제한되지는 않지만, O-메틸-L-티로신; 3-메틸-페닐알라닌; p-아세틸-L-페닐알라닌; O-4-알릴-L-티로신; 4-프로필-L-티로신; 불소화 페닐알라닌; 이소프로필-L-페닐알라닌; p-아지도-L-페닐알라닌; p-아실-L-페닐알라닌; p-벤조일-L-페닐알라닌; 포스포노티로신; p-요오도-페닐알라닌; p-브로모페닐알라닌; p-아미노-L-페닐알라닌; 이소프로필-L-페닐알라닌; 아미노-, 이소프로필-, 또는 O-알릴 함유 페닐알라닌 유사체; p-(프로파르길옥시)페닐알라닌; 3-니트로-티로신; 5-플루오로-트립토판, 5-하이드록시-트립토판, 5-메톡시-트립토판, 5-메틸-트립토판, 트리플루오로메틸-트립타민 에틸 에스테르가 포함된다.
비천연 아미노산을 단백질에 도입하는 방법도 당업계에 알려져 있다. 예를 들어, 돌연변이 단량체를 발현하는데 사용되는 IVTT 시스템에 합성 아미노아실-tRNA를 포함시켜서 비천연 발생 아미노산을 도입할 수 있다. 다르게는, 이들은 특정 아미노산의 합성 (즉, 비자연 발생적인) 유사체의 존재 하에 해당 특정 아미노산에 대해 영양 요구성인 이. 콜라이에서 돌연변이체 단량체를 발현시킴으로써 도입될 수도 있다. 또한, 비천연 아미노산들은 펩타이드 합성을 위해 당업계에 공지된 합성 펩타이드 화학 방법을 사용하여 도입될 수도 있다. 나노기공의 단량체 단위는, 당업계에 공지된 접합 방법, 예컨대 원천적 화학적 결찰 (native chemical ligation) (Thapa et al., Molecules, 2014, 14461-83) 또는 시스테인 커플링을 사용하여 구축된 합성 펩타이드로부터 전체적으로 형성될 수 있다. 다르게는, 나노기공의 단량체는 당업계에 공지된 커플링 방법을 사용하여 자연적으로 발현된 펩타이드 단위에 커플링된 부분적으로 합성 단위를 포함할 수 있다.
또한, 돌연변이 나노기공은, 예를 들어 야생형 단백질로 이미 존재하거나 돌연변이 유발에 의해 도입될 수 있는, 하나 이상의 시스테인 (시스테인 결합) 또는 라이신에 적절한 분자를 화학적으로 부착하는 것에 의한 것처럼, 당업계에 공지된 수단에 의해 나노기공의 단량체성 전구체 단위 또는 조립된 올리고머 나노기공에 적절한 방향족 분자를 화학적으로 부착함으로써 생성될 수도 있다.
또 다른 측면에서, 변형된 나노기공은 천연 방향족 아미노산으로의 돌연변이, 바람직하게는 Trp, Tyr 또는 Phe, 보다 바람직하게는 Phe으로의 하나 이상의 돌연변이를 포함한다.
방향족 아미노산 돌연변이(들) 이외에도, 하나 이상의 추가 돌연변이(들)이 내강-대면 인식 영역에 도입될 수 있으며, 이러한 추가의 돌연변이(들)은 해당 기공의 순 음전하를 증가시킨다. 예를 들어, 돌연변이가 있는 돌연변이형 단백질성 나노기공을 내강-대면 인식 영역에 도입하여 음성 잔기들과 "공간적으로 인접한" 방향족 잔기들의 조합을 생성하는데, 이 경우 상기 방향족 잔기와 음성 잔기들은 기능성 기공 내에서 서로, 바람직하게는 4 나노미터 이내, 가장 바람직하게는 2 나노미터 이내에 있다. 잔기 위치들 사이의 물리적 공간은, 예를 들어 당업계에 공지된 일반적인 분자 모델링 소프트웨어를 사용하여 조립된 올리고머 기공 단백질의 3D 모델 또는 결정 구조로부터 돌연변이된 각 잔기들 사이의 C-알파 백본 거리를 측정함으로써 유도할 수 있다.
본 발명에 따라 사용하기 위한 막횡단 단백질 기공 또는 이의 단편은 베타-배럴형 기공 또는 알파-나선 다발 기공으로부터 유도될 수 있다. 베타-배럴형 기공은 베타 가닥들로 형성된 배럴 또는 채널을 포함한다. 당업자라면 누구나 본 발명의 적절한 나노기공은 당업계에 공지된 막횡단 기공으로부터 선택될 수 있음을 이해할 것이다 (Peraro et al. Nat Rev Microbiol 2016; Crnkovic et al. Life (Basel) 2021). 적합한 나노기공은 이상적으로는 작은 펩타이드를 비롯한 작은 분석물을 측정하는데 가장 적합한 인식 영역의 치수를 가질 것이다. 적합한 나노기공은 이상적으로는 2 나노미터 미만, 가장 바람직하게는 1.5 나노미터 미만의 직경을 갖는, 막관통 영역, 인식 영역 또는 수축부를 가질 것이다. 적합한 베타-배럴형 기공에는, 이에 제한되지는 않지만, 베타-독소, 예컨대 알파-용혈소, 에어로라이신, 리세닌, 사이토라이신 (Cytolysin), 사이토라이신 K, 탄저병 독소 및 류코시딘, 및 박테리아의 외막 단백질/포린, 예컨대 마이코박테리움 스메그마티스 (Mycobacterium smegmatis) 포린 (Msp), 예를 들어 MspA, MspB, MspC 또는 MspD, 외막 포린 F (OmpF), 외막 포린 G (OmpG), 외막 포스포리파제 A (OMPLA), 페릭 하이드록사메이트 (ferric hydroxamate) 흡수 성분 A (FhuA), 컬리 (Curli) 생산 수송 성분 CsgG, 및 나이세리아 (Neisseria) 자가수송 지질단백질 (NalP)이 포함된다. 알파-나선형 다발 기공은 알파 나선들로 형성된 배럴 또는 채널을 포함한다. 적한한 알파-나선형 다발 기공에는, 이에 제한되지는 않지만, 내막 단백질 및 외막 단백질, 예컨대 악티노포린, H. 파일로리 (pylori) Cag T4SS 입자의 외막 코어 복합체 (OMCC) 및 E. 콜라이의 다당류 수송체 Wza의 막관통 도메인을 포함한다.
당업자라면 누구나 본 발명의 적합한 나노기공은 인공 나노기공, 예컨대 공지된 인공 나노기공으로부터 개조된 것과 같은 인공 나노기공일 수 있음을 이해할 것이다. 예를 들어, 고리-유사 단백질에 부착된 막횡단 베타-배럴 또는 알파 나선을 기반으로 하는 나노기공 (Zhang et al. BioRxiv 2020), DNA 오리가미 (origami)에 부착된 막관통 펩타이드를 기반으로 하는 단백질 (Spruijt et al. Nat Nanotechnol 2018), 인공적으로 생성된 막관통 펩타이드를 기반으로 하는 자가 조립형 나노기공 (Scott et al. Nat Chem 2021) 및 새롭게 설계된 나노기공들 (Vorobieva et al. Science 2021)을 들 수 있다.
알파-나선형 기공
한 측면에서, 단백질성 나노기공은 돌연변이 악티노포린, 또는 이의 알파-나선형 막횡단 영역 (aa 1-27)을 포함한다. 예를 들어, 돌연변이 악티노포린은 아미노산 10-20에 해당하는 인식 영역의 방향족 아미노산 잔기로의 돌연변이를 포함한다. 추가의 N-말단 서열을 갖는 상동체의 경우, 막관통 알파-나선에 해당하는 영역은 상동성 맵핑 및 당업계에 공지된 다른 수단에 의해 측정될 수 있다. 악티노포린 계열의 기공 형성 독소는 당업계에 잘 알려져 있다. 예를 들어, 문헌 [Kristan et al. Toxicon 2009]을 참조한다.
본 발명에 따른 돌연변이를 제조하기 위한 악티노포린 계열의 예시적인 구성원으로는 프라가세아톡신 A (FraA), 프라가세아톡신 B (FraB), 프라가세아톡신 C (FraC), 프라가세아톡신 D (FraD), 프라가세아톡신 E (FraE), 에퀴나톡신 II (Eqt-II), 에퀴나톡신 IV (Eqt-IV), 에퀴나톡신 V (Eqt-V), 우르티시나톡신 (UcI), 액티톡신-Oor1b (Or-G), 액티톡신-Oor1a (Or-A), 기간톡신-4 (Gigt 4), 헤터락티스 마그니피카 (Heteractis magnifica) 사이토라이신 III (HmgIII), 반다포린 (bp-1), 크리비놉시스 자포니카 (Cribinopsis japonica) 독소 I (CJTOX I), 크리비놉시스 자포니카 독소 II (CJTOX II), 스티콜라이신 I (StI), 스티콜라이신 II (StII), 스티코톡신 Hcr4a (RTX-A), 스티코톡신 Hcr4b (RTX-SII) 및 사가톡신 I (Src I)을 포함한다.
예시적인 알파-나선형 기공 형성 단백질의 야생형 서열 및 SwissProt 등록 번호는 다음과 같다:
기공 형성 독소가 막에 올리고머 나노기공을 생성하는 능력을 유지하는 한, 이들 계열 구성원들 중 임의의 구성원과 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 서열 동일성을 나타내는 그의 기공 형성 독소 상동체들도 포함된다. 이러한 기능성은 당업계에 공지된 방법을 사용하여 시험관 내에서 쉽게 시험할 수 있다. 예를 들어, 정제된 것으로 추정되는 나노기공은 본원에 기술된 바와 같이 또는 당업계에 공지된 다른 수단 (예컨대, 소낭 삽입, 계면활성제 삽입, 자발적 삽입 등)을 사용하여 모델 막에 삽입될 수 있고, 이온 전류를 통과시켜 시스템에 첨가된 모델 분석물의 존재를 감지하는 이들의 능력을 전기생리학적 방법에 의해 측정하는 것을 특징으로 한다.
당업자가 이해하는 바와 같이, 주어진 계열 구성원의 아미노산 서열은 해당 기공의 인식 영역에 하나 이상의 돌연변이(들)을 함유할 것이다. 따라서, 예를 들어 FraD, Eqt-IV 또는 StII를 포함하는 기공에 대해 언급하는 경우라면, 이것은 내부 방향족성의 정도가 선택적으로 본 발명에 따른 음으로 하전된 잔기(들)의 도입과 조합하여 조작된 FraD, Eqt-IV 또는 StII 돌연변이를 지칭하고자 함을 의미하는 것이다.
예를 들어, 본 발명에 따른 단백질성 나노기공은 유리하게는 하기로 이루어진 군으로부터 선택되는 돌연변이 악티노포린:
(i) FraC, FraE; 또는 FraC의 Gly13에 상응하는 위치에 방향족 잔기를 포함하는, 이들과 적어도 90%의 서열 동일성을 나타내는 기능적 상동체;
(ii) FraB, Ten-C, Eqt-II, Gigt 4, HmgIII, RTX-SII, Hmt; 또는 Ser13에 상응하는 위치에 방향족 잔기를 포함하고, 선택적으로 위치 10에 산성 잔기를 포함하는, 이들과 적어도 90%의 서열 동일성을 나타내는 기능적 상동체;
(iii) bp-1; 또는 Asn13에 상응하는 위치에 방향족 잔기를 포함하는, 이와 적어도 90%의 서열 동일성을 나타내는 기능적 상동체;
(iv) CJTOX I; 또는 Thr36에 상응하는 위치에 방향족 잔기를 포함하고, 선택적으로 Gln33에 상응하는 위치에 산성 잔기를 포함하는, 이와 적어도 90%의 서열 동일성을 나타내는 기능적 상동체;
(v) CJTOX II; 또는 Ala36에 상응하는 위치에 방향족 잔기를 포함하고, 선택적으로 Gln33에 상응하는 위치에 산성 잔기를 포함하는, 이와 적어도 90%의 서열 동일성을 나타내는 기능적 상동체;
(vi) 사이토라이신 Avt-I, 사이토라이신 PsTX-20A; 또는 Glu13에 상응하는 위치에 방향족 잔기를 포함하고, 선택적으로 Ala 10에 상응하는 위치에 산성 잔기를 포함하는, 이들과 적어도 90%의 서열 동일성을 나타내는 기능적 상동체;
(vii) Eqt-IV; 또는 Ala13에 상응하는 위치에 방향족 잔기를 포함하고, 선택적으로 Lys10에 상응하는 위치에 산성 잔기를 포함하는, 이와 적어도 90%의 서열 동일성을 나타내는 기능적 상동체;
(viii) Eqt-V; 또는 Thr13에 상응하는 위치에 방향족 잔기를 포함하는, 이와 적어도 90%의 서열 동일성을 나타내는 기능적 상동체;
(ix) 니그레라이신 (Nigrelysin); 또는 Asn27에 상응하는 위치에 방향족 잔기를 포함하는, 이와 적어도 90%의 서열 동일성을 나타내는 기능적 상동체;
(x) StII, RTX-A; 또는 Ser11에 상응하는 위치에 방향족 잔기를 포함하고, 선택적으로 Ala8에 상응하는 위치에 산성 잔기를 포함하는, 이들과 적어도 90%의 서열 동일성을 나타내는 기능적 상동체;
(xi) Src I; 또는 Arg12에 상응하는 위치에 방향족 잔기를 포함하고, 선택적으로 Ala9에 상응하는 위치에 산성 잔기를 포함하는, 이와 적어도 90%의 서열 동일성을 나타내는 기능적 상동체;
(xii) StI; 또는 Ser12에 상응하는 위치에 방향족 잔기를 포함하는, 이와 적어도 90%의 서열 동일성을 나타내는 기능적 상동체;
(xiii) UcI; 또는 Lys13에 상응하는 위치에 방향족 잔기를 포함하는, 이와 적어도 90%의 서열 동일성을 나타내는 기능적 상동체;
(xiv) Or-G; 또는 Ala8에 상응하는 위치에 방향족 잔기를 포함하고, 선택적으로 Ala5에 상응하는 위치에 산성 잔기를 포함하는, 이와 적어도 90%의 서열 동일성을 나타내는 기능적 상동체; 또는
상기 언급된 돌연변이(들)을 포함하는 이들의 알파-나선형 막횡단 영역 (aa 1-27)을 포함한다.
한 실시형태에서, 돌연변이 기공 형성 독소 또는 기공 형성 알파-나선형 단편은 표 1로부터 선택되는데, 표 1은 FraC의 위치 10, 13, 17 및 20에서 내강-대면 잔기들의 돌연변이들과 동등한 각각의 악티노포린에서의 하나 이상의 특정 방향족 돌연변이를 기재하고 있다.
상기 정의된 돌연변이(들)을 포함하고 적어도 85%, 적어도 87%, 적어도 90%, 적어도 93%, 적어도 95% 또는 적어도 98%의 서열 동일성을 나타내는 기공 형성 독소 상동체들도 포함된다.
돌연변이 Gly13Tyr, Gly13Trp 또는 Gly13Phe, 바람직하게는 Gly13Phe를 포함하는 돌연변이 FraC 또는 이의 기공 형성 알파-나선형 단편을 포함하는 단백질성 나노기공을 사용하면 매우 좋은 결과를 얻을 수 있다.
베타-배럴형 기공
또 다른 측면에서, 본 발명은 돌연변이 베타-배럴형 기공 형성 단백질 또는 이의 기공 형성 단편을 포함하는 단백질성 나노기공으로서, 상기 기공 형성 단백질 또는 이의 단편의 내강-대면 인식 영역이 내강-대면 비방향족 잔기(들)의 천연 또는 비천연 방향족 아미노산 잔기로의 하나 이상의 돌연변이, 바람직하게는 Trp, Tyr 또는 Phe으로의 하나 이상의 돌연변이를 포함하는 것인, 단백질성 나노기공에 관한 것이다.
바람직하게는, 베타-배럴형 기공 형성 독소는 인식 영역에서 0.2 내지 2.0 나노미터 범위의 내부 직경 (기공 크기; 수축)을 가지며, 가장 바람직하게는 0.5 내지 1.5 나노미터의 최소 내부 직경을 갖는다. 예를 들어, 베타-배럴형 기공 형성 독소는 알파-용혈소, 에어로라이신, 리세닌, 엡실론-톡신 (ETX), 용혈성 렉틴 (LSL), 사이토라이신 k (cytK), 및 이들과 적어도 80%, 바람직하게는 적어도 85%, 보다 바람직하게는 적어도 90%의 서열 동일성을 나타내는 기능적 상동체로 이루어진 군으로부터 선택된다. 바람직하게는, 이것은 에어로라이신, 리세닌 및 사이토라이신 k (cytK), 및 이들과 적어도 90%, 바람직하게는 적어도 95%, 보다 바람직하게는 적어도 98%의 서열 동일성을 나타내는 기능적 상동체로 이루어진 군으로부터 선택된다.
알파-나선형 기공 형성 단백질에 대해 본원에서 상술한 바와 유사하게, 기공은 특히 산성 pH 조건 (pH < 4.5) 하에, 나노기공을 통한 양이온의 플럭스를 증가시킬 목적으로 (표 4), 기공의 배럴 또는 채널의 순 음전하를 증가시키거나 순 양전하를 감소시키는 하나 이상의 돌연변이를 추가로 포함할 수 있다.
예시적인 베타-배럴형 기공 형성 단백질의 야생형 서열 및 SwissProt 등록 번호는 다음과 같다:
하기의 목록은 방향족 잔기로 돌연변이될 예시적인 베타-배럴형 기공에서 내강-대면 아미노산 위치(들)을 나타내고 있다.
한 측면에서, 본 발명은 에어로라이신 유사 β-PFP (aβ-PFP) 하위계열의 돌연변이를 포함하는 돌연변이형 단백질성 나노기공을 제공한다.
예를 들어, 본 발명은 기공의 수-대면 영역 (이 영역은 잔기 212에서 242 및 256에서 284까지 이어짐)에 방향족 아미노산 치환을 포함하는 에어로라이신 (Aer)을 제공한다. 한 측면에서, 방향족 돌연변이는 적어도 영역 212-242에 있다. 예를 들어, 하나 이상의 염기성 잔기(들)은 순 양전하를 감소시키기 위해 방향족 잔기로 치환된다. 일부 실시형태에서 돌연변이체는 Q212, G214, D216, T218, R220, D222, A224, N226, S228, T230, T232, G234, S236, K238, T240 또는 K242를 포함하는 하나 이상의 위치에서 치환된 W, Y 또는 F이다. 이는 K238을 W, Y 또는 F로 치환하는 것을 포함할 수 있다. 특정 실시형태에서, 돌연변이체는 Aer-K238F 또는 Aer-K238W이다.
또 다른 측면에서, 방향족 돌연변이는 적어도 영역 256-284에 있다.예를 들어, S256, E258, A260, N262, S264, A266, Q268, G270, S272, T274, S276, S278, S280, R282 및/또는 T284에 상응하는 위치는 Trp, Tyr 또는 Phe로 돌연변이된다.방향족 치환은 바람직하게는, 예를 들어 위치 K238에서 산성 치환과 조합된다. 한 실시양태에서, 돌연변이 에어로라이신은 돌연변이 K238D를 포함한다.특정 측면에서, 나노기공은 에어로라이신 돌연변이 A260F, S264F, Q268F, S272F를 포함하고/하거나 돌연변이 K238D를 포함한다. 바람직한 돌연변이에는 Aer-K238D, Aer-K238D-A260F, Aer-K238D-S264F, Aer-K238D-Q268F 및 Aer-K238D-S272F가 포함된다. 이러한 돌연변이 기공은 pH ≤ 4.5, 예컨대 pH 3.8 또는 pH 3.0에서 분석물 검출, 바람직하게는 (비표지된) 펩타이드 검출에 적절하게 사용된다. 하기 본원의 실시예 7을 참조한다.
다른 실시형태에서, 본 발명은 돌연변이 리세닌 또는 이의 기공 형성 단편을 포함하는 돌연변이형 단백질성 나노기공을 제공한다. 리세닌 기공은 이들의 수용성 단량체의 구조가 근본적으로 다르지만, α-용혈소 계열의 작은 β-PFT들의 버섯 형태의 기공 복합체와 닮아 있다. 한 특정 실시형태에서, Lys 돌연변이체는 Glu76 위치에 방향족 치환을 포함하는데, 예를 들어 이는 돌연변이체 Lys-E76F이다.
또 다른 측면에서, 본 발명은 돌연변이 세포독소 K (CytK) 또는 이의 기공 형성 단편을 포함하는 돌연변이형 단백질성 나노기공을 제공한다. CytK는 바실러스 세레우스 (Bacillus cereus)의 기공 형성 독소이다 (Hardy et al. FEMS Microbiol Lett. 2001). 감지하는데 적절한 특성을 갖는 나노기공으로는 확인이 되었지만, 현재까지 돌연변이 유발을 돕는 CytK 나노기공의 구조는 있지 않다. 당업자라면 누구나, 단백질의 막횡단 베타-배럴 영역과, 이에 따라 분석물을 감지하기 위한 추정상의 인식 영역은, 적절하게 유사한 구조 (예컨대 S. 아우레우스 유래의 알파-용혈소)에 대한 상동성 모델링에 의해 측정된 후, 후보 영역에서 돌연변이 유발을 통해 실험적으로 확인될 수 있음을 이해할 것이다. 예시적인 본 발명의 CytK 돌연변이체는 잔기 112에서 잔기 155까지 이어지는 기공의 내강-대면 영역에 방향족 아미노산 치환을 포함한다. 선택적으로 하나 이상의 산성 치환과 조합하여, 방향족 치환에 가장 적합한 것으로 확인된 잔기들은, 하기의 내강-대면 비방향족 막횡단 잔기들 중 하나 이상 (예컨대, 최대 5개, 바람직하게는 최대 4개, 보다 바람직하게는 최대 3개 또는 2개)을 포함한다:
E112/T114/T116/S118/S120/Q122/G124/S126/K128/S130/T132/S134/S137/E139/G141/T143/Q145/T147/S149/S151/S153/K155,
바람직하게는 E112/T114/T116/S118/S120/Q122/G124/S126 중 하나 이상.
이러한 방향족 돌연변이들은 유리하게는 중성 및/또는 양전하를 띤 잔기(들), 예컨대 K128E 또는 K128D, 또는 이미 음성인 잔기를 제외한, 방향족 잔기로 치환될 수 있는 내강-대면 잔기들 중 임의의 잔기의 하나 이상의 산성 치환체와 조합된다. 이러한 돌연변이는 이상적으로는 기공의 배럴을 순 음성으로 만들어서 (아직 그렇지 않은 경우), 해당 기공을 통한 전기-삼투압류를 변경시킨다.
특정 측면에서, 돌연변이 기공 또는 이의 단편은 위치 S126 또는 K128에 방향족 아미노산을 갖는 CytK 돌연변이체, 예를 들어 돌연변이 Ser126Tyr, Ser126Trp, Ser126Phe, Lys128Tyr, Lys128Trp, Lys128Phe, 바람직하게는 Ser126Phe 또는 Lys128Phe를 포함하는 CytK 돌연변이체를 포함한다.
또 다른 특정 측면에서, 돌연변이 기공 또는 이의 단편은, 해당 배럴에서 더 높은 "위쪽"의 방향족 아미노산 치환을 갖는 CytK 돌연변이, 예를 들어 위치 Ser120, Gln122 또는 Gly124에 있는 CytK 돌연변이를 포함한다. 도 20을 참조한다. 본 발명에 따른 예시적인 cytK 돌연변이 나노기공은 돌연변이 S120W/F/Y+ K128D, Q122W/F/Y + K128D, G124W/F/Y + K128D 또는 S126W/F/Y + K128D를 포함한다.
알파-나선형 기공 형성 단백질 및 베타-배럴형 기공 형성 단백질에 대해 본원에서 상술한 바와 유사하게, 기공은 특히 산성 pH 조건 (pH < 4.5) 하에, 나노기공을 통한 양이온의 플럭스를 증가시킬 목적으로 (표 3), 기공의 배럴 또는 채널의 음전하를 증가시키거나 순 양전하를 감소시키는 하나 이상의 돌연변이를 추가로 포함할 수 있다. 돌연변이 K128F 또는 K128D의 경우를 나타내었다 (도 19 및 20).
특정 측면에서, 상술한 기공 형성 단백질에 대해 발견된 바와 같이, 돌연변이 기공은 나노기공의 수-대면 영역에 방향족 아미노산, 예를 들어 S126F를 갖는 CytK 돌연변이체를 포함하고, 수-대면 영역의 음전하를 증가시키는 돌연변이, 예를 들어 K128D를 추가로 포함하여, 펩타이드 분석의 분석을 향상시킨다.
분석 시스템
본 발명의 추가 측면은 본 발명에 따른 돌연변이형 단백질성 나노기공을 포함하는 분석 시스템에 관한 것이다. 예를 들어, 분석 시스템은 유체 챔버를 시스 측과 트랜스 측으로 분리하는 소수성 막을 포함하며, 이때 돌연변이형 단백질성 나노기공은 상기 막에 삽입된다. 나노기공 센서 시스템은 i) 막에 의해 제1 시스 챔버와 제2 트랜스 챔버로 분리된, 이온 용액인 유체로 채워진 구획; ii) 상기 막에 삽입된 본 발명의 조작된 돌연변이형 기공; 및 iii) 나노기공을 통과하는 이온 전류 흐름을 측정하고, 선택적으로는 막을 가로지르는 전위차를 생성하여 기공을 통해 제1 챔버에서 제2 챔버로 또는 그 반대로 이온 흐름을 촉진하도록 구성된 전극을 포함할 수 있다.
이로써, 상기 시스템은 기공 기반 센서를 제공한다. 한 특정 측면에서, 분석 시스템은 악티노포린 계열의 돌연변이 알파-나선형 기공 형성 독소, 바람직하게는 FraC를 포함한다. 또 다른 특정 측면에서, 분석 시스템은 돌연변이 베타-배럴형 기공 형성 독소, 바람직하게는 에어로라이신 유사 β-PFP 또는 세포독소 K를 포함한다.
본 발명에 따른 시스템이 사용 중인 경우, 나노기공은 일반적으로 제1 액체 매질과 제2 액체 매질 사이에 위치하는데, 이때 적어도 하나의 액체 매질은 관심대상 분석물을 포함하고, 상기 시스템은 분석물의 특성을 검출하도록 작동한다. 한 실시형태에서, 시스템은 분석물이 나노기공을 통해 전기영동적으로 및/또는 전기삼투적으로 전위되도록, 나노기공에 전기장을 가하여 해당 분석물의 특성을 검출하도록 작동한다.
아래에 예시된 바와 같이, 본원에 제공된 시스템은 단백질성 물질, 바람직하게는 펩타이드, 보다 바람직하게는 최대 약 30개의 아미노산 길이의 펩타이드의 분석에 특히 적합하다. 보다 구체적으로, 본 발명의 시스템은 길이가 최대 20, 15, 10, 5, 3개 또는 2개의 아미노산인 펩타이드의 포획을 제공한다. 아래에 예시된 바와 같이, 돌연변이 나노기공은 매우 가변적인 아미노산 조성을 갖는 펩타이드(들)도 검출할 수 있다. 따라서, 이 나노기공은 어떤 특정 구조나 특성에 제한을 두지 않고 폭넓게 적용할 수 있다. 그러나, 한 측면에서, 펩타이드는 적어도 50%, 바람직하게는 60%, 보다 바람직하게는 적어도 70%의 소수성 및 하전된 아미노산을 포함한다. 예를 들어, 나노기공은 방향족 아미노산 (Tyr, Trp 및 Phe)을 최대 40%, 바람직하게는 최대 30%, 보다 바람직하게는 최대 25%까지 포함한다.
그러나, 이것을 본 발명이 펩타이드 분석과 관련된 사용에 제한되는 것으로 이해되어서는 안 된다. 예를 들어, 본 발명의 시스템을 사용하여 검출할 수 있는 다른 분석물에는 (비단백질성) 바이오마커, 항생제 또는 기타 약물, DNA, 대사산물 및 생물학적 및 비생물학적 저분자들도 포함된다. 예시적인 분석물에는 저분자 바이오마커의 다양한 하위부류, 예컨대 스테로이드, 탄수화물, 아미노산, 뉴클레오타이드, 호르몬, 지방산, 비타민, 플라빈, 단백질 보조인자, 지질, 페놀성 화합물이 포함된다. 한 실시형태에서, 관심대상 분석물은 바람직하게는 단백질, 폴리펩타이드 및 올리고펩타이드로 이루어진 군으로부터 선택되는 생체고분자이다. 한 측면에서, 분석물은 200 내지 5000 Da 범위, 예를 들어 200 내지 500 Da 범위 또는 500 내지 1700 Da 범위의 질량을 갖는 물질인데 (특히, 도 22를 참조), 이는 본 발명의 방향족이 변형된 기공 형성 독소에 의해 비단백질성 특성의 뚜렷이 구분되는 저분자들 (플라빈, 비타민)이 포획 및 검출될 수 있음을 입증하는 것이다. 시아노코발라민으로도 알려진 비타민 B12는 분자량이 1355 Da인 비단백질성 분자이다.
또한, 본 발명은 본 발명에 따른 시스템을 제공하는 방법도 제공한다. 일반적으로, 상기 방법은 하기의 단계들을 포함한다:
- 상기 돌연변이 기공 형성 독소 또는 이의 기공 형성 단편의 재조합 단량체를 제공하는 단계;
- 상기 단량체를 리포솜 및/또는 계면활성제와 접촉시켜 이들을 올리고머로 조립하는 단계;
- 상기 리포솜 및/또는 계면활성제로부터 올리고머를 회수하는 단계; 및
- 상기 올리고머를 스핑고미엘린을 포함할 수 있는 막과 접촉시켜, 나노기공을 형성시키는 단계.
본 발명의 추가 실시형태는 재조합 기술에 의해 돌연변이 단백질 기공을 제조하기 위한 수단과 방법에 관한 것이다. 여기에는 본 발명에 따른 돌연변이 나노기공을 암호화하는 핵산 분자, 및 상기 핵산 분자를 포함하는 발현 벡터가 포함된다. 또한, 핵산을 함유하는 발현 벡터를 포함하는 숙주 세포, 바람직하게는 박테리아 숙주 세포도 포함된다.
본 발명의 분석 시스템은, 예를 들어 다중 시스템의 어레이 형태로 한 장치에 통합시킬 수도 있다. 상기 장치는 분석물 분석을 위한 임의의 통상적인 장치, 예컨대 어레이 또는 칩일 수 있다. 본 발명에 따른 복수의 분석 시스템 (센서)들을 포함하는 장치가 제공된다. 복수의 센서들은 동일한 단백질성 나노기공 (즉, 동일한 돌연변이)에 기초할 수 있거나, 또는 예를 들어 각 나노기공 센서를 별도로 처리하여 측정하는 복수의 전기 회로에 연결될 수 있는, 복수의 막에 삽입된 별개의 나노기공들에 기초할 수도 있다. 바람직하게는, 각 막에는 단일 기공이 존재한다. 기공은 이들의 유형, 계열, 돌연변이 등에 따라 달라질 수 있다. 한 실시형태에서, 장치는 다수의 기공을 포함하여 펩타이드로부터 서로 다른 특징적인 신호를 생성하고, 이 신호를 비교 또는 조합하여 이들의 구별과 특성화를 개선시킬 수 있다.
본 발명의 단백질 나노기공은 막 내에 존재할 수도 있고, 필요하다면 삽입될 수도 있다. 단백질 나노기공은 일반적으로 비대칭형이며, 당업계에 공지된 다양한 수단에 의해 분석 시스템의 시스 및 트랜스 구획에 대한 방향 제어를 통해 삽입될 수 있다. 일반적으로, 본원의 실시예에서 달리 언급하지 않는 한, 나노기공은 시스 구획으로부터 삽입된다.
본 발명에 따라 임의의 막이 사용될 수 있다. 적합한 막들은 당업계에 잘 알려져 있다. 막은 양친매성 층인 것이 바람직하다. 양친매성 층은 친수성과 소수성/친유성 특성을 모두 갖는, 인지질과 같은 양친매성 분자로 형성된 층이다. 양친매성 층은 단층이거나 이중층일 수 있다. 막은 바람직하게는 인지질의 이중층으로 형성된다. 막은 바람직하게는 낮은 pH 조건 하에서 화학적으로 안정한 지질 또는 양친매성 분자, 예를 들어 에테르 결합된 인지질로 형성된다. 양친매성 분자는 합성되거나 자연 발생적인 것일 수 있다. 단층을 형성하는 비천연 양친매성 물질은 당업계에 공지되어 있으며, 예를 들어 다양한 중합체 조성물의 블록 공중합체 (디-블록, 트리-블록, 테트라-블록 등)를 포함한다.
분석 방법
분석 시스템 또는 장치는 다양한 분석 방법에 사용된다. 예를 들어, 이는 단일 분자 분석에서 사용되는 것이 유리하다. 따라서, 본 발명의 추가의 실시형태는 단일 분자 분석 방법으로서, 상기 방법이 분석할 물질 또는 물질들의 혼합물을 본원에 제공된 (복수의) 분석 시스템(들)의 챔버에 첨가하는 단계, 상기 물질(들)을 나노기공(의 내강-대면 영역)에 접촉시키는 단계, 및 상기 물질 (본원에서는 "분석물" 또는 "관심대상 분석물"이라고도 칭함)의 적어도 하나의 특성을 검출/특성분석 하는 단계를 포함하는 것인, 단일 분자 분석 방법에 관한 것이다. 상기 물질/분석물은 나노기공을 통한 전류의 변화에 의해 검출될 수 있다. 예를 들어, 물질의 다양한 특성, 예를 들어 이에 제한되지는 않지만, 부피, 형태, 전하, 구조, 가교결합, 번역 후 변형 (인산화, 글리코실화, 람노실화 등), 손상, (D/L-) 키랄성 및 서열을 검출할 수 있다.
바람직하게는, 상기 방법은 물질의 식별 및/또는 염기서열분석을 포함한다. 상기 분석 시스템 또는 방법은 놀랍게도 200 내지 5000 Da 범위, 예를 들어 500 내지 1700 Da 범위의 질량을 갖는 분석물의 분석에 적합하다.
예를 들어, 펩타이드 분석물과 같은 물질은 일반적으로 임의의 적절한 샘플에 존재한다. 본 발명은 일반적으로 해당 분석물을 함유하는 것으로 알려져 있거나 함유하는 것으로 의심되는 샘플에 대해 수행된다. 다르게는, 본 발명은 샘플 내의 존재가 알려져 있거나 예상되는 분석물의 정체를 확인하기 위해 샘플 상에서 수행될 수 있다. 샘플은 생물학적 샘플일 수도 있다. 본 발명은 임의의 유기체 또는 미생물 (예컨대, 고세균, 원핵생물 또는 진핵생물)로부터 얻거나 이로부터 추출된 샘플을 사용하여 시험관 내에서 수행될 수 있다. 샘플은 바람직하게는 유체 샘플이다. 샘플은 환자의 체액 (예: 소변, 림프, 점액 또는 양수, 또는 바람직하게는 땀, 타액, 혈장 또는 혈청)을 포함할 수 있다. 샘플은 인간에서 유래할일 수도 있지만, 다르게는 다른 동물, 예컨대 상업적으로 사육된 동물, 또는 식물에서 유래할 수도 있다. 샘플은 비생물학적 샘플일 수도 있다. 비생물학적 샘플의 예로는 수술용 유체; 식수, 해수 또는 강수와 같은 물; 실험실 검사용 시약 등을 포함한다.
샘플은, 본 발명에 사용하기 전에, 예를 들어 당업계에 공지된 다양한 정제 수단에 의해 처리 (전처리)하여 단백질/펩타이드/분자 또는 표적 단백질/펩타이드/분자의 혼합물을 분리할 수 있다. 여기에는, 예를 들어 항체와 같은 친화성 결합 방법, 또는 샘플의 특정 성분을 분리 및 정제하거나 원치 않는 백그라운드 불순물을 제거하기 위한 크로마토그래피 방법도 포함될 수 있다. 단백질 샘플의 경우, 그 안에 함유된 단백질들은 바람직하게는, 예를 들어 당업계에 공지된 효소적 수단 (예: 프로테아제) 또는 다른 분해 수단에 의해 펩타이드 (바람직하게는 정의된 군집)로 단편화된다. 본 발명의 분석 방법은 하나 이상의 샘플 준비 단계를 포함할 수 있다. 예를 들어, 사전 여과 단계 및/또는 다른 방법 (예: Mass Spec)에 대해 수행된 기타 변형들을 들 수 있다.
당업자라면 누구나 고전적인 질량 분석법에 사용되는 여러가지 많은 샘플 준비 방법들이 본원에서 사용될 수 있음을 이해할 것이다. 예를 들어, 샘플의 단백질은 처리 및 나노기공 감지 단계 이전에 물리적 (예: 온도) 또는 화학적 (예: 카오트로픽제, 계면활성제) 수단에 의해 변성될 수 있다. 다르게는, 가교 결합, 예컨대 이황화물 브릿지를 끊어서 특정 2차 구조들을 파괴할 수도 있다. 다르게는, 변형, 예를 들어 대형 글리칸은 나노기공 감지 전에 변형, 절단 또는 제거될 수도 있다. 다르게는, 펩타이드 샘플의 아미노산 중 일부는 신호를 변경하기 위해 변형시킬 수도 있는데, 예를 들어 시스테인 또는 라이신은 나노기공 감지에서의 신호를 조절하기 위해 추가의 태그를 사용하여 화학적으로 표지하여 분석물에 대한 추가적인 이해를 제공할 수도 있다. 본 발명의 일부 실시 형태에서, 펩타이드 분석물은, 예를 들어 분자 표지나 태그를 첨가할 목적으로 (예컨대, 전구체 샘플을 등록하는 바코드를 추가하거나, 또는 나노기공 시스템에서 포획과 감지를 용이하게 하기 위해), 당업계에 공지된 방법을 사용하는 분자의 N-말단 또는 C-말단을 변경하는 반응에 적용시킬 수도 있다. 이러한 분자 표지/태그는 펩타이드 기반, 폴리뉴클레오타이드 기반이거나, 또는 다른 화학 물질들로 구성될 수도 있다.
한 측면에서, 본 발명은 단일 분자 분석 방법으로서, 상기 방법이 분석할 물질 또는 물질들의 혼합물을 본원에 제공된 분석 시스템의 챔버에 첨가하는 단계, 상기 물질(들)을 나노기공(의 내강-대면 영역)에 접촉시키는 단계, 및 상기 물질 (본원에서는 "분석물" 또는 "관심대상 분석물"이라고도 칭함)의 적어도 하나의 특성을 검출/특성분석 하는 단계를 포함하고, 상기 물질이 단백질성 물질, 바람직하게는 펩타이드, 보다 바람직하게는 길이가 약 30, 20, 15, 10, 5, 3개 또는 2개의 아미노산인 펩타이드 것인, 단일 분자 분석 방법을 제공한다.
상기 방법은 물질의 돌연변이 및/또는 번역후 변형을 검출하는 것, 예를 들어 단일 아미노산 잔기, 인산화의 정도 및/또는 글리코실화의 정도가 다른 펩타이드 단편들을 검출하는 것을 수반할 수 있다. 특정 실시형태에서, 나노기공은 변성 조건을 적용시킨 단백질 혼합물로부터 생성되거나, 또는 예를 들어 MS 분석에서 통상적으로 사용되는 프로테아제 소화를 비롯한, 단편화 조건을 적용시킨 단백질 혼합물로부터 생성되는 펩타이드를 검출한다. 한 측면에서, 단편화 조건은 양으로 하전된 펩타이드 단편을 유도한다. 본 발명의 방법은 펩타이드 스펙트럼으로부터 원래의 혼합물 내 단백질의 절대적 또는 상대적 존재비를 정량화하는 능력이 있다.
본 발명의 특정 실시형태에서, 펩타이드 검출을 위한 최적의 조건은 낮은 pH 조건, 바람직하게는 pH 4.5 미만, 바람직하게는 pH 4.0 미만에서 수행하는 것이다. 생리학적 pH 조건에서, 자연 발생 펩타이드는 산성, 염기성 및 중성 아미노산의 매우 가변적인 조성의 결과로서 광범위한 전하 분포와 순 전하 (예컨대, 순 양성 및 순 음성 모두)를 가진다. 이러한 전하의 다양성은 고정된 인가 전위가 적용될 때 나노기공 감지 시스템에서 서로 다른 펩타이드들의 다양한 혼합물에서 모든 펩타이드들을 포착하여 검출하는 능력을 상당히 복잡하게 하는데, 그 이유는 모든 펩타이드들이 동일한 순 전기영동력을 경험하는 것은 아닐 것이기 때문이다. 적용된 전위의 극성과 각 펩타이드의 구체적인 전하 조성에 따라, 일부 펩타이드들은 나노기공으로의 순 전기영동력을 경험할 것인 반면, 반대의 전하를 띤 다른 펩타이드들은 나노기공에서 순 전기영동력을 경험하게 될 것이다. 복잡한 펩타이드 분석물의 혼합물을 포함하는 나노기공 감지 시스템의 측면, 바람직하게는 막의 시스 및 트랜스 측 모두에 낮은 pH 조건을 구현함으로써, 펩타이드 분석물의 아미노산들은 양성자화된다. 증가된 양성자화는 1) 다양한 혼합물에서 모든 펩타이드들의 순 양전하를 증가시키고, 2) 펩타이드 혼합물에서 보다 균일한 전하 분포를 생성하는 역할을 한다. 증가된 순 양전하는 적절한 극성이 인가된 전위 하에 (예컨대, 음전위가 펩타이드 분석물에 대해 막 반대측 상의 전극에 인가되는 경우) 유지되는 나노기공 시스템에서 펩타이드의 향상된 전기영동 포획을 가능하게 한다.
또한, 펩타이드 혼합물의 향상된 전하 균일성은, 모든 펩타이드 분자들이 인가된 전위 하에 그들에게 작용하는 더 유사한 전기영동력을 경험하게 되므로 매우 유리하다. 전기영동은 분석물이 나노기공으로 포획되는 효율성을 결정하는 중요한 구성요소이기 때문에, 이는 혼합물 중의 서로 다른 펩타이드 조성 간의 포획 효율성 편향을 감소시킨다. 이러한 매우 유리한 특징은, 포획 효율이 좋지 않은 일부 펩타이드 대상군이 포획 효율이 더 높은 펩타이드 모집단의 백그라운드에서 누락되거나 손실될 가능성을 감소시킨다.
낮은 pH 조건을 구현하여도 수-대면 아미노산들 중 일부를 부분적으로 양성자화함으로써 감지 시스템에서의 나노기공의 전하 특성도 변경된다. 특히, 나노기공 채널 내부와 내강 인식 영역 내부에서 증가된 양전하는, 펩타이드 분석물의 포획과 후속 검출을 변경시킨다. 낮은 pH 조건에서, 나노기공의 증가된 양전하는 대부분 양전하를 띤 펩타이드 분석물을 정전기적으로 밀어낼 수 있는데, 이는 결국 포획 효율을 감소시키고/거나 나노기공 내부의 펩타이드의 체류 시간을 감소시킬 수 있다. 이로 인해 일부 펩타이드 분석물을 검출하여 특성분석하는 능력이 저하될 수 있다.
나노기공 시스템에서는 다양한 서로 다른 유형의 측정이 이루어질 수 있다. 여기에는 전기적 측정과 광학 측정이 포함되지만 이에 국한되지는 않는다. 가능한 전기적 측정에는 전류 측정, 임피던스 측정, 터널링 (tunnelling) 측정 및 국부 전압 (local voltage) 변화에 대한 전계 효과 트랜지스터 (FET) 측정이 포함된다. 광학적 측정과 전기적 측정을 조합하여 추가의 정보를 제공할 수 있다 (Heron et al. J Am Chem Soc 2009). 광학적 측정은 이온 플럭스의 리포터인 염료 시스템을 사용할 수 있다 (Heron et al. J Am Chem Soc 2009).
본 방법은 바람직하게는 막에 인가된 전위로 수행된다. 인가된 전위는 전압 전위일 수 있다. 인가된 전압은 나노기공을 통해 전기영동 및/또는 전기삼투압 흐름을 가능하게 하여 분석물 포획과 검출을 용이하게 한다. 관례에 따라, 본원에서 본 발명의 데이터에 대해 달리 정의하지 않는 한, 활성 전극은 트랜스 구획에 있는 것으로 정의되며, (예컨대, 시스 구획의 접지 전극에 대해) 언급한 전위의 극성이 인가되는 전극이다. 당업자라면 누구나, 대안적인 전극 구성들이 당업계에 알려져 있고, 이들은, 예를 들어 인가된 전위의 사용을 통해 나노기공 시스템에서 전기영동 및/또는 전기삼투압 분석물 포획을 제어하고/하거나, 이온 전류 또는 국부 전압의 변화를 측정하는데 사용될 수 있음을 이해할 것이다. 인가된 전위는 고정된 기간 (밀리초, 초, 분, 시간) 동안 일정한 전압으로 유지될 수 있다. 다르게는, 감지 조건을 변경하고/하거나 분석물로부터 다른 정보를 얻기 위해 개별 단계에서 전압을 변경할 수도 있다. 전압은 계속 변화될 수 있는데, 예를 들어 당업자라면 누구나 다양한 패턴 (예컨대, 구형파, 삼각파, 정현파 등)의 파형을 사용하여 분석물 포착을 제어해서 분석물로부터 다양한 특성을 얻을 수 있음을 이해할 것이다. 다르게는, 인가된 전위는 화학적 전위 (예컨대, 막에 대한 염구배)일 수 있다. 사용되는 전압은 일반적으로 +50 V 내지 -50 V, 또는 +100 V 내지 -100 V이다.사용되는 전압은 바람직하게는 -300 mV, -300 mV, -150 mV, -100 mV, -50mV, -20 mV 및 0 mV로부터 선택되는 하한값과 +10 mV, +20 mV, +50 mV, +100 mV, +150 mV, +200 mV, +300 mV로부터 독립적으로 선택되는 상한값을 갖는 범위에 있다. 사용되는 전압은 +-50 mV 내지 +-150 mV 범위가 보다 바람직하고, +-50 mV 내지 +-100 mV 범위가 가장 바람직하다.
본 방법은 일반적으로 금속염 또는 이온성 액체와 같이 챔버 내의 수용액에 존재하는 잘 알려진 전하 운반체를 사용하여 수행된다. 예를 들어, 알칼리 금속염, 할로겐화물 염, 예를 들어 클로라이드 염, 예컨대 알칼리 금속 클로라이드 염, 또는 이온성 액체 또는 유기 염, 예컨대 테트라메틸 암모늄 클로라이드, 트리메틸페닐 암모늄 클로라이드, 페닐트리메틸 암모늄 클로라이드, 또는 1-에틸-3-메틸 이미다졸륨 클로라이드를 들 수 있다. 염은 염화칼륨 (KCl), 염화나트륨 (NaCl), 또는 염화리튬 (LiCl)이 바람직하다. 용액은 적절한 전극에서 전자 전달을 중재하기 위해 잘 알려진 산화환원 염, 예를 들어 페로시안화칼륨 및 페리시안화칼륨 또는 기타 잘 알려진 산화환원 쌍을 함유할 수 있다. 염 농도의 범위는 0.1 내지 3M이거나, 또는 주어진 염 유형에 대한 포화점까지일 수도 있다. 염 농도는 바람직하게는 0.1 내지 1.5 M, 가장 바람직하게는 0.15 내지 1.0 M이다. 본 방법은 일반적으로 완충제의 존재 하에 수행된다. 상기 논의된 예시적인 장치에서, 완충제는 챔버 내에서 수용액으로 존재한다. 임의의 완충제가 본 발명의 방법에 사용될 수 있다. 일반적으로, 완충제는 비스-트리스 (bis-tris) 완충제, 시트르산염 완충제, 인산염 완충제, HEPES 완충제 또는 트리스-HCl 완충제이다. 본 방법은 일반적으로 아래 범위에 적합한 완충제 (예컨대, 시트르산염 완충제)를 사용하여 pH 8.0 미만, 바람직하게는 pH 4.5 미만, 가장 바람직하게는 pH 4.0 미만에서 수행된다. 본 방법은 0℃내지 100℃, 바람직하게는 약 20℃ 내지 약 40℃에서 수행될 수 있다.
전기적 측정은 본원에 설명된 것과 같은 표준 단일 채널 기록 장비를 사용하여 수행될 수 있다. 다르게는, 전기적 측정은 다수의 독립적인 나노기공 시스템 (예를 들어, 삽입된 나노기공을 함유하는 복수의 막)으로부터 신호를 동시에 획득할 수 있는 당업계에 공지된 다중 채널 시스템을 사용하여 이루어질 수도 있다.
본 발명의 방법은 전류 신호의 다양한 특성에 대한 측정, 가장 바람직하게는 분석물의 포획과 검출에서 발생하는 사건의 차단에 대한 측정을 포함할 수 있다. 상기 하나 이상의 특성은 바람직하게는 개방 기공 전류, 사건 차단의 평균 또는 중앙값 전류, 사건 차단의 지속 시간 (체류) 시간, 사건 차단의 빈도, 사건 차단의 수, 사건 차단의 노이즈, 및 사건 차단의 형태 (단계적 변화 포함)으로부터 선택된다. 당업자라면 누구나 다양한 분석적 도구를 사용하여 사건 차단 및 현재 신호의 다른 부분들로부터 높은 수준의 정보를 추출할 수 있음을 이해할 것이다. 예를 들어, 엣지 검출 알고리즘 (edge-detecting algorithm)을 사용하여 사건 차단을 분할하여 데이터를 단순화할 수 있다. 다르게는, 원시 데이터는 필터를 적용하거나 적용하지 않고, 예를 들어 슬라이딩 윈도우 특성 및 장기 메모리가 있는 알고리즘을 사용하여 직접적으로 분석하여, 특징적인 메트릭 (metric)을 추출할 수 있다.
본 발명의 방법은 신호의 특징적인 메트릭으로부터 분석물의 1개, 2개, 3개, 4개 또는 5개 이상의 특징을 결정하는 것을 수반할 수 있다. 상기 하나 이상의 특징은 바람직하게는 분석물의 길이, 분석물의 부피, 분석물의 질량, 분석물의 형태, 분석물의 전하 분포, 분석물의 정체성, 분석물의 서열, 및 분석물의 임의의 화학적 변형으로부터 선택된다. 분석물의 특징은, 예를 들어 통계적 방법 또는 기계적 학습 방법을 비롯한, 당업계에 알려진 임의의 수의 다양한 분석 방법들에 의해 결정될 수 있다. 이러한 방법들은, 예를 들어 모델 분석물을 사용하여 해당 시스템을 훈련시켜 훈련 또는 최적화되었을 수도 있거나, 또는 제1 원칙에 따라 구축되었을 수도 있다. 예를 들어, 훈련 데이터를 사용하여 과거에 획득한 데이터와 비교함으로써 펩타이드의 정체성을 확인할 수 있다. 또한, 본원에서는 스펙트럼을 이론적 데이터 또는 과거에 훈련된 데이터와 비교하여 펩타이드 핑거프린트로부터 원래의 단백질(들)의 정체성을 결정하는 분석적 방법도 제공된다. 당업자라면 누구나, 각 나노기공 사건에 대해 얻어진 다중-측정항목 데이터를 (예컨대, 2, 3, 4, 5, 6개, 또는 그 이상의 별도의 사건 측정항목의 조합된 비교에 의해) 더 높은 차원 분석에서 활용하여, 하나의 측정항목만으로는 분리할 수 없는 다양한 분석물들을 식별할 수 있음을 이해할 것이다. 또한, 당업자라면 누구나, 다중 분석물 사건들의 수집 (스펙트럼)은 한 샘플 내 분석물들의 개별 모집단에 대한 모집단 총체 (population ensemble)로서 분석될 수 있고, 개별 모집단들은 (예컨대, 여러 측정항목들을 축으로서 사용하여 여러 차원에서) 해소될 수 있으며, 다양한 고급 피팅 및 분류 도구들을 사용하여 식별할 수 있음을 알 것이다. 또한, 모집단들의 고유한 데이터, 예를 들어 핑거프린트를 분석 방법에 사용하여 분석물 조성을 확인할 수 있기 때문에, 예를 들어 소화된 펩타이드 혼합물의 경우, 전구체 단백질을 식별 및/또는 정량할 수 있다.
본원에 하기 예시된 바와 같이, 본 발명자들은, 에어로라이신과 CytK와 같은 특정 단백질 나노기공의 경우에, 나노기공 채널에서, 바람직하게는 인식 영역에서, 가장 바람직하게는 수축부나 그 부근에서, 바람직하게는 방향족 돌연변이와 조합하여, 순 양전하를 감소시키는 것이, 낮은 pH 조건 하에서 펩타이드 분석물을 효율적으로 포획하여 인식하기 위해 필수적이거나 매우 유리하다는 것을 발견했다. 예를 들어, 방향족 돌연변이(들) (Phe/Tyr/Trp)에 인접한 치환을 통해 산성 잔기(들) (Asp/Glu)을 도입에 의한다. 따라서, 한 실시형태에서, 기공은 수-대면 영역에서 Glu 및/또는 Asp 잔기(들)에 대한 하나 이상의 돌연변이(들)을 포함한다. 다르게는, 염기성 잔기(들) (Arg/Lys/His)을 중성 또는 산성 잔기(들)로 대체함으로써, 선택적으로는 개별적으로 추가로 펩타이드 포획과 식별을 향상시키는 방향족 잔기들로 치환함으로써, 순 양전하를 감소시킬 수도 있는 것으로 이해한다 (예컨대, 본원에 포함된 CytK-K128F, Aer-K238F 실시예).
낮은 pH 조건에서 나노기공 채널의 증가된 양전하도 해당 나노기공의 이온 선택성을 변경시킨다. 나노기공 채널의 증가된 양전하는 음이온 종들의 수송 증가에 유리하고 양이온 종들의 수송을 감소시키는데, 이는 결국 인가된 전위 하에서 나노기공을 통해 흐르는 수화된 이온의 순 전기-삼투압 플럭스를 변경시킨다. 나노기공을 통한 증가된 음이온성 전기-삼투압 플럭스는 낮은 pH 조건에서 대부분 양으로 하전된 펩타이드 분석물에 작용하는 전기영동력에 대항하여 작용할 것이다.
나노기공 시스템에 대한 전기-삼투압 성분의 방향과 크기는 당업계에 공지된 이온 선택성 측정에 의해 결정될 수 있다. 예를 들어, 나노기공 이온 선택성은 비대칭성 염 조건 (예컨대, 트랜스 구획에 2 M KCl, 시스 구획에 0.5 M KCl) 하에 반전 전위를 측정하여 시험관 내 전기생리학 시스템 중에서 측정할 수 있다. 아래 표 3에는 선택된 에어로라이신 및 CytK 나노기공에 대해 측정된 반전 전위와 이온 선택성을 포함하고 있다. 낮은 pH에서 FraC 이온 선택성은 과거에 측정된 바 있다 (Huang et al. Nat. Commun. 2019).
본원에 포함된 FraC 나노기공 및 CytK 나노기공 예에서와 같이, 전기영동에 의한 분석물 포획이 가능하도록 설정된 나노기공 감지 시스템의 경우 (예컨대, 펩타이드 분석물을 함유하는 구획의 반대쪽 구획에 있는 전극에 음전위가 인가되는 시스템에서), 선택된 감지 조건 하에 과도한 전기삼투력이 분석물의 전기영동 포획에 대항하여 작용하지 않도록 해두는 것이 유리하다. 따라서, 이온 선택성과 전기-삼투압 플럭스가 낮은 pH 조건의 구현에 의해 증가되는 본 발명의 특정 실시형태 (예컨대, 본원에 포함된 CytK 나노기공 예의 경우)에서, 순 이온 선택성 및 전기-삼투압 플럭스를, 바람직하게는 전기영동력이 분석물 포획을 지배하는 수준까지, 바람직하게는 순 이온 선택성이 0에 가깝게 감소시키는 것이 유리할 수 있다. 전기-삼투압은 나노기공 채널 내부의 순 전하를 감소시킴으로써 (예컨대, 돌연변이 유발에 의함, 표 4 참조) 감소될 수 있다. 예를 들어, 음이온 이온 선택성 편향과 그에 따른 순 음이온성 전기-삼투압 플럭스는 방향족 돌연변이에 인접한 치환에 의해 산성 잔기를 도입함으로써 감소시킬 수 있다. 따라서, 한 실시형태에서, 기공은 수-대면 영역에서 Glu 및/또는 Asp 잔기(들)에 대한 하나 이상의 돌연변이(들)을 포함한다. 다르게는, 염기성 잔기들을 중성 또는 산성 잔기(들)로 대체함으로써, 선택적으로는 개별적으로 추가로 펩타이드 포획과 식별을 향상시키는 방향족 잔기로 치환함으로써, 순 양전하를 감소시킬 수도 있는 것으로 이해한다 (예컨대, 본원에 포함된 CytK-K128F, Aer-K238F 실시예).
FraC, FraE 또는 FraB와 같은 일부 단백질들에서, 야생형 기공은 최적의 이온 선택성과 전기-삼투압 및 대부분 양전하를 띤 분석물과의 최적의 상호작용을 위해 낮은 pH 조건 하에 수-대면 나노기공 채널/내강 또는 인식 영역 내부에 이미 충분한 음전하 특성을 포함하고 있으므로, 도입된 방향족 잔기(들)과의 공간적 조합과 함께 추가의 음전하를 부가하기 위한 돌연변이는 필요하지 않다. 이와는 반대로, 본원의 FraC 예에서 산성 잔기를 제거하면, 나노기공의 순 양성도가 증가하고, 전기영동력 우세 상황 하에 펩타이드 포획과 식별력은 크게 감소된다.
본 발명의 일부 실시형태에서, 효율적인 펩타이드 분석물 포획과 검출은 우세한 전기-삼투 포획을 만들도록 설정된 조건 하에 달성될 수 있다는 것이 밝혀졌다. 예를 들어, 본원의 에어로라이신 나노기공 시스템 예의 경우, 낮은 pH 조건을 구현하면 나노기공 채널 내부의 순 양전하가 증가하므로, 음이온 선택성 및, 강한 순 음이온 선택성 나노기공 (표 3 참조)이 증가하고, 대부분이 양전하를 띤 분석물의 정전기적 반발력도 증가된다. 나노기공을 통해 생성된 강한 전기-삼투압 플럭스는 분석물에 작용하는 전기영동력의 방향에 반대되는 분석물을 포획하는데 활용될 수 있다 (예컨대, 시스 용액에 대부분 양전하를 띤 펩타이드가 있는 시스템의 경우 트랜스 전극에 양의 인가 전위가 있는 경우 - 본원의 에어로라이신 실시예 참조). 본 발명의 특정 실시형태에서, 전기-삼투력을 활용하여 분석물을 포획하는 것이 매우 유리할 수 있는데, 이는 이렇게 하는 것이 전하 조성에 덜 민감하기 때문이다. 따라서, 이는 표지되지 않은 펩타이드의 다양한 조성 (예컨대, 중성, 순 양성, 순 음성)을 포획하여 검출하는데 매우 유리할 수 있다. 본 발명의 특정 실시형태에서, 분석물에 작용하는 전기-삼투력의 강도는 (예컨대, 돌연변이 유발에 의해) 추가로 조정될 수도 있다. 예를 들어, 특정 실시형태에서, 전기-삼투력을 감소시켜 분석물이 나노기공에 유지되는 기간을 증가시키는 것이 유용할 수 있다. 예를 들어, 음이온 이온 선택성 편향과 낮은 pH 조건에서 발생하는 순 음이온성 전기-삼투압 플럭스는 산성 잔기를 도입함으로써, 바람직하게는 방향족 돌연변이에 인접한 치환을 통해 감소될 수 있다. 순 양전하를 감소시키는 산성 돌연변이 치환은 대부분 양전하를 띤 분석물의 정전기적 반발력도 감소시킨다. 따라서, 한 실시형태에서, 기공은 수-대면 영역에서 Glu 및/또는 Asp 잔기(들)에 대한 하나 이상의 돌연변이(들)을 포함한다. 다르게는, 염기성 잔기들을 중성 또는 산성 잔기로 대체함으로써, 선택적으로는 개별적으로 추가로 펩타이드 포획과 식별을 향상시키는 방향족 잔기로 치환함으로써, 순 양전하를 감소시킬 수도 있는 것으로 이해한다 (예컨대, CytK-K128F, Aer-K238F). 또한, 돌연변이 유발법은 전기-삼투압 효과의 방향과 크기를 제어하기 위해 시스템 조건 (예컨대, pH, 염 유형, 염 비대칭성)의 변화와 조합될 수 있으며, 예를 들어 역방향 전압 측정을 통해 이전에 설명한 바와 같이 실험적으로 결정될 수 있음도 이해한다.
이런 이유로, 서로 다른 펩타이드들을 구별할 목적으로 비표지된 펩타이드를 포획하여 특성화하기 위한 나노기공 감지 시스템의 전기영동 및 전기삼투 성분들을 최적화하는 방법을 본원에 설명하였다. 효과적인 펩타이드 감지 또는 다른 분자들의 감지를 위한 최적의 "특성분석 매개변수"는 모델 펩타이드 또는 천연 펩타이드들을 사용한 측정을 통해 나노기공 시스템에서 실험적으로 결정될 수 있다.
성분 키트
또한, 본 발명은, 예를 들어 관심대상 분석물의 특성 분석에 사용하기 위한 성분 키트로서, 상기 키트가 (i) 본 발명에 따른 돌연변이형 단백질성 나노기공, 분석 시스템 및/또는 장치; 및 (ii) 분석물 처리 효소를 포함하는 것인, 성분 키트도 제공한다. 바람직하게는, 분석물 처리 효소는 프로테아제와 같은 단백질 처리 효소이다. 특히 흥미로운 것은 트립신 또는 다른 프로테아제, 예컨대 키모트립신 또는 Lys-C 프로테아제이다. 트립신을 사용하면 유리할 수 있는데, 그 이유는 트립신이 K/R 아미노산 이후를 우선적으로 절단하기 때문이며, 대부분의 펩타이드들이 해당 펩타이드의 양쪽성 이온 전하 옆에 양전하를 가질 것이므로, 분석에 사용된 산성 내지 중성 pH 조건 하에 +1의 추가의 순 전하가 생성된다. Lys-C 프로테아제는 라이신 잔기에 대한 높은 활성과 특이성을 가지므로, 트립신보다 더 큰 펩타이드를 생성하며, 샘플 복잡성은 트립신보다 덜하다 (즉, 더 적은 펩타이드). 트립신과는 달리, Lys-C 프로테아제는 라이신과 프롤린을 차례로 절단할 수 있어, 트립신에 이어 순차적인 단백질 소화에 있어서 절단 누락을 감소시키는데 있어 이상적이다. 이러한 고유한 Lys-C 프로테아제 특성은 단독으로 사용하거나, 또는 이어서 트립신 소화를 사용하여 높은 소화 효율을 보장한다.
당업자가 이해하는 바와 같이, 본원에 개시된 돌연변이형 단백질성 기공을 포함하는 분석 시스템, 장치 또는 키트는, 예를 들어 분자 분석 및 확인 분야에서 많이 사용되고 응용된다. 여기에는 단일 분자 분석, 바람직하게는 생체분자 또는 생체고분자의 식별 및/또는 염기서열분석, 보다 바람직하게는 무표지 단백질 또는 펩타이드 핑거프린팅이 포함된다.
본 발명의 추가 실시형태들은 다음과 같다.
<1> 돌연변이 베타-배럴형 (beta-barrel) 단백질 기공 형성 독소 또는 이의 기공 형성 단편을 포함하는 단백질성 나노기공으로서, 상기 기공 형성 단백질 또는 이의 단편의 내강-대면 (lumen-facing) 인식 영역이, 내강-대면 비방향족 아미노산(들)의 천연 또는 비천연 방향족 아미노산 잔기로의 하나 이상의 치환(들)을 포함하는 것인, 단백질성 나노기공.
<2> <1>에 있어서, 내강-대면 아미노산(들)의 Trp, Tyr 또는 Phe로의 하나 이상의 치환(들)을 포함하는 돌연변이형 기공 형성 독소를 포함하는, 단백질성 나노기공.
<3> <1> 또는 <2>에 있어서, 상기 베타-배럴형 기공 형성 독소가 인식 영역에서 0.2 내지 2.0 나노미터 범위의 내부 직경 (기공 크기; 수축)을 가지며, 바람직하게는 0.5 내지 1.5 나노미터의 최소 내부 직경을 갖는 것인, 단백질성 나노기공.
<4> <1> 내지 <3> 중 어느 하나에 있어서, 알파-용혈소 (SwissProt P09616.2), 에어로라이신 (SwissProt P09167), 감마-용혈소 성분 B (SwissProt P0A075.1), 리세닌 (SwissProt O18423), 엡실론-톡신 (ETX), 용혈성 렉틴 (LSL; SwissProt Q868M7), 사이토라이신 k (cytK; SwissProt Q937V2), 및 이들과 적어도 80%, 바람직하게는 적어도 85%, 보다 바람직하게는 적어도 90%의 서열 동일성을 나타내는 기능성 상동체를 포함하는, 단백질성 나노기공.
<5> <4>에 있어서, 에어로라이신, 리세닌 및 사이토라이신 k (cytK), 및 이들과 적어도 90%, 바람직하게는 적어도 95%, 보다 바람직하게는 적어도 98%의 서열 동일성을 나타내는 기능적 상동체로 이루어진 군으로부터 선택되는, 단백질성 나노기공.
<6> <1> 내지 <5> 중 어느 하나에 있어서, 에어로라이신의 잔기 212 내지 242 및 256 내지 284로 이어지는, 기공의 수-대면 (water-facing) 영역에 방향족 아미노산 치환을 포함하는 에어로라이신 (Aer)을 포함하고, 바람직하게는 방향족 돌연변이가 적어도 영역 212 내지 242에 있고, 보다 바람직하게는 돌연변이가 Q212, G214, D216, T218, R220, D222, A224, N226, S228, T230, T232, G234, S236, K238, T240 또는 K242를 포함하는 하나 이상의 위치에서 치환된 W, Y 또는 F인 것인, 단백질성 나노기공.
<7> <1> 내지 <5> 중 어느 하나에 있어서, 돌연변이 CytK를 포함하고, 바람직하게는 기공의 내강-대면 영역에 방향족 아미노산 치환을 포함하되, 이 영역은 잔기 112 내지 잔기 155까지 걸쳐 있고, 보다 바람직하게는 하기의 내강-대면 비방향족 막횡단 잔기들 중 하나 이상 (예컨대, 최대 5개, 바람직하게는 최대 4개, 보다 바람직하게는 최대 3개 또는 2개)에 걸쳐 있는 것인, 단백질성 나노기공:
E112/T114/T116/S118/S120/Q122/G124/S126/K128/S130/T132/S134/S137/E139/G141/T143/Q145/T147/S149/S151/S153/K155,
예컨대 E112/T114/T116/S118/S120/Q122/G124/S126 중 하나 이상.
<8> <1> 내지 <5> 중 어느 하나에 있어서, 돌연변이 리세닌 (UniProtKB - P13423) 또는 이의 기공 형성 단편을 포함하고, 바람직하게는 위치 35, 37, 39, 41, 45, 43, 47, 49, 51, 53, 55, 57, 59, 63, 61, 65, 68, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102 및/또는 104에 방향족 치환기를 포함하며, 보다 바람직하게는 Lys 돌연변이가 위치 Glu76에 방향족 치환, 예를 들어 돌연변이 Lys-E76F를 포함하는 것인, 단백질성 나노기공.
<9> <1> 내지 <8> 중 어느 하나에 있어서, 하나 이상의 추가의 돌연변이(들)이 인식 영역의 내강-대면 아미노산에 도입되고, 이러한 추가의 돌연변이(들)이 해당 기공의 순 음전하를 증가시키는 것인, 단백질성 나노기공.
<10> <9>에 있어서, Glu 및/또는 Asp 잔기에 대한 하나 이상의 돌연변이를 포함하는, 단백질성 나노기공.
<11> <1> 내지 <10> 중 어느 하나에 있어서, 하기로 이루어진 군으로부터 선택된 돌연변이 베타-배럴형 기공 또는 이의 단편을 포함하는, 단백질성 나노기공:
(i) Aer-K238D, Aer-K238D-A260F, Aer-K238D-S264F, Aer-K238D-Q268F 및 Aer-K238D-S272F;
(ii) CytK-Ser126Tyr, CytK-Ser126Trp, CytK-Ser126Phe, (ii)CytK-Lys128Tyr, CytK-Lys128Trp, CytK-Lys128Phe, S120W/F/Y+ K128D, Q122W/F/Y + K128D, G124W/F/Y + K128D, S126W/F/Y + K128D; 및
(iii) Lys-E76F.
<12> 분석 시스템으로서, 유체 챔버를 시스 측과 트랜스 측으로 분리하는 소수성 막을 포함하고, 상기 막은 <1> 내지 <11> 중 어느 하나에 따른 돌연변이형 단백질성 나노기공을 포함하는 것인, 분석 시스템.
<13> 하기 단계를 포함하는, <12>에 따른 시스템을 제공하는 방법:
- 상기 돌연변이 기공 형성 독소 또는 이의 기공 형성 단편의 재조합 단량체를 제공하는 단계;
- 상기 단량체를 리포솜 및/또는 계면활성제와 접촉시켜 이들을 올리고머로 조립하는 단계;
- 상기 리포솜 및/또는 계면활성제로부터 올리고머를 회수하는 단계; 및
- 상기 올리고머를 스핑고미엘린을 포함할 수 있는 막과 접촉시켜, 나노기공을 형성시키는 단계.
<14> 단일 분자 분석 방법, 바람직하게는 관심대상 분석물의 식별 및/또는 염기서열분석을 위한, 단일 분자 분석 방법으로서, <12>에 따른 분석 시스템의 챔버에 관심대상 분석물을 첨가하는 단계, 상기 분석물을 나노기공에 접촉시키는 단계, 및 상기 분석물의 적어도 하나의 속성을 검출/특성분석하는 단계를 포함하는 것인, 방법.
<15> <14>에 있어서, 상기 분석물이 전기영동적으로 및/또는 전기삼투적으로 나노기공에 포획되도록, 상기 나노기공에 전기장을 가하는 단계를 포함하는, 방법.
<16> <14> 또는 <15>에 있어서, 상기 관심대상 분석물의 질량이 200 내지 5000 Da 범위, 바람직하게는 200 내지 500 Da, 또는 500 내지 1700 Da 범위인 것인, 방법.
<17> <14> 내지 <16> 중 어느 하나에 있어서, 상기 관심대상 분석물이 바람직하게는 단백질, 폴리펩타이드 및 올리고펩타이드로 이루어진 군으로부터 선택되는 생체고분자인 것인, 방법.
<18> <17>에 있어서, 상기 관심대상 분석물이 단백질성 물질, 바람직하게는 펩타이드, 보다 바람직하게는 최대 약 30, 20, 15, 10, 5, 3개 또는 2개의 아미노산 길이를 갖는 펩타이드인 것인, 방법.
<19> <17> 또는 <18>에 있어서, 분석물의 돌연변이 및/또는 번역후 변형을 검출하는 단계, 예를 들어 단일 아미노산 잔기, 아미노산 키랄성, 인산화의 정도 및/또는 글리코실화의 정도가 다른 펩타이드 단편들을 검출하는 단계를 포함하는, 방법.
<20> <14> 내지 <19> 중 어느 하나에 있어서, 상기 검출이 pH 4.5 이하, 바람직하게는 pH 4.0 미만에서 수행하는 것인, 방법.
<21> 막횡단 베타-배럴형 단백질 기공을 통한 펩타이드 분석물의 전위 속도를 감소시키는 방법으로서, 상기 방법이
(a) 하나 이상의 내강-대면 비방향족 아미노산(들)을 하나 이상의 방향족 아미노산(들)로 치환함으로써 기공 내강의 순 방향족성을 증가시키는 단계; 및
(b) 폴리펩타이드를 상기 기공으로 통과시키는 단계로서, 이때 순 방향족성의 증가가 상기 기공을 통한 폴리펩타이드의 전위 속도를 감소시키는 것인, 단계를 포함하는 것인, 방법.
<22> <21>에 있어서, 상기 단계 (a)가 <1> 내지 <11> 중 어느 하나에 따른 단백질성 나노기공을 제공하는 단계를 포함하는 것인, 방법.
<23> <12>에 따른 복수의 분석 시스템을 포함하는 장치로서, 바람직하게는 상기 분석 시스템이 뚜렷이 다른 기공 유형들을 포함하는 것인, 방법.
<24> 관심대상 분석물을 특성 분석하기 위한 성분 키트로서, (i) <1> 내지 <11> 중 어느 하나에 따른 돌연변이형 단백질성 나노기공, <12>에 따른 분석 시스템, 또는 <23>에 따른 장치; 및 (ii) 분석물 처리 효소, 바람직하게는 프로테아제를 포함하는 것인, 성분 키트.
<25> 단일 분자 분석을 위한, 바람직하게는 생체분자 또는 생체고분자의 식별 및/또는 염기서열분석을 위한, 보다 바람직하게는 무표지 단백질 핑거프린팅을 위한, <12>에 따른 분석 시스템, <23>에 따른 장치, 또는 <24>에 따른 키트의 용도.
도 1. 악티노포린 공통 서열 정렬 및 야생형 프라가세아톡신 C. a: 일부 공지된 악티노포린의 공통 서열 정렬로서, 점들은 공통 서열과 동일한 아미노산을 나타내고, 기공들 간의 다른 아미노산 차이는 1-문자 코드로 나타낸다. b: 지질 이중층에 삽입된 프라가세아톡신 C의 정교한 모델 (PDB: 4TSY)로서, 여기 지질 이중층에 전압이 인가된다. 보존되지 않은 여러 위치들을 확대하였다. c: 비스-트리스 프로판을 사용하여 pH 3.8로 적정된 1M KCl 및 50 mM 시트르산 중 -50 mV의 인가 전위 하에 옥타머 (T1) 및 헵타머 (T2) 형태의 야생형 프라가세아톡신 C의 예시적인 추적기록. 10 kHz 베셀 (Bessel) 필터와 5 kHz 가우스 (Gaussian) 필터를 사용하여, 50 kHz의 샘플링 주파수에서 추적기록을 수집했다.
도 2. 프라가세아톡신 C 동족체 간의 정렬. 프라가세아톡신 C의 D10 및 G13에 해당하는 상동체에서의 위치들을 강조해서 표시하였다.
도 3. 트립신으로 소화된 라이소자임이 포함된 (돌연변이) 프라가세아톡신 C의 전기생리학 기록. A: -50 mV의 인가 전위 하에서 시스 측에 첨가된 동일한 단위의 트립신 소화된 라이소자임과 조합된 (돌연변이) 프라가세아톡신 C의 예시적인 전기 이온 전류 기록. 전류의 기록은 다양한 기공들에 있어서 대표적인 섹션들의 이온 전류 데이터를 보여주고 있다. 가장 낮은 전류 수준은 기공의 개방형 기공 전류 (IO)이고, 계단형 상향 사건들은 나노기공을 통해 흐르는 이온 전류의 일부를 차폐하는 포획된 분석물에 대한 결과이다 (사건 차단, IB). B-D: 옥타머 프라가세아톡신 C (T1, B), 헵타머 프라가세아톡신 C (T2, C) 및 프라가세아톡신 C 돌연변이 G13F (D)의 대표적인 기록. 기록의 원시 전류 데이터는 엣지를 검출하는 사건 검출 알고리즘을 적용한 추세선과 오버레이된다. 기록 위에 표시한 블록은 사건들 길이와 함께 정렬되어 펄스 지속 시간을 나타낸다. 10 kHz 베셀 필터와 5 kHz 가우스 필터를 사용하여, 50 kHz의 샘플링 주파수에서 비스-트리스 프로판으로 pH 3.8로 적정한 1 M KCl 및 50 mM 시트르산 중에서 기록을 수집하였다.
도 4. 트립신 소화된 라이소자임과 (돌연변이) 프라가세아톡신 C의 사건수와 신호 상관관계. A-D: 라이소자임의 트립신 소화로부터 배제된 전류 (Iex%) 스펙트럼을 관찰했다. A: 옥타머 야생형 프라가세아톡신 C (T1), B: 헵타머 야생형 프라가세아톡신 C (T2), C: 프라가시아톡신 C 돌연변이 G13F 및 D: 프라가세아톡신 C 돌연변이 G13N. 10 kHz 베셀 필터와 5 kHz 가우스 필터를 사용하여, 50 kHz의 샘플링 주파수에서 비스-트리스 프로판으로 약 pH 3.8로 적정한 1 M KCl 및 50 mM 시트르산 중세서 -50 mV에서 기록을 수집하였다. E: 동일한 단위의 트립신 소화된 라이소자임과 조합된 (돌연변이) 프라가세아톡신 C의 잔류 전류 스펙트럼에 대한 제곱된 1차 도함수 유클리드 코사인 상관 관계. 다수의 돌연변이들을 둘러싼 검은색 박스들은 유사한 신호를 나타낸다. 10 kHz 베셀 필터와 5 kHz 가우스 필터를 사용하여, 50 kHz의 샘플링 주파수에서 비스-트리스 프로판으로 pH 3.8로 적정한 1 M KCl 및 50 mM 시트르산 중에서 기록을 수집하였다. 외부 전압 (external bias)은 +50 mV에서 시험한 D10R#과 G13H#를 제외하고는 -50 mV였다.
도 5. (돌연변이체) 프라가세아톡신 C의 펩타이드 인식. A: (A) 프라가세아톡신 C의 내강에서의 돌연변이 위치 (PDB:4TSY 상에 모델링됨)는 화살표로 표시된다. B: 가우스는 -50 mV의 인가 전위에서 기록된 안지오텐신 IV [1], 안지오텐신 III [2], 안지오텐신 I [3] 및 안지오텐시노겐 [4]의 포획과 검출을 위해 클러스터링된 사건 차단에서 제외된 전류의 히스토그램에 적합하다. C: 다양한 기공 유형들에 의해 검출된 단일 분자 펩타이드 사건 차단에 대한 배제된 전류% (IEX%)와 체류 시간 산점도. 10 kHz 베셀 필터와 5 kHz 가우스 필터를 사용하여, 50 kHz의 샘플링 주파수에서 비스-트리스 프로판으로 pH 3.8로 적정한 1 M KCl 및 50 mM 시트르산 중에서 기록을 수집하였다.
도 6. (돌연변이) 프라가세아톡신 C의 펩타이드 인식. 헵타머 및 헥사머 프라가세아톡신 C를 비롯한, 추가의 기공 유형에서의 펩타이드 인식. (상단 패널) 잔류 전류의 피팅을 류신-엔케팔린 (YGGFL) [Leu-enk], 안지오텐신 II (4-8) (YIHPF) [AngII] 및 켐프타이드 (LRRASLG)[켐프타이드] 각 10 μM 농도에 대해 나타내었고, -70 mV의 인가 전위 하에 기록하였다. (하단 패널) 다양한 기공 유형들의 경우의 단일 분자 펩타이드 사건 차단에 대한 배제된 전류% (IEX%)와 체류 시간 산점도. 10 kHz 베셀 필터와 5 kHz 가우스 필터를 사용하여, 50 kHz의 샘플링 주파수에서 비스-트리스 프로판으로 pH 3.8로 적정한 1 M KCl 및 50 mM 시트르산 중에서 기록을 수집하였다. 해당 도면은 방향족 나노기공이 야생형 프라가세아톡신 C보다 다양한 펩타이드들을 더 잘 식별하여 구별할 수 있음을 보여주고 있다.
도 7. 나노기공을 포함하는 분석 시스템의 전기생리학 구성. 본 개략도는 분석물의 전기적 검출을 위한 나노기공 센서와 함께 사용할 수 있는 시스템 유형의 한 예를 나타낸 것이다. 다른 유형의 시스템, 예컨대 마이크로칩 상의 나노기공 센서의 어레이도 적합하다. 본 개략도는 100 ㎛의 구멍이 포함된 테플론 필름으로 분리된, Delrin으로 만들어진 2개의 구획으로 이루어진 챔버를 보여주고 있다. 두 구획 모두 완충제로 채워졌고 전기적 감지를 용이하게 하기 위해 전극 (예컨대, Ag/AgCl 전극)을 각 챔버에 연결시켰다. 랭뮤어-블로젯 (Langmuir-Blodgett) 방법을 사용하여 테플론 필름 내부의 구멍에 지질막을 형성하여 상기 두 구획을 분리하였다. 나노기공은 일반적으로 시스 챔버에서 첨가되어 막에 삽입되도록 한다. 분석물은 일반적으로 검출을 위해 시스 챔버에 첨가된다.
도 8. 상향식 나노기공 기반 프로테오믹스의 개념. A: 단백질을 펩타이드 단편의 혼합물로 분해하기 위한 프로테아제 단백질 소화를 그림으로 재현한 것. B: 생성된 펩타이드 단편 혼합물의 펩타이드 단편이 막에 전기장을 인가함으로써 FraC 나노기공을 통해 포획되어 전위되는 실험적 구성을 그림으로 재현한 것. C: 나노기공 기반 전기생리학 실험에서 검출된 펩타이드들에 대한 이온 전류 결과 데이터를 그림으로 재현한 것. D: 개별 단일 분자 사건 차단 분석을 통해 얻은, 생성된 잔류 전류와 표준 편차 스펙트럼을 그림으로 재현한 것으로, 다양한 펩타이드 모집단에 대한 고유한 클러스터를 나타내고 있다.
도 9. 펩타이드를 사용한 배제된 전류 - 질량 보정 및 트립신의 라이소자임 펩타이드로부터 얻은 스펙트럼. 완전한 트립신 소화로부터 생성될 것으로 예측되는 합성 모델 펩타이드인 닭 (Gallus-gallus) 라이소자임을 사용한 G13F-FraC-T1 나노기공의 특성 분석. A: G13F-FraC-T1 나노기공 시스템에 첨가할 때 각 펩타이드에 대해 측정된 배제된 평균 전류(%)에 대해 플롯팅된 합성 모델 펩타이드 (원으로 표시)의 질량 (각 모델 펩타이드에 대한 별도의 기공들에 대해 n>3의 다수의 개별 실험에서 얻음). 점선은 데이터에 피팅된 로지스틱 함수를 나타내며, 배제된 전류와 분자량 간의 명확한 상관관계를 보여주는데, 이는 포획된 펩타이드를 특성분석하고 미지의 펩타이드들을 시험할 때 예측 목적으로 사용할 수 있다. B: G13F-FraC-T1 기공에 모든 모델 펩타이드들의 혼합물을 첨가하여기록된 배제된 전류 스펙트럼 (사건 차단으로부터 배제된 전류에 대한 히스토그램). 피크들은 파트 A의 실험에서 결정된 예측에 따라 표지하였고, 별도의 실험에서 관찰된 동일한 위치와 매칭하였다.
도 10. 전기분무 이온화 질량 분광법과 비교한 나노기공 실험. A: G13F-FraC-T1과 닭 (Gallus-gallus) 라이소자임의 트립신 소화를 사용하여 나노기공 전기생리학으로 얻은 잔류 전류 스펙트럼. B: 질량 분광법은 A와 동일한 트립신 소화로부터 결과를 내도록 했지만, 질량 분광계 (ESI-MS)로 측정함. 생성된 펩타이드 질량들은 0.5 Iex%의 표준 편차로 도 9A에 도시된 로지스틱 함수 예측을 사용하여 잔류 전류에 맵핑하였다.
도 11. 나노기공 단백질 스펙트럼의 재현성. 각 행들은 BSA (a), DHFR (b) 및 EFP (c) 단백질의 단백질분해성 소화 감지에 대한 3개의 독립적인 반복을 나타낸다. 각 반복은, 해당 반복에서 동일한 소화 샘플을 사용하여, 새로운 나노기공을 사용한 별도의 나노기공 실험으로부터 얻었다. 왼쪽 패널은 100%의 정규화된 영역을 갖는 배제된 전류 히스토그램을 나타낸 것으로, 이는 각 오른쪽 패널에 나타낸 모든 사건 차단에서 배제된 전류와 체류 시간 분산으로부터 얻은 것이다. 모든 측정은 -70 mV의 인가 전위 하에 비스-트리스-프로판으로 적정된 50 mM 시트르산을 사용하여 pH 3.8로 완충된 1M KCl 중에서 G13F-FraC-T1 나노기공을 사용하여 수행되었다. 기록은 10 kHz에서 아날로그 베셀 필터와 5 kHz에서 디지털 가우스 필터를 사용하여 50 kHz에서 수행하였다.
도 12. 제곱된 1차 차이 상관 계수를 사용한 스펙트럼 매칭. a. 9개의 트립신 소화 단백질들의 펩타이드 단편 혼합물 측정에 대한 대표적인 기준선 보정된 잔류 전류 스펙트럼의 예로서, 각 단백질 유형에 대해 독특한 스펙트럼이 관찰된다는 것을 보여주고 있다. 오른쪽 패널은 100%의 정규화된 영역을 갖는 배제된 전류 히스토그램을 나타낸 것으로, 이는 각 왼쪽 패널에 나타낸 모든 사건 차단에서 배제된 전류와 체류 시간 분산으로부터 얻은 것이다. b. 유클리드 코사인 교차-상관관계를 사용한 기준선 보정된 잔류 전류 스펙트럼의 리브-원-아웃 (Leave-one-out) 스펙트럼 매칭.
도 13. 인산화된 단백질의 검출. 2.5 μM의 켐프타이드 (LRRASLG) 및 2.5 μM의 인산화된 켐프타이드 (LRRA{pS}LG)를 FraC_G13F 나노기공을 포함하는 시스템의 시스-챔버에 첨가하였다. 비스-트리스 프로판으로 pH 3.8로 완충된 1M KCl, 50 mM 시트르산에서 측정하였다.기록은 10 kHz 저주파통과 필터를 사용하여 50 kHz 주파수에서 -70 mV의 인가 전위 하에 수행하였다. 본 그래프는 잔류 전류 (Ires = 차단 전류/개방-기공 전류)와 체류 시간을 플롯팅한 것으로, 펩타이드들이 2개의 서로 다른 클러스터로 검출될 수 있음을 보여주고 있다.
도 14. 글리코펩타이드의 검출. 2.5 μM의 변형되지 않은 펩타이드 (ANVTLNTAG), 1개의 글리칸을 함유하는 2.5 μM의 펩타이드 (ANVT(Glc)LNTAG) 및 2개의 글리칸을 함유하는 2.5 μM의 펩타이드 (ANVT(Glc)LNTT(Glc)G)를 FraC_G13F-T1 나노기공 (비스-트리스 프로판을 사용하여 pH 3.8로 완충된 3M LiCl, 50 mM 시트르산, 10 kHz 저주파통과 필터를 사용하여 50 kHz 주파수에서 -50 mV)을 포함하는 시스템의 시스-챔버에 순차적으로 첨가했다. 본 도면은 글리코실화된 3가지 펩타이드를 모두 포함하는 혼합물을 측정할 때 감지된 모든 포획 사건들의 잔류 전류 차단 히스토그램을 나타낸 것이다.
도 15. 람노실화된 단백질의 검출. 25 ㎍의 변형되지 않은 신장 인자 P (EF-P, A)와 75 ㎍의 람노실화된 EF-P (B)를 Lys-C를 사용하여 펩타이드 단편으로 분해하였다. 분해 후, 별도의 실험에서, 소화된 단백질 8 ㎍을 펩타이드 분석을 위한 FraC_G13F-T1 나노기공 (pH 3.8의 3M LiCl, 50 mM 시트르산, 10 kHz 저주파통과 필터를 사용하여 50 kHz 주파수에서 -50 mV)을 포함하는 나노기공 감지 시스템의 시스-챔버에 첨가하였다. 람노실화 변형은 SGRNAAVVK 펩타이드 단편 상에 하였다. 람노실화 변형은 변형된 펩타이드 [SGR{rham}NAAVVK]와 변형되지 않은 펩타이드 [SGRNAAVVK] 사이의 잔류 전류 (Ires)에서의 큰 변화로 명확하게 구별된다.
도 16. 단일 아미노산 변화 간의 구별. (패널 a) G13F-FraC-T1 기공의 시스-챔버에 첨가된 서열: YGGFL 및 YdAGFdL (여기서, d는 D-아미노산을 나타내며; 다른 모든 아미노산들은 L-배열임)을 갖는 2가지 형태의 엔케팔린의 검출. 측정은 50 kHz의 샘플링 주파수로 -100 mV의 인가 전위에서 비스-트리스-프로판 (pH 3.8)으로 적정된 1 M KCl, 50 mM 시트르산 중에서 수행하였으며, G13F-FraC-T1 기공을 사용하여 10 kHz로 필터링하였다. 본 도면은 기록된 사건 차단에 있어서 차단에서의 노이즈의 표준 편차와 차단의 진폭을 플롯팅한 것으로, 적어도 4 Da의 차이는 2개의 명확한 클러스터로 구별될 수 있음을 도시하고 있다. (패널 b와 c) D-아미노산의 존재로 인한 나노기공 신호에서의 차이. 10 μM의 [Ala2]-Leu 엔케팔린과 10 μM의 DADLE ([D-Ala2, D-Leu5]-엔케팔린)의 혼합물을 시스 구획 (FraC-G13F; 패널 b) 또는 트랜스 구획 (CytK-K128F; 패널 c)으로 첨가하였다. 측정은 pH 3.8로 완충된 3M LiCl, 50 mM 시트르산에서 수행되었다. 50 kHz 샘플링 주파수와 10 kHz 필터로 데이터를 기록하였다.
도 17. 에어로라이신 나노기공에서 트립신화된 라이소자임의 검출. 나노기공 감지 시스템 (+150 mV)의 시스-챔버에 첨가된 4 ㎍의 트립신화된 라이소자임을 함유하는 (돌연변이) 에어로라이신 나노기공의 대표적인 전기 이온 전류 기록. 본 전류 기록은 pH 7.5의 WT-Aer (A), pH 3.8의 WT-Aer (B), pH 3.8의 Aer-K238F (C) 및 pH 3.0의 Aer-K238D-S264F (D)를 포함하는, 선택된 기공에 있어서 대표적인 섹션들의 이온 전류 데이터를 보여주고 있다. 개방형 기공 전류 (IO) 및 펩타이드 포획으로 인한 대표적인 단계형 전류 차단 (IB)을 표시하였다. 나타낸 바와 같이, 시스 및 트랜스에서 1M KCl, 비스-트리스 프로판을 사용하여 약 pH 3.8 또는 pH 3.0으로 완충된 50 mM 시트르산, 또는 pH 7.5로 완충된 50 mM 트리스를 사용하여 기록을 얻었다.
도 18. 에어로라이신 나노기공에서 트립신화된 라이소자임의 검출. pH 7.5의 WT-에어로라이신 (A), pH 3.8의 WT-에어로라이신 (B), pH 3.8의 K238F 에어로라이신 (C), pH 3.0의 K238D 에어로라이신 (D), pH 3.0의 K238D-A260F 에어로라이신 (E), pH 3.0의 K238D-S264F 에어로라이신 (F), pH 3.0의 K238D-Q268F 에어로라이신 (G), pH 3.0의 K238D-S272F 에어로라이신 (H) 중 어느 하나를 포함하는, 나노기공 감지 시스템에 있어서, 해당 에어로라이신 나노기공의 변형의 위치와 이들 사이의 간격을 표시한 에어로라이신 나노기공의 구조와 개략도, 및 해당 시스템의 시스-챔버에 첨가된 4 ㎍의 트립신화된 라이소자임에 의해 유발된 개별 펩타이드 차단의 잔류 전류와 체류 시간 분산을 나타냄. 나타낸 바와 같이, 측정은 1M KCl 시스 및 트랜스에서, 낮은 pH 실험의 경우에는 비스-트리스 프로판을 사용하여 약 pH 3.8 또는 pH 3.0으로 완충된 50 mM 시트르산, 또는 pH 7.5로 완충된 50 mM 트리스를 사용하여 수행하였다. 기록은 10 kHz 저주파통과 필터를 사용하여 50 kHz 주파수에서 +150 mV의 인가 전위 하에 수행하였다. 본 도면은, 특히 기공의 음전하를 증가시키는 변형과 조합된 방향족 돌연변이가, 특히 4 미만의 pH 값에서 펩타이드 인식을 향상시킴을 보여주고 있다. (I) Aer-K238W를 포함하는 나노기공 시스템의 시스 구획에 첨가된 트립신화된 라이소자임 4 ㎍ (최종 농도 10 ng/μl)에 대한 측정. +150 mV 인가 전위에서 pH 3.8로 완충된 1M KCl, 50 mM 시트르산에서 측정하였다. 50 kHz 샘플링 주파수와 10 kHz 필터로 데이터를 기록하였다.
도 19. 사이토라이신 K (CytK) 나노기공에서 트립신화된 라이소자임의 검출. 나노기공 감지 시스템 (+100 mV)의 트랜스-챔버에 첨가된 4 ㎍의 트립신화된 라이소자임을 함유하는 (돌연변이) 사이토라이신 나노기공의 대표적인 전기 이온 전류 기록. 본 전류 기록은 pH 3.8의 WT-CytK (A), pH 3.8의 CytK-K128F (B) 또는 pH 3.8의 CytK-S126F-K128D (C) 중 어느 하나를 포함하는, 선택된 기공에 있어서 대표적인 섹션들의 이온 전류 데이터를 보여주고 있다. 개방형 기공 전류 (IO) 및 펩타이드 포획으로 인한 대표적인 단계형 전류 차단 (IB)을 표시하였다. 챔버 내 1M KCl과 pH 3.8로 완충된 50 mM 시트르산을 사용하여 기록을 얻었다.
도 20. 사이토라이신 K (CytK) 나노기공에서 트립신화된 라이소자임의 검출. A: 황색포도상구균 유래의 알파-용혈소 나노기공 구조에 맵핑된 CytK의 상동성 모델 (왼쪽), 및 나노기공의 베타-배럴 내강에 대해 안쪽으로의 수-대면 아미노산을 보여주는 예측된 베타-가닥 (오른쪽). B-G: (B) pH 3.8의 야생형 (WT-CytK), (C) pH 3.8의 K128F CytK 나노기공, (D) pH 3.8의 S126F-K128D CytK 나노기공, (E) pH 3.0의 S120F - K128D CytK 나노기공 (F) pH 3.0의 Q 122F - K128D CytK 나노기공, (G) pH 3.0의 G124F - K128D CytK 나노기공 중 어느 하나를 포함하는 시스템의 트랜스-챔버에 첨가된 4 ㎍의 트립신화된 라이소자임에 의해 유발된 개별 펩타이드 차단의 잔류 전류와 체류 시간 분산. (H) K128W CytK 나노기공을 포함하는 시스템의 트랜스 구획에 첨가된 2개의 펩타이드(10 μM의 Lys4 및 10 μM의 Lys7)에 대한 측정. +100 mV 인가 전위에서 pH 3.8로 완충된 1M KCl, 50 mM 트리스에서 측정하였다. 50 kHz 샘플링 주파수와 10 kHz 필터로 데이터를 기록하였다.
각 패널의 왼쪽에는 치환된 아미노산의 개략적 위치를 나타내었다. 기록은 10 kHz 저주파통과 필터를 사용하여 50 kHz 주파수에서 +100 mV의 인가 전위 하에 수행하였다. 본 도면은, 특히 기공의 음전하를 증가시키는 변형과 조합된 방향족 돌연변이가, 특히 4 미만의 pH 값에서 펩타이드 인식을 허용함을 보여주고 있다.
도 21. 리세닌 나노기공에서 Lys-C 소화된 라이소자임의 검출. (A) 야생형 (WT-Lys) 또는 (B) 돌연변이 Lys-E76F 나노기공을 포함하는 시스템의 트랜스 구획에 첨가된 0.5 ㎍의 Lys-C 소화된 라이소자임 (최종 농도 1.25 ng/μl)의 측정. -70 mV 인가 전위에서 pH 3.8로 완충된 1M KCl, 50 mM 시트르산에서 측정을 수행하였다. 50 kHz 샘플링 주파수와 10 kHz 필터로 데이터를 기록하였다.
도 22. 비단백질성 저분자의 검출. 분석물을 헵타머 (A) 야생형 FraC 또는 (B, C) 돌연변이 FraC_G13F 나노기공 (티오플라빈); 또는 옥타머 (D) 야생형 FraC 또는 (E, F) 돌연변이 FraC_G13F 나노기공 (비타민 B12)을 포함하는 시스템의 시스-챔버 (티오플라빈 2.0 μM) 또는 시스 및 트랜스 챔버 (비타민 B12, 10.0 μM)에 첨가했다. 1M KCl, 50 mM 트리스.HCl pH 7.5에서 측정하였다.기록은 10 kHz 저주파통과 필터를 사용하여 50 kHz 주파수에서 -70 mV (비타민 B12) 또는 -50 mV (티오플라빈)의 인가 전위에서 수행하였다. 본 그래프는 잔류 전류 (Ires = 차단 전류/개방-기공 전류)와 체류 시간을 플롯팅한 것으로, 분자들이 하나의 클러스터로 검출될 수 있음을 보여주고 있다.
도 2. 프라가세아톡신 C 동족체 간의 정렬. 프라가세아톡신 C의 D10 및 G13에 해당하는 상동체에서의 위치들을 강조해서 표시하였다.
도 3. 트립신으로 소화된 라이소자임이 포함된 (돌연변이) 프라가세아톡신 C의 전기생리학 기록. A: -50 mV의 인가 전위 하에서 시스 측에 첨가된 동일한 단위의 트립신 소화된 라이소자임과 조합된 (돌연변이) 프라가세아톡신 C의 예시적인 전기 이온 전류 기록. 전류의 기록은 다양한 기공들에 있어서 대표적인 섹션들의 이온 전류 데이터를 보여주고 있다. 가장 낮은 전류 수준은 기공의 개방형 기공 전류 (IO)이고, 계단형 상향 사건들은 나노기공을 통해 흐르는 이온 전류의 일부를 차폐하는 포획된 분석물에 대한 결과이다 (사건 차단, IB). B-D: 옥타머 프라가세아톡신 C (T1, B), 헵타머 프라가세아톡신 C (T2, C) 및 프라가세아톡신 C 돌연변이 G13F (D)의 대표적인 기록. 기록의 원시 전류 데이터는 엣지를 검출하는 사건 검출 알고리즘을 적용한 추세선과 오버레이된다. 기록 위에 표시한 블록은 사건들 길이와 함께 정렬되어 펄스 지속 시간을 나타낸다. 10 kHz 베셀 필터와 5 kHz 가우스 필터를 사용하여, 50 kHz의 샘플링 주파수에서 비스-트리스 프로판으로 pH 3.8로 적정한 1 M KCl 및 50 mM 시트르산 중에서 기록을 수집하였다.
도 4. 트립신 소화된 라이소자임과 (돌연변이) 프라가세아톡신 C의 사건수와 신호 상관관계. A-D: 라이소자임의 트립신 소화로부터 배제된 전류 (Iex%) 스펙트럼을 관찰했다. A: 옥타머 야생형 프라가세아톡신 C (T1), B: 헵타머 야생형 프라가세아톡신 C (T2), C: 프라가시아톡신 C 돌연변이 G13F 및 D: 프라가세아톡신 C 돌연변이 G13N. 10 kHz 베셀 필터와 5 kHz 가우스 필터를 사용하여, 50 kHz의 샘플링 주파수에서 비스-트리스 프로판으로 약 pH 3.8로 적정한 1 M KCl 및 50 mM 시트르산 중세서 -50 mV에서 기록을 수집하였다. E: 동일한 단위의 트립신 소화된 라이소자임과 조합된 (돌연변이) 프라가세아톡신 C의 잔류 전류 스펙트럼에 대한 제곱된 1차 도함수 유클리드 코사인 상관 관계. 다수의 돌연변이들을 둘러싼 검은색 박스들은 유사한 신호를 나타낸다. 10 kHz 베셀 필터와 5 kHz 가우스 필터를 사용하여, 50 kHz의 샘플링 주파수에서 비스-트리스 프로판으로 pH 3.8로 적정한 1 M KCl 및 50 mM 시트르산 중에서 기록을 수집하였다. 외부 전압 (external bias)은 +50 mV에서 시험한 D10R#과 G13H#를 제외하고는 -50 mV였다.
도 5. (돌연변이체) 프라가세아톡신 C의 펩타이드 인식. A: (A) 프라가세아톡신 C의 내강에서의 돌연변이 위치 (PDB:4TSY 상에 모델링됨)는 화살표로 표시된다. B: 가우스는 -50 mV의 인가 전위에서 기록된 안지오텐신 IV [1], 안지오텐신 III [2], 안지오텐신 I [3] 및 안지오텐시노겐 [4]의 포획과 검출을 위해 클러스터링된 사건 차단에서 제외된 전류의 히스토그램에 적합하다. C: 다양한 기공 유형들에 의해 검출된 단일 분자 펩타이드 사건 차단에 대한 배제된 전류% (IEX%)와 체류 시간 산점도. 10 kHz 베셀 필터와 5 kHz 가우스 필터를 사용하여, 50 kHz의 샘플링 주파수에서 비스-트리스 프로판으로 pH 3.8로 적정한 1 M KCl 및 50 mM 시트르산 중에서 기록을 수집하였다.
도 6. (돌연변이) 프라가세아톡신 C의 펩타이드 인식. 헵타머 및 헥사머 프라가세아톡신 C를 비롯한, 추가의 기공 유형에서의 펩타이드 인식. (상단 패널) 잔류 전류의 피팅을 류신-엔케팔린 (YGGFL) [Leu-enk], 안지오텐신 II (4-8) (YIHPF) [AngII] 및 켐프타이드 (LRRASLG)[켐프타이드] 각 10 μM 농도에 대해 나타내었고, -70 mV의 인가 전위 하에 기록하였다. (하단 패널) 다양한 기공 유형들의 경우의 단일 분자 펩타이드 사건 차단에 대한 배제된 전류% (IEX%)와 체류 시간 산점도. 10 kHz 베셀 필터와 5 kHz 가우스 필터를 사용하여, 50 kHz의 샘플링 주파수에서 비스-트리스 프로판으로 pH 3.8로 적정한 1 M KCl 및 50 mM 시트르산 중에서 기록을 수집하였다. 해당 도면은 방향족 나노기공이 야생형 프라가세아톡신 C보다 다양한 펩타이드들을 더 잘 식별하여 구별할 수 있음을 보여주고 있다.
도 7. 나노기공을 포함하는 분석 시스템의 전기생리학 구성. 본 개략도는 분석물의 전기적 검출을 위한 나노기공 센서와 함께 사용할 수 있는 시스템 유형의 한 예를 나타낸 것이다. 다른 유형의 시스템, 예컨대 마이크로칩 상의 나노기공 센서의 어레이도 적합하다. 본 개략도는 100 ㎛의 구멍이 포함된 테플론 필름으로 분리된, Delrin으로 만들어진 2개의 구획으로 이루어진 챔버를 보여주고 있다. 두 구획 모두 완충제로 채워졌고 전기적 감지를 용이하게 하기 위해 전극 (예컨대, Ag/AgCl 전극)을 각 챔버에 연결시켰다. 랭뮤어-블로젯 (Langmuir-Blodgett) 방법을 사용하여 테플론 필름 내부의 구멍에 지질막을 형성하여 상기 두 구획을 분리하였다. 나노기공은 일반적으로 시스 챔버에서 첨가되어 막에 삽입되도록 한다. 분석물은 일반적으로 검출을 위해 시스 챔버에 첨가된다.
도 8. 상향식 나노기공 기반 프로테오믹스의 개념. A: 단백질을 펩타이드 단편의 혼합물로 분해하기 위한 프로테아제 단백질 소화를 그림으로 재현한 것. B: 생성된 펩타이드 단편 혼합물의 펩타이드 단편이 막에 전기장을 인가함으로써 FraC 나노기공을 통해 포획되어 전위되는 실험적 구성을 그림으로 재현한 것. C: 나노기공 기반 전기생리학 실험에서 검출된 펩타이드들에 대한 이온 전류 결과 데이터를 그림으로 재현한 것. D: 개별 단일 분자 사건 차단 분석을 통해 얻은, 생성된 잔류 전류와 표준 편차 스펙트럼을 그림으로 재현한 것으로, 다양한 펩타이드 모집단에 대한 고유한 클러스터를 나타내고 있다.
도 9. 펩타이드를 사용한 배제된 전류 - 질량 보정 및 트립신의 라이소자임 펩타이드로부터 얻은 스펙트럼. 완전한 트립신 소화로부터 생성될 것으로 예측되는 합성 모델 펩타이드인 닭 (Gallus-gallus) 라이소자임을 사용한 G13F-FraC-T1 나노기공의 특성 분석. A: G13F-FraC-T1 나노기공 시스템에 첨가할 때 각 펩타이드에 대해 측정된 배제된 평균 전류(%)에 대해 플롯팅된 합성 모델 펩타이드 (원으로 표시)의 질량 (각 모델 펩타이드에 대한 별도의 기공들에 대해 n>3의 다수의 개별 실험에서 얻음). 점선은 데이터에 피팅된 로지스틱 함수를 나타내며, 배제된 전류와 분자량 간의 명확한 상관관계를 보여주는데, 이는 포획된 펩타이드를 특성분석하고 미지의 펩타이드들을 시험할 때 예측 목적으로 사용할 수 있다. B: G13F-FraC-T1 기공에 모든 모델 펩타이드들의 혼합물을 첨가하여기록된 배제된 전류 스펙트럼 (사건 차단으로부터 배제된 전류에 대한 히스토그램). 피크들은 파트 A의 실험에서 결정된 예측에 따라 표지하였고, 별도의 실험에서 관찰된 동일한 위치와 매칭하였다.
도 10. 전기분무 이온화 질량 분광법과 비교한 나노기공 실험. A: G13F-FraC-T1과 닭 (Gallus-gallus) 라이소자임의 트립신 소화를 사용하여 나노기공 전기생리학으로 얻은 잔류 전류 스펙트럼. B: 질량 분광법은 A와 동일한 트립신 소화로부터 결과를 내도록 했지만, 질량 분광계 (ESI-MS)로 측정함. 생성된 펩타이드 질량들은 0.5 Iex%의 표준 편차로 도 9A에 도시된 로지스틱 함수 예측을 사용하여 잔류 전류에 맵핑하였다.
도 11. 나노기공 단백질 스펙트럼의 재현성. 각 행들은 BSA (a), DHFR (b) 및 EFP (c) 단백질의 단백질분해성 소화 감지에 대한 3개의 독립적인 반복을 나타낸다. 각 반복은, 해당 반복에서 동일한 소화 샘플을 사용하여, 새로운 나노기공을 사용한 별도의 나노기공 실험으로부터 얻었다. 왼쪽 패널은 100%의 정규화된 영역을 갖는 배제된 전류 히스토그램을 나타낸 것으로, 이는 각 오른쪽 패널에 나타낸 모든 사건 차단에서 배제된 전류와 체류 시간 분산으로부터 얻은 것이다. 모든 측정은 -70 mV의 인가 전위 하에 비스-트리스-프로판으로 적정된 50 mM 시트르산을 사용하여 pH 3.8로 완충된 1M KCl 중에서 G13F-FraC-T1 나노기공을 사용하여 수행되었다. 기록은 10 kHz에서 아날로그 베셀 필터와 5 kHz에서 디지털 가우스 필터를 사용하여 50 kHz에서 수행하였다.
도 12. 제곱된 1차 차이 상관 계수를 사용한 스펙트럼 매칭. a. 9개의 트립신 소화 단백질들의 펩타이드 단편 혼합물 측정에 대한 대표적인 기준선 보정된 잔류 전류 스펙트럼의 예로서, 각 단백질 유형에 대해 독특한 스펙트럼이 관찰된다는 것을 보여주고 있다. 오른쪽 패널은 100%의 정규화된 영역을 갖는 배제된 전류 히스토그램을 나타낸 것으로, 이는 각 왼쪽 패널에 나타낸 모든 사건 차단에서 배제된 전류와 체류 시간 분산으로부터 얻은 것이다. b. 유클리드 코사인 교차-상관관계를 사용한 기준선 보정된 잔류 전류 스펙트럼의 리브-원-아웃 (Leave-one-out) 스펙트럼 매칭.
도 13. 인산화된 단백질의 검출. 2.5 μM의 켐프타이드 (LRRASLG) 및 2.5 μM의 인산화된 켐프타이드 (LRRA{pS}LG)를 FraC_G13F 나노기공을 포함하는 시스템의 시스-챔버에 첨가하였다. 비스-트리스 프로판으로 pH 3.8로 완충된 1M KCl, 50 mM 시트르산에서 측정하였다.기록은 10 kHz 저주파통과 필터를 사용하여 50 kHz 주파수에서 -70 mV의 인가 전위 하에 수행하였다. 본 그래프는 잔류 전류 (Ires = 차단 전류/개방-기공 전류)와 체류 시간을 플롯팅한 것으로, 펩타이드들이 2개의 서로 다른 클러스터로 검출될 수 있음을 보여주고 있다.
도 14. 글리코펩타이드의 검출. 2.5 μM의 변형되지 않은 펩타이드 (ANVTLNTAG), 1개의 글리칸을 함유하는 2.5 μM의 펩타이드 (ANVT(Glc)LNTAG) 및 2개의 글리칸을 함유하는 2.5 μM의 펩타이드 (ANVT(Glc)LNTT(Glc)G)를 FraC_G13F-T1 나노기공 (비스-트리스 프로판을 사용하여 pH 3.8로 완충된 3M LiCl, 50 mM 시트르산, 10 kHz 저주파통과 필터를 사용하여 50 kHz 주파수에서 -50 mV)을 포함하는 시스템의 시스-챔버에 순차적으로 첨가했다. 본 도면은 글리코실화된 3가지 펩타이드를 모두 포함하는 혼합물을 측정할 때 감지된 모든 포획 사건들의 잔류 전류 차단 히스토그램을 나타낸 것이다.
도 15. 람노실화된 단백질의 검출. 25 ㎍의 변형되지 않은 신장 인자 P (EF-P, A)와 75 ㎍의 람노실화된 EF-P (B)를 Lys-C를 사용하여 펩타이드 단편으로 분해하였다. 분해 후, 별도의 실험에서, 소화된 단백질 8 ㎍을 펩타이드 분석을 위한 FraC_G13F-T1 나노기공 (pH 3.8의 3M LiCl, 50 mM 시트르산, 10 kHz 저주파통과 필터를 사용하여 50 kHz 주파수에서 -50 mV)을 포함하는 나노기공 감지 시스템의 시스-챔버에 첨가하였다. 람노실화 변형은 SGRNAAVVK 펩타이드 단편 상에 하였다. 람노실화 변형은 변형된 펩타이드 [SGR{rham}NAAVVK]와 변형되지 않은 펩타이드 [SGRNAAVVK] 사이의 잔류 전류 (Ires)에서의 큰 변화로 명확하게 구별된다.
도 16. 단일 아미노산 변화 간의 구별. (패널 a) G13F-FraC-T1 기공의 시스-챔버에 첨가된 서열: YGGFL 및 YdAGFdL (여기서, d는 D-아미노산을 나타내며; 다른 모든 아미노산들은 L-배열임)을 갖는 2가지 형태의 엔케팔린의 검출. 측정은 50 kHz의 샘플링 주파수로 -100 mV의 인가 전위에서 비스-트리스-프로판 (pH 3.8)으로 적정된 1 M KCl, 50 mM 시트르산 중에서 수행하였으며, G13F-FraC-T1 기공을 사용하여 10 kHz로 필터링하였다. 본 도면은 기록된 사건 차단에 있어서 차단에서의 노이즈의 표준 편차와 차단의 진폭을 플롯팅한 것으로, 적어도 4 Da의 차이는 2개의 명확한 클러스터로 구별될 수 있음을 도시하고 있다. (패널 b와 c) D-아미노산의 존재로 인한 나노기공 신호에서의 차이. 10 μM의 [Ala2]-Leu 엔케팔린과 10 μM의 DADLE ([D-Ala2, D-Leu5]-엔케팔린)의 혼합물을 시스 구획 (FraC-G13F; 패널 b) 또는 트랜스 구획 (CytK-K128F; 패널 c)으로 첨가하였다. 측정은 pH 3.8로 완충된 3M LiCl, 50 mM 시트르산에서 수행되었다. 50 kHz 샘플링 주파수와 10 kHz 필터로 데이터를 기록하였다.
도 17. 에어로라이신 나노기공에서 트립신화된 라이소자임의 검출. 나노기공 감지 시스템 (+150 mV)의 시스-챔버에 첨가된 4 ㎍의 트립신화된 라이소자임을 함유하는 (돌연변이) 에어로라이신 나노기공의 대표적인 전기 이온 전류 기록. 본 전류 기록은 pH 7.5의 WT-Aer (A), pH 3.8의 WT-Aer (B), pH 3.8의 Aer-K238F (C) 및 pH 3.0의 Aer-K238D-S264F (D)를 포함하는, 선택된 기공에 있어서 대표적인 섹션들의 이온 전류 데이터를 보여주고 있다. 개방형 기공 전류 (IO) 및 펩타이드 포획으로 인한 대표적인 단계형 전류 차단 (IB)을 표시하였다. 나타낸 바와 같이, 시스 및 트랜스에서 1M KCl, 비스-트리스 프로판을 사용하여 약 pH 3.8 또는 pH 3.0으로 완충된 50 mM 시트르산, 또는 pH 7.5로 완충된 50 mM 트리스를 사용하여 기록을 얻었다.
도 18. 에어로라이신 나노기공에서 트립신화된 라이소자임의 검출. pH 7.5의 WT-에어로라이신 (A), pH 3.8의 WT-에어로라이신 (B), pH 3.8의 K238F 에어로라이신 (C), pH 3.0의 K238D 에어로라이신 (D), pH 3.0의 K238D-A260F 에어로라이신 (E), pH 3.0의 K238D-S264F 에어로라이신 (F), pH 3.0의 K238D-Q268F 에어로라이신 (G), pH 3.0의 K238D-S272F 에어로라이신 (H) 중 어느 하나를 포함하는, 나노기공 감지 시스템에 있어서, 해당 에어로라이신 나노기공의 변형의 위치와 이들 사이의 간격을 표시한 에어로라이신 나노기공의 구조와 개략도, 및 해당 시스템의 시스-챔버에 첨가된 4 ㎍의 트립신화된 라이소자임에 의해 유발된 개별 펩타이드 차단의 잔류 전류와 체류 시간 분산을 나타냄. 나타낸 바와 같이, 측정은 1M KCl 시스 및 트랜스에서, 낮은 pH 실험의 경우에는 비스-트리스 프로판을 사용하여 약 pH 3.8 또는 pH 3.0으로 완충된 50 mM 시트르산, 또는 pH 7.5로 완충된 50 mM 트리스를 사용하여 수행하였다. 기록은 10 kHz 저주파통과 필터를 사용하여 50 kHz 주파수에서 +150 mV의 인가 전위 하에 수행하였다. 본 도면은, 특히 기공의 음전하를 증가시키는 변형과 조합된 방향족 돌연변이가, 특히 4 미만의 pH 값에서 펩타이드 인식을 향상시킴을 보여주고 있다. (I) Aer-K238W를 포함하는 나노기공 시스템의 시스 구획에 첨가된 트립신화된 라이소자임 4 ㎍ (최종 농도 10 ng/μl)에 대한 측정. +150 mV 인가 전위에서 pH 3.8로 완충된 1M KCl, 50 mM 시트르산에서 측정하였다. 50 kHz 샘플링 주파수와 10 kHz 필터로 데이터를 기록하였다.
도 19. 사이토라이신 K (CytK) 나노기공에서 트립신화된 라이소자임의 검출. 나노기공 감지 시스템 (+100 mV)의 트랜스-챔버에 첨가된 4 ㎍의 트립신화된 라이소자임을 함유하는 (돌연변이) 사이토라이신 나노기공의 대표적인 전기 이온 전류 기록. 본 전류 기록은 pH 3.8의 WT-CytK (A), pH 3.8의 CytK-K128F (B) 또는 pH 3.8의 CytK-S126F-K128D (C) 중 어느 하나를 포함하는, 선택된 기공에 있어서 대표적인 섹션들의 이온 전류 데이터를 보여주고 있다. 개방형 기공 전류 (IO) 및 펩타이드 포획으로 인한 대표적인 단계형 전류 차단 (IB)을 표시하였다. 챔버 내 1M KCl과 pH 3.8로 완충된 50 mM 시트르산을 사용하여 기록을 얻었다.
도 20. 사이토라이신 K (CytK) 나노기공에서 트립신화된 라이소자임의 검출. A: 황색포도상구균 유래의 알파-용혈소 나노기공 구조에 맵핑된 CytK의 상동성 모델 (왼쪽), 및 나노기공의 베타-배럴 내강에 대해 안쪽으로의 수-대면 아미노산을 보여주는 예측된 베타-가닥 (오른쪽). B-G: (B) pH 3.8의 야생형 (WT-CytK), (C) pH 3.8의 K128F CytK 나노기공, (D) pH 3.8의 S126F-K128D CytK 나노기공, (E) pH 3.0의 S120F - K128D CytK 나노기공 (F) pH 3.0의 Q 122F - K128D CytK 나노기공, (G) pH 3.0의 G124F - K128D CytK 나노기공 중 어느 하나를 포함하는 시스템의 트랜스-챔버에 첨가된 4 ㎍의 트립신화된 라이소자임에 의해 유발된 개별 펩타이드 차단의 잔류 전류와 체류 시간 분산. (H) K128W CytK 나노기공을 포함하는 시스템의 트랜스 구획에 첨가된 2개의 펩타이드(10 μM의 Lys4 및 10 μM의 Lys7)에 대한 측정. +100 mV 인가 전위에서 pH 3.8로 완충된 1M KCl, 50 mM 트리스에서 측정하였다. 50 kHz 샘플링 주파수와 10 kHz 필터로 데이터를 기록하였다.
각 패널의 왼쪽에는 치환된 아미노산의 개략적 위치를 나타내었다. 기록은 10 kHz 저주파통과 필터를 사용하여 50 kHz 주파수에서 +100 mV의 인가 전위 하에 수행하였다. 본 도면은, 특히 기공의 음전하를 증가시키는 변형과 조합된 방향족 돌연변이가, 특히 4 미만의 pH 값에서 펩타이드 인식을 허용함을 보여주고 있다.
도 21. 리세닌 나노기공에서 Lys-C 소화된 라이소자임의 검출. (A) 야생형 (WT-Lys) 또는 (B) 돌연변이 Lys-E76F 나노기공을 포함하는 시스템의 트랜스 구획에 첨가된 0.5 ㎍의 Lys-C 소화된 라이소자임 (최종 농도 1.25 ng/μl)의 측정. -70 mV 인가 전위에서 pH 3.8로 완충된 1M KCl, 50 mM 시트르산에서 측정을 수행하였다. 50 kHz 샘플링 주파수와 10 kHz 필터로 데이터를 기록하였다.
도 22. 비단백질성 저분자의 검출. 분석물을 헵타머 (A) 야생형 FraC 또는 (B, C) 돌연변이 FraC_G13F 나노기공 (티오플라빈); 또는 옥타머 (D) 야생형 FraC 또는 (E, F) 돌연변이 FraC_G13F 나노기공 (비타민 B12)을 포함하는 시스템의 시스-챔버 (티오플라빈 2.0 μM) 또는 시스 및 트랜스 챔버 (비타민 B12, 10.0 μM)에 첨가했다. 1M KCl, 50 mM 트리스.HCl pH 7.5에서 측정하였다.기록은 10 kHz 저주파통과 필터를 사용하여 50 kHz 주파수에서 -70 mV (비타민 B12) 또는 -50 mV (티오플라빈)의 인가 전위에서 수행하였다. 본 그래프는 잔류 전류 (Ires = 차단 전류/개방-기공 전류)와 체류 시간을 플롯팅한 것으로, 분자들이 하나의 클러스터로 검출될 수 있음을 보여주고 있다.
실험 섹션
재료 및 방법
화합물. 스핑고미엘린 (돼지 뇌, ≥99%, CAS# 383907-91-3) 및 디피타노일-sn-글리세로-3-포스포콜린 (DPhPC, ≥99%, CAS# 207131-40-6)은 Avanti Polar Lipids에서 검색하였다. Ni-NTA 수지는 Qiagen으로부터 구입하였다. 라이소자임 (트립신 소화를 위한 알부민 무함유, CAS# 12650-88-3), 글루코스 (≥99%, CAS# 50-99-7), 염화나트륨 (≥99.5%, CAS# 7647-14-5), 염화칼륨 (≥99%, CAS# 7447-40-7), 디티오트레이톨 (DTT, ≥99.0%, 3483-12-3), Trizma® HCl (≥99%, CAS# 1185-53-1), Trizma® 염기 (≥99.9%, CAS# 77-86-1), 이미다졸 (≥99%, CAS# 288-32-4), n-도데실 β-D-말토시드 (DDM, ≥99%, CAS# 69227-93-6), 염산 (1M, CAS# 7647-01-0), 요소 (≥99.5%, CAS# 57-13-6), 염화마그네슘 (≥98.5%, CAS# 7786-30-3), LB 액체배지 (Luria/Miller), 아가-아가 및 2x YT 액체배지는 Carl Roth로부터 구입했다. 암피실린 나트륨염 (CAS# 69-52-3), 이소프로필 β-D-1-티오갈락토피라노시드 (IPTG, ≥99%, CAS# 367-93-1), 에탄올 (≥99.8%, CAS# 64-17-5) 및 모든 효소들은 Fisher Scientific으로부터 받았다. 닭 달걀 흰자에서 추출한 라이소자임 (용해용, CAS# 12650-88-3), N,N-디메틸도데실아민 N-옥사이드 (LDAO, ≥99.0%, CAS# 1643-20-5), 펜탄 (≥99%, CAS# 109-66-0), 요오드아세트아미드 (IAA, ≥99%, CAS# 144-48-9), 비스-트리스 프로판 (≥99.0%, CAS# 64431-96-5)은 Sigma-Aldrich에서 구입했다. n-헥사데칸 (99%, CAS# 544-76-3) 및 시트르산 (99.6%, CAS# 77-92-9)은 Acros에서 구입했다. 트립신 (소 췌장, CAS# 9002-07-7)은 Alfa Aesar에서 구입했다.
프라가세아톡신 C (FraC) 단량체 발현 및 정제. His6 태그가 붙은 FraC 플라스미드를 함유하는 pT7-SC1 벡터를 이. 콜라이 BL21 (DE3) 세포에 전기화학적으로 삽입하고, 100 mg/l 암피실린과 1% 글루코스가 보충된 LB 아가 플레이트에서 37℃에서 밤새 성장시켰다. 콜로니를 사용하여 100 mg/l 암피실린이 보충된 200 ml의 2xYT 배지에 접종하고 600 nm (OD600)의 광학 밀도가 0.6에 도달할 때까지 37℃에서 성장시킨 후, 0.5 mM 이소프로필 β-D-1-티오갈락토피라노사이드 (IPTG)를 사용하여 발현을 유도시켜, 21℃에서 밤새 계속 성장시켰다. 세포 펠릿을 원심분리 (6,000g, 20분, 4℃)로 수집하여 -80℃에서 적어도 1시간 동안 보관했다. 펠릿을 50 ml 배양물당 10 ml 용해 완충액에 재현탁시켰는데, 이때 상기 용해 완충액은 150 mM NaCl, 1 mM MgCl2가 보충된 15 mM 트리스 염기 용액 (pH 7.5), 2M 요소, 20 mM 이미다졸, 0.2 mg/ml 라이소자임 및 0.2 단위/ml DNase로 이루어졌다. 상기 용액을 15 RPM으로 회전 믹서를 사용하여 실온 (21℃)에서 1시간 동안 혼합하였다. 세포들은동작 주기 Branson Sonifier 450을 사용해 30회 스윕 (sweep) (동작 주기 30%, 출력 제어 3)을 3회 적용하는 초음파 처리로 완전히 파괴하였다. 용해물을 6000g로 4℃에서 20분간 원심분리했다. 상청액을 100 ㎕의 재현탁된 Ni-NTA 수지 (20 mM 이미다졸이 보충된 pH 7.5의 150 mM NaCl, 15 mM 트리스 염기에 재현탁됨)와 함께 일정한 회전 (15RPM) 하에 1시간 동안 항온배양했다. 상기 용액을 미리 세척한 Micro Bio-Spin 컬럼 (Bio-Rad)에 로딩했다. Ni-NTA 비드를 20 ml WB (150 mM NaCl, 20 mM 이미다졸이 보충된 pH 7.5의 15 mM 트리스 염기)로 광범위하게 세척했다. 상기 컬럼을 마이크로튜브에 삽입하고, 잔여 세척 완충액을 제거하기 위해 원심분리기 (13,300g, 1분)를 사용하여 회전 건조시켰다. 150 mM NaCl, 300 mM 이미다졸 (EB)이 보충된 pH 7.5의 15 mM 트리스 염기 용액 150 ㎕를 첨가하고 5분간 항온배양 후 용출시켰다. 이 단계를 4회 반복하여 FraC 단량체를 함유한 4개의 분획을 회수했다. FraC 단량체의 존재와 순도는 SDS-PAGE를 사용하여 추산하였다. 순수한 분획들을 모아서 4℃에 보관했다. FraC 단량체의 농도는 용출 완충액을 공시험액으로 사용하는 Nano Drop 2000 UV-Vis 분광광도계 (Thermo Scientific)를 사용하여 추산했다.
스핑고미엘린-DPhPC 리포솜 제제. 25 mg 스핑고미엘린 (뇌, 돼지)을 25 mg의 1,2-디피타노일-sn-글리세로-3-포스포콜린 (DPhPC)과 혼합하고 0.5% v/v 에탄올을 함유한 펜탄 4 ml에 용해시켰다. 뜨거운 공기 흐름을 사용해 둥근 바닥 플라스크 내부를 돌리면서 지질 혼합물을 증발시켜서 플라스크 표면 위에 지질 박막을 생성하였다. 상기 박막을 초음파 처리조를 사용하여 Sdex 완충액 (150 mM NaCl, 15 mM 트리스, pH 7.5) 10 ml로 재구성하였다. 리포솜 용액 (5 mg/ml)을 냉동시켜 -20℃에 보관했다.
프라가시아톡신 C 올리고머화. 리포솜을 해동하여 10:1의 지질 대 단백질 질량비로 FraC 단량체에 첨가했다. 상기 혼합물을 37℃에서 30분 동안 항온배양한 후, N,N-디메틸도데실아민 N-옥사이드 (LDAO)를 최종 농도 0.6 v/v%로 첨가하여 상기 리포솜을 용해시켰다. 상기 용액을 15 mM 트리스 (pH 7.5) 및 0.02 v/v% n-도데실 β-D-말토시드 (DDM)가 보충된 150 mM NaCl 중에 10배 희석했다. 상기 희석된 용액을 WB2 (150 mM NaCl; 20 mM 이미다졸 및 0.02v/v% DDM이 보충된 15 mM 트리스 염기)를 사용하여 미리 세척한 100 ㎕의 Ni-NTA와 혼합했다. 일정한 회전 (15 RPM) 하에 혼합하면서 상기 혼합물을 30분 동안 항온배양하였다. 상기 용액을 500 ㎕의 WB2로 미리 세척한 Micro Bio-Spin 컬럼 (Bio-Rad)에 로딩하였다. Ni-NTA 비드들을 10 ml의 WB2를 사용하여 광범위하게 세척하였다. 원심분리기 (13,300g, 1분)를 사용하여 컬럼을 마이크로튜브에서 회전 건조시켜 잔여 세척 완충액을 제거하였다. 150 ㎕의 용출 완충액을 상기 컬럼 (150 mM NaCl; 1M 이미다졸 및 0.02 v/v% DDM이 보충된 15 mM 트리스 염기)에 첨가하고 10분간 방치한 후, 원심분리를 통해 깨끗한 마이크로튜브로 용출시켰다 (13,300g, 2 분). 올리고머는 4℃에서 수개월간 안정적이고 장기 보관을 위해 -80℃에서 냉동시킬 수 있다.
프라가시아톡신 C 돌연변이체의 구축. 프라가세아톡신 C 돌연변이 DNA는 MEGAWHOP 방법을 사용하여 제조하였다. 메가프라이머는 Integrated DNA Technologies에서 합성한 정방향 프라이머와 T7 역방향 프라이머 (5'-GCTAGTTATTGCTCAGCGG-3')를 사용하여 구축하였다. 25 ㎕의 REDTag® ReadyMix™ PCR 반응 믹스 (Sigma-Aldrich)와 함께 22 ㎕의 PCR 등급수 (Sigma-Aldrich), 각 1 ㎕의 정방향 및 역방향 프라이머 및 His6 태그가 붙은 프라가세아톡신 C 주형 DNA 1 ㎕를 조합하여 사용해 돌연변이당 6번의 반응을 수행했다 (두 번째 PCR에 충분한 DNA를 확보하기 위함). PCR 프로토콜은 95℃에서 90초의 변성 단계, 이후 95℃ (15초)에서 30 사이클의 변성 단계, 55℃ (15초)에서 어닐링 단계, 72℃ (120초)에서 신장 단계로 구성되었다. 6개의 PCR 반응물을 혼합하고 GeneJET PCR 정제 키트 (Thermo Scientific)를 사용하여 정제했다. 두 번째 PCR의 경우, 10 ㎕의 5x Phire 완충액 (Thermo Scientific)을 1 ㎕의 주형 DNA, 1 ㎕의 dNTP (10 mM), 2 ㎕의 메가프라이머 (1차 PCR), 35 ㎕의 PCR 등급수 (Sigma-Aldrich) 및 1 ㎕의 Phire II Hot Start DNA 폴리머라제 (Thermo Scientific)와 혼합하였다. PCR 프로토콜은 98℃ (30초)의 초기 사전 변성 단계, 이후 98℃ (5초)에서 25 사이클의 변성 단계 및 72℃ (90초)에서 확장 단계로 구성되었다. 5.7 ㎕의 5x FD 녹색 완충액 (Thermo Scientific) 및 1 ㎕의 Dpn1 효소 (Thermo Scientific)를 PCR 혼합물에 첨가하고 37℃에서 1~3시간 동안 분해되도록 두었다. 0.5 ㎕의 소화된 생성물을 50 ㎕의 이. 콜라이 10G® (Lucigen) 컴피턴트 세포에 전기화학적으로 형질전환시키고 100 mg/l의 암피실린 및 1% 글루코스를 함유하는 LB 아가 플레이트에서 성장시켰다. GeneJET 플라스미드 미니프렙 키트 (Thermo Scientific)를 사용하여 단일 콜로니를 농축하고 Macrogen Europe의 염기서열분석 서비스를 사용하여 서열을 확인했다.
His
6
태그가 붙은 야생형 프라가세아톡신 C의 아미노산 서열
비특이적 라이소자임 소화. 라이소자임 (Carl Roth, 닭 달걀 흰자에서 추출, 알부민 무함유)을 15 mM 트리스 (pH 9.5)가 보충된 8 M 요소에 최종 농도 20 mg/ml로 용해시키고 95℃에서 5분간 변성되도록 방치했다. 200 ㎕의 변성된 라이소자임 용액을 20 mM 디티오트레이톨 (DTT)과 함께 37℃에서 30분간 항온배양하여 시스테인 잔기를 환원시켰다. 요오도아세트아미드 (IAA)를 상기 혼합물에 첨가하여, 감소된 시스테인과 반응시켜 최종 농도가 45 mM이 되도록 하고, 암실에서 30분간 실온으로 항온배양했다. 상기 혼합물을 100 mM 트리스 (pH 8.5)로 5배 희석하고 트립신(Alfa Aesar™ 트립신, 소 췌장)을 1:50 (트립신:단백질)의 비율로 첨가했다. 상기 혼합물을 37℃에서 밤새 (~18시간) 소화되도록 두었다. 남아있을 수 있는 트립신을 변성시켜 비활성화하기 위해, 다음날 최종 혼합물을 95℃에서 10분간 변성시키고 HCl을 첨가하여 pH를 낮추었다 (대략 pH 4). 그런 다음, 상기 혼합물을 사용할 때까지 -20℃에서 냉동시켰다.
평면 지질 이중층 전기생리학적 기록. 전기생리학 챔버는 25 ㎛ 두께의 테플론 (Goodfellow Cambridge Ltd) 막으로 분리된 2개의 구획으로 구성되었다. 상기 테플론 막에는 직경이 약 100~200 ㎛인 개구부가 포함되어 있다. 펜탄 (Sigma Aldrich)에 용해된 5% 헥사데칸 (Sigma Aldrich) 5 ㎕를 상기 개구부 근처의 테플론 막에 먼저 적용하여 지질막을 형성했다. 상기 펜탄을 건조되도록 방치하고 완충액 (1 M KCl, 50 mM 시트르산; 비스-트리스 프로판으로 pH 3.8로 적정됨) 400 ㎕를 양측에 첨가했다. 펜탄에 용해된 DPhPC의 6.25 mg/ml 용액 20 ㎕를 챔버 각 측의 완충액 위에 첨가하였다. 펜탄이 증발할 수 있도록 챔버를 약 2분간 건조되도록 두었다. 은/염화은 전극을 각 구획에 부착했다. 시스 구획은 접지 전극에 연결시켰고 트랜스는 작동 전극에 연결시켰다. 평면 지질 이중층은 마글리아 등 (Maglia et al.)7에 의해 기술된 랭뮤어-블로젯 방법을 사용하여 생성하였다. FraC 나노기공의 방향은 전류-전압 관계의 비대칭성에 의해 결정되었다. 기록된 각 기공에 대해서 2분의 기준선을 기록하였다. 챔버의 시스 구획에 분석물을 첨가했다.
데이터 기록. 이온 전류의 기록은 과거의 작업1,2과 유사하게 Digidata 1550B A/D 변환기 (Axon Instruments)와 결합된 Axopatch 200B (Axon Instruments)를 사용하여 얻었다. 분석물 기록을 위해 샘플링 주파수는 50 kHz로 설정하였고, 아날로그 베셀 필터는 10 kHz로 설정하였다. 데이터는 Lampex 10 (Molecular Devices)을 사용하여 기록하였다.
표준 데이터 분석 및 사건 검출.
나노기공 전기생리학으로부터 측정된 단계적 전류 차단을 분석하는 익히 알려진 여러가지 방법들은 당업계에 알려져 있으며, 차단 크기, 차단 기간, 차단 형태, 차단 노이즈, 기타 차단의 하위 특징들 (예컨대, 미니스텝 등)을 포함하되 이에 국한되지 않는 유용한 데이터를 추출하기 위해 우리가 관찰하는 사건 유형들에 대해 다양한 방법들을 사용할 수 있다.
기본 데이터 분석을 위해, 맞춤형 Python 스크립트를 사용하여 원시 전기 데이터를 분석했다. 모든 기록들의 개방형 기공 전류 (Io) 및 표준 편차는 각 측정에 대해 10초 스니펫 (snippet)을 100회 반복하여 부트스트래핑된 3개의 독립적인 측정의 평균 전류를 계산하여 결정되었다. 사건 검출을 위해, 기록된 자취의 기준선 전류와 표준 오차는 분석물이 포함되지 않은 빈 나노기공 측정의 전체 전류 히스토그램으로부터 결정되었다. 그런 다음, 기준선 값을 사용하여 분석물이 첨가되었을 때의 사건을 측정했다. 적어도 2배의 샘플링 기간으로 구분된 기준선 전류와 표준 오차 이상의 모든 데이터 지점들이 사건으로 검출된다. 각 사건의 제외된 전류 (Iex%)는 개방형 기공 전류 Io에 대한 개방 기공 전류 Io와 차단 전류 Ib 간의 차이로서 계산되었다 (Iex% = [Io-Ib]/Io).
공정한 사건 검출.
분석을 개선하기 위해 공정한 사건 검출기 (impartial event detector) 방법이 사용되었다. 본 발명자들은 샘플링 주파수 부근의 체류 시간을 갖는 단기 사건들은 과소 샘플링과 필터링 효과로 인해 스파이크 또는 가우스 프로파일을 형성하는 경향이 있는 반면, 장기 사건들은 정상 부분이 평탄한 (flat-top) 모양을 따른다는 것을 발견했다. 따라서, 우리는 돌연변이 기공의 성능을 공정하게 비교하기 위해서 전류 차단의 형태를 설명하는 매개변수를 도입했다. 우리는 이온 전류 차단의 프로파일이 정상 부분이 평탄한 일반화된 정규 분포 함수 (gNDF, 수학식 3)로 설명될 수 있다고 가정한다. 관찰된 각 블록은 해당 함수의 비다항적 특성으로 인해 최소 제곱 피팅을 사용하여 수학식 1에 맞춰졌다.
(β > 0) (3)
상기 식에서, μ는 시간 영역 (time domain) (분산 σ2)의 사건 중심이고, ΔI B 는 기준선 (I O )과 사건 최대값 사이의 전류 차이 (pA)이다. 변수 β는 함수의 형태를 설명하는 것으로, 0보다 큰 임의의 실수를 취할 수 있다. β가 1보다 작고 0보다 큰 경우, 함수의 형태는 스파이크이다. β가 1과 같으면, 함수는 정규 분포 함수와 같다. β가 1보다 크면, 함수는 직사각형 (플랫-탑) 프로파일을 따르기 시작한다. 유리한 점은, 변수 β는 다음과 같은 방식으로 개별 사건들의 품질을 평가하는데에도 사용될 수 있다는 것이다. β< 1인 사건들은 대개 이온 전류 차단을 정확하게 측정하기에는 단기간의 사건들이다. 따라서, β≥1인 사건들만 펩타이드의 보다 정확한 측정으로 간주되어야 한다. 이와 마찬가지로, 우리는 β≥10인 사건들을 구별하는데, 그 이유는 플랫-탑 형태를 갖는 이러한 사건들로 차단된 전류를 보다 정확하게 추산할 수 있기 때문이다. gNDF 피팅은 gNDF의 반치전폭 (FWHM)을 취하여 사건의 체류 시간을 추정할 수 있게 해준다 (수학식 4). 이 수학식을 사용하여 체류 시간을 추산하는 것은, 이 매개변수들을 이산형이 아닌 연속형으로 처리할 수 있기에 유리하다 (이것은 데이터 지점의 수가 해당 사건 내에서 계수되는 경우임).
(4)
상기 식에서, σ는 분산 (σ2, 수학식 3)의 제곱근과 같고, β는 형태 매개변수를 나타낸다.
스펙트럼 매칭. 우리가 얻은 잔류 전류 스펙트럼들 중 일부는 분석물 (게이팅) 이외의 요인들에 의해 유도된 무작위 사건들을 포함할 것으로 예상되므로, 기준선 경사를 줄이고 높은 민감도를 유지하기 위해, 우리는 제곱된 1차 도함수 유클리드 코사인 상관 관계 (수학식 5)를 활용한다. 이 비교는 스펙트럼에서 관찰된 피크들의 위치에는 민감하지만, 기준선 이동에는 민감하지 않다.
(5)
상기 식에서, A 1 과 A 2 는 배제된 전류 세기값의 벡터와 같고, A 1,i 및A 2,i 는 배제된 전류 스펙트럼의 개별 빈 (bin)을 나타낸다. 좀 더 상세하게 설명하자면, 우리는 A 1 과 A 2 를 각 잔류 전류 빈에 대해 우리가 관찰한 세기값의 벡터로 설정하였다 (예컨대, An= 세기값 (40-41%), 세기값 (41-42%), ..., 세기값 (94-95%)). ΔA n 은 A n 의 도함수이다 (빈들 간의 차이). 분자에서는, 각 성분 ΔA n 을 비교 스펙트럼의 상응하는 ΔA n 과 곱하여 모든 항목들의 제곱합을 구하였다. 분모에서는, ΔA n 의 각 성분의 제곱합을 구하고, 이를 우리가 비교하려는 스펙트럼의 각 성분의 제곱합과 곱하였다. 따라서, 상기 두 벡터 A 1 과 A 2 가 동일한 경우라면, 상관관계는 1이고, 그렇지 않으면 1보다 작으며, A 1 과 A 2 의 도함수를 취하기 때문에, 선형 기준선 경사가 영향을 덜 미친다.
우리는 생성된 상관 계수에 대해 SciPy 버전 1.4.1에서 구현한 대로 Ward 거리를 사용하여 계층적 클러스터링을 수행해, 가장 유사한 스펙트럼을 결정하였다. 본질적으로, 이 메트릭은 이웃 간의 차이가 최소화되는 방식으로 데이터의 순서를 지정하기 때문에, 유사한 스펙트럼의 맵을 구축한다.
실시예 1: 프라가세아톡신 C 돌연변이 스크리닝.
FraC의 돌연변이:
말미잘인 악티나 프라가세아 (Actinia fragacea)의 WtFraC 서열을 다른 악티노포린과 정렬하여 서열 상동성을 확인했다 (도 1a). D10, G13, G15, D17 및 K20을 비롯해, 돌연변이가 더 잘 발생하는 일반적으로 보존되지 않은 다수의 위치들을 확인하였다 (도 1b). 이러한 위치들을 다른 돌연변이들로 조작하여 서로 다른 펩타이드들을 감지하여 구별하는 기공의 능력을 향상시켰다.
위치 D10에서, 아르기닌 (R) 및 글리신 (G)에 대한 돌연변이를 도입하여 분석물의 전기삼투 포획에서의 변화를 시험했다. 인식 부위 (G13) 부근의 각 위치들을 염기성 잔기 (K, R 또는 H) 또는 산성 잔기 (D 또는 E) 뿐만 아니라 중성 (G 또는 Q) 또는 방향족 (W, Y 및 F) 기를 갖는 아미노산으로 변형시켰다. FraC에서는 글리신 잔기가 잔기 15에 위치하는 반면, 다른 악티노포린에서 가장 흔한 아미노산은 트레오닌이다. 돌연변이 G15T를 도입하여 막 바깥쪽을 향하는 증가된 소수성 돌연변이가 FraC 기공의 거동을 안정화하고 개선하는지의 여부를 시험하였다.
서열 정렬 (도 1a)은 위치 20/21에서 일반적으로 한 쌍의 반대 전하를 보여주므로, 동일한 특성을 갖는 두 돌연변이 T21D와 이중 돌연변이 K20D/T21K가 구축되었다. 글루탐산을 도입하여 (K20D) 위치 20 상의 전하 변화도 시험했다.
올리고머 형태:
WtFraC는 옥타머, 헵타머 및 헥사머에 해당하는 것으로 예측되는 3가지 올리고머 형태로 존재할 수 있다. 우리는 옥타머 기공 (또는 유형 I 기공, T1)과 헵타머 기공 (또는 유형 II 기공, T2) 및 헥사머 기공 (또는 유형 III 기공, T3)을 시험하였다.
옥타머 올리고머는 가장 높은 전도도를 갖는 나노기공으로 확인되었다. 여러 돌연변이들은 WtFraC-T1 (95 ± 1 pA)에 비해 개방형 기공 전류 (Io)를 크게 감소시켰고, 일부의 Io는 WtFraC-T2 (47 ± 3 pA)와 유사한 정도였다. 특히, 더 큰 부피의 잔기가 도입되는 경우, 특히 위치 13에 도입된 방향족 잔기 (W/F/Y)의 경우 (각각 Io = 64 ± 8 pA, 77 ± 4 pA 및 82 ± 3 pA)에, Io 감소가 관찰되었는데, 이는 작은 펩타이드와 같은 더 작은 분석물을 검출하는데 유리할 수 있는, 더 작은 인식 영역이 달성될 수 있음을 시사하는 것이다. 위치 15에 트레오닌 잔기를 도입하였더니 기공을 통해 흐르는 개방형 기공 전류 Io가 증가하였는데 (100 ± 3 pA), 이는 증가된 전류가 일반적으로 분석물 결합으로 인한 변화에 더 민감하기 때문에 나노기공 분석에 유용한 특성이다.
펩타이드 혼합물:
기공 간의 공정한 비교를 보장하기 위해 라이소자임(Gallus-Gallus)의 비특이적 트립신 분해로부터 펩타이드 혼합물이 생성되었다. 우리는 트립신이나 다른 프로테아제, 예컨대 키모트립신이나 Lys-C 프로테아제를 사용했다. 트립신을 사용하면 유리할 수 있는데, 그 이유는 트립신이 K/R 아미노산 이후를 우선적으로 절단하기 때문이며, 대부분의 펩타이드들이 해당 펩타이드의 양쪽성 이온 전하 옆에 양전하를 가질 것이므로, 사용된 낮은 pH 조건 하에 +1의 순 전하가 생성된다. 모든 기공들은 동일한 단백질분해성 혼합물로 시험하였다.
차단 사건 분석:
나노기공 전류 차단으로 인해 발생하는 사건들은 최소 제곱 레벤버그-마커트 (Levenberg-Marquardt) 방법과 일반화된 플랫-탑 정규 분포 함수를 사용하여 피팅된 플랫-탑 형태로 분석하였다. 상기 피팅은 사건들을 β < 1인 스파이크, β = 1인 정규 분포 또는 플랫-탑 분포인 β > 1로 분류할 수 있는 β값을 유도한다. β > 1인 모든 사건들을 후속 분석에 사용하였다. 각 차단의 경우, 여러가지 특징적인 지표들이 추출된다. 여기에는 개방형 기공 전류에 대한 전위 사건 중에 차단되는 전류의 백분율 (Iex% =[Io-Ib]/Io)인 배제된 전류 (Iex%), 차단의 지속 시간(체류 시간이라고도 함), 차단의 형태, 차단 전류에서의 노이즈 등이 포함된다.
실험 조건
FraC 나노기공에서의 펩타이드 포획과 식별을 다양한 조건에서 연구하였다. 예를 들어, +-10 mV의 낮은 전압에서 +-200 mV까지 광범위한 전압에서 펩타이드 포획이 관찰되었다. 대부분의 감지는 일반적으로 펩타이드 포획과 특성 분석에 최적인 것으로 나타났던 +-50 mV 내지 +-100 mV에서 수행되었다. 펩타이드 검출은 광범위한 염 유형, 농도 및 막 전체에 걸친 비대칭성으로 관찰할 수 있는데, 이들 모두는 기공 유형과 결합하여 해당 시스템의 포획 및 검출 특성을 변경할 수 있다. 바람직한 염 조건은 pH <4.5 (예: pH 3.8)에서 약 1M KCl (또는 NaCl 또는 LiCl)이다.
결과:
야생형 FraC-T1과 야생형 FraC-T2는 pH 3.8 조건에서 약 10~13개의 사건/s의 빈도로 펩타이드를 포획하였다. 위치 10 또는 17에서 전하가 제거된 경우 (D10G-FraC-T1 또는 D17Q-FraC-T1 돌연변이), 포획 빈도는 WtFraC-T에 비해 약 3.4배와 약 7.2배 감소했다. 전기 삼투압 흐름 (EOF)은 나노기공에서 펩타이드를 효율적으로 포획하는데 중요한 구성요소로서, 분석물에 작용하는 전기영동력과 함께 작용하거나 이에 반대하여 작용할 수 있는 것으로 나타났다. 또한, EOF의 강도와 방향은 수축 부위의 전하에 따라서도 달라지는 것으로 나타났다 (표 4). 수-대면 잔기들을 부분적으로 양성자화하고 일반적으로 기공 내부의 순 양전하를 증가시키는 (음이온 선택성을 증가시키는) 낮은 pH 하에서, 우리는 야생형 FraC의 본래의 음성 잔기들이 거의 0인 순 이온 선택성을 유도하고 (표 4), 이에 따라 나노기공을 통한 순 전기-삼투압 플럭스도 거의 0으로 유도됨을 발견했다 (pH 7.5에서 매우 높은 양이온 선택성과 비교됨). 위치 10에서 음전하를 제거하면 낮은 pH에서 음이온 선택성이 더욱 증가해, 대부분 양전하를 띤 펩타이드들의 포획에 반대로 작용하는 더 강력한 EOF 성분이 생성되어 포획 효율이 낮아진다. 또한, D10R-FraC-T1과 같이 양전하 수축이 있는 기공은, -50 mV의 인가 바이어스에서 불안정한 기준선 전류를 나타내었지만, +50 mV에서는 안정적이므로 WtFraC와 반대로 거동한다. 그러나, D10R 돌연변이는 양의 인가 전압 하에 시스 챔버에서 펩타이드 분석물에 대한 우수한 포획을 나타냈다 (음의 전압 하에 WT의 본래의 D10의 포획과 유사한 포획을 나타냄). 이 극성 하에 증가된 포획은 양성 돌연변이에 의해 생성된 (시스에서 트랜스로 흐르는) 강한 순 음이온 선택성 전기-삼투압 바이어스의 결과이며, 이것은 이 극성에서 펩타이드 포획에 대항하여 작용하는 약한 전기영동력에 비해 우세하다.
글루타민으로 치환하여 잔기 K20의 전하를 제거하면 야생형 Frac에 비해 포획 빈도가 1.4배 증가한다. 아스파르트산을 도입하여 K20 전하를 대체하면 야생형 FraC에 비해 포획 빈도가 1.5배 감소했다. 비교적 작은 이러한 변화들은 EOF를 미세 조정하여 포획 빈도 및/또는 사건 상주 (체류) 시간을 제어하는 방법을 예시하고 있다.
흥미롭게도, 우리는 방향족 잔기 (Y, F 또는 W)를 도입하면 3가지 돌연변이 모두의 경우 야생형 FraC-T1 및 FraC-T2 기공에 비해 포획 빈도가 약 4배 증가한다는 점을 발견했다.
또한, 우리는 방향족 돌연변이들도 나노기공의 펩타이드 사건 차단의 기간을 증가시킴을 발견했다. G13에 방향족 잔기가 있는 기공의 차단의 대부분은 비교적 긴 체류 시간을 갖는 플랫-탑 형태였다 (예컨대, 도 3D). 실제로, 이러한 방향족 기공에서 사건들의 중앙값 체류 시간은, WtFraC-T1의 경우 0.09 ± 0.06 ms, WtFraC-T2의 경우 0.10 ± 0.01 ms와 비교하였을 때, G13Y-FraC-T1, G13F-FraC-T1 및 G13W-FraC-T1의 경우에 각각 0.32 ± 0.06 ms, 0.18 ± 0.03 ms 및 0.22 ± 0.06 ms로 증가했다.
다양한 돌연변이들을 비교하기 위해, 우리는 β > 1인 모든 사건들을 사용해 배제된 전류 (Iex%)의 히스토그램을 생성함으로써 배제된 전류 스펙트럼 (도 4A-D의 4개 기공에 대해 나타냄)을 구축했다 (5 kHz 가우스 필터, 방법 참조). 우리는 스펙트럼을 정규화하고 G13F-FraC-T1의 경우 샤프한 가우스 형태의 피크 (도 4C)와 함께 WtFraC-T1 및 T2 (도 4A/B)의 경우의 뚜렷한 패턴들도 관찰하였다. G13N-FraC-T1의 피크의 대부분은 낮은 Iex% (도 4D)였는데, 이는 나노기공을 통한 펩타이드들의 더 빠른 전위를 반영하는 것이다. 우리는 40% < Iex% < 95%인 배제된 전류 스펙트럼을 사용해, 점대점 (point-to-point) 스펙트럼 매칭 알고리즘을 활용하여 배제된 전류 스펙트럼을 비교하였다.
실시예 2: 프라가세아톡신 C 돌연변이 특성 분석.
우리는 추가의 특성 분석을 위해 다음과 같은 5개의 돌연변이를 선택했다: WtFraC-T1과 유사하며 Io가 약간 증가한 G15T-FraC-T1, 높은 SNR들 중 하나와 우수한 포획 빈도를 갖는 K20D-FraC-T1, 및 WtFraC-T2에 비해 체류 시간이 증가하고 포획 빈도가 증가된 G13에서의 방향족 돌연변이 (G13Y/F/ W-FraC-T1). 이러한 기공들의 특성 분석을 위해, 우리는 익히 확립된 펩타이드들의 혼합물을 사용했다 (즉, 상기 혼합물은 등몰 농도로 각 펩타이드들을 첨가하여 제조함). 상기 혼합물은 4개의 펩타이드로 구성되었다: 안지오텐시노겐 (DRVYIHPFHLVIHN, 1758.9 Da, 전하 = +3.96), 안지오텐신 1 (DRVYIHPFHL, 1296.5 Da, 전하 = +2.96), 안지오텐신 3 (RVYIHPF, 931.1 Da, 전하 = +2.16) 및 안지오텐신 4 (VYIHPF, 774.9 Da, 전하) = +1.16) (각각 안지오텐시노겐, Ang-I, Ang-III 및 Ang-IV로 약칭함). 나노기공의 분해능은 수학식 1과 2에 나타낸 것과 같이 피크 중심과 이들의 평균 표준 편차 간의 차이를 이용하여 펩타이드들 간의 분리도를 측정하여 정량하였다.
(1)
(2)
상기 식에서, Rs는 분해능이고, μ 1 및 μ 2 는 각각 표준 편차가 σ 1 및 σ 2 인 피크 중심이다. Rs < 2인 경우라면, 피크 중심들 간의 차이는 평균 표준 편차의 2배 미만이다. 따라서, 기준선 분리가 달성되지 않는다. 5% 미만의 중첩을 달성하기 위해서는, Rs ≥ 4가 필요한데, 즉 피크 중심들 간의 차이가 피크들의 평균 표준 편차의 2배 이상이 되어야 하므로, 우리는 이들이 분리된 것으로 간주할 수 있다. Rs 값이 클수록 분리가 더 잘 됨을 의미한다 (표 2).
도 5는 WtFraC-T2와 선택된 조작된 FraC 기공들 간의 비교를 나타낸 것이다. 방향족 기공인 G13F/Y/W는 펩타이드를 구별하는 능력이 현저하게 향상된 것으로 나타났다. 방향족 기공들은 WtFraC-T2에 비해 현저하게 길어진 차단 사건 기간을 나타냈다. 사건의 지속 시간이 길어지면 (주어진 획득 빈도에서 더 많은 원시 데이터 지점들을 포함), 개별 사건 차단의 경우에 배제된 전류의 진폭을 더 높은 정확도로 측정할 수 있다. 이로써, 방향족 기공에 대한 각 펩타이드 클러스터에 대해 관찰된 배제된 전류의 확산 감소를 적어도 부분적이나마 설명할 수 있다.
실시예 3: T2 나노기공을 이용한 펩타이드 분석
우리는 방향족 헵타머 (T2) 나노기공의 분해능을 시험하고, 류신-엔케팔린 (Leu-enk, YGGFL, 555.6 Da), 안지오텐신 II (4-8) {Ang-II (4-8), YIHPF, 675.8 Da} 및 켐프타이드 (LRRASLG, 771.9 Da)를 사용하여 헥사머 (T3) WtFraC-T3 및 WtFraC-T2 나노기공과 비교하였다. WtFraC-T3의 경우, 우리는 2가지의 변경된 막 인터페이스 변형태인 W112S-W116S를 함유한 FraC 버전을 사용하여, 헥사머 나노기공을 형성할 수 있다. WtFraC-T2는 차단을 나타내지 않았는데 (도 5), 이는 대부분의 펩타이드들이 감지되지 않은 채 기공을 통해 전위되었음을 시사하는 것이다. FraC-T3 및 G13W-FraC-T2는 류신-엔케팔린 및 안지오텐신 II (4-8) 차단을 나타냈던 반면, 켐프타이드 차단은 관찰되지 않았다. 켐프타이드가 류신-엔케팔린 및 안지오텐신 II (4-8)보다 분자량이 더 크다는 점을 고려하면 이는 놀라운 일이다. 아마도, 켐프타이드에 있는 두 아르기닌 잔기들이 이러한 나노기공을 통한 빠른 전기영동 전위를 유도하는 것일 것이다. 흥미롭게도, 우리는 켐프타이드가 G13F-FraC-T2에 대한 차단을 유도하였다는 사실을 발견했는데, 이는 이러한 방향족 변형이 이러한 종류의 펩타이드들을 검출하는데 있어서 가장 중요하다는 것을 의미한다. 한가지 가능한 설명은 페닐 알라닌 잔기들의 고리와 두 아르기닌 잔기들 사이의 양이온-π 상호작용이 나노기공 내부의 펩타이드의 체류 시간을 감소시키는데 중요하다는 것이다.
실시예 4: 나노기공을 포함하는 분석 시스템.
나노기공은 개구부를 통해 이동하는 분석물들을 검출하는 박막에 있는 나노미터 크기의 구멍이다. 본 발명의 예시적인 분석 시스템을 도 7에 개략적으로 도시하였다. 이 시스템은 막으로 분리된, 전해질 용액으로 채워진 2개의 챔버로 구성된다. 상기 챔버들은 막에 형성되어 있는 나노기공을 통해 연결된다. 어느 한 챔버의 전극을 통해 막에 전위가 가해지면, 이온들이 해당 기공을 통해 이동해, 작은 이온 전류를 생성하고, 이들이 증폭되어 측정된다. 분석물이 나노기공에 진입하게 되면, 개방형 기공을 통해 흐르는 이온 전류는 분석물에 의한 이온의 변위로 인해 변경되고, 이로써 일반적으로 이온 전류가 감소한다 (차단 사건). 전류 차단의 특성 (예컨대, 크기, 기간, 형태, 노이즈 등)은 포획된 분석물의 성질과 조건 (예컨대, 인가 전위, 완충 조건, 온도 등)에 따라 달라지며, 포획된 분석물의 특성을 제공하는데 사용될 수 있다.
실시예 5: 차세대 단일 분자 단백질 분석기로서 FraC 나노기공
본 실시예는 돌연변이 프라가시아톡신 C (FraC)의 조작된 나노미터 이하의 생물학적 나노기공이 다수의 트립신 소화된 단백질들을 식별할 수 있음을 입증한다. 수개의 합성 펩타이드들을 통한 보정에 의해, 잔류 전류 스펙트럼과 질량 스펙트럼 간의 관계를 찾아낼 수 있었기에, 단백질 식별이 가능해졌다. 도 8은 이러한 "상향식" 나노기공 기반 프로테오믹스의 개념을 도시한 것이다.
단백질 소화. 100 ㎍의 단백질 스톡을 취해 20 mM 트리스 완충액 (pH 7.5)을 사용하여 부피를 50 ㎕로 조정하였다. 최종 농도 20 mM의 디티오트레이톨 (DTT)을 첨가하여 있을 수 있는 이황화 결합을 감소시켰다. 샘플을 37℃에서 15분간 항온배양한 후, 95℃에서 15분간 변성 단계를 거치도록 하였다. 그 후, 20 mM 요오도아세트아미드 (IAA)를 첨가하고, 환원된 시스테인 잔기들을 알킬화하기 위해 상기 샘플을 암실에서 실온으로 15분간 항온배양되도록 두었다. 마지막으로, 100 mM 트리스 완충액 (pH 8.5)을 사용하여 총 부피를 100 ㎕로 조정했다.
트립신 소화를 위해, 우리는 프로테오믹스 등급 트립신이 포함하고 있는 Sigma-Aldrich에서 구입한 키트를 사용했다. 50 ㎕의 샘플 (50 ㎍의 단백질 함유)을 1 ㎍의 질량 분광법 등급 트립신 (1:50 효소:단백질 비율)에 첨가한 후, 상기 샘플을 37℃에서 밤새 항온배양했다. 마지막으로, 3000 Da (Amicon)의 분자량 컷오프를 갖는 원심분리 필터를 사용하여 큰 (> 2000 Da) 펩타이드들을 제거했다. 여과된 샘플들은 사용 전에 -20℃에 보관하였다.
트립신은 서열 의존성 프로테아제로서, 프롤린 (P)이 뒤따르지 않는 한, 아르기닌 (R)과 라이신 (K) 잔기의 카르복실 측쇄를 주로 절단한다. 따라서, 주어진 단백질을 트립신화하면 특이적 절단에서 나온 특정 펩타이드 단편들의 세트를 포함하는 펩타이드 혼합물이 생성되고, 이는 불완전한 소화 또는 표적외 절단으로 인해 발생하는 일정 수준의 다른 펩타이드 단편들과 결합된다.
트립신 소화를 위한 단백질의 발현. 5가지 모델 단백질: DHFR (디하이드로폴레이트 리덕타제), BSA (소혈청 알부민, Sigma-Aldrich), PAN (PAN 전개효소), ThpA (티아민 결합 단백질) 및 HMWI_Act (헤모필루스 인플루엔자에 (Haemophilus influenzae) 고분자량 부착 단백질의 C-말단 단편, 잔기 1205-1536)을 나노기공 센서를 시험할 목적으로 발현 및/또는 정제하였다.
DHFR/PAN/ThpA/HMWI_Act의 단백질 발현: 모든 단백질들은 유사한 프로토콜을 통해 발현되었다. 간략히 설명하면, 관심대상 유전자를 함유하는 플라스미드를 BL21 (DE3) 컴피턴트 에쉐리키아 콜라이 세포로 전기화학적으로 형질전환시켰다. 상기 세포들을 100 mg/L 암피실린 및 1% 글루코스가 보충된 LB 아가 플레이트에서 37℃에서 밤새 성장시켰다. 다음날, 성장한 LB 플레이트들을 100 mg/L 암피실린이 보충된 200 mL 2xYT 배지에 용해시켰다. 광학 밀도 (OD600)가 0.6에 도달할 때까지 배양물을 37℃에서 계속 진탕하면서 성장시켰다. 그 후, 유도를 위해 0.5 mM 이소프로필 β-D-1-티오갈락토피라노사이드를 첨가하고 21℃에서 밤새 계속 성장시켰다. 박테리아 세포를 원심분리를 사용하여 펠렛화하고 -80℃에서 적어도 1시간 동안 보관했다.
DHFR/PAN/ThpA/HMWI_Act의 단백질 정제: 세포 펠렛들을 먼저 용해 완충액에 재현탁시키고, 프로테아제 억제제 칵테일 (Roche)의 존재 하에 초음파 처리 (Branson Sonifier 450)로 용해함으로써 처리하였다. 원심분리로 세포 잔해물을 제거하고 Ni-친화성 크로마토그래피 컬럼을 통해 상층액을 처리하여 정제된 단백질 분획들을 회수했다. PAN의 경우, HiTrap Q HP 음이온 교환 컬럼 (GE Healthcare Life Sciences)을 사용하여 음이온 교환을 통해 단백질을 정제하는 추가의 정제를 수행하였다. SDS-PAGE로 순도를 확인하였고, 단백질 농도가 가장 높은 분획들을 혼합하여 10 kDa MWCO 회전 필터 (Amicon)를 사용하여 농축했다. HMW1Act의 경우, 관심대상 단백질을 함유하는 분획들을 수집하여 저장 완충액 (50 mM HEPES, 100 mM NaCl, 10% 글리세롤, pH 7.5)에 대해 SnakeSkin 투석 시스템 (MWCO 10 kDa, Thermo Fischer Scientific)을 사용하여 투석했다. 투석 후, 단백질을 분취하여 추가의 사용시까지 -80℃로 보관했다.
BSA의 단백질 정제: BSA는 Acros Organics에서 구입했다. HiTrap Q HP 음이온 교환 컬럼 (GE Healthcare Life Sciences) 상에서 10 mg의 BSA (1 ml의 50 mM 트리스 중, pH 7.5)를 처리함으로써 음이온 교환 크로마토그래피 (Akta pure)를 사용하여 BSA의 순도를 증가시켰다. SDS-PAGE로 용출된 단백질 분획들을 평가하였고, 단백질 농도가 가장 높은 분획들을 혼합하여 10 kDa MWCO 회전 필터 (Amicon)를 사용하여 농축했다.
결과
모델 단백질 소화의 검출. (표준) 질량 분광법 기반 기술을 사용하는 단백질의 검출과 식별은 (트립신) 펩타이드의 핑거프린팅에 크게 의존한다. 적절하게 소화된 단백질을 모방하기 위해, 우리는 라이소자임의 완전한 트립신화로 인해 발생할 것으로 예측되는 700 내지 1700 Da (Sigma Aldrich 및 Genscript)의 질량을 갖는 7개의 합성 펩타이드들을 포함하는 모델 펩타이드 시스템 (즉 상기 단백질은, 프롤린 (P)이 뒤따르지 않는 한, 모든 아르기닌 (R)과 리신 (K) 잔기들에서 인-실리코 (in-silico) 절단됨)을 사용하였다.
7개의 모델 펩타이드들을 별도의 나노기공 실험 (G13F-FraC-T1 기공, 1M KCl, pH 3.8, -50 mV)에 개별적으로 첨가하였는데, 배제된 전류 및 체류 시간으로 플롯팅하였을 때 사건들의 고유한 클러스터가 생성되었다. 각 단일 실험의 경우, 사건 차단에 대한 배제된 평균 전류는 클러스터링된 사건들의 히스토그램에 가우스를 피팅하여 계산하였다. 각 펩타이드 유형에 대한 배제된 평균 전류는 각 펩타이드에 대해 수행된 n > 3 실험들을 평균하여 계산하였다. 펩타이드들의 분자량과 이들의 각 배제된 평균 전류 차단 사이에는 강한 상관관계가 관찰되었다 (도 9A). 데이터는 배제된 전류 측정치로부터 펩타이드 질량을 예측할 수 있는 로지스틱 함수 (수학식 1, 도 9A)를 사용하여 피팅하였다.
(1)
상기 식에서, a는 오프셋 (offset)이고, k는 너비를 나타내며, μ는 변곡점이다.
도 9B는 나노기공 시스템 (G13F-FraC-T1 기공, 1M KCl, pH 3.8, -50 mV)에서 모든 7개 모델 펩타이드들의 혼합물로부터 측정된 배제된 전류 차단 사건들에 대한 히스토그램을 나타낸 것이다. 피크들은 로지스틱 함수의 예측에 따라 표지하고, 개별 실험들에서 관찰된 것과 동일한 배제된 전류 위치와 매칭시켰다.
소화된 라이소자임 단백질의 검출 및 질량 분광법을 사용한 비교. 라이소자임 단백질은 상술한 바와 같이 트립신화를 통해 소화시켰다. 이후, 생성된 펩타이드 단편 혼합물을 나노기공 감지 (G13F-FraC-T1 기공, 1M KCl, pH 3.8, -50 mV)와 질량 분광법 (LC ESI-MS)을 모두 사용하여 분석하였다. 나노기공을 사용하여 혼합물로부터 측정한 배제된 전류 차단의 히스토그램을 도 10A에 플롯팅하였다. 비교를 위해, 질량 분광법 스펙트럼에서 얻은 질량 데이터는 수학식 1에서 결정된 로지스틱 피팅 매개변수의 예측을 사용하여 배제된 전류 가상축 (pseudo excluded current axis)으로 변환시켰다 (도 10B). 특히, 예컨대 검출 효율의 차이로 인하여 방법들을 직접적으로 비교할 수는 없지만, 우리는 관찰된 전기분무 이온화 (ESI) 질량 스펙트럼과 나노기공 질량 스펙트럼 사이에 유의미한 상관관계가 있음을 관찰하였다.
트립신 소화된 단백질의 검출
매우 다양한 조성들을 갖는 추가의 9개의 단백질을 나노기공 분광법으로 시험했다. 상기 9가지 단백질은 다음과 같았다: 소혈청 알부민 (BSA), 디하이드로폴레이트 리덕타제 (DHFR), 고분자량 부착 1 (HMW1Act), PAN 전개효소, 티아민 결합 단백질 (TbpA), 베타 카제인, 사이토크롬 C, 라이소자임 및 트립신. 상기 단백질들은 설명한 바와 같이 트립신화를 통해 소화시켰다. 생성된 펩타이드 단편 혼합물들을 다수의 개별 나노기공 실험들 (G13F-FraC-T1 기공, 1M KCl, pH 3.8, -50 mV)에서 별도로 시험하였다. 소화된 라이소자임 펩타이드 혼합물에서 관찰되었던 것과 유사하게, 소화된 각 단백질에 대한 펩타이드 혼합물들로부터 차단 사건들의 뚜렷한 클러스터들이 관찰되었는데 (도 11 및 도 12), 사건 차단들의 클러스터는 이들의 배제된 전류 Iex%에 의해 구분되었다. 도 11은 3가지 대표적인 단백질 샘플에 대한 별도의 나노기공 실험들 간에 각 고유한 스펙트럼에 대한 높은 수준의 일관성이 관찰된다는 것을 보여주고 있다.
기준선 전류에서 기공들 간의 변동을 설명하기 위해, 우리는 Iex%에 슬라이딩 윈도우 (sliding window)를 사용하여 잔류 전류 스펙트럼을 기준 스펙트럼에 정렬했다. 도 12는 각 단백질 샘플에 대한 체류 시간과 배제된 전류의 개별 펩타이드 차단 사건 산점도에 대한 피팅에서 집계된 히스토그램 "배제된 전류 스펙트럼"을 플롯팅한 것이다. 예상한 대로, 각 단백질에 있어서 배제된 전류 스펙트럼은 각 시스템에서 소화된 펩타이드들의 고유한 조성에 따라 달라지는 고유한 피크의 패턴을 나타내고 있다 (단편들은 질량, 길이 및 아미노산 조성에 따라 다름). 흥미롭게도, PAN과 BSA의 스펙트럼은 인-실리코 소화로부터 예측된 다량의 단편들에도 불구하고, 뚜렷한 펩타이드 클러스터를 나타냈다는 것이다. 이는 큰 (50 kDa) 단백질이라도 전구체 단백질의 핑거프린팅을 가능하게 할 수 있는 뚜렷한 스펙트럼을 생성한다는 것을 의미한다.
단백질 핑거프린팅 및 스펙트럼 매칭. 트립신 소화물의 고유한 배제된 전류 스펙트럼 (도 12A)을 사용하여 단백질을 핑거프린팅할 수 있다. 가장 간단한 핑거프린팅 방법은 스펙트럼 매칭인데, 이것은 측정된 스펙트럼을 이전에 측정한 공지된 스펙트럼 데이터베이스와 비교하는 것이다. 서로 다른 데이터 세트들은, 별도의 반복 실험들에서 기공들 간의 변동으로부터 기준선 이동을 감안한 후, 높은 수준의 재현성을 나타내었다 (예컨대, 도 11 참조).
상기 스펙트럼의 고유성과 재현성은 제곱된 1차 도함수 유클리드 코사인 상관관계 (DEuc) (수학식 2)를 활용한, 스펙트럼 상관 관계를 사용하여 결정되었다.
(2)
배제된 전류 스펙트럼의 벡터들과 해당 벡터의 각 성분 (i)9를 포함하는 A 1 및 A 2 .
스펙트럼 매칭에 대한 대표적인 예를 담보하기 위해, 우리는 매칭되었던 스펙트럼을 제외한, 모든 스펙트럼에서 비교 데이터베이스를 구축하는 리브-원-아웃 비교를 수행했다. 확률 P(X) %는 모든 DEuc 점수들의 합에 대한 해당 DEuc 점수로부터 계산하였다 (도 12B). 라이소자임에 잘못 할당된 DHFR을 제외하고는, 9개의 트립신 소화물 중 8개가 공지된 단백질 (대각선 축)에 올바르게 할당된 것으로 나타났다. DHFR 및 라이소자임 스펙트럼 (도 12A)에 대한 육안 검사를 통해, 두 소화물이 모두, 배제된 전류에 대한 일부 피크 유사성을 공유하고 있기 때문에, 잘못된 할당은 쉽게 설명되었다. 이 분석에서는 사건들의 배제된 전류라는 단 하나의 "지표"만 사용한다. 우리는, 다른 측정항목들 (예를 들어, 각 사건에서 노이즈의 표준 편차)을 사용하여 스펙트럼을 추가로 분석해 보았더니, 하나의 측정항목 차원으로는 쉽게 분리할 수 없는 클러스터/피크들이 다른 측정항목 차원으로 분리가능한 경우가 많이 있음을 발견하였다.
아미노산 변화의 검출
4 달톤만 다른 펩타이드들을 구별하기 위한 분석 검출 시스템의 분해능을 평가하기 위해, 2가지 다른 형태의 엔케팔린 펩타이드들: YGGFL 및 YdAGFdL (여기서, d는 D-아미노산을 나타내며; 다른 모든 아미노산들은 L-배열로 존재함)을 시험하였다. 도 16A는 2개의 명확한 클러스터들이 서로 다른 펩타이드들에 대해 관찰됨을 나타낸 것으로, 대표적인 FraC G13F 나노기공을 사용하여 키랄성 차이와 함께 적어도 4 Da의 질량 차이가 구별될 수 있음을 예시하고 있다. 동일한 질량의 펩타이드들에 대한 펩타이드 키랄성의 검출은 도 16B와 16C에서 확인되었는데, 이는 D-아미노산의 존재로 인한 나노기공 신호에서의 차이를 보여주는 것이다. 10 μM의 [Ala2]-Leu 엔케팔린과 10 μM의 DADLE ([D-Ala2, D-Leu5]-엔케팔린)의 혼합물을 시스 구획 (FraC-G13F; 도 16B) 또는 트랜스 구획 (CytK-K128F; 도 16C)으로 첨가하였다.
실시예 6: 번역 후 변형된 펩타이드의 검출.
본 실시예는 돌연변이형 단백질성 나노기공이 번역 후 변형된 펩타이드들을 검출할 수 있음을 입증한 것이다. 상술한 바와 같이 FraC-G13F 나노기공을 포함하는 분석 시스템을 사용하여 인산화된 펩타이드와 인산화되지 않은 펩타이드 (도 13 참조), 변형되지 않은 펩타이드, 1개 또는 2개의 글리칸으로 변형된 펩타이드 (도 14 참조), 및 변형되지 않은 단백질과 람노실화된 단백질 (도 15)을 구별하였다.
실시예 7: 베타-배럴형 기공 형성 독소를 포함하는 돌연변이형 단백질성 나노기공.
실시예 1 내지 6은 악티노포린 계열의 알파-나선형 기공 형성 독소를 포함하는 돌연변이형 단백질성 나노기공과 그의 단일 분자 센서로서의 용도에 관한 것이다. 이러한 발견들이, 감지 영역의 크기는 비슷하지만 구조적 구성이 매우 다른 다양한 종류의 나노기공들에 더 광범위하게 적용가능한지를 시험하기 위해, 우리는 베타-배럴형 기공들에 대한 유사한 돌연변이와 조건들을 연구하였다.
본 실시예는 단백질의 내강-대면 인식 영역이 방향족 잔기로의 하나 이상의 돌연변이를 포함하는 베타-배럴형 기공 형성 단백질이 특히 근처의 산성 돌연변이들과 결합하여 이러한 나노기공 기반 센서를 제공하는데 사용될 수 있음을 입증한 것이다.
완충액의 pH를 낮추면, 야생형 에어로라이신 기공을 사용하여 트립신 소화된 펩타이드 혼합물의 포획 (도 17A vs. 도 17B)과 분해능 (도 18A vs. 도 18B)을 증대시킬 수 있는 것으로 밝혀졌다. 그러나, 야생형 기공의 경우, 낮은 pH (예컨대, pH 3.8)에서도 우리가 관찰하는 사건들은 매우 짧고 (도 17A/B), 서로 다른 펩타이드 모집단에서 생성된 펩타이드 클러스터는 광범위한 분포를 가지며 서로 잘 분리되지 않아서, 해당 혼합물로부터 개별 펩타이드들을 구별하는 것이 쉽지 않다 (도 18B).
우리는 위치 238의 라이신을 페닐알라닌 (Aer-K238F, 도 17C 및 18C)으로 치환하였더니 펩타이드의 체류 시간이 크게 증가하지 않았고 (도 17C) pH 3.8에서 펩타이드 클러스터 분해능이 약간만 향상되었음 (도 18C)과, 위치 238의 라이신 잔기를 산성 아미노산 아스파테이트 (Aer-K238D)로 치환하였더니 야생형 기공에 비해 낮은 pH에서 클러스터 분해능이 크게 증가했음 (도 18D)을 발견하였다. K238D 돌연변이의 경우에 향상된 펩타이드 포획과 분리는 부분적으로는 낮은 pH에서 나노기공의 인식 영역과 대부분 양전하를 띤 펩타이드들 사이의 정전기적 반발력 감소에 기인하고, 부분적으로는 양이온 이온 선택성의 증가에도 기인한다.
우리는 추가로 에어로라이신의 Ala260, Ser264, Gln268 또는 S272 어느 한 위치에 페닐알라닌을 도입하는 것과 K238D 돌연변이를 조합하였더니, 펩타이드 분해능의 크게 개선되었음을 관찰했다 (도 18E-H). 서로 다른 펩타이드 클러스터들 간의 향상된 분해능은 1) 각 단일 분자 사건의 보다 정확한 측정을 가능하게 하는 더 긴 체류 시간(예: 도 17D), 2) 가깝게 분리된 클러스터들을 서로 더 쉽게 구분할 수 있도록 하는, 각 클러스터에서 잔류 전류의 확산 감소, 및 3) 전체 전류 범위에 걸쳐 클러스터들의 더 광범위한 확산을 포함하는, 개선사항들의 조합 결과이다. 분석물 펩타이드의 분해능은 위치 238의 아스파르트산과 도입된 방향족 아미노산 간의 거리가 4 nm 미만인 경우에 특히 선명하였다. 따라서, 증가된 음전하 기공과 수-대면 막횡단에 대한 방향족 치환의 조합은 표지하지 않은 펩타이드들의 포획과 분해능을 증가시키는데 중요하다. 이는 산성 pH 값 (< pH 4.5)에서 샘플링하는 경우에 특히 중요하다. 중요한 점은, 베타-배럴형 기공의 내강에 있는 이러한 돌연변이들의 조합이, 향상된 펩타이드 식별을 위해 조작된 경우, FraC 나노기공의 수축부에 있는 것과 유사한 감지 잔기들의 고리를 생성한다는 것인데, 이는 이러한 돌연변이들의 조합이 유사한 감지 수축 형상을 갖는 광범위한 알파-나선형 및 베타-배럴형 기반의 나노기공의 감지 수축부로 조작될 수 있는 일반적인 특징임을 보여주는 것이다 (예를 들어, 당업계에 공지된 익히 알려진 구조적 및 상동성 모델링 도구의 조합을 사용하여 비보존된 내향 (inward facing) 잔기들에 돌연변이를 조작하여 넣는 것).
도 18I는 돌연변이 Aer-K238W 기공을 사용한 트립신 소화된 펩타이드 혼합물의 포획과 분해능을 나타낸 것으로, 방향족 돌연변이가 야생형 에어로라이신에 비해 펩타이드 검출을 유의하게 향상시킴을 입증하고 있다.
프로-에어로라이신 (pro-aerolysin)의 발현과 정제
C-말단의 헥사-히스티딘 태그에 의해 신장된 프로-에어로라이신을 암호화하는 유전자를 함유하는 플라스미드를 전기천공법을 사용하여 BL21 (DE3) 세포 내로 형질전환시켰다. 상기 형질전환된 세포를 1% 글루코스와 100 ㎍/ml의 암피실린이 보충된 LB 아가 플레이트에서 37℃로 밤새 성장시켰다. 다음날, 콜로니들을 재현탁시키고 OD600이 0.6-0.8에 도달할 때까지 37℃에서 200 mL의 2YT 배지에서 성장시켰다. 이 시점에서, 0.5 mM의 IPTG를 첨가하여 발현을 유도하고 상기 배양물을 25℃에서 밤새 항온배양하였다. 그 후, 세포들을 4000 rpm에서 15분간 원심분리하여 펠렛화하고, 세포 펠렛들을 -80℃에서 최소 30분간 보관했다. 단백질 정제를 위해, 100 ml의 배양물의 세포 펠렛을 1 mM MgCl2, 0.2 단위/ml DNase1 및 약 1 mg의 라이소자임이 보충된, 150 mM NaCl, 20 mM 이미다졸 및 pH 7.5로 완충된 15 mM 트리스를 함유하는 20 ml의 용해 완충액에 재현탁시켰다. 상기 혼합물을 실온에서 30분간 항온배양한 후, Branson Sonifier 450 (2분, 동작 주기 30%, 출력 제어 3)을 사용하여 초음파 처리하여 세포들이 완전히 파괴되도록 한다. 세포 잔해물을 6000 rpm에서 20분간 원심분리하여 펠렛화하고, 상청액을 조심스럽게 새로운 팔콘 튜브로 옮긴다. 한편, Ni-NTA 비드 용액 200 ㎕를 150 mM NaCl, 20 mM 이미다졸 및 pH 7.5로 완충된 15 mM 트리스를 함유하는 세척 완충액으로 세척한다. 상기 비드들을 상청액에 첨가하여 실온에서 5분간 항온배양한다. 그 후, 상기 용액을 Micro Bio-Spin 컬럼 (Bio-Rad)에 로딩한 후 5 ml의 세척 완충액으로 세척한다. 결합된 단백질은 용출 완충액 (150 mM NaCl, 300 mM 이미다졸, pH 7.5로 완충된 15 mM 트리스) 200 ㎕의 분획에 용출시킨다. 프로-에어로라이신 분획들은 몇 주간 4℃에서 보관할 수 있다.
트립신을 사용한 프로-에어로라이신의 올리고머화
프로-에어로라이신을 실온에서 15분 동안 1:1000 질량비로 트립신과 함께 항온배양한다. 트립신은 C-말단 펩타이드를 절단하여, 헵타머 기공으로 조립될 수 있는 에어로라이신 단량체를 생성하는데, 상기 헵타머 기공은 전기생리학 실험에서 특성 분석될 수 있다.
평면 지질 이중층 전기생리학적 기록.
전기생리학 챔버는 25 ㎛ 두께의 테플론 (Goodfellow Cambridge Ltd) 막으로 분리된 2개의 구획으로 구성되었다. 상기 테플론 막에는 직경이 약 100~200 ㎛인 개구부가 포함되어 있다. 펜탄 (Sigma Aldrich)에 용해된 5% 헥사데칸 (Sigma Aldrich) 5 ㎕를 상기 개구부 근처의 테플론 막에 먼저 적용하여 지질막을 형성했다. 상기 펜탄을 건조되도록 방치하고 400 ㎕의 실행 완충액 (1M KCl, 비스-트리스 프로판으로 pH 3.8 또는 pH 3.0으로 적정된 50 mM 시트르산; 또는 pH 7.5로 완충된 50 mM 트리스)을 양측에 첨가했다. 펜탄에 용해된 DPhPC의 10 mg/ml 용액 20 ㎕를 챔버 각 측의 완충액 위에 첨가하였다. 펜탄이 증발할 수 있도록 챔버를 약 2분간 건조되도록 두었다. 은/염화은 전극을 각 구획에 부착했다. 시스 구획은 접지 전극에 연결시켰고 트랜스는 작동 전극에 연결시켰다. 평면 지질 이중층은 마글리아 등 (Maglia et al.) (Huang et al. Nat. Commun. 2017)에 의해 기술된 랭뮤어-블로젯 방법을 사용하여 생성하였다.
라이소자임의 트립신 소화
100 ㎍의 라이소자임 (Carl Roth, 닭 달걀 흰자, 알부민 무함유)을 150 mM NaCl, pH 7.5로 완충된 15mM 트리스 중에 용해시켰다. 소화 전에, 유리 시스테인을 알킬화하여 소화 후 이황화 브릿지 형성을 방지하였다. 이를 위해, 3 ㎕의 200 mM DTT를 첨가하고 샘플을 37℃에서 15분간 항온배양한 후, 95℃에서 15분간 변성시켰다. 이어서, 200 mM IAA 7 ㎕를 첨가하고 샘플을 암실에서 실온으로 15분 동안 항온배양했다. 알킬화 후, 라이소자임은 Trypsin Singles, Proteomics 등급 키트 (Sigma Aldrich, 카타로그 #T7575-1KT)를 사용하여 50:1의 라이소자임:트립신 질량비로 37℃에서 밤새 소화시켰다.
에어로라이신 기공을 이용한 라이소자임 소화에 대한 검출
에어로라이신을 시스-챔버에 첨가하고 단일 채널이 이중층에 삽입될 때까지 이중층을 파괴하고 재형성하였다. 기공의 방향은 해당 기공의 IV 곡선의 작은 비대칭으로 감지될 수 있다. 먼저, +150 mV 인가 전위에서 2분간 공백을 기록한 후, 트립신 소화된 라이소자임 4 ㎕를 챔버의 시스 구획에 첨가했다. 분석물은 +150 mV의 인가 전위에서 최소 10분 동안 측정하였다.
데이터 기록. 이온 전류의 기록은 과거의 작업 (Huang et al. Nat. Commun. 2019)과 유사하게 Digidata 1550B A/D 변환기 (Axon Instruments)와 결합된 Axopatch 200B (Axon Instruments)를 사용하여 얻었다. 분석물 기록을 위해 샘플링 주파수는 50 kHz로 설정하였고, 아날로그 베셀 필터는 10 kHz로 설정하였다. 데이터는 Lampex 10 (Molecular Devices)을 사용하여 기록하였다.
실시예 8. 사이토라이신 k 베타-배럴형 기공 형성 단백질을 포함하는 돌연변이형 단백질성 나노기공
실시예 7은 변형된 베타-배럴형 기공 형성 단백질 에어로라이신을 사용한 단일 분자 분석에 관한 것이다. 본 실시예에서는, 기능적으로 유사한 돌연변이들을 사이토라이신 k (cytK) 나노기공에 도입하여, 바람직하게는 낮은 pH 조건 (<pH 4)에서 사용되는 경우에, 방향족 돌연변이가 바람직하게는 부근의 산성 돌연변이들과 조합되어, 다른 베타-배럴형 기공들의 경우에 비표지된 펩타이드들을 포획하여 분리하는 능력을 향상시킴을 입증하고 있다.
CytK는 막에 삽입되는 경우 전류를 통과시킬 수 있는 나노기공으로 알려져 있지만 (Hardy et al, FEMS Microbiol Lett. 2001), CytK의 구조는 알려져 있지 않다. 따라서, 베타-배럴향 영역과 추정 상의 분석물 인식 영역을 식별하기 위해서, 황색포도상구균 유래의 알파-용혈소 나노기공의 서열 및 구조에 CytK 서열을 맵핑함으로써 상동성 모델을 구축했다 (도 20A). 우리는 베타-배럴 영역이, 아미노산 E112에서 아미노산 S134까지, 아미노산 S137에서 아미노산 K155까지 이어지는 스트레치 (stretch)를 포함하며, E112-S130 범위에 있는 짝수 잔기들과 S137-K155 범위에 있는 홀수 잔기들이 내부 내강의 수-대면 잔기들임을 확인하였다 (도 20A).
(돌연변이) CytK의 발현과 정제
C-말단에서 6개의 히스티딘 잔기에 의해 신장된 CytK를 암호화하는 유전자를 함유하는 플라스미드를 전기천공법에 의해 BL21 (DE3) 세포 내로 형질전환시켰다. 상기 형질전환된 세포를 LB 아가 플레이트 (1% 글루코스와 100 ㎍/ml의 암피실린)에서 37℃로 밤새 성장시켰다. 콜로니들을 재현탁시키고 OD600 0.6-0.8이 될 때까지 37℃에서 200 mL의 2YT 배지에서 성장시킨 후, 0.5 mM IPTG를 첨가하여 발현을 유도하고, 배양물을 25℃에서 밤새 항온배양하였다. 세포를 원심분리에 의해 펠렛화하고 -80℃에서 최소 30분 동안 보관했다. 세포 펠렛을 용해 완충액 (150 mM NaCl, 20 mM 이미다졸, 15 mM 트리스, pH 7.5, 1 mM MgCl2, 0.2 단위/ml DNase1, ~1 mg의 라이소자임)에 재현탁시켜 용해시키고, 실온에서 30분 동안 항온배양한 후, 초음파 처리했다 (Branson Sonifier 450, 2분). 세포 잔해물을 원심분리에 의해 펠렛화하고 CytK를 함유하는 상청액을 회수하였다. CytK를 상청액에서 추출하여 Ni-NTA 비드를 사용하여 정제했고, 200 ㎕의 분취량 (150 mM NaCl, 300 mM 이미다졸, pH 7.5에서 완충된 15 mM 트리스) 중에서 최종 용출한 후 4℃에서 보관했다.
평면 지질 이중층 전기생리학적 기록.
실시예 7에 기술한 바와 같이 전기생리학 측정을 수행하였다. CytK를 시스-챔버에 첨가하고 단일 나노기공이 이중층에 삽입될 때까지 나노기공 시스템의 DPhPC 이중층을 파괴하고 재형성했다. 기공의 방향은 해당 기공의 IV 곡선의 비대칭으로 감지될 수 있다. 모든 기록은 pH 3.8 (비스-트리스 프로판으로 pH 3.8로 적정된, 50 mM 시트르산) 또는 pH 7.5 (pH 7.5로 완충된 50 mM 트리스)에서 시스 및 트랜스 구획 모두에서 1M KCl을 사용하여 수행되었다. 먼저, +100 mV 인가 전위에서 2분간의 공백 개방형 기공 전류를 기록한 후, 트립신 소화된 라이소자임 4 ㎕를 챔버의 시스 또는 트랜스 구획에 첨가했다. 표시한 바와 같이, -100 mV 내지 +100 mV의 인가 전위에서 최소 10분 동안 분석물을 측정했다. 이온 전류는 Axopatch 200B 증폭기 (Molecular Devices)에 연결된 Digidata 1440A (Molecular Devices)를 사용하여 기록하였다. 분석물 기록을 위해 샘플링 주파수는 50 kHz로 설정하였고, 아날로그 베셀 필터는 10 kHz로 설정하였다. 데이터는 Lampex 10 (Molecular Devices)을 사용하여 기록하였다. 사건 차단 데이터를 본원에 설명된 대로 분석하였는데, 펩타이드 포획으로 인한 사건 차단들을 측정하고, 평균 개방형 기공 전류, 평균 차단 전류, 차단 기간 (체류 시간), 차단 전류의 표준 편차 등을 포함한 측정항목을 추출하였다.
결과
실시예 7과 유사하게, CytK 나노기공을 함유하는 나노기공 감지 시스템을, 트립신화된 라이소자임으로부터 생성된 소화된 펩타이드 혼합물을 사용하여 시험하였다. 야생형 CytK는, pH 7.5 또는 pH 3.8에서, 광범위한 전압에 걸쳐 양 또는 음의 인가 전위 하에, 샘플이 시스 또는 트랜스 구획에 첨가되는 경우를 비롯해서, 트립신 처리된 라이소자임 샘플의 펩타이드를 포획하지 않거나, 또는 거의 포획하지 않는다. 예를 들어, 도 19A 및 도 20B는, 대부분 양으로 하전된 펩타이드의 전기영동 포획 (+100 mV, 1M KCl, pH 3.8)을 유도하기 위해 트랜스전극에 양의 인가 전위를 사용하여, 트립신 처리된 라이소자임 샘플을 트랜스 구획에 첨가했던 경우에, 야생형 CytK 나노기공을 사용하여 검출된 사건들의 수가 적음을 보여주고 있다.
우리가 예측한 구조에 따르면, 위치 128의 라이신 잔기와 위치 139의 글루타메이트 잔기는 인식 영역에서 내향 잔기들인 것으로 예측한다. 본원에 설명된 과거 연구 결과들에 따르면, 페닐알라닌은 산성 E139에 인접한 CytK 단량체의 K128 위치로 치환되어, 나노기공에서 순 양전하를 감소시킬 뿐 아니라, 향상된 펩타이드 검출을 위해 방향족을 도입하는 기능도 한다. K128F 돌연변이는 야생형 나노기공에 비해 낮은 pH에서 서로 다른 펩타이드들을 포획 (도 19B) 및 구분 (도 20C)을 모두하는 능력에서 큰 개선을 가져왔다. K128W 돌연변이에서도 매우 좋은 결과가 얻어졌다 (도 20H).
또 다른 구현에서는, 실시예 7에서 사용된 전략과 유사하게, 238번의 라이신을 아스파르트산으로 치환하고, 126번의 세린을 페닐알라닌으로 치환함으로써 (CytK-S126F-K128D), 추가적인 음성 돌연변이에 인접하게 방향족 아미노산을 도입하였다. 에어로라이신 나노기공 시스템에 대해 관찰되었던 것과 유사하게, 산성 아미노산 치환에 인접한 방향족 아미노산 치환의 이러한 조합은, 다음을 포함하는 개선된 측정항목들의 조합을 통해 다양한 펩타이드의 분해능을 더욱 향상시켰다: 더 나은 포획 (도 19C), 펩타이드 차단의 더 긴 상주 (체류 시간) (도 19C), 잔류 전류 확산이 적은 더 조밀한 클러스터 (도 20D), 및 전체 최소-최대 전류 범위에 걸쳐 광범위하게 확산된 클러스터 (도 20D).
K128D와 조합된 에어로라이신의 배럴에서 더 높은 위치 (위치 S120, Q122 또는 G124)에 있는 방향족 돌연변이들도 트립신화된 라이소자임 샘플의 펩타이드에 대한 우수한 분해능을 제공했다. 도 20E, F 및 G를 참조한다.
따라서, 데이터는 바람직하게는 산성 아미노산 치환에 인접한, 방향족 돌연변이가, 특히 낮은 pH 조건에서, 비표지된 펩타이드들을 포획하여 구별하는 능력을 향상시키는 감지 영역을 생성한다는 것을 입증하는 것이다.
특히, 실시예 7과 8에서 우리는 CytK와 에어로라이신 나노기공에서 펩타이드 포획을 제어하는 2가지 다른 주요 메커니즘을 입증하였다. 예를 들어, 우리는 분석물들이 시스 구획에 있는 경우에 에어로라이신 나노기공이 양의 인가 전위에서 효과적으로 펩타이드들을 포획하여 구별할 수 있음을 입증했다. 따라서, pH 3.8 또는 pH 3.0에서 대부분 양전하를 띠는 분석물은, 우세한 전기삼투압 포획 조건으로 인해 전기영동 방향에 대항하여 포획된다. 이와는 대조적으로, 우리는 분석물들이 트랜스 구획에 있는 경우에 CytK가 양의 인가 전위에서 효과적으로 펩타이드들을 포획하여 구별할 수 있음을 입증했다. 따라서, 분석물들은 pH 3.8 조건 하에 주로 전기영동력에 의해 포획되고, 전기삼투압 성분은 추가적인 산성 잔기들의 치환에 의해 0에 가깝게 조정되었다 (표 4 참조). 우리의 결과들은, 베타-배럴형 기공 형성 독소에 방향족 잔기의 도입이 해당 분석물의 포획 메커니즘과 관계없이 작동하며, 낮은 pH 조건 하에 산성 잔기의 도입이 양이온 선택성과 전기-삼투압 포획을 조정과 제어하는 중요한 도구임을 의미하는 것이다.
[표 4] FraC, 에어로라이신 및 CytK 나노기공의 이온 선택성. 반전 전위는 pH 7.5에 대해서는 50 mM 트리스 또는 비스-트리스 프로판을 사용하여 pH 3.8로 적정된 50 mM 시트르산을 사용하여 표시된 pH로 완충된, 비대칭 염 조건 (트랜스에서 2M KCl 및 시스에서 0.5M KCl) 하에 -100 mV와 +100 mV 사이의 IV 곡선으로부터 측정하였다. 반전 전위 (순 전류 흐름이 0인 인가 전압)는 -20 mV와 +20 mV 사이의 IV 곡선의 선형 회귀에 의해 측정되었다.
실시예 9. 리세닌 베타-배럴형 기공 형성 단백질을 포함하는 돌연변이형 단백질성 나노기공
본 실시예는 추가의 예시적인 베타-배럴형 기공 형성 단백질인 리세닌이 성공적으로 돌연변이되어, 비방향족 내강-대면 잔기의 방향족 돌연변이가 비표지된 펩타이드들을 포획하여 구별하는 능력을 향상시킨다는 것을 보여주고 있다.
에이세니아 페티다 (Eisenia fetida) 유래의 리세닌 유전자를 함유하는 플라스미드를 전기천공법에 의해 BL21 (DE3) 이. 콜라이 컴피턴트 세포 내로 형질전환시켰다. 다음으로, 세포들을 37℃에서 밤새 100 μL/mL의 암피실린을 함유하는 용원성 액체배지 (LB) 아가 플레이트에서 성장시켰다. LB 플레이트를 수거하여 400 mL의 2xYT 배지에 접종했다. 그 후, 세포 배양물의 600 nm에서의 흡광도가 0.8에 도달할 때까지 200 rpm으로 진탕하면서 배양물을 37℃에서 성장시켰다. 이어서, 0.5 mM 이소프로필-D-티오갈락토사이드 (IPTG)를 배지에 첨가하고 상기 배양물을 200 rpm으로 진탕시키면서 25℃에서 밤새 성장시켰다. 다음날, 원심분리 (4000 rpm, 15분)를 통해 세포를 수거하고, 생성된 펠릿들을 -80℃에서 30분 동안 냉동시켰다.
세포들을 재현탁시키고 40 mL의 용해 완충액 (10 mM 이미다졸, 1 mM MgCl2가 보충된, 50 mM 트리스-HCl (pH 7.5), 150 mM NaCl 및 0.02% DDM)에 0.2mg/mL의 라이소자임 및 10 ㎕의 DNaseI과 함께 30분 동안 혼합했다. 상기 용해물을 2분 동안 초음파 처리하고 (40% 출력 전력) 4℃에서 15분(4000 rpm) 동안 원심분리하여 가라앉혔다. 다음으로, 상청액을 150 ㎕의 세척된 Ni-NTA 비드와 함께 20 rpm에서 15분 동안 항온배양했다. Ni-NTA 비드를 중력 흐름 컬럼에 로딩하고 세척* 완충액 ([50 mM 트리스-HCl (pH 7.5), 150 mM NaCl, 10 mM 이미다졸 및 0.02% DDM)]으로 세척했다. 단백질들은 150 ㎕의 용출 완충액* ([50 mM 트리스-HCl (pH 7.5), 150 mM NaCl, 300 mM 이미다졸 및 0.02% DDM)]을 사용하여 3단계 용출 단계로 용출시켰다. 리세닌 단량체를 4℃에서 보관하였다.
리세닌은 1:10 단백질:리포솜 비율의 리포솜 (1:1 스핑고미엘린:DPPHPC 지질 조성)과 함께 37℃에서 1시간 동안 항온배양하여 올리고머화할 수 있다. 그런 다음, 0.6% LDAO를 첨가하여 리포솜을 파괴한다. 상기 용액을 세척 완충액을 사용하여 20배 희석하고 세척된 Ni-NTA 비드 150 μl와 혼합한다. 이어서, 상기 용액을 중력 흐름 컬럼에 로딩하고 세척 완충액으로 세척한다. 올리고머는 150 ㎕의 분획 중 pH 7.5로 완충된 1M 이미다졸, 150 mM NaCl 및 15 mM 트리스를 함유하는 용출 완충액에 의해 용출시킨다. 올리고머는 4℃에서 보관하였다.
도 21은 야생형 Lys (패널 A) 또는 Lys-E76F (패널 B)를 포함하는 분석 시스템의 트랜스 구획 (최종 농도 1.25 ng/μl)에 Lys-C 소화된 라이소자임 0.5 ㎍을 첨가하여 얻은 결과를 나타낸 것이다. 내강에 방향족 잔기를 도입하면 더 큰 펩타이드들에 대한 명확한 펩타이드 클러스터를 유도할 수 있다.
참고문헌
SEQUENCE LISTING
<110> Rijksuniversiteit te Groningen
<120> Nanopore proteomics.
<130> P128791PC00
<140> PCT/NL2022/050266
<141> 2022-05-18
<150> EP 21174437.0
<151> 2021-05-18
<160> 100
<170> PatentIn version 3.5
<210> 1
<211> 179
<212> PRT
<213> Actinia fragacea
<400> 1
Ser Ala Asp Val Ala Gly Ala Val Ile Asp Gly Ala Gly Leu Gly Phe
1 5 10 15
Asp Val Leu Lys Thr Val Leu Glu Ala Leu Gly Asn Val Lys Arg Lys
20 25 30
Ile Ala Val Gly Ile Asp Asn Glu Ser Gly Lys Thr Trp Thr Ala Met
35 40 45
Asn Thr Tyr Phe Arg Ser Gly Thr Ser Asp Ile Val Leu Pro His Lys
50 55 60
Val Ala His Gly Lys Ala Leu Leu Tyr Asn Gly Gln Lys Asn Arg Gly
65 70 75 80
Pro Val Ala Thr Gly Val Val Gly Val Ile Ala Tyr Ser Met Ser Asp
85 90 95
Gly Asn Thr Leu Ala Val Leu Phe Ser Val Pro Tyr Asp Tyr Asn Trp
100 105 110
Tyr Ser Asn Trp Trp Asn Val Arg Val Tyr Lys Gly Gln Lys Arg Ala
115 120 125
Asp Gln Arg Met Tyr Glu Glu Leu Tyr Tyr His Arg Ser Pro Phe Arg
130 135 140
Gly Asp Asn Gly Trp His Ser Arg Gly Leu Gly Tyr Gly Leu Lys Ser
145 150 155 160
Arg Gly Phe Met Asn Ser Ser Gly His Ala Ile Leu Glu Ile His Val
165 170 175
Thr Lys Ala
<210> 2
<211> 20
<212> PRT
<213> Actinia fragacea
<400> 2
Ser Ala Glu Val Ala Gly Ala Val Ile Glu Gly Ala Lys Leu Thr Phe
1 5 10 15
Asn Val Leu Gln
20
<210> 3
<211> 167
<212> PRT
<213> Actinia fragacea
<400> 3
Ser Leu Thr Phe Asp Val Leu Gln Thr Val Leu Lys Ala Leu Gly Asp
1 5 10 15
Val Ser Arg Lys Ile Ala Val Gly Ile Asp Asn Glu Pro Gly Met Thr
20 25 30
Trp Thr Ala Met Asn Thr Tyr Phe Arg Ser Gly Thr Ser Asp Val Ile
35 40 45
Leu Pro His Thr Val Pro His Ser Lys Ala Leu Leu Tyr Asp Gly Gln
50 55 60
Lys Asn Arg Gly Pro Val Thr Thr Gly Val Val Gly Val Ile Ala Tyr
65 70 75 80
Ala Met Ser Asp Gly Asn Thr Leu Ala Val Leu Phe Ser Ile Pro Phe
85 90 95
Asp Tyr Asn Leu Tyr Ser Asn Trp Trp Asn Val Lys Val Tyr Lys Gly
100 105 110
His Arg Arg Ala Asp Gln Ala Met Tyr Glu Glu Leu Tyr Tyr Asp Phe
115 120 125
Ser Pro Phe Arg Gly Asp Asn Gly Trp His Thr Lys Ser Ile Gly Tyr
130 135 140
Gly Leu Lys Gly Arg Gly Phe Met Asn Ser Ser Gly Lys Ala Ile Leu
145 150 155 160
Gln Ile His Val Asn Lys Val
165
<210> 4
<211> 20
<212> PRT
<213> Actinia fragacea
<400> 4
Ser Val Ala Val Ala Gly Ala Val Ile Lys Gly Ala Ala Leu Thr Phe
1 5 10 15
Asn Ile Leu Gln
20
<210> 5
<211> 168
<212> PRT
<213> Actinia fragacea
<400> 5
Ala Gly Leu Gly Phe Asp Val Leu Lys Thr Val Leu Glu Ala Leu Gly
1 5 10 15
Asn Val Lys Arg Lys Ile Ala Val Gly Ile Asp Asn Glu Ser Gly Arg
20 25 30
Thr Trp Thr Ala Met Asn Thr Tyr Phe Arg Ser Gly Thr Ser Asp Ile
35 40 45
Val Leu Pro His Lys Val Ala His Gly Lys Ala Leu Leu Tyr Asn Gly
50 55 60
Gln Lys Asn Arg Gly Pro Val Ala Thr Gly Val Val Gly Val Ile Ala
65 70 75 80
Tyr Ser Met Ser Asp Gly Asn Thr Leu Ala Val Leu Phe Ser Val Pro
85 90 95
Tyr Asp Tyr Asn Trp Tyr Ser Asn Trp Trp Asn Val Arg Val Tyr Lys
100 105 110
Gly Gln Lys Arg Ala Asn Gln Arg Met Tyr Glu Glu Leu Tyr Tyr His
115 120 125
Arg Ser Pro Phe Arg Gly Asp Asn Gly Trp His Ser Arg Ser Leu Gly
130 135 140
Tyr Gly Leu Lys Ser Arg Gly Phe Met Asn Ser Ser Gly His Ala Ile
145 150 155 160
Leu Glu Ile His Val Thr Lys Ala
165
<210> 6
<211> 179
<212> PRT
<213> Actinia equina
<400> 6
Ser Ala Asp Val Ala Gly Ala Val Ile Asp Gly Ala Ser Leu Ser Phe
1 5 10 15
Asp Ile Leu Lys Thr Val Leu Glu Ala Leu Gly Asn Val Lys Arg Lys
20 25 30
Ile Ala Val Gly Val Asp Asn Glu Ser Gly Lys Thr Trp Thr Ala Leu
35 40 45
Asn Thr Tyr Phe Arg Ser Gly Thr Ser Asp Ile Val Leu Pro His Lys
50 55 60
Val Pro His Gly Lys Ala Leu Leu Tyr Asn Gly Gln Lys Asp Arg Gly
65 70 75 80
Pro Val Ala Thr Gly Ala Val Gly Val Leu Ala Tyr Leu Met Ser Asp
85 90 95
Gly Asn Thr Leu Ala Val Leu Phe Ser Val Pro Tyr Asp Tyr Asn Trp
100 105 110
Tyr Ser Asn Trp Trp Asn Val Arg Ile Tyr Lys Gly Lys Arg Arg Ala
115 120 125
Asp Gln Arg Met Tyr Glu Glu Leu Tyr Tyr Asn Leu Ser Pro Phe Arg
130 135 140
Gly Asp Asn Gly Trp His Thr Arg Asn Leu Gly Tyr Gly Leu Lys Ser
145 150 155 160
Arg Gly Phe Met Asn Ser Ser Gly His Ala Ile Leu Glu Ile His Val
165 170 175
Ser Lys Ala
<210> 7
<211> 179
<212> PRT
<213> Actinia equina
<400> 7
Ser Val Ala Val Ala Gly Ala Ile Ile Lys Gly Ala Ala Leu Thr Phe
1 5 10 15
Asn Val Leu Gln Thr Val Leu Lys Ala Leu Gly Asp Ile Ser Arg Lys
20 25 30
Ile Ala Val Gly Val Asp Asn Glu Ser Gly Lys Thr Trp Thr Ala Leu
35 40 45
Asn Thr Tyr Phe Arg Ser Gly Thr Ser Asp Ile Val Leu Pro His Lys
50 55 60
Val Pro His Gly Lys Ala Leu Leu Tyr Asn Gly Gln Lys Asp Arg Gly
65 70 75 80
Pro Val Ala Thr Gly Ala Val Gly Val Leu Ala Tyr Ala Met Ser Asp
85 90 95
Gly Asn Thr Leu Ala Val Leu Phe Ser Val Pro Tyr Asp Tyr Asn Trp
100 105 110
Tyr Ser Asn Trp Trp Asn Val Arg Ile Phe Lys Gly Arg Arg Arg Ala
115 120 125
Asp Gln Arg Met Tyr Glu Gln Leu Tyr Tyr Tyr Leu Ser Pro Phe Arg
130 135 140
Gly Asp Asn Gly Trp His Glu Arg His Leu Gly Tyr Gly Leu Lys Ser
145 150 155 160
Arg Gly Phe Met Asn Ser Gly Gly Gln Ala Ile Leu Glu Ile His Val
165 170 175
Thr Lys Ala
<210> 8
<211> 179
<212> PRT
<213> Actinia equina
<400> 8
Ser Val Ala Val Ala Gly Ala Val Ile Glu Gly Ala Thr Leu Thr Phe
1 5 10 15
Asn Val Leu Gln Thr Val Leu Lys Ala Leu Gly Asp Ile Ser Arg Lys
20 25 30
Ile Ala Val Gly Ile Asp Asn Glu Ser Gly Met Thr Trp Thr Ala Met
35 40 45
Asn Thr Tyr Phe Arg Ser Gly Thr Ser Asp Val Ile Leu Pro His Thr
50 55 60
Val Pro His Gly Lys Ala Leu Leu Tyr Asn Gly Gln Lys Asp Arg Gly
65 70 75 80
Pro Val Ala Thr Gly Val Val Gly Val Leu Ala Tyr Ala Met Ser Asp
85 90 95
Gly Asn Thr Leu Ala Val Leu Phe Ser Ile Pro Phe Asp Tyr Asn Leu
100 105 110
Tyr Ser Asn Trp Trp Asn Val Lys Val Tyr Lys Gly His Arg Arg Ala
115 120 125
Asp Gln Arg Met Tyr Glu Glu Leu Tyr Tyr Asn Leu Ser Pro Phe Arg
130 135 140
Gly Asp Asn Gly Trp His Asn Arg Asp Leu Gly Tyr Gly Leu Lys Gly
145 150 155 160
Arg Gly Phe Met Asn Ser Ser Gly Gln Ser Ile Leu Glu Ile His Val
165 170 175
Thr Lys Ala
<210> 9
<211> 179
<212> PRT
<213> Urticina crassicornis
<400> 9
Ser Val Ala Ile Ala Gly Ala Val Ile Glu Gly Ala Lys Leu Thr Phe
1 5 10 15
Gly Ile Leu Glu Lys Ile Leu Thr Val Leu Gly Asp Ile Asn Arg Lys
20 25 30
Ile Ala Ile Gly Val Asp Asn Glu Ser Gly Arg Glu Trp Thr Ala Gln
35 40 45
Asn Ala Tyr Phe Phe Ser Gly Thr Ser Asp Val Val Leu Pro Ala Ser
50 55 60
Val Pro Asn Thr Lys Ala Phe Leu Tyr Asn Ala Gln Lys Asp Arg Gly
65 70 75 80
Pro Val Ala Thr Gly Val Val Gly Val Leu Ala Tyr Ser Leu Ser Asn
85 90 95
Gly Asn Thr Leu Gly Ile Leu Phe Ser Val Pro Tyr Asp Tyr Asn Leu
100 105 110
Tyr Ser Asn Trp Trp Asn Ile Lys Leu Tyr Lys Gly Ile Lys Arg Ala
115 120 125
Asp Arg Asp Met Tyr Asn Asp Leu Tyr Tyr Tyr Ala His Pro His Lys
130 135 140
Gly Asp Asn Gly Trp His Glu Asn Ser Leu Gly Phe Gly Leu Lys Ser
145 150 155 160
Lys Gly Phe Met Thr Ser Ser Gly Gln Thr Ile Leu Gln Ile Arg Val
165 170 175
Ser Arg Ala
<210> 10
<211> 173
<212> PRT
<213> Oulactis orientalis
<400> 10
Gly Ala Ile Ile Ala Gly Ala Ala Leu Gly Phe Asn Val His Gln Thr
1 5 10 15
Val Leu Lys Ala Leu Gly Gln Val Ser Arg Lys Ile Ala Ile Gly Val
20 25 30
Asp Asn Glu Ser Gly Gly Thr Trp Thr Ala Leu Asn Ala Tyr Phe Arg
35 40 45
Ser Gly Thr Thr Asp Val Ile Leu Pro Glu Phe Val Pro Asn Gln Lys
50 55 60
Ala Leu Leu Tyr Ser Gly Gln Lys Asp Thr Gly Pro Val Ala Thr Gly
65 70 75 80
Ala Val Gly Val Leu Ala Tyr Tyr Met Ser Asp Gly Asn Thr Leu Gly
85 90 95
Val Met Phe Ser Val Pro Phe Asp Tyr Asn Leu Tyr Ser Asn Trp Trp
100 105 110
Asp Val Lys Val Tyr Arg Gly Arg Arg Arg Ala Asp Gln Ala Met Tyr
115 120 125
Glu Gly Leu Leu Tyr Gly Ile Pro Tyr Gly Gly Asp Asn Gly Trp His
130 135 140
Ala Arg Lys Leu Gly Tyr Gly Leu Lys Gly Arg Gly Phe Met Lys Ser
145 150 155 160
Ser Ala Gln Ser Ile Leu Glu Ile His Val Thr Lys Ala
165 170
<210> 11
<211> 165
<212> PRT
<213> Oulactis orientalis
<400> 11
Ala Thr Phe Arg Val Leu Ala Lys Val Leu Ala Glu Leu Gly Lys Val
1 5 10 15
Ser Arg Lys Ile Ala Val Gly Val Asp Asn Glu Ser Gly Gly Ser Trp
20 25 30
Thr Ala Leu Asn Ala Tyr Phe Arg Ser Gly Thr Thr Asp Val Ile Leu
35 40 45
Pro Asp Leu Val Pro Asn Gln Lys Ala Leu Leu Tyr Arg Gly Gly Lys
50 55 60
Asp Thr Gly Pro Val Ala Thr Gly Val Val Gly Val Leu Ala Tyr Ala
65 70 75 80
Met Ser Asp Gly Asn Thr Leu Ala Ile Leu Phe Ser Val Pro Tyr Asp
85 90 95
Tyr Asn Leu Tyr Ser Asn Trp Trp Asn Val Lys Val Tyr Ser Gly Lys
100 105 110
Arg Arg Ala Asp Gln Gly Met Ser Glu Asp Leu Ser Tyr Gly Asn Pro
115 120 125
Tyr Gly Gly Asp Asn Gly Trp His Ala Arg Lys Leu Ala Tyr Gly Leu
130 135 140
Lys Glu Arg Gly Phe Met Lys Ser Ser Ala Gln Ser Ile Leu Glu Ile
145 150 155 160
His Ala Thr Lys Ala
165
<210> 12
<211> 177
<212> PRT
<213> Stichodactyla gigantea
<400> 12
Ala Ser Ala Val Ala Gly Thr Ile Ile Glu Gly Ala Ser Leu Thr Phe
1 5 10 15
Gln Ile Leu Asp Lys Val Leu Thr Glu Leu Gly Asn Val Ser Arg Lys
20 25 30
Ile Ala Ile Gly Ile Asp Asn Glu Ser Gly Gly Ser Trp Thr Ala Met
35 40 45
Asn Ala Tyr Phe Arg Ser Gly Thr Thr Asp Val Ile Leu Pro Glu Phe
50 55 60
Val Pro Asn Asn Lys Ala Leu Leu Tyr Ser Gly Arg Lys Asp Thr Gly
65 70 75 80
Pro Val Thr Thr Gly Ala Val Gly Ala Leu Ala Tyr Tyr Met Ser Asp
85 90 95
Gly Asn Thr Leu Ala Val Met Phe Ser Val Pro Phe Asp Tyr Asn Leu
100 105 110
Tyr Ser Asn Trp Trp Asp Val Arg Val Tyr Ser Gly Lys Arg Arg Ala
115 120 125
Asp Gln Lys Met Tyr Glu Asp Leu Tyr Asn Gly Ser Pro Phe Lys Gly
130 135 140
Asp Asn Gly Trp His Gln Lys Asn Leu Gly Tyr Gly Leu Arg Met Lys
145 150 155 160
Gly Ile Met Thr Ser Ala Gly Glu Ala Lys Leu Gln Ile Lys Ile Ser
165 170 175
Arg
<210> 13
<211> 177
<212> PRT
<213> Heteractis magnifica
<400> 13
Ser Ala Ala Leu Ala Gly Thr Ile Ile Glu Gly Ala Ser Leu Gly Phe
1 5 10 15
Gln Ile Leu Asp Lys Val Leu Gly Glu Leu Gly Lys Val Ser Arg Lys
20 25 30
Ile Ala Val Gly Val Asp Asn Glu Ser Gly Gly Ser Trp Thr Ala Leu
35 40 45
Asn Ala Tyr Phe Arg Ser Gly Thr Thr Asp Val Ile Leu Pro Glu Phe
50 55 60
Val Pro Asn Gln Lys Ala Leu Leu Tyr Ser Gly Arg Lys Asp Thr Gly
65 70 75 80
Pro Val Ala Thr Gly Ala Val Ala Ala Phe Ala Tyr Tyr Met Ser Asn
85 90 95
Gly His Thr Leu Gly Val Met Phe Ser Val Pro Phe Asp Tyr Asn Phe
100 105 110
Tyr Ser Asn Trp Trp Asp Val Lys Val Tyr Ser Gly Lys Arg Arg Ala
115 120 125
Asp Gln Gly Met Tyr Glu Asp Met Tyr Tyr Gly Asn Pro Tyr Arg Gly
130 135 140
Asp Asn Gly Trp His Gln Lys Asn Leu Gly Tyr Gly Leu Arg Met Lys
145 150 155 160
Gly Ile Met Thr Ser Ala Gly Glu Ala Ile Leu Gln Ile Arg Ile Ser
165 170 175
Arg
<210> 14
<211> 179
<212> PRT
<213> Anthopleura asiatica
<400> 14
Ser Leu Ala Val Ala Gly Ala Val Ile Glu Gly Gly Asn Leu Val Met
1 5 10 15
Ser Val Leu Asp Arg Ile Leu Glu Ala Ile Gly Asp Val Asn Arg Lys
20 25 30
Ile Ala Ile Gly Val Glu Asn Gln Ser Gly Lys Ser Trp Thr Ala Met
35 40 45
Asn Thr Tyr Phe Arg Ser Gly Thr Ser Asp Val Val Leu Pro His Ser
50 55 60
Val Pro Ser Gly Lys Ala Leu Leu Tyr Asp Gly Gln Lys Thr Arg Gly
65 70 75 80
Pro Val Ala Thr Gly Val Val Gly Val Phe Ala Tyr Ala Met Ser Asp
85 90 95
Gly Asn Thr Leu Ala Val Met Phe Ser Ile Pro Tyr Asp Tyr Asn Leu
100 105 110
Tyr Ser Asn Trp Trp Asn Val Lys Thr Tyr Ser Gly Met Lys Arg Ala
115 120 125
Asp Gln Ser Met Tyr Glu Asp Leu Tyr Tyr His Ala Ser Pro Phe Lys
130 135 140
Gly Asp Asn Gly Trp His Ser Arg Asn Leu Gly Tyr Gly Leu Lys Cys
145 150 155 160
Arg Gly Phe Met Asn Ser Ser Gly Ala Ala Lys Leu Glu Ile His Val
165 170 175
Ser Arg Ala
<210> 15
<211> 201
<212> PRT
<213> Cribrinopsis japonica
<400> 15
Leu Pro Met Lys Glu Asp Ile Ser Asn Glu Glu Arg Pro Thr Ser Val
1 5 10 15
Asn Glu Lys Pro Val Lys Lys Ser Val Ala Val Ala Gly Ala Val Ile
20 25 30
Gln Gly Ala Ala Leu Ala Phe Gln Val Leu Asp Lys Ile Leu Thr Ser
35 40 45
Leu Gly Gly Ile Gly Arg Lys Ile Ala Ile Gly Val Asp Asn Glu Ser
50 55 60
Gly Met Lys Trp Ala Ala Arg Asn Val Tyr Phe Tyr Ser Gly Thr Ser
65 70 75 80
Asp Thr Val Leu Pro Tyr Ser Val Pro His Ser Lys Ala Phe Leu Tyr
85 90 95
Gly Ala Arg Lys Thr Arg Gly Ser Val Arg Gly Ala Val Gly Val Leu
100 105 110
Ala Tyr Ser Met Ser Asp Gly Asn Thr Leu Gly Ile Leu Phe Ser Val
115 120 125
Pro Tyr Asp Tyr Asn Trp Tyr Ser Asn Trp Trp Asn Ile Lys Val Tyr
130 135 140
Arg Gly Tyr Lys Arg Ala Asn Lys Trp Met Tyr His Asp Leu Tyr Tyr
145 150 155 160
Tyr Ala Arg Pro His Lys Gly Asn Asn Glu Trp His Glu Lys Ser Leu
165 170 175
Gly Tyr Gly Leu Lys Ser Lys Gly Phe Met Thr Ser Ser Gly Gln Thr
180 185 190
Lys Leu Glu Ile Arg Val Ser Arg Ala
195 200
<210> 16
<211> 202
<212> PRT
<213> Cribrinopsis japonica
<400> 16
Leu Pro Met Lys Glu Asp Ile Ser Asn Asp Glu Arg Pro Ile Ser Val
1 5 10 15
Asn Glu Glu Pro Val Lys Lys Asn Ala Ala Val Ala Gly Ala Val Ile
20 25 30
Gln Gly Ala Thr Leu Thr Phe Gln Val Leu Asp Arg Ile Leu Thr Val
35 40 45
Leu Gly Asp Ile Ser Arg Lys Ile Ala Ile Gly Val Asp Asn Glu Ser
50 55 60
Gly Arg Lys Trp Thr Ala Lys Asn Ala Tyr Phe Phe Ser Gly Thr Ser
65 70 75 80
Asp Val Val Leu Pro Tyr Ser Val Pro Asn Gly Lys Ala Phe Leu Tyr
85 90 95
Asp Gly Lys Lys Thr Arg Gly Pro Val Ala Thr Gly Ala Val Gly Val
100 105 110
Leu Ala Tyr Ser Met Ser Asp Gly Asn Thr Leu Gly Ile Leu Phe Ser
115 120 125
Val Pro Tyr Asp Tyr Asn Trp Tyr Glu Asn Trp Trp Asn Ile Lys Val
130 135 140
Tyr Ser Gly Ser Lys Arg Ala Asn Lys Trp Met Tyr Glu Asn Leu Tyr
145 150 155 160
Tyr Asn Ala Ser Pro His Lys Gly Asp Asn Gly Trp His Glu Lys Ser
165 170 175
Leu Gly Tyr Gly Leu Lys Ser Arg Gly Tyr Met Ala Ser Ser Gly Gln
180 185 190
Thr Lys Leu Glu Ile Arg Val Thr Arg Ala
195 200
<210> 17
<211> 176
<212> PRT
<213> Stichodactyla helianthus
<400> 17
Ser Glu Leu Ala Gly Thr Ile Ile Asp Gly Ala Ser Leu Thr Phe Glu
1 5 10 15
Val Leu Asp Lys Val Leu Gly Glu Leu Gly Lys Val Ser Arg Lys Ile
20 25 30
Ala Val Gly Ile Asp Asn Glu Ser Gly Gly Thr Trp Thr Ala Leu Asn
35 40 45
Ala Tyr Phe Arg Ser Gly Thr Thr Asp Val Ile Leu Pro Glu Val Val
50 55 60
Pro Asn Thr Lys Ala Leu Leu Tyr Ser Gly Arg Lys Ser Ser Gly Pro
65 70 75 80
Val Ala Thr Gly Ala Val Ala Ala Phe Ala Tyr Tyr Met Ser Asn Gly
85 90 95
Asn Thr Leu Gly Val Met Phe Ser Val Pro Phe Asp Tyr Asn Trp Tyr
100 105 110
Ser Asn Trp Trp Asp Val Lys Ile Tyr Pro Gly Lys Arg Arg Ala Asp
115 120 125
Gln Gly Met Tyr Glu Asp Met Tyr Tyr Gly Asn Pro Tyr Arg Gly Asp
130 135 140
Asn Gly Trp Tyr Gln Lys Asn Leu Gly Tyr Gly Leu Arg Met Lys Gly
145 150 155 160
Ile Met Thr Ser Ala Gly Glu Ala Lys Met Gln Ile Lys Ile Ser Arg
165 170 175
<210> 18
<211> 175
<212> PRT
<213> Stichodactyla helianthus
<400> 18
Ala Leu Ala Gly Thr Ile Ile Ala Gly Ala Ser Leu Thr Phe Gln Val
1 5 10 15
Leu Asp Lys Val Leu Glu Glu Leu Gly Lys Val Ser Arg Lys Ile Ala
20 25 30
Val Gly Ile Asp Asn Glu Ser Gly Gly Thr Trp Thr Ala Leu Asn Ala
35 40 45
Tyr Phe Arg Ser Gly Thr Thr Asp Val Ile Leu Pro Glu Phe Val Pro
50 55 60
Asn Thr Lys Ala Leu Leu Tyr Ser Gly Arg Lys Asp Thr Gly Pro Val
65 70 75 80
Ala Thr Gly Ala Val Ala Ala Phe Ala Tyr Tyr Met Ser Ser Gly Asn
85 90 95
Thr Leu Gly Val Met Phe Ser Val Pro Phe Asp Tyr Asn Trp Tyr Ser
100 105 110
Asn Trp Trp Asp Val Lys Ile Tyr Ser Gly Lys Arg Arg Ala Asp Gln
115 120 125
Gly Met Tyr Glu Asp Leu Tyr Tyr Gly Asn Pro Tyr Arg Gly Asp Asn
130 135 140
Gly Trp His Glu Lys Asn Leu Gly Tyr Gly Leu Arg Met Lys Gly Ile
145 150 155 160
Met Thr Ser Ala Gly Glu Ala Lys Met Gln Ile Lys Ile Ser Arg
165 170 175
<210> 19
<211> 175
<212> PRT
<213> Heteractis crispa
<400> 19
Ala Leu Ala Gly Ala Ile Ile Ala Gly Ala Ser Leu Thr Phe Gln Ile
1 5 10 15
Leu Asp Lys Val Leu Ala Glu Leu Gly Gln Val Ser Arg Lys Ile Ala
20 25 30
Ile Gly Ile Asp Asn Glu Ser Gly Gly Ser Trp Thr Ala Met Asn Ala
35 40 45
Tyr Phe Arg Ser Gly Thr Thr Asp Val Ile Leu Pro Glu Phe Val Pro
50 55 60
Asn Gln Lys Ala Leu Leu Tyr Ser Gly Arg Lys Asn Arg Gly Pro Asp
65 70 75 80
Thr Thr Gly Ala Val Gly Ala Leu Ala Tyr Tyr Met Ser Asn Gly Asn
85 90 95
Thr Leu Gly Val Met Phe Ser Val Pro Phe Asp Tyr Asn Leu Tyr Ser
100 105 110
Asn Trp Trp Asp Val Lys Val Tyr Ser Gly Lys Arg Arg Ala Asp Gln
115 120 125
Ala Met Tyr Glu Asp Leu Tyr Tyr Ser Asn Pro Tyr Arg Gly Asp Asn
130 135 140
Gly Trp His Gln Lys Asn Leu Gly Tyr Gly Leu Lys Met Lys Gly Ile
145 150 155 160
Met Thr Ser Ala Gly Glu Ala Ile Met Glu Ile Arg Ile Ser Arg
165 170 175
<210> 20
<211> 177
<212> PRT
<213> Heteractis crispa
<400> 20
Ser Ala Ala Leu Ala Gly Thr Ile Thr Leu Gly Ala Ser Leu Gly Phe
1 5 10 15
Gln Ile Leu Asp Lys Val Leu Gly Glu Leu Gly Lys Val Ser Arg Lys
20 25 30
Ile Ala Val Gly Val Asp Asn Glu Ser Gly Gly Ser Trp Thr Ala Leu
35 40 45
Asn Ala Tyr Phe Arg Ser Gly Thr Thr Asp Val Ile Leu Pro Glu Phe
50 55 60
Val Pro Asn Gln Lys Ala Leu Leu Tyr Ser Gly Arg Lys Asp Thr Gly
65 70 75 80
Pro Val Ala Thr Gly Ala Val Ala Ala Phe Ala Tyr Tyr Met Ser Asn
85 90 95
Gly His Thr Leu Gly Val Met Phe Ser Val Pro Phe Asp Tyr Asn Leu
100 105 110
Tyr Ser Asn Trp Trp Asp Val Lys Ile Tyr Ser Gly Lys Arg Arg Ala
115 120 125
Asp Gln Ala Met Tyr Glu Asp Met Tyr Tyr Gly Asn Pro Tyr Arg Gly
130 135 140
Asp Asn Gly Trp His Gln Lys Asn Leu Gly Tyr Gly Leu Lys Met Lys
145 150 155 160
Gly Ile Met Thr Ser Ala Val Glu Ala Ile Leu Glu Ile Arg Ile Ser
165 170 175
Arg
<210> 21
<211> 178
<212> PRT
<213> Sagartia rosea
<400> 21
Lys Ile Ser Gly Gly Thr Val Ile Ala Ala Gly Arg Leu Thr Leu Asp
1 5 10 15
Leu Leu Lys Thr Leu Leu Gly Thr Leu Gly Ser Ile Ser Arg Lys Ile
20 25 30
Ala Ile Gly Val Asp Asn Glu Thr Gly Gly Leu Ile Thr Gly Asn Asn
35 40 45
Val Tyr Phe Arg Ser Gly Thr Ser Asp Asp Ile Leu Pro His Arg Val
50 55 60
Glu Thr Gly Glu Ala Leu Leu Tyr Thr Ala Arg Lys Thr Lys Gly Pro
65 70 75 80
Val Ala Thr Gly Ala Val Gly Val Phe Thr Tyr Tyr Leu Ser Asp Gly
85 90 95
Asn Thr Leu Ala Val Leu Phe Ser Val Pro Phe Asp Tyr Asn Phe Tyr
100 105 110
Ser Asn Trp Trp Asn Val Lys Ile Tyr Ser Gly Lys Arg Asn Ala Asp
115 120 125
Tyr Asp Met Tyr His Glu Leu Tyr Tyr Asp Ala Asn Pro Phe Glu Gly
130 135 140
Asp Asp Thr Trp Glu Tyr Arg Tyr Leu Gly Tyr Gly Met Arg Met Glu
145 150 155 160
Gly Tyr Met Asn Ser Pro Gly Glu Ala Ile Leu Lys Ile Thr Val Met
165 170 175
Pro Asp
<210> 22
<211> 179
<212> PRT
<213> Actineria villosa
<400> 22
Ser Ala Ala Val Ala Gly Ala Val Ile Ala Gly Gly Glu Leu Ala Leu
1 5 10 15
Lys Ile Leu Thr Lys Ile Leu Asp Glu Ile Gly Lys Ile Asp Arg Lys
20 25 30
Ile Ala Ile Gly Val Asp Asn Glu Ser Gly Leu Lys Trp Thr Ala Leu
35 40 45
Asn Thr Tyr Tyr Lys Ser Gly Ala Ser Asp Val Thr Leu Pro Tyr Glu
50 55 60
Val Glu Asn Ser Lys Ala Leu Leu Tyr Thr Ala Arg Lys Ser Lys Gly
65 70 75 80
Pro Val Ala Arg Gly Ala Val Gly Val Leu Ala Tyr Lys Met Ser Ser
85 90 95
Gly Asn Thr Leu Ala Val Met Phe Ser Val Pro Phe Asp Tyr Asn Leu
100 105 110
Tyr Ser Asn Trp Trp Asn Val Lys Ile Tyr Asp Gly Glu Lys Lys Ala
115 120 125
Asp Glu Lys Met Tyr Asn Glu Leu Tyr Asn Asn Asn Asn Pro Ile Lys
130 135 140
Pro Ser Thr Trp Glu Lys Arg Asp Leu Gly Lys Asp Gly Leu Lys Leu
145 150 155 160
Arg Gly Phe Met Thr Ser Asn Gly Asp Ala Lys Leu Val Ile His Ile
165 170 175
Glu Lys Ser
<210> 23
<211> 179
<212> PRT
<213> Phyllodiscus semoni
<400> 23
Ser Ala Ala Val Ala Gly Ala Val Ile Ala Gly Gly Glu Leu Ala Leu
1 5 10 15
Lys Ile Leu Thr Lys Ile Leu Asp Glu Ile Gly Lys Ile Asp Arg Lys
20 25 30
Ile Ala Ile Gly Val Asp Asn Glu Ser Gly Leu Lys Trp Thr Ala Leu
35 40 45
Asn Thr Tyr Tyr Lys Ser Gly Ala Ser Asp Val Thr Leu Pro Tyr Glu
50 55 60
Val Glu Asn Ser Lys Ala Leu Leu Tyr Thr Ala Arg Lys Ser Lys Gly
65 70 75 80
Pro Val Ala Arg Gly Ala Val Gly Val Leu Ala Tyr Lys Met Ser Ser
85 90 95
Gly Asn Thr Leu Ala Val Met Phe Ser Val Pro Phe Asp Tyr Asn Leu
100 105 110
Tyr Thr Asn Trp Trp Asn Val Lys Ile Tyr Asp Gly Glu Lys Lys Ala
115 120 125
Asp Glu Lys Met Tyr Asn Glu Leu Tyr Asn Asn Asn Asn Pro Ile Lys
130 135 140
Pro Ser Ile Trp Glu Lys Arg Asp Leu Gly Gln Asp Gly Leu Lys Leu
145 150 155 160
Arg Gly Phe Met Thr Ser Asn Gly Asp Ala Lys Leu Val Ile His Ile
165 170 175
Glu Lys Ser
<210> 24
<211> 193
<212> PRT
<213> Anthopleura nigrescens
<400> 24
Leu Pro Leu Glu Glu Lys Glu Asp Glu Lys Asp Glu Lys Arg Ser Leu
1 5 10 15
Glu Val Ala Gly Ala Val Met Glu Gly Ala Asn Leu Gly Met Ser Val
20 25 30
Leu Gln Thr Ile Leu Gln Ala Ile Gly Asp Val Ser Arg Lys Ile Ala
35 40 45
Val Gly Val Asp Asn Glu Ser Gly Arg Ser Trp Thr Ala Gln Asn Ala
50 55 60
Tyr Phe Arg Ser Gly Thr Ser Asp Val Ile Leu Pro His Thr Val Pro
65 70 75 80
Ser Gly Lys Ala Leu Leu Tyr Asp Gly Gln Lys Asn Arg Gly Pro Val
85 90 95
Ala Thr Gly Val Val Gly Val Ile Thr Tyr Thr Met Gly Asp Gly Asn
100 105 110
Thr Leu Ala Val Met Phe Ser Val Pro Tyr Asp Tyr Asn Trp Tyr Ser
115 120 125
Asn Trp Trp Asn Val Lys Ile Tyr His Gly Lys Val Arg Ala Ser Gln
130 135 140
Lys Met Tyr Glu Asp Leu Tyr Tyr Tyr Arg Ser Pro Phe Lys Gly Asp
145 150 155 160
Asn Gly Trp His Glu Arg Asn Leu Gly Tyr Gly Leu Lys Ser Lys Gly
165 170 175
Phe Met Asn Ser Ser Gly Ala Ala Leu Leu Gln Ile Lys Val Met Lys
180 185 190
Ala
<210> 25
<211> 493
<212> PRT
<213> Aeromonas hydrophila
<400> 25
Met Gln Lys Ile Lys Leu Thr Gly Leu Ser Leu Ile Ile Ser Gly Leu
1 5 10 15
Leu Met Ala Gln Ala Gln Ala Ala Glu Pro Val Tyr Pro Asp Gln Leu
20 25 30
Arg Leu Phe Ser Leu Gly Gln Gly Val Cys Gly Asp Lys Tyr Arg Pro
35 40 45
Val Asn Arg Glu Glu Ala Gln Ser Val Lys Ser Asn Ile Val Gly Met
50 55 60
Met Gly Gln Trp Gln Ile Ser Gly Leu Ala Asn Gly Trp Val Ile Met
65 70 75 80
Gly Pro Gly Tyr Asn Gly Glu Ile Lys Pro Gly Thr Ala Ser Asn Thr
85 90 95
Trp Cys Tyr Pro Thr Asn Pro Val Thr Gly Glu Ile Pro Thr Leu Ser
100 105 110
Ala Leu Asp Ile Pro Asp Gly Asp Glu Val Asp Val Gln Trp Arg Leu
115 120 125
Val His Asp Ser Ala Asn Phe Ile Lys Pro Thr Ser Tyr Leu Ala His
130 135 140
Tyr Leu Gly Tyr Ala Trp Val Gly Gly Asn His Ser Gln Tyr Val Gly
145 150 155 160
Glu Asp Met Asp Val Thr Arg Asp Gly Asp Gly Trp Val Ile Arg Gly
165 170 175
Asn Asn Asp Gly Gly Cys Asp Gly Tyr Arg Cys Gly Asp Lys Thr Ala
180 185 190
Ile Lys Val Ser Asn Phe Ala Tyr Asn Leu Asp Pro Asp Ser Phe Lys
195 200 205
His Gly Asp Val Thr Gln Ser Asp Arg Gln Leu Val Lys Thr Val Val
210 215 220
Gly Trp Ala Val Asn Asp Ser Asp Thr Pro Gln Ser Gly Tyr Asp Val
225 230 235 240
Thr Leu Arg Tyr Asp Thr Ala Thr Asn Trp Ser Lys Thr Asn Thr Tyr
245 250 255
Gly Leu Ser Glu Lys Val Thr Thr Lys Asn Lys Phe Lys Trp Pro Leu
260 265 270
Val Gly Glu Thr Glu Leu Ser Ile Glu Ile Ala Ala Asn Gln Ser Trp
275 280 285
Ala Ser Gln Asn Gly Gly Ser Thr Thr Thr Ser Leu Ser Gln Ser Val
290 295 300
Arg Pro Thr Val Pro Ala Arg Ser Lys Ile Pro Val Lys Ile Glu Leu
305 310 315 320
Tyr Lys Ala Asp Ile Ser Tyr Pro Tyr Glu Phe Lys Ala Asp Val Ser
325 330 335
Tyr Asp Leu Thr Leu Ser Gly Phe Leu Arg Trp Gly Gly Asn Ala Trp
340 345 350
Tyr Thr His Pro Asp Asn Arg Pro Asn Trp Asn His Thr Phe Val Ile
355 360 365
Gly Pro Tyr Lys Asp Lys Ala Ser Ser Ile Arg Tyr Gln Trp Asp Lys
370 375 380
Arg Tyr Ile Pro Gly Glu Val Lys Trp Trp Asp Trp Asn Trp Thr Ile
385 390 395 400
Gln Gln Asn Gly Leu Ser Thr Met Gln Asn Asn Leu Ala Arg Val Leu
405 410 415
Arg Pro Val Arg Ala Gly Ile Thr Gly Asp Phe Ser Ala Glu Ser Gln
420 425 430
Phe Ala Gly Asn Ile Glu Ile Gly Ala Pro Val Pro Leu Ala Ala Asp
435 440 445
Ser Lys Val Arg Arg Ala Arg Ser Val Asp Gly Ala Gly Gln Gly Leu
450 455 460
Arg Leu Glu Ile Pro Leu Asp Ala Gln Glu Leu Ser Gly Leu Gly Phe
465 470 475 480
Asn Asn Val Ser Leu Ser Val Thr Pro Ala Ala Asn Gln
485 490
<210> 26
<211> 337
<212> PRT
<213> Bacillus cereus
<400> 26
Met Lys Arg Ser Lys Thr Tyr Leu Lys Cys Leu Ala Leu Ser Ala Val
1 5 10 15
Phe Ala Ser Ser Ala Leu Ala Leu Ser Thr Pro Ala Ala Tyr Ala Gln
20 25 30
Thr Thr Ser Gln Val Val Thr Asp Ile Gly Gln Asn Ala Lys Thr His
35 40 45
Thr Ser Tyr Asn Thr Phe Asn Asn Asp Gln Thr Asp Asn Met Thr Met
50 55 60
Ser Leu Lys Val Thr Phe Ile Asp Asp Pro Ser Ala Asp Lys Gln Ile
65 70 75 80
Ala Val Ile Asn Thr Thr Gly Ser Phe Leu Lys Ala Asn Pro Thr Ile
85 90 95
Ser Ser Ala Pro Ile Asp Asn Tyr Pro Ile Pro Gly Ala Ser Ala Thr
100 105 110
Leu Arg Tyr Pro Ser Gln Tyr Asp Ile Ala Phe Asn Leu Gln Asp Asn
115 120 125
Ser Ala Arg Phe Phe Asn Val Ala Pro Thr Asn Ala Val Glu Glu Thr
130 135 140
Thr Val Thr Ser Ser Val Ser Tyr Gln Leu Gly Gly Ser Val Lys Ala
145 150 155 160
Ser Ala Thr Pro Asn Gly Leu Ser Ala Glu Ala Gly Ala Thr Gly Gln
165 170 175
Val Thr Trp Ser Asp Ser Val Ser Tyr Lys Gln Thr Ser Tyr Lys Thr
180 185 190
Asn Leu Ile Asp Gln Thr Asn Lys Asn Val Lys Trp Asn Val Phe Phe
195 200 205
Asn Gly Tyr Asn Asn Gln Asn Trp Gly Ile Tyr Thr Arg Asp Ser Tyr
210 215 220
His Ser Leu Tyr Gly Asn Gln Leu Phe Met Tyr Ser Arg Thr Tyr Leu
225 230 235 240
Tyr Glu Ser Asp Ala Lys Gly Asn Leu Ile Pro Met Asp Gln Leu Pro
245 250 255
Ala Leu Thr Asn Ser Gly Phe Ser Pro Gly Met Ile Ala Val Val Ile
260 265 270
Ser Glu Lys Asn Thr Asp Gln Ser Asn Leu Gln Val Ala Tyr Thr Lys
275 280 285
His Ala Asp Asp Tyr Gln Leu Arg Pro Gly Phe Thr Phe Gly Thr Ala
290 295 300
Asn Trp Val Gly Asn Asn Val Lys Asp Val Asp Gln Lys Thr Phe Asn
305 310 315 320
Lys Ser Phe Thr Leu Asp Trp Lys Asn Lys Lys Leu Val Glu Lys Asn
325 330 335
Arg
<210> 27
<211> 317
<212> PRT
<213> Staphylococcus aureus
<400> 27
Met Lys Thr Arg Ile Val Ser Ser Val Thr Thr Thr Leu Leu Leu Gly
1 5 10 15
Ser Ile Leu Met Asn Pro Val Ala Gly Ala Ala Asp Ser Asp Ile Asn
20 25 30
Ile Lys Thr Gly Thr Thr Asp Ile Gly Ser Asn Thr Thr Val Lys Thr
35 40 45
Gly Asp Leu Val Thr Tyr Asp Lys Glu Asn Gly Met His Lys Lys Val
50 55 60
Phe Tyr Ser Phe Ile Asp Asp Lys Asn His Asn Lys Lys Leu Leu Val
65 70 75 80
Ile Arg Thr Lys Gly Thr Ile Ala Gly Gln Tyr Arg Val Tyr Ser Glu
85 90 95
Glu Gly Ala Asn Lys Ser Gly Leu Ala Trp Pro Ser Ala Phe Lys Val
100 105 110
Gln Leu Gln Leu Pro Asp Asn Glu Val Ala Gln Ile Ser Asp Tyr Tyr
115 120 125
Pro Arg Asn Ser Ile Asp Thr Lys Glu Tyr Met Ser Thr Leu Thr Tyr
130 135 140
Gly Phe Asn Gly Asn Val Thr Gly Asp Asp Thr Gly Lys Ile Gly Gly
145 150 155 160
Leu Ile Gly Ala Asn Val Ser Ile Gly His Thr Leu Lys Tyr Val Gln
165 170 175
Pro Asp Phe Lys Thr Ile Leu Glu Ser Pro Thr Asp Lys Lys Val Gly
180 185 190
Trp Lys Val Ile Phe Asn Asn Met Val Asn Gln Asn Trp Gly Pro Tyr
195 200 205
Asp Arg Asp Ser Trp Asn Pro Val Tyr Gly Asn Gln Leu Phe Met Lys
210 215 220
Thr Arg Asn Gly Ser Met Lys Ala Ala Asp Asn Phe Leu Asp Pro Asn
225 230 235 240
Lys Ala Ser Ser Leu Leu Ser Ser Gly Phe Ser Pro Asp Phe Ala Thr
245 250 255
Val Ile Thr Met Asp Arg Lys Ala Ser Lys Gln Gln Thr Asn Ile Asp
260 265 270
Val Ile Tyr Glu Arg Val Arg Asp Asp Tyr Gln Leu His Trp Thr Ser
275 280 285
Thr Asn Trp Lys Gly Thr Asn Thr Lys Asp Lys Trp Thr Asp Arg Ser
290 295 300
Ser Glu Arg Tyr Lys Ile Asp Trp Glu Lys Glu Glu Met
305 310 315
<210> 28
<211> 311
<212> PRT
<213> Staphylococcus aureus
<400> 28
Met Asn Lys Leu Val Lys Ser Ser Val Ala Thr Ser Met Ala Leu Leu
1 5 10 15
Leu Leu Ser Gly Thr Ala Asn Ala Glu Gly Lys Ile Thr Pro Val Ser
20 25 30
Val Lys Lys Val Asp Asp Lys Val Thr Leu Tyr Lys Thr Thr Ala Thr
35 40 45
Ala Asp Ser Asp Lys Phe Lys Ile Ser Gln Ile Leu Thr Phe Asn Phe
50 55 60
Ile Lys Asp Lys Ser Tyr Asp Lys Asp Thr Leu Val Leu Lys Ala Thr
65 70 75 80
Gly Asn Ile Asn Ser Gly Phe Val Lys Pro Asn Pro Asn Asp Tyr Asp
85 90 95
Phe Ser Lys Leu Tyr Trp Gly Ala Lys Tyr Asn Val Ser Ile Ser Ser
100 105 110
Gln Ser Asn Asp Ser Val Asn Val Val Asp Tyr Ala Pro Lys Asn Gln
115 120 125
Asn Glu Glu Phe Gln Val Gln Asn Thr Leu Gly Tyr Thr Phe Gly Gly
130 135 140
Asp Ile Ser Ile Ser Asn Gly Leu Ser Gly Gly Leu Asn Gly Asn Thr
145 150 155 160
Ala Phe Ser Glu Thr Ile Asn Tyr Lys Gln Glu Ser Tyr Arg Thr Thr
165 170 175
Leu Ser Arg Asn Thr Asn Tyr Lys Asn Val Gly Trp Gly Val Glu Ala
180 185 190
His Lys Ile Met Asn Asn Gly Trp Gly Pro Tyr Gly Arg Asp Ser Phe
195 200 205
His Pro Thr Tyr Gly Asn Glu Leu Phe Leu Ala Gly Arg Gln Ser Ser
210 215 220
Ala Tyr Ala Gly Gln Asn Phe Ile Ala Gln His Gln Met Pro Leu Leu
225 230 235 240
Ser Arg Ser Asn Phe Asn Pro Glu Phe Leu Ser Val Leu Ser His Arg
245 250 255
Gln Asp Gly Ala Lys Lys Ser Lys Ile Thr Val Thr Tyr Gln Arg Glu
260 265 270
Met Asp Leu Tyr Gln Ile Arg Trp Asn Gly Phe Tyr Trp Ala Gly Ala
275 280 285
Asn Tyr Lys Asn Phe Lys Thr Arg Thr Phe Lys Ser Thr Tyr Glu Ile
290 295 300
Asp Trp Glu Asn His Lys Val
305 310
<210> 29
<211> 309
<212> PRT
<213> Staphylococcus aureus
<400> 29
Met Asn Lys Leu Val Lys Ser Ser Val Ala Thr Ser Met Ala Leu Leu
1 5 10 15
Leu Leu Ser Gly Thr Ala Asn Ala Glu Gly Lys Ile Thr Pro Val Ser
20 25 30
Val Lys Lys Val Asp Asp Lys Val Thr Leu Tyr Lys Thr Thr Ala Thr
35 40 45
Ala Asp Ser Asp Lys Phe Lys Ile Ser Gln Ile Leu Thr Phe Asn Phe
50 55 60
Ile Lys Asp Lys Ser Tyr Asp Lys Asp Thr Leu Val Leu Lys Ala Thr
65 70 75 80
Gly Asn Ile Asn Ser Gly Phe Val Lys Pro Asn Pro Asn Asp Tyr Asp
85 90 95
Phe Ser Lys Leu Tyr Trp Gly Ala Lys Tyr Asn Val Ser Ile Ser Ser
100 105 110
Gln Ser Asn Asp Ser Val Asn Ala Val Asp Tyr Ala Pro Lys Asn Gln
115 120 125
Asn Glu Glu Phe Gln Val Gln Asn Thr Leu Gly Tyr Thr Phe Gly Gly
130 135 140
Asp Ile Ser Ile Ser Asn Gly Leu Ser Gly Gly Leu Asn Gly Asn Thr
145 150 155 160
Ala Phe Ser Glu Thr Ile Asn Tyr Lys Gln Glu Ser Tyr Arg Thr Leu
165 170 175
Ser Arg Asn Thr Asn Tyr Lys Asn Val Gly Trp Gly Val Glu Ala His
180 185 190
Lys Ile Met Asn Gly Trp Gly Pro Tyr Gly Arg Asp Ser Phe His Pro
195 200 205
Thr Tyr Gly Asn Glu Leu Phe Leu Ala Gly Arg Gln Ser Ser Ala Tyr
210 215 220
Ala Gly Gln Asn Phe Ile Ala Gln His Gln Met Pro Leu Leu Ser Arg
225 230 235 240
Ser Asn Phe Asn Pro Glu Phe Leu Ser Val Leu Ser His Arg Gln Asp
245 250 255
Arg Ala Lys Lys Ser Lys Ile Thr Val Thr Tyr Gln Arg Glu Met Asp
260 265 270
Leu Tyr Gln Ile Arg Trp Asn Gly Phe Tyr Trp Ala Gly Ala Asn Tyr
275 280 285
Lys Asn Phe Lys Thr Arg Thr Phe Lys Ser Thr Tyr Glu Ile Asp Trp
290 295 300
Glu Asn His Lys Val
305
<210> 30
<211> 308
<212> PRT
<213> Staphylococcus aureus
<400> 30
Ile Glu Lys Leu Gly Lys Ser Ser Val Ala Ser Ser Ile Ala Leu Leu
1 5 10 15
Leu Leu Ser Asn Thr Val Asp Ala Ala Gln Asn Ile Thr Pro Lys Arg
20 25 30
Glu Lys Lys Val Asp Asp Lys Ile Thr Leu Tyr Lys Thr Thr Ala Thr
35 40 45
Ser Asp Asn Asp Lys Leu Asn Ile Phe Gln Ile Leu Thr Phe Asn Phe
50 55 60
Ile Lys Asp Lys Ser Tyr Asp Lys Asp Thr Leu Val Leu Lys Ala Ala
65 70 75 80
Gly Asn Ile Asn Ser Gly Tyr Lys Asn Ser Asn Pro Lys Asp Tyr Asn
85 90 95
Tyr Ser Gln Phe Tyr Trp Gly Gly Lys Tyr Asn Val Ser Val Ser Ser
100 105 110
Glu Ser Asn Asp Ala Val Asn Val Val Asp Tyr Ala Pro Lys Asn Gln
115 120 125
Asn Glu Glu Phe Gln Val Gln Gln Thr Leu Gly Tyr Ser Tyr Gly Gly
130 135 140
Asp Ile Asn Ile Ser Asn Gly Leu Ser Gly Gly Leu Asn Gly Ser Lys
145 150 155 160
Ser Phe Ser Glu Thr Ile Asn Tyr Lys Gln Glu Ser Tyr Arg Thr Thr
165 170 175
Ile Asp Arg Lys Thr Asn His Lys Ser Ile Gly Trp Gly Val Glu Ala
180 185 190
His Lys Ile Met Asn Asn Gly Trp Gly Pro Tyr Gly Arg Asp Ser Tyr
195 200 205
Asp Pro Thr Tyr Gly Asn Glu Leu Phe Leu Gly Gly Asp Lys Ser Ser
210 215 220
Ser Asn Ala Gly Gln Asn Phe Leu Pro Thr His Gln Ile Pro Leu Leu
225 230 235 240
Ala Arg Gly Asn Phe Asn Pro Glu Phe Ile Ser Val Leu Ser His Lys
245 250 255
Leu Phe Asp Thr Lys Lys Ser Lys Ile Lys Val Thr Tyr Gln Arg Glu
260 265 270
Met Asp Arg Tyr Thr Asn Gln Trp Asn Arg Ser His Trp Val Gly Asn
275 280 285
Asn Tyr Lys Asn Gln Asn Thr Val Thr Phe Thr Ser Thr Tyr Glu Val
290 295 300
Asp Trp Gln Asn
305
<210> 31
<211> 262
<212> PRT
<213> Staphylococcus aureus
<400> 31
Ile Lys Asn Lys Ile Leu Thr Ala Thr Leu Ala Val Gly Leu Ile Ala
1 5 10 15
Pro Leu Ala Asn Pro Phe Ile Glu Ile Ser Lys Ala Glu Asn Lys Ile
20 25 30
Glu Asp Ile Gly Gln Gly Ala Glu Ile Ile Lys Arg Thr Gln Asp Ile
35 40 45
Thr Ser Lys Arg Leu Ala Ile Thr Gln Asn Ile Gln Phe Asp Phe Val
50 55 60
Lys Asp Lys Lys Tyr Asn Lys Asp Ala Leu Val Val Lys Met Gln Gly
65 70 75 80
Phe Ile Ser Ser Arg Thr Thr Tyr Ser Asp Leu Lys Lys Tyr Pro Tyr
85 90 95
Ile Lys Arg Met Ile Trp Pro Phe Gln Tyr Asn Ile Ser Leu Lys Thr
100 105 110
Lys Asp Ser Asn Val Asp Leu Ile Asn Tyr Leu Pro Lys Asn Lys Ile
115 120 125
Asp Ser Ala Asp Val Ser Gln Lys Leu Gly Tyr Asn Ile Gly Gly Asn
130 135 140
Phe Gln Ser Ala Pro Ser Ile Gly Gly Ser Gly Ser Phe Asn Tyr Ser
145 150 155 160
Lys Thr Ile Ser Tyr Asn Gln Lys Asn Tyr Val Thr Glu Val Glu Ser
165 170 175
Gln Asn Ser Lys Gly Val Lys Trp Gly Val Lys Ala Asn Ser Phe Val
180 185 190
Thr Pro Asn Gly Gln Val Ser Ala Tyr Asp Gln Tyr Leu Phe Ala Gln
195 200 205
Asp Pro Thr Gly Pro Ala Ala Arg Asp Tyr Phe Val Pro Asp Asn Gln
210 215 220
Leu Pro Pro Leu Ile Gln Ser Gly Phe Asn Pro Ser Phe Ile Thr Thr
225 230 235 240
Leu Ser His Glu Arg Gly Lys Gly Asp Lys Ser Glu Phe Glu Ile Thr
245 250 255
Tyr Gly Arg Asn Met Asp
260
<210> 32
<211> 275
<212> PRT
<213> Staphylococcus aureus
<400> 32
Asp Ile Gly Lys Gly Ser Asp Ile Glu Ile Ile Lys Arg Thr Glu Asp
1 5 10 15
Lys Thr Ser Asn Lys Trp Gly Val Thr Gln Asn Ile Gln Phe Asp Phe
20 25 30
Val Lys Asp Thr Lys Tyr Asn Lys Asp Ala Leu Ile Leu Lys Met Gln
35 40 45
Gly Phe Ile Ser Ser Arg Thr Thr Tyr Tyr Asn Tyr Lys Lys Thr Asn
50 55 60
His Val Lys Ala Met Arg Trp Pro Phe Gln Tyr Asn Ile Gly Leu Lys
65 70 75 80
Thr Asn Asp Lys Tyr Val Ser Leu Ile Asn Tyr Leu Pro Lys Asn Lys
85 90 95
Ile Glu Ser Thr Asn Val Ser Gln Thr Leu Gly Tyr Asn Ile Gly Gly
100 105 110
Asn Phe Gln Ser Ala Pro Ser Leu Gly Gly Asn Gly Ser Phe Asn Tyr
115 120 125
Ser Lys Ser Ile Ser Tyr Thr Gln Gln Asn Tyr Val Ser Glu Val Glu
130 135 140
Gln Gln Asn Ser Lys Ser Val Leu Trp Gly Val Lys Ala Asn Ser Phe
145 150 155 160
Ala Thr Glu Ser Gly Gln Lys Ser Ala Phe Asp Ser Asp Leu Phe Val
165 170 175
Gly Tyr Lys Pro His Ser Lys Asp Pro Arg Asp Tyr Phe Val Pro Asp
180 185 190
Ser Glu Leu Pro Pro Leu Val Gln Ser Gly Phe Asn Pro Ser Phe Ile
195 200 205
Ala Thr Val Ser His Glu Lys Gly Ser Ser Asp Thr Ser Glu Phe Glu
210 215 220
Ile Thr Tyr Gly Arg Asn Met Asp Val Thr His Ala Ile Lys Arg Ser
225 230 235 240
Thr His Tyr Gly Asn Ser Tyr Leu Asp Gly His Arg Val His Asn Ala
245 250 255
Phe Val Asn Arg Asn Tyr Thr Val Lys Tyr Glu Val Asn Trp Lys Thr
260 265 270
His Glu Ile
275
<210> 33
<211> 275
<212> PRT
<213> Staphylococcus aureus
<400> 33
Asp Ile Gly Lys Gly Ser Asp Ile Glu Ile Ile Lys Arg Thr Glu Asp
1 5 10 15
Lys Thr Ser Asn Lys Trp Gly Val Thr Gln Asn Ile Gln Phe Asp Phe
20 25 30
Val Lys Asp Lys Lys Tyr Asn Lys Asp Ala Leu Ile Leu Lys Met Gln
35 40 45
Gly Phe Ile Ser Ser Arg Thr Thr Tyr Tyr Asn Tyr Lys Lys Thr Asn
50 55 60
His Val Lys Ala Met Arg Trp Pro Phe Gln Tyr Asn Ile Gly Leu Lys
65 70 75 80
Thr Asn Asp Lys Tyr Val Ser Leu Ile Asn Tyr Leu Pro Lys Asn Lys
85 90 95
Ile Glu Ser Thr Asn Val Ser Gln Ile Leu Gly Tyr Asn Ile Gly Gly
100 105 110
Asn Phe Gln Ser Ala Pro Ser Leu Gly Gly Asn Gly Ser Phe Asn Tyr
115 120 125
Ser Lys Ser Ile Ser Tyr Thr Gln Gln Asn Tyr Val Ser Glu Val Glu
130 135 140
Gln Gln Asn Ser Lys Ser Val Leu Trp Gly Val Lys Ala Asn Ser Phe
145 150 155 160
Ala Thr Glu Ser Gly Gln Lys Ser Ala Phe Asp Ser Asp Leu Phe Val
165 170 175
Gly Tyr Lys Pro His Ser Lys Asp Pro Arg Asp Tyr Phe Val Pro Asp
180 185 190
Ser Glu Leu Pro Pro Leu Val Gln Ser Gly Phe Asn Pro Ser Phe Ile
195 200 205
Ala Thr Val Ser His Glu Lys Gly Ser Ser Asp Thr Ser Glu Phe Glu
210 215 220
Ile Thr Tyr Gly Arg Asn Met Asp Val Thr His Ala Ile Lys Arg Ser
225 230 235 240
Thr His Tyr Gly Asn Ser Tyr Leu Asp Gly His Arg Val His Asn Ala
245 250 255
Phe Val Asn Arg Asn Tyr Thr Val Lys Tyr Glu Val Asn Trp Lys Thr
260 265 270
His Glu Ile
275
<210> 34
<211> 212
<212> PRT
<213> Staphylococcus aureus
<400> 34
Val Thr Gln Asn Val Gln Phe Asp Phe Val Lys Asp Lys Lys Tyr Asn
1 5 10 15
Lys Asp Ala Leu Ile Val Lys Met Gln Gly Phe Ile Asn Ser Arg Thr
20 25 30
Ser Phe Ser Asp Val Lys Gly Ser Gly Tyr Glu Leu Thr Lys Arg Met
35 40 45
Ile Trp Pro Phe Gln Tyr Asn Ile Gly Leu Thr Thr Lys Asp Pro Asn
50 55 60
Val Ser Leu Ile Asn Tyr Leu Pro Lys Asn Lys Ile Glu Thr Thr Asp
65 70 75 80
Val Gly Gln Thr Leu Gly Tyr Asn Ile Gly Gly Asn Phe Gln Ser Ala
85 90 95
Pro Ser Ile Gly Gly Asn Gly Ser Phe Asn Tyr Ser Lys Thr Ile Ser
100 105 110
Tyr Thr Gln Lys Ser Tyr Val Ser Glu Val Asp Lys Gln Asn Ser Lys
115 120 125
Ser Val Lys Trp Gly Val Lys Ala Asn Glu Phe Val Thr Pro Asp Gly
130 135 140
Lys Lys Ser Ala His Asp Arg Tyr Leu Phe Val Gln Ser Pro Asn Gly
145 150 155 160
Pro Thr Gly Ser Ala Arg Glu Tyr Phe Ala Pro Asp Asn Gln Leu Pro
165 170 175
Pro Leu Val Gln Ser Gly Phe Asn Pro Ser Phe Ile Thr Thr Leu Ser
180 185 190
His Glu Lys Gly Ser Ser Asp Thr Ser Glu Phe Glu Ile Ser Tyr Gly
195 200 205
Arg Asn Leu Asp
210
<210> 35
<211> 296
<212> PRT
<213> Eisenia fetida
<400> 35
Met Ser Ala Lys Ala Ala Glu Gly Tyr Glu Gln Ile Glu Val Asp Val
1 5 10 15
Val Ala Val Trp Lys Glu Gly Tyr Val Tyr Glu Asn Arg Gly Ser Thr
20 25 30
Ser Val Asp Gln Lys Ile Thr Ile Thr Lys Gly Met Lys Asn Val Asn
35 40 45
Ser Glu Thr Arg Thr Val Thr Ala Thr His Ser Ile Gly Ser Thr Ile
50 55 60
Ser Thr Gly Asp Ala Phe Glu Ile Gly Ser Val Glu Val Ser Tyr Ser
65 70 75 80
His Ser His Glu Glu Ser Gln Val Ser Met Thr Glu Thr Glu Val Tyr
85 90 95
Glu Ser Lys Val Ile Glu His Thr Ile Thr Ile Pro Pro Thr Ser Lys
100 105 110
Phe Thr Arg Trp Gln Leu Asn Ala Asp Val Gly Gly Ala Asp Ile Glu
115 120 125
Tyr Met Tyr Leu Ile Asp Glu Val Thr Pro Ile Gly Gly Thr Gln Ser
130 135 140
Ile Pro Gln Val Ile Thr Ser Arg Ala Lys Ile Ile Val Gly Arg Gln
145 150 155 160
Ile Ile Leu Gly Lys Thr Glu Ile Arg Ile Lys His Ala Glu Arg Lys
165 170 175
Glu Tyr Met Thr Val Val Ser Arg Lys Ser Trp Pro Ala Ala Thr Leu
180 185 190
Gly His Ser Lys Leu Phe Lys Phe Val Leu Tyr Glu Asp Trp Gly Gly
195 200 205
Phe Arg Ile Lys Thr Leu Asn Thr Met Tyr Ser Gly Tyr Glu Tyr Ala
210 215 220
Tyr Ser Ser Asp Gln Gly Gly Ile Tyr Phe Asp Gln Gly Thr Asp Asn
225 230 235 240
Pro Lys Gln Arg Trp Ala Ile Asn Lys Ser Leu Pro Leu Arg His Gly
245 250 255
Asp Val Val Thr Phe Met Asn Lys Tyr Phe Thr Arg Ser Gly Leu Cys
260 265 270
Tyr Asp Asp Gly Pro Ala Thr Asn Val Tyr Cys Leu Asp Lys Arg Glu
275 280 285
Asp Lys Trp Ile Leu Glu Val Val
290 295
<210> 36
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Leucine-enkephalin.
<400> 36
Tyr Gly Gly Phe Leu
1 5
<210> 37
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Angiotensin II (4-8)
<400> 37
Tyr Ile His Pro Phe
1 5
<210> 38
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Kemptide
<400> 38
Leu Arg Arg Ala Ser Leu Gly
1 5
<210> 39
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> phosphorylated kemptide
<220>
<221> MOD_RES
<222> (5)..(5)
<223> PHOSPHORYLATION
<400> 39
Leu Arg Arg Ala Ser Leu Gly
1 5
<210> 40
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> unmodified peptide
<400> 40
Ala Asn Val Thr Leu Asn Thr Ala Gly
1 5
<210> 41
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> peptide with one glycan
<220>
<221> MOD_RES
<222> (4)..(4)
<223> T is modified with glycan
<400> 41
Ala Asn Val Thr Leu Asn Thr Ala Gly
1 5
<210> 42
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> peptide with two glycans
<220>
<221> MOD_RES
<222> (4)..(4)
<223> T is modified with glycan
<220>
<221> MOD_RES
<222> (8)..(8)
<223> T is modified with glycan
<400> 42
Ala Asn Val Thr Leu Asn Thr Thr Gly
1 5
<210> 43
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> peptide fragment
<400> 43
Ser Gly Arg Asn Ala Ala Val Val Lys
1 5
<210> 44
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> rhamnosylated peptide
<220>
<221> MOD_RES
<222> (3)..(3)
<223> R is rhamnosylated
<400> 44
Ser Gly Arg Asn Ala Ala Val Val Lys
1 5
<210> 45
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> modified enkephalin
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> is D-Asp
<220>
<221> MISC_FEATURE
<222> (6)..(6)
<223> is D-Asp
<400> 45
Tyr Asp Ala Gly Phe Asp Leu
1 5
<210> 46
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> T7 reverse primer
<400> 46
gctagttatt gctcagcgg 19
<210> 47
<211> 190
<212> PRT
<213> Artificial Sequence
<220>
<223> His6-tagged wild type Fragaceatoxin C.
<400> 47
Met Ala Ser Ala Asp Val Ala Gly Ala Val Ile Asp Gly Ala Gly Leu
1 5 10 15
Gly Phe Asp Val Leu Lys Thr Val Leu Glu Ala Leu Gly Asn Val Lys
20 25 30
Arg Lys Ile Ala Val Gly Ile Asp Asn Glu Ser Gly Lys Thr Trp Thr
35 40 45
Ala Met Asn Thr Tyr Phe Arg Ser Gly Thr Ser Asp Ile Val Leu Pro
50 55 60
His Lys Val Ala His Gly Lys Ala Leu Leu Tyr Asn Gly Gln Lys Asn
65 70 75 80
Arg Gly Pro Val Ala Thr Gly Val Val Gly Val Ile Ala Tyr Ser Met
85 90 95
Ser Asp Gly Asn Thr Leu Ala Val Leu Phe Ser Val Pro Tyr Asp Tyr
100 105 110
Asn Trp Tyr Ser Asn Trp Trp Asn Val Arg Val Tyr Lys Gly Gln Lys
115 120 125
Arg Ala Asp Gln Arg Met Tyr Glu Glu Leu Tyr Tyr His Arg Ser Pro
130 135 140
Phe Arg Gly Asp Asn Gly Trp His Ser Arg Gly Leu Gly Tyr Gly Leu
145 150 155 160
Lys Ser Arg Gly Phe Met Asn Ser Ser Gly His Ala Ile Leu Glu Ile
165 170 175
His Val Thr Lys Ala Gly Ser Ala His His His His His His
180 185 190
<210> 48
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> Angiotensinogen peptide
<400> 48
Asp Arg Val Tyr Ile His Pro Phe His Leu Val Ile His Asn
1 5 10
<210> 49
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> Angiotensin 1 peptide
<400> 49
Asp Arg Val Tyr Ile His Pro Phe His Leu
1 5 10
<210> 50
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Angiotensin 3 peptide
<400> 50
Arg Val Tyr Ile His Pro Phe
1 5
<210> 51
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> Angiotensin 4 peptide
<400> 51
Val Tyr Ile His Pro Phe
1 5
<210> 52
<211> 27
<212> PRT
<213> Artificial Sequence
<220>
<223> Common sequence alignment of some known actinoporins
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> X can be A, V, L, I, or S
<220>
<221> MISC_FEATURE
<222> (24)..(24)
<223> X can be E, T, K, G, A or Q
<220>
<221> MISC_FEATURE
<222> (25)..(25)
<223> X can be A, V, E, T or S
<400> 52
Ser Xaa Ala Val Ala Gly Ala Val Ile Glu Gly Ala Ser Leu Thr Phe
1 5 10 15
Gln Val Leu Asp Lys Val Leu Xaa Xaa Leu Gly
20 25
<210> 53
<211> 27
<212> PRT
<213> Actinia fragacea
<400> 53
Ser Ala Asp Val Ala Gly Ala Val Ile Asp Gly Ala Gly Leu Gly Phe
1 5 10 15
Asp Val Leu Lys Thr Val Leu Glu Ala Leu Gly
20 25
<210> 54
<211> 27
<212> PRT
<213> Urticina crassicornis
<400> 54
Ser Val Ala Ile Ala Gly Ala Val Ile Glu Gly Ala Lys Leu Thr Phe
1 5 10 15
Gly Ile Leu Glu Lys Ile Leu Thr Val Leu Gly
20 25
<210> 55
<211> 27
<212> PRT
<213> Actinia equina
<400> 55
Ser Ala Asp Val Ala Gly Ala Val Ile Asp Gly Ala Ser Leu Ser Phe
1 5 10 15
Asp Ile Leu Lys Thr Val Leu Glu Ala Leu Gly
20 25
<210> 56
<211> 27
<212> PRT
<213> Actinia equina
<400> 56
Ser Val Ala Val Ala Gly Ala Ile Ile Lys Gly Ala Ala Leu Thr Phe
1 5 10 15
Asn Val Leu Gln Thr Val Leu Lys Ala Leu Gly
20 25
<210> 57
<211> 27
<212> PRT
<213> Actinia equina
<400> 57
Ser Val Ala Val Ala Gly Ala Val Ile Glu Gly Ala Thr Leu Thr Phe
1 5 10 15
Asn Val Leu Gln Thr Val Leu Lys Ala Leu Gly
20 25
<210> 58
<211> 27
<212> PRT
<213> Anthopleura asiatica
<400> 58
Ser Leu Ala Val Ala Gly Ala Val Ile Glu Gly Gly Asn Leu Val Met
1 5 10 15
Ser Val Leu Asp Arg Ile Leu Glu Ala Ile Gly
20 25
<210> 59
<211> 27
<212> PRT
<213> Heteractis magnifica
<400> 59
Ser Ala Ala Leu Ala Gly Thr Ile Ile Glu Gly Ala Ser Leu Gly Phe
1 5 10 15
Gln Ile Leu Asp Lys Val Leu Gly Glu Leu Gly
20 25
<210> 60
<211> 25
<212> PRT
<213> Heteractis crispa
<400> 60
Ala Leu Ala Gly Ala Ile Ile Ala Gly Ala Ser Leu Thr Phe Gln Ile
1 5 10 15
Leu Asp Lys Val Leu Ala Glu Leu Gly
20 25
<210> 61
<211> 27
<212> PRT
<213> Heteractis crispa
<400> 61
Ser Ala Ala Leu Ala Gly Thr Ile Thr Leu Gly Ala Ser Leu Gly Phe
1 5 10 15
Gln Ile Leu Asp Lys Val Leu Gly Glu Leu Gly
20 25
<210> 62
<211> 26
<212> PRT
<213> Sagartia rosea
<400> 62
Lys Ile Ser Gly Gly Thr Val Ile Ala Ala Gly Arg Leu Thr Leu Asp
1 5 10 15
Leu Leu Lys Thr Leu Leu Gly Thr Leu Gly
20 25
<210> 63
<211> 26
<212> PRT
<213> Stichodactyla helianthus
<400> 63
Ser Glu Leu Ala Gly Thr Ile Ile Asp Gly Ala Ser Leu Thr Phe Glu
1 5 10 15
Val Leu Asp Lys Val Leu Gly Glu Leu Gly
20 25
<210> 64
<211> 25
<212> PRT
<213> Stichodactyla helianthus
<400> 64
Ala Leu Ala Gly Thr Ile Ile Ala Gly Ala Ser Leu Thr Phe Gln Val
1 5 10 15
Leu Asp Lys Val Leu Glu Glu Leu Gly
20 25
<210> 65
<211> 27
<212> PRT
<213> Cribrinopsis japonica
<400> 65
Ser Val Ala Val Ala Gly Ala Val Ile Gln Gly Ala Ala Leu Ala Phe
1 5 10 15
Gln Val Leu Asp Lys Ile Leu Thr Ser Leu Gly
20 25
<210> 66
<211> 27
<212> PRT
<213> Cribrinopsis japonica
<400> 66
Asn Ala Ala Val Ala Gly Ala Val Ile Gln Gly Ala Thr Leu Thr Phe
1 5 10 15
Gln Val Leu Asp Arg Ile Leu Thr Val Leu Gly
20 25
<210> 67
<211> 27
<212> PRT
<213> Anthopleura nigrescens
<400> 67
Ser Leu Glu Val Ala Gly Ala Val Met Glu Gly Ala Asn Leu Gly Met
1 5 10 15
Ser Val Leu Gln Thr Ile Leu Gln Ala Ile Gly
20 25
<210> 68
<211> 27
<212> PRT
<213> Stychodactyla gigantea
<400> 68
Ala Ser Ala Val Ala Gly Thr Ile Ile Glu Gly Ala Ser Leu Thr Phe
1 5 10 15
Gln Ile Leu Asp Lys Val Leu Thr Glu Leu Gly
20 25
<210> 69
<211> 23
<212> PRT
<213> Actinia fragacea
<400> 69
Ser Ala Asp Val Ala Gly Ala Val Ile Asp Gly Ala Gly Leu Gly Phe
1 5 10 15
Asp Val Leu Lys Thr Val Leu
20
<210> 70
<211> 23
<212> PRT
<213> Anthopleura asiatica
<400> 70
Ser Leu Ala Val Ala Gly Ala Val Ile Glu Gly Gly Asn Leu Val Met
1 5 10 15
Ser Val Leu Asp Arg Ile Leu
20
<210> 71
<211> 46
<212> PRT
<213> Cribrinopsis japonica
<400> 71
Leu Pro Met Lys Glu Asp Ile Ser Asn Asp Glu Arg Pro Ile Ser Val
1 5 10 15
Asn Glu Glu Pro Val Lys Lys Asn Ala Ala Val Ala Gly Ala Val Ile
20 25 30
Gln Gly Ala Thr Leu Thr Phe Gln Val Leu Asp Arg Ile Leu
35 40 45
<210> 72
<211> 46
<212> PRT
<213> Cribrinopsis japonica
<400> 72
Leu Pro Met Lys Glu Asp Ile Ser Asn Glu Glu Arg Pro Thr Ser Val
1 5 10 15
Asn Glu Lys Pro Val Lys Lys Ser Val Ala Val Ala Gly Ala Val Ile
20 25 30
Gln Gly Ala Ala Leu Ala Phe Gln Val Leu Asp Lys Ile Leu
35 40 45
<210> 73
<211> 23
<212> PRT
<213> Actineria villosa
<400> 73
Ser Ala Ala Val Ala Gly Ala Val Ile Ala Gly Gly Glu Leu Ala Leu
1 5 10 15
Lys Ile Leu Thr Lys Ile Leu
20
<210> 74
<211> 23
<212> PRT
<213> Phyllodiscus semoni
<400> 74
Ser Ala Ala Val Ala Gly Ala Val Ile Ala Gly Gly Glu Leu Ala Leu
1 5 10 15
Lys Ile Leu Thr Lys Ile Leu
20
<210> 75
<211> 23
<212> PRT
<213> Actinia equina
<400> 75
Ser Ala Asp Val Ala Gly Ala Val Ile Asp Gly Ala Ser Leu Ser Phe
1 5 10 15
Asp Ile Leu Lys Thr Val Leu
20
<210> 76
<211> 23
<212> PRT
<213> Actinia equina
<400> 76
Ser Val Ala Val Ala Gly Ala Ile Ile Lys Gly Ala Ala Leu Thr Phe
1 5 10 15
Asn Val Leu Gln Thr Val Leu
20
<210> 77
<211> 23
<212> PRT
<213> Actinia equina
<400> 77
Ser Val Ala Val Ala Gly Ala Val Ile Glu Gly Ala Thr Leu Thr Phe
1 5 10 15
Asn Val Leu Gln Thr Val Leu
20
<210> 78
<211> 23
<212> PRT
<213> Stychodactyla gigantea
<400> 78
Ala Ser Ala Val Ala Gly Thr Ile Ile Glu Gly Ala Ser Leu Thr Phe
1 5 10 15
Gln Ile Leu Asp Lys Val Leu
20
<210> 79
<211> 23
<212> PRT
<213> Heteractis magnifica
<400> 79
Ser Ala Ala Leu Ala Gly Thr Ile Ile Glu Gly Ala Ser Leu Gly Phe
1 5 10 15
Gln Ile Leu Asp Lys Val Leu
20
<210> 80
<211> 5
<212> PRT
<213> Anthopleura nigrescens
<400> 80
Leu Pro Leu Glu Glu
1 5
<210> 81
<211> 32
<212> PRT
<213> Anthopleura nigrescens
<400> 81
Lys Glu Asp Glu Lys Asp Glu Lys Arg Ser Leu Glu Val Ala Gly Ala
1 5 10 15
Val Met Glu Gly Ala Asn Leu Gly Met Ser Val Leu Gln Thr Ile Leu
20 25 30
<210> 82
<211> 21
<212> PRT
<213> Heteractis crispa
<400> 82
Ala Leu Ala Gly Ala Ile Ile Ala Gly Ala Ser Leu Thr Phe Gln Ile
1 5 10 15
Leu Asp Lys Val Leu
20
<210> 83
<211> 23
<212> PRT
<213> Heteractis crispa
<400> 83
Ser Ala Ala Leu Ala Gly Thr Ile Thr Leu Gly Ala Ser Leu Gly Phe
1 5 10 15
Gln Ile Leu Asp Lys Val Leu
20
<210> 84
<211> 22
<212> PRT
<213> Sagartia rosea
<400> 84
Lys Ile Ser Gly Gly Thr Val Ile Ala Ala Gly Arg Leu Thr Leu Asp
1 5 10 15
Leu Leu Lys Thr Leu Leu
20
<210> 85
<211> 21
<212> PRT
<213> Stichodactyla helianthus
<400> 85
Ala Leu Ala Gly Thr Ile Ile Ala Gly Ala Ser Leu Thr Phe Gln Val
1 5 10 15
Leu Asp Lys Val Leu
20
<210> 86
<211> 22
<212> PRT
<213> Stichodactyla helianthus
<400> 86
Ser Glu Leu Ala Gly Thr Ile Ile Asp Gly Ala Ser Leu Thr Phe Glu
1 5 10 15
Val Leu Asp Lys Val Leu
20
<210> 87
<211> 23
<212> PRT
<213> Urticina crassicornis
<400> 87
Ser Val Ala Ile Ala Gly Ala Val Ile Glu Gly Ala Lys Leu Thr Phe
1 5 10 15
Gly Ile Leu Glu Lys Ile Leu
20
<210> 88
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> peptide fragment
<400> 88
Arg Gly Asn Ala Glu Lys
1 5
<210> 89
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> peptide fragment
<400> 89
Phe Asp Gln Gly Lys
1 5
<210> 90
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> peptide fragment
<400> 90
His Ile Tyr Val Arg
1 5
<210> 91
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> peptide
<400> 91
Thr Pro Gly Ser Arg
1 5
<210> 92
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> peptide
<400> 92
His Gly Leu Asp Asn Tyr Arg
1 5
<210> 93
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> peptide
<400> 93
Cys Glu Leu Ala Ala Ala Met Lys
1 5
<210> 94
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> peptide
<400> 94
Trp Trp Cys Asn Asp Gly Arg
1 5
<210> 95
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> peptide
<400> 95
Gly Thr Asp Val Gln Ala Trp Ile Arg
1 5
<210> 96
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<223> peptide
<400> 96
Gly Tyr Ser Leu Gly Asn Trp Val Cys Ala Ala Lys
1 5 10
<210> 97
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<223> peptide
<400> 97
Phe Glu Ser Asn Phe Asn Thr Gln Ala Thr Asn Arg
1 5 10
<210> 98
<211> 13
<212> PRT
<213> Artificial Sequence
<220>
<223> peptide fragment
<400> 98
Asn Leu Leu Thr Gly Ala Gly Thr Glu Thr Val Phe Lys
1 5 10
<210> 99
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> [Ala2]-Leu Enkephalin
<400> 99
Tyr Ala Gly Phe Leu
1 5
<210> 100
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> DADLE ([D-Ala2, D-Leu5]-Enkephalin)
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> is D-Ala
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> is D-Leu
<400> 100
Tyr Ala Gly Phe Leu
1 5
Claims (23)
- 악티노포린 계열의 돌연변이 알파-나선형 기공 형성 독소 또는 이의 기공 형성 단편을 포함하는 단백질성 나노기공으로서, 상기 기공 형성 독소 또는 이의 단편의 내강-대면 (lumen-facing) 인식 영역이, 프라가세아톡신 C (FraC; UniProtKB/Swiss-Prot: B9W5G6)의 아미노산 10-20에 상응하는 인식 영역에서 내강-대면 아미노산(들)의 천연 또는 비천연 방향족 아미노산 잔기로의 하나 이상의 치환(들)을 포함하는 것인, 단백질성 나노기공.
- 제1항에 있어서, 내강-대면 아미노산(들)의 Trp, Tyr 또는 Phe로의 하나 이상의 치환(들)을 포함하는, 돌연변이 악티노포린 또는 이의 알파-나선형 막횡단 영역 (aa 1-27)을 포함하는, 단백질성 나노기공.
- 제1항 또는 제2항에 있어서, 프라가세아톡신 A (FraA; Swiss-Prot P0DUW8), 프라가세아톡신 B (FraB; Swiss-Prot A0A515MEN7), 프라가세아톡신 C (FraC; Swiss-Prot B9W5G6), 프라가세아톡신 D (FraD; Swiss-Prot P0DUW9), 프라가세아톡신 E (FraE; Swiss-Prot A0A515MEM9), 에퀴나톡신 II (Eqt-II; Swiss-Prot P61914), 에퀴나톡신 IV (Eqt-IV; Swiss-Prot P61914), 에퀴나톡신 V (Eqt-V; Swiss-Prot Q93109), 우르티시나톡신 (UcI; Swiss-Prot C9EIC7), 액티톡신-Oor1b (Or-G; Swiss-Prot Q5I2B1), 액티톡신-Oor1a (Or-A Swiss-Prot Q5I4B8), 기간톡신-4 (Gigt 4; Swiss-Prot H9CNF5), 헤터락티스 마그니피카 (Heteractis magnifica) 사이토라이신 III (HmgIII; Swiss-Prot Q9U6X1), 반다포린 (bp-1; Swiss-Prot C5NSL2), 크리비놉시스 자포니카 (Cribinopsis japonica) 독소 I (CJTOX I; Swiss-Prot A0A2Z5Z9X0), 크리비놉시스 자포니카 독소 II (CJTOX II; Swiss-Prot A0A2Z5Z9H5), 스티콜라이신 I (StI; Swiss-Prot P81662), 스티콜라이신 II (StII; Swiss-Prot P07845), 스티코톡신 Hcr4a (RTX-A; Swiss-Prot P58691), 스티코톡신 Hcr4b (RTX-SII; Swiss-Prot P0C1F8), 사가톡신 I (Src I; Swiss-Prot Q86FQ0), 사이토라이신 Avt-I (AvtI; Swiss-Prot Q5R231), 사이토라이신 PsTX-20A (PsTX20A; Swiss-Prot P0DL55), 니그레라이신 (Nigrelysin) (Swiss-Prot A0A345GPN1) 및 이들과 적어도 90%, 바람직하게는 적어도 95%의 서열 동일성을 나타내는 이들의 기공 형성 독소 상동체로 이루어진 군으로부터 선택되는, 악티노포린 계열의 돌연변이 알파-나선형 기공 형성 독소 또는 이의 기공 형성 단편을 포함하는, 단백질성 나노기공.
- 제1항 내지 제3항 중 어느 한 항에 있어서, FraC의 아미노산 Asp10, Gly13, Asp17 및 Lys20, 바람직하게는 Gly13에 상응하는 하나 이상의 잔기들의 방향족 치환을 포함하는, 단백질성 나노기공.
- 제4항에 있어서, 표 1에서 선택된 돌연변이 악티노포린을 포함하는, 단백질성 나노기공.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 하나 이상의 추가의 돌연변이(들)이 인식 영역의 내강-대면 아미노산에 도입되고, 이러한 추가의 돌연변이(들)이 기공의 순 음전하를 증가시키는 것인, 단백질성 나노기공.
- 제6항에 있어서, Glu 및/또는 Asp 잔기(들)에 대한 하나 이상의 돌연변이를 포함하는, 단백질성 나노기공.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 하기로 이루어진 군으로부터 선택된 돌연변이 악티노포린:
(i) FraC, FraE; 또는 FraC의 Gly13에 상응하는 위치에 방향족 잔기를 포함하는, 이들과 적어도 90%의 서열 동일성을 나타내는 기능적 상동체;
(ii) FraB, Ten-C, Eqt-II, Gigt 4, HmgIII, RTX-SII, Hmt; 또는 Ser13에 상응하는 위치에 방향족 잔기를 포함하고, 선택적으로 위치 10에 산성 잔기를 포함하는, 이들과 적어도 90%의 서열 동일성을 나타내는 기능적 상동체;
(iii) bp-1; 또는 Asn13에 상응하는 위치에 방향족 잔기를 포함하는, 이와 적어도 90%의 서열 동일성을 나타내는 기능적 상동체;
(iv) CJTOX I; 또는 Thr36에 상응하는 위치에 방향족 잔기를 포함하고, 선택적으로 Gln33에 상응하는 위치에 산성 잔기를 포함하는, 이와 적어도 90%의 서열 동일성을 나타내는 기능적 상동체;
(v) CJTOX II; 또는 Ala36에 상응하는 위치에 방향족 잔기를 포함하고, 선택적으로 Gln33에 상응하는 위치에 산성 잔기를 포함하는, 이와 적어도 90%의 서열 동일성을 나타내는 기능적 상동체;
(vi) 사이토라이신 Avt-I, 사이토라이신 PsTX-20A; 또는 Glu13에 상응하는 위치에 방향족 잔기를 포함하고, 선택적으로 Ala 10에 상응하는 위치에 산성 잔기를 포함하는, 이들과 적어도 90%의 서열 동일성을 나타내는 기능적 상동체;
(vii) Eqt-IV; 또는 Ala13에 상응하는 위치에 방향족 잔기를 포함하고, 선택적으로 Lys10에 상응하는 위치에 산성 잔기를 포함하는, 이와 적어도 90%의 서열 동일성을 나타내는 기능적 상동체;
(viii) Eqt-V; 또는 Thr13에 상응하는 위치에 방향족 잔기를 포함하는, 이와 적어도 90%의 서열 동일성을 나타내는 기능적 상동체;
(ix) 니그레라이신; 또는 Asn27에 상응하는 위치에 방향족 잔기를 포함하는, 이와 적어도 90%의 서열 동일성을 나타내는 기능적 상동체;
(x) StII, RTX-A; 또는 Ser11에 상응하는 위치에 방향족 잔기를 포함하고, 선택적으로 Ala8에 상응하는 위치에 산성 잔기를 포함하는, 이들과 적어도 90%의 서열 동일성을 나타내는 기능적 상동체;
(xi) Src I; 또는 Arg12에 상응하는 위치에 방향족 잔기를 포함하고, 선택적으로 Ala9에 상응하는 위치에 산성 잔기를 포함하는, 이와 적어도 90%의 서열 동일성을 나타내는 기능적 상동체;
(xii) StI; 또는 Ser12에 상응하는 위치에 방향족 잔기를 포함하는, 이와 적어도 90%의 서열 동일성을 나타내는 기능적 상동체;
(xiii) UcI; 또는 Lys13에 상응하는 위치에 방향족 잔기를 포함하는, 이와 적어도 90%의 서열 동일성을 나타내는 기능적 상동체;
(xiv) Or-G; 또는 Ala8에 상응하는 위치에 방향족 잔기를 포함하고, 선택적으로 Ala5에 상응하는 위치에 산성 잔기를 포함하는, 이와 적어도 90%의 서열 동일성을 나타내는 기능적 상동체; 또는
상기 언급된 돌연변이(들)을 포함하는 이들의 알파-나선형 막횡단 영역 (aa 1-27)을 포함하는, 단백질성 나노기공. - 제8항에 있어서, 돌연변이 Gly13Tyr, Gly13Trp 또는 Gly13Phe, 바람직하게는 Gly13Phe를 포함하는, 돌연변이 FraC 또는 이의 기공 형성 단편을 포함하는, 단백질성 나노기공.
- 분석 시스템으로서, 유체 챔버를 시스 측과 트랜스 측으로 분리하는 소수성 막을 포함하고, 상기 막은 제1항 내지 제9항 중 어느 한 항에 따른 돌연변이형 단백질성 나노기공을 포함하는 것인, 분석 시스템.
- 하기 단계를 포함하는, 제10항에 따른 시스템을 제공하는 방법:
- 상기 돌연변이 기공 형성 독소 또는 이의 기공 형성 단편의 재조합 단량체를 제공하는 단계;
- 상기 단량체를 리포솜 및/또는 계면활성제와 접촉시켜 이들을 올리고머로 조립하는 단계;
- 상기 리포솜 및/또는 계면활성제로부터 올리고머를 회수하는 단계; 및
- 상기 올리고머를 스핑고미엘린을 포함할 수 있는 막과 접촉시켜, 나노기공을 형성시키는 단계. - 단일 분자 분석 방법, 바람직하게는 관심대상 분석물의 식별 및/또는 염기서열분석을 위한, 단일 분자 분석 방법으로서, 제10항에 따른 분석 시스템의 챔버에 관심대상 분석물을 첨가하는 단계, 상기 분석물을 나노기공에 접촉시키는 단계, 및 상기 분석물의 적어도 하나의 속성을 검출/특성 분석하는 단계를 포함하는 것인, 방법.
- 제12항에 있어서, 상기 분석물이 전기영동적으로 및/또는 전기삼투적으로 나노기공에 포획되도록, 상기 나노기공에 전기장을 가하는 단계를 포함하는, 방법.
- 제12항 또는 제13항에 있어서, 상기 관심대상 분석물의 질량이 200 내지 5000 Da 범위, 바람직하게는 200 내지 500 Da, 또는 500 내지 1700 Da 범위인 것인, 방법.
- 제12항 내지 제14항 중 어느 한 항에 있어서, 상기 관심대상 분석물이 바람직하게는 단백질, 폴리펩타이드 및 올리고펩타이드로 이루어진 군으로부터 선택되는 생체고분자인 것인, 방법.
- 제15항에 있어서, 상기 관심대상 분석물이 단백질성 물질, 바람직하게는 펩타이드, 보다 바람직하게는 최대 약 30, 20, 15, 10, 5, 3개 또는 2개의 아미노산 길이를 갖는 펩타이드인 것인, 방법.
- 제12항 또는 제13항에 있어서, 분석물의 돌연변이 및/또는 번역후 변형을 검출하는 단계, 예를 들어 하나의 아미노산 잔기, 아미노산 키랄성, 인산화의 정도 및/또는 글리코실화의 정도가 다른 펩타이드 단편들을 검출하는 단계를 포함하는, 방법.
- 제12항 내지 제17항 중 어느 한 항에 있어서, 상기 검출이 pH 4.5 이하, 바람직하게는 pH 4.0 미만에서 수행되는 것인, 방법.
- 막횡단 알파-나선형 또는 베타-배럴형 단백질 기공을 통한 펩타이드 분석물의 전위 속도를 감소시키는 방법으로서,
(a) 하나 이상의 내강-대면 비방향족 아미노산(들)을 하나 이상의 방향족 아미노산(들)로 치환함으로써 기공 내강의 순 방향족성을 증가시키는 단계; 및
(b) 폴리펩타이드를 상기 기공으로 통과시키는 단계로서, 이때 순 방향족성의 증가가 상기 기공을 통한 폴리펩타이드의 전위 속도를 감소시키는 것인, 단계를 포함하는 것인, 방법. - 제19항에 있어서, 상기 단계 (a)가 제1항 내지 제9항 중 어느 한 항에 따른 단백질성 나노기공을 제공하는 것을 포함하는 것인, 방법.
- 제10항에 따른 복수의 분석 시스템을 포함하는 장치로서, 바람직하게는 상기 분석 시스템이 서로 다른 기공 유형들을 포함하는 것인, 방법.
- 관심대상 분석물을 특성 분석하기 위한 성분 키트로서, (i) 제1항 내지 제9항 중 어느 한 항에 따른 돌연변이형 단백질성 나노기공, 제10항에 따른 분석 시스템, 또는 제21항에 따른 장치; 및 (ii) 분석물 처리 효소, 바람직하게는 프로테아제를 포함하는 것인, 성분 키트.
- 단일 분자 분석을 위한, 바람직하게는 생체고분자의 식별 및/또는 염기서열분석을 위한, 보다 바람직하게는 무표지 단백질 핑거프린팅을 위한, 제10항에 따른 분석 시스템, 제21항에 따른 장치, 또는 제22항에 따른 키트의 용도.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP21174437 | 2021-05-18 | ||
EP21174437.0 | 2021-05-18 | ||
PCT/NL2022/050266 WO2022245209A2 (en) | 2021-05-18 | 2022-05-18 | Nanopore proteomics |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20240010007A true KR20240010007A (ko) | 2024-01-23 |
Family
ID=76011701
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237043541A KR20240010007A (ko) | 2021-05-18 | 2022-05-18 | 나노기공 프로테오믹스 |
Country Status (6)
Country | Link |
---|---|
EP (1) | EP4341278A2 (ko) |
KR (1) | KR20240010007A (ko) |
AU (1) | AU2022277010A1 (ko) |
CA (1) | CA3219470A1 (ko) |
IL (1) | IL308635A (ko) |
WO (1) | WO2022245209A2 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB202112235D0 (en) * | 2021-08-26 | 2021-10-13 | Oxford Nanopore Tech Ltd | Nanopore |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB0820927D0 (en) * | 2008-11-14 | 2008-12-24 | Isis Innovation | Method |
JP2022500074A (ja) * | 2018-09-11 | 2022-01-04 | レイクスユニフェルシテイト フローニンゲン | 調節可能な孔直径を有する生物学的ナノポアと分析ツールとしてのその使用 |
CN112500459B (zh) * | 2020-02-29 | 2023-04-07 | 南京大学 | Aerolysin突变纳米孔及其在分子生物检测方面的应用 |
CN112480204A (zh) * | 2020-04-13 | 2021-03-12 | 南京大学 | 一种采用Aerolysin纳米孔道的蛋白质/多肽测序方法 |
-
2022
- 2022-05-18 EP EP22725307.7A patent/EP4341278A2/en active Pending
- 2022-05-18 CA CA3219470A patent/CA3219470A1/en active Pending
- 2022-05-18 KR KR1020237043541A patent/KR20240010007A/ko unknown
- 2022-05-18 IL IL308635A patent/IL308635A/en unknown
- 2022-05-18 WO PCT/NL2022/050266 patent/WO2022245209A2/en active Application Filing
- 2022-05-18 AU AU2022277010A patent/AU2022277010A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
AU2022277010A1 (en) | 2023-12-14 |
IL308635A (en) | 2024-01-01 |
EP4341278A2 (en) | 2024-03-27 |
WO2022245209A3 (en) | 2022-12-29 |
CA3219470A1 (en) | 2022-11-24 |
WO2022245209A2 (en) | 2022-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210284696A1 (en) | Novel protein pores | |
CN107109479B (zh) | 具有改变的特征的α-溶血素变体 | |
EP3485029B1 (en) | Biological nanopores for biopolymer sensing and sequencing based on frac actinoporin | |
CN114605507A (zh) | 突变csgg孔 | |
EP3850001A1 (en) | Biological nanopores having tunable pore diameters and uses thereof as analytical tools | |
Pflüger-Grau et al. | The interplay of the EIIANtr component of the nitrogen-related phosphotransferase system (PTSNtr) of Pseudomonas putida with pyruvate dehydrogenase | |
JP2022518095A (ja) | 細孔 | |
EP3049814B1 (en) | Method for determining the number or position(s) of two or more post-translational modifications (ptms) in a peptide, polypeptide or protein | |
WO2017083632A1 (en) | Host cells and systems for membrane protein expression | |
KR20240010007A (ko) | 나노기공 프로테오믹스 | |
US10648966B2 (en) | Lipid bilayer-integrated SPP1 connector protein nanopore and SPP1 connector protein variants for use as lipid bilayer-integrated nanopore | |
CN117957243A (en) | Nanopore proteomics | |
US20220412948A1 (en) | Artificial nanopores and uses and methods relating thereto | |
Puthumadathil et al. | Assembly of alpha-helical transmembrane pores through an intermediate state | |
EP3351556A1 (en) | Protein tag that binds to substances having a crystal structure, and uses thereof | |
WO2024091123A1 (en) | Nanopore systems and methods for single-molecule polymer profiling | |
Li et al. | Identification of interacting regions within the coiled coil of the Escherichia coli structural maintenance of chromosomes protein MukB | |
Abdali | Identification and characterization of channel-forming proteins in the cell wall of Corynebacterium jeikeium and Corynebacterium urealyticum | |
Reddy et al. | Review on Identification of Proteins of Microorganisms by Two-dimensional gel electrophoresis-Mass spectrometry (2-DE-MS) |