KR20210013571A - 백신 조성물 - Google Patents
백신 조성물 Download PDFInfo
- Publication number
- KR20210013571A KR20210013571A KR1020207034602A KR20207034602A KR20210013571A KR 20210013571 A KR20210013571 A KR 20210013571A KR 1020207034602 A KR1020207034602 A KR 1020207034602A KR 20207034602 A KR20207034602 A KR 20207034602A KR 20210013571 A KR20210013571 A KR 20210013571A
- Authority
- KR
- South Korea
- Prior art keywords
- leu
- ser
- thr
- val
- ala
- Prior art date
Links
- 239000000203 mixture Substances 0.000 title claims abstract description 107
- 229960005486 vaccine Drugs 0.000 title claims abstract description 61
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 179
- 230000000890 antigenic effect Effects 0.000 claims abstract description 54
- 239000002245 particle Substances 0.000 claims abstract description 35
- 108090000623 proteins and genes Proteins 0.000 claims description 159
- 102000004169 proteins and genes Human genes 0.000 claims description 138
- 235000018102 proteins Nutrition 0.000 claims description 134
- 241000701024 Human betaherpesvirus 5 Species 0.000 claims description 130
- 230000004927 fusion Effects 0.000 claims description 56
- 230000002163 immunogen Effects 0.000 claims description 56
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 49
- 150000007523 nucleic acids Chemical class 0.000 claims description 40
- 235000004252 protein component Nutrition 0.000 claims description 35
- 108020004707 nucleic acids Proteins 0.000 claims description 31
- 102000039446 nucleic acids Human genes 0.000 claims description 31
- 238000000034 method Methods 0.000 claims description 27
- 239000002773 nucleotide Substances 0.000 claims description 26
- 125000003729 nucleotide group Chemical group 0.000 claims description 26
- 108010068327 4-hydroxyphenylpyruvate dioxygenase Proteins 0.000 claims description 24
- 241000700605 Viruses Species 0.000 claims description 21
- 239000013598 vector Substances 0.000 claims description 17
- 239000013638 trimer Substances 0.000 claims description 14
- 201000010099 disease Diseases 0.000 claims description 11
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 11
- 239000000178 monomer Substances 0.000 claims description 11
- 206010011831 Cytomegalovirus infection Diseases 0.000 claims description 9
- 230000004048 modification Effects 0.000 claims description 7
- 238000012986 modification Methods 0.000 claims description 7
- 239000002105 nanoparticle Substances 0.000 claims description 7
- 238000002255 vaccination Methods 0.000 claims description 7
- 230000001404 mediated effect Effects 0.000 claims description 6
- 230000002265 prevention Effects 0.000 claims description 6
- 238000011282 treatment Methods 0.000 claims description 6
- 241000894006 Bacteria Species 0.000 claims description 4
- 108010087302 Viral Structural Proteins Proteins 0.000 claims description 3
- 206010061603 Respiratory syncytial virus infection Diseases 0.000 claims description 2
- 230000001747 exhibiting effect Effects 0.000 claims description 2
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 claims 1
- 229910052698 phosphorus Inorganic materials 0.000 claims 1
- 239000011574 phosphorus Substances 0.000 claims 1
- 244000052769 pathogen Species 0.000 abstract description 13
- 108010076504 Protein Sorting Signals Proteins 0.000 description 82
- 239000000427 antigen Substances 0.000 description 68
- 102000036639 antigens Human genes 0.000 description 68
- 108091007433 antigens Proteins 0.000 description 68
- 210000004027 cell Anatomy 0.000 description 36
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 28
- 241000725643 Respiratory syncytial virus Species 0.000 description 28
- 229940024606 amino acid Drugs 0.000 description 28
- 235000001014 amino acid Nutrition 0.000 description 28
- 230000014509 gene expression Effects 0.000 description 28
- 108020004705 Codon Proteins 0.000 description 27
- 108020004414 DNA Proteins 0.000 description 27
- 150000001413 amino acids Chemical class 0.000 description 26
- 241000880493 Leptailurus serval Species 0.000 description 22
- 239000002671 adjuvant Substances 0.000 description 19
- 230000003053 immunization Effects 0.000 description 18
- 238000002649 immunization Methods 0.000 description 18
- 230000021615 conjugation Effects 0.000 description 17
- 230000003472 neutralizing effect Effects 0.000 description 17
- 102000004196 processed proteins & peptides Human genes 0.000 description 17
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 16
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 15
- 241000699670 Mus sp. Species 0.000 description 15
- 210000002966 serum Anatomy 0.000 description 15
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 15
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 14
- 108010034529 leucyl-lysine Proteins 0.000 description 14
- 238000001262 western blot Methods 0.000 description 14
- HKZAAJSTFUZYTO-LURJTMIESA-N (2s)-2-[[2-[[2-[[2-[(2-aminoacetyl)amino]acetyl]amino]acetyl]amino]acetyl]amino]-3-hydroxypropanoic acid Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O HKZAAJSTFUZYTO-LURJTMIESA-N 0.000 description 13
- KZZCOWMDDXDKSS-CIUDSAMLSA-N Leu-Ser-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KZZCOWMDDXDKSS-CIUDSAMLSA-N 0.000 description 13
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 13
- 230000028993 immune response Effects 0.000 description 13
- 230000005847 immunogenicity Effects 0.000 description 13
- 229920001184 polypeptide Polymers 0.000 description 13
- 102000003886 Glycoproteins Human genes 0.000 description 12
- 108090000288 Glycoproteins Proteins 0.000 description 12
- 238000000746 purification Methods 0.000 description 12
- 241000272186 Falco columbarius Species 0.000 description 11
- 101100315698 Human cytomegalovirus (strain Merlin) UL131A gene Proteins 0.000 description 11
- 108010057821 leucylproline Proteins 0.000 description 11
- 108010026333 seryl-proline Proteins 0.000 description 11
- FTVRVZNYIYWJGB-ACZMJKKPSA-N Ser-Asp-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FTVRVZNYIYWJGB-ACZMJKKPSA-N 0.000 description 10
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 10
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 10
- 108010005233 alanylglutamic acid Proteins 0.000 description 10
- YEBZNKPPOHFZJM-BPNCWPANSA-N Ala-Tyr-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O YEBZNKPPOHFZJM-BPNCWPANSA-N 0.000 description 9
- 238000002965 ELISA Methods 0.000 description 9
- YMEXHZTVKDAKIY-GHCJXIJMSA-N Ser-Asn-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO)C(O)=O YMEXHZTVKDAKIY-GHCJXIJMSA-N 0.000 description 9
- UIPXCLNLUUAMJU-JBDRJPRFSA-N Ser-Ile-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UIPXCLNLUUAMJU-JBDRJPRFSA-N 0.000 description 9
- 230000005875 antibody response Effects 0.000 description 9
- 108010025306 histidylleucine Proteins 0.000 description 9
- 108010092114 histidylphenylalanine Proteins 0.000 description 9
- 208000015181 infectious disease Diseases 0.000 description 9
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 9
- 108010051242 phenylalanylserine Proteins 0.000 description 9
- 108010031719 prolyl-serine Proteins 0.000 description 9
- 108010061238 threonyl-glycine Proteins 0.000 description 9
- 108010036211 5-HT-moduline Proteins 0.000 description 8
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 8
- 108091092195 Intron Proteins 0.000 description 8
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 8
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 8
- 108091028043 Nucleic acid sequence Proteins 0.000 description 8
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 8
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 8
- 125000000539 amino acid group Chemical group 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 8
- 238000013459 approach Methods 0.000 description 8
- 108010068380 arginylarginine Proteins 0.000 description 8
- 108010093581 aspartyl-proline Proteins 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 8
- 238000012217 deletion Methods 0.000 description 8
- 230000037430 deletion Effects 0.000 description 8
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 8
- 108010050848 glycylleucine Proteins 0.000 description 8
- 108010015796 prolylisoleucine Proteins 0.000 description 8
- 230000001681 protective effect Effects 0.000 description 8
- 238000005406 washing Methods 0.000 description 8
- LXAARTARZJJCMB-CIQUZCHMSA-N Ala-Ile-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LXAARTARZJJCMB-CIQUZCHMSA-N 0.000 description 7
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 7
- WMOMPXKOKASNBK-PEFMBERDSA-N Gln-Asn-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WMOMPXKOKASNBK-PEFMBERDSA-N 0.000 description 7
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 7
- IROABALAWGJQGM-OALUTQOASA-N Gly-Trp-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)NC(=O)CN IROABALAWGJQGM-OALUTQOASA-N 0.000 description 7
- 101710154606 Hemagglutinin Proteins 0.000 description 7
- 241000700721 Hepatitis B virus Species 0.000 description 7
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 7
- NNKLKUUGESXCBS-KBPBESRZSA-N Lys-Gly-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NNKLKUUGESXCBS-KBPBESRZSA-N 0.000 description 7
- SJDQOYTYNGZZJX-SRVKXCTJSA-N Met-Glu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SJDQOYTYNGZZJX-SRVKXCTJSA-N 0.000 description 7
- 241000699666 Mus <mouse, genus> Species 0.000 description 7
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 7
- 101710093908 Outer capsid protein VP4 Proteins 0.000 description 7
- 101710135467 Outer capsid protein sigma-1 Proteins 0.000 description 7
- 101710176177 Protein A56 Proteins 0.000 description 7
- PQLXHSACXPGWPD-GSSVUCPTSA-N Thr-Asn-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PQLXHSACXPGWPD-GSSVUCPTSA-N 0.000 description 7
- XTCNBOBTROGWMW-RWRJDSDZSA-N Thr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XTCNBOBTROGWMW-RWRJDSDZSA-N 0.000 description 7
- MNYNCKZAEIAONY-XGEHTFHBSA-N Thr-Val-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O MNYNCKZAEIAONY-XGEHTFHBSA-N 0.000 description 7
- UVHFONIHVHLDDQ-IFFSRLJSSA-N Val-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O UVHFONIHVHLDDQ-IFFSRLJSSA-N 0.000 description 7
- 238000001261 affinity purification Methods 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 7
- 238000003776 cleavage reaction Methods 0.000 description 7
- 238000009472 formulation Methods 0.000 description 7
- 239000012634 fragment Substances 0.000 description 7
- 108010010096 glycyl-glycyl-tyrosine Proteins 0.000 description 7
- 239000000185 hemagglutinin Substances 0.000 description 7
- 230000035772 mutation Effects 0.000 description 7
- 239000013612 plasmid Substances 0.000 description 7
- 230000007017 scission Effects 0.000 description 7
- 238000001542 size-exclusion chromatography Methods 0.000 description 7
- 239000000126 substance Substances 0.000 description 7
- 238000006467 substitution reaction Methods 0.000 description 7
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 7
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 7
- 108010051110 tyrosyl-lysine Proteins 0.000 description 7
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 6
- MDNAVFBZPROEHO-DCAQKATOSA-N Ala-Lys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MDNAVFBZPROEHO-DCAQKATOSA-N 0.000 description 6
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 6
- PYXXJFRXIYAESU-PCBIJLKTSA-N Asp-Ile-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PYXXJFRXIYAESU-PCBIJLKTSA-N 0.000 description 6
- RXBGWGRSWXOBGK-KKUMJFAQSA-N Asp-Lys-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RXBGWGRSWXOBGK-KKUMJFAQSA-N 0.000 description 6
- QOJJMJKTMKNFEF-ZKWXMUAHSA-N Asp-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O QOJJMJKTMKNFEF-ZKWXMUAHSA-N 0.000 description 6
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 6
- SBVMXEZQJVUARN-XPUUQOCRSA-N Gly-Val-Ser Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O SBVMXEZQJVUARN-XPUUQOCRSA-N 0.000 description 6
- SUPVSFFZWVOEOI-UHFFFAOYSA-N Leu-Ala-Tyr Natural products CC(C)CC(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-UHFFFAOYSA-N 0.000 description 6
- FOEHRHOBWFQSNW-KATARQTJSA-N Leu-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(C)C)N)O FOEHRHOBWFQSNW-KATARQTJSA-N 0.000 description 6
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 6
- HDHQQEDVWQGBEE-DCAQKATOSA-N Leu-Met-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O HDHQQEDVWQGBEE-DCAQKATOSA-N 0.000 description 6
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 6
- PXHCFKXNSBJSTQ-KKUMJFAQSA-N Lys-Asn-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N)O PXHCFKXNSBJSTQ-KKUMJFAQSA-N 0.000 description 6
- HWMZUBUEOYAQSC-DCAQKATOSA-N Lys-Gln-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O HWMZUBUEOYAQSC-DCAQKATOSA-N 0.000 description 6
- QKXZCUCBFPEXNK-KKUMJFAQSA-N Lys-Leu-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 QKXZCUCBFPEXNK-KKUMJFAQSA-N 0.000 description 6
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 6
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 6
- LDSOBEJVGGVWGD-DLOVCJGASA-N Phe-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 LDSOBEJVGGVWGD-DLOVCJGASA-N 0.000 description 6
- GPSMLZQVIIYLDK-ULQDDVLXSA-N Phe-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O GPSMLZQVIIYLDK-ULQDDVLXSA-N 0.000 description 6
- JFNPBBOGGNMSRX-CIUDSAMLSA-N Pro-Gln-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O JFNPBBOGGNMSRX-CIUDSAMLSA-N 0.000 description 6
- 108010003201 RGH 0205 Proteins 0.000 description 6
- MFQMZDPAZRZAPV-NAKRPEOUSA-N Ser-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CO)N MFQMZDPAZRZAPV-NAKRPEOUSA-N 0.000 description 6
- VXMHQKHDKCATDV-VEVYYDQMSA-N Thr-Asp-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VXMHQKHDKCATDV-VEVYYDQMSA-N 0.000 description 6
- UDQBCBUXAQIZAK-GLLZPBPUSA-N Thr-Glu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDQBCBUXAQIZAK-GLLZPBPUSA-N 0.000 description 6
- PCMDGXKXVMBIFP-VEVYYDQMSA-N Thr-Met-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(O)=O PCMDGXKXVMBIFP-VEVYYDQMSA-N 0.000 description 6
- WNQJTLATMXYSEL-OEAJRASXSA-N Thr-Phe-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WNQJTLATMXYSEL-OEAJRASXSA-N 0.000 description 6
- WTMPKZWHRCMMMT-KZVJFYERSA-N Thr-Pro-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WTMPKZWHRCMMMT-KZVJFYERSA-N 0.000 description 6
- DNCUODYZAMHLCV-XGEHTFHBSA-N Thr-Pro-Cys Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)O)N)O DNCUODYZAMHLCV-XGEHTFHBSA-N 0.000 description 6
- ZESGVALRVJIVLZ-VFCFLDTKSA-N Thr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O ZESGVALRVJIVLZ-VFCFLDTKSA-N 0.000 description 6
- OGNMURQZFMHFFD-NHCYSSNCSA-N Val-Asn-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N OGNMURQZFMHFFD-NHCYSSNCSA-N 0.000 description 6
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 6
- VCIYTVOBLZHFSC-XHSDSOJGSA-N Val-Phe-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N VCIYTVOBLZHFSC-XHSDSOJGSA-N 0.000 description 6
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 6
- 239000000872 buffer Substances 0.000 description 6
- 239000003795 chemical substances by application Substances 0.000 description 6
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 6
- 108010081985 glycyl-cystinyl-aspartic acid Proteins 0.000 description 6
- 108010012058 leucyltyrosine Proteins 0.000 description 6
- 108010064235 lysylglycine Proteins 0.000 description 6
- 108010054155 lysyllysine Proteins 0.000 description 6
- 239000003656 tris buffered saline Substances 0.000 description 6
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 5
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 5
- BOKLLPVAQDSLHC-FXQIFTODSA-N Ala-Val-Cys Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)O)N BOKLLPVAQDSLHC-FXQIFTODSA-N 0.000 description 5
- OMSKGWFGWCQFBD-KZVJFYERSA-N Ala-Val-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OMSKGWFGWCQFBD-KZVJFYERSA-N 0.000 description 5
- RFXXUWGNVRJTNQ-QXEWZRGKSA-N Arg-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N RFXXUWGNVRJTNQ-QXEWZRGKSA-N 0.000 description 5
- UZSQXCMNUPKLCC-FJXKBIBVSA-N Arg-Thr-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UZSQXCMNUPKLCC-FJXKBIBVSA-N 0.000 description 5
- QHBMKQWOIYJYMI-BYULHYEWSA-N Asn-Asn-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QHBMKQWOIYJYMI-BYULHYEWSA-N 0.000 description 5
- AWXDRZJQCVHCIT-DCAQKATOSA-N Asn-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(N)=O AWXDRZJQCVHCIT-DCAQKATOSA-N 0.000 description 5
- 238000011725 BALB/c mouse Methods 0.000 description 5
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 5
- 101100505161 Caenorhabditis elegans mel-32 gene Proteins 0.000 description 5
- 108091026890 Coding region Proteins 0.000 description 5
- ICRKQMRFXYDYMK-LAEOZQHASA-N Gln-Val-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ICRKQMRFXYDYMK-LAEOZQHASA-N 0.000 description 5
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 5
- YKBUCXNNBYZYAY-MNXVOIDGSA-N Glu-Lys-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YKBUCXNNBYZYAY-MNXVOIDGSA-N 0.000 description 5
- LWYUQLZOIORFFJ-XKBZYTNZSA-N Glu-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O LWYUQLZOIORFFJ-XKBZYTNZSA-N 0.000 description 5
- UZWUBBRJWFTHTD-LAEOZQHASA-N Glu-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O UZWUBBRJWFTHTD-LAEOZQHASA-N 0.000 description 5
- NVTPVQLIZCOJFK-FOHZUACHSA-N Gly-Thr-Asp Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O NVTPVQLIZCOJFK-FOHZUACHSA-N 0.000 description 5
- ADDYYRVQQZFIMW-MNXVOIDGSA-N Ile-Lys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ADDYYRVQQZFIMW-MNXVOIDGSA-N 0.000 description 5
- WCNWGAUZWWSYDG-SVSWQMSJSA-N Ile-Thr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)O)N WCNWGAUZWWSYDG-SVSWQMSJSA-N 0.000 description 5
- JZBVBOKASHNXAD-NAKRPEOUSA-N Ile-Val-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N JZBVBOKASHNXAD-NAKRPEOUSA-N 0.000 description 5
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 5
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 5
- KUIDCYNIEJBZBU-AJNGGQMLSA-N Leu-Ile-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O KUIDCYNIEJBZBU-AJNGGQMLSA-N 0.000 description 5
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 5
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 5
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 5
- MPOHDJKRBLVGCT-CIUDSAMLSA-N Lys-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N MPOHDJKRBLVGCT-CIUDSAMLSA-N 0.000 description 5
- DGAAQRAUOFHBFJ-CIUDSAMLSA-N Lys-Asn-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O DGAAQRAUOFHBFJ-CIUDSAMLSA-N 0.000 description 5
- XTONYTDATVADQH-CIUDSAMLSA-N Lys-Cys-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O XTONYTDATVADQH-CIUDSAMLSA-N 0.000 description 5
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 5
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 5
- YCJCEMKOZOYBEF-OEAJRASXSA-N Lys-Thr-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YCJCEMKOZOYBEF-OEAJRASXSA-N 0.000 description 5
- RZJOHSFAEZBWLK-CIUDSAMLSA-N Met-Gln-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N RZJOHSFAEZBWLK-CIUDSAMLSA-N 0.000 description 5
- 102000005348 Neuraminidase Human genes 0.000 description 5
- 108010006232 Neuraminidase Proteins 0.000 description 5
- HPECNYCQLSVCHH-BZSNNMDCSA-N Phe-Cys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N HPECNYCQLSVCHH-BZSNNMDCSA-N 0.000 description 5
- MVIJMIZJPHQGEN-IHRRRGAJSA-N Phe-Ser-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@H](CO)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 MVIJMIZJPHQGEN-IHRRRGAJSA-N 0.000 description 5
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 5
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 5
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 5
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 5
- MMTOHPRBJKEZHT-BWBBJGPYSA-N Thr-Cys-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O MMTOHPRBJKEZHT-BWBBJGPYSA-N 0.000 description 5
- IJVNLNRVDUTWDD-MEYUZBJRSA-N Thr-Leu-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IJVNLNRVDUTWDD-MEYUZBJRSA-N 0.000 description 5
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 description 5
- YTHWAWACWGWBLE-MNSWYVGCSA-N Trp-Tyr-Thr Chemical compound C([C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CC=C(O)C=C1 YTHWAWACWGWBLE-MNSWYVGCSA-N 0.000 description 5
- HZZKQZDUIKVFDZ-AVGNSLFASA-N Tyr-Gln-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)O HZZKQZDUIKVFDZ-AVGNSLFASA-N 0.000 description 5
- UJMCYJKPDFQLHX-XGEHTFHBSA-N Val-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N)O UJMCYJKPDFQLHX-XGEHTFHBSA-N 0.000 description 5
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 5
- 108010047857 aspartylglycine Proteins 0.000 description 5
- 238000003556 assay Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 108010015792 glycyllysine Proteins 0.000 description 5
- 108010037850 glycylvaline Proteins 0.000 description 5
- 238000004128 high performance liquid chromatography Methods 0.000 description 5
- 210000000987 immune system Anatomy 0.000 description 5
- 108010076756 leucyl-alanyl-phenylalanine Proteins 0.000 description 5
- 108010017391 lysylvaline Proteins 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 5
- 239000000546 pharmaceutical excipient Substances 0.000 description 5
- 108010053725 prolylvaline Proteins 0.000 description 5
- 230000002269 spontaneous effect Effects 0.000 description 5
- YYGNTYWPHWGJRM-AAJYLUCBSA-N squalene Chemical compound CC(C)=CCC\C(C)=C\CC\C(C)=C\CC\C=C(/C)CC\C=C(/C)CCC=C(C)C YYGNTYWPHWGJRM-AAJYLUCBSA-N 0.000 description 5
- 238000010186 staining Methods 0.000 description 5
- 239000006228 supernatant Substances 0.000 description 5
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 5
- JEPNLGMEZMCFEX-QSFUFRPTSA-N Ala-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C)N JEPNLGMEZMCFEX-QSFUFRPTSA-N 0.000 description 4
- ZKEHTYWGPMMGBC-XUXIUFHCSA-N Ala-Leu-Leu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O ZKEHTYWGPMMGBC-XUXIUFHCSA-N 0.000 description 4
- 108010011170 Ala-Trp-Arg-His-Pro-Gln-Phe-Gly-Gly Proteins 0.000 description 4
- KMSHNDWHPWXPEC-BQBZGAKWSA-N Arg-Asp-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KMSHNDWHPWXPEC-BQBZGAKWSA-N 0.000 description 4
- KBBKCNHWCDJPGN-GUBZILKMSA-N Arg-Gln-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KBBKCNHWCDJPGN-GUBZILKMSA-N 0.000 description 4
- MJINRRBEMOLJAK-DCAQKATOSA-N Arg-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N MJINRRBEMOLJAK-DCAQKATOSA-N 0.000 description 4
- KUYKVGODHGHFDI-ACZMJKKPSA-N Asn-Gln-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O KUYKVGODHGHFDI-ACZMJKKPSA-N 0.000 description 4
- KHCNTVRVAYCPQE-CIUDSAMLSA-N Asn-Lys-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O KHCNTVRVAYCPQE-CIUDSAMLSA-N 0.000 description 4
- SNAWMGHSCHKSDK-GUBZILKMSA-N Asp-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N SNAWMGHSCHKSDK-GUBZILKMSA-N 0.000 description 4
- HAFCJCDJGIOYPW-WDSKDSINSA-N Asp-Gly-Gln Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O HAFCJCDJGIOYPW-WDSKDSINSA-N 0.000 description 4
- XZKJEOMFLDVXJG-KATARQTJSA-N Cys-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CS)N)O XZKJEOMFLDVXJG-KATARQTJSA-N 0.000 description 4
- SRZZZTMJARUVPI-JBDRJPRFSA-N Cys-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N SRZZZTMJARUVPI-JBDRJPRFSA-N 0.000 description 4
- OAOOXBSVCJEIFY-QAETUUGQSA-N Gln-Leu-Leu-Pro Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O OAOOXBSVCJEIFY-QAETUUGQSA-N 0.000 description 4
- IRDASPPCLZIERZ-XHNCKOQMSA-N Glu-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N IRDASPPCLZIERZ-XHNCKOQMSA-N 0.000 description 4
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 4
- DLISPGXMKZTWQG-IFFSRLJSSA-N Glu-Thr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O DLISPGXMKZTWQG-IFFSRLJSSA-N 0.000 description 4
- 108010070675 Glutathione transferase Proteins 0.000 description 4
- 102000005720 Glutathione transferase Human genes 0.000 description 4
- JSNNHGHYGYMVCK-XVKPBYJWSA-N Gly-Glu-Val Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O JSNNHGHYGYMVCK-XVKPBYJWSA-N 0.000 description 4
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 4
- UWSMZKRTOZEGDD-CUJWVEQBSA-N His-Thr-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O UWSMZKRTOZEGDD-CUJWVEQBSA-N 0.000 description 4
- YOTNPRLPIPHQSB-XUXIUFHCSA-N Ile-Arg-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOTNPRLPIPHQSB-XUXIUFHCSA-N 0.000 description 4
- QSPLUJGYOPZINY-ZPFDUUQYSA-N Ile-Asp-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QSPLUJGYOPZINY-ZPFDUUQYSA-N 0.000 description 4
- FUOYNOXRWPJPAN-QEWYBTABSA-N Ile-Glu-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FUOYNOXRWPJPAN-QEWYBTABSA-N 0.000 description 4
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 4
- SVBAHOMTJRFSIC-SXTJYALSSA-N Ile-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SVBAHOMTJRFSIC-SXTJYALSSA-N 0.000 description 4
- TWYOYAKMLHWMOJ-ZPFDUUQYSA-N Ile-Leu-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O TWYOYAKMLHWMOJ-ZPFDUUQYSA-N 0.000 description 4
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 4
- SAEWJTCJQVZQNZ-IUKAMOBKSA-N Ile-Thr-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SAEWJTCJQVZQNZ-IUKAMOBKSA-N 0.000 description 4
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 4
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 4
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 4
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 4
- FIJMQLGQLBLBOL-HJGDQZAQSA-N Leu-Asn-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FIJMQLGQLBLBOL-HJGDQZAQSA-N 0.000 description 4
- DKEZVKFLETVJFY-CIUDSAMLSA-N Leu-Cys-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N DKEZVKFLETVJFY-CIUDSAMLSA-N 0.000 description 4
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 4
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 4
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 4
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 4
- YUTNOGOMBNYPFH-XUXIUFHCSA-N Leu-Pro-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YUTNOGOMBNYPFH-XUXIUFHCSA-N 0.000 description 4
- MVHXGBZUJLWZOH-BJDJZHNGSA-N Leu-Ser-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVHXGBZUJLWZOH-BJDJZHNGSA-N 0.000 description 4
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 4
- 102000003960 Ligases Human genes 0.000 description 4
- 108090000364 Ligases Proteins 0.000 description 4
- NNCDAORZCMPZPX-GUBZILKMSA-N Lys-Gln-Ser Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N NNCDAORZCMPZPX-GUBZILKMSA-N 0.000 description 4
- HAUUXTXKJNVIFY-ONGXEEELSA-N Lys-Gly-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAUUXTXKJNVIFY-ONGXEEELSA-N 0.000 description 4
- CBNMHRCLYBJIIZ-XUXIUFHCSA-N Lys-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCCN)N CBNMHRCLYBJIIZ-XUXIUFHCSA-N 0.000 description 4
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 4
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 4
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 4
- 108010066427 N-valyltryptophan Proteins 0.000 description 4
- BAONJAHBAUDJKA-BZSNNMDCSA-N Phe-Tyr-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=CC=C1 BAONJAHBAUDJKA-BZSNNMDCSA-N 0.000 description 4
- APZNYJFGVAGFCF-JYJNAYRXSA-N Phe-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccccc1)C(C)C)C(O)=O APZNYJFGVAGFCF-JYJNAYRXSA-N 0.000 description 4
- OBXVZEAMXFSGPU-FXQIFTODSA-N Ser-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)CN=C(N)N OBXVZEAMXFSGPU-FXQIFTODSA-N 0.000 description 4
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 4
- AEGUWTFAQQWVLC-BQBZGAKWSA-N Ser-Gly-Arg Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEGUWTFAQQWVLC-BQBZGAKWSA-N 0.000 description 4
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 4
- MQUZANJDFOQOBX-SRVKXCTJSA-N Ser-Phe-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O MQUZANJDFOQOBX-SRVKXCTJSA-N 0.000 description 4
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 4
- VVKVHAOOUGNDPJ-SRVKXCTJSA-N Ser-Tyr-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VVKVHAOOUGNDPJ-SRVKXCTJSA-N 0.000 description 4
- UKBSDLHIKIXJKH-HJGDQZAQSA-N Thr-Arg-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UKBSDLHIKIXJKH-HJGDQZAQSA-N 0.000 description 4
- JTEICXDKGWKRRV-HJGDQZAQSA-N Thr-Asn-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O JTEICXDKGWKRRV-HJGDQZAQSA-N 0.000 description 4
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 4
- ADPHPKGWVDHWML-PPCPHDFISA-N Thr-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N ADPHPKGWVDHWML-PPCPHDFISA-N 0.000 description 4
- HPQHHRLWSAMMKG-KATARQTJSA-N Thr-Lys-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)O)N)O HPQHHRLWSAMMKG-KATARQTJSA-N 0.000 description 4
- IQPWNQRRAJHOKV-KATARQTJSA-N Thr-Ser-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN IQPWNQRRAJHOKV-KATARQTJSA-N 0.000 description 4
- 239000007983 Tris buffer Substances 0.000 description 4
- NWQCKAPDGQMZQN-IHPCNDPISA-N Trp-Lys-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O NWQCKAPDGQMZQN-IHPCNDPISA-N 0.000 description 4
- JKUZFODWJGEQAP-KBPBESRZSA-N Tyr-Gly-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O JKUZFODWJGEQAP-KBPBESRZSA-N 0.000 description 4
- OFHKXNKJXURPSY-ULQDDVLXSA-N Tyr-Met-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O OFHKXNKJXURPSY-ULQDDVLXSA-N 0.000 description 4
- GOPQNCQSXBJAII-ULQDDVLXSA-N Tyr-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N GOPQNCQSXBJAII-ULQDDVLXSA-N 0.000 description 4
- JYVKKBDANPZIAW-AVGNSLFASA-N Val-Arg-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](C(C)C)N JYVKKBDANPZIAW-AVGNSLFASA-N 0.000 description 4
- XIFAHCUNWWKUDE-DCAQKATOSA-N Val-Cys-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N XIFAHCUNWWKUDE-DCAQKATOSA-N 0.000 description 4
- VFOHXOLPLACADK-GVXVVHGQSA-N Val-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N VFOHXOLPLACADK-GVXVVHGQSA-N 0.000 description 4
- XWYUBUYQMOUFRQ-IFFSRLJSSA-N Val-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N)O XWYUBUYQMOUFRQ-IFFSRLJSSA-N 0.000 description 4
- NXRAUQGGHPCJIB-RCOVLWMOSA-N Val-Gly-Asn Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O NXRAUQGGHPCJIB-RCOVLWMOSA-N 0.000 description 4
- XTDDIVQWDXMRJL-IHRRRGAJSA-N Val-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N XTDDIVQWDXMRJL-IHRRRGAJSA-N 0.000 description 4
- YQMILNREHKTFBS-IHRRRGAJSA-N Val-Phe-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)O)N YQMILNREHKTFBS-IHRRRGAJSA-N 0.000 description 4
- KSFXWENSJABBFI-ZKWXMUAHSA-N Val-Ser-Asn Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KSFXWENSJABBFI-ZKWXMUAHSA-N 0.000 description 4
- QZKVWWIUSQGWMY-IHRRRGAJSA-N Val-Ser-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QZKVWWIUSQGWMY-IHRRRGAJSA-N 0.000 description 4
- 108010044940 alanylglutamine Proteins 0.000 description 4
- 108010087924 alanylproline Proteins 0.000 description 4
- 108010038633 aspartylglutamate Proteins 0.000 description 4
- 108010092854 aspartyllysine Proteins 0.000 description 4
- 108010068265 aspartyltyrosine Proteins 0.000 description 4
- 230000002238 attenuated effect Effects 0.000 description 4
- 238000010241 blood sampling Methods 0.000 description 4
- 230000001413 cellular effect Effects 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 4
- 239000000839 emulsion Substances 0.000 description 4
- 108020001507 fusion proteins Proteins 0.000 description 4
- 102000037865 fusion proteins Human genes 0.000 description 4
- 108010078144 glutaminyl-glycine Proteins 0.000 description 4
- 108010049041 glutamylalanine Proteins 0.000 description 4
- 230000013595 glycosylation Effects 0.000 description 4
- 238000006206 glycosylation reaction Methods 0.000 description 4
- 239000012678 infectious agent Substances 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 108010027338 isoleucylcysteine Proteins 0.000 description 4
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 4
- 108010000761 leucylarginine Proteins 0.000 description 4
- 108010010679 lysyl-valyl-leucyl-aspartic acid Proteins 0.000 description 4
- 229940124735 malaria vaccine Drugs 0.000 description 4
- 210000004962 mammalian cell Anatomy 0.000 description 4
- 230000001717 pathogenic effect Effects 0.000 description 4
- 239000008194 pharmaceutical composition Substances 0.000 description 4
- 108091033319 polynucleotide Proteins 0.000 description 4
- 102000040430 polynucleotide Human genes 0.000 description 4
- 239000002157 polynucleotide Substances 0.000 description 4
- 108010004914 prolylarginine Proteins 0.000 description 4
- 229940023143 protein vaccine Drugs 0.000 description 4
- 230000002829 reductive effect Effects 0.000 description 4
- 239000011780 sodium chloride Substances 0.000 description 4
- PRAKJMSDJKAYCZ-UHFFFAOYSA-N squalane Chemical compound CC(C)CCCC(C)CCCC(C)CCCCC(C)CCCC(C)CCCC(C)C PRAKJMSDJKAYCZ-UHFFFAOYSA-N 0.000 description 4
- 230000010473 stable expression Effects 0.000 description 4
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 4
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 4
- 108010027345 wheylin-1 peptide Proteins 0.000 description 4
- AXFMEGAFCUULFV-BLFANLJRSA-N (2s)-2-[[(2s)-1-[(2s,3r)-2-amino-3-methylpentanoyl]pyrrolidine-2-carbonyl]amino]pentanedioic acid Chemical compound CC[C@@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AXFMEGAFCUULFV-BLFANLJRSA-N 0.000 description 3
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 3
- LBYMZCVBOKYZNS-CIUDSAMLSA-N Ala-Leu-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O LBYMZCVBOKYZNS-CIUDSAMLSA-N 0.000 description 3
- VHVVPYOJIIQCKS-QEJZJMRPSA-N Ala-Leu-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VHVVPYOJIIQCKS-QEJZJMRPSA-N 0.000 description 3
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 3
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 3
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 3
- XRUJOVRWNMBAAA-NHCYSSNCSA-N Ala-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 XRUJOVRWNMBAAA-NHCYSSNCSA-N 0.000 description 3
- RUXQNKVQSKOOBS-JURCDPSOSA-N Ala-Phe-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RUXQNKVQSKOOBS-JURCDPSOSA-N 0.000 description 3
- MAZZQZWCCYJQGZ-GUBZILKMSA-N Ala-Pro-Arg Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MAZZQZWCCYJQGZ-GUBZILKMSA-N 0.000 description 3
- CQJHFKKGZXKZBC-BPNCWPANSA-N Ala-Pro-Tyr Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CQJHFKKGZXKZBC-BPNCWPANSA-N 0.000 description 3
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 3
- BVLPIIBTWIYOML-ZKWXMUAHSA-N Ala-Val-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BVLPIIBTWIYOML-ZKWXMUAHSA-N 0.000 description 3
- SGYSTDWPNPKJPP-GUBZILKMSA-N Arg-Ala-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SGYSTDWPNPKJPP-GUBZILKMSA-N 0.000 description 3
- UXJCMQFPDWCHKX-DCAQKATOSA-N Arg-Arg-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UXJCMQFPDWCHKX-DCAQKATOSA-N 0.000 description 3
- PVSNBTCXCQIXSE-JYJNAYRXSA-N Arg-Arg-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PVSNBTCXCQIXSE-JYJNAYRXSA-N 0.000 description 3
- DPNHSNLIULPOBH-GUBZILKMSA-N Arg-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N DPNHSNLIULPOBH-GUBZILKMSA-N 0.000 description 3
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 3
- NPAVRDPEFVKELR-DCAQKATOSA-N Arg-Lys-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NPAVRDPEFVKELR-DCAQKATOSA-N 0.000 description 3
- MFFOYNGMOYFPBD-DCAQKATOSA-N Asn-Arg-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MFFOYNGMOYFPBD-DCAQKATOSA-N 0.000 description 3
- JEPNYDRDYNSFIU-QXEWZRGKSA-N Asn-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(N)=O)C(O)=O JEPNYDRDYNSFIU-QXEWZRGKSA-N 0.000 description 3
- KWQPAXYXVMHJJR-AVGNSLFASA-N Asn-Gln-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KWQPAXYXVMHJJR-AVGNSLFASA-N 0.000 description 3
- FVKHEKVYFTZWDX-GHCJXIJMSA-N Asn-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N FVKHEKVYFTZWDX-GHCJXIJMSA-N 0.000 description 3
- XVBDDUPJVQXDSI-PEFMBERDSA-N Asn-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N XVBDDUPJVQXDSI-PEFMBERDSA-N 0.000 description 3
- RCFGLXMZDYNRSC-CIUDSAMLSA-N Asn-Lys-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O RCFGLXMZDYNRSC-CIUDSAMLSA-N 0.000 description 3
- JWKDQOORUCYUIW-ZPFDUUQYSA-N Asn-Lys-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JWKDQOORUCYUIW-ZPFDUUQYSA-N 0.000 description 3
- GZXOUBTUAUAVHD-ACZMJKKPSA-N Asn-Ser-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GZXOUBTUAUAVHD-ACZMJKKPSA-N 0.000 description 3
- VLDRQOHCMKCXLY-SRVKXCTJSA-N Asn-Ser-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VLDRQOHCMKCXLY-SRVKXCTJSA-N 0.000 description 3
- KVMPVNGOKHTUHZ-GCJQMDKQSA-N Asp-Ala-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KVMPVNGOKHTUHZ-GCJQMDKQSA-N 0.000 description 3
- YNQIDCRRTWGHJD-ZLUOBGJFSA-N Asp-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(O)=O YNQIDCRRTWGHJD-ZLUOBGJFSA-N 0.000 description 3
- VPSHHQXIWLGVDD-ZLUOBGJFSA-N Asp-Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VPSHHQXIWLGVDD-ZLUOBGJFSA-N 0.000 description 3
- PXLNPFOJZQMXAT-BYULHYEWSA-N Asp-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O PXLNPFOJZQMXAT-BYULHYEWSA-N 0.000 description 3
- ACEDJCOOPZFUBU-CIUDSAMLSA-N Asp-Cys-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N ACEDJCOOPZFUBU-CIUDSAMLSA-N 0.000 description 3
- ICZWAZVKLACMKR-CIUDSAMLSA-N Asp-His-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CN=CN1 ICZWAZVKLACMKR-CIUDSAMLSA-N 0.000 description 3
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 3
- QNIACYURSSCLRP-GUBZILKMSA-N Asp-Lys-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O QNIACYURSSCLRP-GUBZILKMSA-N 0.000 description 3
- RRUWMFBLFLUZSI-LPEHRKFASA-N Asp-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N RRUWMFBLFLUZSI-LPEHRKFASA-N 0.000 description 3
- BYLPQJAWXJWUCJ-YDHLFZDLSA-N Asp-Tyr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O BYLPQJAWXJWUCJ-YDHLFZDLSA-N 0.000 description 3
- 108090000565 Capsid Proteins Proteins 0.000 description 3
- 101710132601 Capsid protein Proteins 0.000 description 3
- 101710094648 Coat protein Proteins 0.000 description 3
- NDUSUIGBMZCOIL-ZKWXMUAHSA-N Cys-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CS)N NDUSUIGBMZCOIL-ZKWXMUAHSA-N 0.000 description 3
- UWXFFVQPAMBETM-ZLUOBGJFSA-N Cys-Asp-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O UWXFFVQPAMBETM-ZLUOBGJFSA-N 0.000 description 3
- XRTISHJEPHMBJG-SRVKXCTJSA-N Cys-Asp-Tyr Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XRTISHJEPHMBJG-SRVKXCTJSA-N 0.000 description 3
- CUXIOFHFFXNUGG-HTFCKZLJSA-N Cys-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CS)N CUXIOFHFFXNUGG-HTFCKZLJSA-N 0.000 description 3
- 102000004190 Enzymes Human genes 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 3
- 101710189104 Fibritin Proteins 0.000 description 3
- WLODHVXYKYHLJD-ACZMJKKPSA-N Gln-Asp-Ser Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N WLODHVXYKYHLJD-ACZMJKKPSA-N 0.000 description 3
- FFVXLVGUJBCKRX-UKJIMTQDSA-N Gln-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCC(=O)N)N FFVXLVGUJBCKRX-UKJIMTQDSA-N 0.000 description 3
- JNENSVNAUWONEZ-GUBZILKMSA-N Gln-Lys-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O JNENSVNAUWONEZ-GUBZILKMSA-N 0.000 description 3
- JRHPEMVLTRADLJ-AVGNSLFASA-N Gln-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JRHPEMVLTRADLJ-AVGNSLFASA-N 0.000 description 3
- MFHVAWMMKZBSRQ-ACZMJKKPSA-N Gln-Ser-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N MFHVAWMMKZBSRQ-ACZMJKKPSA-N 0.000 description 3
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 3
- GHAXJVNBAKGWEJ-AVGNSLFASA-N Gln-Ser-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GHAXJVNBAKGWEJ-AVGNSLFASA-N 0.000 description 3
- XIYWAJQIWLXXAF-XKBZYTNZSA-N Gln-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O XIYWAJQIWLXXAF-XKBZYTNZSA-N 0.000 description 3
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 3
- GCYFUZJHAXJKKE-KKUMJFAQSA-N Glu-Arg-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GCYFUZJHAXJKKE-KKUMJFAQSA-N 0.000 description 3
- OGNJZUXUTPQVBR-BQBZGAKWSA-N Glu-Gly-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OGNJZUXUTPQVBR-BQBZGAKWSA-N 0.000 description 3
- RAUDKMVXNOWDLS-WDSKDSINSA-N Glu-Gly-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O RAUDKMVXNOWDLS-WDSKDSINSA-N 0.000 description 3
- YGLCLCMAYUYZSG-AVGNSLFASA-N Glu-Lys-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 YGLCLCMAYUYZSG-AVGNSLFASA-N 0.000 description 3
- WZAYJXZPSJOXCP-QAETUUGQSA-N Glu-Phe-Gln-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](CCC(O)=O)N)CC1=CC=CC=C1 WZAYJXZPSJOXCP-QAETUUGQSA-N 0.000 description 3
- DXVOKNVIKORTHQ-GUBZILKMSA-N Glu-Pro-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O DXVOKNVIKORTHQ-GUBZILKMSA-N 0.000 description 3
- JYXKPJVDCAWMDG-ZPFDUUQYSA-N Glu-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)O)N JYXKPJVDCAWMDG-ZPFDUUQYSA-N 0.000 description 3
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 3
- CQGBSALYGOXQPE-HTUGSXCWSA-N Glu-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O CQGBSALYGOXQPE-HTUGSXCWSA-N 0.000 description 3
- UUTGYDAKPISJAO-JYJNAYRXSA-N Glu-Tyr-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 UUTGYDAKPISJAO-JYJNAYRXSA-N 0.000 description 3
- VIPDPMHGICREIS-GVXVVHGQSA-N Glu-Val-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VIPDPMHGICREIS-GVXVVHGQSA-N 0.000 description 3
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 3
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 3
- BEQGFMIBZFNROK-JGVFFNPUSA-N Gly-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)CN)C(=O)O BEQGFMIBZFNROK-JGVFFNPUSA-N 0.000 description 3
- JNGJGFMFXREJNF-KBPBESRZSA-N Gly-Glu-Trp Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JNGJGFMFXREJNF-KBPBESRZSA-N 0.000 description 3
- GWCJMBNBFYBQCV-XPUUQOCRSA-N Gly-Val-Ala Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O GWCJMBNBFYBQCV-XPUUQOCRSA-N 0.000 description 3
- 102100021181 Golgi phosphoprotein 3 Human genes 0.000 description 3
- MWWOPNQSBXEUHO-ULQDDVLXSA-N His-Arg-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 MWWOPNQSBXEUHO-ULQDDVLXSA-N 0.000 description 3
- OQDLKDUVMTUPPG-AVGNSLFASA-N His-Leu-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OQDLKDUVMTUPPG-AVGNSLFASA-N 0.000 description 3
- BXOLYFJYQQRQDJ-MXAVVETBSA-N His-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CN=CN1)N BXOLYFJYQQRQDJ-MXAVVETBSA-N 0.000 description 3
- FFKJUTZARGRVTH-KKUMJFAQSA-N His-Ser-Tyr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O FFKJUTZARGRVTH-KKUMJFAQSA-N 0.000 description 3
- ZZHGKECPZXPXJF-PCBIJLKTSA-N Ile-Asn-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZZHGKECPZXPXJF-PCBIJLKTSA-N 0.000 description 3
- GYAFMRQGWHXMII-IUKAMOBKSA-N Ile-Asp-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N GYAFMRQGWHXMII-IUKAMOBKSA-N 0.000 description 3
- DURWCDDDAWVPOP-JBDRJPRFSA-N Ile-Cys-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N DURWCDDDAWVPOP-JBDRJPRFSA-N 0.000 description 3
- HOLOYAZCIHDQNS-YVNDNENWSA-N Ile-Gln-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HOLOYAZCIHDQNS-YVNDNENWSA-N 0.000 description 3
- IOVUXUSIGXCREV-DKIMLUQUSA-N Ile-Leu-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IOVUXUSIGXCREV-DKIMLUQUSA-N 0.000 description 3
- AKOYRLRUFBZOSP-BJDJZHNGSA-N Ile-Lys-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N AKOYRLRUFBZOSP-BJDJZHNGSA-N 0.000 description 3
- BKPPWVSPSIUXHZ-OSUNSFLBSA-N Ile-Met-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N BKPPWVSPSIUXHZ-OSUNSFLBSA-N 0.000 description 3
- 206010061598 Immunodeficiency Diseases 0.000 description 3
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 3
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 3
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 3
- XIRYQRLFHWWWTC-QEJZJMRPSA-N Leu-Ala-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XIRYQRLFHWWWTC-QEJZJMRPSA-N 0.000 description 3
- SUPVSFFZWVOEOI-CQDKDKBSSA-N Leu-Ala-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-CQDKDKBSSA-N 0.000 description 3
- HBJZFCIVFIBNSV-DCAQKATOSA-N Leu-Arg-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O HBJZFCIVFIBNSV-DCAQKATOSA-N 0.000 description 3
- GRZSCTXVCDUIPO-SRVKXCTJSA-N Leu-Arg-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRZSCTXVCDUIPO-SRVKXCTJSA-N 0.000 description 3
- IGUOAYLTQJLPPD-DCAQKATOSA-N Leu-Asn-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IGUOAYLTQJLPPD-DCAQKATOSA-N 0.000 description 3
- POJPZSMTTMLSTG-SRVKXCTJSA-N Leu-Asn-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N POJPZSMTTMLSTG-SRVKXCTJSA-N 0.000 description 3
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 3
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 3
- HPBCTWSUJOGJSH-MNXVOIDGSA-N Leu-Glu-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HPBCTWSUJOGJSH-MNXVOIDGSA-N 0.000 description 3
- FIYMBBHGYNQFOP-IUCAKERBSA-N Leu-Gly-Gln Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N FIYMBBHGYNQFOP-IUCAKERBSA-N 0.000 description 3
- KEVYYIMVELOXCT-KBPBESRZSA-N Leu-Gly-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KEVYYIMVELOXCT-KBPBESRZSA-N 0.000 description 3
- IFMPDNRWZZEZSL-SRVKXCTJSA-N Leu-Leu-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(O)=O IFMPDNRWZZEZSL-SRVKXCTJSA-N 0.000 description 3
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 3
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 3
- ZDBMWELMUCLUPL-QEJZJMRPSA-N Leu-Phe-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ZDBMWELMUCLUPL-QEJZJMRPSA-N 0.000 description 3
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 3
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 3
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 3
- ADJWHHZETYAAAX-SRVKXCTJSA-N Leu-Ser-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ADJWHHZETYAAAX-SRVKXCTJSA-N 0.000 description 3
- WUHBLPVELFTPQK-KKUMJFAQSA-N Leu-Tyr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O WUHBLPVELFTPQK-KKUMJFAQSA-N 0.000 description 3
- SXOFUVGLPHCPRQ-KKUMJFAQSA-N Leu-Tyr-Cys Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(O)=O SXOFUVGLPHCPRQ-KKUMJFAQSA-N 0.000 description 3
- WFCKERTZVCQXKH-KBPBESRZSA-N Leu-Tyr-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O WFCKERTZVCQXKH-KBPBESRZSA-N 0.000 description 3
- AXVIGSRGTMNSJU-YESZJQIVSA-N Leu-Tyr-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N AXVIGSRGTMNSJU-YESZJQIVSA-N 0.000 description 3
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 3
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 3
- YIBOAHAOAWACDK-QEJZJMRPSA-N Lys-Ala-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YIBOAHAOAWACDK-QEJZJMRPSA-N 0.000 description 3
- WXJKFRMKJORORD-DCAQKATOSA-N Lys-Arg-Ala Chemical compound NC(=N)NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CCCCN WXJKFRMKJORORD-DCAQKATOSA-N 0.000 description 3
- DNEJSAIMVANNPA-DCAQKATOSA-N Lys-Asn-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DNEJSAIMVANNPA-DCAQKATOSA-N 0.000 description 3
- ABHIXYDMILIUKV-CIUDSAMLSA-N Lys-Asn-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ABHIXYDMILIUKV-CIUDSAMLSA-N 0.000 description 3
- HIIZIQUUHIXUJY-GUBZILKMSA-N Lys-Asp-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HIIZIQUUHIXUJY-GUBZILKMSA-N 0.000 description 3
- XFBBBRDEQIPGNR-KATARQTJSA-N Lys-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCCN)N)O XFBBBRDEQIPGNR-KATARQTJSA-N 0.000 description 3
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 3
- GCMWRRQAKQXDED-IUCAKERBSA-N Lys-Glu-Gly Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)N[C@@H](CCC([O-])=O)C(=O)NCC([O-])=O GCMWRRQAKQXDED-IUCAKERBSA-N 0.000 description 3
- HKXSZKJMDBHOTG-CIUDSAMLSA-N Lys-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN HKXSZKJMDBHOTG-CIUDSAMLSA-N 0.000 description 3
- IEVXCWPVBYCJRZ-IXOXFDKPSA-N Lys-Thr-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IEVXCWPVBYCJRZ-IXOXFDKPSA-N 0.000 description 3
- XABXVVSWUVCZST-GVXVVHGQSA-N Lys-Val-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN XABXVVSWUVCZST-GVXVVHGQSA-N 0.000 description 3
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 3
- 101710125418 Major capsid protein Proteins 0.000 description 3
- 108010052285 Membrane Proteins Proteins 0.000 description 3
- WYEXWKAWMNJKPN-UBHSHLNASA-N Met-Ala-Phe Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCSC)N WYEXWKAWMNJKPN-UBHSHLNASA-N 0.000 description 3
- GTRWUQSSISWRTL-NAKRPEOUSA-N Met-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCSC)N GTRWUQSSISWRTL-NAKRPEOUSA-N 0.000 description 3
- XDGFFEZAZHRZFR-RHYQMDGZSA-N Met-Leu-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XDGFFEZAZHRZFR-RHYQMDGZSA-N 0.000 description 3
- QLESZRANMSYLCZ-CYDGBPFRSA-N Met-Pro-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O QLESZRANMSYLCZ-CYDGBPFRSA-N 0.000 description 3
- 108010079364 N-glycylalanine Proteins 0.000 description 3
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 3
- 101710141454 Nucleoprotein Proteins 0.000 description 3
- FPTXMUIBLMGTQH-ONGXEEELSA-N Phe-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 FPTXMUIBLMGTQH-ONGXEEELSA-N 0.000 description 3
- ZBYHVSHBZYHQBW-SRVKXCTJSA-N Phe-Cys-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ZBYHVSHBZYHQBW-SRVKXCTJSA-N 0.000 description 3
- OPEVYHFJXLCCRT-AVGNSLFASA-N Phe-Gln-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O OPEVYHFJXLCCRT-AVGNSLFASA-N 0.000 description 3
- QRUOLOPKCOEZKU-HJWJTTGWSA-N Phe-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=CC=C1)N QRUOLOPKCOEZKU-HJWJTTGWSA-N 0.000 description 3
- MSSXKZBDKZAHCX-UNQGMJICSA-N Phe-Thr-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O MSSXKZBDKZAHCX-UNQGMJICSA-N 0.000 description 3
- ZYNBEWGJFXTBDU-ACRUOGEOSA-N Phe-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CC=CC=C2)N ZYNBEWGJFXTBDU-ACRUOGEOSA-N 0.000 description 3
- 241000223960 Plasmodium falciparum Species 0.000 description 3
- HFZNNDWPHBRNPV-KZVJFYERSA-N Pro-Ala-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HFZNNDWPHBRNPV-KZVJFYERSA-N 0.000 description 3
- CKXMGSJPDQXBPG-JYJNAYRXSA-N Pro-Cys-Trp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O CKXMGSJPDQXBPG-JYJNAYRXSA-N 0.000 description 3
- YSUZKYSRAFNLRB-ULQDDVLXSA-N Pro-Gln-Trp Chemical compound N([C@@H](CCC(=O)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C(=O)[C@@H]1CCCN1 YSUZKYSRAFNLRB-ULQDDVLXSA-N 0.000 description 3
- JUJGNDZIKKQMDJ-IHRRRGAJSA-N Pro-His-His Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O JUJGNDZIKKQMDJ-IHRRRGAJSA-N 0.000 description 3
- FMLRRBDLBJLJIK-DCAQKATOSA-N Pro-Leu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FMLRRBDLBJLJIK-DCAQKATOSA-N 0.000 description 3
- CLJLVCYFABNTHP-DCAQKATOSA-N Pro-Leu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O CLJLVCYFABNTHP-DCAQKATOSA-N 0.000 description 3
- XYSXOCIWCPFOCG-IHRRRGAJSA-N Pro-Leu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XYSXOCIWCPFOCG-IHRRRGAJSA-N 0.000 description 3
- JLMZKEQFMVORMA-SRVKXCTJSA-N Pro-Pro-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 JLMZKEQFMVORMA-SRVKXCTJSA-N 0.000 description 3
- FNGOXVQBBCMFKV-CIUDSAMLSA-N Pro-Ser-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O FNGOXVQBBCMFKV-CIUDSAMLSA-N 0.000 description 3
- FIODMZKLZFLYQP-GUBZILKMSA-N Pro-Val-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FIODMZKLZFLYQP-GUBZILKMSA-N 0.000 description 3
- YDTUEBLEAVANFH-RCWTZXSCSA-N Pro-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 YDTUEBLEAVANFH-RCWTZXSCSA-N 0.000 description 3
- 101710083689 Probable capsid protein Proteins 0.000 description 3
- WTWGOQRNRFHFQD-JBDRJPRFSA-N Ser-Ala-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WTWGOQRNRFHFQD-JBDRJPRFSA-N 0.000 description 3
- OYEDZGNMSBZCIM-XGEHTFHBSA-N Ser-Arg-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OYEDZGNMSBZCIM-XGEHTFHBSA-N 0.000 description 3
- VGNYHOBZJKWRGI-CIUDSAMLSA-N Ser-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO VGNYHOBZJKWRGI-CIUDSAMLSA-N 0.000 description 3
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 3
- KJMOINFQVCCSDX-XKBZYTNZSA-N Ser-Gln-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KJMOINFQVCCSDX-XKBZYTNZSA-N 0.000 description 3
- JEHPKECJCALLRW-CUJWVEQBSA-N Ser-His-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEHPKECJCALLRW-CUJWVEQBSA-N 0.000 description 3
- YMDNFPNTIPQMJP-NAKRPEOUSA-N Ser-Ile-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(O)=O YMDNFPNTIPQMJP-NAKRPEOUSA-N 0.000 description 3
- LRZLZIUXQBIWTB-KATARQTJSA-N Ser-Lys-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRZLZIUXQBIWTB-KATARQTJSA-N 0.000 description 3
- RRVFEDGUXSYWOW-BZSNNMDCSA-N Ser-Phe-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RRVFEDGUXSYWOW-BZSNNMDCSA-N 0.000 description 3
- NUEHQDHDLDXCRU-GUBZILKMSA-N Ser-Pro-Arg Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NUEHQDHDLDXCRU-GUBZILKMSA-N 0.000 description 3
- FLONGDPORFIVQW-XGEHTFHBSA-N Ser-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FLONGDPORFIVQW-XGEHTFHBSA-N 0.000 description 3
- ZKOKTQPHFMRSJP-YJRXYDGGSA-N Ser-Thr-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKOKTQPHFMRSJP-YJRXYDGGSA-N 0.000 description 3
- BDMWLJLPPUCLNV-XGEHTFHBSA-N Ser-Thr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BDMWLJLPPUCLNV-XGEHTFHBSA-N 0.000 description 3
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 3
- XSLXHSYIVPGEER-KZVJFYERSA-N Thr-Ala-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O XSLXHSYIVPGEER-KZVJFYERSA-N 0.000 description 3
- YLXAMFZYJTZXFH-OLHMAJIHSA-N Thr-Asn-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O YLXAMFZYJTZXFH-OLHMAJIHSA-N 0.000 description 3
- PZVGOVRNGKEFCB-KKHAAJSZSA-N Thr-Asn-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N)O PZVGOVRNGKEFCB-KKHAAJSZSA-N 0.000 description 3
- ASJDFGOPDCVXTG-KATARQTJSA-N Thr-Cys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O ASJDFGOPDCVXTG-KATARQTJSA-N 0.000 description 3
- UHBPFYOQQPFKQR-JHEQGTHGSA-N Thr-Gln-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O UHBPFYOQQPFKQR-JHEQGTHGSA-N 0.000 description 3
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 3
- YDWLCDQXLCILCZ-BWAGICSOSA-N Thr-His-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YDWLCDQXLCILCZ-BWAGICSOSA-N 0.000 description 3
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 3
- BDENGIGFTNYZSJ-RCWTZXSCSA-N Thr-Pro-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(O)=O BDENGIGFTNYZSJ-RCWTZXSCSA-N 0.000 description 3
- VUXIQSUQQYNLJP-XAVMHZPKSA-N Thr-Ser-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N)O VUXIQSUQQYNLJP-XAVMHZPKSA-N 0.000 description 3
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 3
- KPMIQCXJDVKWKO-IFFSRLJSSA-N Thr-Val-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KPMIQCXJDVKWKO-IFFSRLJSSA-N 0.000 description 3
- ILUOMMDDGREELW-OSUNSFLBSA-N Thr-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O ILUOMMDDGREELW-OSUNSFLBSA-N 0.000 description 3
- DTPWXZXGFAHEKL-NWLDYVSISA-N Trp-Thr-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DTPWXZXGFAHEKL-NWLDYVSISA-N 0.000 description 3
- MBFJIHUHHCJBSN-AVGNSLFASA-N Tyr-Asn-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MBFJIHUHHCJBSN-AVGNSLFASA-N 0.000 description 3
- BEIGSKUPTIFYRZ-SRVKXCTJSA-N Tyr-Asp-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O BEIGSKUPTIFYRZ-SRVKXCTJSA-N 0.000 description 3
- HGEHWFGAKHSIDY-SRVKXCTJSA-N Tyr-Asp-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N)O HGEHWFGAKHSIDY-SRVKXCTJSA-N 0.000 description 3
- CTDPLKMBVALCGN-JSGCOSHPSA-N Tyr-Gly-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O CTDPLKMBVALCGN-JSGCOSHPSA-N 0.000 description 3
- OHOVFPKXPZODHS-SJWGOKEGSA-N Tyr-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OHOVFPKXPZODHS-SJWGOKEGSA-N 0.000 description 3
- AEOFMCAKYIQQFY-YDHLFZDLSA-N Tyr-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AEOFMCAKYIQQFY-YDHLFZDLSA-N 0.000 description 3
- JIODCDXKCJRMEH-NHCYSSNCSA-N Val-Arg-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N JIODCDXKCJRMEH-NHCYSSNCSA-N 0.000 description 3
- LNYOXPDEIZJDEI-NHCYSSNCSA-N Val-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N LNYOXPDEIZJDEI-NHCYSSNCSA-N 0.000 description 3
- PWRITNSESKQTPW-NRPADANISA-N Val-Gln-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N PWRITNSESKQTPW-NRPADANISA-N 0.000 description 3
- BEGDZYNDCNEGJZ-XVKPBYJWSA-N Val-Gly-Gln Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O BEGDZYNDCNEGJZ-XVKPBYJWSA-N 0.000 description 3
- LKUDRJSNRWVGMS-QSFUFRPTSA-N Val-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LKUDRJSNRWVGMS-QSFUFRPTSA-N 0.000 description 3
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 3
- QRVPEKJBBRYISE-XUXIUFHCSA-N Val-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N QRVPEKJBBRYISE-XUXIUFHCSA-N 0.000 description 3
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 3
- VIKZGAUAKQZDOF-NRPADANISA-N Val-Ser-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O VIKZGAUAKQZDOF-NRPADANISA-N 0.000 description 3
- VVIZITNVZUAEMI-DLOVCJGASA-N Val-Val-Gln Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O VVIZITNVZUAEMI-DLOVCJGASA-N 0.000 description 3
- 108010045023 alanyl-prolyl-tyrosine Proteins 0.000 description 3
- 108010047495 alanylglycine Proteins 0.000 description 3
- 125000003277 amino group Chemical group 0.000 description 3
- 108010008355 arginyl-glutamine Proteins 0.000 description 3
- 210000004369 blood Anatomy 0.000 description 3
- 239000008280 blood Substances 0.000 description 3
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 108010060199 cysteinylproline Proteins 0.000 description 3
- 239000000539 dimer Substances 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 229940088598 enzyme Drugs 0.000 description 3
- 108010079547 glutamylmethionine Proteins 0.000 description 3
- 208000002672 hepatitis B Diseases 0.000 description 3
- 108010018006 histidylserine Proteins 0.000 description 3
- 206010022000 influenza Diseases 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000002427 irreversible effect Effects 0.000 description 3
- 239000002502 liposome Substances 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 108010005942 methionylglycine Proteins 0.000 description 3
- 239000011148 porous material Substances 0.000 description 3
- 230000004481 post-translational protein modification Effects 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 108010070643 prolylglutamic acid Proteins 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000003252 repetitive effect Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 3
- 238000005829 trimerization reaction Methods 0.000 description 3
- 108010078580 tyrosylleucine Proteins 0.000 description 3
- 241000712461 unidentified influenza virus Species 0.000 description 3
- DQJCDTNMLBYVAY-ZXXIYAEKSA-N (2S,5R,10R,13R)-16-{[(2R,3S,4R,5R)-3-{[(2S,3R,4R,5S,6R)-3-acetamido-4,5-dihydroxy-6-(hydroxymethyl)oxan-2-yl]oxy}-5-(ethylamino)-6-hydroxy-2-(hydroxymethyl)oxan-4-yl]oxy}-5-(4-aminobutyl)-10-carbamoyl-2,13-dimethyl-4,7,12,15-tetraoxo-3,6,11,14-tetraazaheptadecan-1-oic acid Chemical compound NCCCC[C@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)CC[C@H](C(N)=O)NC(=O)[C@@H](C)NC(=O)C(C)O[C@@H]1[C@@H](NCC)C(O)O[C@H](CO)[C@H]1O[C@H]1[C@H](NC(C)=O)[C@@H](O)[C@H](O)[C@@H](CO)O1 DQJCDTNMLBYVAY-ZXXIYAEKSA-N 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- 241001672158 Acinetobacter phage AP205 Species 0.000 description 2
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 2
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 2
- LBJYAILUMSUTAM-ZLUOBGJFSA-N Ala-Asn-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O LBJYAILUMSUTAM-ZLUOBGJFSA-N 0.000 description 2
- ZEXDYVGDZJBRMO-ACZMJKKPSA-N Ala-Asn-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZEXDYVGDZJBRMO-ACZMJKKPSA-N 0.000 description 2
- YIGLXQRFQVWFEY-NRPADANISA-N Ala-Gln-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O YIGLXQRFQVWFEY-NRPADANISA-N 0.000 description 2
- QHASENCZLDHBGX-ONGXEEELSA-N Ala-Gly-Phe Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QHASENCZLDHBGX-ONGXEEELSA-N 0.000 description 2
- HJGZVLLLBJLXFC-LSJOCFKGSA-N Ala-His-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O HJGZVLLLBJLXFC-LSJOCFKGSA-N 0.000 description 2
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 2
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 2
- MMLHRUJLOUSRJX-CIUDSAMLSA-N Ala-Ser-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN MMLHRUJLOUSRJX-CIUDSAMLSA-N 0.000 description 2
- YNOCMHZSWJMGBB-GCJQMDKQSA-N Ala-Thr-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O YNOCMHZSWJMGBB-GCJQMDKQSA-N 0.000 description 2
- QOIGKCBMXUCDQU-KDXUFGMBSA-N Ala-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N)O QOIGKCBMXUCDQU-KDXUFGMBSA-N 0.000 description 2
- AENHOIXXHKNIQL-AUTRQRHGSA-N Ala-Tyr-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H]([NH3+])C)CC1=CC=C(O)C=C1 AENHOIXXHKNIQL-AUTRQRHGSA-N 0.000 description 2
- XAXMJQUMRJAFCH-CQDKDKBSSA-N Ala-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 XAXMJQUMRJAFCH-CQDKDKBSSA-N 0.000 description 2
- SSQHYGLFYWZWDV-UVBJJODRSA-N Ala-Val-Trp Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O SSQHYGLFYWZWDV-UVBJJODRSA-N 0.000 description 2
- RVDVDRUZWZIBJQ-CIUDSAMLSA-N Arg-Asn-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O RVDVDRUZWZIBJQ-CIUDSAMLSA-N 0.000 description 2
- HKRXJBBCQBAGIM-FXQIFTODSA-N Arg-Asp-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N HKRXJBBCQBAGIM-FXQIFTODSA-N 0.000 description 2
- FEZJJKXNPSEYEV-CIUDSAMLSA-N Arg-Gln-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FEZJJKXNPSEYEV-CIUDSAMLSA-N 0.000 description 2
- VDBKFYYIBLXEIF-GUBZILKMSA-N Arg-Gln-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VDBKFYYIBLXEIF-GUBZILKMSA-N 0.000 description 2
- RKRSYHCNPFGMTA-CIUDSAMLSA-N Arg-Glu-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O RKRSYHCNPFGMTA-CIUDSAMLSA-N 0.000 description 2
- PBSOQGZLPFVXPU-YUMQZZPRSA-N Arg-Glu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PBSOQGZLPFVXPU-YUMQZZPRSA-N 0.000 description 2
- SKTGPBFTMNLIHQ-KKUMJFAQSA-N Arg-Glu-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SKTGPBFTMNLIHQ-KKUMJFAQSA-N 0.000 description 2
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 2
- RATVAFHGEFAWDH-JYJNAYRXSA-N Arg-Phe-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCCN=C(N)N)N RATVAFHGEFAWDH-JYJNAYRXSA-N 0.000 description 2
- VLIJAPRTSXSGFY-STQMWFEESA-N Arg-Tyr-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 VLIJAPRTSXSGFY-STQMWFEESA-N 0.000 description 2
- CMLGVVWQQHUXOZ-GHCJXIJMSA-N Asn-Ala-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CMLGVVWQQHUXOZ-GHCJXIJMSA-N 0.000 description 2
- XSGBIBGAMKTHMY-WHFBIAKZSA-N Asn-Asp-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O XSGBIBGAMKTHMY-WHFBIAKZSA-N 0.000 description 2
- UPALZCBCKAMGIY-PEFMBERDSA-N Asn-Gln-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UPALZCBCKAMGIY-PEFMBERDSA-N 0.000 description 2
- QYXNFROWLZPWPC-FXQIFTODSA-N Asn-Glu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QYXNFROWLZPWPC-FXQIFTODSA-N 0.000 description 2
- PLVAAIPKSGUXDV-WHFBIAKZSA-N Asn-Gly-Cys Chemical compound C([C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N)C(=O)N PLVAAIPKSGUXDV-WHFBIAKZSA-N 0.000 description 2
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 2
- SEKBHZJLARBNPB-GHCJXIJMSA-N Asn-Ile-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O SEKBHZJLARBNPB-GHCJXIJMSA-N 0.000 description 2
- FODVBOKTYKYRFJ-CIUDSAMLSA-N Asn-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N FODVBOKTYKYRFJ-CIUDSAMLSA-N 0.000 description 2
- MVXJBVVLACEGCG-PCBIJLKTSA-N Asn-Phe-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVXJBVVLACEGCG-PCBIJLKTSA-N 0.000 description 2
- GMUOCGCDOYYWPD-FXQIFTODSA-N Asn-Pro-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O GMUOCGCDOYYWPD-FXQIFTODSA-N 0.000 description 2
- JWQWPRCDYWNVNM-ACZMJKKPSA-N Asn-Ser-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N JWQWPRCDYWNVNM-ACZMJKKPSA-N 0.000 description 2
- UXHYOWXTJLBEPG-GSSVUCPTSA-N Asn-Thr-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UXHYOWXTJLBEPG-GSSVUCPTSA-N 0.000 description 2
- DATSKXOXPUAOLK-KKUMJFAQSA-N Asn-Tyr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DATSKXOXPUAOLK-KKUMJFAQSA-N 0.000 description 2
- XEGZSHSPQNDNRH-JRQIVUDYSA-N Asn-Tyr-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XEGZSHSPQNDNRH-JRQIVUDYSA-N 0.000 description 2
- XOQYDFCQPWAMSA-KKHAAJSZSA-N Asn-Val-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOQYDFCQPWAMSA-KKHAAJSZSA-N 0.000 description 2
- BLQBMRNMBAYREH-UWJYBYFXSA-N Asp-Ala-Tyr Chemical compound N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O BLQBMRNMBAYREH-UWJYBYFXSA-N 0.000 description 2
- PDECQIHABNQRHN-GUBZILKMSA-N Asp-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O PDECQIHABNQRHN-GUBZILKMSA-N 0.000 description 2
- VIRHEUMYXXLCBF-WDSKDSINSA-N Asp-Gly-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O VIRHEUMYXXLCBF-WDSKDSINSA-N 0.000 description 2
- ZSVJVIOVABDTTL-YUMQZZPRSA-N Asp-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)O)N ZSVJVIOVABDTTL-YUMQZZPRSA-N 0.000 description 2
- PGUYEUCYVNZGGV-QWRGUYRKSA-N Asp-Gly-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PGUYEUCYVNZGGV-QWRGUYRKSA-N 0.000 description 2
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 2
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 2
- ORRJQLIATJDMQM-HJGDQZAQSA-N Asp-Leu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O ORRJQLIATJDMQM-HJGDQZAQSA-N 0.000 description 2
- GYWQGGUCMDCUJE-DLOVCJGASA-N Asp-Phe-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O GYWQGGUCMDCUJE-DLOVCJGASA-N 0.000 description 2
- WMLFFCRUSPNENW-ZLUOBGJFSA-N Asp-Ser-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O WMLFFCRUSPNENW-ZLUOBGJFSA-N 0.000 description 2
- OZBXOELNJBSJOA-UBHSHLNASA-N Asp-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N OZBXOELNJBSJOA-UBHSHLNASA-N 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 201000001320 Atherosclerosis Diseases 0.000 description 2
- 241000283707 Capra Species 0.000 description 2
- 208000032170 Congenital Abnormalities Diseases 0.000 description 2
- 206010010356 Congenital anomaly Diseases 0.000 description 2
- ZOLXQKZHYOHHMD-DLOVCJGASA-N Cys-Ala-Phe Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CS)N ZOLXQKZHYOHHMD-DLOVCJGASA-N 0.000 description 2
- LMXOUGMSGHFLRX-CIUDSAMLSA-N Cys-Gln-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CS)N LMXOUGMSGHFLRX-CIUDSAMLSA-N 0.000 description 2
- HHABWQIFXZPZCK-ACZMJKKPSA-N Cys-Gln-Ser Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N HHABWQIFXZPZCK-ACZMJKKPSA-N 0.000 description 2
- KXUKWRVYDYIPSQ-CIUDSAMLSA-N Cys-Leu-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O KXUKWRVYDYIPSQ-CIUDSAMLSA-N 0.000 description 2
- KSMSFCBQBQPFAD-GUBZILKMSA-N Cys-Pro-Pro Chemical compound SC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 KSMSFCBQBQPFAD-GUBZILKMSA-N 0.000 description 2
- YNJBLTDKTMKEET-ZLUOBGJFSA-N Cys-Ser-Ser Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O YNJBLTDKTMKEET-ZLUOBGJFSA-N 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- YNNXQZDEOCYJJL-CIUDSAMLSA-N Gln-Arg-Asp Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N YNNXQZDEOCYJJL-CIUDSAMLSA-N 0.000 description 2
- TWHDOEYLXXQYOZ-FXQIFTODSA-N Gln-Asn-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N TWHDOEYLXXQYOZ-FXQIFTODSA-N 0.000 description 2
- COYGBRTZEVWZBW-XKBZYTNZSA-N Gln-Cys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCC(N)=O COYGBRTZEVWZBW-XKBZYTNZSA-N 0.000 description 2
- NKCZYEDZTKOFBG-GUBZILKMSA-N Gln-Gln-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NKCZYEDZTKOFBG-GUBZILKMSA-N 0.000 description 2
- KCJJFESQRXGTGC-BQBZGAKWSA-N Gln-Glu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O KCJJFESQRXGTGC-BQBZGAKWSA-N 0.000 description 2
- XKBASPWPBXNVLQ-WDSKDSINSA-N Gln-Gly-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XKBASPWPBXNVLQ-WDSKDSINSA-N 0.000 description 2
- HDUDGCZEOZEFOA-KBIXCLLPSA-N Gln-Ile-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HDUDGCZEOZEFOA-KBIXCLLPSA-N 0.000 description 2
- ITZWDGBYBPUZRG-KBIXCLLPSA-N Gln-Ile-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O ITZWDGBYBPUZRG-KBIXCLLPSA-N 0.000 description 2
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 2
- XGKNQFOKIBKFTR-CIUDSAMLSA-N Gln-Met-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CCC(N)=O XGKNQFOKIBKFTR-CIUDSAMLSA-N 0.000 description 2
- UWMDGPFFTKDUIY-HJGDQZAQSA-N Gln-Pro-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O UWMDGPFFTKDUIY-HJGDQZAQSA-N 0.000 description 2
- UEILCTONAMOGBR-RWRJDSDZSA-N Gln-Thr-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UEILCTONAMOGBR-RWRJDSDZSA-N 0.000 description 2
- NHMRJKKAVMENKJ-WDCWCFNPSA-N Gln-Thr-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NHMRJKKAVMENKJ-WDCWCFNPSA-N 0.000 description 2
- OUBUHIODTNUUTC-WDCWCFNPSA-N Gln-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O OUBUHIODTNUUTC-WDCWCFNPSA-N 0.000 description 2
- XKPACHRGOWQHFH-IRIUXVKKSA-N Gln-Thr-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XKPACHRGOWQHFH-IRIUXVKKSA-N 0.000 description 2
- JKDBRTNMYXYLHO-JYJNAYRXSA-N Gln-Tyr-Leu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 JKDBRTNMYXYLHO-JYJNAYRXSA-N 0.000 description 2
- UTKUTMJSWKKHEM-WDSKDSINSA-N Glu-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O UTKUTMJSWKKHEM-WDSKDSINSA-N 0.000 description 2
- DSPQRJXOIXHOHK-WDSKDSINSA-N Glu-Asp-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O DSPQRJXOIXHOHK-WDSKDSINSA-N 0.000 description 2
- PAQUJCSYVIBPLC-AVGNSLFASA-N Glu-Asp-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PAQUJCSYVIBPLC-AVGNSLFASA-N 0.000 description 2
- RFDHKPSHTXZKLL-IHRRRGAJSA-N Glu-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N RFDHKPSHTXZKLL-IHRRRGAJSA-N 0.000 description 2
- KRGZZKWSBGPLKL-IUCAKERBSA-N Glu-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N KRGZZKWSBGPLKL-IUCAKERBSA-N 0.000 description 2
- ZSWGJYOZWBHROQ-RWRJDSDZSA-N Glu-Ile-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSWGJYOZWBHROQ-RWRJDSDZSA-N 0.000 description 2
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 2
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 2
- TZXOPHFCAATANZ-QEJZJMRPSA-N Glu-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N TZXOPHFCAATANZ-QEJZJMRPSA-N 0.000 description 2
- ZQNCUVODKOBSSO-XEGUGMAKSA-N Glu-Trp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O ZQNCUVODKOBSSO-XEGUGMAKSA-N 0.000 description 2
- MIWJDJAMMKHUAR-ZVZYQTTQSA-N Glu-Trp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCC(=O)O)N MIWJDJAMMKHUAR-ZVZYQTTQSA-N 0.000 description 2
- MFVQGXGQRIXBPK-WDSKDSINSA-N Gly-Ala-Glu Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFVQGXGQRIXBPK-WDSKDSINSA-N 0.000 description 2
- FKJQNJCQTKUBCD-XPUUQOCRSA-N Gly-Ala-His Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O FKJQNJCQTKUBCD-XPUUQOCRSA-N 0.000 description 2
- YMUFWNJHVPQNQD-ZKWXMUAHSA-N Gly-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN YMUFWNJHVPQNQD-ZKWXMUAHSA-N 0.000 description 2
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 2
- XUDLUKYPXQDCRX-BQBZGAKWSA-N Gly-Arg-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O XUDLUKYPXQDCRX-BQBZGAKWSA-N 0.000 description 2
- DJTXYXZNNDDEOU-WHFBIAKZSA-N Gly-Asn-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN)C(=O)N DJTXYXZNNDDEOU-WHFBIAKZSA-N 0.000 description 2
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 2
- GRIRDMVMJJDZKV-RCOVLWMOSA-N Gly-Asn-Val Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O GRIRDMVMJJDZKV-RCOVLWMOSA-N 0.000 description 2
- QPDUVFSVVAOUHE-XVKPBYJWSA-N Gly-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)CN)C(O)=O QPDUVFSVVAOUHE-XVKPBYJWSA-N 0.000 description 2
- INLIXXRWNUKVCF-JTQLQIEISA-N Gly-Gly-Tyr Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 INLIXXRWNUKVCF-JTQLQIEISA-N 0.000 description 2
- AAHSHTLISQUZJL-QSFUFRPTSA-N Gly-Ile-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AAHSHTLISQUZJL-QSFUFRPTSA-N 0.000 description 2
- HAXARWKYFIIHKD-ZKWXMUAHSA-N Gly-Ile-Ser Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HAXARWKYFIIHKD-ZKWXMUAHSA-N 0.000 description 2
- YIFUFYZELCMPJP-YUMQZZPRSA-N Gly-Leu-Cys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(O)=O YIFUFYZELCMPJP-YUMQZZPRSA-N 0.000 description 2
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 2
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 2
- QAMMIGULQSIRCD-IRXDYDNUSA-N Gly-Phe-Tyr Chemical compound C([C@H](NC(=O)C[NH3+])C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C([O-])=O)C1=CC=CC=C1 QAMMIGULQSIRCD-IRXDYDNUSA-N 0.000 description 2
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 2
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 2
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 2
- 108010015899 Glycopeptides Proteins 0.000 description 2
- 102000002068 Glycopeptides Human genes 0.000 description 2
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 2
- VLPMGIJPAWENQB-SRVKXCTJSA-N His-Cys-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O VLPMGIJPAWENQB-SRVKXCTJSA-N 0.000 description 2
- OZBDSFBWIDPVDA-BZSNNMDCSA-N His-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CN=CN3)N OZBDSFBWIDPVDA-BZSNNMDCSA-N 0.000 description 2
- IWXMHXYOACDSIA-PYJNHQTQSA-N His-Ile-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O IWXMHXYOACDSIA-PYJNHQTQSA-N 0.000 description 2
- YAALVYQFVJNXIV-KKUMJFAQSA-N His-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 YAALVYQFVJNXIV-KKUMJFAQSA-N 0.000 description 2
- GNBHSMFBUNEWCJ-DCAQKATOSA-N His-Pro-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O GNBHSMFBUNEWCJ-DCAQKATOSA-N 0.000 description 2
- CUEQQFOGARVNHU-VGDYDELISA-N His-Ser-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUEQQFOGARVNHU-VGDYDELISA-N 0.000 description 2
- NBWATNYAUVSAEQ-ZEILLAHLSA-N His-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O NBWATNYAUVSAEQ-ZEILLAHLSA-N 0.000 description 2
- XGBVLRJLHUVCNK-DCAQKATOSA-N His-Val-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O XGBVLRJLHUVCNK-DCAQKATOSA-N 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 241000282414 Homo sapiens Species 0.000 description 2
- 241000701085 Human alphaherpesvirus 3 Species 0.000 description 2
- 241000701044 Human gammaherpesvirus 4 Species 0.000 description 2
- 206010020772 Hypertension Diseases 0.000 description 2
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 2
- VZIFYHYNQDIPLI-HJWJTTGWSA-N Ile-Arg-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N VZIFYHYNQDIPLI-HJWJTTGWSA-N 0.000 description 2
- WEWCEPOYKANMGZ-MMWGEVLESA-N Ile-Cys-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N WEWCEPOYKANMGZ-MMWGEVLESA-N 0.000 description 2
- TWPSALMCEHCIOY-YTFOTSKYSA-N Ile-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(=O)O)N TWPSALMCEHCIOY-YTFOTSKYSA-N 0.000 description 2
- CSQNHSGHAPRGPQ-YTFOTSKYSA-N Ile-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)O)N CSQNHSGHAPRGPQ-YTFOTSKYSA-N 0.000 description 2
- DMSVBUWGDLYNLC-IAVJCBSLSA-N Ile-Ile-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DMSVBUWGDLYNLC-IAVJCBSLSA-N 0.000 description 2
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 2
- UOPBQSJRBONRON-STECZYCISA-N Ile-Met-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UOPBQSJRBONRON-STECZYCISA-N 0.000 description 2
- WYUHAXJAMDTOAU-IAVJCBSLSA-N Ile-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N WYUHAXJAMDTOAU-IAVJCBSLSA-N 0.000 description 2
- RQJUKVXWAKJDBW-SVSWQMSJSA-N Ile-Ser-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N RQJUKVXWAKJDBW-SVSWQMSJSA-N 0.000 description 2
- NAFIFZNBSPWYOO-RWRJDSDZSA-N Ile-Thr-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N NAFIFZNBSPWYOO-RWRJDSDZSA-N 0.000 description 2
- 206010021882 Infections and infestations congenital Diseases 0.000 description 2
- 241000712431 Influenza A virus Species 0.000 description 2
- 108010065920 Insulin Lispro Proteins 0.000 description 2
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 2
- 241000235058 Komagataella pastoris Species 0.000 description 2
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 2
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 2
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 2
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 2
- DBVWMYGBVFCRBE-CIUDSAMLSA-N Leu-Asn-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DBVWMYGBVFCRBE-CIUDSAMLSA-N 0.000 description 2
- RFUBXQQFJFGJFV-GUBZILKMSA-N Leu-Asn-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RFUBXQQFJFGJFV-GUBZILKMSA-N 0.000 description 2
- BPANDPNDMJHFEV-CIUDSAMLSA-N Leu-Asp-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O BPANDPNDMJHFEV-CIUDSAMLSA-N 0.000 description 2
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 2
- MMEDVBWCMGRKKC-GARJFASQSA-N Leu-Asp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N MMEDVBWCMGRKKC-GARJFASQSA-N 0.000 description 2
- VPKIQULSKFVCSM-SRVKXCTJSA-N Leu-Gln-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPKIQULSKFVCSM-SRVKXCTJSA-N 0.000 description 2
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 2
- VZBIUJURDLFFOE-IHRRRGAJSA-N Leu-His-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VZBIUJURDLFFOE-IHRRRGAJSA-N 0.000 description 2
- BKTXKJMNTSMJDQ-AVGNSLFASA-N Leu-His-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BKTXKJMNTSMJDQ-AVGNSLFASA-N 0.000 description 2
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 2
- QLDHBYRUNQZIJQ-DKIMLUQUSA-N Leu-Ile-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QLDHBYRUNQZIJQ-DKIMLUQUSA-N 0.000 description 2
- JKSIBWITFMQTOA-XUXIUFHCSA-N Leu-Ile-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O JKSIBWITFMQTOA-XUXIUFHCSA-N 0.000 description 2
- PDQDCFBVYXEFSD-SRVKXCTJSA-N Leu-Leu-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PDQDCFBVYXEFSD-SRVKXCTJSA-N 0.000 description 2
- WXUOJXIGOPMDJM-SRVKXCTJSA-N Leu-Lys-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O WXUOJXIGOPMDJM-SRVKXCTJSA-N 0.000 description 2
- KXCMQWMNYQOAKA-SRVKXCTJSA-N Leu-Met-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N KXCMQWMNYQOAKA-SRVKXCTJSA-N 0.000 description 2
- DDVHDMSBLRAKNV-IHRRRGAJSA-N Leu-Met-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O DDVHDMSBLRAKNV-IHRRRGAJSA-N 0.000 description 2
- SYRTUBLKWNDSDK-DKIMLUQUSA-N Leu-Phe-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYRTUBLKWNDSDK-DKIMLUQUSA-N 0.000 description 2
- UHNQRAFSEBGZFZ-YESZJQIVSA-N Leu-Phe-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N UHNQRAFSEBGZFZ-YESZJQIVSA-N 0.000 description 2
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 2
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 2
- KNKHAVVBVXKOGX-JXUBOQSCSA-N Lys-Ala-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KNKHAVVBVXKOGX-JXUBOQSCSA-N 0.000 description 2
- GQUDMNDPQTXZRV-DCAQKATOSA-N Lys-Arg-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GQUDMNDPQTXZRV-DCAQKATOSA-N 0.000 description 2
- SJNZALDHDUYDBU-IHRRRGAJSA-N Lys-Arg-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(O)=O SJNZALDHDUYDBU-IHRRRGAJSA-N 0.000 description 2
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 2
- HEWWNLVEWBJBKA-WDCWCFNPSA-N Lys-Gln-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCCN HEWWNLVEWBJBKA-WDCWCFNPSA-N 0.000 description 2
- GPJGFSFYBJGYRX-YUMQZZPRSA-N Lys-Gly-Asp Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O GPJGFSFYBJGYRX-YUMQZZPRSA-N 0.000 description 2
- KEPWSUPUFAPBRF-DKIMLUQUSA-N Lys-Ile-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KEPWSUPUFAPBRF-DKIMLUQUSA-N 0.000 description 2
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 2
- LUAJJLPHUXPQLH-KKUMJFAQSA-N Lys-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCCN)N LUAJJLPHUXPQLH-KKUMJFAQSA-N 0.000 description 2
- LOGFVTREOLYCPF-RHYQMDGZSA-N Lys-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN LOGFVTREOLYCPF-RHYQMDGZSA-N 0.000 description 2
- RPWQJSBMXJSCPD-XUXIUFHCSA-N Lys-Val-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)C(C)C)C(O)=O RPWQJSBMXJSCPD-XUXIUFHCSA-N 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- 102000018697 Membrane Proteins Human genes 0.000 description 2
- ZAJNRWKGHWGPDQ-SDDRHHMPSA-N Met-Arg-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N ZAJNRWKGHWGPDQ-SDDRHHMPSA-N 0.000 description 2
- AETNZPKUUYYYEK-CIUDSAMLSA-N Met-Glu-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O AETNZPKUUYYYEK-CIUDSAMLSA-N 0.000 description 2
- OBCRZLRPJFNLAN-DCAQKATOSA-N Met-His-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O OBCRZLRPJFNLAN-DCAQKATOSA-N 0.000 description 2
- PZUUMQPMHBJJKE-AVGNSLFASA-N Met-Leu-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCNC(N)=N PZUUMQPMHBJJKE-AVGNSLFASA-N 0.000 description 2
- USBFEVBHEQBWDD-AVGNSLFASA-N Met-Leu-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O USBFEVBHEQBWDD-AVGNSLFASA-N 0.000 description 2
- PHKBGZKVOJCIMZ-SRVKXCTJSA-N Met-Pro-Arg Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PHKBGZKVOJCIMZ-SRVKXCTJSA-N 0.000 description 2
- OVTOTTGZBWXLFU-QXEWZRGKSA-N Met-Val-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O OVTOTTGZBWXLFU-QXEWZRGKSA-N 0.000 description 2
- VYDLZDRMOFYOGV-TUAOUCFPSA-N Met-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N VYDLZDRMOFYOGV-TUAOUCFPSA-N 0.000 description 2
- 108091005804 Peptidases Proteins 0.000 description 2
- VHWOBXIWBDWZHK-IHRRRGAJSA-N Phe-Arg-Asp Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 VHWOBXIWBDWZHK-IHRRRGAJSA-N 0.000 description 2
- LXUJDHOKVUYHRC-KKUMJFAQSA-N Phe-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CC=CC=C1)N LXUJDHOKVUYHRC-KKUMJFAQSA-N 0.000 description 2
- KOUUGTKGEQZRHV-KKUMJFAQSA-N Phe-Gln-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O KOUUGTKGEQZRHV-KKUMJFAQSA-N 0.000 description 2
- PBXYXOAEQQUVMM-ULQDDVLXSA-N Phe-His-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=CC=C2)N PBXYXOAEQQUVMM-ULQDDVLXSA-N 0.000 description 2
- ONORAGIFHNAADN-LLLHUVSDSA-N Phe-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N ONORAGIFHNAADN-LLLHUVSDSA-N 0.000 description 2
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 2
- YCCUXNNKXDGMAM-KKUMJFAQSA-N Phe-Leu-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YCCUXNNKXDGMAM-KKUMJFAQSA-N 0.000 description 2
- HBXAOEBRGLCLIW-AVGNSLFASA-N Phe-Ser-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HBXAOEBRGLCLIW-AVGNSLFASA-N 0.000 description 2
- BPCLGWHVPVTTFM-QWRGUYRKSA-N Phe-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O BPCLGWHVPVTTFM-QWRGUYRKSA-N 0.000 description 2
- ILGCZYGFYQLSDZ-KKUMJFAQSA-N Phe-Ser-His Chemical compound N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CO)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O ILGCZYGFYQLSDZ-KKUMJFAQSA-N 0.000 description 2
- IAOZOFPONWDXNT-IXOXFDKPSA-N Phe-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IAOZOFPONWDXNT-IXOXFDKPSA-N 0.000 description 2
- BSTPNLNKHKBONJ-HTUGSXCWSA-N Phe-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O BSTPNLNKHKBONJ-HTUGSXCWSA-N 0.000 description 2
- XNQMZHLAYFWSGJ-HTUGSXCWSA-N Phe-Thr-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XNQMZHLAYFWSGJ-HTUGSXCWSA-N 0.000 description 2
- CVAUVSOFHJKCHN-BZSNNMDCSA-N Phe-Tyr-Cys Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CS)C(O)=O)C1=CC=CC=C1 CVAUVSOFHJKCHN-BZSNNMDCSA-N 0.000 description 2
- QUUCAHIYARMNBL-FHWLQOOXSA-N Phe-Tyr-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N QUUCAHIYARMNBL-FHWLQOOXSA-N 0.000 description 2
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 2
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 2
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 2
- OLHDPZMYUSBGDE-GUBZILKMSA-N Pro-Arg-Cys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O OLHDPZMYUSBGDE-GUBZILKMSA-N 0.000 description 2
- CYQQWUPHIZVCNY-GUBZILKMSA-N Pro-Arg-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CYQQWUPHIZVCNY-GUBZILKMSA-N 0.000 description 2
- ORPZXBQTEHINPB-SRVKXCTJSA-N Pro-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H]1CCCN1)C(O)=O ORPZXBQTEHINPB-SRVKXCTJSA-N 0.000 description 2
- KPDRZQUWJKTMBP-DCAQKATOSA-N Pro-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 KPDRZQUWJKTMBP-DCAQKATOSA-N 0.000 description 2
- HXOLCSYHGRNXJJ-IHRRRGAJSA-N Pro-Asp-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HXOLCSYHGRNXJJ-IHRRRGAJSA-N 0.000 description 2
- XZONQWUEBAFQPO-HJGDQZAQSA-N Pro-Gln-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XZONQWUEBAFQPO-HJGDQZAQSA-N 0.000 description 2
- LHALYDBUDCWMDY-CIUDSAMLSA-N Pro-Glu-Ala Chemical compound C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O LHALYDBUDCWMDY-CIUDSAMLSA-N 0.000 description 2
- QCARZLHECSFOGG-CIUDSAMLSA-N Pro-Glu-Cys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O QCARZLHECSFOGG-CIUDSAMLSA-N 0.000 description 2
- UIMCLYYSUCIUJM-UWVGGRQHSA-N Pro-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 UIMCLYYSUCIUJM-UWVGGRQHSA-N 0.000 description 2
- GBRUQFBAJOKCTF-DCAQKATOSA-N Pro-His-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O GBRUQFBAJOKCTF-DCAQKATOSA-N 0.000 description 2
- XQHGISDMVBTGAL-ULQDDVLXSA-N Pro-His-Phe Chemical compound C([C@@H](C(=O)[O-])NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H]1[NH2+]CCC1)C1=CC=CC=C1 XQHGISDMVBTGAL-ULQDDVLXSA-N 0.000 description 2
- LPGSNRSLPHRNBW-AVGNSLFASA-N Pro-His-Val Chemical compound C([C@@H](C(=O)N[C@@H](C(C)C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 LPGSNRSLPHRNBW-AVGNSLFASA-N 0.000 description 2
- GURGCNUWVSDYTP-SRVKXCTJSA-N Pro-Leu-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GURGCNUWVSDYTP-SRVKXCTJSA-N 0.000 description 2
- FXGIMYRVJJEIIM-UWVGGRQHSA-N Pro-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FXGIMYRVJJEIIM-UWVGGRQHSA-N 0.000 description 2
- CPRLKHJUFAXVTD-ULQDDVLXSA-N Pro-Leu-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CPRLKHJUFAXVTD-ULQDDVLXSA-N 0.000 description 2
- SUENWIFTSTWUKD-AVGNSLFASA-N Pro-Leu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SUENWIFTSTWUKD-AVGNSLFASA-N 0.000 description 2
- WHNJMTHJGCEKGA-ULQDDVLXSA-N Pro-Phe-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WHNJMTHJGCEKGA-ULQDDVLXSA-N 0.000 description 2
- DWPXHLIBFQLKLK-CYDGBPFRSA-N Pro-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 DWPXHLIBFQLKLK-CYDGBPFRSA-N 0.000 description 2
- RTQKBZIRDWZLDF-BZSNNMDCSA-N Pro-Pro-Trp Chemical compound C([C@H]1C(=O)N[C@@H](CC=2C3=CC=CC=C3NC=2)C(=O)O)CCN1C(=O)[C@@H]1CCCN1 RTQKBZIRDWZLDF-BZSNNMDCSA-N 0.000 description 2
- GMJDSFYVTAMIBF-FXQIFTODSA-N Pro-Ser-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GMJDSFYVTAMIBF-FXQIFTODSA-N 0.000 description 2
- LNICFEXCAHIJOR-DCAQKATOSA-N Pro-Ser-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LNICFEXCAHIJOR-DCAQKATOSA-N 0.000 description 2
- AJJDPGVVNPUZCR-RHYQMDGZSA-N Pro-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1)O AJJDPGVVNPUZCR-RHYQMDGZSA-N 0.000 description 2
- RMJZWERKFFNNNS-XGEHTFHBSA-N Pro-Thr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMJZWERKFFNNNS-XGEHTFHBSA-N 0.000 description 2
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 2
- 239000004365 Protease Substances 0.000 description 2
- HBZBPFLJNDXRAY-FXQIFTODSA-N Ser-Ala-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O HBZBPFLJNDXRAY-FXQIFTODSA-N 0.000 description 2
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 2
- WXUBSIDKNMFAGS-IHRRRGAJSA-N Ser-Arg-Tyr Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WXUBSIDKNMFAGS-IHRRRGAJSA-N 0.000 description 2
- WKLJLEXEENIYQE-SRVKXCTJSA-N Ser-Cys-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O WKLJLEXEENIYQE-SRVKXCTJSA-N 0.000 description 2
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 2
- WSTIOCFMWXNOCX-YUMQZZPRSA-N Ser-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N WSTIOCFMWXNOCX-YUMQZZPRSA-N 0.000 description 2
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 2
- PPNPDKGQRFSCAC-CIUDSAMLSA-N Ser-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPNPDKGQRFSCAC-CIUDSAMLSA-N 0.000 description 2
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 2
- HEYZPTCCEIWHRO-IHRRRGAJSA-N Ser-Met-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HEYZPTCCEIWHRO-IHRRRGAJSA-N 0.000 description 2
- GDUZTEQRAOXYJS-SRVKXCTJSA-N Ser-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GDUZTEQRAOXYJS-SRVKXCTJSA-N 0.000 description 2
- FZEUTKVQGMVGHW-AVGNSLFASA-N Ser-Phe-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZEUTKVQGMVGHW-AVGNSLFASA-N 0.000 description 2
- BVLGVLWFIZFEAH-BPUTZDHNSA-N Ser-Pro-Trp Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O BVLGVLWFIZFEAH-BPUTZDHNSA-N 0.000 description 2
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 2
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 2
- SOACHCFYJMCMHC-BWBBJGPYSA-N Ser-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N)O SOACHCFYJMCMHC-BWBBJGPYSA-N 0.000 description 2
- ZSDXEKUKQAKZFE-XAVMHZPKSA-N Ser-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N)O ZSDXEKUKQAKZFE-XAVMHZPKSA-N 0.000 description 2
- PLQWGQUNUPMNOD-KKUMJFAQSA-N Ser-Tyr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O PLQWGQUNUPMNOD-KKUMJFAQSA-N 0.000 description 2
- PCMZJFMUYWIERL-ZKWXMUAHSA-N Ser-Val-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PCMZJFMUYWIERL-ZKWXMUAHSA-N 0.000 description 2
- ANOQEBQWIAYIMV-AEJSXWLSSA-N Ser-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ANOQEBQWIAYIMV-AEJSXWLSSA-N 0.000 description 2
- 108010008038 Synthetic Vaccines Proteins 0.000 description 2
- BHEOSNUKNHRBNM-UHFFFAOYSA-N Tetramethylsqualene Natural products CC(=C)C(C)CCC(=C)C(C)CCC(C)=CCCC=C(C)CCC(C)C(=C)CCC(C)C(C)=C BHEOSNUKNHRBNM-UHFFFAOYSA-N 0.000 description 2
- MQBTXMPQNCGSSZ-OSUNSFLBSA-N Thr-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N MQBTXMPQNCGSSZ-OSUNSFLBSA-N 0.000 description 2
- UNURFMVMXLENAZ-KJEVXHAQSA-N Thr-Arg-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UNURFMVMXLENAZ-KJEVXHAQSA-N 0.000 description 2
- VIBXMCZWVUOZLA-OLHMAJIHSA-N Thr-Asn-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O VIBXMCZWVUOZLA-OLHMAJIHSA-N 0.000 description 2
- GKMYGVQDGVYCPC-IUKAMOBKSA-N Thr-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H]([C@@H](C)O)N GKMYGVQDGVYCPC-IUKAMOBKSA-N 0.000 description 2
- OHAJHDJOCKKJLV-LKXGYXEUSA-N Thr-Asp-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OHAJHDJOCKKJLV-LKXGYXEUSA-N 0.000 description 2
- ZLNWJMRLHLGKFX-SVSWQMSJSA-N Thr-Cys-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZLNWJMRLHLGKFX-SVSWQMSJSA-N 0.000 description 2
- WBCCCPZIJIJTSD-TUBUOCAGSA-N Thr-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H]([C@@H](C)O)N WBCCCPZIJIJTSD-TUBUOCAGSA-N 0.000 description 2
- PUEWAXRPXOEQOW-HJGDQZAQSA-N Thr-Met-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(O)=O PUEWAXRPXOEQOW-HJGDQZAQSA-N 0.000 description 2
- UGFSAPWZBROURT-IXOXFDKPSA-N Thr-Phe-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)O)N)O UGFSAPWZBROURT-IXOXFDKPSA-N 0.000 description 2
- JAJOFWABAUKAEJ-QTKMDUPCSA-N Thr-Pro-His Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O JAJOFWABAUKAEJ-QTKMDUPCSA-N 0.000 description 2
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 2
- IEZVHOULSUULHD-XGEHTFHBSA-N Thr-Ser-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O IEZVHOULSUULHD-XGEHTFHBSA-N 0.000 description 2
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 2
- CYCGARJWIQWPQM-YJRXYDGGSA-N Thr-Tyr-Ser Chemical compound C[C@@H](O)[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CO)C([O-])=O)CC1=CC=C(O)C=C1 CYCGARJWIQWPQM-YJRXYDGGSA-N 0.000 description 2
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 2
- QNXZCKMXHPULME-ZNSHCXBVSA-N Thr-Val-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O QNXZCKMXHPULME-ZNSHCXBVSA-N 0.000 description 2
- SAKLWFSRZTZQAJ-GQGQLFGLSA-N Trp-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N SAKLWFSRZTZQAJ-GQGQLFGLSA-N 0.000 description 2
- RWAYYYOZMHMEGD-XIRDDKMYSA-N Trp-Leu-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 RWAYYYOZMHMEGD-XIRDDKMYSA-N 0.000 description 2
- ABEVJDLMFPTGPS-SZMVWBNQSA-N Trp-Met-Met Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(O)=O ABEVJDLMFPTGPS-SZMVWBNQSA-N 0.000 description 2
- BOESUSAIMQGVJD-RYQLBKOJSA-N Trp-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N BOESUSAIMQGVJD-RYQLBKOJSA-N 0.000 description 2
- ZZDFLJFVSNQINX-HWHUXHBOSA-N Trp-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)O ZZDFLJFVSNQINX-HWHUXHBOSA-N 0.000 description 2
- VMXLNDRJXVAJFT-JYBASQMISA-N Trp-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O VMXLNDRJXVAJFT-JYBASQMISA-N 0.000 description 2
- UOXPLPBMEPLZBW-WDSOQIARSA-N Trp-Val-Lys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 UOXPLPBMEPLZBW-WDSOQIARSA-N 0.000 description 2
- TVOGEPLDNYTAHD-CQDKDKBSSA-N Tyr-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TVOGEPLDNYTAHD-CQDKDKBSSA-N 0.000 description 2
- IIJWXEUNETVJPV-IHRRRGAJSA-N Tyr-Arg-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N)O IIJWXEUNETVJPV-IHRRRGAJSA-N 0.000 description 2
- PEVVXUGSAKEPEN-AVGNSLFASA-N Tyr-Asn-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PEVVXUGSAKEPEN-AVGNSLFASA-N 0.000 description 2
- SCCKSNREWHMKOJ-SRVKXCTJSA-N Tyr-Asn-Ser Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O SCCKSNREWHMKOJ-SRVKXCTJSA-N 0.000 description 2
- NRFTYDWKWGJLAR-MELADBBJSA-N Tyr-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O NRFTYDWKWGJLAR-MELADBBJSA-N 0.000 description 2
- RYSNTWVRSLCAJZ-RYUDHWBXSA-N Tyr-Gln-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RYSNTWVRSLCAJZ-RYUDHWBXSA-N 0.000 description 2
- PMDWYLVWHRTJIW-STQMWFEESA-N Tyr-Gly-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PMDWYLVWHRTJIW-STQMWFEESA-N 0.000 description 2
- FJBCEFPCVPHPPM-STECZYCISA-N Tyr-Ile-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O FJBCEFPCVPHPPM-STECZYCISA-N 0.000 description 2
- DAOREBHZAKCOEN-ULQDDVLXSA-N Tyr-Leu-Met Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O DAOREBHZAKCOEN-ULQDDVLXSA-N 0.000 description 2
- NSGZILIDHCIZAM-KKUMJFAQSA-N Tyr-Leu-Ser Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NSGZILIDHCIZAM-KKUMJFAQSA-N 0.000 description 2
- BJCILVZEZRDIDR-PMVMPFDFSA-N Tyr-Leu-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=C(O)C=C1 BJCILVZEZRDIDR-PMVMPFDFSA-N 0.000 description 2
- GITNQBVCEQBDQC-KKUMJFAQSA-N Tyr-Lys-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O GITNQBVCEQBDQC-KKUMJFAQSA-N 0.000 description 2
- YYLHVUCSTXXKBS-IHRRRGAJSA-N Tyr-Pro-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O YYLHVUCSTXXKBS-IHRRRGAJSA-N 0.000 description 2
- RGYCVIZZTUBSSG-JYJNAYRXSA-N Tyr-Pro-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O RGYCVIZZTUBSSG-JYJNAYRXSA-N 0.000 description 2
- TYFLVOUZHQUBGM-IHRRRGAJSA-N Tyr-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TYFLVOUZHQUBGM-IHRRRGAJSA-N 0.000 description 2
- LDKDSFQSEUOCOO-RPTUDFQQSA-N Tyr-Thr-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LDKDSFQSEUOCOO-RPTUDFQQSA-N 0.000 description 2
- AOIZTZRWMSPPAY-KAOXEZKKSA-N Tyr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)O AOIZTZRWMSPPAY-KAOXEZKKSA-N 0.000 description 2
- UUJHRSTVQCFDPA-UFYCRDLUSA-N Tyr-Tyr-Val Chemical compound C([C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 UUJHRSTVQCFDPA-UFYCRDLUSA-N 0.000 description 2
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 2
- KKHRWGYHBZORMQ-NHCYSSNCSA-N Val-Arg-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKHRWGYHBZORMQ-NHCYSSNCSA-N 0.000 description 2
- PAPWZOJOLKZEFR-AVGNSLFASA-N Val-Arg-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PAPWZOJOLKZEFR-AVGNSLFASA-N 0.000 description 2
- UDNYEPLJTRDMEJ-RCOVLWMOSA-N Val-Asn-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N UDNYEPLJTRDMEJ-RCOVLWMOSA-N 0.000 description 2
- TZVUSFMQWPWHON-NHCYSSNCSA-N Val-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N TZVUSFMQWPWHON-NHCYSSNCSA-N 0.000 description 2
- BRPKEERLGYNCNC-NHCYSSNCSA-N Val-Glu-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N BRPKEERLGYNCNC-NHCYSSNCSA-N 0.000 description 2
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 2
- HQYVQDRYODWONX-DCAQKATOSA-N Val-His-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CO)C(=O)O)N HQYVQDRYODWONX-DCAQKATOSA-N 0.000 description 2
- BZMIYHIJVVJPCK-QSFUFRPTSA-N Val-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N BZMIYHIJVVJPCK-QSFUFRPTSA-N 0.000 description 2
- HGJRMXOWUWVUOA-GVXVVHGQSA-N Val-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N HGJRMXOWUWVUOA-GVXVVHGQSA-N 0.000 description 2
- KTEZUXISLQTDDQ-NHCYSSNCSA-N Val-Lys-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KTEZUXISLQTDDQ-NHCYSSNCSA-N 0.000 description 2
- DIOSYUIWOQCXNR-ONGXEEELSA-N Val-Lys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O DIOSYUIWOQCXNR-ONGXEEELSA-N 0.000 description 2
- UEPLNXPLHJUYPT-AVGNSLFASA-N Val-Met-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O UEPLNXPLHJUYPT-AVGNSLFASA-N 0.000 description 2
- MJFSRZZJQWZHFQ-SRVKXCTJSA-N Val-Met-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)O)N MJFSRZZJQWZHFQ-SRVKXCTJSA-N 0.000 description 2
- GBIUHAYJGWVNLN-AEJSXWLSSA-N Val-Ser-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N GBIUHAYJGWVNLN-AEJSXWLSSA-N 0.000 description 2
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 2
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 2
- JAIZPWVHPQRYOU-ZJDVBMNYSA-N Val-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O JAIZPWVHPQRYOU-ZJDVBMNYSA-N 0.000 description 2
- GTACFKZDQFTVAI-STECZYCISA-N Val-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=C(O)C=C1 GTACFKZDQFTVAI-STECZYCISA-N 0.000 description 2
- ZLNYBMWGPOKSLW-LSJOCFKGSA-N Val-Val-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLNYBMWGPOKSLW-LSJOCFKGSA-N 0.000 description 2
- 108010003533 Viral Envelope Proteins Proteins 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- 108010041407 alanylaspartic acid Proteins 0.000 description 2
- 239000003513 alkali Substances 0.000 description 2
- XAGFODPZIPBFFR-UHFFFAOYSA-N aluminium Chemical compound [Al] XAGFODPZIPBFFR-UHFFFAOYSA-N 0.000 description 2
- 229910052782 aluminium Inorganic materials 0.000 description 2
- 238000010976 amide bond formation reaction Methods 0.000 description 2
- 108010013835 arginine glutamate Proteins 0.000 description 2
- 108010060035 arginylproline Proteins 0.000 description 2
- 230000004872 arterial blood pressure Effects 0.000 description 2
- 125000003118 aryl group Chemical group 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 108010077245 asparaginyl-proline Proteins 0.000 description 2
- 229940009098 aspartate Drugs 0.000 description 2
- 239000002585 base Substances 0.000 description 2
- 230000007698 birth defect Effects 0.000 description 2
- 238000006664 bond formation reaction Methods 0.000 description 2
- 210000004899 c-terminal region Anatomy 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000004132 cross linking Methods 0.000 description 2
- 229940075234 cytogam Drugs 0.000 description 2
- 230000034994 death Effects 0.000 description 2
- 231100000517 death Toxicity 0.000 description 2
- 238000000502 dialysis Methods 0.000 description 2
- 238000010790 dilution Methods 0.000 description 2
- 239000012895 dilution Substances 0.000 description 2
- 238000009510 drug design Methods 0.000 description 2
- 210000002919 epithelial cell Anatomy 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 230000005714 functional activity Effects 0.000 description 2
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 2
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 2
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Chemical compound NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 2
- 108010081551 glycylphenylalanine Proteins 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 108010036413 histidylglycine Proteins 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 210000001165 lymph node Anatomy 0.000 description 2
- 108010009298 lysylglutamic acid Proteins 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 210000004779 membrane envelope Anatomy 0.000 description 2
- 235000013336 milk Nutrition 0.000 description 2
- 239000008267 milk Substances 0.000 description 2
- 210000004080 milk Anatomy 0.000 description 2
- 229920001606 poly(lactic acid-co-glycolic acid) Polymers 0.000 description 2
- 108010077112 prolyl-proline Proteins 0.000 description 2
- 108010090894 prolylleucine Proteins 0.000 description 2
- 239000013639 protein trimer Substances 0.000 description 2
- 229940124551 recombinant vaccine Drugs 0.000 description 2
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 229940031439 squalene Drugs 0.000 description 2
- TUHBEKDERLKLEC-UHFFFAOYSA-N squalene Natural products CC(=CCCC(=CCCC(=CCCC=C(/C)CCC=C(/C)CC=C(C)C)C)C)C TUHBEKDERLKLEC-UHFFFAOYSA-N 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 2
- 239000012096 transfection reagent Substances 0.000 description 2
- 230000010474 transient expression Effects 0.000 description 2
- 230000014616 translation Effects 0.000 description 2
- 108091005703 transmembrane proteins Proteins 0.000 description 2
- 102000035160 transmembrane proteins Human genes 0.000 description 2
- 108010045269 tryptophyltryptophan Proteins 0.000 description 2
- 241001515965 unidentified phage Species 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 108010073969 valyllysine Proteins 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- GJLXVWOMRRWCIB-MERZOTPQSA-N (2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-acetamido-5-(diaminomethylideneamino)pentanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanamide Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=C(O)C=C1 GJLXVWOMRRWCIB-MERZOTPQSA-N 0.000 description 1
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 1
- BRPMXFSTKXXNHF-IUCAKERBSA-N (2s)-1-[2-[[(2s)-pyrrolidine-2-carbonyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H]1NCCC1 BRPMXFSTKXXNHF-IUCAKERBSA-N 0.000 description 1
- YYGNTYWPHWGJRM-UHFFFAOYSA-N (6E,10E,14E,18E)-2,6,10,15,19,23-hexamethyltetracosa-2,6,10,14,18,22-hexaene Chemical compound CC(C)=CCCC(C)=CCCC(C)=CCCC=C(C)CCC=C(C)CCC=C(C)C YYGNTYWPHWGJRM-UHFFFAOYSA-N 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- PIDRBUDUWHBYSR-UHFFFAOYSA-N 1-[2-[[2-[(2-amino-4-methylpentanoyl)amino]-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O PIDRBUDUWHBYSR-UHFFFAOYSA-N 0.000 description 1
- NHBKXEKEPDILRR-UHFFFAOYSA-N 2,3-bis(butanoylsulfanyl)propyl butanoate Chemical compound CCCC(=O)OCC(SC(=O)CCC)CSC(=O)CCC NHBKXEKEPDILRR-UHFFFAOYSA-N 0.000 description 1
- PMKKIDFHWBBGDA-UHFFFAOYSA-N 2-(2,5-dioxopyrrol-1-yl)ethyl methanesulfonate Chemical compound CS(=O)(=O)OCCN1C(=O)C=CC1=O PMKKIDFHWBBGDA-UHFFFAOYSA-N 0.000 description 1
- WEZDRVHTDXTVLT-GJZGRUSLSA-N 2-[[(2s)-2-[[(2s)-2-[(2-aminoacetyl)amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]acetic acid Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 WEZDRVHTDXTVLT-GJZGRUSLSA-N 0.000 description 1
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 1
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 1
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 1
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 1
- QDRGPQWIVZNJQD-CIUDSAMLSA-N Ala-Arg-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O QDRGPQWIVZNJQD-CIUDSAMLSA-N 0.000 description 1
- OILNWMNBLIHXQK-ZLUOBGJFSA-N Ala-Cys-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O OILNWMNBLIHXQK-ZLUOBGJFSA-N 0.000 description 1
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 1
- IXTPACPAXIOCRG-ACZMJKKPSA-N Ala-Glu-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N IXTPACPAXIOCRG-ACZMJKKPSA-N 0.000 description 1
- GGNHBHYDMUDXQB-KBIXCLLPSA-N Ala-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)N GGNHBHYDMUDXQB-KBIXCLLPSA-N 0.000 description 1
- XYTNPQNAZREREP-XQXXSGGOSA-N Ala-Glu-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XYTNPQNAZREREP-XQXXSGGOSA-N 0.000 description 1
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 1
- CBCCCLMNOBLBSC-XVYDVKMFSA-N Ala-His-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O CBCCCLMNOBLBSC-XVYDVKMFSA-N 0.000 description 1
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 1
- NYDBKUNVSALYPX-NAKRPEOUSA-N Ala-Ile-Arg Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NYDBKUNVSALYPX-NAKRPEOUSA-N 0.000 description 1
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 1
- VNYMOTCMNHJGTG-JBDRJPRFSA-N Ala-Ile-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O VNYMOTCMNHJGTG-JBDRJPRFSA-N 0.000 description 1
- LNNSWWRRYJLGNI-NAKRPEOUSA-N Ala-Ile-Val Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O LNNSWWRRYJLGNI-NAKRPEOUSA-N 0.000 description 1
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 1
- QPBSRMDNJOTFAL-AICCOOGYSA-N Ala-Leu-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QPBSRMDNJOTFAL-AICCOOGYSA-N 0.000 description 1
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 1
- OMFMCIVBKCEMAK-CYDGBPFRSA-N Ala-Leu-Val-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O OMFMCIVBKCEMAK-CYDGBPFRSA-N 0.000 description 1
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 1
- FUKFQILQFQKHLE-DCAQKATOSA-N Ala-Lys-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O FUKFQILQFQKHLE-DCAQKATOSA-N 0.000 description 1
- BDQNLQSWRAPHGU-DLOVCJGASA-N Ala-Phe-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)O)N BDQNLQSWRAPHGU-DLOVCJGASA-N 0.000 description 1
- ZBLQIYPCUWZSRZ-QEJZJMRPSA-N Ala-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 ZBLQIYPCUWZSRZ-QEJZJMRPSA-N 0.000 description 1
- IORKCNUBHNIMKY-CIUDSAMLSA-N Ala-Pro-Glu Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IORKCNUBHNIMKY-CIUDSAMLSA-N 0.000 description 1
- FFZJHQODAYHGPO-KZVJFYERSA-N Ala-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N FFZJHQODAYHGPO-KZVJFYERSA-N 0.000 description 1
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 1
- PEEYDECOOVQKRZ-DLOVCJGASA-N Ala-Ser-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PEEYDECOOVQKRZ-DLOVCJGASA-N 0.000 description 1
- SYIFFFHSXBNPMC-UWJYBYFXSA-N Ala-Ser-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N SYIFFFHSXBNPMC-UWJYBYFXSA-N 0.000 description 1
- XQNRANMFRPCFFW-GCJQMDKQSA-N Ala-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C)N)O XQNRANMFRPCFFW-GCJQMDKQSA-N 0.000 description 1
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 1
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 1
- XCIGOVDXZULBBV-DCAQKATOSA-N Ala-Val-Lys Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCCCN)C(O)=O XCIGOVDXZULBBV-DCAQKATOSA-N 0.000 description 1
- 101100495462 Arabidopsis thaliana CER16 gene Proteins 0.000 description 1
- VKKYFICVTYKFIO-CIUDSAMLSA-N Arg-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N VKKYFICVTYKFIO-CIUDSAMLSA-N 0.000 description 1
- KJGNDQCYBNBXDA-GUBZILKMSA-N Arg-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N)CN=C(N)N KJGNDQCYBNBXDA-GUBZILKMSA-N 0.000 description 1
- IASNWHAGGYTEKX-IUCAKERBSA-N Arg-Arg-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(O)=O IASNWHAGGYTEKX-IUCAKERBSA-N 0.000 description 1
- PQWTZSNVWSOFFK-FXQIFTODSA-N Arg-Asp-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)CN=C(N)N PQWTZSNVWSOFFK-FXQIFTODSA-N 0.000 description 1
- IGULQRCJLQQPSM-DCAQKATOSA-N Arg-Cys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O IGULQRCJLQQPSM-DCAQKATOSA-N 0.000 description 1
- QQJSJIBESHAJPM-IHRRRGAJSA-N Arg-Cys-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QQJSJIBESHAJPM-IHRRRGAJSA-N 0.000 description 1
- SNBHMYQRNCJSOJ-CIUDSAMLSA-N Arg-Gln-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SNBHMYQRNCJSOJ-CIUDSAMLSA-N 0.000 description 1
- YHQGEARSFILVHL-HJGDQZAQSA-N Arg-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)O YHQGEARSFILVHL-HJGDQZAQSA-N 0.000 description 1
- VRZDJJWOFXMFRO-ZFWWWQNUSA-N Arg-Gly-Trp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O VRZDJJWOFXMFRO-ZFWWWQNUSA-N 0.000 description 1
- NVCIXQYNWYTLDO-IHRRRGAJSA-N Arg-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N NVCIXQYNWYTLDO-IHRRRGAJSA-N 0.000 description 1
- OOIMKQRCPJBGPD-XUXIUFHCSA-N Arg-Ile-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O OOIMKQRCPJBGPD-XUXIUFHCSA-N 0.000 description 1
- IIAXFBUTKIDDIP-ULQDDVLXSA-N Arg-Leu-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IIAXFBUTKIDDIP-ULQDDVLXSA-N 0.000 description 1
- UGZUVYDKAYNCII-ULQDDVLXSA-N Arg-Phe-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UGZUVYDKAYNCII-ULQDDVLXSA-N 0.000 description 1
- AOHKLEBWKMKITA-IHRRRGAJSA-N Arg-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AOHKLEBWKMKITA-IHRRRGAJSA-N 0.000 description 1
- OVQJAKFLFTZDNC-GUBZILKMSA-N Arg-Pro-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O OVQJAKFLFTZDNC-GUBZILKMSA-N 0.000 description 1
- UULLJGQFCDXVTQ-CYDGBPFRSA-N Arg-Pro-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UULLJGQFCDXVTQ-CYDGBPFRSA-N 0.000 description 1
- JPAWCMXVNZPJLO-IHRRRGAJSA-N Arg-Ser-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JPAWCMXVNZPJLO-IHRRRGAJSA-N 0.000 description 1
- WCZXPVPHUMYLMS-VEVYYDQMSA-N Arg-Thr-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O WCZXPVPHUMYLMS-VEVYYDQMSA-N 0.000 description 1
- RYQSYXFGFOTJDJ-RHYQMDGZSA-N Arg-Thr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RYQSYXFGFOTJDJ-RHYQMDGZSA-N 0.000 description 1
- QMQZYILAWUOLPV-JYJNAYRXSA-N Arg-Tyr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)CC1=CC=C(O)C=C1 QMQZYILAWUOLPV-JYJNAYRXSA-N 0.000 description 1
- NMTANZXPDAHUKU-ULQDDVLXSA-N Arg-Tyr-Lys Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=C(O)C=C1 NMTANZXPDAHUKU-ULQDDVLXSA-N 0.000 description 1
- HZPSDHRYYIORKR-WHFBIAKZSA-N Asn-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O HZPSDHRYYIORKR-WHFBIAKZSA-N 0.000 description 1
- VDCIPFYVCICPEC-FXQIFTODSA-N Asn-Arg-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O VDCIPFYVCICPEC-FXQIFTODSA-N 0.000 description 1
- HAJWYALLJIATCX-FXQIFTODSA-N Asn-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N HAJWYALLJIATCX-FXQIFTODSA-N 0.000 description 1
- BGINHSZTXRJIPP-FXQIFTODSA-N Asn-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N BGINHSZTXRJIPP-FXQIFTODSA-N 0.000 description 1
- PQAIOUVVZCOLJK-FXQIFTODSA-N Asn-Gln-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PQAIOUVVZCOLJK-FXQIFTODSA-N 0.000 description 1
- SRUUBQBAVNQZGJ-LAEOZQHASA-N Asn-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N SRUUBQBAVNQZGJ-LAEOZQHASA-N 0.000 description 1
- ULRPXVNMIIYDDJ-ACZMJKKPSA-N Asn-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N ULRPXVNMIIYDDJ-ACZMJKKPSA-N 0.000 description 1
- OLGCWMNDJTWQAG-GUBZILKMSA-N Asn-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(N)=O OLGCWMNDJTWQAG-GUBZILKMSA-N 0.000 description 1
- DMLSCRJBWUEALP-LAEOZQHASA-N Asn-Glu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O DMLSCRJBWUEALP-LAEOZQHASA-N 0.000 description 1
- AITGTTNYKAWKDR-CIUDSAMLSA-N Asn-His-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O AITGTTNYKAWKDR-CIUDSAMLSA-N 0.000 description 1
- JLNFZLNDHONLND-GARJFASQSA-N Asn-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N JLNFZLNDHONLND-GARJFASQSA-N 0.000 description 1
- HZZIFFOVHLWGCS-KKUMJFAQSA-N Asn-Phe-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O HZZIFFOVHLWGCS-KKUMJFAQSA-N 0.000 description 1
- MKJBPDLENBUHQU-CIUDSAMLSA-N Asn-Ser-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O MKJBPDLENBUHQU-CIUDSAMLSA-N 0.000 description 1
- SNYCNNPOFYBCEK-ZLUOBGJFSA-N Asn-Ser-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O SNYCNNPOFYBCEK-ZLUOBGJFSA-N 0.000 description 1
- NCXTYSVDWLAQGZ-ZKWXMUAHSA-N Asn-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O NCXTYSVDWLAQGZ-ZKWXMUAHSA-N 0.000 description 1
- JBDLMLZNDRLDIX-HJGDQZAQSA-N Asn-Thr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O JBDLMLZNDRLDIX-HJGDQZAQSA-N 0.000 description 1
- PUUPMDXIHCOPJU-HJGDQZAQSA-N Asn-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O PUUPMDXIHCOPJU-HJGDQZAQSA-N 0.000 description 1
- KZYSHAMXEBPJBD-JRQIVUDYSA-N Asn-Thr-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KZYSHAMXEBPJBD-JRQIVUDYSA-N 0.000 description 1
- RTFXPCYMDYBZNQ-SRVKXCTJSA-N Asn-Tyr-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O RTFXPCYMDYBZNQ-SRVKXCTJSA-N 0.000 description 1
- BEHQTVDBCLSCBY-CFMVVWHZSA-N Asn-Tyr-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BEHQTVDBCLSCBY-CFMVVWHZSA-N 0.000 description 1
- LTDGPJKGJDIBQD-LAEOZQHASA-N Asn-Val-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LTDGPJKGJDIBQD-LAEOZQHASA-N 0.000 description 1
- GVPSCJQLUGIKAM-GUBZILKMSA-N Asp-Arg-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GVPSCJQLUGIKAM-GUBZILKMSA-N 0.000 description 1
- KIJLEFNHWSXHRU-NUMRIWBASA-N Asp-Gln-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KIJLEFNHWSXHRU-NUMRIWBASA-N 0.000 description 1
- OVPHVTCDVYYTHN-AVGNSLFASA-N Asp-Glu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OVPHVTCDVYYTHN-AVGNSLFASA-N 0.000 description 1
- YNCHFVRXEQFPBY-BQBZGAKWSA-N Asp-Gly-Arg Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N YNCHFVRXEQFPBY-BQBZGAKWSA-N 0.000 description 1
- AITKTFCQOBRJTG-CIUDSAMLSA-N Asp-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N AITKTFCQOBRJTG-CIUDSAMLSA-N 0.000 description 1
- HKEZZWQWXWGASX-KKUMJFAQSA-N Asp-Leu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HKEZZWQWXWGASX-KKUMJFAQSA-N 0.000 description 1
- LIVXPXUVXFRWNY-CIUDSAMLSA-N Asp-Lys-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O LIVXPXUVXFRWNY-CIUDSAMLSA-N 0.000 description 1
- HJCGDIGVVWETRO-ZPFDUUQYSA-N Asp-Lys-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O)C(O)=O HJCGDIGVVWETRO-ZPFDUUQYSA-N 0.000 description 1
- LIJXJYGRSRWLCJ-IHRRRGAJSA-N Asp-Phe-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LIJXJYGRSRWLCJ-IHRRRGAJSA-N 0.000 description 1
- LTCKTLYKRMCFOC-KKUMJFAQSA-N Asp-Phe-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LTCKTLYKRMCFOC-KKUMJFAQSA-N 0.000 description 1
- JUWISGAGWSDGDH-KKUMJFAQSA-N Asp-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=CC=C1 JUWISGAGWSDGDH-KKUMJFAQSA-N 0.000 description 1
- UCHSVZYJKJLPHF-BZSNNMDCSA-N Asp-Phe-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O UCHSVZYJKJLPHF-BZSNNMDCSA-N 0.000 description 1
- YFGUZQQCSDZRBN-DCAQKATOSA-N Asp-Pro-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O YFGUZQQCSDZRBN-DCAQKATOSA-N 0.000 description 1
- GGRSYTUJHAZTFN-IHRRRGAJSA-N Asp-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O GGRSYTUJHAZTFN-IHRRRGAJSA-N 0.000 description 1
- ZBYLEBZCVKLPCY-FXQIFTODSA-N Asp-Ser-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZBYLEBZCVKLPCY-FXQIFTODSA-N 0.000 description 1
- ZVGRHIRJLWBWGJ-ACZMJKKPSA-N Asp-Ser-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZVGRHIRJLWBWGJ-ACZMJKKPSA-N 0.000 description 1
- MNQMTYSEKZHIDF-GCJQMDKQSA-N Asp-Thr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O MNQMTYSEKZHIDF-GCJQMDKQSA-N 0.000 description 1
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 1
- UEFODXNXUAVPTC-VEVYYDQMSA-N Asp-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O UEFODXNXUAVPTC-VEVYYDQMSA-N 0.000 description 1
- PDIYGFYAMZZFCW-JIOCBJNQSA-N Asp-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N)O PDIYGFYAMZZFCW-JIOCBJNQSA-N 0.000 description 1
- ITGFVUYOLWBPQW-KKHAAJSZSA-N Asp-Thr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O ITGFVUYOLWBPQW-KKHAAJSZSA-N 0.000 description 1
- ALMIMUZAWTUNIO-BZSNNMDCSA-N Asp-Tyr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ALMIMUZAWTUNIO-BZSNNMDCSA-N 0.000 description 1
- GZYDPEJSZYZWEF-MXAVVETBSA-N Asp-Val-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O GZYDPEJSZYZWEF-MXAVVETBSA-N 0.000 description 1
- 108091008875 B cell receptors Proteins 0.000 description 1
- 206010006448 Bronchiolitis Diseases 0.000 description 1
- 102100023321 Ceruloplasmin Human genes 0.000 description 1
- 229940124957 Cervarix Drugs 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- 102100031673 Corneodesmosin Human genes 0.000 description 1
- 101710139375 Corneodesmosin Proteins 0.000 description 1
- 241000699802 Cricetulus griseus Species 0.000 description 1
- RRIJEABIXPKSGP-FXQIFTODSA-N Cys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CS RRIJEABIXPKSGP-FXQIFTODSA-N 0.000 description 1
- XGIAHEUULGOZHH-GUBZILKMSA-N Cys-Arg-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CS)N XGIAHEUULGOZHH-GUBZILKMSA-N 0.000 description 1
- QDFBJJABJKOLTD-FXQIFTODSA-N Cys-Asn-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QDFBJJABJKOLTD-FXQIFTODSA-N 0.000 description 1
- KOHBWQDSVCARMI-BWBBJGPYSA-N Cys-Cys-Thr Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KOHBWQDSVCARMI-BWBBJGPYSA-N 0.000 description 1
- ZVNFONSZVUBRAV-CIUDSAMLSA-N Cys-Gln-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CS)N)CN=C(N)N ZVNFONSZVUBRAV-CIUDSAMLSA-N 0.000 description 1
- PQHYZJPCYRDYNE-QWRGUYRKSA-N Cys-Gly-Phe Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PQHYZJPCYRDYNE-QWRGUYRKSA-N 0.000 description 1
- HBHMVBGGHDMPBF-GARJFASQSA-N Cys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N HBHMVBGGHDMPBF-GARJFASQSA-N 0.000 description 1
- XXDATQFUGMAJRV-XIRDDKMYSA-N Cys-Leu-Trp Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O XXDATQFUGMAJRV-XIRDDKMYSA-N 0.000 description 1
- ZXCAQANTQWBICD-DCAQKATOSA-N Cys-Lys-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CS)N ZXCAQANTQWBICD-DCAQKATOSA-N 0.000 description 1
- KJJASVYBTKRYSN-FXQIFTODSA-N Cys-Pro-Asp Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CS)N)C(=O)N[C@@H](CC(=O)O)C(=O)O KJJASVYBTKRYSN-FXQIFTODSA-N 0.000 description 1
- DQUWSUWXPWGTQT-DCAQKATOSA-N Cys-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CS DQUWSUWXPWGTQT-DCAQKATOSA-N 0.000 description 1
- NXQCSPVUPLUTJH-WHFBIAKZSA-N Cys-Ser-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O NXQCSPVUPLUTJH-WHFBIAKZSA-N 0.000 description 1
- NRVQLLDIJJEIIZ-VZFHVOOUSA-N Cys-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CS)N)O NRVQLLDIJJEIIZ-VZFHVOOUSA-N 0.000 description 1
- IRKLTAKLAFUTLA-KATARQTJSA-N Cys-Thr-Lys Chemical compound C[C@@H](O)[C@H](NC(=O)[C@@H](N)CS)C(=O)N[C@@H](CCCCN)C(O)=O IRKLTAKLAFUTLA-KATARQTJSA-N 0.000 description 1
- DRXOWZZHCSBUOI-YJRXYDGGSA-N Cys-Thr-Tyr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CS)N)O DRXOWZZHCSBUOI-YJRXYDGGSA-N 0.000 description 1
- BOMGEMDZTNZESV-QWRGUYRKSA-N Cys-Tyr-Gly Chemical compound SC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 BOMGEMDZTNZESV-QWRGUYRKSA-N 0.000 description 1
- JRZMCSIUYGSJKP-ZKWXMUAHSA-N Cys-Val-Asn Chemical compound SC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O JRZMCSIUYGSJKP-ZKWXMUAHSA-N 0.000 description 1
- DGQJGBDBFVGLGL-ZKWXMUAHSA-N Cys-Val-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N DGQJGBDBFVGLGL-ZKWXMUAHSA-N 0.000 description 1
- 241000702421 Dependoparvovirus Species 0.000 description 1
- 208000012239 Developmental disease Diseases 0.000 description 1
- 238000012286 ELISA Assay Methods 0.000 description 1
- 102100038132 Endogenous retrovirus group K member 6 Pro protein Human genes 0.000 description 1
- 241000710781 Flaviviridae Species 0.000 description 1
- 108091006027 G proteins Proteins 0.000 description 1
- 102000030782 GTP binding Human genes 0.000 description 1
- 108091000058 GTP-Binding Proteins 0.000 description 1
- 229940124897 Gardasil Drugs 0.000 description 1
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 1
- KZKBJEUWNMQTLV-XDTLVQLUSA-N Gln-Ala-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KZKBJEUWNMQTLV-XDTLVQLUSA-N 0.000 description 1
- JSYULGSPLTZDHM-NRPADANISA-N Gln-Ala-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O JSYULGSPLTZDHM-NRPADANISA-N 0.000 description 1
- PRBLYKYHAJEABA-SRVKXCTJSA-N Gln-Arg-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O PRBLYKYHAJEABA-SRVKXCTJSA-N 0.000 description 1
- MADFVRSKEIEZHZ-DCAQKATOSA-N Gln-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N MADFVRSKEIEZHZ-DCAQKATOSA-N 0.000 description 1
- SNLOOPZHAQDMJG-CIUDSAMLSA-N Gln-Glu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SNLOOPZHAQDMJG-CIUDSAMLSA-N 0.000 description 1
- HYPVLWGNBIYTNA-GUBZILKMSA-N Gln-Leu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HYPVLWGNBIYTNA-GUBZILKMSA-N 0.000 description 1
- QBLMTCRYYTVUQY-GUBZILKMSA-N Gln-Leu-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QBLMTCRYYTVUQY-GUBZILKMSA-N 0.000 description 1
- PSERKXGRRADTKA-MNXVOIDGSA-N Gln-Leu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PSERKXGRRADTKA-MNXVOIDGSA-N 0.000 description 1
- XFAUJGNLHIGXET-AVGNSLFASA-N Gln-Leu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XFAUJGNLHIGXET-AVGNSLFASA-N 0.000 description 1
- IOFDDSNZJDIGPB-GVXVVHGQSA-N Gln-Leu-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IOFDDSNZJDIGPB-GVXVVHGQSA-N 0.000 description 1
- FALJZCPMTGJOHX-SRVKXCTJSA-N Gln-Met-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O FALJZCPMTGJOHX-SRVKXCTJSA-N 0.000 description 1
- SFAFZYYMAWOCIC-KKUMJFAQSA-N Gln-Phe-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SFAFZYYMAWOCIC-KKUMJFAQSA-N 0.000 description 1
- XZUUUKNKNWVPHQ-JYJNAYRXSA-N Gln-Phe-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O XZUUUKNKNWVPHQ-JYJNAYRXSA-N 0.000 description 1
- KUBFPYIMAGXGBT-ACZMJKKPSA-N Gln-Ser-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KUBFPYIMAGXGBT-ACZMJKKPSA-N 0.000 description 1
- STHSGOZLFLFGSS-SUSMZKCASA-N Gln-Thr-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STHSGOZLFLFGSS-SUSMZKCASA-N 0.000 description 1
- FITIQFSXXBKFFM-NRPADANISA-N Gln-Val-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FITIQFSXXBKFFM-NRPADANISA-N 0.000 description 1
- SOEXCCGNHQBFPV-DLOVCJGASA-N Gln-Val-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SOEXCCGNHQBFPV-DLOVCJGASA-N 0.000 description 1
- NKSGKPWXSWBRRX-ACZMJKKPSA-N Glu-Asn-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N NKSGKPWXSWBRRX-ACZMJKKPSA-N 0.000 description 1
- MXPBQDFWIMBACQ-ACZMJKKPSA-N Glu-Cys-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(O)=O MXPBQDFWIMBACQ-ACZMJKKPSA-N 0.000 description 1
- YLJHCWNDBKKOEB-IHRRRGAJSA-N Glu-Glu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YLJHCWNDBKKOEB-IHRRRGAJSA-N 0.000 description 1
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 1
- MTAOBYXRYJZRGQ-WDSKDSINSA-N Glu-Gly-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MTAOBYXRYJZRGQ-WDSKDSINSA-N 0.000 description 1
- IOUQWHIEQYQVFD-JYJNAYRXSA-N Glu-Leu-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IOUQWHIEQYQVFD-JYJNAYRXSA-N 0.000 description 1
- SWRVAQHFBRZVNX-GUBZILKMSA-N Glu-Lys-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SWRVAQHFBRZVNX-GUBZILKMSA-N 0.000 description 1
- QDMVXRNLOPTPIE-WDCWCFNPSA-N Glu-Lys-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QDMVXRNLOPTPIE-WDCWCFNPSA-N 0.000 description 1
- WVWZIPOJECFDAG-AVGNSLFASA-N Glu-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N WVWZIPOJECFDAG-AVGNSLFASA-N 0.000 description 1
- FGSGPLRPQCZBSQ-AVGNSLFASA-N Glu-Phe-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O FGSGPLRPQCZBSQ-AVGNSLFASA-N 0.000 description 1
- QOXDAWODGSIDDI-GUBZILKMSA-N Glu-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N QOXDAWODGSIDDI-GUBZILKMSA-N 0.000 description 1
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 1
- HZISRJBYZAODRV-XQXXSGGOSA-N Glu-Thr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O HZISRJBYZAODRV-XQXXSGGOSA-N 0.000 description 1
- GPSHCSTUYOQPAI-JHEQGTHGSA-N Glu-Thr-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O GPSHCSTUYOQPAI-JHEQGTHGSA-N 0.000 description 1
- FVGOGEGGQLNZGH-DZKIICNBSA-N Glu-Val-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FVGOGEGGQLNZGH-DZKIICNBSA-N 0.000 description 1
- QXUPRMQJDWJDFR-NRPADANISA-N Glu-Val-Ser Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXUPRMQJDWJDFR-NRPADANISA-N 0.000 description 1
- UPOJUWHGMDJUQZ-IUCAKERBSA-N Gly-Arg-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UPOJUWHGMDJUQZ-IUCAKERBSA-N 0.000 description 1
- CLODWIOAKCSBAN-BQBZGAKWSA-N Gly-Arg-Asp Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O CLODWIOAKCSBAN-BQBZGAKWSA-N 0.000 description 1
- PYUCNHJQQVSPGN-BQBZGAKWSA-N Gly-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN)CN=C(N)N PYUCNHJQQVSPGN-BQBZGAKWSA-N 0.000 description 1
- GWCRIHNSVMOBEQ-BQBZGAKWSA-N Gly-Arg-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O GWCRIHNSVMOBEQ-BQBZGAKWSA-N 0.000 description 1
- GZBZACMXFIPIDX-WHFBIAKZSA-N Gly-Cys-Asp Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)CN)C(=O)O GZBZACMXFIPIDX-WHFBIAKZSA-N 0.000 description 1
- CQZDZKRHFWJXDF-WDSKDSINSA-N Gly-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CN CQZDZKRHFWJXDF-WDSKDSINSA-N 0.000 description 1
- LHRXAHLCRMQBGJ-RYUDHWBXSA-N Gly-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)CN LHRXAHLCRMQBGJ-RYUDHWBXSA-N 0.000 description 1
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 1
- VAXIVIPMCTYSHI-YUMQZZPRSA-N Gly-His-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN VAXIVIPMCTYSHI-YUMQZZPRSA-N 0.000 description 1
- FSPVILZGHUJOHS-QWRGUYRKSA-N Gly-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CNC=N1 FSPVILZGHUJOHS-QWRGUYRKSA-N 0.000 description 1
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 1
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 1
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 1
- WZSHYFGOLPXPLL-RYUDHWBXSA-N Gly-Phe-Glu Chemical compound NCC(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CCC(O)=O)C(O)=O WZSHYFGOLPXPLL-RYUDHWBXSA-N 0.000 description 1
- 108010009504 Gly-Phe-Leu-Gly Proteins 0.000 description 1
- QSQXZZCGPXQBPP-BQBZGAKWSA-N Gly-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)CN)C(=O)N[C@@H](CS)C(=O)O QSQXZZCGPXQBPP-BQBZGAKWSA-N 0.000 description 1
- HAOUOFNNJJLVNS-BQBZGAKWSA-N Gly-Pro-Ser Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O HAOUOFNNJJLVNS-BQBZGAKWSA-N 0.000 description 1
- ABPRMMYHROQBLY-NKWVEPMBSA-N Gly-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)CN)C(=O)O ABPRMMYHROQBLY-NKWVEPMBSA-N 0.000 description 1
- FKESCSGWBPUTPN-FOHZUACHSA-N Gly-Thr-Asn Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O FKESCSGWBPUTPN-FOHZUACHSA-N 0.000 description 1
- GWNIGUKSRJBIHX-STQMWFEESA-N Gly-Tyr-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)CN)O GWNIGUKSRJBIHX-STQMWFEESA-N 0.000 description 1
- GNNJKUYDWFIBTK-QWRGUYRKSA-N Gly-Tyr-Asp Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O GNNJKUYDWFIBTK-QWRGUYRKSA-N 0.000 description 1
- KOYUSMBPJOVSOO-XEGUGMAKSA-N Gly-Tyr-Ile Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KOYUSMBPJOVSOO-XEGUGMAKSA-N 0.000 description 1
- IHDKKJVBLGXLEL-STQMWFEESA-N Gly-Tyr-Met Chemical compound CSCC[C@H](NC(=O)[C@H](Cc1ccc(O)cc1)NC(=O)CN)C(O)=O IHDKKJVBLGXLEL-STQMWFEESA-N 0.000 description 1
- ZVXMEWXHFBYJPI-LSJOCFKGSA-N Gly-Val-Ile Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZVXMEWXHFBYJPI-LSJOCFKGSA-N 0.000 description 1
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 1
- 241000711549 Hepacivirus C Species 0.000 description 1
- 229920002971 Heparan sulfate Polymers 0.000 description 1
- AWHJQEYGWRKPHE-LSJOCFKGSA-N His-Ala-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AWHJQEYGWRKPHE-LSJOCFKGSA-N 0.000 description 1
- PROLDOGUBQJNPG-RWMBFGLXSA-N His-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O PROLDOGUBQJNPG-RWMBFGLXSA-N 0.000 description 1
- LYSVCKOXIDKEEL-SRVKXCTJSA-N His-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CN=CN1 LYSVCKOXIDKEEL-SRVKXCTJSA-N 0.000 description 1
- ZZLWLWSUIBSMNP-CIUDSAMLSA-N His-Asp-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZZLWLWSUIBSMNP-CIUDSAMLSA-N 0.000 description 1
- HVCRQRQPIIRNLY-IUCAKERBSA-N His-Gln-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)NCC(=O)O)N HVCRQRQPIIRNLY-IUCAKERBSA-N 0.000 description 1
- 108010093488 His-His-His-His-His-His Proteins 0.000 description 1
- SKOKHBGDXGTDDP-MELADBBJSA-N His-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N SKOKHBGDXGTDDP-MELADBBJSA-N 0.000 description 1
- YIGCZZKZFMNSIU-RWMBFGLXSA-N His-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N YIGCZZKZFMNSIU-RWMBFGLXSA-N 0.000 description 1
- KYFGGRHWLFZXPU-KKUMJFAQSA-N His-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N KYFGGRHWLFZXPU-KKUMJFAQSA-N 0.000 description 1
- BFOGZWSSGMLYKV-DCAQKATOSA-N His-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CN=CN1)N BFOGZWSSGMLYKV-DCAQKATOSA-N 0.000 description 1
- FFYYUUWROYYKFY-IHRRRGAJSA-N His-Val-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O FFYYUUWROYYKFY-IHRRRGAJSA-N 0.000 description 1
- 101001098868 Homo sapiens Proprotein convertase subtilisin/kexin type 9 Proteins 0.000 description 1
- 101001012157 Homo sapiens Receptor tyrosine-protein kinase erbB-2 Proteins 0.000 description 1
- 101000807236 Human cytomegalovirus (strain AD169) Membrane glycoprotein US3 Proteins 0.000 description 1
- 101900039244 Human cytomegalovirus Envelope glycoprotein UL130 Proteins 0.000 description 1
- 101900003124 Human cytomegalovirus Envelope protein UL128 Proteins 0.000 description 1
- VSZALHITQINTGC-GHCJXIJMSA-N Ile-Ala-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VSZALHITQINTGC-GHCJXIJMSA-N 0.000 description 1
- DXUJSRIVSWEOAG-NAKRPEOUSA-N Ile-Arg-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N DXUJSRIVSWEOAG-NAKRPEOUSA-N 0.000 description 1
- HZMLFETXHFHGBB-UGYAYLCHSA-N Ile-Asn-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZMLFETXHFHGBB-UGYAYLCHSA-N 0.000 description 1
- PJLLMGWWINYQPB-PEFMBERDSA-N Ile-Asn-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PJLLMGWWINYQPB-PEFMBERDSA-N 0.000 description 1
- YPQDTQJBOFOTJQ-SXTJYALSSA-N Ile-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N YPQDTQJBOFOTJQ-SXTJYALSSA-N 0.000 description 1
- IDAHFEPYTJJZFD-PEFMBERDSA-N Ile-Asp-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N IDAHFEPYTJJZFD-PEFMBERDSA-N 0.000 description 1
- HPCFRQWLTRDGHT-AJNGGQMLSA-N Ile-Leu-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O HPCFRQWLTRDGHT-AJNGGQMLSA-N 0.000 description 1
- PHRWFSFCNJPWRO-PPCPHDFISA-N Ile-Leu-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N PHRWFSFCNJPWRO-PPCPHDFISA-N 0.000 description 1
- CKRFDMPBSWYOBT-PPCPHDFISA-N Ile-Lys-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CKRFDMPBSWYOBT-PPCPHDFISA-N 0.000 description 1
- VUPHVQCDULLACF-NAKRPEOUSA-N Ile-Met-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CS)C(=O)O)N VUPHVQCDULLACF-NAKRPEOUSA-N 0.000 description 1
- UAELWXJFLZBKQS-WHOFXGATSA-N Ile-Phe-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O UAELWXJFLZBKQS-WHOFXGATSA-N 0.000 description 1
- XLXPYSDGMXTTNQ-DKIMLUQUSA-N Ile-Phe-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CC(C)C)C(O)=O XLXPYSDGMXTTNQ-DKIMLUQUSA-N 0.000 description 1
- CIDLJWVDMNDKPT-FIRPJDEBSA-N Ile-Phe-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N CIDLJWVDMNDKPT-FIRPJDEBSA-N 0.000 description 1
- VEPIBPGLTLPBDW-URLPEUOOSA-N Ile-Phe-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N VEPIBPGLTLPBDW-URLPEUOOSA-N 0.000 description 1
- KCTIFOCXAIUQQK-QXEWZRGKSA-N Ile-Pro-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O KCTIFOCXAIUQQK-QXEWZRGKSA-N 0.000 description 1
- CAHCWMVNBZJVAW-NAKRPEOUSA-N Ile-Pro-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)O)N CAHCWMVNBZJVAW-NAKRPEOUSA-N 0.000 description 1
- PELCGFMHLZXWBQ-BJDJZHNGSA-N Ile-Ser-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)O)N PELCGFMHLZXWBQ-BJDJZHNGSA-N 0.000 description 1
- WLRJHVNFGAOYPS-HJPIBITLSA-N Ile-Ser-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N WLRJHVNFGAOYPS-HJPIBITLSA-N 0.000 description 1
- PZWBBXHHUSIGKH-OSUNSFLBSA-N Ile-Thr-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PZWBBXHHUSIGKH-OSUNSFLBSA-N 0.000 description 1
- YCKPUHHMCFSUMD-IUKAMOBKSA-N Ile-Thr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCKPUHHMCFSUMD-IUKAMOBKSA-N 0.000 description 1
- APQYGMBHIVXFML-OSUNSFLBSA-N Ile-Val-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N APQYGMBHIVXFML-OSUNSFLBSA-N 0.000 description 1
- 241000371980 Influenza B virus (B/Shanghai/361/2002) Species 0.000 description 1
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 1
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 1
- FJUKMPUELVROGK-IHRRRGAJSA-N Leu-Arg-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N FJUKMPUELVROGK-IHRRRGAJSA-N 0.000 description 1
- CUXRXAIAVYLVFD-ULQDDVLXSA-N Leu-Arg-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CUXRXAIAVYLVFD-ULQDDVLXSA-N 0.000 description 1
- MDVZJYGNAGLPGJ-KKUMJFAQSA-N Leu-Asn-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MDVZJYGNAGLPGJ-KKUMJFAQSA-N 0.000 description 1
- WXHFZJFZWNCDNB-KKUMJFAQSA-N Leu-Asn-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WXHFZJFZWNCDNB-KKUMJFAQSA-N 0.000 description 1
- ZURHXHNAEJJRNU-CIUDSAMLSA-N Leu-Asp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZURHXHNAEJJRNU-CIUDSAMLSA-N 0.000 description 1
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 1
- PPBKJAQJAUHZKX-SRVKXCTJSA-N Leu-Cys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC(C)C PPBKJAQJAUHZKX-SRVKXCTJSA-N 0.000 description 1
- PNUCWVAGVNLUMW-CIUDSAMLSA-N Leu-Cys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O PNUCWVAGVNLUMW-CIUDSAMLSA-N 0.000 description 1
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 1
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 1
- LLBQJYDYOLIQAI-JYJNAYRXSA-N Leu-Glu-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LLBQJYDYOLIQAI-JYJNAYRXSA-N 0.000 description 1
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 1
- VBZOAGIPCULURB-QWRGUYRKSA-N Leu-Gly-His Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N VBZOAGIPCULURB-QWRGUYRKSA-N 0.000 description 1
- OMHLATXVNQSALM-FQUUOJAGSA-N Leu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(C)C)N OMHLATXVNQSALM-FQUUOJAGSA-N 0.000 description 1
- HRTRLSRYZZKPCO-BJDJZHNGSA-N Leu-Ile-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HRTRLSRYZZKPCO-BJDJZHNGSA-N 0.000 description 1
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 1
- FAELBUXXFQLUAX-AJNGGQMLSA-N Leu-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C FAELBUXXFQLUAX-AJNGGQMLSA-N 0.000 description 1
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 1
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 1
- ZGUMORRUBUCXEH-AVGNSLFASA-N Leu-Lys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZGUMORRUBUCXEH-AVGNSLFASA-N 0.000 description 1
- FLNPJLDPGMLWAU-UWVGGRQHSA-N Leu-Met-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(C)C FLNPJLDPGMLWAU-UWVGGRQHSA-N 0.000 description 1
- PTRKPHUGYULXPU-KKUMJFAQSA-N Leu-Phe-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O PTRKPHUGYULXPU-KKUMJFAQSA-N 0.000 description 1
- MVVSHHJKJRZVNY-ACRUOGEOSA-N Leu-Phe-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MVVSHHJKJRZVNY-ACRUOGEOSA-N 0.000 description 1
- QMKFDEUJGYNFMC-AVGNSLFASA-N Leu-Pro-Arg Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QMKFDEUJGYNFMC-AVGNSLFASA-N 0.000 description 1
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 1
- JDBQSGMJBMPNFT-AVGNSLFASA-N Leu-Pro-Val Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JDBQSGMJBMPNFT-AVGNSLFASA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- SBANPBVRHYIMRR-GARJFASQSA-N Leu-Ser-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N SBANPBVRHYIMRR-GARJFASQSA-N 0.000 description 1
- SQUFDMCWMFOEBA-KKUMJFAQSA-N Leu-Ser-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SQUFDMCWMFOEBA-KKUMJFAQSA-N 0.000 description 1
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 1
- LJBVRCDPWOJOEK-PPCPHDFISA-N Leu-Thr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LJBVRCDPWOJOEK-PPCPHDFISA-N 0.000 description 1
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 1
- FPFOYSCDUWTZBF-IHPCNDPISA-N Leu-Trp-Leu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H]([NH3+])CC(C)C)C(=O)N[C@@H](CC(C)C)C([O-])=O)=CNC2=C1 FPFOYSCDUWTZBF-IHPCNDPISA-N 0.000 description 1
- SUYRAPCRSCCPAK-VFAJRCTISA-N Leu-Trp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SUYRAPCRSCCPAK-VFAJRCTISA-N 0.000 description 1
- HQBOMRTVKVKFMN-WDSOQIARSA-N Leu-Trp-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(O)=O HQBOMRTVKVKFMN-WDSOQIARSA-N 0.000 description 1
- VUBIPAHVHMZHCM-KKUMJFAQSA-N Leu-Tyr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 VUBIPAHVHMZHCM-KKUMJFAQSA-N 0.000 description 1
- VQHUBNVKFFLWRP-ULQDDVLXSA-N Leu-Tyr-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 VQHUBNVKFFLWRP-ULQDDVLXSA-N 0.000 description 1
- LMDVGHQPPPLYAR-IHRRRGAJSA-N Leu-Val-His Chemical compound N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O LMDVGHQPPPLYAR-IHRRRGAJSA-N 0.000 description 1
- 108010028921 Lipopeptides Proteins 0.000 description 1
- 206010024971 Lower respiratory tract infections Diseases 0.000 description 1
- 208000019693 Lung disease Diseases 0.000 description 1
- CLBGMWIYPYAZPR-AVGNSLFASA-N Lys-Arg-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O CLBGMWIYPYAZPR-AVGNSLFASA-N 0.000 description 1
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 1
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 1
- 108010062166 Lys-Asn-Asp Proteins 0.000 description 1
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 1
- AAORVPFVUIHEAB-YUMQZZPRSA-N Lys-Asp-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O AAORVPFVUIHEAB-YUMQZZPRSA-N 0.000 description 1
- VEGLGAOVLFODGC-GUBZILKMSA-N Lys-Glu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VEGLGAOVLFODGC-GUBZILKMSA-N 0.000 description 1
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 1
- KYNNSEJZFVCDIV-ZPFDUUQYSA-N Lys-Ile-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O KYNNSEJZFVCDIV-ZPFDUUQYSA-N 0.000 description 1
- QOJDBRUCOXQSSK-AJNGGQMLSA-N Lys-Ile-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O QOJDBRUCOXQSSK-AJNGGQMLSA-N 0.000 description 1
- ORVFEGYUJITPGI-IHRRRGAJSA-N Lys-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN ORVFEGYUJITPGI-IHRRRGAJSA-N 0.000 description 1
- ZJWIXBZTAAJERF-IHRRRGAJSA-N Lys-Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZJWIXBZTAAJERF-IHRRRGAJSA-N 0.000 description 1
- JQSIGLHQNSZZRL-KKUMJFAQSA-N Lys-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N JQSIGLHQNSZZRL-KKUMJFAQSA-N 0.000 description 1
- TVOOGUNBIWAURO-KATARQTJSA-N Lys-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N)O TVOOGUNBIWAURO-KATARQTJSA-N 0.000 description 1
- YKBSXQFZWFXFIB-VOAKCMCISA-N Lys-Thr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O YKBSXQFZWFXFIB-VOAKCMCISA-N 0.000 description 1
- RMKJOQSYLQQRFN-KKUMJFAQSA-N Lys-Tyr-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O RMKJOQSYLQQRFN-KKUMJFAQSA-N 0.000 description 1
- MDDUIRLQCYVRDO-NHCYSSNCSA-N Lys-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN MDDUIRLQCYVRDO-NHCYSSNCSA-N 0.000 description 1
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 1
- OZVXDDFYCQOPFD-XQQFMLRXSA-N Lys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N OZVXDDFYCQOPFD-XQQFMLRXSA-N 0.000 description 1
- 241000701076 Macacine alphaherpesvirus 1 Species 0.000 description 1
- DSWOTZCVCBEPOU-IUCAKERBSA-N Met-Arg-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCNC(N)=N DSWOTZCVCBEPOU-IUCAKERBSA-N 0.000 description 1
- WDTLNWHPIPCMMP-AVGNSLFASA-N Met-Arg-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O WDTLNWHPIPCMMP-AVGNSLFASA-N 0.000 description 1
- HKRYNJSKVLZIFP-IHRRRGAJSA-N Met-Asn-Tyr Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O HKRYNJSKVLZIFP-IHRRRGAJSA-N 0.000 description 1
- JUXONJROIXKHEV-GUBZILKMSA-N Met-Cys-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCCNC(N)=N JUXONJROIXKHEV-GUBZILKMSA-N 0.000 description 1
- PTYVBBNIAQWUFV-DCAQKATOSA-N Met-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCSC)N PTYVBBNIAQWUFV-DCAQKATOSA-N 0.000 description 1
- CRGKLOXHKICQOL-GARJFASQSA-N Met-Gln-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N CRGKLOXHKICQOL-GARJFASQSA-N 0.000 description 1
- SODXFJOPSCXOHE-IHRRRGAJSA-N Met-Leu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O SODXFJOPSCXOHE-IHRRRGAJSA-N 0.000 description 1
- AWGBEIYZPAXXSX-RWMBFGLXSA-N Met-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N AWGBEIYZPAXXSX-RWMBFGLXSA-N 0.000 description 1
- XIGAHPDZLAYQOS-SRVKXCTJSA-N Met-Pro-Pro Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 XIGAHPDZLAYQOS-SRVKXCTJSA-N 0.000 description 1
- PHURAEXVWLDIGT-LPEHRKFASA-N Met-Ser-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N PHURAEXVWLDIGT-LPEHRKFASA-N 0.000 description 1
- ZBLSZPYQQRIHQU-RCWTZXSCSA-N Met-Thr-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O ZBLSZPYQQRIHQU-RCWTZXSCSA-N 0.000 description 1
- WOGNGBROIHHFAO-JYJNAYRXSA-N Met-Tyr-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCSC)C(=O)O)N WOGNGBROIHHFAO-JYJNAYRXSA-N 0.000 description 1
- 102000007474 Multiprotein Complexes Human genes 0.000 description 1
- 108010085220 Multiprotein Complexes Proteins 0.000 description 1
- 208000005647 Mumps Diseases 0.000 description 1
- 230000004988 N-glycosylation Effects 0.000 description 1
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 1
- 101100068676 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) gln-1 gene Proteins 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- BBDSZDHUCPSYAC-QEJZJMRPSA-N Phe-Ala-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BBDSZDHUCPSYAC-QEJZJMRPSA-N 0.000 description 1
- ULECEJGNDHWSKD-QEJZJMRPSA-N Phe-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 ULECEJGNDHWSKD-QEJZJMRPSA-N 0.000 description 1
- AWAYOWOUGVZXOB-BZSNNMDCSA-N Phe-Asn-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 AWAYOWOUGVZXOB-BZSNNMDCSA-N 0.000 description 1
- WGXOKDLDIWSOCV-MELADBBJSA-N Phe-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O WGXOKDLDIWSOCV-MELADBBJSA-N 0.000 description 1
- LXVFHIBXOWJTKZ-BZSNNMDCSA-N Phe-Asn-Tyr Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O LXVFHIBXOWJTKZ-BZSNNMDCSA-N 0.000 description 1
- JIYJYFIXQTYDNF-YDHLFZDLSA-N Phe-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N JIYJYFIXQTYDNF-YDHLFZDLSA-N 0.000 description 1
- FRPVPGRXUKFEQE-YDHLFZDLSA-N Phe-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O FRPVPGRXUKFEQE-YDHLFZDLSA-N 0.000 description 1
- XEXSSIBQYNKFBX-KBPBESRZSA-N Phe-Gly-His Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CC=CC=C1 XEXSSIBQYNKFBX-KBPBESRZSA-N 0.000 description 1
- WKTSCAXSYITIJJ-PCBIJLKTSA-N Phe-Ile-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O WKTSCAXSYITIJJ-PCBIJLKTSA-N 0.000 description 1
- DVOCGBNHAUHKHJ-DKIMLUQUSA-N Phe-Ile-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O DVOCGBNHAUHKHJ-DKIMLUQUSA-N 0.000 description 1
- RORUIHAWOLADSH-HJWJTTGWSA-N Phe-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=CC=C1 RORUIHAWOLADSH-HJWJTTGWSA-N 0.000 description 1
- SMFGCTXUBWEPKM-KBPBESRZSA-N Phe-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 SMFGCTXUBWEPKM-KBPBESRZSA-N 0.000 description 1
- PBWNICYZGJQKJV-BZSNNMDCSA-N Phe-Phe-Cys Chemical compound N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CS)C(O)=O PBWNICYZGJQKJV-BZSNNMDCSA-N 0.000 description 1
- AAERWTUHZKLDLC-IHRRRGAJSA-N Phe-Pro-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O AAERWTUHZKLDLC-IHRRRGAJSA-N 0.000 description 1
- CZQZSMJXFGGBHM-KKUMJFAQSA-N Phe-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O CZQZSMJXFGGBHM-KKUMJFAQSA-N 0.000 description 1
- NJJBATPLUQHRBM-IHRRRGAJSA-N Phe-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CO)C(=O)O NJJBATPLUQHRBM-IHRRRGAJSA-N 0.000 description 1
- YMIZSYUAZJSOFL-SRVKXCTJSA-N Phe-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O YMIZSYUAZJSOFL-SRVKXCTJSA-N 0.000 description 1
- MRWOVVNKSXXLRP-IHPCNDPISA-N Phe-Ser-Trp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O MRWOVVNKSXXLRP-IHPCNDPISA-N 0.000 description 1
- KUSYCSMTTHSZOA-DZKIICNBSA-N Phe-Val-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N KUSYCSMTTHSZOA-DZKIICNBSA-N 0.000 description 1
- XALFIVXGQUEGKV-JSGCOSHPSA-N Phe-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 XALFIVXGQUEGKV-JSGCOSHPSA-N 0.000 description 1
- 102000013566 Plasminogen Human genes 0.000 description 1
- 108010051456 Plasminogen Proteins 0.000 description 1
- 101100033946 Plasmodium falciparum (isolate 3D7) RIPR gene Proteins 0.000 description 1
- 206010035664 Pneumonia Diseases 0.000 description 1
- KDIIENQUNVNWHR-JYJNAYRXSA-N Pro-Arg-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KDIIENQUNVNWHR-JYJNAYRXSA-N 0.000 description 1
- NUZHSNLQJDYSRW-BZSNNMDCSA-N Pro-Arg-Trp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O NUZHSNLQJDYSRW-BZSNNMDCSA-N 0.000 description 1
- INXAPZFIOVGHSV-CIUDSAMLSA-N Pro-Asn-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 INXAPZFIOVGHSV-CIUDSAMLSA-N 0.000 description 1
- WPQKSRHDTMRSJM-CIUDSAMLSA-N Pro-Asp-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 WPQKSRHDTMRSJM-CIUDSAMLSA-N 0.000 description 1
- NOXSEHJOXCWRHK-DCAQKATOSA-N Pro-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@@H]1CCCN1 NOXSEHJOXCWRHK-DCAQKATOSA-N 0.000 description 1
- OLTFZQIYCNOBLI-DCAQKATOSA-N Pro-Cys-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O OLTFZQIYCNOBLI-DCAQKATOSA-N 0.000 description 1
- DIFXZGPHVCIVSQ-CIUDSAMLSA-N Pro-Gln-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DIFXZGPHVCIVSQ-CIUDSAMLSA-N 0.000 description 1
- VWXGFAIZUQBBBG-UWVGGRQHSA-N Pro-His-Gly Chemical compound C([C@@H](C(=O)NCC(=O)[O-])NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 VWXGFAIZUQBBBG-UWVGGRQHSA-N 0.000 description 1
- AQGUSRZKDZYGGV-GMOBBJLQSA-N Pro-Ile-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O AQGUSRZKDZYGGV-GMOBBJLQSA-N 0.000 description 1
- FKVNLUZHSFCNGY-RVMXOQNASA-N Pro-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 FKVNLUZHSFCNGY-RVMXOQNASA-N 0.000 description 1
- NFLNBHLMLYALOO-DCAQKATOSA-N Pro-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@@H]1CCCN1 NFLNBHLMLYALOO-DCAQKATOSA-N 0.000 description 1
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 1
- WCNVGGZRTNHOOS-ULQDDVLXSA-N Pro-Lys-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O WCNVGGZRTNHOOS-ULQDDVLXSA-N 0.000 description 1
- RFWXYTJSVDUBBZ-DCAQKATOSA-N Pro-Pro-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RFWXYTJSVDUBBZ-DCAQKATOSA-N 0.000 description 1
- CZCCVJUUWBMISW-FXQIFTODSA-N Pro-Ser-Cys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O CZCCVJUUWBMISW-FXQIFTODSA-N 0.000 description 1
- QUBVFEANYYWBTM-VEVYYDQMSA-N Pro-Thr-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUBVFEANYYWBTM-VEVYYDQMSA-N 0.000 description 1
- GZNYIXWOIUFLGO-ZJDVBMNYSA-N Pro-Thr-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZNYIXWOIUFLGO-ZJDVBMNYSA-N 0.000 description 1
- ZYJMLBCDFPIGNL-JYJNAYRXSA-N Pro-Tyr-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@H](Cc1ccc(O)cc1)NC(=O)[C@@H]1CCCN1)C(O)=O ZYJMLBCDFPIGNL-JYJNAYRXSA-N 0.000 description 1
- STGVYUTZKGPRCI-GUBZILKMSA-N Pro-Val-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 STGVYUTZKGPRCI-GUBZILKMSA-N 0.000 description 1
- 102100038955 Proprotein convertase subtilisin/kexin type 9 Human genes 0.000 description 1
- 102000002067 Protein Subunits Human genes 0.000 description 1
- 108010001267 Protein Subunits Proteins 0.000 description 1
- 102000016611 Proteoglycans Human genes 0.000 description 1
- 108010067787 Proteoglycans Proteins 0.000 description 1
- 101900083372 Rabies virus Glycoprotein Proteins 0.000 description 1
- 108700033496 Recombivax HB Proteins 0.000 description 1
- 229940124942 Recombivax HB Drugs 0.000 description 1
- 206010057190 Respiratory tract infections Diseases 0.000 description 1
- 241000712907 Retroviridae Species 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 1
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 1
- HBOABDXGTMMDSE-GUBZILKMSA-N Ser-Arg-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O HBOABDXGTMMDSE-GUBZILKMSA-N 0.000 description 1
- OOKCGAYXSNJBGQ-ZLUOBGJFSA-N Ser-Asn-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OOKCGAYXSNJBGQ-ZLUOBGJFSA-N 0.000 description 1
- WXWDPFVKQRVJBJ-CIUDSAMLSA-N Ser-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N WXWDPFVKQRVJBJ-CIUDSAMLSA-N 0.000 description 1
- SNNSYBWPPVAXQW-ZLUOBGJFSA-N Ser-Cys-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)O)N)O SNNSYBWPPVAXQW-ZLUOBGJFSA-N 0.000 description 1
- IXUGADGDCQDLSA-FXQIFTODSA-N Ser-Gln-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N IXUGADGDCQDLSA-FXQIFTODSA-N 0.000 description 1
- HVKMTOIAYDOJPL-NRPADANISA-N Ser-Gln-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVKMTOIAYDOJPL-NRPADANISA-N 0.000 description 1
- UICKAKRRRBTILH-GUBZILKMSA-N Ser-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N UICKAKRRRBTILH-GUBZILKMSA-N 0.000 description 1
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 1
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 1
- KDGARKCAKHBEDB-NKWVEPMBSA-N Ser-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CO)N)C(=O)O KDGARKCAKHBEDB-NKWVEPMBSA-N 0.000 description 1
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 1
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 1
- QGAHMVHBORDHDC-YUMQZZPRSA-N Ser-His-Gly Chemical compound OC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CN=CN1 QGAHMVHBORDHDC-YUMQZZPRSA-N 0.000 description 1
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 1
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 1
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 1
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 1
- JWOBLHJRDADHLN-KKUMJFAQSA-N Ser-Leu-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JWOBLHJRDADHLN-KKUMJFAQSA-N 0.000 description 1
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 1
- BYCVMHKULKRVPV-GUBZILKMSA-N Ser-Lys-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O BYCVMHKULKRVPV-GUBZILKMSA-N 0.000 description 1
- CKDXFSPMIDSMGV-GUBZILKMSA-N Ser-Pro-Val Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O CKDXFSPMIDSMGV-GUBZILKMSA-N 0.000 description 1
- GYDFRTRSSXOZCR-ACZMJKKPSA-N Ser-Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GYDFRTRSSXOZCR-ACZMJKKPSA-N 0.000 description 1
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 1
- DKGRNFUXVTYRAS-UBHSHLNASA-N Ser-Ser-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O DKGRNFUXVTYRAS-UBHSHLNASA-N 0.000 description 1
- STIAINRLUUKYKM-WFBYXXMGSA-N Ser-Trp-Ala Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CO)=CNC2=C1 STIAINRLUUKYKM-WFBYXXMGSA-N 0.000 description 1
- IAOHCSQDQDWRQU-GUBZILKMSA-N Ser-Val-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IAOHCSQDQDWRQU-GUBZILKMSA-N 0.000 description 1
- JZRYFUGREMECBH-XPUUQOCRSA-N Ser-Val-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O JZRYFUGREMECBH-XPUUQOCRSA-N 0.000 description 1
- YEDSOSIKVUMIJE-DCAQKATOSA-N Ser-Val-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O YEDSOSIKVUMIJE-DCAQKATOSA-N 0.000 description 1
- 101001039853 Sonchus yellow net virus Matrix protein Proteins 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 241000194017 Streptococcus Species 0.000 description 1
- 241000193996 Streptococcus pyogenes Species 0.000 description 1
- 101710172711 Structural protein Proteins 0.000 description 1
- UCKMPCXJQFINFW-UHFFFAOYSA-N Sulphide Chemical compound [S-2] UCKMPCXJQFINFW-UHFFFAOYSA-N 0.000 description 1
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 1
- VFEHSAJCWWHDBH-RHYQMDGZSA-N Thr-Arg-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VFEHSAJCWWHDBH-RHYQMDGZSA-N 0.000 description 1
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 1
- JNQZPAWOPBZGIX-RCWTZXSCSA-N Thr-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N JNQZPAWOPBZGIX-RCWTZXSCSA-N 0.000 description 1
- ZUUDNCOCILSYAM-KKHAAJSZSA-N Thr-Asp-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZUUDNCOCILSYAM-KKHAAJSZSA-N 0.000 description 1
- YAAPRMFURSENOZ-KATARQTJSA-N Thr-Cys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N)O YAAPRMFURSENOZ-KATARQTJSA-N 0.000 description 1
- UZJDBCHMIQXLOQ-HEIBUPTGSA-N Thr-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O UZJDBCHMIQXLOQ-HEIBUPTGSA-N 0.000 description 1
- RKDFEMGVMMYYNG-WDCWCFNPSA-N Thr-Gln-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O RKDFEMGVMMYYNG-WDCWCFNPSA-N 0.000 description 1
- KGKWKSSSQGGYAU-SUSMZKCASA-N Thr-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KGKWKSSSQGGYAU-SUSMZKCASA-N 0.000 description 1
- KRGDDWVBBDLPSJ-CUJWVEQBSA-N Thr-His-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O KRGDDWVBBDLPSJ-CUJWVEQBSA-N 0.000 description 1
- YJCVECXVYHZOBK-KNZXXDILSA-N Thr-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H]([C@@H](C)O)N YJCVECXVYHZOBK-KNZXXDILSA-N 0.000 description 1
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 1
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 1
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 1
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 1
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 1
- ZXIHABSKUITPTN-IXOXFDKPSA-N Thr-Lys-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O ZXIHABSKUITPTN-IXOXFDKPSA-N 0.000 description 1
- KZURUCDWKDEAFZ-XVSYOHENSA-N Thr-Phe-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O KZURUCDWKDEAFZ-XVSYOHENSA-N 0.000 description 1
- VGYVVSQFSSKZRJ-OEAJRASXSA-N Thr-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@H](O)C)CC1=CC=CC=C1 VGYVVSQFSSKZRJ-OEAJRASXSA-N 0.000 description 1
- ABWNZPOIUJMNKT-IXOXFDKPSA-N Thr-Phe-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O ABWNZPOIUJMNKT-IXOXFDKPSA-N 0.000 description 1
- OLFOOYQTTQSSRK-UNQGMJICSA-N Thr-Pro-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLFOOYQTTQSSRK-UNQGMJICSA-N 0.000 description 1
- YGCDFAJJCRVQKU-RCWTZXSCSA-N Thr-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O YGCDFAJJCRVQKU-RCWTZXSCSA-N 0.000 description 1
- AAZOYLQUEQRUMZ-GSSVUCPTSA-N Thr-Thr-Asn Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O AAZOYLQUEQRUMZ-GSSVUCPTSA-N 0.000 description 1
- MFMGPEKYBXFIRF-SUSMZKCASA-N Thr-Thr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFMGPEKYBXFIRF-SUSMZKCASA-N 0.000 description 1
- VGNLMPBYWWNQFS-ZEILLAHLSA-N Thr-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O VGNLMPBYWWNQFS-ZEILLAHLSA-N 0.000 description 1
- LECUEEHKUFYOOV-ZJDVBMNYSA-N Thr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)[C@@H](C)O LECUEEHKUFYOOV-ZJDVBMNYSA-N 0.000 description 1
- PELIQFPESHBTMA-WLTAIBSBSA-N Thr-Tyr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 PELIQFPESHBTMA-WLTAIBSBSA-N 0.000 description 1
- BKVICMPZWRNWOC-RHYQMDGZSA-N Thr-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O BKVICMPZWRNWOC-RHYQMDGZSA-N 0.000 description 1
- KZTLZZQTJMCGIP-ZJDVBMNYSA-N Thr-Val-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KZTLZZQTJMCGIP-ZJDVBMNYSA-N 0.000 description 1
- BTAJAOWZCWOHBU-HSHDSVGOSA-N Thr-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)C(C)C)C(O)=O)=CNC2=C1 BTAJAOWZCWOHBU-HSHDSVGOSA-N 0.000 description 1
- 108090000190 Thrombin Proteins 0.000 description 1
- 241000723873 Tobacco mosaic virus Species 0.000 description 1
- 241000209140 Triticum Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- PKZVWAGGKFAVKR-UBHSHLNASA-N Trp-Cys-Cys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)O)N PKZVWAGGKFAVKR-UBHSHLNASA-N 0.000 description 1
- AZBIIKDSDLVJAK-VHWLVUOQSA-N Trp-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N AZBIIKDSDLVJAK-VHWLVUOQSA-N 0.000 description 1
- AIISTODACBDQLW-WDSOQIARSA-N Trp-Leu-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 AIISTODACBDQLW-WDSOQIARSA-N 0.000 description 1
- KYWBVMKEYAEDIX-BPUTZDHNSA-N Trp-Met-Cys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CS)C(O)=O)=CNC2=C1 KYWBVMKEYAEDIX-BPUTZDHNSA-N 0.000 description 1
- STJXERBCEWQLKS-IHPCNDPISA-N Trp-Tyr-Cys Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(=O)N[C@@H](CS)C(O)=O)C1=CC=C(O)C=C1 STJXERBCEWQLKS-IHPCNDPISA-N 0.000 description 1
- JYLWCVVMDGNZGD-WIRXVTQYSA-N Trp-Tyr-Trp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JYLWCVVMDGNZGD-WIRXVTQYSA-N 0.000 description 1
- NMOIRIIIUVELLY-WDSOQIARSA-N Trp-Val-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)C(C)C)=CNC2=C1 NMOIRIIIUVELLY-WDSOQIARSA-N 0.000 description 1
- DLZKEQQWXODGGZ-KWQFWETISA-N Tyr-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DLZKEQQWXODGGZ-KWQFWETISA-N 0.000 description 1
- YLHFIMLKNPJRGY-BVSLBCMMSA-N Tyr-Arg-Trp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O YLHFIMLKNPJRGY-BVSLBCMMSA-N 0.000 description 1
- PZXUIGWOEWWFQM-SRVKXCTJSA-N Tyr-Asn-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O PZXUIGWOEWWFQM-SRVKXCTJSA-N 0.000 description 1
- GAYLGYUVTDMLKC-UWJYBYFXSA-N Tyr-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GAYLGYUVTDMLKC-UWJYBYFXSA-N 0.000 description 1
- XKDOQXAXKFQWQJ-SRVKXCTJSA-N Tyr-Cys-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O XKDOQXAXKFQWQJ-SRVKXCTJSA-N 0.000 description 1
- ZRPLVTZTKPPSBT-AVGNSLFASA-N Tyr-Glu-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZRPLVTZTKPPSBT-AVGNSLFASA-N 0.000 description 1
- QJKMCQRFHJRIPU-XDTLVQLUSA-N Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 QJKMCQRFHJRIPU-XDTLVQLUSA-N 0.000 description 1
- ILTXFANLDMJWPR-SIUGBPQLSA-N Tyr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N ILTXFANLDMJWPR-SIUGBPQLSA-N 0.000 description 1
- HVPPEXXUDXAPOM-MGHWNKPDSA-N Tyr-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HVPPEXXUDXAPOM-MGHWNKPDSA-N 0.000 description 1
- QFXVAFIHVWXXBJ-AVGNSLFASA-N Tyr-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O QFXVAFIHVWXXBJ-AVGNSLFASA-N 0.000 description 1
- QPOUERMDWKKZEG-HJPIBITLSA-N Tyr-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 QPOUERMDWKKZEG-HJPIBITLSA-N 0.000 description 1
- SYFHQHYTNCQCCN-MELADBBJSA-N Tyr-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O SYFHQHYTNCQCCN-MELADBBJSA-N 0.000 description 1
- NAHUCETZGZZSEX-IHPCNDPISA-N Tyr-Trp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N NAHUCETZGZZSEX-IHPCNDPISA-N 0.000 description 1
- NUQZCPSZHGIYTA-HKUYNNGSSA-N Tyr-Trp-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N NUQZCPSZHGIYTA-HKUYNNGSSA-N 0.000 description 1
- PQPWEALFTLKSEB-DZKIICNBSA-N Tyr-Val-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PQPWEALFTLKSEB-DZKIICNBSA-N 0.000 description 1
- NVJCMGGZHOJNBU-UFYCRDLUSA-N Tyr-Val-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N NVJCMGGZHOJNBU-UFYCRDLUSA-N 0.000 description 1
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 1
- QPZMOUMNTGTEFR-ZKWXMUAHSA-N Val-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N QPZMOUMNTGTEFR-ZKWXMUAHSA-N 0.000 description 1
- ZMDCGGKHRKNWKD-LAEOZQHASA-N Val-Asn-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZMDCGGKHRKNWKD-LAEOZQHASA-N 0.000 description 1
- GNWUWQAVVJQREM-NHCYSSNCSA-N Val-Asn-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N GNWUWQAVVJQREM-NHCYSSNCSA-N 0.000 description 1
- XLDYBRXERHITNH-QSFUFRPTSA-N Val-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)C(C)C XLDYBRXERHITNH-QSFUFRPTSA-N 0.000 description 1
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 1
- FRUYSSRPJXNRRB-GUBZILKMSA-N Val-Cys-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N FRUYSSRPJXNRRB-GUBZILKMSA-N 0.000 description 1
- LHADRQBREKTRLR-DCAQKATOSA-N Val-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N LHADRQBREKTRLR-DCAQKATOSA-N 0.000 description 1
- DLYOEFGPYTZVSP-AEJSXWLSSA-N Val-Cys-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N DLYOEFGPYTZVSP-AEJSXWLSSA-N 0.000 description 1
- CPTQYHDSVGVGDZ-UKJIMTQDSA-N Val-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N CPTQYHDSVGVGDZ-UKJIMTQDSA-N 0.000 description 1
- OXVPMZVGCAPFIG-BQFCYCMXSA-N Val-Gln-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N OXVPMZVGCAPFIG-BQFCYCMXSA-N 0.000 description 1
- URIRWLJVWHYLET-ONGXEEELSA-N Val-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C URIRWLJVWHYLET-ONGXEEELSA-N 0.000 description 1
- LAYSXAOGWHKNED-XPUUQOCRSA-N Val-Gly-Ser Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LAYSXAOGWHKNED-XPUUQOCRSA-N 0.000 description 1
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 1
- YTNGABPUXFEOGU-SRVKXCTJSA-N Val-Pro-Arg Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O YTNGABPUXFEOGU-SRVKXCTJSA-N 0.000 description 1
- VSCIANXXVZOYOC-AVGNSLFASA-N Val-Pro-His Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N VSCIANXXVZOYOC-AVGNSLFASA-N 0.000 description 1
- QIVPZSWBBHRNBA-JYJNAYRXSA-N Val-Pro-Phe Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O QIVPZSWBBHRNBA-JYJNAYRXSA-N 0.000 description 1
- DOFAQXCYFQKSHT-SRVKXCTJSA-N Val-Pro-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DOFAQXCYFQKSHT-SRVKXCTJSA-N 0.000 description 1
- JQTYTBPCSOAZHI-FXQIFTODSA-N Val-Ser-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N JQTYTBPCSOAZHI-FXQIFTODSA-N 0.000 description 1
- PGQUDQYHWICSAB-NAKRPEOUSA-N Val-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N PGQUDQYHWICSAB-NAKRPEOUSA-N 0.000 description 1
- HWNYVQMOLCYHEA-IHRRRGAJSA-N Val-Ser-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N HWNYVQMOLCYHEA-IHRRRGAJSA-N 0.000 description 1
- PQSNETRGCRUOGP-KKHAAJSZSA-N Val-Thr-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O PQSNETRGCRUOGP-KKHAAJSZSA-N 0.000 description 1
- LZDNBBYBDGBADK-KBPBESRZSA-N Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-KBPBESRZSA-N 0.000 description 1
- ZLMFVXMJFIWIRE-FHWLQOOXSA-N Val-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](C(C)C)N ZLMFVXMJFIWIRE-FHWLQOOXSA-N 0.000 description 1
- BGTDGENDNWGMDQ-KJEVXHAQSA-N Val-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N)O BGTDGENDNWGMDQ-KJEVXHAQSA-N 0.000 description 1
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 1
- 108010059722 Viral Fusion Proteins Proteins 0.000 description 1
- 108010067390 Viral Proteins Proteins 0.000 description 1
- UZQJVUCHXGYFLQ-AYDHOLPZSA-N [(2s,3r,4s,5r,6r)-4-[(2s,3r,4s,5r,6r)-4-[(2r,3r,4s,5r,6r)-4-[(2s,3r,4s,5r,6r)-3,5-dihydroxy-6-(hydroxymethyl)-4-[(2s,3r,4s,5s,6r)-3,4,5-trihydroxy-6-(hydroxymethyl)oxan-2-yl]oxyoxan-2-yl]oxy-3,5-dihydroxy-6-(hydroxymethyl)oxan-2-yl]oxy-3,5-dihydroxy-6-(hy Chemical compound O([C@H]1[C@H](O)[C@@H](CO)O[C@H]([C@@H]1O)O[C@H]1[C@H](O)[C@@H](CO)O[C@H]([C@@H]1O)O[C@H]1CC[C@]2(C)[C@H]3CC=C4[C@@]([C@@]3(CC[C@H]2[C@@]1(C=O)C)C)(C)CC(O)[C@]1(CCC(CC14)(C)C)C(=O)O[C@H]1[C@@H]([C@@H](O[C@H]2[C@@H]([C@@H](O[C@H]3[C@@H]([C@@H](O[C@H]4[C@@H]([C@@H](O[C@H]5[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O5)O)[C@H](O)[C@@H](CO)O4)O)[C@H](O)[C@@H](CO)O3)O)[C@H](O)[C@@H](CO)O2)O)[C@H](O)[C@@H](CO)O1)O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O UZQJVUCHXGYFLQ-AYDHOLPZSA-N 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 238000003450 affinity purification method Methods 0.000 description 1
- 108010070783 alanyltyrosine Proteins 0.000 description 1
- -1 aliphatic amino acids Chemical class 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000006229 amino acid addition Effects 0.000 description 1
- 230000030741 antigen processing and presentation Effects 0.000 description 1
- 210000000612 antigen-presenting cell Anatomy 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 210000004900 c-terminal fragment Anatomy 0.000 description 1
- 210000000234 capsid Anatomy 0.000 description 1
- 125000005392 carboxamide group Chemical group NC(=O)* 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000002512 chemotherapy Methods 0.000 description 1
- 239000007979 citrate buffer Substances 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 230000000536 complexating effect Effects 0.000 description 1
- 230000001268 conjugating effect Effects 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 108010004073 cysteinylcysteine Proteins 0.000 description 1
- 108010016616 cysteinylglycine Proteins 0.000 description 1
- 108010069495 cysteinyltyrosine Proteins 0.000 description 1
- 238000005034 decoration Methods 0.000 description 1
- 239000003398 denaturant Substances 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 108010054812 diprotin A Proteins 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003937 drug carrier Substances 0.000 description 1
- 230000002121 endocytic effect Effects 0.000 description 1
- 210000002889 endothelial cell Anatomy 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 210000002950 fibroblast Anatomy 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 244000053095 fungal pathogen Species 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- NFJRQODDTXZEBV-MXIFXDQUSA-M gleptoferron Chemical compound [Fe].[O-]O.OC[C@H]1O[C@H](OCC(O)C(O)C(O)C(O)C(O)C(O)=O)[C@H](O)[C@@H](O)[C@@H]1O NFJRQODDTXZEBV-MXIFXDQUSA-M 0.000 description 1
- 229930195712 glutamate Natural products 0.000 description 1
- 108010073628 glutamyl-valyl-phenylalanine Proteins 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010072405 glycyl-aspartyl-glycine Proteins 0.000 description 1
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010020688 glycylhistidine Proteins 0.000 description 1
- 108010077515 glycylproline Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 208000019622 heart disease Diseases 0.000 description 1
- 239000000833 heterodimer Substances 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 108010085325 histidylproline Proteins 0.000 description 1
- 102000051957 human ERBB2 Human genes 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 208000026278 immune system disease Diseases 0.000 description 1
- 230000009851 immunogenic response Effects 0.000 description 1
- 230000008902 immunological benefit Effects 0.000 description 1
- 230000002480 immunoprotective effect Effects 0.000 description 1
- 229960001438 immunostimulant agent Drugs 0.000 description 1
- 239000003022 immunostimulating agent Substances 0.000 description 1
- 230000003308 immunostimulating effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 229960003971 influenza vaccine Drugs 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 1
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 1
- 229960003646 lysine Drugs 0.000 description 1
- 201000004792 malaria Diseases 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000010534 mechanism of action Effects 0.000 description 1
- 208000010805 mumps infectious disease Diseases 0.000 description 1
- 125000001446 muramyl group Chemical group N[C@@H](C=O)[C@@H](O[C@@H](C(=O)*)C)[C@H](O)[C@H](O)CO 0.000 description 1
- JXTPJDDICSTXJX-UHFFFAOYSA-N n-Triacontane Natural products CCCCCCCCCCCCCCCCCCCCCCCCCCCCCC JXTPJDDICSTXJX-UHFFFAOYSA-N 0.000 description 1
- 210000004898 n-terminal fragment Anatomy 0.000 description 1
- 239000007908 nanoemulsion Substances 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 238000006386 neutralization reaction Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 229960002566 papillomavirus vaccine Drugs 0.000 description 1
- 244000045947 parasite Species 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 108010084572 phenylalanyl-valine Proteins 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 108010014614 prolyl-glycyl-proline Proteins 0.000 description 1
- 108010029020 prolylglycine Proteins 0.000 description 1
- 238000011321 prophylaxis Methods 0.000 description 1
- 235000019419 proteases Nutrition 0.000 description 1
- 230000004224 protection Effects 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 230000004850 protein–protein interaction Effects 0.000 description 1
- 230000005180 public health Effects 0.000 description 1
- 230000009257 reactivity Effects 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 208000023504 respiratory system disease Diseases 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 229930182490 saponin Natural products 0.000 description 1
- 150000007949 saponins Chemical class 0.000 description 1
- 235000017709 saponins Nutrition 0.000 description 1
- 238000001338 self-assembly Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000037432 silent mutation Effects 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 229940032094 squalane Drugs 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
- 229940031626 subunit vaccine Drugs 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 229960004072 thrombin Drugs 0.000 description 1
- 108010080629 tryptophan-leucine Proteins 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
- 108010087967 type I signal peptidase Proteins 0.000 description 1
- 108010020532 tyrosyl-proline Proteins 0.000 description 1
- 108010003137 tyrosyltyrosine Proteins 0.000 description 1
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 1
- 108010009962 valyltyrosine Proteins 0.000 description 1
- 230000033041 viral attachment to host cell Effects 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
- A61K39/245—Herpetoviridae, e.g. herpes simplex virus
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/385—Haptens or antigens, bound to carriers
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/14—Antivirals for RNA viruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/20—Antivirals for DNA viruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/20—Antivirals for DNA viruses
- A61P31/22—Antivirals for DNA viruses for herpes viruses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/51—Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
- A61K2039/525—Virus
- A61K2039/5258—Virus-like particles
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/545—Medicinal preparations containing antigens or antibodies characterised by the dose, timing or administration schedule
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/555—Medicinal preparations containing antigens or antibodies characterised by a specific combination antigen/adjuvant
- A61K2039/55511—Organic adjuvants
- A61K2039/55516—Proteins; Peptides
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/60—Medicinal preparations containing antigens or antibodies characteristics by the carrier linked to the antigen
- A61K2039/6031—Proteins
- A61K2039/6068—Other bacterial proteins, e.g. OMP
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/60—Medicinal preparations containing antigens or antibodies characteristics by the carrier linked to the antigen
- A61K2039/6031—Proteins
- A61K2039/6075—Viral proteins
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/62—Medicinal preparations containing antigens or antibodies characterised by the link between antigen and carrier
- A61K2039/627—Medicinal preparations containing antigens or antibodies characterised by the link between antigen and carrier characterised by the linker
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/70—Fusion polypeptide containing domain for protein-protein interaction
- C07K2319/735—Fusion polypeptide containing domain for protein-protein interaction containing a domain for self-assembly, e.g. a viral coat protein (includes phage display)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/16011—Herpesviridae
- C12N2710/16111—Cytomegalovirus, e.g. human herpesvirus 5
- C12N2710/16123—Virus like particles [VLP]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/16011—Herpesviridae
- C12N2710/16111—Cytomegalovirus, e.g. human herpesvirus 5
- C12N2710/16134—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2760/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
- C12N2760/00011—Details
- C12N2760/18011—Paramyxoviridae
- C12N2760/18511—Pneumovirus, e.g. human respiratory syncytial virus
- C12N2760/18523—Virus like particles [VLP]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2760/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
- C12N2760/00011—Details
- C12N2760/18011—Paramyxoviridae
- C12N2760/18511—Pneumovirus, e.g. human respiratory syncytial virus
- C12N2760/18534—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Virology (AREA)
- Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Public Health (AREA)
- Pharmacology & Pharmacy (AREA)
- Veterinary Medicine (AREA)
- Animal Behavior & Ethology (AREA)
- Organic Chemistry (AREA)
- Molecular Biology (AREA)
- Oncology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Communicable Diseases (AREA)
- Epidemiology (AREA)
- Immunology (AREA)
- Mycology (AREA)
- Microbiology (AREA)
- Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Genetics & Genomics (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- Gastroenterology & Hepatology (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
- Peptides Or Proteins (AREA)
- Medicinal Preparation (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
본 발명은 백신 조성물, 특히 항원성 성분이 크거나, 예를 들어 50 kDa 초과, 또는 다량체인, 즉 서브유닛들을 포함하는 백신 조성물에 관한 것이다. 이러한 항원성 성분은 현재 백신 접종이 불가능한 병원체로부터 항원성 성분을 나타낼 수 있기 때문에 특히 중요하다. 본 발명은 항원성 성분을 나타내는 입자를 포함하는 조성물에 관한 것으로서, 상기 조성물은 제1 펩티드 태그를 포함하는 항원성 성분 및 제2 펩티드 태그를 포함하는 모이어티를 포함하고, 상기 항원성 성분 및 모이어티는 상기 제1 및 제2 펩티드 태그들 간 이소펩티드 결합을 통해 연결되며, 상기 항원성 성분은 50 kDa를 초과하거나, 또는 대안으로서 다량체이다.
Description
백신은 감염성 질환을 퇴치하고 근절하는 안전하고 효과적인 방법이다. 백신 개발은 매우 성공적이었지만, 위협적인 면역 장애를 나타내는 많은 중요한 병원체를 포함한, 현재 백신이 존재하지 않는 남은 질환에 대한 도전과제 목록이 있다. 일반적으로 효과적인 백신은 림프절로 이동하고, 면역 반응을 생성하기에 충분한 시간 동안 지속되어야한다고 여겨진다.
백신 개발은 약독화된 균주를 사용함으로써 내재된 위험을 피하면서 필요한 보호 면역 반응을 생성하는 것을 목표로, 약독화 또는 사멸된 병원체를 사용하는 것으로부터 이러한 병원체의 더 작은 항원성 성분 (antigenic component)을 사용하는 것까지 진행되었다. 크거나 또는 다성분 항원의 발현에 대한 기술적인 문제 때문에 간단하게 짧거나/작은 펩티드 및 단백질로 제한되었던 병원체 성분 (예: 병원체가 세포를 감염시키는데 필요한 성분)의 면역원성 부분을 발현시키려는 시도에 중점을 두었다. 그러나 매우 짧거나 또는 작은 펩티드 사용에 대한 잠재적인 문제는, 백신 접종 (vaccination)에 의해 유도된 면역 반응을 항원의 특정 부분의 변화를 통해 회피하는, 항원성 가변 병원체의 위험 (risk)이 존재한다.
하나의 병원체의 다수의 중화 에피토프에 대한 항체를 생성하는 능력을 포함한, 큰/다성분 항원의 발현과 관련된 면역학적 이점이 있을 것이다. 그러나 관련 항원성 에피토프가 효과적인 항체 반응의 생성을 위해 유지 및 제시되는 방식으로, 복합체를 형성할 수 있는 하나 이상의 큰 항원의 발현은 여전히 큰 도전과제로 남아 있다. 그러므로 임상적으로 유의한 면역 반응을 일으킬 수 있는 방식으로 큰 항원 및/또는 다성분 항원을 발현시키기 위한 개선된 방법이 여전히 필요하다.
다수의 항원성 성분들에 대해 면역 반응을 유발하도록 디자인된 이전의 재조합 백신은 각 성분이 발현되고 별개의 입자로 개별적으로 포장되는 것에 의존하며, 예를 들어 항-HPV 백신인 서바릭스 (Cervarix) 및 가다실 (Gardasil)의 경우, 특정 HPV 균주의 재조합 주요 캡시드 L1 단백질은 개별로 발현되고 바이러스-유사 입자 (virus-like particles: VLP)로 조립되며, 그 후 다양한 타입의 VLP가 백신 제제로 조합된다. 대안으로서, 다수의 짧은 에피토프들이 선택되어 단일 재조합 백신 (예: 다량체-001 인플루엔자 백신 (Multimeric-001 influenza vaccine))으로 조합되지만, 그 특성상 이러한 에피토프는 3차원 구조 또는 재접힘과 관련된 제조 복잡성을 피하기 위해 선택된 짧은 선형 펩티드이므로, 활성 감염에서 면역계에 제시되는 바와 같이 천연 병원체를 나타내도록 시도하지 못했다.
일례로서, β-헤르페스 인간 사이토메갈로바이러스 (human Cytomegalovirus: HCMV, 인간 헤르페스바이러스-5 (human herpesvirus-5: HHV-5) 라고도 함)는 신생아 발달 장애의 주요 바이러스 원인이다. 이러한 편재하는 바이러스는 일반 인구의 60% 이상을 감염시켰고, 초기 감염은 보통 경미하거나 또는 무증상이다. 감염 후에, 상기 바이러스는 체내에 잠복해 있지만, 면역손상 환자 (즉, HIV 환자, 이식 환자 및 화학요법을 받는 환자) 또는 노인에게 심각한 질병을 유발할 수 있다. HCMV는 선진국에서 선천적 장애 (birth defects)의 주요 감염 원인이다. 200명의 영아 중 최대 4명이 선천적 감염으로 인해 HCMV를 가지고 태어나며, 이들 중 최대 10%는 장기적인 결과를 겪는다. HCMV 감염은 또한 성인의 고혈압 및 죽상동맥경화증 (atherosclerosis)과 관련이 있다 (Cheng et al. (May 2009). Fruh K, ed. "Cytomegalovirus infection causes an increase of arterial blood pressure". PLoS Pathog. 5 (5): e1000427). 그러므로 HCMV는 공중 보건 우선순위이다. 그러나 집중적인 노력에도 불구하고, 성공적인 HCMV 백신은 현재까지 개발되지 않았다.
호흡기 세포융합 바이러스 (Respiratory syncytial virus: RSV)는 이 바이러스에 감염된 건강한 성인 및 소아 (older children)의 건강에 거의 영향을 미치지 않는 다른 편재하는 바이러스이다. 그러나 세계적으로 1세 미만의 영아 사망 원인으로 말라리아에 이어 두 번째로 큰 사망 원인이다. 이 바이러스는 세계적으로 매년 약 16만 명이 사망한다. 이 바이러스는 심각한 호흡기 감염을 일으키며, 합병증으로는 폐렴과 세기관지염이 있다. 고위험 그룹에는 1세 미만의 영아와 면역손상 환자, 노인, 및 심장 및 폐 질환이 있는 사람을 포함한다. 다시 말하면, 수년간의 활발한 연구 및 개발에도 불구하고, 현재 허가된 RSV 백신은 없다.
현재 이용 가능한 백신이 없는 RSV 및 HCMV로 인한 질병과 같은 질병의 경우에, 일반적으로 백신 제조에 대한 현재 접근법은 원하는 효능을 나타내지 않아서, 이러한 파국적인 결과를 초래하는 질병을 다루기 위해 대체 타입의 백신을 제공하는데 있어서 많은 미충족된 요구가 있다.
최근에 자발적 또는 보조적 아미드 결합 형성을 가능하게 하는 몇 가지 유전자-코딩 시스템 (genetically-encoded systems)이 서술되어 있다. 예를 들어, SpyTag는 이의 단백질 파트너인 SpyCatcher에 대한 자발적 및 비가역적 이소펩티드 결합 (isopeptide bond)을 상기 2개의 성분들이 혼합될 때 형성하도록 조작된 펩티드이다. 단백질 사슬 내에 SpyTag 및 SpyCatcher 성분들의 위치는 다양한 위치에 있도록 디자인될 수 있고, 광범위한 pH, 버퍼 및 온도 조건하에 반응성이 있다. 상기 SpyTag/SpyCatcher 쌍 및 이의 변이체 및 유도체가 백신 개발에 사용되었지만, 현재까지 간단한 항원의 제시에만 사용되었다. 자발적 아미드 결합 형성을 가능하게 하는 다른 유전자 코딩 시스템으로는 SnoopTag/SnoopTagJr 및 SnoopCatcher; RrgATag/RrgATag2/DogTag 및 RrgACatcher, IsopepTag/IsopepTag-N 및 Pilin-C 또는 Pilin-N, PsCsTag 및 PsCsCatcher; 및 SnoopTagJr 및 DogTag (SnoopLigase에 의해 매개됨), 및 이들 시스템들 모두의 변이체를 포함한다.
본 발명자들은 아미드 결합 형성을 가능하게 하는 유전자-코딩 시스템을 사용하여, 백신 조성물에서 큰/다성분 항원의 사용이 가능하다는 것을 입증하였고, 이는 큰/다성분 항원에 대한 반응을 개선할 수 있다. 이것은 놀라운 결과이다.
본 발명의 제1 양상에서, 단백질 성분을 나타내는 입자를 포함하는 조성물이 제공되며, 상기 조성물은 하기를 포함하고:
i) 제1 펩티드 태그를 포함하는 단백질 성분, 및
ii) 제2 펩티드 태그를 포함하는 모이어티 (moiety),
상기 단백질 성분 및 모이어티는 상기 제1 및 제2 펩티드 태그 간 이소펩티드 결합을 통해 연결되고, 상기 단백질 성분은 50 kDa 초과이다.
본 발명의 다른 양상에서, 단백질 성분을 나타내는 입자를 포함하는 조성물이 제공되며, 상기 조성물은 하기를 포함하고:
i) 제1 펩티드 태그를 포함하는 단백질 성분, 및
ii) 제2 펩티드 태그를 포함하는 모이어티,
상기 단백질 성분 및 모이어티는 상기 제1 및 제2 펩티드 태그 간 이소펩티드 결합을 통해 연결되고, 상기 단백질 성분은 다량체 (multimeric)이다.
상기 단백질 성분은 임의의 기능을 가질 수 있고, 예컨대 이는 효소일 수 있거나 또는 효소적 특성을 가질 수 있다. 상기 단백질 성분은 전장 단백질일 수 있거나, 또는 이는 전장 단백질의 일부, 세그먼트, 도메인 또는 절단물일 수 있다. 상기 단백질 성분은 항원 또는 면역원일 수 있다. 상기 단백질 성분은 항원성 성분이라고도 할 수 있다.
본 발명의 다른 양상에서, 항원성 성분을 나타내는 입자를 포함하는 조성물이 제공되며, 상기 조성물은 하기를 포함하고:
iii) 제1 펩티드 태그를 포함하는 항원성 성분, 및
iv) 제2 펩티드 태그를 포함하는 모이어티,
상기 항원성 성분 및 모이어티는 상기 제1 및 제2 펩티드 태그 간 이소펩티드 결합을 통해 연결되고, 상기 항원성 성분은 대략 50 kDa 초과이다.
본 발명의 임의의 양상의 일부 구체예에서, 상기 단백질 성분 또는 항원성 성분은 60 kDa, 70 kDa, 80 kDa, 90 kDa, 100 kDa, 110 kDa, 120 kDa, 130 kDa, 140 kDa, 150 kDa, 160 kDa, 170 kDa, 180 kDa, 190 kDa 또는 초과, 예컨대 200 kDa 초과, 300 kDa 초과 또는 400 kDa 초과일 수 있다.
다량체는 임의의 수의 서브유닛을 포함할 수 있고, 이는 단백질 또는 항원성 성분에서 공유적으로 연결되거나 또는 연결되지 않을 수 있다. 상기 다량체는 2-20개의 서브유닛, 대안으로서 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15개 이상의 서브유닛을 포함할 수 있다. 대안으로서, 상기 다량체는 2량체, 3량체, 4량체, 5량체, 6량체, 7량체, 8량체, 9량체 또는 10량체일 수 있다. 상기 다량체는 임의의 적절한 병원체로부터 유래될 수 있지만, 바람직하게는 바이러스 다량체이다.
50 kDa 초과 또는 상기에 기재된 큰 단백질 성분의 비-제한적인 예는 인간 사이토메갈로바이러스 (HCMV) 유래의 5량체 복합체 (PC) 및 gB 당단백질, RSV 유래의 G 및 F 당단백질, 인플루엔자 A 바이러스 유래의 헤마글루티닌 (HA) 및 뉴라미니다제 (NA), 플라스모디움 팔시파룸 (Plasmodium falciparum) Pfs230, P. 팔시파룸 CSP, 인간 HER2 수용체, PCSK9, VAR2CSA, P. 팔시파룸 RIPR, 바리셀라 조스터 바이러스 (Varicella zoster virus: VZV) 당단백질 E, 광견병 바이러스 (Rabies virus) 당단백질 및 EBV (Epstein-Barr virus) gH/gL 복합체를 포함한다.
본 발명의 임의의 양상의 일부 구체예에서, 상기 단백질 성분 또는 항원성 성분은 단량체 또는 다량체, 예를 들어 2량체, 3량체, 4량체 또는 5량체일 수 있다. 본 발명의 임의의 양상의 일부 구체예에서, 상기 단백질 성분 또는 항원성 성분은 단백질 또는 펩티드 복합체일 수 있다.
다량체 항원성 성분의 비-제한적인 예는 인간 사이토메갈로바이러스 (HCMV) 유래의 5량체 복합체 (PC) 및 gB 3량체, RSV 유래의 G 및 F 당단백질, 인플루엔자 A 바이러스의 헤마글루티닌 (HA) 및 뉴라미니다제 (NA) 항원을 포함하고, 이의 일부가 본원에 기재되어 있다. 다른 예는 바이러스, 박테리아, 진균 병원체, 기생충 또는 다른 질병 벡터와 같은 질병 인자들의 성분을 포함한다. 적합한 다량체 항원성 성분은 예를 들어 인플루엔자 (예컨대 인플루엔자 헤마글루티닌 (HA) (예: Flu 3량체)), 호흡기 세포융합 바이러스 (RSV) 등과 같은 바이러스로부터 유래된 것을 포함한다.
상기 단백질 성분은 제1 펩티드 태그에 유전자 융합을 통해 부착될 수 있고, 적절한 세포에서 재조합으로 발현될 수 있다. 글리코실화와 같은 번역-후 변형을 포함하는 성분의 경우, 진핵 또는 포유류 세포주에서 재조합 단백질을 발현하는 것이 바람직할 수 있다.
일 구체예에서, 상기 "모이어티 (moiety)"는 단백질 성분 또는 항원성 성분이 예를 들어 면역계에 이용 가능하게 표시될 수 있는 성분이다. 일 구체예에서, 상기 모이어티는 다량체화되어 상기 입자를 형성한다. 적절하게는, 이러한 모이어티는 바이러스, 박테리아, 백신 접종을 위한 다량체화 스캐폴드 (multimerisation scaffold) 또는 다량체화되어 VLP (바이러스-유사 입자)를 형성하는 단백질 성분일 수 있다. 적절하게는, 상기 모이어티는 박테리오파지, 담배 모자이크 바이러스 입자, 아데노-관련 바이러스 유사 입자 (AAVLP), 대장균 등의 성분일 수 있다. 일 구체예에서, 상기 모이어티는 그 자체가 바이러스, 박테리아 등의 성분이어서, 상기 모이어티의 다량체화 (예: 자가-조립)가 단백질 성분 또는 항원성 성분을 나타내기 위한 입자를 형성하다. 일 구체예에서, 상기 모이어티는 바이러스 구조 단백질, 예를 들어 바이러스 외피 또는 캡시드 단백질 또는 표면 항원일 수 있다. 구조 단백질의 예는 인플루엔자 바이러스 유래의 기질 M1 단백질 및 바이러스 외피 M2 단백질, B형 간염 바이러스 유래의 HBsAg, 대장균 박테리오파지 AP205 바이러스 코트 단백질 (CP3), 볼거리 (Mumps)를 포함한 다양한 바이러스 유래의 헤마글루티닌-뉴라미니다제 및 유사물을 포함한다. 적절한 바이러스 구조 단백질은 당업자에게 알려져 있을 것이다. 다른 구체예에서, 상기 모이어티는 MI3과 같은 계산적으로 유도된 입자, 또는 나노입자를 형성하는 IMX313과 같은 다량체화 도메인과 같은 단백질 또는 펩티드일 수 있다. 추가 구체예에서, 상기 모이어티는 합성 나노입자 또는 합성 VLP, 예컨대 금, 리포펩티드 또는 폴리(락틱-코-글리콜산) (PLGA) 나노입자일 수 있다. 다른 적절한 모이어티는 리포좀 또는 외막 소포를 포함할 수 있다. 적절하게는, 제2 펩티드 태그를 포함하는 모이어티는 제2 펩티드 태그가 부착된 모이어티이다.
바이러스 유래의 구조적 표면 항원을 사용하는 것이 바람직할 수 있다. 그러므로 제2 펩티드 태그는 상기 구조적 표면 항원에 부착되어, 제2 펩티드 태그가 부착되거나 또는 제2 펩티드 태그를 나타내는 바이러스-유사 입자 (VLP)의 형성을 허용한다. VLP는 비-감염성 자가-조립 나노입자이고, 이들의 반복적인 분자-정의된 구조는 특히 백신 접종을 위해 다가성 (multivalency)을 조작하는데 매력적이다. VLP는 B형 간염 바이러스 (B형 간염 작은 표면 항원 (HBsAg) 포함), 파보비리데 (Parvoviridae) (예: 아데노-관련 바이러스), 레트로비리데 (Retroviridae) (예: HIV), 플라비비리데 (Flaviviridae) (예: C형 간염 바이러스) 및 박테리오파지 (예: Qβ, AP205)를 포함한 다양한 바이러스 패밀리의 성분으로부터 생성되었다. 이들 중 하나가 본 발명에서 모이어티로서 사용하기에 적합할 수 있다.
상기 제2 펩티드 태그는 상기 모이어티에 유전자 융합을 통해 부착될 수 있다. 이러한 유전자 융합은 단순히 말단에만 국한되지 않고, 서열의 임의의 적절한 지점에 있을 수 있다. 당업자는 융합 단백질이 적절한 세포에서 재조합으로 발현될 수 있음을 이해할 것이다.
상기 제2 펩티드 태그는 대안으로서 상기 모이어티에 화학적 접합에 의해 표시 또는 부착될 수 있다. 이는 예를 들어 접합이 일어나도록 하기 위해 반응성 아민기의 존재를 필요로 할 것이다.
따라서, 일 구체예에서, 상기 모이어티는 B형 간염 바이러스 (HBsAg)의 표면 항원이다. 적절하게는, HBsAg는 본원에 기재된 바와 같이 서열 번호: 41에 제시된 아미노산 서열 (또는 이의 기능적 동등물)을 갖는다.
본 발명의 임의의 양상의 일 구체예에서, 상기 단백질 성분 또는 항원성 성분은 HCMV 5량체의 면역원성 성분이다. 적절하게는, 항원성 또는 면역원성 성분은 환자와 같은 대상에 도입시에 이러한 성분에 대한 항체 반응과 같은 면역 반응을 생성할 수 있는 성분이다. 따라서, 예를 들어 "HCMV 5량체의 면역원성 성분"은 대상에서 항-HCMV 항체 반응을 생성할 수 있는 성분이다. 적절하게는, 면역원성 성분은 gH, gL, pUL128, pUL130 및 pUL131 (pUL131A로도 알려짐)로부터 선택된 HCMV 5량체 서브유닛 성분들 중 하나 이상 (적어도 하나)을 포함한다. 일부 구체예에서, 상기 면역원성 성분은 이러한 "pUL" 또는 "UL" 성분들 중 하나 이상을 포함한다. 다른 구체예에서, 상기 면역원성 성분은 이러한 gH 또는 gL 성분들 중 하나 이상을 포함한다. 일 구체예에서, 상기 면역원성 성분은 하나 이상의 "UL" 성분과 gH 또는 gL 성분들로부터 선택된 하나 이상의 성분들의 조합을 포함한다. 본 발명의 다른 구체예에서, HCMV 5량체의 면역원성 성분은 gH/gL/pUL128/pUL130/pUL131 서브유닛들 모두를 포함하는 HCMV 5량체이다. 적절하게는, 상기 gH/gL/pUL128/pUL130/pUL131 서브유닛들은 Towne (GI: 239909366), AD169 (GI: 219879600), Toledo (GI: 290564358) 및 Merlin (GI: 155573956)을 포함하는, 임의의 알려진 HCMV 균주 (실험실 균주 및/또는 임상적 단리물 모두를 포함)로부터 유래된 것들에 해당하는 아미노산 서열, 또는 이의 기능적 동등물을 갖는다. 기능적 동등물 (functional equivalents)은 일부 상동성을 공유하고 일부 아미노산에서 차이가 있지만 보호 항체를 제공하는 항원성 서브유닛 또는 5량체를 형성할 수 있는 기능적 특성을 보유하는 아미노산 서열을 의미하다. 성분들 gH/gL/pUL128/pUL130/pUL131A의 적절한 변이체가 예를 들어 WO2014/005959 (페이지 4 내지 10 참조)에 기재되어 있고, 이는 본원에 참조로 통합된다. 유리하게는, 백신 접근법에서 HCMV 5량체 서브유닛을 사용하면, 5량체 아미노산 서열 수준에서 균주들 간 높은 수준의 상동성으로 인해, 광범위한 HCMV 바이러스 균주로부터의 감염에 대한 면역원성 보호를 제공할 수 있다.
일부 구체예에서, 항원성 성분은 질병 인자 또는 벡터의 성분 또는 이의 일부에 해당할 수 있다. 예를 들어, 항원성 성분은 용이한 제조를 위해 막관통 도메인 (transmembrane domain)이 결여될 수 있다. 적절하게는, 상기 HCMV 5량체에서, 예를 들어 HCMV 5량체의 면역원성 성분은 절단된 막관통 도메인 (이 영역으로부터 하나 이상의 아미노산의 결실에 의해 절단됨)을 가진 gH 서브유닛을 포함하여, 상기 서브유닛은 용이한 정제를 위해 숙주 세포에서 단백질 생성 중에 세포 상등액으로 분비된다.
일 구체예에서, 상기 gH/gL/pUL128/pUL130/pUL131A 서브유닛은 각각 서열 번호: 28, 31, 35, 33, 36에 제시된 아미노산 서열 (또는 이의 기능적 동등물)을 갖는다 (지시된 신호 펩티드를 갖거나 또는 갖지 않음). 기능적 동등물은 일부 상동성을 공유하고 일부 아미노산에서 차이가 있지만 보호 항체를 제공하는 항원성 서브유닛 또는 5량체를 형성할 수 있는 기능적 특성을 보유하는 아미노산 서열을 의미하다. 일부 구체예에서, 기능적 동등물은 관련 아미노산 서열과 상동성을 70%, 80%, 90% 또는 초과로 공유할 수 있다. 다른 구체예에서, 상기 gH/gL/pUL128/pUL130/pUL131A 서브유닛은 서열 번호: 13, 16, 20, 18, 21에 제시된 것과 같은 핵산 서열, 또는 이의 코돈 최적화된 버전에 의해 코딩된다 (신호 펩티드에 대한 코딩 서열을 갖거나 또는 갖지 않음). 일부 구체예에서, 상기 gH/gL/pUL128/pUL130/pUL131A 서브유닛들 중 어느 하나는 신호 펩티드, 예를 들어 해당 균주에 대한 천연 단백질에 존재하는 신호 펩티드, 상기 신호 펩티드의 기능적 동등물, 또는 HCMV의 다른 균주 유래의 신호 펩티드를 가질 수 있다. 일부 구체예에서, 상기 gH/gL/pUL128/pUL130/pUL131A 서브유닛들 중 어느 하나는 이종 단백질로부터 유래된 신호 펩티드를 가질 수 있다. 신호 펩티드의 선택은 발현된 단백질을 특정 세포 (또는 세포외) 위치로 표적화하거나 또는 다른 기능을 부여하기 위해 결정될 수 있다. 상기 서브유닛(들)의 발현 후에, 상기 신호 펩티드는 사용된 발현 시스템에서 천연 세포기구에 의해 또는 인 비트로로 효소로 절단될 수 있다 (예: 신호 펩티다제에 의해). 일부 구체예에서, 상기 gH/gL/pUL128/pUL130/pUL131A 서브유닛들 중 어느 하나는 신호 펩티드 없이 발현될 수 있다. 일부 구체예에서, 인트론을 포함하는 천연 서열은 더 높은 발현 수준을 초래할 수 있는 경우에 사용될 수 있다. 적절하게는, UL128에 대한 천연 핵산 서열은 2개의 인트론을 포함한다. 다른 구체예에서, UL131A에 대한 핵산 서열은 1개의 인트론을 포함한다. 일부 구체예에서, 상기 인트론은 제거될 수 있다. 일부 구체예에서, 상기 천연 서열은 관련 발현 시스템에 대해 코돈-최적화될 수 있다.
본 발명의 임의의 양상의 일 구체예에서, 상기 단백질 성분 또는 항원성 성분은 부착 당단백질 (G 단백질) 또는 융합 당단백질 (F 단백질)과 같은 RSV 바이러스의 면역원성 성분이고, 이들 모두는 감염 초기 단계를 제어한다. G는 고도로 글리코실화된 90 kDa 타입 II 내재성 막 단백질이고, 프로테오글리칸에서 헤파란 설페이트와의 상호 작용을 통해 숙주 세포막에 바이러스 부착을 매개할 수 있으며, 단백질 성분에 대한 우수한 후보이다.
상기 F 단백질은 F1 및 F2 서브유닛들로 조립되는 동안 처리되는 3개의 F0 단량체로 구성된 내재성 막 단백질이고, 이는 2개의 디설파이드 결합에 의해 공유적으로 연결된다. 상기 F 단백질은 A 및 B 하위그룹 모두로부터의 RSV 단리물들 중에 고도로 보존되고, 상기 아미노산 서열은 90% 이상의 동일성을 보여준다. F는 50 kDa (kilodalton) 카복시-말단 F1 단편 및 20 kDa 아미노-말단 F2 단편으로 구성된 574개의 아미노산 클래스 I 융합 단백질이고; 이를 이종2량체의 3량체로 만든다. 이는 27개의 아미노산 글리코펩티드를 유리시키고 F1 아미노 말단에서 소수성 융합 펩티드를 노출시키는 2개의 퓨린 절단 부위에 의해 구별된다. F2에는 2개의 N-연결된 글리코실화 부위가 있고 F1에는 하나만 있다. F2와 F1 사이에 25개의 아미노산 신호 펩티드 및 27개의 아미노산 글리코펩티드를 제거한 후에, F의 남은 엑토도메인 (ectodomain)은 472개의 아미노산으로 구성된다. 상기 F 엑토도메인에서 25개의 아미노산만이 서브타입들 A 및 B 간에 상이하다.
RSV-F 단백질로부터 항원성 조성물을 개발하기 위해, 일부 연구는 3량체인 융합-전 단백질의 변이체를 제조하는데 중점을 두었다. 변이체는 성숙한 pre-F의 2개의 서브유닛을 단일 사슬로 유전자 융합하여 제조되었다. F2가 F1에 유전자 융합되고, 융합 펩티드 및 pep27 영역이 모두 결실된 DS-Cav1 변이체가 제조되었다. F2 서브유닛 및 F1 서브유닛 간 링커의 차이는 면역원성에 영향을 주는 것으로 보이므로, 변이체는 다양한 링커를 선택할 수 있다. 상기 천연 RSV-F 단백질 서열은 수탁 번호 P03420.1에서 찾을 수 있다.
여러 버전의 융합-전 F 단백질이 연구 및 개발되었으며, 결과적으로 공개되었다. 이들 융합-전 3량체는 모두 본 발명에서 사용하기에 적합할 수 있다. 상기 DS-Cav1-안정화된 융합 당단백질은 천연 단백질로부터 유래된다. 본원에 참조로 통합된 EP2222710은 또한 RSV-F 단백질 폴리펩티드의 F2 도메인 및 F1 도메인 및 3량체화 도메인을 포함하는 가용성 F 단백질 폴리펩티드를 포함하는 재조합 RSV 항원을 개시하였다. Nat. Commun. 2015; 6: 8143, Krarup et al에서, 고도로 안정한 융합-전 RSV-F 단백질이 기재되어 있으며, 이는 참조로 통합된다.
본원에 참조로 통합된 WO2014/160463은 융합-전 입체형태로 안정화된 단리된 재조합 RSV-F 단백질뿐만 아니라 재조합 RSV-F 단백질을 코딩하는 핵산 분자를 개시하였다.
본원에 참조로 통합된 WO2017/172890은 치환-변형된 융합-전 RSV-F 단백질 및 이를 코딩하는 핵산을 개시하였다. 추가적 설명은 Nat Struct Mol Biol. 2016 Sep; 23(9): 811-820, Iterative structure-based improvement of a respiratory syncytial virus fusion glycoprotein vaccine, M. Gordon Joyce, Baoshan Zhang, Li Ou, Man Chen, Gwo-Yu Chuang, Aliaksandr Druz, Wing-Pui Kong,Yen-Ting Lai, Emily J. Rundlet, Yaroslav Tsybovsky, Yongping Yang, Ivelin S. Georgiev, Miklos Guttman, Christopher R. Lees, Marie Pancera, Mallika Sastry, Cinque Soto, Guillaume B.E. Stewart-Jones, Paul V. Thomas, Joseph G. Van Galen, Ulrich Baxa, Kelly K. Lee, John R. Mascola, Barney S. Graham, and Peter D. Kwong에서 제공되고, 또한 본원에 참조로 통합된다.
T4 피브리틴 3량체화 도메인 (T4 Fibritin trimerization domain)에 연결된 재조합 F2-F1 엑토도메인 프로토머 (protomers)를 코딩하는 예시되는 핵산 서열은 수탁 번호: LP884611.1, LP884610.1, LP884609.1 및 LP884608.1로 입수 가능하다.
일부 구체예에서, 단백질 또는 항원성 성분은 질병 인자 또는 벡터의 성분 또는 이의 일부에 해당할 수 있다. 예를 들어, 항원성 성분은 용이한 제조를 위해 막관통 도메인이 결여될 수 있다. 적절하게는, 상기 RSV-F 단백질 또는 이의 융합-전 입체형태에서, 예를 들어 F 단백질의 면역원성 성분은 절단된 막관통 도메인 (이 영역으로부터 하나 이상의 아미노산의 결실에 의해 절단됨)을 가진 F2-F1 서브유닛을 포함하여, 상기 서브유닛은 용이한 정제를 위해 숙주 세포에서 단백질 생성 중에 세포 상등액으로 분비된다. 그러므로 상기 RSV-F 단백질은 기능적 TM 도메인이 결여된다. 대안으로서, 제1 펩티드 태그를 가진 유전자 융합은 기능적 막관통 도메인의 존재에도 불구하고 F 단백질이 막에 존재하는 것을 실제로 방지할 수 있다.
일 구체예에서, 상기 융합-전 안정화된 서브유닛은 각각 서열 번호: 50-58에 제시된 아미노산 서열 (또는 이의 기능적 동등물)을 갖는다. 기능적 동등물은 일부 상동성을 공유하고 일부 아미노산에서 차이가 있지만 예를 들어 보호 항체를 제공하는 항원성 서브유닛을 형성할 수 있는 기능적 특성을 보유하는 아미노산 서열을 의미하다. 일부 구체예에서, 기능적 동등물은 관련 아미노산 서열과 상동성을 70%, 80%, 90% 또는 초과로 공유할 수 있다. 일 구체예에서, 상기 융합-전 안정화된 RSV-F 3량체는 이종 3량체화 도메인을 포함하지 않을 수 있다.
상기 단백질 성분은 제1 펩티드 태그를 포함한다. 상기 제1 펩티드 태그는 재조합 융합 단백질을 발현함으로써 단백질 성분에 부착될 수 있다. 당업자는 적절한 세포 시스템에서 재조합 단백질을 발현시키기 위한 펩티드 서열의 유전자 융합 기술을 알고 있을 것이다. 글리코실화와 같은 번역-후 변형을 포함하는 모이어티의 경우, 진핵 또는 포유류 세포주에서 재조합 단백질을 발현하는 것이 바람직하다.
유리하게는 본원에 기재된 SpyTag-SpyCatcher 시스템과 같이, 이소펩티드 결합을 형성하는 제1 펩티드 태그 및 제2 펩티드 태그를 사용하여, 보호/중화/면역원성 효과를 제공할 수 있는 항-항원 (예: 항-HCMV) 항체를 생성할 수 있는 방식으로 면역계에 항원이 제시되도록 정확한 형성 및 배향으로 VLP와 같이, 상기 큰 항원을 나타내는 모이어티에, 크고 및/또는 다량체인 항원, 예컨대 HCMV 5량체, 또는 이의 면역원성 성분의 "데코레이션 (decoration)"을 허용한다. 가용성 항원 (심지어 다량체/5량체와 같은 큰 항원)을 사용하는 종래의 백신 접종 접근법은 보호/중화/면역원성 효과를 발휘하는데 덜 효과적일 수 있다. 유리하게는, VLP 또는 나노입자와 같은 입자에 항원 (예: 다량체 항원)을 나타내면, 가용성 항원과 달리, 면역 반응을 강하게 유발할 수 있는 동일한 항원의 기하학적 반복 배열을 나타낸다. '유리 (free)' 항원에 비해 더 큰 크기의 VLP 또는 다른 적절한 입자는 또한 더 큰 면역원성 효과를 가질 수 있다. 또한, 다량체 항원, 예컨대 HCMV 5량체의 표시 배향은 면역원성에 중요할 수 있다. 입자에 다량체 항원을 부착하기 위해, 본원에 기재된 SpyTag-SpyCatcher 시스템과 같은 쌍을 이룬 태그들의 사용은 항원이 입자에 특정 유리한 배향으로 부착되도록 한다. 예를 들어 HCMV의 경우, 상기 gH/gL 서브유닛은 "UL" 서브유닛보다 중화 에피토프를 가질 가능성이 떨어질 수 있다. 따라서, 유리하게는, 본 발명은 예를 들어 "UL" 서브유닛이 입자의 외부를 향해 표시되고, 그러므로 개인의 면역계에서 더 쉽게 이용할 수 있도록, 제1 펩티드 태그의 적절한 위치결정에 의해 입자상에 HCMV 5량체의 표시 배향이 결정되도록 한다. 대안으로서/추가로, 상기 항원에 제1 펩티드 태그의 위치는 천연 바이러스의 항원과 유사한 배향을 생성하도록 결정될 수 있으며, 이에 따라 침입한 살아있는 바이러스에 대한 면역반응을 유도할 가능성이 높은 배향으로 항원을 나타내는 입자를 면역계에 제시한다.
대조적으로, VLP에 단백질을 제시하기 위한 종래의 접근법은 화학적 연결을 포함할 수 있고, 이는 이러한 화학 반응이 더 무작위적이어서, 항원의 정확한 (예: 면역학적으로 선호되는) 배향을 확실하게 수득할 수 없고, 연결 반응의 작은 비율만이 수득될 수 있다는 단점이 있다. 더욱이, 화학적 접합에 관여된 과정은 적절한 항원 제시에 필요한 3-D 구조가 유지될 가능성이 떨어질 수 있다. 종래의 접근법의 몇 가지 단점은 예를 들어 Brune et al. 2016; Scientific Reports, 6:19234, DOI: 10.1038/srep19234, Brune et al. Bioconjugate Chemistry, 2017, 28, 1544-1551, and Leneghan et al (2017) Scientific reports, 7:3811에 기재되어 있다.
유사하게, 항원의 바이러스 코트 단백질로의 유전자 융합은 미스폴딩 (misfolding) 문제와 2개의 성분들 모두에 최적인 발현 조건을 결정하는데 도전적이고 시간-소모적인 것으로 입증되었다. 더욱이 유전자 융합은 정확한 입체형태의 효과적인 발현을 달성하기 너무 어렵기 때문에 큰 항원 또는 다성분 항원의 발현에 적합하지 않을 것이다.
상기 단백질 또는 항원성 성분을 면역원성 방식으로 제시하기 위해, 상기 제1 펩티드 태그의 위치는 천연 단백질 입체형태가 유지되고, 선택적으로 임의의 번역-후 변형이 적절하게 유지되도록 신중하게 디자인되어야 한다. 일부 항원의 경우, 글리코실화 유지는 에피토프가 제시되는 방식에 영향을 주지 않지만, 다른 항원의 경우 이들을 유지하거나 제거하면 효능이 향상된다. 막관통 단백질인 단백질 성분의 경우, 상기 단백질 성분의 막관통 섹션은 제1 펩티드 태그의 위치를 지정하는데 양호한 표적을 제공하고, 이러한 서열은 항원성인 단백질 성분의 입체형태에 관여되지 않고, 예를 들어 백신에서 더 이상 필요로 하지 않는 역할을 제공하기 때문이다. 상기 단백질 성분이 막관통 단백질을 포함하지 않는 경우, 상기 제1 펩티드 태그를 성분의 C- 또는 N-말단 또는 이의 서브유닛 (다량체의 경우)에 융합시키는 것이 도움이 될 수 있지만, 상기 제1 펩티드 태그가 또한 상기 서열의 임의의 부분에 포함될 수 있다. 대안으로서, 상기 단백질 또는 항원성 성분의 루프에 제1 펩티드 태그를 위치시킬 수 있다.
면역원성 성분, 예컨대 HCMV 5량체의 면역원성 성분을 제시하기 위해, 제1 펩티드 태그의 위치는 천연 단백질 입체형태가 유지되도록 신중하게 디자인되어야 한다. HCMV의 경우, 일 구체예에서, gH 서브유닛을 통해, 적절하게는 gH 서브유닛의 C-말단, 또는 gH 서브유닛의 막관통 도메인 (또는 이의 일부)을 통해 부착된다. 상기 5량체 (또는 5량체의 성분)의 입체형태를 유지하는 것 외에도, 이러한 합리적인 디자인은 또한 상기에 논의한 바와 같이 입자의 외부를 향해 5량체의 표적 영역을 제시한다. 본원에서 사용된 바와 같이, 상기 표적 영역은 중화 효과를 가진 항체를 생성하는 것으로 알려진 단백질의 일부이고, 또한 면역원성 부분이라고 지칭될 수 있다.
면역원성 성분, 예컨대 RSV 융합-전 F 단백질의 면역원성 성분을 제시하기 위해, 제1 펩티드 태그의 위치는 천연 단백질 입체형태가 유지되도록 신중하게 디자인되어야 한다. RSV-F 융합-전 단백질의 경우, 일 구체예에서, 적절하게는 융합-전 F의 C-말단을 통해, 이를 코딩하는 핵산의 3' 말단을 통해 부착된다. 융합-전 F 단백질 (또는 이의 성분)의 입체형태를 유지하는 것 외에도, 이러한 합리적인 디자인은 또한 융합-전 F 단백질의 대부분의 중화 에피토프를 상기에 논의된 바와 같이 입자 외부를 향해 제시한다. 상기 고려 사항이 F 단백질의 임의의 다른 변형에도 동일하게 적용된다. 상기 제1 펩티드 태그를 C-말단에 포함시키는 것은 본 발명자들의 연구에 의해 입증되었고, 면역원성 단백질 성분이 정확하게 폴딩된다.
일 구체예에서, 상기 제1 및 제2 펩티드 태그는 이소펩티드 결합을 형성할 수 있는 펩티드 태그/결합 파트너 쌍의 일부이다. 이러한 이소펩티드 결합은 자발적, 즉 도움이 필요없거나, 또는 도움이 필요한, 즉 리가제 (ligase) 또는 다른 헬퍼 (helper)로부터의 도움이 필요할 수 있다. 적절하게는, 상기 제1 및 제2 펩티드 태그는 SpyTag/SpyCatcher 쌍이다. 적절하게는, 상기 제1 및 제2 펩티드 태그는 SpyTag/SpyCatcher, SnoopTag/SnoopTagJr 및 SnoopCatcher; RrgATag/RrgATag2/DogTag 및 RrgACatcher, IsopepTag/IsopepTag-N 및 Pilin-C 또는 Pilin-N, PsCsTag 및 PsCsCatcher; 및 SnoopTagJr 및 DogTag (SnoopLigase에 의해 매개됨), 및 이러한 시스템들 모두의 변이체, 유도체 및 변형을 포함하는 목록으로부터 선택된다.
적절하게는, 상기 제1 펩티드 태그는 펩티드 태그/결합 파트너 쌍으로부터의 펩티드 태그, 예컨대 SpyTag이고, 상기 제2 펩티드 태그는 결합 파트너, 예컨대 SpyCatcher이다. 다른 구체예에서, 상기 제1 펩티드 태그는 결합 파트너, 예컨대 SpyCatcher이고, 상기 제2 펩티드 태그는 펩티드 태그/결합 파트너 쌍으로부터의 펩티드 태그 성분, 예컨대 SpyTag이다.
적절하게는, 상기 제1 펩티드 태그는 펩티드 태그/결합 파트너 쌍으로부터의 펩티드 태그, 예컨대 SnoopTag이고, 상기 제2 펩티드 태그는 결합 파트너, 예컨대 SnoopCatcher이다. 다른 구체예에서, 상기 제1 펩티드 태그는 결합 파트너, 예컨대 SnoopCatcher이고, 상기 제2 펩티드 태그는 펩티드 태그/결합 파트너 쌍으로부터의 펩티드 태그 성분, 예컨대 SnoopTag이다. 따라서, 상기 제1 펩티드 태그는 "태그 (tag)" 또는 "캐처 (catcher)"이고; 상기 제2 펩티드 태그는 이러한 쌍에 대한 파트너인, 각각 "캐처" 또는 "태그"일 수 있음을 알 수 있다. 적절한 펩티드 태그/결합 파트너 쌍은 WO2011/09877, WO2016/193746, WO2018/18951 및 WO2018/197854에 상세하게 기재되어 있고, 본원에 참조로 통합된다.
일 구체예에서, 상기 단백질 또는 항원성 성분은 제1 펩티드 태그로서 SpyTag, SnoopTag, RrgATag, RrgATag2, DogTag, IsopepTag, IsopepTag-N, PsCsTag 및 SnoopTagJr 중 어느 하나에 부착된다.
상기 제1 펩티드 태그는 필요한 경우 링커를 통해 부착될 수 있고, 이는 견고하거나 또는 유연할 수 있다. 당업자는 어떤 링커가 적절할지 알 것이다.
다른 구체예에서, 상기 모이어티는 제2 펩티드 태그로서 SpyCatcher, SnoopCatcher, RrgACatcher, Pilin-C, Pilin-N, PsCsCatcher 및 DogTag (SnoopLigase에 의해 매개됨) 중 어느 하나에 부착된다.
상기 모이어티는 합성 다량체화 플랫폼을 포함하여 이전에 논의된 임의의 적절한 모이어티일 수 있다.
상기 제2 펩티드 태그는 모이어티의 임의의 적절한 위치에 부착될 수 있고, 이는 폴딩 및 적절한 입체형태를 형성하는 능력에 영향을 주지 않는다. 유전자 융합이 선호될 수 있다. 상기 모이어티의 C- 또는 N-말단에 제2 펩티드 태그를 포함하는 것이 바람직할 수 있지만, 상기 제2 펩티드 태그는 또한 서열의 어느 부분에 포함될 수 있다. 대안으로서, 상기 모이어티의 루프에서 제2 펩티드 태그를 위치시킬 수 있다. 예를 들어, RNA 박테리오파지 AP205의 바이러스 코트 단백질 (CP3)의 N-말단에 SpyCatcher를 유전자 융합시키는 것은 Brune et al, Scientific Reports volume 6, Article number: 19234 (2016)에 기재되어 있다. 다량체화 플랫폼으로서 자가-조립 합성 단백질을 사용하는 대체 융합은 Bruun et al, ACS Nano, 2018, 12 (9), pp 8855-8866에서 논의된다. 상기 제2 펩티드 태그는 대안으로서 화학적 접합을 통해 부착될 수 있다.
상기 제2 펩티드 태그는 필요한 경우 링커를 통해 부착될 수 있고, 이는 견고하거나 또는 유연할 수 있다. 당업자는 어떤 링커가 적절할지 알 것이다.
일 구체예에서, 상기 항원성 성분, 예컨대 HCMV 5량체 또는 이의 면역원성 성분은 SpyTag에 부착된다. 적절한 SpyTag는 서열 번호: 30에 제시된 아미노산 서열을 갖는다.
상기 SpyTag는 링커를 통해 부착될 수 있다. 적절한 링커는 서열 번호: 29에 제시된 아미노산 서열을 가진 링커를 포함한다.
다른 구체예에서, 상기 모이어티는 SpyCatcher 결합 파트너 (제2 펩티드 태그)에 부착된다. 상기 모이어티는 적절하게 HBsAg일 수 있다. 적절한 SpyCatcher는 서열 번호: 38에 제시된 아미노산 서열을 갖는다. 일 구체예에서, SpyCatcher는 링커를 통해 부착된다. 상기 링커는 견고한 링커 또는 가요성 링커일 수 있고, 적절하게는 상기 링커는 서열 번호: 39에 제시된 아미노산 서열을 갖는다.
다른 구체예에서, 본 발명의 임의의 양상 또는 구체예에 따른 단백질 조성물 또는 항원성 조성물은 제1 펩티드 태그를 포함하는 다른, 바람직하게는 상이한 단백질을 추가로 포함한다.
다른 구체예에서, 본 발명의 임의의 양상 또는 구체예에 따른 조성물은 다른 HCMV 항원과 같은, 제1 펩티드 태그를 포함하는 또 다른, 바람직하게는 상이한 항원을 추가로 포함한다. 적절하게는, 상기 다른 HCMV 항원은 당단백질 B이다. 적절하게는, 당단백질 B 서열은 예를 들어 WO2014/005959에 기재되어 있으며, 서열 번호: 21, 22, 23 또는 36을 참조한다. 일 구체예에서, 상기 조성물은 HCMV 5량체 및 다른 HCMV 항원 모두를 나타내는 입자 (예: VLP)를 포함한다.
일 구체예에서, 상기 조성물은 면역원성 조성물 또는 백신 조성물이다. 바람직하게 상기 면역원성 또는 백신 조성물은 개인에게 투여시에 항체 반응과 같은 면역 반응을 유도할 수 있는 것이다. 적절하게는, 상기 면역 반응은 보호 면역 반응일 수 있다. 적절한 면역원성 조성물은 아쥬반트 (adjuvants), 면역자극제 및/또는 약학적으로 허용 가능한 부형제를 포함하는 추가 성분들을 추가로 포함할 수 있다.
적절한 아쥬반트는 예를 들어 알루미늄, 펩티드, 스쿠알렌, 리포좀, 수중유형 에멀젼 및 사포닌을 기반으로 할 수 있고, Alhydrogel®, MF59, AS01, MatrixM, 무라밀 디펩파이드 (muramyl dipepide) 및 Quil A를 포함할 수 있다. 또한, 유중수형 아쥬반트가 적합하다. 스쿠알렌-수중유형 에멀젼 (Squalene-Oil-in-water emulsions), 예컨대 AddavaxTM가 적합하다.
따라서, 본 발명의 다른 양상 또는 구체예에서, 본 발명에 따른 조성물을 포함하는 면역원성 또는 백신 조성물이 제공된다. 적절하게는, 백신 조성물은 HCMV 감염으로부터의 중화 효과와 같은 감염체/벡터로부터 면역원성, 바람직하게는 면역보호 효과를 제공하는, 본 발명에 따른 조성물의 양인 백신 용량 (vaccine dose)을 포함한다. 적절하게는, 백신 조성물은 RSV 감염으로부터의 중화 효과와 같은 감염체/벡터로부터 중화 효과를 제공하는, 본 발명에 따른 조성물의 양인 백신 용량을 포함한다. 면역원성 조성물에 대해 생성된 항체, 바람직하게는 중화 항체는, 예를 들어 본원에 기재된 바와 같이 표준화된 ELISA 분석 또는 미세중화 분석을 포함한, 당업자에게 친숙한 방법에 의해 검출 및 측정될 수 있다.
다른 양상에서, 하기를 포함하는 VLP가 제공되며:
i) 제1 펩티드 태그를 포함하는 모이어티
ii) 제2 펩티드 태그를 포함하는 단백질
상기 제1 펩티드 태그 및 상기 제2 펩티드 태그는 이소펩티드 결합을 형성한다. 일부 구체예에서, 상기 모이어티는 HBsAg이다. 그러나, 전술한 바와 같이, 임의의 적절한 모이어티가 사용될 수 있다.
적절하게는, 상기 제1 펩티드 태그는 펩티드 태그/결합 파트너 쌍으로부터의 펩티드 태그, 예컨대 SpyTag이고, 상기 제2 펩티드 태그는 결합 파트너, 예컨대 SpyCatcher이다. 다른 구체예에서, 상기 제1 펩티드 태그는 결합 파트너, 예컨대 SpyCatcher이고, 상기 제2 펩티드 태그는 펩티드 태그/결합 파트너 쌍으로부터의 펩티드 태그, 예컨대 SpyTag이다. 다른 적절한 펩티드 태그/결합 파트너 쌍이 본원에 기재되어 있고, 당업자에게 알려져 있다. 적절하게는, 상기 제1 및 제2 펩티드 태그는 SpyTag/SpyCatcher, SnoopTag/SnoopTagJr 및 SnoopCatcher; RrgATag/RrgATag2/DogTag 및 RrgACatcher, IsopepTag/IsopepTag-N 및 Pilin-C 또는 Pilin-N, PsCsTag 및 PsCsCatcher; 및 SnoopTagJr 및 DogTag (SnoopLigase에 의해 매개됨), 및 이러한 시스템들 모두의 변이체, 유도체 및 변형을 포함하는 목록으로부터 선택된다.
적절하게는, 상기 제2 펩티드 태그를 포함하는 단백질은 50 kDa를 초과하는 단백질 또는 펩티드 복합체이다. 상기 제2 펩티드 태그를 포함하는 단백질은 50 kDa, 60 kDa, 70 kDa, 80 kDa, 90 kDa, 100 kDa, 110 kDa, 120 kDa, 130 kDa, 140 kDa, 150 kDa 또는 160 kDa, 170 kDa, 180 kDa, 190 kDa 또는 초과, 예컨대 200 kDa 초과, 300 kDa 초과 또는 400 kDa 초과인 단백질 또는 펩티드 복합체일 수 있다.
일 구체예에서, 상기 제2 펩티드 태그를 포함하는 단백질은 다량체 단백질이다. 일 구체예에서, 상기 제2 펩티드 태그를 포함하는 단백질은 항원, 바람직하게는 다량체 항원이다. 적절하게는, 상기 다량체 항원은 본원에 기재된 HCMV 5량체일 수 있다. 적절하게는, 상기 단백질은 RSV-F 단백질 또는 이의 유도체 (예: 융합-전 F 단백질)일 수 있다. 일 구체예에서, 제2 펩티드 태그를 포함하는 단백질은 HCMV 5량체의 면역원성 성분이다. 본원에 기재되고 적절한 링커 및 태그를 포함하는 HCMV 5량체 (gH/gL/pUL128/pUL130/pUL131)는 분자량이 160 kDa 초과이다. 다른 적절한 크거나 또는 다량체 단백질 또는 항원은 인플루엔자 바이러스, RSV 등과 같은 바이러스를 포함하는 다른 감염체로부터의 항원을 포함한다.
유리하게는, 이러한 방식에서 담체 (VLP)로서 HBsAg를 사용하면 대안으로서 항-B형 간염 바이러스 (HBV) 반응으로 기재되는, 항-HepB 부스트 (boost)를 생성할 가능성이 있다.
다른 양상에서, 하기를 포함하는 VLP가 제공되며:
i) 제1 펩티드 태그를 포함하는 단백질
ii) 제2 펩티드 태그를 포함하는 모이어티
상기 제1 펩티드 태그 및 상기 제2 펩티드 태그는 이소펩티드 결합을 형성한다. 일부 구체예에서, 상기 모이어티는 HBsAg이다. 그러나 전술한 바와 같이, 임의의 적절한 모이어티가 사용될 수 있다.
적절하게는, 상기 제1 펩티드 태그는 펩티드 태그/결합 파트너 쌍으로부터의 펩티드 태그, 예컨대 SpyTag이고, 상기 제2 펩티드 태그는 결합 파트너, 예컨대 SpyCatcher이다. 다른 구체예에서, 상기 제1 펩티드 태그는 결합 파트너, 예컨대 SpyCatcher이고, 상기 제2 펩티드 태그는 펩티드 태그/결합 파트너 쌍으로부터의 펩티드 태그, 예컨대 SpyTag이다. 다른 적절한 펩티드 태그/결합 파트너 쌍이 본원에 기재되어 있고, 당업자에게 알려져 있다. 적절하게는, 상기 제1 및 제2 펩티드 태그는 SpyTag/SpyCatcher, SnoopTag/SnoopTagJr 및 SnoopCatcher; RrgATag/RrgATag2/DogTag 및 RrgACatcher, IsopepTag/IsopepTag-N 및 Pilin-C 또는 Pilin-N, PsCsTag 및 PsCsCatcher; 및 SnoopTagJr 및 DogTag (SnoopLigase에 의해 매개됨), 및 이러한 시스템들 모두의 변이체, 유도체 및 변형을 포함하는 목록으로부터 선택된다.
적절하게는, 상기 제1 펩티드 태그를 포함하는 단백질은 50 kDa를 초과하는 단백질 또는 펩티드 복합체이다. 상기 제1 펩티드 태그를 포함하는 단백질은 50 kDa, 60 kDa, 70 kDa, 80 kDa, 90 kDa, 100 kDa, 110 kDa, 120 kDa, 130 kDa, 140 kDa, 150 kDa 또는 160 kDa 초과, 특히 200 kDa, 300 kDa 또는 심지어 400 kDa 초과인 단백질 또는 펩티드 복합체일 수 있다. 일 구체예에서, 상기 제1 펩티드 태그를 포함하는 단백질은 다량체 단백질이다. 일 구체예에서, 상기 제2 펩티드 태그를 포함하는 단백질은 항원, 바람직하게는 다량체 항원이다. 적절하게는, 상기 다량체 항원은 본원에 기재된 HCMV 5량체일 수 있다. 적절하게는, 상기 단백질은 RSV-F 단백질 또는 이의 유도체 (예컨대 융합-전 F 단백질)일 수 있다. 일 구체예에서, 제1 펩티드 태그를 포함하는 단백질은 HCMV 5량체의 면역원성 성분이다. 본원에 기재되고 적합한 링커 및 태그를 포함하는 HCMV 5량체 (gH/gL/pUL128/pUL130/pUL131A)는 160 kDa 초과의 분자량을 갖는다. 다른 적합한 크거나 또는 다량체 단백질 또는 항원은 인플루엔자 바이러스, RSV 등과 같은 바이러스를 포함하는 다른 감염체로부터의 항원을 포함한다.
유리하게는, 이러한 방식에서 담체 (VLP)로서 HBsAg를 사용하면 또한 항-HBV 부스트를 생성할 가능성이 있다.
본 발명의 다른 양상에서, 본원에 기재된 바와 같이 SpyTag에 연결된 HCMV 5량체가 제공된다.
본 발명의 다른 양상에 따르면, 본 발명에 따른 조성물 또는 VLP를 제조하는 방법이 제공되며, 상기 방법은 하기 단계를 포함한다:
- 제1 단백질의 제1 펩티드 태그로의 제1 유전자 융합을 코딩하는 제1 핵산을 제1 숙주 세포에 도입하는 단계;
- 상기 제1 유전자 융합을 발현시키는 조건하에 상기 제1 숙주 세포를 인큐베이션하는 단계; 선택적으로 상기 발현된 성분을 정제하는 단계;
- 제2 단백질의 제2 펩티드 태그로의 제2 유전자 융합을 코딩하는 제2 핵산을 제2 숙주 세포에 도입하는 단계;
- 상기 제2 유전자 융합을 발현시키는 조건하에 상기 제2 숙주 세포를 인큐베이션하는 단계; 선택적으로 상기 발현된 성분을 정제하는 단계;
- 상기 제1 펩티드 태그 및 제2 펩티드 태그 간 이소펩티드 결합을 형성하는 조건하에 상기 발현된 성분들을 인큐베이션하는 단계; 선택적으로 수득된 조성물을 정제하는 단계.
적절하게는, 상기 발현된 성분들은 이소펩티드 결합이 형성되도록 함께 인큐베이션된다. 상기 이소펩티드 결합의 형성은 리가제 또는 유사물과의 공동-인큐베이션이 필요할 수 있다.
적절하게는, 본 발명에 따른 조성물 또는 VLP를 제조하는 방법은 VLP에 나타낸 항원성 성분을 포함하는 조성물을 제조하기 위한 것일 수 있다.
일부 구체예에서, "HCMV 5량체의 면역원성 성분"이 전체 HCMV 5량체를 포함하는 경우, 상기 HCMV 5량체의 성분의 재조합 생성은 각 서브유닛이 형성될 5량체에 대해 정확한 화학량론으로 발현될 뿐만 아니라 조립을 위해 정확하게 폴딩되는 것을 필요로 한다. 이러한 구체예에서, 필요한 5량체의 단지 일부의 복합체 (예: gH/gL 2량체 및 4량체, 또는 5개의 서브유닛들 중 어느 하나가 결여된 4량체)는 최종 산물에서 제외될 필요가 있다. 유리하게는, 본 발명은 성분들을 개별적으로 제조한 다음 이들을 접합하는 간단한 접근법을 제공함으로써 하나의 시스템에서 모든 백신 성분들 (즉, HCMV 5량체의 5개의 서브유닛 및 HBsAg)을 발현시킴으로써 연관될 수 있는 문제들을 극복한다. 따라서, 일 구체예에서, 정제 태그 (purification tag)는 UL130에 통합된다 (Hofmann et al, DOI 10.1002/bit 25670). 유사한 원리가 다른 면역원성 성분에도 적용될 수 있다.
일부 구체예에서, "RSV-F 단백질의 면역원성 성분"이 전체 F 단백질 또는 이의 유도체를 포함하는 경우, 상기 F 단백질 또는 이의 유도체의 성분의 재조합 생성은 융합-전 F 단백질 3량체를 포함하는 유도체와 함께, 조립을 위해 정확하게 폴딩되어야 한다.
적절하게는, 상기 방법은 HBsAg VLP에 나타낸 HCMV 5량체를 포함하는 조성물을 제조하기 위한 것이다. 적절하게는, 상기 방법은 HBsAg VLP에 나타낸 RSV-F 융합-전 F 단백질 3량체를 포함하는 조성물을 제조하기 위한 것이다.
본 발명의 다른 양상에서, 질병의 예방 및/또는 치료에 사용하기 위한 백신이 제공된다. 적절하게는, 상기 백신은 본 발명의 임의의 양상 또는 구체예에 따른 조성물 또는 VLP를 포함한다. 일 구체예에서, 상기 질병은 HCMV 감염이다. 다른 양상에서, HCMV에 대한 예방적 치료 방법이 제공된다. 적절하게는, 상기 백신은 인간에게 사용하기 위한 것이다. 적절하게는, 상기 백신은 성인 인간, 예를 들어 가임 연령의 여성 또는 임산부에게 사용하기 위한 것이다. 다른 양상에서, 본 발명은 개인에서 HCMV에 대한 면역원성 반응, 예를 들어 보호 면역 반응을 유도하는 방법을 제공하고, 상기 방법은 본 발명의 임의의 양상 또는 구체예에 따른 조성물을 투여하는 단계를 포함한다.
본 발명의 다른 양상에서, 의약 (medicament)으로서 사용하기 위한 본 발명의 임의의 양상에 따른 조성물이 제공된다.
본 발명의 추가의 일 양상에서, 백신으로서, 바람직하게는 HCMV 감염의 예방 및/또는 치료에 사용하기 위한 백신으로서 사용하기 위한 본 발명의 임의의 양상에 따른 조성물이 제공된다. 본 발명에 따른 의약 또는 백신으로서 사용하기 위한 조성물이 인간 성인, 예를 들어 가임 연령의 여성 또는 임산부에게 투여될 수 있다.
다른 양상에서, 본 발명은 본 발명에 따른 방법에 사용하기 위한 핵산 분자를 제공한다. 일 구체예에서, 본 발명에 따른 핵산 분자는 서열 번호: 27 내지 41 중 어느 하나에 제시된 아미노산 서열을 코딩하는 핵산 서열을 포함한다. 일 구체예에서, 본 발명에 따른 핵산 분자는 서열 번호: 12 내지 26 또는 42 내지 46 중 어느 하나에 제시된 핵산 서열을 포함한다.
다른 양상에서, 본 발명은 서열 번호: 27 내지 41에 제시된 아미노산 서열을 코딩하는 핵산 분자를 포함하는 복수의 핵산 분자를 제공한다. 일 구체예에서, 본 발명의 핵산 분자는 서열 번호: 12 내지 26 또는 42 내지 46 중 어느 하나에 제시된 서열을 가진 것을 포함한다.
다른 양상에서, 본 발명은 본 발명에 따른 방법에 사용하기 위한 핵산 분자를 제공한다. 일 구체예에서, 본 발명에 따른 핵산 분자는 서열 번호: 50 내지 58 중 어느 하나에 제시된 아미노산 서열을 코딩하는 핵산 서열을 포함한다. 일 구체예에서, 본 발명에 따른 핵산 분자는 서열 번호: 47 내지 55 중 어느 하나에 제시된 핵산 서열을 포함한다.
다른 양상에서, 본 발명은 서열 번호: 50 내지 58에 제시된 아미노산 서열을 코딩하는 핵산 분자를 포함하는 복수의 핵산 분자를 제공한다. 일 구체예에서, 본 발명의 핵산 분자는 서열 번호: 47 내지 55 중 어느 하나에 제시된 서열을 가진 것을 포함한다.
다른 양상에서, 본 발명은 본 발명에 따른 핵산 분자 또는 복수의 핵산 분자를 포함하는 벡터를 제공한다. 적절하게는, 벡터는 본 발명에 따른 조성물의 임의의 성분의 아미노산 서열을 발현하기 위한 발현 벡터이다.
다른 양상에서, 본 발명은 본 발명에 따른 조성물의 성분들을 발현하기 위한 숙주 세포를 제공한다. 적합한 숙주 세포는 이러한 성분들의 일시적 또는 안정한 발현을 위한 것일 수 있다. CMV 단백질을 발현하기 위한 방법 및 숙주 세포는 예를 들어 WO2014/005959 및 WO2016/067239에 기재되어 있고, 이들 모두는 참조로 통합된다. 일부 구체예에서, 상기 성분은 글리코실화될 수 있다.
본 발명의 다른 양상에서, 프라임-부스트 백신 접종 요법 (prime-boost vaccination regime)에 사용하기 위한 본 발명에 따른 조성물을 포함하는 키트가 제공된다. 적절하게는, 상기 키트는 본 발명에 따른 제1 면역원성 조성물을 포함하는 프라임 조성물 (prime composition) 및 본 발명에 따른 제2 면역원성 조성물을 포함하는 부스트 조성물 (boost composition)을 포함할 수 있다. 대안으로서, 단일 또는 다중 용량 백신 접종 요법, 즉 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10회 용량을 제공하기 위해 상기 키트가 제공될 수 있다. 따라서, 다른 양상에서, 본 발명은 대략 3주 간격으로 적용되는 용량들을 포함하는 투여 요법 (dosage regime)을 제공한다.
도 1: 비-환원 및 환원 조건하에 정제된 5량체-SpyTag의 SDS-PAGE 및 웨스턴 블롯 분석 (Western blot analysis). 레인 1: ColorPlus Prestained Broad Range Protein Ladder, 크기는 kDa로 나타냄. 레인 2: 비-환원 샘플; 레인 3: 환원 샘플. A) SDS-PAGE 및 쿠마시 염색 분석 (Coomassie staining analysis), HCMV 5량체 성분의 위치가 표시됨, 겔의 좌측으로 비-환원, 우측으로 환원. B) 항-HCMV 5량체 항체를 사용한 웨스턴 블롯 분석.
도 2: 비-환원 (NR) 및 환원 조건 (R)하에 정제된 SpyCatcher-HBsAg의 SDS-PAGE 및 웨스턴 블롯 분석. A) SDS-PAGE 및 쿠마시 염색 분석. B) 항-HBsAg 모노클로날 항체를 사용한 웨스턴 블롯 분석.
도 3: s200increase 3.2/300 컬럼을 사용한 HPLC 분석. A) 10 μl의 정제된 HCMV 5량체-SpyTag를 로딩하고 단일 피크로 용출하였다. B) 10 μl의 정제된 SpyCatcher-HBsAg를 로딩하고, 상기 컬럼의 공극 부피에서 단일 주요 피크로 용출하였다.
도 4: 환원 조건하에 접합된 5량체-SpyTag 및 SpyCatcher-HBsAg의 SDS-PAGE 및 웨스턴 블롯 분석. 1: ColorPlus Prestained Broad Range Protein Ladder, 크기는 kDa로 나타냄. 2: 접합; 3: 5량체-SpyTag; 4: SpyCatcher-HBsAg. A) SDS-PAGE 및 쿠마시 염색 분석. B) 항-HBsAg 모노클로날 항체를 사용한 웨스턴 블롯. C) 항-5량체 폴리클로날 항체를 사용한 웨스턴 블롯.
도 5: s200 increase 3.2/300 컬럼을 사용한 HPLC 분석. 30 μl의 접합된 5량체-SpyTag--SpyCatcher-HBsAg를 로딩하고, 상기 컬럼의 공극 부피에서 주요 피크로 용출하였다.
도 6: 단일 면역화 후에, Addavax를 아쥬반트로 갖는 (adjuvanted), HCMV 5량체-HBsAg 백신 대 5량체 단백질 백신의 면역원성. BALB/c 마우스를, 5량체-HBsAg VLP로서 또는 가용성 단백질로서, 1 μg 또는 0.1 μg의 HCMV 5량체-SpyTag로 면역화하였다. 역가 (Titres)는 마우스 혈청으로부터 표준화된 ELISA로 측정하였다. 선 (Lines)은 평균을 나타내고, 오차 막대 (error bars)는 표준 편차를 나타낸다 (n = 10). HCMV 5량체-HBsAg VLP로 면역화된 마우스는, 상기 5량체-동등물 VLP 용량이 10배 더 적더라도, HCMV 5량체 단백질 단독으로 면역화된 마우스에 비해 실질적으로 더 강한 혈청 IgG 항체 반응을 나타낸다.
도 7: 5량체 단백질 백신에 비해 HCMV 5량체-HBsAg 백신으로 면역화된 마우스 혈청 중 중화 활성 (Neutralising activity). 백신은 Addavax를 아쥬반트로 갖고, 1회 면역화 후 (프라임 후) 또는 2회 면역화 후 (부스트 후)에 반응을 나타내었다. NT50은 AD169wt131 균주로 감염시킨 ARPE-19 세포에서 측정하였다 (기능적 5량체를 나타냄). 동일한 분석에서 Cytogam에 대한 중화 역가 및 상업적으로 입수 가능한 중화 항-gH mAb (Bio-Rad Antibodies의 HCMV16 (51C1))를 나타낸다.
도 8: 1회 또는 2회 면역화 후에, 아쥬반트 없이, HCMV 5량체-HBsAg 백신 대 5량체 단백질 백신의 면역원성. BALB/c 마우스를, SpyCatcher-HBsAg (5량체-HBsAg)에 접합시킨 HCMV 5량체-SpyTag의 1 μg 또는 0.1 μg, 또는 5량체-SpyTag 단백질의 1 μg으로 면역화하였다. 역가는 마우스 혈청으로부터 표준화된 ELISA로 측정하였다. 선은 평균을 나타내고, 오차 막대는 표준 편차를 나타낸다 (n = 10). HCMV 5량체-HBsAg VLP로 면역화된 마우스는, 상기 5량체-동등물 VLP 용량이 10배 더 적더라도, HCMV 5량체 단백질 단독으로 면역화된 마우스에 비해 실질적으로 더 강한 혈청 IgG 항체 반응을 나타낸다.
도 9: 5량체 단백질 백신과 비교하여 HCMV 5량체-HBsAg 백신으로 면역화된 마우스 혈청 중 중화 활성. 백신은 아쥬반트를 사용하지 않았고, 1회 면역화 후 (프라임 후) 또는 2회 면역화 후 (부스트 후)에 반응을 나타내었다. NT50은 AD169wt131 균주로 감염시킨 ARPE-19 세포에서 측정하였다 (기능적 5량체를 나타냄). 동일한 분석에서 Cytogam에 대한 중화 역가 및 상업적으로 입수 가능한 중화 항-gH mAb (Bio-Rad Antibodies의 HCMV16 (51C1))를 나타낸다.
도 10: 비-환원 및 환원 조건하에 정제된 RSV-F-SpyTag의 SDS-PAGE 및 웨스턴 블롯 분석. A) SDS-PAGE 및 쿠마시 염색 분석, 레인 1: ColorPlus Prestained Broad Range Protein Ladder; 레인 2: 비-환원 샘플; 레인 3: 환원 샘플. B) 항-RSV-F 모노클로날 항체를 사용한 웨스턴 블롯 분석, 레인 1: ColorPlus Prestained Broad Range Protein Ladder; 레인 2: 비-환원 샘플; 레인 3: 환원 샘플.
도 11: 환원 조건하에 SpyCatcher-HBsAg와 접합된 RSV-F-SpyTag의 SDS-PAGE 및 웨스턴 블롯 분석. 1: ColorPlus Prestained Broad Range Protein Ladder, 2: RSV-F-SpyTag--SpyCatcher-HBsAg 접합체, 3: RSV-F-SpyTag, 4: SpyCatcher-HBsAg. A) SDS-PAGE 및 쿠마시 염색 분석. B) 항-HBsAg 모노클로날 항체를 사용한 웨스턴 블롯. C) 항-RSV-F 모노클로날 항체를 사용한 웨스턴 블롯.
도 12: 접합된 RSV-F-SpyTag--SpyCatcher-HBsAg ('Sc9-10-HBsAg') 대 비접합된 RSV-F-SpyTag ('Sc9-10')의 면역원성. BALB/c 마우스를, Addavax™ (n = 8)을 아쥬반트로 갖거나 또는 갖지 않는, SpyCatcher-HBsAg (RSV-F VLP)에 접합시킨 RSV-F-SpyTag의 1 μg 또는 RSV-F-SpyTag 단백질의 1 μg으로 면역화하였다. RSV-F 항원은 sc9-10 DS-Cav1 A149C Y458C-SpyTag이다.
도 2: 비-환원 (NR) 및 환원 조건 (R)하에 정제된 SpyCatcher-HBsAg의 SDS-PAGE 및 웨스턴 블롯 분석. A) SDS-PAGE 및 쿠마시 염색 분석. B) 항-HBsAg 모노클로날 항체를 사용한 웨스턴 블롯 분석.
도 3: s200increase 3.2/300 컬럼을 사용한 HPLC 분석. A) 10 μl의 정제된 HCMV 5량체-SpyTag를 로딩하고 단일 피크로 용출하였다. B) 10 μl의 정제된 SpyCatcher-HBsAg를 로딩하고, 상기 컬럼의 공극 부피에서 단일 주요 피크로 용출하였다.
도 4: 환원 조건하에 접합된 5량체-SpyTag 및 SpyCatcher-HBsAg의 SDS-PAGE 및 웨스턴 블롯 분석. 1: ColorPlus Prestained Broad Range Protein Ladder, 크기는 kDa로 나타냄. 2: 접합; 3: 5량체-SpyTag; 4: SpyCatcher-HBsAg. A) SDS-PAGE 및 쿠마시 염색 분석. B) 항-HBsAg 모노클로날 항체를 사용한 웨스턴 블롯. C) 항-5량체 폴리클로날 항체를 사용한 웨스턴 블롯.
도 5: s200 increase 3.2/300 컬럼을 사용한 HPLC 분석. 30 μl의 접합된 5량체-SpyTag--SpyCatcher-HBsAg를 로딩하고, 상기 컬럼의 공극 부피에서 주요 피크로 용출하였다.
도 6: 단일 면역화 후에, Addavax를 아쥬반트로 갖는 (adjuvanted), HCMV 5량체-HBsAg 백신 대 5량체 단백질 백신의 면역원성. BALB/c 마우스를, 5량체-HBsAg VLP로서 또는 가용성 단백질로서, 1 μg 또는 0.1 μg의 HCMV 5량체-SpyTag로 면역화하였다. 역가 (Titres)는 마우스 혈청으로부터 표준화된 ELISA로 측정하였다. 선 (Lines)은 평균을 나타내고, 오차 막대 (error bars)는 표준 편차를 나타낸다 (n = 10). HCMV 5량체-HBsAg VLP로 면역화된 마우스는, 상기 5량체-동등물 VLP 용량이 10배 더 적더라도, HCMV 5량체 단백질 단독으로 면역화된 마우스에 비해 실질적으로 더 강한 혈청 IgG 항체 반응을 나타낸다.
도 7: 5량체 단백질 백신에 비해 HCMV 5량체-HBsAg 백신으로 면역화된 마우스 혈청 중 중화 활성 (Neutralising activity). 백신은 Addavax를 아쥬반트로 갖고, 1회 면역화 후 (프라임 후) 또는 2회 면역화 후 (부스트 후)에 반응을 나타내었다. NT50은 AD169wt131 균주로 감염시킨 ARPE-19 세포에서 측정하였다 (기능적 5량체를 나타냄). 동일한 분석에서 Cytogam에 대한 중화 역가 및 상업적으로 입수 가능한 중화 항-gH mAb (Bio-Rad Antibodies의 HCMV16 (51C1))를 나타낸다.
도 8: 1회 또는 2회 면역화 후에, 아쥬반트 없이, HCMV 5량체-HBsAg 백신 대 5량체 단백질 백신의 면역원성. BALB/c 마우스를, SpyCatcher-HBsAg (5량체-HBsAg)에 접합시킨 HCMV 5량체-SpyTag의 1 μg 또는 0.1 μg, 또는 5량체-SpyTag 단백질의 1 μg으로 면역화하였다. 역가는 마우스 혈청으로부터 표준화된 ELISA로 측정하였다. 선은 평균을 나타내고, 오차 막대는 표준 편차를 나타낸다 (n = 10). HCMV 5량체-HBsAg VLP로 면역화된 마우스는, 상기 5량체-동등물 VLP 용량이 10배 더 적더라도, HCMV 5량체 단백질 단독으로 면역화된 마우스에 비해 실질적으로 더 강한 혈청 IgG 항체 반응을 나타낸다.
도 9: 5량체 단백질 백신과 비교하여 HCMV 5량체-HBsAg 백신으로 면역화된 마우스 혈청 중 중화 활성. 백신은 아쥬반트를 사용하지 않았고, 1회 면역화 후 (프라임 후) 또는 2회 면역화 후 (부스트 후)에 반응을 나타내었다. NT50은 AD169wt131 균주로 감염시킨 ARPE-19 세포에서 측정하였다 (기능적 5량체를 나타냄). 동일한 분석에서 Cytogam에 대한 중화 역가 및 상업적으로 입수 가능한 중화 항-gH mAb (Bio-Rad Antibodies의 HCMV16 (51C1))를 나타낸다.
도 10: 비-환원 및 환원 조건하에 정제된 RSV-F-SpyTag의 SDS-PAGE 및 웨스턴 블롯 분석. A) SDS-PAGE 및 쿠마시 염색 분석, 레인 1: ColorPlus Prestained Broad Range Protein Ladder; 레인 2: 비-환원 샘플; 레인 3: 환원 샘플. B) 항-RSV-F 모노클로날 항체를 사용한 웨스턴 블롯 분석, 레인 1: ColorPlus Prestained Broad Range Protein Ladder; 레인 2: 비-환원 샘플; 레인 3: 환원 샘플.
도 11: 환원 조건하에 SpyCatcher-HBsAg와 접합된 RSV-F-SpyTag의 SDS-PAGE 및 웨스턴 블롯 분석. 1: ColorPlus Prestained Broad Range Protein Ladder, 2: RSV-F-SpyTag--SpyCatcher-HBsAg 접합체, 3: RSV-F-SpyTag, 4: SpyCatcher-HBsAg. A) SDS-PAGE 및 쿠마시 염색 분석. B) 항-HBsAg 모노클로날 항체를 사용한 웨스턴 블롯. C) 항-RSV-F 모노클로날 항체를 사용한 웨스턴 블롯.
도 12: 접합된 RSV-F-SpyTag--SpyCatcher-HBsAg ('Sc9-10-HBsAg') 대 비접합된 RSV-F-SpyTag ('Sc9-10')의 면역원성. BALB/c 마우스를, Addavax™ (n = 8)을 아쥬반트로 갖거나 또는 갖지 않는, SpyCatcher-HBsAg (RSV-F VLP)에 접합시킨 RSV-F-SpyTag의 1 μg 또는 RSV-F-SpyTag 단백질의 1 μg으로 면역화하였다. RSV-F 항원은 sc9-10 DS-Cav1 A149C Y458C-SpyTag이다.
바이러스-유사 입자
종래에, 백신 접근법은 약독화되거나 또는 사멸된 전체 병원체를 사용하였지만, 이는 적절한 병원체로부터의 단백질을 포함하는 재조합 서브유닛 백신을 사용함으로써 대체되었다. 최근에는 바이러스-유사 입자 (VLP)를 사용하는 접근법이 개발되었다. VLP는 그 크기 (대략 20-200 nm), 형태 및 반복적인 단백질 배열이 바이러스와 유사하지만, 병원체 유래의 임의의 유전자 물질이 결여되어 있는 입자이다. 그 크기 때문에, VLP는 림프절로 배출될 가능성이 더 높아서, 항원-제시 세포에 의한 흡수 및 제시에 이상적이다. 또한, 이들의 반복적인 구조는 보체 고정 및 B 세포 수용체 가교를 촉진하다 (Kushnir et al. Vaccine 2012; Vol 31(1):58-83). 그러나 이들의 작용 기전은 이론에 국한되지 않는다.
HCMV
인간 사이토메갈로바이러스 (HCMV, 또한 인간 헤르페스바이러스-5 (HHV-5) 라고도 함)는 대부분의 성인이 노출된 바이러스이며, 초기 감염은 대개 경미하거나 또는 무증상이다. 감염 후에, 상기 바이러스는 체내에 잠복해 있지만, 면역손상 환자 또는 노인에게 심각한 질병을 유발할 수 있다. HCMV는 선진국에서 선천적 장애의 주요 감염 원인이다. 200명의 영아 중 최대 4명이 선천적 감염으로 인해 HCMV를 가지고 태어나며, 이들 중 최대 10%는 장기적인 결과를 겪는다. HCMV 감염은 또한 성인의 고혈압 및 죽상동맥경화증과 관련이 있다 (Cheng et al. (May 2009). Fruh K, ed. "Cytomegalovirus infection causes an increase of arterial blood pressure". PLoS Pathog. 5 (5): e1000427).
바이러스 단백질 gH/gL/pUL128/pUL130/pUL131A를 포함하는 HCMV의 5량체 복합체는, 이러한 복합체에 대한 항체가 상피 세포로 유입된 바이러스를 중화시킬 뿐만 아니라 주산기에 (perinatally) HCMV 전파 위험을 감소시킬 수 있다는 관찰에 근거하여, HCMV에 대한 잠재적으로 유용한 백신 표적으로 확인되었다. 그러나 집중적인 노력에도 불구하고, 성공적인 HCMV 백신은 현재까지 개발되지 않았다.
HCMV
5량체
임상 단리주 및 실험실 균주를 포함한, HCMV 균주는 이들의 게놈 서열에서 차이가 있다. HCMV 균주는 Merlin (GI:155573956), Towne (GI239909366) 및 AD169 (GI:219879600), Toledo (GI290564358) 및 TB40/E를 포함한다. HCMV는 다수의 막 단백질 및 단백질 복합체를 함유한다. 상기 5량체 단백질 gH/gL/pUL128/pUL130/pUL131A는 세포내이입 경로 (endocytic pathways)를 통하는 것으로 사료되는, 상피 및 내피 세포의 HCMV 감염에 중요하다. 이러한 복합체 성분의 다른 조합은 예를 들어 섬유모세포의 감염에 중요한 것으로 나타났다. "pUL" 서브유닛/성분은 또한 "UL"로 지칭되고; "pUL131"은 또한 "pUL131A" 및 "pUL131a" 또는 "UL131A"로 지칭된다.
다양한 HCMV 균주가 ATCC에 기탁되었고, Merlin (VR-1590), Towne (VR-977) 및 AD169 (VR-538)로 찾을 수 있다. 게놈 서열은 수탁 번호를 통해 참조할 수 있다: Merlin (AY446894.2), Towne (GO121041.1), AD169 (FJ527563.1), Toledo (GU37742.2) 및 TB40/E (KF297339.1)
RSV
호흡기 세포융합 바이러스는 세계적으로 유아의 심각한 호흡기 질환의 주요 원인이다. 매년 5세 미만의 유아 약 340만 명이 중증 RSV 하기도 감염으로 입원하고, 6개월 미만의 영아에서 가장 높은 발병률을 보인다. 대부분의 사망은 1세 미만의 영아와 개발도상국에서 발생한다. 현재로서는 예방 및 관리 옵션이 제한적이다.
RSV
-F 융합-전
3량체
F 당단백질은 타입 I 바이러스 융합 단백질이다. 상기 RSV F 전구체 (F0)는 2개의 부위에서 퓨린-유사 프로테아제에 의해 절단되어, 3개의 단편을 생성하는 것으로 사료된다. 더 짧은 N-말단 단편 (F2)은 2개의 디설파이드 결합에 의해 더 큰 C-말단 단편 (F1)에 공유 부착된다. 27개 아미노산의 개재 단편은 절단 후 해리되며, 성숙한 단백질에서는 발견되지 않는다.
이전에 논의된 바와 같이, 다수의 안정화된 융합-전 F 3량체를 이용할 수 있다. 본원에 제출된 실시예에서, 이들 융합-전 3량체를 코딩하는 예시되는 서열은 서열 번호: 48, 48, 54 및 55로 알 수 있다. SpyTag와의 융합을 포함하는 서열은 서열 번호: 47 및 53으로 포함된다. 상기 아미노산 서열은 융합-전 3량체의 경우 서열 번호: 51, 52, 57 및 58로 제시되고, SpyTag의 경우 서열 번호: 50 및 56으로 제시된다. 다른 예시되는 서열이 본원에서 언급된다.
펩티드 태그/결합 파트너 쌍
자발적으로 이소펩티드 결합을 형성할 수 있는 단백질 (소위 "이소펩티드 단백질 (isopeptide proteins)")은 서로 공유 결합하여 비가역적 상호작용을 제공하는 펩티드 태그/폴리펩티드 결합 파트너 쌍 (즉, 2-파트 링커들)을 개발하는데 유리하게 사용되었다 (예를 들어, 본원에 참조로 통합된 WO2011/098772 및 WO 2016/193746과 함께, 본원에 참조로 통합된 WO2018/189517 및 WO2018/197854를 참조한다). 이러한 점에서, 자발적으로 이소펩티드 결합을 형성할 수 있는 단백질은 별개의 단편으로 발현되어, 펩티드 태그 및 상기 펩티드 태그에 대한 폴리펩티드 결합 파트너를 제공할 수 있고, 여기서 상기 2개의 단편은 이소펩티드 결합 형성에 의해 공유적으로 재구성되고, 이에 의해 상기 펩티드 태그 및 이의 폴리펩티드 결합 파트너에 융합된 분자들 또는 성분들을 연결할 수 있다. 상기 펩티드 태그 및 이의 폴리펩티드 결합 파트너에 의해 형성된 이소펩티드 결합은, 비공유적 상호작용이 예를 들어 장기간 (예: 몇 주)에 걸쳐 고온에서 (적어도 95℃까지), 강한 힘 또는 가혹한 화학적 처리 (예: pH 2-11, 유기 용매, 세제 또는 변성제)에서 빠르게 해리되는 조건에서 안정하다.
이소펩티드 결합은 카복실/카복사미드기 및 아미노기 간에 형성된 아미드 결합이고, 여기서 카복실기 또는 아미노기 중 적어도 하나는 단백질 주쇄 (단백질의 백본) 외부에 있다. 이러한 결합은 전형적인 생물학적 조건하에 화학적으로 비가역적이고, 이들은 대부분의 프로테아제에 내성이 있다. 이소펩티드 결합은 본질적으로 공유 결합이므로, 이들은 가장 강하게 측정된 단백질-단백질 상호작용의 일부를 유도한다.
간단히 말해서, 2-파트 링커, 즉 펩티드 태그 및 이의 폴리펩티드 결합 파트너 (소위 펩티드 태그/결합 파트너 쌍)는 이소펩티드 결합을 자발적으로 형성할 수 있는 단백질 (이소펩티드 단백질)로부터 유래될 수 있고, 상기 단백질의 도메인은 개별적으로 발현되어 이소펩티드 결합에 관여된 잔기들 중 하나 (예: 아스파르테이트 또는 아스파라긴, 또는 리신)를 포함하는 펩티드 "태그" 및 이소펩티드 결합에 관여된 다른 잔기 (예: 리신, 또는 아스파르테이트 또는 아스파라긴) 및 이소펩티드 결합을 형성하는데 필요한 적어도 하나의 다른 잔기 (예: 글루타메이트)를 포함하는 펩티드 또는 폴리펩티드 결합 파트너 (또는 "캐처")를 생성한다. 상기 펩티드 태그 및 결합 파트너를 혼합하면 상기 태그 및 결합 파트너 간 이소펩티드 결합이 자발적으로 형성된다. 따라서, 상기 펩티드 태그 및 결합 파트너를 상이한 분자들 또는 성분들, 예컨대 단백질에 개별적으로 혼입함으로써, 상기 펩티드 태그 및 결합 파트너 간에 형성된 이소펩티드 결합을 통해 상기 분자들 또는 성분들을 함께 공유적으로 연결하는, 즉 상기 펩티드 태그 및 결합 파트너를 혼입하여 분자들 또는 성분들 간에 링커를 형성하는 것이 가능하다.
상기 이소펩티드 결합의 자발적인 형성은 단리될 수 있으며, 임의의 다른 실재물 (entity)을 부가할 필요가 없다. 일부 펩티드 태그 및 태그 파트너 쌍의 경우, 이소펩티드 결합을 생성하기 위해 리가제와 같은 헬퍼 실재물의 존재를 필요로 할 수 있다.
SpyTag/SpyCatcher라고 하는 펩티드 태그/결합 파트너 쌍 (2-부분 링커)은 스트렙토코쿠스 피오게네스 (Streptococcus pyogenes) FbaB 단백질의 CnaB2 도메인으로부터 유래되었고 (Zakeri et al., 2012, Proc Natl Acad Sci U S A 109, E690-697), 백신 개발을 포함한 다양한 응용 분야에 사용되었다 (Brune et al., 2016, Scientific reports 6, 19234; Thrane et al., 2016, Journal of Nanobiotechnology 14, 30).
적절하게는, 상기 제1 및 제2 펩티드 태그는 SpyTag/SpyCatcher라는 펩티드 태그/결합 쌍을 형성한다. 적절하게는, 상기 SpyCatcher 성분은 DeltaN1 (ΔN1) SpyCatcher이고 (Li, L., Fierer, J. O., Rapoport, T. A. & Howarth, M. Structural analysis and optimization of the covalent association between SpyCatcher and a peptide Tag. J. Mol . Biol . 426, 309-317 (2014)에 기재된 바와 같음), 이는 "SpyCatcher" (서열 번호: 38)와 비교하여 N-말단에서 23개의 아미노산 절단을 갖는다.
다른 구체예에서, 상기 제1 및 제2 펩티드 태그는 예를 들어 공동 계류 중인 출원 GB1706430.4에 기재된 것과 같이, 이소펩티드 결합 형성에 대해 증가된 반응 속도를 나타내는 SpyTag/SpyCatcher의 돌연변이된 버전인 펩티드 태그/결합 쌍을 형성한다. 일부 구체예에서, 이러한 돌연변이된 형태는 큰 단백질 (예: >50 kDa 또는>100 kDa, 예컨대 본원에 기재된 >160 kDa HCMV 5량체 단백질)의 부착, 및/또는 느린 반응 또는 입체 장애가 발생할 수 있는 경우에 유용할 수 있다.
다른 구체예에서, 상기 이소펩티드 단백질은 예를 들어 WO 2016/193746에 기재된 SnoopTag/SnoopCatcher를 포함할 수 있다.
일부 구체예에서, 상기 이소펩티드 단백질 중 하나 또는 모두는 상기 이소펩티드 결합의 반응성을 여전히 유지하면서, N- 또는 C-말단 절단을 가질 수 있다.
예시되는 제1 및 제2 펩티드 태그 쌍 (펩티드 태그/결합 파트너 쌍; 반응성 쌍)은 하기 표에 기재되어 있다:
예를 들어, WO2011/098772, WO2016/193746, GB1706430.4, GB 1705750.6 또는 Li, L., et al., J. Mol. Biol. 426, 309-317 (2014)에 기재되어 있다.
상기 결합 쌍의 변이체, 유도체 및 변형은 임의의 적절한 수단에 의해 제조될 수 있다. 변이체, 유도체 및 기능적으로 작동하는 변형은 관련 결합 파트너와 이소펩티드 결합을 형성하는 능력과 관련하여 동일한 기능을 유지하는 아미노산 부가, 치환, 변경 또는 결실을 포함할 수 있다.
일부 결합 쌍의 경우, 효소와 같은 제3 실재물에 의한 매개가 요구된다. 예를 들어, SnoopLigase는 SnoopTagJr 및 DogTag 간 결합 형성을 매개하는데 사용될 수 있다. 따라서, 페어링 (pairing)에 리가제와 같은 효소의 도움이 필요할 수 있다.
HBsAg
"HBsAg"는 B형 간염 바이러스 (HBsAg)로부터의 표면 항원 또는 이의 일부를 의미하다. 일 구체예에서, HBsAg는 B형 간염 바이러스 (adw 혈청형)의 S 단백질의 226개 아미노산을 포함하는, HBsAg, 예컨대 서열 번호: 41로 제시된 HBsAg 서열의 N-말단을 지칭할 수 있다. 적절하게는, 상기 HBsAg는 B형 간염 바이러스 (adw 혈청형) preS2 단백질의 4개의 카복시 말단 잔기를 나타내는 4개의 아미노산 서열인 Pro Val Thr Asn을 포함하고, Valenzuela et al., (1979) 'Nucleotide sequence of the gene coding for the major protein of hepatitis B virus surface antigen' Nature 280:815-819에 기재된 바와 같다. HBsAg로부터 형성된 VLP는 B형 간염에 대해 임상적 사용이 승인되었고 (Kushnir et al. Vaccine 2012; Vol 31(1):58-83), Recombivax HB (https://vaccines.procon.org/sourcefiles/recombivax_package_insert.pdf), 및 Energix B (https://au.gsk.com/media/217195/engerix-b_pi_006_approved.pdf)를 포함한다. HBsAg는 또한 전-적혈구형 말라리아 백신 (pre-erythrocytic malaria vaccine) RTS,S에 대한 기초로 사용되어 왔고, 이는 임상 3상 시험을 완료하고 현재까지 가장 진보된 말라리아 백신이다 (http://www.malariavaccine.org/sites/www.malariavaccine.org/files/content/page/files/RTSS%20FAQs_FINAL.pdf; Kaslow and Biernaux, Vaccine 2015, Vol. 33(52): 7425-7432).
링커 세부정보
단백질들 (예: VLP 및 장식 항원) 간 거리는 단백질에서 항원성 에피토프의 이용가능성, 단백질/들의 안정성에 영향을 줄 수 있고, 또한 이소펩티드 결합 파트너들 (예: SpyTag/SpyCatcher) 중 하나의 접근성으로 인해 접합 효율에도 영향을 줄 수 있다. 그러므로 이용가능성, 안정성 및/또는 접근성을 최적화하기 위해 적절한 특성을 가진 링커를 선택할 수 있다. 링커는 가요성 및 견고한 서브타입들로 크게 세분화될 수 있다.
가요성
링커
연결된 도메인들이 이동이 필요한 경우 가요성 링커를 사용할 수 있다. 일반적으로 이들은 작은 비-극성 (예: Gly) 또는 극성 (예: Ser, Thr) 아미노산으로 구성되고, 작은 크기는 가요성을 제공한다 (Chen et al., 2013 Adv Drug Deliv Rev. Oct 15; 65(10): 1357-1369). Ser 또는 Thr의 부가는 용액의 안정성을 유지하는데 도움이 될 수 있고, 길이를 조정하면 단백질의 적절한 폴딩에 영향을 줄 수 있다 (Chen et al., 2013). 관련 실재물에 적합한 특성 및 길이를 가진 임의의 적절한 가요성 링커를 사용할 수 있다. 적절하게는, 가요성 링커는 이러한 타입의 2개 내지 70개의 아미노산들 간의 조합을 포함할 수 있다.
견고한 링커
일부 경우에, 견고한 링커가 선호될 수 있고, 이들은 단백질 분리를 제공하는데 도움이 될 수 있기 때문이다. 견고한 링커는 2차 구조를 갖는다. 가장 일반적인 견고한 링커들 중 하나는 α-나선 구조를 채택하는 (EAAAK)n (여기서 n은 반복 횟수)이다 (Arai et al., (2001) Protein Eng. Aug;14(8):529-32). 다른 견고한 링커는 (XP)n과 같은 프롤린 풍부 서열을 포함할 수 있고, 여기서 X는 임의의 아미노산이지만 우선적으로는 Ala (A), Lys (K) 또는 Glu (E)이며, 여기서 프롤린은 입체형태적 제약 (conformational constraint)을 제공하다 (Chen at al., 2013).
다른 적절한 링커는 예를 들어 Klein et al. (2014) Protein Eng Des Sel. Oct; 27(10): 325-330에 기재되어 있다. 관련 실재물에 적합한 특성 및 길이를 가진 임의의 적절한 견고한 링커를 사용할 수 있다. 적절하게는, 견고한 링커는 이러한 타입의 2개 내지 70개 아미노산들 간의 조합을 포함할 수 있다.
숙주 세포 및 발현 벡터
본 발명에 따른 단백질 및 조성물을 제조하기 위해 핵산의 발현에 적절한 숙주 세포는 당업자에게 알려져 있다.
일 구체예에서, 상기 숙주 세포는 일시적 발현에 적절할 것이다. 다른 구체예에서, 숙주 세포는 안정한 세포주를 형성할 수 있는 세포일 것이다. 적절하게는, 이소펩티드 결합을 형성하는 펩티드 태그를 포함하는, HCMV 5량체 및 RSV-F 단백질과 같은 항원성 성분을 코딩하는 코딩 서열이 하나의 숙주 세포에 통합될 것이다. 일 구체예에서, 5량체와 같은 다량체의 서브유닛을 코딩하는 각 핵산 서열은 상이한 플라스미드/벡터에 포함되어, 예를 들어 5개의 플라스미드/벡터 모두로 숙주 세포를 형질감염시켜서 이를 적절한 조건에서 배양할 때 숙주 세포에 의해 5량체의 생성을 유도할 것이다. 다른 구체예에서, 플라스미드/벡터는 적어도 1, 2, 3, 4 또는 5개의 플라스미드가 도입될 수 있도록 하나 이상의 코딩 서열의 조합을 포함할 수 있다. 대안으로서, 전체 단백질 성분 및 제1 펩티드 태그가 동일한 벡터에서 코딩되도록, 전체 융합 펩티드 코딩 서열이 하나의 벡터에 제공될 수 있다.
일 구체예에서, 이들 벡터는 코딩 서열을 숙주 세포의 게놈으로 안정하게 통합시키는데 사용된다. 안정적인 발현에 적합한 숙주 세포는 포유류 세포, 예컨대 HEK 세포 (인간 배아 신장 293 세포) 또는 CHO (Chinese Hamster Ovary) 세포를 포함하는 설치류 세포 (rodent cells)를 포함한다. 본 발명에 따른 조성물의 단백질 성분의 발현에 적합한 포유류 세포 및 벡터는 당업자에게 알려져 있고, 예를 들어 WO2016/067239, 페이지 15-16 및 Hofmann et al., (2015) Biotech and Bioeng, 112(12):2505-2515에 기재되어 있다. 본 발명에 따른 성분들의 발현을 위해 예시되는 안정한 구조체 서열은 하기 실시예 3에서 찾을 수 있다.
친화도 정제
일부 구체예에서, 본 발명에 따른 조성물의 성분들을 발현시키는데 사용하기 위한 이러한 발현 구조체는 친화도 정제와 같은 정제를 용이하게 하는 "태그" 서열 또는 서열들을 포함할 수 있다. 친화성 태그 (affinity tag)와 같은 임의의 적절한 태그는 생성된 시스템으로부터 단백질 성분 및 제1 펩티드 태그를 분리하기 위해 포함될 수 있다. 재조합 단백질 제조 분야의 숙련자는 정제 목적을 위해 포함될 수 있는 His-태그 및 Strep-태그와 같은 시스템을 알고 있다. 이러한 태그는 단백질 정제에 극적으로 도움이 되고, 생물학적 또는 생화학적 활성에 유해한 영향을 거의 주지 않으므로 바람직하다. 적절한 태그 서열은 C-태그, 히스티딘 태그 (His-태그), 스트렙타비딘 태그 (Strep-태그), 말토스-결합 단백질 (MBP), 글루타티온-S-트란스퍼라제 (GST) 및 FLAG 태그를 포함한다.
상기 단백질 성분 및/또는 모이어티 모두는 친화성 정제 태그를 포함할 수 있다. 용이한 사용을 위해, 이들은 일반적으로 단백질의 C- 또는 N-말단에서 유전적으로 융합된다.
그러므로 일부 구체예에서, 예를 들어, HCMV의 gH, gL, pUL128, pUL130, pUL131A (또는 이의 단편) 서브유닛, RSV 융합-전 F 단백질, 또는 HBsAg 펩티드/단백질은 N- 또는 C-말단에서 추가의 아미노산 잔기를 포함할 수 있고, 이는 정제를 용이하게 한다. 이러한 추가의 아미노산 잔기는 예를 들어 His-태그 또는 C-태그와 같은 태그를 포함할 수 있다. 일부 구체예에서, C-태그는 더 깨끗한 정제를 제공할 수 있다. 다른 적절한 태그 서열은 말토스-결합 단백질 (MBP), Strep-태그, 글루타티온-S-트란스퍼라제 (GST) 및 FLAG 태그를 포함한다. 일부 구체예에서, 태그는 예를 들어 절단 가능한 링커를 사용하여 정제 후에 절단될 수 있는 방식으로 아미노산 서열에 연결될 수 있다. 다른 구체예에서, 비-친화성 정제 방법이 사용될 수 있다.
다른 구체예에서, 상기 RSV 융합-전 F 단백질은 C- 또는 N-말단에 추가의 아미노산 잔기를 포함할 수 있고, 이는 정제를 용이하게 한다. 본원에 예시된 RSV 융합-전 F 단백질은 친화도 정제를 위한 C-태그를 갖는다.
제1 및 제2 펩티드 태그 쌍의 접합
상기 제1 및 제2 펩티드 태그/결합 파트너/반응성 쌍의 접합은 4℃에서 밤새 수행될 수 있다. 대안으로서, 상기 접합 반응은 커플링 속도가 실온에서 증가할 것으로 예상되기 때문에 실온에서 3-4시간 동안 수행될 수 있다. 주어진 커플링 반응에 대한 최적의 제1 및 제2 결합 파트너 비율은 각 결합 파트너의 크기에 따라 다르다. 예를 들어, VLP 모노머 대 항원의 1:1.5 몰비 (molar ratio)는 더 작은 항원 (~ 20 kDa)의 경우에 충분할 수 있는 반면, 1:1의 질량비 (mass ratio)는 동일한 VLP 단량체와 조합에서 더 큰 항원 (> 100 kDa)의 경우에 충분할 수 있다. 그러나 비율들 모두는 과도한 항원 (더 작은 결합 파트너)을 초래한다. 임의의 과도한 항원은 예를 들어 크기 배제 크로마토그래피 (SEC) 또는 투석에 의해 제거될 수 있다. 투석은 SEC 만큼 효과적이지 않기 때문에 더 작은 항원에 더 적합할 수 있다. 대안으로서, 항원에 대한 VLP/입자의 비율은 모든 항원이 접합되어서 다운스트림 정제가 필요하지 않도록 최적화될 수 있다. 대략 1 mg/ml의 적절한 최종 단백질 농도가 접합 반응에 최적이고, 농도가 낮을수록 반응 속도는 감소될 수 있다. 중성 pH 부근의 광범위한 버퍼가 커플링/접합에 적합하다. 접합 버퍼의 표준 선택은 TBS (20 mM Tris 및 150 mM NaCl, pH 7.4)이다. 일부 경우에, Brune et al. Sci Rep. (2016)에 기재된 바와 같이 시트레이트 버퍼 (40 mM Na2HPO4, 200 mM 소듐 시트레이트, pH 6.2)의 10x 스톡의 부가가 사용될 수 있다.
약학적 조성물 및 용도
본 발명의 조성물은 백신 또는 면역원성 조성물로 혼입될 수 있다. 적절하게는, 백신 또는 면역원성 조성물은 본 발명의 입자를 면역원성 용량으로 포함할 것이다.
약학적 조성물은 약학적으로 허용 가능한 담체와 함께 제공된 본 발명에 따른 입자 또는 면역원성 조성물을 포함할 수 있다. 적절한 담체는 당업자에게 잘 알려져 있다. 일 구체예에서, 약학적 조성물은 버퍼, 부형제 또는 담체를 포함한다. 적절하게는, 약학적 조성물은 조성물의 안정성을 유지하는데 적절한 부형제 및 제제를 포함할 수 있다. 적절하게는, 상기 제제는 아쥬반트를 포함할 수 있다. 일 구체예에서, 상기 제제는 MF59®와 유사한 제제를 갖는 AddaVax™ 또는 유사한 스쿠알렌-기반 수중유형 나노-에멀젼을 포함할 수 있다. 다른 적절한 아쥬반트는 Matrix M 및 AS01과 같은 리포좀-기반 아쥬반트를 포함한다. 다른 적합한 아쥬반트는 Alhydrogel®과 같은 알루미늄-기반 제제를 포함한다. 일 구체예에서, 상기 제제는 예를 들어 5 mM 농도의 EDTA를 포함할 수 있다. 적합한 부형제 또는 제제는 입자 또는 면역원성 조성물의 특성에 따라 달라질 수 있고; 예를 들어, 발현 시스템의 선택은 조성물 중 단백질의 안정성, 글리코실화 또는 폴딩에 영향을 줄 수 있으며, 이는 결국 조성물의 최적인 제제에 영향을 줄 수 있다. 적절한 부형제, 제제 또는 아쥬반트의 결정 방법은 당업자에게 알려져 있다.
본 발명의 다양한 추가 양상 및 구체예는 본 개시내용을 고려하여 당업자에게 명백할 것이다.
본 명세서에 언급된 모든 문헌은 그 전체가 참조로 본원에 통합된다.
본원에 사용되는 "및/또는"은 2개의 명시된 특징들 또는 성분들 각각을 서로 포함하거나 또는 포함하지 않는 특정 개시내용으로 간주되어야 한다. 예를 들어, "A 및/또는 B"는 (i) A, (ii) B 및 (iii) A 및 B 각각의 특정 개시내용으로, 각각이 본원에서 개별적으로 제시된 것처럼 간주되어야 한다.
문맥에서 달리 지시하지 않는 한, 상기에 제시된 특징들의 설명 및 정의는 본 발명의 임의의 특정 양상 또는 구체예로 제한되지 않으며, 기재된 모든 양상 및 구체예에 동일하게 적용된다.
본 발명이 몇몇 구체예를 참조하여 예로서 기재되었다는 것을 당업자는 또한 이해할 것이다. 이는 개시된 구체예에 제한되지 않으며, 첨부된 청구범위에 정의된 바와 같이 본 발명의 범위를 벗어나지 않고 대체 구체예가 구성될 수 있다.
폴리뉴클레오티드를 설명하기 위해 본원에서 사용되는 "재조합 (recombinant)"은 그 기원 또는 조작으로 인해 하기와 같은 게놈, cDNA, 반합성 또는 합성 기원의 폴리뉴클레오티드를 의미한다: (1) 본질적으로 결합되어 있는 폴리뉴클레오티드의 전부 또는 일부와 결합되지 않음; 및/또는 (2) 본질적으로 연결되어 있는 것 이외의 폴리뉴클레오티드에 연결됨. 단백질 또는 폴리펩티드와 관련하여 사용되는 용어 "재조합"은 재조합 폴리뉴클레오티드의 발현에 의해 생성된 폴리펩티드를 의미한다.
구체적으로 언급되지 않는 한, 단계들을 포함하는 방법은 임의의 적절한 순서로 수행될 수 있다. 따라서, 단계들은 임의의 적합한 순서로 수행될 수 있다.
폴리펩티드 서열들 간의 서열 동일성은 바람직하게는 디폴트 파라미터 (예컨대, 갭 개방 페널티 (Gap opening penalty) = 10.0 및 갭 확장 페널티 (Gap extension penalty) = 0.5, EBLOSUM62 스코어링 매트릭스 사용)를 사용하는, Needleman-Wunsch 글로벌 정렬 알고리즘 (Needleman and Wunsch 1970)을 사용하는 쌍별 정렬 알고리즘 (pairwise alignment algorithm)에 의해 결정된다. 이러한 알고리즘은 EMBOSS 패키지 (Rice, Longden and Bleasby 2000)의 니들 툴 (needle tool)로 편리하게 구현된다. 서열 동일성은 본 발명의 폴리펩티드 서열의 전체 길이에 걸쳐 계산되어야 한다.
본원에 언급된 성분들의 임의의 상동체 (homologues)는 전형적으로 기능적 상동체이고, 전형적으로 단백질의 관련 영역에 대해 적어도 40% 상동성이다. 상동성은 알려진 방법을 사용하여 측정될 수 있다. 예를 들어 상기 UWGCG 패키지는 상 동성을 계산하는데 사용될 수 있는 BESTFIT 프로그램을 제공한다 (예를 들어 그의 디폴트 설정으로 사용) (Devereux et al (1984) Nucleic Acids Research 12, 387-395). PILEUP 및 BLAST 알고리즘은 예를 들어 Altschul S. F. (1993) J Mol Evol 36:290-300; Altschul, S, F et al (1990) J Mol Biol 215:403-10에 기재된 바와 같이, 상동성 또는 정렬 서열 (전형적으로 이들의 디폴트 설정에서)을 계산하는데 사용될 수 있다. BLAST 분석을 수행하기 위한 소프트웨어는 National Center for Biotechnology Information (http://www.ncbi.nlm.nih.gov/)을 통해 공개적으로 입수할 수 있다.
BLAST 알고리즘은 2개의 서열들 간 유사성에 대한 통계 분석을 수행한다; 예를 들어, Karlin and Altschul (1993) Proc. Natl. Acad. Sci. USA 90: 5873-5787을 참조한다. BLAST 알고리즘에 의해 제공되는 유사성의 한 가지 척도는 최소 합 확률 (P(N))이고, 이는 2개의 뉴클레오티드 또는 아미노산 서열들 간에 일치가 우연히 발생할 확률을 나타낸다. 예를 들어, 제1 서열과 제2 서열의 비교에서 최소 합 확률이 약 1 미만, 바람직하게는 약 0.1 미만, 더 바람직하게는 약 0.01 미만, 가장 바람직하게는 약 0.001 미만인 경우, 서열은 다른 서열과 유사한 것으로 간주된다.
변이체 폴리펩티드는 천연 단백질과 적어도 40% 동일성을 갖는 서열을 포함한다 (또는 구성된다). 바람직한 구체예에서, 변이체 서열은 천연 단백질의 특정 영역에 대해 적어도 20개, 바람직하게는 적어도 30개, 예를 들어 적어도 40, 60, 100, 200, 300, 400개 또는 초과의 인접한 아미노산들에 대해, 또는 심지어 상기 변이체의 전체 서열에 대해 적어도 55%, 65%, 70%, 75%, 80%, 85%, 90%, 더욱 바람직하게는 적어도 95%, 97% 또는 99%의 상동성일 수 있다. 대안으로서, 상기 변이체 서열은 전장 천연 단백질에 대해 적어도 55%, 65%, 70%, 75%, 80%, 85%, 90%, 보다 바람직하게는 적어도 95%, 97% 또는 99%의 상동성일 수 있다. 전형적으로 상기 변이체 서열은 천연 단백질의 관련 영역과, 적어도 2, 5, 10, 20, 40, 50 또는 60개 미만의 돌연변이 만큼 다를 수 있다 (각각은 치환, 삽입 또는 결실일 수 있음). 본 발명의 변이체 서열은 전장 천연 단백질의 특정 영역과 동일성 퍼센트를 가질 수 있고, 이는 상기에 언급된 서열의 길이에 걸쳐서 임의의 특정 퍼센트의 상동성 값과 동일하다 (즉, 이는 적어도 40%, 55%, 80% 또는 90%, 더 바람직하게는 적어도 95%, 97% 또는 99% 동일성을 가질 수 있음).
상기 단백질의 변이체는 또한 절단 (truncations)을 포함한다. 상기 변이체가 여전히 기능적인 한 임의의 절단이 사용될 수 있다. 절단이 전형적으로 수행되어 활성/기능, 특히 이소펩티드 결합 형성에 필수적이지 않고 및/또는 폴딩된 단백질의 입체형태, 특히 임의의 면역원성 부위의 폴딩에 영향을 주지 않는 서열을 제거할 것이다. 상기 성분들의 제조를 용이하게 하기 위해 절단이 또한 선택될 수 있다. 적절한 절단은 N- 또는 C-말단으로부터 다양한 길이의 서열을 체계적으로 절단하여 일상적으로 확인될 수 있다.
상기 천연 단백질의 변이체는 천연 단백질의 특정 영역에 대해 하나 이상, 예를 들어 2, 3, 4, 5 내지 10, 10 내지 20, 20 내지 40개 이상의 아미노산 삽입, 치환 또는 결실을 가진 돌연변이체를 추가로 포함한다. 결실 및 삽입은 바람직하게는 항원성 영역 외부에서 수행된다. 삽입은 전형적으로 예를 들어 재조합 발현의 목적을 위해, 천연 단백질로부터 유래된 서열의 N- 또는 C-말단 단부에서 수행된다. 치환은 또한 전형적으로 활성/기능에 필수적이지 않고 및/또는 폴딩된 단백질의 입체형태에 영향을 주지 않는 영역에서 수행된다. 단백질의 가용성 또는 다른 특징들을 개선하기 위해 이러한 치환이 수행될 수 있다. 상기 단백질의 안정성을 증가시키기 위해 치환이 수행될 수 있다.
치환은 바람직하게는 아미노산을 유사한 화학 구조, 유사한 화학적 특성 또는 유사한 측쇄 부피의 다른 아미노산으로 대체하는, 하나 이상의 보존적 변화를 도입한다. 도입된 아미노산은 그들이 대체하는 아미노산과 유사한 극성, 친수성, 소수성, 염기도, 산도, 중성도 또는 전하를 가질 수 있다. 대안으로서, 상기 보존적 변화는 기존의 방향족 또는 지방족 아미노산 대신에 방향족 또는 지방족인 다른 아미노산을 도입할 수 있다. 보존적 아미노산 변화는 당 분야에 잘 알려져 있다.
유도체는 모체 실재물의 일부분의 대체에 의해, 모체 실재물로부터 유래하거나 또는 만들어진 실재물이다.
실시예
실시예
1
예시되는
다량체
-
VLP
조성물 (
HCMV
5량체
-
HBsAg
VLP
)의 생성
HCMV 5량체는 ExpiFectamine™ 293 형질감염 시약 (ThermoFisher Scientific) 및 하기 서열을 코딩하는 5개의 개별 플라스미드를 사용하여 Expi293F 세포에서 일시적으로 발현되었다. 하기에 기재된 HCMV 5량체는 대략 162 kDa으로, 글리코실화되지 않았다 (태그 및 링커를 포함하지만, 신호 펩티드는 제외).
뉴클레오티드 서열
발현된 HCMV 5량체 서열은 Merlin 균주 (GenBank: AY446894.2; 낮은-계대 (즉, 약독화된) HCMV 균주) (인트론 포함) 유래의 천연 서열을 나타내며, 하기 관련 구절에 기재된 2개의 도입된 돌연변이 (gH에서 하나, UL128에서 하나)는 제외된다.
gH
-
SpyTag
-His 뉴클레오티드 서열 (서열 번호: 12)
본 서열 (서열 번호: 12)에서, GeneArt® 합성을 위해 위치 1146에서 침묵 돌연변이 C>A가 도입되었고, 이러한 뉴클레오티드 주변의 천연 서열 CACCTGC가 문제 가능성이 있는 것으로 표시되었기 때문이다. 구조체는 하기를 포함한다: 신호 펩티드 (nt 1-69), 엑토도메인 (nt 70-2151), 막관통 도메인 (절단됨) (nt 2152-2157), (신호 펩티드, 엑토도메인 및 막관통 도메인 (절단됨)이 함께 서열 번호: 13으로 표시됨), 링커 (nt 2158-2175; 서열 번호: 14), SpyTag (nt 2176-2214; 서열 번호: 15), 6x His 태그 (nt 2215-2232), 정지 코돈 (nt 2233-2235). 뉴클레오티드 1 내지 2157 (서열 번호: 13)은 gH 코딩 서열을 나타낸다.
gL
뉴클레오티드 서열 (서열 번호: 16)
본 서열에서: 신호 펩티드 (nt 1-90), 엑토도메인 (nt 91-834), 정지 코돈 (nt 835-837).
UL130-C-태그 뉴클레오티드 서열 (서열 번호: 17)
본 서열에서: 신호 펩티드 (nt 1-75), 엑토도메인 (nt 76-642), 링커 (nt 643-687), C-태그 (nt 688-699), 정지 코돈 (nt 700-702).
UL128 뉴클레오티드 서열 (서열 번호: 20) (천연 서열에 존재하는 2개의
인트론
포함)
본 서열에서: 신호 펩티드 (nt 1-81), 인트론: nt 165-287, nt 423-542, 엑토도메인 엑손 (nt 82-164, nt 288-422, nt 543-756), 정지 코돈 (nt 757-759).
T>C 돌연변이는 뉴클레오티드 634에서 도입되었다. T634 뉴클레오티드는 Merlin 균주에서 UL128의 조기 종료를 유발하는 것으로 GenBank 파일에 언급되었으므로, 본 발명자는 전장 단백질의 발현으로 복귀시키는데 어떤 염기가 치환되었는지를 알기 위해 다른 균주 (GenBank: GQ396662.1, 균주 HAN38)의 주석을 사용하였다.
UL131A
뉴클레오티드 서열 (서열 번호: 21) (천연 서열에 존재하는
인트론
포함)
본 서열에서: 신호 펩티드 (nt 1-54), 인트론 (nt 237-344, 엑토도메인 엑손 (nt 55-236, nt 345-495), 정지 코돈 (nt 496-498)).
SpyCatcher
-
HBsAg
뉴클레오티드 서열 (서열 번호: 22)
본 서열에서: SpyCatcherDeltaN1 (nt 1-276), 가요성 링커 (nt 277-303), PVTN 링커 (nt 304-315), HBsAg (nt 316-993), C-태그 (nt 994-1005), 정지 코돈 (nt 1006-1008).
아미노산 서열
상기 뉴클레오티드 서열의 발현은 하기 아미노산 서열을 유도할 것으로 예상된다.
gH
-
SpyTag
-His 아미노산 서열 (서열 번호: 27)
예상 질량 81.852 kDa (신호 펩티드 제외), 84.364 kDa (신호 펩티드 포함).
본 서열에서: 신호 펩티드 (aa 1-23), 엑토도메인 (aa 24-717), 막관통 도메인 (절단됨) (aa 718-719)) (신호 펩티드, 엑토도메인 및 막관통 도메인 (절단됨)이 함께 서열 번호: 28로 표시됨), 링커 (aa 720-725; 서열 번호: 29), SpyTag (aa 726-738; 서열 번호: 30), 6x His 태그 (aa 739-744). 아미노산 잔기 1-719는 절단된 TM 도메인 (서열 번호: 28)을 가진 천연 Merlin 균주 gH 아미노산 서열을 나타낸다.
gL
아미노산 서열 (서열 번호: 31)
예상 질량 27.522 kDa (신호 펩티드 제외), 30.815 kDa (신호 펩티드 포함).
본 서열에서: 신호 펩티드 (aa 1-30), 엑토도메인 (aa 31-278). 아미노산 잔기 1-278은 천연 Merlin 균주 gL 아미노산 서열을 나타낸다.
UL130-C-태그 아미노산 서열 (서열 번호: 32)
예상 질량 23.167 kDa (신호 펩티드 제외), 26.081 kDa (신호 펩티드 포함).
본 서열에서: 신호 펩티드 (aa 1-25), 엑토도메인 (aa 26-214), (신호 펩티드 및 엑토도메인은 함께 서열 번호: 33으로 표시됨), 링커 (aa 215-229; 서열 번호: 34), C-태그 (aa 230-233).
아미노산 잔기 1-214는 천연 Merlin 균주 UL130 아미노산 서열을 나타낸다.
UL128 아미노산 서열 (서열 번호: 35)
예상 질량 16.659 kDa (신호 펩티드 제외), 19.717 kDa (신호 펩티드 포함).
본 서열에서: 신호 펩티드 (aa 1-27), 엑토도메인 (aa 28-171). 아미노산 잔기 1-171은 천연 Merlin 균주 UL128 아미노산 서열을 나타낸다.
UL131A
아미노산 서열 (서열 번호: 36)
예상 질량 12.985 kDa (신호 펩티드 제외), 14.989 kDa (신호 펩티드 포함).
상기 서열에서: 신호 펩티드 (aa 1-18), 엑토도메인 (aa 19-129). 아미노산 잔기 1-129는 천연 Merlin 균주 UL131A 아미노산 서열을 나타낸다.
SpyCatcher
-
HBsAg
아미노산 서열 (서열 번호: 37)
태그 및 링커를 포함한 예상 질량 36.824 kDa.
본 서열에서: SpyCatcherDeltaN1 (aa 1-92; 서열 번호: 38), 가요성 링커 (aa 93-101; 서열 번호: 39), PVTN 링커 (aa 102-105; 서열 번호: 40), HBsAg (aa 106-331; 서열 번호: 41), C-태그 (aa 332-335).
5량체의
정제
5량체-SpyTag는 EXPI293F 세포에서 발현되고 상등액으로 분비되었다 (gH 서브유닛으로부터 TM 도메인 (의 일부)의 결실로 인해). HCMV 5량체를 정제하기 위해 친 화도 정제를 사용하려는 초기 시도는 C-태그가 있는 gH 서브유닛의 발현에 의존하지만, 이로 인해 5량체뿐만 아니라 gH/gL 헤테로 동종이량체도 단리되었다. 대안의 전략에서, C-태그를 UL130 서브유닛 (서열 번호: 17 (뉴클레오티드) 및 서열 번호: 32 (아미노산))에 부가하여 C-태그 친화도 정제 (ThermoFisher) 및 크기 배제 크로마토그래피를 사용하여 상등액으로부터 5량체를 정제하였다. 상기 5량체는 SDS-PAGE로 분석했을 때 비-환원 및 환원 조건하에 예상대로 나타났고 (도 1의 A), 항-HCMV 5량체 항체 (Native Antigen Company (AbCMV2450))와 반응하였고 (도 1의 B), 경미한 오염물질이 ~14 kDa에서 관찰되었다.
HBsAg
VLP
모노머의 정제
SpyCatcher-HBsAg는 피키아 파스토리스 (Pichia pastoris)에서 발현되고, 세포 균질물로부터 정제되었다. SDS-PAGE 겔의 환원 조건하에, 우세한 단백질 밴드는 예상된 크기의 단량체 (대략 37 kDa)에 해당하고, 추가의 더 큰 밴드는 올리고머 종의 존재를 나타내며, 이는 입자의 가교가 양호하게 발생하였음을 나타낸다 (도 2의 A, 레인 'R'). 비-환원 조건 (레인 'NR')하에, 상기 물질은 주로 겔 상단에 약간의 얼룩과 함께 남아있고, 이는 VLP 입자가 잘 형성되어, 너무 커서 겔로 완전히 이동하기가 어렵다는 것을 나타낸다 (도 2의 A). 비-환원 및 환원된 SpyCatcher-HBsAg 모두는 마우스 항-HBsAg 모노클로날 항체 (Bio-Rad (MCA4658)로부터 입수)와 강하게 반응하였고 (도 2의 B), 이는 SpyCatcher의 존재가 반응성 에피토프에 부정적인 영향을 미치지 않았음을 나타낸다.
HCMV 5량체-SpyTag 및 SpyCatcher-HBsAg 모두는 s200increase 3.2/300 컬럼에서 HPLC 크기 배제 분석에 의해 평가된 바와 같이 단일 피크로 용출되었다 (도 3의 A-B). HCMV 5량체-SpyTag는 예상보다 더 큰 ~400 kDa에서 용출되었다 (도 3의 A). 그러나 이는 크기 배제 크로마토그래피 중에 단백질의 체류 시간을 변경하는 것으로 알려진 5량체의 구조가 구형이 아닌 것으로 설명될 수 있다. SpyCatcher-HBsAg는 컬럼의 공극 부피에서 용출되었고, 이는 상기 입자가 용액 중에 검출 가능한 단량체 없이 적절하게 형성되었음을 나타낸다 (도 3의 B).
항원-
VLP
접합
HCMV 5량체-SpyTag를 4℃에서 밤새 SpyCatcher-HBsAg에 접합시켜서 HCMV-5량체로 코팅된 HBsAg VLP를 생성하였다. 5 mM EDTA가 보충된 Tris 완충 식염수 (TBS; 20 mM Tris 및 150 mM NaCl, pH 7.4)를 함유하는 버퍼를 접합에 사용하였다. 접합은 SDS-PAGE 및 웨스턴-블롯 분석 및 HPLC를 사용하여 모니터링하였다. 상기 접합 반응을 5량체-SpyTag 또는 SpyCatcher-HBsAg 단독과 비교했을 때, 환원 조건 (도 4의 A, 레인 2)하에 ~130 kDa에서 새로운 밴드가 존재하였고, 이는 모노클로날 항-HBsAg (도 4의 B) 및 폴리클로날 항-HCMV 5량체 (도 4의 C) 항체들 모두와 반응하며, 이는 접합된 HBsAg-gH를 적어도 함유하고 있음을 나타낸다. HPLC 크기 배제 크로마토그래피로 분석한 경우, 접합된 HCMV 5량체-HBsAg 단량체의 예상 크기에 해당하는 주 피크에서 97% 용출되었다 (도 5).
실시예
2
HCMV
-
SpyTag
--
SpyCatcher
-
HBsAg
VLP의
인 비보 테스트 (
아쥬반트
사용)
접합된 HCMV 5량체-HBsAg VLP 및 비접합된 HCMV 5량체-SpyTag를 BALB/c 마우스를 사용한 면역화 일정에 사용하여, (i) 생성된 HCMV 5량체-SpyTag의 면역원성을 확인하고, (ii) 접합된 HCMV 5량체-HBsAg VLP에 대해 비접합된 HCMV 5량체-SpyTag의 면역원성을 비교하였다.
3주 간격으로 프라임-부스트-부스트 일정이 하기와 같이 사용되었다:
0일: 면역화 (프라임); 20일: 꼬리 채혈; 21일: 면역화 (부스트 1); 41일: 꼬리 채혈; 42일: 면역화 (부스트 2); 63일: 심장 채혈.
면역화된 그룹은 하기와 같다. 각 그룹에 대해 n = 10:
1) AddaVax™ (Invivogen) 중 1 μg HCMV 5량체-SpyTag
2) AddaVax™ 중 1 μg HCMV 5량체-SpyTag--SpyCatcher-HBsAg VLP (1 μg의 5량체 동등물)
3) AddaVax™ 중 SpyCatcher-HBsAg VLP (그룹 2에서 SpyCatcher-HBsAg의 양으로 정규화됨)
4) AddaVax™ 중 0.1 μg HCMV 5량체-SpyTag
5) AddaVax™ 중 0.1 μg HCMV 5량체-SpyTag--SpyCatcher-HBsAg VLP (0.1 μg의 5량체 동등물)
6) TBS (20 mM Tris 및 150 mM NaCl, pH 7.4)
AddaVax™는 스쿠알렌 기반의 수중유형 나노-에멀젼으로, 유럽에서 아쥬반트 플루 백신 (adjuvanted flu vaccines)에 대해 라이센스를 받은 MF59®와 유사한 제제이다. 스쿠알렌 수중유형 에멀젼은 세포 (Th1) 및 체액 (Th2) 면역 반응 모두를 유발하는 것으로 알려져 있다. 다른 적절한 아쥬반트는 당업자에게 알려져 있다.
ELISA를 사용하여 면역원성을 평가하였다. HCMV 5량체에 대한 표준화된 ELISA를 사용하여 각 그룹에서 생성된 항혈청의 역가를 결정하였다. 플레이트를 5 μg/ml 5량체 (SpyTag 없음), 50 μL/웰로 밤새 코팅하고; 세척하고; 1시간 동안 우유 (milk)로 차단하고; 세척하고; 마우스 혈청 (PBS 중에 적절하게 희석)을 1시간 동안 적용하고; 세척하고; 염소 항-마우스-알칼리 포스파타제 항체 (1:10,000)를 1시간 동안 적용하고; 세척하고; 발생시켰다.
상이한 용량의 비접합된 (그룹 1 및 4) 및 접합된 HCMV 5량체-HBsAg (그룹 2 및 5) 모두를 포함하여 접합된 HCMV 5량체-HBsAg VLP 백신과 비접합된 HCMV 5량체-SpyTag 간 면역원성 비교를 가능하게 하고, 이는 다른 HCMV 5량체 백신 (예: 가용성 5량체)에 외삽하였다. 그룹 3 및 6은 음성 대조군을 나타낸다.
각 시점에서, 샘플에 대한 OD 값을 적절한 희석에서 판독하고, ELISA 유닛을 각 플레이트에서 실행되는 표준 곡선을 사용하여 결정하였다. 프라임 후에, 그룹 1, 2, 4 및 5에 대한 결과를 보여주는 데이터는 도 6에 도시되어 있다. 1 μg 및 0.1 μg 용량 모두를 사용하는 HCMV 5량체-HBsAg 면역화된 마우스는, 1 μg 또는 0.1 μg 용량의 비접합된 HCMV 5량체로 면역화된 마우스와 비교하여, 실질적으로 더 강한 혈청 IgG 항체 반응을 나타낸다. 그룹 3 및 6에 대한 ELISA 유닛은 본 분석에 대한 기준선을 제공하였고, 또한 도 6에 도시하였다.
생성된 항체의 기능적 활성은 Wang et al. (Vaccine 33 (2015) 7254-7261; DOI: 10.1016/j.vaccine.2015.10.110)에 기반한 미세중화 분석 (microneutralisation assay)을 사용하여 연구되었다. 그룹 1, 2, 4 및 5에 대한 중화 역가는 도 7에 도시되어 있다. 5량체-HBsAg VLP로 면역화된 마우스로부터의 혈청은 5량체-SpyTag 단백질 단독으로 면역화된 마우스의 혈청보다 실질적으로 더 많이 중화된다.
실시예
3
안정한 구조체 서열
2개의 안정한 구조체 (Hofmann et al., (2015) Biotech and Bioeng, 112(12):2505-2515로부터 조정됨)가 HCMV 5량체-SpyTag 성분의 CHO 발현에 최적화되었다. 인트론은 HCMV 5량체 서열로부터 제거되었지만, 신호 서열은 유지되었다.
HCMV
gH
-
SpyTag
/
gL
안정한 발현 구조체
EV71 IRES의 상류 및 하류에서 각각 gH-SpyTag-His 성분 (서열 번호: 42) 및 gL 성분 (서열 번호: 43)을 포함하도록 안정한 벡터 구조체 HCMV-gH-(GSG)2-SpyTag-His-IRES-gL을 디자인하였다. 상기 구조체에 사용된 코딩 서열은 하기에 기재되어 있다.
뉴클레오티드
서열
EV71 IRES의 상류에 삽입된
gH
-(
GSG
)2-
SpyTag
-His (
인트론
없음) (서열 번호: 42)
본 서열에서: 신호 펩티드 (nt 1-69), 엑토도메인 (nt 70-2151), 절단된 막관통 도메인 (nt 2152-2157), (GSG)2 링커 (nt 2158-2175), SpyTag (nt 2176-2214) , His-태그 (nt 2215-2232), 정지 코돈 (nt 2233-2235).
EV71 IRES의 하류에 삽입된
gL
(
인트론
없음) (서열 번호: 43)
본 서열에서: 신호 펩티드 (nt 1-90), 엑토도메인 (nt 91-834), 정지 코돈 (nt 835-837)
HCMV
UL128/UL130/
UL131A
안정한 발현 구조체
UL128 성분 (서열 번호: 44), UL130 성분 (서열 번호: 45) 및 UL131A 성분 (서열 번호: 46)를 포함하도록 안정한 구조체 HCMV-UL128-IRES-UL130-(G4S)3-C-태그-IRES-UL131A를 디자인하였다. 상기 UL130 성분을 플라스미드의 제1 EV71 IRES 다음에 삽입되고, UL131A 성분은 제2 EV71 IRES 다음에 삽입되었다. 본 구조체에 사용된 코딩 서열은 하기에 기재되어 있다.
뉴클레오티드 서열
UL128 (
인트론
없음) (서열 번호: 44)
본 서열에서: 신호 펩티드 (nt 1-81), 엑토도메인 (nt 82-513), 정지 코돈 (nt 514-516).
UL130-(
G4S
)3-C-태그 (
인트론
없음) (서열 번호: 45)
본 서열에서: 신호 펩티드 (nt 1-75), 엑토도메인 (nt 76-642), (G4S)3 링커 (nt 643-687), C태그 (nt 688-699), 정지 코돈 (nt 700-702).
UL131A
(
인트론
없음) (서열 번호: 46)
본 서열에서: 신호 펩티드 (nt 1-54), 엑토도메인 (nt 55-387), 정지 코돈 (nt 388-390).
실시예
4
HCMV
-
SpyTag
--
SpyCatcher
-
HBsAg
VLP의
인 비보 테스트 (
아쥬반트
없음)
상기 접합된 HCMV 5량체-HBsAg VLP 및 비접합된 HCMV 5량체-SpyTag를, 비접합된 5량체-SpyTag 단백질에 대한 접합된 5량체-HBsAg VLP의 면역원성을 추가로 연구하기 위해, BALB/c 마우스를 사용한 면역화 일정에서 사용하였다.
3주 간격으로 프라임-부스트-부스트 일정이 하기와 같이 사용되었다:
0일: 면역화 (프라임); 20일: 꼬리 채혈; 21일: 면역화 (부스트 1); 41일: 꼬리 채혈; 42일: 면역화 (부스트 2); 63일: 심장 채혈.
면역화된 그룹은 하기와 같다. 각 그룹에 대해 n = 10:
1) 1 μg HCMV 5량체-SpyTag 아쥬반트 없음
2) 1 μg HCMV 5량체-SpyTag--SpyCatcher-HBsAg VLP (1 μg의 5량체 동등물) 아쥬반트 없음
3) 0.1 μg HCMV 5량체-SpyTag--SpyCatcher-HBsAg VLP (0.1 μg의 5량체 동등물) 아쥬반트 없음
ELISA를 사용하여 면역원성을 평가하였다. HCMV 5량체에 대한 표준화된 ELISA를 사용하여 각 그룹에서 생성된 항혈청의 역가를 결정하였다. 플레이트를 5 μg/ml 5량체 (SpyTag 없음), 50 μL/웰로 밤새 코팅하고; 세척하고; 1시간 동안 우유로 차단하고; 세척하고; 마우스 혈청 (PBS 중에 적절하게 희석)을 1시간 동안 적용하고; 세척하고; 염소 항-마우스-알칼리 포스파타제 항체 (1:10,000)를 1시간 동안 적용하고; 세척하고; 발생시켰다.
각 시점에서, 샘플들에 대한 OD 값을 적절한 희석에서 판독하고, ELISA 유닛을 각 플레이트에서 실행되는 표준 곡선을 사용하여 결정하였다. 프라임 후 및 부스트 후 데이터는 도 8에 도시되어 있다. 1 μg 및 0.1 μg 용량 모두를 사용하는 HCMV 5량체-HBsAg 면역화된 마우스는, 가용성 단백질로서 1 μg의 HCMV 5량체 단독으로 면역화된 마우스와 비교하여, 실질적으로 더 강한 혈청 IgG 항체 반응을 나타낸다.
생성된 항체의 기능적 활성은 Wang et al. (2015)을 기반으로 하는 미세중화 분석을 사용하여 연구하였다. 프라임 후 및 부스트 후 중화 역가는 도 9에 도시되어 있다. 아쥬반트가 없는 5량체-HBsAg VLP로 면역화된 마우스로부터의 혈청은 아쥬반트가 없는 5량체-SpyTag 단백질 단독으로 면역화된 마우스로부터의 혈청보다 실질적으로 더 많이 중화된다.
실시예
5
RSV
-F-
SpyTag의
발현 및 정제
항원 RSV-F Sc9-10 DS-Cav1 A149C Y458C로부터의 서열을 SpyTag에 융합시켜 RSV-F-SpyTag를 생성하고, ExpiCHO™ 발현 시스템 키트 및 ExpiFectamine™ 형질감염 시약 (ThermoFisher Scientific)을 사용하여, 플라스미드 pcDNA3.4에서 뉴클레오티드 서열 서열 번호: 47로 ExpiCHO™ 세포를 일시적으로 형질감염시켜 발현시켰다.
RSV-F Sc9-10 DS-Cav1 A149C Y458C (National Institutes of Health)는 Joyce et al. (2016)에 의해 기재된 바와 같이 호흡기 세포융합 바이러스 융합 단백질 (융합-전 RSV-F)의 변이체이다 (Iterative structure-based improvement of a respiratory syncytial virus fusion glycoprotein vaccine. Nat Struct Mol Biol. 2016 Sep; 23(9): 811-820). 이러한 변이체는 유전자-연결된 F 서브유닛, 결실된 융합 펩티드, T4 피브리틴 3량체화 모티프 (foldon 도메인) 및 추가의 프로토머간 디설파이드 결합 (A149C Y458C)에 의해 안정화된 프로토머간 이동 (interprotomer movements)이 있는 융합 (F) 당단백질의 융합-전 안정화된 형태이다.
뉴클레오티드 서열
RSV-F-SpyTag-C태그 뉴클레오티드 서열 (서열 번호: 47)
Sc9-10 DS-Cav1 A149C Y458C의 원래 서열은 트롬빈 부위, 6x His-태그 및 Strep-tag® II의 결실에 의해 3' 말단에서 변형되었다. 이들 결실된 도메인을 링커-SpyTag-C-태그 서열로 대체하여, Sc9-10 DS-Cav1 A149C Y458C (nt 1-1515, 신호 펩티드 (nt 1-75), 및 T4 피브리틴 foldon 도메인 (nt 1435-1515) 포함), (GSG)2 링커 (nt 1516-1533; 서열 번호: 14), SpyTag (nt 1534-1572; 서열 번호: 15), C-태그 (nt 1573-1584) 및 정지 코돈 (nt 1585-1587)을 포함하는 1587 nt 카세트 (서열 번호: 47))를 생성하였다. 링커, SpyTag, C-태그 및 정지 코돈을 제외한 Sc9-10 DS-Cav1 A149C Y458C 뉴클레오티드 서열은 서열 번호: 48에 포함된다. 신호 펩티드, 링커, SpyTag 또는 C-태그를 제외한 Sc9-10 DS-Cav1 A149C Y458C 뉴클레오티드 산 서열은 서열 번호: 49에 포함된다.
아미노산 서열
뉴클레오티드 서열 서열 번호: 47의 발현은 하기 도메인을 갖는 RSV-F-SpyTag-C태그 아미노산 서열 (서열 번호: 50)을 생성할 것으로 예상되었다: Sc9-10 DS-Cav1 A149C Y458C ((aa 1-505, 신호 펩티드 (aa 1-25) 및 foldon 도메인 (aa 479-505) 포함), 링커 (aa 506-511; 서열 번호: 29), SpyTag (aa 512-524; 서열 번호: 30), C-태그 (aa 525-528). 상기 단백질의 예상 질량은 신호 펩티드가 있는 경우 57.9 kDa, 신호 펩티드가 없는 경우 55.3 kDa이었다. 링커, SpyTag 또는 C-태그를 제외한 Sc9-10 DS-Cav1 A149C Y458C 아미노산 서열은 서열 번호: 51에 포함된다. 신호 펩티드, 링커, SpyTag 또는 C-태그를 제외한 Sc9-10 DS-Cav1 A149C Y458C 아미노산 서열은 서열 번호: 52에 포함된다.
RSV
-F-
SpyTag의
정제
RSF-F-SpyTag 항원이 세포로부터 분비되고, C-태그 친화도 정제 및 크기 배제 크로마토그래피를 사용하여 상등액으로부터 정제되었다. RSV-F-SpyTag는 SDS-PAGE로 분석했을 때 비-환원 및 환원 조건하에 예상대로 나타났고 (도 10의 A), 항-RSV-F [2F7] 모노클로날 항체 (ab43812; Abcam)와 반응하였다 (도 10의 B).
HBsAg
VLP
모노머의 정제
SpyCatcher-HBsAg (VLP 모노머)를 상기 실시예 1에 기재된 바와 같이 제조 및 정제하고, 또한 도 2를 참조한다.
RSV
-F-
SpyTag의
SpyCatcher
-
HBsAg로의
접합
RSV-F-SpyTag를 4℃에서 밤새 SpyCatcher-HBsAg에 접합시켜서 RSV-F 3량체로 코팅된 HBsAg VLP를 생성하였다 (RSV-F-SpyTag--SpyCatcher-HBsAg). Tris 완충 식염수 (TBS; 20 mM Tris 및 150 mM NaCl, pH 7.4)를 함유하는 버퍼를 접합에 사용하였다. 상기 접합은 SDS-PAGE 및 웨스턴-블롯 분석을 사용하여 모니터링하였다 (도 11). 상기 접합 반응을 RSV-F-SpyTag 또는 SpyCatcher-HBsAg 단독과 비교했을 때, 환원 조건하에 ~105 kDa (레인 2)에서 새로운 밴드가 존재하였고 (도 11의 A), 이는 항-HBsAg 모노클로날 항체 (MCA4658, Bio-Rad) (도 11의 B) 및 항-RSV-F [2F7] 모노클로날 항체 (ab43812; Abcam) (도 11의 C) 모두와 반응하며, 이는 접합된 RSV-F-SpyTag--SpyCatcher-HBsAg를 함유하고 있음을 나타낸다.
실시예
6
접합된
RSV
-F-
SpyTag
--
SpyCatcher
-
HBsAg의
면역원성
생성된 RSV-F 항원의 면역원성을 확인하고, 비접합된 RSV-F-SpyTag 단백질에 대한 접합된 RSV-F-SpyTag--SpyCatcher-HBsAg VLP의 면역원성을 비교하기 위해, BALB/c 마우스를 사용하여 면역화 일정을 디자인하였다. 상기 그룹들에게 샘플 중 RSV-F-SpyTag의 양을 기준으로 투여하고, 부스트 면역화하고 2주 후 최종 시점을 갖는, 3주 간격의 프라임-부스트 일정이 선택되었다.
RSV-F-SpyTag--SpyCatcher-HBsAg로 면역화된 프라임 후 마우스는, 상기 백신이 아쥬반트를 사용하지 않았거나 (도 6) 또는 Addavax™으로 제제화되었는지 (도 6)에 관계없이, RSV-F-SpyTag 단백질 단독으로 면역화된 마우스와 비교하여, 실질적으로 더 강한 혈청 IgG 항체 반응을 나타내었다.
SEQUENCE LISTING
<110> SpyBiotech Limited
<120> Vaccine composition
<130> P9800wo1
<160> 60
<170> PatentIn version 3.5
<210> 1
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> Flexible linker 2 - (GSG)2
<400> 1
Gly Ser Gly Gly Ser Gly
1 5
<210> 2
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Flexible linker 3 - (GSG)3
<400> 2
Gly Ser Gly Gly Ser Gly Gly Ser Gly
1 5
<210> 3
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Flexible linker 4 - (G4S)1
<400> 3
Gly Gly Gly Gly Ser
1 5
<210> 4
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> Flexible linker 5 - (G4S)3
<400> 4
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
1 5 10 15
<210> 5
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> Flexible linker 6 - (G4S)4
<400> 5
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15
Gly Gly Gly Ser
20
<210> 6
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<223> Flexible linker 7
<400> 6
Gly Ser Ala Gly Ser Ala Ala Gly Ser Gly Glu Phe
1 5 10
<210> 7
<211> 18
<212> PRT
<213> Artificial Sequence
<220>
<223> Flexible linker 8
<400> 7
Lys Glu Ser Gly Ser Val Ser Ser Glu Gln Leu Ala Gln Phe Arg Ser
1 5 10 15
Leu Asp
<210> 8
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> Flexible linker 9
<400> 8
Glu Gly Lys Ser Ser Gly Ser Gly Ser Glu Ser Lys Ser Thr
1 5 10
<210> 9
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Rigid linker 1
<400> 9
Glu Ala Ala Ala Lys
1 5
<210> 10
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> Rigid linker 2 - (EAAAK)3
<400> 10
Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys
1 5 10 15
<210> 11
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> Rigid linker 3 - (AP)7
<400> 11
Ala Pro Ala Pro Ala Pro Ala Pro Ala Pro Ala Pro Ala Pro
1 5 10
<210> 12
<211> 2235
<212> DNA
<213> Artificial Sequence
<220>
<223> gH-SpyTag-His
<220>
<221> misc_feature
<222> (1146)..(1146)
<223> C>A mutation at position 1146
<220>
<221> misc_feature
<222> (1)..(69)
<223> Signal peptide
<220>
<221> misc_feature
<222> (70)..(2151)
<223> Ectodomain
<220>
<221> misc_feature
<222> (2152)..(2157)
<223> Transmembrane domain (truncated)
<220>
<221> misc_feature
<222> (2158)..(2175)
<223> Linker
<220>
<221> misc_feature
<222> (2176)..(2214)
<223> SpyTag
<220>
<221> misc_feature
<222> (2215)..(2232)
<223> 6x His tag
<220>
<221> misc_feature
<222> (2233)..(2235)
<223> Stop codon
<400> 12
atgcggccag gcctcccctc ctacctcatc atcctcgccg tctgtctctt cagccaccta 60
ctttcgtcac gatatggcgc agaagccgta tccgaaccgc tggacaaagc gtttcaccta 120
ctgctcaaca cctacgggag acccatccgc ttcctgcgtg aaaataccac ccagtgtacc 180
tacaacagca gcctccgtaa cagcacggtc gtcagggaaa acgccatcag tttcaacttt 240
ttccaaagct ataatcaata ctatgtattc catatgcctc gatgtctttt tgcgggtcct 300
ctggcggagc agtttctgaa ccaggtagat ctgaccgaaa ccctggaaag ataccaacag 360
agacttaaca cttacgcgct ggtatccaaa gacctggcca gctaccgatc tttttcgcag 420
cagctaaagg cacaagacag cctaggtgaa cagcccacca ctgtgccacc gcccattgac 480
ctgtcaatac ctcacgtttg gatgccaccg caaaccactc cacacggctg gacagaatca 540
cataccacct caggactaca ccgaccacac tttaaccaga cctgtatcct ctttgatgga 600
cacgatctac tattcagcac cgtcacacct tgtttgcacc aaggctttta cctcatcgac 660
gaactacgtt acgttaaaat aacactgacc gaggacttct tcgtagttac ggtgtccata 720
gacgacgaca cacccatgct gcttatcttc ggccatcttc cacgcgtact tttcaaagcg 780
ccctatcaac gcgacaactt tatactacga caaactgaaa aacacgagct cctggtgcta 840
gttaagaaag atcaactgaa ccgtcactct tatctcaaag acccggactt tcttgacgcc 900
gcacttgact tcaactacct agacctcagc gcactactac gtaacagctt tcaccgttac 960
gccgtggatg tactcaagag cggtcgatgt cagatgctgg accgccgcac ggtagaaatg 1020
gccttcgcct acgcattagc actgttcgca gcagcccgac aagaagaggc cggcgcccaa 1080
gtctccgtcc cacgggccct agaccgccag gccgcactct tacaaataca agaatttatg 1140
atcacatgcc tctcacaaac accaccacgc accacgttgc tgctgtatcc cacggccgtg 1200
gacctggcca aacgagccct ttggacaccg aatcagatca ccgacatcac cagcctcgta 1260
cgcctggtct acatactctc taaacagaat cagcaacatc tcatccccca atgggcacta 1320
cgacagatcg ccgactttgc cctaaaacta cacaaaacgc acctggcctc ttttctttca 1380
gccttcgcac gccaagaact ctacctcatg ggcagcctcg tccactccat gctggtacat 1440
acgacggaga gacgcgaaat cttcatcgta gaaacgggcc tctgttcatt ggccgagcta 1500
tcacacttta cgcagttgtt agctcatcca caccacgaat acctcagcga cctgtacaca 1560
ccctgttcca gtagcgggcg acgcgatcac tcgctcgaac gcctcacgcg tctcttcccc 1620
gatgccaccg tccccgctac cgttcccgcc gccctctcca tcctatctac catgcaacca 1680
agcacgctgg aaaccttccc cgacctgttt tgcttgccgc tcggcgaatc cttctccgcg 1740
ctgaccgtct ccgaacacgt cagttatatc gtaacaaacc agtacctgat caaaggtatc 1800
tcctaccctg tctccaccac cgtcgtaggc cagagcctca tcatcaccca gacggacagt 1860
caaactaaat gcgaactgac gcgcaacatg cataccacac acagcatcac agtggcgctc 1920
aacatttcgc tagaaaactg cgccttttgc caaagcgccc tgctagaata cgacgacacg 1980
caaggcgtca tcaacatcat gtacatgcac gactcggacg acgtcctttt cgccctggat 2040
ccctacaacg aagtggtggt ctcatctccg cgaactcact acctcatgct tttgaaaaac 2100
ggtacggtac tagaagtaac tgacgtcgtc gtggacgcca ccgacagtcg tctcctcgga 2160
agcggaggct ctggtgccca tatcgtgatg gtggacgcct acaagcctac caaacatcat 2220
caccatcacc actaa 2235
<210> 13
<211> 2157
<212> DNA
<213> Artificial Sequence
<220>
<223> gH with truncated transmembrane domain
<220>
<221> misc_feature
<222> (1146)..(1146)
<223> C>A mutation at position 1146
<220>
<221> misc_feature
<222> (1)..(69)
<223> Signal peptide
<220>
<221> misc_feature
<222> (70)..(2151)
<223> Ectodomain
<220>
<221> misc_feature
<222> (2152)..(2157)
<223> Transmembrane domain (truncated)
<400> 13
atgcggccag gcctcccctc ctacctcatc atcctcgccg tctgtctctt cagccaccta 60
ctttcgtcac gatatggcgc agaagccgta tccgaaccgc tggacaaagc gtttcaccta 120
ctgctcaaca cctacgggag acccatccgc ttcctgcgtg aaaataccac ccagtgtacc 180
tacaacagca gcctccgtaa cagcacggtc gtcagggaaa acgccatcag tttcaacttt 240
ttccaaagct ataatcaata ctatgtattc catatgcctc gatgtctttt tgcgggtcct 300
ctggcggagc agtttctgaa ccaggtagat ctgaccgaaa ccctggaaag ataccaacag 360
agacttaaca cttacgcgct ggtatccaaa gacctggcca gctaccgatc tttttcgcag 420
cagctaaagg cacaagacag cctaggtgaa cagcccacca ctgtgccacc gcccattgac 480
ctgtcaatac ctcacgtttg gatgccaccg caaaccactc cacacggctg gacagaatca 540
cataccacct caggactaca ccgaccacac tttaaccaga cctgtatcct ctttgatgga 600
cacgatctac tattcagcac cgtcacacct tgtttgcacc aaggctttta cctcatcgac 660
gaactacgtt acgttaaaat aacactgacc gaggacttct tcgtagttac ggtgtccata 720
gacgacgaca cacccatgct gcttatcttc ggccatcttc cacgcgtact tttcaaagcg 780
ccctatcaac gcgacaactt tatactacga caaactgaaa aacacgagct cctggtgcta 840
gttaagaaag atcaactgaa ccgtcactct tatctcaaag acccggactt tcttgacgcc 900
gcacttgact tcaactacct agacctcagc gcactactac gtaacagctt tcaccgttac 960
gccgtggatg tactcaagag cggtcgatgt cagatgctgg accgccgcac ggtagaaatg 1020
gccttcgcct acgcattagc actgttcgca gcagcccgac aagaagaggc cggcgcccaa 1080
gtctccgtcc cacgggccct agaccgccag gccgcactct tacaaataca agaatttatg 1140
atcacatgcc tctcacaaac accaccacgc accacgttgc tgctgtatcc cacggccgtg 1200
gacctggcca aacgagccct ttggacaccg aatcagatca ccgacatcac cagcctcgta 1260
cgcctggtct acatactctc taaacagaat cagcaacatc tcatccccca atgggcacta 1320
cgacagatcg ccgactttgc cctaaaacta cacaaaacgc acctggcctc ttttctttca 1380
gccttcgcac gccaagaact ctacctcatg ggcagcctcg tccactccat gctggtacat 1440
acgacggaga gacgcgaaat cttcatcgta gaaacgggcc tctgttcatt ggccgagcta 1500
tcacacttta cgcagttgtt agctcatcca caccacgaat acctcagcga cctgtacaca 1560
ccctgttcca gtagcgggcg acgcgatcac tcgctcgaac gcctcacgcg tctcttcccc 1620
gatgccaccg tccccgctac cgttcccgcc gccctctcca tcctatctac catgcaacca 1680
agcacgctgg aaaccttccc cgacctgttt tgcttgccgc tcggcgaatc cttctccgcg 1740
ctgaccgtct ccgaacacgt cagttatatc gtaacaaacc agtacctgat caaaggtatc 1800
tcctaccctg tctccaccac cgtcgtaggc cagagcctca tcatcaccca gacggacagt 1860
caaactaaat gcgaactgac gcgcaacatg cataccacac acagcatcac agtggcgctc 1920
aacatttcgc tagaaaactg cgccttttgc caaagcgccc tgctagaata cgacgacacg 1980
caaggcgtca tcaacatcat gtacatgcac gactcggacg acgtcctttt cgccctggat 2040
ccctacaacg aagtggtggt ctcatctccg cgaactcact acctcatgct tttgaaaaac 2100
ggtacggtac tagaagtaac tgacgtcgtc gtggacgcca ccgacagtcg tctcctc 2157
<210> 14
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Linker from gH construct
<400> 14
ggaagcggag gctctggt 18
<210> 15
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Spytag
<400> 15
gcccatatcg tgatggtgga cgcctacaag cctaccaaa 39
<210> 16
<211> 837
<212> DNA
<213> Human cytomegalovirus
<220>
<221> misc_feature
<222> (1)..(90)
<223> Signal peptide
<220>
<221> misc_feature
<222> (91)..(834)
<223> Ectodomain
<220>
<221> misc_feature
<222> (835)..(837)
<223> Stop codon
<400> 16
atgtgccgcc gcccggattg cggcttctct ttctcacctg gaccggtgat actgctgtgg 60
tgttgccttc tgctgcccat tgtttcctca gccgccgtca gcgtcgctcc taccgccgcc 120
gagaaagtcc ccgcggagtg ccccgaacta acgcgccgat gcttgttggg tgaggtgttt 180
gagggtgaca agtatgaaag ttggctgcgc ccgttggtga atgttaccgg gcgcgatggc 240
ccgctatcgc aacttatccg ttaccgtccc gttacgccgg aggccgccaa ctccgtgctg 300
ttggacgagg ctttcctgga cactctggcc ctgctgtaca acaatccgga tcaattgcgg 360
gccctgctga cgctgttgag ctcggacaca gcgccgcgct ggatgacggt gatgcgcggc 420
tacagcgagt gcggcgatgg ctcgccggcc gtgtacacgt gcgtggacga cctgtgccgc 480
ggctacgacc tcacgcgact gtcatacggg cgcagcatct tcacggaaca cgtgttaggc 540
ttcgagctgg tgccaccgtc tctctttaac gtggtggtgg ccatacgcaa cgaagccacg 600
cgtaccaacc gcgccgtgcg tctgcccgtg agcaccgctg ccgcgcccga gggcatcacg 660
ctcttttacg gcctgtacaa cgcagtgaag gaattctgcc tgcgtcacca gctggacccg 720
ccgctgctac gccacctaga taaatactac gccggactgc cgcccgagct gaagcagacg 780
cgcgtcaacc tgccggctca ctcgcgctat ggccctcaag cagtggatgc tcgctaa 837
<210> 17
<211> 702
<212> DNA
<213> Artificial Sequence
<220>
<223> UL130 - C-tag
<220>
<221> misc_feature
<222> (1)..(75)
<223> Signal peptide
<220>
<221> misc_feature
<222> (76)..(642)
<223> Ectodomain
<220>
<221> misc_feature
<222> (643)..(687)
<223> Linker
<220>
<221> misc_feature
<222> (688)..(699)
<223> C-tag
<220>
<221> misc_feature
<222> (700)..(702)
<223> Stop codon
<400> 17
atgctgcggc ttctgcttcg tcaccacttt cactgcctgc ttctgtgcgc ggtttgggca 60
acgccctgtc tggcgtctcc gtggtcgacg ctaacagcaa accagaatcc gtccccgcca 120
tggtctaaac tgacgtattc caaaccgcat gacgcggcga cgttttactg tccttttctc 180
tatccctcgc ccccacgatc ccccttgcaa ttctcggggt tccagcgggt atcaacgggt 240
cccgagtgtc gcaacgagac cctgtatctg ctgtacaacc gggaaggcca gaccttggtg 300
gagagaagct ccacctgggt gaaaaaggtg atctggtacc tgagcggtcg gaaccaaacc 360
atcctccaac ggatgccccg aacggcttcg aaaccgagcg acggaaacgt gcagatcagc 420
gtggaagacg ccaagatttt tggagcgcac atggtgccca agcagaccaa gctgctacgc 480
ttcgtcgtca acgatggcac acgttatcag atgtgtgtga tgaagctgga gagctgggct 540
cacgtcttcc gggactacag cgtgtctttt caggtgcgat tgacgttcac cgaggccaat 600
aaccagactt acaccttctg cacccatccc aatctcatcg ttggaggcgg aggatctggc 660
ggaggtggaa gtggcggagg cggatctgag cccgaggcct aa 702
<210> 18
<211> 642
<212> DNA
<213> Artificial Sequence
<220>
<223> UL130 (signal sequence and ectodomain)
<220>
<221> misc_feature
<222> (1)..(75)
<223> Signal peptide
<220>
<221> misc_feature
<222> (76)..(642)
<223> Ectodomain
<400> 18
atgctgcggc ttctgcttcg tcaccacttt cactgcctgc ttctgtgcgc ggtttgggca 60
acgccctgtc tggcgtctcc gtggtcgacg ctaacagcaa accagaatcc gtccccgcca 120
tggtctaaac tgacgtattc caaaccgcat gacgcggcga cgttttactg tccttttctc 180
tatccctcgc ccccacgatc ccccttgcaa ttctcggggt tccagcgggt atcaacgggt 240
cccgagtgtc gcaacgagac cctgtatctg ctgtacaacc gggaaggcca gaccttggtg 300
gagagaagct ccacctgggt gaaaaaggtg atctggtacc tgagcggtcg gaaccaaacc 360
atcctccaac ggatgccccg aacggcttcg aaaccgagcg acggaaacgt gcagatcagc 420
gtggaagacg ccaagatttt tggagcgcac atggtgccca agcagaccaa gctgctacgc 480
ttcgtcgtca acgatggcac acgttatcag atgtgtgtga tgaagctgga gagctgggct 540
cacgtcttcc gggactacag cgtgtctttt caggtgcgat tgacgttcac cgaggccaat 600
aaccagactt acaccttctg cacccatccc aatctcatcg tt 642
<210> 19
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Linker from UL130 construct
<400> 19
ggaggcggag gatctggcgg aggtggaagt ggcggaggcg gatct 45
<210> 20
<211> 759
<212> DNA
<213> Human cytomegalovirus
<220>
<221> misc_feature
<222> (634)..(634)
<223> T>C mutation at position 634
<220>
<221> misc_feature
<222> (1)..(81)
<223> Signal peptide
<220>
<221> misc_feature
<222> (82)..(164)
<223> Ectodomain
<220>
<221> Intron
<222> (165)..(287)
<220>
<221> misc_feature
<222> (288)..(422)
<223> Ectodomain
<220>
<221> Intron
<222> (423)..(542)
<220>
<221> misc_feature
<222> (543)..(756)
<223> Ectodomain
<220>
<221> misc_feature
<222> (757)..(759)
<223> Stop codon
<400> 20
atgagtccca aagatctgac gccgttcttg acggcgttgt ggctgctatt gggtcacagc 60
cgcgtgccgc gggtgcgcgc agaagaatgt tgcgaattca taaacgtcaa ccacccgccg 120
gaacgctgtt acgatttcaa aatgtgcaat cgcttcaccg tcgcgtacgt attttcatga 180
ttgtctgcgt tctgtggtgc gtctggatct gtctctcgac gtttctgata gccatgttcc 240
atcgacgatc ctcgggaatg ccagagtaga ttttcatgaa tccacaggct gcggtgtccg 300
gacggcgaag tctgctacag tcccgagaaa acggctgaga ttcgcgggat cgtcaccacc 360
atgacccatt cattgacacg ccaggtcgta cacaacaaac tgacgagctg caactacaat 420
ccgtaagtct cttcctgagg gccttacagc ctatgggaga gtaagacaga gagggacaaa 480
acatcattaa aaaaaaaagt ctaatttcac gttttgtacc ccccttcccc tccgtgttgt 540
aggttatacc tcgaagctga cgggcgaata cgctgcggca aagtaaacga caaggcgcag 600
tacctgctgg gcgccgctgg cagcgttccc tatcgatgga tcaatctgga atacgacaag 660
ataacccgga tcgtgggcct ggatcagtac ctggagagcg ttaagaaaca caaacggctg 720
gatgtgtgcc gcgctaaaat gggctatatg ctgcagtga 759
<210> 21
<211> 498
<212> DNA
<213> Human cytomegalovirus
<220>
<221> misc_feature
<222> (1)..(54)
<223> Signal peptide
<220>
<221> misc_feature
<222> (55)..(236)
<223> Ectodomain
<220>
<221> Intron
<222> (237)..(344)
<220>
<221> misc_feature
<222> (345)..(495)
<223> Ectodomain
<220>
<221> misc_feature
<222> (496)..(498)
<223> Stop codon
<400> 21
atgcggctgt gtcgggtgtg gctgtctgtt tgtctgtgcg ccgtggtgct gggtcagtgc 60
cagcgggaaa ccgcggaaaa aaacgattat taccgagtac cgcattactg ggacgcgtgc 120
tctcgcgcgc tgcccgacca aacccgttac aagtatgtgg aacagctcgt ggacctcacg 180
ttgaactacc actacgatgc gagccacggc ttggacaact ttgacgtgct caagaggtga 240
gggtacgcgc taaagatgca tgacaacggg aaggtaaggg cgaacgggta acgggtaagt 300
aaccgcatgg ggtatgaaat gacgttcgga acctgtgctt gcagaatcaa cgtgaccgag 360
gtgtcgttgc tcatcagcga ctttagacgt cagaaccgtc gcggcggcac caacaaaagg 420
accacgttca acgccgccgg ttcgctggcg ccacacgccc ggagcctcga gttcagcgtg 480
cggctctttg ccaactag 498
<210> 22
<211> 1008
<212> DNA
<213> Artificial Sequence
<220>
<223> SpyCatcher-HBsAg
<220>
<221> misc_feature
<222> (1)..(276)
<223> SpyCatcherDeltaN1
<220>
<221> misc_feature
<222> (277)..(303)
<223> Flexible Linker
<220>
<221> misc_feature
<222> (304)..(315)
<223> PVTN linker
<220>
<221> misc_feature
<222> (316)..(993)
<223> HBsAg
<220>
<221> misc_feature
<222> (994)..(1005)
<223> C-tag
<220>
<221> misc_feature
<222> (1006)..(1008)
<223> Stop codon
<400> 22
gactccgcta ctcacatcaa gttctccaag agagatgagg acggtaaaga attggctggt 60
gctactatgg aattgagaga ctcctccggt aagactatct ccacttggat ttccgacggt 120
caggttaagg acttctactt gtacccaggt aagtacactt tcgttgagac tgctgctcca 180
gacggttacg aagttgctac tgctatcact ttcactgtta acgagcaggg acaggttaca 240
gttaacggta aggctactaa gggtgacgct catattggtt ctggtggatc tggtggttcc 300
ggtccagtta ctaatatgga aaacatcact tccggtttct tgggtccttt gttggttttg 360
caggctggat tcttcttgtt gactagaatc ttgactatcc cacagtcctt ggactcttgg 420
tggacttcct tgaacttctt gggtggttcc ccagtttgtt tgggtcaaaa ctctcaatcc 480
ccaacttcca accactcccc aacatcttgt ccaccaattt gtcctggtta cagatggatg 540
tgtttgagaa gattcatcat tttcttgttc atcttgttgt tgtgtttgat cttcttgttg 600
gttttgttgg actaccaggg tatgttgcca gtttgtccat tgatcccagg ttccactact 660
acaaacactg gtccatgtaa gacttgtact actccagctc agggtaactc catgttccct 720
tcatgttgtt gtactaagcc aactgacggt aactgtactt gtatcccaat tccatcctcc 780
tgggctttcg ctaagtactt gtgggaatgg gcttccgtta gattctcctg gttgtccttg 840
ttggttccat tcgttcagtg gttcgttggt ttgtccccaa ctgtttggtt gtccgctatt 900
tggatgatgt ggtactgggg tccatccttg tactctatcg tttccccatt catccctttg 960
ttgccaatct tcttctgttt gtgggtttac atcgagccag aggcttaa 1008
<210> 23
<211> 276
<212> DNA
<213> Artificial Sequence
<220>
<223> SpyCatcherDeltaN1
<400> 23
gactccgcta ctcacatcaa gttctccaag agagatgagg acggtaaaga attggctggt 60
gctactatgg aattgagaga ctcctccggt aagactatct ccacttggat ttccgacggt 120
caggttaagg acttctactt gtacccaggt aagtacactt tcgttgagac tgctgctcca 180
gacggttacg aagttgctac tgctatcact ttcactgtta acgagcaggg acaggttaca 240
gttaacggta aggctactaa gggtgacgct catatt 276
<210> 24
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Flexible linker from SpyCatcher-HBsAg
<400> 24
ggttctggtg gatctggtgg ttccggt 27
<210> 25
<211> 12
<212> DNA
<213> Artificial Sequence
<220>
<223> PVTN linker from SpyCatcher-HbsAg
<400> 25
ccagttacta at 12
<210> 26
<211> 678
<212> DNA
<213> Artificial Sequence
<220>
<223> HBsAg
<400> 26
atggaaaaca tcacttccgg tttcttgggt cctttgttgg ttttgcaggc tggattcttc 60
ttgttgacta gaatcttgac tatcccacag tccttggact cttggtggac ttccttgaac 120
ttcttgggtg gttccccagt ttgtttgggt caaaactctc aatccccaac ttccaaccac 180
tccccaacat cttgtccacc aatttgtcct ggttacagat ggatgtgttt gagaagattc 240
atcattttct tgttcatctt gttgttgtgt ttgatcttct tgttggtttt gttggactac 300
cagggtatgt tgccagtttg tccattgatc ccaggttcca ctactacaaa cactggtcca 360
tgtaagactt gtactactcc agctcagggt aactccatgt tcccttcatg ttgttgtact 420
aagccaactg acggtaactg tacttgtatc ccaattccat cctcctgggc tttcgctaag 480
tacttgtggg aatgggcttc cgttagattc tcctggttgt ccttgttggt tccattcgtt 540
cagtggttcg ttggtttgtc cccaactgtt tggttgtccg ctatttggat gatgtggtac 600
tggggtccat ccttgtactc tatcgtttcc ccattcatcc ctttgttgcc aatcttcttc 660
tgtttgtggg tttacatc 678
<210> 27
<211> 744
<212> PRT
<213> Artificial Sequence
<220>
<223> gH-SpyTag-His
<220>
<221> misc_feature
<222> (1)..(23)
<223> Signal peptide
<220>
<221> misc_feature
<222> (24)..(717)
<223> Ectodomain
<220>
<221> misc_feature
<222> (718)..(719)
<223> Transmembrane domain (truncated)
<220>
<221> misc_feature
<222> (720)..(725)
<223> Linker
<220>
<221> misc_feature
<222> (726)..(738)
<223> Spytag
<220>
<221> misc_feature
<222> (739)..(744)
<223> 6x His tag
<400> 27
Met Arg Pro Gly Leu Pro Ser Tyr Leu Ile Ile Leu Ala Val Cys Leu
1 5 10 15
Phe Ser His Leu Leu Ser Ser Arg Tyr Gly Ala Glu Ala Val Ser Glu
20 25 30
Pro Leu Asp Lys Ala Phe His Leu Leu Leu Asn Thr Tyr Gly Arg Pro
35 40 45
Ile Arg Phe Leu Arg Glu Asn Thr Thr Gln Cys Thr Tyr Asn Ser Ser
50 55 60
Leu Arg Asn Ser Thr Val Val Arg Glu Asn Ala Ile Ser Phe Asn Phe
65 70 75 80
Phe Gln Ser Tyr Asn Gln Tyr Tyr Val Phe His Met Pro Arg Cys Leu
85 90 95
Phe Ala Gly Pro Leu Ala Glu Gln Phe Leu Asn Gln Val Asp Leu Thr
100 105 110
Glu Thr Leu Glu Arg Tyr Gln Gln Arg Leu Asn Thr Tyr Ala Leu Val
115 120 125
Ser Lys Asp Leu Ala Ser Tyr Arg Ser Phe Ser Gln Gln Leu Lys Ala
130 135 140
Gln Asp Ser Leu Gly Glu Gln Pro Thr Thr Val Pro Pro Pro Ile Asp
145 150 155 160
Leu Ser Ile Pro His Val Trp Met Pro Pro Gln Thr Thr Pro His Gly
165 170 175
Trp Thr Glu Ser His Thr Thr Ser Gly Leu His Arg Pro His Phe Asn
180 185 190
Gln Thr Cys Ile Leu Phe Asp Gly His Asp Leu Leu Phe Ser Thr Val
195 200 205
Thr Pro Cys Leu His Gln Gly Phe Tyr Leu Ile Asp Glu Leu Arg Tyr
210 215 220
Val Lys Ile Thr Leu Thr Glu Asp Phe Phe Val Val Thr Val Ser Ile
225 230 235 240
Asp Asp Asp Thr Pro Met Leu Leu Ile Phe Gly His Leu Pro Arg Val
245 250 255
Leu Phe Lys Ala Pro Tyr Gln Arg Asp Asn Phe Ile Leu Arg Gln Thr
260 265 270
Glu Lys His Glu Leu Leu Val Leu Val Lys Lys Asp Gln Leu Asn Arg
275 280 285
His Ser Tyr Leu Lys Asp Pro Asp Phe Leu Asp Ala Ala Leu Asp Phe
290 295 300
Asn Tyr Leu Asp Leu Ser Ala Leu Leu Arg Asn Ser Phe His Arg Tyr
305 310 315 320
Ala Val Asp Val Leu Lys Ser Gly Arg Cys Gln Met Leu Asp Arg Arg
325 330 335
Thr Val Glu Met Ala Phe Ala Tyr Ala Leu Ala Leu Phe Ala Ala Ala
340 345 350
Arg Gln Glu Glu Ala Gly Ala Gln Val Ser Val Pro Arg Ala Leu Asp
355 360 365
Arg Gln Ala Ala Leu Leu Gln Ile Gln Glu Phe Met Ile Thr Cys Leu
370 375 380
Ser Gln Thr Pro Pro Arg Thr Thr Leu Leu Leu Tyr Pro Thr Ala Val
385 390 395 400
Asp Leu Ala Lys Arg Ala Leu Trp Thr Pro Asn Gln Ile Thr Asp Ile
405 410 415
Thr Ser Leu Val Arg Leu Val Tyr Ile Leu Ser Lys Gln Asn Gln Gln
420 425 430
His Leu Ile Pro Gln Trp Ala Leu Arg Gln Ile Ala Asp Phe Ala Leu
435 440 445
Lys Leu His Lys Thr His Leu Ala Ser Phe Leu Ser Ala Phe Ala Arg
450 455 460
Gln Glu Leu Tyr Leu Met Gly Ser Leu Val His Ser Met Leu Val His
465 470 475 480
Thr Thr Glu Arg Arg Glu Ile Phe Ile Val Glu Thr Gly Leu Cys Ser
485 490 495
Leu Ala Glu Leu Ser His Phe Thr Gln Leu Leu Ala His Pro His His
500 505 510
Glu Tyr Leu Ser Asp Leu Tyr Thr Pro Cys Ser Ser Ser Gly Arg Arg
515 520 525
Asp His Ser Leu Glu Arg Leu Thr Arg Leu Phe Pro Asp Ala Thr Val
530 535 540
Pro Ala Thr Val Pro Ala Ala Leu Ser Ile Leu Ser Thr Met Gln Pro
545 550 555 560
Ser Thr Leu Glu Thr Phe Pro Asp Leu Phe Cys Leu Pro Leu Gly Glu
565 570 575
Ser Phe Ser Ala Leu Thr Val Ser Glu His Val Ser Tyr Ile Val Thr
580 585 590
Asn Gln Tyr Leu Ile Lys Gly Ile Ser Tyr Pro Val Ser Thr Thr Val
595 600 605
Val Gly Gln Ser Leu Ile Ile Thr Gln Thr Asp Ser Gln Thr Lys Cys
610 615 620
Glu Leu Thr Arg Asn Met His Thr Thr His Ser Ile Thr Val Ala Leu
625 630 635 640
Asn Ile Ser Leu Glu Asn Cys Ala Phe Cys Gln Ser Ala Leu Leu Glu
645 650 655
Tyr Asp Asp Thr Gln Gly Val Ile Asn Ile Met Tyr Met His Asp Ser
660 665 670
Asp Asp Val Leu Phe Ala Leu Asp Pro Tyr Asn Glu Val Val Val Ser
675 680 685
Ser Pro Arg Thr His Tyr Leu Met Leu Leu Lys Asn Gly Thr Val Leu
690 695 700
Glu Val Thr Asp Val Val Val Asp Ala Thr Asp Ser Arg Leu Leu Gly
705 710 715 720
Ser Gly Gly Ser Gly Ala His Ile Val Met Val Asp Ala Tyr Lys Pro
725 730 735
Thr Lys His His His His His His
740
<210> 28
<211> 719
<212> PRT
<213> Artificial Sequence
<220>
<223> gH with truncated transmembrane domain
<220>
<221> misc_feature
<222> (1)..(23)
<223> Signal peptide
<220>
<221> misc_feature
<222> (24)..(717)
<223> Ectodomain
<220>
<221> misc_feature
<222> (718)..(719)
<223> Transmembrane domain (truncated)
<400> 28
Met Arg Pro Gly Leu Pro Ser Tyr Leu Ile Ile Leu Ala Val Cys Leu
1 5 10 15
Phe Ser His Leu Leu Ser Ser Arg Tyr Gly Ala Glu Ala Val Ser Glu
20 25 30
Pro Leu Asp Lys Ala Phe His Leu Leu Leu Asn Thr Tyr Gly Arg Pro
35 40 45
Ile Arg Phe Leu Arg Glu Asn Thr Thr Gln Cys Thr Tyr Asn Ser Ser
50 55 60
Leu Arg Asn Ser Thr Val Val Arg Glu Asn Ala Ile Ser Phe Asn Phe
65 70 75 80
Phe Gln Ser Tyr Asn Gln Tyr Tyr Val Phe His Met Pro Arg Cys Leu
85 90 95
Phe Ala Gly Pro Leu Ala Glu Gln Phe Leu Asn Gln Val Asp Leu Thr
100 105 110
Glu Thr Leu Glu Arg Tyr Gln Gln Arg Leu Asn Thr Tyr Ala Leu Val
115 120 125
Ser Lys Asp Leu Ala Ser Tyr Arg Ser Phe Ser Gln Gln Leu Lys Ala
130 135 140
Gln Asp Ser Leu Gly Glu Gln Pro Thr Thr Val Pro Pro Pro Ile Asp
145 150 155 160
Leu Ser Ile Pro His Val Trp Met Pro Pro Gln Thr Thr Pro His Gly
165 170 175
Trp Thr Glu Ser His Thr Thr Ser Gly Leu His Arg Pro His Phe Asn
180 185 190
Gln Thr Cys Ile Leu Phe Asp Gly His Asp Leu Leu Phe Ser Thr Val
195 200 205
Thr Pro Cys Leu His Gln Gly Phe Tyr Leu Ile Asp Glu Leu Arg Tyr
210 215 220
Val Lys Ile Thr Leu Thr Glu Asp Phe Phe Val Val Thr Val Ser Ile
225 230 235 240
Asp Asp Asp Thr Pro Met Leu Leu Ile Phe Gly His Leu Pro Arg Val
245 250 255
Leu Phe Lys Ala Pro Tyr Gln Arg Asp Asn Phe Ile Leu Arg Gln Thr
260 265 270
Glu Lys His Glu Leu Leu Val Leu Val Lys Lys Asp Gln Leu Asn Arg
275 280 285
His Ser Tyr Leu Lys Asp Pro Asp Phe Leu Asp Ala Ala Leu Asp Phe
290 295 300
Asn Tyr Leu Asp Leu Ser Ala Leu Leu Arg Asn Ser Phe His Arg Tyr
305 310 315 320
Ala Val Asp Val Leu Lys Ser Gly Arg Cys Gln Met Leu Asp Arg Arg
325 330 335
Thr Val Glu Met Ala Phe Ala Tyr Ala Leu Ala Leu Phe Ala Ala Ala
340 345 350
Arg Gln Glu Glu Ala Gly Ala Gln Val Ser Val Pro Arg Ala Leu Asp
355 360 365
Arg Gln Ala Ala Leu Leu Gln Ile Gln Glu Phe Met Ile Thr Cys Leu
370 375 380
Ser Gln Thr Pro Pro Arg Thr Thr Leu Leu Leu Tyr Pro Thr Ala Val
385 390 395 400
Asp Leu Ala Lys Arg Ala Leu Trp Thr Pro Asn Gln Ile Thr Asp Ile
405 410 415
Thr Ser Leu Val Arg Leu Val Tyr Ile Leu Ser Lys Gln Asn Gln Gln
420 425 430
His Leu Ile Pro Gln Trp Ala Leu Arg Gln Ile Ala Asp Phe Ala Leu
435 440 445
Lys Leu His Lys Thr His Leu Ala Ser Phe Leu Ser Ala Phe Ala Arg
450 455 460
Gln Glu Leu Tyr Leu Met Gly Ser Leu Val His Ser Met Leu Val His
465 470 475 480
Thr Thr Glu Arg Arg Glu Ile Phe Ile Val Glu Thr Gly Leu Cys Ser
485 490 495
Leu Ala Glu Leu Ser His Phe Thr Gln Leu Leu Ala His Pro His His
500 505 510
Glu Tyr Leu Ser Asp Leu Tyr Thr Pro Cys Ser Ser Ser Gly Arg Arg
515 520 525
Asp His Ser Leu Glu Arg Leu Thr Arg Leu Phe Pro Asp Ala Thr Val
530 535 540
Pro Ala Thr Val Pro Ala Ala Leu Ser Ile Leu Ser Thr Met Gln Pro
545 550 555 560
Ser Thr Leu Glu Thr Phe Pro Asp Leu Phe Cys Leu Pro Leu Gly Glu
565 570 575
Ser Phe Ser Ala Leu Thr Val Ser Glu His Val Ser Tyr Ile Val Thr
580 585 590
Asn Gln Tyr Leu Ile Lys Gly Ile Ser Tyr Pro Val Ser Thr Thr Val
595 600 605
Val Gly Gln Ser Leu Ile Ile Thr Gln Thr Asp Ser Gln Thr Lys Cys
610 615 620
Glu Leu Thr Arg Asn Met His Thr Thr His Ser Ile Thr Val Ala Leu
625 630 635 640
Asn Ile Ser Leu Glu Asn Cys Ala Phe Cys Gln Ser Ala Leu Leu Glu
645 650 655
Tyr Asp Asp Thr Gln Gly Val Ile Asn Ile Met Tyr Met His Asp Ser
660 665 670
Asp Asp Val Leu Phe Ala Leu Asp Pro Tyr Asn Glu Val Val Val Ser
675 680 685
Ser Pro Arg Thr His Tyr Leu Met Leu Leu Lys Asn Gly Thr Val Leu
690 695 700
Glu Val Thr Asp Val Val Val Asp Ala Thr Asp Ser Arg Leu Leu
705 710 715
<210> 29
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> Linker from gH construct
<400> 29
Gly Ser Gly Gly Ser Gly
1 5
<210> 30
<211> 13
<212> PRT
<213> Artificial Sequence
<220>
<223> Spytag
<400> 30
Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys
1 5 10
<210> 31
<211> 278
<212> PRT
<213> Human cytomegalovirus
<220>
<221> misc_feature
<222> (1)..(30)
<223> Signal peptide
<220>
<221> misc_feature
<222> (31)..(278)
<223> Ectodomain
<400> 31
Met Cys Arg Arg Pro Asp Cys Gly Phe Ser Phe Ser Pro Gly Pro Val
1 5 10 15
Ile Leu Leu Trp Cys Cys Leu Leu Leu Pro Ile Val Ser Ser Ala Ala
20 25 30
Val Ser Val Ala Pro Thr Ala Ala Glu Lys Val Pro Ala Glu Cys Pro
35 40 45
Glu Leu Thr Arg Arg Cys Leu Leu Gly Glu Val Phe Glu Gly Asp Lys
50 55 60
Tyr Glu Ser Trp Leu Arg Pro Leu Val Asn Val Thr Gly Arg Asp Gly
65 70 75 80
Pro Leu Ser Gln Leu Ile Arg Tyr Arg Pro Val Thr Pro Glu Ala Ala
85 90 95
Asn Ser Val Leu Leu Asp Glu Ala Phe Leu Asp Thr Leu Ala Leu Leu
100 105 110
Tyr Asn Asn Pro Asp Gln Leu Arg Ala Leu Leu Thr Leu Leu Ser Ser
115 120 125
Asp Thr Ala Pro Arg Trp Met Thr Val Met Arg Gly Tyr Ser Glu Cys
130 135 140
Gly Asp Gly Ser Pro Ala Val Tyr Thr Cys Val Asp Asp Leu Cys Arg
145 150 155 160
Gly Tyr Asp Leu Thr Arg Leu Ser Tyr Gly Arg Ser Ile Phe Thr Glu
165 170 175
His Val Leu Gly Phe Glu Leu Val Pro Pro Ser Leu Phe Asn Val Val
180 185 190
Val Ala Ile Arg Asn Glu Ala Thr Arg Thr Asn Arg Ala Val Arg Leu
195 200 205
Pro Val Ser Thr Ala Ala Ala Pro Glu Gly Ile Thr Leu Phe Tyr Gly
210 215 220
Leu Tyr Asn Ala Val Lys Glu Phe Cys Leu Arg His Gln Leu Asp Pro
225 230 235 240
Pro Leu Leu Arg His Leu Asp Lys Tyr Tyr Ala Gly Leu Pro Pro Glu
245 250 255
Leu Lys Gln Thr Arg Val Asn Leu Pro Ala His Ser Arg Tyr Gly Pro
260 265 270
Gln Ala Val Asp Ala Arg
275
<210> 32
<211> 233
<212> PRT
<213> Artificial Sequence
<220>
<223> UL130 - C-tag
<220>
<221> misc_feature
<222> (1)..(25)
<223> Signal peptide
<220>
<221> misc_feature
<222> (26)..(214)
<223> Ectodomain
<220>
<221> misc_feature
<222> (215)..(229)
<223> Linker
<220>
<221> misc_feature
<222> (230)..(233)
<223> C-tag
<400> 32
Met Leu Arg Leu Leu Leu Arg His His Phe His Cys Leu Leu Leu Cys
1 5 10 15
Ala Val Trp Ala Thr Pro Cys Leu Ala Ser Pro Trp Ser Thr Leu Thr
20 25 30
Ala Asn Gln Asn Pro Ser Pro Pro Trp Ser Lys Leu Thr Tyr Ser Lys
35 40 45
Pro His Asp Ala Ala Thr Phe Tyr Cys Pro Phe Leu Tyr Pro Ser Pro
50 55 60
Pro Arg Ser Pro Leu Gln Phe Ser Gly Phe Gln Arg Val Ser Thr Gly
65 70 75 80
Pro Glu Cys Arg Asn Glu Thr Leu Tyr Leu Leu Tyr Asn Arg Glu Gly
85 90 95
Gln Thr Leu Val Glu Arg Ser Ser Thr Trp Val Lys Lys Val Ile Trp
100 105 110
Tyr Leu Ser Gly Arg Asn Gln Thr Ile Leu Gln Arg Met Pro Arg Thr
115 120 125
Ala Ser Lys Pro Ser Asp Gly Asn Val Gln Ile Ser Val Glu Asp Ala
130 135 140
Lys Ile Phe Gly Ala His Met Val Pro Lys Gln Thr Lys Leu Leu Arg
145 150 155 160
Phe Val Val Asn Asp Gly Thr Arg Tyr Gln Met Cys Val Met Lys Leu
165 170 175
Glu Ser Trp Ala His Val Phe Arg Asp Tyr Ser Val Ser Phe Gln Val
180 185 190
Arg Leu Thr Phe Thr Glu Ala Asn Asn Gln Thr Tyr Thr Phe Cys Thr
195 200 205
His Pro Asn Leu Ile Val Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
210 215 220
Gly Gly Gly Gly Ser Glu Pro Glu Ala
225 230
<210> 33
<211> 214
<212> PRT
<213> Artificial Sequence
<220>
<223> UL130 (signal sequence and ectodomain)
<220>
<221> misc_feature
<222> (1)..(25)
<223> Signal peptide
<220>
<221> misc_feature
<222> (26)..(214)
<223> Ectodomain
<400> 33
Met Leu Arg Leu Leu Leu Arg His His Phe His Cys Leu Leu Leu Cys
1 5 10 15
Ala Val Trp Ala Thr Pro Cys Leu Ala Ser Pro Trp Ser Thr Leu Thr
20 25 30
Ala Asn Gln Asn Pro Ser Pro Pro Trp Ser Lys Leu Thr Tyr Ser Lys
35 40 45
Pro His Asp Ala Ala Thr Phe Tyr Cys Pro Phe Leu Tyr Pro Ser Pro
50 55 60
Pro Arg Ser Pro Leu Gln Phe Ser Gly Phe Gln Arg Val Ser Thr Gly
65 70 75 80
Pro Glu Cys Arg Asn Glu Thr Leu Tyr Leu Leu Tyr Asn Arg Glu Gly
85 90 95
Gln Thr Leu Val Glu Arg Ser Ser Thr Trp Val Lys Lys Val Ile Trp
100 105 110
Tyr Leu Ser Gly Arg Asn Gln Thr Ile Leu Gln Arg Met Pro Arg Thr
115 120 125
Ala Ser Lys Pro Ser Asp Gly Asn Val Gln Ile Ser Val Glu Asp Ala
130 135 140
Lys Ile Phe Gly Ala His Met Val Pro Lys Gln Thr Lys Leu Leu Arg
145 150 155 160
Phe Val Val Asn Asp Gly Thr Arg Tyr Gln Met Cys Val Met Lys Leu
165 170 175
Glu Ser Trp Ala His Val Phe Arg Asp Tyr Ser Val Ser Phe Gln Val
180 185 190
Arg Leu Thr Phe Thr Glu Ala Asn Asn Gln Thr Tyr Thr Phe Cys Thr
195 200 205
His Pro Asn Leu Ile Val
210
<210> 34
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> Linker from UL130 construct
<400> 34
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
1 5 10 15
<210> 35
<211> 171
<212> PRT
<213> Human cytomegalovirus
<220>
<221> misc_feature
<222> (1)..(27)
<223> Signal peptide
<220>
<221> misc_feature
<222> (28)..(171)
<223> Ectodomain
<400> 35
Met Ser Pro Lys Asp Leu Thr Pro Phe Leu Thr Ala Leu Trp Leu Leu
1 5 10 15
Leu Gly His Ser Arg Val Pro Arg Val Arg Ala Glu Glu Cys Cys Glu
20 25 30
Phe Ile Asn Val Asn His Pro Pro Glu Arg Cys Tyr Asp Phe Lys Met
35 40 45
Cys Asn Arg Phe Thr Val Ala Leu Arg Cys Pro Asp Gly Glu Val Cys
50 55 60
Tyr Ser Pro Glu Lys Thr Ala Glu Ile Arg Gly Ile Val Thr Thr Met
65 70 75 80
Thr His Ser Leu Thr Arg Gln Val Val His Asn Lys Leu Thr Ser Cys
85 90 95
Asn Tyr Asn Pro Leu Tyr Leu Glu Ala Asp Gly Arg Ile Arg Cys Gly
100 105 110
Lys Val Asn Asp Lys Ala Gln Tyr Leu Leu Gly Ala Ala Gly Ser Val
115 120 125
Pro Tyr Arg Trp Ile Asn Leu Glu Tyr Asp Lys Ile Thr Arg Ile Val
130 135 140
Gly Leu Asp Gln Tyr Leu Glu Ser Val Lys Lys His Lys Arg Leu Asp
145 150 155 160
Val Cys Arg Ala Lys Met Gly Tyr Met Leu Gln
165 170
<210> 36
<211> 129
<212> PRT
<213> Human cytomegalovirus
<220>
<221> misc_feature
<222> (1)..(18)
<223> Signal peptide
<220>
<221> misc_feature
<222> (19)..(129)
<223> Ectodomain
<400> 36
Met Arg Leu Cys Arg Val Trp Leu Ser Val Cys Leu Cys Ala Val Val
1 5 10 15
Leu Gly Gln Cys Gln Arg Glu Thr Ala Glu Lys Asn Asp Tyr Tyr Arg
20 25 30
Val Pro His Tyr Trp Asp Ala Cys Ser Arg Ala Leu Pro Asp Gln Thr
35 40 45
Arg Tyr Lys Tyr Val Glu Gln Leu Val Asp Leu Thr Leu Asn Tyr His
50 55 60
Tyr Asp Ala Ser His Gly Leu Asp Asn Phe Asp Val Leu Lys Arg Ile
65 70 75 80
Asn Val Thr Glu Val Ser Leu Leu Ile Ser Asp Phe Arg Arg Gln Asn
85 90 95
Arg Arg Gly Gly Thr Asn Lys Arg Thr Thr Phe Asn Ala Ala Gly Ser
100 105 110
Leu Ala Pro His Ala Arg Ser Leu Glu Phe Ser Val Arg Leu Phe Ala
115 120 125
Asn
<210> 37
<211> 335
<212> PRT
<213> Artificial Sequence
<220>
<223> SpyCatcher-HBsAg
<220>
<221> misc_feature
<222> (1)..(92)
<223> SpycatcherDeltaN1
<220>
<221> misc_feature
<222> (93)..(101)
<223> Flexible Linker
<220>
<221> misc_feature
<222> (102)..(105)
<223> PVTN linker
<220>
<221> misc_feature
<222> (106)..(331)
<223> HBsAg
<220>
<221> misc_feature
<222> (332)..(335)
<223> C-tag
<400> 37
Asp Ser Ala Thr His Ile Lys Phe Ser Lys Arg Asp Glu Asp Gly Lys
1 5 10 15
Glu Leu Ala Gly Ala Thr Met Glu Leu Arg Asp Ser Ser Gly Lys Thr
20 25 30
Ile Ser Thr Trp Ile Ser Asp Gly Gln Val Lys Asp Phe Tyr Leu Tyr
35 40 45
Pro Gly Lys Tyr Thr Phe Val Glu Thr Ala Ala Pro Asp Gly Tyr Glu
50 55 60
Val Ala Thr Ala Ile Thr Phe Thr Val Asn Glu Gln Gly Gln Val Thr
65 70 75 80
Val Asn Gly Lys Ala Thr Lys Gly Asp Ala His Ile Gly Ser Gly Gly
85 90 95
Ser Gly Gly Ser Gly Pro Val Thr Asn Met Glu Asn Ile Thr Ser Gly
100 105 110
Phe Leu Gly Pro Leu Leu Val Leu Gln Ala Gly Phe Phe Leu Leu Thr
115 120 125
Arg Ile Leu Thr Ile Pro Gln Ser Leu Asp Ser Trp Trp Thr Ser Leu
130 135 140
Asn Phe Leu Gly Gly Ser Pro Val Cys Leu Gly Gln Asn Ser Gln Ser
145 150 155 160
Pro Thr Ser Asn His Ser Pro Thr Ser Cys Pro Pro Ile Cys Pro Gly
165 170 175
Tyr Arg Trp Met Cys Leu Arg Arg Phe Ile Ile Phe Leu Phe Ile Leu
180 185 190
Leu Leu Cys Leu Ile Phe Leu Leu Val Leu Leu Asp Tyr Gln Gly Met
195 200 205
Leu Pro Val Cys Pro Leu Ile Pro Gly Ser Thr Thr Thr Asn Thr Gly
210 215 220
Pro Cys Lys Thr Cys Thr Thr Pro Ala Gln Gly Asn Ser Met Phe Pro
225 230 235 240
Ser Cys Cys Cys Thr Lys Pro Thr Asp Gly Asn Cys Thr Cys Ile Pro
245 250 255
Ile Pro Ser Ser Trp Ala Phe Ala Lys Tyr Leu Trp Glu Trp Ala Ser
260 265 270
Val Arg Phe Ser Trp Leu Ser Leu Leu Val Pro Phe Val Gln Trp Phe
275 280 285
Val Gly Leu Ser Pro Thr Val Trp Leu Ser Ala Ile Trp Met Met Trp
290 295 300
Tyr Trp Gly Pro Ser Leu Tyr Ser Ile Val Ser Pro Phe Ile Pro Leu
305 310 315 320
Leu Pro Ile Phe Phe Cys Leu Trp Val Tyr Ile Glu Pro Glu Ala
325 330 335
<210> 38
<211> 92
<212> PRT
<213> Artificial Sequence
<220>
<223> SpyCatcherDeltaN1
<400> 38
Asp Ser Ala Thr His Ile Lys Phe Ser Lys Arg Asp Glu Asp Gly Lys
1 5 10 15
Glu Leu Ala Gly Ala Thr Met Glu Leu Arg Asp Ser Ser Gly Lys Thr
20 25 30
Ile Ser Thr Trp Ile Ser Asp Gly Gln Val Lys Asp Phe Tyr Leu Tyr
35 40 45
Pro Gly Lys Tyr Thr Phe Val Glu Thr Ala Ala Pro Asp Gly Tyr Glu
50 55 60
Val Ala Thr Ala Ile Thr Phe Thr Val Asn Glu Gln Gly Gln Val Thr
65 70 75 80
Val Asn Gly Lys Ala Thr Lys Gly Asp Ala His Ile
85 90
<210> 39
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Flexible linker from SpyCatcher-HBsAg
<400> 39
Gly Ser Gly Gly Ser Gly Gly Ser Gly
1 5
<210> 40
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> PVTN linker from SpyCatcher-HBsAg
<400> 40
Pro Val Thr Asn
1
<210> 41
<211> 226
<212> PRT
<213> Artificial Sequence
<220>
<223> HBsAg
<400> 41
Met Glu Asn Ile Thr Ser Gly Phe Leu Gly Pro Leu Leu Val Leu Gln
1 5 10 15
Ala Gly Phe Phe Leu Leu Thr Arg Ile Leu Thr Ile Pro Gln Ser Leu
20 25 30
Asp Ser Trp Trp Thr Ser Leu Asn Phe Leu Gly Gly Ser Pro Val Cys
35 40 45
Leu Gly Gln Asn Ser Gln Ser Pro Thr Ser Asn His Ser Pro Thr Ser
50 55 60
Cys Pro Pro Ile Cys Pro Gly Tyr Arg Trp Met Cys Leu Arg Arg Phe
65 70 75 80
Ile Ile Phe Leu Phe Ile Leu Leu Leu Cys Leu Ile Phe Leu Leu Val
85 90 95
Leu Leu Asp Tyr Gln Gly Met Leu Pro Val Cys Pro Leu Ile Pro Gly
100 105 110
Ser Thr Thr Thr Asn Thr Gly Pro Cys Lys Thr Cys Thr Thr Pro Ala
115 120 125
Gln Gly Asn Ser Met Phe Pro Ser Cys Cys Cys Thr Lys Pro Thr Asp
130 135 140
Gly Asn Cys Thr Cys Ile Pro Ile Pro Ser Ser Trp Ala Phe Ala Lys
145 150 155 160
Tyr Leu Trp Glu Trp Ala Ser Val Arg Phe Ser Trp Leu Ser Leu Leu
165 170 175
Val Pro Phe Val Gln Trp Phe Val Gly Leu Ser Pro Thr Val Trp Leu
180 185 190
Ser Ala Ile Trp Met Met Trp Tyr Trp Gly Pro Ser Leu Tyr Ser Ile
195 200 205
Val Ser Pro Phe Ile Pro Leu Leu Pro Ile Phe Phe Cys Leu Trp Val
210 215 220
Tyr Ile
225
<210> 42
<211> 2235
<212> DNA
<213> Artificial Sequence
<220>
<223> gH-(GSG)2-SpyTag-His (without introns) optimised for CHO expression
<220>
<221> misc_feature
<222> (1)..(69)
<223> gH signal peptide
<220>
<221> misc_feature
<222> (70)..(2151)
<223> gH ectodomain
<220>
<221> misc_feature
<222> (2152)..(2157)
<223> gH truncated transmembrane domain
<220>
<221> misc_feature
<222> (2158)..(2175)
<223> (GSG)2 linker
<220>
<221> misc_feature
<222> (2176)..(2214)
<223> Spytag
<220>
<221> misc_feature
<222> (2215)..(2232)
<223> Histag
<220>
<221> misc_feature
<222> (2233)..(2235)
<223> Stop codon
<400> 42
atgaggcctg gcctgccttc ttatctgatc atcctggccg tgtgcctgtt ctcccatctg 60
ctgtcctcta gatacggcgc cgaggctgtg tctgagcctc tggataaggc ctttcatctg 120
ctgctgaaca cctacggcag acctatccgg ttcctgcgcg agaacaccac acagtgcacc 180
tacaactcca gcctgcggaa ctccacagtc gtgcgggaaa acgccatctc cttcaacttt 240
ttccagtcct acaaccagta ctatgtgttc cacatgcctc gctgcctgtt cgctggacct 300
ctggctgagc agttcctgaa ccaggtggac ctgaccgaga cactggaaag ataccagcag 360
cggctgaaca catatgccct ggtgtctaag gacctggcct cctacagatc cttcagccag 420
cagctgaagg ctcaggactc tctgggagag cagcctacaa cagtgcctcc tcctatcgac 480
ctgtctatcc ctcacgtgtg gatgcctcca cagaccacac ctcatggctg gaccgagtct 540
cataccacct ctggcctgca ccggcctcac ttcaaccaga cctgcatcct gttcgacggc 600
cacgacctgc tgttctccac cgtgacacca tgtctgcacc agggcttcta cctgatcgac 660
gagctgagat acgtgaagat taccctgaca gaggacttct tcgtggtcac cgtgtccatc 720
gacgacgaca cccctatgct gctgatcttc ggccatctgc ctcgggtgct gttcaaggcc 780
ccttaccagc gggacaactt catcctgaga cagaccgaga agcacgagct gctggtgctg 840
gtcaagaagg accagctgaa ccggcactcc tacctgaagg accctgactt cctggacgcc 900
gctctggact tcaactacct ggatctgagc gccctgctgc ggaacagctt tcacagatac 960
gccgtggacg tgctgaagtc tggcagatgc cagatgctgg acagacggac cgtggaaatg 1020
gccttcgctt acgccctggc tctgtttgcc gccgctagac aagaagaggc tggcgcccaa 1080
gtgtccgtgc ctagagcact ggatagacaa gccgctctgc tgcagatcca agagttcatg 1140
atcacatgcc tgtctcagac ccctcctcgg accacactgc tgctgtatcc taccgctgtg 1200
gatctggcca agagggctct gtggacccct aaccagatca ccgacatcac atccctcgtg 1260
cggctggtgt acatcctgtc caagcagaac cagcagcatc tgatccctca gtgggccctg 1320
aggcagatcg ctgattttgc cctgaagctg cacaagaccc acctggccag ctttctgtct 1380
gccttcgcca gacaagagct gtacctgatg ggcagcctgg tgcactctat gctggtgcat 1440
accaccgagc ggcgcgagat cttcatcgtg gaaaccggcc tgtgttccct ggccgagctg 1500
tctcacttta cccagctgct cgctcaccct caccacgagt acctgtccga cctgtacacc 1560
ccttgctcct ctagcggcag aagggaccac agcctggaaa gactgacccg gctgttccct 1620
gatgccaccg tgcctgctac agttcctgcc gctctgtcca tcctgagcac catgcagcct 1680
tccactctgg aaacattccc cgacctgttc tgcctgcctc tgggcgagtc tttttctgcc 1740
ctgaccgtgt ccgagcacgt gtcctacatc gtgaccaatc agtacctgat caagggcatc 1800
agctaccccg tgtccacaac cgtcgttggc cagagcctga tcatcaccca gaccgactct 1860
cagaccaagt gcgagctgac ccggaacatg cacacaaccc actccatcac cgtggctctg 1920
aacatctccc tggaaaactg cgccttctgc cagtctgccc tgctggaata cgatgacacc 1980
cagggcgtga tcaacatcat gtatatgcac gactccgacg acgtgctgtt tgccctggat 2040
ccttacaacg aggtggtggt gtctagcccc agaacacact acctgatgct gctcaagaac 2100
ggcaccgtgc tggaagtgac cgacgtggtg gtggacgcca ccgattctag attgctcggc 2160
tctggtggct ccggcgctca tatcgtgatg gtggatgctt acaagcccac caagcaccat 2220
catcaccacc actaa 2235
<210> 43
<211> 837
<212> DNA
<213> Artificial Sequence
<220>
<223> gL (without introns) optimised for CHO expression
<220>
<221> misc_feature
<222> (1)..(90)
<223> gL signal peptide
<220>
<221> misc_feature
<222> (91)..(834)
<223> gL ectodomain
<220>
<221> misc_feature
<222> (835)..(837)
<223> Stop codon
<400> 43
atgtgcagaa ggcctgactg cggcttctcc ttctctcccg gacctgtgat cctgctgtgg 60
tgctgtctgc tgctgcccat cgtttcttcc gccgctgtgt ctgtggctcc taccgctgct 120
gaaaaggtgc cagctgagtg tcccgagctg accagaagat gtctgctggg cgaagtgttc 180
gagggcgata agtacgagtc ttggctgcgg cctctggtca acgtgaccgg aagagatgga 240
cccctgagcc agctgatccg gtacagacct gtgacacctg aggccgccaa ttccgtgctg 300
ctggatgagg ccttcctgga cacactggcc ctgctgtaca acaaccccga tcagctgaga 360
gccctgctga ccctgctgtc ctctgatacc gctcctagat ggatgaccgt gatgcggggc 420
tactctgagt gcggagatgg aagcccagcc gtgtacacct gtgtggacga tctgtgcaga 480
ggctacgacc tgaccagact gtcctacggc cggtccatct ttaccgagca tgtgctgggc 540
tttgagctgg tgcctcctag cctgttcaat gtggtggtgg ccatccggaa tgaggccacc 600
agaacaaata gagccgtgcg gctgcctgtg tctacagctg ctgctcctga gggcatcacc 660
ctgttctacg gcctgtacaa cgccgtgaaa gagttctgcc tgagacacca gctggaccct 720
ccactgctga ggcacctgga taagtactac gctggcctgc ctcctgagct gaagcagacc 780
agagtgaacc tgcctgctca ctccagatac ggccctcagg ctgtggacgc cagataa 837
<210> 44
<211> 516
<212> DNA
<213> Artificial Sequence
<220>
<223> UL128 (without introns) optimised for CHO expression
<220>
<221> misc_feature
<222> (1)..(81)
<223> UL128 signal peptide
<220>
<221> misc_feature
<222> (82)..(513)
<223> UL128 ectodomain
<220>
<221> misc_feature
<222> (514)..(516)
<223> Stop codon
<400> 44
atgtccccta aggatctgac ccctttcctg accgctctgt ggctgctgct gggccattct 60
agagtgccta gagtcagagc cgaggaatgc tgcgagttca tcaacgtgaa ccatcctcca 120
gagcggtgct acgacttcaa gatgtgcaac agattcaccg tggctctgcg gtgccctgat 180
ggcgaagtgt gctactcccc tgaaaagacc gccgagatca gaggcatcgt gaccaccatg 240
acacactccc tgaccagaca ggtggtgcac aacaagctga ccagctgcaa ctacaaccct 300
ctgtacctgg aagccgacgg cagaatcaga tgcggcaaag tgaacgacaa ggcccagtac 360
ctgttgggcg ctgctggctc tgtgccctac agatggatca acctggaata cgacaagatc 420
acccggatcg tcggcctgga ccagtatctg gaatccgtga agaagcacaa gcggctggac 480
gtgtgcagag ccaagatggg ctatatgctg cagtaa 516
<210> 45
<211> 702
<212> DNA
<213> Artificial Sequence
<220>
<223> UL130-(G4S)3 - C-tag (without introns) optimised for CHO expression
<220>
<221> misc_feature
<222> (1)..(75)
<223> UL130 signal peptide
<220>
<221> misc_feature
<222> (76)..(642)
<223> UL130 ectodomain
<220>
<221> misc_feature
<222> (643)..(687)
<223> (G4S)3 linker
<220>
<221> misc_feature
<222> (688)..(699)
<223> C-tag
<220>
<221> misc_feature
<222> (700)..(702)
<223> Stop codon
<400> 45
atgctgagac tgctgctgag acaccacttc cactgcctgc tgctgtgtgc cgtttgggct 60
acaccttgtc tggcctctcc atggtctacc ctgaccgcca accagaatcc ttctccacct 120
tggtccaagc tgacctactc caagcctcac gatgccgcta ccttctactg cccctttctg 180
tacccatctc cacctcggag ccctctgcag ttctctggct tccagagagt gtccaccgga 240
cctgagtgcc ggaacgagac actgtacctg ctgtacaacc gcgagggcca gacactggtg 300
gaaagatcct ctacctgggt caagaaagtg atctggtatc tgagcggccg gaaccagacc 360
atcctgcaga gaatgcctcg gaccgcctct aagccttctg acggcaacgt gcagatctcc 420
gtggaagatg ccaagatctt cggcgcccac atggtgccca agcagaccaa actgctgaga 480
ttcgtggtca acgacggcac ccgctaccag atgtgcgtga tgaagctgga aagctgggcc 540
cacgtgttcc gggattactc cgtgtctttc caagtgcggc tgaccttcac cgaggccaac 600
aaccagacct acaccttctg cacccatcct aacctgatcg tcggaggcgg aggatctggc 660
ggaggtggaa gtggcggagg cggatctgag cccgaggcct aa 702
<210> 46
<211> 390
<212> DNA
<213> Artificial Sequence
<220>
<223> UL131A (without introns) optimised for CHO expression
<220>
<221> misc_feature
<222> (1)..(54)
<223> UL131 signal peptide
<220>
<221> misc_feature
<222> (55)..(387)
<223> UL131 ectodomain
<220>
<221> misc_feature
<222> (388)..(390)
<223> Stop codon
<400> 46
atgagactgt gcagagtgtg gctgtccgtg tgcctgtgtg ctgtggttct gggccagtgc 60
cagagagaga cagccgagaa gaacgactac tacagagtgc cccactactg ggacgcctgc 120
agtagagctt tgcccgatca gacccggtac aaatacgtgg aacagctggt ggatctgacc 180
ctgaactacc actacgacgc ctctcacggc ctggacaact tcgacgtgct gaagcggatc 240
aacgtgaccg aggtgtccct gctgatctct gacttccggc ggcagaatag aagaggcggc 300
accaacaagc ggaccacctt taatgctgcc ggctctctgg ctccccacgc cagatctctg 360
gaattttccg tgcggctgtt cgccaactaa 390
<210> 47
<211> 1587
<212> DNA
<213> Artificial Sequence
<220>
<223> RSV-F-SpyTag-Ctag
<220>
<221> misc_feature
<222> (1)..(75)
<223> Signal peptide
<220>
<221> misc_feature
<222> (1435)..(1515)
<223> Foldon domain
<220>
<221> misc_feature
<222> (1516)..(1533)
<223> (GSG)2 linker
<220>
<221> misc_feature
<222> (1534)..(1572)
<223> Spytag
<220>
<221> misc_feature
<222> (1573)..(1584)
<223> Ctag
<220>
<221> misc_feature
<222> (1585)..(1587)
<223> Stop codon
<400> 47
atggaactgc tgatcctgaa ggccaacgcc atcaccacca tcctgaccgc cgtgaccttc 60
tgcttcgcca gcggccagaa catcaccgag gaattctacc agagcacctg cagcgccgtg 120
agcaagggct acctgagcgc cctgcggacc ggctggtaca ccagcgtgat caccatcgag 180
ctgtccaaca tcaaagaaaa caagtgcaac ggcaccgacg ccaaagtgaa gctgatcaag 240
caggaactgg acaagtacaa gaacgccgtg accgagctgc agctgctgat gcagagcacc 300
cccgccaccg gatctggcag cgccatttgc agcggcgtgg ccgtgtgtaa agtgctgcac 360
ctggaaggcg aagtgaacaa gatcaagtcc gccctgctgt ccaccaacaa ggccgtggtg 420
tccctgagca acggcgtgag cgtgctgacc ttcaaggtgc tggatctgaa gaactacatc 480
gacaagcagc tgctgcccat cctgaacaag cagagctgca gcatcagcaa catcgagaca 540
gtgatcgagt tccagcagaa gaacaaccgg ctgctggaaa tcacccggga gttcagcgtg 600
aacgccggag tgaccacccc cgtgtccacc tacatgctga ccaacagcga gctgctgtcc 660
ctgatcaatg acatgcccat caccaacgac cagaaaaagc tgatgagcaa caacgtgcag 720
atcgtgcggc agcagagcta ctccatcatg tgcatcatca aagaagaggt gctggcctac 780
gtggtgcagc tgcccctgta cggcgtgatc gacaccccct gctggaagct gcacaccagc 840
cccctgtgca caaccaacac caaagagggc agcaacatct gcctgacccg gaccgaccgg 900
ggctggtact gcgacaacgc cggcagcgtg tccttctttc cacaggccga gacatgcaag 960
gtgcagagca accgggtgtt ctgcgacacc atgaacagcc ggaccctgcc ctccgaagtg 1020
aacctgtgca acgtggacat cttcaacccc aagtacgact gcaagatcat gacctccaag 1080
accgacgtgt ccagctccgt gatcacctcc ctgggcgcca tcgtgtcctg ctacggcaag 1140
accaagtgca ccgccagcaa caagaacaga ggcatcatca agaccttcag caacggctgc 1200
gactacgtgt ccaataaggg cgtggacacc gtgtccgtgg gcaacacact gtactgcgtg 1260
aataagcagg aaggcaagag cctgtacgtg aagggcgagc ccatcatcaa cttctacgac 1320
cccctggtgt tccccagcga cgagttcgac gctagcatca gccaggtgaa cgagaagatc 1380
aaccagagcc tggccttcat cagaaagagc gacgaactgc tgtccgccat cggcggctac 1440
atccccgagg cccccagaga tggccaggcc tacgtgcgga aggacggcga gtgggtgctg 1500
ctgtctacat ttctgggaag cggaggctct ggtgcccata tcgtgatggt ggacgcctac 1560
aagcctacca aagagcccga ggcctaa 1587
<210> 48
<211> 1515
<212> DNA
<213> Artificial Sequence
<220>
<223> Sc9-10 DS-Cav1 A149C Y458C (RSV-F)
<220>
<221> misc_feature
<222> (1)..(75)
<223> Signal peptide
<220>
<221> misc_feature
<222> (1435)..(1515)
<223> Foldon domain
<400> 48
atggaactgc tgatcctgaa ggccaacgcc atcaccacca tcctgaccgc cgtgaccttc 60
tgcttcgcca gcggccagaa catcaccgag gaattctacc agagcacctg cagcgccgtg 120
agcaagggct acctgagcgc cctgcggacc ggctggtaca ccagcgtgat caccatcgag 180
ctgtccaaca tcaaagaaaa caagtgcaac ggcaccgacg ccaaagtgaa gctgatcaag 240
caggaactgg acaagtacaa gaacgccgtg accgagctgc agctgctgat gcagagcacc 300
cccgccaccg gatctggcag cgccatttgc agcggcgtgg ccgtgtgtaa agtgctgcac 360
ctggaaggcg aagtgaacaa gatcaagtcc gccctgctgt ccaccaacaa ggccgtggtg 420
tccctgagca acggcgtgag cgtgctgacc ttcaaggtgc tggatctgaa gaactacatc 480
gacaagcagc tgctgcccat cctgaacaag cagagctgca gcatcagcaa catcgagaca 540
gtgatcgagt tccagcagaa gaacaaccgg ctgctggaaa tcacccggga gttcagcgtg 600
aacgccggag tgaccacccc cgtgtccacc tacatgctga ccaacagcga gctgctgtcc 660
ctgatcaatg acatgcccat caccaacgac cagaaaaagc tgatgagcaa caacgtgcag 720
atcgtgcggc agcagagcta ctccatcatg tgcatcatca aagaagaggt gctggcctac 780
gtggtgcagc tgcccctgta cggcgtgatc gacaccccct gctggaagct gcacaccagc 840
cccctgtgca caaccaacac caaagagggc agcaacatct gcctgacccg gaccgaccgg 900
ggctggtact gcgacaacgc cggcagcgtg tccttctttc cacaggccga gacatgcaag 960
gtgcagagca accgggtgtt ctgcgacacc atgaacagcc ggaccctgcc ctccgaagtg 1020
aacctgtgca acgtggacat cttcaacccc aagtacgact gcaagatcat gacctccaag 1080
accgacgtgt ccagctccgt gatcacctcc ctgggcgcca tcgtgtcctg ctacggcaag 1140
accaagtgca ccgccagcaa caagaacaga ggcatcatca agaccttcag caacggctgc 1200
gactacgtgt ccaataaggg cgtggacacc gtgtccgtgg gcaacacact gtactgcgtg 1260
aataagcagg aaggcaagag cctgtacgtg aagggcgagc ccatcatcaa cttctacgac 1320
cccctggtgt tccccagcga cgagttcgac gctagcatca gccaggtgaa cgagaagatc 1380
aaccagagcc tggccttcat cagaaagagc gacgaactgc tgtccgccat cggcggctac 1440
atccccgagg cccccagaga tggccaggcc tacgtgcgga aggacggcga gtgggtgctg 1500
ctgtctacat ttctg 1515
<210> 49
<211> 1440
<212> DNA
<213> Artificial Sequence
<220>
<223> Sc-9-10 DS-Cav1 A149C Y458C (RSV-F) without the signal peptide
<220>
<221> misc_feature
<222> (1360)..(1440)
<223> Foldon domain
<400> 49
cagaacatca ccgaggaatt ctaccagagc acctgcagcg ccgtgagcaa gggctacctg 60
agcgccctgc ggaccggctg gtacaccagc gtgatcacca tcgagctgtc caacatcaaa 120
gaaaacaagt gcaacggcac cgacgccaaa gtgaagctga tcaagcagga actggacaag 180
tacaagaacg ccgtgaccga gctgcagctg ctgatgcaga gcacccccgc caccggatct 240
ggcagcgcca tttgcagcgg cgtggccgtg tgtaaagtgc tgcacctgga aggcgaagtg 300
aacaagatca agtccgccct gctgtccacc aacaaggccg tggtgtccct gagcaacggc 360
gtgagcgtgc tgaccttcaa ggtgctggat ctgaagaact acatcgacaa gcagctgctg 420
cccatcctga acaagcagag ctgcagcatc agcaacatcg agacagtgat cgagttccag 480
cagaagaaca accggctgct ggaaatcacc cgggagttca gcgtgaacgc cggagtgacc 540
acccccgtgt ccacctacat gctgaccaac agcgagctgc tgtccctgat caatgacatg 600
cccatcacca acgaccagaa aaagctgatg agcaacaacg tgcagatcgt gcggcagcag 660
agctactcca tcatgtgcat catcaaagaa gaggtgctgg cctacgtggt gcagctgccc 720
ctgtacggcg tgatcgacac cccctgctgg aagctgcaca ccagccccct gtgcacaacc 780
aacaccaaag agggcagcaa catctgcctg acccggaccg accggggctg gtactgcgac 840
aacgccggca gcgtgtcctt ctttccacag gccgagacat gcaaggtgca gagcaaccgg 900
gtgttctgcg acaccatgaa cagccggacc ctgccctccg aagtgaacct gtgcaacgtg 960
gacatcttca accccaagta cgactgcaag atcatgacct ccaagaccga cgtgtccagc 1020
tccgtgatca cctccctggg cgccatcgtg tcctgctacg gcaagaccaa gtgcaccgcc 1080
agcaacaaga acagaggcat catcaagacc ttcagcaacg gctgcgacta cgtgtccaat 1140
aagggcgtgg acaccgtgtc cgtgggcaac acactgtact gcgtgaataa gcaggaaggc 1200
aagagcctgt acgtgaaggg cgagcccatc atcaacttct acgaccccct ggtgttcccc 1260
agcgacgagt tcgacgctag catcagccag gtgaacgaga agatcaacca gagcctggcc 1320
ttcatcagaa agagcgacga actgctgtcc gccatcggcg gctacatccc cgaggccccc 1380
agagatggcc aggcctacgt gcggaaggac ggcgagtggg tgctgctgtc tacatttctg 1440
<210> 50
<211> 528
<212> PRT
<213> Artificial Sequence
<220>
<223> RSV-F-SpyTag-Ctag
<220>
<221> MISC_FEATURE
<222> (1)..(25)
<223> Signal peptide
<220>
<221> MISC_FEATURE
<222> (479)..(505)
<223> Foldon domain
<220>
<221> MISC_FEATURE
<222> (506)..(511)
<223> (GSG)2 linker
<220>
<221> MISC_FEATURE
<222> (512)..(524)
<223> Spytag
<220>
<221> MISC_FEATURE
<222> (525)..(527)
<223> Ctag
<400> 50
Met Glu Leu Leu Ile Leu Lys Ala Asn Ala Ile Thr Thr Ile Leu Thr
1 5 10 15
Ala Val Thr Phe Cys Phe Ala Ser Gly Gln Asn Ile Thr Glu Glu Phe
20 25 30
Tyr Gln Ser Thr Cys Ser Ala Val Ser Lys Gly Tyr Leu Ser Ala Leu
35 40 45
Arg Thr Gly Trp Tyr Thr Ser Val Ile Thr Ile Glu Leu Ser Asn Ile
50 55 60
Lys Glu Asn Lys Cys Asn Gly Thr Asp Ala Lys Val Lys Leu Ile Lys
65 70 75 80
Gln Glu Leu Asp Lys Tyr Lys Asn Ala Val Thr Glu Leu Gln Leu Leu
85 90 95
Met Gln Ser Thr Pro Ala Thr Gly Ser Gly Ser Ala Ile Cys Ser Gly
100 105 110
Val Ala Val Cys Lys Val Leu His Leu Glu Gly Glu Val Asn Lys Ile
115 120 125
Lys Ser Ala Leu Leu Ser Thr Asn Lys Ala Val Val Ser Leu Ser Asn
130 135 140
Gly Val Ser Val Leu Thr Phe Lys Val Leu Asp Leu Lys Asn Tyr Ile
145 150 155 160
Asp Lys Gln Leu Leu Pro Ile Leu Asn Lys Gln Ser Cys Ser Ile Ser
165 170 175
Asn Ile Glu Thr Val Ile Glu Phe Gln Gln Lys Asn Asn Arg Leu Leu
180 185 190
Glu Ile Thr Arg Glu Phe Ser Val Asn Ala Gly Val Thr Thr Pro Val
195 200 205
Ser Thr Tyr Met Leu Thr Asn Ser Glu Leu Leu Ser Leu Ile Asn Asp
210 215 220
Met Pro Ile Thr Asn Asp Gln Lys Lys Leu Met Ser Asn Asn Val Gln
225 230 235 240
Ile Val Arg Gln Gln Ser Tyr Ser Ile Met Cys Ile Ile Lys Glu Glu
245 250 255
Val Leu Ala Tyr Val Val Gln Leu Pro Leu Tyr Gly Val Ile Asp Thr
260 265 270
Pro Cys Trp Lys Leu His Thr Ser Pro Leu Cys Thr Thr Asn Thr Lys
275 280 285
Glu Gly Ser Asn Ile Cys Leu Thr Arg Thr Asp Arg Gly Trp Tyr Cys
290 295 300
Asp Asn Ala Gly Ser Val Ser Phe Phe Pro Gln Ala Glu Thr Cys Lys
305 310 315 320
Val Gln Ser Asn Arg Val Phe Cys Asp Thr Met Asn Ser Arg Thr Leu
325 330 335
Pro Ser Glu Val Asn Leu Cys Asn Val Asp Ile Phe Asn Pro Lys Tyr
340 345 350
Asp Cys Lys Ile Met Thr Ser Lys Thr Asp Val Ser Ser Ser Val Ile
355 360 365
Thr Ser Leu Gly Ala Ile Val Ser Cys Tyr Gly Lys Thr Lys Cys Thr
370 375 380
Ala Ser Asn Lys Asn Arg Gly Ile Ile Lys Thr Phe Ser Asn Gly Cys
385 390 395 400
Asp Tyr Val Ser Asn Lys Gly Val Asp Thr Val Ser Val Gly Asn Thr
405 410 415
Leu Tyr Cys Val Asn Lys Gln Glu Gly Lys Ser Leu Tyr Val Lys Gly
420 425 430
Glu Pro Ile Ile Asn Phe Tyr Asp Pro Leu Val Phe Pro Ser Asp Glu
435 440 445
Phe Asp Ala Ser Ile Ser Gln Val Asn Glu Lys Ile Asn Gln Ser Leu
450 455 460
Ala Phe Ile Arg Lys Ser Asp Glu Leu Leu Ser Ala Ile Gly Gly Tyr
465 470 475 480
Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr Val Arg Lys Asp Gly
485 490 495
Glu Trp Val Leu Leu Ser Thr Phe Leu Gly Ser Gly Gly Ser Gly Ala
500 505 510
His Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys Glu Pro Glu Ala
515 520 525
<210> 51
<211> 1010
<212> PRT
<213> Artificial Sequence
<220>
<223> Sc-9-10 DS-Cav1 A149C Y458C (RSV-F)
<220>
<221> MISC_FEATURE
<222> (1)..(25)
<223> Signal peptide
<220>
<221> MISC_FEATURE
<222> (479)..(505)
<223> Foldon domain
<400> 51
Met Glu Leu Leu Ile Leu Lys Ala Asn Ala Ile Thr Thr Ile Leu Thr
1 5 10 15
Ala Val Thr Phe Cys Phe Ala Ser Gly Gln Asn Ile Thr Glu Glu Phe
20 25 30
Tyr Gln Ser Thr Cys Ser Ala Val Ser Lys Gly Tyr Leu Ser Ala Leu
35 40 45
Arg Thr Gly Trp Tyr Thr Ser Val Ile Thr Ile Glu Leu Ser Asn Ile
50 55 60
Lys Glu Asn Lys Cys Asn Gly Thr Asp Ala Lys Val Lys Leu Ile Lys
65 70 75 80
Gln Glu Leu Asp Lys Tyr Lys Asn Ala Val Thr Glu Leu Gln Leu Leu
85 90 95
Met Gln Ser Thr Pro Ala Thr Gly Ser Gly Ser Ala Ile Cys Ser Gly
100 105 110
Val Ala Val Cys Lys Val Leu His Leu Glu Gly Glu Val Asn Lys Ile
115 120 125
Lys Ser Ala Leu Leu Ser Thr Asn Lys Ala Val Val Ser Leu Ser Asn
130 135 140
Gly Val Ser Val Leu Thr Phe Lys Val Leu Asp Leu Lys Asn Tyr Ile
145 150 155 160
Asp Lys Gln Leu Leu Pro Ile Leu Asn Lys Gln Ser Cys Ser Ile Ser
165 170 175
Asn Ile Glu Thr Val Ile Glu Phe Gln Gln Lys Asn Asn Arg Leu Leu
180 185 190
Glu Ile Thr Arg Glu Phe Ser Val Asn Ala Gly Val Thr Thr Pro Val
195 200 205
Ser Thr Tyr Met Leu Thr Asn Ser Glu Leu Leu Ser Leu Ile Asn Asp
210 215 220
Met Pro Ile Thr Asn Asp Gln Lys Lys Leu Met Ser Asn Asn Val Gln
225 230 235 240
Ile Val Arg Gln Gln Ser Tyr Ser Ile Met Cys Ile Ile Lys Glu Glu
245 250 255
Val Leu Ala Tyr Val Val Gln Leu Pro Leu Tyr Gly Val Ile Asp Thr
260 265 270
Pro Cys Trp Lys Leu His Thr Ser Pro Leu Cys Thr Thr Asn Thr Lys
275 280 285
Glu Gly Ser Asn Ile Cys Leu Thr Arg Thr Asp Arg Gly Trp Tyr Cys
290 295 300
Asp Asn Ala Gly Ser Val Ser Phe Phe Pro Gln Ala Glu Thr Cys Lys
305 310 315 320
Val Gln Ser Asn Arg Val Phe Cys Asp Thr Met Asn Ser Arg Thr Leu
325 330 335
Pro Ser Glu Val Asn Leu Cys Asn Val Asp Ile Phe Asn Pro Lys Tyr
340 345 350
Asp Cys Lys Ile Met Thr Ser Lys Thr Asp Val Ser Ser Ser Val Ile
355 360 365
Thr Ser Leu Met Glu Leu Leu Ile Leu Lys Ala Asn Ala Ile Thr Thr
370 375 380
Ile Leu Thr Ala Val Thr Phe Cys Phe Ala Ser Gly Gln Asn Ile Thr
385 390 395 400
Glu Glu Phe Tyr Gln Ser Thr Cys Ser Ala Val Ser Lys Gly Tyr Leu
405 410 415
Ser Ala Leu Arg Thr Gly Trp Tyr Thr Ser Val Ile Thr Ile Glu Leu
420 425 430
Ser Asn Ile Lys Glu Asn Lys Cys Asn Gly Thr Asp Ala Lys Val Lys
435 440 445
Leu Ile Lys Gln Glu Leu Asp Lys Tyr Lys Asn Ala Val Thr Glu Leu
450 455 460
Gln Leu Leu Met Gln Ser Thr Pro Ala Thr Gly Ser Gly Ser Ala Ile
465 470 475 480
Cys Ser Gly Val Ala Val Cys Lys Val Leu His Leu Glu Gly Glu Val
485 490 495
Asn Lys Ile Lys Ser Ala Leu Leu Ser Thr Asn Lys Ala Val Val Ser
500 505 510
Leu Ser Asn Gly Val Ser Val Leu Thr Phe Lys Val Leu Asp Leu Lys
515 520 525
Asn Tyr Ile Asp Lys Gln Leu Leu Pro Ile Leu Asn Lys Gln Ser Cys
530 535 540
Ser Ile Ser Asn Ile Glu Thr Val Ile Glu Phe Gln Gln Lys Asn Asn
545 550 555 560
Arg Leu Leu Glu Ile Thr Arg Glu Phe Ser Val Asn Ala Gly Val Thr
565 570 575
Thr Pro Val Ser Thr Tyr Met Leu Thr Asn Ser Glu Leu Leu Ser Leu
580 585 590
Ile Asn Asp Met Pro Ile Thr Asn Asp Gln Lys Lys Leu Met Ser Asn
595 600 605
Asn Val Gln Ile Val Arg Gln Gln Ser Tyr Ser Ile Met Cys Ile Ile
610 615 620
Lys Glu Glu Val Leu Ala Tyr Val Val Gln Leu Pro Leu Tyr Gly Val
625 630 635 640
Ile Asp Thr Pro Cys Trp Lys Leu His Thr Ser Pro Leu Cys Thr Thr
645 650 655
Asn Thr Lys Glu Gly Ser Asn Ile Cys Leu Thr Arg Thr Asp Arg Gly
660 665 670
Trp Tyr Cys Asp Asn Ala Gly Ser Val Ser Phe Phe Pro Gln Ala Glu
675 680 685
Thr Cys Lys Val Gln Ser Asn Arg Val Phe Cys Asp Thr Met Asn Ser
690 695 700
Arg Thr Leu Pro Ser Glu Val Asn Leu Cys Asn Val Asp Ile Phe Asn
705 710 715 720
Pro Lys Tyr Asp Cys Lys Ile Met Thr Ser Lys Thr Asp Val Ser Ser
725 730 735
Ser Val Ile Thr Ser Leu Gly Ala Ile Val Ser Cys Tyr Gly Lys Thr
740 745 750
Lys Cys Thr Ala Ser Asn Lys Asn Arg Gly Ile Ile Lys Thr Phe Ser
755 760 765
Asn Gly Cys Asp Tyr Val Ser Asn Lys Gly Val Asp Thr Val Ser Val
770 775 780
Gly Asn Thr Leu Tyr Cys Val Asn Lys Gln Glu Gly Lys Ser Leu Tyr
785 790 795 800
Val Lys Gly Glu Pro Ile Ile Asn Phe Tyr Asp Pro Leu Val Phe Pro
805 810 815
Ser Asp Glu Phe Asp Ala Ser Ile Ser Gln Val Asn Glu Lys Ile Asn
820 825 830
Gln Ser Leu Ala Phe Ile Arg Lys Ser Asp Glu Leu Leu Ser Ala Ile
835 840 845
Gly Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr Val Arg
850 855 860
Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu Gly Ala Ile Val
865 870 875 880
Ser Cys Tyr Gly Lys Thr Lys Cys Thr Ala Ser Asn Lys Asn Arg Gly
885 890 895
Ile Ile Lys Thr Phe Ser Asn Gly Cys Asp Tyr Val Ser Asn Lys Gly
900 905 910
Val Asp Thr Val Ser Val Gly Asn Thr Leu Tyr Cys Val Asn Lys Gln
915 920 925
Glu Gly Lys Ser Leu Tyr Val Lys Gly Glu Pro Ile Ile Asn Phe Tyr
930 935 940
Asp Pro Leu Val Phe Pro Ser Asp Glu Phe Asp Ala Ser Ile Ser Gln
945 950 955 960
Val Asn Glu Lys Ile Asn Gln Ser Leu Ala Phe Ile Arg Lys Ser Asp
965 970 975
Glu Leu Leu Ser Ala Ile Gly Gly Tyr Ile Pro Glu Ala Pro Arg Asp
980 985 990
Gly Gln Ala Tyr Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr
995 1000 1005
Phe Leu
1010
<210> 52
<211> 480
<212> PRT
<213> Artificial Sequence
<220>
<223> sc9-10 DS-Cav1 A149C Y458C (RSV-F) without the signal peptide
<220>
<221> MISC_FEATURE
<222> (454)..(480)
<223> Foldon domain
<400> 52
Gln Asn Ile Thr Glu Glu Phe Tyr Gln Ser Thr Cys Ser Ala Val Ser
1 5 10 15
Lys Gly Tyr Leu Ser Ala Leu Arg Thr Gly Trp Tyr Thr Ser Val Ile
20 25 30
Thr Ile Glu Leu Ser Asn Ile Lys Glu Asn Lys Cys Asn Gly Thr Asp
35 40 45
Ala Lys Val Lys Leu Ile Lys Gln Glu Leu Asp Lys Tyr Lys Asn Ala
50 55 60
Val Thr Glu Leu Gln Leu Leu Met Gln Ser Thr Pro Ala Thr Gly Ser
65 70 75 80
Gly Ser Ala Ile Cys Ser Gly Val Ala Val Cys Lys Val Leu His Leu
85 90 95
Glu Gly Glu Val Asn Lys Ile Lys Ser Ala Leu Leu Ser Thr Asn Lys
100 105 110
Ala Val Val Ser Leu Ser Asn Gly Val Ser Val Leu Thr Phe Lys Val
115 120 125
Leu Asp Leu Lys Asn Tyr Ile Asp Lys Gln Leu Leu Pro Ile Leu Asn
130 135 140
Lys Gln Ser Cys Ser Ile Ser Asn Ile Glu Thr Val Ile Glu Phe Gln
145 150 155 160
Gln Lys Asn Asn Arg Leu Leu Glu Ile Thr Arg Glu Phe Ser Val Asn
165 170 175
Ala Gly Val Thr Thr Pro Val Ser Thr Tyr Met Leu Thr Asn Ser Glu
180 185 190
Leu Leu Ser Leu Ile Asn Asp Met Pro Ile Thr Asn Asp Gln Lys Lys
195 200 205
Leu Met Ser Asn Asn Val Gln Ile Val Arg Gln Gln Ser Tyr Ser Ile
210 215 220
Met Cys Ile Ile Lys Glu Glu Val Leu Ala Tyr Val Val Gln Leu Pro
225 230 235 240
Leu Tyr Gly Val Ile Asp Thr Pro Cys Trp Lys Leu His Thr Ser Pro
245 250 255
Leu Cys Thr Thr Asn Thr Lys Glu Gly Ser Asn Ile Cys Leu Thr Arg
260 265 270
Thr Asp Arg Gly Trp Tyr Cys Asp Asn Ala Gly Ser Val Ser Phe Phe
275 280 285
Pro Gln Ala Glu Thr Cys Lys Val Gln Ser Asn Arg Val Phe Cys Asp
290 295 300
Thr Met Asn Ser Arg Thr Leu Pro Ser Glu Val Asn Leu Cys Asn Val
305 310 315 320
Asp Ile Phe Asn Pro Lys Tyr Asp Cys Lys Ile Met Thr Ser Lys Thr
325 330 335
Asp Val Ser Ser Ser Val Ile Thr Ser Leu Gly Ala Ile Val Ser Cys
340 345 350
Tyr Gly Lys Thr Lys Cys Thr Ala Ser Asn Lys Asn Arg Gly Ile Ile
355 360 365
Lys Thr Phe Ser Asn Gly Cys Asp Tyr Val Ser Asn Lys Gly Val Asp
370 375 380
Thr Val Ser Val Gly Asn Thr Leu Tyr Cys Val Asn Lys Gln Glu Gly
385 390 395 400
Lys Ser Leu Tyr Val Lys Gly Glu Pro Ile Ile Asn Phe Tyr Asp Pro
405 410 415
Leu Val Phe Pro Ser Asp Glu Phe Asp Ala Ser Ile Ser Gln Val Asn
420 425 430
Glu Lys Ile Asn Gln Ser Leu Ala Phe Ile Arg Lys Ser Asp Glu Leu
435 440 445
Leu Ser Ala Ile Gly Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln
450 455 460
Ala Tyr Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu
465 470 475 480
<210> 53
<211> 1704
<212> DNA
<213> Artificial Sequence
<220>
<223> RSV-F DS-Cav1-SpyTag-Ctag
<220>
<221> misc_feature
<222> (1)..(75)
<223> Signal peptide
<220>
<221> misc_feature
<222> (1552)..(1632)
<223> Foldon domain
<220>
<221> misc_feature
<222> (1633)..(1650)
<223> (GSG)2 linker
<220>
<221> misc_feature
<222> (1651)..(1689)
<223> Spytag
<220>
<221> misc_feature
<222> (1690)..(1701)
<223> Ctag
<220>
<221> misc_feature
<222> (1702)..(1704)
<223> Stop codon
<400> 53
atggaactgc tgatcctgaa ggccaacgcc atcaccacca tcctgaccgc cgtgaccttc 60
tgcttcgcca gcggccagaa catcaccgag gaattctacc agagcacctg cagcgccgtg 120
agcaagggct acctgagcgc cctgcggacc ggctggtaca ccagcgtgat caccatcgag 180
ctgtccaaca tcaaagaaaa caagtgcaac ggcaccgacg ccaaagtgaa gctgatcaag 240
caggaactgg acaagtacaa gaacgccgtg accgagctgc agctgctgat gcagagcacc 300
cccgccacca acaacagagc cagaagagag ctgccccggt tcatgaacta caccctgaac 360
aacgccaaga aaaccaacgt gaccctgagc aagaagagaa agagaagatt cctgggcttc 420
ctgctgggcg tgggcagcgc cattgccagc ggcgtggccg tgtgtaaagt gctgcacctg 480
gaaggcgaag tgaacaagat caagtccgcc ctgctgtcca ccaacaaggc cgtggtgtcc 540
ctgagcaacg gcgtgagcgt gctgaccttc aaggtgctgg atctgaagaa ctacatcgac 600
aagcagctgc tgcccatcct gaacaagcag agctgcagca tcagcaacat cgagacagtg 660
atcgagttcc agcagaagaa caaccggctg ctggaaatca cccgggagtt cagcgtgaac 720
gccggagtga ccacccccgt gtccacctac atgctgacca acagcgagct gctgtccctg 780
atcaatgaca tgcccatcac caacgaccag aaaaagctga tgagcaacaa cgtgcagatc 840
gtgcggcagc agagctactc catcatgtgc atcatcaaag aagaggtgct ggcctacgtg 900
gtgcagctgc ccctgtacgg cgtgatcgac accccctgct ggaagctgca caccagcccc 960
ctgtgcacaa ccaacaccaa agagggcagc aacatctgcc tgacccggac cgaccggggc 1020
tggtactgcg acaacgccgg cagcgtgtcc ttctttccac aggccgagac atgcaaggtg 1080
cagagcaacc gggtgttctg cgacaccatg aacagcctga ccctgccctc cgaagtgaac 1140
ctgtgcaacg tggacatctt caaccccaag tacgactgca agatcatgac ctccaagacc 1200
gacgtgtcca gctccgtgat cacctccctg ggcgccatcg tgtcctgcta cggcaagacc 1260
aagtgcaccg ccagcaacaa gaacagaggc atcatcaaga ccttcagcaa cggctgcgac 1320
tacgtgtcca ataagggcgt ggacaccgtg tccgtgggca acacactgta ctacgtgaat 1380
aagcaggaag gcaagagcct gtacgtgaag ggcgagccca tcatcaactt ctacgacccc 1440
ctggtgttcc ccagcgacga gttcgacgcc agcatcagcc aggtgaacga gaagatcaac 1500
cagagcctgg ccttcatcag aaagagcgac gaactgctgt ccgccatcgg cggctacatc 1560
cccgaggccc ccagagatgg ccaggcctac gtgcggaagg acggcgagtg ggtgctgctg 1620
tctacatttc tgggaagcgg aggctctggt gcccatatcg tgatggtgga cgcctacaag 1680
cctaccaaag agcccgaggc ctaa 1704
<210> 54
<211> 1632
<212> DNA
<213> Artificial Sequence
<220>
<223> RSV-F DS-Cav1
<220>
<221> misc_feature
<222> (1)..(75)
<223> Signal peptide
<220>
<221> misc_feature
<222> (1552)..(1632)
<223> Foldon domain
<400> 54
atggaactgc tgatcctgaa ggccaacgcc atcaccacca tcctgaccgc cgtgaccttc 60
tgcttcgcca gcggccagaa catcaccgag gaattctacc agagcacctg cagcgccgtg 120
agcaagggct acctgagcgc cctgcggacc ggctggtaca ccagcgtgat caccatcgag 180
ctgtccaaca tcaaagaaaa caagtgcaac ggcaccgacg ccaaagtgaa gctgatcaag 240
caggaactgg acaagtacaa gaacgccgtg accgagctgc agctgctgat gcagagcacc 300
cccgccacca acaacagagc cagaagagag ctgccccggt tcatgaacta caccctgaac 360
aacgccaaga aaaccaacgt gaccctgagc aagaagagaa agagaagatt cctgggcttc 420
ctgctgggcg tgggcagcgc cattgccagc ggcgtggccg tgtgtaaagt gctgcacctg 480
gaaggcgaag tgaacaagat caagtccgcc ctgctgtcca ccaacaaggc cgtggtgtcc 540
ctgagcaacg gcgtgagcgt gctgaccttc aaggtgctgg atctgaagaa ctacatcgac 600
aagcagctgc tgcccatcct gaacaagcag agctgcagca tcagcaacat cgagacagtg 660
atcgagttcc agcagaagaa caaccggctg ctggaaatca cccgggagtt cagcgtgaac 720
gccggagtga ccacccccgt gtccacctac atgctgacca acagcgagct gctgtccctg 780
atcaatgaca tgcccatcac caacgaccag aaaaagctga tgagcaacaa cgtgcagatc 840
gtgcggcagc agagctactc catcatgtgc atcatcaaag aagaggtgct ggcctacgtg 900
gtgcagctgc ccctgtacgg cgtgatcgac accccctgct ggaagctgca caccagcccc 960
ctgtgcacaa ccaacaccaa agagggcagc aacatctgcc tgacccggac cgaccggggc 1020
tggtactgcg acaacgccgg cagcgtgtcc ttctttccac aggccgagac atgcaaggtg 1080
cagagcaacc gggtgttctg cgacaccatg aacagcctga ccctgccctc cgaagtgaac 1140
ctgtgcaacg tggacatctt caaccccaag tacgactgca agatcatgac ctccaagacc 1200
gacgtgtcca gctccgtgat cacctccctg ggcgccatcg tgtcctgcta cggcaagacc 1260
aagtgcaccg ccagcaacaa gaacagaggc atcatcaaga ccttcagcaa cggctgcgac 1320
tacgtgtcca ataagggcgt ggacaccgtg tccgtgggca acacactgta ctacgtgaat 1380
aagcaggaag gcaagagcct gtacgtgaag ggcgagccca tcatcaactt ctacgacccc 1440
ctggtgttcc ccagcgacga gttcgacgcc agcatcagcc aggtgaacga gaagatcaac 1500
cagagcctgg ccttcatcag aaagagcgac gaactgctgt ccgccatcgg cggctacatc 1560
cccgaggccc ccagagatgg ccaggcctac gtgcggaagg acggcgagtg ggtgctgctg 1620
tctacatttc tg 1632
<210> 55
<211> 1557
<212> DNA
<213> Artificial Sequence
<220>
<223> RSV-F DS-Cav1 without the signal peptide
<220>
<221> misc_feature
<222> (1477)..(1557)
<223> Foldon domain
<400> 55
cagaacatca ccgaggaatt ctaccagagc acctgcagcg ccgtgagcaa gggctacctg 60
agcgccctgc ggaccggctg gtacaccagc gtgatcacca tcgagctgtc caacatcaaa 120
gaaaacaagt gcaacggcac cgacgccaaa gtgaagctga tcaagcagga actggacaag 180
tacaagaacg ccgtgaccga gctgcagctg ctgatgcaga gcacccccgc caccaacaac 240
agagccagaa gagagctgcc ccggttcatg aactacaccc tgaacaacgc caagaaaacc 300
aacgtgaccc tgagcaagaa gagaaagaga agattcctgg gcttcctgct gggcgtgggc 360
agcgccattg ccagcggcgt ggccgtgtgt aaagtgctgc acctggaagg cgaagtgaac 420
aagatcaagt ccgccctgct gtccaccaac aaggccgtgg tgtccctgag caacggcgtg 480
agcgtgctga ccttcaaggt gctggatctg aagaactaca tcgacaagca gctgctgccc 540
atcctgaaca agcagagctg cagcatcagc aacatcgaga cagtgatcga gttccagcag 600
aagaacaacc ggctgctgga aatcacccgg gagttcagcg tgaacgccgg agtgaccacc 660
cccgtgtcca cctacatgct gaccaacagc gagctgctgt ccctgatcaa tgacatgccc 720
atcaccaacg accagaaaaa gctgatgagc aacaacgtgc agatcgtgcg gcagcagagc 780
tactccatca tgtgcatcat caaagaagag gtgctggcct acgtggtgca gctgcccctg 840
tacggcgtga tcgacacccc ctgctggaag ctgcacacca gccccctgtg cacaaccaac 900
accaaagagg gcagcaacat ctgcctgacc cggaccgacc ggggctggta ctgcgacaac 960
gccggcagcg tgtccttctt tccacaggcc gagacatgca aggtgcagag caaccgggtg 1020
ttctgcgaca ccatgaacag cctgaccctg ccctccgaag tgaacctgtg caacgtggac 1080
atcttcaacc ccaagtacga ctgcaagatc atgacctcca agaccgacgt gtccagctcc 1140
gtgatcacct ccctgggcgc catcgtgtcc tgctacggca agaccaagtg caccgccagc 1200
aacaagaaca gaggcatcat caagaccttc agcaacggct gcgactacgt gtccaataag 1260
ggcgtggaca ccgtgtccgt gggcaacaca ctgtactacg tgaataagca ggaaggcaag 1320
agcctgtacg tgaagggcga gcccatcatc aacttctacg accccctggt gttccccagc 1380
gacgagttcg acgccagcat cagccaggtg aacgagaaga tcaaccagag cctggccttc 1440
atcagaaaga gcgacgaact gctgtccgcc atcggcggct acatccccga ggcccccaga 1500
gatggccagg cctacgtgcg gaaggacggc gagtgggtgc tgctgtctac atttctg 1557
<210> 56
<211> 567
<212> PRT
<213> Artificial Sequence
<220>
<223> RSV-F DS-Cav1-SpyTag-Ctag
<220>
<221> MISC_FEATURE
<222> (1)..(25)
<223> Signal peptide
<220>
<221> MISC_FEATURE
<222> (518)..(544)
<223> Foldon domain
<220>
<221> MISC_FEATURE
<222> (545)..(550)
<223> Linker
<220>
<221> MISC_FEATURE
<222> (551)..(563)
<223> Spytag
<220>
<221> MISC_FEATURE
<222> (564)..(567)
<223> Ctag
<400> 56
Met Glu Leu Leu Ile Leu Lys Ala Asn Ala Ile Thr Thr Ile Leu Thr
1 5 10 15
Ala Val Thr Phe Cys Phe Ala Ser Gly Gln Asn Ile Thr Glu Glu Phe
20 25 30
Tyr Gln Ser Thr Cys Ser Ala Val Ser Lys Gly Tyr Leu Ser Ala Leu
35 40 45
Arg Thr Gly Trp Tyr Thr Ser Val Ile Thr Ile Glu Leu Ser Asn Ile
50 55 60
Lys Glu Asn Lys Cys Asn Gly Thr Asp Ala Lys Val Lys Leu Ile Lys
65 70 75 80
Gln Glu Leu Asp Lys Tyr Lys Asn Ala Val Thr Glu Leu Gln Leu Leu
85 90 95
Met Gln Ser Thr Pro Ala Thr Asn Asn Arg Ala Arg Arg Glu Leu Pro
100 105 110
Arg Phe Met Asn Tyr Thr Leu Asn Asn Ala Lys Lys Thr Asn Val Thr
115 120 125
Leu Ser Lys Lys Arg Lys Arg Arg Phe Leu Gly Phe Leu Leu Gly Val
130 135 140
Gly Ser Ala Ile Ala Ser Gly Val Ala Val Cys Lys Val Leu His Leu
145 150 155 160
Glu Gly Glu Val Asn Lys Ile Lys Ser Ala Leu Leu Ser Thr Asn Lys
165 170 175
Ala Val Val Ser Leu Ser Asn Gly Val Ser Val Leu Thr Phe Lys Val
180 185 190
Leu Asp Leu Lys Asn Tyr Ile Asp Lys Gln Leu Leu Pro Ile Leu Asn
195 200 205
Lys Gln Ser Cys Ser Ile Ser Asn Ile Glu Thr Val Ile Glu Phe Gln
210 215 220
Gln Lys Asn Asn Arg Leu Leu Glu Ile Thr Arg Glu Phe Ser Val Asn
225 230 235 240
Ala Gly Val Thr Thr Pro Val Ser Thr Tyr Met Leu Thr Asn Ser Glu
245 250 255
Leu Leu Ser Leu Ile Asn Asp Met Pro Ile Thr Asn Asp Gln Lys Lys
260 265 270
Leu Met Ser Asn Asn Val Gln Ile Val Arg Gln Gln Ser Tyr Ser Ile
275 280 285
Met Cys Ile Ile Lys Glu Glu Val Leu Ala Tyr Val Val Gln Leu Pro
290 295 300
Leu Tyr Gly Val Ile Asp Thr Pro Cys Trp Lys Leu His Thr Ser Pro
305 310 315 320
Leu Cys Thr Thr Asn Thr Lys Glu Gly Ser Asn Ile Cys Leu Thr Arg
325 330 335
Thr Asp Arg Gly Trp Tyr Cys Asp Asn Ala Gly Ser Val Ser Phe Phe
340 345 350
Pro Gln Ala Glu Thr Cys Lys Val Gln Ser Asn Arg Val Phe Cys Asp
355 360 365
Thr Met Asn Ser Leu Thr Leu Pro Ser Glu Val Asn Leu Cys Asn Val
370 375 380
Asp Ile Phe Asn Pro Lys Tyr Asp Cys Lys Ile Met Thr Ser Lys Thr
385 390 395 400
Asp Val Ser Ser Ser Val Ile Thr Ser Leu Gly Ala Ile Val Ser Cys
405 410 415
Tyr Gly Lys Thr Lys Cys Thr Ala Ser Asn Lys Asn Arg Gly Ile Ile
420 425 430
Lys Thr Phe Ser Asn Gly Cys Asp Tyr Val Ser Asn Lys Gly Val Asp
435 440 445
Thr Val Ser Val Gly Asn Thr Leu Tyr Tyr Val Asn Lys Gln Glu Gly
450 455 460
Lys Ser Leu Tyr Val Lys Gly Glu Pro Ile Ile Asn Phe Tyr Asp Pro
465 470 475 480
Leu Val Phe Pro Ser Asp Glu Phe Asp Ala Ser Ile Ser Gln Val Asn
485 490 495
Glu Lys Ile Asn Gln Ser Leu Ala Phe Ile Arg Lys Ser Asp Glu Leu
500 505 510
Leu Ser Ala Ile Gly Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln
515 520 525
Ala Tyr Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu
530 535 540
Gly Ser Gly Gly Ser Gly Ala His Ile Val Met Val Asp Ala Tyr Lys
545 550 555 560
Pro Thr Lys Glu Pro Glu Ala
565
<210> 57
<211> 544
<212> PRT
<213> Artificial Sequence
<220>
<223> RSV-F DS-Cav1
<220>
<221> MISC_FEATURE
<222> (1)..(25)
<223> Signal peptide
<220>
<221> MISC_FEATURE
<222> (518)..(544)
<223> Foldon domain
<400> 57
Met Glu Leu Leu Ile Leu Lys Ala Asn Ala Ile Thr Thr Ile Leu Thr
1 5 10 15
Ala Val Thr Phe Cys Phe Ala Ser Gly Gln Asn Ile Thr Glu Glu Phe
20 25 30
Tyr Gln Ser Thr Cys Ser Ala Val Ser Lys Gly Tyr Leu Ser Ala Leu
35 40 45
Arg Thr Gly Trp Tyr Thr Ser Val Ile Thr Ile Glu Leu Ser Asn Ile
50 55 60
Lys Glu Asn Lys Cys Asn Gly Thr Asp Ala Lys Val Lys Leu Ile Lys
65 70 75 80
Gln Glu Leu Asp Lys Tyr Lys Asn Ala Val Thr Glu Leu Gln Leu Leu
85 90 95
Met Gln Ser Thr Pro Ala Thr Asn Asn Arg Ala Arg Arg Glu Leu Pro
100 105 110
Arg Phe Met Asn Tyr Thr Leu Asn Asn Ala Lys Lys Thr Asn Val Thr
115 120 125
Leu Ser Lys Lys Arg Lys Arg Arg Phe Leu Gly Phe Leu Leu Gly Val
130 135 140
Gly Ser Ala Ile Ala Ser Gly Val Ala Val Cys Lys Val Leu His Leu
145 150 155 160
Glu Gly Glu Val Asn Lys Ile Lys Ser Ala Leu Leu Ser Thr Asn Lys
165 170 175
Ala Val Val Ser Leu Ser Asn Gly Val Ser Val Leu Thr Phe Lys Val
180 185 190
Leu Asp Leu Lys Asn Tyr Ile Asp Lys Gln Leu Leu Pro Ile Leu Asn
195 200 205
Lys Gln Ser Cys Ser Ile Ser Asn Ile Glu Thr Val Ile Glu Phe Gln
210 215 220
Gln Lys Asn Asn Arg Leu Leu Glu Ile Thr Arg Glu Phe Ser Val Asn
225 230 235 240
Ala Gly Val Thr Thr Pro Val Ser Thr Tyr Met Leu Thr Asn Ser Glu
245 250 255
Leu Leu Ser Leu Ile Asn Asp Met Pro Ile Thr Asn Asp Gln Lys Lys
260 265 270
Leu Met Ser Asn Asn Val Gln Ile Val Arg Gln Gln Ser Tyr Ser Ile
275 280 285
Met Cys Ile Ile Lys Glu Glu Val Leu Ala Tyr Val Val Gln Leu Pro
290 295 300
Leu Tyr Gly Val Ile Asp Thr Pro Cys Trp Lys Leu His Thr Ser Pro
305 310 315 320
Leu Cys Thr Thr Asn Thr Lys Glu Gly Ser Asn Ile Cys Leu Thr Arg
325 330 335
Thr Asp Arg Gly Trp Tyr Cys Asp Asn Ala Gly Ser Val Ser Phe Phe
340 345 350
Pro Gln Ala Glu Thr Cys Lys Val Gln Ser Asn Arg Val Phe Cys Asp
355 360 365
Thr Met Asn Ser Leu Thr Leu Pro Ser Glu Val Asn Leu Cys Asn Val
370 375 380
Asp Ile Phe Asn Pro Lys Tyr Asp Cys Lys Ile Met Thr Ser Lys Thr
385 390 395 400
Asp Val Ser Ser Ser Val Ile Thr Ser Leu Gly Ala Ile Val Ser Cys
405 410 415
Tyr Gly Lys Thr Lys Cys Thr Ala Ser Asn Lys Asn Arg Gly Ile Ile
420 425 430
Lys Thr Phe Ser Asn Gly Cys Asp Tyr Val Ser Asn Lys Gly Val Asp
435 440 445
Thr Val Ser Val Gly Asn Thr Leu Tyr Tyr Val Asn Lys Gln Glu Gly
450 455 460
Lys Ser Leu Tyr Val Lys Gly Glu Pro Ile Ile Asn Phe Tyr Asp Pro
465 470 475 480
Leu Val Phe Pro Ser Asp Glu Phe Asp Ala Ser Ile Ser Gln Val Asn
485 490 495
Glu Lys Ile Asn Gln Ser Leu Ala Phe Ile Arg Lys Ser Asp Glu Leu
500 505 510
Leu Ser Ala Ile Gly Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln
515 520 525
Ala Tyr Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu
530 535 540
<210> 58
<211> 519
<212> PRT
<213> Artificial Sequence
<220>
<223> RSV-F DS-Cav1 without the signal peptide
<220>
<221> MISC_FEATURE
<222> (493)..(519)
<223> Foldon domain
<400> 58
Gln Asn Ile Thr Glu Glu Phe Tyr Gln Ser Thr Cys Ser Ala Val Ser
1 5 10 15
Lys Gly Tyr Leu Ser Ala Leu Arg Thr Gly Trp Tyr Thr Ser Val Ile
20 25 30
Thr Ile Glu Leu Ser Asn Ile Lys Glu Asn Lys Cys Asn Gly Thr Asp
35 40 45
Ala Lys Val Lys Leu Ile Lys Gln Glu Leu Asp Lys Tyr Lys Asn Ala
50 55 60
Val Thr Glu Leu Gln Leu Leu Met Gln Ser Thr Pro Ala Thr Asn Asn
65 70 75 80
Arg Ala Arg Arg Glu Leu Pro Arg Phe Met Asn Tyr Thr Leu Asn Asn
85 90 95
Ala Lys Lys Thr Asn Val Thr Leu Ser Lys Lys Arg Lys Arg Arg Phe
100 105 110
Leu Gly Phe Leu Leu Gly Val Gly Ser Ala Ile Ala Ser Gly Val Ala
115 120 125
Val Cys Lys Val Leu His Leu Glu Gly Glu Val Asn Lys Ile Lys Ser
130 135 140
Ala Leu Leu Ser Thr Asn Lys Ala Val Val Ser Leu Ser Asn Gly Val
145 150 155 160
Ser Val Leu Thr Phe Lys Val Leu Asp Leu Lys Asn Tyr Ile Asp Lys
165 170 175
Gln Leu Leu Pro Ile Leu Asn Lys Gln Ser Cys Ser Ile Ser Asn Ile
180 185 190
Glu Thr Val Ile Glu Phe Gln Gln Lys Asn Asn Arg Leu Leu Glu Ile
195 200 205
Thr Arg Glu Phe Ser Val Asn Ala Gly Val Thr Thr Pro Val Ser Thr
210 215 220
Tyr Met Leu Thr Asn Ser Glu Leu Leu Ser Leu Ile Asn Asp Met Pro
225 230 235 240
Ile Thr Asn Asp Gln Lys Lys Leu Met Ser Asn Asn Val Gln Ile Val
245 250 255
Arg Gln Gln Ser Tyr Ser Ile Met Cys Ile Ile Lys Glu Glu Val Leu
260 265 270
Ala Tyr Val Val Gln Leu Pro Leu Tyr Gly Val Ile Asp Thr Pro Cys
275 280 285
Trp Lys Leu His Thr Ser Pro Leu Cys Thr Thr Asn Thr Lys Glu Gly
290 295 300
Ser Asn Ile Cys Leu Thr Arg Thr Asp Arg Gly Trp Tyr Cys Asp Asn
305 310 315 320
Ala Gly Ser Val Ser Phe Phe Pro Gln Ala Glu Thr Cys Lys Val Gln
325 330 335
Ser Asn Arg Val Phe Cys Asp Thr Met Asn Ser Leu Thr Leu Pro Ser
340 345 350
Glu Val Asn Leu Cys Asn Val Asp Ile Phe Asn Pro Lys Tyr Asp Cys
355 360 365
Lys Ile Met Thr Ser Lys Thr Asp Val Ser Ser Ser Val Ile Thr Ser
370 375 380
Leu Gly Ala Ile Val Ser Cys Tyr Gly Lys Thr Lys Cys Thr Ala Ser
385 390 395 400
Asn Lys Asn Arg Gly Ile Ile Lys Thr Phe Ser Asn Gly Cys Asp Tyr
405 410 415
Val Ser Asn Lys Gly Val Asp Thr Val Ser Val Gly Asn Thr Leu Tyr
420 425 430
Tyr Val Asn Lys Gln Glu Gly Lys Ser Leu Tyr Val Lys Gly Glu Pro
435 440 445
Ile Ile Asn Phe Tyr Asp Pro Leu Val Phe Pro Ser Asp Glu Phe Asp
450 455 460
Ala Ser Ile Ser Gln Val Asn Glu Lys Ile Asn Gln Ser Leu Ala Phe
465 470 475 480
Ile Arg Lys Ser Asp Glu Leu Leu Ser Ala Ile Gly Gly Tyr Ile Pro
485 490 495
Glu Ala Pro Arg Asp Gly Gln Ala Tyr Val Arg Lys Asp Gly Glu Trp
500 505 510
Val Leu Leu Ser Thr Phe Leu
515
<210> 59
<211> 2088
<212> DNA
<213> Artificial Sequence
<220>
<223> gH without the signal peptide
<220>
<221> misc_feature
<222> (1077)..(1077)
<223> C>A mutation at position 1077
<220>
<221> misc_feature
<222> (1)..(2082)
<223> Ectodomain
<220>
<221> misc_feature
<222> (2083)..(2088)
<223> Transmembrane domain (truncated)
<400> 59
cgatatggcg cagaagccgt atccgaaccg ctggacaaag cgtttcacct actgctcaac 60
acctacggga gacccatccg cttcctgcgt gaaaatacca cccagtgtac ctacaacagc 120
agcctccgta acagcacggt cgtcagggaa aacgccatca gtttcaactt tttccaaagc 180
tataatcaat actatgtatt ccatatgcct cgatgtcttt ttgcgggtcc tctggcggag 240
cagtttctga accaggtaga tctgaccgaa accctggaaa gataccaaca gagacttaac 300
acttacgcgc tggtatccaa agacctggcc agctaccgat ctttttcgca gcagctaaag 360
gcacaagaca gcctaggtga acagcccacc actgtgccac cgcccattga cctgtcaata 420
cctcacgttt ggatgccacc gcaaaccact ccacacggct ggacagaatc acataccacc 480
tcaggactac accgaccaca ctttaaccag acctgtatcc tctttgatgg acacgatcta 540
ctattcagca ccgtcacacc ttgtttgcac caaggctttt acctcatcga cgaactacgt 600
tacgttaaaa taacactgac cgaggacttc ttcgtagtta cggtgtccat agacgacgac 660
acacccatgc tgcttatctt cggccatctt ccacgcgtac ttttcaaagc gccctatcaa 720
cgcgacaact ttatactacg acaaactgaa aaacacgagc tcctggtgct agttaagaaa 780
gatcaactga accgtcactc ttatctcaaa gacccggact ttcttgacgc cgcacttgac 840
ttcaactacc tagacctcag cgcactacta cgtaacagct ttcaccgtta cgccgtggat 900
gtactcaaga gcggtcgatg tcagatgctg gaccgccgca cggtagaaat ggccttcgcc 960
tacgcattag cactgttcgc agcagcccga caagaagagg ccggcgccca agtctccgtc 1020
ccacgggccc tagaccgcca ggccgcactc ttacaaatac aagaatttat gatcacatgc 1080
ctctcacaaa caccaccacg caccacgttg ctgctgtatc ccacggccgt ggacctggcc 1140
aaacgagccc tttggacacc gaatcagatc accgacatca ccagcctcgt acgcctggtc 1200
tacatactct ctaaacagaa tcagcaacat ctcatccccc aatgggcact acgacagatc 1260
gccgactttg ccctaaaact acacaaaacg cacctggcct cttttctttc agccttcgca 1320
cgccaagaac tctacctcat gggcagcctc gtccactcca tgctggtaca tacgacggag 1380
agacgcgaaa tcttcatcgt agaaacgggc ctctgttcat tggccgagct atcacacttt 1440
acgcagttgt tagctcatcc acaccacgaa tacctcagcg acctgtacac accctgttcc 1500
agtagcgggc gacgcgatca ctcgctcgaa cgcctcacgc gtctcttccc cgatgccacc 1560
gtccccgcta ccgttcccgc cgccctctcc atcctatcta ccatgcaacc aagcacgctg 1620
gaaaccttcc ccgacctgtt ttgcttgccg ctcggcgaat ccttctccgc gctgaccgtc 1680
tccgaacacg tcagttatat cgtaacaaac cagtacctga tcaaaggtat ctcctaccct 1740
gtctccacca ccgtcgtagg ccagagcctc atcatcaccc agacggacag tcaaactaaa 1800
tgcgaactga cgcgcaacat gcataccaca cacagcatca cagtggcgct caacatttcg 1860
ctagaaaact gcgccttttg ccaaagcgcc ctgctagaat acgacgacac gcaaggcgtc 1920
atcaacatca tgtacatgca cgactcggac gacgtccttt tcgccctgga tccctacaac 1980
gaagtggtgg tctcatctcc gcgaactcac tacctcatgc ttttgaaaaa cggtacggta 2040
ctagaagtaa ctgacgtcgt cgtggacgcc accgacagtc gtctcctc 2088
<210> 60
<211> 696
<212> PRT
<213> Artificial Sequence
<220>
<223> gH without the signal peptide
<220>
<221> MISC_FEATURE
<222> (1)..(694)
<223> Ectodomain
<220>
<221> MISC_FEATURE
<222> (694)..(696)
<223> Transmembrane domain (truncated)
<400> 60
Arg Tyr Gly Ala Glu Ala Val Ser Glu Pro Leu Asp Lys Ala Phe His
1 5 10 15
Leu Leu Leu Asn Thr Tyr Gly Arg Pro Ile Arg Phe Leu Arg Glu Asn
20 25 30
Thr Thr Gln Cys Thr Tyr Asn Ser Ser Leu Arg Asn Ser Thr Val Val
35 40 45
Arg Glu Asn Ala Ile Ser Phe Asn Phe Phe Gln Ser Tyr Asn Gln Tyr
50 55 60
Tyr Val Phe His Met Pro Arg Cys Leu Phe Ala Gly Pro Leu Ala Glu
65 70 75 80
Gln Phe Leu Asn Gln Val Asp Leu Thr Glu Thr Leu Glu Arg Tyr Gln
85 90 95
Gln Arg Leu Asn Thr Tyr Ala Leu Val Ser Lys Asp Leu Ala Ser Tyr
100 105 110
Arg Ser Phe Ser Gln Gln Leu Lys Ala Gln Asp Ser Leu Gly Glu Gln
115 120 125
Pro Thr Thr Val Pro Pro Pro Ile Asp Leu Ser Ile Pro His Val Trp
130 135 140
Met Pro Pro Gln Thr Thr Pro His Gly Trp Thr Glu Ser His Thr Thr
145 150 155 160
Ser Gly Leu His Arg Pro His Phe Asn Gln Thr Cys Ile Leu Phe Asp
165 170 175
Gly His Asp Leu Leu Phe Ser Thr Val Thr Pro Cys Leu His Gln Gly
180 185 190
Phe Tyr Leu Ile Asp Glu Leu Arg Tyr Val Lys Ile Thr Leu Thr Glu
195 200 205
Asp Phe Phe Val Val Thr Val Ser Ile Asp Asp Asp Thr Pro Met Leu
210 215 220
Leu Ile Phe Gly His Leu Pro Arg Val Leu Phe Lys Ala Pro Tyr Gln
225 230 235 240
Arg Asp Asn Phe Ile Leu Arg Gln Thr Glu Lys His Glu Leu Leu Val
245 250 255
Leu Val Lys Lys Asp Gln Leu Asn Arg His Ser Tyr Leu Lys Asp Pro
260 265 270
Asp Phe Leu Asp Ala Ala Leu Asp Phe Asn Tyr Leu Asp Leu Ser Ala
275 280 285
Leu Leu Arg Asn Ser Phe His Arg Tyr Ala Val Asp Val Leu Lys Ser
290 295 300
Gly Arg Cys Gln Met Leu Asp Arg Arg Thr Val Glu Met Ala Phe Ala
305 310 315 320
Tyr Ala Leu Ala Leu Phe Ala Ala Ala Arg Gln Glu Glu Ala Gly Ala
325 330 335
Gln Val Ser Val Pro Arg Ala Leu Asp Arg Gln Ala Ala Leu Leu Gln
340 345 350
Ile Gln Glu Phe Met Ile Thr Cys Leu Ser Gln Thr Pro Pro Arg Thr
355 360 365
Thr Leu Leu Leu Tyr Pro Thr Ala Val Asp Leu Ala Lys Arg Ala Leu
370 375 380
Trp Thr Pro Asn Gln Ile Thr Asp Ile Thr Ser Leu Val Arg Leu Val
385 390 395 400
Tyr Ile Leu Ser Lys Gln Asn Gln Gln His Leu Ile Pro Gln Trp Ala
405 410 415
Leu Arg Gln Ile Ala Asp Phe Ala Leu Lys Leu His Lys Thr His Leu
420 425 430
Ala Ser Phe Leu Ser Ala Phe Ala Arg Gln Glu Leu Tyr Leu Met Gly
435 440 445
Ser Leu Val His Ser Met Leu Val His Thr Thr Glu Arg Arg Glu Ile
450 455 460
Phe Ile Val Glu Thr Gly Leu Cys Ser Leu Ala Glu Leu Ser His Phe
465 470 475 480
Thr Gln Leu Leu Ala His Pro His His Glu Tyr Leu Ser Asp Leu Tyr
485 490 495
Thr Pro Cys Ser Ser Ser Gly Arg Arg Asp His Ser Leu Glu Arg Leu
500 505 510
Thr Arg Leu Phe Pro Asp Ala Thr Val Pro Ala Thr Val Pro Ala Ala
515 520 525
Leu Ser Ile Leu Ser Thr Met Gln Pro Ser Thr Leu Glu Thr Phe Pro
530 535 540
Asp Leu Phe Cys Leu Pro Leu Gly Glu Ser Phe Ser Ala Leu Thr Val
545 550 555 560
Ser Glu His Val Ser Tyr Ile Val Thr Asn Gln Tyr Leu Ile Lys Gly
565 570 575
Ile Ser Tyr Pro Val Ser Thr Thr Val Val Gly Gln Ser Leu Ile Ile
580 585 590
Thr Gln Thr Asp Ser Gln Thr Lys Cys Glu Leu Thr Arg Asn Met His
595 600 605
Thr Thr His Ser Ile Thr Val Ala Leu Asn Ile Ser Leu Glu Asn Cys
610 615 620
Ala Phe Cys Gln Ser Ala Leu Leu Glu Tyr Asp Asp Thr Gln Gly Val
625 630 635 640
Ile Asn Ile Met Tyr Met His Asp Ser Asp Asp Val Leu Phe Ala Leu
645 650 655
Asp Pro Tyr Asn Glu Val Val Val Ser Ser Pro Arg Thr His Tyr Leu
660 665 670
Met Leu Leu Lys Asn Gly Thr Val Leu Glu Val Thr Asp Val Val Val
675 680 685
Asp Ala Thr Asp Ser Arg Leu Leu
690 695
Claims (38)
- 항원성 성분을 나타내는 입자를 포함하는 조성물로서, 상기 조성물은 하기를 포함하고:
i) 제1 펩티드 태그를 포함하는 항원성 성분 (antigenic component), 및
ii) 제2 펩티드 태그를 포함하는 모이어티 (moiety),
상기 항원성 성분 및 모이어티는 상기 제1 및 제2 펩티드 태그 간 이소펩티드 결합 (isopeptide bond)을 통해 연결되고, 상기 항원성 성분은 50 kDa 초과인 것인 조성물. - 청구항 1에 있어서, 상기 항원성 성분은 60 kDa, 70 kDa, 80 kDa, 90 kDa, 100 kDa, 110 kDa, 120 kDa, 130 kDa, 140 kDa, 150 kDa, 160 kDa, 170 kDa, 180 kDa, 190 kDa, 200 kDa, 300k Da 또는 400 kDa 초과인 것인 조성물.
- 청구항 1 또는 2에 있어서, 상기 항원성 성분은 단량체 또는 다량체이고, 선택적으로 상기 다량체는 3량체, 4량체, 5량체, 6량체, 7량체, 8량체, 9량체 또는 10량체인 것인 조성물.
- 청구항 1 내지 3 중 어느 한 항에 있어서, 상기 모이어티는 바이러스, 박테리아, 백신 접종 (vaccination)을 위한 다량체화 스캐폴드 (multimerisation scaffold), 다량체화되어 바이러스-유사 입자 (virus-like particle: VLP)를 형성하는 단백질 성분, 바이러스 구조 단백질, 나노입자를 형성하는 다량체화 도메인, 합성 나노입자 또는 합성 VLP인 것인 조성물.
- 청구항 1 내지 4 중 어느 한 항에 있어서, 상기 모이어티는 HBsAg인 것인 조성물.
- 청구항 1 내지 5 중 어느 한 항에 있어서, 상기 제1 및 제2 펩티드 태그는 SpyTag 및 SpyCatcher 쌍; SnoopTag 또는 SnoopTagJr 및 SnoopCatcher 쌍; RrgATag, RrgATag2 또는 DogTag 및 RrgACatcher 쌍, IsopepTag Pilin-C 쌍; IsopepTag-N 및 Pilin-N 쌍; PsCsTag 및 PsCsCatcher 쌍; 및 SnoopLigase에 의해 매개된 SnoopTagJr 및 DogTag 쌍; 또는 이의 변이체, 유도체 또는 변형 중 어느 하나로부터 선택되고, 선택적으로 상기 제1 및 제2 펩티드 태그는 SpyTag/SpyCatcher 쌍인 것인 조성물.
- 청구항 1 내지 6 중 어느 한 항에 있어서, 상기 항원성 성분은 HCMV 5량체의 면역원성 성분을 포함하는 것인 조성물.
- 청구항 7에 있어서, HCMV 5량체의 면역원성 성분은 gH, gL, pUL128, pUL130 또는 pUL131 서브유닛들 중 하나 이상을 포함하는 것인 조성물.
- 청구항 8에 있어서, HCMV 5량체의 면역원성 성분은 gH, gL, pUL128, pUL130 및 pUL131 서브유닛들 모두를 포함하는 것인 조성물.
- 청구항 7 내지 9 중 어느 한 항에 있어서, HCMV 5량체의 면역원성 성분은 절단된 (truncated) 막관통 도메인을 갖는 gH 서브유닛을 포함하는 것인 조성물.
- 청구항 8 내지 10 중 어느 한 항에 있어서, 상기 gH, gL, pUL128, pUL130 및 pUL131 서브유닛은 각각 서열 번호: 28, 31, 35, 33 및 36에 제시된 아미노산 서열, 또는 이의 기능적 동등물을 갖는 것인 조성물.
- 청구항 8 내지 11 중 어느 한 항에 있어서, 상기 제1 펩티드 태그는 gH 서브유닛에, 바람직하게는 gH 서브유닛의 C-말단에 부착되는 것인 조성물.
- 청구항 1 내지 6 중 어느 한 항에 있어서, 상기 항원성 성분은 RSV-F 단백질의 면역원성 성분을 포함하는 것인 조성물.
- 청구항 13에 있어서, RSV-F 단백질의 면역원성 성분은 융합-전 (pre-fusion) F 단백질, 선택적으로 안정화된 융합-전 F 단백질인 것인 조성물.
- 청구항 14에 있어서, RSV 융합-전 F 단백질의 면역원성 성분은 F1 및 F2 서브유닛들의 3량체를 포함하는 것인 조성물.
- 청구항 13 내지 15 중 어느 한 항에 있어서, 상기 RSV-F 단백질은 서열 번호: 50 내지 58 중 어느 하나에 제시된 서열을 갖는 것인 조성물.
- 청구항 13 내지 16 중 어느 한 항에 있어서, 상기 제1 펩티드 태그는 융합-전 F 단백질의 C-말단에 부착되는 것인 조성물.
- 청구항 1 내지 17 중 어느 한 항에 있어서, 상기 제1 펩티드 태그는 SpyTag인 것인 조성물.
- 청구항 18에 있어서, 상기 SpyTag는 서열 번호: 30에 제시된 아미노산 서열을 갖는 것인 조성물.
- 청구항 18 또는 19에 있어서, 상기 SpyTag는 링커를 통해 부착되는 것인 조성물.
- 청구항 20에 있어서, 상기 링커는 서열 번호: 29에 제시된 아미노산 서열을 갖는 것인 조성물.
- 청구항 1 내지 21 중 어느 한 항에 있어서, 상기 모이어티는 HBsAg이고, 선택적으로 상기 제2 펩티드 태그는 SpyCatcher인 것인 조성물.
- 청구항 22에 있어서, 상기 제2 펩티드는 SpyCatcher이고, 상기 SpyCatcher는 서열 번호: 38에 제시된 아미노산 서열을 갖는 것인 조성물.
- 청구항 22 또는 23에 있어서, 상기 모이어티는 상기 SpyCatcher에 링커, 바람직하게는 가요성 링커를 통해 부착되는 것인 조성물.
- 청구항 24에 있어서, 상기 링커는 서열 번호: 39에 제시된 아미노산 서열을 갖는 것인 조성물.
- 청구항 1 내지 25 중 어느 한 항에 있어서, 상기 조성물은 면역원성 또는 백신 조성물인 것인 조성물.
- 질병의 예방 및/또는 치료에 사용하기 위한 청구항 1 내지 26 중 어느 한 항에 따른 조성물을 포함하는 백신.
- 하기 단계를 포함하는, 청구항 1 내지 26 중 어느 한 항에 따른 조성물을 제조하는 방법:
- 제1 단백질의 제1 펩티드 태그로의 제1 유전자 융합을 코딩하는 제1 핵산을 제1 숙주 세포에 도입하는 단계;
- 상기 제1 유전자 융합을 발현시키는 조건하에 상기 제1 숙주 세포를 인큐베이션하는 단계;
- 제2 단백질의 제2 펩티드 태그로의 제2 유전자 융합을 코딩하는 제2 핵산을 제2 숙주 세포에 도입하는 단계;
- 상기 제2 유전자 융합을 발현시키는 조건하에 상기 제2 숙주 세포를 인큐베이션하는 단계;
- 선택적으로 상기 발현된 성분들을 정제하는 단계;
- 상기 제1 펩티드 태그 및 제2 펩티드 태그 간 이소펩티드 결합을 형성하는 조건하에 상기 발현된 성분들을 인큐베이션하는 단계; 및 선택적으로 수득된 조성물을 정제하는 단계. - 청구항 28에 있어서, 상기 제1 단백질은 항원성 성분을 포함하고, 상기 제2 단백질은 모이어티를 포함하는 것인 방법.
- 청구항 28 또는 29에 따른 방법에 사용하기 위한 핵산 분자로서, 상기 핵산 분자는 서열 번호: 27 내지 41 중 어느 하나에 제시된 아미노산 서열을 코딩하는 것인 핵산 분자.
- 청구항 30에 있어서, 서열 번호: 12 내지 26 또는 42 내지 46 중 어느 하나에 제시된 뉴클레오티드 서열을 갖는 것인 핵산 분자.
- 청구항 28 또는 29에 따른 방법에 사용하기 위한 핵산 분자로서, 상기 핵산 분자는 서열 번호: 50 내지 58 중 어느 하나에 제시된 아미노산 서열을 코딩하는 것인 핵산 분자.
- 청구항 32에 있어서, 서열 번호: 47 내지 55 중 어느 하나에 제시된 뉴클레오티드 서열을 갖는 것인 핵산 분자.
- 청구항 30 내지 33 중 어느 한 항에 따른 핵산 분자를 포함하는 벡터.
- 청구항 30 내지 32 중 어느 한 항에 따른 핵산 분자, 또는 청구항 34에 따른 벡터를 포함하는 숙주 세포.
- 제1 면역원성 조성물을 포함하는 조성물 및 선택적으로 제2 면역원성 조성물을 포함하는 하나 이상의 부스터 (booster) 조성물(들)을 포함하는 키트로서, 상기 제1 및/또는 제2 면역원성 조성물은 청구항 1 내지 26 중 어느 한 항에 따른 조성물을 포함하는 것인 키트.
- 청구항 7 내지 12 중 어느 한 항에 따른 조성물을 포함하는, HCMV 감염의 예방 및/또는 치료에 사용하기 위한 백신.
- 청구항 13 내지 17 중 어느 한 항에 따른 조성물을 포함하는, RSV 감염의 예방 및/또는 치료에 사용하기 위한 백신.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GBGB1807378.3A GB201807378D0 (en) | 2018-05-04 | 2018-05-04 | Vaccine composition |
GB1807378.3 | 2018-05-04 | ||
GB1807376.7 | 2018-05-04 | ||
GBGB1807376.7A GB201807376D0 (en) | 2018-05-04 | 2018-05-04 | HMCV Vaccine Composition |
PCT/GB2019/051245 WO2019211630A2 (en) | 2018-05-04 | 2019-05-03 | Vaccine composition |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20210013571A true KR20210013571A (ko) | 2021-02-04 |
Family
ID=66484095
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020207034602A KR20210013571A (ko) | 2018-05-04 | 2019-05-03 | 백신 조성물 |
Country Status (11)
Country | Link |
---|---|
US (1) | US20210128717A1 (ko) |
EP (1) | EP3787676A2 (ko) |
JP (1) | JP2021523937A (ko) |
KR (1) | KR20210013571A (ko) |
CN (1) | CN112638411A (ko) |
AU (1) | AU2019263706A1 (ko) |
BR (1) | BR112020022393A2 (ko) |
CA (1) | CA3099381A1 (ko) |
IL (1) | IL278418B2 (ko) |
SG (1) | SG11202010821TA (ko) |
WO (1) | WO2019211630A2 (ko) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB201917265D0 (en) * | 2019-11-27 | 2020-01-08 | Univ Sheffield | Bonded neurotoxins |
CN114634578B (zh) * | 2020-12-15 | 2024-04-02 | 榕森生物科技(北京)有限公司 | 针对新型冠状病毒感染的疫苗组合物 |
CA3202379A1 (en) * | 2020-12-18 | 2022-06-23 | Adam Frederik Sander Bertelsen | Nucleic acid vaccines |
WO2022234276A1 (en) * | 2021-05-04 | 2022-11-10 | SpyBiotech Limited | Adenoviral vectors and vaccines thereof |
WO2023155318A1 (zh) * | 2022-02-21 | 2023-08-24 | 悦康药业集团股份有限公司 | 一种优化病毒膜融合抑制剂的方法及广谱抗冠状病毒脂肽和应用 |
CN115920026B (zh) * | 2022-04-02 | 2023-11-14 | 中山大学 | 耐热性多聚体蛋白支架、耐热性多聚体蛋白支架在疫苗中的应用 |
CN117462666A (zh) * | 2022-09-30 | 2024-01-30 | 烟台派诺生物技术有限公司 | 一种预防或治疗水痘-带状疱疹病毒相关疾病的免疫组合物产品及其制备方法 |
CN117264081A (zh) * | 2023-11-21 | 2023-12-22 | 华南理工大学 | 一种双肽受体激动剂及其制备方法与应用 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3508505A1 (en) | 2007-12-24 | 2019-07-10 | ID Biomedical Corporation of Quebec | Recombinant rsv antigens |
WO2011009877A1 (de) | 2009-07-24 | 2011-01-27 | Basf Se | Flammgeschützte polyamidformmassen |
GB201002362D0 (en) | 2010-02-11 | 2010-03-31 | Isis Innovation | Peptide tag systems that spontaneously form an irreversible link to protein partners via isopeptide bonds |
KR102301463B1 (ko) * | 2011-11-11 | 2021-09-14 | 배리에이션 바이오테크놀로지스 아이엔씨. | 사이토메갈로바이러스의 치료를 위한 조성물 및 방법 |
SG11201408328VA (en) | 2012-07-06 | 2015-02-27 | Novartis Ag | Complexes of cytomegalovirus proteins |
WO2014160463A1 (en) | 2013-03-13 | 2014-10-02 | The United States Of America, As Represented By The Secretary, Department Of Health & Human Services | Prefusion rsv f proteins and their use |
CA2934073A1 (en) * | 2013-12-20 | 2015-06-25 | The Broad Institute, Inc. | Combination therapy with neoantigen vaccine |
EP3015475A1 (en) | 2014-10-31 | 2016-05-04 | Novartis AG | Mammalian cells expressing cytomegalovirus antigens |
EA035378B1 (ru) * | 2015-01-15 | 2020-06-04 | Юниверсити Оф Копенгаген | Вирусоподобная частица с эффективным экспонированием эпитопов |
GB201509782D0 (en) | 2015-06-05 | 2015-07-22 | Isis Innovation | Methods and products for fusion protein synthesis |
CA3015570A1 (en) | 2016-03-29 | 2017-10-05 | Peter Kwong | Substitutions-modified prefusion rsv f proteins and their use |
CN106081304A (zh) | 2016-07-27 | 2016-11-09 | 佛山市高明金荣华乐金属制品有限公司 | 一种新型可折叠箱体及其拆装方法 |
GB201705750D0 (en) | 2017-04-10 | 2017-05-24 | Univ Oxford Innovation Ltd | Peptide ligase and use therof |
GB201706430D0 (en) | 2017-04-24 | 2017-06-07 | Univ Oxford Innovation Ltd | Proteins and peptide tags with enhanced rate of spontaneous isopeptide bond formation and uses thereof |
-
2019
- 2019-05-03 BR BR112020022393-0A patent/BR112020022393A2/pt unknown
- 2019-05-03 CA CA3099381A patent/CA3099381A1/en active Pending
- 2019-05-03 JP JP2021510553A patent/JP2021523937A/ja active Pending
- 2019-05-03 SG SG11202010821TA patent/SG11202010821TA/en unknown
- 2019-05-03 EP EP19723480.0A patent/EP3787676A2/en active Pending
- 2019-05-03 AU AU2019263706A patent/AU2019263706A1/en active Pending
- 2019-05-03 CN CN201980044956.2A patent/CN112638411A/zh active Pending
- 2019-05-03 KR KR1020207034602A patent/KR20210013571A/ko unknown
- 2019-05-03 US US17/052,707 patent/US20210128717A1/en active Pending
- 2019-05-03 IL IL278418A patent/IL278418B2/en unknown
- 2019-05-03 WO PCT/GB2019/051245 patent/WO2019211630A2/en unknown
Also Published As
Publication number | Publication date |
---|---|
EP3787676A2 (en) | 2021-03-10 |
US20210128717A1 (en) | 2021-05-06 |
BR112020022393A2 (pt) | 2021-02-02 |
CA3099381A1 (en) | 2019-11-07 |
CN112638411A (zh) | 2021-04-09 |
SG11202010821TA (en) | 2020-11-27 |
IL278418A (ko) | 2020-12-31 |
JP2021523937A (ja) | 2021-09-09 |
WO2019211630A3 (en) | 2019-12-05 |
IL278418B1 (en) | 2023-09-01 |
WO2019211630A2 (en) | 2019-11-07 |
IL278418B2 (en) | 2024-01-01 |
AU2019263706A1 (en) | 2020-11-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20210013571A (ko) | 백신 조성물 | |
US20230265127A1 (en) | Stabilized soluble pre-fusion rsv f polypeptides | |
JP6679475B2 (ja) | 安定化された可溶性融合前rsv fポリペプチド | |
KR20180131584A (ko) | 안정화된 용해성 융합-전 rsv f 단백질 | |
KR20180026734A (ko) | 안정화된 가용성 융합-전 rsv f 폴리펩티드 | |
JP5557254B2 (ja) | 薬物運搬体並びにこれを利用したアジュバントおよびワクチン | |
CA3117275A1 (en) | Stabilized pre-fusion rsv f proteins | |
US20230086093A1 (en) | Mutant rsv f protein and use thereof | |
KR20190012193A (ko) | 안정화된 융합-전 rsv f 단백질 | |
WO2019092002A1 (en) | Pharmaceutical compositions for treatment or prevention of viral infections | |
JP7253529B2 (ja) | 三量体安定化hivエンベロープタンパク質変異 | |
CA3197971A1 (en) | Protein-based nanoparticle vaccine for metapneumovirus | |
CN113227123A (zh) | 重组呼吸道合胞病毒f蛋白以及包含该蛋白的疫苗组合物 | |
CA3193288A1 (en) | Immunogenic coronavirus fusion proteins and related methods | |
CN112823021A (zh) | 稳定化的丝状病毒糖蛋白三聚体 | |
JP2023002492A (ja) | 変異型rsv fタンパク質を含む医薬組成物 | |
WO2024059149A2 (en) | Immunogenic coronavirus fusion proteins and related methods | |
NZ752808A (en) | Stabilized soluble prefusion rsv f polypeptides | |
OA17539A (en) | Stabilized soluble prefusion RSV F polypeptides. | |
NZ713371B2 (en) | Stabilized soluble prefusion rsv f polypeptides |