KR20230150269A - Hiv 외피 단백질 돌연변이를 안정화시키는 삼량체 - Google Patents
Hiv 외피 단백질 돌연변이를 안정화시키는 삼량체 Download PDFInfo
- Publication number
- KR20230150269A KR20230150269A KR1020237026810A KR20237026810A KR20230150269A KR 20230150269 A KR20230150269 A KR 20230150269A KR 1020237026810 A KR1020237026810 A KR 1020237026810A KR 20237026810 A KR20237026810 A KR 20237026810A KR 20230150269 A KR20230150269 A KR 20230150269A
- Authority
- KR
- South Korea
- Prior art keywords
- leu
- ile
- asn
- hiv
- gly
- Prior art date
Links
- 239000013638 trimer Substances 0.000 title claims abstract description 137
- 230000035772 mutation Effects 0.000 title claims abstract description 131
- 101710091045 Envelope protein Proteins 0.000 title abstract description 92
- 101710188315 Protein X Proteins 0.000 title abstract description 92
- 102100021696 Syncytin-1 Human genes 0.000 title abstract 7
- 230000000087 stabilizing effect Effects 0.000 title description 10
- 241000725303 Human immunodeficiency virus Species 0.000 claims abstract description 373
- 239000013598 vector Substances 0.000 claims abstract description 62
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 45
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 43
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 43
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 31
- 239000000203 mixture Substances 0.000 claims abstract description 26
- 239000002245 particle Substances 0.000 claims abstract description 15
- 108010078428 env Gene Products Proteins 0.000 claims description 201
- 102100034353 Integrase Human genes 0.000 claims description 199
- 108090000623 proteins and genes Proteins 0.000 claims description 73
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 claims description 70
- 102000004169 proteins and genes Human genes 0.000 claims description 70
- 125000000510 L-tryptophano group Chemical group [H]C1=C([H])C([H])=C2N([H])C([H])=C(C([H])([H])[C@@]([H])(C(O[H])=O)N([H])[*])C2=C1[H] 0.000 claims description 57
- 150000001413 amino acids Chemical class 0.000 claims description 50
- 238000006467 substitution reaction Methods 0.000 claims description 49
- 238000003776 cleavage reaction Methods 0.000 claims description 44
- 230000007017 scission Effects 0.000 claims description 42
- 125000000393 L-methionino group Chemical group [H]OC(=O)[C@@]([H])(N([H])[*])C([H])([H])C(SC([H])([H])[H])([H])[H] 0.000 claims description 37
- 108090001126 Furin Proteins 0.000 claims description 35
- 102000004961 Furin Human genes 0.000 claims description 34
- 241000713772 Human immunodeficiency virus 1 Species 0.000 claims description 30
- 238000000034 method Methods 0.000 claims description 29
- 125000000539 amino acid group Chemical group 0.000 claims description 22
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 claims description 21
- 239000002502 liposome Substances 0.000 claims description 16
- 241000701161 unidentified adenovirus Species 0.000 claims description 15
- 230000001086 cytosolic effect Effects 0.000 claims description 13
- 239000002105 nanoparticle Substances 0.000 claims description 13
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 claims description 6
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 claims description 4
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 claims description 4
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 claims description 4
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 claims description 4
- 229930182817 methionine Natural products 0.000 claims description 4
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 claims description 4
- 102100038132 Endogenous retrovirus group K member 6 Pro protein Human genes 0.000 description 88
- 235000001014 amino acid Nutrition 0.000 description 80
- 125000003275 alpha amino acid group Chemical group 0.000 description 67
- 235000018102 proteins Nutrition 0.000 description 65
- 229940024606 amino acid Drugs 0.000 description 59
- 210000004027 cell Anatomy 0.000 description 39
- 238000012815 AlphaLISA Methods 0.000 description 27
- 238000001542 size-exclusion chromatography Methods 0.000 description 25
- 239000011324 bead Substances 0.000 description 23
- 230000003472 neutralizing effect Effects 0.000 description 21
- 125000003290 L-leucino group Chemical group [H]OC(=O)[C@@]([H])(N([H])[*])C([H])([H])C(C([H])([H])[H])([H])C([H])([H])[H] 0.000 description 20
- 238000004113 cell culture Methods 0.000 description 20
- 230000001965 increasing effect Effects 0.000 description 18
- 239000012228 culture supernatant Substances 0.000 description 16
- 108020004705 Codon Proteins 0.000 description 15
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 15
- 101800001690 Transmembrane protein gp41 Proteins 0.000 description 15
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Chemical compound NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 15
- 108010034529 leucyl-lysine Proteins 0.000 description 15
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 14
- VKCOHFFSTKCXEQ-OLHMAJIHSA-N Asn-Asn-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VKCOHFFSTKCXEQ-OLHMAJIHSA-N 0.000 description 13
- 108010076504 Protein Sorting Signals Proteins 0.000 description 13
- 229960005486 vaccine Drugs 0.000 description 13
- 108091035707 Consensus sequence Proteins 0.000 description 12
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical group CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 12
- 239000000427 antigen Substances 0.000 description 12
- 102000036639 antigens Human genes 0.000 description 12
- 108091007433 antigens Proteins 0.000 description 12
- 101710125418 Major capsid protein Proteins 0.000 description 11
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 10
- 101710132601 Capsid protein Proteins 0.000 description 10
- 101710094648 Coat protein Proteins 0.000 description 10
- 102100021181 Golgi phosphoprotein 3 Human genes 0.000 description 10
- 101710141454 Nucleoprotein Proteins 0.000 description 10
- 101710083689 Probable capsid protein Proteins 0.000 description 10
- 230000028993 immune response Effects 0.000 description 10
- 230000000670 limiting effect Effects 0.000 description 10
- ACRYGQFHAQHDSF-ZLUOBGJFSA-N Asn-Asn-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ACRYGQFHAQHDSF-ZLUOBGJFSA-N 0.000 description 9
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 9
- PXHVJJICTQNCMI-UHFFFAOYSA-N Nickel Chemical compound [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 9
- 238000003556 assay Methods 0.000 description 9
- 239000013612 plasmid Substances 0.000 description 9
- 238000002360 preparation method Methods 0.000 description 9
- HKZAAJSTFUZYTO-LURJTMIESA-N (2s)-2-[[2-[[2-[[2-[(2-aminoacetyl)amino]acetyl]amino]acetyl]amino]acetyl]amino]-3-hydroxypropanoic acid Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O HKZAAJSTFUZYTO-LURJTMIESA-N 0.000 description 8
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 8
- 210000004899 c-terminal region Anatomy 0.000 description 8
- 239000013604 expression vector Substances 0.000 description 8
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 8
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 8
- 108010001064 glycyl-glycyl-glycyl-glycine Proteins 0.000 description 8
- 108010050848 glycylleucine Proteins 0.000 description 8
- 238000001890 transfection Methods 0.000 description 8
- AMGQTNHANMRPOE-LKXGYXEUSA-N Asn-Thr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O AMGQTNHANMRPOE-LKXGYXEUSA-N 0.000 description 7
- NHSDEZURHWEZPN-SXTJYALSSA-N Asp-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC(=O)O)N NHSDEZURHWEZPN-SXTJYALSSA-N 0.000 description 7
- 108020004414 DNA Proteins 0.000 description 7
- 208000031886 HIV Infections Diseases 0.000 description 7
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 7
- 108010087924 alanylproline Proteins 0.000 description 7
- 238000012217 deletion Methods 0.000 description 7
- 230000037430 deletion Effects 0.000 description 7
- 239000012634 fragment Substances 0.000 description 7
- 238000005259 measurement Methods 0.000 description 7
- 239000013603 viral vector Substances 0.000 description 7
- XJKAKYXMFHUIHT-AUTRQRHGSA-N Gln-Glu-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N XJKAKYXMFHUIHT-AUTRQRHGSA-N 0.000 description 6
- XFAUJGNLHIGXET-AVGNSLFASA-N Gln-Leu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XFAUJGNLHIGXET-AVGNSLFASA-N 0.000 description 6
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 6
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 6
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 6
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 6
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 6
- 108010066427 N-valyltryptophan Proteins 0.000 description 6
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 6
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 6
- 102100036011 T-cell surface glycoprotein CD4 Human genes 0.000 description 6
- 241000700605 Viruses Species 0.000 description 6
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 6
- 230000004927 fusion Effects 0.000 description 6
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 6
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 6
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 6
- 108020004999 messenger RNA Proteins 0.000 description 6
- 238000005829 trimerization reaction Methods 0.000 description 6
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 5
- WKOBSJOZRJJVRZ-FXQIFTODSA-N Ala-Glu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WKOBSJOZRJJVRZ-FXQIFTODSA-N 0.000 description 5
- CGWVCWFQGXOUSJ-ULQDDVLXSA-N Arg-Tyr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O CGWVCWFQGXOUSJ-ULQDDVLXSA-N 0.000 description 5
- QRHYAUYXBVVDSB-LKXGYXEUSA-N Asn-Cys-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QRHYAUYXBVVDSB-LKXGYXEUSA-N 0.000 description 5
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 5
- LANZYLJEHLBUPR-BPUTZDHNSA-N Asn-Met-Trp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(=O)N)N LANZYLJEHLBUPR-BPUTZDHNSA-N 0.000 description 5
- UXHYOWXTJLBEPG-GSSVUCPTSA-N Asn-Thr-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UXHYOWXTJLBEPG-GSSVUCPTSA-N 0.000 description 5
- XOQYDFCQPWAMSA-KKHAAJSZSA-N Asn-Val-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOQYDFCQPWAMSA-KKHAAJSZSA-N 0.000 description 5
- NQSUTVRXXBGVDQ-LKXGYXEUSA-N Cys-Asn-Thr Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NQSUTVRXXBGVDQ-LKXGYXEUSA-N 0.000 description 5
- SBYVDRJAXWSXQL-AVGNSLFASA-N Glu-Asn-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SBYVDRJAXWSXQL-AVGNSLFASA-N 0.000 description 5
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 5
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 5
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical group OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 5
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 5
- KKXDHFKZWKLYGB-GUBZILKMSA-N Leu-Asn-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKXDHFKZWKLYGB-GUBZILKMSA-N 0.000 description 5
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 5
- HIIZIQUUHIXUJY-GUBZILKMSA-N Lys-Asp-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HIIZIQUUHIXUJY-GUBZILKMSA-N 0.000 description 5
- BVRNWWHJYNPJDG-XIRDDKMYSA-N Lys-Trp-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N BVRNWWHJYNPJDG-XIRDDKMYSA-N 0.000 description 5
- QGVBFDIREUUSHX-IFFSRLJSSA-N Thr-Val-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O QGVBFDIREUUSHX-IFFSRLJSSA-N 0.000 description 5
- 239000002671 adjuvant Substances 0.000 description 5
- 108010008355 arginyl-glutamine Proteins 0.000 description 5
- 108010093581 aspartyl-proline Proteins 0.000 description 5
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 5
- 230000002068 genetic effect Effects 0.000 description 5
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 5
- 108010025306 histidylleucine Proteins 0.000 description 5
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 5
- 108010000761 leucylarginine Proteins 0.000 description 5
- 239000012528 membrane Substances 0.000 description 5
- 210000004379 membrane Anatomy 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 239000000178 monomer Substances 0.000 description 5
- 108090000765 processed proteins & peptides Proteins 0.000 description 5
- 230000003612 virological effect Effects 0.000 description 5
- CKLDHDOIYBVUNP-KBIXCLLPSA-N Ala-Ile-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O CKLDHDOIYBVUNP-KBIXCLLPSA-N 0.000 description 4
- TZDNWXDLYFIFPT-BJDJZHNGSA-N Ala-Ile-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O TZDNWXDLYFIFPT-BJDJZHNGSA-N 0.000 description 4
- 241000710929 Alphavirus Species 0.000 description 4
- IBLAOXSULLECQZ-IUKAMOBKSA-N Asn-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(N)=O IBLAOXSULLECQZ-IUKAMOBKSA-N 0.000 description 4
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 4
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 4
- NVFSJIXJZCDICF-SRVKXCTJSA-N Asp-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N NVFSJIXJZCDICF-SRVKXCTJSA-N 0.000 description 4
- KBJVTFWQWXCYCQ-IUKAMOBKSA-N Asp-Thr-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KBJVTFWQWXCYCQ-IUKAMOBKSA-N 0.000 description 4
- HMWBPUDETPKSSS-DCAQKATOSA-N Cys-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CS)N)C(=O)N[C@@H](CCCCN)C(=O)O HMWBPUDETPKSSS-DCAQKATOSA-N 0.000 description 4
- INKFLNZBTSNFON-CIUDSAMLSA-N Gln-Ala-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O INKFLNZBTSNFON-CIUDSAMLSA-N 0.000 description 4
- RGAOLBZBLOJUTP-GRLWGSQLSA-N Gln-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CCC(=O)N)N RGAOLBZBLOJUTP-GRLWGSQLSA-N 0.000 description 4
- GDOZQTNZPCUARW-YFKPBYRVSA-N Gly-Gly-Glu Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O GDOZQTNZPCUARW-YFKPBYRVSA-N 0.000 description 4
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 4
- ITZOBNKQDZEOCE-NHCYSSNCSA-N Gly-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)CN ITZOBNKQDZEOCE-NHCYSSNCSA-N 0.000 description 4
- 208000037357 HIV infectious disease Diseases 0.000 description 4
- 241000282412 Homo Species 0.000 description 4
- 241000598171 Human adenovirus sp. Species 0.000 description 4
- NULSANWBUWLTKN-NAKRPEOUSA-N Ile-Arg-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N NULSANWBUWLTKN-NAKRPEOUSA-N 0.000 description 4
- -1 Leu amino acids Chemical group 0.000 description 4
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 4
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 4
- BYPMOIFBQPEWOH-CIUDSAMLSA-N Lys-Asn-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N BYPMOIFBQPEWOH-CIUDSAMLSA-N 0.000 description 4
- XTONYTDATVADQH-CIUDSAMLSA-N Lys-Cys-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O XTONYTDATVADQH-CIUDSAMLSA-N 0.000 description 4
- 241000124008 Mammalia Species 0.000 description 4
- MDXAULHWGWETHF-SRVKXCTJSA-N Met-Arg-Val Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CCCNC(N)=N MDXAULHWGWETHF-SRVKXCTJSA-N 0.000 description 4
- HAAQQNHQZBOWFO-LURJTMIESA-N Pro-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H]1CCCN1 HAAQQNHQZBOWFO-LURJTMIESA-N 0.000 description 4
- YMEXHZTVKDAKIY-GHCJXIJMSA-N Ser-Asn-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO)C(O)=O YMEXHZTVKDAKIY-GHCJXIJMSA-N 0.000 description 4
- SZRNDHWMVSFPSP-XKBZYTNZSA-N Ser-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N)O SZRNDHWMVSFPSP-XKBZYTNZSA-N 0.000 description 4
- BDMWLJLPPUCLNV-XGEHTFHBSA-N Ser-Thr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BDMWLJLPPUCLNV-XGEHTFHBSA-N 0.000 description 4
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 4
- PZVGOVRNGKEFCB-KKHAAJSZSA-N Thr-Asn-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N)O PZVGOVRNGKEFCB-KKHAAJSZSA-N 0.000 description 4
- OYTNZCBFDXGQGE-XQXXSGGOSA-N Thr-Gln-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O OYTNZCBFDXGQGE-XQXXSGGOSA-N 0.000 description 4
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 4
- GXUWHVZYDAHFSV-FLBSBUHZSA-N Thr-Ile-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GXUWHVZYDAHFSV-FLBSBUHZSA-N 0.000 description 4
- QZKVWWIUSQGWMY-IHRRRGAJSA-N Val-Ser-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QZKVWWIUSQGWMY-IHRRRGAJSA-N 0.000 description 4
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Chemical group CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 4
- 108010060035 arginylproline Proteins 0.000 description 4
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 108010079547 glutamylmethionine Proteins 0.000 description 4
- 208000033519 human immunodeficiency virus infectious disease Diseases 0.000 description 4
- 230000036039 immunity Effects 0.000 description 4
- 108010009298 lysylglutamic acid Proteins 0.000 description 4
- 210000004962 mammalian cell Anatomy 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 108010034507 methionyltryptophan Proteins 0.000 description 4
- 238000001823 molecular biology technique Methods 0.000 description 4
- 229910052759 nickel Inorganic materials 0.000 description 4
- 229920001184 polypeptide Polymers 0.000 description 4
- 102000004196 processed proteins & peptides Human genes 0.000 description 4
- 238000000746 purification Methods 0.000 description 4
- 239000006228 supernatant Substances 0.000 description 4
- GXPCCSYVSYFRDU-LJWNLINESA-N 2-[[(2s)-2-[[(2s)-2-[[2-[[(2s)-2-[[(2s)-2-amino-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]acetyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]acetic acid Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O)C1=CC=CC=C1 GXPCCSYVSYFRDU-LJWNLINESA-N 0.000 description 3
- 208000030507 AIDS Diseases 0.000 description 3
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 3
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 3
- QDRGPQWIVZNJQD-CIUDSAMLSA-N Ala-Arg-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O QDRGPQWIVZNJQD-CIUDSAMLSA-N 0.000 description 3
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 3
- VHVVPYOJIIQCKS-QEJZJMRPSA-N Ala-Leu-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VHVVPYOJIIQCKS-QEJZJMRPSA-N 0.000 description 3
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 3
- QUIGLPSHIFPEOV-CIUDSAMLSA-N Ala-Lys-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O QUIGLPSHIFPEOV-CIUDSAMLSA-N 0.000 description 3
- FFZJHQODAYHGPO-KZVJFYERSA-N Ala-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N FFZJHQODAYHGPO-KZVJFYERSA-N 0.000 description 3
- RMAWDDRDTRSZIR-ZLUOBGJFSA-N Ala-Ser-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RMAWDDRDTRSZIR-ZLUOBGJFSA-N 0.000 description 3
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 3
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 3
- DBKNLHKEVPZVQC-LPEHRKFASA-N Arg-Ala-Pro Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O DBKNLHKEVPZVQC-LPEHRKFASA-N 0.000 description 3
- OGUPCHKBOKJFMA-SRVKXCTJSA-N Arg-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N OGUPCHKBOKJFMA-SRVKXCTJSA-N 0.000 description 3
- YKZJPIPFKGYHKY-DCAQKATOSA-N Arg-Leu-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKZJPIPFKGYHKY-DCAQKATOSA-N 0.000 description 3
- NPAVRDPEFVKELR-DCAQKATOSA-N Arg-Lys-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NPAVRDPEFVKELR-DCAQKATOSA-N 0.000 description 3
- HNJNAMGZQZPSRE-GUBZILKMSA-N Arg-Pro-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O HNJNAMGZQZPSRE-GUBZILKMSA-N 0.000 description 3
- DXZNJWFECGJCQR-FXQIFTODSA-N Asn-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N DXZNJWFECGJCQR-FXQIFTODSA-N 0.000 description 3
- PQAIOUVVZCOLJK-FXQIFTODSA-N Asn-Gln-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PQAIOUVVZCOLJK-FXQIFTODSA-N 0.000 description 3
- HNXWVVHIGTZTBO-LKXGYXEUSA-N Asn-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O HNXWVVHIGTZTBO-LKXGYXEUSA-N 0.000 description 3
- JBDLMLZNDRLDIX-HJGDQZAQSA-N Asn-Thr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O JBDLMLZNDRLDIX-HJGDQZAQSA-N 0.000 description 3
- YNQIDCRRTWGHJD-ZLUOBGJFSA-N Asp-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(O)=O YNQIDCRRTWGHJD-ZLUOBGJFSA-N 0.000 description 3
- DXQOQMCLWWADMU-ACZMJKKPSA-N Asp-Gln-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DXQOQMCLWWADMU-ACZMJKKPSA-N 0.000 description 3
- 108010041397 CD4 Antigens Proteins 0.000 description 3
- PKNIZMPLMSKROD-BIIVOSGPSA-N Cys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N PKNIZMPLMSKROD-BIIVOSGPSA-N 0.000 description 3
- DCXGXDGGXVZVMY-GHCJXIJMSA-N Cys-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CS DCXGXDGGXVZVMY-GHCJXIJMSA-N 0.000 description 3
- HJXSYJVCMUOUNY-SRVKXCTJSA-N Cys-Ser-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N HJXSYJVCMUOUNY-SRVKXCTJSA-N 0.000 description 3
- UKHNKRGNFKSHCG-CUJWVEQBSA-N Cys-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CS)N)O UKHNKRGNFKSHCG-CUJWVEQBSA-N 0.000 description 3
- YQEHNIKPAOPBNH-DCAQKATOSA-N Cys-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CS)N YQEHNIKPAOPBNH-DCAQKATOSA-N 0.000 description 3
- QQAYIVHVRFJICE-AEJSXWLSSA-N Cys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N QQAYIVHVRFJICE-AEJSXWLSSA-N 0.000 description 3
- MYMOFIZGZYHOMD-UHFFFAOYSA-N Dioxygen Chemical compound O=O MYMOFIZGZYHOMD-UHFFFAOYSA-N 0.000 description 3
- UWZLBXOBVKRUFE-HGNGGELXSA-N Gln-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N UWZLBXOBVKRUFE-HGNGGELXSA-N 0.000 description 3
- HPCOBEHVEHWREJ-DCAQKATOSA-N Gln-Lys-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HPCOBEHVEHWREJ-DCAQKATOSA-N 0.000 description 3
- XUZQMPGBGFQJMY-SRVKXCTJSA-N Gln-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N XUZQMPGBGFQJMY-SRVKXCTJSA-N 0.000 description 3
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 3
- JILRMFFFCHUUTJ-ACZMJKKPSA-N Gln-Ser-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O JILRMFFFCHUUTJ-ACZMJKKPSA-N 0.000 description 3
- IESFZVCAVACGPH-PEFMBERDSA-N Glu-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 3
- XTZDZAXYPDISRR-MNXVOIDGSA-N Glu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XTZDZAXYPDISRR-MNXVOIDGSA-N 0.000 description 3
- SWRVAQHFBRZVNX-GUBZILKMSA-N Glu-Lys-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SWRVAQHFBRZVNX-GUBZILKMSA-N 0.000 description 3
- DAHLWSFUXOHMIA-FXQIFTODSA-N Glu-Ser-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O DAHLWSFUXOHMIA-FXQIFTODSA-N 0.000 description 3
- GPSHCSTUYOQPAI-JHEQGTHGSA-N Glu-Thr-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O GPSHCSTUYOQPAI-JHEQGTHGSA-N 0.000 description 3
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 3
- XBWMTPAIUQIWKA-BYULHYEWSA-N Gly-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN XBWMTPAIUQIWKA-BYULHYEWSA-N 0.000 description 3
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 3
- QSQXZZCGPXQBPP-BQBZGAKWSA-N Gly-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)CN)C(=O)N[C@@H](CS)C(=O)O QSQXZZCGPXQBPP-BQBZGAKWSA-N 0.000 description 3
- 108090000288 Glycoproteins Proteins 0.000 description 3
- 102000003886 Glycoproteins Human genes 0.000 description 3
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 3
- 229940033330 HIV vaccine Drugs 0.000 description 3
- YXBRCTXAEYSCHS-XVYDVKMFSA-N His-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N YXBRCTXAEYSCHS-XVYDVKMFSA-N 0.000 description 3
- MDBYBTWRMOAJAY-NHCYSSNCSA-N His-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N MDBYBTWRMOAJAY-NHCYSSNCSA-N 0.000 description 3
- 241000713340 Human immunodeficiency virus 2 Species 0.000 description 3
- DMHGKBGOUAJRHU-UHFFFAOYSA-N Ile-Arg-Pro Natural products CCC(C)C(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O DMHGKBGOUAJRHU-UHFFFAOYSA-N 0.000 description 3
- PHIXPNQDGGILMP-YVNDNENWSA-N Ile-Glu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PHIXPNQDGGILMP-YVNDNENWSA-N 0.000 description 3
- VNDQNDYEPSXHLU-JUKXBJQTSA-N Ile-His-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N VNDQNDYEPSXHLU-JUKXBJQTSA-N 0.000 description 3
- PNTWNAXGBOZMBO-MNXVOIDGSA-N Ile-Lys-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PNTWNAXGBOZMBO-MNXVOIDGSA-N 0.000 description 3
- PELCGFMHLZXWBQ-BJDJZHNGSA-N Ile-Ser-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)O)N PELCGFMHLZXWBQ-BJDJZHNGSA-N 0.000 description 3
- AUIYHFRUOOKTGX-UKJIMTQDSA-N Ile-Val-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N AUIYHFRUOOKTGX-UKJIMTQDSA-N 0.000 description 3
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 3
- WCTCIIAGNMFYAO-DCAQKATOSA-N Leu-Cys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O WCTCIIAGNMFYAO-DCAQKATOSA-N 0.000 description 3
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 3
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 3
- ORWTWZXGDBYVCP-BJDJZHNGSA-N Leu-Ile-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(C)C ORWTWZXGDBYVCP-BJDJZHNGSA-N 0.000 description 3
- RTIRBWJPYJYTLO-MELADBBJSA-N Leu-Lys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N RTIRBWJPYJYTLO-MELADBBJSA-N 0.000 description 3
- YESNGRDJQWDYLH-KKUMJFAQSA-N Leu-Phe-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)O)N YESNGRDJQWDYLH-KKUMJFAQSA-N 0.000 description 3
- KLSUAWUZBMAZCL-RHYQMDGZSA-N Leu-Thr-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O KLSUAWUZBMAZCL-RHYQMDGZSA-N 0.000 description 3
- HQBOMRTVKVKFMN-WDSOQIARSA-N Leu-Trp-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(O)=O HQBOMRTVKVKFMN-WDSOQIARSA-N 0.000 description 3
- VHXMZJGOKIMETG-CQDKDKBSSA-N Lys-Ala-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCCCN)N VHXMZJGOKIMETG-CQDKDKBSSA-N 0.000 description 3
- 108010062166 Lys-Asn-Asp Proteins 0.000 description 3
- YVMQJGWLHRWMDF-MNXVOIDGSA-N Lys-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N YVMQJGWLHRWMDF-MNXVOIDGSA-N 0.000 description 3
- RZHLIPMZXOEJTL-AVGNSLFASA-N Lys-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N RZHLIPMZXOEJTL-AVGNSLFASA-N 0.000 description 3
- JCVOHUKUYSYBAD-DCAQKATOSA-N Lys-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCCCN)N)C(=O)N[C@@H](CS)C(=O)O JCVOHUKUYSYBAD-DCAQKATOSA-N 0.000 description 3
- YCJCEMKOZOYBEF-OEAJRASXSA-N Lys-Thr-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YCJCEMKOZOYBEF-OEAJRASXSA-N 0.000 description 3
- RKIIYGUHIQJCBW-SRVKXCTJSA-N Met-His-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RKIIYGUHIQJCBW-SRVKXCTJSA-N 0.000 description 3
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 3
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 3
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 3
- UEHNWRNADDPYNK-DLOVCJGASA-N Phe-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CC=CC=C1)N UEHNWRNADDPYNK-DLOVCJGASA-N 0.000 description 3
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 3
- UPJGUQPLYWTISV-GUBZILKMSA-N Pro-Gln-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UPJGUQPLYWTISV-GUBZILKMSA-N 0.000 description 3
- MTMJNKFZDQEVSY-BZSNNMDCSA-N Pro-Val-Trp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O MTMJNKFZDQEVSY-BZSNNMDCSA-N 0.000 description 3
- FHJQROWZEJFZPO-SRVKXCTJSA-N Pro-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FHJQROWZEJFZPO-SRVKXCTJSA-N 0.000 description 3
- VGNYHOBZJKWRGI-CIUDSAMLSA-N Ser-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO VGNYHOBZJKWRGI-CIUDSAMLSA-N 0.000 description 3
- KNZQGAUEYZJUSQ-ZLUOBGJFSA-N Ser-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N KNZQGAUEYZJUSQ-ZLUOBGJFSA-N 0.000 description 3
- ZOHGLPQGEHSLPD-FXQIFTODSA-N Ser-Gln-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZOHGLPQGEHSLPD-FXQIFTODSA-N 0.000 description 3
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 3
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 3
- WSTIOCFMWXNOCX-YUMQZZPRSA-N Ser-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N WSTIOCFMWXNOCX-YUMQZZPRSA-N 0.000 description 3
- GDUZTEQRAOXYJS-SRVKXCTJSA-N Ser-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GDUZTEQRAOXYJS-SRVKXCTJSA-N 0.000 description 3
- FLMYSKVSDVHLEW-SVSWQMSJSA-N Ser-Thr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLMYSKVSDVHLEW-SVSWQMSJSA-N 0.000 description 3
- 101150006914 TRP1 gene Proteins 0.000 description 3
- JXKMXEBNZCKSDY-JIOCBJNQSA-N Thr-Asp-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O JXKMXEBNZCKSDY-JIOCBJNQSA-N 0.000 description 3
- RKDFEMGVMMYYNG-WDCWCFNPSA-N Thr-Gln-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O RKDFEMGVMMYYNG-WDCWCFNPSA-N 0.000 description 3
- XOTBWOCSLMBGMF-SUSMZKCASA-N Thr-Glu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOTBWOCSLMBGMF-SUSMZKCASA-N 0.000 description 3
- SIMKLINEDYOTKL-MBLNEYKQSA-N Thr-His-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C)C(=O)O)N)O SIMKLINEDYOTKL-MBLNEYKQSA-N 0.000 description 3
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 3
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 3
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 3
- BPGDJSUFQKWUBK-KJEVXHAQSA-N Thr-Val-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BPGDJSUFQKWUBK-KJEVXHAQSA-N 0.000 description 3
- PEYSVKMXSLPQRU-FJHTZYQYSA-N Trp-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O PEYSVKMXSLPQRU-FJHTZYQYSA-N 0.000 description 3
- UKINEYBQXPMOJO-UBHSHLNASA-N Trp-Asn-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N UKINEYBQXPMOJO-UBHSHLNASA-N 0.000 description 3
- MHCLIYHJRXZBGJ-AAEUAGOBSA-N Trp-Gly-Cys Chemical compound N[C@@H](CC1=CNC2=CC=CC=C12)C(=O)NCC(=O)N[C@@H](CS)C(=O)O MHCLIYHJRXZBGJ-AAEUAGOBSA-N 0.000 description 3
- DNUJCLUFRGGSDJ-YLVFBTJISA-N Trp-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CNC2=CC=CC=C21)N DNUJCLUFRGGSDJ-YLVFBTJISA-N 0.000 description 3
- HJXOFWKCWLHYIJ-SZMVWBNQSA-N Trp-Lys-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HJXOFWKCWLHYIJ-SZMVWBNQSA-N 0.000 description 3
- LVTKHGUGBGNBPL-UHFFFAOYSA-N Trp-P-1 Chemical compound N1C2=CC=CC=C2C2=C1C(C)=C(N)N=C2C LVTKHGUGBGNBPL-UHFFFAOYSA-N 0.000 description 3
- CTDPLKMBVALCGN-JSGCOSHPSA-N Tyr-Gly-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O CTDPLKMBVALCGN-JSGCOSHPSA-N 0.000 description 3
- WYOBRXPIZVKNMF-IRXDYDNUSA-N Tyr-Tyr-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)NCC(O)=O)C1=CC=C(O)C=C1 WYOBRXPIZVKNMF-IRXDYDNUSA-N 0.000 description 3
- VCAWFLIWYNMHQP-UKJIMTQDSA-N Val-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N VCAWFLIWYNMHQP-UKJIMTQDSA-N 0.000 description 3
- OACSGBOREVRSME-NHCYSSNCSA-N Val-His-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CC(N)=O)C(O)=O OACSGBOREVRSME-NHCYSSNCSA-N 0.000 description 3
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 3
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 3
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 3
- MIKHIIQMRFYVOR-RCWTZXSCSA-N Val-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C(C)C)N)O MIKHIIQMRFYVOR-RCWTZXSCSA-N 0.000 description 3
- QSPOLEBZTMESFY-SRVKXCTJSA-N Val-Pro-Val Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O QSPOLEBZTMESFY-SRVKXCTJSA-N 0.000 description 3
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 3
- IRAUYEAFPFPVND-UVBJJODRSA-N Val-Trp-Ala Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 IRAUYEAFPFPVND-UVBJJODRSA-N 0.000 description 3
- VVIZITNVZUAEMI-DLOVCJGASA-N Val-Val-Gln Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O VVIZITNVZUAEMI-DLOVCJGASA-N 0.000 description 3
- NLNCNKIVJPEFBC-DLOVCJGASA-N Val-Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O NLNCNKIVJPEFBC-DLOVCJGASA-N 0.000 description 3
- 238000007792 addition Methods 0.000 description 3
- 238000001042 affinity chromatography Methods 0.000 description 3
- 108010047495 alanylglycine Proteins 0.000 description 3
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 3
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 3
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 3
- 239000000969 carrier Substances 0.000 description 3
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 3
- 239000003937 drug carrier Substances 0.000 description 3
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 3
- 108010089804 glycyl-threonine Proteins 0.000 description 3
- 108010015792 glycyllysine Proteins 0.000 description 3
- 108010077515 glycylproline Proteins 0.000 description 3
- 108010037850 glycylvaline Proteins 0.000 description 3
- 108010036413 histidylglycine Proteins 0.000 description 3
- 208000015181 infectious disease Diseases 0.000 description 3
- 238000002347 injection Methods 0.000 description 3
- 239000007924 injection Substances 0.000 description 3
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 3
- 229960000310 isoleucine Drugs 0.000 description 3
- 108010027338 isoleucylcysteine Proteins 0.000 description 3
- 150000002632 lipids Chemical class 0.000 description 3
- 108010038320 lysylphenylalanine Proteins 0.000 description 3
- 108010017391 lysylvaline Proteins 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000036961 partial effect Effects 0.000 description 3
- 239000002243 precursor Substances 0.000 description 3
- 239000003755 preservative agent Substances 0.000 description 3
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 3
- 108010015796 prolylisoleucine Proteins 0.000 description 3
- 108010090894 prolylleucine Proteins 0.000 description 3
- 108020003175 receptors Proteins 0.000 description 3
- 102000005962 receptors Human genes 0.000 description 3
- 230000006641 stabilisation Effects 0.000 description 3
- 238000011105 stabilization Methods 0.000 description 3
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 3
- 108010051110 tyrosyl-lysine Proteins 0.000 description 3
- 238000002255 vaccination Methods 0.000 description 3
- 108010073969 valyllysine Proteins 0.000 description 3
- 108010009962 valyltyrosine Proteins 0.000 description 3
- IGXNPQWXIRIGBF-KEOOTSPTSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoic acid Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IGXNPQWXIRIGBF-KEOOTSPTSA-N 0.000 description 2
- NRJAVPSFFCBXDT-HUESYALOSA-N 1,2-distearoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCCCCCCCCCCC NRJAVPSFFCBXDT-HUESYALOSA-N 0.000 description 2
- DUMYKLNEYCJLQK-UHFFFAOYSA-N Ala-Gln-Gln-His Chemical compound CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(=O)NC(C(O)=O)CC1=CN=CN1 DUMYKLNEYCJLQK-UHFFFAOYSA-N 0.000 description 2
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 2
- NIZKGBJVCMRDKO-KWQFWETISA-N Ala-Gly-Tyr Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NIZKGBJVCMRDKO-KWQFWETISA-N 0.000 description 2
- NYDBKUNVSALYPX-NAKRPEOUSA-N Ala-Ile-Arg Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NYDBKUNVSALYPX-NAKRPEOUSA-N 0.000 description 2
- OINVDEKBKBCPLX-JXUBOQSCSA-N Ala-Lys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OINVDEKBKBCPLX-JXUBOQSCSA-N 0.000 description 2
- FVNAUOZKIPAYNA-BPNCWPANSA-N Ala-Met-Tyr Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FVNAUOZKIPAYNA-BPNCWPANSA-N 0.000 description 2
- OLVCTPPSXNRGKV-GUBZILKMSA-N Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OLVCTPPSXNRGKV-GUBZILKMSA-N 0.000 description 2
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 2
- NLYYHIKRBRMAJV-AEJSXWLSSA-N Ala-Val-Pro Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N NLYYHIKRBRMAJV-AEJSXWLSSA-N 0.000 description 2
- PQWTZSNVWSOFFK-FXQIFTODSA-N Arg-Asp-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)CN=C(N)N PQWTZSNVWSOFFK-FXQIFTODSA-N 0.000 description 2
- KMSHNDWHPWXPEC-BQBZGAKWSA-N Arg-Asp-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KMSHNDWHPWXPEC-BQBZGAKWSA-N 0.000 description 2
- SQKPKIJVWHAWNF-DCAQKATOSA-N Arg-Asp-Lys Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(O)=O SQKPKIJVWHAWNF-DCAQKATOSA-N 0.000 description 2
- JVMKBJNSRZWDBO-FXQIFTODSA-N Arg-Cys-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O JVMKBJNSRZWDBO-FXQIFTODSA-N 0.000 description 2
- FEZJJKXNPSEYEV-CIUDSAMLSA-N Arg-Gln-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FEZJJKXNPSEYEV-CIUDSAMLSA-N 0.000 description 2
- OHYQKYUTLIPFOX-ZPFDUUQYSA-N Arg-Glu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OHYQKYUTLIPFOX-ZPFDUUQYSA-N 0.000 description 2
- RFXXUWGNVRJTNQ-QXEWZRGKSA-N Arg-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N RFXXUWGNVRJTNQ-QXEWZRGKSA-N 0.000 description 2
- NVUIWHJLPSZZQC-CYDGBPFRSA-N Arg-Ile-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NVUIWHJLPSZZQC-CYDGBPFRSA-N 0.000 description 2
- LKDHUGLXOHYINY-XUXIUFHCSA-N Arg-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LKDHUGLXOHYINY-XUXIUFHCSA-N 0.000 description 2
- HGKHPCFTRQDHCU-IUCAKERBSA-N Arg-Pro-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HGKHPCFTRQDHCU-IUCAKERBSA-N 0.000 description 2
- VUGWHBXPMAHEGZ-SRVKXCTJSA-N Arg-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N VUGWHBXPMAHEGZ-SRVKXCTJSA-N 0.000 description 2
- ISJWBVIYRBAXEB-CIUDSAMLSA-N Arg-Ser-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O ISJWBVIYRBAXEB-CIUDSAMLSA-N 0.000 description 2
- WOZDCBHUGJVJPL-AVGNSLFASA-N Arg-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WOZDCBHUGJVJPL-AVGNSLFASA-N 0.000 description 2
- QHBMKQWOIYJYMI-BYULHYEWSA-N Asn-Asn-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QHBMKQWOIYJYMI-BYULHYEWSA-N 0.000 description 2
- WQSCVMQDZYTFQU-FXQIFTODSA-N Asn-Cys-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WQSCVMQDZYTFQU-FXQIFTODSA-N 0.000 description 2
- SPIPSJXLZVTXJL-ZLUOBGJFSA-N Asn-Cys-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O SPIPSJXLZVTXJL-ZLUOBGJFSA-N 0.000 description 2
- NUCUBYIUPVYGPP-XIRDDKMYSA-N Asn-Leu-Trp Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CC(N)=O)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O NUCUBYIUPVYGPP-XIRDDKMYSA-N 0.000 description 2
- SNYCNNPOFYBCEK-ZLUOBGJFSA-N Asn-Ser-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O SNYCNNPOFYBCEK-ZLUOBGJFSA-N 0.000 description 2
- QYRMBFWDSFGSFC-OLHMAJIHSA-N Asn-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QYRMBFWDSFGSFC-OLHMAJIHSA-N 0.000 description 2
- FLJVGAFLZVBBNG-BPUTZDHNSA-N Asn-Trp-Arg Chemical compound N[C@@H](CC(=O)N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(=O)N[C@@H](CCCNC(=N)N)C(=O)O FLJVGAFLZVBBNG-BPUTZDHNSA-N 0.000 description 2
- XEGZSHSPQNDNRH-JRQIVUDYSA-N Asn-Tyr-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XEGZSHSPQNDNRH-JRQIVUDYSA-N 0.000 description 2
- PQKSVQSMTHPRIB-ZKWXMUAHSA-N Asn-Val-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O PQKSVQSMTHPRIB-ZKWXMUAHSA-N 0.000 description 2
- WSOKZUVWBXVJHX-CIUDSAMLSA-N Asp-Arg-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O WSOKZUVWBXVJHX-CIUDSAMLSA-N 0.000 description 2
- FAEIQWHBRBWUBN-FXQIFTODSA-N Asp-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N)CN=C(N)N FAEIQWHBRBWUBN-FXQIFTODSA-N 0.000 description 2
- UQBGYPFHWFZMCD-ZLUOBGJFSA-N Asp-Asn-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O UQBGYPFHWFZMCD-ZLUOBGJFSA-N 0.000 description 2
- ICTXFVKYAGQURS-UBHSHLNASA-N Asp-Asn-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ICTXFVKYAGQURS-UBHSHLNASA-N 0.000 description 2
- RYEWQKQXRJCHIO-SRVKXCTJSA-N Asp-Asn-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 RYEWQKQXRJCHIO-SRVKXCTJSA-N 0.000 description 2
- VILLWIDTHYPSLC-PEFMBERDSA-N Asp-Glu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VILLWIDTHYPSLC-PEFMBERDSA-N 0.000 description 2
- GBSUGIXJAAKZOW-GMOBBJLQSA-N Asp-Ile-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GBSUGIXJAAKZOW-GMOBBJLQSA-N 0.000 description 2
- UZNSWMFLKVKJLI-VHWLVUOQSA-N Asp-Ile-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O UZNSWMFLKVKJLI-VHWLVUOQSA-N 0.000 description 2
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 2
- YTXCCDCOHIYQFC-GUBZILKMSA-N Asp-Met-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O YTXCCDCOHIYQFC-GUBZILKMSA-N 0.000 description 2
- MVRGBQGZSDJBSM-GMOBBJLQSA-N Asp-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)O)N MVRGBQGZSDJBSM-GMOBBJLQSA-N 0.000 description 2
- 102100021277 Beta-secretase 2 Human genes 0.000 description 2
- 101710150190 Beta-secretase 2 Proteins 0.000 description 2
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 2
- 108700010070 Codon Usage Proteins 0.000 description 2
- LHLSSZYQFUNWRZ-NAKRPEOUSA-N Cys-Arg-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LHLSSZYQFUNWRZ-NAKRPEOUSA-N 0.000 description 2
- KIQKJXYVGSYDFS-ZLUOBGJFSA-N Cys-Asn-Asn Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O KIQKJXYVGSYDFS-ZLUOBGJFSA-N 0.000 description 2
- KOHBWQDSVCARMI-BWBBJGPYSA-N Cys-Cys-Thr Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KOHBWQDSVCARMI-BWBBJGPYSA-N 0.000 description 2
- MKMKILWCRQLDFJ-DCAQKATOSA-N Cys-Lys-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MKMKILWCRQLDFJ-DCAQKATOSA-N 0.000 description 2
- NXQCSPVUPLUTJH-WHFBIAKZSA-N Cys-Ser-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O NXQCSPVUPLUTJH-WHFBIAKZSA-N 0.000 description 2
- NRVQLLDIJJEIIZ-VZFHVOOUSA-N Cys-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CS)N)O NRVQLLDIJJEIIZ-VZFHVOOUSA-N 0.000 description 2
- 230000006820 DNA synthesis Effects 0.000 description 2
- 101710121417 Envelope glycoprotein Proteins 0.000 description 2
- 101710114816 Gene 41 protein Proteins 0.000 description 2
- COYGBRTZEVWZBW-XKBZYTNZSA-N Gln-Cys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCC(N)=O COYGBRTZEVWZBW-XKBZYTNZSA-N 0.000 description 2
- PKVWNYGXMNWJSI-CIUDSAMLSA-N Gln-Gln-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O PKVWNYGXMNWJSI-CIUDSAMLSA-N 0.000 description 2
- XFKUFUJECJUQTQ-CIUDSAMLSA-N Gln-Gln-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XFKUFUJECJUQTQ-CIUDSAMLSA-N 0.000 description 2
- RBWKVOSARCFSQQ-FXQIFTODSA-N Gln-Gln-Ser Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O RBWKVOSARCFSQQ-FXQIFTODSA-N 0.000 description 2
- IWUFOVSLWADEJC-AVGNSLFASA-N Gln-His-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IWUFOVSLWADEJC-AVGNSLFASA-N 0.000 description 2
- LGIKBBLQVSWUGK-DCAQKATOSA-N Gln-Leu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGIKBBLQVSWUGK-DCAQKATOSA-N 0.000 description 2
- SHAUZYVSXAMYAZ-JYJNAYRXSA-N Gln-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SHAUZYVSXAMYAZ-JYJNAYRXSA-N 0.000 description 2
- DITJVHONFRJKJW-BPUTZDHNSA-N Gln-Trp-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N DITJVHONFRJKJW-BPUTZDHNSA-N 0.000 description 2
- OGMQXTXGLDNBSS-FXQIFTODSA-N Glu-Ala-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O OGMQXTXGLDNBSS-FXQIFTODSA-N 0.000 description 2
- FYBSCGZLICNOBA-XQXXSGGOSA-N Glu-Ala-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FYBSCGZLICNOBA-XQXXSGGOSA-N 0.000 description 2
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 2
- RDDSZZJOKDVPAE-ACZMJKKPSA-N Glu-Asn-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDDSZZJOKDVPAE-ACZMJKKPSA-N 0.000 description 2
- PCBBLFVHTYNQGG-LAEOZQHASA-N Glu-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N PCBBLFVHTYNQGG-LAEOZQHASA-N 0.000 description 2
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 2
- ZCOJVESMNGBGLF-GRLWGSQLSA-N Glu-Ile-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZCOJVESMNGBGLF-GRLWGSQLSA-N 0.000 description 2
- ZHNHJYYFCGUZNQ-KBIXCLLPSA-N Glu-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O ZHNHJYYFCGUZNQ-KBIXCLLPSA-N 0.000 description 2
- ZSWGJYOZWBHROQ-RWRJDSDZSA-N Glu-Ile-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSWGJYOZWBHROQ-RWRJDSDZSA-N 0.000 description 2
- INGJLBQKTRJLFO-UKJIMTQDSA-N Glu-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O INGJLBQKTRJLFO-UKJIMTQDSA-N 0.000 description 2
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 2
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 2
- CUPSDFQZTVVTSK-GUBZILKMSA-N Glu-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O CUPSDFQZTVVTSK-GUBZILKMSA-N 0.000 description 2
- OCJRHJZKGGSPRW-IUCAKERBSA-N Glu-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O OCJRHJZKGGSPRW-IUCAKERBSA-N 0.000 description 2
- ZGEJRLJEAMPEDV-SRVKXCTJSA-N Glu-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N ZGEJRLJEAMPEDV-SRVKXCTJSA-N 0.000 description 2
- YTRBQAQSUDSIQE-FHWLQOOXSA-N Glu-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 YTRBQAQSUDSIQE-FHWLQOOXSA-N 0.000 description 2
- JYXKPJVDCAWMDG-ZPFDUUQYSA-N Glu-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)O)N JYXKPJVDCAWMDG-ZPFDUUQYSA-N 0.000 description 2
- HVKAAUOFFTUSAA-XDTLVQLUSA-N Glu-Tyr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O HVKAAUOFFTUSAA-XDTLVQLUSA-N 0.000 description 2
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 2
- JRDYDYXZKFNNRQ-XPUUQOCRSA-N Gly-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN JRDYDYXZKFNNRQ-XPUUQOCRSA-N 0.000 description 2
- JXYMPBCYRKWJEE-BQBZGAKWSA-N Gly-Arg-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O JXYMPBCYRKWJEE-BQBZGAKWSA-N 0.000 description 2
- BGVYNAQWHSTTSP-BYULHYEWSA-N Gly-Asn-Ile Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BGVYNAQWHSTTSP-BYULHYEWSA-N 0.000 description 2
- FZQLXNIMCPJVJE-YUMQZZPRSA-N Gly-Asp-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FZQLXNIMCPJVJE-YUMQZZPRSA-N 0.000 description 2
- ZRZILYKEJBMFHY-BQBZGAKWSA-N Gly-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN ZRZILYKEJBMFHY-BQBZGAKWSA-N 0.000 description 2
- BPQYBFAXRGMGGY-LAEOZQHASA-N Gly-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN BPQYBFAXRGMGGY-LAEOZQHASA-N 0.000 description 2
- LHRXAHLCRMQBGJ-RYUDHWBXSA-N Gly-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)CN LHRXAHLCRMQBGJ-RYUDHWBXSA-N 0.000 description 2
- SWQALSGKVLYKDT-ZKWXMUAHSA-N Gly-Ile-Ala Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SWQALSGKVLYKDT-ZKWXMUAHSA-N 0.000 description 2
- COVXELOAORHTND-LSJOCFKGSA-N Gly-Ile-Val Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O COVXELOAORHTND-LSJOCFKGSA-N 0.000 description 2
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 2
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 2
- 241000282575 Gorilla Species 0.000 description 2
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 2
- 241000238631 Hexapoda Species 0.000 description 2
- SYMSVYVUSPSAAO-IHRRRGAJSA-N His-Arg-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O SYMSVYVUSPSAAO-IHRRRGAJSA-N 0.000 description 2
- RBOOOLVEKJHUNA-CIUDSAMLSA-N His-Cys-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O RBOOOLVEKJHUNA-CIUDSAMLSA-N 0.000 description 2
- PGTISAJTWZPFGN-PEXQALLHSA-N His-Gly-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O PGTISAJTWZPFGN-PEXQALLHSA-N 0.000 description 2
- STOOMQFEJUVAKR-KKUMJFAQSA-N His-His-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CNC=N1 STOOMQFEJUVAKR-KKUMJFAQSA-N 0.000 description 2
- ATXGFMOBVKSOMK-PEDHHIEDSA-N Ile-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N ATXGFMOBVKSOMK-PEDHHIEDSA-N 0.000 description 2
- WECYRWOMWSCWNX-XUXIUFHCSA-N Ile-Arg-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O WECYRWOMWSCWNX-XUXIUFHCSA-N 0.000 description 2
- XLCZWMJPVGRWHJ-KQXIARHKSA-N Ile-Glu-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N XLCZWMJPVGRWHJ-KQXIARHKSA-N 0.000 description 2
- NZOCIWKZUVUNDW-ZKWXMUAHSA-N Ile-Gly-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O NZOCIWKZUVUNDW-ZKWXMUAHSA-N 0.000 description 2
- QZZIBQZLWBOOJH-PEDHHIEDSA-N Ile-Ile-Val Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)O QZZIBQZLWBOOJH-PEDHHIEDSA-N 0.000 description 2
- TVYWVSJGSHQWMT-AJNGGQMLSA-N Ile-Leu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N TVYWVSJGSHQWMT-AJNGGQMLSA-N 0.000 description 2
- JHNJNTMTZHEDLJ-NAKRPEOUSA-N Ile-Ser-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JHNJNTMTZHEDLJ-NAKRPEOUSA-N 0.000 description 2
- KBDIBHQICWDGDL-PPCPHDFISA-N Ile-Thr-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N KBDIBHQICWDGDL-PPCPHDFISA-N 0.000 description 2
- WKSHBPRUIRGWRZ-KCTSRDHCSA-N Ile-Trp-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)NCC(=O)O)N WKSHBPRUIRGWRZ-KCTSRDHCSA-N 0.000 description 2
- JCGMFFQQHJQASB-PYJNHQTQSA-N Ile-Val-His Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O JCGMFFQQHJQASB-PYJNHQTQSA-N 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- 241000713666 Lentivirus Species 0.000 description 2
- 241000880493 Leptailurus serval Species 0.000 description 2
- HBJZFCIVFIBNSV-DCAQKATOSA-N Leu-Arg-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O HBJZFCIVFIBNSV-DCAQKATOSA-N 0.000 description 2
- UILIPCLTHRPCRB-XUXIUFHCSA-N Leu-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(C)C)N UILIPCLTHRPCRB-XUXIUFHCSA-N 0.000 description 2
- BAJIJEGGUYXZGC-CIUDSAMLSA-N Leu-Asn-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N BAJIJEGGUYXZGC-CIUDSAMLSA-N 0.000 description 2
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 2
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 2
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 2
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 2
- HRTRLSRYZZKPCO-BJDJZHNGSA-N Leu-Ile-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HRTRLSRYZZKPCO-BJDJZHNGSA-N 0.000 description 2
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 2
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 2
- HGUUMQWGYCVPKG-DCAQKATOSA-N Leu-Pro-Cys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)O)N HGUUMQWGYCVPKG-DCAQKATOSA-N 0.000 description 2
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 2
- IDGRADDMTTWOQC-WDSOQIARSA-N Leu-Trp-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IDGRADDMTTWOQC-WDSOQIARSA-N 0.000 description 2
- YWFZWQKWNDOWPA-XIRDDKMYSA-N Leu-Trp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O YWFZWQKWNDOWPA-XIRDDKMYSA-N 0.000 description 2
- LSLUTXRANSUGFY-XIRDDKMYSA-N Leu-Trp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(O)=O)C(O)=O LSLUTXRANSUGFY-XIRDDKMYSA-N 0.000 description 2
- LXGSOEPHQJONMG-PMVMPFDFSA-N Leu-Trp-Tyr Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)N LXGSOEPHQJONMG-PMVMPFDFSA-N 0.000 description 2
- BTEMNFBEAAOGBR-BZSNNMDCSA-N Leu-Tyr-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BTEMNFBEAAOGBR-BZSNNMDCSA-N 0.000 description 2
- CLBGMWIYPYAZPR-AVGNSLFASA-N Lys-Arg-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O CLBGMWIYPYAZPR-AVGNSLFASA-N 0.000 description 2
- QYOXSYXPHUHOJR-GUBZILKMSA-N Lys-Asn-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QYOXSYXPHUHOJR-GUBZILKMSA-N 0.000 description 2
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 2
- KZOHPCYVORJBLG-AVGNSLFASA-N Lys-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N KZOHPCYVORJBLG-AVGNSLFASA-N 0.000 description 2
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 2
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 2
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 2
- HYSVGEAWTGPMOA-IHRRRGAJSA-N Lys-Pro-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O HYSVGEAWTGPMOA-IHRRRGAJSA-N 0.000 description 2
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 2
- RPWTZTBIFGENIA-VOAKCMCISA-N Lys-Thr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RPWTZTBIFGENIA-VOAKCMCISA-N 0.000 description 2
- CAVRAQIDHUPECU-UVOCVTCTSA-N Lys-Thr-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAVRAQIDHUPECU-UVOCVTCTSA-N 0.000 description 2
- WINFHLHJTRGLCV-BZSNNMDCSA-N Lys-Tyr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=C(O)C=C1 WINFHLHJTRGLCV-BZSNNMDCSA-N 0.000 description 2
- IKXQOBUBZSOWDY-AVGNSLFASA-N Lys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N IKXQOBUBZSOWDY-AVGNSLFASA-N 0.000 description 2
- CWFYZYQMUDWGTI-GUBZILKMSA-N Met-Arg-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O CWFYZYQMUDWGTI-GUBZILKMSA-N 0.000 description 2
- BKIFWLQFOOKUCA-DCAQKATOSA-N Met-His-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CO)C(=O)O)N BKIFWLQFOOKUCA-DCAQKATOSA-N 0.000 description 2
- ZIIMORLEZLVRIP-SRVKXCTJSA-N Met-Leu-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZIIMORLEZLVRIP-SRVKXCTJSA-N 0.000 description 2
- LBNFTWKGISQVEE-AVGNSLFASA-N Met-Leu-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCSC LBNFTWKGISQVEE-AVGNSLFASA-N 0.000 description 2
- JCMMNFZUKMMECJ-DCAQKATOSA-N Met-Lys-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O JCMMNFZUKMMECJ-DCAQKATOSA-N 0.000 description 2
- OIFHHODAXVWKJN-ULQDDVLXSA-N Met-Phe-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 OIFHHODAXVWKJN-ULQDDVLXSA-N 0.000 description 2
- YDKYJRZWRJTILC-WDSOQIARSA-N Met-Trp-Lys Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCSC)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 YDKYJRZWRJTILC-WDSOQIARSA-N 0.000 description 2
- HOTNHEUETJELDL-BPNCWPANSA-N Met-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCSC)N HOTNHEUETJELDL-BPNCWPANSA-N 0.000 description 2
- OVTOTTGZBWXLFU-QXEWZRGKSA-N Met-Val-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O OVTOTTGZBWXLFU-QXEWZRGKSA-N 0.000 description 2
- QAVZUKIPOMBLMC-AVGNSLFASA-N Met-Val-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C QAVZUKIPOMBLMC-AVGNSLFASA-N 0.000 description 2
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- QMMRHASQEVCJGR-UBHSHLNASA-N Phe-Ala-Pro Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=CC=C1 QMMRHASQEVCJGR-UBHSHLNASA-N 0.000 description 2
- BRDYYVQTEJVRQT-HRCADAONSA-N Phe-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O BRDYYVQTEJVRQT-HRCADAONSA-N 0.000 description 2
- UUWCIPUVJJIEEP-SRVKXCTJSA-N Phe-Asn-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N UUWCIPUVJJIEEP-SRVKXCTJSA-N 0.000 description 2
- HHOOEUSPFGPZFP-QWRGUYRKSA-N Phe-Asn-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HHOOEUSPFGPZFP-QWRGUYRKSA-N 0.000 description 2
- LNIIRLODKOWQIY-IHRRRGAJSA-N Phe-Asn-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O LNIIRLODKOWQIY-IHRRRGAJSA-N 0.000 description 2
- GHNVJQZQYKNTDX-HJWJTTGWSA-N Phe-Ile-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(O)=O GHNVJQZQYKNTDX-HJWJTTGWSA-N 0.000 description 2
- DSXPMZMSJHOKKK-HJOGWXRNSA-N Phe-Phe-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O DSXPMZMSJHOKKK-HJOGWXRNSA-N 0.000 description 2
- RVEVENLSADZUMS-IHRRRGAJSA-N Phe-Pro-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O RVEVENLSADZUMS-IHRRRGAJSA-N 0.000 description 2
- CVAUVSOFHJKCHN-BZSNNMDCSA-N Phe-Tyr-Cys Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CS)C(O)=O)C1=CC=CC=C1 CVAUVSOFHJKCHN-BZSNNMDCSA-N 0.000 description 2
- DBNGDEAQXGFGRA-ACRUOGEOSA-N Phe-Tyr-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DBNGDEAQXGFGRA-ACRUOGEOSA-N 0.000 description 2
- KIZQGKLMXKGDIV-BQBZGAKWSA-N Pro-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 KIZQGKLMXKGDIV-BQBZGAKWSA-N 0.000 description 2
- TXPUNZXZDVJUJQ-LPEHRKFASA-N Pro-Asn-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O TXPUNZXZDVJUJQ-LPEHRKFASA-N 0.000 description 2
- JMVQDLDPDBXAAX-YUMQZZPRSA-N Pro-Gly-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 JMVQDLDPDBXAAX-YUMQZZPRSA-N 0.000 description 2
- IBGCFJDLCYTKPW-NAKRPEOUSA-N Pro-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 IBGCFJDLCYTKPW-NAKRPEOUSA-N 0.000 description 2
- SOACYAXADBWDDT-CYDGBPFRSA-N Pro-Ile-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SOACYAXADBWDDT-CYDGBPFRSA-N 0.000 description 2
- FJLODLCIOJUDRG-PYJNHQTQSA-N Pro-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 FJLODLCIOJUDRG-PYJNHQTQSA-N 0.000 description 2
- FKVNLUZHSFCNGY-RVMXOQNASA-N Pro-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 FKVNLUZHSFCNGY-RVMXOQNASA-N 0.000 description 2
- RUDOLGWDSKQQFF-DCAQKATOSA-N Pro-Leu-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O RUDOLGWDSKQQFF-DCAQKATOSA-N 0.000 description 2
- FXGIMYRVJJEIIM-UWVGGRQHSA-N Pro-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FXGIMYRVJJEIIM-UWVGGRQHSA-N 0.000 description 2
- RSTWKJFWBKFOFC-JYJNAYRXSA-N Pro-Trp-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O RSTWKJFWBKFOFC-JYJNAYRXSA-N 0.000 description 2
- 241000714474 Rous sarcoma virus Species 0.000 description 2
- RDFQNDHEHVSONI-ZLUOBGJFSA-N Ser-Asn-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDFQNDHEHVSONI-ZLUOBGJFSA-N 0.000 description 2
- CDVFZMOFNJPUDD-ACZMJKKPSA-N Ser-Gln-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CDVFZMOFNJPUDD-ACZMJKKPSA-N 0.000 description 2
- SMIDBHKWSYUBRZ-ACZMJKKPSA-N Ser-Glu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O SMIDBHKWSYUBRZ-ACZMJKKPSA-N 0.000 description 2
- WBINSDOPZHQPPM-AVGNSLFASA-N Ser-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)O WBINSDOPZHQPPM-AVGNSLFASA-N 0.000 description 2
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 2
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 2
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 2
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 2
- DKGRNFUXVTYRAS-UBHSHLNASA-N Ser-Ser-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O DKGRNFUXVTYRAS-UBHSHLNASA-N 0.000 description 2
- ZKOKTQPHFMRSJP-YJRXYDGGSA-N Ser-Thr-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKOKTQPHFMRSJP-YJRXYDGGSA-N 0.000 description 2
- MFQMZDPAZRZAPV-NAKRPEOUSA-N Ser-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CO)N MFQMZDPAZRZAPV-NAKRPEOUSA-N 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 101710172711 Structural protein Proteins 0.000 description 2
- VIBXMCZWVUOZLA-OLHMAJIHSA-N Thr-Asn-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O VIBXMCZWVUOZLA-OLHMAJIHSA-N 0.000 description 2
- VBPDMBAFBRDZSK-HOUAVDHOSA-N Thr-Asn-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O VBPDMBAFBRDZSK-HOUAVDHOSA-N 0.000 description 2
- MFEBUIFJVPNZLO-OLHMAJIHSA-N Thr-Asp-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O MFEBUIFJVPNZLO-OLHMAJIHSA-N 0.000 description 2
- YAAPRMFURSENOZ-KATARQTJSA-N Thr-Cys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N)O YAAPRMFURSENOZ-KATARQTJSA-N 0.000 description 2
- CQNFRKAKGDSJFR-NUMRIWBASA-N Thr-Glu-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CQNFRKAKGDSJFR-NUMRIWBASA-N 0.000 description 2
- BNGDYRRHRGOPHX-IFFSRLJSSA-N Thr-Glu-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O BNGDYRRHRGOPHX-IFFSRLJSSA-N 0.000 description 2
- XFTYVCHLARBHBQ-FOHZUACHSA-N Thr-Gly-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XFTYVCHLARBHBQ-FOHZUACHSA-N 0.000 description 2
- MSIYNSBKKVMGFO-BHNWBGBOSA-N Thr-Gly-Pro Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N)O MSIYNSBKKVMGFO-BHNWBGBOSA-N 0.000 description 2
- KRGDDWVBBDLPSJ-CUJWVEQBSA-N Thr-His-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O KRGDDWVBBDLPSJ-CUJWVEQBSA-N 0.000 description 2
- QHUWWSQZTFLXPQ-FJXKBIBVSA-N Thr-Met-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O QHUWWSQZTFLXPQ-FJXKBIBVSA-N 0.000 description 2
- WRQLCVIALDUQEQ-UNQGMJICSA-N Thr-Phe-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WRQLCVIALDUQEQ-UNQGMJICSA-N 0.000 description 2
- MEBDIIKMUUNBSB-RPTUDFQQSA-N Thr-Phe-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MEBDIIKMUUNBSB-RPTUDFQQSA-N 0.000 description 2
- NQQMWWVVGIXUOX-SVSWQMSJSA-N Thr-Ser-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NQQMWWVVGIXUOX-SVSWQMSJSA-N 0.000 description 2
- FRQRWAMUESPWMT-HSHDSVGOSA-N Thr-Trp-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCSC)C(=O)O)N)O FRQRWAMUESPWMT-HSHDSVGOSA-N 0.000 description 2
- BTAJAOWZCWOHBU-HSHDSVGOSA-N Thr-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)C(C)C)C(O)=O)=CNC2=C1 BTAJAOWZCWOHBU-HSHDSVGOSA-N 0.000 description 2
- TWJDQTTXXZDJKV-BPUTZDHNSA-N Trp-Arg-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O TWJDQTTXXZDJKV-BPUTZDHNSA-N 0.000 description 2
- GKUROEIXVURAAO-BPUTZDHNSA-N Trp-Asp-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GKUROEIXVURAAO-BPUTZDHNSA-N 0.000 description 2
- IQGJAHMZWBTRIF-UBHSHLNASA-N Trp-Asp-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N IQGJAHMZWBTRIF-UBHSHLNASA-N 0.000 description 2
- DQDXHYIEITXNJY-BPUTZDHNSA-N Trp-Gln-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N DQDXHYIEITXNJY-BPUTZDHNSA-N 0.000 description 2
- VOCHZIJXPRBVSI-XIRDDKMYSA-N Trp-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N VOCHZIJXPRBVSI-XIRDDKMYSA-N 0.000 description 2
- KBKTUNYBNJWFRL-UBHSHLNASA-N Trp-Ser-Asn Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O)=CNC2=C1 KBKTUNYBNJWFRL-UBHSHLNASA-N 0.000 description 2
- VRTMYQGKPQZAPO-SBCJRHGPSA-N Trp-Trp-Ile Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VRTMYQGKPQZAPO-SBCJRHGPSA-N 0.000 description 2
- OOEUVMFKKZYSRX-LEWSCRJBSA-N Tyr-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OOEUVMFKKZYSRX-LEWSCRJBSA-N 0.000 description 2
- SMLCYZYQFRTLCO-UWJYBYFXSA-N Tyr-Cys-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O SMLCYZYQFRTLCO-UWJYBYFXSA-N 0.000 description 2
- RIJPHPUJRLEOAK-JYJNAYRXSA-N Tyr-Gln-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O RIJPHPUJRLEOAK-JYJNAYRXSA-N 0.000 description 2
- SLCSPPCQWUHPPO-JYJNAYRXSA-N Tyr-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 SLCSPPCQWUHPPO-JYJNAYRXSA-N 0.000 description 2
- CNNVVEPJTFOGHI-ACRUOGEOSA-N Tyr-Lys-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CNNVVEPJTFOGHI-ACRUOGEOSA-N 0.000 description 2
- PMHLLBKTDHQMCY-ULQDDVLXSA-N Tyr-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMHLLBKTDHQMCY-ULQDDVLXSA-N 0.000 description 2
- PWKMJDQXKCENMF-MEYUZBJRSA-N Tyr-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O PWKMJDQXKCENMF-MEYUZBJRSA-N 0.000 description 2
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 2
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 2
- ZEVNVXYRZRIRCH-GVXVVHGQSA-N Val-Gln-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N ZEVNVXYRZRIRCH-GVXVVHGQSA-N 0.000 description 2
- VLDMQVZZWDOKQF-AUTRQRHGSA-N Val-Glu-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VLDMQVZZWDOKQF-AUTRQRHGSA-N 0.000 description 2
- PMDOQZFYGWZSTK-LSJOCFKGSA-N Val-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C PMDOQZFYGWZSTK-LSJOCFKGSA-N 0.000 description 2
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 2
- NZGOVKLVQNOEKP-YDHLFZDLSA-N Val-Phe-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NZGOVKLVQNOEKP-YDHLFZDLSA-N 0.000 description 2
- USLVEJAHTBLSIL-CYDGBPFRSA-N Val-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C USLVEJAHTBLSIL-CYDGBPFRSA-N 0.000 description 2
- LCHZBEUVGAVMKS-RHYQMDGZSA-N Val-Thr-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)[C@@H](C)O)C(O)=O LCHZBEUVGAVMKS-RHYQMDGZSA-N 0.000 description 2
- AOILQMZPNLUXCM-AVGNSLFASA-N Val-Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN AOILQMZPNLUXCM-AVGNSLFASA-N 0.000 description 2
- 239000000654 additive Substances 0.000 description 2
- 108010070944 alanylhistidine Proteins 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000005875 antibody response Effects 0.000 description 2
- 108010013835 arginine glutamate Proteins 0.000 description 2
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 2
- 238000012439 bead-based proximity assay Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 239000011230 binding agent Substances 0.000 description 2
- 229910002091 carbon monoxide Inorganic materials 0.000 description 2
- 210000000170 cell membrane Anatomy 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 235000012000 cholesterol Nutrition 0.000 description 2
- 238000004587 chromatography analysis Methods 0.000 description 2
- 239000000356 contaminant Substances 0.000 description 2
- 235000018417 cysteine Nutrition 0.000 description 2
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 2
- 108010016616 cysteinylglycine Proteins 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 239000000539 dimer Substances 0.000 description 2
- 108010054812 diprotin A Proteins 0.000 description 2
- 239000007884 disintegrant Substances 0.000 description 2
- 238000007876 drug discovery Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000796 flavoring agent Substances 0.000 description 2
- 235000013355 food flavoring agent Nutrition 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- 150000002334 glycols Chemical class 0.000 description 2
- 108010092114 histidylphenylalanine Proteins 0.000 description 2
- 108010018006 histidylserine Proteins 0.000 description 2
- 230000002163 immunogen Effects 0.000 description 2
- 230000005847 immunogenicity Effects 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 108010078274 isoleucylvaline Proteins 0.000 description 2
- 108010053037 kyotorphin Proteins 0.000 description 2
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 2
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 2
- 239000000314 lubricant Substances 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 2
- 108700021021 mRNA Vaccine Proteins 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 108010056582 methionylglutamic acid Proteins 0.000 description 2
- 239000002773 nucleotide Substances 0.000 description 2
- 125000003729 nucleotide group Chemical group 0.000 description 2
- 239000003921 oil Substances 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000001717 pathogenic effect Effects 0.000 description 2
- 239000000546 pharmaceutical excipient Substances 0.000 description 2
- 108010012581 phenylalanylglutamate Proteins 0.000 description 2
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 2
- 238000003752 polymerase chain reaction Methods 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 125000001500 prolyl group Chemical group [H]N1C([H])(C(=O)[*])C([H])([H])C([H])([H])C1([H])[H] 0.000 description 2
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 2
- 238000000159 protein binding assay Methods 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 230000001177 retroviral effect Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 108010048818 seryl-histidine Proteins 0.000 description 2
- 108010061238 threonyl-glycine Proteins 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 108010080629 tryptophan-leucine Proteins 0.000 description 2
- 108010043941 valyl-glutamyl-isoleucyl-asparaginyl-cysteinyl-threonyl-arginine Proteins 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 239000000080 wetting agent Substances 0.000 description 2
- CWFMWBHMIMNZLN-NAKRPEOUSA-N (2s)-1-[(2s)-2-[[(2s,3s)-2-amino-3-methylpentanoyl]amino]propanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CWFMWBHMIMNZLN-NAKRPEOUSA-N 0.000 description 1
- QVVDVENEPNODSI-BTNSXGMBSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-5-(diaminomethylideneamino)pentanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-5-(diaminomethylidene Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QVVDVENEPNODSI-BTNSXGMBSA-N 0.000 description 1
- SYFQYGMJENQVQT-UHFFFAOYSA-N 6-amino-2-[bis(carboxymethyl)amino]hexanoic acid Chemical compound NCCCCC(C(O)=O)N(CC(O)=O)CC(O)=O SYFQYGMJENQVQT-UHFFFAOYSA-N 0.000 description 1
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 1
- WJRXVTCKASUIFF-FXQIFTODSA-N Ala-Cys-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WJRXVTCKASUIFF-FXQIFTODSA-N 0.000 description 1
- VIGKUFXFTPWYER-BIIVOSGPSA-N Ala-Cys-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N VIGKUFXFTPWYER-BIIVOSGPSA-N 0.000 description 1
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 1
- QHASENCZLDHBGX-ONGXEEELSA-N Ala-Gly-Phe Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QHASENCZLDHBGX-ONGXEEELSA-N 0.000 description 1
- ANGAOPNEPIDLPO-XVYDVKMFSA-N Ala-His-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CS)C(=O)O)N ANGAOPNEPIDLPO-XVYDVKMFSA-N 0.000 description 1
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 1
- LBYMZCVBOKYZNS-CIUDSAMLSA-N Ala-Leu-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O LBYMZCVBOKYZNS-CIUDSAMLSA-N 0.000 description 1
- OPZJWMJPCNNZNT-DCAQKATOSA-N Ala-Leu-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N OPZJWMJPCNNZNT-DCAQKATOSA-N 0.000 description 1
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 1
- XWFWAXPOLRTDFZ-FXQIFTODSA-N Ala-Pro-Ser Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O XWFWAXPOLRTDFZ-FXQIFTODSA-N 0.000 description 1
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 1
- MMLHRUJLOUSRJX-CIUDSAMLSA-N Ala-Ser-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN MMLHRUJLOUSRJX-CIUDSAMLSA-N 0.000 description 1
- UCDOXFBTMLKASE-HERUPUMHSA-N Ala-Ser-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N UCDOXFBTMLKASE-HERUPUMHSA-N 0.000 description 1
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 1
- FSXDWQGEWZQBPJ-HERUPUMHSA-N Ala-Trp-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)O)C(=O)O)N FSXDWQGEWZQBPJ-HERUPUMHSA-N 0.000 description 1
- DHONNEYAZPNGSG-UBHSHLNASA-N Ala-Val-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DHONNEYAZPNGSG-UBHSHLNASA-N 0.000 description 1
- PEFFAAKJGBZBKL-NAKRPEOUSA-N Arg-Ala-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PEFFAAKJGBZBKL-NAKRPEOUSA-N 0.000 description 1
- XVLLUZMFSAYKJV-GUBZILKMSA-N Arg-Asp-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XVLLUZMFSAYKJV-GUBZILKMSA-N 0.000 description 1
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 1
- TTXYKSADPSNOIF-IHRRRGAJSA-N Arg-Asp-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O TTXYKSADPSNOIF-IHRRRGAJSA-N 0.000 description 1
- YSUVMPICYVWRBX-VEVYYDQMSA-N Arg-Asp-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YSUVMPICYVWRBX-VEVYYDQMSA-N 0.000 description 1
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 1
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 1
- VRZDJJWOFXMFRO-ZFWWWQNUSA-N Arg-Gly-Trp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O VRZDJJWOFXMFRO-ZFWWWQNUSA-N 0.000 description 1
- HCIUUZGFTDTEGM-NAKRPEOUSA-N Arg-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N HCIUUZGFTDTEGM-NAKRPEOUSA-N 0.000 description 1
- YQGZIRIYGHNSQO-ZPFDUUQYSA-N Arg-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YQGZIRIYGHNSQO-ZPFDUUQYSA-N 0.000 description 1
- UAOSDDXCTBIPCA-QXEWZRGKSA-N Arg-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UAOSDDXCTBIPCA-QXEWZRGKSA-N 0.000 description 1
- SSZGOKWBHLOCHK-DCAQKATOSA-N Arg-Lys-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N SSZGOKWBHLOCHK-DCAQKATOSA-N 0.000 description 1
- KMFPQTITXUKJOV-DCAQKATOSA-N Arg-Ser-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O KMFPQTITXUKJOV-DCAQKATOSA-N 0.000 description 1
- OQPAZKMGCWPERI-GUBZILKMSA-N Arg-Ser-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OQPAZKMGCWPERI-GUBZILKMSA-N 0.000 description 1
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- SLKLLQWZQHXYSV-CIUDSAMLSA-N Asn-Ala-Lys Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O SLKLLQWZQHXYSV-CIUDSAMLSA-N 0.000 description 1
- LJUOLNXOWSWGKF-ACZMJKKPSA-N Asn-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N LJUOLNXOWSWGKF-ACZMJKKPSA-N 0.000 description 1
- DAPLJWATMAXPPZ-CIUDSAMLSA-N Asn-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O DAPLJWATMAXPPZ-CIUDSAMLSA-N 0.000 description 1
- BGINHSZTXRJIPP-FXQIFTODSA-N Asn-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N BGINHSZTXRJIPP-FXQIFTODSA-N 0.000 description 1
- XQQVCUIBGYFKDC-OLHMAJIHSA-N Asn-Asp-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XQQVCUIBGYFKDC-OLHMAJIHSA-N 0.000 description 1
- UBKOVSLDWIHYSY-ACZMJKKPSA-N Asn-Glu-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UBKOVSLDWIHYSY-ACZMJKKPSA-N 0.000 description 1
- LTZIRYMWOJHRCH-GUDRVLHUSA-N Asn-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N LTZIRYMWOJHRCH-GUDRVLHUSA-N 0.000 description 1
- SEKBHZJLARBNPB-GHCJXIJMSA-N Asn-Ile-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O SEKBHZJLARBNPB-GHCJXIJMSA-N 0.000 description 1
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 1
- COWITDLVHMZSIW-CIUDSAMLSA-N Asn-Lys-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O COWITDLVHMZSIW-CIUDSAMLSA-N 0.000 description 1
- AYOAHKWVQLNPDM-HJGDQZAQSA-N Asn-Lys-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AYOAHKWVQLNPDM-HJGDQZAQSA-N 0.000 description 1
- VITDJIPIJZAVGC-VEVYYDQMSA-N Asn-Met-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VITDJIPIJZAVGC-VEVYYDQMSA-N 0.000 description 1
- RTFWCVDISAMGEQ-SRVKXCTJSA-N Asn-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N RTFWCVDISAMGEQ-SRVKXCTJSA-N 0.000 description 1
- BKFXFUPYETWGGA-XVSYOHENSA-N Asn-Phe-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BKFXFUPYETWGGA-XVSYOHENSA-N 0.000 description 1
- YRTOMUMWSTUQAX-FXQIFTODSA-N Asn-Pro-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O YRTOMUMWSTUQAX-FXQIFTODSA-N 0.000 description 1
- JXMREEPBRANWBY-VEVYYDQMSA-N Asn-Thr-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JXMREEPBRANWBY-VEVYYDQMSA-N 0.000 description 1
- ZUFPUBYQYWCMDB-NUMRIWBASA-N Asn-Thr-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZUFPUBYQYWCMDB-NUMRIWBASA-N 0.000 description 1
- MJIJBEYEHBKTIM-BYULHYEWSA-N Asn-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N MJIJBEYEHBKTIM-BYULHYEWSA-N 0.000 description 1
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 1
- WKGJGVGTEZGFSW-FXQIFTODSA-N Asp-Asn-Met Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O WKGJGVGTEZGFSW-FXQIFTODSA-N 0.000 description 1
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 1
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 1
- PXLNPFOJZQMXAT-BYULHYEWSA-N Asp-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O PXLNPFOJZQMXAT-BYULHYEWSA-N 0.000 description 1
- LJRPYAZQQWHEEV-FXQIFTODSA-N Asp-Gln-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O LJRPYAZQQWHEEV-FXQIFTODSA-N 0.000 description 1
- XAJRHVUUVUPFQL-ACZMJKKPSA-N Asp-Glu-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XAJRHVUUVUPFQL-ACZMJKKPSA-N 0.000 description 1
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 1
- SEMWSADZTMJELF-BYULHYEWSA-N Asp-Ile-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O SEMWSADZTMJELF-BYULHYEWSA-N 0.000 description 1
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 1
- NZWDWXSWUQCNMG-GARJFASQSA-N Asp-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)C(=O)O NZWDWXSWUQCNMG-GARJFASQSA-N 0.000 description 1
- BWJZSLQJNBSUPM-FXQIFTODSA-N Asp-Pro-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O BWJZSLQJNBSUPM-FXQIFTODSA-N 0.000 description 1
- BJDHEININLSZOT-KKUMJFAQSA-N Asp-Tyr-Lys Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(O)=O BJDHEININLSZOT-KKUMJFAQSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 241000700198 Cavia Species 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 241001217856 Chimpanzee adenovirus Species 0.000 description 1
- 229940046168 CpG oligodeoxynucleotide Drugs 0.000 description 1
- CEZSLNCYQUFOSL-BQBZGAKWSA-N Cys-Arg-Gly Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O CEZSLNCYQUFOSL-BQBZGAKWSA-N 0.000 description 1
- CPTUXCUWQIBZIF-ZLUOBGJFSA-N Cys-Asn-Ser Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CPTUXCUWQIBZIF-ZLUOBGJFSA-N 0.000 description 1
- NDUSUIGBMZCOIL-ZKWXMUAHSA-N Cys-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CS)N NDUSUIGBMZCOIL-ZKWXMUAHSA-N 0.000 description 1
- DZLQXIFVQFTFJY-BYPYZUCNSA-N Cys-Gly-Gly Chemical compound SC[C@H](N)C(=O)NCC(=O)NCC(O)=O DZLQXIFVQFTFJY-BYPYZUCNSA-N 0.000 description 1
- KCPOQGRVVXYLAC-KKUMJFAQSA-N Cys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CS)N KCPOQGRVVXYLAC-KKUMJFAQSA-N 0.000 description 1
- NIXHTNJAGGFBAW-CIUDSAMLSA-N Cys-Lys-Ser Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N NIXHTNJAGGFBAW-CIUDSAMLSA-N 0.000 description 1
- YNJBLTDKTMKEET-ZLUOBGJFSA-N Cys-Ser-Ser Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O YNJBLTDKTMKEET-ZLUOBGJFSA-N 0.000 description 1
- YWEHYKGJWHPGPY-XGEHTFHBSA-N Cys-Thr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CS)N)O YWEHYKGJWHPGPY-XGEHTFHBSA-N 0.000 description 1
- FNXOZWPPOJRBRE-XGEHTFHBSA-N Cys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CS)N)O FNXOZWPPOJRBRE-XGEHTFHBSA-N 0.000 description 1
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 241000702421 Dependoparvovirus Species 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- XZWYTXMRWQJBGX-VXBMVYAYSA-N FLAG peptide Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=C(O)C=C1 XZWYTXMRWQJBGX-VXBMVYAYSA-N 0.000 description 1
- 102000008857 Ferritin Human genes 0.000 description 1
- 108050000784 Ferritin Proteins 0.000 description 1
- 238000008416 Ferritin Methods 0.000 description 1
- 101710177291 Gag polyprotein Proteins 0.000 description 1
- DTCCMDYODDPHBG-ACZMJKKPSA-N Gln-Ala-Cys Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(O)=O DTCCMDYODDPHBG-ACZMJKKPSA-N 0.000 description 1
- PGPJSRSLQNXBDT-YUMQZZPRSA-N Gln-Arg-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O PGPJSRSLQNXBDT-YUMQZZPRSA-N 0.000 description 1
- TWHDOEYLXXQYOZ-FXQIFTODSA-N Gln-Asn-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N TWHDOEYLXXQYOZ-FXQIFTODSA-N 0.000 description 1
- BTSPOOHJBYJRKO-CIUDSAMLSA-N Gln-Asp-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BTSPOOHJBYJRKO-CIUDSAMLSA-N 0.000 description 1
- CITDWMLWXNUQKD-FXQIFTODSA-N Gln-Gln-Asn Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CITDWMLWXNUQKD-FXQIFTODSA-N 0.000 description 1
- GPISLLFQNHELLK-DCAQKATOSA-N Gln-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N GPISLLFQNHELLK-DCAQKATOSA-N 0.000 description 1
- CGVWDTRDPLOMHZ-FXQIFTODSA-N Gln-Glu-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O CGVWDTRDPLOMHZ-FXQIFTODSA-N 0.000 description 1
- PXAFHUATEHLECW-GUBZILKMSA-N Gln-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N PXAFHUATEHLECW-GUBZILKMSA-N 0.000 description 1
- FGYPOQPQTUNESW-IUCAKERBSA-N Gln-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N FGYPOQPQTUNESW-IUCAKERBSA-N 0.000 description 1
- VGTDBGYFVWOQTI-RYUDHWBXSA-N Gln-Gly-Phe Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VGTDBGYFVWOQTI-RYUDHWBXSA-N 0.000 description 1
- TWTWUBHEWQPMQW-ZPFDUUQYSA-N Gln-Ile-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWTWUBHEWQPMQW-ZPFDUUQYSA-N 0.000 description 1
- TYRMVTKPOWPZBC-SXNHZJKMSA-N Gln-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCC(=O)N)N TYRMVTKPOWPZBC-SXNHZJKMSA-N 0.000 description 1
- MLSKFHLRFVGNLL-WDCWCFNPSA-N Gln-Leu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MLSKFHLRFVGNLL-WDCWCFNPSA-N 0.000 description 1
- OKARHJKJTKFQBM-ACZMJKKPSA-N Gln-Ser-Asn Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OKARHJKJTKFQBM-ACZMJKKPSA-N 0.000 description 1
- HGBHRZBXOOHRDH-JBACZVJFSA-N Gln-Tyr-Trp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O HGBHRZBXOOHRDH-JBACZVJFSA-N 0.000 description 1
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 1
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 1
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 1
- VTTSANCGJWLPNC-ZPFDUUQYSA-N Glu-Arg-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VTTSANCGJWLPNC-ZPFDUUQYSA-N 0.000 description 1
- XHUCVVHRLNPZSZ-CIUDSAMLSA-N Glu-Gln-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XHUCVVHRLNPZSZ-CIUDSAMLSA-N 0.000 description 1
- KASDBWKLWJKTLJ-GUBZILKMSA-N Glu-Glu-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O KASDBWKLWJKTLJ-GUBZILKMSA-N 0.000 description 1
- IQACOVZVOMVILH-FXQIFTODSA-N Glu-Glu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O IQACOVZVOMVILH-FXQIFTODSA-N 0.000 description 1
- BIHMNDPWRUROFZ-JYJNAYRXSA-N Glu-His-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BIHMNDPWRUROFZ-JYJNAYRXSA-N 0.000 description 1
- QIQABBIDHGQXGA-ZPFDUUQYSA-N Glu-Ile-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QIQABBIDHGQXGA-ZPFDUUQYSA-N 0.000 description 1
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 1
- BCYGDJXHAGZNPQ-DCAQKATOSA-N Glu-Lys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O BCYGDJXHAGZNPQ-DCAQKATOSA-N 0.000 description 1
- NTHIHAUEXVTXQG-KKUMJFAQSA-N Glu-Tyr-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O NTHIHAUEXVTXQG-KKUMJFAQSA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- OCQUNKSFDYDXBG-QXEWZRGKSA-N Gly-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OCQUNKSFDYDXBG-QXEWZRGKSA-N 0.000 description 1
- MXXXVOYFNVJHMA-IUCAKERBSA-N Gly-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN MXXXVOYFNVJHMA-IUCAKERBSA-N 0.000 description 1
- CIMULJZTTOBOPN-WHFBIAKZSA-N Gly-Asn-Asn Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CIMULJZTTOBOPN-WHFBIAKZSA-N 0.000 description 1
- FMVLWTYYODVFRG-BQBZGAKWSA-N Gly-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN FMVLWTYYODVFRG-BQBZGAKWSA-N 0.000 description 1
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 1
- QCTLGOYODITHPQ-WHFBIAKZSA-N Gly-Cys-Ser Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O QCTLGOYODITHPQ-WHFBIAKZSA-N 0.000 description 1
- NPSWCZIRBAYNSB-JHEQGTHGSA-N Gly-Gln-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPSWCZIRBAYNSB-JHEQGTHGSA-N 0.000 description 1
- SXJHOPPTOJACOA-QXEWZRGKSA-N Gly-Ile-Arg Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SXJHOPPTOJACOA-QXEWZRGKSA-N 0.000 description 1
- HMHRTKOWRUPPNU-RCOVLWMOSA-N Gly-Ile-Gly Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O HMHRTKOWRUPPNU-RCOVLWMOSA-N 0.000 description 1
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 1
- UYPPAMNTTMJHJW-KCTSRDHCSA-N Gly-Ile-Trp Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O UYPPAMNTTMJHJW-KCTSRDHCSA-N 0.000 description 1
- PTIIBFKSLCYQBO-NHCYSSNCSA-N Gly-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)CN PTIIBFKSLCYQBO-NHCYSSNCSA-N 0.000 description 1
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 1
- OQQKUTVULYLCDG-ONGXEEELSA-N Gly-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)CN)C(O)=O OQQKUTVULYLCDG-ONGXEEELSA-N 0.000 description 1
- YHYDTTUSJXGTQK-UWVGGRQHSA-N Gly-Met-Leu Chemical compound CSCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(C)C)C(O)=O YHYDTTUSJXGTQK-UWVGGRQHSA-N 0.000 description 1
- NZOAFWHVAFJERA-OALUTQOASA-N Gly-Phe-Trp Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O NZOAFWHVAFJERA-OALUTQOASA-N 0.000 description 1
- IALQAMYQJBZNSK-WHFBIAKZSA-N Gly-Ser-Asn Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O IALQAMYQJBZNSK-WHFBIAKZSA-N 0.000 description 1
- OHUKZZYSJBKFRR-WHFBIAKZSA-N Gly-Ser-Asp Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O OHUKZZYSJBKFRR-WHFBIAKZSA-N 0.000 description 1
- MKIAPEZXQDILRR-YUMQZZPRSA-N Gly-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN MKIAPEZXQDILRR-YUMQZZPRSA-N 0.000 description 1
- NVTPVQLIZCOJFK-FOHZUACHSA-N Gly-Thr-Asp Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O NVTPVQLIZCOJFK-FOHZUACHSA-N 0.000 description 1
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 1
- BXDLTKLPPKBVEL-FJXKBIBVSA-N Gly-Thr-Met Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O BXDLTKLPPKBVEL-FJXKBIBVSA-N 0.000 description 1
- UIQGJYUEQDOODF-KWQFWETISA-N Gly-Tyr-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 UIQGJYUEQDOODF-KWQFWETISA-N 0.000 description 1
- DNAZKGFYFRGZIH-QWRGUYRKSA-N Gly-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 DNAZKGFYFRGZIH-QWRGUYRKSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 241000560067 HIV-1 group M Species 0.000 description 1
- DYKZGTLPSNOFHU-DEQVHRJGSA-N His-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N DYKZGTLPSNOFHU-DEQVHRJGSA-N 0.000 description 1
- RNAYRCNHRYEBTH-IHRRRGAJSA-N His-Met-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O RNAYRCNHRYEBTH-IHRRRGAJSA-N 0.000 description 1
- BZAQOPHNBFOOJS-DCAQKATOSA-N His-Pro-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O BZAQOPHNBFOOJS-DCAQKATOSA-N 0.000 description 1
- NBWATNYAUVSAEQ-ZEILLAHLSA-N His-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O NBWATNYAUVSAEQ-ZEILLAHLSA-N 0.000 description 1
- YKUAGFAXQRYUQW-KKUMJFAQSA-N His-Tyr-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)O YKUAGFAXQRYUQW-KKUMJFAQSA-N 0.000 description 1
- 241000701024 Human betaherpesvirus 5 Species 0.000 description 1
- AQCUAZTZSPQJFF-ZKWXMUAHSA-N Ile-Ala-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O AQCUAZTZSPQJFF-ZKWXMUAHSA-N 0.000 description 1
- MKWSZEHGHSLNPF-NAKRPEOUSA-N Ile-Ala-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O)N MKWSZEHGHSLNPF-NAKRPEOUSA-N 0.000 description 1
- SACHLUOUHCVIKI-GMOBBJLQSA-N Ile-Arg-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SACHLUOUHCVIKI-GMOBBJLQSA-N 0.000 description 1
- QYZYJFXHXYUZMZ-UGYAYLCHSA-N Ile-Asn-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N QYZYJFXHXYUZMZ-UGYAYLCHSA-N 0.000 description 1
- IPYVXYDYLHVWHU-GMOBBJLQSA-N Ile-Asn-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N IPYVXYDYLHVWHU-GMOBBJLQSA-N 0.000 description 1
- FADXGVVLSPPEQY-GHCJXIJMSA-N Ile-Cys-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N FADXGVVLSPPEQY-GHCJXIJMSA-N 0.000 description 1
- DURWCDDDAWVPOP-JBDRJPRFSA-N Ile-Cys-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N DURWCDDDAWVPOP-JBDRJPRFSA-N 0.000 description 1
- VQUCKIAECLVLAD-SVSWQMSJSA-N Ile-Cys-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N VQUCKIAECLVLAD-SVSWQMSJSA-N 0.000 description 1
- KOPIAUWNLKKELG-SIGLWIIPSA-N Ile-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N KOPIAUWNLKKELG-SIGLWIIPSA-N 0.000 description 1
- SVBAHOMTJRFSIC-SXTJYALSSA-N Ile-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SVBAHOMTJRFSIC-SXTJYALSSA-N 0.000 description 1
- SJLVSMMIFYTSGY-GRLWGSQLSA-N Ile-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SJLVSMMIFYTSGY-GRLWGSQLSA-N 0.000 description 1
- YNMQUIVKEFRCPH-QSFUFRPTSA-N Ile-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O)N YNMQUIVKEFRCPH-QSFUFRPTSA-N 0.000 description 1
- BBQABUDWDUKJMB-LZXPERKUSA-N Ile-Ile-Ile Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C([O-])=O BBQABUDWDUKJMB-LZXPERKUSA-N 0.000 description 1
- KLBVGHCGHUNHEA-BJDJZHNGSA-N Ile-Leu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)O)N KLBVGHCGHUNHEA-BJDJZHNGSA-N 0.000 description 1
- FZWVCYCYWCLQDH-NHCYSSNCSA-N Ile-Leu-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N FZWVCYCYWCLQDH-NHCYSSNCSA-N 0.000 description 1
- GAZGFPOZOLEYAJ-YTFOTSKYSA-N Ile-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N GAZGFPOZOLEYAJ-YTFOTSKYSA-N 0.000 description 1
- OVDKXUDMKXAZIV-ZPFDUUQYSA-N Ile-Lys-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OVDKXUDMKXAZIV-ZPFDUUQYSA-N 0.000 description 1
- FFAUOCITXBMRBT-YTFOTSKYSA-N Ile-Lys-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FFAUOCITXBMRBT-YTFOTSKYSA-N 0.000 description 1
- YSGBJIQXTIVBHZ-AJNGGQMLSA-N Ile-Lys-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O YSGBJIQXTIVBHZ-AJNGGQMLSA-N 0.000 description 1
- GLYJPWIRLBAIJH-FQUUOJAGSA-N Ile-Lys-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N GLYJPWIRLBAIJH-FQUUOJAGSA-N 0.000 description 1
- RCMNUBZKIIJCOI-ZPFDUUQYSA-N Ile-Met-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RCMNUBZKIIJCOI-ZPFDUUQYSA-N 0.000 description 1
- HQEPKOFULQTSFV-JURCDPSOSA-N Ile-Phe-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)O)N HQEPKOFULQTSFV-JURCDPSOSA-N 0.000 description 1
- LRAUKBMYHHNADU-DKIMLUQUSA-N Ile-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CC=CC=C1 LRAUKBMYHHNADU-DKIMLUQUSA-N 0.000 description 1
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 1
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 1
- RQJUKVXWAKJDBW-SVSWQMSJSA-N Ile-Ser-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N RQJUKVXWAKJDBW-SVSWQMSJSA-N 0.000 description 1
- NAFIFZNBSPWYOO-RWRJDSDZSA-N Ile-Thr-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N NAFIFZNBSPWYOO-RWRJDSDZSA-N 0.000 description 1
- YBKKLDBBPFIXBQ-MBLNEYKQSA-N Ile-Thr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)O)N YBKKLDBBPFIXBQ-MBLNEYKQSA-N 0.000 description 1
- NURNJECQNNCRBK-FLBSBUHZSA-N Ile-Thr-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NURNJECQNNCRBK-FLBSBUHZSA-N 0.000 description 1
- HZVRQFKRALAMQS-SLBDDTMCSA-N Ile-Trp-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZVRQFKRALAMQS-SLBDDTMCSA-N 0.000 description 1
- HQLSBZFLOUHQJK-STECZYCISA-N Ile-Tyr-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HQLSBZFLOUHQJK-STECZYCISA-N 0.000 description 1
- YWCJXQKATPNPOE-UKJIMTQDSA-N Ile-Val-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YWCJXQKATPNPOE-UKJIMTQDSA-N 0.000 description 1
- KXUKTDGKLAOCQK-LSJOCFKGSA-N Ile-Val-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O KXUKTDGKLAOCQK-LSJOCFKGSA-N 0.000 description 1
- RQZFWBLDTBDEOF-RNJOBUHISA-N Ile-Val-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N RQZFWBLDTBDEOF-RNJOBUHISA-N 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- 125000000998 L-alanino group Chemical group [H]N([*])[C@](C([H])([H])[H])([H])C(=O)O[H] 0.000 description 1
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 102000004856 Lectins Human genes 0.000 description 1
- 108090001090 Lectins Proteins 0.000 description 1
- JUWJEAPUNARGCF-DCAQKATOSA-N Leu-Arg-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O JUWJEAPUNARGCF-DCAQKATOSA-N 0.000 description 1
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 1
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 1
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 1
- PPBKJAQJAUHZKX-SRVKXCTJSA-N Leu-Cys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC(C)C PPBKJAQJAUHZKX-SRVKXCTJSA-N 0.000 description 1
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 1
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 1
- AUBMZAMQCOYSIC-MNXVOIDGSA-N Leu-Ile-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O AUBMZAMQCOYSIC-MNXVOIDGSA-N 0.000 description 1
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 1
- JFSGIJSCJFQGSZ-MXAVVETBSA-N Leu-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(C)C)N JFSGIJSCJFQGSZ-MXAVVETBSA-N 0.000 description 1
- TVEOVCYCYGKVPP-HSCHXYMDSA-N Leu-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(C)C)N TVEOVCYCYGKVPP-HSCHXYMDSA-N 0.000 description 1
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 1
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 1
- FAELBUXXFQLUAX-AJNGGQMLSA-N Leu-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C FAELBUXXFQLUAX-AJNGGQMLSA-N 0.000 description 1
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 1
- WXUOJXIGOPMDJM-SRVKXCTJSA-N Leu-Lys-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O WXUOJXIGOPMDJM-SRVKXCTJSA-N 0.000 description 1
- DCGXHWINSHEPIR-SRVKXCTJSA-N Leu-Lys-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)O)N DCGXHWINSHEPIR-SRVKXCTJSA-N 0.000 description 1
- ONPJGOIVICHWBW-BZSNNMDCSA-N Leu-Lys-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 ONPJGOIVICHWBW-BZSNNMDCSA-N 0.000 description 1
- AUNMOHYWTAPQLA-XUXIUFHCSA-N Leu-Met-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AUNMOHYWTAPQLA-XUXIUFHCSA-N 0.000 description 1
- BIZNDKMFQHDOIE-KKUMJFAQSA-N Leu-Phe-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 BIZNDKMFQHDOIE-KKUMJFAQSA-N 0.000 description 1
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 1
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 1
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 1
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 1
- 239000000232 Lipid Bilayer Substances 0.000 description 1
- WSXTWLJHTLRFLW-SRVKXCTJSA-N Lys-Ala-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O WSXTWLJHTLRFLW-SRVKXCTJSA-N 0.000 description 1
- VHNOAIFVYUQOOY-XUXIUFHCSA-N Lys-Arg-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VHNOAIFVYUQOOY-XUXIUFHCSA-N 0.000 description 1
- JPNRPAJITHRXRH-BQBZGAKWSA-N Lys-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O JPNRPAJITHRXRH-BQBZGAKWSA-N 0.000 description 1
- WLCYCADOWRMSAJ-CIUDSAMLSA-N Lys-Asn-Cys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(O)=O WLCYCADOWRMSAJ-CIUDSAMLSA-N 0.000 description 1
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 1
- MWVUEPNEPWMFBD-SRVKXCTJSA-N Lys-Cys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCCCN MWVUEPNEPWMFBD-SRVKXCTJSA-N 0.000 description 1
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 1
- IMAKMJCBYCSMHM-AVGNSLFASA-N Lys-Glu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN IMAKMJCBYCSMHM-AVGNSLFASA-N 0.000 description 1
- ODUQLUADRKMHOZ-JYJNAYRXSA-N Lys-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N)O ODUQLUADRKMHOZ-JYJNAYRXSA-N 0.000 description 1
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 1
- DTUZCYRNEJDKSR-NHCYSSNCSA-N Lys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN DTUZCYRNEJDKSR-NHCYSSNCSA-N 0.000 description 1
- QBEPTBMRQALPEV-MNXVOIDGSA-N Lys-Ile-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN QBEPTBMRQALPEV-MNXVOIDGSA-N 0.000 description 1
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 1
- PFZWARWVRNTPBR-IHPCNDPISA-N Lys-Leu-Trp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCCN)N PFZWARWVRNTPBR-IHPCNDPISA-N 0.000 description 1
- PYFNONMJYNJENN-AVGNSLFASA-N Lys-Lys-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PYFNONMJYNJENN-AVGNSLFASA-N 0.000 description 1
- HKXSZKJMDBHOTG-CIUDSAMLSA-N Lys-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN HKXSZKJMDBHOTG-CIUDSAMLSA-N 0.000 description 1
- JOSAKOKSPXROGQ-BJDJZHNGSA-N Lys-Ser-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JOSAKOKSPXROGQ-BJDJZHNGSA-N 0.000 description 1
- USPJSTBDIGJPFK-PMVMPFDFSA-N Lys-Tyr-Trp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O USPJSTBDIGJPFK-PMVMPFDFSA-N 0.000 description 1
- VKCPHIOZDWUFSW-ONGXEEELSA-N Lys-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN VKCPHIOZDWUFSW-ONGXEEELSA-N 0.000 description 1
- VWJFOUBDZIUXGA-AVGNSLFASA-N Lys-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCCN)N VWJFOUBDZIUXGA-AVGNSLFASA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- IECZNARPMKQGJC-XIRDDKMYSA-N Met-Gln-Trp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N IECZNARPMKQGJC-XIRDDKMYSA-N 0.000 description 1
- IUYCGMNKIZDRQI-BQBZGAKWSA-N Met-Gly-Ala Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O IUYCGMNKIZDRQI-BQBZGAKWSA-N 0.000 description 1
- ZEVPMOHYCQFWSE-NAKRPEOUSA-N Met-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCSC)N ZEVPMOHYCQFWSE-NAKRPEOUSA-N 0.000 description 1
- SODXFJOPSCXOHE-IHRRRGAJSA-N Met-Leu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O SODXFJOPSCXOHE-IHRRRGAJSA-N 0.000 description 1
- QQPMHUCGDRJFQK-RHYQMDGZSA-N Met-Thr-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QQPMHUCGDRJFQK-RHYQMDGZSA-N 0.000 description 1
- XLTSAUGGDYRFLS-UMPQAUOISA-N Met-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCSC)N)O XLTSAUGGDYRFLS-UMPQAUOISA-N 0.000 description 1
- RKRFGIBULDYDPF-XIRDDKMYSA-N Met-Trp-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N RKRFGIBULDYDPF-XIRDDKMYSA-N 0.000 description 1
- FSTWDRPCQQUJIT-NHCYSSNCSA-N Met-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCSC)N FSTWDRPCQQUJIT-NHCYSSNCSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 1
- 108010092030 NAKTIIVQL nanopeptide Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 108010036616 P18-I10 peptide Proteins 0.000 description 1
- 241000282577 Pan troglodytes Species 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- KIEPQOIQHFKQLK-PCBIJLKTSA-N Phe-Asn-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KIEPQOIQHFKQLK-PCBIJLKTSA-N 0.000 description 1
- CDNPIRSCAFMMBE-SRVKXCTJSA-N Phe-Asn-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CDNPIRSCAFMMBE-SRVKXCTJSA-N 0.000 description 1
- NKLDZIPTGKBDBB-HTUGSXCWSA-N Phe-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N)O NKLDZIPTGKBDBB-HTUGSXCWSA-N 0.000 description 1
- KXUZHWXENMYOHC-QEJZJMRPSA-N Phe-Leu-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O KXUZHWXENMYOHC-QEJZJMRPSA-N 0.000 description 1
- XNMYNGDKJNOKHH-BZSNNMDCSA-N Phe-Ser-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XNMYNGDKJNOKHH-BZSNNMDCSA-N 0.000 description 1
- WSAPMHXTQAOAQQ-BVSLBCMMSA-N Phe-Trp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC3=CC=CC=C3)N WSAPMHXTQAOAQQ-BVSLBCMMSA-N 0.000 description 1
- QTDBZORPVYTRJU-KKXDTOCCSA-N Phe-Tyr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O QTDBZORPVYTRJU-KKXDTOCCSA-N 0.000 description 1
- 229920001213 Polysorbate 20 Polymers 0.000 description 1
- BNBBNGZZKQUWCD-IUCAKERBSA-N Pro-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 BNBBNGZZKQUWCD-IUCAKERBSA-N 0.000 description 1
- WWAQEUOYCYMGHB-FXQIFTODSA-N Pro-Asn-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 WWAQEUOYCYMGHB-FXQIFTODSA-N 0.000 description 1
- MTHRMUXESFIAMS-DCAQKATOSA-N Pro-Asn-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O MTHRMUXESFIAMS-DCAQKATOSA-N 0.000 description 1
- JARJPEMLQAWNBR-GUBZILKMSA-N Pro-Asp-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JARJPEMLQAWNBR-GUBZILKMSA-N 0.000 description 1
- AIZVVCMAFRREQS-GUBZILKMSA-N Pro-Cys-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AIZVVCMAFRREQS-GUBZILKMSA-N 0.000 description 1
- LUGOKRWYNMDGTD-FXQIFTODSA-N Pro-Cys-Asn Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O LUGOKRWYNMDGTD-FXQIFTODSA-N 0.000 description 1
- LHALYDBUDCWMDY-CIUDSAMLSA-N Pro-Glu-Ala Chemical compound C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O LHALYDBUDCWMDY-CIUDSAMLSA-N 0.000 description 1
- NMELOOXSGDRBRU-YUMQZZPRSA-N Pro-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)O)NC(=O)[C@@H]1CCCN1 NMELOOXSGDRBRU-YUMQZZPRSA-N 0.000 description 1
- WVOXLKUUVCCCSU-ZPFDUUQYSA-N Pro-Glu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVOXLKUUVCCCSU-ZPFDUUQYSA-N 0.000 description 1
- GSPPWVHVBBSPSY-FHWLQOOXSA-N Pro-His-Trp Chemical compound OC(=O)[C@H](Cc1c[nH]c2ccccc12)NC(=O)[C@H](Cc1cnc[nH]1)NC(=O)[C@@H]1CCCN1 GSPPWVHVBBSPSY-FHWLQOOXSA-N 0.000 description 1
- AQGUSRZKDZYGGV-GMOBBJLQSA-N Pro-Ile-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O AQGUSRZKDZYGGV-GMOBBJLQSA-N 0.000 description 1
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 1
- WOIFYRZPIORBRY-AVGNSLFASA-N Pro-Lys-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O WOIFYRZPIORBRY-AVGNSLFASA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 230000006819 RNA synthesis Effects 0.000 description 1
- 229940022005 RNA vaccine Drugs 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 241000712907 Retroviridae Species 0.000 description 1
- 241000710961 Semliki Forest virus Species 0.000 description 1
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 1
- HBZBPFLJNDXRAY-FXQIFTODSA-N Ser-Ala-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O HBZBPFLJNDXRAY-FXQIFTODSA-N 0.000 description 1
- OYEDZGNMSBZCIM-XGEHTFHBSA-N Ser-Arg-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OYEDZGNMSBZCIM-XGEHTFHBSA-N 0.000 description 1
- HEQPKICPPDOSIN-SRVKXCTJSA-N Ser-Asp-Tyr Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HEQPKICPPDOSIN-SRVKXCTJSA-N 0.000 description 1
- ZHYMUFQVKGJNRM-ZLUOBGJFSA-N Ser-Cys-Asn Chemical compound OC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC(N)=O ZHYMUFQVKGJNRM-ZLUOBGJFSA-N 0.000 description 1
- BRGQQXQKPUCUJQ-KBIXCLLPSA-N Ser-Glu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRGQQXQKPUCUJQ-KBIXCLLPSA-N 0.000 description 1
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 1
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 1
- YIUWWXVTYLANCJ-NAKRPEOUSA-N Ser-Ile-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O YIUWWXVTYLANCJ-NAKRPEOUSA-N 0.000 description 1
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 1
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 1
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 1
- GVIGVIOEYBOTCB-XIRDDKMYSA-N Ser-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC(C)C)C(O)=O)=CNC2=C1 GVIGVIOEYBOTCB-XIRDDKMYSA-N 0.000 description 1
- UGTZYIPOBYXWRW-SRVKXCTJSA-N Ser-Phe-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O UGTZYIPOBYXWRW-SRVKXCTJSA-N 0.000 description 1
- BUYHXYIUQUBEQP-AVGNSLFASA-N Ser-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CO)N BUYHXYIUQUBEQP-AVGNSLFASA-N 0.000 description 1
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 1
- KKKVOZNCLALMPV-XKBZYTNZSA-N Ser-Thr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KKKVOZNCLALMPV-XKBZYTNZSA-N 0.000 description 1
- UYLKOSODXYSWMQ-XGEHTFHBSA-N Ser-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CO)N)O UYLKOSODXYSWMQ-XGEHTFHBSA-N 0.000 description 1
- ZWSZBWAFDZRBNM-UBHSHLNASA-N Ser-Trp-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O ZWSZBWAFDZRBNM-UBHSHLNASA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 210000001744 T-lymphocyte Anatomy 0.000 description 1
- XSLXHSYIVPGEER-KZVJFYERSA-N Thr-Ala-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O XSLXHSYIVPGEER-KZVJFYERSA-N 0.000 description 1
- GZYNMZQXFRWDFH-YTWAJWBKSA-N Thr-Arg-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O GZYNMZQXFRWDFH-YTWAJWBKSA-N 0.000 description 1
- PQLXHSACXPGWPD-GSSVUCPTSA-N Thr-Asn-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PQLXHSACXPGWPD-GSSVUCPTSA-N 0.000 description 1
- VXMHQKHDKCATDV-VEVYYDQMSA-N Thr-Asp-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VXMHQKHDKCATDV-VEVYYDQMSA-N 0.000 description 1
- NLSNVZAREYQMGR-HJGDQZAQSA-N Thr-Asp-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NLSNVZAREYQMGR-HJGDQZAQSA-N 0.000 description 1
- JMGJDTNUMAZNLX-RWRJDSDZSA-N Thr-Glu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JMGJDTNUMAZNLX-RWRJDSDZSA-N 0.000 description 1
- NIEWSKWFURSECR-FOHZUACHSA-N Thr-Gly-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NIEWSKWFURSECR-FOHZUACHSA-N 0.000 description 1
- FDALPRWYVKJCLL-PMVVWTBXSA-N Thr-His-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)NCC(O)=O FDALPRWYVKJCLL-PMVVWTBXSA-N 0.000 description 1
- GMXIJHCBTZDAPD-QPHKQPEJSA-N Thr-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N GMXIJHCBTZDAPD-QPHKQPEJSA-N 0.000 description 1
- AHOLTQCAVBSUDP-PPCPHDFISA-N Thr-Ile-Lys Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)[C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O AHOLTQCAVBSUDP-PPCPHDFISA-N 0.000 description 1
- IHAPJUHCZXBPHR-WZLNRYEVSA-N Thr-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N IHAPJUHCZXBPHR-WZLNRYEVSA-N 0.000 description 1
- HOVLHEKTGVIKAP-WDCWCFNPSA-N Thr-Leu-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HOVLHEKTGVIKAP-WDCWCFNPSA-N 0.000 description 1
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 1
- KRDSCBLRHORMRK-JXUBOQSCSA-N Thr-Lys-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O KRDSCBLRHORMRK-JXUBOQSCSA-N 0.000 description 1
- HPQHHRLWSAMMKG-KATARQTJSA-N Thr-Lys-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)O)N)O HPQHHRLWSAMMKG-KATARQTJSA-N 0.000 description 1
- KZURUCDWKDEAFZ-XVSYOHENSA-N Thr-Phe-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O KZURUCDWKDEAFZ-XVSYOHENSA-N 0.000 description 1
- STUAPCLEDMKXKL-LKXGYXEUSA-N Thr-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O STUAPCLEDMKXKL-LKXGYXEUSA-N 0.000 description 1
- IQPWNQRRAJHOKV-KATARQTJSA-N Thr-Ser-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN IQPWNQRRAJHOKV-KATARQTJSA-N 0.000 description 1
- HUPLKEHTTQBXSC-YJRXYDGGSA-N Thr-Ser-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUPLKEHTTQBXSC-YJRXYDGGSA-N 0.000 description 1
- IEZVHOULSUULHD-XGEHTFHBSA-N Thr-Ser-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O IEZVHOULSUULHD-XGEHTFHBSA-N 0.000 description 1
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 1
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 1
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 1
- UMFLBPIPAJMNIM-LYARXQMPSA-N Thr-Trp-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CC=CC=C3)C(=O)O)N)O UMFLBPIPAJMNIM-LYARXQMPSA-N 0.000 description 1
- NJGMALCNYAMYCB-JRQIVUDYSA-N Thr-Tyr-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O NJGMALCNYAMYCB-JRQIVUDYSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 241000723873 Tobacco mosaic virus Species 0.000 description 1
- AVYVKJMBNLPWRX-WFBYXXMGSA-N Trp-Ala-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 AVYVKJMBNLPWRX-WFBYXXMGSA-N 0.000 description 1
- YEGMNOHLZNGOCG-UBHSHLNASA-N Trp-Asn-Asn Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YEGMNOHLZNGOCG-UBHSHLNASA-N 0.000 description 1
- ADBFWLXCCKIXBQ-XIRDDKMYSA-N Trp-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N ADBFWLXCCKIXBQ-XIRDDKMYSA-N 0.000 description 1
- IUFQHOCOKQIOMC-XIRDDKMYSA-N Trp-Asn-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N IUFQHOCOKQIOMC-XIRDDKMYSA-N 0.000 description 1
- VTHNLRXALGUDBS-BPUTZDHNSA-N Trp-Gln-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N VTHNLRXALGUDBS-BPUTZDHNSA-N 0.000 description 1
- NXJZCPKZIKTYLX-XEGUGMAKSA-N Trp-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NXJZCPKZIKTYLX-XEGUGMAKSA-N 0.000 description 1
- RPVDDQYNBOVWLR-HOCLYGCPSA-N Trp-Gly-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O RPVDDQYNBOVWLR-HOCLYGCPSA-N 0.000 description 1
- OGXQLUCMJZSJPW-LYSGOOTNSA-N Trp-Gly-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O OGXQLUCMJZSJPW-LYSGOOTNSA-N 0.000 description 1
- YRXXUYPYPHRJPB-RXVVDRJESA-N Trp-Gly-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O)N YRXXUYPYPHRJPB-RXVVDRJESA-N 0.000 description 1
- GWBWCGITOYODER-YTQUADARSA-N Trp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N GWBWCGITOYODER-YTQUADARSA-N 0.000 description 1
- TUUXFNQXSFNFLX-XIRDDKMYSA-N Trp-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N TUUXFNQXSFNFLX-XIRDDKMYSA-N 0.000 description 1
- GQEXFCQNAJHJTI-IHPCNDPISA-N Trp-Phe-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N GQEXFCQNAJHJTI-IHPCNDPISA-N 0.000 description 1
- XGEUYEOEZYFHRL-KKXDTOCCSA-N Tyr-Ala-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 XGEUYEOEZYFHRL-KKXDTOCCSA-N 0.000 description 1
- NOXKHHXSHQFSGJ-FQPOAREZSA-N Tyr-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NOXKHHXSHQFSGJ-FQPOAREZSA-N 0.000 description 1
- MNMYOSZWCKYEDI-JRQIVUDYSA-N Tyr-Asp-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MNMYOSZWCKYEDI-JRQIVUDYSA-N 0.000 description 1
- XBWKCYFGRXKWGO-SRVKXCTJSA-N Tyr-Cys-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O XBWKCYFGRXKWGO-SRVKXCTJSA-N 0.000 description 1
- PRONOHBTMLNXCZ-BZSNNMDCSA-N Tyr-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PRONOHBTMLNXCZ-BZSNNMDCSA-N 0.000 description 1
- FMXFHNSFABRVFZ-BZSNNMDCSA-N Tyr-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FMXFHNSFABRVFZ-BZSNNMDCSA-N 0.000 description 1
- UUBKSZNKJUJQEJ-JRQIVUDYSA-N Tyr-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O UUBKSZNKJUJQEJ-JRQIVUDYSA-N 0.000 description 1
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 1
- 206010046865 Vaccinia virus infection Diseases 0.000 description 1
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 1
- JIODCDXKCJRMEH-NHCYSSNCSA-N Val-Arg-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N JIODCDXKCJRMEH-NHCYSSNCSA-N 0.000 description 1
- UDLYXGYWTVOIKU-QXEWZRGKSA-N Val-Asn-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UDLYXGYWTVOIKU-QXEWZRGKSA-N 0.000 description 1
- UDNYEPLJTRDMEJ-RCOVLWMOSA-N Val-Asn-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N UDNYEPLJTRDMEJ-RCOVLWMOSA-N 0.000 description 1
- VUTHNLMCXKLLFI-LAEOZQHASA-N Val-Asp-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VUTHNLMCXKLLFI-LAEOZQHASA-N 0.000 description 1
- CFSSLXZJEMERJY-NRPADANISA-N Val-Gln-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CFSSLXZJEMERJY-NRPADANISA-N 0.000 description 1
- HURRXSNHCCSJHA-AUTRQRHGSA-N Val-Gln-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HURRXSNHCCSJHA-AUTRQRHGSA-N 0.000 description 1
- XEYUMGGWQCIWAR-XVKPBYJWSA-N Val-Gln-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)NCC(=O)O)N XEYUMGGWQCIWAR-XVKPBYJWSA-N 0.000 description 1
- AAOPYWQQBXHINJ-DZKIICNBSA-N Val-Gln-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N AAOPYWQQBXHINJ-DZKIICNBSA-N 0.000 description 1
- BRPKEERLGYNCNC-NHCYSSNCSA-N Val-Glu-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N BRPKEERLGYNCNC-NHCYSSNCSA-N 0.000 description 1
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 1
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 1
- KVRLNEILGGVBJX-IHRRRGAJSA-N Val-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CN=CN1 KVRLNEILGGVBJX-IHRRRGAJSA-N 0.000 description 1
- VXDSPJJQUQDCKH-UKJIMTQDSA-N Val-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N VXDSPJJQUQDCKH-UKJIMTQDSA-N 0.000 description 1
- LJSZPMSUYKKKCP-UBHSHLNASA-N Val-Phe-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 LJSZPMSUYKKKCP-UBHSHLNASA-N 0.000 description 1
- NSUUANXHLKKHQB-BZSNNMDCSA-N Val-Pro-Trp Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CNC2=CC=CC=C12 NSUUANXHLKKHQB-BZSNNMDCSA-N 0.000 description 1
- UGFMVXRXULGLNO-XPUUQOCRSA-N Val-Ser-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O UGFMVXRXULGLNO-XPUUQOCRSA-N 0.000 description 1
- MNSSBIHFEUUXNW-RCWTZXSCSA-N Val-Thr-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N MNSSBIHFEUUXNW-RCWTZXSCSA-N 0.000 description 1
- PQSNETRGCRUOGP-KKHAAJSZSA-N Val-Thr-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O PQSNETRGCRUOGP-KKHAAJSZSA-N 0.000 description 1
- UVHFONIHVHLDDQ-IFFSRLJSSA-N Val-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O UVHFONIHVHLDDQ-IFFSRLJSSA-N 0.000 description 1
- TVGWMCTYUFBXAP-QTKMDUPCSA-N Val-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N)O TVGWMCTYUFBXAP-QTKMDUPCSA-N 0.000 description 1
- QHSSPPHOHJSTML-HOCLYGCPSA-N Val-Trp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)NCC(=O)O)N QHSSPPHOHJSTML-HOCLYGCPSA-N 0.000 description 1
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 1
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 1
- 241000710959 Venezuelan equine encephalitis virus Species 0.000 description 1
- 108010003533 Viral Envelope Proteins Proteins 0.000 description 1
- 108010067390 Viral Proteins Proteins 0.000 description 1
- 108010087302 Viral Structural Proteins Proteins 0.000 description 1
- 102100038611 Vitamin D-binding protein Human genes 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 108010005233 alanylglutamic acid Proteins 0.000 description 1
- 108010070783 alanyltyrosine Proteins 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- AZDRQVAHHNSJOQ-UHFFFAOYSA-N alumane Chemical class [AlH3] AZDRQVAHHNSJOQ-UHFFFAOYSA-N 0.000 description 1
- WNROFYMDJYEPJX-UHFFFAOYSA-K aluminium hydroxide Chemical compound [OH-].[OH-].[OH-].[Al+3] WNROFYMDJYEPJX-UHFFFAOYSA-K 0.000 description 1
- ILRRQNADMUWWFW-UHFFFAOYSA-K aluminium phosphate Chemical compound O1[Al]2OP1(=O)O2 ILRRQNADMUWWFW-UHFFFAOYSA-K 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000012436 analytical size exclusion chromatography Methods 0.000 description 1
- 230000000798 anti-retroviral effect Effects 0.000 description 1
- 230000030741 antigen processing and presentation Effects 0.000 description 1
- 230000000890 antigenic effect Effects 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 239000007900 aqueous suspension Substances 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 1
- 108010068380 arginylarginine Proteins 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 1
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 108010077245 asparaginyl-proline Proteins 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 210000000234 capsid Anatomy 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000036755 cellular response Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000011260 co-administration Methods 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 150000001868 cobalt Chemical class 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 150000001875 compounds Chemical group 0.000 description 1
- 108091036078 conserved sequence Proteins 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- RHJVIGLEIFVHIJ-UHFFFAOYSA-N cyclohexanecarboxamide Chemical compound NC(=O)C1[CH]CCCC1 RHJVIGLEIFVHIJ-UHFFFAOYSA-N 0.000 description 1
- 108010060199 cysteinylproline Proteins 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 239000008298 dragée Substances 0.000 description 1
- 238000012377 drug delivery Methods 0.000 description 1
- 241001493065 dsRNA viruses Species 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 230000002500 effect on skin Effects 0.000 description 1
- 230000009881 electrostatic interaction Effects 0.000 description 1
- 239000003974 emollient agent Substances 0.000 description 1
- 239000003995 emulsifying agent Substances 0.000 description 1
- 108700004025 env Genes Proteins 0.000 description 1
- 101150030339 env gene Proteins 0.000 description 1
- 210000001808 exosome Anatomy 0.000 description 1
- 210000001723 extracellular space Anatomy 0.000 description 1
- 235000003599 food sweetener Nutrition 0.000 description 1
- 239000003205 fragrance Substances 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 239000007903 gelatin capsule Substances 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 1
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 1
- 108010032388 glycyl-prolyl-glycyl-arginyl-alanyl-phenylanine Proteins 0.000 description 1
- 108010010147 glycylglutamine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 108010084389 glycyltryptophan Proteins 0.000 description 1
- 239000003979 granulating agent Substances 0.000 description 1
- 210000002443 helper t lymphocyte Anatomy 0.000 description 1
- 238000012188 high-throughput screening assay Methods 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 230000003053 immunization Effects 0.000 description 1
- 238000002649 immunization Methods 0.000 description 1
- 239000007943 implant Substances 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000000968 intestinal effect Effects 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 239000007927 intramuscular injection Substances 0.000 description 1
- 238000010255 intramuscular injection Methods 0.000 description 1
- 238000007912 intraperitoneal administration Methods 0.000 description 1
- 238000001990 intravenous administration Methods 0.000 description 1
- 238000010253 intravenous injection Methods 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 1
- 239000002523 lectin Substances 0.000 description 1
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 1
- 108010091871 leucylmethionine Proteins 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000004811 liquid chromatography Methods 0.000 description 1
- 108010054155 lysyllysine Proteins 0.000 description 1
- 229940126582 mRNA vaccine Drugs 0.000 description 1
- 125000005439 maleimidyl group Chemical group C1(C=CC(N1*)=O)=O 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 210000004779 membrane envelope Anatomy 0.000 description 1
- 230000034217 membrane fusion Effects 0.000 description 1
- 108010005942 methionylglycine Proteins 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 210000002200 mouth mucosa Anatomy 0.000 description 1
- 238000000569 multi-angle light scattering Methods 0.000 description 1
- 229940100661 nasal inhalant Drugs 0.000 description 1
- 229940097496 nasal spray Drugs 0.000 description 1
- 239000007922 nasal spray Substances 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 108091033319 polynucleotide Proteins 0.000 description 1
- 102000040430 polynucleotide Human genes 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 1
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 230000037452 priming Effects 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- 235000019419 proteases Nutrition 0.000 description 1
- 230000012846 protein folding Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 102200042487 rs141568342 Human genes 0.000 description 1
- 239000012146 running buffer Substances 0.000 description 1
- 238000001338 self-assembly Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 108010071207 serylmethionine Proteins 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 229910000162 sodium phosphate Inorganic materials 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 108090000250 sortase A Proteins 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 239000007929 subcutaneous injection Substances 0.000 description 1
- 238000010254 subcutaneous injection Methods 0.000 description 1
- 125000002730 succinyl group Chemical group C(CCC(=O)*)(=O)* 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 239000013595 supernatant sample Substances 0.000 description 1
- 239000000375 suspending agent Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 239000003765 sweetening agent Substances 0.000 description 1
- 230000008961 swelling Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 239000003826 tablet Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
- 108010045269 tryptophyltryptophan Proteins 0.000 description 1
- 108010087967 type I signal peptidase Proteins 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 241000990167 unclassified Simian adenoviruses Species 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 229940125575 vaccine candidate Drugs 0.000 description 1
- 208000007089 vaccinia Diseases 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 229940054967 vanquish Drugs 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
- 210000002845 virion Anatomy 0.000 description 1
- 239000000277 virosome Substances 0.000 description 1
- 108010063191 vitamin D-binding protein-macrophage activating factor Proteins 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
- A61K39/21—Retroviridae, e.g. equine infectious anemia virus
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/14—Antivirals for RNA viruses
- A61P31/18—Antivirals for RNA viruses for HIV
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P37/00—Drugs for immunological or allergic disorders
- A61P37/02—Immunomodulators
- A61P37/04—Immunostimulants
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
- C07K14/08—RNA viruses
- C07K14/15—Retroviridae, e.g. bovine leukaemia virus, feline leukaemia virus human T-cell leukaemia-lymphoma virus
- C07K14/155—Lentiviridae, e.g. human immunodeficiency virus [HIV], visna-maedi virus or equine infectious anaemia virus
- C07K14/16—HIV-1 ; HIV-2
- C07K14/162—HIV-1 ; HIV-2 env, e.g. gp160, gp110/120, gp41, V3, peptid T, CD4-Binding site
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N7/00—Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/51—Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
- A61K2039/53—DNA (RNA) vaccination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2740/00—Reverse transcribing RNA viruses
- C12N2740/00011—Details
- C12N2740/10011—Retroviridae
- C12N2740/16011—Human Immunodeficiency Virus, HIV
- C12N2740/16111—Human Immunodeficiency Virus, HIV concerning HIV env
- C12N2740/16122—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2740/00—Reverse transcribing RNA viruses
- C12N2740/00011—Details
- C12N2740/10011—Retroviridae
- C12N2740/16011—Human Immunodeficiency Virus, HIV
- C12N2740/16111—Human Immunodeficiency Virus, HIV concerning HIV env
- C12N2740/16134—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Virology (AREA)
- Medicinal Chemistry (AREA)
- Organic Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Veterinary Medicine (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Communicable Diseases (AREA)
- Molecular Biology (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Microbiology (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Hematology (AREA)
- Biochemistry (AREA)
- AIDS & HIV (AREA)
- Oncology (AREA)
- Epidemiology (AREA)
- Mycology (AREA)
- Tropical Medicine & Parasitology (AREA)
- Biophysics (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
외피 단백질의 삼량체성 형태를 안정화시키는 명시된 돌연변이를 갖는 인간 면역결핍 바이러스(HIV) 외피 단백질이 제공된다. 본 명세서에 기재된 HIV 외피 단백질은 삼량체 형성의 개선된 백분율 및/또는 개선된 삼량체 수율을 갖는다. HIV 외피 단백질을 디스플레이하는 입자, HIV 외피 단백질을 인코딩하는 핵산 분자 및 벡터뿐만 아니라, HIV 외피 단백질, 입자, 핵산, 또는 벡터를 함유하는 조성물이 또한 제공된다.
Description
인간 면역결핍 바이러스(HIV)는 전세계적으로 수백만 명의 사람에게 영향을 미치며, 효과적인 백신을 통한 HIV의 예방은 심지어 광범위한 항레트로바이러스 치료의 시대에도 매우 높은 우선순위로 유지된다. 상이한 균주와 HIV 바이러스의 계통군 사이의 항원성 다양성은 광범위한 효능을 갖는 백신을 개발하는 것을 어렵게 만든다. HIV-1은 바이러스의 가장 흔한 병원성 균주이며, HIV/AIDS 사례의 90% 초과가 HIV-1 군 M에 의한 감염으로부터 유래된다. M 군은 계통군 또는 아형으로 추가로 세분되며, 그 중에 계통군 C가 최대이다. 효과적인 백신은 이상적으로는 상이한 계통군로부터 HIV-1 균주를 중화시킬 수 있는 강력한 세포 반응 및 광범위한 중화 항체 둘 모두를 유도할 수 있을 것이다.
HIV 표면에 대한 외피 단백질 스파이크(Env)는 당단백질 gp120 및 gp41의 이종이량체의 삼량체로 구성된다(도 1a). 전구체 단백질 gp160은 푸린에 의해 gp120으로 절단되며, 이는 스파이크의 헤드이고, CD4 수용체 결합 부위뿐만 아니라 큰 초가변 루프(V1 내지 V5), 및 gp41을 함유하며, 이는 외피 단백질 스파이크의 막-고정 스템이다. 다른 부류 I 융합 단백질과 마찬가지로, gp41은 N-말단 융합 펩티드(FP), C-말단 막관통(TM) 도메인, 및 세포질 도메인을 함유한다. HIV와 표적 세포막 사이의 막 융합은 외피 단백질에서 일련의 입체배좌 변화를 필요로 한다. 외피 단백질에 기초하여 HIV 백신을 개발할 수 있다.
그러나, HIV-1의 높은 유전적 가변성, 외피 단백질의 고밀도 탄수화물 코트, 및 외피 단백질 스파이크 구조의 비교적 동적이고 불안정한 성질을 포함하는, 외피 단백질 난제에 기초하는 다양한 요인이 HIV 백신의 개발을 이룬다. 야생형 외피 단백질은 그의 기능으로 인해 불안정하다. 따라서, 백신 후보를 생성하기 위해 때때로 외피 구조 내로 안정화 변형이 도입된다. 외피 단백질은 중화 항체에 대한 표적이고 고도로 글리코실화되며, 이는 단백질 에피토프를 차폐함으로써 면역원성을 감소시킨다. 모든 알려진 광범위한 중화 항체(bNAb)는 이러한 글리칸을 수용한다.
백신 개발을 위해, bNAb를 유도할 수 있는 외피 단백질을 사용하는 것이 바람직하다. 그러나, 대부분의 bNAb는 그것이 임의의 입체배좌 변화를 겪기 전에 천연 외피 단백질 입체배좌만을 인식한다. 따라서, 비-천연적 및 따라서 비-중화 에피토프의 제시를 최소화하면서, 그의 간결하고 폐쇄된 천연-유사 입체배좌로 안정한 외피 단백질을 발생시키는 것은 그러한 bNAb를 생성하는 효율을 개선할 수 있을 것이다. HIV 백신을 생성하기 위한 이전의 노력은 삼량체성 HIV 외피 단백질, gp140의 사전-융합 엑토도메인을 함유하는 백신을 개발하는 것에 집중되었다. Gp140은 막관통(TM) 및 세포질 도메인을 갖지 않지만, gp120과는 달리, 그것은 삼량체 구조를 형성할 수 있다. 또한, 이러한 이전의 노력은 주로 계통군 A에 집중되었다. 그러나, 유도된 중화 항체 반응의 폭은 여전히 제한된다. 따라서, 다중의 HIV 계통군에 대한 안정화된 천연 외피 삼량체가 이용가능하다면 또한 유익할 것이다.
20 년 초과 동안, 광범위한 중화 항체 반응을 유도할 수 있는 외피 단백질의 가용성, 안정한 삼량체를 생성함에 있어서 안정한 외피 단백질을 그의 사전-융합 삼량체 입체배좌로 개발하는 시도가 단지 제한된 성공으로 이루어졌다. 예를 들어, 가용성 gp140 삼량체 분획의 형성을 개선하기 위해 소위 SOSIP 돌연변이(501C, 605C, 및 559P)가 외피 단백질 서열 내로 도입되었다(문헌[Sanders et al., (2002), J. Virol. 76(17): 8875-89]). 소위 SOSIP 돌연변이는 본 분야에 사용되는 통상적인 넘버링(numbering) 체계인 HIV-1 단리물 HXB2의 gp160에서의 넘버링에 따라 위치 501 및 605에 시스테인 잔기 및 위치 559에 프롤린 잔기를 포함한다. 3-차원 단백질 구조에서 서로 가까운 위치 501 및 605에 2개의 시스테인 잔기를 도입하는 것은 다이설파이드 가교를 유발한다. SOSIP 돌연변이 외피 단백질, 예컨대 BG505_SOSIP 및 B41_SOSIP(SOSIP 돌연변이를 갖는 HIV 균주 BG505 및 B41(즉, 9032-08.A1.4685) 균주로부터의 외피 단백질)는 백신 연구에서 사용되어 왔으며, 티어 2(tier 2) 자가유래 중화 Ab를 유도하는 것으로 나타났다(문헌[Sanders et al., Science (2015), 349(6224): 139-140]).
그러나, 소위 SOSIP 돌연변이가 외피 단백질의 삼량체 형태를 안정화시킬 수 있더라도, 그러한 SOSIP 돌연변이체의 삼량체 분획은 통상적으로 10% 미만이며, 다량의 단량체 및 응집체가 여전히 생성된다. 심지어 삼량체 형태를 안정화시키는 그의 능력의 관점에서 유망한 SOSIP 돌연변이 외피인 SOSIP 돌연변이체 BG505_SOSIP도 전형적으로 삼량체 형태의 최대 25%를 산출할 뿐이다(문헌[Julien et al., Proc. Nat. Acad. Sci. (2015), 112(38), 11947-52]). 또한, 이 삼량체 분획에서 삼량체는 이들이 첨부에서 브리딩(breathing)함에 따라 완전히 안정하지는 않다. 따라서, 첨부를 안정화하고 그것이 브리딩하는 것을 방지하기 위해, SOSIP 돌연변이에 부가하여 E64K, A316W, 및 201C-433C와 같은 몇몇 부가적인 치환이 설계되었다(문헌[de Taeye et al., Cell (2015), 163(7), 1702-15]; 문헌[Kwon et al., (2015) Nat. Struct. Mol. Biol. 22(7) 522-31]). 또한, 삼량체화 수율을 개선하고 사전융합-폐쇄된 HIV 외피 삼량체의 폴딩 및 안정성을 최적화하기 위한 추가의 돌연변이 및 전략이 보고되었다(WO 2018/050747호; WO 2019/016062호; 문헌[Rutten et al, (2018) Cell Reports 23: 584-595]; 문헌[Rawi et al, (2020) Cell Reports 33, 108432]).
따라서, 삼량체 형성의 개선된 백분율, 개선된 삼량체 수율, 및/또는 개선된 삼량체 안정성을 갖는 HIV 외피 단백질의 안정화된 삼량체에 대한 필요성이 존재한다. 바람직하게는, HIV 외피 단백질의 그러한 안정화된 삼량체는 또한 광범위한 중화 항체(bNAb)와의 양호한 결합, 및 광범위하지 않은 중화 Ab(비-bNAb)에 대한 비교적 제한된 결합을 나타낼 것이다. 본 발명의 목적은 개선된 삼량체 백분율, 및 바람직하게는 또한 개선된 삼량체 수율을 갖는 HIV Env 단백질을 제공하는 것이다.
본 발명은 이전에 기재된 소정의 HIV 외피 삼량체와 비교하여 삼량체 형성의 개선된 백분율 및/또는 개선된 삼량체 수율을 갖는 재조합 HIV 외피 단백질에 관한 것이다. 생성되는 안정하고 양호하게 폴딩된 HIV Env 삼량체는, 예를 들어, 재조합 HIV Env 삼량체의 투여 시에 광범위한 중화 항체를 유도하고 비-중화 항체 및 약한 중화 항체의 유도를 감소시키는 기회를 개선하기 위한 면역화 목적에 유용하다. 본 발명은 또한 재조합 HIV 외피 단백질을 인코딩하는 단리된 핵산 분자 및 벡터, 이를 포함하는 세포, 및 재조합 HIV 외피 단백질, 핵산 분자, 벡터, 및/또는 세포의 조성물에 관한 것이다.
일반적인 일 태양에서, 본 발명은 아미노산 트립토판(Trp), 페닐알라닌(Phe), 메티오닌(Met), 또는 류신(Leu), 바람직하게는 Trp 또는 Phe 중 하나를 위치 650에 포함하는 재조합 인간 면역결핍 바이러스(HIV) 외피(Env) 단백질에 관한 것이며, 여기서 위치의 넘버링은 HIV-1 단리물 HXB2의 gp160에서의 넘버링에 따른다. 소정의 실시 형태에서, 그러한 HIV Env 단백질은 본 명세서에 표시된 바와 같이 삼량체 수율을 증가시키고/시키거나 삼량체를 안정화시키는 하나 이상의 돌연변이를 추가로 포함한다. 그러한 Env 단백질은 전에 기재된 바 없으며, 위치 650에서의 Trp, Phe, Met, 또는 Leu 아미노산은 증가된 삼량체 수율로 이어진다. 이는 그 위치에서 가장 풍부하게 발견되는 원래의 아미노산(글루타민, Gln, Q임)을 갖는 Env 단백질과 비교하여 계통군 B 및 계통군 C 유래의 Env 단백질 둘 모두에 대해 본 명세서에 나타냈다.
소정의 바람직한 실시 형태에서, 본 발명의 HIV Env 단백질은 위치 650에 Trp를 포함한다.
소정의 바람직한 실시 형태에서, 본 발명의 HIV Env 단백질은 위치 650에 Phe를 포함한다.
소정의 실시 형태에서, 본 발명의 재조합 HIV 외피(Env) 단백질은 표시된 위치에 하기 아미노산 잔기 중 하나 이상을 추가로 포함하며, 여기서 위치의 넘버링은 HIV-1 단리물 HXB2의 gp160에서의 넘버링에 따른다:
(i) 위치 651에 Phe, Leu, Met, 또는 Trp, 바람직하게는 Phe;
(ii) 위치 655에 Phe, Ile, Met, 또는 Trp, 바람직하게는 Ile;
(iii) 위치 535에 Asn 또는 Gln, 바람직하게는 Asn;
(iv) 위치 589에 Val, Ile, 또는 Ala;
(v) 위치 573에 Phe 또는 Trp, 바람직하게는 Phe;
(vi) 위치 204에 Ile;
(vii) 위치 647에 Phe, Met, 또는 Ile, 바람직하게는 Phe;
(viii) 위치 658에 Val, Ile, Phe, Met, Ala, 또는 Leu, 바람직하게는 Val 또는 Ile, 더욱 바람직하게는 Val;
(ix) 위치 588에 Gln, Glu, Ile, Met, Val, Trp, 또는 Phe, 바람직하게는 Gln 또는 Glu;
(x) 위치 64에 Lys 또는 위치 66에 Arg 또는 위치 64에 Lys 및 위치 66에 Arg;
(xi) 위치 316에 Trp;
(xii) 위치 201 및 433 둘 모두에 Cys;
(xiii) 위치 556 또는 558에 또는 위치 556 및 558 둘 모두에 Pro;
(xiv) 예를 들어 (서열 번호 9 내지 14) 중 어느 하나로부터 선택된 서열을 갖는, 7 내지 10개의 아미노산을 갖는 루프, 바람직하게는 8개의 아미노산의 루프에 의한 아미노산 위치 548 내지 568(HR1-루프)에서의 루프의 대체;
(xv) 위치 568에 Gly, 또는 위치 569에 Gly, 또는 위치 636에 Gly, 또는 위치 568 및 636 둘 모두에 Gly, 또는 위치 569 및 636 둘 모두에 Gly;
(xvi) 위치 302에 Tyr, 또는 위치 519에 Arg, 또는 위치 520에 Arg, 또는 위치 302에 Tyr 및 위치 519에 Arg, 또는 위치 302에 Tyr 및 위치 520에 Arg, 또는 위치 302에 Tyr 및 위치 519 및 520 둘 모두에 Arg;
(xvii) HIV Env 단백질의 푸린 절단 서열 내의 돌연변이, 바람직하게는 위치 508 내지 511에서의 RRRRRR(서열 번호 6)에 의한 대체;
(xviii) 위치 501 및 605에 Cys 또는 위치 559에 Pro, 바람직하게는 위치 501 및 605에 Cys 및 위치 559에 Pro;
(xix) 위치 108에 His; 및/또는
(xx) 위치 538에 His.
소정의 실시 형태에서, 본 발명의 HIV Env 단백질은 상기 (i) 내지 (viii)로 이루어진 군으로부터 선택된 표시된 위치 중 2개 이상에 표시된 아미노산 잔기를 포함한다.
소정의 실시 형태에서, 본 발명의 재조합 HIV Env 단백질은 위치 108에 His, 또는 위치 538에 His, 또는 위치 108에 His 및 위치 538에 His를 포함한다.
소정의 실시 형태에서, 본 발명의 재조합 HIV Env 단백질은 위치 650에 Trp, Phe, Met, 또는 Leu, 바람직하게는 Trp 또는 Phe를 포함하고, (a) 위치 501 및 605에 Cys, 또는 (b) 위치 559에 Pro, 또는 바람직하게는 (c) 위치 501 및 605에 Cys 및 위치 559에 Pro(소위 'SOSIP' 변이체 HIV Env 단백질)를 추가로 포함하며, 여기서 여기서 위치의 넘버링은 HIV-1 단리물 HXB2의 gp160에서의 넘버링에 따른다. 소정의 실시 형태에서, 이는 위치 108에서의 His 및/또는 위치 538에서의 His와 조합된다. 소정의 실시 형태에서, 이는 상기 (i) 내지 (viii)에 기재된 위치에서의 아미노산 중 하나 이상과 조합된다.
소정의 실시 형태에서, 본 발명에 따른 재조합 HIV Env 단백질은 계통군 C HIV로부터의 것이다. 소정의 실시 형태에서, 본 발명에 따른 재조합 HIV Env 단백질은 계통군 B HIV로부터의 것이다. 소정의 실시 형태에서, 본 발명에 따른 재조합 HIV Env 단백질은 계통군 A HIV로부터의 것이다. 소정의 실시 형태에서, 본 발명에 따른 재조합 HIV Env 단백질은 계통군 D, E, F, G, H, I, J, K, 또는 L HIV로부터의 것이다. 소정의 실시 형태에서, 본 발명에 따른 재조합 HIV Env 단백질은 계통군 A, B, C, D, E, F, G, H, I, J, K, 또는 L 중 2개 이상으로부터의 HIV의 순환 재조합 형태(CRF)로부터의 것이다.
소정의 실시 형태에서, 본 발명의 재조합 HIV Env 단백질은 HIV Env 단백질의 푸린 절단 서열 내의 돌연변이, 예컨대 위치 508 내지 511에서의 RRRRRR(서열 번호 6)에 의한 대체를 추가로 포함한다.
일 실시 형태에서, 재조합 HIV Env 단백질은 gp140 단백질이다.
다른 실시 형태에서, 재조합 HIV Env 단백질은 gp160 단백질이다.
소정의 실시 형태에서, 재조합 HIV Env 단백질은 세포질 영역 내에서 절단된다. 이의 소정의 실시 형태에서, 절단은 세포질 영역의 7개 아미노산 뒤에 있다.
서열 번호 2, 3, 4, 5, 16 중 어느 하나와 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상, 또는 100% 동일한 아미노산 서열을 포함하며, 여기서 위치 650에서의 아미노산은 Trp, Phe, Met, 또는 Leu, 바람직하게는 Trp 또는 Phe인 재조합 HIV Env 단백질이 또한 개시된다. 이 태양에서, 위치 650은 % 동일성을 결정할 때 고려되지 않으며, 여기서 넘버링은 HIV-1 단리물 HXB2의 gp160에서의 넘버링에 따른다. 또한 이 태양에서, % 동일성을 결정하기 위해 고려되지 않는 표시된 위치에서의 아미노산 중 하나 이상은, 바람직하게는 상기 언급된 (i) 내지 (xx)에서 본 명세서에서 바람직한 것으로 표시된 아미노산으로부터 선택된다.
다른 일반적인 태양에서, 본 발명은 본 명세서에 기재된 임의의 재조합 HIV Env 단백질 중 3개의 비공유 올리고머를 포함하는 삼량체성 복합체에 관한 것이다.
다른 일반적인 태양에서, 본 발명은 본 발명의 재조합 HIV Env 단백질, 또는 본 발명의 삼량체성 복합체를 그의 표면 상에 디스플레이하는 입자, 예를 들어 리포좀 또는 나노입자, 예를 들어 자가-조립 나노입자에 관한 것이다.
다른 일반적인 태양에서, 본 발명은 본 발명의 재조합 HIV Env 단백질을 인코딩하는 단리된 핵산 분자에 관한 것이다.
다른 일반적인 태양에서, 본 발명은 프로모터에 작동가능하게 연결된 단리된 핵산 분자를 포함하는 벡터에 관한 것이다. 일 실시 형태에서, 벡터는 바이러스 벡터이다. 다른 실시 형태에서, 벡터는 발현 벡터이다. 바람직한 일 실시 형태에서, 바이러스 벡터는 아데노바이러스 벡터이다.
다른 일반적인 태양은 본 발명의 재조합 HIV Env 단백질을 인코딩하는 단리된 핵산 분자 또는 벡터를 포함하는 숙주 세포에 관한 것이다. 그러한 숙주 세포는 재조합 단백질 생성, 재조합 단백질 발현, 또는 바이러스 입자, 예컨대 재조합 아데노바이러스의 생성을 위해 사용될 수 있다.
다른 일반적인 태양은 재조합 HIV Env 단백질의 생성에 적합한 조건 하에 본 발명의 재조합 HIV Env 단백질을 인코딩하는 단리된 핵산 분자 또는 벡터를 포함하는 숙주 세포를 성장시키는 단계를 포함하는, 재조합 HIV Env 단백질의 생성 방법에 관한 것이다.
또 다른 일반적인 태양은 본 명세서에 기재된 재조합 HIV Env 단백질, 삼량체성 복합체, 단리된 핵산 분자, 또는 벡터, 및 약제학적으로 허용가능한 담체를 포함하는 조성물에 관한 것이다.
다른 일반적인 태양에서, 본 발명은 HIV Env 단백질의 삼량체 형성을 개선하는 방법으로서, 모 HIV Env 단백질 내의 위치 650에서의 아미노산 잔기를 Trp, Phe, Met, 또는 Leu, 바람직하게는 Trp 또는 Phe에 의해 치환하는 단계를 포함하며, 여기서 위치의 넘버링은 HIV-1 단리물 HXB2의 gp160에서의 넘버링에 따르는, 방법에 관한 것이다.
전술한 요약뿐만 아니라 본 발명의 하기의 상세한 설명도 첨부 도면과 함께 읽을 때 더 잘 이해될 것이다. 본 발명은 도면에 나타낸 정확한 실시형태로 제한되지 않음이 이해되어야 한다.
도 1a 및 도 1b는 돌연변이 Q650W가 ConC_SOSIP의 삼량체 수율을 증가시킨다는 것을 나타낸다. A) HIV Env ConC-SOSIP 및 그의 Q650W 변이체를 코딩하는 플라스미드를 이용한 형질감염 후의 Expi293F 세포 배양 상청액을 이용한 분석용 SEC. B) ConC_SOSIP에 대한 HIV Env-특이적 bNAb 및 비-bNAb 및 그의 Q650W 변이체를 이용한 세포 배양 상청액의 AlphaLISA 결합. 모든 측정은 삼중실험으로 수행되었다.
도 2a 및 도 2b는 돌연변이 Q650W가 ConB_SOSIP의 삼량체 수율을 증가시킨다는 것을 나타낸다. A) HIV Env ConB-SOSIP 및 그의 Q650W 변이체를 코딩하는 플라스미드를 이용한 형질감염 후의 Expi293F 세포 배양 상청액을 이용한 분석용 SEC. B) ConB_SOSIP 및 그의 Q650W 변이체에 대한 HIV Env-특이적 bNAb 및 비-bNAb를 이용한 세포 배양 상청액의 AlphaLISA 결합. 모든 측정은 삼중실험으로 수행되었다.
도 3은, Expi293F 세포 배양 상청액을 이용한 분석용 SEC에서, ConC_SOSIP에서 돌연변이 Q650F, Q650M, 및 Q650L은 ConC_SOSIP의 삼량체 수율을 증가시키는 반면에, 돌연변이 Q650I는 삼량체 형성을 감소시킨다는 것을 나타낸다.
도 4a 및 도 4b는 돌연변이 T538H가 ConC_SOSIP의 삼량체 수율을 증가시킨다는 것을 나타낸다. A) HIV Env ConC-SOSIP 및 그의 T538H 변이체를 코딩하는 플라스미드를 이용한 형질감염 후의 Expi293F 세포 배양 상청액을 이용한 분석용 SEC. B) ConC_SOSIP에 대한 HIV Env-특이적 bNAb 및 비-bNAb 및 그의 T538H 변이체를 이용한 세포 배양 상청액의 AlphaLISA 결합. 모든 측정은 삼중실험으로 수행되었다.
도 5a 및 도 5b는 돌연변이 T538H가 ConB_SOSIP의 삼량체 수율을 증가시킨다는 것을 나타낸다. A) HIV Env ConB-SOSIP 및 그의 T538H 변이체를 코딩하는 플라스미드를 이용한 형질감염 후의 Expi293F 세포 배양 상청액을 이용한 분석용 SEC. B) ConB_SOSIP에 대한 HIV Env-특이적 bNAb 및 비-bNAb 및 그의 T538H 변이체를 이용한 세포 배양 상청액의 AlphaLISA 결합. 모든 측정은 삼중실험으로 수행되었다.
도 6a 및 도 6b는 돌연변이 I108H가 ConC_SOSIP의 삼량체 수율을 증가시킨다는 것을 나타낸다. A) HIV Env ConC-SOSIP 및 그의 I108H 변이체를 코딩하는 플라스미드를 이용한 형질감염 후의 Expi293F 세포 배양 상청액을 이용한 분석용 SEC. B) ConC_SOSIP에 대한 HIV Env-특이적 bNAb 및 비-bNAb 및 그의 I108H 변이체를 이용한 세포 배양 상청액의 AlphaLISA 결합. 모든 측정은 삼중실험으로 수행되었다.
도 7a 및 도 7b는 돌연변이 I108H가 ConB_SOSIP의 삼량체 수율을 증가시킨다는 것을 나타낸다. A) HIV Env ConB-SOSIP 및 그의 I108H 변이체를 코딩하는 플라스미드를 이용한 형질감염 후의 Expi293F 세포 배양 상청액을 이용한 분석용 SEC. B) ConB_SOSIP에 대한 HIV Env-특이적 bNAb 및 비-bNAb 및 그의 I108H 변이체를 이용한 세포 배양 상청액의 AlphaLISA 결합. 모든 측정은 삼중실험으로 수행되었다.
도 8a 및 도 8b는 I108H 돌연변이만을 포함하는 ConcB_SOSIP와 비교하여 돌연변이 I108H, T538H, 및 Q650W가 삼량체 수율을 증가시킨다는 것을 나타낸다. A) I108H, T538H, 및 Q650W 돌연변이를 포함하는 HIV Env ConB-SOSIP 및 I108H 돌연변이만을 포함하는 HIV Env ConB-SOSIP를 코딩하는 플라스미드를 이용한 형질감염 후의 Expi293F 세포 배양 상청액을 이용한 분석용 SEC. B) ConB_SOSIP_ I108H_T538H_Q650W 및 ConB_SOSIP_ I108H 변이체에 대한 HIV Env-특이적 bNAb 및 비-bNAb를 이용한 세포 배양 상청액의 AlphaLISA 결합. 모든 측정은 삼중실험으로 수행되었다.
도 1a 및 도 1b는 돌연변이 Q650W가 ConC_SOSIP의 삼량체 수율을 증가시킨다는 것을 나타낸다. A) HIV Env ConC-SOSIP 및 그의 Q650W 변이체를 코딩하는 플라스미드를 이용한 형질감염 후의 Expi293F 세포 배양 상청액을 이용한 분석용 SEC. B) ConC_SOSIP에 대한 HIV Env-특이적 bNAb 및 비-bNAb 및 그의 Q650W 변이체를 이용한 세포 배양 상청액의 AlphaLISA 결합. 모든 측정은 삼중실험으로 수행되었다.
도 2a 및 도 2b는 돌연변이 Q650W가 ConB_SOSIP의 삼량체 수율을 증가시킨다는 것을 나타낸다. A) HIV Env ConB-SOSIP 및 그의 Q650W 변이체를 코딩하는 플라스미드를 이용한 형질감염 후의 Expi293F 세포 배양 상청액을 이용한 분석용 SEC. B) ConB_SOSIP 및 그의 Q650W 변이체에 대한 HIV Env-특이적 bNAb 및 비-bNAb를 이용한 세포 배양 상청액의 AlphaLISA 결합. 모든 측정은 삼중실험으로 수행되었다.
도 3은, Expi293F 세포 배양 상청액을 이용한 분석용 SEC에서, ConC_SOSIP에서 돌연변이 Q650F, Q650M, 및 Q650L은 ConC_SOSIP의 삼량체 수율을 증가시키는 반면에, 돌연변이 Q650I는 삼량체 형성을 감소시킨다는 것을 나타낸다.
도 4a 및 도 4b는 돌연변이 T538H가 ConC_SOSIP의 삼량체 수율을 증가시킨다는 것을 나타낸다. A) HIV Env ConC-SOSIP 및 그의 T538H 변이체를 코딩하는 플라스미드를 이용한 형질감염 후의 Expi293F 세포 배양 상청액을 이용한 분석용 SEC. B) ConC_SOSIP에 대한 HIV Env-특이적 bNAb 및 비-bNAb 및 그의 T538H 변이체를 이용한 세포 배양 상청액의 AlphaLISA 결합. 모든 측정은 삼중실험으로 수행되었다.
도 5a 및 도 5b는 돌연변이 T538H가 ConB_SOSIP의 삼량체 수율을 증가시킨다는 것을 나타낸다. A) HIV Env ConB-SOSIP 및 그의 T538H 변이체를 코딩하는 플라스미드를 이용한 형질감염 후의 Expi293F 세포 배양 상청액을 이용한 분석용 SEC. B) ConB_SOSIP에 대한 HIV Env-특이적 bNAb 및 비-bNAb 및 그의 T538H 변이체를 이용한 세포 배양 상청액의 AlphaLISA 결합. 모든 측정은 삼중실험으로 수행되었다.
도 6a 및 도 6b는 돌연변이 I108H가 ConC_SOSIP의 삼량체 수율을 증가시킨다는 것을 나타낸다. A) HIV Env ConC-SOSIP 및 그의 I108H 변이체를 코딩하는 플라스미드를 이용한 형질감염 후의 Expi293F 세포 배양 상청액을 이용한 분석용 SEC. B) ConC_SOSIP에 대한 HIV Env-특이적 bNAb 및 비-bNAb 및 그의 I108H 변이체를 이용한 세포 배양 상청액의 AlphaLISA 결합. 모든 측정은 삼중실험으로 수행되었다.
도 7a 및 도 7b는 돌연변이 I108H가 ConB_SOSIP의 삼량체 수율을 증가시킨다는 것을 나타낸다. A) HIV Env ConB-SOSIP 및 그의 I108H 변이체를 코딩하는 플라스미드를 이용한 형질감염 후의 Expi293F 세포 배양 상청액을 이용한 분석용 SEC. B) ConB_SOSIP에 대한 HIV Env-특이적 bNAb 및 비-bNAb 및 그의 I108H 변이체를 이용한 세포 배양 상청액의 AlphaLISA 결합. 모든 측정은 삼중실험으로 수행되었다.
도 8a 및 도 8b는 I108H 돌연변이만을 포함하는 ConcB_SOSIP와 비교하여 돌연변이 I108H, T538H, 및 Q650W가 삼량체 수율을 증가시킨다는 것을 나타낸다. A) I108H, T538H, 및 Q650W 돌연변이를 포함하는 HIV Env ConB-SOSIP 및 I108H 돌연변이만을 포함하는 HIV Env ConB-SOSIP를 코딩하는 플라스미드를 이용한 형질감염 후의 Expi293F 세포 배양 상청액을 이용한 분석용 SEC. B) ConB_SOSIP_ I108H_T538H_Q650W 및 ConB_SOSIP_ I108H 변이체에 대한 HIV Env-특이적 bNAb 및 비-bNAb를 이용한 세포 배양 상청액의 AlphaLISA 결합. 모든 측정은 삼중실험으로 수행되었다.
다양한 간행물, 논문, 및 특허가 배경기술에 그리고 본 명세서 전체에 걸쳐 인용되어 있거나 기재되어 있으며; 이들 참고문헌 각각은 전체적으로 본 명세서에 참고로 포함된다. 본 명세서에 포함된 문헌, 행동, 재료, 장치, 물품 등에 대한 논의는 본 발명에 대한 상황을 제공하는 것을 목적으로 한다. 그러한 논의는 이들 대상 중 임의의 것 또는 모든 것이 개시되거나 청구된 임의의 발명에 대하여 종래 기술의 일부를 형성하는 것을 인정하는 것은 아니다.
달리 정의되지 않는 한, 본원에 사용된 모든 기술 및 과학 용어는 본 발명이 속하는 기술 분야의 통상의 기술을 가진 자가 통상적으로 이해하는 것과 동일한 의미를 갖는다. 이와 달리, 본원에 사용되는 특정 용어는 본 명세서에 기재된 것과 같은 의미를 갖는다. 본 명세서에 인용된 모든 특허, 공개된 특허 출원 및 간행물은 마치 본 명세서에 완전히 기재되어 있는 것처럼 참고로 포함된다. 본 명세서 및 첨부된 청구범위에서 사용되는 바와 같이, 단수 형태(부정 관사 및 정관사)는, 문맥이 명확하게 달리 지시하지 않으면, 복수의 지시 대상을 포함한다는 것에 유의해야 한다.
달리 언급되지 않는 한, 본원에 기재된 농도 또는 농도 범위와 같은 임의의 수치는 모든 경우에서 "약"이라는 용어로 수식되는 것으로 이해되어야 한다. 따라서, 수치 값은 전형적으로 인용된 값의 ±10%를 포함한다. 본원에 사용되는 바와 같이, 수치 범위의 사용은 문맥이 명백히 달리 나타내지 않는 한, 모든 가능한 하위 범위를, 즉 그 범위 내의 정수 및 그 값의 분율을 포함한 모든 개별 수치를, 명시적으로 포함한다.
아미노산은 본 개시내용 전체에 걸쳐 참조된다. 20개의 천연 발생 아미노산뿐만 아니라 다수의 비-천연 발생 아미노산이 존재한다. 천연 아미노산 및 비-천연 아미노산 둘 모두를 포함하는 각각의 알려진 아미노산은 전체 명칭, 축약형 1 문자 코드, 및 축약형 3 문자 코드를 가지며, 이들 모두는 당업자에게 잘 알려져 있다. 예를 들어, 20개의 천연 발생 아미노산에 사용되는 3 문자 및 1문자 축약형 코드는 하기와 같다: 알라닌(Ala; A), 아르기닌(Arg; R), 아스파르트산(Asp; D), 아스파라긴(Asn; N), 시스테인(Cys; C), 글리신(Gly, G), 글루탐산(Glu; E), 글루타민(Gln; Q), 히스티딘(His; H), 아이소류신(Ile; I), 류신(Leu; L), 리신(Lys; K), 메티오닌(Met; M), 페닐알라닌(Phe; F), 프롤린(Pro; P), 세린(Ser; S), 트레오닌(Thr; T), 트립토판(Trp; W), 티로신(Tyr; Y), 및 발린(Val; V). 아미노산은 이들의 전체 명칭, 1 문자 축약형 코드, 또는 3 문자 축약형 코드로 지칭될 수 있다.
문맥이 명확하게 달리 지시하지 않는 한, 본 명세서에 사용되는 바와 같은 HIV 외피 단백질의 아미노산 서열 내의 위치의 넘버링은, 예를 들어 문헌[Korber et al., Human Retroviruses and AIDS 1998: A Compilation and Analysis of Nucleic Acid and Amino Acid Sequences. Korber et al., Eds. Theoretical Biology and Biophysics Group, Los Alamos National Laboratory, Los Alamos, N. Mex.]에 기술된 바와 같이 HIV-1 단리물 HXB2의 gp160에서의 넘버링에 따르며, 이는 전체적으로 본 명세서에 참고로 포함된다. HXB2에 따른 넘버링은 HIV Env 단백질의 분야에서 통상적이다. HIV-1 단리물 HXB2의 gp160은 서열 번호 1에 나타낸 아미노산 서열을 갖는다. 이 서열과 관심 HIV Env 서열의 정렬을 사용하여 관심 서열 내의 상응하는 아미노산 넘버링을 찾을 수 있다.
용어 "퍼센트(%) 서열 동일성" 또는 "% 동일성"은 아미노산 서열의 전체 길이를 구성하는 아미노산 잔기의 수와 비교하여 2개 이상의 정렬된 아미노산 서열의 동일한 아미노산의 매치("히트(hit)")의 수를 기재한다. 다른 관점에서는, 서열들이 당업계에 알려진 바와 같은 서열 비교 알고리즘을 사용하여 측정된 바와 같은 최대 상응성에 대해 비교되고 정렬될 때, 또는 수동으로 정렬되고 시각적으로 검사될 때, 2개 이상의 서열에 대해 정렬을 사용하여 동일한 아미노산 잔기의 백분율(예를 들어, 95%, 97%, 또는 98% 동일성)을 결정할 수 있다. 따라서, 서열 동일성을 결정하기 위해 비교되는 서열들은 아미노산의 치환(들), 부가(들) 또는 결실(들)에 의해 상이할 수 있다. 단백질 서열들을 정렬하기에 적합한 프로그램은 당업자에게 알려져 있다. 단백질 서열의 서열 동일성 백분율은, 예를 들어, CLUSTALW, Clustal Omega, FASTA, 또는 BLAST와 같은 프로그램으로, 예를 들어 NCBI BLAST 알고리즘을 사용하여 결정할 수 있다(문헌[Altschul SF, et al (1997), Nucleic Acids Res. 25:3389-3402]).
HIV Env 단백질 내의 "상응하는 위치"는 2개 이상의 HIV Env 서열이 정렬될 때 아미노산 잔기의 위치를 지칭한다. 달리 지시되지 않는 한, 이러한 목적을 위한 아미노산 위치 넘버링은 본 분야에서 관례적인 바와 같이 HIV-1 단리물 HXB2의 gp160에서의 넘버링에 따른다.
본 명세서에 사용되는 바와 같이, '본 발명에 따른 돌연변이'는 트립토판(Trp), 페닐알라닌(Phe), 메티오닌(Met), 또는 류신(Leu) 잔기에 의한 모 HIV Env 단백질 내의 위치 650에서의 아미노산의 치환이다. 이들 중에서, Trp 또는 Phe에 의한 치환이 바람직하다. 본 명세서에 사용되는 바와 같이 부가적인 '안정화 돌연변이'는 표 1의 항목 (i) 내지 (xvi) 중 임의의 것에서 본 명세서에 기재된 바와 같은 돌연변이이며, 이는 상기 모 분자 내의 상응하는 아미노산의 치환에 의해 돌연변이가 도입될 때 모 분자와 비교하여 HIV Env 단백질의 삼량체의 백분율 및/또는 삼량체 수율(이는 예를 들어 AlphaLISA 또는 크기 배제 크로마토그래피(SEC) 검정, 예를 들어 본 명세서에 기재된 분석용 SEC 검정, 또는 예를 들어 WO 2019/016062호에 기재된 바와 같은 SEC-MALS에 따라 측정될 수 있음)을 증가시킨다(예를 들어 WO 2019/016062호 참조). 본 발명에 따른 돌연변이와 임의로 조합될 수 있는 다른 신규 안정화 돌연변이는 모 HIV Env 단백질 내의 위치 108에서의 아미노산의 히스티딘(His) 잔기에 의한 치환, 또는 모 HIV Env 단백질 내의 위치 538에서의 아미노산의 히스티딘(His) 잔기에 의한 아미노산의 치환, 또는 위치 108 및 538 둘 모두에서의 아미노산의 His 잔기에 의한 치환이다. 그러한 안정화 돌연변이로부터 생성되는 아미노산은 전형적으로 야생형 HIV 단리물의 Env 단백질에서 거의 발견되지 않는다.
다른 태양에서, 본 발명은 위치 108에 히스티딘(His)을 포함하는 HIV Env 단백질을 제공하며, 여기서 위치의 넘버링은 HIV-1 단리물 HXB2의 gp160에서의 넘버링에 따른다. 그러한 Env 단백질은 전에 기재된 바 없으며, 위치 108에서의 His 아미노산은 증가된 삼량체 수율로 이어진다. 이는 그 위치에서 가장 풍부하게 발견되는 원래의 아미노산(아이소류신, Ile임)을 갖는 Env 단백질과 비교하여 계통군 B 및 계통군 C 유래의 Env 단백질 둘 모두에 대해 본 명세서에 나타냈다. 위치 108에 히스티딘(His)을 포함하는 HIV Env 단백질은 650 및/또는 538 변형 또는 본 명세서에 기재된 바와 같은 다른 아미노산 변형 중 임의의 것과 임의로 조합될 수 있다. 소정의 실시 형태에서, 본 발명의 재조합 HIV Env 단백질은 위치 108에 His를 포함하고, (a) 위치 501 및 605에 Cys, 또는 (b) 위치 559에 Pro, 또는 바람직하게는 (c) 위치 501 및 605에 Cys 및 위치 559에 Pro를 추가로 포함하며, 여기서 위치의 넘버링은 HIV-1 단리물 HXB2의 gp160에서의 넘버링에 따른다.
용어 '천연' 또는 '야생형'은 HIV 균주(또는 이로부터의 Env 단백질)를 언급할 때 본 명세서에서 상호교환적으로 사용되며, 예를 들어 HIV-감염된 환자에서와 같이, 천연 발생하는 바와 같은 HIV 균주(또는 이로부터의 Env 단백질)를 지칭한다.
본 발명은 일반적으로 외피 단백질의 삼량체 형태를 안정화하는 외피 단백질 서열 내의 표시된 위치에 소정의 아미노산 치환을 포함하는 재조합 HIV 외피(Env) 단백질에 관한 것이다. HIV 외피 단백질의 서열에 본 발명의 식별된 아미노산 치환, 및 임의로 부가적인 안정화 돌연변이 중 하나 이상을 도입하는 것은 삼량체 형성의 증가된 백분율 및/또는 증가된 삼량체 수율을 유발할 수 있다. 이는 예를 들어 삼량체-특이적 항체, 크기 배제 크로마토그래피, 및 정확하게 폴딩되거나(안정한 삼량체성) 대안적으로 부정확하게 폴딩된(불안정하거나 비-삼량체성) Env 단백질에 결합하는 항체에 대한 결합을 사용하여 측정할 수 있으며, 증가된 삼량체 백분율 및/또는 삼량체 수율은 안정한, 천연의, 정확하게 폴딩된 Env 단백질을 나타내는 것으로 간주된다.
인간 면역결핍 바이러스(HIV)는 레트로바이러스과 패밀리의 일부인 렌티바이러스 속의 구성원이다. HIV-1 및 HIV-2의 2가지 종의 HIV는 인간을 감염시킨다. HIV-1은 HIV 바이러스의 가장 통상적인 균주이며, HIV-2보다 더 병원성인 것으로 알려져 있다. 본 명세서에 사용되는 바와 같이, 용어 "인간 면역결핍 바이러스" 및 "HIV"는 HIV-1 및 HIV-2를 지칭하지만 이로 제한되지 않는다. 바람직한 실시 형태에서, HIV는 HIV-1을 지칭한다.
HIV는 고도의 유전적 다양성을 갖는 다중 계통군으로 분류된다. 본 명세서에 사용되는 바와 같이, 용어 "HIV 계통군" 또는 "HIV 아형"은 유전적 유사성의 정도에 따라 분류된 관련 인간 면역결핍 바이러스를 지칭한다. HIV-1 단리물의 최대 군은 군 M(주요 균주)으로 불리며 12개 이상의 계통군, A 내지 L로 이루어진다.
일반적인 일 태양에서, 본 발명은 재조합 HIV 외피(Env) 단백질에 관한 것이다. 단백질과 관련하여 사용될 때 용어 "재조합"은 재조합 기술에 의해 또는 시험관내 화학적 합성에 의해 생성되는 단백질을 지칭한다. 본 발명의 실시 형태에 따라, "재조합" 단백질은 상응하는 천연 발생 서열에서 발견되지 않는 하나 이상의 서열 요소(예를 들어, 아미노산 치환, 결실, 첨가, 서열 대체 등)를 그것이 함유한다는 점에서 인공 아미노산 서열을 갖는다. 바람직하게는, "재조합" 단백질은 하나 이상의 천연 발생 HIV 균주에 대해 면역 반응을 유도하거나 면역을 생성하도록 최적화된 비-천연 발생 HIV 외피 단백질이다.
용어 "HIV 외피 단백질", "HIV Env", 및 "HIV Env 단백질"은 천연에서 HIV 비리온의 외피 상에서 발현되고 HIV가 HIV 감염된 세포의 원형질막을 표적화하고 이에 부착되는 것을 가능하게 하는 단백질 또는 이의 단편 또는 유도체를 지칭한다. 용어 "외피" 및 "Env"는 본 개시내용 전체에 걸쳐 상호교환적으로 사용된다. HIV env 유전자는 전구체 단백질 gp160을 인코딩하며, 이는 2개의 성숙 외피 당단백질 gp120 및 gp41로 단백질분해적으로 절단된다. 절단 반응은 레트로바이러스 외피 당단백질 전구체에서 고도로 보존된 서열 모티프에서 숙주 세포 프로테아제인 푸린에 의해(또는 푸린-유사 프로테아제에 의해) 매개된다. 더욱 구체적으로, gp160은 (gp160)3으로 삼량체화된 후에 2개의 비공유적으로 회합된 성숙 당단백질 gp120 및 gp41로의 절단을 겪는다. 이어서, 바이러스 진입은 gp120/gp41 이종이량체의 삼량체에 의해 매개된다. Gp120은 수용체 결합 단편이며, 예를 들어 T-헬퍼 세포와 같은, 그러한 수용체를 갖는 표적 세포 상의 CD4 수용체(및 공동-수용체)에 결합한다. gp120에 비공유 결합되는 Gp41은 융합 단편이며, HIV가 세포에 진입하는 제2 단계를 제공한다. Gp41은 원래 바이러스 외피 내에 매립되지만, gp120이 CD4 수용체 및 공동-수용체에 결합할 때 gp120은 그의 입체배좌를 변화시켜 gp41이 노출되게 하며, 여기서 그것은 숙주 세포와의 융합을 보조할 수 있다. Gp140은 gp160의 엑토도메인이다.
본 발명의 실시 형태에 따라, "HIV 외피(Env) 단백질"은 gp160 또는 gp140 단백질, 또는 이들의 조합, 융합, 절단, 또는 유도체일 수 있다. 예를 들어, "HIV 외피 단백질"은 gp41 단백질과 비공유적으로 회합된 gp120 단백질을 포함할 수 있다. "HIV 외피 단백질"은 또한 엑토도메인(즉, 세포외 공간 내로 연장되는 도메인) 내의 C-말단 절단, gp41 내의 절단, 예컨대 gp41의 엑토도메인, gp41의 막관통 도메인, 또는 gp41의 세포질 도메인 내의 절단을 포함하는 외피 단백질을 포함하지만 이로 제한되지 않는 절단된 HIV 외피 단백질일 수 있다. HIV 외피 단백질은 또한 gp160 엑토도메인에 상응하는 gp140, 또는 gp140의 연장되거나 절단된 버전일 수 있다. gp140 단백질의 발현은 몇몇 간행물에 기재되어 있으며(예를 들어, 문헌[Zhang et al., 2001]; 문헌[Sanders et al., 2002]; 문헌[Harris et al., 2011]), 단백질은 또한, 예를 들어 상이한 HIV 균주에 기초하는 상이한 변이체에서, 서비스 제공자로부터 주문될 수 있다. gp120 도메인 및 gp41 엑토도메인이 절단되지 않고 공유 연결되거나, 대안적으로 gp120 도메인 및 gp41 엑토도메인이 절단되고, 예를 들어 다이설파이드 가교에 의해 공유 연결될 수 있도록(예를 들어, SOSIP 변이체에서와 같이), 본 발명에 따른 gp140 단백질은 절단 부위 돌연변이를 가질 수 있다. "HIV 외피 단백질"은 추가로, 예를 들어 푸린 절단 부위에서의 서열 돌연변이, 및/또는 소위 SOSIP 돌연변이를 갖는 천연 발생 HIV 외피 단백질의 유도체일 수 있다. 본 발명에 따른 HIV 외피 단백질은 또한 gp120 및 gp41 엑토도메인이 비-공유 연결될 수 있도록 절단 부위를 가질 수 있다.
본 발명의 바람직한 실시 형태에서, HIV Env 단백질은 gp140 단백질 또는 gp160 단백질, 더욱 바람직하게는 gp140 단백질이다. 다른 바람직한 실시 형태에서, Env 단백질은, 예를 들어, 천연 Env 단백질과 비교하여 세포질 영역의 제7 잔기 후에 잔기의 결실에 의해 절단된다.
본 발명의 실시 형태에 따라, "HIV 외피 단백질"은 삼량체 또는 단량체일 수 있으며, 바람직하게는 삼량체이다. 삼량체는 동종삼량체(예를 들어, 3개의 동일한 폴리펩티드 단위를 포함하는 삼량체) 또는 이종삼량체(예를 들어, 모두 동일하지는 않은 3개의 폴리펩티드 단위를 포함하는 삼량체)일 수 있다. 바람직하게는, 삼량체는 동종삼량체이다. 절단된 gp140 또는 gp160의 경우, 그것은 gp120-gp41 이량체인 폴리펩티드 단위의 삼량체이고, 이러한 이량체 3개 모두가 동일한 경우, 이는 동종삼량체로 간주된다. 일부 경우에, HIV 외피 단백질은 또한 육량체의 형태로 존재할 수 있다.
"HIV 외피 단백질"은 가용성 단백질, 또는 막 결합 단백질일 수 있다. 막 결합 외피 단백질은 전형적으로 막관통 도메인(TM)을 포함하는 전장 HIV 외피 단백질에서와 같이 막관통 도메인을 포함한다. 막 결합 단백질은 세포질 도메인을 가질 수 있지만, 막 결합되기 위해 세포질 도메인을 필요로 하지는 않는다. 가용성 외피 단백질은 막관통 도메인의 적어도 부분적인 또는 완전한 결실을 포함한다. 예를 들어, 전장 HIV 외피 단백질의 C-말단 단부는 막관통 도메인을 결실하도록 절단될 수 있으며, 이에 의해 가용성 단백질을 생성한다(각각 전장 및 절단된 가용성 HIV Env 단백질의 개략적인 표현에 대해서는, 예를 들어, WO 2019/016062호의 도 1a 및 도 1b를 참조함). 그러나, HIV 외피 단백질은 WO 2019/016062호의 도 1b에 나타낸 것들에 대해 더 짧은 절단 및 대안적인 절단 위치로 여전히 가용성일 수 있다. 절단은 다양한 위치에서 실행될 수 있으며, 비-제한적인 예는 모두 가용성 단백질을 유발하는 아미노산 664, 655, 683 등 후이다. 본 발명에 따른 막-결합 Env 단백질은 천연 Env 단백질과 비교하여 완전한 또는 부분적인 C-말단 도메인을 포함할 수 있다(예를 들어, 소정의 실시 형태에서, 세포질 영역의 제7 잔기 후에, 예를 들어, C-말단 세포질 도메인의 부분적인 결실에 의함). 세포질 영역의 결실은 또한 세포질 도메인의 제7 잔기와는 다른 것, 예를 들어 세포질 도메인의 제1, 제2, 제3, 제4, 제5, 제6, 제8, 제9, 제10, 또는 이후의 임의의 잔기 후로부터일 수 있다는 것이 당업자에게 명백할 것이다.
신호 펩티드는 발현될 때 HIV Env 단백질의 N-말단에 전형적으로 존재하지만, 신호 펩티다제에 의해 절단되므로 성숙 단백질에는 존재하지 않는다. 신호 펩티드는 다른 신호 서열과 상호교환될 수 있으며, 신호 펩티드의 2개의 비-제한적인 예는 본 명세서에서 서열 번호 7 및 8에 제공된다.
본 발명의 실시 형태에 따라, HIV 외피 단백질, 예를 들어, gp160 또는 gp140은, 임의의 HIV 계통군(또는 '아형'), 예를 들어, 계통군 A, 계통군 B, 계통군 C, 계통군 D, 계통군 E, 계통군 F, 계통군 G, 계통군 H 등, 또는 이들의 조합(상이한 아형, 예를 들어 BC, AE, AG, BE, BF, ADG 등의 바이러스 사이의 재조합으로부터 유래된 '순환 재조합 형태' 또는 CRF에서와 같음)으로부터의 HIV 외피 단백질 서열로부터 유래될 수 있다. HIV 외피 단백질 서열은 천연 발생 서열, 모자이크 서열, 공통 서열, 합성 서열, 또는 이의 임의의 유도체 또는 단편일 수 있다. "모자이크 서열"은 하나 이상의 HIV 계통군의 3개 이상의 HIV 외피 서열로부터 유래된 다중 에피토프를 함유하며, T-세포 에피토프의 커버리지를 최적화하는 알고리즘에 의해 설계될 수 있다. 모자이크 HIV 외피 단백질의 서열의 예는, 예를 들어, 문헌[Barouch et al, Nat Med 2010, 16: 319-323]; WO 2010/059732호; 및 WO 2017/102929호에 기재된 것들을 포함한다. 본 명세서에 사용되는 바와 같이, "공통 서열"은, 예를 들어 상동성 단백질의 아미노산 서열의 정렬(예를 들어, Clustal Omega를 사용함)에 의해 결정된 바와 같이, 상동성 단백질의 아미노산 서열의 정렬에 기초한 아미노산의 인공 서열을 의미한다. 이는, 예를 들어 1000개 이상의 천연 HIV 단리물로부터의 Env의 서열에 기초하는 서열 정렬에서 각각의 위치에서 발견되는 가장 빈번한 아미노산 잔기의 계산된 순서이다. "합성 서열"은 하나 초과의 천연 발생 HIV 균주에 대해 면역 반응을 유도하거나 면역을 생성하도록 최적화된 비-천연 발생 HIV 외피 단백질이다. 모자이크 HIV 외피 단백질은 합성 HIV 외피 단백질의 비-제한적인 예이다. 본 발명의 소정의 실시 형태에서, 모 HIV Env 단백질은 공통 Env 단백질, 또는 합성 Env 단백질이다. 모 Env 단백질 내에 돌연변이가 도입되어 위치 650에 아미노산 Trp, Phe, Met, 또는 Leu를 유발한다. 바람직한 실시 형태에서, 돌연변이는 HIV Env 단백질의 위치 650에 Trp 또는 Phe를 유발한다. 임의로, 그러한 HIV Env 단백질은 표 1에서 본 명세서에 기재된 표시된 위치 (i) 내지 (xx)에 표시된 아미노산 중 하나 이상을 추가로 가질 수 있다. 하기 기재된 바와 같이, (a) 표시된 위치 (i) 내지 (viii)에 표시된 아미노산 잔기 중 1개 이상, 바람직하게는 2개 이상을 추가로 갖고/갖거나, (b) 바람직하게는 추가의 SOSIP(예를 들어 위치 (xviii)에 표시된 아미노산)을 갖고/갖거나 (c) 푸린 절단 부위 돌연변이(예를 들어 위치 (xvii)에 표시된 아미노산)를 추가로 갖는, 위치 650에 Trp, Phe, Met, 또는 Leu, 바람직하게는 Trp 또는 Phe를 갖는 Env 단백질이 특히 바람직하다.
본 발명의 소정의 실시 형태에서, 천연 발생 서열, 모자이크 서열, 공통 서열, 합성 서열 중 어느 것이든, HIV 외피 단백질은, 예를 들어, 푸린 절단 부위 내에 부가적인 서열 돌연변이, 및/또는 소위 SOSIP 돌연변이를 포함한다.
본 발명의 일부 실시 형태에서, 본 발명의 HIV 외피 단백질은 추가의 돌연변이를 가지며, "SOSIP 돌연변이체 HIV Env 단백질"이다. 소위 SOSIP 돌연변이는 'SOS 돌연변이'(위치 501 및 605에서의 Cys 잔기, 이는 새로 생성된 시스테인 잔기들 사이에 가능한 다이설파이드 가교의 도입을 유발함) 및 'IP 돌연변이'(위치 559에서의 Pro 잔기)를 포함하는 삼량체 안정화 돌연변이이다. 본 발명의 실시 형태에 따라, SOSIP 돌연변이체 Env 단백질은 위치 501 및 605에서의 Cys; 위치 559에서의 Pro; 및 바람직하게는 위치 501 및 605에서의 Cys 및 위치 559에서의 Pro로 이루어진 군으로부터 선택된 하나 이상의 돌연변이를 포함한다. SOSIP 돌연변이체 HIV Env 단백질은, 예를 들어 푸린 절단 부위 내에 다른 서열 돌연변이를 추가로 포함할 수 있다. 또한, 소정의 실시 형태에서, Env 단백질이 위치 556 또는 위치 558에, 또는 위치 556 및 558에 Pro를 포함하도록 돌연변이를 추가로 첨가하는 것이 가능하며, 이는 SOSIP 변이체에서 위치 559에서의 Pro에 대한 대안으로서뿐만 아니라, 위치 559에 이미 Pro를 갖는 SOSIP 변이체의 삼량체 형성을 추가로 개선할 수 있는 부가적인 돌연변이로서 작용할 수 있는 것으로 밝혀졌다.
본 발명의 소정의 바람직한 실시 형태에서, SOSIP 돌연변이체 HIV Env 단백질은 위치 501 및 605에 Cys를 포함하고, 위치 559에 Pro를 포함한다.
소정의 실시 형태에서, 본 발명의 HIV 외피 단백질은 푸린 절단 부위 내에 돌연변이를 추가로 포함한다. 푸린 절단 서열 내의 돌연변이는 아미노산 치환, 결실, 삽입, 또는 하나의 서열의 다른 서열에 의한 대체, 또는 링커 아미노산 서열에 의한 대체일 수 있다. 바람직하게는 본 발명에서, 예를 들어 잔기 508 내지 511에서의 서열을 RRRRRR(서열 번호 6)로 대체함으로써, 야생형에 비해 푸린 절단이 개선되도록, 푸린 절단 부위를 돌연변이화하는 단계를 사용하여 절단 부위를 최적화할 수 있다[즉, 위치 509 내지 510에서 전형적인 아미노산 서열(예를 들어 EK)을 4개의 아르기닌 잔기로 대체(즉, 2개의 대체 및 2개의 첨가)하는 반면에, 위치 508 및 511에는, 대부분의 HIV Env 단백질에서 아르기닌 잔기가 이미 존재하므로, 이들은 전형적으로 대체될 필요가 없지만, 문헌에서 최종 결과는 종종 아미노산 서열 RRRRRR로 지칭되므로, 본 발명자들은 본 명세서에서 이 명명법을 유지하였음]. 푸린-절단을 개선하는 다른 돌연변이가 알려져 있으며 또한 사용될 수 있다. 대안적으로, 푸린 절단이 더 이상 필요하지 않지만 단백질이 천연-유사 입체배좌를 채택하도록 푸린 절단 부위를 링커로 대체하는 것이 가능하다(예를 들어, 문헌[Sharma et al, 2015] 및 문헌[Georgiev et al, 2015]에 기재됨).
본 발명의 소정의 실시 형태에서, 본 발명의 HIV 외피 단백질은 소위 SOSIP 돌연변이(바람직하게는 위치 501 및 605에서의 Cys, 및 위치 559에서의 Pro) 및 푸린 절단 부위에서의 서열 돌연변이, 바람직하게는 RRRRRR(서열 번호 6)에 의한 잔기 508 내지 511에서의 서열의 대체 둘 모두를 추가로 포함한다. 소정의 바람직한 실시 형태에서, HIV Env는 표시된 SOSIP 및 푸린 절단 부위 돌연변이 둘 모두를 포함하며, 또한 위치 556 또는 558에, 가장 바람직하게는 위치 556 및 558 둘 모두에 Pro 잔기를 추가로 포함한다.
본 발명의 소정의 실시 형태에서, HIV 외피 단백질의 아미노산 서열은 공통 서열, 예컨대 HIV 외피 계통군 C 공통 또는 HIV 외피 계통군 B 공통이다.
본 발명에 사용될 수 있는 예시적인 HIV 외피 단백질은 HIV 외피 계통군 C 공통(서열 번호 2) 및 HIV 외피 계통군 B 공통(서열 번호 4)을 포함한다. 이러한 HIV 외피 계통군 C 및 계통군 B 공통 서열은, 예를 들어 소위 SOSIP 돌연변이와 같이, 예를 들어 안정성 및/또는 삼량체 형성을 향상시키는 부가적인 돌연변이 및/또는, 예를 들어 서열 번호 3에 나타낸 ConC_SOSIP 서열 및 서열 번호 5에 나타낸 ConB_SOSIP 서열에서와 같이, 상기 기재된 바와 같은 푸린 절단 부위 내의 서열 돌연변이를 포함할 수 있다.
본 발명에 사용될 수 있는 바람직한 HIV 외피 단백질 서열('배경' 또는 '모' 분자로서 사용됨, 여기서 이어서 위치 650은 Trp, Phe, Met, 또는 Leu, 바람직하게는 Trp 또는 Phe로 돌연변이화됨)의 다른 비-제한적인 예는, 상기 기재된 바와 같이 임의로 SOSIP 및/또는 푸린 절단 부위 돌연변이를 추가로 갖는 합성 HIV Env 단백질을 포함한다. 추가의 비-제한적인 예는 모자이크 HIV 외피 단백질이다.
소정의 실시 형태에서, 모 분자는 야생형 HIV Env 단백질이다. 그러한 모 분자는 상기 기재된 바와 같이 임의로 SOSIP 및/또는 푸린 절단 부위 돌연변이를 추가로 갖는다.
아미노산 Trp, Phe, Met, 또는 Leu로, 임의로 추가로 표 1에 기재된 위치 (i) 내지 (xvii)에 표시된 아미노산으로 대체되는 위치 650에서의 아미노산을 유발하는 돌연변이, 및/또는 임의로 아미노산 His로 대체되는 위치 108 및/또는 538에서의 아미노산을 유발하는 돌연변이를 추가로 포함하는 것은, SOSIP 돌연변이가 존재하지 않는 HIV Env 단백질에(예를 들어. Env 공통 서열에 또는 야생형 HIV 단리물로부터의 Env 단백질에) 또한 사용될 수 있으며, 이들의 삼량체화를 또한 개선할 가능성이 있는데, 이는 본 발명의 돌연변이가 SOSIP 돌연변이로부터 독립적이며, 상이한 작용 모드를 갖기 때문이다. 실제로, 예를 들어 부가적인 안정화 돌연변이는, 예를 들어 WO 2019/016062호에 기재된 바와 같이 몇몇 상이한 HIV Env 단백질 골격에서 작용하는 것으로 나타났으며, 이는 SOS-돌연변이의 부재뿐만 아니라 HIV Env 삼량체화 특성을 개선하기 위한 IP-돌연변이의 부재, 뿐만 아니라 SOSIP 돌연변이 중 임의의 것의 부재 하의 것을 포함한다. 따라서, 소정의 실시 형태에서, 본 발명에 따른 HIV Env 단백질은 SOSIP 돌연변이 중 임의의 것을 포함하지 않는다. 또 다른 실시 형태에서, 삼량체를 추가로 안정화하기 위해 SOSIP 돌연변이에 대한 대안을 사용하는 것이 또한 가능하다. 소정의 대안적인 실시 형태에서는, 'SOS' 돌연변이 대신에 링커가 사용된다. 소정의 대안적인 실시 형태에서는, 'IP' 돌연변이 대신에, 위치 556 및/또는 558 중 하나 또는 둘 모두가 Pro 잔기에 의해 대체된다.
본 발명의 실시 형태에 따른 재조합 HIV 외피 단백질은 HIV 외피 단백질의 아미노산 서열 내의 명시된 위치에 소정의 아미노산 잔기(들)를 갖는 HIV 외피 단백질을 포함한다. 특히, Env 단백질 내의 위치 650은 Trp, Phe, Met, 또는 Leu 잔기로 돌연변이화되어 Env 단백질의 삼량체 형성을 개선할 수 있는 것으로 나타났으며, 여기서 위치의 넘버링은 HIV-1 단리물 HXB2의 gp160에서의 넘버링에 따른다. 또한 임의의 실시 형태에서, 표 1에는 외피 단백질 내의 다수의 위치가 표시되어 있을뿐만 아니라, 식별된 위치 중 하나 이상 또는 각각에서 바람직할 특정 아미노산 잔기가 표시되어 있으며, 여기서 위치의 넘버링은 HIV-1 단리물 HXB2의 gp160에서의 넘버링에 따른다. 본 발명에 따른 HIV Env 단백질은 위치 650에 Trp, Phe, Met, 또는 Leu, 바람직하게는 Trp 또는 Phe를 가지며, 임의로 표 1에 제공된 바와 같이 표시된 위치 (i) 내지 (xx) 중 하나 이상에 명시된 아미노산 잔기(들)를 갖는다.
[표 1]
위치 650에 Trp, Phe, Met, 또는 Leu, 및 임의로 하나 이상의 다른 표시된 위치에 하나 이상의 바람직한 아미노산(또는 표시된 아미노산) 치환이 도입되는 HIV 외피 단백질의 아미노산 서열은 "골격 HIV 외피 서열" 또는 "모 HIV 외피 서열"로 지칭된다. 예를 들어, 서열 번호 3의 ConC_SOSIP 서열의 위치 650이 Trp, Phe, Met, 또는 Leu로 돌연변이화된다면, ConC_SOSIP 서열은 "골격" 또는 "모" 서열인 것으로 간주된다. 임의의 HIV 외피 단백질을 "골격" 또는 "모" 서열로 사용할 수 있으며, 여기에 본 발명의 실시 형태에 따라 신규한 안정화 돌연변이(즉, 위치 650에서의 아미노산의 Trp, Phe, Met, 또는 Leu에 의한 치환)가, 단독으로 또는 다른 돌연변이, 예컨대 소위 SOSIP 돌연변이 및/또는 푸린 절단 부위에서의 돌연변이와 조합되어 도입될 수 있다. 골격으로 사용될 수 있는 HIV Env 단백질의 비-제한적인 예는 천연 HIV 단리물, 합성 HIV Env 단백질, 또는 공통 HIV Env 단백질로부터의 HIV Env 단백질을 포함한다.
본 발명의 소정의 실시 형태에 따라, 위치 650에 Trp, Phe, Met, 또는 Leu를 갖는 것에 부가하여, HIV 외피 단백질은 임의로 표 1의 위치 (i) 내지 (xx)으로 이루어진 군으로부터 선택된 표시된 위치 중 하나 이상에 표시된 아미노산 잔기를 가질 수 있다. 전형적으로, 바람직하게는 표시된 위치 (i) 내지 (viii)에서의 2개 이상, 3개 이상 등의 치환의 조합을 포함하는, 표시된 위치 (i) 내지 (xviii)에서의 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상 등의 치환의 조합을 포함하는 HIV Env 단백질은, 그러한 치환을 갖지 않거나 덜 갖는 골격 단백질과 비교하여 개선된 삼량체화 특성을 갖는다는 것이 확인되었다(예를 들어 WO 2019/016062호 참조).
본 발명의 소정의 실시 형태에 따라, 위치 650에 Trp, Phe, Met, 또는 Leu, 바람직하게는 Trp 또는 Phe를 갖는 것에 부가하여, HIV 외피 단백질은 임의로 위치 108에 His, 또는 위치 538에 His, 또는 위치 108 및 538 둘 모두에 His를 또한 가질 수 있다. 이들은 본 명세서에 나타낸 바와 같이 개선된 특성을 독립적으로 유발하는 것으로 나타난 다른 신규 돌연변이이다. 이들 위치는 서로 독립적이며, 소정의 실시 형태에서 조합되어 추가의 개선을 유발할 수 있다. 그러한 분자(위치 650에 Trp, Phe, Met, 또는 Leu 및 위치 538 및/또는 108에 His를 가짐)는 임의로 표 1의 위치 (i) 내지 (xviii)로 이루어진 군으로부터 선택된 표시된 위치 중 하나 이상에 표시된 아미노산 잔기를 추가로 가질 수 있다.
바람직하게는, 위치 650에서의 Trp, Phe, Met, 또는 Leu, 및/또는 (i) 내지 (xx)의 아미노산 중 하나 이상이 아미노산 치환에 의해 재조합 HIV Env 단백질에 도입된다. 예를 들어, 표시된 아미노산 잔기 중 전부 또는 하나 이상이 아미노산 치환에 의해 재조합 HIV Env 단백질에 도입되도록, 재조합 HIV Env 단백질은 위치 650에 Trp, Phe, Met, 또는 Leu를 함유하지 않거나 상기 (i) 내지 (xx)의 아미노산 잔기 중 하나만을 포함하거나 전혀 포함하지 않는 HIV Env 단백질로부터 생성될 수 있다. 마찬가지로, 위치 108 및/또는 538에 His가 아미노산 치환에 의해 재조합 HIV Env 단백질에 도입될 수 있다.
상기 기재된 치환이 도입되는 HIV Env 단백질의 아미노산 서열은, 예를 들어 HIV 계통군 A, 계통군 B, 계통군 C 등으로부터의 천연 발생 서열; 모자이크 서열; 공통 서열, 예를 들어, 계통군 B 또는 계통군 C 공통 서열; 합성 서열; 또는 이의 임의의 유도체 또는 단편과 같은, 본 개시내용을 고려하여 당업계에 알려진 임의의 HIV Env 단백질일 수 있다. 본 발명의 소정의 실시 형태에서, HIV Env 단백질의 아미노산 서열은, 예를 들어, 소위 SOSIP 돌연변이, 및/또는 푸린 절단 부위에서의 돌연변이와 같은 부가적인 돌연변이를 포함한다.
일 특정 실시 형태에서, HIV Env 골격 단백질은 위치 501 및 605에 Cys; 위치 559에 Pro로 이루어진 군으로부터 선택된 하나 이상의 돌연변이를 포함하는 SOSIP 돌연변이체 HIV Env 단백질이다. 바람직한 실시 형태에서, SOSIP 돌연변이체 HIV Env 단백질은 위치 501 및 605에 Cys를 포함하고, 위치 559에 Pro를 포함한다. 본 실시 형태에 따라, 재조합 HIV Env 단백질은 SOSIP 돌연변이체 HIV Env 단백질의 아미노산 서열 및 위치 650에 Trp, Phe, Met, 또는 Leu를 생성하는 위치 650에서의 아미노산 치환, 및 임의로 표 1의 항목 (i) 내지 (xvi)으로 이루어진 군으로부터 선택된 표시된 위치 중 하나 이상에서의 표시된 아미노산 잔기에 의한 하나 이상의 추가의 아미노산 치환을 포함한다.
SOSIP 돌연변이체 HIV Env 단백질은 서열 번호 6에 의한 위치 608 내지 511에서의 대체와 같은 푸린 절단 부위에서의 돌연변이를 추가로 포함할 수 있다.
일 특정 실시 형태에서, HIV Env 골격 단백질은 서열 번호 2의 아미노산 서열과 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 아미노산 서열을 포함하는 HIV Env 공통 계통군 C이다. 소정의 실시 형태에서, 서열 번호 2의 HIV 공통 계통군 C 서열은 소위 SOSIP 돌연변이, 즉 위치 501 및 605에 Cys, 및 위치 559에 Pro를 추가로 포함하고, 소정의 실시 형태에서는 소위 SOSIP 돌연변이 및 푸린 절단 부위에서의 돌연변이, 예컨대, 서열 번호 6에 의한 위치 508 내지 511에서의 대체를 추가로 포함한다. 특정 실시 형태에서, HIV Env 골격 단백질은 서열 번호 3에 나타낸 서열, 또는 이와 95% 이상 동일한 서열을 포함하며, 여기서 위치 501, 559, 605, 및 서열 번호 6에 의해 대체된 바와 같은 508 내지 511에서의 아미노산은 서열 번호 3과 비교하여 돌연변이화되지 않는다.
다른 특정 실시 형태에서, HIV Env 골격 단백질은 서열 번호 4의 아미노산 서열과 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 아미노산 서열을 포함하는 HIV Env 공통 계통군 B이다. 소정의 실시 형태에서, 서열 번호 4의 HIV 공통 계통군 B 서열은 소위 SOSIP 돌연변이, 즉 위치 501 및 605에 Cys, 및 위치 559에 Pro를 추가로 포함하고, 소정의 실시 형태에서는 소위 SOSIP 돌연변이 및 푸린 절단 부위에서의 돌연변이, 예컨대, 서열 번호 6에 의한 위치 508 내지 511에서의 대체를 추가로 포함한다. 특정 실시 형태에서, HIV Env 골격 단백질은 서열 번호 5에 나타낸 서열, 또는 이와 95% 이상 동일한 서열을 포함하며, 여기서 위치 501, 559, 605, 및 서열 번호 6에 의해 대체된 바와 같은 508 내지 511에서의 아미노산은 서열 번호 5와 비교하여 돌연변이화되지 않는다.
또 다른 특정 실시 형태에서, HIV Env 골격 단백질은 합성 HIV Env 단백질이며, 이는 임의로 상기 기재된 바와 같이 추가의 SOSIP(501C, 605C, 559P) 및/또는 푸린 절단 부위 돌연변이(508 내지 511 RRRRRR)를 가질 수 있다.
또 다른 특정 실시 형태에서, HIV Env 골격 단백질은 WO 2018/050747호 및 WO 2019/016062에 기재된 방법에 따라 서열을 복구 및/또는 안정화하기 위한 부가적인 돌연변이를 임의로 포함하는, 야생형 계통군 A, 계통군 B, 또는 계통군 C HIV 바이러스로부터의 HIV Env 단백질이다.
본 발명의 소정의 실시 형태에서, 본 발명에 따른 재조합 HIV Env 단백질(즉, 위치 650에 Trp, Phe, Met, 또는 Leu, 및 임의로 상기 표 1의 위치 (i) 내지 (viii) 에 하나 이상의 표시된 아미노산을 가짐)은 표 1의 위치 (ix) 내지 (xvi)로 이루어진 군으로부터 선택된 하나 이상의 부가적인 표시된 위치에 표시된 아미노산 잔기를 추가로 포함할 수 있다(예를 들어, 치환을 통함). 아미노산 치환은 이전에, 예를 들어 WO 2019/016062호에 기재되었다. 이들 아미노산 치환(예를 들어, (ix)) 중 소정의 것은 돌연변이 (i) 내지 (viii)과 매우 양호하게 조합되는 것으로 밝혀졌다(예를 들어 WO 2019/016062호 참조). 그러나, 본 발명자들의 지식의 범위 내에서, 이전에 기재된 이들 돌연변이는 본 명세서에 기재된 신규 치환, 즉, 위치 650에서의 Trp, Phe, Met, 또는 Leu와 조합되어 기재되지 않았다. 본 발명의 아미노산 치환과 조합된 이들 아미노산 돌연변이는 삼량체 수율 및/또는 삼량체 형성의 백분율을 추가로 증가시킬 수 있다. 이들 아미노산 치환은 위치 650에서의 Trp, Phe, Met, 또는 Leu 아미노산 잔기에 의한 치환, 및 임의로 표 1에 기재된 바와 같이 표시된 위치 중 하나 이상에 표시된 아미노산 잔기에 의한 추가의 치환 및/또는 위치 108 및/또는 538에 His를 갖는 것에 더하여 본 명세서에 기재된 임의의 재조합 HIV Env 단백질에 도입될 수 있다. 본 발명에서 식별된 치환[위치 650에서의 W, F, M, 또는 L; 및 마찬가지로, 위치 538에서의 H에 대해, 그리고 위치 108에서의 H에 대해]은, 본 발명자들의 지식의 범위 내에서, 천연(군 M, 즉, 전체) HIV Env 서열 내에 존재하지 않고, 이전에 보고된 HIV Env 단백질 서열에서 표 1의 치환 (i) 내지 (xx) 중 임의의 것과 조합하여 발견되지 않고, HIV Env 단백질의 개선된 삼량체화, 개선된 삼량체 수율, 및/또는 증가된 삼량체 안정성을 유발하는 것으로 이전에 제안되지 않았다. 명백히, 이전에 기재된 돌연변이는, 예를 들어 항체 PGT145 결합에 의해 측정되는 바와 같이 폐쇄된 첨부를 갖는 삼량체 형성에 대한 의외의 효과는 물론이고, 본 발명의 돌연변이의 도입에 대한 어떠한 제안도 제공하지 않았다. 표 1의 점 돌연변이 (ix) 내지 (xiii) 외에도, Env 단백질의 HR1 루프(HXB2 단리물의 gp160에 따른 넘버링으로 야생형 서열에서 아미노산 잔기 548 내지 568)를, 예를 들어 (서열 번호 9 내지 14) 중 어느 하나로부터 선택된 서열을 갖는 7 내지 10개의 아미노산을 갖는 더 짧고 덜 가요성인 루프, 바람직하게는 8개의 아미노산의 루프에 의해 대체하는 것이 또한 가능하며, 예를 들어, HR1 루프를 대체하는 그러한 더 짧은 루프를 기재하는 문헌[Kong et al., Nat Commun. 2016 Jun 28;7:12040. doi: 10.1038/ncomms12040]을 참조한다. 위치 650에 Trp, Phe, Met, 또는 Leu 아미노산 잔기, 및 임의로 표시된 위치 (i) 내지 (viii) 중 하나 이상에 표시된 아미노산 잔기를 추가로 갖는 그러한 Env 변이체는 또한 본 발명의 실시 형태이다. (ix) 내지 (xiv)에 열거된 돌연변이는 본 발명의 소정의 실시 형태에서, 즉, 위치 650에 Trp, Phe, Met, 또는 Leu를 갖는, 본 발명의 HIV Env 단백질에 첨가될 수 있다. 추가의 실시 형태에서, 이들은 위치 (i) 내지 (viii)에서의 표시된 아미노산 중 하나 이상으로의 돌연변이와 조합될 수 있다. 또한, 군 (ix) 내지 (xiv) 내의 조합이 이루어질 수 있다.
다시, 이들 실시 형태 중 임의의 것은 임의의 HIV Env 단백질, 예를 들어 야생형 단리물, 공통 Env, 합성 Env 단백질, SOSIP 돌연변이체 Env 단백질 등 내에 있을 수 있다.
소정의 실시 형태에서, HIV Env 단백질은 서열 번호 2 내지 5 중 어느 하나와 95% 이상 동일한, 예를 들어 96%, 97%, 98%, 99% 이상 동일한, 또는 100% 동일한 서열을 포함한다. % 동일성의 결정에 대해, 바람직하게는 위치 650, 바람직하게는 또한 표 1의 위치 (i) 내지 (xvi), 바람직하게는 또한 위치 108, 501, 538, 559, 및 605가 고려되지 않는다. 위치 650에서의 Trp, Phe, Met, 또는 Leu, 바람직하게는 Trp 또는 Phe가 Env 단백질의 삼량체 백분율 및 삼량체 수율을 증가시킨 것으로 밝혀졌다.
본 발명의 실시 형태에 따라, 재조합 HIV Env 단백질은, 추가로 동일하면서 위치 650에 Trp, Phe, Met, 또는 Leu를 갖지 않는 HIV Env 단백질과 비교하여(바람직하게는, 추가로 동일하면서 위치 650에 Gln을 갖는 HIV Env 단백질과 비교하여), (a) 삼량체 형성의 개선된 백분율, 및 (b) 개선된 삼량체 수율 중 하나 이상을 갖는다.
본 명세서에 사용되는 바와 같이, "삼량체 형성의 개선된 백분율"은, HIV 외피 서열의 골격 서열이 위치 650에 Gln 잔기를 함유할 때 형성되는 삼량체의 백분율과 비교하여(Gln은 HIV-1 Env의 천연 계통군 C 변이체의 대부분에서 이 위치에 존재하는 아미노산임), HIV 외피 단백질의 골격 서열이 위치 650에 Trp, Phe, Met, 또는 Leu, 바람직하게는 Trp 또는 Phe를 함유할 때 더 큰 백분율의 삼량체가 형성됨을 의미한다. 더욱 일반적으로, "삼량체 형성의 개선된 백분율"은, HIV 외피 단백질의 골격 서열이 위치 650에서의 아미노산의 Trp, Phe, Met, 또는 Leu, 바람직하게는 Trp 또는 Phe로의 치환, 및 임의로 표 1에 기재된 아미노산 치환 중 하나 이상을 함유할 때, HIV 외피 서열의 골격 서열이 그러한 아미노산 치환을 함유하지 않을 때 형성되는 삼량체의 백분율과 비교하여, 더 큰 백분율의 삼량체가 형성됨을 의미한다. 본 명세서에 사용되는 바와 같이, "개선된 삼량체 수율"은, HIV 외피 서열의 골격 서열이 위치 650에 Gln 잔기를 함유할 때 얻어지는 외피 단백질의 삼량체 형태의 총량과 비교하여, HIV 외피 단백질의 골격 서열이 위치 650에 Trp, Phe, Met, 또는 Leu, 바람직하게는 Trp 또는 Phe를 함유할 때 외피 단백질의 삼량체 형태의 더 많은 총량이 얻어짐을 의미한다. 더욱 일반적으로, "개선된 삼량체 수율"은, HIV 외피 단백질의 골격 서열이 표 1에 기재된 아미노산 치환 중 하나 이상을 함유할 때, HIV 외피 서열의 골격 서열이 그러한 아미노산 치환을 함유하지 않을 때 얻어지는 외피 단백질의 삼량체 형태의 총량과 비교하여, 외피 단백질의 삼량체 형태의 더 많은 총량이 얻어짐을 의미한다.
삼량체 형성은 HIV Env 단백질의 삼량체 형태에 특이적으로 결합하는 항체를 사용하는 항체 결합 검정에 의해 측정될 수 있다. 삼량체 형태를 검출하기 위해 사용될 수 있는 삼량체 특이적 항체의 예는 단일클론 항체(mAb) PGT145, PGDM1400, PG16, 및 PGT151을 포함하지만 이로 제한되지 않는다. 바람직하게는, 삼량체 특이적 항체는 mAb PGT145이다. 본 개시내용을 고려하여 당업계에 알려진 임의의 항체 결합 검정, 예컨대 ELISA, AlphaLISA 등을 사용하여, 본 발명의 재조합 HIV Env 단백질의 삼량체 형성의 백분율을 측정할 수 있다.
특정 실시 형태에서, 삼량체 형성은 AlphaLISA에 의해 측정된다. AlphaLISA는 공여자 비드의 고에너지 조사에 의해 생성되는 단일항 산소 분자가 공여자 비드에 대해 대략 200 nm의 거리 이내에 있는 수용자 비드로 전달되는 비드-기반 근접 검정이다. 수용자 비드에 대한 단일항 산소 분자의 전달은 화학 반응의 캐스케이딩 시리즈(cascading series)를 개시하여, 이어서 검출될 수 있는 화학발광 신호를 유발한다(문헌[Eglen et al. Curr. Chem. Genomics, 2008, 25(1): 2-10]). 예를 들어, 플래그-His 태그로 표지된 재조합 HIV 외피 단백질을 삼량체 특이적 mAb, 삼량체 특이적 mAb에 결합하는 항체에 접합된 공여자 비드, 니켈-접합된 공여자 비드, 항-His 항체에 접합된 수용자 비드, 및 항-플래그 항체에 접합된 수용자 비드와 함께 인큐베이션할 수 있다. 형성된 삼량체의 양은 삼량체 특이적 mAb에 결합하는 항체에 접합된 공여자 비드의 쌍으로부터 생성되는 화학발광 신호 및 항-His 항체에 접합된 수용자 비드를 측정함으로써 결정될 수 있다. 발현된 HIV 외피 단백질의 총량은 니켈-접합된 공여자 비드 및 항-플래그-접합된 수용자 비드의 쌍으로부터 생성된 화학발광 신호를 측정함으로써 결정될 수 있다. 예를 들어, 삼량체 및 발현된 총 외피 단백질의 양은 WO 2019/016062호의 실시예 3에 상세히 기재된 바와 같이 AlphaLISA 검정에 의해 측정될 수 있다. 삼량체 형성의 백분율은 형성된 삼량체의 양을 발현된 외피 단백질의 총량으로 나눔으로써 계산할 수 있다. 소정의 실시 형태에서, 삼량체 형성은 광범위한 중화 HIV Env 결합 항체 PGT145, PGDM1400, 또는 둘 모두에 대한 결합에 의해 측정되고, 본 발명의 돌연변이를 갖지 않는 모 분자에 대한 그러한 결합에 대해 동일한 조건 하에(예를 들어, AlphaLISA에서) 비교된다(그러한 항체 각각은 이전에 기재된 바와 같이(예를 들어, 보충 정보를 포함하는 문헌[Lee et al, 2017, Immunity 46: 690-702] 참조) 당업자에게 이용가능하고, NIH AIDS 시약 프로그램과 같은 다양한 공급원으로부터, 또는 Creative Biolabs로부터 이용가능하거나, 이들의 알려진 서열에 기초하여 재조합적으로 생성될 수 있으며; 본 명세서에 기재된 다른 유용한 항체는 또한 선행 기술로부터 알려져 있고 유사한 수단에 의해 얻어질 수 있다). 소정의 실시 형태에서, 항체 PGT145 및/또는 PGDM1400에 대한 결합은 본 발명의 HIV Env 단백질의 경우에 HIV Env 모 단백질과 비교하여 증가되고, 소정의 실시 형태에서, 비-광범위한 중화 항체 17b에 대한 결합은 본 발명의 HIV Env 단백질의 경우에 HIV Env 모 단백질과 비교하여 대략 동일하거나 바람직하게는 감소된다.
형성된 삼량체의 양 및 발현된 외피 단백질의 총량은 또한 다른 형태의 HIV 외피 단백질, 예를 들어 단량체 형태로부터 삼량체 형태를 분리할 수 있는 크로마토그래피 기술을 사용하여 결정할 수 있다. 사용될 수 있는 그러한 기술의 예는 크기 배제 크로마토그래피(SEC), 예를 들어 분석용 SEC, 또는 SEC 다중-각도 광 산란(SEC-MALS)을 포함하지만 이로 제한되지 않는다. 소정의 실시 형태에 따라, 삼량체 형성의 백분율은 SEC-MALS 또는 (분석용) SEC를 사용하여 결정한다. 소정의 실시 형태에 따라, 삼량체 수율은 SEC-MALS 또는 (분석용) SEC를 사용하여 결정한다.
소정의 실시 형태에서, 본 발명은 또한 HIV Env 단백질의 삼량체 형성을 개선하기 위한 방법으로서, 모 HIV Env 단백질의 위치 650(전형적으로 Gln)에서의 잔기를 Trp, Phe, Met, 또는 Leu로, 바람직하게는 Trp 또는 Phe로 치환하는 단계를 포함하는 방법을 제공한다. 이는 예를 들어 표준 분자 생물학 기술을 사용하여 실행할 수 있다.
핵산, 벡터, 및 세포
다른 일반적인 태양에서, 본 발명은 본 발명에 따른 재조합 HIV Env 단백질을 인코딩하는 핵산 분자, 및 핵산 분자를 포함하는 벡터를 제공한다. 본 발명의 핵산 분자는 클로닝에 의해 얻어지거나 합성적으로 생성된 DNA 형태 또는 RNA 형태일 수 있다. DNA는 이중-가닥 또는 단일-가닥일 수 있다. DNA는 예를 들어 cDNA, 게놈 DNA, 또는 이들의 조합을 포함할 수 있다. 핵산 분자 및 벡터는 재조합 단백질 생성, 숙주 세포에서의 단백질의 발현, 또는 바이러스 입자의 생성에 사용될 수 있다.
소정의 실시 형태에서, 본 발명에 따른 단백질을 인코딩하는 핵산 분자는 포유류 세포, 바람직하게는 인간 세포, 또는 곤충 세포에서의 발현을 위해 코돈-최적화된다. 코돈-최적화 방법은 이전에 알려지고 기재되어 있다(예를 들어 포유류 세포에 대한 WO 96/09378호). 서열은 야생형 서열과 비교하여 적어도 하나의 바람직하지 않은 코돈이 더 바람직한 코돈으로 대체된 경우 코돈-최적화된 것으로 간주된다. 본 명세서에서, 바람직하지 않은 코돈은 동일한 아미노산을 코딩하는 다른 코돈보다 유기체에서 덜 빈번하게 사용되는 코돈이며, 더 바람직한 코돈은 바람직하지 않은 코돈보다 유기체에서 더 빈번하게 사용되는 코돈이다. 특이적 유기체에 대한 코돈 사용의 빈도는, http://www.kazusa.or.jp/codon과 같은 코돈 빈도 표에서 찾을 수 있다. 바람직하게는, 하나 초과의 바람직하지 않은 코돈, 바람직하게는 대부분의 바람직하지 않은 코돈 또는 모든 바람직하지 않은 코돈이 더 바람직한 코돈으로 대체된다. 바람직하게는, 유기체에서 가장 빈번하게 사용되는 코돈은 코돈-최적화된 서열에 사용된다. 바람직한 코돈에 의한 대체는 일반적으로 더 높은 발현을 야기한다.
유전자 코드의 축퇴의 결과로서 다수의 상이한 폴리뉴클레오티드 및 핵산 분자가 동일한 단백질을 인코딩할 수 있다는 것이 당업자에 의해 이해될 것이다. 또한, 당업자는 통상적인 기술을 사용하여, 단백질이 발현되는 임의의 특정 숙주 생물의 코돈 사용을 반영하는 핵산 분자에 의해 암호화되는 단백질 서열에 영향을 주지 않는 뉴클레오티드 치환을 이룰 수 있음이 이해된다. 따라서, 달리 명시되지 않는 한, "아미노산 서열을 인코딩하는 뉴클레오티드 서열"은 서로의 축퇴 버전이고 동일한 아미노산 서열을 인코딩하는 모든 뉴클레오티드 서열을 포함한다. 단백질 및 RNA를 암호화하는 뉴클레오티드 서열은 인트론(intron)을 포함할 수 있거나 포함하지 않을 수도 있다.
핵산 서열은 일상적인 분자 생물학 기술을 사용하여 클로닝될 수 있거나, DNA 합성에 의해 신생 생성될 수 있으며, 이는 DNA 및/또는 RNA 합성 및/또는 분자 클로닝의 분야에서 사업을 하는 서비스 회사에 의해 통상적인 절차를 사용하여 수행될 수 있다.
본 발명의 재조합 HIV Env 단백질을 인코딩하는 핵산은, 예를 들어 또한 mRNA의 형태일 수 있다. 예를 들어 세포 배양에서뿐만 아니라, 예를 들어 리포좀 또는 지질 나노입자와 같은 약물 전달 비히클 내의 mRNA를 투여하는 단계에 의한 백신접종을 통해, 그러한 mRNA를 직접 사용하여 Env 단백질을 생성할 수 있다. 핵산 또는 mRNA는 또한, 예를 들어 알파바이러스와 같은 양성-센스 RNA 바이러스의 자가-복제 기전에 기초하는 자가-증폭 RNA 또는 자가-복제 RNA의 형태일 수 있다. 그러한 자가-복제 RNA(또는 repRNA 또는 RNA 레플리콘)는 자손 바이러스를 생성하지 않으면서, 세포에서 그 자신의 복제 증폭을 지향시킬 수 있도록 알파바이러스 비구조 단백질 유전자를 발현하는 RNA 분자의 형태일 수 있다. 예를 들어, repRNA는 5' 및 3' 알파바이러스 복제 인식 서열, 알파바이러스 비구조 단백질에 대한 코딩 서열, 항원을 인코딩하는 이종성 유전자, 예컨대 본 발명의 HIV Env 단백질, 및 항원을 발현하기 위한 수단, 및 폴리아데닐화 지역을 포함할 수 있다. 그러한 repRNA는 숙주 내에서 넓은 범위의 조직에서 일시적인 고수준 항원 발현을 유도하며, 분열하는 세포 및 분열하지 않는 세포 둘 모두에 작용할 수 있다. RepRNA는 DNA 분자로서 세포에 전달될 수 있으며, 이로부터 repRNA는 바이러스 레플리콘 입자(VRP) 내에 패키징되거나, 변형되거나 변형되지 않은 네이키드 RNA 분자로서 론칭된다. 소정의 실시 형태에서, mRNA는 뉴클레오시드-변형될 수 있으며, 예를 들어, mRNA 또는 복제 RNA는 US2011/0300205호에 기재된 것들과 같이 변형된 핵염기를 함유할 수 있다. repRNA의 비-제한적인 예는 WO 2019/023566에서 찾을 수 있다. 비-제한적인 실시 형태에서, mRNA 백신 및 자가-증폭 RNA 백신은 예를 들어 문헌[Pardi et al, 2018, Nature Reviews Drug Discovery 17: 261-279] 및 문헌[Zhang et al, 2019, Front. Immunol. 10: 594]에 기재된 바와 같은 백신 포맷 및 변형을 포함할 수 있다.
본 발명의 실시 형태에 따라, 재조합 HIV 외피 단백질을 인코딩하는 핵산은 프로모터에 작동가능하게 연결되며, 이는 핵산이 프로모터의 제어 하에 있음을 의미한다. 프로모터는 상동성 프로모터(즉, 벡터와 동일한 유전자 공급원으로부터 유래됨) 또는 이종성 프로모터(즉, 상이한 벡터 또는 유전자 공급원으로부터 유래됨)일 수 있다. 적합한 프로모터의 비-제한적인 예는 인간 사이토메갈로바이러스 즉시 초기(hCMV IE, 또는 약칭하여 "CMV") 프로모터 및 라우스 육종 바이러스(RSV) 프로모터를 포함한다. 바람직하게는, 프로모터는 발현 카세트 내에서 핵산의 상류에 위치한다.
본 발명에 따른 핵산은 벡터에 혼입될 수 있다. 소정의 실시 형태에서, 벡터는 DNA 및/또는 RNA를 포함한다. 본 발명의 실시 형태에 따라, 벡터는 발현 벡터일 수 있다. 발현 벡터는 재조합 단백질 발현을 위한 벡터 및 대상체의 조직 내에서의 발현을 위해 대상체 내로의 핵산의 전달을 위한 벡터, 예컨대 바이러스 벡터를 포함하지만 이로 제한되지 않는다. 본 발명과 함께 사용하기에 적합한 바이러스 벡터의 예는 아데노바이러스 벡터, 아데노-관련 바이러스 벡터, 폭스 바이러스 벡터, 변형된 백시니아 앙카라(MVA: Modified Vaccinia Ankara) 벡터, 장관계 바이러스 벡터, 베네수엘라 말 뇌염 바이러스 벡터, 셈리키 삼림 바이러스 벡터, 담배 모자이크 바이러스 벡터, 렌티바이러스 벡터, 알파바이러스 벡터 등을 포함하지만, 이로 제한되지 않는다. 벡터는 또한 비-바이러스 벡터일 수 있다. 비-바이러스 벡터의 예에는 플라스미드, 세균 인공 염색체, 효모 인공 염색체, 박테리오파지 등이 포함되지만 이로 한정되지 않는다.
본 발명의 소정의 실시 형태에서, 벡터는 아데노바이러스 벡터, 예를 들어, 재조합 아데노바이러스 벡터이다. 재조합 아데노바이러스 벡터는, 예를 들어, 인간 아데노바이러스(HAdV 또는 AdHu), 또는 침팬지 또는 고릴라 아데노바이러스와 같은 유인원 아데노바이러스(ChAd, AdCh, 또는 SAdV), 또는 레서스 아데노바이러스(rhAd)로부터 유래될 수 있다. 바람직하게는, 아데노바이러스 벡터는 재조합 인간 아데노바이러스 벡터, 예를 들어 재조합 인간 아데노바이러스 혈청형 26, 또는 재조합 인간 아데노바이러스 혈청형 5, 4, 35, 7, 48 등 중 어느 하나이다. 다른 실시 형태에서, 아데노바이러스 벡터는 rhAd 벡터, 예를 들어 rhAd51, rhAd52, 또는 rhAd53이다. 다른 실시 형태에서, 재조합 아데노바이러스는 ChAdOx 1(예를 들어, WO 2012/172277호 참조), 또는 ChAdOx 2(예를 들어, WO 2018/215766호 참조), 또는 BZ28(예를 들어, WO 2019/086466호 참조)과 같은 침팬지 아데노바이러스에 기초한다. 다른 실시 형태에서, 재조합 아데노바이러스는 BLY6(예를 들어, WO 2019/086456호 참조)과 같은 고릴라 아데노바이러스, 또는 BZ1(예를 들어, WO 2019/086466호 참조)에 기초한다.
재조합 아데노바이러스 벡터의 제조는 당업계에 잘 알려져 있다. 예를 들어, 재조합 아데노바이러스 26 벡터의 제조는, 예를 들어, WO 2007/104792호 및 문헌[Abbink et al., (2007) Virol. 81(9): 4654-63]에 기재되어 있다. 아데노바이러스 26의 예시적인 게놈 서열은 GenBank 수탁번호 EF 153474 및 WO 2007/104792호의 서열 번호 1에서 발견된다. rhAd51, rhAd52, 및 rhAd53에 대한 예시적인 게놈 서열은 US 2015/0291935호에 제공된다.
본 발명의 실시 형태에 따라, 본 명세서에 기재된 재조합 HIV Env 단백질 중 임의의 것은 본 명세서에 기재된 벡터 중 임의의 것에 의해 발현 및/또는 인코딩될 수 있다. 유전자 코드의 축퇴를 고려하여, 당업자는 당업계에서 완전히 일상적인 방법에 따라 동일한 단백질을 인코딩하는 몇몇 핵산 서열이 설계될 수 있음을 잘 알고 있다. 본 발명의 재조합 HIV Env 단백질을 인코딩하는 핵산은 숙주 세포(예를 들어, 박테리아 또는 포유류 세포)에서의 적절한 발현을 보장하기 위해 임의로 코돈-최적화될 수 있다. 코돈-최적화는 당업계에 널리 적용되는 기술이다.
본 발명은 또한 본 명세서에 기재된 핵산 분자 및 벡터 중 임의의 것을 포함하는 세포, 바람직하게는 단리된 세포를 제공한다. 세포는 예를 들어 재조합 단백질 생성을 위해, 또는 바이러스 입자의 생성을 위해 사용될 수 있다.
따라서, 본 발명의 실시 형태는 또한 재조합 HIV Env 단백질의 제조 방법에 관한 것이다. 본 방법은 프로모터에 작동가능하게 연결된 본 발명의 실시 형태에 따른 재조합 HIV Env 단백질을 인코딩하는 핵산을 포함하는 발현 벡터로 숙주 세포를 형질감염시키는 단계, 형질감염된 세포를 재조합 HIV Env 단백질의 발현에 적합한 조건 하에 성장시키는 단계, 및 임의로 세포에서 발현된 재조합 HIV Env 단백질을 정제 또는 단리하는 단계를 포함한다. 재조합 HIV Env 단백질은 친화도 크로마토그래피, 크기 배제 크로마토그래피 등을 포함하는 당업계에 알려진 임의의 방법에 의해 세포로부터 단리 또는 수집될 수 있다. 재조합 단백질 발현에 사용되는 기술은 본 개시내용을 고려하여 당업자에게 잘 알려져 있을 것이다. 발현된 재조합 HIV Env 단백질은 또한, 예를 들어, 재조합 HIV Env 단백질을 인코딩하는 발현 벡터로 형질감염되고 HIV Env 단백질의 발현에 적합한 조건 하에 성장시킨 세포의 상청액을 분석함으로써, 발현된 단백질을 정제 또는 단리하지 않고 연구할 수 있다.
바람직한 실시 형태에서, 발현된 재조합 HIV Env 단백질은 안정화된 삼량체성 복합체를 형성하도록 단백질의 회합을 허용하는 조건 하에 정제된다. 예를 들어, 프로모터(예를 들어, CMV 프로모터)에 작동가능하게 연결된 재조합 HIV Env 단백질을 인코딩하는 발현 벡터로 형질감염된 포유류 세포를 33 내지 39℃, 예를 들어 37℃, 및 2 내지 12% CO2, 예를 들어 8% CO2에서 배양할 수 있다. 발현은 또한 당업계에서 모두 통상적인 곤충 세포 또는 효모 세포와 같은 대안적인 발현 시스템에서 수행될 수 있다. 이어서, 발현된 HIV Env 단백질을, 예를 들어 당단백질에 결합하는 렉틴 친화도 크로마토그래피에 의해 세포 배양물로부터 단리할 수 있다. 컬럼에 결합된 HIV Env 단백질은 만노피라노사이드로 용리시킬 수 있다. 컬럼으로부터 용리된 HIV Env 단백질에 필요에 따라 크기 배제 크로마토그래피와 같은 추가의 정제 단계를 적용하여, 임의의 잔류 오염물, 예를 들어 세포 오염물뿐만 아니라, Env 응집체, gp140 단량체, 및 gp120 단량체를 제거할 수 있다. 비-제한적인 예로서 항체 친화도 크로마토그래피, 비-bNAb를 이용한 음성 선택, 항-태그 정제, 또는 이온 교환 크로마토그래피 등과 같은 다른 크로마토그래피 방법뿐만 아니라, 당업계에 알려진 다른 방법을 포함하는 대안적인 정제 방법을 또한 사용하여 발현된 HIV Env 단백질을 단리할 수 있을 것이다.
본 발명의 재조합 HIV Env 단백질을 인코딩하는 핵산 분자 및 발현 벡터는 본 개시내용을 고려하여 당업계에 알려진 임의의 방법에 의해 제조될 수 있다. 예를 들어, 재조합 HIV Env 단백질을 인코딩하는 핵산은 유전 공학 기술 및 분자 생물학 기술, 예를 들어, 당업자에게 잘 알려진 부위 지정 돌연변이유발, 중합효소 연쇄 반응(PCR) 등을 사용하여 표시된 위치에서 하나 이상의 아미노산 치환을 인코딩하는 돌연변이를 골격 HIV 외피 서열 내로 도입함으로써 제조할 수 있다. 이어서, 또한 표준 분자 생물학 기술을 사용하여 핵산 분자를 발현 벡터 내로 도입 또는 "클로닝"할 수 있다. 이어서, 재조합 HIV 외피 단백질은 숙주 세포에서 발현 벡터로부터 발현될 수 있고, 발현된 단백질은 본 개시내용을 고려하여 당업계에 알려진 임의의 방법에 의해 세포 배양물로부터 정제될 수 있다.
삼량체성 복합체
다른 일반적인 태양에서, 본 발명은 본 발명에 따른 재조합 HIV Env 단백질 중 3개의 비공유 올리고머를 포함하는 삼량체성 복합체에 관한 것이다. 삼량체성 복합체는 본 명세서에 기재된 재조합 HIV Env 단백질 중 임의의 것을 포함할 수 있다. 바람직하게는 삼량체성 복합체는 본 발명에 따른 재조합 HIV Env 단백질의 3개의 동일한 단량체(또는 gp140이 절단되는 경우에 동일한 이종이량체)를 포함한다. 삼량체성 복합체는 단량체 형태와 같은 다른 형태의 HIV 외피 단백질로부터 분리될 수 있거나, 삼량체성 복합체는 단량체 형태와 같은 다른 형태의 HIV 외피 단백질과 함께 존재할 수 있다.
조성물 및 방법
다른 일반적인 태양에서, 본 발명은 재조합 HIV Env 단백질, 삼량체성 복합체, 단리된 핵산, 벡터, 또는 숙주 세포, 및 약제학적으로 허용가능한 담체를 포함하는 조성물에 관한 것이다. 조성물은 본 명세서에 기재된 재조합 HIV Env 단백질, 삼량체성 복합체, 단리된 핵산 분자, 벡터, 또는 숙주 세포 중 임의의 것을 포함할 수 있다.
담체는 하나 이상의 약제학적으로 허용가능한 부형제, 예컨대 결합제, 붕해제, 팽윤제, 현탁화제, 유화제, 습윤제, 윤활제, 향미제, 감미제, 방부제, 염료, 가용화제, 및 코팅을 포함할 수 있다. 담체 또는 다른 재료의 정확한 성질은 투여 경로, 예를 들어 근육내, 피내, 피하, 경구, 정맥내, 피부, 점막내(예를 들어, 장), 비강내, 또는 복막내 경로에 의존할 수 있다. 액체 주사용 제제, 예를 들어, 현탁액 및 용액의 경우, 적합한 담체 및 첨가제는 물, 글리콜, 오일, 알코올, 방부제, 착색제 등을 포함한다. 고체 경구 제제, 예를 들어, 분말, 캡슐, 당의정, 젤라틴 캡슐, 및 정제의 경우, 적합한 담체 및 첨가제는 전분, 당, 희석제, 과립화제, 윤활제, 결합제, 붕해제 등을 포함한다. 비강 분무/흡입제 혼합물의 경우, 수성 용액/현탁액은 적합한 담체 및 첨가제로서 물, 글리콜, 오일, 연화제, 안정화제, 습윤제, 방부제, 향료, 향미제 등을 포함할 수 있다.
본 발명의 조성물은, 경구(경장) 투여 및 비경구 주사를 포함하지만 이로 제한되지 않는, 투여를 용이하게 하고 효능을 개선하기 위해 대상체에게 투여하기에 적합한 임의의 물질 중에 제형화될 수 있다. 비경구 주사는 정맥내 주사 또는 주입, 피하 주사, 피내 주사, 및 근육내 주사를 포함한다. 본 발명의 조성물은 또한, 경점막, 안구, 직장, 장기 작용 이식, 구강 점막으로부터 문맥 순환을 우회하는 혀 아래의, 설하 투여, 흡입, 또는 비내를 포함하는 다른 투여 경로를 위해 제형화될 수 있다.
본 발명의 실시 형태는 또한 조성물의 제조 방법에 관한 것이다. 본 발명의 실시 형태에 따라, 조성물의 제조 방법은 본 발명의 재조합 HIV Env 단백질, 삼량체성 복합체, 단리된 핵산, 벡터, 또는 숙주 세포를 하나 이상의 약제학적으로 허용가능한 담체와 혼합하는 단계를 포함한다. 당업자는 그러한 조성물을 제조하기 위해 사용되는 통상적인 기술에 익숙할 것이다.
HIV 항원(예를 들어, HIV gag, pol, 및/또는 env 유전자 생성물로부터 유래된 단백질 또는 이의 단편), 및 HIV 항원을 발현하는 바이러스 벡터와 같은 벡터는, HIV 감염에 대해 대상체를 백신접종하거나 대상체에서 HIV 감염에 대한 면역 반응을 생성하기 위한 면역원성 조성물 및 백신에 이전에 사용되어 왔다. 본 명세서에 사용되는 바와 같이, "대상체"는 본 발명의 실시 형태에 따른 면역원성 조성물이 투여될 것이거나 투여된 임의의 동물, 바람직하게는 포유류, 가장 바람직하게는 인간을 의미한다. 본원에 사용된 바와 같은 용어 "포유동물"은 임의의 포유동물을 포괄한다. 포유류의 예는 마우스, 래트, 토끼, 기니 피그, 원숭이, 인간 등, 바람직하게는 인간을 포함하지만 이로 제한되지 않는다. 본 발명의 재조합 HIV Env 단백질은 또한, 이를 필요로 하는 대상체에서 인간 면역결핍 바이러스(HIV)에 대한 면역 반응을 유도하기 위한 항원으로서 사용될 수 있다. 면역 반응은 계통군 A, 계통군 B, 계통군 C 등과 같은 하나 이상의 HIV 계통군에 대한 것일 수 있다. 조성물은 재조합 HIV Env 단백질이 발현되는 벡터를 포함할 수 있거나, 조성물은 본 발명의 실시 형태에 따라 단리된 재조합 HIV Env 단백질을 포함할 수 있다.
예를 들어, 대상체에서 HIV 감염에 대한 면역 반응을 유도하기 위해 재조합 HIV 단백질 또는 이의 삼량체성 복합체를 포함하는 조성물을 이를 필요로 하는 대상체에게 투여할 수 있다. 재조합 HIV Env 단백질이 벡터에 의해 발현되는, 본 발명의 재조합 HIV Env 단백질을 인코딩하는 아데노바이러스 벡터와 같은 벡터를 포함하는 조성물은, 대상체에서 HIV 감염에 대한 면역 반응을 유도하기 위해 이를 필요로 하는 대상체에게 또한 투여될 수 있다. 면역 반응을 프라이밍 및 부스팅하는 방법을 포함하는, 본 명세서에 기재된 방법은 또한, 바람직하게는 아데노바이러스 벡터 또는 MVA 벡터와 같은 하나 이상의 벡터로부터 발현되는 하나 이상의 부가적인 HIV 항원(예를 들어, HIV gag, pol, 및/또는env 유전자 생성물로부터 유래된 단백질 또는 이의 단편)과 조합하여 본 발명의 조성물을 투여하는 단계를 포함한다.
소정의 실시 형태에서, HIV Env 단백질은, 임의로 내인성 및/또는 외인성 보조제와 조합하여, 리포좀, 바이러스-유사 입자(VLP), 나노입자, 바이로좀, 또는 엑소좀과 같은 입자 상에 디스플레이될 수 있다. 그 자신 상의 가용성 또는 단량체성 Env 단백질과 비교할 때, 그러한 입자는 전형적으로 생체내에서 항원 제시의 향상된 효능을 나타낸다.
HIV Env 단백질을 디스플레이하는 VLP의 예는, 예를 들어 HIV Env 단백질을 자가-조립 바이러스 단백질, 예컨대 HIV Gag 코어 또는 다른 레트로바이러스 Gag 단백질과 공동-발현시킴으로써 제조할 수 있다. VLP는 바이러스와 유사하지만, 이들은 바이러스 유전 물질을 함유하지 않기 때문에 비-감염성이다. 외피 또는 캡시드와 같은 바이러스 구조 단백질의 발현은 VLP의 자가-조립을 유발할 수 있다. VLP는 당업자에게 잘 알려져 있으며, 백신에서의 이들의 사용은 예를 들어 문헌[Kushnir et al, 2012]에 기재되어 있다.
소정의 바람직한 실시 형태에서, 입자는 리포좀이다. 리포좀은 하나 이상의 지질 이중층을 갖는 구형 소포이다. 예를 들어 HIV Env 삼량체의 C-말단에 His-태그를 첨가하고 Ni2+ 또는 Co2+와 같은 2가 킬레이트화 원자를 리포좀 내의 유도체화된 지질의 헤드 기에 혼입함으로써, HIV Env 삼량체 단백질을 예를 들어 정전기적 상호작용에 의해 그러한 리포좀에 비-공유적으로 커플링할 수 있다. 소정의 비-제한적이고 예시적인 실시 형태에서, 리포좀은 1,2-다이스테아로일-sn-글리세로-3-포스포콜린(DSPC), 콜레스테롤, 및 1,2-다이올레오일-sn-글리세로-3-[(N-(5-아미노-1-카르복시펜틸)이미노다이아세트산)석시닐]의 니켈 또는 코발트 염(DGS-NTA(Ni2+) 또는 DGS-NTA(Co2+))을 60:36:4의 몰비로 포함한다. 바람직한 실시 형태에서, HIV Env 삼량체 단백질은, 예를 들어 리포좀 표면에 통합된 말레이미드 작용기를 통해 리포좀 표면에 공유적으로 커플링된다. 이의 소정의 비-제한적인 예시적인 실시 형태에서, 리포좀은 DSPC, 콜레스테롤, 및 1,2-다이팔미토일-sn-글리세로-3-포스포에탄올아민-N-[4-(p-말레이미도메틸)사이클로헥산-카르복사미드] 지질을 54:30:16의 몰비로 포함한다. HIV Env 단백질은 예를 들어 HIV Env 단백질 내에 첨가된 C-말단 시스테인을 통해 이에 커플링될 수 있다. 공유적으로 커플링된 변이체는 더 안정하고, 높은 항원 특이적 IgG 역가를 유도하며, Env 삼량체의 항원적으로 덜 관련된 '하부'에서 에피토프는 마스킹된다. 리포좀에 커플링된 HIV Env 삼량체의 제조뿐만 아니라 이들의 특성화를 위한 방법은 알려져 있으며, 예를 들어 본 명세서에 참고로 포함된 문헌[Bale et al, 2017]에 기재되어 있다. 본 발명은 또한 리포좀에 융합되고/되거나 리포좀 상에 디스플레이된 본 발명의 HIV Env 단백질을 제공한다.
소정의 실시 형태에서, 본 발명의 HIV Env 단백질은 자가-조립 입자에 융합되거나, 나노입자 상에 디스플레이된다. 항원 나노입자는 다중의 결합 부위(결합력)를 유발하고 개선된 항원 안정성 및 면역원성을 제공할 수 있는, 다중 카피의 항원, 예를 들어 본 발명의 HIV Env 단백질을 제공하는 폴리펩티드의 조립체이다. 백신에 사용하기 위한 자가-조립 단백질 나노입자의 제조 및 사용은 당업자에게 잘 알려져 있으며, 예를 들어 문헌[Zhao et al, 2014], 문헌[Lpez-Sagaseta et al, 2016]을 참조한다. 비-제한적인 예로서, 자가-조립 나노입자는 페리틴, 박테리오페라틴, 또는 DPS에 기초할 수 있다. 표면 상에 단백질을 디스플레이하는 DPS 나노입자는 예를 들어 WO2011/082087호에 기재되어 있다. 그러한 입자 상의 삼량체성 HIV-1 항원의 설명은 예를 들어 문헌[He et al, 2016]에 기재되어 있다. 다른 자가-조립 단백질 나노입자뿐만 아니라 이의 제조는, 예를 들어 본 명세서에 참고로 포함된 WO 2014/124301호 및 US 2016/0122392호에 개시되어 있다. 본 발명은 또한 자가-조립 나노입자에 융합되고/되거나 자가-조립 나노입자 상에 디스플레이된 본 발명의 HIV Env 단백질을 제공한다. 본 발명은 또한 본 발명에 따른 VLP, 리포좀, 또는 자가-조립 나노입자를 포함하는 조성물을 제공한다.
소정의 실시 형태에서, 보조제는 본 발명의 조성물에 포함되거나 본 발명의 조성물과 공동-투여된다. 보조제의 사용은 임의적이며, 조성물이 백신접종 목적을 위해 사용될 때 면역 반응을 추가로 향상시킬 수 있다. 본 발명에 따른 조성물 내의 포함 또는 공동-투여에 적합한 보조제는 바람직하게는 사람에게 잠재적으로 안전하고, 잘 용인되고, 효과적인 것들이어야 한다. 그러한 보조제는 당업자에게 잘 알려져 있으며, 비-제한적인 예는 QS-21, Detox-PC, MPL-SE, MoGM-CSF, TiterMax-G, CRL- 1005, GERBU, TERamide, PSC97B, Adjumer, PG-026, GSK-I, GcMAF, B-알레틴, MPC-026, Adjuvax, CpG ODN, Betafectin, 인산 알루미늄(예를 들어 AdjuPhos) 또는 수산화 알루미늄과 같은 알루미늄 염, 및 MF59를 포함한다.
각각 HIV 외피 공통 계통군 C 및 공통 계통군 B 서열을 나타내는, 서열 번호 2 또는 서열 번호 4의 아미노산 서열과 95%, 96%, 97%, 98%, 99% 이상, 또는 100% 동일한 아미노산 서열을 포함하는 재조합 HIV 외피 단백질이 본 명세서에 또한 개시된다. 서열 번호 2 또는 서열 번호 4의 아미노산 서열과 95%, 96%, 97%, 98%, 99% 이상, 또는 100% 동일한 아미노산 서열을 포함하는 재조합 HIV 외피 단백질은 임의로 소위 SOSIP 돌연변이 및/또는 푸린 절단 부위 내의 돌연변이, 예컨대, 예를 들어 서열 번호 3, 또는 위치 558 및/또는 위치 556에 Pro를 추가로 포함하는 서열 번호 3; 및 서열 번호 5, 또는 위치 558 및/또는 위치 556에 Pro를 추가로 포함하는 서열 번호 5에 나타낸 서열 내의 것을 추가로 포함할 수 있다. 이들 서열에 대한 % 동일성을 결정할 때, 돌연변이화된 푸린 절단 부위에서의 아미노산 및 위치 501, 605, 559, 556, 및 558에서의 아미노산은 바람직하게는 고려되지 않는다. 그러한 단백질은 고수준으로 발현되고 고수준의 안정성 및 삼량체 형성을 갖는다. 그러한 HIV Env 단백질은 소정의 실시 형태에서 골격 단백질로서 사용될 수 있으며, 여기서 T538의 H로의 돌연변이를 실행하여 본 발명의 분자를 얻을 수 있다. 이들 서열을 인코딩하는 단리된 핵산 분자, 프로모터에 작동가능하게 연결된 이들 서열을 포함하는 벡터, 및 단백질, 단리된 핵산 분자, 또는 벡터를 포함하는 조성물이 또한 개시된다.
실시예
실시예 1: 위치 650에서의 HIV 외피의 Trp, Phe, Met, 또는 Leu로의 돌연변이는 삼량체 수율을 증가시킨다
SOSIP 돌연변이(위치 501 및 605에서의 시스테인 잔기 및 위치 559에서의 프롤린 잔기)뿐만 아니라 잔기 508 내지 511에서 푸린 부위를 6개의 아르기닌 잔기로 대체함으로써 최적화된 푸린 절단 부위를 포함하는 HIV 계통군 C 및 계통군 B 외피(Env) 단백질 공통 서열이 HIV Env 단백질의 삼량체 형성에 대한 위치 650에서의 돌연변이의 효과를 연구하기 위한 골격 서열로서 사용되었다. 또한, C-말단은 잔기 664에서 절단되어, 가용성 HIV gp140 단백질을 인코딩하는 서열을 유발하였다. 추가로, 계통군 C 변이체(ConC_SOSIP)에서 위치 295에서의 Val을 Asn(V295N)으로 돌연변이화하여, 대부분의 HIV 균주에 존재하고 일부 실험에 사용된 소정의 항체에 대한 결합을 개선할 수 있는 N-연결된 글리코실화 부위를 생성하였다. 상기 기재된 치환/변형의 모든 위치는 HIV-1 단리물 HXB2의 gp160에서의 넘버링에 대한 것이다. 각각 "ConC_SOSIP" 및 "ConB_SOSIP"로 지칭되는 골격 계통군 C 및 계통군 B HIV gp140 서열은 (서열 번호 3 및 5)에 나타낸다. 특히, 이들 골격 분자에서 위치 650에서의 Gln 잔기는 Trp 잔기에 의해 대체되었다(Q650W 돌연변이, '본 발명의 돌연변이' 중 하나로도 지칭됨). 또한, ConC_SOSIP 골격에서 위치 650에서의 Gln 잔기는 또한 Phe(Q650F), Met(Q650M), Ile(Q650I), 또는 Leu(Q650L) 잔기에 의해 대체되었으며, 이 중 Q650F, Q650M, 및 Q650L은 '본 발명의 돌연변이'로도 지칭된다. 유사하게, ConC_SOSIP 및 ConB_SOSIP 골격에서 위치 108에서의 Ile 잔기는 His 잔기(I108H 돌연변이)에 의해 대체되었다. 유사하게, ConC_SOSIP 및 ConB_SOSIP 골격에서 위치 538에서의 Thr 잔기는 His 잔기(T538H 돌연변이)에 의해 대체되었다. 생성되는 재조합 HIV Env 단백질은 가용성 gp140 단백질로서 발현되었다. 예를 들어 WO 2018/050747호에 기재된 바와 같이, 본 실험은 알려진 방법에 따라 실행되었다.
AlphaLISA 검정
AlphaLISA®(Perkin-Elmer)는 공여자 비드의 고에너지 조사에 의해 생성되는 단일항 산소 분자가 대략 200 nm의 거리 이내에 있는 수용자 비드로 전달되는 비드-기반 근접 검정이다. 이는 세척 단계를 필요로 하지 않는 민감한 고처리량 스크리닝 검정이다. 화학 반응의 캐스케이딩 시리즈는 화학발광 신호를 유발한다(문헌[Eglen et al. Curr Chem Genomics, 2008]). AlphaLISA 검정을 위해, 작제물에 소르타제 A-플래그-His 태그(서열 번호 15)를 장착하였다. HIV 작제물을 Expi293F 세포에서 발현시키고, 이를 96 웰 플레이트에서 3 일 동안 배양하였다(200 μl/웰). 상청액을 12배 희석한 17b-기반 검정을 제외하고는, 비정제 상청액을 AlphaLISA® 완충액(PBS + 0.05% Tween-20 + 0.5 mg/mL BSA)에 120배 희석하였다. 이어서, 10 μl의 이들 희석액을 절반-면적 96-웰 플레이트로 이전하고, 수용자 비드, 공여자 비드, 및 mAb의 40 μl 혼합물과 혼합하였다. 사용 전에 비드를 잘 혼합하였다. RT에서 진탕 없이 2 시간의 인큐베이션 후에, Neo(BioTek)로 신호를 측정하였다. mAb에 결합할 수 있는 ProtA(카탈로그 번호 AS102M, Perkin Elmer)에 공여자 비드를 접합시켰다. 단백질의 His-태그를 검출하기 위한 항-His 항체(카탈로그 번호 AL112R, Perkin Elmer)에 수용자 비드를 접합시켰다. 총 단백질 수준의 정량화를 위해, 항-플래그 항체(카탈로그 번호 AL112R, Perkin Elmer)를 담지하는 수용자 비드와 함께 니켈-접합된 공여자 비드(카탈로그 번호 AS101M, Perkin Elmer)의 조합이 사용되었다. sCD4-His와 조합된 17b의 경우, ProtA 공여자 비드와 항-플래그 수용자 비드의 조합이 사용되었다. 상이한 Env 단백질에 대해 측정된 AlphaLISA 카운트로부터 모의 형질감염(Env 없음)의 평균 신호를 감산하였다. 각각 계통군 C 및 계통군 B Env 돌연변이체에 대해, 참조로서 모 ConC_SOSIP 또는 ConB_SOSIP Env 플라스미드를 사용하였다.
분석에 사용된 단일클론 항체(mAb)는 본 분야에 잘 알려져 있으며(예를 들어, WO 2018/050747호 참조), 이들의 특징 중 일부와 함께 표 2에 표시되어 있다.
[표 2]
광범위한 중화 항체(bNAb)는 다수의 HIV 균주로부터의 Env의 천연 사전융합 입체배좌에 결합한다. 비-bNAb는 잘못 폴딩된 비-천연 Env 또는 고도로 가변적인 노출된 루프에 결합한다. CD4의 결합 후에만 노출되는, HIV 외피 단백질의 공동-수용체 결합 부위에 결합하는 것으로 알려진 항체(mAb 17b)에 대한 가용성 HIV gp140 Env 단백질 변이체의 결합을 측정함으로써 단백질 폴딩을 또한 시험하였다(데이터는 나타내지 않음). 특히, 가용성 수용체 CD4(sCD4)를 mAb 17과 조합하여 사용하여 CD4-유도 입체배좌 변화를 평가하였다. 외피 단백질에 대한 이전의 CD4 결합이 없는 HIV gp140 Env 단백질 변이체에 대한 mAb 17b의 결합은 부분적으로 언폴딩되거나 사전-촉발된 외피 단백질(즉, CD4 결합의 부재 하에 "개방" 입체배좌를 채택하는 불안정한 Env)의 표시이다.
따라서, 일반적으로, 이들 실험에서 모 Env 분자와 비교하여 하나 이상의 bNAb의 결합이 증가하고 하나 이상의 비-bNAb의 결합이 증가하지 않거나 심지어 감소하는 경우에 그것은 HIV Env 변이체에 대한 긍정적 속성이다.
분석용 SEC
96 웰 포맷 세포 배양에서 HIV Env 변이체를 발현시켰다. 분석용 크기 배제 크로마토그래피(분석용 SEC) 실험을 수행하기 위해 인-라인 Nanostar DLS 판독기(Wyatt)와 조합되어 Optilab μT-rEX 굴절률 검출기(Wyatt)에 커플링된 μDAWN TREOS 기기(Wyatt) 및 초고성능 액체 크로마토그래피 시스템(Vanquish, Thermo Scientific)을 사용하였다. 투명해진 비정제 세포 배양 상청액을 0.3 mL/분의 전개 완충액(150 mM 인산 나트륨, 50 mM 염화 나트륨, pH 7.0) 중에 평형화된 상응하는 가드 컬럼(Tosoh Bioscience)을 갖는 TSK-Gel UP-SW3000 4.6x150 mm 컬럼에 적용하였다. 상청액 샘플을 분석할 때, μMALS 검출기는 오프라인(offline)이였고, 분석 SEC 데이터는 Chromeleon 7.2.8.0 소프트웨어 패키지를 사용하여 분석되었다. HIV Env 형질전환된 세포의 상청액의 신호로부터 형질전환되지 않은 세포의 상청액의 신호를 감산하였다.
생성된 재조합 HIV Env 단백질 변이체를 삼량체 형성에 대해 스크리닝하여, 골격 서열에 비교하여 Q650W 돌연변이가 형성된 삼량체의 백분율을 개선하고/하거나 삼량체 수율을 개선했는지 여부를 확인하였다. 분석용 SEC(도 1a, 도 2a)를 사용하여 삼량체 수율을 결정하였다. 재조합 HIV Env 단백질에 대한 광범위한 중화 HIV 항체(bNAb) 및 비-bNAb의 패널의 결합을 평가하기 위한 AlphaLISA 검정을 사용하여 상대 삼량체 수율을 확인하고 HIV Env 단백질의 입체배좌 특징을 결정하였다(도 1b, 도 2b).
분석용 SEC에서, 돌연변이 Q650W는 ConC_SOSIP 및 ConB_SOSIP 둘 모두의 삼량체 수율을 증가시킨 것으로 나타났다(도 1a 및 도 2a). 추가로, 돌연변이 Q650W는 돌연변이를 갖지 않는 그의 모 분자와 비교하여 AlphaLISA에서 bNAb 항체 결합을 증가시켰다. 삼량체-특이적 첨부-지향 광범위 중화 항체(bNAb) PGT145, VRC026, 및 PGDM1400의 증가가 입증되었으며, 이는 ConC_SOSIP의 개선된 삼량체 수율 및/또는 삼량체 폴딩을 표시한다(도 1b). 안정화에 무관하게 이 HIV Env에 결합하지 않는 VRC026을 제외하고는, ConB_SOSIP에 대해 동일한 관찰이 이루어졌다(도 2b). Q650W는 ConC_SOSIP 및 ConB_SOSIP 둘 모두에 대해 AlphaLISA에서 비-bNAb 17b의 결합을 감소시키며(도 1b 및 도 2b), 이는 원하는 특징이고 Env 삼량체의 폐쇄된 천연 사전융합 입체배좌를 표시한다. CD4의 존재 하에 mAb 17b에 대한 증가된 결합은 이러한 비-bNAb 17b에 대한 에피토프가 여전히 온전하다는 것을 입증한다.
위치 650에서, 트립토판(W) 외에 몇 가지 다른 아미노산 치환이 시험되었다. 각각의 HIV Env ConC_SOSIP 변이체를 코딩하는 플라스미드를 이용한 형질감염 후에 Expi293F 세포 배양 상청액의 분석용 SEC를 사용하여 나타낸 바와 같이, 페닐알라닌(F)은 삼량체 수율을 상당히 증가시켰고, 메티오닌(M) 및 류신(L)도 삼량체를 증가시킨 반면에, 의외로 대조적으로 이소류신(I)은 삼량체 형성을 감소시킨다(도 3).
돌연변이 T538H는, 이러한 돌연변이를 갖지 않는 그의 모 분자와 비교하여, ConC_SOSIP 및 ConB-SOSIP 둘 모두의 삼량체 수율(도 4a 및 도 5a), 및 AlphaLISA에서 bNAb 결합을 증가시킨 것으로 또한 나타났다. 삼량체-특이적 첨부-지향 광범위 중화 항체(bNAb) PGT145, VRC026, 및 PGDM1400의 증가가 T538H 돌연변이에 대해 입증되었으며, 이는 ConC_SOSIP의 개선된 삼량체 수율 및/또는 삼량체 폴딩을 표시하며(도 4b); T538H 안정화에 무관하게 이 HIV Env에 결합하지 않는 VRC026을 제외하고는, ConB_SOSIP에 대해 동일한 관찰이 이루어졌다(도 5b). T538H는 ConC_SOSIP 및 ConB_SOSIP 둘 모두에 대해 AlphaLISA에서 비-bNAb 17b의 결합을 감소시킨다(도 4b 및 도 5b).
돌연변이 I108H는, 이러한 돌연변이를 갖지 않는 그의 모 분자와 비교하여, ConC_SOSIP 및 ConB-SOSIP 둘 모두의 삼량체 수율(도 6a 및 도 7a), 및 AlphaLISA에서 bNAb 결합을 증가시킨 것으로 또한 나타났다. 삼량체-특이적 첨부-지향 광범위 중화 항체(bNAb) PGT145, VRC026, 및 PGDM1400의 증가가 I108H 돌연변이에 대해 입증되었으며, 이는 ConC_SOSIP의 개선된 삼량체 수율 및/또는 삼량체 폴딩을 표시하며(도 6b); I108H 안정화에 무관하게 이 HIV Env에 결합하지 않는 VRC026을 제외하고는, ConB_SOSIP에 대해 동일한 관찰이 이루어졌다(도 7b). I108H는 ConC_SOSIP 및 ConB_SOSIP 둘 모두에 대해 AlphaLISA에서 비-bNAb 17b의 결합을 강력하게 감소시킨다(도 6b 및 도 7b).
돌연변이 I108H, T538H, 및 Q650W의 조합은, I108H만을 포함하는 ConB_SOSIP와 비교하여, ConB_SOSIP의 삼량체 수율(도 8a) 및 AlphaLISA에서 bNAb 결합을 증가시킨 것으로 또한 나타났다. 삼량체-특이적 첨부-지향 광범위 중화 항체(bNAb) PGT145 및 PGDM1400의 증가가 ConB_SOSIP_I108H_T538H_Q650W에 대해 입증되었으며, 이는 ConB_SOSIP_I108H에 비교하여 개선된 삼량체 수율 및/또는 삼량체 폴딩을 표시한다(도 8b). AlphaLISA에 의해 측정된 바와 같이 ConB_SOSIP_I108H와 비교하여 비-bNAb의 동일한 감소가 ConB_SOSIP_I108H_T538H_Q650W에 대해 관찰된다(도 8b).
위치 650W, 650F, 650M, 또는 650L, 바람직하게는 650W 또는 650F의 돌연변이가 다른 계통군로부터의 HIV Env 단백질에서, 천연 HIV Env 서열에서, SOSIP 돌연변이 중 하나 또는 전부를 포함하지 않는 HIV Env 단백질에서, 표 1의 항목 (i) 내지 (xvi)에 표시된 돌연변이 중 하나 이상을 갖는 HIV Env 단백질에서, T538H 및/또는 I108H 돌연변이를 갖는 HIV Env 단백질에서 또한 수행되며, 본 출원 및 HIV Env 단백질의 지식에 기초하여, 그러한 배경 중 대부분 또는 전부에서 650W, 650F, 650M, 및 650L 돌연변이 각각, 바람직하게는 650W 또는 650F가 또한 삼량체 형성 및/또는 삼량체 수율을 증가시키는 작용을 할 개연성이 있다.
본 명세서에 나타낸 데이터는 본 발명의 분자, 즉, 위치 650에 Trp, Phe, Met, 또는 Leu, 바람직하게는 Trp 또는 Leu를 갖는 HIV Env 단백질이, 그 위치에 천연 발생 아미노산을 갖는 HIV Env 단백질과 비교하여 의외로 증가된 삼량체 형성 및/또는 삼량체 수율을 갖는다는 것을 입증한다. 위치 650에 Trp를 갖는 생성된 Env 삼량체는 폐쇄된 천연 사전융합 입체배좌로 존재하는 경향이 증가한다.
증가된 백분율의 삼량체 형성을 갖는 HIV 외피 단백질은, 백신을 위한 것과 같은 제조 관점에서 유리하며, 이는 원하지 않는 비-천연 입체배좌로 제제 중에 존재하는 외피 단백질의 정제 및 제거가 덜 필요할 것이기 때문이다. 또한, 삼량체의 총 발현 수율이 증가하는 것은 백신 생성물의 제조에 유리하다. 주로 폐쇄된 천연 사전융합 입체배좌로 존재하는 HIV 외피 단백질은 백신접종에 또한 바람직한데, 이는 이들이 실제 감염 중의 Env 단백질에 구조적으로 더 가까우므로, 그러한 입체배좌의 Env 단백질에 대해 발생된 면역 반응은 고도로 유익하다고 여겨지기 때문이다.
본 명세서에 기재된 실시예 및 실시 형태는 단지 예시적인 목적을 위한 것이며, 본 발명의 광범위한 발명 개념으로부터 이탈하지 않으면서 상기 기재된 실시 형태에 대한 변경이 이루어질 수 있음이 이해된다. 따라서, 본 발명은 개시된 특정 실시 형태로 제한되는 것이 아니라, 첨부된 청구범위에 의해 한정되는 바와 같은 본 발명의 사상 및 범주 내의 변형들을 포함하도록 의도됨이 이해된다.
서열 목록
서열 번호 1 HIV-1 단리물 HXB2의 gp160(신호 서열은 이탤릭체임; 위치 108에서의 Ile, 위치 538에서의 Thr, 및 위치 650에서의 Gln은 밑줄 및 굵은체로 표시됨)
MRVKEKYQHLWRWGWRWGTMLLGMLMICSATEKLWVTVYYGVPVWKEATTTLFCASDAKAYDTEVHNVWATHACVPTDPNPQEVVLVNVTENFNMWKNDMVEQMHED I ISLWDQSLKPCVKLTPLCVSLKCTDLKNDTNTNSSSGRMIMEKGEIKNCSFNISTSIRGKVQKEYAFFYKLDIIPIDNDTTSYKLTSCNTSVITQACPKVSFEPIPIHYCAPAGFAILKCNNKTFNGTGPCTNVSTVQCTHGIRPVVSTQLLLNGSLAEEEVVIRSVNFTDNAKTIIVQLNTSVEINCTRPNNNTRKRIRIQRGPGRAFVTIGKIGNMRQAHCNISRAKWNNTLKQIASKLREQFGNNKTIIFKQSSGGDPEIVTHSFNCGGEFFYCNSTQLFNSTWFNSTWSTEGSNNTEGSDTITLPCRIKQIINMWQKVGKAMYAPPISGQIRCSSNITGLLLTRDGGNSNNESEIFRPGGGDMRDNWRSELYKYKVVKIEPLGVAPTKAKRRVVQREKRAVGIGALFLGFLGAAGSTMGAASMTL T VQARQLLSGIVQQQNNLLRAIEAQQHLLQLTVWGIKQLQARILAVERYLKDQQLLGIWGCSGKLICTTAVPWNASWSNKSLEQIWNHTTWMEWDREINNYTSLIHSLIEES Q NQQEKNEQELLELDKWASLWNWFNITNWLWYIKLFIMIVGGLVGLRIVFAVLSIVNRVRQGYSPLSFQTHLPTPRGPDRPEGIEEEGGERDRDRSIRLVNGSLALIWDDLRSLCLFSYHRLRDLLLIVTRIVELLGRRGWEALKYWWNLLQYWSQELKNSAVSLLNATAIAVAEGTDRVIEVVQGACRAIRHIPRRIRQGLERILL
서열 번호 2 HIV Env 예시적 공통 계통군 C(공통 서열 단독, 임의의 신호 서열, 막관통 도메인(664가 마지막 아미노산임), SOSIP 돌연변이, 및/또는 푸린 절단 부위 돌연변이를 포함하지 않음; 위치 108에서의 Ile, 위치 538에서의 Thr, 및 위치 650에서의 Gln은 밑줄 및 굵은체로 표시됨)
NLWVTVYYGVPVWKEAKTTLFCASDAKAYEKEVHNVWATHACVPTDPNPQEMVLENVTENFNMWKNDMVDQMHED I ISLWDQSLKPCVKLTPLCVTLNCTNVNVTNTNNNNMKEEMKNCSFNTTTEIRDKKQKEYALFYRLDIVPLNENSSEYRLINCNTSTITQACPKVSFDPIPIHYCAPAGYAILKCNNKTFNGTGPCNNVSTVQCTHGIKPVVSTQLLLNGSLAEEEIIIRSENLTDNAKTIIVHLNESVEINCTRPNNNTRKSIRIGPGQTFYATGDIIGDIRQAHCNISEAKWNKTLQRVKKKLKEHFPNKTIKFAPSSGGDLEITTHSFNCRGEFFYCNTSKLFNSTYNNTTSNSTITLPCRIKQIINMWQEVGRAMYAPPIAGNITCKSNITGLLLTRDGGNNNNNTETFRPGGGDMRDNWRSELYKYKVVEIKPLGIAPTKAKRRVVEREKRRAVGIGAVFLGFLGAAGSTMGAASITL T VQARQLLSGIVQQQSNLLRAIEAQQHMLQLTVWGIKQLQARVLAIERYLKDQQLLGIWGCSGKLICTTAVPWNSSWSNKSQEDIWDNMTWMQWDREISNYTDTIYRLLEES Q NQQEKNEKDLLALD
서열 번호 3 ConC_SOSIP(SOSIP 돌연변이 및 푸린 절단 부위, 및 C-말단 절단, 및 C-말단에 소르타제 A-플래그-His 태그(밑줄로 표시됨)를 갖는 성숙 계통군 C 공통 서열; 위치 108에서의 Ile, 위치 538에서의 Thr, 및 위치 650에서의 Gln은 밑줄 및 굵은체로 표시됨)(HIV150606)
NLWVTVYYGVPVWKEAKTTLFCASDAKAYEKEVHNVWATHACVPTDPNPQEMVLENVTENFNMWKNDMVDQMHED I ISLWDQSLKPCVKLTPLCVTLNCTNVNVTNTNNNNMKEEMKNCSFNTTTEIRDKKQKEYALFYRLDIVPLNENSSEYRLINCNTSTITQACPKVSFDPIPIHYCAPAGYAILKCNNKTFNGTGPCNNVSTVQCTHGIKPVVSTQLLLNGSLAEEEIIIRSENLTDNAKTIIVHLNESVEINCTRPNNNTRKSIRIGPGQTFYATGDIIGDIRQAHCNISEAKWNKTLQRVKKKLKEHFPNKTIKFAPSSGGDLEITTHSFNCRGEFFYCNTSKLFNSTYNNTTSNSTITLPCRIKQIINMWQEVGRAMYAPPIAGNITCKSNITGLLLTRDGGNNNNNTETFRPGGGDMRDNWRSELYKYKVVEIKPLGIAPTKCKRRVVERRRRRRAVGIGAVFLGFLGAAGSTMGAASITL T VQARQLLSGIVQQQSNLLRAPEAQQHMLQLTVWGIKQLQARVLAIERYLKDQQLLGIWGCSGKLICCTAVPWNSSWSNKSQEDIWDNMTWMQWDREISNYTDTIYRLLEES Q NQQEKNEKDLLALDAAALPETGGGSDYKDDDDKPGGGGSGGGGSGGGGSGGGGSGGGGSGGGGSGGGGSHHHHHH
서열 번호 4 HIV Env 예시적 공통 계통군 B(공통 서열 단독, 임의의 신호 서열, 막관통 도메인(664가 마지막 아미노산임), SOSIP 돌연변이, 및/또는 푸린 절단 부위 돌연변이를 포함하지 않음; 위치 108에서의 Ile, 위치 538에서의 Thr, 및 위치 650에서의 Gln은 밑줄 및 굵은체로 표시됨)
AEKLWVTVYYGVPVWKEATTTLFCASDAKAYDTEVHNVWATHACVPTDPNPQEVVLENVTENFNMWKNNMVEQMHED I ISLWDQSLKPCVKLTPLCVTLNCTDLNNNTTNNNSSSEKMEKGEIKNCSFNITTSIRDKVQKEYALFYKLDVVPIDNNNTSYRLISCNTSVITQACPKVSFEPIPIHYCAPAGFAILKCNDKKFNGTGPCTNVSTVQCTHGIRPVVSTQLLLNGSLAEEEVVIRSENFTDNAKTIIVQLNESVEINCTRPNNNTRKSIHIGPGRAFYATGDIIGDIRQAHCNISRTKWNNTLKQIVKKLREQFGNKTIVFNQSSGGDPEIVMHSFNCGGEFFYCNTTQLFNSTWNSNGTWNNTTGNDTITLPCRIKQIINMWQEVGKAMYAPPIRGQIRCSSNITGLLLTRDGGNNNNNTTETFRPGGGDMRDNWRSELYKYKVVKIEPLGVAPTKCKRRVVQRRRRRRAVGIGAMFLGFLGAAGSTMGAASITL T VQARQLLSGIVQQQNNLLRAPEAQQHLLQLTVWGIKQLQARVLAVERYLKDQQLLGIWGCSGKLICCTAVPWNTSWSNKSLDEIWDNMTWMQWEREIDNYTGLIYTLIEES Q NQQEKNEQELLELD
서열 번호 5 ConB_SOSIP(SOSIP 돌연변이 및 푸린 절단 부위, 및 C-말단 절단, 및 C-말단에 소르타제 A-플래그-His 태그(밑줄로 표시됨)를 갖는 성숙 계통군 B 공통 서열; 위치 108에서의 Ile, 위치 538에서의 Thr, 및 위치 650에서의 Gln은 밑줄 및 굵은체로 표시됨)(HIV150606)
AEKLWVTVYYGVPVWKEATTTLFCASDAKAYDTEVHNVWATHACVPTDPNPQEVVLENVTENFNMWKNNMVEQMHED I ISLWDQSLKPCVKLTPLCVTLNCTDLNNNTTNNNSSSEKMEKGEIKNCSFNITTSIRDKVQKEYALFYKLDVVPIDNNNTSYRLISCNTSVITQACPKVSFEPIPIHYCAPAGFAILKCNDKKFNGTGPCTNVSTVQCTHGIRPVVSTQLLLNGSLAEEEVVIRSENFTDNAKTIIVQLNESVEINCTRPNNNTRKSIHIGPGRAFYATGDIIGDIRQAHCNISRTKWNNTLKQIVKKLREQFGNKTIVFNQSSGGDPEIVMHSFNCGGEFFYCNTTQLFNSTWNSNGTWNNTTGNDTITLPCRIKQIINMWQEVGKAMYAPPIRGQIRCSSNITGLLLTRDGGNNNNNTTETFRPGGGDMRDNWRSELYKYKVVKIEPLGVAPTKCKRRVVQRRRRRRAVGIGAMFLGFLGAAGSTMGAASITL T VQARQLLSGIVQQQNNLLRAPEAQQHLLQLTVWGIKQLQARVLAVERYLKDQQLLGIWGCSGKLICCTAVPWNTSWSNKSLDEIWDNMTWMQWEREIDNYTGLIYTLIEES Q NQQEKNEQELLELDAAALPETGGGSDYKDDDDKPGGGGSGGGGSGGGGSGGGGSGGGGSGGGGSGGGGSHHHHHH
서열 번호 6(푸린 절단 부위 돌연변이체 서열)
RRRRRR
서열 번호 7(신호 서열의 예(예를 들어 ConC_SOSIP에 사용됨))
MRVRGILRNWQQWWIWGILGFWMLMICNVVG(주의: 마지막 VG는 성숙 단백질의 시작 또는 신호 서열의 종료일 수 있음)
서열 번호 8(신호 서열의 예(예를 들어 ConB_SOSIP에 사용됨))
MRVKGIRKNYQHLWRWGTMLLGMLMICSA
서열 번호 9(HR1 루프를 대체할 수 있는 8개의 아미노산 서열의 예)
NPDWLPDM
서열 번호 10(HR1 루프를 대체할 수 있는 8개의 아미노산 서열의 예)
GSGSGSGS
서열 번호 11(HR1 루프를 대체할 수 있는 8개의 아미노산 서열의 예)
DDVHPDWD
서열 번호 12(HR1 루프를 대체할 수 있는 8개의 아미노산 서열의 예)
RDTFALMM
서열 번호 13(HR1 루프를 대체할 수 있는 8개의 아미노산 서열의 예)
DEEKVMDF
서열 번호 14(HR1 루프를 대체할 수 있는 8개의 아미노산 서열의 예)
DEDPHWDP
서열 번호 15(소르타제 A-플래그-His 태그)
AAALPETGGGSDYKDDDDKPGGGGSGGGGSGGGGSGGGGSGGGGSGGGGSGGGGSHHHHHH
서열 번호 16 (예시적인 전장 ConC_SOSIP(이탤릭체인 신호 서열을 포함함); 위치 108에서의 Ile, 위치 538에서의 Thr, 및 위치 650에서의 Gln은 밑줄 및 굵은체로 표시됨)
MRVRGILRNWQQWWIWGILGFWMLMICNVVGNLWVTVYYGVPVWKEAKTTLFCASDAKAYEKEVHNVWATHACVPTDPNPQEMVLENVTENFNMWKNDMVDQMHED I ISLWDQSLKPCVKLTPLCVTLNCTNVNVTNTNNNNMKEEMKNCSFNTTTEIRDKKQKEYALFYRLDIVPLNENSSEYRLINCNTSTITQACPKVSFDPIPIHYCAPAGYAILKCNNKTFNGTGPCNNVSTVQCTHGIKPVVSTQLLLNGSLAEEEIIIRSENLTDNAKTIIVHLNESVEINCTRPNNNTRKSIRIGPGQTFYATGDIIGDIRQAHCNISEAKWNKTLQRVKKKLKEHFPNKTIKFAPSSGGDLEITTHSFNCRGEFFYCNTSKLFNSTYNNTTSNSTITLPCRIKQIINMWQEVGRAMYAPPIAGNITCKSNITGLLLTRDGGNNNNNTETFRPGGGDMRDNWRSELYKYKVVEIKPLGIAPTKCKRRVVERekRAVGIGAVFLGFLGAAGSTMGAASITL T VQARQLLSGIVQQQSNLLRAPEAQQHMLQLTVWGIKQLQARVLAIERYLKDQQLLGIWGCSGKLICCTAVPWNSSWSNKSQEDIWDNMTWMQWDREISNYTDTIYRLLEES Q NQQEKNEKDLLALDSWNNLWNWFDITNWLWYIKIFIMIVGGLIGLRIIFAVLSIVNRVRQGYSPLSFQTLTPNPRGPDRLGRIEEEGGEQDRDRSIRLVSGFLALAWDDLRSLCLFSYHRLRDFILIAARAVELLGRSSLRGLQRGWEALKYLGSLVQYWGLELKKSAISLLDTIAIAVAEGTDRIIELIQRICRAIRNIPRRIRQGFEAALL
참고문헌
1.
Sanders et al. J. Virol. (2002) 76(17), 8875-89
2.
Sanders et al. Science (2015) 349(6224), 139-140
3.
Julien et al. Proc. Nat. Acad. Sci. (2015) 112(38), 11947-52
4.
de Taeye et al. Cell (2015) 163(7), 1702-15
5.
Kwon et al. (2015) Nat. Struct. Mol. Biol. 22(7) 522-31
6.
Eglen et al. Curr. Chem. Genomics, (2008) 25(1), 2-10
7.
Kong et al, Nat Commun. 2016 Jun 28;7:12040. doi: 10.1038/ncomms12040
8.
Barouch et al, Nat Med 2010, 16: 319-323
9.
WO 2010/059732
10.
Sharma SK, et al. Cell Rep. (2015) 11(4):539-50. doi: 10.1016/j.celrep.2015.03.047.
11.
Georgiev IS, et al. J Virol. (2015) 89(10):5318-29. doi: 10.1128/JVI.03451-14.
12.
-Sagaseta J, et al (2016) Computational and Struct Biotechnol J 14: 58-68.
13.
Zhao L, et al (2014) Vaccine 32: 327-337
14.
He L, et al (2016) Nat Commun. 2016 Jun 28;7:12041. doi: 10.1038/ncomms12041
15.
WO2011082087
16.
Bale S, et al (2017) J. Virol. doi:10.1128/JVI.00443-17
17.
Abbink et al (2007) Virol. 81(9): 4654-64
18.
Altschul SF et al (1997) Nucleic Acid Res. 25: 3389-3402
19.
Harris et al (2011) PNAS 108 (28): 11440-11445
20.
Kushnir et al (2012) Vaccine (31): 58-83
21.
WO 2007/104792
22.
WO 2014/124301
23.
US 2016/0122392
24.
WO 2018/050747
25.
WO 2019/016062
26.
WO 2017/102929
27.
WO 2012/172277
28.
WO 2018/215766
29.
WO 2019/086466
30.
WO 2019/086456
31.
WO 96/09378
32.
US2011/0300205
33.
WO 2019/023566
34.
Pardi et al, 2018, Nature Reviews Drug Discovery 17: 261-279
35.
Zhang et al, 2019, Front. Immunol. 10: 594
36.
Eglen et al. Curr. Chem. Genomics, (2008) 25(1), 2-10
37.
Rutten et al, (2018) Cell Reports 23: 584-595
38.
Lee et al, 2017, Immunity 46: 690-702
39.
Rawi et al, (2020) Cell Reports 33, 108432
SEQUENCE LISTING
<110> Janssen Vaccines & Prevention B.V.
Rutten, Lucy
Langedijk, Johannes P.M.
Juraszek, Jarek
<120> Trimer Stabilizing HIV Envelope Protein Mutation
<130> CRU6054
<150> EP21158800.9
<151> 2021-02-23
<160> 16
<170> PatentIn version 3.5
<210> 1
<211> 856
<212> PRT
<213> Human immunodeficiency virus
<220>
<221> MISC_FEATURE
<223> gp160 of HIV-1 isolate HXB2
<400> 1
Met Arg Val Lys Glu Lys Tyr Gln His Leu Trp Arg Trp Gly Trp Arg
1 5 10 15
Trp Gly Thr Met Leu Leu Gly Met Leu Met Ile Cys Ser Ala Thr Glu
20 25 30
Lys Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys Glu Ala
35 40 45
Thr Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Asp Thr Glu
50 55 60
Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp Pro Asn
65 70 75 80
Pro Gln Glu Val Val Leu Val Asn Val Thr Glu Asn Phe Asn Met Trp
85 90 95
Lys Asn Asp Met Val Glu Gln Met His Glu Asp Ile Ile Ser Leu Trp
100 105 110
Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val Ser
115 120 125
Leu Lys Cys Thr Asp Leu Lys Asn Asp Thr Asn Thr Asn Ser Ser Ser
130 135 140
Gly Arg Met Ile Met Glu Lys Gly Glu Ile Lys Asn Cys Ser Phe Asn
145 150 155 160
Ile Ser Thr Ser Ile Arg Gly Lys Val Gln Lys Glu Tyr Ala Phe Phe
165 170 175
Tyr Lys Leu Asp Ile Ile Pro Ile Asp Asn Asp Thr Thr Ser Tyr Lys
180 185 190
Leu Thr Ser Cys Asn Thr Ser Val Ile Thr Gln Ala Cys Pro Lys Val
195 200 205
Ser Phe Glu Pro Ile Pro Ile His Tyr Cys Ala Pro Ala Gly Phe Ala
210 215 220
Ile Leu Lys Cys Asn Asn Lys Thr Phe Asn Gly Thr Gly Pro Cys Thr
225 230 235 240
Asn Val Ser Thr Val Gln Cys Thr His Gly Ile Arg Pro Val Val Ser
245 250 255
Thr Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu Glu Glu Val Val Ile
260 265 270
Arg Ser Val Asn Phe Thr Asp Asn Ala Lys Thr Ile Ile Val Gln Leu
275 280 285
Asn Thr Ser Val Glu Ile Asn Cys Thr Arg Pro Asn Asn Asn Thr Arg
290 295 300
Lys Arg Ile Arg Ile Gln Arg Gly Pro Gly Arg Ala Phe Val Thr Ile
305 310 315 320
Gly Lys Ile Gly Asn Met Arg Gln Ala His Cys Asn Ile Ser Arg Ala
325 330 335
Lys Trp Asn Asn Thr Leu Lys Gln Ile Ala Ser Lys Leu Arg Glu Gln
340 345 350
Phe Gly Asn Asn Lys Thr Ile Ile Phe Lys Gln Ser Ser Gly Gly Asp
355 360 365
Pro Glu Ile Val Thr His Ser Phe Asn Cys Gly Gly Glu Phe Phe Tyr
370 375 380
Cys Asn Ser Thr Gln Leu Phe Asn Ser Thr Trp Phe Asn Ser Thr Trp
385 390 395 400
Ser Thr Glu Gly Ser Asn Asn Thr Glu Gly Ser Asp Thr Ile Thr Leu
405 410 415
Pro Cys Arg Ile Lys Gln Ile Ile Asn Met Trp Gln Lys Val Gly Lys
420 425 430
Ala Met Tyr Ala Pro Pro Ile Ser Gly Gln Ile Arg Cys Ser Ser Asn
435 440 445
Ile Thr Gly Leu Leu Leu Thr Arg Asp Gly Gly Asn Ser Asn Asn Glu
450 455 460
Ser Glu Ile Phe Arg Pro Gly Gly Gly Asp Met Arg Asp Asn Trp Arg
465 470 475 480
Ser Glu Leu Tyr Lys Tyr Lys Val Val Lys Ile Glu Pro Leu Gly Val
485 490 495
Ala Pro Thr Lys Ala Lys Arg Arg Val Val Gln Arg Glu Lys Arg Ala
500 505 510
Val Gly Ile Gly Ala Leu Phe Leu Gly Phe Leu Gly Ala Ala Gly Ser
515 520 525
Thr Met Gly Ala Ala Ser Met Thr Leu Thr Val Gln Ala Arg Gln Leu
530 535 540
Leu Ser Gly Ile Val Gln Gln Gln Asn Asn Leu Leu Arg Ala Ile Glu
545 550 555 560
Ala Gln Gln His Leu Leu Gln Leu Thr Val Trp Gly Ile Lys Gln Leu
565 570 575
Gln Ala Arg Ile Leu Ala Val Glu Arg Tyr Leu Lys Asp Gln Gln Leu
580 585 590
Leu Gly Ile Trp Gly Cys Ser Gly Lys Leu Ile Cys Thr Thr Ala Val
595 600 605
Pro Trp Asn Ala Ser Trp Ser Asn Lys Ser Leu Glu Gln Ile Trp Asn
610 615 620
His Thr Thr Trp Met Glu Trp Asp Arg Glu Ile Asn Asn Tyr Thr Ser
625 630 635 640
Leu Ile His Ser Leu Ile Glu Glu Ser Gln Asn Gln Gln Glu Lys Asn
645 650 655
Glu Gln Glu Leu Leu Glu Leu Asp Lys Trp Ala Ser Leu Trp Asn Trp
660 665 670
Phe Asn Ile Thr Asn Trp Leu Trp Tyr Ile Lys Leu Phe Ile Met Ile
675 680 685
Val Gly Gly Leu Val Gly Leu Arg Ile Val Phe Ala Val Leu Ser Ile
690 695 700
Val Asn Arg Val Arg Gln Gly Tyr Ser Pro Leu Ser Phe Gln Thr His
705 710 715 720
Leu Pro Thr Pro Arg Gly Pro Asp Arg Pro Glu Gly Ile Glu Glu Glu
725 730 735
Gly Gly Glu Arg Asp Arg Asp Arg Ser Ile Arg Leu Val Asn Gly Ser
740 745 750
Leu Ala Leu Ile Trp Asp Asp Leu Arg Ser Leu Cys Leu Phe Ser Tyr
755 760 765
His Arg Leu Arg Asp Leu Leu Leu Ile Val Thr Arg Ile Val Glu Leu
770 775 780
Leu Gly Arg Arg Gly Trp Glu Ala Leu Lys Tyr Trp Trp Asn Leu Leu
785 790 795 800
Gln Tyr Trp Ser Gln Glu Leu Lys Asn Ser Ala Val Ser Leu Leu Asn
805 810 815
Ala Thr Ala Ile Ala Val Ala Glu Gly Thr Asp Arg Val Ile Glu Val
820 825 830
Val Gln Gly Ala Cys Arg Ala Ile Arg His Ile Pro Arg Arg Ile Arg
835 840 845
Gln Gly Leu Glu Arg Ile Leu Leu
850 855
<210> 2
<211> 615
<212> PRT
<213> Artificial Sequence
<220>
<223> HIV Env consensus clade C
<400> 2
Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys Glu Ala
1 5 10 15
Lys Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Glu Lys Glu
20 25 30
Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp Pro Asn
35 40 45
Pro Gln Glu Met Val Leu Glu Asn Val Thr Glu Asn Phe Asn Met Trp
50 55 60
Lys Asn Asp Met Val Asp Gln Met His Glu Asp Ile Ile Ser Leu Trp
65 70 75 80
Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val Thr
85 90 95
Leu Asn Cys Thr Asn Val Asn Val Thr Asn Thr Asn Asn Asn Asn Met
100 105 110
Lys Glu Glu Met Lys Asn Cys Ser Phe Asn Thr Thr Thr Glu Ile Arg
115 120 125
Asp Lys Lys Gln Lys Glu Tyr Ala Leu Phe Tyr Arg Leu Asp Ile Val
130 135 140
Pro Leu Asn Glu Asn Ser Ser Glu Tyr Arg Leu Ile Asn Cys Asn Thr
145 150 155 160
Ser Thr Ile Thr Gln Ala Cys Pro Lys Val Ser Phe Asp Pro Ile Pro
165 170 175
Ile His Tyr Cys Ala Pro Ala Gly Tyr Ala Ile Leu Lys Cys Asn Asn
180 185 190
Lys Thr Phe Asn Gly Thr Gly Pro Cys Asn Asn Val Ser Thr Val Gln
195 200 205
Cys Thr His Gly Ile Lys Pro Val Val Ser Thr Gln Leu Leu Leu Asn
210 215 220
Gly Ser Leu Ala Glu Glu Glu Ile Ile Ile Arg Ser Glu Asn Leu Thr
225 230 235 240
Asp Asn Ala Lys Thr Ile Ile Val His Leu Asn Glu Ser Val Glu Ile
245 250 255
Asn Cys Thr Arg Pro Asn Asn Asn Thr Arg Lys Ser Ile Arg Ile Gly
260 265 270
Pro Gly Gln Thr Phe Tyr Ala Thr Gly Asp Ile Ile Gly Asp Ile Arg
275 280 285
Gln Ala His Cys Asn Ile Ser Glu Ala Lys Trp Asn Lys Thr Leu Gln
290 295 300
Arg Val Lys Lys Lys Leu Lys Glu His Phe Pro Asn Lys Thr Ile Lys
305 310 315 320
Phe Ala Pro Ser Ser Gly Gly Asp Leu Glu Ile Thr Thr His Ser Phe
325 330 335
Asn Cys Arg Gly Glu Phe Phe Tyr Cys Asn Thr Ser Lys Leu Phe Asn
340 345 350
Ser Thr Tyr Asn Asn Thr Thr Ser Asn Ser Thr Ile Thr Leu Pro Cys
355 360 365
Arg Ile Lys Gln Ile Ile Asn Met Trp Gln Glu Val Gly Arg Ala Met
370 375 380
Tyr Ala Pro Pro Ile Ala Gly Asn Ile Thr Cys Lys Ser Asn Ile Thr
385 390 395 400
Gly Leu Leu Leu Thr Arg Asp Gly Gly Asn Asn Asn Asn Asn Thr Glu
405 410 415
Thr Phe Arg Pro Gly Gly Gly Asp Met Arg Asp Asn Trp Arg Ser Glu
420 425 430
Leu Tyr Lys Tyr Lys Val Val Glu Ile Lys Pro Leu Gly Ile Ala Pro
435 440 445
Thr Lys Ala Lys Arg Arg Val Val Glu Arg Glu Lys Arg Arg Ala Val
450 455 460
Gly Ile Gly Ala Val Phe Leu Gly Phe Leu Gly Ala Ala Gly Ser Thr
465 470 475 480
Met Gly Ala Ala Ser Ile Thr Leu Thr Val Gln Ala Arg Gln Leu Leu
485 490 495
Ser Gly Ile Val Gln Gln Gln Ser Asn Leu Leu Arg Ala Ile Glu Ala
500 505 510
Gln Gln His Met Leu Gln Leu Thr Val Trp Gly Ile Lys Gln Leu Gln
515 520 525
Ala Arg Val Leu Ala Ile Glu Arg Tyr Leu Lys Asp Gln Gln Leu Leu
530 535 540
Gly Ile Trp Gly Cys Ser Gly Lys Leu Ile Cys Thr Thr Ala Val Pro
545 550 555 560
Trp Asn Ser Ser Trp Ser Asn Lys Ser Gln Glu Asp Ile Trp Asp Asn
565 570 575
Met Thr Trp Met Gln Trp Asp Arg Glu Ile Ser Asn Tyr Thr Asp Thr
580 585 590
Ile Tyr Arg Leu Leu Glu Glu Ser Gln Asn Gln Gln Glu Lys Asn Glu
595 600 605
Lys Asp Leu Leu Ala Leu Asp
610 615
<210> 3
<211> 677
<212> PRT
<213> Artificial Sequence
<220>
<223> ConC_SOSIP sequence
<400> 3
Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys Glu Ala
1 5 10 15
Lys Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Glu Lys Glu
20 25 30
Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp Pro Asn
35 40 45
Pro Gln Glu Met Val Leu Glu Asn Val Thr Glu Asn Phe Asn Met Trp
50 55 60
Lys Asn Asp Met Val Asp Gln Met His Glu Asp Ile Ile Ser Leu Trp
65 70 75 80
Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val Thr
85 90 95
Leu Asn Cys Thr Asn Val Asn Val Thr Asn Thr Asn Asn Asn Asn Met
100 105 110
Lys Glu Glu Met Lys Asn Cys Ser Phe Asn Thr Thr Thr Glu Ile Arg
115 120 125
Asp Lys Lys Gln Lys Glu Tyr Ala Leu Phe Tyr Arg Leu Asp Ile Val
130 135 140
Pro Leu Asn Glu Asn Ser Ser Glu Tyr Arg Leu Ile Asn Cys Asn Thr
145 150 155 160
Ser Thr Ile Thr Gln Ala Cys Pro Lys Val Ser Phe Asp Pro Ile Pro
165 170 175
Ile His Tyr Cys Ala Pro Ala Gly Tyr Ala Ile Leu Lys Cys Asn Asn
180 185 190
Lys Thr Phe Asn Gly Thr Gly Pro Cys Asn Asn Val Ser Thr Val Gln
195 200 205
Cys Thr His Gly Ile Lys Pro Val Val Ser Thr Gln Leu Leu Leu Asn
210 215 220
Gly Ser Leu Ala Glu Glu Glu Ile Ile Ile Arg Ser Glu Asn Leu Thr
225 230 235 240
Asp Asn Ala Lys Thr Ile Ile Val His Leu Asn Glu Ser Val Glu Ile
245 250 255
Asn Cys Thr Arg Pro Asn Asn Asn Thr Arg Lys Ser Ile Arg Ile Gly
260 265 270
Pro Gly Gln Thr Phe Tyr Ala Thr Gly Asp Ile Ile Gly Asp Ile Arg
275 280 285
Gln Ala His Cys Asn Ile Ser Glu Ala Lys Trp Asn Lys Thr Leu Gln
290 295 300
Arg Val Lys Lys Lys Leu Lys Glu His Phe Pro Asn Lys Thr Ile Lys
305 310 315 320
Phe Ala Pro Ser Ser Gly Gly Asp Leu Glu Ile Thr Thr His Ser Phe
325 330 335
Asn Cys Arg Gly Glu Phe Phe Tyr Cys Asn Thr Ser Lys Leu Phe Asn
340 345 350
Ser Thr Tyr Asn Asn Thr Thr Ser Asn Ser Thr Ile Thr Leu Pro Cys
355 360 365
Arg Ile Lys Gln Ile Ile Asn Met Trp Gln Glu Val Gly Arg Ala Met
370 375 380
Tyr Ala Pro Pro Ile Ala Gly Asn Ile Thr Cys Lys Ser Asn Ile Thr
385 390 395 400
Gly Leu Leu Leu Thr Arg Asp Gly Gly Asn Asn Asn Asn Asn Thr Glu
405 410 415
Thr Phe Arg Pro Gly Gly Gly Asp Met Arg Asp Asn Trp Arg Ser Glu
420 425 430
Leu Tyr Lys Tyr Lys Val Val Glu Ile Lys Pro Leu Gly Ile Ala Pro
435 440 445
Thr Lys Cys Lys Arg Arg Val Val Glu Arg Arg Arg Arg Arg Arg Ala
450 455 460
Val Gly Ile Gly Ala Val Phe Leu Gly Phe Leu Gly Ala Ala Gly Ser
465 470 475 480
Thr Met Gly Ala Ala Ser Ile Thr Leu Thr Val Gln Ala Arg Gln Leu
485 490 495
Leu Ser Gly Ile Val Gln Gln Gln Ser Asn Leu Leu Arg Ala Pro Glu
500 505 510
Ala Gln Gln His Met Leu Gln Leu Thr Val Trp Gly Ile Lys Gln Leu
515 520 525
Gln Ala Arg Val Leu Ala Ile Glu Arg Tyr Leu Lys Asp Gln Gln Leu
530 535 540
Leu Gly Ile Trp Gly Cys Ser Gly Lys Leu Ile Cys Cys Thr Ala Val
545 550 555 560
Pro Trp Asn Ser Ser Trp Ser Asn Lys Ser Gln Glu Asp Ile Trp Asp
565 570 575
Asn Met Thr Trp Met Gln Trp Asp Arg Glu Ile Ser Asn Tyr Thr Asp
580 585 590
Thr Ile Tyr Arg Leu Leu Glu Glu Ser Gln Asn Gln Gln Glu Lys Asn
595 600 605
Glu Lys Asp Leu Leu Ala Leu Asp Ala Ala Ala Leu Pro Glu Thr Gly
610 615 620
Gly Gly Ser Asp Tyr Lys Asp Asp Asp Asp Lys Pro Gly Gly Gly Gly
625 630 635 640
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
645 650 655
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His
660 665 670
His His His His His
675
<210> 4
<211> 630
<212> PRT
<213> Artificial Sequence
<220>
<223> HIV Env consensus clade B
<400> 4
Ala Glu Lys Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys
1 5 10 15
Glu Ala Thr Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Asp
20 25 30
Thr Glu Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp
35 40 45
Pro Asn Pro Gln Glu Val Val Leu Glu Asn Val Thr Glu Asn Phe Asn
50 55 60
Met Trp Lys Asn Asn Met Val Glu Gln Met His Glu Asp Ile Ile Ser
65 70 75 80
Leu Trp Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys
85 90 95
Val Thr Leu Asn Cys Thr Asp Leu Asn Asn Asn Thr Thr Asn Asn Asn
100 105 110
Ser Ser Ser Glu Lys Met Glu Lys Gly Glu Ile Lys Asn Cys Ser Phe
115 120 125
Asn Ile Thr Thr Ser Ile Arg Asp Lys Val Gln Lys Glu Tyr Ala Leu
130 135 140
Phe Tyr Lys Leu Asp Val Val Pro Ile Asp Asn Asn Asn Thr Ser Tyr
145 150 155 160
Arg Leu Ile Ser Cys Asn Thr Ser Val Ile Thr Gln Ala Cys Pro Lys
165 170 175
Val Ser Phe Glu Pro Ile Pro Ile His Tyr Cys Ala Pro Ala Gly Phe
180 185 190
Ala Ile Leu Lys Cys Asn Asp Lys Lys Phe Asn Gly Thr Gly Pro Cys
195 200 205
Thr Asn Val Ser Thr Val Gln Cys Thr His Gly Ile Arg Pro Val Val
210 215 220
Ser Thr Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu Glu Glu Val Val
225 230 235 240
Ile Arg Ser Glu Asn Phe Thr Asp Asn Ala Lys Thr Ile Ile Val Gln
245 250 255
Leu Asn Glu Ser Val Glu Ile Asn Cys Thr Arg Pro Asn Asn Asn Thr
260 265 270
Arg Lys Ser Ile His Ile Gly Pro Gly Arg Ala Phe Tyr Ala Thr Gly
275 280 285
Asp Ile Ile Gly Asp Ile Arg Gln Ala His Cys Asn Ile Ser Arg Thr
290 295 300
Lys Trp Asn Asn Thr Leu Lys Gln Ile Val Lys Lys Leu Arg Glu Gln
305 310 315 320
Phe Gly Asn Lys Thr Ile Val Phe Asn Gln Ser Ser Gly Gly Asp Pro
325 330 335
Glu Ile Val Met His Ser Phe Asn Cys Gly Gly Glu Phe Phe Tyr Cys
340 345 350
Asn Thr Thr Gln Leu Phe Asn Ser Thr Trp Asn Ser Asn Gly Thr Trp
355 360 365
Asn Asn Thr Thr Gly Asn Asp Thr Ile Thr Leu Pro Cys Arg Ile Lys
370 375 380
Gln Ile Ile Asn Met Trp Gln Glu Val Gly Lys Ala Met Tyr Ala Pro
385 390 395 400
Pro Ile Arg Gly Gln Ile Arg Cys Ser Ser Asn Ile Thr Gly Leu Leu
405 410 415
Leu Thr Arg Asp Gly Gly Asn Asn Asn Asn Asn Thr Thr Glu Thr Phe
420 425 430
Arg Pro Gly Gly Gly Asp Met Arg Asp Asn Trp Arg Ser Glu Leu Tyr
435 440 445
Lys Tyr Lys Val Val Lys Ile Glu Pro Leu Gly Val Ala Pro Thr Lys
450 455 460
Cys Lys Arg Arg Val Val Gln Arg Arg Arg Arg Arg Arg Ala Val Gly
465 470 475 480
Ile Gly Ala Met Phe Leu Gly Phe Leu Gly Ala Ala Gly Ser Thr Met
485 490 495
Gly Ala Ala Ser Ile Thr Leu Thr Val Gln Ala Arg Gln Leu Leu Ser
500 505 510
Gly Ile Val Gln Gln Gln Asn Asn Leu Leu Arg Ala Pro Glu Ala Gln
515 520 525
Gln His Leu Leu Gln Leu Thr Val Trp Gly Ile Lys Gln Leu Gln Ala
530 535 540
Arg Val Leu Ala Val Glu Arg Tyr Leu Lys Asp Gln Gln Leu Leu Gly
545 550 555 560
Ile Trp Gly Cys Ser Gly Lys Leu Ile Cys Cys Thr Ala Val Pro Trp
565 570 575
Asn Thr Ser Trp Ser Asn Lys Ser Leu Asp Glu Ile Trp Asp Asn Met
580 585 590
Thr Trp Met Gln Trp Glu Arg Glu Ile Asp Asn Tyr Thr Gly Leu Ile
595 600 605
Tyr Thr Leu Ile Glu Glu Ser Gln Asn Gln Gln Glu Lys Asn Glu Gln
610 615 620
Glu Leu Leu Glu Leu Asp
625 630
<210> 5
<211> 691
<212> PRT
<213> Artificial Sequence
<220>
<223> ConB_SOSIP sequence
<400> 5
Ala Glu Lys Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys
1 5 10 15
Glu Ala Thr Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Asp
20 25 30
Thr Glu Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp
35 40 45
Pro Asn Pro Gln Glu Val Val Leu Glu Asn Val Thr Glu Asn Phe Asn
50 55 60
Met Trp Lys Asn Asn Met Val Glu Gln Met His Glu Asp Ile Ile Ser
65 70 75 80
Leu Trp Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys
85 90 95
Val Thr Leu Asn Cys Thr Asp Leu Asn Asn Asn Thr Thr Asn Asn Asn
100 105 110
Ser Ser Ser Glu Lys Met Glu Lys Gly Glu Ile Lys Asn Cys Ser Phe
115 120 125
Asn Ile Thr Thr Ser Ile Arg Asp Lys Val Gln Lys Glu Tyr Ala Leu
130 135 140
Phe Tyr Lys Leu Asp Val Val Pro Ile Asp Asn Asn Asn Thr Ser Tyr
145 150 155 160
Arg Leu Ile Ser Cys Asn Thr Ser Val Ile Thr Gln Ala Cys Pro Lys
165 170 175
Val Ser Phe Glu Pro Ile Pro Ile His Tyr Cys Ala Pro Ala Gly Phe
180 185 190
Ala Ile Leu Lys Cys Asn Asp Lys Lys Phe Asn Gly Thr Gly Pro Cys
195 200 205
Thr Asn Val Ser Thr Val Gln Cys Thr His Gly Ile Arg Pro Val Val
210 215 220
Ser Thr Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu Glu Glu Val Val
225 230 235 240
Ile Arg Ser Glu Asn Phe Thr Asp Asn Ala Lys Thr Ile Ile Val Gln
245 250 255
Leu Asn Glu Ser Val Glu Ile Asn Cys Thr Arg Pro Asn Asn Asn Thr
260 265 270
Arg Lys Ser Ile His Ile Gly Pro Gly Arg Ala Phe Tyr Ala Thr Gly
275 280 285
Asp Ile Ile Gly Asp Ile Arg Gln Ala His Cys Asn Ile Ser Arg Thr
290 295 300
Lys Trp Asn Asn Thr Leu Lys Gln Ile Val Lys Lys Leu Arg Glu Gln
305 310 315 320
Phe Gly Asn Lys Thr Ile Val Phe Asn Gln Ser Ser Gly Gly Asp Pro
325 330 335
Glu Ile Val Met His Ser Phe Asn Cys Gly Gly Glu Phe Phe Tyr Cys
340 345 350
Asn Thr Thr Gln Leu Phe Asn Ser Thr Trp Asn Ser Asn Gly Thr Trp
355 360 365
Asn Asn Thr Thr Gly Asn Asp Thr Ile Thr Leu Pro Cys Arg Ile Lys
370 375 380
Gln Ile Ile Asn Met Trp Gln Glu Val Gly Lys Ala Met Tyr Ala Pro
385 390 395 400
Pro Ile Arg Gly Gln Ile Arg Cys Ser Ser Asn Ile Thr Gly Leu Leu
405 410 415
Leu Thr Arg Asp Gly Gly Asn Asn Asn Asn Asn Thr Thr Glu Thr Phe
420 425 430
Arg Pro Gly Gly Gly Asp Met Arg Asp Asn Trp Arg Ser Glu Leu Tyr
435 440 445
Lys Tyr Lys Val Val Lys Ile Glu Pro Leu Gly Val Ala Pro Thr Lys
450 455 460
Cys Lys Arg Arg Val Val Gln Arg Arg Arg Arg Arg Arg Ala Val Gly
465 470 475 480
Ile Gly Ala Met Phe Leu Gly Phe Leu Gly Ala Ala Gly Ser Thr Met
485 490 495
Gly Ala Ala Ser Ile Thr Leu Thr Val Gln Ala Arg Gln Leu Leu Ser
500 505 510
Gly Ile Val Gln Gln Gln Asn Asn Leu Leu Arg Ala Pro Glu Ala Gln
515 520 525
Gln His Leu Leu Gln Leu Thr Val Trp Gly Ile Lys Gln Leu Gln Ala
530 535 540
Arg Val Leu Ala Val Glu Arg Tyr Leu Lys Asp Gln Gln Leu Leu Gly
545 550 555 560
Ile Trp Gly Cys Ser Gly Lys Leu Ile Cys Cys Thr Ala Val Pro Trp
565 570 575
Asn Thr Ser Trp Ser Asn Lys Ser Leu Asp Glu Ile Trp Asp Asn Met
580 585 590
Thr Trp Met Gln Trp Glu Arg Glu Ile Asp Asn Tyr Thr Gly Leu Ile
595 600 605
Tyr Thr Leu Ile Glu Glu Ser Gln Asn Gln Gln Glu Lys Asn Glu Gln
610 615 620
Glu Leu Leu Glu Leu Asp Ala Ala Ala Leu Pro Glu Thr Gly Gly Gly
625 630 635 640
Ser Asp Tyr Lys Asp Asp Asp Asp Lys Pro Gly Gly Gly Gly Ser Gly
645 650 655
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
660 665 670
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His His
675 680 685
His His His
690
<210> 6
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> furin cleavage site mutant sequence
<400> 6
Arg Arg Arg Arg Arg Arg
1 5
<210> 7
<211> 31
<212> PRT
<213> Artificial Sequence
<220>
<223> signal sequence
<400> 7
Met Arg Val Arg Gly Ile Leu Arg Asn Trp Gln Gln Trp Trp Ile Trp
1 5 10 15
Gly Ile Leu Gly Phe Trp Met Leu Met Ile Cys Asn Val Val Gly
20 25 30
<210> 8
<211> 29
<212> PRT
<213> Artificial Sequence
<220>
<223> signal sequence
<400> 8
Met Arg Val Lys Gly Ile Arg Lys Asn Tyr Gln His Leu Trp Arg Trp
1 5 10 15
Gly Thr Met Leu Leu Gly Met Leu Met Ile Cys Ser Ala
20 25
<210> 9
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> example of 8 amino acid sequence that can replace HR1 loop
<400> 9
Asn Pro Asp Trp Leu Pro Asp Met
1 5
<210> 10
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> example of 8 amino acid sequence that can replace HR1 loop
<400> 10
Gly Ser Gly Ser Gly Ser Gly Ser
1 5
<210> 11
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> example of 8 amino acid sequence that can replace HR1 loop
<400> 11
Asp Asp Val His Pro Asp Trp Asp
1 5
<210> 12
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> example of 8 amino acid sequence that can replace HR1 loop
<400> 12
Arg Asp Thr Phe Ala Leu Met Met
1 5
<210> 13
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> example of 8 amino acid sequence that can replace HR1 loop
<400> 13
Asp Glu Glu Lys Val Met Asp Phe
1 5
<210> 14
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> example of 8 amino acid sequence that can replace HR1 loop
<400> 14
Asp Glu Asp Pro His Trp Asp Pro
1 5
<210> 15
<211> 61
<212> PRT
<213> Artificial Sequence
<220>
<223> sortase A-Flag-His tag
<400> 15
Ala Ala Ala Leu Pro Glu Thr Gly Gly Gly Ser Asp Tyr Lys Asp Asp
1 5 10 15
Asp Asp Lys Pro Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
20 25 30
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
35 40 45
Gly Ser Gly Gly Gly Gly Ser His His His His His His
50 55 60
<210> 16
<211> 844
<212> PRT
<213> Artificial Sequence
<220>
<223> full length ConC_SOSIP
<400> 16
Met Arg Val Arg Gly Ile Leu Arg Asn Trp Gln Gln Trp Trp Ile Trp
1 5 10 15
Gly Ile Leu Gly Phe Trp Met Leu Met Ile Cys Asn Val Val Gly Asn
20 25 30
Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys Glu Ala Lys
35 40 45
Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Glu Lys Glu Val
50 55 60
His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp Pro Asn Pro
65 70 75 80
Gln Glu Met Val Leu Glu Asn Val Thr Glu Asn Phe Asn Met Trp Lys
85 90 95
Asn Asp Met Val Asp Gln Met His Glu Asp Ile Ile Ser Leu Trp Asp
100 105 110
Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val Thr Leu
115 120 125
Asn Cys Thr Asn Val Asn Val Thr Asn Thr Asn Asn Asn Asn Met Lys
130 135 140
Glu Glu Met Lys Asn Cys Ser Phe Asn Thr Thr Thr Glu Ile Arg Asp
145 150 155 160
Lys Lys Gln Lys Glu Tyr Ala Leu Phe Tyr Arg Leu Asp Ile Val Pro
165 170 175
Leu Asn Glu Asn Ser Ser Glu Tyr Arg Leu Ile Asn Cys Asn Thr Ser
180 185 190
Thr Ile Thr Gln Ala Cys Pro Lys Val Ser Phe Asp Pro Ile Pro Ile
195 200 205
His Tyr Cys Ala Pro Ala Gly Tyr Ala Ile Leu Lys Cys Asn Asn Lys
210 215 220
Thr Phe Asn Gly Thr Gly Pro Cys Asn Asn Val Ser Thr Val Gln Cys
225 230 235 240
Thr His Gly Ile Lys Pro Val Val Ser Thr Gln Leu Leu Leu Asn Gly
245 250 255
Ser Leu Ala Glu Glu Glu Ile Ile Ile Arg Ser Glu Asn Leu Thr Asp
260 265 270
Asn Ala Lys Thr Ile Ile Val His Leu Asn Glu Ser Val Glu Ile Asn
275 280 285
Cys Thr Arg Pro Asn Asn Asn Thr Arg Lys Ser Ile Arg Ile Gly Pro
290 295 300
Gly Gln Thr Phe Tyr Ala Thr Gly Asp Ile Ile Gly Asp Ile Arg Gln
305 310 315 320
Ala His Cys Asn Ile Ser Glu Ala Lys Trp Asn Lys Thr Leu Gln Arg
325 330 335
Val Lys Lys Lys Leu Lys Glu His Phe Pro Asn Lys Thr Ile Lys Phe
340 345 350
Ala Pro Ser Ser Gly Gly Asp Leu Glu Ile Thr Thr His Ser Phe Asn
355 360 365
Cys Arg Gly Glu Phe Phe Tyr Cys Asn Thr Ser Lys Leu Phe Asn Ser
370 375 380
Thr Tyr Asn Asn Thr Thr Ser Asn Ser Thr Ile Thr Leu Pro Cys Arg
385 390 395 400
Ile Lys Gln Ile Ile Asn Met Trp Gln Glu Val Gly Arg Ala Met Tyr
405 410 415
Ala Pro Pro Ile Ala Gly Asn Ile Thr Cys Lys Ser Asn Ile Thr Gly
420 425 430
Leu Leu Leu Thr Arg Asp Gly Gly Asn Asn Asn Asn Asn Thr Glu Thr
435 440 445
Phe Arg Pro Gly Gly Gly Asp Met Arg Asp Asn Trp Arg Ser Glu Leu
450 455 460
Tyr Lys Tyr Lys Val Val Glu Ile Lys Pro Leu Gly Ile Ala Pro Thr
465 470 475 480
Lys Cys Lys Arg Arg Val Val Glu Arg Glu Lys Arg Ala Val Gly Ile
485 490 495
Gly Ala Val Phe Leu Gly Phe Leu Gly Ala Ala Gly Ser Thr Met Gly
500 505 510
Ala Ala Ser Ile Thr Leu Thr Val Gln Ala Arg Gln Leu Leu Ser Gly
515 520 525
Ile Val Gln Gln Gln Ser Asn Leu Leu Arg Ala Pro Glu Ala Gln Gln
530 535 540
His Met Leu Gln Leu Thr Val Trp Gly Ile Lys Gln Leu Gln Ala Arg
545 550 555 560
Val Leu Ala Ile Glu Arg Tyr Leu Lys Asp Gln Gln Leu Leu Gly Ile
565 570 575
Trp Gly Cys Ser Gly Lys Leu Ile Cys Cys Thr Ala Val Pro Trp Asn
580 585 590
Ser Ser Trp Ser Asn Lys Ser Gln Glu Asp Ile Trp Asp Asn Met Thr
595 600 605
Trp Met Gln Trp Asp Arg Glu Ile Ser Asn Tyr Thr Asp Thr Ile Tyr
610 615 620
Arg Leu Leu Glu Glu Ser Gln Asn Gln Gln Glu Lys Asn Glu Lys Asp
625 630 635 640
Leu Leu Ala Leu Asp Ser Trp Asn Asn Leu Trp Asn Trp Phe Asp Ile
645 650 655
Thr Asn Trp Leu Trp Tyr Ile Lys Ile Phe Ile Met Ile Val Gly Gly
660 665 670
Leu Ile Gly Leu Arg Ile Ile Phe Ala Val Leu Ser Ile Val Asn Arg
675 680 685
Val Arg Gln Gly Tyr Ser Pro Leu Ser Phe Gln Thr Leu Thr Pro Asn
690 695 700
Pro Arg Gly Pro Asp Arg Leu Gly Arg Ile Glu Glu Glu Gly Gly Glu
705 710 715 720
Gln Asp Arg Asp Arg Ser Ile Arg Leu Val Ser Gly Phe Leu Ala Leu
725 730 735
Ala Trp Asp Asp Leu Arg Ser Leu Cys Leu Phe Ser Tyr His Arg Leu
740 745 750
Arg Asp Phe Ile Leu Ile Ala Ala Arg Ala Val Glu Leu Leu Gly Arg
755 760 765
Ser Ser Leu Arg Gly Leu Gln Arg Gly Trp Glu Ala Leu Lys Tyr Leu
770 775 780
Gly Ser Leu Val Gln Tyr Trp Gly Leu Glu Leu Lys Lys Ser Ala Ile
785 790 795 800
Ser Leu Leu Asp Thr Ile Ala Ile Ala Val Ala Glu Gly Thr Asp Arg
805 810 815
Ile Ile Glu Leu Ile Gln Arg Ile Cys Arg Ala Ile Arg Asn Ile Pro
820 825 830
Arg Arg Ile Arg Gln Gly Phe Glu Ala Ala Leu Leu
835 840
Claims (20)
- 위치 650에 아미노산 트립토판(Trp), 페닐알라닌(Phe), 메티오닌(Met), 또는 류신(Leu) 중 하나를 포함하며,
여기서 위치의 넘버링(numbering)은 HIV-1 단리물 HXB2의 gp160에서의 넘버링에 따르는, 재조합 인간 면역결핍 바이러스(HIV) 외피(Env) 단백질. - 제1항에 있어서, 표시된 위치에 하기 아미노산 잔기 중 하나 이상을 추가로 포함하며, 여기서 위치의 넘버링은 HIV-1 단리물 HXB2의 gp160에서의 넘버링에 따르는, 재조합 HIV Env 단백질:
(i) 위치 651에 Phe, Leu, Met, 또는 Trp, 바람직하게는 Phe;
(ii) 위치 655에 Phe, Ile, Met, 또는 Trp, 바람직하게는 Ile;
(iii) 위치 535에 Asn 또는 Gln, 바람직하게는 Asn;
(iv) 위치 589에 Val, Ile, 또는 Ala, 바람직하게는 Val 또는 Ile, 더욱 바람직하게는 Val;
(v) 위치 573에 Phe 또는 Trp, 바람직하게는 Phe;
(vi) 위치 204에 Ile;
(vii) 위치 647에 Phe, Met, 또는 Ile, 바람직하게는 Phe;
(viii) 위치 658에 Val, Ile, Phe, Met, Ala, 또는 Leu, 바람직하게는 Val 또는 Ile, 더욱 바람직하게는 Val;
(ix) 위치 588에 Gln, Glu, Ile, Met, Val, Trp, 또는 Phe, 바람직하게는 Gln 또는 Glu;
(x) 위치 64에 Lys 또는 위치 66에 Arg 또는 위치 64에 Lys 및 위치 66에 Arg;
(xi) 위치 316에 Trp;
(xii) 위치 201 및 433 둘 모두에 Cys;
(xiii) 위치 556 또는 558에 또는 위치 556 및 558 둘 모두에 Pro;
(xiv) 예를 들어 (서열 번호 9 내지 14) 중 어느 하나로부터 선택된 서열을 갖는, 7 내지 10개의 아미노산을 갖는 루프, 바람직하게는 8개의 아미노산의 루프에 의한 아미노산 위치 548 내지 568(HR1-루프)에서의 루프의 대체;
(xv) 위치 568에 Gly, 또는 위치 569에 Gly, 또는 위치 636에 Gly, 또는 위치 568 및 636 둘 모두에 Gly, 또는 위치 569 및 636 둘 모두에 Gly;
(xvi) 위치 302에 Tyr, 또는 위치 519에 Arg, 또는 위치 520에 Arg, 또는 위치 302에 Tyr 및 위치 519에 Arg, 또는 위치 302에 Tyr 및 위치 520에 Arg, 또는 위치 302에 Tyr 및 위치 519 및 520 둘 모두에 Arg;
(xvii) HIV Env 단백질의 푸린 절단 서열 내의 돌연변이, 바람직하게는 위치 508 내지 511에서의 RRRRRR(서열 번호 6)에 의한 대체;
(xviii) 위치 501 및 605에 Cys 또는 위치 559에 Pro, 바람직하게는 위치 501 및 605에 Cys 및 위치 559에 Pro;
(xix) 위치 108에 His; 및/또는
(xx) 위치 538에 His. - 제1항 또는 제2항에 있어서, 위치 650에 Trp를 포함하는, 재조합 HIV Env 단백질.
- 제1항 또는 제2항에 있어서, 위치 650에 Phe를 포함하는, 재조합 HIV Env 단백질.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 위치 108에 His를 포함하는, 재조합 HIV Env 단백질.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 위치 538에 His를 포함하는, 재조합 HIV Env 단백질.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 위치 501 및 605에 Cys 또는 위치 559에 Pro, 바람직하게는 위치 501 및 605에 Cys 및 위치 559에 Pro를 포함하는, 재조합 HIV Env 단백질.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 위치 501 및 605에 Cys 및 위치 559에 Pro를 포함하는, 재조합 HIV Env 단백질.
- 제1항 내지 제8항 중 어느 한 항에 있어서, gp140 또는 gp160 단백질, 또는 세포질 영역 내에 절단을 갖는 Env 단백질인, 재조합 HIV Env 단백질.
- 제1항 내지 제9항 중 어느 한 항에 있어서, 계통군 A HIV, 계통군 B HIV, 또는 계통군 C HIV의 Env 단백질인, 재조합 HIV Env 단백질.
- 제1항 내지 제10항 중 어느 한 항의 3개의 동일한 재조합 HIV Env 단백질의 비공유 올리고머를 포함하는, 삼량체성 복합체.
- 제1항 내지 제10항 중 어느 한 항의 재조합 HIV Env 단백질 또는 제11항의 삼량체성 복합체를 그의 표면 상에 디스플레이하는, 입자, 바람직하게는 리포좀 또는 나노입자.
- 제1항 내지 제10항 중 어느 한 항의 재조합 HIV Env 단백질을 인코딩하는, 단리된 핵산 분자.
- 프로모터에 작동가능하게 연결된 제13항의 단리된 핵산 분자를 포함하는, 벡터.
- 제14항에 있어서, 아데노바이러스 벡터인, 벡터.
- 제13항의 단리된 핵산 분자 또는 제14항 또는 제15항의 벡터를 포함하는, 숙주 세포.
- 재조합 HIV Env 단백질을 생성하는 방법으로서, 재조합 HIV Env 단백질의 생성에 적합한 조건 하에 제16항의 숙주 세포를 성장시키는 단계를 포함하는, 방법.
- 제1항 내지 제10항 중 어느 한 항의 재조합 HIV Env 단백질, 제11항의 삼량체성 복합체, 제12항의 입자, 제13항의 단리된 핵산 분자, 또는 제14항 또는 제15항의 벡터, 및 약제학적으로 허용가능한 담체를 포함하는, 조성물.
- HIV Env 단백질의 삼량체 형성을 개선하는 방법으로서, 모 HIV Env 단백질 내의 위치 650에서의 아미노산 잔기를 Trp, Phe, Met, 또는 Leu 중 하나에 의해, 바람직하게는 Trp 또는 Phe에 의해 치환하는 단계를 포함하며, 여기서 위치의 넘버링은 HIV-1 단리물 HXB2의 gp160에서의 넘버링에 따르는, 방법.
- 위치 108에 히스티딘(His)을 포함하며, 여기서 위치의 넘버링은 HIV-1 단리물 HXB2의 gp160에서의 넘버링에 따르는, 재조합 인간 면역결핍 바이러스(HIV) 외피(Env) 단백질.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP21158800.9 | 2021-02-23 | ||
EP21158800 | 2021-02-23 | ||
PCT/EP2022/054336 WO2022180007A1 (en) | 2021-02-23 | 2022-02-22 | Trimer stabilizing hiv envelope protein mutation |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230150269A true KR20230150269A (ko) | 2023-10-30 |
Family
ID=74732664
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237026810A KR20230150269A (ko) | 2021-02-23 | 2022-02-22 | Hiv 외피 단백질 돌연변이를 안정화시키는 삼량체 |
Country Status (11)
Country | Link |
---|---|
US (1) | US20220265813A1 (ko) |
EP (1) | EP4297778A1 (ko) |
JP (1) | JP2024509769A (ko) |
KR (1) | KR20230150269A (ko) |
CN (1) | CN116867517A (ko) |
AR (1) | AR124937A1 (ko) |
AU (1) | AU2022224967A1 (ko) |
CA (1) | CA3211197A1 (ko) |
MX (1) | MX2023009835A (ko) |
TW (1) | TW202302622A (ko) |
WO (1) | WO2022180007A1 (ko) |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5786464C1 (en) | 1994-09-19 | 2012-04-24 | Gen Hospital Corp | Overexpression of mammalian and viral proteins |
WO2005034842A2 (en) * | 2003-05-19 | 2005-04-21 | Progenics Pharmaceuticals, Inc. | Peptides useful as hiv fusion inhibitors |
US20100143302A1 (en) | 2006-03-16 | 2010-06-10 | Crucell Holland B.V. | Recombinant Adenoviruses Based on Serotype 26 and 48, and Use Thereof |
SI2358757T1 (sl) | 2008-11-18 | 2018-12-31 | Beth Israel Deaconess Medical Center | Antivirusna cepiva z izboljšano celularno imunogenostjo |
US20110300205A1 (en) | 2009-07-06 | 2011-12-08 | Novartis Ag | Self replicating rna molecules and uses thereof |
CN105399833B (zh) | 2010-01-04 | 2019-09-06 | Kj 生物科学有限公司 | 用于疫苗和诊断学的Dps融合蛋白 |
GB201108879D0 (en) | 2011-05-25 | 2011-07-06 | Isis Innovation | Vector |
EP2920313B1 (en) | 2012-11-16 | 2019-06-12 | Beth Israel Deaconess Medical Center, Inc. | Recombinant adenoviruses and use thereof |
US10248758B2 (en) | 2013-02-07 | 2019-04-02 | University Of Washington Through Its Center For Commercialization | Self-assembling protein nanostructures |
EP3189067B1 (en) * | 2014-09-04 | 2021-05-19 | The United States of America, as represented by The Secretary, Department of Health and Human Services | Recombinant hiv-1 envelope proteins and their use |
US9630994B2 (en) | 2014-11-03 | 2017-04-25 | University Of Washington | Polypeptides for use in self-assembling protein nanostructures |
MA44059B1 (fr) | 2015-12-15 | 2019-11-29 | Janssen Vaccines & Prevention Bv | Antigènes du virus de l'immunodéficience humaine, vecteurs, compositions, et leurs procédés d'utilisation |
MX2019002938A (es) | 2016-09-15 | 2019-10-15 | Janssen Vaccines & Prevention Bv | Mutaciones estebilizantes de trimeros de proteinas de la envoltura del vih. |
GB201708444D0 (en) | 2017-05-26 | 2017-07-12 | Univ Oxford Innovation Ltd | Compositions and methods for inducing an immune response |
SG11202000112XA (en) | 2017-07-19 | 2020-02-27 | Janssen Vaccines & Prevention Bv | Trimer stabilizing hiv envelope protein mutations |
KR20200037818A (ko) | 2017-07-28 | 2020-04-09 | 얀센 백신스 앤드 프리벤션 비.브이. | 이종성 repRNA 면역접종을 위한 방법 및 조성물 |
US11136356B2 (en) * | 2017-10-16 | 2021-10-05 | The United States Of America, As Represented By The Secretary, Department Of Health And Human Services | Recombinant HIV-1 envelope proteins and their use |
WO2019086466A1 (en) | 2017-10-31 | 2019-05-09 | Janssen Vaccines & Prevention B.V. | Adenovirus and uses thereof |
CN111372943B (zh) | 2017-10-31 | 2023-12-05 | 扬森疫苗与预防公司 | 腺病毒及其用途 |
-
2022
- 2022-02-22 US US17/651,973 patent/US20220265813A1/en active Pending
- 2022-02-22 CN CN202280015572.XA patent/CN116867517A/zh active Pending
- 2022-02-22 TW TW111106284A patent/TW202302622A/zh unknown
- 2022-02-22 AU AU2022224967A patent/AU2022224967A1/en active Pending
- 2022-02-22 AR ARP220100371A patent/AR124937A1/es unknown
- 2022-02-22 CA CA3211197A patent/CA3211197A1/en active Pending
- 2022-02-22 WO PCT/EP2022/054336 patent/WO2022180007A1/en active Application Filing
- 2022-02-22 MX MX2023009835A patent/MX2023009835A/es unknown
- 2022-02-22 JP JP2023550223A patent/JP2024509769A/ja active Pending
- 2022-02-22 EP EP22707124.8A patent/EP4297778A1/en active Pending
- 2022-02-22 KR KR1020237026810A patent/KR20230150269A/ko unknown
Also Published As
Publication number | Publication date |
---|---|
AR124937A1 (es) | 2023-05-24 |
MX2023009835A (es) | 2023-09-04 |
US20220265813A1 (en) | 2022-08-25 |
EP4297778A1 (en) | 2024-01-03 |
AU2022224967A9 (en) | 2024-05-16 |
JP2024509769A (ja) | 2024-03-05 |
TW202302622A (zh) | 2023-01-16 |
CA3211197A1 (en) | 2022-09-01 |
WO2022180007A1 (en) | 2022-09-01 |
CN116867517A (zh) | 2023-10-10 |
AU2022224967A1 (en) | 2023-07-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2020267278B2 (en) | Trimer stabilizing HIV envelope protein mutations | |
US11732010B2 (en) | Trimer stabilizing HIV envelope protein mutations | |
US20220265813A1 (en) | Trimer Stabilizing HIV Envelope Protein Mutation | |
WO2023156505A1 (en) | Trimer stabilizing hiv envelope protein mutations r304v, n302m and t320l | |
EA038287B1 (ru) | Стабилизирующие тример мутации белка оболочки hiv | |
OA19492A (en) | Trimer stabilizing HIV envelope protein mutations | |
NZ750773B2 (en) | Trimer stabilizing hiv envelope protein mutations | |
EA042607B1 (ru) | Стабилизирующие тример мутации белка оболочки hiv | |
OA19472A (en) | Trimer stabilizing HIV envelope protein mutations. |