KR20190050786A - 삼량체를 안정화하는 hiv 엔벨로프 단백질 돌연변이 - Google Patents
삼량체를 안정화하는 hiv 엔벨로프 단백질 돌연변이 Download PDFInfo
- Publication number
- KR20190050786A KR20190050786A KR1020197007592A KR20197007592A KR20190050786A KR 20190050786 A KR20190050786 A KR 20190050786A KR 1020197007592 A KR1020197007592 A KR 1020197007592A KR 20197007592 A KR20197007592 A KR 20197007592A KR 20190050786 A KR20190050786 A KR 20190050786A
- Authority
- KR
- South Korea
- Prior art keywords
- asn
- ile
- leu
- thr
- val
- Prior art date
Links
- 230000035772 mutation Effects 0.000 title claims abstract description 245
- 239000013638 trimer Substances 0.000 title claims description 174
- 101710091045 Envelope protein Proteins 0.000 title abstract description 174
- 101710188315 Protein X Proteins 0.000 title abstract description 174
- 102100021696 Syncytin-1 Human genes 0.000 title abstract 9
- 241000725303 Human immunodeficiency virus Species 0.000 claims abstract description 624
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract description 151
- 238000006467 substitution reaction Methods 0.000 claims abstract description 148
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 84
- 239000013598 vector Substances 0.000 claims abstract description 73
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 50
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 48
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 48
- 108010078428 env Gene Products Proteins 0.000 claims description 369
- 102100034353 Integrase Human genes 0.000 claims description 368
- 125000000539 amino acid group Chemical group 0.000 claims description 110
- 150000001413 amino acids Chemical class 0.000 claims description 85
- 108090000623 proteins and genes Proteins 0.000 claims description 84
- 102000004169 proteins and genes Human genes 0.000 claims description 82
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 claims description 73
- 238000000034 method Methods 0.000 claims description 42
- 238000003776 cleavage reaction Methods 0.000 claims description 37
- 230000007017 scission Effects 0.000 claims description 36
- 108091035707 Consensus sequence Proteins 0.000 claims description 34
- 239000002245 particle Substances 0.000 claims description 27
- 230000008439 repair process Effects 0.000 claims description 20
- 239000002502 liposome Substances 0.000 claims description 16
- 239000002105 nanoparticle Substances 0.000 claims description 16
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 15
- 238000004519 manufacturing process Methods 0.000 claims description 14
- 241000701161 unidentified adenovirus Species 0.000 claims description 7
- 230000001976 improved effect Effects 0.000 abstract description 48
- 239000000203 mixture Substances 0.000 abstract description 33
- 102100038132 Endogenous retrovirus group K member 6 Pro protein Human genes 0.000 description 170
- 235000001014 amino acid Nutrition 0.000 description 134
- 229940024606 amino acid Drugs 0.000 description 79
- 235000018102 proteins Nutrition 0.000 description 76
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical group OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 54
- 210000004027 cell Anatomy 0.000 description 52
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical group CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 47
- 125000000174 L-prolyl group Chemical group [H]N1C([H])([H])C([H])([H])C([H])([H])[C@@]1([H])C(*)=O 0.000 description 41
- 238000012815 AlphaLISA Methods 0.000 description 40
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 39
- 239000011324 bead Substances 0.000 description 31
- 230000000087 stabilizing effect Effects 0.000 description 30
- 125000000510 L-tryptophano group Chemical group [H]C1=C([H])C([H])=C2N([H])C([H])=C(C([H])([H])[C@@]([H])(C(O[H])=O)N([H])[*])C2=C1[H] 0.000 description 26
- 230000003472 neutralizing effect Effects 0.000 description 26
- 238000003556 assay Methods 0.000 description 25
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Chemical group CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 24
- VKCOHFFSTKCXEQ-OLHMAJIHSA-N Asn-Asn-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VKCOHFFSTKCXEQ-OLHMAJIHSA-N 0.000 description 23
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 23
- 238000004458 analytical method Methods 0.000 description 23
- 108010050848 glycylleucine Proteins 0.000 description 21
- 101800001690 Transmembrane protein gp41 Proteins 0.000 description 20
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Chemical compound NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 20
- 241000713772 Human immunodeficiency virus 1 Species 0.000 description 19
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical group OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 19
- 108010034529 leucyl-lysine Proteins 0.000 description 19
- AMGQTNHANMRPOE-LKXGYXEUSA-N Asn-Thr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O AMGQTNHANMRPOE-LKXGYXEUSA-N 0.000 description 17
- 230000006641 stabilisation Effects 0.000 description 16
- 238000011105 stabilization Methods 0.000 description 16
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 15
- WHNSHJJNWNSTSU-BZSNNMDCSA-N Val-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 WHNSHJJNWNSTSU-BZSNNMDCSA-N 0.000 description 15
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 15
- XOQYDFCQPWAMSA-KKHAAJSZSA-N Asn-Val-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOQYDFCQPWAMSA-KKHAAJSZSA-N 0.000 description 14
- NHSDEZURHWEZPN-SXTJYALSSA-N Asp-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC(=O)O)N NHSDEZURHWEZPN-SXTJYALSSA-N 0.000 description 14
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 14
- 108010066427 N-valyltryptophan Proteins 0.000 description 14
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 14
- 238000007792 addition Methods 0.000 description 14
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 14
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 14
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 14
- 239000000178 monomer Substances 0.000 description 14
- 239000006228 supernatant Substances 0.000 description 14
- XFAUJGNLHIGXET-AVGNSLFASA-N Gln-Leu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XFAUJGNLHIGXET-AVGNSLFASA-N 0.000 description 13
- 108010047495 alanylglycine Proteins 0.000 description 13
- 108010060035 arginylproline Proteins 0.000 description 13
- 239000013604 expression vector Substances 0.000 description 13
- CGWVCWFQGXOUSJ-ULQDDVLXSA-N Arg-Tyr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O CGWVCWFQGXOUSJ-ULQDDVLXSA-N 0.000 description 12
- 241000700605 Viruses Species 0.000 description 12
- 108010087924 alanylproline Proteins 0.000 description 12
- 238000002474 experimental method Methods 0.000 description 12
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 12
- 238000005829 trimerization reaction Methods 0.000 description 12
- 229960005486 vaccine Drugs 0.000 description 12
- ACRYGQFHAQHDSF-ZLUOBGJFSA-N Asn-Asn-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ACRYGQFHAQHDSF-ZLUOBGJFSA-N 0.000 description 11
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 11
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 11
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 11
- 230000004927 fusion Effects 0.000 description 11
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 10
- XJKAKYXMFHUIHT-AUTRQRHGSA-N Gln-Glu-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N XJKAKYXMFHUIHT-AUTRQRHGSA-N 0.000 description 10
- 108010062166 Lys-Asn-Asp Proteins 0.000 description 10
- PXHVJJICTQNCMI-UHFFFAOYSA-N Nickel Chemical compound [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 10
- 108010005233 alanylglutamic acid Proteins 0.000 description 10
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 10
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 10
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 10
- 108010089804 glycyl-threonine Proteins 0.000 description 10
- 239000002523 lectin Substances 0.000 description 10
- 238000001542 size-exclusion chromatography Methods 0.000 description 10
- 108010051110 tyrosyl-lysine Proteins 0.000 description 10
- CKLDHDOIYBVUNP-KBIXCLLPSA-N Ala-Ile-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O CKLDHDOIYBVUNP-KBIXCLLPSA-N 0.000 description 9
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 9
- LANZYLJEHLBUPR-BPUTZDHNSA-N Asn-Met-Trp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(=O)N)N LANZYLJEHLBUPR-BPUTZDHNSA-N 0.000 description 9
- PQKSVQSMTHPRIB-ZKWXMUAHSA-N Asn-Val-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O PQKSVQSMTHPRIB-ZKWXMUAHSA-N 0.000 description 9
- HJXSYJVCMUOUNY-SRVKXCTJSA-N Cys-Ser-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N HJXSYJVCMUOUNY-SRVKXCTJSA-N 0.000 description 9
- XBWMTPAIUQIWKA-BYULHYEWSA-N Gly-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN XBWMTPAIUQIWKA-BYULHYEWSA-N 0.000 description 9
- ITZOBNKQDZEOCE-NHCYSSNCSA-N Gly-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)CN ITZOBNKQDZEOCE-NHCYSSNCSA-N 0.000 description 9
- NZOCIWKZUVUNDW-ZKWXMUAHSA-N Ile-Gly-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O NZOCIWKZUVUNDW-ZKWXMUAHSA-N 0.000 description 9
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 9
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 9
- VHXMZJGOKIMETG-CQDKDKBSSA-N Lys-Ala-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCCCN)N VHXMZJGOKIMETG-CQDKDKBSSA-N 0.000 description 9
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 9
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 9
- UEHNWRNADDPYNK-DLOVCJGASA-N Phe-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CC=CC=C1)N UEHNWRNADDPYNK-DLOVCJGASA-N 0.000 description 9
- YMEXHZTVKDAKIY-GHCJXIJMSA-N Ser-Asn-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO)C(O)=O YMEXHZTVKDAKIY-GHCJXIJMSA-N 0.000 description 9
- KNZQGAUEYZJUSQ-ZLUOBGJFSA-N Ser-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N KNZQGAUEYZJUSQ-ZLUOBGJFSA-N 0.000 description 9
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 9
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 9
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 9
- 239000000427 antigen Substances 0.000 description 9
- 102000036639 antigens Human genes 0.000 description 9
- 108091007433 antigens Proteins 0.000 description 9
- 230000001086 cytosolic effect Effects 0.000 description 9
- 108010077515 glycylproline Proteins 0.000 description 9
- 108010090894 prolylleucine Proteins 0.000 description 9
- 238000000746 purification Methods 0.000 description 9
- JNTMAZFVYNDPLB-PEDHHIEDSA-N (2S,3S)-2-[[[(2S)-1-[(2S,3S)-2-amino-3-methyl-1-oxopentyl]-2-pyrrolidinyl]-oxomethyl]amino]-3-methylpentanoic acid Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JNTMAZFVYNDPLB-PEDHHIEDSA-N 0.000 description 8
- APHUDFFMXFYRKP-CIUDSAMLSA-N Asn-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N APHUDFFMXFYRKP-CIUDSAMLSA-N 0.000 description 8
- WQSCVMQDZYTFQU-FXQIFTODSA-N Asn-Cys-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WQSCVMQDZYTFQU-FXQIFTODSA-N 0.000 description 8
- IBLAOXSULLECQZ-IUKAMOBKSA-N Asn-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(N)=O IBLAOXSULLECQZ-IUKAMOBKSA-N 0.000 description 8
- NVFSJIXJZCDICF-SRVKXCTJSA-N Asp-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N NVFSJIXJZCDICF-SRVKXCTJSA-N 0.000 description 8
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 8
- 108020004414 DNA Proteins 0.000 description 8
- SBYVDRJAXWSXQL-AVGNSLFASA-N Glu-Asn-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SBYVDRJAXWSXQL-AVGNSLFASA-N 0.000 description 8
- LHRXAHLCRMQBGJ-RYUDHWBXSA-N Gly-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)CN LHRXAHLCRMQBGJ-RYUDHWBXSA-N 0.000 description 8
- YXBRCTXAEYSCHS-XVYDVKMFSA-N His-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N YXBRCTXAEYSCHS-XVYDVKMFSA-N 0.000 description 8
- MDBYBTWRMOAJAY-NHCYSSNCSA-N His-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N MDBYBTWRMOAJAY-NHCYSSNCSA-N 0.000 description 8
- ASCFJMSGKUIRDU-ZPFDUUQYSA-N Ile-Arg-Gln Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O ASCFJMSGKUIRDU-ZPFDUUQYSA-N 0.000 description 8
- GQKSJYINYYWPMR-NGZCFLSTSA-N Ile-Gly-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N GQKSJYINYYWPMR-NGZCFLSTSA-N 0.000 description 8
- 102000004856 Lectins Human genes 0.000 description 8
- 108090001090 Lectins Proteins 0.000 description 8
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 8
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 8
- LSLUTXRANSUGFY-XIRDDKMYSA-N Leu-Trp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(O)=O)C(O)=O LSLUTXRANSUGFY-XIRDDKMYSA-N 0.000 description 8
- HQBOMRTVKVKFMN-WDSOQIARSA-N Leu-Trp-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(O)=O HQBOMRTVKVKFMN-WDSOQIARSA-N 0.000 description 8
- BYPMOIFBQPEWOH-CIUDSAMLSA-N Lys-Asn-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N BYPMOIFBQPEWOH-CIUDSAMLSA-N 0.000 description 8
- YDKYJRZWRJTILC-WDSOQIARSA-N Met-Trp-Lys Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCSC)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 YDKYJRZWRJTILC-WDSOQIARSA-N 0.000 description 8
- 230000004988 N-glycosylation Effects 0.000 description 8
- TXPUNZXZDVJUJQ-LPEHRKFASA-N Pro-Asn-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O TXPUNZXZDVJUJQ-LPEHRKFASA-N 0.000 description 8
- SQBLRDDJTUJDMV-ACZMJKKPSA-N Ser-Glu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQBLRDDJTUJDMV-ACZMJKKPSA-N 0.000 description 8
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 8
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 8
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 8
- BTAJAOWZCWOHBU-HSHDSVGOSA-N Thr-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)C(C)C)C(O)=O)=CNC2=C1 BTAJAOWZCWOHBU-HSHDSVGOSA-N 0.000 description 8
- BPGDJSUFQKWUBK-KJEVXHAQSA-N Thr-Val-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BPGDJSUFQKWUBK-KJEVXHAQSA-N 0.000 description 8
- PEYSVKMXSLPQRU-FJHTZYQYSA-N Trp-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O PEYSVKMXSLPQRU-FJHTZYQYSA-N 0.000 description 8
- OOEUVMFKKZYSRX-LEWSCRJBSA-N Tyr-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OOEUVMFKKZYSRX-LEWSCRJBSA-N 0.000 description 8
- CTDPLKMBVALCGN-JSGCOSHPSA-N Tyr-Gly-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O CTDPLKMBVALCGN-JSGCOSHPSA-N 0.000 description 8
- LMSBRIVOCYOKMU-NRPADANISA-N Val-Gln-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N LMSBRIVOCYOKMU-NRPADANISA-N 0.000 description 8
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 8
- MIKHIIQMRFYVOR-RCWTZXSCSA-N Val-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C(C)C)N)O MIKHIIQMRFYVOR-RCWTZXSCSA-N 0.000 description 8
- UJMCYJKPDFQLHX-XGEHTFHBSA-N Val-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N)O UJMCYJKPDFQLHX-XGEHTFHBSA-N 0.000 description 8
- LCHZBEUVGAVMKS-RHYQMDGZSA-N Val-Thr-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)[C@@H](C)O)C(O)=O LCHZBEUVGAVMKS-RHYQMDGZSA-N 0.000 description 8
- NLNCNKIVJPEFBC-DLOVCJGASA-N Val-Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O NLNCNKIVJPEFBC-DLOVCJGASA-N 0.000 description 8
- 239000012228 culture supernatant Substances 0.000 description 8
- 238000012217 deletion Methods 0.000 description 8
- 230000037430 deletion Effects 0.000 description 8
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 8
- 108010037850 glycylvaline Proteins 0.000 description 8
- 230000028993 immune response Effects 0.000 description 8
- 108010017391 lysylvaline Proteins 0.000 description 8
- 108010034507 methionyltryptophan Proteins 0.000 description 8
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 8
- 239000013603 viral vector Substances 0.000 description 8
- WKOBSJOZRJJVRZ-FXQIFTODSA-N Ala-Glu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WKOBSJOZRJJVRZ-FXQIFTODSA-N 0.000 description 7
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 7
- YKZJPIPFKGYHKY-DCAQKATOSA-N Arg-Leu-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKZJPIPFKGYHKY-DCAQKATOSA-N 0.000 description 7
- ISJWBVIYRBAXEB-CIUDSAMLSA-N Arg-Ser-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O ISJWBVIYRBAXEB-CIUDSAMLSA-N 0.000 description 7
- KXFCBAHYSLJCCY-ZLUOBGJFSA-N Asn-Asn-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O KXFCBAHYSLJCCY-ZLUOBGJFSA-N 0.000 description 7
- GFFRWIJAFFMQGM-NUMRIWBASA-N Asn-Glu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GFFRWIJAFFMQGM-NUMRIWBASA-N 0.000 description 7
- UXHYOWXTJLBEPG-GSSVUCPTSA-N Asn-Thr-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UXHYOWXTJLBEPG-GSSVUCPTSA-N 0.000 description 7
- DXQOQMCLWWADMU-ACZMJKKPSA-N Asp-Gln-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DXQOQMCLWWADMU-ACZMJKKPSA-N 0.000 description 7
- HMWBPUDETPKSSS-DCAQKATOSA-N Cys-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CS)N)C(=O)N[C@@H](CCCCN)C(=O)O HMWBPUDETPKSSS-DCAQKATOSA-N 0.000 description 7
- YQEHNIKPAOPBNH-DCAQKATOSA-N Cys-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CS)N YQEHNIKPAOPBNH-DCAQKATOSA-N 0.000 description 7
- QQAYIVHVRFJICE-AEJSXWLSSA-N Cys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N QQAYIVHVRFJICE-AEJSXWLSSA-N 0.000 description 7
- INKFLNZBTSNFON-CIUDSAMLSA-N Gln-Ala-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O INKFLNZBTSNFON-CIUDSAMLSA-N 0.000 description 7
- PKVWNYGXMNWJSI-CIUDSAMLSA-N Gln-Gln-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O PKVWNYGXMNWJSI-CIUDSAMLSA-N 0.000 description 7
- RGAOLBZBLOJUTP-GRLWGSQLSA-N Gln-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CCC(=O)N)N RGAOLBZBLOJUTP-GRLWGSQLSA-N 0.000 description 7
- XUZQMPGBGFQJMY-SRVKXCTJSA-N Gln-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N XUZQMPGBGFQJMY-SRVKXCTJSA-N 0.000 description 7
- IESFZVCAVACGPH-PEFMBERDSA-N Glu-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 7
- COVXELOAORHTND-LSJOCFKGSA-N Gly-Ile-Val Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O COVXELOAORHTND-LSJOCFKGSA-N 0.000 description 7
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 7
- YKUAGFAXQRYUQW-KKUMJFAQSA-N His-Tyr-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)O YKUAGFAXQRYUQW-KKUMJFAQSA-N 0.000 description 7
- GLYJPWIRLBAIJH-FQUUOJAGSA-N Ile-Lys-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N GLYJPWIRLBAIJH-FQUUOJAGSA-N 0.000 description 7
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 7
- PELCGFMHLZXWBQ-BJDJZHNGSA-N Ile-Ser-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)O)N PELCGFMHLZXWBQ-BJDJZHNGSA-N 0.000 description 7
- WCTCIIAGNMFYAO-DCAQKATOSA-N Leu-Cys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O WCTCIIAGNMFYAO-DCAQKATOSA-N 0.000 description 7
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 7
- RTIRBWJPYJYTLO-MELADBBJSA-N Leu-Lys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N RTIRBWJPYJYTLO-MELADBBJSA-N 0.000 description 7
- BIZNDKMFQHDOIE-KKUMJFAQSA-N Leu-Phe-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 BIZNDKMFQHDOIE-KKUMJFAQSA-N 0.000 description 7
- KLSUAWUZBMAZCL-RHYQMDGZSA-N Leu-Thr-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O KLSUAWUZBMAZCL-RHYQMDGZSA-N 0.000 description 7
- BTEMNFBEAAOGBR-BZSNNMDCSA-N Leu-Tyr-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BTEMNFBEAAOGBR-BZSNNMDCSA-N 0.000 description 7
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 7
- QTDBZORPVYTRJU-KKXDTOCCSA-N Phe-Tyr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O QTDBZORPVYTRJU-KKXDTOCCSA-N 0.000 description 7
- WWAQEUOYCYMGHB-FXQIFTODSA-N Pro-Asn-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 WWAQEUOYCYMGHB-FXQIFTODSA-N 0.000 description 7
- UPJGUQPLYWTISV-GUBZILKMSA-N Pro-Gln-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UPJGUQPLYWTISV-GUBZILKMSA-N 0.000 description 7
- HAAQQNHQZBOWFO-LURJTMIESA-N Pro-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H]1CCCN1 HAAQQNHQZBOWFO-LURJTMIESA-N 0.000 description 7
- VGNYHOBZJKWRGI-CIUDSAMLSA-N Ser-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO VGNYHOBZJKWRGI-CIUDSAMLSA-N 0.000 description 7
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 7
- PZVGOVRNGKEFCB-KKHAAJSZSA-N Thr-Asn-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N)O PZVGOVRNGKEFCB-KKHAAJSZSA-N 0.000 description 7
- JXKMXEBNZCKSDY-JIOCBJNQSA-N Thr-Asp-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O JXKMXEBNZCKSDY-JIOCBJNQSA-N 0.000 description 7
- CQNFRKAKGDSJFR-NUMRIWBASA-N Thr-Glu-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CQNFRKAKGDSJFR-NUMRIWBASA-N 0.000 description 7
- SIMKLINEDYOTKL-MBLNEYKQSA-N Thr-His-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C)C(=O)O)N)O SIMKLINEDYOTKL-MBLNEYKQSA-N 0.000 description 7
- FDALPRWYVKJCLL-PMVVWTBXSA-N Thr-His-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)NCC(O)=O FDALPRWYVKJCLL-PMVVWTBXSA-N 0.000 description 7
- QGVBFDIREUUSHX-IFFSRLJSSA-N Thr-Val-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O QGVBFDIREUUSHX-IFFSRLJSSA-N 0.000 description 7
- XBWKCYFGRXKWGO-SRVKXCTJSA-N Tyr-Cys-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O XBWKCYFGRXKWGO-SRVKXCTJSA-N 0.000 description 7
- WYOBRXPIZVKNMF-IRXDYDNUSA-N Tyr-Tyr-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)NCC(O)=O)C1=CC=C(O)C=C1 WYOBRXPIZVKNMF-IRXDYDNUSA-N 0.000 description 7
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 7
- OACSGBOREVRSME-NHCYSSNCSA-N Val-His-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CC(N)=O)C(O)=O OACSGBOREVRSME-NHCYSSNCSA-N 0.000 description 7
- HJSLDXZAZGFPDK-ULQDDVLXSA-N Val-Phe-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C(C)C)N HJSLDXZAZGFPDK-ULQDDVLXSA-N 0.000 description 7
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 7
- IRAUYEAFPFPVND-UVBJJODRSA-N Val-Trp-Ala Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 IRAUYEAFPFPVND-UVBJJODRSA-N 0.000 description 7
- 108010068380 arginylarginine Proteins 0.000 description 7
- 108010062796 arginyllysine Proteins 0.000 description 7
- 108010093581 aspartyl-proline Proteins 0.000 description 7
- 108010054812 diprotin A Proteins 0.000 description 7
- 239000012634 fragment Substances 0.000 description 7
- 108010025306 histidylleucine Proteins 0.000 description 7
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 7
- 108010009298 lysylglutamic acid Proteins 0.000 description 7
- 150000002772 monosaccharides Chemical class 0.000 description 7
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 7
- 108010015796 prolylisoleucine Proteins 0.000 description 7
- 239000011780 sodium chloride Substances 0.000 description 7
- 108010061238 threonyl-glycine Proteins 0.000 description 7
- 108010009962 valyltyrosine Proteins 0.000 description 7
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 6
- TZDNWXDLYFIFPT-BJDJZHNGSA-N Ala-Ile-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O TZDNWXDLYFIFPT-BJDJZHNGSA-N 0.000 description 6
- VHVVPYOJIIQCKS-QEJZJMRPSA-N Ala-Leu-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VHVVPYOJIIQCKS-QEJZJMRPSA-N 0.000 description 6
- RMAWDDRDTRSZIR-ZLUOBGJFSA-N Ala-Ser-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RMAWDDRDTRSZIR-ZLUOBGJFSA-N 0.000 description 6
- XPSGESXVBSQZPL-SRVKXCTJSA-N Arg-Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XPSGESXVBSQZPL-SRVKXCTJSA-N 0.000 description 6
- KMSHNDWHPWXPEC-BQBZGAKWSA-N Arg-Asp-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KMSHNDWHPWXPEC-BQBZGAKWSA-N 0.000 description 6
- LKDHUGLXOHYINY-XUXIUFHCSA-N Arg-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LKDHUGLXOHYINY-XUXIUFHCSA-N 0.000 description 6
- NPAVRDPEFVKELR-DCAQKATOSA-N Arg-Lys-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NPAVRDPEFVKELR-DCAQKATOSA-N 0.000 description 6
- QHBMKQWOIYJYMI-BYULHYEWSA-N Asn-Asn-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QHBMKQWOIYJYMI-BYULHYEWSA-N 0.000 description 6
- QRHYAUYXBVVDSB-LKXGYXEUSA-N Asn-Cys-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QRHYAUYXBVVDSB-LKXGYXEUSA-N 0.000 description 6
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 6
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 6
- LHLSSZYQFUNWRZ-NAKRPEOUSA-N Cys-Arg-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LHLSSZYQFUNWRZ-NAKRPEOUSA-N 0.000 description 6
- NQSUTVRXXBGVDQ-LKXGYXEUSA-N Cys-Asn-Thr Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NQSUTVRXXBGVDQ-LKXGYXEUSA-N 0.000 description 6
- YWEHYKGJWHPGPY-XGEHTFHBSA-N Cys-Thr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CS)N)O YWEHYKGJWHPGPY-XGEHTFHBSA-N 0.000 description 6
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 6
- DTCCMDYODDPHBG-ACZMJKKPSA-N Gln-Ala-Cys Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(O)=O DTCCMDYODDPHBG-ACZMJKKPSA-N 0.000 description 6
- KHGGWBRVRPHFMH-PEFMBERDSA-N Gln-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N KHGGWBRVRPHFMH-PEFMBERDSA-N 0.000 description 6
- LGIKBBLQVSWUGK-DCAQKATOSA-N Gln-Leu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGIKBBLQVSWUGK-DCAQKATOSA-N 0.000 description 6
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 6
- PCBBLFVHTYNQGG-LAEOZQHASA-N Glu-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N PCBBLFVHTYNQGG-LAEOZQHASA-N 0.000 description 6
- DAHLWSFUXOHMIA-FXQIFTODSA-N Glu-Ser-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O DAHLWSFUXOHMIA-FXQIFTODSA-N 0.000 description 6
- BGVYNAQWHSTTSP-BYULHYEWSA-N Gly-Asn-Ile Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BGVYNAQWHSTTSP-BYULHYEWSA-N 0.000 description 6
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 6
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 6
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 6
- 208000031886 HIV Infections Diseases 0.000 description 6
- NULSANWBUWLTKN-NAKRPEOUSA-N Ile-Arg-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N NULSANWBUWLTKN-NAKRPEOUSA-N 0.000 description 6
- NURNJECQNNCRBK-FLBSBUHZSA-N Ile-Thr-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NURNJECQNNCRBK-FLBSBUHZSA-N 0.000 description 6
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 6
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 6
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 6
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 6
- ORWTWZXGDBYVCP-BJDJZHNGSA-N Leu-Ile-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(C)C ORWTWZXGDBYVCP-BJDJZHNGSA-N 0.000 description 6
- DCGXHWINSHEPIR-SRVKXCTJSA-N Leu-Lys-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)O)N DCGXHWINSHEPIR-SRVKXCTJSA-N 0.000 description 6
- YESNGRDJQWDYLH-KKUMJFAQSA-N Leu-Phe-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)O)N YESNGRDJQWDYLH-KKUMJFAQSA-N 0.000 description 6
- CLBGMWIYPYAZPR-AVGNSLFASA-N Lys-Arg-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O CLBGMWIYPYAZPR-AVGNSLFASA-N 0.000 description 6
- XTONYTDATVADQH-CIUDSAMLSA-N Lys-Cys-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O XTONYTDATVADQH-CIUDSAMLSA-N 0.000 description 6
- YVMQJGWLHRWMDF-MNXVOIDGSA-N Lys-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N YVMQJGWLHRWMDF-MNXVOIDGSA-N 0.000 description 6
- RZHLIPMZXOEJTL-AVGNSLFASA-N Lys-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N RZHLIPMZXOEJTL-AVGNSLFASA-N 0.000 description 6
- JCVOHUKUYSYBAD-DCAQKATOSA-N Lys-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCCCN)N)C(=O)N[C@@H](CS)C(=O)O JCVOHUKUYSYBAD-DCAQKATOSA-N 0.000 description 6
- CAVRAQIDHUPECU-UVOCVTCTSA-N Lys-Thr-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAVRAQIDHUPECU-UVOCVTCTSA-N 0.000 description 6
- BVRNWWHJYNPJDG-XIRDDKMYSA-N Lys-Trp-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N BVRNWWHJYNPJDG-XIRDDKMYSA-N 0.000 description 6
- RKIIYGUHIQJCBW-SRVKXCTJSA-N Met-His-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RKIIYGUHIQJCBW-SRVKXCTJSA-N 0.000 description 6
- RKRFGIBULDYDPF-XIRDDKMYSA-N Met-Trp-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N RKRFGIBULDYDPF-XIRDDKMYSA-N 0.000 description 6
- OVTOTTGZBWXLFU-QXEWZRGKSA-N Met-Val-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O OVTOTTGZBWXLFU-QXEWZRGKSA-N 0.000 description 6
- LNIIRLODKOWQIY-IHRRRGAJSA-N Phe-Asn-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O LNIIRLODKOWQIY-IHRRRGAJSA-N 0.000 description 6
- 108010076504 Protein Sorting Signals Proteins 0.000 description 6
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 6
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 6
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 6
- SZRNDHWMVSFPSP-XKBZYTNZSA-N Ser-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N)O SZRNDHWMVSFPSP-XKBZYTNZSA-N 0.000 description 6
- BDMWLJLPPUCLNV-XGEHTFHBSA-N Ser-Thr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BDMWLJLPPUCLNV-XGEHTFHBSA-N 0.000 description 6
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 6
- YAAPRMFURSENOZ-KATARQTJSA-N Thr-Cys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N)O YAAPRMFURSENOZ-KATARQTJSA-N 0.000 description 6
- KZURUCDWKDEAFZ-XVSYOHENSA-N Thr-Phe-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O KZURUCDWKDEAFZ-XVSYOHENSA-N 0.000 description 6
- 239000007983 Tris buffer Substances 0.000 description 6
- TWJDQTTXXZDJKV-BPUTZDHNSA-N Trp-Arg-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O TWJDQTTXXZDJKV-BPUTZDHNSA-N 0.000 description 6
- PMHLLBKTDHQMCY-ULQDDVLXSA-N Tyr-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMHLLBKTDHQMCY-ULQDDVLXSA-N 0.000 description 6
- VLDMQVZZWDOKQF-AUTRQRHGSA-N Val-Glu-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VLDMQVZZWDOKQF-AUTRQRHGSA-N 0.000 description 6
- QZKVWWIUSQGWMY-IHRRRGAJSA-N Val-Ser-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QZKVWWIUSQGWMY-IHRRRGAJSA-N 0.000 description 6
- 239000002671 adjuvant Substances 0.000 description 6
- 108010013835 arginine glutamate Proteins 0.000 description 6
- 210000004899 c-terminal region Anatomy 0.000 description 6
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 6
- 108010060199 cysteinylproline Proteins 0.000 description 6
- 238000000113 differential scanning calorimetry Methods 0.000 description 6
- 239000003937 drug carrier Substances 0.000 description 6
- 230000002068 genetic effect Effects 0.000 description 6
- 108010079547 glutamylmethionine Proteins 0.000 description 6
- 108010000761 leucylarginine Proteins 0.000 description 6
- 238000002844 melting Methods 0.000 description 6
- 230000008018 melting Effects 0.000 description 6
- 238000000569 multi-angle light scattering Methods 0.000 description 6
- 108090000765 processed proteins & peptides Proteins 0.000 description 6
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 6
- 108010073969 valyllysine Proteins 0.000 description 6
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 5
- QDRGPQWIVZNJQD-CIUDSAMLSA-N Ala-Arg-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O QDRGPQWIVZNJQD-CIUDSAMLSA-N 0.000 description 5
- DUMYKLNEYCJLQK-UHFFFAOYSA-N Ala-Gln-Gln-His Chemical compound CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(=O)NC(C(O)=O)CC1=CN=CN1 DUMYKLNEYCJLQK-UHFFFAOYSA-N 0.000 description 5
- ANGAOPNEPIDLPO-XVYDVKMFSA-N Ala-His-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CS)C(=O)O)N ANGAOPNEPIDLPO-XVYDVKMFSA-N 0.000 description 5
- QUIGLPSHIFPEOV-CIUDSAMLSA-N Ala-Lys-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O QUIGLPSHIFPEOV-CIUDSAMLSA-N 0.000 description 5
- FFZJHQODAYHGPO-KZVJFYERSA-N Ala-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N FFZJHQODAYHGPO-KZVJFYERSA-N 0.000 description 5
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 5
- HGKHPCFTRQDHCU-IUCAKERBSA-N Arg-Pro-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HGKHPCFTRQDHCU-IUCAKERBSA-N 0.000 description 5
- SLKLLQWZQHXYSV-CIUDSAMLSA-N Asn-Ala-Lys Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O SLKLLQWZQHXYSV-CIUDSAMLSA-N 0.000 description 5
- DXZNJWFECGJCQR-FXQIFTODSA-N Asn-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N DXZNJWFECGJCQR-FXQIFTODSA-N 0.000 description 5
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 5
- NUCUBYIUPVYGPP-XIRDDKMYSA-N Asn-Leu-Trp Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CC(N)=O)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O NUCUBYIUPVYGPP-XIRDDKMYSA-N 0.000 description 5
- JXMREEPBRANWBY-VEVYYDQMSA-N Asn-Thr-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JXMREEPBRANWBY-VEVYYDQMSA-N 0.000 description 5
- JBDLMLZNDRLDIX-HJGDQZAQSA-N Asn-Thr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O JBDLMLZNDRLDIX-HJGDQZAQSA-N 0.000 description 5
- 102000008857 Ferritin Human genes 0.000 description 5
- 108050000784 Ferritin Proteins 0.000 description 5
- 238000008416 Ferritin Methods 0.000 description 5
- COYGBRTZEVWZBW-XKBZYTNZSA-N Gln-Cys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCC(N)=O COYGBRTZEVWZBW-XKBZYTNZSA-N 0.000 description 5
- IWUFOVSLWADEJC-AVGNSLFASA-N Gln-His-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IWUFOVSLWADEJC-AVGNSLFASA-N 0.000 description 5
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 5
- ZCOJVESMNGBGLF-GRLWGSQLSA-N Glu-Ile-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZCOJVESMNGBGLF-GRLWGSQLSA-N 0.000 description 5
- YTRBQAQSUDSIQE-FHWLQOOXSA-N Glu-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 YTRBQAQSUDSIQE-FHWLQOOXSA-N 0.000 description 5
- FZQLXNIMCPJVJE-YUMQZZPRSA-N Gly-Asp-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FZQLXNIMCPJVJE-YUMQZZPRSA-N 0.000 description 5
- QCTLGOYODITHPQ-WHFBIAKZSA-N Gly-Cys-Ser Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O QCTLGOYODITHPQ-WHFBIAKZSA-N 0.000 description 5
- NPSWCZIRBAYNSB-JHEQGTHGSA-N Gly-Gln-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPSWCZIRBAYNSB-JHEQGTHGSA-N 0.000 description 5
- QSQXZZCGPXQBPP-BQBZGAKWSA-N Gly-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)CN)C(=O)N[C@@H](CS)C(=O)O QSQXZZCGPXQBPP-BQBZGAKWSA-N 0.000 description 5
- IALQAMYQJBZNSK-WHFBIAKZSA-N Gly-Ser-Asn Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O IALQAMYQJBZNSK-WHFBIAKZSA-N 0.000 description 5
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 5
- UIQGJYUEQDOODF-KWQFWETISA-N Gly-Tyr-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 UIQGJYUEQDOODF-KWQFWETISA-N 0.000 description 5
- RBOOOLVEKJHUNA-CIUDSAMLSA-N His-Cys-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O RBOOOLVEKJHUNA-CIUDSAMLSA-N 0.000 description 5
- IAYPZSHNZQHQNO-KKUMJFAQSA-N His-Ser-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC2=CN=CN2)N IAYPZSHNZQHQNO-KKUMJFAQSA-N 0.000 description 5
- -1 IDS Species 0.000 description 5
- KFVUBLZRFSVDGO-BYULHYEWSA-N Ile-Gly-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O KFVUBLZRFSVDGO-BYULHYEWSA-N 0.000 description 5
- BBQABUDWDUKJMB-LZXPERKUSA-N Ile-Ile-Ile Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C([O-])=O BBQABUDWDUKJMB-LZXPERKUSA-N 0.000 description 5
- PNTWNAXGBOZMBO-MNXVOIDGSA-N Ile-Lys-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PNTWNAXGBOZMBO-MNXVOIDGSA-N 0.000 description 5
- AUIYHFRUOOKTGX-UKJIMTQDSA-N Ile-Val-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N AUIYHFRUOOKTGX-UKJIMTQDSA-N 0.000 description 5
- 241000880493 Leptailurus serval Species 0.000 description 5
- KKXDHFKZWKLYGB-GUBZILKMSA-N Leu-Asn-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKXDHFKZWKLYGB-GUBZILKMSA-N 0.000 description 5
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 5
- HIIZIQUUHIXUJY-GUBZILKMSA-N Lys-Asp-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HIIZIQUUHIXUJY-GUBZILKMSA-N 0.000 description 5
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 5
- HYSVGEAWTGPMOA-IHRRRGAJSA-N Lys-Pro-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O HYSVGEAWTGPMOA-IHRRRGAJSA-N 0.000 description 5
- WINFHLHJTRGLCV-BZSNNMDCSA-N Lys-Tyr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=C(O)C=C1 WINFHLHJTRGLCV-BZSNNMDCSA-N 0.000 description 5
- IUYCGMNKIZDRQI-BQBZGAKWSA-N Met-Gly-Ala Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O IUYCGMNKIZDRQI-BQBZGAKWSA-N 0.000 description 5
- XLTSAUGGDYRFLS-UMPQAUOISA-N Met-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCSC)N)O XLTSAUGGDYRFLS-UMPQAUOISA-N 0.000 description 5
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 5
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 5
- QMMRHASQEVCJGR-UBHSHLNASA-N Phe-Ala-Pro Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=CC=C1 QMMRHASQEVCJGR-UBHSHLNASA-N 0.000 description 5
- HHOOEUSPFGPZFP-QWRGUYRKSA-N Phe-Asn-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HHOOEUSPFGPZFP-QWRGUYRKSA-N 0.000 description 5
- CVAUVSOFHJKCHN-BZSNNMDCSA-N Phe-Tyr-Cys Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CS)C(O)=O)C1=CC=CC=C1 CVAUVSOFHJKCHN-BZSNNMDCSA-N 0.000 description 5
- LUGOKRWYNMDGTD-FXQIFTODSA-N Pro-Cys-Asn Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O LUGOKRWYNMDGTD-FXQIFTODSA-N 0.000 description 5
- IBGCFJDLCYTKPW-NAKRPEOUSA-N Pro-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 IBGCFJDLCYTKPW-NAKRPEOUSA-N 0.000 description 5
- FXGIMYRVJJEIIM-UWVGGRQHSA-N Pro-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FXGIMYRVJJEIIM-UWVGGRQHSA-N 0.000 description 5
- WOIFYRZPIORBRY-AVGNSLFASA-N Pro-Lys-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O WOIFYRZPIORBRY-AVGNSLFASA-N 0.000 description 5
- RSTWKJFWBKFOFC-JYJNAYRXSA-N Pro-Trp-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O RSTWKJFWBKFOFC-JYJNAYRXSA-N 0.000 description 5
- FHJQROWZEJFZPO-SRVKXCTJSA-N Pro-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FHJQROWZEJFZPO-SRVKXCTJSA-N 0.000 description 5
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 5
- WSTIOCFMWXNOCX-YUMQZZPRSA-N Ser-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N WSTIOCFMWXNOCX-YUMQZZPRSA-N 0.000 description 5
- YIUWWXVTYLANCJ-NAKRPEOUSA-N Ser-Ile-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O YIUWWXVTYLANCJ-NAKRPEOUSA-N 0.000 description 5
- FLMYSKVSDVHLEW-SVSWQMSJSA-N Ser-Thr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLMYSKVSDVHLEW-SVSWQMSJSA-N 0.000 description 5
- OYTNZCBFDXGQGE-XQXXSGGOSA-N Thr-Gln-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O OYTNZCBFDXGQGE-XQXXSGGOSA-N 0.000 description 5
- RKDFEMGVMMYYNG-WDCWCFNPSA-N Thr-Gln-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O RKDFEMGVMMYYNG-WDCWCFNPSA-N 0.000 description 5
- JMGJDTNUMAZNLX-RWRJDSDZSA-N Thr-Glu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JMGJDTNUMAZNLX-RWRJDSDZSA-N 0.000 description 5
- NIEWSKWFURSECR-FOHZUACHSA-N Thr-Gly-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NIEWSKWFURSECR-FOHZUACHSA-N 0.000 description 5
- GMXIJHCBTZDAPD-QPHKQPEJSA-N Thr-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N GMXIJHCBTZDAPD-QPHKQPEJSA-N 0.000 description 5
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 5
- QHUWWSQZTFLXPQ-FJXKBIBVSA-N Thr-Met-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O QHUWWSQZTFLXPQ-FJXKBIBVSA-N 0.000 description 5
- UKINEYBQXPMOJO-UBHSHLNASA-N Trp-Asn-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N UKINEYBQXPMOJO-UBHSHLNASA-N 0.000 description 5
- IQGJAHMZWBTRIF-UBHSHLNASA-N Trp-Asp-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N IQGJAHMZWBTRIF-UBHSHLNASA-N 0.000 description 5
- MHCLIYHJRXZBGJ-AAEUAGOBSA-N Trp-Gly-Cys Chemical compound N[C@@H](CC1=CNC2=CC=CC=C12)C(=O)NCC(=O)N[C@@H](CS)C(=O)O MHCLIYHJRXZBGJ-AAEUAGOBSA-N 0.000 description 5
- DNUJCLUFRGGSDJ-YLVFBTJISA-N Trp-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CNC2=CC=CC=C21)N DNUJCLUFRGGSDJ-YLVFBTJISA-N 0.000 description 5
- KBKTUNYBNJWFRL-UBHSHLNASA-N Trp-Ser-Asn Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O)=CNC2=C1 KBKTUNYBNJWFRL-UBHSHLNASA-N 0.000 description 5
- ADBDQGBDNUTRDB-ULQDDVLXSA-N Tyr-Arg-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O ADBDQGBDNUTRDB-ULQDDVLXSA-N 0.000 description 5
- KVRLNEILGGVBJX-IHRRRGAJSA-N Val-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CN=CN1 KVRLNEILGGVBJX-IHRRRGAJSA-N 0.000 description 5
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 5
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 5
- 238000001042 affinity chromatography Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 238000004113 cell culture Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 108010078144 glutaminyl-glycine Proteins 0.000 description 5
- 108010015792 glycyllysine Proteins 0.000 description 5
- 108010027338 isoleucylcysteine Proteins 0.000 description 5
- 108010078274 isoleucylvaline Proteins 0.000 description 5
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 5
- 108010054155 lysyllysine Proteins 0.000 description 5
- 108010038320 lysylphenylalanine Proteins 0.000 description 5
- 239000012528 membrane Substances 0.000 description 5
- 210000004379 membrane Anatomy 0.000 description 5
- 229920001184 polypeptide Polymers 0.000 description 5
- 238000002360 preparation method Methods 0.000 description 5
- 102000004196 processed proteins & peptides Human genes 0.000 description 5
- 108010038745 tryptophylglycine Proteins 0.000 description 5
- 125000002987 valine group Chemical group [H]N([H])C([H])(C(*)=O)C([H])(C([H])([H])[H])C([H])([H])[H] 0.000 description 5
- 108010043941 valyl-glutamyl-isoleucyl-asparaginyl-cysteinyl-threonyl-arginine Proteins 0.000 description 5
- 230000003612 virological effect Effects 0.000 description 5
- NIZKGBJVCMRDKO-KWQFWETISA-N Ala-Gly-Tyr Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NIZKGBJVCMRDKO-KWQFWETISA-N 0.000 description 4
- LXAARTARZJJCMB-CIQUZCHMSA-N Ala-Ile-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LXAARTARZJJCMB-CIQUZCHMSA-N 0.000 description 4
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 4
- PQWTZSNVWSOFFK-FXQIFTODSA-N Arg-Asp-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)CN=C(N)N PQWTZSNVWSOFFK-FXQIFTODSA-N 0.000 description 4
- HNJNAMGZQZPSRE-GUBZILKMSA-N Arg-Pro-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O HNJNAMGZQZPSRE-GUBZILKMSA-N 0.000 description 4
- XQQVCUIBGYFKDC-OLHMAJIHSA-N Asn-Asp-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XQQVCUIBGYFKDC-OLHMAJIHSA-N 0.000 description 4
- PQAIOUVVZCOLJK-FXQIFTODSA-N Asn-Gln-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PQAIOUVVZCOLJK-FXQIFTODSA-N 0.000 description 4
- VITDJIPIJZAVGC-VEVYYDQMSA-N Asn-Met-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VITDJIPIJZAVGC-VEVYYDQMSA-N 0.000 description 4
- HNXWVVHIGTZTBO-LKXGYXEUSA-N Asn-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O HNXWVVHIGTZTBO-LKXGYXEUSA-N 0.000 description 4
- QYRMBFWDSFGSFC-OLHMAJIHSA-N Asn-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QYRMBFWDSFGSFC-OLHMAJIHSA-N 0.000 description 4
- XEGZSHSPQNDNRH-JRQIVUDYSA-N Asn-Tyr-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XEGZSHSPQNDNRH-JRQIVUDYSA-N 0.000 description 4
- WSOKZUVWBXVJHX-CIUDSAMLSA-N Asp-Arg-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O WSOKZUVWBXVJHX-CIUDSAMLSA-N 0.000 description 4
- YNQIDCRRTWGHJD-ZLUOBGJFSA-N Asp-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(O)=O YNQIDCRRTWGHJD-ZLUOBGJFSA-N 0.000 description 4
- ICTXFVKYAGQURS-UBHSHLNASA-N Asp-Asn-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ICTXFVKYAGQURS-UBHSHLNASA-N 0.000 description 4
- UZNSWMFLKVKJLI-VHWLVUOQSA-N Asp-Ile-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O UZNSWMFLKVKJLI-VHWLVUOQSA-N 0.000 description 4
- YTXCCDCOHIYQFC-GUBZILKMSA-N Asp-Met-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O YTXCCDCOHIYQFC-GUBZILKMSA-N 0.000 description 4
- MVRGBQGZSDJBSM-GMOBBJLQSA-N Asp-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)O)N MVRGBQGZSDJBSM-GMOBBJLQSA-N 0.000 description 4
- PKNIZMPLMSKROD-BIIVOSGPSA-N Cys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N PKNIZMPLMSKROD-BIIVOSGPSA-N 0.000 description 4
- NXQCSPVUPLUTJH-WHFBIAKZSA-N Cys-Ser-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O NXQCSPVUPLUTJH-WHFBIAKZSA-N 0.000 description 4
- UKHNKRGNFKSHCG-CUJWVEQBSA-N Cys-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CS)N)O UKHNKRGNFKSHCG-CUJWVEQBSA-N 0.000 description 4
- RBWKVOSARCFSQQ-FXQIFTODSA-N Gln-Gln-Ser Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O RBWKVOSARCFSQQ-FXQIFTODSA-N 0.000 description 4
- KDXKFBSNIJYNNR-YVNDNENWSA-N Gln-Glu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDXKFBSNIJYNNR-YVNDNENWSA-N 0.000 description 4
- HPCOBEHVEHWREJ-DCAQKATOSA-N Gln-Lys-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HPCOBEHVEHWREJ-DCAQKATOSA-N 0.000 description 4
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 4
- RDDSZZJOKDVPAE-ACZMJKKPSA-N Glu-Asn-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDDSZZJOKDVPAE-ACZMJKKPSA-N 0.000 description 4
- BIHMNDPWRUROFZ-JYJNAYRXSA-N Glu-His-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BIHMNDPWRUROFZ-JYJNAYRXSA-N 0.000 description 4
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 4
- CUPSDFQZTVVTSK-GUBZILKMSA-N Glu-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O CUPSDFQZTVVTSK-GUBZILKMSA-N 0.000 description 4
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 4
- ZRZILYKEJBMFHY-BQBZGAKWSA-N Gly-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN ZRZILYKEJBMFHY-BQBZGAKWSA-N 0.000 description 4
- GDOZQTNZPCUARW-YFKPBYRVSA-N Gly-Gly-Glu Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O GDOZQTNZPCUARW-YFKPBYRVSA-N 0.000 description 4
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 4
- UYPPAMNTTMJHJW-KCTSRDHCSA-N Gly-Ile-Trp Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O UYPPAMNTTMJHJW-KCTSRDHCSA-N 0.000 description 4
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 4
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 4
- PGTISAJTWZPFGN-PEXQALLHSA-N His-Gly-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O PGTISAJTWZPFGN-PEXQALLHSA-N 0.000 description 4
- 241000282412 Homo Species 0.000 description 4
- DMHGKBGOUAJRHU-UHFFFAOYSA-N Ile-Arg-Pro Natural products CCC(C)C(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O DMHGKBGOUAJRHU-UHFFFAOYSA-N 0.000 description 4
- RSDHVTMRXSABSV-GHCJXIJMSA-N Ile-Asn-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N RSDHVTMRXSABSV-GHCJXIJMSA-N 0.000 description 4
- VNDQNDYEPSXHLU-JUKXBJQTSA-N Ile-His-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N VNDQNDYEPSXHLU-JUKXBJQTSA-N 0.000 description 4
- TVYWVSJGSHQWMT-AJNGGQMLSA-N Ile-Leu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N TVYWVSJGSHQWMT-AJNGGQMLSA-N 0.000 description 4
- JHNJNTMTZHEDLJ-NAKRPEOUSA-N Ile-Ser-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JHNJNTMTZHEDLJ-NAKRPEOUSA-N 0.000 description 4
- KBDIBHQICWDGDL-PPCPHDFISA-N Ile-Thr-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N KBDIBHQICWDGDL-PPCPHDFISA-N 0.000 description 4
- JCGMFFQQHJQASB-PYJNHQTQSA-N Ile-Val-His Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O JCGMFFQQHJQASB-PYJNHQTQSA-N 0.000 description 4
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 4
- JUWJEAPUNARGCF-DCAQKATOSA-N Leu-Arg-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O JUWJEAPUNARGCF-DCAQKATOSA-N 0.000 description 4
- BAJIJEGGUYXZGC-CIUDSAMLSA-N Leu-Asn-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N BAJIJEGGUYXZGC-CIUDSAMLSA-N 0.000 description 4
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 4
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 4
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 4
- WLCYCADOWRMSAJ-CIUDSAMLSA-N Lys-Asn-Cys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(O)=O WLCYCADOWRMSAJ-CIUDSAMLSA-N 0.000 description 4
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 4
- YCJCEMKOZOYBEF-OEAJRASXSA-N Lys-Thr-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YCJCEMKOZOYBEF-OEAJRASXSA-N 0.000 description 4
- IKXQOBUBZSOWDY-AVGNSLFASA-N Lys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N IKXQOBUBZSOWDY-AVGNSLFASA-N 0.000 description 4
- 241000124008 Mammalia Species 0.000 description 4
- CSDMCMITJLKBAH-SOUVJXGZSA-N Phe-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O CSDMCMITJLKBAH-SOUVJXGZSA-N 0.000 description 4
- LHALYDBUDCWMDY-CIUDSAMLSA-N Pro-Glu-Ala Chemical compound C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O LHALYDBUDCWMDY-CIUDSAMLSA-N 0.000 description 4
- JMVQDLDPDBXAAX-YUMQZZPRSA-N Pro-Gly-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 JMVQDLDPDBXAAX-YUMQZZPRSA-N 0.000 description 4
- RUDOLGWDSKQQFF-DCAQKATOSA-N Pro-Leu-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O RUDOLGWDSKQQFF-DCAQKATOSA-N 0.000 description 4
- CDVFZMOFNJPUDD-ACZMJKKPSA-N Ser-Gln-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CDVFZMOFNJPUDD-ACZMJKKPSA-N 0.000 description 4
- WBINSDOPZHQPPM-AVGNSLFASA-N Ser-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)O WBINSDOPZHQPPM-AVGNSLFASA-N 0.000 description 4
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 4
- DKGRNFUXVTYRAS-UBHSHLNASA-N Ser-Ser-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O DKGRNFUXVTYRAS-UBHSHLNASA-N 0.000 description 4
- ZWSZBWAFDZRBNM-UBHSHLNASA-N Ser-Trp-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O ZWSZBWAFDZRBNM-UBHSHLNASA-N 0.000 description 4
- 102100036011 T-cell surface glycoprotein CD4 Human genes 0.000 description 4
- GZYNMZQXFRWDFH-YTWAJWBKSA-N Thr-Arg-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O GZYNMZQXFRWDFH-YTWAJWBKSA-N 0.000 description 4
- VIBXMCZWVUOZLA-OLHMAJIHSA-N Thr-Asn-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O VIBXMCZWVUOZLA-OLHMAJIHSA-N 0.000 description 4
- XOTBWOCSLMBGMF-SUSMZKCASA-N Thr-Glu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOTBWOCSLMBGMF-SUSMZKCASA-N 0.000 description 4
- IHAPJUHCZXBPHR-WZLNRYEVSA-N Thr-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N IHAPJUHCZXBPHR-WZLNRYEVSA-N 0.000 description 4
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 4
- HPQHHRLWSAMMKG-KATARQTJSA-N Thr-Lys-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)O)N)O HPQHHRLWSAMMKG-KATARQTJSA-N 0.000 description 4
- WRQLCVIALDUQEQ-UNQGMJICSA-N Thr-Phe-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WRQLCVIALDUQEQ-UNQGMJICSA-N 0.000 description 4
- MEBDIIKMUUNBSB-RPTUDFQQSA-N Thr-Phe-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MEBDIIKMUUNBSB-RPTUDFQQSA-N 0.000 description 4
- STUAPCLEDMKXKL-LKXGYXEUSA-N Thr-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O STUAPCLEDMKXKL-LKXGYXEUSA-N 0.000 description 4
- FRQRWAMUESPWMT-HSHDSVGOSA-N Thr-Trp-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCSC)C(=O)O)N)O FRQRWAMUESPWMT-HSHDSVGOSA-N 0.000 description 4
- SMLCYZYQFRTLCO-UWJYBYFXSA-N Tyr-Cys-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O SMLCYZYQFRTLCO-UWJYBYFXSA-N 0.000 description 4
- CFSSLXZJEMERJY-NRPADANISA-N Val-Gln-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CFSSLXZJEMERJY-NRPADANISA-N 0.000 description 4
- VCAWFLIWYNMHQP-UKJIMTQDSA-N Val-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N VCAWFLIWYNMHQP-UKJIMTQDSA-N 0.000 description 4
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 4
- VVIZITNVZUAEMI-DLOVCJGASA-N Val-Val-Gln Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O VVIZITNVZUAEMI-DLOVCJGASA-N 0.000 description 4
- AOILQMZPNLUXCM-AVGNSLFASA-N Val-Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN AOILQMZPNLUXCM-AVGNSLFASA-N 0.000 description 4
- 108010070944 alanylhistidine Proteins 0.000 description 4
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 108010054813 diprotin B Proteins 0.000 description 4
- 108010049041 glutamylalanine Proteins 0.000 description 4
- 150000004676 glycans Chemical group 0.000 description 4
- 238000010438 heat treatment Methods 0.000 description 4
- 108010036413 histidylglycine Proteins 0.000 description 4
- 108010018006 histidylserine Proteins 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 238000002347 injection Methods 0.000 description 4
- 239000007924 injection Substances 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 229930182817 methionine Natural products 0.000 description 4
- 229910052759 nickel Inorganic materials 0.000 description 4
- 239000008194 pharmaceutical composition Substances 0.000 description 4
- 238000003752 polymerase chain reaction Methods 0.000 description 4
- 102000005962 receptors Human genes 0.000 description 4
- 108020003175 receptors Proteins 0.000 description 4
- 102200042487 rs141568342 Human genes 0.000 description 4
- GXPCCSYVSYFRDU-LJWNLINESA-N 2-[[(2s)-2-[[(2s)-2-[[2-[[(2s)-2-[[(2s)-2-amino-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]acetyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]acetic acid Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O)C1=CC=CC=C1 GXPCCSYVSYFRDU-LJWNLINESA-N 0.000 description 3
- NHLAEBFGWPXFGI-WHFBIAKZSA-N Ala-Gly-Asn Chemical compound C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N NHLAEBFGWPXFGI-WHFBIAKZSA-N 0.000 description 3
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 3
- OINVDEKBKBCPLX-JXUBOQSCSA-N Ala-Lys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OINVDEKBKBCPLX-JXUBOQSCSA-N 0.000 description 3
- FVNAUOZKIPAYNA-BPNCWPANSA-N Ala-Met-Tyr Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FVNAUOZKIPAYNA-BPNCWPANSA-N 0.000 description 3
- OLVCTPPSXNRGKV-GUBZILKMSA-N Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OLVCTPPSXNRGKV-GUBZILKMSA-N 0.000 description 3
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 3
- NLYYHIKRBRMAJV-AEJSXWLSSA-N Ala-Val-Pro Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N NLYYHIKRBRMAJV-AEJSXWLSSA-N 0.000 description 3
- VYSRNGOMGHOJCK-GUBZILKMSA-N Arg-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N VYSRNGOMGHOJCK-GUBZILKMSA-N 0.000 description 3
- DBKNLHKEVPZVQC-LPEHRKFASA-N Arg-Ala-Pro Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O DBKNLHKEVPZVQC-LPEHRKFASA-N 0.000 description 3
- SQKPKIJVWHAWNF-DCAQKATOSA-N Arg-Asp-Lys Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(O)=O SQKPKIJVWHAWNF-DCAQKATOSA-N 0.000 description 3
- JVMKBJNSRZWDBO-FXQIFTODSA-N Arg-Cys-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O JVMKBJNSRZWDBO-FXQIFTODSA-N 0.000 description 3
- FEZJJKXNPSEYEV-CIUDSAMLSA-N Arg-Gln-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FEZJJKXNPSEYEV-CIUDSAMLSA-N 0.000 description 3
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 3
- OHYQKYUTLIPFOX-ZPFDUUQYSA-N Arg-Glu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OHYQKYUTLIPFOX-ZPFDUUQYSA-N 0.000 description 3
- OGUPCHKBOKJFMA-SRVKXCTJSA-N Arg-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N OGUPCHKBOKJFMA-SRVKXCTJSA-N 0.000 description 3
- UAOSDDXCTBIPCA-QXEWZRGKSA-N Arg-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UAOSDDXCTBIPCA-QXEWZRGKSA-N 0.000 description 3
- RIIVUOJDDQXHRV-SRVKXCTJSA-N Arg-Lys-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O RIIVUOJDDQXHRV-SRVKXCTJSA-N 0.000 description 3
- VUGWHBXPMAHEGZ-SRVKXCTJSA-N Arg-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N VUGWHBXPMAHEGZ-SRVKXCTJSA-N 0.000 description 3
- WOZDCBHUGJVJPL-AVGNSLFASA-N Arg-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WOZDCBHUGJVJPL-AVGNSLFASA-N 0.000 description 3
- DAPLJWATMAXPPZ-CIUDSAMLSA-N Asn-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O DAPLJWATMAXPPZ-CIUDSAMLSA-N 0.000 description 3
- BGINHSZTXRJIPP-FXQIFTODSA-N Asn-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N BGINHSZTXRJIPP-FXQIFTODSA-N 0.000 description 3
- SEKBHZJLARBNPB-GHCJXIJMSA-N Asn-Ile-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O SEKBHZJLARBNPB-GHCJXIJMSA-N 0.000 description 3
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 3
- SNYCNNPOFYBCEK-ZLUOBGJFSA-N Asn-Ser-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O SNYCNNPOFYBCEK-ZLUOBGJFSA-N 0.000 description 3
- XLDMSQYOYXINSZ-QXEWZRGKSA-N Asn-Val-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N XLDMSQYOYXINSZ-QXEWZRGKSA-N 0.000 description 3
- LJRPYAZQQWHEEV-FXQIFTODSA-N Asp-Gln-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O LJRPYAZQQWHEEV-FXQIFTODSA-N 0.000 description 3
- VSMYBNPOHYAXSD-GUBZILKMSA-N Asp-Lys-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O VSMYBNPOHYAXSD-GUBZILKMSA-N 0.000 description 3
- GWWSUMLEWKQHLR-NUMRIWBASA-N Asp-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O GWWSUMLEWKQHLR-NUMRIWBASA-N 0.000 description 3
- 108010041397 CD4 Antigens Proteins 0.000 description 3
- CEZSLNCYQUFOSL-BQBZGAKWSA-N Cys-Arg-Gly Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O CEZSLNCYQUFOSL-BQBZGAKWSA-N 0.000 description 3
- DCXGXDGGXVZVMY-GHCJXIJMSA-N Cys-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CS DCXGXDGGXVZVMY-GHCJXIJMSA-N 0.000 description 3
- MKMKILWCRQLDFJ-DCAQKATOSA-N Cys-Lys-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MKMKILWCRQLDFJ-DCAQKATOSA-N 0.000 description 3
- NRVQLLDIJJEIIZ-VZFHVOOUSA-N Cys-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CS)N)O NRVQLLDIJJEIIZ-VZFHVOOUSA-N 0.000 description 3
- UWZLBXOBVKRUFE-HGNGGELXSA-N Gln-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N UWZLBXOBVKRUFE-HGNGGELXSA-N 0.000 description 3
- XFKUFUJECJUQTQ-CIUDSAMLSA-N Gln-Gln-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XFKUFUJECJUQTQ-CIUDSAMLSA-N 0.000 description 3
- MAGNEQBFSBREJL-DCAQKATOSA-N Gln-Glu-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N MAGNEQBFSBREJL-DCAQKATOSA-N 0.000 description 3
- GLAPJAHOPFSLKL-SRVKXCTJSA-N Gln-His-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)N)N GLAPJAHOPFSLKL-SRVKXCTJSA-N 0.000 description 3
- QKWBEMCLYTYBNI-GVXVVHGQSA-N Gln-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O QKWBEMCLYTYBNI-GVXVVHGQSA-N 0.000 description 3
- FYBSCGZLICNOBA-XQXXSGGOSA-N Glu-Ala-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FYBSCGZLICNOBA-XQXXSGGOSA-N 0.000 description 3
- CXRWMMRLEMVSEH-PEFMBERDSA-N Glu-Ile-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CXRWMMRLEMVSEH-PEFMBERDSA-N 0.000 description 3
- XTZDZAXYPDISRR-MNXVOIDGSA-N Glu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XTZDZAXYPDISRR-MNXVOIDGSA-N 0.000 description 3
- ZSWGJYOZWBHROQ-RWRJDSDZSA-N Glu-Ile-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSWGJYOZWBHROQ-RWRJDSDZSA-N 0.000 description 3
- INGJLBQKTRJLFO-UKJIMTQDSA-N Glu-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O INGJLBQKTRJLFO-UKJIMTQDSA-N 0.000 description 3
- IOUQWHIEQYQVFD-JYJNAYRXSA-N Glu-Leu-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IOUQWHIEQYQVFD-JYJNAYRXSA-N 0.000 description 3
- SWRVAQHFBRZVNX-GUBZILKMSA-N Glu-Lys-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SWRVAQHFBRZVNX-GUBZILKMSA-N 0.000 description 3
- RBXSZQRSEGYDFG-GUBZILKMSA-N Glu-Lys-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O RBXSZQRSEGYDFG-GUBZILKMSA-N 0.000 description 3
- VHPVBPCCWVDGJL-IRIUXVKKSA-N Glu-Thr-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VHPVBPCCWVDGJL-IRIUXVKKSA-N 0.000 description 3
- HQTDNEZTGZUWSY-XVKPBYJWSA-N Glu-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)NCC(O)=O HQTDNEZTGZUWSY-XVKPBYJWSA-N 0.000 description 3
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 3
- JXYMPBCYRKWJEE-BQBZGAKWSA-N Gly-Arg-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O JXYMPBCYRKWJEE-BQBZGAKWSA-N 0.000 description 3
- FMVLWTYYODVFRG-BQBZGAKWSA-N Gly-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN FMVLWTYYODVFRG-BQBZGAKWSA-N 0.000 description 3
- BPQYBFAXRGMGGY-LAEOZQHASA-N Gly-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN BPQYBFAXRGMGGY-LAEOZQHASA-N 0.000 description 3
- SWQALSGKVLYKDT-ZKWXMUAHSA-N Gly-Ile-Ala Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SWQALSGKVLYKDT-ZKWXMUAHSA-N 0.000 description 3
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 3
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 3
- GWCJMBNBFYBQCV-XPUUQOCRSA-N Gly-Val-Ala Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O GWCJMBNBFYBQCV-XPUUQOCRSA-N 0.000 description 3
- 102000003886 Glycoproteins Human genes 0.000 description 3
- 108090000288 Glycoproteins Proteins 0.000 description 3
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 3
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 3
- 208000037357 HIV infectious disease Diseases 0.000 description 3
- 229940033330 HIV vaccine Drugs 0.000 description 3
- 241000598171 Human adenovirus sp. Species 0.000 description 3
- 241000713340 Human immunodeficiency virus 2 Species 0.000 description 3
- ATXGFMOBVKSOMK-PEDHHIEDSA-N Ile-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N ATXGFMOBVKSOMK-PEDHHIEDSA-N 0.000 description 3
- PHIXPNQDGGILMP-YVNDNENWSA-N Ile-Glu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PHIXPNQDGGILMP-YVNDNENWSA-N 0.000 description 3
- ZXIGYKICRDFISM-DJFWLOJKSA-N Ile-His-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ZXIGYKICRDFISM-DJFWLOJKSA-N 0.000 description 3
- SVBAHOMTJRFSIC-SXTJYALSSA-N Ile-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SVBAHOMTJRFSIC-SXTJYALSSA-N 0.000 description 3
- YNMQUIVKEFRCPH-QSFUFRPTSA-N Ile-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O)N YNMQUIVKEFRCPH-QSFUFRPTSA-N 0.000 description 3
- YBKKLDBBPFIXBQ-MBLNEYKQSA-N Ile-Thr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)O)N YBKKLDBBPFIXBQ-MBLNEYKQSA-N 0.000 description 3
- UYODHPPSCXBNCS-XUXIUFHCSA-N Ile-Val-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C UYODHPPSCXBNCS-XUXIUFHCSA-N 0.000 description 3
- RQZFWBLDTBDEOF-RNJOBUHISA-N Ile-Val-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N RQZFWBLDTBDEOF-RNJOBUHISA-N 0.000 description 3
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 3
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 3
- 125000000241 L-isoleucino group Chemical group [H]OC(=O)[C@@]([H])(N([H])[*])[C@@](C([H])([H])[H])(C(C([H])([H])[H])([H])[H])[H] 0.000 description 3
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical group CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 3
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 3
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 3
- DPWGZWUMUUJQDT-IUCAKERBSA-N Leu-Gln-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O DPWGZWUMUUJQDT-IUCAKERBSA-N 0.000 description 3
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 3
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 3
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 3
- WXUOJXIGOPMDJM-SRVKXCTJSA-N Leu-Lys-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O WXUOJXIGOPMDJM-SRVKXCTJSA-N 0.000 description 3
- MVVSHHJKJRZVNY-ACRUOGEOSA-N Leu-Phe-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MVVSHHJKJRZVNY-ACRUOGEOSA-N 0.000 description 3
- HGUUMQWGYCVPKG-DCAQKATOSA-N Leu-Pro-Cys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)O)N HGUUMQWGYCVPKG-DCAQKATOSA-N 0.000 description 3
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 3
- QYOXSYXPHUHOJR-GUBZILKMSA-N Lys-Asn-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QYOXSYXPHUHOJR-GUBZILKMSA-N 0.000 description 3
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 3
- KZOHPCYVORJBLG-AVGNSLFASA-N Lys-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N KZOHPCYVORJBLG-AVGNSLFASA-N 0.000 description 3
- VQXAVLQBQJMENB-SRVKXCTJSA-N Lys-Glu-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O VQXAVLQBQJMENB-SRVKXCTJSA-N 0.000 description 3
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 3
- QBEPTBMRQALPEV-MNXVOIDGSA-N Lys-Ile-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN QBEPTBMRQALPEV-MNXVOIDGSA-N 0.000 description 3
- MYZMQWHPDAYKIE-SRVKXCTJSA-N Lys-Leu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O MYZMQWHPDAYKIE-SRVKXCTJSA-N 0.000 description 3
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 3
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 3
- JOSAKOKSPXROGQ-BJDJZHNGSA-N Lys-Ser-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JOSAKOKSPXROGQ-BJDJZHNGSA-N 0.000 description 3
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 3
- RPWTZTBIFGENIA-VOAKCMCISA-N Lys-Thr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RPWTZTBIFGENIA-VOAKCMCISA-N 0.000 description 3
- BWECSLVQIWEMSC-IHRRRGAJSA-N Lys-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCCN)N BWECSLVQIWEMSC-IHRRRGAJSA-N 0.000 description 3
- GILLQRYAWOMHED-DCAQKATOSA-N Lys-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN GILLQRYAWOMHED-DCAQKATOSA-N 0.000 description 3
- MDXAULHWGWETHF-SRVKXCTJSA-N Met-Arg-Val Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CCCNC(N)=N MDXAULHWGWETHF-SRVKXCTJSA-N 0.000 description 3
- WWWGMQHQSAUXBU-BQBZGAKWSA-N Met-Gly-Asn Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(N)=O WWWGMQHQSAUXBU-BQBZGAKWSA-N 0.000 description 3
- ZIIMORLEZLVRIP-SRVKXCTJSA-N Met-Leu-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZIIMORLEZLVRIP-SRVKXCTJSA-N 0.000 description 3
- JCMMNFZUKMMECJ-DCAQKATOSA-N Met-Lys-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O JCMMNFZUKMMECJ-DCAQKATOSA-N 0.000 description 3
- QAVZUKIPOMBLMC-AVGNSLFASA-N Met-Val-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C QAVZUKIPOMBLMC-AVGNSLFASA-N 0.000 description 3
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 3
- 108091005804 Peptidases Proteins 0.000 description 3
- DFEVBOYEUQJGER-JURCDPSOSA-N Phe-Ala-Ile Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O DFEVBOYEUQJGER-JURCDPSOSA-N 0.000 description 3
- BRDYYVQTEJVRQT-HRCADAONSA-N Phe-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O BRDYYVQTEJVRQT-HRCADAONSA-N 0.000 description 3
- QCHNRQQVLJYDSI-DLOVCJGASA-N Phe-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 QCHNRQQVLJYDSI-DLOVCJGASA-N 0.000 description 3
- IILUKIJNFMUBNF-IHRRRGAJSA-N Phe-Gln-Gln Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O IILUKIJNFMUBNF-IHRRRGAJSA-N 0.000 description 3
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 3
- RVEVENLSADZUMS-IHRRRGAJSA-N Phe-Pro-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O RVEVENLSADZUMS-IHRRRGAJSA-N 0.000 description 3
- KIZQGKLMXKGDIV-BQBZGAKWSA-N Pro-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 KIZQGKLMXKGDIV-BQBZGAKWSA-N 0.000 description 3
- MTHRMUXESFIAMS-DCAQKATOSA-N Pro-Asn-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O MTHRMUXESFIAMS-DCAQKATOSA-N 0.000 description 3
- AIZVVCMAFRREQS-GUBZILKMSA-N Pro-Cys-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AIZVVCMAFRREQS-GUBZILKMSA-N 0.000 description 3
- SOACYAXADBWDDT-CYDGBPFRSA-N Pro-Ile-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SOACYAXADBWDDT-CYDGBPFRSA-N 0.000 description 3
- FJLODLCIOJUDRG-PYJNHQTQSA-N Pro-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 FJLODLCIOJUDRG-PYJNHQTQSA-N 0.000 description 3
- DWPXHLIBFQLKLK-CYDGBPFRSA-N Pro-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 DWPXHLIBFQLKLK-CYDGBPFRSA-N 0.000 description 3
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 3
- 239000004365 Protease Substances 0.000 description 3
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 3
- FIDMVVBUOCMMJG-CIUDSAMLSA-N Ser-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO FIDMVVBUOCMMJG-CIUDSAMLSA-N 0.000 description 3
- ZOHGLPQGEHSLPD-FXQIFTODSA-N Ser-Gln-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZOHGLPQGEHSLPD-FXQIFTODSA-N 0.000 description 3
- KJMOINFQVCCSDX-XKBZYTNZSA-N Ser-Gln-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KJMOINFQVCCSDX-XKBZYTNZSA-N 0.000 description 3
- SMIDBHKWSYUBRZ-ACZMJKKPSA-N Ser-Glu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O SMIDBHKWSYUBRZ-ACZMJKKPSA-N 0.000 description 3
- GDUZTEQRAOXYJS-SRVKXCTJSA-N Ser-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GDUZTEQRAOXYJS-SRVKXCTJSA-N 0.000 description 3
- UGTZYIPOBYXWRW-SRVKXCTJSA-N Ser-Phe-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O UGTZYIPOBYXWRW-SRVKXCTJSA-N 0.000 description 3
- GYDFRTRSSXOZCR-ACZMJKKPSA-N Ser-Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GYDFRTRSSXOZCR-ACZMJKKPSA-N 0.000 description 3
- OJFFAQFRCVPHNN-JYBASQMISA-N Ser-Thr-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O OJFFAQFRCVPHNN-JYBASQMISA-N 0.000 description 3
- ZKOKTQPHFMRSJP-YJRXYDGGSA-N Ser-Thr-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKOKTQPHFMRSJP-YJRXYDGGSA-N 0.000 description 3
- MFQMZDPAZRZAPV-NAKRPEOUSA-N Ser-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CO)N MFQMZDPAZRZAPV-NAKRPEOUSA-N 0.000 description 3
- NAXBBCLCEOTAIG-RHYQMDGZSA-N Thr-Arg-Lys Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O NAXBBCLCEOTAIG-RHYQMDGZSA-N 0.000 description 3
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 3
- GARULAKWZGFIKC-RWRJDSDZSA-N Thr-Gln-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GARULAKWZGFIKC-RWRJDSDZSA-N 0.000 description 3
- UDQBCBUXAQIZAK-GLLZPBPUSA-N Thr-Glu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDQBCBUXAQIZAK-GLLZPBPUSA-N 0.000 description 3
- BNGDYRRHRGOPHX-IFFSRLJSSA-N Thr-Glu-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O BNGDYRRHRGOPHX-IFFSRLJSSA-N 0.000 description 3
- MSIYNSBKKVMGFO-BHNWBGBOSA-N Thr-Gly-Pro Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N)O MSIYNSBKKVMGFO-BHNWBGBOSA-N 0.000 description 3
- KRGDDWVBBDLPSJ-CUJWVEQBSA-N Thr-His-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O KRGDDWVBBDLPSJ-CUJWVEQBSA-N 0.000 description 3
- AHOLTQCAVBSUDP-PPCPHDFISA-N Thr-Ile-Lys Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)[C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O AHOLTQCAVBSUDP-PPCPHDFISA-N 0.000 description 3
- GXUWHVZYDAHFSV-FLBSBUHZSA-N Thr-Ile-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GXUWHVZYDAHFSV-FLBSBUHZSA-N 0.000 description 3
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 3
- LECUEEHKUFYOOV-ZJDVBMNYSA-N Thr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)[C@@H](C)O LECUEEHKUFYOOV-ZJDVBMNYSA-N 0.000 description 3
- IUFQHOCOKQIOMC-XIRDDKMYSA-N Trp-Asn-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N IUFQHOCOKQIOMC-XIRDDKMYSA-N 0.000 description 3
- TUUXFNQXSFNFLX-XIRDDKMYSA-N Trp-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N TUUXFNQXSFNFLX-XIRDDKMYSA-N 0.000 description 3
- MTEQZJFSEMXXRK-CFMVVWHZSA-N Tyr-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N MTEQZJFSEMXXRK-CFMVVWHZSA-N 0.000 description 3
- SLCSPPCQWUHPPO-JYJNAYRXSA-N Tyr-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 SLCSPPCQWUHPPO-JYJNAYRXSA-N 0.000 description 3
- CNNVVEPJTFOGHI-ACRUOGEOSA-N Tyr-Lys-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CNNVVEPJTFOGHI-ACRUOGEOSA-N 0.000 description 3
- UUBKSZNKJUJQEJ-JRQIVUDYSA-N Tyr-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O UUBKSZNKJUJQEJ-JRQIVUDYSA-N 0.000 description 3
- GPLTZEMVOCZVAV-UFYCRDLUSA-N Tyr-Tyr-Arg Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CC=C(O)C=C1 GPLTZEMVOCZVAV-UFYCRDLUSA-N 0.000 description 3
- VUTHNLMCXKLLFI-LAEOZQHASA-N Val-Asp-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VUTHNLMCXKLLFI-LAEOZQHASA-N 0.000 description 3
- PMDOQZFYGWZSTK-LSJOCFKGSA-N Val-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C PMDOQZFYGWZSTK-LSJOCFKGSA-N 0.000 description 3
- KDKLLPMFFGYQJD-CYDGBPFRSA-N Val-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N KDKLLPMFFGYQJD-CYDGBPFRSA-N 0.000 description 3
- JAIZPWVHPQRYOU-ZJDVBMNYSA-N Val-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O JAIZPWVHPQRYOU-ZJDVBMNYSA-N 0.000 description 3
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 3
- 239000000654 additive Substances 0.000 description 3
- 108010070783 alanyltyrosine Proteins 0.000 description 3
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 239000000969 carrier Substances 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- 239000000356 contaminant Substances 0.000 description 3
- 125000002228 disulfide group Chemical group 0.000 description 3
- 230000002349 favourable effect Effects 0.000 description 3
- 239000000796 flavoring agent Substances 0.000 description 3
- 235000013355 food flavoring agent Nutrition 0.000 description 3
- 108010001064 glycyl-glycyl-glycyl-glycine Proteins 0.000 description 3
- 108010010147 glycylglutamine Proteins 0.000 description 3
- 108010040030 histidinoalanine Proteins 0.000 description 3
- 108010092114 histidylphenylalanine Proteins 0.000 description 3
- 208000033519 human immunodeficiency virus infectious disease Diseases 0.000 description 3
- 230000036039 immunity Effects 0.000 description 3
- 230000003053 immunization Effects 0.000 description 3
- 238000002649 immunization Methods 0.000 description 3
- 230000006698 induction Effects 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- 208000015181 infectious disease Diseases 0.000 description 3
- 230000000968 intestinal effect Effects 0.000 description 3
- 108010053037 kyotorphin Proteins 0.000 description 3
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 3
- 108010057821 leucylproline Proteins 0.000 description 3
- 239000003755 preservative agent Substances 0.000 description 3
- 125000001500 prolyl group Chemical group [H]N1C([H])(C(=O)[*])C([H])([H])C([H])([H])C1([H])[H] 0.000 description 3
- 235000019419 proteases Nutrition 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 3
- 108010080629 tryptophan-leucine Proteins 0.000 description 3
- 238000001262 western blot Methods 0.000 description 3
- CWFMWBHMIMNZLN-NAKRPEOUSA-N (2s)-1-[(2s)-2-[[(2s,3s)-2-amino-3-methylpentanoyl]amino]propanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CWFMWBHMIMNZLN-NAKRPEOUSA-N 0.000 description 2
- NRJAVPSFFCBXDT-HUESYALOSA-N 1,2-distearoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCCCCCCCCCCC NRJAVPSFFCBXDT-HUESYALOSA-N 0.000 description 2
- 208000030507 AIDS Diseases 0.000 description 2
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 2
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 2
- LDLSENBXQNDTPB-DCAQKATOSA-N Ala-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LDLSENBXQNDTPB-DCAQKATOSA-N 0.000 description 2
- IORKCNUBHNIMKY-CIUDSAMLSA-N Ala-Pro-Glu Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IORKCNUBHNIMKY-CIUDSAMLSA-N 0.000 description 2
- XAXHGSOBFPIRFG-LSJOCFKGSA-N Ala-Pro-His Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O XAXHGSOBFPIRFG-LSJOCFKGSA-N 0.000 description 2
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 2
- LTTLSZVJTDSACD-OWLDWWDNSA-N Ala-Thr-Trp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O LTTLSZVJTDSACD-OWLDWWDNSA-N 0.000 description 2
- KLKARCOHVHLAJP-UWJYBYFXSA-N Ala-Tyr-Cys Chemical compound C[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CS)C(O)=O KLKARCOHVHLAJP-UWJYBYFXSA-N 0.000 description 2
- PEFFAAKJGBZBKL-NAKRPEOUSA-N Arg-Ala-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PEFFAAKJGBZBKL-NAKRPEOUSA-N 0.000 description 2
- SVHRPCMZTWZROG-DCAQKATOSA-N Arg-Cys-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCN=C(N)N)N SVHRPCMZTWZROG-DCAQKATOSA-N 0.000 description 2
- AUFHLLPVPSMEOG-YUMQZZPRSA-N Arg-Gly-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AUFHLLPVPSMEOG-YUMQZZPRSA-N 0.000 description 2
- SSZGOKWBHLOCHK-DCAQKATOSA-N Arg-Lys-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N SSZGOKWBHLOCHK-DCAQKATOSA-N 0.000 description 2
- AMIQZQAAYGYKOP-FXQIFTODSA-N Arg-Ser-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O AMIQZQAAYGYKOP-FXQIFTODSA-N 0.000 description 2
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 2
- XHFXZQHTLJVZBN-FXQIFTODSA-N Asn-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N XHFXZQHTLJVZBN-FXQIFTODSA-N 0.000 description 2
- ZZXMOQIUIJJOKZ-ZLUOBGJFSA-N Asn-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O ZZXMOQIUIJJOKZ-ZLUOBGJFSA-N 0.000 description 2
- RRVBEKYEFMCDIF-WHFBIAKZSA-N Asn-Cys-Gly Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N)C(=O)N RRVBEKYEFMCDIF-WHFBIAKZSA-N 0.000 description 2
- SPIPSJXLZVTXJL-ZLUOBGJFSA-N Asn-Cys-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O SPIPSJXLZVTXJL-ZLUOBGJFSA-N 0.000 description 2
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 2
- GQRDIVQPSMPQME-ZPFDUUQYSA-N Asn-Ile-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O GQRDIVQPSMPQME-ZPFDUUQYSA-N 0.000 description 2
- LWXJVHTUEDHDLG-XUXIUFHCSA-N Asn-Leu-Leu-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O LWXJVHTUEDHDLG-XUXIUFHCSA-N 0.000 description 2
- FBODFHMLALOPHP-GUBZILKMSA-N Asn-Lys-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O FBODFHMLALOPHP-GUBZILKMSA-N 0.000 description 2
- COWITDLVHMZSIW-CIUDSAMLSA-N Asn-Lys-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O COWITDLVHMZSIW-CIUDSAMLSA-N 0.000 description 2
- AYOAHKWVQLNPDM-HJGDQZAQSA-N Asn-Lys-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AYOAHKWVQLNPDM-HJGDQZAQSA-N 0.000 description 2
- MPXTVIOEYISUQC-DHATWTDPSA-N Asn-Met-Thr-Thr Chemical compound CSCC[C@H](NC(=O)[C@@H](N)CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MPXTVIOEYISUQC-DHATWTDPSA-N 0.000 description 2
- FLJVGAFLZVBBNG-BPUTZDHNSA-N Asn-Trp-Arg Chemical compound N[C@@H](CC(=O)N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(=O)N[C@@H](CCCNC(=N)N)C(=O)O FLJVGAFLZVBBNG-BPUTZDHNSA-N 0.000 description 2
- LMIWYCWRJVMAIQ-NHCYSSNCSA-N Asn-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N LMIWYCWRJVMAIQ-NHCYSSNCSA-N 0.000 description 2
- GHWWTICYPDKPTE-NGZCFLSTSA-N Asn-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N GHWWTICYPDKPTE-NGZCFLSTSA-N 0.000 description 2
- XEDQMTWEYFBOIK-ACZMJKKPSA-N Asp-Ala-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XEDQMTWEYFBOIK-ACZMJKKPSA-N 0.000 description 2
- VPPXTHJNTYDNFJ-CIUDSAMLSA-N Asp-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N VPPXTHJNTYDNFJ-CIUDSAMLSA-N 0.000 description 2
- UQBGYPFHWFZMCD-ZLUOBGJFSA-N Asp-Asn-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O UQBGYPFHWFZMCD-ZLUOBGJFSA-N 0.000 description 2
- WKGJGVGTEZGFSW-FXQIFTODSA-N Asp-Asn-Met Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O WKGJGVGTEZGFSW-FXQIFTODSA-N 0.000 description 2
- RYEWQKQXRJCHIO-SRVKXCTJSA-N Asp-Asn-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 RYEWQKQXRJCHIO-SRVKXCTJSA-N 0.000 description 2
- VHWNKSJHQFZJTH-FXQIFTODSA-N Asp-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N VHWNKSJHQFZJTH-FXQIFTODSA-N 0.000 description 2
- PXLNPFOJZQMXAT-BYULHYEWSA-N Asp-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O PXLNPFOJZQMXAT-BYULHYEWSA-N 0.000 description 2
- VILLWIDTHYPSLC-PEFMBERDSA-N Asp-Glu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VILLWIDTHYPSLC-PEFMBERDSA-N 0.000 description 2
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 2
- ZVGRHIRJLWBWGJ-ACZMJKKPSA-N Asp-Ser-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZVGRHIRJLWBWGJ-ACZMJKKPSA-N 0.000 description 2
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 2
- KBJVTFWQWXCYCQ-IUKAMOBKSA-N Asp-Thr-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KBJVTFWQWXCYCQ-IUKAMOBKSA-N 0.000 description 2
- ZUNMTUPRQMWMHX-LSJOCFKGSA-N Asp-Val-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O ZUNMTUPRQMWMHX-LSJOCFKGSA-N 0.000 description 2
- 102100021277 Beta-secretase 2 Human genes 0.000 description 2
- 101710150190 Beta-secretase 2 Proteins 0.000 description 2
- KOHBWQDSVCARMI-BWBBJGPYSA-N Cys-Cys-Thr Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KOHBWQDSVCARMI-BWBBJGPYSA-N 0.000 description 2
- DZLQXIFVQFTFJY-BYPYZUCNSA-N Cys-Gly-Gly Chemical compound SC[C@H](N)C(=O)NCC(=O)NCC(O)=O DZLQXIFVQFTFJY-BYPYZUCNSA-N 0.000 description 2
- SWJYSDXMTPMBHO-FXQIFTODSA-N Cys-Pro-Ser Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O SWJYSDXMTPMBHO-FXQIFTODSA-N 0.000 description 2
- LPBUBIHAVKXUOT-FXQIFTODSA-N Cys-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N LPBUBIHAVKXUOT-FXQIFTODSA-N 0.000 description 2
- 238000002965 ELISA Methods 0.000 description 2
- 101710121417 Envelope glycoprotein Proteins 0.000 description 2
- TWHDOEYLXXQYOZ-FXQIFTODSA-N Gln-Asn-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N TWHDOEYLXXQYOZ-FXQIFTODSA-N 0.000 description 2
- XEYMBRRKIFYQMF-GUBZILKMSA-N Gln-Asp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XEYMBRRKIFYQMF-GUBZILKMSA-N 0.000 description 2
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 2
- HWEINOMSWQSJDC-SRVKXCTJSA-N Gln-Leu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HWEINOMSWQSJDC-SRVKXCTJSA-N 0.000 description 2
- SHAUZYVSXAMYAZ-JYJNAYRXSA-N Gln-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SHAUZYVSXAMYAZ-JYJNAYRXSA-N 0.000 description 2
- AQPZYBSRDRZBAG-AVGNSLFASA-N Gln-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N AQPZYBSRDRZBAG-AVGNSLFASA-N 0.000 description 2
- OKARHJKJTKFQBM-ACZMJKKPSA-N Gln-Ser-Asn Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OKARHJKJTKFQBM-ACZMJKKPSA-N 0.000 description 2
- JILRMFFFCHUUTJ-ACZMJKKPSA-N Gln-Ser-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O JILRMFFFCHUUTJ-ACZMJKKPSA-N 0.000 description 2
- OEIDWQHTRYEYGG-QEJZJMRPSA-N Gln-Trp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N OEIDWQHTRYEYGG-QEJZJMRPSA-N 0.000 description 2
- DITJVHONFRJKJW-BPUTZDHNSA-N Gln-Trp-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N DITJVHONFRJKJW-BPUTZDHNSA-N 0.000 description 2
- OGMQXTXGLDNBSS-FXQIFTODSA-N Glu-Ala-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O OGMQXTXGLDNBSS-FXQIFTODSA-N 0.000 description 2
- CVPXINNKRTZBMO-CIUDSAMLSA-N Glu-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)CN=C(N)N CVPXINNKRTZBMO-CIUDSAMLSA-N 0.000 description 2
- FLLRAEJOLZPSMN-CIUDSAMLSA-N Glu-Asn-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FLLRAEJOLZPSMN-CIUDSAMLSA-N 0.000 description 2
- MLCPTRRNICEKIS-FXQIFTODSA-N Glu-Asn-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLCPTRRNICEKIS-FXQIFTODSA-N 0.000 description 2
- NTBDVNJIWCKURJ-ACZMJKKPSA-N Glu-Asp-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NTBDVNJIWCKURJ-ACZMJKKPSA-N 0.000 description 2
- YLJHCWNDBKKOEB-IHRRRGAJSA-N Glu-Glu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YLJHCWNDBKKOEB-IHRRRGAJSA-N 0.000 description 2
- ZHNHJYYFCGUZNQ-KBIXCLLPSA-N Glu-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O ZHNHJYYFCGUZNQ-KBIXCLLPSA-N 0.000 description 2
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 2
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 2
- BCYGDJXHAGZNPQ-DCAQKATOSA-N Glu-Lys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O BCYGDJXHAGZNPQ-DCAQKATOSA-N 0.000 description 2
- OCJRHJZKGGSPRW-IUCAKERBSA-N Glu-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O OCJRHJZKGGSPRW-IUCAKERBSA-N 0.000 description 2
- ZGEJRLJEAMPEDV-SRVKXCTJSA-N Glu-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N ZGEJRLJEAMPEDV-SRVKXCTJSA-N 0.000 description 2
- HLYCMRDRWGSTPZ-CIUDSAMLSA-N Glu-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CS)C(=O)O HLYCMRDRWGSTPZ-CIUDSAMLSA-N 0.000 description 2
- JYXKPJVDCAWMDG-ZPFDUUQYSA-N Glu-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)O)N JYXKPJVDCAWMDG-ZPFDUUQYSA-N 0.000 description 2
- RGJKYNUINKGPJN-RWRJDSDZSA-N Glu-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(=O)O)N RGJKYNUINKGPJN-RWRJDSDZSA-N 0.000 description 2
- CQGBSALYGOXQPE-HTUGSXCWSA-N Glu-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O CQGBSALYGOXQPE-HTUGSXCWSA-N 0.000 description 2
- HVKAAUOFFTUSAA-XDTLVQLUSA-N Glu-Tyr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O HVKAAUOFFTUSAA-XDTLVQLUSA-N 0.000 description 2
- JRDYDYXZKFNNRQ-XPUUQOCRSA-N Gly-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN JRDYDYXZKFNNRQ-XPUUQOCRSA-N 0.000 description 2
- PYUCNHJQQVSPGN-BQBZGAKWSA-N Gly-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN)CN=C(N)N PYUCNHJQQVSPGN-BQBZGAKWSA-N 0.000 description 2
- DWUKOTKSTDWGAE-BQBZGAKWSA-N Gly-Asn-Arg Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DWUKOTKSTDWGAE-BQBZGAKWSA-N 0.000 description 2
- CQZDZKRHFWJXDF-WDSKDSINSA-N Gly-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CN CQZDZKRHFWJXDF-WDSKDSINSA-N 0.000 description 2
- STVHDEHTKFXBJQ-LAEOZQHASA-N Gly-Glu-Ile Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STVHDEHTKFXBJQ-LAEOZQHASA-N 0.000 description 2
- HMHRTKOWRUPPNU-RCOVLWMOSA-N Gly-Ile-Gly Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O HMHRTKOWRUPPNU-RCOVLWMOSA-N 0.000 description 2
- POJJAZJHBGXEGM-YUMQZZPRSA-N Gly-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN POJJAZJHBGXEGM-YUMQZZPRSA-N 0.000 description 2
- OQDLKDUVMTUPPG-AVGNSLFASA-N His-Leu-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OQDLKDUVMTUPPG-AVGNSLFASA-N 0.000 description 2
- BSVLMPMIXPQNKC-KBPBESRZSA-N His-Phe-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O BSVLMPMIXPQNKC-KBPBESRZSA-N 0.000 description 2
- BOTVMTSMOUSDRW-GMOBBJLQSA-N Ile-Arg-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O BOTVMTSMOUSDRW-GMOBBJLQSA-N 0.000 description 2
- KBHYLOIVRVBBEB-JBDRJPRFSA-N Ile-Cys-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)O)N KBHYLOIVRVBBEB-JBDRJPRFSA-N 0.000 description 2
- VQUCKIAECLVLAD-SVSWQMSJSA-N Ile-Cys-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N VQUCKIAECLVLAD-SVSWQMSJSA-N 0.000 description 2
- CYHJCEKUMCNDFG-LAEOZQHASA-N Ile-Gln-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)NCC(=O)O)N CYHJCEKUMCNDFG-LAEOZQHASA-N 0.000 description 2
- WZDCVAWMBUNDDY-KBIXCLLPSA-N Ile-Glu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C)C(=O)O)N WZDCVAWMBUNDDY-KBIXCLLPSA-N 0.000 description 2
- XLCZWMJPVGRWHJ-KQXIARHKSA-N Ile-Glu-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N XLCZWMJPVGRWHJ-KQXIARHKSA-N 0.000 description 2
- KOPIAUWNLKKELG-SIGLWIIPSA-N Ile-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N KOPIAUWNLKKELG-SIGLWIIPSA-N 0.000 description 2
- KYLIZSDYWQQTFM-PEDHHIEDSA-N Ile-Ile-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N KYLIZSDYWQQTFM-PEDHHIEDSA-N 0.000 description 2
- QZZIBQZLWBOOJH-PEDHHIEDSA-N Ile-Ile-Val Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)O QZZIBQZLWBOOJH-PEDHHIEDSA-N 0.000 description 2
- OVDKXUDMKXAZIV-ZPFDUUQYSA-N Ile-Lys-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OVDKXUDMKXAZIV-ZPFDUUQYSA-N 0.000 description 2
- IDMNOFVUXYYZPF-DKIMLUQUSA-N Ile-Lys-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N IDMNOFVUXYYZPF-DKIMLUQUSA-N 0.000 description 2
- UYNXBNHVWFNVIN-HJWJTTGWSA-N Ile-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CC=CC=C1 UYNXBNHVWFNVIN-HJWJTTGWSA-N 0.000 description 2
- SAEWJTCJQVZQNZ-IUKAMOBKSA-N Ile-Thr-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SAEWJTCJQVZQNZ-IUKAMOBKSA-N 0.000 description 2
- RKQAYOWLSFLJEE-SVSWQMSJSA-N Ile-Thr-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)O)N RKQAYOWLSFLJEE-SVSWQMSJSA-N 0.000 description 2
- BZUOLKFQVVBTJY-SLBDDTMCSA-N Ile-Trp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)N)C(=O)O)N BZUOLKFQVVBTJY-SLBDDTMCSA-N 0.000 description 2
- WKSHBPRUIRGWRZ-KCTSRDHCSA-N Ile-Trp-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)NCC(=O)O)N WKSHBPRUIRGWRZ-KCTSRDHCSA-N 0.000 description 2
- DTPGSUQHUMELQB-GVARAGBVSA-N Ile-Tyr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 DTPGSUQHUMELQB-GVARAGBVSA-N 0.000 description 2
- HQLSBZFLOUHQJK-STECZYCISA-N Ile-Tyr-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HQLSBZFLOUHQJK-STECZYCISA-N 0.000 description 2
- PRTZQMBYUZFSFA-XEGUGMAKSA-N Ile-Tyr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)NCC(=O)O)N PRTZQMBYUZFSFA-XEGUGMAKSA-N 0.000 description 2
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 2
- 241000713666 Lentivirus Species 0.000 description 2
- CIVKXGPFXDIQBV-WDCWCFNPSA-N Leu-Gln-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CIVKXGPFXDIQBV-WDCWCFNPSA-N 0.000 description 2
- YSKSXVKQLLBVEX-SZMVWBNQSA-N Leu-Gln-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 YSKSXVKQLLBVEX-SZMVWBNQSA-N 0.000 description 2
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 2
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 2
- DDEMUMVXNFPDKC-SRVKXCTJSA-N Leu-His-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CS)C(=O)O)N DDEMUMVXNFPDKC-SRVKXCTJSA-N 0.000 description 2
- KUIDCYNIEJBZBU-AJNGGQMLSA-N Leu-Ile-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O KUIDCYNIEJBZBU-AJNGGQMLSA-N 0.000 description 2
- HRTRLSRYZZKPCO-BJDJZHNGSA-N Leu-Ile-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HRTRLSRYZZKPCO-BJDJZHNGSA-N 0.000 description 2
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 2
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 2
- BGZCJDGBBUUBHA-KKUMJFAQSA-N Leu-Lys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O BGZCJDGBBUUBHA-KKUMJFAQSA-N 0.000 description 2
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 2
- ICYRCNICGBJLGM-HJGDQZAQSA-N Leu-Thr-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 2
- IDGRADDMTTWOQC-WDSOQIARSA-N Leu-Trp-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IDGRADDMTTWOQC-WDSOQIARSA-N 0.000 description 2
- HOMFINRJHIIZNJ-HOCLYGCPSA-N Leu-Trp-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(O)=O HOMFINRJHIIZNJ-HOCLYGCPSA-N 0.000 description 2
- WQWZXKWOEVSGQM-DCAQKATOSA-N Lys-Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN WQWZXKWOEVSGQM-DCAQKATOSA-N 0.000 description 2
- KPJJOZUXFOLGMQ-CIUDSAMLSA-N Lys-Asp-Asn Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N KPJJOZUXFOLGMQ-CIUDSAMLSA-N 0.000 description 2
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 2
- IMAKMJCBYCSMHM-AVGNSLFASA-N Lys-Glu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN IMAKMJCBYCSMHM-AVGNSLFASA-N 0.000 description 2
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 2
- ODTZHNZPINULEU-KKUMJFAQSA-N Lys-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N ODTZHNZPINULEU-KKUMJFAQSA-N 0.000 description 2
- MEQLGHAMAUPOSJ-DCAQKATOSA-N Lys-Ser-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O MEQLGHAMAUPOSJ-DCAQKATOSA-N 0.000 description 2
- BLIPQDLSCFGUFA-GUBZILKMSA-N Met-Arg-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O BLIPQDLSCFGUFA-GUBZILKMSA-N 0.000 description 2
- CWFYZYQMUDWGTI-GUBZILKMSA-N Met-Arg-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O CWFYZYQMUDWGTI-GUBZILKMSA-N 0.000 description 2
- IECZNARPMKQGJC-XIRDDKMYSA-N Met-Gln-Trp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N IECZNARPMKQGJC-XIRDDKMYSA-N 0.000 description 2
- BKIFWLQFOOKUCA-DCAQKATOSA-N Met-His-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CO)C(=O)O)N BKIFWLQFOOKUCA-DCAQKATOSA-N 0.000 description 2
- SCKPOOMCTFEVTN-QTKMDUPCSA-N Met-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCSC)N)O SCKPOOMCTFEVTN-QTKMDUPCSA-N 0.000 description 2
- AEQVPPGEJJBFEE-CYDGBPFRSA-N Met-Ile-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEQVPPGEJJBFEE-CYDGBPFRSA-N 0.000 description 2
- KMSMNUFBNCHMII-IHRRRGAJSA-N Met-Leu-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN KMSMNUFBNCHMII-IHRRRGAJSA-N 0.000 description 2
- LBNFTWKGISQVEE-AVGNSLFASA-N Met-Leu-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCSC LBNFTWKGISQVEE-AVGNSLFASA-N 0.000 description 2
- OIFHHODAXVWKJN-ULQDDVLXSA-N Met-Phe-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 OIFHHODAXVWKJN-ULQDDVLXSA-N 0.000 description 2
- QQPMHUCGDRJFQK-RHYQMDGZSA-N Met-Thr-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QQPMHUCGDRJFQK-RHYQMDGZSA-N 0.000 description 2
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 2
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 2
- 241000283973 Oryctolagus cuniculus Species 0.000 description 2
- WSXKXSBOJXEZDV-DLOVCJGASA-N Phe-Ala-Asn Chemical compound NC(=O)C[C@@H](C([O-])=O)NC(=O)[C@H](C)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 WSXKXSBOJXEZDV-DLOVCJGASA-N 0.000 description 2
- UUWCIPUVJJIEEP-SRVKXCTJSA-N Phe-Asn-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N UUWCIPUVJJIEEP-SRVKXCTJSA-N 0.000 description 2
- KIAWKQJTSGRCSA-AVGNSLFASA-N Phe-Asn-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KIAWKQJTSGRCSA-AVGNSLFASA-N 0.000 description 2
- MQVFHOPCKNTHGT-MELADBBJSA-N Phe-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O MQVFHOPCKNTHGT-MELADBBJSA-N 0.000 description 2
- DSXPMZMSJHOKKK-HJOGWXRNSA-N Phe-Phe-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O DSXPMZMSJHOKKK-HJOGWXRNSA-N 0.000 description 2
- VFDRDMOMHBJGKD-UFYCRDLUSA-N Phe-Tyr-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N VFDRDMOMHBJGKD-UFYCRDLUSA-N 0.000 description 2
- DBNGDEAQXGFGRA-ACRUOGEOSA-N Phe-Tyr-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DBNGDEAQXGFGRA-ACRUOGEOSA-N 0.000 description 2
- AQGUSRZKDZYGGV-GMOBBJLQSA-N Pro-Ile-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O AQGUSRZKDZYGGV-GMOBBJLQSA-N 0.000 description 2
- IURWWZYKYPEANQ-HJGDQZAQSA-N Pro-Thr-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O IURWWZYKYPEANQ-HJGDQZAQSA-N 0.000 description 2
- 101800001295 Putative ATP-dependent helicase Proteins 0.000 description 2
- 101800001006 Putative helicase Proteins 0.000 description 2
- 241000714474 Rous sarcoma virus Species 0.000 description 2
- HBZBPFLJNDXRAY-FXQIFTODSA-N Ser-Ala-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O HBZBPFLJNDXRAY-FXQIFTODSA-N 0.000 description 2
- OOKCGAYXSNJBGQ-ZLUOBGJFSA-N Ser-Asn-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OOKCGAYXSNJBGQ-ZLUOBGJFSA-N 0.000 description 2
- UBRXAVQWXOWRSJ-ZLUOBGJFSA-N Ser-Asn-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N)C(=O)N UBRXAVQWXOWRSJ-ZLUOBGJFSA-N 0.000 description 2
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 2
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 2
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 2
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 2
- UYLKOSODXYSWMQ-XGEHTFHBSA-N Ser-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CO)N)O UYLKOSODXYSWMQ-XGEHTFHBSA-N 0.000 description 2
- LLSLRQOEAFCZLW-NRPADANISA-N Ser-Val-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LLSLRQOEAFCZLW-NRPADANISA-N 0.000 description 2
- 239000012505 Superdex™ Substances 0.000 description 2
- 101150006914 TRP1 gene Proteins 0.000 description 2
- GLQFKOVWXPPFTP-VEVYYDQMSA-N Thr-Arg-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GLQFKOVWXPPFTP-VEVYYDQMSA-N 0.000 description 2
- SWIKDOUVROTZCW-GCJQMDKQSA-N Thr-Asn-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O SWIKDOUVROTZCW-GCJQMDKQSA-N 0.000 description 2
- YLXAMFZYJTZXFH-OLHMAJIHSA-N Thr-Asn-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O YLXAMFZYJTZXFH-OLHMAJIHSA-N 0.000 description 2
- PQLXHSACXPGWPD-GSSVUCPTSA-N Thr-Asn-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PQLXHSACXPGWPD-GSSVUCPTSA-N 0.000 description 2
- MFEBUIFJVPNZLO-OLHMAJIHSA-N Thr-Asp-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O MFEBUIFJVPNZLO-OLHMAJIHSA-N 0.000 description 2
- HJOSVGCWOTYJFG-WDCWCFNPSA-N Thr-Glu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O HJOSVGCWOTYJFG-WDCWCFNPSA-N 0.000 description 2
- XFTYVCHLARBHBQ-FOHZUACHSA-N Thr-Gly-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XFTYVCHLARBHBQ-FOHZUACHSA-N 0.000 description 2
- KRDSCBLRHORMRK-JXUBOQSCSA-N Thr-Lys-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O KRDSCBLRHORMRK-JXUBOQSCSA-N 0.000 description 2
- VGYVVSQFSSKZRJ-OEAJRASXSA-N Thr-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@H](O)C)CC1=CC=CC=C1 VGYVVSQFSSKZRJ-OEAJRASXSA-N 0.000 description 2
- YGCDFAJJCRVQKU-RCWTZXSCSA-N Thr-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O YGCDFAJJCRVQKU-RCWTZXSCSA-N 0.000 description 2
- NQQMWWVVGIXUOX-SVSWQMSJSA-N Thr-Ser-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NQQMWWVVGIXUOX-SVSWQMSJSA-N 0.000 description 2
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 2
- QYDKSNXSBXZPFK-ZJDVBMNYSA-N Thr-Thr-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYDKSNXSBXZPFK-ZJDVBMNYSA-N 0.000 description 2
- YEGMNOHLZNGOCG-UBHSHLNASA-N Trp-Asn-Asn Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YEGMNOHLZNGOCG-UBHSHLNASA-N 0.000 description 2
- GKUROEIXVURAAO-BPUTZDHNSA-N Trp-Asp-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GKUROEIXVURAAO-BPUTZDHNSA-N 0.000 description 2
- VOCHZIJXPRBVSI-XIRDDKMYSA-N Trp-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N VOCHZIJXPRBVSI-XIRDDKMYSA-N 0.000 description 2
- LVTKHGUGBGNBPL-UHFFFAOYSA-N Trp-P-1 Chemical compound N1C2=CC=CC=C2C2=C1C(C)=C(N)N=C2C LVTKHGUGBGNBPL-UHFFFAOYSA-N 0.000 description 2
- NOXKHHXSHQFSGJ-FQPOAREZSA-N Tyr-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NOXKHHXSHQFSGJ-FQPOAREZSA-N 0.000 description 2
- BARBHMSSVWPKPZ-IHRRRGAJSA-N Tyr-Asp-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BARBHMSSVWPKPZ-IHRRRGAJSA-N 0.000 description 2
- RIJPHPUJRLEOAK-JYJNAYRXSA-N Tyr-Gln-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O RIJPHPUJRLEOAK-JYJNAYRXSA-N 0.000 description 2
- FMXFHNSFABRVFZ-BZSNNMDCSA-N Tyr-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FMXFHNSFABRVFZ-BZSNNMDCSA-N 0.000 description 2
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 2
- PWKMJDQXKCENMF-MEYUZBJRSA-N Tyr-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O PWKMJDQXKCENMF-MEYUZBJRSA-N 0.000 description 2
- COQLPRJCUIATTQ-UHFFFAOYSA-N Uranyl acetate Chemical compound O.O.O=[U]=O.CC(O)=O.CC(O)=O COQLPRJCUIATTQ-UHFFFAOYSA-N 0.000 description 2
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 2
- ZEVNVXYRZRIRCH-GVXVVHGQSA-N Val-Gln-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N ZEVNVXYRZRIRCH-GVXVVHGQSA-N 0.000 description 2
- BRPKEERLGYNCNC-NHCYSSNCSA-N Val-Glu-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N BRPKEERLGYNCNC-NHCYSSNCSA-N 0.000 description 2
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 2
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 2
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 2
- CXWJFWAZIVWBOS-XQQFMLRXSA-N Val-Lys-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CXWJFWAZIVWBOS-XQQFMLRXSA-N 0.000 description 2
- NZGOVKLVQNOEKP-YDHLFZDLSA-N Val-Phe-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NZGOVKLVQNOEKP-YDHLFZDLSA-N 0.000 description 2
- USLVEJAHTBLSIL-CYDGBPFRSA-N Val-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C USLVEJAHTBLSIL-CYDGBPFRSA-N 0.000 description 2
- NSUUANXHLKKHQB-BZSNNMDCSA-N Val-Pro-Trp Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CNC2=CC=CC=C12 NSUUANXHLKKHQB-BZSNNMDCSA-N 0.000 description 2
- 108010044940 alanylglutamine Proteins 0.000 description 2
- 108010011559 alanylphenylalanine Proteins 0.000 description 2
- 230000005875 antibody response Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 108010008355 arginyl-glutamine Proteins 0.000 description 2
- 108010027371 asparaginyl-leucyl-prolyl-arginine Proteins 0.000 description 2
- 108010047857 aspartylglycine Proteins 0.000 description 2
- 108010092854 aspartyllysine Proteins 0.000 description 2
- 238000000429 assembly Methods 0.000 description 2
- 230000000712 assembly Effects 0.000 description 2
- 239000011230 binding agent Substances 0.000 description 2
- 210000000170 cell membrane Anatomy 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 235000012000 cholesterol Nutrition 0.000 description 2
- 238000004587 chromatography analysis Methods 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 108010016616 cysteinylglycine Proteins 0.000 description 2
- 239000000539 dimer Substances 0.000 description 2
- 238000010828 elution Methods 0.000 description 2
- 102000037865 fusion proteins Human genes 0.000 description 2
- 108020001507 fusion proteins Proteins 0.000 description 2
- 150000002334 glycols Chemical class 0.000 description 2
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 2
- 108010032388 glycyl-prolyl-glycyl-arginyl-alanyl-phenylanine Proteins 0.000 description 2
- 239000000833 heterodimer Substances 0.000 description 2
- 230000005847 immunogenicity Effects 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 2
- 239000003446 ligand Substances 0.000 description 2
- 150000002632 lipids Chemical class 0.000 description 2
- 239000000314 lubricant Substances 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 2
- 210000004962 mammalian cell Anatomy 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 108010056582 methionylglutamic acid Proteins 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000001823 molecular biology technique Methods 0.000 description 2
- 210000002200 mouth mucosa Anatomy 0.000 description 2
- 239000003921 oil Substances 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 108010012581 phenylalanylglutamate Proteins 0.000 description 2
- 108010025488 pinealon Proteins 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 238000000159 protein binding assay Methods 0.000 description 2
- 230000001177 retroviral effect Effects 0.000 description 2
- 239000012146 running buffer Substances 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 108010071207 serylmethionine Proteins 0.000 description 2
- 238000002741 site-directed mutagenesis Methods 0.000 description 2
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 2
- 238000009987 spinning Methods 0.000 description 2
- 238000010186 staining Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 239000003656 tris buffered saline Substances 0.000 description 2
- 239000004474 valine Substances 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 239000000080 wetting agent Substances 0.000 description 2
- HKZAAJSTFUZYTO-LURJTMIESA-N (2s)-2-[[2-[[2-[[2-[(2-aminoacetyl)amino]acetyl]amino]acetyl]amino]acetyl]amino]-3-hydroxypropanoic acid Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O HKZAAJSTFUZYTO-LURJTMIESA-N 0.000 description 1
- WEZDRVHTDXTVLT-GJZGRUSLSA-N 2-[[(2s)-2-[[(2s)-2-[(2-aminoacetyl)amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]acetic acid Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 WEZDRVHTDXTVLT-GJZGRUSLSA-N 0.000 description 1
- 125000004080 3-carboxypropanoyl group Chemical group O=C([*])C([H])([H])C([H])([H])C(O[H])=O 0.000 description 1
- QRKPLLLQZJCOLR-UHFFFAOYSA-N 6-[2-(4-carboxybut-2-enyl)-3-hydroxy-5-oxocyclopentyl]-4-oxohexanoic acid Chemical compound OC1CC(=O)C(CCC(=O)CCC(O)=O)C1CC=CCC(O)=O QRKPLLLQZJCOLR-UHFFFAOYSA-N 0.000 description 1
- SYFQYGMJENQVQT-UHFFFAOYSA-N 6-amino-2-[bis(carboxymethyl)amino]hexanoic acid Chemical compound NCCCCC(C(O)=O)N(CC(O)=O)CC(O)=O SYFQYGMJENQVQT-UHFFFAOYSA-N 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- YAXNATKKPOWVCP-ZLUOBGJFSA-N Ala-Asn-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O YAXNATKKPOWVCP-ZLUOBGJFSA-N 0.000 description 1
- MBWYUTNBYSSUIQ-HERUPUMHSA-N Ala-Asn-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N MBWYUTNBYSSUIQ-HERUPUMHSA-N 0.000 description 1
- WJRXVTCKASUIFF-FXQIFTODSA-N Ala-Cys-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WJRXVTCKASUIFF-FXQIFTODSA-N 0.000 description 1
- VIGKUFXFTPWYER-BIIVOSGPSA-N Ala-Cys-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N VIGKUFXFTPWYER-BIIVOSGPSA-N 0.000 description 1
- UQJUGHFKNKGHFQ-VZFHVOOUSA-N Ala-Cys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UQJUGHFKNKGHFQ-VZFHVOOUSA-N 0.000 description 1
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 1
- BLIMFWGRQKRCGT-YUMQZZPRSA-N Ala-Gly-Lys Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN BLIMFWGRQKRCGT-YUMQZZPRSA-N 0.000 description 1
- QHASENCZLDHBGX-ONGXEEELSA-N Ala-Gly-Phe Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QHASENCZLDHBGX-ONGXEEELSA-N 0.000 description 1
- NYDBKUNVSALYPX-NAKRPEOUSA-N Ala-Ile-Arg Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NYDBKUNVSALYPX-NAKRPEOUSA-N 0.000 description 1
- OPZJWMJPCNNZNT-DCAQKATOSA-N Ala-Leu-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N OPZJWMJPCNNZNT-DCAQKATOSA-N 0.000 description 1
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 1
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 1
- MMLHRUJLOUSRJX-CIUDSAMLSA-N Ala-Ser-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN MMLHRUJLOUSRJX-CIUDSAMLSA-N 0.000 description 1
- OMCKWYSDUQBYCN-FXQIFTODSA-N Ala-Ser-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O OMCKWYSDUQBYCN-FXQIFTODSA-N 0.000 description 1
- UCDOXFBTMLKASE-HERUPUMHSA-N Ala-Ser-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N UCDOXFBTMLKASE-HERUPUMHSA-N 0.000 description 1
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 1
- DHONNEYAZPNGSG-UBHSHLNASA-N Ala-Val-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DHONNEYAZPNGSG-UBHSHLNASA-N 0.000 description 1
- SBVJJNJLFWSJOV-UBHSHLNASA-N Arg-Ala-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SBVJJNJLFWSJOV-UBHSHLNASA-N 0.000 description 1
- ITVINTQUZMQWJR-QXEWZRGKSA-N Arg-Asn-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ITVINTQUZMQWJR-QXEWZRGKSA-N 0.000 description 1
- XVLLUZMFSAYKJV-GUBZILKMSA-N Arg-Asp-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XVLLUZMFSAYKJV-GUBZILKMSA-N 0.000 description 1
- DXQIQUIQYAGRCC-CIUDSAMLSA-N Arg-Asp-Gln Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)CN=C(N)N DXQIQUIQYAGRCC-CIUDSAMLSA-N 0.000 description 1
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 1
- YSUVMPICYVWRBX-VEVYYDQMSA-N Arg-Asp-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YSUVMPICYVWRBX-VEVYYDQMSA-N 0.000 description 1
- HPKSHFSEXICTLI-CIUDSAMLSA-N Arg-Glu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HPKSHFSEXICTLI-CIUDSAMLSA-N 0.000 description 1
- QAXCZGMLVICQKS-SRVKXCTJSA-N Arg-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N QAXCZGMLVICQKS-SRVKXCTJSA-N 0.000 description 1
- RFXXUWGNVRJTNQ-QXEWZRGKSA-N Arg-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N RFXXUWGNVRJTNQ-QXEWZRGKSA-N 0.000 description 1
- VRZDJJWOFXMFRO-ZFWWWQNUSA-N Arg-Gly-Trp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O VRZDJJWOFXMFRO-ZFWWWQNUSA-N 0.000 description 1
- NVUIWHJLPSZZQC-CYDGBPFRSA-N Arg-Ile-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NVUIWHJLPSZZQC-CYDGBPFRSA-N 0.000 description 1
- YQGZIRIYGHNSQO-ZPFDUUQYSA-N Arg-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YQGZIRIYGHNSQO-ZPFDUUQYSA-N 0.000 description 1
- KMFPQTITXUKJOV-DCAQKATOSA-N Arg-Ser-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O KMFPQTITXUKJOV-DCAQKATOSA-N 0.000 description 1
- OQPAZKMGCWPERI-GUBZILKMSA-N Arg-Ser-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OQPAZKMGCWPERI-GUBZILKMSA-N 0.000 description 1
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 1
- LLQIAIUAKGNOSE-NHCYSSNCSA-N Arg-Val-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N LLQIAIUAKGNOSE-NHCYSSNCSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- IARGXWMWRFOQPG-GCJQMDKQSA-N Asn-Ala-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IARGXWMWRFOQPG-GCJQMDKQSA-N 0.000 description 1
- LJUOLNXOWSWGKF-ACZMJKKPSA-N Asn-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N LJUOLNXOWSWGKF-ACZMJKKPSA-N 0.000 description 1
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 1
- JRVABKHPWDRUJF-UBHSHLNASA-N Asn-Asn-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N JRVABKHPWDRUJF-UBHSHLNASA-N 0.000 description 1
- BVLIJXXSXBUGEC-SRVKXCTJSA-N Asn-Asn-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BVLIJXXSXBUGEC-SRVKXCTJSA-N 0.000 description 1
- QISZHYWZHJRDAO-CIUDSAMLSA-N Asn-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N QISZHYWZHJRDAO-CIUDSAMLSA-N 0.000 description 1
- HLTLEIXYIJDFOY-ZLUOBGJFSA-N Asn-Cys-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O HLTLEIXYIJDFOY-ZLUOBGJFSA-N 0.000 description 1
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 1
- AITGTTNYKAWKDR-CIUDSAMLSA-N Asn-His-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O AITGTTNYKAWKDR-CIUDSAMLSA-N 0.000 description 1
- PTSDPWIHOYMRGR-UGYAYLCHSA-N Asn-Ile-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O PTSDPWIHOYMRGR-UGYAYLCHSA-N 0.000 description 1
- NLDNNZKUSLAYFW-NHCYSSNCSA-N Asn-Lys-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O NLDNNZKUSLAYFW-NHCYSSNCSA-N 0.000 description 1
- QGABLMITFKUQDF-DCAQKATOSA-N Asn-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N QGABLMITFKUQDF-DCAQKATOSA-N 0.000 description 1
- RTFWCVDISAMGEQ-SRVKXCTJSA-N Asn-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N RTFWCVDISAMGEQ-SRVKXCTJSA-N 0.000 description 1
- BKFXFUPYETWGGA-XVSYOHENSA-N Asn-Phe-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BKFXFUPYETWGGA-XVSYOHENSA-N 0.000 description 1
- YRTOMUMWSTUQAX-FXQIFTODSA-N Asn-Pro-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O YRTOMUMWSTUQAX-FXQIFTODSA-N 0.000 description 1
- ZUFPUBYQYWCMDB-NUMRIWBASA-N Asn-Thr-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZUFPUBYQYWCMDB-NUMRIWBASA-N 0.000 description 1
- FAEIQWHBRBWUBN-FXQIFTODSA-N Asp-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N)CN=C(N)N FAEIQWHBRBWUBN-FXQIFTODSA-N 0.000 description 1
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 1
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 1
- XAJRHVUUVUPFQL-ACZMJKKPSA-N Asp-Glu-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XAJRHVUUVUPFQL-ACZMJKKPSA-N 0.000 description 1
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 1
- KYQNAIMCTRZLNP-QSFUFRPTSA-N Asp-Ile-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O KYQNAIMCTRZLNP-QSFUFRPTSA-N 0.000 description 1
- QNIACYURSSCLRP-GUBZILKMSA-N Asp-Lys-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O QNIACYURSSCLRP-GUBZILKMSA-N 0.000 description 1
- HJCGDIGVVWETRO-ZPFDUUQYSA-N Asp-Lys-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O)C(O)=O HJCGDIGVVWETRO-ZPFDUUQYSA-N 0.000 description 1
- AHWRSSLYSGLBGD-CIUDSAMLSA-N Asp-Pro-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AHWRSSLYSGLBGD-CIUDSAMLSA-N 0.000 description 1
- XXAMCEGRCZQGEM-ZLUOBGJFSA-N Asp-Ser-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O XXAMCEGRCZQGEM-ZLUOBGJFSA-N 0.000 description 1
- BJDHEININLSZOT-KKUMJFAQSA-N Asp-Tyr-Lys Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(O)=O BJDHEININLSZOT-KKUMJFAQSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 241000700198 Cavia Species 0.000 description 1
- 208000034628 Celiac artery compression syndrome Diseases 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 229940046168 CpG oligodeoxynucleotide Drugs 0.000 description 1
- GEEXORWTBTUOHC-FXQIFTODSA-N Cys-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N)CN=C(N)N GEEXORWTBTUOHC-FXQIFTODSA-N 0.000 description 1
- KIQKJXYVGSYDFS-ZLUOBGJFSA-N Cys-Asn-Asn Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O KIQKJXYVGSYDFS-ZLUOBGJFSA-N 0.000 description 1
- CPTUXCUWQIBZIF-ZLUOBGJFSA-N Cys-Asn-Ser Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CPTUXCUWQIBZIF-ZLUOBGJFSA-N 0.000 description 1
- KCPOQGRVVXYLAC-KKUMJFAQSA-N Cys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CS)N KCPOQGRVVXYLAC-KKUMJFAQSA-N 0.000 description 1
- YNJBLTDKTMKEET-ZLUOBGJFSA-N Cys-Ser-Ser Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O YNJBLTDKTMKEET-ZLUOBGJFSA-N 0.000 description 1
- JIVJQYNNAYFXDG-LKXGYXEUSA-N Cys-Thr-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O JIVJQYNNAYFXDG-LKXGYXEUSA-N 0.000 description 1
- MWVDDZUTWXFYHL-XKBZYTNZSA-N Cys-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CS)N)O MWVDDZUTWXFYHL-XKBZYTNZSA-N 0.000 description 1
- NAPULYCVEVVFRB-HEIBUPTGSA-N Cys-Thr-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)CS NAPULYCVEVVFRB-HEIBUPTGSA-N 0.000 description 1
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 1
- MYMOFIZGZYHOMD-UHFFFAOYSA-N Dioxygen Chemical compound O=O MYMOFIZGZYHOMD-UHFFFAOYSA-N 0.000 description 1
- 102000004961 Furin Human genes 0.000 description 1
- 108090001126 Furin Proteins 0.000 description 1
- 102100030393 G-patch domain and KOW motifs-containing protein Human genes 0.000 description 1
- 101710177291 Gag polyprotein Proteins 0.000 description 1
- 101710114816 Gene 41 protein Proteins 0.000 description 1
- RKAQZCDMSUQTSS-FXQIFTODSA-N Gln-Asp-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N RKAQZCDMSUQTSS-FXQIFTODSA-N 0.000 description 1
- CITDWMLWXNUQKD-FXQIFTODSA-N Gln-Gln-Asn Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CITDWMLWXNUQKD-FXQIFTODSA-N 0.000 description 1
- NVEASDQHBRZPSU-BQBZGAKWSA-N Gln-Gln-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O NVEASDQHBRZPSU-BQBZGAKWSA-N 0.000 description 1
- GPISLLFQNHELLK-DCAQKATOSA-N Gln-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N GPISLLFQNHELLK-DCAQKATOSA-N 0.000 description 1
- CGVWDTRDPLOMHZ-FXQIFTODSA-N Gln-Glu-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O CGVWDTRDPLOMHZ-FXQIFTODSA-N 0.000 description 1
- PXAFHUATEHLECW-GUBZILKMSA-N Gln-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N PXAFHUATEHLECW-GUBZILKMSA-N 0.000 description 1
- FGYPOQPQTUNESW-IUCAKERBSA-N Gln-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N FGYPOQPQTUNESW-IUCAKERBSA-N 0.000 description 1
- YXQCLIVLWCKCRS-RYUDHWBXSA-N Gln-Gly-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N)O YXQCLIVLWCKCRS-RYUDHWBXSA-N 0.000 description 1
- TWTWUBHEWQPMQW-ZPFDUUQYSA-N Gln-Ile-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWTWUBHEWQPMQW-ZPFDUUQYSA-N 0.000 description 1
- DAAUVRPSZRDMBV-KBIXCLLPSA-N Gln-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)N)N DAAUVRPSZRDMBV-KBIXCLLPSA-N 0.000 description 1
- TYRMVTKPOWPZBC-SXNHZJKMSA-N Gln-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCC(=O)N)N TYRMVTKPOWPZBC-SXNHZJKMSA-N 0.000 description 1
- VZRAXPGTUNDIDK-GUBZILKMSA-N Gln-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N VZRAXPGTUNDIDK-GUBZILKMSA-N 0.000 description 1
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 1
- QBEWLBKBGXVVPD-RYUDHWBXSA-N Gln-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N QBEWLBKBGXVVPD-RYUDHWBXSA-N 0.000 description 1
- DYVMTEWCGAVKSE-HJGDQZAQSA-N Gln-Thr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O DYVMTEWCGAVKSE-HJGDQZAQSA-N 0.000 description 1
- VOUSELYGTNGEPB-NUMRIWBASA-N Gln-Thr-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O VOUSELYGTNGEPB-NUMRIWBASA-N 0.000 description 1
- HGBHRZBXOOHRDH-JBACZVJFSA-N Gln-Tyr-Trp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O HGBHRZBXOOHRDH-JBACZVJFSA-N 0.000 description 1
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 1
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 1
- VTTSANCGJWLPNC-ZPFDUUQYSA-N Glu-Arg-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VTTSANCGJWLPNC-ZPFDUUQYSA-N 0.000 description 1
- ZJICFHQSPWFBKP-AVGNSLFASA-N Glu-Asn-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZJICFHQSPWFBKP-AVGNSLFASA-N 0.000 description 1
- FLQAKQOBSPFGKG-CIUDSAMLSA-N Glu-Cys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FLQAKQOBSPFGKG-CIUDSAMLSA-N 0.000 description 1
- XHUCVVHRLNPZSZ-CIUDSAMLSA-N Glu-Gln-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XHUCVVHRLNPZSZ-CIUDSAMLSA-N 0.000 description 1
- IQACOVZVOMVILH-FXQIFTODSA-N Glu-Glu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O IQACOVZVOMVILH-FXQIFTODSA-N 0.000 description 1
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 1
- NJPQBTJSYCKCNS-HVTMNAMFSA-N Glu-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N NJPQBTJSYCKCNS-HVTMNAMFSA-N 0.000 description 1
- ITBHUUMCJJQUSC-LAEOZQHASA-N Glu-Ile-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O ITBHUUMCJJQUSC-LAEOZQHASA-N 0.000 description 1
- WTMZXOPHTIVFCP-QEWYBTABSA-N Glu-Ile-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WTMZXOPHTIVFCP-QEWYBTABSA-N 0.000 description 1
- SJJHXJDSNQJMMW-SRVKXCTJSA-N Glu-Lys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SJJHXJDSNQJMMW-SRVKXCTJSA-N 0.000 description 1
- SYWCGQOIIARSIX-SRVKXCTJSA-N Glu-Pro-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O SYWCGQOIIARSIX-SRVKXCTJSA-N 0.000 description 1
- GPSHCSTUYOQPAI-JHEQGTHGSA-N Glu-Thr-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O GPSHCSTUYOQPAI-JHEQGTHGSA-N 0.000 description 1
- NTHIHAUEXVTXQG-KKUMJFAQSA-N Glu-Tyr-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O NTHIHAUEXVTXQG-KKUMJFAQSA-N 0.000 description 1
- HJTSRYLPAYGEEC-SIUGBPQLSA-N Glu-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)O)N HJTSRYLPAYGEEC-SIUGBPQLSA-N 0.000 description 1
- SITLTJHOQZFJGG-XPUUQOCRSA-N Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O SITLTJHOQZFJGG-XPUUQOCRSA-N 0.000 description 1
- YQPFCZVKMUVZIN-AUTRQRHGSA-N Glu-Val-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQPFCZVKMUVZIN-AUTRQRHGSA-N 0.000 description 1
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- MXXXVOYFNVJHMA-IUCAKERBSA-N Gly-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN MXXXVOYFNVJHMA-IUCAKERBSA-N 0.000 description 1
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 1
- CUYLIWAAAYJKJH-RYUDHWBXSA-N Gly-Glu-Tyr Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CUYLIWAAAYJKJH-RYUDHWBXSA-N 0.000 description 1
- SXJHOPPTOJACOA-QXEWZRGKSA-N Gly-Ile-Arg Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SXJHOPPTOJACOA-QXEWZRGKSA-N 0.000 description 1
- JPAACTMBBBGAAR-HOTGVXAUSA-N Gly-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)CN)CC(C)C)C(O)=O)=CNC2=C1 JPAACTMBBBGAAR-HOTGVXAUSA-N 0.000 description 1
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 1
- PDUHNKAFQXQNLH-ZETCQYMHSA-N Gly-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)NCC(O)=O PDUHNKAFQXQNLH-ZETCQYMHSA-N 0.000 description 1
- PTIIBFKSLCYQBO-NHCYSSNCSA-N Gly-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)CN PTIIBFKSLCYQBO-NHCYSSNCSA-N 0.000 description 1
- OQQKUTVULYLCDG-ONGXEEELSA-N Gly-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)CN)C(O)=O OQQKUTVULYLCDG-ONGXEEELSA-N 0.000 description 1
- YHYDTTUSJXGTQK-UWVGGRQHSA-N Gly-Met-Leu Chemical compound CSCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(C)C)C(O)=O YHYDTTUSJXGTQK-UWVGGRQHSA-N 0.000 description 1
- 108010009504 Gly-Phe-Leu-Gly Proteins 0.000 description 1
- NZOAFWHVAFJERA-OALUTQOASA-N Gly-Phe-Trp Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O NZOAFWHVAFJERA-OALUTQOASA-N 0.000 description 1
- OHUKZZYSJBKFRR-WHFBIAKZSA-N Gly-Ser-Asp Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O OHUKZZYSJBKFRR-WHFBIAKZSA-N 0.000 description 1
- MKIAPEZXQDILRR-YUMQZZPRSA-N Gly-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN MKIAPEZXQDILRR-YUMQZZPRSA-N 0.000 description 1
- BXDLTKLPPKBVEL-FJXKBIBVSA-N Gly-Thr-Met Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O BXDLTKLPPKBVEL-FJXKBIBVSA-N 0.000 description 1
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 1
- 241000282575 Gorilla Species 0.000 description 1
- 241000560067 HIV-1 group M Species 0.000 description 1
- 241000590002 Helicobacter pylori Species 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- SYMSVYVUSPSAAO-IHRRRGAJSA-N His-Arg-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O SYMSVYVUSPSAAO-IHRRRGAJSA-N 0.000 description 1
- KYMUEAZVLPRVAE-GUBZILKMSA-N His-Asn-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KYMUEAZVLPRVAE-GUBZILKMSA-N 0.000 description 1
- DYKZGTLPSNOFHU-DEQVHRJGSA-N His-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N DYKZGTLPSNOFHU-DEQVHRJGSA-N 0.000 description 1
- BZAQOPHNBFOOJS-DCAQKATOSA-N His-Pro-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O BZAQOPHNBFOOJS-DCAQKATOSA-N 0.000 description 1
- VIJMRAIWYWRXSR-CIUDSAMLSA-N His-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 VIJMRAIWYWRXSR-CIUDSAMLSA-N 0.000 description 1
- NBWATNYAUVSAEQ-ZEILLAHLSA-N His-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O NBWATNYAUVSAEQ-ZEILLAHLSA-N 0.000 description 1
- 241000701024 Human betaherpesvirus 5 Species 0.000 description 1
- MKWSZEHGHSLNPF-NAKRPEOUSA-N Ile-Ala-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O)N MKWSZEHGHSLNPF-NAKRPEOUSA-N 0.000 description 1
- WECYRWOMWSCWNX-XUXIUFHCSA-N Ile-Arg-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O WECYRWOMWSCWNX-XUXIUFHCSA-N 0.000 description 1
- QYZYJFXHXYUZMZ-UGYAYLCHSA-N Ile-Asn-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N QYZYJFXHXYUZMZ-UGYAYLCHSA-N 0.000 description 1
- SCHZQZPYHBWYEQ-PEFMBERDSA-N Ile-Asn-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SCHZQZPYHBWYEQ-PEFMBERDSA-N 0.000 description 1
- IPYVXYDYLHVWHU-GMOBBJLQSA-N Ile-Asn-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N IPYVXYDYLHVWHU-GMOBBJLQSA-N 0.000 description 1
- ZZHGKECPZXPXJF-PCBIJLKTSA-N Ile-Asn-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZZHGKECPZXPXJF-PCBIJLKTSA-N 0.000 description 1
- FADXGVVLSPPEQY-GHCJXIJMSA-N Ile-Cys-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N FADXGVVLSPPEQY-GHCJXIJMSA-N 0.000 description 1
- DURWCDDDAWVPOP-JBDRJPRFSA-N Ile-Cys-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N DURWCDDDAWVPOP-JBDRJPRFSA-N 0.000 description 1
- DVRDRICMWUSCBN-UKJIMTQDSA-N Ile-Gln-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DVRDRICMWUSCBN-UKJIMTQDSA-N 0.000 description 1
- LPXHYGGZJOCAFR-MNXVOIDGSA-N Ile-Glu-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N LPXHYGGZJOCAFR-MNXVOIDGSA-N 0.000 description 1
- SLQVFYWBGNNOTK-BYULHYEWSA-N Ile-Gly-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N SLQVFYWBGNNOTK-BYULHYEWSA-N 0.000 description 1
- DMSVBUWGDLYNLC-IAVJCBSLSA-N Ile-Ile-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DMSVBUWGDLYNLC-IAVJCBSLSA-N 0.000 description 1
- KLBVGHCGHUNHEA-BJDJZHNGSA-N Ile-Leu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)O)N KLBVGHCGHUNHEA-BJDJZHNGSA-N 0.000 description 1
- FZWVCYCYWCLQDH-NHCYSSNCSA-N Ile-Leu-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N FZWVCYCYWCLQDH-NHCYSSNCSA-N 0.000 description 1
- GAZGFPOZOLEYAJ-YTFOTSKYSA-N Ile-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N GAZGFPOZOLEYAJ-YTFOTSKYSA-N 0.000 description 1
- PMMMQRVUMVURGJ-XUXIUFHCSA-N Ile-Leu-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O PMMMQRVUMVURGJ-XUXIUFHCSA-N 0.000 description 1
- YSGBJIQXTIVBHZ-AJNGGQMLSA-N Ile-Lys-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O YSGBJIQXTIVBHZ-AJNGGQMLSA-N 0.000 description 1
- CKRFDMPBSWYOBT-PPCPHDFISA-N Ile-Lys-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CKRFDMPBSWYOBT-PPCPHDFISA-N 0.000 description 1
- RCMNUBZKIIJCOI-ZPFDUUQYSA-N Ile-Met-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RCMNUBZKIIJCOI-ZPFDUUQYSA-N 0.000 description 1
- SNHYFFQZRFIRHO-CYDGBPFRSA-N Ile-Met-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)O)N SNHYFFQZRFIRHO-CYDGBPFRSA-N 0.000 description 1
- FBGXMKUWQFPHFB-JBDRJPRFSA-N Ile-Ser-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N FBGXMKUWQFPHFB-JBDRJPRFSA-N 0.000 description 1
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 1
- RQJUKVXWAKJDBW-SVSWQMSJSA-N Ile-Ser-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N RQJUKVXWAKJDBW-SVSWQMSJSA-N 0.000 description 1
- NAFIFZNBSPWYOO-RWRJDSDZSA-N Ile-Thr-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N NAFIFZNBSPWYOO-RWRJDSDZSA-N 0.000 description 1
- HZVRQFKRALAMQS-SLBDDTMCSA-N Ile-Trp-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZVRQFKRALAMQS-SLBDDTMCSA-N 0.000 description 1
- NGKPIPCGMLWHBX-WZLNRYEVSA-N Ile-Tyr-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N NGKPIPCGMLWHBX-WZLNRYEVSA-N 0.000 description 1
- YWCJXQKATPNPOE-UKJIMTQDSA-N Ile-Val-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YWCJXQKATPNPOE-UKJIMTQDSA-N 0.000 description 1
- ZSESFIFAYQEKRD-CYDGBPFRSA-N Ile-Val-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N ZSESFIFAYQEKRD-CYDGBPFRSA-N 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- 125000003290 L-leucino group Chemical group [H]OC(=O)[C@@]([H])(N([H])[*])C([H])([H])C(C([H])([H])[H])([H])C([H])([H])[H] 0.000 description 1
- 125000002068 L-phenylalanino group Chemical group [H]OC(=O)[C@@]([H])(N([H])[*])C([H])([H])C1=C([H])C([H])=C([H])C([H])=C1[H] 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 1
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 1
- HBJZFCIVFIBNSV-DCAQKATOSA-N Leu-Arg-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O HBJZFCIVFIBNSV-DCAQKATOSA-N 0.000 description 1
- GRZSCTXVCDUIPO-SRVKXCTJSA-N Leu-Arg-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRZSCTXVCDUIPO-SRVKXCTJSA-N 0.000 description 1
- UILIPCLTHRPCRB-XUXIUFHCSA-N Leu-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(C)C)N UILIPCLTHRPCRB-XUXIUFHCSA-N 0.000 description 1
- POJPZSMTTMLSTG-SRVKXCTJSA-N Leu-Asn-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N POJPZSMTTMLSTG-SRVKXCTJSA-N 0.000 description 1
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 1
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 1
- HGFGEMSVBMCFKK-MNXVOIDGSA-N Leu-Ile-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HGFGEMSVBMCFKK-MNXVOIDGSA-N 0.000 description 1
- JFSGIJSCJFQGSZ-MXAVVETBSA-N Leu-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(C)C)N JFSGIJSCJFQGSZ-MXAVVETBSA-N 0.000 description 1
- TVEOVCYCYGKVPP-HSCHXYMDSA-N Leu-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(C)C)N TVEOVCYCYGKVPP-HSCHXYMDSA-N 0.000 description 1
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 1
- FAELBUXXFQLUAX-AJNGGQMLSA-N Leu-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C FAELBUXXFQLUAX-AJNGGQMLSA-N 0.000 description 1
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 1
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 1
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 1
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 1
- YWFZWQKWNDOWPA-XIRDDKMYSA-N Leu-Trp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O YWFZWQKWNDOWPA-XIRDDKMYSA-N 0.000 description 1
- LXGSOEPHQJONMG-PMVMPFDFSA-N Leu-Trp-Tyr Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)N LXGSOEPHQJONMG-PMVMPFDFSA-N 0.000 description 1
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 1
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 1
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 1
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 239000000232 Lipid Bilayer Substances 0.000 description 1
- WSXTWLJHTLRFLW-SRVKXCTJSA-N Lys-Ala-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O WSXTWLJHTLRFLW-SRVKXCTJSA-N 0.000 description 1
- VHNOAIFVYUQOOY-XUXIUFHCSA-N Lys-Arg-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VHNOAIFVYUQOOY-XUXIUFHCSA-N 0.000 description 1
- NQCJGQHHYZNUDK-DCAQKATOSA-N Lys-Arg-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CCCN=C(N)N NQCJGQHHYZNUDK-DCAQKATOSA-N 0.000 description 1
- LZWNAOIMTLNMDW-NHCYSSNCSA-N Lys-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N LZWNAOIMTLNMDW-NHCYSSNCSA-N 0.000 description 1
- HKCCVDWHHTVVPN-CIUDSAMLSA-N Lys-Asp-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O HKCCVDWHHTVVPN-CIUDSAMLSA-N 0.000 description 1
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 1
- QQUJSUFWEDZQQY-AVGNSLFASA-N Lys-Gln-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN QQUJSUFWEDZQQY-AVGNSLFASA-N 0.000 description 1
- NNCDAORZCMPZPX-GUBZILKMSA-N Lys-Gln-Ser Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N NNCDAORZCMPZPX-GUBZILKMSA-N 0.000 description 1
- IRRZDAIFYHNIIN-JYJNAYRXSA-N Lys-Gln-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IRRZDAIFYHNIIN-JYJNAYRXSA-N 0.000 description 1
- LPAJOCKCPRZEAG-MNXVOIDGSA-N Lys-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCCN LPAJOCKCPRZEAG-MNXVOIDGSA-N 0.000 description 1
- DTUZCYRNEJDKSR-NHCYSSNCSA-N Lys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN DTUZCYRNEJDKSR-NHCYSSNCSA-N 0.000 description 1
- OVAOHZIOUBEQCJ-IHRRRGAJSA-N Lys-Leu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OVAOHZIOUBEQCJ-IHRRRGAJSA-N 0.000 description 1
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 1
- PFZWARWVRNTPBR-IHPCNDPISA-N Lys-Leu-Trp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCCN)N PFZWARWVRNTPBR-IHPCNDPISA-N 0.000 description 1
- DNWBUCHHMRQWCZ-GUBZILKMSA-N Lys-Ser-Gln Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O DNWBUCHHMRQWCZ-GUBZILKMSA-N 0.000 description 1
- USPJSTBDIGJPFK-PMVMPFDFSA-N Lys-Tyr-Trp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O USPJSTBDIGJPFK-PMVMPFDFSA-N 0.000 description 1
- VKCPHIOZDWUFSW-ONGXEEELSA-N Lys-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN VKCPHIOZDWUFSW-ONGXEEELSA-N 0.000 description 1
- VWJFOUBDZIUXGA-AVGNSLFASA-N Lys-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCCN)N VWJFOUBDZIUXGA-AVGNSLFASA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 239000007993 MOPS buffer Substances 0.000 description 1
- 241000701076 Macacine alphaherpesvirus 1 Species 0.000 description 1
- 101710125418 Major capsid protein Proteins 0.000 description 1
- YAWKHFKCNSXYDS-XIRDDKMYSA-N Met-Glu-Trp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N YAWKHFKCNSXYDS-XIRDDKMYSA-N 0.000 description 1
- ZEVPMOHYCQFWSE-NAKRPEOUSA-N Met-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCSC)N ZEVPMOHYCQFWSE-NAKRPEOUSA-N 0.000 description 1
- SODXFJOPSCXOHE-IHRRRGAJSA-N Met-Leu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O SODXFJOPSCXOHE-IHRRRGAJSA-N 0.000 description 1
- HOTNHEUETJELDL-BPNCWPANSA-N Met-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCSC)N HOTNHEUETJELDL-BPNCWPANSA-N 0.000 description 1
- FSTWDRPCQQUJIT-NHCYSSNCSA-N Met-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCSC)N FSTWDRPCQQUJIT-NHCYSSNCSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 241000187480 Mycobacterium smegmatis Species 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 108010092030 NAKTIIVQL nanopeptide Proteins 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 108010036616 P18-I10 peptide Proteins 0.000 description 1
- 241000282577 Pan troglodytes Species 0.000 description 1
- KIEPQOIQHFKQLK-PCBIJLKTSA-N Phe-Asn-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KIEPQOIQHFKQLK-PCBIJLKTSA-N 0.000 description 1
- CDNPIRSCAFMMBE-SRVKXCTJSA-N Phe-Asn-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CDNPIRSCAFMMBE-SRVKXCTJSA-N 0.000 description 1
- GHNVJQZQYKNTDX-HJWJTTGWSA-N Phe-Ile-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(O)=O GHNVJQZQYKNTDX-HJWJTTGWSA-N 0.000 description 1
- JHSRGEODDALISP-XVSYOHENSA-N Phe-Thr-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O JHSRGEODDALISP-XVSYOHENSA-N 0.000 description 1
- 229920001213 Polysorbate 20 Polymers 0.000 description 1
- NHDVNAKDACFHPX-GUBZILKMSA-N Pro-Arg-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O NHDVNAKDACFHPX-GUBZILKMSA-N 0.000 description 1
- BNBBNGZZKQUWCD-IUCAKERBSA-N Pro-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 BNBBNGZZKQUWCD-IUCAKERBSA-N 0.000 description 1
- XROLYVMNVIKVEM-BQBZGAKWSA-N Pro-Asn-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O XROLYVMNVIKVEM-BQBZGAKWSA-N 0.000 description 1
- JARJPEMLQAWNBR-GUBZILKMSA-N Pro-Asp-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JARJPEMLQAWNBR-GUBZILKMSA-N 0.000 description 1
- NMELOOXSGDRBRU-YUMQZZPRSA-N Pro-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)O)NC(=O)[C@@H]1CCCN1 NMELOOXSGDRBRU-YUMQZZPRSA-N 0.000 description 1
- WVOXLKUUVCCCSU-ZPFDUUQYSA-N Pro-Glu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVOXLKUUVCCCSU-ZPFDUUQYSA-N 0.000 description 1
- GSPPWVHVBBSPSY-FHWLQOOXSA-N Pro-His-Trp Chemical compound OC(=O)[C@H](Cc1c[nH]c2ccccc12)NC(=O)[C@H](Cc1cnc[nH]1)NC(=O)[C@@H]1CCCN1 GSPPWVHVBBSPSY-FHWLQOOXSA-N 0.000 description 1
- KWMUAKQOVYCQJQ-ZPFDUUQYSA-N Pro-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@@H]1CCCN1 KWMUAKQOVYCQJQ-ZPFDUUQYSA-N 0.000 description 1
- FKVNLUZHSFCNGY-RVMXOQNASA-N Pro-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 FKVNLUZHSFCNGY-RVMXOQNASA-N 0.000 description 1
- XZBYTHCRAVAXQQ-DCAQKATOSA-N Pro-Met-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O XZBYTHCRAVAXQQ-DCAQKATOSA-N 0.000 description 1
- AJJDPGVVNPUZCR-RHYQMDGZSA-N Pro-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1)O AJJDPGVVNPUZCR-RHYQMDGZSA-N 0.000 description 1
- 102220470494 Proteasome subunit beta type-3_M34L_mutation Human genes 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 241000712907 Retroviridae Species 0.000 description 1
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 1
- YUSRGTQIPCJNHQ-CIUDSAMLSA-N Ser-Arg-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O YUSRGTQIPCJNHQ-CIUDSAMLSA-N 0.000 description 1
- BRGQQXQKPUCUJQ-KBIXCLLPSA-N Ser-Glu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRGQQXQKPUCUJQ-KBIXCLLPSA-N 0.000 description 1
- QKQDTEYDEIJPNK-GUBZILKMSA-N Ser-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO QKQDTEYDEIJPNK-GUBZILKMSA-N 0.000 description 1
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 1
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 1
- BEAFYHFQTOTVFS-VGDYDELISA-N Ser-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N BEAFYHFQTOTVFS-VGDYDELISA-N 0.000 description 1
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 1
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 1
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 1
- RQXDSYQXBCRXBT-GUBZILKMSA-N Ser-Met-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RQXDSYQXBCRXBT-GUBZILKMSA-N 0.000 description 1
- RXSWQCATLWVDLI-XGEHTFHBSA-N Ser-Met-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RXSWQCATLWVDLI-XGEHTFHBSA-N 0.000 description 1
- FZEUTKVQGMVGHW-AVGNSLFASA-N Ser-Phe-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZEUTKVQGMVGHW-AVGNSLFASA-N 0.000 description 1
- BUYHXYIUQUBEQP-AVGNSLFASA-N Ser-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CO)N BUYHXYIUQUBEQP-AVGNSLFASA-N 0.000 description 1
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 1
- AABIBDJHSKIMJK-FXQIFTODSA-N Ser-Ser-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O AABIBDJHSKIMJK-FXQIFTODSA-N 0.000 description 1
- KKKVOZNCLALMPV-XKBZYTNZSA-N Ser-Thr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KKKVOZNCLALMPV-XKBZYTNZSA-N 0.000 description 1
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 1
- PCJLFYBAQZQOFE-KATARQTJSA-N Ser-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N)O PCJLFYBAQZQOFE-KATARQTJSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 210000001744 T-lymphocyte Anatomy 0.000 description 1
- XSLXHSYIVPGEER-KZVJFYERSA-N Thr-Ala-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O XSLXHSYIVPGEER-KZVJFYERSA-N 0.000 description 1
- JNQZPAWOPBZGIX-RCWTZXSCSA-N Thr-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N JNQZPAWOPBZGIX-RCWTZXSCSA-N 0.000 description 1
- VBPDMBAFBRDZSK-HOUAVDHOSA-N Thr-Asn-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O VBPDMBAFBRDZSK-HOUAVDHOSA-N 0.000 description 1
- LMMDEZPNUTZJAY-GCJQMDKQSA-N Thr-Asp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O LMMDEZPNUTZJAY-GCJQMDKQSA-N 0.000 description 1
- VXMHQKHDKCATDV-VEVYYDQMSA-N Thr-Asp-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VXMHQKHDKCATDV-VEVYYDQMSA-N 0.000 description 1
- NLSNVZAREYQMGR-HJGDQZAQSA-N Thr-Asp-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NLSNVZAREYQMGR-HJGDQZAQSA-N 0.000 description 1
- ZQUKYJOKQBRBCS-GLLZPBPUSA-N Thr-Gln-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O ZQUKYJOKQBRBCS-GLLZPBPUSA-N 0.000 description 1
- VGYBYGQXZJDZJU-XQXXSGGOSA-N Thr-Glu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VGYBYGQXZJDZJU-XQXXSGGOSA-N 0.000 description 1
- LGNBRHZANHMZHK-NUMRIWBASA-N Thr-Glu-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O LGNBRHZANHMZHK-NUMRIWBASA-N 0.000 description 1
- WYKJENSCCRJLRC-ZDLURKLDSA-N Thr-Gly-Cys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N)O WYKJENSCCRJLRC-ZDLURKLDSA-N 0.000 description 1
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 1
- XYFISNXATOERFZ-OSUNSFLBSA-N Thr-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XYFISNXATOERFZ-OSUNSFLBSA-N 0.000 description 1
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 1
- ABWNZPOIUJMNKT-IXOXFDKPSA-N Thr-Phe-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O ABWNZPOIUJMNKT-IXOXFDKPSA-N 0.000 description 1
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 description 1
- WPSKTVVMQCXPRO-BWBBJGPYSA-N Thr-Ser-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WPSKTVVMQCXPRO-BWBBJGPYSA-N 0.000 description 1
- HUPLKEHTTQBXSC-YJRXYDGGSA-N Thr-Ser-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUPLKEHTTQBXSC-YJRXYDGGSA-N 0.000 description 1
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 1
- CSNBWOJOEOPYIJ-UVOCVTCTSA-N Thr-Thr-Lys Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O CSNBWOJOEOPYIJ-UVOCVTCTSA-N 0.000 description 1
- BJJRNAVDQGREGC-HOUAVDHOSA-N Thr-Trp-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O BJJRNAVDQGREGC-HOUAVDHOSA-N 0.000 description 1
- UMFLBPIPAJMNIM-LYARXQMPSA-N Thr-Trp-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CC=CC=C3)C(=O)O)N)O UMFLBPIPAJMNIM-LYARXQMPSA-N 0.000 description 1
- ZEJBJDHSQPOVJV-UAXMHLISSA-N Thr-Trp-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZEJBJDHSQPOVJV-UAXMHLISSA-N 0.000 description 1
- VMSSYINFMOFLJM-KJEVXHAQSA-N Thr-Tyr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCSC)C(=O)O)N)O VMSSYINFMOFLJM-KJEVXHAQSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 241000723873 Tobacco mosaic virus Species 0.000 description 1
- AVYVKJMBNLPWRX-WFBYXXMGSA-N Trp-Ala-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 AVYVKJMBNLPWRX-WFBYXXMGSA-N 0.000 description 1
- ADBFWLXCCKIXBQ-XIRDDKMYSA-N Trp-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N ADBFWLXCCKIXBQ-XIRDDKMYSA-N 0.000 description 1
- BXKWZPXTTSCOMX-AQZXSJQPSA-N Trp-Asn-Thr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BXKWZPXTTSCOMX-AQZXSJQPSA-N 0.000 description 1
- DQDXHYIEITXNJY-BPUTZDHNSA-N Trp-Gln-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N DQDXHYIEITXNJY-BPUTZDHNSA-N 0.000 description 1
- VTHNLRXALGUDBS-BPUTZDHNSA-N Trp-Gln-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N VTHNLRXALGUDBS-BPUTZDHNSA-N 0.000 description 1
- DZIKVMCFXIIETR-JSGCOSHPSA-N Trp-Gly-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O DZIKVMCFXIIETR-JSGCOSHPSA-N 0.000 description 1
- NOFFAYIYPAUNRM-HKUYNNGSSA-N Trp-Gly-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC2=CNC3=CC=CC=C32)N NOFFAYIYPAUNRM-HKUYNNGSSA-N 0.000 description 1
- OGXQLUCMJZSJPW-LYSGOOTNSA-N Trp-Gly-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O OGXQLUCMJZSJPW-LYSGOOTNSA-N 0.000 description 1
- YRXXUYPYPHRJPB-RXVVDRJESA-N Trp-Gly-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O)N YRXXUYPYPHRJPB-RXVVDRJESA-N 0.000 description 1
- GWBWCGITOYODER-YTQUADARSA-N Trp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N GWBWCGITOYODER-YTQUADARSA-N 0.000 description 1
- VRTMYQGKPQZAPO-SBCJRHGPSA-N Trp-Trp-Ile Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VRTMYQGKPQZAPO-SBCJRHGPSA-N 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- XGEUYEOEZYFHRL-KKXDTOCCSA-N Tyr-Ala-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 XGEUYEOEZYFHRL-KKXDTOCCSA-N 0.000 description 1
- CRWOSTCODDFEKZ-HRCADAONSA-N Tyr-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O CRWOSTCODDFEKZ-HRCADAONSA-N 0.000 description 1
- AYPAIRCDLARHLM-KKUMJFAQSA-N Tyr-Asn-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O AYPAIRCDLARHLM-KKUMJFAQSA-N 0.000 description 1
- JFDGVHXRCKEBAU-KKUMJFAQSA-N Tyr-Asp-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O JFDGVHXRCKEBAU-KKUMJFAQSA-N 0.000 description 1
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 1
- PRONOHBTMLNXCZ-BZSNNMDCSA-N Tyr-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PRONOHBTMLNXCZ-BZSNNMDCSA-N 0.000 description 1
- KGSDLCMCDFETHU-YESZJQIVSA-N Tyr-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O KGSDLCMCDFETHU-YESZJQIVSA-N 0.000 description 1
- XUIOBCQESNDTDE-FQPOAREZSA-N Tyr-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O XUIOBCQESNDTDE-FQPOAREZSA-N 0.000 description 1
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 1
- 206010046865 Vaccinia virus infection Diseases 0.000 description 1
- NMANTMWGQZASQN-QXEWZRGKSA-N Val-Arg-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N NMANTMWGQZASQN-QXEWZRGKSA-N 0.000 description 1
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 1
- UDLYXGYWTVOIKU-QXEWZRGKSA-N Val-Asn-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UDLYXGYWTVOIKU-QXEWZRGKSA-N 0.000 description 1
- UDNYEPLJTRDMEJ-RCOVLWMOSA-N Val-Asn-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N UDNYEPLJTRDMEJ-RCOVLWMOSA-N 0.000 description 1
- CGGVNFJRZJUVAE-BYULHYEWSA-N Val-Asp-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CGGVNFJRZJUVAE-BYULHYEWSA-N 0.000 description 1
- HURRXSNHCCSJHA-AUTRQRHGSA-N Val-Gln-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HURRXSNHCCSJHA-AUTRQRHGSA-N 0.000 description 1
- XEYUMGGWQCIWAR-XVKPBYJWSA-N Val-Gln-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)NCC(=O)O)N XEYUMGGWQCIWAR-XVKPBYJWSA-N 0.000 description 1
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 1
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 1
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 1
- QRVPEKJBBRYISE-XUXIUFHCSA-N Val-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N QRVPEKJBBRYISE-XUXIUFHCSA-N 0.000 description 1
- LJSZPMSUYKKKCP-UBHSHLNASA-N Val-Phe-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 LJSZPMSUYKKKCP-UBHSHLNASA-N 0.000 description 1
- VNGKMNPAENRGDC-JYJNAYRXSA-N Val-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 VNGKMNPAENRGDC-JYJNAYRXSA-N 0.000 description 1
- LGXUZJIQCGXKGZ-QXEWZRGKSA-N Val-Pro-Asn Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)N)C(=O)O)N LGXUZJIQCGXKGZ-QXEWZRGKSA-N 0.000 description 1
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 1
- MNSSBIHFEUUXNW-RCWTZXSCSA-N Val-Thr-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N MNSSBIHFEUUXNW-RCWTZXSCSA-N 0.000 description 1
- UVHFONIHVHLDDQ-IFFSRLJSSA-N Val-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O UVHFONIHVHLDDQ-IFFSRLJSSA-N 0.000 description 1
- TVGWMCTYUFBXAP-QTKMDUPCSA-N Val-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N)O TVGWMCTYUFBXAP-QTKMDUPCSA-N 0.000 description 1
- QHSSPPHOHJSTML-HOCLYGCPSA-N Val-Trp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)NCC(=O)O)N QHSSPPHOHJSTML-HOCLYGCPSA-N 0.000 description 1
- QPJSIBAOZBVELU-BPNCWPANSA-N Val-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N QPJSIBAOZBVELU-BPNCWPANSA-N 0.000 description 1
- 241000710959 Venezuelan equine encephalitis virus Species 0.000 description 1
- 108010003533 Viral Envelope Proteins Proteins 0.000 description 1
- 108010087302 Viral Structural Proteins Proteins 0.000 description 1
- 102100038611 Vitamin D-binding protein Human genes 0.000 description 1
- 108010081404 acein-2 Proteins 0.000 description 1
- 238000013019 agitation Methods 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- AZDRQVAHHNSJOQ-UHFFFAOYSA-N alumane Chemical class [AlH3] AZDRQVAHHNSJOQ-UHFFFAOYSA-N 0.000 description 1
- WNROFYMDJYEPJX-UHFFFAOYSA-K aluminium hydroxide Chemical compound [OH-].[OH-].[OH-].[Al+3] WNROFYMDJYEPJX-UHFFFAOYSA-K 0.000 description 1
- ILRRQNADMUWWFW-UHFFFAOYSA-K aluminium phosphate Chemical compound O1[Al]2OP1(=O)O2 ILRRQNADMUWWFW-UHFFFAOYSA-K 0.000 description 1
- 230000030741 antigen processing and presentation Effects 0.000 description 1
- 230000000890 antigenic effect Effects 0.000 description 1
- 238000011225 antiretroviral therapy Methods 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 239000007900 aqueous suspension Substances 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 238000000149 argon plasma sintering Methods 0.000 description 1
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 1
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 238000012439 bead-based proximity assay Methods 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 239000012148 binding buffer Substances 0.000 description 1
- BBWBEZAMXFGUGK-UHFFFAOYSA-N bis(dodecylsulfanyl)-methylarsane Chemical compound CCCCCCCCCCCCS[As](C)SCCCCCCCCCCCC BBWBEZAMXFGUGK-UHFFFAOYSA-N 0.000 description 1
- OWMVSZAMULFTJU-UHFFFAOYSA-N bis-tris Chemical compound OCCN(CCO)C(CO)(CO)CO OWMVSZAMULFTJU-UHFFFAOYSA-N 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 210000000234 capsid Anatomy 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000036755 cellular response Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000004927 clay Substances 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000011260 co-administration Methods 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 150000001868 cobalt Chemical class 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 108091036078 conserved sequence Proteins 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000368 destabilizing effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 239000007884 disintegrant Substances 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 239000008298 dragée Substances 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000001493 electron microscopy Methods 0.000 description 1
- 230000009881 electrostatic interaction Effects 0.000 description 1
- 239000003995 emulsifying agent Substances 0.000 description 1
- 108700004025 env Genes Proteins 0.000 description 1
- 101150030339 env gene Proteins 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 210000001808 exosome Anatomy 0.000 description 1
- 210000001723 extracellular space Anatomy 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 235000003599 food sweetener Nutrition 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 239000007897 gelcap Substances 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 108010037389 glutamyl-cysteinyl-lysine Proteins 0.000 description 1
- 108010002108 glycopeptide gp432 Proteins 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 1
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 1
- 239000003979 granulating agent Substances 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 230000035876 healing Effects 0.000 description 1
- 229940037467 helicobacter pylori Drugs 0.000 description 1
- 210000002443 helper t lymphocyte Anatomy 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 238000013537 high throughput screening Methods 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 230000002163 immunogen Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 230000004941 influx Effects 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 238000010255 intramuscular injection Methods 0.000 description 1
- 239000007927 intramuscular injection Substances 0.000 description 1
- 238000007912 intraperitoneal administration Methods 0.000 description 1
- 238000007913 intrathecal administration Methods 0.000 description 1
- 238000001990 intravenous administration Methods 0.000 description 1
- 238000010253 intravenous injection Methods 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 229910052743 krypton Inorganic materials 0.000 description 1
- DNNSSWSSYDEUBZ-UHFFFAOYSA-N krypton atom Chemical compound [Kr] DNNSSWSSYDEUBZ-UHFFFAOYSA-N 0.000 description 1
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 1
- 108010091871 leucylmethionine Proteins 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 125000005439 maleimidyl group Chemical group C1(C=CC(N1*)=O)=O 0.000 description 1
- 210000004779 membrane envelope Anatomy 0.000 description 1
- 230000034217 membrane fusion Effects 0.000 description 1
- 108010005942 methionylglycine Proteins 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 229940100661 nasal inhalant Drugs 0.000 description 1
- 229940097496 nasal spray Drugs 0.000 description 1
- 239000007922 nasal spray Substances 0.000 description 1
- 238000001426 native polyacrylamide gel electrophoresis Methods 0.000 description 1
- 238000006386 neutralization reaction Methods 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 238000000424 optical density measurement Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- MXHCPCSDRGLRER-UHFFFAOYSA-N pentaglycine Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)NCC(O)=O MXHCPCSDRGLRER-UHFFFAOYSA-N 0.000 description 1
- 239000000546 pharmaceutical excipient Substances 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 1
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 230000037452 priming Effects 0.000 description 1
- 108010020432 prolyl-prolylisoleucine Proteins 0.000 description 1
- 108010031719 prolyl-serine Proteins 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000012846 protein folding Effects 0.000 description 1
- 238000001273 protein sequence alignment Methods 0.000 description 1
- 230000017854 proteolysis Effects 0.000 description 1
- 125000000561 purinyl group Chemical group N1=C(N=C2N=CNC2=C1)* 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 102200011361 rs727502767 Human genes 0.000 description 1
- 102220053067 rs727504613 Human genes 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000001338 self-assembly Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 1
- 208000007056 sickle cell anemia Diseases 0.000 description 1
- 238000007873 sieving Methods 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 229910000162 sodium phosphate Inorganic materials 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 238000010254 subcutaneous injection Methods 0.000 description 1
- 239000007929 subcutaneous injection Substances 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 239000000375 suspending agent Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 239000003765 sweetening agent Substances 0.000 description 1
- 230000008961 swelling Effects 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- 239000003826 tablet Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 238000002054 transplantation Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- 108010045269 tryptophyltryptophan Proteins 0.000 description 1
- 108010087967 type I signal peptidase Proteins 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 241000990167 unclassified Simian adenoviruses Species 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 238000002255 vaccination Methods 0.000 description 1
- 229940125575 vaccine candidate Drugs 0.000 description 1
- 208000007089 vaccinia Diseases 0.000 description 1
- 210000002845 virion Anatomy 0.000 description 1
- 239000000277 virosome Substances 0.000 description 1
- 108010063191 vitamin D-binding protein-macrophage activating factor Proteins 0.000 description 1
- 108010027345 wheylin-1 peptide Proteins 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
- C07K14/08—RNA viruses
- C07K14/15—Retroviridae, e.g. bovine leukaemia virus, feline leukaemia virus human T-cell leukaemia-lymphoma virus
- C07K14/155—Lentiviridae, e.g. human immunodeficiency virus [HIV], visna-maedi virus or equine infectious anaemia virus
- C07K14/16—HIV-1 ; HIV-2
- C07K14/162—HIV-1 ; HIV-2 env, e.g. gp160, gp110/120, gp41, V3, peptid T, CD4-Binding site
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
- A61K39/21—Retroviridae, e.g. equine infectious anemia virus
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/14—Antivirals for RNA viruses
- A61P31/18—Antivirals for RNA viruses for HIV
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P37/00—Drugs for immunological or allergic disorders
- A61P37/02—Immunomodulators
- A61P37/04—Immunostimulants
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/51—Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
- A61K2039/53—DNA (RNA) vaccination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2740/00—Reverse transcribing RNA viruses
- C12N2740/00011—Details
- C12N2740/10011—Retroviridae
- C12N2740/16011—Human Immunodeficiency Virus, HIV
- C12N2740/16111—Human Immunodeficiency Virus, HIV concerning HIV env
- C12N2740/16122—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2740/00—Reverse transcribing RNA viruses
- C12N2740/00011—Details
- C12N2740/10011—Retroviridae
- C12N2740/16011—Human Immunodeficiency Virus, HIV
- C12N2740/16111—Human Immunodeficiency Virus, HIV concerning HIV env
- C12N2740/16134—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N7/00—Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
- C12N7/02—Recovery or purification
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Virology (AREA)
- Organic Chemistry (AREA)
- Medicinal Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Veterinary Medicine (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Molecular Biology (AREA)
- Communicable Diseases (AREA)
- Genetics & Genomics (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Epidemiology (AREA)
- Mycology (AREA)
- Gastroenterology & Hepatology (AREA)
- Biophysics (AREA)
- Hematology (AREA)
- AIDS & HIV (AREA)
- Oncology (AREA)
- General Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Engineering & Computer Science (AREA)
- Tropical Medicine & Parasitology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Peptides Or Proteins (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
Abstract
엔벨로프 단백질의 삼량체 형태를 안정화시키는 돌연변이를 갖는 인간 면역결핍 바이러스 (HIV) 엔벨로프 단백질이 제공된다. HIV 엔벨로프 단백질은 엔벨로프 단백질 서열에서의 특정된 위치에서 특정 아미노산 치환을 갖는다. 본원에 개시된 HIV 엔벨로프 단백질은 표시된 아미노산 치환들 중 하나 이상의 치환을 갖지 않는 HIV 엔벨로프 단백질과 비교하여 개선된 삼량체 형성 백분율 및/또는 개선된 삼량체 수득량을 갖는다. HIV 엔벨로프 단백질을 코딩하는 핵산 분자 및 벡터와, HIV 엔벨로프 단백질, 핵산 및 벡터를 함유하는 조성물이 또한 제공된다.
Description
인간 면역결핍 바이러스 (Human Immunodeficiency Virus, HIV)는 전 세계적으로 수백만 명의 사람에게서 발생하며, 광범위한 항레트로바이러스 치료 시대에서도 유효한 백신을 통한 HIV의 예방은 매우 높은 우선순위로 남아 있다. HIV 바이러스의 상이한 주 (strain)들 및 클레이드들 사이의 항원 다양성은 광범위한 효능을 갖는 백신의 개발을 어렵게 한다. HIV-1은 가장 일반적이고 병원성인 바이러스 주이며, 90%가 넘는 HIV/AIDS 사례가 HIV-1 그룹 M의 감염으로부터 유래된다. 그룹 M은 클레이드 또는 아형 (subtype)으로 추가 세분된다. 유효한 백신은 이상적으로는 강력한 세포 반응 및 상이한 클레이드로부터의 HIV-1 주를 중화할 수 있는 광범위 중화 항체 둘 다를 유도할 수 있을 것이다.
HIV 표면 상의 엔벨로프 단백질 스파이크 (엔벨로프 단백질 spike; Env)는 당단백질인 gp120 및 gp41의 이종이량체의 삼량체로 구성된다 (도 1a). 전구 단백질 gp160은 푸린에 의해 gp120 (이는 상기 스파이크의 헤드 (head)이며 CD4 수용체 결합 부위와, 큰 초가변 루프 (V1 내지 V5)를 포함함), 및 gp41 (이는 엔벨로프 단백질 스파이크의 막-고정된 스템 (stem)임)로 절단된다. 다른 클래스 I 융합성 단백질과 같이, gp41은 N-말단 융합 펩티드 (FP), C-말단 막관통 (TM) 도메인, 및 세포질 도메인을 함유한다. HIV와 표적 세포막 사이의 막 융합은 엔벨로프 단백질에서의 일련의 배좌 변화를 필요로 한다. HIV 백신은 엔벨로프 단백질을 기반으로 하여 개발될 수 있다.
그러나, HIV-1의 높은 유전적 변이성, 엔벨로프 단백질의 조밀한 탄수화물 코트, 및 엔벨로프 단백질 스파이크 구조의 상대적으로 동적이고 불안정한 성질을 포함하는 다양한 요인이 엔벨로프 단백질을 기반으로 하는 HIV 백신의 개발을 어렵게 만든다. 야생형 엔벨로프 단백질은 그의 기능으로 인하여 불안정하다. 따라서, 때때로 안정화 변형이 백신 후보 생성을 위하여 엔벨로프 구조 내에 도입된다. 엔벨로프 단백질은 중화 항체의 표적이며, 고도로 글리코실화되어 있는데, 이는 단백질 에피토프를 차폐함으로써 면역원성을 감소시킨다. 모든 공지된 광범위 중화 항체 (broadly neutralizing antibody; bNAb)는 이러한 글리칸을 수용하고 있다.
백신 개발에 있어서, bNAb를 유도할 수 있는 엔벨로프 단백질을 사용하는 것이 바람직하다. 그러나, 대부분의 bNAb는 단지 이것이 임의의 배좌 변화를 겪기 전의 천연 엔벨로프 단백질 배좌를 인식한다. 따라서, 비-천연이고 따라서 비-중화성인 에피토프의 제시를 최소화하면서 천연과 유사한 콤팩트한 폐쇄 배좌의 안정한 엔벨로프 단백질을 개발하는 것은 그러한 bNAb의 생성 효율을 개선시킬 수 있다. HIV 백신을 생성하려는 이전의 노력은 삼량체형 HIV 엔벨로프 단백질, gp140의 융합 전 엑토도메인을 함유하는 백신을 개발하는 것에 초점을 맞추었다. gp140은 막관통 (TM) 및 세포질 도메인을 갖지 않지만, gp120과는 달리 삼량체 구조를 형성할 수 있다. 게다가, 이러한 이전의 노력은 주로 클레이드 A에 초점을 맞추었다. 그러나, 유도된 중화 항체 반응의 폭은 여전히 한정되어 있다. 따라서, 다수의 HIV 클레이드에 대한 안정화 천연 엔벨로프 삼량체를 이용할 수 있다면 이것이 또한 유익할 것이다.
20년 넘게, 융합 전 삼량체 배좌의 안정한 엔벨로프 단백질을 개발하려는 시도가 이루어져 왔으며, 이때 광범위 중화 항체 반응을 유도할 수 있는 엔벨로프 단백질의 가용성의 안정한 삼량체의 생성은 단지 제한적으로 성공하였다. 예를 들어, 소위 SOSIP 돌연변이 (501C, 605C 및 559P)를 엔벨로프 단백질 서열 내로 도입하여 가용성 gp140 삼량체 분획의 형성을 개선시켰다 (문헌[Sanders et al., (2002), J. Virol.76(17): 8875-89]). 소위 SOSIP 돌연변이는 위치 501 및 605에서 시스테인 잔기, 및 위치 559에서 프롤린 잔기를 포함하며, 이는 본 분야에서 사용되는 통상적인 넘버링 스킴인, HIV-1 단리체 HXB2의 gp160에서의 넘버링에 따른 것이다. 3차원 단백질 구조에서 서로 가까이 있는 위치 501 및 605에서의 상기 두 시스테인 잔기의 도입은 디술피드 가교체를 생성한다. SOSIP 돌연변이 엔벨로프 단백질, 예컨대 BG505_SOSIP 및 B41_SOSIP (SOSIP 돌연변이를 갖는 HIV 주 BG505 및 B41 (즉 9032-08.A1.4685) 주 유래의 엔벨로프 단백질)가 백신 연구에서 사용되었으며, 이들은 tier 2 자가 중화 Ab를 유도하는 것으로 밝혀졌다 (문헌[Sanders et al., Science(2015), 349(6224):139-140]).
그러나, 비록 소위 SOSIP 돌연변이가 엔벨로프 단백질의 삼량체 형태를 안정화시킬 수 있다 하더라도, 그러한 SOSIP 돌연변이체의 삼량체 분율은 대개 10% 미만이며, 이때 많은 양의 단량체 및 응집체가 여전히 생성된다. 심지어 SOSIP 돌연변이 BG505_SOSIP (이는 삼량체 형태를 안정화하는 능력 면에서 지금까지 공지된 가장 유망한 SOSIP 돌연변이 엔벨로프 단백질 중 하나임)는 전형적으로 단지 25% 이하의 삼량체 형태를 생성한다 (문헌[Julien et al., Proc . Nat. Acad . Sci . (2015), 112(38), 11947-52]). 게다가, 이러한 삼량체 분획에서, 삼량체는 첨부에서 숨을 쉬기 때문에 완전히 안정한 것은 아니다. 따라서, SOSIP 돌연변이에 더하여, 몇몇 추가 치환, 예컨대 E64K, A316W, 및 201C-433C가 첨부를 안정화하고 첨부가 숨쉬는 것을 방지하기 위하여 설계되었다 (문헌[de Taeye et al., Cell(2015), 163(7), 1702-15]; 문헌[Kwon et al., (2015) Nat.Struct. Mol. Biol. 22(7) 522-31].
따라서, 삼량체 형성 백분율이 향상되고/되거나, 삼량체 수득량이 향상되고/되거나 삼량체 안정성이 향상된 HIV 엔벨로프 단백질의 안정화 삼량체가 필요하다. 바람직하게는, HIV 엔벨로프 단백질의 그러한 안정화 삼량체는 또한 양호한 광범위 중화 항체 (bNAb)와의 결합성, 및 비-광범위 중화 Ab (비-bNAb)에 대한 상대적으로 제한된 결합성을 나타낸다. 향상된 삼량체 백분율, 및 바람직하게는 또한 향상된 삼량체 수득량을 갖는 HIV Env 단백질을 제공하는 것이 본 발명의 목적이다.
본 발명은 이전에 개시된 HIV 엔벨로프 삼량체와 비교하여 삼량체 형성 백분율이 향상되고/되거나 삼량체 수득량이 향상된, 상이한 클레이드 유래의 재조합 HIV 엔벨로프 단백질에 관한 것이다. 본원에 개시된 돌연변이에 의해 Env 폴딩이 최적화되고, 주-특이적 특징부가 복구되고, 융합 과정에 중요한 융합 전 폐쇄 배좌의 영역이 안정화된다. 이것은 융합 전 폐쇄 HIV-1 엔벨로프 삼량체의 폴딩 및 안정성을 최적화하기 위한 보편적 접근법을 제공한다. 생성된 안정하고 잘 폴딩된 HIV Env 삼량체는, 예를 들어 재조합 HIV Env 삼량체의 투여시에 비-중화 항체 및 약한 중화성의 항체의 유도의 감소 및 광범위 중화 항체의 유도 기회의 개선을 위한 면역화 목적에 유용하다. 또한 본 발명은 본 재조합 HIV 엔벨로프 단백질을 코딩하는 단리된 핵산 분자 및 벡터, 이를 포함하는 세포, 및 재조합 HIV 엔벨로프 단백질, 핵산 분자, 벡터, 및/또는 세포의 조성물에 관한 것이다.
일반적인 일 양태에서, 본 발명은 삼량체의 형성을 안정화하는, 식별된 위치에서 특정한 아미노산 잔기를 갖는 재조합 인간 면역결핍 바이러스 (HIV) 엔벨로프 단백질에 관한 것이다.
특정 실시 형태에서, 본 발명의 재조합 HIV 엔벨로프 (Env) 단백질은 하기로 이루어진 군으로부터 선택되는 표시된 위치들 중 적어도 2개의 위치에서의 표시된 아미노산 잔기를 갖는 HIV Env 단백질의 아미노산 서열을 포함한다:
(i) 위치 651에서 Phe, Leu, Met, 또는 Trp;
(ii) 위치 655에서 Phe, Ile, Met, 또는 Trp;
(iii) 위치 535에서 Asn 또는 Gln;
(iv) 위치 589에서 Val, Ile 또는 Ala;
(v) 위치 573에서 Phe 또는 Trp;
(vi) 위치 204에서 Ile; 및
(vii) 위치 647에서 Phe, Met, 또는 Ile
(여기서, 위치의 넘버링은 HIV-1 단리체 HXB2의 gp160에서의 넘버링에 따름). 바람직한 특정 실시 형태에서, 위치 651에서의 표시된 아미노산 잔기는 Phe이고/이거나; 위치 655에서의 표시된 아미노산 잔기는 Ile이고/이거나; 위치 535에서의 표시된 아미노산 잔기는 Asn이고/이거나; 위치 573에서의 표시된 아미노산 잔기는 Phe이다.
특정 실시 형태에서, 본 발명의 재조합 HIV Env 단백질은 HIV Env 단백질의 아미노산 서열 및 하기로 이루어진 군으로부터 선택되는 표시된 위치들 중 적어도 하나에서의 표시된 아미노산 잔기에 의한 아미노산 치환을 포함한다:
(i) 위치 651에서 Phe, Leu, Met, 또는 Trp;
(ii) 위치 655에서 Phe, Ile, Met, 또는 Trp;
(iii) 위치 535에서 Asn 또는 Gln;
(iv) 위치 589에서 Val, Ile 또는 Ala;
(v) 위치 573에서 Phe 또는 Trp;
(vi) 위치 204에서 Ile; 및
(vii) 위치 647에서 Phe, Met, 또는 Ile
(여기서, HIV Env 단백질은
(1) HIV Env 콘센서스 아미노산 서열로서, 예를 들어 클레이드 C 유래의 것 (예를 들어 서열 번호 2 또는 3의 아미노산 서열을 포함함) 또는 클레이드 B 유래의 것 (예를 들어 서열 번호 4 또는 5의 아미노산 서열을 포함함);
(2) 합성 HIV Env 단백질, 예를 들어 (a): 서열 번호 6의 아미노산 서열, 또는 (b):위치 166에서의 Glu의 Arg으로의 돌연변이를 갖는 서열 번호 6의 아미노산 서열, 또는 (c): 위치 501 및 605에서의 아미노산의 Cys 잔기로의 돌연변이 및 위치 559에서의 아미노산의 Pro 잔기로의 돌연변이를 갖는 (a) 또는 (b), 또는 (d): 추가의 푸린 절단 부위 돌연변이, 예를 들어 위치 508~511에서의 아미노산의RRRRRR (서열 번호 10)에 의한 대체를 갖는 (a), (b) 또는 (c), 또는 (e) 서열 번호 7, 또는 (f) 모자이크 Env 서열, 예컨대 서열 번호 8 또는 9의 아미노산 서열을 포함하는 Env를 포함하는 것; 및
(3) 적어도 100개, 바람직하게는 적어도 1000개, 바람직하게는 적어도 10000개의 야생형 HIV Env 서열들의 컬렉션(collection)에서의 HIV Env 서열의 7.5% 미만, 바람직하게는 2% 미만의 빈도로 상응하는 위치에서 발견되는 아미노산 잔기에서의 적어도 하나의 복구 돌연변이를 포함하는 모 HIV Env 단백질 (이는 바람직하게는 야생형 HIV Env 단백질, 바람직하게는 클레이드 C의 야생형 HIV Env 단백질임) (여기서, 복구 돌연변이는 상기 컬렉션에서의 HIV Env 서열의 적어도 10%의 빈도로 상응하는 위치에서 발견되는 아미노산 잔기에 의한 치환이며, 바람직하게는 복구 돌연변이는 상기 컬렉션에서 가장 빈번하게 상응하는 위치에서 발견되는 아미노산 잔기에 의한 치환임)로 이루어진 군으로부터 선택되며;
위치의 넘버링은 HIV-1 단리체 HXB2의 gp160에서의 넘버링에 따름). 바람직한 특정 실시 형태에서, 위치 651에서의 표시된 아미노산 잔기는 Phe이고/이거나; 위치 655에서의 표시된 아미노산 잔기는 Ile이고/이거나; 위치 535에서의 표시된 아미노산 잔기는 Asn이고/이거나; 위치 573에서의 표시된 아미노산 잔기는 Phe이다.
특정 실시 형태에서, 본 발명의 재조합 HIV Env 단백질은 HIV Env 단백질의 아미노산 서열 및 하기로 이루어진 군으로부터 선택되는 표시된 위치들 중 적어도 하나에서의 표시된 아미노산 잔기에 의한 아미노산 치환을 포함한다:
(i) 위치 651에서 Phe, Leu, Met, 또는 Trp;
(ii) 위치 655에서 Phe, Ile, Met, 또는 Trp;
(iii) 위치 535에서 Asn 또는 Gln;
(iv) 위치 589에서 Val, Ile 또는 Ala;
(v) 위치 573에서 Phe 또는 Trp;
(vi) 위치 204에서 Ile; 및
(vii) 위치 647에서 Phe, Met, 또는 Ile
(여기서, HIV Env 단백질은
(a) 위치 501 및 605에서의 Cys;
(b) 위치 559에서의 Pro; 및
(c) 위치 501 및 605에서의 Cys 및 위치 559에서의 Pro로 이루어진 군으로부터 선택되는 표시된 위치에서의 표시된 아미노산 잔기(들)로 이어지는 적어도 하나의 돌연변이를 포함하는 SOSIP 돌연변이 HIV Env 단백질이며;
위치의 넘버링은 HIV-1 단리체 HXB2의 gp160에서의 넘버링에 따름). 바람직한 특정 실시 형태에서, 위치 651에서의 표시된 아미노산 잔기는 Phe이며; 위치 655에서의 표시된 아미노산 잔기는 Ile이며; 위치 535에서의 표시된 아미노산 잔기는 Asn이며; 위치 573에서의 표시된 아미노산 잔기는 Phe이다.
다른 실시 형태에서, 본 발명의 재조합 HIV Env 단백질은 하기로 이루어진 군으로부터 선택되는 표시된 위치들 중 적어도 하나에서의 표시된 아미노산 잔기를 추가로 포함한다:
(viii) 위치 588에서 Gln, Glu, Ile, Met, Val, Trp 또는 Phe, 바람직하게는 Gln 또는 Glu;
(ix) 위치 64에서 Lys, 또는 위치 66에서 Arg, 또는 위치 64에서 Lys 및 위치 66에서 Arg;
(x) 위치 316에서 Trp;
(xi) 위치 201 및 433 둘 다에서 Cys;
(xii) 위치 556에서 Pro, 또는 위치 558에서 Pro, 또는 위치 556 및 558에서 Pro;
(xiii) 7~10개의 아미노산을 갖는 루프, 바람직하게는 8개 아미노산의 루프, 예를 들어 (서열 번호 12~17) 중 어느 하나로부터 선택되는 서열을 갖는 루프에 의한 아미노산 위치 548~568에서의 루프 (HR1-루프)의 대체;
(xiv) 위치 568에서 Gly, 또는 위치 569에서 Gly, 또는 위치 636에서 Gly, 또는 위치 568 및 636 둘 다에서 Gly, 또는 위치 569 및 636 둘 다에서 Gly; 및/또는
(xv) 위치 302에서 Tyr, 또는 위치 519에서 Arg, 또는 위치 520에서 Arg, 또는 위치 302에서 Tyr 및 위치 519에서 Arg, 또는 위치 302에서 Tyr 및 위치 520에서 Arg, 또는 위치 302에서 Tyr 및 위치 519 및 520 둘 다에서 Arg.
특정 실시 형태에서, 본 발명의 재조합 HIV Env 단백질은 HIV Env 단백질의 푸린 절단 서열에서의 돌연변이, 예컨대 RRRRRR (서열 번호 10)에 의한 위치 508~511에서의 대체를 추가로 포함한다.
일 실시 형태에서, 재조합 HIV Env 단백질은 gp140 단백질이다.
또 다른 실시 형태에서, 재조합 HIV Env 단백질은 gp160 단백질이다.
특정 실시 형태에서, 재조합 HIV Env 단백질은 세포질 영역 내에서, 예를 들어 세포질 영역의 7개 아미노산 뒤에서 절두된다.
또 다른 일반 양태에서, 본 발명은 본원에 개시된 3가지의 임의의 재조합 HIV Env 단백질의 비공유적 올리고머를 포함하는 삼량체성 복합체에 관한 것이다.
모 HIV Env 단백질의 폴딩 및 안정성 (증가된 삼량체 백분율 및/또는 삼량체 수득량으로서 측정됨)을 개선시키는 방법을 제공하는 것이 본 발명의 또 다른 일반 양태이며, 본 방법은 모 HIV Env 단백질 내에 적어도 하나의 복구 돌연변이, 바람직하게는 적어도 3개의 복구 돌연변이를 도입함으로써 모 HIV Env 단백질의 아미노산 서열을 복구하는 단계를 포함하고, 여기서, 복구 돌연변이는 적어도 100개, 바람직하게는 적어도 500개, 바람직하게는 적어도 1000개, 바람직하게는 적어도 10000개의 야생형 HIV Env 서열들의 컬렉션에서 HIV Env 서열의 7.5% 미만, 바람직하게는 2% 미만의 빈도로 상응하는 위치에 존재하는 아미노산 잔기에서의 아미노산 치환이며, 상기 치환은 상기 컬렉션에서 HIV Env 서열의 적어도 10%의 빈도로 상응하는 위치에 존재하는 아미노산 잔기에 의한 것이고, 바람직하게는 상기 치환은 상기 컬렉션에서 가장 빈번하게 상응하는 위치에 존재하는 아미노산 잔기에 의한 것이다. 또한 본 발명은 HIV Env 단백질의 폴딩 및 안정성 (삼량체 백분율 및/또는 삼량체 수득량으로서 측정됨)을 개선시키기 위한 본 발명의 상기 방법에 의해 수득가능한 복구 HIV Env 단백질을 제공한다. 또한 본 발명은 상기 복구 HIV Env 단백질을 포함하는 제약 조성물을 제공한다. 또한 본 발명은 HIV Env 단백질의 생성 방법을 제공하며, 이는 본원에 개시된 HIV Env 단백질을 복구하고, 복구 안정화 HIV Env 단백질을 코딩하는 핵산을 재조합 숙주 세포에서 발현시키는 방법을 포함한다.
또 다른 일반 양태에서, 본 발명은 서열 번호 2의 아미노산 서열과 적어도 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 아미노산 서열을 포함하는 재조합 HIV Env 단백질에 관한 것이며, 여기서, 바람직하게는 위치 204, 535, 573, 589, 647, 651, 및 655, 및 바람직하게는 추가 위치 64, 66, 201, 316, 433, 501, 508~511, 556, 558, 559, 588, 548~568 및 605는 동일성%를 결정할 때 고려되지 않고, 넘버링은 HIV-1 단리체 HXB2의 gp160에서의 넘버링에 따른다. 이의 특정 실시 형태에서, 재조합 HIV Env 단백질은 서열 번호 3의 아미노산 서열과 적어도 98%, 99% 또는 100% 동일한 아미노산 서열을 포함하며, 여기서, 바람직하게는 위치 204, 535, 573, 589, 647, 651, 및 655, 및 바람직하게는 추가 위치 64, 66, 201, 316, 433, 508~511, 556, 558, 588, 및 548~568은 동일성%를 결정할 때 고려되지 않고, 넘버링은 HIV-1 단리체 HXB2의 gp160에서의 넘버링에 따른다.
또 다른 일반 양태에서, 본 발명은 서열 번호 4의 아미노산 서열과 적어도 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 아미노산 서열을 포함하는 재조합 HIV Env 단백질에 관한 것이며, 여기서, 바람직하게는 위치 204, 535, 573, 589, 647, 651, 및 655, 및 바람직하게는 추가 위치 64, 66, 201, 316, 433, 501, 508~511, 556, 558, 559, 588, 548~568 및 605는 동일성%를 결정할 때 고려되지 않고, 넘버링은 HIV-1 단리체 HXB2의 gp160에서의 넘버링에 따른다. 이의 특정 실시 형태에서, 재조합 HIV Env 단백질은 서열 번호 5의 아미노산 서열과 적어도 98%, 99% 또는 100% 동일한 아미노산 서열을 포함하며, 여기서, 바람직하게는 위치 204, 535, 573, 589, 647, 651, 및 655, 및 바람직하게는 추가 위치 64, 66, 201, 316, 433, 508~511, 556, 558, 588, 및 548~568은 동일성%를 결정할 때 고려되지 않고, 넘버링은 HIV-1 단리체 HXB2의 gp160에서의 넘버링에 따른다.
이러한 양태 및 실시 형태에서, 동일성%의 결정에 있어서 고려되지 않는 표시된 위치에서의 아미노산들 중 하나 이상은 바람직하게는 본원에서 바람직한 것으로 표시된 아미노산, 예를 들어 위치 204에서의 Ile; 위치 651에서의 Phe, Ala, Leu, 또는 Trp 등으로부터 선택된다 (하기 표 1 및 표 2 참조).
또 다른 일반 양태에서, 본 발명은 서열 번호 2, 3, 4, 5, 20, 22, 24, 26, 27, 28, 29, 30, 31, 또는 32 중 어느 하나의 아미노산 서열과 적어도 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 아미노산 서열을 포함하는 재조합 HIV Env 단백질에 관한 것이며, 여기서, 서열 번호 20, 22, 24, 26, 27, 28, 29, 30, 31, 또는 32가 특히 바람직하다. 이 양태에서, 바람직하게는 위치 204, 535, 573, 589, 647, 651, 655, 및 658 및 바람직하게는 추가 위치 64, 66, 201, 316, 433, 508~511, 556, 558, 588, 및 548~568은 동일성%를 결정할 때 고려되지 않고, 넘버링은 HIV-1 단리체 HXB2의 gp160에서의 넘버링에 따른다. 또한 이 양태에서, 동일성% 결정에 고려되지 않는 표시된 위치에서의 아미노산들 중 하나 이상은 바람직하게는 표 1의 (i)~(vii), 표 2의 (viii)~(xv), 및/또는 표 1의 (xvi)에서 본원에서 바람직한 것으로 표시된 아미노산, 예를 들어 위치 204에서의 Ile; 위치 651에서의 Phe, Leu, Met, 또는 Trp 등으로부터 선택된다.
또 다른 일반 양태에서, 본 발명은 표면 상에 본 발명의 재조합 HIV Env 단백질을 디스플레이하는 입자, 바람직하게는 리포좀 또는 나노입자, 예를 들어 자가-조립 나노입자에 관한 것이다.
또 다른 일반 양태에서, 본 발명은 본 발명의 재조합 HIV Env 단백질을 코딩하는 단리된 핵산 분자 및 프로모터에 작동가능하게 연결된 단리된 핵산 분자를 포함하는 벡터에 관한 것이다. 일 실시 형태에서, 벡터는 바이러스 벡터이다. 또 다른 실시 형태에서, 벡터는 발현 벡터이다. 바람직한 일 실시 형태에서, 바이러스 벡터는 아데노바이러스 벡터이다.
또 다른 일반 양태는 본 발명의 재조합 HIV Env 단백질을 코딩하는 단리된 핵산 분자 또는 벡터를 포함하는 숙주 세포에 관한 것이다. 그러한 숙주 세포는 재조합 단백질 생성, 재조합 단백질 발현, 또는 바이러스 입자 생성에 사용될 수 있다.
또 다른 일반 양태는 재조합 HIV Env 단백질의 생성 방법에 관한 것이며, 이는 본 발명의 재조합 HIV Env 단백질을 코딩하는 단리된 핵산 분자 또는 벡터를 포함하는 숙주 세포를 재조합 HIV Env 단백질의 생성에 적합한 조건 하에 성장시키는 단계를 포함한다.
또 다른 일반 양태는 재조합 HIV Env 단백질, 삼량체성 복합체, 단리된 핵산 분자, 벡터, 또는 숙주 세포 (본원에 개시된 바와 같음), 및 제약상 허용가능한 담체를 포함하는 조성물에 관한 것이다.
전술한 요약뿐 아니라, 다음의 발명의 상세한 설명은 첨부된 도면과 함께 읽을 때 더 잘 이해될 것이다. 본 발명은 도면에 나타낸 정확한 실시 형태에 한정되지 않음이 이해되어야 한다.
도면에서,
도 1a 및 도 1b는 HIV 엔벨로프 (Env) 단백질의 구조의 개략도를 나타내며;
도 1a는 전장 HIV Env 단백질을 나타내며;
도 1b는 소위 SOSIP 돌연변이 및 잔기 664 (HIV-1 단리체 HXB2의 gp160에서의 넘버링에 따름 (SOSIP.644 서열))에서 시작되는 C-말단 절두를 포함하는 가용성 HIV Env 단백질을 나타내며;
도 2a 및 도 2b는 실시예 3에서 설명된 바와 같이 AlphaLISA 분석법에 의해 측정할 경우 본 발명의 실시 형태에 따른 재조합 HIV Env 단백질에 있어서의 삼량체 형성 백분율 (도 2a) 및 삼량체 수득량 (도 2b)을 나타내며; 테스트한 재조합 HIV Env 단백질은 백본 HIV Env 콘센서스 클레이드 C 서열 ConC_SOSIP (서열 번호 3) 내에 도입된 단일, 이중 또는 삼중 아미노산 치환을 포함하였으며; 삼량체 백분율 및 삼량체 수득량은 삼량체 특이적 단클론 항체 (mAb) PGT145가 각각의 재조합 HIV Env 단백질에 결합하는 것을 기반으로 하여 결정되었으며; 각각의 본 발명의 재조합 HIV Env 단백질에 있어서의 삼량체 수득량 및 삼량체 백분율은 본원에 개시된 임의의 추가 삼량체 안정화 돌연변이를 포함하지 않는 백본 ConC_SOSIP 서열을 갖는 엔벨로프 단백질의 것과 비교되며;
도 3은 본 발명의 실시 형태에 따른 재조합 HIV Env 단백질의 다중각 광산란을 이용한 크기 배제 크로마토그래피 (SEC-MALS)로부터의 크로마토그램을 나타내며; 테스트한 재조합 HIV Env 단백질은 백본 HIV Env 콘센서스 클레이드 C 서열 ConC_SOSIP (서열 번호 3) 내로 도입된 단일 아미노산 치환을 포함하고, 실시예 2에서 설명된 바와 같이 렉틴 친화성 크로마토그래피로 정제되었으며; SEC-MALS 분석은 실시예 3에서 설명된 바와 같이 수행되었고; 삼량체 형태에 상응하는 피크는 각각의 크로마토그램에 표시되어 있으며;
도 4는 열처리 후 잔존하는 삼량체의 백분율로 보고된 본 발명의 실시 형태에 따른 재조합 HIV Env 단백질의 열안정성을 나타내며; 테스트한 재조합 HIV Env 단백질은 백본 HIV Env 콘센서스 클레이드 C 서열 ConC_SOSIP (서열 번호 3) 내로 도입된 단일, 이중 또는 삼중 아미노산 치환을 포함하였으며; 재조합 HIV Env 단백질은 열처리되었고, 열처리 후 잔존하는 삼량체의 백분율은 AlphaLISA 분석법에 의해 결정되었으며 (실시예 4에서 설명된 바와 같음); 임의의 추가의 삼량체 안정화 돌연변이를 포함하지 않는 백본 ConC_SOSIP 서열을 갖는 엔벨로프 단백질의 열안정성이 또한 예시되어 있으며;
도 5a~도 5b는 본 발명의 실시 형태에 따른 백본 HIV Env 콘센서스 클레이드 B 서열 ConB_SOSIP (서열 번호 5) 내로 도입된 단일 아미노산 치환을 갖는 재조합 HIV Env 단백질에 있어서의 삼량체 형성 백분율 (도 5a) 및 삼량체 수득량 (도 5b)을 본 발명의 임의의 추가의 삼량체 안정화 돌연변이를 포함하지 않는 백본 ConB_SOSIP 서열을 갖는 엔벨로프 단백질의 것과 비교하여 나타내며 (이는 실시예 5에서 설명된 바와 같음); 삼량체 수득량 및 삼량체 형성 백분율은 AlphaLISA 분석법에 의해 측정되었고;
도 6a~도 6b는 실시예 6에서 설명된 바와 같이 본 발명의 실시 형태에 따른 백본 합성 HIV 엔벨로프 단백질 서열 DS_sC4_SOSIP_E166R 내로 도입된 아미노산 치환을 갖는 재조합 HIV Env 단백질에 있어서의 삼량체 형성 백분율 및 삼량체 수득량을 나타내며; 삼량체 형성 백분율 및 삼량체 수득량은 AlphaLISA 분석법으로 측정되었다.
도 7은 본 발명의 실시 형태에 따른 재조합 HIV Env 단백질의 다중각 광산란을 이용한 크기 배제 크로마토그래피 (SEC-MALS)로부터의 크로마토그램을 나타내며; 테스트한 재조합 HIV Env 단백질은 각각의 다음 변이체 내에서의 단일 K655I 돌연변이 및 백본 HIV Env 콘센서스 클레이드 C 서열 ConC_SOSIP (서열 번호 3) 내로 도입된 추가 돌연변이를 포함하고, 실시예 2에서 설명된 바와 같이 렉틴 친화성 크로마토그래피로 정제되었으며; SEC-MALS 분석은 실시예 3에서 설명된 바와 같이 수행되었고; ConC_SOSIP에서의 gp140 단량체를 나타내는 피크는 삼량체 피크의 우측에 음영 처리된 박스로 표시되어 있다. 하부 패널은 각각의 추가 돌연변이가 gp140 단량체 피크의 높이의 추가 감소를 야기함을 관찰할 수 있도록 그래프의 하부에의 줌인을 나타낸다.
도 8a~도 8b는 본 발명의 실시 형태에 따른 도입된 치환들의 조합 및 단일 아미노산 치환을 갖는 BG505_SOSIP (야생형 클레이드 A 주로부터 유래됨)에 있어서의 삼량체 형성 백분율 (도 8a) 및 삼량체 수득량 (도 8b)을 실시예 9에서 설명된 바와 같이 본 발명의 임의의 추가의 삼량체 안정화 돌연변이를 포함하지 않는 백본 BG505_SOSIP 서열을 갖는 엔벨로프 단백질의 것과 비교한 것을 나타낸다. 삼량체 수득량 및 삼량체 형성 백분율은 AlphaLISA 분석법으로 측정되었다.
도 9는 본 발명의 실시 형태에 따른 재조합 HIV Env 단백질의, 다중각 광 산란을 이용한 크기 배제 크로마토그래피 (SEC-MALS) 분석으로부터의 크로마토그램을 나타내며; SEC-MALS 분석은 Env 형질감염 세포의 배양 상청액에서 수행되었다. 삼량체 형태에 상응하는 피크는 7분과 7.5분 사이에 용출된다. 짙은 회색 선은 BG505_SOSIP (야생형 클레이드 A 주로부터 유래됨)이며, 연한 회색 선은 L556P, K655I, M535N, N651F, D589V, K588E 치환을 포함하는 BG505_SOSIP이다.
도 10a~도 10b는 실시예 10에서 설명된 C97ZA_SOSIP 변이체에 있어서의 삼량체 수득량을 나타낸다. 3개의 안정화 치환 (L556P, T651F 및 M535N)을 포함하는 C97ZA의 삼량체 수득량 (도 10a 및 도 10b). 도 10b에서, Env 서열은 도 12에 설명된 개념적 프레임워크에 따른 C97ZA Env 서열의 복구를 위하여 부가된 추가 돌연변이에 의해, 그리고 추가 안정화 치환 (K655I, D589V, A204I 및 K588E)의 도입에 의해 추가로 최적화되었다. 삼량체 수득량 및 삼량체 형성 백분율은 AlphaLISA 분석법으로 측정되었다. 신호는 1로 설정된 ConC_SOSIP 신호에 대하여 정규화되었다. PNGS는 잠재적인 N-글리코실화 부위이다.
도 11. 4개의 안정화 치환을 포함하는 HIV-1 Env 주 Du422의 삼량체 수득량 (상세 사항에 대해서는 실시예 11 참조). 모든 수는 1로 설정된 ConC_SOSIP (예시되지 않음)에 대하여 정규화되었다.
도 12. HIV-1 Env 서열의 복구에 대한 보편적 개념이 주 C97ZA에 대하여 예시되었다. 전체 HIV-1 데이터베이스 (상부 막대) 및 주 C97ZA 잔기 (하부 막대)에서 최고 출현 빈도를 갖는 잔기 (본원에서 ‘콘센서스 잔기’로 칭해짐)는 C97ZA 잔기 위치의 낮은 출현 백분율로부터 높은 출현 백분율로 분류되었다. 콘센서스 잔기로 치환될 C97ZA 서열 위치는 하기 기준을 기반으로 하여 선택되었다: Env 데이터베이스 서열에서 2% 미만으로 출현하는 C97ZA 잔기에서의 위치 (흑색 막대). Env 데이터베이스 서열에서 2% 내지 7.5%로 출현하고 묻혀 있거나 부분적으로 묻혀 있는 C97ZA 잔기에서의 위치 (짙은 회색 막대). 친수성 콘센서스 잔기 및 C97ZA에서 소수성이고 노출되어 있는 위치 (2개의 가장 연한 회색 막대) 및 잠재적인 N-글리코실화 부위 (PNGS) 콘센서스 잔기 (S234N)인 위치.
도 13. 서열 복구 및 돌연변이 안정화를 통한 융합전 폐쇄 HIV ENV_SOSIP 삼량체. 광범위 중화 항체에 있어서의 ConC_SOSIP에 대하여 정규화된 모든 SOSIP 변이체에 있어서의 세포 배양 상청액에서의 AlphaLISA 신호.
도 14. 대조 Env_SOSIP 변이체 (백본 SOSIP), 실시예 12 및 도 12에 설명된 개념에 다른 복구된 Env 변이체, 및 추가의 안정화 치환을 갖는 Env 변이체 (표 3에 다름, 형질감염 후 세포 배양 상청액을 사용)의 분석용 SEC 프로파일. 세포 배양 상청액의 모크(mock) 신호는 모든 프로파일로부터 차감되었다. 삼량체 피크는 *로 표시된다.
도 15. 안정화 SOSIP 변형을 포함하지 않는 HIV-1 Env ConC 변이체의 삼량체 수득량.
도 16. 위치 589, 647, 651 및 655에서 메티오닌으로의 돌연변이를 갖는 ConC_SOSIP의 삼량체 수득량 (도 16a) 및 삼량체 백분율 (16b). 모든 수는 1로 설정된 ConC_SOSIP (예시되지 않음)에 대하여 정규화되었다. 에러 바는 막대들의 우측 말단에 나타낸다.
도 17a~17d는 AlphaLISA 분석법으로 측정된, 실시예 15에서 설명된 바와 같이 표시된 돌연변이를 갖는 재조합 HIV Env 단백질에 있어서의 삼량체 형성 백분율 (도 17a, 17b; 상이한 실험들에 대하여) 및 삼량체 수득량 (도 17c, 17d; 상이한 실험들에 대하여)을 나타낸다.
도 18은 실시예 15에서 설명된 바와 같이, 표시된 돌연변이를 갖는 재조합 HIV Env 단백질의 SEC-MALS 크로마토그램을 나타낸다.
도면에서,
도 1a 및 도 1b는 HIV 엔벨로프 (Env) 단백질의 구조의 개략도를 나타내며;
도 1a는 전장 HIV Env 단백질을 나타내며;
도 1b는 소위 SOSIP 돌연변이 및 잔기 664 (HIV-1 단리체 HXB2의 gp160에서의 넘버링에 따름 (SOSIP.644 서열))에서 시작되는 C-말단 절두를 포함하는 가용성 HIV Env 단백질을 나타내며;
도 2a 및 도 2b는 실시예 3에서 설명된 바와 같이 AlphaLISA 분석법에 의해 측정할 경우 본 발명의 실시 형태에 따른 재조합 HIV Env 단백질에 있어서의 삼량체 형성 백분율 (도 2a) 및 삼량체 수득량 (도 2b)을 나타내며; 테스트한 재조합 HIV Env 단백질은 백본 HIV Env 콘센서스 클레이드 C 서열 ConC_SOSIP (서열 번호 3) 내에 도입된 단일, 이중 또는 삼중 아미노산 치환을 포함하였으며; 삼량체 백분율 및 삼량체 수득량은 삼량체 특이적 단클론 항체 (mAb) PGT145가 각각의 재조합 HIV Env 단백질에 결합하는 것을 기반으로 하여 결정되었으며; 각각의 본 발명의 재조합 HIV Env 단백질에 있어서의 삼량체 수득량 및 삼량체 백분율은 본원에 개시된 임의의 추가 삼량체 안정화 돌연변이를 포함하지 않는 백본 ConC_SOSIP 서열을 갖는 엔벨로프 단백질의 것과 비교되며;
도 3은 본 발명의 실시 형태에 따른 재조합 HIV Env 단백질의 다중각 광산란을 이용한 크기 배제 크로마토그래피 (SEC-MALS)로부터의 크로마토그램을 나타내며; 테스트한 재조합 HIV Env 단백질은 백본 HIV Env 콘센서스 클레이드 C 서열 ConC_SOSIP (서열 번호 3) 내로 도입된 단일 아미노산 치환을 포함하고, 실시예 2에서 설명된 바와 같이 렉틴 친화성 크로마토그래피로 정제되었으며; SEC-MALS 분석은 실시예 3에서 설명된 바와 같이 수행되었고; 삼량체 형태에 상응하는 피크는 각각의 크로마토그램에 표시되어 있으며;
도 4는 열처리 후 잔존하는 삼량체의 백분율로 보고된 본 발명의 실시 형태에 따른 재조합 HIV Env 단백질의 열안정성을 나타내며; 테스트한 재조합 HIV Env 단백질은 백본 HIV Env 콘센서스 클레이드 C 서열 ConC_SOSIP (서열 번호 3) 내로 도입된 단일, 이중 또는 삼중 아미노산 치환을 포함하였으며; 재조합 HIV Env 단백질은 열처리되었고, 열처리 후 잔존하는 삼량체의 백분율은 AlphaLISA 분석법에 의해 결정되었으며 (실시예 4에서 설명된 바와 같음); 임의의 추가의 삼량체 안정화 돌연변이를 포함하지 않는 백본 ConC_SOSIP 서열을 갖는 엔벨로프 단백질의 열안정성이 또한 예시되어 있으며;
도 5a~도 5b는 본 발명의 실시 형태에 따른 백본 HIV Env 콘센서스 클레이드 B 서열 ConB_SOSIP (서열 번호 5) 내로 도입된 단일 아미노산 치환을 갖는 재조합 HIV Env 단백질에 있어서의 삼량체 형성 백분율 (도 5a) 및 삼량체 수득량 (도 5b)을 본 발명의 임의의 추가의 삼량체 안정화 돌연변이를 포함하지 않는 백본 ConB_SOSIP 서열을 갖는 엔벨로프 단백질의 것과 비교하여 나타내며 (이는 실시예 5에서 설명된 바와 같음); 삼량체 수득량 및 삼량체 형성 백분율은 AlphaLISA 분석법에 의해 측정되었고;
도 6a~도 6b는 실시예 6에서 설명된 바와 같이 본 발명의 실시 형태에 따른 백본 합성 HIV 엔벨로프 단백질 서열 DS_sC4_SOSIP_E166R 내로 도입된 아미노산 치환을 갖는 재조합 HIV Env 단백질에 있어서의 삼량체 형성 백분율 및 삼량체 수득량을 나타내며; 삼량체 형성 백분율 및 삼량체 수득량은 AlphaLISA 분석법으로 측정되었다.
도 7은 본 발명의 실시 형태에 따른 재조합 HIV Env 단백질의 다중각 광산란을 이용한 크기 배제 크로마토그래피 (SEC-MALS)로부터의 크로마토그램을 나타내며; 테스트한 재조합 HIV Env 단백질은 각각의 다음 변이체 내에서의 단일 K655I 돌연변이 및 백본 HIV Env 콘센서스 클레이드 C 서열 ConC_SOSIP (서열 번호 3) 내로 도입된 추가 돌연변이를 포함하고, 실시예 2에서 설명된 바와 같이 렉틴 친화성 크로마토그래피로 정제되었으며; SEC-MALS 분석은 실시예 3에서 설명된 바와 같이 수행되었고; ConC_SOSIP에서의 gp140 단량체를 나타내는 피크는 삼량체 피크의 우측에 음영 처리된 박스로 표시되어 있다. 하부 패널은 각각의 추가 돌연변이가 gp140 단량체 피크의 높이의 추가 감소를 야기함을 관찰할 수 있도록 그래프의 하부에의 줌인을 나타낸다.
도 8a~도 8b는 본 발명의 실시 형태에 따른 도입된 치환들의 조합 및 단일 아미노산 치환을 갖는 BG505_SOSIP (야생형 클레이드 A 주로부터 유래됨)에 있어서의 삼량체 형성 백분율 (도 8a) 및 삼량체 수득량 (도 8b)을 실시예 9에서 설명된 바와 같이 본 발명의 임의의 추가의 삼량체 안정화 돌연변이를 포함하지 않는 백본 BG505_SOSIP 서열을 갖는 엔벨로프 단백질의 것과 비교한 것을 나타낸다. 삼량체 수득량 및 삼량체 형성 백분율은 AlphaLISA 분석법으로 측정되었다.
도 9는 본 발명의 실시 형태에 따른 재조합 HIV Env 단백질의, 다중각 광 산란을 이용한 크기 배제 크로마토그래피 (SEC-MALS) 분석으로부터의 크로마토그램을 나타내며; SEC-MALS 분석은 Env 형질감염 세포의 배양 상청액에서 수행되었다. 삼량체 형태에 상응하는 피크는 7분과 7.5분 사이에 용출된다. 짙은 회색 선은 BG505_SOSIP (야생형 클레이드 A 주로부터 유래됨)이며, 연한 회색 선은 L556P, K655I, M535N, N651F, D589V, K588E 치환을 포함하는 BG505_SOSIP이다.
도 10a~도 10b는 실시예 10에서 설명된 C97ZA_SOSIP 변이체에 있어서의 삼량체 수득량을 나타낸다. 3개의 안정화 치환 (L556P, T651F 및 M535N)을 포함하는 C97ZA의 삼량체 수득량 (도 10a 및 도 10b). 도 10b에서, Env 서열은 도 12에 설명된 개념적 프레임워크에 따른 C97ZA Env 서열의 복구를 위하여 부가된 추가 돌연변이에 의해, 그리고 추가 안정화 치환 (K655I, D589V, A204I 및 K588E)의 도입에 의해 추가로 최적화되었다. 삼량체 수득량 및 삼량체 형성 백분율은 AlphaLISA 분석법으로 측정되었다. 신호는 1로 설정된 ConC_SOSIP 신호에 대하여 정규화되었다. PNGS는 잠재적인 N-글리코실화 부위이다.
도 11. 4개의 안정화 치환을 포함하는 HIV-1 Env 주 Du422의 삼량체 수득량 (상세 사항에 대해서는 실시예 11 참조). 모든 수는 1로 설정된 ConC_SOSIP (예시되지 않음)에 대하여 정규화되었다.
도 12. HIV-1 Env 서열의 복구에 대한 보편적 개념이 주 C97ZA에 대하여 예시되었다. 전체 HIV-1 데이터베이스 (상부 막대) 및 주 C97ZA 잔기 (하부 막대)에서 최고 출현 빈도를 갖는 잔기 (본원에서 ‘콘센서스 잔기’로 칭해짐)는 C97ZA 잔기 위치의 낮은 출현 백분율로부터 높은 출현 백분율로 분류되었다. 콘센서스 잔기로 치환될 C97ZA 서열 위치는 하기 기준을 기반으로 하여 선택되었다: Env 데이터베이스 서열에서 2% 미만으로 출현하는 C97ZA 잔기에서의 위치 (흑색 막대). Env 데이터베이스 서열에서 2% 내지 7.5%로 출현하고 묻혀 있거나 부분적으로 묻혀 있는 C97ZA 잔기에서의 위치 (짙은 회색 막대). 친수성 콘센서스 잔기 및 C97ZA에서 소수성이고 노출되어 있는 위치 (2개의 가장 연한 회색 막대) 및 잠재적인 N-글리코실화 부위 (PNGS) 콘센서스 잔기 (S234N)인 위치.
도 13. 서열 복구 및 돌연변이 안정화를 통한 융합전 폐쇄 HIV ENV_SOSIP 삼량체. 광범위 중화 항체에 있어서의 ConC_SOSIP에 대하여 정규화된 모든 SOSIP 변이체에 있어서의 세포 배양 상청액에서의 AlphaLISA 신호.
도 14. 대조 Env_SOSIP 변이체 (백본 SOSIP), 실시예 12 및 도 12에 설명된 개념에 다른 복구된 Env 변이체, 및 추가의 안정화 치환을 갖는 Env 변이체 (표 3에 다름, 형질감염 후 세포 배양 상청액을 사용)의 분석용 SEC 프로파일. 세포 배양 상청액의 모크(mock) 신호는 모든 프로파일로부터 차감되었다. 삼량체 피크는 *로 표시된다.
도 15. 안정화 SOSIP 변형을 포함하지 않는 HIV-1 Env ConC 변이체의 삼량체 수득량.
도 16. 위치 589, 647, 651 및 655에서 메티오닌으로의 돌연변이를 갖는 ConC_SOSIP의 삼량체 수득량 (도 16a) 및 삼량체 백분율 (16b). 모든 수는 1로 설정된 ConC_SOSIP (예시되지 않음)에 대하여 정규화되었다. 에러 바는 막대들의 우측 말단에 나타낸다.
도 17a~17d는 AlphaLISA 분석법으로 측정된, 실시예 15에서 설명된 바와 같이 표시된 돌연변이를 갖는 재조합 HIV Env 단백질에 있어서의 삼량체 형성 백분율 (도 17a, 17b; 상이한 실험들에 대하여) 및 삼량체 수득량 (도 17c, 17d; 상이한 실험들에 대하여)을 나타낸다.
도 18은 실시예 15에서 설명된 바와 같이, 표시된 돌연변이를 갖는 재조합 HIV Env 단백질의 SEC-MALS 크로마토그램을 나타낸다.
다양한 간행물, 논문 및 특허가 [배경기술] 및 명세서 전체에 걸쳐 인용되거나 기술되며; 각각의 이러한 참고문헌은 그 전체가 본원에 참고로 포함된다. 본 명세서에 포함된 문헌, 행동, 물질, 장치, 물품 등의 논의는 본 발명의 맥락을 제공하는 목적을 위한 것이다. 이러한 논의는 임의의 또는 전부의 이들 대상이 개시되거나 청구되는 임의의 발명에 대해 선행 기술의 일부를 형성한다고 인정하는 것이 아니다.
달리 정의되지 않는 한, 본원에서 사용되는 모든 기술 및 과학 용어는 본 발명과 관련된 분야의 당업자에게 통상적으로 이해되는 것과 동일한 의미를 갖는다. 다르게는, 본원에서 사용되는 특정 용어는 명세서에 제시되는 의미를 갖는다. 본원에서 인용되는 모든 특허, 공개된 특허 출원 및 공보는 마치 본원에 전체가 제시된 것처럼 참고로 포함된다. 본원에서 그리고 첨부된 청구범위에서 사용되는 단수형 "a", "an", 및 "the"는 문맥상 명확히 달리 기재되지 않는 한 복수의 언급 대상을 포함한다는 것이 주목되어야 한다.
달리 기재되지 않는 한, 본원에 기술되는 농도 또는 농도 범위와 같은 임의의 수치는 모든 경우에 "약"이라는 용어로 수식되는 것으로 이해될 것이다. 따라서, 수치는 전형적으로 열거된 값의 ±10%를 포함한다. 본원에서 사용되는 바와 같이, 수치 범위의 사용은 문맥상 명백히 달리 지시되지 않는 한, 이러한 범위 내의 정수 및 소수값을 포함하는, 그 범위 내의 모든 가능한 하위범위, 모든 개별 수치를 명확히 포함한다.
아미노산이 본 개시 내용 전체에 걸쳐 언급된다. 20가지의 천연 발생 아미노산과, 많은 천연 비-발생 아미노산이 있다. 천연 및 비-천연 아미노산 둘 다를 포함하는 각각의 공지된 아미노산은 전체 이름, 축약형 1문자 코드, 및 축약형 3문자 코드를 가지며, 이들 전부는 당업자에게 잘 알려져 있다. 예를 들어, 20가지의 천연 발생 아미노산에 사용되는 축약형 3문자 및 1문자 코드는 하기와 같다: 알라닌 (Ala; A), 아르기닌 (Arg; R), 아스파르트산 (Asp; D), 아스파라긴 (Asn; N), 시스테인 (Cys; C), 글리신 (Gly; G), 글루탐산 (Glu; E), 글루타민 (Gln; Q), 히스티딘 (His; H), 이소류신 (Ile; I), 류신 (Leu; L), 라이신 (Lys; K), 메티오닌 (Met; M), 페닐알라닌 (Phe; F), 프롤린 (Pro; P), 세린 (Ser; S), 트레오닌 (Thr; T), 트립토판 (Trp; W), 타이로신 (Tyr; Y) 및 발린 (Val; V). 아미노산은 그의 전체 이름, 축약형 1문자 코드, 또는 축약형 3문자 코드로 지칭될 수 있다.
문맥상 명확히 달리 기재되지 않는 한, 본원에서 사용되는 바와 같이, HIV 엔벨로프 단백질의 아미노산 서열에서의 위치의 넘버링은 HIV-1 단리체 HXB2의 gp160에서의 넘버링에 따르며, 이는 예를 들어 문헌[Korber et al. (Human Retroviruses and AIDS 1998: A Compilation and Analysis of Nucleic Acid and Amino Acid Sequences. Korber et al., Eds. Theoretical Biology and Biophysics Group, Los Alamos National Laboratory, Los Alamos, N. Mex.)]에 기재된 바와 같은데, 상기 문헌은 본원에 그 전체가 참고로 포함된다. HXB2에 따른 넘버링은 HIV Env 단백질 분야에서 통상적인 것이다. HIV-1 단리체 HXB2의 gp160은 서열 번호 1로 나타낸 아미노산 서열을 갖는다. 이 서열과 관심 HIV Env 서열의 정렬을 이용하여 상기 관심 서열에서의 상응하는 아미노산 넘버링을 찾을 수 있다.
“~으로 이루어진 군으로부터 선택되는 표시된 위치들 중 적어도 하나에서의 표시된 아미노산 잔기를 갖는 HIV Env 단백질의 아미노산 서열을 포함하다”라는 어구 및 “하기 (아미노산 잔기들) 중 하나 이상을 포함하다”라는 어구는 본원에서 상호교환가능하게 사용된다.
용어 “서열 동일성 퍼센트 (%)” 또는 “동일성 %”는 전장의 아미노산 서열을 구성하는 아미노산 잔기의 수와 비교하여 둘 이상의 정렬된 아미노산 서열 중 동일한 아미노산의 매치 (“히트 (hit)”)의 수를 설명한다. 다른 말로 하면, 정렬을 이용하면, 둘 이상의 서열에 있어서, 서열들을 본 기술 분야에 공지된 바와 같은 서열 비교 알고리즘을 이용하여 측정할 경우 최대 상응도를 위하여 비교 및 정렬할 때, 또는 수동으로 정렬하고 시각적으로 점검할 때, 동일한 아미노산 잔기의 백분율 (예를 들어 95%, 97% 또는 98%의 동일성)이 결정될 수 있다. 따라서 서열 동일성을 결정하기 위하여 비교되는 서열들은 아미노산의 치환(들), 부가(들) 또는 결실(들)이 다를 수 있다. 단백질 서열 정렬에 적합한 프로그램은 당업자에게 공지되어 있다. 단백질 서열의 서열 동일성 백분율은 예를 들어 CLUSTALW, Clustal Omega, FASTA 또는 BLAST와 같은 프로그램을 이용하여, 예를 들어 NCBI BLAST 알고리즘을 이용하여 결정될 수 있다 (문헌[Altschul SF, et al (1997), Nucleic Acids Res. 25:3389-3402]).
본원에서 사용되는 바와 같이, ‘HIV Env 서열들의 컬렉션’은 동일 클레이드 (예를 들어 클레이드 C)로부터 또는 상이한 클레이드들 (예를 들어 클레이드 A, B, C 등)로부터 유래될 수 있는 야생형 HIV Env 단백질의 대표적인 수 (예를 들어 적어도 100개, 또는 500개, 또는 1000개, 또는 이보다 더 많은 수)의 랜덤 서열들의 컬렉션이다. 그러한 서열의 적합한 컬렉션은 데이터베이스에서 이용가능하거나, 하위컬렉션이 이로부터, 예를 들어 HIV 서열 데이터베이스 (Los Alamos National Laboratory)로부터 추출될 수 있다. 그러한 컬렉션은 바람직하게는 적어도 100개의 HIV Env 단백질 서열, 1000개의 HIV Env 단백질 서열, 적어도 10000개의 HIV Env 단백질 서열, 적어도 50000개의 HIV Env 단백질 서열을 포함하며, 90000개 초과의 HIV Env 단백질 서열을 포함할 수 있다.
HIV Env 단백질에서 ‘상응하는 위치’는 적어도 2개의 HIV Env 서열을 정렬할 때의 아미노산 잔기의 위치를 지칭한다. 달리 표시되지 않는 한, 본 분야에서 관례적인 바와 같이, 이러한 목적을 위한 아미노산 위치 넘버링은 HIV-1 단리체 HXB2의 gp160에서의 넘버링에 따른다.
본원에서 사용되는 바와 같이, ‘안정화 돌연변이’는 본원에서 표 1의 임의의 엔트리 (i)~(vii), 또는 (xvi), 또는 표 2의 (viii)~(xv)에서 설명된 바와 같은 돌연변이이며, 이는 HIV Env 단백질의 삼량체 백분율 및/또는 삼량체 수득량 (이는 본원에서 설명된 AlphaLISA 또는 SEC-MALS 분석법에 따라 측정될 수 있음)을 모 분자와 비교하여 증가시킨다 (돌연변이가 상기 모 분자에서 상응하는 아미노산의 치환에 의해 도입되는 경우). 그러한 안정화 돌연변이에 의해 생긴 아미노산은 전형적으로, 야생형 HIV 단리체의 Env 단백질에서는 발견된다고 하더라도 드물게 발견된다.
본원에서 사용되는 바와 같이, ‘복구 돌연변이’는 모 HIV Env 단백질에서의 아미노산 잔기의 치환이며 (상기 아미노산 잔기는 HIV Env 단백질 서열들의 컬렉션에서 상응하는 위치에서 7.5% 미만, 바람직하게는 2% 미만으로 존재함), 여기서, 치환은 상기 컬렉션에서 상응하는 위치에서 더 빈번하게, 예를 들어 상기 컬렉션에서 HIV Env 단백질의 적어도 10%로 존재하는 아미노산에 의한 것이며, 바람직하게는 HIV Env 단백질의 적어도 20%에서 상기 컬렉션에서 상응하는 위치에 존재하거나 상기 컬렉션에서 상응하는 위치에서 가장 빈번하게 출현하는 아미노산인 아미노산에 의한 것이다. 따라서 그러한 복구 돌연변이에서 생긴 아미노산은 전형적으로, 상대적으로 높은 백분율의 야생형 HIV 단리체의 Env 단백질에서 발견되며, 몇몇 경우 콘센서스 HIV Env 서열에서 상응하는 위치에서의 것과 동일할 수 있다.
본원에서 사용되는 바와 같이, ‘복구되고 안정화된’ HIV Env 서열은 전형적으로, 모 HIV Env 서열과 비교하여 적어도 하나의 복구 돌연변이 및 적어도 하나의 안정화 돌연변이, 바람직하게는 다수의 복구 돌연변이 및 다수의 안정화 돌연변이를 포함한다.
용어 ‘천연’ 또는 ‘야생형’은, HIV 주 (또는 이로부터 유래된 Env 단백질)를 지칭할 때 본원에서 상호교환가능하게 사용되며, 자연에서, 예를 들어 HIV-감염 환자에서 나타나는 HIV 주 (또는 이로부터 유래된 Env 단백질)를 지칭한다.
일반적으로 본 발명은 엔벨로프 단백질 서열에서 표시된 위치에서 특정 아미노산 치환을 포함하는 재조합 HIV 엔벨로프 (Env) 단백질에 관한 것으로서, 상기 치환은 엔벨로프 단백질의 삼량체 형태를 안정화한다. 본 발명의 확인된 아미노산 치환들 중 하나 이상을 HIV 엔벨로프 단백질의 서열 내로 도입하면 삼량체 형성 백분율이 증가되고/되거나 삼량체 수득량이 증가될 수 있다. 이것은 예를 들어 삼량체-특이적 항체, 융점, 크기 배제 크로마토그래피, 및 올바르게 폴딩된 (안정한 삼량체성) 또는 대안적으로 올바르지 않게 폴딩된 (비-안정성 또는 비-삼량체성) Env 단백질에 결합하는 항체에의 결합성을 이용하여 측정될 수 있으며, 증가된 삼량체 백분율 및/또는 삼량체 수득량은 안정하고, 올바르게 폴딩된 천연 Env 단백질을 나타내는 것으로 간주된다.
인간 면역결핍 바이러스 (HIV)는 레트로바이러스과 (family of Retroviridae)의 일부인 렌티바이러스속 (genus Lentivirinae)의 구성원이다. 다음 2가지의 HIV 종이 인간을 감염시킨다: HIV-1 및 HIV-2. HIV-1은 HIV 바이러스의 가장 일반적인 주이고, HIV-2보다 더 병원성인 것으로 알려져 있다. 본원에서 사용되는 바와 같이, 용어 "인간 면역결핍 바이러스" 및 "HIV"는 HIV-1 및 HIV-2를 지칭하지만, 이에 한정되는 것은 아니다. 바람직한 실시 형태에서, HIV는 HIV-1을 지칭한다.
HIV는 높은 정도의 유전적 다양성을 갖는 복수의 클레이드로 분류된다. 본원에서 사용되는 바와 같이, 용어 "HIV 클레이드" 또는 "HIV 아형"은 이들의 유전적 유사성 정도에 따라 분류되는 관련된 인간 면역결핍 바이러스를 지칭한다. HIV-1 단리체의 가장 큰 그룹은 그룹 M (주요 주)으로 칭해지며, 적어도 10개의 클레이드, A 내지 J로 이루어진다.
일반적인 일 양태에서, 본 발명은 재조합 HIV 엔벨로프 (Env) 단백질에 관한 것이다. 단백질과 관련하여 사용될 때 “재조합”이라는 용어는 시험관 내에서 화학적 합성에 의해 또는 재조합 기술에 의해 생성된 단백질을 지칭한다. 본 발명의 실시 형태에 따르면, “재조합” 단백질은, 상응하는 천연 발생 서열에서는 발견되지 않는 적어도 하나의 서열 요소 (예를 들어, 아미노산의 치환, 결실, 부가, 서열 대체 등)를 포함한다는 점에서 인공 아미노산 서열을 갖는다. 바람직하게는, “재조합” 단백질은 하나 이상의 천연 발생 HIV 주에 대하여 면역 반응을 유도하거나 면역성을 생성하도록 최적화된 천연 비-발생 HIV 엔벨로프 단백질이다.
용어 “HIV 엔벨로프 단백질”, “HIV Env” 및 “HIV Env 단백질”은 자연에서 HIV 비리온의 엔벨로프 상에서 발현되며 HIV가 HIV 감염 세포의 형질막을 표적화하여 이에 부착되게 할 수 있는 단백질, 또는 이의 단편 또는 유도체를 지칭한다. 용어 “엔벨로프” 및 “Env”는 본 개시 내용 전체에 걸쳐 상호교환가능하게 사용된다. HIV env 유전자는 전구 단백질 gp160을 코딩하는데, 이는 단백질 분해에 의해 2개의 성숙 엔벨로프 당단백질 gp120 및 gp41로 절단된다. 상기 절단 반응은 레트로바이러스 엔벨로프 당단백질 전구체에서 고도로 보존된 서열 모티프에서 숙주 세포 프로테아제, 푸린에 의해 (또는 푸린-유사 프로테아제에 의해) 매개된다. 더 구체적으로, gp160은 (gp160)3으로 삼량체화되며, 그 후 2개의 비공유적 회합 성숙 당단백질 gp120 및 gp41로 절단된다. 바이러스 유입은 이후 gp120/gp41 헤테로이량체의 삼량체에 의해 매개된다. Gp120은 수용체 결합 단편이고, 예를 들어 T-헬퍼 세포와 같이 그러한 수용체를 갖는 표적 세포 상의 CD4 수용체 (및 공동수용체)에 결합한다. gp120에 비공유적으로 결합된 gp41은 융합 단편이고 HIV가 세포에 진입하는 제2 단계를 제공한다. Gp41은 원래 바이러스 엔벨로프 내에 묻혀 있지만, gp120이 CD4 수용체 및 공동수용체에 결합할 때, gp120은 gp41이 노출되도록 이의 배좌를 변화시키는데, 여기서 이것은 숙주 세포와의 융합을 보조할 수 있다. Gp140은 gp160의 엑토도메인이다.
본 발명의 실시 형태에 따르면, “HIV 엔벨로프 (Env) 단백질”은 gp160 또는 gp140 단백질, 또는 이들의 조합물, 융합물, 절두된 것 또는 유도체일 수 있다. 예를 들어, “HIV 엔벨로프 단백질”은 gp41 단백질과 비?유적으로 회합된 gp120 단백질을 포함할 수 있다. 또한 “HIV 엔벨로프 단백질”은 엑토도메인 (즉, 세포외 공간 내로 연장된 도메인)에서의 C-말단 절두, gp41에서의 절두, 예컨대 gp41의 엑토도메인에서의 절두, gp41의 막관통 도메인에서의 절두, 또는 gp41의 세포질 도메인에서의 절두를 포함하는 엔벨로프 단백질을 포함하지만 이에 한정되는 것은 아닌 절두형 HIV 엔벨로프 단백질일 수 있다. 또한 HIV 엔벨로프 단백질은 gp160 엑토도메인에 상응하는 gp140, 또는 연장되거나 절두된 버전의 gp140일 수 있다. gp140 단백질의 발현은 몇 가지 간행물 (예를 들어, 문헌[Zhang et al., 2001]; 문헌[Sanders et al., 2002]; 문헌[Harris et al., 2011])에서 기술되었고, 이 단백질은 또한 서비스 제공자로부터, 예를 들어 상이한 HIV 주를 기반으로 하는 상이한 변이체로 주문될 수 있다. 본 발명에 따른 gp140 단백질은 gp120 도메인 및 gp41 엑토도메인이 절단되지 않고 공유적으로 연결되지 않거나, 또는 대안적으로 gp120 도메인 및 gp41 엑토도메인이 절단되고 예를 들어 디술피드 가교체 (예를 들어 SOSIP 변이체에서와 같이)에 의해 공유적으로 연결될 수 있도록 절단 부위 돌연변이를 가질 수 있다. “HIV 엔벨로프 단백질”은 또한, 예를 들어 푸린 절단 부위에서 서열 돌연변이 및/또는 소위 SOSIP 돌연변이를 갖는 천연 발생 HIV 엔벨로프 단백질의 유도체일 수 있다. 본 발명에 따른 HIV 엔벨로프 단백질은 또한 gp120 및 gp41 엑토도메인이 비-공유적으로 연결될 수 있도록 절단 부위를 가질 수 있다.
본 발명의 바람직한 실시 형태에서, HIV Env 단백질은 gp140 단백질 또는 gp160 단백질이며, 더 바람직하게는 gp140 단백질이다. 다른 바람직한 실시 형태에서, Env 단백질은 천연 Env 단백질과 비교하여 예를 들어 세포질 영역의 일곱 번째 잔기 뒤의 잔기들의 결실에 의해 절두된다.
본 발명의 실시 형태에 따르면, “HIV 엔벨로프 단백질”은 삼량체 또는 단량체일 수 있으며, 바람직하게는 삼량체이다. 삼량체는 호모삼량체 (예를 들어, 3개의 동일한 폴리펩티드 단위를 포함하는 삼량체), 또는 헤테로삼량체 (예를 들어, 모두 동일한 것은 아닌 3개의 폴리펩티드 단위를 포함하는 삼량체)일 수 있다. 바람직하게는, 삼량체는 호모삼량체이다. 절단된 gp140 또는 gp160의 경우, 이것은 gp120-gp41 이량체인 폴리펩티드 단위의 삼량체이며, 모든 3개의 이러한 이량체들이 동일한 경우, 이것은 호모삼량체로 간주된다.
“HIV 엔벨로프 단백질”은 가용성 단백질, 또는 막 결합 단백질일 수 있다. 전형적으로 막 결합 엔벨로프 단백질은 도 1a에 나타낸 바와 같이 막관통 도메인 (Tm)을 포함하는 전장 HIV 엔벨로프 단백질에서와 같이 막관통 도메인을 포함한다. 막 결합 단백질은 세포질 도메인을 가질 수 있지만, 세포질 도메인이 막 결합되는 것을 필요로 하는 것은 아니다. 가용성 엔벨로프 단백질은 막관통 도메인의 적어도 부분적인 결실 또는 완전한 결실을 포함한다. 예를 들어, 전장 HIV 엔벨로프 단백질의 C-말단을 막관통 도메인이 결실되도록 절두함으로써 가용성 단백질을 생성할 수 있으며, 이는 도 1b에 나타낸 바와 같다. 그러나, HIV 엔벨로프 단백질은 도 1b에 나타낸 것에 대하여 대안적인 절두 위치 및 더 짧은 절두부를 가지고서 여전히 가용성일 수 있다. 절두는 다양한 위치에서 행해질 수 있으며, 비제한적 예로는 아미노산 664, 655, 683 등의 뒤인데, 이들 전부는 가용성 단백질을 생성한다. 본 발명에 따른 막 결합 Env 단백질은 천연 Env 단백질과 비교하여 완전한 또는 부분적인 C-말단 도메인 (예를 들어, C-말단 세포질 도메인의 부분 결실에 의해 (예를 들어 특정 실시 형태에서 세포질 영역의 일곱 번째 잔기 뒤에서))을 포함할 수 있다.
전형적으로 신호 펩티드는 발현될 경우 HIV Env 단백질의 N-말단에 존재하지만, 신호 펩티다아제에 의해 절단 제거되고 따라서 성숙 단백질에는 존재하지 않는다. 신호 펩티드는 다른 신호 서열과 교환될 수 있으며, 신호 펩티드의 일부 비제한적 예가 본원에 서열 번호 11, 18, 33, 및 34로 제공되어 있다.
본 발명의 실시 형태에 따르면, HIV 엔벨로프 단백질, 예를 들어, gp160, 또는 gp140은 임의의 HIV 클레이드 (또는 ‘아형’), 예를 들어, 클레이드 A, 클레이드 B, 클레이드 C, 클레이드 D, 클레이드 E, 클레이드 F, 클레이드 G, 클레이드 H 등, 또는 이들의 조합 (상이한 아형의 바이러스들 사이의 재조합으로부터 유래된 ‘순환 재조합형’ 또는 CRF, 예를 들어 BC, AE, AG, BE, BF, ADG 등에서와 같이)으로부터의 HIV 엔벨로프 단백질 서열로부터 유래될 수 있다. HIV 엔벨로프 단백질 서열은 천연 발생 서열, 모자이크 서열, 콘센서스 서열, 합성 서열, 또는 이의 임의의 유도체 또는 단편일 수 있다. “모자이크 서열”은 하나 이상의 HIV 클레이드의 적어도 3개의 HIV 엔벨로프 서열로부터 유래된 다수의 에피토프를 포함하며, T-세포 에피토프의 커버리지(coverage)를 최적화하는 알고리즘에 의해 설계될 수 있다. 모자이크 HIV 엔벨로프 단백질의 서열의 예는 예를 들어 문헌[Barouch et al, Nat Med 2010, 16: 319-323]; 및 국제 공개 제2010/059732호에 개시된 것, 예컨대 서열 번호 8 및 9로 나타낸 것을 포함한다. 본원에서 사용되는 바와 같이, “콘센서스 서열”은 예를 들어 상동 단백질들의 아미노산 서열의 정렬 (예를 들어, Clustal Omega)에 의해 결정되는 바와 같이, 상동 단백질들의 아미노산 서열의 정렬을 기반으로 한 아미노산의 인공 서열을 의미한다. 이것은 적어도 1000가지의 천연 HIV 단리체로부터의 Env의 서열을 기반으로 한, 서열 정렬에서의 각각의 위치에서 발견되는, 계산된 가장 빈번한 순서의 아미노산 잔기이다. “합성 서열”은 하나 초과의 천연 발생 HIV 주에 대하여 면역 반응을 유도하거나 면역성을 생성하도록 최적화된 천연 비-발생 HIV 엔벨로프 단백질이다. 모자이크 HIV 엔벨로프 단백질은 합성 HIV 엔벨로프 단백질의 비제한적 예이다. 본 발명의 바람직한 실시 형태에서, HIV Env 단백질은 본 발명에 따른 표시된 위치 (i)~(vii)에서의 표시된 아미노산 중 적어도 하나를 갖는 콘센서스 Env 단백질, 또는 합성 Env 단백질이다. 본 발명에 따른 표시된 위치 (i)~(vii)에서의 표시된 아미노산 잔기들 중 적어도 하나, 바람직하게는 적어도 2개를 갖는, 바람직하게는 하기에 기술된 바와 같은 추가의 SOSIP 및/또는 푸린 절단 부위 돌연변이를 갖는 콘센서스 Env 단백질이 특히 바람직하다.
본 발명의 특정 실시 형태에서, 천연 발생 서열이든지, 모자이크 서열이든지, 콘센서스 서열이든지, 합성 서열 등이든지간에, HIV 엔벨로프 단백질은 예를 들어 푸린 절단 부위 내의 추가 서열 돌연변이, 및/또는 소위 SOSIP 돌연변이를 포함한다.
본 발명의 일부 실시 형태에서, HIV 엔벨로프 단백질은 “SOSIP 돌연변이 HIV Env 단백질”이다. 소위 SOSIP 돌연변이는 ‘SOS 돌연변이’ (위치 501 및 605에서 Cys 잔기 (이는 새롭게 생성된 시스테인 잔기들 사이에 가능한 디술피드 가교체를 도입함) 및 ‘IP 돌연변이’ (위치 559에서 Pro 잔기)를 포함하는 삼량체 안정화 돌연변이이다. 본 발명의 실시 형태에 따르면, SOSIP 돌연변이 Env 단백질은 위치 501 및 605에서 Cys; 위치 559에서 Pro; 및 바람직하게는 위치 501 및 605에서 Cys 및 위치 559에서 Pro으로 이루어진 군으로부터 선택되는 적어도 하나의 돌연변이를 포함한다. SOSIP 돌연변이 HIV Env 단백질은 예를 들어 푸린 절단 부위에서 다른 서열 돌연변이를 추가로 포함할 수 있다. 게다가, 특정 실시 형태에서 Env 단백질이 위치 556 또는 위치 558에서 또는 위치 556 및 558에서 Pro을 포함하도록 돌연변이를 추가로 부가하는 것이 가능한데, 이는 본원에서, SOSIP 변이체에서 위치 559에서의 Pro에 대한 대안으로 작용할 수 있을뿐만 아니라 위치 559에서 Pro을 이미 갖고 있는 SOSIP 변이체의 삼량체 형성을 추가로 개선시킬 수 있는 추가 돌연변이로도 작용할 수 있는 것으로 밝혀졌다.
본 발명의 바람직한 특정 실시 형태에서, SOSIP 돌연변이 HIV Env 단백질은 위치 501 및 605에서 Cys, 및 위치 559에서 Pro을 포함한다.
특정 실시 형태에서, 본 발명의 HIV 엔벨로프 단백질은 푸린 절단 부위에서의 돌연변이를 추가로 포함한다. 푸린 절단 서열에서의 돌연변이는 아미노산의 치환, 결실, 삽입, 또는 하나의 서열의 또 다른 것에 의한 대체, 또는 링커 아미노산 서열에 의한 대체일 수 있다. 바람직하게는 본 발명에서, 푸린 절단 부위를 돌연변이시키는 것은, 예를 들어 잔기 508~511에서의 서열을 RRRRRR (서열 번호 10)로 대체하는 것에 의해 [즉, 위치 509~510에서의 전형적인 아미노산 서열 (예를 들어 EK)을 4개의 아르기닌 잔기로 대체하는 한편 (즉, 2개의 대체 및 2개의 부가), 위치 508 및 511에서는, 대부분의 HIV Env 단백질에 이미 아르기닌 잔기가 존재하여서, 이들은 전형적으로 대체될 필요가 없지만, 문헌에서 최종 결과는 종종 아미노산 서열 RRRRRR로 지칭되기 때문에 본원에서는 이 명명법을 유지하였음] 푸린 절단이 야생형에 비해 개선되도록 상기 절단 부위를 최적화하는 데 사용될 수 있다. 푸린 절단을 개선시키는 다른 돌연변이가 공지되어 있으며, 또한 사용될 수 있다. 대안적으로, 푸린 절단이 더 이상 필요하지 않도록 푸린 절단 부위를 링커로 대체하는 것이 가능하지만, 단백질은 천연-유사 배좌를 채택할 것이다 (예를 들어 문헌[Sharma et al, 2015] 및 문헌[Georgiev et al, 2015]에 기술됨).
본 발명의 특정한 실시 형태에서, 본 발명의 HIV 엔벨로프 단백질은 추가로 소위 SOSIP 돌연변이 (바람직하게는 위치 501 및 605에서 Cys, 및 위치 559에서 Pro) 및 푸린 절단 부위에서의 서열 돌연변이 둘 다를 포함하며, 바람직하게는 RRRRRR (서열 번호 10)에 의한 잔기 508~511에서의 서열의 대체를 포함한다. 바람직한 특정 실시 형태에서, HIV Env는 표시된 SOSIP 및 푸린 절단 부위 돌연변이 둘 다를 포함하며, 게다가 추가로, 위치 556 또는 558에서, 가장 바람직하게는 위치 556 및 558 둘 다에서 Pro 잔기를 포함한다.
본 발명의 바람직한 실시 형태에서, HIV 엔벨로프 단백질의 아미노산 서열은 콘센서스 서열, 예컨대 HIV 엔벨로프 클레이드 C 콘센서스 또는 HIV 엔벨로프 클레이드 B 콘센서스이다. 특히 바람직한 실시 형태에서, HIV 엔벨로프 단백질의 아미노산 서열은 HIV 엔벨로프 클레이드 C 콘센서스이다.
본 발명에서 사용될 수 있는 예시적인 HIV 엔벨로프 단백질은 HIV 엔벨로프 클레이드 C 콘센서스 (서열 번호 2) 및 HIV 엔벨로프 클레이드 B 콘센서스 (서열 번호 4)를 포함한다. 이러한 HIV 엔벨로프 클레이드 C 및 클레이드 B 콘센서스 서열은, 예를 들어 안정성 및/또는 삼량체 형성을 향상시키는 추가 돌연변이, 예를 들어 소위 SOSIP 돌연변이 및/또는 푸린 절단 부위에서의 서열 돌연변이 (상기에 기술된 바와 같음), 예를 들어 서열 번호 3으로 나타낸 ConC_SOSIP 서열 및 서열 번호 5로 나타낸 ConB_SOSIP 서열에서의 것을 포함할 수 있다.
본 발명에서 사용될 수 있는 바람직한 HIV 엔벨로프 단백질 서열의 다른 비제한적 예 (‘배경’ 또는 ‘모’ 분자로서 (여기서, 그러면 본 발명의 돌연변이들 중 하나 이상이 도입됨)는, 예를 들어 서열 번호 6의 아미노산 서열, 또는 위치 166에서 Glu가 Arg으로 돌연변이된 서열 번호 6의 아미노산 서열을 포함하는 합성 HIV Env 단백질을 포함하며, 이들 중 어느 하나는 선택적으로 추가 SOSIP 및/또는 푸린 절단 부위 돌연변이 (상기에 기술된 바와 같음)를 선택적으로 갖는다. 또 다른 비제한적 예로는 서열 번호 7이 있다. 추가의 비제한적 예로는 모자이크 HIV 엔벨로프 단백질, 예컨대 서열 번호 8 또는 9의 아미노산 서열을 갖는 것이 있다.
특정 실시 형태에서, 모 분자는 야생형 HIV Env 단백질이며, 여기서, 하나 또는 바람직하게는 이보다 많은 아미노산이 본원에 개시된 방법에 따라 복구되었다. 이러한 모 분자는 적어도 100개, 바람직하게는 적어도 500개, 바람직하게는 적어도 1000개, 바람직하게는 적어도 10000개, 바람직하게는 적어도 20000개의 야생형 HIV Env 서열들의 컬렉션에서 HIV Env 서열의 7.5% 미만, 바람직하게는 2% 미만의 빈도로 상응하는 위치에 존재하는 아미노산 잔기에서의 적어도 하나의 복구 돌연변이를 포함하며, 여기서, 복구 돌연변이는 상기 컬렉션에서 HIV Env 서열의 적어도 10%의 빈도로 상응하는 위치에 존재하는 아미노산 잔기에 의한 치환이다. 바람직하게는 상기 치환은 상기 컬렉션에서 HIV Env 서열의 적어도 15%, 적어도 20%, 적어도 25%의 빈도로 상응하는 위치에 존재하는 아미노산 잔기에 의한 것이다. 바람직하게는, 상기 치환은 상기 컬렉션에서 가장 빈번하게 상응하는 위치에 존재하는 아미노산 잔기에 의한 것이다. 바람직한 특정 실시 형태에서, 상기 모 분자는 그러한 복구 돌연변이들 중 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 적어도 20개를 포함한다. 바람직하게는, 상기 컬렉션에서 HIV Env 서열의 2% 미만의 빈도로 상응하는 위치에 존재하는 아미노산 잔기들 중 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% 또는 이들 전부가 야생형 Env 단백질과 비교하여 모 분자에서 복구된다. 특정 실시 형태에서, 상기 컬렉션에서 HIV Env 서열의 7.5% 미만의 빈도로 상응하는 위치에 존재하는 아미노산 잔기들 중 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% 또는 이들 전부가 야생형 Env 단백질에 비하여 모 분자에서 복구된다. 특정 실시 형태에서, 야생형 HIV Env 단백질은 클레이드 A, B, 또는 C 주, 바람직하게는 클레이드 C 주로부터 유래된다. 이러한 복구 돌연변이의 결과로서, 모 분자는 HIV Env 콘센서스 서열에 대하여 원래의 야생형 주보다 더 많은 유사함을 나타내며, 따라서, 복구된 아미노산 잔기는 때때로 본원에서 ‘콘센서스 아미노산’ 또는 ‘콘센서스 잔기’로 지칭된다. 이러한 복구 활성의 결과는 폴딩, 삼량체화, 발현, 및/또는 안정성과 관련하여 생성된 모 분자의 크게 향상된 특성이며, 생성된 분자는 본원에서 ‘복구된 Env 단백질’로 지칭된다. 그러한 모 분자 내로의 본 발명의 안정화 돌연변이의 부가 (예를 들어, (i)~(vii) 중 하나 이상 (표 1), 및/또는 (xvi) (표 1), 및/또는 선택적으로 (viii)~(xv) (표 2))는 삼량체 백분율, 삼량체 수득량, 안정성, 광범위 중화 항체의 결합성, 폴딩 중 하나 이상에서 훨씬 더한 개선을 초래하며, 야생형 HIV Env 단백질로부터 유래된 생성된 분자는 본원에서 ‘복구되고 안정화된 Env 단백질’로 지칭된다. 안정화 돌연변이의 도입은 실제로, 생성된 서열이 콘센서스 서열로부터 약간 벗어나게 하여서, 복구되고 안정화된 HIV Env 분자의 크게 향상된 특성의 최종 결과는 2가지의 전적으로 다른 개념을 기반으로 하게 됨이 당업자에게 명백할 것이다.
본 발명에 따른 위치 (i)~(vii)에서의 표시된 아미노산으로 이어지는 돌연변이는 또한 HIV Env 단백질에서 사용될 수 있으며, 여기서, SOSIP 돌연변이는 전혀 존재하지 않고 (예를 들어, Env 콘센서스 서열 내에 또는 야생형 HIV 단리체 유래의 Env 단백질 내에), 이의 삼량체화를 또한 개선시킬 가능성이 있으며, 그 이유는 본 발명의 돌연변이가 SOSIP 돌연변이와 관련이 없고 게다가 몇몇 상이한 HIV Env 단백질 백본에서 작동하는 것으로 보였기 때문이다. 실제로, 본 발명에 따른 돌연변이는 HIV Env 삼량체화 특성을 개선시키도록 Ip-돌연변이의 부재 하에서뿐만 아니라 SOS-돌연변이의 부재 하에서도 작동할 수 있음이 본원에 나타나 있다.
본 발명의 실시 형태에 따른 재조합 HIV 엔벨로프 단백질은 HIV 엔벨로프 단백질의 아미노산 서열에서의 특정된 위치에서 특정한 아미노산 잔기(들)를 갖는 HIV 엔벨로프 단백질을 포함한다. 특히, 엔벨로프 단백질에서의 7개의 위치가 확인되었으며, 이외에도, 확인된 위치 각각에서 바람직한 특정한 아미노산 잔기가 확인되었다. 엔벨로프 단백질 서열에서의 확인된 위치는 (i) 위치 651, (ii) 위치 655, (iii) 위치 535, (iv) 위치 589, (v) 위치 573, (vi) 위치 204, 및 (vii) 위치 647을 포함하며, 여기서, 위치의 넘버링은 HIV-1 단리체 HXB2의 gp160에서의 넘버링에 따른다. 본 발명에 따른 HIV Env 단백질은 표시된 위치 (i)~(vii) 중 적어도 하나의 위치에서, 바람직하게는 표시된 위치 (i)~(vii) 중 적어도 2개의 위치에서, 더 바람직하게는 표시된 위치 (i)~(vii) 중 적어도 3개의 위치에서 특정된 아미노산 잔기(들)를 갖는다. 본 발명의 실시 형태에 따른 확인된 위치 각각에 있는 것이 바람직한 특정한 아미노산 잔기는 표 1에 예시되어 있다. 이러한 옵션의 바람직한 위치로는 (i), (ii), (iii), (iv), (vi), 및/또는 (vii)이 있다. 이러한 옵션의 특히 바람직한 위치로는 (i), (ii), (iii), (iv), 및/또는 (vii)이 있다. 추가의 바람직한 옵션으로는 이후에 본원에서 약간 더 상세하게 언급되는 (xvi)가 있다.
[표 1]
상기 하나 이상의 표시된 위치에서 하나 이상의 바람직한 아미노산 (또는 표시된 아미노산)이 도입되는 HIV 엔벨로프 단백질의 아미노산 서열은 “백본 HIV 엔벨로프 서열” 또는 “모 HIV 엔벨로프 서열”로 지칭된다. 예를 들어, 서열 번호 3의 ConC_SOSIP 서열에서의 위치 651이 Phe로 돌연변이된다면, ConC_SOSIP 서열은 “백본” 또는 “모” 서열인 것으로 간주된다. 임의의 HIV 엔벨로프 단백질이 본 발명의 실시 형태에 따른 신규 안정화 돌연변이가 단독으로 또는 다른 돌연변이, 예컨대 소위 SOSIP 돌연변이 및/또는 푸린 절단 부위에서의 돌연변이와 조합되어 도입될 수 있는 “백본” 또는 “모” 서열로 사용될 수 있다. 백본으로 사용될 수 있는 HIV Env 단백질의 비제한적 예는 천연 HIV 단리체 유래의 HIV Env 단백질, 합성 HIV Env 단백질, 또는 콘센서스 HIV Env 단백질을 포함하며, 특정한 비제한적 예에서, 서열 번호 2, 서열 번호 3, 서열 번호 4, 서열 번호 5, 서열 번호 6, 열 번호 7, 서열 번호 8, 또는 서열 번호 9를 포함하는 것을 포함한다.
본 발명의 실시 형태에 따르면, HIV 엔벨로프 단백질은 위치 651, 655, 535, 589, 573, 204, 및 647로 이루어진 군으로부터 선택되는 표시된 위치들 중 적어도 하나에서의 표시된 아미노산 잔기, 예컨대 1개, 2개, 3개, 4개, 5개, 6개, 또는 7개의 위치에서의 표시된 아미노산 잔기를 가질 수 있다. 바람직하게는, HIV 엔벨로프 단백질은 표시된 위치들 중 1개, 2개 또는 3개의 위치에서 치환되며, 더 바람직하게는 HIV 엔벨로프 단백질은 표시된 위치들 중 적어도 2개의 위치에서 치환된다. 더욱 더 바람직하게는, HIV Env 단백질은 표시된 위치들 중 3개의 위치, 표시된 위치들 중 4개의 위치, 표시된 위치들 중 5개의 위치, 표시된 위치들 중 6개의 위치, 또는 표시된 위치들 중 모든 7개의 위치에서 치환된다. 바람직하게는, HIV 엔벨로프 단백질은 표시된 위치들 중 적어도 2개의 위치에서 표시된 아미노산 잔기를 포함한다. 더 바람직하게는, HIV 엔벨로프 단백질은 표시된 위치들 중 3개의 위치에서 표시된 아미노산 잔기를 포함한다. 다른 바람직한 실시 형태에서, HIV 엔벨로프 단백질은 표시된 위치들 중 4개, 5개, 6개, 또는 모든 7개의 위치에서 표시된 아미노산 잔기를 포함한다.
다수의 위치에서 표시된 아미노산을 갖는 HIV Env 단백질의 실시 형태 (HIV-1 단리체 HXB2의 gp160에서의 넘버링에 따라 넘버링된 위치 (그 위치에 존재하는 잔기의 1문자 아미노산 코드가 뒤따름), 하나의 HIV Env 단백질 실시 형태 내의 위치는 쉼표로 나뉘어짐 [예를 들어, 위치 651에서 Phe 및 위치 655에서 Ile를 갖는 Env 단백질의 실시 형태는 651F, 655I로 설명됨], 한편 다른 실시 형태 (즉, 다른 HIV Env 단백질)는 세미콜론으로 나뉘어짐)는 다음을 포함한다.
2개의 위치에서 표시된 아미노산을 갖는 Env 단백질의 경우: 651F, 655I; 651F, 655F; 651F, 655M; 651F, 655W; 651F, 535N; 651F, 535Q; 651F, 589V; 651F, 589I; 651F, 589A; 651F, 573F; 651F, 573W; 651F, 204I; 651F, 647F; 651F, 647I; 651F, 647M; 651L, 655I; 651L, 655F; 651L, 655M; 651L, 655W; 651L, 535N; 651L, 535Q; 651L, 589V; 651L, 589I; 651L, 589A; 651L, 573F; 651L, 573W; 651L, 204I; 651L, 647F; 651L, 647I; 651L, 647M; 651M, 655I; 651M, 655F; 651M, 655A; 651M, 655L; 651M, 655W; 651M, 535N; 651M, 535Q; 651M, 589V; 651M, 589I; 651M, 589A; 651M, 573F; 651M, 573W; 651M, 204I; 651M, 647F; 651M, 647I; 651M, 647M; 651W, 655I; 651W, 655F; 651W, 655M; 651W, 655W; 651W, 535N; 651W, 535Q; 651W, 589V; 651W, 589I; 651W, 589A; 651W, 573F; 651W, 573W; 651W, 204I; 651W, 647F; 651W, 647I; 651W, 647M; 655I, 535N; 655I, 535Q; 655I, 589V; 655I, 589I; 655I, 589A; 655I, 573F; 655I, 573W; 655I, 204I; 655I, 647F; 655I, 647I; 655I, 647M; 655F, 535N; 655F, 535Q; 655F, 589V; 655F, 589I; 655F, 589A; 655F, 573F; 655F, 573W; 655F, 204I; 655F, 647F; 655F, 647I; 655F, 647M; 655M, 535N; 655M, 535Q; 655M, 589V; 655M, 589I; 655M, 589A; 655M, 573F; 655M, 573W; 655M, 204I; 655M, 647F; 655M, 647I; 655M, 647M; 655W, 535N; 655W, 535Q; 655W, 589V; 655W, 589I; 655W, 589A; 655W, 573F; 655W, 573W; 655W, 204I; 655W, 647F; 655W, 647I; 655W, 647M; 535N, 589V; 535N, 589I; 535N, 589A; 535N, 573F; 535N, 573W; 535N, 204I; 535N, 647F; 535N, 647I; 535N, 647M; 535Q, 589V; 535Q, 589I; 535Q, 589A; 535Q, 573F; 535Q, 573W; 535Q, 204I; 535Q, 647F; 535Q, 647I; 535Q, 647M; 589V, 573F; 589V, 573W; 589V, 204I; 589V, 647F; 589V, 647I; 589V, 647M; 589I, 573F; 589I, 573W; 589I, 204I; 589I, 647F; 589I, 647I; 589I, 647M; 589A, 573F; 589A, 573W; 589A, 204I; 589A, 647F; 589A, 647I; 589A, 647M; 573F, 204I; 573F, 647F; 573F, 647I; 573F, 647M; 573W, 204I; 573W, 647F; 573W, 647I; 573W, 647M; 204I, 647F; 204I, 647I; 201I, 647M. 각각의 상기 실시 형태는 임의의 HIV Env 서열, 예컨대 야생형 단리체, 또는 SOSIP 돌연변이 HIV Env 단백질, 또는 콘센서스 HIV Env 단백질, 또는 합성 HIV Env 단백질에 본 발명에 따라 존재할 수 있다. 각각의 상기 실시 형태는 본 발명에 따른 (i)~(vii)로부터의 다른 표시된 위치들 중 하나의 제3 위치에서의 본 발명에 따른 바람직한 아미노산들 중 하나와 조합될 수 있다. 표시된 (i)~(vii) 중 3개의 위치에서 바람직한 아미노산 잔기를 갖는 그러한 실시 형태는 본 발명에 따른 (i)~(vii)로부터의 다른 표시된 위치들 중 하나의 제4 위치에서의 바람직한 아미노산들 중 하나와 조합될 수 있다. 표시된 (i)~(vii) 중 4개의 위치에서 바람직한 아미노산 잔기를 갖는 그러한 실시 형태는 본 발명에 따른 (i)~(vii)로부터의 다른 표시된 위치들 중 하나의 제5 위치에서의 바람직한 아미노산들 중 하나와 조합될 수 있다. 표시된 (i)~(vii) 중 5개의 위치에서 바람직한 아미노산 잔기를 갖는 그러한 실시 형태는 본 발명에 따른 (i)~(vii)로부터의 다른 표시된 위치들 중 하나의 제6 위치에서의 바람직한 아미노산들 중 하나와 조합될 수 있다. 표시된 (i)~(vii) 중 6개의 위치에서 바람직한 아미노산 잔기를 갖는 그러한 실시 형태는 본 발명에 따른 (i)~(vii)로부터의 다른 표시된 위치들 중 하나의 제7 위치에서의 바람직한 아미노산들 중 하나와 조합될 수 있어서, Env 단백질은 본 발명에 따른 모든 7개의 위치 (i)~(vii)에서 본 발명에 따른 바람직한 아미노산을 갖게 된다. 본 발명의 위치 (v)~(vii) 중 3개, 4개, 5개, 6개 또는 7개의 위치에서 본 발명에 따른 바람직한 아미노산을 갖는 이러한 추가 실시 형태들 중 임의의 것은, 야생형 단리체, SOSIP 변이체, 콘센서스 HIV Env 단백질, 합성 HIV Env 단백질 등으로부터의 것과 같은 임의의 HIV Env 단백질에 존재할 수 있다.
2개의 위치에서 표시된 아미노산을 갖는 본 발명에 따른 바람직한 Env 단백질로는 다음이 있다: 651F, 655I; 651F, 535N; 651F, 589V; 651F, 589I; 651F, 573F; 651F, 204I; 651F, 647F; 655I, 535N; 655I, 589V; 655I, 589I; 655I, 573F; 655I, 204I; 655I, 647F; 535N, 589V; 535N, 589I; 535N, 573F; 535N, 204I; 535N, 647F ; 589V, 573F; 589V, 204I; 589V, 647F; 589I, 573F; 589I, 204I; 589I, 647F; 573F, 204I; 573F, 647F; 204I, 647F. 본 발명에 따른 적어도 2개의 위치에서 바람직한 아미노산을 갖는 특히 바람직한 Env 단백질은 다음을 포함한다: 651F, 655I; 655I, 535N; 655I, 589V; 535N, 589V; 535N, 647F.
3개의 위치에서 바람직한 아미노산 잔기를 갖는 일부 바람직한 HIV Env 단백질로는 다음이 있다: 651F, 655I, 535N; 651F, 589V, 535N; 651F, 589I, 535N; 651F, 573F, 535N; 651F, 204I, 535N; 651F, 647F, 535N; 655I, 589V, 535N; 655I, 589I, 535N; 655I, 573F, 535N; 655I, 204I, 535N; 655I, 647F, 535N; 589V, 573F, 535N; 589V, 204I, 535N; 589V, 647F, 535N;
589I, 573F, 535N; 589I, 204I, 535N; 589I, 647F, 535N; 573F, 204I, 535N; 573F, 647F, 535N;
204I, 647F, 535N; 651F, 655I, 589V; 651F, 573F, 589V; 651F, 204I, 589V; 651F, 647F, 589V;
655I, 573F, 589V; 655I, 204I, 589V; 655I, 647F, 589V; 573F, 204I, 589V; 573F, 647F, 589V;
204I, 647F, 589V; 651F, 655I, 589I; 651F, 573F, 589I; 651F, 204I, 589I; 651F, 647F, 589I;
655I, 573F, 589I; 655I, 204I, 589I; 655I, 647F, 589I; 573F, 204I, 589I; 573F, 647F, 589I;
204I, 647F, 589I; 651F, 655I, 573F; 651F, 204I, 573F; 651F, 647F, 573F; 655I, 204I, 573F; 655I, 647F, 573F; 204I, 647F, 573F; 651F, 655I, 204I; 651F, 647F, 204I; 655I, 647F, 204I; 651F, 655I, 647F; 655I, 651F, 647F; 655I, 651F, 535N; 655I, 589V, 573F; 655I, 589V, 204I. 본 발명에 따른 적어도 3개의 위치에서 바람직한 아미노산을 갖는 특히 바람직한 Env 단백질은 다음을 포함한다: 651F, 655I, 535N; 655I, 589V, 535N; 655I, 573F, 589V; 655I, 204I, 589V; 651F, 655I, 647F.
4개의 위치에서 바람직한 아미노산 잔기를 갖는 일부 바람직한 HIV Env 단백질로는 다음이 있다: 651F, 655I, 535N, 589V; 651F, 655I, 535N, 573F; 651F, 655I, 589V, 573F; 651F, 535N, 589V, 573F; 655I, 535N, 589V, 573F; 651F, 655I, 535N, 204I; 651F, 655I, 589V, 204I; 651F, 535N, 589V, 204I; 655I, 535N, 589V, 204I; 651F, 655I, 573F, 204I; 651F, 535N, 573F, 204I; 655I, 535N, 573F, 204I; 651F, 589V, 573F, 204I; 655I, 589V, 573F, 204I; 535N, 589V, 573F, 204I; 651F, 655I, 535N, 647F; 651F, 655I, 589V, 647F; 651F, 535N, 589V, 647F; 655I, 535N, 589V, 647F; 651F, 655I, 573F, 647F; 651F, 535N, 573F, 647F; 655I, 535N, 573F, 647F; 651F, 589V, 573F, 647F; 655I, 589V, 573F, 647F; 535N, 589V, 573F, 647F; 651F, 655I, 204I, 647F; 651F, 535N, 204I, 647F; 655I, 535N, 204I, 647F; 651F, 589V, 204I, 647F; 655I, 589V, 204I, 647F; 535N, 589V, 204I, 647F; 651F, 573F, 204I, 647F; 655I, 573F, 204I, 647F; 535N, 573F, 204I, 647F; and 589V, 573F, 204I, 647F.
적어도 4개의 위치에서 바람직한 아미노산 잔기를 갖는 바람직한 HIV Env 단백질의 일부 예는 다음을 포함한다: 651F, 655I, 647F, I535N; 651F, 655I, 573F, 589V. 적어도 4개의 위치에서 표시된 아미노산 잔기를 포함하는 HIV Env 단백질의 바람직한 예는 535N, 589V, 651F, 655I를 포함한다. 그러한 HIV Env 단백질의 비제한적 예는 서열 번호 20, 22, 24, 26,27, 28, 29, 30, 31, 및 32로 제공된다. 바람직하게는 그러한 HIV Env 단백질은 클레이드 C HIV Env 단백질 또는 클레이드 A HIV Env 단백질, 가장 바람직하게는 클레이드 C HIV Env 단백질이다. 특정 실시 형태에서, 상기 HIV Env 단백질은추가로 588E를 포함하며, 즉, 이것은 적어도 535N, 588E, 589V, 651F, 655I를 포함한다. 그러한 HIV Env 단백질의 비제한적 예는 서열 번호 20, 24, 26, 27, 28, 29, 30, 31, 및 32로 제공된다. 특정 실시 형태에서, 상기 HIV Env는 추가로 556P를 포함하며, 즉, 이것은 적어도 535N, 556P, 589V, 651F, 655I 또는 적어도 535N, 556P, 588E, 589V, 651F, 655I를 포함한다. 그러한 HIV Env 단백질의 비제한적 예는 서열 번호 22, 24, 26, 27, 29, 30, 31 및 32로 제공된다.
일 실시 형태에서, 본 발명에 따른 재조합 HIV Env 단백질은 하기로 이루어진 군으로부터 선택되는 표시된 위치들 중 적어도 2개의 위치에서의 표시된 아미노산 잔기를 갖는 HIV Env 단백질의 아미노산 서열을 포함한다:
(i)
위치 651에서 Phe, Leu, Met, 또는 Trp;
(ii)
위치 655에서 Phe, Ile, Met, 또는 Trp;
(iii)
위치 535에서 Asn 또는 Gln;
(iv)
위치 589에서 Val, Ile, 또는 Ala;
(v)
위치 573에서 Phe 또는 Trp;
(vi)
위치 204에서 Ile; 및
(vii)
위치 647에서 Phe, Met, 또는 Ile.
예를 들어, 재조합 HIV Env 단백질은 위치 651에서 Phe, Leu, Met, 또는 Trp 중 하나, 및 위치 535에서 Asn 또는 Gln, 선택적으로, 추가의 표시된 위치에서 추가의 표시된 아미노산 잔기를 가질 수 있다. 바람직하게는, (i)~(vii)에서의 아미노산들 중 적어도 하나가 아미노산 치환에 의해 재조합 HIV Env 단백질 내로 도입된다. 예를 들어, 재조합 HIV Env 단백질은, 전부의 또는 하나 이상의 상기 적어도 2개의 표시된 아미노산 잔기들이 아미노산 치환에 의해 재조합 HIV Env 단백질 내로 도입되도록 상기 (i)~(vii)에서의 아미노산 잔기들 중 어떤 것도 함유하지 않거나 하나만을 함유하는 HIV Env 단백질로부터 생성될 수 있다.
특정 실시 형태에서, 본 발명의 재조합 HIV Env 단백질은 (viii) 위치 588에서 Gln, Glu, Ile, Met, Val, Trp, 또는 Phe을 추가로 포함하며, 여기서, Gln 또는 Glu가 바람직하다.
상기에 기술된 치환이 도입되는 HIV Env 단백질의 아미노산 서열은 본 발명의 개시 내용을 고려하여 본 기술 분야에 공지된 임의의 HIV Env 단백질, 예를 들어 HIV 클레이드 A, 클레이드 B, 클레이드 C 등으로부터의 천연 발생 서열; 모자이크 서열; 콘센서스 서열, 예를 들어, 클레이드 B 또는 클레이드 C 콘센서스 서열; 합성 서열; 또는 이들의 임의의 유도체 또는 단편일 수 있다. 본 발명의 특정 실시 형태에서, HIV Env 단백질의 아미노산 서열은 추가 돌연변이, 예를 들어, 소위 SOSIP 돌연변이, 및/또는 푸린 절단 부위에서의 돌연변이를 포함한다.
특정한 일 실시 형태에서, HIV Env 백본 단백질은 위치 501 및 605에서 Cys; 위치 559에서 Pro로 이루어진 군으로부터 선택되는 적어도 하나의 돌연변이를 포함하는 SOSIP 돌연변이 HIV Env 단백질이다. 바람직한 실시 형태에서, SOSIP 돌연변이 HIV Env 단백질은 위치 501 및 605에서 Cys, 및 위치 559에서 Pro을 포함한다. 이러한 실시 형태에 따르면, 재조합 HIV Env 단백질은 SOSIP 돌연변이 HIV Env 단백질의 아미노산 서열 및 하기로 이루어진 군으로부터 선택되는 표시된 위치들 중 적어도 하나에서의 표시된 아미노산 잔기에 의한 아미노산 치환을 포함한다:
(i)
위치 651에서 Phe, Leu, Met, 또는 Trp;
(ii)
위치 655에서 Phe, Ile, Met, 또는 Trp;
(iii)
위치 535에서 Asn 또는 Gln;
(iv)
위치 589에서 Val, Ile, 또는 Ala;
(v)
위치 573에서 Phe 또는 Trp;
(vi)
위치 204에서 Ile; 및
(vii)
위치 647에서 Phe, Met, 또는 Ile.
SOSIP 돌연변이 HIV Env 단백질은 푸린 절단 부위에서의 돌연변이, 예컨대 서열 번호 10의 서열에 의한 위치 608~511에서의 대체를 추가로 포함할 수 있다.
또 다른 실시 형태에서, 본 발명에 따른 재조합 HIV Env 단백질은 HIV Env 단백질의 아미노산 서열 및 하기로 이루어진 군으로부터 선택되는 표시된 위치들 중 적어도 하나에서의 표시된 아미노산 잔기에 의한 아미노산 치환을 포함한다:
(i)
위치 651에서 Phe, Leu, Met, 또는 Trp;
(ii)
위치 655에서 Phe, Ile, Met, 또는 Trp;
(iii)
위치 535에서 Asn 또는 Gln;
(iv)
위치 589에서 Val, Ile, 또는 Ala;
(v)
위치 573에서 Phe 또는 Trp;
(vi)
위치 204에서 Ile; 및
(vii)
위치 647에서 Phe, Met, 또는 Ile
(여기서, HIV Env 단백질은
(1) HIV Env 콘센서스 서열, 예컨대 클레이드 C 또는 클레이드 B 콘센서스 서열 (예를 들어 서열 번호 2, 3, 4 또는 5의 아미노산 서열을 포함함);
(2) 합성 HIV Env 단백질 (예를 들어 (a) 서열 번호 6의 아미노산 서열; (b) 위치 166에서 Glu의 Arg로의 돌연변이를 갖는 서열 번호 6의 아미노산 서열; (c) 서열 번호 7의 아미노산 서열; 또는 (d) 서열 번호 8 또는 9의 아미노산 서열, 추가 SOSIP 및/또는 푸린 절단 부위 돌연변이 (상기에 기술된 바와 같음)를 선택적으로 갖는 (a), (b) 또는 (d)를 포함함)로 이루어진 군으로부터 선택됨).
바람직하게는, 재조합 HIV Env 단백질은 HIV Env 단백질의 아미노산 서열, 및 상기 (i)~(vii)로 이루어진 군으로부터 선택되는 표시된 위치들 중 적어도 2개의 위치, 예컨대 2개의 위치 또는 3개의 위치에서의 표시된 아미노산 잔기에 의한 아미노산 치환을 포함한다. 그러나, 재조합 HIV Env 단백질은 표시된 위치들 중 하나 이상의 위치, 예컨대 표시된 위치들 중 1개, 2개, 3개, 4개, 5개, 6개, 또는 7개의 위치에서의 표시된 아미노산 잔기에 의한 아미노산 치환을 포함할 수 있다.
특정한 일 실시 형태에서, HIV Env 백본 단백질은 서열 번호 2의 아미노산 서열과 적어도 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 아미노산 서열을 포함하는 HIV Env 콘센서스 클레이드 C이다. 바람직하게는, 서열 번호 2의 HIV 콘센서스 클레이드 C 서열은 소위 SOSIP 돌연변이, 즉, 위치 501 및 605에서 Cys, 및 위치 559에서 Pro을 추가로 포함하며, 더 바람직하게는 소위 SOSIP 돌연변이 및 푸린 절단 부위에서의 돌연변이, 예를 들어 서열 번호 10의 서열에 의한 위치 508~511에서의 대체를 추가로 포함한다. 특히 바람직한 실시 형태에서, HIV Env 백본 단백질은 서열 번호 3으로 나타낸 서열, 또는 이와 적어도 95% 동일한 서열을 포함하며, 여기서, 바람직하게는 위치 501, 559, 605, 및 508~511에서의 아미노산 (서열 번호 10의 서열로 대체되는 바와 같음)은 서열 번호 3의 서열과 비교하여 돌연변이되지 않는다.
또 다른 특정한 실시 형태에서, HIV Env 백본 단백질은 서열 번호 4의 아미노산 서열과 적어도 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 아미노산 서열을 포함하는 HIV Env 콘센서스 클레이드 B이다. 바람직하게는, 서열 번호 4의 HIV 콘센서스 클레이드 B 서열은 소위 SOSIP 돌연변이, 즉, 위치 501 및 605에서 Cys, 및 위치 559에서 Pro을 추가로 포함하며, 더 바람직하게는 소위 SOSIP 돌연변이 및 푸린 절단 부위에서의 돌연변이, 예를 들어 서열 번호 10의 서열에 의한 위치 508~511에서의 대체를 추가로 포함한다. 특히 바람직한 실시 형태에서, HIV Env 백본 단백질은 서열 번호 5로 나타낸 서열, 또는 이와 적어도 95% 동일한 서열을 포함하며, 여기서, 바람직하게는 위치 501, 559, 605, 및 508~511에서의 아미노산 (서열 번호 10의 서열로 대체되는 바와 같음)은 서열 번호 5의 서열과 비교하여 돌연변이되지 않는다.
또 다른 특정한 실시 형태에서, HIV Env 백본 단백질은 합성 HIV Env 단백질로서, 예를 들어 (a) 서열 번호 6의 아미노산 서열; (b) 위치 166에서 Glu의 Arg로의 돌연변이를 갖는 서열 번호 6의 아미노산 서열; (c) 서열 번호 7의 아미노산 서열; 또는 (d) 서열 번호 8 또는 9의 아미노산 서열, 추가 SOSIP (501C, 605C, 559P) 및/또는 푸린 절단 부위 돌연변이 (508~511RRRRRR) (상기에 기술된 바와 같음)를 선택적으로 갖는 (a), (b) 또는 (d)를 포함하는 합성 HIV Env 단백질이다.
또 다른 특정한 실시 형태에서, HIV Env 백본 단백질은 야생형 클레이드 A 또는 클레이드 C HIV 바이러스 유래의 HIV Env 단백질로서, 이는 선택적으로, 본원에 개시된 방법에 따라 서열을 복구하기 위한 돌연변이를 포함한다.
동시에 치환될 수 있는 HIV Env 단백질에서의 두 위치의 예시적인 조합은 잔기 535,589; 535,647; 및 589,655; 예를 들어 이중 돌연변이체 I535N, D589V; I535N, E647F; 및 D589V, K655I를 포함한다. 다른 이중 돌연변이체는 K655I, I535N; N651F, K655I; 및 K655I, I573F를 포함한다. 동시에 치환될 수 있는 HIV Env 단백질에서의 세 위치의 예시적인 조합은 예를 들어 삼중 돌연변이체 I535N, D589V, K655I에서와 같은 535, 589, 655를 포함한다. 다른 삼중 돌연변이체는 K655I, D589V, I573F; 및 K655I, N651F, I535N을 포함한다.
본 발명의 특정 실시 형태에서, 본 발명에 따른 재조합 HIV Env 단백질은 하기 표 2에 나타낸 바와 같이, 위치 (viii) 588, (ix) 64 또는 66, (x) 316, (xi) 201/433, (xii) 556 또는 558 또는 556 및 558, (xiii) 548~568, (xiv) 568, 569 및 636, 또는 (xv) 302, 519 또는 520으로 이루어진 군으로부터 선택되는 하나 이상의 추가의 표시된 위치들에서 표시된 아미노산 잔기를 추가로 포함할 수 있다 (예를 들어 치환을 통하여). 특정한 이러한 아미노산 치환 (예를 들어 (viii))은 본 발명자에 의해, 상기에 기술된 본 발명에 따라 돌연변이 (i)~(vii)와 (이들의 조합과) 매우 잘 조합되는 것으로 밝혀졌다. 이러한 아미노산 치환들 중 다른 것은 이전에 문헌에 보고되어 있었다. 예를 들어, 문헌[De Taeye et al. Cell(2015), 163(7), 1702-15]에는 E64K 및 T316W 이중 돌연변이를 갖는 HIV 엔벨로프 단백질, 및 66R 돌연변이를 갖는 HIV Env 단백질이 보고되었으며; 문헌[Kwon et al. (2015) Nat.Struct. Mol . Biol . 22(7) 522-31]에는 I204C, A433C 디술피드 치환을 갖는 HIV 엔벨로프 단백질이 보고되었으며; 문헌[Guenaga et al. (Immunity (2017) 46, 792-803)]에는 L568G, T569G 또는 N636G, 및 N302Y, F519R, L520R 삼중 치환을 갖는 HIV 엔벨로프 단백질이 보고되었다. 그러나, 본 발명자가 알고 있는 한, 이러한 이전에 기술된 돌연변이는 본원에 개시된 신규한 치환들, 예를 들어 표 1에 열거된 치환들 중 임의의 것과 조합된 형태로는 기술되지 않았다. 본 발명의 아미노산 치환과 조합된 이러한 아미노산 돌연변이는 추가로 삼량체 수득량 및/또는 삼량체 형성 백분율을 증가시킬 수 있다. 이러한 아미노산 치환은 표 1에 기술된 바와 같은 표시된 위치들 중 하나 이상에서의 표시된 아미노산 잔기에 의한 치환에 더하여 본원에 기술된 재조합 HIV Env 단백질 중 임의의 것 내로 도입될 수 있다.
[표 2]
본 발명의 표시된 위치들 [(i)~(vii), 예를 들어 표 1 참조]에서 확인된 치환은 천연 서열에서는 존재하지 않거나 드물게 존재하며, 이전에 보고된 HIV Env 단백질 서열에서는 조합된 형태로는 발견되지 않으며, HIV Env 단백질의 개선된 삼량체화, 개선된 삼량체 수득량 및/또는 증가된 삼량체 안정성으로 이어지는 것으로 이전에 제안된 것이 아니었다. 표 2에서의 돌연변이 (ix)~(xi) (다른 이들에 의해 이전에 보고됨)는 모두 gp120 영역에 있는데, 상기 영역에 삼량체 특이적 항체 PGT145가 결합한다. 이러한 돌연변이는 첨부 (이는 분자의 정상에 있음)에서 폐쇄되는 삼량체를 유지한다. 치환 (xii) 및 (xiii)은 모두 gp41의 Hr1에 있다. 위치 204를 제외하고서, 표 1에서의 본 발명의 돌연변이는 모두 gp41 영역에 (분자의 바닥 부분에), 그러나 HR1 영역 외부에 있다. 명백하게, 이전에 기술된 돌연변이는 본 발명의 돌연변이의 도입에 대하여, PGT145 결합에 의해 측정되는 바와 같이 폐쇄 첨부에 의한 삼량체 형성에 대한 이의 놀라운 효과는 고사하고 상기 도입에 대하여 제안도 전혀 제공하지 않았다. 표 2에서의 점 돌연변이 (viii)~(xii) 외에도, Env 단백질의 HR1 루프 (야생형 서열에서 아미노산 잔기 548~568, 이때 넘버링은 HXB2 단리체의 gp160에 따름)를 7~10개의 아미노산을 갖는 더 짧고 덜 유연한 루프, 바람직하게는 8개 아미노산의 루프 (예를 들어, (서열 번호 12~17) 중 어느 하나로부터 선택되는 서열을 가짐)로 대체하는 것이 또한 가능하며, 예를 들어, 문헌[Kong et al (Nat Commun. 2016 Jun 28;7:12040. doi: 10.1038/Ncomms12040)]을 참조하는데, 상기 문헌은 HR1 루프를 대체하는 그러한 더 짧은 루프가 기술되어 있다. 본 발명에 따른 표시된 위치 (i)~(vii) 중 적어도 1개의 위치, 바람직하게는 적어도 2개의 위치에서 표시된 아미노산 잔기를 추가로 갖는 그러한 Env 변이체도 본 발명의 실시 형태이다. 본 발명의 특정 실시 형태에서, (Viii)~(xiii)에 열거된 돌연변이는 본 발명의 HIV Env 단백질에 부가될 수 있다 (즉, 위치 (i)~(vii)에서 표시된 아미노산들 중 하나 이상을 가짐). 또한, 그룹 (viii)~(xiii) 내에서의 조합이 이루어질 수 있으며, 비제한적 예로는 (viii) 및 (xii)에서 ((i)~(vii)의 적어도 하나의 돌연변이에 더하여) 돌연변이들의 조합이 있다 (예를 들어 I535N, A556P, K588E). 위치 (i)~(vii) 중 적어도 하나에서 및 위치 (viii)~(xiii) 중 적어도 하나에서 돌연젼이들이 조합되고 SOSIP 돌연변이들을 갖는 HIV Env 배경에서 이루어진 이중 돌연변이체의 일부 비제한적 예는 다음을 포함한다: 535,588; 588,589; 655,588; 558,535; 및 655,556; 예를 들어 I535N, K588E; 588Q, D589V; K655I, K588E; A588P, I535N; 및 K655I, I556P. 그러한 삼중 돌연변이체의 일부 비제한적 예는 다음을 포함한다: 558,535,588; 558,535,589; 558,535,655; 및 558,535,651, 예를 들어 A558P, I535N, K588E; A588P, I535. D589V; A558P, I535N, K655I; 및 A558P, I535N, N651F.
본 발명에 따른 조합의 추가의 비제한적 예는 다음을 포함한다: 655I, 573F, 589V, 588E; 651F, 655I, 573F, 589V, 588E; 651F, 655I, 573F, 589V, 588E, 535N; 651F, 655I, 573F, 589V, 588E, 535N, 204I; 651F, 655I, 556P; 651F, 535N, 556P; 651F, 589V, 556P; 651F, 589I, 556P; 651F, 573F, 556P; 651F, 204I, 556P; 651F, 647F, 556P; 655I, 535N, 556P; 655I, 589V, 556P; 655I, 589I, 556P; 655I, 573F, 556P; 655I, 204I, 556P; 655I, 647F, 556P; 535N, 589V, 556P; 535N, 589I, 556P; 535N, 573F, 556P; 535N, 204I, 556P; 535N, 647F, 556P;
589V, 573F, 556P; 589V, 204I, 556P; 589V, 647F, 556P; 589I, 573F, 556P; 589I, 204I, 556P; 589I, 647F, 556P; 573F, 204I, 556P; 573F, 647F, 556P; 651F, 655I, 558P; 651F, 535N, 558P; 651F, 589V, 558P; 651F, 589I, 558P; 651F, 573F, 558P; 651F, 204I, 558P; 651F, 647F, 558P;
655I, 535N, 558P; 655I, 589V, 558P; 655I, 589I, 558P; 655I, 573F, 558P; 655I, 204I, 558P; 655I, 647F, 558P; 535N, 589V, 558P; 535N, 589I, 558P; 535N, 573F, 558P; 535N, 204I, 558P; 535N, 647F , 558P; 589V, 573F, 558P; 589V, 204I, 558P; 589V, 647F, 558P; 589I, 573F, 558P; 589I, 204I, 558P; 589I, 647F, 558P; 573F, 204I, 558P; 573F, 647F, 558P; 655I, 589V, 535N, 556P; 651F, 655I, 535N, 556P; 556P, 651F; 556P, 651F, 655I, 535N; 655I, 589V, 573F, 651F, 588E, 556P; 556P, 651F, 655I, 535N, 573F; 556P, 651F, 655I, 535N, 573F, 589V; 556P, 651F, 655I, 535N, 573F, 589V, 204I; 556P, 651F, 655I, 535N, 573F, 589V, 204I, 588Q; 556P, 651F, 655I, 535N, 573F, 589V, 204I, 588Q, 647F; 556P, 651F, 535N, 573F; 556P, 651F, 535N, 573F, 589V; 556P, 651F, 535N, 573F, 589V, 204I; 556P, 651F, 535N, 573F, 589V, 204I, 588Q; 556P, 651F, 535N, 573F, 589V, 204I, 588Q, 647F; 556P, 655I, 535N, 573F; 556P, 655I, 535N, 573F, 589V; 556P, 655I, 535N, 573F, 589V, 204I; 556P, 655I, 535N, 573F, 589V, 204I, 588Q; 556P, 655I, 535N, 573F, 589V, 204I, 588Q, 647F. 또, 상기 실시 형태들 중 임의의 것은 임의의 HIV Env 단백질, 예를 들어 야생형 단리체, 콘센서스 Env, 합성 Env 단백질, SOSIP 돌연변이 Env 단백질, 본원에 개시된 개념에 따른 복구 돌연변이를 포함하는 야생형 단리체 등의 형태로 존재할 수 있다. 본 발명에 따른 일부 바람직한 조합은 다음을 포함한다: 655I,589V,573F,651F,588E,535N,204I; 556P, 655I, 535N, 573F, 589V, 204I, 588Q; 204I,535N,556P,588E,589V,651F,655I; 535N,556P,589V,651F,655I; 및 535N,556P,588E,589V,651F,655I.
바람직한 특정 실시 형태에서, HIV Env 단백질은 서열 번호 20, 22, 24, 26, 27, 28, 29, 30, 31 및 32의 서열 중 어느 하나와 적어도 95% 동일한, 바람직하게는 적어도 96%, 97%, 98%, 99% 동일한, 바람직하게는 100% 동일한 서열을 포함한다. 동일성 %의 결정을 위하여, 바람직하게는 표 1 및 표 2의 위치 (i)~(xv), 및 바람직하게는 또한 위치 501, 559 및 605는 고려되지 않는다. 바람직하게는 상기 위치에서의 아미노산 잔기는 각각 서열 번호 20, 22, 24, 26, 27, 28, 29, 30, 31 또는 32의 서열에서의 것이다.
특정 실시 형태에서, 본 발명의 HIV Env 단백질은 다음을 추가로 포함한다: (xvi) 위치 658에서 Val, Ile, Phe, Met, Ala, 또는 Leu으로부터 선택되는 아미노산 잔기.바람직하게는 위치 658에서의 아미노산은 Val 또는 Ile, 가장 바람직하게는 Val이다. 이것은 단독으로, 또는 표 1의 (i)~(vii) 및/또는 표 2의 (viii)~(xv) (본원에 기술됨)로부터 선택되는 돌연변이와 조합되어 Env 단백질의 삼량체 백분율 및 삼량체 수득량을 강하게 증가시킴이 밝혀졌다.
본 발명의 실시 형태에 따르면, 재조합 HIV Env 단백질은 표 1에 나타낸 바와 같이 위치 651, 655, 535, 589, 573, 204, 및 647 중 하나 이상에서 표시된 아미노산 잔기를 갖지 않는 HIV Env 단백질과 비교하여 (a) 개선된 삼량체 형성 백분율 및 (b) 개선된 삼량체 수득량 중 적어도 하나를 갖는다.
본원에서 사용되는 바와 같이, “개선된 삼량체 형성 백분율”은 HIV 엔벨로프 단백질의 백본 서열이 본 발명의 아미노산 치환들 중 하나 이상을 포함할 경우, HIV 엔벨로프 서열의 백본 서열이 그러한 아미노산 치환을 포함하지 않을 때 형성되는 삼량체의 백분율과 비교하여 더 큰 백분율의 삼량체가 형성됨을 의미한다. 본원에서 사용되는 바와 같이, “개선된 삼량체 수득량”은 HIV 엔벨로프 단백질의 백본 서열이 본 발명의 아미노산 치환들 중 하나 이상을 포함할 경우, HIV 엔벨로프 서열의 백본 서열이 그러한 아미노산 치환을 포함하지 않을 때 수득되는 상기 엔벨로프 단백질의 삼량체 형태의 총 양과 비교하여 더 많은 총 양의 엔벨로프 단백질의 삼량체 형태가 수득됨을 의미한다.
삼량체 형성은 HIV Env 단백질의 삼량체 형태에 특이적으로 결합하는 항체를 사용하여 항체 결합 분석법에 의해 측정될 수 있다. 삼량체 형태를 검출하는 데 사용될 수 있는 삼량체 특이적 항체의 예는 단클론 항체 (mAb) PGT145, PGDM1400, PG16, 및 PGT151을 포함하지만 이에 한정되는 것은 아니다. 바람직하게는, 삼량체 특이적 항체는 mAb PGT145이다. 본 발명의 개시 내용을 고려하면 본 기술 분야에 공지된 임의의 항체 결합 분석법, 예컨대 ELISA, AlphaLISA 등을 이용하여 본 발명의 재조합 HIV Env 단백질의 삼량체 형성 백분율을 측정할 수 있다.
특정한 실시 형태에서, 삼량체 형성은 AlphaLISA에 의해 측정된다. AlphaLISA는 도너 비드의 고에너지 조사에 의해 생성된 일중항 산소 분자가 도너 비드와 관련하여 대략 200 nm의 거리 내에 있는 억셉터 비드로 전달되는 비드-기반 근접 분석이다. 억셉터 비드로의 일중항 산소 분자의 전달은 연속적인 일련의 화학 반응들을 개시하여 화학발광 신호를 생성하고, 그 후 이것이 검출될 수 있다 (문헌[Eglen et al. Curr . Chem . Genomics, 2008, 25(1): 2-10]). 예를 들어, Flag-His 태그로 표지된 재조합 HIV 엔벨로프 단백질은 삼량체 특이적 mAb, 삼량체 특이적 mAb에 결합하는 항체에 콘쥬게이션된 도너 비드, 니켈-콘쥬게이션된 도너 비드, 항-His 항체에 콘쥬게이션된 억셉터 비드, 및 항-Flag 항체에 콘쥬게이션된 억셉터 비드와 함께 인큐베이션될 수 있다. 형성된 삼량체의 양은 삼량체 특이적 mAb에 결합하는 항체에 콘쥬게이션된 도너 비드와 항-His 항체에 콘쥬게이션된 억셉터 비드의 쌍으로부터 생성된 화학발광 신호를 측정함으로써 결정될 수 있다. 발현된 HIV 엔벨로프 단백질의 총 양은 니켈-콘쥬게이션된 도너 비드와 항-Flag-콘쥬게이션된 억셉터 비드의 쌍으로부터 생성된 화학발광 신호를 측정함으로써 결정될 수 있다. 예를 들어, 발현된 총 엔벨로프 단백질 및 삼량체의 양은 실시예 3에 상세하게 설명된 바와 같이 AlphaLISA 분석법에 의해 측정될 수 있다. 삼량체 형성 백분율은 형성된 삼량체의 양을 발현된 엔벨로프 단백질의 총 양으로 나누어서 계산될 수 있다.
형성된 삼량체의 양 및 발현된 엔벨로프 단백질의 총 양은 또한 삼량체 형태를 다른 형태의 HIV 엔벨로프 단백질, 예를 들어 단량체로부터 분리할 수 있는 크로마토그래피 기술을 이용하여 결정될 수 있다. 사용될 수 있는 그러한 기술의 예는 크기 배제 크로마토그래피 다중각 광 산란 (SEC-MALS)을 포함하지만, 이에 한정되는 것은 아니다. 특정 실시 형태에 따르면, 삼량체 형성 백분율은 SEC-MALS를 사용하여 결정된다. 특정 실시 형태에 따르면, 삼량체 수득량은 SEC-MALS를 사용하여 결정된다.
핵산, 벡터 및 세포
또 다른 일반 양태에서, 본 발명은 본 발명에 따른 재조합 HIV Env 단백질을 코딩하는 핵산 분자, 및 이 핵산 분자를 포함하는 벡터를 제공한다. 본 발명의 핵산 분자는 클로닝에 의해 수득되거나 합성에 의해 생성되는 RNA 형태 또는 DNA 형태로 존재할 수 있다. DNA는 이중 가닥 또는 단일 가닥일 수 있다. DNA는 예를 들어 cDNA, 게놈 DNA, 또는 이들의 조합을 포함할 수 있다. 본 핵산 분자 및 벡터는 재조합 단백질 생성, 숙주 세포에서의 이 단백질의 발현, 또는 바이러스 입자의 생성에 사용될 수 있다.
본 발명의 실시 형태에 따르면, 재조합 HIV 엔벨로프 단백질을 코딩하는 핵산은 프로모터에 작동가능하게 연결되며, 이는 핵산이 프로모터의 제어 하에 있음을 의미한다. 프로모터는 동종 프로모터 (즉, 벡터와 동일한 유전적 공급원으로부터 유래됨) 또는 이종 프로모터 (즉, 상이한 벡터 또는 유전적 공급원으로부터 유래됨)일 수 있다. 적합한 프로모터의 예는 인간 사이토메갈로바이러스 극초기 (hCMV IE, 또는 짧게 “CMV”) 프로모터 및 라우스 육종 바이러스 (Rous Sarcoma virus, RSV) 프로모터를 포함한다. 바람직하게는, 프로모터는 발현 카세트 내에서 핵산의 상류에 위치한다.
본 발명의 실시 형태에 따르면, 벡터는 발현 벡터일 수 있다. 발현 벡터는 재조합 단백질 발현용 벡터 및 대상체의 조직에서의 발현을 위한 대상체 내로의 핵산의 전달을 위한 벡터, 예컨대 바이러스 벡터를 포함하지만, 이에 한정되는 것은 아니다. 본 발명에서 사용하기에 적합한 바이러스 벡터의 예는 아데노바이러스 벡터, 아데노-관련 바이러스 벡터, 폭스 바이러스 벡터, 변형된 백시니아 앙카라 (Modified Vaccinia Ankara; MVA) 벡터, 장내 바이러스 벡터, 베네수엘라 말 뇌염 바이러스 벡터, 셈리키 삼림열 바이러스 벡터, 담배 모자이크 바이러스 벡터, 렌티바이러스 벡터 등을 포함하지만, 이에 한정되는 것은 아니다. 벡터는 또한 비-바이러스 벡터일 수 있다. 비-바이러스 벡터의 예는 플라스미드, 박테리아 인공 염색체, 효모 인공 염색체, 박테리오파지 등을 포함하지만, 이에 한정되는 것은 아니다.
본 발명의 특정 실시 형태에서, 벡터는 아데노바이러스 벡터, 예를 들어 재조합 아데노바이러스 벡터이다. 재조합 아데노바이러스 벡터는 예를 들어 인간 아데노바이러스 (HAdV, 또는 AdHu), 또는 시미안 아데노바이러스, 예컨대 침팬지 또는 고릴라 아데노바이러스 (ChAd, AdCh, 또는 SAdV) 또는 레수스 아데노바이러스 (rhAd)로부터 유래될 수 있다. 바람직하게는, 아데노바이러스 벡터는 재조합 인간 아데노바이러스 벡터, 예를 들어 재조합 인간 아데노바이러스 혈청형 26, 또는 재조합 인간 아데노바이러스 혈청형 5, 4, 35, 7, 48 등 중 어느 하나이다. 다른 실시 형태에서, 아데노바이러스 벡터는 rhAd 벡터, 예를 들어 rhAd51, rhAd52 또는 rhAd53이다.
재조합 아데노바이러스 벡터의 제조는 본 기술 분야에 잘 알려져 있다. 예를 들어, 재조합 아데노바이러스 26 벡터의 제조는 예를 들어 국제 공개 제2007/104792호 및 문헌[Abbink et al., (2007) Virol . 81(9): 4654-63]에 기술되어 있다. 아데노바이러스 26의 예시적인 게놈 서열은 GenBank 등록번호 EF 153474 및 국제 공개 제2007/104792호의 서열 번호 1에서 발견된다. rhAd51, rhAd52 및 rhAd53의 예시적인 게놈 서열이 미국 특허 출원 공개 제2015/0291935호에 제공되어 있다.
본 발명의 실시 형태에 따르면, 본원에 개시된 재조합 HIV Env 단백질 중 임의의 것이 본원에 개시된 벡터 중 임의의 것에 의해 발현되고/되거나 코딩될 수 있다. 유전자 코드의 축퇴성을 고려하면, 당업자는 본 기술 분야에서 전적으로 일상적인 방법에 따라 동일 단백질을 코딩하는 몇몇 핵산 서열들이 설계될 수 있음을 잘 알고 있다. 본 발명의 재조합 HIV Env 단백질을 코딩하는 핵산은 선택적으로, 숙주 세포 (예를 들어, 박테리아 또는 포유류 세포)에서의 적당한 발현을 보장하도록 코돈-최적화될 수 있다. 코돈-최적화는 본 기술 분야에서 널리 적용되는 기술이다.
또한 본 발명은 본원에 개시된 임의의 핵산 분자 및 벡터를 포함하는 세포, 바람직하게는 단리된 세포를 제공한다. 세포는 예를 들어 재조합 단백질 생산에, 또는 바이러스 입자 생성에 사용될 수 있다.
이와 같이 본 발명의 실시 형태는 또한 재조합 HIV Env 단백질의 제조 방법에 관한 것이다. 본 방법은 프로모터에 작동가능하게 연결된 본 발명의 실시 형태에 따른 재조합 HIV Env 단백질을 코딩하는 핵산을 포함하는 발현 벡터로 숙주 세포를 형질감염시키는 단계, 형질감염된 세포를 재조합 HIV Env 단백질의 발현에 적합한 조건 하에 성장시키는 단계, 및 선택적으로, 상기 세포에서 발현된 재조합 HIV Env 단백질을 정제하거나 단리하는 단계를 포함한다. 재조합 HIV Env 단백질은 친화성 크로마토그래피, 크기 배제 크로마토그래피 등을 포함하는 본 기술 분야에 공지된 임의의 방법에 의해 세포로부터 단리되거나 수집될 수 있다. 재조합 단백질 발현에 사용되는 기술은 본 발명의 개시 내용을 고려하면 당업자에게 잘 알려져 있다. 또한, 발현된 재조합 HIV Env 단백질은, 발현된 단백질의 정제 또는 단리 없이, 예를 들어 재조합 HIV Env 단백질을 코딩하는 발현 벡터로 형질감염되고 이 HIV Env 단백질의 발현에 적합한 조건 하에 성장시킨 세포의 상청액을 분석함으로써 연구될 수 있다.
바람직한 실시 형태에서, 발현된 재조합 HIV Env 단백질은 안정화된 삼량체성 복합체를 형성하도록 상기 단백질의 회합을 가능케 하는 조건 하에 정제된다. 예를 들어, 프로모터 (예를 들어, CMV 프로모터)에 작동가능하게 연결된 재조합 HIV Env 단백질을 코딩하는 발현 벡터로 형질감염된 포유류 세포는 33~39℃, 예를 들어 37℃, 및 2~12% CO2, 예를 들어 8% Co2에서2에서 배양될 수 있다. 또한 발현은 대안적인 발현 시스템, 예컨대 곤충 세포 또는 효모 세포 (모두 본 기술 분야에서 통상적임)에서 수행될 수 있다. 그 후, 발현된 HIV Env 단백질은 예를 들어 렉틴 친화성 크로마토그래피에 의해 세포 배양물로부터 단리될 수 있는데, 이는 당단백질에 결합한다. 컬럼에 결합된 HIV Env 단백질은 만노피라노시드를 이용하여 용출될 수 있다. 컬럼으로부터 용출된 HIV Env 단백질은 필요할 경우 추가 정제 단계, 예컨대 크기 배제 크로마토그래피를 하여서 임의의 잔존 오염물질, 예를 들어 세포 오염물질뿐만 아니라 Env 응집물, gp140 단량체 및 gp120 단량체도 제거할 수 있다. 대안적인 정제 방법, 항체 친화성 크로마토그래피를 포함하는 비제한적 예, 비-bNAB를 이용한 음성 선택, 항-태그 정제, 또는 기타 크로마토그래피 방법, 예컨대 이온 교환 크로마토그래피 등과, 본 기술 분야에 공지된 다른 방법을 발현된 HIV Env 단백질의 단리에 또한 사용할 수 있다.
본 발명의 재조합 HIV Env 단백질을 코딩하는 핵산 분자 및 발현 벡터는 본 발명의 개시 내용을 고려하여 본 기술 분야에 공지된 임의의 방법에 의해 제조될 수 있다. 예를 들어, 재조합 HIV Env 단백질을 코딩하는 핵산은 당업자에게 잘 알려진 유전 공학 기술 및 분자 생물학 기술, 예를 들어 부위 지정 돌연변이 유발, 폴리머라아제 연쇄 반응 (PCR) 등을 이용하여, 표시된 위치에서의 아미노산 치환 중 적어도 하나의 치환을 백본 HIV 엔벨로프 서열 내로 도입함으로써 제조될 수 있다. 그 후, 핵산 분자는 표준 분자 생물학 기술을 또한 사용하여 발현 벡터 내로 도입되거나 “클로닝될” 수 있다. 그 후 재조합 HIV 엔벨로프 단백질은 숙주 세포에서 발현 벡터로부터 발현될 수 있으며, 발현된 단백질은 본 기술 분야에 공지된 임의의 방법에 의해 세포 배양물로부터 정제될 수 있다 (본 발명의 개시 내용을 고려하여).
삼량체성
복합체
또 다른 일반 양태에서, 본 발명은 본 발명에 따른 3개의 재조합 HIV Env 단백질들의 비공유적 올리고머를 포함하는 삼량체성 복합체에 관한 것이다. 삼량체성 복합체는 본원에 개시된 재조합 HIV Env 단백질 중 임의의 것을 포함할 수 있다. 바람직하게는 삼량체성 복합체는 본 발명에 따른 재조합 HIV Env 단백질의 3개의 동일한 단량체 (또는 gp140이 절단될 경우 동일한 헤테로이량체)를 포함한다. 삼량체성 복합체는 다른 형태의 HIV 엔벨로프 단백질, 예컨대 단량체 형태로부터 분리될 수 있거나, 삼량체성 복합체는 다른 형태의 HIV 엔벨로프 단백질, 예컨대 단량체 형태와 함께 존재할 수 있다.
조성물 및 방법
또 다른 일반 양태에서, 본 발명은 재조합 HIV Env 단백질, 삼량체성 복합체, 단리된 핵산 분자, 벡터, 또는 숙주 세포, 및 제약상 허용가능한 담체를 포함하는 조성물에 관한 것이다. 본 조성물은 본원에 개시된 임의의 재조합 HIV Env 단백질, 삼량체성 복합체, 단리된 핵산 분자, 벡터, 또는 숙주 세포를 포함할 수 있다.
담체는 하나 이상의 제약상 허용가능한 부형제, 예컨대 결합제, 붕해제, 팽윤제, 현탁제, 유화제, 습윤제, 활택제, 착향제, 감미제, 방부제, 염색제, 가용화제 및 코팅을 포함할 수 있다. 담체 또는 기타 재료의 정확한 성질은 투여 경로, 예를 들어 근육내, 피내, 피하, 경구, 정맥내, 피부, 점막내 (예를 들어, 소화관), 비강내 또는 복강내 경로에 의존할 수 있다. 액상 주사용 제제, 예를 들어 현탁액 및 용액에 있어서, 적합한 담체 및 첨가제는 물, 글리콜, 오일, 알코올, 방부제, 착색제 등을 포함한다. 고형 경구 제제, 예를 들어, 산제, 캡슐, 당의정, 겔캡 및 정제에 있어서, 적합한 담체 및 첨가제는 전분, 당, 희석제, 과립화제, 활택제, 결합제, 붕해제 등을 포함한다. 코 스프레이/흡입제 혼합물에 있어서, 수성 용액/현탁액은 적합한 담체 및 첨가제로서 물, 글리콜, 오일, 연화제, 안정화제, 습윤제, 방부제, 방향제, 착향제 등을 포함할 수 있다.
본 발명의 조성물은 경구 (장관) 투여 및 비경구 주사를 포함하지만 이에 한정되는 것은 아닌, 투여를 촉진하고 효능을 개선하기 위해 대상체에 투여하기에 적합한 임의의 물질로 제형화될 수 있다. 비경구 주사는 정맥내 주사 또는 주입, 피하 주사, 피내 주사, 및 근육내 주사를 포함한다. 본 발명의 조성물은 또한 경점막, 안구, 직장, 투여, 장시간 작용성 이식, 설하 투여, 혀 아래, 문맥 순환을 우회하는 구강 점막으로부터, 흡입, 또는 비내 투여를 포함하는 기타 투여 경로용으로 제형화될 수 있다.
본 발명의 실시 형태는 또한 조성물의 제조 방법에 관한 것이다. 본 발명의 실시 형태에 따르면, 조성물의 제조 방법은 본 발명의 재조합 HIV Env 단백질, 삼량체성 복합체, 단리된 핵산, 벡터, 또는 숙주 세포를 하나 이상의 제약상 허용가능한 담체와 혼합하는 단계를 포함한다. 당업자는 이러한 조성물을 제조하기 위해 사용되는 통상적인 기술에 익숙할 것이다.
HIV 항원 (예를 들어, HIV gag, pol, 및/또는 env 유전자 생성물로부터 유래되는 단백질 또는 이의 단편) 및 HIV 항원을 발현하는 벡터, 예컨대 바이러스 벡터는, HIV 감염에 대하여 대상체를 백신접종하기 위한, 또는 대상체에서 HIV 감염에 대한 면역 반응을 생성하기 위한 백신 및 면역원성 조성물에서 이전에 사용되었었다. 본원에서 사용되는 "대상"은 이에 대해 본 발명의 구현예에 따른 면역학적 조성물이 투여될 것이거나 투여된 임의의 동물, 바람직하게는 포유류, 가장 바람직하게는 인간을 의미한다. 본원에서 사용되는 바와 같이, "포유류"라는 용어는 임의의 포유류를 포괄한다. 포유류의 예는 마우스, 래트, 토끼, 기니피그, 원숭이, 인간 등, 바람직하게는 인간을 포함하지만, 이에 한정되는 것은 아니다. 또한 본 발명의 재조합 HIV Env 단백질은 필요로 하는 대상체에서 인간 면역결핍 바이러스 (HIV)에 대하여 면역 반응을 유도하기 위한 항원으로 사용될 수 있다. 면역 반응은 하나 이상의 HIV 클레이드, 예컨대 클레이드 A, 클레이드 B, 클레이드 C 등에 대한 것일 수 있다. 조성물은 재조합 HIV Env 단백질을 발현하는 벡터를 포함할 수 있거나, 조성물은 본 발명의 실시 형태에 따른 단리된 재조합 HIV Env 단백질을 포함할 수 있다.
예를 들어, 재조합 HIV 단백질 또는 이의 삼량체성 복합체를 포함하는 조성물이 필요로 하는 대상체에게 투여되어 대상체에서 HIV 감염에 대한 면역 반응을 유도할 수 있다. 또한 본 발명의 재조합 HIV Env 단백질을 코딩하는 벡터, 예컨대 아데노바이러스 벡터를 포함하는 조성물 (여기서, 재조합 HIV Env 단백질은 벡터에 의해 발현됨)이 필요로 하는 대상체에게 투여되어 대상체에서 HIV 감염에 대한 면역 반응을 유도할 수 있다. 본원에 개시된 방법은 또한, 면역 반응의 프라이밍 및 부스팅 방법을 포함하여, 바람직하게는 하나 이상의 벡터, 예컨대 아데노바이러스 벡터 또는 MVA 벡터로부터 발현되는 하나 이상의 추가 HIV 항원 (예를 들어, HIV gag, pol, 및/또는 env 유전자 생성물로부터 유래된 단백질 또는 이의 단편)과 조합된 본 발명의 조성물을 투여하는 단계를 포함한다.
특정 실시 형태에서, HIV Env 단백질은 입자, 예컨대 리포좀, 바이러스-유사 입자 (VLP), 나노입자, 비로좀, 또는 엑소좀 (선택적으로 내인성 및/또는 외인성 아쥬반트와 조합됨) 상에서 디스플레이될 수 있다. 가용성 또는 단량체성 Env 단백질 단독과 비교할 때, 그러한 입자는 전형적으로 생체 내에서 향상된 항원 제시 효능을 디스플레이한다.
HIV Env 단백질을 디스플레이하는 VLP의 예는 예를 들어 HIV Env 단백질을 자가-조립성 바이러스 단백질, 예컨대 HIV Gag 코어 또는 기타 레트로바이러스 Gag 단백질과 공동발현시킴으로써 제조될 수 있다. VLP는 바이러스와 유사하지만, 바이러스 유전 물질을 포함하지 않기 때문에 비-감염성이다. 바이러스 구조 단백질, 예컨대 엔벨로프 또는 캡시드의 발현은 VLP의 자가-조립으로 이어질 수 있다. VLP는 당업자에게 잘 알려져 있으며, 백신에서의 이의 사용은 예를 들어 문헌[Kushnir et al, 2012]에 기술되어 있다.
바람직한 특정 실시 형태에서, 입자는 리포좀이다. 리포좀은 적어도 하나의 지질 이중층을 갖는 구형 소포이다. HIV Env 삼량체 단백질은 예를 들어 그러한 리포좀에 정전기적 상호작용에 의해, 예를 들어 리포좀 내의 유도체화 지질의 헤드 그룹 내로 혼입된 Ni2 + 또는 Co2 +와 같은 2가 킬레이팅 원자 및 HIV Env 삼량체의 C-말단에의 His-태그의 부가에 의해 비-공유적으로 커플링될 수 있다. 특정한 비제한적 예시적 실시 형태에서, 리포좀은 1,2-디스테아로일-sn-글리세로-3-포스포콜린 (DSPC), 콜레스테롤, 및 1,2-디올레오일-sn-글리세로-3-[(N-(5-아미노-1-카르복시펜틸)이미노디아세트산)숙시닐]의 니켈 또는 코발트 염 (DGS-NTA(Ni2 +) 또는 DGS-NTA(Co2 +))을 60:36:4의 몰비로 포함한다. 바람직한 실시 형태에서, HIV Env 삼량체 단백질은 예를 들어 리포좀 표면 내에 통합된 말레이미드 작용기를 통하여 리포좀 표면에 공유적으로 커플링된다. 이의 특정한 비제한적 예시적 실시 형태에서, 리포좀은 DSPC, 콜레스테롤, 및 1,2-디팔미토일-sn-글리세로-3-포스포에탄올아민-N-[4-(p-말레이미도메틸)시클로헥산-카르복스아미드] 지질을 54:30:16의 몰비로 포함한다. HIV Env 단백질은 이것에 예를 들어 HIV Env 단백질에서의 부가된 C-말단 시스테인을 통하여 커플링될 수 있다. 공유적으로 커플링된 변이체는 더 안정하며, 높은 항원 특이적 IgG 역가를 이끌어 내며, Env 삼량체의 항원적으로 덜 관련있는 “하부”의 에피토프는 차폐된다. 리포좀에 커플링된 HIV Env 삼량체의 제조 방법과, 이의 특성화는 공지되어 있으며, 예를 들어 본원에 참고로 포함된 문헌[Bale et al, 2017]에 개시되었다. 또한 본 발명은 리포좀에 융합되고/되거나 리포좀 상에서 디스플레이되는 본 발명의 HIV Env 단백질을 제공한다.
특정 실시 형태에서, 본 발명의 HIV Env 단백질은 자가-조립 입자에 융합되거나, 나노입자 상에서 디스플레이된다. 항원 나노입자는 다수의 카피의 항원, 예를 들어 본 발명의 HIV Env 단백질을 제시하는 폴리펩티드들의 조립체이며, 이는 다수의 결합 부위를 생성하고 (친화력), 개선된 항원 안정성 및 면역원성을 제공할 수 있다. 백신에서 사용하기 위한 자가-조립 단백질 나노입자의 제조 및 사용은 당업자에게 잘 알려져 있으며, 예를 들어 문헌[Zhao et al, 2014], 문헌[Lσpez-Sagaseta et al, 2016]을 참조한다. 비제한적 예로서, 자가-조립 나노입자는 페리틴, 박테리오페리틴, 또는 DPS를 기반으로 할 수 있다. 표면 상에서 단백질을 디스플레이하는 DPS 나노입자는 예를 들어 국제 공개 제2011/082087호에 기술되어 있다. 그러한 입자 상의 삼량체성 HIV-1 항원의 설명은 예를 들어 문헌[He et al, 2016]에 기술되어 있다. 다른 자가-조립 단백질 나노입자와, 이의 제조는 예를 들어 본원에 참고로 포함된 국제 공개 제2014/124301호 및 미국 특허 출원 공개 제2016/0122392호에 개시되어 있다. 또한 본 발명은 자가-조립 나노입자에 융합되고/되거나 자가-조립 나노입자 상에서 디스플레이되는 본 발명의 HIV Env 단백질을 제공한다. 또한 본 발명은 본 발명에 따른 VLP, 리포좀, 또는 자가-조립 나노입자를 포함하는 조성물을 제공한다.
특정 실시 형태에서, 아쥬반트가 본 발명의 조성물에 포함되거나 본 발명의 조성물과 함께 공동투여된다. 아쥬반트의 사용은 선택적이며, 이는 조성물이 백신접종 목적에 사용될 때 면역 반응을 추가로 향상시킬 수 있다. 본 발명에 따른 조성물에 포함시키거나 공동투여하기에 적합한 아쥬반트는 바람직하게는 사람에 있어서 잠재적으로 안전하고, 내용성이 좋고, 효과적인 것이어야 한다. 그러한 아쥬반트는 당업자에게 잘 알려져 있으며, 비제한적 예는 QS-21, Detox-PC, MPL-SE, MoGM-CSF, TiterMax-G, CRL- 1005, GERBU, TERamide, PSC97B, 아쥬머 (Adjumer), PG-026, GSK-I, GcMAF, B-알레틴 (alethine), MPC-026, 아쥬박스 (Adjuvax), CpG ODN, 베타펙틴 (Betafectin), 알루미늄 염, 예컨대 알루미늄 포스페이트 (예를 들어 아쥬포스 (AdjuPhos)) 또는 알루미늄 히드록시드, 및 MF59를 포함한다.
본 발명의 다른 양태는 서열 번호 2 또는 서열 번호 4의 아미노산 서열 (이는 각각 HIV 엔벨로프 콘센서스 클레이드 C 및 콘센서스 클레이드 B 서열을 나타냄)과 적어도 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 아미노산 서열을 포함하는 재조합 HIV 엔벨로프 단백질에 관한 것이다. 이러한 콘센서스 서열은 천연 발생 서열에서 전혀 발견되지 않았으며, 따라서 신규한 HIV 엔벨로프 단백질인 것으로 믿어진다. 서열 번호 2 또는 서열 번호 4의 아미노산 서열과 적어도 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 아미노산 서열을 포함하는 재조합 HIV 엔벨로프 단백질은 선택적으로, 소위 SOSIP 돌연변이 및/또는 푸린 절단 부위에서의 돌연변이, 예를 들어 서열 번호 3으로 나타낸 서열, 또는 위치 558 및/또는 위치 556에서 Pro을 추가로 포함하는 서열 번호 3의 서열; 및 서열 번호 5의 서열, 또는 위치 558 및/또는 위치 556에서 Pro을 추가로 포함하는 서열 번호 5의 서열에서의 돌연변이를 추가로 포함한다. 이러한 서열들에 있어서 동일성 %를 결정할 때, 돌연변이된 푸린 절단 부위에서의 아미노산 및 위치 501, 605, 559, 556 및 558에서의 아미노산은 바람직하게는 고려되지 않는다. 놀랍게도, 그러한 단백질은 고수준으로 발현되며, 고수준의 안정성 및 삼량체 형성성을 갖는다는 것이 밝혀졌다. 특정 실시 형태에서 그러한 HIV Env 단백질은 백본 단백질로 사용될 수 있으며, 여기서, 상기에 설명된 돌연변이는 본 발명의 분자를 수득하도록 만들어질 수 있다. 이러한 서열을 코딩하는 단리된 핵산 분자, 프로모터에 작동가능하게 연결된 이러한 서열을 포함하는 벡터, 및 이 단백질, 단리된 핵산 분자, 또는 벡터를 포함하는 조성물이 또한 본 발명에 의해 고려된다.
실시 형태
실시 형태 1은 하기로 이루어진 군으로부터 선택되는 표시된 위치들 중 적어도 2개의 위치에서의 표시된 아미노산 잔기를 갖는 HIV Env 단백질의 아미노산 서열을 포함하는 재조합 HIV Env 단백질이다:
(i) 위치 651에서 Phe, Leu, Met, 또는 Trp, 바람직하게는 Phe;
(ii) 위치 655에서 Phe, Ile, Met, 또는 Trp, 바람직하게는 Ile;
(iii) 위치 535에서 Asn 또는 Gln, 바람직하게는 Asn;
(iv) 위치 589에서 Val, Ile 또는 Ala, 바람직하게는 Val 또는 Ile;
(v) 위치 573에서 Phe 또는 Trp, 바람직하게는 Phe;
(vi) 위치 204에서 Ile; 및
(vii) 위치 647에서 Phe, Met, 또는 Ile, 바람직하게는 Phe
(여기서, 위치의 넘버링은 HIV-1 단리체 HXB2의 gp160에서의 넘버링에 따름).
실시 형태 2는 HIV Env 단백질의 아미노산 서열 및 하기로 이루어진 군으로부터 선택되는 표시된 위치 중 적어도 하나에서의 표시된 아미노산 잔기에 의한 아미노산 치환을 포함하는 재조합 HIV Env 단백질이다:
(i) 위치 651에서 Phe, Leu, Met, 또는 Trp, 바람직하게는 Phe;
(ii) 위치 655에서 Phe, Ile, Met, 또는 Trp, 바람직하게는 Ile;
(iii) 위치 535에서 Asn 또는 Gln, 바람직하게는 Asn;
(iv) 위치 589에서 Val, Ile 또는 Ala, 바람직하게는 Val 또는 Ile;
(v) 위치 573에서 Phe 또는 Trp, 바람직하게는 Phe;
(vi) 위치 204에서 Ile; 및
(vii) 위치 647에서 Phe, Met, 또는 Ile, 바람직하게는 Phe
(여기서, HIV Env 단백질은
(1) 예를 들어 (서열 번호 2, 3, 4 또는 5)의 아미노산 서열을 포함하는, 예를 들어 클레이드 C 또는 클레이드 B 유래의 콘센서스 서열을 갖는 HIV Env 단백질; 또는
(2) 합성 HIV Env 단백질 (예를 들어 (a) 서열 번호 6의 아미노산 서열; (b) 위치 166에서 Glu의 Arg로의 돌연변이를 갖는 서열 번호 6의 아미노산 서열; (c) 서열 번호 7의 아미노산 서열; 또는 (d) 서열 번호 8 또는 서열 번호 9의 아미노산 서열을 포함함) (여기서, (a), (b) 또는 (d)는 선택적으로, 추가 SOSIP (위치 501 및 605에서의 Cys 및 위치 559에서의 Pro) 및/또는 푸린 절단 부위 돌연변이 (예를 들어, 아미노산 508~511을 대체하는 서열 번호 10)를 가질 수 있음); 또는
(3) 적어도 100개, 바람직하게는 적어도 1000개, 바람직하게는 적어도 10000개의 야생형 HIV Env 서열들의 컬렉션에서의 HIV Env 서열의 7.5% 미만, 바람직하게는 2% 미만의 빈도로 상응하는 위치에 존재하는 아미노산 잔기에서의 적어도 하나의 복구 돌연변이를 포함하는, 바람직하게는 클레이드 C의 야생형 HIV Env 단백질 (여기서, 복구 돌연변이는 상기 컬렉션에서의 HIV Env 서열의 적어도 10%의 빈도로 상응하는 위치에 존재하는 아미노산 잔기에 의한 치환이며, 바람직하게는 복구 돌연변이는 상기 컬렉션에서 가장 빈번하게 상응하는 위치에 존재하는 아미노산 잔기에 의한 치환임)로 이루어진 군으로부터 선택되며;
위치의 넘버링은 HIV-1 단리체 HXB2의 gp160에서의 넘버링에 따름).
실시 형태 3은 HIV Env 단백질의 아미노산 서열 및 하기로 이루어진 군으로부터 선택되는 표시된 위치 중 적어도 하나에서의 표시된 아미노산 잔기에 의한 아미노산 치환을 포함하는 재조합 HIV Env 단백질이다:
(i) 위치 651에서 Phe, Leu, Met, 또는 Trp, 바람직하게는 Phe;
(ii) 위치 655에서 Phe, Ile, Met, 또는 Trp, 바람직하게는 Ile;
(iii) 위치 535에서 Asn 또는 Gln, 바람직하게는 Asn;
(iv) 위치 589에서 Val, Ile 또는 Ala, 바람직하게는 Val 또는 Ile;
(v) 위치 573에서 Phe 또는 Trp, 바람직하게는 Phe;
(vi) 위치 204에서 Ile; 및
(vii) 위치 647에서 Phe, Met, 또는 Ile, 바람직하게는 Phe
(여기서, HIV Env 단백질은
(a) 위치 501 및 605에서의 Cys;
(b) 위치 559에서 Pro;
(c) 위치 501 및 605에서 Cys 및 위치 559에서 Pro로 이루어진 군으로부터 선택되는 적어도 하나의 돌연변이를 포함하는 SOSIP 돌연변이 HIV Env 단백질이며;
위치의 넘버링은 HIV-1 단리체 HXB2의 gp160에서의 넘버링에 따름).
실시 형태 4는 (i)~(vii)로 이루어진 군으로부터 선택되는 표시된 위치들 중 적어도 2개의 위치에서 표시된 아미노산 잔기를 포함하는, 실시 형태 2의 재조합 HIV Env 단백질이다.
실시 형태 5는 (i)~(vii)로 이루어진 군으로부터 선택되는 표시된 위치들 중 적어도 2개의 위치에서 표시된 아미노산 잔기를 포함하는, 실시 형태 3의 재조합 HIV Env 단백질이다.
실시 형태 6은 위치 501 및 605에서 Cys 또는 위치 559에서 Pro, 바람직하게는 위치 501 및 605에서 Cys 및 위치 559에서 Pro을 추가로 포함하는, 실시 형태 1, 2 및 4 중 임의의 것의 재조합 HIV Env 단백질이다.
실시 형태 7은 (i)~(vii)로 이루어진 군으로부터 선택되는 표시된 위치들 중 적어도 3개의 위치에서 표시된 아미노산 잔기를 포함하는, 실시 형태 1 내지 6 중 임의의 것의 재조합 HIV Env 단백질이다.
실시 형태 8은 (i)~(vii)로 이루어진 군으로부터 선택되는 표시된 위치들 중 적어도 4개의 위치에서 표시된 아미노산 잔기를 포함하는, 실시 형태 1 내지 6 중 임의의 것의 재조합 HIV Env 단백질이다.
실시 형태 9는 (i)~(vii)로 이루어진 군으로부터 선택되는 표시된 위치들 중 적어도 5개의 위치에서 표시된 아미노산 잔기를 포함하는, 실시 형태 1 내지 6 중 임의의 것의 재조합 HIV Env 단백질이다.
실시 형태 10은 (i)~(vii)로 이루어진 군으로부터 선택되는 표시된 위치들 중 적어도 6개의 위치에서 표시된 아미노산 잔기를 포함하는, 실시 형태 1 내지 6 중 임의의 것의 재조합 HIV Env 단백질이다.
실시 형태 11은 (i)~(vii)로 이루어진 군으로부터 선택되는 표시된 위치들 중 적어도 7개의 위치에서 표시된 아미노산 잔기를 포함하는, 실시 형태 1 내지 6 중 임의의 것의 재조합 HIV Env 단백질이다.
실시 형태 12는 상기 적어도 2개의 표시된 위치 및 잔기가 하기로 이루어진 군으로부터 선택되는 조합인, 실시 형태 1, 4 및 5 중 임의의 것의 재조합 HIV Env 단백질이다: 651F, 655I; 651F, 535N; 651F, 589V; 651F, 589I; 651F, 573F; 651F, 204I; 651F, 647F; 655I, 535N; 655I, 589V; 655I, 589I; 655I, 573F; 655I, 204I; 655I, 647F; 535N, 589V; 535N, 589I; 535N, 573F; 535N, 204I; 535N, 647F ; 589V, 573F; 589V, 204I; 589V, 647F; 589I, 573F; 589I, 204I; 589I, 647F; 573F, 204I; 573F, 647F; 및 204I, 647F.
실시 형태 13은 상기 적어도 3개의 표시된 위치 및 잔기가 하기로 이루어진 군으로부터 선택되는 조합인, 실시 형태 7의 재조합 HIV Env 단백질이다: 651F, 655I, 535N; 651F, 589V, 535N; 651F, 589I, 535N; 651F, 573F, 535N; 651F, 204I, 535N; 651F, 647F, 535N; 655I, 589V, 535N; 655I, 589I, 535N; 655I, 573F, 535N; 655I, 204I, 535N; 655I, 647F, 535N; 589V, 573F, 535N; 589V, 204I, 535N; 589V, 647F, 535N; 589I, 573F, 535N; 589I, 204I, 535N; 589I, 647F, 535N; 573F, 204I, 535N; 573F, 647F, 535N; 204I, 647F, 535N; 651F, 655I, 589V; 651F, 573F, 589V; 651F, 204I, 589V; 651F, 647F, 589V; 655I, 573F, 589V; 655I, 204I, 589V; 655I, 647F, 589V; 573F, 204I, 589V; 573F, 647F, 589V; 204I, 647F, 589V; 651F, 655I, 589I; 651F, 573F, 589I; 651F, 204I, 589I; 651F, 647F, 589I; 655I, 573F, 589I; 655I, 204I, 589I; 655I, 647F, 589I; 573F, 204I, 589I; 573F, 647F, 589I; 204I, 647F, 589I; 651F, 655I, 573F; 651F, 204I, 573F; 651F, 647F, 573F; 655I, 204I, 573F; 655I, 647F, 573F; 204I, 647F, 573F; 651F, 655I, 204I; 651F, 647F, 204I; 655I, 647F, 204I; 651F, 655I, 647F; 655I, 651F, 647F; 655I, 651F, 535N; 655I, 589V, 573F; 및 655I, 589V, 204I.
실시 형태 14는 상기 적어도 4개의 표시된 위치 및 잔기가 하기로 이루어진 군으로부터 선택되는 조합인, 실시 형태 8의 재조합 HIV Env 단백질이다: 651F, 655I, 535N, 589V; 651F, 655I, 535N, 573F; 651F, 655I, 589V, 573F; 651F, 535N, 589V, 573F; 655I, 535N, 589V, 573F; 651F, 655I, 535N, 204I; 651F, 655I, 589V, 204I; 651F, 535N, 589V, 204I; 655I, 535N, 589V, 204I; 651F, 655I, 573F, 204I; 651F, 535N, 573F, 204I; 655I, 535N, 573F, 204I; 651F, 589V, 573F, 204I; 655I, 589V, 573F, 204I; 535N, 589V, 573F, 204I; 651F, 655I, 535N, 647F; 651F, 655I, 589V, 647F; 651F, 535N, 589V, 647F; 655I, 535N, 589V, 647F; 651F, 655I, 573F, 647F; 651F, 535N, 573F, 647F; 655I, 535N, 573F, 647F; 651F, 589V, 573F, 647F; 655I, 589V, 573F, 647F; 535N, 589V, 573F, 647F; 651F, 655I, 204I, 647F; 651F, 535N, 204I, 647F; 655I, 535N, 204I, 647F; 651F, 589V, 204I, 647F; 655I, 589V, 204I, 647F; 535N, 589V, 204I, 647F; 651F, 573F, 204I, 647F; 655I, 573F, 204I, 647F; 535N, 573F, 204I, 647F; 및 589V, 573F, 204I, 647F.
실시 형태 15는 상기 적어도 5개의 표시된 위치 및 잔기가 하기로 이루어진 군으로부터 선택되는 조합인, 실시 형태 9의 재조합 HIV Env 단백질이다: 651F, 655I, 535N, 589V, 573F; 651F, 655I, 535N, 589V, 204I; 651F, 655I, 535N, 573F, 204I; 651F, 655I, 589V, 573F, 204I; 651F, 535N, 589V, 573F, 204I; 655I, 535N, 589V, 573F, 204I; 651F, 655I, 535N, 589V, 647F; 651F, 655I, 535N, 573F, 647F; 651F, 655I, 589V, 573F, 647F; 651F, 535N, 589V, 573F, 647F; 655I, 535N, 589V, 573F, 647F; 651F, 655I, 535N, 204I, 647F; 651F, 655I, 589V, 204I, 647F; 651F, 535N, 589V, 204I, 647F; 655I, 535N, 589V, 204I, 647F; 651F, 655I, 573F, 204I, 647F; 651F, 535N, 573F, 204I, 647F; 655I, 535N, 573F, 204I, 647F; 651F, 589V, 573F, 204I, 647F; 655I, 589V, 573F, 204I, 647F; 및 535N, 589V, 573F, 204I, 647F.
실시 형태 16은 상기 적어도 6개의 표시된 위치 및 잔기가 하기로 이루어진 군으로부터 선택되는 조합인, 실시 형태 10의 재조합 HIV Env 단백질이다: 651F, 655I, 535N, 589V, 573F, 204I; 651F, 655I, 535N, 589V, 573F, 647F; 651F, 655I, 535N, 589V, 204I, 647F; 651F, 655I, 535N, 573F, 204I, 647F; 651F, 655I, 589V, 573F, 204I, 647F; 651F, 535N, 589V, 573F, 204I, 647F; 및 655I, 535N, 589V, 573F, 204I, 647F.
실시 형태 17은 하기로 이루어진 군으로부터 선택되는 표시된 위치들 중 적어도 하나의 위치에서의 표시된 아미노산 잔기에 의한 아미노산 치환을 추가로 포함하는, 실시 형태 1 내지 16 중 임의의 것의 재조합 HIV Env 단백질이다:
(viii) 위치 588에서 Gln, Glu, Ile, Met, Val, Trp, 또는 Phe, 바람직하게는 Gln 또는 Glu;
(ix) 위치 64에서 Lys 또는 위치 66에서 Arg 또는 위치 64에서 Lys 및 위치 66에서 Arg;
(x) 위치 316에서 Trp;
(xi) 위치 201 및 433 둘 다에서 Cys;
(xii) 위치 556 또는 558에서, 또는 위치 556 및 558 둘 다에서 Pro; 및
(xiii) 7~10개의 아미노산을 갖는 루프, 바람직하게는 8개 아미노산의 루프, 예를 들어 (서열 번호 12~17) 중 어느 하나로부터 선택되는 서열을 갖는 루프에 의한 아미노산 위치 548~568에서의 루프 (HR1-루프)의 대체;
(xiv) 위치 568에서 Gly, 또는 위치 569에서 Gly, 또는 위치 636에서 Gly, 또는 위치 568 및 636 둘 다에서 Gly, 또는 위치 569 및 636 둘 다에서 Gly; 및/또는
(xv) 위치 302에서 Tyr, 또는 위치 519에서 Arg, 또는 위치 520에서 Arg, 또는 위치 302에서 Tyr 및 위치 519에서 Arg, 또는 위치 302에서 Tyr 및 위치 520에서 Arg, 또는 위치 302에서 Tyr 및 위치 519 및 520 둘 다에서 Arg
(여기서, 위치의 넘버링은 HIV-1 단리체 HXB2의 gp160에서의 넘버링에 따름).
실시 형태 18은 HIV Env 단백질의 푸린 절단 서열에서의 돌연변이를 추가로 포함하는 실시 형태 1 내지 17 중 임의의 것의 재조합 HIV Env 단백질이다.
실시 형태 19는 푸린 절단 부위에서의 돌연변이가 RRRRRR (서열 번호 10)에 의한 위치 508~511에서의 대체인, 실시 형태 18의 재조합 HIV Env 단백질이다.
실시 형태 20은 gp140 또는 gp160인, 실시 형태 1 내지 19 중 임의의 것의 재조합 HIV Env 단백질이다.
실시 형태 21은, (i)~(vii)로 이루어진 군으로부터 선택되는 표시된 위치에서의 표시된 아미노산 잔기 중 상기 하나 이상의 잔기를 갖지 않는 HIV Env 단백질과 비교하여 개선된 삼량체 형성 백분율 및 개선된 삼량체 수득량 중 적어도 하나를 갖는, 실시 형태 1 내지 20 중 임의의 것의 재조합 HIV Env 단백질이다.
실시 형태 22는 삼량체 형성이 다중각 광 산란을 이용한 크기 배제 크로마토그래피 (SEC-MALS)에 의해 측정되는, 실시 형태 21의 재조합 HIV Env 단백질.
실시 형태 23은 위치 658에서 Val, Ile, Phe, Met, Ala, 또는 Leu, 바람직하게는 Val 또는 Ile, 가장 바람직하게는 Val으로부터 선택되는 아미노산 잔기를 추가로 포함하는, 실시 형태 1 내지 22 중 임의의 것의 재조합 HIV Env 단백질이다.
실시 형태 24는 하기로 이루어진 군으로부터 선택되는 아미노산의 조합을 포함하는, 실시 형태 1 내지 23 중 임의의 것의 재조합 HIV Env 단백질이다:
(a) 655I, 589V, 573F, 651F, 588E, 535N, 204I;
(b) 556P, 655I, 535N, 573F, 589V, 204I, 588Q;
(c) 204I, 535N, 556P, 588E, 589V, 651F, 655I;
(d) 535N, 556P, 589V, 651F, 655I; 및
(e) 535N, 556P, 588E, 589V, 651F, 655I.
실시 형태 25는 서열 번호 3, 5, 20, 22, 24, 26, 27, 28, 29, 30, 31, 또는 32의 아미노산 서열 중 어느 하나와 적어도 95%, 96%, 97%, 98%, 99% 동일한, 바람직하게는 서열 번호 20, 22, 24, 26, 27, 28, 29, 30, 31, 또는 32의 아미노산 서열 중 어느 하나와 적어도 98% 동일한 아미노산 서열을 포함하는, 실시 형태 1 내지 24 중 임의의 것의 재조합 HIV Env 단백질이다.
실시 형태 26은 실시 형태 1 내지 25 중 임의의 것의 3개의 재조합 HIV Env 단백질의 비공유적 올리고머를 포함하는 삼량체성 복합체이다.
실시 형태 27은 실시 형태 1 내지 25 중 어느 하나의 재조합 HIV Env 단백질 또는 실시 형태 26의 삼량체성 복합체를 디스플레이하는 입자, 예를 들어 리포좀 또는 나노입자, 예를 들어 자가-조립 나노입자이다.
실시 형태 28은 실시 형태 1 내지 25 중 임의의 것의 재조합 HIV Env 단백질을 코딩하는 단리된 핵산 분자이다.
실시 형태 29는 프로모터에 작동가능하게 연결된 실시 형태 28의 단리된 핵산 분자를 포함하는 벡터이다.
실시 형태 30은 아데노바이러스 벡터인 실시 형태 29의 벡터이다.
실시 형태 31은 실시 형태 28의 단리된 핵산 분자 또는 실시 형태 29 또는 30의 벡터를 포함하는 숙주 세포이다.
실시 형태 32는 실시 형태 31의 숙주 세포를, 재조합 HIV Env 단백질의 생성에 적합한 조건 하에 성장시키는 단계를 포함하는 재조합 HIV Env 단백질의 생성 방법이다.
실시 형태 33은 프로모터에 작동가능하게 연결된 실시 형태 28의 단리된 핵산을 포함하는 발현 벡터를 수득하는 단계; 세포를 상기 발현 벡터로 형질감염시키는 단계; 형질감염된 세포를 재조합 HIV Env 단백질의 발현에 적합한 조건 하에 성장시키는 단계; 및 재조합 HIV Env 단백질을 안정화된 삼량체성 복합체의 형성을 가능케 하는 조건 하에 정제하는 단계를 포함하는 재조합 HIV Env 단백질의 생성 방법이다.
실시 형태 34는 (i)~(vii)로 이루어진 군으로부터 선택되는 위치에서의 표시된 아미노산 잔기를 생성하는 적어도 하나의 아미노산 치환을 백본 HIV 엔벨로프 단백질 서열 내로 도입하는 단계를 포함하는, 실시 형태 1 내지 25 중 어느 하나에 따른 재조합 HIV Env 단백질의 생성 방법이다.
실시 형태 35는 아미노산 치환을 코딩하는 뉴클레오티드 서열을 백본 HIV 엔벨로프 단백질 서열을 코딩하는 핵산 내로 도입하는, 실시 형태 34에 따른 방법이다.
실시 형태 36은 백본 HIV 엔벨로프 단백질 서열이 하기로 이루어진 군으로부터 선택되는, 실시 형태 34 또는 35의 방법이다: 서열 번호 2; 서열 번호 3; 서열 번호 4; 서열 번호 5; 서열 번호 6; 서열 번호 7; 서열 번호 8; 서열 번호 9; 위치 166에서 Glu의 Arg로의 돌연변이를 갖는 서열 번호 6; 위치 501 및 605에서 Cys 및 위치 559에서 Pro을 갖고/갖거나 아미노산 508~511이 대체된 서열 번호 10의 서열을 갖는 서열 번호 6; 위치 166에서 Glu의 Arg로의 돌연변이를 갖고, 추가로 위치 501 및 605에서 Cys 및 위치 559에서 Pro을 갖고/갖거나 아미노산 508~511을 대체하는 서열 번호 10의 서열을 갖는 서열 번호 6; 위치 501 및 605에서 Cys 및 위치 559에서 Pro을 갖고/갖거나 아미노산 508~511을 대체하는 서열 번호 10의 서열을 갖는 서열 번호 8; 위치 501 및 605에서 Cys 및 위치 559에서 Pro을 갖고/갖거나 아미노산 508~511을 대체하는 서열 번호 10의 서열을 갖는 서열 번호 9; 및 적어도 다음의 (a), (b) 또는 (c), 바람직하게는 다음의 (a), (b) 및 (c) 중 적어도 둘, 가장 바람직하게는 다음의 (a), (b) 및 (c)로 이어지는 돌연변이를 갖는 야생형 HIV Env 단백질:
(a) 위치 501 및 506에서 Cys 및 위치 559에서 Pro,
(b) 아미노산 508~511을 대체하는 서열 번호 10의 서열을 갖는 것, 및/또는
(c) 적어도 100개, 바람직하게는 적어도 1000개, 바람직하게는 적어도 10000개의 야생형 HIV Env 서열들의 컬렉션에서의 HIV Env 서열의 7.5% 미만, 바람직하게는 2% 미만의 빈도로 상응하는 위치에 존재하는 아미노산 잔기에서의 적어도 하나의 복구 돌연변이 (여기서, 복구 돌연변이는 상기 컬렉션에서의 HIV Env 서열의 적어도 10%의 빈도로 상응하는 위치에 존재하는 아미노산 잔기에 의한 치환이며, 바람직하게는 복구 돌연변이는 상기 컬렉션에서 가장 빈번하게 상응하는 위치에 존재하는 아미노산 잔기에 의한 치환임).
실시 형태 37은 실시 형태 1 내지 25 중 임의의 것의 재조합 HIV Env 단백질, 실시 형태 26의 삼량체성 복합체, 실시 형태 27의 입자, 실시 형태 28의 단리된 핵산 분자, 실시 형태 29 또는 30의 벡터, 또는 실시 형태 31의 숙주 세포, 및 제약상 허용가능한 담체를 포함하는 조성물이다.
실시 형태 38은 아쥬반트를 추가로 포함하는 실시 형태 37의 조성물이다.
실시 형태 39는 재조합 HIV Env 단백질, 삼량체성 복합체, 입자, 단리된 핵산, 벡터, 또는 숙주 세포를 하나 이상의 제약상 허용가능한 담체와 혼합하는 단계를 포함하는 실시 형태 37의 조성물의 생성 방법이다.
실시 형태 40은 대상체에게 실시 형태 1 내지 25 중 어느 하나의 재조합 HIV 엔벨로프 단백질, 실시 형태 26의 삼량체성 복합체, 실시 형태 27의 입자, 또는 실시 형태 29 또는 30의 벡터를 포함하는 조성물을 투여하는 단계를 포함하는 HIV 감염에 대한 대상체의 백신접종 방법이다.
실시 형태 41은 필요로 하는 대상체에서의 HIV 감염에 대한 면역 반응의 생성 방법으로서, 이는 대상체에게 실시 형태 1 내지 25 중 어느 하나의 재조합 HIV 엔벨로프 단백질, 실시 형태 26의 삼량체성 복합체, 실시 형태 27의 입자, 또는 실시 형태 29 또는 30의 벡터를 포함하는 조성물을 투여하는 단계를 포함한다.
실시 형태 42는 서열 번호 2의 아미노산 서열, 또는 이와 적어도 95% 동일한 서열을 포함하는 재조합 HIV Env 단백질이다.
실시 형태 43은 서열 번호 3의 아미노산 서열, 또는 이와 적어도 95% 동일한 서열을 포함하는 재조합 HIV Env 단백질이다.
실시 형태 44는 서열 번호 4의 아미노산 서열, 또는 이와 적어도 95% 동일한 서열을 포함하는 재조합 HIV Env 단백질이다.
실시 형태 45는 서열 번호 5의 아미노산 서열, 또는 이와 적어도 95% 동일한 서열을 포함하는 재조합 HIV Env 단백질이다.
실시 형태 46은 실시 형태 42 내지 45 중 임의의 것의 재조합 HIV Env 단백질을 코딩하는 단리된 핵산 분자이다.
실시 형태 47은 프로모터에 작동가능하게 연결된 실시 형태 46의 단리된 핵산 분자를 포함하는 벡터이다.
실시 형태 48은 아데노바이러스 벡터인 실시 형태 47의 벡터이다.
실시 형태 49는 실시 형태 46의 단리된 핵산 분자 또는 실시 형태 47 또는 48의 벡터를 포함하는 숙주 세포이다.
실시 형태 50은 실시 형태 42 내지 25 중 임의의 것의 재조합 HIV Env 단백질, 실시 형태 46의 단리된 핵산 분자, 실시 형태 47 또는 48의 벡터, 또는 실시 형태 49의 숙주 세포, 및 제약상 허용가능한 담체를 포함하는 조성물이다.
실시 형태 51은 모 HIV Env 단백질의 삼량체 백분율 및/또는 삼량체 수득량 (폴딩 및 안정성을 나타냄)을 개선시키는 방법으로서, 본 방법은 모 HIV Env 단백질 내에 적어도 하나의 복구 돌연변이, 바람직하게는 적어도 3개의 복구 돌연변이를 도입함으로써 모 HIV Env 단백질의 아미노산 서열을 복구하는 단계를 포함하고, 여기서, 복구 돌연변이는 적어도 100개, 바람직하게는 적어도 500개, 바람직하게는 적어도 1000개, 바람직하게는 적어도 10000개의 야생형 HIV Env 서열들의 컬렉션에서 HIV Env 서열의 7.5% 미만, 바람직하게는 2% 미만의 빈도로 상응하는 위치에서 발견되는 아미노산 잔기에서의 아미노산 치환이며, 상기 치환은 상기 컬렉션에서 HIV Env 서열의 적어도 10%의 빈도로 상응하는 위치에서 발견되는 아미노산 잔기에 의한 것이고, 바람직하게는 상기 치환은 상기 컬렉션에서 가장 빈번하게 상응하는 위치에서 발견되는 아미노산 잔기에 의한 것이다.
실시 형태 52는 상기 컬렉션에서 HIV Env 서열의 7.5% 미만의 빈도로 상응하는 위치에서 발견되는 모 HIV Env 단백질에서의 아미노산 잔기의 적어도 50%, 바람직하게는 적어도 80%가 복구되는, 실시 형태 51의 방법이다.
실시 형태 53은 상기 컬렉션에서 HIV Env 서열의 2% 미만의 빈도로 상응하는 위치에서 발견되는 모 HIV Env 단백질에서의 아미노산 잔기의 적어도 50%, 바람직하게는 적어도 80%가 복구되는, 실시 형태 51의 방법이다.
실시 형태 54는 모 HIV Env 단백질이 클레이드 C 유래의 것인, 실시 형태 51 내지 53 중 어느 하나의 방법이다.
실시 형태 55는 모 HIV Env 단백질이 야생형 HIV Env 단백질인, 실시 형태 51 내지 54 중 어느 하나의 방법이다.
실시 형태 56은 모 HIV Env 단백질이 하기 중 하나 이상을 포함하는, 실시 형태 51 내지 54 중 어느 하나의 방법이다:
(a) 위치 501 및 506에서 Cys 및 위치 559에서 Pro;
(b) 예를 들어 아미노산 508~511을 대체하는 서열 번호 10의 서열을 갖는, HIV Env 단백질의 푸린 절단 서열에서의 돌연변이;
(c) 위치 651에서 Phe;
(d) 위치 655에서 Ile;
(e) 위치 535에서 Asn;
(f) 위치 589에서 Val;
(g) 위치 573에서 Phe;
(h) 위치 204에서 Ile;
(i) 위치 647에서 Phe;
(j) 위치 658에서 Val;
(k) 위치 588에서 Gln 또는 Glu; 및/또는
(l) 위치 556, 558, 또는 556 및 558에서 Pro.
실시 형태 57은 실시 형태 51 내지 56 중 임의의 것의 방법에 의해 수득가능한 재조합 HIV Env 단백질이다.
실시예
실시예 1: HIV 엔벨로프 클레이드 C 및 클레이드 B 콘센서스 서열의 생성
HIV 엔벨로프 클레이드 C 콘센서스 서열
HIV 클레이드 C 엔벨로프 (Env) 단백질 콘센서스 서열을 HIV Env 단백질의 삼량체 형성에 대한 다양한 돌연변이의 영향을 연구하기 위한 백본 서열로서 개발하였다. 공지된 HIV 바이러스 단리체로부터의 3,434개의 엔벨로프 단백질 서열의 서열 정렬을 Los Alamos Database (http://www.hiv.lanl.gov/content/index)로부터 다운로드하였다. 3,434개 서열로부터, 단지 클레이드 C의 1,252개 서열을 선택하여 HIV 클레이드 C Env 단백질 콘센서스 서열을 생성하였다. 콘센서스 잔기가 정렬에 기초하여 명확하게 확인될 수 없는 위치에서는, BLAST 검색에 의해 가장 가까운 야생형 서열을 확인하기 위하여 콘센서스 서열을 이용하였다. 그 후 이들 위치에서의 콘센서스 잔기를 BLAST 검색으로부터 확인된 가장 가까운 야생형 서열에서의 아미노산으로서 선택하였다. HIV Env 클레이드 C 콘센서스 서열을 서열 번호 2로 나타낸다. BLAST를 이용할 경우 서열 번호 2에 대하여 최고의 상동성을 갖는 두 서열은 Genbank 번호 ADM30337.1 및 ADM30340.1을 갖는 서열이었으며, 이들 둘 다는 서열 번호 2에 대하여 90% 서열 동일성을 가졌다.
위치 501 및 605에서 시스테인 잔기 및 위치 559에서 프롤린 잔기를 포함하는 소위 SOSIP 돌연변이를 도입하고, 잔기 508-511에서 푸린 부위를 6개 아르기닌 잔기로 대체함으로써 푸린 절단 부위를 최적화함으로써 HIV Env 클레이드 C 콘센서스 서열을 추가로 변형하였다. 또한, 위치 295에서의 Val을 Asn (V295N)로 돌연변이시켜, 대다수의 HIV 주에 존재하며 일부 실험에서 사용된 특정 항체에의 결합을 개선할 수 있는 N-연결 글리코실화 부위를 생성하였다. 추가적으로, C-말단을 잔기 664에서 절두시켜, 가용성 HIV gp140 단백질을 코딩하는 서열을 생성하였다. 상기에 기술된 치환/변형의 모든 위치는 HIV-1 단리체 HXB2의 gp160에서의 넘버링에 대한 것이다. "ConC_SOSIP"으로 칭해지는, 생성된 HIV gp140 서열은 (서열 번호 3)으로 나타낸다. ConC_SOSIP 서열은 추가의 돌연변이, 예를 들어, 단일 및 이중 아미노산 치환이 도입되어 본 발명의 실시 형태에 따른 재조합 HIV Env 단백질을 생성하는 백본 또는 모 HIV 엔벨로프 서열로서 사용되었다.
HIV 엔벨로프 클레이드 C 콘센서스 서열
HIV Env 클레이드 C 콘센서스 서열을 생성하기 위하여 상기에 개시한 것과 유사한 절차를 이용하여 HIV Env 클레이드 B 콘센서스 서열을 생성하였다. 클레이드 B 콘센서스 서열은 공지된 클레이드 B 바이러스 단리체로부터의 1,708개 클레이드 B 엔벨로프 단백질 서열을 이용하여 생성하였다. HIV Env 클레이드 B 콘센서스 서열을 서열 번호 4로 나타낸다.
HIV Env 클레이드 B 콘센서스 서열은 소위 SOSIP 돌연변이를 도입하고, 푸린 부위를 6개 아르기닌 잔기로 대체하여 푸린 절단 부위를 최적화하고, 상기에 기술된 바와 같이 잔기 664에서 C-말단을 절두함으로써 추가로 변형시켜, 가용성 HIV gp140 클레이드 B 콘센서스 서열을 코딩하는 서열을 생성하였다. "ConB_SOSIP"로 칭해지는, 생성된 HIV gp140 Env 단백질 서열을 (서열 번호 5)로 나타낸다.
놀랍게도, 콘센서스-기반 분자가 천연 단리체를 기반으로 하는 분자에 비하여 발현 수준이 개선되었으며, 또한 삼량체화 수준을 이미 개선하였음이 밝혀졌다. 따라서, 서열 번호 2~5를 가진 분자는 이미 놀라울 정도로 유익한 특성을 갖는다.
실시예 2: 재조합 HIV Env 단백질의 발현 및 정제
재조합 HIV Env 단백질을 가용성 gp140 단백질로서 발현시키고 정제하였다. 단일 돌연변이 (아미노산 치환) 및 그 조합 (예를 들어, 이중 및 삼중 돌연변이)을 ConC_SOSIP 백본 콘센서스 서열 내로 도입하여 일련의 재조합 HIV Env 단백질 변이체를 생성하였다.
HIV gp140 Env 구축물 및 변이체의 생성 및 발현
서열 번호 3으로 나타낸 HIV 클레이드 C Env 콘센서스 서열 ConC_SOSIP를 코딩하는 DNA를 GenScript (Piscataway, NJ 08854) 또는 Gene Art (Life Technologies, 미국 캘리포니아주 칼스배드 소재)에서 합성하고 코돈-최적화시켰다. 이어서 코돈-최적화된 서열을 벡터 pcDNA2004 내로 클로닝하여 HIV 클레이드 C gp140 Env 구축물을 생성하고, 이것을 추가 돌연변이를 도입하기 위한 백본 HIV 엔벨로프 서열로서 사용하였다. pcDNA2004 HIV 클레이드 C gp140 Env 구축물에서 수행된 부위 지정 돌연변이 유발 및 폴리머라아제 연쇄 반응 (PCR)에 의해 ConC_SOSIP 백본 서열 내로 돌연변이를 도입하였다. HEK-Expi293F 세포 또는 HEK293F 세포를, 제조업자의 설명서에 따라 ConC_SOSIP 서열 또는 그 변이체를 코딩하는 pcDNA2004 벡터 90% 및 푸린 프로테아제 (푸린-pCDNA2004)를 코딩하는 pcDNA2004 벡터 10%로 일시적으로 형질감염시켰다. 형질감염된 세포를 5일 동안 37℃ 및 10% CO2에서 배양하였다. 배양 상청액을 10분 동안 1250 x g에서 회전시켰다. 그 후, 회전 상청액을 0.22 ㎛ 진공 필터를 이용하여 살균 여과하고 추가 사용할 때까지 4℃에서 보관하였다.
96웰 포맷에서의 발현을 위하여 세포를 3일 동안 37℃ 및 10% CO2에서 배양하였다. 4 uL의 Optimem (배양 배지)을 4 uL 100 ng/uL DNA 및 8 uL Expi293F 믹스 (54 uL/mL Optimem)와 혼합하고 20분 동안 인큐베이션하였다. 그 후 웰당 200 uL의 Expi293F 세포를 2.5 x 10E6개의 세포/mL로 첨가하였다. 배양 상청액을 수확하고, 300 g에서 5분 동안 회전시켜, 세포 및 세포 잔사를 제거하였다. 이후, 회전 상청액을 0.22 um 진공 필터를 사용하여 살균 여과하고, 사용할 때까지 4℃에 보관하였다.
HIV gp140 Env 단백질의 정제
pcDNA2004 벡터로부터 발현된 HIV gp140 Env 단백질을, 초기 정제를 위하여 갈란투스 니바리스 (Galantus nivalis)-렉틴 컬럼 (Vectorlabs, AL-1243)을 이용하고 후속 단계에서는 Superdex200 Increase 컬럼 (GE)을 이용하는 2단계 정제 프로토콜에 따라 정제하여 잔여 오염물질을 제거하였다. 갈란투스 니바리스-렉틴 컬럼을 이용하는 초기 단계를 위하여, 배양 상청액을 완충제 (40 mM Tris, 500 mM NaCl pH 7.5)로 희석하고 4 mL/분의 속도로 4 mL CV Tricorn 10~50 렉틴 아가로스 컬럼에 통과시켰다. 그 후, 컬럼을 4배 컬럼 부피 완충제 (40 mM Tris, 500 mM NaCl pH 7.5)로 세척하고 1.6 mL/min의 상향류 (upflow)로 4배 컬럼 부피의 40 mM Tris, 500 mM NaCl, 및 1 M 만노피라노시드 (pH 7.5)로 용출시켰으며, 이것은 엔벨로프 단백질의 용출 속도를 증가시키고 용출 부피를 감소시키기 위하여 유동 방향이 하향에서 상향으로 변경되었음을 의미한다. 용출액을 회전 농축기 (50K, Amicon Ultra, Millipore)를 이용하여 농축시켰다.
HIV gp140 Env 단백질은, 러닝 완충제로서 50 mM Tris, 150 mM NaCl pH 7.4를 이용하여 Superdex200 컬럼에서 추가로 정제하였다. 컬럼으로부터 용출된 두 번째 피크가 HIV gp140 Env 단백질을 함유하였다. 이 피크를 함유한 분획을 모았으며, 웨스턴 블롯과 SDS-PAGE 및/또는 SEC-MALS 분석을 이용할 경우 피크의 실체는 HIV gp140 Env 단백질로 확인되었다. 정제된 HIV gp140 Env 단백질의 농도는 280 nm에서의 광학 밀도 측정에 의해 결정하였으며, 정제된 HIV gp140 Env 단백질은 추가 사용할 때까지 4℃에서 보관하였다.
SDS-PAGE 및 웨스턴 블로팅 분석
발현된 HIV gp140 Env 단백질을 함유한 세포 배양 상청액 및 정제된 HIV gp140 Env 단백질 샘플을 환원 또는 비환원 조건 하에서 4~12% (w/v) Bis-Tris NuPAGE 겔, 1X MOPS (Life Technologies)에서 분석하고, iBlot 기술 (Life Technologies)을 이용하여 블로팅하였다. 모든 절차는 제조업자의 설명서에 따라 수행하였다. 순도 분석을 위하여, 겔을 Krypton Infrared Protein Stain (Thermo Scientific) 또는 SYPRO Rubi 단백질 염색제 (Bio-Rad)으로 염색하였다. 웨스턴 블로팅 분석을 위하여, 막을 항-6x-히스티딘-태그 항체 (항-His-HRP)로 탐침하였다. 겔과 블롯 막을 Odyssey 기기 (Li-Cor)에서 스캔하고, Odyssey 3.0 소프트웨어 (Li-Cor)를 이용하여 이미지를 분석하였다.
음성 염색 전자 현미경에 의한 HIV Env 삼량체 형성의 영상화
음성 염색 전자 현미경 (NS-EM)을 이용하여 ConC_SOSIP 백본 서열을 가진 엔벨로프 단백질의 삼량체를 영상화하였으며, 삼량체는 갈란투스 니바리스 렉틴, 이어서 크기 배제 크로마토그래피를 이용하여 정제하였으며, 문헌[Julien et al. 2015 (Proc. Natl. Acad. Sci. (2015) 112(38) 11947-52)]에 개시된 바와 같이 수행하였다. 삼량체 샘플을 Tris-완충 염수 (TBS), pH 7.4에서 0.01-0.5 mg/mL로 희석시키고, 사용 직전에 공기 2*10-1 mbar, 25 mA, 30 초에서 글로우 방전된 탄소-코팅 200 Cu 메쉬 격자판 (EMS CF200-Cu) 상에 부착시켰다. 그 후, 3 μL 방울의 희석 삼량체 샘플을 1분 동안 격자판에 가하고 이어서 여과지 (Whatman 번호 1 또는 4)로 블로팅시켰다. 격자판을 1분 동안 건조시킨 후, 3 μL의 2.3% 우라닐 아세테이트 (UAc)로 60초 동안 염색하였다. 시료 평면에서 4.68 Å의 픽셀 크기를 생성하는 25,000x의 배율로, 120 keV에서 작동하는 FEI Tecnai F20 전자 현미경을 이용하여 데이터를 수집하였다. Gatan BM 울트라스캔으로 이미지를 획득하였다.
(이 삼량체-농축 물질의) 이미지에서 거의 모든 입자는 잘 형성된 폐쇄 삼량체였다 (데이터는 예시되어 있지 않음).
실시예 3: 삼량체 수득량 및 삼량체 형성 백분율에 대한 재조합 HIV gp140 Env 변이체의 스크리닝
ConC_SOSIP 백본 서열에 비하여 형성된 삼량체의 백분율을 향상시키고/시키거나 삼량체 수득량을 향상시킨 돌연변이를 확인하기 위하여, 실시예 2에서 생성된 재조합 HIV Env 단백질 변이체를 삼량체 형성에 대하여 스크리닝하였다. 재조합 HIV Env 단백질에의 광범위 중화 HIV 항체 (bNAb) 및 비-bNAb 패널의 결합을 평가하기 위하여 AlphaLISA 분석법을 이용하여 삼량체 백분율 및 삼량체 수득량의 고처리 스크리닝을 수행하였다. AlphaLISA 분석법의 결과는 크기 배제 크로마토그래피 및 다중각 광 산란 (SEC-MALS)에 의해 확인하였다.
AlphaLISA® 분석법에 의한 분석
HIV gp140 Env 단백질의 총 발현 및 실시예 2에서 개시된 바와 같이 생성된 ConC_SOSIP 서열 내로 도입된 단일 아미노산 치환을 가진 200가지가 넘는 HIV gp140 변이체의 올바르게 폴딩된 천연 삼량체의 총 양을 AlphaLISA 분석법에 의해 세포 배양 상청액에서 측정하였다. 이중 및 삼중 돌연변이를 함유한 HIV gp140 변이체를 또한 테스트하였다. 임의의 추가의 돌연변이가 없는 ConC_SOSIP 서열을 가진 HIV Env 단백질을 비교를 위해 테스트하였다.
특히 하기 단클론 항체 (mAbs)를 분석에 사용하였다: mAb PGT145, mAb PGDM1400, mAb PG16, mAb PGT151, mAb 35O22, mAb PGT128, mAb PG9, mAb F105, mAb B6, mAb 447-52d, mAb 14e, 및 mAb 17b.MAb 447-52D (AB014), PG9 (AB015), 및 PG16 (AB016)을 Polymun Scientific Immunbiologische Forschung GmbH (오스크리아 클로스테르뉴베르크 소재)로부터 구매하였다. 비-중화 항체 b6은 Dennis R. Burton (The Scripps Research Institue, 미국 캘리포니아주 라 졸라 소재)으로부터 수득하였으며, 비-중화 항체 14e는 James E. Robinson (Tulane University, New Orleans, LA)로부터 수득하였다. mAbs PGT145 (PDB: 3U1S), PGDM1400 (PDB: 4RQQ), PGT151 (PDB: 4NUG), 35O22 (PDB: 4TVP), F105 (PDB: 1U6A), PGT128 (PDB: 3TYG), 및 17b (PDB: 4RQS)의 경우 공개된 서열을 코딩하는 핵산을 발현 벡터 내로 클로닝하고 HIV Env 단백질의 평가를 위해 생성하였다. mAb F105, B6, 447-52d, 14e, 및 17b를 제외하고, 분석을 위해 사용된 항체는 광범위 중화 항체 (bNAb)이다. bNAb는 다수의 HIV 바이러스 주를 중화할 수 있다. bNAb 중에서, PGT145, PGDM1400, 및 PG16은 첨부 결합자이며 삼량체 특이적이다. PGT151가 또한 삼량체 특이적이지만, gp120과 gp41의 두 프로모터의 계면에서 결합하며, 절단 의존적이다. 비-bNAb의 결합은 올바르지 않은 폴딩 또는 개방 삼량체 배좌를 나타낸다.
단백질 폴딩은 또한 CD4의 결합 후에만 노출되는, HIV 엔벨로프 단백질의 공동수용체 결합 부위에 결합하는 것으로 알려진 항체 (mAb 17b)에의 가용성 HIV gp140 Env 단백질 변이체의 결합을 측정함으로써 테스트하였다 (데이터는 예시되어 있지 않음). 구체적으로, CD4-유도된 배좌 변화를 평가하기 위하여 가용성 수용체 CD4 (sCD4)를 mAb 17과 조합하여 이용하였다. 엔벨로프 단백질에의 사전 CD4 결합 없이 HIV gp140 Env 단백질 변이체에의 mAb 17b의 결합은 부분적으로 비폴딩되거나 예비-촉발된 엔벨로프 단백질 (즉, CD4 결합의 부재 하에서 "개방" 배좌를 채택하는 불안정한 Env)을 나타낸다.
AlphaLISA 분석법을 위하여, 링커, 이어서 소르타아제 A 태그, 이어서 Flag-태그, 이어서 유연성 (G4S)7 링커를 함유하며 His-태그로 끝나는 pcDNA2004 벡터 내의 HIV gp140 Env 구축물을 제조하였다 (HIV Env 단백질의 C-말단에 위치된 태그의 서열은 서열 번호 19로 제공된다). HIV gp140 Env 구축물을 HEK-Expi293 세포에서 발현시켰으며, 세포를 3일 동안 96웰 플레이트 (200 μL/웰)에서 배양하였다. 조 상청액을 AlphaLISA 완충제 (PBS + 0.05% Tween-20 + 0.5 mg/mL BSA)에서 120배 희석시켰다. mAb 17b 기반 분석법를 위하여, 상청액을 12배 희석시켰다. 그 후, 10 μL의 각 희석액을 96웰 플레이트로 옮기고 40 μL 억셉터 비드, 도너 비드 및 상기 열거된 mAb 중 하나와 혼합하였다. 도너 비드를 mAb에 결합하는 ProtA (카탈로그 번호: AS102M, 로트 번호 1831829, Perkin Elmer)에 콘쥬게이션시켰다. 억셉터 비드를 구축물의 His-태그에 결합하는 항-His 항체 (카탈로그 번호: AL128M, Perkin Elmer)에 콘쥬게이션시켰다. 모든 형태의 엔벨로프 단백질을 포함하는 총 단백질 수득량의 정량을 위하여, His-태그의 검출을 위한 니켈-콘쥬게이션된 도너 비드 (카탈로그 번호: AS101M, Perkin Elmer)와 Flag 태그의 검출을 위한 항-Flag 항체-콘쥬게이션 도너 비드 (카탈로그 번호: AL112R, Perkin Elmer)의 조합을 이용하였다. sCD4-His와 조합된 mAb 17b를 이용하는 테스트의 경우, ProtA 도너 비드와 항-Flag 억셉터 비드의 조합을 이용하였다 (데이터는 예시되어 있지 않음). 하나의 샘플은 삼량체 형성을 검출하기 위하여 공여체 및 억셉터 비드와 혼합하였으며, 동일한 Env 변이체의 두 번째 샘플은 발현된 단백질의 총량 (즉, 총 단백질 수득량)을 측정하기 위하여 니켈-콘쥬게이션 도너 비드 및 항-Flag 콘쥬게이션 억셉터 비드와 혼합하였다.
발현된 HIV gp140 Env 단백질, mAb, 도너 비드 및 억셉터 비드를 함유한 상청액의 혼합물을 교반 없이 2시간 동안 실온에서 인큐베이션하였다. 그 후, Synergy NEO 플레이트 판독기 기기 (BioTek)로 화학발광 신호를 측정하였다. 모크 형질감염 세포로 인한 평균 배경 신호를 각 HIV gp140 Env 변이체에 대해 측정된 AlphaLISA 카운트로부터 차감하였다. 그 후, 전체 데이터 세트를 ConC_SOSIP 백본 서열 신호를 가진 HIV Env 단백질에 대해 측정된 신호로 나누어서, 테스트된 각각의 HIV gp140 Env 변이체에 대한 신호를 백본에 대하여 정규화하였다. 삼량체 특이적 mAb PGT145에의 HIV gp140 Env 변이체 각각에 있어서의 결합 데이터를 이용하여 변이체 각각에 있어서의 삼량체 형성 백분율 및 삼량체 수득량을 결정하였다. 다른 mAb에의 결합을 이용하여 bNAb 및 비-bNAb에의 HIV Env 변이체의 일반적인 결합 패턴을 평가하였다 (예시되어 있지 않음).
HIV Env 변이체 각각에 있어서의 삼량체 형성 백분율은 HIV Env 변이체, mAb PGT145, ProtA-콘쥬게이션 도너 비드 및 항-His-콘쥬게이션 억셉터 비드의 샘플 혼합물로부터 수득한 정규화된 화학발광 신호를 HIV Env 변이체, 항-His-콘쥬게이션 도너 비드 및 항-Flag-콘쥬게이션 억셉터 비드의 샘플 혼합물로부터 수득한 정규화된 화학발광 신호로 나눔으로써 계산하였다.
HIV Env 변이체 각각에 있어서의 삼량체 수득량은 임의의 추가 돌연변이가 없는 ConC_SOSIP 백본 서열을 가진 HIV Env 단백질에 있어서의 삼량체 수득량에 비하여 결정되었다. ConC_SOSIP 엔벨로프 단백질에의 mAb PGT145의 결합으로부터 수득한 정규화된 화학발광 신호를 1로 설정하고, HIV gp140 단백질의 각각에의 mAb PGT145의 결합으로부터 수득한 정규화된 화학발광 신호를 이 값에 대하여 정규화하였다.
AlphaLISA 분석법에 의한 분석의 결과 - 삼량체 백분율 및 삼량체 수득량
ConC_SOSIP 백본 서열에서 상기 표 1의 (i)~(vii) 리스트로부터의 여러 단일, 이중 및 삼중 아미노산 치환에 대한 AlphaLISA 분석에 의해 결정된 삼량체 형성 백분율을 도 2a에 나타낸다. 테스트된 단일 아미노산 치환을 함유한 약 200가지 HIV gp140 Env 변이체 중에서, 형성된 삼량체의 백분율이, 임의의 추가의 아미노산 치환이 없는 ConC_SOSIP 백본 서열에 대해 형성된 삼량체의 백분율에 비하여 적어도 25%만큼 증가한 7가지 위치의 치환이 확인되었다.
도 2a로 나타낸 결과는 삼량체 형성 백분율에서의 유의한 증가가 관찰된 7가지 바람직한 위치의 치환이 HIV-1 단리체 HXB2의 gp160에서의 넘버링에 따라 N651, K655, I535, D589, I573, A204, 및 E647을 포함함을 입증한다. 특히, 가장 향상된 삼량체 형성 백분율을 야기한 단일 아미노산 치환은 N651F, K655I (/F/W) (K655F가 향상을 야기하는 것으로 보이는 하나의 실험도 있지만), I535N, D589V (/A), I573F, A204I, E647F를 포함하였다. 몇몇의 이들 돌연변이와 조합하여 테스트된 일부 돌연변이는 K588Q/E, I556P 및 A558P를 포함하였으며, 이들은 이 실험에서 본 발명의 위치에서 바람직한 아미노산 (표 1의 (i)~(vii))을 가진 돌연변이체의 삼량체 백분율을 더 향상시켰다.
이 실험에서 테스트된 모든 이중 치환은 상응하는 단일 치환보다 더 높은 삼량체 형성 백분율을 가졌으며, 테스트된 모든 삼중 치환은 상응하는 단일 및 이중 돌연변이보다 더 높은 삼량체 형성 백분율을 가졌다 (도 2a). 예상하지 못한 그리고 놀라운 이들 결과는 이들 돌연변이가 엔벨로프 단백질의 삼량체화와 관련하여 이들 실험에서 시너지를 보여줄 수 있음을 나타낸다.
향상된 삼량체 형성 백분율에 더하여, 증가된 삼량체 수득량이 또한 바람직하다. 따라서, ConC_SOSIP 백본 서열에서 단일, 이중 및 삼중 돌연변이를 함유한 HIV gp140 변이체의 삼량체 수득량을 또한 AlphaLISA 분석법에 의해 결정하였다. 결과를 도 2b에 나타낸다. 단일 돌연변이를 함유한 대부분의 HIV gp140 변이체 (예외는 I535N, D589A 및 D589I였음)는 ConC_SOSIP 엔벨로프 단백질보다 높은 삼량체 수득량을 가졌다. 그러나, 후술하는 바와 같이, I535N 돌연변이체의 보다 정확한 SEC-MALS 분석은 삼량체 수득량의 증가를 나타냈다. 더욱이, D589V과 같은, I535N과 조합된 추가의 돌연변이는 I535N 돌연변이의 부재 하에서 그 특정 추가 치환을 가진 엔벨로프 단백질에 대해 관찰된 동일한 삼량체 수득량으로 이어졌다. 이중 돌연변이를 가진 변이체의 삼량체 수득량이 또한 증가하였으며 이때 단일 돌연변이 변이체의 각각은 ConC_SOSIP 엔벨로프 단백질보다 더 높은 삼량체 수득량을 가졌다 (도 2b).
(문헌[De Taeye et al., supra])에 의해 개시된 E64K, T316W 이중 치환, 및 (문헌[Kwon et al., supra])에 의해 개시된 디술피드 이중 치환 I204C, A433C을 비롯한, 문헌에서 이전에 개시된 ConC_SOSIP 백본에서의 이중 돌연변이를 가진 HIV gp140 변이체에 있어서의 삼량체 형성 백분율을 또한 테스트하였다. E64K, T316W 이중 치환은 ConC_SOSIP 엔벨로프 단백질보다 더 낮은 삼량체 형성 백분율, 즉 15%를 야기하였다 (데이터는 예시되어 있지 않음). 디술피드 이중 치환 I204C, A433C는 삼량체 백분율을 43%까지 증가시켰지만 (데이터는 예시되어 있지 않음), I535N/K588E, K588Q/D589V, K655I/K588E, I535N/D589V, I535N/E647F, D589V/K655I, 및 I535N/K655I와 같은, 본 명세서에 개시된 새로운 이중 치환 (도 2a)이 AlphaLISA 실험에서 훨씬 더 큰 삼량체 형성 백분율을 야기하였다.
추가의 돌연변이 (잔기 558 및/또는 556에서 프롤린)를 또한 ConC_SOSIP 백본 내로 도입하였으며, 이들 HIV gp140 Env 단백질에 대하여 삼량체 형성 백분율 및 삼량체 수득량을 측정하였다. ConC_SOSIP 백본에 이미 함유된 SOSIP 돌연변이 (즉, 위치 501 및 605에서 Cys, 및 위치 559에서 Pro)에 더하여 위치 558 또는 556에서 Pro의 단일 치환, 및 위치 556 및 558 둘 다에서 프롤린의 이중 치환은 삼량체 형성 백분율과 삼량체 수득량을 증가시켰다 (데이터는 예시되어 있지 않음). 사실상, 위치 558 및/또는 556에서 Pro 잔기를 추가로 포함하는 ConC_SOSIP 백본에서 본 발명의 새로운 아미노산 안정화 치환 하나 이상의 도입은 삼량체 형성 백분율 및/또는 삼량체 수득량을 추가로 향상시킨다 (예를 들어 도 2a, 예를 들어 A558P/I535N, K655I/L556P 및 A558P 돌연변이를 포함하는 몇몇 삼중 돌연변이체).
다른 bNAb 및 비-bNAb에의 HIV gp140 Env 변이체의 결합 데이터는 도 2a 및 도 2b에 열거된 것과 같은, 삼량체 수득량과 삼량체 형성 백분율이 증가된, 테스트된 단일, 이중 및 삼중 돌연변이의 대부분이 또한 ConC_SOSIP 백본 서열을 가진 HIV 엔벨로프 단백질에 있어서 관찰된 bNAb 및 비-bNAb에의 결합의 양에 비하여 증가된 bNAb에의 결합 및 동일하거나 감소된 비-bNAb에의 결합을 가졌음을 입증하였다 (데이터는 예시되어 있지 않음). 백신 개발을 위하여, bNAb에의 증가된 결합 및 비-bNAb에의 감소된 결합이 바람직하다. 따라서, 데이터는 상기 표 1에 나타낸 위치 (i)~(vii)에서의 아미노산 치환을 포함하는 HIV 엔벨로프 단백질이 광범위 중화 및 비-광범위 중화 항체와 관련하여 바람직한 특성을 가짐을 입증한다.
SEC-MALS 분석
AlphaLISA 분석법을 이용하여 스크리닝된 HIV gp140 변이체에 있어서의 삼량체 수득량 및 삼량체 형성 백분율을 확인하기 위하여 SEC-MALS 분석을 또한 이용하였다. HIV gp140 변이체를 30 mL 규모 배양에서 발현시키고 무세포 상청액을 Polyprep 중력 유동 컬럼 (Biorad 카탈로그 번호 731-1550) 내의 200 ㎕ 갈란투스 니바리스 렉틴 비드 (Vectorlab 카탈로그 번호 AL-1243) 상에 적용하여 정제하였다. 비드를 2 ml 결합 완충제 (40 mM Tris, 500 mM NaCl pH 7.4)로 세척하였다. 단백질을 250~500 ㎕의 40 mM Tris, 500 mM NaCl, 1 M 만노피라노시드 (pH 7.4)를 이용하여 용출하였다. 고성능 액체 크로마토그래피 시스템 (Agilent Technologies) 및 Optilab T-rEX 굴절률 검출기 (Wyatt)에 결합된 MiniDAWN TREOS 기기 (Wyatt)를 SEC-MALS 실험을 수행하기 위하여 이용하였다. 통틀어, 100 ㎕의 렉틴 용출액 또는 대략 30㎍의 단백질을 러닝 완충제 (150 mM 소듐 포스페이트, 50 mM NaCl, pH 7.0)에서 평형화된 TSK-Gel G3000SWxl 컬럼 (Tosoh Bioscience)에 1 mL/min으로 적용하였다. Astra 6 소프트웨어 패키지를 이용하여 데이터를 분석하고, 분자량 계산은 굴절률 신호로부터 유도하였다.
ConC_SOSIP 엔벨로프 단백질 및 단일 돌연변이를 함유한 HIV gp140 변이체의 SEC-MALS 크로마토그램을 도 3에 나타낸다. 일반적으로, SEC-MALS 분석으로부터 수득한 결과는 AlphaLISA 분석으로부터 수득한 결과와 비견되고 이와 일치하였다. ConC_SOSIP 엔벨로프 단백질의 크로마토그램은 4개의 주요 피크를 가지며, 약 7.3분에 용출된 두 번째 피크가 삼량체 피크이다. ConC_SOSIP 엔벨로프 단백질은 약 27% 삼량체로 결정되었다. 응집체와 단량체의 형성은 ConC_SOSIP 콘센서스 서열을 가진 HIV gp140 Env 단백질에서 일부 미스폴딩 및 불안정성이 있음을 나타낸다. 도 3으로 나타낸 크로마토그램에 의해 입증된 바와 같이, 모든 단일 치환은 ConC_SOSIP 엔벨로프 단백질에 있어서의 삼량체 피크와 비교하여 상대적으로 더 높은 삼량체 피크로 이어졌으며, 이는 삼량체 수득량이 HIV gp140 변이체 각각에 있어서 증가되었음을 나타낸다.
종합하면, 결과는 본원에서 표 1의 (i)~(vii)에서 확인된 아미노산 치환이 향상된 삼량체 형성 백분율 및/또는 향상된 삼량체 수득량을 갖는 재조합 HIV Env 단백질을 제공함을 입증한다. 특히, 확인된 돌연변이 중 둘 이상의 조합과 같은, 표 1의 (i)~(vii)에서 확인된 위치에서 다수의 치환을 갖는 HIV Env 단백질 변이체는 전형적으로 단일 돌연변이만을 갖는 HIV Env 단백질 변이체에 비하여 훨씬 더 향상된 삼량체 수득량 및/또는 삼량체 형성 백분율을 나타내며, 이는 표 1의 돌연변이 (i)~(vii)의 조합의 가능한 상승적 효과를 보여준다. 본 발명자가 알고 있는 한, 이들 아미노산 치환의 조합 중 어느 것도 자연 발생 HIV 엔벨로프 단백질 서열에서 보고되지 않았으며, 따라서 ((i)~(vii) 사이의) 모든 조합이 삼량체 안정화 돌연변이의 새로운 조합으로 생각된다. 본 발명의 재조합 HIV 엔벨로프 단백질과 같은, 삼량체 형성 백분율이 증가된 HIV 엔벨로프 단백질은, 원치 않는 비-천연 배좌로 제제 내에 존재하는 엔벨로프 단백질의 정제 및 제거가 덜 요구될 것이므로, 백신에 대해서와 같이, 제조 관점에서 유리하다. 또한, 삼량체의 증가된 총 발현 수득량은 백신 제품의 제조에 유리하다.
실시예 4: 삼량체 HIV 엔벨로프 단백질의 안정성
본 발명의 실시 형태에 따른 재조합 HIV Env 단백질의 열 안정성을 AlphaLISA 및 시차 주사 열량계 (DSC)에 의해 테스트하였다.
AlphaLISA를 이용한 열 안정성 측정
삼량체-특이적 mAb PGT145에의 결합에 기초하여 열 처리시에 본래의 삼량체의 소실을 측정함으로써 열 안정성을 테스트하였다. 조 상청액 (20 ㎕)을 1 시간 동안 60℃에서 가열하였다. 그 후 샘플을 5분 동안 최대 속도로 원심분리하여 응집체를 제거하였다. AlphaLISA 분석을 실시예 3에서 상기한 대로 수행하였다.
결과를 도 4에 나타내며, 데이터는 열 처리 후 온전하게 남아 있는 삼량체의 백분율로서 보고된다. 이 결과로부터, 테스트된 본 발명의 단일 돌연변이체 재조합 HIV gp140 Env 단백질의 대부분이 ConC_SOSIP 엔벨로프 단백질보다 더 높은 열 안정성을 가졌음을 알 수 있다. 본 명세서에서 확인된 삼량체 안정화 이중 및 삼중 치환을 가진 테스트된 HIV 엔벨로프 단백질은 또한 ConC_SOSIP 엔벨로프 단백질보다 더 높은 열 안정성을 갖는 것으로 밝혀졌다.
DSC를 이용한 열 안정성 측정
HIV gp140 Env 변이체의 융점 (Tm)을 MicroCal 모세관 DSC 시스템을 이용하여 DSC에 의해 결정하였다. 각각의 측정은 100℃/시간의 스캔 속도로 20℃의 시작 온도와 110℃의 최종 온도로 수행하였다. 0.5 mg/mL의 농도를 가진 단백질 샘플 (400 μL)을 각 측정을 위하여 사용하였다. 데이터는 Origin J. Software (MicroCal VP-분석 툴)을 이용하여 분석하였다.
DSC를 이용하여 측정한 ConC_SOSIP 엔벨로프 단백질의 융점 (Tm)은 69.8℃로 결정되었으며 용융 개시 온도는 60.1℃였다. ConC_SOSIP 엔벨로프 단백질에 대하여 측정된 Tm은 67.0℃의 Tm을 갖는 것으로 보고된 (문헌[Kwon et al, 2015]) BG505_SOSIP 엔벨로프 단백질 (소위 SOSIP 돌연변이를 갖는 BG505 바이러스 단리체의 HIV 엔벨로프 단백질)에 대한 것보다 높았다. 이것은 ConC_SOSIP 백본 서열을 가진 HIV 엔벨로프 단백질이 삼량체 안정화 돌연변이를 가진 다른 공지된 HIV 엔벨로프 서열보다 열 안정성에 관하여 더 유리한 특성을 가짐을 나타낸다.
ConC_SOSIP의 K655I 돌연변이체의 Tm은 72.3℃로 측정되었으며 용융 개시 온도는 63.7℃였으며, 이것은 ConC_SOSIP 엔벨로프 단백질의 Tm보다 훨씬 높다. ConC_SOSIP의 A558P, N651F, I535N 돌연변이체의 Tm은 77.29℃로 측정되었으며 개시 온도는 74.87℃였다. 따라서 DSC 결과는 AlphaLISA 분석법에 의해 결정된 열 안정성 결과를 확인한다.
종합하면, 결과는 본 명세서에 개시된 아미노산 치환 적어도 하나를 포함하는 HIV Env 단백질이 전형적으로 그러한 돌연변이가 없는 엔벨로프 단백질보다 높은 열 안정성을 가짐을 입증한다. 결과는 또한 모든 이중 치환 HIV Env 단백질 변이체가 ConC_SOSIP 엔벨로프 단백질보다 더 높은 열 안정성을 가졌음을 입증한다. 삼중 치환 HIV Env 단백질 변이체는 또한 ConC_SOSIP 엔벨로프 단백질보다 더 안정하였다.
실시예 5: 클레이드 B 엔벨로프 단백질 콘센서스 서열을 기반으로 한 재조합 HIV 엔벨로프 단백질 변이체
클레이드 B 콘센서스 서열 ConB_SOSIP (서열 번호 5) 내로 도입된 단일 아미노산 치환 (I535N, D589V, N651F 또는 K655I)을 포함하는 본 발명의 실시 형태에 따른 재조합 HIV Env 단백질을 실시예 2에 개시된 바와 같이 생성하고 정제하였다. 삼량체 수득량과 삼량체 형성 백분율을 실시예 3에 개시된 바와 같이 AlphaLISA 분석에 의해 측정하였다.
결과를 도 5a (삼량체 형성의 백분율) 및 도 5b (삼량체 수득량)에 나타낸다. 보고된 값은 삼량체 형성 백분율 및 삼량체 수득량 둘 다에 대하여 1로 설정된, ConB_SOSIP 엔벨로프 단백질에 대하여 측정된 값과 비교한 것이다. 결과는 테스트된 모든 돌연변이가 삼량체 형성 백분율을 증가시켰음을 보여준다. 삼량체 수득량은 모든 테스트된 돌연변이에 대하여 ConB_SOSIP 엔벨로프 단백질에 비하여 동일하거나 향상되었다.
이들 결과는 이들 돌연변이가 또한 상이한 백본 HIV 엔벨로프 단백질 서열 내로, 이 경우에는 클레이드 B 유래 콘센서스 서열 내로 도입될 경우, 엔벨로프 단백질에 대해 안정화 효과, 예를 들어, 향상된 삼량체 수득량, 향상된 삼량체 형성 백분율 등을 가짐을 입증한다.
실시예 6: 합성 엔벨로프 단백질 서열을 기반으로 한 재조합 HIV 엔벨로프 단백질 변이체
서열 번호 7로 나타낸 서열을 가진 합성 HIV 엔벨로프 단백질 ('DS_sC4_SOSIP_E166R'로 불림) 내로 도입된 아미노산 치환을 포함하는 본 발명의 실시 형태에 따른 재조합 HIV Env 단백질을 실시예 2에 개시된 바와 같이 제조하고 정제하였다. 합성 HIV 엔벨로프 단백질 DS_sC4_SOSIP_E166R은 소위 SOSIP 돌연변이 (잔기 501 및 605에서 Cys, 및 잔기 559에서 Pro), 디술피드 (DS) 결합의 도입을 야기하는 잔기 201 및 433에서의 Cys, 및 첨부를 안정화하기 위한 위치 166에서의 Arg를 가진다. 또한, 단백질은 위치 655에서 절두된다. 삼량체 형성 백분율 및 삼량체 수득량을 실시예 3에 개시된 바와 같이 AlphaLISA 분석에 의해 측정하였다.
결과를 도 6에 나타내며, 도 6은 테스트된 변이체의 각각에 있어서의 삼량체 형성 백분율을 DS_sC4_SOSIP_E166R 백본에 있어서의 삼량체 형성 백분율 (도 6a) 및 삼량체 수득량 (도 6b)과 비교한다. 백본 서열에 비하여 더 큰 삼량체 형성 백분율이 테스트된 변이체 각각에 대해 관찰되었다.
E166R 외에, 하기 실시예 12 및 도 12에서 더욱 상세히 설명된 프레임워크에 따라 단백질을 '복구'하기 위하여, 일부 다른 드물게 나타나는 아미노산을 야생형 HIV Env 단백질들의 컬렉션에서의 상응하는 위치 (A114Q, E117K, T375S 및 I434M)에서의 보다 일반적인 아미노산으로 변화시켰다. 이러한 '복구된' 단백질에서, 안정화 돌연변이 A204I, 및 K655I는 sC4_SOSIP를 더욱 더 향상시킨다 (도 13).
이 실시예의 결과는 본 명세서에 개시된 돌연변이가 또한 상이한 백본 HIV 엔벨로프 단백질 서열 내로, 이 경우에는 비-콘센서스, 합성, Env 서열 내로 도입될 경우, 엔벨로프 단백질에 대해 안정화 효과, 예를 들어, 향상된 삼량체 형성 백분율 및/또는 향상된 삼량체 수득량 등을 가짐을 입증한다는 점에서 실시예 5의 결과와 일치한다.
실시예 7: HIV Env 돌연변이의 추가 조합
(서열 번호 3으로 나타낸 서열을 갖는) ConC_SOSIP 내에 도입된 아미노산 치환을 포함하는 본 발명의 실시 형태에 따른 재조합 HIV Env 단백질을 실시예 2에 개시된 바와 같이 제조하고 정제하였다. 삼량체 형성 백분율은 실시예 3에 개시된 바와 같이 AlphaLISA 분석법에 의해 측정하였다. 이어서, 더 작은 선택된 조합 (하기에 이탤릭체로 표시된 것 및 추가로 K655I; I535N,D589V; I535N, K655I; D589V, K655I)을 갈란투스 니바리스 렉틴을 이용하여 정제하고 삼량체 함량은 실시예 3에 개시된 바와 같이 SEC-MALS를 이용하여 분석하였다. 안정성은 실시예 4에 개시된 바와 같이 측정하였다.
하기 돌연변이체를 이 실험을 위하여 제조하였다:
K655I, N651F;
K655I, N651F, E647F;
K655I, N651F, E647F, I535N;
K655I, N651F, I535N;
K655I, I573F;
K655I, D589V, I573F;
K655I, D589V, I573F, N651F;
K655I, D589V, I573F, K588E;
K655I, D589V, I573F, N651F, K588E;
K655I, D589V, I573F, N651F, K588E, I535N;
K655I, D589V, I573F, N651F, K588E, I535N, A204I;
K655I, D589V, I535N, L556P;
K655I, D589V, I573F, N651F, K588E, L556P;
K655I, D589V, A204I;
L556P, N651F;
L556P, N651F, K655I;
L556P, N651F, K655I, I535N;
L556P, N651F, K655I, I535N, I573F;
L556P, N651F, K655I, I535N, I573F, D589V;
L556P, N651F, K655I, I535N, I573F, D589V, A204I;
L556P, N651F, K655I, I535N, I573F, D589V, A204I, K588Q;
L556P, N651F, K655I, I535N, I573F, D589V, A204I, K588Q, E647F;
L556P, N651F, I535N;
L556P, N651F, I535N, I573F;
L556P, N651F, I535N, I573F, D589V;
L556P, N651F, I535N, I573F, D589V, A204I;
L556P, N651F, I535N, I573F, D589V, A204I, K588Q;
L556P, N651F, I535N, I573F, D589V, A204I, K588Q, E647F;
L556P, K655I, I535N;
L556P, K655I, I535N, I573F;
L556P, K655I, I535N, I573F, D589V;
L556P, K655I, I535N, I573F, D589V, A204I;
L556P, K655I, I535N, I573F, D589V, A204I, K588Q;
L556P, K655I, I535N, I573F, D589V, A204I, K588Q, E647F;
L556P, N651F, I535N, I573F, D589V, A204I, K588Q (이때 SOS 돌연변이는 제거됨).
ConC_SOSIP 백본에서의 치환의 모든 테스트된 조합은 AlphaLISA에서 백본에 비하여 더 높은 삼량체 백분율, 더 높은 삼량체 수득량 및 60℃에서 더 높은 삼량체 안정성을 나타냈다 (데이터는 예시되어 있지 않음). SEC_MALS는 백본에서 모든 테스트된 돌연변이에 대해 향상된 삼량체 백분율을 확인하였다 (데이터는 예시되어 있지 않음).
9개 돌연변이까지 하나씩 추가 돌연변이를 포함하는 세트에 대하여, SEC-MALS는 각각의 다음 돌연변이의 도입에 의해 단량체 피크의 높이가 감소함에 따라 삼량체/단량체 비율이 증가한 한편, 삼량체 피크의 높이는 SEC 그래프에서 동일하게 머물렀음을 보여주었다 (도 7). SEC-MALS에서 테스트된 모든 변이체 중에서, L556P, N651F, K655I, I535N, I573F, D589V, A204I, K588Q, E647F 치환을 가진 변이체가 최고의 삼량체 백분율 (최소의 gp140 단량체 및 최소의 gp120 단량체), 최고의 총 단백질 수득량, 및 더 높은 온도 안정성들 중 하나를 나타냈다. 이것은 이들 돌연변이가 백본과 비교할 때 삼량체의 손실 없이 조합될 수 있음을 의미한다. 또한, 이것은 일반적으로 표 2에 개시된 돌연변이와 선택적으로 조합된, 표 1의 (i)~(vii)에 개시된 돌연변이의 부가가 더 향상된 삼량체화를 야기함을 시사한다.
'SOS 돌연변이'가 제거된 (즉, 위치 501과 605에서의 두 시스테인 잔기가 콘센서스 클레이드 C 서열에 원래 존재했던 아미노산 잔기로 다시 돌아갔음), L556P, N651F, I535N, I573F, D589V, A204I, K588Q 돌연변이를 가진 구축물을 또한 테스트하였다. 그의 온도 안정성이 더 낮았지만, 돌연변이체는 SOS 돌연변이를 포함하는 그의 상응하는 돌연변이체에 비견되는 삼량체 백분율 및 수득량을 가졌다. SOS 돌연변이가 제거된 돌연변이체는 그것이 그의 상응하는 SOS-함유 대응체 (L556P, N651F, I535N, I573F, D589V, A204I, K588Q 돌연변이를 가짐)보다 비-bNAb에 덜 결합했다는 점에서 심지어 장점을 가졌다. 이것은 높은 삼량체 백분율과 같은, 본 발명의 유리한 특성이 모든 SOSIP 돌연변이를 갖지 않는 HIV Env 단백질에서 또한 수득될 수 있다는 것을 입증한다.
발현 수준, 삼량체 형성 및 광범위 중화 항체 PGT151에의 결합에서의 유리한 특성들의 조합에 기초할 때, 하나의 돌연변이체 (ConC_SOSIP 백본에서 테스트됨)는 하기 돌연변이를 갖는다: L556P, N651F, I535N, I573F, D589V, A204I, K588Q.
ConC_SOSIP 배경에서, 9가지의 가장 성공적인 치환은 gp41에서 L556P, E647F, N651F, K655I, I535N, D589V, I573F, 및 K588E 및 gp120에서 A204I이었다. 모든 이들 9가지 치환의 조합은 증가된 안정성, 삼량체 함량 및 삼량체 수득량을 유도하였다. 9가지 치환을 가진 이 변이체에서 L556P의 추가는 향상된 삼량체 백분율에 대해 상대적으로 제한된 효과를 가졌으며 이 맥락에서 E647F 치환은 PGT151 결합을 방해하는 것으로 나타났으므로, 이들 두 돌연변이는 추가 변이체에서 항상 사용되지는 않았으며, 7가지 치환을 가진 변이체 (ConC_SOSIP_7mut로 불림, 때로는 본 명세서에서 '안정화된 ConC_SOSIP' 또는 'ConC_base'로도 불림; N651F, K655I, I535N, D589V, I573F, K588E, 및 A204I를 포함함)가 상기에 나타낸 9가지 치환을 가진 변이체보다 약간 더 안정한 (증가된 융점) 것으로 밝혀졌다. 이 변이체의 완전한 서열 (안정화된 ConC_SOSIP Env, HIV 160544)은 서열 번호 20으로 제공된다.
이때, 발현 수준, 삼량체 형성 및 광범위 중화 항체에의 결합에서의 유리한 특성들의 조합에 기초할 때, 특히 바람직한 돌연변이체[하기 추가의 돌연변이를 가진 ConC_SOSIP 백본에서 테스트됨: (a) D279N, A281V, A362Q (다른 사람들에 의해 개시된 바와 같이, 전파된 창립자 바이러스와의 유사성을 증가시킴); (b) Del139-152 (가변 루프에 대한 항체 유도 가능성을 감소시키기 위한 가변 루프의 결실); 및 (c) V295N (HIV 주의 대부분에 존재하는 글리칸 부위의 도입)]는 하기의 본 발명의 안정화 돌연변이를 가진다: N651F, K655I, I535N, I573F, D589V, A204I, K588E. 이 변이체의 완전한 서열 (안정화 ConC_SOSIP.v3 Env (HIV170654, ConC_SOSIP.v3))은 서열 번호 28로 제공된다.
추가 변이체에서는, K658V 돌연변이가 이 구축물에 부가되었으며 (하기 실시예 15를 또한 참조), 이것은 결과를 더 개선시켰다.
실시예 8: 안정화된 HIV Env 단백질을 디스플레이하는 자가-조립 입자
페리틴 및 (문헌[He et al, 2016])에서 개시된 것과 유사한 방식으로 안정화된 Env 단백질을 디스플레이하는 DPS 자가-조립 입자를 제조하였다. 이를 위하여 gp140 단백질을 DNA 레벨에서 짧은 아미노산 링커 (예를 들어 GSG 또는 AAAGS, 그러나 다른 링커도 사용될 수 있으며, 예를 들어 문헌[He et al, 2016] 참고)를 통해 입자의 N-말단에 융합시키고 Expi293F 세포에서 융합 단백질을 발현시켰다. 이 방식으로 제조된 입자의 일 예는 하기 돌연변이: I535N,A558P,D589V,K655II535N, A558P, D589V, K655I를 가진 ConC_SOSIP (서열 번호 3) HIV Env 단백질에 융합된 페리틴을 기반으로 하였다. 삼량체화를 향상시키는 것으로 보고된 (문헌[Kesavardhana et al,2014]) 추가의 V570D 돌연변이를 가진 이 Env 단백질을 가진 페리틴 입자가 또한 제조되었으나, 이 돌연변이는 비-중화 항체 (17b)의 결합에서의 강한 증가를 초래하는 것으로 관찰되었으며, 이것은 원치 않는 것이다. 이들 5가지 돌연변이를 가진 Env를 또한 헬리코박터 파일로리 (Helicobacter pylori) 유래의 및 마이코박테리움 스메그마티스 (Mycobacterium smegmatis) 유래의 두 가지 타입의 DPS 입자 (예를 들어 DPS 입자의 제조에 대하여 국제 공개 제2011/082087호 참조)에 융합시켰다. 이들 5가지 돌연변이 및 또한 디술피드 가교 도입 이중 돌연변이 I201C-A433C를 가진 Env를 또한 페리틴에 융합시켰다.
PGDM140 친화성 비드를 이용하여 무세포 상청액으로부터 입자를 정제하고 TSKgel G6000PWCL 컬럼을 가진 SEC-MALS를 이용하여 입자를 분석하였다. Native PAGE (3-12%) 뿐만 아니라 SEC-MALS도 대략 예상된 크기를 가진 입자가 형성되었음을 확인하였다.
유사한 방식으로, 페리틴 및 돌연변이의 하기 조합: (L556P, N651F, I535N, I573F, D589V, A204I, K588Q)(L556P, N651F, I535N, I573F, D589V, A204I, K588Q)을 가진 ConC_SOSIP 서열을 가진 HIV Env를 디스플레이하는 DPS 자가-조립 나노입자를 또한 제조한다.
본원에 개시된 다른 HIV Env 변이체, 예를 들어 서열 번호 20, 22, 24, 26, 27, 28, 29, 30, 31, 또는 32를 갖는 HIV Env를 디스플레이하는 추가의 리포좀 및/또는 자가-조립 나노입자를 또한 제조한다.
실시예 9: 클레이드 A 엔벨로프 단백질 서열을 기반으로 한 재조합 HIV 엔벨로프 단백질 변이체
단일 아미노산 치환 (I535N, D589V, N651F, K655I, I573F, A204I 또는 E647F)을 포함하는 본 발명의 실시 형태에 따른 재조합 HIV Env 단백질을 실시예 2에 개시된 바와 같이 SOSIP 변형 ('BG505_SOSIP'로 불림)을 가진 야생형 클레이드 A HIV 엔벨로프 단백질 내로 도입하였다. HIV 엔벨로프 단백질 BG505_SOSIP는 소위 SOSIP 돌연변이 (잔기 501 및 605에서 Cys, 및 잔기 559에서 Pro), 및 디술피드 (DS) 결합의 도입을 야기하는 잔기 201 및 433에서의 추가 Cys, 및 위치 332 상의 잠재적 N-글리코실화 부위 (T332N 돌연변이)를 가진다. 단백질은 위치 664에서 절두된다. BG505_SOSIP의 서열은 서열 번호 21로 나타낸다.
삼량체 형성 백분율 및 삼량체 수득량을 실시예 3에 개시된 바와 같이 AlphaLISA 분석에 의해 측정하였다. 테스트된 변이체 각각에 있어서의 삼량체 형성 백분율 및 삼량체 수득량을 BG505_SOSIP와 비교하였다. 백본 서열에 비하여 M535N, D589V, N651F 또는 K655I 치환에 대해 더 높은 삼량체 형성 백분율이 관찰되었다 (예를 들어 도 8a). 예를 들어 L556P, K655I 및 M535N의 조합은 더욱 더 증가된 삼량체 수득량과 백분율을 나타냈다 (예를 들어 도 8a 및 도 8b). N651F와 D589V의 조합은 삼량체 수득량과 백분율을 더욱 더 향상시켰다 (데이터는 예시되어 있지 않음). 클레이드 A 바이러스에 대한 이 실시예의 결과는 하기 실시예 10과 11 (클레이드 C) 및 실시예 5의 결과와 일치하며, 여기서는 돌연변이 I535N, D589V, N651F 및 K655I가 또한 야생형 주로부터 유래된 엔벨로프 단백질에 대해 안정화 효과, 예를 들어, 향상된 삼량체 형성 백분율 및/또는 향상된 삼량체 수득량을 나타냈다. 명백히, 본 발명의 이들 돌연변이는 또한 야생형 클레이드 A 주로부터 유래된 HIV Env의 삼량체화를 향상시킨다.
이때, 발현 수준, 삼량체 형성 및 광범위 중화 항체에의 결합에서의 유리한 특성들의 조합에 기초할 때, 특히 바람직한 변이체 (BG505_SOSIP 백본에서 테스트됨)는 하기 돌연변이를 갖는 것이다: L556P, K655I, M535N, N651F, D589V (예를 들어, SEC-MALS 분석에서 그러한 돌연변이체의 강하게 향상된 삼량체 형성을 보여주는 도 9 및 그러한 돌연변이체의 광범위 중화 항체의 명백히 향상된 결합을 보여주는 도 13 참조). 이 안정화된 BG505_SOSIP Env (HIV170863)의 서열을 서열 번호 22로 나타낸다.
돌연변이 Q658V의 부가는 적은 추가 향상을 제공하였다.
추가의 바람직한 구축물은 L556P, K655I, M535N, N651F, D589V 돌연변이, 및 'DS' 돌연변이 (디술피드 결합의 도입을 야기하는 위치 201과 433에서의 Cys), R588E, 및 Q658V를 함유한다. 그 변이체 (BG505_SOSIP.v2 Env, HIV171814)의 서열이 서열 번호 29에 제공된다.
실시예 10: 클레이드 C 야생형 엔벨로프 단백질 서열을 기반으로 하는 재조합 HIV 엔벨로프 단백질 변이체
추가 치환 L556P을 가진 WT C97ZA_SOSIP Env 서열 (서열 번호 23) (C97ZA_SOSIP_L556P) 내로 도입된 단일 아미노산 치환 T651F, 이중 아미노산 치환 T651F, M535N을 포함하는 본 발명의 실시 형태에 따른 재조합 HIV Env 단백질을 실시예 2에 개시된 대로 생성하고 발현하였다. 삼량체 수득량과 삼량체 형성 백분율을 실시예 3에 개시된 바와 같이 AlphaLISA 분석에 의해 측정하였다.
결과는 도 10a 및 도 10b로 나타낸다. C97ZA_SOSIP_L556P_T651F_M535N의 삼량체 수득량은 C97ZA_SOSIP 백본의 수득량보다 5배 더 높다.
따라서 L556P, T651F 및 M535N 치환은 C97ZA_SOSIP를 크게 향상시켰지만, 이 클레이드 C 야생형 유래 변이체에 있어서의 bNAb에의 결합 및 삼량체 백분율은 ConC_SOSIP 백본에 대한 것보다 훨씬 더 낮았다. wt Env가 그의 숙주에 적응되어, 가능하게는 그의 일반적인 적합성을 감소시켜서 폴딩이 파괴될 수 있으므로, Env 서열을 실시예 12 및 도 12에서 개시된 개념적 프레임워크에 따라 '복구'하였다. 서열을 복구하기 위하여 총 21 잔기를 변화시켰으며, 소위 '글리칸 홀' (야생형 HIV 주 Env 단백질의 적어도 50%에서 잠재적 N-글리코실화 부위가 존재하는 위치)을 채우기 위하여 3개의 잠재적 N-글리코실화 부위 (PNGS)를 부가하였다. C97ZA_SOSIP를 위한 이 프레임워크를 따름으로써 도입된 돌연변이를 표 3에서 컬럼 '복구 돌연변이'에서 나타낸다. 본 명세서에 개시된 안정화 돌연변이 K655I의 부가는 D589V, A204I 및 K588E에서처럼 삼량체 백분율과 수득량을 더욱 더 증가시켰다.
이들 결과는 본 명세서에 개시된 T651F, M535N 및 K655I, D589V, A204I 및 K588E 돌연변이가 C97ZA_SOSIP (클레이드 C 야생형 주 Env 단백질로부터 유래됨) 및 그 변이체 내로 도입될 때 또한 엔벨로프 단백질에 대해 안정화 효과, 예를 들어, 향상된 삼량체 수득량, 향상된 삼량체 형성 백분율을 가졌음을 입증한다.
이때, 발현 수준, 삼량체 형성 및 광범위 중화 항체에의 결합에서의 유리한 특성들의 조합에 기초할 때, 특히 바람직한 변이체 (C97ZA_SOSIP 백본에서 테스트됨)는 하기 돌연변이를 갖는 것이다: Q567K (이전에 다른 사람들에 의해 개시됨); A198T, S243N, K236T, V295N (글리칸 홀을 채움); M34L, T46K, T58A, Q171K, G172V, P179L, L183Q, I192R, N209T, M307I, Q350R, N352H, Y353F, D412N, G429E, V455T, I489V, L491I, G500K, S547G, T578A, T651N (서열을 복구함); V505N, E507T, T663N (분자의 베이스에서 잠재적 N-글리코실화 부위의 부가); 및 A204I, M535N, L556P, K588E, D589V, T651F, K655I (본 발명의 안정화 돌연변이). 이 변이체에 대한 데이터를 예를 들어 도 13 (특히 그안의 '안정화되고 복구된 C97ZA'를 참고)에 나타내며, 원래의 wt C97ZA Env 분자에 비하여 광범위 중화 항체 결합에서 큰 증가를 보여준다. 이 변이체 (안정화되고 복구된 C97ZA_SOSIP Env (HIV170690))의 서열은 서열 번호 24로 제공된다.
돌연변이 K658V의 부가는 이 단백질을 더욱 더 안정화시켰다.
추가의 바람직한 변이체는 'DS' 돌연변이 및 K658V를 포함하며, 이 변이체 (C97ZA_SOSIP.v2 Env, HIV171810)의 서열은 서열 번호 30에 제공된다.
실시예
11: 또 다른
클레이드
C 야생형
엔벨로프
단백질 서열을 기반으로 하는 재조합 HIV
엔벨로프
단백질
변이체
클레이드 C 주 Du422 유래의 Env 단백질에서, SOSIP 돌연변이를 도입하고, 2개의 글리칸 홀 (hole)을 위치 295 및 386에서 K295N 및 D386N 돌연변이에 의해 채웠다. 게다가, 일부 잔기를 실시예 12 및 도 12에 설명된 개념적 프레임워크에 따라 복구하고 (V272I, W456R, G466E 및 F643Y), 안정화 치환인 L556P, I535N, N651F 및 D589V를 도입하였다. 모든 추가 치환은 더 큰 삼량체 수득량 및 삼량체 백분율로 이어졌다 (예를 들어 도 11).
이러한 4개의 안정화 돌연변이를 갖는 테스트되는 특정한 변이체 (서열 번호 25)에서, 추가적인 K655I 치환은 삼량체 수득량 및 삼량체 백분율을 각각 1.3배 및 1.4배만큼 더 증가하였다 (데이터는 예시되어 있지 않음).
이때, 발현 수준, 삼량체 형성 및 광범위 중화 항체에의 결합 면에서의 유리한 특성들의 조합을 기반으로 하면, 특히 바람직한 Du422_SOSIP Env 변이체는 하기 돌연변이를 갖는 것이다: L556P, K655I, M535N, N651F, D589V, K588E, I201C, A433C, V272I, W456R, G466E, F643Y, D386N, 및 K295N. 이 변이체 (안정화되고 복구된 Du422_SOSIP Env (HIV170859))의 서열은 도 26으로 제공된다. 이 변이체에 대한 데이터를 예를 들어 도 13에 나타내며 (그 안에서 안정화되고 복구된 Du422 참조), 이는 원래의 야생형 Du422 Env 분자와 비교하여 광범위 중화 항체 결합성의 엄청난 증가를 보여준다.
추가의 바람직한 변이체는 ‘DS’ 돌연변이 및 K658V를 추가로 포함하며, 이 변이체 (Du422_SOSIP.v1 Env, HIV171812)의 서열은 서열 번호 31로 제공된다.
실시예
12: 다양한 HIV-1
Env
서열의 복구 및 안정화
감염된 환자로부터 단리한 바이러스로부터의 야생형 서열은 올바른 폴딩을 저해하는 불안정화 돌연변이를 획득하였을 수도 있기 때문에, 먼저 클레이드 C C97ZA, DU422 및 모자이크 sC4의 야생형 Env 서열을 복구시켰다.
야생형 서열에서의 비-최적 돌연변이에 대하여 검색하기 위하여, UniProt 데이터베이스 및 Los Alamos HIV 데이터베이스에서의 모든 HIV-1 Env 서열 (대략 90.000개의 서열)의 정렬을 행하고, 아미노산 분포를 각각의 아미노산에 대하여 계산하였다. 일반적으로, 야생형 Env 서열에서의 다수의 상대적으로 드물게 나타나는 아미노산을 도 12에 설명된 개념적 프레임워크에 따라 더 일반적인 아미노산 (상응하는 위치에서의 데이터베이스에서의 빈도를 기반으로 함)으로 치환하였다.
더욱이, C97ZA_SOSIP의 첨부에서의 2개의 추가 치환 Y353F 및 Q171K를 도입하여 가능하게는 첨부 표적화 항체의 결합성을 개선시키며, 가외의 글리칸 부위를 D411N, K236T 및 V295N의 치환에 의해 도입하였는데, 그 이유는 이러한 잠재적 N-글리코실화 부위 (PNGS)가 50%보다 많이 보존되어 있기 때문이었다. 다음, 이전 실시예에서 설명한 안정화 치환을 복구된 서열에 전달하였다.
안정화된 ConC_SOSIP는 치환 A204I, I535N, I573F, K588E, D589V, N651F 및 K655I를 포함한다 (안정화된 ConC_SOSIP). 안정화된 ConC_SOSIP의 전체 서열은 서열 번호 20으로 제공된다.
일부의 변이형 Env 단백질 및 이의 돌연변이의 개관이 표 3에 제공되어 있다.
[표 3]
표 3. 본원에 개시된 몇몇 HIV Env 단백질 변이체.‘문헌으로부터의 돌연변이’라는 컬럼에는 이들 구축물에서 사용되고 다른 이들에 의해 이전에 기술된 돌연변이가 기술되어 있다. ‘부가된 PNGS’라는 컬럼에는 잠재적 N-글리코실화 부위를 (많은 야생형 Env 단백질이 그러한 부위를 포함하는 위치에) 부가하는 돌연변이가 기술되어 있다. ‘리더 서열’이라는 컬럼에는 리더 서열이 원래의 (천연) 리더 서열이 아닌 경우 어떤 리더 서열이 발현에 사용되었는지가 기술되어 있다. ‘복구 돌연변이’라는 컬럼에는 실시예 12 및 도 12에 기술된 바와 같이, 일부의 야생형 Env 단백질의 폴딩 및 안정성 (bNAb에의 결합을 기반으로 하여, 삼량체의 수득량 및 백분율로서 측정)을 개선시키는 돌연변이가 기술되어 있다. ‘안정화 돌연변이’라는 컬럼에는 본원에 개시된 바와 같이 단백질을 안정화시키고 삼량체화를 개선시키는 본 발명의 돌연변이가 기술되어 있다. ‘추가 돌연변이’라는 컬럼에는 일부 구축물을 위하여 만들어진 추가 돌연변이가 기술되어 있다. ‘말단’이라는 컬럼에는 마지막 아미노산의 위치가 기술되어 있다 (표 전체에 걸친 넘버링은 HXB2 Env 서열에 관한 것이다).
야생형 (wt), 복구, 및 안정화 Env 변이체로 일시적으로 형질감염시킨 세포의 상청액을 첨부에 대하여 유도된 몇몇 삼량체-특이적 광범위 중화 항체에의 결합에 대하여 테스트하였다. 복구 치환 및 특히 안정화 치환은 삼량체 함량에 대하여 극적인 영향을 주었으며 (도 13 및 도 14), 이는 AlphaLISA (도 13) 및 SEC-MALS (도 14)를 이용하여 결정하였다.
복구되고 안정화된 DS_sC4 Env 단백질 (복구되고 안정화된 DS_sC4_SOSIP Env (HIV170686))의 바람직한 변이체의 서열이 서열 번호 27로 제공되어 있다.
이의 또 다른 바람직한 변이체가 서열 번호 32로 제공되어 있다 (복구되고 안정화된 sC4_SOSIP.v4 Env).
실시예
13: 본 발명의 안정화 돌연변이는
SOSIP
돌연변이의 부재 하에서 기능을 한다
이전 실시예에서 나타낸 바와 같이, 7개의 돌연변이 (A204I, I535N, I573F, K588E, D589V, N651F 및 K655I)는 ConC_SOSIP에서 삼량체의 수득량 및 백분율을 개선시켰다 (이는 ‘ConC_base’ 또는 ‘안정화된 ConC_SOSIP’ 또는 ‘ConC_SOSIP 7mut’로 이어짐) (예를 들어 도 13 및 도 15 참조).
이 실시예는 상이한 SOSIP 돌연변이들 (즉, ‘SOS’ 돌연변이: 위치 501 및 605에서 Cys 잔기에 의한 2개의 치환; 및 ‘IP 돌연변이’: 위치 559에서 Pro 잔기에 의한 치환)이 추가 안정화에 기여하지만 본 발명의 돌연변이들로부터 이익을 얻는 데 필요한 것은 아님을 입증한다.
상기 7가지의 돌연변이는 안정화 I559P 돌연변이 (‘IP’ 돌연변이)를 포함하지 않는 소위 ConC_SOS에서 삼량체 수득량을 또한 개선시키는 것으로 밝혀졌으며, 이는 도 15에 나타낸 바와 같다 (ConC_SOS 대 ConC_SOS, 7mut). 따라서, ‘IP’ 돌연변이는 본원에 기술된 돌연변이들로부터 이익을 얻는 데 필수적인 것은 아니다. I559P 돌연변이의 부가는 큰 증가로 이어졌으며, 이는 본 발명의 7가지의 돌연변이에 더하여 ‘IP’ 돌연변이가 이 구축물에서 유익함을 나타내는 것이다. 안정화 IP 돌연변이 (I559P)는 또한 A558P 또는 L556P에 의해 대체될 수 있으며, 이들 둘 다도 I559P 돌연변이가 결여된 변이체에 비하여 큰 증가로 이어졌다.
또한, 상기에 기술된 본 발명의 7가지의 돌연변이를 포함하지만 ‘SOS’ 돌연변이가 결여된 ConC_IP, 7 mut는 여전히 매우 높은 삼량체 수득량을 나타냈으며, 이는 ‘SOS’ 돌연변이도 본원에 기술된 돌연변이들로부터 이익을 얻는 데 필수적인 것은 아님을 입증하는 것인데 (예를 들어 ConC_SOSIP 대 ConC_IP, 7 mut의 비교), 이는 실시예 7에서의 관찰과 일치한다. ‘SOS’ 돌연변이의 부가는 삼량체 수득량을 더 증가시킨다.
따라서, 본원에 개시된 안정화 돌연변이를 포함하는 Env 삼량체는 SOSIP 돌연변이에 의한 추가 안정화로부터 이익을 얻을 수 있지만, 상기 3개의 SOSIP 돌연변이 중 어떤 것도 본원에 개시된 안정화 돌연변이의 이익 (예를 들어, 개선된 삼량체 수득량)을 얻는 데 필요하지 않다.
실시예
14: 위치 647, 651 또는 655에서의 메티오닌 치환은
삼량체
특질을 개선시킨다
실시예 2에서 설명한 돌연변이에 더하여, ConC_SOSIP (서열 번호 3) 백본에서 위치 589, 647, 651 및 655를 Met 잔기로 개별적으로 치환시키고, 삼량체의 백분율 및 수득량에 대하여 테스트하였다 (상기에 설명된 바와 같은 방법을 이용함). 실시예 2에서 설명한 돌연변이와 같이, 위치 647, 651, 또는 655에서의 Met은 도 16에서 알 수 있는 바와 같이, 삼량체의 특질을 개선시킴이 밝혀졌다 (더 높은 삼량체의 백분율 및 수득량, 증가된 bNAb 결합성).
이와 같이, 위치 651에서의 Phe, Ala, 또는 Trp에 의한 치환 외에, 위치 651에서의 Met에 의한 치환도 삼량체 형성을 개선시키며; 위치 655에서의 Phe, Ile, 또는 Trp에 의한 치환 외에, 위치 655에서의 Met에 의한 치환도 삼량체 형성을 개선시키며; 위치 647에서의 Phe, 또는 Ile에 의한 치환 외에, 위치 647에서의 Met에 의한 치환도 삼량체 형성을 개선시킨다.
실시예 15: 위치 658에서 삼량체 안정화 돌연변이를 갖는 HIV Env 단백질
위치 658 (넘버링은 HIV-1 단리체 HXB2의 gp160에 따름)에서 치환 돌연변이를 갖는 재조합 HIV Env 단백질을 ConC_SOSIP (서열 번호 3) 백본에서 제조하였다. K658을 Val, Ile, Phe, Leu, Met, 또는 Ala으로 돌연변이시켰다. 게다가, 일부 이중 돌연변이체를 만들었으며, 여기서, 이러한 돌연변이를 상기에 설명된 안정화 돌연변이들 중 하나인 K655I와 조합하였다. 삼량체 형성 백분율을 실시예 3에 설명된 바와 같이 AlphaLISA 분석법으로 결정하였다.
결과를 도 17a 및 도 17b (삼량체 백분율, 다른 실험들에서 측정함, 따라서 2개의 패널) 및 도 17c 및 도 17d (삼량체 수득량, 다른 실험들에서 측정함, 따라서 2개의 패널)에 나타낸다. 이러한 결과는 Ile, Phe, Met, Leu, Ala, 또는 Val에 의한 위치 658에서의 치환이 삼량체 형성 백분율을 개선시켰고 삼량체 수득량을 개선시켰음을 입증한다. 위치 658에서의 Ile에 의한 치환은 상기에 설명된 표 1에서의 돌연변이 (i)~(vii)로부터의 최상의 수행성의 단일 돌연변이체 (예를 들어 도 2a 참조)인 K655I 돌연변이와 대략 동일한 범위 내에 있는 증가로 이어졌다 (도 17a, 도 17c). 위치 658에서 Val에 의한 치환은 더욱 더 많은 개선으로 이어졌다 (도 17a, 도 17c).
이 결과도, Ile 또는 Val에 의한 위치 658에서의 치환이 상기에 설명된 돌연변이 K655I와 조합될 수 있고, 이것은 각각의 상응하는 단일 돌연변이체에 비하여 추가 개선으로 이어짐을 입증하였다 (도 17a, 도 17c).
K658V 돌연변이체를 SEC-MALS를 이용하여 또한 테스트하였다. 96웰 배양물을 AlphaLISA에 대하여 행한 것과 같이 3일 동안 성장시켰다. 상청액을 SEC-MALS 컬럼에 직접적으로 로딩하였다. 모크 상청액 (푸린 발현이 있음)에 대하여 수득된 크로마토그램을 Env 단백질을 포함하는 상청액의 크로마토그램으로부터 차감하였다. 삼량체성 단백질이 7분과 8분 사이에 컬럼으로부터 용출되었다. 그 결과를 도 18에 나타내며, 이는 K658V 돌연변이체가 배경 Env 단백질에 비하여, 그리고 K655I 돌연변이 Env 단백질에 비하여 개선된 삼량체화를 나타냄을 확인해 주는 것이었다.
이 실시예는 Val, Ile, Phe, Met, Leu, 또는 Ala에 의한 HIV Env 단백질에서의 위치 658에서의 아미노산의 치환이 삼량체 백분율 및 삼량체 수득량을 개선시킴을 입증한다.
AlphaLISA 및/또는 SEC-MALS를 사용하여 변이체의 삼량체 형성을 측정하기 위한 추가 실험을 HIV Env 변이체 (여기서, K658V 돌연변이는 본원에 설명된 바와 같이 표 1 및/또는 표 2로부터의 다른 돌연변이와 조합되어 존재함)에서 수행하며, 이외에도 클레이드 A 및 B 유래의 HIV 주에서 수행한다. 예를 들어, 658V 돌연변이는 상기에 설명된 바와 같은 ConC_SOSIP,7mut 변이체 (실시예 7)와, L556P, K655I, M535N, N651F, D589V, K588E를 갖는 BG505_SOSIP (실시예 9)와, 복구되고 안정화된 C97ZA_SOSIP (실시예 10)를 개선시키는 것으로 이미 밝혀져 있었다.
상기에 기술된 결과를 기반으로 하면, 위치 658에서의 아미노산의 발린, 이소류신, 페닐알라닌, 류신, 메티오닌 또는 알라닌 잔기로의 돌연변이, 바람직하게는 발린 잔기로의 돌연변이는 상이한 배경 HIV Env 단백질들에서 삼량체 형성 및/또는 삼량체 수득량을 개선시킬 것으로 예상된다.
실시예
16: 안정화된 HIV
Env
단백질을 이용한 면역화
토끼 면역화 연구를 가용성 Env 단백질을 이용하여, 그리고 리포좀에 커플링된 Env 단백질을 이용하여 행한다. 프라이밍을 안정화된 ConC_SOSIP.v3 (서열 번호 28)을 이용하여 수행하고, 이어서 각각 다른 단백질을 이용하여, 즉, 1) 복구되고 안정화된 sC4_SOSIP.v4 (서열 번호 32); 2) 복구되고 안정화된 C97ZA_SOSIP.v2 (서열 번호 30); 3) 복구되고 안정화된 Du422_SOSIP.v1 (서열 번호 31); 및 4) 안정화된 BG505_SOSIP.v2 (서열 번호 29)를 이용하여 4회 부스팅을 수행한다.
혈청을 연이은 면역화 후 단리하고, 안정하고 폐쇄된 융합 전 배좌의 Env에 특별히 결합하는 유도된 항체에 대하여 분석하고 (ELISA를 사용), 이외에도 bNAb의 유도에 대하여 분석한다 (바이러스 중화 분석법을 이용).
상기 실시예는 본 발명이 융합 전 폐쇄 HIV 엔벨로프 삼량체 단백질의 폴딩 및 안정성을 최적화하기 위한 보편적인 접근법을 제공함을 입증한다.
본원에 기술된 실시예 및 실시 형태는 단지 예시적인 목적을 위한 것이고, 이의 광범위한 발명 개념으로부터 벗어나지 않으면서 위에 기술된 실시 형태에 대한 변화가 이루어질 수 있음이 이해된다. 따라서, 본 발명은 개시된 특정 실시 형태에 한정되지 않고, 첨부된 청구범위에 의해 정의되는 본 발명의 사상 및 범주 내에서의 변형을 포함하고자 함이 이해된다.
서열 목록
참고 문헌
SEQUENCE LISTING
<110> Janssen Vaccines & Prevention B.V.
Rutten, Lucy
Truan, Daphn?
Strokappe, Nika M.
Langedijk, Johannes P.M.
<120> Trimer Stabilizing HIV Envelope Protein Mutations
<130> 0276 WO 00 ORD
<150> EP16188866.4
<151> 2016-09-15
<160> 34
<170> PatentIn version 3.5
<210> 1
<211> 856
<212> PRT
<213> HIV-1
<220>
<221> misc_feature
<223> gp160 of HIV-1 isolate HXB2
<400> 1
Met Arg Val Lys Glu Lys Tyr Gln His Leu Trp Arg Trp Gly Trp Arg
1 5 10 15
Trp Gly Thr Met Leu Leu Gly Met Leu Met Ile Cys Ser Ala Thr Glu
20 25 30
Lys Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys Glu Ala
35 40 45
Thr Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Asp Thr Glu
50 55 60
Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp Pro Asn
65 70 75 80
Pro Gln Glu Val Val Leu Val Asn Val Thr Glu Asn Phe Asn Met Trp
85 90 95
Lys Asn Asp Met Val Glu Gln Met His Glu Asp Ile Ile Ser Leu Trp
100 105 110
Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val Ser
115 120 125
Leu Lys Cys Thr Asp Leu Lys Asn Asp Thr Asn Thr Asn Ser Ser Ser
130 135 140
Gly Arg Met Ile Met Glu Lys Gly Glu Ile Lys Asn Cys Ser Phe Asn
145 150 155 160
Ile Ser Thr Ser Ile Arg Gly Lys Val Gln Lys Glu Tyr Ala Phe Phe
165 170 175
Tyr Lys Leu Asp Ile Ile Pro Ile Asp Asn Asp Thr Thr Ser Tyr Lys
180 185 190
Leu Thr Ser Cys Asn Thr Ser Val Ile Thr Gln Ala Cys Pro Lys Val
195 200 205
Ser Phe Glu Pro Ile Pro Ile His Tyr Cys Ala Pro Ala Gly Phe Ala
210 215 220
Ile Leu Lys Cys Asn Asn Lys Thr Phe Asn Gly Thr Gly Pro Cys Thr
225 230 235 240
Asn Val Ser Thr Val Gln Cys Thr His Gly Ile Arg Pro Val Val Ser
245 250 255
Thr Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu Glu Glu Val Val Ile
260 265 270
Arg Ser Val Asn Phe Thr Asp Asn Ala Lys Thr Ile Ile Val Gln Leu
275 280 285
Asn Thr Ser Val Glu Ile Asn Cys Thr Arg Pro Asn Asn Asn Thr Arg
290 295 300
Lys Arg Ile Arg Ile Gln Arg Gly Pro Gly Arg Ala Phe Val Thr Ile
305 310 315 320
Gly Lys Ile Gly Asn Met Arg Gln Ala His Cys Asn Ile Ser Arg Ala
325 330 335
Lys Trp Asn Asn Thr Leu Lys Gln Ile Ala Ser Lys Leu Arg Glu Gln
340 345 350
Phe Gly Asn Asn Lys Thr Ile Ile Phe Lys Gln Ser Ser Gly Gly Asp
355 360 365
Pro Glu Ile Val Thr His Ser Phe Asn Cys Gly Gly Glu Phe Phe Tyr
370 375 380
Cys Asn Ser Thr Gln Leu Phe Asn Ser Thr Trp Phe Asn Ser Thr Trp
385 390 395 400
Ser Thr Glu Gly Ser Asn Asn Thr Glu Gly Ser Asp Thr Ile Thr Leu
405 410 415
Pro Cys Arg Ile Lys Gln Ile Ile Asn Met Trp Gln Lys Val Gly Lys
420 425 430
Ala Met Tyr Ala Pro Pro Ile Ser Gly Gln Ile Arg Cys Ser Ser Asn
435 440 445
Ile Thr Gly Leu Leu Leu Thr Arg Asp Gly Gly Asn Ser Asn Asn Glu
450 455 460
Ser Glu Ile Phe Arg Pro Gly Gly Gly Asp Met Arg Asp Asn Trp Arg
465 470 475 480
Ser Glu Leu Tyr Lys Tyr Lys Val Val Lys Ile Glu Pro Leu Gly Val
485 490 495
Ala Pro Thr Lys Ala Lys Arg Arg Val Val Gln Arg Glu Lys Arg Ala
500 505 510
Val Gly Ile Gly Ala Leu Phe Leu Gly Phe Leu Gly Ala Ala Gly Ser
515 520 525
Thr Met Gly Ala Ala Ser Met Thr Leu Thr Val Gln Ala Arg Gln Leu
530 535 540
Leu Ser Gly Ile Val Gln Gln Gln Asn Asn Leu Leu Arg Ala Ile Glu
545 550 555 560
Ala Gln Gln His Leu Leu Gln Leu Thr Val Trp Gly Ile Lys Gln Leu
565 570 575
Gln Ala Arg Ile Leu Ala Val Glu Arg Tyr Leu Lys Asp Gln Gln Leu
580 585 590
Leu Gly Ile Trp Gly Cys Ser Gly Lys Leu Ile Cys Thr Thr Ala Val
595 600 605
Pro Trp Asn Ala Ser Trp Ser Asn Lys Ser Leu Glu Gln Ile Trp Asn
610 615 620
His Thr Thr Trp Met Glu Trp Asp Arg Glu Ile Asn Asn Tyr Thr Ser
625 630 635 640
Leu Ile His Ser Leu Ile Glu Glu Ser Gln Asn Gln Gln Glu Lys Asn
645 650 655
Glu Gln Glu Leu Leu Glu Leu Asp Lys Trp Ala Ser Leu Trp Asn Trp
660 665 670
Phe Asn Ile Thr Asn Trp Leu Trp Tyr Ile Lys Leu Phe Ile Met Ile
675 680 685
Val Gly Gly Leu Val Gly Leu Arg Ile Val Phe Ala Val Leu Ser Ile
690 695 700
Val Asn Arg Val Arg Gln Gly Tyr Ser Pro Leu Ser Phe Gln Thr His
705 710 715 720
Leu Pro Thr Pro Arg Gly Pro Asp Arg Pro Glu Gly Ile Glu Glu Glu
725 730 735
Gly Gly Glu Arg Asp Arg Asp Arg Ser Ile Arg Leu Val Asn Gly Ser
740 745 750
Leu Ala Leu Ile Trp Asp Asp Leu Arg Ser Leu Cys Leu Phe Ser Tyr
755 760 765
His Arg Leu Arg Asp Leu Leu Leu Ile Val Thr Arg Ile Val Glu Leu
770 775 780
Leu Gly Arg Arg Gly Trp Glu Ala Leu Lys Tyr Trp Trp Asn Leu Leu
785 790 795 800
Gln Tyr Trp Ser Gln Glu Leu Lys Asn Ser Ala Val Ser Leu Leu Asn
805 810 815
Ala Thr Ala Ile Ala Val Ala Glu Gly Thr Asp Arg Val Ile Glu Val
820 825 830
Val Gln Gly Ala Cys Arg Ala Ile Arg His Ile Pro Arg Arg Ile Arg
835 840 845
Gln Gly Leu Glu Arg Ile Leu Leu
850 855
<210> 2
<211> 615
<212> PRT
<213> Artificial Sequence
<220>
<223> HIV Env consensus clade C sequence
<400> 2
Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys Glu Ala
1 5 10 15
Lys Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Glu Lys Glu
20 25 30
Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp Pro Asn
35 40 45
Pro Gln Glu Met Val Leu Glu Asn Val Thr Glu Asn Phe Asn Met Trp
50 55 60
Lys Asn Asp Met Val Asp Gln Met His Glu Asp Ile Ile Ser Leu Trp
65 70 75 80
Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val Thr
85 90 95
Leu Asn Cys Thr Asn Val Asn Val Thr Asn Thr Asn Asn Asn Asn Met
100 105 110
Lys Glu Glu Met Lys Asn Cys Ser Phe Asn Thr Thr Thr Glu Ile Arg
115 120 125
Asp Lys Lys Gln Lys Glu Tyr Ala Leu Phe Tyr Arg Leu Asp Ile Val
130 135 140
Pro Leu Asn Glu Asn Ser Ser Glu Tyr Arg Leu Ile Asn Cys Asn Thr
145 150 155 160
Ser Thr Ile Thr Gln Ala Cys Pro Lys Val Ser Phe Asp Pro Ile Pro
165 170 175
Ile His Tyr Cys Ala Pro Ala Gly Tyr Ala Ile Leu Lys Cys Asn Asn
180 185 190
Lys Thr Phe Asn Gly Thr Gly Pro Cys Asn Asn Val Ser Thr Val Gln
195 200 205
Cys Thr His Gly Ile Lys Pro Val Val Ser Thr Gln Leu Leu Leu Asn
210 215 220
Gly Ser Leu Ala Glu Glu Glu Ile Ile Ile Arg Ser Glu Asn Leu Thr
225 230 235 240
Asp Asn Ala Lys Thr Ile Ile Val His Leu Asn Glu Ser Val Glu Ile
245 250 255
Asn Cys Thr Arg Pro Asn Asn Asn Thr Arg Lys Ser Ile Arg Ile Gly
260 265 270
Pro Gly Gln Thr Phe Tyr Ala Thr Gly Asp Ile Ile Gly Asp Ile Arg
275 280 285
Gln Ala His Cys Asn Ile Ser Glu Ala Lys Trp Asn Lys Thr Leu Gln
290 295 300
Arg Val Lys Lys Lys Leu Lys Glu His Phe Pro Asn Lys Thr Ile Lys
305 310 315 320
Phe Ala Pro Ser Ser Gly Gly Asp Leu Glu Ile Thr Thr His Ser Phe
325 330 335
Asn Cys Arg Gly Glu Phe Phe Tyr Cys Asn Thr Ser Lys Leu Phe Asn
340 345 350
Ser Thr Tyr Asn Asn Thr Thr Ser Asn Ser Thr Ile Thr Leu Pro Cys
355 360 365
Arg Ile Lys Gln Ile Ile Asn Met Trp Gln Glu Val Gly Arg Ala Met
370 375 380
Tyr Ala Pro Pro Ile Ala Gly Asn Ile Thr Cys Lys Ser Asn Ile Thr
385 390 395 400
Gly Leu Leu Leu Thr Arg Asp Gly Gly Asn Asn Asn Asn Asn Thr Glu
405 410 415
Thr Phe Arg Pro Gly Gly Gly Asp Met Arg Asp Asn Trp Arg Ser Glu
420 425 430
Leu Tyr Lys Tyr Lys Val Val Glu Ile Lys Pro Leu Gly Ile Ala Pro
435 440 445
Thr Lys Ala Lys Arg Arg Val Val Glu Arg Glu Lys Arg Arg Ala Val
450 455 460
Gly Ile Gly Ala Val Phe Leu Gly Phe Leu Gly Ala Ala Gly Ser Thr
465 470 475 480
Met Gly Ala Ala Ser Ile Thr Leu Thr Val Gln Ala Arg Gln Leu Leu
485 490 495
Ser Gly Ile Val Gln Gln Gln Ser Asn Leu Leu Arg Ala Ile Glu Ala
500 505 510
Gln Gln His Met Leu Gln Leu Thr Val Trp Gly Ile Lys Gln Leu Gln
515 520 525
Ala Arg Val Leu Ala Ile Glu Arg Tyr Leu Lys Asp Gln Gln Leu Leu
530 535 540
Gly Ile Trp Gly Cys Ser Gly Lys Leu Ile Cys Thr Thr Ala Val Pro
545 550 555 560
Trp Asn Ser Ser Trp Ser Asn Lys Ser Gln Glu Asp Ile Trp Asp Asn
565 570 575
Met Thr Trp Met Gln Trp Asp Arg Glu Ile Ser Asn Tyr Thr Asp Thr
580 585 590
Ile Tyr Arg Leu Leu Glu Glu Ser Gln Asn Gln Gln Glu Lys Asn Glu
595 600 605
Lys Asp Leu Leu Ala Leu Asp
610 615
<210> 3
<211> 616
<212> PRT
<213> Artificial Sequence
<220>
<223> ConC_SOSIP sequence
<400> 3
Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys Glu Ala
1 5 10 15
Lys Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Glu Lys Glu
20 25 30
Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp Pro Asn
35 40 45
Pro Gln Glu Met Val Leu Glu Asn Val Thr Glu Asn Phe Asn Met Trp
50 55 60
Lys Asn Asp Met Val Asp Gln Met His Glu Asp Ile Ile Ser Leu Trp
65 70 75 80
Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val Thr
85 90 95
Leu Asn Cys Thr Asn Val Asn Val Thr Asn Thr Asn Asn Asn Asn Met
100 105 110
Lys Glu Glu Met Lys Asn Cys Ser Phe Asn Thr Thr Thr Glu Ile Arg
115 120 125
Asp Lys Lys Gln Lys Glu Tyr Ala Leu Phe Tyr Arg Leu Asp Ile Val
130 135 140
Pro Leu Asn Glu Asn Ser Ser Glu Tyr Arg Leu Ile Asn Cys Asn Thr
145 150 155 160
Ser Thr Ile Thr Gln Ala Cys Pro Lys Val Ser Phe Asp Pro Ile Pro
165 170 175
Ile His Tyr Cys Ala Pro Ala Gly Tyr Ala Ile Leu Lys Cys Asn Asn
180 185 190
Lys Thr Phe Asn Gly Thr Gly Pro Cys Asn Asn Val Ser Thr Val Gln
195 200 205
Cys Thr His Gly Ile Lys Pro Val Val Ser Thr Gln Leu Leu Leu Asn
210 215 220
Gly Ser Leu Ala Glu Glu Glu Ile Ile Ile Arg Ser Glu Asn Leu Thr
225 230 235 240
Asp Asn Ala Lys Thr Ile Ile Val His Leu Asn Glu Ser Val Glu Ile
245 250 255
Asn Cys Thr Arg Pro Asn Asn Asn Thr Arg Lys Ser Ile Arg Ile Gly
260 265 270
Pro Gly Gln Thr Phe Tyr Ala Thr Gly Asp Ile Ile Gly Asp Ile Arg
275 280 285
Gln Ala His Cys Asn Ile Ser Glu Ala Lys Trp Asn Lys Thr Leu Gln
290 295 300
Arg Val Lys Lys Lys Leu Lys Glu His Phe Pro Asn Lys Thr Ile Lys
305 310 315 320
Phe Ala Pro Ser Ser Gly Gly Asp Leu Glu Ile Thr Thr His Ser Phe
325 330 335
Asn Cys Arg Gly Glu Phe Phe Tyr Cys Asn Thr Ser Lys Leu Phe Asn
340 345 350
Ser Thr Tyr Asn Asn Thr Thr Ser Asn Ser Thr Ile Thr Leu Pro Cys
355 360 365
Arg Ile Lys Gln Ile Ile Asn Met Trp Gln Glu Val Gly Arg Ala Met
370 375 380
Tyr Ala Pro Pro Ile Ala Gly Asn Ile Thr Cys Lys Ser Asn Ile Thr
385 390 395 400
Gly Leu Leu Leu Thr Arg Asp Gly Gly Asn Asn Asn Asn Asn Thr Glu
405 410 415
Thr Phe Arg Pro Gly Gly Gly Asp Met Arg Asp Asn Trp Arg Ser Glu
420 425 430
Leu Tyr Lys Tyr Lys Val Val Glu Ile Lys Pro Leu Gly Ile Ala Pro
435 440 445
Thr Lys Cys Lys Arg Arg Val Val Glu Arg Arg Arg Arg Arg Arg Ala
450 455 460
Val Gly Ile Gly Ala Val Phe Leu Gly Phe Leu Gly Ala Ala Gly Ser
465 470 475 480
Thr Met Gly Ala Ala Ser Ile Thr Leu Thr Val Gln Ala Arg Gln Leu
485 490 495
Leu Ser Gly Ile Val Gln Gln Gln Ser Asn Leu Leu Arg Ala Pro Glu
500 505 510
Ala Gln Gln His Met Leu Gln Leu Thr Val Trp Gly Ile Lys Gln Leu
515 520 525
Gln Ala Arg Val Leu Ala Ile Glu Arg Tyr Leu Lys Asp Gln Gln Leu
530 535 540
Leu Gly Ile Trp Gly Cys Ser Gly Lys Leu Ile Cys Cys Thr Ala Val
545 550 555 560
Pro Trp Asn Ser Ser Trp Ser Asn Lys Ser Gln Glu Asp Ile Trp Asp
565 570 575
Asn Met Thr Trp Met Gln Trp Asp Arg Glu Ile Ser Asn Tyr Thr Asp
580 585 590
Thr Ile Tyr Arg Leu Leu Glu Glu Ser Gln Asn Gln Gln Glu Lys Asn
595 600 605
Glu Lys Asp Leu Leu Ala Leu Asp
610 615
<210> 4
<211> 630
<212> PRT
<213> Artificial Sequence
<220>
<223> HIV Env consensus Clade B sequence
<400> 4
Ala Glu Lys Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys
1 5 10 15
Glu Ala Thr Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Asp
20 25 30
Thr Glu Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp
35 40 45
Pro Asn Pro Gln Glu Val Val Leu Glu Asn Val Thr Glu Asn Phe Asn
50 55 60
Met Trp Lys Asn Asn Met Val Glu Gln Met His Glu Asp Ile Ile Ser
65 70 75 80
Leu Trp Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys
85 90 95
Val Thr Leu Asn Cys Thr Asp Leu Asn Asn Asn Thr Thr Asn Asn Asn
100 105 110
Ser Ser Ser Glu Lys Met Glu Lys Gly Glu Ile Lys Asn Cys Ser Phe
115 120 125
Asn Ile Thr Thr Ser Ile Arg Asp Lys Val Gln Lys Glu Tyr Ala Leu
130 135 140
Phe Tyr Lys Leu Asp Val Val Pro Ile Asp Asn Asn Asn Thr Ser Tyr
145 150 155 160
Arg Leu Ile Ser Cys Asn Thr Ser Val Ile Thr Gln Ala Cys Pro Lys
165 170 175
Val Ser Phe Glu Pro Ile Pro Ile His Tyr Cys Ala Pro Ala Gly Phe
180 185 190
Ala Ile Leu Lys Cys Asn Asp Lys Lys Phe Asn Gly Thr Gly Pro Cys
195 200 205
Thr Asn Val Ser Thr Val Gln Cys Thr His Gly Ile Arg Pro Val Val
210 215 220
Ser Thr Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu Glu Glu Val Val
225 230 235 240
Ile Arg Ser Glu Asn Phe Thr Asp Asn Ala Lys Thr Ile Ile Val Gln
245 250 255
Leu Asn Glu Ser Val Glu Ile Asn Cys Thr Arg Pro Asn Asn Asn Thr
260 265 270
Arg Lys Ser Ile His Ile Gly Pro Gly Arg Ala Phe Tyr Ala Thr Gly
275 280 285
Asp Ile Ile Gly Asp Ile Arg Gln Ala His Cys Asn Ile Ser Arg Thr
290 295 300
Lys Trp Asn Asn Thr Leu Lys Gln Ile Val Lys Lys Leu Arg Glu Gln
305 310 315 320
Phe Gly Asn Lys Thr Ile Val Phe Asn Gln Ser Ser Gly Gly Asp Pro
325 330 335
Glu Ile Val Met His Ser Phe Asn Cys Gly Gly Glu Phe Phe Tyr Cys
340 345 350
Asn Thr Thr Gln Leu Phe Asn Ser Thr Trp Asn Ser Asn Gly Thr Trp
355 360 365
Asn Asn Thr Thr Gly Asn Asp Thr Ile Thr Leu Pro Cys Arg Ile Lys
370 375 380
Gln Ile Ile Asn Met Trp Gln Glu Val Gly Lys Ala Met Tyr Ala Pro
385 390 395 400
Pro Ile Arg Gly Gln Ile Arg Cys Ser Ser Asn Ile Thr Gly Leu Leu
405 410 415
Leu Thr Arg Asp Gly Gly Asn Asn Asn Asn Asn Thr Thr Glu Thr Phe
420 425 430
Arg Pro Gly Gly Gly Asp Met Arg Asp Asn Trp Arg Ser Glu Leu Tyr
435 440 445
Lys Tyr Lys Val Val Lys Ile Glu Pro Leu Gly Val Ala Pro Thr Lys
450 455 460
Cys Lys Arg Arg Val Val Gln Arg Arg Arg Arg Arg Arg Ala Val Gly
465 470 475 480
Ile Gly Ala Met Phe Leu Gly Phe Leu Gly Ala Ala Gly Ser Thr Met
485 490 495
Gly Ala Ala Ser Ile Thr Leu Thr Val Gln Ala Arg Gln Leu Leu Ser
500 505 510
Gly Ile Val Gln Gln Gln Asn Asn Leu Leu Arg Ala Pro Glu Ala Gln
515 520 525
Gln His Leu Leu Gln Leu Thr Val Trp Gly Ile Lys Gln Leu Gln Ala
530 535 540
Arg Val Leu Ala Val Glu Arg Tyr Leu Lys Asp Gln Gln Leu Leu Gly
545 550 555 560
Ile Trp Gly Cys Ser Gly Lys Leu Ile Cys Cys Thr Ala Val Pro Trp
565 570 575
Asn Thr Ser Trp Ser Asn Lys Ser Leu Asp Glu Ile Trp Asp Asn Met
580 585 590
Thr Trp Met Gln Trp Glu Arg Glu Ile Asp Asn Tyr Thr Gly Leu Ile
595 600 605
Tyr Thr Leu Ile Glu Glu Ser Gln Asn Gln Gln Glu Lys Asn Glu Gln
610 615 620
Glu Leu Leu Glu Leu Asp
625 630
<210> 5
<211> 630
<212> PRT
<213> Artificial Sequence
<220>
<223> ConB_SOSIP sequence
<400> 5
Ala Glu Lys Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys
1 5 10 15
Glu Ala Thr Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Asp
20 25 30
Thr Glu Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp
35 40 45
Pro Asn Pro Gln Glu Val Val Leu Glu Asn Val Thr Glu Asn Phe Asn
50 55 60
Met Trp Lys Asn Asn Met Val Glu Gln Met His Glu Asp Ile Ile Ser
65 70 75 80
Leu Trp Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys
85 90 95
Val Thr Leu Asn Cys Thr Asp Leu Asn Asn Asn Thr Thr Asn Asn Asn
100 105 110
Ser Ser Ser Glu Lys Met Glu Lys Gly Glu Ile Lys Asn Cys Ser Phe
115 120 125
Asn Ile Thr Thr Ser Ile Arg Asp Lys Val Gln Lys Glu Tyr Ala Leu
130 135 140
Phe Tyr Lys Leu Asp Val Val Pro Ile Asp Asn Asn Asn Thr Ser Tyr
145 150 155 160
Arg Leu Ile Ser Cys Asn Thr Ser Val Ile Thr Gln Ala Cys Pro Lys
165 170 175
Val Ser Phe Glu Pro Ile Pro Ile His Tyr Cys Ala Pro Ala Gly Phe
180 185 190
Ala Ile Leu Lys Cys Asn Asp Lys Lys Phe Asn Gly Thr Gly Pro Cys
195 200 205
Thr Asn Val Ser Thr Val Gln Cys Thr His Gly Ile Arg Pro Val Val
210 215 220
Ser Thr Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu Glu Glu Val Val
225 230 235 240
Ile Arg Ser Glu Asn Phe Thr Asp Asn Ala Lys Thr Ile Ile Val Gln
245 250 255
Leu Asn Glu Ser Val Glu Ile Asn Cys Thr Arg Pro Asn Asn Asn Thr
260 265 270
Arg Lys Ser Ile His Ile Gly Pro Gly Arg Ala Phe Tyr Ala Thr Gly
275 280 285
Asp Ile Ile Gly Asp Ile Arg Gln Ala His Cys Asn Ile Ser Arg Thr
290 295 300
Lys Trp Asn Asn Thr Leu Lys Gln Ile Val Lys Lys Leu Arg Glu Gln
305 310 315 320
Phe Gly Asn Lys Thr Ile Val Phe Asn Gln Ser Ser Gly Gly Asp Pro
325 330 335
Glu Ile Val Met His Ser Phe Asn Cys Gly Gly Glu Phe Phe Tyr Cys
340 345 350
Asn Thr Thr Gln Leu Phe Asn Ser Thr Trp Asn Ser Asn Gly Thr Trp
355 360 365
Asn Asn Thr Thr Gly Asn Asp Thr Ile Thr Leu Pro Cys Arg Ile Lys
370 375 380
Gln Ile Ile Asn Met Trp Gln Glu Val Gly Lys Ala Met Tyr Ala Pro
385 390 395 400
Pro Ile Arg Gly Gln Ile Arg Cys Ser Ser Asn Ile Thr Gly Leu Leu
405 410 415
Leu Thr Arg Asp Gly Gly Asn Asn Asn Asn Asn Thr Thr Glu Thr Phe
420 425 430
Arg Pro Gly Gly Gly Asp Met Arg Asp Asn Trp Arg Ser Glu Leu Tyr
435 440 445
Lys Tyr Lys Val Val Lys Ile Glu Pro Leu Gly Val Ala Pro Thr Lys
450 455 460
Cys Lys Arg Arg Val Val Gln Arg Arg Arg Arg Arg Arg Ala Val Gly
465 470 475 480
Ile Gly Ala Met Phe Leu Gly Phe Leu Gly Ala Ala Gly Ser Thr Met
485 490 495
Gly Ala Ala Ser Ile Thr Leu Thr Val Gln Ala Arg Gln Leu Leu Ser
500 505 510
Gly Ile Val Gln Gln Gln Asn Asn Leu Leu Arg Ala Pro Glu Ala Gln
515 520 525
Gln His Leu Leu Gln Leu Thr Val Trp Gly Ile Lys Gln Leu Gln Ala
530 535 540
Arg Val Leu Ala Val Glu Arg Tyr Leu Lys Asp Gln Gln Leu Leu Gly
545 550 555 560
Ile Trp Gly Cys Ser Gly Lys Leu Ile Cys Cys Thr Ala Val Pro Trp
565 570 575
Asn Thr Ser Trp Ser Asn Lys Ser Leu Asp Glu Ile Trp Asp Asn Met
580 585 590
Thr Trp Met Gln Trp Glu Arg Glu Ile Asp Asn Tyr Thr Gly Leu Ile
595 600 605
Tyr Thr Leu Ile Glu Glu Ser Gln Asn Gln Gln Glu Lys Asn Glu Gln
610 615 620
Glu Leu Leu Glu Leu Asp
625 630
<210> 6
<211> 625
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic HIV envelope protein Mos2S Env C4 fragment
<400> 6
Met Gly Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys
1 5 10 15
Asp Ala Lys Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Glu
20 25 30
Lys Glu Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp
35 40 45
Pro Asn Pro Gln Glu Ile Val Leu Gly Asn Val Thr Glu Asn Phe Asn
50 55 60
Met Trp Lys Asn Asp Met Val Asp Gln Met His Glu Asp Ile Ile Ser
65 70 75 80
Leu Trp Asp Ala Ser Leu Glu Pro Cys Val Lys Leu Thr Pro Leu Cys
85 90 95
Val Thr Leu Asn Cys Arg Asn Val Arg Asn Val Ser Ser Asn Gly Thr
100 105 110
Tyr Asn Ile Ile His Asn Glu Thr Tyr Lys Glu Met Lys Asn Cys Ser
115 120 125
Phe Asn Ala Thr Thr Val Val Glu Asp Arg Lys Gln Lys Val His Ala
130 135 140
Leu Phe Tyr Arg Leu Asp Ile Val Pro Leu Asp Glu Asn Asn Ser Ser
145 150 155 160
Glu Lys Ser Ser Glu Asn Ser Ser Glu Tyr Tyr Arg Leu Ile Asn Cys
165 170 175
Asn Thr Ser Ala Ile Thr Gln Ala Cys Pro Lys Val Ser Phe Asp Pro
180 185 190
Ile Pro Ile His Tyr Cys Ala Pro Ala Gly Tyr Ala Ile Leu Lys Cys
195 200 205
Asn Asn Lys Thr Phe Asn Gly Thr Gly Pro Cys Asn Asn Val Ser Thr
210 215 220
Val Gln Cys Thr His Gly Ile Lys Pro Val Val Ser Thr Gln Leu Leu
225 230 235 240
Leu Asn Gly Ser Leu Ala Glu Glu Glu Ile Ile Ile Arg Ser Glu Asn
245 250 255
Leu Thr Asn Asn Ala Lys Thr Ile Ile Val His Leu Asn Glu Thr Val
260 265 270
Asn Ile Thr Cys Thr Arg Pro Asn Asn Asn Thr Arg Lys Ser Ile Arg
275 280 285
Ile Gly Pro Gly Gln Thr Phe Tyr Ala Thr Gly Asp Ile Ile Gly Asp
290 295 300
Ile Arg Gln Ala His Cys Asn Leu Ser Arg Asp Gly Trp Asn Lys Thr
305 310 315 320
Leu Gln Gly Val Lys Lys Lys Leu Ala Glu His Phe Pro Asn Lys Thr
325 330 335
Ile Lys Phe Ala Pro His Ser Gly Gly Asp Leu Glu Ile Thr Thr His
340 345 350
Thr Phe Asn Cys Arg Gly Glu Phe Phe Tyr Cys Asn Thr Ser Asn Leu
355 360 365
Phe Asn Glu Ser Asn Ile Glu Arg Asn Asp Ser Ile Ile Thr Leu Pro
370 375 380
Cys Arg Ile Lys Gln Ile Ile Asn Met Trp Gln Glu Val Gly Arg Ala
385 390 395 400
Ile Tyr Ala Pro Pro Ile Ala Gly Asn Ile Thr Cys Arg Ser Asn Ile
405 410 415
Thr Gly Leu Leu Leu Thr Arg Asp Gly Gly Ser Asn Asn Gly Val Pro
420 425 430
Asn Asp Thr Glu Thr Phe Arg Pro Gly Gly Gly Asp Met Arg Asn Asn
435 440 445
Trp Arg Ser Glu Leu Tyr Lys Tyr Lys Val Val Glu Val Lys Pro Leu
450 455 460
Gly Val Ala Pro Thr Glu Ala Lys Arg Arg Val Val Glu Arg Glu Lys
465 470 475 480
Arg Ala Val Gly Ile Gly Ala Val Phe Leu Gly Ile Leu Gly Ala Ala
485 490 495
Gly Ser Thr Met Gly Ala Ala Ser Ile Thr Leu Thr Val Gln Ala Arg
500 505 510
Gln Leu Leu Ser Gly Ile Val Gln Gln Gln Ser Asn Leu Leu Arg Ala
515 520 525
Ile Glu Ala Gln Gln His Met Leu Gln Leu Thr Val Trp Gly Ile Lys
530 535 540
Gln Leu Gln Thr Arg Val Leu Ala Ile Glu Arg Tyr Leu Gln Asp Gln
545 550 555 560
Gln Leu Leu Gly Leu Trp Gly Cys Ser Gly Lys Leu Ile Cys Thr Thr
565 570 575
Ala Val Pro Trp Asn Thr Ser Trp Ser Asn Lys Ser Gln Thr Asp Ile
580 585 590
Trp Asp Asn Met Thr Trp Met Gln Trp Asp Lys Glu Ile Gly Asn Tyr
595 600 605
Thr Gly Glu Ile Tyr Arg Leu Leu Glu Glu Ser Gln Asn Gln Gln Glu
610 615 620
Lys
625
<210> 7
<211> 627
<212> PRT
<213> Artificial Sequence
<220>
<223> DS_sC4_SOSIP_E166R sequence
<400> 7
Met Gly Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys
1 5 10 15
Asp Ala Lys Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Glu
20 25 30
Lys Glu Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp
35 40 45
Pro Asn Pro Gln Glu Ile Val Leu Gly Asn Val Thr Glu Asn Phe Asn
50 55 60
Met Trp Lys Asn Asp Met Val Asp Gln Met His Glu Asp Ile Ile Ser
65 70 75 80
Leu Trp Asp Ala Ser Leu Glu Pro Cys Val Lys Leu Thr Pro Leu Cys
85 90 95
Val Thr Leu Asn Cys Arg Asn Val Arg Asn Val Ser Ser Asn Gly Thr
100 105 110
Tyr Asn Ile Ile His Asn Glu Thr Tyr Lys Glu Met Lys Asn Cys Ser
115 120 125
Phe Asn Ala Thr Thr Val Val Arg Asp Arg Lys Gln Lys Val His Ala
130 135 140
Leu Phe Tyr Arg Leu Asp Ile Val Pro Leu Asp Glu Asn Asn Ser Ser
145 150 155 160
Glu Lys Ser Ser Glu Asn Ser Ser Glu Tyr Tyr Arg Leu Ile Asn Cys
165 170 175
Asn Thr Ser Ala Cys Thr Gln Ala Cys Pro Lys Val Ser Phe Asp Pro
180 185 190
Ile Pro Ile His Tyr Cys Ala Pro Ala Gly Tyr Ala Ile Leu Lys Cys
195 200 205
Asn Asn Lys Thr Phe Asn Gly Thr Gly Pro Cys Asn Asn Val Ser Thr
210 215 220
Val Gln Cys Thr His Gly Ile Lys Pro Val Val Ser Thr Gln Leu Leu
225 230 235 240
Leu Asn Gly Ser Leu Ala Glu Glu Glu Ile Ile Ile Arg Ser Glu Asn
245 250 255
Leu Thr Asn Asn Ala Lys Thr Ile Ile Val His Leu Asn Glu Thr Val
260 265 270
Asn Ile Asn Cys Thr Arg Pro Asn Asn Asn Thr Arg Lys Ser Ile Arg
275 280 285
Ile Gly Pro Gly Gln Thr Phe Tyr Ala Thr Gly Asp Ile Ile Gly Asp
290 295 300
Ile Arg Gln Ala His Cys Asn Leu Ser Arg Asp Gly Trp Asn Lys Thr
305 310 315 320
Leu Gln Gly Val Lys Lys Lys Leu Ala Glu His Phe Pro Asn Lys Thr
325 330 335
Ile Lys Phe Ala Pro His Ser Gly Gly Asp Leu Glu Ile Thr Thr His
340 345 350
Thr Phe Asn Cys Arg Gly Glu Phe Phe Tyr Cys Asn Thr Ser Asn Leu
355 360 365
Phe Asn Glu Ser Asn Ile Glu Arg Asn Asp Ser Ile Ile Thr Leu Pro
370 375 380
Cys Arg Ile Lys Gln Ile Ile Asn Met Trp Gln Glu Val Gly Arg Cys
385 390 395 400
Ile Tyr Ala Pro Pro Ile Ala Gly Asn Ile Thr Cys Arg Ser Asn Ile
405 410 415
Thr Gly Leu Leu Leu Thr Arg Asp Gly Gly Ser Asn Asn Gly Val Pro
420 425 430
Asn Asp Thr Glu Thr Phe Arg Pro Gly Gly Gly Asp Met Arg Asn Asn
435 440 445
Trp Arg Ser Glu Leu Tyr Lys Tyr Lys Val Val Glu Val Lys Pro Leu
450 455 460
Gly Val Ala Pro Thr Glu Cys Lys Arg Arg Val Val Glu Arg Arg Arg
465 470 475 480
Arg Arg Arg Ala Val Gly Ile Gly Ala Val Phe Leu Gly Ile Leu Gly
485 490 495
Ala Ala Gly Ser Thr Met Gly Ala Ala Ser Ile Thr Leu Thr Val Gln
500 505 510
Ala Arg Gln Leu Leu Ser Gly Ile Val Gln Gln Gln Ser Asn Leu Leu
515 520 525
Arg Ala Pro Glu Ala Gln Gln His Met Leu Gln Leu Thr Val Trp Gly
530 535 540
Ile Lys Gln Leu Gln Thr Arg Val Leu Ala Ile Glu Arg Tyr Leu Gln
545 550 555 560
Asp Gln Gln Leu Leu Gly Leu Trp Gly Cys Ser Gly Lys Leu Ile Cys
565 570 575
Cys Thr Ala Val Pro Trp Asn Thr Ser Trp Ser Asn Lys Ser Gln Thr
580 585 590
Asp Ile Trp Asp Asn Met Thr Trp Met Gln Trp Asp Lys Glu Ile Gly
595 600 605
Asn Tyr Thr Gly Glu Ile Tyr Arg Leu Leu Glu Glu Ser Gln Asn Gln
610 615 620
Gln Glu Lys
625
<210> 8
<211> 631
<212> PRT
<213> Artificial Sequence
<220>
<223> Mos1.Env sequence
<400> 8
Ala Gly Lys Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys
1 5 10 15
Glu Ala Thr Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Asp
20 25 30
Thr Glu Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp
35 40 45
Pro Asn Pro Gln Glu Val Val Leu Glu Asn Val Thr Glu Asn Phe Asn
50 55 60
Met Trp Lys Asn Asn Met Val Glu Gln Met His Glu Asp Ile Ile Ser
65 70 75 80
Leu Trp Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys
85 90 95
Val Thr Leu Asn Cys Thr Asp Asp Val Arg Asn Val Thr Asn Asn Ala
100 105 110
Thr Asn Thr Asn Ser Ser Trp Gly Glu Pro Met Glu Lys Gly Glu Ile
115 120 125
Lys Asn Cys Ser Phe Asn Ile Thr Thr Ser Ile Arg Asn Lys Val Gln
130 135 140
Lys Gln Tyr Ala Leu Phe Tyr Lys Leu Asp Val Val Pro Ile Asp Asn
145 150 155 160
Asp Ser Asn Asn Thr Asn Tyr Arg Leu Ile Ser Cys Asn Thr Ser Val
165 170 175
Ile Thr Gln Ala Cys Pro Lys Val Ser Phe Glu Pro Ile Pro Ile His
180 185 190
Tyr Cys Ala Pro Ala Gly Phe Ala Ile Leu Lys Cys Asn Asp Lys Lys
195 200 205
Phe Asn Gly Thr Gly Pro Cys Thr Asn Val Ser Thr Val Gln Cys Thr
210 215 220
His Gly Ile Arg Pro Val Val Ser Thr Gln Leu Leu Leu Asn Gly Ser
225 230 235 240
Leu Ala Glu Glu Glu Val Val Ile Arg Ser Glu Asn Phe Thr Asn Asn
245 250 255
Ala Lys Thr Ile Met Val Gln Leu Asn Val Ser Val Glu Ile Asn Cys
260 265 270
Thr Arg Pro Asn Asn Asn Thr Arg Lys Ser Ile His Ile Gly Pro Gly
275 280 285
Arg Ala Phe Tyr Thr Ala Gly Asp Ile Ile Gly Asp Ile Arg Gln Ala
290 295 300
His Cys Asn Ile Ser Arg Ala Asn Trp Asn Asn Thr Leu Arg Gln Ile
305 310 315 320
Val Glu Lys Leu Gly Lys Gln Phe Gly Asn Asn Lys Thr Ile Val Phe
325 330 335
Asn His Ser Ser Gly Gly Asp Pro Glu Ile Val Met His Ser Phe Asn
340 345 350
Cys Gly Gly Glu Phe Phe Tyr Cys Asn Ser Thr Lys Leu Phe Asn Ser
355 360 365
Thr Trp Thr Trp Asn Asn Ser Thr Trp Asn Asn Thr Lys Arg Ser Asn
370 375 380
Asp Thr Glu Glu His Ile Thr Leu Pro Cys Arg Ile Lys Gln Ile Ile
385 390 395 400
Asn Met Trp Gln Glu Val Gly Lys Ala Met Tyr Ala Pro Pro Ile Arg
405 410 415
Gly Gln Ile Arg Cys Ser Ser Asn Ile Thr Gly Leu Leu Leu Thr Arg
420 425 430
Asp Gly Gly Asn Asp Thr Ser Gly Thr Glu Ile Phe Arg Pro Gly Gly
435 440 445
Gly Asp Met Arg Asp Asn Trp Arg Ser Glu Leu Tyr Lys Tyr Lys Val
450 455 460
Val Lys Ile Glu Pro Leu Gly Val Ala Pro Thr Lys Ala Lys Arg Arg
465 470 475 480
Val Val Gln Ser Glu Lys Ser Ala Val Gly Ile Gly Ala Val Phe Leu
485 490 495
Gly Phe Leu Gly Ala Ala Gly Ser Thr Met Gly Ala Ala Ser Met Thr
500 505 510
Leu Thr Val Gln Ala Arg Leu Leu Leu Ser Gly Ile Val Gln Gln Gln
515 520 525
Asn Asn Leu Leu Arg Ala Ile Glu Ala Gln Gln His Leu Leu Gln Leu
530 535 540
Thr Val Trp Gly Ile Lys Gln Leu Gln Ala Arg Val Leu Ala Val Glu
545 550 555 560
Arg Tyr Leu Lys Asp Gln Gln Leu Leu Gly Ile Trp Gly Cys Ser Gly
565 570 575
Lys Leu Ile Cys Thr Thr Thr Val Pro Trp Asn Ala Ser Trp Ser Asn
580 585 590
Lys Ser Leu Asp Lys Ile Trp Asn Asn Met Thr Trp Met Glu Trp Glu
595 600 605
Arg Glu Ile Asn Asn Tyr Thr Ser Leu Ile Tyr Thr Leu Ile Glu Glu
610 615 620
Ser Gln Asn Gln Gln Glu Lys
625 630
<210> 9
<211> 630
<212> PRT
<213> Artificial Sequence
<220>
<223> Mos2.Env sequence
<400> 9
Met Gly Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys
1 5 10 15
Glu Ala Lys Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Glu
20 25 30
Lys Glu Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp
35 40 45
Pro Asn Pro Gln Glu Met Val Leu Glu Asn Val Thr Glu Asn Phe Asn
50 55 60
Met Trp Lys Asn Asp Met Val Asp Gln Met His Glu Asp Ile Ile Arg
65 70 75 80
Leu Trp Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys
85 90 95
Val Thr Leu Glu Cys Arg Asn Val Arg Asn Val Ser Ser Asn Gly Thr
100 105 110
Tyr Asn Ile Ile His Asn Glu Thr Tyr Lys Glu Met Lys Asn Cys Ser
115 120 125
Phe Asn Ala Thr Thr Val Val Glu Asp Arg Lys Gln Lys Val His Ala
130 135 140
Leu Phe Tyr Arg Leu Asp Ile Val Pro Leu Asp Glu Asn Asn Ser Ser
145 150 155 160
Glu Lys Ser Ser Glu Asn Ser Ser Glu Tyr Tyr Arg Leu Ile Asn Cys
165 170 175
Asn Thr Ser Ala Ile Thr Gln Ala Cys Pro Lys Val Ser Phe Asp Pro
180 185 190
Ile Pro Ile His Tyr Cys Ala Pro Ala Gly Tyr Ala Ile Leu Lys Cys
195 200 205
Asn Asn Lys Thr Phe Asn Gly Thr Gly Pro Cys Asn Asn Val Ser Thr
210 215 220
Val Gln Cys Thr His Gly Ile Lys Pro Val Val Ser Thr Gln Leu Leu
225 230 235 240
Leu Asn Gly Ser Leu Ala Glu Glu Glu Ile Ile Ile Arg Ser Glu Asn
245 250 255
Leu Thr Asn Asn Ala Lys Thr Ile Ile Val His Leu Asn Glu Thr Val
260 265 270
Asn Ile Thr Cys Thr Arg Pro Asn Asn Asn Thr Arg Lys Ser Ile Arg
275 280 285
Ile Gly Pro Gly Gln Thr Phe Tyr Ala Thr Gly Asp Ile Ile Gly Asp
290 295 300
Ile Arg Gln Ala His Cys Asn Leu Ser Arg Asp Gly Trp Asn Lys Thr
305 310 315 320
Leu Gln Gly Val Lys Lys Lys Leu Ala Glu His Phe Pro Asn Lys Thr
325 330 335
Ile Asn Phe Thr Ser Ser Ser Gly Gly Asp Leu Glu Ile Thr Thr His
340 345 350
Ser Phe Asn Cys Arg Gly Glu Phe Phe Tyr Cys Asn Thr Ser Gly Leu
355 360 365
Phe Asn Gly Thr Tyr Met Pro Asn Gly Thr Asn Ser Asn Ser Ser Ser
370 375 380
Asn Ile Thr Leu Pro Cys Arg Ile Lys Gln Ile Ile Asn Met Trp Gln
385 390 395 400
Glu Val Gly Arg Ala Met Tyr Ala Pro Pro Ile Ala Gly Asn Ile Thr
405 410 415
Cys Arg Ser Asn Ile Thr Gly Leu Leu Leu Thr Arg Asp Gly Gly Ser
420 425 430
Asn Asn Gly Val Pro Asn Asp Thr Glu Thr Phe Arg Pro Gly Gly Gly
435 440 445
Asp Met Arg Asn Asn Trp Arg Ser Glu Leu Tyr Lys Tyr Lys Val Val
450 455 460
Glu Val Lys Pro Leu Gly Val Ala Pro Thr Glu Ala Lys Arg Arg Val
465 470 475 480
Val Glu Arg Glu Lys Arg Ala Val Gly Ile Gly Ala Val Phe Leu Gly
485 490 495
Ile Leu Gly Ala Ala Gly Ser Thr Met Gly Ala Ala Ser Ile Thr Leu
500 505 510
Thr Val Gln Ala Arg Gln Leu Leu Ser Gly Ile Val Gln Gln Gln Ser
515 520 525
Asn Leu Leu Arg Ala Ile Glu Ala Gln Gln His Met Leu Gln Leu Thr
530 535 540
Val Trp Gly Ile Lys Gln Leu Gln Thr Arg Val Leu Ala Ile Glu Arg
545 550 555 560
Tyr Leu Gln Asp Gln Gln Leu Leu Gly Leu Trp Gly Cys Ser Gly Lys
565 570 575
Leu Ile Cys Thr Thr Ala Val Pro Trp Asn Thr Ser Trp Ser Asn Lys
580 585 590
Ser Gln Thr Asp Ile Trp Asp Asn Met Thr Trp Met Gln Trp Asp Lys
595 600 605
Glu Ile Gly Asn Tyr Thr Gly Glu Ile Tyr Arg Leu Leu Glu Glu Ser
610 615 620
Gln Asn Gln Gln Glu Lys
625 630
<210> 10
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> furin cleavage site mutant sequence
<400> 10
Arg Arg Arg Arg Arg Arg
1 5
<210> 11
<211> 31
<212> PRT
<213> Artificial Sequence
<220>
<223> signal sequence
<400> 11
Met Arg Val Arg Gly Ile Leu Arg Asn Trp Gln Gln Trp Trp Ile Trp
1 5 10 15
Gly Ile Leu Gly Phe Trp Met Leu Met Ile Cys Asn Val Val Gly
20 25 30
<210> 12
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> example of 8 amino acid sequence that can replace HR1 loop
<400> 12
Asn Pro Asp Trp Leu Pro Asp Met
1 5
<210> 13
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> example of 8 amino acid sequence that can replace HR1 loop
<400> 13
Gly Ser Gly Ser Gly Ser Gly Ser
1 5
<210> 14
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> example of 8 amino acid sequence that can replace HR1 loop
<400> 14
Asp Asp Val His Pro Asp Trp Asp
1 5
<210> 15
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> example of 8 amino acid sequence that can replace HR1 loop
<400> 15
Arg Asp Thr Phe Ala Leu Met Met
1 5
<210> 16
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> example of 8 amino acid sequence that can replace HR1 loop
<400> 16
Asp Glu Glu Lys Val Met Asp Phe
1 5
<210> 17
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> example of 8 amino acid sequence that can replace HR1 loop
<400> 17
Asp Glu Asp Pro His Trp Asp Pro
1 5
<210> 18
<211> 29
<212> PRT
<213> Artificial Sequence
<220>
<223> signal sequence
<400> 18
Met Arg Val Lys Gly Ile Arg Lys Asn Tyr Gln His Leu Trp Arg Trp
1 5 10 15
Gly Thr Met Leu Leu Gly Met Leu Met Ile Cys Ser Ala
20 25
<210> 19
<211> 61
<212> PRT
<213> Artificial Sequence
<220>
<223> tag sequence
<400> 19
Ala Ala Ala Leu Pro Glu Thr Gly Gly Gly Ser Asp Tyr Lys Asp Asp
1 5 10 15
Asp Asp Lys Pro Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
20 25 30
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
35 40 45
Gly Ser Gly Gly Gly Gly Ser His His His His His His
50 55 60
<210> 20
<211> 616
<212> PRT
<213> Artificial Sequence
<220>
<223> stabilized ConC_SOSIP Env protein (HIV160544)
<400> 20
Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys Glu Ala
1 5 10 15
Lys Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Glu Lys Glu
20 25 30
Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp Pro Asn
35 40 45
Pro Gln Glu Met Val Leu Glu Asn Val Thr Glu Asn Phe Asn Met Trp
50 55 60
Lys Asn Asp Met Val Asp Gln Met His Glu Asp Ile Ile Ser Leu Trp
65 70 75 80
Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val Thr
85 90 95
Leu Asn Cys Thr Asn Val Asn Val Thr Asn Thr Asn Asn Asn Asn Met
100 105 110
Lys Glu Glu Met Lys Asn Cys Ser Phe Asn Thr Thr Thr Glu Ile Arg
115 120 125
Asp Lys Lys Gln Lys Glu Tyr Ala Leu Phe Tyr Arg Leu Asp Ile Val
130 135 140
Pro Leu Asn Glu Asn Ser Ser Glu Tyr Arg Leu Ile Asn Cys Asn Thr
145 150 155 160
Ser Thr Ile Thr Gln Ile Cys Pro Lys Val Ser Phe Asp Pro Ile Pro
165 170 175
Ile His Tyr Cys Ala Pro Ala Gly Tyr Ala Ile Leu Lys Cys Asn Asn
180 185 190
Lys Thr Phe Asn Gly Thr Gly Pro Cys Asn Asn Val Ser Thr Val Gln
195 200 205
Cys Thr His Gly Ile Lys Pro Val Val Ser Thr Gln Leu Leu Leu Asn
210 215 220
Gly Ser Leu Ala Glu Glu Glu Ile Ile Ile Arg Ser Glu Asn Leu Thr
225 230 235 240
Asp Asn Ala Lys Thr Ile Ile Val His Leu Asn Glu Ser Val Glu Ile
245 250 255
Asn Cys Thr Arg Pro Asn Asn Asn Thr Arg Lys Ser Ile Arg Ile Gly
260 265 270
Pro Gly Gln Thr Phe Tyr Ala Thr Gly Asp Ile Ile Gly Asp Ile Arg
275 280 285
Gln Ala His Cys Asn Ile Ser Glu Ala Lys Trp Asn Lys Thr Leu Gln
290 295 300
Arg Val Lys Lys Lys Leu Lys Glu His Phe Pro Asn Lys Thr Ile Lys
305 310 315 320
Phe Ala Pro Ser Ser Gly Gly Asp Leu Glu Ile Thr Thr His Ser Phe
325 330 335
Asn Cys Arg Gly Glu Phe Phe Tyr Cys Asn Thr Ser Lys Leu Phe Asn
340 345 350
Ser Thr Tyr Asn Asn Thr Thr Ser Asn Ser Thr Ile Thr Leu Pro Cys
355 360 365
Arg Ile Lys Gln Ile Ile Asn Met Trp Gln Glu Val Gly Arg Ala Met
370 375 380
Tyr Ala Pro Pro Ile Ala Gly Asn Ile Thr Cys Lys Ser Asn Ile Thr
385 390 395 400
Gly Leu Leu Leu Thr Arg Asp Gly Gly Asn Asn Asn Asn Asn Thr Glu
405 410 415
Thr Phe Arg Pro Gly Gly Gly Asp Met Arg Asp Asn Trp Arg Ser Glu
420 425 430
Leu Tyr Lys Tyr Lys Val Val Glu Ile Lys Pro Leu Gly Ile Ala Pro
435 440 445
Thr Lys Cys Lys Arg Arg Val Val Glu Arg Arg Arg Arg Arg Arg Ala
450 455 460
Val Gly Ile Gly Ala Val Phe Leu Gly Phe Leu Gly Ala Ala Gly Ser
465 470 475 480
Thr Met Gly Ala Ala Ser Asn Thr Leu Thr Val Gln Ala Arg Gln Leu
485 490 495
Leu Ser Gly Ile Val Gln Gln Gln Ser Asn Leu Leu Arg Ala Pro Glu
500 505 510
Ala Gln Gln His Met Leu Gln Leu Thr Val Trp Gly Phe Lys Gln Leu
515 520 525
Gln Ala Arg Val Leu Ala Ile Glu Arg Tyr Leu Glu Val Gln Gln Leu
530 535 540
Leu Gly Ile Trp Gly Cys Ser Gly Lys Leu Ile Cys Cys Thr Ala Val
545 550 555 560
Pro Trp Asn Ser Ser Trp Ser Asn Lys Ser Gln Glu Asp Ile Trp Asp
565 570 575
Asn Met Thr Trp Met Gln Trp Asp Arg Glu Ile Ser Asn Tyr Thr Asp
580 585 590
Thr Ile Tyr Arg Leu Leu Glu Glu Ser Gln Phe Gln Gln Glu Ile Asn
595 600 605
Glu Lys Asp Leu Leu Ala Leu Asp
610 615
<210> 21
<211> 634
<212> PRT
<213> Artificial Sequence
<220>
<223> BG505_SOSIP Env protein (HIV150673)
<400> 21
Ala Glu Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys
1 5 10 15
Asp Ala Glu Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Glu
20 25 30
Thr Glu Lys His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp
35 40 45
Pro Asn Pro Gln Glu Ile His Leu Glu Asn Val Thr Glu Glu Phe Asn
50 55 60
Met Trp Lys Asn Asn Met Val Glu Gln Met His Thr Asp Ile Ile Ser
65 70 75 80
Leu Trp Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys
85 90 95
Val Thr Leu Gln Cys Thr Asn Val Thr Asn Asn Ile Thr Asp Asp Met
100 105 110
Arg Gly Glu Leu Lys Asn Cys Ser Phe Asn Met Thr Thr Glu Leu Arg
115 120 125
Asp Lys Lys Gln Lys Val Tyr Ser Leu Phe Tyr Arg Leu Asp Val Val
130 135 140
Gln Ile Asn Glu Asn Gln Gly Asn Arg Ser Asn Asn Ser Asn Lys Glu
145 150 155 160
Tyr Arg Leu Ile Asn Cys Asn Thr Ser Ala Ile Thr Gln Ala Cys Pro
165 170 175
Lys Val Ser Phe Glu Pro Ile Pro Ile His Tyr Cys Ala Pro Ala Gly
180 185 190
Phe Ala Ile Leu Lys Cys Lys Asp Lys Lys Phe Asn Gly Thr Gly Pro
195 200 205
Cys Pro Ser Val Ser Thr Val Gln Cys Thr His Gly Ile Lys Pro Val
210 215 220
Val Ser Thr Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu Glu Glu Val
225 230 235 240
Met Ile Arg Ser Glu Asn Ile Thr Asn Asn Ala Lys Asn Ile Leu Val
245 250 255
Gln Phe Asn Thr Pro Val Gln Ile Asn Cys Thr Arg Pro Asn Asn Asn
260 265 270
Thr Arg Lys Ser Ile Arg Ile Gly Pro Gly Gln Ala Phe Tyr Ala Thr
275 280 285
Gly Asp Ile Ile Gly Asp Ile Arg Gln Ala His Cys Asn Val Ser Lys
290 295 300
Ala Thr Trp Asn Glu Thr Leu Gly Lys Val Val Lys Gln Leu Arg Lys
305 310 315 320
His Phe Gly Asn Asn Thr Ile Ile Arg Phe Ala Asn Ser Ser Gly Gly
325 330 335
Asp Leu Glu Val Thr Thr His Ser Phe Asn Cys Gly Gly Glu Phe Phe
340 345 350
Tyr Cys Asn Thr Ser Gly Leu Phe Asn Ser Thr Trp Ile Ser Asn Thr
355 360 365
Ser Val Gln Gly Ser Asn Ser Thr Gly Ser Asn Asp Ser Ile Thr Leu
370 375 380
Pro Cys Arg Ile Lys Gln Ile Ile Asn Met Trp Gln Arg Ile Gly Gln
385 390 395 400
Ala Met Tyr Ala Pro Pro Ile Gln Gly Val Ile Arg Cys Val Ser Asn
405 410 415
Ile Thr Gly Leu Ile Leu Thr Arg Asp Gly Gly Ser Thr Asn Ser Thr
420 425 430
Thr Glu Thr Phe Arg Pro Gly Gly Gly Asp Met Arg Asp Asn Trp Arg
435 440 445
Ser Glu Leu Tyr Lys Tyr Lys Val Val Lys Ile Glu Pro Leu Gly Val
450 455 460
Ala Pro Thr Arg Cys Lys Arg Arg Val Val Gly Arg Arg Arg Arg Arg
465 470 475 480
Arg Ala Val Gly Ile Gly Ala Val Phe Leu Gly Phe Leu Gly Ala Ala
485 490 495
Gly Ser Thr Met Gly Ala Ala Ser Met Thr Leu Thr Val Gln Ala Arg
500 505 510
Asn Leu Leu Ser Gly Ile Val Gln Gln Gln Ser Asn Leu Leu Arg Ala
515 520 525
Pro Glu Ala Gln Gln His Leu Leu Lys Leu Thr Val Trp Gly Ile Lys
530 535 540
Gln Leu Gln Ala Arg Val Leu Ala Val Glu Arg Tyr Leu Arg Asp Gln
545 550 555 560
Gln Leu Leu Gly Ile Trp Gly Cys Ser Gly Lys Leu Ile Cys Cys Thr
565 570 575
Asn Val Pro Trp Asn Ser Ser Trp Ser Asn Arg Asn Leu Ser Glu Ile
580 585 590
Trp Asp Asn Met Thr Trp Leu Gln Trp Asp Lys Glu Ile Ser Asn Tyr
595 600 605
Thr Gln Ile Ile Tyr Gly Leu Leu Glu Glu Ser Gln Asn Gln Gln Glu
610 615 620
Lys Asn Glu Gln Asp Leu Leu Ala Leu Asp
625 630
<210> 22
<211> 634
<212> PRT
<213> Artificial Sequence
<220>
<223> stabilized BG505_SOSIP Env protein (HIV170863)
<400> 22
Ala Glu Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys
1 5 10 15
Asp Ala Glu Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Glu
20 25 30
Thr Glu Lys His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp
35 40 45
Pro Asn Pro Gln Glu Ile His Leu Glu Asn Val Thr Glu Glu Phe Asn
50 55 60
Met Trp Lys Asn Asn Met Val Glu Gln Met His Thr Asp Ile Ile Ser
65 70 75 80
Leu Trp Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys
85 90 95
Val Thr Leu Gln Cys Thr Asn Val Thr Asn Asn Ile Thr Asp Asp Met
100 105 110
Arg Gly Glu Leu Lys Asn Cys Ser Phe Asn Met Thr Thr Glu Leu Arg
115 120 125
Asp Lys Lys Gln Lys Val Tyr Ser Leu Phe Tyr Arg Leu Asp Val Val
130 135 140
Gln Ile Asn Glu Asn Gln Gly Asn Arg Ser Asn Asn Ser Asn Lys Glu
145 150 155 160
Tyr Arg Leu Ile Asn Cys Asn Thr Ser Ala Ile Thr Gln Ala Cys Pro
165 170 175
Lys Val Ser Phe Glu Pro Ile Pro Ile His Tyr Cys Ala Pro Ala Gly
180 185 190
Phe Ala Ile Leu Lys Cys Lys Asp Lys Lys Phe Asn Gly Thr Gly Pro
195 200 205
Cys Pro Ser Val Ser Thr Val Gln Cys Thr His Gly Ile Lys Pro Val
210 215 220
Val Ser Thr Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu Glu Glu Val
225 230 235 240
Met Ile Arg Ser Glu Asn Ile Thr Asn Asn Ala Lys Asn Ile Leu Val
245 250 255
Gln Phe Asn Thr Pro Val Gln Ile Asn Cys Thr Arg Pro Asn Asn Asn
260 265 270
Thr Arg Lys Ser Ile Arg Ile Gly Pro Gly Gln Ala Phe Tyr Ala Thr
275 280 285
Gly Asp Ile Ile Gly Asp Ile Arg Gln Ala His Cys Asn Val Ser Lys
290 295 300
Ala Thr Trp Asn Glu Thr Leu Gly Lys Val Val Lys Gln Leu Arg Lys
305 310 315 320
His Phe Gly Asn Asn Thr Ile Ile Arg Phe Ala Asn Ser Ser Gly Gly
325 330 335
Asp Leu Glu Val Thr Thr His Ser Phe Asn Cys Gly Gly Glu Phe Phe
340 345 350
Tyr Cys Asn Thr Ser Gly Leu Phe Asn Ser Thr Trp Ile Ser Asn Thr
355 360 365
Ser Val Gln Gly Ser Asn Ser Thr Gly Ser Asn Asp Ser Ile Thr Leu
370 375 380
Pro Cys Arg Ile Lys Gln Ile Ile Asn Met Trp Gln Arg Ile Gly Gln
385 390 395 400
Ala Met Tyr Ala Pro Pro Ile Gln Gly Val Ile Arg Cys Val Ser Asn
405 410 415
Ile Thr Gly Leu Ile Leu Thr Arg Asp Gly Gly Ser Thr Asn Ser Thr
420 425 430
Thr Glu Thr Phe Arg Pro Gly Gly Gly Asp Met Arg Asp Asn Trp Arg
435 440 445
Ser Glu Leu Tyr Lys Tyr Lys Val Val Lys Ile Glu Pro Leu Gly Val
450 455 460
Ala Pro Thr Arg Cys Lys Arg Arg Val Val Gly Arg Arg Arg Arg Arg
465 470 475 480
Arg Ala Val Gly Ile Gly Ala Val Phe Leu Gly Phe Leu Gly Ala Ala
485 490 495
Gly Ser Thr Met Gly Ala Ala Ser Asn Thr Leu Thr Val Gln Ala Arg
500 505 510
Asn Leu Leu Ser Gly Ile Val Gln Gln Gln Ser Asn Leu Pro Arg Ala
515 520 525
Pro Glu Ala Gln Gln His Leu Leu Lys Leu Thr Val Trp Gly Ile Lys
530 535 540
Gln Leu Gln Ala Arg Val Leu Ala Val Glu Arg Tyr Leu Arg Val Gln
545 550 555 560
Gln Leu Leu Gly Ile Trp Gly Cys Ser Gly Lys Leu Ile Cys Cys Thr
565 570 575
Asn Val Pro Trp Asn Ser Ser Trp Ser Asn Arg Asn Leu Ser Glu Ile
580 585 590
Trp Asp Asn Met Thr Trp Leu Gln Trp Asp Lys Glu Ile Ser Asn Tyr
595 600 605
Thr Gln Ile Ile Tyr Gly Leu Leu Glu Glu Ser Gln Phe Gln Gln Glu
610 615 620
Ile Asn Glu Gln Asp Leu Leu Ala Leu Asp
625 630
<210> 23
<211> 619
<212> PRT
<213> Artificial Sequence
<220>
<223> wt C97ZA_SOSIP Env protein with L535M and Q567K (HIV150673)
<400> 23
Asn Met Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Thr Asp Ala
1 5 10 15
Lys Thr Thr Leu Phe Cys Ala Ser Asp Thr Lys Ala Tyr Asp Arg Glu
20 25 30
Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp Pro Asn
35 40 45
Pro Gln Glu Ile Val Leu Glu Asn Val Thr Glu Asn Phe Asn Met Trp
50 55 60
Lys Asn Asp Met Val Asp Gln Met His Glu Asp Ile Ile Ser Leu Trp
65 70 75 80
Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val Thr
85 90 95
Leu His Cys Thr Asn Ala Thr Phe Lys Asn Asn Val Thr Asn Asp Met
100 105 110
Asn Lys Glu Ile Arg Asn Cys Ser Phe Asn Thr Thr Thr Glu Ile Arg
115 120 125
Asp Lys Lys Gln Gln Gly Tyr Ala Leu Phe Tyr Arg Pro Asp Ile Val
130 135 140
Leu Leu Lys Glu Asn Arg Asn Asn Ser Asn Asn Ser Glu Tyr Ile Leu
145 150 155 160
Ile Asn Cys Asn Ala Ser Thr Ile Thr Gln Ala Cys Pro Lys Val Asn
165 170 175
Phe Asp Pro Ile Pro Ile His Tyr Cys Ala Pro Ala Gly Tyr Ala Ile
180 185 190
Leu Lys Cys Asn Asn Lys Thr Phe Ser Gly Lys Gly Pro Cys Asn Asn
195 200 205
Val Ser Thr Val Gln Cys Thr His Gly Ile Lys Pro Val Val Ser Thr
210 215 220
Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu Lys Glu Ile Ile Ile Arg
225 230 235 240
Ser Glu Asn Leu Thr Asp Asn Val Lys Thr Ile Ile Val His Leu Asn
245 250 255
Lys Ser Val Glu Ile Val Cys Thr Arg Pro Asn Asn Asn Thr Arg Lys
260 265 270
Ser Met Arg Ile Gly Pro Gly Gln Thr Phe Tyr Ala Thr Gly Asp Ile
275 280 285
Ile Gly Asp Ile Arg Gln Ala Tyr Cys Asn Ile Ser Gly Ser Lys Trp
290 295 300
Asn Glu Thr Leu Lys Arg Val Lys Glu Lys Leu Gln Glu Asn Tyr Asn
305 310 315 320
Asn Asn Lys Thr Ile Lys Phe Ala Pro Ser Ser Gly Gly Asp Leu Glu
325 330 335
Ile Thr Thr His Ser Phe Asn Cys Arg Gly Glu Phe Phe Tyr Cys Asn
340 345 350
Thr Thr Arg Leu Phe Asn Asn Asn Ala Thr Glu Asp Glu Thr Ile Thr
355 360 365
Leu Pro Cys Arg Ile Lys Gln Ile Ile Asn Met Trp Gln Gly Val Gly
370 375 380
Arg Ala Met Tyr Ala Pro Pro Ile Ala Gly Asn Ile Thr Cys Lys Ser
385 390 395 400
Asn Ile Thr Gly Leu Leu Leu Val Arg Asp Gly Gly Glu Asp Asn Lys
405 410 415
Thr Glu Glu Ile Phe Arg Pro Gly Gly Gly Asn Met Lys Asp Asn Trp
420 425 430
Arg Ser Glu Leu Tyr Lys Tyr Lys Val Ile Glu Leu Lys Pro Leu Gly
435 440 445
Ile Ala Pro Thr Gly Cys Lys Arg Arg Val Val Glu Arg Arg Arg Arg
450 455 460
Arg Arg Ala Val Gly Ile Gly Ala Val Phe Leu Gly Phe Leu Gly Ala
465 470 475 480
Ala Gly Ser Thr Met Gly Ala Ala Ser Met Thr Leu Thr Val Gln Ala
485 490 495
Arg Gln Leu Leu Ser Ser Ile Val Gln Gln Gln Ser Asn Leu Leu Arg
500 505 510
Ala Pro Glu Ala Gln Gln His Met Leu Lys Leu Thr Val Trp Gly Ile
515 520 525
Lys Gln Leu Gln Thr Arg Val Leu Ala Ile Glu Arg Tyr Leu Lys Asp
530 535 540
Gln Gln Leu Leu Gly Ile Trp Gly Cys Ser Gly Lys Leu Ile Cys Cys
545 550 555 560
Thr Asn Val Pro Trp Asn Ser Ser Trp Ser Asn Lys Ser Gln Thr Asp
565 570 575
Ile Trp Asn Asn Met Thr Trp Met Glu Trp Asp Arg Glu Ile Ser Asn
580 585 590
Tyr Thr Asp Thr Ile Tyr Arg Leu Leu Glu Asp Ser Gln Thr Gln Gln
595 600 605
Glu Lys Asn Glu Lys Asp Leu Leu Ala Leu Asp
610 615
<210> 24
<211> 619
<212> PRT
<213> Artificial Sequence
<220>
<223> repaired and stabilized C97ZA_SOSIP Env protein (HIV170690)
<400> 24
Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys Asp Ala
1 5 10 15
Lys Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Asp Arg Glu
20 25 30
Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp Pro Asn
35 40 45
Pro Gln Glu Ile Val Leu Glu Asn Val Thr Glu Asn Phe Asn Met Trp
50 55 60
Lys Asn Asp Met Val Asp Gln Met His Glu Asp Ile Ile Ser Leu Trp
65 70 75 80
Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val Thr
85 90 95
Leu His Cys Thr Asn Ala Thr Phe Lys Asn Asn Val Thr Asn Asp Met
100 105 110
Asn Lys Glu Ile Arg Asn Cys Ser Phe Asn Thr Thr Thr Glu Ile Arg
115 120 125
Asp Lys Lys Gln Lys Val Tyr Ala Leu Phe Tyr Arg Leu Asp Ile Val
130 135 140
Gln Leu Lys Glu Asn Arg Asn Asn Ser Asn Asn Ser Glu Tyr Arg Leu
145 150 155 160
Ile Asn Cys Asn Thr Ser Thr Ile Thr Gln Ile Cys Pro Lys Val Thr
165 170 175
Phe Asp Pro Ile Pro Ile His Tyr Cys Ala Pro Ala Gly Tyr Ala Ile
180 185 190
Leu Lys Cys Asn Asn Lys Thr Phe Asn Gly Thr Gly Pro Cys Asn Asn
195 200 205
Val Ser Thr Val Gln Cys Thr His Gly Ile Lys Pro Val Val Ser Thr
210 215 220
Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu Lys Glu Ile Ile Ile Arg
225 230 235 240
Ser Glu Asn Leu Thr Asp Asn Val Lys Thr Ile Ile Val His Leu Asn
245 250 255
Lys Ser Val Glu Ile Asn Cys Thr Arg Pro Asn Asn Asn Thr Arg Lys
260 265 270
Ser Ile Arg Ile Gly Pro Gly Gln Thr Phe Tyr Ala Thr Gly Asp Ile
275 280 285
Ile Gly Asp Ile Arg Gln Ala Tyr Cys Asn Ile Ser Gly Ser Lys Trp
290 295 300
Asn Glu Thr Leu Lys Arg Val Lys Glu Lys Leu Arg Glu His Phe Asn
305 310 315 320
Asn Asn Lys Thr Ile Lys Phe Ala Pro Ser Ser Gly Gly Asp Leu Glu
325 330 335
Ile Thr Thr His Ser Phe Asn Cys Arg Gly Glu Phe Phe Tyr Cys Asn
340 345 350
Thr Thr Arg Leu Phe Asn Asn Asn Ala Thr Glu Asn Glu Thr Ile Thr
355 360 365
Leu Pro Cys Arg Ile Lys Gln Ile Ile Asn Met Trp Gln Glu Val Gly
370 375 380
Arg Ala Met Tyr Ala Pro Pro Ile Ala Gly Asn Ile Thr Cys Lys Ser
385 390 395 400
Asn Ile Thr Gly Leu Leu Leu Thr Arg Asp Gly Gly Glu Asp Asn Lys
405 410 415
Thr Glu Glu Ile Phe Arg Pro Gly Gly Gly Asn Met Lys Asp Asn Trp
420 425 430
Arg Ser Glu Leu Tyr Lys Tyr Lys Val Val Glu Ile Lys Pro Leu Gly
435 440 445
Ile Ala Pro Thr Lys Cys Lys Arg Arg Asn Val Thr Arg Arg Arg Arg
450 455 460
Arg Arg Ala Val Gly Ile Gly Ala Val Phe Leu Gly Phe Leu Gly Ala
465 470 475 480
Ala Gly Ser Thr Met Gly Ala Ala Ser Asn Thr Leu Thr Val Gln Ala
485 490 495
Arg Gln Leu Leu Ser Gly Ile Val Gln Gln Gln Ser Asn Leu Pro Arg
500 505 510
Ala Pro Glu Ala Gln Gln His Met Leu Lys Leu Thr Val Trp Gly Ile
515 520 525
Lys Gln Leu Gln Ala Arg Val Leu Ala Ile Glu Arg Tyr Leu Glu Val
530 535 540
Gln Gln Leu Leu Gly Ile Trp Gly Cys Ser Gly Lys Leu Ile Cys Cys
545 550 555 560
Thr Asn Val Pro Trp Asn Ser Ser Trp Ser Asn Lys Ser Gln Thr Asp
565 570 575
Ile Trp Asn Asn Met Thr Trp Met Glu Trp Asp Arg Glu Ile Ser Asn
580 585 590
Tyr Thr Asp Thr Ile Tyr Arg Leu Leu Glu Asp Ser Gln Phe Gln Gln
595 600 605
Glu Ile Asn Glu Lys Asp Leu Leu Ala Asn Asp
610 615
<210> 25
<211> 628
<212> PRT
<213> Artificial Sequence
<220>
<223> variant of repaired and stabilized Du422 construct (HIV161818)
<400> 25
Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys Glu Ala
1 5 10 15
Lys Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Asp Lys Glu
20 25 30
Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp Pro Asn
35 40 45
Pro Gln Glu Ile Val Leu Glu Asn Val Thr Glu Asn Phe Asn Met Trp
50 55 60
Lys Asn Asp Met Val Asp Gln Met His Glu Asp Ile Ile Ser Leu Trp
65 70 75 80
Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val Thr
85 90 95
Leu Asn Cys Lys Asn Val Asn Ile Ser Ala Asn Ala Asn Ala Thr Ala
100 105 110
Thr Leu Asn Ser Ser Met Asn Gly Glu Ile Lys Asn Cys Ser Phe Asn
115 120 125
Thr Thr Thr Glu Leu Arg Asp Lys Lys Gln Lys Val Tyr Ala Leu Phe
130 135 140
Tyr Lys Pro Asp Val Val Pro Leu Asn Gly Gly Glu His Asn Glu Thr
145 150 155 160
Gly Glu Tyr Ile Leu Ile Asn Cys Asn Ser Ser Thr Cys Thr Gln Ala
165 170 175
Cys Pro Lys Val Ser Phe Asp Pro Ile Pro Ile His Tyr Cys Ala Pro
180 185 190
Ala Gly Tyr Ala Ile Leu Lys Cys Asn Asn Lys Thr Phe Asn Gly Thr
195 200 205
Gly Pro Cys Asn Asn Val Ser Thr Val Gln Cys Thr His Gly Ile Lys
210 215 220
Pro Val Val Ser Thr Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu Glu
225 230 235 240
Glu Ile Ile Ile Arg Ser Glu Asn Leu Thr Asn Asn Ile Lys Thr Ile
245 250 255
Ile Val His Leu Asn Lys Ser Val Glu Ile Asn Cys Thr Arg Pro Asn
260 265 270
Asn Asn Thr Arg Lys Ser Val Arg Ile Gly Pro Gly Gln Thr Phe Tyr
275 280 285
Ala Thr Gly Glu Ile Ile Gly Asp Ile Arg Glu Ala His Cys Asn Ile
290 295 300
Ser Arg Glu Thr Trp Asn Ser Thr Leu Ile Gln Val Lys Glu Lys Leu
305 310 315 320
Arg Glu His Tyr Asn Lys Thr Ile Lys Phe Glu Pro Ser Ser Gly Gly
325 330 335
Asp Leu Glu Val Thr Thr His Ser Phe Asn Cys Arg Gly Glu Phe Phe
340 345 350
Tyr Cys Asn Thr Thr Lys Leu Phe Asn Glu Thr Lys Leu Phe Asn Glu
355 360 365
Ser Glu Tyr Val Asp Asn Lys Thr Ile Ile Leu Pro Cys Arg Ile Lys
370 375 380
Gln Ile Ile Asn Met Trp Gln Glu Val Gly Arg Cys Met Tyr Ala Pro
385 390 395 400
Pro Ile Glu Gly Asn Ile Thr Cys Lys Ser Asn Ile Thr Gly Leu Leu
405 410 415
Leu Thr Arg Asp Gly Gly Glu Asn Ser Thr Glu Glu Val Phe Arg Pro
420 425 430
Gly Gly Gly Asn Met Lys Asp Asn Trp Arg Ser Glu Leu Tyr Lys Tyr
435 440 445
Lys Val Val Glu Ile Lys Pro Leu Gly Val Ala Pro Thr Lys Cys Lys
450 455 460
Arg Lys Asn Val Thr Arg Arg Arg Arg Arg Arg Ala Val Gly Leu Gly
465 470 475 480
Ala Val Leu Leu Gly Phe Leu Gly Ala Ala Gly Ser Thr Met Gly Ala
485 490 495
Ala Ser Asn Thr Leu Thr Val Gln Ala Arg Gln Leu Leu Ser Gly Ile
500 505 510
Val Gln Gln Gln Ser Asn Leu Pro Arg Ala Pro Glu Ala Gln Gln His
515 520 525
Leu Leu Gln Leu Thr Val Trp Gly Ile Lys Gln Leu Gln Thr Arg Val
530 535 540
Leu Ala Ile Glu Arg Tyr Leu Lys Val Gln Gln Leu Leu Gly Leu Trp
545 550 555 560
Gly Cys Ser Gly Lys Leu Ile Cys Cys Thr Ala Val Pro Trp Asn Ser
565 570 575
Ser Trp Ser Asn Lys Ser Leu Gly Asp Ile Trp Asp Asn Met Thr Trp
580 585 590
Met Gln Trp Asp Arg Glu Ile Ser Asn Tyr Thr Asn Thr Ile Tyr Arg
595 600 605
Leu Leu Glu Asp Ser Gln Phe Gln Gln Glu Lys Asn Glu Lys Asp Leu
610 615 620
Leu Ala Asn Asp
625
<210> 26
<211> 628
<212> PRT
<213> Artificial Sequence
<220>
<223> repaired and stabilized Du422_SOSIP Env protein (HIV170859)
<400> 26
Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys Glu Ala
1 5 10 15
Lys Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Asp Lys Glu
20 25 30
Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp Pro Asn
35 40 45
Pro Gln Glu Ile Val Leu Glu Asn Val Thr Glu Asn Phe Asn Met Trp
50 55 60
Lys Asn Asp Met Val Asp Gln Met His Glu Asp Ile Ile Ser Leu Trp
65 70 75 80
Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val Thr
85 90 95
Leu Asn Cys Lys Asn Val Asn Ile Ser Ala Asn Ala Asn Ala Thr Ala
100 105 110
Thr Leu Asn Ser Ser Met Asn Gly Glu Ile Lys Asn Cys Ser Phe Asn
115 120 125
Thr Thr Thr Glu Leu Arg Asp Lys Lys Gln Lys Val Tyr Ala Leu Phe
130 135 140
Tyr Lys Pro Asp Val Val Pro Leu Asn Gly Gly Glu His Asn Glu Thr
145 150 155 160
Gly Glu Tyr Ile Leu Ile Asn Cys Asn Ser Ser Thr Ile Thr Gln Ala
165 170 175
Cys Pro Lys Val Ser Phe Asp Pro Ile Pro Ile His Tyr Cys Ala Pro
180 185 190
Ala Gly Tyr Ala Ile Leu Lys Cys Asn Asn Lys Thr Phe Asn Gly Thr
195 200 205
Gly Pro Cys Asn Asn Val Ser Thr Val Gln Cys Thr His Gly Ile Lys
210 215 220
Pro Val Val Ser Thr Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu Glu
225 230 235 240
Glu Ile Ile Ile Arg Ser Glu Asn Leu Thr Asn Asn Ile Lys Thr Ile
245 250 255
Ile Val His Leu Asn Lys Ser Val Glu Ile Asn Cys Thr Arg Pro Asn
260 265 270
Asn Asn Thr Arg Lys Ser Val Arg Ile Gly Pro Gly Gln Thr Phe Tyr
275 280 285
Ala Thr Gly Glu Ile Ile Gly Asp Ile Arg Glu Ala His Cys Asn Ile
290 295 300
Ser Arg Glu Thr Trp Asn Ser Thr Leu Ile Gln Val Lys Glu Lys Leu
305 310 315 320
Arg Glu His Tyr Asn Lys Thr Ile Lys Phe Glu Pro Ser Ser Gly Gly
325 330 335
Asp Leu Glu Val Thr Thr His Ser Phe Asn Cys Arg Gly Glu Phe Phe
340 345 350
Tyr Cys Asn Thr Thr Lys Leu Phe Asn Glu Thr Lys Leu Phe Asn Glu
355 360 365
Ser Glu Tyr Val Asp Asn Lys Thr Ile Ile Leu Pro Cys Arg Ile Lys
370 375 380
Gln Ile Ile Asn Met Trp Gln Glu Val Gly Arg Ala Met Tyr Ala Pro
385 390 395 400
Pro Ile Glu Gly Asn Ile Thr Cys Lys Ser Asn Ile Thr Gly Leu Leu
405 410 415
Leu Thr Arg Asp Gly Gly Glu Asn Ser Thr Glu Glu Val Phe Arg Pro
420 425 430
Gly Gly Gly Asn Met Lys Asp Asn Trp Arg Ser Glu Leu Tyr Lys Tyr
435 440 445
Lys Val Val Glu Ile Lys Pro Leu Gly Val Ala Pro Thr Lys Cys Lys
450 455 460
Arg Lys Val Val Gly Arg Arg Arg Arg Arg Arg Ala Val Gly Leu Gly
465 470 475 480
Ala Val Leu Leu Gly Phe Leu Gly Ala Ala Gly Ser Thr Met Gly Ala
485 490 495
Ala Ser Asn Thr Leu Thr Val Gln Ala Arg Gln Leu Leu Ser Gly Ile
500 505 510
Val Gln Gln Gln Ser Asn Leu Pro Arg Ala Pro Glu Ala Gln Gln His
515 520 525
Leu Leu Gln Leu Thr Val Trp Gly Ile Lys Gln Leu Gln Thr Arg Val
530 535 540
Leu Ala Ile Glu Arg Tyr Leu Glu Val Gln Gln Leu Leu Gly Leu Trp
545 550 555 560
Gly Cys Ser Gly Lys Leu Ile Cys Cys Thr Ala Val Pro Trp Asn Ser
565 570 575
Ser Trp Ser Asn Lys Ser Leu Gly Asp Ile Trp Asp Asn Met Thr Trp
580 585 590
Met Gln Trp Asp Arg Glu Ile Ser Asn Tyr Thr Asn Thr Ile Tyr Arg
595 600 605
Leu Leu Glu Asp Ser Gln Phe Gln Gln Glu Ile Asn Glu Lys Asp Leu
610 615 620
Leu Ala Leu Asp
625
<210> 27
<211> 599
<212> PRT
<213> Artificial Sequence
<220>
<223> repaired and stabilized DS_sC4_SOSIP Env protein (HIV170686)
<400> 27
Met Gly Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys
1 5 10 15
Asp Ala Lys Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Glu
20 25 30
Lys Glu Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp
35 40 45
Pro Asn Pro Gln Glu Ile Val Leu Gly Asn Val Thr Glu Asn Phe Asn
50 55 60
Met Trp Lys Asn Asp Met Val Asp Gln Met His Glu Asp Ile Ile Ser
65 70 75 80
Leu Trp Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys
85 90 95
Val Thr Leu Asn Cys Arg Asn Val Arg Asn Val Glu Met Lys Asn Cys
100 105 110
Ser Phe Asn Ala Thr Thr Val Val Arg Asp Arg Lys Gln Lys Val His
115 120 125
Ala Leu Phe Tyr Arg Leu Asp Ile Val Pro Leu Asp Glu Asn Asn Ser
130 135 140
Ser Tyr Arg Leu Ile Asn Cys Asn Thr Ser Ala Cys Thr Gln Ile Cys
145 150 155 160
Pro Lys Val Ser Phe Asp Pro Ile Pro Ile His Tyr Cys Ala Pro Ala
165 170 175
Gly Tyr Ala Ile Leu Lys Cys Asn Asn Lys Thr Phe Asn Gly Thr Gly
180 185 190
Pro Cys Asn Asn Val Ser Thr Val Gln Cys Thr His Gly Ile Lys Pro
195 200 205
Val Val Ser Thr Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu Glu Glu
210 215 220
Ile Ile Ile Arg Ser Glu Asn Leu Thr Asn Asn Ala Lys Thr Ile Ile
225 230 235 240
Val His Leu Asn Glu Thr Val Asn Ile Asn Cys Thr Arg Pro Asn Asn
245 250 255
Asn Thr Arg Lys Ser Ile Arg Ile Gly Pro Gly Gln Thr Phe Tyr Ala
260 265 270
Thr Gly Asp Ile Ile Gly Asp Ile Arg Gln Ala His Cys Asn Leu Ser
275 280 285
Arg Asp Gly Trp Asn Lys Thr Leu Gln Gly Val Lys Lys Lys Leu Ala
290 295 300
Glu His Phe Pro Asn Lys Thr Ile Lys Phe Ala Pro His Ser Gly Gly
305 310 315 320
Asp Leu Glu Ile Thr Thr His Ser Phe Asn Cys Arg Gly Glu Phe Phe
325 330 335
Tyr Cys Asn Thr Ser Asn Leu Phe Asn Glu Ser Asn Ile Glu Arg Asn
340 345 350
Asp Ser Ile Ile Thr Leu Pro Cys Arg Ile Lys Gln Ile Ile Asn Met
355 360 365
Trp Gln Glu Val Gly Arg Cys Met Tyr Ala Pro Pro Ile Ala Gly Asn
370 375 380
Ile Thr Cys Arg Ser Asn Ile Thr Gly Leu Leu Leu Thr Arg Asp Gly
385 390 395 400
Gly Ser Asn Asn Asn Asp Thr Glu Thr Phe Arg Pro Gly Gly Gly Asp
405 410 415
Met Arg Asn Asn Trp Arg Ser Glu Leu Tyr Lys Tyr Lys Val Val Glu
420 425 430
Val Lys Pro Leu Gly Val Ala Pro Thr Glu Cys Lys Arg Arg Val Val
435 440 445
Glu Arg Arg Arg Arg Arg Arg Ala Val Gly Ile Gly Ala Val Phe Leu
450 455 460
Gly Ile Leu Gly Ala Ala Gly Ser Thr Met Gly Ala Ala Ser Asn Thr
465 470 475 480
Leu Thr Val Gln Ala Arg Gln Leu Leu Ser Gly Ile Val Gln Gln Gln
485 490 495
Ser Asn Leu Pro Arg Ala Pro Glu Ala Gln Gln His Met Leu Gln Leu
500 505 510
Thr Val Trp Gly Ile Lys Gln Leu Gln Thr Arg Val Leu Ala Ile Glu
515 520 525
Arg Tyr Leu Glu Val Gln Gln Leu Leu Gly Leu Trp Gly Cys Ser Gly
530 535 540
Lys Leu Ile Cys Cys Thr Ala Val Pro Trp Asn Thr Ser Trp Ser Asn
545 550 555 560
Lys Ser Gln Thr Asp Ile Trp Asp Asn Met Thr Trp Met Gln Trp Asp
565 570 575
Lys Glu Ile Gly Asn Tyr Thr Gly Glu Ile Tyr Arg Leu Leu Glu Glu
580 585 590
Ser Gln Phe Gln Gln Glu Ile
595
<210> 28
<211> 607
<212> PRT
<213> Artificial Sequence
<220>
<223> Stabilized ConC_SOSIP.v3 Env protein (HIV170654)
<400> 28
Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys Glu Ala
1 5 10 15
Lys Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Glu Lys Glu
20 25 30
Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp Pro Asn
35 40 45
Pro Gln Glu Met Val Leu Glu Asn Val Thr Glu Asn Phe Asn Met Trp
50 55 60
Lys Asn Asp Met Val Asp Gln Met His Glu Asp Ile Ile Ser Leu Trp
65 70 75 80
Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val Thr
85 90 95
Leu Asn Cys Thr Asn Val Asn Val Thr Glu Met Lys Asn Cys Ser Phe
100 105 110
Asn Thr Thr Thr Glu Ile Arg Asp Lys Lys Gln Lys Glu Tyr Ala Leu
115 120 125
Phe Tyr Arg Leu Asp Ile Val Pro Leu Asn Glu Asn Ser Ser Glu Tyr
130 135 140
Arg Leu Ile Asn Cys Asn Thr Ser Thr Ile Thr Gln Ile Cys Pro Lys
145 150 155 160
Val Ser Phe Asp Pro Ile Pro Ile His Tyr Cys Ala Pro Ala Gly Tyr
165 170 175
Ala Ile Leu Lys Cys Asn Asn Lys Thr Phe Asn Gly Thr Gly Pro Cys
180 185 190
Asn Asn Val Ser Thr Val Gln Cys Thr His Gly Ile Lys Pro Val Val
195 200 205
Ser Thr Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu Glu Glu Ile Ile
210 215 220
Ile Arg Ser Glu Asn Leu Thr Asn Asn Val Lys Thr Ile Ile Val His
225 230 235 240
Leu Asn Glu Ser Val Glu Ile Val Cys Thr Arg Pro Asn Asn Asn Thr
245 250 255
Arg Lys Ser Ile Arg Ile Gly Pro Gly Gln Thr Phe Tyr Ala Thr Gly
260 265 270
Asp Ile Ile Gly Asp Ile Arg Gln Ala His Cys Asn Ile Ser Glu Ala
275 280 285
Lys Trp Asn Lys Thr Leu Gln Arg Val Lys Lys Lys Leu Lys Glu His
290 295 300
Phe Pro Asn Lys Thr Ile Lys Phe Gln Pro Ser Ser Gly Gly Asp Leu
305 310 315 320
Glu Ile Thr Thr His Ser Phe Asn Cys Arg Gly Glu Phe Phe Tyr Cys
325 330 335
Asn Thr Ser Lys Leu Phe Asn Ser Thr Tyr Asn Asn Thr Thr Ser Asn
340 345 350
Ser Thr Ile Thr Leu Pro Cys Arg Ile Lys Gln Ile Ile Asn Met Trp
355 360 365
Gln Glu Val Gly Arg Ala Met Tyr Ala Pro Pro Ile Ala Gly Asn Ile
370 375 380
Thr Cys Lys Ser Asn Ile Thr Gly Leu Leu Leu Thr Arg Asp Gly Gly
385 390 395 400
Asn Asn Asn Asn Asn Thr Glu Thr Phe Arg Pro Gly Gly Gly Asp Met
405 410 415
Arg Asp Asn Trp Arg Ser Glu Leu Tyr Lys Tyr Lys Val Val Glu Ile
420 425 430
Lys Pro Leu Gly Ile Ala Pro Thr Lys Cys Lys Arg Arg Val Val Glu
435 440 445
Arg Arg Arg Arg Arg Arg Ala Val Gly Ile Gly Ala Val Phe Leu Gly
450 455 460
Phe Leu Gly Ala Ala Gly Ser Thr Met Gly Ala Ala Ser Asn Thr Leu
465 470 475 480
Thr Val Gln Ala Arg Gln Leu Leu Ser Gly Ile Val Gln Gln Gln Ser
485 490 495
Asn Leu Leu Arg Ala Pro Glu Ala Gln Gln His Met Leu Gln Leu Thr
500 505 510
Val Trp Gly Phe Lys Gln Leu Gln Ala Arg Val Leu Ala Ile Glu Arg
515 520 525
Tyr Leu Glu Val Gln Gln Leu Leu Gly Ile Trp Gly Cys Ser Gly Lys
530 535 540
Leu Ile Cys Cys Thr Ala Val Pro Trp Asn Ser Ser Trp Ser Asn Lys
545 550 555 560
Ser Gln Glu Asp Ile Trp Asp Asn Met Thr Trp Met Gln Trp Asp Arg
565 570 575
Glu Ile Ser Asn Tyr Thr Asp Thr Ile Tyr Arg Leu Leu Glu Glu Ser
580 585 590
Gln Phe Gln Gln Glu Ile Asn Glu Lys Asp Leu Leu Ala Leu Asp
595 600 605
<210> 29
<211> 634
<212> PRT
<213> Artificial Sequence
<220>
<223> Stabilized BG505_SOSIP.v2 Env protein (HIV171814)
<400> 29
Ala Glu Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys
1 5 10 15
Asp Ala Glu Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Glu
20 25 30
Thr Glu Lys His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp
35 40 45
Pro Asn Pro Gln Glu Ile His Leu Glu Asn Val Thr Glu Glu Phe Asn
50 55 60
Met Trp Lys Asn Asn Met Val Glu Gln Met His Thr Asp Ile Ile Ser
65 70 75 80
Leu Trp Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys
85 90 95
Val Thr Leu Gln Cys Thr Asn Val Thr Asn Asn Ile Thr Asp Asp Met
100 105 110
Arg Gly Glu Leu Lys Asn Cys Ser Phe Asn Met Thr Thr Glu Leu Arg
115 120 125
Asp Lys Lys Gln Lys Val Tyr Ser Leu Phe Tyr Arg Leu Asp Val Val
130 135 140
Gln Ile Asn Glu Asn Gln Gly Asn Arg Ser Asn Asn Ser Asn Lys Glu
145 150 155 160
Tyr Arg Leu Ile Asn Cys Asn Thr Ser Ala Cys Thr Gln Ala Cys Pro
165 170 175
Lys Val Ser Phe Glu Pro Ile Pro Ile His Tyr Cys Ala Pro Ala Gly
180 185 190
Phe Ala Ile Leu Lys Cys Lys Asp Lys Lys Phe Asn Gly Thr Gly Pro
195 200 205
Cys Pro Ser Val Ser Thr Val Gln Cys Thr His Gly Ile Lys Pro Val
210 215 220
Val Ser Thr Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu Glu Glu Val
225 230 235 240
Met Ile Arg Ser Glu Asn Ile Thr Asn Asn Ala Lys Asn Ile Leu Val
245 250 255
Gln Phe Asn Thr Pro Val Gln Ile Asn Cys Thr Arg Pro Asn Asn Asn
260 265 270
Thr Arg Lys Ser Ile Arg Ile Gly Pro Gly Gln Ala Phe Tyr Ala Thr
275 280 285
Gly Asp Ile Ile Gly Asp Ile Arg Gln Ala His Cys Asn Val Ser Lys
290 295 300
Ala Thr Trp Asn Glu Thr Leu Gly Lys Val Val Lys Gln Leu Arg Lys
305 310 315 320
His Phe Gly Asn Asn Thr Ile Ile Arg Phe Ala Asn Ser Ser Gly Gly
325 330 335
Asp Leu Glu Val Thr Thr His Ser Phe Asn Cys Gly Gly Glu Phe Phe
340 345 350
Tyr Cys Asn Thr Ser Gly Leu Phe Asn Ser Thr Trp Ile Ser Asn Thr
355 360 365
Ser Val Gln Gly Ser Asn Ser Thr Gly Ser Asn Asp Ser Ile Thr Leu
370 375 380
Pro Cys Arg Ile Lys Gln Ile Ile Asn Met Trp Gln Arg Ile Gly Gln
385 390 395 400
Cys Met Tyr Ala Pro Pro Ile Gln Gly Val Ile Arg Cys Val Ser Asn
405 410 415
Ile Thr Gly Leu Ile Leu Thr Arg Asp Gly Gly Ser Thr Asn Ser Thr
420 425 430
Thr Glu Thr Phe Arg Pro Gly Gly Gly Asp Met Arg Asp Asn Trp Arg
435 440 445
Ser Glu Leu Tyr Lys Tyr Lys Val Val Lys Ile Glu Pro Leu Gly Val
450 455 460
Ala Pro Thr Arg Cys Lys Arg Arg Val Val Gly Arg Arg Arg Arg Arg
465 470 475 480
Arg Ala Val Gly Ile Gly Ala Val Phe Leu Gly Phe Leu Gly Ala Ala
485 490 495
Gly Ser Thr Met Gly Ala Ala Ser Asn Thr Leu Thr Val Gln Ala Arg
500 505 510
Asn Leu Leu Ser Gly Ile Val Gln Gln Gln Ser Asn Leu Pro Arg Ala
515 520 525
Pro Glu Ala Gln Gln His Leu Leu Lys Leu Thr Val Trp Gly Ile Lys
530 535 540
Gln Leu Gln Ala Arg Val Leu Ala Val Glu Arg Tyr Leu Glu Val Gln
545 550 555 560
Gln Leu Leu Gly Ile Trp Gly Cys Ser Gly Lys Leu Ile Cys Cys Thr
565 570 575
Asn Val Pro Trp Asn Ser Ser Trp Ser Asn Arg Asn Leu Ser Glu Ile
580 585 590
Trp Asp Asn Met Thr Trp Leu Gln Trp Asp Lys Glu Ile Ser Asn Tyr
595 600 605
Thr Gln Ile Ile Tyr Gly Leu Leu Glu Glu Ser Gln Phe Gln Gln Glu
610 615 620
Ile Asn Glu Val Asp Leu Leu Ala Leu Asp
625 630
<210> 30
<211> 619
<212> PRT
<213> Artificial Sequence
<220>
<223> Repaired and stabilized C97ZA_SOSIP.v2 Env protein (HIV171810)
<400> 30
Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys Asp Ala
1 5 10 15
Lys Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Asp Arg Glu
20 25 30
Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp Pro Asn
35 40 45
Pro Gln Glu Ile Val Leu Glu Asn Val Thr Glu Asn Phe Asn Met Trp
50 55 60
Lys Asn Asp Met Val Asp Gln Met His Glu Asp Ile Ile Ser Leu Trp
65 70 75 80
Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val Thr
85 90 95
Leu His Cys Thr Asn Ala Thr Phe Lys Asn Asn Val Thr Asn Asp Met
100 105 110
Asn Lys Glu Ile Arg Asn Cys Ser Phe Asn Thr Thr Thr Glu Ile Arg
115 120 125
Asp Lys Lys Gln Lys Val Tyr Ala Leu Phe Tyr Arg Leu Asp Ile Val
130 135 140
Gln Leu Lys Glu Asn Arg Asn Asn Ser Asn Asn Ser Glu Tyr Arg Leu
145 150 155 160
Ile Asn Cys Asn Thr Ser Thr Cys Thr Gln Ile Cys Pro Lys Val Thr
165 170 175
Phe Asp Pro Ile Pro Ile His Tyr Cys Ala Pro Ala Gly Tyr Ala Ile
180 185 190
Leu Lys Cys Asn Asn Lys Thr Phe Asn Gly Thr Gly Pro Cys Asn Asn
195 200 205
Val Ser Thr Val Gln Cys Thr His Gly Ile Lys Pro Val Val Ser Thr
210 215 220
Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu Lys Glu Ile Ile Ile Arg
225 230 235 240
Ser Glu Asn Leu Thr Asp Asn Val Lys Thr Ile Ile Val His Leu Asn
245 250 255
Lys Ser Val Glu Ile Asn Cys Thr Arg Pro Asn Asn Asn Thr Arg Lys
260 265 270
Ser Ile Arg Ile Gly Pro Gly Gln Thr Phe Tyr Ala Thr Gly Asp Ile
275 280 285
Ile Gly Asp Ile Arg Gln Ala Tyr Cys Asn Ile Ser Gly Ser Lys Trp
290 295 300
Asn Glu Thr Leu Lys Arg Val Lys Glu Lys Leu Arg Glu His Phe Asn
305 310 315 320
Asn Asn Lys Thr Ile Lys Phe Ala Pro Ser Ser Gly Gly Asp Leu Glu
325 330 335
Ile Thr Thr His Ser Phe Asn Cys Arg Gly Glu Phe Phe Tyr Cys Asn
340 345 350
Thr Thr Arg Leu Phe Asn Asn Asn Ala Thr Glu Asn Glu Thr Ile Thr
355 360 365
Leu Pro Cys Arg Ile Lys Gln Ile Ile Asn Met Trp Gln Glu Val Gly
370 375 380
Arg Cys Met Tyr Ala Pro Pro Ile Ala Gly Asn Ile Thr Cys Lys Ser
385 390 395 400
Asn Ile Thr Gly Leu Leu Leu Thr Arg Asp Gly Gly Glu Asp Asn Lys
405 410 415
Thr Glu Glu Ile Phe Arg Pro Gly Gly Gly Asn Met Lys Asp Asn Trp
420 425 430
Arg Ser Glu Leu Tyr Lys Tyr Lys Val Val Glu Ile Lys Pro Leu Gly
435 440 445
Ile Ala Pro Thr Lys Cys Lys Arg Arg Asn Val Thr Arg Arg Arg Arg
450 455 460
Arg Arg Ala Val Gly Ile Gly Ala Val Phe Leu Gly Phe Leu Gly Ala
465 470 475 480
Ala Gly Ser Thr Met Gly Ala Ala Ser Asn Thr Leu Thr Val Gln Ala
485 490 495
Arg Gln Leu Leu Ser Gly Ile Val Gln Gln Gln Ser Asn Leu Pro Arg
500 505 510
Ala Pro Glu Ala Gln Gln His Met Leu Lys Leu Thr Val Trp Gly Ile
515 520 525
Lys Gln Leu Gln Ala Arg Val Leu Ala Ile Glu Arg Tyr Leu Glu Val
530 535 540
Gln Gln Leu Leu Gly Ile Trp Gly Cys Ser Gly Lys Leu Ile Cys Cys
545 550 555 560
Thr Asn Val Pro Trp Asn Ser Ser Trp Ser Asn Lys Ser Gln Thr Asp
565 570 575
Ile Trp Asn Asn Met Thr Trp Met Glu Trp Asp Arg Glu Ile Ser Asn
580 585 590
Tyr Thr Asp Thr Ile Tyr Arg Leu Leu Glu Asp Ser Gln Phe Gln Gln
595 600 605
Glu Ile Asn Glu Val Asp Leu Leu Ala Asn Asp
610 615
<210> 31
<211> 628
<212> PRT
<213> Artificial Sequence
<220>
<223> Repaired and stabilized Du422_SOSIP.v1 Env protein (HIV171812)
<400> 31
Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys Glu Ala
1 5 10 15
Lys Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Asp Lys Glu
20 25 30
Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp Pro Asn
35 40 45
Pro Gln Glu Ile Val Leu Glu Asn Val Thr Glu Asn Phe Asn Met Trp
50 55 60
Lys Asn Asp Met Val Asp Gln Met His Glu Asp Ile Ile Ser Leu Trp
65 70 75 80
Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val Thr
85 90 95
Leu Asn Cys Lys Asn Val Asn Ile Ser Ala Asn Ala Asn Ala Thr Ala
100 105 110
Thr Leu Asn Ser Ser Met Asn Gly Glu Ile Lys Asn Cys Ser Phe Asn
115 120 125
Thr Thr Thr Glu Leu Arg Asp Lys Lys Gln Lys Val Tyr Ala Leu Phe
130 135 140
Tyr Lys Pro Asp Val Val Pro Leu Asn Gly Gly Glu His Asn Glu Thr
145 150 155 160
Gly Glu Tyr Ile Leu Ile Asn Cys Asn Ser Ser Thr Cys Thr Gln Ala
165 170 175
Cys Pro Lys Val Ser Phe Asp Pro Ile Pro Ile His Tyr Cys Ala Pro
180 185 190
Ala Gly Tyr Ala Ile Leu Lys Cys Asn Asn Lys Thr Phe Asn Gly Thr
195 200 205
Gly Pro Cys Asn Asn Val Ser Thr Val Gln Cys Thr His Gly Ile Lys
210 215 220
Pro Val Val Ser Thr Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu Glu
225 230 235 240
Glu Ile Ile Ile Arg Ser Glu Asn Leu Thr Asn Asn Ile Lys Thr Ile
245 250 255
Ile Val His Leu Asn Lys Ser Val Glu Ile Asn Cys Thr Arg Pro Asn
260 265 270
Asn Asn Thr Arg Lys Ser Val Arg Ile Gly Pro Gly Gln Thr Phe Tyr
275 280 285
Ala Thr Gly Glu Ile Ile Gly Asp Ile Arg Glu Ala His Cys Asn Ile
290 295 300
Ser Arg Glu Thr Trp Asn Ser Thr Leu Ile Gln Val Lys Glu Lys Leu
305 310 315 320
Arg Glu His Tyr Asn Lys Thr Ile Lys Phe Glu Pro Ser Ser Gly Gly
325 330 335
Asp Leu Glu Val Thr Thr His Ser Phe Asn Cys Arg Gly Glu Phe Phe
340 345 350
Tyr Cys Asn Thr Thr Lys Leu Phe Asn Glu Thr Lys Leu Phe Asn Glu
355 360 365
Ser Glu Tyr Val Asp Asn Lys Thr Ile Ile Leu Pro Cys Arg Ile Lys
370 375 380
Gln Ile Ile Asn Met Trp Gln Glu Val Gly Arg Cys Met Tyr Ala Pro
385 390 395 400
Pro Ile Glu Gly Asn Ile Thr Cys Lys Ser Asn Ile Thr Gly Leu Leu
405 410 415
Leu Thr Arg Asp Gly Gly Glu Asn Ser Thr Glu Glu Val Phe Arg Pro
420 425 430
Gly Gly Gly Asn Met Lys Asp Asn Trp Arg Ser Glu Leu Tyr Lys Tyr
435 440 445
Lys Val Val Glu Ile Lys Pro Leu Gly Val Ala Pro Thr Lys Cys Lys
450 455 460
Arg Lys Val Val Gly Arg Arg Arg Arg Arg Arg Ala Val Gly Leu Gly
465 470 475 480
Ala Val Leu Leu Gly Phe Leu Gly Ala Ala Gly Ser Thr Met Gly Ala
485 490 495
Ala Ser Asn Thr Leu Thr Val Gln Ala Arg Gln Leu Leu Ser Gly Ile
500 505 510
Val Gln Gln Gln Ser Asn Leu Pro Arg Ala Pro Glu Ala Gln Gln His
515 520 525
Leu Leu Gln Leu Thr Val Trp Gly Ile Lys Gln Leu Gln Thr Arg Val
530 535 540
Leu Ala Ile Glu Arg Tyr Leu Glu Val Gln Gln Leu Leu Gly Leu Trp
545 550 555 560
Gly Cys Ser Gly Lys Leu Ile Cys Cys Thr Ala Val Pro Trp Asn Ser
565 570 575
Ser Trp Ser Asn Lys Ser Leu Gly Asp Ile Trp Asp Asn Met Thr Trp
580 585 590
Met Gln Trp Asp Arg Glu Ile Ser Asn Tyr Thr Asn Thr Ile Tyr Arg
595 600 605
Leu Leu Glu Asp Ser Gln Phe Gln Gln Glu Ile Asn Glu Val Asp Leu
610 615 620
Leu Ala Leu Asp
625
<210> 32
<211> 599
<212> PRT
<213> Artificial Sequence
<220>
<223> Stabilized and repaired sC4_SOSIP.v4 Env protein
<400> 32
Met Gly Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys
1 5 10 15
Asp Ala Lys Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Glu
20 25 30
Lys Glu Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp
35 40 45
Pro Asn Pro Gln Glu Ile Val Leu Gly Asn Val Thr Glu Asn Phe Asn
50 55 60
Met Trp Lys Asn Asp Met Val Asp Gln Met His Glu Asp Ile Ile Ser
65 70 75 80
Leu Trp Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys
85 90 95
Val Thr Leu Asn Cys Arg Asn Val Arg Asn Val Glu Met Lys Asn Cys
100 105 110
Ser Phe Asn Ala Thr Thr Val Val Arg Asp Arg Lys Gln Lys Val His
115 120 125
Ala Leu Phe Tyr Arg Leu Asp Ile Val Pro Leu Asp Glu Asn Asn Ser
130 135 140
Ser Tyr Arg Leu Ile Asn Cys Asn Thr Ser Ala Cys Thr Gln Ile Cys
145 150 155 160
Pro Lys Val Ser Phe Asp Pro Ile Pro Ile His Tyr Cys Ala Pro Ala
165 170 175
Gly Tyr Ala Ile Leu Lys Cys Asn Asn Lys Thr Phe Asn Gly Thr Gly
180 185 190
Pro Cys Asn Asn Val Ser Thr Val Gln Cys Thr His Gly Ile Lys Pro
195 200 205
Val Val Ser Thr Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu Glu Glu
210 215 220
Ile Ile Ile Arg Ser Glu Asn Leu Thr Asn Asn Ala Lys Thr Ile Ile
225 230 235 240
Val His Leu Asn Glu Thr Val Asn Ile Val Cys Thr Arg Pro Asn Asn
245 250 255
Asn Thr Arg Lys Ser Ile Arg Ile Gly Pro Gly Gln Thr Phe Tyr Ala
260 265 270
Thr Gly Asp Ile Ile Gly Asp Ile Arg Gln Ala His Cys Asn Leu Ser
275 280 285
Arg Asp Gly Trp Asn Lys Thr Leu Gln Gly Val Lys Lys Lys Leu Ala
290 295 300
Glu His Phe Pro Asn Lys Thr Ile Lys Phe Ala Pro His Ser Gly Gly
305 310 315 320
Asp Leu Glu Ile Thr Thr His Ser Phe Asn Cys Arg Gly Glu Phe Phe
325 330 335
Tyr Cys Asn Thr Ser Asn Leu Phe Asn Glu Ser Asn Ile Glu Arg Asn
340 345 350
Asp Ser Ile Ile Thr Leu Pro Cys Arg Ile Lys Gln Ile Ile Asn Met
355 360 365
Trp Gln Glu Val Gly Arg Cys Met Tyr Ala Pro Pro Ile Ala Gly Asn
370 375 380
Ile Thr Cys Arg Ser Asn Ile Thr Gly Leu Leu Leu Thr Arg Asp Gly
385 390 395 400
Gly Ser Asn Asn Asn Asp Thr Glu Thr Phe Arg Pro Gly Gly Gly Asp
405 410 415
Met Arg Asn Asn Trp Arg Ser Glu Leu Tyr Lys Tyr Lys Val Val Glu
420 425 430
Val Lys Pro Leu Gly Val Ala Pro Thr Glu Cys Lys Arg Arg Asn Val
435 440 445
Thr Arg Arg Arg Arg Arg Arg Ala Val Gly Ile Gly Ala Val Phe Leu
450 455 460
Gly Ile Leu Gly Ala Ala Gly Ser Thr Met Gly Ala Ala Ser Asn Thr
465 470 475 480
Leu Thr Val Gln Ala Arg Gln Leu Leu Ser Gly Ile Val Gln Gln Gln
485 490 495
Ser Asn Leu Pro Arg Ala Pro Glu Ala Gln Gln His Met Leu Gln Leu
500 505 510
Thr Val Trp Gly Ile Lys Gln Leu Gln Thr Arg Val Leu Ala Ile Glu
515 520 525
Arg Tyr Leu Glu Asp Gln Gln Leu Leu Gly Leu Trp Gly Cys Ser Gly
530 535 540
Lys Leu Ile Cys Cys Thr Ala Val Pro Trp Asn Thr Ser Trp Ser Asn
545 550 555 560
Lys Ser Gln Thr Asp Ile Trp Asp Asn Met Thr Trp Met Gln Trp Asp
565 570 575
Lys Glu Ile Gly Asn Tyr Thr Gly Glu Ile Tyr Arg Leu Leu Glu Glu
580 585 590
Ser Gln Phe Gln Gln Glu Ile
595
<210> 33
<211> 29
<212> PRT
<213> Artificial Sequence
<220>
<223> signal sequence
<400> 33
Met Arg Val Arg Gly Met Leu Arg Asn Trp Gln Gln Trp Trp Ile Trp
1 5 10 15
Ser Ser Leu Gly Phe Trp Met Leu Met Ile Tyr Ser Val
20 25
<210> 34
<211> 29
<212> PRT
<213> Artificial Sequence
<220>
<223> signal sequence
<400> 34
Met Arg Val Met Gly Ile Gln Arg Asn Cys Gln His Leu Phe Arg Trp
1 5 10 15
Gly Thr Met Ile Leu Gly Met Ile Ile Ile Cys Ser Ala
20 25
Claims (25)
- 하기 아미노산 잔기 중 2개 이상을 포함하는 재조합 인간 면역결핍 바이러스 (HIV) 엔벨로프 (Env) 단백질:
(i) 위치 651에서 Phe, Leu, Met, 또는 Trp, 바람직하게는 Phe;
(ii) 위치 655에서 Phe, Ile, Met, 또는 Trp, 바람직하게는 Ile;
(iii) 위치 535에서 Asn 또는 Gln, 바람직하게는 Asn;
(iv) 위치 589에서 Val, Ile 또는 Ala, 바람직하게는 Val;
(v) 위치 573에서 Phe 또는 Trp, 바람직하게는 Phe;
(vi) 위치 204에서 Ile; 및/또는
(vii) 위치 647에서 Phe, Met, 또는 Ile, 바람직하게는 Phe
(여기서, 위치의 넘버링은 HIV-1 단리체 HXB2의 gp160에서의 넘버링에 따름). - 하기 아미노산 잔기 중 1개 이상의 아미노산 잔기를 포함하는 재조합 HIV Env 단백질:
(i) 위치 651에서 Phe, Leu, Met, 또는 Trp, 바람직하게는 Phe;
(ii) 위치 655에서 Phe, Ile, Met, 또는 Trp, 바람직하게는 Ile;
(iii) 위치 535에서 Asn 또는 Gln, 바람직하게는 Asn;
(iv) 위치 589에서 Val, Ile 또는 Ala, 바람직하게는 Val;
(v) 위치 573에서 Phe 또는 Trp, 바람직하게는 Phe;
(vi) 위치 204에서 Ile; 및/또는
(vii) 위치 647에서 Phe, Met, 또는 Ile, 바람직하게는 Phe
(여기서, HIV Env 단백질은
(1) HIV Env 콘센서스 서열 (예를 들어 서열 번호 2 또는 3의 아미노산 서열을 포함하는, 예를 들어 클레이드 C로부터 유래되거나, 예를 들어 서열 번호 4 또는 5의 아미노산 서열을 포함하는, 예를 들어 클레이드 B로부터 유래됨);
(2) 합성 HIV Env 단백질 (예를 들어 (a): 서열 번호 6의 아미노산 서열; 또는 (b): 위치 166에서의 Glu의 Arg으로의 돌연변이를 갖는 서열 번호 6의 아미노산 서열; 또는 (c): 위치 501 및 605에서의 아미노산의 Cys 잔기로의 돌연변이 및 위치 559에서의 아미노산의 Pro 잔기로의 돌연변이를 갖는 (a) 또는 (b); 또는 (d): 추가의 푸린 절단 부위 돌연변이, 예를 들어 위치 508~511에서의 아미노산의 RRRRRR (서열 번호 10)에 의한 대체를 갖는 (a), (b) 또는 (c); 또는 (e) 서열 번호 7의 아미노산 서열; 또는 (f) 서열 번호 8 또는 서열 번호 9의 아미노산 서열을 포함함); 및
(3) 적어도 1000개, 바람직하게는 적어도 10000개의 야생형 HIV Env 서열들의 컬렉션(collection)에서의 HIV Env 서열의 7.5% 미만, 바람직하게는 2% 미만의 빈도로 상응하는 위치에 존재하는 아미노산 잔기에서의 적어도 하나의 복구 돌연변이를 포함하는 모 HIV Env 단백질 (이는 바람직하게는 야생형 HIV Env 단백질, 바람직하게는 클레이드 C의 야생형 HIV Env 단백질임) (여기서, 복구 돌연변이는 상기 컬렉션에서의 HIV Env 서열의 적어도 10%의 빈도로 상응하는 위치에 존재하는 아미노산 잔기에 의한 치환이며, 바람직하게는 복구 돌연변이는 상기 컬렉션에서 가장 빈번하게 상응하는 위치에 존재하는 아미노산 잔기에 의한 치환임)
로 이루어진 군으로부터 선택되며;
위치의 넘버링은 HIV-1 단리체 HXB2의 gp160에서의 넘버링에 따름). - 하기 아미노산 잔기 중 1개 이상의 아미노산 잔기를 포함하는 재조합 HIV Env 단백질:
(i) 위치 651에서 Phe, Leu, Met, 또는 Trp, 바람직하게는 Phe;
(ii) 위치 655에서 Phe, Ile, Met, 또는 Trp, 바람직하게는 Ile;
(iii) 위치 535에서 Asn 또는 Gln, 바람직하게는 Asn;
(iv) 위치 589에서 Val, Ile 또는 Ala, 바람직하게는 Val;
(v) 위치 573에서 Phe 또는 Trp, 바람직하게는 Phe;
(vi) 위치 204에서 Ile; 및/또는
(vii) 위치 647에서 Phe, Met, 또는 Ile, 바람직하게는 Phe
(여기서, HIV Env 단백질은
(a) 위치 501 및 605에서의 Cys;
(b) 위치 559에서 Pro;
(c) 위치 501 및 605에서 Cys 및 위치 559에서 Pro 중 하나 이상을 포함하는 HIV Env 단백질이며;
위치의 넘버링은 HIV-1 단리체 HXB2의 gp160에서의 넘버링에 따름). - 제2항 또는 제3항에 있어서, (i)~(vii)에서 표시된 아미노산 잔기들 중 2개 이상을 포함하는 재조합 HIV Env 단백질.
- 제1항, 제2항 및 제4항 중 어느 한 항에 있어서, 위치 501 및 605에서 Cys 또는 위치 559에서 Pro, 바람직하게는 위치 501 및 605에서 Cys 및 위치 559에서 Pro을 포함하는 재조합 HIV Env 단백질.
- 제1항 내지 제5항 중 어느 한 항에 있어서, (i)~(vii)에서 표시된 아미노산 잔기들 중 3개 이상을 포함하는 재조합 HIV Env 단백질.
- 제1항 내지 제5항 중 어느 한 항에 있어서, (i)~(vii)에서 표시된 아미노산 잔기들 중 4개 이상을 포함하는 재조합 HIV Env 단백질.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 위치 651에서 Phe, 위치 655에서 Ile, 위치 535에서 Asn, 및 위치 589에서 Val을 포함하는 재조합 HIV Env 단백질.
- 제1항 내지 제8항 중 어느 한 항에 있어서, (i)~(vii)에서 표시된 아미노산 잔기들 중 5개 이상을 포함하는 재조합 HIV Env 단백질.
- 제1항 내지 제10항 중 어느 한 항에 있어서, 하기 중 하나 이상을 추가로 포함하는 재조합 HIV Env 단백질:
(viii) 위치 588에서 Gln, Glu, Ile, Met, Val, Trp, 또는 Phe, 바람직하게는 Gln 또는 Glu;
(ix) 위치 64에서 Lys 또는 위치 66에서 Arg 또는 위치 64에서 Lys 및 위치 66에서 Arg;
(x) 위치 316에서 Trp;
(xi) 위치 201 및 433 둘 다에서 Cys;
(xii) 위치 556 또는 558에서, 또는 위치 556 및 558 둘 다에서 Pro;
(xiii) 7~10개의 아미노산을 갖는 루프, 바람직하게는 8개 아미노산의 루프, 예를 들어 (서열 번호 12~17) 중 어느 하나로부터 선택되는 서열을 갖는 루프에 의한 아미노산 위치 548~568에서의 루프 (HR1-루프)의 대체;
(xiv) 위치 568에서 Gly, 또는 위치 569에서 Gly, 또는 위치 636에서 Gly, 또는 위치 568 및 636 둘 다에서 Gly, 또는 위치 569 및 636 둘 다에서 Gly; 및/또는
(xv) 위치 302에서 Tyr, 또는 위치 519에서 Arg, 또는 위치 520에서 Arg, 또는 위치 302에서 Tyr 및 위치 519에서 Arg, 또는 위치 302에서 Tyr 및 위치 520에서 Arg, 또는 위치 302에서 Tyr 및 위치 519 및 520 둘 다에서 Arg. - 제1항 내지 제10항 중 어느 한 항에 있어서, HIV Env 단백질의 푸린 절단 서열에서의 돌연변이, 바람직하게는 RRRRRR (서열 번호 10)에 의한 위치 508~511에서의 대체를 추가로 포함하는 재조합 HIV Env 단백질.
- 제1항 내지 제11항 중 어느 한 항에 있어서, 서열 번호 3, 5, 20, 22, 24, 26, 27, 28, 29, 30, 31, 또는 32의 아미노산 서열 중 어느 하나와 95% 이상 동일한 아미노산 서열을 포함하는 재조합 HIV Env 단백질.
- 제1항 내지 제12항 중 어느 한 항에 있어서, 다음을 추가로 포함하는 재조합 HIV Env 단백질: (xvi) 위치 658에서 Val, Ile, Phe, Met, Ala, 또는 Leu, 바람직하게는 Val 또는 Ile, 가장 바람직하게는 Val으로부터 선택되는 아미노산 잔기.
- 제1항 내지 제13항 중 어느 한 항에 있어서, gp140 또는 gp160 단백질인 재조합 HIV Env 단백질.
- 제1항 내지 제14항 중 어느 한 항에 있어서, 클레이드 C 또는 클레이드 A, 바람직하게는 클레이드 C로부터 유래된 재조합 HIV Env 단백질.
- 제1항 내지 제15항 중 어느 한 항의 3개의 재조합 HIV Env 단백질의 비공유적 올리고머를 포함하는 삼량체성 복합체.
- 제1항 내지 제15항 중 어느 한 항의 재조합 HIV Env 단백질 또는 제16항의 삼량체성 복합체를 표면 상에서 디스플레이 (display)하는 입자, 바람직하게는 리포좀 또는 나노입자.
- 제1항 내지 제15항 중 어느 한 항의 재조합 HIV Env 단백질을 코딩하는 단리된 핵산 분자.
- 프로모터에 작동가능하게 연결된 제18항의 단리된 핵산 분자를 포함하는 벡터.
- 제19항에 있어서, 아데노바이러스 벡터인 벡터.
- 제18항의 단리된 핵산 분자 또는 제19항 또는 제20항의 벡터를 포함하는 숙주 세포.
- 제21항의 숙주 세포를 재조합 HIV Env 단백질의 생성에 적합한 조건 하에 성장시키는 단계를 포함하는, 재조합 HIV Env 단백질을 제조하는 방법.
- 제1항 내지 제15항 중 어느 한 항의 재조합 HIV Env 단백질, 제16항의 삼량체성 복합체, 제17항의 입자, 제18항의 단리된 핵산 분자, 또는 제19항 또는 제20항의 벡터, 및 제약상 허용가능한 담체를 포함하는 조성물.
- 모 HIV Env 단백질에서의 하나 이상의 아미노산 잔기의 치환 단계를 포함하고, 상기 하나 이상의 치환은 하기 아미노산들 중 하나 이상으로 이어지는, HIV Env 단백질의 삼량체 형성을 개선시키는 방법:
(i) 위치 651에서 Phe, Leu, Met, 또는 Trp, 바람직하게는 Phe;
(ii) 위치 655에서 Phe, Ile, Met, 또는 Trp, 바람직하게는 Ile;
(iii) 위치 535에서 Asn 또는 Gln, 바람직하게는 Asn;
(iv) 위치 589에서 Val, Ile 또는 Ala, 바람직하게는 Val;
(v) 위치 573에서 Phe 또는 Trp, 바람직하게는 Phe;
(vi) 위치 204에서 Ile; 및/또는
(vii) 위치 647에서 Phe, Met, 또는 Ile, 바람직하게는 Phe
(여기서, 위치의 넘버링은 HIV-1 단리체 HXB2의 gp160에서의 넘버링에 따름). - 모 HIV Env 단백질 내에 하나 이상의 복구 돌연변이, 바람직하게는 3개 이상의 복구 돌연변이를 도입함으로써 모 HIV Env 단백질의 아미노산 서열을 복구하는 단계를 포함하고, 여기서, 복구 돌연변이는 100개 이상, 바람직하게는 1000개 이상, 바람직하게는 10000개 이상의 야생형 HIV Env 서열들의 컬렉션에서 HIV Env 서열의 7.5% 미만, 바람직하게는 2% 미만의 빈도로 상응하는 위치에 존재하는 아미노산 잔기에서의 아미노산 치환이며, 상기 치환은 상기 컬렉션에서 HIV Env 서열의 10% 이상의 빈도로 상응하는 위치에 존재하는 아미노산 잔기에 의한 것이고, 바람직하게는 상기 치환은 상기 컬렉션에서 가장 빈번하게 상응하는 위치에 존재하는 아미노산 잔기에 의한 것인, 모 HIV Env 단백질의 폴딩 및 안정성 (증가된 삼량체 백분율 및/또는 삼량체 수득량으로서 측정됨)을 개선시키는 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP16188866.4 | 2016-09-15 | ||
EP16188866 | 2016-09-15 | ||
PCT/EP2017/073141 WO2018050747A1 (en) | 2016-09-15 | 2017-09-14 | Trimer stabilizing hiv envelope protein mutations |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20190050786A true KR20190050786A (ko) | 2019-05-13 |
KR102513146B1 KR102513146B1 (ko) | 2023-03-23 |
Family
ID=57017955
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020197007592A KR102513146B1 (ko) | 2016-09-15 | 2017-09-14 | 삼량체를 안정화하는 hiv 엔벨로프 단백질 돌연변이 |
Country Status (30)
Country | Link |
---|---|
US (3) | US10793607B2 (ko) |
EP (2) | EP3512543B1 (ko) |
JP (2) | JP7178344B2 (ko) |
KR (1) | KR102513146B1 (ko) |
CN (1) | CN109689091A (ko) |
AR (1) | AR109528A1 (ko) |
AU (2) | AU2017327672B2 (ko) |
BR (1) | BR112019004593A2 (ko) |
CA (1) | CA3036959A1 (ko) |
CY (1) | CY1124518T1 (ko) |
DK (1) | DK3512543T3 (ko) |
EA (1) | EA201990715A1 (ko) |
ES (1) | ES2824525T3 (ko) |
HR (1) | HRP20201458T1 (ko) |
HU (1) | HUE052008T2 (ko) |
IL (2) | IL265186B (ko) |
LT (1) | LT3512543T (ko) |
MA (1) | MA46230B1 (ko) |
MD (1) | MD3512543T2 (ko) |
MX (1) | MX2019002938A (ko) |
MY (1) | MY190534A (ko) |
PH (1) | PH12019500280A1 (ko) |
PL (1) | PL3512543T3 (ko) |
PT (1) | PT3512543T (ko) |
RS (1) | RS60919B1 (ko) |
SG (2) | SG11201901206SA (ko) |
SI (1) | SI3512543T1 (ko) |
TW (1) | TWI742158B (ko) |
WO (1) | WO2018050747A1 (ko) |
ZA (1) | ZA201901597B (ko) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MA44059B1 (fr) | 2015-12-15 | 2019-11-29 | Janssen Vaccines & Prevention Bv | Antigènes du virus de l'immunodéficience humaine, vecteurs, compositions, et leurs procédés d'utilisation |
US11318197B2 (en) | 2016-03-03 | 2022-05-03 | Duke University | Compositions and methods for inducing HIV-1 antibodies |
WO2017152146A2 (en) | 2016-03-03 | 2017-09-08 | Duke University | Compositions and methods for inducing hiv-1 antibodies |
SG11201809387QA (en) * | 2016-05-02 | 2018-11-29 | Scripps Research Inst | Compositions and methods related to hiv-1 immunogens |
EP3471765B1 (en) | 2016-06-16 | 2024-04-24 | Janssen Vaccines & Prevention B.V. | Hiv vaccine formulation |
US10307477B2 (en) | 2016-09-02 | 2019-06-04 | Janssen Vaccines & Prevention B.V. | Methods for inducing an immune response against human immunodeficiency virus infection in subjects undergoing antiretroviral treatment |
MX2019002938A (es) | 2016-09-15 | 2019-10-15 | Janssen Vaccines & Prevention Bv | Mutaciones estebilizantes de trimeros de proteinas de la envoltura del vih. |
WO2018067580A1 (en) | 2016-10-03 | 2018-04-12 | Duke University | Methods to identify immunogens by targeting improbable mutations |
AU2018283811B2 (en) | 2017-06-15 | 2022-10-20 | Bavarian Nordic A/S | Poxvirus vectors encoding HIV antigens, and methods of use thereof |
SG11202000112XA (en) * | 2017-07-19 | 2020-02-27 | Janssen Vaccines & Prevention Bv | Trimer stabilizing hiv envelope protein mutations |
US11097002B2 (en) | 2018-06-13 | 2021-08-24 | The Scripps Research Institute | Nanoparticle vaccines with novel structural components |
EA038287B1 (ru) * | 2018-06-18 | 2021-08-04 | Янссен Вэксинс Энд Превеншн Б.В. | Стабилизирующие тример мутации белка оболочки hiv |
US20210379177A1 (en) * | 2018-10-01 | 2021-12-09 | Duke University | Hiv-1 envelope stabilizing mutations |
EP3914067A4 (en) * | 2019-01-22 | 2022-11-02 | 2seventy bio, Inc. | METHODS AND SYSTEMS FOR MAKING VIRAL VECTORS |
CN110184298B (zh) * | 2019-05-15 | 2023-05-16 | 武汉璟泓科技股份有限公司 | Hiv突变型表面糖蛋白及其纳米化抗原与制备方法 |
US20220401546A1 (en) * | 2019-11-14 | 2022-12-22 | Emory University | HIV Immunogens, Vaccines, and Methods Related Thereto |
US20240000919A1 (en) * | 2020-11-12 | 2024-01-04 | Xiamen University | Modified envelope protein of human immunodeficiency virus and use thereof |
US20220265813A1 (en) | 2021-02-23 | 2022-08-25 | Janssen Vaccines & Prevention B.V. | Trimer Stabilizing HIV Envelope Protein Mutation |
WO2023156505A1 (en) | 2022-02-17 | 2023-08-24 | Janssen Vaccines & Prevention B.V. | Trimer stabilizing hiv envelope protein mutations r304v, n302m and t320l |
WO2023192835A1 (en) * | 2022-03-27 | 2023-10-05 | The United States Of America, As Represented By The Secretary, Department Of Health And Human Services | Base-covered hiv-1 envelope ectodomains and their use |
WO2024091921A1 (en) * | 2022-10-24 | 2024-05-02 | Duke University | Stabilization of human immunodeficiency virus (hiv) envelopes |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20120086379A (ko) * | 2003-09-17 | 2012-08-02 | 듀크 유니버시티 | 컨센서스/원형 면역원 |
WO2016037154A1 (en) * | 2014-09-04 | 2016-03-10 | The United States Of America, As Represented By The Secretary, Department Of Health & Human Services | Recombinant hiv-1 envelope proteins and their use |
Family Cites Families (50)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4603112A (en) | 1981-12-24 | 1986-07-29 | Health Research, Incorporated | Modified vaccinia virus |
CA1341245C (en) | 1988-01-12 | 2001-06-05 | F. Hoffmann-La Roche Ag | Recombinant vaccinia virus mva |
US5298416A (en) | 1989-01-18 | 1994-03-29 | British Technology Group Ltd. | Attenuated polioviruses |
US5505947A (en) | 1994-05-27 | 1996-04-09 | The University Of North Carolina At Chapel Hill | Attenuating mutations in Venezuelan Equine Encephalitis virus |
UA68327C2 (en) | 1995-07-04 | 2004-08-16 | Gsf Forschungszentrum Fur Unwe | A recombinant mva virus, an isolated eukaryotic cell, infected with recombinant mva virus, a method for production in vitro of polypeptides with use of said cell, a method for production in vitro of virus parts (variants), vaccine containing the recombinant mva virus, a method for immunization of animals |
US6479258B1 (en) | 1995-12-07 | 2002-11-12 | Diversa Corporation | Non-stochastic generation of genetic vaccines |
US5761893A (en) | 1996-10-22 | 1998-06-09 | Lofquist Welding, Inc. | Crop saving attachment for the snouts of combines |
US6710173B1 (en) | 1999-06-25 | 2004-03-23 | Progenics Pharmaceuticals, Inc. | Stabilized viral envelope proteins and uses thereof |
EP1214333A4 (en) | 1999-09-17 | 2005-01-19 | Dana Farber Cancer Inst Inc | STABILIZED SOLUBLE GLYCOPROTEINTRIMERE |
DE60116371T3 (de) | 2000-11-23 | 2016-11-17 | Bavarian Nordic A/S | Variante des modifizierten vaccinia ankara virus |
CN102409063A (zh) | 2001-12-04 | 2012-04-11 | 巴法里安诺迪克有限公司 | 黄病毒ns1亚单位疫苗 |
SI1497438T1 (sl) | 2002-04-25 | 2010-03-31 | Crucell Holland Bv | Sredstva in postopki za pripravo adenovirusnih vektorjev |
WO2004044155A2 (en) | 2002-11-07 | 2004-05-27 | Beth Israel Deaconess Medical Center | MIP-1α AND GM-CSF AS ADJUVANTS OF IMMUNE RESPONSE |
JP2006509039A (ja) | 2002-12-03 | 2006-03-16 | ユニバーシティ オブ マサチューセッツ | 多価初代hiv−1糖タンパク質dnaワクチンおよびワクチン接種方法 |
EP2363143A3 (en) | 2003-03-28 | 2012-02-15 | The Government of the United States of America, as represented by the Secretary, Department of Health and Human Services | MVA expressing modified hiv envelope, gag, and pol genes |
EP1667631A4 (en) | 2003-09-15 | 2010-04-14 | Novartis Vaccines & Diagnostic | COMBINED APPROACHES TO PRODUCE IMMUNE RESPONSES |
US20070298051A1 (en) | 2003-11-19 | 2007-12-27 | Beth Israel Deaconess Medical Center | Adjuvants Of Immune Response |
EP1766097A4 (en) | 2004-06-15 | 2008-03-19 | Progenics Pharm Inc | HIV-1 NEUTRALIZATION ANTIBODIES ELICITED BY A TRIMERIC COMPLEX OF HIV-1 ENVELOPE GLYCOPROTEINS |
EP2397490B1 (en) | 2004-07-16 | 2013-09-04 | THE UNITED STATES OF AMERICA, represented by THE SECRETARY, DEPARTMENT OF HEALTH AND HUMAN SERVICES | Vaccine constructs and combinations of vaccines designed to improve the breadth of the immune response to diverse strains and clades of HIV |
EA010433B1 (ru) | 2004-10-13 | 2008-08-29 | Круселл Холланд Б.В. | Усовершенствованные аденовирусные векторы и их применение |
CN1857345B (zh) * | 2005-05-08 | 2010-09-01 | 谢秀琼 | 一种治疗偏头痛的药物组合物及其制备方法 |
WO2007005934A2 (en) | 2005-07-06 | 2007-01-11 | University Of Maryland Biotechnology Institute | Constrained hiv envelope-based immunogen that simultaneously presents receptor and coreceptor binding sites |
CN101969996A (zh) | 2005-08-23 | 2011-02-09 | 加利福尼亚大学董事会 | 多价疫苗 |
US20100143302A1 (en) | 2006-03-16 | 2010-06-10 | Crucell Holland B.V. | Recombinant Adenoviruses Based on Serotype 26 and 48, and Use Thereof |
WO2007149491A2 (en) | 2006-06-19 | 2007-12-27 | Progenics Pharmaceuticals, Inc. | Soluble stabilized trimeric hiv env proteins and uses thereof |
WO2008063331A2 (en) | 2006-10-23 | 2008-05-29 | Progenics Pharmaceuticals, Inc. | Modified gp140 envelope polypeptides of hiv-1 isolates, compositions, stabilized trimeric complexes, and uses thereof |
WO2008140579A2 (en) | 2006-11-17 | 2008-11-20 | New York University | Induction of broadly reactive neutralizing antibodies by focusing the immune response on v3 epitopes of the hiv-1 gp120 envelope |
CA2896131C (en) | 2007-03-02 | 2020-04-07 | Glaxosmithkline Biologicals S.A. | Novel method and compositions |
PT2340038T (pt) | 2008-10-10 | 2018-02-21 | Beth Israel Deaconess Medical Ct Inc | Vacina de trímero de envelope para hiv-1 bioquimicamente estabilizada |
SI2358757T1 (sl) | 2008-11-18 | 2018-12-31 | Beth Israel Deaconess Medical Center | Antivirusna cepiva z izboljšano celularno imunogenostjo |
WO2010096561A1 (en) | 2009-02-18 | 2010-08-26 | The United States Of America, As Represented By The Secretary, Department Of Health And Human Services | Synthetic hiv/siv gag proteins and uses thereof |
CN105399833B (zh) | 2010-01-04 | 2019-09-06 | Kj 生物科学有限公司 | 用于疫苗和诊断学的Dps融合蛋白 |
JP5783642B2 (ja) | 2010-01-28 | 2015-09-24 | バヴァリアン・ノルディック・アクティーゼルスカブ | Mvaの主なゲノム欠失を含むワクシニアウイルス変異体 |
EP2926830B1 (en) | 2010-08-31 | 2017-08-02 | Theraclone Sciences, Inc. | Human immunodeficiency virus (hiv)-neutralizing antibodies |
US20140348791A1 (en) | 2011-09-09 | 2014-11-27 | Beth Israel Deaconess Medical Center, Inc. | Modified adenoviral vectors and methods of treatment using same |
US20130189754A1 (en) | 2011-09-12 | 2013-07-25 | International Aids Vaccine Initiative | Immunoselection of recombinant vesicular stomatitis virus expressing hiv-1 proteins by broadly neutralizing antibodies |
EP2766037A4 (en) | 2011-10-12 | 2015-08-05 | Scripps Research Inst | HIV-1 GP-120 MINI-V3 LOOP AND USES THEREOF |
WO2014047261A1 (en) | 2012-09-19 | 2014-03-27 | Beth Israel Deaconess Medical Center, Inc. | Viruses associated with immunodeficiency and enteropathy and methods using same |
EP2920313B1 (en) | 2012-11-16 | 2019-06-12 | Beth Israel Deaconess Medical Center, Inc. | Recombinant adenoviruses and use thereof |
CA2897059C (en) | 2013-01-07 | 2021-12-28 | Beth Israel Deaconess Medical Center, Inc. | Stabilized human immunodeficiency virus (hiv) envelope (env) trimer vaccines and methods of using same |
US10248758B2 (en) | 2013-02-07 | 2019-04-02 | University Of Washington Through Its Center For Commercialization | Self-assembling protein nanostructures |
US10376583B2 (en) | 2013-09-30 | 2019-08-13 | Beth Israel Deaconess Medical Center, Inc. | Human immunodeficiency virus therapies utilizing N332-glycan-dependent antibodies and a reservoir activator |
RS61902B1 (sr) | 2014-09-26 | 2021-06-30 | Beth Israel Deaconess Medical Ct Inc | Metodi i kompozicije za indukovanje zaštitnog imuniteta protiv infekcije virusom humane imunodeficijencije |
US9630994B2 (en) | 2014-11-03 | 2017-04-25 | University Of Washington | Polypeptides for use in self-assembling protein nanostructures |
ES2836432T3 (es) | 2015-03-18 | 2021-06-25 | Janssen Vaccines & Prevention Bv | Ensayos para sistemas de expresión recombinante |
MA44059B1 (fr) | 2015-12-15 | 2019-11-29 | Janssen Vaccines & Prevention Bv | Antigènes du virus de l'immunodéficience humaine, vecteurs, compositions, et leurs procédés d'utilisation |
EP3471765B1 (en) | 2016-06-16 | 2024-04-24 | Janssen Vaccines & Prevention B.V. | Hiv vaccine formulation |
US10307477B2 (en) | 2016-09-02 | 2019-06-04 | Janssen Vaccines & Prevention B.V. | Methods for inducing an immune response against human immunodeficiency virus infection in subjects undergoing antiretroviral treatment |
MX2019002938A (es) | 2016-09-15 | 2019-10-15 | Janssen Vaccines & Prevention Bv | Mutaciones estebilizantes de trimeros de proteinas de la envoltura del vih. |
SG11202000112XA (en) * | 2017-07-19 | 2020-02-27 | Janssen Vaccines & Prevention Bv | Trimer stabilizing hiv envelope protein mutations |
-
2017
- 2017-09-14 MX MX2019002938A patent/MX2019002938A/es unknown
- 2017-09-14 MD MDE20190798T patent/MD3512543T2/ro unknown
- 2017-09-14 BR BR112019004593A patent/BR112019004593A2/pt unknown
- 2017-09-14 IL IL265186A patent/IL265186B/en unknown
- 2017-09-14 CA CA3036959A patent/CA3036959A1/en active Pending
- 2017-09-14 AR ARP170102536A patent/AR109528A1/es unknown
- 2017-09-14 IL IL294832A patent/IL294832A/en unknown
- 2017-09-14 SG SG11201901206SA patent/SG11201901206SA/en unknown
- 2017-09-14 SI SI201730416T patent/SI3512543T1/sl unknown
- 2017-09-14 SG SG10202001956UA patent/SG10202001956UA/en unknown
- 2017-09-14 MY MYPI2019001242A patent/MY190534A/en unknown
- 2017-09-14 EA EA201990715A patent/EA201990715A1/ru unknown
- 2017-09-14 EP EP17769027.8A patent/EP3512543B1/en active Active
- 2017-09-14 PT PT177690278T patent/PT3512543T/pt unknown
- 2017-09-14 JP JP2019514316A patent/JP7178344B2/ja active Active
- 2017-09-14 MA MA46230A patent/MA46230B1/fr unknown
- 2017-09-14 RS RS20201208A patent/RS60919B1/sr unknown
- 2017-09-14 HU HUE17769027A patent/HUE052008T2/hu unknown
- 2017-09-14 EP EP20179463.3A patent/EP3747463A1/en active Pending
- 2017-09-14 US US15/704,651 patent/US10793607B2/en active Active
- 2017-09-14 LT LTEP17769027.8T patent/LT3512543T/lt unknown
- 2017-09-14 WO PCT/EP2017/073141 patent/WO2018050747A1/en active Search and Examination
- 2017-09-14 DK DK17769027.8T patent/DK3512543T3/da active
- 2017-09-14 ES ES17769027T patent/ES2824525T3/es active Active
- 2017-09-14 AU AU2017327672A patent/AU2017327672B2/en active Active
- 2017-09-14 PL PL17769027T patent/PL3512543T3/pl unknown
- 2017-09-14 KR KR1020197007592A patent/KR102513146B1/ko active IP Right Grant
- 2017-09-14 CN CN201780054555.6A patent/CN109689091A/zh active Pending
- 2017-09-15 TW TW106131855A patent/TWI742158B/zh active
-
2019
- 2019-02-08 PH PH12019500280A patent/PH12019500280A1/en unknown
- 2019-03-14 ZA ZA2019/01597A patent/ZA201901597B/en unknown
-
2020
- 2020-08-13 US US16/947,694 patent/US11365222B2/en active Active
- 2020-09-14 HR HRP20201458TT patent/HRP20201458T1/hr unknown
- 2020-10-09 CY CY20201100952T patent/CY1124518T1/el unknown
- 2020-11-13 AU AU2020267278A patent/AU2020267278B2/en not_active Expired - Fee Related
-
2022
- 2022-06-08 US US17/805,873 patent/US11820796B2/en active Active
- 2022-11-14 JP JP2022181566A patent/JP2023011941A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20120086379A (ko) * | 2003-09-17 | 2012-08-02 | 듀크 유니버시티 | 컨센서스/원형 면역원 |
WO2016037154A1 (en) * | 2014-09-04 | 2016-03-10 | The United States Of America, As Represented By The Secretary, Department Of Health & Human Services | Recombinant hiv-1 envelope proteins and their use |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11820796B2 (en) | Trimer stabilizing HIV envelope protein mutations | |
US11732010B2 (en) | Trimer stabilizing HIV envelope protein mutations | |
NZ750773B2 (en) | Trimer stabilizing hiv envelope protein mutations | |
KR20230150269A (ko) | Hiv 외피 단백질 돌연변이를 안정화시키는 삼량체 | |
EA042607B1 (ru) | Стабилизирующие тример мутации белка оболочки hiv | |
OA19472A (en) | Trimer stabilizing HIV envelope protein mutations. | |
EA038287B1 (ru) | Стабилизирующие тример мутации белка оболочки hiv | |
OA19492A (en) | Trimer stabilizing HIV envelope protein mutations |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |