KR20230015310A - 2019-ncov (sars-cov-2) 백신 - Google Patents
2019-ncov (sars-cov-2) 백신 Download PDFInfo
- Publication number
- KR20230015310A KR20230015310A KR1020227032226A KR20227032226A KR20230015310A KR 20230015310 A KR20230015310 A KR 20230015310A KR 1020227032226 A KR1020227032226 A KR 1020227032226A KR 20227032226 A KR20227032226 A KR 20227032226A KR 20230015310 A KR20230015310 A KR 20230015310A
- Authority
- KR
- South Korea
- Prior art keywords
- leu
- ser
- thr
- gly
- val
- Prior art date
Links
- 229960005486 vaccine Drugs 0.000 title claims abstract description 44
- 101000629318 Severe acute respiratory syndrome coronavirus 2 Spike glycoprotein Proteins 0.000 claims abstract description 217
- 239000012634 fragment Substances 0.000 claims abstract description 209
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 168
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 168
- 239000002157 polynucleotide Substances 0.000 claims abstract description 168
- 101710198474 Spike protein Proteins 0.000 claims abstract description 119
- 229940096437 Protein S Drugs 0.000 claims abstract description 111
- 230000014509 gene expression Effects 0.000 claims abstract description 110
- 241001678559 COVID-19 virus Species 0.000 claims abstract description 93
- 210000004027 cell Anatomy 0.000 claims abstract description 73
- 230000009260 cross reactivity Effects 0.000 claims abstract description 47
- 241000588724 Escherichia coli Species 0.000 claims abstract description 44
- 230000000890 antigenic effect Effects 0.000 claims abstract description 42
- 208000025721 COVID-19 Diseases 0.000 claims abstract description 27
- 238000011282 treatment Methods 0.000 claims abstract description 17
- 210000005260 human cell Anatomy 0.000 claims abstract description 16
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims abstract description 10
- 210000004962 mammalian cell Anatomy 0.000 claims abstract description 8
- 230000002265 prevention Effects 0.000 claims abstract description 8
- 238000003259 recombinant expression Methods 0.000 claims abstract description 6
- 241000235070 Saccharomyces Species 0.000 claims abstract description 4
- 102000037865 fusion proteins Human genes 0.000 claims description 120
- 108020001507 fusion proteins Proteins 0.000 claims description 120
- 150000007523 nucleic acids Chemical group 0.000 claims description 101
- 108090000623 proteins and genes Proteins 0.000 claims description 96
- 102000004169 proteins and genes Human genes 0.000 claims description 73
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 70
- 238000000034 method Methods 0.000 claims description 62
- 108020004414 DNA Proteins 0.000 claims description 60
- 108091007433 antigens Proteins 0.000 claims description 56
- 102000036639 antigens Human genes 0.000 claims description 56
- 239000000427 antigen Substances 0.000 claims description 55
- 239000000203 mixture Substances 0.000 claims description 43
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 42
- 239000013603 viral vector Substances 0.000 claims description 38
- 108020004705 Codon Proteins 0.000 claims description 37
- 102000039446 nucleic acids Human genes 0.000 claims description 37
- 108020004707 nucleic acids Proteins 0.000 claims description 37
- 229940022005 RNA vaccine Drugs 0.000 claims description 33
- 108700021021 mRNA Vaccine Proteins 0.000 claims description 33
- 239000013612 plasmid Substances 0.000 claims description 33
- 102000005962 receptors Human genes 0.000 claims description 21
- 108020003175 receptors Proteins 0.000 claims description 21
- 230000003472 neutralizing effect Effects 0.000 claims description 20
- 239000002245 particle Substances 0.000 claims description 19
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 15
- 238000004519 manufacturing process Methods 0.000 claims description 13
- 108091023037 Aptamer Proteins 0.000 claims description 11
- 201000010284 hepatitis E Diseases 0.000 claims description 11
- 208000002672 hepatitis B Diseases 0.000 claims description 9
- 230000028327 secretion Effects 0.000 claims description 9
- 101000641175 Human papillomavirus type 18 Major capsid protein L1 Proteins 0.000 claims description 8
- 230000006978 adaptation Effects 0.000 claims description 7
- 108091034117 Oligonucleotide Proteins 0.000 claims description 6
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 6
- 239000003085 diluting agent Substances 0.000 claims description 6
- 239000003814 drug Substances 0.000 claims description 6
- 239000003937 drug carrier Substances 0.000 claims description 5
- 241000700605 Viruses Species 0.000 claims description 4
- 108020005067 RNA Splice Sites Proteins 0.000 claims description 3
- 108700026226 TATA Box Proteins 0.000 claims description 3
- 230000003252 repetitive effect Effects 0.000 claims description 3
- 238000011321 prophylaxis Methods 0.000 claims description 2
- 229940023147 viral vector vaccine Drugs 0.000 claims 2
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 claims 1
- 229910052698 phosphorus Inorganic materials 0.000 claims 1
- 239000011574 phosphorus Substances 0.000 claims 1
- 241000711573 Coronaviridae Species 0.000 abstract description 31
- 230000002163 immunogen Effects 0.000 description 74
- 108090000765 processed proteins & peptides Proteins 0.000 description 69
- 235000018102 proteins Nutrition 0.000 description 65
- 235000001014 amino acid Nutrition 0.000 description 62
- 150000001413 amino acids Chemical class 0.000 description 57
- 229940024606 amino acid Drugs 0.000 description 55
- 102000004196 processed proteins & peptides Human genes 0.000 description 49
- 229920001184 polypeptide Polymers 0.000 description 46
- 238000010367 cloning Methods 0.000 description 43
- 241000282414 Homo sapiens Species 0.000 description 34
- 239000013598 vector Substances 0.000 description 32
- 238000006467 substitution reaction Methods 0.000 description 27
- 108700010070 Codon Usage Proteins 0.000 description 22
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 22
- 150000001875 compounds Chemical class 0.000 description 22
- HKZAAJSTFUZYTO-LURJTMIESA-N (2s)-2-[[2-[[2-[[2-[(2-aminoacetyl)amino]acetyl]amino]acetyl]amino]acetyl]amino]-3-hydroxypropanoic acid Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O HKZAAJSTFUZYTO-LURJTMIESA-N 0.000 description 18
- 241000880493 Leptailurus serval Species 0.000 description 18
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 18
- 108010050848 glycylleucine Proteins 0.000 description 18
- 108010037850 glycylvaline Proteins 0.000 description 18
- 108010057821 leucylproline Proteins 0.000 description 18
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 17
- 241000699670 Mus sp. Species 0.000 description 16
- WNROFYMDJYEPJX-UHFFFAOYSA-K aluminium hydroxide Chemical compound [OH-].[OH-].[OH-].[Al+3] WNROFYMDJYEPJX-UHFFFAOYSA-K 0.000 description 16
- 125000000539 amino acid group Chemical group 0.000 description 16
- 108010061238 threonyl-glycine Proteins 0.000 description 16
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 15
- 230000004048 modification Effects 0.000 description 15
- 238000012986 modification Methods 0.000 description 15
- 238000005457 optimization Methods 0.000 description 15
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 14
- 239000002671 adjuvant Substances 0.000 description 14
- 230000035772 mutation Effects 0.000 description 14
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 13
- 230000005875 antibody response Effects 0.000 description 13
- 108010089804 glycyl-threonine Proteins 0.000 description 13
- 230000000670 limiting effect Effects 0.000 description 13
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 12
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 12
- 241001465754 Metazoa Species 0.000 description 12
- -1 P1263L) Chemical compound 0.000 description 12
- 108010047495 alanylglycine Proteins 0.000 description 12
- 238000009472 formulation Methods 0.000 description 12
- 208000015181 infectious disease Diseases 0.000 description 12
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 12
- 102100031673 Corneodesmosin Human genes 0.000 description 11
- 101710139375 Corneodesmosin Proteins 0.000 description 11
- 241000701806 Human papillomavirus Species 0.000 description 11
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 11
- 241000124008 Mammalia Species 0.000 description 11
- 230000002480 immunoprotective effect Effects 0.000 description 11
- 108020004999 messenger RNA Proteins 0.000 description 11
- 108010047041 Complementarity Determining Regions Proteins 0.000 description 10
- RMKGXGPQIPLTFC-KKUMJFAQSA-N Phe-Lys-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O RMKGXGPQIPLTFC-KKUMJFAQSA-N 0.000 description 10
- 241000288906 Primates Species 0.000 description 10
- 108010044940 alanylglutamine Proteins 0.000 description 10
- 238000012217 deletion Methods 0.000 description 10
- 230000037430 deletion Effects 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 108010029020 prolylglycine Proteins 0.000 description 10
- 241000894007 species Species 0.000 description 10
- 108010009962 valyltyrosine Proteins 0.000 description 10
- IBLAOXSULLECQZ-IUKAMOBKSA-N Asn-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(N)=O IBLAOXSULLECQZ-IUKAMOBKSA-N 0.000 description 9
- 241000282412 Homo Species 0.000 description 9
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 9
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 9
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 9
- 108010072041 arginyl-glycyl-aspartic acid Proteins 0.000 description 9
- 230000000694 effects Effects 0.000 description 9
- 230000004044 response Effects 0.000 description 9
- 230000003612 virological effect Effects 0.000 description 9
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 8
- IARGXWMWRFOQPG-GCJQMDKQSA-N Asn-Ala-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IARGXWMWRFOQPG-GCJQMDKQSA-N 0.000 description 8
- 102100028169 BET1-like protein Human genes 0.000 description 8
- 101710138653 BET1-like protein Proteins 0.000 description 8
- 108091062157 Cis-regulatory element Proteins 0.000 description 8
- QICVAHODWHIWIS-HTFCKZLJSA-N Ile-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N QICVAHODWHIWIS-HTFCKZLJSA-N 0.000 description 8
- GHKXHCMRAUYLBS-CIUDSAMLSA-N Lys-Ser-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O GHKXHCMRAUYLBS-CIUDSAMLSA-N 0.000 description 8
- 108010079364 N-glycylalanine Proteins 0.000 description 8
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 8
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 8
- NSTPFWRAIDTNGH-BZSNNMDCSA-N Tyr-Asn-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NSTPFWRAIDTNGH-BZSNNMDCSA-N 0.000 description 8
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 8
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 8
- 108010038633 aspartylglutamate Proteins 0.000 description 8
- 210000004899 c-terminal region Anatomy 0.000 description 8
- 108010060199 cysteinylproline Proteins 0.000 description 8
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 8
- 108010027338 isoleucylcysteine Proteins 0.000 description 8
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 8
- 108010017391 lysylvaline Proteins 0.000 description 8
- 108010051242 phenylalanylserine Proteins 0.000 description 8
- 208000024891 symptom Diseases 0.000 description 8
- 230000001225 therapeutic effect Effects 0.000 description 8
- 210000005253 yeast cell Anatomy 0.000 description 8
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 7
- KLYPOCBLKMPBIQ-GHCJXIJMSA-N Asp-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N KLYPOCBLKMPBIQ-GHCJXIJMSA-N 0.000 description 7
- 108091026890 Coding region Proteins 0.000 description 7
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 7
- IBYOLNARKHMLBG-WHOFXGATSA-N Gly-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IBYOLNARKHMLBG-WHOFXGATSA-N 0.000 description 7
- ZYVTXBXHIKGZMD-QSFUFRPTSA-N Ile-Val-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ZYVTXBXHIKGZMD-QSFUFRPTSA-N 0.000 description 7
- 241000235058 Komagataella pastoris Species 0.000 description 7
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 7
- GCXGCIYIHXSKAY-ULQDDVLXSA-N Leu-Phe-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GCXGCIYIHXSKAY-ULQDDVLXSA-N 0.000 description 7
- KLSUAWUZBMAZCL-RHYQMDGZSA-N Leu-Thr-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O KLSUAWUZBMAZCL-RHYQMDGZSA-N 0.000 description 7
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 7
- WVXQQUWOKUZIEG-VEVYYDQMSA-N Pro-Thr-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O WVXQQUWOKUZIEG-VEVYYDQMSA-N 0.000 description 7
- CXBFHZLODKPIJY-AAEUAGOBSA-N Ser-Gly-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N CXBFHZLODKPIJY-AAEUAGOBSA-N 0.000 description 7
- FLONGDPORFIVQW-XGEHTFHBSA-N Ser-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FLONGDPORFIVQW-XGEHTFHBSA-N 0.000 description 7
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 7
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 7
- GXUWHVZYDAHFSV-FLBSBUHZSA-N Thr-Ile-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GXUWHVZYDAHFSV-FLBSBUHZSA-N 0.000 description 7
- KVEWWQRTAVMOFT-KJEVXHAQSA-N Thr-Tyr-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O KVEWWQRTAVMOFT-KJEVXHAQSA-N 0.000 description 7
- IECQJCJNPJVUSB-IHRRRGAJSA-N Val-Tyr-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CO)C(O)=O IECQJCJNPJVUSB-IHRRRGAJSA-N 0.000 description 7
- 108010041407 alanylaspartic acid Proteins 0.000 description 7
- 108010068265 aspartyltyrosine Proteins 0.000 description 7
- 108010054812 diprotin A Proteins 0.000 description 7
- 108010081551 glycylphenylalanine Proteins 0.000 description 7
- 230000028993 immune response Effects 0.000 description 7
- 108010053037 kyotorphin Proteins 0.000 description 7
- 108010009298 lysylglutamic acid Proteins 0.000 description 7
- 108010012581 phenylalanylglutamate Proteins 0.000 description 7
- 230000010473 stable expression Effects 0.000 description 7
- 230000014616 translation Effects 0.000 description 7
- 108010073969 valyllysine Proteins 0.000 description 7
- DPNZTBKGAUAZQU-DLOVCJGASA-N Ala-Leu-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DPNZTBKGAUAZQU-DLOVCJGASA-N 0.000 description 6
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 6
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 6
- XMIAMUXIMWREBJ-HERUPUMHSA-N Ala-Trp-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)N)C(=O)O)N XMIAMUXIMWREBJ-HERUPUMHSA-N 0.000 description 6
- LXMKTIZAGIBQRX-HRCADAONSA-N Arg-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O LXMKTIZAGIBQRX-HRCADAONSA-N 0.000 description 6
- KXFCBAHYSLJCCY-ZLUOBGJFSA-N Asn-Asn-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O KXFCBAHYSLJCCY-ZLUOBGJFSA-N 0.000 description 6
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 6
- UHGUKCOQUNPSKK-CIUDSAMLSA-N Asn-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N UHGUKCOQUNPSKK-CIUDSAMLSA-N 0.000 description 6
- PLOKOIJSGCISHE-BYULHYEWSA-N Asp-Val-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PLOKOIJSGCISHE-BYULHYEWSA-N 0.000 description 6
- ATPDEYTYWVMINF-ZLUOBGJFSA-N Cys-Cys-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O ATPDEYTYWVMINF-ZLUOBGJFSA-N 0.000 description 6
- JLZCAZJGWNRXCI-XKBZYTNZSA-N Cys-Thr-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O JLZCAZJGWNRXCI-XKBZYTNZSA-N 0.000 description 6
- 238000002965 ELISA Methods 0.000 description 6
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 6
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 6
- SWQALSGKVLYKDT-ZKWXMUAHSA-N Gly-Ile-Ala Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SWQALSGKVLYKDT-ZKWXMUAHSA-N 0.000 description 6
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 6
- PTIIBFKSLCYQBO-NHCYSSNCSA-N Gly-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)CN PTIIBFKSLCYQBO-NHCYSSNCSA-N 0.000 description 6
- 239000004471 Glycine Substances 0.000 description 6
- TZCGZYWNIDZZMR-NAKRPEOUSA-N Ile-Arg-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C)C(=O)O)N TZCGZYWNIDZZMR-NAKRPEOUSA-N 0.000 description 6
- UMYZBHKAVTXWIW-GMOBBJLQSA-N Ile-Asp-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UMYZBHKAVTXWIW-GMOBBJLQSA-N 0.000 description 6
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 6
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 6
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 6
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 6
- VCSBGUACOYUIGD-CIUDSAMLSA-N Leu-Asn-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VCSBGUACOYUIGD-CIUDSAMLSA-N 0.000 description 6
- KKXDHFKZWKLYGB-GUBZILKMSA-N Leu-Asn-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKXDHFKZWKLYGB-GUBZILKMSA-N 0.000 description 6
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 6
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 6
- VHTIZYYHIUHMCA-JYJNAYRXSA-N Leu-Tyr-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VHTIZYYHIUHMCA-JYJNAYRXSA-N 0.000 description 6
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 6
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 6
- MWMKFWJYRRGXOR-ZLUOBGJFSA-N Ser-Ala-Asn Chemical compound N[C@H](C(=O)N[C@H](C(=O)N[C@H](C(=O)O)CC(N)=O)C)CO MWMKFWJYRRGXOR-ZLUOBGJFSA-N 0.000 description 6
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 6
- YEDSOSIKVUMIJE-DCAQKATOSA-N Ser-Val-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O YEDSOSIKVUMIJE-DCAQKATOSA-N 0.000 description 6
- TZKPNGDGUVREEB-FOHZUACHSA-N Thr-Asn-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O TZKPNGDGUVREEB-FOHZUACHSA-N 0.000 description 6
- ONNSECRQFSTMCC-XKBZYTNZSA-N Thr-Glu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ONNSECRQFSTMCC-XKBZYTNZSA-N 0.000 description 6
- RRRRCRYTLZVCEN-HJGDQZAQSA-N Thr-Leu-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O RRRRCRYTLZVCEN-HJGDQZAQSA-N 0.000 description 6
- KXUKIBHIVRYOIP-ZKWXMUAHSA-N Val-Asp-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N KXUKIBHIVRYOIP-ZKWXMUAHSA-N 0.000 description 6
- 108010087924 alanylproline Proteins 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 6
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 6
- 108010047857 aspartylglycine Proteins 0.000 description 6
- 108010090037 glycyl-alanyl-isoleucine Proteins 0.000 description 6
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Chemical compound NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 6
- 230000036039 immunity Effects 0.000 description 6
- 230000001965 increasing effect Effects 0.000 description 6
- 108010064235 lysylglycine Proteins 0.000 description 6
- 108010054155 lysyllysine Proteins 0.000 description 6
- 239000000546 pharmaceutical excipient Substances 0.000 description 6
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 6
- 108010020432 prolyl-prolylisoleucine Proteins 0.000 description 6
- 108010090894 prolylleucine Proteins 0.000 description 6
- 230000009467 reduction Effects 0.000 description 6
- 108010026333 seryl-proline Proteins 0.000 description 6
- 238000013519 translation Methods 0.000 description 6
- 238000001262 western blot Methods 0.000 description 6
- DQVAZKGVGKHQDS-UHFFFAOYSA-N 2-[[1-[2-[(2-amino-4-methylpentanoyl)amino]-4-methylpentanoyl]pyrrolidine-2-carbonyl]amino]-4-methylpentanoic acid Chemical compound CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(=O)NC(CC(C)C)C(O)=O DQVAZKGVGKHQDS-UHFFFAOYSA-N 0.000 description 5
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 5
- KUDREHRZRIVKHS-UWJYBYFXSA-N Ala-Asp-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KUDREHRZRIVKHS-UWJYBYFXSA-N 0.000 description 5
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 5
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 5
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 5
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 5
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 5
- BECXEHHOZNFFFX-IHRRRGAJSA-N Arg-Ser-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BECXEHHOZNFFFX-IHRRRGAJSA-N 0.000 description 5
- PDQBXRSOSCTGKY-ACZMJKKPSA-N Asn-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PDQBXRSOSCTGKY-ACZMJKKPSA-N 0.000 description 5
- DAPLJWATMAXPPZ-CIUDSAMLSA-N Asn-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O DAPLJWATMAXPPZ-CIUDSAMLSA-N 0.000 description 5
- CZIXHXIJJZLYRJ-SRVKXCTJSA-N Asn-Cys-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CZIXHXIJJZLYRJ-SRVKXCTJSA-N 0.000 description 5
- NCFJQJRLQJEECD-NHCYSSNCSA-N Asn-Leu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O NCFJQJRLQJEECD-NHCYSSNCSA-N 0.000 description 5
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 5
- IVPNEDNYYYFAGI-GARJFASQSA-N Asp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N IVPNEDNYYYFAGI-GARJFASQSA-N 0.000 description 5
- VNXQRBXEQXLERQ-CIUDSAMLSA-N Asp-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N VNXQRBXEQXLERQ-CIUDSAMLSA-N 0.000 description 5
- QQOWCDCBFFBRQH-IXOXFDKPSA-N Cys-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CS)N)O QQOWCDCBFFBRQH-IXOXFDKPSA-N 0.000 description 5
- 102100038132 Endogenous retrovirus group K member 6 Pro protein Human genes 0.000 description 5
- HHWQMFIGMMOVFK-WDSKDSINSA-N Gln-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O HHWQMFIGMMOVFK-WDSKDSINSA-N 0.000 description 5
- UWMDGPFFTKDUIY-HJGDQZAQSA-N Gln-Pro-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O UWMDGPFFTKDUIY-HJGDQZAQSA-N 0.000 description 5
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 5
- QXDXIXFSFHUYAX-MNXVOIDGSA-N Glu-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O QXDXIXFSFHUYAX-MNXVOIDGSA-N 0.000 description 5
- KRRFFAHEAOCBCQ-SIUGBPQLSA-N Glu-Ile-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KRRFFAHEAOCBCQ-SIUGBPQLSA-N 0.000 description 5
- FVGOGEGGQLNZGH-DZKIICNBSA-N Glu-Val-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FVGOGEGGQLNZGH-DZKIICNBSA-N 0.000 description 5
- SUDUYJOBLHQAMI-WHFBIAKZSA-N Gly-Asp-Cys Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CS)C(O)=O SUDUYJOBLHQAMI-WHFBIAKZSA-N 0.000 description 5
- DGKBSGNCMCLDSL-BYULHYEWSA-N Gly-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN DGKBSGNCMCLDSL-BYULHYEWSA-N 0.000 description 5
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 5
- SBVMXEZQJVUARN-XPUUQOCRSA-N Gly-Val-Ser Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O SBVMXEZQJVUARN-XPUUQOCRSA-N 0.000 description 5
- IZVICCORZOSGPT-JSGCOSHPSA-N Gly-Val-Tyr Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IZVICCORZOSGPT-JSGCOSHPSA-N 0.000 description 5
- 241000238631 Hexapoda Species 0.000 description 5
- UWSMZKRTOZEGDD-CUJWVEQBSA-N His-Thr-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O UWSMZKRTOZEGDD-CUJWVEQBSA-N 0.000 description 5
- MQFGXJNSUJTXDT-QSFUFRPTSA-N Ile-Gly-Ile Chemical compound N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)O MQFGXJNSUJTXDT-QSFUFRPTSA-N 0.000 description 5
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 5
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 5
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 5
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 5
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 5
- MMEDVBWCMGRKKC-GARJFASQSA-N Leu-Asp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N MMEDVBWCMGRKKC-GARJFASQSA-N 0.000 description 5
- CQGSYZCULZMEDE-SRVKXCTJSA-N Leu-Gln-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CQGSYZCULZMEDE-SRVKXCTJSA-N 0.000 description 5
- LAPSXOAUPNOINL-YUMQZZPRSA-N Leu-Gly-Asp Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O LAPSXOAUPNOINL-YUMQZZPRSA-N 0.000 description 5
- FIYMBBHGYNQFOP-IUCAKERBSA-N Leu-Gly-Gln Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N FIYMBBHGYNQFOP-IUCAKERBSA-N 0.000 description 5
- RTIRBWJPYJYTLO-MELADBBJSA-N Leu-Lys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N RTIRBWJPYJYTLO-MELADBBJSA-N 0.000 description 5
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 5
- XXXXOVFBXRERQL-ULQDDVLXSA-N Leu-Pro-Phe Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XXXXOVFBXRERQL-ULQDDVLXSA-N 0.000 description 5
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 5
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 5
- LJUUGSWZPQOJKD-JYJNAYRXSA-N Phe-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O LJUUGSWZPQOJKD-JYJNAYRXSA-N 0.000 description 5
- AWAYOWOUGVZXOB-BZSNNMDCSA-N Phe-Asn-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 AWAYOWOUGVZXOB-BZSNNMDCSA-N 0.000 description 5
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 5
- JJHVFCUWLSKADD-ONGXEEELSA-N Phe-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O JJHVFCUWLSKADD-ONGXEEELSA-N 0.000 description 5
- WWPAHTZOWURIMR-ULQDDVLXSA-N Phe-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 WWPAHTZOWURIMR-ULQDDVLXSA-N 0.000 description 5
- VDTYRPWRWRCROL-UFYCRDLUSA-N Phe-Val-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 VDTYRPWRWRCROL-UFYCRDLUSA-N 0.000 description 5
- MWQXFDIQXIXPMS-UNQGMJICSA-N Phe-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O MWQXFDIQXIXPMS-UNQGMJICSA-N 0.000 description 5
- AJBQTGZIZQXBLT-STQMWFEESA-N Pro-Phe-Gly Chemical compound C([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 AJBQTGZIZQXBLT-STQMWFEESA-N 0.000 description 5
- UCXDHBORXLVBNC-ZLUOBGJFSA-N Ser-Asn-Cys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(O)=O UCXDHBORXLVBNC-ZLUOBGJFSA-N 0.000 description 5
- KKKVOZNCLALMPV-XKBZYTNZSA-N Ser-Thr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KKKVOZNCLALMPV-XKBZYTNZSA-N 0.000 description 5
- DYEGLQRVMBWQLD-IXOXFDKPSA-N Ser-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CO)N)O DYEGLQRVMBWQLD-IXOXFDKPSA-N 0.000 description 5
- 108091081024 Start codon Proteins 0.000 description 5
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 5
- JMGJDTNUMAZNLX-RWRJDSDZSA-N Thr-Glu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JMGJDTNUMAZNLX-RWRJDSDZSA-N 0.000 description 5
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 5
- AZGZDDNKFFUDEH-QWRGUYRKSA-N Tyr-Gly-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AZGZDDNKFFUDEH-QWRGUYRKSA-N 0.000 description 5
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 5
- FMXFHNSFABRVFZ-BZSNNMDCSA-N Tyr-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FMXFHNSFABRVFZ-BZSNNMDCSA-N 0.000 description 5
- JIODCDXKCJRMEH-NHCYSSNCSA-N Val-Arg-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N JIODCDXKCJRMEH-NHCYSSNCSA-N 0.000 description 5
- BYOHPUZJVXWHAE-BYULHYEWSA-N Val-Asn-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N BYOHPUZJVXWHAE-BYULHYEWSA-N 0.000 description 5
- BVWPHWLFGRCECJ-JSGCOSHPSA-N Val-Gly-Tyr Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N BVWPHWLFGRCECJ-JSGCOSHPSA-N 0.000 description 5
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 5
- VNGKMNPAENRGDC-JYJNAYRXSA-N Val-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 VNGKMNPAENRGDC-JYJNAYRXSA-N 0.000 description 5
- LCHZBEUVGAVMKS-RHYQMDGZSA-N Val-Thr-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)[C@@H](C)O)C(O)=O LCHZBEUVGAVMKS-RHYQMDGZSA-N 0.000 description 5
- QPJSIBAOZBVELU-BPNCWPANSA-N Val-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N QPJSIBAOZBVELU-BPNCWPANSA-N 0.000 description 5
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 5
- 235000004279 alanine Nutrition 0.000 description 5
- ILRRQNADMUWWFW-UHFFFAOYSA-K aluminium phosphate Chemical compound O1[Al]2OP1(=O)O2 ILRRQNADMUWWFW-UHFFFAOYSA-K 0.000 description 5
- 108010062796 arginyllysine Proteins 0.000 description 5
- 108010092854 aspartyllysine Proteins 0.000 description 5
- 230000001580 bacterial effect Effects 0.000 description 5
- 239000003795 chemical substances by application Substances 0.000 description 5
- 108010004073 cysteinylcysteine Proteins 0.000 description 5
- 108010069495 cysteinyltyrosine Proteins 0.000 description 5
- 241001493065 dsRNA viruses Species 0.000 description 5
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 5
- 108010073628 glutamyl-valyl-phenylalanine Proteins 0.000 description 5
- 108010074027 glycyl-seryl-phenylalanine Proteins 0.000 description 5
- 108010087823 glycyltyrosine Proteins 0.000 description 5
- 108010018006 histidylserine Proteins 0.000 description 5
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 5
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 5
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 5
- 108010038320 lysylphenylalanine Proteins 0.000 description 5
- 229940035032 monophosphoryl lipid a Drugs 0.000 description 5
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 5
- 150000003839 salts Chemical class 0.000 description 5
- CWFMWBHMIMNZLN-NAKRPEOUSA-N (2s)-1-[(2s)-2-[[(2s,3s)-2-amino-3-methylpentanoyl]amino]propanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CWFMWBHMIMNZLN-NAKRPEOUSA-N 0.000 description 4
- YYGNTYWPHWGJRM-UHFFFAOYSA-N (6E,10E,14E,18E)-2,6,10,15,19,23-hexamethyltetracosa-2,6,10,14,18,22-hexaene Chemical compound CC(C)=CCCC(C)=CCCC(C)=CCCC=C(C)CCC=C(C)CCC=C(C)C YYGNTYWPHWGJRM-UHFFFAOYSA-N 0.000 description 4
- FUOOLUPWFVMBKG-UHFFFAOYSA-N 2-Aminoisobutyric acid Chemical compound CC(C)(N)C(O)=O FUOOLUPWFVMBKG-UHFFFAOYSA-N 0.000 description 4
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 4
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 4
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 4
- UGLPMYSCWHTZQU-AUTRQRHGSA-N Ala-Ala-Tyr Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UGLPMYSCWHTZQU-AUTRQRHGSA-N 0.000 description 4
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 4
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 4
- BTYTYHBSJKQBQA-GCJQMDKQSA-N Ala-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N)O BTYTYHBSJKQBQA-GCJQMDKQSA-N 0.000 description 4
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 4
- BVSGPHDECMJBDE-HGNGGELXSA-N Ala-Glu-His Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N BVSGPHDECMJBDE-HGNGGELXSA-N 0.000 description 4
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 4
- FAJIYNONGXEXAI-CQDKDKBSSA-N Ala-His-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CNC=N1 FAJIYNONGXEXAI-CQDKDKBSSA-N 0.000 description 4
- NMXKFWOEASXOGB-QSFUFRPTSA-N Ala-Ile-His Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NMXKFWOEASXOGB-QSFUFRPTSA-N 0.000 description 4
- PVQLRJRPUTXFFX-CIUDSAMLSA-N Ala-Met-Gln Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O PVQLRJRPUTXFFX-CIUDSAMLSA-N 0.000 description 4
- PEEYDECOOVQKRZ-DLOVCJGASA-N Ala-Ser-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PEEYDECOOVQKRZ-DLOVCJGASA-N 0.000 description 4
- QRIYOHQJRDHFKF-UWJYBYFXSA-N Ala-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 QRIYOHQJRDHFKF-UWJYBYFXSA-N 0.000 description 4
- SGYSTDWPNPKJPP-GUBZILKMSA-N Arg-Ala-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SGYSTDWPNPKJPP-GUBZILKMSA-N 0.000 description 4
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 4
- JSHVMZANPXCDTL-GMOBBJLQSA-N Arg-Asp-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JSHVMZANPXCDTL-GMOBBJLQSA-N 0.000 description 4
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 4
- CZUHPNLXLWMYMG-UBHSHLNASA-N Arg-Phe-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 CZUHPNLXLWMYMG-UBHSHLNASA-N 0.000 description 4
- VEAIMHJZTIDCIH-KKUMJFAQSA-N Arg-Phe-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VEAIMHJZTIDCIH-KKUMJFAQSA-N 0.000 description 4
- UGXVKHRDGLYFKR-CIUDSAMLSA-N Asn-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(N)=O UGXVKHRDGLYFKR-CIUDSAMLSA-N 0.000 description 4
- QNJIRRVTOXNGMH-GUBZILKMSA-N Asn-Gln-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC(N)=O QNJIRRVTOXNGMH-GUBZILKMSA-N 0.000 description 4
- QPTAGIPWARILES-AVGNSLFASA-N Asn-Gln-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QPTAGIPWARILES-AVGNSLFASA-N 0.000 description 4
- PBSQFBAJKPLRJY-BYULHYEWSA-N Asn-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N PBSQFBAJKPLRJY-BYULHYEWSA-N 0.000 description 4
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 4
- ZMUQQMGITUJQTI-CIUDSAMLSA-N Asn-Leu-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZMUQQMGITUJQTI-CIUDSAMLSA-N 0.000 description 4
- OROMFUQQTSWUTI-IHRRRGAJSA-N Asn-Phe-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OROMFUQQTSWUTI-IHRRRGAJSA-N 0.000 description 4
- RBOBTTLFPRSXKZ-BZSNNMDCSA-N Asn-Phe-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RBOBTTLFPRSXKZ-BZSNNMDCSA-N 0.000 description 4
- XTMZYFMTYJNABC-ZLUOBGJFSA-N Asn-Ser-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N XTMZYFMTYJNABC-ZLUOBGJFSA-N 0.000 description 4
- BCADFFUQHIMQAA-KKHAAJSZSA-N Asn-Thr-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BCADFFUQHIMQAA-KKHAAJSZSA-N 0.000 description 4
- XOQYDFCQPWAMSA-KKHAAJSZSA-N Asn-Val-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOQYDFCQPWAMSA-KKHAAJSZSA-N 0.000 description 4
- HBUJSDCLZCXXCW-YDHLFZDLSA-N Asn-Val-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HBUJSDCLZCXXCW-YDHLFZDLSA-N 0.000 description 4
- WQAOZCVOOYUWKG-LSJOCFKGSA-N Asn-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC(=O)N)N WQAOZCVOOYUWKG-LSJOCFKGSA-N 0.000 description 4
- PZXPWHFYZXTFBI-YUMQZZPRSA-N Asp-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PZXPWHFYZXTFBI-YUMQZZPRSA-N 0.000 description 4
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 4
- XWSIYTYNLKCLJB-CIUDSAMLSA-N Asp-Lys-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O XWSIYTYNLKCLJB-CIUDSAMLSA-N 0.000 description 4
- RXBGWGRSWXOBGK-KKUMJFAQSA-N Asp-Lys-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RXBGWGRSWXOBGK-KKUMJFAQSA-N 0.000 description 4
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 4
- NJLLRXWFPQQPHV-SRVKXCTJSA-N Asp-Tyr-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O NJLLRXWFPQQPHV-SRVKXCTJSA-N 0.000 description 4
- ZUNMTUPRQMWMHX-LSJOCFKGSA-N Asp-Val-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O ZUNMTUPRQMWMHX-LSJOCFKGSA-N 0.000 description 4
- WXKWQSDHEXKKNC-ZKWXMUAHSA-N Cys-Asp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N WXKWQSDHEXKKNC-ZKWXMUAHSA-N 0.000 description 4
- UCSXXFRXHGUXCQ-SRVKXCTJSA-N Cys-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CS)N UCSXXFRXHGUXCQ-SRVKXCTJSA-N 0.000 description 4
- JRZMCSIUYGSJKP-ZKWXMUAHSA-N Cys-Val-Asn Chemical compound SC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O JRZMCSIUYGSJKP-ZKWXMUAHSA-N 0.000 description 4
- 101710091045 Envelope protein Proteins 0.000 description 4
- LMPBBFWHCRURJD-LAEOZQHASA-N Gln-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N LMPBBFWHCRURJD-LAEOZQHASA-N 0.000 description 4
- ZDJZEGYVKANKED-NRPADANISA-N Gln-Cys-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O ZDJZEGYVKANKED-NRPADANISA-N 0.000 description 4
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 4
- XKBASPWPBXNVLQ-WDSKDSINSA-N Gln-Gly-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XKBASPWPBXNVLQ-WDSKDSINSA-N 0.000 description 4
- HPCOBEHVEHWREJ-DCAQKATOSA-N Gln-Lys-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HPCOBEHVEHWREJ-DCAQKATOSA-N 0.000 description 4
- MQJDLNRXBOELJW-KKUMJFAQSA-N Gln-Pro-Phe Chemical compound N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O MQJDLNRXBOELJW-KKUMJFAQSA-N 0.000 description 4
- KUBFPYIMAGXGBT-ACZMJKKPSA-N Gln-Ser-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KUBFPYIMAGXGBT-ACZMJKKPSA-N 0.000 description 4
- GHAXJVNBAKGWEJ-AVGNSLFASA-N Gln-Ser-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GHAXJVNBAKGWEJ-AVGNSLFASA-N 0.000 description 4
- NHMRJKKAVMENKJ-WDCWCFNPSA-N Gln-Thr-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NHMRJKKAVMENKJ-WDCWCFNPSA-N 0.000 description 4
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 4
- DIXKFOPPGWKZLY-CIUDSAMLSA-N Glu-Arg-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O DIXKFOPPGWKZLY-CIUDSAMLSA-N 0.000 description 4
- JPHYJQHPILOKHC-ACZMJKKPSA-N Glu-Asp-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O JPHYJQHPILOKHC-ACZMJKKPSA-N 0.000 description 4
- FKGNJUCQKXQNRA-NRPADANISA-N Glu-Cys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCC(O)=O FKGNJUCQKXQNRA-NRPADANISA-N 0.000 description 4
- HUFCEIHAFNVSNR-IHRRRGAJSA-N Glu-Gln-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUFCEIHAFNVSNR-IHRRRGAJSA-N 0.000 description 4
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 4
- ZWQVYZXPYSYPJD-RYUDHWBXSA-N Glu-Gly-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZWQVYZXPYSYPJD-RYUDHWBXSA-N 0.000 description 4
- SWRVAQHFBRZVNX-GUBZILKMSA-N Glu-Lys-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SWRVAQHFBRZVNX-GUBZILKMSA-N 0.000 description 4
- AAJHGGDRKHYSDH-GUBZILKMSA-N Glu-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O AAJHGGDRKHYSDH-GUBZILKMSA-N 0.000 description 4
- IDEODOAVGCMUQV-GUBZILKMSA-N Glu-Ser-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IDEODOAVGCMUQV-GUBZILKMSA-N 0.000 description 4
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 4
- QSTLUOIOYLYLLF-WDSKDSINSA-N Gly-Asp-Glu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QSTLUOIOYLYLLF-WDSKDSINSA-N 0.000 description 4
- NMROINAYXCACKF-WHFBIAKZSA-N Gly-Cys-Cys Chemical compound NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(O)=O NMROINAYXCACKF-WHFBIAKZSA-N 0.000 description 4
- NPSWCZIRBAYNSB-JHEQGTHGSA-N Gly-Gln-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPSWCZIRBAYNSB-JHEQGTHGSA-N 0.000 description 4
- CVFOYJJOZYYEPE-KBPBESRZSA-N Gly-Lys-Tyr Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CVFOYJJOZYYEPE-KBPBESRZSA-N 0.000 description 4
- MTBIKIMYHUWBRX-QWRGUYRKSA-N Gly-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN MTBIKIMYHUWBRX-QWRGUYRKSA-N 0.000 description 4
- GAAHQHNCMIAYEX-UWVGGRQHSA-N Gly-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN GAAHQHNCMIAYEX-UWVGGRQHSA-N 0.000 description 4
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 4
- RHRLHXQWHCNJKR-PMVVWTBXSA-N Gly-Thr-His Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 RHRLHXQWHCNJKR-PMVVWTBXSA-N 0.000 description 4
- SYOJVRNQCXYEOV-XVKPBYJWSA-N Gly-Val-Glu Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SYOJVRNQCXYEOV-XVKPBYJWSA-N 0.000 description 4
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 4
- BNMRSWQOHIQTFL-JSGCOSHPSA-N Gly-Val-Phe Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 BNMRSWQOHIQTFL-JSGCOSHPSA-N 0.000 description 4
- MJUUWJJEUOBDGW-IHRRRGAJSA-N His-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 MJUUWJJEUOBDGW-IHRRRGAJSA-N 0.000 description 4
- VSZALHITQINTGC-GHCJXIJMSA-N Ile-Ala-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VSZALHITQINTGC-GHCJXIJMSA-N 0.000 description 4
- QLRMMMQNCWBNPQ-QXEWZRGKSA-N Ile-Arg-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)O)N QLRMMMQNCWBNPQ-QXEWZRGKSA-N 0.000 description 4
- LOXMWQOKYBGCHF-JBDRJPRFSA-N Ile-Cys-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O LOXMWQOKYBGCHF-JBDRJPRFSA-N 0.000 description 4
- LLHYWBGDMBGNHA-VGDYDELISA-N Ile-Cys-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LLHYWBGDMBGNHA-VGDYDELISA-N 0.000 description 4
- AXNGDPAKKCEKGY-QPHKQPEJSA-N Ile-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N AXNGDPAKKCEKGY-QPHKQPEJSA-N 0.000 description 4
- CEPIAEUVRKGPGP-DSYPUSFNSA-N Ile-Lys-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 CEPIAEUVRKGPGP-DSYPUSFNSA-N 0.000 description 4
- CIJLNXXMDUOFPH-HJWJTTGWSA-N Ile-Pro-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 CIJLNXXMDUOFPH-HJWJTTGWSA-N 0.000 description 4
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 4
- RQJUKVXWAKJDBW-SVSWQMSJSA-N Ile-Ser-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N RQJUKVXWAKJDBW-SVSWQMSJSA-N 0.000 description 4
- YCKPUHHMCFSUMD-IUKAMOBKSA-N Ile-Thr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCKPUHHMCFSUMD-IUKAMOBKSA-N 0.000 description 4
- ANTFEOSJMAUGIB-KNZXXDILSA-N Ile-Thr-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N ANTFEOSJMAUGIB-KNZXXDILSA-N 0.000 description 4
- RTSQPLLOYSGMKM-DSYPUSFNSA-N Ile-Trp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(C)C)C(=O)O)N RTSQPLLOYSGMKM-DSYPUSFNSA-N 0.000 description 4
- 108060003951 Immunoglobulin Proteins 0.000 description 4
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 4
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 4
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 4
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 4
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 4
- GZAUZBUKDXYPEH-CIUDSAMLSA-N Leu-Cys-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)O)N GZAUZBUKDXYPEH-CIUDSAMLSA-N 0.000 description 4
- PBGDOSARRIJMEV-DLOVCJGASA-N Leu-His-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O PBGDOSARRIJMEV-DLOVCJGASA-N 0.000 description 4
- HMDDEJADNKQTBR-BZSNNMDCSA-N Leu-His-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O HMDDEJADNKQTBR-BZSNNMDCSA-N 0.000 description 4
- SGIIOQQGLUUMDQ-IHRRRGAJSA-N Leu-His-Val Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C(C)C)C(=O)O)N SGIIOQQGLUUMDQ-IHRRRGAJSA-N 0.000 description 4
- DBSLVQBXKVKDKJ-BJDJZHNGSA-N Leu-Ile-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O DBSLVQBXKVKDKJ-BJDJZHNGSA-N 0.000 description 4
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 4
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 4
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 4
- BIZNDKMFQHDOIE-KKUMJFAQSA-N Leu-Phe-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 BIZNDKMFQHDOIE-KKUMJFAQSA-N 0.000 description 4
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 4
- UCRJTSIIAYHOHE-ULQDDVLXSA-N Leu-Tyr-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UCRJTSIIAYHOHE-ULQDDVLXSA-N 0.000 description 4
- WUHBLPVELFTPQK-KKUMJFAQSA-N Leu-Tyr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O WUHBLPVELFTPQK-KKUMJFAQSA-N 0.000 description 4
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 4
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 4
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 4
- VHNOAIFVYUQOOY-XUXIUFHCSA-N Lys-Arg-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VHNOAIFVYUQOOY-XUXIUFHCSA-N 0.000 description 4
- WALVCOOOKULCQM-ULQDDVLXSA-N Lys-Arg-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WALVCOOOKULCQM-ULQDDVLXSA-N 0.000 description 4
- DZQYZKPINJLLEN-KKUMJFAQSA-N Lys-Cys-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCCN)N)O DZQYZKPINJLLEN-KKUMJFAQSA-N 0.000 description 4
- RZHLIPMZXOEJTL-AVGNSLFASA-N Lys-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N RZHLIPMZXOEJTL-AVGNSLFASA-N 0.000 description 4
- IRRZDAIFYHNIIN-JYJNAYRXSA-N Lys-Gln-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IRRZDAIFYHNIIN-JYJNAYRXSA-N 0.000 description 4
- NNKLKUUGESXCBS-KBPBESRZSA-N Lys-Gly-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NNKLKUUGESXCBS-KBPBESRZSA-N 0.000 description 4
- SLQJJFAVWSZLBL-BJDJZHNGSA-N Lys-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN SLQJJFAVWSZLBL-BJDJZHNGSA-N 0.000 description 4
- ATNKHRAIZCMCCN-BZSNNMDCSA-N Lys-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N ATNKHRAIZCMCCN-BZSNNMDCSA-N 0.000 description 4
- JYVCOTWSRGFABJ-DCAQKATOSA-N Lys-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCCN)N JYVCOTWSRGFABJ-DCAQKATOSA-N 0.000 description 4
- TWPCWKVOZDUYAA-KKUMJFAQSA-N Lys-Phe-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O TWPCWKVOZDUYAA-KKUMJFAQSA-N 0.000 description 4
- LNMKRJJLEFASGA-BZSNNMDCSA-N Lys-Phe-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LNMKRJJLEFASGA-BZSNNMDCSA-N 0.000 description 4
- YTJFXEDRUOQGSP-DCAQKATOSA-N Lys-Pro-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O YTJFXEDRUOQGSP-DCAQKATOSA-N 0.000 description 4
- RMOKGALPSPOYKE-KATARQTJSA-N Lys-Thr-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMOKGALPSPOYKE-KATARQTJSA-N 0.000 description 4
- FZUNSVYYPYJYAP-NAKRPEOUSA-N Met-Ile-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O FZUNSVYYPYJYAP-NAKRPEOUSA-N 0.000 description 4
- GWADARYJIJDYRC-XGEHTFHBSA-N Met-Thr-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GWADARYJIJDYRC-XGEHTFHBSA-N 0.000 description 4
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 4
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 4
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 4
- ALHULIGNEXGFRM-QWRGUYRKSA-N Phe-Cys-Gly Chemical compound OC(=O)CNC(=O)[C@H](CS)NC(=O)[C@@H](N)CC1=CC=CC=C1 ALHULIGNEXGFRM-QWRGUYRKSA-N 0.000 description 4
- IDUCUXTUHHIQIP-SOUVJXGZSA-N Phe-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O IDUCUXTUHHIQIP-SOUVJXGZSA-N 0.000 description 4
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 4
- OSBADCBXAMSPQD-YESZJQIVSA-N Phe-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N OSBADCBXAMSPQD-YESZJQIVSA-N 0.000 description 4
- BSKMOCNNLNDIMU-CDMKHQONSA-N Phe-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O BSKMOCNNLNDIMU-CDMKHQONSA-N 0.000 description 4
- FGWUALWGCZJQDJ-URLPEUOOSA-N Phe-Thr-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGWUALWGCZJQDJ-URLPEUOOSA-N 0.000 description 4
- YFXXRYFWJFQAFW-JHYOHUSXSA-N Phe-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O YFXXRYFWJFQAFW-JHYOHUSXSA-N 0.000 description 4
- AJLVKXCNXIJHDV-CIUDSAMLSA-N Pro-Ala-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O AJLVKXCNXIJHDV-CIUDSAMLSA-N 0.000 description 4
- IHCXPSYCHXFXKT-DCAQKATOSA-N Pro-Arg-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O IHCXPSYCHXFXKT-DCAQKATOSA-N 0.000 description 4
- ILMLVTGTUJPQFP-FXQIFTODSA-N Pro-Asp-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ILMLVTGTUJPQFP-FXQIFTODSA-N 0.000 description 4
- YFNOUBWUIIJQHF-LPEHRKFASA-N Pro-Asp-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O YFNOUBWUIIJQHF-LPEHRKFASA-N 0.000 description 4
- XUSDDSLCRPUKLP-QXEWZRGKSA-N Pro-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 XUSDDSLCRPUKLP-QXEWZRGKSA-N 0.000 description 4
- HQVPQXMCQKXARZ-FXQIFTODSA-N Pro-Cys-Ser Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O HQVPQXMCQKXARZ-FXQIFTODSA-N 0.000 description 4
- VWXGFAIZUQBBBG-UWVGGRQHSA-N Pro-His-Gly Chemical compound C([C@@H](C(=O)NCC(=O)[O-])NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 VWXGFAIZUQBBBG-UWVGGRQHSA-N 0.000 description 4
- XYHMFGGWNOFUOU-QXEWZRGKSA-N Pro-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 XYHMFGGWNOFUOU-QXEWZRGKSA-N 0.000 description 4
- CGSOWZUPLOKYOR-AVGNSLFASA-N Pro-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 CGSOWZUPLOKYOR-AVGNSLFASA-N 0.000 description 4
- SXJOPONICMGFCR-DCAQKATOSA-N Pro-Ser-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O SXJOPONICMGFCR-DCAQKATOSA-N 0.000 description 4
- DIDLUFMLRUJLFB-FKBYEOEOSA-N Pro-Trp-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CC4=CC=C(C=C4)O)C(=O)O DIDLUFMLRUJLFB-FKBYEOEOSA-N 0.000 description 4
- 101710188315 Protein X Proteins 0.000 description 4
- 241000831652 Salinivibrio sharmensis Species 0.000 description 4
- WTWGOQRNRFHFQD-JBDRJPRFSA-N Ser-Ala-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WTWGOQRNRFHFQD-JBDRJPRFSA-N 0.000 description 4
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 4
- BCKYYTVFBXHPOG-ACZMJKKPSA-N Ser-Asn-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N BCKYYTVFBXHPOG-ACZMJKKPSA-N 0.000 description 4
- FIDMVVBUOCMMJG-CIUDSAMLSA-N Ser-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO FIDMVVBUOCMMJG-CIUDSAMLSA-N 0.000 description 4
- SNNSYBWPPVAXQW-ZLUOBGJFSA-N Ser-Cys-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)O)N)O SNNSYBWPPVAXQW-ZLUOBGJFSA-N 0.000 description 4
- RNFKSBPHLTZHLU-WHFBIAKZSA-N Ser-Cys-Gly Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N)O RNFKSBPHLTZHLU-WHFBIAKZSA-N 0.000 description 4
- UFKPDBLKLOBMRH-XHNCKOQMSA-N Ser-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)C(=O)O UFKPDBLKLOBMRH-XHNCKOQMSA-N 0.000 description 4
- BPMRXBZYPGYPJN-WHFBIAKZSA-N Ser-Gly-Asn Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BPMRXBZYPGYPJN-WHFBIAKZSA-N 0.000 description 4
- DOSZISJPMCYEHT-NAKRPEOUSA-N Ser-Ile-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O DOSZISJPMCYEHT-NAKRPEOUSA-N 0.000 description 4
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 4
- SRKMDKACHDVPMD-SRVKXCTJSA-N Ser-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N SRKMDKACHDVPMD-SRVKXCTJSA-N 0.000 description 4
- XVWDJUROVRQKAE-KKUMJFAQSA-N Ser-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CC=CC=C1 XVWDJUROVRQKAE-KKUMJFAQSA-N 0.000 description 4
- RWDVVSKYZBNDCO-MELADBBJSA-N Ser-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CO)N)C(=O)O RWDVVSKYZBNDCO-MELADBBJSA-N 0.000 description 4
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 4
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 4
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 4
- ZSDXEKUKQAKZFE-XAVMHZPKSA-N Ser-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N)O ZSDXEKUKQAKZFE-XAVMHZPKSA-N 0.000 description 4
- ODRUTDLAONAVDV-IHRRRGAJSA-N Ser-Val-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ODRUTDLAONAVDV-IHRRRGAJSA-N 0.000 description 4
- 201000003176 Severe Acute Respiratory Syndrome Diseases 0.000 description 4
- BHEOSNUKNHRBNM-UHFFFAOYSA-N Tetramethylsqualene Natural products CC(=C)C(C)CCC(=C)C(C)CCC(C)=CCCC=C(C)CCC(C)C(=C)CCC(C)C(C)=C BHEOSNUKNHRBNM-UHFFFAOYSA-N 0.000 description 4
- UTSWGQNAQRIHAI-UNQGMJICSA-N Thr-Arg-Phe Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 UTSWGQNAQRIHAI-UNQGMJICSA-N 0.000 description 4
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 4
- PQLXHSACXPGWPD-GSSVUCPTSA-N Thr-Asn-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PQLXHSACXPGWPD-GSSVUCPTSA-N 0.000 description 4
- PZVGOVRNGKEFCB-KKHAAJSZSA-N Thr-Asn-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N)O PZVGOVRNGKEFCB-KKHAAJSZSA-N 0.000 description 4
- LMMDEZPNUTZJAY-GCJQMDKQSA-N Thr-Asp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O LMMDEZPNUTZJAY-GCJQMDKQSA-N 0.000 description 4
- MFEBUIFJVPNZLO-OLHMAJIHSA-N Thr-Asp-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O MFEBUIFJVPNZLO-OLHMAJIHSA-N 0.000 description 4
- QILPDQCTQZDHFM-HJGDQZAQSA-N Thr-Gln-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QILPDQCTQZDHFM-HJGDQZAQSA-N 0.000 description 4
- ZQUKYJOKQBRBCS-GLLZPBPUSA-N Thr-Gln-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O ZQUKYJOKQBRBCS-GLLZPBPUSA-N 0.000 description 4
- VUVCRYXYUUPGSB-GLLZPBPUSA-N Thr-Gln-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O VUVCRYXYUUPGSB-GLLZPBPUSA-N 0.000 description 4
- RKDFEMGVMMYYNG-WDCWCFNPSA-N Thr-Gln-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O RKDFEMGVMMYYNG-WDCWCFNPSA-N 0.000 description 4
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 4
- LCCSEJSPBWKBNT-OSUNSFLBSA-N Thr-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N LCCSEJSPBWKBNT-OSUNSFLBSA-N 0.000 description 4
- KZSYAEWQMJEGRZ-RHYQMDGZSA-N Thr-Leu-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O KZSYAEWQMJEGRZ-RHYQMDGZSA-N 0.000 description 4
- SPVHQURZJCUDQC-VOAKCMCISA-N Thr-Lys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O SPVHQURZJCUDQC-VOAKCMCISA-N 0.000 description 4
- BIBYEFRASCNLAA-CDMKHQONSA-N Thr-Phe-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 BIBYEFRASCNLAA-CDMKHQONSA-N 0.000 description 4
- NWECYMJLJGCBOD-UNQGMJICSA-N Thr-Phe-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O NWECYMJLJGCBOD-UNQGMJICSA-N 0.000 description 4
- MXDOAJQRJBMGMO-FJXKBIBVSA-N Thr-Pro-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O MXDOAJQRJBMGMO-FJXKBIBVSA-N 0.000 description 4
- BPGDJSUFQKWUBK-KJEVXHAQSA-N Thr-Val-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BPGDJSUFQKWUBK-KJEVXHAQSA-N 0.000 description 4
- IBBBOLAPFHRDHW-BPUTZDHNSA-N Trp-Asn-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N IBBBOLAPFHRDHW-BPUTZDHNSA-N 0.000 description 4
- UKINEYBQXPMOJO-UBHSHLNASA-N Trp-Asn-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N UKINEYBQXPMOJO-UBHSHLNASA-N 0.000 description 4
- UQHPXCFAHVTWFU-BVSLBCMMSA-N Trp-Phe-Val Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O UQHPXCFAHVTWFU-BVSLBCMMSA-N 0.000 description 4
- SCCKSNREWHMKOJ-SRVKXCTJSA-N Tyr-Asn-Ser Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O SCCKSNREWHMKOJ-SRVKXCTJSA-N 0.000 description 4
- NRFTYDWKWGJLAR-MELADBBJSA-N Tyr-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O NRFTYDWKWGJLAR-MELADBBJSA-N 0.000 description 4
- MPKPIWFFDWVJGC-IRIUXVKKSA-N Tyr-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O MPKPIWFFDWVJGC-IRIUXVKKSA-N 0.000 description 4
- WURLIFOWSMBUAR-SLFFLAALSA-N Tyr-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O WURLIFOWSMBUAR-SLFFLAALSA-N 0.000 description 4
- TYFLVOUZHQUBGM-IHRRRGAJSA-N Tyr-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TYFLVOUZHQUBGM-IHRRRGAJSA-N 0.000 description 4
- NWEGIYMHTZXVBP-JSGCOSHPSA-N Tyr-Val-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O NWEGIYMHTZXVBP-JSGCOSHPSA-N 0.000 description 4
- FZSPNKUFROZBSG-ZKWXMUAHSA-N Val-Ala-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O FZSPNKUFROZBSG-ZKWXMUAHSA-N 0.000 description 4
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 4
- LIQJSDDOULTANC-QSFUFRPTSA-N Val-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N LIQJSDDOULTANC-QSFUFRPTSA-N 0.000 description 4
- VLDMQVZZWDOKQF-AUTRQRHGSA-N Val-Glu-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VLDMQVZZWDOKQF-AUTRQRHGSA-N 0.000 description 4
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 4
- CPGJELLYDQEDRK-NAKRPEOUSA-N Val-Ile-Ala Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C)C(O)=O CPGJELLYDQEDRK-NAKRPEOUSA-N 0.000 description 4
- KDKLLPMFFGYQJD-CYDGBPFRSA-N Val-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N KDKLLPMFFGYQJD-CYDGBPFRSA-N 0.000 description 4
- UKEVLVBHRKWECS-LSJOCFKGSA-N Val-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](C(C)C)N UKEVLVBHRKWECS-LSJOCFKGSA-N 0.000 description 4
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 4
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 4
- MJFSRZZJQWZHFQ-SRVKXCTJSA-N Val-Met-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)O)N MJFSRZZJQWZHFQ-SRVKXCTJSA-N 0.000 description 4
- LJSZPMSUYKKKCP-UBHSHLNASA-N Val-Phe-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 LJSZPMSUYKKKCP-UBHSHLNASA-N 0.000 description 4
- QSPOLEBZTMESFY-SRVKXCTJSA-N Val-Pro-Val Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O QSPOLEBZTMESFY-SRVKXCTJSA-N 0.000 description 4
- KSFXWENSJABBFI-ZKWXMUAHSA-N Val-Ser-Asn Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KSFXWENSJABBFI-ZKWXMUAHSA-N 0.000 description 4
- GBIUHAYJGWVNLN-AEJSXWLSSA-N Val-Ser-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N GBIUHAYJGWVNLN-AEJSXWLSSA-N 0.000 description 4
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 4
- XNLUVJPMPAZHCY-JYJNAYRXSA-N Val-Val-Phe Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 XNLUVJPMPAZHCY-JYJNAYRXSA-N 0.000 description 4
- 238000007792 addition Methods 0.000 description 4
- 108010077245 asparaginyl-proline Proteins 0.000 description 4
- 108010093581 aspartyl-proline Proteins 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- PMMYEEVYMWASQN-UHFFFAOYSA-N dl-hydroxyproline Natural products OC1C[NH2+]C(C([O-])=O)C1 PMMYEEVYMWASQN-UHFFFAOYSA-N 0.000 description 4
- PRAKJMSDJKAYCZ-UHFFFAOYSA-N dodecahydrosqualene Natural products CC(C)CCCC(C)CCCC(C)CCCCC(C)CCCC(C)CCCC(C)C PRAKJMSDJKAYCZ-UHFFFAOYSA-N 0.000 description 4
- 230000001747 exhibiting effect Effects 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 108010078144 glutaminyl-glycine Proteins 0.000 description 4
- 108010015792 glycyllysine Proteins 0.000 description 4
- 108010084389 glycyltryptophan Proteins 0.000 description 4
- 102000018358 immunoglobulin Human genes 0.000 description 4
- 230000001976 improved effect Effects 0.000 description 4
- 238000000338 in vitro Methods 0.000 description 4
- 230000001939 inductive effect Effects 0.000 description 4
- 230000005764 inhibitory process Effects 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 108010034529 leucyl-lysine Proteins 0.000 description 4
- 150000002632 lipids Chemical class 0.000 description 4
- 239000002773 nucleotide Substances 0.000 description 4
- 125000003729 nucleotide group Chemical group 0.000 description 4
- 239000008194 pharmaceutical composition Substances 0.000 description 4
- 108010089198 phenylalanyl-prolyl-arginine Proteins 0.000 description 4
- 108010024607 phenylalanylalanine Proteins 0.000 description 4
- 108010018625 phenylalanylarginine Proteins 0.000 description 4
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 108010031719 prolyl-serine Proteins 0.000 description 4
- 108010079317 prolyl-tyrosine Proteins 0.000 description 4
- 229930182490 saponin Natural products 0.000 description 4
- 235000017709 saponins Nutrition 0.000 description 4
- 150000007949 saponins Chemical class 0.000 description 4
- FSYKKLYZXJSNPZ-UHFFFAOYSA-N sarcosine Chemical compound C[NH2+]CC([O-])=O FSYKKLYZXJSNPZ-UHFFFAOYSA-N 0.000 description 4
- 238000002741 site-directed mutagenesis Methods 0.000 description 4
- 229940031439 squalene Drugs 0.000 description 4
- TUHBEKDERLKLEC-UHFFFAOYSA-N squalene Natural products CC(=CCCC(=CCCC(=CCCC=C(/C)CCC=C(/C)CC=C(C)C)C)C)C TUHBEKDERLKLEC-UHFFFAOYSA-N 0.000 description 4
- 230000004083 survival effect Effects 0.000 description 4
- 108010078580 tyrosylleucine Proteins 0.000 description 4
- 239000004474 valine Substances 0.000 description 4
- NFGXHKASABOEEW-UHFFFAOYSA-N 1-methylethyl 11-methoxy-3,7,11-trimethyl-2,4-dodecadienoate Chemical compound COC(C)(C)CCCC(C)CC=CC(C)=CC(=O)OC(C)C NFGXHKASABOEEW-UHFFFAOYSA-N 0.000 description 3
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 3
- ZDYNWWQXFRUOEO-XDTLVQLUSA-N Ala-Gln-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZDYNWWQXFRUOEO-XDTLVQLUSA-N 0.000 description 3
- LJFNNUBZSZCZFN-WHFBIAKZSA-N Ala-Gly-Cys Chemical compound N[C@@H](C)C(=O)NCC(=O)N[C@@H](CS)C(=O)O LJFNNUBZSZCZFN-WHFBIAKZSA-N 0.000 description 3
- VNYMOTCMNHJGTG-JBDRJPRFSA-N Ala-Ile-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O VNYMOTCMNHJGTG-JBDRJPRFSA-N 0.000 description 3
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 3
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 3
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 3
- JPOQZCHGOTWRTM-FQPOAREZSA-N Ala-Tyr-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPOQZCHGOTWRTM-FQPOAREZSA-N 0.000 description 3
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 3
- MFAMTAVAFBPXDC-LPEHRKFASA-N Arg-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O MFAMTAVAFBPXDC-LPEHRKFASA-N 0.000 description 3
- IYMAXBFPHPZYIK-BQBZGAKWSA-N Arg-Gly-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IYMAXBFPHPZYIK-BQBZGAKWSA-N 0.000 description 3
- GMFAGHNRXPSSJS-SRVKXCTJSA-N Arg-Leu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GMFAGHNRXPSSJS-SRVKXCTJSA-N 0.000 description 3
- QTAIIXQCOPUNBQ-QXEWZRGKSA-N Arg-Val-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QTAIIXQCOPUNBQ-QXEWZRGKSA-N 0.000 description 3
- 239000004475 Arginine Substances 0.000 description 3
- XSGBIBGAMKTHMY-WHFBIAKZSA-N Asn-Asp-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O XSGBIBGAMKTHMY-WHFBIAKZSA-N 0.000 description 3
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 3
- RVHGJNGNKGDCPX-KKUMJFAQSA-N Asn-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N RVHGJNGNKGDCPX-KKUMJFAQSA-N 0.000 description 3
- YXVAESUIQFDBHN-SRVKXCTJSA-N Asn-Phe-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O YXVAESUIQFDBHN-SRVKXCTJSA-N 0.000 description 3
- HPNDKUOLNRVRAY-BIIVOSGPSA-N Asn-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N)C(=O)O HPNDKUOLNRVRAY-BIIVOSGPSA-N 0.000 description 3
- RTFXPCYMDYBZNQ-SRVKXCTJSA-N Asn-Tyr-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O RTFXPCYMDYBZNQ-SRVKXCTJSA-N 0.000 description 3
- KBQOUDLMWYWXNP-YDHLFZDLSA-N Asn-Val-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)N)N KBQOUDLMWYWXNP-YDHLFZDLSA-N 0.000 description 3
- RGKKALNPOYURGE-ZKWXMUAHSA-N Asp-Ala-Val Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O RGKKALNPOYURGE-ZKWXMUAHSA-N 0.000 description 3
- FTNVLGCFIJEMQT-CIUDSAMLSA-N Asp-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N FTNVLGCFIJEMQT-CIUDSAMLSA-N 0.000 description 3
- HOBNTSHITVVNBN-ZPFDUUQYSA-N Asp-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N HOBNTSHITVVNBN-ZPFDUUQYSA-N 0.000 description 3
- SPKCGKRUYKMDHP-GUDRVLHUSA-N Asp-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N SPKCGKRUYKMDHP-GUDRVLHUSA-N 0.000 description 3
- SPWXXPFDTMYTRI-IUKAMOBKSA-N Asp-Ile-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SPWXXPFDTMYTRI-IUKAMOBKSA-N 0.000 description 3
- XLILXFRAKOYEJX-GUBZILKMSA-N Asp-Leu-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLILXFRAKOYEJX-GUBZILKMSA-N 0.000 description 3
- RQHLMGCXCZUOGT-ZPFDUUQYSA-N Asp-Leu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RQHLMGCXCZUOGT-ZPFDUUQYSA-N 0.000 description 3
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 3
- USNJAPJZSGTTPX-XVSYOHENSA-N Asp-Phe-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O USNJAPJZSGTTPX-XVSYOHENSA-N 0.000 description 3
- YFGUZQQCSDZRBN-DCAQKATOSA-N Asp-Pro-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O YFGUZQQCSDZRBN-DCAQKATOSA-N 0.000 description 3
- XUVTWGPERWIERB-IHRRRGAJSA-N Asp-Pro-Phe Chemical compound N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O XUVTWGPERWIERB-IHRRRGAJSA-N 0.000 description 3
- ZQFRDAZBTSFGGW-SRVKXCTJSA-N Asp-Ser-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZQFRDAZBTSFGGW-SRVKXCTJSA-N 0.000 description 3
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 3
- 241000282472 Canis lupus familiaris Species 0.000 description 3
- 102100035360 Cerebellar degeneration-related antigen 1 Human genes 0.000 description 3
- 208000001528 Coronaviridae Infections Diseases 0.000 description 3
- XMTDCXXLDZKAGI-ACZMJKKPSA-N Cys-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CS)N XMTDCXXLDZKAGI-ACZMJKKPSA-N 0.000 description 3
- OIMUAKUQOUEPCZ-WHFBIAKZSA-N Cys-Asn-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIMUAKUQOUEPCZ-WHFBIAKZSA-N 0.000 description 3
- KOHBWQDSVCARMI-BWBBJGPYSA-N Cys-Cys-Thr Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KOHBWQDSVCARMI-BWBBJGPYSA-N 0.000 description 3
- SKSJPIBFNFPTJB-NKWVEPMBSA-N Cys-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CS)N)C(=O)O SKSJPIBFNFPTJB-NKWVEPMBSA-N 0.000 description 3
- VPQZSNQICFCCSO-BJDJZHNGSA-N Cys-Leu-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VPQZSNQICFCCSO-BJDJZHNGSA-N 0.000 description 3
- KVCJEMHFLGVINV-ZLUOBGJFSA-N Cys-Ser-Asn Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KVCJEMHFLGVINV-ZLUOBGJFSA-N 0.000 description 3
- FCXJJTRGVAZDER-FXQIFTODSA-N Cys-Val-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O FCXJJTRGVAZDER-FXQIFTODSA-N 0.000 description 3
- NGOIQDYZMIKCOK-NAKRPEOUSA-N Cys-Val-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NGOIQDYZMIKCOK-NAKRPEOUSA-N 0.000 description 3
- 102000053602 DNA Human genes 0.000 description 3
- 229940021995 DNA vaccine Drugs 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- 241000282326 Felis catus Species 0.000 description 3
- WLODHVXYKYHLJD-ACZMJKKPSA-N Gln-Asp-Ser Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N WLODHVXYKYHLJD-ACZMJKKPSA-N 0.000 description 3
- IXFVOPOHSRKJNG-LAEOZQHASA-N Gln-Asp-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IXFVOPOHSRKJNG-LAEOZQHASA-N 0.000 description 3
- VGTDBGYFVWOQTI-RYUDHWBXSA-N Gln-Gly-Phe Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VGTDBGYFVWOQTI-RYUDHWBXSA-N 0.000 description 3
- HDUDGCZEOZEFOA-KBIXCLLPSA-N Gln-Ile-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HDUDGCZEOZEFOA-KBIXCLLPSA-N 0.000 description 3
- JKGHMESJHRTHIC-SIUGBPQLSA-N Gln-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JKGHMESJHRTHIC-SIUGBPQLSA-N 0.000 description 3
- VZRAXPGTUNDIDK-GUBZILKMSA-N Gln-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N VZRAXPGTUNDIDK-GUBZILKMSA-N 0.000 description 3
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 3
- MLSKFHLRFVGNLL-WDCWCFNPSA-N Gln-Leu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MLSKFHLRFVGNLL-WDCWCFNPSA-N 0.000 description 3
- DCWNCMRZIZSZBL-KKUMJFAQSA-N Gln-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)N)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O DCWNCMRZIZSZBL-KKUMJFAQSA-N 0.000 description 3
- DYVMTEWCGAVKSE-HJGDQZAQSA-N Gln-Thr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O DYVMTEWCGAVKSE-HJGDQZAQSA-N 0.000 description 3
- ININBLZFFVOQIO-JHEQGTHGSA-N Gln-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O ININBLZFFVOQIO-JHEQGTHGSA-N 0.000 description 3
- ARYKRXHBIPLULY-XKBZYTNZSA-N Gln-Thr-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ARYKRXHBIPLULY-XKBZYTNZSA-N 0.000 description 3
- SGVGIVDZLSHSEN-RYUDHWBXSA-N Gln-Tyr-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O SGVGIVDZLSHSEN-RYUDHWBXSA-N 0.000 description 3
- MKRDNSWGJWTBKZ-GVXVVHGQSA-N Gln-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MKRDNSWGJWTBKZ-GVXVVHGQSA-N 0.000 description 3
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 3
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 3
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 3
- LKOAAMXDJGEYMS-ZPFDUUQYSA-N Glu-Met-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LKOAAMXDJGEYMS-ZPFDUUQYSA-N 0.000 description 3
- ALMBZBOCGSVSAI-ACZMJKKPSA-N Glu-Ser-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ALMBZBOCGSVSAI-ACZMJKKPSA-N 0.000 description 3
- GMVCSRBOSIUTFC-FXQIFTODSA-N Glu-Ser-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMVCSRBOSIUTFC-FXQIFTODSA-N 0.000 description 3
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 3
- HHSKZJZWQFPSKN-AVGNSLFASA-N Glu-Tyr-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O HHSKZJZWQFPSKN-AVGNSLFASA-N 0.000 description 3
- HBMRTXJZQDVRFT-DZKIICNBSA-N Glu-Tyr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O HBMRTXJZQDVRFT-DZKIICNBSA-N 0.000 description 3
- YQPFCZVKMUVZIN-AUTRQRHGSA-N Glu-Val-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQPFCZVKMUVZIN-AUTRQRHGSA-N 0.000 description 3
- DJTXYXZNNDDEOU-WHFBIAKZSA-N Gly-Asn-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN)C(=O)N DJTXYXZNNDDEOU-WHFBIAKZSA-N 0.000 description 3
- XBWMTPAIUQIWKA-BYULHYEWSA-N Gly-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN XBWMTPAIUQIWKA-BYULHYEWSA-N 0.000 description 3
- KMSGYZQRXPUKGI-BYPYZUCNSA-N Gly-Gly-Asn Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(N)=O KMSGYZQRXPUKGI-BYPYZUCNSA-N 0.000 description 3
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 3
- LUJVWKKYHSLULQ-ZKWXMUAHSA-N Gly-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN LUJVWKKYHSLULQ-ZKWXMUAHSA-N 0.000 description 3
- XVYKMNXXJXQKME-XEGUGMAKSA-N Gly-Ile-Tyr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XVYKMNXXJXQKME-XEGUGMAKSA-N 0.000 description 3
- YYXJFBMCOUSYSF-RYUDHWBXSA-N Gly-Phe-Gln Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYXJFBMCOUSYSF-RYUDHWBXSA-N 0.000 description 3
- QSQXZZCGPXQBPP-BQBZGAKWSA-N Gly-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)CN)C(=O)N[C@@H](CS)C(=O)O QSQXZZCGPXQBPP-BQBZGAKWSA-N 0.000 description 3
- FKESCSGWBPUTPN-FOHZUACHSA-N Gly-Thr-Asn Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O FKESCSGWBPUTPN-FOHZUACHSA-N 0.000 description 3
- WTUSRDZLLWGYAT-KCTSRDHCSA-N Gly-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)CN WTUSRDZLLWGYAT-KCTSRDHCSA-N 0.000 description 3
- GWNIGUKSRJBIHX-STQMWFEESA-N Gly-Tyr-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)CN)O GWNIGUKSRJBIHX-STQMWFEESA-N 0.000 description 3
- OCRQUYDOYKCOQG-IRXDYDNUSA-N Gly-Tyr-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 OCRQUYDOYKCOQG-IRXDYDNUSA-N 0.000 description 3
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- KZTLOHBDLMIFSH-XVYDVKMFSA-N His-Ala-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O KZTLOHBDLMIFSH-XVYDVKMFSA-N 0.000 description 3
- HTZKFIYQMHJWSQ-INTQDDNPSA-N His-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N HTZKFIYQMHJWSQ-INTQDDNPSA-N 0.000 description 3
- 101000690301 Homo sapiens Aldo-keto reductase family 1 member C4 Proteins 0.000 description 3
- 101001116548 Homo sapiens Protein CBFA2T1 Proteins 0.000 description 3
- PMMYEEVYMWASQN-DMTCNVIQSA-N Hydroxyproline Chemical compound O[C@H]1CN[C@H](C(O)=O)C1 PMMYEEVYMWASQN-DMTCNVIQSA-N 0.000 description 3
- GECLQMBTZCPAFY-PEFMBERDSA-N Ile-Gln-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GECLQMBTZCPAFY-PEFMBERDSA-N 0.000 description 3
- NZOCIWKZUVUNDW-ZKWXMUAHSA-N Ile-Gly-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O NZOCIWKZUVUNDW-ZKWXMUAHSA-N 0.000 description 3
- PDTMWFVVNZYWTR-NHCYSSNCSA-N Ile-Gly-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O PDTMWFVVNZYWTR-NHCYSSNCSA-N 0.000 description 3
- WIZPFZKOFZXDQG-HTFCKZLJSA-N Ile-Ile-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O WIZPFZKOFZXDQG-HTFCKZLJSA-N 0.000 description 3
- DMSVBUWGDLYNLC-IAVJCBSLSA-N Ile-Ile-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DMSVBUWGDLYNLC-IAVJCBSLSA-N 0.000 description 3
- PMMMQRVUMVURGJ-XUXIUFHCSA-N Ile-Leu-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O PMMMQRVUMVURGJ-XUXIUFHCSA-N 0.000 description 3
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 3
- RMNMUUCYTMLWNA-ZPFDUUQYSA-N Ile-Lys-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RMNMUUCYTMLWNA-ZPFDUUQYSA-N 0.000 description 3
- YBKKLDBBPFIXBQ-MBLNEYKQSA-N Ile-Thr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)O)N YBKKLDBBPFIXBQ-MBLNEYKQSA-N 0.000 description 3
- ZUWSVOYKBCHLRR-MGHWNKPDSA-N Ile-Tyr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZUWSVOYKBCHLRR-MGHWNKPDSA-N 0.000 description 3
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 3
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 3
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 3
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 3
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 3
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 3
- KUEVMUXNILMJTK-JYJNAYRXSA-N Leu-Gln-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KUEVMUXNILMJTK-JYJNAYRXSA-N 0.000 description 3
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 3
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 3
- QLDHBYRUNQZIJQ-DKIMLUQUSA-N Leu-Ile-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QLDHBYRUNQZIJQ-DKIMLUQUSA-N 0.000 description 3
- OMHLATXVNQSALM-FQUUOJAGSA-N Leu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(C)C)N OMHLATXVNQSALM-FQUUOJAGSA-N 0.000 description 3
- PDQDCFBVYXEFSD-SRVKXCTJSA-N Leu-Leu-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PDQDCFBVYXEFSD-SRVKXCTJSA-N 0.000 description 3
- IFMPDNRWZZEZSL-SRVKXCTJSA-N Leu-Leu-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(O)=O IFMPDNRWZZEZSL-SRVKXCTJSA-N 0.000 description 3
- SYRTUBLKWNDSDK-DKIMLUQUSA-N Leu-Phe-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYRTUBLKWNDSDK-DKIMLUQUSA-N 0.000 description 3
- JDBQSGMJBMPNFT-AVGNSLFASA-N Leu-Pro-Val Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JDBQSGMJBMPNFT-AVGNSLFASA-N 0.000 description 3
- IWMJFLJQHIDZQW-KKUMJFAQSA-N Leu-Ser-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IWMJFLJQHIDZQW-KKUMJFAQSA-N 0.000 description 3
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 3
- ICYRCNICGBJLGM-HJGDQZAQSA-N Leu-Thr-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 3
- ZQCVMVCVPFYXHZ-SRVKXCTJSA-N Lys-Asn-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN ZQCVMVCVPFYXHZ-SRVKXCTJSA-N 0.000 description 3
- QUCDKEKDPYISNX-HJGDQZAQSA-N Lys-Asn-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QUCDKEKDPYISNX-HJGDQZAQSA-N 0.000 description 3
- QIJVAFLRMVBHMU-KKUMJFAQSA-N Lys-Asp-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QIJVAFLRMVBHMU-KKUMJFAQSA-N 0.000 description 3
- XREQQOATSMMAJP-MGHWNKPDSA-N Lys-Ile-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XREQQOATSMMAJP-MGHWNKPDSA-N 0.000 description 3
- ODTZHNZPINULEU-KKUMJFAQSA-N Lys-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N ODTZHNZPINULEU-KKUMJFAQSA-N 0.000 description 3
- LECIJRIRMVOFMH-ULQDDVLXSA-N Lys-Pro-Phe Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 LECIJRIRMVOFMH-ULQDDVLXSA-N 0.000 description 3
- MIFFFXHMAHFACR-KATARQTJSA-N Lys-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN MIFFFXHMAHFACR-KATARQTJSA-N 0.000 description 3
- ZVXSESPJMKNIQA-YXMSTPNBSA-N Lys-Thr-Pro-Pro Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 ZVXSESPJMKNIQA-YXMSTPNBSA-N 0.000 description 3
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 3
- 108010052285 Membrane Proteins Proteins 0.000 description 3
- BVXXDMUMHMXFER-BPNCWPANSA-N Met-Ala-Tyr Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BVXXDMUMHMXFER-BPNCWPANSA-N 0.000 description 3
- AWGBEIYZPAXXSX-RWMBFGLXSA-N Met-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N AWGBEIYZPAXXSX-RWMBFGLXSA-N 0.000 description 3
- HLZORBMOISUNIV-DCAQKATOSA-N Met-Ser-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C HLZORBMOISUNIV-DCAQKATOSA-N 0.000 description 3
- 241001529936 Murinae Species 0.000 description 3
- 101100068676 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) gln-1 gene Proteins 0.000 description 3
- 241000283973 Oryctolagus cuniculus Species 0.000 description 3
- MUBZPKHOEPUJKR-UHFFFAOYSA-N Oxalic acid Chemical compound OC(=O)C(O)=O MUBZPKHOEPUJKR-UHFFFAOYSA-N 0.000 description 3
- UHRNIXJAGGLKHP-DLOVCJGASA-N Phe-Ala-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O UHRNIXJAGGLKHP-DLOVCJGASA-N 0.000 description 3
- KAHUBGWSIQNZQQ-KKUMJFAQSA-N Phe-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KAHUBGWSIQNZQQ-KKUMJFAQSA-N 0.000 description 3
- OMHMIXFFRPMYHB-SRVKXCTJSA-N Phe-Cys-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OMHMIXFFRPMYHB-SRVKXCTJSA-N 0.000 description 3
- PSBJZLMFFTULDX-IXOXFDKPSA-N Phe-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CC=CC=C1)N)O PSBJZLMFFTULDX-IXOXFDKPSA-N 0.000 description 3
- NKLDZIPTGKBDBB-HTUGSXCWSA-N Phe-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N)O NKLDZIPTGKBDBB-HTUGSXCWSA-N 0.000 description 3
- HOYQLNNGMHXZDW-KKUMJFAQSA-N Phe-Glu-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HOYQLNNGMHXZDW-KKUMJFAQSA-N 0.000 description 3
- QPVFUAUFEBPIPT-CDMKHQONSA-N Phe-Gly-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O QPVFUAUFEBPIPT-CDMKHQONSA-N 0.000 description 3
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 3
- WEMYTDDMDBLPMI-DKIMLUQUSA-N Phe-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N WEMYTDDMDBLPMI-DKIMLUQUSA-N 0.000 description 3
- CJAHQEZWDZNSJO-KKUMJFAQSA-N Phe-Lys-Cys Chemical compound NCCCC[C@@H](C(=O)N[C@@H](CS)C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CJAHQEZWDZNSJO-KKUMJFAQSA-N 0.000 description 3
- GPLWGAYGROGDEN-BZSNNMDCSA-N Phe-Phe-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O GPLWGAYGROGDEN-BZSNNMDCSA-N 0.000 description 3
- RVEVENLSADZUMS-IHRRRGAJSA-N Phe-Pro-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O RVEVENLSADZUMS-IHRRRGAJSA-N 0.000 description 3
- IAOZOFPONWDXNT-IXOXFDKPSA-N Phe-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IAOZOFPONWDXNT-IXOXFDKPSA-N 0.000 description 3
- BQMFWUKNOCJDNV-HJWJTTGWSA-N Phe-Val-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BQMFWUKNOCJDNV-HJWJTTGWSA-N 0.000 description 3
- 206010035664 Pneumonia Diseases 0.000 description 3
- KWYUFKZDYYNOTN-UHFFFAOYSA-M Potassium hydroxide Chemical compound [OH-].[K+] KWYUFKZDYYNOTN-UHFFFAOYSA-M 0.000 description 3
- HFZNNDWPHBRNPV-KZVJFYERSA-N Pro-Ala-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HFZNNDWPHBRNPV-KZVJFYERSA-N 0.000 description 3
- LCRSGSIRKLXZMZ-BPNCWPANSA-N Pro-Ala-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LCRSGSIRKLXZMZ-BPNCWPANSA-N 0.000 description 3
- XKHCJJPNXFBADI-DCAQKATOSA-N Pro-Asp-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O XKHCJJPNXFBADI-DCAQKATOSA-N 0.000 description 3
- JMVQDLDPDBXAAX-YUMQZZPRSA-N Pro-Gly-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 JMVQDLDPDBXAAX-YUMQZZPRSA-N 0.000 description 3
- FKVNLUZHSFCNGY-RVMXOQNASA-N Pro-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 FKVNLUZHSFCNGY-RVMXOQNASA-N 0.000 description 3
- XYSXOCIWCPFOCG-IHRRRGAJSA-N Pro-Leu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XYSXOCIWCPFOCG-IHRRRGAJSA-N 0.000 description 3
- SUENWIFTSTWUKD-AVGNSLFASA-N Pro-Leu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SUENWIFTSTWUKD-AVGNSLFASA-N 0.000 description 3
- KDBHVPXBQADZKY-GUBZILKMSA-N Pro-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KDBHVPXBQADZKY-GUBZILKMSA-N 0.000 description 3
- DWPXHLIBFQLKLK-CYDGBPFRSA-N Pro-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 DWPXHLIBFQLKLK-CYDGBPFRSA-N 0.000 description 3
- CZCCVJUUWBMISW-FXQIFTODSA-N Pro-Ser-Cys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O CZCCVJUUWBMISW-FXQIFTODSA-N 0.000 description 3
- IURWWZYKYPEANQ-HJGDQZAQSA-N Pro-Thr-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O IURWWZYKYPEANQ-HJGDQZAQSA-N 0.000 description 3
- AJJDPGVVNPUZCR-RHYQMDGZSA-N Pro-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1)O AJJDPGVVNPUZCR-RHYQMDGZSA-N 0.000 description 3
- CNUIHOAISPKQPY-HSHDSVGOSA-N Pro-Thr-Trp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O CNUIHOAISPKQPY-HSHDSVGOSA-N 0.000 description 3
- ZYJMLBCDFPIGNL-JYJNAYRXSA-N Pro-Tyr-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@H](Cc1ccc(O)cc1)NC(=O)[C@@H]1CCCN1)C(O)=O ZYJMLBCDFPIGNL-JYJNAYRXSA-N 0.000 description 3
- FIODMZKLZFLYQP-GUBZILKMSA-N Pro-Val-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FIODMZKLZFLYQP-GUBZILKMSA-N 0.000 description 3
- 241000700159 Rattus Species 0.000 description 3
- BRKHVZNDAOMAHX-BIIVOSGPSA-N Ser-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N BRKHVZNDAOMAHX-BIIVOSGPSA-N 0.000 description 3
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 3
- NRCJWSGXMAPYQX-LPEHRKFASA-N Ser-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CO)N)C(=O)O NRCJWSGXMAPYQX-LPEHRKFASA-N 0.000 description 3
- WXWDPFVKQRVJBJ-CIUDSAMLSA-N Ser-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N WXWDPFVKQRVJBJ-CIUDSAMLSA-N 0.000 description 3
- KAAPNMOKUUPKOE-SRVKXCTJSA-N Ser-Asn-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KAAPNMOKUUPKOE-SRVKXCTJSA-N 0.000 description 3
- TYYBJUYSTWJHGO-ZKWXMUAHSA-N Ser-Asn-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TYYBJUYSTWJHGO-ZKWXMUAHSA-N 0.000 description 3
- FMDHKPRACUXATF-ACZMJKKPSA-N Ser-Gln-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O FMDHKPRACUXATF-ACZMJKKPSA-N 0.000 description 3
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 3
- GJFYFGOEWLDQGW-GUBZILKMSA-N Ser-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GJFYFGOEWLDQGW-GUBZILKMSA-N 0.000 description 3
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 3
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 3
- RXSWQCATLWVDLI-XGEHTFHBSA-N Ser-Met-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RXSWQCATLWVDLI-XGEHTFHBSA-N 0.000 description 3
- FBLNYDYPCLFTSP-IXOXFDKPSA-N Ser-Phe-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FBLNYDYPCLFTSP-IXOXFDKPSA-N 0.000 description 3
- DKGRNFUXVTYRAS-UBHSHLNASA-N Ser-Ser-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O DKGRNFUXVTYRAS-UBHSHLNASA-N 0.000 description 3
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 3
- FRPNVPKQVFHSQY-BPUTZDHNSA-N Ser-Trp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N FRPNVPKQVFHSQY-BPUTZDHNSA-N 0.000 description 3
- VEVYMLNYMULSMS-AVGNSLFASA-N Ser-Tyr-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VEVYMLNYMULSMS-AVGNSLFASA-N 0.000 description 3
- FHXGMDRKJHKLKW-QWRGUYRKSA-N Ser-Tyr-Gly Chemical compound OC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 FHXGMDRKJHKLKW-QWRGUYRKSA-N 0.000 description 3
- MFQMZDPAZRZAPV-NAKRPEOUSA-N Ser-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CO)N MFQMZDPAZRZAPV-NAKRPEOUSA-N 0.000 description 3
- SIEBDTCABMZCLF-XGEHTFHBSA-N Ser-Val-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SIEBDTCABMZCLF-XGEHTFHBSA-N 0.000 description 3
- 101000953880 Severe acute respiratory syndrome coronavirus 2 Membrane protein Proteins 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- 101710172711 Structural protein Proteins 0.000 description 3
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 3
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 3
- KGKWKSSSQGGYAU-SUSMZKCASA-N Thr-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KGKWKSSSQGGYAU-SUSMZKCASA-N 0.000 description 3
- WYKJENSCCRJLRC-ZDLURKLDSA-N Thr-Gly-Cys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N)O WYKJENSCCRJLRC-ZDLURKLDSA-N 0.000 description 3
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 3
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 3
- HPQHHRLWSAMMKG-KATARQTJSA-N Thr-Lys-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)O)N)O HPQHHRLWSAMMKG-KATARQTJSA-N 0.000 description 3
- NZRUWPIYECBYRK-HTUGSXCWSA-N Thr-Phe-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O NZRUWPIYECBYRK-HTUGSXCWSA-N 0.000 description 3
- DNCUODYZAMHLCV-XGEHTFHBSA-N Thr-Pro-Cys Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)O)N)O DNCUODYZAMHLCV-XGEHTFHBSA-N 0.000 description 3
- FWTFAZKJORVTIR-VZFHVOOUSA-N Thr-Ser-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O FWTFAZKJORVTIR-VZFHVOOUSA-N 0.000 description 3
- ZESGVALRVJIVLZ-VFCFLDTKSA-N Thr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O ZESGVALRVJIVLZ-VFCFLDTKSA-N 0.000 description 3
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 3
- AXEJRUGTOJPZKG-XGEHTFHBSA-N Thr-Val-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)O)N)O AXEJRUGTOJPZKG-XGEHTFHBSA-N 0.000 description 3
- BKVICMPZWRNWOC-RHYQMDGZSA-N Thr-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O BKVICMPZWRNWOC-RHYQMDGZSA-N 0.000 description 3
- 239000004473 Threonine Substances 0.000 description 3
- 108020004566 Transfer RNA Proteins 0.000 description 3
- KYWBVMKEYAEDIX-BPUTZDHNSA-N Trp-Met-Cys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CS)C(O)=O)=CNC2=C1 KYWBVMKEYAEDIX-BPUTZDHNSA-N 0.000 description 3
- PEVVXUGSAKEPEN-AVGNSLFASA-N Tyr-Asn-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PEVVXUGSAKEPEN-AVGNSLFASA-N 0.000 description 3
- QHEGAOPHISYNDF-XDTLVQLUSA-N Tyr-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QHEGAOPHISYNDF-XDTLVQLUSA-N 0.000 description 3
- RYSNTWVRSLCAJZ-RYUDHWBXSA-N Tyr-Gln-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RYSNTWVRSLCAJZ-RYUDHWBXSA-N 0.000 description 3
- CKHQKYHIZCRTAP-SOUVJXGZSA-N Tyr-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O CKHQKYHIZCRTAP-SOUVJXGZSA-N 0.000 description 3
- WSFXJLFSJSXGMQ-MGHWNKPDSA-N Tyr-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N WSFXJLFSJSXGMQ-MGHWNKPDSA-N 0.000 description 3
- OLYXUGBVBGSZDN-ACRUOGEOSA-N Tyr-Leu-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 OLYXUGBVBGSZDN-ACRUOGEOSA-N 0.000 description 3
- XJPXTYLVMUZGNW-IHRRRGAJSA-N Tyr-Pro-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O XJPXTYLVMUZGNW-IHRRRGAJSA-N 0.000 description 3
- XFEMMSGONWQACR-KJEVXHAQSA-N Tyr-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O XFEMMSGONWQACR-KJEVXHAQSA-N 0.000 description 3
- RVGVIWNHABGIFH-IHRRRGAJSA-N Tyr-Val-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O RVGVIWNHABGIFH-IHRRRGAJSA-N 0.000 description 3
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 3
- NMANTMWGQZASQN-QXEWZRGKSA-N Val-Arg-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N NMANTMWGQZASQN-QXEWZRGKSA-N 0.000 description 3
- GXAZTLJYINLMJL-LAEOZQHASA-N Val-Asn-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N GXAZTLJYINLMJL-LAEOZQHASA-N 0.000 description 3
- DLYOEFGPYTZVSP-AEJSXWLSSA-N Val-Cys-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N DLYOEFGPYTZVSP-AEJSXWLSSA-N 0.000 description 3
- CPTQYHDSVGVGDZ-UKJIMTQDSA-N Val-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N CPTQYHDSVGVGDZ-UKJIMTQDSA-N 0.000 description 3
- AGKDVLSDNSTLFA-UMNHJUIQSA-N Val-Gln-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N AGKDVLSDNSTLFA-UMNHJUIQSA-N 0.000 description 3
- XGJLNBNZNMVJRS-NRPADANISA-N Val-Glu-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O XGJLNBNZNMVJRS-NRPADANISA-N 0.000 description 3
- VVZDBPBZHLQPPB-XVKPBYJWSA-N Val-Glu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VVZDBPBZHLQPPB-XVKPBYJWSA-N 0.000 description 3
- FEXILLGKGGTLRI-NHCYSSNCSA-N Val-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N FEXILLGKGGTLRI-NHCYSSNCSA-N 0.000 description 3
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 3
- WBAJDGWKRIHOAC-GVXVVHGQSA-N Val-Lys-Gln Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O WBAJDGWKRIHOAC-GVXVVHGQSA-N 0.000 description 3
- HJSLDXZAZGFPDK-ULQDDVLXSA-N Val-Phe-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C(C)C)N HJSLDXZAZGFPDK-ULQDDVLXSA-N 0.000 description 3
- DEGUERSKQBRZMZ-FXQIFTODSA-N Val-Ser-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DEGUERSKQBRZMZ-FXQIFTODSA-N 0.000 description 3
- PGBMPFKFKXYROZ-UFYCRDLUSA-N Val-Tyr-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N PGBMPFKFKXYROZ-UFYCRDLUSA-N 0.000 description 3
- OWFGFHQMSBTKLX-UFYCRDLUSA-N Val-Tyr-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N OWFGFHQMSBTKLX-UFYCRDLUSA-N 0.000 description 3
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 3
- NWMHDZMRVUOQGL-CZEIJOLGSA-N almurtide Chemical compound OC(=O)CC[C@H](C(N)=O)NC(=O)[C@H](C)NC(=O)CO[C@@H]([C@H](O)[C@H](O)CO)[C@@H](NC(C)=O)C=O NWMHDZMRVUOQGL-CZEIJOLGSA-N 0.000 description 3
- 238000010171 animal model Methods 0.000 description 3
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 3
- 235000009582 asparagine Nutrition 0.000 description 3
- 229960001230 asparagine Drugs 0.000 description 3
- 235000003704 aspartic acid Nutrition 0.000 description 3
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- UPAZUDUZKTYFBG-HNPUZVNISA-N azane [(2S,3R,4R,5S,6R)-2,5-dihydroxy-6-[[(2R,3R,4R,5S,6R)-6-(hydroxymethyl)-5-phosphonooxy-3-[[(3R)-3-tetradecanoyloxytetradecanoyl]amino]-4-[(3R)-3-tetradecanoyloxytetradecanoyl]oxyoxan-2-yl]oxymethyl]-3-[[(3R)-3-hydroxytetradecanoyl]amino]oxan-4-yl] (3R)-3-hydroxytetradecanoate Chemical compound [NH4+].CCCCCCCCCCCCCC(=O)O[C@H](CCCCCCCCCCC)CC(=O)N[C@H]1[C@H](OC[C@H]2O[C@H](O)[C@H](NC(=O)C[C@H](O)CCCCCCCCCCC)[C@@H](OC(=O)C[C@H](O)CCCCCCCCCCC)[C@@H]2O)O[C@H](CO)[C@@H](OP(O)([O-])=O)[C@@H]1OC(=O)C[C@@H](CCCCCCCCCCC)OC(=O)CCCCCCCCCCCCC UPAZUDUZKTYFBG-HNPUZVNISA-N 0.000 description 3
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 3
- 239000000969 carrier Substances 0.000 description 3
- 108010016616 cysteinylglycine Proteins 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 210000004602 germ cell Anatomy 0.000 description 3
- 235000013922 glutamic acid Nutrition 0.000 description 3
- 239000004220 glutamic acid Substances 0.000 description 3
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 3
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 3
- 108010025306 histidylleucine Proteins 0.000 description 3
- 102000054751 human RUNX1T1 Human genes 0.000 description 3
- 108010078274 isoleucylvaline Proteins 0.000 description 3
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 3
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 3
- 239000012528 membrane Substances 0.000 description 3
- 229930182817 methionine Natural products 0.000 description 3
- 108010056582 methionylglutamic acid Proteins 0.000 description 3
- 238000006386 neutralization reaction Methods 0.000 description 3
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 3
- 239000002953 phosphate buffered saline Substances 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 108010015796 prolylisoleucine Proteins 0.000 description 3
- 230000000069 prophylactic effect Effects 0.000 description 3
- 230000001681 protective effect Effects 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 238000007920 subcutaneous administration Methods 0.000 description 3
- 239000000829 suppository Substances 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 238000002560 therapeutic procedure Methods 0.000 description 3
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 3
- 108010051110 tyrosyl-lysine Proteins 0.000 description 3
- 108010020532 tyrosyl-proline Proteins 0.000 description 3
- 241000701161 unidentified adenovirus Species 0.000 description 3
- 230000007502 viral entry Effects 0.000 description 3
- JNTMAZFVYNDPLB-PEDHHIEDSA-N (2S,3S)-2-[[[(2S)-1-[(2S,3S)-2-amino-3-methyl-1-oxopentyl]-2-pyrrolidinyl]-oxomethyl]amino]-3-methylpentanoic acid Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JNTMAZFVYNDPLB-PEDHHIEDSA-N 0.000 description 2
- PDRJLZDUOULRHE-ZETCQYMHSA-N (2s)-2-amino-3-pyridin-2-ylpropanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=N1 PDRJLZDUOULRHE-ZETCQYMHSA-N 0.000 description 2
- FQFVANSXYKWQOT-ZETCQYMHSA-N (2s)-2-azaniumyl-3-pyridin-4-ylpropanoate Chemical compound OC(=O)[C@@H](N)CC1=CC=NC=C1 FQFVANSXYKWQOT-ZETCQYMHSA-N 0.000 description 2
- NWFLONJLUJYCNS-UHFFFAOYSA-N 2-[[2-[[2-[(2-amino-3-phenylpropanoyl)amino]acetyl]amino]acetyl]amino]-3-phenylpropanoic acid Chemical compound C=1C=CC=CC=1CC(C(O)=O)NC(=O)CNC(=O)CNC(=O)C(N)CC1=CC=CC=C1 NWFLONJLUJYCNS-UHFFFAOYSA-N 0.000 description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 2
- 206010001052 Acute respiratory distress syndrome Diseases 0.000 description 2
- BYXHQQCXAJARLQ-ZLUOBGJFSA-N Ala-Ala-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O BYXHQQCXAJARLQ-ZLUOBGJFSA-N 0.000 description 2
- TTXMOJWKNRJWQJ-FXQIFTODSA-N Ala-Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N TTXMOJWKNRJWQJ-FXQIFTODSA-N 0.000 description 2
- LBJYAILUMSUTAM-ZLUOBGJFSA-N Ala-Asn-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O LBJYAILUMSUTAM-ZLUOBGJFSA-N 0.000 description 2
- MCKSLROAGSDNFC-ACZMJKKPSA-N Ala-Asp-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MCKSLROAGSDNFC-ACZMJKKPSA-N 0.000 description 2
- ZODMADSIQZZBSQ-FXQIFTODSA-N Ala-Gln-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZODMADSIQZZBSQ-FXQIFTODSA-N 0.000 description 2
- IFTVANMRTIHKML-WDSKDSINSA-N Ala-Gln-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O IFTVANMRTIHKML-WDSKDSINSA-N 0.000 description 2
- BTBUEVAGZCKULD-XPUUQOCRSA-N Ala-Gly-His Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CN=CN1 BTBUEVAGZCKULD-XPUUQOCRSA-N 0.000 description 2
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 2
- NIZKGBJVCMRDKO-KWQFWETISA-N Ala-Gly-Tyr Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NIZKGBJVCMRDKO-KWQFWETISA-N 0.000 description 2
- OKIKVSXTXVVFDV-MMWGEVLESA-N Ala-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N OKIKVSXTXVVFDV-MMWGEVLESA-N 0.000 description 2
- LNNSWWRRYJLGNI-NAKRPEOUSA-N Ala-Ile-Val Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O LNNSWWRRYJLGNI-NAKRPEOUSA-N 0.000 description 2
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 2
- AJBVYEYZVYPFCF-CIUDSAMLSA-N Ala-Lys-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O AJBVYEYZVYPFCF-CIUDSAMLSA-N 0.000 description 2
- DHBKYZYFEXXUAK-ONGXEEELSA-N Ala-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 DHBKYZYFEXXUAK-ONGXEEELSA-N 0.000 description 2
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 2
- RMAWDDRDTRSZIR-ZLUOBGJFSA-N Ala-Ser-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RMAWDDRDTRSZIR-ZLUOBGJFSA-N 0.000 description 2
- YYAVDNKUWLAFCV-ACZMJKKPSA-N Ala-Ser-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYAVDNKUWLAFCV-ACZMJKKPSA-N 0.000 description 2
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 2
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 2
- 101710117290 Aldo-keto reductase family 1 member C4 Proteins 0.000 description 2
- 241000004176 Alphacoronavirus Species 0.000 description 2
- DFCIPNHFKOQAME-FXQIFTODSA-N Arg-Ala-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DFCIPNHFKOQAME-FXQIFTODSA-N 0.000 description 2
- UXJCMQFPDWCHKX-DCAQKATOSA-N Arg-Arg-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UXJCMQFPDWCHKX-DCAQKATOSA-N 0.000 description 2
- PVSNBTCXCQIXSE-JYJNAYRXSA-N Arg-Arg-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PVSNBTCXCQIXSE-JYJNAYRXSA-N 0.000 description 2
- PBSOQGZLPFVXPU-YUMQZZPRSA-N Arg-Glu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PBSOQGZLPFVXPU-YUMQZZPRSA-N 0.000 description 2
- NKNILFJYKKHBKE-WPRPVWTQSA-N Arg-Gly-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NKNILFJYKKHBKE-WPRPVWTQSA-N 0.000 description 2
- GXXWTNKNFFKTJB-NAKRPEOUSA-N Arg-Ile-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O GXXWTNKNFFKTJB-NAKRPEOUSA-N 0.000 description 2
- YTMKMRSYXHBGER-IHRRRGAJSA-N Arg-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YTMKMRSYXHBGER-IHRRRGAJSA-N 0.000 description 2
- VUGWHBXPMAHEGZ-SRVKXCTJSA-N Arg-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N VUGWHBXPMAHEGZ-SRVKXCTJSA-N 0.000 description 2
- JPAWCMXVNZPJLO-IHRRRGAJSA-N Arg-Ser-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JPAWCMXVNZPJLO-IHRRRGAJSA-N 0.000 description 2
- OQPAZKMGCWPERI-GUBZILKMSA-N Arg-Ser-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OQPAZKMGCWPERI-GUBZILKMSA-N 0.000 description 2
- HRCIIMCTUIAKQB-XGEHTFHBSA-N Arg-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O HRCIIMCTUIAKQB-XGEHTFHBSA-N 0.000 description 2
- LYJXHXGPWDTLKW-HJGDQZAQSA-N Arg-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O LYJXHXGPWDTLKW-HJGDQZAQSA-N 0.000 description 2
- MOGMYRUNTKYZFB-UNQGMJICSA-N Arg-Thr-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MOGMYRUNTKYZFB-UNQGMJICSA-N 0.000 description 2
- LLQIAIUAKGNOSE-NHCYSSNCSA-N Arg-Val-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N LLQIAIUAKGNOSE-NHCYSSNCSA-N 0.000 description 2
- DQTIWTULBGLJBL-DCAQKATOSA-N Asn-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N DQTIWTULBGLJBL-DCAQKATOSA-N 0.000 description 2
- ZZXMOQIUIJJOKZ-ZLUOBGJFSA-N Asn-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O ZZXMOQIUIJJOKZ-ZLUOBGJFSA-N 0.000 description 2
- YNSCBOUZTAGIGO-ZLUOBGJFSA-N Asn-Asn-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N)C(=O)N YNSCBOUZTAGIGO-ZLUOBGJFSA-N 0.000 description 2
- APHUDFFMXFYRKP-CIUDSAMLSA-N Asn-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N APHUDFFMXFYRKP-CIUDSAMLSA-N 0.000 description 2
- ZDOQDYFZNGASEY-BIIVOSGPSA-N Asn-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O ZDOQDYFZNGASEY-BIIVOSGPSA-N 0.000 description 2
- QRHYAUYXBVVDSB-LKXGYXEUSA-N Asn-Cys-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QRHYAUYXBVVDSB-LKXGYXEUSA-N 0.000 description 2
- AYKKKGFJXIDYLX-ACZMJKKPSA-N Asn-Gln-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O AYKKKGFJXIDYLX-ACZMJKKPSA-N 0.000 description 2
- WPOLSNAQGVHROR-GUBZILKMSA-N Asn-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N WPOLSNAQGVHROR-GUBZILKMSA-N 0.000 description 2
- DMLSCRJBWUEALP-LAEOZQHASA-N Asn-Glu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O DMLSCRJBWUEALP-LAEOZQHASA-N 0.000 description 2
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 2
- ANPFQTJEPONRPL-UGYAYLCHSA-N Asn-Ile-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O ANPFQTJEPONRPL-UGYAYLCHSA-N 0.000 description 2
- PHJPKNUWWHRAOC-PEFMBERDSA-N Asn-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PHJPKNUWWHRAOC-PEFMBERDSA-N 0.000 description 2
- YYSYDIYQTUPNQQ-SXTJYALSSA-N Asn-Ile-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YYSYDIYQTUPNQQ-SXTJYALSSA-N 0.000 description 2
- FODVBOKTYKYRFJ-CIUDSAMLSA-N Asn-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N FODVBOKTYKYRFJ-CIUDSAMLSA-N 0.000 description 2
- WXVGISRWSYGEDK-KKUMJFAQSA-N Asn-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N WXVGISRWSYGEDK-KKUMJFAQSA-N 0.000 description 2
- GIQCDTKOIPUDSG-GARJFASQSA-N Asn-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N)C(=O)O GIQCDTKOIPUDSG-GARJFASQSA-N 0.000 description 2
- COWITDLVHMZSIW-CIUDSAMLSA-N Asn-Lys-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O COWITDLVHMZSIW-CIUDSAMLSA-N 0.000 description 2
- RTFWCVDISAMGEQ-SRVKXCTJSA-N Asn-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N RTFWCVDISAMGEQ-SRVKXCTJSA-N 0.000 description 2
- VHQSGALUSWIYOD-QXEWZRGKSA-N Asn-Pro-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O VHQSGALUSWIYOD-QXEWZRGKSA-N 0.000 description 2
- REQUGIWGOGSOEZ-ZLUOBGJFSA-N Asn-Ser-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N REQUGIWGOGSOEZ-ZLUOBGJFSA-N 0.000 description 2
- NPZJLGMWMDNQDD-GHCJXIJMSA-N Asn-Ser-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NPZJLGMWMDNQDD-GHCJXIJMSA-N 0.000 description 2
- MYTHOBCLNIOFBL-SRVKXCTJSA-N Asn-Ser-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MYTHOBCLNIOFBL-SRVKXCTJSA-N 0.000 description 2
- UXHYOWXTJLBEPG-GSSVUCPTSA-N Asn-Thr-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UXHYOWXTJLBEPG-GSSVUCPTSA-N 0.000 description 2
- DATSKXOXPUAOLK-KKUMJFAQSA-N Asn-Tyr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DATSKXOXPUAOLK-KKUMJFAQSA-N 0.000 description 2
- QNNBHTFDFFFHGC-KKUMJFAQSA-N Asn-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QNNBHTFDFFFHGC-KKUMJFAQSA-N 0.000 description 2
- CBHVAFXKOYAHOY-NHCYSSNCSA-N Asn-Val-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O CBHVAFXKOYAHOY-NHCYSSNCSA-N 0.000 description 2
- DBWYWXNMZZYIRY-LPEHRKFASA-N Asp-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O DBWYWXNMZZYIRY-LPEHRKFASA-N 0.000 description 2
- UGIBTKGQVWFTGX-BIIVOSGPSA-N Asp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O UGIBTKGQVWFTGX-BIIVOSGPSA-N 0.000 description 2
- XACXDSRQIXRMNS-OLHMAJIHSA-N Asp-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)O XACXDSRQIXRMNS-OLHMAJIHSA-N 0.000 description 2
- SVFOIXMRMLROHO-SRVKXCTJSA-N Asp-Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SVFOIXMRMLROHO-SRVKXCTJSA-N 0.000 description 2
- QXHVOUSPVAWEMX-ZLUOBGJFSA-N Asp-Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXHVOUSPVAWEMX-ZLUOBGJFSA-N 0.000 description 2
- AMRANMVXQWXNAH-ZLUOBGJFSA-N Asp-Cys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CC(O)=O AMRANMVXQWXNAH-ZLUOBGJFSA-N 0.000 description 2
- DZQKLNLLWFQONU-LKXGYXEUSA-N Asp-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N)O DZQKLNLLWFQONU-LKXGYXEUSA-N 0.000 description 2
- YDJVIBMKAMQPPP-LAEOZQHASA-N Asp-Glu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O YDJVIBMKAMQPPP-LAEOZQHASA-N 0.000 description 2
- JUWZKMBALYLZCK-WHFBIAKZSA-N Asp-Gly-Asn Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O JUWZKMBALYLZCK-WHFBIAKZSA-N 0.000 description 2
- KTTCQQNRRLCIBC-GHCJXIJMSA-N Asp-Ile-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O KTTCQQNRRLCIBC-GHCJXIJMSA-N 0.000 description 2
- AITKTFCQOBRJTG-CIUDSAMLSA-N Asp-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N AITKTFCQOBRJTG-CIUDSAMLSA-N 0.000 description 2
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 2
- HKEZZWQWXWGASX-KKUMJFAQSA-N Asp-Leu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HKEZZWQWXWGASX-KKUMJFAQSA-N 0.000 description 2
- DJCAHYVLMSRBFR-QXEWZRGKSA-N Asp-Met-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(O)=O DJCAHYVLMSRBFR-QXEWZRGKSA-N 0.000 description 2
- HJZLUGQGJWXJCJ-CIUDSAMLSA-N Asp-Pro-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O HJZLUGQGJWXJCJ-CIUDSAMLSA-N 0.000 description 2
- FAUPLTGRUBTXNU-FXQIFTODSA-N Asp-Pro-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O FAUPLTGRUBTXNU-FXQIFTODSA-N 0.000 description 2
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 2
- YIDFBWRHIYOYAA-LKXGYXEUSA-N Asp-Ser-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YIDFBWRHIYOYAA-LKXGYXEUSA-N 0.000 description 2
- JJQGZGOEDSSHTE-FOHZUACHSA-N Asp-Thr-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JJQGZGOEDSSHTE-FOHZUACHSA-N 0.000 description 2
- GCACQYDBDHRVGE-LKXGYXEUSA-N Asp-Thr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC(O)=O GCACQYDBDHRVGE-LKXGYXEUSA-N 0.000 description 2
- RSMZEHCMIOKNMW-GSSVUCPTSA-N Asp-Thr-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RSMZEHCMIOKNMW-GSSVUCPTSA-N 0.000 description 2
- USENATHVGFXRNO-SRVKXCTJSA-N Asp-Tyr-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 USENATHVGFXRNO-SRVKXCTJSA-N 0.000 description 2
- CZIVKMOEXPILDK-SRVKXCTJSA-N Asp-Tyr-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O CZIVKMOEXPILDK-SRVKXCTJSA-N 0.000 description 2
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 2
- GIKOVDMXBAFXDF-NHCYSSNCSA-N Asp-Val-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GIKOVDMXBAFXDF-NHCYSSNCSA-N 0.000 description 2
- 241000271566 Aves Species 0.000 description 2
- 241000008904 Betacoronavirus Species 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- 238000009010 Bradford assay Methods 0.000 description 2
- 101100505161 Caenorhabditis elegans mel-32 gene Proteins 0.000 description 2
- 241000282421 Canidae Species 0.000 description 2
- 241000282693 Cercopithecidae Species 0.000 description 2
- 108091035707 Consensus sequence Proteins 0.000 description 2
- WDQXKVCQXRNOSI-GHCJXIJMSA-N Cys-Asp-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WDQXKVCQXRNOSI-GHCJXIJMSA-N 0.000 description 2
- LWTTURISBKEVAC-CIUDSAMLSA-N Cys-Cys-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CS)N LWTTURISBKEVAC-CIUDSAMLSA-N 0.000 description 2
- WYZLWZNAWQNLGQ-FXQIFTODSA-N Cys-Cys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CS)N WYZLWZNAWQNLGQ-FXQIFTODSA-N 0.000 description 2
- UYYZZJXUVIZTMH-AVGNSLFASA-N Cys-Glu-Phe Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O UYYZZJXUVIZTMH-AVGNSLFASA-N 0.000 description 2
- GUKYYUFHWYRMEU-WHFBIAKZSA-N Cys-Gly-Asp Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O GUKYYUFHWYRMEU-WHFBIAKZSA-N 0.000 description 2
- DZSICRGTVPDCRN-YUMQZZPRSA-N Cys-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CS)N DZSICRGTVPDCRN-YUMQZZPRSA-N 0.000 description 2
- XTHUKRLJRUVVBF-WHFBIAKZSA-N Cys-Gly-Ser Chemical compound SC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O XTHUKRLJRUVVBF-WHFBIAKZSA-N 0.000 description 2
- ANRWXLYGJRSQEQ-CIUDSAMLSA-N Cys-His-Asp Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O ANRWXLYGJRSQEQ-CIUDSAMLSA-N 0.000 description 2
- IZUNQDRIAOLWCN-YUMQZZPRSA-N Cys-Leu-Gly Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CS)N IZUNQDRIAOLWCN-YUMQZZPRSA-N 0.000 description 2
- CNAMJJOZGXPDHW-IHRRRGAJSA-N Cys-Pro-Phe Chemical compound N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O CNAMJJOZGXPDHW-IHRRRGAJSA-N 0.000 description 2
- BCWIFCLVCRAIQK-ZLUOBGJFSA-N Cys-Ser-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CS)N)O BCWIFCLVCRAIQK-ZLUOBGJFSA-N 0.000 description 2
- HJXSYJVCMUOUNY-SRVKXCTJSA-N Cys-Ser-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N HJXSYJVCMUOUNY-SRVKXCTJSA-N 0.000 description 2
- FTTZLFIEUQHLHH-BWBBJGPYSA-N Cys-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CS)N)O FTTZLFIEUQHLHH-BWBBJGPYSA-N 0.000 description 2
- MWVDDZUTWXFYHL-XKBZYTNZSA-N Cys-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CS)N)O MWVDDZUTWXFYHL-XKBZYTNZSA-N 0.000 description 2
- SAEVTQWAYDPXMU-KATARQTJSA-N Cys-Thr-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O SAEVTQWAYDPXMU-KATARQTJSA-N 0.000 description 2
- GFAPBMCRSMSGDZ-XGEHTFHBSA-N Cys-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CS)N)O GFAPBMCRSMSGDZ-XGEHTFHBSA-N 0.000 description 2
- BOMGEMDZTNZESV-QWRGUYRKSA-N Cys-Tyr-Gly Chemical compound SC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 BOMGEMDZTNZESV-QWRGUYRKSA-N 0.000 description 2
- 108010041986 DNA Vaccines Proteins 0.000 description 2
- 241000450599 DNA viruses Species 0.000 description 2
- 241001461743 Deltacoronavirus Species 0.000 description 2
- 241000702421 Dependoparvovirus Species 0.000 description 2
- 231100000491 EC50 Toxicity 0.000 description 2
- 241000283086 Equidae Species 0.000 description 2
- 241000287828 Gallus gallus Species 0.000 description 2
- 241000008920 Gammacoronavirus Species 0.000 description 2
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 2
- DLOHWQXXGMEZDW-CIUDSAMLSA-N Gln-Arg-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O DLOHWQXXGMEZDW-CIUDSAMLSA-N 0.000 description 2
- RMOCFPBLHAOTDU-ACZMJKKPSA-N Gln-Asn-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RMOCFPBLHAOTDU-ACZMJKKPSA-N 0.000 description 2
- XEYMBRRKIFYQMF-GUBZILKMSA-N Gln-Asp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XEYMBRRKIFYQMF-GUBZILKMSA-N 0.000 description 2
- KZEUVLLVULIPNX-GUBZILKMSA-N Gln-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N KZEUVLLVULIPNX-GUBZILKMSA-N 0.000 description 2
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 2
- LVNILKSSFHCSJZ-IHRRRGAJSA-N Gln-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N LVNILKSSFHCSJZ-IHRRRGAJSA-N 0.000 description 2
- XJKAKYXMFHUIHT-AUTRQRHGSA-N Gln-Glu-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N XJKAKYXMFHUIHT-AUTRQRHGSA-N 0.000 description 2
- LVSYIKGMLRHKME-IUCAKERBSA-N Gln-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N LVSYIKGMLRHKME-IUCAKERBSA-N 0.000 description 2
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 2
- XFAUJGNLHIGXET-AVGNSLFASA-N Gln-Leu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XFAUJGNLHIGXET-AVGNSLFASA-N 0.000 description 2
- SHAUZYVSXAMYAZ-JYJNAYRXSA-N Gln-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SHAUZYVSXAMYAZ-JYJNAYRXSA-N 0.000 description 2
- YPMDZWPZFOZYFG-GUBZILKMSA-N Gln-Leu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YPMDZWPZFOZYFG-GUBZILKMSA-N 0.000 description 2
- FKXCBKCOSVIGCT-AVGNSLFASA-N Gln-Lys-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FKXCBKCOSVIGCT-AVGNSLFASA-N 0.000 description 2
- ILKYYKRAULNYMS-JYJNAYRXSA-N Gln-Lys-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ILKYYKRAULNYMS-JYJNAYRXSA-N 0.000 description 2
- AQPZYBSRDRZBAG-AVGNSLFASA-N Gln-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N AQPZYBSRDRZBAG-AVGNSLFASA-N 0.000 description 2
- QBEWLBKBGXVVPD-RYUDHWBXSA-N Gln-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N QBEWLBKBGXVVPD-RYUDHWBXSA-N 0.000 description 2
- HMIXCETWRYDVMO-GUBZILKMSA-N Gln-Pro-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O HMIXCETWRYDVMO-GUBZILKMSA-N 0.000 description 2
- KPNWAJMEMRCLAL-GUBZILKMSA-N Gln-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N KPNWAJMEMRCLAL-GUBZILKMSA-N 0.000 description 2
- BYKZWDGMJLNFJY-XKBZYTNZSA-N Gln-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)O BYKZWDGMJLNFJY-XKBZYTNZSA-N 0.000 description 2
- UXXIVIQGOODKQC-NUMRIWBASA-N Gln-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UXXIVIQGOODKQC-NUMRIWBASA-N 0.000 description 2
- XKPACHRGOWQHFH-IRIUXVKKSA-N Gln-Thr-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XKPACHRGOWQHFH-IRIUXVKKSA-N 0.000 description 2
- AKDOUBMVLRCHBD-SIUGBPQLSA-N Gln-Tyr-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AKDOUBMVLRCHBD-SIUGBPQLSA-N 0.000 description 2
- UBRQJXFDVZNYJP-AVGNSLFASA-N Gln-Tyr-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UBRQJXFDVZNYJP-AVGNSLFASA-N 0.000 description 2
- UQKVUFGUSVYJMQ-IRIUXVKKSA-N Gln-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)N)N)O UQKVUFGUSVYJMQ-IRIUXVKKSA-N 0.000 description 2
- UTKUTMJSWKKHEM-WDSKDSINSA-N Glu-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O UTKUTMJSWKKHEM-WDSKDSINSA-N 0.000 description 2
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 2
- OBIHEDRRSMRKLU-ACZMJKKPSA-N Glu-Cys-Asp Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OBIHEDRRSMRKLU-ACZMJKKPSA-N 0.000 description 2
- CLROYXHHUZELFX-FXQIFTODSA-N Glu-Gln-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O CLROYXHHUZELFX-FXQIFTODSA-N 0.000 description 2
- KRGZZKWSBGPLKL-IUCAKERBSA-N Glu-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N KRGZZKWSBGPLKL-IUCAKERBSA-N 0.000 description 2
- ZGKXAUIVGIBISK-SZMVWBNQSA-N Glu-His-Trp Chemical compound N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1c[nH]cn1)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O ZGKXAUIVGIBISK-SZMVWBNQSA-N 0.000 description 2
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 2
- OCJRHJZKGGSPRW-IUCAKERBSA-N Glu-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O OCJRHJZKGGSPRW-IUCAKERBSA-N 0.000 description 2
- RBXSZQRSEGYDFG-GUBZILKMSA-N Glu-Lys-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O RBXSZQRSEGYDFG-GUBZILKMSA-N 0.000 description 2
- FQFWFZWOHOEVMZ-IHRRRGAJSA-N Glu-Phe-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O FQFWFZWOHOEVMZ-IHRRRGAJSA-N 0.000 description 2
- SYWCGQOIIARSIX-SRVKXCTJSA-N Glu-Pro-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O SYWCGQOIIARSIX-SRVKXCTJSA-N 0.000 description 2
- NNQDRRUXFJYCCJ-NHCYSSNCSA-N Glu-Pro-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O NNQDRRUXFJYCCJ-NHCYSSNCSA-N 0.000 description 2
- MLILEEIVMRUYBX-NHCYSSNCSA-N Glu-Val-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O MLILEEIVMRUYBX-NHCYSSNCSA-N 0.000 description 2
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 2
- MFVQGXGQRIXBPK-WDSKDSINSA-N Gly-Ala-Glu Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFVQGXGQRIXBPK-WDSKDSINSA-N 0.000 description 2
- YMUFWNJHVPQNQD-ZKWXMUAHSA-N Gly-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN YMUFWNJHVPQNQD-ZKWXMUAHSA-N 0.000 description 2
- CLODWIOAKCSBAN-BQBZGAKWSA-N Gly-Arg-Asp Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O CLODWIOAKCSBAN-BQBZGAKWSA-N 0.000 description 2
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 2
- VXKCPBPQEKKERH-IUCAKERBSA-N Gly-Arg-Pro Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N1CCC[C@H]1C(O)=O VXKCPBPQEKKERH-IUCAKERBSA-N 0.000 description 2
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 2
- PABFFPWEJMEVEC-JGVFFNPUSA-N Gly-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)CN)C(=O)O PABFFPWEJMEVEC-JGVFFNPUSA-N 0.000 description 2
- QSVCIFZPGLOZGH-WDSKDSINSA-N Gly-Glu-Ser Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QSVCIFZPGLOZGH-WDSKDSINSA-N 0.000 description 2
- JSNNHGHYGYMVCK-XVKPBYJWSA-N Gly-Glu-Val Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O JSNNHGHYGYMVCK-XVKPBYJWSA-N 0.000 description 2
- QPTNELDXWKRIFX-YFKPBYRVSA-N Gly-Gly-Gln Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O QPTNELDXWKRIFX-YFKPBYRVSA-N 0.000 description 2
- YFGONBOFGGWKKY-VHSXEESVSA-N Gly-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)CN)C(=O)O YFGONBOFGGWKKY-VHSXEESVSA-N 0.000 description 2
- HMHRTKOWRUPPNU-RCOVLWMOSA-N Gly-Ile-Gly Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O HMHRTKOWRUPPNU-RCOVLWMOSA-N 0.000 description 2
- LRQXRHGQEVWGPV-NHCYSSNCSA-N Gly-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN LRQXRHGQEVWGPV-NHCYSSNCSA-N 0.000 description 2
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 2
- FHQRLHFYVZAQHU-IUCAKERBSA-N Gly-Lys-Gln Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O FHQRLHFYVZAQHU-IUCAKERBSA-N 0.000 description 2
- BMWFDYIYBAFROD-WPRPVWTQSA-N Gly-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN BMWFDYIYBAFROD-WPRPVWTQSA-N 0.000 description 2
- JSLVAHYTAJJEQH-QWRGUYRKSA-N Gly-Ser-Phe Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JSLVAHYTAJJEQH-QWRGUYRKSA-N 0.000 description 2
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 2
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 2
- HUFUVTYGPOUCBN-MBLNEYKQSA-N Gly-Thr-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HUFUVTYGPOUCBN-MBLNEYKQSA-N 0.000 description 2
- UMBDRSMLCUYIRI-DVJZZOLTSA-N Gly-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)CN)O UMBDRSMLCUYIRI-DVJZZOLTSA-N 0.000 description 2
- KBBFOULZCHWGJX-KBPBESRZSA-N Gly-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)CN)O KBBFOULZCHWGJX-KBPBESRZSA-N 0.000 description 2
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 2
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 2
- DCRODRAURLJOFY-XPUUQOCRSA-N His-Ala-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)NCC(O)=O DCRODRAURLJOFY-XPUUQOCRSA-N 0.000 description 2
- XINDHUAGVGCNSF-QSFUFRPTSA-N His-Ala-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XINDHUAGVGCNSF-QSFUFRPTSA-N 0.000 description 2
- BQFGKVYHKCNEMF-DCAQKATOSA-N His-Glu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 BQFGKVYHKCNEMF-DCAQKATOSA-N 0.000 description 2
- NTXIJPDAHXSHNL-ONGXEEELSA-N His-Gly-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NTXIJPDAHXSHNL-ONGXEEELSA-N 0.000 description 2
- FHGVHXCQMJWQPK-SRVKXCTJSA-N His-Lys-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O FHGVHXCQMJWQPK-SRVKXCTJSA-N 0.000 description 2
- ULRFSEJGSHYLQI-YESZJQIVSA-N His-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CN=CN3)N)C(=O)O ULRFSEJGSHYLQI-YESZJQIVSA-N 0.000 description 2
- KAXZXLSXFWSNNZ-XVYDVKMFSA-N His-Ser-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KAXZXLSXFWSNNZ-XVYDVKMFSA-N 0.000 description 2
- ILUVWFTXAUYOBW-CUJWVEQBSA-N His-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CN=CN1)N)O ILUVWFTXAUYOBW-CUJWVEQBSA-N 0.000 description 2
- CSTDQOOBZBAJKE-BWAGICSOSA-N His-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CN=CN2)N)O CSTDQOOBZBAJKE-BWAGICSOSA-N 0.000 description 2
- XGBVLRJLHUVCNK-DCAQKATOSA-N His-Val-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O XGBVLRJLHUVCNK-DCAQKATOSA-N 0.000 description 2
- GBMSSORHVHAYLU-QTKMDUPCSA-N His-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CN=CN1)N)O GBMSSORHVHAYLU-QTKMDUPCSA-N 0.000 description 2
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 2
- NKVZTQVGUNLLQW-JBDRJPRFSA-N Ile-Ala-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)O)N NKVZTQVGUNLLQW-JBDRJPRFSA-N 0.000 description 2
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 2
- WZPIKDWQVRTATP-SYWGBEHUSA-N Ile-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 WZPIKDWQVRTATP-SYWGBEHUSA-N 0.000 description 2
- MKWSZEHGHSLNPF-NAKRPEOUSA-N Ile-Ala-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O)N MKWSZEHGHSLNPF-NAKRPEOUSA-N 0.000 description 2
- QADCTXFNLZBZAB-GHCJXIJMSA-N Ile-Asn-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N QADCTXFNLZBZAB-GHCJXIJMSA-N 0.000 description 2
- YPQDTQJBOFOTJQ-SXTJYALSSA-N Ile-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N YPQDTQJBOFOTJQ-SXTJYALSSA-N 0.000 description 2
- XENGULNPUDGALZ-ZPFDUUQYSA-N Ile-Asn-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N XENGULNPUDGALZ-ZPFDUUQYSA-N 0.000 description 2
- NKRJALPCDNXULF-BYULHYEWSA-N Ile-Asp-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O NKRJALPCDNXULF-BYULHYEWSA-N 0.000 description 2
- PFTFEWHJSAXGED-ZKWXMUAHSA-N Ile-Cys-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N PFTFEWHJSAXGED-ZKWXMUAHSA-N 0.000 description 2
- AWTDTFXPVCTHAK-BJDJZHNGSA-N Ile-Cys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N AWTDTFXPVCTHAK-BJDJZHNGSA-N 0.000 description 2
- KIMHKBDJQQYLHU-PEFMBERDSA-N Ile-Glu-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KIMHKBDJQQYLHU-PEFMBERDSA-N 0.000 description 2
- APDIECQNNDGFPD-PYJNHQTQSA-N Ile-His-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C(C)C)C(=O)O)N APDIECQNNDGFPD-PYJNHQTQSA-N 0.000 description 2
- KYLIZSDYWQQTFM-PEDHHIEDSA-N Ile-Ile-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N KYLIZSDYWQQTFM-PEDHHIEDSA-N 0.000 description 2
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 2
- UDBPXJNOEWDBDF-XUXIUFHCSA-N Ile-Lys-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)O)N UDBPXJNOEWDBDF-XUXIUFHCSA-N 0.000 description 2
- WSSGUVAKYCQSCT-XUXIUFHCSA-N Ile-Met-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)O)N WSSGUVAKYCQSCT-XUXIUFHCSA-N 0.000 description 2
- UAELWXJFLZBKQS-WHOFXGATSA-N Ile-Phe-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O UAELWXJFLZBKQS-WHOFXGATSA-N 0.000 description 2
- BJECXJHLUJXPJQ-PYJNHQTQSA-N Ile-Pro-His Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N BJECXJHLUJXPJQ-PYJNHQTQSA-N 0.000 description 2
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 2
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 2
- SAEWJTCJQVZQNZ-IUKAMOBKSA-N Ile-Thr-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SAEWJTCJQVZQNZ-IUKAMOBKSA-N 0.000 description 2
- NURNJECQNNCRBK-FLBSBUHZSA-N Ile-Thr-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NURNJECQNNCRBK-FLBSBUHZSA-N 0.000 description 2
- GNXGAVNTVNOCLL-SIUGBPQLSA-N Ile-Tyr-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N GNXGAVNTVNOCLL-SIUGBPQLSA-N 0.000 description 2
- IPFKIGNDTUOFAF-CYDGBPFRSA-N Ile-Val-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IPFKIGNDTUOFAF-CYDGBPFRSA-N 0.000 description 2
- 108020005350 Initiator Codon Proteins 0.000 description 2
- 108010065920 Insulin Lispro Proteins 0.000 description 2
- SNDPXSYFESPGGJ-BYPYZUCNSA-N L-2-aminopentanoic acid Chemical compound CCC[C@H](N)C(O)=O SNDPXSYFESPGGJ-BYPYZUCNSA-N 0.000 description 2
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 2
- UGTHTQWIQKEDEH-BQBZGAKWSA-N L-alanyl-L-prolylglycine zwitterion Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UGTHTQWIQKEDEH-BQBZGAKWSA-N 0.000 description 2
- ZGUNAGUHMKGQNY-ZETCQYMHSA-N L-alpha-phenylglycine zwitterion Chemical compound OC(=O)[C@@H](N)C1=CC=CC=C1 ZGUNAGUHMKGQNY-ZETCQYMHSA-N 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 2
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 2
- SNDPXSYFESPGGJ-UHFFFAOYSA-N L-norVal-OH Natural products CCCC(N)C(O)=O SNDPXSYFESPGGJ-UHFFFAOYSA-N 0.000 description 2
- HXEACLLIILLPRG-YFKPBYRVSA-N L-pipecolic acid Chemical compound [O-]C(=O)[C@@H]1CCCC[NH2+]1 HXEACLLIILLPRG-YFKPBYRVSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 2
- IGUOAYLTQJLPPD-DCAQKATOSA-N Leu-Asn-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IGUOAYLTQJLPPD-DCAQKATOSA-N 0.000 description 2
- FIJMQLGQLBLBOL-HJGDQZAQSA-N Leu-Asn-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FIJMQLGQLBLBOL-HJGDQZAQSA-N 0.000 description 2
- GBDMISNMNXVTNV-XIRDDKMYSA-N Leu-Asp-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O GBDMISNMNXVTNV-XIRDDKMYSA-N 0.000 description 2
- YORLGJINWYYIMX-KKUMJFAQSA-N Leu-Cys-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YORLGJINWYYIMX-KKUMJFAQSA-N 0.000 description 2
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 2
- OYQUOLRTJHWVSQ-SRVKXCTJSA-N Leu-His-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O OYQUOLRTJHWVSQ-SRVKXCTJSA-N 0.000 description 2
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 2
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 2
- FAELBUXXFQLUAX-AJNGGQMLSA-N Leu-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C FAELBUXXFQLUAX-AJNGGQMLSA-N 0.000 description 2
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 2
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 2
- ONPJGOIVICHWBW-BZSNNMDCSA-N Leu-Lys-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 ONPJGOIVICHWBW-BZSNNMDCSA-N 0.000 description 2
- WXZOHBVPVKABQN-DCAQKATOSA-N Leu-Met-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WXZOHBVPVKABQN-DCAQKATOSA-N 0.000 description 2
- HDHQQEDVWQGBEE-DCAQKATOSA-N Leu-Met-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O HDHQQEDVWQGBEE-DCAQKATOSA-N 0.000 description 2
- MVVSHHJKJRZVNY-ACRUOGEOSA-N Leu-Phe-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MVVSHHJKJRZVNY-ACRUOGEOSA-N 0.000 description 2
- YUTNOGOMBNYPFH-XUXIUFHCSA-N Leu-Pro-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YUTNOGOMBNYPFH-XUXIUFHCSA-N 0.000 description 2
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 2
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 2
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 2
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 2
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 2
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 2
- CGHXMODRYJISSK-NHCYSSNCSA-N Leu-Val-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O CGHXMODRYJISSK-NHCYSSNCSA-N 0.000 description 2
- NTXYXFDMIHXTHE-WDSOQIARSA-N Leu-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 NTXYXFDMIHXTHE-WDSOQIARSA-N 0.000 description 2
- NQCJGQHHYZNUDK-DCAQKATOSA-N Lys-Arg-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CCCN=C(N)N NQCJGQHHYZNUDK-DCAQKATOSA-N 0.000 description 2
- ABHIXYDMILIUKV-CIUDSAMLSA-N Lys-Asn-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ABHIXYDMILIUKV-CIUDSAMLSA-N 0.000 description 2
- DEFGUIIUYAUEDU-ZPFDUUQYSA-N Lys-Asn-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DEFGUIIUYAUEDU-ZPFDUUQYSA-N 0.000 description 2
- YVSHZSUKQHNDHD-KKUMJFAQSA-N Lys-Asn-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N YVSHZSUKQHNDHD-KKUMJFAQSA-N 0.000 description 2
- LPAJOCKCPRZEAG-MNXVOIDGSA-N Lys-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCCN LPAJOCKCPRZEAG-MNXVOIDGSA-N 0.000 description 2
- NJNRBRKHOWSGMN-SRVKXCTJSA-N Lys-Leu-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O NJNRBRKHOWSGMN-SRVKXCTJSA-N 0.000 description 2
- MUXNCRWTWBMNHX-SRVKXCTJSA-N Lys-Leu-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O MUXNCRWTWBMNHX-SRVKXCTJSA-N 0.000 description 2
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 2
- VUTWYNQUSJWBHO-BZSNNMDCSA-N Lys-Leu-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VUTWYNQUSJWBHO-BZSNNMDCSA-N 0.000 description 2
- SQXZLVXQXWILKW-KKUMJFAQSA-N Lys-Ser-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQXZLVXQXWILKW-KKUMJFAQSA-N 0.000 description 2
- UWHCKWNPWKTMBM-WDCWCFNPSA-N Lys-Thr-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O UWHCKWNPWKTMBM-WDCWCFNPSA-N 0.000 description 2
- YCJCEMKOZOYBEF-OEAJRASXSA-N Lys-Thr-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YCJCEMKOZOYBEF-OEAJRASXSA-N 0.000 description 2
- AWMMBHDKERMOID-YTQUADARSA-N Lys-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CCCCN)N)C(=O)O AWMMBHDKERMOID-YTQUADARSA-N 0.000 description 2
- XYLSGAWRCZECIQ-JYJNAYRXSA-N Lys-Tyr-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 XYLSGAWRCZECIQ-JYJNAYRXSA-N 0.000 description 2
- QFSYGUMEANRNJE-DCAQKATOSA-N Lys-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N QFSYGUMEANRNJE-DCAQKATOSA-N 0.000 description 2
- VKCPHIOZDWUFSW-ONGXEEELSA-N Lys-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN VKCPHIOZDWUFSW-ONGXEEELSA-N 0.000 description 2
- TXTZMVNJIRZABH-ULQDDVLXSA-N Lys-Val-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TXTZMVNJIRZABH-ULQDDVLXSA-N 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- UAPZLLPGGOOCRO-IHRRRGAJSA-N Met-Asn-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N UAPZLLPGGOOCRO-IHRRRGAJSA-N 0.000 description 2
- OSOLWRWQADPDIQ-DCAQKATOSA-N Met-Asp-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OSOLWRWQADPDIQ-DCAQKATOSA-N 0.000 description 2
- HLQWFLJOJRFXHO-CIUDSAMLSA-N Met-Glu-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O HLQWFLJOJRFXHO-CIUDSAMLSA-N 0.000 description 2
- IHRFZLQEQVHXFA-RHYQMDGZSA-N Met-Thr-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCCN IHRFZLQEQVHXFA-RHYQMDGZSA-N 0.000 description 2
- LIIXIZKVWNYQHB-STECZYCISA-N Met-Tyr-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LIIXIZKVWNYQHB-STECZYCISA-N 0.000 description 2
- IIHMNTBFPMRJCN-RCWTZXSCSA-N Met-Val-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IIHMNTBFPMRJCN-RCWTZXSCSA-N 0.000 description 2
- 208000025370 Middle East respiratory syndrome Diseases 0.000 description 2
- 241000699666 Mus <mouse, genus> Species 0.000 description 2
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 2
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 2
- 108700015872 N-acetyl-nor-muramyl-L-alanyl-D-isoglutamine Proteins 0.000 description 2
- QIAFMBKCNZACKA-UHFFFAOYSA-N N-benzoylglycine Chemical compound OC(=O)CNC(=O)C1=CC=CC=C1 QIAFMBKCNZACKA-UHFFFAOYSA-N 0.000 description 2
- 108020004485 Nonsense Codon Proteins 0.000 description 2
- 108090001074 Nucleocapsid Proteins Proteins 0.000 description 2
- 241000320412 Ogataea angusta Species 0.000 description 2
- AJOKKVTWEMXZHC-DRZSPHRISA-N Phe-Ala-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 AJOKKVTWEMXZHC-DRZSPHRISA-N 0.000 description 2
- QCHNRQQVLJYDSI-DLOVCJGASA-N Phe-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 QCHNRQQVLJYDSI-DLOVCJGASA-N 0.000 description 2
- UUWCIPUVJJIEEP-SRVKXCTJSA-N Phe-Asn-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N UUWCIPUVJJIEEP-SRVKXCTJSA-N 0.000 description 2
- HHOOEUSPFGPZFP-QWRGUYRKSA-N Phe-Asn-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HHOOEUSPFGPZFP-QWRGUYRKSA-N 0.000 description 2
- MECSIDWUTYRHRJ-KKUMJFAQSA-N Phe-Asn-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O MECSIDWUTYRHRJ-KKUMJFAQSA-N 0.000 description 2
- DDYIRGBOZVKRFR-AVGNSLFASA-N Phe-Asp-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N DDYIRGBOZVKRFR-AVGNSLFASA-N 0.000 description 2
- IILUKIJNFMUBNF-IHRRRGAJSA-N Phe-Gln-Gln Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O IILUKIJNFMUBNF-IHRRRGAJSA-N 0.000 description 2
- GDBOREPXIRKSEQ-FHWLQOOXSA-N Phe-Gln-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GDBOREPXIRKSEQ-FHWLQOOXSA-N 0.000 description 2
- RFEXGCASCQGGHZ-STQMWFEESA-N Phe-Gly-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O RFEXGCASCQGGHZ-STQMWFEESA-N 0.000 description 2
- ZLGQEBCCANLYRA-RYUDHWBXSA-N Phe-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O ZLGQEBCCANLYRA-RYUDHWBXSA-N 0.000 description 2
- NAXPHWZXEXNDIW-JTQLQIEISA-N Phe-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 NAXPHWZXEXNDIW-JTQLQIEISA-N 0.000 description 2
- PMKIMKUGCSVFSV-CQDKDKBSSA-N Phe-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=CC=C2)N PMKIMKUGCSVFSV-CQDKDKBSSA-N 0.000 description 2
- VZFPYFRVHMSSNA-JURCDPSOSA-N Phe-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=CC=C1 VZFPYFRVHMSSNA-JURCDPSOSA-N 0.000 description 2
- INHMISZWLJZQGH-ULQDDVLXSA-N Phe-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 INHMISZWLJZQGH-ULQDDVLXSA-N 0.000 description 2
- WLYPRKLMRIYGPP-JYJNAYRXSA-N Phe-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 WLYPRKLMRIYGPP-JYJNAYRXSA-N 0.000 description 2
- ZUQACJLOHYRVPJ-DKIMLUQUSA-N Phe-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 ZUQACJLOHYRVPJ-DKIMLUQUSA-N 0.000 description 2
- CZQZSMJXFGGBHM-KKUMJFAQSA-N Phe-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O CZQZSMJXFGGBHM-KKUMJFAQSA-N 0.000 description 2
- AFNJAQVMTIQTCB-DLOVCJGASA-N Phe-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 AFNJAQVMTIQTCB-DLOVCJGASA-N 0.000 description 2
- LTAWNJXSRUCFAN-UNQGMJICSA-N Phe-Thr-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LTAWNJXSRUCFAN-UNQGMJICSA-N 0.000 description 2
- MSSXKZBDKZAHCX-UNQGMJICSA-N Phe-Thr-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O MSSXKZBDKZAHCX-UNQGMJICSA-N 0.000 description 2
- GTMSCDVFQLNEOY-BZSNNMDCSA-N Phe-Tyr-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N GTMSCDVFQLNEOY-BZSNNMDCSA-N 0.000 description 2
- AGTHXWTYCLLYMC-FHWLQOOXSA-N Phe-Tyr-Glu Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 AGTHXWTYCLLYMC-FHWLQOOXSA-N 0.000 description 2
- JTKGCYOOJLUETJ-ULQDDVLXSA-N Phe-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JTKGCYOOJLUETJ-ULQDDVLXSA-N 0.000 description 2
- IEIFEYBAYFSRBQ-IHRRRGAJSA-N Phe-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N IEIFEYBAYFSRBQ-IHRRRGAJSA-N 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- FZHBZMDRDASUHN-NAKRPEOUSA-N Pro-Ala-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1)C(O)=O FZHBZMDRDASUHN-NAKRPEOUSA-N 0.000 description 2
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 2
- ZSKJPKFTPQCPIH-RCWTZXSCSA-N Pro-Arg-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSKJPKFTPQCPIH-RCWTZXSCSA-N 0.000 description 2
- ZPPVJIJMIKTERM-YUMQZZPRSA-N Pro-Gln-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)N)NC(=O)[C@@H]1CCCN1 ZPPVJIJMIKTERM-YUMQZZPRSA-N 0.000 description 2
- WGAQWMRJUFQXMF-ZPFDUUQYSA-N Pro-Gln-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WGAQWMRJUFQXMF-ZPFDUUQYSA-N 0.000 description 2
- BBFRBZYKHIKFBX-GMOBBJLQSA-N Pro-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@@H]1CCCN1 BBFRBZYKHIKFBX-GMOBBJLQSA-N 0.000 description 2
- YXHYJEPDKSYPSQ-AVGNSLFASA-N Pro-Leu-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 YXHYJEPDKSYPSQ-AVGNSLFASA-N 0.000 description 2
- CLJLVCYFABNTHP-DCAQKATOSA-N Pro-Leu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O CLJLVCYFABNTHP-DCAQKATOSA-N 0.000 description 2
- GURGCNUWVSDYTP-SRVKXCTJSA-N Pro-Leu-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GURGCNUWVSDYTP-SRVKXCTJSA-N 0.000 description 2
- VGVCNKSUVSZEIE-IHRRRGAJSA-N Pro-Phe-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O VGVCNKSUVSZEIE-IHRRRGAJSA-N 0.000 description 2
- MLKVIVZCFYRTIR-KKUMJFAQSA-N Pro-Phe-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLKVIVZCFYRTIR-KKUMJFAQSA-N 0.000 description 2
- WHNJMTHJGCEKGA-ULQDDVLXSA-N Pro-Phe-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WHNJMTHJGCEKGA-ULQDDVLXSA-N 0.000 description 2
- BUEIYHBJHCDAMI-UFYCRDLUSA-N Pro-Phe-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BUEIYHBJHCDAMI-UFYCRDLUSA-N 0.000 description 2
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 2
- MDAWMJUZHBQTBO-XGEHTFHBSA-N Pro-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@@H]1CCCN1)O MDAWMJUZHBQTBO-XGEHTFHBSA-N 0.000 description 2
- CXGLFEOYCJFKPR-RCWTZXSCSA-N Pro-Thr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O CXGLFEOYCJFKPR-RCWTZXSCSA-N 0.000 description 2
- LZHHZYDPMZEMRX-STQMWFEESA-N Pro-Tyr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O LZHHZYDPMZEMRX-STQMWFEESA-N 0.000 description 2
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 2
- KHRLUIPIMIQFGT-AVGNSLFASA-N Pro-Val-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHRLUIPIMIQFGT-AVGNSLFASA-N 0.000 description 2
- PGSWNLRYYONGPE-JYJNAYRXSA-N Pro-Val-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PGSWNLRYYONGPE-JYJNAYRXSA-N 0.000 description 2
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 2
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 2
- 206010057190 Respiratory tract infections Diseases 0.000 description 2
- 241000283984 Rodentia Species 0.000 description 2
- 108010077895 Sarcosine Proteins 0.000 description 2
- FIXILCYTSAUERA-FXQIFTODSA-N Ser-Ala-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FIXILCYTSAUERA-FXQIFTODSA-N 0.000 description 2
- OOKCGAYXSNJBGQ-ZLUOBGJFSA-N Ser-Asn-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OOKCGAYXSNJBGQ-ZLUOBGJFSA-N 0.000 description 2
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 2
- YMEXHZTVKDAKIY-GHCJXIJMSA-N Ser-Asn-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO)C(O)=O YMEXHZTVKDAKIY-GHCJXIJMSA-N 0.000 description 2
- MMAPOBOTRUVNKJ-ZLUOBGJFSA-N Ser-Asp-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O MMAPOBOTRUVNKJ-ZLUOBGJFSA-N 0.000 description 2
- RFBKULCUBJAQFT-BIIVOSGPSA-N Ser-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CO)N)C(=O)O RFBKULCUBJAQFT-BIIVOSGPSA-N 0.000 description 2
- YPUSXTWURJANKF-KBIXCLLPSA-N Ser-Gln-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YPUSXTWURJANKF-KBIXCLLPSA-N 0.000 description 2
- GYXVUTAOICLGKJ-ACZMJKKPSA-N Ser-Glu-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N GYXVUTAOICLGKJ-ACZMJKKPSA-N 0.000 description 2
- HBTCFCHYALPXME-HTFCKZLJSA-N Ser-Ile-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HBTCFCHYALPXME-HTFCKZLJSA-N 0.000 description 2
- UIPXCLNLUUAMJU-JBDRJPRFSA-N Ser-Ile-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UIPXCLNLUUAMJU-JBDRJPRFSA-N 0.000 description 2
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 2
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 2
- PTWIYDNFWPXQSD-GARJFASQSA-N Ser-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N)C(=O)O PTWIYDNFWPXQSD-GARJFASQSA-N 0.000 description 2
- LRZLZIUXQBIWTB-KATARQTJSA-N Ser-Lys-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRZLZIUXQBIWTB-KATARQTJSA-N 0.000 description 2
- PMCMLDNPAZUYGI-DCAQKATOSA-N Ser-Lys-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMCMLDNPAZUYGI-DCAQKATOSA-N 0.000 description 2
- MHVXPTAMDHLTHB-IHPCNDPISA-N Ser-Phe-Trp Chemical compound C([C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 MHVXPTAMDHLTHB-IHPCNDPISA-N 0.000 description 2
- NUEHQDHDLDXCRU-GUBZILKMSA-N Ser-Pro-Arg Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NUEHQDHDLDXCRU-GUBZILKMSA-N 0.000 description 2
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 2
- SQHKXWODKJDZRC-LKXGYXEUSA-N Ser-Thr-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQHKXWODKJDZRC-LKXGYXEUSA-N 0.000 description 2
- SZRNDHWMVSFPSP-XKBZYTNZSA-N Ser-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N)O SZRNDHWMVSFPSP-XKBZYTNZSA-N 0.000 description 2
- FLMYSKVSDVHLEW-SVSWQMSJSA-N Ser-Thr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLMYSKVSDVHLEW-SVSWQMSJSA-N 0.000 description 2
- QYBRQMLZDDJBSW-AVGNSLFASA-N Ser-Tyr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O QYBRQMLZDDJBSW-AVGNSLFASA-N 0.000 description 2
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 2
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 2
- PXIPVTKHYLBLMZ-UHFFFAOYSA-N Sodium azide Chemical compound [Na+].[N-]=[N+]=[N-] PXIPVTKHYLBLMZ-UHFFFAOYSA-N 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- TYVAWPFQYFPSBR-BFHQHQDPSA-N Thr-Ala-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)NCC(O)=O TYVAWPFQYFPSBR-BFHQHQDPSA-N 0.000 description 2
- TWLMXDWFVNEFFK-FJXKBIBVSA-N Thr-Arg-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O TWLMXDWFVNEFFK-FJXKBIBVSA-N 0.000 description 2
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 2
- YBXMGKCLOPDEKA-NUMRIWBASA-N Thr-Asp-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YBXMGKCLOPDEKA-NUMRIWBASA-N 0.000 description 2
- WLDUCKSCDRIVLJ-NUMRIWBASA-N Thr-Gln-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O WLDUCKSCDRIVLJ-NUMRIWBASA-N 0.000 description 2
- LIXBDERDAGNVAV-XKBZYTNZSA-N Thr-Gln-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O LIXBDERDAGNVAV-XKBZYTNZSA-N 0.000 description 2
- VOHWDZNIESHTFW-XKBZYTNZSA-N Thr-Glu-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N)O VOHWDZNIESHTFW-XKBZYTNZSA-N 0.000 description 2
- KBBRNEDOYWMIJP-KYNKHSRBSA-N Thr-Gly-Thr Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KBBRNEDOYWMIJP-KYNKHSRBSA-N 0.000 description 2
- NCGUQWSJUKYCIT-SZZJOZGLSA-N Thr-His-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O NCGUQWSJUKYCIT-SZZJOZGLSA-N 0.000 description 2
- HOVLHEKTGVIKAP-WDCWCFNPSA-N Thr-Leu-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HOVLHEKTGVIKAP-WDCWCFNPSA-N 0.000 description 2
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 2
- DXPURPNJDFCKKO-RHYQMDGZSA-N Thr-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DXPURPNJDFCKKO-RHYQMDGZSA-N 0.000 description 2
- FDQXPJCLVPFKJW-KJEVXHAQSA-N Thr-Met-Tyr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N)O FDQXPJCLVPFKJW-KJEVXHAQSA-N 0.000 description 2
- WNQJTLATMXYSEL-OEAJRASXSA-N Thr-Phe-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WNQJTLATMXYSEL-OEAJRASXSA-N 0.000 description 2
- VTMGKRABARCZAX-OSUNSFLBSA-N Thr-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O VTMGKRABARCZAX-OSUNSFLBSA-N 0.000 description 2
- KERCOYANYUPLHJ-XGEHTFHBSA-N Thr-Pro-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O KERCOYANYUPLHJ-XGEHTFHBSA-N 0.000 description 2
- STUAPCLEDMKXKL-LKXGYXEUSA-N Thr-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O STUAPCLEDMKXKL-LKXGYXEUSA-N 0.000 description 2
- IVDFVBVIVLJJHR-LKXGYXEUSA-N Thr-Ser-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IVDFVBVIVLJJHR-LKXGYXEUSA-N 0.000 description 2
- NBIIPOKZPUGATB-BWBBJGPYSA-N Thr-Ser-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N)O NBIIPOKZPUGATB-BWBBJGPYSA-N 0.000 description 2
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 description 2
- XZUBGOYOGDRYFC-XGEHTFHBSA-N Thr-Ser-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O XZUBGOYOGDRYFC-XGEHTFHBSA-N 0.000 description 2
- IEZVHOULSUULHD-XGEHTFHBSA-N Thr-Ser-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O IEZVHOULSUULHD-XGEHTFHBSA-N 0.000 description 2
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 2
- CSNBWOJOEOPYIJ-UVOCVTCTSA-N Thr-Thr-Lys Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O CSNBWOJOEOPYIJ-UVOCVTCTSA-N 0.000 description 2
- LECUEEHKUFYOOV-ZJDVBMNYSA-N Thr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)[C@@H](C)O LECUEEHKUFYOOV-ZJDVBMNYSA-N 0.000 description 2
- ZOCJFNXUVSGBQI-HSHDSVGOSA-N Thr-Trp-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O ZOCJFNXUVSGBQI-HSHDSVGOSA-N 0.000 description 2
- LVRFMARKDGGZMX-IZPVPAKOSA-N Thr-Tyr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=C(O)C=C1 LVRFMARKDGGZMX-IZPVPAKOSA-N 0.000 description 2
- KPMIQCXJDVKWKO-IFFSRLJSSA-N Thr-Val-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KPMIQCXJDVKWKO-IFFSRLJSSA-N 0.000 description 2
- DPMVSFFKGNKJLQ-VJBMBRPKSA-N Trp-Glu-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O)N DPMVSFFKGNKJLQ-VJBMBRPKSA-N 0.000 description 2
- UJRIVCPPPMYCNA-HOCLYGCPSA-N Trp-Leu-Gly Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N UJRIVCPPPMYCNA-HOCLYGCPSA-N 0.000 description 2
- RWAYYYOZMHMEGD-XIRDDKMYSA-N Trp-Leu-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 RWAYYYOZMHMEGD-XIRDDKMYSA-N 0.000 description 2
- VUMCLPHXCBIJJB-PMVMPFDFSA-N Trp-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC3=CNC4=CC=CC=C43)N VUMCLPHXCBIJJB-PMVMPFDFSA-N 0.000 description 2
- YCQXZDHDSUHUSG-FJHTZYQYSA-N Trp-Thr-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 YCQXZDHDSUHUSG-FJHTZYQYSA-N 0.000 description 2
- ZPZNQAZHMCLTOA-PXDAIIFMSA-N Trp-Tyr-Ile Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CC=C(O)C=C1 ZPZNQAZHMCLTOA-PXDAIIFMSA-N 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- BURPTJBFWIOHEY-UWJYBYFXSA-N Tyr-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 BURPTJBFWIOHEY-UWJYBYFXSA-N 0.000 description 2
- ADBDQGBDNUTRDB-ULQDDVLXSA-N Tyr-Arg-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O ADBDQGBDNUTRDB-ULQDDVLXSA-N 0.000 description 2
- XHALUUQSNXSPLP-UFYCRDLUSA-N Tyr-Arg-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 XHALUUQSNXSPLP-UFYCRDLUSA-N 0.000 description 2
- QYSBJAUCUKHSLU-JYJNAYRXSA-N Tyr-Arg-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O QYSBJAUCUKHSLU-JYJNAYRXSA-N 0.000 description 2
- LOOCQRRBKZTPKO-AVGNSLFASA-N Tyr-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 LOOCQRRBKZTPKO-AVGNSLFASA-N 0.000 description 2
- IWRMTNJCCMEBEX-AVGNSLFASA-N Tyr-Glu-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N)O IWRMTNJCCMEBEX-AVGNSLFASA-N 0.000 description 2
- CTDPLKMBVALCGN-JSGCOSHPSA-N Tyr-Gly-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O CTDPLKMBVALCGN-JSGCOSHPSA-N 0.000 description 2
- WVGKPKDWYQXWLU-BZSNNMDCSA-N Tyr-His-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CCCCN)C(=O)O)N)O WVGKPKDWYQXWLU-BZSNNMDCSA-N 0.000 description 2
- JJNXZIPLIXIGBX-HJPIBITLSA-N Tyr-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N JJNXZIPLIXIGBX-HJPIBITLSA-N 0.000 description 2
- BYAKMYBZADCNMN-JYJNAYRXSA-N Tyr-Lys-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O BYAKMYBZADCNMN-JYJNAYRXSA-N 0.000 description 2
- SOAUMCDLIUGXJJ-SRVKXCTJSA-N Tyr-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O SOAUMCDLIUGXJJ-SRVKXCTJSA-N 0.000 description 2
- UMSZZGTXGKHTFJ-SRVKXCTJSA-N Tyr-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 UMSZZGTXGKHTFJ-SRVKXCTJSA-N 0.000 description 2
- BXJQKVDPRMLGKN-PMVMPFDFSA-N Tyr-Trp-Leu Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(O)=O)C1=CC=C(O)C=C1 BXJQKVDPRMLGKN-PMVMPFDFSA-N 0.000 description 2
- AFWXOGHZEKARFH-ACRUOGEOSA-N Tyr-Tyr-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=C(O)C=C1 AFWXOGHZEKARFH-ACRUOGEOSA-N 0.000 description 2
- KHPLUFDSWGDRHD-SLFFLAALSA-N Tyr-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O KHPLUFDSWGDRHD-SLFFLAALSA-N 0.000 description 2
- OBKOPLHSRDATFO-XHSDSOJGSA-N Tyr-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OBKOPLHSRDATFO-XHSDSOJGSA-N 0.000 description 2
- 206010046865 Vaccinia virus infection Diseases 0.000 description 2
- LNYOXPDEIZJDEI-NHCYSSNCSA-N Val-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N LNYOXPDEIZJDEI-NHCYSSNCSA-N 0.000 description 2
- QGFPYRPIUXBYGR-YDHLFZDLSA-N Val-Asn-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N QGFPYRPIUXBYGR-YDHLFZDLSA-N 0.000 description 2
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 2
- TZVUSFMQWPWHON-NHCYSSNCSA-N Val-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N TZVUSFMQWPWHON-NHCYSSNCSA-N 0.000 description 2
- HHSILIQTHXABKM-YDHLFZDLSA-N Val-Asp-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](Cc1ccccc1)C(O)=O HHSILIQTHXABKM-YDHLFZDLSA-N 0.000 description 2
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 2
- KOPBYUSPXBQIHD-NRPADANISA-N Val-Cys-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KOPBYUSPXBQIHD-NRPADANISA-N 0.000 description 2
- FPCIBLUVDNXPJO-XPUUQOCRSA-N Val-Cys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O FPCIBLUVDNXPJO-XPUUQOCRSA-N 0.000 description 2
- CVIXTAITYJQMPE-LAEOZQHASA-N Val-Glu-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CVIXTAITYJQMPE-LAEOZQHASA-N 0.000 description 2
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 2
- WNZSAUMKZQXHNC-UKJIMTQDSA-N Val-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N WNZSAUMKZQXHNC-UKJIMTQDSA-N 0.000 description 2
- SDUBQHUJJWQTEU-XUXIUFHCSA-N Val-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C(C)C)N SDUBQHUJJWQTEU-XUXIUFHCSA-N 0.000 description 2
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 2
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 2
- NZGOVKLVQNOEKP-YDHLFZDLSA-N Val-Phe-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NZGOVKLVQNOEKP-YDHLFZDLSA-N 0.000 description 2
- MHHAWNPHDLCPLF-ULQDDVLXSA-N Val-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 MHHAWNPHDLCPLF-ULQDDVLXSA-N 0.000 description 2
- MJOUSKQHAIARKI-JYJNAYRXSA-N Val-Phe-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 MJOUSKQHAIARKI-JYJNAYRXSA-N 0.000 description 2
- UGFMVXRXULGLNO-XPUUQOCRSA-N Val-Ser-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O UGFMVXRXULGLNO-XPUUQOCRSA-N 0.000 description 2
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 2
- UQMPYVLTQCGRSK-IFFSRLJSSA-N Val-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N)O UQMPYVLTQCGRSK-IFFSRLJSSA-N 0.000 description 2
- JAIZPWVHPQRYOU-ZJDVBMNYSA-N Val-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O JAIZPWVHPQRYOU-ZJDVBMNYSA-N 0.000 description 2
- 108010003533 Viral Envelope Proteins Proteins 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 239000004480 active ingredient Substances 0.000 description 2
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 108010008355 arginyl-glutamine Proteins 0.000 description 2
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 2
- 108010036533 arginylvaline Proteins 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 230000000740 bleeding effect Effects 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 210000000234 capsid Anatomy 0.000 description 2
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 2
- 238000007385 chemical modification Methods 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 235000013330 chicken meat Nutrition 0.000 description 2
- PMMYEEVYMWASQN-IMJSIDKUSA-N cis-4-Hydroxy-L-proline Chemical compound O[C@@H]1CN[C@H](C(O)=O)C1 PMMYEEVYMWASQN-IMJSIDKUSA-N 0.000 description 2
- 235000018417 cysteine Nutrition 0.000 description 2
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 2
- 230000002939 deleterious effect Effects 0.000 description 2
- 238000010790 dilution Methods 0.000 description 2
- 239000012895 dilution Substances 0.000 description 2
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 2
- 108010054813 diprotin B Proteins 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 238000010494 dissociation reaction Methods 0.000 description 2
- 230000005593 dissociations Effects 0.000 description 2
- 239000003797 essential amino acid Substances 0.000 description 2
- 235000020776 essential amino acid Nutrition 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 235000019688 fish Nutrition 0.000 description 2
- BTCSSZJGUNDROE-UHFFFAOYSA-N gamma-aminobutyric acid Chemical compound NCCCC(O)=O BTCSSZJGUNDROE-UHFFFAOYSA-N 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 108010049041 glutamylalanine Proteins 0.000 description 2
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 108010040030 histidinoalanine Proteins 0.000 description 2
- 108010092114 histidylphenylalanine Proteins 0.000 description 2
- 210000004408 hybridoma Anatomy 0.000 description 2
- 229960002591 hydroxyproline Drugs 0.000 description 2
- 230000005847 immunogenicity Effects 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 238000002347 injection Methods 0.000 description 2
- 239000007924 injection Substances 0.000 description 2
- 238000001990 intravenous administration Methods 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- HXEACLLIILLPRG-RXMQYKEDSA-N l-pipecolic acid Natural products OC(=O)[C@H]1CCCCN1 HXEACLLIILLPRG-RXMQYKEDSA-N 0.000 description 2
- 108010000761 leucylarginine Proteins 0.000 description 2
- 108010012058 leucyltyrosine Proteins 0.000 description 2
- 244000144972 livestock Species 0.000 description 2
- HQKMJHAJHXVSDF-UHFFFAOYSA-L magnesium stearate Chemical compound [Mg+2].CCCCCCCCCCCCCCCCCC([O-])=O.CCCCCCCCCCCCCCCCCC([O-])=O HQKMJHAJHXVSDF-UHFFFAOYSA-L 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 210000004779 membrane envelope Anatomy 0.000 description 2
- 230000034217 membrane fusion Effects 0.000 description 2
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 230000037434 nonsense mutation Effects 0.000 description 2
- 108010084572 phenylalanyl-valine Proteins 0.000 description 2
- 230000003449 preventive effect Effects 0.000 description 2
- 210000001236 prokaryotic cell Anatomy 0.000 description 2
- 108010093296 prolyl-prolyl-alanine Proteins 0.000 description 2
- 108010004914 prolylarginine Proteins 0.000 description 2
- 108010070643 prolylglutamic acid Proteins 0.000 description 2
- 108010053725 prolylvaline Proteins 0.000 description 2
- 230000012846 protein folding Effects 0.000 description 2
- 230000012743 protein tagging Effects 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 230000003362 replicative effect Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 210000002966 serum Anatomy 0.000 description 2
- 108010071207 serylmethionine Proteins 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 238000004114 suspension culture Methods 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- NPDBDJFLKKQMCM-UHFFFAOYSA-N tert-butylglycine Chemical compound CC(C)(C)C(N)C(O)=O NPDBDJFLKKQMCM-UHFFFAOYSA-N 0.000 description 2
- 229940124597 therapeutic agent Drugs 0.000 description 2
- UMGDCJDMYOKAJW-UHFFFAOYSA-N thiourea Chemical compound NC(N)=S UMGDCJDMYOKAJW-UHFFFAOYSA-N 0.000 description 2
- GETQZCLCWQTVFV-UHFFFAOYSA-N trimethylamine Chemical compound CN(C)C GETQZCLCWQTVFV-UHFFFAOYSA-N 0.000 description 2
- 108010038745 tryptophylglycine Proteins 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- 108010003137 tyrosyltyrosine Proteins 0.000 description 2
- 208000007089 vaccinia Diseases 0.000 description 2
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- OGNSCSPNOLGXSM-UHFFFAOYSA-N (+/-)-DABA Natural products NCCC(N)C(O)=O OGNSCSPNOLGXSM-UHFFFAOYSA-N 0.000 description 1
- GJLXVWOMRRWCIB-MERZOTPQSA-N (2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-acetamido-5-(diaminomethylideneamino)pentanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanamide Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=C(O)C=C1 GJLXVWOMRRWCIB-MERZOTPQSA-N 0.000 description 1
- SEFSGUQSMFDYPA-YFKPBYRVSA-N (2r)-2-(difluoroamino)-2-fluoro-3-methylbutanoic acid Chemical compound CC(C)[C@](F)(N(F)F)C(O)=O SEFSGUQSMFDYPA-YFKPBYRVSA-N 0.000 description 1
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 1
- BVAUMRCGVHUWOZ-ZETCQYMHSA-N (2s)-2-(cyclohexylazaniumyl)propanoate Chemical compound OC(=O)[C@H](C)NC1CCCCC1 BVAUMRCGVHUWOZ-ZETCQYMHSA-N 0.000 description 1
- LEVLUBIPMJQYHH-QMMMGPOBSA-N (2s)-2-(difluoroamino)-3-phenylpropanoic acid Chemical compound OC(=O)[C@@H](N(F)F)CC1=CC=CC=C1 LEVLUBIPMJQYHH-QMMMGPOBSA-N 0.000 description 1
- IYKLZBIWFXPUCS-VIFPVBQESA-N (2s)-2-(naphthalen-1-ylamino)propanoic acid Chemical compound C1=CC=C2C(N[C@@H](C)C(O)=O)=CC=CC2=C1 IYKLZBIWFXPUCS-VIFPVBQESA-N 0.000 description 1
- WTKYBFQVZPCGAO-LURJTMIESA-N (2s)-2-(pyridin-3-ylamino)propanoic acid Chemical compound OC(=O)[C@H](C)NC1=CC=CN=C1 WTKYBFQVZPCGAO-LURJTMIESA-N 0.000 description 1
- SAAQPSNNIOGFSQ-LURJTMIESA-N (2s)-2-(pyridin-4-ylamino)propanoic acid Chemical compound OC(=O)[C@H](C)NC1=CC=NC=C1 SAAQPSNNIOGFSQ-LURJTMIESA-N 0.000 description 1
- NPDBDJFLKKQMCM-SCSAIBSYSA-N (2s)-2-amino-3,3-dimethylbutanoic acid Chemical compound CC(C)(C)[C@H](N)C(O)=O NPDBDJFLKKQMCM-SCSAIBSYSA-N 0.000 description 1
- DFZVZEMNPGABKO-ZETCQYMHSA-N (2s)-2-amino-3-pyridin-3-ylpropanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=CN=C1 DFZVZEMNPGABKO-ZETCQYMHSA-N 0.000 description 1
- WAMWSIDTKSNDCU-ZETCQYMHSA-N (2s)-2-azaniumyl-2-cyclohexylacetate Chemical compound OC(=O)[C@@H](N)C1CCCCC1 WAMWSIDTKSNDCU-ZETCQYMHSA-N 0.000 description 1
- MNZLMQYCEWHPPS-REOHCLBHSA-N (2s)-2-azaniumyl-5,5,5-trifluoro-4-(trifluoromethyl)pentanoate Chemical compound OC(=O)[C@@H](N)CC(C(F)(F)F)C(F)(F)F MNZLMQYCEWHPPS-REOHCLBHSA-N 0.000 description 1
- FXGZFWDCXQRZKI-VKHMYHEASA-N (2s)-5-amino-2-nitramido-5-oxopentanoic acid Chemical compound NC(=O)CC[C@@H](C(O)=O)N[N+]([O-])=O FXGZFWDCXQRZKI-VKHMYHEASA-N 0.000 description 1
- CQYBNXGHMBNGCG-FXQIFTODSA-N (2s,3as,7as)-2,3,3a,4,5,6,7,7a-octahydro-1h-indol-1-ium-2-carboxylate Chemical compound C1CCC[C@@H]2[NH2+][C@H](C(=O)[O-])C[C@@H]21 CQYBNXGHMBNGCG-FXQIFTODSA-N 0.000 description 1
- CCAIIPMIAFGKSI-DMTCNVIQSA-N (2s,3r)-3-hydroxy-2-(methylazaniumyl)butanoate Chemical compound CN[C@@H]([C@@H](C)O)C(O)=O CCAIIPMIAFGKSI-DMTCNVIQSA-N 0.000 description 1
- CNPSFBUUYIVHAP-WHFBIAKZSA-N (2s,3s)-3-methylpyrrolidin-1-ium-2-carboxylate Chemical compound C[C@H]1CCN[C@@H]1C(O)=O CNPSFBUUYIVHAP-WHFBIAKZSA-N 0.000 description 1
- LJRDOKAZOAKLDU-UDXJMMFXSA-N (2s,3s,4r,5r,6r)-5-amino-2-(aminomethyl)-6-[(2r,3s,4r,5s)-5-[(1r,2r,3s,5r,6s)-3,5-diamino-2-[(2s,3r,4r,5s,6r)-3-amino-4,5-dihydroxy-6-(hydroxymethyl)oxan-2-yl]oxy-6-hydroxycyclohexyl]oxy-4-hydroxy-2-(hydroxymethyl)oxolan-3-yl]oxyoxane-3,4-diol;sulfuric ac Chemical compound OS(O)(=O)=O.N[C@@H]1[C@@H](O)[C@H](O)[C@H](CN)O[C@@H]1O[C@H]1[C@@H](O)[C@H](O[C@H]2[C@@H]([C@@H](N)C[C@@H](N)[C@@H]2O)O[C@@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O2)N)O[C@@H]1CO LJRDOKAZOAKLDU-UDXJMMFXSA-N 0.000 description 1
- YHQZWWDVLJPRIF-JLHRHDQISA-N (4R)-4-[[(2S,3R)-2-[acetyl-[(3R,4R,5S,6R)-3-amino-4-[(1R)-1-carboxyethoxy]-5-hydroxy-6-(hydroxymethyl)oxan-2-yl]amino]-3-hydroxybutanoyl]amino]-5-amino-5-oxopentanoic acid Chemical compound C(C)(=O)N([C@@H]([C@H](O)C)C(=O)N[C@H](CCC(=O)O)C(N)=O)C1[C@H](N)[C@@H](O[C@@H](C(=O)O)C)[C@H](O)[C@H](O1)CO YHQZWWDVLJPRIF-JLHRHDQISA-N 0.000 description 1
- OVKKNJPJQKTXIT-JLNKQSITSA-N (5Z,8Z,11Z,14Z,17Z)-icosapentaenoylethanolamine Chemical compound CC\C=C/C\C=C/C\C=C/C\C=C/C\C=C/CCCC(=O)NCCO OVKKNJPJQKTXIT-JLNKQSITSA-N 0.000 description 1
- XJLSEXAGTJCILF-RXMQYKEDSA-N (R)-nipecotic acid zwitterion Chemical compound OC(=O)[C@@H]1CCCNC1 XJLSEXAGTJCILF-RXMQYKEDSA-N 0.000 description 1
- TYAFIFFKPSWZRM-HYXAFXHYSA-N (z)-2-amino-4-methylpent-2-enoic acid Chemical compound CC(C)\C=C(/N)C(O)=O TYAFIFFKPSWZRM-HYXAFXHYSA-N 0.000 description 1
- OXFGRWIKQDSSLY-UHFFFAOYSA-N 1,2,3,4-tetrahydroisoquinolin-2-ium-1-carboxylate Chemical compound C1=CC=C2C(C(=O)O)NCCC2=C1 OXFGRWIKQDSSLY-UHFFFAOYSA-N 0.000 description 1
- BWKMGYQJPOAASG-UHFFFAOYSA-N 1,2,3,4-tetrahydroisoquinoline-3-carboxylic acid Chemical compound C1=CC=C2CNC(C(=O)O)CC2=C1 BWKMGYQJPOAASG-UHFFFAOYSA-N 0.000 description 1
- KJUGUADJHNHALS-UHFFFAOYSA-N 1H-tetrazole Substances C=1N=NNN=1 KJUGUADJHNHALS-UHFFFAOYSA-N 0.000 description 1
- KIPSRYDSZQRPEA-UHFFFAOYSA-N 2,2,2-trifluoroethanamine Chemical compound NCC(F)(F)F KIPSRYDSZQRPEA-UHFFFAOYSA-N 0.000 description 1
- BLCJBICVQSYOIF-UHFFFAOYSA-N 2,2-diaminobutanoic acid Chemical compound CCC(N)(N)C(O)=O BLCJBICVQSYOIF-UHFFFAOYSA-N 0.000 description 1
- MIJDSYMOBYNHOT-UHFFFAOYSA-N 2-(ethylamino)ethanol Chemical compound CCNCCO MIJDSYMOBYNHOT-UHFFFAOYSA-N 0.000 description 1
- TXHAHOVNFDVCCC-UHFFFAOYSA-N 2-(tert-butylazaniumyl)acetate Chemical compound CC(C)(C)NCC(O)=O TXHAHOVNFDVCCC-UHFFFAOYSA-N 0.000 description 1
- QWCKQJZIFLGMSD-UHFFFAOYSA-N 2-Aminobutanoic acid Natural products CCC(N)C(O)=O QWCKQJZIFLGMSD-UHFFFAOYSA-N 0.000 description 1
- WEZDRVHTDXTVLT-GJZGRUSLSA-N 2-[[(2s)-2-[[(2s)-2-[(2-aminoacetyl)amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]acetic acid Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 WEZDRVHTDXTVLT-GJZGRUSLSA-N 0.000 description 1
- CXOWHCCVISNMIX-UHFFFAOYSA-N 2-aminonaphthalene-1-carboxylic acid Chemical compound C1=CC=CC2=C(C(O)=O)C(N)=CC=C21 CXOWHCCVISNMIX-UHFFFAOYSA-N 0.000 description 1
- KWOMLHIFHFWBSB-UHFFFAOYSA-N 2-azaniumyl-2-ethylbutanoate Chemical compound CCC(N)(CC)C(O)=O KWOMLHIFHFWBSB-UHFFFAOYSA-N 0.000 description 1
- WTOFYLAWDLQMBZ-UHFFFAOYSA-N 2-azaniumyl-3-thiophen-2-ylpropanoate Chemical compound OC(=O)C(N)CC1=CC=CS1 WTOFYLAWDLQMBZ-UHFFFAOYSA-N 0.000 description 1
- XEVFXAFXZZYFSX-UHFFFAOYSA-N 3-azabicyclo[2.1.1]hexane-4-carboxylic acid Chemical compound C1C2CC1(C(=O)O)NC2 XEVFXAFXZZYFSX-UHFFFAOYSA-N 0.000 description 1
- BXRLWGXPSRYJDZ-UHFFFAOYSA-N 3-cyanoalanine Chemical compound OC(=O)C(N)CC#N BXRLWGXPSRYJDZ-UHFFFAOYSA-N 0.000 description 1
- CMUHFUGDYMFHEI-QMMMGPOBSA-N 4-amino-L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(N)C=C1 CMUHFUGDYMFHEI-QMMMGPOBSA-N 0.000 description 1
- ALYNCZNDIQEVRV-UHFFFAOYSA-N 4-aminobenzoic acid Chemical compound NC1=CC=C(C(O)=O)C=C1 ALYNCZNDIQEVRV-UHFFFAOYSA-N 0.000 description 1
- XWHHYOYVRVGJJY-QMMMGPOBSA-N 4-fluoro-L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(F)C=C1 XWHHYOYVRVGJJY-QMMMGPOBSA-N 0.000 description 1
- XWHHYOYVRVGJJY-UHFFFAOYSA-N 4-fluorophenylalanine Chemical compound OC(=O)C(N)CC1=CC=C(F)C=C1 XWHHYOYVRVGJJY-UHFFFAOYSA-N 0.000 description 1
- YTWPGUQMZQRYGM-UHFFFAOYSA-N 7-hydroxy-1,2,3,4-tetrahydroisoquinoline-1-carboxylic acid Chemical compound C1=C(O)C=C2C(C(=O)O)NCCC2=C1 YTWPGUQMZQRYGM-UHFFFAOYSA-N 0.000 description 1
- 239000013607 AAV vector Substances 0.000 description 1
- 206010069754 Acquired gene mutation Diseases 0.000 description 1
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 1
- KVWLTGNCJYDJET-LSJOCFKGSA-N Ala-Arg-His Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KVWLTGNCJYDJET-LSJOCFKGSA-N 0.000 description 1
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 1
- JAMAWBXXKFGFGX-KZVJFYERSA-N Ala-Arg-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JAMAWBXXKFGFGX-KZVJFYERSA-N 0.000 description 1
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 1
- XQGIRPGAVLFKBJ-CIUDSAMLSA-N Ala-Asn-Lys Chemical compound N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)O XQGIRPGAVLFKBJ-CIUDSAMLSA-N 0.000 description 1
- IKKVASZHTMKJIR-ZKWXMUAHSA-N Ala-Asp-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IKKVASZHTMKJIR-ZKWXMUAHSA-N 0.000 description 1
- DECCMEWNXSNSDO-ZLUOBGJFSA-N Ala-Cys-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O DECCMEWNXSNSDO-ZLUOBGJFSA-N 0.000 description 1
- MIPWEZAIMPYQST-FXQIFTODSA-N Ala-Cys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O MIPWEZAIMPYQST-FXQIFTODSA-N 0.000 description 1
- AWAXZRDKUHOPBO-GUBZILKMSA-N Ala-Gln-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O AWAXZRDKUHOPBO-GUBZILKMSA-N 0.000 description 1
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 1
- GGNHBHYDMUDXQB-KBIXCLLPSA-N Ala-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)N GGNHBHYDMUDXQB-KBIXCLLPSA-N 0.000 description 1
- LMFXXZPPZDCPTA-ZKWXMUAHSA-N Ala-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N LMFXXZPPZDCPTA-ZKWXMUAHSA-N 0.000 description 1
- QHASENCZLDHBGX-ONGXEEELSA-N Ala-Gly-Phe Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QHASENCZLDHBGX-ONGXEEELSA-N 0.000 description 1
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 1
- LXAARTARZJJCMB-CIQUZCHMSA-N Ala-Ile-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LXAARTARZJJCMB-CIQUZCHMSA-N 0.000 description 1
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 1
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 1
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 1
- XRUJOVRWNMBAAA-NHCYSSNCSA-N Ala-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 XRUJOVRWNMBAAA-NHCYSSNCSA-N 0.000 description 1
- SYIFFFHSXBNPMC-UWJYBYFXSA-N Ala-Ser-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N SYIFFFHSXBNPMC-UWJYBYFXSA-N 0.000 description 1
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 1
- XQNRANMFRPCFFW-GCJQMDKQSA-N Ala-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C)N)O XQNRANMFRPCFFW-GCJQMDKQSA-N 0.000 description 1
- QOIGKCBMXUCDQU-KDXUFGMBSA-N Ala-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N)O QOIGKCBMXUCDQU-KDXUFGMBSA-N 0.000 description 1
- KTXKIYXZQFWJKB-VZFHVOOUSA-N Ala-Thr-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O KTXKIYXZQFWJKB-VZFHVOOUSA-N 0.000 description 1
- MTDDMSUUXNQMKK-BPNCWPANSA-N Ala-Tyr-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N MTDDMSUUXNQMKK-BPNCWPANSA-N 0.000 description 1
- MUGAESARFRGOTQ-IGNZVWTISA-N Ala-Tyr-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N MUGAESARFRGOTQ-IGNZVWTISA-N 0.000 description 1
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 102000009027 Albumins Human genes 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- VHUUQVKOLVNVRT-UHFFFAOYSA-N Ammonium hydroxide Chemical compound [NH4+].[OH-] VHUUQVKOLVNVRT-UHFFFAOYSA-N 0.000 description 1
- GIVATXIGCXFQQA-FXQIFTODSA-N Arg-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N GIVATXIGCXFQQA-FXQIFTODSA-N 0.000 description 1
- JCAISGGAOQXEHJ-ZPFDUUQYSA-N Arg-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N JCAISGGAOQXEHJ-ZPFDUUQYSA-N 0.000 description 1
- SKTGPBFTMNLIHQ-KKUMJFAQSA-N Arg-Glu-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SKTGPBFTMNLIHQ-KKUMJFAQSA-N 0.000 description 1
- VRZDJJWOFXMFRO-ZFWWWQNUSA-N Arg-Gly-Trp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O VRZDJJWOFXMFRO-ZFWWWQNUSA-N 0.000 description 1
- MSILNNHVVMMTHZ-UWVGGRQHSA-N Arg-His-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CN=CN1 MSILNNHVVMMTHZ-UWVGGRQHSA-N 0.000 description 1
- CLICCYPMVFGUOF-IHRRRGAJSA-N Arg-Lys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O CLICCYPMVFGUOF-IHRRRGAJSA-N 0.000 description 1
- BTJVOUQWFXABOI-IHRRRGAJSA-N Arg-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCNC(N)=N BTJVOUQWFXABOI-IHRRRGAJSA-N 0.000 description 1
- GRRXPUAICOGISM-RWMBFGLXSA-N Arg-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O GRRXPUAICOGISM-RWMBFGLXSA-N 0.000 description 1
- NPAVRDPEFVKELR-DCAQKATOSA-N Arg-Lys-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NPAVRDPEFVKELR-DCAQKATOSA-N 0.000 description 1
- FKQITMVNILRUCQ-IHRRRGAJSA-N Arg-Phe-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O FKQITMVNILRUCQ-IHRRRGAJSA-N 0.000 description 1
- SLQQPJBDBVPVQV-JYJNAYRXSA-N Arg-Phe-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O SLQQPJBDBVPVQV-JYJNAYRXSA-N 0.000 description 1
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 1
- ISVACHFCVRKIDG-SRVKXCTJSA-N Arg-Val-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O ISVACHFCVRKIDG-SRVKXCTJSA-N 0.000 description 1
- CGXQUULXFWRJOI-SRVKXCTJSA-N Arg-Val-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O CGXQUULXFWRJOI-SRVKXCTJSA-N 0.000 description 1
- HZPSDHRYYIORKR-WHFBIAKZSA-N Asn-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O HZPSDHRYYIORKR-WHFBIAKZSA-N 0.000 description 1
- VDCIPFYVCICPEC-FXQIFTODSA-N Asn-Arg-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O VDCIPFYVCICPEC-FXQIFTODSA-N 0.000 description 1
- SQZIAWGBBUSSPJ-ZKWXMUAHSA-N Asn-Cys-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)N)N SQZIAWGBBUSSPJ-ZKWXMUAHSA-N 0.000 description 1
- SRUUBQBAVNQZGJ-LAEOZQHASA-N Asn-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N SRUUBQBAVNQZGJ-LAEOZQHASA-N 0.000 description 1
- XVAPVJNJGLWGCS-ACZMJKKPSA-N Asn-Glu-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N XVAPVJNJGLWGCS-ACZMJKKPSA-N 0.000 description 1
- PNHQRQTVBRDIEF-CIUDSAMLSA-N Asn-Leu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(=O)N)N PNHQRQTVBRDIEF-CIUDSAMLSA-N 0.000 description 1
- NLRJGXZWTKXRHP-DCAQKATOSA-N Asn-Leu-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NLRJGXZWTKXRHP-DCAQKATOSA-N 0.000 description 1
- BXUHCIXDSWRSBS-CIUDSAMLSA-N Asn-Leu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BXUHCIXDSWRSBS-CIUDSAMLSA-N 0.000 description 1
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 1
- YVXRYLVELQYAEQ-SRVKXCTJSA-N Asn-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N YVXRYLVELQYAEQ-SRVKXCTJSA-N 0.000 description 1
- LZLCLRQMUQWUHJ-GUBZILKMSA-N Asn-Lys-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N LZLCLRQMUQWUHJ-GUBZILKMSA-N 0.000 description 1
- JWKDQOORUCYUIW-ZPFDUUQYSA-N Asn-Lys-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JWKDQOORUCYUIW-ZPFDUUQYSA-N 0.000 description 1
- ZYPWIUFLYMQZBS-SRVKXCTJSA-N Asn-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZYPWIUFLYMQZBS-SRVKXCTJSA-N 0.000 description 1
- PPCORQFLAZWUNO-QWRGUYRKSA-N Asn-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N PPCORQFLAZWUNO-QWRGUYRKSA-N 0.000 description 1
- BKFXFUPYETWGGA-XVSYOHENSA-N Asn-Phe-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BKFXFUPYETWGGA-XVSYOHENSA-N 0.000 description 1
- JWQWPRCDYWNVNM-ACZMJKKPSA-N Asn-Ser-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N JWQWPRCDYWNVNM-ACZMJKKPSA-N 0.000 description 1
- VLDRQOHCMKCXLY-SRVKXCTJSA-N Asn-Ser-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VLDRQOHCMKCXLY-SRVKXCTJSA-N 0.000 description 1
- NCXTYSVDWLAQGZ-ZKWXMUAHSA-N Asn-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O NCXTYSVDWLAQGZ-ZKWXMUAHSA-N 0.000 description 1
- HPASIOLTWSNMFB-OLHMAJIHSA-N Asn-Thr-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O HPASIOLTWSNMFB-OLHMAJIHSA-N 0.000 description 1
- AMGQTNHANMRPOE-LKXGYXEUSA-N Asn-Thr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O AMGQTNHANMRPOE-LKXGYXEUSA-N 0.000 description 1
- CBWCQCANJSGUOH-ZKWXMUAHSA-N Asn-Val-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O CBWCQCANJSGUOH-ZKWXMUAHSA-N 0.000 description 1
- JZLFYAAGGYMRIK-BYULHYEWSA-N Asn-Val-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O JZLFYAAGGYMRIK-BYULHYEWSA-N 0.000 description 1
- PQKSVQSMTHPRIB-ZKWXMUAHSA-N Asn-Val-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O PQKSVQSMTHPRIB-ZKWXMUAHSA-N 0.000 description 1
- HPNDBHLITCHRSO-WHFBIAKZSA-N Asp-Ala-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)NCC(O)=O HPNDBHLITCHRSO-WHFBIAKZSA-N 0.000 description 1
- RDRMWJBLOSRRAW-BYULHYEWSA-N Asp-Asn-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O RDRMWJBLOSRRAW-BYULHYEWSA-N 0.000 description 1
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 1
- HRGGPWBIMIQANI-GUBZILKMSA-N Asp-Gln-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HRGGPWBIMIQANI-GUBZILKMSA-N 0.000 description 1
- UFAQGGZUXVLONR-AVGNSLFASA-N Asp-Gln-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N)O UFAQGGZUXVLONR-AVGNSLFASA-N 0.000 description 1
- LTXGDRFJRZSZAV-CIUDSAMLSA-N Asp-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N LTXGDRFJRZSZAV-CIUDSAMLSA-N 0.000 description 1
- PGUYEUCYVNZGGV-QWRGUYRKSA-N Asp-Gly-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PGUYEUCYVNZGGV-QWRGUYRKSA-N 0.000 description 1
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 1
- CMBDUPIBCOEWNE-BJDJZHNGSA-N Asp-Leu-Asp-Gln Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CMBDUPIBCOEWNE-BJDJZHNGSA-N 0.000 description 1
- RPUYTJJZXQBWDT-SRVKXCTJSA-N Asp-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N RPUYTJJZXQBWDT-SRVKXCTJSA-N 0.000 description 1
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 1
- OFYVKOXTTDCUIL-FXQIFTODSA-N Asp-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N OFYVKOXTTDCUIL-FXQIFTODSA-N 0.000 description 1
- OZBXOELNJBSJOA-UBHSHLNASA-N Asp-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N OZBXOELNJBSJOA-UBHSHLNASA-N 0.000 description 1
- NAAAPCLFJPURAM-HJGDQZAQSA-N Asp-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O NAAAPCLFJPURAM-HJGDQZAQSA-N 0.000 description 1
- JDDYEZGPYBBPBN-JRQIVUDYSA-N Asp-Thr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JDDYEZGPYBBPBN-JRQIVUDYSA-N 0.000 description 1
- ITGFVUYOLWBPQW-KKHAAJSZSA-N Asp-Thr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O ITGFVUYOLWBPQW-KKHAAJSZSA-N 0.000 description 1
- NVXLFIPTHPKSKL-UBHSHLNASA-N Asp-Trp-Asn Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(O)=O)N)C(=O)N[C@@H](CC(N)=O)C(O)=O)=CNC2=C1 NVXLFIPTHPKSKL-UBHSHLNASA-N 0.000 description 1
- BYLPQJAWXJWUCJ-YDHLFZDLSA-N Asp-Tyr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O BYLPQJAWXJWUCJ-YDHLFZDLSA-N 0.000 description 1
- 241000282672 Ateles sp. Species 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 238000011725 BALB/c mouse Methods 0.000 description 1
- 241000112287 Bat coronavirus Species 0.000 description 1
- 241000157302 Bison bison athabascae Species 0.000 description 1
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 1
- 108090000565 Capsid Proteins Proteins 0.000 description 1
- KXDHJXZQYSOELW-UHFFFAOYSA-M Carbamate Chemical compound NC([O-])=O KXDHJXZQYSOELW-UHFFFAOYSA-M 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 102100023321 Ceruloplasmin Human genes 0.000 description 1
- 229940124957 Cervarix Drugs 0.000 description 1
- 241000282994 Cervidae Species 0.000 description 1
- 241000288673 Chiroptera Species 0.000 description 1
- 241000251730 Chondrichthyes Species 0.000 description 1
- 241000193403 Clostridium Species 0.000 description 1
- 206010010071 Coma Diseases 0.000 description 1
- 241000004175 Coronavirinae Species 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- 241000699802 Cricetulus griseus Species 0.000 description 1
- PKNIZMPLMSKROD-BIIVOSGPSA-N Cys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N PKNIZMPLMSKROD-BIIVOSGPSA-N 0.000 description 1
- PRXCTTWKGJAPMT-ZLUOBGJFSA-N Cys-Ala-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O PRXCTTWKGJAPMT-ZLUOBGJFSA-N 0.000 description 1
- DEVDFMRWZASYOF-ZLUOBGJFSA-N Cys-Asn-Asp Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DEVDFMRWZASYOF-ZLUOBGJFSA-N 0.000 description 1
- VKAWJBQTFCBHQY-GUBZILKMSA-N Cys-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CS)N VKAWJBQTFCBHQY-GUBZILKMSA-N 0.000 description 1
- HHABWQIFXZPZCK-ACZMJKKPSA-N Cys-Gln-Ser Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N HHABWQIFXZPZCK-ACZMJKKPSA-N 0.000 description 1
- VIRYODQIWJNWNU-NRPADANISA-N Cys-Glu-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CS)N VIRYODQIWJNWNU-NRPADANISA-N 0.000 description 1
- OXFOKRAFNYSREH-BJDJZHNGSA-N Cys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CS)N OXFOKRAFNYSREH-BJDJZHNGSA-N 0.000 description 1
- XXDATQFUGMAJRV-XIRDDKMYSA-N Cys-Leu-Trp Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O XXDATQFUGMAJRV-XIRDDKMYSA-N 0.000 description 1
- XMVZMBGFIOQONW-GARJFASQSA-N Cys-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CS)N)C(=O)O XMVZMBGFIOQONW-GARJFASQSA-N 0.000 description 1
- KSMSFCBQBQPFAD-GUBZILKMSA-N Cys-Pro-Pro Chemical compound SC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 KSMSFCBQBQPFAD-GUBZILKMSA-N 0.000 description 1
- JTEGHEWKBCTIAL-IXOXFDKPSA-N Cys-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CS)N)O JTEGHEWKBCTIAL-IXOXFDKPSA-N 0.000 description 1
- WTXCNOPZMQRTNN-BWBBJGPYSA-N Cys-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N)O WTXCNOPZMQRTNN-BWBBJGPYSA-N 0.000 description 1
- BUAUGQJXGNRTQE-AAEUAGOBSA-N Cys-Trp-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CS)N BUAUGQJXGNRTQE-AAEUAGOBSA-N 0.000 description 1
- PNEAWXSKCKCHDK-XIRDDKMYSA-N Cys-Trp-His Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CS)N)C(O)=O)C1=CN=CN1 PNEAWXSKCKCHDK-XIRDDKMYSA-N 0.000 description 1
- HPZAJRPYUIHDIN-BZSNNMDCSA-N Cys-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CS)N HPZAJRPYUIHDIN-BZSNNMDCSA-N 0.000 description 1
- WVWRADGCZPIJJR-IHRRRGAJSA-N Cys-Val-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CS)N WVWRADGCZPIJJR-IHRRRGAJSA-N 0.000 description 1
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 1
- QWCKQJZIFLGMSD-GSVOUGTGSA-N D-alpha-aminobutyric acid Chemical compound CC[C@@H](N)C(O)=O QWCKQJZIFLGMSD-GSVOUGTGSA-N 0.000 description 1
- 150000008574 D-amino acids Chemical class 0.000 description 1
- VVNCNSJFMMFHPL-VKHMYHEASA-N D-penicillamine Chemical compound CC(C)(S)[C@@H](N)C(O)=O VVNCNSJFMMFHPL-VKHMYHEASA-N 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- FEWJPZIEWOKRBE-JCYAYHJZSA-N Dextrotartaric acid Chemical compound OC(=O)[C@H](O)[C@@H](O)C(O)=O FEWJPZIEWOKRBE-JCYAYHJZSA-N 0.000 description 1
- 241000271571 Dromaius novaehollandiae Species 0.000 description 1
- 229940124884 Engerix-B Drugs 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 229940124897 Gardasil Drugs 0.000 description 1
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 1
- RGXXLQWXBFNXTG-CIUDSAMLSA-N Gln-Arg-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O RGXXLQWXBFNXTG-CIUDSAMLSA-N 0.000 description 1
- INFBPLSHYFALDE-ACZMJKKPSA-N Gln-Asn-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O INFBPLSHYFALDE-ACZMJKKPSA-N 0.000 description 1
- WQWMZOIPXWSZNE-WDSKDSINSA-N Gln-Asp-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O WQWMZOIPXWSZNE-WDSKDSINSA-N 0.000 description 1
- MWERYIXRDZDXOA-QEWYBTABSA-N Gln-Ile-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MWERYIXRDZDXOA-QEWYBTABSA-N 0.000 description 1
- KKCJHBXMYYVWMX-KQXIARHKSA-N Gln-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N KKCJHBXMYYVWMX-KQXIARHKSA-N 0.000 description 1
- HHQCBFGKQDMWSP-GUBZILKMSA-N Gln-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HHQCBFGKQDMWSP-GUBZILKMSA-N 0.000 description 1
- KSKFIECUYMYWNS-AVGNSLFASA-N Gln-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N KSKFIECUYMYWNS-AVGNSLFASA-N 0.000 description 1
- KLKYKPXITJBSNI-CIUDSAMLSA-N Gln-Met-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O KLKYKPXITJBSNI-CIUDSAMLSA-N 0.000 description 1
- DFRYZTUPVZNRLG-KKUMJFAQSA-N Gln-Met-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N DFRYZTUPVZNRLG-KKUMJFAQSA-N 0.000 description 1
- DSRVQBZAMPGEKU-AVGNSLFASA-N Gln-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)N)N DSRVQBZAMPGEKU-AVGNSLFASA-N 0.000 description 1
- XUMFMAVDHQDATI-DCAQKATOSA-N Gln-Pro-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XUMFMAVDHQDATI-DCAQKATOSA-N 0.000 description 1
- WLRYGVYQFXRJDA-DCAQKATOSA-N Gln-Pro-Pro Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 WLRYGVYQFXRJDA-DCAQKATOSA-N 0.000 description 1
- SXFPZRRVWSUYII-KBIXCLLPSA-N Gln-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N SXFPZRRVWSUYII-KBIXCLLPSA-N 0.000 description 1
- SYZZMPFLOLSMHL-XHNCKOQMSA-N Gln-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)C(=O)O SYZZMPFLOLSMHL-XHNCKOQMSA-N 0.000 description 1
- OTQSTOXRUBVWAP-NRPADANISA-N Gln-Ser-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OTQSTOXRUBVWAP-NRPADANISA-N 0.000 description 1
- YRHZWVKUFWCEPW-GLLZPBPUSA-N Gln-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O YRHZWVKUFWCEPW-GLLZPBPUSA-N 0.000 description 1
- ZZLDMBMFKZFQMU-NRPADANISA-N Gln-Val-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O ZZLDMBMFKZFQMU-NRPADANISA-N 0.000 description 1
- RDDSZZJOKDVPAE-ACZMJKKPSA-N Glu-Asn-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDDSZZJOKDVPAE-ACZMJKKPSA-N 0.000 description 1
- PCBBLFVHTYNQGG-LAEOZQHASA-N Glu-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N PCBBLFVHTYNQGG-LAEOZQHASA-N 0.000 description 1
- DSPQRJXOIXHOHK-WDSKDSINSA-N Glu-Asp-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O DSPQRJXOIXHOHK-WDSKDSINSA-N 0.000 description 1
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 1
- PBFGQTGPSKWHJA-QEJZJMRPSA-N Glu-Asp-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O PBFGQTGPSKWHJA-QEJZJMRPSA-N 0.000 description 1
- WATXSTJXNBOHKD-LAEOZQHASA-N Glu-Asp-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O WATXSTJXNBOHKD-LAEOZQHASA-N 0.000 description 1
- XKPOCESCRTVRPL-KBIXCLLPSA-N Glu-Cys-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XKPOCESCRTVRPL-KBIXCLLPSA-N 0.000 description 1
- KVBPDJIFRQUQFY-ACZMJKKPSA-N Glu-Cys-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O KVBPDJIFRQUQFY-ACZMJKKPSA-N 0.000 description 1
- BUAKRRKDHSSIKK-IHRRRGAJSA-N Glu-Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BUAKRRKDHSSIKK-IHRRRGAJSA-N 0.000 description 1
- ZPASCJBSSCRWMC-GVXVVHGQSA-N Glu-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N ZPASCJBSSCRWMC-GVXVVHGQSA-N 0.000 description 1
- QIQABBIDHGQXGA-ZPFDUUQYSA-N Glu-Ile-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QIQABBIDHGQXGA-ZPFDUUQYSA-N 0.000 description 1
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 1
- BBBXWRGITSUJPB-YUMQZZPRSA-N Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O BBBXWRGITSUJPB-YUMQZZPRSA-N 0.000 description 1
- KJBGAZSLZAQDPV-KKUMJFAQSA-N Glu-Phe-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N KJBGAZSLZAQDPV-KKUMJFAQSA-N 0.000 description 1
- KXTAGESXNQEZKB-DZKIICNBSA-N Glu-Phe-Val Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 KXTAGESXNQEZKB-DZKIICNBSA-N 0.000 description 1
- DTLLNDVORUEOTM-WDCWCFNPSA-N Glu-Thr-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DTLLNDVORUEOTM-WDCWCFNPSA-N 0.000 description 1
- ZQNCUVODKOBSSO-XEGUGMAKSA-N Glu-Trp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O ZQNCUVODKOBSSO-XEGUGMAKSA-N 0.000 description 1
- UUTGYDAKPISJAO-JYJNAYRXSA-N Glu-Tyr-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 UUTGYDAKPISJAO-JYJNAYRXSA-N 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- KFMBRBPXHVMDFN-UWVGGRQHSA-N Gly-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCNC(N)=N KFMBRBPXHVMDFN-UWVGGRQHSA-N 0.000 description 1
- JVACNFOPSUPDTK-QWRGUYRKSA-N Gly-Asn-Phe Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JVACNFOPSUPDTK-QWRGUYRKSA-N 0.000 description 1
- LURCIJSJAKFCRO-QWRGUYRKSA-N Gly-Asn-Tyr Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LURCIJSJAKFCRO-QWRGUYRKSA-N 0.000 description 1
- IXKRSKPKSLXIHN-YUMQZZPRSA-N Gly-Cys-Leu Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O IXKRSKPKSLXIHN-YUMQZZPRSA-N 0.000 description 1
- PEZZSFLFXXFUQD-XPUUQOCRSA-N Gly-Cys-Val Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O PEZZSFLFXXFUQD-XPUUQOCRSA-N 0.000 description 1
- HAXARWKYFIIHKD-ZKWXMUAHSA-N Gly-Ile-Ser Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HAXARWKYFIIHKD-ZKWXMUAHSA-N 0.000 description 1
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 1
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 1
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 1
- PDUHNKAFQXQNLH-ZETCQYMHSA-N Gly-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)NCC(O)=O PDUHNKAFQXQNLH-ZETCQYMHSA-N 0.000 description 1
- 108010009504 Gly-Phe-Leu-Gly Proteins 0.000 description 1
- IEGFSKKANYKBDU-QWHCGFSZSA-N Gly-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)CN)C(=O)O IEGFSKKANYKBDU-QWHCGFSZSA-N 0.000 description 1
- GGAPHLIUUTVYMX-QWRGUYRKSA-N Gly-Phe-Ser Chemical compound OC[C@@H](C([O-])=O)NC(=O)[C@@H](NC(=O)C[NH3+])CC1=CC=CC=C1 GGAPHLIUUTVYMX-QWRGUYRKSA-N 0.000 description 1
- HAOUOFNNJJLVNS-BQBZGAKWSA-N Gly-Pro-Ser Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O HAOUOFNNJJLVNS-BQBZGAKWSA-N 0.000 description 1
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 1
- XHVONGZZVUUORG-WEDXCCLWSA-N Gly-Thr-Lys Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN XHVONGZZVUUORG-WEDXCCLWSA-N 0.000 description 1
- TVTZEOHWHUVYCG-KYNKHSRBSA-N Gly-Thr-Thr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O TVTZEOHWHUVYCG-KYNKHSRBSA-N 0.000 description 1
- NWOSHVVPKDQKKT-RYUDHWBXSA-N Gly-Tyr-Gln Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O NWOSHVVPKDQKKT-RYUDHWBXSA-N 0.000 description 1
- RIYIFUFFFBIOEU-KBPBESRZSA-N Gly-Tyr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 RIYIFUFFFBIOEU-KBPBESRZSA-N 0.000 description 1
- 229940121710 HMGCoA reductase inhibitor Drugs 0.000 description 1
- 108010093488 His-His-His-His-His-His Proteins 0.000 description 1
- PGRPSOUCWRBWKZ-DLOVCJGASA-N His-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CN=CN1 PGRPSOUCWRBWKZ-DLOVCJGASA-N 0.000 description 1
- UPJODPVSKKWGDQ-KLHWPWHYSA-N His-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)O UPJODPVSKKWGDQ-KLHWPWHYSA-N 0.000 description 1
- GYXDQXPCPASCNR-NHCYSSNCSA-N His-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N GYXDQXPCPASCNR-NHCYSSNCSA-N 0.000 description 1
- YZJSUQQZGCHHNQ-UHFFFAOYSA-N Homoglutamine Chemical compound OC(=O)C(N)CCCC(N)=O YZJSUQQZGCHHNQ-UHFFFAOYSA-N 0.000 description 1
- CISBRYJZMFWOHJ-JBDRJPRFSA-N Ile-Ala-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(=O)O)N CISBRYJZMFWOHJ-JBDRJPRFSA-N 0.000 description 1
- YKRYHWJRQUSTKG-KBIXCLLPSA-N Ile-Ala-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YKRYHWJRQUSTKG-KBIXCLLPSA-N 0.000 description 1
- HERITAGIPLEJMT-GVARAGBVSA-N Ile-Ala-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HERITAGIPLEJMT-GVARAGBVSA-N 0.000 description 1
- WEWCEPOYKANMGZ-MMWGEVLESA-N Ile-Cys-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N WEWCEPOYKANMGZ-MMWGEVLESA-N 0.000 description 1
- NHJKZMDIMMTVCK-QXEWZRGKSA-N Ile-Gly-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N NHJKZMDIMMTVCK-QXEWZRGKSA-N 0.000 description 1
- GQKSJYINYYWPMR-NGZCFLSTSA-N Ile-Gly-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N GQKSJYINYYWPMR-NGZCFLSTSA-N 0.000 description 1
- VOBYAKCXGQQFLR-LSJOCFKGSA-N Ile-Gly-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O VOBYAKCXGQQFLR-LSJOCFKGSA-N 0.000 description 1
- JLWLMGADIQFKRD-QSFUFRPTSA-N Ile-His-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CN=CN1 JLWLMGADIQFKRD-QSFUFRPTSA-N 0.000 description 1
- CMNMPCTVCWWYHY-MXAVVETBSA-N Ile-His-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(C)C)C(=O)O)N CMNMPCTVCWWYHY-MXAVVETBSA-N 0.000 description 1
- KEKTTYCXKGBAAL-VGDYDELISA-N Ile-His-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CO)C(=O)O)N KEKTTYCXKGBAAL-VGDYDELISA-N 0.000 description 1
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 1
- VOCZPDONPURUHV-QEWYBTABSA-N Ile-Phe-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VOCZPDONPURUHV-QEWYBTABSA-N 0.000 description 1
- CIDLJWVDMNDKPT-FIRPJDEBSA-N Ile-Phe-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N CIDLJWVDMNDKPT-FIRPJDEBSA-N 0.000 description 1
- VZSDQFZFTCVEGF-ZEWNOJEFSA-N Ile-Phe-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O VZSDQFZFTCVEGF-ZEWNOJEFSA-N 0.000 description 1
- HXIDVIFHRYRXLZ-NAKRPEOUSA-N Ile-Ser-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)O)N HXIDVIFHRYRXLZ-NAKRPEOUSA-N 0.000 description 1
- PZWBBXHHUSIGKH-OSUNSFLBSA-N Ile-Thr-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PZWBBXHHUSIGKH-OSUNSFLBSA-N 0.000 description 1
- KBDIBHQICWDGDL-PPCPHDFISA-N Ile-Thr-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N KBDIBHQICWDGDL-PPCPHDFISA-N 0.000 description 1
- WCNWGAUZWWSYDG-SVSWQMSJSA-N Ile-Thr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)O)N WCNWGAUZWWSYDG-SVSWQMSJSA-N 0.000 description 1
- FXJLRZFMKGHYJP-CFMVVWHZSA-N Ile-Tyr-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N FXJLRZFMKGHYJP-CFMVVWHZSA-N 0.000 description 1
- ZGKVPOSSTGHJAF-HJPIBITLSA-N Ile-Tyr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CO)C(=O)O)N ZGKVPOSSTGHJAF-HJPIBITLSA-N 0.000 description 1
- NXRNRBOKDBIVKQ-CXTHYWKRSA-N Ile-Tyr-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N NXRNRBOKDBIVKQ-CXTHYWKRSA-N 0.000 description 1
- 241001099157 Komagataella Species 0.000 description 1
- 241001099156 Komagataella phaffii Species 0.000 description 1
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- 125000000998 L-alanino group Chemical group [H]N([*])[C@](C([H])([H])[H])([H])C(=O)O[H] 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- RHGKLRLOHDJJDR-BYPYZUCNSA-N L-citrulline Chemical compound NC(=O)NCCC[C@H]([NH3+])C([O-])=O RHGKLRLOHDJJDR-BYPYZUCNSA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- FFFHZYDWPBMWHY-VKHMYHEASA-N L-homocysteine Chemical compound OC(=O)[C@@H](N)CCS FFFHZYDWPBMWHY-VKHMYHEASA-N 0.000 description 1
- JTTHKOPSMAVJFE-VIFPVBQESA-N L-homophenylalanine Chemical compound OC(=O)[C@@H](N)CCC1=CC=CC=C1 JTTHKOPSMAVJFE-VIFPVBQESA-N 0.000 description 1
- LRQKBLKVPFOOQJ-YFKPBYRVSA-N L-norleucine Chemical compound CCCC[C@H]([NH3+])C([O-])=O LRQKBLKVPFOOQJ-YFKPBYRVSA-N 0.000 description 1
- DGYHPLMPMRKMPD-UHFFFAOYSA-N L-propargyl glycine Natural products OC(=O)C(N)CC#C DGYHPLMPMRKMPD-UHFFFAOYSA-N 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 1
- MDVZJYGNAGLPGJ-KKUMJFAQSA-N Leu-Asn-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MDVZJYGNAGLPGJ-KKUMJFAQSA-N 0.000 description 1
- KTFHTMHHKXUYPW-ZPFDUUQYSA-N Leu-Asp-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KTFHTMHHKXUYPW-ZPFDUUQYSA-N 0.000 description 1
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 1
- NHHKSOGJYNQENP-SRVKXCTJSA-N Leu-Cys-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N NHHKSOGJYNQENP-SRVKXCTJSA-N 0.000 description 1
- HUEBCHPSXSQUGN-GARJFASQSA-N Leu-Cys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N HUEBCHPSXSQUGN-GARJFASQSA-N 0.000 description 1
- ZYLJULGXQDNXDK-GUBZILKMSA-N Leu-Gln-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ZYLJULGXQDNXDK-GUBZILKMSA-N 0.000 description 1
- GLBNEGIOFRVRHO-JYJNAYRXSA-N Leu-Gln-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GLBNEGIOFRVRHO-JYJNAYRXSA-N 0.000 description 1
- CIVKXGPFXDIQBV-WDCWCFNPSA-N Leu-Gln-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CIVKXGPFXDIQBV-WDCWCFNPSA-N 0.000 description 1
- HPBCTWSUJOGJSH-MNXVOIDGSA-N Leu-Glu-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HPBCTWSUJOGJSH-MNXVOIDGSA-N 0.000 description 1
- OGUUKPXUTHOIAV-SDDRHHMPSA-N Leu-Glu-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N OGUUKPXUTHOIAV-SDDRHHMPSA-N 0.000 description 1
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 1
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 1
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 1
- ORWTWZXGDBYVCP-BJDJZHNGSA-N Leu-Ile-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(C)C ORWTWZXGDBYVCP-BJDJZHNGSA-N 0.000 description 1
- JKSIBWITFMQTOA-XUXIUFHCSA-N Leu-Ile-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O JKSIBWITFMQTOA-XUXIUFHCSA-N 0.000 description 1
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 1
- KYIIALJHAOIAHF-KKUMJFAQSA-N Leu-Leu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 KYIIALJHAOIAHF-KKUMJFAQSA-N 0.000 description 1
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 1
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 1
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 1
- QNTJIDXQHWUBKC-BZSNNMDCSA-N Leu-Lys-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNTJIDXQHWUBKC-BZSNNMDCSA-N 0.000 description 1
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 1
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 1
- XWEVVRRSIOBJOO-SRVKXCTJSA-N Leu-Pro-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O XWEVVRRSIOBJOO-SRVKXCTJSA-N 0.000 description 1
- AKVBOOKXVAMKSS-GUBZILKMSA-N Leu-Ser-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O AKVBOOKXVAMKSS-GUBZILKMSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- SBANPBVRHYIMRR-GARJFASQSA-N Leu-Ser-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N SBANPBVRHYIMRR-GARJFASQSA-N 0.000 description 1
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 1
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 1
- LJBVRCDPWOJOEK-PPCPHDFISA-N Leu-Thr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LJBVRCDPWOJOEK-PPCPHDFISA-N 0.000 description 1
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 1
- VUBIPAHVHMZHCM-KKUMJFAQSA-N Leu-Tyr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 VUBIPAHVHMZHCM-KKUMJFAQSA-N 0.000 description 1
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 1
- SJNZALDHDUYDBU-IHRRRGAJSA-N Lys-Arg-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(O)=O SJNZALDHDUYDBU-IHRRRGAJSA-N 0.000 description 1
- MKBIVWXCFINCLE-SRVKXCTJSA-N Lys-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N MKBIVWXCFINCLE-SRVKXCTJSA-N 0.000 description 1
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 1
- YEIYAQQKADPIBJ-GARJFASQSA-N Lys-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O YEIYAQQKADPIBJ-GARJFASQSA-N 0.000 description 1
- XFBBBRDEQIPGNR-KATARQTJSA-N Lys-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCCN)N)O XFBBBRDEQIPGNR-KATARQTJSA-N 0.000 description 1
- OPTCSTACHGNULU-DCAQKATOSA-N Lys-Cys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCCCN OPTCSTACHGNULU-DCAQKATOSA-N 0.000 description 1
- VSRXPEHZMHSFKU-IUCAKERBSA-N Lys-Gln-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VSRXPEHZMHSFKU-IUCAKERBSA-N 0.000 description 1
- IMAKMJCBYCSMHM-AVGNSLFASA-N Lys-Glu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN IMAKMJCBYCSMHM-AVGNSLFASA-N 0.000 description 1
- DTUZCYRNEJDKSR-NHCYSSNCSA-N Lys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN DTUZCYRNEJDKSR-NHCYSSNCSA-N 0.000 description 1
- HQXSFFSLXFHWOX-IXOXFDKPSA-N Lys-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCCN)N)O HQXSFFSLXFHWOX-IXOXFDKPSA-N 0.000 description 1
- YPLVCBKEPJPBDQ-MELADBBJSA-N Lys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N YPLVCBKEPJPBDQ-MELADBBJSA-N 0.000 description 1
- NVGBPTNZLWRQSY-UWVGGRQHSA-N Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN NVGBPTNZLWRQSY-UWVGGRQHSA-N 0.000 description 1
- YDDDRTIPNTWGIG-SRVKXCTJSA-N Lys-Lys-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O YDDDRTIPNTWGIG-SRVKXCTJSA-N 0.000 description 1
- BXPHMHQHYHILBB-BZSNNMDCSA-N Lys-Lys-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BXPHMHQHYHILBB-BZSNNMDCSA-N 0.000 description 1
- LUAJJLPHUXPQLH-KKUMJFAQSA-N Lys-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCCN)N LUAJJLPHUXPQLH-KKUMJFAQSA-N 0.000 description 1
- WLXGMVVHTIUPHE-ULQDDVLXSA-N Lys-Phe-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O WLXGMVVHTIUPHE-ULQDDVLXSA-N 0.000 description 1
- LUTDBHBIHHREDC-IHRRRGAJSA-N Lys-Pro-Lys Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O LUTDBHBIHHREDC-IHRRRGAJSA-N 0.000 description 1
- LOGFVTREOLYCPF-RHYQMDGZSA-N Lys-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN LOGFVTREOLYCPF-RHYQMDGZSA-N 0.000 description 1
- UIJVKVHLCQSPOJ-XIRDDKMYSA-N Lys-Ser-Trp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O UIJVKVHLCQSPOJ-XIRDDKMYSA-N 0.000 description 1
- TVOOGUNBIWAURO-KATARQTJSA-N Lys-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N)O TVOOGUNBIWAURO-KATARQTJSA-N 0.000 description 1
- PELXPRPDQRFBGQ-KKUMJFAQSA-N Lys-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N)O PELXPRPDQRFBGQ-KKUMJFAQSA-N 0.000 description 1
- LMMBAXJRYSXCOQ-ACRUOGEOSA-N Lys-Tyr-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O LMMBAXJRYSXCOQ-ACRUOGEOSA-N 0.000 description 1
- IKXQOBUBZSOWDY-AVGNSLFASA-N Lys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N IKXQOBUBZSOWDY-AVGNSLFASA-N 0.000 description 1
- 241000282553 Macaca Species 0.000 description 1
- 241000282567 Macaca fascicularis Species 0.000 description 1
- 229930195725 Mannitol Natural products 0.000 description 1
- 241000283923 Marmota monax Species 0.000 description 1
- 101710159527 Maturation protein A Proteins 0.000 description 1
- 101710091157 Maturation protein A2 Proteins 0.000 description 1
- QEVRUYFHWJJUHZ-DCAQKATOSA-N Met-Ala-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(C)C QEVRUYFHWJJUHZ-DCAQKATOSA-N 0.000 description 1
- DLAFCQWUMFMZSN-GUBZILKMSA-N Met-Arg-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CCCN=C(N)N DLAFCQWUMFMZSN-GUBZILKMSA-N 0.000 description 1
- MDXAULHWGWETHF-SRVKXCTJSA-N Met-Arg-Val Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CCCNC(N)=N MDXAULHWGWETHF-SRVKXCTJSA-N 0.000 description 1
- CAODKDAPYGUMLK-FXQIFTODSA-N Met-Asn-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CAODKDAPYGUMLK-FXQIFTODSA-N 0.000 description 1
- KLFPZIUIXZNEKY-DCAQKATOSA-N Met-Gln-Met Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O KLFPZIUIXZNEKY-DCAQKATOSA-N 0.000 description 1
- AETNZPKUUYYYEK-CIUDSAMLSA-N Met-Glu-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O AETNZPKUUYYYEK-CIUDSAMLSA-N 0.000 description 1
- HUURTRNKPBHHKZ-JYJNAYRXSA-N Met-Phe-Val Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 HUURTRNKPBHHKZ-JYJNAYRXSA-N 0.000 description 1
- CIDICGYKRUTYLE-FXQIFTODSA-N Met-Ser-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O CIDICGYKRUTYLE-FXQIFTODSA-N 0.000 description 1
- NSMXRFMGZYTFEX-KJEVXHAQSA-N Met-Thr-Tyr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCSC)N)O NSMXRFMGZYTFEX-KJEVXHAQSA-N 0.000 description 1
- LBSWWNKMVPAXOI-GUBZILKMSA-N Met-Val-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O LBSWWNKMVPAXOI-GUBZILKMSA-N 0.000 description 1
- 108010006519 Molecular Chaperones Proteins 0.000 description 1
- 208000034486 Multi-organ failure Diseases 0.000 description 1
- 208000010718 Multiple Organ Failure Diseases 0.000 description 1
- 241000282339 Mustela Species 0.000 description 1
- PQNASZJZHFPQLE-LURJTMIESA-N N(6)-methyl-L-lysine Chemical compound CNCCCC[C@H](N)C(O)=O PQNASZJZHFPQLE-LURJTMIESA-N 0.000 description 1
- 108700020354 N-acetylmuramyl-threonyl-isoglutamine Proteins 0.000 description 1
- 238000005481 NMR spectroscopy Methods 0.000 description 1
- RHGKLRLOHDJJDR-UHFFFAOYSA-N Ndelta-carbamoyl-DL-ornithine Natural products OC(=O)C(N)CCCNC(N)=O RHGKLRLOHDJJDR-UHFFFAOYSA-N 0.000 description 1
- 241001292005 Nidovirales Species 0.000 description 1
- BZQFBWGGLXLEPQ-UHFFFAOYSA-N O-phosphoryl-L-serine Natural products OC(=O)C(N)COP(O)(O)=O BZQFBWGGLXLEPQ-UHFFFAOYSA-N 0.000 description 1
- 241000282579 Pan Species 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 108010033276 Peptide Fragments Proteins 0.000 description 1
- 102000007079 Peptide Fragments Human genes 0.000 description 1
- JNRFYJZCMHHGMH-UBHSHLNASA-N Phe-Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JNRFYJZCMHHGMH-UBHSHLNASA-N 0.000 description 1
- YYRCPTVAPLQRNC-ULQDDVLXSA-N Phe-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CC1=CC=CC=C1 YYRCPTVAPLQRNC-ULQDDVLXSA-N 0.000 description 1
- JEGFCFLCRSJCMA-IHRRRGAJSA-N Phe-Arg-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N JEGFCFLCRSJCMA-IHRRRGAJSA-N 0.000 description 1
- HCTXJGRYAACKOB-SRVKXCTJSA-N Phe-Asn-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HCTXJGRYAACKOB-SRVKXCTJSA-N 0.000 description 1
- WMGVYPPIMZPWPN-SRVKXCTJSA-N Phe-Asp-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N WMGVYPPIMZPWPN-SRVKXCTJSA-N 0.000 description 1
- UAMFZRNCIFFMLE-FHWLQOOXSA-N Phe-Glu-Tyr Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N UAMFZRNCIFFMLE-FHWLQOOXSA-N 0.000 description 1
- APJPXSFJBMMOLW-KBPBESRZSA-N Phe-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 APJPXSFJBMMOLW-KBPBESRZSA-N 0.000 description 1
- BWTKUQPNOMMKMA-FIRPJDEBSA-N Phe-Ile-Phe Chemical compound C([C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 BWTKUQPNOMMKMA-FIRPJDEBSA-N 0.000 description 1
- ONORAGIFHNAADN-LLLHUVSDSA-N Phe-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N ONORAGIFHNAADN-LLLHUVSDSA-N 0.000 description 1
- SMFGCTXUBWEPKM-KBPBESRZSA-N Phe-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 SMFGCTXUBWEPKM-KBPBESRZSA-N 0.000 description 1
- KPEIBEPEUAZWNS-ULQDDVLXSA-N Phe-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KPEIBEPEUAZWNS-ULQDDVLXSA-N 0.000 description 1
- PBWNICYZGJQKJV-BZSNNMDCSA-N Phe-Phe-Cys Chemical compound N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CS)C(O)=O PBWNICYZGJQKJV-BZSNNMDCSA-N 0.000 description 1
- DSXPMZMSJHOKKK-HJOGWXRNSA-N Phe-Phe-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O DSXPMZMSJHOKKK-HJOGWXRNSA-N 0.000 description 1
- XOHJOMKCRLHGCY-UNQGMJICSA-N Phe-Pro-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOHJOMKCRLHGCY-UNQGMJICSA-N 0.000 description 1
- YMIZSYUAZJSOFL-SRVKXCTJSA-N Phe-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O YMIZSYUAZJSOFL-SRVKXCTJSA-N 0.000 description 1
- HBXAOEBRGLCLIW-AVGNSLFASA-N Phe-Ser-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HBXAOEBRGLCLIW-AVGNSLFASA-N 0.000 description 1
- BONHGTUEEPIMPM-AVGNSLFASA-N Phe-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O BONHGTUEEPIMPM-AVGNSLFASA-N 0.000 description 1
- GLJZDMZJHFXJQG-BZSNNMDCSA-N Phe-Ser-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GLJZDMZJHFXJQG-BZSNNMDCSA-N 0.000 description 1
- MRWOVVNKSXXLRP-IHPCNDPISA-N Phe-Ser-Trp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O MRWOVVNKSXXLRP-IHPCNDPISA-N 0.000 description 1
- JHSRGEODDALISP-XVSYOHENSA-N Phe-Thr-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O JHSRGEODDALISP-XVSYOHENSA-N 0.000 description 1
- NJONQBYLTANINY-IHPCNDPISA-N Phe-Trp-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(=O)N[C@@H](CC(N)=O)C(O)=O NJONQBYLTANINY-IHPCNDPISA-N 0.000 description 1
- XALFIVXGQUEGKV-JSGCOSHPSA-N Phe-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 XALFIVXGQUEGKV-JSGCOSHPSA-N 0.000 description 1
- 241000235648 Pichia Species 0.000 description 1
- FYQSMXKJYTZYRP-DCAQKATOSA-N Pro-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 FYQSMXKJYTZYRP-DCAQKATOSA-N 0.000 description 1
- LNLNHXIQPGKRJQ-SRVKXCTJSA-N Pro-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 LNLNHXIQPGKRJQ-SRVKXCTJSA-N 0.000 description 1
- WWAQEUOYCYMGHB-FXQIFTODSA-N Pro-Asn-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 WWAQEUOYCYMGHB-FXQIFTODSA-N 0.000 description 1
- SFECXGVELZFBFJ-VEVYYDQMSA-N Pro-Asp-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SFECXGVELZFBFJ-VEVYYDQMSA-N 0.000 description 1
- LUGOKRWYNMDGTD-FXQIFTODSA-N Pro-Cys-Asn Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O LUGOKRWYNMDGTD-FXQIFTODSA-N 0.000 description 1
- DIFXZGPHVCIVSQ-CIUDSAMLSA-N Pro-Gln-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DIFXZGPHVCIVSQ-CIUDSAMLSA-N 0.000 description 1
- XZONQWUEBAFQPO-HJGDQZAQSA-N Pro-Gln-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XZONQWUEBAFQPO-HJGDQZAQSA-N 0.000 description 1
- UEHYFUCOGHWASA-HJGDQZAQSA-N Pro-Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 UEHYFUCOGHWASA-HJGDQZAQSA-N 0.000 description 1
- HAAQQNHQZBOWFO-LURJTMIESA-N Pro-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H]1CCCN1 HAAQQNHQZBOWFO-LURJTMIESA-N 0.000 description 1
- AFXCXDQNRXTSBD-FJXKBIBVSA-N Pro-Gly-Thr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O AFXCXDQNRXTSBD-FJXKBIBVSA-N 0.000 description 1
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 1
- XQPHBAKJJJZOBX-SRVKXCTJSA-N Pro-Lys-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O XQPHBAKJJJZOBX-SRVKXCTJSA-N 0.000 description 1
- DWGFLKQSGRUQTI-IHRRRGAJSA-N Pro-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 DWGFLKQSGRUQTI-IHRRRGAJSA-N 0.000 description 1
- ZUZINZIJHJFJRN-UBHSHLNASA-N Pro-Phe-Ala Chemical compound C([C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 ZUZINZIJHJFJRN-UBHSHLNASA-N 0.000 description 1
- JIWJRKNYLSHONY-KKUMJFAQSA-N Pro-Phe-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JIWJRKNYLSHONY-KKUMJFAQSA-N 0.000 description 1
- GZNYIXWOIUFLGO-ZJDVBMNYSA-N Pro-Thr-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZNYIXWOIUFLGO-ZJDVBMNYSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- OFOBLEOULBTSOW-UHFFFAOYSA-N Propanedioic acid Natural products OC(=O)CC(O)=O OFOBLEOULBTSOW-UHFFFAOYSA-N 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 101000933967 Pseudomonas phage KPP25 Major capsid protein Proteins 0.000 description 1
- 206010037423 Pulmonary oedema Diseases 0.000 description 1
- 208000013616 Respiratory Distress Syndrome Diseases 0.000 description 1
- 241000315672 SARS coronavirus Species 0.000 description 1
- 241000277331 Salmonidae Species 0.000 description 1
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 1
- VQBLHWSPVYYZTB-DCAQKATOSA-N Ser-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CO)N VQBLHWSPVYYZTB-DCAQKATOSA-N 0.000 description 1
- VGNYHOBZJKWRGI-CIUDSAMLSA-N Ser-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO VGNYHOBZJKWRGI-CIUDSAMLSA-N 0.000 description 1
- ICHZYBVODUVUKN-SRVKXCTJSA-N Ser-Asn-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ICHZYBVODUVUKN-SRVKXCTJSA-N 0.000 description 1
- OHKLFYXEOGGGCK-ZLUOBGJFSA-N Ser-Asp-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OHKLFYXEOGGGCK-ZLUOBGJFSA-N 0.000 description 1
- CRZRTKAVUUGKEQ-ACZMJKKPSA-N Ser-Gln-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CRZRTKAVUUGKEQ-ACZMJKKPSA-N 0.000 description 1
- MAWSJXHRLWVJEZ-ACZMJKKPSA-N Ser-Gln-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N MAWSJXHRLWVJEZ-ACZMJKKPSA-N 0.000 description 1
- BQWCDDAISCPDQV-XHNCKOQMSA-N Ser-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N)C(=O)O BQWCDDAISCPDQV-XHNCKOQMSA-N 0.000 description 1
- SMIDBHKWSYUBRZ-ACZMJKKPSA-N Ser-Glu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O SMIDBHKWSYUBRZ-ACZMJKKPSA-N 0.000 description 1
- DSGYZICNAMEJOC-AVGNSLFASA-N Ser-Glu-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DSGYZICNAMEJOC-AVGNSLFASA-N 0.000 description 1
- GZBKRJVCRMZAST-XKBZYTNZSA-N Ser-Glu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZBKRJVCRMZAST-XKBZYTNZSA-N 0.000 description 1
- OHKFXGKHSJKKAL-NRPADANISA-N Ser-Glu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OHKFXGKHSJKKAL-NRPADANISA-N 0.000 description 1
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 1
- FYUIFUJFNCLUIX-XVYDVKMFSA-N Ser-His-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O FYUIFUJFNCLUIX-XVYDVKMFSA-N 0.000 description 1
- IAORETPTUDBBGV-CIUDSAMLSA-N Ser-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N IAORETPTUDBBGV-CIUDSAMLSA-N 0.000 description 1
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 1
- AMRRYKHCILPAKD-FXQIFTODSA-N Ser-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CO)N AMRRYKHCILPAKD-FXQIFTODSA-N 0.000 description 1
- KJKQUQXDEKMPDK-FXQIFTODSA-N Ser-Met-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O KJKQUQXDEKMPDK-FXQIFTODSA-N 0.000 description 1
- HEYZPTCCEIWHRO-IHRRRGAJSA-N Ser-Met-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HEYZPTCCEIWHRO-IHRRRGAJSA-N 0.000 description 1
- ASGYVPAVFNDZMA-GUBZILKMSA-N Ser-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CO)N ASGYVPAVFNDZMA-GUBZILKMSA-N 0.000 description 1
- HJAXVYLCKDPPDF-SRVKXCTJSA-N Ser-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N HJAXVYLCKDPPDF-SRVKXCTJSA-N 0.000 description 1
- BUYHXYIUQUBEQP-AVGNSLFASA-N Ser-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CO)N BUYHXYIUQUBEQP-AVGNSLFASA-N 0.000 description 1
- KZPRPBLHYMZIMH-MXAVVETBSA-N Ser-Phe-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZPRPBLHYMZIMH-MXAVVETBSA-N 0.000 description 1
- MQUZANJDFOQOBX-SRVKXCTJSA-N Ser-Phe-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O MQUZANJDFOQOBX-SRVKXCTJSA-N 0.000 description 1
- QMCDMHWAKMUGJE-IHRRRGAJSA-N Ser-Phe-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O QMCDMHWAKMUGJE-IHRRRGAJSA-N 0.000 description 1
- XQAPEISNMXNKGE-FXQIFTODSA-N Ser-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CS)C(=O)O XQAPEISNMXNKGE-FXQIFTODSA-N 0.000 description 1
- RHAPJNVNWDBFQI-BQBZGAKWSA-N Ser-Pro-Gly Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O RHAPJNVNWDBFQI-BQBZGAKWSA-N 0.000 description 1
- AZWNCEBQZXELEZ-FXQIFTODSA-N Ser-Pro-Ser Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O AZWNCEBQZXELEZ-FXQIFTODSA-N 0.000 description 1
- CKDXFSPMIDSMGV-GUBZILKMSA-N Ser-Pro-Val Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O CKDXFSPMIDSMGV-GUBZILKMSA-N 0.000 description 1
- KQNDIKOYWZTZIX-FXQIFTODSA-N Ser-Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQNDIKOYWZTZIX-FXQIFTODSA-N 0.000 description 1
- FZXOPYUEQGDGMS-ACZMJKKPSA-N Ser-Ser-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZXOPYUEQGDGMS-ACZMJKKPSA-N 0.000 description 1
- JCLAFVNDBJMLBC-JBDRJPRFSA-N Ser-Ser-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JCLAFVNDBJMLBC-JBDRJPRFSA-N 0.000 description 1
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 1
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 1
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 1
- PLQWGQUNUPMNOD-KKUMJFAQSA-N Ser-Tyr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O PLQWGQUNUPMNOD-KKUMJFAQSA-N 0.000 description 1
- IAOHCSQDQDWRQU-GUBZILKMSA-N Ser-Val-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IAOHCSQDQDWRQU-GUBZILKMSA-N 0.000 description 1
- UKKROEYWYIHWBD-ZKWXMUAHSA-N Ser-Val-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O UKKROEYWYIHWBD-ZKWXMUAHSA-N 0.000 description 1
- 101800001707 Spacer peptide Proteins 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 239000004138 Stearyl citrate Substances 0.000 description 1
- 241000272534 Struthio camelus Species 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 229940100389 Sulfonylurea Drugs 0.000 description 1
- FEWJPZIEWOKRBE-UHFFFAOYSA-N Tartaric acid Natural products [H+].[H+].[O-]C(=O)C(O)C(O)C([O-])=O FEWJPZIEWOKRBE-UHFFFAOYSA-N 0.000 description 1
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 1
- NJEMRSFGDNECGF-GCJQMDKQSA-N Thr-Ala-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O NJEMRSFGDNECGF-GCJQMDKQSA-N 0.000 description 1
- YRNBANYVJJBGDI-VZFHVOOUSA-N Thr-Ala-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(=O)O)N)O YRNBANYVJJBGDI-VZFHVOOUSA-N 0.000 description 1
- ZUXQFMVPAYGPFJ-JXUBOQSCSA-N Thr-Ala-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN ZUXQFMVPAYGPFJ-JXUBOQSCSA-N 0.000 description 1
- CAGTXGDOIFXLPC-KZVJFYERSA-N Thr-Arg-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CCCN=C(N)N CAGTXGDOIFXLPC-KZVJFYERSA-N 0.000 description 1
- MQBTXMPQNCGSSZ-OSUNSFLBSA-N Thr-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N MQBTXMPQNCGSSZ-OSUNSFLBSA-N 0.000 description 1
- QNJZOAHSYPXTAB-VEVYYDQMSA-N Thr-Asn-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O QNJZOAHSYPXTAB-VEVYYDQMSA-N 0.000 description 1
- JBHMLZSKIXMVFS-XVSYOHENSA-N Thr-Asn-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JBHMLZSKIXMVFS-XVSYOHENSA-N 0.000 description 1
- ZLNWJMRLHLGKFX-SVSWQMSJSA-N Thr-Cys-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZLNWJMRLHLGKFX-SVSWQMSJSA-N 0.000 description 1
- CQNFRKAKGDSJFR-NUMRIWBASA-N Thr-Glu-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CQNFRKAKGDSJFR-NUMRIWBASA-N 0.000 description 1
- HJOSVGCWOTYJFG-WDCWCFNPSA-N Thr-Glu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O HJOSVGCWOTYJFG-WDCWCFNPSA-N 0.000 description 1
- KCRQEJSKXAIULJ-FJXKBIBVSA-N Thr-Gly-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O KCRQEJSKXAIULJ-FJXKBIBVSA-N 0.000 description 1
- MPUMPERGHHJGRP-WEDXCCLWSA-N Thr-Gly-Lys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O MPUMPERGHHJGRP-WEDXCCLWSA-N 0.000 description 1
- JKGGPMOUIAAJAA-YEPSODPASA-N Thr-Gly-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O JKGGPMOUIAAJAA-YEPSODPASA-N 0.000 description 1
- DDDLIMCZFKOERC-SVSWQMSJSA-N Thr-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N DDDLIMCZFKOERC-SVSWQMSJSA-N 0.000 description 1
- ADPHPKGWVDHWML-PPCPHDFISA-N Thr-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N ADPHPKGWVDHWML-PPCPHDFISA-N 0.000 description 1
- FQPDRTDDEZXCEC-SVSWQMSJSA-N Thr-Ile-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O FQPDRTDDEZXCEC-SVSWQMSJSA-N 0.000 description 1
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 1
- TZJSEJOXAIWOST-RHYQMDGZSA-N Thr-Lys-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N TZJSEJOXAIWOST-RHYQMDGZSA-N 0.000 description 1
- DCRHJDRLCFMEBI-RHYQMDGZSA-N Thr-Lys-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O DCRHJDRLCFMEBI-RHYQMDGZSA-N 0.000 description 1
- QNCFWHZVRNXAKW-OEAJRASXSA-N Thr-Lys-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNCFWHZVRNXAKW-OEAJRASXSA-N 0.000 description 1
- QHUWWSQZTFLXPQ-FJXKBIBVSA-N Thr-Met-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O QHUWWSQZTFLXPQ-FJXKBIBVSA-N 0.000 description 1
- WRUWXBBEFUTJOU-XGEHTFHBSA-N Thr-Met-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N)O WRUWXBBEFUTJOU-XGEHTFHBSA-N 0.000 description 1
- VGYVVSQFSSKZRJ-OEAJRASXSA-N Thr-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@H](O)C)CC1=CC=CC=C1 VGYVVSQFSSKZRJ-OEAJRASXSA-N 0.000 description 1
- XIHGJKFSIDTDKV-LYARXQMPSA-N Thr-Phe-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O XIHGJKFSIDTDKV-LYARXQMPSA-N 0.000 description 1
- GVMXJJAJLIEASL-ZJDVBMNYSA-N Thr-Pro-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVMXJJAJLIEASL-ZJDVBMNYSA-N 0.000 description 1
- PRTHQBSMXILLPC-XGEHTFHBSA-N Thr-Ser-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PRTHQBSMXILLPC-XGEHTFHBSA-N 0.000 description 1
- XHWCDRUPDNSDAZ-XKBZYTNZSA-N Thr-Ser-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O XHWCDRUPDNSDAZ-XKBZYTNZSA-N 0.000 description 1
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 1
- VUXIQSUQQYNLJP-XAVMHZPKSA-N Thr-Ser-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N)O VUXIQSUQQYNLJP-XAVMHZPKSA-N 0.000 description 1
- WPSKTVVMQCXPRO-BWBBJGPYSA-N Thr-Ser-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WPSKTVVMQCXPRO-BWBBJGPYSA-N 0.000 description 1
- QYDKSNXSBXZPFK-ZJDVBMNYSA-N Thr-Thr-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYDKSNXSBXZPFK-ZJDVBMNYSA-N 0.000 description 1
- YRJOLUDFVAUXLI-GSSVUCPTSA-N Thr-Thr-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O YRJOLUDFVAUXLI-GSSVUCPTSA-N 0.000 description 1
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 1
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 1
- GRIUMVXCJDKVPI-IZPVPAKOSA-N Thr-Thr-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GRIUMVXCJDKVPI-IZPVPAKOSA-N 0.000 description 1
- UMFLBPIPAJMNIM-LYARXQMPSA-N Thr-Trp-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CC=CC=C3)C(=O)O)N)O UMFLBPIPAJMNIM-LYARXQMPSA-N 0.000 description 1
- BEZTUFWTPVOROW-KJEVXHAQSA-N Thr-Tyr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O BEZTUFWTPVOROW-KJEVXHAQSA-N 0.000 description 1
- ILUOMMDDGREELW-OSUNSFLBSA-N Thr-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O ILUOMMDDGREELW-OSUNSFLBSA-N 0.000 description 1
- BTAJAOWZCWOHBU-HSHDSVGOSA-N Thr-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)C(C)C)C(O)=O)=CNC2=C1 BTAJAOWZCWOHBU-HSHDSVGOSA-N 0.000 description 1
- ATJFFYVFTNAWJD-UHFFFAOYSA-N Tin Chemical compound [Sn] ATJFFYVFTNAWJD-UHFFFAOYSA-N 0.000 description 1
- 102000003978 Tissue Plasminogen Activator Human genes 0.000 description 1
- 108090000373 Tissue Plasminogen Activator Proteins 0.000 description 1
- 101000980463 Treponema pallidum (strain Nichols) Chaperonin GroEL Proteins 0.000 description 1
- VIWQOOBRKCGSDK-RYQLBKOJSA-N Trp-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O VIWQOOBRKCGSDK-RYQLBKOJSA-N 0.000 description 1
- ICNFHVUVCNWUAB-SZMVWBNQSA-N Trp-Arg-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N ICNFHVUVCNWUAB-SZMVWBNQSA-N 0.000 description 1
- BYSKNUASOAGJSS-NQCBNZPSSA-N Trp-Ile-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N BYSKNUASOAGJSS-NQCBNZPSSA-N 0.000 description 1
- GWBWCGITOYODER-YTQUADARSA-N Trp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N GWBWCGITOYODER-YTQUADARSA-N 0.000 description 1
- TUUXFNQXSFNFLX-XIRDDKMYSA-N Trp-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N TUUXFNQXSFNFLX-XIRDDKMYSA-N 0.000 description 1
- ABEVJDLMFPTGPS-SZMVWBNQSA-N Trp-Met-Met Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(O)=O ABEVJDLMFPTGPS-SZMVWBNQSA-N 0.000 description 1
- YXSSXUIBUJGHJY-SFJXLCSZSA-N Trp-Thr-Phe Chemical compound C([C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)[C@H](O)C)C(O)=O)C1=CC=CC=C1 YXSSXUIBUJGHJY-SFJXLCSZSA-N 0.000 description 1
- VMXLNDRJXVAJFT-JYBASQMISA-N Trp-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O VMXLNDRJXVAJFT-JYBASQMISA-N 0.000 description 1
- JYLWCVVMDGNZGD-WIRXVTQYSA-N Trp-Tyr-Trp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JYLWCVVMDGNZGD-WIRXVTQYSA-N 0.000 description 1
- VCXWRWYFJLXITF-AUTRQRHGSA-N Tyr-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 VCXWRWYFJLXITF-AUTRQRHGSA-N 0.000 description 1
- FBVGQXJIXFZKSQ-GMVOTWDCSA-N Tyr-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N FBVGQXJIXFZKSQ-GMVOTWDCSA-N 0.000 description 1
- GAYLGYUVTDMLKC-UWJYBYFXSA-N Tyr-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GAYLGYUVTDMLKC-UWJYBYFXSA-N 0.000 description 1
- JFDGVHXRCKEBAU-KKUMJFAQSA-N Tyr-Asp-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O JFDGVHXRCKEBAU-KKUMJFAQSA-N 0.000 description 1
- UBAQSAUDKMIEQZ-QWRGUYRKSA-N Tyr-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 UBAQSAUDKMIEQZ-QWRGUYRKSA-N 0.000 description 1
- FJKXUIJOMUWCDD-FHWLQOOXSA-N Tyr-Gln-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N)O FJKXUIJOMUWCDD-FHWLQOOXSA-N 0.000 description 1
- CNLKDWSAORJEMW-KWQFWETISA-N Tyr-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O CNLKDWSAORJEMW-KWQFWETISA-N 0.000 description 1
- NOOMDULIORCDNF-IRXDYDNUSA-N Tyr-Gly-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NOOMDULIORCDNF-IRXDYDNUSA-N 0.000 description 1
- ILTXFANLDMJWPR-SIUGBPQLSA-N Tyr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N ILTXFANLDMJWPR-SIUGBPQLSA-N 0.000 description 1
- DZKFGCNKEVMXFA-JUKXBJQTSA-N Tyr-Ile-His Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O DZKFGCNKEVMXFA-JUKXBJQTSA-N 0.000 description 1
- BJCILVZEZRDIDR-PMVMPFDFSA-N Tyr-Leu-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=C(O)C=C1 BJCILVZEZRDIDR-PMVMPFDFSA-N 0.000 description 1
- WTTRJMAZPDHPGS-KKXDTOCCSA-N Tyr-Phe-Ala Chemical compound C[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(O)=O WTTRJMAZPDHPGS-KKXDTOCCSA-N 0.000 description 1
- IGXLNVIYDYONFB-UFYCRDLUSA-N Tyr-Phe-Arg Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CC=C(O)C=C1 IGXLNVIYDYONFB-UFYCRDLUSA-N 0.000 description 1
- PSALWJCUIAQKFW-ACRUOGEOSA-N Tyr-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N PSALWJCUIAQKFW-ACRUOGEOSA-N 0.000 description 1
- NHOVZGFNTGMYMI-KKUMJFAQSA-N Tyr-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NHOVZGFNTGMYMI-KKUMJFAQSA-N 0.000 description 1
- BIVIUZRBCAUNPW-JRQIVUDYSA-N Tyr-Thr-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O BIVIUZRBCAUNPW-JRQIVUDYSA-N 0.000 description 1
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 1
- UUJHRSTVQCFDPA-UFYCRDLUSA-N Tyr-Tyr-Val Chemical compound C([C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 UUJHRSTVQCFDPA-UFYCRDLUSA-N 0.000 description 1
- ABSXSJZNRAQDDI-KJEVXHAQSA-N Tyr-Val-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ABSXSJZNRAQDDI-KJEVXHAQSA-N 0.000 description 1
- HNWQUBBOBKSFQV-AVGNSLFASA-N Val-Arg-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HNWQUBBOBKSFQV-AVGNSLFASA-N 0.000 description 1
- IDKGBVZGNTYYCC-QXEWZRGKSA-N Val-Asn-Pro Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(O)=O IDKGBVZGNTYYCC-QXEWZRGKSA-N 0.000 description 1
- CGGVNFJRZJUVAE-BYULHYEWSA-N Val-Asp-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CGGVNFJRZJUVAE-BYULHYEWSA-N 0.000 description 1
- CFSSLXZJEMERJY-NRPADANISA-N Val-Gln-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CFSSLXZJEMERJY-NRPADANISA-N 0.000 description 1
- VFOHXOLPLACADK-GVXVVHGQSA-N Val-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N VFOHXOLPLACADK-GVXVVHGQSA-N 0.000 description 1
- OXVPMZVGCAPFIG-BQFCYCMXSA-N Val-Gln-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N OXVPMZVGCAPFIG-BQFCYCMXSA-N 0.000 description 1
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 1
- NXRAUQGGHPCJIB-RCOVLWMOSA-N Val-Gly-Asn Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O NXRAUQGGHPCJIB-RCOVLWMOSA-N 0.000 description 1
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 1
- HGJRMXOWUWVUOA-GVXVVHGQSA-N Val-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N HGJRMXOWUWVUOA-GVXVVHGQSA-N 0.000 description 1
- XTDDIVQWDXMRJL-IHRRRGAJSA-N Val-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N XTDDIVQWDXMRJL-IHRRRGAJSA-N 0.000 description 1
- XXWBHOWRARMUOC-NHCYSSNCSA-N Val-Lys-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N XXWBHOWRARMUOC-NHCYSSNCSA-N 0.000 description 1
- YDVDTCJGBBJGRT-GUBZILKMSA-N Val-Met-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N YDVDTCJGBBJGRT-GUBZILKMSA-N 0.000 description 1
- UZFNHAXYMICTBU-DZKIICNBSA-N Val-Phe-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UZFNHAXYMICTBU-DZKIICNBSA-N 0.000 description 1
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 1
- QIVPZSWBBHRNBA-JYJNAYRXSA-N Val-Pro-Phe Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O QIVPZSWBBHRNBA-JYJNAYRXSA-N 0.000 description 1
- DOFAQXCYFQKSHT-SRVKXCTJSA-N Val-Pro-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DOFAQXCYFQKSHT-SRVKXCTJSA-N 0.000 description 1
- RYHUIHUOYRNNIE-NRPADANISA-N Val-Ser-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N RYHUIHUOYRNNIE-NRPADANISA-N 0.000 description 1
- DLLRRUDLMSJTMB-GUBZILKMSA-N Val-Ser-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)O)N DLLRRUDLMSJTMB-GUBZILKMSA-N 0.000 description 1
- UEXPMFIAZZHEAD-HSHDSVGOSA-N Val-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](C(C)C)N)O UEXPMFIAZZHEAD-HSHDSVGOSA-N 0.000 description 1
- DFQZDQPLWBSFEJ-LSJOCFKGSA-N Val-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N DFQZDQPLWBSFEJ-LSJOCFKGSA-N 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 108010067390 Viral Proteins Proteins 0.000 description 1
- 108010087302 Viral Structural Proteins Proteins 0.000 description 1
- 241000269370 Xenopus <genus> Species 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 230000001594 aberrant effect Effects 0.000 description 1
- 235000011054 acetic acid Nutrition 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000001154 acute effect Effects 0.000 description 1
- 206010001053 acute respiratory failure Diseases 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 201000000028 adult respiratory distress syndrome Diseases 0.000 description 1
- 239000000443 aerosol Substances 0.000 description 1
- 238000012867 alanine scanning Methods 0.000 description 1
- 108010028939 alanyl-alanyl-lysyl-alanine Proteins 0.000 description 1
- 108010045350 alanyl-tyrosyl-alanine Proteins 0.000 description 1
- 108010005233 alanylglutamic acid Proteins 0.000 description 1
- 108010070944 alanylhistidine Proteins 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- 229940037003 alum Drugs 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- 230000009435 amidation Effects 0.000 description 1
- 238000007112 amidation reaction Methods 0.000 description 1
- 230000000689 aminoacylating effect Effects 0.000 description 1
- 229960004050 aminobenzoic acid Drugs 0.000 description 1
- 239000000908 ammonium hydroxide Substances 0.000 description 1
- 238000005571 anion exchange chromatography Methods 0.000 description 1
- 229940127002 anti-2019-nCov Drugs 0.000 description 1
- 230000000845 anti-microbial effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 108010013835 arginine glutamate Proteins 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- 150000001576 beta-amino acids Chemical class 0.000 description 1
- 239000011230 binding agent Substances 0.000 description 1
- 239000012148 binding buffer Substances 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 230000009141 biological interaction Effects 0.000 description 1
- 229960000074 biopharmaceutical Drugs 0.000 description 1
- 229920001222 biopolymer Polymers 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- JCZLABDVDPYLRZ-AWEZNQCLSA-N biphenylalanine Chemical compound C1=CC(C[C@H](N)C(O)=O)=CC=C1C1=CC=CC=C1 JCZLABDVDPYLRZ-AWEZNQCLSA-N 0.000 description 1
- 150000001642 boronic acid derivatives Chemical class 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 244000309464 bull Species 0.000 description 1
- AXCZMVOFGPJBDE-UHFFFAOYSA-L calcium dihydroxide Chemical compound [OH-].[OH-].[Ca+2] AXCZMVOFGPJBDE-UHFFFAOYSA-L 0.000 description 1
- 239000000920 calcium hydroxide Substances 0.000 description 1
- 229910001861 calcium hydroxide Inorganic materials 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- UHBYWPGGCSDKFX-UHFFFAOYSA-N carboxyglutamic acid Chemical compound OC(=O)C(N)CC(C(O)=O)C(O)=O UHBYWPGGCSDKFX-UHFFFAOYSA-N 0.000 description 1
- 230000005101 cell tropism Effects 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 210000004671 cell-free system Anatomy 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 235000013477 citrulline Nutrition 0.000 description 1
- 229960002173 citrulline Drugs 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 125000004093 cyano group Chemical group *C#N 0.000 description 1
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 239000003405 delayed action preparation Substances 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 229950006137 dexfosfoserine Drugs 0.000 description 1
- 239000008121 dextrose Substances 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000002050 diffraction method Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 231100000676 disease causative agent Toxicity 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000002003 electron diffraction Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 239000003995 emulsifying agent Substances 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 229960004887 ferric hydroxide Drugs 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 229960003692 gamma aminobutyric acid Drugs 0.000 description 1
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 1
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 1
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- JYPCXBJRLBHWME-UHFFFAOYSA-N glycyl-L-prolyl-L-arginine Natural products NCC(=O)N1CCCC1C(=O)NC(CCCN=C(N)N)C(O)=O JYPCXBJRLBHWME-UHFFFAOYSA-N 0.000 description 1
- 108010001064 glycyl-glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010025801 glycyl-prolyl-arginine Proteins 0.000 description 1
- 108010020688 glycylhistidine Proteins 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 108010028403 hemagglutinin esterase Proteins 0.000 description 1
- 108010045383 histidyl-glycyl-glutamic acid Proteins 0.000 description 1
- 230000005745 host immune response Effects 0.000 description 1
- 230000028996 humoral immune response Effects 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- MWFRVMDVLYIXJF-BYPYZUCNSA-N hydroxyethylcysteine Chemical compound OC(=O)[C@@H](N)CSCCO MWFRVMDVLYIXJF-BYPYZUCNSA-N 0.000 description 1
- 230000002519 immonomodulatory effect Effects 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 230000036737 immune function Effects 0.000 description 1
- 230000003053 immunization Effects 0.000 description 1
- 238000002649 immunization Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000000126 in silico method Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 150000007529 inorganic bases Chemical class 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 238000010255 intramuscular injection Methods 0.000 description 1
- 239000007927 intramuscular injection Substances 0.000 description 1
- 238000007912 intraperitoneal administration Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- IEECXTSVVFWGSE-UHFFFAOYSA-M iron(3+);oxygen(2-);hydroxide Chemical compound [OH-].[O-2].[Fe+3] IEECXTSVVFWGSE-UHFFFAOYSA-M 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- JJWLVOIRVHMVIS-UHFFFAOYSA-N isopropylamine Chemical compound CC(C)N JJWLVOIRVHMVIS-UHFFFAOYSA-N 0.000 description 1
- GCHPUFAZSONQIV-UHFFFAOYSA-N isovaline Chemical compound CCC(C)(N)C(O)=O GCHPUFAZSONQIV-UHFFFAOYSA-N 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 238000011031 large-scale manufacturing process Methods 0.000 description 1
- 230000021633 leukocyte mediated immunity Effects 0.000 description 1
- GZQKNULLWNGMCW-PWQABINMSA-N lipid A (E. coli) Chemical class O1[C@H](CO)[C@@H](OP(O)(O)=O)[C@H](OC(=O)C[C@@H](CCCCCCCCCCC)OC(=O)CCCCCCCCCCCCC)[C@@H](NC(=O)C[C@@H](CCCCCCCCCCC)OC(=O)CCCCCCCCCCC)[C@@H]1OC[C@@H]1[C@@H](O)[C@H](OC(=O)C[C@H](O)CCCCCCCCCCC)[C@@H](NC(=O)C[C@H](O)CCCCCCCCCCC)[C@@H](OP(O)(O)=O)O1 GZQKNULLWNGMCW-PWQABINMSA-N 0.000 description 1
- 230000029226 lipidation Effects 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 239000006193 liquid solution Substances 0.000 description 1
- 239000006194 liquid suspension Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010057952 lysyl-phenylalanyl-lysine Proteins 0.000 description 1
- ZLNQQNXFFQJAID-UHFFFAOYSA-L magnesium carbonate Chemical compound [Mg+2].[O-]C([O-])=O ZLNQQNXFFQJAID-UHFFFAOYSA-L 0.000 description 1
- 239000001095 magnesium carbonate Substances 0.000 description 1
- 229910000021 magnesium carbonate Inorganic materials 0.000 description 1
- 235000019359 magnesium stearate Nutrition 0.000 description 1
- VZCYOOQTPOCHFL-UPHRSURJSA-N maleic acid Chemical compound OC(=O)\C=C/C(O)=O VZCYOOQTPOCHFL-UPHRSURJSA-N 0.000 description 1
- 239000011976 maleic acid Substances 0.000 description 1
- 239000000594 mannitol Substances 0.000 description 1
- 235000010355 mannitol Nutrition 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 229940078547 methylserine Drugs 0.000 description 1
- 239000003094 microcapsule Substances 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- JMUHBNWAORSSBD-WKYWBUFDSA-N mifamurtide Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@@H](OC(=O)CCCCCCCCCCCCCCC)COP(O)(=O)OCCNC(=O)[C@H](C)NC(=O)CC[C@H](C(N)=O)NC(=O)[C@H](C)NC(=O)[C@@H](C)O[C@H]1[C@H](O)[C@@H](CO)OC(O)[C@@H]1NC(C)=O JMUHBNWAORSSBD-WKYWBUFDSA-N 0.000 description 1
- 229960005225 mifamurtide Drugs 0.000 description 1
- 108700007621 mifamurtide Proteins 0.000 description 1
- 150000007522 mineralic acids Chemical class 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 229940126619 mouse monoclonal antibody Drugs 0.000 description 1
- 208000029744 multiple organ dysfunction syndrome Diseases 0.000 description 1
- 238000002887 multiple sequence alignment Methods 0.000 description 1
- 238000001216 nucleic acid method Methods 0.000 description 1
- 239000007764 o/w emulsion Substances 0.000 description 1
- 238000006384 oligomerization reaction Methods 0.000 description 1
- 210000000287 oocyte Anatomy 0.000 description 1
- 150000007524 organic acids Chemical class 0.000 description 1
- 235000005985 organic acids Nutrition 0.000 description 1
- 150000007530 organic bases Chemical class 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 235000006408 oxalic acid Nutrition 0.000 description 1
- 230000001590 oxidative effect Effects 0.000 description 1
- 239000006179 pH buffering agent Substances 0.000 description 1
- 230000006320 pegylation Effects 0.000 description 1
- 229960001639 penicillamine Drugs 0.000 description 1
- 238000002823 phage display Methods 0.000 description 1
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 1
- 239000008363 phosphate buffer Substances 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- BZQFBWGGLXLEPQ-REOHCLBHSA-N phosphoserine Chemical compound OC(=O)[C@@H](N)COP(O)(O)=O BZQFBWGGLXLEPQ-REOHCLBHSA-N 0.000 description 1
- USRGIUJOYOXOQJ-GBXIJSLDSA-N phosphothreonine Chemical compound OP(=O)(O)O[C@H](C)[C@H](N)C(O)=O USRGIUJOYOXOQJ-GBXIJSLDSA-N 0.000 description 1
- DCWXELXMIBXGTH-UHFFFAOYSA-N phosphotyrosine Chemical compound OC(=O)C(N)CC1=CC=C(OP(O)(O)=O)C=C1 DCWXELXMIBXGTH-UHFFFAOYSA-N 0.000 description 1
- 238000005222 photoaffinity labeling Methods 0.000 description 1
- 239000006187 pill Substances 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 229920001515 polyalkylene glycol Polymers 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 235000010482 polyoxyethylene sorbitan monooleate Nutrition 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 229920000053 polysorbate 80 Polymers 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 230000002335 preservative effect Effects 0.000 description 1
- MFDFERRIHVXMIY-UHFFFAOYSA-N procaine Chemical compound CCN(CC)CCOC(=O)C1=CC=C(N)C=C1 MFDFERRIHVXMIY-UHFFFAOYSA-N 0.000 description 1
- 229960004919 procaine Drugs 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 1
- 239000003380 propellant Substances 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 229940023143 protein vaccine Drugs 0.000 description 1
- 208000005333 pulmonary edema Diseases 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 239000001397 quillaja saponaria molina bark Substances 0.000 description 1
- 238000002708 random mutagenesis Methods 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 201000004193 respiratory failure Diseases 0.000 description 1
- 208000020029 respiratory tract infectious disease Diseases 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 238000007363 ring formation reaction Methods 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 102220081228 rs372168541 Human genes 0.000 description 1
- CVHZOJJKTDOEJC-UHFFFAOYSA-N saccharin Chemical compound C1=CC=C2C(=O)NS(=O)(=O)C2=C1 CVHZOJJKTDOEJC-UHFFFAOYSA-N 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 229940043230 sarcosine Drugs 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 235000014102 seafood Nutrition 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 208000026425 severe pneumonia Diseases 0.000 description 1
- 229940074404 sodium succinate Drugs 0.000 description 1
- ZDQYSKICYIVCPN-UHFFFAOYSA-L sodium succinate (anhydrous) Chemical compound [Na+].[Na+].[O-]C(=O)CCC([O-])=O ZDQYSKICYIVCPN-UHFFFAOYSA-L 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 230000037439 somatic mutation Effects 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000009987 spinning Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 229940038774 squalene oil Drugs 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- YROXIXLRRCOBKF-UHFFFAOYSA-N sulfonylurea Chemical compound OC(=N)N=S(=O)=O YROXIXLRRCOBKF-UHFFFAOYSA-N 0.000 description 1
- 239000003826 tablet Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 239000011975 tartaric acid Substances 0.000 description 1
- 235000002906 tartaric acid Nutrition 0.000 description 1
- 150000003536 tetrazoles Chemical class 0.000 description 1
- 229940021747 therapeutic vaccine Drugs 0.000 description 1
- RTKIYNMVFMVABJ-UHFFFAOYSA-L thimerosal Chemical compound [Na+].CC[Hg]SC1=CC=CC=C1C([O-])=O RTKIYNMVFMVABJ-UHFFFAOYSA-L 0.000 description 1
- 150000003556 thioamides Chemical class 0.000 description 1
- 229960004906 thiomersal Drugs 0.000 description 1
- 229960000187 tissue plasminogen activator Drugs 0.000 description 1
- 230000005100 tissue tropism Effects 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 231100000765 toxin Toxicity 0.000 description 1
- FGMPLJWBKKVCDB-UHFFFAOYSA-N trans-L-hydroxy-proline Natural products ON1CCCC1C(O)=O FGMPLJWBKKVCDB-UHFFFAOYSA-N 0.000 description 1
- VZCYOOQTPOCHFL-UHFFFAOYSA-N trans-butenedioic acid Natural products OC(=O)C=CC(O)=O VZCYOOQTPOCHFL-UHFFFAOYSA-N 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- XETCRXVKJHBPMK-MJSODCSWSA-N trehalose 6,6'-dimycolate Chemical compound C([C@@H]1[C@H]([C@H](O)[C@@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](COC(=O)C(CCCCCCCCCCC3C(C3)CCCCCCCCCCCCCCCCCC)C(O)CCCCCCCCCCCCCCCCCCCCCCCCC)O2)O)O1)O)OC(=O)C(C(O)CCCCCCCCCCCCCCCCCCCCCCCCC)CCCCCCCCCCC1CC1CCCCCCCCCCCCCCCCCC XETCRXVKJHBPMK-MJSODCSWSA-N 0.000 description 1
- 150000003626 triacylglycerols Chemical class 0.000 description 1
- 108010080629 tryptophan-leucine Proteins 0.000 description 1
- 108010045269 tryptophyltryptophan Proteins 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 238000002255 vaccination Methods 0.000 description 1
- 230000007501 viral attachment Effects 0.000 description 1
- 229940023148 viral-based vaccine Drugs 0.000 description 1
- 210000002845 virion Anatomy 0.000 description 1
- 238000009736 wetting Methods 0.000 description 1
- 239000000080 wetting agent Substances 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
- A61K39/215—Coronaviridae, e.g. avian infectious bronchitis virus
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/14—Antivirals for RNA viruses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
- C07K14/08—RNA viruses
- C07K14/165—Coronaviridae, e.g. avian infectious bronchitis virus
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
- C07K16/08—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from viruses
- C07K16/10—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from viruses from RNA viruses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/115—Aptamers, i.e. nucleic acids binding a target molecule specifically and with high affinity without hybridising therewith ; Nucleic acids binding to non-nucleic acids, e.g. aptamers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
- C12N15/815—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts for yeasts other than Saccharomyces
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N7/00—Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/505—Medicinal preparations containing antigens or antibodies comprising antibodies
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/51—Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
- A61K2039/525—Virus
- A61K2039/5258—Virus-like particles
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/51—Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
- A61K2039/53—DNA (RNA) vaccination
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/555—Medicinal preparations containing antigens or antibodies characterised by a specific combination antigen/adjuvant
- A61K2039/55505—Inorganic adjuvants
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/555—Medicinal preparations containing antigens or antibodies characterised by a specific combination antigen/adjuvant
- A61K2039/55511—Organic adjuvants
- A61K2039/55566—Emulsions, e.g. Freund's adjuvant, MF59
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/555—Medicinal preparations containing antigens or antibodies characterised by a specific combination antigen/adjuvant
- A61K2039/55511—Organic adjuvants
- A61K2039/55572—Lipopolysaccharides; Lipid A; Monophosphoryl lipid A
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/20011—Papillomaviridae
- C12N2710/20022—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/20011—Papillomaviridae
- C12N2710/20023—Virus like particles [VLP]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/20011—Coronaviridae
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/20011—Coronaviridae
- C12N2770/20022—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/20011—Coronaviridae
- C12N2770/20023—Virus like particles [VLP]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/20011—Coronaviridae
- C12N2770/20034—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/28011—Hepeviridae
- C12N2770/28111—Hepevirus, e.g. hepatitis E virus
- C12N2770/28122—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/28011—Hepeviridae
- C12N2770/28111—Hepevirus, e.g. hepatitis E virus
- C12N2770/28123—Virus like particles [VLP]
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Virology (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Communicable Diseases (AREA)
- Mycology (AREA)
- Pharmacology & Pharmacy (AREA)
- Public Health (AREA)
- Animal Behavior & Ethology (AREA)
- Veterinary Medicine (AREA)
- Immunology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Epidemiology (AREA)
- Gastroenterology & Hepatology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Oncology (AREA)
- General Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Pulmonology (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
Abstract
본 발명은 2019-nCoV 감염의 치료 또는 예방을 위한 코로나바이러스 2019-nCoV 스파이크 단백질, 상기 스파이크 단백질을 코딩하는 폴리뉴클레오티드, 항체 및 백신에 관한 것이다. 한 실시양태는 서열식별번호: 1과 적어도 90% 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 코딩하는 단리된 폴리뉴클레오티드를 지칭하며, 여기서 상기 폴리뉴클레오티드는 재조합 발현에 대해 최적화된다. 특정한 실시양태에서, 폴리뉴클레오티드는 (a) 에스케리키아 콜라이; (b) 효모, 바람직하게는 코마가타엘라 또는 사카로미세스; 및/또는 (c) 포유동물 세포, 바람직하게는 인간 세포로부터 선택되는 숙주 세포에서의 발현에 대해 최적화된다.
Description
본 발명은 2019-nCoV 감염의 치료 또는 예방을 위한 코로나바이러스 2019-nCoV 스파이크 단백질, 상기 스파이크 단백질을 코딩하는 폴리뉴클레오티드, 항체 및 백신에 관한 것이다.
2019년 12월 8일 이후 중국 후베이성 우한에서 미지 병인의 폐렴의 여러 사례가 보고되었다. 대부분의 환자들은 살아있는 동물도 판매하는 현지 화난 해산물 도매 시장에서 일하거나 그 주변에서 살았다. 이 폐렴의 초기 단계에서, 중증 급성 호흡기 감염 증상이 발생하였고, 일부 환자는 급성 호흡 곤란 증후군 (ARDS), 급성 호흡 부전 및 다른 심각한 합병증이 급속하게 발생하였다. 2020년 1월 7일에, 신규 코로나바이러스가 중국 질병 통제 예방 센터 (CDC)에 의해 환자의 인후 면봉 샘플로부터 확인되었고, 후속적으로 WHO에 의해 2019-nCoV로 명명되었고, 현재 SARS-CoV-2로 지정되었다.
코로나바이러스는 다양한 동물에서 다계통 감염 및 주로 인간에서 기도 감염, 예컨대 중증 급성 호흡기 증후군 (SARS) 및 중동 호흡기 증후군 (MERS)을 유발할 수 있다. 대부분의 환자는 경도 증상 및 양호한 예후를 갖는다.
지금까지, 2019-nCoV를 갖는 소수의 환자가 중증 폐렴, 폐 부종, ARDS 또는 다발성 기관 부전이 발생하였고, 사망하였다. 2019-nCoV 치료의 모든 비용은 중국에서 의료 보험에 포함된다. 현재, 2019-nCoV에 의해 유발되는 폐렴의 역학 및 임상적 특징에 관한 정보는 부족하고, 백신은 이용가능하지 않다. 따라서, 2019-nCoV 감염을 예방 및 치료하기 위해 백신에서 사용될 수 있는 항원의 개발이 지속적으로 필요하다. 추가로, 저렴하게 소정의 규모로 생산될 수 있는 항원을 제공할 필요가 있다.
본 발명은 2019-nCoV 항원, 특히 2019-nCoV의 스파이크 단백질로부터의 항원을 코딩하는 폴리뉴클레오티드, 상기 폴리뉴클레오티드를 포함하는 벡터, 상기 항원을 코딩하는 벡터, 및 항원에 대해 생성된 결합 화합물 (특히 항체 및 항체-유사 분자 (압타머 및 펩티드 포함))을, 2019-nCoV에 의한 감염의 예방 또는 치료에서의 그의 사용 (단독으로 또는 조합하여)과 함께 제공함으로써 상기 요구 중 하나 이상을 해결한다. 항원을 코딩하는 폴리뉴클레오티드는 관심 숙주 세포에서의 발현에 대해 최적화된다. 항원에 대해 생성된 항체 및 항체-유사 분자는 항원에 결합할 (예를 들어, 특이적으로 결합할) 수 있다.
현재까지, 2019-nCoV에 대한 백신은 개발되지 않았다. 본 발명자들은 2019-nCoV 스파이크 단백질을 코딩하며, 통상적으로 사용되는 발현 시스템에서의 발현에 대해 최적화된 폴리뉴클레오티드를 개발하였다. 이러한 폴리뉴클레오티드는 2019-nCoV 스파이크 단백질의 발현 수준 및 지속기간 증가를 제공하여, 이를 상기 항원의 대규모 생산에 유리하게 만든다. 또한, 본 발명자들이 고안한 폴리뉴클레오티드는 천연 스파이크 단백질의 입체형태를 보유하는 형태의 스파이크 단백질 아미노산 서열을 코딩한다. 따라서, 본 발명에 따라 생성된 스파이크 단백질은 특히 중화 항체의 생성을 통해 면역보호 반응을 일으킬 수 있다.
따라서, 본 발명은 서열식별번호: 1과 적어도 90% 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 코딩하며, 재조합 발현에 대해 최적화된 단리된 폴리뉴클레오티드를 제공한다.
상기 폴리뉴클레오티드는 에스케리키아 콜라이(Escherichia coli); 효모, 바람직하게는 코마가타엘라(Komagataella) 또는 사카로미세스(Saccharomyces); 및/또는 포유동물 세포, 바람직하게는 인간 세포로부터 선택되는 숙주 세포에서의 발현에 대해 최적화될 수 있다. 최적화는 내부 TATA-박스; chi-부위; 리보솜 진입 부위; 서열의 AT-풍부 및/또는 GC-풍부 스트레치; RNA 불안정성 모티프; 반복 서열 및/또는 RNA 2차 구조; 잠재 스플라이스 공여자 부위; 잠재 스플라이스 수용 부위; 및/또는 (a) 내지 (i)의 임의의 조합으로부터 독립적으로 선택된 하나 이상의 시스-작용성 서열 모티프를 생략함으로써 일어날 수 있다. 상기 폴리뉴클레오티드는 숙주 세포 게놈 내로 통합될 수 있다. 상기 폴리뉴클레오티드는 적어도 약 0.80, 바람직하게는 적어도 약 0.9, 보다 바람직하게는 적어도 약 0.93의 코돈 적응 지수 (CAI)를 가질 수 있다. 본 발명의 폴리뉴클레오티드는 서열식별번호: 2 내지 8, 13, 14, 26, 27, 28, 30 또는 32 중의 어느 하나에 대해 적어도 90% 동일성을 갖는 핵산 서열을 포함하거나 또는 그로 이루어질 수 있다. 본 발명의 폴리뉴클레오티드는 전형적으로 (i) 천연 2019-nCoV 스파이크 단백질에 존재하는 입체형태적 에피토프를 보유하고/거나; (ii) 핵산 또는 코딩된 스파이크 단백질 또는 그의 단편이 대상체에게 투여될 때 스파이크 단백질 또는 그의 단편에 특이적인 중화 항체의 생성을 유발하고/거나; (iii) 바람직하게는 서열식별번호: 15와 적어도 90% 동일성을 갖는 2019-nCoV 스파이크 단백질의 수용체-결합 도메인 (RBD)을 포함하거나 또는 그로 이루어진, 스파이크 단백질 또는 그의 단편을 코딩한다.
본 발명은 프로모터에 작동가능하게 연결된 본 발명의 폴리뉴클레오티드를 포함하는 발현 구축물을 추가로 제공한다.
본 발명은, 서열식별번호: 1과 적어도 90% 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 포함하고, 여기서 임의로 상기 단편은 바람직하게는 서열식별번호: 15와 적어도 90% 동일성을 갖는 2019-nCoV 스파이크 단백질의 수용체-결합 도메인 (RBD)을 포함하거나 또는 그로 이루어진 것인 백신 조성물을 추가로 제공한다. 상기 백신은 전형적으로 대상체에게 투여될 때 스파이크 단백질 또는 그의 단편에 특이적인 중화 항체를 생성한다.
본 발명은 또한, 서열식별번호: 1과 적어도 90% 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 발현하고, 여기서 임의로 상기 단편은 바람직하게는 서열식별번호: 15와 적어도 90% 동일성을 갖는 2019-nCoV 스파이크 단백질의 수용체-결합 도메인 (RBD)을 포함하거나 또는 그로 이루어진 것인 바이러스 벡터, RNA 백신 또는 DNA 플라스미드를 제공한다. 상기 바이러스 벡터, RNA 백신 또는 DNA 플라스미드는 신호 펩티드를 추가로 코딩할 수 있다. 신호 펩티드는 인간 세포로부터의 분비를 지시할 수 있다. 본 발명의 바이러스 벡터, RNA 백신 또는 DNA 플라스미드는 하나 이상의 추가의 항원 또는 그의 단편, 바람직하게는 2019-nCoV로부터의 하나 이상의 추가의 항원 또는 그의 단편을 추가로 발현할 수 있다. 스파이크 단백질 또는 그의 단편 및 하나 이상의 추가의 항원 또는 그의 단편은 융합 단백질로서; 또는 조합하여 사용하기 위한 개별 바이러스 벡터, RNA 백신 또는 DNA 플라스미드에서 발현될 수 있다. 상기 바이러스 벡터, RNA 백신 또는 DNA 플라스미드는 본 발명의 하나 이상의 폴리뉴클레오티드 또는 발현 구축물을 포함할 수 있다.
본 발명은 서열식별번호: 1과 적어도 90% 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 포함하고, 여기서 임의로 상기 단편은 바람직하게는 서열식별번호: 15와 적어도 90% 동일성을 갖는 2019-nCoV 스파이크 단백질의 수용체-결합 도메인 (RBD)을 포함하거나 또는 그로 이루어진 것인 융합 단백질을 또한 제공한다. 상기 VLP 또는 융합 단백질은 B형 간염 표면 항원 (HBSAg), 또는 상기 HBSAg와 공통 항원 교차-반응성을 갖는 그의 단편; HPV 18 L1 단백질, 또는 상기 HPV 18 L1 단백질과 공통 항원 교차-반응성을 갖는 그의 단편; E형 간염 P239 단백질 (HEV), 또는 상기 E형 간염 P239 단백질과 공통 항원 교차-반응성을 갖는 그의 단편; 및/또는 HPV 16 L1 단백질, 또는 상기 HPV 16 L1 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 추가로 포함할 수 있다. 융합 단백질은 서열식별번호: 3, 5, 6, 8, 26, 27, 29, 30 또는 32 중 어느 하나와 적어도 90% 동일성을 갖는 핵산 서열을 포함하거나 또는 그로 이루어진 폴리뉴클레오티드에 의해 코딩될 수 있고/거나; 융합 단백질은 서열식별번호: 9, 10, 11, 12, 28, 31 또는 33 중 어느 하나와 적어도 90% 동일성을 갖는 아미노산 서열을 포함하거나 또는 그로 이루어질 수 있다.
본 발명은 또한, 서열식별번호: 1과 적어도 90% 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 포함하고, 여기서 임의로 상기 단편은 바람직하게는 서열식별번호: 15와 적어도 90% 동일성을 갖는 2019-nCoV 스파이크 단백질의 수용체-결합 도메인 (RBD)을 포함하거나 또는 그로 이루어진 것인 바이러스-유사 입자를 제공한다. 바람직하게는, VLP는 본 발명의 융합 단백질을 포함하거나 또는 그로 이루어진다.
본 발명은 또한 본원에서와 같은 2091-nCoV 스파이크 단백질 항원 또는 그의 단편에 특이적으로 결합하는 항체 또는 그의 결합 단편을 제공한다. 상기 항체 또는 그의 결합 단편은 모노클로날 또는 폴리클로날 항체일 수 있다. 상기 항체 또는 그의 결합 단편은 Fab, F(ab')2, Fv, scFv, Fd 또는 dAb일 수 있다.
본 발명은 본원에 정의된 바와 같은 2019-nCoV 스파이크 단백질 또는 그의 단편에 특이적으로 결합하는 올리고뉴클레오티드 압타머를 추가로 제공한다.
본 발명은 본 발명의 바이러스 벡터, 및/또는 RNA 백신 및/또는 DNA 플라스미드를 포함하는 백신 조성물을 제공한다.
본 발명은 또한 2019-nCoV 감염의 치료 및/또는 예방에 사용하기 위한 본 발명의 폴리뉴클레오티드, 및/또는 본 발명의 발현 구축물, 및/또는 본 발명의 백신 조성물, 및/또는 본 발명의 바이러스 벡터 및/또는 RNA 백신 및/또는 DNA 플라스미드 및/또는 본 발명의 바이러스-유사 입자, 및/또는 본 발명의 융합 단백질, 및/또는 본 발명의 항체 및/또는 본 발명의 압타머를 제공한다.
본 발명은 또한 2019-nCoV 감염의 예방 및/또는 치료를 위한 의약의 제조에서의 본 발명의 폴리뉴클레오티드, 및/또는 본 발명의 발현 구축물, 및/또는 본 발명의 백신 조성물, 및/또는 본 발명의 바이러스 벡터 및/또는 RNA 백신 및/또는 DNA 플라스미드 및/또는 본 발명의 바이러스-유사 입자, 및/또는 본 발명의 융합 단백질, 및/또는 본 발명의 항체 및/또는 본 발명의 압타머의 용도를 제공한다.
본 발명은 숙주 세포에서 본 발명의 폴리뉴클레오티드를 발현시키는 단계, 및 임의로 스파이크 단백질 또는 단편을 정제하는 단계를 포함하는, 서열식별번호: 1과 적어도 90% 동일성을 갖는 2019-nCoV로부터 스파이크 단백질 또는 그의 단편을 생산하는 방법을 또한 제공한다. 상기 방법은 상기 스파이크 단백질 또는 그의 단편을 제약상 허용되는 담체 또는 희석제와 함께 제제화하는 것을 추가로 포함할 수 있다.
도 1: 코로나바이러스의 구조 및 구조 단백질의 기능의 개략도.
도 2: 2019-nCoV 스파이크 단백질, 및 본 발명에 따라 생성된 2019-nCoV 스파이크 단백질을 포함하는 융합 단백질의 투여 후 제0일 및 제14일에 항체 역가를 기록한 ELISA로부터의 표로 만든 결과.
도 3: 40시간 후 (원심 여과에 의한 농축 후) 배양 배지로 방출된 분비 단백질 HBSAg(EAAAK)3RBD를 나타낸 웨스턴 블롯. 좌측 블롯 = HBSAg 항체. 우측 블롯 = 2019-nCoV 항체. 양쪽 블롯에 대해, 레인 M = 마커; 레인 1 = HEV-GGGS-RBD #10B; 레인 2 = HBSAg-EAAK-RBD #2A (293F 분비형, 브래드포드 검정에 의한 총 단백질 함량 = 750 μg/ml); 레인 3 = HBSAg-EAAAK-RBD #2B (293F 분비형, 브래드포드 검정에 의한 총 단백질 함량 = 500 μg/ml); 레인 4 = CoV-s #17 (293F 표면 결합 HisTag)
도 4: HEK 세포에서 생산된 HBSAg(EAAAK)3RBD가 단독으로, 또는 수산화알루미늄 또는 아다박스(Addavax)™ 아주반트와 함께 접종된 마우스에서의 제14일 (A) 및 제42일 (B)의 역가를 도시한 그래프.
도 5: 이. 콜라이에 의해 생산된 분비 단백질 HEV-(GGGGS)3-RBD를 나타낸 웨스턴 블롯. 좌측 블롯 = #10A. 중간 블롯 = #10B. 우측 블롯 = #10C. 모든 블롯에 대해, 항-HEV mAB를 1:4000의 희석물로 사용하였다.
도 6: 이. 콜라이에서 생산된 HEV-GGGGS-RBD가 단독으로, 또는 수산화알루미늄 또는 아다박스™ 아주반트와 함께 접종된 마우스에서의 제14일 (A) 및 제42일 (B)의 역가를 도시한 그래프.
도 7: HEK 293 세포에서 발현된 재조합 HBSAg-(EAAAK)3-전장 2019-nCoV 스파이크 단백질 융합 단백질 (HBSAg-(EAAAK)3-CoV-s) 클론 D8-SA01-01-01 (4x) 및 클론 D8-SA01-02-01 (5X)의 웨스턴 블롯.
도 2: 2019-nCoV 스파이크 단백질, 및 본 발명에 따라 생성된 2019-nCoV 스파이크 단백질을 포함하는 융합 단백질의 투여 후 제0일 및 제14일에 항체 역가를 기록한 ELISA로부터의 표로 만든 결과.
도 3: 40시간 후 (원심 여과에 의한 농축 후) 배양 배지로 방출된 분비 단백질 HBSAg(EAAAK)3RBD를 나타낸 웨스턴 블롯. 좌측 블롯 = HBSAg 항체. 우측 블롯 = 2019-nCoV 항체. 양쪽 블롯에 대해, 레인 M = 마커; 레인 1 = HEV-GGGS-RBD #10B; 레인 2 = HBSAg-EAAK-RBD #2A (293F 분비형, 브래드포드 검정에 의한 총 단백질 함량 = 750 μg/ml); 레인 3 = HBSAg-EAAAK-RBD #2B (293F 분비형, 브래드포드 검정에 의한 총 단백질 함량 = 500 μg/ml); 레인 4 = CoV-s #17 (293F 표면 결합 HisTag)
도 4: HEK 세포에서 생산된 HBSAg(EAAAK)3RBD가 단독으로, 또는 수산화알루미늄 또는 아다박스(Addavax)™ 아주반트와 함께 접종된 마우스에서의 제14일 (A) 및 제42일 (B)의 역가를 도시한 그래프.
도 5: 이. 콜라이에 의해 생산된 분비 단백질 HEV-(GGGGS)3-RBD를 나타낸 웨스턴 블롯. 좌측 블롯 = #10A. 중간 블롯 = #10B. 우측 블롯 = #10C. 모든 블롯에 대해, 항-HEV mAB를 1:4000의 희석물로 사용하였다.
도 6: 이. 콜라이에서 생산된 HEV-GGGGS-RBD가 단독으로, 또는 수산화알루미늄 또는 아다박스™ 아주반트와 함께 접종된 마우스에서의 제14일 (A) 및 제42일 (B)의 역가를 도시한 그래프.
도 7: HEK 293 세포에서 발현된 재조합 HBSAg-(EAAAK)3-전장 2019-nCoV 스파이크 단백질 융합 단백질 (HBSAg-(EAAAK)3-CoV-s) 클론 D8-SA01-01-01 (4x) 및 클론 D8-SA01-02-01 (5X)의 웨스턴 블롯.
본원에서 달리 정의되지 않는 한, 본 발명과 관련하여 사용된 과학 및 기술 용어는 관련 기술분야의 통상의 기술자에 의해 통상적으로 이해되는 의미를 가질 것이다. 용어의 의미 및 범위는 명확해야 하지만; 임의의 잠재적 모호성이 있는 경우에 본원에 제공된 정의가 임의의 사전적 또는 외인적 정의보다 우선한다. 본 발명은 본원에 기재된 특정한 방법론, 프로토콜 및 시약 등으로 제한되지 않으며, 그 자체가 다양할 수 있는 것으로 이해되어야 한다. 본원에 사용된 용어는 특정한 실시양태만을 기재하기 위한 목적이며, 청구범위에 의해서만 규정되는 본 발명의 범주를 제한하는 것으로 의도되지 않는다. 추가로, 문맥상 달리 요구되지 않는 한, 단수 용어는 복수를 포함할 것이고, 복수 용어는 단수를 포함할 것이다. 본 출원에서, "또는"의 사용은 달리 언급되지 않는 한 "및/또는"을 의미한다. 또한, 용어 "포함하는" 뿐만 아니라 다른 형태, 예컨대 "포함하다" 및 "포함되다"의 사용은 제한적이지 않다.
본 개시내용의 실시양태의 기재는 완전하거나 본 개시내용이 개시된 정확한 형태로 제한되도록 의도하지 않는다. 본 개시내용의 구체적 실시양태 및 그에 대한 실시예가 예시적 목적을 위해 본원에 기재되지만, 관련 기술분야의 통상의 기술자가 인지하는 바와 같이, 본 개시내용의 범주 내에서 다양한 등가의 변형이 가능하다. 예를 들어, 방법 단계 또는 기능이 주어진 순서로 제시되지만, 대안적 실시양태는 기능을 상이한 순서로 수행할 수 있거나, 또는 기능이 실질적으로 동시에 수행될 수 있다. 본원에 제공된 개시내용의 교시는 적절하게 다른 절차 또는 방법에 적용될 수 있다. 본원에 기재된 다양한 실시양태는 조합하여 추가의 실시양태를 제공할 수 있다. 본 개시내용의 측면은, 필요한 경우, 상기 참고문헌 및 출원의 조성물, 기능 및 개념을 사용하여 본 개시내용의 추가 실시양태를 제공하도록 변형될 수 있다. 또한, 생물학적 기능적 동등성 고려사항으로 인해, 종류 또는 양에 있어서 생물학적 또는 화학적 작용에 영향을 미치지 않으면서 단백질 구조에서 일부 변화가 이루어질 수 있다. 이들 및 다른 변화는 상세한 설명에 비추어 본 개시내용에 대해 이루어질 수 있다. 이러한 모든 변형은 첨부된 청구범위의 범주 내에 포함되는 것으로 의도된다.
본원에 논의된 간행물은 본 출원의 출원일 이전의 그의 개시내용에 대해서만 제공된다. 본원에서의 어떠한 것도 이러한 간행물이 본원에 첨부된 청구범위에 대한 선행 기술을 구성한다는 것을 인정하는 것으로 해석되지 않아야 한다.
코로나바이러스
코로나바이러스 (CoV)는 니도비랄레스(Nidovirales) 목의 코로나비리다에(Coronaviridae) 과 중 코로나비리나에(Coronavirinae) 아과에 속한다. 4가지 속이 있다: 알파코로나바이러스, 베타코로나바이러스, 감마코로나바이러스 및 델타코로나바이러스. 알파코로나바이러스 및 베타코로나바이러스는 포유동물의 종을 감염시키고, 감마코로나바이러스는 조류의 종을 감염시키고, 델타코로나바이러스는 포유동물 및 조류의 종 둘 다를 감염시킨다.
CoV는 큰 외피보유 단일 양성-센스 RNA 바이러스이다. RNA 바이러스의 돌연변이율은 DNA 바이러스보다 크며, 이는 생존을 위한 보다 효율적인 적응 프로세스를 시사한다.
CoV는 모든 RNA 바이러스 중에서 가장 큰 게놈을 가지며, 전형적으로 27 내지 32 kb 범위이다. CoV 게놈은 적어도 4종의 주요 구조 단백질: 스파이크 (S), 막 (M), 외피 (E), 뉴클레오캡시드 (N) 단백질, 및 복제 과정을 보조하고 세포 내로의 진입을 용이하게 하는 다른 보조 단백질을 코딩한다. 도 1은 코로나바이러스의 구조 및 구조 단백질의 기능을 요약한다. 간략하게, CoV 게놈은, 뉴클레오캡시드에 의해 형성되고 외피에 의해 추가로 둘러싸인 나선형 캡시드 내부에 패킹된다. 적어도 3종의 구조 단백질: 바이러스 조립에 수반되는 막 및 외피 단백질, 및 숙주 세포 내로의 바이러스 진입을 매개하는 스파이크 단백질이 바이러스 외피와 연관된다. 일부 코로나바이러스는 또한 외피-연관 헤마글루티닌-에스테라제 단백질 (HE)을 코딩한다. 스파이크 단백질은 바이러스 표면으로부터 큰 돌출부를 형성하여 코로나바이러스에 크라운을 갖는 외관을 제공하고, 이로부터 "코로나바이러스"라는 명칭이 유래되었다. 스파이크 단백질은 바이러스 진입을 매개할 뿐만 아니라 바이러스 숙주 범위 및 조직 향성 및 숙주 면역 반응의 주요 유도인자의 중요한 결정인자이다.
2019-nCoV (공식적으로 중증 급성 호흡기 증후군 코로나바이러스 2, SARS-CoV-2로 명명되고, 두 용어는 본원에서 상호교환가능하게 사용됨)는 코로나바이러스 질환 2019 (COVID-19)의 병원체이고, 인간 사이에서 전염성이다. 2019-nCoV는 동물에서 기원한 것으로 여겨지며, SARS-CoV (79.5%) 및 박쥐 코로나바이러스 (96%)에 대한 2019-nCoV의 유전적 유사성을 고려할 때 박쥐가 공급원일 가능성이 있다. CoV에 관한 본원의 임의의 개시내용은 또한 직접적으로 및 제한 없이 2019-nCoV에 적용된다.
CoV 스파이크 단백질은 3개의 도메인을 포함한다: (i) 대형 엑토도메인; (ii) 막횡단 도메인 (단일 통과로 바이러스 외피를 통과함); 및 (iii) 짧은 세포내 꼬리. 엑토도메인은 3개의 수용체-결합 서브유닛 (3 x S1), 및 3개의 막-융합 서브유닛 (3 x S2)으로 제조된 삼량체 줄기로 이루어진다. 바이러스 진입 동안, S1은 바이러스 부착을 위해 숙주 세포 표면 상의 수용체에 결합하고, S2는 숙주 및 바이러스 막을 융합시켜 바이러스 게놈이 숙주 세포에 진입하게 한다. 수용체 결합 및 막 융합은 코로나바이러스 감염 사이클에서 초기 및 결정적인 단계이다. 상이한 CoV에 의해 표적화된 수용체에서 유의한 차이가 있다.
2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편은 2019-nCoV 감염에 대한 백신용 항원으로서의 치료 잠재력을 갖는다.
따라서, 본원에 기재된 바와 같이, 본 발명은 서열식별번호: 1과 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 2019-nCoV 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편에 관한 것이다. 바람직하게는, 본 발명은 서열식별번호: 1과 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편에 관한 것이다. 보다 바람직하게는, 본 발명은 서열식별번호: 1과 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편에 관한 것이다. 2019-nCoV로부터의 스파이크 단백질은 서열식별번호: 1, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 포함하거나 또는 그로 이루어질 수 있다.
본 발명에 따르면, 본 발명의 폴리뉴클레오티드에 의해 코딩되는 2019-nCoV 스파이크 단백질 또는 그의 단편은 천연 2019-nCoV 스파이크 단백질에 존재하는 하나 이상의 입체형태적 에피토프를 유지한다. 따라서, 본 발명의 폴리뉴클레오티드에 의해 코딩되는 2019-nCoV 스파이크 단백질 또는 그의 단편은 면역보호 효과를 일으킬 수 있다. 전형적으로, 상기 면역보호 효과는 본 발명의 폴리뉴클레오티드에 의해 코딩되는 2019-nCoV 스파이크 단백질 또는 그의 단편의 하나 이상의 입체형태적 에피토프에 특이적으로 결합하는 중화 항체 (nAb)의 생성을 포함한다. CoV 스파이크 단백질의 입체형태적 에피토프는 CoV 스파이크 단백질의 3차 구조에서 발견되는 특이적인 3차원 구조를 갖는다. 상기 하나 이상의 입체형태적 에피토프는 전형적으로 스파이크 단백질의 엑토도메인 내에 있다. 바람직하게는, 본 발명의 폴리뉴클레오티드에 의해 코딩되는 2019-nCoV 스파이크 단백질 또는 그의 단편은 천연 2019-nCoV 스파이크 단백질에 존재하는 모든 입체형태적 에피토프를 보유한다.
일부 바람직한 실시양태에서, 본 발명은 2019-nCoV 스파이크 단백질의 수용체-결합 도메인 (RBD)인 2019-nCoV 스파이크 단백질의 면역원성 단편에 관한 것이다. 이러한 RBD는 숙주 세포에 대한 2019-nCoV 결합을 담당하고, 따라서 2019-nCoV 입자의 숙주 세포 내로의 진입을 용이하게 한다. RBD는 본원에 기재된 바와 같은 서열식별번호: 1의 아미노산 잔기 319 내지 529에 상응하고, 서열식별번호: 15로 지칭된다. RBD는 2019-nCoV 바이러스 (진뱅크 수탁 번호 MN908947, 그의 버전 3 (MN908947.3), 2020년 1월 17일에 기탁됨)의 게놈에서 위치 955 내지 1597에 상응하는 염기에 의해 코딩된다. 따라서, 본원에 기재된 바와 같이, 본 발명은 서열식별번호: 15와 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 2019-nCoV 스파이크 단백질의 RBD에 관한 것이다. 바람직하게는, 본 발명은 서열식별번호: 15와 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 2019-nCoV 스파이크 단백질의 RBD에 관한 것이다. 보다 바람직하게는, 본 발명은 서열식별번호: 15와 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 2019-nCoV 스파이크 단백질의 RBD에 관한 것이다. 2019-nCoV 스파이크 단백질의 RBD는 서열식별번호: 15를 포함하거나 또는 그로 이루어질 수 있다. 2019-nCoV 스파이크 단백질에 관한 (예를 들어, 폴리뉴클레오티드, 바이러스 벡터, DNA 플라스미드, RNA 백신, 바이러스-유사 입자 (VLP), 융합 단백질, 항체, 조성물 및 제약 조성물, 제제 및 치료 적응증에 관한) 본원의 임의의 및 모든 개시내용은 2019-nCoV 스파이크 단백질의 RBD에 동등하게 유보 없이 적용된다. 본원에서 RBD에 대한 언급은 2019-nCoV 스파이크 단백질의 RBD를 지칭한다.
CoV는 큰 외피보유 단일 양성-센스 RNA 바이러스이다. RNA 바이러스의 돌연변이율은 DNA 바이러스보다 크며, 이는 생존을 위한 보다 효율적인 적응 프로세스를 시사한다. 따라서, 항원 소변이가 또한 2019-nCoV의 특징이 되거나, 2019-nCoV가 범유행성이 진정되면 집단에서 풍토병이 될 위험성이 있다. 실제로, 지금까지의 연구는 2019-nCoV의 스파이크 단백질의 수용체 결합 도메인 (RBD) 내의 돌연변이, 특히 G476S 및 V483A/G, 뿐만 아니라 S1/S2 부위 부근의 보편적인 D614G 돌연변이를 이미 확인하였으며 (Saha et al., ChemRxivTM http://doi.org/10.26434/chemrxiv.12320567.v1), 증거는 2019-nCoV 비리온에 의한 세포 진입을 증진시키고 또한 숙주 세포 향성을 확장시킬 수 있음을 시사한다. 2019-nCoV 스파이크 단백질에서 보고된 다른 돌연변이는 S943 (특히 S943P), L5 (특히 L5F), L8 (특히 L8F), V367 (특히 V367F), H49 (특히 H49Y), Y145 (특히 Y145H/del), Q239 (특히 Q239K), A831 (특히 A831V), D839 (특히 D839Y/N/E), 및 P1263 (특히 P1263L), 또는 그의 임의의 조합을 포함한다 (Korber et al., BioRxiv™ https://doi.org/10.1101/2020.04.29.069054).
따라서, 본 발명은 유리하게는 발생 시 돌연변이된 스파이크 단백질을 갖는 균주에 대해 증진된 면역을 제공하기 위해 필요한 경우 2019-nCoV 백신 항원이 변형되도록 한다. 비제한적 예로서, 본 발명에 따른 임의의 2019-nCoV 스파이크 단백질 또는 그의 단편은 (i) D614, (ii) V483, (iii) G476, (iv) K417, (v), E484, (vi) N501, (vii) A570, 및 (viii) P681, 또는 (i) 내지 (viii)의 임의의 조합 (임의의 2개, 임의의 3개, 임의의 4개, 임의의 5개, 임의의 6개, 임의의 7개 또는 모든 8개 포함)에서 (특히 치환에 의해) 변형될 수 있다. 대안적으로 또는 추가로, 2019-nCoV 스파이크 단백질 또는 그의 단편은 아미노산 잔기 69, 70 및/또는 144 중 하나 이상에서의 결실을 비롯한 결실 돌연변이를 포함할 수 있다. 본원에 기재된 바와 같이, 돌연변이/변형의 위치는 전형적으로 본 발명의 서열식별번호: 1에서의 아미노산의 넘버링에 상응한다.
위치 D614에서의 변형, 특히 D614G 치환이 바람직하다. 특히, 본 발명에 따른 임의의 2019-nCoV 스파이크 단백질 또는 그의 단편은 다음 치환 (i) G476S, (ii) V483A/G, (iii) D614G, (iv) K417N/T, (v), E484K, (vi) N501Y, (vii) A570D, 및 (viii) P681H, 또는 (i) 내지 (viii)의 임의의 조합 (임의의 2개, 임의의 3개, 임의의 4개, 임의의 5개, 임의의 6개, 임의의 7개 또는 8개 모두 포함)을 포함할 수 있다.
본 발명은 또한 변이체 2019-nCoV로부터의 2019-nCoV 스파이크 단백질 또는 그의 단편에 관한 것이다. 특히, 본 발명은 B.1.1.7 균주 (201/501Y.V1로도 알려져 있으며, 영국에서 처음 검출되었음); B.1.351 균주 (20H/501.V2로도 알려져 있으며, 남아프리카에서 처음 검출되었음) 및/또는 P1 균주 (20J/501Y.V3으로도 알려져 있으며, 일본 및 브라질에서 처음 검출되었음) 유래의 2019-nCoV 스파이크 단백질 또는 그의 단편에 관한 것일 수 있다. B.1.1.7 균주의 핵심 돌연변이는 잔기 69/70 및 144Y의 결실, 뿐만 아니라 N501Y, A570D, D614G 및 P681H 치환을 포함한다. B.1.351 균주의 핵심 돌연변이는 K417N, E484K, N501Y 및 D614G 치환을 포함한다. P.1 균주의 핵심 돌연변이는 E484K, K417N.T, N501Y 및 D614G를 포함한다.
폴리뉴클레오티드, 스파이크 단백질 및 그의 단편, VLP, 융합 단백질 및 DNA/RNA 백신과 관련한 본원의 모든 개시내용은 명시적으로 언급되지 않는 한 2019-nCoV의 다양한 변이체 및 균주에 동등하게 적용된다.
폴리뉴클레오티드
본 발명은 본 발명의 단백질 또는 면역원성 단편을 코딩하거나 발현하는 (용어 "코딩하다" 및 "발현하다"는 본원에서 상호교환가능하게 사용됨) 폴리뉴클레오티드를 제공한다. 용어 폴리뉴클레오티드는 DNA 및 RNA 서열 둘 다를 포괄한다. 본원에서, 용어 "핵산", "핵산 분자" 및 "폴리뉴클레오티드"는 상호교환가능하게 사용된다.
본 발명은 서열식별번호: 1과 적어도 90% 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 코딩하는 단리된 폴리뉴클레오티드를 제공한다. 예를 들어, 폴리뉴클레오티드는 2019-nCoV 스파이크 단백질의 RBD를 코딩할 수 있고, 바람직하게는 상기 RBD는 서열식별번호: 15와 적어도 90% 동일성을 갖는다. RBD를 코딩하는 예시적인 폴리뉴클레오티드가 서열식별번호: 13, 및 서열식별번호: 14의 코돈-최적화된 서열에 제시된다.
본 발명은 상기 기재된 바와 같은 2019-nCoV로부터의 변이체 스파이크 단백질, 또는 상기 변이체 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 코딩하는 폴리뉴클레오티드를 또한 포괄한다. 상기 변이체 스파이크 단백질은 전형적으로 서열식별번호: 1과 적어도 90% 동일성을 갖는다.
본 발명의 폴리뉴클레오티드는 본 발명의 단백질 또는 면역원성 단편 (VLP 또는 융합 단백질의 형태 포함)의 재조합 발현을 위해, 또는 DNA/RNA 백신으로서 사용될 수 있다.
본 발명자들은 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편을 코딩하는 개선된 폴리뉴클레오티드를 최초로 제공한다. 특히, 본 발명자들은 재조합 발현에 대해 최적화된 폴리뉴클레오티드를 설계하였다. 본 발명의 폴리뉴클레오티드는 1종 이상의 특정한 세포 유형, 예를 들어 진핵 세포 (예를 들어, 포유동물 세포, 효모 세포, 곤충 세포 또는 식물 세포) 또는 원핵 세포 (박테리아 세포)에서의 발현에 대해 최적화될 수 있다. 전형적으로, 폴리뉴클레오티드는 박테리아 세포, 효모 세포 또는 포유동물 세포에서의 발현에 대해 최적화된다. 바람직하게는, 상기 폴리뉴클레오티드는 에스케리키아 콜라이 (예를 들어, BL21(DE3), RV308(DE3), HMS174(DE3) 또는 K12 균주), 코마가타엘라 (공식적으로 피키아(Pichia), 특히 코마가타엘라 파스토리스(Komagataella pastoris) 또는 코마가타엘라 파피이(Komagataella phaffii)로서 배정됨), 사카로미세스 (특히 사카로미세스 세레비지아에(Saccharomyces cerevisiae)) 또는 인간 세포 (바람직하게는 293 F 세포, HEK 293 세포, HEK 293T 세포 또는 HeLa 세포)에서의 발현에 대해 최적화된다. 다른 관심 세포 유형/발현 시스템은 피키아 안구스타(Pichia angusta), 한세눌라 폴리모르파(Hansenula polymorpha), 차이니즈 햄스터 난소 (CHO) 세포 및/또는 곤충 세포 바큘로바이러스-기반 발현 시스템을 포함한다.
본원에 사용된 용어 "최적화된"은 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편의 재조합 발현에 대한 최적화에 관한 것이고, 숙주 세포/유기체 내의 폴리뉴클레오티드로부터 2019-nCoV 스파이크 단백질의 발현의 수준 및/또는 지속기간을 증가시키거나, 또는 다르게는 본 발명의 폴리뉴클레오티드로부터 2019-nCoV 스파이크 단백질 또는 그의 단편을 발현할 때 이점을 제공하는 폴리뉴클레오티드에 대한 코돈 최적화 및/또는 다른 변형 둘 다를 포함한다 (핵산 서열 및 다른 변형 둘 다의 면에서).
용어 "코돈 최적화된"은 염기 폴리뉴클레오티드 서열 내의 적어도 하나의 코돈을 폴리뉴클레오티드가 발현될 숙주 유기체 또는 세포에 의해 우선적으로 사용되는 코돈으로 대체하는 것을 지칭한다. 전형적으로, 숙주 유기체에서 가장 빈번하게 사용되는 코돈이 코돈-최적화된 폴리뉴클레오티드 서열에 사용된다. 코돈 최적화 방법은 관련 기술분야에 널리 공지되어 있다.
비-제한적 예로서, 폴리뉴클레오티드 최적화의 또 다른 형태는 RNA 구조를 최소화하는 변형인데, 이는 원핵생물에서 발현되는 유전자 내의 RBS 및/또는 개시 코돈을 수반하거나 또는 다르게는 폐쇄시키는 구조가 발현을 손상시킬 수 있기 때문이다. 최적화는 또한 번역 속도를 증가시킴으로써 또는 효율적인 "자기" 또는 샤페론-보조 단백질 폴딩을 허용할 필요성과 번역 속도의 균형을 유지함으로써 번역을 최적화하는 폴리뉴클레오티드에 대한 변형을 포괄하며, 여기서 전략적으로 배치된 보다 느린 코돈 또는 코돈 실행 (예를 들어, 단백질 도메인 경계에서)이 높은 전체 번역 속도를 유지하면서 폴딩 효율을 최대화할 수 있다. 최적화는 또한 폴리뉴클레오티드의 핵산 서열 내의 유해 모티프의 제거를 포괄할 수 있다. 비제한적 예로서, 이. 콜라이에서 T7 프로모터의 제어 하에 유전자를 발현시키는 것은 부류 I 및 II 전사 종결 부위 둘 다를 피하는 것이 바람직하다. 코딩 서열 내의 샤인-달가노-유사 서열은 원핵 숙주에서 부정확한 하류 개시 또는 번역 휴지를 유발할 수 있다. 진핵 숙주/세포에서의 발현을 위해, 잠재적 스플라이스 신호, 폴리아데닐화 신호 및 mRNA 프로세싱 및 안정성에 영향을 미치는 다른 모티프가 제거될 수 있다. 다른 부류의 유해 모티프는 리보솜 프레임시프트 및 휴지를 촉진하는 서열을 포함한다. 관심 숙주 세포에서의 발현을 최적화하기 위해 본 발명의 폴리뉴클레오티드에 임의의 조합의 변형이 이루어질 수 있다.
전형적으로, 박테리아 세포, 특히 이. 콜라이에서의 발현에 대해 최적화된 본 발명의 폴리뉴클레오티드는 클로닝된 N-말단 및/또는 C-말단 결실된 아미노산을 포함한다. 바람직하게는 약 1 내지 20개, 보다 바람직하게는 약 1 내지 15개, 가장 바람직하게는 약 5 내지 10개의 클로닝된 N-말단 및/또는 C-말단 결실된 아미노산이 포함된다.
관련 기술분야의 통상의 기술자는 수많은 상이한 폴리뉴클레오티드가 유전자 코드의 축중성의 결과로서 동일한 폴리펩티드를 코딩할 수 있음을 이해할 것이다. 또한, 관련 기술분야의 통상의 기술자는 폴리펩티드가 발현될 임의의 특정한 숙주 유기체의 코돈 사용빈도를 반영하기 위해 상용 기술을 사용하여 핵산 분자에 의해 코딩되는 폴리펩티드 서열에 영향을 미치지 않는 뉴클레오티드 치환을 수행할 수 있는 것으로 이해된다. 따라서, 달리 명시되지 않는 한, "본 발명의 단백질 또는 면역원성 단편을 코딩하는 폴리뉴클레오티드"는 서로의 축중성 버전이고 동일한 아미노산 서열을 코딩하는 모든 폴리뉴클레오티드 서열을 포함한다.
본 발명의 폴리뉴클레오티드는 전형적으로 관심 숙주 세포의 게놈 내로 통합될 수 있도록 설계된다. 원하는 숙주 세포에 따라 통합을 용이하게 하기 위해 상이한 최적화 전략이 사용될 수 있다.
전형적으로, 본 발명의 폴리뉴클레오티드는 하나 이상의 시스-작용성 서열 모티프 (시스-작용성 요소 또는 시스-작용성 조절 요소로도 상호교환가능하게 지칭됨)의 제거 또는 생략에 의해 최적화된다. 시스-작용성 서열 모티프는 유전자 발현에 필요한 유전자의 구조적 부분 부근의 서열이다. 상기 하나 이상의 시스-작용성 서열 모티프는 (a) 내부 TATA-박스; (b) Chi-부위; (c) 리보솜 진입 부위; (d) 서열의 AT-풍부 및/또는 GC-풍부 스트레치; (e) RNA 불안정성 모티프; (f) 반복 서열 및/또는 RNA 2차 구조; (g) 잠재 스플라이스 공여자 부위; (h) 잠재 스플라이스 수용 부위; 및/또는 (i) (a) 내지 (i)의 임의의 조합으로부터 독립적으로 선택될 수 있다. 이들 시스-작용성 서열 모티프는 관련 기술분야에 공지되어 있다. 비제한적 예로서, 높은 GC 함량 (예를 들어, 약 70% 초과, 바람직하게는 약 80% 초과) 및/또는 낮은 GB 함량 (예를 들어, 약 40% 미만, 바람직하게는 약 30% 미만)의 영역은 생략된다. 바람직하게는, 하나 이상의 다른 시스-작용성 서열 모티프의 제거 또는 생략과 조합하여 높은 및 낮은 GC 함량의 영역 둘 다가 생략된다.
본 발명의 폴리뉴클레오티드는 또한 본원에 기재된 바와 같이 "코돈 최적화"될 수 있다. 코돈 최적화는 바람직하게는 본원에 기재된 바와 같은 하나 이상의 시스-작용성 서열 모티프의 제거 또는 생략에 추가하여 발생한다.
본 발명의 폴리뉴클레오티드의 평균 GC 함량 또한 상기 폴리뉴클레오티드의 발현을 최적화하도록 변형될 수 있다. 예를 들어, 폴리뉴클레오티드의 평균 GC 함량은 약 40% 내지 약 60%, 바람직하게는 약 40% 내지 약 57%, 보다 바람직하게는 약 45% 내지 약 56% 정도일 수 있다.
본 발명의 폴리뉴클레오티드는 전형적으로 적어도 약 0.80, 바람직하게는 적어도 약 0.9, 보다 바람직하게는 적어도 약 0.91, 적어도 약 0.92, 적어도 약 0.93, 적어도 약 0.94, 적어도 약 0.95, 적어도 약 0.96, 적어도 약 0.97, 적어도 약 0.98, 적어도 약 0.99, 또는 약 1.0 이하까지의 코돈 적응 지수 (CAI)를 갖는다.
최적화 변형의 결과로서, 본 발명의 폴리뉴클레오티드는 코딩된 2019-nCoV 스파이크 단백질 또는 그의 단편의 발현을 상응하는 비-최적화 폴리뉴클레오티드 서열과 비교하여 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 100% 또는 그 초과만큼 증가시킬 수 있다. 바람직하게는, 발현 수준은 상응하는 비-최적화된 폴리뉴클레오티드와 비교하여 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 100% 또는 그 초과, 보다 바람직하게는 적어도 70%, 적어도 80%, 적어도 90%, 적어도 100% 또는 그 초과만큼 증가된다.
본 발명의 폴리뉴클레오티드는 숙주 세포에서 적어도 1주, 적어도 2주, 적어도 3주, 적어도 1개월, 적어도 2개월, 적어도 3개월, 적어도 4개월 또는 그 초과, 바람직하게는 적어도 1개월, 적어도 2개월, 적어도 3개월, 적어도 4개월 또는 그 초과 동안 발현될 수 있다.
본 발명자들은 2019-nCoV 스파이크 단백질, 및 2019-nCoV 스파이크 단백질을 포함하는 융합 단백질이 그의 합리적으로 설계된 최적화된 폴리뉴클레오티드를 사용하여 다양한 발현 시스템/숙주 세포에서 높은 수준으로 발현될 수 있음을 입증하였다. 또한, 본 발명은 놀랍게도 2019-nCoV 스파이크 단백질, 및 2019-nCoV 스파이크 단백질을 포함하는 융합 단백질이 마우스에서 강한 항체 반응을 생성할 수 있다는 것을 입증하였고, 이는 그의 잠재적 치료 유용성을 나타낸다. 본 발명자들은 하기 실시예에 기재된 바와 같이 최적화된 폴리뉴클레오티드 및 융합 단백질을 설계하고 생성함으로써 그의 최적화 방법론을 예시하였다.
따라서, 본 발명의 폴리뉴클레오티드는 서열식별번호: 2, 3, 4, 5, 6, 7 또는 8 중 어느 하나에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 핵산 서열을 포함하거나 또는 그로 이루어질 수 있다. 바람직하게는, 본 발명의 폴리뉴클레오티드는 서열식별번호: 2, 3, 4, 5, 6, 7, 8, 13, 14, 26, 27, 29, 30, 또는 32 중 어느 하나에 대해 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 핵산 서열을 포함하거나 또는 그로 이루어질 수 있다. 보다 바람직하게는, 본 발명의 폴리뉴클레오티드는 서열식별번호: 2, 3, 4, 5, 6, 7, 8, 13, 14, 26, 27, 29, 30, 또는 32 중 어느 하나에 대해 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 핵산 서열을 포함하거나 또는 그로 이루어질 수 있다. 본 발명의 폴리뉴클레오티드는 서열식별번호: 2, 3, 4, 5, 6, 7, 8, 13, 14, 26, 27, 29, 30, 또는 32 중 어느 하나의 핵산 서열을 포함하거나 또는 그로 이루어질 수 있다. 또한, 본원에 기재된 바와 같은 서열식별번호: 2, 3, 4, 5, 6, 7, 8, 13, 14, 26, 27, 29, 30, 또는 32 중 임의의 것 또는 그의 임의의 변이체에서 확인된 5' 클로닝 부위, 3' 클로닝 부위, 또는 5' 및 3' 클로닝 부위가 결실될 수 있다. 따라서, 본 발명은, 서열식별번호: 2, 3, 4, 5, 6, 7, 8, 13, 14, 26, 27, 29, 30, 또는 32 중 어느 하나를 포함하거나 또는 그로 이루어지지만, 서열식별번호: 2, 3, 4, 5, 6, 7, 8, 13, 14, 26, 27, 29, 30, 또는 32 중 임의의 것에서 확인된 5' 클로닝 부위, 3' 클로닝 부위, 또는 5' 및 3' 클로닝 부위가 결여된 폴리뉴클레오티드를 제공한다. 대안적으로, 본원에 기재된 바와 같은 서열식별번호: 2, 3, 4, 5, 6, 7, 8, 13, 14, 26, 27, 29, 30, 또는 32 중 임의의 것 또는 그의 임의의 변이체에서 확인된 5' 클로닝 부위, 3' 클로닝 부위, 또는 5' 및 3' 클로닝 부위가 독립적으로 또 다른 적절한 클로닝 부위로 대체될 수 있다. 적합한 대안적 클로닝 부위는 관련 기술분야에 널리 공지되어 있다.
본 발명은 특히 2019-nCoV 스파이크 단백질의 RBD를 코딩하는 폴리뉴클레오티드를 제공한다. 따라서, 본 발명의 폴리뉴클레오티드는 서열식별번호: 13, 또는 서열식별번호: 14의 코돈-최적화된 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 핵산 서열을 포함하거나 또는 그로 이루어질 수 있다. 바람직하게는, 본 발명의 폴리뉴클레오티드는 서열식별번호: 13, 또는 서열식별번호: 14의 코돈-최적화된 서열에 대해 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 핵산 서열을 포함하거나 또는 그로 이루어질 수 있다. 보다 바람직하게는, 본 발명의 폴리뉴클레오티드는 서열식별번호: 13, 또는 서열식별번호: 14의 코돈-최적화된 서열에 대해 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 핵산 서열을 포함하거나 또는 그로 이루어질 수 있다. 본 발명의 폴리뉴클레오티드는 서열식별번호: 13의 핵산 서열, 또는 서열식별번호: 14의 코돈-최적화된 서열을 포함하거나 또는 그로 이루어질 수 있다.
본 발명의 폴리뉴클레오티드는 전형적으로 (a) 천연 2019-nCoV 스파이크 단백질에 존재하는 입체형태적 에피토프를 보유하고/거나; (b) 핵산 또는 코딩된 스파이크 단백질 또는 그의 단편이 대상체에게 투여될 때 스파이크 단백질 또는 그의 단편에 특이적인 중화 항체의 생성을 유발하는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편을 코딩한다.
본 발명의 폴리뉴클레오티드는 전형적으로 서열식별번호: 1과 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 발현한다. 바람직하게는, 본 발명의 폴리뉴클레오티드는 서열식별번호: 1과 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 발현한다. 보다 바람직하게는, 본 발명의 폴리뉴클레오티드는 서열식별번호: 1과 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 발현한다. 본 발명의 폴리뉴클레오티드는 서열식별번호: 1을 포함하거나 또는 그로 이루어진 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 발현할 수 있다.
본 발명의 폴리뉴클레오티드는 2019-nCoV 스파이크 단백질 또는 그의 단편의 발현을 용이하게 하기 위해 발현 구축물 내에 포함될 수 있다. 따라서, 본 발명은 본 발명의 폴리뉴클레오티드를 포함하는 발현 구축물을 추가로 제공한다. 전형적으로, 이러한 발현 구축물에서 본 발명의 폴리뉴클레오티드는 적합한 프로모터에 작동가능하게 연결된다. 폴리뉴클레오티드는 적합한 종결인자 서열에 연결될 수 있다. 폴리뉴클레오티드는 프로모터 및 종결인자 둘 다에 연결될 수 있다. 적합한 프로모터 및 종결인자 서열은 관련 기술분야에 널리 공지되어 있다.
프로모터의 선택은 폴리뉴클레오티드의 궁극적인 발현이 어디에서 일어날 것인지에 좌우될 것이다. 일반적으로, 구성적 프로모터가 바람직하지만, 유도성 프로모터가 마찬가지로 사용될 수 있다. 이러한 방식으로 생성된 구축물은 벡터의 적어도 한 부분, 특히 조절 요소를 포함한다. 벡터는 바람직하게는 주어진 숙주 세포에서 핵산을 발현할 수 있다. 임의의 적절한 숙주 세포, 예컨대 포유동물, 박테리아, 곤충, 효모 및/또는 식물 숙주 세포가 사용될 수 있다. 또한, 무세포 발현 시스템이 사용될 수 있다. 이러한 발현 시스템 및 숙주 세포는 관련 기술분야에서 표준이다.
본 발명의 폴리뉴클레오티드에 의해 코딩 또는 발현되는 (두 용어는 본원에서 상호교환가능하게 사용됨) 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편은 전형적으로 천연 2019-nCoV 스파이크 단백질과 동일한 그의 수용체에 대한 결합 친화도를 보유한다. 본 발명의 문맥에서, 이는 2019-nCoV 스파이크 단백질 수용체에 대한 결합 친화도가 천연 2019-nCoV 스파이크 단백질의 결합 친화도의 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99% 또는 그 초과임을 의미할 수 있다. 바람직하게는, 본 발명의 폴리뉴클레오티드에 의해 발현되는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편은 2019-nCoV 스파이크 단백질에 대한 결합 친화도가 천연 2019-nCoV 스파이크 단백질의 결합 친화도의 적어도 90%, 적어도 95%, 적어도 99% 또는 그 초과이다.
일부 실시양태에서, 본 발명의 폴리뉴클레오티드에 의해 발현되는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편은 2019-nCoV 스파이크 단백질 수용체에 대한 결합 친화도가 전장 단백질의 결합 친화도보다 크다. 예를 들어, 본 발명의 폴리뉴클레오티드에 의해 발현되는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편은 천연 2019-nCoV 스파이크 단백질의 결합 친화도의 적어도 100%, 적어도 110%, 적어도 120% 또는 적어도 150% 또는 그 초과의 결합 친화도를 가질 수 있다.
다른 실시양태에서, 본 발명의 폴리뉴클레오티드에 의해 발현되는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편은 2019-nCoV 스파이크 단백질 수용체에 대한 결합 친화도가 천연 2019-nCoV 스파이크 단백질의 결합 친화도보다 작을 수 있다. 예를 들어, 본 발명의 폴리뉴클레오티드에 의해 발현되는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편은 천연 2019-nCoV 스파이크 단백질의 결합 친화도의 80% 미만, 70% 미만, 60% 미만, 50% 미만 또는 그 미만의 결합 친화도를 가질 수 있다.
본 발명의 폴리뉴클레오티드에 의해 발현되는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편의 그의 수용체에 대한 결합 친화도는 해리 상수 (Kd)로 정량화될 수 있다. Kd는 임의의 적절한 기술을 사용하여 결정될 수 있지만, SPR이 본 발명의 문맥에서 일반적으로 바람직하다.
본 발명의 폴리뉴클레오티드에 의해 발현되는 2019-nCoV 스파이크 단백질의 면역원성 단편은 전형적으로 200개 초과의 아미노산 길이이다. 본 발명의 2019-nCoV 스파이크 단백질 단편은 적어도 200개, 적어도 300개, 적어도 400개, 적어도 500개, 적어도 600개, 적어도 700개, 적어도 800개, 적어도 900개, 적어도 1000개, 적어도 1100개, 또는 그 초과의 아미노산 잔기 길이를 포함하거나 또는 그로 이루어질 수 있다. 본 발명의 단편은 2019-nCoV 스파이크 단백질과 공통 항원 교차-반응성을 갖는다. 일부 바람직한 실시양태에서, 본 발명의 폴리뉴클레오티드에 의해 발현되는 2019-nCoV 스파이크 단백질의 면역원성 단편은 본원에서 정의된 바와 같은 2019-nCoV 스파이크 단백질의 RBD이고, 바람직하게는 여기서 상기 RBD는 서열식별번호: 15와 적어도 90% 동일성을 갖는다.
본 발명의 폴리뉴클레오티드에 의해 발현되는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편은, 예를 들어 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편의 재조합 생성 및/또는 분비를 보조하기 위해 리더 서열을 추가적으로 포함할 수 있다. 관련 기술분야에 공지된 통상적인 리더 서열을 포함한 임의의 적합한 리더 서열이 사용될 수 있다. 적합한 리더 서열은 곤충 세포로부터의 분비를 보조하기 위해 관련 기술분야에서 통상적으로 사용되는 Bip 리더 서열, 및 바이러스 및 DNA 기반 백신, 및 포유동물 세포 발현 플랫폼으로부터의 분비를 보조하기 위한 단백질 백신에 상용적으로 사용되는 인간 조직 플라스미노겐 활성화제 리더 서열 (tPA)을 포함한다.
본 발명의 폴리뉴클레오티드에 의해 발현되는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편은, 예를 들어 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편의 재조합 생성 및/또는 정제를 돕기 위해 N- 또는 C-말단 태그를 추가로 포함할 수 있다. 관련 기술분야에 공지된 통상적인 태그를 포함한 임의의 N- 또는 C-말단 태그가 사용될 수 있다. 적합한 태그 서열은 C-말단 헥사-히스티딘 태그 및 "C-태그" (C-말단의 4개의 아미노산 EPEA)를 포함하며, 이는 이종 발현 시스템, 예를 들어 곤충 세포, 포유동물 세포, 박테리아 또는 효모로부터의 정제를 보조하기 위해 관련 기술분야에서 통상적으로 사용된다. 다른 실시양태에서, 본 발명의 폴리뉴클레오티드에 의해 발현되는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편은 정제 태그를 사용할 필요 없이 이종 발현 시스템으로부터 정제된다.
본 발명의 폴리뉴클레오티드에 의해 발현되는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편은 본원에서 정의되는 바와 같은 리더 서열 및/또는 태그를 포함할 수 있다.
바이러스 벡터, DNA 플라스미드 및 RNA 백신
본 발명은 또한 (a) 본 발명의 폴리뉴클레오티드를 포함하고/거나; (b) 본 발명의 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편을 코딩하는 벡터를 제공한다. 벡터(들)는 백신 조성물 또는 제제의 형태로 존재할 수 있다.
본 발명의 벡터는 전형적으로 서열식별번호: 1과 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 발현한다. 바람직하게는, 본 발명의 벡터는 서열식별번호: 1과 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 발현한다. 보다 바람직하게는, 본 발명의 벡터는 서열식별번호: 1과 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 발현한다. 본 발명의 벡터는 서열식별번호: 1을 포함하거나 또는 그로 이루어진 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 발현할 수 있다. 일부 바람직한 실시양태에서, 본 발명의 벡터에 의해 발현되는 2019-nCoV 스파이크 단백질의 면역원성 단편은 본원에서 정의된 바와 같은 2019-nCoV 스파이크 단백질의 RBD이고, 바람직하게는 상기 RBD는 서열식별번호: 15와 적어도 90% 동일성을 갖는다.
본 발명의 벡터는 신호 펩티드를 추가로 포함하는 본원에 정의된 바와 같은 스파이크 단백질 또는 그의 면역원성 단편을 발현할 수 있다. 전형적으로, 상기 신호 펩티드는 관심 숙주 세포, 예컨대 인간 세포, 이. 콜라이 세포 또는 효모 세포로부터 2019-nCoV 스파이크 단백질 또는 그의 단편의 분비를 지시한다.
본 발명의 벡터는 하나 이상의 추가의 항원 또는 그의 단편을 추가로 발현할 수 있다. 스파이크 단백질 또는 그의 단편 및 하나 이상의 추가의 항원 또는 그의 단편은 융합 단백질로서 발현될 수 있다. 대안적으로, 2019-nCoV 스파이크 단백질 또는 그의 단편 및 하나 이상의 추가의 항원 또는 그의 단편을 발현하는 개별 벡터가 사용될 수 있다. 이러한 경우, 상기 개별 벡터는 순차적으로 또는 동시에 조합하여 사용될 수 있다. 하나 이상의 추가의 항원은 2019-nCoV와 동일한 항원 또는 상이한 항원, 또는 그의 단편일 수 있다. 보다 바람직하게는, 상기 하나 이상의 추가의 항원은 2019-nCoV와 상이한 항원, 예컨대 2019-CoV 막 단백질 또는 외피 단백질로부터의 항원이다.
본 발명의 벡터(들)는 본원에 정의된 바와 같은 임의의 폴리뉴클레오티드 또는 발현 구축물, 또는 그의 임의의 조합을 포함할 수 있다.
벡터(들)는 바이러스 벡터일 수 있다. 이러한 바이러스 벡터는 아데노바이러스 (인간 혈청형, 예컨대 AdHu5, 원숭이 혈청형, 예컨대 ChAd63, ChAdOX1 또는 ChAdOX2, 또는 또 다른 형태), 아데노-관련 바이러스 (AAV), 또는 폭스바이러스 벡터 (예컨대, 변형된 백시니아 안카라 (MVA)), 또는 아데노 연관 바이러스 (AAV)일 수 있다. ChAdOX1 및 ChAdOX2는 WO2012/172277 (그 전문이 본원에 참조로 포함됨)에 개시되어 있다. ChAdOX2는 BAC-유래 및 E4 변형된 AdC68-기반 바이러스 벡터이다. 바람직하게는, 상기 바이러스 벡터는 AAV 벡터 아데노바이러스이다.
바이러스 벡터는 통상적으로 비-복제 또는 복제 손상 벡터이며, 이는 통상적인 수단에 의해 - 예를 들어, DNA 합성 및/또는 바이러스 역가를 측정하는 것을 통해 측정 시, 바이러스 벡터가 정상 세포 (예를 들어, 정상 인간 세포)에서 임의의 유의한 정도로 복제할 수 없다는 것을 의미한다. 비-복제 또는 복제 손상 벡터는 자연적으로 (즉, 자연으로부터 그 자체로 단리됨) 또는 인공적으로 (예를 들어, 시험관내 육종에 의해 또는 유전자 조작에 의해) 그렇게 될 수 있다. 일반적으로, 복제-손상 바이러스 벡터가 성장할 수 있는 적어도 하나의 세포-유형이 있을 것이다 - 예를 들어, 변형된 백시니아 앙카라 (MVA)는 CEF 세포에서 성장할 수 있다. 비제한적 예로서, 벡터는 인간 또는 원숭이 아데노바이러스 또는 폭스바이러스 벡터로부터 선택될 수 있다.
전형적으로, 바이러스 벡터는 동물 대상체, 전형적으로 포유동물 대상체, 예컨대 인간 또는 다른 영장류에서 유의한 감염을 유발할 수 없다.
벡터(들)는 DNA 벡터, 예컨대 DNA 플라스미드일 수 있다. 벡터(들)는 RNA 벡터, 예컨대 mRNA 벡터 또는 자가-증폭 RNA 벡터일 수 있다. 본 발명의 DNA 및/또는 RNA 벡터(들)는 진핵 및/또는 원핵 세포, 특히 본원에 기재된 임의의 숙주 세포 유형에서, 또는 치료될 대상체에서 발현될 수 있다.
전형적으로, DNA 및/또는 RNA 벡터(들)는 인간, 이. 콜라이 또는 효모 세포에서 발현될 수 있다.
본 발명은 파지 벡터, 예컨대 문헌 [Hajitou et al., Cell 2006; 125(2) pp. 385-398] (본원에 참조로 포함됨)에 기재된 바와 같은 AAV/파지 하이브리드 벡터일 수 있다.
본 발명의 핵산 분자는 관련 기술분야에 공지된 임의의 적합한 프로세스를 사용하여 제조될 수 있다. 따라서, 핵산 분자는 화학적 합성 기술을 사용하여 제조될 수 있다. 대안적으로, 본 발명의 핵산 분자는 분자 생물학 기술을 사용하여 제조될 수 있다.
본 발명의 벡터(들)는 인 실리코로 설계된 후, 통상적인 폴리뉴클레오티드 합성 기술에 의해 합성될 수 있다.
바이러스-유사 입자
바이러스-유사 입자 (VLP)는 바이러스와 유사하지만 바이러스 핵산을 함유하지 않는 입자이고, 따라서 비-감염성이다. 이들은 통상적으로, VLP를 형성하기 위해 자기-조립될 수 있는 하나 이상의 바이러스 캡시드 또는 외피 단백질을 함유한다. VLP는 매우 다양한 바이러스 패밀리의 성분으로부터 생성되었다 (문헌 [Noad and Roy (2003), Trends in Microbiology, 11:438-444; Grgacic et al., (2006), Methods, 40:60-65]). 일부 VLP, 예를 들어 엔게릭스(Engerix)-B (B형 간염용), 서바릭스(Cervarix) 및 가르다실(Gardasil) (인간 유두종 바이러스용)은 치료 백신으로서 승인되었다.
따라서, 본 발명은 본 발명의 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편을 포함하는 VLP를 제공한다. 본 발명의 VLP는 전형적으로 서열식별번호: 1과 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 포함한다. 바람직하게는, 본 발명의 VLP는 서열식별번호: 1과 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 포함한다. 보다 바람직하게는, 본 발명의 VLP는 서열식별번호: 1과 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 포함한다. 본 발명의 VLP는 서열식별번호: 1을 포함하거나 또는 그로 이루어진 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 포함할 수 있다. 일부 바람직한 실시양태에서, 본 발명의 VLP 내에 포함된 2019-nCoV 스파이크 단백질의 면역원성 단편은 본원에서 정의된 바와 같은 2019-nCoV 스파이크 단백질의 RBD이고, 바람직하게는 여기서 상기 RBD는 서열식별번호: 15와 적어도 90% 동일성을 갖는다.
관련 기술분야의 통상의 기술자는 VLP가 바이러스 구조 단백질의 개별 발현을 통해 합성될 수 있으며, 이어서 바이러스-유사 구조로 자기-조립될 수 있음을 이해할 것이다. 상이한 바이러스로부터의 구조적 캡시드 단백질의 조합을 사용하여 재조합 VLP를 생성할 수 있다. 또한, 항원 또는 그의 면역원성 단편은 VLP의 표면에 융합될 수 있다. 비제한적 예로서, 본 발명의 항원 또는 그의 면역원성 단편은 스파이캐처-스파이태그(SpyCatcher-SpyTag) 시스템 (브룬, 비스워스, 하워스(Brune, Biswas, Howarth)에 의해 기재된 바와 같음)을 사용하여 VLP에 커플링될 수 있다.
본 발명의 VLP는 하나 이상의 추가의 단백질 항원을 포함할 수 있다. 하나 이상의 추가의 항원은 2019-nCoV와 동일한 항원 또는 상이한 항원, 또는 그의 단편일 수 있다. 보다 바람직하게는, 상기 하나 이상의 추가의 항원은 2019-nCoV와 상이한 항원, 예컨대 2019-CoV 막 단백질 또는 외피 단백질로부터의 항원이다.
본 발명의 VLP는 본원에 기재된 바와 같은 융합 단백질을 포함할 수 있다. 본 발명의 VLP는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편과 B형 간염 표면 항원 (HBSAg), 인간 유두종바이러스 (HPV) 18 L1 단백질, HPV 16 L1 단백질 및/또는 E형 간염 P239, 바람직하게는 B형 간염 표면 항원의 융합 단백질을 포함할 수 있다. 이들 다른 바이러스 단백질이 융합 단백질로 이전에 기재되었지만, 지금까지 2019-nCoV 스파이크 단백질 크기의 단백질을 포함하는 융합 단백질이 성공적으로 생성되었다는 보고는 없다. 또한, 이러한 융합 단백질에 대한 발현 시스템의 선택과 관련하여 공지된 제한이 있다. 본 발명자들은 놀랍게도 2019-nCoV 스파이크 단백질을 포함하는 VLP/융합 단백질이 이. 콜라이, 효모 및 인간 세포에서 재조합적으로 생산될 수 있고, 이들 VLP/융합 단백질이 동물 모델에서 (면역보호) 항체 반응을 도출할 수 있다는 것을 입증하였다.
따라서, 본 발명의 VLP는 서열식별번호: 3, 5, 6 또는 8 중 어느 하나에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 핵산 서열을 포함하거나 또는 그로 이루어진 폴리뉴클레오티드에 의해 코딩될 수 있다. 바람직하게는, 본 발명의 VLP는 서열식별번호: 3, 5, 6 또는 8 중 어느 하나에 대해 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 핵산 서열을 포함하거나 또는 그로 이루어진 폴리뉴클레오티드에 의해 코딩될 수 있다. 보다 바람직하게는, 본 발명의 VLP는 서열식별번호: 3, 5, 6 또는 8 중 어느 하나에 대해 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 핵산 서열을 포함하거나 또는 그로 이루어진 폴리뉴클레오티드에 의해 코딩될 수 있다. 본 발명의 VLP는 서열식별번호: 3, 5, 6 또는 8 중 어느 하나의 핵산 서열을 포함하거나 또는 그로 이루어진 폴리뉴클레오티드에 의해 코딩될 수 있다.
본 발명의 VLP는 서열식별번호: 26, 27, 29, 30, 또는 32 중 어느 하나에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 핵산 서열을 포함하거나 또는 그로 이루어진 폴리뉴클레오티드에 의해 코딩될 수 있다. 바람직하게는, 본 발명의 VLP는 서열식별번호: 26, 27, 29, 30, 또는 32 중 어느 하나에 대해 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 핵산 서열을 포함하거나 또는 그로 이루어진 폴리뉴클레오티드에 의해 코딩될 수 있다. 보다 바람직하게는, 본 발명의 VLP는 서열식별번호: 26, 27, 29, 30, 또는 32 중 어느 하나에 대해 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 핵산 서열을 포함하거나 또는 그로 이루어진 폴리뉴클레오티드에 의해 코딩될 수 있다. 본 발명의 VLP는 서열식별번호: 26, 27, 29, 30, 또는 32 중 어느 하나 핵산 서열을 포함하거나 또는 그로 이루어진 폴리뉴클레오티드에 의해 코딩될 수 있다.
본 발명의 VLP는 서열식별번호: 9, 10, 11 또는 12 중 어느 하나에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 아미노산 서열을 포함하거나 또는 그로 이루어질 수 있다. 바람직하게는, 본 발명의 VLP는 서열식별번호: 9, 10, 11 또는 12 중 어느 하나에 대해 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 아미노산 서열을 포함하거나 또는 그로 이루어질 수 있다. 보다 바람직하게는, 본 발명의 VLP는 서열식별번호: 9, 10, 11 또는 12 중 어느 하나에 대해 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 아미노산 서열을 포함하거나 또는 그로 이루어질 수 있다. 본 발명의 VLP는 서열식별번호: 9, 10, 11 또는 12 중 어느 하나의 아미노산 서열을 포함하거나 또는 그로 이루어질 수 있다.
본 발명의 VLP는 서열식별번호: 28, 31 또는 33 중 어느 하나에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 아미노산 서열을 포함하거나 또는 그로 이루어질 수 있다. 바람직하게는, 본 발명의 VLP는 서열식별번호: 28, 31, 또는 33 중 어느 하나에 대해 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 아미노산 서열을 포함하거나 또는 그로 이루어질 수 있다. 보다 바람직하게는, 본 발명의 VLP는 서열식별번호: 28, 31, 또는 33 중 어느 하나에 대해 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 아미노산 서열을 포함하거나 또는 그로 이루어질 수 있다. 본 발명의 VLP는 서열식별번호: 28, 31, 또는 33 중 어느 하나의 아미노산 서열을 포함하거나 또는 그로 이루어질 수 있다.
VLP의 사용은 2019-nCoV 스파이크 단백질 또는 면역원성 단편에 의해 유도된 면역보호 반응의 효능을 증가시킬 수 있고/있거나 본원에 정의된 바와 같은 면역보호 반응의 지속기간을 증가시킬 수 있다.
융합 단백질
본 발명은 본 발명의 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편을 포함하는 융합 단백질을 추가로 제공한다. 본 발명의 융합 단백질은 전형적으로 서열식별번호: 1과 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 포함한다. 바람직하게는, 본 발명의 융합 단백질은 서열식별번호: 1과 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 포함한다. 보다 바람직하게는, 본 발명의 융합 단백질은 서열식별번호: 1과 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 포함한다. 본 발명의 융합 단백질은 서열식별번호: 1을 포함하거나 또는 그로 이루어진 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 포함할 수 있다. 일부 바람직한 실시양태에서, 본 발명의 융합 단백질에 포함된 2019-nCoV 스파이크 단백질의 면역원성 단편은 본원에서 정의된 바와 같은 2019-nCoV 스파이크 단백질의 RBD이고, 바람직하게는 여기서 상기 RBD는 서열식별번호: 15와 적어도 90% 동일성을 갖는다.
본 발명의 융합 단백질은 전형적으로 비-2019-nCoV 도메인 또는 요소, 전형적으로 비-2019-nCoV 단백질, 폴리펩티드 또는 펩티드 도메인 또는 요소를 또한 포함한다. 본 발명의 융합 단백질은 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편, 및 B형 간염 표면 항원 (HBSAg); 인간 유두종바이러스 (HPV) 18 L1 단백질; HPV 16 L1 단백질; 및/또는 E형 간염 P239 (HEV) 중 하나 이상, 바람직하게는 B형 간염 표면 항원을 포함할 수 있다. VLP와 관련하여 상기 기재된 바와 같이, 본 발명자들은 놀랍게도 2019-nCoV 스파이크 단백질을 포함하는 융합 단백질이 이. 콜라이, 효모 및 인간 세포에서 재조합적으로 생산될 수 있고, 이들 융합 단백질이 동물 모델에서 (면역보호) 항체 반응을 도출할 수 있다는 것을 입증하였다.
본 발명의 융합 단백질은 서열식별번호: 3, 5, 6 또는 8 중 어느 하나에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 핵산 서열을 포함하거나 또는 그로 이루어진 폴리뉴클레오티드에 의해 코딩될 수 있다. 바람직하게는, 본 발명의 융합 단백질은 서열식별번호: 3, 5, 6 또는 8 중 어느 하나에 대해 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 핵산 서열을 포함하거나 또는 그로 이루어진 폴리뉴클레오티드에 의해 코딩될 수 있다. 보다 바람직하게는, 본 발명의 융합 단백질은 서열식별번호: 3, 5, 6 또는 8 중 어느 하나에 대해 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 핵산 서열을 포함하거나 또는 그로 이루어진 폴리뉴클레오티드에 의해 코딩될 수 있다. 본 발명의 VLP는 서열식별번호: 3, 5, 6 또는 8 중 어느 하나의 핵산 서열을 포함하거나 또는 그로 이루어진 폴리뉴클레오티드에 의해 코딩될 수 있다.
본 발명의 융합 단백질은 서열식별번호: 26, 27, 29, 30, 또는 32 중 어느 하나에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 핵산 서열을 포함하거나 또는 그로 이루어진 폴리뉴클레오티드에 의해 코딩될 수 있다. 바람직하게는, 본 발명의 융합 단백질은 서열식별번호: 26, 27, 29, 30, 또는 32 중 어느 하나에 대해 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 핵산 서열을 포함하거나 또는 그로 이루어진 폴리뉴클레오티드에 의해 코딩될 수 있다. 보다 바람직하게는, 본 발명의 융합 단백질은 서열식별번호: 26, 27, 29, 30, 또는 32 중 어느 하나에 대해 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 핵산 서열을 포함하거나 또는 그로 이루어진 폴리뉴클레오티드에 의해 코딩될 수 있다. 본 발명의 융합 단백질은 서열식별번호: 26, 27, 29, 30, 또는 32 중 어느 하나의 핵산 서열을 포함하거나 또는 그로 이루어진 폴리뉴클레오티드에 의해 코딩될 수 있다.
본 발명의 융합 단백질은 서열식별번호: 9, 10, 11 또는 12 중 어느 하나에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 아미노산 서열을 포함하거나 또는 그로 이루어질 수 있다. 바람직하게는, 본 발명의 융합 단백질은 서열식별번호: 9, 10, 11 또는 12 중 어느 하나에 대해 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 아미노산 서열을 포함하거나 또는 그로 이루어질 수 있다. 보다 바람직하게는, 본 발명의 융합 단백질은 서열식별번호: 9, 10, 11 또는 12 중의 어느 하나에 대해 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 아미노산 서열을 포함하거나 또는 그로 이루어질 수 있다. 본 발명의 융합 단백질은 서열식별번호: 9, 10, 11 또는 12 중 어느 하나의 아미노산 서열을 포함하거나 또는 그로 이루어질 수 있다.
본 발명의 융합 단백질은 서열식별번호: 28, 31 또는 33 중 어느 하나에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 아미노산 서열을 포함하거나 또는 그로 이루어질 수 있다. 바람직하게는, 본 발명의 융합 단백질은 서열식별번호: 28, 31 또는 33 중 어느 하나에 대해 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 아미노산 서열을 포함하거나 또는 그로 이루어질 수 있다. 보다 바람직하게는, 본 발명의 융합 단백질은 서열식별번호: 28, 31 또는 33 중 어느 하나에 대해 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 아미노산 서열을 포함하거나 또는 그로 이루어질 수 있다. 본 발명의 융합 단백질은 서열식별번호: 28, 31, 또는 33 중 어느 하나의 아미노산 서열을 포함하거나 또는 그로 이루어질 수 있다.
본 발명의 융합 단백질은 링커 (본원에서 링커 펩티드, 스페이서 또는 스페이서 펩티드로도 상호교환가능하게 지칭됨)를 포함할 수 있다. 링커는 본 발명의 융합 단백질의 2개 이상의 기능적 도메인을 연결하는 데 사용될 수 있다. 전형적으로, 링커가 존재하는 경우, 이는 융합 단백질의 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편 도메인을 융합 단백질의 비-2019-nCoV 스파이크 단백질 도메인에 연결하는 데 사용된다. 융합 단백질에서의 링커의 사용은 관련 기술분야에서 상용적이고, 생성된 융합 단백질이 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편의 목적하는 기능적 특성 및 비-2019-nCoV 스파이크 단백질 도메인의 목적하는 기능 특성을 보유하는 한, 임의의 통상적인 링커 단백질이 본 발명의 융합 단백질에 사용될 수 있다.
링커는 약 30개 이하의 아미노산, 예컨대 약 5-30개 아미노산, 약 5-25개 아미노산, 약 5-20개 아미노산, 약 10-20개 아미노산, 약 5-15개 아미노산 또는 약 10-15개 아미노산 길이의 짧은 펩티드일 수 있다. 일부 실시양태에서, 링커는 약 10개, 약 11개, 약 12개, 약 13개, 약 14개, 약 15개, 약 16개, 약 17개, 약 18개, 약 19개 또는 약 20개 아미노산 길이이다.
일부 실시양태에서, 강성 링커가 본 발명의 융합 단백질에 사용될 수 있다. 강성 링커는 융합 단백질의 상이한 도메인/부분 사이에 고정된 거리를 유지하고 그의 독립적인 기능을 유지하는 것이 필요한 경우에 통상적으로 사용된다. 강성 링커는 또한 융합 단백질 도메인의 공간적 분리가 융합 단백질의 안정성 또는 생물활성을 보존하는 데 중요한 경우에 사용될 수 있다. A(EAAAK)nA (n = 2-5) (서열식별번호: 16)의 서열을 갖는 실험적 강성 링커는 Glu--Lys+ 염 가교에 의해 안정화된 α-나선 입체형태를 나타냈다. 링커의 길이는 도메인 사이의 최적 거리를 달성하기 위해 카피수를 변화시킴으로써 조정될 수 있다. 나선형 링커는 또한 융합 단백질 폴딩 및 안정성을 개선시킬 수 있다.
강성 링커의 비제한적인 예는 EAAAKEAAAKEAAAK ((EAAAK)3으로 또한 지칭됨, 서열식별번호: 18)이고, 이는 핵산 서열 (서열식별번호: 17)에 의해 코딩될 수 있다. 기능적 도메인 사이의 거리를 제어하는 링커의 길이 및 구조는 융합 단백질의 안정성에 영향을 미친다. 본 발명의 RBD 융합 단백질의 안정성 및 활성은 전형적으로 본원의 실시예에 제시된 바와 같이 (EAAAK)3 링커 삽입 후에 유의하게 개선된다. 링커, 특히 (EAAAK)3의 사용은 또한 본 발명의 재조합 융합 단백질의 수율을 증진시킬 수 있다.
따라서, 강성 링커, 특히 (EAAAK)3 (서열식별번호: 18)은 바람직하게는 포유동물 세포, 예컨대 HEK 293 세포에서의 본 발명의 융합 단백질의 발현에 사용될 수 있다.
일부 실시양태에서, 가요성 링커가 본 발명의 융합 단백질에 사용될 수 있다. 가요성 링커는 연결된 도메인이 특정 정도의 이동 또는 상호작용을 필요로 하는 경우에 통상적으로 사용된다. 가요성 링커는 통상적으로 소형 아미노산 잔기, 예컨대 글리신, 트레오닌, 아르기닌, 세린, 아스파라긴, 글루타민, 알라닌, 아스파르트산, 프롤린, 글루탐산, 리신, 류신 및/또는 발린, 특히 글리신, 세린, 알라닌, 류신 및/또는 발린을 포함하거나 또는 그로 이루어진다. 글리신, 세린 및/또는 알라닌을 포함하거나 또는 그로 이루어진 가요성 링커가 바람직하고, 글리신 및 세린이 특히 바람직하다. 따라서, 가장 통상적으로 사용되는 가요성 링커는 주로 Gly 및 Ser 잔기의 스트레치로 이루어진 서열 ("GS" 링커)을 가지며, (Gly-Gly-Gly-Gly-Ser)n (서열식별번호: 19)의 서열을 포함한다. GS 링커의 비제한적 예는 GS5 또는 (GGGGS)1 (서열식별번호: 20); GS10 또는 (GGGGS)2 (서열식별번호: 21); GS15 또는 (GGGGS)3 (서열식별번호: 23); GS20 또는 (GGGGS)4 (서열식별번호: 24); 및 GS25 또는 (GGGGS)5 (서열식별번호: 25)를 포함한다. 바람직하게는, (서열식별번호: 22)에 의해 코딩될 수 있는 GS15가 사용될 수 있다. 가요성 링커는 바람직하게는 박테리아 세포, 예컨대 이. 콜라이 세포에서의 본 발명의 융합 단백질의 발현에 사용될 수 있다.
임의의 적절한 링커, 예컨대 본원에 기재된 예시적인 링커는 본 발명의 임의의 융합 단백질 (임의의 2019-nCoV 스파이크 단백질 또는 면역원성 단편 도메인 및 임의의 비-219-nCoV 스파이크 단백질 도메인을 포함함)과 함께 사용될 수 있다. 비제한적인 예로서, 본 발명의 융합 단백질은 HBSAg-(EAAAK)3-RBD (서열식별번호: 28), 또는 그에 대해 적어도 90% 서열 동일성을 갖는 변이체를 포함하거나 또는 그로 이루어질 수 있으며, 이는 서열식별번호: 26 또는 27, 또는 그에 대해 적어도 90% 서열 동일성을 갖는 변이체에 의해 코딩될 수 있다. 추가의 비제한적인 예로서, 본 발명의 융합 단백질은 HBSAg-(EAAAK)3-전장 2019-nCoV 스파이크 단백질 (서열식별번호: 33), 또는 그에 대해 적어도 90% 서열 동일성을 갖는 변이체를 포함하거나 또는 그로 이루어질 수 있으며, 이는 서열식별번호: 32, 또는 그에 대해 적어도 90% 서열 동일성을 갖는 변이체에 의해 코딩될 수 있다. 추가의 비제한적 예로서, 본 발명의 융합 단백질은 HEV-GS15-RBD (서열식별번호: 31), 또는 그에 대해 적어도 90% 서열 동일성을 갖는 변이체를 포함하거나 또는 그로 이루어질 수 있으며, 이는 (서열식별번호: 29 또는 30), 또는 그에 대해 적어도 90% 서열 동일성을 갖는 변이체에 의해 코딩될 수 있다.
본 발명의 융합 단백질은 바람직하게는 VLP의 형태를 취할 수 있다. 이론에 얽매이지는 않지만, 이는 HBSAg, HPV 18 L1 단백질, HPB 16 L1 단백질 및 E형 간염 P239 단백질이 재조합적으로 발현되는 경우에 VLP를 자발적으로 형성하는 것으로 공지되어 있고, 이러한 구조는 HBSAg, HPV 18 L1 단백질, HPB 16 L1 단백질 및/또는 E형 간염 P239 단백질이 본 발명의 2019-nCoV 스파이크 단백질 (또는 그의 면역원성 단편)과 조합된 융합 단백질 형태로 존재하는 경우에 유지되기 때문이다.
항체
본원에 기재된 바와 같이, 본 발명의 폴리뉴클레오티드에 의해 코딩되는 2019-nCoV 스파이크 단백질 또는 그의 단편은 천연 2019-nCoV에서 발견되는 하나 이상의 입체형태적 에피토프에 특이적으로 결합하는 항체의 생성을 도출한다. 상기 항체는 전형적으로 하기 논의된 바와 같은 중화 항체 (nAb)이다. 이들 nAb는 2019-nCoV에 대한 면역보호 효과를 매개할 수 있다.
본원에 사용된 용어 "항체"는 4개의 폴리펩티드 쇄, 즉 2개의 중쇄 (H) 및 2개의 경쇄 (L)로 구성된 임의의 이뮤노글로불린 (Ig) 분자, 또는 Ig 분자의 본질적인 에피토프 결합 특색을 보유하는 그의 임의의 기능적 단편, 돌연변이체, 변이체 또는 유도체를 광범위하게 지칭한다. 이러한 돌연변이체, 변이체 또는 유도체 항체 실체는 관련 기술분야에 공지되어 있으며, 그의 비제한적 실시양태가 하기 논의된다.
전장 항체에서, 각각의 중쇄는 중쇄 가변 영역 (본원에서 VH로 약칭됨) 및 중쇄 불변 영역으로 구성된다. 중쇄 불변 영역은 3개의 도메인 CH1, CH2 및 CH3으로 구성된다. 각각의 경쇄는 경쇄 가변 영역 (본원에서 VL로 약칭됨) 및 경쇄 불변 영역으로 구성된다. 경쇄 불변 영역은 1개의 도메인 CL로 구성된다. VH 및 VL 영역은 프레임워크 영역 (FR)으로 명명된 더욱 보존된 영역이 산재되어 있는, 상보성 결정 영역 (CDR)으로 명명된 초가변성 영역으로 추가로 세분될 수 있다. 각각의 VH 및 VL은 3개의 CDR 및 4개의 FR로 구성되며, 아미노-말단에서 카르복시-말단으로 다음 순서: FR1, CDR1, FR2, CDR2, FR3, CDR3, FR4로 배열되어 있다. 항체는 폴리클로날 (pAb) 또는 모노클로날 (mAb)일 수 있다. 치료적으로 사용될 때 (즉, 수동 면역을 제공하기 위해), mAb의 투여가 바람직하다.
본 발명에 따르면, 항체는 임의의 유형 (예를 들어, IgG, IgE, IgM, IgD, IgA 및 IgY), 부류 (예를 들어, IgG1, IgG2, IgG3, IgG4, IgA1 및 IgA2) 또는 하위부류의 것일 수 있고, 임의의 종 (예를 들어, 마우스, 인간, 닭, 래트, 토끼, 양, 상어 및 낙타류)으로부터의 것일 수 있다.
본원에 사용된 용어 항체의 "항원-결합 단편" (또는 간단히 "결합 단편")은 항원에 특이적으로 결합하는 능력을 보유하는 항체의 하나 이상의 단편을 지칭한다. 항체의 항원-결합 기능은 전장 항체의 하나 이상의 단편에 의해 수행될 수 있는 것으로 밝혀졌다. 단일 쇄 항체가 또한 포함된다. 이러한 항원-결합 단편은 또한 2종 이상의 상이한 항원에 특이적으로 결합하는 이중특이적, 이중 특이적 또는 다중-특이적일 수 있다. 따라서, 용어 항체의 "항원-결합 단편" 내에 포괄되는 결합 단편의 예는 Fab, Fv, scFv, dAb, Fd, Fab' 또는 F(ab')2, 탠덤 scFv 및 디아바디를 포함한다.
또한, 링커 폴리펩티드 또는 이뮤노글로불린 불변 도메인에 연결된 본 발명의 하나 이상의 항원 결합 단편을 포함하는 폴리펩티드로서 정의되는 항체 구축물이 포함된다. 링커 폴리펩티드는 펩티드 결합에 의해 연결된 2개 이상의 아미노산 잔기를 포함하고, 1개 이상의 항원 결합 부분을 연결하는 데 사용된다.
본원에 사용된 용어 "항체"는 인간 배선 이뮤노글로불린 서열로부터 유래된 가변 및 불변 영역을 갖지만, 예를 들어 CDR 및 특히 CDR3에서 인간 배선 이뮤노글로불린 서열에 의해 코딩되지 않은 아미노산 잔기 (예를 들어, 시험관내 무작위 또는 부위-특이적 돌연변이유발에 의해 또는 생체내 체세포 돌연변이에 의해 도입된 돌연변이)를 포함할 수 있는 항체로서 정의되는 인간 항체일 수 있다. 재조합 인간 항체가 또한 포함된다.
본 발명의 항체는 하나의 종으로부터의 중쇄 및 경쇄 가변 영역 서열 및 또 다른 종으로부터의 불변 영역 서열을 포함하는 항체로 정의되는 "키메라 항체"일 수 있다. 본 발명은, 예를 들어 인간 불변 영역에 연결된 뮤린 중쇄 및 경쇄 가변 영역을 갖는 키메라 항체를 포괄한다.
본 발명의 항체는 하나의 종으로부터의 중쇄 및 경쇄 가변 영역 서열을 포함하지만 VH 및/또는 VL의 CDR 영역 중 하나 이상의 서열이 또 다른 종의 CDR 서열로 대체된 항체, 예컨대 뮤린 CDR 중 하나 이상 (예를 들어, CDR3 또는 3개의 CDR 모두)이 인간 CDR 서열로 대체된 뮤린 중쇄 및 경쇄 가변 영역을 갖는 항체로서 정의되는 "CDR-그라프트된 항체"일 수 있다.
본 발명의 항체는 비-인간 종 (예를 들어, 마우스)으로부터의 중쇄 및 경쇄 가변 영역 서열을 포함하지만, VH 및/또는 VL 서열의 적어도 일부분이 더욱 "인간-유사"하도록, 즉 인간 배선 가변 서열에 더욱 유사하도록 변경된 항체로 정의되는 "인간화 항체"일 수 있다. 인간화 항체의 한 유형은 인간 CDR 서열이 상응하는 비-인간 CDR 서열을 대체하기 위해 비-인간 VH 및 VL 서열 내로 도입된 CDR-그라프트된 항체이다.
용어 "카바트 넘버링", "카바트 정의 및 "카바트 표지"는 본원에서 상호교환가능하게 사용된다. 관련 기술분야에 인지된 이들 용어는 항체 또는 그의 항원 결합 부분의 중쇄 및 경쇄 가변 영역 내의 다른 아미노산 잔기보다 더 가변적인 (즉, 초가변적인) 아미노산 잔기를 넘버링하는 시스템을 지칭한다 (문헌 [Kabat et al. (1971) Ann. NY Acad, Sci. 190:382-391 and Kabat, E.A., et al. (1991) Sequences of Proteins of Immunological Interest, Fifth Edition, U.S. Department of Health and Human Services, NIH Publication No. 91-3242]).
본 발명의 항체는 특정한 생성 또는 생산 방법으로 제한되지 않는다. 따라서, 본 발명은 항체를 분비하는 하이브리도마로부터 제조된 항체, 뿐만 아니라 항체를 코딩하는 폴리뉴클레오티드 또는 폴리뉴클레오티드들로 형질전환 또는 형질감염된 재조합적으로 생성된 세포로부터 생산된 항체를 제공한다. 이러한 하이브리도마, 재조합적으로 생성된 세포, 및 폴리뉴클레오티드는 본 발명의 일부를 형성한다.
본 발명의 항체 또는 그의 항원-결합 단편은 본원에 기재된 바와 같은 2019-nCoV 스파이크 단백질, 또는 2019-nCoV 스파이크 단백질의 특정한 에피토프 (바람직하게는 입체형태적 에피토프)에 대해 선택적이거나 특이적이다. 구체적으로, 항체는 임의의 다른 분자, 특히 임의의 다른 단백질에 대한 유의한 교차-반응성 없이 관심 분자, 이 경우 2019-nCoV 스파이크 단백질 또는 그의 단편에 결합하는 것으로 이해될 것이다. 예를 들어, 본 발명의 특정한 2019-nCoV 스파이크 단백질 에피토프에 특이적인 본 발명의 결합 화합물 또는 항체는 다른 2019-nCoV 스파이크 단백질 에피토프와 유의한 교차-반응성을 나타내지 않을 것이다. 또 다른 예로서, 2019-nCoV 스파이크 단백질에 특이적인 본 발명의 결합 화합물 또는 항체는 2019-nCoV 막 단백질과 유의한 교차-반응성을 나타내지 않을 것이다. 교차-반응성은 임의의 적합한 방법에 의해 평가될 수 있다. 2019-nCoV 스파이크 단백질 에피토프에 대한 결합 화합물 (예를 들어, 항체)과 또 다른 2019-nCoV 스파이크 단백질 에피토프 또는 2019-nCoV 스파이크 단백질 이외의 단백질의 교차-반응성은 결합 화합물 (예를 들어, 항체)이 2019-nCoV 스파이크 단백질 에피토프에 결합하는 것만큼 강하게 다른 분자에 대해 적어도 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 100% 결합하는 경우에 유의한 것으로 간주될 수 있다. 2019-nCoV 스파이크 단백질 또는 그의 단편에 특이적인 결합 화합물 (예를 들어, 항체)은 2019-nCoV 스파이크 단백질 에피토프에 결합하는 강도의 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%, 50%, 45%, 40%, 35%, 30%, 25% 또는 20% 미만으로 또 다른 분자, 예컨대 2019-nCoV 막 단백질에 결합할 수 있다. 바람직하게는, 결합 화합물 (예를 들어, 항체)은 2019-nCoV 스파이크 단백질 에피토프에 결합하는 강도의 20% 미만, 15% 미만, 10% 미만 또는 5% 미만, 2% 미만 또는 1% 미만으로 다른 분자에 결합한다. 결합 친화도는 임의의 적합한 방식으로, 예를 들어 KD에 의해 정량화될 수 있다.
2019-nCoV 스파이크 단백질에 대한 본 발명의 2019-nCoV 스파이크 단백질 항체 (바람직하게는 중화)의 결합 친화도는 해리 상수 (KD)로 정량화될 수 있다. KD는 임의의 적절한 기술을 사용하여 결정될 수 있지만, SPR이 본 발명의 문맥에서 일반적으로 바람직하다. 본 발명의 2019-nCoV 스파이크 단백질 항체는 1 μM 미만, 100 nM 미만, 50 nM 미만, 25 nM 미만, 10 nM 미만, 1 nM 미만, 900 pM 미만, 800 pM 미만, 700 pM 미만, 600 pM 미만, 500 pM 미만, 400 pM 미만, 300 pM 미만, 200 pM 미만, 100 pM 미만, 50 pM 미만, 25 pM 미만, 10 pM 미만, 5 pM 미만, 또는 그 미만의 KD로 2019-nCoV 스파이크 단백질에 결합할 수 있다. 전형적으로, 본 발명의 2019-nCoV 스파이크 단백질 항체는 50 nM 미만, 10 nM 미만 또는 1 nM 미만의 KD로 2019-nCoV 스파이크 단백질에 결합한다.
본 발명의 에피토프/항원에 결합하는 추가의 항체는 본 발명의 항체의 변이체를 생산함으로써 생성될 수 있다. 이러한 변이체는 본 발명의 항체의 CDR과 높은 수준의 동일성을 공유하는 CDR을 가질 수 있고, 예를 들어 각각 독립적으로 변이체 항체가 유래된 본 발명의 항체와 1 또는 2개의 아미노산이 상이할 수 있는 CDR을 가질 수 있으며, 여기서 변이체는 본 발명의 항체의 결합 및 기능적 특성을 보유한다. 추가로, 상기 항체는 프레임워크 영역에 하나 이상의 변이 (예를 들어, 보존적 아미노산 치환)를 가질 수 있다. 본 발명의 항체의 아미노산 서열에서의 변이는 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 및 최대 99% 서열 동일성을 유지해야 한다. 본 발명의 항체, 특히 본원에 예시된 특이적 항체와 적어도 90% 서열 동일성을 갖는 변이체가 구체적으로 고려된다. 변이는 프레임워크 영역으로 제한되거나 제한되지 않을 수 있고, CDR에 존재하지 않을 수 있다.
용어 "중화 항체"는 그 자체로 (임의의 다른 2019-nCoV 스파이크 단백질 항체 또는 또 다른 2019-nCoV 단백질에 대한 다른 항체의 부재 하에) 그가 결합하는 스파이크 단백질의 기능에 영향을 미치는 능력을 갖는 항체를 의미하는 것으로 본원에 정의된다. 특히, 중화 항체는 스파이크 단백질의 생물학적 활성을 중화 또는 억제함으로써 세포를 감염시켜 스파이크 단백질을 발현하는 2019-nCoV 바이러스 입자의 능력을 감소시킨다.
이러한 중화 활성은 임의의 적절한 기술을 사용하여 정량화될 수 있고, 임의의 적절한 단위로 측정될 수 있다. 본 개시내용은 본 발명의 중화 항체 (및 본원에 기재된 바와 같은 다른 결합 화합물)에 동등하게 적용된다. 예를 들어, 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편의 유효성은 그의 반수 최대 유효 농도 (EC50), 자극된 항체 역가 (항체 단위, AU) 및/또는 AU와 관련한 EC50으로 주어질 수 있다. 이들 중 후자는 본 발명의 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편에 의해 자극된 항체 반응의 품질의 지표를 제공한다. 임의의 적절한 기술을 사용하여 EC50, AU 또는 EC50/AU를 결정할 수 있다. 통상의 기술은 관련 기술분야에 공지되어 있다.
생성된 항체의 양은 임의의 적절한 방법을 사용하여 정량화될 수 있으며, 표준 기술이 관련 기술분야에 공지되어 있다. 예를 들어, 생성된 항체의 양은 본 발명의 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편에 의해 유도된 혈청 IgG 반응과 관련하여 ELISA에 의해 측정될 수 있다. 생성된 항체의 양은 임의 항체 단위 (AU)로 주어질 수 있다.
본 발명의 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편에 대한 면역 반응 (또는 면역원성), 특히 항체 반응은 생성된 항체의 양과 관련한 반수-최대 유효 농도, 즉 EC50/AU로 주어질 수 있다. 이는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편에 대해 생성된 면역 반응의 품질의 지표를 제공한다. 예를 들어, 낮은 EC50 (즉, 유효 반응)이지만 높은 수의 생성된 항체 단위는 낮은 수의 항체 단위와 함께 낮은 EC50보다 덜 효과적이다 (더 높은 EC50/AU를 제공함). 따라서, 이 값은 중화 항체 활성 (EC50으로서 측정됨)을 생성된 항-2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편 IgG 항체의 총량의 비율 (ELISA에 의해 측정됨, AU)로서 나타냄으로써 항체 반응의 품질을 나타낸다. 따라서, 보다 효과적인 백신은 보다 적은 항체 (보다 낮은 AU)로 EC50을 유도한다.
전형적으로, 본 발명의 중화 2019-nCoV 스파이크 단백질 항체는 2019-nCoV 입자의 감염성을 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90% 또는 그 초과만큼 감소시킨다.
본 발명의 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편은 천연 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편 또는 비-최적화된 폴리뉴클레오티드에 의해 생성된 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편과 비교하여 개선된 면역 반응, 특히 개선된 항체 반응을 유발할 수 있다.
결합 화합물과 관련된 본원의 임의의 및 모든 개시내용은 바람직하게는 본원에 기재된 바와 같은 항체에 관한 것이다.
대안적으로, 다른 결합 화합물, 예컨대 2019-nCoV 스파이크 단백질 또는 그의 단편, 특히 상기 2019-nCoV 스파이크 단백질 또는 단편 내의 에피토프에 대한 DNA 올리고뉴클레오티드 압타머, RNA 올리고뉴클레오티드 압타머, 및 다른 조작된 생체중합체가 또한 본원에 기재된 항체 및 그의 조합의 활성을 복제할 수 있다. 상기 대안적 결합 화합물은 본 발명의 단백질 또는 그의 면역원성 단편에 특이적으로 결합할 수 있다.
올리고뉴클레오티드 압타머는 널리 확립된 방법을 사용하여 확인 또는 합성될 수 있다. 압타머는 치료 용도에 적합해지도록 추가로 최적화될 수 있으며, 예를 들어 이는 모노클로날 항체에 접합되어 그의 약동학을 변형시키고/거나 Fc-의존성 면역 기능을 동원할 수 있다.
조성물 및 치료 적응증
본원에 기재된 바와 같이, 본 발명자들은 본 발명의 폴리뉴클레오티드에 의해 발현된 2019-nCoV 스파이크 단백질로의 면역화가 강건한 항체 반응을 생성할 수 있음을 입증하였다.
따라서, 본 발명은 백신으로 사용하기 위한, 본 발명의 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편을 발현하는 폴리뉴클레오티드, 발현 구축물, 바이러스 벡터, DNA 플라스미드 또는 RNA 백신, 또는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편, 또는 결합 화합물을 제공한다.
본 발명은 또한 상기 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편을 발현하는 폴리뉴클레오티드, 발현 구축물, 바이러스 벡터, DNA 플라스미드 또는 RNA 백신, 또는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편, 또는 결합 화합물을 포함하는 백신 조성물을 제공한다. 백신 조성물은 임의로 제약상 허용되는 부형제, 희석제, 담체, 추진제, 염 및/또는 첨가제를 포함할 수 있다.
일부 실시양태에서, 백신 조성물은 본 발명에 따른 2종 이상의 상이한 단백질 또는 면역원성 단편, 및/또는 본 발명에 따른 2종 이상의 상이한 폴리뉴클레오티드 분자를 포함한다. 비제한적 예로서, 백신 조성물은 2019-nCoV 스파이크 단백질을 코딩하는 폴리뉴클레오티드 및 2019-nCoV 막 단백질을 코딩하는 폴리뉴클레오티드를 포함할 수 있다.
본 발명은 또한 본 발명의 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편을 발현하는 폴리뉴클레오티드, 발현 구축물, 바이러스 벡터, DNA 플라스미드 또는 RNA 백신, 또는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편, 또는 결합 화합물 (상기 기재된 바와 같음)을 사용하여 대상체에서 면역 반응을 자극하거나 유도하는 방법을 제공한다.
상기 대상체에서 면역 반응을 자극하거나 유도하는 방법은 본 발명의 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편을 발현하는 폴리뉴클레오티드, 발현 구축물, 바이러스 벡터, DNA 플라스미드 또는 RNA 백신, 또는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편, 또는 결합 화합물 (상기 기재된 바와 같음)을 대상체에게 투여하는 것을 포함할 수 있다.
치료 용도 및 방법과 관련하여, "대상체"는 2019-nCoV에 대한 면역보호 반응의 자극 또는 유도로부터 이익을 얻을 임의의 동물 대상체이다. 전형적인 동물 대상체는 포유동물, 예컨대 영장류, 예를 들어 인간이다.
따라서, 본 발명은 2019-nCoV 감염을 치료 또는 예방하는 방법을 제공한다. 상기 방법은 전형적으로 본 발명의 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편을 발현하는 폴리뉴클레오티드, 발현 구축물, 바이러스 벡터, DNA 플라스미드 또는 RNA 백신, 또는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편, 백신 조성물 또는 결합 화합물을 그를 필요로 하는 대상체에게 투여하는 것을 포함한다.
본 발명은 또한 2019-nCoV 감염의 예방 또는 치료에 사용하기 위한, 본 발명의 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편을 발현하는 폴리뉴클레오티드, 발현 구축물, 바이러스 벡터, DNA 플라스미드 또는 RNA 백신, 또는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편, 백신 조성물 또는 결합 화합물을 제공한다.
본 발명은 또한 2019-nCoV 감염의 예방 또는 치료를 위한 의약의 제조를 위한, 본 발명의 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편을 발현하는 폴리뉴클레오티드, 발현 구축물, 바이러스 벡터, DNA 플라스미드 또는 RNA 백신, 또는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편, 백신 조성물 또는 결합 화합물의 용도를 제공한다.
본원에 사용된 용어 "치료" 또는 "치료하는"은 치료적 또는 방지적/예방적 조치를 포괄하고, 2019-nCoV 감염의 감염후 요법 및 호전을 포함한다.
본원에 사용된 용어 "예방하는"은 2019-nCoV에 의한 감염의 개시를 예방하고/거나 2019-nCoV에 의한 감염의 중증도 또는 강도를 감소시키는 것을 포함한다. 용어 "예방하는"은 2019-nCoV에 의한 감염에 대한 보호 면역을 유도하거나 제공하는 것을 포함한다. 2019-nCoV에 의한 감염에 대한 면역은 임의의 적절한 기술을 사용하여 정량화될 수 있으며, 그의 예는 관련 기술분야에 공지되어 있다.
본원에 정의된 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편을 발현하는 폴리뉴클레오티드, 발현 구축물, 바이러스 벡터, DNA 플라스미드 또는 RNA 백신, 또는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편, 백신 조성물 또는 결합 화합물은 2019-nCoV에 의한 감염을 치료 또는 예방하기 위해 이미 2019-nCoV 감염, 2019-nCoV에 의한 감염과 연관된 상태 또는 증상을 갖는 대상체 (전형적으로 포유동물 대상체, 예컨대 인간 또는 다른 영장류)에게 투여될 수 있다. 예를 들어, 대상체는 2019-nCoV와 접촉한 것으로 의심될 수 있거나, 또는 2019-nCoV와 접촉한 것으로 알려졌지만, 아직 노출의 증상을 나타내지 않는다.
이미 2019-nCoV 감염을 앓고 있거나, 또는 2019-nCoV 감염과 연관된 증상을 보이고 있는 대상체 (예를 들어, 포유동물, 예컨대, 인간 또는 다른 영장류)에게 투여되었을 때, 정의된 바와 같은 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편을 발현하는 폴리뉴클레오티드, 발현 구축물, 바이러스 벡터, DNA 플라스미드 또는 RNA 백신, 또는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편, 백신 조성물 또는 결합 화합물은 1종 이상의 증상을 치유하거나, 지연시키거나, 그의 중증도를 감소시키거나, 또는 호전시킬 수 있고/거나, 이러한 치료의 부재 하에서 예상되는 것 이상으로 대상체의 생존을 연장시킬 수 있다.
대안적으로, 본원에 정의된 바와 같은 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편을 발현하는 폴리뉴클레오티드, 발현 구축물, 바이러스 벡터, DNA 플라스미드 또는 RNA 백신, 또는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편, 백신 조성물 또는 결합 화합물은 궁극적으로 2019-nCoV로 감염될 수 있는 대상체 (예를 들어, 포유동물, 예컨대 인간 또는 다른 영장류)에게 투여되어, 상기 2019-nCoV 감염의 1종 이상의 증상을 예방하거나, 치유하거나, 지연시키거나, 그의 중증도를 감소시키거나, 또는 호전시키거나, 또는 이러한 치료의 부재 하에 예상되는 것 이상으로 대상체의 생존을 연장시키거나, 또는 대상체가 2019-nCoV 감염을 전파하는 것을 예방하는 데 도움이 될 수 있다.
본 발명의 치료 및 예방 요법은 상이한 연령의 다양한 상이한 대상체에게 적용가능하다. 인간과 관련하여, 요법은 소아 (예를 들어, 영아, 5세 미만의 소아, 더 큰 소아 또는 10대) 및 성인에게 적용가능하다. 다른 동물 대상체 (예를 들어, 포유동물, 예컨대 영장류)와 관련하여, 요법은 미성숙 대상체 및 성숙/성인 대상체에게 적용가능하다. 본원에 사용된 용어 "예방하는"은 2019-nCoV 감염의 개시를 예방하고/거나 2019-nCoV 감염의 중증도 또는 강도를 감소시키는 것을 포함한다. 용어 "예방하는"은 2019-nCoV 감염에 대한 보호 면역을 유도하거나 제공하는 것을 포함한다. 2019-nCoV 감염에 대한 면역은 임의의 적절한 기술을 사용하여 정량화될 수 있으며, 그의 예는 관련 기술분야에 공지되어 있다.
본원에 사용된 "백신"은 동물 대상체, 예컨대 포유동물 (예를 들어, 인간 또는 다른 영장류)에게 투여될 때 2019-nCoV 감염에 대한 보호성 면역 반응을 자극하는 제제이다. 면역 반응은 체액성 및/또는 세포-매개 면역 반응일 수 있다. 본 발명의 백신은, 예를 들어 2019-nCoV 감염의 영향으로부터 대상체를 보호하기 위해 사용될 수 있다.
제약 조성물 및 제제
용어 "백신"은 본원에서 용어 "치료/예방 조성물", "제제" 또는 "의약"과 상호교환가능하게 사용된다.
본 발명의 백신 (상기 정의된 바와 같음)은 제약상 허용되는 담체에 추가하여 조합되거나 투여될 수 있다. 대안적으로 또는 추가로, 본 발명의 백신은 염, 부형제, 희석제, 아주반트, 면역조절제 및/또는 항미생물 화합물 중 하나 이상과 추가로 조합할 수 있다.
제약상 허용되는 염은 무기산, 예컨대 염산 또는 인산, 또는 유기산, 예컨대 아세트산, 옥살산, 타르타르산, 말레산 등으로 형성된 산 부가염을 포함한다. 유리 카르복실 기로 형성된 염은 또한 무기 염기, 예컨대 예를 들어 수산화나트륨, 수산화칼륨, 수산화암모늄, 수산화칼슘 또는 수산화제2철, 및 유기 염기, 예컨대 이소프로필아민, 트리메틸아민, 2-에틸아미노 에탄올, 히스티딘, 프로카인 등으로부터 유래될 수 있다.
면역원성 조성물, 치료 제제, 의약 및 예방 제제 (예를 들어, 백신)의 투여는 일반적으로 통상적인 경로, 예를 들어 정맥내, 피하, 복강내 또는 점막 경로에 의한 것이다. 투여는 비경구 주사, 예를 들어 피하, 피내 또는 근육내 주사에 의한 것일 수 있다. 중화 항체를 포함하는 제제는 정맥내, 근육내, 피내 또는 피하 투여에 특히 적합할 수 있다.
따라서, 본 발명의 면역원성 조성물, 치료 제제, 의약 및 예방 제제 (예를 들어, 백신)는 전형적으로 액체 용액 또는 현탁액으로 주사제로서 제조된다. 주사 전에 액체 중에 용해 또는 현탁시키기에 적합한 고체 형태가 대안적으로 제조될 수 있다. 제제는 또한 유화되거나, 또는 펩티드를 리포솜 또는 마이크로캡슐 내에 캡슐화할 수 있다.
활성 면역원성 성분 (예컨대, 2019-nCoV 스파이크 단백질, 그의 단편, 상기 스파이크 단백질을 코딩하는 핵산, 발현 벡터, 바이러스 벡터, DNA 플라스미드, RNA 백신, 융합 단백질 및 백신 조성물)은 종종 제약상 허용되고 활성 성분과 상용성인 담체, 희석제, 부형제 또는 유사물과 혼합된다. 적합한 부형제는, 예를 들어 물, 염수, 덱스트로스, 글리세롤, 에탄올 등 및 그의 조합이다. 또한, 원하는 경우, 백신은 소량의 보조 물질, 예컨대 습윤제 또는 유화제, pH 완충제, 및/또는 백신의 유효성을 증진시키는 아주반트를 함유할 수 있다.
일반적으로, 담체, 희석제, 부형제 또는 유사물은 제약상 허용되는 담체이다. 제약상 허용되는 담체의 비제한적 예는 물, 염수 및 포스페이트-완충 염수를 포함한다. 그러나, 일부 실시양태에서, 조성물은 동결건조 형태이고, 이 경우에 안정화제, 예컨대 BSA를 포함할 수 있다. 일부 실시양태에서, 장기간 저장을 용이하게 하기 위해 조성물을 보존제, 예컨대 티오메르살 또는 아지드화나트륨과 함께 제제화하는 것이 바람직할 수 있다.
효과적일 수 있는 추가의 아주반트의 예는 완전 프로인트 아주반트 (CFA), 불완전 프로인트 아주반트 (IFA), 사포닌, 사포닌의 정제된 추출물 분획, 예컨대 퀼 A, 사포닌의 유도체, 예컨대 QS-21, 사포닌을 기재로 하는 지질 입자, 예컨대 이스콤/이스코매트릭스(ISCOM/ISCOMATRIX), 이. 콜라이 열 불안정성 독소 (LT) 돌연변이체, 예컨대 LTK63 및/또는 LTK72, 수산화알루미늄, N-아세틸-뮤라밀-L-트레오닐-D-이소글루타민 (thr-MDP), N-아세틸-노르-뮤라밀-L-알라닐-D-이소글루타민 (CGP 11637, 노르-MDP로 지칭됨), N-아세틸뮤라밀-L-알라닐-D-이소글루타미닐-L-알라닌-2-(1'-2'-디팔미토일-sn-글리세로-3-히드록시포스포릴 옥시)-에틸아민 (CGP 19835A, MTP-PE로 지칭됨), 및 박테리아로부터 추출된 3종의 성분을 함유하는 RIBI, GLA-SE (GLA는 합성 지질 A 유도체이고, GLA-SE에서 스쿠알렌 오일을 사용하여 수중유 에멀젼으로서 제제화됨), 2% 스쿠알렌/트윈 80 에멀젼 중 모노포스포릴 지질 A, 트레할로스 디미콜레이트 및 세포벽 골격 (MPL+TDM+CWS), 노파르티스(Novartis)에 의해 개발된 MF59 제제, 및 GSK 바이올로지칼스(GSK Biologicals) (벨기에 릭센사르트)에 의해 개발된 AS02, AS01, AS03 및 AS04 아주반트 제제를 포함하나 이에 제한되지는 않는다. 바람직한 아주반트는 수산화알루미늄 및 인산알루미늄 겔; 수산화알루미늄 및 모노포스포릴 지질 A (MPL); 및 5% 스쿠알렌 (MF59)을 포함한다. 다른 바람직한 아주반트는 명반 또는 수산화알루미늄 및/또는 인산알루미늄, GLA-SE 및/또는 스쿠알렌-기재 아주반트, 예컨대 MF59 또는 아다박스™, 또는 그의 임의의 조합을 포함한다. 바람직하게는 수산화알루미늄 및/또는 인산알루미늄, GLA-SE 및 아다박스™의 조합이 사용된다.
완충제의 예는 숙신산나트륨 (pH 6.5), 및 포스페이트 완충 염수 (PBS; pH 6.5 및 7.5)를 포함하나 이에 제한되지는 않는다.
다른 투여 방식에 적합한 추가의 제제는 좌제, 및 일부 경우에, 경구 제제 또는 에어로졸로서의 분배에 적합한 제제를 포함한다. 좌제의 경우, 전통적인 결합제 및 담체는, 예를 들어 폴리알킬렌 글리콜 또는 트리글리세리드를 포함할 수 있고; 이러한 좌제는 활성 성분을 0.5% 내지 10%, 바람직하게는 1%-2%의 범위로 함유하는 혼합물로부터 형성될 수 있다.
경구 제제는, 예를 들어 제약 등급의 만니톨, 락토스, 전분, 스테아르산마그네슘, 사카린나트륨, 셀룰로스, 탄산마그네슘 등과 같은 통상적으로 사용되는 부형제를 포함한다. 이들 조성물은 용액, 현탁액, 정제, 환제, 캡슐, 지속 방출 제제 또는 분말의 형태를 취한다.
정의
본원에 사용된 용어 "할 수 있는"은 동사와 함께 사용되는 경우, 상응하는 동사의 작용을 포괄하거나 의미한다. 예를 들어, "상호작용할 수 있는"은 또한 상호작용하는 것을 의미하고, "절단할 수 있는"은 또한 절단하는 것을 의미하고, "결합할 수 있는"은 또한 결합하는 것을 의미하고, "특이적으로 표적화할 수 있는..."은 또한 특이적으로 표적화하는 것을 의미한다.
단백질과 관련하여 사용될 때, 용어 "변이체"는 아미노산 (예를 들어, 비천연 아미노산)의 하나 이상의 유사체, 또는 치환된 연결을 함유하는 단백질의 펩티드 또는 펩티드 단편을 의미한다.
단백질과 관련하여 사용될 때, 용어 "유도체"는 해당 단백질 및 추가의 펩티드 서열을 포함하는 단백질을 의미한다. 추가의 펩티드 서열은 바람직하게는 원래의 단백질의 기본 폴딩 및 이에 따른 입체형태적 구조를 방해하지 않아야 한다. 2개 이상의 펩티드 (또는 단편, 또는 변이체)는 함께 연결되어 유도체를 형성할 수 있다. 대안적으로, 펩티드 (또는 단편, 또는 변이체)는 비관련 분자 (예를 들어, 제2, 비관련 펩티드)에 연결될 수 있다. 유도체는 화학적으로 합성될 수 있지만, 전형적으로 재조합 핵산 방법에 의해 제조될 것이다. 추가의 성분, 예컨대 지질, 및/또는 폴리사카라이드, 및/또는 폴리펩티드 성분이 포함될 수 있다.
본 명세서에서 2019-nCoV 폴리뉴클레오티드 및/또는 단백질에 대한 언급은 그의 단편 및 변이체를 포함한다. 변이체 2019-nCoV 스파이크 단백질은 천연 스파이크 단백질의 하나 이상의 입체형태적 에피토프 및 중화 항체의 생성 및/또는 면역보호 반응을 도출하는 능력을 보유한다. 본 발명의 변이체 2019-nCoV 스파이크 단백질 폴리뉴클레오티드는 이러한 스파이크 단백질을 코딩한다. 예로서, 변이체는 참조 서열 (예를 들어, 본 발명의 2019-nCoV 폴리뉴클레오티드 및/또는 단백질, 특히 2019-nCoV 폴리뉴클레오티드 및/또는 단백질을 규정하는 본 명세서에 제시된 임의의 서열식별번호)과 적어도 80%, 바람직하게는 적어도 90%, 보다 바람직하게는 적어도 95%, 가장 바람직하게는 적어도 97 또는 적어도 99% 아미노산 서열 상동성을 가질 수 있다. 따라서, 변이체는 폴리뉴클레오티드의 하나 이상의 유사체 (예를 들어, 비천연 핵산), 또는 치환된 연결을 포함할 수 있다. 또한, 예로서, 2019-nCoV 폴리뉴클레오티드 및/또는 단백질과 관련하여 사용될 때, 단편이라는 용어는 참조 2019-nCoV 폴리뉴클레오티드 및/또는 단백질의 적어도 10개, 바람직하게는 적어도 15개, 보다 바람직하게는 적어도 20개의 핵산 잔기를 갖는 폴리뉴클레오티드를 의미한다. 용어 단편은 또한 상기 언급된 변이체에 관한 것이다. 따라서, 예로서, 본 발명의 2019-nCoV 폴리뉴클레오티드 및/또는 단백질의 단편은 적어도 10, 20 또는 30개의 핵산을 갖는 핵산 서열을 포함할 수 있으며, 여기서 폴리뉴클레오티드 서열은 참조 2019-nCoV 폴리뉴클레오티드 및/또는 단백질 서열의 (인접한) 핵산의 상응하는 핵산 서열에 비해 적어도 80% 서열 상동성을 갖는다. 단편 및 변이체의 이들 정의는 또한 본 발명의 다른 폴리뉴클레오티드에도 적용된다. 펩티드 서열과 관련하여, 용어 단편은 참조 단백질의 적어도 10개, 바람직하게는 적어도 15개, 보다 바람직하게는 적어도 20개의 아미노산 잔기를 갖는 펩티드를 의미한다. 용어 단편은 또한 상기 언급된 변이체에 관한 것이다. 따라서, 예로서, 단편은 적어도 10, 20 또는 30개의 아미노산을 갖는 아미노산 서열을 포함할 수 있으며, 여기서 아미노산 서열은 참조 서열의 (인접한) 아미노산의 상응하는 아미노산 서열에 비해 적어도 80% 서열 상동성을 갖는다.
본원에서 예시된 일부 폴리뉴클레오티드는 추가의 모티프, 특히 제한 효소 부위, KOZAC 서열 및/또는 단백질 분비를 유도하는 모티프 (예를 들어, tga taa)를 포함한다. 관련 기술분야의 통상의 기술자는 이들 추가의 서열이 생략될 수 있음을 이해할 것이다. 따라서, 본 발명은 명시된 모티프를 포함하는 예시된 핵산 서열, 뿐만 아니라 이들 모티프 중 하나 이상이 결여된 핵산 서열을 포괄한다.
용어 "감소시키다", "감소된", "감소" 또는 "억제하다"는 모두 본원에서 통계적으로 유의한 양만큼의 감소를 의미하는 것으로 사용된다. 용어 "감소시키다", "감소" 또는 "감소시키다" 또는 "억제하다"는 전형적으로 참조 수준 (예를 들어, 소정의 치료 부재)과 비교하여 적어도 10%만큼의 감소를 의미하고, 예를 들어 적어도 약 10%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%, 적어도 약 99%, 또는 그 초과만큼의 감소를 포함할 수 있다. 본원에 사용된 "감소" 또는 "억제"는 참조 수준과 비교하여 완전한 억제 또는 감소를 포괄하지 않는다. "완전한 억제"는 참조 수준과 비교하여 100% 억제이다. 감소는 바람직하게는 소정의 장애를 갖지 않는 개체에 대해 정상 범위 내로서 허용되는 수준까지의 감소일 수 있다.
용어 "증가된", "증가시키다", "증진시키다" 또는 "활성화시키다"는 모두 본원에서 통계적으로 유의한 양만큼의 증가를 의미하는 것으로 사용된다. 용어 "증가된", "증가시키다", "증진시키다" 또는 "활성화시키다"는 참조 수준과 비교하여 적어도 10%의 증가, 예를 들어 참조 수준과 비교하여 적어도 약 20%, 또는 적어도 약 30%, 또는 적어도 약 40%, 또는 적어도 약 50%, 또는 적어도 약 60%, 또는 적어도 약 70%, 또는 적어도 약 80%, 또는 적어도 약 90%, 또는 100%까지의 증가 또는 10-100% 사이의 임의의 증가, 또는 참조 수준과 비교하여 적어도 약 2배, 또는 적어도 약 3배, 또는 적어도 약 4배, 또는 적어도 약 5배 또는 적어도 약 10배 증가, 또는 2배 내지 10배 또는 그 초과의 임의의 증가를 의미할 수 있다. 마커 또는 증상과 관련하여, "증가"는 이러한 수준의 통계적으로 유의한 증가이다.
본원에 사용된 "대상체"는 인간 또는 동물을 의미한다. 통상적으로 동물은 척추동물, 예컨대 영장류, 설치류, 가축 또는 사냥 동물이다. 영장류는 침팬지, 시노몰구스 원숭이, 거미 원숭이 및 마카크, 예를 들어 레서스를 포함한다. 설치류는 마우스, 래트, 우드척, 페릿, 토끼 및 햄스터를 포함한다. 가축 및 사냥 동물은 소, 말, 돼지, 사슴, 들소, 버팔로, 고양이 종, 예를 들어 집고양이, 개 종, 예를 들어 개, 여우, 늑대, 조류 종, 예를 들어 닭, 에뮤, 타조, 및 어류, 예를 들어 송어, 어류 및 연어를 포함한다. 바람직하게는, 대상체는 포유동물, 예를 들어 영장류, 예를 들어 인간이다. 용어 "개체", "환자" 및 "대상체"는 본원에서 상호교환가능하게 사용된다.
바람직하게는, 대상체는 포유동물이다. 포유동물은 인간, 비-인간 영장류, 마우스, 래트, 개, 고양이, 말 또는 소일 수 있으나, 이들 예로 제한되지는 않는다. 인간 이외의 포유동물은 통증의 동물 모델을 나타내는 대상체로서 유리하게 사용될 수 있다. 대상체는 남성 또는 여성, 성인 또는 소아일 수 있다.
대상체는 치료를 필요로 하는 상태 또는 이러한 상태와 관련된 1종 이상의 합병증을 앓고 있거나 갖는 것으로 이전에 진단 또는 확인되었고, 임의로 본원에 정의된 바와 같은 상태 또는 상기 상태와 관련된 1종 이상의 합병증에 대해 이미 치료를 받는 대상체일 수 있다. 대안적으로, 대상체는 또한 본원에 정의된 바와 같은 상태 또는 상기 상태와 관련된 1종 이상의 합병증을 갖는 것으로 이전에 진단되지 않은 대상체일 수 있다. 예를 들어, 대상체는 상태 또는 상기 상태와 관련된 1종 이상의 합병증에 대한 하나 이상의 위험 인자를 나타내는 대상체 또는 위험 인자를 나타내지 않는 대상체일 수 있다.
특정한 상태에 대한 치료를 "필요로 하는 대상체"는 그 상태를 갖거나, 그 상태를 갖는 것으로 진단되거나, 또는 그 상태가 발생할 위험이 있는 대상체일 수 있다.
본원에 사용된 용어 "단백질" 및 "폴리펩티드"는 인접한 잔기의 알파-아미노 및 카르복실 기 사이의 펩티드 결합에 의해 서로 연결된 일련의 아미노산 잔기를 지정하기 위해 본원에서 상호교환가능하게 사용된다. 용어 "단백질" 및 "폴리펩티드"는 그의 크기 또는 기능에 상관없이, 변형된 아미노산 (예를 들어, 인산화, 당화, 글리코실화 등) 및 아미노산 유사체를 비롯한 아미노산의 중합체를 지칭한다. "단백질" 및 "폴리펩티드"는 종종 비교적 큰 폴리펩티드와 관련하여 사용되는 반면에, 용어 "펩티드"는 종종 작은 폴리펩티드와 관련하여 사용되지만, 관련 기술분야에서의 이들 용어의 용법은 중복된다. 용어 "단백질" 및 "폴리펩티드"는 유전자 산물 및 그의 단편을 지칭하는 경우에 본원에서 상호교환가능하게 사용된다. 따라서, 예시적인 폴리펩티드 또는 단백질은 유전자 산물, 자연 발생 단백질, 상동체, 오르토로그, 파라로그, 단편 및 상기의 다른 등가물, 변이체, 단편 및 유사체를 포함한다.
폴리펩티드, 예를 들어 융합 폴리펩티드 또는 그의 부분 (예를 들어, 도메인)은 본원에 기재된 서열의 변이체일 수 있다. 바람직하게는, 변이체는 보존적 치환 변이체이다. 본원에서 지칭되는 "변이체"는 천연 또는 참조 폴리펩티드와 실질적으로 상동이지만, 하나 또는 복수의 결실, 삽입 또는 치환으로 인해 천연 또는 참조 폴리펩티드의 것과 상이한 아미노산 서열을 갖는 폴리펩티드이다. 폴리펩티드-코딩 DNA 서열은 천연 또는 참조 DNA 서열에 비해 뉴클레오티드의 하나 이상의 부가, 결실 또는 치환을 포함하지만, 참조 단백질에 비해 관련 생물학적 활성을 보유하는 변이체 단백질 또는 그의 단편, 예를 들어 야생형 참조 단백질의 적어도 50%를 코딩하는 서열을 포함한다. 아미노산 서열에 관하여, 관련 기술분야의 통상의 기술자는 코딩된 서열에서 단일 아미노산 또는 작은 백분율 (즉, 5% 이하, 예를 들어 4% 이하, 또는 3% 이하, 또는 1% 이하)의 아미노산을 변경시키는 핵산, 펩티드, 폴리펩티드 또는 단백질 서열에 대한 개별 치환, 결실 또는 부가가, 변경이 화학적으로 유사한 아미노산으로의 아미노산의 치환을 발생시키는 경우에 "보존적으로 변형된 변이체"라는 것을 인식할 것이다. 일부 변화는 관련 활성을 잠재적으로 개선시켜, 변이체가 보존적이든 아니든 야생형 활성의 100% 초과, 예를 들어 110%, 125%, 150%, 175%, 200%, 500%, 1000% 또는 그 초과를 갖도록 할 수 있는 것으로 고려된다.
소정의 아미노산은 유사한 생리화학적 특징을 갖는 잔기에 의해 대체될 수 있으며, 예를 들어 하나의 지방족 잔기를 또 다른 것으로 치환하거나 (예컨대, 서로 Ile, Val, Leu 또는 Ala), 또는 하나의 극성 잔기를 또 다른 것으로 치환한다 (예컨대, Lys와 Arg; Glu와 Asp; 또는 Gln과 Asn). 다른 이러한 보존적 치환, 예를 들어 유사한 소수성 특징을 갖는 전체 영역의 치환이 공지되어 있다. 보존적 아미노산 치환을 포함하는 폴리펩티드는 천연 또는 참조 폴리펩티드의 목적 활성이 보유됨을 확인하기 위해 본원에 기재된 검정 중 어느 하나에서 시험될 수 있다. 기능적으로 유사한 아미노산을 제공하는 보존적 치환 표가 관련 기술분야에 널리 공지되어 있다. 이러한 보존적으로 변형된 변이체는 본 개시내용과 일치하는 다형성 변이체, 종간 상동체 및 대립유전자에 부가적이고 이를 배제하지 않는다. 전형적으로 서로에 대한 보존적 치환은 1) 알라닌 (A), 글리신 (G); 2) 아스파르트산 (D), 글루탐산 (E); 3) 아스파라긴 (N), 글루타민 (Q); 4) 아르기닌 (R), 리신 (K); 5)이소류신 (I), 류신 (L), 메티오닌 (M), 발린 (V); 6) 페닐알라닌 (F), 티로신 (Y), 트립토판 (W); 7) 세린 (S), 트레오닌 (T); 및 8) 시스테인 (C), 메티오닌 (M)을 포함한다 (예를 들어, 문헌 [Creighton, Proteins (1984)] 참조).
폴리펩티드의 적절한 입체형태를 유지하는 데 수반되지 않는 임의의 시스테인 잔기는 또한 일반적으로 세린으로 치환되어, 분자의 산화 안정성을 개선시키고 이상 가교를 방지할 수 있다. 반대로, 시스테인 결합(들)이 폴리펩티드에 부가되어 그의 안정성을 개선시키거나 또는 올리고머화를 용이하게 할 수 있다.
본원에 기재된 바와 같은 폴리펩티드는 적어도 1개의 펩티드 결합 대체를 포함할 수 있다. 단일 펩티드 결합 또는 다중 펩티드 결합, 예를 들어 2개의 결합, 3개의 결합, 4개의 결합, 5개의 결합, 또는 6개 이상의 결합, 또는 모든 펩티드 결합이 대체될 수 있다. 본원에 기재된 바와 같은 단리된 펩티드는 1가지 유형의 펩티드 결합 대체 또는 다중 유형의 펩티드 결합 대체, 예를 들어 2가지 유형, 3가지 유형, 4가지 유형, 5가지 유형 또는 그 초과의 유형의 펩티드 결합 대체를 포함할 수 있다. 펩티드 결합 대체의 비제한적 예는 우레아, 티오우레아, 카르바메이트, 술포닐 우레아, 트리플루오로에틸아민, 오르토-(아미노알킬)-페닐아세트산, 파라-(아미노알킬)-페닐아세트산, 메타-(아미노알킬)-페닐아세트산, 티오아미드, 테트라졸, 보론산 에스테르, 올레핀계 기 및 그의 유도체를 포함한다.
본원에 기재된 바와 같은 폴리펩티드는 살아있는 유기체에 의해 생산된 폴리펩티드 및/또는 단백질에서 통상적으로 발견되는 자연 발생 아미노산, 예를 들어 Ala (A), Val (V), Leu (L), Ile (I), Pro (P), Phe (F), Trp (W), Met (M), Gly (G), Ser (S), Thr (T), Cys (C), Tyr (Y), Asn (N), Gln (Q), Asp (D), Glu (E), Lys (K), Arg (R), 및 His (H)를 포함할 수 있다. 본원에 기재된 바와 같은 폴리펩티드는 대안적 아미노산을 포함할 수 있다. 대안적 아미노산의 비제한적 예는 D 아미노산, 베타-아미노산, 호모시스테인, 포스포세린, 포스포트레오닌, 포스포티로신, 히드록시프롤린, 감마-카르복시글루타메이트; 히푸르산, 옥타히드로인돌-2-카르복실산, 스타틴, 1,2,3,4-테트라히드로이소퀴놀린-3-카르복실산, 페니실라민 (3-메르캅토-D-발린), 오르니틴, 시트룰린, 알파-메틸-알라닌, 파라-벤조일페닐알라닌, 파라아미노페닐알라닌, p-플루오로페닐알라닌, 페닐글리신, 프로파르길글리신, 사르코신 및 tert-부틸글리신), 디아미노부티르산, 7-히드록시-테트라히드로이소퀴놀린 카르복실산, 나프틸알라닌, 비페닐알라닌, 시클로헥실알라닌, 아미노-이소부티르산, 노르발린, 노르류신, tert-류신, 테트라히드로이소퀴놀린 카르복실산, 피페콜산, 페닐글리신, 호모페닐알라닌, 시클로헥실글리신, 데히드로류신, 2,2-디에틸글리신, l-아미노-1-시클로펜탄카르복실산, l-아미노-1-시클로헥산카르복실산, 아미노-벤조산, 아미노-나프토산, 감마-아미노부티르산, 디플루오로페닐알라닌, 니페코트산, 알파아미노 부티르산, 티에닐-알라닌, t-부틸글리신, 트리플루오로발린; 헥사플루오로류신; 플루오린화 유사체; 아지드-변형된 아미노산; 알킨-변형된 아미노산; 시아노-변형된 아미노산; 및 그의 유도체를 포함한다.
폴리펩티드는, 예를 들어 펩티드를 구성하는 아미노산 중 하나 이상에 모이어티를 부가함으로써 변형될 수 있다. 본원에 기재된 바와 같은 폴리펩티드는 1개 이상의 모이어티 분자, 예를 들어 펩티드당 1개 이상의 모이어티 분자, 펩티드당 2개 이상의 모이어티 분자, 펩티드당 5개 이상의 모이어티 분자, 펩티드당 10개 이상의 모이어티 분자 또는 펩티드당 1개 이상의 모이어티 분자를 포함할 수 있다. 본원에 기재된 바와 같은 폴리펩티드는 1가지 이상의 유형의 변형 및/또는 모이어티, 예를 들어 1가지 유형의 변형, 2가지 유형의 변형, 3가지 유형의 변형 또는 더 많은 유형의 변형을 포함할 수 있다. 변형 및/또는 모이어티의 비제한적 예는 PEG화; 글리코실화; HES화; ELP화; 지질화; 아세틸화; 아미드화; 말단-캡핑 변형; 시아노 기; 인산화; 알부민 및 고리화를 포함한다.
원래의 아미노산 서열의 변경은 관련 기술분야의 통상의 기술자에게 공지된 다수의 기술 중 임의의 것에 의해 달성될 수 있다. 아미노산 치환은, 예를 들어 변화될 아미노산을 코딩하는 뉴클레오티드 서열에 코돈 변화를 함유하는 올리고뉴클레오티드를 합성함으로써 특정한 위치에 도입될 수 있고, 이는 원래 서열의 단편에 대한 라이게이션을 허용하는 제한 부위에 의해 플랭킹된다. 라이게이션 후, 생성된 재구성된 서열은 목적하는 아미노산 삽입, 치환 또는 결실을 갖는 유사체를 코딩한다. 대안적으로, 올리고뉴클레오티드-지정 부위-특이적 돌연변이유발 절차를 이용하여, 요구되는 치환, 결실 또는 삽입에 따라 변경된 특정한 코돈을 갖는 변경된 뉴클레오티드 서열을 제공할 수 있다. 이러한 변경을 만드는 기술은 문헌 [Walder et al. (Gene 42:133, 1986); Bauer et al. (Gene 37:73, 1985); Craik (BioTechniques, January 1985, 12-19); Smith et al. (Genetic Engineering: Principles and Methods, Plenum Press, 1981)]; 및 미국 특허 번호 4,518,584 및 4,737,462 (그 전문이 본원에 참조로 포함됨)에 의해 개시된 것들을 포함한다. 본원에 기재된 바와 같은 폴리펩티드는 화학적으로 합성될 수 있고, 돌연변이는 화학적 합성 과정의 일부로서 혼입될 수 있다.
본원에 사용된 용어 "폴리뉴클레오티드", "핵산" 및 "핵산 서열"은 리보핵산, 데옥시리보핵산 또는 그의 유사체의 단위를 포함하는 임의의 분자, 바람직하게는 중합체 분자를 지칭한다. 핵산은 단일-가닥 또는 이중-가닥일 수 있다. 단일-가닥 핵산은 변성된 이중-가닥 DNA의 하나의 핵산 가닥일 수 있다. 대안적으로, 이는 임의의 이중-가닥 DNA로부터 유래되지 않은 단일-가닥 핵산일 수 있다. 한 측면에서, 핵산은 DNA일 수 있다. 또 다른 측면에서, 핵산은 RNA일 수 있다. 핵산 분자는 게놈 DNA 또는 cDNA를 비롯한 DNA이다. 다른 적합한 핵산 분자는 mRNA를 비롯한 RNA이다.
본원에 사용된 용어 "포함하는" 또는 "포함하다"는 방법 또는 조성물에 필수적이지만 필수적이든 그렇지 않든 비명시된 요소의 포함에 대해서도 개방되어 있는 조성물, 방법, 및 그의 각각의 성분(들)과 관련하여 사용된다.
용어 "~로 이루어진"은 본 발명의 상기 설명에서 언급되지 않은 임의의 요소를 배제한 본원에 기재된 바와 같은 조성물, 방법, 및 그의 각각의 성분을 지칭한다.
본원에 사용된 용어 "~로 본질적으로 이루어진"은 주어진 발명에 요구되는 요소를 지칭한다. 상기 용어는 본 발명의 기본적이고 신규한 또는 기능적 특징(들)에 실질적으로 영향을 미치지 않는 요소의 존재를 허용한다.
서열 상동성
전역 방법, 국부 방법 및 하이브리드 방법, 예컨대 예를 들어 분절 접근 방법을 포함하나 이에 제한되지는 않는 임의의 다양한 서열 정렬 방법이 퍼센트 동일성을 결정하는 데 사용될 수 있다. 퍼센트 동일성을 결정하기 위한 프로토콜은 관련 기술분야의 통상의 기술자의 범주 내에 속하는 상용 절차이다. 전역 방법은 분자의 시작부터 끝까지 서열을 정렬하고, 개별 잔기 쌍의 점수를 합산하고 갭 페널티를 부과함으로써 최선의 정렬을 결정한다. 비제한적 방법은, 예를 들어 CLUSTAL W (예를 들어, 문헌 [Julie D. Thompson et al., CLUSTAL W: Improving the Sensitivity of Progressive Multiple Sequence Alignment Through Sequence Weighting, Position-Specific Gap Penalties and Weight Matrix Choice, 22(22) Nucleic Acids Research 4673-4680 (1994)] 참조); 및 반복 정밀화 (예를 들어, 문헌 [Osamu Gotoh, Significant Improvement in Accuracy of Multiple Protein. Sequence Alignments by Iterative Refinement as Assessed by Reference to Structural Alignments, 264(4) J. Mol. Biol. 823-838 (1996)] 참조)를 포함한다. 국부 방법은 모든 입력 서열에 의해 공유되는 하나 이상의 보존된 모티프를 확인함으로써 서열을 정렬한다. 비제한적 방법은, 예를 들어 매치-박스(Match-box) (예를 들어, 문헌 [Eric Depiereux and Ernest Feytmans, Match-Box: A Fundamentally New Algorithm for the Simultaneous Alignment of Several Protein Sequences, 8(5) CABIOS 501 -509 (1992)] 참조); 깁스(Gibbs) 샘플링 (예를 들어, 문헌 [C. E. Lawrence et al., Detecting Subtle Sequence Signals: A Gibbs Sampling Strategy for Multiple Alignment, 262(5131 ) Science 208-214 (1993)] 참조); 얼라인-M(Align-M) (예를 들어, 문헌 [Ivo Van Walle et al., Align-M - A New Algorithm for Multiple Alignment of Highly Divergent Sequences, 20(9) Bioinformatics: 1428-1435 (2004)] 참조)을 포함한다.
따라서, 퍼센트 서열 동일성은 통상적인 방법에 의해 결정된다. 예를 들어, 문헌 [Altschul et al., Bull. Math. Bio. 48: 603-16, 1986 and Henikoff and Henikoff, Proc. Natl. Acad. Sci. USA 89:10915-19, 1992]을 참조한다. 간략하게, 갭 개방 페널티 10, 갭 연장 페널티 1, 및 하기 제시된 바와 같은 문헌 [Henikoff and Henikoff] (상기 문헌)의 "블로섬(blosum) 62" 점수화 매트릭스 (아미노산은 표준 1-문자 코드로 나타냄)을 사용하여 정렬 점수가 최적화되도록 2개의 아미노산 서열을 정렬한다.
서열 동일성을 결정하기 위한 정렬 점수
BLOSUM62 표
이어서, 퍼센트 동일성을 다음과 같이 계산한다:
실질적으로 상동성인 폴리펩티드는 하나 이상의 아미노산 치환, 결실 또는 부가를 갖는 것을 특징으로 한다. 이들 변화는 바람직하게는 부차적인 성질의 것, 즉 보존적 아미노산 치환 (하기 참조) 및 폴리펩티드의 폴딩 또는 활성에 유의하게 영향을 미치지 않는 다른 치환; 소형 결실, 전형적으로 1 내지 약 30개의 아미노산의 결실; 및 소형 아미노- 또는 카르복실-말단 연장, 예컨대 아미노-말단 메티오닌 잔기, 약 20-25개 이하의 잔기의 소형 링커 펩티드, 또는 친화성 태그이다.
보존적 아미노산 치환
염기성:
아르기닌
리신
히스티딘
산성:
글루탐산
아스파르트산
극성:
글루타민
아스파라긴
소수성:
류신
이소류신
발린
방향족:
페닐알라닌
트립토판
티로신
소형:
글리신
알라닌
세린
트레오닌
메티오닌
20개의 표준 아미노산에 추가로, 비-표준 아미노산 (예컨대, 4-히드록시프롤린, 6-N-메틸 리신, 2-아미노이소부티르산, 이소발린 및 -메틸 세린)이 본 발명의 폴리펩티드의 아미노산 잔기를 치환할 수 있다. 제한된 수의 비-보존적 아미노산, 유전자 코드에 의해 코딩되지 않는 아미노산, 및 비천연 아미노산이 클로스트리디움 폴리펩티드 아미노산 잔기를 치환할 수 있다. 본 발명의 폴리펩티드는 또한 비-자연 발생 아미노산 잔기를 포함할 수 있다.
비-자연 발생 아미노산은 비제한적으로 트랜스-3-메틸프롤린, 2,4-메타노-프롤린, 시스-4-히드록시프롤린, 트랜스-4-히드록시-프롤린, N-메틸글리신, 알로트레오닌, 메틸-트레오닌, 히드록시-에틸시스테인, 히드록시에틸호모-시스테인, 니트로글루타민, 호모글루타민, 피페콜산, tert-류신, 노르발린, 2-아자페닐알라닌, 3-아자페닐-알라닌, 4-아자페닐-알라닌, 및 4-플루오로페닐알라닌을 포함한다. 비-자연 발생 아미노산 잔기를 단백질 내로 혼입하기 위한 여러 방법이 관련 기술분야에 공지되어 있다. 예를 들어, 화학적으로 아미노아실화된 억제인자 tRNA를 사용하여 넌센스 돌연변이가 억제되는 시험관내 시스템이 사용될 수 있다. 아미노산을 합성하고 tRNA를 아미노아실화시키는 방법이 관련 기술분야에 공지되어 있다. 넌센스 돌연변이를 함유하는 플라스미드의 전사 및 번역은 이. 콜라이 S30 추출물 및 상업적으로 입수가능한 효소 및 다른 시약을 포함하는 무세포 시스템에서 수행된다. 단백질은 크로마토그래피에 의해 정제된다. 예를 들어, 문헌 [Robertson et al., J. Am. Chem. Soc. 113:2722, 1991; Ellman et al., Methods Enzymol. 202:301, 1991; Chung et al., Science 259:806-9, 1993; and Chung et al., Proc. Natl. Acad. Sci. USA 90: 10145-9, 1993]을 참조한다. 제2 방법에서는, 돌연변이된 mRNA 및 화학적으로 아미노아실화된 억제인자 tRNA의 미세주사에 의해 크세노푸스 난모세포에서 번역이 수행된다 (문헌 [Turcatti et al., J. Biol. Chem. 271:19991-8, 1996]). 제3 방법에서는, 이. 콜라이 세포가 대체될 천연 아미노산 (예를 들어, 페닐알라닌)의 부재 하에 및 목적하는 비-자연 발생 아미노산(들) (예를 들어, 2-아자페닐알라닌, 3-아자페닐알라닌, 4-아자페닐알라닌 또는 4-플루오로페닐알라닌)의 존재 하에 배양된다. 비-자연 발생 아미노산이 그의 천연 대응물을 대신하여 폴리펩티드 내로 혼입된다. 문헌 [Koide et al., Biochem. 33:7470-6, 1994]을 참조한다. 자연 발생 아미노산 잔기가 시험관내 화학적 변형에 의해 비-자연 발생 종으로 전환될 수 있다. 화학적 변형을 부위-지정 돌연변이유발과 조합하여 치환 범위를 추가로 확장시킬 수 있다 (문헌 [Wynn and Richards, Protein Sci. 2:395-403, 1993]).
제한된 수의 비-보존적 아미노산, 유전자 코드에 의해 코딩되지 않는 아미노산, 비-자연 발생 아미노산, 및 비천연 아미노산이 본 발명의 폴리펩티드의 아미노산 잔기를 치환할 수 있다.
본 발명의 폴리펩티드 내의 필수 아미노산은 관련 기술분야에 공지된 절차, 예컨대 부위-지정 돌연변이유발 또는 알라닌 스캐닝 돌연변이유발에 따라 확인될 수 있다 (문헌 [Cunningham and Wells, Science 244: 1081-5, 1989]). 생물학적 상호작용의 부위는 또한, 추정 접촉 부위 아미노산의 돌연변이와 함께 핵 자기 공명, 결정학, 전자 회절 또는 광친화성 표지화와 같은 기술에 의해 결정된 바와 같은, 구조의 물리적 분석에 의해 결정될 수 있다. 예를 들어, 문헌 [de Vos et al., Science 255:306-12, 1992; Smith et al., J. Mol. Biol. 224:899-904, 1992; Wlodaver et al., FEBS Lett. 309:59-64, 1992]을 참조한다. 필수 아미노산의 정체는 또한 본 발명의 폴리펩티드의 관련 성분 (예를 들어, 전위 또는 프로테아제 성분)과의 상동성의 분석으로부터 추론될 수 있다.
다중 아미노산 치환은 공지된 돌연변이유발 및 스크리닝 방법, 예컨대 문헌 [Reidhaar-Olson and Sauer (Science 241 :53-7, 1988) or Bowie and Sauer (Proc. Natl. Acad. Sci. USA 86:2152-6, 1989)]에 개시된 것들을 사용하여 이루어지고 시험될 수 있다. 간략하게, 이들 저자는 폴리펩티드 내의 2개 이상의 위치를 동시에 무작위화하고, 기능적 폴리펩티드에 대해 선택한 후, 돌연변이유발된 폴리펩티드를 서열분석하여 각각의 위치에서 허용되는 치환의 스펙트럼을 결정하는 방법을 개시한다. 사용될 수 있는 다른 방법은 파지 디스플레이 (예를 들어, 문헌 [Lowman et al., Biochem. 30: 10832-7, 1991]; 란더(Ladner) 등, 미국 특허 번호 5,223,409; 휴스(Huse), WIPO 공개공보 WO 92/06204) 및 영역-지정 돌연변이유발 (문헌 [Derbyshire et al., Gene 46:145, 1986; Ner et al., DNA 7:127, 1988])을 포함한다.
하기 실시예는 본 발명을 예시한다.
실시예
2019-nCoV 감염에 대해 보호하기 위한 중화 항체 반응을 유도하기 위해, 2019-nCoV 스파이크 단백질 (S)을 코딩하는 핵산을 이. 콜라이, 효모 및 인간 세포를 비롯한 다양한 발현 시스템에서의 발현을 위해 변형시켰다.
이. 콜라이 시스템에서는 N 및 C 말단 결실된 아미노산 (5-10)을 클로닝하여 코로나바이러스의 천연 입체형태로 S 단백질을 발현 및 재폴딩시키는 한편, 다른 것 (효모 및 인간 세포)은 전체 단백질로서 발현 및 재폴딩시켰다. 코로나바이러스로부터의 S 단백질을 또한 E형 간염 (P239)의 바이러스 유사 입자 및 인간 유두종 바이러스 유사 입자 (18L1)와의 융합 단백질로서 조합하여 발현시켜 면역보호 반응의 효능 및 수명을 증가시켰다.
실시예 1: 이. 콜라이 기반 2019-nCoV 스파이크 단백질 발현
코로나바이러스 S 단백질의 핵산 서열 (Wuhan-Hu-1-CoV-S, 진뱅크: MN908947.3)을 코돈 최적화를 위해 진아트(Geneart)를 사용하여 이. 콜라이에서의 발현에 대해 최적화하였고, 이는 서열식별번호: 2의 핵산 서열을 설계하기 위한 SacI 및 NotI 단일 클로닝 부위를 함유하였다.
코돈 사용빈도를 에스케리키아 콜라이 유전자의 코돈 편향에 적합화시켰다. 또한, 가능한 경우에 매우 높은 (>80%) 또는 매우 낮은 (<30%) GC 함량의 영역을 피하였다. 발현에 부정적으로 영향을 미칠 수 있는 음성 시스-작용성 부위 (예컨대, 스플라이스 부위, TATA-박스 등)는 가능한 한 제거하였다. GC 함량을 조정하여 (평균 GC 함량 45%) mRNA 반감기를 연장시켰다. 코돈 사용빈도를 이. 콜라이의 편향에 적합화시켜 0.96의 CAI (코돈 적응 지수) 값을 생성하였다. 이. 콜라이에서 높고 안정한 발현 속도를 허용하는 최적화된 유전자가 설계되었다.
실시예 2: E형 간염 바이러스-유사 입자 내 2019-nCoV 스파이크 단백질
코로나바이러스 S 단백질의 핵산 서열을 이. 콜라이에서의 발현에 대해 최적화하고, 이를 사용하여 S 단백질을 포함하는 E형 간염 바이러스-유사 입자 (Wuhan-Hu-1-HEV-CoV-S)를 생성하였다.
유전자 합성물을 서열식별번호: 3의 핵산 서열을 설계하기 위한 SacI 및 NotI 단일 클로닝 부위와 함께 진아트에 의해 이. 콜라이에서의 발현에 대해 코돈 최적화하였다.
코돈 사용빈도를 에스케리키아 콜라이 유전자의 코돈 편향에 적합화시켰다. 또한, 가능한 경우에 매우 높은 (>80%) 또는 매우 낮은 (<30%) GC 함량의 영역을 피하였다. 발현에 부정적으로 영향을 미칠 수 있는 음성 시스-작용성 부위 (예컨대, 스플라이스 부위, TATA-박스 등)는 가능한 한 제거하였다. GC 함량 (46%)을 조정하여 mRNA 반감기를 연장시켰다. 코돈 사용빈도를 이. 콜라이의 편향에 적합화시켜 0.96의 CAI 값을 생성하였다. 이. 콜라이에서 높고 안정한 발현 속도를 허용하는 최적화된 유전자가 설계되었다.
실시예 3: 코마가타엘라 파스토리스 기반 2019-nCoV 스파이크 단백질 발현
코로나바이러스 S 단백질의 핵산 서열 (Wuhan-Hu-1 CoV-S)을 코돈 최적화를 위해 진아트를 사용하여 케이. 파스토리스에서의 발현에 대해 최적화하였고, 이는 서열식별번호: 4의 핵산 서열을 설계하기 위한 BstBI-NotI 단일 클로닝 부위를 함유하였다.
코돈 사용빈도를 케이. 파스토리스 유전자의 코돈 편향에 적합화시켰다. 또한, 가능한 경우에 매우 높은 (>80%) 또는 매우 낮은 (<30%) GC 함량의 영역을 피하였다. 발현에 부정적으로 영향을 미칠 수 있는 음성 시스-작용성 부위 (예컨대, 스플라이스 부위, TATA-박스 등)는 가능한 한 제거하였다. GC 함량 (48%)을 조정하여 mRNA 반감기를 연장시켰다. 코돈 사용빈도를 케이. 파스토리스의 편향에 적합화시켜 0.84의 CAI 값을 생성하였다. 케이. 파스토리스에서 높고 안정한 발현 속도를 허용하는 최적화된 유전자가 설계되었다.
실시예 4: 케이. 파스토리스에서의 2019-nCoV 스파이크 단백질을 포함하는 융합 단백질의 발현
HPV 18 L1과의 융합 단백질로서 코로나바이러스 S 단백질의 핵산 서열 (Wuhan-Hu-1-HPV18 L1-CoV-S)을 케이. 파스토리스에서의 발현에 대해 최적화하였다. BstBI 및 NotI는 서열식별번호: 5의 핵산 서열을 설계하기 위한 단일 클로닝 부위이다.
코돈 사용빈도를 케이. 파스토리스 유전자의 코돈 편향에 적합화시켰다. 또한, 가능한 경우에 매우 높은 (>80%) 또는 매우 낮은 (<30%) GC 함량의 영역을 피하였다. 발현에 부정적으로 영향을 미칠 수 있는 음성 시스-작용성 부위 (예컨대, 스플라이스 부위, TATA-박스 등)는 가능한 한 제거하였다. GC 함량 (48%)을 조정하여 mRNA 반감기를 연장시켰다. 코돈 사용빈도를 케이. 파스토리스의 편향에 적합화시켜 0.84의 CAI 값을 생성하였다. 케이. 파스토리스에서 높고 안정한 발현 속도를 허용하는 최적화된 유전자가 설계되었다.
실시예 5: 케이. 파스토리스에서의 2019-nCoV 스파이크 단백질을 포함하는 융합 단백질의 발현
HPV 16 L1과의 융합 단백질로서 코로나바이러스 S 단백질의 핵산 서열 (Wuhan-Hu-1-HPV16 L1-CoV-S)을 케이. 파스토리스에서의 발현에 대해 최적화하였다. BstBI 및 NotI는 서열식별번호: 6의 핵산 서열을 설계하기 위한 단일 클로닝 부위이다.
코돈 사용빈도를 케이. 파스토리스 유전자의 코돈 편향에 적합화시켰다. 또한, 가능한 경우에 매우 높은 (>80%) 또는 매우 낮은 (<30%) GC 함량의 영역을 피하였다. 발현에 부정적으로 영향을 미칠 수 있는 음성 시스-작용성 부위 (예컨대, 스플라이스 부위, TATA-박스 등)는 가능한 한 제거하였다. GC 함량 (48%)을 조정하여 mRNA 반감기를 연장시켰다. 코돈 사용빈도를 케이. 파스토리스의 편향에 적합화시켜 0.84의 CAI 값을 생성하였다. 피키아 파스토리스에서 높고 안정한 발현 속도를 허용하는 최적화된 유전자가 설계되었다.
실시예 6: 인간 293 F 세포에서의 2019-nCoV 스파이크 단백질의 발현
코로나바이러스 S 단백질 (293 F 세포의 외부 표면에 발현 및 결합된 Wuhan-Hu-1 CoV-S 표면 결합 단백질)의 핵산 서열을 코돈 최적화를 위해 진아트를 사용하여 인간 293 F 세포에서의 발현에 대해 최적화하였고, 이는 서열식별번호: 7의 핵산 서열을 설계하기 위한 NheI-NotI 단일 클로닝 부위를 함유하였다.
코돈 사용빈도를 호모 사피엔스 유전자의 코돈 편향에 적합화시켰다. 또한, 가능한 경우에 매우 높은 (>80%) 또는 매우 낮은 (<30%) GC 함량의 영역을 피하였다. 발현에 부정적으로 영향을 미칠 수 있는 음성 시스-작용성 부위 (예컨대, 스플라이스 부위, TATA-박스 등)는 가능한 한 제거하였다. GC 함량 (56%)을 조정하여 mRNA 반감기를 연장시켰다. 코돈 사용빈도를 호모 사피엔스의 편향에 적합화시켜 0.94의 CAI 값을 생성하였다. 인간 세포에서 높고 안정한 발현 속도를 허용하는 최적화된 유전자가 설계되었다.
실시예 7: 293 F 세포에서의 2019-nCoV 스파이크 단백질을 포함하는 융합 단백질의 발현
B형 간염 표면 항원과의 융합 단백질로서 코로나바이러스 S 단백질의 핵산 서열 (Wuhan-Hu-1-HBSAg-CoV-S)을 293 F 세포에서의 발현에 대해 최적화하였다. 서열은 서열식별번호: 8의 핵산 서열을 설계하기 위한 NheI-NotI 단일 클로닝 부위를 함유한다.
코돈 사용빈도를 호모 사피엔스 유전자의 코돈 편향에 적합화시켰다. 또한, 가능한 경우에 매우 높은 (>80%) 또는 매우 낮은 (<30%) GC 함량의 영역을 피하였다. 발현에 부정적으로 영향을 미칠 수 있는 음성 시스-작용성 부위 (예컨대, 스플라이스 부위, TATA-박스 등)는 가능한 한 제거하였다. GC 함량 (56%)을 조정하여 mRNA 반감기를 연장시켰다. 코돈 사용빈도를 호모 사피엔스의 편향에 적합화시켜 0.94의 CAI* (코돈 적응 지수) 값을 생성하였다. 인간 세포에서 높고 안정한 발현 속도를 허용하는 최적화된 유전자가 설계되었다.
실시예 8: 수산화알루미늄 및 인산알루미늄 겔을 사용한 2019-nCoV 스파이크 단백질의 아주반트화
실시예 1, 3 및 6의 2019-nCoV 스파이크 단백질 및 그의 융합 단백질을 아주반트화를 위해 0.5 mg의 수산화알루미늄 및 인산알루미늄 겔에 흡착시켰다.
실시예 9: 모노포스포릴 지질 및 수산화알루미늄을 사용한 2019-nCoV 스파이크 단백질의 아주반트화
실시예 1, 3 및 6의 2019-nCoV 스파이크 단백질 및 그의 융합 단백질을 아주반트화를 위해 모노포스포릴 지질 (MPL) 및 수산화알루미늄에서 혼합하였다.
실시예 10: MF59를 사용한 2019-nCoV 스파이크 단백질의 아주반트화
실시예 1, 3 및 6의 2019-nCoV 스파이크 단백질 및 그의 융합 단백질을 아주반트화를 위해 MF59 (5% 스쿠알렌)에서 혼합하였다.
실시예 11: 2019-nCoV 스파이크 단백질로 면역화된 마우스에서의 항체 반응의 생성
아주반트 없이 실시예 2, 4, 5 및 7의 2019-CoV 스파이크 단백질 및 그의 융합 단백질을 포함하는 제제 및 실시예 1, 3 및 6의 아주반트화된 제제의 면역원성을 BALB/c 마우스 (군 당 5마리의 마우스)에서 시험하였다. 제0일 및 제7일에 투여당 2 μg 항원으로 백신접종을 수행하였다. 제0일 및 제14일에 혈청 샘플을 간접 ELISA에 의해 혈청 음성 (제0일) 및 S 단백질에 대한 항체 반응 (제14일)에 대해 시험하였다. 제14일에 모든 제제는 높은 항체 역가를 유도하였지만, 아주반트화된 것은 최대 반응을 유도하였다 (도 2).
실시예 12: HEK 세포 (293F)에서의 HBSAg-(EAAAK)3-RBD 융합 단백질의 발현
서열식별번호: 28의 HBSAg-(EAAAK)3-RBD 융합 단백질을 서열식별번호: 27의 코돈-최적화된 핵산 서열을 사용하여 HEK 세포에서 발현시켰다. 간략하게, HBSAg-(EAAAK)3-RBD 유전자를 인간 세포 (293F) 발현에 대해 최적화하고, Nhe-NotI를 사용하여 pcDNA3.1(+) 내로 클로닝하고, 클론 선택 후 현탁 배양물 중 293F 세포 내로 형질감염시켰다. 분비된 HBSAg-(EAAAK)3-RBD 융합 단백질을 40시간 후에 수거하였다.
2019-nCoV 스파이크 단백질에 대한 폴리클로날 항체 (1:250) 및 HBSAg에 대한 마우스 모노클로날 항체 (1:1,000)를 사용한 웨스턴 블롯팅은 2개의 개별 배양물 - #2A 및 #2B에서 HEK 세포에 의한 융합 단백질의 강한 분비를 입증하였다 (도 3).
실시예 13: HEK 세포에서 HBSAg-(EAAAK)3-RBD 융합체로 면역화된 마우스에서의 항체 반응의 생성
실시예 12로부터의 HBSAg-(EAAAK)3-RBD (#2A)를 4000 rpm x 40분으로 회전하는 3K 아미콘 15 ml 원심분리 필터 장치를 통해 농축시켰다.
이어서, Balb/c 마우스를 (i) 50 μg/용량 (100 μl); 또는 (ii) 1:1 v/v 비의 수산화알루미늄 또는 아다박스™와 함께 50 μg/용량 (70 μl) (투여된 총 부피 = 140 μl)을 사용하여 면역화시켰다. 마우스를 제0일에 백신으로 프라이밍한 후, 제7일에 제1 부스팅, 제14일에 제2 부스팅 (분석을 위해 채혈) 및 제28일에 제3 부스팅하였다. 분석을 위한 최종 채혈을 제42일에 수행하였다. 실험군을 하기 표 1에 나타냈다.
표 1: HBSAg-(EAAAK)3-RBD로 면역화된 마우스에 대한 실험군
ELISA를 사용하여 제14일 및 제42일에 항체 역가를 평가하였다. 도 4에 도시된 바와 같이, HBSAg-(EAAAK)3-RBD의 VLP는 제14일 및 제42일에 유의한 IgG 역가를 달성할 수 있었고, 보다 높은 역가는 제42일에 관찰되었다. 아주반트 (수산화알루미늄 또는 아다박스™)와 함께 투여는 또한 도 4에 도시된 바와 같이 역가를 추가로 증가시켰다.
중화 검정은 또한 HBSAg-(EAAAK)3-RBD (단독으로 또는 수산화알루미늄 또는 아다박스™와 함께)의 VLP로 면역화된 마우스를 사용하여 수행하였다. 결과를 하기 표 2에 나타냈다. 평균 중화 역가는 1:1,200-1:2,700이었다. 달성된 최고 역가는 1:5,120이었고, 최저는 1:640이었다.
표 2: HBSAg-EAAAK3-RBD를 사용한 중화 검정의 결과
실시예 14: 이. 콜라이에서의 HEV-(GGGGS)3-RBD 융합체의 발현
서열식별번호: 31의 HEV-(GGGGS)3-RBD 융합 단백질을 이. 콜라이에서의 발현에 대해 코돈-최적화된 서열식별번호: 30의 핵산 서열을 사용하여 이. 콜라이에서 발현시켰다. 상기 핵산 서열을 SacI-NotI를 사용하여 pET26(+) 내로 클로닝하였다. 양성 클론을 선택하고 (#10), BL21에서 발현시켰다. 3종의 상이한 양성 콜로니 (#10A, #10B 및 #10C)를 단백질 발현에 대해 스크리닝하고, #10A, #10B 및 #10C 모두에 대해 IPTG 유도 (6시간)를 사용하여 HEV-RBD 발현을 평가하였다. HEV에 대한 항체를 사용하는 웨스턴 블롯팅을 이용하여 #10A, #10B 및 #10C 모두에서 융합 단백질 발현을 확인하였다 (도 5). 클론 #10B를 추가 조사를 위해 선택하고, 결합 완충제로서 pH 7.2의 50 mM 포스페이트 완충제를 사용하는 음이온 교환 크로마토그래피를 사용하여 정제하였다 (데이터는 제시되지 않음).
실시예 15: 이. 콜라이에서 생산된 HEV-(GGGGS)3-RBD 융합 단백질로 면역화된 마우스에서의 항체 반응의 생성
Balb/c 마우스를 실시예 14로부터의 HEV-(GGGGS)3-RBD (#10B)를 50 μg/용량으로 사용하여 1:1 v/v 비의 수산화알루미늄 또는 아다박스™ (투여된 총 부피= 100 μl)와 함께 면역화시켰다. 마우스를 제0일에 백신으로 프라이밍한 후, 제7일에 제1 부스팅, 제14일에 제2 부스팅 (분석을 위해 채혈) 및 제28일에 제3 부스팅하였다. 분석을 위한 최종 채혈을 제42일에 수행하였다. 실험군을 하기 표 3에 나타냈다.
표 3: HEV-(GGGGS)3-RBD로 면역화된 마우스에 대한 실험군
ELISA를 사용하여 제14일 및 제42일에 항체 역가를 평가하였다. HEV-(GGGGS)3-RBD의 VLP는 제14일 및 제42일에 유의한 중화 역가를 달성할 수 있었고, 보다 높은 역가는 제42일에 관찰되었다. 아주반트 (수산화알루미늄 또는 아다박스(™))와 함께 투여는 도 6에 도시된 바와 같이 역가를 추가로 증가시켰다.
실시예 16: HEK 293 세포에서 HBSAg-(EAAAK)3-전장 2019-nCoV 스파이크 단백질을 포함하는 융합 단백질의 발현
서열식별번호: 33의 HBSAg-(EAAAK)3-전장 2019-nCoV 스파이크 단백질 융합 단백질 (HBSAg-(EAAAK)3-CoV-s)을 서열식별번호: 32의 코돈-최적화된 핵산 서열을 사용하여 HEK 세포에서 발현시켰다. 간략하게, HBSAg-(EAAAK)3-CoV-s를 인간 세포 (293F) 발현에 대해 최적화하고, 클론 선택 후 현탁 배양물 중 293F 세포 내로 형질감염시켰다. 분비된 HBSAg-(EAAAK)3-CoV-s를 40시간 후에 수거하였다.
정제된 재조합 단백질 HBSAg-Co-V-s의 2종의 상이한 클론인 D8-SA01-01-01 (4x) 및 D8-SA01-02-01 (5x)을 1:250 희석으로 사용된 토끼 COVID-19 스파이크 단백질 폴리클로날 항체 (마이 바이오소스(My Biosource), MBS434243)를 사용하여 웨스턴 블롯에 의해 분석하였다. 도 7에 도시된 바와 같이, 두 클론은 모두 예상된 크기의 예리하고 고도로 발현된 밴드를 생성하였고, 이는 융합 단백질의 강한 발현을 나타낸다.
서열 정보
서열식별번호: 1 - 2019-nCoV 스파이크 단백질 아미노산 서열
스파이크 단백질의 RDB 도메인 (잔기 319 내지 529)은 밑줄표시됨.
서열식별번호: 2 - 2019-nCoV 스파이크 단백질 핵산 서열 - 이. 콜라이에서의 발현에 대해 최적화되고, SacI 및 NotI 단일 클로닝 부위를 함유함. 실시예 1에 기재됨
5' SacI 단일 클로닝 부위는 단일-밑줄표시됨
3' NotI 단일 클로닝 부위는 파선-밑줄표시됨
ATG 개시 코돈은 볼드체 및 이탤릭체임
서열식별번호: 2의 핵산 서열을 번역하여 서열식별번호: 1의 천연 2019-nCoV 스파이크 단백질을 제공함
서열식별번호: 3 - 융합 단백질 HEV-2019-nCoV 스파이크 단백질을 코딩하는 핵산 - 이. 콜라이에서의 발현에 대해 최적화되고, SacI 및 NotI 단일 클로닝 부위를 함유함. 실시예 2에 기재됨
5' SacI 단일 클로닝 부위는 단일-밑줄표시됨
HEV (p239 단편) 서열은 대문자로 나타냄
2019-nCoV 스파이크 단백질 코딩 서열은 소문자로 나타냄
3' NotI 단일 클로닝 부위는 파선-밑줄표시됨
서열식별번호: 4 - 2019-nCoV 스파이크 단백질 핵산 서열 - 코마가타엘라 파스토리스에서의 발현에 대해 최적화되고, BstB1 및 NotI 단일 클로닝 부위를 함유함. 실시예 3에 기재됨
5' BstBI 단일 클로닝 부위는 단일-밑줄표시됨
3' NotI 단일 클로닝 부위는 파선-밑줄표시됨
5' BstBI 바로 다음은 ACG 코돈임 (코딩 서열이 ACG 바로 다음인 ATG 개시 코돈과 인-프레임일 필요가 있음). 이들 2개의 코돈은 볼드체로 이탤릭체로 나타냄.
서열식별번호: 4의 핵산 서열을 번역하여 서열식별번호: 1의 천연 2019-nCoV 스파이크 단백질을 제공함
서열식별번호: 5 - 융합 단백질 HPV18L1/2019-nCoV 스파이크 단백질을 코딩하는 핵산 - 케이. 파스토리스에서의 발현에 대해 최적화되고, BstB1 및 NotI 단일 클로닝 부위를 함유함. 실시예 4에 기재됨
5' BstBI 단일 클로닝 부위는 단일-밑줄표시됨
HPV18L1 서열은 소문자로 나타냄
2019-nCoV 스파이크 단백질 코딩 서열은 대문자로 나타냄
3' NotI 단일 클로닝 부위는 파선-밑줄표시됨
5' BstBI 바로 다음은 ACG 코돈임 (코딩 서열이 ACG 바로 다음인 ATG 개시 코돈과 인-프레임일 필요가 있음). 이들 2개의 코돈은 볼드체로 이탤릭체로 나타냄.
서열식별번호: 6 - 융합 단백질 HPV16L1/2019-nCoV 스파이크 단백질을 코딩하는 핵산 - 케이. 파스토리스에서의 발현에 최적화되고, BstB1 및 NotI 단일 클로닝 부위를 함유함. 실시예 5에 기재됨
5' BstBI 단일 클로닝 부위는 단일-밑줄표시됨
HPV16L1 서열은 소문자로 나타냄
2019-nCoV 스파이크 단백질 코딩 서열은 대문자로 나타냄
3' NotI 단일 클로닝 부위는 파선-밑줄표시됨
5' BstBI 바로 다음은 ACG 코돈임 (코딩 서열이 ACG 바로 다음인 ATG 개시 코돈과 인-프레임일 필요가 있음). 이들 2개의 코돈은 볼드체로 이탤릭체로 나타냄.
서열식별번호: 7 - 2019-nCoV 스파이크 단백질 핵산 서열 - 인간 (293F)에서의 발현에 대해 최적화되고, NheI 및 NotI 단일 클로닝 부위를 함유함. 실시예 6에 기재됨
5' NheI 단일 클로닝 부위는 단일-밑줄표시됨
3' NotI 단일 클로닝 부위는 파선-밑줄표시됨
5' NheI 바로 다음은 GAC 코돈임 (코딩 서열이 GAC 바로 다음인 ATG 개시 코돈과 인-프레임일 필요가 있음). 이들 2개의 코돈은 볼드체로 이탤릭체로 나타냄.
서열식별번호: 7의 핵산 서열을 번역하여 서열식별번호: 1의 천연 2019-nCoV 스파이크 단백질을 제공함
서열식별번호: 8- 융합 단백질 HBSAg/2019-nCoV 스파이크 단백질을 코딩하는 핵산 - 인간 (293F)에서의 발현에 대해 최적화되고, NheI 및 NotI 단일 클로닝 부위를 함유함. 실시예 7에 기재됨
5' NheI 단일 클로닝 부위는 단일-밑줄표시됨
HSBAg 서열은 소문자로 나타냄
2019-nCoV 스파이크 단백질 코딩 서열은 대문자로 나타냄
3' NotI 단일 클로닝 부위는 파선-밑줄표시됨
5' NheI 바로 다음은 GAC 코돈임 (코딩 서열이 GAC 바로 다음인 ATG 개시 코돈과 인-프레임일 필요가 있음). 이들 2개의 코돈은 볼드체로 이탤릭체로 나타냄.
서열식별번호: 9 - 서열식별번호: 3에 상응하는 아미노산 서열
(융합 단백질 HEV-2019-nCoV 스파이크 단백질 - 이. 콜라이에서의 발현에 대해 최적화되고, SacI 및 NotI 단일 클로닝 부위를 함유함. 실시예 2에 기재됨)
서열식별번호: 10 - 서열식별번호: 5에 상응하는 아미노산 서열
(융합 단백질 HPV18L1/2019-nCoV 스파이크 단백질 - 케이. 파스토리스에서의 발현에 대해 최적화되고, BstB1 및 NotI 단일 클로닝 부위를 함유함. 실시예 4에 기재됨)
서열식별번호: 11 - 서열식별번호: 6에 상응하는 아미노산 서열
(융합 단백질 HPV16L1/2019-nCoV 스파이크 단백질 - 케이. 파스토리스에서의 발현에 대해 최적화되고, BstB1 및 NotI 단일 클로닝 부위를 함유함. 실시예 5에 기재됨)
서열식별번호: 12 - 서열식별번호: 8에 상응하는 아미노산 서열
(융합 단백질 HBSAg/2019-nCoV 스파이크 단백질 - 인간 (293F)에서의 발현에 대해 최적화되고, NheI 및 NotI 단일 클로닝 부위를 함유함. 실시예 7에 기재됨)
서열식별번호: 13 - RBD 2019-nCoV 스파이크 단백질 핵산 서열
개시 ATG (볼드체) 앞에 부가된 KOZAC 서열 (gcc acc, 밑줄표시됨).
NotI 앞에 부가된 분비형 tga taa (이중 밑줄표시됨) - 상기 tga taa 서열은 단백질 합성을 방해하여 세포외 배지로의 분비를 용이하게 하는 "2개의 정지 코돈" 모티프임 (또한 하기 기재된 바와 같은 다른 서열에 포함됨).
고유한 제한 부위는 각각 5' 말단에 NheI 및 3' 말단에 NotI가 부가됨 (파선 밑줄표시됨)
서열식별번호: 14 - RBD 2019-nCoV 스파이크 단백질 핵산 서열 - 293F (HEK) 세포 발현에 대해 인간 코돈 최적화됨.
개시 ATG (볼드체) 앞에 부가된 KOZAC 서열 (gcc acc, 밑줄표시됨).
NotI 앞에 부가된 분비형 tga taa (이중 밑줄표시됨)
고유한 제한 부위는 각각 5' 말단에 NheI 및 3' 말단에 NotI가 부가됨 (파선 밑줄표시됨)
서열식별번호: 15 - 서열식별번호: 13 및 14에 상응하는 RBD 2019-nCoV 스파이크 단백질 아미노산 서열
서열식별번호: 16 - 강성 EAAAK 링커 컨센서스 아미노산 서열
A(EAAAK)nA (n = 2-5)
서열식별번호: 17 - 강성 (EAAAK)3 링커 핵산 서열
GAA GCC GCC GCT AAA GAG GCC GCT GCC AAA GAA GCT GCT GCT AAG
서열식별번호: 18 - 강성 (EAAAK)3 링커 아미노산 서열
EAAAKEAAAKEAAAK
서열식별번호: 19 - 가요성 GSn 링커 컨센서스 아미노산 서열
(Gly-Gly-Gly-Gly-Ser)n (n=1-6)
서열식별번호: 20 - 가요성 GS5 ((GGGGS)1) 링커 아미노산 서열
GGGGS
서열식별번호: 21 - 가요성 GS10 ((GGGGS)2) 링커 아미노산 서열
GGGGSGGGGS
서열식별번호: 22 - 가요성 GS15 링커 핵산 서열
GGT GGT GGT GGT AGC GGT GGT GGC GGT TCA GGT GGC GGT GGT TCA
서열식별번호: 23 - 가요성 GS15 ((GGGGS)3) 링커 아미노산 서열
GGGGSGGGGSGGGGS
서열식별번호: 24 - 가요성 GS20 ((GGGGS)4) 링커 아미노산 서열
GGGGSGGGGSGGGGSGGGGS
서열식별번호: 25 - 가요성 GS25 ((GGGGS)5) 링커 아미노산 서열
GGGGSGGGGSGGGGSGGGGSGGGGS
서열식별번호: 26 - HBSAg-(EAAAK)3-RBD 핵산 서열
개시 ATG (볼드체) 앞에 부가된 KOZAC 서열 (gcc acc, 밑줄표시됨).
NotI 앞에 부가된 분비형 tga taa (이중 밑줄표시됨)
고유한 제한 부위는 각각 5' 말단에 NheI 및 3' 말단에 NotI가 부가됨 (파선 밑줄표시됨)
볼드체 및 점선 밑줄표시된 서열은 (EAAAK)3 링커에 상응함.
서열식별번호: 27 - 293f (HEK) 세포 발현에 대해 인간 코돈 최적화된 HBSAg-(EAAAK)3-RBD 핵산 서열
개시 ATG (볼드체) 앞에 부가된 KOZAC 서열 (gcc acc, 밑줄표시됨).
NotI 앞에 부가된 분비형 tga taa (이중 밑줄표시됨)
고유한 제한 부위는 각각 5' 말단에 NheI 및 3' 말단에 NotI가 부가됨 (파선 밑줄표시됨)
볼드체 및 점선 밑줄표시된 서열은 (EAAAK)3 링커에 상응함.
서열식별번호: 28 - 서열식별번호: 26 및 27에 상응하는 HBSAg-(EAAAK)3-RBD 아미노산 서열
(EAAAK)3 링커는 밑줄표시됨.
서열식별번호: 29 - HEV-GS15-RBD 핵산 서열
개시 ATG (볼드체)
고유한 제한 부위는 각각 5' 말단에 SacI 및 3' 말단에 NotI가 부가됨 (파선 밑줄표시됨)
NotI 앞에 부가된 분비형 tga taa (이중 밑줄표시됨)
볼드체 및 점선 밑줄표시된 서열은 GS15 링커에 상응함.
서열식별번호: 30 - 이. 콜라이 발현에 대해 최적화된 HEV-GS15-RBD 핵산 서열
개시 ATG (볼드체)
NotI 앞에 부가된 분비형 tga taa (이중 밑줄표시됨)
고유한 제한 부위는 각각 5' 말단에 SacI 및 3' 말단에 NotI가 부가됨 (파선 밑줄표시됨)
볼드체 및 점선 밑줄표시된 서열은 GS15 링커에 상응함.
서열식별번호: 31 - 서열식별번호: 29 및 30에 상응하는 HEV-GS15-RBD 아미노산 서열
GS15 링커는 밑줄표시됨
서열식별번호: 32 - 293f (HEK) 세포 발현에 대해 인간 코돈 최적화된 HBSAg-(EAAAK)3-전장 2019-nCoV 스파이크 단백질 핵산 서열
개시 ATG (볼드체) 앞에 부가된 KOZAC 서열 (gcc acc, 밑줄표시됨).
볼드체 및 점선 밑줄표시된 서열은 (EAAAK)3 링커에 상응함.
서열식별번호: 33 - 서열식별번호: 32에 상응하는 HBSAg-(EAAAK)3-전장 2019-nCoV 스파이크 단백질 아미노산 서열
(EAAAK)3 링커는 밑줄표시됨
SEQUENCE LISTING
<110> Vaxbio Ltd.
<120> VACCINE
<130> P66542WO
<150> GB 2002166.3
<151> 2020-02-17
<160> 33
<170> PatentIn version 3.5
<210> 1
<211> 1273
<212> PRT
<213> SARS-CoV-2
<400> 1
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
1010 1015 1020
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
1025 1030 1035
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1040 1045 1050
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
1055 1060 1065
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His
1070 1075 1080
Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn
1085 1090 1095
Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln
1100 1105 1110
Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val
1115 1120 1125
Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1130 1135 1140
Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn
1145 1150 1155
His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn
1160 1165 1170
Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu
1175 1180 1185
Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu
1190 1195 1200
Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu
1205 1210 1215
Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met
1220 1225 1230
Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro
1250 1255 1260
Val Leu Lys Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 2
<211> 3839
<212> DNA
<213> Artificial Sequence
<220>
<223> SARS-CoV2 spike protein nucleic acid - optimised for E. coli
expression
<400> 2
gagctcatgt ttgtttttct ggttctgctg ccgctggtta gcagccagtg tgttaatctg 60
accacacgta cccagctgcc tccggcatat accaatagct ttacccgtgg tgtttattat 120
ccggacaaag tttttcgtag cagcgttctg catagcaccc aggacctgtt tctgccgttt 180
tttagcaatg ttacctggtt tcatgccatt catgttagcg gcaccaatgg caccaaacgt 240
tttgataatc cggtgctgcc gtttaatgat ggtgtgtatt ttgcaagcac cgaaaaaagc 300
aacattattc gcggttggat ttttggtaca accctggata gcaaaaccca gagcctgctg 360
attgttaata atgccaccaa tgtggtgatc aaagtgtgcg aatttcagtt ttgcaatgat 420
ccgtttctgg gcgtgtatta ccacaaaaat aacaagagct ggatggaaag cgaatttcgt 480
gtttatagca gcgccaataa ttgcaccttt gaatatgtta gccagccgtt tctgatggat 540
ctggaaggta aacagggtaa ctttaaaaac ctgcgcgagt tcgtgttcaa aaacatcgat 600
ggttacttca aaatctatag caaacacacc ccgattaatc tggttcgtga tctgccgcag 660
ggttttagcg cactggaacc gctggttgat ctgccaattg gtattaacat tacccgtttt 720
cagaccctgc tggcactgca tcgtagctat ctgacaccgg gtgatagcag cagcggttgg 780
accgcaggcg cagcagcata ttatgttggt tatctgcagc ctcgtacctt tctgctgaaa 840
tataacgaaa atggcacaat taccgatgcc gttgattgtg ccctggatcc gctgagcgaa 900
accaaatgta ccctgaaaag ctttaccgtt gagaaaggta tttatcagac cagcaatttt 960
cgtgtgcagc cgaccgaaag cattgttcgt tttccgaata tcaccaatct gtgtccgttt 1020
ggcgaagttt ttaatgcaac ccgttttgcc agcgtttatg catggaatcg taaacgtatt 1080
agcaattgcg ttgccgatta tagcgttctg tataatagcg caagcttcag cacctttaaa 1140
tgctatggtg ttagcccgac caaactgaat gatctgtgtt ttaccaatgt gtatgccgat 1200
agctttgtga ttcgtggtga tgaagttcgt cagattgcac cgggtcagac cggtaaaatt 1260
gcagattata actataaact gccggatgat tttacgggtt gtgttattgc ctggaatagc 1320
aataatctgg acagcaaagt tggtggcaac tataactatc tgtatcgcct gtttcgtaag 1380
agcaatctga aaccgtttga acgtgatatt agcaccgaga tttatcaggc aggtagcacc 1440
ccgtgtaatg gtgttgaagg ttttaattgc tattttccgc tgcagagcta tggttttcag 1500
ccgacaaatg gtgtgggtta tcagccgtat cgtgttgttg ttctgtcatt tgaactgctg 1560
catgcaccgg caaccgtttg tggtccgaaa aaaagtacca atctggtgaa aaataagtgc 1620
gtgaacttta actttaatgg tctgaccggc accggtgttc tgaccgaaag taacaaaaaa 1680
ttcctgccgt ttcagcagtt tggccgtgat attgcagata ccaccgatgc agttcgcgat 1740
ccgcagacac tggaaattct ggatattacc ccgtgcagct ttggtggtgt ttcagttatt 1800
acaccgggta caaataccag caatcaggtt gcagttctgt atcaggatgt taattgtacc 1860
gaagttccgg ttgcaattca tgcagatcag ctgaccccga cctggcgtgt gtatagcacc 1920
ggtagcaatg tgtttcagac acgtgcaggt tgtctgattg gtgcagaaca tgtgaataat 1980
agctatgaat gcgatattcc gattggtgcg ggtatttgtg ccagctatca gacccagacc 2040
aatagtccgc gtcgtgcacg tagcgttgca agccagagca ttattgccta taccatgagc 2100
ctgggtgcag aaaatagcgt tgcctatagt aataacagca ttgccattcc gaccaacttt 2160
accattagcg ttaccaccga aattctgccg gttagcatga ccaaaaccag cgttgattgc 2220
accatgtata tttgtggtga tagtaccgaa tgtagcaatc tgctgctgca gtatggtagc 2280
ttttgcaccc agctgaatcg tgcactgacc ggtattgcag ttgaacagga taaaaacacg 2340
caagaagttt ttgcacaggt caagcagatc tataaaaccc ctccgattaa agattttggc 2400
ggtttcaatt ttagccagat cctgccggat ccgagcaaac cgagtaaacg tagctttatt 2460
gaagatctgc tgttcaacaa agtgaccctg gcagatgcag gttttatcaa acagtatggt 2520
gattgcctgg gcgatattgc cgcacgtgat ctgatttgtg cacagaaatt taacggcctg 2580
accgttctgc ctccgctgct gaccgatgaa atgattgcac agtataccag cgcactgctg 2640
gcaggcacca ttaccagtgg ttggaccttt ggtgccggtg ccgcactgca gattccgttt 2700
gcaatgcaga tggcatatcg ttttaatggt attggtgtta cccagaacgt gctgtatgaa 2760
aaccagaaac tgattgccaa ccagtttaat agcgccattg gcaaaattca ggatagcctg 2820
agcagcaccg caagtgcact gggtaaactg caggacgttg ttaatcagaa tgcacaggca 2880
ctgaataccc tggttaaaca gctgagcagt aattttggtg caatttcaag cgtgctgaac 2940
gatattctga gccgtctgga taaagttgaa gcagaagttc agattgatcg tctgattacc 3000
ggtcgtctgc aaagcctgca gacctatgtg acccagcagc tgattcgcgc agcagaaatt 3060
cgtgcaagcg caaatctggc agccaccaaa atgagcgaat gtgttctggg tcagagcaaa 3120
cgtgttgatt tttgcggcaa aggttatcac ctgatgagct ttccgcagag cgcaccgcat 3180
ggtgttgtgt ttctgcatgt tacctatgtt ccggcacaag aaaaaaactt tacaaccgct 3240
ccggcaattt gccatgatgg taaagcacat tttccgcgtg aaggtgtttt tgttagtaat 3300
ggcacccatt ggtttgttac acagcgcaac ttttatgaac cgcagattat tacaaccgac 3360
aacacctttg ttagcggtaa ctgtgatgtt gtgattggca ttgtgaataa caccgtttat 3420
gatccactgc agccggaact ggatagcttt aaagaagaac tggacaaata tttcaaaaac 3480
cacaccagtc cggatgttga tctgggtgat atttcaggta ttaatgccag cgtggtgaac 3540
atccagaaag aaattgatcg cctgaatgaa gtggccaaaa atctgaatga aagcctgatt 3600
gatctgcaag aactggggaa atatgagcag tatatcaaat ggccgtggta tatttggctg 3660
ggttttattg caggcctgat tgcaattgtt atggtgacca ttatgctgtg ttgtatgacc 3720
agctgttgta gctgtctgaa aggttgttgc agctgcggta gctgttgcaa atttgatgaa 3780
gatgatagcg aaccggtgct gaaaggtgtt aaactgcatt atacctaatg agcggccgc 3839
<210> 3
<211> 4556
<212> DNA
<213> Artificial Sequence
<220>
<223> nucleic acid encoding for fusion protein HEV-SARS-CoV-2 spike
protein- optimised for expression in E. coli
<400> 3
gagctcatga ttgcactgac cctgtttaat ctggcagata ccctgttagg tggtctgccg 60
accgaactga ttagcagtgc cggtggtcag ctgttttata gccgtccggt tgttagcgca 120
aatggtgaac cgaccgttaa actgtatacc agcgttgaaa atgcacagca ggataaaggt 180
attgcaattc cgcatgatat tgatctgggt gaaagccgtg ttgtgattca ggattatgat 240
aatcagcatg aacaggatcg tccgacaccg agtccggcac cgagccgtcc gtttagcgtt 300
ctgcgtgcaa atgatgttct gtggctgagc ctgaccgcag cagaatatga tcagagcacc 360
tatggtagca gcaccggtcc ggtttatgtt agcgatagcg ttaccctggt taatgttgca 420
accggtgcac aggcagttgc acgtagcctg gattggacca aagtgaccct ggatggtcgt 480
ccgctgagca ccattcagca gtatagcaaa accttttttg ttctgccgct gcgtggtaaa 540
ctgagctttt gggaagcagg caccaccaaa gcaggttatc cgtataacta taataccacc 600
gcaagcgatc agctgctggt tgaaaacgca gcaggtcatc gtgttgcaat tagcacctat 660
accaccagtt taggtgcagg tccggttagc attagcgcag ttgcagttct ggcaccgcat 720
agcgcatttg tttttctggt tctgctgccg ctggttagca gccagtgtgt taatctgacc 780
acacgtaccc agctgcctcc ggcatatacc aatagcttta cccgtggtgt ttattatccg 840
gacaaagttt ttcgtagcag cgttctgcat agcacccagg acctgtttct gccgtttttt 900
agcaatgtta cctggtttca tgccattcat gttagcggca ccaatggcac caaacgtttt 960
gataatccgg tgctgccgtt taatgatggt gtgtattttg caagcaccga aaaaagcaac 1020
attattcgcg gttggatttt tggtacaacc ctggatagca aaacccagag cctgctgatt 1080
gttaataatg ccaccaatgt ggtgatcaaa gtgtgcgaat ttcagttttg caatgatccg 1140
tttctgggcg tgtattacca caaaaataac aagagctgga tggaaagcga atttcgtgtt 1200
tatagcagcg ccaataattg cacctttgaa tatgttagcc agccgtttct gatggatctg 1260
gaaggtaaac agggtaactt taaaaacctg cgcgagttcg tgttcaaaaa catcgatggt 1320
tacttcaaaa tctatagcaa acacaccccg attaatctgg ttcgtgatct gccgcagggt 1380
tttagcgcac tggaaccgct ggttgatctg ccaattggta ttaacattac ccgttttcag 1440
accctgctgg cactgcatcg tagctatctg acaccgggtg atagcagcag cggttggacc 1500
gcaggcgcag cagcatatta tgttggttat ctgcagcctc gtacctttct gctgaaatat 1560
aacgaaaatg gcacaattac cgatgccgtt gattgtgccc tggatccgct gagcgaaacc 1620
aaatgtaccc tgaaaagctt taccgttgag aaaggtattt atcagaccag caattttcgt 1680
gtgcagccga ccgaaagcat tgttcgtttt ccgaatatca ccaatctgtg tccgtttggc 1740
gaagttttta atgcaacccg ttttgccagc gtttatgcat ggaatcgtaa acgtattagc 1800
aattgcgttg ccgattatag cgttctgtat aatagcgcaa gcttcagcac ctttaaatgc 1860
tatggtgtta gcccgaccaa actgaatgat ctgtgtttta ccaatgtgta tgccgatagc 1920
tttgtgattc gtggtgatga agttcgtcag attgcaccgg gtcagaccgg taaaattgca 1980
gattataact ataaactgcc ggatgatttt acgggttgtg ttattgcctg gaatagcaat 2040
aatctggaca gcaaagttgg tggcaactat aactatctgt atcgcctgtt tcgtaagagc 2100
aatctgaaac cgtttgaacg tgatattagc accgagattt atcaggcagg tagcaccccg 2160
tgtaatggtg ttgaaggttt taattgctat tttccgctgc agagctatgg ttttcagccg 2220
acaaatggtg tgggttatca gccgtatcgt gttgttgttc tgtcatttga actgctgcat 2280
gcaccggcaa ccgtttgtgg tccgaaaaaa agtaccaatc tggtgaaaaa taagtgcgtg 2340
aactttaact ttaatggtct gaccggcacc ggtgttctga ccgaaagtaa caaaaaattc 2400
ctgccgtttc agcagtttgg ccgtgatatt gcagatacca ccgatgcagt tcgcgatccg 2460
cagacactgg aaattctgga tattaccccg tgcagctttg gtggtgtttc agttattaca 2520
ccgggtacaa ataccagcaa tcaggttgca gttctgtatc aggatgttaa ttgtaccgaa 2580
gttccggttg caattcatgc agatcagctg accccgacct ggcgtgtgta tagcaccggt 2640
agcaatgtgt ttcagacacg tgcaggttgt ctgattggtg cagaacatgt gaataatagc 2700
tatgaatgcg atattccgat tggtgcgggt atttgtgcca gctatcagac ccagaccaat 2760
agtccgcgtc gtgcacgtag cgttgcaagc cagagcatta ttgcctatac catgagcctg 2820
ggtgcagaaa atagcgttgc ctatagtaat aacagcattg ccattccgac caactttacc 2880
attagcgtta ccaccgaaat tctgccggtt agcatgacca aaaccagcgt tgattgcacc 2940
atgtatattt gtggtgatag taccgaatgt agcaatctgc tgctgcagta tggtagcttt 3000
tgcacccagc tgaatcgtgc actgaccggt attgcagttg aacaggataa aaacacgcaa 3060
gaagtttttg cacaggtcaa gcagatctat aaaacccctc cgattaaaga ttttggcggt 3120
ttcaatttta gccagatcct gccggatccg agcaaaccga gtaaacgtag ctttattgaa 3180
gatctgctgt tcaacaaagt gaccctggca gatgcaggtt ttatcaaaca gtatggtgat 3240
tgcctgggcg atattgccgc acgtgatctg atttgtgcac agaaatttaa cggcctgacc 3300
gttctgcctc cgctgctgac cgatgaaatg attgcacagt ataccagcgc actgctggca 3360
ggcaccatta ccagtggttg gacctttggt gccggtgccg cactgcagat tccgtttgca 3420
atgcagatgg catatcgttt taatggtatt ggtgttaccc agaacgtgct gtatgaaaac 3480
cagaaactga ttgccaacca gtttaatagc gccattggca aaattcagga tagcctgagc 3540
agcaccgcaa gtgcactggg taaactgcag gacgttgtta atcagaatgc acaggcactg 3600
aataccctgg ttaaacagct gagcagtaat tttggtgcaa tttcaagcgt gctgaacgat 3660
attctgagcc gtctggataa agttgaagca gaagttcaga ttgatcgtct gattaccggt 3720
cgtctgcaaa gcctgcagac ctatgtgacc cagcagctga ttcgcgcagc agaaattcgt 3780
gcaagcgcaa atctggcagc caccaaaatg agcgaatgtg ttctgggtca gagcaaacgt 3840
gttgattttt gcggcaaagg ttatcacctg atgagctttc cgcagagcgc accgcatggt 3900
gttgtgtttc tgcatgttac ctatgttccg gcacaagaaa aaaactttac aaccgctccg 3960
gcaatttgcc atgatggtaa agcacatttt ccgcgtgaag gtgtttttgt tagtaatggc 4020
acccattggt ttgttacaca gcgcaacttt tatgaaccgc agattattac aaccgacaac 4080
acctttgtta gcggtaactg tgatgttgtg attggcattg tgaataacac cgtttatgat 4140
ccactgcagc cggaactgga tagctttaaa gaagaactgg acaaatattt caaaaaccac 4200
accagtccgg atgttgatct gggtgatatt tcaggtatta atgccagcgt ggtgaacatc 4260
cagaaagaaa ttgatcgcct gaatgaagtg gccaaaaatc tgaatgaaag cctgattgat 4320
ctgcaagaac tggggaaata tgagcagtat atcaaatggc cgtggtatat ttggctgggt 4380
tttattgcag gcctgattgc aattgttatg gtgaccatta tgctgtgttg tatgaccagc 4440
tgttgtagct gtctgaaagg ttgttgcagc tgcggtagct gttgcaaatt tgatgaagat 4500
gatagcgaac cggtgctgaa aggtgttaaa ctgcattata cctaatgagc ggccgc 4556
<210> 4
<211> 3839
<212> DNA
<213> Artificial Sequence
<220>
<223> SARS-CoV-2 spike protein nucleic acid sequence - optimised for
expression in Komagataella pastoris
<400> 4
ttcgaaacga tgttcgtgtt cttggtcctg ttgccattgg tttcttccca gtgtgttaac 60
ctgaccacta gaactcaatt gcctccagcc tacaccaatt ccttcaccag aggtgtttac 120
tacccagaca aggtgttcag atcttccgtc ttgcactcca ctcaggactt gttcttgcca 180
ttcttctcca acgttacctg gttccacgct attcacgttt ccggaactaa cggtactaag 240
agattcgaca acccagtcct gccattcaac gatggtgtct acttcgcttc taccgagaag 300
tccaacatca tcagaggttg gatcttcggt actaccctgg actctaagac tcagtccttg 360
ctgatcgtta acaacgccac caacgttgtc atcaaggttt gcgagttcca gttctgcaac 420
gacccattct tgggtgtgta ctaccacaag aacaacaagt cttggatgga atccgagttc 480
agagtttact cctccgccaa caactgtacc ttcgagtacg tttcccagcc attcttgatg 540
gacttggagg gtaagcaggg taacttcaag aacctgagag agttcgtttt caagaacatc 600
gacggttact tcaagatcta ctccaagcac accccaatca acctggttag agatttgcca 660
caaggtttct ccgctttgga gcctttggtt gacttgccaa tcggtatcaa catcaccaga 720
ttccagacct tgttggcctt gcacagatcc tacttgactc caggtgattc ttcttccggt 780
tggactgctg gtgctgctgc ttactatgtt ggttacttgc agccaagaac cttcctgctg 840
aagtacaacg agaacggaac tatcactgac gctgttgact gtgctttgga cccattgtct 900
gagactaagt gcaccttgaa gtccttcacc gttgagaagg gtatctacca gacctccaac 960
ttcagagttc agccaactga gtccatcgtc agattcccaa acatcactaa cttgtgccca 1020
ttcggtgagg tgttcaacgc tactagattc gcttctgttt acgcctggaa cagaaagaga 1080
atctccaact gcgttgctga ctactccgtc ttgtacaact ctgcttcatt ctccaccttc 1140
aagtgctacg gtgtttcccc aactaagttg aacgacctgt gtttcactaa cgtctacgcc 1200
gactccttcg ttattagagg tgacgaggtt agacagatcg ctccaggtca aactggtaag 1260
atcgctgact acaactacaa gctgccagac gacttcaccg gttgtgttat tgcttggaac 1320
tccaacaacc tggactccaa ggttggtggt aactacaatt acctgtaccg tctgttcaga 1380
aagtccaact tgaagccatt cgagagagac atctccaccg agatctacca agctggttct 1440
actccatgta acggtgtcga gggtttcaac tgctacttcc cattgcaatc ctacggtttc 1500
caacctacca acggtgttgg ataccagcca tacagagttg tcgttttgtc cttcgagttg 1560
ttgcacgctc cagctactgt ttgtggtcca aagaagtcca ccaacttggt caagaacaaa 1620
tgcgtcaact ttaacttcaa cggcctgacc ggtactggtg ttttgactga atccaacaag 1680
aagttcctgc ctttccagca gttcggtaga gacattgctg acactactga cgccgttaga 1740
gatccacaga ctttggagat cttggacatc accccatgtt ccttcggtgg tgtttccgtt 1800
attacccctg gaactaacac ctccaatcag gtcgctgtct tgtaccagga cgttaactgt 1860
actgaggttc cagttgctat ccacgctgac caattgactc caacttggag agtctactcc 1920
accggttcca acgttttcca aactagagcc ggttgtttga tcggtgctga acacgtcaac 1980
aactcctacg agtgtgacat tccaattggt gctggtatct gtgcctccta ccaaactcaa 2040
actaactccc caagaagggc tagatccgtt gcttcccaat ccattatcgc ttacaccatg 2100
tctttgggtg ccgagaactc tgttgcctac tctaacaact ctatcgctat ccctaccaac 2160
ttcaccatct ccgttaccac tgagatcttg ccagtctcca tgaccaagac ttccgttgac 2220
tgtaccatgt acatctgtgg tgactccact gagtgttcca acttgttgct gcaatacggt 2280
tccttctgca cccagttgaa cagagctttg actggtattg ctgtcgagca agacaagaac 2340
actcaagagg ttttcgccca ggtgaagcag atctacaaga ctccacctat taaggacttc 2400
ggtggcttca acttctccca gattttgcca gatccatcta agccctccaa gagatccttc 2460
attgaggacc tgctgttcaa caaggttact ttggctgacg ccggtttcat caagcagtac 2520
ggtgattgct tgggtgacat tgcagctaga gacttgatct gtgcccagaa gttcaacggt 2580
ttgaccgttt tgccaccttt gttgaccgac gagatgatcg ctcagtacac ttctgctttg 2640
ttggccggta ctatcacttc tggttggaca tttggagctg gtgccgcatt gcaaattcca 2700
ttcgctatgc aaatggccta cagattcaac ggtatcggtg ttacccagaa cgtcctgtac 2760
gagaaccaga agcttatcgc caaccagttc aactccgcta tcggtaagat tcaggactcc 2820
ttgtcctcta ctgcttctgc cttgggaaag ttgcaggatg ttgttaacca gaatgcccag 2880
gctttgaaca ccctggttaa gcaactgtcc tctaacttcg gtgctatctc ctccgttttg 2940
aacgacatct tgtcccgttt ggacaaggtt gaggctgagg ttcagatcga cagattgatc 3000
actggtagat tgcagtccct gcagacttac gttactcagc agttgattag agctgccgag 3060
attagagcct ctgctaactt ggctgctact aagatgtccg agtgtgtttt gggtcagtcc 3120
aagagagttg acttctgcgg taagggttac cacctgatgt ctttcccaca atctgctcca 3180
cacggtgtcg ttttcttgca cgttacttac gttccagctc aagagaagaa cttcactact 3240
gctccagcca tttgtcacga tggtaaggct cactttcctc gtgagggtgt tttcgtttcc 3300
aacggtactc actggttcgt cacccagaga aacttttacg agccacagat catcaccacc 3360
gacaacactt tcgtttctgg taactgtgac gtcgtcatcg gtatcgtgaa caacactgtc 3420
tacgatccat tgcagccaga attggactcc ttcaaagagg aactggacaa gtactttaag 3480
aaccacactt ccccagacgt tgacctgggt gatatttccg gtattaacgc ctccgttgtc 3540
aacatccaaa aagagatcga ccgtttgaac gaggtcgcca agaacttgaa cgagtccttg 3600
attgacttgc aagagctggg caagtacgag cagtacatta agtggccatg gtacatttgg 3660
ctgggtttca ttgctggttt gatcgccatc gttatggtca ccatcatgtt gtgctgtatg 3720
acctcctgtt gctcctgttt gaagggttgt tgttcctgcg gttcctgttg taagttcgac 3780
gaagatgact ccgagccagt cttgaagggt gttaagttgc actacactta agcggccgc 3839
<210> 5
<211> 5357
<212> DNA
<213> Artificial Sequence
<220>
<223> nucleic acid encoding for fusion protein HPV18L1/SARS-CoV-2 spike
protein- optimised for expression in K. pastoris
<400> 5
ttcgaaacga tggctctttg gagaccatcc gacaacactg tttacttgcc accaccatcc 60
gttgctagag ttgttaacac tgacgactac gttactagaa cttccatctt ctaccacgct 120
ggttcttcca gattgttgac tgttggtaac ccatacttca gagttccagc tggaggtggt 180
aacaagcaag acatcccaaa ggtttccgct taccagtaca gagttttcag agttcagttg 240
ccagacccaa acaagtttgg attgccagac acttccatct acaacccaga gactcagaga 300
cttgtttggg cttgtgctgg tgttgaaatc ggtagaggac agccattggg tgttggtttg 360
tctggtcacc cattctacaa caagttggac gacactgaat cttctcacgc tgctacttct 420
aacgtttccg aggatgttag agacaacgtt tccgttgact acaagcagac tcagttgtgt 480
atcttgggtt gtgctccagc tattggtgaa cattgggcta agggtactgc ttgtaagtcc 540
agaccattgt ctcagggaga ttgtccacca ttggagttga agaacactgt tttggaggac 600
ggtgatatgg ttgatactgg ttacggtgct atggacttct ctactttgca ggacactaag 660
tgtgaagttc cattggacat ctgtcagtcc atctgtaagt acccagacta cttgcaaatg 720
tccgctgatc catacggtga ctctatgttc ttctgtttga gaagagagca gttgttcgct 780
agacacttct ggaacagagc tggtactatg ggtgacactg ttccacaatc cttgtacatc 840
aagggtactg gaatgagagc ttctcctggt tcttgtgttt actctccatc tccatccggt 900
tccattgtta cttccgactc ccagttgttc aacaagccat actggttgca taaggctcaa 960
ggtcacaaca acggtgtttg ttggcacaac cagttgttcg ttactgttgt tgacactact 1020
agatccacta acttgactat ctgtgcttcc actcaatctc cagttccagg acaatacgac 1080
gctactaagt tcaagcagta ctccagacac gttgaagagt acgacttgca gttcatcttc 1140
cagttgtgta ctatcacttt gactgctgat gttatgtcct acatccactc tatgaactcc 1200
tccattttgg aggattggaa cttcggtgtt ccaccaccac caactacttc attggttgac 1260
acttacagat tcgttcagtc cgttgctatc acttgtcaaa aggacgctgc tccagctgaa 1320
aacaaggacc catacgacaa gttgaagttc tggaacgttg acttgaaaga gaagttctcc 1380
ttggacttgg accaataccc attgggtaga aagtttttgg ttcaggctgg attgagaaga 1440
aagccaacta tcggtccaag aaagagatca gctccatccg ctactacttc atccaagcca 1500
gctaagagag ttagagttag agctagaaag ttcgtgttct tggtcctgtt gccattggtt 1560
tcttcccagt gtgttaacct gaccactaga actcaattgc ctccagccta caccaattcc 1620
ttcaccagag gtgtttacta cccagacaag gtgttcagat cttccgtctt gcactccact 1680
caggacttgt tcttgccatt cttctccaac gttacctggt tccacgctat tcacgtttcc 1740
ggaactaacg gtactaagag attcgacaac ccagtcctgc cattcaacga tggtgtctac 1800
ttcgcttcta ccgagaagtc caacatcatc agaggttgga tcttcggtac taccctggac 1860
tctaagactc agtccttgct gatcgttaac aacgccacca acgttgtcat caaggtttgc 1920
gagttccagt tctgcaacga cccattcttg ggtgtgtact accacaagaa caacaagtct 1980
tggatggaat ccgagttcag agtttactcc tccgccaaca actgtacctt cgagtacgtt 2040
tcccagccat tcttgatgga cttggagggt aagcagggta acttcaagaa cctgagagag 2100
ttcgttttca agaacatcga cggttacttc aagatctact ccaagcacac cccaatcaac 2160
ctggttagag atttgccaca aggtttctcc gctttggagc ctttggttga cttgccaatc 2220
ggtatcaaca tcaccagatt ccagaccttg ttggccttgc acagatccta cttgactcca 2280
ggtgattctt cttccggttg gactgctggt gctgctgctt actatgttgg ttacttgcag 2340
ccaagaacct tcctgctgaa gtacaacgag aacggaacta tcactgacgc tgttgactgt 2400
gctttggacc cattgtctga gactaagtgc accttgaagt ccttcaccgt tgagaagggt 2460
atctaccaga cctccaactt cagagttcag ccaactgagt ccatcgtcag attcccaaac 2520
atcactaact tgtgcccatt cggtgaggtg ttcaacgcta ctagattcgc ttctgtttac 2580
gcctggaaca gaaagagaat ctccaactgc gttgctgact actccgtctt gtacaactct 2640
gcttcattct ccaccttcaa gtgctacggt gtttccccaa ctaagttgaa cgacctgtgt 2700
ttcactaacg tctacgccga ctccttcgtt attagaggtg acgaggttag acagatcgct 2760
ccaggtcaaa ctggtaagat cgctgactac aactacaagc tgccagacga cttcaccggt 2820
tgtgttattg cttggaactc caacaacctg gactccaagg ttggtggtaa ctacaattac 2880
ctgtaccgtc tgttcagaaa gtccaacttg aagccattcg agagagacat ctccaccgag 2940
atctaccaag ctggttctac tccatgtaac ggtgtcgagg gtttcaactg ctacttccca 3000
ttgcaatcct acggtttcca acctaccaac ggtgttggat accagccata cagagttgtc 3060
gttttgtcct tcgagttgtt gcacgctcca gctactgttt gtggtccaaa gaagtccacc 3120
aacttggtca agaacaaatg cgtcaacttt aacttcaacg gcctgaccgg tactggtgtt 3180
ttgactgaat ccaacaagaa gttcctgcct ttccagcagt tcggtagaga cattgctgac 3240
actactgacg ccgttagaga tccacagact ttggagatct tggacatcac cccatgttcc 3300
ttcggtggtg tttccgttat tacccctgga actaacacct ccaatcaggt cgctgtcttg 3360
taccaggacg ttaactgtac tgaggttcca gttgctatcc acgctgacca attgactcca 3420
acttggagag tctactccac cggttccaac gttttccaaa ctagagccgg ttgtttgatc 3480
ggtgctgaac acgtcaacaa ctcctacgag tgtgacattc caattggtgc tggtatctgt 3540
gcctcctacc aaactcaaac taactcccca agaagggcta gatccgttgc ttcccaatcc 3600
attatcgctt acaccatgtc tttgggtgcc gagaactctg ttgcctactc taacaactct 3660
atcgctatcc ctaccaactt caccatctcc gttaccactg agatcttgcc agtctccatg 3720
accaagactt ccgttgactg taccatgtac atctgtggtg actccactga gtgttccaac 3780
ttgttgctgc aatacggttc cttctgcacc cagttgaaca gagctttgac tggtattgct 3840
gtcgagcaag acaagaacac tcaagaggtt ttcgcccagg tgaagcagat ctacaagact 3900
ccacctatta aggacttcgg tggcttcaac ttctcccaga ttttgccaga tccatctaag 3960
ccctccaaga gatccttcat tgaggacctg ctgttcaaca aggttacttt ggctgacgcc 4020
ggtttcatca agcagtacgg tgattgcttg ggtgacattg cagctagaga cttgatctgt 4080
gcccagaagt tcaacggttt gaccgttttg ccacctttgt tgaccgacga gatgatcgct 4140
cagtacactt ctgctttgtt ggccggtact atcacttctg gttggacatt tggagctggt 4200
gccgcattgc aaattccatt cgctatgcaa atggcctaca gattcaacgg tatcggtgtt 4260
acccagaacg tcctgtacga gaaccagaag cttatcgcca accagttcaa ctccgctatc 4320
ggtaagattc aggactcctt gtcctctact gcttctgcct tgggaaagtt gcaggatgtt 4380
gttaaccaga atgcccaggc tttgaacacc ctggttaagc aactgtcctc taacttcggt 4440
gctatctcct ccgttttgaa cgacatcttg tcccgtttgg acaaggttga ggctgaggtt 4500
cagatcgaca gattgatcac tggtagattg cagtccctgc agacttacgt tactcagcag 4560
ttgattagag ctgccgagat tagagcctct gctaacttgg ctgctactaa gatgtccgag 4620
tgtgttttgg gtcagtccaa gagagttgac ttctgcggta agggttacca cctgatgtct 4680
ttcccacaat ctgctccaca cggtgtcgtt ttcttgcacg ttacttacgt tccagctcaa 4740
gagaagaact tcactactgc tccagccatt tgtcacgatg gtaaggctca ctttcctcgt 4800
gagggtgttt tcgtttccaa cggtactcac tggttcgtca cccagagaaa cttttacgag 4860
ccacagatca tcaccaccga caacactttc gtttctggta actgtgacgt cgtcatcggt 4920
atcgtgaaca acactgtcta cgatccattg cagccagaat tggactcctt caaagaggaa 4980
ctggacaagt actttaagaa ccacacttcc ccagacgttg acctgggtga tatttccggt 5040
attaacgcct ccgttgtcaa catccaaaaa gagatcgacc gtttgaacga ggtcgccaag 5100
aacttgaacg agtccttgat tgacttgcaa gagctgggca agtacgagca gtacattaag 5160
tggccatggt acatttggct gggtttcatt gctggtttga tcgccatcgt tatggtcacc 5220
atcatgttgt gctgtatgac ctcctgttgc tcctgtttga agggttgttg ttcctgcggt 5280
tcctgttgta agttcgacga agatgactcc gagccagtct tgaagggtgt taagttgcac 5340
tacacttaag cggccgc 5357
<210> 6
<211> 5351
<212> DNA
<213> Artificial Sequence
<220>
<223> nucleic acid encoding for fusion protein HPV16L1/SARS-CoV-2 spike
protein - optimised for expression in K. pastoris
<400> 6
ttcgaaacga tgtctttgtg gttgccatct gaagctactg tttacttgcc accagttcca 60
gtttctaaag ttgtttccac tgacgaatac gttgctagaa ctaacatcta ctaccacgct 120
ggtacttcta gattgttggc tgttggtcat ccatacttcc caattaagaa gccaaacaac 180
aacaagattt tggttccaaa ggtttccgga ttgcaataca gagttttcag aatccatttg 240
ccagatccaa acaagtttgg tttcccagat acttctttct acaacccaga cactcaaaga 300
cttgtttggg cttgtgttgg tgttgaagtt ggtagaggtc aaccattggg tgttggtatt 360
tctggtcacc cattgttgaa caagttggac gatactgaaa acgcttctgc ttacgctgct 420
aacgctggtg ttgataacag agaatgtatt tctatggact acaagcaaac tcaattgtgt 480
ttgattggtt gtaagccacc aattggtgaa cattggggaa agggttctcc atgtactaat 540
gttgctgtta accctggtga ttgtccacca ttggaattga ttaacactgt tattcaagac 600
ggtgatatgg ttgatactgg tttcggtgct atggatttca ctactttgca agctaacaag 660
tctgaagttc cattggacat ttgtacttcc atctgtaagt acccagacta cattaagatg 720
gtttctgaac catacggtga ttctttgttc ttctacttga gaagagaaca aatgtttgtt 780
agacacttgt tcaacagagc tggtgctgtt ggtgaaaacg ttccagatga cttgtacatt 840
aagggttctg gttctactgc taacttggct tcttctaact actttccaac tccatctggt 900
tctatggtta cttctgacgc tcaaattttc aacaagccat actggttgca aagagcacaa 960
ggtcataaca acggtatttg ttggggtaac caattgttcg ttactgttgt tgacactact 1020
agatccacta acatgtcctt gtgtgctgct atttctactt ctgaaactac ttacaagaac 1080
actaacttca aagagtactt gagacacgga gaagaatacg acttgcaatt cattttccaa 1140
ttgtgtaaga ttactttgac tgctgacgtt atgacttaca ttcactctat gaactctact 1200
attttggaag attggaactt cggattgcaa ccaccaccag gtggtacttt ggaagatact 1260
tacagattcg ttacttctca agctattgct tgtcaaaagc atactccacc tgctccaaaa 1320
gaagatccat tgaagaagta cactttctgg gaagttaact tgaaagaaaa gttctctgct 1380
gatttggatc aattcccatt gggtagaaag tttttgttgc aagctggatt gaaggctaaa 1440
ccaaagttca ctttgggaaa gagaaaggct actccaacta cttcttctac ttctactact 1500
gctaagagaa agaagagaaa attgttcgtg ttcttggtcc tgttgccatt ggtttcttcc 1560
cagtgtgtta acctgaccac tagaactcaa ttgcctccag cctacaccaa ttccttcacc 1620
agaggtgttt actacccaga caaggtgttc agatcttccg tcttgcactc cactcaggac 1680
ttgttcttgc cattcttctc caacgttacc tggttccacg ctattcacgt ttccggaact 1740
aacggtacta agagattcga caacccagtc ctgccattca acgatggtgt ctacttcgct 1800
tctaccgaga agtccaacat catcagaggt tggatcttcg gtactaccct ggactctaag 1860
actcagtcct tgctgatcgt taacaacgcc accaacgttg tcatcaaggt ttgcgagttc 1920
cagttctgca acgacccatt cttgggtgtg tactaccaca agaacaacaa gtcttggatg 1980
gaatccgagt tcagagttta ctcctccgcc aacaactgta ccttcgagta cgtttcccag 2040
ccattcttga tggacttgga gggtaagcag ggtaacttca agaacctgag agagttcgtt 2100
ttcaagaaca tcgacggtta cttcaagatc tactccaagc acaccccaat caacctggtt 2160
agagatttgc cacaaggttt ctccgctttg gagcctttgg ttgacttgcc aatcggtatc 2220
aacatcacca gattccagac cttgttggcc ttgcacagat cctacttgac tccaggtgat 2280
tcttcttccg gttggactgc tggtgctgct gcttactatg ttggttactt gcagccaaga 2340
accttcctgc tgaagtacaa cgagaacgga actatcactg acgctgttga ctgtgctttg 2400
gacccattgt ctgagactaa gtgcaccttg aagtccttca ccgttgagaa gggtatctac 2460
cagacctcca acttcagagt tcagccaact gagtccatcg tcagattccc aaacatcact 2520
aacttgtgcc cattcggtga ggtgttcaac gctactagat tcgcttctgt ttacgcctgg 2580
aacagaaaga gaatctccaa ctgcgttgct gactactccg tcttgtacaa ctctgcttca 2640
ttctccacct tcaagtgcta cggtgtttcc ccaactaagt tgaacgacct gtgtttcact 2700
aacgtctacg ccgactcctt cgttattaga ggtgacgagg ttagacagat cgctccaggt 2760
caaactggta agatcgctga ctacaactac aagctgccag acgacttcac cggttgtgtt 2820
attgcttgga actccaacaa cctggactcc aaggttggtg gtaactacaa ttacctgtac 2880
cgtctgttca gaaagtccaa cttgaagcca ttcgagagag acatctccac cgagatctac 2940
caagctggtt ctactccatg taacggtgtc gagggtttca actgctactt cccattgcaa 3000
tcctacggtt tccaacctac caacggtgtt ggataccagc catacagagt tgtcgttttg 3060
tccttcgagt tgttgcacgc tccagctact gtttgtggtc caaagaagtc caccaacttg 3120
gtcaagaaca aatgcgtcaa ctttaacttc aacggcctga ccggtactgg tgttttgact 3180
gaatccaaca agaagttcct gcctttccag cagttcggta gagacattgc tgacactact 3240
gacgccgtta gagatccaca gactttggag atcttggaca tcaccccatg ttccttcggt 3300
ggtgtttccg ttattacccc tggaactaac acctccaatc aggtcgctgt cttgtaccag 3360
gacgttaact gtactgaggt tccagttgct atccacgctg accaattgac tccaacttgg 3420
agagtctact ccaccggttc caacgttttc caaactagag ccggttgttt gatcggtgct 3480
gaacacgtca acaactccta cgagtgtgac attccaattg gtgctggtat ctgtgcctcc 3540
taccaaactc aaactaactc cccaagaagg gctagatccg ttgcttccca atccattatc 3600
gcttacacca tgtctttggg tgccgagaac tctgttgcct actctaacaa ctctatcgct 3660
atccctacca acttcaccat ctccgttacc actgagatct tgccagtctc catgaccaag 3720
acttccgttg actgtaccat gtacatctgt ggtgactcca ctgagtgttc caacttgttg 3780
ctgcaatacg gttccttctg cacccagttg aacagagctt tgactggtat tgctgtcgag 3840
caagacaaga acactcaaga ggttttcgcc caggtgaagc agatctacaa gactccacct 3900
attaaggact tcggtggctt caacttctcc cagattttgc cagatccatc taagccctcc 3960
aagagatcct tcattgagga cctgctgttc aacaaggtta ctttggctga cgccggtttc 4020
atcaagcagt acggtgattg cttgggtgac attgcagcta gagacttgat ctgtgcccag 4080
aagttcaacg gtttgaccgt tttgccacct ttgttgaccg acgagatgat cgctcagtac 4140
acttctgctt tgttggccgg tactatcact tctggttgga catttggagc tggtgccgca 4200
ttgcaaattc cattcgctat gcaaatggcc tacagattca acggtatcgg tgttacccag 4260
aacgtcctgt acgagaacca gaagcttatc gccaaccagt tcaactccgc tatcggtaag 4320
attcaggact ccttgtcctc tactgcttct gccttgggaa agttgcagga tgttgttaac 4380
cagaatgccc aggctttgaa caccctggtt aagcaactgt cctctaactt cggtgctatc 4440
tcctccgttt tgaacgacat cttgtcccgt ttggacaagg ttgaggctga ggttcagatc 4500
gacagattga tcactggtag attgcagtcc ctgcagactt acgttactca gcagttgatt 4560
agagctgccg agattagagc ctctgctaac ttggctgcta ctaagatgtc cgagtgtgtt 4620
ttgggtcagt ccaagagagt tgacttctgc ggtaagggtt accacctgat gtctttccca 4680
caatctgctc cacacggtgt cgttttcttg cacgttactt acgttccagc tcaagagaag 4740
aacttcacta ctgctccagc catttgtcac gatggtaagg ctcactttcc tcgtgagggt 4800
gttttcgttt ccaacggtac tcactggttc gtcacccaga gaaactttta cgagccacag 4860
atcatcacca ccgacaacac tttcgtttct ggtaactgtg acgtcgtcat cggtatcgtg 4920
aacaacactg tctacgatcc attgcagcca gaattggact ccttcaaaga ggaactggac 4980
aagtacttta agaaccacac ttccccagac gttgacctgg gtgatatttc cggtattaac 5040
gcctccgttg tcaacatcca aaaagagatc gaccgtttga acgaggtcgc caagaacttg 5100
aacgagtcct tgattgactt gcaagagctg ggcaagtacg agcagtacat taagtggcca 5160
tggtacattt ggctgggttt cattgctggt ttgatcgcca tcgttatggt caccatcatg 5220
ttgtgctgta tgacctcctg ttgctcctgt ttgaagggtt gttgttcctg cggttcctgt 5280
tgtaagttcg acgaagatga ctccgagcca gtcttgaagg gtgttaagtt gcactacact 5340
taagcggccg c 5351
<210> 7
<211> 3836
<212> DNA
<213> Artificial Sequence
<220>
<223> SARS-CoV-2 spike protein nucleic acid sequence - optimised for
expression in humans
<400> 7
gctagcgaca tgttcgtgtt tctggtgctg ctgcctctgg tgtccagcca gtgtgtgaac 60
ctgaccacca gaacacagct gcctccagcc tacaccaata gcttcaccag gggcgtgtac 120
taccccgaca aggtgttcag atctagcgtg ctgcacagca cccaggacct gtttctgccc 180
ttcttcagca acgtgacctg gttccacgcc atccacgtgt ccggcaccaa tggcaccaag 240
agattcgaca accccgtgct gcccttcaac gatggggtgt actttgccag caccgagaag 300
tccaacatca tcagaggctg gatcttcggc accacactgg acagcaagac ccagagcctg 360
ctgatcgtga acaacgccac caacgtggtc atcaaagtgt gcgagttcca gttctgcaac 420
gacccattcc tgggagtcta ctaccacaag aacaacaaga gctggatgga aagcgagttc 480
cgggtgtaca gcagcgccaa caactgcacc ttcgagtacg tgtcccagcc tttcctgatg 540
gacctggaag gcaagcaggg caacttcaag aacctgcgcg agttcgtgtt caagaacatc 600
gacggctact tcaagatcta cagcaagcac acccctatca acctcgtgcg ggatctgcct 660
cagggctttt ctgctctgga acctctggtg gacctgccta tcggcatcaa catcacccgg 720
tttcagaccc tgctggccct gcacagatct tacctgacac ctggcgatag cagctctgga 780
tggacagctg gcgccgctgc ctattatgtg ggctacctgc agcctcggac cttcctgctg 840
aagtacaacg agaacggcac catcaccgac gccgtggatt gtgctctgga tcccctgagc 900
gagacaaagt gcaccctgaa gtccttcacc gtggaaaagg gcatctacca gaccagcaac 960
ttcagagtgc agcccaccga gagcatcgtg cggttcccca atatcaccaa tctgtgcccc 1020
ttcggcgagg tgttcaatgc cacaagattt gccagcgtgt acgcctggaa ccggaagaga 1080
atcagcaact gcgtggccga ctacagcgtg ctgtacaata gcgccagctt cagcaccttc 1140
aagtgctacg gcgtgtcccc taccaagctg aacgacctgt gcttcaccaa tgtgtacgcc 1200
gacagcttcg tgatcagagg cgacgaagtt cggcagatcg ctcctggaca gacaggcaag 1260
atcgccgatt acaactacaa gctgcccgac gacttcaccg gctgcgtgat cgcctggaat 1320
agcaacaacc tggactccaa agtcggcggc aactacaact acctgtaccg gctgttccgg 1380
aagtccaatc tgaagccctt cgagcgggac atctccaccg aaatctatca ggccggcagc 1440
accccttgta acggcgtgga aggcttcaac tgctacttcc cactgcagtc ctacggcttt 1500
cagcctacca atggcgtggg ctatcagccc tatagagtgg tggtgctgag cttcgaactg 1560
ctgcatgccc ctgctaccgt gtgcggccct aagaagtcta ccaacctggt caagaacaaa 1620
tgcgtgaact tcaacttcaa cggcctgacc ggcacaggcg tgctgacaga gagcaacaag 1680
aagttcctgc ctttccagca gtttggccgg gatatcgccg ataccacaga cgccgttaga 1740
gatccccaga cactggaaat cctggacatc accccatgca gctttggcgg agtgtctgtg 1800
atcacccctg gcaccaatac cagcaatcag gtggccgtgc tgtatcagga cgtgaactgt 1860
acagaggtgc ccgtggccat tcacgccgat caactgacac ccacttggag agtgtactcc 1920
accggctcca acgtgttcca gactagagcc ggatgtctga tcggagccga gcacgtgaac 1980
aatagctacg agtgcgacat ccccatcggc gctggcatct gtgccagcta ccagacacag 2040
acaaatagcc ccagacgggc cagaagcgtg gcctctcaga gcatcattgc ctacacaatg 2100
agcctgggcg ccgagaattc tgtggcctac agcaacaact ctatcgctat ccccaccaac 2160
ttcaccatca gcgtgaccac cgagatcctg cctgtgtcca tgaccaagac cagcgtggac 2220
tgcaccatgt acatctgcgg cgattccacc gagtgcagca acctgctgct gcagtacggc 2280
agcttctgca cccagctgaa tagagccctg acagggatcg ccgtggaaca ggacaagaac 2340
acccaagagg tgttcgccca agtgaagcag atctacaaga cccctcctat caaggacttc 2400
ggcggcttca atttcagcca gattctgccc gatcctagca agcccagcaa gcggagcttt 2460
atcgaggacc tgctgttcaa caaagtgaca ctggccgacg ccggcttcat caagcagtat 2520
ggcgattgcc tgggcgacat tgccgccaga gatctgattt gcgcccagaa gtttaacgga 2580
ctgacagtgc tgcctcctct gctgaccgat gagatgatcg cccagtacac atctgctctg 2640
ctggccggca caatcaccag cggatggaca tttggagctg gcgcagccct gcagatcccc 2700
tttgctatgc agatggccta ccggttcaac ggcatcggag tgacccagaa tgtgctgtac 2760
gagaaccaga agctgatcgc caaccagttc aacagcgcca tcggcaagat ccaggatagc 2820
ctgtctagca cagccagcgc tctgggcaaa ctgcaggacg tggtcaatca gaacgctcag 2880
gccctgaaca ccctcgtgaa gcagctgagc agcaatttcg gcgccatcag ctccgtgctg 2940
aacgatatcc tgagccggct ggataaggtg gaagccgagg tgcagatcga cagactgatc 3000
acaggcagac tgcagagcct ccagacatac gtgacccagc agctgatcag agccgccgag 3060
attagagcct ctgccaatct ggccgccacc aagatgtctg agtgtgtgct gggccagagc 3120
aagagagtgg atttctgcgg caagggctac cacctgatga gctttccaca gtctgctcct 3180
cacggcgtgg tgtttctgca cgtgacctat gtgcccgctc aagagaagaa cttcacaaca 3240
gcccctgcca tctgccacga cggaaaggcc cattttccta gagaaggcgt gttcgtgtcc 3300
aacggcaccc attggttcgt gacacagcgg aacttctacg agccccagat catcaccacc 3360
gacaacacct tcgtgtctgg caactgtgac gtcgtgatcg gcattgtgaa caacaccgtg 3420
tacgaccctc tgcagcccga gctggacagc ttcaaagagg aactggacaa gtactttaag 3480
aaccacacaa gccccgacgt ggacctgggc gatattagcg gcatcaatgc ctccgtggtc 3540
aacatccaga aagagatcga ccggctgaac gaggtggcca agaatctgaa cgagagcctg 3600
atcgacctgc aagaactggg gaagtacgag cagtacatca agtggccctg gtacatctgg 3660
ctgggcttta tcgccggact gattgccatc gtgatggtca caatcatgct gtgctgcatg 3720
accagctgct gtagctgcct gaagggctgt tgcagctgtg gcagctgctg caagttcgac 3780
gaggatgata gcgagcctgt gctgaagggc gtgaaactgc actacaccgc ggccgc 3836
<210> 8
<211> 4232
<212> DNA
<213> Artificial Sequence
<220>
<223> nucleic acid encoding for fusion protein HBSAg/SARS-CoV-2 spike
protein- optimised for expression in humans
<400> 8
gctagcgaca tgaactttct gggcggtacg acagtatgcc ttggacaaaa ttcacaatct 60
ccgacgtcta atcactcccc tacaagttgt ccaccgactt gccccggcta taggtggatg 120
tgtctcagac gattcataat ctttctcttc attcttcttc tgtgcctgat attcttgctg 180
gtccttctgg attaccaggg aatgcttccc gtgtgtcctc tgattcctgg ttcatccact 240
acatctacgg gtccctgtag aacatgcacc acacctgcac agggcacctc catgtatccg 300
tcatgctgct gcacgaaacc atcagatggt aactgcacgt gcataccgat cccctcatca 360
tgggcgtttg ggaaatttct gtgggagtgg gcctcagccc ggttttcctt cgtgtttctg 420
gtgctgctgc ctctggtgtc cagccagtgt gtgaacctga ccaccagaac acagctgcct 480
ccagcctaca ccaatagctt caccaggggc gtgtactacc ccgacaaggt gttcagatct 540
agcgtgctgc acagcaccca ggacctgttt ctgcccttct tcagcaacgt gacctggttc 600
cacgccatcc acgtgtccgg caccaatggc accaagagat tcgacaaccc cgtgctgccc 660
ttcaacgatg gggtgtactt tgccagcacc gagaagtcca acatcatcag aggctggatc 720
ttcggcacca cactggacag caagacccag agcctgctga tcgtgaacaa cgccaccaac 780
gtggtcatca aagtgtgcga gttccagttc tgcaacgacc cattcctggg agtctactac 840
cacaagaaca acaagagctg gatggaaagc gagttccggg tgtacagcag cgccaacaac 900
tgcaccttcg agtacgtgtc ccagcctttc ctgatggacc tggaaggcaa gcagggcaac 960
ttcaagaacc tgcgcgagtt cgtgttcaag aacatcgacg gctacttcaa gatctacagc 1020
aagcacaccc ctatcaacct cgtgcgggat ctgcctcagg gcttttctgc tctggaacct 1080
ctggtggacc tgcctatcgg catcaacatc acccggtttc agaccctgct ggccctgcac 1140
agatcttacc tgacacctgg cgatagcagc tctggatgga cagctggcgc cgctgcctat 1200
tatgtgggct acctgcagcc tcggaccttc ctgctgaagt acaacgagaa cggcaccatc 1260
accgacgccg tggattgtgc tctggatccc ctgagcgaga caaagtgcac cctgaagtcc 1320
ttcaccgtgg aaaagggcat ctaccagacc agcaacttca gagtgcagcc caccgagagc 1380
atcgtgcggt tccccaatat caccaatctg tgccccttcg gcgaggtgtt caatgccaca 1440
agatttgcca gcgtgtacgc ctggaaccgg aagagaatca gcaactgcgt ggccgactac 1500
agcgtgctgt acaatagcgc cagcttcagc accttcaagt gctacggcgt gtcccctacc 1560
aagctgaacg acctgtgctt caccaatgtg tacgccgaca gcttcgtgat cagaggcgac 1620
gaagttcggc agatcgctcc tggacagaca ggcaagatcg ccgattacaa ctacaagctg 1680
cccgacgact tcaccggctg cgtgatcgcc tggaatagca acaacctgga ctccaaagtc 1740
ggcggcaact acaactacct gtaccggctg ttccggaagt ccaatctgaa gcccttcgag 1800
cgggacatct ccaccgaaat ctatcaggcc ggcagcaccc cttgtaacgg cgtggaaggc 1860
ttcaactgct acttcccact gcagtcctac ggctttcagc ctaccaatgg cgtgggctat 1920
cagccctata gagtggtggt gctgagcttc gaactgctgc atgcccctgc taccgtgtgc 1980
ggccctaaga agtctaccaa cctggtcaag aacaaatgcg tgaacttcaa cttcaacggc 2040
ctgaccggca caggcgtgct gacagagagc aacaagaagt tcctgccttt ccagcagttt 2100
ggccgggata tcgccgatac cacagacgcc gttagagatc cccagacact ggaaatcctg 2160
gacatcaccc catgcagctt tggcggagtg tctgtgatca cccctggcac caataccagc 2220
aatcaggtgg ccgtgctgta tcaggacgtg aactgtacag aggtgcccgt ggccattcac 2280
gccgatcaac tgacacccac ttggagagtg tactccaccg gctccaacgt gttccagact 2340
agagccggat gtctgatcgg agccgagcac gtgaacaata gctacgagtg cgacatcccc 2400
atcggcgctg gcatctgtgc cagctaccag acacagacaa atagccccag acgggccaga 2460
agcgtggcct ctcagagcat cattgcctac acaatgagcc tgggcgccga gaattctgtg 2520
gcctacagca acaactctat cgctatcccc accaacttca ccatcagcgt gaccaccgag 2580
atcctgcctg tgtccatgac caagaccagc gtggactgca ccatgtacat ctgcggcgat 2640
tccaccgagt gcagcaacct gctgctgcag tacggcagct tctgcaccca gctgaataga 2700
gccctgacag ggatcgccgt ggaacaggac aagaacaccc aagaggtgtt cgcccaagtg 2760
aagcagatct acaagacccc tcctatcaag gacttcggcg gcttcaattt cagccagatt 2820
ctgcccgatc ctagcaagcc cagcaagcgg agctttatcg aggacctgct gttcaacaaa 2880
gtgacactgg ccgacgccgg cttcatcaag cagtatggcg attgcctggg cgacattgcc 2940
gccagagatc tgatttgcgc ccagaagttt aacggactga cagtgctgcc tcctctgctg 3000
accgatgaga tgatcgccca gtacacatct gctctgctgg ccggcacaat caccagcgga 3060
tggacatttg gagctggcgc agccctgcag atcccctttg ctatgcagat ggcctaccgg 3120
ttcaacggca tcggagtgac ccagaatgtg ctgtacgaga accagaagct gatcgccaac 3180
cagttcaaca gcgccatcgg caagatccag gatagcctgt ctagcacagc cagcgctctg 3240
ggcaaactgc aggacgtggt caatcagaac gctcaggccc tgaacaccct cgtgaagcag 3300
ctgagcagca atttcggcgc catcagctcc gtgctgaacg atatcctgag ccggctggat 3360
aaggtggaag ccgaggtgca gatcgacaga ctgatcacag gcagactgca gagcctccag 3420
acatacgtga cccagcagct gatcagagcc gccgagatta gagcctctgc caatctggcc 3480
gccaccaaga tgtctgagtg tgtgctgggc cagagcaaga gagtggattt ctgcggcaag 3540
ggctaccacc tgatgagctt tccacagtct gctcctcacg gcgtggtgtt tctgcacgtg 3600
acctatgtgc ccgctcaaga gaagaacttc acaacagccc ctgccatctg ccacgacgga 3660
aaggcccatt ttcctagaga aggcgtgttc gtgtccaacg gcacccattg gttcgtgaca 3720
cagcggaact tctacgagcc ccagatcatc accaccgaca acaccttcgt gtctggcaac 3780
tgtgacgtcg tgatcggcat tgtgaacaac accgtgtacg accctctgca gcccgagctg 3840
gacagcttca aagaggaact ggacaagtac tttaagaacc acacaagccc cgacgtggac 3900
ctgggcgata ttagcggcat caatgcctcc gtggtcaaca tccagaaaga gatcgaccgg 3960
ctgaacgagg tggccaagaa tctgaacgag agcctgatcg acctgcaaga actggggaag 4020
tacgagcagt acatcaagtg gccctggtac atctggctgg gctttatcgc cggactgatt 4080
gccatcgtga tggtcacaat catgctgtgc tgcatgacca gctgctgtag ctgcctgaag 4140
ggctgttgca gctgtggcag ctgctgcaag ttcgacgagg atgatagcga gcctgtgctg 4200
aagggcgtga aactgcacta caccgcggcc gc 4232
<210> 9
<211> 1512
<212> PRT
<213> Artificial Sequence
<220>
<223> fusion protein HEV-SARS-CoV-2 spike protein
<400> 9
Met Ile Ala Leu Thr Leu Phe Asn Leu Ala Asp Thr Leu Leu Gly Gly
1 5 10 15
Leu Pro Thr Glu Leu Ile Ser Ser Ala Gly Gly Gln Leu Phe Tyr Ser
20 25 30
Arg Pro Val Val Ser Ala Asn Gly Glu Pro Thr Val Lys Leu Tyr Thr
35 40 45
Ser Val Glu Asn Ala Gln Gln Asp Lys Gly Ile Ala Ile Pro His Asp
50 55 60
Ile Asp Leu Gly Glu Ser Arg Val Val Ile Gln Asp Tyr Asp Asn Gln
65 70 75 80
His Glu Gln Asp Arg Pro Thr Pro Ser Pro Ala Pro Ser Arg Pro Phe
85 90 95
Ser Val Leu Arg Ala Asn Asp Val Leu Trp Leu Ser Leu Thr Ala Ala
100 105 110
Glu Tyr Asp Gln Ser Thr Tyr Gly Ser Ser Thr Gly Pro Val Tyr Val
115 120 125
Ser Asp Ser Val Thr Leu Val Asn Val Ala Thr Gly Ala Gln Ala Val
130 135 140
Ala Arg Ser Leu Asp Trp Thr Lys Val Thr Leu Asp Gly Arg Pro Leu
145 150 155 160
Ser Thr Ile Gln Gln Tyr Ser Lys Thr Phe Phe Val Leu Pro Leu Arg
165 170 175
Gly Lys Leu Ser Phe Trp Glu Ala Gly Thr Thr Lys Ala Gly Tyr Pro
180 185 190
Tyr Asn Tyr Asn Thr Thr Ala Ser Asp Gln Leu Leu Val Glu Asn Ala
195 200 205
Ala Gly His Arg Val Ala Ile Ser Thr Tyr Thr Thr Ser Leu Gly Ala
210 215 220
Gly Pro Val Ser Ile Ser Ala Val Ala Val Leu Ala Pro His Ser Ala
225 230 235 240
Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val Asn
245 250 255
Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe Thr
260 265 270
Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu His
275 280 285
Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp Phe
290 295 300
His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp Asn
305 310 315 320
Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu Lys
325 330 335
Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser Lys
340 345 350
Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile Lys
355 360 365
Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr Tyr
370 375 380
His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr Ser
385 390 395 400
Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu Met
405 410 415
Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe Val
420 425 430
Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr Pro
435 440 445
Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu Pro
450 455 460
Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr Leu
465 470 475 480
Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly
485 490 495
Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg
500 505 510
Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val
515 520 525
Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser
530 535 540
Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln
545 550 555 560
Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro
565 570 575
Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp
580 585 590
Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr
595 600 605
Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr
610 615 620
Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val
625 630 635 640
Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys
645 650 655
Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val
660 665 670
Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr
675 680 685
Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu
690 695 700
Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn
705 710 715 720
Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe
725 730 735
Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu
740 745 750
Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys
755 760 765
Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly
770 775 780
Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro
785 790 795 800
Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val Arg
805 810 815
Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly
820 825 830
Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val Ala
835 840 845
Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile His
850 855 860
Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn
865 870 875 880
Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn
885 890 895
Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser
900 905 910
Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala Ser
915 920 925
Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val
930 935 940
Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser
945 950 955 960
Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp
965 970 975
Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu
980 985 990
Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly
995 1000 1005
Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
1010 1015 1020
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly
1025 1030 1035
Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys
1040 1045 1050
Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala
1055 1060 1065
Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile
1070 1075 1080
Ala Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr
1085 1090 1095
Val Leu Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr
1100 1105 1110
Ser Ala Leu Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly
1115 1120 1125
Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr
1130 1135 1140
Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val Leu Tyr Glu Asn
1145 1150 1155
Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile Gly Lys Ile
1160 1165 1170
Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys Leu Gln
1175 1180 1185
Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val Lys
1190 1195 1200
Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn Asp
1205 1210 1215
Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln Ile Asp
1220 1225 1230
Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr
1235 1240 1245
Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu
1250 1255 1260
Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg
1265 1270 1275
Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln
1280 1285 1290
Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro
1295 1300 1305
Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp
1310 1315 1320
Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly
1325 1330 1335
Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile
1340 1345 1350
Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val
1355 1360 1365
Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu
1370 1375 1380
Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His
1385 1390 1395
Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala
1400 1405 1410
Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val
1415 1420 1425
Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly
1430 1435 1440
Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly
1445 1450 1455
Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met Leu
1460 1465 1470
Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser
1475 1480 1485
Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val
1490 1495 1500
Leu Lys Gly Val Lys Leu His Tyr Thr
1505 1510
<210> 10
<211> 1779
<212> PRT
<213> Artificial Sequence
<220>
<223> fusion protein HPV18L1/SARS-CoV-2 spike protein
<400> 10
Met Ala Leu Trp Arg Pro Ser Asp Asn Thr Val Tyr Leu Pro Pro Pro
1 5 10 15
Ser Val Ala Arg Val Val Asn Thr Asp Asp Tyr Val Thr Arg Thr Ser
20 25 30
Ile Phe Tyr His Ala Gly Ser Ser Arg Leu Leu Thr Val Gly Asn Pro
35 40 45
Tyr Phe Arg Val Pro Ala Gly Gly Gly Asn Lys Gln Asp Ile Pro Lys
50 55 60
Val Ser Ala Tyr Gln Tyr Arg Val Phe Arg Val Gln Leu Pro Asp Pro
65 70 75 80
Asn Lys Phe Gly Leu Pro Asp Thr Ser Ile Tyr Asn Pro Glu Thr Gln
85 90 95
Arg Leu Val Trp Ala Cys Ala Gly Val Glu Ile Gly Arg Gly Gln Pro
100 105 110
Leu Gly Val Gly Leu Ser Gly His Pro Phe Tyr Asn Lys Leu Asp Asp
115 120 125
Thr Glu Ser Ser His Ala Ala Thr Ser Asn Val Ser Glu Asp Val Arg
130 135 140
Asp Asn Val Ser Val Asp Tyr Lys Gln Thr Gln Leu Cys Ile Leu Gly
145 150 155 160
Cys Ala Pro Ala Ile Gly Glu His Trp Ala Lys Gly Thr Ala Cys Lys
165 170 175
Ser Arg Pro Leu Ser Gln Gly Asp Cys Pro Pro Leu Glu Leu Lys Asn
180 185 190
Thr Val Leu Glu Asp Gly Asp Met Val Asp Thr Gly Tyr Gly Ala Met
195 200 205
Asp Phe Ser Thr Leu Gln Asp Thr Lys Cys Glu Val Pro Leu Asp Ile
210 215 220
Cys Gln Ser Ile Cys Lys Tyr Pro Asp Tyr Leu Gln Met Ser Ala Asp
225 230 235 240
Pro Tyr Gly Asp Ser Met Phe Phe Cys Leu Arg Arg Glu Gln Leu Phe
245 250 255
Ala Arg His Phe Trp Asn Arg Ala Gly Thr Met Gly Asp Thr Val Pro
260 265 270
Gln Ser Leu Tyr Ile Lys Gly Thr Gly Met Arg Ala Ser Pro Gly Ser
275 280 285
Cys Val Tyr Ser Pro Ser Pro Ser Gly Ser Ile Val Thr Ser Asp Ser
290 295 300
Gln Leu Phe Asn Lys Pro Tyr Trp Leu His Lys Ala Gln Gly His Asn
305 310 315 320
Asn Gly Val Cys Trp His Asn Gln Leu Phe Val Thr Val Val Asp Thr
325 330 335
Thr Arg Ser Thr Asn Leu Thr Ile Cys Ala Ser Thr Gln Ser Pro Val
340 345 350
Pro Gly Gln Tyr Asp Ala Thr Lys Phe Lys Gln Tyr Ser Arg His Val
355 360 365
Glu Glu Tyr Asp Leu Gln Phe Ile Phe Gln Leu Cys Thr Ile Thr Leu
370 375 380
Thr Ala Asp Val Met Ser Tyr Ile His Ser Met Asn Ser Ser Ile Leu
385 390 395 400
Glu Asp Trp Asn Phe Gly Val Pro Pro Pro Pro Thr Thr Ser Leu Val
405 410 415
Asp Thr Tyr Arg Phe Val Gln Ser Val Ala Ile Thr Cys Gln Lys Asp
420 425 430
Ala Ala Pro Ala Glu Asn Lys Asp Pro Tyr Asp Lys Leu Lys Phe Trp
435 440 445
Asn Val Asp Leu Lys Glu Lys Phe Ser Leu Asp Leu Asp Gln Tyr Pro
450 455 460
Leu Gly Arg Lys Phe Leu Val Gln Ala Gly Leu Arg Arg Lys Pro Thr
465 470 475 480
Ile Gly Pro Arg Lys Arg Ser Ala Pro Ser Ala Thr Thr Ser Ser Lys
485 490 495
Pro Ala Lys Arg Val Arg Val Arg Ala Arg Lys Phe Val Phe Leu Val
500 505 510
Leu Leu Pro Leu Val Ser Ser Gln Cys Val Asn Leu Thr Thr Arg Thr
515 520 525
Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe Thr Arg Gly Val Tyr Tyr
530 535 540
Pro Asp Lys Val Phe Arg Ser Ser Val Leu His Ser Thr Gln Asp Leu
545 550 555 560
Phe Leu Pro Phe Phe Ser Asn Val Thr Trp Phe His Ala Ile His Val
565 570 575
Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp Asn Pro Val Leu Pro Phe
580 585 590
Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu Lys Ser Asn Ile Ile Arg
595 600 605
Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser Lys Thr Gln Ser Leu Leu
610 615 620
Ile Val Asn Asn Ala Thr Asn Val Val Ile Lys Val Cys Glu Phe Gln
625 630 635 640
Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr Tyr His Lys Asn Asn Lys
645 650 655
Ser Trp Met Glu Ser Glu Phe Arg Val Tyr Ser Ser Ala Asn Asn Cys
660 665 670
Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu Met Asp Leu Glu Gly Lys
675 680 685
Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe Val Phe Lys Asn Ile Asp
690 695 700
Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr Pro Ile Asn Leu Val Arg
705 710 715 720
Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu Pro Leu Val Asp Leu Pro
725 730 735
Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr Leu Leu Ala Leu His Arg
740 745 750
Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp Thr Ala Gly Ala
755 760 765
Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr Phe Leu Leu Lys
770 775 780
Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp Cys Ala Leu Asp
785 790 795 800
Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe Thr Val Glu Lys
805 810 815
Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro Thr Glu Ser Ile
820 825 830
Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe
835 840 845
Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile
850 855 860
Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe
865 870 875 880
Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu
885 890 895
Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu
900 905 910
Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn
915 920 925
Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser
930 935 940
Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg
945 950 955 960
Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr
965 970 975
Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe
980 985 990
Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly
995 1000 1005
Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu
1010 1015 1020
Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Asn
1025 1030 1035
Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Thr
1040 1045 1050
Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe
1055 1060 1065
Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val Arg
1070 1075 1080
Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
1085 1090 1095
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln
1100 1105 1110
Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val
1115 1120 1125
Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser
1130 1135 1140
Thr Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly
1145 1150 1155
Ala Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly
1160 1165 1170
Ala Gly Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg
1175 1180 1185
Arg Ala Arg Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met
1190 1195 1200
Ser Leu Gly Ala Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile
1205 1210 1215
Ala Ile Pro Thr Asn Phe Thr Ile Ser Val Thr Thr Glu Ile Leu
1220 1225 1230
Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys Thr Met Tyr Ile
1235 1240 1245
Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln Tyr Gly
1250 1255 1260
Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile Ala Val
1265 1270 1275
Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln
1280 1285 1290
Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe
1295 1300 1305
Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe
1310 1315 1320
Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
1325 1330 1335
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg
1340 1345 1350
Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro
1355 1360 1365
Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu
1370 1375 1380
Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala
1385 1390 1395
Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn
1400 1405 1410
Gly Ile Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu
1415 1420 1425
Ile Ala Asn Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser
1430 1435 1440
Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val
1445 1450 1455
Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val Lys Gln Leu Ser
1460 1465 1470
Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn Asp Ile Leu Ser
1475 1480 1485
Arg Leu Asp Lys Val Glu Ala Glu Val Gln Ile Asp Arg Leu Ile
1490 1495 1500
Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln Leu
1505 1510 1515
Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala Thr
1520 1525 1530
Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp Phe
1535 1540 1545
Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala Pro
1550 1555 1560
His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu
1565 1570 1575
Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala
1580 1585 1590
His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp
1595 1600 1605
Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr
1610 1615 1620
Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile
1625 1630 1635
Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser
1640 1645 1650
Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro
1655 1660 1665
Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser Val Val
1670 1675 1680
Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala Lys Asn
1685 1690 1695
Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr Glu
1700 1705 1710
Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly Phe Ile Ala
1715 1720 1725
Gly Leu Ile Ala Ile Val Met Val Thr Ile Met Leu Cys Cys Met
1730 1735 1740
Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser Cys Gly Ser
1745 1750 1755
Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu Lys Gly
1760 1765 1770
Val Lys Leu His Tyr Thr
1775
<210> 11
<211> 1777
<212> PRT
<213> Artificial Sequence
<220>
<223> fusion protein HPV16L1/SARS-CoV-2 spike protein
<400> 11
Met Ser Leu Trp Leu Pro Ser Glu Ala Thr Val Tyr Leu Pro Pro Val
1 5 10 15
Pro Val Ser Lys Val Val Ser Thr Asp Glu Tyr Val Ala Arg Thr Asn
20 25 30
Ile Tyr Tyr His Ala Gly Thr Ser Arg Leu Leu Ala Val Gly His Pro
35 40 45
Tyr Phe Pro Ile Lys Lys Pro Asn Asn Asn Lys Ile Leu Val Pro Lys
50 55 60
Val Ser Gly Leu Gln Tyr Arg Val Phe Arg Ile His Leu Pro Asp Pro
65 70 75 80
Asn Lys Phe Gly Phe Pro Asp Thr Ser Phe Tyr Asn Pro Asp Thr Gln
85 90 95
Arg Leu Val Trp Ala Cys Val Gly Val Glu Val Gly Arg Gly Gln Pro
100 105 110
Leu Gly Val Gly Ile Ser Gly His Pro Leu Leu Asn Lys Leu Asp Asp
115 120 125
Thr Glu Asn Ala Ser Ala Tyr Ala Ala Asn Ala Gly Val Asp Asn Arg
130 135 140
Glu Cys Ile Ser Met Asp Tyr Lys Gln Thr Gln Leu Cys Leu Ile Gly
145 150 155 160
Cys Lys Pro Pro Ile Gly Glu His Trp Gly Lys Gly Ser Pro Cys Thr
165 170 175
Asn Val Ala Val Asn Pro Gly Asp Cys Pro Pro Leu Glu Leu Ile Asn
180 185 190
Thr Val Ile Gln Asp Gly Asp Met Val Asp Thr Gly Phe Gly Ala Met
195 200 205
Asp Phe Thr Thr Leu Gln Ala Asn Lys Ser Glu Val Pro Leu Asp Ile
210 215 220
Cys Thr Ser Ile Cys Lys Tyr Pro Asp Tyr Ile Lys Met Val Ser Glu
225 230 235 240
Pro Tyr Gly Asp Ser Leu Phe Phe Tyr Leu Arg Arg Glu Gln Met Phe
245 250 255
Val Arg His Leu Phe Asn Arg Ala Gly Ala Val Gly Glu Asn Val Pro
260 265 270
Asp Asp Leu Tyr Ile Lys Gly Ser Gly Ser Thr Ala Asn Leu Ala Ser
275 280 285
Ser Asn Tyr Phe Pro Thr Pro Ser Gly Ser Met Val Thr Ser Asp Ala
290 295 300
Gln Ile Phe Asn Lys Pro Tyr Trp Leu Gln Arg Ala Gln Gly His Asn
305 310 315 320
Asn Gly Ile Cys Trp Gly Asn Gln Leu Phe Val Thr Val Val Asp Thr
325 330 335
Thr Arg Ser Thr Asn Met Ser Leu Cys Ala Ala Ile Ser Thr Ser Glu
340 345 350
Thr Thr Tyr Lys Asn Thr Asn Phe Lys Glu Tyr Leu Arg His Gly Glu
355 360 365
Glu Tyr Asp Leu Gln Phe Ile Phe Gln Leu Cys Lys Ile Thr Leu Thr
370 375 380
Ala Asp Val Met Thr Tyr Ile His Ser Met Asn Ser Thr Ile Leu Glu
385 390 395 400
Asp Trp Asn Phe Gly Leu Gln Pro Pro Pro Gly Gly Thr Leu Glu Asp
405 410 415
Thr Tyr Arg Phe Val Thr Ser Gln Ala Ile Ala Cys Gln Lys His Thr
420 425 430
Pro Pro Ala Pro Lys Glu Asp Pro Leu Lys Lys Tyr Thr Phe Trp Glu
435 440 445
Val Asn Leu Lys Glu Lys Phe Ser Ala Asp Leu Asp Gln Phe Pro Leu
450 455 460
Gly Arg Lys Phe Leu Leu Gln Ala Gly Leu Lys Ala Lys Pro Lys Phe
465 470 475 480
Thr Leu Gly Lys Arg Lys Ala Thr Pro Thr Thr Ser Ser Thr Ser Thr
485 490 495
Thr Ala Lys Arg Lys Lys Arg Lys Leu Phe Val Phe Leu Val Leu Leu
500 505 510
Pro Leu Val Ser Ser Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu
515 520 525
Pro Pro Ala Tyr Thr Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp
530 535 540
Lys Val Phe Arg Ser Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu
545 550 555 560
Pro Phe Phe Ser Asn Val Thr Trp Phe His Ala Ile His Val Ser Gly
565 570 575
Thr Asn Gly Thr Lys Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp
580 585 590
Gly Val Tyr Phe Ala Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp
595 600 605
Ile Phe Gly Thr Thr Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val
610 615 620
Asn Asn Ala Thr Asn Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys
625 630 635 640
Asn Asp Pro Phe Leu Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp
645 650 655
Met Glu Ser Glu Phe Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe
660 665 670
Glu Tyr Val Ser Gln Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly
675 680 685
Asn Phe Lys Asn Leu Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr
690 695 700
Phe Lys Ile Tyr Ser Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu
705 710 715 720
Pro Gln Gly Phe Ser Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly
725 730 735
Ile Asn Ile Thr Arg Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr
740 745 750
Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala
755 760 765
Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn
770 775 780
Glu Asn Gly Thr Ile Thr Asp Ala Val Asp Cys Ala Leu Asp Pro Leu
785 790 795 800
Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile
805 810 815
Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro Thr Glu Ser Ile Val Arg
820 825 830
Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala
835 840 845
Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn
850 855 860
Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr
865 870 875 880
Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe
885 890 895
Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg
900 905 910
Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys
915 920 925
Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn
930 935 940
Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe
945 950 955 960
Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile
965 970 975
Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys
980 985 990
Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly
995 1000 1005
Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His
1010 1015 1020
Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Asn Leu Val
1025 1030 1035
Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Thr Gly Thr
1040 1045 1050
Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe Gln Gln
1055 1060 1065
Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val Arg Asp Pro
1070 1075 1080
Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly
1085 1090 1095
Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val Ala
1100 1105 1110
Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
1115 1120 1125
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly
1130 1135 1140
Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu
1145 1150 1155
His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly
1160 1165 1170
Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala
1175 1180 1185
Arg Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu
1190 1195 1200
Gly Ala Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile
1205 1210 1215
Pro Thr Asn Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val
1220 1225 1230
Ser Met Thr Lys Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly
1235 1240 1245
Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe
1250 1255 1260
Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile Ala Val Glu Gln
1265 1270 1275
Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln Ile Tyr
1280 1285 1290
Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe Ser Gln
1295 1300 1305
Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe Ile Glu
1310 1315 1320
Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile
1325 1330 1335
Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu
1340 1345 1350
Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
1355 1360 1365
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala
1370 1375 1380
Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu
1385 1390 1395
Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile
1400 1405 1410
Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala
1415 1420 1425
Asn Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser
1430 1435 1440
Ser Thr Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln
1445 1450 1455
Asn Ala Gln Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn
1460 1465 1470
Phe Gly Ala Ile Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu
1475 1480 1485
Asp Lys Val Glu Ala Glu Val Gln Ile Asp Arg Leu Ile Thr Gly
1490 1495 1500
Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln Leu Ile Arg
1505 1510 1515
Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala Thr Lys Met
1520 1525 1530
Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp Phe Cys Gly
1535 1540 1545
Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala Pro His Gly
1550 1555 1560
Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu Lys Asn
1565 1570 1575
Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His Phe
1580 1585 1590
Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val
1595 1600 1605
Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn
1610 1615 1620
Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn
1625 1630 1635
Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys
1640 1645 1650
Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val
1655 1660 1665
Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile
1670 1675 1680
Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala Lys Asn Leu Asn
1685 1690 1695
Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr
1700 1705 1710
Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly Phe Ile Ala Gly Leu
1715 1720 1725
Ile Ala Ile Val Met Val Thr Ile Met Leu Cys Cys Met Thr Ser
1730 1735 1740
Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser Cys Gly Ser Cys Cys
1745 1750 1755
Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu Lys Gly Val Lys
1760 1765 1770
Leu His Tyr Thr
1775
<210> 12
<211> 1407
<212> PRT
<213> Artificial Sequence
<220>
<223> fusion protein HBSAg/SARS-CoV-2 spike protein
<400> 12
Met Asn Phe Leu Gly Gly Thr Thr Val Cys Leu Gly Gln Asn Ser Gln
1 5 10 15
Ser Pro Thr Ser Asn His Ser Pro Thr Ser Cys Pro Pro Thr Cys Pro
20 25 30
Gly Tyr Arg Trp Met Cys Leu Arg Arg Phe Ile Ile Phe Leu Phe Ile
35 40 45
Leu Leu Leu Cys Leu Ile Phe Leu Leu Val Leu Leu Asp Tyr Gln Gly
50 55 60
Met Leu Pro Val Cys Pro Leu Ile Pro Gly Ser Ser Thr Thr Ser Thr
65 70 75 80
Gly Pro Cys Arg Thr Cys Thr Thr Pro Ala Gln Gly Thr Ser Met Tyr
85 90 95
Pro Ser Cys Cys Cys Thr Lys Pro Ser Asp Gly Asn Cys Thr Cys Ile
100 105 110
Pro Ile Pro Ser Ser Trp Ala Phe Gly Lys Phe Leu Trp Glu Trp Ala
115 120 125
Ser Ala Arg Phe Ser Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser
130 135 140
Ser Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr
145 150 155 160
Thr Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg
165 170 175
Ser Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser
180 185 190
Asn Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr
195 200 205
Lys Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe
210 215 220
Ala Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr
225 230 235 240
Thr Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr
245 250 255
Asn Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe
260 265 270
Leu Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu
275 280 285
Phe Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser
290 295 300
Gln Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn
305 310 315 320
Leu Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr
325 330 335
Ser Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe
340 345 350
Ser Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr
355 360 365
Arg Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly
370 375 380
Asp Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly
385 390 395 400
Tyr Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr
405 410 415
Ile Thr Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys
420 425 430
Cys Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser
435 440 445
Asn Phe Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile
450 455 460
Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala
465 470 475 480
Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp
485 490 495
Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr
500 505 510
Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr
515 520 525
Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro
530 535 540
Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp
545 550 555 560
Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys
565 570 575
Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn
580 585 590
Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly
595 600 605
Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu
610 615 620
Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr
625 630 635 640
Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val
645 650 655
Cys Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn
660 665 670
Phe Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn
675 680 685
Lys Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr
690 695 700
Thr Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr
705 710 715 720
Pro Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr
725 730 735
Ser Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val
740 745 750
Pro Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr
755 760 765
Ser Thr Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly
770 775 780
Ala Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala
785 790 795 800
Gly Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala
805 810 815
Arg Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly
820 825 830
Ala Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr
835 840 845
Asn Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr
850 855 860
Lys Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu
865 870 875 880
Cys Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn
885 890 895
Arg Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu
900 905 910
Val Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp
915 920 925
Phe Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro
930 935 940
Ser Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu
945 950 955 960
Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile
965 970 975
Ala Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val
980 985 990
Leu Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala
995 1000 1005
Leu Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly
1010 1015 1020
Ala Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe
1025 1030 1035
Asn Gly Ile Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys
1040 1045 1050
Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp
1055 1060 1065
Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys Leu Gln Asp Val
1070 1075 1080
Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val Lys Gln Leu
1085 1090 1095
Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn Asp Ile Leu
1100 1105 1110
Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln Ile Asp Arg Leu
1115 1120 1125
Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln
1130 1135 1140
Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala
1145 1150 1155
Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp
1160 1165 1170
Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
1175 1180 1185
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln
1190 1195 1200
Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys
1205 1210 1215
Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His
1220 1225 1230
Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr
1235 1240 1245
Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly
1250 1255 1260
Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp
1265 1270 1275
Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser
1280 1285 1290
Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser Val
1295 1300 1305
Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala Lys
1310 1315 1320
Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr
1325 1330 1335
Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly Phe Ile
1340 1345 1350
Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met Leu Cys Cys
1355 1360 1365
Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser Cys Gly
1370 1375 1380
Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu Lys
1385 1390 1395
Gly Val Lys Leu His Tyr Thr Ala Ala
1400 1405
<210> 13
<211> 665
<212> DNA
<213> Artificial Sequence
<220>
<223> RBD SARS-CoV-2 spike protein nucleic acid
<400> 13
gctagcgacg ccaccatgag agtccaacca acagaatcta ttgttagatt tcctaatatt 60
acaaacttgt gcccttttgg tgaagttttt aacgccacca gatttgcatc tgtttatgct 120
tggaacagga agagaatcag caactgtgtt gctgattatt ctgtcctata taattccgca 180
tcattttcca cttttaagtg ttatggagtg tctcctacta aattaaatga tctctgcttt 240
actaatgtct atgcagattc atttgtaatt agaggtgatg aagtcagaca aatcgctcca 300
gggcaaactg gaaagattgc tgattataat tataaattac cagatgattt tacaggctgc 360
gttatagctt ggaattctaa caatcttgat tctaaggttg gtggtaatta taattacctg 420
tatagattgt ttaggaagtc taatctcaaa ccttttgaga gagatatttc aactgaaatc 480
tatcaggccg gtagcacacc ttgtaatggt gttgaaggtt ttaattgtta ctttccttta 540
caatcatatg gtttccaacc cactaatggt gttggttacc aaccatacag agtagtagta 600
ctttcttttg aacttctaca tgcaccagca actgtttgtg gacctaaaaa gtgataagcg 660
gccgc 665
<210> 14
<211> 665
<212> DNA
<213> Artificial Sequence
<220>
<223> RBD SARS-CoV-2 spike protein nucleic acid sequence - human codon
optimized
<400> 14
gctagcgacg ccaccatgag agtgcagcct acagagtcta tcgtgcggtt ccccaacatc 60
accaatctgt gccctttcgg cgaggtgttc aacgccacaa gatttgccag cgtgtacgcc 120
tggaaccgga agagaatcag caactgcgtg gccgactaca gcgtgctgta caatagcgcc 180
agcttcagca ccttcaagtg ctacggcgtg tcccctacca agctgaacga cctgtgcttc 240
accaatgtgt acgccgacag cttcgtgatc agaggcgacg aagttcggca gatcgctcct 300
ggacagacag gcaagatcgc cgattacaac tacaagctgc ccgacgactt caccggctgc 360
gtgatcgcct ggaatagcaa caacctggac agcaaagtcg gcggcaacta caactacctg 420
taccggctgt tccggaagtc caacctgaag cctttcgagc gggacatcag caccgagatc 480
tatcaggccg gcagcacccc ttgtaatggc gtggaaggct tcaactgcta cttcccactg 540
cagtcctacg gcttccagcc tacaaacggc gtgggctacc agccttatag agtggtggtg 600
ctgagcttcg aactgctgca tgcccctgct acagtgtgcg gccccaagaa gtgataagcg 660
gccgc 665
<210> 15
<211> 212
<212> PRT
<213> SARS-CoV-2
<400> 15
Met Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr
1 5 10 15
Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser
20 25 30
Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr
35 40 45
Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly
50 55 60
Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala
65 70 75 80
Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly
85 90 95
Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe
100 105 110
Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val
115 120 125
Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu
130 135 140
Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser
145 150 155 160
Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln
165 170 175
Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg
180 185 190
Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys
195 200 205
Gly Pro Lys Lys
210
<210> 16
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> EAAAK linker consensus sequence
<400> 16
Ala Glu Ala Ala Ala Lys Ala
1 5
<210> 17
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> (EAAAK)3 linker
<400> 17
gaagccgccg ctaaagaggc cgctgccaaa gaagctgctg ctaag 45
<210> 18
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> (EAAAK)3 linker
<400> 18
Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys
1 5 10 15
<210> 19
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> GS linker consensus sequence
<400> 19
Gly Gly Gly Gly Ser
1 5
<210> 20
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> GS5 linker
<400> 20
Gly Gly Gly Gly Ser
1 5
<210> 21
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> GS10 linker
<400> 21
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
1 5 10
<210> 22
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> GS15 linker
<400> 22
ggtggtggtg gtagcggtgg tggcggttca ggtggcggtg gttca 45
<210> 23
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> GS15 linker
<400> 23
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
1 5 10 15
<210> 24
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> GS20 linker
<400> 24
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15
Gly Gly Gly Ser
20
<210> 25
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> GS25 linker
<400> 25
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15
Gly Gly Gly Ser Gly Gly Gly Gly Ser
20 25
<210> 26
<211> 1427
<212> DNA
<213> Artificial Sequence
<220>
<223> HBSAg-(EAAAK)3-RBD
<400> 26
gctagcgacg ccaccatgat tgcactgacc ctgtttaatc tggcagatac cctgttaggt 60
ggtctgccga ccgaactgat tagcagtgcc ggtggtcagc tgttttatag ccgtccggtt 120
gttagcgcaa atggtgaacc gaccgttaaa ctgtatacca gcgttgaaaa tgcacagcag 180
gataaaggta ttgcaattcc gcatgatatt gatctgggtg aaagccgtgt tgtgattcag 240
gattatgata atcagcatga acaggatcgt ccgacaccga gtccggcacc gagccgtccg 300
tttagcgttc tgcgtgcaaa tgatgttctg tggctgagcc tgaccgcagc agaatatgat 360
cagagcacct atggtagcag caccggtccg gtttatgtta gcgatagcgt taccctggtt 420
aatgttgcaa ccggtgcaca ggcagttgca cgtagcctgg attggaccaa agtgaccctg 480
gatggtcgtc cgctgagcac cattcagcag tatagcaaaa ccttttttgt tctgccgctg 540
cgtggtaaac tgagcttttg ggaagcaggc accaccaaag caggttatcc gtataactat 600
aataccaccg caagcgatca gctgctggtt gaaaacgcag caggtcatcg tgttgcaatt 660
agcacctata ccaccagttt aggtgcaggt ccggttagca ttagcgcagt tgcagttctg 720
gcaccgcatt cagccgaagc agccgctaaa gaagcagccg ctaaagaagc agccgctaaa 780
agagtccaac caacagaatc tattgttaga tttcctaata ttacaaactt gtgccctttt 840
ggtgaagttt ttaacgccac cagatttgca tctgtttatg cttggaacag gaagagaatc 900
agcaactgtg ttgctgatta ttctgtccta tataattccg catcattttc cacttttaag 960
tgttatggag tgtctcctac taaattaaat gatctctgct ttactaatgt ctatgcagat 1020
tcatttgtaa ttagaggtga tgaagtcaga caaatcgctc cagggcaaac tggaaagatt 1080
gctgattata attataaatt accagatgat tttacaggct gcgttatagc ttggaattct 1140
aacaatcttg attctaaggt tggtggtaat tataattacc tgtatagatt gtttaggaag 1200
tctaatctca aaccttttga gagagatatt tcaactgaaa tctatcaggc cggtagcaca 1260
ccttgtaatg gtgttgaagg ttttaattgt tactttcctt tacaatcata tggtttccaa 1320
cccactaatg gtgttggtta ccaaccatac agagtagtag tactttcttt tgaacttcta 1380
catgcaccag caactgtttg tggacctaaa aagtgataag cggccgc 1427
<210> 27
<211> 1106
<212> DNA
<213> Artificial Sequence
<220>
<223> HBSAg-(EAAAK)3-RBD nucleic acid sequence human codon optimised
<400> 27
gctagcgacg ccaccatgaa ttttctcggc ggcacaacag tgtgcctggg ccagaatagc 60
cagtctccta ccagcaatca cagccccacc agctgtcctc caacctgtcc tggctacaga 120
tggatgtgcc tgcggcggtt catcatcttt ctgttcatcc tgctgctgtg cctgatcttc 180
ctgctggtgc tgctggatta ccagggaatg ctgcctgtgt gtcctctgat ccctggcagc 240
agcacaacaa gcacaggccc ttgcagaacc tgcacaacac cagctcaggg caccagcatg 300
taccctagct gctgttgtac caagcctagc gacggcaact gcacatgcat ccccattcct 360
agcagctggg ccttcggcaa gtttctgtgg gaatgggcca gcgccagatt ttccgaagcc 420
gccgctaaag aggccgctgc caaagaagct gctgctaaga gagtgcagcc caccgagtct 480
atcgtgcggt tccccaacat caccaatctg tgccctttcg gcgaggtgtt caacgccaca 540
agatttgcca gcgtgtacgc ctggaaccgg aagagaatca gcaactgcgt ggccgactac 600
agcgtgctgt acaatagcgc cagcttcagc accttcaagt gctacggcgt gtcccctacc 660
aagctgaacg acctgtgctt caccaatgtg tacgccgaca gcttcgtgat cagaggcgac 720
gaagttcggc agatcgctcc tggacagaca ggcaagatcg ccgattacaa ctacaagctg 780
cccgacgact tcaccggctg cgtgatcgcc tggaatagca acaacctgga cagcaaagtc 840
ggcggcaact acaactacct gtaccggctg ttccggaagt ccaacctgaa gcctttcgag 900
cgggacatca gcaccgaaat ctaccaggcc ggcagcaccc cttgtaatgg cgtggaaggc 960
ttcaactgct acttcccact gcagtcctac ggcttccagc ctacaaacgg cgtgggctac 1020
cagccttata gagtggtggt gctgagcttc gaactgctgc atgcccctgc tacagtgtgc 1080
ggccccaaga agtgataagc ggccgc 1106
<210> 28
<211> 359
<212> PRT
<213> Artificial Sequence
<220>
<223> HBSAg-(EAAAK)3-RBD
<400> 28
Met Asn Phe Leu Gly Gly Thr Thr Val Cys Leu Gly Gln Asn Ser Gln
1 5 10 15
Ser Pro Thr Ser Asn His Ser Pro Thr Ser Cys Pro Pro Thr Cys Pro
20 25 30
Gly Tyr Arg Trp Met Cys Leu Arg Arg Phe Ile Ile Phe Leu Phe Ile
35 40 45
Leu Leu Leu Cys Leu Ile Phe Leu Leu Val Leu Leu Asp Tyr Gln Gly
50 55 60
Met Leu Pro Val Cys Pro Leu Ile Pro Gly Ser Ser Thr Thr Ser Thr
65 70 75 80
Gly Pro Cys Arg Thr Cys Thr Thr Pro Ala Gln Gly Thr Ser Met Tyr
85 90 95
Pro Ser Cys Cys Cys Thr Lys Pro Ser Asp Gly Asn Cys Thr Cys Ile
100 105 110
Pro Ile Pro Ser Ser Trp Ala Phe Gly Lys Phe Leu Trp Glu Trp Ala
115 120 125
Ser Ala Arg Phe Ser Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu
130 135 140
Ala Ala Ala Lys Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro
145 150 155 160
Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg
165 170 175
Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val
180 185 190
Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys
195 200 205
Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn
210 215 220
Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile
225 230 235 240
Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro
245 250 255
Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp
260 265 270
Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys
275 280 285
Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln
290 295 300
Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe
305 310 315 320
Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln
325 330 335
Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala
340 345 350
Thr Val Cys Gly Pro Lys Lys
355
<210> 29
<211> 1418
<212> DNA
<213> Artificial Sequence
<220>
<223> HEV-GS15-RBD
<400> 29
gagctcatga ttgcactgac cctgtttaat ctggcagata ccctgctggg tggtctgccg 60
accgaactga ttagcagtgc cggtggtcag ctgttttata gccgtccggt tgttagcgca 120
aatggtgaac cgaccgttaa actgtatacc agcgttgaaa atgcacagca ggataaaggt 180
attgcaattc cgcatgatat tgatctgggt gaaagccgtg ttgtgattca ggattatgat 240
aatcagcatg aacaggatcg tccgaccccg agtccggcac cgagccgtcc gtttagcgtt 300
ctgcgtgcaa atgatgttct gtggctgagc ctgaccgcag cagaatatga tcagagcacc 360
tatggtagca gcaccggtcc ggtttatgtt agcgatagcg ttaccctggt taatgttgca 420
accggtgcac aggcagttgc acgtagcctg gattggacca aagtgaccct ggatggtcgt 480
ccgctgagca ccattcagca gtatagcaaa accttttttg ttctgccgct gcgtggtaaa 540
ctgagctttt gggaagcagg caccaccaaa gcaggttatc cgtataacta taataccacc 600
gcaagcgatc agctgctggt tgaaaacgca gcaggtcatc gtgttgcaat tagcacctat 660
accaccagtc tgggtgcagg tccggttagc attagcgcag ttgcagttct ggcaccgcat 720
agcgcaggtg gaggaggttc tggaggcggt ggaagtggtg gcggaggtag cagagtccaa 780
ccaacagaat ctattgttag atttcctaat attacaaact tgtgcccttt tggtgaagtt 840
tttaacgcca ccagatttgc atctgtttat gcttggaaca ggaagagaat cagcaactgt 900
gttgctgatt attctgtcct atataattcc gcatcatttt ccacttttaa gtgttatgga 960
gtgtctccta ctaaattaaa tgatctctgc tttactaatg tctatgcaga ttcatttgta 1020
attagaggtg atgaagtcag acaaatcgct ccagggcaaa ctggaaagat tgctgattat 1080
aattataaat taccagatga ttttacaggc tgcgttatag cttggaattc taacaatctt 1140
gattctaagg ttggtggtaa ttataattac ctgtatagat tgtttaggaa gtctaatctc 1200
aaaccttttg agagagatat ttcaactgaa atctatcagg ccggtagcac accttgtaat 1260
ggtgttgaag gttttaattg ttactttcct ttacaatcat atggtttcca acccactaat 1320
ggtgttggtt accaaccata cagagtagta gtactttctt ttgaacttct acatgcacca 1380
gcaactgttt gtggacctaa aaagtgataa gcggccgc 1418
<210> 30
<211> 1418
<212> DNA
<213> Artificial Sequence
<220>
<223> HEV-GS15-RBD nucleic acid sequence optimized for E.coli
expression
<400> 30
gagctcatga ttgcactgac cctgtttaat ctggcagata ccctgttagg tggtctgccg 60
accgaactga ttagcagtgc cggtggtcag ctgttttata gccgtccggt tgttagcgca 120
aatggtgaac cgaccgttaa actgtatacc agcgttgaaa atgcacagca ggataaaggt 180
attgcaattc cgcatgatat tgatctgggt gaaagccgtg ttgtgattca ggattatgat 240
aatcagcatg aacaggatcg tccgacaccg agtccggcac cgagccgtcc gtttagcgtt 300
ctgcgtgcaa atgatgttct gtggctgagc ctgaccgcag cagaatatga tcagagcacc 360
tatggtagca gcaccggtcc ggtttatgtt agcgatagcg ttaccctggt taatgttgca 420
accggtgcac aggcagttgc acgtagcctg gattggacca aagtgaccct ggatggtcgt 480
ccgctgagca ccattcagca gtatagcaaa accttttttg ttctgccgct gcgtggtaaa 540
ctgagctttt gggaagcagg caccaccaaa gcaggttatc cgtataacta taataccacc 600
gcaagcgatc agctgctggt tgaaaacgca gcaggtcatc gtgttgcaat tagcacctat 660
accaccagtt taggtgcagg tccggttagc attagcgcag ttgcagttct ggcaccgcat 720
tcagccggtg gtggtggtag cggtggtggc ggttcaggtg gcggtggttc acgtgttcag 780
ccgacagaaa gcattgttcg ttttccgaat atcaccaatc tgtgtccgtt tggcgaagtt 840
tttaatgcaa cccgttttgc aagcgtttat gcctggaatc gtaaacgtat tagcaattgc 900
gttgccgatt atagcgtgct gtataatagc gcaagcttta gcacctttaa atgctatggt 960
gttagcccga ccaaactgaa tgatctgtgt tttaccaatg tgtatgccga tagctttgtg 1020
attcgtggtg atgaagttcg tcagattgca ccgggtcaga ccggtaaaat tgcagattat 1080
aactacaaac tgccggatga ttttacgggt tgtgttattg catggaatag caataacctg 1140
gatagcaaag ttggtggcaa ctataactat ctgtatcgcc tgtttcgtaa gagcaatctg 1200
aaaccgtttg aacgtgatat tagcaccgaa atttatcagg caggtagcac cccgtgcaat 1260
ggtgttgaag gttttaattg ttattttccg ctgcagagct atggttttca gcctaccaat 1320
ggtgtgggtt atcagccgta tcgtgttgtt gttctgtcat ttgaactgct gcatgcaccg 1380
gcaaccgttt gtggtccgaa aaaatgataa gcggccgc 1418
<210> 31
<211> 466
<212> PRT
<213> Artificial Sequence
<220>
<223> HEV-GS15-RBD
<400> 31
Met Ile Ala Leu Thr Leu Phe Asn Leu Ala Asp Thr Leu Leu Gly Gly
1 5 10 15
Leu Pro Thr Glu Leu Ile Ser Ser Ala Gly Gly Gln Leu Phe Tyr Ser
20 25 30
Arg Pro Val Val Ser Ala Asn Gly Glu Pro Thr Val Lys Leu Tyr Thr
35 40 45
Ser Val Glu Asn Ala Gln Gln Asp Lys Gly Ile Ala Ile Pro His Asp
50 55 60
Ile Asp Leu Gly Glu Ser Arg Val Val Ile Gln Asp Tyr Asp Asn Gln
65 70 75 80
His Glu Gln Asp Arg Pro Thr Pro Ser Pro Ala Pro Ser Arg Pro Phe
85 90 95
Ser Val Leu Arg Ala Asn Asp Val Leu Trp Leu Ser Leu Thr Ala Ala
100 105 110
Glu Tyr Asp Gln Ser Thr Tyr Gly Ser Ser Thr Gly Pro Val Tyr Val
115 120 125
Ser Asp Ser Val Thr Leu Val Asn Val Ala Thr Gly Ala Gln Ala Val
130 135 140
Ala Arg Ser Leu Asp Trp Thr Lys Val Thr Leu Asp Gly Arg Pro Leu
145 150 155 160
Ser Thr Ile Gln Gln Tyr Ser Lys Thr Phe Phe Val Leu Pro Leu Arg
165 170 175
Gly Lys Leu Ser Phe Trp Glu Ala Gly Thr Thr Lys Ala Gly Tyr Pro
180 185 190
Tyr Asn Tyr Asn Thr Thr Ala Ser Asp Gln Leu Leu Val Glu Asn Ala
195 200 205
Ala Gly His Arg Val Ala Ile Ser Thr Tyr Thr Thr Ser Leu Gly Ala
210 215 220
Gly Pro Val Ser Ile Ser Ala Val Ala Val Leu Ala Pro His Ser Ala
225 230 235 240
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Arg
245 250 255
Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu
260 265 270
Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr
275 280 285
Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val
290 295 300
Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser
305 310 315 320
Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser
325 330 335
Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr
340 345 350
Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly
355 360 365
Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly
370 375 380
Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro
385 390 395 400
Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro
405 410 415
Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr
420 425 430
Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val
435 440 445
Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro
450 455 460
Lys Lys
465
<210> 32
<211> 4566
<212> DNA
<213> Artificial Sequence
<220>
<223> HBSAg-(EAAAK)3-full-length SARS-CoV-2 spike protein nucleic acid
sequence human codon optimised
<400> 32
aagcttgccg ccaccatgga gaacatcaca tcaggattcc taggacccct gctcgtgtta 60
caggcggggt ttttcttgtt gacaagaatc ctcacaatac cacagagtct agactcgtgg 120
tggacttctc tcaattttct agggggatca cccgtgtgtc tgggccaaaa ttcgcagtcc 180
ccaacctcca atcactcacc aacctcttgt cctccaattt gtcctggcta tcgctggatg 240
tgtctgcggc gttttatcat attcctcttc atcctgctgc tatgcctcat cttcttgttg 300
gttcttctgg actaccaggg tatgttgccc gtttgtcctc taattccagg atcaacaact 360
accaacacgg gaccatgcaa gacctgcacg actcctgctc aaggaaactc tatgtttccc 420
tcttgttgct gtacaaaacc taccgacgga aactgcactt gtattcccat cccatcatcc 480
tgggctttcg caaaatacct atgggagtgg gcctcagtcc gtttctcctg gctcagttta 540
ctagtgccat ttgttcagtg gttcgtaggg ctttccccca ctgtttggct ttccgctata 600
tggatgatgt ggtattgggg gccaagtctg tacagcatcg tgagtccctt tatacctcta 660
ttaccaattt tcttttgtct ttgggtatac attgaggctg ccgcaaagga agccgcagct 720
aaagaggcag ctgccaagtt cgtgttcctg gttctgctgc ccctggtgtc tagccagtgc 780
gtgaacctga ccaccagaac acagctgcct ccagcctaca ccaacagctt caccagaggc 840
gtgtactacc ccgacaaggt gttccggtcc tccgtgctgc attctaccca ggacctgttc 900
ctgcctttct tctccaacgt gacctggttc cacgccatcc atgtgtctgg caccaacggc 960
accaagagat tcgacaaccc cgtgctgcct ttcaacgacg gggtgtactt tgcctccacc 1020
gagaagtcca acatcatcag aggctggatc ttcggcacaa ccctggacag caagacccag 1080
agcctgctga tcgtgaacaa cgccaccaac gtggtcatca aagtgtgcga gttccagttc 1140
tgcaacgacc ccttcctggg cgtctactac cacaagaaca acaagtcctg gatggaatcc 1200
gagttccggg tgtactcctc cgccaacaac tgcaccttcg aatacgtgtc ccagcctttc 1260
ctgatggacc tggaaggcaa gcagggcaac ttcaagaacc tgcgcgagtt cgtgttcaag 1320
aacatcgacg gctacttcaa gatctactcc aagcacaccc ctatcaacct cgtgcgggat 1380
ctgcctcagg gcttctctgc tctggaaccc ctggtggatc tgcccatcgg catcaacatc 1440
acccggtttc agaccctgct ggccctgcac cggtcttatt tgacccctgg cgactcctct 1500
tctggctgga ctgctggcgc cgctgcttac tatgtgggct acctgcagcc tcggaccttt 1560
ctgctgaagt acaacgagaa tggcaccatc accgacgccg tggactgtgc tctggatcct 1620
ctgtccgaga caaagtgcac cctgaagtcc ttcaccgtgg aaaagggcat ctaccagacc 1680
tccaacttcc gggtgcagcc caccgagtct atcgtgcggt tccctaacat caccaacctg 1740
tgtcctttcg gcgaggtgtt caatgccacc agattcgcct ctgtgtacgc ctggaaccgg 1800
aagcggatct ctaactgcgt ggccgactac agcgtgctgt acaactccgc ctccttcagc 1860
accttcaagt gctacggcgt gtcccctaca aagctgaacg acctgtgctt cacaaacgtg 1920
tacgccgaca gcttcgtgat ccggggagat gaagtgcggc agatcgctcc tggacagacc 1980
ggcaagatcg ccgattacaa ctacaagctg cccgacgact tcaccggctg tgtgatcgct 2040
tggaactcca acaacctgga ctccaaagtc ggcggcaact acaactacct gtaccggctg 2100
ttccggaagt ctaacctgaa gcctttcgag cgggacatca gcaccgagat ctaccaggct 2160
ggcagcaccc cttgtaacgg cgtggaaggc ttcaactgct acttcccact gcagtcctac 2220
ggctttcagc ctaccaatgg cgtgggctat cagccctaca gagtggtggt gctgtccttc 2280
gagctgctgc atgctcctgc taccgtgtgc ggccctaaga aatctaccaa cctggtcaag 2340
aacaaatgcg tgaacttcaa cttcaacggc ctgaccggca ccggcgtgct gacagagtcc 2400
aacaagaagt tcctgccatt ccagcagttc ggccgggata tcgccgatac cacagatgcc 2460
gtcagggacc ctcagacact ggaaatcctg gacatcaccc cttgctcctt cggcggagtg 2520
tctgtgatca ccccaggcac caacacctct aaccaggtgg ccgtgctgta tcaggacgtg 2580
aactgtaccg aggtgcccgt ggctatccat gccgatcagc tgacccctac atggcgcgtg 2640
tactccaccg gctctaacgt gttccagaca agagctggct gtctgatcgg cgctgagcac 2700
gtgaacaatt cctacgagtg cgacatcccc atcggagccg gaatctgcgc ctcttatcag 2760
acccagacca actctcccag acgggccaga tctgtggcca gccagtctat cattgcttac 2820
accatgagcc tgggcgccga gaactctgtg gcctacagca acaactctat cgctatcccc 2880
accaacttca ccatctccgt gaccacagag atcctgccag tgtccatgac caagaccagc 2940
gtggactgca ccatgtacat ctgcggcgac tctaccgagt gctccaacct gctgctccag 3000
tacggctcct tctgcaccca gctgaataga gccctgaccg gaatcgccgt ggaacaggac 3060
aagaacaccc aagaggtgtt cgcccaagtg aagcagatct acaagacccc tcctatcaag 3120
gacttcggcg gcttcaattt ctcccagatt ctgcccgatc ctagcaagcc ctccaagcgg 3180
tctttcatcg aggacctgct gttcaacaaa gtgacactgg ccgacgccgg cttcatcaag 3240
cagtacggcg actgtctggg cgacattgcc gctagggatc tgatctgcgc ccagaagttt 3300
aacggactga cagtgctgcc tcctctgctg accgatgaga tgatcgccca gtacacctcc 3360
gcactgctgg ctggcacaat cacctctgga tggacatttg gcgctggcgc tgctctgcaa 3420
atcccattcg ctatgcaaat ggcctaccgg ttcaacggca tcggcgtgac ccagaatgtg 3480
ctgtacgaga accagaagct gatcgccaac cagttcaaca gcgccatcgg aaagatccag 3540
gacagcctgt ccagcaccgc ttctgccctg ggaaagctgc aggatgtggt caaccagaac 3600
gctcaggccc tgaacaccct cgtgaagcag ctgtctagca acttcggcgc catctcctct 3660
gtgctgaacg atatcctgag ccggctggac aaggtggaag ccgaggtgca gatcgacaga 3720
ctgatcaccg gacggctgca gtccctgcag acctatgtta cccagcagct gatccgggct 3780
gccgagatta gagcctctgc caatctggcc gcaaccaaga tgtctgagtg tgtgctggga 3840
cagtccaaga gagtggactt ctgcggcaag ggctaccacc tgatgagctt ccctcagtct 3900
gctcctcacg gcgtggtgtt tctgcacgtg acctacgtgc ccgctcaaga gaagaacttt 3960
accaccgctc ctgccatctg ccacgacggc aaggctcact ttcctagaga aggcgtgttc 4020
gtgtctaacg gcacccattg gttcgtgaca cagcggaact tctacgagcc ccagatcatc 4080
accaccgaca acaccttcgt gtccggcaac tgcgacgtcg tgatcggaat tgtgaacaat 4140
accgtgtacg accctctgca gcccgagctg gactccttca aagaggaact ggacaagtac 4200
tttaagaacc acacaagccc cgacgtggac ctgggagaca tctctggcat caacgcctcc 4260
gtggtcaaca tccagaaaga gatcgaccgg ctgaacgagg tggccaagaa tctgaacgag 4320
tccctgatcg acctgcaaga actggggaag tacgagcagt acatcaagtg gccctggtac 4380
atctggctgg gctttatcgc tggcctgatc gctatcgtga tggtcacaat catgctgtgc 4440
tgtatgacct cctgttgctc ctgcctgaag ggctgctgct cttgcggctc ttgctgcaag 4500
ttcgacgagg acgactctga gcccgtgctg aaaggcgtga agctgcacta tacctgatga 4560
ctcgag 4566
<210> 33
<211> 1513
<212> PRT
<213> Artificial Sequence
<220>
<223> HBSAg-(EAAAK)3-full-length SARS-CoV-2 spike protein
<400> 33
Met Glu Asn Ile Thr Ser Gly Phe Leu Gly Pro Leu Leu Val Leu Gln
1 5 10 15
Ala Gly Phe Phe Leu Leu Thr Arg Ile Leu Thr Ile Pro Gln Ser Leu
20 25 30
Asp Ser Trp Trp Thr Ser Leu Asn Phe Leu Gly Gly Ser Pro Val Cys
35 40 45
Leu Gly Gln Asn Ser Gln Ser Pro Thr Ser Asn His Ser Pro Thr Ser
50 55 60
Cys Pro Pro Ile Cys Pro Gly Tyr Arg Trp Met Cys Leu Arg Arg Phe
65 70 75 80
Ile Ile Phe Leu Phe Ile Leu Leu Leu Cys Leu Ile Phe Leu Leu Val
85 90 95
Leu Leu Asp Tyr Gln Gly Met Leu Pro Val Cys Pro Leu Ile Pro Gly
100 105 110
Ser Thr Thr Thr Asn Thr Gly Pro Cys Lys Thr Cys Thr Thr Pro Ala
115 120 125
Gln Gly Asn Ser Met Phe Pro Ser Cys Cys Cys Thr Lys Pro Thr Asp
130 135 140
Gly Asn Cys Thr Cys Ile Pro Ile Pro Ser Ser Trp Ala Phe Ala Lys
145 150 155 160
Tyr Leu Trp Glu Trp Ala Ser Val Arg Phe Ser Trp Leu Ser Leu Leu
165 170 175
Val Pro Phe Val Gln Trp Phe Val Gly Leu Ser Pro Thr Val Trp Leu
180 185 190
Ser Ala Ile Trp Met Met Trp Tyr Trp Gly Pro Ser Leu Tyr Ser Ile
195 200 205
Val Ser Pro Phe Ile Pro Leu Leu Pro Ile Phe Phe Cys Leu Trp Val
210 215 220
Tyr Ile Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala
225 230 235 240
Lys Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
245 250 255
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
260 265 270
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
275 280 285
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
290 295 300
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
305 310 315 320
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
325 330 335
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
340 345 350
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
355 360 365
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
370 375 380
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
385 390 395 400
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
405 410 415
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
420 425 430
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
435 440 445
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
450 455 460
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
465 470 475 480
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
485 490 495
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
500 505 510
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
515 520 525
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
530 535 540
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
545 550 555 560
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
565 570 575
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
580 585 590
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
595 600 605
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
610 615 620
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
625 630 635 640
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
645 650 655
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
660 665 670
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
675 680 685
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
690 695 700
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
705 710 715 720
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
725 730 735
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
740 745 750
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
755 760 765
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
770 775 780
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
785 790 795 800
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
805 810 815
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
820 825 830
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
835 840 845
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
850 855 860
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
865 870 875 880
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
885 890 895
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
900 905 910
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala
915 920 925
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
930 935 940
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
945 950 955 960
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
965 970 975
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
980 985 990
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
995 1000 1005
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala
1010 1015 1020
Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly
1025 1030 1035
Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser
1040 1045 1050
Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu
1055 1060 1065
Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp
1070 1075 1080
Ile Ala Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu
1085 1090 1095
Thr Val Leu Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr
1100 1105 1110
Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe
1115 1120 1125
Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala
1130 1135 1140
Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val Leu Tyr Glu
1145 1150 1155
Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile Gly Lys
1160 1165 1170
Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys Leu
1175 1180 1185
Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val
1190 1195 1200
Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn
1205 1210 1215
Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln Ile
1220 1225 1230
Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
1235 1240 1245
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
1250 1255 1260
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
1265 1270 1275
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1280 1285 1290
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
1295 1300 1305
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His
1310 1315 1320
Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn
1325 1330 1335
Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln
1340 1345 1350
Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val
1355 1360 1365
Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1370 1375 1380
Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn
1385 1390 1395
His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn
1400 1405 1410
Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu
1415 1420 1425
Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu
1430 1435 1440
Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu
1445 1450 1455
Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met
1460 1465 1470
Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1475 1480 1485
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro
1490 1495 1500
Val Leu Lys Gly Val Lys Leu His Tyr Thr
1505 1510
Claims (28)
- 서열식별번호: 1과 적어도 90% 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 코딩하며, 재조합 발현에 대해 최적화된 단리된 폴리뉴클레오티드.
- 제1항에 있어서,
(a) 에스케리키아 콜라이;
(b) 효모, 바람직하게는 코마가타엘라 또는 사카로미세스; 및/또는
(c) 포유동물 세포, 바람직하게는 인간 세포
로부터 선택되는 숙주 세포에서의 발현에 대해 최적화된 폴리뉴클레오티드. - 제1항 또는 제2항에 있어서, 하나 이상의 시스-작용성 서열 모티프가 생략되고, 상기 하나 이상의 시스-작용성 서열 모티프가 독립적으로
(a) 내부 TATA-박스;
(b) chi-부위;
(c) 리보솜 진입 부위;
(d) 서열의 AT-풍부 및/또는 GC-풍부 스트레치;
(e) RNA 불안정성 모티프;
(f) 반복 서열 및/또는 RNA 2차 구조;
(g) 잠재 스플라이스 공여자 부위;
(h) 잠재 스플라이스 수용 부위; 및/또는
(i) (a) 내지 (i)의 임의의 조합
으로부터 선택되는 것인 폴리뉴클레오티드. - 제1항 내지 제3항 중 어느 한 항에 있어서, 숙주 세포 게놈 내로 통합되는 폴리뉴클레오티드.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 적어도 약 0.80, 바람직하게는 적어도 약 0.9, 보다 바람직하게는 적어도 약 0.93의 코돈 적응 지수 (CAI)를 갖는 폴리뉴클레오티드.
- 제1항 내지 제5항 중 어느 한 항에 있어서,
(a) 서열식별번호: 2에 대해 적어도 90% 동일성;
(b) 서열식별번호: 3에 대해 적어도 90% 동일성;
(c) 서열식별번호: 4에 대해 적어도 90% 동일성;
(d) 서열식별번호: 5에 대해 적어도 90% 동일성;
(e) 서열식별번호: 6에 대해 적어도 90% 동일성;
(f) 서열식별번호: 7에 대해 적어도 90% 동일성;
(g) 서열식별번호: 8에 대해 적어도 90% 동일성
(h) 서열식별번호: 13에 대해 적어도 90% 동일성
(i) 서열식별번호: 14에 대해 적어도 90% 서열 동일성,
(j) 서열식별번호: 26에 대해 적어도 90% 동일성
(k) 서열식별번호: 27에 대해 적어도 90% 동일성,
(l) 서열식별번호: 29에 대해 적어도 90% 동일성;
(m) 서열식별번호: 30에 대해 적어도 90% 동일성; 또는
(n) 서열식별번호: 32에 대해 적어도 90% 동일성
을 갖는 핵산 서열을 포함하거나 또는 그로 이루어진 폴리뉴클레오티드. - 제1항 내지 제6항 중 어느 한 항에 있어서, 코딩된 스파이크 단백질 또는 그의 단편이
(a) 천연 2019-nCoV 스파이크 단백질에 존재하는 입체형태적 에피토프를 보유하고/거나;
(b) 핵산 또는 코딩된 스파이크 단백질 또는 그의 단편이 대상체에게 투여될 때 스파이크 단백질 또는 그의 단편에 특이적인 중화 항체의 생성을 유발하고/거나;
(c) 바람직하게는 서열식별번호: 15와 적어도 90% 동일성을 갖는 2019-nCoV 스파이크 단백질의 수용체-결합 도메인 (RBD)을 포함하거나 또는 그로 이루어진 것
인 폴리뉴클레오티드. - 프로모터에 작동가능하게 연결된, 제1항 내지 제7항 중 어느 한 항의 폴리뉴클레오티드를 포함하는 발현 구축물.
- 서열식별번호: 1과 적어도 90% 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 포함하고, 여기서 임의로 상기 단편은 바람직하게는 서열식별번호: 15와 적어도 90% 동일성을 갖는 2019-nCoV 스파이크 단백질의 수용체-결합 도메인 (RBD)을 포함하거나 또는 그로 이루어진 것인 백신 조성물.
- 제9항에 있어서, 대상체에게 투여되었을 때 스파이크 단백질 또는 그의 단편에 대해 특이적인 중화 항체의 생성을 유발하는 조성물.
- 서열식별번호: 1과 적어도 90% 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 발현하며, 여기서 임의로 상기 단편은 바람직하게는 서열식별번호: 15와 적어도 90% 동일성을 갖는 2019-nCoV 스파이크 단백질의 수용체-결합 도메인 (RBD)을 포함하거나 또는 그로 이루어진 것인 바이러스 벡터, RNA 백신 또는 DNA 플라스미드.
- 제11항에 있어서, 신호 펩티드를 추가로 포함하는, 스파이크 단백질 또는 그의 단편을 발현하는 바이러스 벡터, RNA 백신 또는 DNA 플라스미드.
- 제12항에 있어서, 신호 펩티드가 인간 세포로부터의 분비를 지시하는 것인 바이러스 벡터, RNA 백신 또는 DNA 플라스미드.
- 제11항 내지 제13항 중 어느 한 항에 있어서, 하나 이상의 추가의 항원 또는 그의 단편, 바람직하게는 2019-nCoV로부터의 하나 이상의 추가의 항원 또는 그의 단편을 추가로 발현하는 바이러스 벡터, RNA 백신 또는 DNA 플라스미드.
- 제14항에 있어서, 스파이크 단백질 또는 그의 단편 및 하나 이상의 추가의 항원 또는 그의 단편이
(a) 융합 단백질로서; 또는
(b) 조합하여 사용하기 위한 개별 바이러스 벡터, RNA 백신 또는 DNA 플라스미드에서
발현되는 것인 바이러스 벡터, RNA 백신 또는 DNA 플라스미드. - 제11항 내지 제15항 중 어느 한 항에 있어서, 제1항 내지 제7항 중 어느 한 항에 정의된 바와 같은 하나 이상의 폴리뉴클레오티드 또는 제8항의 발현 구축물을 포함하는 바이러스 벡터, RNA 백신 또는 DNA 플라스미드.
- 서열식별번호: 1과 적어도 90% 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 포함하고, 여기서 임의로 상기 단편은 바람직하게는 서열식별번호: 15와 적어도 90% 동일성을 갖는 2019-nCoV 스파이크 단백질의 수용체-결합 도메인 (RBD)을 포함하거나 또는 그로 이루어진 것인 융합 단백질.
- 제17항에 있어서,
(a) B형 간염 표면 항원, 또는 상기 B형 간염 표면 항원과 공통 항원 교차-반응성을 갖는 그의 단편;
(b) HPV 18 L1 단백질, 또는 상기 HPV 18 L1 단백질과 공통 항원 교차-반응성을 갖는 그의 단편;
(c) E형 간염 P239 단백질, 또는 상기 E형 간염 P239 단백질과 공통 항원 교차-반응성을 갖는 그의 단편; 및/또는
(d) HPV 16 L1 단백질, 또는 상기 HPV 16 L1 단백질과 공통 항원 교차-반응성을 갖는 그의 단편
을 추가로 포함하는 융합 단백질이며;
임의로:
(i) 융합 단백질이 서열식별번호: 3, 5, 6, 8, 26, 27, 29, 30, 또는 32 중 어느 하나와 적어도 90% 동일성을 갖는 핵산 서열을 포함하거나 또는 그로 이루어진 폴리뉴클레오티드에 의해 코딩되고/거나;
(ii) 융합 단백질이 서열식별번호: 9, 10, 11, 12, 28, 31 또는 33 중 어느 하나와 적어도 90% 동일성을 갖는 아미노산 서열을 포함하거나 또는 그로 이루어진 것인
융합 단백질. - 서열식별번호: 1과 적어도 90% 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 포함하며, 여기서 임의로 상기 단편은 바람직하게는 서열식별번호: 15와 적어도 90% 동일성을 갖는 2019-nCoV 스파이크 단백질의 수용체-결합 도메인 (RBD)을 포함하거나 또는 그로 이루어진 것인 바이러스-유사 입자 (VLP)이며;
여기서 임의로 상기 VLP는 제17항 또는 제18항에 정의된 바와 같은 융합 단백질을 포함하거나 또는 그로 이루어진 것인
바이러스-유사 입자 (VLP). - 제1항에 정의된 바와 같은 2091-nCoV 스파이크 단백질 항원 또는 그의 단편에 특이적으로 결합하는 항체 또는 그의 결합 단편.
- 제20항에 있어서, 모노클로날 또는 폴리클로날 항체인 항체 또는 그의 결합 단편.
- 제20항 또는 제21항에 있어서, Fab, F(ab')2, Fv, scFv, Fd 또는 dAb인 항체 또는 그의 결합 단편.
- 제1항에 정의된 바와 같은 2019-nCoV 스파이크 단백질 또는 그의 단편에 특이적으로 결합하는 올리고뉴클레오티드 압타머.
- 제11항 내지 제16항 중 어느 한 항의 바이러스 벡터, 및/또는 RNA 백신 및/또는 DNA 플라스미드를 포함하는 백신 조성물.
- 2019-nCoV 감염의 치료 및/또는 예방에 사용하기 위한, 제1항 내지 제7항 중 어느 한 항의 폴리뉴클레오티드, 및/또는 제8항의 발현 구축물, 및/또는 제9항, 제10항 및/또는 제24항 중 어느 한 항의 백신 조성물, 및/또는 제11항 내지 제16항 중 어느 한 항의 바이러스 벡터 및/또는 RNA 백신 및/또는 DNA 플라스미드, 및/또는 제19항의 바이러스-유사 입자, 및/또는 제17항 또는 제18항의 융합 단백질, 및/또는 제20항 내지 제22항 중 어느 한 항의 항체 및/또는 제23항의 압타머.
- 2019-nCoV 감염의 예방 및/또는 치료를 위한 의약의 제조에서의, 제1항 내지 제7항 중 어느 한 항의 폴리뉴클레오티드, 및/또는 제8항의 발현 구축물, 및/또는 제9항, 제10항 및/또는 제24항 중 어느 한 항의 백신 조성물, 및/또는 제11항 내지 제16항 중 어느 한 항의 바이러스 벡터 및/또는 RNA 백신 및/또는 DNA 플라스미드, 및/또는 제19항의 바이러스-유사 입자, 및/또는 제17항 또는 제18항의 융합 단백질, 및/또는 제20항 내지 제22항 중 어느 한 항의 항체, 및/또는 제23항의 압타머의 용도.
- 제1항 내지 제7항 중 어느 한 항에 정의된 바와 같은 폴리뉴클레오티드를 숙주 세포에서 발현시키는 단계, 및 임의로 스파이크 단백질 또는 단편을 정제하는 단계를 포함하는, 서열식별번호: 1과 적어도 90% 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질 또는 그의 단편을 생산하는 방법.
- 제27항에 있어서, 상기 스파이크 단백질 또는 그의 단편을 제약상 허용되는 담체 또는 희석제와 함께 제제화하는 것을 추가로 포함하는 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB2002166.3 | 2020-02-17 | ||
GB2002166.3A GB2594683A (en) | 2020-02-17 | 2020-02-17 | Vaccine |
PCT/GB2021/050383 WO2021165667A1 (en) | 2020-02-17 | 2021-02-17 | 2019-ncov (sars-cov-2) vaccine |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230015310A true KR20230015310A (ko) | 2023-01-31 |
Family
ID=69956492
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227032226A KR20230015310A (ko) | 2020-02-17 | 2021-02-17 | 2019-ncov (sars-cov-2) 백신 |
Country Status (15)
Country | Link |
---|---|
US (1) | US20240108715A1 (ko) |
EP (1) | EP4106808A1 (ko) |
JP (1) | JP2023514348A (ko) |
KR (1) | KR20230015310A (ko) |
CN (1) | CN116056764A (ko) |
AR (1) | AR121361A1 (ko) |
AU (1) | AU2021223894A1 (ko) |
BR (1) | BR112022016346A2 (ko) |
CA (1) | CA3168153A1 (ko) |
CO (1) | CO2022013121A2 (ko) |
GB (1) | GB2594683A (ko) |
IL (1) | IL295708A (ko) |
MX (1) | MX2022010027A (ko) |
TW (1) | TW202140519A (ko) |
WO (1) | WO2021165667A1 (ko) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115297868B (zh) | 2020-02-21 | 2024-04-12 | 联合治疗公司 | 用于编码核糖核酸的器官保护性表达和调节的组合物及方法 |
GB202307565D0 (en) | 2020-04-22 | 2023-07-05 | BioNTech SE | Coronavirus vaccine |
CN113684219B (zh) * | 2020-05-18 | 2022-12-23 | 康希诺(上海)生物科技有限公司 | mRNA或mRNA组合物及其制备方法和应用 |
CN115315442B (zh) * | 2020-05-27 | 2024-02-13 | 上海济煜医药科技有限公司 | Sars-cov-2抗体及其应用 |
CN111620952A (zh) * | 2020-06-17 | 2020-09-04 | 苏州米迪生物技术有限公司 | 基于嵌合型病毒样颗粒的新型冠状病毒疫苗 |
CN113322271A (zh) * | 2020-06-24 | 2021-08-31 | 西南交通大学 | 基于酵母表面展示系统的covid-19亚单位疫苗 |
CN113150082B (zh) * | 2020-12-29 | 2022-11-08 | 中国医学科学院医学生物学研究所 | 呈递sars-cov-2的rbm不同区域肽表位的病毒样颗粒疫苗构建方法 |
WO2023039252A2 (en) * | 2021-09-13 | 2023-03-16 | The Johns Hopkins University | Exosomal nucleic acid vaccine composition for protection against sars-cov-2 infection and disease |
US11878055B1 (en) | 2022-06-26 | 2024-01-23 | BioNTech SE | Coronavirus vaccine |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4737462A (en) | 1982-10-19 | 1988-04-12 | Cetus Corporation | Structural genes, plasmids and transformed cells for producing cysteine depleted muteins of interferon-β |
US4518584A (en) | 1983-04-15 | 1985-05-21 | Cetus Corporation | Human recombinant interleukin-2 muteins |
US5223409A (en) | 1988-09-02 | 1993-06-29 | Protein Engineering Corp. | Directed evolution of novel binding proteins |
IL99552A0 (en) | 1990-09-28 | 1992-08-18 | Ixsys Inc | Compositions containing procaryotic cells,a kit for the preparation of vectors useful for the coexpression of two or more dna sequences and methods for the use thereof |
WO2005056781A1 (fr) * | 2003-12-02 | 2005-06-23 | Institut Pasteur | Utilisation des proteines et des peptides codes par le genome d'une nouvelle souche de coronavirus associe au sras. |
GB201108879D0 (en) | 2011-05-25 | 2011-07-06 | Isis Innovation | Vector |
-
2020
- 2020-02-17 GB GB2002166.3A patent/GB2594683A/en not_active Withdrawn
-
2021
- 2021-02-17 CA CA3168153A patent/CA3168153A1/en active Pending
- 2021-02-17 AU AU2021223894A patent/AU2021223894A1/en active Pending
- 2021-02-17 EP EP21708308.8A patent/EP4106808A1/en active Pending
- 2021-02-17 KR KR1020227032226A patent/KR20230015310A/ko unknown
- 2021-02-17 TW TW110105414A patent/TW202140519A/zh unknown
- 2021-02-17 WO PCT/GB2021/050383 patent/WO2021165667A1/en unknown
- 2021-02-17 BR BR112022016346A patent/BR112022016346A2/pt unknown
- 2021-02-17 MX MX2022010027A patent/MX2022010027A/es unknown
- 2021-02-17 US US17/800,472 patent/US20240108715A1/en active Pending
- 2021-02-17 IL IL295708A patent/IL295708A/en unknown
- 2021-02-17 AR ARP210100415A patent/AR121361A1/es unknown
- 2021-02-17 JP JP2022549524A patent/JP2023514348A/ja active Pending
- 2021-02-17 CN CN202180027987.4A patent/CN116056764A/zh active Pending
-
2022
- 2022-09-15 CO CONC2022/0013121A patent/CO2022013121A2/es unknown
Also Published As
Publication number | Publication date |
---|---|
AU2021223894A1 (en) | 2022-09-15 |
CA3168153A1 (en) | 2021-08-26 |
GB2594683A (en) | 2021-11-10 |
EP4106808A1 (en) | 2022-12-28 |
CN116056764A (zh) | 2023-05-02 |
IL295708A (en) | 2022-10-01 |
MX2022010027A (es) | 2023-01-24 |
BR112022016346A2 (pt) | 2022-11-16 |
US20240108715A1 (en) | 2024-04-04 |
TW202140519A (zh) | 2021-11-01 |
CO2022013121A2 (es) | 2023-02-27 |
JP2023514348A (ja) | 2023-04-05 |
WO2021165667A1 (en) | 2021-08-26 |
GB202002166D0 (en) | 2020-04-01 |
AR121361A1 (es) | 2022-06-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20240108715A1 (en) | 2019-ncov (sars-cov-2) vaccine | |
US20230256085A1 (en) | Combination vaccine | |
JP6840718B2 (ja) | 安定化された可溶性融合前rsv fポリペプチド | |
KR102482994B1 (ko) | 사스-코로나바이러스-2 감염증 예방 또는 치료용 백신 조성물 | |
JP2018520159A (ja) | Rsvに対するワクチン | |
KR20180131584A (ko) | 안정화된 용해성 융합-전 rsv f 단백질 | |
JP2019523644A (ja) | 安定化された融合前rsv fタンパク質 | |
US8277820B2 (en) | Process for preparing variant of Erysipelothrix rhusiopathiae surface protective antigen in E. coli | |
US20240189416A1 (en) | Stabilized coronavirus spike protein fusion proteins | |
US20230265128A1 (en) | Stabilised viral fusion proteins | |
WO2022229817A1 (en) | Vaccines comprising virus-like particles displaying sars-cov-2 antigens and methods of use | |
WO2020144465A1 (en) | Novel trypanosomal vaccine | |
KR20220040423A (ko) | 재조합 단백질을 포함하는 사스-코로나바이러스-2 감염증 예방 또는 치료용 백신 조성물 | |
KR20220039078A (ko) | 사스-코로나바이러스-2의 변형된 스파이크 단백질을 포함하는 사스-코로나바이러스-2 감염증 예방 또는 치료용 백신 조성물 |