KR20230084478A - 면역원성 코로나 바이러스 융합 단백질 및 관련 방법 - Google Patents
면역원성 코로나 바이러스 융합 단백질 및 관련 방법 Download PDFInfo
- Publication number
- KR20230084478A KR20230084478A KR1020237010064A KR20237010064A KR20230084478A KR 20230084478 A KR20230084478 A KR 20230084478A KR 1020237010064 A KR1020237010064 A KR 1020237010064A KR 20237010064 A KR20237010064 A KR 20237010064A KR 20230084478 A KR20230084478 A KR 20230084478A
- Authority
- KR
- South Korea
- Prior art keywords
- leu
- ser
- val
- thr
- asn
- Prior art date
Links
- 108020001507 fusion proteins Proteins 0.000 title claims abstract description 199
- 102000037865 fusion proteins Human genes 0.000 title claims abstract description 199
- 230000002163 immunogen Effects 0.000 title claims abstract description 105
- 238000000034 method Methods 0.000 title claims abstract description 64
- 241000711573 Coronaviridae Species 0.000 title claims abstract description 16
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract description 177
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 153
- 241001678559 COVID-19 virus Species 0.000 claims abstract description 128
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 125
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 125
- 239000000203 mixture Substances 0.000 claims abstract description 117
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 78
- 239000002105 nanoparticle Substances 0.000 claims abstract description 76
- 229920001184 polypeptide Polymers 0.000 claims abstract description 71
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 71
- 239000013598 vector Substances 0.000 claims abstract description 71
- 101710198474 Spike protein Proteins 0.000 claims abstract description 63
- 229940096437 Protein S Drugs 0.000 claims abstract description 61
- 101710157275 Ferritin subunit Proteins 0.000 claims abstract description 40
- 239000013638 trimer Substances 0.000 claims abstract description 34
- 210000004027 cell Anatomy 0.000 claims description 135
- 230000003472 neutralizing effect Effects 0.000 claims description 87
- 108010061994 Coronavirus Spike Glycoprotein Proteins 0.000 claims description 68
- 230000014509 gene expression Effects 0.000 claims description 62
- 229940037003 alum Drugs 0.000 claims description 44
- 230000028993 immune response Effects 0.000 claims description 40
- 238000012217 deletion Methods 0.000 claims description 33
- 230000037430 deletion Effects 0.000 claims description 33
- 239000002671 adjuvant Substances 0.000 claims description 26
- 230000013595 glycosylation Effects 0.000 claims description 22
- 210000004899 c-terminal region Anatomy 0.000 claims description 21
- 238000006206 glycosylation reaction Methods 0.000 claims description 21
- 230000001939 inductive effect Effects 0.000 claims description 19
- 238000004519 manufacturing process Methods 0.000 claims description 19
- 230000035772 mutation Effects 0.000 claims description 13
- 239000000546 pharmaceutical excipient Substances 0.000 claims description 12
- 230000001681 protective effect Effects 0.000 claims description 12
- 108090001126 Furin Proteins 0.000 claims description 8
- 102000004961 Furin Human genes 0.000 claims description 8
- 230000004927 fusion Effects 0.000 claims description 8
- 238000001338 self-assembly Methods 0.000 claims description 6
- 241000590002 Helicobacter pylori Species 0.000 claims description 5
- 229940037467 helicobacter pylori Drugs 0.000 claims description 5
- 230000000087 stabilizing effect Effects 0.000 claims description 2
- 238000008416 Ferritin Methods 0.000 description 226
- 108050000784 Ferritin Proteins 0.000 description 204
- 102000008857 Ferritin Human genes 0.000 description 204
- 101000629318 Severe acute respiratory syndrome coronavirus 2 Spike glycoprotein Proteins 0.000 description 172
- 108091007433 antigens Proteins 0.000 description 156
- 102000036639 antigens Human genes 0.000 description 156
- 239000000427 antigen Substances 0.000 description 153
- 235000001014 amino acid Nutrition 0.000 description 86
- 108090000623 proteins and genes Proteins 0.000 description 80
- 241000699670 Mus sp. Species 0.000 description 79
- 229940024606 amino acid Drugs 0.000 description 76
- 150000001413 amino acids Chemical class 0.000 description 76
- 108010076504 Protein Sorting Signals Proteins 0.000 description 73
- 241000004176 Alphacoronavirus Species 0.000 description 72
- 210000002966 serum Anatomy 0.000 description 72
- 230000003053 immunization Effects 0.000 description 68
- 238000002649 immunization Methods 0.000 description 68
- 235000018102 proteins Nutrition 0.000 description 63
- 102000004169 proteins and genes Human genes 0.000 description 63
- 241001465754 Metazoa Species 0.000 description 55
- 230000027455 binding Effects 0.000 description 45
- 230000004044 response Effects 0.000 description 42
- 238000006386 neutralization reaction Methods 0.000 description 39
- 238000006467 substitution reaction Methods 0.000 description 36
- 238000012360 testing method Methods 0.000 description 35
- 102000053723 Angiotensin-converting enzyme 2 Human genes 0.000 description 32
- 108090000975 Angiotensin-converting enzyme 2 Proteins 0.000 description 32
- 238000002965 ELISA Methods 0.000 description 28
- 238000003556 assay Methods 0.000 description 28
- 208000001528 Coronaviridae Infections Diseases 0.000 description 26
- 108091028043 Nucleic acid sequence Proteins 0.000 description 25
- 241000700605 Viruses Species 0.000 description 25
- 102000005962 receptors Human genes 0.000 description 24
- 108020003175 receptors Proteins 0.000 description 24
- 108060001084 Luciferase Proteins 0.000 description 23
- 238000010790 dilution Methods 0.000 description 23
- 239000012895 dilution Substances 0.000 description 23
- 239000000872 buffer Substances 0.000 description 22
- 241000699666 Mus <mouse, genus> Species 0.000 description 21
- 239000000523 sample Substances 0.000 description 21
- 239000012634 fragment Substances 0.000 description 19
- UZQJVUCHXGYFLQ-AYDHOLPZSA-N [(2s,3r,4s,5r,6r)-4-[(2s,3r,4s,5r,6r)-4-[(2r,3r,4s,5r,6r)-4-[(2s,3r,4s,5r,6r)-3,5-dihydroxy-6-(hydroxymethyl)-4-[(2s,3r,4s,5s,6r)-3,4,5-trihydroxy-6-(hydroxymethyl)oxan-2-yl]oxyoxan-2-yl]oxy-3,5-dihydroxy-6-(hydroxymethyl)oxan-2-yl]oxy-3,5-dihydroxy-6-(hy Chemical compound O([C@H]1[C@H](O)[C@@H](CO)O[C@H]([C@@H]1O)O[C@H]1[C@H](O)[C@@H](CO)O[C@H]([C@@H]1O)O[C@H]1CC[C@]2(C)[C@H]3CC=C4[C@@]([C@@]3(CC[C@H]2[C@@]1(C=O)C)C)(C)CC(O)[C@]1(CCC(CC14)(C)C)C(=O)O[C@H]1[C@@H]([C@@H](O[C@H]2[C@@H]([C@@H](O[C@H]3[C@@H]([C@@H](O[C@H]4[C@@H]([C@@H](O[C@H]5[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O5)O)[C@H](O)[C@@H](CO)O4)O)[C@H](O)[C@@H](CO)O3)O)[C@H](O)[C@@H](CO)O2)O)[C@H](O)[C@@H](CO)O1)O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O UZQJVUCHXGYFLQ-AYDHOLPZSA-N 0.000 description 18
- 239000013604 expression vector Substances 0.000 description 18
- 239000002245 particle Substances 0.000 description 18
- 239000005089 Luciferase Substances 0.000 description 17
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 17
- 229930006000 Sucrose Natural products 0.000 description 17
- 238000010171 animal model Methods 0.000 description 17
- 229940035032 monophosphoryl lipid a Drugs 0.000 description 17
- 239000005720 sucrose Substances 0.000 description 17
- 125000000539 amino acid group Chemical group 0.000 description 16
- 208000015181 infectious disease Diseases 0.000 description 16
- 230000005875 antibody response Effects 0.000 description 15
- 238000012575 bio-layer interferometry Methods 0.000 description 15
- 108020004414 DNA Proteins 0.000 description 14
- 102000053602 DNA Human genes 0.000 description 14
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 14
- 230000000694 effects Effects 0.000 description 14
- 238000000746 purification Methods 0.000 description 14
- 239000000243 solution Substances 0.000 description 14
- 230000003612 virological effect Effects 0.000 description 14
- 208000025721 COVID-19 Diseases 0.000 description 13
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 13
- 102220599672 Spindlin-1_D614G_mutation Human genes 0.000 description 13
- 238000004458 analytical method Methods 0.000 description 13
- 208000024891 symptom Diseases 0.000 description 13
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 12
- 230000005847 immunogenicity Effects 0.000 description 12
- 239000006228 supernatant Substances 0.000 description 12
- 210000002845 virion Anatomy 0.000 description 12
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 11
- 238000002474 experimental method Methods 0.000 description 11
- 239000013612 plasmid Substances 0.000 description 11
- 238000001890 transfection Methods 0.000 description 11
- 229960005486 vaccine Drugs 0.000 description 11
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 10
- 201000003176 Severe Acute Respiratory Syndrome Diseases 0.000 description 10
- -1 cells Substances 0.000 description 10
- 125000001500 prolyl group Chemical group [H]N1C([H])(C(=O)[*])C([H])([H])C([H])([H])C1([H])[H] 0.000 description 10
- 238000000159 protein binding assay Methods 0.000 description 10
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 9
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 9
- 108091005634 SARS-CoV-2 receptor-binding domains Proteins 0.000 description 9
- UQLDLKMNUJERMK-UHFFFAOYSA-L di(octadecanoyloxy)lead Chemical compound [Pb+2].CCCCCCCCCCCCCCCCCC([O-])=O.CCCCCCCCCCCCCCCCCC([O-])=O UQLDLKMNUJERMK-UHFFFAOYSA-L 0.000 description 9
- 238000010494 dissociation reaction Methods 0.000 description 9
- 230000005593 dissociations Effects 0.000 description 9
- 108010050848 glycylleucine Proteins 0.000 description 9
- 239000002609 medium Substances 0.000 description 9
- 230000004048 modification Effects 0.000 description 9
- 238000012986 modification Methods 0.000 description 9
- 230000009467 reduction Effects 0.000 description 9
- 238000001542 size-exclusion chromatography Methods 0.000 description 9
- ATRRKUHOCOJYRX-UHFFFAOYSA-N Ammonium bicarbonate Chemical compound [NH4+].OC([O-])=O ATRRKUHOCOJYRX-UHFFFAOYSA-N 0.000 description 8
- 229910000013 Ammonium bicarbonate Inorganic materials 0.000 description 8
- 101100107610 Arabidopsis thaliana ABCF4 gene Proteins 0.000 description 8
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 8
- 241000713666 Lentivirus Species 0.000 description 8
- 241000880493 Leptailurus serval Species 0.000 description 8
- 230000004988 N-glycosylation Effects 0.000 description 8
- 241001112090 Pseudovirus Species 0.000 description 8
- 101100068078 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) GCN4 gene Proteins 0.000 description 8
- 235000012538 ammonium bicarbonate Nutrition 0.000 description 8
- 239000001099 ammonium carbonate Substances 0.000 description 8
- 201000010099 disease Diseases 0.000 description 8
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 108010057821 leucylproline Proteins 0.000 description 8
- 238000011002 quantification Methods 0.000 description 8
- 239000000126 substance Substances 0.000 description 8
- 239000013603 viral vector Substances 0.000 description 8
- IBLAOXSULLECQZ-IUKAMOBKSA-N Asn-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(N)=O IBLAOXSULLECQZ-IUKAMOBKSA-N 0.000 description 7
- 108060003951 Immunoglobulin Proteins 0.000 description 7
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 7
- 238000003776 cleavage reaction Methods 0.000 description 7
- 210000003527 eukaryotic cell Anatomy 0.000 description 7
- 238000004108 freeze drying Methods 0.000 description 7
- 102000018358 immunoglobulin Human genes 0.000 description 7
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 7
- 229920000642 polymer Polymers 0.000 description 7
- 230000001105 regulatory effect Effects 0.000 description 7
- 229920002477 rna polymer Polymers 0.000 description 7
- 230000007017 scission Effects 0.000 description 7
- 108010061238 threonyl-glycine Proteins 0.000 description 7
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 7
- 238000001262 western blot Methods 0.000 description 7
- 241000271566 Aves Species 0.000 description 6
- 241000494545 Cordyline virus 2 Species 0.000 description 6
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 6
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 6
- 125000002842 L-seryl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])O[H] 0.000 description 6
- MMEDVBWCMGRKKC-GARJFASQSA-N Leu-Asp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N MMEDVBWCMGRKKC-GARJFASQSA-N 0.000 description 6
- KLSUAWUZBMAZCL-RHYQMDGZSA-N Leu-Thr-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O KLSUAWUZBMAZCL-RHYQMDGZSA-N 0.000 description 6
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 6
- 108700001237 Nucleic Acid-Based Vaccines Proteins 0.000 description 6
- DNIAPMSPPWPWGF-UHFFFAOYSA-N Propylene glycol Chemical compound CC(O)CO DNIAPMSPPWPWGF-UHFFFAOYSA-N 0.000 description 6
- 108010005233 alanylglutamic acid Proteins 0.000 description 6
- 108010044940 alanylglutamine Proteins 0.000 description 6
- 108010047495 alanylglycine Proteins 0.000 description 6
- 230000001580 bacterial effect Effects 0.000 description 6
- 150000001720 carbohydrates Chemical group 0.000 description 6
- 238000010276 construction Methods 0.000 description 6
- 239000003085 diluting agent Substances 0.000 description 6
- 239000003623 enhancer Substances 0.000 description 6
- 238000009472 formulation Methods 0.000 description 6
- 239000000499 gel Substances 0.000 description 6
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 6
- 239000001963 growth medium Substances 0.000 description 6
- 108010017391 lysylvaline Proteins 0.000 description 6
- 239000012528 membrane Substances 0.000 description 6
- 239000000178 monomer Substances 0.000 description 6
- 229940023146 nucleic acid vaccine Drugs 0.000 description 6
- 238000010254 subcutaneous injection Methods 0.000 description 6
- 239000007929 subcutaneous injection Substances 0.000 description 6
- 238000011282 treatment Methods 0.000 description 6
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 6
- LXMKTIZAGIBQRX-HRCADAONSA-N Arg-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O LXMKTIZAGIBQRX-HRCADAONSA-N 0.000 description 5
- IARGXWMWRFOQPG-GCJQMDKQSA-N Asn-Ala-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IARGXWMWRFOQPG-GCJQMDKQSA-N 0.000 description 5
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 5
- VNXQRBXEQXLERQ-CIUDSAMLSA-N Asp-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N VNXQRBXEQXLERQ-CIUDSAMLSA-N 0.000 description 5
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 5
- UWMDGPFFTKDUIY-HJGDQZAQSA-N Gln-Pro-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O UWMDGPFFTKDUIY-HJGDQZAQSA-N 0.000 description 5
- SBVMXEZQJVUARN-XPUUQOCRSA-N Gly-Val-Ser Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O SBVMXEZQJVUARN-XPUUQOCRSA-N 0.000 description 5
- 239000004471 Glycine Substances 0.000 description 5
- 241000282412 Homo Species 0.000 description 5
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 5
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 5
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 5
- 229930195725 Mannitol Natural products 0.000 description 5
- RMKGXGPQIPLTFC-KKUMJFAQSA-N Phe-Lys-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O RMKGXGPQIPLTFC-KKUMJFAQSA-N 0.000 description 5
- FIDMVVBUOCMMJG-CIUDSAMLSA-N Ser-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO FIDMVVBUOCMMJG-CIUDSAMLSA-N 0.000 description 5
- 239000007983 Tris buffer Substances 0.000 description 5
- NSTPFWRAIDTNGH-BZSNNMDCSA-N Tyr-Asn-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NSTPFWRAIDTNGH-BZSNNMDCSA-N 0.000 description 5
- IECQJCJNPJVUSB-IHRRRGAJSA-N Val-Tyr-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CO)C(O)=O IECQJCJNPJVUSB-IHRRRGAJSA-N 0.000 description 5
- 235000004279 alanine Nutrition 0.000 description 5
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 5
- 108010072041 arginyl-glycyl-aspartic acid Proteins 0.000 description 5
- 230000001186 cumulative effect Effects 0.000 description 5
- 239000012520 frozen sample Substances 0.000 description 5
- 235000011187 glycerol Nutrition 0.000 description 5
- 230000001965 increasing effect Effects 0.000 description 5
- 230000002458 infectious effect Effects 0.000 description 5
- 210000004962 mammalian cell Anatomy 0.000 description 5
- 239000000594 mannitol Substances 0.000 description 5
- 235000010355 mannitol Nutrition 0.000 description 5
- 230000001404 mediated effect Effects 0.000 description 5
- 238000000569 multi-angle light scattering Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 5
- 108010051242 phenylalanylserine Proteins 0.000 description 5
- 239000011347 resin Substances 0.000 description 5
- 229920005989 resin Polymers 0.000 description 5
- 102200128238 rs201124247 Human genes 0.000 description 5
- 239000011780 sodium chloride Substances 0.000 description 5
- 238000013518 transcription Methods 0.000 description 5
- 230000035897 transcription Effects 0.000 description 5
- 230000002103 transcriptional effect Effects 0.000 description 5
- 230000005945 translocation Effects 0.000 description 5
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 4
- DQVAZKGVGKHQDS-UHFFFAOYSA-N 2-[[1-[2-[(2-amino-4-methylpentanoyl)amino]-4-methylpentanoyl]pyrrolidine-2-carbonyl]amino]-4-methylpentanoic acid Chemical compound CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(=O)NC(CC(C)C)C(O)=O DQVAZKGVGKHQDS-UHFFFAOYSA-N 0.000 description 4
- DPNZTBKGAUAZQU-DLOVCJGASA-N Ala-Leu-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DPNZTBKGAUAZQU-DLOVCJGASA-N 0.000 description 4
- BECXEHHOZNFFFX-IHRRRGAJSA-N Arg-Ser-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BECXEHHOZNFFFX-IHRRRGAJSA-N 0.000 description 4
- KXFCBAHYSLJCCY-ZLUOBGJFSA-N Asn-Asn-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O KXFCBAHYSLJCCY-ZLUOBGJFSA-N 0.000 description 4
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 4
- KTTCQQNRRLCIBC-GHCJXIJMSA-N Asp-Ile-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O KTTCQQNRRLCIBC-GHCJXIJMSA-N 0.000 description 4
- IVPNEDNYYYFAGI-GARJFASQSA-N Asp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N IVPNEDNYYYFAGI-GARJFASQSA-N 0.000 description 4
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 4
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 4
- 102100036846 C-C motif chemokine 21 Human genes 0.000 description 4
- JRZMCSIUYGSJKP-ZKWXMUAHSA-N Cys-Val-Asn Chemical compound SC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O JRZMCSIUYGSJKP-ZKWXMUAHSA-N 0.000 description 4
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 4
- CKLJMWTZIZZHCS-UWTATZPHSA-N D-aspartic acid Chemical compound OC(=O)[C@H](N)CC(O)=O CKLJMWTZIZZHCS-UWTATZPHSA-N 0.000 description 4
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 4
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 4
- MTBIKIMYHUWBRX-QWRGUYRKSA-N Gly-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN MTBIKIMYHUWBRX-QWRGUYRKSA-N 0.000 description 4
- UMBDRSMLCUYIRI-DVJZZOLTSA-N Gly-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)CN)O UMBDRSMLCUYIRI-DVJZZOLTSA-N 0.000 description 4
- 102000004457 Granulocyte-Macrophage Colony-Stimulating Factor Human genes 0.000 description 4
- 108010017213 Granulocyte-Macrophage Colony-Stimulating Factor Proteins 0.000 description 4
- 241000238631 Hexapoda Species 0.000 description 4
- 108010093488 His-His-His-His-His-His Proteins 0.000 description 4
- 101000929928 Homo sapiens Angiotensin-converting enzyme 2 Proteins 0.000 description 4
- 101000713085 Homo sapiens C-C motif chemokine 21 Proteins 0.000 description 4
- QICVAHODWHIWIS-HTFCKZLJSA-N Ile-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N QICVAHODWHIWIS-HTFCKZLJSA-N 0.000 description 4
- QLRMMMQNCWBNPQ-QXEWZRGKSA-N Ile-Arg-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)O)N QLRMMMQNCWBNPQ-QXEWZRGKSA-N 0.000 description 4
- GNXGAVNTVNOCLL-SIUGBPQLSA-N Ile-Tyr-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N GNXGAVNTVNOCLL-SIUGBPQLSA-N 0.000 description 4
- 102000018071 Immunoglobulin Fc Fragments Human genes 0.000 description 4
- 108010091135 Immunoglobulin Fc Fragments Proteins 0.000 description 4
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 4
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 4
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 4
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 4
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 4
- XXXXOVFBXRERQL-ULQDDVLXSA-N Leu-Pro-Phe Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XXXXOVFBXRERQL-ULQDDVLXSA-N 0.000 description 4
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 4
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 4
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 4
- GHKXHCMRAUYLBS-CIUDSAMLSA-N Lys-Ser-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O GHKXHCMRAUYLBS-CIUDSAMLSA-N 0.000 description 4
- HUURTRNKPBHHKZ-JYJNAYRXSA-N Met-Phe-Val Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 HUURTRNKPBHHKZ-JYJNAYRXSA-N 0.000 description 4
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 4
- HHOOEUSPFGPZFP-QWRGUYRKSA-N Phe-Asn-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HHOOEUSPFGPZFP-QWRGUYRKSA-N 0.000 description 4
- OSBADCBXAMSPQD-YESZJQIVSA-N Phe-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N OSBADCBXAMSPQD-YESZJQIVSA-N 0.000 description 4
- INHMISZWLJZQGH-ULQDDVLXSA-N Phe-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 INHMISZWLJZQGH-ULQDDVLXSA-N 0.000 description 4
- GURGCNUWVSDYTP-SRVKXCTJSA-N Pro-Leu-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GURGCNUWVSDYTP-SRVKXCTJSA-N 0.000 description 4
- 102000044437 S1 domains Human genes 0.000 description 4
- 241000315672 SARS coronavirus Species 0.000 description 4
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 4
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 4
- FBLNYDYPCLFTSP-IXOXFDKPSA-N Ser-Phe-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FBLNYDYPCLFTSP-IXOXFDKPSA-N 0.000 description 4
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 4
- 210000001744 T-lymphocyte Anatomy 0.000 description 4
- HPQHHRLWSAMMKG-KATARQTJSA-N Thr-Lys-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)O)N)O HPQHHRLWSAMMKG-KATARQTJSA-N 0.000 description 4
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 4
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 4
- BVWPHWLFGRCECJ-JSGCOSHPSA-N Val-Gly-Tyr Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N BVWPHWLFGRCECJ-JSGCOSHPSA-N 0.000 description 4
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 4
- OWFGFHQMSBTKLX-UFYCRDLUSA-N Val-Tyr-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N OWFGFHQMSBTKLX-UFYCRDLUSA-N 0.000 description 4
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 4
- 238000000540 analysis of variance Methods 0.000 description 4
- 239000008365 aqueous carrier Substances 0.000 description 4
- 235000009582 asparagine Nutrition 0.000 description 4
- 229960001230 asparagine Drugs 0.000 description 4
- 108010093581 aspartyl-proline Proteins 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 238000012512 characterization method Methods 0.000 description 4
- 238000010367 cloning Methods 0.000 description 4
- 238000000502 dialysis Methods 0.000 description 4
- 239000003937 drug carrier Substances 0.000 description 4
- 238000004520 electroporation Methods 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 108010078144 glutaminyl-glycine Proteins 0.000 description 4
- 108010084389 glycyltryptophan Proteins 0.000 description 4
- 108010037850 glycylvaline Proteins 0.000 description 4
- 210000002443 helper t lymphocyte Anatomy 0.000 description 4
- 102000048657 human ACE2 Human genes 0.000 description 4
- 210000000987 immune system Anatomy 0.000 description 4
- 229940072221 immunoglobulins Drugs 0.000 description 4
- 238000000338 in vitro Methods 0.000 description 4
- 238000001802 infusion Methods 0.000 description 4
- 239000003112 inhibitor Substances 0.000 description 4
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 4
- 239000002502 liposome Substances 0.000 description 4
- 239000007788 liquid Substances 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 229930182817 methionine Natural products 0.000 description 4
- 239000002773 nucleotide Substances 0.000 description 4
- 125000003729 nucleotide group Chemical group 0.000 description 4
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 108010029020 prolylglycine Proteins 0.000 description 4
- 230000000069 prophylactic effect Effects 0.000 description 4
- 238000000164 protein isolation Methods 0.000 description 4
- 230000010076 replication Effects 0.000 description 4
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 4
- 239000000600 sorbitol Substances 0.000 description 4
- 238000009987 spinning Methods 0.000 description 4
- 238000007920 subcutaneous administration Methods 0.000 description 4
- 210000001519 tissue Anatomy 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 210000005253 yeast cell Anatomy 0.000 description 4
- CWFMWBHMIMNZLN-NAKRPEOUSA-N (2s)-1-[(2s)-2-[[(2s,3s)-2-amino-3-methylpentanoyl]amino]propanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CWFMWBHMIMNZLN-NAKRPEOUSA-N 0.000 description 3
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 3
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 3
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 3
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 3
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 3
- PEEYDECOOVQKRZ-DLOVCJGASA-N Ala-Ser-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PEEYDECOOVQKRZ-DLOVCJGASA-N 0.000 description 3
- QRIYOHQJRDHFKF-UWJYBYFXSA-N Ala-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 QRIYOHQJRDHFKF-UWJYBYFXSA-N 0.000 description 3
- JSHVMZANPXCDTL-GMOBBJLQSA-N Arg-Asp-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JSHVMZANPXCDTL-GMOBBJLQSA-N 0.000 description 3
- CZUHPNLXLWMYMG-UBHSHLNASA-N Arg-Phe-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 CZUHPNLXLWMYMG-UBHSHLNASA-N 0.000 description 3
- 239000004475 Arginine Substances 0.000 description 3
- DAPLJWATMAXPPZ-CIUDSAMLSA-N Asn-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O DAPLJWATMAXPPZ-CIUDSAMLSA-N 0.000 description 3
- UGXVKHRDGLYFKR-CIUDSAMLSA-N Asn-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(N)=O UGXVKHRDGLYFKR-CIUDSAMLSA-N 0.000 description 3
- XVAPVJNJGLWGCS-ACZMJKKPSA-N Asn-Glu-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N XVAPVJNJGLWGCS-ACZMJKKPSA-N 0.000 description 3
- UHGUKCOQUNPSKK-CIUDSAMLSA-N Asn-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N UHGUKCOQUNPSKK-CIUDSAMLSA-N 0.000 description 3
- HBUJSDCLZCXXCW-YDHLFZDLSA-N Asn-Val-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HBUJSDCLZCXXCW-YDHLFZDLSA-N 0.000 description 3
- NJLLRXWFPQQPHV-SRVKXCTJSA-N Asp-Tyr-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O NJLLRXWFPQQPHV-SRVKXCTJSA-N 0.000 description 3
- PLOKOIJSGCISHE-BYULHYEWSA-N Asp-Val-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PLOKOIJSGCISHE-BYULHYEWSA-N 0.000 description 3
- 241000008904 Betacoronavirus Species 0.000 description 3
- 108020004705 Codon Proteins 0.000 description 3
- 108091035707 Consensus sequence Proteins 0.000 description 3
- QQOWCDCBFFBRQH-IXOXFDKPSA-N Cys-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CS)N)O QQOWCDCBFFBRQH-IXOXFDKPSA-N 0.000 description 3
- JLZCAZJGWNRXCI-XKBZYTNZSA-N Cys-Thr-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O JLZCAZJGWNRXCI-XKBZYTNZSA-N 0.000 description 3
- 102000004127 Cytokines Human genes 0.000 description 3
- 108090000695 Cytokines Proteins 0.000 description 3
- ONIBWKKTOPOVIA-SCSAIBSYSA-N D-Proline Chemical compound OC(=O)[C@H]1CCCN1 ONIBWKKTOPOVIA-SCSAIBSYSA-N 0.000 description 3
- 229930182820 D-proline Natural products 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- NHMRJKKAVMENKJ-WDCWCFNPSA-N Gln-Thr-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NHMRJKKAVMENKJ-WDCWCFNPSA-N 0.000 description 3
- QXDXIXFSFHUYAX-MNXVOIDGSA-N Glu-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O QXDXIXFSFHUYAX-MNXVOIDGSA-N 0.000 description 3
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 3
- YQPFCZVKMUVZIN-AUTRQRHGSA-N Glu-Val-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQPFCZVKMUVZIN-AUTRQRHGSA-N 0.000 description 3
- FVGOGEGGQLNZGH-DZKIICNBSA-N Glu-Val-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FVGOGEGGQLNZGH-DZKIICNBSA-N 0.000 description 3
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 3
- QSTLUOIOYLYLLF-WDSKDSINSA-N Gly-Asp-Glu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QSTLUOIOYLYLLF-WDSKDSINSA-N 0.000 description 3
- NPSWCZIRBAYNSB-JHEQGTHGSA-N Gly-Gln-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPSWCZIRBAYNSB-JHEQGTHGSA-N 0.000 description 3
- DGKBSGNCMCLDSL-BYULHYEWSA-N Gly-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN DGKBSGNCMCLDSL-BYULHYEWSA-N 0.000 description 3
- 102000003886 Glycoproteins Human genes 0.000 description 3
- 108090000288 Glycoproteins Proteins 0.000 description 3
- 239000007995 HEPES buffer Substances 0.000 description 3
- XINDHUAGVGCNSF-QSFUFRPTSA-N His-Ala-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XINDHUAGVGCNSF-QSFUFRPTSA-N 0.000 description 3
- TZCGZYWNIDZZMR-NAKRPEOUSA-N Ile-Arg-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C)C(=O)O)N TZCGZYWNIDZZMR-NAKRPEOUSA-N 0.000 description 3
- NZOCIWKZUVUNDW-ZKWXMUAHSA-N Ile-Gly-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O NZOCIWKZUVUNDW-ZKWXMUAHSA-N 0.000 description 3
- ANTFEOSJMAUGIB-KNZXXDILSA-N Ile-Thr-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N ANTFEOSJMAUGIB-KNZXXDILSA-N 0.000 description 3
- ZYVTXBXHIKGZMD-QSFUFRPTSA-N Ile-Val-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ZYVTXBXHIKGZMD-QSFUFRPTSA-N 0.000 description 3
- 108010002350 Interleukin-2 Proteins 0.000 description 3
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 3
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 3
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 3
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 3
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 3
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 3
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 3
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 3
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 3
- VHTIZYYHIUHMCA-JYJNAYRXSA-N Leu-Tyr-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VHTIZYYHIUHMCA-JYJNAYRXSA-N 0.000 description 3
- VHNOAIFVYUQOOY-XUXIUFHCSA-N Lys-Arg-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VHNOAIFVYUQOOY-XUXIUFHCSA-N 0.000 description 3
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 3
- QIJVAFLRMVBHMU-KKUMJFAQSA-N Lys-Asp-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QIJVAFLRMVBHMU-KKUMJFAQSA-N 0.000 description 3
- DZQYZKPINJLLEN-KKUMJFAQSA-N Lys-Cys-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCCN)N)O DZQYZKPINJLLEN-KKUMJFAQSA-N 0.000 description 3
- SLQJJFAVWSZLBL-BJDJZHNGSA-N Lys-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN SLQJJFAVWSZLBL-BJDJZHNGSA-N 0.000 description 3
- 239000004472 Lysine Substances 0.000 description 3
- 108700018351 Major Histocompatibility Complex Proteins 0.000 description 3
- 241000124008 Mammalia Species 0.000 description 3
- 208000025370 Middle East respiratory syndrome Diseases 0.000 description 3
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 3
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 3
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 3
- 102000035195 Peptidases Human genes 0.000 description 3
- 108091005804 Peptidases Proteins 0.000 description 3
- JJHVFCUWLSKADD-ONGXEEELSA-N Phe-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O JJHVFCUWLSKADD-ONGXEEELSA-N 0.000 description 3
- BSKMOCNNLNDIMU-CDMKHQONSA-N Phe-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O BSKMOCNNLNDIMU-CDMKHQONSA-N 0.000 description 3
- FGWUALWGCZJQDJ-URLPEUOOSA-N Phe-Thr-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGWUALWGCZJQDJ-URLPEUOOSA-N 0.000 description 3
- ILMLVTGTUJPQFP-FXQIFTODSA-N Pro-Asp-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ILMLVTGTUJPQFP-FXQIFTODSA-N 0.000 description 3
- AJBQTGZIZQXBLT-STQMWFEESA-N Pro-Phe-Gly Chemical compound C([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 AJBQTGZIZQXBLT-STQMWFEESA-N 0.000 description 3
- DWPXHLIBFQLKLK-CYDGBPFRSA-N Pro-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 DWPXHLIBFQLKLK-CYDGBPFRSA-N 0.000 description 3
- WVXQQUWOKUZIEG-VEVYYDQMSA-N Pro-Thr-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O WVXQQUWOKUZIEG-VEVYYDQMSA-N 0.000 description 3
- 239000004365 Protease Substances 0.000 description 3
- 108700036684 S1 domains Proteins 0.000 description 3
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 3
- MWMKFWJYRRGXOR-ZLUOBGJFSA-N Ser-Ala-Asn Chemical compound N[C@H](C(=O)N[C@H](C(=O)N[C@H](C(=O)O)CC(N)=O)C)CO MWMKFWJYRRGXOR-ZLUOBGJFSA-N 0.000 description 3
- UCXDHBORXLVBNC-ZLUOBGJFSA-N Ser-Asn-Cys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(O)=O UCXDHBORXLVBNC-ZLUOBGJFSA-N 0.000 description 3
- KKKVOZNCLALMPV-XKBZYTNZSA-N Ser-Thr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KKKVOZNCLALMPV-XKBZYTNZSA-N 0.000 description 3
- DYEGLQRVMBWQLD-IXOXFDKPSA-N Ser-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CO)N)O DYEGLQRVMBWQLD-IXOXFDKPSA-N 0.000 description 3
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 3
- ODRUTDLAONAVDV-IHRRRGAJSA-N Ser-Val-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ODRUTDLAONAVDV-IHRRRGAJSA-N 0.000 description 3
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 3
- 102220599406 Spindlin-1_N501Y_mutation Human genes 0.000 description 3
- 230000024932 T cell mediated immunity Effects 0.000 description 3
- SPVHQURZJCUDQC-VOAKCMCISA-N Thr-Lys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O SPVHQURZJCUDQC-VOAKCMCISA-N 0.000 description 3
- KVEWWQRTAVMOFT-KJEVXHAQSA-N Thr-Tyr-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O KVEWWQRTAVMOFT-KJEVXHAQSA-N 0.000 description 3
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 3
- 239000004473 Threonine Substances 0.000 description 3
- IBBBOLAPFHRDHW-BPUTZDHNSA-N Trp-Asn-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N IBBBOLAPFHRDHW-BPUTZDHNSA-N 0.000 description 3
- UKINEYBQXPMOJO-UBHSHLNASA-N Trp-Asn-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N UKINEYBQXPMOJO-UBHSHLNASA-N 0.000 description 3
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 3
- SCCKSNREWHMKOJ-SRVKXCTJSA-N Tyr-Asn-Ser Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O SCCKSNREWHMKOJ-SRVKXCTJSA-N 0.000 description 3
- FMXFHNSFABRVFZ-BZSNNMDCSA-N Tyr-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FMXFHNSFABRVFZ-BZSNNMDCSA-N 0.000 description 3
- PSALWJCUIAQKFW-ACRUOGEOSA-N Tyr-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N PSALWJCUIAQKFW-ACRUOGEOSA-N 0.000 description 3
- TYFLVOUZHQUBGM-IHRRRGAJSA-N Tyr-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TYFLVOUZHQUBGM-IHRRRGAJSA-N 0.000 description 3
- FZSPNKUFROZBSG-ZKWXMUAHSA-N Val-Ala-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O FZSPNKUFROZBSG-ZKWXMUAHSA-N 0.000 description 3
- JIODCDXKCJRMEH-NHCYSSNCSA-N Val-Arg-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N JIODCDXKCJRMEH-NHCYSSNCSA-N 0.000 description 3
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 3
- CPGJELLYDQEDRK-NAKRPEOUSA-N Val-Ile-Ala Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C)C(O)=O CPGJELLYDQEDRK-NAKRPEOUSA-N 0.000 description 3
- KDKLLPMFFGYQJD-CYDGBPFRSA-N Val-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N KDKLLPMFFGYQJD-CYDGBPFRSA-N 0.000 description 3
- QSPOLEBZTMESFY-SRVKXCTJSA-N Val-Pro-Val Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O QSPOLEBZTMESFY-SRVKXCTJSA-N 0.000 description 3
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 3
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 3
- 208000036142 Viral infection Diseases 0.000 description 3
- 238000007792 addition Methods 0.000 description 3
- 108010041407 alanylaspartic acid Proteins 0.000 description 3
- 150000001371 alpha-amino acids Chemical class 0.000 description 3
- 235000008206 alpha-amino acids Nutrition 0.000 description 3
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 3
- 108010062796 arginyllysine Proteins 0.000 description 3
- 238000000149 argon plasma sintering Methods 0.000 description 3
- 230000003115 biocidal effect Effects 0.000 description 3
- 210000004369 blood Anatomy 0.000 description 3
- 239000008280 blood Substances 0.000 description 3
- 239000008366 buffered solution Substances 0.000 description 3
- 239000004067 bulking agent Substances 0.000 description 3
- 210000000234 capsid Anatomy 0.000 description 3
- 239000000969 carrier Substances 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 210000000170 cell membrane Anatomy 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 3
- 235000018417 cysteine Nutrition 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 239000013024 dilution buffer Substances 0.000 description 3
- 108010054812 diprotin A Proteins 0.000 description 3
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 3
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 3
- 108010073628 glutamyl-valyl-phenylalanine Proteins 0.000 description 3
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 3
- 108010090037 glycyl-alanyl-isoleucine Proteins 0.000 description 3
- 108010074027 glycyl-seryl-phenylalanine Proteins 0.000 description 3
- 230000001976 improved effect Effects 0.000 description 3
- 238000011534 incubation Methods 0.000 description 3
- 238000002347 injection Methods 0.000 description 3
- 239000007924 injection Substances 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- XEEYBQQBJWHFJM-UHFFFAOYSA-N iron Substances [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 3
- 108010078274 isoleucylvaline Proteins 0.000 description 3
- 230000000670 limiting effect Effects 0.000 description 3
- 239000012160 loading buffer Substances 0.000 description 3
- 108010009298 lysylglutamic acid Proteins 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000001000 micrograph Methods 0.000 description 3
- 230000036961 partial effect Effects 0.000 description 3
- 108010089198 phenylalanyl-prolyl-arginine Proteins 0.000 description 3
- 229920001223 polyethylene glycol Polymers 0.000 description 3
- 230000002265 prevention Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 108010020432 prolyl-prolylisoleucine Proteins 0.000 description 3
- 230000001177 retroviral effect Effects 0.000 description 3
- 230000028327 secretion Effects 0.000 description 3
- 108010071207 serylmethionine Proteins 0.000 description 3
- 239000002904 solvent Substances 0.000 description 3
- 230000004936 stimulating effect Effects 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 230000020382 suppression by virus of host antigen processing and presentation of peptide antigen via MHC class I Effects 0.000 description 3
- 239000004094 surface-active agent Substances 0.000 description 3
- 239000000725 suspension Substances 0.000 description 3
- 230000005030 transcription termination Effects 0.000 description 3
- 238000005829 trimerization reaction Methods 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- 108010073969 valyllysine Proteins 0.000 description 3
- 108010009962 valyltyrosine Proteins 0.000 description 3
- 230000009385 viral infection Effects 0.000 description 3
- HDTRYLNUVZCQOY-UHFFFAOYSA-N α-D-glucopyranosyl-α-D-glucopyranoside Natural products OC1C(O)C(O)C(CO)OC1OC1C(O)C(O)C(O)C(CO)O1 HDTRYLNUVZCQOY-UHFFFAOYSA-N 0.000 description 2
- GJLXVWOMRRWCIB-MERZOTPQSA-N (2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-acetamido-5-(diaminomethylideneamino)pentanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanamide Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=C(O)C=C1 GJLXVWOMRRWCIB-MERZOTPQSA-N 0.000 description 2
- JNTMAZFVYNDPLB-PEDHHIEDSA-N (2S,3S)-2-[[[(2S)-1-[(2S,3S)-2-amino-3-methyl-1-oxopentyl]-2-pyrrolidinyl]-oxomethyl]amino]-3-methylpentanoic acid Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JNTMAZFVYNDPLB-PEDHHIEDSA-N 0.000 description 2
- NTUPOKHATNSWCY-PMPSAXMXSA-N (2s)-2-[[(2s)-1-[(2r)-2-amino-3-phenylpropanoyl]pyrrolidine-2-carbonyl]amino]-5-(diaminomethylideneamino)pentanoic acid Chemical compound C([C@@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CC=CC=C1 NTUPOKHATNSWCY-PMPSAXMXSA-N 0.000 description 2
- LEBVLXFERQHONN-UHFFFAOYSA-N 1-butyl-N-(2,6-dimethylphenyl)piperidine-2-carboxamide Chemical compound CCCCN1CCCCC1C(=O)NC1=C(C)C=CC=C1C LEBVLXFERQHONN-UHFFFAOYSA-N 0.000 description 2
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 2
- WRMNZCZEMHIOCP-UHFFFAOYSA-N 2-phenylethanol Chemical compound OCCC1=CC=CC=C1 WRMNZCZEMHIOCP-UHFFFAOYSA-N 0.000 description 2
- UGLPMYSCWHTZQU-AUTRQRHGSA-N Ala-Ala-Tyr Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UGLPMYSCWHTZQU-AUTRQRHGSA-N 0.000 description 2
- SSSROGPPPVTHLX-FXQIFTODSA-N Ala-Arg-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSROGPPPVTHLX-FXQIFTODSA-N 0.000 description 2
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 2
- MCKSLROAGSDNFC-ACZMJKKPSA-N Ala-Asp-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MCKSLROAGSDNFC-ACZMJKKPSA-N 0.000 description 2
- KUDREHRZRIVKHS-UWJYBYFXSA-N Ala-Asp-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KUDREHRZRIVKHS-UWJYBYFXSA-N 0.000 description 2
- GGNHBHYDMUDXQB-KBIXCLLPSA-N Ala-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)N GGNHBHYDMUDXQB-KBIXCLLPSA-N 0.000 description 2
- QHASENCZLDHBGX-ONGXEEELSA-N Ala-Gly-Phe Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QHASENCZLDHBGX-ONGXEEELSA-N 0.000 description 2
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 2
- FOHXUHGZZKETFI-JBDRJPRFSA-N Ala-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C)N FOHXUHGZZKETFI-JBDRJPRFSA-N 0.000 description 2
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 2
- NMXKFWOEASXOGB-QSFUFRPTSA-N Ala-Ile-His Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NMXKFWOEASXOGB-QSFUFRPTSA-N 0.000 description 2
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 2
- XAXHGSOBFPIRFG-LSJOCFKGSA-N Ala-Pro-His Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O XAXHGSOBFPIRFG-LSJOCFKGSA-N 0.000 description 2
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 2
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 2
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 2
- XQNRANMFRPCFFW-GCJQMDKQSA-N Ala-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C)N)O XQNRANMFRPCFFW-GCJQMDKQSA-N 0.000 description 2
- SAHQGRZIQVEJPF-JXUBOQSCSA-N Ala-Thr-Lys Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN SAHQGRZIQVEJPF-JXUBOQSCSA-N 0.000 description 2
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 2
- JPOQZCHGOTWRTM-FQPOAREZSA-N Ala-Tyr-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPOQZCHGOTWRTM-FQPOAREZSA-N 0.000 description 2
- MUGAESARFRGOTQ-IGNZVWTISA-N Ala-Tyr-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N MUGAESARFRGOTQ-IGNZVWTISA-N 0.000 description 2
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 2
- 108700028369 Alleles Proteins 0.000 description 2
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 2
- 108091093088 Amplicon Proteins 0.000 description 2
- 241000272517 Anseriformes Species 0.000 description 2
- 102000000546 Apoferritins Human genes 0.000 description 2
- 108010002084 Apoferritins Proteins 0.000 description 2
- GIVATXIGCXFQQA-FXQIFTODSA-N Arg-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N GIVATXIGCXFQQA-FXQIFTODSA-N 0.000 description 2
- KWTVWJPNHAOREN-IHRRRGAJSA-N Arg-Asn-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KWTVWJPNHAOREN-IHRRRGAJSA-N 0.000 description 2
- JCAISGGAOQXEHJ-ZPFDUUQYSA-N Arg-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N JCAISGGAOQXEHJ-ZPFDUUQYSA-N 0.000 description 2
- NKNILFJYKKHBKE-WPRPVWTQSA-N Arg-Gly-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NKNILFJYKKHBKE-WPRPVWTQSA-N 0.000 description 2
- GXXWTNKNFFKTJB-NAKRPEOUSA-N Arg-Ile-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O GXXWTNKNFFKTJB-NAKRPEOUSA-N 0.000 description 2
- GMFAGHNRXPSSJS-SRVKXCTJSA-N Arg-Leu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GMFAGHNRXPSSJS-SRVKXCTJSA-N 0.000 description 2
- VEAIMHJZTIDCIH-KKUMJFAQSA-N Arg-Phe-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VEAIMHJZTIDCIH-KKUMJFAQSA-N 0.000 description 2
- LYJXHXGPWDTLKW-HJGDQZAQSA-N Arg-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O LYJXHXGPWDTLKW-HJGDQZAQSA-N 0.000 description 2
- MOGMYRUNTKYZFB-UNQGMJICSA-N Arg-Thr-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MOGMYRUNTKYZFB-UNQGMJICSA-N 0.000 description 2
- LLQIAIUAKGNOSE-NHCYSSNCSA-N Arg-Val-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N LLQIAIUAKGNOSE-NHCYSSNCSA-N 0.000 description 2
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 2
- PDQBXRSOSCTGKY-ACZMJKKPSA-N Asn-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PDQBXRSOSCTGKY-ACZMJKKPSA-N 0.000 description 2
- DQTIWTULBGLJBL-DCAQKATOSA-N Asn-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N DQTIWTULBGLJBL-DCAQKATOSA-N 0.000 description 2
- YNSCBOUZTAGIGO-ZLUOBGJFSA-N Asn-Asn-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N)C(=O)N YNSCBOUZTAGIGO-ZLUOBGJFSA-N 0.000 description 2
- APHUDFFMXFYRKP-CIUDSAMLSA-N Asn-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N APHUDFFMXFYRKP-CIUDSAMLSA-N 0.000 description 2
- VKCOHFFSTKCXEQ-OLHMAJIHSA-N Asn-Asn-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VKCOHFFSTKCXEQ-OLHMAJIHSA-N 0.000 description 2
- XSGBIBGAMKTHMY-WHFBIAKZSA-N Asn-Asp-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O XSGBIBGAMKTHMY-WHFBIAKZSA-N 0.000 description 2
- ZWASIOHRQWRWAS-UGYAYLCHSA-N Asn-Asp-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZWASIOHRQWRWAS-UGYAYLCHSA-N 0.000 description 2
- VWJFQGXPYOPXJH-ZLUOBGJFSA-N Asn-Cys-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)C(=O)N VWJFQGXPYOPXJH-ZLUOBGJFSA-N 0.000 description 2
- QRHYAUYXBVVDSB-LKXGYXEUSA-N Asn-Cys-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QRHYAUYXBVVDSB-LKXGYXEUSA-N 0.000 description 2
- CZIXHXIJJZLYRJ-SRVKXCTJSA-N Asn-Cys-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CZIXHXIJJZLYRJ-SRVKXCTJSA-N 0.000 description 2
- SQZIAWGBBUSSPJ-ZKWXMUAHSA-N Asn-Cys-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)N)N SQZIAWGBBUSSPJ-ZKWXMUAHSA-N 0.000 description 2
- PBSQFBAJKPLRJY-BYULHYEWSA-N Asn-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N PBSQFBAJKPLRJY-BYULHYEWSA-N 0.000 description 2
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 2
- ANPFQTJEPONRPL-UGYAYLCHSA-N Asn-Ile-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O ANPFQTJEPONRPL-UGYAYLCHSA-N 0.000 description 2
- BXUHCIXDSWRSBS-CIUDSAMLSA-N Asn-Leu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BXUHCIXDSWRSBS-CIUDSAMLSA-N 0.000 description 2
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 2
- NCFJQJRLQJEECD-NHCYSSNCSA-N Asn-Leu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O NCFJQJRLQJEECD-NHCYSSNCSA-N 0.000 description 2
- FODVBOKTYKYRFJ-CIUDSAMLSA-N Asn-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N FODVBOKTYKYRFJ-CIUDSAMLSA-N 0.000 description 2
- COWITDLVHMZSIW-CIUDSAMLSA-N Asn-Lys-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O COWITDLVHMZSIW-CIUDSAMLSA-N 0.000 description 2
- OROMFUQQTSWUTI-IHRRRGAJSA-N Asn-Phe-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OROMFUQQTSWUTI-IHRRRGAJSA-N 0.000 description 2
- BKFXFUPYETWGGA-XVSYOHENSA-N Asn-Phe-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BKFXFUPYETWGGA-XVSYOHENSA-N 0.000 description 2
- VHQSGALUSWIYOD-QXEWZRGKSA-N Asn-Pro-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O VHQSGALUSWIYOD-QXEWZRGKSA-N 0.000 description 2
- REQUGIWGOGSOEZ-ZLUOBGJFSA-N Asn-Ser-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N REQUGIWGOGSOEZ-ZLUOBGJFSA-N 0.000 description 2
- MYTHOBCLNIOFBL-SRVKXCTJSA-N Asn-Ser-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MYTHOBCLNIOFBL-SRVKXCTJSA-N 0.000 description 2
- PIABYSIYPGLLDQ-XVSYOHENSA-N Asn-Thr-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PIABYSIYPGLLDQ-XVSYOHENSA-N 0.000 description 2
- AMGQTNHANMRPOE-LKXGYXEUSA-N Asn-Thr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O AMGQTNHANMRPOE-LKXGYXEUSA-N 0.000 description 2
- DATSKXOXPUAOLK-KKUMJFAQSA-N Asn-Tyr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DATSKXOXPUAOLK-KKUMJFAQSA-N 0.000 description 2
- CBHVAFXKOYAHOY-NHCYSSNCSA-N Asn-Val-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O CBHVAFXKOYAHOY-NHCYSSNCSA-N 0.000 description 2
- XOQYDFCQPWAMSA-KKHAAJSZSA-N Asn-Val-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOQYDFCQPWAMSA-KKHAAJSZSA-N 0.000 description 2
- WQAOZCVOOYUWKG-LSJOCFKGSA-N Asn-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC(=O)N)N WQAOZCVOOYUWKG-LSJOCFKGSA-N 0.000 description 2
- RGKKALNPOYURGE-ZKWXMUAHSA-N Asp-Ala-Val Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O RGKKALNPOYURGE-ZKWXMUAHSA-N 0.000 description 2
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 2
- SVFOIXMRMLROHO-SRVKXCTJSA-N Asp-Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SVFOIXMRMLROHO-SRVKXCTJSA-N 0.000 description 2
- AMRANMVXQWXNAH-ZLUOBGJFSA-N Asp-Cys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CC(O)=O AMRANMVXQWXNAH-ZLUOBGJFSA-N 0.000 description 2
- YDJVIBMKAMQPPP-LAEOZQHASA-N Asp-Glu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O YDJVIBMKAMQPPP-LAEOZQHASA-N 0.000 description 2
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 2
- AITKTFCQOBRJTG-CIUDSAMLSA-N Asp-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N AITKTFCQOBRJTG-CIUDSAMLSA-N 0.000 description 2
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 2
- HKEZZWQWXWGASX-KKUMJFAQSA-N Asp-Leu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HKEZZWQWXWGASX-KKUMJFAQSA-N 0.000 description 2
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 2
- WZUZGDANRQPCDD-SRVKXCTJSA-N Asp-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N WZUZGDANRQPCDD-SRVKXCTJSA-N 0.000 description 2
- HJZLUGQGJWXJCJ-CIUDSAMLSA-N Asp-Pro-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O HJZLUGQGJWXJCJ-CIUDSAMLSA-N 0.000 description 2
- XUVTWGPERWIERB-IHRRRGAJSA-N Asp-Pro-Phe Chemical compound N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O XUVTWGPERWIERB-IHRRRGAJSA-N 0.000 description 2
- FAUPLTGRUBTXNU-FXQIFTODSA-N Asp-Pro-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O FAUPLTGRUBTXNU-FXQIFTODSA-N 0.000 description 2
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 2
- RSMZEHCMIOKNMW-GSSVUCPTSA-N Asp-Thr-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RSMZEHCMIOKNMW-GSSVUCPTSA-N 0.000 description 2
- 241000193830 Bacillus <bacterium> Species 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- 241000282836 Camelus dromedarius Species 0.000 description 2
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 2
- 241000282472 Canis lupus familiaris Species 0.000 description 2
- 241000283707 Capra Species 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical group [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- 102000014914 Carrier Proteins Human genes 0.000 description 2
- 102000019034 Chemokines Human genes 0.000 description 2
- 108010012236 Chemokines Proteins 0.000 description 2
- PRXCTTWKGJAPMT-ZLUOBGJFSA-N Cys-Ala-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O PRXCTTWKGJAPMT-ZLUOBGJFSA-N 0.000 description 2
- DEVDFMRWZASYOF-ZLUOBGJFSA-N Cys-Asn-Asp Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DEVDFMRWZASYOF-ZLUOBGJFSA-N 0.000 description 2
- SKSJPIBFNFPTJB-NKWVEPMBSA-N Cys-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CS)N)C(=O)O SKSJPIBFNFPTJB-NKWVEPMBSA-N 0.000 description 2
- IZUNQDRIAOLWCN-YUMQZZPRSA-N Cys-Leu-Gly Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CS)N IZUNQDRIAOLWCN-YUMQZZPRSA-N 0.000 description 2
- MWVDDZUTWXFYHL-XKBZYTNZSA-N Cys-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CS)N)O MWVDDZUTWXFYHL-XKBZYTNZSA-N 0.000 description 2
- GFAPBMCRSMSGDZ-XGEHTFHBSA-N Cys-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CS)N)O GFAPBMCRSMSGDZ-XGEHTFHBSA-N 0.000 description 2
- HPZAJRPYUIHDIN-BZSNNMDCSA-N Cys-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CS)N HPZAJRPYUIHDIN-BZSNNMDCSA-N 0.000 description 2
- KZZYVYWSXMFYEC-DCAQKATOSA-N Cys-Val-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KZZYVYWSXMFYEC-DCAQKATOSA-N 0.000 description 2
- DCXYFEDJOCDNAF-UWTATZPHSA-N D-Asparagine Chemical compound OC(=O)[C@H](N)CC(N)=O DCXYFEDJOCDNAF-UWTATZPHSA-N 0.000 description 2
- XUJNEKJLAYXESH-UWTATZPHSA-N D-Cysteine Chemical compound SC[C@@H](N)C(O)=O XUJNEKJLAYXESH-UWTATZPHSA-N 0.000 description 2
- AGPKZVBTJJNPAG-RFZPGFLSSA-N D-Isoleucine Chemical compound CC[C@@H](C)[C@@H](N)C(O)=O AGPKZVBTJJNPAG-RFZPGFLSSA-N 0.000 description 2
- MTCFGRXMJLQNBG-UWTATZPHSA-N D-Serine Chemical compound OC[C@@H](N)C(O)=O MTCFGRXMJLQNBG-UWTATZPHSA-N 0.000 description 2
- 229930195711 D-Serine Natural products 0.000 description 2
- QNAYBMKLOCPYGJ-UWTATZPHSA-N D-alanine Chemical compound C[C@@H](N)C(O)=O QNAYBMKLOCPYGJ-UWTATZPHSA-N 0.000 description 2
- QNAYBMKLOCPYGJ-UHFFFAOYSA-N D-alpha-Ala Natural products CC([NH3+])C([O-])=O QNAYBMKLOCPYGJ-UHFFFAOYSA-N 0.000 description 2
- ODKSFYDXXFIFQN-SCSAIBSYSA-N D-arginine Chemical compound OC(=O)[C@H](N)CCCNC(N)=N ODKSFYDXXFIFQN-SCSAIBSYSA-N 0.000 description 2
- 229930028154 D-arginine Natural products 0.000 description 2
- 229930182846 D-asparagine Natural products 0.000 description 2
- WHUUTDBJXJRKMK-GSVOUGTGSA-N D-glutamic acid Chemical compound OC(=O)[C@H](N)CCC(O)=O WHUUTDBJXJRKMK-GSVOUGTGSA-N 0.000 description 2
- 229930182847 D-glutamic acid Natural products 0.000 description 2
- ZDXPYRJPNDTMRX-GSVOUGTGSA-N D-glutamine Chemical compound OC(=O)[C@H](N)CCC(N)=O ZDXPYRJPNDTMRX-GSVOUGTGSA-N 0.000 description 2
- 229930195715 D-glutamine Natural products 0.000 description 2
- HNDVDQJCIGZPNO-RXMQYKEDSA-N D-histidine Chemical compound OC(=O)[C@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-RXMQYKEDSA-N 0.000 description 2
- 229930195721 D-histidine Natural products 0.000 description 2
- 229930182845 D-isoleucine Natural products 0.000 description 2
- ROHFNLRQFUQHCH-RXMQYKEDSA-N D-leucine Chemical compound CC(C)C[C@@H](N)C(O)=O ROHFNLRQFUQHCH-RXMQYKEDSA-N 0.000 description 2
- 229930182819 D-leucine Natural products 0.000 description 2
- KDXKERNSBIXSRK-RXMQYKEDSA-N D-lysine Chemical compound NCCCC[C@@H](N)C(O)=O KDXKERNSBIXSRK-RXMQYKEDSA-N 0.000 description 2
- FFEARJCKVFRZRR-SCSAIBSYSA-N D-methionine Chemical compound CSCC[C@@H](N)C(O)=O FFEARJCKVFRZRR-SCSAIBSYSA-N 0.000 description 2
- 229930182818 D-methionine Natural products 0.000 description 2
- COLNVLDHVKWLRT-MRVPVSSYSA-N D-phenylalanine Chemical compound OC(=O)[C@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-MRVPVSSYSA-N 0.000 description 2
- 229930182827 D-tryptophan Natural products 0.000 description 2
- QIVBCDIJIAJPQS-SECBINFHSA-N D-tryptophane Chemical compound C1=CC=C2C(C[C@@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-SECBINFHSA-N 0.000 description 2
- OUYCCCASQSFEME-MRVPVSSYSA-N D-tyrosine Chemical compound OC(=O)[C@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-MRVPVSSYSA-N 0.000 description 2
- 229930195709 D-tyrosine Natural products 0.000 description 2
- KZSNJWFQEVHDMF-SCSAIBSYSA-N D-valine Chemical compound CC(C)[C@@H](N)C(O)=O KZSNJWFQEVHDMF-SCSAIBSYSA-N 0.000 description 2
- 229930182831 D-valine Natural products 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- 241000702421 Dependoparvovirus Species 0.000 description 2
- 229930195710 D‐cysteine Natural products 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 2
- 241000287828 Gallus gallus Species 0.000 description 2
- 241000008920 Gammacoronavirus Species 0.000 description 2
- HHWQMFIGMMOVFK-WDSKDSINSA-N Gln-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O HHWQMFIGMMOVFK-WDSKDSINSA-N 0.000 description 2
- XEYMBRRKIFYQMF-GUBZILKMSA-N Gln-Asp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XEYMBRRKIFYQMF-GUBZILKMSA-N 0.000 description 2
- IXFVOPOHSRKJNG-LAEOZQHASA-N Gln-Asp-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IXFVOPOHSRKJNG-LAEOZQHASA-N 0.000 description 2
- ZDJZEGYVKANKED-NRPADANISA-N Gln-Cys-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O ZDJZEGYVKANKED-NRPADANISA-N 0.000 description 2
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 2
- MAGNEQBFSBREJL-DCAQKATOSA-N Gln-Glu-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N MAGNEQBFSBREJL-DCAQKATOSA-N 0.000 description 2
- XJKAKYXMFHUIHT-AUTRQRHGSA-N Gln-Glu-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N XJKAKYXMFHUIHT-AUTRQRHGSA-N 0.000 description 2
- XKBASPWPBXNVLQ-WDSKDSINSA-N Gln-Gly-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XKBASPWPBXNVLQ-WDSKDSINSA-N 0.000 description 2
- VGTDBGYFVWOQTI-RYUDHWBXSA-N Gln-Gly-Phe Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VGTDBGYFVWOQTI-RYUDHWBXSA-N 0.000 description 2
- RGAOLBZBLOJUTP-GRLWGSQLSA-N Gln-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CCC(=O)N)N RGAOLBZBLOJUTP-GRLWGSQLSA-N 0.000 description 2
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 2
- YPMDZWPZFOZYFG-GUBZILKMSA-N Gln-Leu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YPMDZWPZFOZYFG-GUBZILKMSA-N 0.000 description 2
- MLSKFHLRFVGNLL-WDCWCFNPSA-N Gln-Leu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MLSKFHLRFVGNLL-WDCWCFNPSA-N 0.000 description 2
- FKXCBKCOSVIGCT-AVGNSLFASA-N Gln-Lys-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FKXCBKCOSVIGCT-AVGNSLFASA-N 0.000 description 2
- ILKYYKRAULNYMS-JYJNAYRXSA-N Gln-Lys-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ILKYYKRAULNYMS-JYJNAYRXSA-N 0.000 description 2
- KLKYKPXITJBSNI-CIUDSAMLSA-N Gln-Met-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O KLKYKPXITJBSNI-CIUDSAMLSA-N 0.000 description 2
- AQPZYBSRDRZBAG-AVGNSLFASA-N Gln-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N AQPZYBSRDRZBAG-AVGNSLFASA-N 0.000 description 2
- XUMFMAVDHQDATI-DCAQKATOSA-N Gln-Pro-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XUMFMAVDHQDATI-DCAQKATOSA-N 0.000 description 2
- MQJDLNRXBOELJW-KKUMJFAQSA-N Gln-Pro-Phe Chemical compound N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O MQJDLNRXBOELJW-KKUMJFAQSA-N 0.000 description 2
- DCWNCMRZIZSZBL-KKUMJFAQSA-N Gln-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)N)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O DCWNCMRZIZSZBL-KKUMJFAQSA-N 0.000 description 2
- SXFPZRRVWSUYII-KBIXCLLPSA-N Gln-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N SXFPZRRVWSUYII-KBIXCLLPSA-N 0.000 description 2
- GHAXJVNBAKGWEJ-AVGNSLFASA-N Gln-Ser-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GHAXJVNBAKGWEJ-AVGNSLFASA-N 0.000 description 2
- UXXIVIQGOODKQC-NUMRIWBASA-N Gln-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UXXIVIQGOODKQC-NUMRIWBASA-N 0.000 description 2
- ARYKRXHBIPLULY-XKBZYTNZSA-N Gln-Thr-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ARYKRXHBIPLULY-XKBZYTNZSA-N 0.000 description 2
- UQKVUFGUSVYJMQ-IRIUXVKKSA-N Gln-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)N)N)O UQKVUFGUSVYJMQ-IRIUXVKKSA-N 0.000 description 2
- ZZLDMBMFKZFQMU-NRPADANISA-N Gln-Val-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O ZZLDMBMFKZFQMU-NRPADANISA-N 0.000 description 2
- DIXKFOPPGWKZLY-CIUDSAMLSA-N Glu-Arg-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O DIXKFOPPGWKZLY-CIUDSAMLSA-N 0.000 description 2
- RDDSZZJOKDVPAE-ACZMJKKPSA-N Glu-Asn-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDDSZZJOKDVPAE-ACZMJKKPSA-N 0.000 description 2
- OBIHEDRRSMRKLU-ACZMJKKPSA-N Glu-Cys-Asp Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OBIHEDRRSMRKLU-ACZMJKKPSA-N 0.000 description 2
- CLROYXHHUZELFX-FXQIFTODSA-N Glu-Gln-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O CLROYXHHUZELFX-FXQIFTODSA-N 0.000 description 2
- CJWANNXUTOATSJ-DCAQKATOSA-N Glu-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N CJWANNXUTOATSJ-DCAQKATOSA-N 0.000 description 2
- KRGZZKWSBGPLKL-IUCAKERBSA-N Glu-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N KRGZZKWSBGPLKL-IUCAKERBSA-N 0.000 description 2
- ZWQVYZXPYSYPJD-RYUDHWBXSA-N Glu-Gly-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZWQVYZXPYSYPJD-RYUDHWBXSA-N 0.000 description 2
- HILMIYALTUQTRC-XVKPBYJWSA-N Glu-Gly-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HILMIYALTUQTRC-XVKPBYJWSA-N 0.000 description 2
- KRRFFAHEAOCBCQ-SIUGBPQLSA-N Glu-Ile-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KRRFFAHEAOCBCQ-SIUGBPQLSA-N 0.000 description 2
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 2
- OCJRHJZKGGSPRW-IUCAKERBSA-N Glu-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O OCJRHJZKGGSPRW-IUCAKERBSA-N 0.000 description 2
- FQFWFZWOHOEVMZ-IHRRRGAJSA-N Glu-Phe-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O FQFWFZWOHOEVMZ-IHRRRGAJSA-N 0.000 description 2
- KXTAGESXNQEZKB-DZKIICNBSA-N Glu-Phe-Val Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 KXTAGESXNQEZKB-DZKIICNBSA-N 0.000 description 2
- GMVCSRBOSIUTFC-FXQIFTODSA-N Glu-Ser-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMVCSRBOSIUTFC-FXQIFTODSA-N 0.000 description 2
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 2
- YMUFWNJHVPQNQD-ZKWXMUAHSA-N Gly-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN YMUFWNJHVPQNQD-ZKWXMUAHSA-N 0.000 description 2
- JVACNFOPSUPDTK-QWRGUYRKSA-N Gly-Asn-Phe Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JVACNFOPSUPDTK-QWRGUYRKSA-N 0.000 description 2
- LURCIJSJAKFCRO-QWRGUYRKSA-N Gly-Asn-Tyr Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LURCIJSJAKFCRO-QWRGUYRKSA-N 0.000 description 2
- XBWMTPAIUQIWKA-BYULHYEWSA-N Gly-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN XBWMTPAIUQIWKA-BYULHYEWSA-N 0.000 description 2
- IXKRSKPKSLXIHN-YUMQZZPRSA-N Gly-Cys-Leu Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O IXKRSKPKSLXIHN-YUMQZZPRSA-N 0.000 description 2
- PEZZSFLFXXFUQD-XPUUQOCRSA-N Gly-Cys-Val Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O PEZZSFLFXXFUQD-XPUUQOCRSA-N 0.000 description 2
- GNPVTZJUUBPZKW-WDSKDSINSA-N Gly-Gln-Ser Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GNPVTZJUUBPZKW-WDSKDSINSA-N 0.000 description 2
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 2
- XVYKMNXXJXQKME-XEGUGMAKSA-N Gly-Ile-Tyr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XVYKMNXXJXQKME-XEGUGMAKSA-N 0.000 description 2
- COVXELOAORHTND-LSJOCFKGSA-N Gly-Ile-Val Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O COVXELOAORHTND-LSJOCFKGSA-N 0.000 description 2
- FHQRLHFYVZAQHU-IUCAKERBSA-N Gly-Lys-Gln Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O FHQRLHFYVZAQHU-IUCAKERBSA-N 0.000 description 2
- PDUHNKAFQXQNLH-ZETCQYMHSA-N Gly-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)NCC(O)=O PDUHNKAFQXQNLH-ZETCQYMHSA-N 0.000 description 2
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 2
- GGAPHLIUUTVYMX-QWRGUYRKSA-N Gly-Phe-Ser Chemical compound OC[C@@H](C([O-])=O)NC(=O)[C@@H](NC(=O)C[NH3+])CC1=CC=CC=C1 GGAPHLIUUTVYMX-QWRGUYRKSA-N 0.000 description 2
- IALQAMYQJBZNSK-WHFBIAKZSA-N Gly-Ser-Asn Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O IALQAMYQJBZNSK-WHFBIAKZSA-N 0.000 description 2
- JSLVAHYTAJJEQH-QWRGUYRKSA-N Gly-Ser-Phe Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JSLVAHYTAJJEQH-QWRGUYRKSA-N 0.000 description 2
- FKESCSGWBPUTPN-FOHZUACHSA-N Gly-Thr-Asn Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O FKESCSGWBPUTPN-FOHZUACHSA-N 0.000 description 2
- HUFUVTYGPOUCBN-MBLNEYKQSA-N Gly-Thr-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HUFUVTYGPOUCBN-MBLNEYKQSA-N 0.000 description 2
- XHVONGZZVUUORG-WEDXCCLWSA-N Gly-Thr-Lys Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN XHVONGZZVUUORG-WEDXCCLWSA-N 0.000 description 2
- TVTZEOHWHUVYCG-KYNKHSRBSA-N Gly-Thr-Thr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O TVTZEOHWHUVYCG-KYNKHSRBSA-N 0.000 description 2
- WTUSRDZLLWGYAT-KCTSRDHCSA-N Gly-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)CN WTUSRDZLLWGYAT-KCTSRDHCSA-N 0.000 description 2
- NWOSHVVPKDQKKT-RYUDHWBXSA-N Gly-Tyr-Gln Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O NWOSHVVPKDQKKT-RYUDHWBXSA-N 0.000 description 2
- OCRQUYDOYKCOQG-IRXDYDNUSA-N Gly-Tyr-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 OCRQUYDOYKCOQG-IRXDYDNUSA-N 0.000 description 2
- SYOJVRNQCXYEOV-XVKPBYJWSA-N Gly-Val-Glu Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SYOJVRNQCXYEOV-XVKPBYJWSA-N 0.000 description 2
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 2
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 2
- HTZKFIYQMHJWSQ-INTQDDNPSA-N His-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N HTZKFIYQMHJWSQ-INTQDDNPSA-N 0.000 description 2
- LSQHWKPPOFDHHZ-YUMQZZPRSA-N His-Asp-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N LSQHWKPPOFDHHZ-YUMQZZPRSA-N 0.000 description 2
- FHGVHXCQMJWQPK-SRVKXCTJSA-N His-Lys-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O FHGVHXCQMJWQPK-SRVKXCTJSA-N 0.000 description 2
- ILUVWFTXAUYOBW-CUJWVEQBSA-N His-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CN=CN1)N)O ILUVWFTXAUYOBW-CUJWVEQBSA-N 0.000 description 2
- UPJODPVSKKWGDQ-KLHWPWHYSA-N His-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)O UPJODPVSKKWGDQ-KLHWPWHYSA-N 0.000 description 2
- KECFCPNPPYCGBL-PMVMPFDFSA-N His-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CC4=CN=CN4)N KECFCPNPPYCGBL-PMVMPFDFSA-N 0.000 description 2
- GYXDQXPCPASCNR-NHCYSSNCSA-N His-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N GYXDQXPCPASCNR-NHCYSSNCSA-N 0.000 description 2
- XGBVLRJLHUVCNK-DCAQKATOSA-N His-Val-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O XGBVLRJLHUVCNK-DCAQKATOSA-N 0.000 description 2
- 101000638154 Homo sapiens Transmembrane protease serine 2 Proteins 0.000 description 2
- 244000309467 Human Coronavirus Species 0.000 description 2
- 241000711467 Human coronavirus 229E Species 0.000 description 2
- 241001109669 Human coronavirus HKU1 Species 0.000 description 2
- 241000482741 Human coronavirus NL63 Species 0.000 description 2
- 241001428935 Human coronavirus OC43 Species 0.000 description 2
- MHAJPDPJQMAIIY-UHFFFAOYSA-N Hydrogen peroxide Chemical compound OO MHAJPDPJQMAIIY-UHFFFAOYSA-N 0.000 description 2
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 2
- VSZALHITQINTGC-GHCJXIJMSA-N Ile-Ala-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VSZALHITQINTGC-GHCJXIJMSA-N 0.000 description 2
- WZPIKDWQVRTATP-SYWGBEHUSA-N Ile-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 WZPIKDWQVRTATP-SYWGBEHUSA-N 0.000 description 2
- HERITAGIPLEJMT-GVARAGBVSA-N Ile-Ala-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HERITAGIPLEJMT-GVARAGBVSA-N 0.000 description 2
- MKWSZEHGHSLNPF-NAKRPEOUSA-N Ile-Ala-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O)N MKWSZEHGHSLNPF-NAKRPEOUSA-N 0.000 description 2
- XENGULNPUDGALZ-ZPFDUUQYSA-N Ile-Asn-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N XENGULNPUDGALZ-ZPFDUUQYSA-N 0.000 description 2
- UMYZBHKAVTXWIW-GMOBBJLQSA-N Ile-Asp-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UMYZBHKAVTXWIW-GMOBBJLQSA-N 0.000 description 2
- NKRJALPCDNXULF-BYULHYEWSA-N Ile-Asp-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O NKRJALPCDNXULF-BYULHYEWSA-N 0.000 description 2
- LOXMWQOKYBGCHF-JBDRJPRFSA-N Ile-Cys-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O LOXMWQOKYBGCHF-JBDRJPRFSA-N 0.000 description 2
- KIMHKBDJQQYLHU-PEFMBERDSA-N Ile-Glu-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KIMHKBDJQQYLHU-PEFMBERDSA-N 0.000 description 2
- MQFGXJNSUJTXDT-QSFUFRPTSA-N Ile-Gly-Ile Chemical compound N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)O MQFGXJNSUJTXDT-QSFUFRPTSA-N 0.000 description 2
- APDIECQNNDGFPD-PYJNHQTQSA-N Ile-His-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C(C)C)C(=O)O)N APDIECQNNDGFPD-PYJNHQTQSA-N 0.000 description 2
- KYLIZSDYWQQTFM-PEDHHIEDSA-N Ile-Ile-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N KYLIZSDYWQQTFM-PEDHHIEDSA-N 0.000 description 2
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 2
- PMMMQRVUMVURGJ-XUXIUFHCSA-N Ile-Leu-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O PMMMQRVUMVURGJ-XUXIUFHCSA-N 0.000 description 2
- PNTWNAXGBOZMBO-MNXVOIDGSA-N Ile-Lys-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PNTWNAXGBOZMBO-MNXVOIDGSA-N 0.000 description 2
- RQJUKVXWAKJDBW-SVSWQMSJSA-N Ile-Ser-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N RQJUKVXWAKJDBW-SVSWQMSJSA-N 0.000 description 2
- PZWBBXHHUSIGKH-OSUNSFLBSA-N Ile-Thr-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PZWBBXHHUSIGKH-OSUNSFLBSA-N 0.000 description 2
- YBKKLDBBPFIXBQ-MBLNEYKQSA-N Ile-Thr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)O)N YBKKLDBBPFIXBQ-MBLNEYKQSA-N 0.000 description 2
- WCNWGAUZWWSYDG-SVSWQMSJSA-N Ile-Thr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)O)N WCNWGAUZWWSYDG-SVSWQMSJSA-N 0.000 description 2
- ZGKVPOSSTGHJAF-HJPIBITLSA-N Ile-Tyr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CO)C(=O)O)N ZGKVPOSSTGHJAF-HJPIBITLSA-N 0.000 description 2
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 2
- 102000000588 Interleukin-2 Human genes 0.000 description 2
- 108090001005 Interleukin-6 Proteins 0.000 description 2
- UGTHTQWIQKEDEH-BQBZGAKWSA-N L-alanyl-L-prolylglycine zwitterion Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UGTHTQWIQKEDEH-BQBZGAKWSA-N 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 2
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 2
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 2
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 2
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 2
- IGUOAYLTQJLPPD-DCAQKATOSA-N Leu-Asn-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IGUOAYLTQJLPPD-DCAQKATOSA-N 0.000 description 2
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 2
- HUEBCHPSXSQUGN-GARJFASQSA-N Leu-Cys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N HUEBCHPSXSQUGN-GARJFASQSA-N 0.000 description 2
- RSFGIMMPWAXNML-MNXVOIDGSA-N Leu-Gln-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RSFGIMMPWAXNML-MNXVOIDGSA-N 0.000 description 2
- KUEVMUXNILMJTK-JYJNAYRXSA-N Leu-Gln-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KUEVMUXNILMJTK-JYJNAYRXSA-N 0.000 description 2
- OGUUKPXUTHOIAV-SDDRHHMPSA-N Leu-Glu-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N OGUUKPXUTHOIAV-SDDRHHMPSA-N 0.000 description 2
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 2
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 2
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 2
- PBGDOSARRIJMEV-DLOVCJGASA-N Leu-His-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O PBGDOSARRIJMEV-DLOVCJGASA-N 0.000 description 2
- FAELBUXXFQLUAX-AJNGGQMLSA-N Leu-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C FAELBUXXFQLUAX-AJNGGQMLSA-N 0.000 description 2
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 2
- RTIRBWJPYJYTLO-MELADBBJSA-N Leu-Lys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N RTIRBWJPYJYTLO-MELADBBJSA-N 0.000 description 2
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 2
- ONPJGOIVICHWBW-BZSNNMDCSA-N Leu-Lys-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 ONPJGOIVICHWBW-BZSNNMDCSA-N 0.000 description 2
- GCXGCIYIHXSKAY-ULQDDVLXSA-N Leu-Phe-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GCXGCIYIHXSKAY-ULQDDVLXSA-N 0.000 description 2
- BIZNDKMFQHDOIE-KKUMJFAQSA-N Leu-Phe-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 BIZNDKMFQHDOIE-KKUMJFAQSA-N 0.000 description 2
- XWEVVRRSIOBJOO-SRVKXCTJSA-N Leu-Pro-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O XWEVVRRSIOBJOO-SRVKXCTJSA-N 0.000 description 2
- YUTNOGOMBNYPFH-XUXIUFHCSA-N Leu-Pro-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YUTNOGOMBNYPFH-XUXIUFHCSA-N 0.000 description 2
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 2
- IWMJFLJQHIDZQW-KKUMJFAQSA-N Leu-Ser-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IWMJFLJQHIDZQW-KKUMJFAQSA-N 0.000 description 2
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 2
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 2
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 2
- UCRJTSIIAYHOHE-ULQDDVLXSA-N Leu-Tyr-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UCRJTSIIAYHOHE-ULQDDVLXSA-N 0.000 description 2
- WUHBLPVELFTPQK-KKUMJFAQSA-N Leu-Tyr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O WUHBLPVELFTPQK-KKUMJFAQSA-N 0.000 description 2
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 2
- CGHXMODRYJISSK-NHCYSSNCSA-N Leu-Val-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O CGHXMODRYJISSK-NHCYSSNCSA-N 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- BTSXLXFPMZXVPR-DLOVCJGASA-N Lys-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCCN)N BTSXLXFPMZXVPR-DLOVCJGASA-N 0.000 description 2
- WALVCOOOKULCQM-ULQDDVLXSA-N Lys-Arg-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WALVCOOOKULCQM-ULQDDVLXSA-N 0.000 description 2
- NQCJGQHHYZNUDK-DCAQKATOSA-N Lys-Arg-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CCCN=C(N)N NQCJGQHHYZNUDK-DCAQKATOSA-N 0.000 description 2
- NTSPQIONFJUMJV-AVGNSLFASA-N Lys-Arg-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O NTSPQIONFJUMJV-AVGNSLFASA-N 0.000 description 2
- ZQCVMVCVPFYXHZ-SRVKXCTJSA-N Lys-Asn-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN ZQCVMVCVPFYXHZ-SRVKXCTJSA-N 0.000 description 2
- QUCDKEKDPYISNX-HJGDQZAQSA-N Lys-Asn-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QUCDKEKDPYISNX-HJGDQZAQSA-N 0.000 description 2
- YVMQJGWLHRWMDF-MNXVOIDGSA-N Lys-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N YVMQJGWLHRWMDF-MNXVOIDGSA-N 0.000 description 2
- OJDFAABAHBPVTH-MNXVOIDGSA-N Lys-Ile-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O OJDFAABAHBPVTH-MNXVOIDGSA-N 0.000 description 2
- XREQQOATSMMAJP-MGHWNKPDSA-N Lys-Ile-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XREQQOATSMMAJP-MGHWNKPDSA-N 0.000 description 2
- NJNRBRKHOWSGMN-SRVKXCTJSA-N Lys-Leu-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O NJNRBRKHOWSGMN-SRVKXCTJSA-N 0.000 description 2
- YPLVCBKEPJPBDQ-MELADBBJSA-N Lys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N YPLVCBKEPJPBDQ-MELADBBJSA-N 0.000 description 2
- YTJFXEDRUOQGSP-DCAQKATOSA-N Lys-Pro-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O YTJFXEDRUOQGSP-DCAQKATOSA-N 0.000 description 2
- MIFFFXHMAHFACR-KATARQTJSA-N Lys-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN MIFFFXHMAHFACR-KATARQTJSA-N 0.000 description 2
- UWHCKWNPWKTMBM-WDCWCFNPSA-N Lys-Thr-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O UWHCKWNPWKTMBM-WDCWCFNPSA-N 0.000 description 2
- QFSYGUMEANRNJE-DCAQKATOSA-N Lys-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N QFSYGUMEANRNJE-DCAQKATOSA-N 0.000 description 2
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 2
- OSOLWRWQADPDIQ-DCAQKATOSA-N Met-Asp-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OSOLWRWQADPDIQ-DCAQKATOSA-N 0.000 description 2
- FZUNSVYYPYJYAP-NAKRPEOUSA-N Met-Ile-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O FZUNSVYYPYJYAP-NAKRPEOUSA-N 0.000 description 2
- RMLLCGYYVZKKRT-CIUDSAMLSA-N Met-Ser-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O RMLLCGYYVZKKRT-CIUDSAMLSA-N 0.000 description 2
- FIZZULTXMVEIAA-IHRRRGAJSA-N Met-Ser-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FIZZULTXMVEIAA-IHRRRGAJSA-N 0.000 description 2
- IHRFZLQEQVHXFA-RHYQMDGZSA-N Met-Thr-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCCN IHRFZLQEQVHXFA-RHYQMDGZSA-N 0.000 description 2
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 2
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 2
- 108010079364 N-glycylalanine Proteins 0.000 description 2
- 239000000020 Nitrocellulose Substances 0.000 description 2
- 101710163270 Nuclease Proteins 0.000 description 2
- 241000283973 Oryctolagus cuniculus Species 0.000 description 2
- 241000286209 Phasianidae Species 0.000 description 2
- AJOKKVTWEMXZHC-DRZSPHRISA-N Phe-Ala-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 AJOKKVTWEMXZHC-DRZSPHRISA-N 0.000 description 2
- JNRFYJZCMHHGMH-UBHSHLNASA-N Phe-Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JNRFYJZCMHHGMH-UBHSHLNASA-N 0.000 description 2
- UHRNIXJAGGLKHP-DLOVCJGASA-N Phe-Ala-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O UHRNIXJAGGLKHP-DLOVCJGASA-N 0.000 description 2
- YYRCPTVAPLQRNC-ULQDDVLXSA-N Phe-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CC1=CC=CC=C1 YYRCPTVAPLQRNC-ULQDDVLXSA-N 0.000 description 2
- JEGFCFLCRSJCMA-IHRRRGAJSA-N Phe-Arg-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N JEGFCFLCRSJCMA-IHRRRGAJSA-N 0.000 description 2
- LJUUGSWZPQOJKD-JYJNAYRXSA-N Phe-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O LJUUGSWZPQOJKD-JYJNAYRXSA-N 0.000 description 2
- AWAYOWOUGVZXOB-BZSNNMDCSA-N Phe-Asn-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 AWAYOWOUGVZXOB-BZSNNMDCSA-N 0.000 description 2
- WMGVYPPIMZPWPN-SRVKXCTJSA-N Phe-Asp-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N WMGVYPPIMZPWPN-SRVKXCTJSA-N 0.000 description 2
- OMHMIXFFRPMYHB-SRVKXCTJSA-N Phe-Cys-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OMHMIXFFRPMYHB-SRVKXCTJSA-N 0.000 description 2
- IILUKIJNFMUBNF-IHRRRGAJSA-N Phe-Gln-Gln Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O IILUKIJNFMUBNF-IHRRRGAJSA-N 0.000 description 2
- GDBOREPXIRKSEQ-FHWLQOOXSA-N Phe-Gln-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GDBOREPXIRKSEQ-FHWLQOOXSA-N 0.000 description 2
- IDUCUXTUHHIQIP-SOUVJXGZSA-N Phe-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O IDUCUXTUHHIQIP-SOUVJXGZSA-N 0.000 description 2
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 2
- UAMFZRNCIFFMLE-FHWLQOOXSA-N Phe-Glu-Tyr Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N UAMFZRNCIFFMLE-FHWLQOOXSA-N 0.000 description 2
- RFEXGCASCQGGHZ-STQMWFEESA-N Phe-Gly-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O RFEXGCASCQGGHZ-STQMWFEESA-N 0.000 description 2
- ZLGQEBCCANLYRA-RYUDHWBXSA-N Phe-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O ZLGQEBCCANLYRA-RYUDHWBXSA-N 0.000 description 2
- QPVFUAUFEBPIPT-CDMKHQONSA-N Phe-Gly-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O QPVFUAUFEBPIPT-CDMKHQONSA-N 0.000 description 2
- PMKIMKUGCSVFSV-CQDKDKBSSA-N Phe-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=CC=C2)N PMKIMKUGCSVFSV-CQDKDKBSSA-N 0.000 description 2
- METZZBCMDXHFMK-BZSNNMDCSA-N Phe-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N METZZBCMDXHFMK-BZSNNMDCSA-N 0.000 description 2
- KPEIBEPEUAZWNS-ULQDDVLXSA-N Phe-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KPEIBEPEUAZWNS-ULQDDVLXSA-N 0.000 description 2
- CJAHQEZWDZNSJO-KKUMJFAQSA-N Phe-Lys-Cys Chemical compound NCCCC[C@@H](C(=O)N[C@@H](CS)C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CJAHQEZWDZNSJO-KKUMJFAQSA-N 0.000 description 2
- GPLWGAYGROGDEN-BZSNNMDCSA-N Phe-Phe-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O GPLWGAYGROGDEN-BZSNNMDCSA-N 0.000 description 2
- WWPAHTZOWURIMR-ULQDDVLXSA-N Phe-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 WWPAHTZOWURIMR-ULQDDVLXSA-N 0.000 description 2
- YMIZSYUAZJSOFL-SRVKXCTJSA-N Phe-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O YMIZSYUAZJSOFL-SRVKXCTJSA-N 0.000 description 2
- HBXAOEBRGLCLIW-AVGNSLFASA-N Phe-Ser-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HBXAOEBRGLCLIW-AVGNSLFASA-N 0.000 description 2
- IAOZOFPONWDXNT-IXOXFDKPSA-N Phe-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IAOZOFPONWDXNT-IXOXFDKPSA-N 0.000 description 2
- JHSRGEODDALISP-XVSYOHENSA-N Phe-Thr-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O JHSRGEODDALISP-XVSYOHENSA-N 0.000 description 2
- MSSXKZBDKZAHCX-UNQGMJICSA-N Phe-Thr-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O MSSXKZBDKZAHCX-UNQGMJICSA-N 0.000 description 2
- IEIFEYBAYFSRBQ-IHRRRGAJSA-N Phe-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N IEIFEYBAYFSRBQ-IHRRRGAJSA-N 0.000 description 2
- 241000235648 Pichia Species 0.000 description 2
- 239000002202 Polyethylene glycol Substances 0.000 description 2
- 229920001213 Polysorbate 20 Polymers 0.000 description 2
- WCUXLLCKKVVCTQ-UHFFFAOYSA-M Potassium chloride Chemical compound [Cl-].[K+] WCUXLLCKKVVCTQ-UHFFFAOYSA-M 0.000 description 2
- HFZNNDWPHBRNPV-KZVJFYERSA-N Pro-Ala-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HFZNNDWPHBRNPV-KZVJFYERSA-N 0.000 description 2
- LCRSGSIRKLXZMZ-BPNCWPANSA-N Pro-Ala-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LCRSGSIRKLXZMZ-BPNCWPANSA-N 0.000 description 2
- XKHCJJPNXFBADI-DCAQKATOSA-N Pro-Asp-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O XKHCJJPNXFBADI-DCAQKATOSA-N 0.000 description 2
- LUGOKRWYNMDGTD-FXQIFTODSA-N Pro-Cys-Asn Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O LUGOKRWYNMDGTD-FXQIFTODSA-N 0.000 description 2
- DIFXZGPHVCIVSQ-CIUDSAMLSA-N Pro-Gln-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DIFXZGPHVCIVSQ-CIUDSAMLSA-N 0.000 description 2
- LHALYDBUDCWMDY-CIUDSAMLSA-N Pro-Glu-Ala Chemical compound C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O LHALYDBUDCWMDY-CIUDSAMLSA-N 0.000 description 2
- NXEYSLRNNPWCRN-SRVKXCTJSA-N Pro-Glu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXEYSLRNNPWCRN-SRVKXCTJSA-N 0.000 description 2
- AFXCXDQNRXTSBD-FJXKBIBVSA-N Pro-Gly-Thr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O AFXCXDQNRXTSBD-FJXKBIBVSA-N 0.000 description 2
- BBFRBZYKHIKFBX-GMOBBJLQSA-N Pro-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@@H]1CCCN1 BBFRBZYKHIKFBX-GMOBBJLQSA-N 0.000 description 2
- SUENWIFTSTWUKD-AVGNSLFASA-N Pro-Leu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SUENWIFTSTWUKD-AVGNSLFASA-N 0.000 description 2
- DWGFLKQSGRUQTI-IHRRRGAJSA-N Pro-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 DWGFLKQSGRUQTI-IHRRRGAJSA-N 0.000 description 2
- VGVCNKSUVSZEIE-IHRRRGAJSA-N Pro-Phe-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O VGVCNKSUVSZEIE-IHRRRGAJSA-N 0.000 description 2
- JIWJRKNYLSHONY-KKUMJFAQSA-N Pro-Phe-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JIWJRKNYLSHONY-KKUMJFAQSA-N 0.000 description 2
- WHNJMTHJGCEKGA-ULQDDVLXSA-N Pro-Phe-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WHNJMTHJGCEKGA-ULQDDVLXSA-N 0.000 description 2
- CGSOWZUPLOKYOR-AVGNSLFASA-N Pro-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 CGSOWZUPLOKYOR-AVGNSLFASA-N 0.000 description 2
- IURWWZYKYPEANQ-HJGDQZAQSA-N Pro-Thr-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O IURWWZYKYPEANQ-HJGDQZAQSA-N 0.000 description 2
- KHRLUIPIMIQFGT-AVGNSLFASA-N Pro-Val-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHRLUIPIMIQFGT-AVGNSLFASA-N 0.000 description 2
- FIODMZKLZFLYQP-GUBZILKMSA-N Pro-Val-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FIODMZKLZFLYQP-GUBZILKMSA-N 0.000 description 2
- 241000589516 Pseudomonas Species 0.000 description 2
- 241000700159 Rattus Species 0.000 description 2
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 2
- YMEXHZTVKDAKIY-GHCJXIJMSA-N Ser-Asn-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO)C(O)=O YMEXHZTVKDAKIY-GHCJXIJMSA-N 0.000 description 2
- VGNYHOBZJKWRGI-CIUDSAMLSA-N Ser-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO VGNYHOBZJKWRGI-CIUDSAMLSA-N 0.000 description 2
- KAAPNMOKUUPKOE-SRVKXCTJSA-N Ser-Asn-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KAAPNMOKUUPKOE-SRVKXCTJSA-N 0.000 description 2
- DSGYZICNAMEJOC-AVGNSLFASA-N Ser-Glu-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DSGYZICNAMEJOC-AVGNSLFASA-N 0.000 description 2
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 2
- DOSZISJPMCYEHT-NAKRPEOUSA-N Ser-Ile-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O DOSZISJPMCYEHT-NAKRPEOUSA-N 0.000 description 2
- GJFYFGOEWLDQGW-GUBZILKMSA-N Ser-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GJFYFGOEWLDQGW-GUBZILKMSA-N 0.000 description 2
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 2
- SRKMDKACHDVPMD-SRVKXCTJSA-N Ser-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N SRKMDKACHDVPMD-SRVKXCTJSA-N 0.000 description 2
- PMCMLDNPAZUYGI-DCAQKATOSA-N Ser-Lys-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMCMLDNPAZUYGI-DCAQKATOSA-N 0.000 description 2
- XKFJENWJGHMDLI-QWRGUYRKSA-N Ser-Phe-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O XKFJENWJGHMDLI-QWRGUYRKSA-N 0.000 description 2
- QMCDMHWAKMUGJE-IHRRRGAJSA-N Ser-Phe-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O QMCDMHWAKMUGJE-IHRRRGAJSA-N 0.000 description 2
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 2
- FLONGDPORFIVQW-XGEHTFHBSA-N Ser-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FLONGDPORFIVQW-XGEHTFHBSA-N 0.000 description 2
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 2
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 2
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 2
- SQHKXWODKJDZRC-LKXGYXEUSA-N Ser-Thr-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQHKXWODKJDZRC-LKXGYXEUSA-N 0.000 description 2
- SZRNDHWMVSFPSP-XKBZYTNZSA-N Ser-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N)O SZRNDHWMVSFPSP-XKBZYTNZSA-N 0.000 description 2
- ZSDXEKUKQAKZFE-XAVMHZPKSA-N Ser-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N)O ZSDXEKUKQAKZFE-XAVMHZPKSA-N 0.000 description 2
- FRPNVPKQVFHSQY-BPUTZDHNSA-N Ser-Trp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N FRPNVPKQVFHSQY-BPUTZDHNSA-N 0.000 description 2
- 241000008910 Severe acute respiratory syndrome-related coronavirus Species 0.000 description 2
- 102220590628 Spindlin-1_L18F_mutation Human genes 0.000 description 2
- 102220642430 Spindlin-1_P681R_mutation Human genes 0.000 description 2
- 238000000692 Student's t-test Methods 0.000 description 2
- 241000282887 Suidae Species 0.000 description 2
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 2
- 238000010459 TALEN Methods 0.000 description 2
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 2
- CAGTXGDOIFXLPC-KZVJFYERSA-N Thr-Arg-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CCCN=C(N)N CAGTXGDOIFXLPC-KZVJFYERSA-N 0.000 description 2
- TWLMXDWFVNEFFK-FJXKBIBVSA-N Thr-Arg-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O TWLMXDWFVNEFFK-FJXKBIBVSA-N 0.000 description 2
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 2
- TZKPNGDGUVREEB-FOHZUACHSA-N Thr-Asn-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O TZKPNGDGUVREEB-FOHZUACHSA-N 0.000 description 2
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 2
- YBXMGKCLOPDEKA-NUMRIWBASA-N Thr-Asp-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YBXMGKCLOPDEKA-NUMRIWBASA-N 0.000 description 2
- LIXBDERDAGNVAV-XKBZYTNZSA-N Thr-Gln-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O LIXBDERDAGNVAV-XKBZYTNZSA-N 0.000 description 2
- VOHWDZNIESHTFW-XKBZYTNZSA-N Thr-Glu-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N)O VOHWDZNIESHTFW-XKBZYTNZSA-N 0.000 description 2
- HJOSVGCWOTYJFG-WDCWCFNPSA-N Thr-Glu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O HJOSVGCWOTYJFG-WDCWCFNPSA-N 0.000 description 2
- MPUMPERGHHJGRP-WEDXCCLWSA-N Thr-Gly-Lys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O MPUMPERGHHJGRP-WEDXCCLWSA-N 0.000 description 2
- JKGGPMOUIAAJAA-YEPSODPASA-N Thr-Gly-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O JKGGPMOUIAAJAA-YEPSODPASA-N 0.000 description 2
- GXUWHVZYDAHFSV-FLBSBUHZSA-N Thr-Ile-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GXUWHVZYDAHFSV-FLBSBUHZSA-N 0.000 description 2
- RRRRCRYTLZVCEN-HJGDQZAQSA-N Thr-Leu-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O RRRRCRYTLZVCEN-HJGDQZAQSA-N 0.000 description 2
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 2
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 2
- WRUWXBBEFUTJOU-XGEHTFHBSA-N Thr-Met-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N)O WRUWXBBEFUTJOU-XGEHTFHBSA-N 0.000 description 2
- NZRUWPIYECBYRK-HTUGSXCWSA-N Thr-Phe-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O NZRUWPIYECBYRK-HTUGSXCWSA-N 0.000 description 2
- WNQJTLATMXYSEL-OEAJRASXSA-N Thr-Phe-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WNQJTLATMXYSEL-OEAJRASXSA-N 0.000 description 2
- STUAPCLEDMKXKL-LKXGYXEUSA-N Thr-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O STUAPCLEDMKXKL-LKXGYXEUSA-N 0.000 description 2
- IEZVHOULSUULHD-XGEHTFHBSA-N Thr-Ser-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O IEZVHOULSUULHD-XGEHTFHBSA-N 0.000 description 2
- YRJOLUDFVAUXLI-GSSVUCPTSA-N Thr-Thr-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O YRJOLUDFVAUXLI-GSSVUCPTSA-N 0.000 description 2
- ZOCJFNXUVSGBQI-HSHDSVGOSA-N Thr-Trp-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O ZOCJFNXUVSGBQI-HSHDSVGOSA-N 0.000 description 2
- UMFLBPIPAJMNIM-LYARXQMPSA-N Thr-Trp-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CC=CC=C3)C(=O)O)N)O UMFLBPIPAJMNIM-LYARXQMPSA-N 0.000 description 2
- BKVICMPZWRNWOC-RHYQMDGZSA-N Thr-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O BKVICMPZWRNWOC-RHYQMDGZSA-N 0.000 description 2
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 2
- 102100031989 Transmembrane protease serine 2 Human genes 0.000 description 2
- HDTRYLNUVZCQOY-WSWWMNSNSA-N Trehalose Natural products O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-WSWWMNSNSA-N 0.000 description 2
- BYSKNUASOAGJSS-NQCBNZPSSA-N Trp-Ile-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N BYSKNUASOAGJSS-NQCBNZPSSA-N 0.000 description 2
- TUUXFNQXSFNFLX-XIRDDKMYSA-N Trp-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N TUUXFNQXSFNFLX-XIRDDKMYSA-N 0.000 description 2
- YCQXZDHDSUHUSG-FJHTZYQYSA-N Trp-Thr-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 YCQXZDHDSUHUSG-FJHTZYQYSA-N 0.000 description 2
- FBVGQXJIXFZKSQ-GMVOTWDCSA-N Tyr-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N FBVGQXJIXFZKSQ-GMVOTWDCSA-N 0.000 description 2
- ADBDQGBDNUTRDB-ULQDDVLXSA-N Tyr-Arg-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O ADBDQGBDNUTRDB-ULQDDVLXSA-N 0.000 description 2
- XHALUUQSNXSPLP-UFYCRDLUSA-N Tyr-Arg-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 XHALUUQSNXSPLP-UFYCRDLUSA-N 0.000 description 2
- MPKPIWFFDWVJGC-IRIUXVKKSA-N Tyr-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O MPKPIWFFDWVJGC-IRIUXVKKSA-N 0.000 description 2
- LOOCQRRBKZTPKO-AVGNSLFASA-N Tyr-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 LOOCQRRBKZTPKO-AVGNSLFASA-N 0.000 description 2
- LHTGRUZSZOIAKM-SOUVJXGZSA-N Tyr-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O LHTGRUZSZOIAKM-SOUVJXGZSA-N 0.000 description 2
- AKLNEFNQWLHIGY-QWRGUYRKSA-N Tyr-Gly-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N)O AKLNEFNQWLHIGY-QWRGUYRKSA-N 0.000 description 2
- NOOMDULIORCDNF-IRXDYDNUSA-N Tyr-Gly-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NOOMDULIORCDNF-IRXDYDNUSA-N 0.000 description 2
- CTDPLKMBVALCGN-JSGCOSHPSA-N Tyr-Gly-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O CTDPLKMBVALCGN-JSGCOSHPSA-N 0.000 description 2
- FBHBVXUBTYVCRU-BZSNNMDCSA-N Tyr-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CN=CN1 FBHBVXUBTYVCRU-BZSNNMDCSA-N 0.000 description 2
- WVGKPKDWYQXWLU-BZSNNMDCSA-N Tyr-His-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CCCCN)C(=O)O)N)O WVGKPKDWYQXWLU-BZSNNMDCSA-N 0.000 description 2
- JJNXZIPLIXIGBX-HJPIBITLSA-N Tyr-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N JJNXZIPLIXIGBX-HJPIBITLSA-N 0.000 description 2
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 2
- SINRIKQYQJRGDQ-MEYUZBJRSA-N Tyr-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 SINRIKQYQJRGDQ-MEYUZBJRSA-N 0.000 description 2
- WTTRJMAZPDHPGS-KKXDTOCCSA-N Tyr-Phe-Ala Chemical compound C[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(O)=O WTTRJMAZPDHPGS-KKXDTOCCSA-N 0.000 description 2
- KHPLUFDSWGDRHD-SLFFLAALSA-N Tyr-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O KHPLUFDSWGDRHD-SLFFLAALSA-N 0.000 description 2
- NWEGIYMHTZXVBP-JSGCOSHPSA-N Tyr-Val-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O NWEGIYMHTZXVBP-JSGCOSHPSA-N 0.000 description 2
- RVGVIWNHABGIFH-IHRRRGAJSA-N Tyr-Val-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O RVGVIWNHABGIFH-IHRRRGAJSA-N 0.000 description 2
- NMANTMWGQZASQN-QXEWZRGKSA-N Val-Arg-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N NMANTMWGQZASQN-QXEWZRGKSA-N 0.000 description 2
- BYOHPUZJVXWHAE-BYULHYEWSA-N Val-Asn-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N BYOHPUZJVXWHAE-BYULHYEWSA-N 0.000 description 2
- GXAZTLJYINLMJL-LAEOZQHASA-N Val-Asn-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N GXAZTLJYINLMJL-LAEOZQHASA-N 0.000 description 2
- QGFPYRPIUXBYGR-YDHLFZDLSA-N Val-Asn-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N QGFPYRPIUXBYGR-YDHLFZDLSA-N 0.000 description 2
- KXUKIBHIVRYOIP-ZKWXMUAHSA-N Val-Asp-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N KXUKIBHIVRYOIP-ZKWXMUAHSA-N 0.000 description 2
- KOPBYUSPXBQIHD-NRPADANISA-N Val-Cys-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KOPBYUSPXBQIHD-NRPADANISA-N 0.000 description 2
- FPCIBLUVDNXPJO-XPUUQOCRSA-N Val-Cys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O FPCIBLUVDNXPJO-XPUUQOCRSA-N 0.000 description 2
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 2
- SDUBQHUJJWQTEU-XUXIUFHCSA-N Val-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C(C)C)N SDUBQHUJJWQTEU-XUXIUFHCSA-N 0.000 description 2
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 2
- XTDDIVQWDXMRJL-IHRRRGAJSA-N Val-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N XTDDIVQWDXMRJL-IHRRRGAJSA-N 0.000 description 2
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 2
- VNGKMNPAENRGDC-JYJNAYRXSA-N Val-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 VNGKMNPAENRGDC-JYJNAYRXSA-N 0.000 description 2
- NZGOVKLVQNOEKP-YDHLFZDLSA-N Val-Phe-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NZGOVKLVQNOEKP-YDHLFZDLSA-N 0.000 description 2
- UZFNHAXYMICTBU-DZKIICNBSA-N Val-Phe-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UZFNHAXYMICTBU-DZKIICNBSA-N 0.000 description 2
- MHHAWNPHDLCPLF-ULQDDVLXSA-N Val-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 MHHAWNPHDLCPLF-ULQDDVLXSA-N 0.000 description 2
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 2
- RYHUIHUOYRNNIE-NRPADANISA-N Val-Ser-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N RYHUIHUOYRNNIE-NRPADANISA-N 0.000 description 2
- UGFMVXRXULGLNO-XPUUQOCRSA-N Val-Ser-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O UGFMVXRXULGLNO-XPUUQOCRSA-N 0.000 description 2
- UQMPYVLTQCGRSK-IFFSRLJSSA-N Val-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N)O UQMPYVLTQCGRSK-IFFSRLJSSA-N 0.000 description 2
- JAIZPWVHPQRYOU-ZJDVBMNYSA-N Val-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O JAIZPWVHPQRYOU-ZJDVBMNYSA-N 0.000 description 2
- YLBNZCJFSVJDRJ-KJEVXHAQSA-N Val-Thr-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O YLBNZCJFSVJDRJ-KJEVXHAQSA-N 0.000 description 2
- QPJSIBAOZBVELU-BPNCWPANSA-N Val-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N QPJSIBAOZBVELU-BPNCWPANSA-N 0.000 description 2
- VTIAEOKFUJJBTC-YDHLFZDLSA-N Val-Tyr-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VTIAEOKFUJJBTC-YDHLFZDLSA-N 0.000 description 2
- PGBMPFKFKXYROZ-UFYCRDLUSA-N Val-Tyr-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N PGBMPFKFKXYROZ-UFYCRDLUSA-N 0.000 description 2
- DFQZDQPLWBSFEJ-LSJOCFKGSA-N Val-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N DFQZDQPLWBSFEJ-LSJOCFKGSA-N 0.000 description 2
- 230000010530 Virus Neutralization Effects 0.000 description 2
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 101150063416 add gene Proteins 0.000 description 2
- 230000002411 adverse Effects 0.000 description 2
- 239000000556 agonist Substances 0.000 description 2
- HDTRYLNUVZCQOY-LIZSDCNHSA-N alpha,alpha-trehalose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-LIZSDCNHSA-N 0.000 description 2
- 230000010056 antibody-dependent cellular cytotoxicity Effects 0.000 description 2
- 239000007864 aqueous solution Substances 0.000 description 2
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 2
- 108010077245 asparaginyl-proline Proteins 0.000 description 2
- 235000003704 aspartic acid Nutrition 0.000 description 2
- 108010038633 aspartylglutamate Proteins 0.000 description 2
- 108010047857 aspartylglycine Proteins 0.000 description 2
- 108010092854 aspartyllysine Proteins 0.000 description 2
- WPYMKLBDIGXBTP-UHFFFAOYSA-N benzoic acid Chemical compound OC(=O)C1=CC=CC=C1 WPYMKLBDIGXBTP-UHFFFAOYSA-N 0.000 description 2
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 2
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 2
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 2
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 2
- 239000007975 buffered saline Substances 0.000 description 2
- 229960003150 bupivacaine Drugs 0.000 description 2
- RYYVLZVUVIJVGH-UHFFFAOYSA-N caffeine Chemical compound CN1C(=O)N(C)C(=O)C2=C1N=CN2C RYYVLZVUVIJVGH-UHFFFAOYSA-N 0.000 description 2
- 239000001506 calcium phosphate Substances 0.000 description 2
- 229910000389 calcium phosphate Inorganic materials 0.000 description 2
- 235000011010 calcium phosphates Nutrition 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 230000007969 cellular immunity Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 235000013330 chicken meat Nutrition 0.000 description 2
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 2
- 238000004587 chromatography analysis Methods 0.000 description 2
- 239000011248 coating agent Substances 0.000 description 2
- 238000000576 coating method Methods 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 230000002338 cryopreservative effect Effects 0.000 description 2
- 108010016616 cysteinylglycine Proteins 0.000 description 2
- 108010069495 cysteinyltyrosine Proteins 0.000 description 2
- 210000001151 cytotoxic T lymphocyte Anatomy 0.000 description 2
- 230000034994 death Effects 0.000 description 2
- 231100000517 death Toxicity 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 2
- 150000002016 disaccharides Chemical class 0.000 description 2
- 231100000673 dose–response relationship Toxicity 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 241001493065 dsRNA viruses Species 0.000 description 2
- 239000003995 emulsifying agent Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000005713 exacerbation Effects 0.000 description 2
- 108700014844 flt3 ligand Proteins 0.000 description 2
- 238000002523 gelfiltration Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- 108010015792 glycyllysine Proteins 0.000 description 2
- 108010087823 glycyltyrosine Proteins 0.000 description 2
- 238000003306 harvesting Methods 0.000 description 2
- 229960002885 histidine Drugs 0.000 description 2
- 108010040030 histidinoalanine Proteins 0.000 description 2
- 108010036413 histidylglycine Proteins 0.000 description 2
- 108010092114 histidylphenylalanine Proteins 0.000 description 2
- 108010018006 histidylserine Proteins 0.000 description 2
- 230000028996 humoral immune response Effects 0.000 description 2
- 239000012678 infectious agent Substances 0.000 description 2
- 230000036512 infertility Effects 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 238000010255 intramuscular injection Methods 0.000 description 2
- 239000007927 intramuscular injection Substances 0.000 description 2
- 229910052742 iron Inorganic materials 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 2
- FZWBNHMXJMCXLU-BLAUPYHCSA-N isomaltotriose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1OC[C@@H]1[C@@H](O)[C@H](O)[C@@H](O)[C@@H](OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C=O)O1 FZWBNHMXJMCXLU-BLAUPYHCSA-N 0.000 description 2
- 210000003292 kidney cell Anatomy 0.000 description 2
- 108010034529 leucyl-lysine Proteins 0.000 description 2
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 2
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 2
- 108010012058 leucyltyrosine Proteins 0.000 description 2
- 210000000265 leukocyte Anatomy 0.000 description 2
- 108010064235 lysylglycine Proteins 0.000 description 2
- 108010054155 lysyllysine Proteins 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000034217 membrane fusion Effects 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 108010056582 methionylglutamic acid Proteins 0.000 description 2
- LXCFILQKKLGQFO-UHFFFAOYSA-N methylparaben Chemical compound COC(=O)C1=CC=C(O)C=C1 LXCFILQKKLGQFO-UHFFFAOYSA-N 0.000 description 2
- 229920001220 nitrocellulos Polymers 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 108010012581 phenylalanylglutamate Proteins 0.000 description 2
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 2
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 2
- 239000000244 polyoxyethylene sorbitan monooleate Substances 0.000 description 2
- 235000010482 polyoxyethylene sorbitan monooleate Nutrition 0.000 description 2
- 229920000136 polysorbate Polymers 0.000 description 2
- 229940068977 polysorbate 20 Drugs 0.000 description 2
- 229920000053 polysorbate 80 Polymers 0.000 description 2
- 229940068968 polysorbate 80 Drugs 0.000 description 2
- 239000001267 polyvinylpyrrolidone Substances 0.000 description 2
- 229920000036 polyvinylpyrrolidone Polymers 0.000 description 2
- 235000013855 polyvinylpyrrolidone Nutrition 0.000 description 2
- 239000011148 porous material Substances 0.000 description 2
- 230000004481 post-translational protein modification Effects 0.000 description 2
- 239000003755 preservative agent Substances 0.000 description 2
- 108010015796 prolylisoleucine Proteins 0.000 description 2
- 108010090894 prolylleucine Proteins 0.000 description 2
- QELSKZZBTMNZEB-UHFFFAOYSA-N propylparaben Chemical compound CCCOC(=O)C1=CC=C(O)C=C1 QELSKZZBTMNZEB-UHFFFAOYSA-N 0.000 description 2
- 230000000241 respiratory effect Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 102200056390 rs12204826 Human genes 0.000 description 2
- 102220114694 rs763810935 Human genes 0.000 description 2
- YGSDEFSMJLZEOE-UHFFFAOYSA-N salicylic acid Chemical compound OC(=O)C1=CC=CC=C1O YGSDEFSMJLZEOE-UHFFFAOYSA-N 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 238000007480 sanger sequencing Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- GEHJYWRUCIMESM-UHFFFAOYSA-L sodium sulfite Chemical compound [Na+].[Na+].[O-]S([O-])=O GEHJYWRUCIMESM-UHFFFAOYSA-L 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 125000006850 spacer group Chemical group 0.000 description 2
- 239000008223 sterile water Substances 0.000 description 2
- 230000001954 sterilising effect Effects 0.000 description 2
- 238000004659 sterilization and disinfection Methods 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 229940104230 thymidine Drugs 0.000 description 2
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- 108010051110 tyrosyl-lysine Proteins 0.000 description 2
- 108010078580 tyrosylleucine Proteins 0.000 description 2
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 2
- 229940045145 uridine Drugs 0.000 description 2
- 239000004474 valine Substances 0.000 description 2
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 1
- JNYAEWCLZODPBN-JGWLITMVSA-N (2r,3r,4s)-2-[(1r)-1,2-dihydroxyethyl]oxolane-3,4-diol Chemical class OC[C@@H](O)[C@H]1OC[C@H](O)[C@H]1O JNYAEWCLZODPBN-JGWLITMVSA-N 0.000 description 1
- DRHZYJAUECRAJM-DWSYSWFDSA-N (2s,3s,4s,5r,6r)-6-[[(3s,4s,4ar,6ar,6bs,8r,8ar,12as,14ar,14br)-8a-[(2s,3r,4s,5r,6r)-3-[(2s,3r,4s,5r,6s)-5-[(2s,3r,4s,5r)-4-[(2s,3r,4r)-3,4-dihydroxy-4-(hydroxymethyl)oxolan-2-yl]oxy-3,5-dihydroxyoxan-2-yl]oxy-3,4-dihydroxy-6-methyloxan-2-yl]oxy-5-[(3s,5s, Chemical compound O([C@H]1[C@H](O)[C@H](O[C@H]([C@@H]1O[C@H]1[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O1)O)O[C@H]1CC[C@]2(C)[C@H]3CC=C4[C@@H]5CC(C)(C)CC[C@@]5([C@@H](C[C@@]4(C)[C@]3(C)CC[C@H]2[C@@]1(C=O)C)O)C(=O)O[C@@H]1O[C@H](C)[C@@H]([C@@H]([C@H]1O[C@H]1[C@@H]([C@H](O)[C@@H](O[C@H]2[C@@H]([C@@H](O[C@H]3[C@@H]([C@@](O)(CO)CO3)O)[C@H](O)CO2)O)[C@H](C)O1)O)O)OC(=O)C[C@@H](O)C[C@H](OC(=O)C[C@@H](O)C[C@@H]([C@@H](C)CC)O[C@H]1[C@@H]([C@@H](O)[C@H](CO)O1)O)[C@@H](C)CC)C(O)=O)[C@@H]1OC[C@@H](O)[C@H](O)[C@H]1O DRHZYJAUECRAJM-DWSYSWFDSA-N 0.000 description 1
- YYGNTYWPHWGJRM-UHFFFAOYSA-N (6E,10E,14E,18E)-2,6,10,15,19,23-hexamethyltetracosa-2,6,10,14,18,22-hexaene Chemical compound CC(C)=CCCC(C)=CCCC(C)=CCCC=C(C)CCC=C(C)CCC=C(C)C YYGNTYWPHWGJRM-UHFFFAOYSA-N 0.000 description 1
- UKAUYVFTDYCKQA-UHFFFAOYSA-N -2-Amino-4-hydroxybutanoic acid Natural products OC(=O)C(N)CCO UKAUYVFTDYCKQA-UHFFFAOYSA-N 0.000 description 1
- IIZPXYDJLKNOIY-JXPKJXOSSA-N 1-palmitoyl-2-arachidonoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCC\C=C/C\C=C/C\C=C/C\C=C/CCCCC IIZPXYDJLKNOIY-JXPKJXOSSA-N 0.000 description 1
- VGONTNSXDCQUGY-RRKCRQDMSA-N 2'-deoxyinosine Chemical group C1[C@H](O)[C@@H](CO)O[C@H]1N1C(N=CNC2=O)=C2N=C1 VGONTNSXDCQUGY-RRKCRQDMSA-N 0.000 description 1
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 1
- BFSVOASYOCHEOV-UHFFFAOYSA-N 2-diethylaminoethanol Chemical compound CCN(CC)CCO BFSVOASYOCHEOV-UHFFFAOYSA-N 0.000 description 1
- UAIUNKRWKOVEES-UHFFFAOYSA-N 3,3',5,5'-tetramethylbenzidine Chemical compound CC1=C(N)C(C)=CC(C=2C=C(C)C(N)=C(C)C=2)=C1 UAIUNKRWKOVEES-UHFFFAOYSA-N 0.000 description 1
- HVCNXQOWACZAFN-UHFFFAOYSA-N 4-ethylmorpholine Chemical compound CCN1CCOCC1 HVCNXQOWACZAFN-UHFFFAOYSA-N 0.000 description 1
- CHBAWFGIXDBEBT-UHFFFAOYSA-N 4-methylheptane Chemical compound CCCC(C)CCC CHBAWFGIXDBEBT-UHFFFAOYSA-N 0.000 description 1
- 102220579649 ATP-dependent RNA helicase A_K417N_mutation Human genes 0.000 description 1
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 1
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 1
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 1
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 1
- BTYTYHBSJKQBQA-GCJQMDKQSA-N Ala-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N)O BTYTYHBSJKQBQA-GCJQMDKQSA-N 0.000 description 1
- AWAXZRDKUHOPBO-GUBZILKMSA-N Ala-Gln-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O AWAXZRDKUHOPBO-GUBZILKMSA-N 0.000 description 1
- ZDYNWWQXFRUOEO-XDTLVQLUSA-N Ala-Gln-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZDYNWWQXFRUOEO-XDTLVQLUSA-N 0.000 description 1
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 1
- BVSGPHDECMJBDE-HGNGGELXSA-N Ala-Glu-His Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N BVSGPHDECMJBDE-HGNGGELXSA-N 0.000 description 1
- LJFNNUBZSZCZFN-WHFBIAKZSA-N Ala-Gly-Cys Chemical compound N[C@@H](C)C(=O)NCC(=O)N[C@@H](CS)C(=O)O LJFNNUBZSZCZFN-WHFBIAKZSA-N 0.000 description 1
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 1
- FAJIYNONGXEXAI-CQDKDKBSSA-N Ala-His-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CNC=N1 FAJIYNONGXEXAI-CQDKDKBSSA-N 0.000 description 1
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 1
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 1
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 1
- IORKCNUBHNIMKY-CIUDSAMLSA-N Ala-Pro-Glu Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IORKCNUBHNIMKY-CIUDSAMLSA-N 0.000 description 1
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 1
- MTDDMSUUXNQMKK-BPNCWPANSA-N Ala-Tyr-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N MTDDMSUUXNQMKK-BPNCWPANSA-N 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 102000009027 Albumins Human genes 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 1
- 241000710929 Alphavirus Species 0.000 description 1
- 102100030988 Angiotensin-converting enzyme Human genes 0.000 description 1
- SGYSTDWPNPKJPP-GUBZILKMSA-N Arg-Ala-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SGYSTDWPNPKJPP-GUBZILKMSA-N 0.000 description 1
- MFAMTAVAFBPXDC-LPEHRKFASA-N Arg-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O MFAMTAVAFBPXDC-LPEHRKFASA-N 0.000 description 1
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 1
- NPAVRDPEFVKELR-DCAQKATOSA-N Arg-Lys-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NPAVRDPEFVKELR-DCAQKATOSA-N 0.000 description 1
- QTAIIXQCOPUNBQ-QXEWZRGKSA-N Arg-Val-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QTAIIXQCOPUNBQ-QXEWZRGKSA-N 0.000 description 1
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 1
- QNJIRRVTOXNGMH-GUBZILKMSA-N Asn-Gln-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC(N)=O QNJIRRVTOXNGMH-GUBZILKMSA-N 0.000 description 1
- QPTAGIPWARILES-AVGNSLFASA-N Asn-Gln-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QPTAGIPWARILES-AVGNSLFASA-N 0.000 description 1
- QYXNFROWLZPWPC-FXQIFTODSA-N Asn-Glu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QYXNFROWLZPWPC-FXQIFTODSA-N 0.000 description 1
- UBKOVSLDWIHYSY-ACZMJKKPSA-N Asn-Glu-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UBKOVSLDWIHYSY-ACZMJKKPSA-N 0.000 description 1
- SUEIIIFUBHDCCS-PBCZWWQYSA-N Asn-His-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SUEIIIFUBHDCCS-PBCZWWQYSA-N 0.000 description 1
- ZMUQQMGITUJQTI-CIUDSAMLSA-N Asn-Leu-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZMUQQMGITUJQTI-CIUDSAMLSA-N 0.000 description 1
- YXVAESUIQFDBHN-SRVKXCTJSA-N Asn-Phe-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O YXVAESUIQFDBHN-SRVKXCTJSA-N 0.000 description 1
- RBOBTTLFPRSXKZ-BZSNNMDCSA-N Asn-Phe-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RBOBTTLFPRSXKZ-BZSNNMDCSA-N 0.000 description 1
- HPNDKUOLNRVRAY-BIIVOSGPSA-N Asn-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N)C(=O)O HPNDKUOLNRVRAY-BIIVOSGPSA-N 0.000 description 1
- BCADFFUQHIMQAA-KKHAAJSZSA-N Asn-Thr-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BCADFFUQHIMQAA-KKHAAJSZSA-N 0.000 description 1
- KBQOUDLMWYWXNP-YDHLFZDLSA-N Asn-Val-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)N)N KBQOUDLMWYWXNP-YDHLFZDLSA-N 0.000 description 1
- GHWWTICYPDKPTE-NGZCFLSTSA-N Asn-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N GHWWTICYPDKPTE-NGZCFLSTSA-N 0.000 description 1
- FTNVLGCFIJEMQT-CIUDSAMLSA-N Asp-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N FTNVLGCFIJEMQT-CIUDSAMLSA-N 0.000 description 1
- DZQKLNLLWFQONU-LKXGYXEUSA-N Asp-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N)O DZQKLNLLWFQONU-LKXGYXEUSA-N 0.000 description 1
- UFAQGGZUXVLONR-AVGNSLFASA-N Asp-Gln-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N)O UFAQGGZUXVLONR-AVGNSLFASA-N 0.000 description 1
- DTNUIAJCPRMNBT-WHFBIAKZSA-N Asp-Gly-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O DTNUIAJCPRMNBT-WHFBIAKZSA-N 0.000 description 1
- PZXPWHFYZXTFBI-YUMQZZPRSA-N Asp-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PZXPWHFYZXTFBI-YUMQZZPRSA-N 0.000 description 1
- LDGUZSIPGSPBJP-XVYDVKMFSA-N Asp-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)O)N LDGUZSIPGSPBJP-XVYDVKMFSA-N 0.000 description 1
- NHSDEZURHWEZPN-SXTJYALSSA-N Asp-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC(=O)O)N NHSDEZURHWEZPN-SXTJYALSSA-N 0.000 description 1
- HOBNTSHITVVNBN-ZPFDUUQYSA-N Asp-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N HOBNTSHITVVNBN-ZPFDUUQYSA-N 0.000 description 1
- SPKCGKRUYKMDHP-GUDRVLHUSA-N Asp-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N SPKCGKRUYKMDHP-GUDRVLHUSA-N 0.000 description 1
- KLYPOCBLKMPBIQ-GHCJXIJMSA-N Asp-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N KLYPOCBLKMPBIQ-GHCJXIJMSA-N 0.000 description 1
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 1
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 1
- XWSIYTYNLKCLJB-CIUDSAMLSA-N Asp-Lys-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O XWSIYTYNLKCLJB-CIUDSAMLSA-N 0.000 description 1
- HJCGDIGVVWETRO-ZPFDUUQYSA-N Asp-Lys-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O)C(O)=O HJCGDIGVVWETRO-ZPFDUUQYSA-N 0.000 description 1
- RXBGWGRSWXOBGK-KKUMJFAQSA-N Asp-Lys-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RXBGWGRSWXOBGK-KKUMJFAQSA-N 0.000 description 1
- ZQFRDAZBTSFGGW-SRVKXCTJSA-N Asp-Ser-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZQFRDAZBTSFGGW-SRVKXCTJSA-N 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 239000005711 Benzoic acid Substances 0.000 description 1
- VGGGPCQERPFHOB-MCIONIFRSA-N Bestatin Chemical compound CC(C)C[C@H](C(O)=O)NC(=O)[C@@H](O)[C@H](N)CC1=CC=CC=C1 VGGGPCQERPFHOB-MCIONIFRSA-N 0.000 description 1
- BVKZGUZCCUSVTD-UHFFFAOYSA-M Bicarbonate Chemical class OC([O-])=O BVKZGUZCCUSVTD-UHFFFAOYSA-M 0.000 description 1
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 1
- 229940022962 COVID-19 vaccine Drugs 0.000 description 1
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 1
- 101100505076 Caenorhabditis elegans gly-2 gene Proteins 0.000 description 1
- 101100067721 Caenorhabditis elegans gly-3 gene Proteins 0.000 description 1
- 101100228196 Caenorhabditis elegans gly-4 gene Proteins 0.000 description 1
- 101100505161 Caenorhabditis elegans mel-32 gene Proteins 0.000 description 1
- 241000178270 Canarypox virus Species 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- 241000700198 Cavia Species 0.000 description 1
- 108010051109 Cell-Penetrating Peptides Proteins 0.000 description 1
- 102000020313 Cell-Penetrating Peptides Human genes 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 241000288673 Chiroptera Species 0.000 description 1
- GHXZTYHSJHQHIJ-UHFFFAOYSA-N Chlorhexidine Chemical compound C=1C=C(Cl)C=CC=1NC(N)=NC(N)=NCCCCCCN=C(N)N=C(N)NC1=CC=C(Cl)C=C1 GHXZTYHSJHQHIJ-UHFFFAOYSA-N 0.000 description 1
- VEXZGXHMUGYJMC-UHFFFAOYSA-M Chloride anion Chemical compound [Cl-] VEXZGXHMUGYJMC-UHFFFAOYSA-M 0.000 description 1
- 241000282552 Chlorocebus aethiops Species 0.000 description 1
- 102000009016 Cholera Toxin Human genes 0.000 description 1
- 108010049048 Cholera Toxin Proteins 0.000 description 1
- 102220585969 Claspin_S982A_mutation Human genes 0.000 description 1
- 102100031673 Corneodesmosin Human genes 0.000 description 1
- 101710139375 Corneodesmosin Proteins 0.000 description 1
- 229920000858 Cyclodextrin Polymers 0.000 description 1
- WXKWQSDHEXKKNC-ZKWXMUAHSA-N Cys-Asp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N WXKWQSDHEXKKNC-ZKWXMUAHSA-N 0.000 description 1
- ATPDEYTYWVMINF-ZLUOBGJFSA-N Cys-Cys-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O ATPDEYTYWVMINF-ZLUOBGJFSA-N 0.000 description 1
- GUKYYUFHWYRMEU-WHFBIAKZSA-N Cys-Gly-Asp Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O GUKYYUFHWYRMEU-WHFBIAKZSA-N 0.000 description 1
- UCSXXFRXHGUXCQ-SRVKXCTJSA-N Cys-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CS)N UCSXXFRXHGUXCQ-SRVKXCTJSA-N 0.000 description 1
- KVCJEMHFLGVINV-ZLUOBGJFSA-N Cys-Ser-Asn Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KVCJEMHFLGVINV-ZLUOBGJFSA-N 0.000 description 1
- HJXSYJVCMUOUNY-SRVKXCTJSA-N Cys-Ser-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N HJXSYJVCMUOUNY-SRVKXCTJSA-N 0.000 description 1
- 150000008574 D-amino acids Chemical class 0.000 description 1
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 1
- 229930182832 D-phenylalanine Natural products 0.000 description 1
- AYFVYJQAPQTCCC-STHAYSLISA-N D-threonine Chemical compound C[C@H](O)[C@@H](N)C(O)=O AYFVYJQAPQTCCC-STHAYSLISA-N 0.000 description 1
- 229930182822 D-threonine Natural products 0.000 description 1
- 108010041986 DNA Vaccines Proteins 0.000 description 1
- 241001461743 Deltacoronavirus Species 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 239000004375 Dextrin Substances 0.000 description 1
- 229920001353 Dextrin Polymers 0.000 description 1
- 108090000204 Dipeptidase 1 Proteins 0.000 description 1
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 1
- 241001115402 Ebolavirus Species 0.000 description 1
- LVGKNOAMLMIIKO-UHFFFAOYSA-N Elaidinsaeure-aethylester Natural products CCCCCCCCC=CCCCCCCCC(=O)OCC LVGKNOAMLMIIKO-UHFFFAOYSA-N 0.000 description 1
- 101710146739 Enterotoxin Proteins 0.000 description 1
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- OTMSDBZUPAUEDD-UHFFFAOYSA-N Ethane Chemical compound CC OTMSDBZUPAUEDD-UHFFFAOYSA-N 0.000 description 1
- 239000001116 FEMA 4028 Substances 0.000 description 1
- 108010046276 FLP recombinase Proteins 0.000 description 1
- VTLYFUHAOXGGBS-UHFFFAOYSA-N Fe3+ Chemical compound [Fe+3] VTLYFUHAOXGGBS-UHFFFAOYSA-N 0.000 description 1
- 108010010803 Gelatin Proteins 0.000 description 1
- 229930182566 Gentamicin Natural products 0.000 description 1
- CEAZRRDELHUEMR-URQXQFDESA-N Gentamicin Chemical compound O1[C@H](C(C)NC)CC[C@@H](N)[C@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](NC)[C@@](C)(O)CO2)O)[C@H](N)C[C@@H]1N CEAZRRDELHUEMR-URQXQFDESA-N 0.000 description 1
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 1
- LJEPDHWNQXPXMM-NHCYSSNCSA-N Gln-Arg-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O LJEPDHWNQXPXMM-NHCYSSNCSA-N 0.000 description 1
- INFBPLSHYFALDE-ACZMJKKPSA-N Gln-Asn-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O INFBPLSHYFALDE-ACZMJKKPSA-N 0.000 description 1
- LMPBBFWHCRURJD-LAEOZQHASA-N Gln-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N LMPBBFWHCRURJD-LAEOZQHASA-N 0.000 description 1
- WLODHVXYKYHLJD-ACZMJKKPSA-N Gln-Asp-Ser Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N WLODHVXYKYHLJD-ACZMJKKPSA-N 0.000 description 1
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 1
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 1
- MWERYIXRDZDXOA-QEWYBTABSA-N Gln-Ile-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MWERYIXRDZDXOA-QEWYBTABSA-N 0.000 description 1
- VZRAXPGTUNDIDK-GUBZILKMSA-N Gln-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N VZRAXPGTUNDIDK-GUBZILKMSA-N 0.000 description 1
- IHSGESFHTMFHRB-GUBZILKMSA-N Gln-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O IHSGESFHTMFHRB-GUBZILKMSA-N 0.000 description 1
- HPCOBEHVEHWREJ-DCAQKATOSA-N Gln-Lys-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HPCOBEHVEHWREJ-DCAQKATOSA-N 0.000 description 1
- QBEWLBKBGXVVPD-RYUDHWBXSA-N Gln-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N QBEWLBKBGXVVPD-RYUDHWBXSA-N 0.000 description 1
- KUBFPYIMAGXGBT-ACZMJKKPSA-N Gln-Ser-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KUBFPYIMAGXGBT-ACZMJKKPSA-N 0.000 description 1
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 1
- DYVMTEWCGAVKSE-HJGDQZAQSA-N Gln-Thr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O DYVMTEWCGAVKSE-HJGDQZAQSA-N 0.000 description 1
- XKPACHRGOWQHFH-IRIUXVKKSA-N Gln-Thr-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XKPACHRGOWQHFH-IRIUXVKKSA-N 0.000 description 1
- SGVGIVDZLSHSEN-RYUDHWBXSA-N Gln-Tyr-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O SGVGIVDZLSHSEN-RYUDHWBXSA-N 0.000 description 1
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 1
- JPHYJQHPILOKHC-ACZMJKKPSA-N Glu-Asp-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O JPHYJQHPILOKHC-ACZMJKKPSA-N 0.000 description 1
- FKGNJUCQKXQNRA-NRPADANISA-N Glu-Cys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCC(O)=O FKGNJUCQKXQNRA-NRPADANISA-N 0.000 description 1
- HUFCEIHAFNVSNR-IHRRRGAJSA-N Glu-Gln-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUFCEIHAFNVSNR-IHRRRGAJSA-N 0.000 description 1
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 1
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 1
- BUAKRRKDHSSIKK-IHRRRGAJSA-N Glu-Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BUAKRRKDHSSIKK-IHRRRGAJSA-N 0.000 description 1
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 1
- LGYCLOCORAEQSZ-PEFMBERDSA-N Glu-Ile-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O LGYCLOCORAEQSZ-PEFMBERDSA-N 0.000 description 1
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 1
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 1
- SWRVAQHFBRZVNX-GUBZILKMSA-N Glu-Lys-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SWRVAQHFBRZVNX-GUBZILKMSA-N 0.000 description 1
- XNOWYPDMSLSRKP-GUBZILKMSA-N Glu-Met-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(O)=O XNOWYPDMSLSRKP-GUBZILKMSA-N 0.000 description 1
- LKOAAMXDJGEYMS-ZPFDUUQYSA-N Glu-Met-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LKOAAMXDJGEYMS-ZPFDUUQYSA-N 0.000 description 1
- AAJHGGDRKHYSDH-GUBZILKMSA-N Glu-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O AAJHGGDRKHYSDH-GUBZILKMSA-N 0.000 description 1
- ALMBZBOCGSVSAI-ACZMJKKPSA-N Glu-Ser-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ALMBZBOCGSVSAI-ACZMJKKPSA-N 0.000 description 1
- IDEODOAVGCMUQV-GUBZILKMSA-N Glu-Ser-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IDEODOAVGCMUQV-GUBZILKMSA-N 0.000 description 1
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 1
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 1
- NZAFOTBEULLEQB-WDSKDSINSA-N Gly-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN NZAFOTBEULLEQB-WDSKDSINSA-N 0.000 description 1
- NMROINAYXCACKF-WHFBIAKZSA-N Gly-Cys-Cys Chemical compound NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(O)=O NMROINAYXCACKF-WHFBIAKZSA-N 0.000 description 1
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 1
- SWQALSGKVLYKDT-ZKWXMUAHSA-N Gly-Ile-Ala Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SWQALSGKVLYKDT-ZKWXMUAHSA-N 0.000 description 1
- LUJVWKKYHSLULQ-ZKWXMUAHSA-N Gly-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN LUJVWKKYHSLULQ-ZKWXMUAHSA-N 0.000 description 1
- TVUWMSBGMVAHSJ-KBPBESRZSA-N Gly-Leu-Phe Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TVUWMSBGMVAHSJ-KBPBESRZSA-N 0.000 description 1
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 1
- PTIIBFKSLCYQBO-NHCYSSNCSA-N Gly-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)CN PTIIBFKSLCYQBO-NHCYSSNCSA-N 0.000 description 1
- CVFOYJJOZYYEPE-KBPBESRZSA-N Gly-Lys-Tyr Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CVFOYJJOZYYEPE-KBPBESRZSA-N 0.000 description 1
- IBYOLNARKHMLBG-WHOFXGATSA-N Gly-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IBYOLNARKHMLBG-WHOFXGATSA-N 0.000 description 1
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 1
- RHRLHXQWHCNJKR-PMVVWTBXSA-N Gly-Thr-His Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 RHRLHXQWHCNJKR-PMVVWTBXSA-N 0.000 description 1
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 1
- BNMRSWQOHIQTFL-JSGCOSHPSA-N Gly-Val-Phe Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 BNMRSWQOHIQTFL-JSGCOSHPSA-N 0.000 description 1
- 101710114810 Glycoprotein Proteins 0.000 description 1
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 1
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 1
- 229920000209 Hexadimethrine bromide Polymers 0.000 description 1
- BIAKMWKJMQLZOJ-ZKWXMUAHSA-N His-Ala-Ala Chemical compound C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)Cc1cnc[nH]1)C(O)=O BIAKMWKJMQLZOJ-ZKWXMUAHSA-N 0.000 description 1
- KZTLOHBDLMIFSH-XVYDVKMFSA-N His-Ala-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O KZTLOHBDLMIFSH-XVYDVKMFSA-N 0.000 description 1
- VCDNHBNNPCDBKV-DLOVCJGASA-N His-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N VCDNHBNNPCDBKV-DLOVCJGASA-N 0.000 description 1
- RGPWUJOMKFYFSR-QWRGUYRKSA-N His-Gly-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O RGPWUJOMKFYFSR-QWRGUYRKSA-N 0.000 description 1
- STOOMQFEJUVAKR-KKUMJFAQSA-N His-His-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CNC=N1 STOOMQFEJUVAKR-KKUMJFAQSA-N 0.000 description 1
- MJUUWJJEUOBDGW-IHRRRGAJSA-N His-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 MJUUWJJEUOBDGW-IHRRRGAJSA-N 0.000 description 1
- IGBBXBFSLKRHJB-BZSNNMDCSA-N His-Lys-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 IGBBXBFSLKRHJB-BZSNNMDCSA-N 0.000 description 1
- UWSMZKRTOZEGDD-CUJWVEQBSA-N His-Thr-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O UWSMZKRTOZEGDD-CUJWVEQBSA-N 0.000 description 1
- 241001272567 Hominoidea Species 0.000 description 1
- 101000883515 Homo sapiens Chitinase-3-like protein 1 Proteins 0.000 description 1
- 101000674278 Homo sapiens Serine-tRNA ligase, cytoplasmic Proteins 0.000 description 1
- PMMYEEVYMWASQN-DMTCNVIQSA-N Hydroxyproline Chemical compound O[C@H]1CN[C@H](C(O)=O)C1 PMMYEEVYMWASQN-DMTCNVIQSA-N 0.000 description 1
- RWIKBYVJQAJYDP-BJDJZHNGSA-N Ile-Ala-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RWIKBYVJQAJYDP-BJDJZHNGSA-N 0.000 description 1
- QYZYJFXHXYUZMZ-UGYAYLCHSA-N Ile-Asn-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N QYZYJFXHXYUZMZ-UGYAYLCHSA-N 0.000 description 1
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 1
- LLHYWBGDMBGNHA-VGDYDELISA-N Ile-Cys-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LLHYWBGDMBGNHA-VGDYDELISA-N 0.000 description 1
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 1
- VOBYAKCXGQQFLR-LSJOCFKGSA-N Ile-Gly-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O VOBYAKCXGQQFLR-LSJOCFKGSA-N 0.000 description 1
- WIZPFZKOFZXDQG-HTFCKZLJSA-N Ile-Ile-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O WIZPFZKOFZXDQG-HTFCKZLJSA-N 0.000 description 1
- AXNGDPAKKCEKGY-QPHKQPEJSA-N Ile-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N AXNGDPAKKCEKGY-QPHKQPEJSA-N 0.000 description 1
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 1
- CEPIAEUVRKGPGP-DSYPUSFNSA-N Ile-Lys-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 CEPIAEUVRKGPGP-DSYPUSFNSA-N 0.000 description 1
- XLXPYSDGMXTTNQ-DKIMLUQUSA-N Ile-Phe-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CC(C)C)C(O)=O XLXPYSDGMXTTNQ-DKIMLUQUSA-N 0.000 description 1
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 1
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 1
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 1
- YCKPUHHMCFSUMD-IUKAMOBKSA-N Ile-Thr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCKPUHHMCFSUMD-IUKAMOBKSA-N 0.000 description 1
- RTSQPLLOYSGMKM-DSYPUSFNSA-N Ile-Trp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(C)C)C(=O)O)N RTSQPLLOYSGMKM-DSYPUSFNSA-N 0.000 description 1
- ZUWSVOYKBCHLRR-MGHWNKPDSA-N Ile-Tyr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZUWSVOYKBCHLRR-MGHWNKPDSA-N 0.000 description 1
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 1
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 1
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 1
- 108020005350 Initiator Codon Proteins 0.000 description 1
- 102000004889 Interleukin-6 Human genes 0.000 description 1
- LPHGQDQBBGAPDZ-UHFFFAOYSA-N Isocaffeine Natural products CN1C(=O)N(C)C(=O)C2=C1N(C)C=N2 LPHGQDQBBGAPDZ-UHFFFAOYSA-N 0.000 description 1
- 241000235058 Komagataella pastoris Species 0.000 description 1
- 150000008575 L-amino acids Chemical class 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- 229930195714 L-glutamate Natural products 0.000 description 1
- UKAUYVFTDYCKQA-VKHMYHEASA-N L-homoserine Chemical compound OC(=O)[C@@H](N)CCO UKAUYVFTDYCKQA-VKHMYHEASA-N 0.000 description 1
- QEFRNWWLZKMPFJ-ZXPFJRLXSA-N L-methionine (R)-S-oxide Chemical compound C[S@@](=O)CC[C@H]([NH3+])C([O-])=O QEFRNWWLZKMPFJ-ZXPFJRLXSA-N 0.000 description 1
- QEFRNWWLZKMPFJ-UHFFFAOYSA-N L-methionine sulphoxide Natural products CS(=O)CCC(N)C(O)=O QEFRNWWLZKMPFJ-UHFFFAOYSA-N 0.000 description 1
- LRQKBLKVPFOOQJ-YFKPBYRVSA-N L-norleucine Chemical compound CCCC[C@H]([NH3+])C([O-])=O LRQKBLKVPFOOQJ-YFKPBYRVSA-N 0.000 description 1
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- VCSBGUACOYUIGD-CIUDSAMLSA-N Leu-Asn-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VCSBGUACOYUIGD-CIUDSAMLSA-N 0.000 description 1
- KKXDHFKZWKLYGB-GUBZILKMSA-N Leu-Asn-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKXDHFKZWKLYGB-GUBZILKMSA-N 0.000 description 1
- GZAUZBUKDXYPEH-CIUDSAMLSA-N Leu-Cys-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)O)N GZAUZBUKDXYPEH-CIUDSAMLSA-N 0.000 description 1
- ZYLJULGXQDNXDK-GUBZILKMSA-N Leu-Gln-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ZYLJULGXQDNXDK-GUBZILKMSA-N 0.000 description 1
- ZTLGVASZOIKNIX-DCAQKATOSA-N Leu-Gln-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZTLGVASZOIKNIX-DCAQKATOSA-N 0.000 description 1
- CQGSYZCULZMEDE-SRVKXCTJSA-N Leu-Gln-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CQGSYZCULZMEDE-SRVKXCTJSA-N 0.000 description 1
- YSKSXVKQLLBVEX-SZMVWBNQSA-N Leu-Gln-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 YSKSXVKQLLBVEX-SZMVWBNQSA-N 0.000 description 1
- FIYMBBHGYNQFOP-IUCAKERBSA-N Leu-Gly-Gln Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N FIYMBBHGYNQFOP-IUCAKERBSA-N 0.000 description 1
- HMDDEJADNKQTBR-BZSNNMDCSA-N Leu-His-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O HMDDEJADNKQTBR-BZSNNMDCSA-N 0.000 description 1
- SGIIOQQGLUUMDQ-IHRRRGAJSA-N Leu-His-Val Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C(C)C)C(=O)O)N SGIIOQQGLUUMDQ-IHRRRGAJSA-N 0.000 description 1
- DBSLVQBXKVKDKJ-BJDJZHNGSA-N Leu-Ile-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O DBSLVQBXKVKDKJ-BJDJZHNGSA-N 0.000 description 1
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 1
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 1
- ORWTWZXGDBYVCP-BJDJZHNGSA-N Leu-Ile-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(C)C ORWTWZXGDBYVCP-BJDJZHNGSA-N 0.000 description 1
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 1
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 1
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 1
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 1
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 1
- JDBQSGMJBMPNFT-AVGNSLFASA-N Leu-Pro-Val Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JDBQSGMJBMPNFT-AVGNSLFASA-N 0.000 description 1
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 1
- ICYRCNICGBJLGM-HJGDQZAQSA-N Leu-Thr-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 1
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 1
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 1
- HLFSDGLLUJUHTE-SNVBAGLBSA-N Levamisole Chemical compound C1([C@H]2CN3CCSC3=N2)=CC=CC=C1 HLFSDGLLUJUHTE-SNVBAGLBSA-N 0.000 description 1
- RZHLIPMZXOEJTL-AVGNSLFASA-N Lys-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N RZHLIPMZXOEJTL-AVGNSLFASA-N 0.000 description 1
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 1
- NNKLKUUGESXCBS-KBPBESRZSA-N Lys-Gly-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NNKLKUUGESXCBS-KBPBESRZSA-N 0.000 description 1
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 1
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 1
- ATNKHRAIZCMCCN-BZSNNMDCSA-N Lys-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N ATNKHRAIZCMCCN-BZSNNMDCSA-N 0.000 description 1
- JYVCOTWSRGFABJ-DCAQKATOSA-N Lys-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCCN)N JYVCOTWSRGFABJ-DCAQKATOSA-N 0.000 description 1
- TWPCWKVOZDUYAA-KKUMJFAQSA-N Lys-Phe-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O TWPCWKVOZDUYAA-KKUMJFAQSA-N 0.000 description 1
- ZUGVARDEGWMMLK-SRVKXCTJSA-N Lys-Ser-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN ZUGVARDEGWMMLK-SRVKXCTJSA-N 0.000 description 1
- RMOKGALPSPOYKE-KATARQTJSA-N Lys-Thr-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMOKGALPSPOYKE-KATARQTJSA-N 0.000 description 1
- 102000018697 Membrane Proteins Human genes 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- KLFPZIUIXZNEKY-DCAQKATOSA-N Met-Gln-Met Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O KLFPZIUIXZNEKY-DCAQKATOSA-N 0.000 description 1
- MIXPUVSPPOWTCR-FXQIFTODSA-N Met-Ser-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MIXPUVSPPOWTCR-FXQIFTODSA-N 0.000 description 1
- GWADARYJIJDYRC-XGEHTFHBSA-N Met-Thr-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GWADARYJIJDYRC-XGEHTFHBSA-N 0.000 description 1
- LIIXIZKVWNYQHB-STECZYCISA-N Met-Tyr-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LIIXIZKVWNYQHB-STECZYCISA-N 0.000 description 1
- 102000003792 Metallothionein Human genes 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 1
- 108010049175 N-substituted Glycines Proteins 0.000 description 1
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 1
- 108091061960 Naked DNA Proteins 0.000 description 1
- 229930193140 Neomycin Natural products 0.000 description 1
- 101100068676 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) gln-1 gene Proteins 0.000 description 1
- 230000004989 O-glycosylation Effects 0.000 description 1
- MXRIRQGCELJRSN-UHFFFAOYSA-N O.O.O.[Al] Chemical compound O.O.O.[Al] MXRIRQGCELJRSN-UHFFFAOYSA-N 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 241000282579 Pan Species 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 1
- KAHUBGWSIQNZQQ-KKUMJFAQSA-N Phe-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KAHUBGWSIQNZQQ-KKUMJFAQSA-N 0.000 description 1
- ALHULIGNEXGFRM-QWRGUYRKSA-N Phe-Cys-Gly Chemical compound OC(=O)CNC(=O)[C@H](CS)NC(=O)[C@@H](N)CC1=CC=CC=C1 ALHULIGNEXGFRM-QWRGUYRKSA-N 0.000 description 1
- PSBJZLMFFTULDX-IXOXFDKPSA-N Phe-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CC=CC=C1)N)O PSBJZLMFFTULDX-IXOXFDKPSA-N 0.000 description 1
- NAOVYENZCWFBDG-BZSNNMDCSA-N Phe-His-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=CC=C1 NAOVYENZCWFBDG-BZSNNMDCSA-N 0.000 description 1
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 1
- WEMYTDDMDBLPMI-DKIMLUQUSA-N Phe-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N WEMYTDDMDBLPMI-DKIMLUQUSA-N 0.000 description 1
- YFXXRYFWJFQAFW-JHYOHUSXSA-N Phe-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O YFXXRYFWJFQAFW-JHYOHUSXSA-N 0.000 description 1
- 241000283216 Phocidae Species 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- AJLVKXCNXIJHDV-CIUDSAMLSA-N Pro-Ala-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O AJLVKXCNXIJHDV-CIUDSAMLSA-N 0.000 description 1
- IHCXPSYCHXFXKT-DCAQKATOSA-N Pro-Arg-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O IHCXPSYCHXFXKT-DCAQKATOSA-N 0.000 description 1
- YFNOUBWUIIJQHF-LPEHRKFASA-N Pro-Asp-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O YFNOUBWUIIJQHF-LPEHRKFASA-N 0.000 description 1
- XUSDDSLCRPUKLP-QXEWZRGKSA-N Pro-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 XUSDDSLCRPUKLP-QXEWZRGKSA-N 0.000 description 1
- VWXGFAIZUQBBBG-UWVGGRQHSA-N Pro-His-Gly Chemical compound C([C@@H](C(=O)NCC(=O)[O-])NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 VWXGFAIZUQBBBG-UWVGGRQHSA-N 0.000 description 1
- ZUZINZIJHJFJRN-UBHSHLNASA-N Pro-Phe-Ala Chemical compound C([C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 ZUZINZIJHJFJRN-UBHSHLNASA-N 0.000 description 1
- MLKVIVZCFYRTIR-KKUMJFAQSA-N Pro-Phe-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLKVIVZCFYRTIR-KKUMJFAQSA-N 0.000 description 1
- CNUIHOAISPKQPY-HSHDSVGOSA-N Pro-Thr-Trp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O CNUIHOAISPKQPY-HSHDSVGOSA-N 0.000 description 1
- DIDLUFMLRUJLFB-FKBYEOEOSA-N Pro-Trp-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CC4=CC=C(C=C4)O)C(=O)O DIDLUFMLRUJLFB-FKBYEOEOSA-N 0.000 description 1
- ZYJMLBCDFPIGNL-JYJNAYRXSA-N Pro-Tyr-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@H](Cc1ccc(O)cc1)NC(=O)[C@@H]1CCCN1)C(O)=O ZYJMLBCDFPIGNL-JYJNAYRXSA-N 0.000 description 1
- 102100038098 Protein-glutamine gamma-glutamyltransferase 5 Human genes 0.000 description 1
- 102000014450 RNA Polymerase III Human genes 0.000 description 1
- 108010078067 RNA Polymerase III Proteins 0.000 description 1
- 108020005067 RNA Splice Sites Proteins 0.000 description 1
- 230000004570 RNA-binding Effects 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 206010057190 Respiratory tract infections Diseases 0.000 description 1
- 108091027981 Response element Proteins 0.000 description 1
- 102000004389 Ribonucleoproteins Human genes 0.000 description 1
- 108010081734 Ribonucleoproteins Proteins 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 108091005609 SARS-CoV-2 Spike Subunit S1 Proteins 0.000 description 1
- 108091005774 SARS-CoV-2 proteins Proteins 0.000 description 1
- 108091007488 SARS-CoV-2 spike ectodomains Proteins 0.000 description 1
- 208000037847 SARS-CoV-2-infection Diseases 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- 241000710961 Semliki Forest virus Species 0.000 description 1
- WTWGOQRNRFHFQD-JBDRJPRFSA-N Ser-Ala-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WTWGOQRNRFHFQD-JBDRJPRFSA-N 0.000 description 1
- BCKYYTVFBXHPOG-ACZMJKKPSA-N Ser-Asn-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N BCKYYTVFBXHPOG-ACZMJKKPSA-N 0.000 description 1
- SNNSYBWPPVAXQW-ZLUOBGJFSA-N Ser-Cys-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)O)N)O SNNSYBWPPVAXQW-ZLUOBGJFSA-N 0.000 description 1
- RNFKSBPHLTZHLU-WHFBIAKZSA-N Ser-Cys-Gly Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N)O RNFKSBPHLTZHLU-WHFBIAKZSA-N 0.000 description 1
- FMDHKPRACUXATF-ACZMJKKPSA-N Ser-Gln-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O FMDHKPRACUXATF-ACZMJKKPSA-N 0.000 description 1
- UFKPDBLKLOBMRH-XHNCKOQMSA-N Ser-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)C(=O)O UFKPDBLKLOBMRH-XHNCKOQMSA-N 0.000 description 1
- BPMRXBZYPGYPJN-WHFBIAKZSA-N Ser-Gly-Asn Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BPMRXBZYPGYPJN-WHFBIAKZSA-N 0.000 description 1
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 1
- CXBFHZLODKPIJY-AAEUAGOBSA-N Ser-Gly-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N CXBFHZLODKPIJY-AAEUAGOBSA-N 0.000 description 1
- UIPXCLNLUUAMJU-JBDRJPRFSA-N Ser-Ile-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UIPXCLNLUUAMJU-JBDRJPRFSA-N 0.000 description 1
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 1
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 1
- PTWIYDNFWPXQSD-GARJFASQSA-N Ser-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N)C(=O)O PTWIYDNFWPXQSD-GARJFASQSA-N 0.000 description 1
- RXSWQCATLWVDLI-XGEHTFHBSA-N Ser-Met-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RXSWQCATLWVDLI-XGEHTFHBSA-N 0.000 description 1
- XVWDJUROVRQKAE-KKUMJFAQSA-N Ser-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CC=CC=C1 XVWDJUROVRQKAE-KKUMJFAQSA-N 0.000 description 1
- RWDVVSKYZBNDCO-MELADBBJSA-N Ser-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CO)N)C(=O)O RWDVVSKYZBNDCO-MELADBBJSA-N 0.000 description 1
- PJIQEIFXZPCWOJ-FXQIFTODSA-N Ser-Pro-Asp Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O PJIQEIFXZPCWOJ-FXQIFTODSA-N 0.000 description 1
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 1
- VEVYMLNYMULSMS-AVGNSLFASA-N Ser-Tyr-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VEVYMLNYMULSMS-AVGNSLFASA-N 0.000 description 1
- MFQMZDPAZRZAPV-NAKRPEOUSA-N Ser-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CO)N MFQMZDPAZRZAPV-NAKRPEOUSA-N 0.000 description 1
- SIEBDTCABMZCLF-XGEHTFHBSA-N Ser-Val-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SIEBDTCABMZCLF-XGEHTFHBSA-N 0.000 description 1
- 102100040516 Serine-tRNA ligase, cytoplasmic Human genes 0.000 description 1
- 102000007562 Serum Albumin Human genes 0.000 description 1
- 108010071390 Serum Albumin Proteins 0.000 description 1
- 241000710960 Sindbis virus Species 0.000 description 1
- DWAQJAXMDSEUJJ-UHFFFAOYSA-M Sodium bisulfite Chemical compound [Na+].OS([O-])=O DWAQJAXMDSEUJJ-UHFFFAOYSA-M 0.000 description 1
- 101710167605 Spike glycoprotein Proteins 0.000 description 1
- 102220599400 Spindlin-1_D1118H_mutation Human genes 0.000 description 1
- 102220590324 Spindlin-1_D80A_mutation Human genes 0.000 description 1
- 102220599627 Spindlin-1_D950N_mutation Human genes 0.000 description 1
- 102220590625 Spindlin-1_P26S_mutation Human genes 0.000 description 1
- 102220590680 Spindlin-1_S13I_mutation Human genes 0.000 description 1
- 102220599630 Spindlin-1_T1027I_mutation Human genes 0.000 description 1
- 102220590621 Spindlin-1_T19R_mutation Human genes 0.000 description 1
- 102220590630 Spindlin-1_T20N_mutation Human genes 0.000 description 1
- 235000019892 Stellar Nutrition 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- 108010076818 TEV protease Proteins 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- BHEOSNUKNHRBNM-UHFFFAOYSA-N Tetramethylsqualene Natural products CC(=C)C(C)CCC(=C)C(C)CCC(C)=CCCC=C(C)CCC(C)C(=C)CCC(C)C(C)=C BHEOSNUKNHRBNM-UHFFFAOYSA-N 0.000 description 1
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 1
- PQLXHSACXPGWPD-GSSVUCPTSA-N Thr-Asn-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PQLXHSACXPGWPD-GSSVUCPTSA-N 0.000 description 1
- LMMDEZPNUTZJAY-GCJQMDKQSA-N Thr-Asp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O LMMDEZPNUTZJAY-GCJQMDKQSA-N 0.000 description 1
- MFEBUIFJVPNZLO-OLHMAJIHSA-N Thr-Asp-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O MFEBUIFJVPNZLO-OLHMAJIHSA-N 0.000 description 1
- QILPDQCTQZDHFM-HJGDQZAQSA-N Thr-Gln-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QILPDQCTQZDHFM-HJGDQZAQSA-N 0.000 description 1
- ZQUKYJOKQBRBCS-GLLZPBPUSA-N Thr-Gln-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O ZQUKYJOKQBRBCS-GLLZPBPUSA-N 0.000 description 1
- VUVCRYXYUUPGSB-GLLZPBPUSA-N Thr-Gln-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O VUVCRYXYUUPGSB-GLLZPBPUSA-N 0.000 description 1
- KGKWKSSSQGGYAU-SUSMZKCASA-N Thr-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KGKWKSSSQGGYAU-SUSMZKCASA-N 0.000 description 1
- JMGJDTNUMAZNLX-RWRJDSDZSA-N Thr-Glu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JMGJDTNUMAZNLX-RWRJDSDZSA-N 0.000 description 1
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 1
- KRGDDWVBBDLPSJ-CUJWVEQBSA-N Thr-His-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O KRGDDWVBBDLPSJ-CUJWVEQBSA-N 0.000 description 1
- KZSYAEWQMJEGRZ-RHYQMDGZSA-N Thr-Leu-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O KZSYAEWQMJEGRZ-RHYQMDGZSA-N 0.000 description 1
- BIBYEFRASCNLAA-CDMKHQONSA-N Thr-Phe-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 BIBYEFRASCNLAA-CDMKHQONSA-N 0.000 description 1
- NWECYMJLJGCBOD-UNQGMJICSA-N Thr-Phe-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O NWECYMJLJGCBOD-UNQGMJICSA-N 0.000 description 1
- MXDOAJQRJBMGMO-FJXKBIBVSA-N Thr-Pro-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O MXDOAJQRJBMGMO-FJXKBIBVSA-N 0.000 description 1
- FWTFAZKJORVTIR-VZFHVOOUSA-N Thr-Ser-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O FWTFAZKJORVTIR-VZFHVOOUSA-N 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- RTAQQCXQSZGOHL-UHFFFAOYSA-N Titanium Chemical compound [Ti] RTAQQCXQSZGOHL-UHFFFAOYSA-N 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- HXMJXDNSFVNSEH-IHPCNDPISA-N Trp-Cys-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)N HXMJXDNSFVNSEH-IHPCNDPISA-N 0.000 description 1
- UQHPXCFAHVTWFU-BVSLBCMMSA-N Trp-Phe-Val Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O UQHPXCFAHVTWFU-BVSLBCMMSA-N 0.000 description 1
- OJKVFAWXPGCJMF-BPUTZDHNSA-N Trp-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)N[C@@H](CO)C(=O)O OJKVFAWXPGCJMF-BPUTZDHNSA-N 0.000 description 1
- PEVVXUGSAKEPEN-AVGNSLFASA-N Tyr-Asn-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PEVVXUGSAKEPEN-AVGNSLFASA-N 0.000 description 1
- NRFTYDWKWGJLAR-MELADBBJSA-N Tyr-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O NRFTYDWKWGJLAR-MELADBBJSA-N 0.000 description 1
- IWRMTNJCCMEBEX-AVGNSLFASA-N Tyr-Glu-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N)O IWRMTNJCCMEBEX-AVGNSLFASA-N 0.000 description 1
- WAPFQMXRSDEGOE-IHRRRGAJSA-N Tyr-Glu-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O WAPFQMXRSDEGOE-IHRRRGAJSA-N 0.000 description 1
- LMLBOGIOLHZXOT-JYJNAYRXSA-N Tyr-Glu-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O LMLBOGIOLHZXOT-JYJNAYRXSA-N 0.000 description 1
- AZGZDDNKFFUDEH-QWRGUYRKSA-N Tyr-Gly-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AZGZDDNKFFUDEH-QWRGUYRKSA-N 0.000 description 1
- WSFXJLFSJSXGMQ-MGHWNKPDSA-N Tyr-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N WSFXJLFSJSXGMQ-MGHWNKPDSA-N 0.000 description 1
- GULIUBBXCYPDJU-CQDKDKBSSA-N Tyr-Leu-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 GULIUBBXCYPDJU-CQDKDKBSSA-N 0.000 description 1
- OGPKMBOPMDTEDM-IHRRRGAJSA-N Tyr-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N OGPKMBOPMDTEDM-IHRRRGAJSA-N 0.000 description 1
- XFEMMSGONWQACR-KJEVXHAQSA-N Tyr-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O XFEMMSGONWQACR-KJEVXHAQSA-N 0.000 description 1
- RGJZPXFZIUUQDN-BPNCWPANSA-N Tyr-Val-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O RGJZPXFZIUUQDN-BPNCWPANSA-N 0.000 description 1
- 241000700618 Vaccinia virus Species 0.000 description 1
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 1
- LIQJSDDOULTANC-QSFUFRPTSA-N Val-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N LIQJSDDOULTANC-QSFUFRPTSA-N 0.000 description 1
- OGNMURQZFMHFFD-NHCYSSNCSA-N Val-Asn-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N OGNMURQZFMHFFD-NHCYSSNCSA-N 0.000 description 1
- TZVUSFMQWPWHON-NHCYSSNCSA-N Val-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N TZVUSFMQWPWHON-NHCYSSNCSA-N 0.000 description 1
- XGJLNBNZNMVJRS-NRPADANISA-N Val-Glu-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O XGJLNBNZNMVJRS-NRPADANISA-N 0.000 description 1
- VLDMQVZZWDOKQF-AUTRQRHGSA-N Val-Glu-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VLDMQVZZWDOKQF-AUTRQRHGSA-N 0.000 description 1
- UKEVLVBHRKWECS-LSJOCFKGSA-N Val-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](C(C)C)N UKEVLVBHRKWECS-LSJOCFKGSA-N 0.000 description 1
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 1
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 1
- WBAJDGWKRIHOAC-GVXVVHGQSA-N Val-Lys-Gln Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O WBAJDGWKRIHOAC-GVXVVHGQSA-N 0.000 description 1
- DIOSYUIWOQCXNR-ONGXEEELSA-N Val-Lys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O DIOSYUIWOQCXNR-ONGXEEELSA-N 0.000 description 1
- MJFSRZZJQWZHFQ-SRVKXCTJSA-N Val-Met-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)O)N MJFSRZZJQWZHFQ-SRVKXCTJSA-N 0.000 description 1
- LJSZPMSUYKKKCP-UBHSHLNASA-N Val-Phe-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 LJSZPMSUYKKKCP-UBHSHLNASA-N 0.000 description 1
- GIAZPLMMQOERPN-YUMQZZPRSA-N Val-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O GIAZPLMMQOERPN-YUMQZZPRSA-N 0.000 description 1
- KSFXWENSJABBFI-ZKWXMUAHSA-N Val-Ser-Asn Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KSFXWENSJABBFI-ZKWXMUAHSA-N 0.000 description 1
- LCHZBEUVGAVMKS-RHYQMDGZSA-N Val-Thr-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)[C@@H](C)O)C(O)=O LCHZBEUVGAVMKS-RHYQMDGZSA-N 0.000 description 1
- XNLUVJPMPAZHCY-JYJNAYRXSA-N Val-Val-Phe Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 XNLUVJPMPAZHCY-JYJNAYRXSA-N 0.000 description 1
- 241000710959 Venezuelan equine encephalitis virus Species 0.000 description 1
- 108020005202 Viral DNA Proteins 0.000 description 1
- 108010059722 Viral Fusion Proteins Proteins 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 238000000862 absorption spectrum Methods 0.000 description 1
- 239000008351 acetate buffer Substances 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 239000000443 aerosol Substances 0.000 description 1
- 238000001261 affinity purification Methods 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- 229910001508 alkali metal halide Inorganic materials 0.000 description 1
- 150000008045 alkali metal halides Chemical class 0.000 description 1
- 230000000172 allergic effect Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- WNROFYMDJYEPJX-UHFFFAOYSA-K aluminium hydroxide Chemical compound [OH-].[OH-].[OH-].[Al+3] WNROFYMDJYEPJX-UHFFFAOYSA-K 0.000 description 1
- ILRRQNADMUWWFW-UHFFFAOYSA-K aluminium phosphate Chemical compound O1[Al]2OP1(=O)O2 ILRRQNADMUWWFW-UHFFFAOYSA-K 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 229910021529 ammonia Inorganic materials 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 208000003455 anaphylaxis Diseases 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 238000005349 anion exchange Methods 0.000 description 1
- 238000005571 anion exchange chromatography Methods 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 230000000840 anti-viral effect Effects 0.000 description 1
- 230000000890 antigenic effect Effects 0.000 description 1
- 239000004599 antimicrobial Substances 0.000 description 1
- 239000003963 antioxidant agent Substances 0.000 description 1
- 235000006708 antioxidants Nutrition 0.000 description 1
- 239000007900 aqueous suspension Substances 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 235000010323 ascorbic acid Nutrition 0.000 description 1
- 239000011668 ascorbic acid Substances 0.000 description 1
- 229960005070 ascorbic acid Drugs 0.000 description 1
- 125000000613 asparagine group Chemical group N[C@@H](CC(N)=O)C(=O)* 0.000 description 1
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 1
- 208000006673 asthma Diseases 0.000 description 1
- 125000004429 atom Chemical group 0.000 description 1
- 208000010668 atopic eczema Diseases 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 239000002585 base Substances 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 229960000686 benzalkonium chloride Drugs 0.000 description 1
- 235000010233 benzoic acid Nutrition 0.000 description 1
- 229960004365 benzoic acid Drugs 0.000 description 1
- CADWTSSKOVRVJC-UHFFFAOYSA-N benzyl(dimethyl)azanium;chloride Chemical compound [Cl-].C[NH+](C)CC1=CC=CC=C1 CADWTSSKOVRVJC-UHFFFAOYSA-N 0.000 description 1
- WHGYBXFWUBPSRW-FOUAGVGXSA-N beta-cyclodextrin Chemical compound OC[C@H]([C@H]([C@@H]([C@H]1O)O)O[C@H]2O[C@@H]([C@@H](O[C@H]3O[C@H](CO)[C@H]([C@@H]([C@H]3O)O)O[C@H]3O[C@H](CO)[C@H]([C@@H]([C@H]3O)O)O[C@H]3O[C@H](CO)[C@H]([C@@H]([C@H]3O)O)O[C@H]3O[C@H](CO)[C@H]([C@@H]([C@H]3O)O)O3)[C@H](O)[C@H]2O)CO)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O)[C@@H]3O[C@@H]1CO WHGYBXFWUBPSRW-FOUAGVGXSA-N 0.000 description 1
- 235000011175 beta-cyclodextrine Nutrition 0.000 description 1
- 102000006635 beta-lactamase Human genes 0.000 description 1
- 229960004853 betadex Drugs 0.000 description 1
- 239000012148 binding buffer Substances 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 150000001642 boronic acid derivatives Chemical class 0.000 description 1
- SIEYLFHKZGLBNX-UHFFFAOYSA-N bupivacaine hydrochloride (anhydrous) Chemical compound [Cl-].CCCC[NH+]1CCCCC1C(=O)NC1=C(C)C=CC=C1C SIEYLFHKZGLBNX-UHFFFAOYSA-N 0.000 description 1
- 102220429344 c.456G>T Human genes 0.000 description 1
- 229960001948 caffeine Drugs 0.000 description 1
- VJEONQKOZGKCAK-UHFFFAOYSA-N caffeine Natural products CN1C(=O)N(C)C(=O)C2=C1C=CN2C VJEONQKOZGKCAK-UHFFFAOYSA-N 0.000 description 1
- 229940023860 canarypox virus HIV vaccine Drugs 0.000 description 1
- 229960003669 carbenicillin Drugs 0.000 description 1
- FPPNZSSZRUTDAP-UWFZAAFLSA-N carbenicillin Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)C(C(O)=O)C1=CC=CC=C1 FPPNZSSZRUTDAP-UWFZAAFLSA-N 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 229910002091 carbon monoxide Inorganic materials 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- UHBYWPGGCSDKFX-UHFFFAOYSA-N carboxyglutamic acid Chemical compound OC(=O)C(N)CC(C(O)=O)C(O)=O UHBYWPGGCSDKFX-UHFFFAOYSA-N 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 230000034303 cell budding Effects 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 239000002738 chelating agent Substances 0.000 description 1
- 239000012707 chemical precursor Substances 0.000 description 1
- 229960003260 chlorhexidine Drugs 0.000 description 1
- 229940107161 cholesterol Drugs 0.000 description 1
- 235000012000 cholesterol Nutrition 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 150000001860 citric acid derivatives Chemical class 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000009827 complement-dependent cellular cytotoxicity Effects 0.000 description 1
- 239000008139 complexing agent Substances 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 239000012468 concentrated sample Substances 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000037029 cross reaction Effects 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 231100000433 cytotoxic Toxicity 0.000 description 1
- 230000001472 cytotoxic effect Effects 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000005860 defense response to virus Effects 0.000 description 1
- 239000003405 delayed action preparation Substances 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 229940119744 dextran 40 Drugs 0.000 description 1
- 235000019425 dextrin Nutrition 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 238000002022 differential scanning fluorescence spectroscopy Methods 0.000 description 1
- 238000007865 diluting Methods 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- PMMYEEVYMWASQN-UHFFFAOYSA-N dl-hydroxyproline Natural products OC1C[NH2+]C(C([O-])=O)C1 PMMYEEVYMWASQN-UHFFFAOYSA-N 0.000 description 1
- PRAKJMSDJKAYCZ-UHFFFAOYSA-N dodecahydrosqualene Natural products CC(C)CCCC(C)CCCC(C)CCCCC(C)CCCC(C)CCCC(C)C PRAKJMSDJKAYCZ-UHFFFAOYSA-N 0.000 description 1
- 239000002552 dosage form Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 238000001493 electron microscopy Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 210000001163 endosome Anatomy 0.000 description 1
- 239000000147 enterotoxin Substances 0.000 description 1
- 231100000655 enterotoxin Toxicity 0.000 description 1
- 244000309457 enveloped RNA virus Species 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 235000019441 ethanol Nutrition 0.000 description 1
- BEFDCLMNVWHSGT-UHFFFAOYSA-N ethenylcyclopentane Chemical compound C=CC1CCCC1 BEFDCLMNVWHSGT-UHFFFAOYSA-N 0.000 description 1
- LVGKNOAMLMIIKO-QXMHVHEDSA-N ethyl oleate Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OCC LVGKNOAMLMIIKO-QXMHVHEDSA-N 0.000 description 1
- 229940093471 ethyl oleate Drugs 0.000 description 1
- 230000028023 exocytosis Effects 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 239000010408 film Substances 0.000 description 1
- 239000000796 flavoring agent Substances 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 235000013355 food flavoring agent Nutrition 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 239000008273 gelatin Substances 0.000 description 1
- 229920000159 gelatin Polymers 0.000 description 1
- 235000019322 gelatine Nutrition 0.000 description 1
- 235000011852 gelatine desserts Nutrition 0.000 description 1
- 229960002518 gentamicin Drugs 0.000 description 1
- 230000035784 germination Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 102000034238 globular proteins Human genes 0.000 description 1
- 108091005896 globular proteins Proteins 0.000 description 1
- 239000003862 glucocorticoid Substances 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 125000000291 glutamic acid group Chemical group N[C@@H](CCC(O)=O)C(=O)* 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 229940093915 gynecological organic acid Drugs 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 102000054350 human CHI3L1 Human genes 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 239000003906 humectant Substances 0.000 description 1
- 210000004754 hybrid cell Anatomy 0.000 description 1
- 150000002431 hydrogen Chemical class 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 229960002163 hydrogen peroxide Drugs 0.000 description 1
- 229920001477 hydrophilic polymer Polymers 0.000 description 1
- 229920001600 hydrophobic polymer Polymers 0.000 description 1
- 229960002591 hydroxyproline Drugs 0.000 description 1
- 230000017555 immunoglobulin mediated immune response Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000000968 intestinal effect Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 238000001990 intravenous administration Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 108010027338 isoleucylcysteine Proteins 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 238000011005 laboratory method Methods 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 239000000787 lecithin Substances 0.000 description 1
- 235000010445 lecithin Nutrition 0.000 description 1
- 229940067606 lecithin Drugs 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 229960001614 levamisole Drugs 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 239000012669 liquid formulation Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000004020 luminiscence type Methods 0.000 description 1
- 238000012792 lyophilization process Methods 0.000 description 1
- 239000008176 lyophilized powder Substances 0.000 description 1
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 230000002934 lysing effect Effects 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- 229940106885 marcaine Drugs 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 235000010270 methyl p-hydroxybenzoate Nutrition 0.000 description 1
- 239000004292 methyl p-hydroxybenzoate Substances 0.000 description 1
- 125000000250 methylamino group Chemical group [H]N(*)C([H])([H])[H] 0.000 description 1
- 229960002216 methylparaben Drugs 0.000 description 1
- LSDPWZHWYPCBBB-UHFFFAOYSA-O methylsulfide anion Chemical compound [SH2+]C LSDPWZHWYPCBBB-UHFFFAOYSA-O 0.000 description 1
- 239000011859 microparticle Substances 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 108091005601 modified peptides Proteins 0.000 description 1
- 150000002772 monosaccharides Chemical class 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 229940022007 naked DNA vaccine Drugs 0.000 description 1
- 239000002071 nanotube Substances 0.000 description 1
- 239000002070 nanowire Substances 0.000 description 1
- 201000009240 nasopharyngitis Diseases 0.000 description 1
- 239000006199 nebulizer Substances 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 229960004927 neomycin Drugs 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 235000008390 olive oil Nutrition 0.000 description 1
- 239000004006 olive oil Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 150000007524 organic acids Chemical class 0.000 description 1
- 235000005985 organic acids Nutrition 0.000 description 1
- 150000002895 organic esters Chemical class 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- FJKROLUGYXJWQN-UHFFFAOYSA-N papa-hydroxy-benzoic acid Natural products OC(=O)C1=CC=C(O)C=C1 FJKROLUGYXJWQN-UHFFFAOYSA-N 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 229940049954 penicillin Drugs 0.000 description 1
- 239000008194 pharmaceutical composition Substances 0.000 description 1
- 235000021317 phosphate Nutrition 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 1
- BZQFBWGGLXLEPQ-REOHCLBHSA-N phosphoserine Chemical compound OC(=O)[C@@H](N)COP(O)(O)=O BZQFBWGGLXLEPQ-REOHCLBHSA-N 0.000 description 1
- 229920001983 poloxamer Polymers 0.000 description 1
- 239000004417 polycarbonate Substances 0.000 description 1
- 229920000515 polycarbonate Polymers 0.000 description 1
- 229920002704 polyhistidine Polymers 0.000 description 1
- 102000040430 polynucleotide Human genes 0.000 description 1
- 108091033319 polynucleotide Proteins 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 229920005862 polyol Polymers 0.000 description 1
- 150000003077 polyols Chemical class 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 229950008882 polysorbate Drugs 0.000 description 1
- 229940068965 polysorbates Drugs 0.000 description 1
- 239000001103 potassium chloride Substances 0.000 description 1
- 235000011164 potassium chloride Nutrition 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 230000037452 priming Effects 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 108010079317 prolyl-tyrosine Proteins 0.000 description 1
- 108010053725 prolylvaline Proteins 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000011321 prophylaxis Methods 0.000 description 1
- 235000010232 propyl p-hydroxybenzoate Nutrition 0.000 description 1
- 239000004405 propyl p-hydroxybenzoate Substances 0.000 description 1
- 229960003415 propylparaben Drugs 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 239000013639 protein trimer Substances 0.000 description 1
- 230000005180 public health Effects 0.000 description 1
- 239000012521 purified sample Substances 0.000 description 1
- 230000009257 reactivity Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 208000023504 respiratory system disease Diseases 0.000 description 1
- 102220277108 rs1553412687 Human genes 0.000 description 1
- 102220053106 rs199537178 Human genes 0.000 description 1
- 102200144284 rs235768 Human genes 0.000 description 1
- 102220031793 rs431825282 Human genes 0.000 description 1
- 102220075059 rs529697285 Human genes 0.000 description 1
- 102220046286 rs587782805 Human genes 0.000 description 1
- 102220033185 rs62646881 Human genes 0.000 description 1
- 102220058675 rs786203529 Human genes 0.000 description 1
- 102220029076 rs78775072 Human genes 0.000 description 1
- 102220074121 rs796052019 Human genes 0.000 description 1
- 102200024304 rs886037751 Human genes 0.000 description 1
- 229960004889 salicylic acid Drugs 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 229930182490 saponin Natural products 0.000 description 1
- 235000017709 saponins Nutrition 0.000 description 1
- 150000007949 saponins Chemical class 0.000 description 1
- 230000003248 secreting effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 235000015424 sodium Nutrition 0.000 description 1
- 229940079827 sodium hydrogen sulfite Drugs 0.000 description 1
- 235000010267 sodium hydrogen sulphite Nutrition 0.000 description 1
- 229940001482 sodium sulfite Drugs 0.000 description 1
- 235000010265 sodium sulphite Nutrition 0.000 description 1
- 238000005063 solubilization Methods 0.000 description 1
- 230000007928 solubilization Effects 0.000 description 1
- 235000010199 sorbic acid Nutrition 0.000 description 1
- 239000004334 sorbic acid Substances 0.000 description 1
- 229940075582 sorbic acid Drugs 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 239000007921 spray Substances 0.000 description 1
- 229940031439 squalene Drugs 0.000 description 1
- TUHBEKDERLKLEC-UHFFFAOYSA-N squalene Natural products CC(=CCCC(=CCCC(=CCCC=C(/C)CCC=C(/C)CC=C(C)C)C)C)C TUHBEKDERLKLEC-UHFFFAOYSA-N 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 238000012289 standard assay Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000011146 sterile filtration Methods 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 229940031626 subunit vaccine Drugs 0.000 description 1
- 150000005846 sugar alcohols Chemical class 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 239000000375 suspending agent Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- RTKIYNMVFMVABJ-UHFFFAOYSA-L thimerosal Chemical compound [Na+].CC[Hg]SC1=CC=CC=C1C([O-])=O RTKIYNMVFMVABJ-UHFFFAOYSA-L 0.000 description 1
- 229940033663 thimerosal Drugs 0.000 description 1
- 125000000341 threoninyl group Chemical group [H]OC([H])(C([H])([H])[H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- FGMPLJWBKKVCDB-UHFFFAOYSA-N trans-L-hydroxy-proline Natural products ON1CCCC1C(O)=O FGMPLJWBKKVCDB-UHFFFAOYSA-N 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 239000012096 transfection reagent Substances 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- ODLHGICHYURWBS-LKONHMLTSA-N trappsol cyclo Chemical compound CC(O)COC[C@H]([C@H]([C@@H]([C@H]1O)O)O[C@H]2O[C@@H]([C@@H](O[C@H]3O[C@H](COCC(C)O)[C@H]([C@@H]([C@H]3O)O)O[C@H]3O[C@H](COCC(C)O)[C@H]([C@@H]([C@H]3O)O)O[C@H]3O[C@H](COCC(C)O)[C@H]([C@@H]([C@H]3O)O)O[C@H]3O[C@H](COCC(C)O)[C@H]([C@@H]([C@H]3O)O)O3)[C@H](O)[C@H]2O)COCC(O)C)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O)[C@@H]3O[C@@H]1COCC(C)O ODLHGICHYURWBS-LKONHMLTSA-N 0.000 description 1
- GPRLSGONYQIRFK-MNYXATJNSA-N triton Chemical compound [3H+] GPRLSGONYQIRFK-MNYXATJNSA-N 0.000 description 1
- 229960000281 trometamol Drugs 0.000 description 1
- 108010044292 tryptophyltyrosine Proteins 0.000 description 1
- 229950009811 ubenimex Drugs 0.000 description 1
- 238000002211 ultraviolet spectrum Methods 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241001529453 unidentified herpesvirus Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 229940125575 vaccine candidate Drugs 0.000 description 1
- 235000015112 vegetable and seed oil Nutrition 0.000 description 1
- 239000008158 vegetable oil Substances 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
- 239000011534 wash buffer Substances 0.000 description 1
- 238000002424 x-ray crystallography Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
- C07K14/08—RNA viruses
- C07K14/165—Coronaviridae, e.g. avian infectious bronchitis virus
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
- A61K39/215—Coronaviridae, e.g. avian infectious bronchitis virus
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/385—Haptens or antigens, bound to carriers
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P11/00—Drugs for disorders of the respiratory system
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/14—Antivirals for RNA viruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P37/00—Drugs for immunological or allergic disorders
- A61P37/02—Immunomodulators
- A61P37/04—Immunostimulants
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/205—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Campylobacter (G)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/79—Transferrins, e.g. lactoferrins, ovotransferrins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/555—Medicinal preparations containing antigens or antibodies characterised by a specific combination antigen/adjuvant
- A61K2039/55505—Inorganic adjuvants
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/555—Medicinal preparations containing antigens or antibodies characterised by a specific combination antigen/adjuvant
- A61K2039/55511—Organic adjuvants
- A61K2039/55561—CpG containing adjuvants; Oligonucleotide containing adjuvants
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/555—Medicinal preparations containing antigens or antibodies characterised by a specific combination antigen/adjuvant
- A61K2039/55511—Organic adjuvants
- A61K2039/55566—Emulsions, e.g. Freund's adjuvant, MF59
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/555—Medicinal preparations containing antigens or antibodies characterised by a specific combination antigen/adjuvant
- A61K2039/55511—Organic adjuvants
- A61K2039/55572—Lipopolysaccharides; Lipid A; Monophosphoryl lipid A
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/555—Medicinal preparations containing antigens or antibodies characterised by a specific combination antigen/adjuvant
- A61K2039/55511—Organic adjuvants
- A61K2039/55577—Saponins; Quil A; QS21; ISCOMS
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/60—Medicinal preparations containing antigens or antibodies characteristics by the carrier linked to the antigen
- A61K2039/6031—Proteins
- A61K2039/6068—Other bacterial proteins, e.g. OMP
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/70—Fusion polypeptide containing domain for protein-protein interaction
- C07K2319/735—Fusion polypeptide containing domain for protein-protein interaction containing a domain for self-assembly, e.g. a viral coat protein (includes phage display)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/90—Fusion polypeptide containing a motif for post-translational modification
- C07K2319/91—Fusion polypeptide containing a motif for post-translational modification containing a motif for glycosylation
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/20011—Coronaviridae
- C12N2770/20022—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/20011—Coronaviridae
- C12N2770/20034—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
Abstract
페리틴 서브유닛 폴리펩티드의 아미노산 서열에 연결된 SARS-CoV-2와 같은 코로나바이러스의 스파이크 단백질의 엑토도메인의 아미노산 서열을 포함하는 융합 단백질이 제공된다. 코로나바이러스의 스파이크 단백질의 엑토도메인의 표면에 노출된 삼량체를 갖는 이러한 융합 단백질을 포함하는 나노입자가 또한 제공된다. 융합 단백질을 인코딩하는 핵산 및 벡터, 이러한 핵산 및 벡터를 포함하는 세포, 융합 단백질, 나노입자 또는 벡터를 포함하는 면역원성 조성물, 및 상응하는 방법 및 키트가 또한 제공된다.
Description
배경
코로나바이러스(CoV)는 일반적인 감기부터 중동 호흡기 증후군(MERS) 및 중증 급성 호흡기 증후군(SARS)과 같은 보다 심각한 질병에 이르는 인간 질병을 유발하는 대규모 바이러스 패밀리이다. 코로나바이러스는 인수공통감염이며, 이는 동물과 사람 사이에 전염될 수 있음을 의미한다. 코로나바이러스는 바이러스 입자의 표면이 비리온으로부터 돌출된, 직경이 80-160 nm인, 잘 분리된 꽃잎 모양의 당단백질 "스파이크"로 덮여 있기 때문에 비리온 주위에 특징적인 왕관 또는 코로나를 갖는 크고 외피가 있는 단일 가닥 RNA 바이러스이다. 스파이크 당단백질은 비리온의 외부 외피에 위치한 클래스 I 바이러스 융합 단백질이다. 스파이크 단백질은 숙주 세포 수용체와 상호작용함으로써 바이러스 감염에 중요한 역할을 한다.
중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2)는 호흡기 질환인 소위 코로나바이러스 질병 2019(COVID-19)를 유발하는 코로나바이러스의 균주이다. SARS-CoV-2는 전 세계적으로 확산되었으며 이미 1,600만 명 이상의 COVID-19 사례 및 600,000명 이상의 사망을 초래하였다. SARS-CoV-2는 엔도솜 또는 원형질막 융합을 통해 진핵 세포에 진입할 수 있다. 두 경로 모두에서, 비리온 표면의 스파이크는 막-결합된 단백질 안지오텐신-전환 효소 2(ACE2)에 결합하고 숙주 세포의 막에 대한 부착 및 진입을 매개한다. SARS-CoV-2는 전염성이 매우 높으며 주로 밀접한 접촉 및 호흡기 비말을 통해 사람들 사이에 확산된다. SARS-CoV-2의 장기적인 통제를 위해서는 전 세계적으로 널리 이용 가능한 효과적인 백신이 필요할 것이다.
개요
본 문서에서 사용된 "발명", "본 발명", "상기 발명" 및 "본 발명"이라는 용어는 본 특허 출원 및 하기 청구 범위의 모든 주제를 광범위하게 지칭하기 위한 것이다. 이러한 용어를 포함하는 진술은 본원에 설명된 주제를 제한하거나 하기 특허 청구 범위의 의미 또는 범위를 제한하지 않는 것으로 이해되어야 한다. 본 발명의 포괄적인 구현예는 본 개요가 아니라 청구 범위에 의해 정의된다. 본 개요는 본 발명의 다양한 양태에 대한 대략적인 개요이며 본 문서 및 첨부된 도면에서 설명되고 예시된 개념 중 일부를 소개한다. 본 개요는 청구된 주제의 핵심 또는 필수 특징을 식별하기 위한 것이 아니며 청구된 주제의 범위를 결정하기 위해 단독으로 사용하기 위한 것도 아니다. 본 주제는 전체 명세서, 일부 또는 모든 도면 및 각 청구항의 적절한 부분을 참조하여 이해되어야 한다. 본 발명의 예시적인 구현예 중 일부는 아래에서 논의된다.
코로나바이러스의 스파이크 단백질의 인공적으로 변형된 아미노산 서열 및 페리틴 서브유닛 폴리펩티드의 아미노산 서열의 융합 단백질이 본 발명의 구현예에 포함되고 본 개시에 기술된다. 일부 예시적인 구현예에서, 스파이크 단백질의 인공적으로 변형된 아미노산 서열은 SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:14 또는 SEQ ID NO:15와 적어도 90% 서열 동일성을 갖는 스파이크 단백질의 엑토도메인의 인공적으로 변형된 아미노산 서열이다. 일부 예시적인 구현예에서, 코로나바이러스는 SARS-CoV-2이다. 일부 예시적인 구현예에서, 코로나바이러스의 스파이크 단백질의 인공적으로 변형된 아미노산 서열은 적어도 헵타드 반복 2(HR2)의 아미노산 서열의 C-말단 결실을 포함한다. 일부 예시적인 구현예에서, 코로나바이러스의 스파이크 단백질의 인공적으로 변형된 아미노산 서열은 푸린 인식 부위를 제거하는 돌연변이를 포함한다. 일부 예시적인 구현예에서, 코로나바이러스의 스파이크 단백질의 인공적으로 변형된 아미노산 서열은 스파이크 단백질을 예비-융합 입체형태로 안정화시키는 하나 이상의 돌연변이를 포함한다. 페리틴 서브유닛 폴리펩티드는 헬리코박터 파일로리(Helicobacter pylori) 페리틴 서브유닛 폴리펩티드일 수 있다. 일부 예시적인 구현예에서, 페리틴 서브유닛 폴리펩티드의 아미노산 서열은 SEQ ID NO:2와 적어도 90% 서열 동일성을 갖는 서열이다. 일부 예시적인 구현예에서, 페리틴 서브유닛 폴리펩티드는 하나 이상(즉, 적어도 하나)의 인공 글리코실화 부위를 함유한다. 일부 예시적인 구현예에서, 코로나바이러스의 스파이크 단백질의 인공적으로 변형된 아미노산 서열은 링커 아미노산 서열에 의해 페리틴 서브유닛 폴리펩티드의 아미노산 서열에 연결된다. 일부 예시적인 구현예에서, 융합 단백질의 아미노산 서열은 SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:33 또는 SEQ ID NO:34와 적어도 90% 서열 동일성을 갖는 서열이다.
본 발명의 구현예에 따른 융합 단백질의 올리고머를 포함하는 나노입자가 또한 본 발명의 구현예에 포함되고 본 개시에 기술된다. 본 발명의 구현예에 따른 나노입자는 코로나바이러스의 스파이크 단백질의 엑토도메인의 표면에 노출된 삼량체를 포함한다. 일부 예시적인 구현예에서, 각각의 나노입자는 코로나바이러스의 스파이크 단백질의 엑토도메인의 표면에 노출된 삼량체 중 8개를 포함한다. 본 발명의 구현예에 따른 융합 단백질을 인코딩하는 핵산이 또한 본 발명의 구현예에 포함되고 본 개시에 기술된다. 본 발명의 구현예에 따른 핵산은 DNA 또는 RNA일 수 있다. 본 발명의 구현예에 따른 핵산을 포함하는 벡터가 또한 본 발명의 구현예에 포함되고 본 개시에 기술된다. 본 발명의 구현예에 따른 핵산 또는 본 발명의 구현예에 따른 벡터를 포함하는 세포가 또한 본 발명의 구현예에 포함되고 본 개시에 기술된다. 본 발명의 구현예에 따른 융합 단백질을 생산하는 방법이 또한 본 발명의 구현예에 포함되고 본 개시에 기술된다. 융합 단백질을 생산하는 방법은 본 발명의 구현예에 따른 핵산 또는 본 발명의 구현예에 따른 벡터를 세포에 도입하는 단계; 융합 단백질의 발현을 허용하는 조건 하에서 세포를 인큐베이션하는 단계; 및 융합 단백질을 분리하는 단계를 포함할 수 있다. 본 발명의 구현예에 따른 나노입자를 생산하는 방법이 또한 본 발명의 구현예에 포함되고 본 개시에 기술된다. 나노입자를 생산하는 방법은 본 발명의 구현예에 따른 핵산 또는 본 발명의 구현예에 따른 벡터를 세포에 도입하는 단계; 본 발명의 구현예에 따른 융합 단백질의 발현 및 나노입자의 자가-조립을 허용하는 조건 하에서 세포를 인큐베이션하는 단계; 및 나노입자를 분리하는 단계를 포함할 수 있다.
본 발명의 구현예에 따른 융합 단백질, 본 발명의 구현예에 따른 나노입자, 본 발명의 구현예에 따른 핵산 또는 본 발명의 구현예에 따른 벡터를 포함하는 면역원성 조성물이 또한 본 발명의 구현예에 포함되고 본 개시에 기술된다. 일부 예시적인 구현예에서, 면역원성 조성물은 본 발명의 구현예에 따른 2개 이상의 상이한 융합 단백질, 본 발명의 구현예에 따른 2개 이상의 상이한 나노입자, 본 발명의 구현예에 따른 2개 이상의 상이한 핵산 또는 본 발명의 구현예에 따른 2개 이상의 상이한 벡터를 포함한다. 면역원성 조성물은 명반을 포함할 수 있는 하나 이상의 애주번트(즉, 적어도 하나)를 추가로 포함할 수 있다. 일부 예시적인 구현예에서, 면역원성 조성물은 동결건조된다. 본 발명의 구현예 중 하나 이상에 따른 면역원성 조성물, 및 면역원성 조성물을 투여하기 위한 장치 및 부형제 중 하나 이상을 포함하는 키트가 또한 본 발명의 구현예에 포함되고 본 개시에 기술된다.
대상체에서 면역 반응을 유도하는 방법이 또한 본 발명의 구현예에 포함되고 본 개시에 기술되며, 상기 방법은 본 발명의 구현예에 따른 면역원성 조성물을 대상체에게 투여하는 단계를 포함한다. 이러한 방법에서, 면역원성 조성물은 대상체에서 코로나바이러스에 대한 보호 면역 반응을 유도할 수 있는 양으로 투여될 수 있다. 면역 반응은 대상체에서 코로나바이러스에 대한 중화 항체의 생산을 포함할 수 있다. 본 발명의 구현예에 따른 대상체에서 면역 반응을 유도하는 방법에서, 대상체는 인간일 수 있다.
본 개시는 하기 도면을 포함한다. 도면은 조성물 및 방법의 특정 구현예 및/또는 특징을 예시하고 조성물 및 방법의 임의의 설명(들)을 보충하기 위한 것이다. 서면 설명이 그러한 경우임을 명시적으로 나타내지 않는 한, 도면은 조성물 및 방법의 범위를 제한하지 않는다.
도 1a는 본 개시의 특정 양태에 따른 SARS-CoV-2 스파이크 단백질 항원 폴리펩티드 작제물의 개략도이다.
도 1b는 본 개시의 특정 양태에 따른 SARS-CoV-2 스파이크 단백질 항원 폴리펩티드의 3차원 구조의 개략도이며, 이는 극저온 전자현미경(cryo-EM)에 의해 결정된 스파이크 삼량체의 구조 및 X-선 결정학에 의해 결정된 헬리코박터 파일로리 페리틴 나노입자의 구조에 기초한다.
도 2a는 본 개시의 특정 양태에 따른 SARS-CoV-2 스파이크 단백질 항원의 발현 및 특성화 결과를 예시하는 웨스턴 블롯의 사진 이미지를 보여준다.
도 2b는 본 개시의 특정 양태에 따른 SARS-CoV-2 스파이크 단백질 항원의 발현 및 특성화 결과를 예시하는 SDS-PAGE 겔의 사진 이미지를 보여준다.
도 3은 본 개시의 특정 양태에 따른 SARS-CoV-2 스파이크 단백질 항원의 다중각 광 산란(SEC-MALS)과 결합된 분석 규모 크기-배제 크로마토그래피의 결과를 예시하는 선 플롯을 보여준다.
도 4는 본 개시의 특정 양태에 따른 효소-결합 면역흡착 검정(ELISA)에 의한 인간 ACE2, 정제된 SARS-CoV-2 반응성 모노클로날 항체 CR3022, CB6 및 COVA-2-15, 및 에볼라 바이러스 반응성 모노클로날 항체 ADI-15731(음성 대조군으로서)에 대한 SARS-CoV-2 스파이크 단백질 항원의 결합 분석 결과를 예시하는 선 플롯을 보여준다.
도 5a는 본 개시의 특정 양태에 따른 SARS-CoV-2 스파이크ΔC-페리틴 융합 단백질 나노입자의 대표적인 동작-보정 cryo-EM 현미경 사진 및 무참조 2D 클래스 평균을 보여준다.
도 5b, 상부 패널은 본 개시의 특정 양태에 따른 두 가지 상이한 관점에서 SARS-CoV-2 스파이크ΔC-페리틴 융합 단백질 나노입자의 재구성된 cryo-EM 맵을 보여준다. 하부 패널은 본 개시의 특정 양태에 따른 상부 패널보다 낮은 등고선 수준에 표시된 cryo-EM 맵에 도킹된 SARS-CoV-2 스파이크ΔC-페리틴 융합 단백질의 원자 모델에 대한 두 가지 상이한 관점을 보여준다.
도 6은 본 개시의 특정 양태에 따른 SARS-CoV-2 스파이크 단백질 항원으로 면역화된 마우스로부터 초기 면역화 21일 후에 추출된 혈청의 ELISA 결합 분석 결과를 예시하는 도트 플롯을 보여준다. 항원은 X-축에 표시된다. SARS-CoV-2 RBD 단백질(왼쪽 그래프) 및 SARS-CoV-2 스파이크 단백질(오른쪽 그래프)에 대한 혈청의 결합을 분석하였다. 그래프에 표시된 각 포인트는 단일 동물로부터 2번의 기술적 중복 ELISA 곡선의 평균 log10 EC50 값을 나타낸다. 그래프의 각 막대는 10마리 동물의 평균 log10 EC50 값을 나타내고, 오차 막대는 표준 편차를 나타낸다. Kruskal-Wallis ANOVA에 이어 Dunn의 다중 비교를 사용하여 통계적 비교를 수행하였다. 모든 p 값은 다음과 같이 표시된다: * = p ≤ 0.05, ** = p ≤ 0.01, *** = p ≤ 0.001, **** = p ≤ 0.0001.
도 7은 본 개시의 특정 양태에 따른 루시페라제-기반 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 검정을 사용하여 평가된 SARS-CoV-2 스파이크 단백질 항원으로 면역화된 마우스로부터 초기 면역화 21일 후에 추출된 혈청의 중화 특성을 예시하는 도트 플롯을 보여준다. 항원은 X-축에 표시된다. Y-축은 정량 검정 한계(1:100 혈청 희석)로 설정되며, 중화 활성이 이보다 낮은 혈청 샘플은 LOQ로 설정된다. 각 포인트는 4번의 중복에서 유래된 단일 동물로부터의 log10 IC50 값을 나타낸다. 4번의 중복을 만들어 내기 위해, 각 실험은 서로 다른 날에 2번 수행되었고, 각 날에 이중 실험이 수행되었다. 이를 통해 4개의 정규화된 희석 곡선이 생성되었고, 그 후 컴파일링되어 각 동물에 대한 각 IC50 값을 얻었다. 그래프 막대의 각 포인트는 10마리 동물의 각 그룹에 대한 평균 값을 나타내고, 오차 막대는 표준 편차를 나타낸다. Kruskal-Wallis ANOVA에 이어 Dunn의 다중 비교를 사용하여 통계적 비교를 수행하였다. 모든 p 값은 다음과 같이 표시된다: * = p ≤ 0.05, ** = p ≤ 0.01, *** = p ≤ 0.001, **** = p ≤ 0.0001
도 8은 본 개시의 특정 양태에 따른 SARS-CoV-2 스파이크 단백질 항원으로 면역화된 마우스로부터 초기 면역화 28일 후에 추출된 혈청의 ELISA 결합 분석 결과를 예시하는 도트 플롯을 보여준다. 항원은 X-축에 표시된다. SARS-CoV-2 RBD 단백질(왼쪽 그래프) 및 SARS-CoV-2 스파이크 단백질(오른쪽 그래프)에 대한 혈청의 결합을 분석하였다. 그래프의 각 포인트는 단일 동물로부터 2번의 기술적 중복 ELISA 곡선의 평균 log10 EC50 값을 나타낸다. 막대는 10마리 동물의 평균을 나타내고, 오차 막대는 표준 편차를 나타낸다. Kruskal-Wallis ANOVA에 이어 Dunn의 다중 비교를 사용하여 통계적 비교를 수행하였다. 모든 p 값은 다음과 같이 표시된다: * = p ≤ 0.05, ** = p ≤ 0.01, *** = p ≤ 0.001, **** = p ≤ 0.0001
도 9는 본 개시의 특정 양태에 따른 SARS-oV-2 스파이크 단백질 항원으로 면역화된 마우스로부터 초기 면역화 28일 후에 추출된 혈청의 중화 특성을 예시하는 도트 플롯을 보여준다. 항원은 X-축에 표시된다. 중화 특성은 루시페라제-기반 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 검정을 사용하여 평가되었다.. Y-축은 정량 검정 한계(1:100 혈청 희석)로 설정되며, 중화 활성이 이보다 낮은 혈청 샘플은 LOQ로 설정된다. 그래프에 도시된 각 포인트는 4번의 중복에서 유래된 단일 동물로부터의 log10 IC50 값을 나타낸다. 4번의 중복을 만들어 내기 위해, 각 실험은 서로 다른 날에 2번 수행되었고, 각 날에 이중 실험이 수행되었다. 이를 통해 4개의 정규화된 희석 곡선이 생성되었고, 그 후 컴파일링되어 각 동물에 대한 각 IC50 값을 얻었다. 막대는 10마리 동물의 각 그룹에 대한 평균 log10 IC50을 나타내고, 오차 막대는 표준 편차를 나타낸다. Kruskal-Wallis ANOVA에 이어 Dunn의 다중 비교를 사용하여 통계적 비교를 수행하였다. 모든 p 값은 다음과 같이 표시된다: * = p ≤ 0.05, ** = p ≤ 0.01, *** = p ≤ 0.001, **** = p ≤ 0.0001
도 10은 본 개시의 특정 양태에 따른 2회 용량의 SARS-CoV-2 스파이크 단백질 항원으로 면역화된 실험용 마우스로부터 추출된 혈청의 IgG1, IgG2a 및 IgG2b 서브클래스 반응(X-축에 표시된 바와 같음)의 ELISA 결합 분석 결과를 예시하는 도트 플롯을 보여준다. 항원은 각 패널의 상단에 표시된다. 그래프의 각 포인트는 단일 동물의 log10 EC50 값을 나타내고; 각 가로 막대는 10마리 동물 그룹에 대한 평균 log10 EC50 역가를 나타내고; 오차 막대는 표준 편차를 나타낸다.
도 11a는 본 개시의 특정 양태에 따른 2회 용량의 SARS-CoV-2 스파이크 단백질 항원으로 면역화된 실험용 마우스로부터 추출된 혈청의 ELISA 결합 분석에 의해 결정된 IgG2a/IgG1 EC50의 비율을 예시하는 도트 플롯을 보여준다. 항원은 X-축에 표시된다. 그래프의 각 포인트는 단일 동물의 비율 값을 나타내고; 각 가로 막대는 10마리 동물 그룹에 대한 평균 비율을 나타내고; 오차 막대는 표준 편차를 나타낸다.
도 11b는 본 개시의 특정 양태에 따른 2회 용량의 SARS-CoV-2 스파이크 단백질 항원으로 면역화된 실험용 마우스로부터 추출된 혈청의 ELISA 결합 분석에 의해 결정된 IgG2b/IgG1 EC50의 비율을 예시하는 도트 플롯을 보여준다. 항원은 X-축에 표시된다. 그래프의 각 포인트는 단일 동물의 비율 값을 나타내고; 각 가로 막대는 10마리 동물 그룹에 대한 평균 비율을 나타내고; 오차 막대는 표준 편차를 나타낸다.
도 12는 본 개시의 특정 양태에 따른 2회 용량의 SARS-CoV-2 스파이크 단백질 항원으로 면역화된 실험용 마우스로부터 추출된 혈청에서 IgM 수준을 평가하는 ELISA에 의한 결합 분석 결과를 예시하는 선 플롯을 보여준다. 항원은 각 패널의 상단에 표시된다. 각 포인트는 용량-반응 연관 곡선에 핏팅된 각 동물(n = 그룹 당 10마리 마우스)로부터 실험 중복을 나타내고; 오차 막대는 각 포인트에 대한 표준 편차를 나타낸다.
도 13a는 본 개시의 특정 양태에 따른 상이한 용량(X-축에 표시됨)의 SARS-CoV-2 스파이크 단백질 항원 투여 28일 후에 실험용 마우스로부터 추출된 혈청의 중화 특성을 예시하는 도트 플롯을 보여준다. 중화 특성은 본 개시의 특정 양태에 따른 루시페라제-기반 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 검정을 사용하여 평가되었다. Y-축은 정량 검정 한계(1:100 혈청 희석)로 설정되며, 중화 활성이 이보다 낮은 혈청 샘플은 LOQ로 설정된다. 각 포인트는 단일 동물의 log10 IC50 값을 나타낸다. 각 가로 막대는 10마리 동물의 각 그룹에 대한 평균 값을 나타내고, 오차 막대는 표준 편차를 나타낸다.
도 13b는 본 개시의 특정 양태에 따른 SARS-CoV-2 스파이크 단백질 항원을 투여한 후 다양한 시점(X-축에 표시됨)에 실험용 마우스로부터 추출된 혈청의 중화 특성을 예시하는 도트 플롯을 보여준다. 중화 특성은 본 개시의 특정 양태에 따른 루시페라제-기반 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 검정을 사용하여 평가되었다. Y-축은 정량 검정 한계(1:100 혈청 희석)로 설정되며, 중화 활성이 이보다 낮은 혈청 샘플은 LOQ로 설정된다. 각 포인트는 단일 동물의 log10 IC50 값을 나타낸다. 각 가로 막대는 5마리 동물의 각 그룹에 대한 평균 값을 나타내고, 오차 막대는 표준 편차를 나타낸다.
도 14는 본 개시의 특정 양태에 따른 SARS-CoV-2 스파이크 단백질 항원(각 패널의 상단에 표시됨)으로 초기 면역화 다양한 시점(X-축에 표시됨)에 실험용 마우스로부터 추출된 혈청의 중화 특성을 예시하는 도트 플롯을 보여준다. 중화 특성은 본 개시의 특정 양태에 따른 루시페라제-기반 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 검정을 사용하여 평가되었다. Y-축은 정량 검정 한계(1:100 혈청 희석)로 설정되며, 중화 활성이 이보다 낮은 혈청 샘플은 LOQ로 설정된다. 각 포인트는 단일 동물의 log10 IC50 값을 나타낸다. 각 가로 막대는 5마리 동물의 각 그룹에 대한 평균 값을 나타내고, 오차 막대는 표준 편차를 나타낸다.
도 15a는 본 개시의 특정 양태에 따른 1 μg 또는 10 μg(X-축에 표시됨)의 SARS-CoV-2 스파이크 단백질 항원의 단일 용량으로 면역화된 실험용 마우스로부터 추출된 혈청의 중화 특성을 예시하는 도트 플롯을 보여준다. 혈청은 초기 면역화 3주 후에 수집되었다. SARS-CoV-2 스파이크 단백질 항원은 각 패널의 상단에 표시된 대로 500 μg Alhydrogel® 및 20 μg CpG, 또는 10 μg Quil-A® 및 10 μg MPLA로 애주번트 처리되었다. 중화 특성은 본 개시의 특정 양태에 따른 루시페라제-기반 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 검정을 사용하여 평가되었다. Y-축은 정량 검정 한계(1:100 혈청 희석)로 설정되며, 중화 활성이 이보다 낮은 혈청 샘플은 LOQ로 설정된다. 각 포인트는 단일 동물의 log10 IC50 값을 나타낸다. 각 가로 막대는 10마리 또는 20마리 동물의 각 그룹에 대한 평균 값을 나타내고(도시된 바와 같음), 오차 막대는 표준 편차를 나타낸다.
도 15b는 본 개시의 특정 양태에 따른 1 μg 또는 10 μg(X-축에 표시됨)의 SARS-CoV-2 스파이크 단백질 항원의 1회("21일") 또는 2회("28일") 용량으로 면역화된 실험용 마우스로부터 추출된 혈청의 중화 특성을 예시하는 도트 플롯을 보여준다. SARS-CoV-2 스파이크 단백질 항원은 500 μg의 Alhydrogel® 및 20 μg의 CpG, AddaVax™, 또는 10 μg의 Quil-A® 및 10 μg의 MPLA로 애주번트 처리되었다(X-축에 표시된 바와 같음). 중화 특성은 본 개시의 특정 양태에 따른 루시페라제-기반 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 검정을 사용하여 평가되었다. Y-축은 정량 검정 한계(1:100 혈청 희석)로 설정되며, 중화 활성이 이보다 낮은 혈청 샘플은 LOQ로 설정된다. 각 포인트는 단일 동물의 log10 IC50 값을 나타낸다. 각 가로 막대는 10마리 동물의 각 그룹에 대한 평균 값을 나타내고, 오차 막대는 표준 편차를 나타낸다.
도 16은 본 개시의 특정 양태에 따른 2회 용량의 2개의 SARS-CoV-2 스파이크 단백질 항원(표시된 바와 같음)으로 면역화된 실험용 마우스로부터 추출된 혈청의 중화 특성을 예시하는 도트 플롯을 보여준다. 실험용 마우스에 투여된 SARS-CoV-2 스파이크 단백질 항원은 10 μg Quil-A® 및 10 μg MPLA로 애주번트 처리되었다. 혈청은 초기 면역화 21일, 28일 및 56일(X-축에 표시된 바와 같음) 후에 수집되었다. 중화 특성은 본 개시의 특정 양태에 따른 루시페라제-기반 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 검정을 사용하여 평가되었다. Y-축은 정량 검정 한계(1:100 혈청 희석)로 설정되며, 중화 활성이 이보다 낮은 혈청 샘플은 LOQ로 설정된다. 각 포인트는 단일 동물의 log10 IC50 값을 나타낸다. 각 가로 막대는 5마리 동물의 각 그룹에 대한 평균 값을 나타내고, 오차 막대는 표준 편차를 나타낸다.
도 17a는 본 개시의 특정 양태에 따른 SARS-CoV-2 스파이크 단백질 항원의 대표적인 크기-배제 크로마토그래피 추적을 보여준다.
도 17b는 본 개시의 특정 양태에 따른 발현되고 정제된 SARS-CoV-2 스파이크 단백질 항원의 상대적인 양의 비교를 예시하는 막대 그래프를 보여준다.
도 18은 입체형태적 모노클로날 항체 및 ACE2 수용체에 대한 본 개시의 특정 양태에 따른 SARS-CoV-2 스파이크 단백질 항원의 결합을 테스트하는 Octet® 시스템(Sartorius, Gottingen, Germany)에서 생물층 간섭계(BLI)에 의해 생성된 플롯을 보여준다. Fc 단편에 융합된 모노클로날 항체 및 ACE2 수용체를 바이오센서 표면에 고정하고, 센서를 용액에 SARS CoV-2 스파이크 단백질 항원을 함유하는 웰로 이동시킨 다음, 항원을 함유하지 않는 웰로 이동시켰다. 항체 및 ACE2에 대한 SARS CoV-2 스파이크 단백질 항원의 결합 및 해리는 내부 표면 및 센서와 용액 사이의 외부 계면으로부터 분광광도계로 다시 반사되는 광파 사이의 광학적 간섭 변화를 초래한다. 간섭의 변화를 Y-축에 플롯팅하고 결합 및 해리를 나타내는데 사용하였다. 따라서 nm 이동(Y-축에 플롯팅됨)의 변화의 크기는 결합에 대한 대용으로 사용되며, 여기서 유사한 결합 파트너의 경우, 더 큰 변화는 더 많은 결합을 반영한다.
도 19는 본 개시의 특정 양태에 따른 2회 용량의 2개의 SARS-CoV-2 스파이크 단백질 항원(표시된 바와 같음)으로 면역화된 실험용 마우스로부터 추출된 혈청의 중화 특성을 예시하는 도트 플롯을 보여준다. 실험용 마우스에 투여된 SARS-CoV-2 스파이크 단백질 항원은 500 μg 명반(Alhydrogel®, InvivoGen, San Diego, California) 및 20 μg CpG(InvivoGen)로 애주번트 처리되었다. 혈청은 초기 면역화 21일 및 42일(X-축에 표시된 바와 같음) 후에 수집되었다. 중화 특성은 본 개시의 특정 양태에 따른 루시페라제-기반 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 검정을 사용하여 평가되었다. IC50 값은 표시된 시점에 상이한 그룹에 대한 중화 역가로 표시된다. 각 포인트는 단일 동물의 log10 IC50 값을 나타낸다. 그룹 간 차이의 유의성은 스튜던트-t 테스트로 계산되었으며 플롯에 표시된 대로 유의하지 않은(NS) 것으로 확인되었다. 각 가로 막대는 10마리 동물의 각 그룹에 대한 평균 값을 나타내고, 오차 막대는 표준 편차를 나타낸다.
도 20은 본 개시의 특정 양태에 따른 동결건조된("Lyo1", "Lyo2" 및 "Lyo3") 및 냉동된("냉동") 스파이크HexaProΔC 단백질 항원 샘플의 UV 스펙트럼을 보여준다.
도 21은, 좌측 패널에서, 본 개시의 특정 양태에 따른 동결건조된("Lyo") 및 냉동된("냉동") 스파이크HexaProΔC 단백질 항원 샘플의 스캐닝 형광측정 분석 결과를 예시하는 선 플롯을 보여준다.
도 22는 입체형태적 모노클로날 항체 및 ACE2 수용체에 대한 본 개시의 특정 양태에 따른 동결건조된("Lyo1", "Lyo2" 및 "Lyo3") 및 냉동된("냉동") 샘플에서 SARS-CoV-2 스파이크 단백질 항원의 결합을 테스트하기 위해 Octet® 시스템에서 BLI에 의해 생성된 플롯을 보여준다. Fc 단편에 융합된 모노클로날 항체 및 ACE2 수용체를 바이오센서 표면에 고정하고, 센서를 용액에 냉동되고 해동된("냉동") 또는 동결건조되고 재구성된("Lyo 1"-"Lyo 3") SARS CoV-2 스파이크 단백질 항원을 함유하는 웰로 이동시킨 다음, 항원을 함유하지 않는 웰로 이동시켰다. 항체 및 ACE2에 대한 SARS CoV-2 스파이크 단백질 항원의 결합 및 해리는 내부 표면 및 센서와 용액 사이의 외부 계면으로부터 분광광도계로 다시 반사되는 광파 사이의 광학적 간섭 변화를 초래한다. 간섭의 변화를 Y-축에 플롯팅하고 결합 및 해리를 나타내는데 사용하였다.
도 23은 본 개시의 특정 양태에 따른 동결건조된 및 냉동된 샘플(X-축에 표시된 바와 같이, 각각 3개의 마우스 그룹)로부터 SARS-CoV-2 스파이크 단백질 항원으로 면역화된 실험용 마우스의 그룹으로부터 추출된 혈청의 SARS-CoV-2 RBD 단백질(본 개시의 다른 곳에 기술된 바와 같이 ELISA에 의해 측정되고 Y-축에 EC50 값으로 표시됨)의 결합을 예시하는 도트 플롯을 보여준다. 각 포인트는 단일 동물의 log10 EC50 값을 나타낸다. 역가의 통계적 차이를 스튜던트 t-테스트로 분석하였으며 플롯에 표시된 대로 유의하지 않은(NS) 것으로 확인되었다.
도 24는 본 개시의 특정 양태에 따른 동결건조된 및 냉동된 샘플(X-축에 표시된 바와 같이, 각각 3개의 마우스 그룹)로부터 SARS-CoV-2 스파이크 단백질 항원으로 면역화된 실험용 마우스로부터 추출된 혈청의 중화 특성을 예시하는 도트 플롯을 보여준다. 중화 특성은 본 개시의 특정 양태에 따른 루시페라제-기반 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 검정을 사용하여 평가되었다. IC50 값은 표시된 시점에 상이한 그룹에 대한 중화 역가로 표시된다. 각 포인트는 단일 동물의 log10 IC50 값을 나타낸다.
도 25는 입체형태적 모노클로날 항체 CB6 및 ACE2 수용체에 대한 동결건조된 SARS-CoV-2 스파이크 단백질 항원 샘플의 결합을 테스트하는 Octet® 시스템에서 BLI에 의해 생성된 플롯을 보여준다. SARS-CoV-2 스파이크 단백질 항원 샘플은 1%, 5% 또는 10% 수크로스(라벨링된 바와 같음)와 함께 10 mM 암모늄 바이카르보네이트 pH 7.8에서 동결건조되었고, SARS-CoV-2 스파이크 단백질 항원 샘플은 10% 수크로스와 함께 10 mM 암모늄 바이카르보네이트 pH 7.8("AB 냉동") 또는 10% 수크로스와 함께 PBS("PBS")에서 냉동되었다. Fc 단편에 융합된 모노클로날 항체 및 ACE2 수용체를 바이오센서 표면에 고정하고, 센서를 용액에 단백질 항원을 함유하는 웰로 이동시킨 다음, 항원을 함유하지 않는 웰로 이동시켰다. 항체 및 ACE2에 대한 SARS CoV-2 스파이크 단백질 항원의 결합 및 해리는 내부 표면 및 센서와 용액 사이의 외부 계면으로부터 분광광도계로 다시 반사되는 광파 사이의 광학적 간섭 변화를 초래한다. 간섭의 변화를 Y-축에 플롯팅하고 결합 및 해리를 나타내는데 사용하였다. 따라서 nm 이동(Y-축에 플롯팅됨)의 변화의 크기는 결합에 대한 대용으로 사용되며, 여기서 유사한 결합 파트너의 경우, 더 큰 변화는 더 많은 결합을 반영한다.
도 26은 휘발성 암모늄 바이카르보네이트 완충액에서 동결건조된 SARS-CoV-2 스파이크 단백질 항원의 특성을 테스트하는 크기 배제 크로마토그래피 - 다중각 광 산란(SEC-MALS) 테스트의 결과를 예시하는 플롯을 보여준다. 단백질은 재구성 직후("1일") 및 실온에서 4일 동안 보관된 후("4일") 테스트되었다.
도 27은 본 개시의 특정 양태에 따른 SARS-CoV-2 스파이크 융합 단백질 나노입자에서 조작된 글리코실화 부위의 위치의 개략도이다. 페리틴 도메인은 흰색으로 표시된다. 조작된 글리코실화 부위에서 아스파라긴 잔기로 돌연변이된 리신 잔기는 검은색 구체로 표시된다. 조작된 글리코실화 부위에서 트레오닌 잔기로 돌연변이된 글루탐산 잔기는 회색 구체로 표시된다. 검은색 삼각형은 3중 대칭축을 묘사한다.
도 28은 입체형태적 모노클로날 항체 및 ACE2 수용체에 대한 본 개시의 특정 양태에 따른 SARS-CoV-2 스파이크 단백질 항원의 결합을 테스트하는 Octet® 시스템에서 BLI에 의해 생성된 플롯을 보여준다. Fc 단편에 융합된 모노클로날 항체 및 ACE2 수용체를 바이오센서 표면에 고정하고, 센서를 용액에 SARS CoV-2 스파이크 단백질 항원을 함유하는 웰로 이동시킨 다음, 항원을 함유하지 않는 웰로 이동시켰다. 항체 및 ACE2에 대한 SARS CoV-2 스파이크 단백질 항원의 결합 및 해리는 내부 표면 및 센서와 용액 사이의 외부 계면으로부터 분광광도계로 다시 반사되는 광파 사이의 광학적 간섭 변화를 초래한다. 간섭의 변화를 Y-축에 플롯팅하고 결합 및 해리를 나타내는데 사용하였다. 따라서 nm 이동(Y-축에 플롯팅됨)의 변화의 크기는 결합에 대한 대용으로 사용되며, 여기서 유사한 결합 파트너의 경우, 더 큰 변화는 더 많은 결합을 반영한다. 플롯 라벨은 다음과 같다: "원래" - 스파이크HexaProΔC 페리틴; "D614G" - 스파이크HexaProΔC 페리틴 D614G; "B.1.1.7" - 스파이크HexaProΔC 페리틴 B.1.1.7; "B.1.351" - 스파이크HexaProΔC 페리틴 B.1.351; "LA" - 스파이크HexaProΔC 페리틴 B.1.429; "P1" - 스파이크HexaProΔC 페리틴 P1.
도 29는 본 개시의 특정 양태에 따른 6개의 슈도바이러스 패널에 대한 SARS-CoV-2 스파이크 단백질 항원의 중화 활성(SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 중화 검정을 사용하여 결정됨)의 "히트 맵"을 보여준다. SARS-CoV-2 스파이크 단백질 항원은 각 "히트 맵"의 x-축에 나열되어 있으며 다음과 같이 라벨링된다: "원래" - 스파이크HexaProΔC 페리틴; "D614G" - 스파이크HexaProΔC 페리틴 D614G; "B.1.1.7" - 스파이크HexaProΔC 페리틴 B.1.1.7; "B.1.351" - 스파이크HexaProΔC 페리틴 B.1.351; "LA" - 스파이크HexaProΔC 페리틴 B.1.429; "P1" - 스파이크HexaProΔC 페리틴 P1. 테스트한 슈도바이러스는 각 히트 맵의 y-축에 플롯팅되어 있으며 SARS-CoV-2 균주 Wuhan-1("WT"로 표시됨), D614G, B.1.429, B1.1.7, P1 및 B.1.351을 기반으로 한다. 히트 맵의 각 값은 특정 슈도타입형 바이러스에 대해 동일한 SARS-CoV-2 스파이크 단백질 항원으로 면역화된 마우스로부터 풀링된 혈청의 log10IC50 값이다.
도 30a는 본 개시의 특정 양태에 따른 스파이크HexaProΔC 페리틴(SEQ ID NO:16) 및 명반으로 면역화된 5마리 마우스의 그룹에서 중화 반응의 테스트를 예시하는 막대 그래프이다. IC50 값은 표시된 시점에 상이한 그룹에 대한 중화 역가로 표시된다. 각 도트는 개별 마우스의 혈청 샘플을 나타낸다. 평균 IC50 값은 표시된 시점에 대한 막대 아래에 표시된다.
도 30b는 본 개시의 특정 양태에 따른 스파이크HexaProΔC 페리틴(SEQ ID NO:16) 및 명반으로 면역화되고, 초기 면역화 21일 후에 부스팅된 5마리 마우스의 그룹에서 중화 반응의 테스트를 예시하는 막대 그래프이다. IC50 값은 표시된 시점에 상이한 그룹에 대한 중화 역가로 표시된다. 각 도트는 개별 마우스의 혈청 샘플을 나타낸다. 평균 IC50 값은 표시된 시점에 대한 막대 아래에 표시된다.
도 31a는 본 개시의 특정 양태에 따른 명반으로 애주번트 처리된 스파이크HexaProΔC 페리틴(SEQ ID NO:16)으로 면역화된 10마리 마우스의 그룹에서 야생형 SARS-CoV-2 및 SARS-CoV-2 변이체(막대 위에 표시된 바와 같음)에 대한 중화 반응의 테스트를 예시하는 막대 그래프이다. IC50 값은 상이한 그룹에 대한 중화 역가로 표시된다. 각 도트는 개별 마우스의 혈청 샘플을 나타낸다. 평균 IC50 값은 표시된 시점에 대한 막대 아래에 표시된다.
도 31b는 본 개시의 특정 양태에 따른 명반으로 애주번트 처리된 스파이크HexaProΔC 페리틴(SEQ ID NO:16)으로 면역화되고, 초기 면역화 21일 후에 부스팅된 10마리 마우스의 그룹에서 야생형 SARS-CoV-2 및 SARS-CoV-2 변이체(막대 위에 표시된 바와 같음)에 대한 중화 반응의 테스트를 예시하는 막대 그래프이다. IC50 값은 상이한 그룹에 대한 중화 역가로 표시된다. 각 도트는 개별 마우스의 혈청 샘플을 나타낸다. 평균 IC50 값은 표시된 시점에 대한 막대 아래에 표시된다.
도 32a는 본 개시의 특정 양태에 따른 명반 및 CpG로 애주번트 처리된 스파이크HexaProΔC 페리틴(SEQ ID NO:16)으로 면역화된 10마리 마우스의 그룹에서 야생형 SARS-CoV-2 및 SARS-CoV-2 변이체(막대 위에 표시된 바와 같음)에 대한 중화 반응의 테스트를 예시하는 막대 그래프이다. IC50 값은 상이한 그룹에 대한 중화 역가로 표시된다. 각 도트는 개별 마우스의 혈청 샘플을 나타낸다. 평균 IC50 값은 막대 아래에 표시된다.
도 32b는 본 개시의 특정 양태에 따른 명반 및 CpG로 애주번트 처리된 스파이크HexaProΔC 페리틴(SEQ ID NO:16)으로 면역화되고, 초기 면역화 21일 후에 부스팅된 10마리 마우스의 그룹에서 야생형 SARS-CoV-2 및 SARS-CoV-2 변이체(막대 위에 표시된 바와 같음)에 대한 중화 반응의 테스트를 예시하는 막대 그래프이다. IC50 값은 상이한 그룹에 대한 중화 역가로 표시된다. 각 도트는 개별 마우스의 혈청 샘플을 나타낸다. 평균 IC50 값은 막대 아래에 표시된다.
도 33은 본 개시의 특정 양태에 따른, x-축에 표시된, 상이한 용량의 명반으로 애주번트 처리된 스파이크HexaProΔC 페리틴(SEQ ID NO:16)으로 면역화된 5마리 마우스의 그룹에서 야생형 SARS-CoV-2 및 SARS-CoV-2 변이체(막대 위에 표시된 바와 같음)에 대한 중화 반응의 테스트를 예시하는 막대 그래프이다. 플롯 위에 표시된 대로, 각 명반 용량에 대해 한 그룹은 단일 면역화를 받았고, 두 번째 그룹은 1차 면역화 21일 후에 부스팅되었다. IC50 값은 상이한 그룹에 대한 중화 역가로 표시된다. 각 도트는 개별 마우스의 혈청 샘플을 나타낸다. 평균 IC50 값은 표시된 시점에 상이한 그룹에 대한 중화 역가로 표시된다.
도 34a는 본 개시의 특정 양태에 따른 상이한 양의 명반(x-축에 표시됨)을 단독으로 또는 20 μg의 CpG(x-축 아래에 표시된 바와 같음)와 함께 애주번트 처리한 스파이크HexaProΔC 페리틴(SEQ ID NO:16)으로 면역화된 5마리 마우스의 그룹에서 야생형 SARS-CoV-2에 대한 중화 반응의 테스트를 예시하는 막대 그래프이다. 각 명반 용량에 대해 한 그룹은 단일 면역화를 받았고, 두 번째 그룹은 1차 면역화 21일 후에 부스팅되었다(x-축 아래에 표시된 바와 같음). IC50 값은 상이한 그룹에 대한 중화 역가로 표시된다. 각 도트는 개별 마우스의 혈청 샘플을 나타낸다. 평균 IC50 값은 표시된 그룹 및 시점 각각에 대해 풀링된 샘플의 상이한 그룹에 대한 중화 역가로 표시된다.
도 34b는 본 개시의 특정 양태에 따른 상이한 양의 명반(x-축에 표시됨)을 단독으로 또는 20 μg의 CpG(x-축 아래에 표시된 바와 같음)와 함께 애주번트 처리한 스파이크HexaProΔC 페리틴(SEQ ID NO:16)으로 면역화된 5마리 마우스의 그룹에서 SARS-CoV-2의 B.1.421 변이체에 대한 중화 반응의 테스트를 예시하는 막대 그래프이다. 각 명반 용량에 대해 한 그룹은 단일 면역화를 받았고, 두 번째 그룹은 1차 면역화 21일 후에 부스팅되었다(x-축 아래에 표시된 바와 같음). IC50 값은 상이한 그룹에 대한 중화 역가로 표시된다. 각 도트는 개별 마우스의 혈청 샘플을 나타낸다. 평균 IC50 값은 표시된 그룹 및 시점 각각에 대해 풀링된 샘플의 상이한 그룹에 대한 중화 역가로 표시된다.
도 34c는 본 개시의 특정 양태에 따른 상이한 양의 명반(x-축에 표시됨)을 단독으로 또는 20 μg의 CpG(x-축 아래에 표시된 바와 같음)와 함께 애주번트 처리한 스파이크HexaProΔC 페리틴(SEQ ID NO:16)으로 면역화된 5마리 마우스의 그룹에서 SARS-CoV-2의 B.1.1.7. 변이체에 대한 중화 반응의 테스트를 예시하는 막대 그래프이다. 각 명반 용량에 대해 한 그룹은 단일 면역화를 받았고, 두 번째 그룹은 1차 면역화 21일 후에 부스팅되었다(x-축 아래에 표시된 바와 같음). IC50 값은 상이한 그룹에 대한 중화 역가로 표시된다. 각 도트는 개별 마우스의 혈청 샘플을 나타낸다. 평균 IC50 값은 표시된 그룹 및 시점 각각에 대해 풀링된 샘플의 상이한 그룹에 대한 중화 역가로 표시된다.
도 34d는 본 개시의 특정 양태에 따른 상이한 양의 명반(x-축에 표시됨)을 단독으로 또는 20 μg의 CpG(x-축 아래에 표시된 바와 같음)와 함께 애주번트 처리한 스파이크HexaProΔC 페리틴(SEQ ID NO:16)으로 면역화된 5마리 마우스의 그룹에서 SARS-CoV-2의 B.1.351 변이체에 대한 중화 반응의 테스트를 예시하는 막대 그래프이다. 각 명반 용량에 대해 한 그룹은 단일 면역화를 받았고, 두 번째 그룹은 1차 면역화 21일 후에 부스팅되었다(x-축 아래에 표시된 바와 같음). IC50 값은 상이한 그룹에 대한 중화 역가로 표시된다. 각 도트는 개별 마우스의 혈청 샘플을 나타낸다. 평균 IC50 값은 표시된 그룹 및 시점 각각에 대해 풀링된 샘플의 상이한 그룹에 대한 중화 역가로 표시된다.
도 34e는 본 개시의 특정 양태에 따른 상이한 양의 명반(x-축에 표시됨)을 단독으로 또는 20 μg의 CpG(x-축 아래에 표시된 바와 같음)와 함께 애주번트 처리한 스파이크HexaProΔC 페리틴(SEQ ID NO:16)으로 면역화된 5마리 마우스의 그룹에서 SARS-CoV-2의 B.1.617.2 변이체에 대한 중화 반응의 테스트를 예시하는 막대 그래프이다. 각 명반 용량에 대해 한 그룹은 단일 면역화를 받았고, 두 번째 그룹은 1차 면역화 21일 후에 부스팅되었다(x-축 아래에 표시된 바와 같음). IC50 값은 상이한 그룹에 대한 중화 역가로 표시된다. 각 도트는 개별 마우스의 혈청 샘플을 나타낸다. 평균 IC50 값은 표시된 그룹 및 시점 각각에 대해 풀링된 샘플의 상이한 그룹에 대한 중화 역가로 표시된다.
도 34f는 본 개시의 특정 양태에 따른 상이한 양의 명반(x-축에 표시됨)을 단독으로 또는 20 μg의 CpG(x-축 아래에 표시된 바와 같음)와 함께 애주번트 처리한 스파이크HexaProΔC 페리틴(SEQ ID NO:16)으로 면역화된 5마리 마우스의 그룹에서 SARS-CoV-2의 P.1 변이체에 대한 중화 반응의 테스트를 예시하는 막대 그래프이다. 각 명반 용량에 대해 한 그룹은 단일 면역화를 받았고, 두 번째 그룹은 1차 면역화 21일 후에 부스팅되었다(x-축 아래에 표시된 바와 같음). IC50 값은 상이한 그룹에 대한 중화 역가로 표시된다. 각 도트는 개별 마우스의 혈청 샘플을 나타낸다. 평균 IC50 값은 표시된 그룹 및 시점 각각에 대해 풀링된 샘플의 상이한 그룹에 대한 중화 역가로 표시된다.
도 1a는 본 개시의 특정 양태에 따른 SARS-CoV-2 스파이크 단백질 항원 폴리펩티드 작제물의 개략도이다.
도 1b는 본 개시의 특정 양태에 따른 SARS-CoV-2 스파이크 단백질 항원 폴리펩티드의 3차원 구조의 개략도이며, 이는 극저온 전자현미경(cryo-EM)에 의해 결정된 스파이크 삼량체의 구조 및 X-선 결정학에 의해 결정된 헬리코박터 파일로리 페리틴 나노입자의 구조에 기초한다.
도 2a는 본 개시의 특정 양태에 따른 SARS-CoV-2 스파이크 단백질 항원의 발현 및 특성화 결과를 예시하는 웨스턴 블롯의 사진 이미지를 보여준다.
도 2b는 본 개시의 특정 양태에 따른 SARS-CoV-2 스파이크 단백질 항원의 발현 및 특성화 결과를 예시하는 SDS-PAGE 겔의 사진 이미지를 보여준다.
도 3은 본 개시의 특정 양태에 따른 SARS-CoV-2 스파이크 단백질 항원의 다중각 광 산란(SEC-MALS)과 결합된 분석 규모 크기-배제 크로마토그래피의 결과를 예시하는 선 플롯을 보여준다.
도 4는 본 개시의 특정 양태에 따른 효소-결합 면역흡착 검정(ELISA)에 의한 인간 ACE2, 정제된 SARS-CoV-2 반응성 모노클로날 항체 CR3022, CB6 및 COVA-2-15, 및 에볼라 바이러스 반응성 모노클로날 항체 ADI-15731(음성 대조군으로서)에 대한 SARS-CoV-2 스파이크 단백질 항원의 결합 분석 결과를 예시하는 선 플롯을 보여준다.
도 5a는 본 개시의 특정 양태에 따른 SARS-CoV-2 스파이크ΔC-페리틴 융합 단백질 나노입자의 대표적인 동작-보정 cryo-EM 현미경 사진 및 무참조 2D 클래스 평균을 보여준다.
도 5b, 상부 패널은 본 개시의 특정 양태에 따른 두 가지 상이한 관점에서 SARS-CoV-2 스파이크ΔC-페리틴 융합 단백질 나노입자의 재구성된 cryo-EM 맵을 보여준다. 하부 패널은 본 개시의 특정 양태에 따른 상부 패널보다 낮은 등고선 수준에 표시된 cryo-EM 맵에 도킹된 SARS-CoV-2 스파이크ΔC-페리틴 융합 단백질의 원자 모델에 대한 두 가지 상이한 관점을 보여준다.
도 6은 본 개시의 특정 양태에 따른 SARS-CoV-2 스파이크 단백질 항원으로 면역화된 마우스로부터 초기 면역화 21일 후에 추출된 혈청의 ELISA 결합 분석 결과를 예시하는 도트 플롯을 보여준다. 항원은 X-축에 표시된다. SARS-CoV-2 RBD 단백질(왼쪽 그래프) 및 SARS-CoV-2 스파이크 단백질(오른쪽 그래프)에 대한 혈청의 결합을 분석하였다. 그래프에 표시된 각 포인트는 단일 동물로부터 2번의 기술적 중복 ELISA 곡선의 평균 log10 EC50 값을 나타낸다. 그래프의 각 막대는 10마리 동물의 평균 log10 EC50 값을 나타내고, 오차 막대는 표준 편차를 나타낸다. Kruskal-Wallis ANOVA에 이어 Dunn의 다중 비교를 사용하여 통계적 비교를 수행하였다. 모든 p 값은 다음과 같이 표시된다: * = p ≤ 0.05, ** = p ≤ 0.01, *** = p ≤ 0.001, **** = p ≤ 0.0001.
도 7은 본 개시의 특정 양태에 따른 루시페라제-기반 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 검정을 사용하여 평가된 SARS-CoV-2 스파이크 단백질 항원으로 면역화된 마우스로부터 초기 면역화 21일 후에 추출된 혈청의 중화 특성을 예시하는 도트 플롯을 보여준다. 항원은 X-축에 표시된다. Y-축은 정량 검정 한계(1:100 혈청 희석)로 설정되며, 중화 활성이 이보다 낮은 혈청 샘플은 LOQ로 설정된다. 각 포인트는 4번의 중복에서 유래된 단일 동물로부터의 log10 IC50 값을 나타낸다. 4번의 중복을 만들어 내기 위해, 각 실험은 서로 다른 날에 2번 수행되었고, 각 날에 이중 실험이 수행되었다. 이를 통해 4개의 정규화된 희석 곡선이 생성되었고, 그 후 컴파일링되어 각 동물에 대한 각 IC50 값을 얻었다. 그래프 막대의 각 포인트는 10마리 동물의 각 그룹에 대한 평균 값을 나타내고, 오차 막대는 표준 편차를 나타낸다. Kruskal-Wallis ANOVA에 이어 Dunn의 다중 비교를 사용하여 통계적 비교를 수행하였다. 모든 p 값은 다음과 같이 표시된다: * = p ≤ 0.05, ** = p ≤ 0.01, *** = p ≤ 0.001, **** = p ≤ 0.0001
도 8은 본 개시의 특정 양태에 따른 SARS-CoV-2 스파이크 단백질 항원으로 면역화된 마우스로부터 초기 면역화 28일 후에 추출된 혈청의 ELISA 결합 분석 결과를 예시하는 도트 플롯을 보여준다. 항원은 X-축에 표시된다. SARS-CoV-2 RBD 단백질(왼쪽 그래프) 및 SARS-CoV-2 스파이크 단백질(오른쪽 그래프)에 대한 혈청의 결합을 분석하였다. 그래프의 각 포인트는 단일 동물로부터 2번의 기술적 중복 ELISA 곡선의 평균 log10 EC50 값을 나타낸다. 막대는 10마리 동물의 평균을 나타내고, 오차 막대는 표준 편차를 나타낸다. Kruskal-Wallis ANOVA에 이어 Dunn의 다중 비교를 사용하여 통계적 비교를 수행하였다. 모든 p 값은 다음과 같이 표시된다: * = p ≤ 0.05, ** = p ≤ 0.01, *** = p ≤ 0.001, **** = p ≤ 0.0001
도 9는 본 개시의 특정 양태에 따른 SARS-oV-2 스파이크 단백질 항원으로 면역화된 마우스로부터 초기 면역화 28일 후에 추출된 혈청의 중화 특성을 예시하는 도트 플롯을 보여준다. 항원은 X-축에 표시된다. 중화 특성은 루시페라제-기반 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 검정을 사용하여 평가되었다.. Y-축은 정량 검정 한계(1:100 혈청 희석)로 설정되며, 중화 활성이 이보다 낮은 혈청 샘플은 LOQ로 설정된다. 그래프에 도시된 각 포인트는 4번의 중복에서 유래된 단일 동물로부터의 log10 IC50 값을 나타낸다. 4번의 중복을 만들어 내기 위해, 각 실험은 서로 다른 날에 2번 수행되었고, 각 날에 이중 실험이 수행되었다. 이를 통해 4개의 정규화된 희석 곡선이 생성되었고, 그 후 컴파일링되어 각 동물에 대한 각 IC50 값을 얻었다. 막대는 10마리 동물의 각 그룹에 대한 평균 log10 IC50을 나타내고, 오차 막대는 표준 편차를 나타낸다. Kruskal-Wallis ANOVA에 이어 Dunn의 다중 비교를 사용하여 통계적 비교를 수행하였다. 모든 p 값은 다음과 같이 표시된다: * = p ≤ 0.05, ** = p ≤ 0.01, *** = p ≤ 0.001, **** = p ≤ 0.0001
도 10은 본 개시의 특정 양태에 따른 2회 용량의 SARS-CoV-2 스파이크 단백질 항원으로 면역화된 실험용 마우스로부터 추출된 혈청의 IgG1, IgG2a 및 IgG2b 서브클래스 반응(X-축에 표시된 바와 같음)의 ELISA 결합 분석 결과를 예시하는 도트 플롯을 보여준다. 항원은 각 패널의 상단에 표시된다. 그래프의 각 포인트는 단일 동물의 log10 EC50 값을 나타내고; 각 가로 막대는 10마리 동물 그룹에 대한 평균 log10 EC50 역가를 나타내고; 오차 막대는 표준 편차를 나타낸다.
도 11a는 본 개시의 특정 양태에 따른 2회 용량의 SARS-CoV-2 스파이크 단백질 항원으로 면역화된 실험용 마우스로부터 추출된 혈청의 ELISA 결합 분석에 의해 결정된 IgG2a/IgG1 EC50의 비율을 예시하는 도트 플롯을 보여준다. 항원은 X-축에 표시된다. 그래프의 각 포인트는 단일 동물의 비율 값을 나타내고; 각 가로 막대는 10마리 동물 그룹에 대한 평균 비율을 나타내고; 오차 막대는 표준 편차를 나타낸다.
도 11b는 본 개시의 특정 양태에 따른 2회 용량의 SARS-CoV-2 스파이크 단백질 항원으로 면역화된 실험용 마우스로부터 추출된 혈청의 ELISA 결합 분석에 의해 결정된 IgG2b/IgG1 EC50의 비율을 예시하는 도트 플롯을 보여준다. 항원은 X-축에 표시된다. 그래프의 각 포인트는 단일 동물의 비율 값을 나타내고; 각 가로 막대는 10마리 동물 그룹에 대한 평균 비율을 나타내고; 오차 막대는 표준 편차를 나타낸다.
도 12는 본 개시의 특정 양태에 따른 2회 용량의 SARS-CoV-2 스파이크 단백질 항원으로 면역화된 실험용 마우스로부터 추출된 혈청에서 IgM 수준을 평가하는 ELISA에 의한 결합 분석 결과를 예시하는 선 플롯을 보여준다. 항원은 각 패널의 상단에 표시된다. 각 포인트는 용량-반응 연관 곡선에 핏팅된 각 동물(n = 그룹 당 10마리 마우스)로부터 실험 중복을 나타내고; 오차 막대는 각 포인트에 대한 표준 편차를 나타낸다.
도 13a는 본 개시의 특정 양태에 따른 상이한 용량(X-축에 표시됨)의 SARS-CoV-2 스파이크 단백질 항원 투여 28일 후에 실험용 마우스로부터 추출된 혈청의 중화 특성을 예시하는 도트 플롯을 보여준다. 중화 특성은 본 개시의 특정 양태에 따른 루시페라제-기반 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 검정을 사용하여 평가되었다. Y-축은 정량 검정 한계(1:100 혈청 희석)로 설정되며, 중화 활성이 이보다 낮은 혈청 샘플은 LOQ로 설정된다. 각 포인트는 단일 동물의 log10 IC50 값을 나타낸다. 각 가로 막대는 10마리 동물의 각 그룹에 대한 평균 값을 나타내고, 오차 막대는 표준 편차를 나타낸다.
도 13b는 본 개시의 특정 양태에 따른 SARS-CoV-2 스파이크 단백질 항원을 투여한 후 다양한 시점(X-축에 표시됨)에 실험용 마우스로부터 추출된 혈청의 중화 특성을 예시하는 도트 플롯을 보여준다. 중화 특성은 본 개시의 특정 양태에 따른 루시페라제-기반 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 검정을 사용하여 평가되었다. Y-축은 정량 검정 한계(1:100 혈청 희석)로 설정되며, 중화 활성이 이보다 낮은 혈청 샘플은 LOQ로 설정된다. 각 포인트는 단일 동물의 log10 IC50 값을 나타낸다. 각 가로 막대는 5마리 동물의 각 그룹에 대한 평균 값을 나타내고, 오차 막대는 표준 편차를 나타낸다.
도 14는 본 개시의 특정 양태에 따른 SARS-CoV-2 스파이크 단백질 항원(각 패널의 상단에 표시됨)으로 초기 면역화 다양한 시점(X-축에 표시됨)에 실험용 마우스로부터 추출된 혈청의 중화 특성을 예시하는 도트 플롯을 보여준다. 중화 특성은 본 개시의 특정 양태에 따른 루시페라제-기반 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 검정을 사용하여 평가되었다. Y-축은 정량 검정 한계(1:100 혈청 희석)로 설정되며, 중화 활성이 이보다 낮은 혈청 샘플은 LOQ로 설정된다. 각 포인트는 단일 동물의 log10 IC50 값을 나타낸다. 각 가로 막대는 5마리 동물의 각 그룹에 대한 평균 값을 나타내고, 오차 막대는 표준 편차를 나타낸다.
도 15a는 본 개시의 특정 양태에 따른 1 μg 또는 10 μg(X-축에 표시됨)의 SARS-CoV-2 스파이크 단백질 항원의 단일 용량으로 면역화된 실험용 마우스로부터 추출된 혈청의 중화 특성을 예시하는 도트 플롯을 보여준다. 혈청은 초기 면역화 3주 후에 수집되었다. SARS-CoV-2 스파이크 단백질 항원은 각 패널의 상단에 표시된 대로 500 μg Alhydrogel® 및 20 μg CpG, 또는 10 μg Quil-A® 및 10 μg MPLA로 애주번트 처리되었다. 중화 특성은 본 개시의 특정 양태에 따른 루시페라제-기반 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 검정을 사용하여 평가되었다. Y-축은 정량 검정 한계(1:100 혈청 희석)로 설정되며, 중화 활성이 이보다 낮은 혈청 샘플은 LOQ로 설정된다. 각 포인트는 단일 동물의 log10 IC50 값을 나타낸다. 각 가로 막대는 10마리 또는 20마리 동물의 각 그룹에 대한 평균 값을 나타내고(도시된 바와 같음), 오차 막대는 표준 편차를 나타낸다.
도 15b는 본 개시의 특정 양태에 따른 1 μg 또는 10 μg(X-축에 표시됨)의 SARS-CoV-2 스파이크 단백질 항원의 1회("21일") 또는 2회("28일") 용량으로 면역화된 실험용 마우스로부터 추출된 혈청의 중화 특성을 예시하는 도트 플롯을 보여준다. SARS-CoV-2 스파이크 단백질 항원은 500 μg의 Alhydrogel® 및 20 μg의 CpG, AddaVax™, 또는 10 μg의 Quil-A® 및 10 μg의 MPLA로 애주번트 처리되었다(X-축에 표시된 바와 같음). 중화 특성은 본 개시의 특정 양태에 따른 루시페라제-기반 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 검정을 사용하여 평가되었다. Y-축은 정량 검정 한계(1:100 혈청 희석)로 설정되며, 중화 활성이 이보다 낮은 혈청 샘플은 LOQ로 설정된다. 각 포인트는 단일 동물의 log10 IC50 값을 나타낸다. 각 가로 막대는 10마리 동물의 각 그룹에 대한 평균 값을 나타내고, 오차 막대는 표준 편차를 나타낸다.
도 16은 본 개시의 특정 양태에 따른 2회 용량의 2개의 SARS-CoV-2 스파이크 단백질 항원(표시된 바와 같음)으로 면역화된 실험용 마우스로부터 추출된 혈청의 중화 특성을 예시하는 도트 플롯을 보여준다. 실험용 마우스에 투여된 SARS-CoV-2 스파이크 단백질 항원은 10 μg Quil-A® 및 10 μg MPLA로 애주번트 처리되었다. 혈청은 초기 면역화 21일, 28일 및 56일(X-축에 표시된 바와 같음) 후에 수집되었다. 중화 특성은 본 개시의 특정 양태에 따른 루시페라제-기반 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 검정을 사용하여 평가되었다. Y-축은 정량 검정 한계(1:100 혈청 희석)로 설정되며, 중화 활성이 이보다 낮은 혈청 샘플은 LOQ로 설정된다. 각 포인트는 단일 동물의 log10 IC50 값을 나타낸다. 각 가로 막대는 5마리 동물의 각 그룹에 대한 평균 값을 나타내고, 오차 막대는 표준 편차를 나타낸다.
도 17a는 본 개시의 특정 양태에 따른 SARS-CoV-2 스파이크 단백질 항원의 대표적인 크기-배제 크로마토그래피 추적을 보여준다.
도 17b는 본 개시의 특정 양태에 따른 발현되고 정제된 SARS-CoV-2 스파이크 단백질 항원의 상대적인 양의 비교를 예시하는 막대 그래프를 보여준다.
도 18은 입체형태적 모노클로날 항체 및 ACE2 수용체에 대한 본 개시의 특정 양태에 따른 SARS-CoV-2 스파이크 단백질 항원의 결합을 테스트하는 Octet® 시스템(Sartorius, Gottingen, Germany)에서 생물층 간섭계(BLI)에 의해 생성된 플롯을 보여준다. Fc 단편에 융합된 모노클로날 항체 및 ACE2 수용체를 바이오센서 표면에 고정하고, 센서를 용액에 SARS CoV-2 스파이크 단백질 항원을 함유하는 웰로 이동시킨 다음, 항원을 함유하지 않는 웰로 이동시켰다. 항체 및 ACE2에 대한 SARS CoV-2 스파이크 단백질 항원의 결합 및 해리는 내부 표면 및 센서와 용액 사이의 외부 계면으로부터 분광광도계로 다시 반사되는 광파 사이의 광학적 간섭 변화를 초래한다. 간섭의 변화를 Y-축에 플롯팅하고 결합 및 해리를 나타내는데 사용하였다. 따라서 nm 이동(Y-축에 플롯팅됨)의 변화의 크기는 결합에 대한 대용으로 사용되며, 여기서 유사한 결합 파트너의 경우, 더 큰 변화는 더 많은 결합을 반영한다.
도 19는 본 개시의 특정 양태에 따른 2회 용량의 2개의 SARS-CoV-2 스파이크 단백질 항원(표시된 바와 같음)으로 면역화된 실험용 마우스로부터 추출된 혈청의 중화 특성을 예시하는 도트 플롯을 보여준다. 실험용 마우스에 투여된 SARS-CoV-2 스파이크 단백질 항원은 500 μg 명반(Alhydrogel®, InvivoGen, San Diego, California) 및 20 μg CpG(InvivoGen)로 애주번트 처리되었다. 혈청은 초기 면역화 21일 및 42일(X-축에 표시된 바와 같음) 후에 수집되었다. 중화 특성은 본 개시의 특정 양태에 따른 루시페라제-기반 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 검정을 사용하여 평가되었다. IC50 값은 표시된 시점에 상이한 그룹에 대한 중화 역가로 표시된다. 각 포인트는 단일 동물의 log10 IC50 값을 나타낸다. 그룹 간 차이의 유의성은 스튜던트-t 테스트로 계산되었으며 플롯에 표시된 대로 유의하지 않은(NS) 것으로 확인되었다. 각 가로 막대는 10마리 동물의 각 그룹에 대한 평균 값을 나타내고, 오차 막대는 표준 편차를 나타낸다.
도 20은 본 개시의 특정 양태에 따른 동결건조된("Lyo1", "Lyo2" 및 "Lyo3") 및 냉동된("냉동") 스파이크HexaProΔC 단백질 항원 샘플의 UV 스펙트럼을 보여준다.
도 21은, 좌측 패널에서, 본 개시의 특정 양태에 따른 동결건조된("Lyo") 및 냉동된("냉동") 스파이크HexaProΔC 단백질 항원 샘플의 스캐닝 형광측정 분석 결과를 예시하는 선 플롯을 보여준다.
도 22는 입체형태적 모노클로날 항체 및 ACE2 수용체에 대한 본 개시의 특정 양태에 따른 동결건조된("Lyo1", "Lyo2" 및 "Lyo3") 및 냉동된("냉동") 샘플에서 SARS-CoV-2 스파이크 단백질 항원의 결합을 테스트하기 위해 Octet® 시스템에서 BLI에 의해 생성된 플롯을 보여준다. Fc 단편에 융합된 모노클로날 항체 및 ACE2 수용체를 바이오센서 표면에 고정하고, 센서를 용액에 냉동되고 해동된("냉동") 또는 동결건조되고 재구성된("Lyo 1"-"Lyo 3") SARS CoV-2 스파이크 단백질 항원을 함유하는 웰로 이동시킨 다음, 항원을 함유하지 않는 웰로 이동시켰다. 항체 및 ACE2에 대한 SARS CoV-2 스파이크 단백질 항원의 결합 및 해리는 내부 표면 및 센서와 용액 사이의 외부 계면으로부터 분광광도계로 다시 반사되는 광파 사이의 광학적 간섭 변화를 초래한다. 간섭의 변화를 Y-축에 플롯팅하고 결합 및 해리를 나타내는데 사용하였다.
도 23은 본 개시의 특정 양태에 따른 동결건조된 및 냉동된 샘플(X-축에 표시된 바와 같이, 각각 3개의 마우스 그룹)로부터 SARS-CoV-2 스파이크 단백질 항원으로 면역화된 실험용 마우스의 그룹으로부터 추출된 혈청의 SARS-CoV-2 RBD 단백질(본 개시의 다른 곳에 기술된 바와 같이 ELISA에 의해 측정되고 Y-축에 EC50 값으로 표시됨)의 결합을 예시하는 도트 플롯을 보여준다. 각 포인트는 단일 동물의 log10 EC50 값을 나타낸다. 역가의 통계적 차이를 스튜던트 t-테스트로 분석하였으며 플롯에 표시된 대로 유의하지 않은(NS) 것으로 확인되었다.
도 24는 본 개시의 특정 양태에 따른 동결건조된 및 냉동된 샘플(X-축에 표시된 바와 같이, 각각 3개의 마우스 그룹)로부터 SARS-CoV-2 스파이크 단백질 항원으로 면역화된 실험용 마우스로부터 추출된 혈청의 중화 특성을 예시하는 도트 플롯을 보여준다. 중화 특성은 본 개시의 특정 양태에 따른 루시페라제-기반 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 검정을 사용하여 평가되었다. IC50 값은 표시된 시점에 상이한 그룹에 대한 중화 역가로 표시된다. 각 포인트는 단일 동물의 log10 IC50 값을 나타낸다.
도 25는 입체형태적 모노클로날 항체 CB6 및 ACE2 수용체에 대한 동결건조된 SARS-CoV-2 스파이크 단백질 항원 샘플의 결합을 테스트하는 Octet® 시스템에서 BLI에 의해 생성된 플롯을 보여준다. SARS-CoV-2 스파이크 단백질 항원 샘플은 1%, 5% 또는 10% 수크로스(라벨링된 바와 같음)와 함께 10 mM 암모늄 바이카르보네이트 pH 7.8에서 동결건조되었고, SARS-CoV-2 스파이크 단백질 항원 샘플은 10% 수크로스와 함께 10 mM 암모늄 바이카르보네이트 pH 7.8("AB 냉동") 또는 10% 수크로스와 함께 PBS("PBS")에서 냉동되었다. Fc 단편에 융합된 모노클로날 항체 및 ACE2 수용체를 바이오센서 표면에 고정하고, 센서를 용액에 단백질 항원을 함유하는 웰로 이동시킨 다음, 항원을 함유하지 않는 웰로 이동시켰다. 항체 및 ACE2에 대한 SARS CoV-2 스파이크 단백질 항원의 결합 및 해리는 내부 표면 및 센서와 용액 사이의 외부 계면으로부터 분광광도계로 다시 반사되는 광파 사이의 광학적 간섭 변화를 초래한다. 간섭의 변화를 Y-축에 플롯팅하고 결합 및 해리를 나타내는데 사용하였다. 따라서 nm 이동(Y-축에 플롯팅됨)의 변화의 크기는 결합에 대한 대용으로 사용되며, 여기서 유사한 결합 파트너의 경우, 더 큰 변화는 더 많은 결합을 반영한다.
도 26은 휘발성 암모늄 바이카르보네이트 완충액에서 동결건조된 SARS-CoV-2 스파이크 단백질 항원의 특성을 테스트하는 크기 배제 크로마토그래피 - 다중각 광 산란(SEC-MALS) 테스트의 결과를 예시하는 플롯을 보여준다. 단백질은 재구성 직후("1일") 및 실온에서 4일 동안 보관된 후("4일") 테스트되었다.
도 27은 본 개시의 특정 양태에 따른 SARS-CoV-2 스파이크 융합 단백질 나노입자에서 조작된 글리코실화 부위의 위치의 개략도이다. 페리틴 도메인은 흰색으로 표시된다. 조작된 글리코실화 부위에서 아스파라긴 잔기로 돌연변이된 리신 잔기는 검은색 구체로 표시된다. 조작된 글리코실화 부위에서 트레오닌 잔기로 돌연변이된 글루탐산 잔기는 회색 구체로 표시된다. 검은색 삼각형은 3중 대칭축을 묘사한다.
도 28은 입체형태적 모노클로날 항체 및 ACE2 수용체에 대한 본 개시의 특정 양태에 따른 SARS-CoV-2 스파이크 단백질 항원의 결합을 테스트하는 Octet® 시스템에서 BLI에 의해 생성된 플롯을 보여준다. Fc 단편에 융합된 모노클로날 항체 및 ACE2 수용체를 바이오센서 표면에 고정하고, 센서를 용액에 SARS CoV-2 스파이크 단백질 항원을 함유하는 웰로 이동시킨 다음, 항원을 함유하지 않는 웰로 이동시켰다. 항체 및 ACE2에 대한 SARS CoV-2 스파이크 단백질 항원의 결합 및 해리는 내부 표면 및 센서와 용액 사이의 외부 계면으로부터 분광광도계로 다시 반사되는 광파 사이의 광학적 간섭 변화를 초래한다. 간섭의 변화를 Y-축에 플롯팅하고 결합 및 해리를 나타내는데 사용하였다. 따라서 nm 이동(Y-축에 플롯팅됨)의 변화의 크기는 결합에 대한 대용으로 사용되며, 여기서 유사한 결합 파트너의 경우, 더 큰 변화는 더 많은 결합을 반영한다. 플롯 라벨은 다음과 같다: "원래" - 스파이크HexaProΔC 페리틴; "D614G" - 스파이크HexaProΔC 페리틴 D614G; "B.1.1.7" - 스파이크HexaProΔC 페리틴 B.1.1.7; "B.1.351" - 스파이크HexaProΔC 페리틴 B.1.351; "LA" - 스파이크HexaProΔC 페리틴 B.1.429; "P1" - 스파이크HexaProΔC 페리틴 P1.
도 29는 본 개시의 특정 양태에 따른 6개의 슈도바이러스 패널에 대한 SARS-CoV-2 스파이크 단백질 항원의 중화 활성(SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 중화 검정을 사용하여 결정됨)의 "히트 맵"을 보여준다. SARS-CoV-2 스파이크 단백질 항원은 각 "히트 맵"의 x-축에 나열되어 있으며 다음과 같이 라벨링된다: "원래" - 스파이크HexaProΔC 페리틴; "D614G" - 스파이크HexaProΔC 페리틴 D614G; "B.1.1.7" - 스파이크HexaProΔC 페리틴 B.1.1.7; "B.1.351" - 스파이크HexaProΔC 페리틴 B.1.351; "LA" - 스파이크HexaProΔC 페리틴 B.1.429; "P1" - 스파이크HexaProΔC 페리틴 P1. 테스트한 슈도바이러스는 각 히트 맵의 y-축에 플롯팅되어 있으며 SARS-CoV-2 균주 Wuhan-1("WT"로 표시됨), D614G, B.1.429, B1.1.7, P1 및 B.1.351을 기반으로 한다. 히트 맵의 각 값은 특정 슈도타입형 바이러스에 대해 동일한 SARS-CoV-2 스파이크 단백질 항원으로 면역화된 마우스로부터 풀링된 혈청의 log10IC50 값이다.
도 30a는 본 개시의 특정 양태에 따른 스파이크HexaProΔC 페리틴(SEQ ID NO:16) 및 명반으로 면역화된 5마리 마우스의 그룹에서 중화 반응의 테스트를 예시하는 막대 그래프이다. IC50 값은 표시된 시점에 상이한 그룹에 대한 중화 역가로 표시된다. 각 도트는 개별 마우스의 혈청 샘플을 나타낸다. 평균 IC50 값은 표시된 시점에 대한 막대 아래에 표시된다.
도 30b는 본 개시의 특정 양태에 따른 스파이크HexaProΔC 페리틴(SEQ ID NO:16) 및 명반으로 면역화되고, 초기 면역화 21일 후에 부스팅된 5마리 마우스의 그룹에서 중화 반응의 테스트를 예시하는 막대 그래프이다. IC50 값은 표시된 시점에 상이한 그룹에 대한 중화 역가로 표시된다. 각 도트는 개별 마우스의 혈청 샘플을 나타낸다. 평균 IC50 값은 표시된 시점에 대한 막대 아래에 표시된다.
도 31a는 본 개시의 특정 양태에 따른 명반으로 애주번트 처리된 스파이크HexaProΔC 페리틴(SEQ ID NO:16)으로 면역화된 10마리 마우스의 그룹에서 야생형 SARS-CoV-2 및 SARS-CoV-2 변이체(막대 위에 표시된 바와 같음)에 대한 중화 반응의 테스트를 예시하는 막대 그래프이다. IC50 값은 상이한 그룹에 대한 중화 역가로 표시된다. 각 도트는 개별 마우스의 혈청 샘플을 나타낸다. 평균 IC50 값은 표시된 시점에 대한 막대 아래에 표시된다.
도 31b는 본 개시의 특정 양태에 따른 명반으로 애주번트 처리된 스파이크HexaProΔC 페리틴(SEQ ID NO:16)으로 면역화되고, 초기 면역화 21일 후에 부스팅된 10마리 마우스의 그룹에서 야생형 SARS-CoV-2 및 SARS-CoV-2 변이체(막대 위에 표시된 바와 같음)에 대한 중화 반응의 테스트를 예시하는 막대 그래프이다. IC50 값은 상이한 그룹에 대한 중화 역가로 표시된다. 각 도트는 개별 마우스의 혈청 샘플을 나타낸다. 평균 IC50 값은 표시된 시점에 대한 막대 아래에 표시된다.
도 32a는 본 개시의 특정 양태에 따른 명반 및 CpG로 애주번트 처리된 스파이크HexaProΔC 페리틴(SEQ ID NO:16)으로 면역화된 10마리 마우스의 그룹에서 야생형 SARS-CoV-2 및 SARS-CoV-2 변이체(막대 위에 표시된 바와 같음)에 대한 중화 반응의 테스트를 예시하는 막대 그래프이다. IC50 값은 상이한 그룹에 대한 중화 역가로 표시된다. 각 도트는 개별 마우스의 혈청 샘플을 나타낸다. 평균 IC50 값은 막대 아래에 표시된다.
도 32b는 본 개시의 특정 양태에 따른 명반 및 CpG로 애주번트 처리된 스파이크HexaProΔC 페리틴(SEQ ID NO:16)으로 면역화되고, 초기 면역화 21일 후에 부스팅된 10마리 마우스의 그룹에서 야생형 SARS-CoV-2 및 SARS-CoV-2 변이체(막대 위에 표시된 바와 같음)에 대한 중화 반응의 테스트를 예시하는 막대 그래프이다. IC50 값은 상이한 그룹에 대한 중화 역가로 표시된다. 각 도트는 개별 마우스의 혈청 샘플을 나타낸다. 평균 IC50 값은 막대 아래에 표시된다.
도 33은 본 개시의 특정 양태에 따른, x-축에 표시된, 상이한 용량의 명반으로 애주번트 처리된 스파이크HexaProΔC 페리틴(SEQ ID NO:16)으로 면역화된 5마리 마우스의 그룹에서 야생형 SARS-CoV-2 및 SARS-CoV-2 변이체(막대 위에 표시된 바와 같음)에 대한 중화 반응의 테스트를 예시하는 막대 그래프이다. 플롯 위에 표시된 대로, 각 명반 용량에 대해 한 그룹은 단일 면역화를 받았고, 두 번째 그룹은 1차 면역화 21일 후에 부스팅되었다. IC50 값은 상이한 그룹에 대한 중화 역가로 표시된다. 각 도트는 개별 마우스의 혈청 샘플을 나타낸다. 평균 IC50 값은 표시된 시점에 상이한 그룹에 대한 중화 역가로 표시된다.
도 34a는 본 개시의 특정 양태에 따른 상이한 양의 명반(x-축에 표시됨)을 단독으로 또는 20 μg의 CpG(x-축 아래에 표시된 바와 같음)와 함께 애주번트 처리한 스파이크HexaProΔC 페리틴(SEQ ID NO:16)으로 면역화된 5마리 마우스의 그룹에서 야생형 SARS-CoV-2에 대한 중화 반응의 테스트를 예시하는 막대 그래프이다. 각 명반 용량에 대해 한 그룹은 단일 면역화를 받았고, 두 번째 그룹은 1차 면역화 21일 후에 부스팅되었다(x-축 아래에 표시된 바와 같음). IC50 값은 상이한 그룹에 대한 중화 역가로 표시된다. 각 도트는 개별 마우스의 혈청 샘플을 나타낸다. 평균 IC50 값은 표시된 그룹 및 시점 각각에 대해 풀링된 샘플의 상이한 그룹에 대한 중화 역가로 표시된다.
도 34b는 본 개시의 특정 양태에 따른 상이한 양의 명반(x-축에 표시됨)을 단독으로 또는 20 μg의 CpG(x-축 아래에 표시된 바와 같음)와 함께 애주번트 처리한 스파이크HexaProΔC 페리틴(SEQ ID NO:16)으로 면역화된 5마리 마우스의 그룹에서 SARS-CoV-2의 B.1.421 변이체에 대한 중화 반응의 테스트를 예시하는 막대 그래프이다. 각 명반 용량에 대해 한 그룹은 단일 면역화를 받았고, 두 번째 그룹은 1차 면역화 21일 후에 부스팅되었다(x-축 아래에 표시된 바와 같음). IC50 값은 상이한 그룹에 대한 중화 역가로 표시된다. 각 도트는 개별 마우스의 혈청 샘플을 나타낸다. 평균 IC50 값은 표시된 그룹 및 시점 각각에 대해 풀링된 샘플의 상이한 그룹에 대한 중화 역가로 표시된다.
도 34c는 본 개시의 특정 양태에 따른 상이한 양의 명반(x-축에 표시됨)을 단독으로 또는 20 μg의 CpG(x-축 아래에 표시된 바와 같음)와 함께 애주번트 처리한 스파이크HexaProΔC 페리틴(SEQ ID NO:16)으로 면역화된 5마리 마우스의 그룹에서 SARS-CoV-2의 B.1.1.7. 변이체에 대한 중화 반응의 테스트를 예시하는 막대 그래프이다. 각 명반 용량에 대해 한 그룹은 단일 면역화를 받았고, 두 번째 그룹은 1차 면역화 21일 후에 부스팅되었다(x-축 아래에 표시된 바와 같음). IC50 값은 상이한 그룹에 대한 중화 역가로 표시된다. 각 도트는 개별 마우스의 혈청 샘플을 나타낸다. 평균 IC50 값은 표시된 그룹 및 시점 각각에 대해 풀링된 샘플의 상이한 그룹에 대한 중화 역가로 표시된다.
도 34d는 본 개시의 특정 양태에 따른 상이한 양의 명반(x-축에 표시됨)을 단독으로 또는 20 μg의 CpG(x-축 아래에 표시된 바와 같음)와 함께 애주번트 처리한 스파이크HexaProΔC 페리틴(SEQ ID NO:16)으로 면역화된 5마리 마우스의 그룹에서 SARS-CoV-2의 B.1.351 변이체에 대한 중화 반응의 테스트를 예시하는 막대 그래프이다. 각 명반 용량에 대해 한 그룹은 단일 면역화를 받았고, 두 번째 그룹은 1차 면역화 21일 후에 부스팅되었다(x-축 아래에 표시된 바와 같음). IC50 값은 상이한 그룹에 대한 중화 역가로 표시된다. 각 도트는 개별 마우스의 혈청 샘플을 나타낸다. 평균 IC50 값은 표시된 그룹 및 시점 각각에 대해 풀링된 샘플의 상이한 그룹에 대한 중화 역가로 표시된다.
도 34e는 본 개시의 특정 양태에 따른 상이한 양의 명반(x-축에 표시됨)을 단독으로 또는 20 μg의 CpG(x-축 아래에 표시된 바와 같음)와 함께 애주번트 처리한 스파이크HexaProΔC 페리틴(SEQ ID NO:16)으로 면역화된 5마리 마우스의 그룹에서 SARS-CoV-2의 B.1.617.2 변이체에 대한 중화 반응의 테스트를 예시하는 막대 그래프이다. 각 명반 용량에 대해 한 그룹은 단일 면역화를 받았고, 두 번째 그룹은 1차 면역화 21일 후에 부스팅되었다(x-축 아래에 표시된 바와 같음). IC50 값은 상이한 그룹에 대한 중화 역가로 표시된다. 각 도트는 개별 마우스의 혈청 샘플을 나타낸다. 평균 IC50 값은 표시된 그룹 및 시점 각각에 대해 풀링된 샘플의 상이한 그룹에 대한 중화 역가로 표시된다.
도 34f는 본 개시의 특정 양태에 따른 상이한 양의 명반(x-축에 표시됨)을 단독으로 또는 20 μg의 CpG(x-축 아래에 표시된 바와 같음)와 함께 애주번트 처리한 스파이크HexaProΔC 페리틴(SEQ ID NO:16)으로 면역화된 5마리 마우스의 그룹에서 SARS-CoV-2의 P.1 변이체에 대한 중화 반응의 테스트를 예시하는 막대 그래프이다. 각 명반 용량에 대해 한 그룹은 단일 면역화를 받았고, 두 번째 그룹은 1차 면역화 21일 후에 부스팅되었다(x-축 아래에 표시된 바와 같음). IC50 값은 상이한 그룹에 대한 중화 역가로 표시된다. 각 도트는 개별 마우스의 혈청 샘플을 나타낸다. 평균 IC50 값은 표시된 그룹 및 시점 각각에 대해 풀링된 샘플의 상이한 그룹에 대한 중화 역가로 표시된다.
본 발명자들은 표면에 각각의 SARS-CoV-2 스파이크 엑토도메인의 버전을 표시하는 나노입자로 자가-조립되는 SARS-CoV-2 스파이크 엑토도메인 폴리펩티드 및 페리틴의 융합 단백질("SARS-CoV-2 스파이크-페리틴 융합 단백질")을 설계, 생성 및 특성화하였다. SARS-CoV-2 스파이크-페리틴 융합 단백질의 일부 버전은 SARS-CoV-2 스파이크 단백질의 전장 엑토도메인을 함유한다. 다른 버전은 C-말단 결실(일례에서, 70개 아미노산의 C-말단 결실)을 갖는 SARS-CoV-2 스파이크 단백질 엑토도메인을 함유한다. 본 발명자들은 놀랍게도 SARS-CoV-2 스파이크 단백질 아미노산 서열의 C-말단 결실이 포유동물 세포에서 생성된 융합 단백질의 발현을 상당히 개선시켰음을 발견하였다. 본 발명자들은 cryo-EM, 크기-배제 크로마토그래피 다중각 광 산란(SEC-MALS) 및 생체층 간섭계(BLI)에 의해 각 버전의 SARS-CoV-2 스파이크-페리틴 융합 단백질의 스파이크 도메인이 나노입자 표면에서 천연-유사 입체형태로 적절하게 폴딩되는 것을 확인하였고, 이는 ACE2 수용체 및/또는 하나 이상의 스파이크-특이적 모노클로날 항체에 대한 SARS-CoV-2 스파이크-페리틴 융합 단백질의 결합을 측정하였다. 본 발명자들은 다른 SARS-CoV-2 융합 단백질 항원과의 비교를 포함하여, 실험용 동물에서 SARS-CoV-2 스파이크-페리틴 융합 단백질의 면역원성을 테스트하였다. SARS-CoV-2 스파이크-페리틴 융합 단백질로 마우스를 단일 면역화한 후, 본 발명자들은 렌티바이러스 CoV-2 슈도바이러스 검정을 사용하여 결정된 바와 같이, 인간 회복기 혈장에서 보이는 것과 비슷하거나 더 많은 중화 항체 양을 관찰하였다. 대조적으로, CoV-2 수용체 결합 도메인(RBD) 또는 SARS-CoV-2 스파이크의 분리된 스파이크 삼량체를 사용한 단일 면역화는 훨씬 약한 중화 항체 반응을 유도하였다. 본 발명자들은 또한 면역원으로 사용된 SARS-CoV-2 스파이크-페리틴 융합 단백질에 대한 실험용 동물에서 생성된 항체의 SARS-CoV-2 바이러스 중화 특성을 테스트하였다. 본 발명자들은 나노입자로 자가-조립될 수 있는 SARS-CoV-2 스파이크-페리틴 융합 단백질이 다른 SARS-CoV-2 스파이크 단백질 항원과 비교하여 실험용 동물에서 훨씬 더 강력한 항원-특이적 및 중화 항체 반응을 유도하였음을 예기치 않게 발견하였다. 본 발명자들은 또한 SARS-CoV-2 스파이크 단백질 엑토도메인 아미노산 서열에서 C-말단 결실("C-말단 결실")을 갖는 SARS-CoV-2 스파이크-페리틴 융합 단백질이 테스트한 모든 항원 중 실험용 동물에서 가장 높은 중화 항체 반응을 유도하였음을 발견하였다. 본 발명자들은 SARS-CoV-2 스파이크-페리틴 융합 단백질이 포유동물 세포에서 생산된 후 나노입자로 자가-조립되는 능력, SARS-CoV-2 스파이크 단백질의 엑토도메인과 유사한 달성된 발현 수준, 및 SARS-CoV-2 스파이크-페리틴 융합 단백질에 의해 유도된 향상된 면역 반응을 감안할 때, SARS-CoV-2 스파이크-페리틴 융합 단백질(SARS-CoV-2 스파이크 단백질 엑토도메인 아미노산 서열에서 C-말단 결실을 갖는 스파이크-페리틴 융합 단백질 포함)이 SARS-CoV-2에 대한 서브유닛 또는 핵산 백신에 사용될 수 있음을 깨달았다.
본 발명자들은 C-말단 결실 및 2개 이상의 프롤린 치환을 갖는 여러 SARS-CoV-2 스파이크-페리틴 융합 단백질을 테스트하였고 C-말단 결실 및 6개의 프롤린 치환을 갖는 SARS-CoV-2 스파이크-페리틴 융합 단백질이 C-말단 결실 및 2개의 프롤린 치환을 갖는 SARS-CoV-2 스파이크-페리틴 융합 단백질에 동등하게 면역원성이었음을 발견하였다. 또한, C-말단 결실 및 6개의 프롤린 치환을 갖는 SARS-CoV-2 스파이크-페리틴 융합 단백질의 발현 및 정제 수율은 C-말단 결실 및 더 적은 프롤린 치환을 갖는 SARS-CoV-2 스파이크-페리틴 융합 단백질보다 예기치 않게 현저하게 더 높았다. 본 발명자들은 C-말단 결실 및 6개의 프롤린 치환을 갖는 SARS-CoV-2 스파이크-페리틴 융합 단백질의 여러 버전을 생성하고 테스트하였다. 이들 버전은 코로나바이러스 스파이크 단백질의 자연 발생 변이체를 기반으로 하며, 실험용 동물에 투여했을 때 높은 중화 활성을 가진 항체를 유도하였다. 본 발명자들은 동결건조되고 이어서 재구성된 SARS-CoV-2 스파이크-페리틴 융합 단백질이 이들의 구조 및 면역원성을 유지하였음을 발견하였다. 또한, 본 발명자들은 면역 시스템으로부터 페리틴 도메인을 차폐하고 페리틴 도메인에 대한 면역 반응을 감소시키기 위해(따라서 본 발명자들이 고안한 항-SARS-CoV-2 백신에 대한 비생산적 면역 반응을 최소화함), 페리틴 도메인에 인공 글리코실화 부위를 갖도록 SARS-CoV-2 스파이크 페리틴 융합 단백질을 조작하였다.
상기 발견에 기초하여, 본 발명자들은 코로나바이러스 스파이크-페리틴 융합 단백질, 이러한 융합 단백질로 구성된 나노입자, 핵산, 핵산 작제물 및 코로나바이러스 스파이크-페리틴 융합 단백질을 인코딩하는 벡터, 및 코로나바이러스 스파이크-페리틴 융합 단백질의 생산 및 사용과 관련된 세포, 조성물, 키트 및 방법의 다양한 구현예를 고안하고 본 개시에서 기술하였다. 코로나바이러스 스파이크-페리틴 융합 단백질의 나노입자 생산은 단일 발현 플라스미드만을 필요로 한다. 코로나바이러스 스파이크-페리틴 융합 단백질의 발현 및 정제는 가용성 단백질에 대한 표준 프로토콜을 사용하여 수행 및 확장될 수 있으며, 정제된 융합 단백질은 나노입자의 균질한 집단으로 자가-조립된다. 대조적으로, 별도의 구성요소로부터 조립된 나노입자는 구성요소가 별도로 생성되고 정제 후 컨쥬게이션 단계에서 컨쥬게이션될 것을 필요로 하며, 이는 수율을 크게 감소시키고 이질적인 나노입자 집단을 생성할 수 있다. 본 발명자들에 의해 고안되고 본 개시에 기술된 코로나바이러스 스파이크-페리틴 융합 단백질 및 관련 핵산, 핵산 작제물, 벡터, 세포, 조성물, 키트 및 방법은 단백질 또는 핵산을 기반으로 하는 면역원성 조성물(백신)의 개발 및 생산을 포함하나 이에 제한되지 않는 다양한 적용에 유용하고 코로나바이러스 감염에 대한 면역 반응을 유도하고 SARS-CoV-2 감염을 포함하나 이에 제한되지 않는 코로나바이러스 감염의 예방 또는 치료에 유용하다. 본 발명자들에 의해 얻어진 실험 결과는 코로나바이러스 스파이크 단백질 엑토도메인을 나타내는 스파이크-페리틴 융합 단백질의 나노입자가 대상체에서 임상적으로 관련된 양의 중화 항체를 안정적으로 유도할 수 있음을 입증하였다. 따라서, 코로나바이러스 스파이크-페리틴 융합 단백질 및 이러한 융합 단백질을 인코딩하는 핵산 작제물은 코로나바이러스 감염에 대한 보호를 유도하기 위한 단일 용량 백신과 같은 백신으로 사용될 수 있다.
용어 및 개념
많은 용어와 개념이 아래에 설명되어 있다. 이들은 본 문서의 나머지 부분 및 첨부된 도면과 함께 본 발명의 다양한 구현예의 이해를 용이하게 하기 위한 것이다. 이러한 용어 및 개념은 본 문서 및/또는 첨부된 도면 전체에 제공된 설명뿐만 아니라 본 발명의 분야에서 허용되는 관례에 기초하여 더 명확해지고 이해될 수 있다. 일부 다른 용어는 본 문서의 다른 섹션 및 첨부된 도면에서 명시적으로 또는 암시적으로 정의될 수 있으며, 본 발명의 분야에서 허용되는 관례, 본 문서 전체에 제공된 설명 및/또는 첨부된 도면에 기초하여 사용되고 이해될 수 있다. 명시적으로 정의되지 않은 용어들은 본 발명의 분야에서 허용되는 관례에 따라 정의되고 이해될 수 있으며, 본 문서 및/또는 첨부된 도면의 맥락에서 해석될 수 있다.
문맥상 달리 규정되지 않는 한, 단수형 용어는 복수형을 포함하고, 복수형 용어는 단수형을 포함할 것이다. 일반적으로, 세포 및 조직 배양, 분자 생물학, 면역학, 미생물학, 유전학 및 단백질 및 핵산 화학과 관련하여 사용되는 명명법 및 기술은 잘 알려져 있고 일반적으로 사용된다. 공지된 방법 및 기술은 달리 나타내지 않는 한 일반적으로 널리 공지된 통상적인 방법에 따라 그리고 다양한 일반적이고 보다 구체적인 참고문헌에 기재된 바와 같이 수행된다. 본 개시에 기재된 실험실 절차 및 기술과 관련하여 사용되는 명명법은 잘 알려져 있고 일반적으로 사용된다.
본원에서 사용되는 단수형은 달리 구체적으로 언급되지 않는 한 하나 이상을 지칭할 수 있다.
"또는"이라는 용어의 사용은 대안만을 지칭하도록 명시적으로 나타내지 않거나 대안이 상호 배타적이지 않는 한 "및/또는"을 의미하기 위해 사용되나, 본 개시는 대안만 그리고 "및/또는"을 지칭하는 정의를 지원한다. 본원에서 사용되는 "또 다른"은 적어도 두 번째 이상을 의미할 수 있다.
본원에서 사용되는 용어 "약" 및 "대략"은 일반적으로 측정의 성질 또는 정밀도를 고려하여 측정된 양에 대해 허용 가능한 오차 정도를 의미한다. 예시적인 오차 정도는 주어진 값 또는 값의 범위의 20%(%) 이내; 바람직하게는 10% 이내; 및 보다 바람직하게는 5% 이내이다. "약 X" 또는 "대략 X"에 대한 모든 언급은 구체적으로 적어도 X, 0.95X, 0.96X, 0.97X, 0.98X, 0.99X, 1.01X, 1.02X, 1.03X, 1.04X, 및 1.05X 값을 나타낸다. 따라서, 표현 "약 X" 및 "대략 X"는, 예를 들어, "0.98X"의 청구 제한에 대한 서면 지원을 교시하고 제공하기 위한 것이다. 대안적으로, 생물학적 시스템에서, 용어 "약" 및 "대략"은 주어진 값의 자릿수 내, 바람직하게는 5배 이내, 보다 바람직하게는 2배 이내의 값을 의미할 수 있다. 본원에서 주어진 수치는 달리 언급되지 않는 한 근사치이며, 용어 "약" 또는 "대략"은 명시적으로 언급되지 않을 때 추론될 수 있음을 의미한다. "약"이 숫자 범위의 시작 부분에 적용되면 범위의 양쪽 끝에 적용된다.
용어 "단백질", "펩티드" 및 "폴리펩티드"는 아미노산 잔기의 중합체를 나타내기 위해 상호교환적으로 사용된다. 이 용어는 자연 발생 아미노산 중합체 및 비자연 아미노산 중합체뿐만 아니라 하나(또는 그 초과)의 아미노산 잔기가 상응하는 자연 발생 아미노산의 인공 화학적 모방체인 아미노산 중합체에 적용된다. 이 용어는 아미노산 잔기가 공유 펩티드 결합에 의해 연결된 전장 단백질을 포함하는 임의의 길이의 아미노산 사슬을 포함한다.
"분리된" 또는 "정제된" 폴리펩티드 또는 단백질, 또는 생물학적 활성 부분인 폴리펩티드 또는 단백질은 자연 발생 환경에서 발견되는 폴리펩티드 또는 단백질과 일반적으로 동반되거나 상호작용하는 구성요소가 실질적으로 또는 본질적으로 없다. 따라서, 분리되거나 정제된 폴리펩티드 또는 단백질은 재조합 기술에 의해 생산될 때 다른 세포 물질 또는 배양 배지가 실질적으로 없거나, 화학적으로 합성될 때 화학적 전구체 또는 다른 화학 물질이 실질적으로 없다. 세포 물질이 실질적으로 없는 단백질은 오염 단백질이 약 30%, 20%, 10%, 5%, 1%, 0.5% 또는 0.1%(총 단백질) 미만인 단백질의 제조물을 포함한다. 본 발명의 단백질 또는 이의 생물학적 활성 부분이 재조합적으로 생산될 때, 최적의 배양 배지는 약 30%, 20%, 10%, 5%, 1%, 0.5% 또는 0.1%(농도 기준) 미만의 화학적 전구체 또는 관심 단백질이 아닌(non-protein-of-interest) 화학 물질을 나타낸다.
용어 "아미노산"은 펩티드, 폴리펩티드 또는 단백질에 혼입될 수 있는 임의의 단량체 단위를 지칭한다. 아미노산은 자연 발생 α-아미노산 및 이의 입체 이성질체뿐만 아니라 비자연(비자연 발생) 아미노산 및 이의 입체 이성질체를 포함한다. 주어진 아미노산의 "입체 이성질체"는 동일한 분자식 및 분자내 결합을 갖지만 결합 및 원자의 상이한 3차원 배열을 갖는 이성질체를 지칭한다(예를 들어, L-아미노산 및 상응하는 D-아미노산).
자연 발생 아미노산은 유전 코드에 의해 인코딩되는 아미노산뿐만 아니라 이후에 변형되는 아미노산, 예를 들어, 하이드록시프롤린, γ-카르복시글루타메이트 및 O-포스포세린이다. 자연 발생 α-아미노산은 알라닌(Ala), 시스테인(Cys), 아스파르트산(Asp), 글루탐산(Glu), 페닐알라닌(Phe), 글리신(Gly), 히스티딘(His), 이소류신(Ile), 아르기닌(Arg), 리신(Lys), 류신(Leu), 메티오닌(Met), 아스파라긴(Asn), 프롤린(Pro), 글루타민(Gln), 세린(Ser), 트레오닌(Thr), 발린(Val), 트립토판(Trp), 티로신(Tyr) 및 이들의 조합을 포함하나 이에 제한되지 않는다. 자연 발생 α-아미노산의 입체 이성질체는 D-알라닌(D-Ala), D-시스테인(D-Cys), D-아스파르트산(D-Asp), D-글루탐산(D- Glu), D-페닐알라닌(D-Phe), D-히스티딘(D-His), D-이소류신(D-Ile), D-아르기닌(D-Arg), D-리신(D-Lys), D-류신(D-Leu), D-메티오닌(D-Met), D-아스파라긴(D-Asn), D-프롤린(D-Pro), D-글루타민(D-Gln), D-세린(D-Ser), D-트레오닌(D-Thr), D-발린(D-Val), D-트립토판(D-Trp), D-티로신(D-Tyr) 및 이들의 조합을 포함하나 이에 제한되지 않는다.
비자연(비자연 발생) 아미노산은 아미노산 유사체, 아미노산 모방체, 합성 아미노산, N-치환된 글리신, 및 자연 발생 아미노산과 유사한 방식으로 기능하는 L- 또는 D-배열의 N-메틸 아미노산을 포함하나 이에 제한되지 않는다. 예를 들어, "아미노산 유사체"는 자연 발생 아미노산과 동일한 기본 화학 구조를 갖지만(즉, 수소, 카르복실 기, 아미노 기에 결합된 탄소) 호모세린, 노르류신, 메티오닌 설폭사이드, 메티오닌 메틸 설포늄과 같이 변형된 측쇄 기 또는 변형된 펩티드 백본을 갖는 비자연 아미노산일 수 있다. "아미노산 모방체"는 아미노산의 일반 화학 구조와 상이하나, 자연 발생 아미노산과 유사한 방식으로 기능하는 구조를 갖는 화학적 화합물을 지칭한다. 아미노산은 일반적으로 공지된 3문자 기호 또는 IUPAC-IUB 생화학 명명법 위원회에 의해 권장되는 1문자 기호로 나타낼 수 있다.
"보존적으로 변형된 변이체"라는 표현 및 관련 표현은 아미노산 서열뿐만 아니라 아미노산 서열을 인코딩하는 핵산 서열에도 적용될 수 있다. 인코딩된 서열 내의 단일 아미노산 또는 적은 퍼센트의 아미노산을 변경시키거나, 첨가하거나, 결실시키는 핵산, 펩티드, 폴리펩티드 또는 단백질 서열에 대한 치환, 결실 또는 첨가는 이러한 변경으로 인해 아미노산이 화학적으로 유사한 아미노산으로 치환되는 경우 "보존적으로 변형된 변이체"이다. 기능적으로 유사한 아미노산을 제공하는 보존적 치환 표는 당업계에 널리 공지되어 있다. 이러한 보존적으로 변형된 변이체는 본 발명의 다형성 변이체, 종간 동족체 및 대립유전자에 추가되며 이를 배제하지 않는다. 다음 8개의 그룹 각각은 서로에 대해 보존적 치환인 아미노산을 포함한다:
1) 알라닌(A), 글리신(G);
2) 아스파르트산(D), 글루탐산(E);
3) 아스파라긴(N), 글루타민(Q);
4) 아르기닌(R), 리신(K);
5) 이소류신(I), 류신(L), 메티오닌(M), 발린(V);
6) 페닐알라닌(F), 티로신(Y), 트립토판(W);
7) 세린(S), 트레오닌(T); 및
8) 시스테인(C), 메티오닌(M).
용어 "핵산", "핵산 서열", "뉴클레오티드 서열", "올리고뉴클레오티드", "폴리뉴클레오티드" 및 관련 용어 및 표현은 데옥시리보핵산(DNA) 또는 리보핵산(RNA) 및 이들의 중합체를 지칭한다. 본 개시에서 논의된 바와 같은 핵산 서열은 단일 가닥 형태, 이중 가닥 형태, 헤어핀, 스템-앤-루프 구조 등을 포함하나 이에 제한되지 않는 모든 형태의 핵산을 포함한다. RNA 서열이 기술될 때, 이의 상응하는 DNA 서열도 기술되며, 여기서 우리딘은 티미딘으로 표시된다. DNA 서열이 기술될 때, 이의 상응하는 RNA 서열도 기술되며, 여기서 티미딘은 우리딘으로 표시된다. 구체적으로 제한되지 않는 한, 용어 "핵산" 및 관련 용어 및 표현은 참조 핵산과 유사한 특성을 갖고 자연 발생 뉴클레오티드와 유사한 방식으로 대사되는 자연 뉴클레오티드의 알려진 유사체를 함유하는 핵산을 포함한다. 핵산 서열은 데옥시리보핵산 및 리보핵산의 조합을 포함할 수 있다. 이러한 데옥시리보핵산 및 리보핵산은 자연 발생 분자 및 합성 유사체를 모두 포함한다. 달리 나타내지 않는 한, 특정 핵산 서열은 축퇴 코돈 치환, 대립유전자, 오르톨로그, SNP 및 상보적 서열뿐만 아니라 명시적으로 나타낸 서열도 암시적으로 포함한다. 축퇴 코돈 치환은 하나 이상의 선택된(또는 모든) 코돈의 세 번째 위치가 혼합-염기 및/또는 데옥시이노신 잔기로 치환된 서열을 생성함으로써 달성될 수 있다.
용어 "동일성", "실질적인 동일성", "유사성", "실질적인 유사성", "상동성" 및 핵산 또는 아미노산 서열을 설명하는 맥락에서 사용되는 관련 용어 및 표현은 첨조 서열과 적어도 60% 서열 동일성을 갖는 서열을 지칭한다. 예는 표준 파라미터를 사용하는 BLAST와 같은 핵산 또는 아미노산 서열의 비교를 위한 프로그램을 사용하는 참조 서열과 비교하여, 적어도 60%, 65%, 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 포함한다. 서열 비교를 위해, 전형적으로 하나의 서열이 테스트 서열과 비교되는 참조 서열로 작용한다. 서열 비교 알고리즘을 사용할 때, 테스트 및 참조 서열을 컴퓨터에 입력하고, 필요에 따라, 하위서열 좌표를 지정하고, 서열 알고리즘 프로그램 파라미터를 지정한다. 기본(표준) 프로그램 파라미터를 사용하거나 대체 파라미터를 지정할 수 있다. 그런 다음 서열 비교 알고리즘은 프로그램 파라미터를 기반으로 참조 서열에 대한 테스트 서열의 서열 동일성 퍼센트를 계산한다. "비교 창"은 인접 위치의 수(20 내지 600개, 일반적으로 약 50 내지 약 200개, 보다 일반적으로 약 100 내지 약 150개)의 임의의 하나의 세그먼트에 대한 참조를 포함하며, 여기서 서열은 두 서열이 최적으로 정렬된 후 인접 위치의 동일한 수의 참조 서열과 비교될 수 있다. 비교를 위한 서열 정렬 방법은 잘 알려져 있다. 비교를 위한 서열의 최적 정렬은, 예를 들어, Smith and Waterman, 1981의 국소 상동성 알고리즘, Needleman and Wunsch, 1970의 상동성 정렬 알고리즘, Pearson and Lipman, 1988의 유사성 검색 방법, 이러한 알고리즘의 컴퓨터 구현(예를 들어, BLAST), 또는 수동 정렬 및 육안 검사를 통해 수행될 수 있다.
서열 동일성 및 서열 유사성 퍼센트를 결정하는데 적합한 알고리즘은 각각 문헌[Altschul et al., 1990, and Altschul et al., 1977]에 기술된 BLAST 및 BLAST 2.0 알고리즘을 포함한다. BLAST 분석을 수행하기 위한 소프트웨어는 National Center for Biotechnology Information(NCBI) 웹 사이트를 통해 공개적으로 이용 가능하다. 이 알고리즘은 먼저 쿼리 서열에서 길이가 W인 짧은 단어를 식별하여 높은 점수 서열 쌍(HSP)을 식별하는 것을 포함하고, 이는 데이터베이스 서열에서 동일한 길이의 단어와 정렬될 때 일부 양의 값 임계 점수 T와 일치하거나 만족한다. T는 이웃 단어 점수 임계값이라고 지칭된다. 이러한 초기 이웃 단어 히트는 이를 포함하는 더 긴 HSP를 찾기 위한 검색을 시작하는 시드 역할을 한다. 그런 다음 누적 정렬 점수가 증가할 수 있는 한 단어 히트가 각 서열을 따라 양방향으로 확장된다. 누적 점수는 뉴클레오티드 서열에 대해 파라미터 M(일치하는 잔기 쌍에 대한 보상 점수; 항상 >0) 및 N(불일치 잔기에 대한 페널티 점수; 항상 <0)을 사용하여 계산된다. 아미노산 서열의 경우, 채점 매트릭스를 사용하여 누적 점수를 계산한다. 각 방향의 단어 히트의 확장은 누적 정렬 점수가 최대 달성 값에서 양 X만큼 떨어지거나; 누적 점수가 하나 이상의 음수-채점 잔기 정렬의 누적으로 인해 0 이하가 되거나; 서열의 끝에 도달했을 때 중지된다. BLAST 알고리즘 파라미터 W, T 및 X는 정렬의 감도 및 속도를 결정한다. BLASTN 프로그램(뉴클레오티드 서열의 경우)은 기본값으로 단어 크기(W) 28, 기대값(E) 10, M=1, N=-2 및 두 가닥의 비교를 사용한다. 아미노산 서열의 경우, BLASTP 프로그램은 기본값으로 단어 크기(W) 3, 기대값(E) 10, 및 BLOSUM62 채점 매트릭스를 사용한다(Henikoff and Henikoff, 1989). BLAST 알고리즘은 또한 두 서열 간의 유사성에 대한 통계 분석을 수행한다(Karlin and Altschul, 1993). BLAST 알고리즘에 의해 제공되는 유사성의 한 척도는 최소 합계 확률(P(N))이며, 이는 두 뉴클레오티드 또는 아미노산 서열 사이의 일치가 우연히 발생할 확률을 나타낸다. 예를 들어, 테스트 핵산과 참조 핵산의 비교에서 최소 합계 확률이 약 0.01 미만, 보다 바람직하게는 약 10-5 미만, 가장 바람직하게는 약 10-20 미만인 경우 핵산은 참조 서열과 유사한 것으로 간주된다.
용어 "항체" 및 관련 용어는 또 다른 분자의 특정 공간 및 극성 조직에 결합하는 면역글로불린 또는 이의 단편을 지칭한다. 면역글로불린은 IgA, IgD, IgE, IgG1, IgG2a, IgG2b 및 IgG3, IgG4, IgM 등과 같은 다양한 클래스 및 아이소형을 포함한다. 항체는 모노클로날 또는 재조합일 수 있으며, 연속 하이브리드 세포주를 준비하고 분비된 단백질을 수집하는 것과 같은 실험실 기술에 의해, 또는 적어도 결합에 필요한 아미노산 서열을 코딩하는 뉴클레오티드 서열 또는 이들의 돌연변이된 버전을 클로닝 및 발현시켜 제조될 수 있다. 용어 "항체"는 인간화, 인간, 단일-사슬, 키메라, 합성, 재조합, 하이브리드, 돌연변이, 그래프트, 및 시험관 내 생성 항체 및 이들의 단편과 같은 천연, 인공적으로 변형된, 및 인공적으로 생성된 항체 형태를 포함한다. 용어 "항체"는 또한 면역글로불린 모이어티를 함유하는 융합 단백질을 포함하나 이에 제한되지 않는 복합 형태를 포함한다. "항체"는 또한 비-4차 항체 구조(예를 들어, 낙타 및 낙타 유도체)를 지칭한다. 항체 단편은 Fab, Fv 및 F(ab')2, Fab', scFv, Fd, dAb, Fc 등을 포함할 수 있다. 항체는 또한 단일-사슬 항체, 키메라 항체, 인간화 항체, 또는 특정 결합 부위에 특이적인 결합 활성을 유지하는 임의의 다른 항체 유도체일 수 있다. 또한, 면역글로불린 또는 이들의 단편의 응집체, 중합체 및 컨쥬게이트를 적절한 경우 사용할 수 있다.
"중화 항체"라는 표현은 감염 제제의 수명 주기 중 하나 이상의 부분을 중화 또는 억제함으로써 바이러스와 같은 감염 제제가 세포를 감염시키는 것을 막을 수 있는 항체를 지칭할 수 있다. 본 개시의 맥락에서, 중화 항체는 비제한적으로 SARS-CoV-2와 같은 코로나바이러스가 숙주 세포에서 수명 주기를 완료하는 것을 막을 수 있다. 예를 들어, 코로나바이러스와 같은 바이러스의 수명 주기는 바이러스가 숙주 세포에 부착하는 것으로 시작하여 숙주 세포에서 새로 형성된 바이러스의 발아로 끝난다. 이 수명 주기는 세포에 부착하는 단계, 세포에 진입하는 단계, 바이러스 막과 숙주 세포막의 융합 단계, 바이러스 리보핵단백질이 세포질로 방출되는 단계, 새로운 바이러스 입자가 형성되는 단계 및 숙주 세포막에서 바이러스 입자가 발아되는 단계를 포함하나 이에 제한되지 않는다.
용어 "면역원성" 및 관련 용어는 본 개시의 맥락에서 사용되는 경우, 단백질, 폴리펩티드, 또는 단백질 또는 폴리펩티드의 영역일 수 있는 항원이 대상체에서 특정 항원에 대한 면역 반응을 유도하는 능력을 지칭한다. 본 개시의 맥락에서, 면역 반응은 대상체에서 항원에 대한 체액성 및/또는 세포성 면역 반응의 발달이다. "체액성 면역 반응"은 분비(IgA) 또는 IgG 분자를 포함하는 항체 분자에 의해 매개되는 면역 반응을 지칭하는 반면, "세포성 면역 반응"은 T-림프구 및/또는 다른 백혈구에 의해 매개되는 반응이다. 세포성 면역의 한 가지 중요한 양태는 세포용해성 T-세포("CTL")에 의한 항원-특이적 반응을 포함한다. CTL은 주요 조직 적합성 복합체(MHC)에 의해 인코딩되고 세포 표면에서 발현되는 단백질과 관련하여 제시되는 펩티드 항원에 대한 특이성을 갖는다. CTL은 세포내 미생물의 파괴 또는 이러한 미생물에 감염된 세포의 용해를 유도하고 촉진하는데 도움이 된다. 세포 면역의 또 다른 양태는 헬퍼 T-세포에 의한 항원-특이적 반응을 포함한다. 헬퍼 T-세포는 표면에 MHC 분자와 관련하여 펩티드 항원을 표시하는 세포에 대해 비특이적 이펙터 세포의 기능을 자극하고 활성을 집중하는데 도움을 주는 역할을 한다. 세포 면역 반응은 또한 CD4+ 및 CD8+ T-세포로부터 유래된 것을 포함하여, 활성화된 T-세포 및/또는 다른 백혈구에 의해 생산된 사이토카인, 케모카인 및 다른 이러한 분자의 생산을 지칭한다. 따라서, 면역원성 조성물은 CTL 및/또는 헬퍼 T 세포의 생산 또는 활성화를 자극할 수 있다. 케모카인 및/또는 사이토카인의 생산도 자극될 수 있다. 면역원성 조성물은 또한 항체-매개 면역 반응을 유도할 수 있다. 면역원성 조성물은 대상체에게 투여시 다음 효과 중 하나 이상을 포함할 수 있다: B-세포에 의한 항체 생산; 및/또는 면역원성 조성물에 존재하는 항원 단백질에 특이적으로 지시된 억제제, 세포독성 또는 헬퍼 T-세포 및/또는 T-세포의 활성화. 대상체에서 유도된 면역 반응은 코로나바이러스, 예를 들어, SARS-CoV-2와 같은 바이러스의 감염성을 중화하고/거나 항체-보체 또는 항체 의존성 세포 세포독성(ADCC)을 매개하여 면역화된 대상체에게 바이러스 감염에 대한 보호를 제공하는 역할을 할 수 있다. 면역원성 조성물에 의해 유도된 면역 반응의 다양한 양태는 표준 검정을 사용하여 결정될 수 있으며, 그 중 일부는 본 개시에 기술되어 있다.
본 개시에 기재된 바와 같은 면역원성 조성물은 또한 "백신"으로 지칭될 수 있다. 면역원성 조성물 또는 백신은 투여시 대상체에서 이들에 대한 면역 반응을 유도하는 항원을 함유할 수 있다. 예를 들어, 본 개시에 기재된 일부 면역원성 조성물 또는 백신은 투여시 대상체에서 이들에 대한 면역 반응을 유도할 수 있는 SARS-CoV-2 스파이크 단백질 항원과 같은 코로나바이러스 스파이크 단백질 항원을 함유한다. 면역원성 조성물은 또한 이러한 항원을 인코딩하는 핵산 서열을 함유할 수 있다. 예를 들어, 본 개시에 기재된 일부 면역원성 조성물 또는 백신은 SARS-CoV-2 스파이크 단백질 항원과 같은 코로나바이러스 스파이크 단백질 항원을 인코딩하는 핵산 서열을 함유한다. 항원-인코딩 핵산 서열을 함유하는 면역원성 조성물은 "핵산 백신"으로 기술되거나 지칭될 수 있다. "핵산 백신"이라는 표현 및 관련 용어 및 표현은 네이키드 DNA 백신, 예를 들어, 플라스미드 백신, 및 바이러스 벡터에 포함되고/거나 바이러스 입자로서 전달되는 바이러스 벡터-기반 핵산 백신을 포함한다.
용어 "항원"은 대상체의 면역 시스템을 자극하여 항원-특이적 면역 반응을 생성할 수 있는 하나 이상의 에피토프(선형, 입체형태 또는 둘 모두)를 포함하는 분자, 예를 들어, 폴리펩티드를 지칭한다. 폴리펩티드 에피토프는 약 7 내지 15개의 아미노산, 예를 들어, 9, 10, 12 또는 15개의 아미노산을 포함할 수 있다. 예를 들어, "코로나바이러스 스파이크 단백질 항원"이라는 표현은 SARS-CoV-2 스파이크 단백질과 같은 코로나바이러스 스파이크 단백질의 폴리펩티드를 지칭할 수 있다. 용어 "항원"은 용어 "면역원"과 상호교환적으로 사용될 수 있다.
"바이러스"는 복수 및 단수의 의미로 모두 사용된다. "비리온"은 단일 바이러스를 지칭한다. 예를 들어, "코로나바이러스 비리온"이라는 표현은 코로나바이러스 입자를 지칭한다.
코로나바이러스는 포유동물 및 조류에서 질병을 일으키는 외피보유 단일 가닥 RNA 바이러스 그룹이다. 코로나바이러스 숙주는 박쥐, 돼지, 개, 고양이, 마우스, 래트, 소, 토끼, 닭 및 칠면조를 포함한다. 인간에서, 코로나바이러스는 경증 내지 중증의 호흡기 감염을 일으킨다. 코로나바이러스는 위험 요인이 매우 다양하다. 일부는 감염된 대상체의 30% 이상을 죽일 수 있다. 인간 코로나바이러스의 일부 예는 인간 코로나바이러스 229E(HCoV-229E); 인간 코로나바이러스 OC43(HCoV-OC43); 중증 급성 호흡기 증후군 코로나바이러스(SARS-CoV); 인간 코로나바이러스 NL63(HCoV-NL63, New Haven 코로나바이러스); 감염된 마우스에서 유래한 인간 코로나바이러스 HKU1(HCoV-HKU1)은 2005년 1월 홍콩의 두 환자에서 처음 발견되었다; 신종 코로나바이러스 2012 및 HCoV-EMC로도 알려진 중동 호흡기 증후군-관련 코로나바이러스(MERS-CoV); 및 2019-nCoV 또는 "신종 코로나바이러스 2019"로도 알려진 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2)(Wu et al., 2020). 인간에서, SARS-CoV-2는 COVID-19라는 코로나바이러스 질병을 일으켜 심각한 증상과 사망을 초래할 수 있다.
스파이크 단백질(또는 "S 단백질")은 코로나바이러스 비리온과 숙주 세포 사이의 수용체 결합 및 막 융합을 매개할 수 있는 코로나바이러스 표면 단백질이다. 코로나바이러스 비리온 표면의 특징적인 스파이크는 스파이크 단백질 동종삼량체의 엑토도메인에 의해 형성된다. 코로나바이러스 스파이크 단백질은 21 내지 35개의 N-글리코실화 부위를 포함하는 다양한 버전으로 고도로 글리코실화된다. 다른 인간-병원성 외피보유 RNA 바이러스에서 발견되는 삼량체 당단백질과 비교하여, 코로나바이러스 스파이크 단백질은 상당히 더 크며 삼량체 당 총 거의 700 kDa이다. 코로나바이러스 스파이크 단백질의 엑토도메인은 숙주 세포 표면의 수용체 결합을 담당하는 S1이라는 N-말단 도메인 및 융합을 담당하는 C-말단 S2 도메인을 포함한다. SARS-CoV-2 스파이크 단백질의 S1 도메인은 숙주 세포의 안지오텐신-전환 효소 2(ACE2)에 결합할 수 있다. ACE2를 인식하는 SARS-CoV-2 스파이크 단백질 S1 도메인의 영역은 수용체 결합 도메인(RBD)이라고 하는 25 kDa 도메인이다(Walls et al., 2020). 독립형 폴리펩티드로 발현될 때, RBD는 ACE2에 결합할 수 있는 기능적으로 폴딩된 도메인을 형성할 수 있다. 다른 코로나바이러스에서, 스파이크 단백질은 비리온의 조립 및 세포외유출 동안 절단되거나 절단되지 않을 수 있다. 대부분의 알파코로나바이러스, 및 베타코로나바이러스 SARS-CoV에서, 비리온은 절단되지 않은 스파이크 단백질을 보유하는 반면, SARS-CoV-2를 포함한 일부 베타코로나바이러스의 비리온, 및 알려진 감마코로나바이러스에서, 스파이크 단백질은 S1과 S2 도메인 사이에서 절단된 것으로 발견된다. 이러한 비리온에서, 스파이크 단백질은 전형적으로 골지-상주 숙주 프로테아제인 푸린에 의해 절단된다. 따라서, SARS-CoV-2 스파이크 단백질의 자연 발생 또는 "야생형" 아미노산 서열(이는 최초의 바이러스 SARS-CoV-2 분리주인 Wuhan-Hu-1의 서열로 간주됨)은 S1과 S2 도메인 사이에 푸린 절단 부위를 포함한다. 코로나바이러스 스파이크 단백질의 S2 도메인은 2개의 헵타드 반복인 HR1 및 HR2를 포함하며, 이는 융합 과정에 참여하는 코일드-코일 형성의 반복적인 헵타펩티드 특성을 포함한다. COVID-19 환자의 혈청 분석은 스파이크 단백질에 대한 항체가 유도되고 바이러스가 숙주 세포로 진입하는 것을 억제할 수 있음을 보여준다(Brouwer et al., 2020). SARS-CoV-2 스파이크 단백질의 첫 번째 cryo-EM 구조는 문헌[Wrapp et al., 2020]에 설명되어 있다.
SARS-CoV-2 스파이크 단백질의 "야생형" 아미노산 서열 - SEQ ID NO:1
단백질 또는 폴리펩티드의 "도메인"은 구조적 및/또는 기능적 특성에 의해 정의되는 단백질 또는 폴리펩티드의 영역을 지칭한다. 예시적인 기능 특성은 효소 활성 및/또는 다른 단백질 또는 비단백질 실체에 결합하거나 결합되는 능력을 포함한다. 예를 들어, 코로나바이러스 스파이크 단백질은 S1 및 S2 도메인을 포함한다.
용어 "올리고머" 및 관련 용어는 폴리펩티드 또는 단백질과 관련하여 사용될 때 "서브유닛" 또는 "사슬"이라고도 지칭될 수 있는 2개 이상의 폴리펩티드 또는 단백질 단량체에 의해 형성된 복합체를 지칭한다. 예를 들어, 삼량체는 3개의 폴리펩티드 서브유닛으로 형성된 올리고머이다.
용어 "융합 단백질", "융합 폴리펩티드" 및 관련 용어는 단일 폴리펩티드를 형성하기 위해 융합 단백질 아미노산 서열로 결합되거나 연결된, 이전에 별도의 폴리펩티드 분자에서 발견된 2개 이상의 아미노산 서열을 포함하는 인공 또는 조작된 폴리펩티드 분자를 포함하는 폴리펩티드 분자에 관한 것이다. 예를 들어, 융합 단백질은 단일 단백질을 만들기 위해 펩티드 결합을 통해 함께 결합된 적어도 2개의 관련이 없는 단백질로부터의 아미노산 서열을 함유하는 조작된 재조합 단백질일 수 있다. 이러한 맥락에서, 단백질은 아미노산 서열이, 예를 들어, 세포 내부와 같은 자연 환경에서 펩티드 결합을 통해 함께 결합된 것으로 일반적으로 발견되지 않는 경우 관련이 없는 것으로 간주된다. 예를 들어, 본 개시는 관련이 없는 단백질인 코로나바이러스의 스파이크 단백질의 아미노산 서열과 페리틴 서브유닛 폴리펩티드의 아미노산 서열을 포함하는 융합 단백질을 기술한다. 융합 단백질의 아미노산 서열은 "인 프레임(in frame)"으로 결합된 상응하는 핵산 서열에 의해 인코딩되어 전사되고 번역되어 단일 폴리펩티드를 생산한다. 융합 단백질의 아미노산 서열은 인접하거나 하나 이상의 스페이서, 링커 또는 힌지 서열에 의해 분리될 수 있다. 융합 단백질은, 예를 들어, 신호 서열, 태그 서열 및/또는 링커 서열과 같은 추가적인 아미노산 서열을 포함할 수 있다.
페리틴은 동물, 박테리아 및 식물에서 발견되는 구상 단백질이며, 주로 수화된 철 이온 및 양성자를 광물화된 코어로 또는 그로부터 수송함으로써 다핵 Fe(III)2O3 형성의 속도 및 위치를 제어하는 역할을 한다. 페리틴의 구상 형태는 약 17-20 kDa의 분자량을 갖는 폴리펩티드인 단량체 서브유닛 단백질(단량체 페리틴 서브유닛이라고도 함)로 구성된다. 하나의 이러한 단량체 페리틴 서브유닛의 서열의 예는 SEQ ID NO:2로 표시된다. 각 단량체 페리틴 서브유닛은 4개의 역평행 나선 모티프를 포함하는 나선 다발의 토폴로지를 가지며, 다섯 번째로 짧은 나선(c-말단 나선)은 4개의 나선 다발의 긴 축에 대략 수직으로 놓여 있다. 관례에 따르면, 나선은 각각 N-말단으로부터 'A, B, C 및 D & E'로 라벨링된다. N-말단 서열은 캡시드 3중 축에 인접하게 놓여 표면으로 확장되는 반면, E 나선은 C-말단이 입자 코어로 확장되는 4중 축에서 함께 패킹된다. 이 패킹의 결과로 캡시드 표면에 2개의 기공이 생성된다. 이러한 기공 중 하나 또는 둘 모두는 수화된 철이 캡시드 안팎으로 확산되는 지점을 나타내는 것으로 예상된다. 생산 후, 이러한 단량체 페리틴 서브유닛 단백질은 구상 페리틴 단백질로 자가-조립된다. 따라서, 구상 형태의 페리틴은 24개의 단량체 페리틴 서브유닛 단백질을 포함하고, 432개의 대칭을 갖는 캡시드-유사 구조를 갖는다.
처음 5개 아미노산의 N-말단 결실을 갖는 헬리코박터 파일로리 페리틴 서브유닛의 아미노산 서열 - SEQ ID NO:2
용어 "개체", "대상체" 및 "환자"는 비인간 동물 또는 인간을 지칭하기 위해 본 개시에서 상호교환적으로 사용될 수 있다. 대상체의 예는 침팬지 및 기타 유인원 및 원숭이 종과 같은 비인간 영장류를 포함하는 인간 및 기타 영장류; 소, 양, 돼지, 물개, 염소 및 말과 같은 농장 동물; 개 및 고양이와 같은 가정용 포유동물; 마우스, 래트 및 기니피그와 같은 설치류를 포함하는 실험실 동물; 닭, 칠면조 및 기타 순계류 조류, 오리, 거위 등과 같은 가정용, 야생 및 사냥감 조류를 포함하는 조류를 포함하나 이에 제한되지 않는다. 개체, 대상체 및 환자라는 용어 자체는 특정 연령, 성별, 인종 또는 임상 상태를 나타내지 않는다. 따라서, 남성이든 여성이든 모든 연령의 대상체는 본 개시에 포함되도록 의도되며 노인, 성인, 어린이, 아기, 유아 및 영아를 포함하나 이에 제한되지 않는다. 마찬가지로, 본 발명의 방법은, 예를 들어, 백인(백인), 아프리카계 미국인(흑인), 미국 원주민, 하와이 원주민, 히스패닉, 라틴계, 아시아인 및 유럽인을 포함하는 모든 인종에 적용될 수 있다. 감염된 대상체는 코로나바이러스, 예를 들어, SARS-CoV-2와 같은 감염 유기체에 의해 감염된 것으로 알려진 대상체이다.
"투여하는" 또는 "투여"라는 용어는 대상체에게 본 개시에 기재된 조성물을 투여하는 맥락에서 사용될 때(및 관련 용어 및 표현), 신체 외부에 존재하는 물질(예를 들어, 본 개시에 기재된 면역원성 조성물)을 대상체에게 물리적으로 전달하는 행위를 지칭한다. 투여는 점막, 피내, 정맥내, 근육내, 피하 전달 및/또는 임의의 다른 공지된 물리적 전달 방법에 의한 것일 수 있다. 투여는 의료 전문가 또는 자가-투여에 의한 대상체로의 투여와 같은 직접 투여, 또는 본 개시에 기재된 조성물을 처방하는 행위일 수 있는 간접 투여를 포함한다.
용어 "글리코실화" 및 관련 용어 및 표현은 폴리펩티드 또는 단백질 분자의 특정 아미노산에 탄수화물 모이어티("글리칸"이라고도 함)를 첨가하는 단백질 및 폴리펩티드의 번역 후 변형의 과정 및/또는 결과를 지칭한다. N-결합된 글리코실화에서, 탄수화물 모이어티가 아스파라긴에 첨가된다. O-결합된 글리코실화에서, 탄수화물 모이어티가 세린 또는 트레오닌에 첨가된다. 탄수화물 모이어티의 부착은 공통 아미노산 서열("공통 서열")의 인식을 필요로 한다.
융합 단백질 및 나노입자
코로나바이러스의 스파이크 단백질("코로나바이러스 스파이크 단백질")의 아미노산 서열 및 페리틴 서브유닛 폴리펩티드의 아미노산 서열을 포함하는 융합 단백질이 본 개시에 제공되고 본 발명의 구현예에 포함된다. 본 발명의 구현예에 따른 융합 단백질에 포함된 코로나바이러스 스파이크 단백질 아미노산 서열은 "스파이크 폴리펩티드", "스파이크 단백질 도메인" 또는 "스파이크 도메인"으로도 지칭될 수 있으며, 페리틴 서브유닛 폴리펩티드 아미노산 서열은 "페리틴 아미노산 서열", "페리틴", "페리틴 도메인" 또는 "페리틴 폴리펩티드"로 지칭될 수 있다. 본 발명의 구현예에 따른 융합 단백질은, 상기 아미노산 서열 이외에, 비제한적으로 스파이크 도메인 및 페리틴 도메인 이외의 폴리펩티드 도메인의 아미노산 서열, 링커 서열, 신호 서열, 태그 등과 같은 다른 아미노산 서열을 포함할 수 있다. 이러한 다른 아미노산 서열 중 일부는 본 개시의 다른 곳에 기술되어 있다.
본 발명의 구현예에 따른 융합 단백질에 포함된 코로나바이러스 스파이크 단백질의 아미노산 서열은 알파코로나바이러스, 베타코로나바이러스, 감마코로나바이러스 또는 델타코로나바이러스와 같은 임의의 코로나바이러스로부터의 스파이크 단백질 서열일 수 있다. 본 개시에 기재된 융합 단백질의 일부 구현예는 인간 베타코로나바이러스, 예를 들어, SARS-CoV, MERS-CoV 및 SARS-CoV-2를 포함하나 이에 제한되지 않는 인간을 감염시킬 수 있는 코로나바이러스("인간 코로나바이러스")의 스파이크 단백질의 아미노산 서열을 포함한다. 본 개시에 기재된 융합 단백질의 일부 구현예는 BatCoV RaTG13, Bat SARSr-CoV ZXC21, Bat SARSr-CoV ZC45, BatSARSr-CoV WIV1, 또는 예를 들어 문헌[Zhang et al., 2020]에 기재된 다른 코로나바이러스를 포함하나 이에 제한되지 않는 비인간 동물을 감염시킬 수 있는 코로나바이러스의 스파이크 단백질의 아미노산 서열을 포함한다. 코로나바이러스 스파이크 단백질 서열은 자연 발생 및 인공적으로 생성된 변이체를 포함하여, 스파이크 단백질의 전체 또는 부분 아미노산 서열, 스파이크 단백질 단편의 아미노산 서열 또는 스파이크 단백질 변이체의 아미노산 서열일 수 있음을 이해해야 한다. 스파이크 단백질 아미노산 서열의 예시적인 변이체 중 일부는 비제한적으로 변이체 D614G, B.1.1.7("알파 변이체"로도 알려져 있음), B.1.429("LA 변이체"로도 알려져 있음), P1("감마 변이체"로도 알려져 있음), 및 B.1.351("베타 변이체"로도 알려져 있음), 또는 B.1.617.2("델타 변이체"로도 알려져 있음)와 같은 자연적으로 순환하는 SARS-CoV-2 변이체에서 발견되는 변이체이다.
융합 단백질의 일부 구현예는 코로나바이러스 스파이크 단백질의 자연 발생(또는 "야생형") 아미노산 서열 또는 이의 일부를 함유할 수 있다. 이러한 야생형 서열의 일부 비제한적인 예는 코로나바이러스 스파이크 단백질의 S1 도메인의 야생형 아미노산 서열; 코로나바이러스 스파이크 단백질의 RBD 도메인의 야생형 아미노산 서열; 또는 하나 이상의 C-말단, N-말단 또는 중간 부분이 결실된 코로나바이러스 스파이크 단백질의 야생형 아미노산 서열이다. 일례는 HR2 아미노산 서열을 포함하는 C-말단 결실을 갖는 코로나바이러스 스파이크 단백질의 야생형 아미노산 서열이다. 코로나바이러스 스파이크 단백질의 야생형 아미노산 서열의 일부 다른 예는 "변이체"로도 지칭될 수 있는 자연 발생 SARS-CoV-2 균주에서 발견되는 SEQ ID NO:1과 비교하여 돌연변이를 포함하는 서열이다. 이러한 예 중 하나는 SARS-CoV-2 변이체 계통 B.1.1.7의 균주 SARS-CoV-2 VUI 202012/01에서 발견된 바와 같이 (SEQ ID NO:1에 관해) 잔기 69-70 및 잔기 144의 결실을 갖는 코로나바이러스 스파이크 단백질의 야생형 아미노산 서열이다. 또 다른 예는 SARS-CoV-2 변이체 D614G에서 발견된 바와 같이 (SEQ ID NO:1에 관해) 잔기 614에서 D에서 G로 치환된 코로나바이러스 스파이크 단백질의 야생형 아미노산 서열이다. 또 다른 예는 SARS-CoV-2 변이체 B.1.429에서 발견된 바와 같이 (SEQ ID NO:1에 관해) S13I, W152C, L452R 및 D614G 치환을 갖는 코로나바이러스 스파이크 단백질의 야생형 아미노산 서열이다. 또 다른 예는 SARS-CoV-2 변이체 P1에서 발견된 바와 같이 (SEQ ID NO:1에 관해) L18F, T20N, P26S, D138Y, R190S, K417T, E484K, N501Y, D614G, H655Y, T1027I 치환을 갖는 코로나바이러스 스파이크 단백질의 야생형 아미노산 서열이다. 또 다른 예는 SARS-CoV-2 변이체 B.1.351에서 발견된 바와 같이 (SEQ ID NO:1에 관해) L18F, D80A, D215G, 242-244 del, R246I, K417N, E484K, N501Y, D614G, A701V 치환을 갖는 코로나바이러스 스파이크 단백질의 야생형 아미노산 서열이다. 또 다른 예는 SARS-CoV-2 변이체 B.1.1.7에서 발견된 바와 같이 (SEQ ID NO:1에 관해) 잔기 69-70 및 잔기 144의 결실, 및 (SEQ ID NO:1에 관해) N501Y, A570D, D614G, P681H, T716I, S982A, D1118H 치환을 갖는 코로나바이러스 스파이크 단백질의 야생형 아미노산 서열이다. 또 다른 예는 잔기 SARS-CoV-2 변이체 B.1.617.2에서 발견된 바와 같이 (SEQ ID NO:1에 관해) 잔기 156-157의 결실, 및 (SEQ ID NO:1에 관해) T19R, G142D, R158G, L452R, T478K, D614G, P681R 및 D950N 치환을 갖는 코로나바이러스 스파이크 단백질의 야생형 아미노산 서열이다. 추가적인 예는 HR2 아미노산 서열 앞에 코로나바이러스 스파이크 단백질 내의 몇 개의 잔기(예를 들어, 1-5개)가 결실된 다른 자연 발생 균주의 서열을 포함한다. 코로나바이러스 스파이크 단백질의 상기 아미노산 서열의 특징 중 일부는 표 1에 요약되어 있다. 본 개시에 따른 SARS-CoV-2 스파이크 단백질 항원의 일부 예에서, 위에서 논의되고 위에서 요약된 것을 포함하나 이에 제한되지 않는 코로나바이러스 스파이크 단백질의 야생형 아미노산 서열의 다양한 특징 및 돌연변이는 다양한 조합 및 하위조합에서 발견될 수 있음을 이해해야 한다.
표 1. 코로나바이러스 스파이크 단백질의 아미노산 서열에서 발견되는 예시적인 특징(SEQ ID NO:1에 관해).
융합 단백질의 일부 구현예는 코로나바이러스 스파이크 단백질의 인공적으로 변형된 아미노산 서열 또는 이의 일부를 함유할 수 있다. 일부 비제한적인 예에서, 인공적으로 변형된 아미노산 서열은 비제한적으로 본 개시에 논의된 것들과 같은 코로나바이러스 스파이크 단백질 서열의 야생형 아미노산 서열의 하나 이상의 특징을 포함할 수 있다. 일부 예시적인 구현예에서, 코로나바이러스 스파이크 단백질 서열의 야생형 아미노산 서열의 특징은 자연 발생 서열에서 발견되지 않는 방식으로 조합될 수 있다. 예를 들어, 코로나바이러스 스파이크 단백질의 인공적으로 변형된 아미노산 서열 또는 이의 일부는 비제한적으로 변이체 D614G, B.1.1.7, B.1.429, B.1.351, P1 및 B.1.617.2와 같은 2개 이상의 자연적으로 순환하는 SARS-CoV-2 변이체 각각의 하나 이상의 특징을 포함할 수 있다. 이러한 인공적으로 변형된 서열의 일부 다른 비제한적인 예는 코로나바이러스 스파이크 단백질의 S1 도메인의 인공적으로 변형된 아미노산 서열; 코로나바이러스 스파이크 단백질의 RBD 도메인의 인공적으로 변형된 아미노산 서열; 또는 하나 이상의 C-말단, N-말단 또는 중간 부분이 결실된 코로나바이러스 스파이크 단백질의 인공적으로 변형된 아미노산 서열, 예를 들어, HR2 아미노산 서열을 포함하는 C-말단이 결실된 코로나바이러스 스파이크 단백질의 인공적으로 변형된 아미노산 서열이다. 융합 단백질의 일부 예시적인 구현예는 HR2 아미노산 서열을 포함하는 S2 도메인에서 C-말단이 결실된 자연 발생 또는 인공적으로 변형된 코로나바이러스 스파이크 단백질 아미노산 서열을 포함한다. 예를 들어, 코로나바이러스 스파이크 단백질 아미노산 서열은 HR2 아미노산 서열의 결실 또는 S2 도메인의 C-말단 아미노산의 70개 이하, 60개 이하 또는 50개 이하, 예를 들어, 50 내지 70개의 결실을 포함할 수 있다. 코로나바이러스 스파이크 단백질의 인공적으로 변형된 아미노산 서열은 야생형 서열과 비교하여 다양한 아미노산 변형을 포함할 수 있다. 예를 들어, 코로나바이러스 스파이크 단백질의 인공적으로 변형된 아미노산 서열은 글리코실화 부위를 제거하거나 첨가하는 돌연변이를 포함할 수 있다. 또 다른 예에서, 코로나바이러스 스파이크 단백질의 인공적으로 변형된 아미노산 서열은 푸린 인식 부위와 같은 프로테아제 인식 부위를 제거하는 하나 이상의 돌연변이를 포함할 수 있다. 또 다른 예에서, 코로나바이러스 스파이크 단백질의 인공적으로 변형된 아미노산 서열은 예비-융합 입체형태에서 스파이크 도메인을 안정화시키는 돌연변이와 같이 스파이크 도메인의 입체형태에 영향을 미치는 하나 이상의 돌연변이를 포함할 수 있다. 야생형 SARS-CoV-2 스파이크 단백질 서열의 일부 예시적인 변형은, 예를 들어, 문헌[Amanat et al., 2020 and Hhsieh et al., 2020]에 기재되어 있다. 문헌[Amanat et al., 2020]에 기재된 SEQ ID NO:3은 푸린 절단 부위 PRAR 서열이 알라닌(SEQ ID NO 1 및 3의 잔기 667)으로 돌연변이되고 SEQ ID NO:1의 잔기 968 및 969에서 프롤린 치환을 갖는 인공적으로 변형된 SARS-CoV-2 스파이크 단백질 서열이다. 문헌[Hhsieh et al., 2020]에 기재된 SEQ ID NO:14는 6개의 프롤린 치환 F817P, A892P, A899P, A942P(모두 SEQ ID NO:1에 대해 표시됨), 및 SEQ ID NO:1의 잔기 968 및 969에서 프롤린 치환을 갖는 인공적으로 변형된 SARS-CoV-2 스파이크 단백질 서열("HexaPro")이다.
인공적으로 변형된 SARS-CoV-2 스파이크 단백질 서열 - SEQ ID NO:3; PRAR 푸린 절단 부위에서 알라닌으로 돌연변이 및 프롤린 치환은 굵게 표시됨
인공적으로 변형된 SARS-CoV-2 스파이크 단백질 서열 "HexaPro" - SEQ ID NO:14; 프롤린 치환은 굵게 표시됨
일부 구현예에서, 본원에 제공된 바와 같은 융합 단백질에 포함된 코로나바이러스의 스파이크 단백질의 아미노산 서열은 SARS-CoV-2 스파이크 단백질 아미노산 서열의 야생형 또는 인공적으로 변형된 아미노산 서열과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열이다. 일부 구현예에서, 본원에 제공된 바와 같은 융합 단백질에 포함된 코로나바이러스의 스파이크 단백질의 아미노산 서열은 SARS-CoV-2 스파이크 단백질 아미노산 서열의 야생형 또는 인공적으로 변형된 아미노산 서열의 일부와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열이다. 일부 경우에, 본원에 제공된 바와 같은 융합 단백질에 포함된 코로나바이러스의 스파이크 단백질은 하나 이상의 아미노산 잔기 치환을 포함하는 보존적으로 변형된 변이체 스파이크 단백질이다. 일부 경우에, 본원에 제공된 바와 같은 융합 단백질에 포함된 코로나바이러스의 스파이크 단백질은 단백질의 C-말단, N-말단 및/또는 중간 부분에서 하나 이상의 아미노산 잔기의 결실을 포함한다. 일부 경우에, 결실은 하나 이상의 연속 아미노산 잔기를 포함할 수 있다. 일부 경우에, 결실은 하나 이상의 비연속 아미노산 잔기를 포함할 수 있다. 일부 경우에, 스파이크 단백질은 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 아미노산 잔기의 결실을 포함할 수 있다. 일부 경우에, 스파이크 단백질은 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 또는 100개의 아미노산 잔기의 결실, 예를 들어, 10-15, 15-30, 25-50, 10-50 또는 50-100개의 아미노산 잔기의 결실을 포함할 수 있다. 예를 들어, 본원에 제공된 바와 같은 융합 단백질에 포함된 코로나바이러스의 스파이크 단백질의 아미노산 서열은 SEQ ID NO:1의 잔기 15 내지 1146, SEQ ID NO:1의 잔기 15 내지 1213 또는 SEQ ID NO:1의 잔기 1 내지 1146과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 서열 동일성을 갖는 서열일 수 있다. 일부 구현예에서, 본원에 제공된 바와 같은 융합 단백질에 포함된 코로나바이러스의 스파이크 단백질의 아미노산 서열은 SEQ ID NO:3과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 서열 동일성을 갖는 서열이다. 일부 구현예에서, 본원에 제공된 바와 같은 융합 단백질에 포함된 코로나바이러스의 스파이크 단백질의 아미노산 서열은 SEQ ID NO:4와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 서열 동일성을 갖는 서열이다. 일부 구현예에서, 본원에 제공된 바와 같은 융합 단백질에 포함된 코로나바이러스의 스파이크 단백질의 아미노산 서열은 SEQ ID NO:14와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 서열 동일성을 갖는 서열이다. 일부 구현예에서, 본원에 제공된 바와 같은 융합 단백질에 포함된 코로나바이러스의 스파이크 단백질의 아미노산 서열은 SEQ ID NO:15와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 서열 동일성을 갖는 서열이다.
인공적으로 변형된 부분 SARS-CoV-2 스파이크 단백질 서열 - SEQ ID NO:4
인공적으로 변형된 부분 SARS-CoV-2 스파이크 단백질 서열 - SEQ ID NO:15
본 발명의 구현예에 따른 융합 단백질은 페리틴 서브유닛 폴리펩티드의 아미노산 서열("페리틴 아미노산 서열")을 포함한다. 페리틴 아미노산 서열은 전장, 단일 페리틴 폴리펩티드의 아미노산 서열, 또는 단량체 페리틴 서브유닛의 올리고머로의 자가-조립을 지시할 수 있는 페리틴 아미노산 서열의 임의의 부분일 수 있다. 페리틴 아미노산 서열을 포함하는 융합 단백질은, 예를 들어, 미국 특허 번호 7,097,841에 기재되어 있다. 임의의 페리틴 단백질의 단량체 페리틴 서브유닛의 아미노산 서열 또는 이의 일부는 단량체 페리틴 서브유닛이 올리고머 또는 나노입자로 자가-조립될 수 있는 한 본 개시의 융합 단백질을 생산하는데 사용될 수 있다. 올리고머 또는 나노입자로 자가-조립되는 능력에 영향을 미치지 않으면서 페리틴 단백질의 아미노산 서열에서 변형이 이루어질 수 있다. 이러한 변형은 아미노산 잔기의 삽입, 아미노산 잔기의 결실 또는 아미노산 잔기의 치환을 포함한다. 예를 들어, 본 발명의 구현예에 따른 융합 단백질에 포함된 단량체 페리틴 서브유닛의 서열은 포유동물 페리틴 아미노산 서열로부터 유래될 수 있지만, 자연 발생 서열로부터 충분히 분기될 수 있으므로, 포유동물 페리틴 아미노산 서열이 유래된 종의 포유동물 대상체에게 면역원으로서 투여될 때, 이는 포유동물의 자연 페리틴 단백질과 반응하는 항체의 생산을 초래하지 않는다. 페리틴 아미노산 서열은 박테리아 페리틴 단백질, 식물 페리틴 단백질, 조류 페리틴 단백질, 곤충 페리틴 단백질, 진균 페리틴 단백질 및/또는 포유동물 페리틴 단백질로부터 유래될 수 있다. 본 개시의 융합 단백질의 일부 구현예에서, 페리틴 아미노산 서열은 H. 파일로리로부터 유래된다. 예를 들어, 본원에 제공된 바와 같은 융합 단백질에 포함된 페리틴 아미노산 서열은 SEQ ID NO:2와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 서열 동일성을 갖는 서열일 수 있거나 서열로부터 유래될 수 있다. 위에서 논의된 바와 같이, 본 발명의 구현예에 따른 융합 단백질은 H. 파일로리의 페리틴 서브유닛 폴리펩티드의 전장 서열을 포함할 필요가 없다. 단량체 페리틴 서브유닛의 올리고머로의 자가-조립을 지시하는 아미노산 서열을 함유하는 H. 파일로리 페리틴 서브유닛 폴리펩티드의 일부 또는 영역이 사용될 수 있다. 이러한 영역의 한 예는 아미노산 서열 H. 파일로리 페리틴 단백질의 아미노산 5와 168 사이에 위치한다. 더 많은 영역은 문헌[Zhang, 2011]에 개시되어 있다.
본 발명의 구현예에 따른 융합 단백질에 포함된 페리틴 아미노산 서열은 인공 글리코실화 부위, 예를 들어, 인공 (조작된) N-글리코실화 부위를 포함할 수 있으며, 이는 페리틴 아미노산 서열에 인공 돌연변이를 삽입하여 공통 글리코실화 서열을 생성하도록 조작된다. 예를 들어, 페리틴 핵산 서열에 공통 서열 NXS/T(여기서 X는 P일 수 없음)를 도입함으로써 인공 N-글리코실화 부위가 생성될 수 있다. 공통 글리코실화 서열은 페리틴 아미노산 서열에서 아미노산 잔기의 인공 치환에 의해 생성될 수 있다. 예를 들어, SEQ ID NO:2의 인공 N-글리코실화 부위는 2개의 아미노산 치환을 도입함으로써 생성될 수 있다: SEQ ID NO:2의 위치 75에 상응하는 위치에서 K에서 N, 그리고 SEQ ID NO:2의 위치 75에 상응하는 위치에서 E에서 T. 또 다른 예에서, SEQ ID NO:2의 인공 N-글리코실화 부위는 2개의 아미노산 치환을 도입함으로써 생성될 수 있다: SEQ ID NO:2의 위치 67에 상응하는 위치에서 T에서 N, 그리고 SEQ ID NO:2의 위치 69에 상응하는 위치에서 I에서 T. 또 다른 예에서, SEQ ID NO:2의 인공 N-글리코실화 부위는 2개의 아미노산 치환을 도입함으로써 생성될 수 있다: SEQ ID NO:2의 위치 74에 상응하는 위치에서 H에서 N, 그리고 SEQ ID NO:2의 위치 76에 상응하는 위치에서 F에서 T. 또 다른 예에서, SEQ ID NO:2의 인공 N-글리코실화 부위는 2개의 아미노산 치환을 도입함으로써 생성될 수 있다: SEQ ID NO:2의 위치 143에 상응하는 위치에서 E에서 N, 그리고 SEQ ID NO:2의 위치 145에 상응하는 위치에서 H에서 T.
본 발명에 따른 융합 단백질의 구현예는 페리틴 서브유닛 폴리펩티드의 아미노산 서열의 적어도 25개의 인접 아미노산, 적어도 50개의 인접 아미노산, 적어도 75개의 인접 아미노산, 적어도 100개의 인접 아미노산 또는 적어도 150개의 인접 아미노산에 연결된 SARS-CoV-2와 같은 코로나바이러스의 스파이크 단백질의 아미노산 서열(예를 들어, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:14 또는 SEQ ID NO:15와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열)을 포함한다. 본 발명에 따른 융합 단백질의 구현예에서, 페리틴 서브유닛 폴리펩티드의 아미노산 서열은 코로나바이러스의 스파이크 단백질의 아미노산 서열 뒤에(즉, 스파이크 단백질 아미노산 서열에 대해 하류 또는 C' 말단) 위치한다. 페리틴 서브유닛 폴리펩티드의 아미노산 서열의 존재로 인해, 본 발명의 구현예에 따른 융합 단백질은 나노입자로 조립되며, 이는 본 개시의 다른 곳에서 더 상세히 기술된다. 융합 단백질의 일부 구현예에서, 코로나바이러스의 스파이크 단백질의 아미노산 서열은 H. 파일로리의 페리틴 서브유닛 폴리펩티드의 아미노산 서열의 적어도 25개의 인접 아미노산, 적어도 50개의 인접 아미노산, 적어도 75개의 인접 아미노산, 적어도 100개의 인접 아미노산 또는 적어도 150개의 인접 아미노산에 연결된다. 본 발명의 구현예에 따른 융합 단백질에 포함된 H. 파일로리의 페리틴 서브유닛 폴리펩티드의 아미노산 서열은 SEQ ID NO:2와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97%, 적어도 98% 또는 적어도 99% 서열 동일성을 가질 수 있다. 본 발명의 구현예에 따른 융합 단백질에 포함된 H. 파일로리의 페리틴 서브유닛 폴리펩티드의 아미노산 서열은 올리고머 또는 나노입자로 자가-조립되는 융합 단백질을 생성한다.
본 발명에 따른 융합 단백질의 일부 구현예에서, 코로나바이러스의 스파이크 단백질의 아미노산 서열 및 페리틴 서브유닛 폴리펩티드의 아미노산 서열은 "링커" 아미노산 서열에 의해 연결된다. 펩티드 링커는, 예를 들어, 2 내지 5개, 2 내지 10개, 2 내지 20개, 2 내지 30개, 2 내지 40개, 2 내지 50개 또는 2 내지 60개 이상의 아미노산 길이, 예를 들어, 2개 아미노산, 3개 아미노산, 4개 아미노산, 5개 아미노산, 10개 아미노산, 15개 아미노산, 25개 아미노산, 35개 아미노산, 45개 아미노산, 50개 아미노산 또는 60개 아미노산일 수 있다. 길이에 따라, 링커 서열은 나선형, β-가닥, 코일/굽힘, 및 회전과 같은 2차 구조에서 다양한 입체형태를 가질 수 있다. 일부 경우에, 링커 서열은 확장된 입체형태를 가질 수 있고 인접한 단백질 도메인과 상호작용하지 않는 독립적인 도메인으로서 기능할 수 있다. 링커 서열은 강성이거나 가요성일 수 있다. 가요성 링커 서열은 융합 단백질의 도메인에 의해 채택될 수 있는 배향의 범위를 증가시킬 수 있다. 강성 링커는 도메인 사이에 고정된 거리를 유지하고 독립적인 기능을 유지하는데 도움이 되도록 사용될 수 있다. 융합 단백질에 대한 링커 서열은, 예를 들어, 문헌[Chen et al., 2013]에 설명되어 있다. 일부 구현예에서, 링커는 아미노산 서열 SGG, GSG, GG, GSGG(SEQ ID NO:5), NGTGGSG(SEQ ID NO:6), G, 또는 GGGGS(SEQ ID NO:7)이거나 이를 포함한다. 융합 단백질의 예시적인 구현예에서, SEQ ID NO:3 또는 SEQ ID NO:4와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 서열 동일성을 갖는 스파이크 단백질 아미노산 서열은 아미노산 서열 SGG, GSG, GG, GSGG(SEQ ID NO:5), NGTGGSG(SEQ ID NO:6), G, 또는 GGGGS(SEQ ID NO:7)을 갖거나 포함하는 링커에 의해 SEQ ID NO:2와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 서열 동일성을 갖는 페리틴 서브유닛 폴리펩티드의 아미노산 서열에 연결된다.
본 개시에 기재된 융합 단백질은 단백질 분리에 유용한 도메인 또는 서열을 포함할 수 있다. 일부 구현예에서, 폴리펩티드는 친화성 태그, 몇 개의 예를 들면, 예를 들어, AviTag™, Myc 태그, 폴리히스티딘 태그(예를 들어, 8XHis 태그), 알부민-결합 단백질, 알칼리 포스파타제, AU1 에피토프, AU5 에피토프, 비오틴-카르복시 담체 단백질(BCCP) 또는 FLAG 에피토프를 포함한다. 일부 구현예에서, 친화성 태그는 단백질 분리에 유용하다. 예를 들어, 문헌[Kimple et al., 2013]을 참조한다. 일부 구현예에서, 폴리펩티드 또는 단백질은 단백질 분리에 유용한 신호 서열, 예를 들어, 분비를 촉진하고 단백질 분리를 용이하게 하는 돌연변이된 인터루킨-2 신호 펩티드 서열을 포함한다. 예를 들어, 문헌[Low et al., 2013]을 참조한다. 일부 구현예에서, 융합 단백질은 프로테아제 인식 부위, 예를 들어, TEV 프로테아제 절단 부위를 포함할 수 있고, 이는 무엇보다도 융합 단백질 분리 후 신호 펩티드 또는 친화성 정제 태그의 제거에 유용할 수 있다.
본 개시에 기재된 융합 단백질의 일부 구현예는, 예를 들어, 발현 후 세포로부터 융합 단백질의 분비를 촉진하기 위해 코로나바이러스 신호 서열을 포함할 수 있다. 예를 들어, 일부 구현예에서, 코로나바이러스 스파이크 단백질 아미노산 서열 앞에 천연 코로나바이러스 신호 서열이 올 수 있다. 예시적인 구현예에서, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:14 또는 SEQ ID NO:15와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 서열 동일성을 갖는 스파이크 단백질 아미노산 서열 앞에 "신호 서열"로 지칭될 수 있는 천연 코로나바이러스 신호 서열 MFVFLVLLPLVSSQ(SEQ ID NO:8), MFVFLVLLPLVS(SEQ ID NO:31) 또는 MFVFLVLLPLVSS(SEQ ID NO:32)가 올 수 있다. 신호 서열은 스파이크 단백질 아미노산 서열 바로 앞에 있을 수 있거나, 신호 서열과 스파이크 단백질 아미노산 서열 사이에 링커 또는 스페이서 서열이 있을 수 있다. 본 발명의 구현예에 따른 융합 단백질의 아미노산 서열의 일부 예는 SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:33 또는 SEQ ID NO:34와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 서열 동일성을 갖는 서열이다. 본 발명의 구현예에 따른 융합 단백질의 아미노산 서열의 일부 예는 N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:12, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:13, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:16, SEQ ID NO:17, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:18, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:21, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:22, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:23, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:24, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:25, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:26, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:27, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:28, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:29, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:30, N-말단 신호 서열(SEQ ID NO:31)이 없는 SEQ ID NO:33 또는 N-말단 신호 서열(SEQ ID NO:32)이 없는 SEQ ID NO:34와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 서열 동일성을 갖는 서열이다.
코로나바이러스의 스파이크 단백질의 아미노산 서열 및 페리틴 서브유닛 폴리펩티드의 아미노산 서열을 포함하는 융합 단백질을 포함하는 나노입자가 본 개시에 제공되고 본 발명의 구현예에 포함된다. 본 발명의 구현예에 따른 융합 단백질은 페리틴 서브유닛 폴리펩티드의 아미노산 서열을 포함한다는 사실로 인해 올리고머로 자가-조립할 수 있다. 이러한 자가-조립에 의해 생성되는 올리고머 구조 또는 초분자를 나노입자라고 한다. 본 발명의 예시적인 구현예는 본 개시에 기술된 바와 같은 융합 단백질의 올리고머를 포함하는 나노입자이다.
본 발명의 구현예에 따른 나노입자는 24개의 융합 단백질 서브유닛을 포함할 수 있고 432개의 대칭성을 가질 수 있다. 본 발명의 구현예에 따른 나노입자는 표면에 스파이크 단백질의 적어도 일부를 삼량체로 나타낸다. 즉, 본 발명의 구현예에 따른 나노입자는 코로나바이러스 스파이크 단백질의 표면에 노출된 삼량체를 포함한다. 나노입자는 코로나바이러스 스파이크 단백질의 표면에 노출된 8개의 삼량체를 포함할 수 있다. 나노입자가 대상체에게 투여되면 코로나바이러스 스파이크 단백질 삼량체의 표면에 노출된 삼량체는 대상체의 면역 시스템에 접근할 수 있으므로 코로나바이러스 스파이크 단백질에 대한 면역 반응을 유도할 수 있다. 페리틴 아미노산 서열을 포함하는 융합 단백질로 구성된 면역원성 나노입자는, 예를 들어, 문헌[U.S. Patent Nos. 9,441,19 and 10,137,190, Kanekiyo et al., 2013, Kanekiyo et al., 2015, and He et al., 2016]에 기술되어 있다.
핵산, 벡터, 세포 및 관련 방법
본 발명의 구현예 및 본 개시의 다른 곳에 기술된 융합 단백질을 인코딩하는 핵산이 본 개시에 제공되고 본 발명의 구현예에 포함된다. 본 발명의 구현예에 따른 핵산은 코로나바이러스의 스파이크 단백질("코로나바이러스 스파이크 단백질")의 아미노산 서열 및 페리틴 서브유닛 폴리펩티드("페리틴"으로 간단히 지칭될 수 있음)의 아미노산 서열의 융합 단백질을 인코딩한다. 본 발명의 구현예에 따른 핵산은 DNA 또는 RNA일 수 있다. 본 개시에 기술된 핵산은 본 발명의 구현예에 따른 융합 단백질 및 나노입자를 생산하기 위해 사용될 수 있다. 예를 들어, 본 개시에 기술된 핵산은 코로나바이러스, 예를 들어, 비제한적으로 SARS-CoV-2에 대한 면역원성 조성물 또는 백신으로서 사용될 융합 단백질 또는 나노입자를 생성하기 위해 본 발명의 구현예에 따른 융합 단백질 및 나노입자를 생산하는데 사용될 수 있다. 또 다른 예에서, 본 개시에 기술된 핵산은 핵산 백신으로 사용될 수 있으며, 이는 대상체에서 SARS-CoV-2를 포함하나 이에 제한되지 않는 코로나바이러스에 대한 보호 면역 반응을 유도하기 위해, 대상체에서 본 발명의 구현예에 따른 융합 단백질 및 나노입자를 생산할 목적으로 대상체에게 투여된다. 본 발명의 구현예에 따른 핵산을 사용하는 방법은 본 개시의 다른 곳에 기술되어 있다.
본 개시에 기술된 융합 단백질을 인코딩하는 핵산의 구현예는 페리틴 서브유닛 폴리펩티드의 아미노산 서열의 적어도 25개의 인접 아미노산, 적어도 50개의 인접 아미노산, 적어도 75개의 인접 아미노산, 적어도 100개의 인접 아미노산 또는 적어도 150개의 인접 아미노산에 연결된 SARS-CoV-2와 같은 코로나바이러스의 스파이크 단백질의 아미노산 서열(예를 들어, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:14 또는 SEQ ID NO:15와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열)을 포함하는 융합 단백질을 인코딩한다. 본 개시에 기술된 융합 단백질을 인코딩하는 핵산의 일부 구현예는 SARS-CoV-2와 같은 코로나바이러스의 스파이크 단백질의 아미노산 서열(예를 들어, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:14 또는 SEQ ID NO:15와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열)이 SEQ ID NO:2와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97%, 적어도 98% 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열과 같은 H. 파일로리의 페리틴 서브유닛 폴리펩티드의 적어도 25개의 인접 아미노산, 적어도 50개의 인접 아미노산, 적어도 75개의 인접 아미노산, 적어도 100개의 인접 아미노산 또는 적어도 150개의 인접 아미노산에 연결된 융합 단백질을 인코딩한다. 본 개시에 기술된 핵산의 일부 예는 SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:12, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:13, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:16, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:17, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:18, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:21, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:22, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:23, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:24, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:25, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:26, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:27, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:28, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:29, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:30, N-말단 신호 서열(SEQ ID NO:31)이 없는 SEQ ID NO:33 또는 N-말단 신호 서열(SEQ ID NO:32)이 없는 SEQ ID NO:34와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열을 갖는 융합 단백질을 인코딩한다.
본원에 제공된 핵산 서열을 포함하는 핵산 작제물이 또한 본 개시에 제공되고 본 발명의 구현예에 포함된다. 핵산 작제물의 일부 구현예는 본 발명의 구현예에 따른 융합 단백질을 인코딩하는 정제된 핵산 분자이다. 예를 들어, 핵산 작제물은 본 발명의 구현예에 따른 융합 단백질을 인코딩하는 핵산에 작동 가능하게 연결된 프로모터를 포함하는 조작된 (재조합) DNA 핵산 서열일 수 있다. 핵산 서열은 다른 핵산 서열과 기능적 관계에 놓일 때 "작동 가능하게 연결된" 것이다. 프로모터는 전사를 개시하기 위해 RNA 폴리머라제 및 다른 단백질의 인식 및 결합에 관여하는 전사 시작부터 상류 및/또는 하류에 위치한 영역 또는 서열이다. 프로모터는 일반적으로 전사 시작 부위에 대해 비교적 고정된 위치에 있을 때 기능하는 핵산 서열 또는 서열들이다. 프로모터는 RNA 폴리머라제와 전사 인자의 기본적인 상호작용에 필요한 핵심 요소를 포함하며, 상류 요소 및 반응 요소를 포함할 수 있다. 본 발명의 구현예에 따른 핵산 작제물에 포함된 프로모터는 진핵 또는 원핵 프로모터일 수 있다. 일부 구현예에서, 프로모터는 유도성 프로모터이다. 일부 구현예에서, 프로모터는 항시적 프로모터이다. 본 발명의 구현예에 따른 핵산 작제물에 포함된 프로모터는 관심 숙주 세포 또는 숙주 유기체에서 본 개시에 기술된 융합 단백질을 인코딩하는 핵산 서열의 발현을 지시하거나 구동할 수 있다. 본 발명의 구현예에 따른 핵산 작제물을 제조하기 위해, 핵산은 적당한 배향 및, 적절한 경우, 적당한 리딩 프레임에서 핵산 서열을 제공하도록 조작될 수 있다. 이를 위해, 핵산 단편을 결합하기 위해 어댑터 또는 링커가 사용되거나 편리한 제한 부위, 불필요한 핵산 서열 제거, 제한 부위 제거 등을 제공하기 위해 다른 조작이 수반될 수 있다. 이러한 목적을 위해, 시험관 내 돌연변이 유발, 프라이머 복구, 제한, 어닐링, 전이 및 전환과 같은 재치환이 포함될 수 있다.
본 발명의 구현예에 따른 핵산은 관심 숙주 세포 또는 유기체에서 핵산에 의해 인코딩되는 융합 단백질의 발현을 위한 발현 카세트에 포함될 수 있다. 일부 구현예에서, 본 발명의 구현예에 따른 핵산은 관심 숙주 세포 또는 유기체에서의 발현을 위해 코돈-최적화될 수 있다. 발현 카세트는 본 발명의 구현예에 따른 융합 단백질을 인코딩하는 핵산에 작동 가능하게 연결된 5' 및 3' 조절 서열을 포함할 수 있다. 발현 카세트는 또한 다른 폴리펩티드 또는 단백질을 인코딩하는 핵산 서열을 포함할 수 있다. 발현 카세트는 다양한 핵산 서열을 발현 카세트로 삽입하기 위한 및/또는 발현 카세트를 벡터와 같은 다른 핵산으로 삽입하기 위한 복수의 제한 부위 및/또는 재조합 부위를 포함할 수 있다. 발현 카세트는 다양한 조절 영역 또는 서열, 예를 들어, 전사 개시 시작 부위, 작동자, 활성자, 인핸서, 다른 조절 요소, 리보솜 결합 부위, 개시 코돈, 종결 신호 등을 포함할 수 있으나 이에 제한되지 않는다. 발현 카세트에 포함된 예시적인 조절 서열은 프로모터, 전사 조절 영역 및/또는 번역 종결 영역이며, 이는 숙주 세포 또는 숙주 유기체, 또는 서로에 대해 내인성 또는 이종성일 수 있다. 이와 관련하여, "이종성"은 숙주 세포 또는 숙주 유기체에서 기원하지 않거나 숙주 세포 또는 숙주 유기체에서 발생하는 이의 형태로부터 실질적으로 변형된 핵산 서열을 의미한다. 발현 카세트는 또한 발현 카세트를 포함하는 숙주 세포의 선택을 위한 하나 이상의 선택 가능한 마커 유전자를 포함할 수 있다. 마커 유전자는, 몇 개의 예를 들면, 하이그로마이신 내성, 암피실린 내성, 젠타마이신 내성, 네오마이신 내성을 부여하는 것과 같은 항생제 내성을 부여하는 유전자를 포함하나 이에 제한되지 않는다. 추가적인 선택 가능한 마커가 알려져 있으며 임의의 마커를 사용할 수 있다. 예시적인 발현 카세트는 5'에서 3' 방향으로 관심 숙주 세포 또는 숙주 유기체에서 기능적인 전사 및 번역 개시 영역(프로모터 포함), 본 개시에 기재된 융합 단백질을 인코딩하는 핵산 서열, 및 전사 및 번역 종결 영역을 포함할 수 있다.
본 발명의 구현예에 따른 핵산 또는 핵산 작제물을 포함하는 벡터도 본 발명의 구현예에 포함된다. 이러한 벡터는 벡터에 포함된 핵산 서열의 전사를 지시하고 조절하는 필수 기능적 요소를 포함할 수 있다. 이러한 기능적 요소는 프로모터, 프로모터의 전사 활성을 조절할 수 있는 인핸서와 같은 프로모터의 상류 또는 하류 영역, 복제 기점, 프로모터에 인접한 삽입물의 클로닝을 용이하게 하는 적절한 제한 부위, 벡터 또는 삽입물을 포함하는 벡터를 포함하는 세포를 선택하는 역할을 할 수 있는 항생제 내성 유전자 또는 다른 마커, RNA 스플라이스 접합부, 전사 종결 영역, 또는 삽입된 유전자 또는 하이브리드의 발현을 촉진하는 역할을 할 수 있는 임의의 다른 영역을 포함하나 이에 제한되지 않는다. 예를 들어, 벡터는 플라스미드일 수 있다.
본 발명의 구현예에 따른 벡터는 박테리아 발현 벡터와 같은 박테리아 벡터일 수 있다. 예를 들어, 수많은 E. 콜리(E. coli) 발현 벡터 중 하나에 기초한 벡터는 본 발명의 구현예에 따른 핵산 발현에 유용할 수 있다. 본 발명의 구현예에 따른 핵산의 발현에 적합한 다른 박테리아 숙주는 바실러스 서브틸리스(Bacillus subtilis)와 같은 바실러스, 및 살모넬라(Salmonella), 세나티아(Senatia) 및 다양한 슈도모나스(Pseudomonas) 종과 같은 다른 장내세균과를 포함한다. 이러한 원핵 숙주에서, 숙주 세포와 호환되는 발현 제어 서열(예를 들어, 복제 기점)을 전형적으로 포함하는 적합한 발현 벡터도 사용할 수 있다. 락토스 프로모터 시스템, 트립토판(Trp) 프로모터 시스템, 베타-락타마제 프로모터 시스템 또는 파지 람다로부터의 프로모터 시스템과 같은 임의의 수의 다양한 잘 알려진 프로모터가 박테리아 발현 벡터에 사용될 수 있다.
효모 세포, 포유동물 세포 및 곤충 세포를 포함하나 이에 제한되지 않는 진핵 세포가 또한 폴딩 및 시스테인 쌍 형성, 복잡한 탄수화물 구조의 추가 및 활성 단백질의 분비와 같은 중요한 번역 후 변형을 선호하는 환경에서 단백질의 발현을 허용한다. 따라서, 효모 세포, 포유동물 세포 및 곤충 세포에서 본 개시에 기재된 핵산의 발현에 유용한 벡터가 또한 구상되고 본 발명의 구현예에 포함된다. 본 발명의 구현예에 따른 벡터는 비제한적으로 피치아 파스토리스(Pichia pastoris) 또는 사카로마이세스 세레비지에(Saccharomyces cerevisiae)의 세포와 같은 효모 세포에서 본 발명의 구현예에 따른 핵산의 발현에 적합한 효모 발현 벡터일 수 있다. 진핵 세포에서 사용되는 발현 벡터는 전사 종결에 필요한 서열을 포함할 수 있다. 이러한 영역은 mRNA의 번역되지 않은 부분에서 폴리아데닐화 세그먼트로서 전사된다. 따라서, 진핵 발현 벡터에 포함된 전사 단위는 폴리아데닐화 영역을 포함할 수 있다. 이 영역의 한 가지 이점은 전사된 단위가 mRNA처럼 처리되고 운반될 가능성을 증가시킨다는 것이다. 3' 비번역 영역도 전사 종결 부위를 포함한다. 진핵 세포용 발현 벡터는 인핸서와 같은 발현 제어 서열, 및 리보솜 결합 부위, RNA 스플라이스 부위 등과 같은 필수 정보 처리 부위를 포함할 수 있다.
본 발명의 구현예에 따른 발현 벡터는 또한 테트라사이클린 유도성 프로모터 또는 글루코코르티코이드 유도성 프로모터와 같은 유도성 프로모터의 제어 하에 본 개시에 기재된 핵산을 포함할 수 있다. 본 발명의 핵산은 또한 특정 세포, 조직 또는 기관에서 핵산의 발현을 촉진하기 위해 조직-특이적 프로모터의 제어 하에 있을 수 있다. 메탈로티오네인 프로모터, 열-충격 프로모터 및 다른 조절 가능한 프로모터와 같은 임의의 조절 가능한 프로모터가 또한 고려된다. 또한, Cre-loxP 유도성 시스템뿐만 아니라 Flp 재조합효소 유도성 프로모터 시스템도 사용될 수 있다.
일부 구현예에서, 본 발명의 구현예에 따른 융합 단백질을 인코딩하는 핵산은 숙주 세포 또는 숙주 유기체로의 전달을 위해 바이러스 벡터에 통합될 수 있다. 따라서, 본 발명의 구현예에 따른 벡터는 본 개시에 기재된 융합 단백질을 인코딩하는 핵산을 분해 없이 세포 내로 수송하는 바이러스 벡터를 포함하고, 전달되는 세포에서 핵산을 발현시키는 프로모터를 포함한다. 적합한 바이러스 벡터는 아데노바이러스 벡터, 아데노-관련 바이러스(AAV) 벡터, 헤르페스 바이러스 벡터, 레트로바이러스 벡터, 폭스바이러스 벡터 또는 렌티바이러스 벡터를 포함한다. 이러한 벡터를 작제하고 사용하는 방법은 잘 알려져 있다. 전형적으로, 바이러스 벡터는 비구조적 초기 유전자, 구조적 후기 유전자, RNA 폴리머라제 III 전사체, 복제 및 캡슐화에 필요한 역 말단 반복, 및 바이러스 게놈의 전사 및 복제를 제어하는 프로모터를 포함한다. 벡터로서 조작될 때, 바이러스는 전형적으로 초기 유전자 중 하나 이상을 제거하고 제거된 바이러스 DNA 대신 유전자 또는 유전자/프로모터 카세트를 바이러스 게놈에 삽입한다. 제거된 초기 유전자의 필요한 기능은 전형적으로 초기 유전자의 유전자 생성물을 트랜스로 발현하도록 조작된 세포주에 의해 공급된다.
예를 들어, 폭스 패밀리 바이러스의 재조합 바이러스는 본 발명의 구현예에 따른 핵산 분자를 숙주 세포 또는 숙주 유기체로 전달하기 위한 벡터로 사용될 수 있다. 여기에는 백시니아 바이러스와 조류 폭스바이러스, 예를 들어, 조류폭스 및 카나리폭스 바이러스가 포함된다. 재조합 폭스 바이러스를 생산하는 방법은 알려져 있다. 재조합 폭스 바이러스의 대표적인 예는 ALVAC, TROVAC 및 NYVAC를 포함한다. 또 다른 예에서, 아데노바이러스 벡터는 본 발명의 구현예에 따른 핵산 분자를 숙주 세포 또는 숙주 유기체로 전달하기 위해 사용될 수 있다. 또 다른 예에서, 아데노-관련 바이러스(AAV) 벡터 시스템은 본 발명의 구현예에 따른 핵산 분자를 숙주 세포 또는 숙주 유기체로 전달하기 위해 사용될 수 있다. 또 다른 예에서, 레트로바이러스 벡터는 본 발명의 구현예에 따른 핵산 분자를 숙주 세포 또는 숙주 유기체로 전달하기 위해 사용될 수 있다. 레트로바이러스 벡터의 예는 뮤린 말로니 백혈병 바이러스(MMLV)에 기초한 벡터, 및 벡터로서 MMLV의 바람직한 특성을 발현하는 레트로바이러스를 포함하나 이에 제한되지 않는다. 또 다른 예에서, 아데노바이러스 키메라 벡터와 같은 분자 컨쥬게이트 벡터는 본 발명의 구현예에 따른 핵산 분자를 숙주 세포 또는 숙주 유기체로 전달하기 위해 사용될 수 있다. 비제한적으로 Sindbis, Semliki Forest 및 베네수엘라 말 뇌염 바이러스와 같은 알파바이러스 속의 구성원에서 유래된 벡터는 또한 본 발명의 구현예에 따른 핵산 분자를 숙주 세포 또는 숙주 유기체로 전달하기 위해 사용될 수 있다.
본 발명의 구현예에 따른 핵산, 핵산 작제물 또는 벡터를 포함하는 세포가 또한 본 개시에 제공되고 본 발명의 구현예에 포함된다. 이러한 세포는 "숙주 세포들"(또는 단수로 "숙주 세포")로 지칭될 수 있다. 일부 숙주 세포는 본 개시에 기술된 융합 단백질을 생산할 수 있는 반면, 다른 숙주 세포는 본 발명의 구현예에 따른 핵산, DNA 작제물 또는 벡터를 생산하거나 유지하는데 사용될 수 있다. 숙주 세포는 시험관 내, 생체 외 또는 생체 내 숙주 세포일 수 있다. 임의의 숙주 세포 집단 및 하나 이상의 숙주 세포를 포함하는 세포 배양물도 본 발명의 구현예에 포함된다. 숙주 세포는, 예를 들어, 박테리아 세포를 포함하는 원핵 세포일 수 있다. 대안적으로, 세포는 진핵 세포일 수 있다. 원핵 숙주 세포의 예는 E. 콜리, 슈도모나스, 바실러스 또는 스트렙토마이세스의 세포이다. 진핵 세포의 예는 효모 세포(예를 들어, 사카로마이세스 효모, 또는 피치아, 칸디다(Candida), 한세눌라(Hansenula) 및 토룰롭시스(Torulopsis)와 같은 메틸영양 효모의 세포); 동물 세포, 예를 들어, CHO, R1. 1, B-W 및 LM 세포, 아프리카 녹색 원숭이 신장 세포(예를 들어, COS 1, COS 7, BSC1, BSC40 및 BMT10), 곤충 세포(예를 들어, Sf9), 인간 세포(예를 들어, 인간 배아 신장 세포, 예를 들어, HEK293 또는 HeLa 세포)이다.
숙주 세포(본 발명의 구현예에 따른 핵산, 핵산 작제물 또는 벡터를 포함하는 세포를 의미함)를 생산 또는 생성하는 방법도 본 발명의 구현예에 포함된다. 본 발명의 구현예에 따른 핵산, 핵산 작제물 또는 벡터는 숙주 세포의 유형에 따라 다양한 널리 공지된 방법에 의해 숙주 세포로 전달 또는 도입될 수 있다. 핵산, 핵산 작제물 또는 벡터를 세포 내로 도입하는 것과 관련하여 사용되는 "도입" 및 관련 용어 또는 구는 세포 외부로부터 세포 내부로의 핵산 서열의 전위를 지칭한다. 일부 경우에, 도입은 세포 외부에서 진핵 세포의 핵 내부로의 핵산의 전위를 지칭한다. 전기천공, 나노입자 전달, 바이러스 전달, 나노와이어 또는 나노튜브와의 접촉, 수용체 매개 내재화, 세포 투과 펩티드를 통한 전위, 리포솜 매개 전위, DEAE 덱스트란, 리포펙타민, 칼슘 포스페이트 또는 핵산을 원핵 또는 진핵 세포 숙주에 도입하기 위해 현재 알려져 있거나 추후 확인되는 임의의 방법을 포함하나 이에 제한되지 않는 이러한 전위의 다양한 방법이 고려된다. 표적화 뉴클레아제 시스템(예를 들어, RNA-유도 뉴클레아제(CRISPR-Cas9), 전사 활성자-유사 이펙터 뉴클레아제(TALEN), 징크 핑거 뉴클레아제(ZFN) 또는 megaTAL(MT)을 또한 사용하여 핵산을 세포에 도입할 수 있다.
본 개시에 기술된 융합 단백질 및 나노입자를 생산 또는 생성하는 방법도 본 발명의 구현예에 포함된다. 융합 단백질 또는 나노입자를 생산하는 예시적인 방법은 본 발명의 구현예에 따른 핵산, 본 발명의 구현예에 따른 핵산 작제물, 또는 본 발명의 구현예에 따른 벡터를 세포 내로 도입하는 단계를 포함할 수 있다. 도입 단계는 본 개시의 다른 곳에서 기술된 바와 같이 수행되며, 이러한 단계의 결과로서 핵산, 핵산 작제물 또는 벡터를 포함하는 세포("숙주 세포"로 지칭될 수 있음)가 생성된다. 융합 단백질을 생산하는 예시적인 방법은 융합 단백질의 발현을 허용하는 조건 하에서 숙주 세포를 인큐베이션하는 단계를 포함할 수 있다. 나노입자를 생산하는 예시적인 방법은 융합 단백질의 발현 및 나노입자의 자가-조립을 허용하는 조건 하에서 숙주 세포를 인큐베이션하는 단계를 포함할 수 있다. 숙주 세포에서 발현된 후, 융합 단백질 또는 나노입자는 다양한 정제 방법을 사용하여 분리 또는 정제될 수 있다. 일부 구현예에서, 융합 단백질은 숙주 세포로부터 분리될 수 있고 시험관 내에서 나노입자로 자가-조립될 수 있다.
본 개시에 기술된 융합 단백질 및 나노입자를 생산 또는 생성하는 과정을 설명하는 일례에서, 본 발명의 구현예에 따른 융합 단백질을 인코딩하는 핵산 또는 핵산 작제물은 플라스미드 또는 다른 벡터에 도입된 후, 살아 있는 세포를 형질전환하는데 사용된다. 예를 들어, 본 발명의 구현예에 따른 융합 단백질을 인코딩하는 핵산은 프로모터, 인핸서, 폴리 A 부위 및 다른 서열과 같은 필요한 조절 영역을 제공하는 발현 벡터에 올바른 배향으로 삽입된다. 일부 경우에, 유도성 또는 조직-특이적 프로모터의 조절 하에서 융합 단백질을 발현시키는 것이 바람직할 수 있다. 그런 다음 리포펙션 또는 전기천공과 같은 다양한 방법을 사용하여 발현 벡터를 살아 있는 세포로 형질감염시켜 융합 단백질을 발현하는 숙주 세포를 생성할 수 있다. 융합 단백질을 발현하는 세포는 적절한 항생제 선택 또는 다른 방법에 의해 선택되고 배양될 수 있다. 상업적으로 이용 가능한 생물반응기에서 세포를 성장시킴으로써 더 많은 양의 융합 단백질이 생산될 수 있다. 일단 숙주 세포에 의해 발현되면, 융합 단백질은 투석, 여과 및 크로마토그래피와 같은 표준 절차에 따라 분리(정제)될 수 있다. 융합 단백질을 분리하기 위해 세포를 용해시키는 단계가 포함될 수 있다. 따라서, 본 발명의 구현예에 따른 융합 단백질을 생산 또는 생성하는 방법은 융합 단백질의 발현을 허용하는 조건 하에서 벡터를 포함하는 세포를 배양하고, 세포를 수확하고/거나 배양된 세포로부터 배지를 수확하고, 세포 및/또는 배양 배지로부터 융합 단백질을 분리하는 하나 이상의 단계를 포함할 수 있다. 본 개시에 기술된 융합 단백질의 생산과 관련된 조성물, 방법 및 키트는 본 발명의 구현예의 범위 내에 포함된다.
면역원성 조성물 및 키트
본 개시에 기재된 융합 단백질, 본 개시에 기재된 나노입자, 본 개시에 기재된 핵산, 본 개시에 기재된 핵산 작제물, 또는 본 개시에 기재된 벡터 중 임의의 것을 함유하는 면역원성 조성물은 본 발명의 구현예에 포함된다. 본 발명의 구현예에 따른 면역원성 조성물은 또한 "백신"으로 지칭될 수 있다. 면역원성 조성물은 본 발명에 따른 융합 단백질, 나노입자, 핵산, 핵산 작제물 또는 벡터 및 약학적으로 허용되는 담체(부형제)를 포함할 수 있다. 면역원성 조성물은 본 발명의 구현예에 따른 융합 단백질, 나노입자, 핵산, 핵산 작제물 또는 벡터 및 애주번트를 포함할 수 있다. 면역원성 조성물은 본 발명의 구현예에 따른 융합 단백질, 나노입자, 핵산, 핵산 작제물 또는 벡터 및 비제한적으로 희석제, 용해제, 유화제 또는 보존제와 같은 다른 구성요소를 포함할 수 있다. 본 발명에 따른 면역원성 조성물은 수용액과 같은 용액, 수성 현탁액과 같은 현탁액일 수 있거나, 동결건조된 형태와 같은 건조 형태일 수 있다. 본 발명의 구현예에 따른 융합 단백질, 나노입자, 핵산, 핵산 작제물 또는 벡터 이외에 면역원성 조성물에 포함된 일부 구성요소(또는 성분)은 본 개시의 다른 곳에서 보다 상세하게 설명된다.
면역원성 조성물의 일부 구현예는 본 개시의 다른 곳에 기술된 하나 이상의 융합 단백질 또는 융합 단백질을 인코딩하는 핵산을 포함한다. 예를 들어, 면역원성 조성물은 본 개시의 다른 곳에 기술된 2개 이상, 3개 이상, 4개 이상, 5개 이상 등의 상이한 융합 단백질을 포함할 수 있다. 또 다른 예에서, 면역원성 조성물은 본 개시의 다른 곳에 기술된 2개 이상, 3개 이상, 4개 이상, 5개 이상 등의 상이한 융합 단백질을 인코딩하는 핵산을 포함할 수 있다. 2개 이상, 3개 이상, 4개 이상, 5개 이상 등의 상이한 융합 단백질을 인코딩하는 핵산은 벡터와 같은 동일한 핵산 작제물, 또는 상이한 핵산 작제물에 포함될 수 있다. 예를 들어, 면역원성 조성물은 N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:12, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:13, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:16, SEQ ID NO:17, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:18, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:21, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:22, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:23, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:24, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:25, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:26, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:27, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:28, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:29, N-말단 신호 서열(SEQ ID NO:8)이 없는 SEQ ID NO:30, N-말단 신호 서열(SEQ ID NO:31)이 없는 SEQ ID NO:33 또는 N-말단 신호 서열(SEQ ID NO:32)이 없는 SEQ ID NO:34와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열을 갖는 하나 이상, 2개 이상, 3개 이상, 4개 이상, 5개 이상 등의 융합 단백질 또는 융합 단백질을 인코딩하는 핵산을 포함할 수 있다.
본 발명의 구현예에 따른 면역원성 조성물은 약학적으로 허용되는 담체 또는 부형제를 포함할 수 있다. 약학적으로 허용되는 담체 또는 부형제는 생물학적으로 또는 달리 바람직하지 않지 않은 물질이며, 이는 바람직하지 않은 생물학적 효과를 일으키거나 이것이 포함된 약학적 조성물의 다른 구성요소와 유해한 방식으로 상호작용하지 않고 대상체에게 투여될 수 있는 물질을 의미한다. 담체 또는 부형제는 전형적으로 담체 또는 부형제가 포함된 조성물의 다른 성분의 분해를 최소화하고, 대상체에서 불리한 부작용(예를 들어, 알레르기 부작용)을 최소화하도록 선택된다. 약학적으로 허용되는 수성 담체의 예는 멸균수, 식염수, 링거 용액과 같은 완충 용액, 글리세롤 용액, 에탄올, 덱스트로스 용액, 요막액 또는 이들의 조합을 포함하나 이에 제한되지 않는다. 수성 담체의 pH는 일반적으로 약 5 내지 약 8 또는 약 7 내지 7.5이다. 담체는 pH 조절 완충액을 포함할 수 있다. 멸균성, pH, 등장성 및 안정성을 보장하는 이러한 수성 담체의 제조는 확립된 프로토콜에 따라 수행된다. 비수성 담체의 예는 프로필렌 글리콜, 폴리에틸렌 글리콜, 올리브유와 같은 식물성 오일, 및 에틸 올레에이트와 같은 주사 가능한 유기 에스테르이다. 다른 예시적인 담체는 고체 소수성 중합체의 반투과성 매트릭스와 같은 지속 방출 제조물이다. 다른 예시적인 담체는 비제한적으로 필름, 리포솜 또는 미세입자와 같은 성형된 물품 형태의 매트릭스이다. 예를 들어, 투여 경로 및 투여되는 조성물의 농도에 따라 특정 담체가 더 바람직할 수 있다.
본 발명의 구현예에 따른 면역원성 조성물은 애주번트를 포함할 수 있다. 화학적 애주번트의 일부 예는 알루미늄 포스페이트, 벤질알코늄 클로라이드, 우베니멕스(ubenimex), QS21, 알루미늄 하이드록사이드(예를 들어, 명반, 알루미늄 하이드록사이드 습식 겔 현탁액, 예를 들어, Alhydrogel®(Croda International, UK)), 사포닌(예를 들어, Quil A®(Croda International, UK)), 스쿠알렌(예를 들어, AddaVax™)이다. 소위 "유전적" 애주번트의 일부 예는 IL-2 유전자 또는 이의 단편, 과립구 대식세포 콜로니-자극 인자(GM-CSF) 유전자 또는 이의 단편, IL-18 유전자 또는 이의 단편, 케모카인(C-C 모티프) 리간드 21(CCL21) 유전자 또는 이의 단편, IL-6 유전자 또는 이의 단편, CpG, LPS, TLR 효능제(예를 들어, 모노포스포릴 지질 A(MPLA)), 및 다른 면역 자극 유전자이다. 단백질 애주번트의 일부 예는 IL-2 또는 이의 단편, 과립구 대식세포 콜로니-자극 인자(GM-CSF) 또는 이의 단편, IL-18 또는 이의 단편, 케모카인(C-C 모티프) 리간드 21(CCL21) 또는 이의 단편, IL-6 또는 이의 단편, CpG, LPS, TLR 효능제 및 다른 면역 자극 사이토카인 또는 이들의 단편이다. 지질 애주번트의 일부 예는 양이온성 리포솜, N3(양이온성 지질), MPLA, Quil-A® 및 AddaVax™이다. 다른 예시적인 애주번트는 콜레라 독소, 엔테로톡신, Fms-유사 티로신 키나제-3 리간드(Flt-3L), 부피바카인(bupivacaine), 마케인(marcaine) 및 레바미솔(levamisole)을 포함하나 이에 제한되지 않는다. 일부 구현예에서, 면역원성 조성물은 Quil-A®를 포함한다. 일부 구현예에서, 면역원성 조성물은 명반을 포함한다. 일부 구현예에서, 면역원성 조성물은 CpG를 포함한다. 하나 초과의 애주번트가 본 발명의 구현예에 따른 면역원성 조성물에 포함될 수 있다. 예를 들어, 일부 구현예에서, 면역원성 조성물은 명반 및 CpG를 포함할 수 있다.
본 발명의 구현예에 따른 면역원성 조성물은 일반적으로 투여에 사용되는 투여량 및 농도에서 대상체에게 비독성이거나 최소 독성이 되도록 제형화된다. 일부 구현예에서, 면역원성 조성물의 제형은 제형을 등장성으로 만들기에 적절한 양의 약학적으로 허용되는 염을 포함할 수 있다. 일부 구현예에서, 면역원성 조성물의 제형은, 예를 들어, pH, 삼투질농도, 점도, 투명도, 색상, 등장성, 냄새, 멸균성, 안정성, 용해 또는 방출 속도, 흡착 또는 조성물의 침투를 변형, 유지 또는 보존하기 위한 구성요소를 포함할 수 있다. 면역원성 조성물의 제형은 다음 구성요소 중 하나 이상을 포함할 수 있다: 아미노산(예를 들어, 글리신, 글루타민, 아스파라긴, 아르기닌 또는 리신); 항미생물제; 항산화제(예를 들어, 아스코르브산, 소듐 설파이트 또는 소듐 하이드로겐-설파이트); 완충액(예를 들어, 보레이트, 바이카르보네이트, Tris-HCl, 시트레이트, 포스페이트 또는 다른 유기산); 증량제(예를 들어, 만니톨 또는 글리신); 킬레이트제(예를 들어, 에틸렌디아민 테트라아세트산(EDTA)); 착화제(예를 들어, 카페인, 폴리비닐피롤리돈, 베타-사이클로덱스트린 또는 하이드록시프로필-베타-시클로덱스트린); 충전제; 단당류, 이당류 및 다른 탄수화물(예를 들어, 글루코스, 만노스 또는 덱스트린); 단백질(예를 들어, 혈청 알부민, 젤라틴 또는 면역글로불린); 착색제, 착향제 및 희석제; 유화제; 친수성 중합체(예를 들어, 폴리비닐피롤리돈); 저분자량 폴리펩티드; 염-형성 반대이온(예를 들어, 소듐); 보존제(예를 들어, 벤즈알코늄 클로라이드, 벤조산, 살리실산, 티메로살, 페네틸 알코올, 메틸파라벤, 프로필파라벤, 클로르헥시딘, 소르브산 또는 하이드로겐 퍼옥사이드); 용매(예를 들어, 글리세린, 프로필렌 글리콜 또는 폴리에틸렌 글리콜); 당 알코올(예를 들어, 만니톨 또는 소르비톨); 현탁화제; 계면활성제 또는 습윤제(예를 들어, 플루로닉, PEG, 소르비탄 에스테르, 폴리소르베이트, 예를 들어, 폴리소르베이트 20, 폴리소르베이트 80, 트리톤, 트로메타민, 레시틴, 콜레스테롤, 틸록사팔); 안정성 향상제(예를 들어, 수크로스 또는 소르비톨); 긴장성 향상제(예를 들어, 알칼리 금속 할라이드, 바람직하게는 소듐 또는 포타슘 클로라이드, 만니톨 소르비톨); 및/또는 전달 비히클.
일부 구현예에서, 면역원성 조성물은 동결건조된 형태와 같은 건조 형태(즉, 탈수 형태)로 제조될 수 있다. 이러한 제형은 "동결건조된" 또는 "동결건조물"로 지칭될 수 있다. 동결건조는 액체 제형에서 용매를 제거하는 냉동-건조 과정이다. 동결건조 과정은 냉동 및 건조의 동시 또는 순차적 단계 중 하나 이상을 포함할 수 있다. 본 발명의 구현예에 따른 면역원성 조성물은 비휘발성 또는 휘발성 완충액을 포함하는 수용액에서 동결건조될 수 있다. 적합한 비휘발성 완충액의 비제한적인 예는 PBS, Tris-HCl, HEPES 또는 L-히스티딘 완충액이다. 적합한 휘발성 완충액의 비제한적인 예는 암모늄 바이카르보네이트, 암모니아/아세트산 또는 N-에틸모르폴린/아세테이트 완충액이다. 본 발명의 구현예에 따른 동결건조된 면역원성 조성물은 적절한 담체 또는 부형제를 포함할 수 있다. 이러한 적절한 부형제는 cryo-보존제, 증량제, 계면활성제 또는 이들의 조합을 포함할 수 있으나 이에 제한되지 않는다. 예시적인 부형제는 폴리올, 이당류 또는 다당류 중 하나 이상, 예를 들어, 이를 테면, 만니톨, 소르비톨, 수크로스, 트레할로스 및/또는 덱스트란 40을 포함한다. 일부 경우에, cryo-보존제는 수크로스 및/또는 트레할로스일 수 있다. 일부 경우에, 증량제는 글리신 또는 만니톨일 수 있다. 일례에서, 계면활성제는, 예를 들어, 폴리소르베이트-20 및/또는 폴리소르베이트-80과 같은 폴리소르베이트일 수 있다. 본 발명의 구현예에 따른 동결건조된 면역원성 조성물은, 예를 들어, 케이크 또는 분말 형태일 수 있다. 동결건조된 면역원성 조성물은 사용 전에 담체 또는 부형제(예를 들어, 물 또는 완충 용액)에서 재수화/용해/재구성될 수 있다. 면역원성 조성물의 일부 구현예는 수크로스를 포함하는 완충 용액 또는 물에서 재구성된다.
본 발명의 구현예에 따른 면역원성 조성물은 대상체에게 투여하기 전에 멸균 상태일 수 있다. 멸균은 멸균 여과막을 통한 여과에 의해 달성될 수 있다. 면역원성 조성물이 동결건조될 때, 멸균은 동결건조 및 재구성 전 또는 후에 수행될 수 있다. 면역원성 조성물은 용액, 현탁액, 겔, 에멀젼, 고체, 또는 탈수되거나 동결건조된 분말로서 바이알 또는 백과 같은 멸균 용기에 보관할 수 있다.
본 개시에 기술된 면역원성 조성물을 포함하는 키트도 본 발명의 구현예에 포함된다. 예를 들어, 키트는 면역원성 조성물 및 백 또는 바이알과 같은 보관을 위한 용기를 포함할 수 있다. 이러한 용기는, 예를 들어, 피하 주사 바늘로 뚫을 수 있는 마개가 있는 백 또는 바이알과 같은 멸균 접근 포트를 가질 수 있다. 다른 예에서, 키트는 동결건조되거나 농축된 형태의 면역원성 조성물 및 희석제를 포함할 수 있다. 이러한 키트에서, 희석제는 또한 본 개시의 다른 곳에서 기재된 바와 같이 약학적으로 허용되는 담체 또는 부형제일 수 있다. 이러한 키트에 포함될 수 있는 희석제의 예는 식염수, 완충 식염수, 물 또는 수크로스이다. 다른 예에서, 키트는 면역원성 조성물 및 면역원성 조성물을 투여하기 위한 장치를 포함할 수 있다. 조성물을 투여하기 위한 장치는 주사 또는 경구 투여를 위한 주사기(예를 들어, 키트는 액체 면역원성 조성물로 미리-충전된 주사기일 수 있음), 미세바늘 패치와 같은 미세바늘 장치, 흡입기 또는 분무기일 수 있다. 일부 구현예에서, 키트는 단일 용량으로 투여될 때 대상체에서 코로나바이러스에 대한 보호 면역 반응을 유도할 수 있는 정의된 양의 면역원성 조성물을 함유할 수 있다. 일부 구현예에서, 키트는 대상체에서 코로나바이러스에 대한 보호 면역 반응을 유도할 수 있는 다중 용량의 정의된 양의 면역원성 조성물을 함유할 수 있다. 예를 들어, 키트는 면역원성 조성물을 함유하는 다수의 바이알, 주사기 또는 미세바늘 패치를 포함할 수 있다.
면역 반응을 유도하는 방법
대상체에게 본 개시에 기술된 면역원성 조성물을 투여함으로써 대상체에서 코로나바이러스에 대한 면역 반응을 유도하거나 유발하는 방법이 본 발명의 구현예에 포함된다. 이러한 방법의 구현예에서, 면역원성 조성물은 대상체에서 코로나바이러스에 대한 보호 면역 반응을 유도하거나 유발할 수 있는 양으로 투여된다. 대상체에서 코로나바이러스에 대한 보호 면역 반응은 대상체에서 항-코로나바이러스 중화 항체의 생산을 포함할 수 있다. 대상체에서 코로나바이러스에 대한 보호 면역 반응을 유도하거나 유발할 수 있는 면역원성 조성물의 양은 "유효량" 또는 "면역학적 유효량"으로 기술될 수 있고, 1회 용량 또는 2회 이상의 용량으로 투여될 수 있다. 투여를 위한 유효량 및 일정은 경험적으로 결정될 수 있다.
본 개시에 기재된 면역원성 조성물의 투여를 위한 투여량 범위는 원하는 효과, 즉, SARS-CoV-2와 같은 코로나바이러스에 대한 보호 면역 반응을 유도하기에 충분히 큰 범위이다. 투여량은 원하지 않는 교차-반응, 아나필락시스 반응 등과 같은 실질적인 불리한 부작용을 일으킬 정도로 크지 않아야 한다. 일반적으로, 투여량은 연령, 상태, 성별, 의학적 상태, 투여 경로, 또는 요법에 다른 약물이 포함되는지 여부에 따라 달라질 수 있다. 투여량은 임의의 금기사항이 있는 경우 의료 전문가에 의해 조정될 수 있다. 투여량은 다양할 수 있으며, 제제는 프라임 및 부스트 패러다임을 포함하여, 하루 또는 며칠 동안 매일 1회 이상의 용량 투여로 투여될 수 있다.
대상체에서 코로나바이러스에 대한 보호 면역 반응을 유도하거나 유발하는 방법의 맥락에서 사용되는 경우, 본 개시에 기술된 면역원성 조성물은 경구, 비경구, 정맥내, 근육내, 피하, 경피, 분무/흡입, 또는 기관지경을 통한 설치를 포함하나 이에 제한되지 않는 임의의 여러 투여 경로를 통해 투여될 수 있다. 면역원성 조성물은 경구 흡입, 비강 흡입 또는 비강 점막 투여에 의해 투여될 수 있다. 흡입에 의한 본 개시에 기재된 면역원성 조성물의 투여는, 예를 들어, 에어로졸 형태의 분무 또는 액적 메카니즘에 의한 전달을 통해 코 또는 입을 통해 이루어질 수 있다. 대상체에서 코로나바이러스에 대한 보호 면역 반응을 최적화하기 위해 투여 형태를 선택할 수 있다.
면역원성 조성물이 본 발명의 구현예에 따른 핵산, 핵산 작제물 또는 벡터를 포함하는 제공된 방법에서(이러한 조성물은 "핵산 면역원성 조성물" 또는 "핵산 백신"으로 지칭될 수 있음), 면역원성 조성물은 대상체의 세포 내로 도입될 수 있다. 핵산 전달 기술의 예는 "네이키드 DNA" 촉진(부피바카인, 중합체, 펩티드 매개) 전달, 및 양이온성 지질 복합체 또는 리포솜을 포함한다. 핵산은, 예를 들어, 미국 특허 번호 5,204,253에 기술된 바와 같은 탄도 전달 또는 압력(예를 들어, 미국 특허 번호 5,922,687 참조)을 사용하여 투여될 수 있다. 일부 예에서, 본 발명의 구현예에 따른 핵산, 핵산 작제물 또는 벡터 단독으로 또는 대부분으로 구성된 입자가 대상체에게 투여될 수 있다. 일부 예에서, 본 발명의 구현예에 따른 핵산, 핵산 작제물 또는 벡터는 대상체에게 투여하기 위해 금 입자와 같은 입자에 부착될 수 있다. 면역원성 조성물이 바이러스 벡터를 포함하는 경우, 바이러스 벡터는 대상체로부터 얻은 세포(자가 세포)에 도입될 수 있고 세포는 대상체에 투여될 수 있다. 일부 구현예에서, 본 발명의 구현예에 따른 핵산, 핵산 작제물 또는 벡터를 포함하는 면역원성 조성물은 주사 또는 전기천공, 또는 주사와 전기천공의 조합에 의해 투여될 수 있다.
본 개시에 기술된 방법의 맥락에서, 대상체는 건강하고 일반 대중보다 코로나바이러스 발명에 대한 위험이 높지 않을 수 있다. 일부 경우에, 대상체는 감염에 걸리기 쉬워서 코로나바이러스 감염 발병 위험이 높거나 COVID-19와 같은 심각한 형태의 코로나바이러스 질병으로 발달하기 쉬운 경향일 수 있다(예를 들어, 65세 이상의 사람, 천식 또는 다른 만성 호흡기 질환이 있는 사람, 어린이, 임산부, 유전적 소인이 있는 사람, 면역 시스템이 손상된 사람은 심각한 형태의 COVID-19로 발달하기 쉬운 경향일 수 있음). 대상체는 또한 현재 코로나바이러스에 감염된 대상체일 수 있으며, 하나 초과의 감염 증상을 가질 수 있다. 현재 코로나바이러스에 감염된 대상체는 증상 또는 진단 테스트 결과에 따라 코로나바이러스 감염으로 진단되었을 수 있다.
본 발명의 구현예에 따른 방법은 예방 및 치료 목적 모두에 유용하다. 코로나바이러스에 감염되었거나 코로나바이러스 감염에 민감한 대상체에게 유효량의 본 개시에 기술된 면역원성 조성물을 투여하는 것을 포함하는, 대상체에서 코로나바이러스 감염을 치료 또는 예방하는 방법도 본 발명의 구현예에 포함된다. 본 발명의 구현예에 따른 방법에서, 면역원성 조성물은 단독으로 또는, 예를 들어, 코로나바이러스 감염 또는 질병의 치료를 위한 항바이러스 화합물과 같은 하나 이상의 치료제와 함께 사용될 수 있다. 예방적 사용을 위해, 본 개시에 기술된 유효량의 면역원성 조성물은 코로나바이러스 감염의 개시 전(예를 들어, 명백한 감염 징후 전) 또는 초기 개시 동안(예를 들어, 초기 징후 및 감염 증상이 있을 때)에 대상체에게 투여될 수 있다. 예방적 투여는 코로나바이러스 감염 증상이 나타나기 며칠 전에서 몇 년 전에 발생할 수 있다. 예방적 투여는, 예를 들어, 코로나바이러스 감염에 대한 소인이 있는 것으로 확인된 대상체의 예방적 치료에서 사용될 수 있다. 치료적 치료는 감염의 진단 또는 발병 후에 치료적 유효량의 본 개시에 기술된 면역원성 조성물을 대상체에게 투여하는 것을 포함한다.
본 발명의 구현예의 맥락에서, 용어 "치료", "치료하다", "치료하는" 및 관련 용어 및 표현은 대상체에서 면역 반응을 유도함에 의해 코로나바이러스 감염의 영향 중 하나 이상 또는 코로나바이러스 감염의 하나 이상의 증상을 감소시키는 것을 지칭한다. 따라서 개시된 방법에서, 치료는 확립된 코로나바이러스 감염의 중증도 또는 코로나바이러스 감염의 증상의 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% 또는 100% 감소를 지칭할 수 있다. 예를 들어, 코로나바이러스 감염을 치료하는 방법은 대조군에 비해 대상체에서 코로나바이러스 감염의 하나 이상의 증상이 10% 감소한 경우 치료로 간주된다. 따라서 감소는 천연 또는 대조군 수준과 비교하여 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 또는 10% 내지 100% 사이의 임의의 퍼센트 감소일 수 있다. 치료가 반드시 코로나바이러스 감염 또는 질병 또는 코로나바이러스 감염 또는 질병의 증상의 치유 또는 완전한 제거를 의미하는 것은 아님이 이해된다.
본 발명의 구현예와 관련하여, 용어 "예방하다", "예방하는", 코로나바이러스 감염 또는 질병의 "예방" 및 관련 용어 및 표현은, 예를 들어, 대상체가 코로나바이러스 감염의 하나 이상의 증상을 나타내기 시작하기 전 또는 거의 동시에 발생하는 행위, 예를 들어, 면역원성 조성물의 투여를 지칭하며, 이는 감염의 하나 이상의 증상의 개시 또는 악화를 억제 또는 지연시키거나 재발을 지연시킨다. 본 개시에 사용된 바와 같이, 저하, 감소 또는 억제에 대한 언급은 대조군 수준과 비교하여 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% 이상의 변화를 포함한다. 예를 들어, 본 개시에 기재된 방법은 감염을 감소시키기 위한 조성물을 수용하지 않은 코로나바이러스에 노출된 대조군 대상체와 비교할 때, 본 개시에 기술된 면역원성 조성물이 투여된 코로나바이러스에 노출된 대상체에서 코로나바이러스 감염의 개시, 악화 또는 재발, 또는 감염 증상의 약 10% 감소가 있는 경우 코로나바이러스 감염의 예방에 영향을 미치는 것으로 간주될 수 있다. 따라서, 코로나바이러스 감염의 개시, 악화 또는 재발의 감소는 대조군 대상체와 비교하여 약 10, 20, 30, 40, 50, 60, 70, 80, 90, 100%, 또는 그 사이의 임의의 감소량일 수 있다.
실시예
하기 실시예는 예시를 위해 제공되지만, 청구된 발명을 제한하지 않는다.
실시예 1: 재료 및 방법.
A.
DNA 작제물.
SARS-CoV-2 스파이크 단백질의 수용체 결합 도메인(RBD)을 인코딩하는 작제물("RBD 작제물")은 문헌[Amanat et al. (2020)]에 기술되어 있다. SARS-CoV-2 스파이크 수용체 RBD는 SARS-CoV-2 Wuhan-Hu-1의 아미노산 잔기 319-541에 걸쳐 있다. RBD 작제물은 천연 신호 펩티드(아미노산 1-14)를 인코딩하는 핵산 서열에 이어, SARS-CoV-2 Wuhan-Hu-1 게놈 서열(GenBank Ref. No. MN9089473)의 잔기 319-541을 인코딩하는 서열, 및 C-말단에서 헥사히스티딘 태그를 인코딩하는 서열을 포함한다.
전장 및 C-말단 트렁케이션된 (ΔC) SARS-CoV-2 스파이크 단백질 엑토도메인 작제물은 문헌[Amanat et al. (2020)]에도 기술된 전장 스파이크 단백질 작제물로부터 제조되었고, 이는 푸린 부위(RRAR)가 알라닌으로 돌연변이되고 예비융합 입체형태에서 스파이크 삼량체를 안정화시키는 2개의 프롤린 돌연변이(K986P 및 V987P)를 갖는 스파이크 단백질의 잔기 1-1213을 인코딩하는 SARS-CoV-2 Wuhan-Hu-1 게놈 서열(GenBank MN9089473)의 핵산 서열을 포함한다. 스파이크 단백질의 잔기 1213을 인코딩하는 핵산 서열 다음에, GCN4 삼량체화 도메인 및 헥사히스티딘 태그를 인코딩하는 핵산 서열이 첨가되었다. 상기 작제물("FL 스파이크 삼량체")는 헵타드 반복 2(HR2)가 결실된 트렁케이션된 SARS-CoV-2 스파이크 단백질 엑토도메인을 인코딩하는 작제물의 기초로 사용되었다. ΔC SARS-CoV-2 스파이크 단백질 엑토도메인("스파이크ΔC 삼량체")을 인코딩하는 작제물, 스파이크 단백질의 잔기 1-1137을 인코딩하는 서열만이 포함되었다. 상기 작제물을 HiFi PCR(Takara)을 사용하여 pADD2 포유동물 발현 벡터로 옮긴 후, EcoRI/XhoI 제한 부위로 InFusion 클로닝하였다. 전장 스파이크 페리틴("FL 스파이크 페리틴") 및 ΔC 스파이크 페리틴("스파이크ΔC 페리틴") 작제물은 발현 벡터에서 전장 스파이크 단백질 엑토도메인(잔기 1-1213) 또는 ΔC 스파이크 단백질 엑토도메인(잔기 1-1143)을 인코딩하는 서열을 PCR-증폭한 후 스티칭 PCR하여 클로닝되었고, 여기서 작제물은 SGG 링커를 인코딩하는 앰플리콘에 이어 H. 파일로리 페리틴 서열(잔기 5-168)로 어닐링되었다. 그런 다음 생성된 앰플리콘을 EcoRI/XhoI 제한 부위를 사용하여 InFusion을 통해 pADD2 포유동물 발현 벡터에 삽입하였다. 최종 서열은 Sanger 시퀀싱을 사용하여 확인되었다.
위에서 논의된 작제물은 도 1에 개략적으로 예시되어 있으며, 작제물에 의해 인코딩된 아미노산 서열은 SEQ ID NO 7-11로 아래에 표시되고, SARS-CoV-2 스파이크 신호 펩티드 서열은 굵게/밑줄이 있는 글꼴로 표시되고, 헥사히스티딘 태그 서열은 굵게 표시되며, Ser/Gly 링커 영역은 밑줄로 표시되고, GCN4 삼량체화 도메인은 이탤릭체로 표시되고, H. 파일로리 페리틴 서열은 이탤릭체 및 밑줄로 표시된다.
RBD - SEQ ID NO:9
FL 스파이크 삼량체 - SEQ ID NO:10
ΔC 스파이크 삼량체 ("스파이크ΔC 삼량체") - SEQ ID NO:11
FL 스파이크 페리틴 융합 단백질 ("FL 스파이크 페리틴") - SEQ ID NO:12
ΔC 스파이크 페리틴 융합 단백질 ("스파이크ΔC 페리틴") - SEQ ID NO:13
SARS-CoV-2 반응성 모노클로날 항체, CR3022, CB6 및 COVA-2-15에 대한 가변 중쇄 및 가변 경쇄 서열은 인간 발현을 위해 코돈-최적화되었고 통합 DNA 기술(IDT)에서 유전자 블록 단편으로 정렬되었다. 단편을 PCR-증폭하고 InFusion을 사용하여 VRC01의 중쇄 또는 경쇄 Fc 서열을 포함하는 선형화된 CMV/R 발현 벡터에 삽입하였다.
Fc 태그에 융합된 가용성 인간 ACE2는 Addgene 플라스미드로부터 ACE2(잔기 1-615)를 PCR 증폭하고 이를 스티칭 PCR 단계를 사용하여 TEV-GSGG(SEQ ID NO:12) 링커에 의해 분리된 인간 Fc 도메인에 융합시켜 작제되었다. 그런 다음 EcoRI/XhoI 절단 부위를 사용하여 InFusion® 클로닝 시스템을 통해 hACE2-Fc를 pADD2 포유동물 발현 벡터에 삽입하였다.
클로닝된 모든 플라스미드는 Sanger 시퀀싱을 사용하여 서열-확인되었다. 시퀀싱 확인 후, 플라스미드를 Stellar Cells(Takara)로 형질전환하고 LB/카르베니실린 배양액에서 밤새 성장시켰고, 예외로 CMV/R mAb 플라스미드는 LB/카나마이신 배양액에서 성장시켰다. Macherey Nagel Maxi Prep 컬럼을 사용하여 포유동물 세포 형질감염을 위한 플라스미드를 준비하였다. 용리된 DNA는 형질감염 전에 0.22 μm 필터를 사용하여 생물안전(biosafety) 후드에서 여과되었다.
B.
SARS-CoV-2 항원의 발현 및 정제.
모든 단백질은 Expi293F 세포에서 발현되었다. Expi293F 세포를 66% Freestyle/33% Expi 배지(ThermoFisher)를 사용하여 배양하고 TriForest 폴리카르보네이트 배플 진탕 플라스크에서 37℃, 8% CO2에서 성장시켰다. 세포를 대략 3-4 x 106개 세포/mL의 밀도로 형질감염시켰다. 형질감염 혼합물은 568 μg의 maxi-prepped DNA를 113 mL의 배양 배지(형질감염된 세포 1리터 당)에 첨가한 다음 1.48 mL의 FectoPro(Polyplus)를 첨가하여 제조되었다. 혼합물을 실온에서 10분 동안 인큐베이션한 다음 세포에 첨가하였다. 세포를 D-글루코스(0.04 g/L 최종 농도) 및 2-프로필펜탄(발프로)산(3 mM 최종 농도)으로 즉시 부스팅하였다. 배양물을 7,000 x g에서 15분 동안 회전시켜 형질감염 3-5일 후에 세포를 수확하였다. 0.22 μm 필터를 사용하여 상청액을 여과하였다.
RBD, FL 스파이크 삼량체 및 ΔC 스파이크 삼량체 폴리펩티드 항원을 HisPur™ Ni-NTA 수지(ThermoFisher)를 사용하여 정제하였다. 정제 전에, 수지를 약 10 컬럼 부피의 세척 완충액(10 mM 이미다졸/1X PBS)으로 3회 세척하였다. 세포 상청액을 10 mM 이미다졸/1X PBS로 1:1 희석하고, 수지를 희석된 세포 상청액에 첨가한 다음, 회전시키면서 4℃에서 인큐베이션하였다. 중력 흐름 정제를 위해 수지/상청액 혼합물을 유리 크로마토그래피 컬럼에 첨가하였다. 칼럼 내의 수지를 10 mM 이미다졸/1X PBS로 세척하고, 단백질을 250 mM 이미다졸/1X PBS로 용리시켰다. 컬럼 용리액은 원심 농축기(RBD의 경우 10 kDa 컷오프, 및 삼량체 작제물의 경우 100 kDa 컷오프)를 사용한 후 AKTA Pure 시스템(Cytiva)에서 크기-배제 크로마토그래피를 사용하여 농축되었다. RBD는 S200을 사용하여 정제되었다. FL 스파이크 삼량체 및 ΔC 스파이크 삼량체 항원은 S6에서 정제되었다. 컬럼은 정제 전에 1X PBS에서 미리-평형화되었다.
FL 스파이크 페리틴 및 ΔC 스파이크 페리틴 나노입자는 음이온 교환 크로마토그래피를 사용한 후 SRT® SEC-1000 컬럼을 사용한 크기-배제 크로마토그래피를 사용하여 분리되었다. 간단히, Expi293F 상청액을 AKTA Flux S 컬럼(Cytiva)을 사용하여 농축하였다. 그런 다음 완충액을 100 kDa 분자량 컷오프(MWCO) 투석 튜빙을 사용하여 4℃에서 밤새 투석을 통해 20 mM Tris, pH 8.0으로 변경하였다. 투석된 상청액을 0.22 μm 필터를 통해 여과하고 20 mM Tris, pH 8.0에서 평형화된 HiTrap® Q 음이온 교환 컬럼에 로딩하였다. 스파이크 나노입자는 0-1 M NaCl 구배를 사용하여 용리되었다. 단백질-함유 분획은 아래에서 추가로 논의되는 바와 같이 CR3022를 사용한 웨스턴 블롯 분석을 사용하여 초기에 확인되었다. 단백질-함유 분획을 풀링하고 100 kDa MWCO Amicon® 스핀 필터를 사용하여 농축하고, 후속하여 1X PBS에서 평형화된 SRT® SEC-1000 SEC 컬럼을 사용하여 AKTA Pure 시스템(Cytiva)에서 정제하였다. A280 신호 및 GelCode™ Blue Stain Reagent(ThermoFisher)로 염색된 4-20% Mini-PROTEAN® TGX™ 단백질 겔에서의 SDS-PAGE 분석을 기반으로 분획을 풀링하였다. 면역화 전에, 샘플을 10% 글리세롤로 보충하고, 0.22 μm 필터를 통해 여과하고, 스냅 냉동하고, 사용할 때까지 -20℃에서 보관하였다.
C.
Expi 상청액의 웨스턴 블롯 분석.
Expi293F 상청액을 형질감염 3일 후에 수집하고, 7,000 xg에서 15분 동안 회전시켜 수확하고, 0.22 μm 필터를 통해 여과하였다. 샘플을 SDS-PAGE Laemmli 로딩 완충액(Bio-Rad)에 희석하고, 95℃에서 비등시킨 다음, 250V에서 4-20% Mini-PROTEAN® TGX 단백질 겔(Bio-Rad)에서 진행시켰다. Trans-Blot® Turbo™ 이동 시스템(Bio-Rad)을 사용하여 단백질을 니트로셀룰로스 막으로 옮겼다. 블롯을 5% 밀크/PBST에서 차단한 후 차단 블롯을 PBST로 세척하였다. 자체 제조한 1차 항체(CR3022, 5 μM 스톡 농도)를 PBST에서 1:10,000으로 첨가하였다. 블롯을 PBST로 세척하고 2차 토끼 항-인간 IgG H&L HRP(abcam ab6759)를 PBST에서 1:50,000 희석하여 첨가하였다. 블롯은 Pierce™ ECL 웨스턴 블롯팅 기질(ThermoFisher)을 사용하여 현상되고 GE Healthcare Life Sciences 이미저를 사용하여 이미지화되었다.
D.
정제된 mAb 및 마우스 혈청을 사용한 효소-결합 면역흡착 검정(ELISA).
SARS-CoV-2 항원과의 ELISA 결합은 MaxiSorp™ 96-웰 플레이트(ThermoFisher)에 항원을 1X PBS에서 2 μg/mL로 4℃에서 밤새 코팅하여 수행하였다. 코팅 후, 플레이트를 PBST로 3X 세척하고 ChonBlock™ 차단/희석 ELISA 완충액(Chondrex)을 사용하여 4℃에서 밤새 차단하였다. 완충액을 수동으로 제거하고 플레이트를 PBST로 3X 세척하였다. 마우스 혈청 샘플, 정제된 모노클로날 항체 및 hACE2-Fc를 1:50 혈청 희석 또는 10 μg/mL에서 시작하여 희석 완충액에서 연속 희석한 다음, 실온에서 1시간 동안 코팅된 플레이트에 첨가하였다. 플레이트를 PBST로 3X 세척하였다. 마우스 혈청 ELISA의 경우, HRP 염소 항-마우스(BioLegend 405306)를 희석 완충액에 1:10,000 희석하여 실온에서 1시간 동안 첨가하였다. 정제된 mAb 및 hACE2-Fc의 경우, Direct-Blot HRP 항-인간 IgG1 Fc 항체를 희석 완충액에 1:10,000 희석하여 실온에서 1시간 동안 첨가하였다. 2차 항체와 함께 인큐베이션한 후, ELISA 플레이트를 PBST로 6X 세척하였다. 1-Step™ Turbo TMB 기질(Pierce)을 사용하여 6분 동안 플레이트를 현상하고 2M 황산으로 켄칭하였다. BioTek 플레이트 판독기를 사용하여 450 nm에서의 흡광도를 판독하였다.
E.
마우스 면역화.
Balb/C 마우스를 The Jackson Laboratories(Bar Harbor, ME)에서 구입하였다. 모든 동물은 실험실 동물 관리에 관한 스탠포드 대학 행정 패널(APLAC)이 승인한 프로토콜에 따라 '실험실 동물의 인도적 관리 및 사용'에 대한 공중 보건 서비스 정책에 따라 스탠포드 대학에서 관리하였다. 6 내지 8주령 암컷 Balb/C 마우스는 1X PBS에서 희석된 애주번트로서 10 μg Quil-A® 애주번트(InVivogen, San Diego, CA) 및 10 μg 모노포스포릴 지질 A(InVivogen, San Diego, CA)(MPLA)와 함께 10 μg의 SARS-Cov-2 스파이크 단백질 면역원(또는 달리 명시됨)을 피하 주사하여 면역화되었다. 면역원 및 애주번트 조합의 목록은 표 2에 제공되어 있다.
표 2. 마우스 면역화에 사용되는 면역원 및 애주번트 조합.
F.
SARS-CoV-2 슈도타입형 렌티바이러스 생산 및 바이러스 중화 검정.
SARS-CoV-2 스파이크 슈도타입형 렌티바이러스는 칼슘 포스페이트 형질감염 시약을 사용하여 HEK293T 세포에서 생산되었다. 600만 개의 세포를 형질감염 하루 전에 10 cm 플레이트의 D10 배지(DMEM + 첨가제: 10% FBS, L-글루타메이트, 페니실린, 스트렙토마이신 및 10 mM HEPES)에 시딩하였다. 문헌[Crawford et al., 2020]에 기술된 바와 같이, 렌티바이러스 패키징 벡터(pHAGE_Luc2_IRES_ZsGreen), SARS-CoV-2 스파이크 벡터("FL 스파이크"), 및 렌티바이러스 헬퍼 플라스미드(HDM-Hgpm2, HDM-Tat1b, 및 pRC-CMV_Rev1b)를 포함하는 5개-플라스미드 시스템이 바이러스 생산에 사용되었다. 스파이크 벡터는 SARS-CoV-2의 Wuhan-Hu-1 균주로부터의 전장 야생형 스파이크 서열을 포함하였다. 플라스미드를 필터 멸균수에 다음 비율로 첨가하였다: 500 μL의 최종 부피 중 10 μg pHAGE_Luc2_IRS_ZsGreen, 3.4 μg FL 스파이크, 2.2 μg HDM-Hgpm2, 2.2 μg HDM-Tat1b, 2.2 μg pRC-CMV_Rev1b. HEPES 완충 식염수(2X, pH 7.0)를 이 혼합물에 1 mL의 최종 부피로 적가하였다. 형질감염 복합체를 형성하기 위해, 용액을 부드럽게 교반하면서 100 μL의 2.5 M CaCl2를 적가하였다. 형질감염 반응을 실온에서 20분 동안 인큐베이션한 다음, 플레이팅된 세포에 천천히 적가하였다. 형질감염 24시간 후 배양 배지를 제거하고 신선한 D10 배지로 교체하였다. 300 x g에서 5분 동안 회전시킨 후 0.45 μm 필터를 통해 여과하여 형질감염 72시간 후 바이러스 상청액을 수확하였다. 바이러스 스톡을 분취하고 추가 사용 전까지 -80℃에서 보관하였다.
바이러스 중화 검정에서 감염에 사용된 표적 세포는 SARS-CoV-2 수용체인 ACE2를 안정적으로 과발현하는 HeLa 세포주에서 유래하였다. 이 세포주의 생산은 문헌[Rogers et al., 2020]에 자세히 설명되어 있다. ACE2/HeLa 세포는 감염 하루 전에 웰 당 5,000개 세포로 플레이팅되었다. 마우스 혈청을 56℃에서 30분 동안 열 불활성화하고, D10 배지에 희석한 다음, 바이러스와 함께 37℃에서 1시간 동안 인큐베이션하였다. 폴리브렌은 억제제/바이러스 희석 전에 5 μg/mL의 최종 농도로 첨가되었다. 인큐베이션 후, 배지를 세포로부터 제거하고, 동등한 부피의 억제제/바이러스 희석액으로 교체한 다음 37℃에서 약 48시간 동안 인큐베이션하였다. 감염성 판독은 루시페라제 수준을 측정하여 수행되었다. BriteLite™ 검정 판독 용액(Perkin Elmer)을 첨가하여 세포를 용해시키고 BioTek 플레이트 판독기를 사용하여 발광 값을 측정하였다. 각 플레이트는 6개의 세포만(0% 감염성) 및 6개의 바이러스만(100% 감염성) 웰을 평균하여 정규화되었다. 정규화된 값은 IC50 값을 얻기 위해 Prism에서 3개의 파라미터 비선형 회귀 억제제 곡선에 핏팅되었다.
G.
cryo-EM 데이터 수집
샘플은 정제 후 ΔC 스파이크 및 FL 스파이크 페리틴 나노입자 모두에 대해 약 0.4 mg/mL의 최종 농도로 희석되었다. 각 샘플의 3 μL를 연속 탄소로 코팅된 글로우-방전 200-메시 R2/1 Quantifoil® 그리드에 적용하였다. 그리드를 2초 동안 블롯팅하고 Vitrobot™ Mark IV(Thermo Fisher Scientific)를 사용하여 4℃ 및 100% 습도에서 액체 에탄으로 신속하게 저온냉각하였다. 200 kV에서 작동되는 Talos™ Arctica™ cryo-전자 현미경(Thermo Fisher Scientific)을 사용하여 샘플을 스크리닝하였다. 그런 다음 샘플을 두 샘플 모두에 대해 130,000x(픽셀 당 1.06 Å의 보정된 샘플링에 상응함)의 배율로 GIF 에너지 필터(Gatan)와 함께 300 kV에서 작동되는 Titan Krios™ cryo 전자-현미경(Thermo Fisher Scientific)에서 이미지화하였다. 현미경 사진은 Gatan K2 Summit® 직접 전자 검출기가 장착된 EPU 소프트웨어(Thermo Fisher Scientific)로 기록되었으며, 여기서 각 이미지는 6초의 노출 시간 및 Å2 당 초 당 7.8개의 전자 노출 속도를 갖는 30개의 개별 프레임으로 구성되었다. 총 3,684개의 동영상 스택이 수집되었다.
H.
단일-입자 이미지 처리 및 3D 재구성
모든 동영상 스택은 먼저 이미지 처리를 위해 RELION(REgularised LIkelihood OptimisatioN용) 소프트웨어로 가져왔다. 동작-보정은 MotionCor2를 사용하여 수행되었으며, 변조 전달 함수(CTF)는 CTFFIND4를 사용하여 결정되었다(Rohou et al., 2015). 모든 입자는 EMAN2의 NeuralNet 옵션을 사용하여 자동 선택되었으며, 선택된 3,540개의 현미경 사진에서 152,734개의 입자를 산출하였다. 그런 다음, 입자 좌표를 RELION 소프트웨어로 가져왔고, 여기서 불량한 2D 클래스 평균은 여러 라운드의 2D 분류에 의해 제거되었다. 초기 모델은 팔면체 대칭이 적용된 ab-initio 재구성 옵션을 사용하여 cryoSPARC 플랫폼에서 구축되었다. 팔면체 대칭을 적용하거나 적용하지 않은 62,837개의 입자를 사용하여 최종 3D 정제를 수행하였고, 각각 X-Å 맵 및 X-Å 맵을 얻었다. 최종 맵의 해상도는 푸리에 쉘 상관 곡선의 0.143 기준으로 추정되었다. 가우시안 저역-통과 필터는 University of California San Francisco Chimera 소프트웨어 패키지에 표시되는 최종 3D 맵에 적용되었다.
실시예 2: SARS-CoV-2 항원의 발현 및 특성화.
실시예 1에 기술된 작제물에 의해 인코딩된 SARS-CoV-2 스파이크 단백질 항원을 실시예 1에서 논의된 바와 같이 발현시키고 특성화하였다. 특성화 결과는 도 2a, 2b 및 3에 예시되어 있다. 도 2a에 예시된 바와 같이, Expi293F 세포 상청액의 웨스턴 블롯 분석은 상이한 SARS-CoV-2 스파이크 단백질 항원 간에 발현 수준이 다양함을 나타내었다. 도 2a에 표시된 웨스턴 블롯을 생성하기 위해, 상청액을 비환원 SDS 로딩 완충액에서 비등시키고, 분리를 위해 10% 겔에서 진행시키고, 니트로셀룰로스 막으로 옮기고, 자체 생산된 재조합 항-SARS-CoV-2 스파이크 당단백질 S1 모노클로날 항체(mAb)로 블롯팅하였다. 도 2b에 예시된 바와 같이, 정제된 SARS-CoV-2 RBD(예상 MW 25.9 kDa), FL 스파이크 삼량체(예상 단량체 MW 138.3 kDa), ΔC 스파이크 삼량체(예상 단량체 MW 129.3 kDa), FL 스파이크 페리틴(예상 단량체 MW 151.9 kDa), 및 ΔC 스파이크 페리틴(예상 단량체 MW 143.8 kDa)의 SDS-PAGE 분석은 상기 SARS-CoV-2 항원의 예상된 바와 같은 분자량을 나타내었다. SDS-PAGE를 위해, 샘플을 비환원 SDS 로딩 완충액에서 비등시키고, 분리를 위해 10% 겔에서 진행시키고, 쿠마시 염색으로 시각화하였다. 실험용 동물의 면역화 전에 SARS-CoV-2 항원 제조물의 순도, 균질성 및 크기를 확인하기 위해 다중각 광 산란(SEC-MALS) 분석과 결합된 분석 규모 크기-배제 크로마토그래피를 사용하였다. SEC-MALS 분석 결과는 도 3에 예시되어 있다. RBD 항원은 S200 컬럼에서 분석되었고, 다른 4개 항원은 SRT-1000 컬럼에서 분석되었다. 컴파일링된 UV 신호, 광 산란 신호, 및 샘플의 굴절률 신호를 사용하여 ASTRA 소프트웨어 분석을 사용하여 각 제조물에 대한 추정 분자량 및 유체역학적 반경을 계산하였다. 중요한 것은, 이 분석을 통해 모든 SARS-CoV-2 스파이크 단백질 항원이 안정적으로 다량체화되었고 단량체 형태로 해리되지 않았음을 확인하였다는 것이다. 각 정제된 단백질에 대한 UV, 광 산란 및 굴절률 측정을 사용하여, 각 항원에 대한 추정 분자량 및 유체역학적 반경을 계산하였다. 또한, 이 분석을 통해 정제된 샘플이 본질적으로 균질하였고 이러한 조건에서 응집되기 쉽지 않음을 확인하였다. SARS-CoV-2 RBD에 결합하는 SARS1 모노클로날 항체인 CR3022를 사용하여 웨스턴 블롯을 통해 Expi 상청액의 발현 수준을 평가한 결과, HR2 영역을 포함하는 C-말단 결실이 스파이크 삼량체의 맥락에서 발현 수준을 향상시키고, 스파이크 페리틴 융합 단백질의 발현을 심지어 더욱 향상시켰음이 입증되었다.
실시예 3: SARS-CoV-2 스파이크 단백질 항원의 ELISA 결합 분석.
ELISA를 사용하여 인간 ACE2, COVID-19 정제된 모노클로날 항체(CR3022, CB6, COVA2-15) 및 COVID-19 환자 혈청(ADI-15731)에 대한 SARS-CoV-2 스파이크 단백질 항원의 결합을 비교하였다. ELISA를 위해, 각 SARS-CoV-2 스파이크 단백질 항원을 동등한 농도로 소수성으로 플레이팅하였다. 도 4에 예시된 ELISA 결합 곡선은 SARS-CoV-2 스파이크 단백질 항원이 각각에 대한 유사한 결합 수준에 의해 결정된 바와 같이, ACE2 결합 부위 및 모노클로날 항체 에피토프 모두를 유사하게 제시하였음을 나타내었다.
실시예 4: SARS-CoV-2 스파이크-페리틴 단백질의 cryo-EM 분석.
SARS-CoV-2 스파이크-페리틴 단백질의 cryo-EM 분석을 수행하였고, 결과는 도 5에 예시되어 있다. cryo-EM 분석 결과에 따르면, SARS-CoV-2 스파이크-페리틴 단백질은 코로나바이러스의 스파이크 단백질의 표면에 노출된 삼량체가 포함된 나노입자를 형성하였다. FL 스파이크 페리틴 및 ΔC 스파이크 페리틴의 cryo-EM 원시 이미지는 아포페리틴 입자 주위에 명확한 밀도를 보여주며, 이는 나노입자의 적절한 형성 및 표면에 스파이크 삼량체의 표시를 나타낸다. 2D 클래스 평균은 아포페리틴 외부에 스파이크 삼량체의 밀도를 추가로 보여주었지만, 스파이크 단백질 밀도는 이의 가요성으로 인해 얼룩졌다. ΔC 스파이크 페리틴 입자의 원시 이미지 및 2D 클래스 평균이 FL 스파이크 페리틴 입자보다 우수하였으므로, 추가 데이터 수집 및 이미지 처리를 위해 전자를 선택하였다. 단일-입자 분석을 사용하여, ΔC 스파이크 페리틴 복합체의 3차원(3D) 구조는 팔면체 대칭을 적용하거나 적용하지 않고 결정되었다. 두 cryo-EM 맵은 교차-상관 계수가 0.9857로 매우 유사하였다. cryo-EM 분석을 통해 스파이크 삼량체가 나노입자의 표면에 폴딩된 형태로 나타났음을 확인하였다.
실시예 5: SARS-CoV-2 스파이크 단백질 항원의 면역원성.
SARS-CoV-2 스파이크 단백질 항원의 면역원성 분석을 수행하였고, 실험 결과는 도 6-9에 예시되어 있다. 마우스 그룹은 10 μg의 각 SARS-CoV-2 스파이크 단백질 항원, 애주번트로서 10 μg의 Quil-A® 및 10 μg의 MPLA로 면역화되었고, 초기 면역화는 "0일"에 수행되었다. 마우스는 초기 면역화 후 "21일" 및 "28일"에 채혈하였고, "21일"에 부스트 용량의 면역원을 투여하였다. 21일 및 28일에 면역화된 마우스에서 추출된 혈청을 ELISA 및 루시페라제-기반 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 검정으로 분석하였다. 슈도타입형 바이러스를 사용한 중화는 연구 실험실 환경에서 바이러스 억제를 평가하는 일반적인 방법이다.
ELISA를 사용하여 SARS-CoV-2 RBD 단백질 및 SARS-CoV-2 스파이크 단백질에 대한 혈청의 결합을 평가하였다. 21일(도 6) 및 28일(도 8)에 추출된 혈청의 ELISA 결합 분석은 5개 모두의 SARS-CoV-2 스파이크 단백질 항원이 SARS-CoV-2 RBD 및 전장 스파이크 단백질을 향한 항체를 유도하였음을 나타내었다. SARS-CoV-2의 혈청 중화는 루시페라제-기반 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 검정을 사용하여 평가되었다. 21일(도 7) 및 28일(도 9)에 추출된 혈청의 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 검정의 결과는 각 SARS-CoV-2 항원이 SARS-CoV-2 슈도타입형 렌티바이러스를 중화할 수 있는 스파이크-지시 항체를 유도하였음을 나타내었다. 그러나, ΔC 스파이크 페리틴 융합 단백질은 테스트한 모든 항원 중에서 실험용 동물에서 가장 높은 중화 항체 반응을 유도하였다. SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 검정은 21일에 추출된 혈청에 대해 수행되었고, 20개의 회복기 COVID-19 환자 혈장 샘플의 세트("회복기 COVID-19 혈장", 도 7에서 "CCP"로 표시됨)를 비교에 사용하였다. 비교 결과, ΔC 스파이크 페리틴 융합 단백질을 사용한 면역화는 회복기 COVID-19 혈장과 비교하여 적어도 2배 더 큰 중화 항체 역가를 유도한 것으로 나타났다.
실시예 6: SARS-CoV-2 스파이크 단백질 항원으로 면역화 후 면역글로불린-특이적 반응.
Quil-A®/MPLA로 애주번트 처리된 SARS-CoV-2 스파이크 단백질 항원으로 면역화 후 실험용 동물(마우스)의 면역글로불린-특이적 반응을 ELISA를 사용하여 평가하였다. 실험 결과는 도 10-12에 예시되어 있다. 도 10은 2회 용량의 SARS-CoV-2 스파이크 단백질 항원 FL 스파이크 페리틴("S-Fer"), 스파이크ΔC 페리틴("SΔC-Fer"), FL 스파이크 삼량체("S-GCN4"), 스파이크ΔC 삼량체("SΔC-GCN4") 및 RBD로 면역화된 실험용 마우스에서 추출된 혈청의 IgG1, IgG2a, IgG2b 서브클래스 반응에 대한 ELISA 결합 분석 결과를 예시한다. 10 μg 용량의 항원을 2회 투여하였고, 첫 번째 투여 21일 후에 두 번째 용량을 투여하였다. 실험은 Quil-A® 및 MPLA로 애주번트 처리된 2회 용량의 SARS-CoV-2 스파이크 단백질 항원을 사용한 면역화가 강력한 IgG1 및 IgG2 반응 및 최소 수준의 IgM 반응으로 이어졌음을 보여주었다.
도 10에 예시된 실험 결과는 상이한 SARS-Cov-2 스파이크 단백질 항원 그룹 간에 다양한 비율의 IgG 서브클래스를 사용한 광범위한 IgG 반응을 입증하였다. 도 11a에 추가로 예시된 바와 같이, 스파이크ΔC 페리틴 및 FL 스파이크 삼량체는 IgG1 반응에 비해 더 높은 IgG2a 반응을 유도하였고, FL 스파이크 페리틴 및 스파이크ΔC 삼량체 그룹은 대략적으로 균형 잡힌 수준의 IgG2a 및 IgG1 반응을 유도하였고, RBD는 IgG2a 반응보다 실질적으로 더 큰 IgG1 반응을 유도하였다. 도 11b에 추가로 예시된 바와 같이, 각 SARS-CoV-2 스파이크 단백질 항원은 1 미만의 IgG2b/IgG1 비율로 반응을 유도하였고, 이는 IgG1 반응에 비해 낮은 IgG2b 반응을 나타낸다. ELISA는 또한 실험용 동물에서 SARS-CoV-2 스파이크 단백질 항원-특이적 IgM 역가를 결정하는데 사용되었고, 결과는 도 12에 예시되어 있다. IgG와 비교하여 더 낮은 수준의 IgM이 검출되었다.
실시예 7: SARS-CoV-2 스파이크 단백질 항원으로 면역화 후 안정적인 중화 항체 반응.
SARS-CoV-2 스파이크 단백질 항원 FL 스파이크 페리틴("S-Fer"), 스파이크ΔC 페리틴("SΔC-Fer"), FL 스파이크 삼량체 ("S-GCN4"), 스파이크ΔC 삼량체("SΔC-GCN4") 및 RBD로 면역화 후 중화 항체 반응을 루시페라제-기반 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 검정을 사용하여 평가하였고, 결과는 도 13a, 13b 및 14에 예시되어 있다. 그 중에서도, 실험 결과는 스파이크ΔC 페리틴을 사용한 면역화가 용량-의존적 중화 항체 반응으로 이어졌고 면역화 후 최대 20주 동안 안정적인 중화 항체 수준을 유도하였음을 나타내었다.
도 13a는 10 μg의 Quil-A® 및 10 μg의 MPLA로 애주번트 처리된 0.1 μg, 1 μg 또는 10 μg의 스파이크ΔC 페리틴의 피하 투여 28일 후에 실험용 마우스로부터 추출된 혈청의 중화 특성을 예시한다. 도 13b는 10 μg의 Quil-A®로 애주번트 처리된 20 μg의 스파이크ΔC 페리틴의 피하 투여 2주 내지 6주 후에 실험용 동물에서 중화 항체 반응이 증가하였고 중화 항체 반응이 스파이크ΔC 페리틴 투여 후 최대 20주 동안 안정적으로 유지되었음을 예시한다. 도 14는 총 100 μL의 부피 중 10 μg의 Quil-A® 및 10 μg의 MPLA로 애주번트 처리된 두 10 μg 용량의 SARS-CoV-2 스파이크 단백질 항원의 피하 투여 후 실험용 마우스에서 SARS-CoV-2 스파이크 단백질 항원에 대한 중화 항체 반응의 수명을 예시한다. 두 번째 용량은 첫 번째 용량 투여 21일 후에 투여되었다. 중화 항체 수준은 초기 투여 4주, 9주 및 15주 후에 수집된 혈청으로부터 평가되었다.
실시예 8: 애주번트 및 투여 조건의 스크리닝.
스파이크ΔC 페리틴으로 면역화를 위한 애주번트 및 투여 조건의 스크리닝을 수행하였고, 결과는 도 15a 및 15b에 예시되어 있다. 루시페라제-기반 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 검정을 사용하여 실험용 동물에서 수집된 혈청의 중화 특성을 평가하였다. 도 15a는 스파이크ΔC 페리틴으로 단일-용량 면역화를 위한 애주번트 및 투여 조건의 비교를 예시한다. 실험용 마우스에 500 μg의 Alhydrogel® 및 20 μg의 CpG, 또는 10 μg의 Quil-A® 및 10 μg의 MPLA로 애주번트 처리된 단일 용량의 1 μg 또는 10 μg의 스파이크ΔC 페리틴을 피하 투여하였다. 면역화 3주 후에 혈청을 수집하였다. 도 15b는 스파이크ΔC 페리틴으로 1회- 및 2회-용량 면역화를 위한 애주번트 및 투여 조건의 비교를 예시한다. 실험용 마우스에 500 μg의 Alhydrogel® 및 20 μg의 CpG, AddaVax™, 또는 10 μg의 Quil-A® 및 10 μg의 MPLA로 애주번트 처리된 첫 번째(초기 또는 프라임) 용량의 1 μg 또는 10 μg의 스파이크ΔC 페리틴을 피하 투여하였다. 혈청은 초기 면역화 21일 후에 수집되었고, 그 시점에 실험용 마우스에 500 μg의 Alhydrogel® 및 20μg의 CpG, AddaVax™, 또는 10 μg의 Quil-A® 및 10 μg의 MPLA로 애주번트 처리된 두 번째(부스트) 용량의 1 μg 또는 10 μg의 스파이크ΔC 페리틴을 피하 투여하였다. 프라임 및 부스트 용량은 실험용 동물의 각 그룹에서 동일하였다. 혈청이 또한 초기 면역화 28일 후에 수집하였다. 도 15b에 예시된 결과는 테스트한 모든 애주번트 조건이 스파이크ΔC 페리틴으로 면역화 후 정량화할 수 있는 중화 항체 수준을 유도하였음을 보여주었고, 500 μg의 Alhydrogel® 및 20 μg의 CpG는 1회 용량 후 가장 강력한 반응을 유도하였고, 10 μg의 Quil-A® 및 10 μg의 MPLA는 2회 용량 후 가장 강력한 반응을 유도하였다.
실시예 9: 2개의 상이한 SARS-CoV-2 스파이크 단백질 항원에 의해 유도된 중화 항체 반응의 비교.
2개의 상이한 SARS-CoV-2 스파이크 단백질 항원, 스파이크ΔC 페리틴("SΔC-Fer McLellan") 및 스파이크HexaProΔC 페리틴("SΔC-Fer HexaPro")에 의해 유도된 중화 항체 반응의 비교를 수행하였고, 결과는 도 16에 예시되어 있다. 스파이크HexaProΔC 페리틴(SEQ ID NO:16)은 실시예 1 및 문헌[Hsieh et al., 2020]에 기술된 것과 실질적으로 유사한 절차를 사용하여 발현 및 정제되었다. 실시예 1에 기술된 것과 실질적으로 유사한 절차를 사용하여, 실험용 마우스를 10 μg의 Quil-A® 및 10 μg의 MPL로 애주번트 처리된 2회 용량의 10 μg의 스파이크ΔC 페리틴 또는 스파이크HexaProΔC 페리틴으로 면역화하였다. 두 번째(부스트) 용량은 초기 면역화 21일 후에 투여되었다. 혈청은 초기 면역화 21일, 28일 및 56일 후에 수집되었다. 실험용 마우스에서 수집된 혈청의 중화 특성은 루시페라제-기반 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 검정을 사용하여 평가되었다. 스파이크ΔC 페리틴 및 스파이크HexaProΔC 페리틴에 의해 유도된 중화 항체 반응의 비교 결과, 스파이크HexaProΔC 페리틴은 스파이크ΔC 페리틴보다 더욱 면역원성인 것으로 나타났다. HexaPro SARS-CoV-2 스파이크 단백질 서열(SEQ ID NO:14)에 기반한 SARS-CoV-2 스파이크 단백질 항원은 아래에 표시된다. SARS-CoV-2 스파이크 신호 펩티드 서열은 굵게/밑줄이 있는 글꼴로 표시되고, 헥사히스티딘 태그 서열은 굵게 표시되며, Ser/Gly 링커 영역은 밑줄로 표시되고, GCN4 삼량체화 도메인 서열은 이탤릭체로 표시되고, H. 파일로리 페리틴 서열은 이탤릭체 및 밑줄로 표시된다.
스파이크HexaProΔC 페리틴 ("HexaPro ΔC 페리틴") - SEQ ID NO:16
스파이크HexaProΔC 페리틴 변이체 ("HexaPro ΔC 페리틴 변이체") - SEQ ID NO:17
스파이크HexaPro 페리틴 ("HexaPro 페리틴") - SEQ ID NO:18
스파이크HexaPro GCN4 ("HexaPro GCN4") - SEQ ID NO:19
스파이크HexaProΔC GCN4 ("HexaPro ΔC GCN4") - SEQ ID NO:20
실시예 10: 3개의 상이한 SARS-CoV-2 스파이크 단백질 항원의 발현 및 정제 수율의 비교.
다음 SARS-CoV-2 스파이크 단백질 항원의 발현 및 정제 수율을 비교하였고: ΔC 스파이크 페리틴 융합 단백질("스파이크ΔC 페리틴", SEQ ID NO:13, 도 17b-19에서 "Krammer"로 표기됨), ΔC 스파이크 페리틴 융합 단백질 변이체("스파이크ΔC 페리틴 변이체", SEQ ID NO:21, 도 17b-19에서 "McLellan"으로 표기됨), 및 스파이크HexaProΔC 페리틴("HexaPro ΔC 페리틴", SEQ ID NO:16, 도 17b-19에서 "HexaPro"로 표시됨), 결과는 도 17a 및 17b에 예시되어 있다. ΔC 스파이크 페리틴 융합 단백질 변이체(SEQ ID NO:14)의 아미노산 서열은 아래에 표시된다. SARS-CoV-2 스파이크 신호 펩티드 서열은 굵게/밑줄이 있는 글꼴로 표시되고, Ser/Gly 링커 영역은 밑줄로 표시되며, H. 파일로리 페리틴 서열은 이탤릭체 및 밑줄로 표시된다.
ΔC 스파이크 페리틴 융합 단백질 변이체 ("스파이크ΔC 페리틴 변이체") - SEQ ID NO:21
상기 3개의 SARS-CoV-2 스파이크 단백질 항원 각각은 실시예 1 및 문헌[Hsieh et al., 2020]에 설명된 절차에 기반한 절차를 사용하여 발현 및 정제되었다. 각 SARS-CoV-2 스파이크 단백질에 대해 이중으로 수행된 발현은 Freestyle™ 및 Expi293™ 발현 배지(Thermo Fisher Scientific, Waltham, Massachusetts)가 2:1 비율로 혼합된 배지에서 배양된 Expi293F 세포에서 수행되었고 제조업체의 지침에 따라 FectPRO® 시약(Polyplus transfection, New York, New York)으로 형질감염되었다. 배양 4-5일 후, 배양 배지를 회전 및 여과에 의해 정화하였다. 정화된 배지를 20 mM Tris, pH 8.0, 완충액으로 희석하고 낮은 이온 강도 완충액(완충액 A, 10 mM Tris, pH 8.0)으로 미리-평형화된 HiTrap Q® HP(Cytiva, Marlborough, Massachusetts) 컬럼에 샘플 펌프로 로딩하였다. 컬럼을 5 컬럼 부피의 완충액 A로 세척하고 완충액 B의 구배(10 mM Tris, pH 8.0, 1M NaCl)를 적용하였다. 5-25% 완충액 B로 용리된 분획을 수집하고 원심 농축기(Amicon®, MilliporeSigma, 100 kDa 컷오프)를 사용하여 20배 농축하였다. 생성된 농축물을 PBS로 10배 희석하고 다시 원심 농축기로 농축하였다. SRT1000 겔 여과 컬럼이 있는 AKTA™ pure FPLC(Cytiva, Marlborough, Massachusetts) 시스템을 추가 정제에 사용하였다.
겔 여과를 위해, 2 ml의 샘플을 2 ml 루프를 사용하여 FPLC 시스템에 주입하고 탈기된 PBS 완충액으로 미리-평형화된 SRT1000 컬럼에 적용하였다. SARS-CoV-2 스파이크 단백질 항원을 포함하는 분획을 수집하고, 풀링하고, 원심 농축기로 농축하였다. 글리세롤 또는 수크로스를 10%의 최종 농도(수크로스의 경우 중량 기준 또는 글리세롤의 경우 부피 기준)로 농축된 샘플에 첨가한 다음 0.22 μm 필터로 여과하고 0.4-0.5 mg/ml의 액체 질소로 급속-냉동하였다. 도 17a는 풀링된 분획이 음영 처리된 SARS-CoV-2 스파이크 단백질 항원의 대표적인 크기-배제 크로마토그래피 추적을 보여준다. 획득된 각 SARS-CoV-2 스파이크 단백질의 상대적인 양은 SARS-CoV-2 스파이크 단백질 항원을 포함하는 분획을 나타내는 곡선 아래 음영 영역으로 계산되었다(도 17a에 예시됨). 도 17b는 전술한 발현 및 정제 절차에 의해 획득된 각 SARS-CoV-2 스파이크 단백질 항원의 상대적인 양의 비교를 예시한다. 도 17b에 예시된 비교는 스파이크HexaProΔC 페리틴의 수율이 스파이크ΔC 페리틴 또는 스파이크ΔC 페리틴 변이체의 수율보다 약 2.5배 더 높음을 나타내었다.
실시예 11: 3개의 상이한 SARS-CoV-2 스파이크 단백질 항원의 면역원성.
실시예 10에 기술된 3개의 SARS-CoV-2 스파이크 단백질 항원 각각의 잠재적 면역원성을 평가하였다. Octet® 시스템(Sartorius, Gottingen, Germany)에서 생물층 간섭계(BLI)를 사용하여 입체형태적 모노클로날 항체(mAb) 및 ACE2 수용체에 대한 SARS-CoV-2 스파이크 단백질 항원의 결합을 테스트하였다. SARS-CoV-2 반응성 mAb, CR3022(HC GenBank DQ168569, LC Genbank DQ168570), CB6(HC GenBank MT470197, LC GenBank MT470196), 및 COVA-2-15(HC GenBank MT599861, LC GenBank MT599945)에 대한 가변 중쇄(HC) 및 가변 경쇄(LC) 서열은 IDT Codon Optimization Tool을 사용하여 인간 발현을 위해 코돈-최적화되고 IDT의 유전자 블록 단편으로 정렬되었다. 단편을 PCR로 증폭하고 In-Fusion® 클로닝 시스템(Takara Bio, Shiga, Japan)을 사용하여 VRC01의 중쇄 또는 경쇄 Fc 서열을 포함하는 CMV/R 발현 벡터에 삽입하였다. Fc 태그가 있는 가용성 인간 ACE2는 Addgene 플라스미드 #1786의 ACE2(아미노산 잔기 1-615를 인코딩하는 서열)를 PCR-증폭하고 이를 스티칭 PCR 단계를 사용하여 TEV-GSGG(SEQ ID NO:5) 링커에 의해 분리된 VRC01의 인간 Fc 도메인에 융합시켜 작제되었다. ACE2-Fc는 EcoRI/XhoI 절단 부위를 사용하여 In-Fusion®을 통해 pADD2 포유동물 발현 벡터에 삽입되었다. 정제된 스파이크 나노입자에 대한 SARS-CoV-2 mAb 및 ACE2 수용체-Fc 융합 단백질을 Octet Fc-결합 팁에 100 nM 농도로 로딩하고, 팁을 Octet 결합 완충액으로 150 nM(SARS-CoV-2 스파이크 단백질 항원 단량체 농도)로 희석하여 테스트 중인 SARS-CoV-2 스파이크 단백질 항원과 함께 웰에 침지시켰다. 결합 60초 후, 팁을 완충액만 존재하는 웰로 옮겼다(해리를 측정하기 위해). 도 18에 예시된 바와 같이, 3개의 SARS-CoV-2 스파이크 단백질 항원 각각이 입체형태적 항체 및 ACE2 수용체에 동등하게 결합하는 것이 관찰되었다. 상기 실험적 관찰을 통해 3개의 SARS-CoV-2 스파이크 단백질 항원 각각이 유사한 방식으로 에피토프를 표시하였음이 확인되었고 면역원성 부위의 제시가 테스트된 SARS-CoV-2 스파이크 단백질 항원 간의 서열 차이에 의해 영향을 받지 않는다는 것이 입증되었다.
SARS-CoV-2 스파이크 단백질 항원에 의해 유도된 중화 항체 반응의 비교는 다음 면역화 시스템을 사용하여 수행되었다. 그룹 당 10마리의 마우스를 500 μg의 명반(InvinoGen, San Diego, California) 및 20 μg의 CpG(InvivoGen)로 애주번트 처리된 2회 용량의 10 μg의 각 SARS-CoV-2 스파이크 단백질 항원으로 면역화하였다. 용량은 "0일" 및 "21일"에 근육내 주사로 투여하였고, 혈액 샘플은 "0일"(면역화 전), "21일" 및 "42일"에 채혈하였다. 실험용 동물로부터 수집된 혈청의 중화 역가는 실시예 1에 기술된 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 중화 검정을 사용하여 평가되었다. 세포의 감염성은 루시페라제 효소 활성을 측정하여 48시간 후에 측정되었다. 상대적인 루시페라제 효소 활성을 혈청 희석에 대해 플롯팅하고 희석 곡선에서 50% 감염 농도(IC50)를 계산하였다. 결과는 도 19에 예시되어 있다. 테스트한 3개의 SARS-CoV-2 스파이크 단백질 항원은 통계적으로 다르지 않은 중화 역가를 생성하였다.
실시예 12: SARS-CoV-2 스파이크 단백질 항원의 동결건조.
동결건조된 스파이크HexaProΔC 페리틴에 대한 실험적 연구가 수행되었고, 수크로스의 존재 하에서 동결건조되고 이후 재구성된 스파이크HexaProΔC 페리틴이 그 구조 및 면역원성을 유지하였음이 입증되었다. 실험 연구의 결과는 도 20-26에 예시되어 있다. 첫 번째 일련의 연구를 위해, 스파이크HexaProΔC 페리틴을 실시예 10에 기술된 바와 같이 발현 및 정제하고 10% 수크로스와 함께 PBS에서 급속 냉동하였다. 동결건조 및 재구성된 스파이크HexaProΔC 페리틴("동결건조된 샘플")을 생성하기 위해, 냉동된 샘플을 동결 건조기(Labconco™, Kansas City, Missouri)에서 밤새 동결건조하고 10% 수크로스와 함께 PBS의 시작 부피와 동일한 부피의 물에 재현탁하였다.
스파이크HexaProΔC 페리틴이 손실 없이 동결건조되고 재구성될 수 있음을 확인하기 위해, 냉동 및 해동된 스파이크HexaProΔC 페리틴 샘플("냉동된 샘플") 및 동결건조된 샘플의 UV 흡광도 스펙트럼을 비교하였고, 결과는 도 20에 예시되어 있다. 시차 주사 형광측정법(결과는 도 21에 예시되어 있음)을 통해 스파이크HexaProΔC 페리틴이 냉동된 및 동결건조된 샘플에서 동일한 열 안정성을 가짐을 확인하였다. 동결건조된 샘플의 스파이크HexaProΔC 페리틴이 입체형태적 에피토프를 유지하는지 확인하기 위해, 두 샘플 모두를 실질적으로 실시예 11에 설명된 대로 BLI로 테스트하였다. BLI 분석 결과는 도 22에 예시되어 있다. BLI 분석은 냉동된 및 동결건조된 샘플이 유사한 방식으로 입체형태적 항체 및 ACE 수용체에 결합하였음을 보여주었고, 이는 면역원성 부위의 제시가 동결건조 및 재구성에 의해 영향을 받지 않았음을 입증한다.
동결건조 및 재구성된 스파이크HexaProΔC 페리틴의 면역원성을 냉동 및 해동된 스파이크HexaProΔC 페리틴의 면역원성과 비교하였다. 냉동된 및 동결건조된 샘플을 각각 5마리의 마우스로 구성된 3개의 동일한 그룹(총 6개 그룹)에 투여하였다. 투여 전에, 동결건조된 및 냉동된 샘플을 실온에서 1시간 동안 인큐베이션하였다. 1시간 후, 10 μg의 단백질과 500 μg의 명반 및 20 μg의 CpG를 혼합하여 샘플을 제형화하였다. 마우스는 "0일"에 근육내 주사를 통한 면역화에 의해 프라이밍되었고, 혈액 샘플은 프라이밍 전 "0일", 면역화 후 "21일" 및 "42일"에 수집되었다. SARS-CoV-2 RBD 단백질에 대한 항혈청의 결합은 "21일"에 측정되었다. 96-웰 플레이트를 재조합 SARS-CoV-2 RBD 단백질로 코팅하고, 희석된 혈청 샘플의 역가를 ELISA로 측정하였다. 혈청 희석에 대해 광학 밀도를 플롯팅하고, 희석 곡선에서 50% 유효 농도(EC50)를 계산하였다. 결과는 도 23에 예시되어 있다. SARS-CoV-2 슈도바이러스 중화 역가는 "21일" 및 "42일"에 테스트되었다. 희석된 마우스 혈청 샘플을 "델타 21-스파이크" 단백질(C-말단 21개 아미노산 결실이 있는 SARS-CoV-2 스파이크 단백질) 및 루시페라제를 포함하는 슈도타입형 SARS-CoV-2 바이러스와 함께 1시간 동안 인큐베이션하고, ACE2 및 막횡단 세린 프로테아제 2(TMPRSS2)를 발현하는 HeLa 세포에 첨가하였다. 세포의 감염성은 루시페라제 효소 활성을 측정하여 48시간 후에 측정되었다. 상대적인 루시페라제 효소 활성을 혈청 희석에 대해 플롯팅하고 희석 곡선에서 50% 감염 농도(IC50)를 계산하였다. 결과는 도 24에 예시되어 있다. 상기 연구는 RBD 결합 역가 및 SARS-CoV-2 슈도바이러스 중화 역가가 냉동된 및 동결건조된 백신 후보로 면역화된 마우스의 혈청 간에 통계적으로 차이가 없음을 보여주었다.
스파이크HexaProΔC 페리틴은 휘발성 암모늄 바이카르보네이트 완충액에서 동결건조되고 10 mg/ml 이상의 농도로 재현탁될 수 있음이 입증되었다. PBS와 같은 비휘발성 완충액에서의 동결건조는 재구성 후 매우 높은 염 농도의 축적을 방지하기 위해 유사한 부피의 물에 재현탁해야 한다. 휘발성 완충액을 사용하면 단백질을 시작 부피에 비해 더 작은 부피로 재현탁하여, 샘플 농도를 증가시킬 수 있다. 암모늄 바이카르보네이트 완충액에서의 동결건조를 위해, 1% 수크로스(중량 기준)를 안정화제로 사용하였다. 동결건조된 샘플의 재구성(가용화) 용이성에 기초하여 1% 수크로스를 선택하였다. 스파이크HexaProΔC 페리틴을 실시예 10에 기재된 바와 같이 발현 및 정제하고, 10 mM 암모늄 바이카르보네이트, pH 7.8로 밤새 투석하였다. 투석 후, 수크로스를 1% 최종 농도(중량 기준)로 첨가하였다. 그런 다음 샘플을 액체 질소에서 1 mg/ml 단백질 농도로 급속 냉동하고, 밤새 동결건조하고, 약 11 mg/ml의 단백질 농도로 PBS에 재현탁하였다. 이어서 재구성된 샘플을 BLI에 의해 입체형태적 항체 CB6 및 ACE2 수용체에 대한 결합에 대해 테스트하였다(결과는 도 25에 예시되어 있음). 샘플 내 스파이크HexaProΔC 페리틴 나노입자의 구조적 완전성은 크기 배제 크로마토그래피 - 다중각 광 산란(SEC-MALS)으로 확인되었다. SEC-MALS 실험 결과는 도 26에 예시되어 있다. 도 26은 휘발성 암모늄 바이카르보네이트 완충액에서 동결건조된 SARS-CoV-2 스파이크 단백질 항원의 특성을 테스트한 SEC-MALS 결과를 예시한다. SEC-MALS 실험을 위해, 재구성 직후 PBS에서 평형화된 SRT SEC-1000 4.6 × 300 mm 컬럼에 5 μg의 단백질을 로딩하였다. UV 및 광-산란 추적 모두에서 검출된 단일의 우세한 피크는 샘플의 나노입자가 균질하고 응집되지 않았음을 확인하였다. 그런 다음 샘플을 실온에서 4일 동안 보관하고, 샘플을 확인하기 위해 SEC-MALS 실험을 반복하였다.
실시예 13: 조작된 글리코실화에 의한 페리틴 도메인 면역원성의 감소.
본 개시의 특정 구현예에 따른 SARS-CoV-2 스파이크 페리틴 융합 단백질 항원의 페리틴 도메인의 면역원성을 감소시키기 위해, 인공 글리코실화 부위가 페리틴 도메인에 설치되도록 설계하였다. 본 개시에 따른 융합 단백질의 페리틴 도메인은 N-결합된 단백질 글리코실화에 필요한 자연 발생 공통 서열 NXS/T(여기서 X는 P일 수 없음)를 포함하지 않는다. 페리틴 도메인에 인공 글리코실화 부위를 작제하기 위해, 융합 단백질 나노입자의 3중 대칭축에서 멀리 떨어진 위치를 선택하고, 2개의 아미노산 치환을 도입하여 인공 글리코실화 부위를 생성하였다. 3중 대칭축에서 멀리 떨어진 위치를 선택하는 것은 SARS-CoV-2 스파이크 융합 단백질 항원의 스파이크 단백질 도메인(3중 축에 위치함)에 대한 면역 반응의 중단을 최소화하기 위해 구상된다. 인공 글리코실화 부위를 갖는 스파이크HexaProΔC 페리틴 변이체의 예는 SEQ ID NO:22-25로 표시된다. SARS-CoV-2 스파이크 신호 펩티드 서열은 굵게/밑줄이 있는 글꼴로 표시되고, Ser/Gly 링커 영역은 밑줄로 표시되며, H. 파일로리 페리틴 서열은 이탤릭체 및 밑줄로 표시되고, 페리틴 도메인의 아미노산 치환은 이탤릭체, 밑줄 및 굵게 표시된다.
인공 글리코실화 부위를 갖는 스파이크HexaProΔC 페리틴 변이체 1 ("HexaPro ΔC Gly 1 페리틴") - SEQ ID NO:22
인공 글리코실화 부위를 갖는 스파이크HexaProΔC 페리틴 변이체 2 ("HexaPro ΔC Gly 2 페리틴") - SEQ ID NO:23
인공 글리코실화 부위를 갖는 스파이크HexaProΔC 페리틴 변이체 3 ("HexaPro ΔC Gly 3 페리틴") - SEQ ID NO:24
인공 글리코실화 부위를 갖는 스파이크HexaProΔC 페리틴 변이체 4 ("HexaPro ΔC Gly 4 페리틴") - SEQ ID NO:25
SEQ ID NO:22에서, 2개의 아미노산 치환은 SEQ ID NO:2의 위치 75에 상응하는 위치에서 K에서 N, 및 SEQ ID NO:2의 위치 77에 상응하는 위치에서 E에서 T로의 치환이다. SEQ ID NO:23에서, 2개의 아미노산 치환은 SEQ ID NO:2의 위치 67에 상응하는 위치에서 T에서 N, 및 SEQ ID NO:2의 위치 69에 상응하는 위치에서 I에서 T로의 치환이다. SEQ ID NO:24에서, 2개의 아미노산 치환은 SEQ ID NO:2의 위치 74에 상응하는 위치에서 H에서 N, 및 SEQ ID NO:2의 위치 76에 상응하는 위치에서 F에서 T로의 치환이다. SEQ ID NO:25에서, 2개의 아미노산 치환은 SEQ ID NO:2의 위치 143에 상응하는 위치에서 E에서 N, 및 SEQ ID NO:2의 위치 145에 상응하는 위치에서 H에서 T로의 치환이다. 도 27은 SEQ ID NO:22로부터 형성된 SARS-CoV-2 스파이크 융합 단백질 나노입자에서 조작된 글리코실화 부위의 위치를 개략적으로 예시한다.
실시예 14: 코로나바이러스 스파이크 단백질의 자연 발생 변이체에 기초한 SARS-CoV-2 스파이크 단백질 항원의 테스트.
코로나바이러스 스파이크 단백질의 자연 발생 변이체에 기초한 SARS-CoV-2 스파이크 단백질 항원의 테스트를 수행하였다. 코로나바이러스 스파이크 단백질 변이체는 자연적으로 순환하는 5개의 SARS-CoV-2 변이체: D614G, B.1.1.7, B.1.429("LA 변이체"라고도 함), P1 및 B.1.351로부터 연구를 위해 선택되었고, 이들은 특히 미국 보건복지부의 질병 통제 및 예방 센터에서 "관심 변이체"로 간주되었다. 이러한 SARS-CoV-2 스파이크 단백질 변이체("변이체 SARS-CoV-2 스파이크 단백질 항원")에 기초한 융합 단백질의 아미노산 서열은 아래에 SEQ ID NO:26(D614G 기반), SEQ ID NO:27(B.1.1.7 기반), SEQ ID NO:28(B.1.351 기반), SEQ ID NO:29(B.1.429 기반) 및 SEQ ID NO:30(P1 기반)으로 표시된다. SARS-CoV-2 스파이크 신호 펩티드 서열은 굵게/밑줄이 있는 글꼴로 표시되고, Ser/Gly 링커 영역은 밑줄로 표시되며, H. 파일로리 서열은 이탤릭체 및 밑줄로 표시되고, SEQ ID NO:2와 비교하여 스파이크 도메인 내의 아미노산 치환(표 1에도 요약되어 있음)은 굵게 표시되고, 결실은 밑줄 기호로 표시된다.
스파이크HexaProΔC 페리틴 D614G ("HexaPro ΔC 페리틴 D614G") - SEQ ID NO:26
스파이크HexaProΔC 페리틴 B.1.1.7 ("HexaPro ΔC 페리틴 B.1.1.7") - SEQ ID NO:27
스파이크HexaProΔC 페리틴 B.1.351 ("HexaPro ΔC 페리틴 B.1.351") - SEQ ID NO:28
스파이크HexaProΔC 페리틴 B.1.429 ("HexaPro ΔC 페리틴 B.1.429") - SEQ ID NO:29
스파이크HexaProΔC 페리틴 P1 ("HexaPro ΔC 페리틴 P1") - SEQ ID NO:30
코로나바이러스 스파이크 단백질의 자연 발생 변이체에 기초한 상기 SARS-CoV-2 스파이크 단백질 항원의 발현 및 정제는 실질적으로 실시예 10에 기재된 바와 같이 수행되었다. 단백질 샘플은 보관을 위해 10% 수크로스와 함께 PBS에서 급속 냉동되었다. BLI는 SARS-CoV-2 스파이크 단백질 항원이 입체형태적 mAb 및 ACE2 수용체에 결합하는 것을 확인하는데 사용되었다. BLI 실험은 실질적으로 실시예 11에 기재된 바와 같이 수행되었다. 결과는 도 28에 요약되어 있다. 입체형태적 항체 및 ACE2 수용체에 대한 스파이크HexaProΔC 페리틴 및 5개의 변이체 SARS-CoV-2 스파이크 단백질 항원 각각의 동등한 결합이 관찰되었다.
변이체 SARS-CoV-2 스파이크 단백질 항원에 의해 유도된 중화 항체 반응에 대한 테스트가 수행되었다. 그룹 당 5마리의 마우스를 각각의 변이체 SARS-CoV-2 스파이크 단백질 항원 및 스파이크HexaProΔC 페리틴(SEQ ID NO:16)으로 면역화하였다. 면역화는 실질적으로 실시예 11에 기재된 바와 같이 수행되었다. 혈액 샘플은 "0일"(면역화 전), "21일" 및 "28일"에 채혈되었다. 실험용 동물에서 수집된 혈청의 중화 역가는 6개의 슈도바이러스(Wuhan-1, D614G, B.1.429, B1.1.7, P1 및 B.1.351) 패널에 대해 실시예 1에 기술된 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 중화 검정을 사용하여 평가되었다. 결과는 "21일"의 풀링된 혈청을 사용하여 SARS-CoV-2 스파이크 슈도타입형 렌티바이러스 중화 검정을 사용하여 생성된 36개의 IC50 값, 및 "28일"의 풀링된 혈청에서의 또 다른 36개의 값으로 요약된다. 결과는 도 29의 표에 제시된 "히트 맵"으로 요약된다. 표에 제시된 각 값은 특정 슈도타입형 바이러스에 대한 동일한 SARS-CoV-2 스파이크 단백질 항원으로 면역화된 마우스로부터 풀링된 혈청의 log10IC50 값이다. 도 29에 요약된 분석을 통해 각 바이러스 변이체에 대한 각 SARS-CoV-2 스파이크 단백질 항원의 중화 활성을 비교할 수 있었다. SARS-CoV-2 스파이크 단백질 항원의 스파이크HexaProΔC 페리틴 버전으로 면역화된 동물은 테스트된 슈도바이러스 패널 전반에 걸쳐 가장 높은 중화 역가를 가졌다.
실시예 15: 애주번트 테스트.
애주번트 테스트는 애주번트 처리된 스파이크HexaProΔC 페리틴(SEQ ID NO:16)으로 면역화된 마우스에서 SARS-CoV-2 중화 반응을 테스트하여 수행되었다. 결과는 도 30a-34f에 예시되어 있다. 도 30a 및 30b는 500 μg의 명반으로 애주번트 처리된 스파이크HexaProΔC 페리틴으로 면역화된 마우스에서 야생형 SARS-CoV-2에 대한 중화 반응의 실험적 테스트 결과를 예시한다. 5마리 마우스의 그룹은 피하 주사를 통해 500 μg의 명반(Alhydrogel®, InvivoGen, San Diego, California)으로 애주번트 처리된 5 μg의 스파이크HexaProΔC 페리틴으로 면역화되었다. 첫 번째 그룹(도 30a)은 1회 면역화되었고, 두 번째 그룹(도 30b)은 초기 면역화 21일 후에 부스팅되었다. 면역 반응을 모니터링하기 위해 표시된 시점에 마우스를 채혈하였고, 이후 야생형 SARS-CoV-2 슈도바이러스 중화 역가를 실질적으로 본 개시의 다른 곳에서 논의된 바와 같이 측정하였다. 간단히, 희석된 마우스 혈청 샘플을 슈도타입형 SARS-CoV-2 바이러스와 함께 1시간 동안 인큐베이션하고 ACE2 및 TMPRSS 2를 발현하는 HeLa 세포에 첨가하였다. 세포의 감염성은 루시페라제 효소 활성을 측정하여 48시간 후에 측정되었다. 상대적인 루시페라제 효소 활성을 혈청 희석에 대해 플롯팅하고 희석 곡선에서 50% 감염 농도(IC50)를 계산하였다. 실험 결과, 명반으로 애주번트 처리된 스파이크HexaProΔC 페리틴을 사용한 단일 용량 면역화가 마우스에서 SARS-CoV-2 중화 반응을 유도한 것으로 나타났다. 21일차 부스트가 중화 반응을 개선했지만, 명반으로 애주번트 처리된 스파이크HexaProΔC 페리틴을 사용한 단일-용량 면역화는 SARS-CoV-2에 대한 적절한 면역 반응을 생성하기에 충분했다.
도 31a 및 31b는 500 μg의 명반으로 애주번트 처리된 스파이크HexaProΔC 페리틴으로 면역화된 마우스에서 야생형 SARS-CoV-2 및 SARS-CoV-2 변이체에 대한 중화 반응의 실험적 테스트 결과를 예시한다. 10마리 마우스의 그룹은 피하 주사를 통해 500 μg의 명반(Alhydrogel®, InvivoGen, San Diego, California)으로 애주번트 처리된 5 μg의 스파이크HexaProΔC 페리틴으로 면역화되었다. 첫 번째 그룹(도 31a)은 1회 면역화되었고, 두 번째 그룹(도 31b)은 초기 면역화 21일 후에 부스팅되었다. 면역 반응을 모니터링하기 위해 초기 면역화 63일 후에 마우스를 채혈하였다. 이어서, 실질적으로 상기 및 본 개시의 다른 곳에서 논의된 바와 같이 슈도타입형 야생형 SARS-CoV-2 및 SARS-CoV-2 변이체에 대해 혈청 샘플의 중화 역가를 검정하였다. 실험 결과, 명반으로 애주번트 처리된 단일 용량의 스파이크HexaProΔC 페리틴으로 면역화된 마우스의 혈청이 야생형 SARS-CoV-2 및 SARS-CoV-2 변이체를 모두 중화할 수 있는 것으로 나타났다. 21일차 부스트가 중화 활성을 증가시켰지만, 명반으로 애주번트 처리된 스파이크HexaProΔC 페리틴을 사용한 단일 용량 면역화가 B.1.617.2("델타 변이체")를 포함하는 테스트된 모든 변이체에 대해 SARS-CoV-2 항바이러스 반응을 일으키는데 효과적이었다.
도 32a 및 32b는 명반 및 CpG로 애주번트 처리된 스파이크HexaProΔC 페리틴으로 면역화된 마우스에서 야생형 SARS-CoV-2 및 SARS-CoV-2 변이체에 대한 중화 반응의 실험적 테스트 결과를 예시한다. 10마리 마우스의 그룹을 피하 주사를 통해 500 μg의 명반(Alhydrogel®, InvivoGen, San Diego, California) 및 20 μg의 CpG(InvivoGen, San Diego, California)로 애주번트 처리된 5 μg의 스파이크HexaProΔC 페리틴으로 면역화하였다. 첫 번째 그룹(도 32a)은 1회 면역화되었고, 두 번째 그룹(도 32b)은 초기 면역화 21일 후에 부스팅되었다. 면역 반응을 모니터링하기 위해 초기 면역화 63일 후에 마우스를 채혈하였다. 이어서, 실질적으로 상기 및 본 개시의 다른 곳에서 논의된 바와 같이 슈도타입형 야생형 SARS-CoV-2 변이체에 대해 혈청 샘플의 중화 역가를 검정하였다. 실험 결과, 명반 및 CpG로 애주번트 처리된 단일 용량의 스파이크HexaProΔC 페리틴이 야생형 SARS-CoV-2 및 SARS-CoV-2 변이체 모두에 대해 마우스에서 강력한 중화 반응을 유도하는 것으로 나타났다. 21일차 부스트는 중화 활성을 증가시켰다. 실험적 테스트는 명반 외에 애주번트로서 CpG를 포함시키는 것이 명반 단독 사용에 비해 유리하였음을 보여주었다.
도 33은 다양한 용량의 명반(Alhydrogel®, InvivoGen, San Diego, California)으로 애주번트 처리된 스파이크HexaProΔC 페리틴으로 면역화된 마우스에서 야생형 SARS-CoV-2에 대한 중화 반응의 실험적 테스트 결과를 예시한다. 5마리 마우스의 그룹은 피하 주사를 통해 500, 50 또는 5 μg의 명반(Alhydrogel®, InvivoGen, San Diego, California)으로 애주번트 처리된 5 μg의 스파이크HexaProΔC 페리틴으로 면역화되었다. 면역 반응을 모니터링하기 위해 초기 면역화 후 상이한 시점에 마우스를 채혈하였다. 이어서, 실질적으로 상기 및 본 개시의 다른 곳에서 논의된 바와 같이 슈도타입형 야생형 SARS-CoV-2 변이체에 대해 혈청 샘플의 중화 역가를 검정하였다. 실험은 명반의 용량을 늘리면 면역 반응이 개선되고, 명반의 용량을 줄이면 부스트가 유리하다는 것을 보여주었다. 실험은 또한 최고 테스트 용량의 명반으로 애주번트 처리된 단일-용량의 스파이크HexaProΔC 면역화(부스트 없음)에 의해 유도된 중화 반응이 시간이 지남에 따라 개선되었음을 보여주었다. 테스트된 최고 용량의 명반을 사용하여, 42일 및 84일에 측정된 단일-용량 중화 반응은 프라임-부스트 요법에 의해 유도된 중화 반응과 비슷하였다. 따라서, 더 높은 양의 명반으로 애주번트 처리된 스파이크HexaProΔC를 사용한 단일 용량 면역화는 항-SARS-CoV-2 반응을 일으키기에 충분할 수 있다.
도 34a-34f는 다양한 용량의 명반(Alhydrogel®, InvivoGen, San Diego, California)을 단독으로 또는 20 μg의 CpG와 함께 애주번트 처리한 스파이크HexaProΔC 페리틴으로 면역화된 마우스에서 야생형 SARS-CoV-2 및 SARS-CoV-2 변이체에 대한 중화 반응의 실험적 테스트 결과를 예시한다. 5마리 마우스의 그룹은 피하 주사를 통해 500, 50 또는 50 μg의 명반(Alhydrogel®, InvivoGen, San Diego, California)으로 애주번트 처리된 10 μg의 스파이크HexaProΔC 페리틴으로 면역화되었다. 테스트된 각 애주번트에 대해, 한 그룹은 단일 면역화를 받았고, 두 번째 그룹은 1차 면역화 21일 후에 부스팅되었다. 면역 반응을 모니터링하기 위해 21일 및 28일에 마우스를 채혈하였다. 각 그룹의 5마리 마우스의 혈청 샘플을 풀링하였다. 이어서, 실질적으로 상기 및 본 개시의 다른 곳에서 논의된 바와 같이 슈도타입형 야생형 SARS-CoV-2 변이체에 대해 풀링된 혈청 샘플의 중화 역가를 검정하였다. 실험은 프라임-부스트 요법에서 50 내지 150 μg의 명반 용량으로 애주번트 처리된 스파이크HexaProΔC를 사용한 면역화가 B.1.617.2("델타 변이체")를 포함하는 야생형 SARS-CoV-2 및 SARS-CoV-2 변이체 모두에 대해 적절한 중화 반응을 유도하였음을 보여주었다.
실시예 16: 스파이크HexaProΔC 페리틴 변형.
SARS-CoV-2 단백질의 신호 펩티드 서열의 다른 버전을 포함하는 스파이크HexaProΔC 페리틴의 변형이 예상되며, 두 가지 예가 아래에 SEQ ID NO:33 및 34로 표시된다. SARS-CoV-2 스파이크 신호 펩티드 서열은 굵게/밑줄이 있는 글꼴로 표시되고, Ser/Gly 링커 영역은 밑줄로 표시되며, H. 파일로리 페리틴 서열은 이탤릭체 및 밑줄로 표시된다.
스파이크HexaProΔC 페리틴 변형 - SEQ ID NO:33
스파이크HexaProΔC 페리틴 변형 - SEQ ID NO:34
본 개시에 기재된 실시예 및 구현예는 단지 예시를 위한 것이며, 이에 비추어 다양한 수정 또는 변경이 당업자에게 제안될 것이고, 이는 본 출원의 사상 및 범위 및 첨부된 청구 범위의 범위 내에 포함되는 것으로 이해된다. 본 개시에 인용된 모든 간행물, 특허 및 특허 출원은 모든 목적을 위해 그 전체가 본원에 참조로 포함된다.
본 개시에 인용된 간행물
SEQUENCE LISTING
<110> czb
<120> IMMUNOGENIC CORONAVIRUS FUSION PROTEINS AND RELATED METHODS
<130> 103182-1256502-005410WO
<150> US 63/070,961
<151> 2020-08-27
<150> US 63/130,056
<151> 2020-12-23
<150> US 63/196,837
<151> 2021-06-04
<160> 30
<170> PatentIn version 3.5
<210> 1
<211> 1273
<212> PRT
<213> SARS-CoV-2
<400> 1
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
1010 1015 1020
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
1025 1030 1035
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1040 1045 1050
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
1055 1060 1065
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His
1070 1075 1080
Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn
1085 1090 1095
Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln
1100 1105 1110
Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val
1115 1120 1125
Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1130 1135 1140
Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn
1145 1150 1155
His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn
1160 1165 1170
Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu
1175 1180 1185
Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu
1190 1195 1200
Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu
1205 1210 1215
Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met
1220 1225 1230
Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro
1250 1255 1260
Val Leu Lys Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 2
<211> 163
<212> PRT
<213> Helicobacter pylori
<400> 2
Asp Ile Ile Lys Leu Leu Asn Glu Gln Val Asn Lys Glu Met Gln Ser
1 5 10 15
Ser Asn Leu Tyr Met Ser Met Ser Ser Trp Cys Tyr Thr His Ser Leu
20 25 30
Asp Gly Ala Gly Leu Phe Leu Phe Asp His Ala Ala Glu Glu Tyr Glu
35 40 45
His Ala Lys Lys Leu Ile Ile Phe Leu Asn Glu Asn Asn Val Pro Val
50 55 60
Gln Leu Thr Ser Ile Ser Ala Pro Glu His Lys Phe Glu Gly Leu Thr
65 70 75 80
Gln Ile Phe Gln Lys Ala Tyr Glu His Glu Gln His Ile Ser Glu Ser
85 90 95
Ile Asn Asn Ile Val Asp His Ala Ile Lys Ser Lys Asp His Ala Thr
100 105 110
Phe Asn Phe Leu Gln Trp Tyr Val Ala Glu Gln His Glu Glu Glu Val
115 120 125
Leu Phe Lys Asp Ile Leu Asp Lys Ile Glu Leu Ile Gly Asn Glu Asn
130 135 140
His Gly Leu Tyr Leu Ala Asp Gln Tyr Val Lys Gly Ile Ala Lys Ser
145 150 155 160
Arg Lys Ser
<210> 3
<211> 1199
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 3
Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn
1 5 10 15
Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser
20 25 30
Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val
35 40 45
Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg
50 55 60
Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser
65 70 75 80
Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu
85 90 95
Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val
100 105 110
Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly
115 120 125
Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg
130 135 140
Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro
145 150 155 160
Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg
165 170 175
Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys
180 185 190
His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala
195 200 205
Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe
210 215 220
Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser
225 230 235 240
Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu
245 250 255
Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr
260 265 270
Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr
275 280 285
Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe
290 295 300
Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn
305 310 315 320
Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val
325 330 335
Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser
340 345 350
Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val
355 360 365
Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp
370 375 380
Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln
385 390 395 400
Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr
405 410 415
Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly
420 425 430
Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys
435 440 445
Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr
450 455 460
Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser
465 470 475 480
Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val
485 490 495
Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly
500 505 510
Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn
515 520 525
Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys
530 535 540
Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp
545 550 555 560
Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys
565 570 575
Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn
580 585 590
Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val
595 600 605
Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr
610 615 620
Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu
625 630 635 640
His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile
645 650 655
Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Ala Ser Val Ala Ser
660 665 670
Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val
675 680 685
Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser
690 695 700
Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp
705 710 715 720
Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu
725 730 735
Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly
740 745 750
Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val
755 760 765
Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn
770 775 780
Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe
785 790 795 800
Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe
805 810 815
Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu
820 825 830
Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu
835 840 845
Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr
850 855 860
Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro
865 870 875 880
Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln
885 890 895
Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser
900 905 910
Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu
915 920 925
Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr
930 935 940
Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu
945 950 955 960
Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln Ile
965 970 975
Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr
980 985 990
Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala
995 1000 1005
Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val
1010 1015 1020
Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser
1025 1030 1035
Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala
1040 1045 1050
Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly
1055 1060 1065
Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr
1070 1075 1080
His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile
1085 1090 1095
Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile
1100 1105 1110
Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu
1115 1120 1125
Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr
1130 1135 1140
Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser
1145 1150 1155
Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala
1160 1165 1170
Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys
1175 1180 1185
Tyr Glu Gln Tyr Ile Lys Trp Pro Ser Gly Arg
1190 1195
<210> 4
<211> 1129
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 4
Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn
1 5 10 15
Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser
20 25 30
Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val
35 40 45
Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg
50 55 60
Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser
65 70 75 80
Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu
85 90 95
Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val
100 105 110
Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly
115 120 125
Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg
130 135 140
Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro
145 150 155 160
Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg
165 170 175
Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys
180 185 190
His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala
195 200 205
Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe
210 215 220
Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser
225 230 235 240
Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu
245 250 255
Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr
260 265 270
Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr
275 280 285
Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe
290 295 300
Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn
305 310 315 320
Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val
325 330 335
Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser
340 345 350
Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val
355 360 365
Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp
370 375 380
Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln
385 390 395 400
Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr
405 410 415
Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly
420 425 430
Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys
435 440 445
Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr
450 455 460
Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser
465 470 475 480
Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val
485 490 495
Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly
500 505 510
Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn
515 520 525
Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys
530 535 540
Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp
545 550 555 560
Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys
565 570 575
Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn
580 585 590
Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val
595 600 605
Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr
610 615 620
Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu
625 630 635 640
His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile
645 650 655
Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Ala Ser Val Ala Ser
660 665 670
Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val
675 680 685
Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser
690 695 700
Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp
705 710 715 720
Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu
725 730 735
Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly
740 745 750
Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val
755 760 765
Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn
770 775 780
Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe
785 790 795 800
Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe
805 810 815
Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu
820 825 830
Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu
835 840 845
Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr
850 855 860
Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro
865 870 875 880
Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln
885 890 895
Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser
900 905 910
Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu
915 920 925
Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr
930 935 940
Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu
945 950 955 960
Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln Ile
965 970 975
Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr
980 985 990
Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala
995 1000 1005
Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val
1010 1015 1020
Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser
1025 1030 1035
Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala
1040 1045 1050
Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly
1055 1060 1065
Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr
1070 1075 1080
His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile
1085 1090 1095
Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile
1100 1105 1110
Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu
1115 1120 1125
Asp
<210> 5
<211> 4
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 5
gsgg 4
<210> 6
<211> 7
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<220>
<221> misc_feature
<222> (1)..(1)
<223> n is a, c, g, or t
<400> 6
ngtggsg 7
<210> 7
<211> 5
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Constuct
<400> 7
ggggs 5
<210> 8
<211> 14
<212> PRT
<213> SARS-CoV-2
<400> 8
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln
1 5 10
<210> 9
<211> 243
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 9
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Arg Val
1 5 10 15
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
20 25 30
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
35 40 45
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
50 55 60
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
65 70 75 80
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
85 90 95
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
100 105 110
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
115 120 125
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
130 135 140
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
145 150 155 160
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
165 170 175
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
180 185 190
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
195 200 205
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
210 215 220
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe His His His
225 230 235 240
His His His
<210> 10
<211> 1262
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 10
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Ala Ser Val Ala Ser Gln Ser
675 680 685
Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val Ala Tyr
690 695 700
Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser Val Thr
705 710 715 720
Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys Thr
725 730 735
Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln
740 745 750
Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile Ala
755 760 765
Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln
770 775 780
Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe Ser
785 790 795 800
Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe Ile Glu
805 810 815
Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys
820 825 830
Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile Cys
835 840 845
Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr Asp
850 855 860
Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr
865 870 875 880
Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala
885 890 895
Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val
900 905 910
Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile
915 920 925
Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys
930 935 940
Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val
945 950 955 960
Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn Asp
965 970 975
Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln Ile Asp Arg
980 985 990
Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln
995 1000 1005
Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala
1010 1015 1020
Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp
1025 1030 1035
Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
1040 1045 1050
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln
1055 1060 1065
Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys
1070 1075 1080
Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His
1085 1090 1095
Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr
1100 1105 1110
Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly
1115 1120 1125
Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp
1130 1135 1140
Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser
1145 1150 1155
Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser Val
1160 1165 1170
Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala Lys
1175 1180 1185
Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr
1190 1195 1200
Glu Gln Tyr Ile Lys Trp Pro Ser Gly Arg Gly Gly Gly Gly Ser
1205 1210 1215
Arg Met Lys Gln Ile Glu Asp Lys Ile Glu Glu Ile Leu Ser Lys
1220 1225 1230
Gln Tyr His Ile Glu Asn Glu Ile Ala Arg Ile Lys Lys Leu Ile
1235 1240 1245
Gly Glu Arg Gly Gly Ser Gly Gly His His His His His His
1250 1255 1260
<210> 11
<211> 1182
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 11
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Ala Ser Val Ala Ser Gln Ser
675 680 685
Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val Ala Tyr
690 695 700
Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser Val Thr
705 710 715 720
Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys Thr
725 730 735
Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln
740 745 750
Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile Ala
755 760 765
Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln
770 775 780
Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe Ser
785 790 795 800
Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe Ile Glu
805 810 815
Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys
820 825 830
Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile Cys
835 840 845
Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr Asp
850 855 860
Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr
865 870 875 880
Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala
885 890 895
Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val
900 905 910
Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile
915 920 925
Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys
930 935 940
Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val
945 950 955 960
Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn Asp
965 970 975
Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln Ile Asp Arg
980 985 990
Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln
995 1000 1005
Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala
1010 1015 1020
Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp
1025 1030 1035
Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
1040 1045 1050
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln
1055 1060 1065
Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys
1070 1075 1080
Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His
1085 1090 1095
Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr
1100 1105 1110
Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly
1115 1120 1125
Ile Val Asn Asn Thr Val Tyr Asp Pro Gly Arg Met Lys Gln Ile
1130 1135 1140
Glu Asp Lys Ile Glu Glu Ile Leu Ser Lys Gln Tyr His Ile Glu
1145 1150 1155
Asn Glu Ile Ala Arg Ile Lys Lys Leu Ile Gly Glu Arg Gly Gly
1160 1165 1170
Ser Gly Gly His His His His His His
1175 1180
<210> 12
<211> 1379
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 12
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Ala Ser Val Ala Ser Gln Ser
675 680 685
Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val Ala Tyr
690 695 700
Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser Val Thr
705 710 715 720
Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys Thr
725 730 735
Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln
740 745 750
Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile Ala
755 760 765
Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln
770 775 780
Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe Ser
785 790 795 800
Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe Ile Glu
805 810 815
Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys
820 825 830
Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile Cys
835 840 845
Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr Asp
850 855 860
Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr
865 870 875 880
Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala
885 890 895
Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val
900 905 910
Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile
915 920 925
Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys
930 935 940
Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val
945 950 955 960
Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn Asp
965 970 975
Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln Ile Asp Arg
980 985 990
Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln
995 1000 1005
Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala
1010 1015 1020
Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp
1025 1030 1035
Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
1040 1045 1050
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln
1055 1060 1065
Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys
1070 1075 1080
Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His
1085 1090 1095
Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr
1100 1105 1110
Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly
1115 1120 1125
Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp
1130 1135 1140
Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser
1145 1150 1155
Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser Val
1160 1165 1170
Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala Lys
1175 1180 1185
Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr
1190 1195 1200
Glu Gln Tyr Ile Lys Trp Pro Ser Gly Arg Ser Gly Gly Asp Ile
1205 1210 1215
Ile Lys Leu Leu Asn Glu Gln Val Asn Lys Glu Met Gln Ser Ser
1220 1225 1230
Asn Leu Tyr Met Ser Met Ser Ser Trp Cys Tyr Thr His Ser Leu
1235 1240 1245
Asp Gly Ala Gly Leu Phe Leu Phe Asp His Ala Ala Glu Glu Tyr
1250 1255 1260
Glu His Ala Lys Lys Leu Ile Ile Phe Leu Asn Glu Asn Asn Val
1265 1270 1275
Pro Val Gln Leu Thr Ser Ile Ser Ala Pro Glu His Lys Phe Glu
1280 1285 1290
Gly Leu Thr Gln Ile Phe Gln Lys Ala Tyr Glu His Glu Gln His
1295 1300 1305
Ile Ser Glu Ser Ile Asn Asn Ile Val Asp His Ala Ile Lys Ser
1310 1315 1320
Lys Asp His Ala Thr Phe Asn Phe Leu Gln Trp Tyr Val Ala Glu
1325 1330 1335
Gln His Glu Glu Glu Val Leu Phe Lys Asp Ile Leu Asp Lys Ile
1340 1345 1350
Glu Leu Ile Gly Asn Glu Asn His Gly Leu Tyr Leu Ala Asp Gln
1355 1360 1365
Tyr Val Lys Gly Ile Ala Lys Ser Arg Lys Ser
1370 1375
<210> 13
<211> 1309
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 13
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Ala Ser Val Ala Ser Gln Ser
675 680 685
Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val Ala Tyr
690 695 700
Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser Val Thr
705 710 715 720
Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys Thr
725 730 735
Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln
740 745 750
Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile Ala
755 760 765
Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln
770 775 780
Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe Ser
785 790 795 800
Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe Ile Glu
805 810 815
Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys
820 825 830
Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile Cys
835 840 845
Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr Asp
850 855 860
Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr
865 870 875 880
Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala
885 890 895
Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val
900 905 910
Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile
915 920 925
Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys
930 935 940
Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val
945 950 955 960
Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn Asp
965 970 975
Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln Ile Asp Arg
980 985 990
Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln
995 1000 1005
Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala
1010 1015 1020
Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp
1025 1030 1035
Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
1040 1045 1050
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln
1055 1060 1065
Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys
1070 1075 1080
Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His
1085 1090 1095
Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr
1100 1105 1110
Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly
1115 1120 1125
Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp
1130 1135 1140
Ser Gly Gly Asp Ile Ile Lys Leu Leu Asn Glu Gln Val Asn Lys
1145 1150 1155
Glu Met Gln Ser Ser Asn Leu Tyr Met Ser Met Ser Ser Trp Cys
1160 1165 1170
Tyr Thr His Ser Leu Asp Gly Ala Gly Leu Phe Leu Phe Asp His
1175 1180 1185
Ala Ala Glu Glu Tyr Glu His Ala Lys Lys Leu Ile Ile Phe Leu
1190 1195 1200
Asn Glu Asn Asn Val Pro Val Gln Leu Thr Ser Ile Ser Ala Pro
1205 1210 1215
Glu His Lys Phe Glu Gly Leu Thr Gln Ile Phe Gln Lys Ala Tyr
1220 1225 1230
Glu His Glu Gln His Ile Ser Glu Ser Ile Asn Asn Ile Val Asp
1235 1240 1245
His Ala Ile Lys Ser Lys Asp His Ala Thr Phe Asn Phe Leu Gln
1250 1255 1260
Trp Tyr Val Ala Glu Gln His Glu Glu Glu Val Leu Phe Lys Asp
1265 1270 1275
Ile Leu Asp Lys Ile Glu Leu Ile Gly Asn Glu Asn His Gly Leu
1280 1285 1290
Tyr Leu Ala Asp Gln Tyr Val Lys Gly Ile Ala Lys Ser Arg Lys
1295 1300 1305
Ser
<210> 14
<211> 1202
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 14
Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn
1 5 10 15
Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser
20 25 30
Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val
35 40 45
Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg
50 55 60
Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser
65 70 75 80
Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu
85 90 95
Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val
100 105 110
Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly
115 120 125
Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg
130 135 140
Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro
145 150 155 160
Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg
165 170 175
Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys
180 185 190
His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala
195 200 205
Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe
210 215 220
Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser
225 230 235 240
Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu
245 250 255
Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr
260 265 270
Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr
275 280 285
Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe
290 295 300
Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn
305 310 315 320
Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val
325 330 335
Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser
340 345 350
Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val
355 360 365
Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp
370 375 380
Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln
385 390 395 400
Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr
405 410 415
Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly
420 425 430
Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys
435 440 445
Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr
450 455 460
Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser
465 470 475 480
Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val
485 490 495
Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly
500 505 510
Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn
515 520 525
Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys
530 535 540
Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp
545 550 555 560
Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys
565 570 575
Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn
580 585 590
Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val
595 600 605
Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr
610 615 620
Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu
625 630 635 640
His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile
645 650 655
Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser
660 665 670
Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu
675 680 685
Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe
690 695 700
Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr
705 710 715 720
Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser
725 730 735
Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala
740 745 750
Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe
755 760 765
Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly
770 775 780
Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys
785 790 795 800
Arg Ser Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp
805 810 815
Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala
820 825 830
Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro
835 840 845
Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu
850 855 860
Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu
865 870 875 880
Gln Ile Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly
885 890 895
Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln
900 905 910
Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro
915 920 925
Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala
930 935 940
Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser
945 950 955 960
Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu
965 970 975
Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr
980 985 990
Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala
995 1000 1005
Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser
1010 1015 1020
Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe
1025 1030 1035
Pro Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr
1040 1045 1050
Val Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys
1055 1060 1065
His Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser
1070 1075 1080
Asn Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro
1085 1090 1095
Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp
1100 1105 1110
Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln
1115 1120 1125
Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys
1130 1135 1140
Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile
1145 1150 1155
Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn
1160 1165 1170
Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu
1175 1180 1185
Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Ser Gly Arg
1190 1195 1200
<210> 15
<211> 1132
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 15
Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn
1 5 10 15
Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser
20 25 30
Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val
35 40 45
Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg
50 55 60
Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser
65 70 75 80
Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu
85 90 95
Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val
100 105 110
Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly
115 120 125
Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg
130 135 140
Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro
145 150 155 160
Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg
165 170 175
Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys
180 185 190
His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala
195 200 205
Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe
210 215 220
Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser
225 230 235 240
Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu
245 250 255
Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr
260 265 270
Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr
275 280 285
Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe
290 295 300
Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn
305 310 315 320
Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val
325 330 335
Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser
340 345 350
Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val
355 360 365
Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp
370 375 380
Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln
385 390 395 400
Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr
405 410 415
Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly
420 425 430
Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys
435 440 445
Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr
450 455 460
Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser
465 470 475 480
Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val
485 490 495
Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly
500 505 510
Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn
515 520 525
Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys
530 535 540
Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp
545 550 555 560
Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys
565 570 575
Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn
580 585 590
Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val
595 600 605
Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr
610 615 620
Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu
625 630 635 640
His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile
645 650 655
Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser
660 665 670
Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu
675 680 685
Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe
690 695 700
Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr
705 710 715 720
Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser
725 730 735
Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala
740 745 750
Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe
755 760 765
Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly
770 775 780
Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys
785 790 795 800
Arg Ser Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp
805 810 815
Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala
820 825 830
Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro
835 840 845
Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu
850 855 860
Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu
865 870 875 880
Gln Ile Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly
885 890 895
Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln
900 905 910
Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro
915 920 925
Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala
930 935 940
Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser
945 950 955 960
Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu
965 970 975
Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr
980 985 990
Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala
995 1000 1005
Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser
1010 1015 1020
Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe
1025 1030 1035
Pro Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr
1040 1045 1050
Val Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys
1055 1060 1065
His Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser
1070 1075 1080
Asn Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro
1085 1090 1095
Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp
1100 1105 1110
Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln
1115 1120 1125
Pro Glu Leu Asp
1130
<210> 16
<211> 1312
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 16
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile
885 890 895
Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
1010 1015 1020
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
1025 1030 1035
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1040 1045 1050
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
1055 1060 1065
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His
1070 1075 1080
Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn
1085 1090 1095
Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln
1100 1105 1110
Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val
1115 1120 1125
Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1130 1135 1140
Glu Leu Asp Ser Gly Gly Asp Ile Ile Lys Leu Leu Asn Glu Gln
1145 1150 1155
Val Asn Lys Glu Met Gln Ser Ser Asn Leu Tyr Met Ser Met Ser
1160 1165 1170
Ser Trp Cys Tyr Thr His Ser Leu Asp Gly Ala Gly Leu Phe Leu
1175 1180 1185
Phe Asp His Ala Ala Glu Glu Tyr Glu His Ala Lys Lys Leu Ile
1190 1195 1200
Ile Phe Leu Asn Glu Asn Asn Val Pro Val Gln Leu Thr Ser Ile
1205 1210 1215
Ser Ala Pro Glu His Lys Phe Glu Gly Leu Thr Gln Ile Phe Gln
1220 1225 1230
Lys Ala Tyr Glu His Glu Gln His Ile Ser Glu Ser Ile Asn Asn
1235 1240 1245
Ile Val Asp His Ala Ile Lys Ser Lys Asp His Ala Thr Phe Asn
1250 1255 1260
Phe Leu Gln Trp Tyr Val Ala Glu Gln His Glu Glu Glu Val Leu
1265 1270 1275
Phe Asn Asp Ile Leu Asp Lys Ile Glu Leu Ile Gly Asn Glu Asn
1280 1285 1290
His Gly Leu Tyr Leu Ala Asp Gln Tyr Val Lys Gly Ile Ala Lys
1295 1300 1305
Ser Arg Lys Ser
1310
<210> 17
<211> 1311
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 17
Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val Asn
1 5 10 15
Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe Thr
20 25 30
Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu His
35 40 45
Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp Phe
50 55 60
His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp Asn
65 70 75 80
Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu Lys
85 90 95
Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser Lys
100 105 110
Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile Lys
115 120 125
Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr Tyr
130 135 140
His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr Ser
145 150 155 160
Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu Met
165 170 175
Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe Val
180 185 190
Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr Pro
195 200 205
Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu Pro
210 215 220
Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr Leu
225 230 235 240
Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly
245 250 255
Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg
260 265 270
Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val
275 280 285
Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser
290 295 300
Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln
305 310 315 320
Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro
325 330 335
Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp
340 345 350
Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr
355 360 365
Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr
370 375 380
Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val
385 390 395 400
Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys
405 410 415
Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val
420 425 430
Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr
435 440 445
Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu
450 455 460
Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn
465 470 475 480
Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe
485 490 495
Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu
500 505 510
Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys
515 520 525
Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly
530 535 540
Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro
545 550 555 560
Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val Arg
565 570 575
Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly
580 585 590
Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val Ala
595 600 605
Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile His
610 615 620
Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn
625 630 635 640
Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn
645 650 655
Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser
660 665 670
Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser Val Ala Ser
675 680 685
Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val
690 695 700
Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser
705 710 715 720
Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp
725 730 735
Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu
740 745 750
Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly
755 760 765
Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val
770 775 780
Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn
785 790 795 800
Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Pro
805 810 815
Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe
820 825 830
Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu
835 840 845
Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu
850 855 860
Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr
865 870 875 880
Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile Pro
885 890 895
Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln
900 905 910
Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser
915 920 925
Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala Leu
930 935 940
Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr
945 950 955 960
Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu
965 970 975
Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln Ile
980 985 990
Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr
995 1000 1005
Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu
1010 1015 1020
Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg
1025 1030 1035
Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln
1040 1045 1050
Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro
1055 1060 1065
Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp
1070 1075 1080
Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly
1085 1090 1095
Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile
1100 1105 1110
Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val
1115 1120 1125
Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu
1130 1135 1140
Leu Asp Ser Gly Gly Asp Ile Ile Lys Leu Leu Asn Glu Gln Val
1145 1150 1155
Asn Lys Glu Met Gln Ser Ser Asn Leu Tyr Met Ser Met Ser Ser
1160 1165 1170
Trp Cys Tyr Thr His Ser Leu Asp Gly Ala Gly Leu Phe Leu Phe
1175 1180 1185
Asp His Ala Ala Glu Glu Tyr Glu His Ala Lys Lys Leu Ile Ile
1190 1195 1200
Phe Leu Asn Glu Asn Asn Val Pro Val Gln Leu Thr Ser Ile Ser
1205 1210 1215
Ala Pro Glu His Lys Phe Glu Gly Leu Thr Gln Ile Phe Gln Lys
1220 1225 1230
Ala Tyr Glu His Glu Gln His Ile Ser Glu Ser Ile Asn Asn Ile
1235 1240 1245
Val Asp His Ala Ile Lys Ser Lys Asp His Ala Thr Phe Asn Phe
1250 1255 1260
Leu Gln Trp Tyr Val Ala Glu Gln His Glu Glu Glu Val Leu Phe
1265 1270 1275
Lys Asp Ile Leu Asp Lys Ile Glu Leu Ile Gly Asn Glu Asn His
1280 1285 1290
Gly Leu Tyr Leu Ala Asp Gln Tyr Val Lys Gly Ile Ala Lys Ser
1295 1300 1305
Arg Lys Ser
1310
<210> 18
<211> 1374
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 18
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile
885 890 895
Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
1010 1015 1020
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
1025 1030 1035
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1040 1045 1050
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
1055 1060 1065
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His
1070 1075 1080
Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn
1085 1090 1095
Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln
1100 1105 1110
Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val
1115 1120 1125
Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1130 1135 1140
Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn
1145 1150 1155
His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn
1160 1165 1170
Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu
1175 1180 1185
Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu
1190 1195 1200
Gly Lys Tyr Glu Gln Ser Gly Gly Asp Ile Ile Lys Leu Leu Asn
1205 1210 1215
Glu Gln Val Asn Lys Glu Met Gln Ser Ser Asn Leu Tyr Met Ser
1220 1225 1230
Met Ser Ser Trp Cys Tyr Thr His Ser Leu Asp Gly Ala Gly Leu
1235 1240 1245
Phe Leu Phe Asp His Ala Ala Glu Glu Tyr Glu His Ala Lys Lys
1250 1255 1260
Leu Ile Ile Phe Leu Asn Glu Asn Asn Val Pro Val Gln Leu Thr
1265 1270 1275
Ser Ile Ser Ala Pro Glu His Lys Phe Glu Gly Leu Thr Gln Ile
1280 1285 1290
Phe Gln Lys Ala Tyr Glu His Glu Gln His Ile Ser Glu Ser Ile
1295 1300 1305
Asn Asn Ile Val Asp His Ala Ile Lys Ser Lys Asp His Ala Thr
1310 1315 1320
Phe Asn Phe Leu Gln Trp Tyr Val Ala Glu Gln His Glu Glu Glu
1325 1330 1335
Val Leu Phe Lys Asp Ile Leu Asp Lys Ile Glu Leu Ile Gly Asn
1340 1345 1350
Glu Asn His Gly Leu Tyr Leu Ala Asp Gln Tyr Val Lys Gly Ile
1355 1360 1365
Ala Lys Ser Arg Lys Ser
1370
<210> 19
<211> 1257
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 19
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile
885 890 895
Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
1010 1015 1020
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
1025 1030 1035
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1040 1045 1050
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
1055 1060 1065
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His
1070 1075 1080
Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn
1085 1090 1095
Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln
1100 1105 1110
Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val
1115 1120 1125
Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1130 1135 1140
Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn
1145 1150 1155
His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn
1160 1165 1170
Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu
1175 1180 1185
Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu
1190 1195 1200
Gly Lys Tyr Glu Gln Gly Gly Gly Gly Ser Arg Met Lys Gln Ile
1205 1210 1215
Glu Asp Lys Ile Glu Glu Ile Leu Ser Lys Gln Tyr His Ile Glu
1220 1225 1230
Asn Glu Ile Ala Arg Ile Lys Lys Leu Ile Gly Glu Arg Gly Gly
1235 1240 1245
Ser Gly Gly His His His His His His
1250 1255
<210> 20
<211> 1195
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 20
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile
885 890 895
Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
1010 1015 1020
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
1025 1030 1035
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1040 1045 1050
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
1055 1060 1065
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His
1070 1075 1080
Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn
1085 1090 1095
Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln
1100 1105 1110
Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val
1115 1120 1125
Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1130 1135 1140
Glu Leu Asp Gly Gly Gly Gly Ser Arg Met Lys Gln Ile Glu Asp
1145 1150 1155
Lys Ile Glu Glu Ile Leu Ser Lys Gln Tyr His Ile Glu Asn Glu
1160 1165 1170
Ile Ala Arg Ile Lys Lys Leu Ile Gly Glu Arg Gly Gly Ser Gly
1175 1180 1185
Gly His His His His His His
1190 1195
<210> 21
<211> 1312
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 21
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
1010 1015 1020
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
1025 1030 1035
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1040 1045 1050
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
1055 1060 1065
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His
1070 1075 1080
Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn
1085 1090 1095
Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln
1100 1105 1110
Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val
1115 1120 1125
Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1130 1135 1140
Glu Leu Asp Ser Gly Gly Asp Ile Ile Lys Leu Leu Asn Glu Gln
1145 1150 1155
Val Asn Lys Glu Met Gln Ser Ser Asn Leu Tyr Met Ser Met Ser
1160 1165 1170
Ser Trp Cys Tyr Thr His Ser Leu Asp Gly Ala Gly Leu Phe Leu
1175 1180 1185
Phe Asp His Ala Ala Glu Glu Tyr Glu His Ala Lys Lys Leu Ile
1190 1195 1200
Ile Phe Leu Asn Glu Asn Asn Val Pro Val Gln Leu Thr Ser Ile
1205 1210 1215
Ser Ala Pro Glu His Lys Phe Glu Gly Leu Thr Gln Ile Phe Gln
1220 1225 1230
Lys Ala Tyr Glu His Glu Gln His Ile Ser Glu Ser Ile Asn Asn
1235 1240 1245
Ile Val Asp His Ala Ile Lys Ser Lys Asp His Ala Thr Phe Asn
1250 1255 1260
Phe Leu Gln Trp Tyr Val Ala Glu Gln His Glu Glu Glu Val Leu
1265 1270 1275
Phe Lys Asp Ile Leu Asp Lys Ile Glu Leu Ile Gly Asn Glu Asn
1280 1285 1290
His Gly Leu Tyr Leu Ala Asp Gln Tyr Val Lys Gly Ile Ala Lys
1295 1300 1305
Ser Arg Lys Ser
1310
<210> 22
<211> 1312
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 22
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile
885 890 895
Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
1010 1015 1020
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
1025 1030 1035
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1040 1045 1050
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
1055 1060 1065
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His
1070 1075 1080
Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn
1085 1090 1095
Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln
1100 1105 1110
Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val
1115 1120 1125
Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1130 1135 1140
Glu Leu Asp Ser Gly Gly Asp Ile Ile Lys Leu Leu Asn Glu Gln
1145 1150 1155
Val Asn Lys Glu Met Gln Ser Ser Asn Leu Tyr Met Ser Met Ser
1160 1165 1170
Ser Trp Cys Tyr Thr His Ser Leu Asp Gly Ala Gly Leu Phe Leu
1175 1180 1185
Phe Asp His Ala Ala Glu Glu Tyr Glu His Ala Lys Lys Leu Ile
1190 1195 1200
Ile Phe Leu Asn Glu Asn Asn Val Pro Val Gln Leu Thr Ser Ile
1205 1210 1215
Ser Ala Pro Glu His Asn Phe Thr Gly Leu Thr Gln Ile Phe Gln
1220 1225 1230
Lys Ala Tyr Glu His Glu Gln His Ile Ser Glu Ser Ile Asn Asn
1235 1240 1245
Ile Val Asp His Ala Ile Lys Ser Lys Asp His Ala Thr Phe Asn
1250 1255 1260
Phe Leu Gln Trp Tyr Val Ala Glu Gln His Glu Glu Glu Val Leu
1265 1270 1275
Phe Asn Asp Ile Leu Asp Lys Ile Glu Leu Ile Gly Asn Glu Asn
1280 1285 1290
His Gly Leu Tyr Leu Ala Asp Gln Tyr Val Lys Gly Ile Ala Lys
1295 1300 1305
Ser Arg Lys Ser
1310
<210> 23
<211> 1312
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 23
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile
885 890 895
Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
1010 1015 1020
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
1025 1030 1035
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1040 1045 1050
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
1055 1060 1065
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His
1070 1075 1080
Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn
1085 1090 1095
Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln
1100 1105 1110
Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val
1115 1120 1125
Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1130 1135 1140
Glu Leu Asp Ser Gly Gly Asp Ile Ile Lys Leu Leu Asn Glu Gln
1145 1150 1155
Val Asn Lys Glu Met Gln Ser Ser Asn Leu Tyr Met Ser Met Ser
1160 1165 1170
Ser Trp Cys Tyr Thr His Ser Leu Asp Gly Ala Gly Leu Phe Leu
1175 1180 1185
Phe Asp His Ala Ala Glu Glu Tyr Glu His Ala Lys Lys Leu Ile
1190 1195 1200
Ile Phe Leu Asn Glu Asn Asn Val Pro Val Gln Leu Asn Ser Thr
1205 1210 1215
Ser Ala Pro Glu His Lys Phe Glu Gly Leu Thr Gln Ile Phe Gln
1220 1225 1230
Lys Ala Tyr Glu His Glu Gln His Ile Ser Glu Ser Ile Asn Asn
1235 1240 1245
Ile Val Asp His Ala Ile Lys Ser Lys Asp His Ala Thr Phe Asn
1250 1255 1260
Phe Leu Gln Trp Tyr Val Ala Glu Gln His Glu Glu Glu Val Leu
1265 1270 1275
Phe Lys Asp Ile Leu Asp Lys Ile Glu Leu Ile Gly Asn Glu Asn
1280 1285 1290
His Gly Leu Tyr Leu Ala Asp Gln Tyr Val Lys Gly Ile Ala Lys
1295 1300 1305
Ser Arg Lys Ser
1310
<210> 24
<211> 1312
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 24
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile
885 890 895
Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
1010 1015 1020
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
1025 1030 1035
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1040 1045 1050
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
1055 1060 1065
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His
1070 1075 1080
Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn
1085 1090 1095
Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln
1100 1105 1110
Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val
1115 1120 1125
Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1130 1135 1140
Glu Leu Asp Ser Gly Gly Asp Ile Ile Lys Leu Leu Asn Glu Gln
1145 1150 1155
Val Asn Lys Glu Met Gln Ser Ser Asn Leu Tyr Met Ser Met Ser
1160 1165 1170
Ser Trp Cys Tyr Thr His Ser Leu Asp Gly Ala Gly Leu Phe Leu
1175 1180 1185
Phe Asp His Ala Ala Glu Glu Tyr Glu His Ala Lys Lys Leu Ile
1190 1195 1200
Ile Phe Leu Asn Glu Asn Asn Val Pro Val Gln Leu Thr Ser Ile
1205 1210 1215
Ser Ala Pro Glu Asn Lys Thr Glu Gly Leu Thr Gln Ile Phe Gln
1220 1225 1230
Lys Ala Tyr Glu His Glu Gln His Ile Ser Glu Ser Ile Asn Asn
1235 1240 1245
Ile Val Asp His Ala Ile Lys Ser Lys Asp His Ala Thr Phe Asn
1250 1255 1260
Phe Leu Gln Trp Tyr Val Ala Glu Gln His Glu Glu Glu Val Leu
1265 1270 1275
Phe Lys Asp Ile Leu Asp Lys Ile Glu Leu Ile Gly Asn Glu Asn
1280 1285 1290
His Gly Leu Tyr Leu Ala Asp Gln Tyr Val Lys Gly Ile Ala Lys
1295 1300 1305
Ser Arg Lys Ser
1310
<210> 25
<211> 1312
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 25
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile
885 890 895
Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
1010 1015 1020
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
1025 1030 1035
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1040 1045 1050
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
1055 1060 1065
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His
1070 1075 1080
Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn
1085 1090 1095
Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln
1100 1105 1110
Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val
1115 1120 1125
Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1130 1135 1140
Glu Leu Asp Ser Gly Gly Asp Ile Ile Lys Leu Leu Asn Glu Gln
1145 1150 1155
Val Asn Lys Glu Met Gln Ser Ser Asn Leu Tyr Met Ser Met Ser
1160 1165 1170
Ser Trp Cys Tyr Thr His Ser Leu Asp Gly Ala Gly Leu Phe Leu
1175 1180 1185
Phe Asp His Ala Ala Glu Glu Tyr Glu His Ala Lys Lys Leu Ile
1190 1195 1200
Ile Phe Leu Asn Glu Asn Asn Val Pro Val Gln Leu Thr Ser Ile
1205 1210 1215
Ser Ala Pro Glu His Lys Phe Glu Gly Leu Thr Gln Ile Phe Gln
1220 1225 1230
Lys Ala Tyr Glu His Glu Gln His Ile Ser Glu Ser Ile Asn Asn
1235 1240 1245
Ile Val Asp His Ala Ile Lys Ser Lys Asp His Ala Thr Phe Asn
1250 1255 1260
Phe Leu Gln Trp Tyr Val Ala Glu Gln His Glu Glu Glu Val Leu
1265 1270 1275
Phe Lys Asp Ile Leu Asp Lys Ile Glu Leu Ile Gly Asn Asn Asn
1280 1285 1290
Thr Gly Leu Tyr Leu Ala Asp Gln Tyr Val Lys Gly Ile Ala Lys
1295 1300 1305
Ser Arg Lys Ser
1310
<210> 26
<211> 1312
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 26
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile
885 890 895
Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
1010 1015 1020
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
1025 1030 1035
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1040 1045 1050
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
1055 1060 1065
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His
1070 1075 1080
Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn
1085 1090 1095
Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln
1100 1105 1110
Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val
1115 1120 1125
Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1130 1135 1140
Glu Leu Asp Ser Gly Gly Asp Ile Ile Lys Leu Leu Asn Glu Gln
1145 1150 1155
Val Asn Lys Glu Met Gln Ser Ser Asn Leu Tyr Met Ser Met Ser
1160 1165 1170
Ser Trp Cys Tyr Thr His Ser Leu Asp Gly Ala Gly Leu Phe Leu
1175 1180 1185
Phe Asp His Ala Ala Glu Glu Tyr Glu His Ala Lys Lys Leu Ile
1190 1195 1200
Ile Phe Leu Asn Glu Asn Asn Val Pro Val Gln Leu Thr Ser Ile
1205 1210 1215
Ser Ala Pro Glu His Lys Phe Glu Gly Leu Thr Gln Ile Phe Gln
1220 1225 1230
Lys Ala Tyr Glu His Glu Gln His Ile Ser Glu Ser Ile Asn Asn
1235 1240 1245
Ile Val Asp His Ala Ile Lys Ser Lys Asp His Ala Thr Phe Asn
1250 1255 1260
Phe Leu Gln Trp Tyr Val Ala Glu Gln His Glu Glu Glu Val Leu
1265 1270 1275
Phe Lys Asp Ile Leu Asp Lys Ile Glu Leu Ile Gly Asn Glu Asn
1280 1285 1290
His Gly Leu Tyr Leu Ala Asp Gln Tyr Val Lys Gly Ile Ala Lys
1295 1300 1305
Ser Arg Lys Ser
1310
<210> 27
<211> 1309
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 27
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp Asn Pro
65 70 75 80
Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu Lys Ser
85 90 95
Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser Lys Thr
100 105 110
Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile Lys Val
115 120 125
Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr His Lys
130 135 140
Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr Ser Ser Ala
145 150 155 160
Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu Met Asp Leu
165 170 175
Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe Val Phe Lys
180 185 190
Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr Pro Ile Asn
195 200 205
Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu Pro Leu Val
210 215 220
Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr Leu Leu Ala
225 230 235 240
Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp Thr
245 250 255
Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr Phe
260 265 270
Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp Cys
275 280 285
Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe Thr
290 295 300
Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro Thr
305 310 315 320
Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly
325 330 335
Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg
340 345 350
Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser
355 360 365
Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu
370 375 380
Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg
385 390 395 400
Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala
405 410 415
Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala
420 425 430
Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr
435 440 445
Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp
450 455 460
Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val
465 470 475 480
Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro
485 490 495
Thr Tyr Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe
500 505 510
Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr
515 520 525
Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Thr
530 535 540
Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe Gln
545 550 555 560
Gln Phe Gly Arg Asp Ile Asp Asp Thr Thr Asp Ala Val Arg Asp Pro
565 570 575
Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly Val
580 585 590
Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val Ala Val Leu
595 600 605
Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile His Ala Asp
610 615 620
Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn Val Phe
625 630 635 640
Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn Asn Ser
645 650 655
Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr Gln
660 665 670
Thr Gln Thr Asn Ser His Gly Ser Ala Ser Ser Val Ala Ser Gln Ser
675 680 685
Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val Ala Tyr
690 695 700
Ser Asn Asn Ser Ile Ala Ile Pro Ile Asn Phe Thr Ile Ser Val Thr
705 710 715 720
Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys Thr
725 730 735
Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln
740 745 750
Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile Ala
755 760 765
Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln
770 775 780
Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe Ser
785 790 795 800
Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Pro Ile Glu
805 810 815
Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys
820 825 830
Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile Cys
835 840 845
Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr Asp
850 855 860
Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr
865 870 875 880
Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile Pro Phe Pro
885 890 895
Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val
900 905 910
Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile
915 920 925
Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala Leu Gly Lys
930 935 940
Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val
945 950 955 960
Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn Asp
965 970 975
Ile Leu Ala Arg Leu Asp Pro Pro Glu Ala Glu Val Gln Ile Asp Arg
980 985 990
Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln
995 1000 1005
Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala
1010 1015 1020
Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp
1025 1030 1035
Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
1040 1045 1050
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln
1055 1060 1065
Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys
1070 1075 1080
Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His
1085 1090 1095
Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr
1100 1105 1110
Thr His Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly
1115 1120 1125
Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp
1130 1135 1140
Ser Gly Gly Asp Ile Ile Lys Leu Leu Asn Glu Gln Val Asn Lys
1145 1150 1155
Glu Met Gln Ser Ser Asn Leu Tyr Met Ser Met Ser Ser Trp Cys
1160 1165 1170
Tyr Thr His Ser Leu Asp Gly Ala Gly Leu Phe Leu Phe Asp His
1175 1180 1185
Ala Ala Glu Glu Tyr Glu His Ala Lys Lys Leu Ile Ile Phe Leu
1190 1195 1200
Asn Glu Asn Asn Val Pro Val Gln Leu Thr Ser Ile Ser Ala Pro
1205 1210 1215
Glu His Lys Phe Glu Gly Leu Thr Gln Ile Phe Gln Lys Ala Tyr
1220 1225 1230
Glu His Glu Gln His Ile Ser Glu Ser Ile Asn Asn Ile Val Asp
1235 1240 1245
His Ala Ile Lys Ser Lys Asp His Ala Thr Phe Asn Phe Leu Gln
1250 1255 1260
Trp Tyr Val Ala Glu Gln His Glu Glu Glu Val Leu Phe Lys Asp
1265 1270 1275
Ile Leu Asp Lys Ile Glu Leu Ile Gly Asn Glu Asn His Gly Leu
1280 1285 1290
Tyr Leu Ala Asp Gln Tyr Val Lys Gly Ile Ala Lys Ser Arg Lys
1295 1300 1305
Ser
<210> 28
<211> 1309
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 28
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Phe Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Ala
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Gly Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu His Ile Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp Thr
245 250 255
Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr Phe
260 265 270
Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp Cys
275 280 285
Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe Thr
290 295 300
Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro Thr
305 310 315 320
Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly
325 330 335
Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg
340 345 350
Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser
355 360 365
Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu
370 375 380
Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg
385 390 395 400
Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Asn Ile Ala
405 410 415
Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala
420 425 430
Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr
435 440 445
Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp
450 455 460
Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val
465 470 475 480
Lys Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro
485 490 495
Thr Tyr Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe
500 505 510
Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr
515 520 525
Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Thr
530 535 540
Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe Gln
545 550 555 560
Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val Arg Asp Pro
565 570 575
Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly Val
580 585 590
Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val Ala Val Leu
595 600 605
Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile His Ala Asp
610 615 620
Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn Val Phe
625 630 635 640
Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn Asn Ser
645 650 655
Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr Gln
660 665 670
Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser Val Ala Ser Gln Ser
675 680 685
Ile Ile Ala Tyr Thr Met Ser Leu Gly Val Glu Asn Ser Val Ala Tyr
690 695 700
Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser Val Thr
705 710 715 720
Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys Thr
725 730 735
Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln
740 745 750
Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile Ala
755 760 765
Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln
770 775 780
Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe Ser
785 790 795 800
Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Pro Ile Glu
805 810 815
Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys
820 825 830
Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile Cys
835 840 845
Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr Asp
850 855 860
Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr
865 870 875 880
Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile Pro Phe Pro
885 890 895
Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val
900 905 910
Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile
915 920 925
Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala Leu Gly Lys
930 935 940
Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val
945 950 955 960
Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn Asp
965 970 975
Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln Ile Asp Arg
980 985 990
Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln
995 1000 1005
Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala
1010 1015 1020
Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp
1025 1030 1035
Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
1040 1045 1050
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln
1055 1060 1065
Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys
1070 1075 1080
Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His
1085 1090 1095
Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr
1100 1105 1110
Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly
1115 1120 1125
Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp
1130 1135 1140
Ser Gly Gly Asp Ile Ile Lys Leu Leu Asn Glu Gln Val Asn Lys
1145 1150 1155
Glu Met Gln Ser Ser Asn Leu Tyr Met Ser Met Ser Ser Trp Cys
1160 1165 1170
Tyr Thr His Ser Leu Asp Gly Ala Gly Leu Phe Leu Phe Asp His
1175 1180 1185
Ala Ala Glu Glu Tyr Glu His Ala Lys Lys Leu Ile Ile Phe Leu
1190 1195 1200
Asn Glu Asn Asn Val Pro Val Gln Leu Thr Ser Ile Ser Ala Pro
1205 1210 1215
Glu His Lys Phe Glu Gly Leu Thr Gln Ile Phe Gln Lys Ala Tyr
1220 1225 1230
Glu His Glu Gln His Ile Ser Glu Ser Ile Asn Asn Ile Val Asp
1235 1240 1245
His Ala Ile Lys Ser Lys Asp His Ala Thr Phe Asn Phe Leu Gln
1250 1255 1260
Trp Tyr Val Ala Glu Gln His Glu Glu Glu Val Leu Phe Lys Asp
1265 1270 1275
Ile Leu Asp Lys Ile Glu Leu Ile Gly Asn Glu Asn His Gly Leu
1280 1285 1290
Tyr Leu Ala Asp Gln Tyr Val Lys Gly Ile Ala Lys Ser Arg Lys
1295 1300 1305
Ser
<210> 29
<211> 1312
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 29
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ile Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Cys Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Arg Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile
885 890 895
Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
1010 1015 1020
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
1025 1030 1035
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1040 1045 1050
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
1055 1060 1065
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His
1070 1075 1080
Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn
1085 1090 1095
Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln
1100 1105 1110
Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val
1115 1120 1125
Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1130 1135 1140
Glu Leu Asp Ser Gly Gly Asp Ile Ile Lys Leu Leu Asn Glu Gln
1145 1150 1155
Val Asn Lys Glu Met Gln Ser Ser Asn Leu Tyr Met Ser Met Ser
1160 1165 1170
Ser Trp Cys Tyr Thr His Ser Leu Asp Gly Ala Gly Leu Phe Leu
1175 1180 1185
Phe Asp His Ala Ala Glu Glu Tyr Glu His Ala Lys Lys Leu Ile
1190 1195 1200
Ile Phe Leu Asn Glu Asn Asn Val Pro Val Gln Leu Thr Ser Ile
1205 1210 1215
Ser Ala Pro Glu His Lys Phe Glu Gly Leu Thr Gln Ile Phe Gln
1220 1225 1230
Lys Ala Tyr Glu His Glu Gln His Ile Ser Glu Ser Ile Asn Asn
1235 1240 1245
Ile Val Asp His Ala Ile Lys Ser Lys Asp His Ala Thr Phe Asn
1250 1255 1260
Phe Leu Gln Trp Tyr Val Ala Glu Gln His Glu Glu Glu Val Leu
1265 1270 1275
Phe Lys Asp Ile Leu Asp Lys Ile Glu Leu Ile Gly Asn Glu Asn
1280 1285 1290
His Gly Leu Tyr Leu Ala Asp Gln Tyr Val Lys Gly Ile Ala Lys
1295 1300 1305
Ser Arg Lys Ser
1310
<210> 30
<211> 1312
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 30
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Phe Thr Asn Arg Thr Gln Leu Pro Ser Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Tyr Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Ser Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Thr Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Lys Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Tyr Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu Tyr Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile
885 890 895
Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
1010 1015 1020
Leu Ala Ala Ile Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
1025 1030 1035
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1040 1045 1050
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
1055 1060 1065
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His
1070 1075 1080
Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn
1085 1090 1095
Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln
1100 1105 1110
Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val
1115 1120 1125
Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1130 1135 1140
Glu Leu Asp Ser Gly Gly Asp Ile Ile Lys Leu Leu Asn Glu Gln
1145 1150 1155
Val Asn Lys Glu Met Gln Ser Ser Asn Leu Tyr Met Ser Met Ser
1160 1165 1170
Ser Trp Cys Tyr Thr His Ser Leu Asp Gly Ala Gly Leu Phe Leu
1175 1180 1185
Phe Asp His Ala Ala Glu Glu Tyr Glu His Ala Lys Lys Leu Ile
1190 1195 1200
Ile Phe Leu Asn Glu Asn Asn Val Pro Val Gln Leu Thr Ser Ile
1205 1210 1215
Ser Ala Pro Glu His Lys Phe Glu Gly Leu Thr Gln Ile Phe Gln
1220 1225 1230
Lys Ala Tyr Glu His Glu Gln His Ile Ser Glu Ser Ile Asn Asn
1235 1240 1245
Ile Val Asp His Ala Ile Lys Ser Lys Asp His Ala Thr Phe Asn
1250 1255 1260
Phe Leu Gln Trp Tyr Val Ala Glu Gln His Glu Glu Glu Val Leu
1265 1270 1275
Phe Lys Asp Ile Leu Asp Lys Ile Glu Leu Ile Gly Asn Glu Asn
1280 1285 1290
His Gly Leu Tyr Leu Ala Asp Gln Tyr Val Lys Gly Ile Ala Lys
1295 1300 1305
Ser Arg Lys Ser
1310
Claims (29)
- 코로나바이러스의 스파이크 단백질의 인공적으로 변형된 아미노산 서열 및 페리틴 서브유닛 폴리펩티드의 아미노산 서열의 융합 단백질로서, 여기서 스파이크 단백질의 인공적으로 변형된 아미노산 서열이 SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:14 또는 SEQ ID NO:15와 적어도 90% 서열 동일성을 갖는 서열인, 융합 단백질.
- 제1항에 있어서, 코로나바이러스가 SARS-CoV-2인 융합 단백질.
- 제1항 또는 제2항에 있어서, 코로나바이러스의 스파이크 단백질의 인공적으로 변형된 아미노산 서열이 적어도 헵타드 반복 2(HR2)의 아미노산 서열의 C-말단 결실을 포함하는 융합 단백질.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 코로나바이러스의 스파이크 단백질의 인공적으로 변형된 아미노산 서열이 푸린 인식 부위를 제거하는 돌연변이를 포함하는 융합 단백질.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 코로나바이러스의 스파이크 단백질의 인공적으로 변형된 아미노산 서열이 스파이크 단백질을 예비-융합 입체형태로 안정화시키는 하나 이상의 돌연변이를 포함하는 융합 단백질.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 페리틴 서브유닛 폴리펩티드가 헬리코박터 파일로리(Helicobacter pylori) 페리틴 서브유닛 폴리펩티드인 융합 단백질.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 페리틴 서브유닛 폴리펩티드의 아미노산 서열이 SEQ ID NO:2와 적어도 90% 서열 동일성을 갖는 서열인 융합 단백질.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 페리틴 서브유닛 폴리펩티드가 하나 이상의 인공 글리코실화 부위를 포함하는 융합 단백질.
- 제1항 내지 제8항 중 어느 한 항에 있어서, 코로나바이러스의 스파이크 단백질의 인공적으로 변형된 아미노산 서열이 링커 아미노산 서열에 의해 페리틴 서브유닛 폴리펩티드의 아미노산 서열에 연결되는 융합 단백질.
- 제1항 내지 제9항 중 어느 한 항에 있어서, 융합 단백질의 아미노산 서열이 SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:33 또는 SEQ ID NO:34와 적어도 90% 동일성을 갖는 서열인 융합 단백질.
- 제1항 내지 제10항 중 어느 한 항의 융합 단백질의 올리고머를 포함하는 나노입자.
- 제11항에 있어서, 나노입자가 코로나바이러스의 스파이크 단백질의 엑토도메인의 표면에 노출된 삼량체를 포함하는 나노입자.
- 제12항에 있어서, 나노입자가 코로나바이러스의 스파이크 단백질의 엑토도메인의 표면에 노출된 8개의 삼량체를 포함하는 나노입자.
- 제1항 내지 제10항 중 어느 한 항의 융합 단백질을 인코딩하는 핵산.
- 제14항에 있어서, 핵산이 DNA 또는 RNA인 핵산.
- 제14항 또는 제15항의 핵산을 포함하는 벡터.
- 제14항 또는 제15항의 핵산 또는 제14항의 벡터를 포함하는 세포.
- 제1항 내지 제9항 중 어느 한 항의 융합 단백질, 제10항 내지 제12항 중 어느 한 항의 나노입자, 제13항 또는 제14항의 핵산, 또는 제 15항의 벡터를 포함하는 면역원성 조성물.
- 제1항 내지 제9항 중 어느 한 항의 2개 이상의 상이한 융합 단백질, 제10항 내지 제12항 중 어느 한 항의 2개 이상의 상이한 나노입자, 제13항 또는 제14항의 2개 이상의 상이한 핵산, 또는 제15항의 2개 이상의 상이한 벡터를 포함하는 면역원성 조성물.
- 제18항 또는 제19항에 있어서, 하나 이상의 애주번트를 추가로 포함하는 면역원성 조성물.
- 제18항 내지 제20항 중 어느 한 항에 있어서, 하나 이상의 애주번트가 명반을 포함하는 면역원성 조성물.
- 제18항 또는 제20항에 있어서, 면역원성 조성물이 동결건조된 면역원성 조성물.
- 제18항 내지 제22항 중 어느 한 항의 면역원성 조성물 및 면역원성 조성물을 투여하기 위한 장치 및 부형제 중 하나 이상을 포함하는 키트.
- 대상체에게 제18항 내지 제22항 중 어느 한 항의 면역원성 조성물을 투여하는 것을 포함하는, 대상체에서 면역 반응을 유도하는 방법.
- 제24항에 있어서, 면역원성 조성물이 대상체에서 코로나바이러스에 대한 보호 면역 반응을 유도할 수 있는 양으로 투여되는 방법.
- 제25항에 있어서, 보호 면역 반응이 대상체에서 코로나바이러스에 대한 중화 항체의 생산을 포함하는 방법.
- 제24항 내지 제26항 중 어느 한 항에 있어서, 대상체가 인간인 방법.
- 제14항 또는 제15항의 핵산 또는 제15항의 벡터를 세포에 도입하고;
융합 단백질의 발현을 허용하는 조건 하에서 세포를 인큐베이션하고;
융합 단백질을 분리하는 것을 포함하는, 융합 단백질을 생산하는 방법. - 제14항 또는 제15항의 핵산 또는 제15항의 벡터를 세포에 도입하고;
융합 단백질의 발현 및 나노입자의 자가-조립을 허용하는 조건 하에서 세포를 인큐베이션하고;
나노입자를 분리하는 것을 포함하는, 나노입자를 생산하는 방법.
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063070961P | 2020-08-27 | 2020-08-27 | |
US63/070,961 | 2020-08-27 | ||
US202063130056P | 2020-12-23 | 2020-12-23 | |
US63/130,056 | 2020-12-23 | ||
US202163196837P | 2021-06-04 | 2021-06-04 | |
US63/196,837 | 2021-06-04 | ||
PCT/US2021/047885 WO2022047116A1 (en) | 2020-08-27 | 2021-08-27 | Immunogenic coronavirus fusion proteins and related methods |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230084478A true KR20230084478A (ko) | 2023-06-13 |
Family
ID=80354081
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237010064A KR20230084478A (ko) | 2020-08-27 | 2021-08-27 | 면역원성 코로나 바이러스 융합 단백질 및 관련 방법 |
Country Status (12)
Country | Link |
---|---|
US (1) | US20230399364A1 (ko) |
EP (1) | EP4203998A1 (ko) |
JP (1) | JP2023540486A (ko) |
KR (1) | KR20230084478A (ko) |
AU (1) | AU2021333793A1 (ko) |
BR (1) | BR112023003526A2 (ko) |
CA (1) | CA3193288A1 (ko) |
CL (1) | CL2023000566A1 (ko) |
CO (1) | CO2023003453A2 (ko) |
IL (1) | IL300905A (ko) |
MX (1) | MX2023002413A (ko) |
WO (1) | WO2022047116A1 (ko) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114717205A (zh) * | 2022-03-29 | 2022-07-08 | 中国人民解放军军事科学院军事医学研究院 | 一种冠状病毒RBDdm变异体及其应用 |
CN115746148B (zh) * | 2022-10-14 | 2023-09-12 | 中国医学科学院病原生物学研究所 | 具有冠状病毒rbd和膜融合抑制多肽的蛋白质及其作为冠状病毒抑制剂的应用 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
HU228121B1 (en) * | 2001-05-17 | 2012-11-28 | Stichting Tech Wetenschapp | Corona-virus-like particles comprising functionally deleted genomes |
EP2758038B1 (en) * | 2011-09-23 | 2018-05-30 | The United States of America, as represented by The Secretary, Department of Health & Human Services | Novel influenza hemagglutinin protein-based vaccines |
-
2021
- 2021-08-27 US US18/043,285 patent/US20230399364A1/en active Pending
- 2021-08-27 JP JP2023513740A patent/JP2023540486A/ja active Pending
- 2021-08-27 KR KR1020237010064A patent/KR20230084478A/ko unknown
- 2021-08-27 EP EP21862795.8A patent/EP4203998A1/en active Pending
- 2021-08-27 BR BR112023003526A patent/BR112023003526A2/pt unknown
- 2021-08-27 AU AU2021333793A patent/AU2021333793A1/en active Pending
- 2021-08-27 IL IL300905A patent/IL300905A/en unknown
- 2021-08-27 CA CA3193288A patent/CA3193288A1/en active Pending
- 2021-08-27 WO PCT/US2021/047885 patent/WO2022047116A1/en active Application Filing
- 2021-08-27 MX MX2023002413A patent/MX2023002413A/es unknown
-
2023
- 2023-02-27 CL CL2023000566A patent/CL2023000566A1/es unknown
- 2023-03-21 CO CONC2023/0003453A patent/CO2023003453A2/es unknown
Also Published As
Publication number | Publication date |
---|---|
BR112023003526A2 (pt) | 2023-04-11 |
CO2023003453A2 (es) | 2023-04-27 |
AU2021333793A1 (en) | 2023-04-13 |
EP4203998A1 (en) | 2023-07-05 |
US20230399364A1 (en) | 2023-12-14 |
CA3193288A1 (en) | 2022-03-03 |
WO2022047116A1 (en) | 2022-03-03 |
CL2023000566A1 (es) | 2023-10-30 |
MX2023002413A (es) | 2023-05-23 |
JP2023540486A (ja) | 2023-09-25 |
IL300905A (en) | 2023-04-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102482994B1 (ko) | 사스-코로나바이러스-2 감염증 예방 또는 치료용 백신 조성물 | |
EP2928493B1 (en) | Fusion proteins for use as immunogenic enhancers for inducing antigen-specific t cell responses | |
CA2485363C (en) | Ferritin fusion proteins for use in vaccines and other applications | |
ES2659875T3 (es) | Vacuna de trímero de Env VIH-1 bioquímicamente estabilizado | |
ES2858315T3 (es) | Proteína F de prefusión de VRS soluble estabilizada para uso en la profilaxis de la infección por VRS | |
CN115515627A (zh) | SARS-CoV-2疫苗 | |
JP2003529319A (ja) | HIV−1gp41を標的化する広範に中和する抗体を誘発する方法 | |
US8936789B2 (en) | Immunoenhancer-linked oligomeric HIV envelope peptides | |
US20230399364A1 (en) | Immunogenic Coronavirus Fusion Proteins and Related Methods | |
CN115246874A (zh) | 一种重组新型冠状病毒s-rbd三聚体蛋白、其制备方法和应用 | |
KR20220010478A (ko) | 기도 감염의 치료 또는 예방용 서브유닛 백신 | |
WO2019092002A1 (en) | Pharmaceutical compositions for treatment or prevention of viral infections | |
WO2023051701A1 (zh) | 抗SARS-CoV-2感染的mRNA、蛋白以及抗SARS-CoV-2感染的疫苗 | |
WO2021262672A1 (en) | Sars-cov-2 rbd constructs | |
WO2022135563A1 (zh) | 同时诱导抗多种病毒的免疫应答的方法 | |
CA2914555A1 (en) | Single domain antibody display | |
WO2021235503A1 (ja) | コロナウイルスの蛋白質が担持された複合蛋白質単量体、当該単量体の会合体、及び当該会合体を有効成分とするコンポーネントワクチン | |
WO2024059149A2 (en) | Immunogenic coronavirus fusion proteins and related methods | |
CN116964104A (zh) | 免疫原性冠状病毒融合蛋白及相关方法 | |
CA3174685A1 (en) | Immunogenic coronavirus fusion proteins and related methods | |
CN113801206A (zh) | 利用受体识别域诱导抗新冠病毒中和抗体的方法 | |
RU2811991C2 (ru) | Субъединичная вакцина для лечения или предотвращения инфекции дыхательных путей | |
US20230310584A1 (en) | Nucleic acids encoding a polypeptide comprising a modified fc region of a human igg1 and at least one heterologous antigen | |
US20240067706A1 (en) | Fully human broad-spectrum neutralizing antibody 76e1 against coronavirus, and use thereof | |
Ávalos et al. | Chimeric Antigen by the Fusion of SARS-CoV-2 Receptor Binding Domain with the Extracellular Domain of Human CD154: A Promising Improved Vaccine Candidate. Vaccines 2022, 10 (6), 897 |