KR20230002571A - 큰 서열 범-코로나바이러스 백신 조성물 - Google Patents
큰 서열 범-코로나바이러스 백신 조성물 Download PDFInfo
- Publication number
- KR20230002571A KR20230002571A KR1020227038797A KR20227038797A KR20230002571A KR 20230002571 A KR20230002571 A KR 20230002571A KR 1020227038797 A KR1020227038797 A KR 1020227038797A KR 20227038797 A KR20227038797 A KR 20227038797A KR 20230002571 A KR20230002571 A KR 20230002571A
- Authority
- KR
- South Korea
- Prior art keywords
- composition
- coronavirus
- protein
- conserved
- cell
- Prior art date
Links
- 229960005486 vaccine Drugs 0.000 title claims abstract description 297
- 239000000203 mixture Substances 0.000 title claims description 765
- 210000001744 T-lymphocyte Anatomy 0.000 claims abstract description 490
- 241000711573 Coronaviridae Species 0.000 claims abstract description 396
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 85
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 79
- 241001465754 Metazoa Species 0.000 claims abstract description 70
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 42
- 201000010099 disease Diseases 0.000 claims abstract description 37
- 208000001528 Coronaviridae Infections Diseases 0.000 claims abstract description 33
- 230000028993 immune response Effects 0.000 claims abstract description 33
- 230000003389 potentiating effect Effects 0.000 claims abstract description 5
- 238000000034 method Methods 0.000 claims description 205
- 102000019034 Chemokines Human genes 0.000 claims description 185
- 108010012236 Chemokines Proteins 0.000 claims description 185
- 101710198474 Spike protein Proteins 0.000 claims description 145
- 229940096437 Protein S Drugs 0.000 claims description 135
- 108010008038 Synthetic Vaccines Proteins 0.000 claims description 133
- 210000003719 b-lymphocyte Anatomy 0.000 claims description 133
- 229940124551 recombinant vaccine Drugs 0.000 claims description 132
- 239000000427 antigen Substances 0.000 claims description 124
- 108091007433 antigens Proteins 0.000 claims description 124
- 102000036639 antigens Human genes 0.000 claims description 124
- 241001678559 COVID-19 virus Species 0.000 claims description 117
- 241000282414 Homo sapiens Species 0.000 claims description 109
- 241000831652 Salinivibrio sharmensis Species 0.000 claims description 93
- 108091036078 conserved sequence Proteins 0.000 claims description 87
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 87
- 101710114810 Glycoprotein Proteins 0.000 claims description 82
- 101710167605 Spike glycoprotein Proteins 0.000 claims description 82
- 210000004072 lung Anatomy 0.000 claims description 71
- 230000006052 T cell proliferation Effects 0.000 claims description 56
- 241000282375 Herpestidae Species 0.000 claims description 49
- 239000002671 adjuvant Substances 0.000 claims description 49
- 241000283966 Pholidota <mammal> Species 0.000 claims description 45
- 241000700605 Viruses Species 0.000 claims description 41
- 101150001779 ORF1a gene Proteins 0.000 claims description 39
- 150000001413 amino acids Chemical class 0.000 claims description 38
- 241000288673 Chiroptera Species 0.000 claims description 36
- 238000006467 substitution reaction Methods 0.000 claims description 32
- 241000282832 Camelidae Species 0.000 claims description 31
- 241000282326 Felis catus Species 0.000 claims description 31
- 101000596353 Severe acute respiratory syndrome coronavirus 2 ORF7a protein Proteins 0.000 claims description 31
- 101710172711 Structural protein Proteins 0.000 claims description 27
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 26
- 101710087110 ORF6 protein Proteins 0.000 claims description 26
- 108020004999 messenger RNA Proteins 0.000 claims description 26
- 102000004127 Cytokines Human genes 0.000 claims description 25
- 108090000695 Cytokines Proteins 0.000 claims description 25
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 claims description 25
- 210000004556 brain Anatomy 0.000 claims description 25
- 201000009240 nasopharyngitis Diseases 0.000 claims description 25
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 24
- 102100025279 C-X-C motif chemokine 11 Human genes 0.000 claims description 23
- 101000858060 Homo sapiens C-X-C motif chemokine 11 Proteins 0.000 claims description 23
- 108091005634 SARS-CoV-2 receptor-binding domains Proteins 0.000 claims description 23
- 125000001500 prolyl group Chemical group [H]N1C([H])(C(=O)[*])C([H])([H])C([H])([H])C1([H])[H] 0.000 claims description 23
- 210000004027 cell Anatomy 0.000 claims description 22
- 101000748061 Acholeplasma phage L2 Uncharacterized 16.1 kDa protein Proteins 0.000 claims description 21
- 101000947615 Clostridium perfringens Uncharacterized 38.4 kDa protein Proteins 0.000 claims description 21
- 101000964391 Enterococcus faecalis UPF0145 protein Proteins 0.000 claims description 21
- 101000748063 Haemophilus phage HP1 (strain HP1c1) Uncharacterized 11.1 kDa protein in rep-hol intergenic region Proteins 0.000 claims description 21
- 108010002586 Interleukin-7 Proteins 0.000 claims description 21
- 101000790840 Klebsiella pneumoniae Uncharacterized 49.5 kDa protein in cps region Proteins 0.000 claims description 21
- 230000035772 mutation Effects 0.000 claims description 21
- 108010002350 Interleukin-2 Proteins 0.000 claims description 20
- 241000008904 Betacoronavirus Species 0.000 claims description 19
- 102100025248 C-X-C motif chemokine 10 Human genes 0.000 claims description 19
- 102100036170 C-X-C motif chemokine 9 Human genes 0.000 claims description 19
- 101000858088 Homo sapiens C-X-C motif chemokine 10 Proteins 0.000 claims description 19
- 101000947172 Homo sapiens C-X-C motif chemokine 9 Proteins 0.000 claims description 19
- -1 Nsp7 Proteins 0.000 claims description 19
- 230000000903 blocking effect Effects 0.000 claims description 19
- 239000003937 drug carrier Substances 0.000 claims description 19
- 102000003812 Interleukin-15 Human genes 0.000 claims description 18
- 108090000172 Interleukin-15 Proteins 0.000 claims description 18
- 101710128341 ORF7a protein Proteins 0.000 claims description 18
- 101000596375 Severe acute respiratory syndrome coronavirus 2 ORF7b protein Proteins 0.000 claims description 18
- 102100032367 C-C motif chemokine 5 Human genes 0.000 claims description 17
- 101000797762 Homo sapiens C-C motif chemokine 5 Proteins 0.000 claims description 17
- 108090001074 Nucleocapsid Proteins Proteins 0.000 claims description 17
- 241000004176 Alphacoronavirus Species 0.000 claims description 16
- 108010052285 Membrane Proteins Proteins 0.000 claims description 16
- 230000036961 partial effect Effects 0.000 claims description 16
- 241000701161 unidentified adenovirus Species 0.000 claims description 16
- 101710091045 Envelope protein Proteins 0.000 claims description 15
- 108700026244 Open Reading Frames Proteins 0.000 claims description 15
- 101710188315 Protein X Proteins 0.000 claims description 15
- 230000001965 increasing effect Effects 0.000 claims description 15
- 101710135104 Uncharacterized protein p6 Proteins 0.000 claims description 14
- 238000003776 cleavage reaction Methods 0.000 claims description 14
- 102000054766 genetic haplotypes Human genes 0.000 claims description 14
- 230000007017 scission Effects 0.000 claims description 14
- 102000011931 Nucleoproteins Human genes 0.000 claims description 13
- 108010061100 Nucleoproteins Proteins 0.000 claims description 13
- 101710125107 ORF7b protein Proteins 0.000 claims description 13
- 101710096370 ORF8 protein Proteins 0.000 claims description 13
- 230000005847 immunogenicity Effects 0.000 claims description 13
- 102100039435 C-X-C motif chemokine 17 Human genes 0.000 claims description 12
- 101710189104 Fibritin Proteins 0.000 claims description 12
- 108010058597 HLA-DR Antigens Proteins 0.000 claims description 12
- 102000006354 HLA-DR Antigens Human genes 0.000 claims description 12
- 101000889048 Homo sapiens C-X-C motif chemokine 17 Proteins 0.000 claims description 12
- 108091005774 SARS-CoV-2 proteins Proteins 0.000 claims description 12
- 101710095001 Uncharacterized protein in nifU 5'region Proteins 0.000 claims description 12
- 210000003071 memory t lymphocyte Anatomy 0.000 claims description 12
- 238000005829 trimerization reaction Methods 0.000 claims description 12
- 102000018697 Membrane Proteins Human genes 0.000 claims description 11
- 230000003472 neutralizing effect Effects 0.000 claims description 11
- 230000001737 promoting effect Effects 0.000 claims description 11
- 101710125418 Major capsid protein Proteins 0.000 claims description 10
- 102000012750 Membrane Glycoproteins Human genes 0.000 claims description 10
- 108010090054 Membrane Glycoproteins Proteins 0.000 claims description 10
- 101710198378 Uncharacterized 10.8 kDa protein in cox-rep intergenic region Proteins 0.000 claims description 10
- 210000001151 cytotoxic T lymphocyte Anatomy 0.000 claims description 10
- 101710132601 Capsid protein Proteins 0.000 claims description 9
- 101710094648 Coat protein Proteins 0.000 claims description 9
- 102100021181 Golgi phosphoprotein 3 Human genes 0.000 claims description 9
- 241000282339 Mustela Species 0.000 claims description 9
- 101800000515 Non-structural protein 3 Proteins 0.000 claims description 9
- 101710141454 Nucleoprotein Proteins 0.000 claims description 9
- 101710083689 Probable capsid protein Proteins 0.000 claims description 9
- 238000006386 neutralization reaction Methods 0.000 claims description 9
- 101800001631 3C-like serine proteinase Proteins 0.000 claims description 8
- 102100021933 C-C motif chemokine 25 Human genes 0.000 claims description 8
- 102100021942 C-C motif chemokine 28 Human genes 0.000 claims description 8
- 102100025250 C-X-C motif chemokine 14 Human genes 0.000 claims description 8
- 101000897486 Homo sapiens C-C motif chemokine 25 Proteins 0.000 claims description 8
- 101000897477 Homo sapiens C-C motif chemokine 28 Proteins 0.000 claims description 8
- 101000858068 Homo sapiens C-X-C motif chemokine 14 Proteins 0.000 claims description 8
- 101800000935 Non-structural protein 12 Proteins 0.000 claims description 8
- 101800000508 Non-structural protein 5 Proteins 0.000 claims description 8
- 101800000507 Non-structural protein 6 Proteins 0.000 claims description 8
- 101800000509 Non-structural protein 8 Proteins 0.000 claims description 8
- 101710193592 ORF3a protein Proteins 0.000 claims description 8
- 101800001554 RNA-directed RNA polymerase Proteins 0.000 claims description 8
- 230000036039 immunity Effects 0.000 claims description 8
- 208000015181 infectious disease Diseases 0.000 claims description 8
- 230000014759 maintenance of location Effects 0.000 claims description 8
- 230000005012 migration Effects 0.000 claims description 8
- 238000013508 migration Methods 0.000 claims description 8
- 229920000642 polymer Polymers 0.000 claims description 8
- 101800003471 Helicase Proteins 0.000 claims description 7
- 101800000355 Helicase nsp10 Proteins 0.000 claims description 7
- 101800000706 Serine protease nsp4 Proteins 0.000 claims description 7
- 101710193546 Tegument protein VP16 homolog Proteins 0.000 claims description 7
- 101800001925 Uridylate-specific endoribonuclease nsp11 Proteins 0.000 claims description 7
- 241000702421 Dependoparvovirus Species 0.000 claims description 6
- 108010040721 Flagellin Proteins 0.000 claims description 6
- 206010061218 Inflammation Diseases 0.000 claims description 6
- 238000011161 development Methods 0.000 claims description 6
- 230000001939 inductive effect Effects 0.000 claims description 6
- 230000004054 inflammatory process Effects 0.000 claims description 6
- 238000004519 manufacturing process Methods 0.000 claims description 6
- 241001164825 Adeno-associated virus - 8 Species 0.000 claims description 5
- 206010052015 cytokine release syndrome Diseases 0.000 claims description 5
- 230000028709 inflammatory response Effects 0.000 claims description 5
- 210000001806 memory b lymphocyte Anatomy 0.000 claims description 5
- 230000002265 prevention Effects 0.000 claims description 5
- 230000029812 viral genome replication Effects 0.000 claims description 5
- 101710132435 ORF8a protein Proteins 0.000 claims description 4
- 230000007774 longterm Effects 0.000 claims description 4
- 206010050685 Cytokine storm Diseases 0.000 claims description 3
- 238000001990 intravenous administration Methods 0.000 claims description 3
- 238000009169 immunotherapy Methods 0.000 claims description 2
- 102100021696 Syncytin-1 Human genes 0.000 claims 4
- 241000701024 Human betaherpesvirus 5 Species 0.000 claims 1
- 101710188368 Protein ORF10 Proteins 0.000 claims 1
- 239000003623 enhancer Substances 0.000 claims 1
- 244000309467 Human Coronavirus Species 0.000 abstract description 9
- 230000005923 long-lasting effect Effects 0.000 abstract description 2
- 239000012634 fragment Substances 0.000 description 48
- 230000008685 targeting Effects 0.000 description 33
- 102000004196 processed proteins & peptides Human genes 0.000 description 31
- 238000004458 analytical method Methods 0.000 description 30
- 210000001266 CD8-positive T-lymphocyte Anatomy 0.000 description 29
- 241000315672 SARS coronavirus Species 0.000 description 26
- 201000003176 Severe Acute Respiratory Syndrome Diseases 0.000 description 26
- 241000282412 Homo Species 0.000 description 23
- 241000008910 Severe acute respiratory syndrome-related coronavirus Species 0.000 description 21
- 210000002216 heart Anatomy 0.000 description 17
- 210000003734 kidney Anatomy 0.000 description 17
- 230000000670 limiting effect Effects 0.000 description 17
- 238000003032 molecular docking Methods 0.000 description 17
- 208000025721 COVID-19 Diseases 0.000 description 16
- 102100040485 HLA class II histocompatibility antigen, DRB1 beta chain Human genes 0.000 description 16
- 108010039343 HLA-DRB1 Chains Proteins 0.000 description 16
- 241000699670 Mus sp. Species 0.000 description 16
- 238000002864 sequence alignment Methods 0.000 description 16
- 102000000588 Interleukin-2 Human genes 0.000 description 15
- 102000000704 Interleukin-7 Human genes 0.000 description 15
- 208000025370 Middle East respiratory syndrome Diseases 0.000 description 15
- 241000282836 Camelus dromedarius Species 0.000 description 13
- 108091034117 Oligonucleotide Proteins 0.000 description 13
- 238000012300 Sequence Analysis Methods 0.000 description 13
- 230000003993 interaction Effects 0.000 description 13
- 239000002105 nanoparticle Substances 0.000 description 13
- 102100038132 Endogenous retrovirus group K member 6 Pro protein Human genes 0.000 description 12
- 238000007792 addition Methods 0.000 description 12
- 230000014509 gene expression Effects 0.000 description 12
- 150000002632 lipids Chemical class 0.000 description 12
- 238000011830 transgenic mouse model Methods 0.000 description 12
- 102100035765 Angiotensin-converting enzyme 2 Human genes 0.000 description 11
- 108090000975 Angiotensin-converting enzyme 2 Proteins 0.000 description 11
- 241000282472 Canis lupus familiaris Species 0.000 description 11
- 102000005962 receptors Human genes 0.000 description 11
- 108020003175 receptors Proteins 0.000 description 11
- 102100025137 Early activation antigen CD69 Human genes 0.000 description 10
- 102100028972 HLA class I histocompatibility antigen, A alpha chain Human genes 0.000 description 10
- 108010075704 HLA-A Antigens Proteins 0.000 description 10
- 101000934374 Homo sapiens Early activation antigen CD69 Proteins 0.000 description 10
- 101001023379 Homo sapiens Lysosome-associated membrane glycoprotein 1 Proteins 0.000 description 10
- 102100035133 Lysosome-associated membrane glycoprotein 1 Human genes 0.000 description 10
- 241000127282 Middle East respiratory syndrome-related coronavirus Species 0.000 description 10
- 241000711975 Vesicular stomatitis virus Species 0.000 description 10
- 239000013598 vector Substances 0.000 description 10
- 102100037850 Interferon gamma Human genes 0.000 description 9
- 108010074328 Interferon-gamma Proteins 0.000 description 9
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 9
- 230000002163 immunogen Effects 0.000 description 9
- 108010034529 leucyl-lysine Proteins 0.000 description 9
- 230000002194 synthesizing effect Effects 0.000 description 9
- 210000001519 tissue Anatomy 0.000 description 9
- 108010088729 HLA-A*02:01 antigen Proteins 0.000 description 8
- 241000699660 Mus musculus Species 0.000 description 8
- 230000002068 genetic effect Effects 0.000 description 8
- 102000040430 polynucleotide Human genes 0.000 description 8
- 108091033319 polynucleotide Proteins 0.000 description 8
- 239000002157 polynucleotide Substances 0.000 description 8
- 229920001184 polypeptide Polymers 0.000 description 8
- 239000000463 material Substances 0.000 description 7
- 239000002773 nucleotide Substances 0.000 description 7
- 125000003729 nucleotide group Chemical group 0.000 description 7
- 230000004044 response Effects 0.000 description 7
- 208000024891 symptom Diseases 0.000 description 7
- 238000012360 testing method Methods 0.000 description 7
- 108020004414 DNA Proteins 0.000 description 6
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 6
- 108010079364 N-glycylalanine Proteins 0.000 description 6
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical group O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 6
- 230000000890 antigenic effect Effects 0.000 description 6
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 6
- 108010037850 glycylvaline Proteins 0.000 description 6
- 238000012423 maintenance Methods 0.000 description 6
- 238000000159 protein binding assay Methods 0.000 description 6
- 239000013603 viral vector Substances 0.000 description 6
- 239000012855 volatile organic compound Substances 0.000 description 6
- 102000017420 CD3 protein, epsilon/gamma/delta subunit Human genes 0.000 description 5
- 238000002965 ELISA Methods 0.000 description 5
- 101000629318 Severe acute respiratory syndrome coronavirus 2 Spike glycoprotein Proteins 0.000 description 5
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 208000035475 disorder Diseases 0.000 description 5
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 5
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 5
- 108010050848 glycylleucine Proteins 0.000 description 5
- 230000003053 immunization Effects 0.000 description 5
- 150000007523 nucleic acids Chemical class 0.000 description 5
- 230000001681 protective effect Effects 0.000 description 5
- 210000000952 spleen Anatomy 0.000 description 5
- 230000001225 therapeutic effect Effects 0.000 description 5
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 4
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 4
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 4
- 229940037003 alum Drugs 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 108010062796 arginyllysine Proteins 0.000 description 4
- 150000001875 compounds Chemical class 0.000 description 4
- 108010016616 cysteinylglycine Proteins 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000002649 immunization Methods 0.000 description 4
- 244000144972 livestock Species 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 108010090894 prolylleucine Proteins 0.000 description 4
- 108010051110 tyrosyl-lysine Proteins 0.000 description 4
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 3
- CREYEAPXISDKSB-FQPOAREZSA-N Ala-Thr-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CREYEAPXISDKSB-FQPOAREZSA-N 0.000 description 3
- GCTANJIJJROSLH-GVARAGBVSA-N Ala-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C)N GCTANJIJJROSLH-GVARAGBVSA-N 0.000 description 3
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 3
- 101100005713 Homo sapiens CD4 gene Proteins 0.000 description 3
- 101100151951 Homo sapiens SARS1 gene Proteins 0.000 description 3
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 3
- 241000880493 Leptailurus serval Species 0.000 description 3
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 3
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 3
- OVZLLFONXILPDZ-VOAKCMCISA-N Leu-Lys-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OVZLLFONXILPDZ-VOAKCMCISA-N 0.000 description 3
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 3
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 3
- YSPZCHGIWAQVKQ-AVGNSLFASA-N Lys-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN YSPZCHGIWAQVKQ-AVGNSLFASA-N 0.000 description 3
- 241000283956 Manis Species 0.000 description 3
- 241000283958 Manis javanica Species 0.000 description 3
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 3
- 241000772415 Neovison vison Species 0.000 description 3
- 241000282316 Paguma Species 0.000 description 3
- 241000608671 Rhinolophus affinis Species 0.000 description 3
- 101000779242 Severe acute respiratory syndrome coronavirus 2 ORF3a protein Proteins 0.000 description 3
- 229930182558 Sterol Chemical class 0.000 description 3
- LYGKYFKSZTUXGZ-ZDLURKLDSA-N Thr-Cys-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)NCC(O)=O LYGKYFKSZTUXGZ-ZDLURKLDSA-N 0.000 description 3
- NIEWSKWFURSECR-FOHZUACHSA-N Thr-Gly-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NIEWSKWFURSECR-FOHZUACHSA-N 0.000 description 3
- HGJRMXOWUWVUOA-GVXVVHGQSA-N Val-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N HGJRMXOWUWVUOA-GVXVVHGQSA-N 0.000 description 3
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 3
- 238000010171 animal model Methods 0.000 description 3
- 108010047857 aspartylglycine Proteins 0.000 description 3
- 108010068265 aspartyltyrosine Proteins 0.000 description 3
- 239000000969 carrier Substances 0.000 description 3
- 238000007385 chemical modification Methods 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 3
- 230000002708 enhancing effect Effects 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 3
- 108010049041 glutamylalanine Proteins 0.000 description 3
- 238000010324 immunological assay Methods 0.000 description 3
- 108010054155 lysyllysine Proteins 0.000 description 3
- 210000004379 membrane Anatomy 0.000 description 3
- 239000012528 membrane Substances 0.000 description 3
- 239000013642 negative control Substances 0.000 description 3
- 102000039446 nucleic acids Human genes 0.000 description 3
- 108020004707 nucleic acids Proteins 0.000 description 3
- 108010051242 phenylalanylserine Proteins 0.000 description 3
- 238000013081 phylogenetic analysis Methods 0.000 description 3
- 108010031719 prolyl-serine Proteins 0.000 description 3
- 108010079317 prolyl-tyrosine Proteins 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 108010048818 seryl-histidine Proteins 0.000 description 3
- 210000004988 splenocyte Anatomy 0.000 description 3
- 239000007921 spray Substances 0.000 description 3
- 230000006641 stabilisation Effects 0.000 description 3
- 238000011105 stabilization Methods 0.000 description 3
- 150000003432 sterols Chemical class 0.000 description 3
- 235000003702 sterols Nutrition 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 238000011823 triple-transgenic mouse model Methods 0.000 description 3
- 229940035893 uracil Drugs 0.000 description 3
- 238000002255 vaccination Methods 0.000 description 3
- 229940125575 vaccine candidate Drugs 0.000 description 3
- MZOFCQQQCNRIBI-VMXHOPILSA-N (3s)-4-[[(2s)-1-[[(2s)-1-[[(1s)-1-carboxy-2-hydroxyethyl]amino]-4-methyl-1-oxopentan-2-yl]amino]-5-(diaminomethylideneamino)-1-oxopentan-2-yl]amino]-3-[[2-[[(2s)-2,6-diaminohexanoyl]amino]acetyl]amino]-4-oxobutanoic acid Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN MZOFCQQQCNRIBI-VMXHOPILSA-N 0.000 description 2
- UVBYMVOUBXYSFV-XUTVFYLZSA-N 1-methylpseudouridine Chemical compound O=C1NC(=O)N(C)C=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 UVBYMVOUBXYSFV-XUTVFYLZSA-N 0.000 description 2
- LRFJOIPOPUJUMI-KWXKLSQISA-N 2-[2,2-bis[(9z,12z)-octadeca-9,12-dienyl]-1,3-dioxolan-4-yl]-n,n-dimethylethanamine Chemical compound CCCCC\C=C/C\C=C/CCCCCCCCC1(CCCCCCCC\C=C/C\C=C/CCCCC)OCC(CCN(C)C)O1 LRFJOIPOPUJUMI-KWXKLSQISA-N 0.000 description 2
- 101800000504 3C-like protease Proteins 0.000 description 2
- QDRGPQWIVZNJQD-CIUDSAMLSA-N Ala-Arg-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O QDRGPQWIVZNJQD-CIUDSAMLSA-N 0.000 description 2
- HQJKCXHQNUCKMY-GHCJXIJMSA-N Ala-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C)N HQJKCXHQNUCKMY-GHCJXIJMSA-N 0.000 description 2
- XQNRANMFRPCFFW-GCJQMDKQSA-N Ala-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C)N)O XQNRANMFRPCFFW-GCJQMDKQSA-N 0.000 description 2
- KTXKIYXZQFWJKB-VZFHVOOUSA-N Ala-Thr-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O KTXKIYXZQFWJKB-VZFHVOOUSA-N 0.000 description 2
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 2
- BSBNNPICFPXDNH-SRVKXCTJSA-N Asn-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N BSBNNPICFPXDNH-SRVKXCTJSA-N 0.000 description 2
- PIABYSIYPGLLDQ-XVSYOHENSA-N Asn-Thr-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PIABYSIYPGLLDQ-XVSYOHENSA-N 0.000 description 2
- LMIWYCWRJVMAIQ-NHCYSSNCSA-N Asn-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N LMIWYCWRJVMAIQ-NHCYSSNCSA-N 0.000 description 2
- HBUJSDCLZCXXCW-YDHLFZDLSA-N Asn-Val-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HBUJSDCLZCXXCW-YDHLFZDLSA-N 0.000 description 2
- BUVNWKQBMZLCDW-UGYAYLCHSA-N Asp-Asn-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BUVNWKQBMZLCDW-UGYAYLCHSA-N 0.000 description 2
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 2
- ZUNMTUPRQMWMHX-LSJOCFKGSA-N Asp-Val-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O ZUNMTUPRQMWMHX-LSJOCFKGSA-N 0.000 description 2
- 206010006458 Bronchitis chronic Diseases 0.000 description 2
- VTYYLEPIZMXCLO-UHFFFAOYSA-L Calcium carbonate Chemical compound [Ca+2].[O-]C([O-])=O VTYYLEPIZMXCLO-UHFFFAOYSA-L 0.000 description 2
- 208000006545 Chronic Obstructive Pulmonary Disease Diseases 0.000 description 2
- ALNKNYKSZPSLBD-ZDLURKLDSA-N Cys-Thr-Gly Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O ALNKNYKSZPSLBD-ZDLURKLDSA-N 0.000 description 2
- 238000011510 Elispot assay Methods 0.000 description 2
- 206010014561 Emphysema Diseases 0.000 description 2
- CGOHAEBMDSEKFB-FXQIFTODSA-N Glu-Glu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O CGOHAEBMDSEKFB-FXQIFTODSA-N 0.000 description 2
- PHONAZGUEGIOEM-GLLZPBPUSA-N Glu-Glu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PHONAZGUEGIOEM-GLLZPBPUSA-N 0.000 description 2
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 2
- HILMIYALTUQTRC-XVKPBYJWSA-N Glu-Gly-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HILMIYALTUQTRC-XVKPBYJWSA-N 0.000 description 2
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 2
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 2
- XLFHCWHXKSFVIB-BQBZGAKWSA-N Gly-Gln-Gln Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLFHCWHXKSFVIB-BQBZGAKWSA-N 0.000 description 2
- QITBQGJOXQYMOA-ZETCQYMHSA-N Gly-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QITBQGJOXQYMOA-ZETCQYMHSA-N 0.000 description 2
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 2
- FGPLUIQCSKGLTI-WDSKDSINSA-N Gly-Ser-Glu Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O FGPLUIQCSKGLTI-WDSKDSINSA-N 0.000 description 2
- PNUFMLXHOLFRLD-KBPBESRZSA-N Gly-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 PNUFMLXHOLFRLD-KBPBESRZSA-N 0.000 description 2
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 2
- 102210042925 HLA-A*02:01 Human genes 0.000 description 2
- BDFCIKANUNMFGB-PMVVWTBXSA-N His-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 BDFCIKANUNMFGB-PMVVWTBXSA-N 0.000 description 2
- 101000929928 Homo sapiens Angiotensin-converting enzyme 2 Proteins 0.000 description 2
- 101000604993 Homo sapiens Lysosome-associated membrane glycoprotein 2 Proteins 0.000 description 2
- 101800000120 Host translation inhibitor nsp1 Proteins 0.000 description 2
- OVPYIUNCVSOVNF-ZPFDUUQYSA-N Ile-Gln-Pro Natural products CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O OVPYIUNCVSOVNF-ZPFDUUQYSA-N 0.000 description 2
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 2
- HJDZMPFEXINXLO-QPHKQPEJSA-N Ile-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N HJDZMPFEXINXLO-QPHKQPEJSA-N 0.000 description 2
- ZYVTXBXHIKGZMD-QSFUFRPTSA-N Ile-Val-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ZYVTXBXHIKGZMD-QSFUFRPTSA-N 0.000 description 2
- 206010061598 Immunodeficiency Diseases 0.000 description 2
- 108010065920 Insulin Lispro Proteins 0.000 description 2
- 108010002616 Interleukin-5 Proteins 0.000 description 2
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 2
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 2
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 2
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 2
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 2
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 2
- SUPVSFFZWVOEOI-UHFFFAOYSA-N Leu-Ala-Tyr Natural products CC(C)CC(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-UHFFFAOYSA-N 0.000 description 2
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 2
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 2
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 2
- ULXYQAJWJGLCNR-YUMQZZPRSA-N Leu-Asp-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 2
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 2
- PRZVBIAOPFGAQF-SRVKXCTJSA-N Leu-Glu-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O PRZVBIAOPFGAQF-SRVKXCTJSA-N 0.000 description 2
- LAPSXOAUPNOINL-YUMQZZPRSA-N Leu-Gly-Asp Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O LAPSXOAUPNOINL-YUMQZZPRSA-N 0.000 description 2
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 2
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 2
- VHFFQUSNFFIZBT-CIUDSAMLSA-N Lys-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N VHFFQUSNFFIZBT-CIUDSAMLSA-N 0.000 description 2
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 2
- YVMQJGWLHRWMDF-MNXVOIDGSA-N Lys-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N YVMQJGWLHRWMDF-MNXVOIDGSA-N 0.000 description 2
- LPAJOCKCPRZEAG-MNXVOIDGSA-N Lys-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCCN LPAJOCKCPRZEAG-MNXVOIDGSA-N 0.000 description 2
- ITWQLSZTLBKWJM-YUMQZZPRSA-N Lys-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCCN ITWQLSZTLBKWJM-YUMQZZPRSA-N 0.000 description 2
- MUXNCRWTWBMNHX-SRVKXCTJSA-N Lys-Leu-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O MUXNCRWTWBMNHX-SRVKXCTJSA-N 0.000 description 2
- LJADEBULDNKJNK-IHRRRGAJSA-N Lys-Leu-Val Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LJADEBULDNKJNK-IHRRRGAJSA-N 0.000 description 2
- OBZHNHBAAVEWKI-DCAQKATOSA-N Lys-Pro-Asn Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O OBZHNHBAAVEWKI-DCAQKATOSA-N 0.000 description 2
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 2
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 2
- WINFHLHJTRGLCV-BZSNNMDCSA-N Lys-Tyr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=C(O)C=C1 WINFHLHJTRGLCV-BZSNNMDCSA-N 0.000 description 2
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 2
- 102100038225 Lysosome-associated membrane glycoprotein 2 Human genes 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 108060004795 Methyltransferase Proteins 0.000 description 2
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 2
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 2
- 101800000512 Non-structural protein 1 Proteins 0.000 description 2
- 101800001728 Nsp1 Proteins 0.000 description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- 101800004803 Papain-like protease Proteins 0.000 description 2
- ALHULIGNEXGFRM-QWRGUYRKSA-N Phe-Cys-Gly Chemical compound OC(=O)CNC(=O)[C@H](CS)NC(=O)[C@@H](N)CC1=CC=CC=C1 ALHULIGNEXGFRM-QWRGUYRKSA-N 0.000 description 2
- OSBADCBXAMSPQD-YESZJQIVSA-N Phe-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N OSBADCBXAMSPQD-YESZJQIVSA-N 0.000 description 2
- GPLWGAYGROGDEN-BZSNNMDCSA-N Phe-Phe-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O GPLWGAYGROGDEN-BZSNNMDCSA-N 0.000 description 2
- BPCLGWHVPVTTFM-QWRGUYRKSA-N Phe-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O BPCLGWHVPVTTFM-QWRGUYRKSA-N 0.000 description 2
- 108010089430 Phosphoproteins Proteins 0.000 description 2
- 102000007982 Phosphoproteins Human genes 0.000 description 2
- 101800001255 Putative 2'-O-methyl transferase Proteins 0.000 description 2
- 241000700159 Rattus Species 0.000 description 2
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 2
- PZZJMBYSYAKYPK-UWJYBYFXSA-N Ser-Ala-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PZZJMBYSYAKYPK-UWJYBYFXSA-N 0.000 description 2
- WBINSDOPZHQPPM-AVGNSLFASA-N Ser-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)O WBINSDOPZHQPPM-AVGNSLFASA-N 0.000 description 2
- HBTCFCHYALPXME-HTFCKZLJSA-N Ser-Ile-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HBTCFCHYALPXME-HTFCKZLJSA-N 0.000 description 2
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 2
- SOACHCFYJMCMHC-BWBBJGPYSA-N Ser-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N)O SOACHCFYJMCMHC-BWBBJGPYSA-N 0.000 description 2
- CDBYLPFSWZWCQE-UHFFFAOYSA-L Sodium Carbonate Chemical compound [Na+].[Na+].[O-]C([O-])=O CDBYLPFSWZWCQE-UHFFFAOYSA-L 0.000 description 2
- 230000005867 T cell response Effects 0.000 description 2
- QWMPARMKIDVBLV-VZFHVOOUSA-N Thr-Cys-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O QWMPARMKIDVBLV-VZFHVOOUSA-N 0.000 description 2
- UDQBCBUXAQIZAK-GLLZPBPUSA-N Thr-Glu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDQBCBUXAQIZAK-GLLZPBPUSA-N 0.000 description 2
- AHOLTQCAVBSUDP-PPCPHDFISA-N Thr-Ile-Lys Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)[C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O AHOLTQCAVBSUDP-PPCPHDFISA-N 0.000 description 2
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 2
- WNQJTLATMXYSEL-OEAJRASXSA-N Thr-Phe-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WNQJTLATMXYSEL-OEAJRASXSA-N 0.000 description 2
- YGCDFAJJCRVQKU-RCWTZXSCSA-N Thr-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O YGCDFAJJCRVQKU-RCWTZXSCSA-N 0.000 description 2
- FWTFAZKJORVTIR-VZFHVOOUSA-N Thr-Ser-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O FWTFAZKJORVTIR-VZFHVOOUSA-N 0.000 description 2
- NQQMWWVVGIXUOX-SVSWQMSJSA-N Thr-Ser-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NQQMWWVVGIXUOX-SVSWQMSJSA-N 0.000 description 2
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 2
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 2
- JAWUQFCGNVEDRN-MEYUZBJRSA-N Thr-Tyr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O JAWUQFCGNVEDRN-MEYUZBJRSA-N 0.000 description 2
- KPMIQCXJDVKWKO-IFFSRLJSSA-N Thr-Val-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KPMIQCXJDVKWKO-IFFSRLJSSA-N 0.000 description 2
- PWONLXBUSVIZPH-RHYQMDGZSA-N Thr-Val-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O PWONLXBUSVIZPH-RHYQMDGZSA-N 0.000 description 2
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 2
- 102000000852 Tumor Necrosis Factor-alpha Human genes 0.000 description 2
- HTHCZRWCFXMENJ-KKUMJFAQSA-N Tyr-Arg-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HTHCZRWCFXMENJ-KKUMJFAQSA-N 0.000 description 2
- GHUNBABNQPIETG-MELADBBJSA-N Tyr-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O GHUNBABNQPIETG-MELADBBJSA-N 0.000 description 2
- DMWNPLOERDAHSY-MEYUZBJRSA-N Tyr-Leu-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DMWNPLOERDAHSY-MEYUZBJRSA-N 0.000 description 2
- AOIZTZRWMSPPAY-KAOXEZKKSA-N Tyr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)O AOIZTZRWMSPPAY-KAOXEZKKSA-N 0.000 description 2
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 2
- 101800000578 Uridylate-specific endoribonuclease Proteins 0.000 description 2
- DNOOLPROHJWCSQ-RCWTZXSCSA-N Val-Arg-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DNOOLPROHJWCSQ-RCWTZXSCSA-N 0.000 description 2
- CGGVNFJRZJUVAE-BYULHYEWSA-N Val-Asp-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CGGVNFJRZJUVAE-BYULHYEWSA-N 0.000 description 2
- OQWNEUXPKHIEJO-NRPADANISA-N Val-Glu-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N OQWNEUXPKHIEJO-NRPADANISA-N 0.000 description 2
- DJEVQCWNMQOABE-RCOVLWMOSA-N Val-Gly-Asp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N DJEVQCWNMQOABE-RCOVLWMOSA-N 0.000 description 2
- WFENBJPLZMPVAX-XVKPBYJWSA-N Val-Gly-Glu Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O WFENBJPLZMPVAX-XVKPBYJWSA-N 0.000 description 2
- FEXILLGKGGTLRI-NHCYSSNCSA-N Val-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N FEXILLGKGGTLRI-NHCYSSNCSA-N 0.000 description 2
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 2
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 2
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 2
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 2
- LTTQCQRTSHJPPL-ZKWXMUAHSA-N Val-Ser-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N LTTQCQRTSHJPPL-ZKWXMUAHSA-N 0.000 description 2
- VVIZITNVZUAEMI-DLOVCJGASA-N Val-Val-Gln Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O VVIZITNVZUAEMI-DLOVCJGASA-N 0.000 description 2
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 2
- NRLNQCOGCKAESA-KWXKLSQISA-N [(6z,9z,28z,31z)-heptatriaconta-6,9,28,31-tetraen-19-yl] 4-(dimethylamino)butanoate Chemical compound CCCCC\C=C/C\C=C/CCCCCCCCC(OC(=O)CCCN(C)C)CCCCCCCC\C=C/C\C=C/CCCCC NRLNQCOGCKAESA-KWXKLSQISA-N 0.000 description 2
- 230000002411 adverse Effects 0.000 description 2
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 2
- 108010005233 alanylglutamic acid Proteins 0.000 description 2
- 108010047495 alanylglycine Proteins 0.000 description 2
- 108010087924 alanylproline Proteins 0.000 description 2
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 2
- 108010038633 aspartylglutamate Proteins 0.000 description 2
- 206010006451 bronchitis Diseases 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 125000002091 cationic group Chemical group 0.000 description 2
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 2
- 208000007451 chronic bronchitis Diseases 0.000 description 2
- 239000013078 crystal Substances 0.000 description 2
- 108010004073 cysteinylcysteine Proteins 0.000 description 2
- 230000002498 deadly effect Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000003114 enzyme-linked immunosorbent spot assay Methods 0.000 description 2
- 238000013401 experimental design Methods 0.000 description 2
- 238000000684 flow cytometry Methods 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 108020001507 fusion proteins Proteins 0.000 description 2
- 102000037865 fusion proteins Human genes 0.000 description 2
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 2
- 108010089804 glycyl-threonine Proteins 0.000 description 2
- 108010010147 glycylglutamine Proteins 0.000 description 2
- 108010015792 glycyllysine Proteins 0.000 description 2
- 108010092114 histidylphenylalanine Proteins 0.000 description 2
- 102000048657 human ACE2 Human genes 0.000 description 2
- 230000001900 immune effect Effects 0.000 description 2
- 210000000987 immune system Anatomy 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000002347 injection Methods 0.000 description 2
- 239000007924 injection Substances 0.000 description 2
- 210000000936 intestine Anatomy 0.000 description 2
- 231100000518 lethal Toxicity 0.000 description 2
- 230000001665 lethal effect Effects 0.000 description 2
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 2
- 108010057821 leucylproline Proteins 0.000 description 2
- 210000000265 leukocyte Anatomy 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 210000004698 lymphocyte Anatomy 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 108010038320 lysylphenylalanine Proteins 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 238000002887 multiple sequence alignment Methods 0.000 description 2
- 210000003928 nasal cavity Anatomy 0.000 description 2
- 210000001331 nose Anatomy 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000007911 parenteral administration Methods 0.000 description 2
- 229940023041 peptide vaccine Drugs 0.000 description 2
- 210000003819 peripheral blood mononuclear cell Anatomy 0.000 description 2
- 239000008194 pharmaceutical composition Substances 0.000 description 2
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 2
- 230000037452 priming Effects 0.000 description 2
- 230000002035 prolonged effect Effects 0.000 description 2
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 2
- 108010070643 prolylglutamic acid Proteins 0.000 description 2
- 108010029020 prolylglycine Proteins 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 210000002345 respiratory system Anatomy 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 238000012289 standard assay Methods 0.000 description 2
- 230000004083 survival effect Effects 0.000 description 2
- 230000000699 topical effect Effects 0.000 description 2
- 230000006433 tumor necrosis factor production Effects 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 108010073969 valyllysine Proteins 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- 230000036266 weeks of gestation Effects 0.000 description 2
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 1
- QNRATNLHPGXHMA-XZHTYLCXSA-N (r)-(6-ethoxyquinolin-4-yl)-[(2s,4s,5r)-5-ethyl-1-azabicyclo[2.2.2]octan-2-yl]methanol;hydrochloride Chemical compound Cl.C([C@H]([C@H](C1)CC)C2)CN1[C@@H]2[C@H](O)C1=CC=NC2=CC=C(OCC)C=C21 QNRATNLHPGXHMA-XZHTYLCXSA-N 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- 101800001779 2'-O-methyltransferase Proteins 0.000 description 1
- 101800003073 2'-O-methyltransferase nsp16 Proteins 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- AAQGRPOPTAUUBM-ZLUOBGJFSA-N Ala-Ala-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O AAQGRPOPTAUUBM-ZLUOBGJFSA-N 0.000 description 1
- UWQJHXKARZWDIJ-ZLUOBGJFSA-N Ala-Ala-Cys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(O)=O UWQJHXKARZWDIJ-ZLUOBGJFSA-N 0.000 description 1
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 1
- LGQPPBQRUBVTIF-JBDRJPRFSA-N Ala-Ala-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LGQPPBQRUBVTIF-JBDRJPRFSA-N 0.000 description 1
- UGLPMYSCWHTZQU-AUTRQRHGSA-N Ala-Ala-Tyr Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UGLPMYSCWHTZQU-AUTRQRHGSA-N 0.000 description 1
- WYPUMLRSQMKIJU-BPNCWPANSA-N Ala-Arg-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O WYPUMLRSQMKIJU-BPNCWPANSA-N 0.000 description 1
- PJNSIUPOXFBHDM-GUBZILKMSA-N Ala-Arg-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O PJNSIUPOXFBHDM-GUBZILKMSA-N 0.000 description 1
- LBJYAILUMSUTAM-ZLUOBGJFSA-N Ala-Asn-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O LBJYAILUMSUTAM-ZLUOBGJFSA-N 0.000 description 1
- STACJSVFHSEZJV-GHCJXIJMSA-N Ala-Asn-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STACJSVFHSEZJV-GHCJXIJMSA-N 0.000 description 1
- ZIWWTZWAKYBUOB-CIUDSAMLSA-N Ala-Asp-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O ZIWWTZWAKYBUOB-CIUDSAMLSA-N 0.000 description 1
- YSMPVONNIWLJML-FXQIFTODSA-N Ala-Asp-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(O)=O YSMPVONNIWLJML-FXQIFTODSA-N 0.000 description 1
- HWPXGQCMZITGFN-XVYDVKMFSA-N Ala-Cys-His Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HWPXGQCMZITGFN-XVYDVKMFSA-N 0.000 description 1
- IFTVANMRTIHKML-WDSKDSINSA-N Ala-Gln-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O IFTVANMRTIHKML-WDSKDSINSA-N 0.000 description 1
- ZDYNWWQXFRUOEO-XDTLVQLUSA-N Ala-Gln-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZDYNWWQXFRUOEO-XDTLVQLUSA-N 0.000 description 1
- YIGLXQRFQVWFEY-NRPADANISA-N Ala-Gln-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O YIGLXQRFQVWFEY-NRPADANISA-N 0.000 description 1
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 1
- GGNHBHYDMUDXQB-KBIXCLLPSA-N Ala-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)N GGNHBHYDMUDXQB-KBIXCLLPSA-N 0.000 description 1
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 1
- ROLXPVQSRCPVGK-XDTLVQLUSA-N Ala-Glu-Tyr Chemical compound N[C@@H](C)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O ROLXPVQSRCPVGK-XDTLVQLUSA-N 0.000 description 1
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 1
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 1
- JDIQCVUDDFENPU-ZKWXMUAHSA-N Ala-His-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CNC=N1 JDIQCVUDDFENPU-ZKWXMUAHSA-N 0.000 description 1
- JEPNLGMEZMCFEX-QSFUFRPTSA-N Ala-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C)N JEPNLGMEZMCFEX-QSFUFRPTSA-N 0.000 description 1
- CFPQUJZTLUQUTJ-HTFCKZLJSA-N Ala-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](C)N CFPQUJZTLUQUTJ-HTFCKZLJSA-N 0.000 description 1
- QCTFKEJEIMPOLW-JURCDPSOSA-N Ala-Ile-Phe Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QCTFKEJEIMPOLW-JURCDPSOSA-N 0.000 description 1
- RUQBGIMJQUWXPP-CYDGBPFRSA-N Ala-Leu-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O RUQBGIMJQUWXPP-CYDGBPFRSA-N 0.000 description 1
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 1
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 1
- NOGFDULFCFXBHB-CIUDSAMLSA-N Ala-Leu-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)O)N NOGFDULFCFXBHB-CIUDSAMLSA-N 0.000 description 1
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 1
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 1
- AJBVYEYZVYPFCF-CIUDSAMLSA-N Ala-Lys-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O AJBVYEYZVYPFCF-CIUDSAMLSA-N 0.000 description 1
- OQWQTGBOFPJOIF-DLOVCJGASA-N Ala-Lys-His Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N OQWQTGBOFPJOIF-DLOVCJGASA-N 0.000 description 1
- PMQXMXAASGFUDX-SRVKXCTJSA-N Ala-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCCN PMQXMXAASGFUDX-SRVKXCTJSA-N 0.000 description 1
- NINQYGGNRIBFSC-CIUDSAMLSA-N Ala-Lys-Ser Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CO)C(O)=O NINQYGGNRIBFSC-CIUDSAMLSA-N 0.000 description 1
- VHEVVUZDDUCAKU-FXQIFTODSA-N Ala-Met-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O VHEVVUZDDUCAKU-FXQIFTODSA-N 0.000 description 1
- PVQLRJRPUTXFFX-CIUDSAMLSA-N Ala-Met-Gln Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O PVQLRJRPUTXFFX-CIUDSAMLSA-N 0.000 description 1
- VEAPAYQQLSEKEM-GUBZILKMSA-N Ala-Met-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(O)=O VEAPAYQQLSEKEM-GUBZILKMSA-N 0.000 description 1
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 1
- XRUJOVRWNMBAAA-NHCYSSNCSA-N Ala-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 XRUJOVRWNMBAAA-NHCYSSNCSA-N 0.000 description 1
- CJQAEJMHBAOQHA-DLOVCJGASA-N Ala-Phe-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CJQAEJMHBAOQHA-DLOVCJGASA-N 0.000 description 1
- DHBKYZYFEXXUAK-ONGXEEELSA-N Ala-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 DHBKYZYFEXXUAK-ONGXEEELSA-N 0.000 description 1
- WQLDNOCHHRISMS-NAKRPEOUSA-N Ala-Pro-Ile Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WQLDNOCHHRISMS-NAKRPEOUSA-N 0.000 description 1
- OLVCTPPSXNRGKV-GUBZILKMSA-N Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OLVCTPPSXNRGKV-GUBZILKMSA-N 0.000 description 1
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 1
- SYIFFFHSXBNPMC-UWJYBYFXSA-N Ala-Ser-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N SYIFFFHSXBNPMC-UWJYBYFXSA-N 0.000 description 1
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 1
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 1
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 1
- SAHQGRZIQVEJPF-JXUBOQSCSA-N Ala-Thr-Lys Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN SAHQGRZIQVEJPF-JXUBOQSCSA-N 0.000 description 1
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 1
- MTDDMSUUXNQMKK-BPNCWPANSA-N Ala-Tyr-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N MTDDMSUUXNQMKK-BPNCWPANSA-N 0.000 description 1
- KLKARCOHVHLAJP-UWJYBYFXSA-N Ala-Tyr-Cys Chemical compound C[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CS)C(O)=O KLKARCOHVHLAJP-UWJYBYFXSA-N 0.000 description 1
- YEBZNKPPOHFZJM-BPNCWPANSA-N Ala-Tyr-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O YEBZNKPPOHFZJM-BPNCWPANSA-N 0.000 description 1
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 1
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 1
- XCIGOVDXZULBBV-DCAQKATOSA-N Ala-Val-Lys Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCCCN)C(O)=O XCIGOVDXZULBBV-DCAQKATOSA-N 0.000 description 1
- XKHLBBQNPSOGPI-GUBZILKMSA-N Ala-Val-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)N XKHLBBQNPSOGPI-GUBZILKMSA-N 0.000 description 1
- DHONNEYAZPNGSG-UBHSHLNASA-N Ala-Val-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DHONNEYAZPNGSG-UBHSHLNASA-N 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- 239000005995 Aluminium silicate Substances 0.000 description 1
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 1
- GIVATXIGCXFQQA-FXQIFTODSA-N Arg-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N GIVATXIGCXFQQA-FXQIFTODSA-N 0.000 description 1
- OTOXOKCIIQLMFH-KZVJFYERSA-N Arg-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N OTOXOKCIIQLMFH-KZVJFYERSA-N 0.000 description 1
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 1
- PNQWAUXQDBIJDY-GUBZILKMSA-N Arg-Glu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNQWAUXQDBIJDY-GUBZILKMSA-N 0.000 description 1
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 1
- NXDXECQFKHXHAM-HJGDQZAQSA-N Arg-Glu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NXDXECQFKHXHAM-HJGDQZAQSA-N 0.000 description 1
- GOWZVQXTHUCNSQ-NHCYSSNCSA-N Arg-Glu-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GOWZVQXTHUCNSQ-NHCYSSNCSA-N 0.000 description 1
- IYMAXBFPHPZYIK-BQBZGAKWSA-N Arg-Gly-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IYMAXBFPHPZYIK-BQBZGAKWSA-N 0.000 description 1
- DGFXIWKPTDKBLF-AVGNSLFASA-N Arg-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N DGFXIWKPTDKBLF-AVGNSLFASA-N 0.000 description 1
- LKDHUGLXOHYINY-XUXIUFHCSA-N Arg-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LKDHUGLXOHYINY-XUXIUFHCSA-N 0.000 description 1
- CLICCYPMVFGUOF-IHRRRGAJSA-N Arg-Lys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O CLICCYPMVFGUOF-IHRRRGAJSA-N 0.000 description 1
- INXWADWANGLMPJ-JYJNAYRXSA-N Arg-Phe-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)CC1=CC=CC=C1 INXWADWANGLMPJ-JYJNAYRXSA-N 0.000 description 1
- UIUXXFIKWQVMEX-UFYCRDLUSA-N Arg-Phe-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UIUXXFIKWQVMEX-UFYCRDLUSA-N 0.000 description 1
- KXOPYFNQLVUOAQ-FXQIFTODSA-N Arg-Ser-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KXOPYFNQLVUOAQ-FXQIFTODSA-N 0.000 description 1
- ADPACBMPYWJJCE-FXQIFTODSA-N Arg-Ser-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O ADPACBMPYWJJCE-FXQIFTODSA-N 0.000 description 1
- ISJWBVIYRBAXEB-CIUDSAMLSA-N Arg-Ser-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O ISJWBVIYRBAXEB-CIUDSAMLSA-N 0.000 description 1
- URAUIUGLHBRPMF-NAKRPEOUSA-N Arg-Ser-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O URAUIUGLHBRPMF-NAKRPEOUSA-N 0.000 description 1
- KMFPQTITXUKJOV-DCAQKATOSA-N Arg-Ser-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O KMFPQTITXUKJOV-DCAQKATOSA-N 0.000 description 1
- OQPAZKMGCWPERI-GUBZILKMSA-N Arg-Ser-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OQPAZKMGCWPERI-GUBZILKMSA-N 0.000 description 1
- ASQKVGRCKOFKIU-KZVJFYERSA-N Arg-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ASQKVGRCKOFKIU-KZVJFYERSA-N 0.000 description 1
- FOWOZYAWODIRFZ-JYJNAYRXSA-N Arg-Tyr-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCCN=C(N)N)N FOWOZYAWODIRFZ-JYJNAYRXSA-N 0.000 description 1
- FTMRPIVPSDVGCC-GUBZILKMSA-N Arg-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FTMRPIVPSDVGCC-GUBZILKMSA-N 0.000 description 1
- ULBHWNVWSCJLCO-NHCYSSNCSA-N Arg-Val-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N ULBHWNVWSCJLCO-NHCYSSNCSA-N 0.000 description 1
- DAPLJWATMAXPPZ-CIUDSAMLSA-N Asn-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O DAPLJWATMAXPPZ-CIUDSAMLSA-N 0.000 description 1
- KXFCBAHYSLJCCY-ZLUOBGJFSA-N Asn-Asn-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O KXFCBAHYSLJCCY-ZLUOBGJFSA-N 0.000 description 1
- XVVOVPFMILMHPX-ZLUOBGJFSA-N Asn-Asp-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XVVOVPFMILMHPX-ZLUOBGJFSA-N 0.000 description 1
- JZRLLSOWDYUKOK-SRVKXCTJSA-N Asn-Asp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N JZRLLSOWDYUKOK-SRVKXCTJSA-N 0.000 description 1
- FUHFYEKSGWOWGZ-XHNCKOQMSA-N Asn-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N)C(=O)O FUHFYEKSGWOWGZ-XHNCKOQMSA-N 0.000 description 1
- DXVMJJNAOVECBA-WHFBIAKZSA-N Asn-Gly-Asn Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O DXVMJJNAOVECBA-WHFBIAKZSA-N 0.000 description 1
- UDSVWSUXKYXSTR-QWRGUYRKSA-N Asn-Gly-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UDSVWSUXKYXSTR-QWRGUYRKSA-N 0.000 description 1
- NKLRWRRVYGQNIH-GHCJXIJMSA-N Asn-Ile-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O NKLRWRRVYGQNIH-GHCJXIJMSA-N 0.000 description 1
- FVKHEKVYFTZWDX-GHCJXIJMSA-N Asn-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N FVKHEKVYFTZWDX-GHCJXIJMSA-N 0.000 description 1
- NVWJMQNYLYWVNQ-BYULHYEWSA-N Asn-Ile-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O NVWJMQNYLYWVNQ-BYULHYEWSA-N 0.000 description 1
- YYSYDIYQTUPNQQ-SXTJYALSSA-N Asn-Ile-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YYSYDIYQTUPNQQ-SXTJYALSSA-N 0.000 description 1
- XLZCLJRGGMBKLR-PCBIJLKTSA-N Asn-Ile-Phe Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XLZCLJRGGMBKLR-PCBIJLKTSA-N 0.000 description 1
- MYCSPQIARXTUTP-SRVKXCTJSA-N Asn-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N MYCSPQIARXTUTP-SRVKXCTJSA-N 0.000 description 1
- JLNFZLNDHONLND-GARJFASQSA-N Asn-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N JLNFZLNDHONLND-GARJFASQSA-N 0.000 description 1
- RCFGLXMZDYNRSC-CIUDSAMLSA-N Asn-Lys-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O RCFGLXMZDYNRSC-CIUDSAMLSA-N 0.000 description 1
- RZNAMKZJPBQWDJ-SRVKXCTJSA-N Asn-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N RZNAMKZJPBQWDJ-SRVKXCTJSA-N 0.000 description 1
- WXVGISRWSYGEDK-KKUMJFAQSA-N Asn-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N WXVGISRWSYGEDK-KKUMJFAQSA-N 0.000 description 1
- AYOAHKWVQLNPDM-HJGDQZAQSA-N Asn-Lys-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AYOAHKWVQLNPDM-HJGDQZAQSA-N 0.000 description 1
- NNDSLVWAQAUPPP-GUBZILKMSA-N Asn-Met-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N NNDSLVWAQAUPPP-GUBZILKMSA-N 0.000 description 1
- VITDJIPIJZAVGC-VEVYYDQMSA-N Asn-Met-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VITDJIPIJZAVGC-VEVYYDQMSA-N 0.000 description 1
- RTFWCVDISAMGEQ-SRVKXCTJSA-N Asn-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N RTFWCVDISAMGEQ-SRVKXCTJSA-N 0.000 description 1
- RVHGJNGNKGDCPX-KKUMJFAQSA-N Asn-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N RVHGJNGNKGDCPX-KKUMJFAQSA-N 0.000 description 1
- IDUUACUJKUXKKD-VEVYYDQMSA-N Asn-Pro-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O IDUUACUJKUXKKD-VEVYYDQMSA-N 0.000 description 1
- GZXOUBTUAUAVHD-ACZMJKKPSA-N Asn-Ser-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GZXOUBTUAUAVHD-ACZMJKKPSA-N 0.000 description 1
- VLDRQOHCMKCXLY-SRVKXCTJSA-N Asn-Ser-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VLDRQOHCMKCXLY-SRVKXCTJSA-N 0.000 description 1
- NCXTYSVDWLAQGZ-ZKWXMUAHSA-N Asn-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O NCXTYSVDWLAQGZ-ZKWXMUAHSA-N 0.000 description 1
- QTKYFZCMSQLYHI-UBHSHLNASA-N Asn-Trp-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O QTKYFZCMSQLYHI-UBHSHLNASA-N 0.000 description 1
- NSTBNYOKCZKOMI-AVGNSLFASA-N Asn-Tyr-Glu Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O NSTBNYOKCZKOMI-AVGNSLFASA-N 0.000 description 1
- DATSKXOXPUAOLK-KKUMJFAQSA-N Asn-Tyr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DATSKXOXPUAOLK-KKUMJFAQSA-N 0.000 description 1
- NJPLPRFQLBZAMH-IHRRRGAJSA-N Asn-Tyr-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCSC)C(O)=O NJPLPRFQLBZAMH-IHRRRGAJSA-N 0.000 description 1
- LRCIOEVFVGXZKB-BZSNNMDCSA-N Asn-Tyr-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LRCIOEVFVGXZKB-BZSNNMDCSA-N 0.000 description 1
- MJIJBEYEHBKTIM-BYULHYEWSA-N Asn-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N MJIJBEYEHBKTIM-BYULHYEWSA-N 0.000 description 1
- CBHVAFXKOYAHOY-NHCYSSNCSA-N Asn-Val-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O CBHVAFXKOYAHOY-NHCYSSNCSA-N 0.000 description 1
- BLQBMRNMBAYREH-UWJYBYFXSA-N Asp-Ala-Tyr Chemical compound N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O BLQBMRNMBAYREH-UWJYBYFXSA-N 0.000 description 1
- UQBGYPFHWFZMCD-ZLUOBGJFSA-N Asp-Asn-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O UQBGYPFHWFZMCD-ZLUOBGJFSA-N 0.000 description 1
- ATYWBXGNXZYZGI-ACZMJKKPSA-N Asp-Asn-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O ATYWBXGNXZYZGI-ACZMJKKPSA-N 0.000 description 1
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 1
- UWOPETAWXDZUJR-ACZMJKKPSA-N Asp-Cys-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O UWOPETAWXDZUJR-ACZMJKKPSA-N 0.000 description 1
- DGKCOYGQLNWNCJ-ACZMJKKPSA-N Asp-Glu-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O DGKCOYGQLNWNCJ-ACZMJKKPSA-N 0.000 description 1
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 1
- NRIFEOUAFLTMFJ-AAEUAGOBSA-N Asp-Gly-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O NRIFEOUAFLTMFJ-AAEUAGOBSA-N 0.000 description 1
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 1
- CMCIMCAQIULNDJ-CIUDSAMLSA-N Asp-His-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N CMCIMCAQIULNDJ-CIUDSAMLSA-N 0.000 description 1
- CYCKJEFVFNRWEZ-UGYAYLCHSA-N Asp-Ile-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CYCKJEFVFNRWEZ-UGYAYLCHSA-N 0.000 description 1
- QNFRBNZGVVKBNJ-PEFMBERDSA-N Asp-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N QNFRBNZGVVKBNJ-PEFMBERDSA-N 0.000 description 1
- NHSDEZURHWEZPN-SXTJYALSSA-N Asp-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC(=O)O)N NHSDEZURHWEZPN-SXTJYALSSA-N 0.000 description 1
- KYQNAIMCTRZLNP-QSFUFRPTSA-N Asp-Ile-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O KYQNAIMCTRZLNP-QSFUFRPTSA-N 0.000 description 1
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 1
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 1
- ORRJQLIATJDMQM-HJGDQZAQSA-N Asp-Leu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O ORRJQLIATJDMQM-HJGDQZAQSA-N 0.000 description 1
- LIVXPXUVXFRWNY-CIUDSAMLSA-N Asp-Lys-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O LIVXPXUVXFRWNY-CIUDSAMLSA-N 0.000 description 1
- XWSIYTYNLKCLJB-CIUDSAMLSA-N Asp-Lys-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O XWSIYTYNLKCLJB-CIUDSAMLSA-N 0.000 description 1
- NVFSJIXJZCDICF-SRVKXCTJSA-N Asp-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N NVFSJIXJZCDICF-SRVKXCTJSA-N 0.000 description 1
- IOXWDLNHXZOXQP-FXQIFTODSA-N Asp-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N IOXWDLNHXZOXQP-FXQIFTODSA-N 0.000 description 1
- WOPJVEMFXYHZEE-SRVKXCTJSA-N Asp-Phe-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WOPJVEMFXYHZEE-SRVKXCTJSA-N 0.000 description 1
- LIQNMKIBMPEOOP-IHRRRGAJSA-N Asp-Phe-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC(=O)O)N LIQNMKIBMPEOOP-IHRRRGAJSA-N 0.000 description 1
- RPUYTJJZXQBWDT-SRVKXCTJSA-N Asp-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N RPUYTJJZXQBWDT-SRVKXCTJSA-N 0.000 description 1
- FAUPLTGRUBTXNU-FXQIFTODSA-N Asp-Pro-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O FAUPLTGRUBTXNU-FXQIFTODSA-N 0.000 description 1
- ZVGRHIRJLWBWGJ-ACZMJKKPSA-N Asp-Ser-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZVGRHIRJLWBWGJ-ACZMJKKPSA-N 0.000 description 1
- BRRPVTUFESPTCP-ACZMJKKPSA-N Asp-Ser-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O BRRPVTUFESPTCP-ACZMJKKPSA-N 0.000 description 1
- JSHWXQIZOCVWIA-ZKWXMUAHSA-N Asp-Ser-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JSHWXQIZOCVWIA-ZKWXMUAHSA-N 0.000 description 1
- MJJIHRWNWSQTOI-VEVYYDQMSA-N Asp-Thr-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O MJJIHRWNWSQTOI-VEVYYDQMSA-N 0.000 description 1
- UTLCRGFJFSZWAW-OLHMAJIHSA-N Asp-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O UTLCRGFJFSZWAW-OLHMAJIHSA-N 0.000 description 1
- OYSYWMMZGJSQRB-AVGNSLFASA-N Asp-Tyr-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O OYSYWMMZGJSQRB-AVGNSLFASA-N 0.000 description 1
- OTKUAVXGMREHRX-CFMVVWHZSA-N Asp-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=C(O)C=C1 OTKUAVXGMREHRX-CFMVVWHZSA-N 0.000 description 1
- ALMIMUZAWTUNIO-BZSNNMDCSA-N Asp-Tyr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ALMIMUZAWTUNIO-BZSNNMDCSA-N 0.000 description 1
- GIKOVDMXBAFXDF-NHCYSSNCSA-N Asp-Val-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GIKOVDMXBAFXDF-NHCYSSNCSA-N 0.000 description 1
- 208000023275 Autoimmune disease Diseases 0.000 description 1
- 241000112287 Bat coronavirus Species 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 229940125579 COVID-19 vaccine candidate Drugs 0.000 description 1
- 241000282828 Camelus bactrianus Species 0.000 description 1
- 241000282465 Canis Species 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 241000700199 Cavia porcellus Species 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 206010011224 Cough Diseases 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- 241000938605 Crocodylia Species 0.000 description 1
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 1
- QFMCHXSGIZPBKG-ZLUOBGJFSA-N Cys-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N QFMCHXSGIZPBKG-ZLUOBGJFSA-N 0.000 description 1
- KKZHXOOZHFABQQ-UWJYBYFXSA-N Cys-Ala-Tyr Chemical compound SC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKZHXOOZHFABQQ-UWJYBYFXSA-N 0.000 description 1
- CLDCTNHPILWQCW-CIUDSAMLSA-N Cys-Arg-Glu Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N)CN=C(N)N CLDCTNHPILWQCW-CIUDSAMLSA-N 0.000 description 1
- YRJICXCOIBUCRP-CIUDSAMLSA-N Cys-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CS)N YRJICXCOIBUCRP-CIUDSAMLSA-N 0.000 description 1
- CPTUXCUWQIBZIF-ZLUOBGJFSA-N Cys-Asn-Ser Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CPTUXCUWQIBZIF-ZLUOBGJFSA-N 0.000 description 1
- ASHTVGGFIMESRD-LKXGYXEUSA-N Cys-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N)O ASHTVGGFIMESRD-LKXGYXEUSA-N 0.000 description 1
- FIADUEYFRSCCIK-CIUDSAMLSA-N Cys-Glu-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FIADUEYFRSCCIK-CIUDSAMLSA-N 0.000 description 1
- CFQVGYWKSLKWFX-KBIXCLLPSA-N Cys-Glu-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CFQVGYWKSLKWFX-KBIXCLLPSA-N 0.000 description 1
- BSFFNUBDVYTDMV-WHFBIAKZSA-N Cys-Gly-Asn Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BSFFNUBDVYTDMV-WHFBIAKZSA-N 0.000 description 1
- DZSICRGTVPDCRN-YUMQZZPRSA-N Cys-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CS)N DZSICRGTVPDCRN-YUMQZZPRSA-N 0.000 description 1
- DVIHGGUODLILFN-GHCJXIJMSA-N Cys-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N DVIHGGUODLILFN-GHCJXIJMSA-N 0.000 description 1
- DIHCYBRLTVEPBW-SRVKXCTJSA-N Cys-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CS)N DIHCYBRLTVEPBW-SRVKXCTJSA-N 0.000 description 1
- UIKLEGZPIOXFHJ-DLOVCJGASA-N Cys-Phe-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O UIKLEGZPIOXFHJ-DLOVCJGASA-N 0.000 description 1
- HJXSYJVCMUOUNY-SRVKXCTJSA-N Cys-Ser-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N HJXSYJVCMUOUNY-SRVKXCTJSA-N 0.000 description 1
- JLZCAZJGWNRXCI-XKBZYTNZSA-N Cys-Thr-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O JLZCAZJGWNRXCI-XKBZYTNZSA-N 0.000 description 1
- JAHCWGSVNZXHRR-SVSWQMSJSA-N Cys-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CS)N JAHCWGSVNZXHRR-SVSWQMSJSA-N 0.000 description 1
- JTEGHEWKBCTIAL-IXOXFDKPSA-N Cys-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CS)N)O JTEGHEWKBCTIAL-IXOXFDKPSA-N 0.000 description 1
- NAPULYCVEVVFRB-HEIBUPTGSA-N Cys-Thr-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)CS NAPULYCVEVVFRB-HEIBUPTGSA-N 0.000 description 1
- UGPCUUWZXRMCIJ-KKUMJFAQSA-N Cys-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CS)N UGPCUUWZXRMCIJ-KKUMJFAQSA-N 0.000 description 1
- JRZMCSIUYGSJKP-ZKWXMUAHSA-N Cys-Val-Asn Chemical compound SC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O JRZMCSIUYGSJKP-ZKWXMUAHSA-N 0.000 description 1
- KZZYVYWSXMFYEC-DCAQKATOSA-N Cys-Val-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KZZYVYWSXMFYEC-DCAQKATOSA-N 0.000 description 1
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 206010061818 Disease progression Diseases 0.000 description 1
- 102100030013 Endoribonuclease Human genes 0.000 description 1
- 108010093099 Endoribonucleases Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 241000283073 Equus caballus Species 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 101800001768 Exoribonuclease Proteins 0.000 description 1
- 241000282324 Felis Species 0.000 description 1
- 102000004961 Furin Human genes 0.000 description 1
- 108090001126 Furin Proteins 0.000 description 1
- INFBPLSHYFALDE-ACZMJKKPSA-N Gln-Asn-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O INFBPLSHYFALDE-ACZMJKKPSA-N 0.000 description 1
- PKVWNYGXMNWJSI-CIUDSAMLSA-N Gln-Gln-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O PKVWNYGXMNWJSI-CIUDSAMLSA-N 0.000 description 1
- XFKUFUJECJUQTQ-CIUDSAMLSA-N Gln-Gln-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XFKUFUJECJUQTQ-CIUDSAMLSA-N 0.000 description 1
- AJDMYLOISOCHHC-YVNDNENWSA-N Gln-Gln-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AJDMYLOISOCHHC-YVNDNENWSA-N 0.000 description 1
- KCJJFESQRXGTGC-BQBZGAKWSA-N Gln-Glu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O KCJJFESQRXGTGC-BQBZGAKWSA-N 0.000 description 1
- FGYPOQPQTUNESW-IUCAKERBSA-N Gln-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N FGYPOQPQTUNESW-IUCAKERBSA-N 0.000 description 1
- GLEGHWQNGPMKHO-DCAQKATOSA-N Gln-His-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N GLEGHWQNGPMKHO-DCAQKATOSA-N 0.000 description 1
- ZNTDJIMJKNNSLR-RWRJDSDZSA-N Gln-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZNTDJIMJKNNSLR-RWRJDSDZSA-N 0.000 description 1
- FFVXLVGUJBCKRX-UKJIMTQDSA-N Gln-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCC(=O)N)N FFVXLVGUJBCKRX-UKJIMTQDSA-N 0.000 description 1
- HWEINOMSWQSJDC-SRVKXCTJSA-N Gln-Leu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HWEINOMSWQSJDC-SRVKXCTJSA-N 0.000 description 1
- QBLMTCRYYTVUQY-GUBZILKMSA-N Gln-Leu-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QBLMTCRYYTVUQY-GUBZILKMSA-N 0.000 description 1
- PSERKXGRRADTKA-MNXVOIDGSA-N Gln-Leu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PSERKXGRRADTKA-MNXVOIDGSA-N 0.000 description 1
- MLSKFHLRFVGNLL-WDCWCFNPSA-N Gln-Leu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MLSKFHLRFVGNLL-WDCWCFNPSA-N 0.000 description 1
- TWIAMTNJOMRDAK-GUBZILKMSA-N Gln-Lys-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O TWIAMTNJOMRDAK-GUBZILKMSA-N 0.000 description 1
- HPCOBEHVEHWREJ-DCAQKATOSA-N Gln-Lys-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HPCOBEHVEHWREJ-DCAQKATOSA-N 0.000 description 1
- LURQDGKYBFWWJA-MNXVOIDGSA-N Gln-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N LURQDGKYBFWWJA-MNXVOIDGSA-N 0.000 description 1
- XGKNQFOKIBKFTR-CIUDSAMLSA-N Gln-Met-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CCC(N)=O XGKNQFOKIBKFTR-CIUDSAMLSA-N 0.000 description 1
- XUMFMAVDHQDATI-DCAQKATOSA-N Gln-Pro-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XUMFMAVDHQDATI-DCAQKATOSA-N 0.000 description 1
- PBYFVIQRFLNQCO-GUBZILKMSA-N Gln-Pro-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O PBYFVIQRFLNQCO-GUBZILKMSA-N 0.000 description 1
- OREPWMPAUWIIAM-ZPFDUUQYSA-N Gln-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N OREPWMPAUWIIAM-ZPFDUUQYSA-N 0.000 description 1
- YPFFHGRJCUBXPX-NHCYSSNCSA-N Gln-Pro-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O)C(O)=O YPFFHGRJCUBXPX-NHCYSSNCSA-N 0.000 description 1
- UTOQQOMEJDPDMX-ACZMJKKPSA-N Gln-Ser-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O UTOQQOMEJDPDMX-ACZMJKKPSA-N 0.000 description 1
- UEILCTONAMOGBR-RWRJDSDZSA-N Gln-Thr-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UEILCTONAMOGBR-RWRJDSDZSA-N 0.000 description 1
- RONJIBWTGKVKFY-HTUGSXCWSA-N Gln-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O RONJIBWTGKVKFY-HTUGSXCWSA-N 0.000 description 1
- HLRLXVPRJJITSK-IFFSRLJSSA-N Gln-Thr-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HLRLXVPRJJITSK-IFFSRLJSSA-N 0.000 description 1
- SAHTWBLTLJWAQA-XIRDDKMYSA-N Gln-Trp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCC(=O)N)N SAHTWBLTLJWAQA-XIRDDKMYSA-N 0.000 description 1
- SOEXCCGNHQBFPV-DLOVCJGASA-N Gln-Val-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SOEXCCGNHQBFPV-DLOVCJGASA-N 0.000 description 1
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 1
- UTKUTMJSWKKHEM-WDSKDSINSA-N Glu-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O UTKUTMJSWKKHEM-WDSKDSINSA-N 0.000 description 1
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 1
- IRDASPPCLZIERZ-XHNCKOQMSA-N Glu-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N IRDASPPCLZIERZ-XHNCKOQMSA-N 0.000 description 1
- MXOODARRORARSU-ACZMJKKPSA-N Glu-Ala-Ser Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N MXOODARRORARSU-ACZMJKKPSA-N 0.000 description 1
- NCWOMXABNYEPLY-NRPADANISA-N Glu-Ala-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O NCWOMXABNYEPLY-NRPADANISA-N 0.000 description 1
- XXCDTYBVGMPIOA-FXQIFTODSA-N Glu-Asp-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XXCDTYBVGMPIOA-FXQIFTODSA-N 0.000 description 1
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 1
- PBFGQTGPSKWHJA-QEJZJMRPSA-N Glu-Asp-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O PBFGQTGPSKWHJA-QEJZJMRPSA-N 0.000 description 1
- KLJMRPIBBLTDGE-ACZMJKKPSA-N Glu-Cys-Asn Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O KLJMRPIBBLTDGE-ACZMJKKPSA-N 0.000 description 1
- XKPOCESCRTVRPL-KBIXCLLPSA-N Glu-Cys-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XKPOCESCRTVRPL-KBIXCLLPSA-N 0.000 description 1
- RQNYYRHRKSVKAB-GUBZILKMSA-N Glu-Cys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O RQNYYRHRKSVKAB-GUBZILKMSA-N 0.000 description 1
- OWVURWCRZZMAOZ-XHNCKOQMSA-N Glu-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N)C(=O)O OWVURWCRZZMAOZ-XHNCKOQMSA-N 0.000 description 1
- GFLQTABMFBXRIY-GUBZILKMSA-N Glu-Gln-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GFLQTABMFBXRIY-GUBZILKMSA-N 0.000 description 1
- LVCHEMOPBORRLB-DCAQKATOSA-N Glu-Gln-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O LVCHEMOPBORRLB-DCAQKATOSA-N 0.000 description 1
- RFDHKPSHTXZKLL-IHRRRGAJSA-N Glu-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N RFDHKPSHTXZKLL-IHRRRGAJSA-N 0.000 description 1
- WLIPTFCZLHCNFD-LPEHRKFASA-N Glu-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O WLIPTFCZLHCNFD-LPEHRKFASA-N 0.000 description 1
- HNVFSTLPVJWIDV-CIUDSAMLSA-N Glu-Glu-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HNVFSTLPVJWIDV-CIUDSAMLSA-N 0.000 description 1
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 1
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 1
- APHGWLWMOXGZRL-DCAQKATOSA-N Glu-Glu-His Chemical compound N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O APHGWLWMOXGZRL-DCAQKATOSA-N 0.000 description 1
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 1
- LYCDZGLXQBPNQU-WDSKDSINSA-N Glu-Gly-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CS)C(O)=O LYCDZGLXQBPNQU-WDSKDSINSA-N 0.000 description 1
- OGNJZUXUTPQVBR-BQBZGAKWSA-N Glu-Gly-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OGNJZUXUTPQVBR-BQBZGAKWSA-N 0.000 description 1
- CUXJIASLBRJOFV-LAEOZQHASA-N Glu-Gly-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUXJIASLBRJOFV-LAEOZQHASA-N 0.000 description 1
- RAUDKMVXNOWDLS-WDSKDSINSA-N Glu-Gly-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O RAUDKMVXNOWDLS-WDSKDSINSA-N 0.000 description 1
- WVTIBGWZUMJBFY-GUBZILKMSA-N Glu-His-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O WVTIBGWZUMJBFY-GUBZILKMSA-N 0.000 description 1
- ZWABFSSWTSAMQN-KBIXCLLPSA-N Glu-Ile-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O ZWABFSSWTSAMQN-KBIXCLLPSA-N 0.000 description 1
- ZCOJVESMNGBGLF-GRLWGSQLSA-N Glu-Ile-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZCOJVESMNGBGLF-GRLWGSQLSA-N 0.000 description 1
- QXDXIXFSFHUYAX-MNXVOIDGSA-N Glu-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O QXDXIXFSFHUYAX-MNXVOIDGSA-N 0.000 description 1
- GXMXPCXXKVWOSM-KQXIARHKSA-N Glu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N GXMXPCXXKVWOSM-KQXIARHKSA-N 0.000 description 1
- INGJLBQKTRJLFO-UKJIMTQDSA-N Glu-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O INGJLBQKTRJLFO-UKJIMTQDSA-N 0.000 description 1
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 1
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 1
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 1
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 1
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 1
- OHWJUIXZHVIXJJ-GUBZILKMSA-N Glu-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N OHWJUIXZHVIXJJ-GUBZILKMSA-N 0.000 description 1
- HRBYTAIBKPNZKQ-AVGNSLFASA-N Glu-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O HRBYTAIBKPNZKQ-AVGNSLFASA-N 0.000 description 1
- QDMVXRNLOPTPIE-WDCWCFNPSA-N Glu-Lys-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QDMVXRNLOPTPIE-WDCWCFNPSA-N 0.000 description 1
- AQNYKMCFCCZEEL-JYJNAYRXSA-N Glu-Lys-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AQNYKMCFCCZEEL-JYJNAYRXSA-N 0.000 description 1
- CBEUFCJRFNZMCU-SRVKXCTJSA-N Glu-Met-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O CBEUFCJRFNZMCU-SRVKXCTJSA-N 0.000 description 1
- ZTVGZOIBLRPQNR-KKUMJFAQSA-N Glu-Met-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZTVGZOIBLRPQNR-KKUMJFAQSA-N 0.000 description 1
- YRMZCZIRHYCNHX-RYUDHWBXSA-N Glu-Phe-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O YRMZCZIRHYCNHX-RYUDHWBXSA-N 0.000 description 1
- ZIYGTCDTJJCDDP-JYJNAYRXSA-N Glu-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZIYGTCDTJJCDDP-JYJNAYRXSA-N 0.000 description 1
- QOXDAWODGSIDDI-GUBZILKMSA-N Glu-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N QOXDAWODGSIDDI-GUBZILKMSA-N 0.000 description 1
- VNCNWQPIQYAMAK-ACZMJKKPSA-N Glu-Ser-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O VNCNWQPIQYAMAK-ACZMJKKPSA-N 0.000 description 1
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 1
- RGJKYNUINKGPJN-RWRJDSDZSA-N Glu-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(=O)O)N RGJKYNUINKGPJN-RWRJDSDZSA-N 0.000 description 1
- DTLLNDVORUEOTM-WDCWCFNPSA-N Glu-Thr-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DTLLNDVORUEOTM-WDCWCFNPSA-N 0.000 description 1
- MXJYXYDREQWUMS-XKBZYTNZSA-N Glu-Thr-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O MXJYXYDREQWUMS-XKBZYTNZSA-N 0.000 description 1
- HAGKYCXGTRUUFI-RYUDHWBXSA-N Glu-Tyr-Gly Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)O)N)O HAGKYCXGTRUUFI-RYUDHWBXSA-N 0.000 description 1
- VXEFAWJTFAUDJK-AVGNSLFASA-N Glu-Tyr-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O VXEFAWJTFAUDJK-AVGNSLFASA-N 0.000 description 1
- LSYFGBRDBIQYAQ-FHWLQOOXSA-N Glu-Tyr-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LSYFGBRDBIQYAQ-FHWLQOOXSA-N 0.000 description 1
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 1
- LZEUDRYSAZAJIO-AUTRQRHGSA-N Glu-Val-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZEUDRYSAZAJIO-AUTRQRHGSA-N 0.000 description 1
- FGGKGJHCVMYGCD-UKJIMTQDSA-N Glu-Val-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGGKGJHCVMYGCD-UKJIMTQDSA-N 0.000 description 1
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 1
- RLFSBAPJTYKSLG-WHFBIAKZSA-N Gly-Ala-Asp Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O RLFSBAPJTYKSLG-WHFBIAKZSA-N 0.000 description 1
- GQGAFTPXAPKSCF-WHFBIAKZSA-N Gly-Ala-Cys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(=O)O GQGAFTPXAPKSCF-WHFBIAKZSA-N 0.000 description 1
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 1
- LERGJIVJIIODPZ-ZANVPECISA-N Gly-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)CN)C)C(O)=O)=CNC2=C1 LERGJIVJIIODPZ-ZANVPECISA-N 0.000 description 1
- QIZJOTQTCAGKPU-KWQFWETISA-N Gly-Ala-Tyr Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 QIZJOTQTCAGKPU-KWQFWETISA-N 0.000 description 1
- OCQUNKSFDYDXBG-QXEWZRGKSA-N Gly-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OCQUNKSFDYDXBG-QXEWZRGKSA-N 0.000 description 1
- DTPOVRRYXPJJAZ-FJXKBIBVSA-N Gly-Arg-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N DTPOVRRYXPJJAZ-FJXKBIBVSA-N 0.000 description 1
- XZRZILPOZBVTDB-GJZGRUSLSA-N Gly-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)CN)C(O)=O)=CNC2=C1 XZRZILPOZBVTDB-GJZGRUSLSA-N 0.000 description 1
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 1
- FUTAPPOITCCWTH-WHFBIAKZSA-N Gly-Asp-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FUTAPPOITCCWTH-WHFBIAKZSA-N 0.000 description 1
- RPLLQZBOVIVGMX-QWRGUYRKSA-N Gly-Asp-Phe Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RPLLQZBOVIVGMX-QWRGUYRKSA-N 0.000 description 1
- TZOVVRJYUDETQG-RCOVLWMOSA-N Gly-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN TZOVVRJYUDETQG-RCOVLWMOSA-N 0.000 description 1
- AQLHORCVPGXDJW-IUCAKERBSA-N Gly-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN AQLHORCVPGXDJW-IUCAKERBSA-N 0.000 description 1
- MBOAPAXLTUSMQI-JHEQGTHGSA-N Gly-Glu-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MBOAPAXLTUSMQI-JHEQGTHGSA-N 0.000 description 1
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 1
- IDOGEHIWMJMAHT-BYPYZUCNSA-N Gly-Gly-Cys Chemical compound NCC(=O)NCC(=O)N[C@@H](CS)C(O)=O IDOGEHIWMJMAHT-BYPYZUCNSA-N 0.000 description 1
- PDAWDNVHMUKWJR-ZETCQYMHSA-N Gly-Gly-His Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 PDAWDNVHMUKWJR-ZETCQYMHSA-N 0.000 description 1
- XMPXVJIDADUOQB-RCOVLWMOSA-N Gly-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 1
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 1
- YNIMVVJTPWCUJH-KBPBESRZSA-N Gly-His-Tyr Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YNIMVVJTPWCUJH-KBPBESRZSA-N 0.000 description 1
- HKSNHPVETYYJBK-LAEOZQHASA-N Gly-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)CN HKSNHPVETYYJBK-LAEOZQHASA-N 0.000 description 1
- IUZGUFAJDBHQQV-YUMQZZPRSA-N Gly-Leu-Asn Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IUZGUFAJDBHQQV-YUMQZZPRSA-N 0.000 description 1
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 1
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 1
- MIIVFRCYJABHTQ-ONGXEEELSA-N Gly-Leu-Val Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O MIIVFRCYJABHTQ-ONGXEEELSA-N 0.000 description 1
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 1
- WDEHMRNSGHVNOH-VHSXEESVSA-N Gly-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)CN)C(=O)O WDEHMRNSGHVNOH-VHSXEESVSA-N 0.000 description 1
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 1
- OQQKUTVULYLCDG-ONGXEEELSA-N Gly-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)CN)C(O)=O OQQKUTVULYLCDG-ONGXEEELSA-N 0.000 description 1
- FXLVSYVJDPCIHH-STQMWFEESA-N Gly-Phe-Arg Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FXLVSYVJDPCIHH-STQMWFEESA-N 0.000 description 1
- MTBIKIMYHUWBRX-QWRGUYRKSA-N Gly-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN MTBIKIMYHUWBRX-QWRGUYRKSA-N 0.000 description 1
- QVDGHDFFYHKJPN-QWRGUYRKSA-N Gly-Phe-Cys Chemical compound NCC(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CS)C(O)=O QVDGHDFFYHKJPN-QWRGUYRKSA-N 0.000 description 1
- IGOYNRWLWHWAQO-JTQLQIEISA-N Gly-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IGOYNRWLWHWAQO-JTQLQIEISA-N 0.000 description 1
- MXIULRKNFSCJHT-STQMWFEESA-N Gly-Phe-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 MXIULRKNFSCJHT-STQMWFEESA-N 0.000 description 1
- HFPVRZWORNJRRC-UWVGGRQHSA-N Gly-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN HFPVRZWORNJRRC-UWVGGRQHSA-N 0.000 description 1
- OHUKZZYSJBKFRR-WHFBIAKZSA-N Gly-Ser-Asp Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O OHUKZZYSJBKFRR-WHFBIAKZSA-N 0.000 description 1
- LBDXVCBAJJNJNN-WHFBIAKZSA-N Gly-Ser-Cys Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(O)=O LBDXVCBAJJNJNN-WHFBIAKZSA-N 0.000 description 1
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 1
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 1
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 1
- ZKJZBRHRWKLVSJ-ZDLURKLDSA-N Gly-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN)O ZKJZBRHRWKLVSJ-ZDLURKLDSA-N 0.000 description 1
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 1
- HUFUVTYGPOUCBN-MBLNEYKQSA-N Gly-Thr-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HUFUVTYGPOUCBN-MBLNEYKQSA-N 0.000 description 1
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 1
- RIYIFUFFFBIOEU-KBPBESRZSA-N Gly-Tyr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 RIYIFUFFFBIOEU-KBPBESRZSA-N 0.000 description 1
- GJHWILMUOANXTG-WPRPVWTQSA-N Gly-Val-Arg Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GJHWILMUOANXTG-WPRPVWTQSA-N 0.000 description 1
- SYOJVRNQCXYEOV-XVKPBYJWSA-N Gly-Val-Glu Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SYOJVRNQCXYEOV-XVKPBYJWSA-N 0.000 description 1
- SBVMXEZQJVUARN-XPUUQOCRSA-N Gly-Val-Ser Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O SBVMXEZQJVUARN-XPUUQOCRSA-N 0.000 description 1
- 101800001704 Guanine-N7 methyltransferase Proteins 0.000 description 1
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 1
- 108010093013 HLA-DR1 Antigen Proteins 0.000 description 1
- MJNWEIMBXKKCSF-XVYDVKMFSA-N His-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N MJNWEIMBXKKCSF-XVYDVKMFSA-N 0.000 description 1
- KYMUEAZVLPRVAE-GUBZILKMSA-N His-Asn-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KYMUEAZVLPRVAE-GUBZILKMSA-N 0.000 description 1
- JWTKVPMQCCRPQY-SRVKXCTJSA-N His-Asn-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JWTKVPMQCCRPQY-SRVKXCTJSA-N 0.000 description 1
- LYSVCKOXIDKEEL-SRVKXCTJSA-N His-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CN=CN1 LYSVCKOXIDKEEL-SRVKXCTJSA-N 0.000 description 1
- HRGGKHFHRSFSDE-CIUDSAMLSA-N His-Asn-Ser Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N HRGGKHFHRSFSDE-CIUDSAMLSA-N 0.000 description 1
- AKEDPWJFQULLPE-IUCAKERBSA-N His-Glu-Gly Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O AKEDPWJFQULLPE-IUCAKERBSA-N 0.000 description 1
- XMENRVZYPBKBIL-AVGNSLFASA-N His-Glu-His Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O XMENRVZYPBKBIL-AVGNSLFASA-N 0.000 description 1
- VTMLJMNQHKBPON-QWRGUYRKSA-N His-Gly-His Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 VTMLJMNQHKBPON-QWRGUYRKSA-N 0.000 description 1
- RGPWUJOMKFYFSR-QWRGUYRKSA-N His-Gly-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O RGPWUJOMKFYFSR-QWRGUYRKSA-N 0.000 description 1
- VJJSDSNFXCWCEJ-DJFWLOJKSA-N His-Ile-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O VJJSDSNFXCWCEJ-DJFWLOJKSA-N 0.000 description 1
- VYUXYMRNGALHEA-DLOVCJGASA-N His-Leu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O VYUXYMRNGALHEA-DLOVCJGASA-N 0.000 description 1
- RNMNYMDTESKEAJ-KKUMJFAQSA-N His-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 RNMNYMDTESKEAJ-KKUMJFAQSA-N 0.000 description 1
- MTHDIEPOBSRDIV-ULQDDVLXSA-N His-Met-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 MTHDIEPOBSRDIV-ULQDDVLXSA-N 0.000 description 1
- PZAJPILZRFPYJJ-SRVKXCTJSA-N His-Ser-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O PZAJPILZRFPYJJ-SRVKXCTJSA-N 0.000 description 1
- JUCZDDVZBMPKRT-IXOXFDKPSA-N His-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O JUCZDDVZBMPKRT-IXOXFDKPSA-N 0.000 description 1
- NBWATNYAUVSAEQ-ZEILLAHLSA-N His-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O NBWATNYAUVSAEQ-ZEILLAHLSA-N 0.000 description 1
- WSXNWASHQNSMRX-GVXVVHGQSA-N His-Val-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N WSXNWASHQNSMRX-GVXVVHGQSA-N 0.000 description 1
- CGAMSLMBYJHMDY-ONGXEEELSA-N His-Val-Gly Chemical compound CC(C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N CGAMSLMBYJHMDY-ONGXEEELSA-N 0.000 description 1
- DRKZDEFADVYTLU-AVGNSLFASA-N His-Val-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DRKZDEFADVYTLU-AVGNSLFASA-N 0.000 description 1
- 101001043807 Homo sapiens Interleukin-7 Proteins 0.000 description 1
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 1
- DPTBVFUDCPINIP-JURCDPSOSA-N Ile-Ala-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DPTBVFUDCPINIP-JURCDPSOSA-N 0.000 description 1
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 1
- DXUJSRIVSWEOAG-NAKRPEOUSA-N Ile-Arg-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N DXUJSRIVSWEOAG-NAKRPEOUSA-N 0.000 description 1
- YOTNPRLPIPHQSB-XUXIUFHCSA-N Ile-Arg-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOTNPRLPIPHQSB-XUXIUFHCSA-N 0.000 description 1
- UAVQIQOOBXFKRC-BYULHYEWSA-N Ile-Asn-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O UAVQIQOOBXFKRC-BYULHYEWSA-N 0.000 description 1
- YPQDTQJBOFOTJQ-SXTJYALSSA-N Ile-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N YPQDTQJBOFOTJQ-SXTJYALSSA-N 0.000 description 1
- XENGULNPUDGALZ-ZPFDUUQYSA-N Ile-Asn-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N XENGULNPUDGALZ-ZPFDUUQYSA-N 0.000 description 1
- UKTUOMWSJPXODT-GUDRVLHUSA-N Ile-Asn-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N UKTUOMWSJPXODT-GUDRVLHUSA-N 0.000 description 1
- QIHJTGSVGIPHIW-QSFUFRPTSA-N Ile-Asn-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N QIHJTGSVGIPHIW-QSFUFRPTSA-N 0.000 description 1
- XLDYDEDTGMHUCZ-GHCJXIJMSA-N Ile-Asp-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N XLDYDEDTGMHUCZ-GHCJXIJMSA-N 0.000 description 1
- BGZIJZJBXRVBGJ-SXTJYALSSA-N Ile-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N BGZIJZJBXRVBGJ-SXTJYALSSA-N 0.000 description 1
- QSPLUJGYOPZINY-ZPFDUUQYSA-N Ile-Asp-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QSPLUJGYOPZINY-ZPFDUUQYSA-N 0.000 description 1
- NPROWIBAWYMPAZ-GUDRVLHUSA-N Ile-Asp-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N NPROWIBAWYMPAZ-GUDRVLHUSA-N 0.000 description 1
- WTOAPTKSZJJWKK-HTFCKZLJSA-N Ile-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N WTOAPTKSZJJWKK-HTFCKZLJSA-N 0.000 description 1
- VQUCKIAECLVLAD-SVSWQMSJSA-N Ile-Cys-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N VQUCKIAECLVLAD-SVSWQMSJSA-N 0.000 description 1
- BSWLQVGEVFYGIM-ZPFDUUQYSA-N Ile-Gln-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N BSWLQVGEVFYGIM-ZPFDUUQYSA-N 0.000 description 1
- JRYQSFOFUFXPTB-RWRJDSDZSA-N Ile-Gln-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N JRYQSFOFUFXPTB-RWRJDSDZSA-N 0.000 description 1
- JXMSHKFPDIUYGS-SIUGBPQLSA-N Ile-Glu-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N JXMSHKFPDIUYGS-SIUGBPQLSA-N 0.000 description 1
- WUKLZPHVWAMZQV-UKJIMTQDSA-N Ile-Glu-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N WUKLZPHVWAMZQV-UKJIMTQDSA-N 0.000 description 1
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 1
- KEKTTYCXKGBAAL-VGDYDELISA-N Ile-His-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CO)C(=O)O)N KEKTTYCXKGBAAL-VGDYDELISA-N 0.000 description 1
- RIVKTKFVWXRNSJ-GRLWGSQLSA-N Ile-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N RIVKTKFVWXRNSJ-GRLWGSQLSA-N 0.000 description 1
- FZWVCYCYWCLQDH-NHCYSSNCSA-N Ile-Leu-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N FZWVCYCYWCLQDH-NHCYSSNCSA-N 0.000 description 1
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 1
- NZGTYCMLUGYMCV-XUXIUFHCSA-N Ile-Lys-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N NZGTYCMLUGYMCV-XUXIUFHCSA-N 0.000 description 1
- FFAUOCITXBMRBT-YTFOTSKYSA-N Ile-Lys-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FFAUOCITXBMRBT-YTFOTSKYSA-N 0.000 description 1
- YSGBJIQXTIVBHZ-AJNGGQMLSA-N Ile-Lys-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O YSGBJIQXTIVBHZ-AJNGGQMLSA-N 0.000 description 1
- GLYJPWIRLBAIJH-FQUUOJAGSA-N Ile-Lys-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N GLYJPWIRLBAIJH-FQUUOJAGSA-N 0.000 description 1
- UAELWXJFLZBKQS-WHOFXGATSA-N Ile-Phe-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O UAELWXJFLZBKQS-WHOFXGATSA-N 0.000 description 1
- XLXPYSDGMXTTNQ-DKIMLUQUSA-N Ile-Phe-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CC(C)C)C(O)=O XLXPYSDGMXTTNQ-DKIMLUQUSA-N 0.000 description 1
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 1
- CIDLJWVDMNDKPT-FIRPJDEBSA-N Ile-Phe-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N CIDLJWVDMNDKPT-FIRPJDEBSA-N 0.000 description 1
- YKZAMJXNJUWFIK-JBDRJPRFSA-N Ile-Ser-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)O)N YKZAMJXNJUWFIK-JBDRJPRFSA-N 0.000 description 1
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 1
- JZNVOBUNTWNZPW-GHCJXIJMSA-N Ile-Ser-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N JZNVOBUNTWNZPW-GHCJXIJMSA-N 0.000 description 1
- XMYURPUVJSKTMC-KBIXCLLPSA-N Ile-Ser-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N XMYURPUVJSKTMC-KBIXCLLPSA-N 0.000 description 1
- PELCGFMHLZXWBQ-BJDJZHNGSA-N Ile-Ser-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)O)N PELCGFMHLZXWBQ-BJDJZHNGSA-N 0.000 description 1
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 1
- YCKPUHHMCFSUMD-IUKAMOBKSA-N Ile-Thr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCKPUHHMCFSUMD-IUKAMOBKSA-N 0.000 description 1
- ZFWISYLMLXFBSX-KKPKCPPISA-N Ile-Trp-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CC=CC=C3)C(=O)O)N ZFWISYLMLXFBSX-KKPKCPPISA-N 0.000 description 1
- GVEODXUBBFDBPW-MGHWNKPDSA-N Ile-Tyr-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 GVEODXUBBFDBPW-MGHWNKPDSA-N 0.000 description 1
- ZGKVPOSSTGHJAF-HJPIBITLSA-N Ile-Tyr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CO)C(=O)O)N ZGKVPOSSTGHJAF-HJPIBITLSA-N 0.000 description 1
- YJRSIJZUIUANHO-NAKRPEOUSA-N Ile-Val-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(=O)O)N YJRSIJZUIUANHO-NAKRPEOUSA-N 0.000 description 1
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 1
- YWCJXQKATPNPOE-UKJIMTQDSA-N Ile-Val-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YWCJXQKATPNPOE-UKJIMTQDSA-N 0.000 description 1
- WIYDLTIBHZSPKY-HJWJTTGWSA-N Ile-Val-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WIYDLTIBHZSPKY-HJWJTTGWSA-N 0.000 description 1
- APQYGMBHIVXFML-OSUNSFLBSA-N Ile-Val-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N APQYGMBHIVXFML-OSUNSFLBSA-N 0.000 description 1
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 1
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 1
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- 101800000517 Leader protein Proteins 0.000 description 1
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 1
- KVRKAGGMEWNURO-CIUDSAMLSA-N Leu-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(C)C)N KVRKAGGMEWNURO-CIUDSAMLSA-N 0.000 description 1
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 1
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 1
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 1
- SUPVSFFZWVOEOI-CQDKDKBSSA-N Leu-Ala-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-CQDKDKBSSA-N 0.000 description 1
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 1
- IBMVEYRWAWIOTN-RWMBFGLXSA-N Leu-Arg-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(O)=O IBMVEYRWAWIOTN-RWMBFGLXSA-N 0.000 description 1
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 1
- IGUOAYLTQJLPPD-DCAQKATOSA-N Leu-Asn-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IGUOAYLTQJLPPD-DCAQKATOSA-N 0.000 description 1
- KKXDHFKZWKLYGB-GUBZILKMSA-N Leu-Asn-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKXDHFKZWKLYGB-GUBZILKMSA-N 0.000 description 1
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 1
- POJPZSMTTMLSTG-SRVKXCTJSA-N Leu-Asn-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N POJPZSMTTMLSTG-SRVKXCTJSA-N 0.000 description 1
- WGNOPSQMIQERPK-GARJFASQSA-N Leu-Asn-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N WGNOPSQMIQERPK-GARJFASQSA-N 0.000 description 1
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 1
- TWQIYNGNYNJUFM-NHCYSSNCSA-N Leu-Asn-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TWQIYNGNYNJUFM-NHCYSSNCSA-N 0.000 description 1
- DLFAACQHIRSQGG-CIUDSAMLSA-N Leu-Asp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DLFAACQHIRSQGG-CIUDSAMLSA-N 0.000 description 1
- PJYSOYLLTJKZHC-GUBZILKMSA-N Leu-Asp-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O PJYSOYLLTJKZHC-GUBZILKMSA-N 0.000 description 1
- KTFHTMHHKXUYPW-ZPFDUUQYSA-N Leu-Asp-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KTFHTMHHKXUYPW-ZPFDUUQYSA-N 0.000 description 1
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 1
- GBDMISNMNXVTNV-XIRDDKMYSA-N Leu-Asp-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O GBDMISNMNXVTNV-XIRDDKMYSA-N 0.000 description 1
- PPBKJAQJAUHZKX-SRVKXCTJSA-N Leu-Cys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC(C)C PPBKJAQJAUHZKX-SRVKXCTJSA-N 0.000 description 1
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 1
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 1
- CQGSYZCULZMEDE-SRVKXCTJSA-N Leu-Gln-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CQGSYZCULZMEDE-SRVKXCTJSA-N 0.000 description 1
- KVMULWOHPPMHHE-DCAQKATOSA-N Leu-Glu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KVMULWOHPPMHHE-DCAQKATOSA-N 0.000 description 1
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 1
- HPBCTWSUJOGJSH-MNXVOIDGSA-N Leu-Glu-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HPBCTWSUJOGJSH-MNXVOIDGSA-N 0.000 description 1
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 1
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 1
- QPXBPQUGXHURGP-UWVGGRQHSA-N Leu-Gly-Met Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CCSC)C(=O)O)N QPXBPQUGXHURGP-UWVGGRQHSA-N 0.000 description 1
- UCDHVOALNXENLC-KBPBESRZSA-N Leu-Gly-Tyr Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UCDHVOALNXENLC-KBPBESRZSA-N 0.000 description 1
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 1
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 1
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 1
- AUBMZAMQCOYSIC-MNXVOIDGSA-N Leu-Ile-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O AUBMZAMQCOYSIC-MNXVOIDGSA-N 0.000 description 1
- KUIDCYNIEJBZBU-AJNGGQMLSA-N Leu-Ile-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O KUIDCYNIEJBZBU-AJNGGQMLSA-N 0.000 description 1
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 1
- TVEOVCYCYGKVPP-HSCHXYMDSA-N Leu-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(C)C)N TVEOVCYCYGKVPP-HSCHXYMDSA-N 0.000 description 1
- KYIIALJHAOIAHF-KKUMJFAQSA-N Leu-Leu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 KYIIALJHAOIAHF-KKUMJFAQSA-N 0.000 description 1
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 1
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 1
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 1
- FKQPWMZLIIATBA-AJNGGQMLSA-N Leu-Lys-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FKQPWMZLIIATBA-AJNGGQMLSA-N 0.000 description 1
- BGZCJDGBBUUBHA-KKUMJFAQSA-N Leu-Lys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O BGZCJDGBBUUBHA-KKUMJFAQSA-N 0.000 description 1
- RTIRBWJPYJYTLO-MELADBBJSA-N Leu-Lys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N RTIRBWJPYJYTLO-MELADBBJSA-N 0.000 description 1
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 1
- LZHJZLHSRGWBBE-IHRRRGAJSA-N Leu-Lys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LZHJZLHSRGWBBE-IHRRRGAJSA-N 0.000 description 1
- PKKMDPNFGULLNQ-AVGNSLFASA-N Leu-Met-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O PKKMDPNFGULLNQ-AVGNSLFASA-N 0.000 description 1
- NHRINZSPIUXYQZ-DCAQKATOSA-N Leu-Met-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CS)C(=O)O)N NHRINZSPIUXYQZ-DCAQKATOSA-N 0.000 description 1
- DDVHDMSBLRAKNV-IHRRRGAJSA-N Leu-Met-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O DDVHDMSBLRAKNV-IHRRRGAJSA-N 0.000 description 1
- GNRPTBRHRRZCMA-RWMBFGLXSA-N Leu-Met-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N GNRPTBRHRRZCMA-RWMBFGLXSA-N 0.000 description 1
- HDHQQEDVWQGBEE-DCAQKATOSA-N Leu-Met-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O HDHQQEDVWQGBEE-DCAQKATOSA-N 0.000 description 1
- KQFZKDITNUEVFJ-JYJNAYRXSA-N Leu-Phe-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CC=CC=C1 KQFZKDITNUEVFJ-JYJNAYRXSA-N 0.000 description 1
- YWKNKRAKOCLOLH-OEAJRASXSA-N Leu-Phe-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YWKNKRAKOCLOLH-OEAJRASXSA-N 0.000 description 1
- FYPWFNKQVVEELI-ULQDDVLXSA-N Leu-Phe-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 FYPWFNKQVVEELI-ULQDDVLXSA-N 0.000 description 1
- XWEVVRRSIOBJOO-SRVKXCTJSA-N Leu-Pro-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O XWEVVRRSIOBJOO-SRVKXCTJSA-N 0.000 description 1
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 1
- ADJWHHZETYAAAX-SRVKXCTJSA-N Leu-Ser-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ADJWHHZETYAAAX-SRVKXCTJSA-N 0.000 description 1
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 1
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 1
- ICYRCNICGBJLGM-HJGDQZAQSA-N Leu-Thr-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 1
- LCNASHSOFMRYFO-WDCWCFNPSA-N Leu-Thr-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O LCNASHSOFMRYFO-WDCWCFNPSA-N 0.000 description 1
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 1
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 1
- KLSUAWUZBMAZCL-RHYQMDGZSA-N Leu-Thr-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O KLSUAWUZBMAZCL-RHYQMDGZSA-N 0.000 description 1
- FPFOYSCDUWTZBF-IHPCNDPISA-N Leu-Trp-Leu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H]([NH3+])CC(C)C)C(=O)N[C@@H](CC(C)C)C([O-])=O)=CNC2=C1 FPFOYSCDUWTZBF-IHPCNDPISA-N 0.000 description 1
- WBRJVRXEGQIDRK-XIRDDKMYSA-N Leu-Trp-Ser Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 WBRJVRXEGQIDRK-XIRDDKMYSA-N 0.000 description 1
- WUHBLPVELFTPQK-KKUMJFAQSA-N Leu-Tyr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O WUHBLPVELFTPQK-KKUMJFAQSA-N 0.000 description 1
- ISSAURVGLGAPDK-KKUMJFAQSA-N Leu-Tyr-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O ISSAURVGLGAPDK-KKUMJFAQSA-N 0.000 description 1
- VHTIZYYHIUHMCA-JYJNAYRXSA-N Leu-Tyr-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VHTIZYYHIUHMCA-JYJNAYRXSA-N 0.000 description 1
- ARNIBBOXIAWUOP-MGHWNKPDSA-N Leu-Tyr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ARNIBBOXIAWUOP-MGHWNKPDSA-N 0.000 description 1
- RDFIVFHPOSOXMW-ACRUOGEOSA-N Leu-Tyr-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RDFIVFHPOSOXMW-ACRUOGEOSA-N 0.000 description 1
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 1
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 1
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 1
- XOEDPXDZJHBQIX-ULQDDVLXSA-N Leu-Val-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XOEDPXDZJHBQIX-ULQDDVLXSA-N 0.000 description 1
- 208000019693 Lung disease Diseases 0.000 description 1
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 1
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 1
- YIBOAHAOAWACDK-QEJZJMRPSA-N Lys-Ala-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YIBOAHAOAWACDK-QEJZJMRPSA-N 0.000 description 1
- CLBGMWIYPYAZPR-AVGNSLFASA-N Lys-Arg-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O CLBGMWIYPYAZPR-AVGNSLFASA-N 0.000 description 1
- ALSRJRIWBNENFY-DCAQKATOSA-N Lys-Arg-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O ALSRJRIWBNENFY-DCAQKATOSA-N 0.000 description 1
- GAOJCVKPIGHTGO-UWVGGRQHSA-N Lys-Arg-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O GAOJCVKPIGHTGO-UWVGGRQHSA-N 0.000 description 1
- NTSPQIONFJUMJV-AVGNSLFASA-N Lys-Arg-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O NTSPQIONFJUMJV-AVGNSLFASA-N 0.000 description 1
- DGAAQRAUOFHBFJ-CIUDSAMLSA-N Lys-Asn-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O DGAAQRAUOFHBFJ-CIUDSAMLSA-N 0.000 description 1
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 1
- LZWNAOIMTLNMDW-NHCYSSNCSA-N Lys-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N LZWNAOIMTLNMDW-NHCYSSNCSA-N 0.000 description 1
- HKCCVDWHHTVVPN-CIUDSAMLSA-N Lys-Asp-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O HKCCVDWHHTVVPN-CIUDSAMLSA-N 0.000 description 1
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 1
- KWUKZRFFKPLUPE-HJGDQZAQSA-N Lys-Asp-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWUKZRFFKPLUPE-HJGDQZAQSA-N 0.000 description 1
- ZAENPHCEQXALHO-GUBZILKMSA-N Lys-Cys-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZAENPHCEQXALHO-GUBZILKMSA-N 0.000 description 1
- MWVUEPNEPWMFBD-SRVKXCTJSA-N Lys-Cys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCCCN MWVUEPNEPWMFBD-SRVKXCTJSA-N 0.000 description 1
- GGNOBVSOZPHLCE-GUBZILKMSA-N Lys-Gln-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O GGNOBVSOZPHLCE-GUBZILKMSA-N 0.000 description 1
- HWMZUBUEOYAQSC-DCAQKATOSA-N Lys-Gln-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O HWMZUBUEOYAQSC-DCAQKATOSA-N 0.000 description 1
- NDORZBUHCOJQDO-GVXVVHGQSA-N Lys-Gln-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O NDORZBUHCOJQDO-GVXVVHGQSA-N 0.000 description 1
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 1
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 1
- GQFDWEDHOQRNLC-QWRGUYRKSA-N Lys-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN GQFDWEDHOQRNLC-QWRGUYRKSA-N 0.000 description 1
- NKKFVJRLCCUJNA-QWRGUYRKSA-N Lys-Gly-Lys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN NKKFVJRLCCUJNA-QWRGUYRKSA-N 0.000 description 1
- RFQATBGBLDAKGI-VHSXEESVSA-N Lys-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCCN)N)C(=O)O RFQATBGBLDAKGI-VHSXEESVSA-N 0.000 description 1
- HAUUXTXKJNVIFY-ONGXEEELSA-N Lys-Gly-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAUUXTXKJNVIFY-ONGXEEELSA-N 0.000 description 1
- VLMNBMFYRMGEMB-QWRGUYRKSA-N Lys-His-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CNC=N1 VLMNBMFYRMGEMB-QWRGUYRKSA-N 0.000 description 1
- WOEDRPCHKPSFDT-MXAVVETBSA-N Lys-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCCN)N WOEDRPCHKPSFDT-MXAVVETBSA-N 0.000 description 1
- PGLGNCVOWIORQE-SRVKXCTJSA-N Lys-His-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O PGLGNCVOWIORQE-SRVKXCTJSA-N 0.000 description 1
- HQXSFFSLXFHWOX-IXOXFDKPSA-N Lys-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCCN)N)O HQXSFFSLXFHWOX-IXOXFDKPSA-N 0.000 description 1
- NJNRBRKHOWSGMN-SRVKXCTJSA-N Lys-Leu-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O NJNRBRKHOWSGMN-SRVKXCTJSA-N 0.000 description 1
- QKXZCUCBFPEXNK-KKUMJFAQSA-N Lys-Leu-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 QKXZCUCBFPEXNK-KKUMJFAQSA-N 0.000 description 1
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 1
- ALGGDNMLQNFVIZ-SRVKXCTJSA-N Lys-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ALGGDNMLQNFVIZ-SRVKXCTJSA-N 0.000 description 1
- YUAXTFMFMOIMAM-QWRGUYRKSA-N Lys-Lys-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O YUAXTFMFMOIMAM-QWRGUYRKSA-N 0.000 description 1
- QQPSCXKFDSORFT-IHRRRGAJSA-N Lys-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN QQPSCXKFDSORFT-IHRRRGAJSA-N 0.000 description 1
- URGPVYGVWLIRGT-DCAQKATOSA-N Lys-Met-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O URGPVYGVWLIRGT-DCAQKATOSA-N 0.000 description 1
- LMGNWHDWJDIOPK-DKIMLUQUSA-N Lys-Phe-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LMGNWHDWJDIOPK-DKIMLUQUSA-N 0.000 description 1
- AZOFEHCPMBRNFD-BZSNNMDCSA-N Lys-Phe-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 AZOFEHCPMBRNFD-BZSNNMDCSA-N 0.000 description 1
- BOJYMMBYBNOOGG-DCAQKATOSA-N Lys-Pro-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BOJYMMBYBNOOGG-DCAQKATOSA-N 0.000 description 1
- QBHGXFQJFPWJIH-XUXIUFHCSA-N Lys-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN QBHGXFQJFPWJIH-XUXIUFHCSA-N 0.000 description 1
- LOGFVTREOLYCPF-RHYQMDGZSA-N Lys-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN LOGFVTREOLYCPF-RHYQMDGZSA-N 0.000 description 1
- LKDXINHHSWFFJC-SRVKXCTJSA-N Lys-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N LKDXINHHSWFFJC-SRVKXCTJSA-N 0.000 description 1
- SQXZLVXQXWILKW-KKUMJFAQSA-N Lys-Ser-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQXZLVXQXWILKW-KKUMJFAQSA-N 0.000 description 1
- YRNRVKTYDSLKMD-KKUMJFAQSA-N Lys-Ser-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YRNRVKTYDSLKMD-KKUMJFAQSA-N 0.000 description 1
- MEQLGHAMAUPOSJ-DCAQKATOSA-N Lys-Ser-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O MEQLGHAMAUPOSJ-DCAQKATOSA-N 0.000 description 1
- RPWTZTBIFGENIA-VOAKCMCISA-N Lys-Thr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RPWTZTBIFGENIA-VOAKCMCISA-N 0.000 description 1
- BDFHWFUAQLIMJO-KXNHARMFSA-N Lys-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N)O BDFHWFUAQLIMJO-KXNHARMFSA-N 0.000 description 1
- CAVRAQIDHUPECU-UVOCVTCTSA-N Lys-Thr-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAVRAQIDHUPECU-UVOCVTCTSA-N 0.000 description 1
- CNXOBMMOYZPPGS-NUTKFTJISA-N Lys-Trp-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O CNXOBMMOYZPPGS-NUTKFTJISA-N 0.000 description 1
- YUTZYVTZDVZBJJ-IHPCNDPISA-N Lys-Trp-Lys Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 YUTZYVTZDVZBJJ-IHPCNDPISA-N 0.000 description 1
- MDDUIRLQCYVRDO-NHCYSSNCSA-N Lys-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN MDDUIRLQCYVRDO-NHCYSSNCSA-N 0.000 description 1
- UGCIQUYEJIEHKX-GVXVVHGQSA-N Lys-Val-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O UGCIQUYEJIEHKX-GVXVVHGQSA-N 0.000 description 1
- VKCPHIOZDWUFSW-ONGXEEELSA-N Lys-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN VKCPHIOZDWUFSW-ONGXEEELSA-N 0.000 description 1
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 1
- TXTZMVNJIRZABH-ULQDDVLXSA-N Lys-Val-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TXTZMVNJIRZABH-ULQDDVLXSA-N 0.000 description 1
- OZVXDDFYCQOPFD-XQQFMLRXSA-N Lys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N OZVXDDFYCQOPFD-XQQFMLRXSA-N 0.000 description 1
- IKXQOBUBZSOWDY-AVGNSLFASA-N Lys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N IKXQOBUBZSOWDY-AVGNSLFASA-N 0.000 description 1
- AHZNUGRZHMZGFL-GUBZILKMSA-N Met-Arg-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CCCNC(N)=N AHZNUGRZHMZGFL-GUBZILKMSA-N 0.000 description 1
- ZMYHJISLFYTQGK-FXQIFTODSA-N Met-Asp-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZMYHJISLFYTQGK-FXQIFTODSA-N 0.000 description 1
- XBYKTPZCWQQSGB-IHRRRGAJSA-N Met-Cys-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XBYKTPZCWQQSGB-IHRRRGAJSA-N 0.000 description 1
- VOOINLQYUZOREH-SRVKXCTJSA-N Met-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCSC)N VOOINLQYUZOREH-SRVKXCTJSA-N 0.000 description 1
- HLQWFLJOJRFXHO-CIUDSAMLSA-N Met-Glu-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O HLQWFLJOJRFXHO-CIUDSAMLSA-N 0.000 description 1
- RATXDYWHIYNZLE-DCAQKATOSA-N Met-Lys-Cys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)O)N RATXDYWHIYNZLE-DCAQKATOSA-N 0.000 description 1
- IILAGWCGKJSBGB-IHRRRGAJSA-N Met-Phe-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N IILAGWCGKJSBGB-IHRRRGAJSA-N 0.000 description 1
- SOAYQFDWEIWPPR-IHRRRGAJSA-N Met-Ser-Tyr Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O SOAYQFDWEIWPPR-IHRRRGAJSA-N 0.000 description 1
- NSMXRFMGZYTFEX-KJEVXHAQSA-N Met-Thr-Tyr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCSC)N)O NSMXRFMGZYTFEX-KJEVXHAQSA-N 0.000 description 1
- OOXVBECOTYHTCK-WDSOQIARSA-N Met-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCSC)N OOXVBECOTYHTCK-WDSOQIARSA-N 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 1
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 1
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 1
- 101800000933 Non-structural protein 10 Proteins 0.000 description 1
- 101800000511 Non-structural protein 2 Proteins 0.000 description 1
- 101800000510 Non-structural protein 7 Proteins 0.000 description 1
- 101800000482 Non-structural protein 9 Proteins 0.000 description 1
- 101710110284 Nuclear shuttle protein Proteins 0.000 description 1
- 101150089880 ORF10 gene Proteins 0.000 description 1
- 101150001656 ORF3a gene Proteins 0.000 description 1
- 101150007210 ORF6 gene Proteins 0.000 description 1
- 101150027577 ORF8 gene Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 241000282317 Paguma larvata Species 0.000 description 1
- 101800002227 Papain-like protease nsp3 Proteins 0.000 description 1
- 101800001074 Papain-like proteinase Proteins 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- LSXGADJXBDFXQU-DLOVCJGASA-N Phe-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 LSXGADJXBDFXQU-DLOVCJGASA-N 0.000 description 1
- MDHZEOMXGNBSIL-DLOVCJGASA-N Phe-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N MDHZEOMXGNBSIL-DLOVCJGASA-N 0.000 description 1
- HHOOEUSPFGPZFP-QWRGUYRKSA-N Phe-Asn-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HHOOEUSPFGPZFP-QWRGUYRKSA-N 0.000 description 1
- WGXOKDLDIWSOCV-MELADBBJSA-N Phe-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O WGXOKDLDIWSOCV-MELADBBJSA-N 0.000 description 1
- LXVFHIBXOWJTKZ-BZSNNMDCSA-N Phe-Asn-Tyr Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O LXVFHIBXOWJTKZ-BZSNNMDCSA-N 0.000 description 1
- JIYJYFIXQTYDNF-YDHLFZDLSA-N Phe-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N JIYJYFIXQTYDNF-YDHLFZDLSA-N 0.000 description 1
- WMGVYPPIMZPWPN-SRVKXCTJSA-N Phe-Asp-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N WMGVYPPIMZPWPN-SRVKXCTJSA-N 0.000 description 1
- SWZKMTDPQXLQRD-XVSYOHENSA-N Phe-Asp-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWZKMTDPQXLQRD-XVSYOHENSA-N 0.000 description 1
- UEHNWRNADDPYNK-DLOVCJGASA-N Phe-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CC=CC=C1)N UEHNWRNADDPYNK-DLOVCJGASA-N 0.000 description 1
- LXUJDHOKVUYHRC-KKUMJFAQSA-N Phe-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CC=CC=C1)N LXUJDHOKVUYHRC-KKUMJFAQSA-N 0.000 description 1
- UNLYPPYNDXHGDG-IHRRRGAJSA-N Phe-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UNLYPPYNDXHGDG-IHRRRGAJSA-N 0.000 description 1
- KYYMILWEGJYPQZ-IHRRRGAJSA-N Phe-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KYYMILWEGJYPQZ-IHRRRGAJSA-N 0.000 description 1
- CSDMCMITJLKBAH-SOUVJXGZSA-N Phe-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O CSDMCMITJLKBAH-SOUVJXGZSA-N 0.000 description 1
- APJPXSFJBMMOLW-KBPBESRZSA-N Phe-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 APJPXSFJBMMOLW-KBPBESRZSA-N 0.000 description 1
- NPLGQVKZFGJWAI-QWHCGFSZSA-N Phe-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O NPLGQVKZFGJWAI-QWHCGFSZSA-N 0.000 description 1
- GYEPCBNTTRORKW-PCBIJLKTSA-N Phe-Ile-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O GYEPCBNTTRORKW-PCBIJLKTSA-N 0.000 description 1
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 1
- XMQSOOJRRVEHRO-ULQDDVLXSA-N Phe-Leu-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 XMQSOOJRRVEHRO-ULQDDVLXSA-N 0.000 description 1
- KBVJZCVLQWCJQN-KKUMJFAQSA-N Phe-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KBVJZCVLQWCJQN-KKUMJFAQSA-N 0.000 description 1
- SMFGCTXUBWEPKM-KBPBESRZSA-N Phe-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 SMFGCTXUBWEPKM-KBPBESRZSA-N 0.000 description 1
- METZZBCMDXHFMK-BZSNNMDCSA-N Phe-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N METZZBCMDXHFMK-BZSNNMDCSA-N 0.000 description 1
- LRBSWBVUCLLRLU-BZSNNMDCSA-N Phe-Leu-Lys Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1ccccc1)C(=O)N[C@@H](CCCCN)C(O)=O LRBSWBVUCLLRLU-BZSNNMDCSA-N 0.000 description 1
- KPEIBEPEUAZWNS-ULQDDVLXSA-N Phe-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KPEIBEPEUAZWNS-ULQDDVLXSA-N 0.000 description 1
- INHMISZWLJZQGH-ULQDDVLXSA-N Phe-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 INHMISZWLJZQGH-ULQDDVLXSA-N 0.000 description 1
- DMEYUTSDVRCWRS-ULQDDVLXSA-N Phe-Lys-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 DMEYUTSDVRCWRS-ULQDDVLXSA-N 0.000 description 1
- OQTDZEJJWWAGJT-KKUMJFAQSA-N Phe-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O OQTDZEJJWWAGJT-KKUMJFAQSA-N 0.000 description 1
- DOXQMJCSSYZSNM-BZSNNMDCSA-N Phe-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O DOXQMJCSSYZSNM-BZSNNMDCSA-N 0.000 description 1
- WZEWCHQHNCMBEN-PMVMPFDFSA-N Phe-Lys-Trp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N WZEWCHQHNCMBEN-PMVMPFDFSA-N 0.000 description 1
- GPSMLZQVIIYLDK-ULQDDVLXSA-N Phe-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O GPSMLZQVIIYLDK-ULQDDVLXSA-N 0.000 description 1
- WKLMCMXFMQEKCX-SLFFLAALSA-N Phe-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O WKLMCMXFMQEKCX-SLFFLAALSA-N 0.000 description 1
- DSXPMZMSJHOKKK-HJOGWXRNSA-N Phe-Phe-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O DSXPMZMSJHOKKK-HJOGWXRNSA-N 0.000 description 1
- RVEVENLSADZUMS-IHRRRGAJSA-N Phe-Pro-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O RVEVENLSADZUMS-IHRRRGAJSA-N 0.000 description 1
- NJJBATPLUQHRBM-IHRRRGAJSA-N Phe-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CO)C(=O)O NJJBATPLUQHRBM-IHRRRGAJSA-N 0.000 description 1
- WEDZFLRYSIDIRX-IHRRRGAJSA-N Phe-Ser-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 WEDZFLRYSIDIRX-IHRRRGAJSA-N 0.000 description 1
- IAOZOFPONWDXNT-IXOXFDKPSA-N Phe-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IAOZOFPONWDXNT-IXOXFDKPSA-N 0.000 description 1
- YDUGVDGFKNXFPL-IXOXFDKPSA-N Phe-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O YDUGVDGFKNXFPL-IXOXFDKPSA-N 0.000 description 1
- KLYYKKGCPOGDPE-OEAJRASXSA-N Phe-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O KLYYKKGCPOGDPE-OEAJRASXSA-N 0.000 description 1
- SHUFSZDAIPLZLF-BEAPCOKYSA-N Phe-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O SHUFSZDAIPLZLF-BEAPCOKYSA-N 0.000 description 1
- GNRMAQSIROFNMI-IXOXFDKPSA-N Phe-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GNRMAQSIROFNMI-IXOXFDKPSA-N 0.000 description 1
- MSSXKZBDKZAHCX-UNQGMJICSA-N Phe-Thr-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O MSSXKZBDKZAHCX-UNQGMJICSA-N 0.000 description 1
- ZYNBEWGJFXTBDU-ACRUOGEOSA-N Phe-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CC=CC=C2)N ZYNBEWGJFXTBDU-ACRUOGEOSA-N 0.000 description 1
- IPVPGAADZXRZSH-RNXOBYDBSA-N Phe-Tyr-Trp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IPVPGAADZXRZSH-RNXOBYDBSA-N 0.000 description 1
- JSGWNFKWZNPDAV-YDHLFZDLSA-N Phe-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JSGWNFKWZNPDAV-YDHLFZDLSA-N 0.000 description 1
- DXWNFNOPBYAFRM-IHRRRGAJSA-N Phe-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N DXWNFNOPBYAFRM-IHRRRGAJSA-N 0.000 description 1
- YUPRIZTWANWWHK-DZKIICNBSA-N Phe-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N YUPRIZTWANWWHK-DZKIICNBSA-N 0.000 description 1
- VDTYRPWRWRCROL-UFYCRDLUSA-N Phe-Val-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 VDTYRPWRWRCROL-UFYCRDLUSA-N 0.000 description 1
- 101800001016 Picornain 3C-like protease Proteins 0.000 description 1
- 108010076039 Polyproteins Proteins 0.000 description 1
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 1
- SSSFPISOZOLQNP-GUBZILKMSA-N Pro-Arg-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSFPISOZOLQNP-GUBZILKMSA-N 0.000 description 1
- UVKNEILZSJMKSR-FXQIFTODSA-N Pro-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 UVKNEILZSJMKSR-FXQIFTODSA-N 0.000 description 1
- VOHFZDSRPZLXLH-IHRRRGAJSA-N Pro-Asn-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VOHFZDSRPZLXLH-IHRRRGAJSA-N 0.000 description 1
- UTAUEDINXUMHLG-FXQIFTODSA-N Pro-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 UTAUEDINXUMHLG-FXQIFTODSA-N 0.000 description 1
- SGCZFWSQERRKBD-BQBZGAKWSA-N Pro-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 SGCZFWSQERRKBD-BQBZGAKWSA-N 0.000 description 1
- ZCXQTRXYZOSGJR-FXQIFTODSA-N Pro-Asp-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZCXQTRXYZOSGJR-FXQIFTODSA-N 0.000 description 1
- XJROSHJRQTXWAE-XGEHTFHBSA-N Pro-Cys-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XJROSHJRQTXWAE-XGEHTFHBSA-N 0.000 description 1
- FRKBNXCFJBPJOL-GUBZILKMSA-N Pro-Glu-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FRKBNXCFJBPJOL-GUBZILKMSA-N 0.000 description 1
- HAEGAELAYWSUNC-WPRPVWTQSA-N Pro-Gly-Val Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAEGAELAYWSUNC-WPRPVWTQSA-N 0.000 description 1
- AQGUSRZKDZYGGV-GMOBBJLQSA-N Pro-Ile-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O AQGUSRZKDZYGGV-GMOBBJLQSA-N 0.000 description 1
- XYHMFGGWNOFUOU-QXEWZRGKSA-N Pro-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 XYHMFGGWNOFUOU-QXEWZRGKSA-N 0.000 description 1
- RUDOLGWDSKQQFF-DCAQKATOSA-N Pro-Leu-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O RUDOLGWDSKQQFF-DCAQKATOSA-N 0.000 description 1
- BRJGUPWVFXKBQI-XUXIUFHCSA-N Pro-Leu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRJGUPWVFXKBQI-XUXIUFHCSA-N 0.000 description 1
- CPRLKHJUFAXVTD-ULQDDVLXSA-N Pro-Leu-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CPRLKHJUFAXVTD-ULQDDVLXSA-N 0.000 description 1
- XQPHBAKJJJZOBX-SRVKXCTJSA-N Pro-Lys-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O XQPHBAKJJJZOBX-SRVKXCTJSA-N 0.000 description 1
- XZBYTHCRAVAXQQ-DCAQKATOSA-N Pro-Met-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O XZBYTHCRAVAXQQ-DCAQKATOSA-N 0.000 description 1
- MHBSUKYVBZVQRW-HJWJTTGWSA-N Pro-Phe-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MHBSUKYVBZVQRW-HJWJTTGWSA-N 0.000 description 1
- YYARMJSFDLIDFS-FKBYEOEOSA-N Pro-Phe-Trp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O YYARMJSFDLIDFS-FKBYEOEOSA-N 0.000 description 1
- FYKUEXMZYFIZKA-DCAQKATOSA-N Pro-Pro-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FYKUEXMZYFIZKA-DCAQKATOSA-N 0.000 description 1
- ITUDDXVFGFEKPD-NAKRPEOUSA-N Pro-Ser-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ITUDDXVFGFEKPD-NAKRPEOUSA-N 0.000 description 1
- UGDMQJSXSSZUKL-IHRRRGAJSA-N Pro-Ser-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O UGDMQJSXSSZUKL-IHRRRGAJSA-N 0.000 description 1
- PRKWBYCXBBSLSK-GUBZILKMSA-N Pro-Ser-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O PRKWBYCXBBSLSK-GUBZILKMSA-N 0.000 description 1
- CHYAYDLYYIJCKY-OSUNSFLBSA-N Pro-Thr-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CHYAYDLYYIJCKY-OSUNSFLBSA-N 0.000 description 1
- AJJDPGVVNPUZCR-RHYQMDGZSA-N Pro-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1)O AJJDPGVVNPUZCR-RHYQMDGZSA-N 0.000 description 1
- RMJZWERKFFNNNS-XGEHTFHBSA-N Pro-Thr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMJZWERKFFNNNS-XGEHTFHBSA-N 0.000 description 1
- BXHRXLMCYSZSIY-STECZYCISA-N Pro-Tyr-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](Cc1ccc(O)cc1)NC(=O)[C@@H]1CCCN1)C(O)=O BXHRXLMCYSZSIY-STECZYCISA-N 0.000 description 1
- DYJTXTCEXMCPBF-UFYCRDLUSA-N Pro-Tyr-Phe Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CC3=CC=CC=C3)C(=O)O DYJTXTCEXMCPBF-UFYCRDLUSA-N 0.000 description 1
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 1
- DGDCSVGVWWAJRS-AVGNSLFASA-N Pro-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 DGDCSVGVWWAJRS-AVGNSLFASA-N 0.000 description 1
- ZMLRZBWCXPQADC-TUAOUCFPSA-N Pro-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ZMLRZBWCXPQADC-TUAOUCFPSA-N 0.000 description 1
- YDTUEBLEAVANFH-RCWTZXSCSA-N Pro-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 YDTUEBLEAVANFH-RCWTZXSCSA-N 0.000 description 1
- FHJQROWZEJFZPO-SRVKXCTJSA-N Pro-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FHJQROWZEJFZPO-SRVKXCTJSA-N 0.000 description 1
- 101800000596 Probable picornain 3C-like protease Proteins 0.000 description 1
- 101800001862 Proofreading exoribonuclease Proteins 0.000 description 1
- 101800002929 Proofreading exoribonuclease nsp14 Proteins 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 108010079005 RDV peptide Proteins 0.000 description 1
- 108010012974 RNA triphosphatase Proteins 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 208000035415 Reinfection Diseases 0.000 description 1
- 206010057190 Respiratory tract infections Diseases 0.000 description 1
- 102100029831 Reticulon-4 Human genes 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- FIXILCYTSAUERA-FXQIFTODSA-N Ser-Ala-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FIXILCYTSAUERA-FXQIFTODSA-N 0.000 description 1
- SRTCFKGBYBZRHA-ACZMJKKPSA-N Ser-Ala-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SRTCFKGBYBZRHA-ACZMJKKPSA-N 0.000 description 1
- IYCBDVBJWDXQRR-FXQIFTODSA-N Ser-Ala-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O IYCBDVBJWDXQRR-FXQIFTODSA-N 0.000 description 1
- IDQFQFVEWMWRQQ-DLOVCJGASA-N Ser-Ala-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IDQFQFVEWMWRQQ-DLOVCJGASA-N 0.000 description 1
- ZXLUWXWISXIFIX-ACZMJKKPSA-N Ser-Asn-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZXLUWXWISXIFIX-ACZMJKKPSA-N 0.000 description 1
- WXWDPFVKQRVJBJ-CIUDSAMLSA-N Ser-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N WXWDPFVKQRVJBJ-CIUDSAMLSA-N 0.000 description 1
- RDFQNDHEHVSONI-ZLUOBGJFSA-N Ser-Asn-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDFQNDHEHVSONI-ZLUOBGJFSA-N 0.000 description 1
- KNZQGAUEYZJUSQ-ZLUOBGJFSA-N Ser-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N KNZQGAUEYZJUSQ-ZLUOBGJFSA-N 0.000 description 1
- SWSRFJZZMNLMLY-ZKWXMUAHSA-N Ser-Asp-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O SWSRFJZZMNLMLY-ZKWXMUAHSA-N 0.000 description 1
- ZHYMUFQVKGJNRM-ZLUOBGJFSA-N Ser-Cys-Asn Chemical compound OC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC(N)=O ZHYMUFQVKGJNRM-ZLUOBGJFSA-N 0.000 description 1
- MPPHJZYXDVDGOF-BWBBJGPYSA-N Ser-Cys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CO MPPHJZYXDVDGOF-BWBBJGPYSA-N 0.000 description 1
- RNMRYWZYFHHOEV-CIUDSAMLSA-N Ser-Gln-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RNMRYWZYFHHOEV-CIUDSAMLSA-N 0.000 description 1
- SMIDBHKWSYUBRZ-ACZMJKKPSA-N Ser-Glu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O SMIDBHKWSYUBRZ-ACZMJKKPSA-N 0.000 description 1
- HJEBZBMOTCQYDN-ACZMJKKPSA-N Ser-Glu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HJEBZBMOTCQYDN-ACZMJKKPSA-N 0.000 description 1
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 1
- SNVIOQXAHVORQM-WDSKDSINSA-N Ser-Gly-Gln Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O SNVIOQXAHVORQM-WDSKDSINSA-N 0.000 description 1
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 1
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 1
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 1
- MOQDPPUMFSMYOM-KKUMJFAQSA-N Ser-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CO)N MOQDPPUMFSMYOM-KKUMJFAQSA-N 0.000 description 1
- BEAFYHFQTOTVFS-VGDYDELISA-N Ser-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N BEAFYHFQTOTVFS-VGDYDELISA-N 0.000 description 1
- MOINZPRHJGTCHZ-MMWGEVLESA-N Ser-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N MOINZPRHJGTCHZ-MMWGEVLESA-N 0.000 description 1
- QYSFWUIXDFJUDW-DCAQKATOSA-N Ser-Leu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYSFWUIXDFJUDW-DCAQKATOSA-N 0.000 description 1
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 1
- GJFYFGOEWLDQGW-GUBZILKMSA-N Ser-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GJFYFGOEWLDQGW-GUBZILKMSA-N 0.000 description 1
- GVMUJUPXFQFBBZ-GUBZILKMSA-N Ser-Lys-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GVMUJUPXFQFBBZ-GUBZILKMSA-N 0.000 description 1
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 1
- ZSLFCBHEINFXRS-LPEHRKFASA-N Ser-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ZSLFCBHEINFXRS-LPEHRKFASA-N 0.000 description 1
- UGTZYIPOBYXWRW-SRVKXCTJSA-N Ser-Phe-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O UGTZYIPOBYXWRW-SRVKXCTJSA-N 0.000 description 1
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 1
- XVWDJUROVRQKAE-KKUMJFAQSA-N Ser-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CC=CC=C1 XVWDJUROVRQKAE-KKUMJFAQSA-N 0.000 description 1
- ZKBKUWQVDWWSRI-BZSNNMDCSA-N Ser-Phe-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKBKUWQVDWWSRI-BZSNNMDCSA-N 0.000 description 1
- JLKWJWPDXPKKHI-FXQIFTODSA-N Ser-Pro-Asn Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CC(=O)N)C(=O)O JLKWJWPDXPKKHI-FXQIFTODSA-N 0.000 description 1
- QUGRFWPMPVIAPW-IHRRRGAJSA-N Ser-Pro-Phe Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QUGRFWPMPVIAPW-IHRRRGAJSA-N 0.000 description 1
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 1
- ILZAUMFXKSIUEF-SRVKXCTJSA-N Ser-Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ILZAUMFXKSIUEF-SRVKXCTJSA-N 0.000 description 1
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 1
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 1
- OLKICIBQRVSQMA-SRVKXCTJSA-N Ser-Ser-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OLKICIBQRVSQMA-SRVKXCTJSA-N 0.000 description 1
- SQHKXWODKJDZRC-LKXGYXEUSA-N Ser-Thr-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQHKXWODKJDZRC-LKXGYXEUSA-N 0.000 description 1
- PCJLFYBAQZQOFE-KATARQTJSA-N Ser-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N)O PCJLFYBAQZQOFE-KATARQTJSA-N 0.000 description 1
- DYEGLQRVMBWQLD-IXOXFDKPSA-N Ser-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CO)N)O DYEGLQRVMBWQLD-IXOXFDKPSA-N 0.000 description 1
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 1
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 1
- FZNNGIHSIPKFRE-QEJZJMRPSA-N Ser-Trp-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZNNGIHSIPKFRE-QEJZJMRPSA-N 0.000 description 1
- FVFUOQIYDPAIJR-XIRDDKMYSA-N Ser-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N FVFUOQIYDPAIJR-XIRDDKMYSA-N 0.000 description 1
- FHXGMDRKJHKLKW-QWRGUYRKSA-N Ser-Tyr-Gly Chemical compound OC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 FHXGMDRKJHKLKW-QWRGUYRKSA-N 0.000 description 1
- ZVBCMFDJIMUELU-BZSNNMDCSA-N Ser-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CO)N ZVBCMFDJIMUELU-BZSNNMDCSA-N 0.000 description 1
- HAYADTTXNZFUDM-IHRRRGAJSA-N Ser-Tyr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O HAYADTTXNZFUDM-IHRRRGAJSA-N 0.000 description 1
- SGZVZUCRAVSPKQ-FXQIFTODSA-N Ser-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N SGZVZUCRAVSPKQ-FXQIFTODSA-N 0.000 description 1
- JZRYFUGREMECBH-XPUUQOCRSA-N Ser-Val-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O JZRYFUGREMECBH-XPUUQOCRSA-N 0.000 description 1
- ANOQEBQWIAYIMV-AEJSXWLSSA-N Ser-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ANOQEBQWIAYIMV-AEJSXWLSSA-N 0.000 description 1
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 1
- SIEBDTCABMZCLF-XGEHTFHBSA-N Ser-Val-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SIEBDTCABMZCLF-XGEHTFHBSA-N 0.000 description 1
- 241000713880 Spleen focus-forming virus Species 0.000 description 1
- 241000282898 Sus scrofa Species 0.000 description 1
- 230000024932 T cell mediated immunity Effects 0.000 description 1
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 1
- DDPVJPIGACCMEH-XQXXSGGOSA-N Thr-Ala-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DDPVJPIGACCMEH-XQXXSGGOSA-N 0.000 description 1
- XSLXHSYIVPGEER-KZVJFYERSA-N Thr-Ala-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O XSLXHSYIVPGEER-KZVJFYERSA-N 0.000 description 1
- GLQFKOVWXPPFTP-VEVYYDQMSA-N Thr-Arg-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GLQFKOVWXPPFTP-VEVYYDQMSA-N 0.000 description 1
- UKBSDLHIKIXJKH-HJGDQZAQSA-N Thr-Arg-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UKBSDLHIKIXJKH-HJGDQZAQSA-N 0.000 description 1
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 1
- UNURFMVMXLENAZ-KJEVXHAQSA-N Thr-Arg-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UNURFMVMXLENAZ-KJEVXHAQSA-N 0.000 description 1
- VIBXMCZWVUOZLA-OLHMAJIHSA-N Thr-Asn-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O VIBXMCZWVUOZLA-OLHMAJIHSA-N 0.000 description 1
- YLXAMFZYJTZXFH-OLHMAJIHSA-N Thr-Asn-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O YLXAMFZYJTZXFH-OLHMAJIHSA-N 0.000 description 1
- TZKPNGDGUVREEB-FOHZUACHSA-N Thr-Asn-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O TZKPNGDGUVREEB-FOHZUACHSA-N 0.000 description 1
- QNJZOAHSYPXTAB-VEVYYDQMSA-N Thr-Asn-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O QNJZOAHSYPXTAB-VEVYYDQMSA-N 0.000 description 1
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 1
- MFEBUIFJVPNZLO-OLHMAJIHSA-N Thr-Asp-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O MFEBUIFJVPNZLO-OLHMAJIHSA-N 0.000 description 1
- DCCGCVLVVSAJFK-NUMRIWBASA-N Thr-Asp-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O DCCGCVLVVSAJFK-NUMRIWBASA-N 0.000 description 1
- NLSNVZAREYQMGR-HJGDQZAQSA-N Thr-Asp-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NLSNVZAREYQMGR-HJGDQZAQSA-N 0.000 description 1
- KRPKYGOFYUNIGM-XVSYOHENSA-N Thr-Asp-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O KRPKYGOFYUNIGM-XVSYOHENSA-N 0.000 description 1
- JXKMXEBNZCKSDY-JIOCBJNQSA-N Thr-Asp-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O JXKMXEBNZCKSDY-JIOCBJNQSA-N 0.000 description 1
- XDARBNMYXKUFOJ-GSSVUCPTSA-N Thr-Asp-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XDARBNMYXKUFOJ-GSSVUCPTSA-N 0.000 description 1
- DHPPWTOLRWYIDS-XKBZYTNZSA-N Thr-Cys-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O DHPPWTOLRWYIDS-XKBZYTNZSA-N 0.000 description 1
- RKDFEMGVMMYYNG-WDCWCFNPSA-N Thr-Gln-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O RKDFEMGVMMYYNG-WDCWCFNPSA-N 0.000 description 1
- RCEHMXVEMNXRIW-IRIUXVKKSA-N Thr-Gln-Tyr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N)O RCEHMXVEMNXRIW-IRIUXVKKSA-N 0.000 description 1
- DKDHTRVDOUZZTP-IFFSRLJSSA-N Thr-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DKDHTRVDOUZZTP-IFFSRLJSSA-N 0.000 description 1
- CQNFRKAKGDSJFR-NUMRIWBASA-N Thr-Glu-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CQNFRKAKGDSJFR-NUMRIWBASA-N 0.000 description 1
- LGNBRHZANHMZHK-NUMRIWBASA-N Thr-Glu-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O LGNBRHZANHMZHK-NUMRIWBASA-N 0.000 description 1
- GKWNLDNXMMLRMC-GLLZPBPUSA-N Thr-Glu-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O GKWNLDNXMMLRMC-GLLZPBPUSA-N 0.000 description 1
- BNGDYRRHRGOPHX-IFFSRLJSSA-N Thr-Glu-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O BNGDYRRHRGOPHX-IFFSRLJSSA-N 0.000 description 1
- XFTYVCHLARBHBQ-FOHZUACHSA-N Thr-Gly-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XFTYVCHLARBHBQ-FOHZUACHSA-N 0.000 description 1
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 1
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 1
- JKGGPMOUIAAJAA-YEPSODPASA-N Thr-Gly-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O JKGGPMOUIAAJAA-YEPSODPASA-N 0.000 description 1
- KRGDDWVBBDLPSJ-CUJWVEQBSA-N Thr-His-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O KRGDDWVBBDLPSJ-CUJWVEQBSA-N 0.000 description 1
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 1
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 1
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 1
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 1
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 1
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 1
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 1
- IJVNLNRVDUTWDD-MEYUZBJRSA-N Thr-Leu-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IJVNLNRVDUTWDD-MEYUZBJRSA-N 0.000 description 1
- KZSYAEWQMJEGRZ-RHYQMDGZSA-N Thr-Leu-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O KZSYAEWQMJEGRZ-RHYQMDGZSA-N 0.000 description 1
- JLNMFGCJODTXDH-WEDXCCLWSA-N Thr-Lys-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O JLNMFGCJODTXDH-WEDXCCLWSA-N 0.000 description 1
- UUSQVWOVUYMLJA-PPCPHDFISA-N Thr-Lys-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UUSQVWOVUYMLJA-PPCPHDFISA-N 0.000 description 1
- MGJLBZFUXUGMML-VOAKCMCISA-N Thr-Lys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MGJLBZFUXUGMML-VOAKCMCISA-N 0.000 description 1
- SIEZEMFJLYRUMK-YTWAJWBKSA-N Thr-Met-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N)O SIEZEMFJLYRUMK-YTWAJWBKSA-N 0.000 description 1
- NZRUWPIYECBYRK-HTUGSXCWSA-N Thr-Phe-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O NZRUWPIYECBYRK-HTUGSXCWSA-N 0.000 description 1
- GYUUYCIXELGTJS-MEYUZBJRSA-N Thr-Phe-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O GYUUYCIXELGTJS-MEYUZBJRSA-N 0.000 description 1
- MEBDIIKMUUNBSB-RPTUDFQQSA-N Thr-Phe-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MEBDIIKMUUNBSB-RPTUDFQQSA-N 0.000 description 1
- NWECYMJLJGCBOD-UNQGMJICSA-N Thr-Phe-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O NWECYMJLJGCBOD-UNQGMJICSA-N 0.000 description 1
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 1
- OLFOOYQTTQSSRK-UNQGMJICSA-N Thr-Pro-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLFOOYQTTQSSRK-UNQGMJICSA-N 0.000 description 1
- DOBIBIXIHJKVJF-XKBZYTNZSA-N Thr-Ser-Gln Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O DOBIBIXIHJKVJF-XKBZYTNZSA-N 0.000 description 1
- QYDKSNXSBXZPFK-ZJDVBMNYSA-N Thr-Thr-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYDKSNXSBXZPFK-ZJDVBMNYSA-N 0.000 description 1
- AAZOYLQUEQRUMZ-GSSVUCPTSA-N Thr-Thr-Asn Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O AAZOYLQUEQRUMZ-GSSVUCPTSA-N 0.000 description 1
- NHQVWACSJZJCGJ-FLBSBUHZSA-N Thr-Thr-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NHQVWACSJZJCGJ-FLBSBUHZSA-N 0.000 description 1
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 1
- QJIODPFLAASXJC-JHYOHUSXSA-N Thr-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O QJIODPFLAASXJC-JHYOHUSXSA-N 0.000 description 1
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 1
- LECUEEHKUFYOOV-ZJDVBMNYSA-N Thr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)[C@@H](C)O LECUEEHKUFYOOV-ZJDVBMNYSA-N 0.000 description 1
- DKNYWNPPSZCWCJ-GBALPHGKSA-N Thr-Trp-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CS)C(=O)O)N)O DKNYWNPPSZCWCJ-GBALPHGKSA-N 0.000 description 1
- UMFLBPIPAJMNIM-LYARXQMPSA-N Thr-Trp-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CC=CC=C3)C(=O)O)N)O UMFLBPIPAJMNIM-LYARXQMPSA-N 0.000 description 1
- NJGMALCNYAMYCB-JRQIVUDYSA-N Thr-Tyr-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O NJGMALCNYAMYCB-JRQIVUDYSA-N 0.000 description 1
- ILUOMMDDGREELW-OSUNSFLBSA-N Thr-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O ILUOMMDDGREELW-OSUNSFLBSA-N 0.000 description 1
- MNYNCKZAEIAONY-XGEHTFHBSA-N Thr-Val-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O MNYNCKZAEIAONY-XGEHTFHBSA-N 0.000 description 1
- ADBFWLXCCKIXBQ-XIRDDKMYSA-N Trp-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N ADBFWLXCCKIXBQ-XIRDDKMYSA-N 0.000 description 1
- BXKWZPXTTSCOMX-AQZXSJQPSA-N Trp-Asn-Thr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BXKWZPXTTSCOMX-AQZXSJQPSA-N 0.000 description 1
- NKUIXQOJUAEIET-AQZXSJQPSA-N Trp-Asp-Thr Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@H](O)C)C(O)=O)=CNC2=C1 NKUIXQOJUAEIET-AQZXSJQPSA-N 0.000 description 1
- RRVUOLRWIZXBRQ-IHPCNDPISA-N Trp-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RRVUOLRWIZXBRQ-IHPCNDPISA-N 0.000 description 1
- UKWSFUSPGPBJGU-VFAJRCTISA-N Trp-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O UKWSFUSPGPBJGU-VFAJRCTISA-N 0.000 description 1
- PWPJLBWYRTVYQS-PMVMPFDFSA-N Trp-Phe-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O PWPJLBWYRTVYQS-PMVMPFDFSA-N 0.000 description 1
- GNCPKOZDOCQRAF-BPUTZDHNSA-N Trp-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N GNCPKOZDOCQRAF-BPUTZDHNSA-N 0.000 description 1
- ABRICLFKFRFDKS-IHPCNDPISA-N Trp-Ser-Tyr Chemical compound C([C@H](NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=C(O)C=C1 ABRICLFKFRFDKS-IHPCNDPISA-N 0.000 description 1
- PALLCTDPFINNMM-JQHSSLGASA-N Trp-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N PALLCTDPFINNMM-JQHSSLGASA-N 0.000 description 1
- ZWZOCUWOXSDYFZ-CQDKDKBSSA-N Tyr-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ZWZOCUWOXSDYFZ-CQDKDKBSSA-N 0.000 description 1
- HSVPZJLMPLMPOX-BPNCWPANSA-N Tyr-Arg-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O HSVPZJLMPLMPOX-BPNCWPANSA-N 0.000 description 1
- GFZQWWDXJVGEMW-ULQDDVLXSA-N Tyr-Arg-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O GFZQWWDXJVGEMW-ULQDDVLXSA-N 0.000 description 1
- CKKFTIQYURNSEI-IHRRRGAJSA-N Tyr-Asn-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CKKFTIQYURNSEI-IHRRRGAJSA-N 0.000 description 1
- GFHYISDTIWZUSU-QWRGUYRKSA-N Tyr-Asn-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GFHYISDTIWZUSU-QWRGUYRKSA-N 0.000 description 1
- KLGFILUOTCBNLJ-IHRRRGAJSA-N Tyr-Cys-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O KLGFILUOTCBNLJ-IHRRRGAJSA-N 0.000 description 1
- BODHJXJNRVRKFA-BZSNNMDCSA-N Tyr-Cys-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BODHJXJNRVRKFA-BZSNNMDCSA-N 0.000 description 1
- CWQZAUYFWRLITN-AVGNSLFASA-N Tyr-Gln-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N)O CWQZAUYFWRLITN-AVGNSLFASA-N 0.000 description 1
- XQYHLZNPOTXRMQ-KKUMJFAQSA-N Tyr-Glu-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XQYHLZNPOTXRMQ-KKUMJFAQSA-N 0.000 description 1
- HKYTWJOWZTWBQB-AVGNSLFASA-N Tyr-Glu-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HKYTWJOWZTWBQB-AVGNSLFASA-N 0.000 description 1
- SLCSPPCQWUHPPO-JYJNAYRXSA-N Tyr-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 SLCSPPCQWUHPPO-JYJNAYRXSA-N 0.000 description 1
- ZRPLVTZTKPPSBT-AVGNSLFASA-N Tyr-Glu-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZRPLVTZTKPPSBT-AVGNSLFASA-N 0.000 description 1
- CNLKDWSAORJEMW-KWQFWETISA-N Tyr-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O CNLKDWSAORJEMW-KWQFWETISA-N 0.000 description 1
- PMDWYLVWHRTJIW-STQMWFEESA-N Tyr-Gly-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PMDWYLVWHRTJIW-STQMWFEESA-N 0.000 description 1
- HVPPEXXUDXAPOM-MGHWNKPDSA-N Tyr-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HVPPEXXUDXAPOM-MGHWNKPDSA-N 0.000 description 1
- BXPOOVDVGWEXDU-WZLNRYEVSA-N Tyr-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BXPOOVDVGWEXDU-WZLNRYEVSA-N 0.000 description 1
- GULIUBBXCYPDJU-CQDKDKBSSA-N Tyr-Leu-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 GULIUBBXCYPDJU-CQDKDKBSSA-N 0.000 description 1
- PRONOHBTMLNXCZ-BZSNNMDCSA-N Tyr-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PRONOHBTMLNXCZ-BZSNNMDCSA-N 0.000 description 1
- WDGDKHLSDIOXQC-ACRUOGEOSA-N Tyr-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 WDGDKHLSDIOXQC-ACRUOGEOSA-N 0.000 description 1
- ARJASMXQBRNAGI-YESZJQIVSA-N Tyr-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N ARJASMXQBRNAGI-YESZJQIVSA-N 0.000 description 1
- CDKZJGMPZHPAJC-ULQDDVLXSA-N Tyr-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDKZJGMPZHPAJC-ULQDDVLXSA-N 0.000 description 1
- HSBZWINKRYZCSQ-KKUMJFAQSA-N Tyr-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O HSBZWINKRYZCSQ-KKUMJFAQSA-N 0.000 description 1
- MXFPBNFKVBHIRW-BZSNNMDCSA-N Tyr-Lys-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O MXFPBNFKVBHIRW-BZSNNMDCSA-N 0.000 description 1
- FMXFHNSFABRVFZ-BZSNNMDCSA-N Tyr-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FMXFHNSFABRVFZ-BZSNNMDCSA-N 0.000 description 1
- PGEFRHBWGOJPJT-KKUMJFAQSA-N Tyr-Lys-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O PGEFRHBWGOJPJT-KKUMJFAQSA-N 0.000 description 1
- UBKKNELWDCBNCF-STQMWFEESA-N Tyr-Met-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 UBKKNELWDCBNCF-STQMWFEESA-N 0.000 description 1
- OFHKXNKJXURPSY-ULQDDVLXSA-N Tyr-Met-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O OFHKXNKJXURPSY-ULQDDVLXSA-N 0.000 description 1
- WTTRJMAZPDHPGS-KKXDTOCCSA-N Tyr-Phe-Ala Chemical compound C[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(O)=O WTTRJMAZPDHPGS-KKXDTOCCSA-N 0.000 description 1
- WPRVVBVWIUWLOH-UFYCRDLUSA-N Tyr-Phe-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC2=CC=C(C=C2)O)N WPRVVBVWIUWLOH-UFYCRDLUSA-N 0.000 description 1
- ARMNWLJYHCOSHE-KKUMJFAQSA-N Tyr-Pro-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O ARMNWLJYHCOSHE-KKUMJFAQSA-N 0.000 description 1
- SZEIFUXUTBBQFQ-STQMWFEESA-N Tyr-Pro-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SZEIFUXUTBBQFQ-STQMWFEESA-N 0.000 description 1
- BIWVVOHTKDLRMP-ULQDDVLXSA-N Tyr-Pro-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O BIWVVOHTKDLRMP-ULQDDVLXSA-N 0.000 description 1
- VXFXIBCCVLJCJT-JYJNAYRXSA-N Tyr-Pro-Pro Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N1CCC[C@H]1C(O)=O VXFXIBCCVLJCJT-JYJNAYRXSA-N 0.000 description 1
- YYLHVUCSTXXKBS-IHRRRGAJSA-N Tyr-Pro-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O YYLHVUCSTXXKBS-IHRRRGAJSA-N 0.000 description 1
- IEWKKXZRJLTIOV-AVGNSLFASA-N Tyr-Ser-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O IEWKKXZRJLTIOV-AVGNSLFASA-N 0.000 description 1
- TYFLVOUZHQUBGM-IHRRRGAJSA-N Tyr-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TYFLVOUZHQUBGM-IHRRRGAJSA-N 0.000 description 1
- BIVIUZRBCAUNPW-JRQIVUDYSA-N Tyr-Thr-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O BIVIUZRBCAUNPW-JRQIVUDYSA-N 0.000 description 1
- LVFZXRQQQDTBQH-IRIUXVKKSA-N Tyr-Thr-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LVFZXRQQQDTBQH-IRIUXVKKSA-N 0.000 description 1
- KLQPIEVIKOQRAW-IZPVPAKOSA-N Tyr-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O KLQPIEVIKOQRAW-IZPVPAKOSA-N 0.000 description 1
- NWEGIYMHTZXVBP-JSGCOSHPSA-N Tyr-Val-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O NWEGIYMHTZXVBP-JSGCOSHPSA-N 0.000 description 1
- NVJCMGGZHOJNBU-UFYCRDLUSA-N Tyr-Val-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N NVJCMGGZHOJNBU-UFYCRDLUSA-N 0.000 description 1
- 101800001927 Uridylate-specific endoribonuclease nsp15 Proteins 0.000 description 1
- FZSPNKUFROZBSG-ZKWXMUAHSA-N Val-Ala-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O FZSPNKUFROZBSG-ZKWXMUAHSA-N 0.000 description 1
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 1
- LTFLDDDGWOVIHY-NAKRPEOUSA-N Val-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N LTFLDDDGWOVIHY-NAKRPEOUSA-N 0.000 description 1
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 1
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 1
- NMANTMWGQZASQN-QXEWZRGKSA-N Val-Arg-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N NMANTMWGQZASQN-QXEWZRGKSA-N 0.000 description 1
- XPYNXORPPVTVQK-SRVKXCTJSA-N Val-Arg-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCSC)C(=O)O)N XPYNXORPPVTVQK-SRVKXCTJSA-N 0.000 description 1
- BYOHPUZJVXWHAE-BYULHYEWSA-N Val-Asn-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N BYOHPUZJVXWHAE-BYULHYEWSA-N 0.000 description 1
- ZMDCGGKHRKNWKD-LAEOZQHASA-N Val-Asn-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZMDCGGKHRKNWKD-LAEOZQHASA-N 0.000 description 1
- UDNYEPLJTRDMEJ-RCOVLWMOSA-N Val-Asn-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N UDNYEPLJTRDMEJ-RCOVLWMOSA-N 0.000 description 1
- LIQJSDDOULTANC-QSFUFRPTSA-N Val-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N LIQJSDDOULTANC-QSFUFRPTSA-N 0.000 description 1
- LNYOXPDEIZJDEI-NHCYSSNCSA-N Val-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N LNYOXPDEIZJDEI-NHCYSSNCSA-N 0.000 description 1
- JLFKWDAZBRYCGX-ZKWXMUAHSA-N Val-Asn-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N JLFKWDAZBRYCGX-ZKWXMUAHSA-N 0.000 description 1
- ISERLACIZUGCDX-ZKWXMUAHSA-N Val-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N ISERLACIZUGCDX-ZKWXMUAHSA-N 0.000 description 1
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 1
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 1
- WPSXZFTVLIAPCN-WDSKDSINSA-N Val-Cys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CS)C(O)=O WPSXZFTVLIAPCN-WDSKDSINSA-N 0.000 description 1
- LHADRQBREKTRLR-DCAQKATOSA-N Val-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N LHADRQBREKTRLR-DCAQKATOSA-N 0.000 description 1
- XIFAHCUNWWKUDE-DCAQKATOSA-N Val-Cys-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N XIFAHCUNWWKUDE-DCAQKATOSA-N 0.000 description 1
- IRLYZKKNBFPQBW-XGEHTFHBSA-N Val-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N)O IRLYZKKNBFPQBW-XGEHTFHBSA-N 0.000 description 1
- XJFXZQKJQGYFMM-GUBZILKMSA-N Val-Cys-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)O)N XJFXZQKJQGYFMM-GUBZILKMSA-N 0.000 description 1
- XEYUMGGWQCIWAR-XVKPBYJWSA-N Val-Gln-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)NCC(=O)O)N XEYUMGGWQCIWAR-XVKPBYJWSA-N 0.000 description 1
- CPTQYHDSVGVGDZ-UKJIMTQDSA-N Val-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N CPTQYHDSVGVGDZ-UKJIMTQDSA-N 0.000 description 1
- PGBJAZDAEWPDAA-NHCYSSNCSA-N Val-Gln-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N PGBJAZDAEWPDAA-NHCYSSNCSA-N 0.000 description 1
- UZDHNIJRRTUKKC-DLOVCJGASA-N Val-Gln-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N UZDHNIJRRTUKKC-DLOVCJGASA-N 0.000 description 1
- XGJLNBNZNMVJRS-NRPADANISA-N Val-Glu-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O XGJLNBNZNMVJRS-NRPADANISA-N 0.000 description 1
- CVIXTAITYJQMPE-LAEOZQHASA-N Val-Glu-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CVIXTAITYJQMPE-LAEOZQHASA-N 0.000 description 1
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 1
- XWYUBUYQMOUFRQ-IFFSRLJSSA-N Val-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N)O XWYUBUYQMOUFRQ-IFFSRLJSSA-N 0.000 description 1
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 1
- GMOLURHJBLOBFW-ONGXEEELSA-N Val-Gly-His Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N GMOLURHJBLOBFW-ONGXEEELSA-N 0.000 description 1
- YTPLVNUZZOBFFC-SCZZXKLOSA-N Val-Gly-Pro Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N1CCC[C@@H]1C(O)=O YTPLVNUZZOBFFC-SCZZXKLOSA-N 0.000 description 1
- ZTKGDWOUYRRAOQ-ULQDDVLXSA-N Val-His-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N ZTKGDWOUYRRAOQ-ULQDDVLXSA-N 0.000 description 1
- JZWZACGUZVCQPS-RNJOBUHISA-N Val-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N JZWZACGUZVCQPS-RNJOBUHISA-N 0.000 description 1
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 1
- BZOSBRIDWSSTFN-AVGNSLFASA-N Val-Leu-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](C(C)C)N BZOSBRIDWSSTFN-AVGNSLFASA-N 0.000 description 1
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 1
- RWOGENDAOGMHLX-DCAQKATOSA-N Val-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N RWOGENDAOGMHLX-DCAQKATOSA-N 0.000 description 1
- JAKHAONCJJZVHT-DCAQKATOSA-N Val-Lys-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N JAKHAONCJJZVHT-DCAQKATOSA-N 0.000 description 1
- WHVSJHJTMUHYBT-SRVKXCTJSA-N Val-Met-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(=O)O)N WHVSJHJTMUHYBT-SRVKXCTJSA-N 0.000 description 1
- RSGHLMMKXJGCMK-JYJNAYRXSA-N Val-Met-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N RSGHLMMKXJGCMK-JYJNAYRXSA-N 0.000 description 1
- YDVDTCJGBBJGRT-GUBZILKMSA-N Val-Met-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N YDVDTCJGBBJGRT-GUBZILKMSA-N 0.000 description 1
- MJFSRZZJQWZHFQ-SRVKXCTJSA-N Val-Met-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)O)N MJFSRZZJQWZHFQ-SRVKXCTJSA-N 0.000 description 1
- NZGOVKLVQNOEKP-YDHLFZDLSA-N Val-Phe-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NZGOVKLVQNOEKP-YDHLFZDLSA-N 0.000 description 1
- AIWLHFZYOUUJGB-UFYCRDLUSA-N Val-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 AIWLHFZYOUUJGB-UFYCRDLUSA-N 0.000 description 1
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 1
- UJMCYJKPDFQLHX-XGEHTFHBSA-N Val-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N)O UJMCYJKPDFQLHX-XGEHTFHBSA-N 0.000 description 1
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 1
- PQSNETRGCRUOGP-KKHAAJSZSA-N Val-Thr-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O PQSNETRGCRUOGP-KKHAAJSZSA-N 0.000 description 1
- BZDGLJPROOOUOZ-XGEHTFHBSA-N Val-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N)O BZDGLJPROOOUOZ-XGEHTFHBSA-N 0.000 description 1
- TVGWMCTYUFBXAP-QTKMDUPCSA-N Val-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N)O TVGWMCTYUFBXAP-QTKMDUPCSA-N 0.000 description 1
- WUFHZIRMAZZWRS-OSUNSFLBSA-N Val-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C(C)C)N WUFHZIRMAZZWRS-OSUNSFLBSA-N 0.000 description 1
- GVNLOVJNNDZUHS-RHYQMDGZSA-N Val-Thr-Lys Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O GVNLOVJNNDZUHS-RHYQMDGZSA-N 0.000 description 1
- PDDJTOSAVNRJRH-UNQGMJICSA-N Val-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](C(C)C)N)O PDDJTOSAVNRJRH-UNQGMJICSA-N 0.000 description 1
- JAIZPWVHPQRYOU-ZJDVBMNYSA-N Val-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O JAIZPWVHPQRYOU-ZJDVBMNYSA-N 0.000 description 1
- POFQRHFHYPSCOI-FHWLQOOXSA-N Val-Trp-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N POFQRHFHYPSCOI-FHWLQOOXSA-N 0.000 description 1
- QTXGUIMEHKCPBH-FHWLQOOXSA-N Val-Trp-Lys Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 QTXGUIMEHKCPBH-FHWLQOOXSA-N 0.000 description 1
- QPJSIBAOZBVELU-BPNCWPANSA-N Val-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N QPJSIBAOZBVELU-BPNCWPANSA-N 0.000 description 1
- CFIBZQOLUDURST-IHRRRGAJSA-N Val-Tyr-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CS)C(=O)O)N CFIBZQOLUDURST-IHRRRGAJSA-N 0.000 description 1
- JXWGBRRVTRAZQA-ULQDDVLXSA-N Val-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N JXWGBRRVTRAZQA-ULQDDVLXSA-N 0.000 description 1
- DFQZDQPLWBSFEJ-LSJOCFKGSA-N Val-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N DFQZDQPLWBSFEJ-LSJOCFKGSA-N 0.000 description 1
- ZLNYBMWGPOKSLW-LSJOCFKGSA-N Val-Val-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLNYBMWGPOKSLW-LSJOCFKGSA-N 0.000 description 1
- AOILQMZPNLUXCM-AVGNSLFASA-N Val-Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN AOILQMZPNLUXCM-AVGNSLFASA-N 0.000 description 1
- ODUHAIXFXFACDY-SRVKXCTJSA-N Val-Val-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)C(C)C ODUHAIXFXFACDY-SRVKXCTJSA-N 0.000 description 1
- JSOXWWFKRJKTMT-WOPDTQHZSA-N Val-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N JSOXWWFKRJKTMT-WOPDTQHZSA-N 0.000 description 1
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 1
- 108010067390 Viral Proteins Proteins 0.000 description 1
- 108010081404 acein-2 Proteins 0.000 description 1
- 238000012387 aerosolization Methods 0.000 description 1
- 108010045023 alanyl-prolyl-tyrosine Proteins 0.000 description 1
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 1
- 108010041407 alanylaspartic acid Proteins 0.000 description 1
- 108010011559 alanylphenylalanine Proteins 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 235000012211 aluminium silicate Nutrition 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 230000000840 anti-viral effect Effects 0.000 description 1
- 230000005875 antibody response Effects 0.000 description 1
- 239000003443 antiviral agent Substances 0.000 description 1
- 108010013835 arginine glutamate Proteins 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 1
- 108010072041 arginyl-glycyl-aspartic acid Proteins 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- 108010077245 asparaginyl-proline Proteins 0.000 description 1
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 1
- 208000006673 asthma Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000011230 binding agent Substances 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- DGNMJYUPWDTKJB-ZDSKVHJSSA-N bis[(z)-non-2-enyl] 9-[4-(dimethylamino)butanoyloxy]heptadecanedioate Chemical compound CCCCCC\C=C/COC(=O)CCCCCCCC(OC(=O)CCCN(C)C)CCCCCCCC(=O)OC\C=C/CCCCCC DGNMJYUPWDTKJB-ZDSKVHJSSA-N 0.000 description 1
- 229910000019 calcium carbonate Inorganic materials 0.000 description 1
- 235000010216 calcium carbonate Nutrition 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 230000012292 cell migration Effects 0.000 description 1
- 230000007969 cellular immunity Effects 0.000 description 1
- 230000036755 cellular response Effects 0.000 description 1
- 235000012000 cholesterol Nutrition 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 239000012050 conventional carrier Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 108700010904 coronavirus proteins Proteins 0.000 description 1
- 108010060199 cysteinylproline Proteins 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 239000010432 diamond Substances 0.000 description 1
- 230000005750 disease progression Effects 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 239000003995 emulsifying agent Substances 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 230000001605 fetal effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000006260 foam Substances 0.000 description 1
- 108010078144 glutaminyl-glycine Proteins 0.000 description 1
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 1
- 108010079547 glutamylmethionine Proteins 0.000 description 1
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 1
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 1
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 1
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 1
- 108010059898 glycyl-tyrosyl-lysine Proteins 0.000 description 1
- 108010020688 glycylhistidine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 108010077515 glycylproline Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 108010040030 histidinoalanine Proteins 0.000 description 1
- 108010036413 histidylglycine Proteins 0.000 description 1
- 108010025306 histidylleucine Proteins 0.000 description 1
- 108010018006 histidylserine Proteins 0.000 description 1
- 102000052622 human IL7 Human genes 0.000 description 1
- 210000004201 immune sera Anatomy 0.000 description 1
- 229940042743 immune sera Drugs 0.000 description 1
- 208000026278 immune system disease Diseases 0.000 description 1
- 238000003018 immunoassay Methods 0.000 description 1
- 230000017555 immunoglobulin mediated immune response Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000002757 inflammatory effect Effects 0.000 description 1
- 206010022000 influenza Diseases 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- NLYAJNPCOHFWQQ-UHFFFAOYSA-N kaolin Chemical compound O.O.O=[Al]O[Si](=O)O[Si](=O)O[Al]=O NLYAJNPCOHFWQQ-UHFFFAOYSA-N 0.000 description 1
- 238000009533 lab test Methods 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 1
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 239000006193 liquid solution Substances 0.000 description 1
- 239000006194 liquid suspension Substances 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 231100000516 lung damage Toxicity 0.000 description 1
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 1
- 108010057952 lysyl-phenylalanyl-lysine Proteins 0.000 description 1
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 1
- 108010009298 lysylglutamic acid Proteins 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 108010005942 methionylglycine Proteins 0.000 description 1
- 108010085203 methionylmethionine Proteins 0.000 description 1
- 108010068488 methionylphenylalanine Proteins 0.000 description 1
- 210000004877 mucosa Anatomy 0.000 description 1
- 210000004400 mucous membrane Anatomy 0.000 description 1
- 210000003097 mucus Anatomy 0.000 description 1
- 230000000869 mutational effect Effects 0.000 description 1
- 230000002276 neurotropic effect Effects 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 239000006179 pH buffering agent Substances 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000010412 perfusion Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 239000008177 pharmaceutical agent Substances 0.000 description 1
- 108010082795 phenylalanyl-arginyl-arginine Proteins 0.000 description 1
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 1
- 108010012581 phenylalanylglutamate Proteins 0.000 description 1
- 108010073101 phenylalanylleucine Proteins 0.000 description 1
- 230000035935 pregnancy Effects 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 230000003449 preventive effect Effects 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- 108010053725 prolylvaline Proteins 0.000 description 1
- 230000000069 prophylactic effect Effects 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 208000020029 respiratory tract infectious disease Diseases 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 108010071207 serylmethionine Proteins 0.000 description 1
- 229910000029 sodium carbonate Inorganic materials 0.000 description 1
- 235000017550 sodium carbonate Nutrition 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 238000013268 sustained release Methods 0.000 description 1
- 239000012730 sustained-release form Substances 0.000 description 1
- 208000011580 syndromic disease Diseases 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 239000012209 synthetic fiber Substances 0.000 description 1
- 229920002994 synthetic fiber Polymers 0.000 description 1
- 239000000454 talc Substances 0.000 description 1
- 229910052623 talc Inorganic materials 0.000 description 1
- 235000012222 talc Nutrition 0.000 description 1
- 210000001550 testis Anatomy 0.000 description 1
- 108010061238 threonyl-glycine Proteins 0.000 description 1
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 1
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 1
- 238000002627 tracheal intubation Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 108010080629 tryptophan-leucine Proteins 0.000 description 1
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 1
- 108010035534 tyrosyl-leucyl-alanine Proteins 0.000 description 1
- 108010078580 tyrosylleucine Proteins 0.000 description 1
- 108010003137 tyrosyltyrosine Proteins 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
- 229960004854 viral vaccine Drugs 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 239000001993 wax Substances 0.000 description 1
- 238000009736 wetting Methods 0.000 description 1
- 239000000080 wetting agent Substances 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
- A61K39/215—Coronaviridae, e.g. avian infectious bronchitis virus
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/14—Antivirals for RNA viruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P37/00—Drugs for immunological or allergic disorders
- A61P37/02—Immunomodulators
- A61P37/04—Immunostimulants
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
- C07K14/08—RNA viruses
- C07K14/165—Coronaviridae, e.g. avian infectious bronchitis virus
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/545—Medicinal preparations containing antigens or antibodies characterised by the dose, timing or administration schedule
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/555—Medicinal preparations containing antigens or antibodies characterised by a specific combination antigen/adjuvant
- A61K2039/55511—Organic adjuvants
- A61K2039/55522—Cytokines; Lymphokines; Interferons
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/57—Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/57—Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2
- A61K2039/575—Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2 humoral response
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/70—Multivalent vaccine
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/20011—Coronaviridae
- C12N2770/20034—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Virology (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Medicinal Chemistry (AREA)
- Organic Chemistry (AREA)
- Veterinary Medicine (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Pharmacology & Pharmacy (AREA)
- Communicable Diseases (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Epidemiology (AREA)
- Mycology (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Gastroenterology & Hepatology (AREA)
- Biophysics (AREA)
- Oncology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Pulmonology (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
Abstract
모든 코로나바이러스 감염 및 질환에 대해 효율적이고 강력하며 오래 지속되는 보호를 유도하기 위한 범-코로나바이러스 백신은 코로나바이러스 감염 및/또는 질환을 예방하기 위한 면역 반응을 개발하기 위해 신체에 대한 다중 표적을 제공하는 데 도움이 되는 하나 이상의 보존된 B, CD4 및 CD8 T 세포 에피토프를 포함할 수 있는 다중 고도로 보존된 큰 서열을 포함한다. 특정 구현예에서, 큰 서열은 보존된 단백질 또는 큰 서열, 예를 들어 인간 코로나바이러스 및/또는 동물 코로나바이러스(예를 들어, 코로나바이러스 감염에 취약한 동물로부터 단리된 코로나바이러스) 사이에 고도로 보존된 서열이다.
Description
관련 출원의 교차 참조
본원은 2020년 4월 14일자로 출원된 미국 가출원 제63/009,907호 및 2020년 9월 28일에 출원된 미국 가출원 제63/084,421호의 이익을 주장하며, 그 명세서(들)의 그 전체가 참고로 본 명세서에 포함된다.
서열 목록에 대한 참조
출원인은 UCI_20_06B_PCT_Sequence_Listing_ST25라는 제목으로 규정 13ter.1(a)에 따라 제출된 Annex C/ST.25 텍스트 파일 형식으로 기록된 정보가 제출된 국제 출원의 일부를 형성하는 정보와 동일하다고 주장한다. 서열 목록의 내용은 그 전체가 참고로 본 명세서에 포함된다.
발명의 분야
본 발명은 백신, 예를 들어 바이러스 백신, 예를 들어 범-코로나바이러스 백신과 같은 코로나바이러스에 대한 백신에 관한 것이다.
지난 20년 동안, 신종 동물매개감염 CoV: SARS-CoV, MERS-CoV, 및 현재 COVID-19 세계적 대유행을 일으킨 전염성이 높고 치명적인 최근 SARS-CoV-2로 인해 인간에 치명적인 코로나바이러스(CoV)가 발생하였다. 세 가지 치명적인 CoV는 모두 천연 숙주인 박쥐에서 유래했으며 다양한 중간 동물 저장소(예를 들어, 천산갑, 사향 고양이 및 낙타)를 통해 인간에게 전염되었다. 현재 보편적인 범-코로나바이러스 백신은 이용가능하기 않기 때문에, 백신을 접종하지 않은 인간 집단으로 알려지지 않은 동물매개감염 박쥐 유래 SARS 유사 코로나바이러스(SL-CoV)의 또 다른 여파로 인해 향후 몇 년 안에 다른 전 세계적인 COVID-유사 대유행이 나타날 가능성이 매우 높다.
중화 항체와 항바이러스 효과기 CD4+ 및 CD8+ T 세포는 대다수의 감염된 무증상 및 회복기 환자에서 바이러스 부하를 줄이는 데 중요한 것으로 보인다. 그러나 인간과 박쥐 코로나바이러스 균주 사이에 보존된 B 세포와 CD4+ 및 CD8+ T 세포 에피토프의 항원 풍경(landscape)과 레퍼토리에 대한 정보는 거의 없다.
무증상 COVID-19 환자에게서 보이는 내성과 상관관계가 있는 B 세포 및 CD4+ 및 CD8+ T 세포의 레퍼토리, 표현형 및 기능뿐만 아니라 인간 및 동물 코로나바이러스 사이에서 항원성, 면역원성, 보호성 및 보존성인 항원 및 에피토프 지형을 결정하는 것은 향후 범-코로나바이러스 백신 개발에 정보를 제공할 수 있다. 본 발명은 고도로 보존된, 예를 들어 하기에서 고도로 보존된 인간 B 세포, CD4+ 및 CD8+ T 세포 에피토프를 포함하는 여러 항원성, 면역원성, 보호 고도로 보존된 큰 서열을 확인하기 위해 인간에서 시험관내 및 동물 모드(예를 들어, 마우스, 햄스터 및 원숭이)에서 생체내 둘 모두에서 여러 면역정보학 및 서열 정렬 접근법 및 여러 면역학적 검정을 사용하는 것을 기재한다.: (i) 6개 대륙의 190개 국가에서 확인된 81,000개 초과의 SARS-CoV-2 인간 균주; (ii) "보통 감기"의 이전 인간 발병을 일으킨 6개의 순환 CoV; (iii) 박쥐에서 단리된 9개의 SL-CoV; (iv) 천산갑에서 단리된 9개의 SL-CoV; (v) 사향 고양이에서 단리된 3개의 SL-CoV; 및 (vi) 낙타에서 단리된 4개의 MERS 균주. 또한, 본 발명은 다음과 같은 교차 반응성 에피토프의 확인을 개재한다: COVID-19 환자와 SARS-CoV-2에 노출된 적이 없는 건강한 개체로부터 회수된 B 세포, CD4+ 및 CD8+ T 세포; 및 "인간화" 인간 백혈구 항원(HLA)-DR1/HLA-A*02:01 이중 형질전환 마우스 및 HLA-DR-1 또는 HLA-A*02:01 일배체형을 발현하지 않는 인간에서 유도된 강력한 B 세포 및 T 세포 반응. 특정 HLA 일배체형으로 제한되는 작은 에피토프와 달리, 큰 서열은 다수의 HLA 일배체형으로 제한된 몇 개의 에피토프를 포괄하므로 HLA 일배체형과 인종 및 민족과 관계없이 인간 집단의 대규모 백신 적용 범위를 확인한다.
본 발명은 인간에 사용하기 위한 백신 조성물에 제한되지 않는다. 본 발명은 개, 고양이 등과 같은 다른 애완 동물에 사용하기 위한 백신 조성물을 포함한다.
본 명세서의 백신 조성물은 코로나바이러스 돌연변이에 관계없이 지속적인 B 및 T 세포 면역성을 제공할 가능성이 있다. 이는 적어도 부분적으로, 백신 조성물이 모든 인간 및 동물 코로나바이러스 변이체 및 균주에서 발견되는 낮은 돌연변이율을 가진 다른 코로나바이러스 구조적 및 비구조적 항원과 조합하여, 고도로 보존된 구조적 및 비-구조적 코로나바이러스 항원, 예컨대 코로나바이러스 핵단백질 (또한 뉴클레오캡시드로 알려져 있음)를 표적으로 하기 때문일 수 있다.
본 발명은 또한 바이러스 내부에 고도로 보존된 구조적(예를 들어, 스파이크 단백질) 및 비-구조적 코로나바이러스 항원(예를 들어, 뉴클레오캡시드와 같은 비-스파이크 단백질)을 선택하는 것에 관한 것으로, 이는 일반적으로 반드시 면역 체계에 의한 돌연변이 압력이 있을 필요는 없는 바이러스 단백질일 수 있다.
본 발명은 인간과 애완동물 및 동물에서 강력하고 오래 지속되는 B 및 T 세포 보호 면역 반응을 유도하는 범-코로나바이러스 재조합 백신 조성물을 제공한다.
특정 구현예에서, 백신 조성물은 인간에서 사용하기 위한 것이다. 특정 구현예에서, 백신 조성물은 마우스, 고양이, 개, 비-인간 영장류, 코로나바이러스 감염에 취약한 다른 동물, 코로나바이러스 감염에 대한 전임상 동물 모델로서 기능할 수 있는 다른 동물, 등으로 제한되지 않는 것과 같은 동물에 사용하기 위한 것이다.
본원에서 사용된 바와 같이, 용어 "다중-에피토프"는 하나 초과의 B 및 T 세포 에피토프를 포함하는 조성물을 지칭하며, 적어도 하나의 CD4 및/또는 CD8 T 세포 에피토프는 MHC-제한되고 TCR에 의해 인식되고, 하나 이상의 에피토프는 B 세포 에피토프이다. 예를 들어, 본 명세서의 백신 조성물은 다중-에피토프 범-코로나바이러스 백신 조성물일 수 있다.
본원에서 사용된 바와 같이, 용어 "재조합 백신 조성물"은 하나 이상의 재조합 유전자, 예를 들어, 상기 유전자(들)의 발현을 지원하는 하나 이상의 시스템으로 클로닝된 유전자에 의해 인코딩되는 하나 이상의 단백질 또는 펩티드를 지칭할 수 있다. 용어 "재조합 백신 조성물"은 재조합 유전자 또는 상기 재조합 유전자의 발현을 지원하는 시스템을 지칭할 수 있다.
예를 들어, 본 발명은 1개 이상의 큰 서열을 포함하는 범-코로나바이러스 재조합 백신 조성물을 제공하며, 1개 이상의 큰 서열 각각은 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프; 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및/또는 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프 중 하나 이상을 포함하고; 적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래된다.
본 발명은 또한 2개 이상의 큰 서열을 포함하는 범-코로나바이러스 재조합 백신 조성물을 특징으로 하며, 2개 이상의 큰 서열 각각은 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프; 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및/또는 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프 중 하나 이상을 포함하고; 적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래된다.
본 발명은 또한 범-코로나바이러스 재조합 백신 조성물을 특징으로 하고, 이 조성물은 전체 스파이크 단백질; 및 하기 중 하나 또는 둘 다: 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및/또는 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프를 포함하고; 적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래된다.
본 발명은 또한 범-코로나바이러스 재조합 백신 조성물을 특징으로 하며, 이 조성물은 스파이크 단백질의 적어도 일부로서, 스파이크 단백질의 일부는 삼량체화된 SARS-CoV-2 수용체 결합 도메인 (RBD)을 포함하는 스파이크 단백질의 적어도 일부; 및 하기 중 하나 또는 둘 다: 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프를 포함하고; 적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래된다.
본 발명은 또한 범-코로나바이러스 재조합 백신 조성물을 특징으로 하고, 이 조성물은 전체 스파이크 단백질; 및 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프를 포함하고; 적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래된다.
본 발명은 또한 범-코로나바이러스 재조합 백신 조성물을 특징으로 하며, 이 조성물은 스파이크 단백질의 적어도 일부로서, 스파이크 단백질의 일부는 삼량체화된 SARS-CoV-2 수용체 결합 도메인 (RBD)을 포함하는 스파이크 단백질의 적어도 일부; 및 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프를 포함하고; 적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래된다.
본 발명은 또한 1개 이상의 큰 서열을 인코딩하는 항원 전달 시스템을 포함하는 범-코로나바이러스 재조합 백신 조성물을 특징으로 하며, 1개 이상의 큰 서열 각각은 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프; 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및/또는 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프 중 하나 이상을 포함하고; 적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래된다.
본 발명은 또한 2개 이상의 큰 서열을 인코딩하는 항원 전달 시스템을 포함하는 범-코로나바이러스 재조합 백신 조성물을 특징으로 하며, 2개 이상의 큰 서열 각각은 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프; 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및/또는 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프 중 하나 이상을 포함하고; 적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래된다.
본 발명은 또한 범-코로나바이러스 재조합 백신 조성물을 특징으로 하고, 이 조성물은 전체 스파이크 단백질을 인코딩하는 항원 전달 시스템; 및 하기 중 하나 또는 둘 다: 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및/또는 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프를 포함하고; 적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래된다.
본 발명은 또한 범-코로나바이러스 재조합 백신 조성물을 특징으로 하며, 이 조성물은 스파이크 단백질의 적어도 일부를 인코딩하는 항원 전달 시스템으로서, 스파이크 단백질의 일부는 삼량체화된 SARS-CoV-2 수용체 결합 도메인 (RBD)을 포함하는 항원 전달 시스템; 및 하기 중 하나 또는 둘 다: 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프를 포함하고; 적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래된다.
본 발명은 또한 범-코로나바이러스 재조합 백신 조성물을 특징으로 하고, 이 조성물은 전체 스파이크 단백질을 인코딩하는 항원 전달 시스템; 및 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프를 포함하고; 적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래된다.
본 발명은 또한 범-코로나바이러스 재조합 백신 조성물을 특징으로 하며, 이 조성물은 스파이크 단백질의 적어도 일부를 인코딩하는 항원 전달 시스템으로서, 스파이크 단백질의 일부는 삼량체화된 SARS-CoV-2 수용체 결합 도메인 (RBD)을 포함하는 항원 전달 시스템; 및 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프를 포함하고; 적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래된다.
상기 언급된 조성물 및 본 명세서의 구현예를 참조하면, 일부 구현예에서, 비-스파이크 단백질은 ORF1ab 단백질, ORF3a 단백질, 외피 단백질, 막 당단백질, ORF6 단백질, ORF7a 단백질, ORF7b 단백질, ORF8 단백질, 뉴클레오캡시드 단백질 및 ORF10 단백질이다.
일부 구현예에서, 1개 이상의 큰 서열은 인간 및 동물 코로나바이러스 중에서 고도로 보존된다. 일부 구현예에서, 1개 이상의 큰 서열은 SARS-CoV-2 단백질 중 적어도 하나로부터 유래된다. 일부 구현예에서, 1개 이상의 큰 서열은 현재 순환 중인 하나 이상의 SARS-CoV-2 인간 균주 또는 변이체; 이전 인간 발병을 일으킨 하나 이상의 코로나바이러스; 박쥐, 천산갑, 사향고양이, 밍크, 낙타, 및 코로나바이러스에 수용적인 다른 동물로 이루어진 군으로부터 선택된 동물로부터 단리된 하나 이상의 코로나바이러스; 또는 보통 감기를 유발하는 하나 이상의 코로나바이러스 중 하나 이상으로부터 유래된다. 일부 구현예에서, 현재 순환 중인 하나 이상의 SARS-CoV-2 인간 균주 또는 변이체는 균주 B.1.177; 균주 B.1.160, 균주 B.1.1.7; 균주 B.1.351; 균주 P.1; 균주 B.1.427/B.1.429; 균주 B.1.258; 균주 B.1.221; 균주 B.1.367; 균주 B.1.1.277; 균주 B.1.1.302; 균주 B.1.525; 균주 B.1.526, 균주 S:677H, 및 균주 S:677P로부터 선택된다. 일부 구현예에서, 보통 감기를 유발하는 하나 이상의 코로나바이러스는 하기로부터 선택된다: 229E 알파 코로나바이러스, NL63 알파 코로나바이러스, OC43 베타 코로나바이러스 및 HKU1 베타 코로나바이러스. 일부 구현예에서, 보존된 큰 서열은 염려 변이체 또는 관심 변이체로부터 선택된다.
일부 구현예에서, 조성물은 2개 이상의 큰 서열을 포함한다. 일부 구현예에서, 조성물은 3개 이상의 큰 서열을 포함한다. 일부 구현예에서, 조성물은 2개의 큰 서열을 포함한다. 일부 구현예에서, 조성물은 3개의 큰 서열을 포함한다. 일부 구현예에서, 조성물은 4개의 큰 서열을 포함한다. 일부 구현예에서, 조성물은 5개의 큰 서열을 포함한다.
일부 구현예에서, 큰 서열은 구조적 단백질, 비-구조적 단백질, 또는 이들의 조합으로부터 유래된다. 일부 구현예에서, 큰 서열 또는 표적 에피토프는 ORF1ab 단백질, 스파이크 당단백질, ORF3a 단백질, 외피 단백질, 막 당단백질, ORF6 단백질, ORF7a 단백질, ORF7b 단백질, ORF8 단백질, 뉴클레오캡시드 단백질 ORF10, 및 단백질로 이루어진 군으로부터 선택된 SARS-CoV-2 단백질로부터 유래된다.
일부 구현예에서, 스파이크 당단백질로부터 유래된 큰 서열 또는 표적 에피토프는 RBD이다. 일부 구현예에서, 스파이크 당단백질로부터 유래된 큰 서열 또는 표적 에피토프는 NTD이다. 일부 구현예에서, 스파이크 당단백질로부터 유래된 큰 서열 또는 표적 에피토프는 RBD 및 NTD 영역 둘 다를 포함한다. 일부 구현예에서, 스파이크 당단백질로부터 유래된 큰 서열 또는 표적 에피토프는 항체를 중화 및 차단함으로써 인식된다. 일부 구현예에서, 스파이크 당단백질로부터 유래된 큰 서열 또는 표적 에피토프는 항체의 중화 및 차단을 유도한다. 일부 구현예에서, 스파이크 당단백질로부터 유래된 큰 서열 또는 표적 에피토프는 바이러스를 인식하고 중화하는 항체의 중화 및 차단을 유도한다.
일부 구현예에서, 스파이크 당단백질로부터 유래된 큰 서열 또는 표적 에피토프는 스파이크 단백질을 인식하는 항체의 중화 및 차단을 유도한다.
일부 구현예에서, ORF1ab 단백질은 비구조적 단백질 (Nsp) 1, Nsp2, Nsp3, Nsp4, Nsp5, Nsp6, Nsp7, Nsp8, Nsp9, Nsp10, Nsp11, Nsp12, Nsp13, Nsp14, Nsp15 및 Nsp16을 포함한다. 일부 구현예에서, 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프는 스파이크 당단백질, 외피 단백질, ORF1ab 단백질, ORF7a 단백질, ORF8a 단백질, ORF10 단백질, 또는 이들의 조합으로부터 선택된다. 일부 구현예에서, 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프는 S2-10, S1220-1228, S1000-1008, S958-966, E20-28, ORF1ab1675 -1683, ORF1ab2363 -2371, ORF1ab3013 -3021, ORF1ab3183-3191, ORF1ab5470 -5478, ORF1ab6749 -6757, ORF7b26 -34, ORF8a73 -81, ORF103 -11, 및 ORF105-13으로부터 선택된다. 일부 구현예에서, 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프는 서열번호: 2-29로부터 선택된다. 일부 구현예에서, 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프는 서열번호: 30-57로부터 선택된다. 일부 구현예에서, 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프는 스파이크 당단백질, 외피 단백질, 막 단백질, 뉴클레오캡시드 단백질, ORF1a 단백질, ORF1ab 단백질, ORF6 단백질, ORF7a 단백질, ORF7b 단백질, ORF8 단백질, 또는 이들의 조합으로부터 선택된다. 일부 구현예에서, 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프는 ORF1a1350 -1365, ORF1ab5019 -5033, ORF612-26, ORF1ab6088 -6102, ORF1ab6420 -6434, ORF1a1801 -1815, S1-13, E26-40, E20-34, M176-190, N388-403, ORF7a3 -17, ORF7a1 -15, ORF7b8 -22, ORF7a98 -112, 및 ORF81 - 15으로부터 선택된다. 일부 구현예에서, 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프는 서열번호: 58-73으로부터 선택된다. 일부 구현예에서, 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프는 서열번호: 74-105로부터 선택된다. 일부 구현예에서, 하나 이상의 보존된 코로나바이러스 B 세포 표적 에피토프는 스파이크 당단백질로부터 선택된다. 일부 구현예에서, 하나 이상의 보존된 코로나바이러스 B 세포 표적 에피토프는 S287-317, S524-598, S601-640, S802-819, S888-909, S369-393, S440-501, S1133-1172, S329-363, 및 S13-37로부터 선택된다. 일부 구현예에서, 하나 이상의 코로나바이러스 B 세포 표적 에피토프는 서열번호: 106-116으로부터 선택된다. 일부 구현예에서, 하나 이상의 코로나바이러스 B 세포 표적 에피토프는 서열번호: 117-138로부터 선택된다.
일부 구현예에서, 하나 이상의 보존된 코로나바이러스 B 세포 표적 에피토프는 큰 서열의 형태이다. 일부 구현예에서, 큰 서열은 전장 스파이크 당단백질이다. 일부 구현예에서, 큰 서열은 부분 스파이크 당단백질이다. 일부 구현예에서, 스파이크 당단백질은 아미노산 위치 986 및 987에서 2개의 연속적인 프롤린 치환을 갖는다. 일부 구현예에서, 스파이크 당단백질은 Tyr-83 및 Tyr-489, Gln-24 및 Asn-487을 포함하는 아미노산 위치에서 단일 아미노산 치환을 갖는다. 일부 구현예에서, 스파이크 단백질의 막횡단 앵커는 온전한 S1-S2 절단 부위를 갖는다. 일부 구현예에서, 스파이크 단백질은 안정화된 형태로 존재한다. 일부 구현예에서, 스파이크 단백질은 S2 서브유닛에서 중심 나선의 상단에 있는 아미노산 위치 986 및 987에서 프롤린 치환으로 안정화된다.
일부 구현예에서, 1개 이상의 큰 서열은 SARS-CoV-2에 의해 발현되는 전체 단백질 서열로부터 유래된다. 일부 구현예에서, 1개 이상의 큰 서열은 SARS-CoV-2에 의해 발현되는 부분 단백질 서열로부터 유래된다. 일부 구현예에서, 스파이크 단백질로부터의 1개 이상의 큰 보존된 서열은 전장 스파이크 당단백질로부터의 것이다. 일부 구현예에서, 스파이크 단백질로부터의 1개 이상의 큰 보존된 서열은 부분 스파이크 당단백질로부터의 것이다. 일부 구현예에서, 1개 이상의 큰 서열은 스파이크 당단백질(S) 또는 이의 일부, 핵단백질 또는 이의 일부, 막 단백질 또는 이의 일부, 및 ORF1a/b 또는 이의 일부를 포함한다. 일부 구현예에서, 1개 이상의 큰 서열은 스파이크 당단백질(S) 또는 이의 일부, 핵단백질 또는 이의 일부, 및 ORF1a/b 또는 이의 일부를 포함한다. 일부 구현예에서, 스파이크 당단백질의 일부는 RBD이다. 일부 구현예에서, 1개 이상의 큰 서열은 ORF1ab 단백질, 스파이크 당단백질, ORF3a 단백질, 외피 단백질, 막 당단백질, ORF6 단백질, ORF7a 단백질, ORF7b 단백질, ORF8 단백질, 뉴클레오캡시드 단백질 ORF10, 및 단백질로 이루어진 군으로부터 선택된다. 일부 구현예에서, ORF1ab 단백질은 비구조적 단백질 (Nsp) 1, Nsp2, Nsp3, Nsp4, Nsp5, Nsp6, Nsp7, Nsp8, Nsp9, Nsp10, Nsp11, Nsp12, Nsp13, Nsp14, Nsp15 및 Nsp16을 포함한다. 일부 구현예에서, 큰 서열 중 1개 이상은 다수의 인간 클래스 1 및 클래스 2 HLA 일배체형으로 제한된 T-세포 에피토프를 포함하고 클래스 1에 대한 HLA-0201 또는 클래스 2에 대한 HLA-DR로 제한된다.
일부 구현예에서, 큰 서열은 구조적 단백질, 비-구조적 단백질, 또는 이들의 조합으로부터 유래된다.
본 발명은 또한 전장 스파이크 단백질을 포함하는 재조합 백신 조성물을 특징으로 한다. 본 발명은 또한 전장 스파이크 단백질 또는 부분 스파이크 단백질을 포함하는 재조합 백신 조성물을 특징으로 한다.
일부 구현예에서, 스파이크 단백질은 Tyr-489 및 Asn-487을 포함한다. 일부 구현예에서, Tyr-489 및 Asn-487은 ACE-2 상의 Tyr 83 및 Gln-24와의 상호작용을 돕는다. 일부 구현예에서, 스파이크 단백질은 Gln-493을 포함한다. 일부 구현예에서, Gln-493은 ACE-2 상의 Glu-35 및 Lys-31과의 상호작용을 돕는다. 일부 구현예에서, 스파이크 단백질은 Tyr-505를 포함한다. 일부 구현예에서, Tyr-505는 ACE-2 상의 Glu-37 및 Arg-393과의 상호작용을 돕는다.
일부 구현예에서, 조성물은 삼량체화된 SARS-CoV-2 수용체 결합 도메인(RBD) 서열을 포함한다. 일부 구현예에서, 삼량체화된 SARS-CoV-2 수용체 결합 도메인(RBD) 서열은 T4 피브리틴 유래 폴돈 삼량체화 도메인의 부가에 의해 변형된다. 일부 구현예에서, T4 피브리틴 유래 폴돈 삼량체화 도메인의 부가는 다가 디스플레이에 의해 면역원성을 증가시킨다. 일부 구현예에서, 조성물은 삼량체화된 SARS-CoV-2 스파이크 당단백질 RBD 항원을 하나 이상의 고도로 보존된 구조적 및 비-구조적 SARS-CoV-2 항원과 함께 인코딩한다. 일부 구현예에서, 항원에 대한 서열은 GenBank 수탁 번호, MN908947.3이다. 일부 구현예에서, 보존된 큰 서열은 염려 변이체 및 관심 변이체로부터 선택된다. 일부 구현예에서, 조성물은 S1-S2 절단 부위에 돌연변이 682-RRAR-685 → 682-QQAQ-685를 포함한다.
일부 구현예에서, 조성물은 적어도 1개의 프롤린 치환을 포함한다. 일부 구현예에서, 조성물은 2개 이상의 프롤린 치환을 포함한다. 일부 구현예에서, 프롤린 치환은 위치 K986 및 V987에 있다. 일부 구현예에서, 조성물은 K986P 및 V987P 돌연변이를 포함한다.
일부 구현예에서, 큰 서열은 서열번호: 182-185 (표 1) 또는 서열번호: 148-159 (표 10)로부터 선택된다.
일부 구현예에서, 조성물은 약제학적 담체를 추가로 포함한다.
일부 구현예에서, 링커는 T2A를 포함한다. 일부 구현예에서, 링커는 T2A, E2A, 및 P2A로부터 선택된다. 일부 구현예에서, 상이한 링커는 각각의 열린 해독틀 사이에 배치된다.
일부 구현예에서, 백신 작제물은 인간에 대한 것이다. 일부 구현예에서, 조성물은 인간 CXCL-11 및 IL-7 또는 IL-2 또는 IL-15를 포함한다. 일부 구현예에서, 백신 작제물은 동물에 대한 것이다. 일부 구현예에서, 조성물은 동물 CXCL-11 및 IL-7 또는 IL-2 또는 IL-15를 포함한다. 일부 구현예에서, 동물은 고양이 및 개이다.
일부 구현예에서, 전달 시스템은 아데노바이러스 시스템이다. 일부 구현예에서, 아데노바이러스 전달 시스템은 Ad26, Ad5, Ad35, 또는 이들의 조합이다. 일부 구현예에서, 큰 서열 중 1개 이상은 일반 프로모터에 작동적으로 연결된다. 일부 구현예에서, 일반 프로모터는 CMV 또는 CAG 프로모터이다. 일부 구현예에서, 1개 이상의 큰 서열은 폐 특이적 프로모터에 작동적으로 연결된다. 일부 구현예에서, 폐 특이적 프로모터는 SpB 또는 CD144이다. 일부 구현예에서, 조성물은 T 세포 유인 케모카인을 추가로 포함한다.
일부 구현예에서, 항원 전달 시스템은 T 세포 유인 케모카인을 추가로 인코딩한다. 일부 구현예에서, 항원 전달 시스템은 2개의 전달 시스템을 포함하며, 제2 전달 시스템은 T 세포 유인 케모카인을 인코딩한다. 일부 구현예에서, T 세포 유인 케모카인은 CCL5, CXCL9, CXCL10, CXCL11, 또는 이들의 조합이다. 일부 구현예에서, T 세포 유인 케모카인은 폐 특이적 프로모터에 작동적으로 연결된다. 일부 구현예에서, T 세포 유인 케모카인은 일반 프로모터에 작동적으로 연결된다. 일부 구현예에서, 조성물은 T 세포 증식을 촉진하는 조성물을 추가로 포함한다.
일부 구현예에서, 항원 전달 시스템은 T 세포 증식을 촉진하는 조성물을 추가로 인코딩한다. 일부 구현예에서, 항원 전달 시스템은 2개의 전달 시스템을 포함하고, 제2 전달 시스템은 T 세포 증식을 촉진하는 조성물을 인코딩한다. 일부 구현예에서, T 세포 증식을 촉진하는 조성물은 IL-7, IL-2, 또는 IL-15이다. 일부 구현예에서, T 세포 증식을 촉진하는 조성물은 폐 특이적 프로모터에 작동적으로 연결된다. 일부 구현예에서, T 세포 증식을 촉진하는 조성물은 일반 프로모터에 작동적으로 연결된다. 일부 구현예에서, T 세포 유인 케모카인 및 T 세포 증식을 촉진하는 조성물은 동일한 프로모터에 의해 구동된다. 일부 구현예에서, 백신은 T 세포 유인 케모카인 및 T 세포 증식을 촉진하는 조성물을 포함하는 펩티드를 추가로 인코딩한다. 일부 구현예에서, 펩티드는 폐 특이적 프로모터에 작동적으로 연결된다. 일부 구현예에서, 펩티드는 일반 프로모터에 작동적으로 연결된다. 일부 구현예에서, 폐 특이적 프로모터는 SpB 또는 CD144이다. 일부 구현예에서, 일반 프로모터는 CMV 또는 CAG 프로모터이다.
일부 구현예에서, 항원 전달 시스템은 분자 보조제를 추가로 인코딩한다. 일부 구현예에서, 항원 전달 시스템은 2개의 전달 시스템을 포함하며, 제2 전달 시스템은 분자 보조제를 인코딩한다. 일부 구현예에서, 분자 보조제는 CpG이다. 일부 구현예에서, 분자 보조제는 CpG 중합체이다. 일부 구현예에서, 분자 보조제는 플라젤린이다. 일부 구현예에서, 분자 보조제는 프로모터에 작동적으로 연결된다. 일부 구현예에서, 프로모터는 폐 특이적 프로모터 또는 일반 프로모터이다.
일부 구현예에서, 큰 서열 중 1개 이상은 링커에 의해 분리된다. 일부 구현예에서, 각각의 큰 서열은 링커에 의해 분리된다. 일부 구현예에서, 링커는 길이가 2 내지 10개의 아미노산이다.
일부 구현예에서, 재조합 백신 조성물은 태그를 포함하고, 예를 들어 큰 서열 중 1개 이상은 태그를 포함한다. 일부 구현예에서, 태그는 His 태그이다.
본 발명은 또한 본 명세서의 임의의 백신 조성물을 포함하는 rVSV-panCoV 재조합 백신 조성물을 포함한다.
본 발명은 또한 본 명세서의 임의의 백신 조성물을 포함하는 rAdV-panCoV 재조합 백신 조성물을 포함한다.
일부 구현예에서, 조성물은 백신으로 사용하기 위한 것이다. 일부 구현예에서, 조성물은 코로나바이러스 감염 및 질환의 예방 및 치료를 위한 면역요법으로서 사용하기 위한 것이다. 일부 구현예에서, 조성물은 대상체에서 코로나바이러스 질환을 예방하기 위해 사용된다. 일부 구현예에서, 조성물은 대상체에서 예방적으로 코로나바이러스 감염을 방지하기 위해 사용된다. 일부 구현예에서, 조성물은 대상체에서 면역 반응을 유도한다. 일부 구현예에서, 조성물은 범-코로나바이러스 재조합 백신 조성물에 의해 유도된 면역 반응을 연장하고 폐로의 T-세포 이동을 증가시킨다.
본 발명은 또한 서열번호: 139-147(표 10)을 포함하는 범-코로나바이러스 재조합 백신 조성물을 포함한다.
비-스파이크 단백질은 스파이크 이외의 임의의 코로나바이러스 단백질, 예를 들어 외피 단백질, 막 단백질, 뉴클레오캡시드 단백질, ORF1a 단백질, ORF1ab 단백질, ORF6 단백질, ORF7a 단백질, ORF7b 단백질, ORF8 단백질 등을 포함하나 이에 제한되지는 않는다.
특정 구현예에서, 본 발명의 조성물, 예를 들어 큰 서열은 하나 이상의 보존된 표적 에피토프, 예를 들어, 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프; 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및/또는 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프를 포함한다. 일부 구현예에서, 보존된 표적 에피토프는 서열 정렬 및 분석에서 확인된 5개의 가장 보존된 에피토프(이의 에피토프 유형에 대해, 예를 들어, B 세포, CD4 T 세포, CD8 T 세포) 중 하나인 것이다. 일부 구현예에서, 보존된 표적 에피토프는 서열 정렬 및 분석에서 확인된 10개의 가장 보존된 에피토프(이의 에피토프 유형에 대해, 예를 들어, B 세포, CD4 T 세포, CD8 T 세포) 중 하나인 것이다. 일부 구현예에서, 보존된 표적 에피토프는 서열 정렬 및 분석에서 확인된 15개의 가장 보존된 에피토프(이의 에피토프 유형에 대해, 예를 들어, B 세포, CD4 T 세포, CD8 T 세포) 중 하나인 것이다. 일부 구현예에서, 보존된 표적 에피토프는 서열 정렬 및 분석에서 확인된 20개의 가장 보존된 에피토프(이의 에피토프 유형에 대해, 예를 들어, B 세포, CD4 T 세포, CD8 T 세포) 중 하나인 것이다. 일부 구현예에서, 보존된 표적 에피토프는 서열 정렬 및 분석에서 확인된 25개의 가장 보존된 에피토프(이의 에피토프 유형에 대해, 예를 들어, B 세포, CD4 T 세포, CD8 T 세포) 중 하나인 것이다. 일부 구현예에서, 보존된 표적 에피토프는 서열 정렬 및 분석에서 확인된 30개의 가장 보존된 에피토프(이의 에피토프 유형에 대해, 예를 들어, B 세포, CD4 T 세포, CD8 T 세포) 중 하나인 것이다. 일부 구현예에서, 보존된 표적 에피토프는 서열 정렬 및 분석에서 확인된 35개의 가장 보존된 에피토프(이의 에피토프 유형에 대해, 예를 들어, B 세포, CD4 T 세포, CD8 T 세포) 중 하나인 것이다. 일부 구현예에서, 보존된 표적 에피토프는 서열 정렬 및 분석에서 확인된 40개의 가장 보존된 에피토프(이의 에피토프 유형에 대해, 예를 들어, B 세포, CD4 T 세포, CD8 T 세포) 중 하나인 것이다. 일부 구현예에서, 보존된 표적 에피토프는 서열 정렬 및 분석에서 확인된 50개의 가장 보존된 에피토프(이의 에피토프 유형에 대해, 예를 들어, B 세포, CD4 T 세포, CD8 T 세포) 중 하나인 것이다. 서열 정렬 및 분석의 예는 본 명세서에 기재되어 있다. 예를 들어, 보존된 큰 서열을 선택하거나 확인하기 위한 단계 또는 방법은 먼저 서열 정렬 및 특정 수의 코로나바이러스 서열의 분석을 수행하여 분석된 서열 그룹 간의 서열 유사성 또는 동일성을 결정하는 것을 포함할 수 있다. 일부 구현예에서, 정렬에 사용되는 서열은 인간 및 동물 서열을 포함할 수 있다. 특정 구현예에서, 정렬에 사용되는 서열은 현재 순환 중인 하나 이상의 SARS-CoV-2 인간 균주 또는 변이체; 이전 인간 발병을 일으킨 하나 이상의 코로나바이러스; 박쥐, 천산갑, 사향고양이, 밍크, 낙타, 및 코로나바이러스에 수용적인 다른 동물로 이루어진 군으로부터 선택된 동물로부터 단리된 하나 이상의 코로나바이러스; 및/또는 보통 감기를 유발하는 하나 이상의 코로나바이러스 중 하나 이상으로부터 유래된다. 일부 구현예에서, 보존된 큰 서열은 서열 정렬 및 특정 수의 코로나바이러스 서열의 분석을 수행하여 분석된 서열의 그룹 간의 서열 유사성 또는 동일성을 결정함으로써 확인된다. 보존된 큰 서열은 분석에서 확인된 가장 고도로 보존된 서열 중 하나이다. 예를 들어, 보존된 큰 서열은 확인된 2개의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 확인된 5개의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 확인된 8개의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 확인된 10개의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 확인된 15개의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 확인된 20개의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 확인된 30개의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 확인된 40개의 가장 고도로 보존된 서열일 수 있다. 본 발명은 전술한 역치에 제한되지 않는다. 일부 구현예에서, 50개 이상의 서열, 100개 이상의 서열, 200개 이상의 서열, 300개 이상의 서열, 400개 이상의 서열, 500개 이상의 서열, 1000개 이상의 서열, 2000개 이상의 서열, 3000개 이상의 서열, 4000개 이상의 서열, 5000개 이상의 서열, 10,000개 이상의 서열, 15,00개 이상의 서열, 15,000개 초과의 서열, 등에 대한 정렬 및 분석. 일부 구현예에서, 정렬에 사용되는 서열은 인간 및 동물 서열을 포함할 수 있다. 특정 구현예에서, 정렬에 사용되는 서열은 현재 순환 중인 하나 이상의 SARS-CoV-2 인간 균주 또는 변이체; 이전 인간 발병을 일으킨 하나 이상의 코로나바이러스; 박쥐, 천산갑, 사향고양이, 밍크, 낙타, 및 코로나바이러스에 수용적인 다른 동물로 이루어진 군으로부터 선택된 동물로부터 단리된 하나 이상의 코로나바이러스; 및/또는 보통 감기를 유발하는 하나 이상의 코로나바이러스 중 하나 이상으로부터 유래된다. 일부 구현예에서, 현재 순환 중인 하나 이상의 SARS-CoV-2 인간 균주 또는 변이체는 균주 B.1.177; 균주 B.1.160, 균주 B.1.1.7; 균주 B.1.351; 균주 P.1; 균주 B.1.427/B.1.429; 균주 B.1.258; 균주 B.1.221; 균주 B.1.367; 균주 B.1.1.277; 균주 B.1.1.302; 균주 B.1.525; 균주 B.1.526, 균주 S:677H, 및 균주 S:677P로부터 선택된다. 일부 구현예에서, 보통 감기를 유발하는 하나 이상의 코로나바이러스는 하기로부터 선택된다: 229E 알파 코로나바이러스, NL63 알파 코로나바이러스, OC43 베타 코로나바이러스 및 HKU1 베타 코로나바이러스. 본원에서 논의된 바와 같이, 표적 에피토프를 포함하는 1개 이상의 보존된 큰 서열은 인간 및 동물 코로나바이러스 중에서 고도로 보존되어 있다. 본 명세서의 임의의 구현예에 대해, 선택된 에피토프는 결합 검정(예를 들어, HLA 분자에 대한 결합에 대해)에서 특정 점수를 달성하는 에피토프일 수 있다.
특정 구현예에서, 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프는 스파이크 당단백질, 외피 단백질, ORF1ab 단백질, ORF7a 단백질, ORF8a 단백질, ORF10 단백질, 또는 이들의 조합으로부터 선택된다. 특정 구현예에서, 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프는 S2-10, S1220-1228, S1000-1008, S958-966, E20-28, ORF1ab1675 -1683, ORF1ab2363 -2371, ORF1ab3013 -3021, ORF1ab3183 -3191, ORF1ab5470 -5478, ORF1ab6749-6757, ORF7b26 -34, ORF8a73 -81, ORF103 -11, 및 ORF105 -13으로부터 선택된다. 특정 구현예에서, 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프는 서열번호: 2-29로부터 선택된다. 특정 구현예에서, 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프는 서열번호: 30-57로부터 선택된다.
특정 구현예에서, 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프는 스파이크 당단백질, 외피 단백질, 막 단백질, 뉴클레오캡시드 단백질, ORF1a 단백질, ORF1ab 단백질, ORF6 단백질, ORF7a 단백질, ORF7b 단백질, ORF8 단백질, 또는 이들의 조합으로부터 선택된다. 특정 구현예에서, 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프는 ORF1a1350 -1365, ORF1ab5019 -5033, ORF612 -26, ORF1ab6088 -6102, ORF1ab6420 -6434, ORF1a1801 -1815, S1-13, E26-40, E20-34, M176-190, N388-403, ORF7a3 -17, ORF7a1-15, ORF7b8 -22, ORF7a98 -112, 및 ORF81 - 15으로부터 선택된다. 특정 구현예에서, 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프는 서열번호: 58-73으로부터 선택된다. 특정 구현예에서, 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프는 서열번호: 74-105로부터 선택된다.
특정 구현예에서, 하나 이상의 보존된 코로나바이러스 B 세포 표적 에피토프는 스파이크 당단백질로부터 선택된다. 특정 구현예에서, 하나 이상의 보존된 코로나바이러스 B 세포 표적 에피토프는 S287-317, S524-598, S601-640, S802-819, S888-909, S369-393, S440-501, S1133-1172, S329-363, 및 S13-37로부터 선택된다. 특정 구현예에서, 하나 이상의 코로나바이러스 B 세포 표적 에피토프는 서열번호: 106-116으로부터 선택된다. 특정 구현예에서, 하나 이상의 코로나바이러스 B 세포 표적 에피토프는 서열번호: 117-138로부터 선택된다.
이전에 논의된 바와 같이, 특정 구현예에서, 하나 이상의 보존된 코로나바이러스 B 세포 표적 에피토프는 큰 서열, 예를 들어 전체 스파이크 단백질 또는 부분 스파이크 단백질(예를 들어, 전체 스파이크 단백질의 일부)의 형태이다. 일부 구현예에서, 전체 스파이크 단백질 또는 이의 일부는 안정화된 형태로 존재한다. 특정 구현예에서, 스파이크 단백질 (또는 이의 일부)의 막횡단 앵커는 온전한 S1-S2 절단 부위를 갖는다. 특정 구현예에서, 스파이크 당단백질은 예를 들어 안정화를 위해 아미노산 위치 986 및 987에서 2개의 연속적인 프롤린 치환을 갖는다. 특정 구현예에서, 스파이크 단백질 또는 이의 일부는 아미노산 위치 Tyr-83에서 아미노산 치환을 갖는다. 특정 구현예에서, 스파이크 단백질 또는 이의 일부는 아미노산 위치 Tyr-489에서 아미노산 치환을 갖는다. 특정 구현예에서, 스파이크 단백질 또는 이의 일부는 아미노산 위치 Gln-24에서 아미노산 치환을 갖는다. 특정 구현예에서, 스파이크 단백질 또는 이의 일부는 아미노산 위치 Asn-487에서 아미노산 치환을 갖는다. 특정 구현예에서, 스파이크 단백질 또는 이의 일부는 Tyr-83, Tyr-489, Gln-24, Gln-493, 및 Asn-487 중 하나 이상에서 아미노산 치환을 가지며, 예를 들어, 스파이크 단백질 또는 이의 일부는 Tyr-489 및 Asn-487을 포함할 수 있고, 스파이크 단백질 또는 이의 일부는 Gln-493을 포함할 수 있고, 스파이크 단백질 또는 이의 일부는 Tyr-505를 포함할 수 있다. Tyr-489 및 Asn-487은 ACE-2 상의 Tyr 83 및 Gln-24와의 상호작용에 도움이 될 수 있다. Gln-493은 ACE-2 상의 Glu-35 및 Lys-31과의 상호작용에 도움이 될 수 있다. Tyr-505는 ACE-2 상의 Glu-37 및 Arg-393과의 상호 작용에 도움이 될 수 있다.
특정 구현예에서, 조성물은 S1-S2 절단 부위에 돌연변이 682-RRAR-685 → 682-QQAQ-685를 포함한다. 특정 구현예에서, 조성물은 적어도 1개의 프롤린 치환을 포함한다. 특정 구현예에서, 조성물은 예를 들어 위치 K986 및 V987에서 적어도 2개의 프롤린 치환을 포함한다.
특정 구현예에서, 스파이크 당단백질로부터 유래된 큰 서열은 RBD이다. 특정 구현예에서, 스파이크 당단백질로부터 유래된 큰 서열은 NTD이다. 특정 구현예에서, 스파이크 당단백질로부터 유래된 큰 서열은 예를 들어 RBD 및 NTD 영역 둘 다를 포함하는 1개 이상의 큰 서열이다. 특정 구현예에서, 스파이크 당단백질로부터 유래된 큰 서열은 항체를 중화 및 차단함으로써 인식된다. 특정 구현예에서, 스파이크 당단백질로부터 유래된 큰 서열은 항체의 중화 및 차단을 유도한다. 특정 구현예에서, 스파이크 당단백질로부터 유래된 큰 서열은 바이러스를 인식하고 중화하는 항체의 중화 및 차단을 유도한다. 특정 구현예에서, 스파이크 당단백질로부터 유래된 큰 서열은 스파이크 단백질을 인식하는 항체의 중화 및 차단을 유도한다.
특정 구현예에서, 링커는 예를 들어 에피토프 사이, 큰 서열 사이 등에 사용된다. 특정 구현예에서, 링커는 그 길이가 2 내지 10개의 아미노산이다. 특정 구현예에서, 링커는 그 길이가 3 내지 12개의 아미노산이다. 특정 구현예에서, 링커는 그 길이가 5 내지 15개의 아미노산이다. 특정 구현예에서, 링커는 그 길이가 10개 이상의 아미노산이다. 링커의 비제한적인 예는 AAY, KK, 및 GPGPG(서열번호: 186)를 포함한다.
일부 구현예에서, 조성물은 T4 피브리틴 유래 폴돈 삼량체화 도메인의 부가를 포함한다. 일부 구현예에서, T4 피브리틴 유래 폴돈 삼량체화 도메인의 부가는 다가 디스플레이에 의해 면역원성을 증가시킨다.
특정 구현예에서, 조성물은 T 세포 유인 케모카인을 추가로 포함한다. 예를 들어, 조성물은 CCL5, CXCL9, CXCL10, CXCL11, 또는 이들의 조합 중 하나 또는 조합을 추가로 포함할 수 있다.
특정 구현예에서, 조성물은 T 세포 증식을 촉진하는 조성물을 추가로 포함한다. 예를 들어, 조성물은 IL-7, IL-15, IL-2, 또는 이들의 조합을 추가로 포함할 수 있다.
특정 구현예에서, 조성물은 분자 보조제를 추가로 포함한다. 예를 들어, 조성물은 CpG(예를 들어, CpG 중합체) 또는 플라젤린 중 하나 또는 이들의 조합을 추가로 포함할 수 있다.
특정 구현예에서, 조성물은 태그를 포함한다. 예를 들어, 큰 서열 중 1개 이상은 태그를 포함할 수 있다. 특정 구현예에서, 에피토프는 2개 이상의 항원 형태이고, 항원 중 1개 이상은 태그를 포함한다. 태그의 비제한적인 예는 His 태그를 포함한다.
특정 구현예에서, "항원 전달 시스템"은 2개의 전달 시스템을 지칭할 수 있으며, 예를 들어, 큰 서열의 일부 (또는 케모카인 등과 같은 다른 성분)는 하나의 전달 시스템에 의해 인코딩될 수 있고, 큰 서열의 일부 (또는 다른 구성요소)는 제2 전달 시스템 (또는 제3 전달 시스템 등)에 의해 인코딩될 수 있다.
항원 전달 시스템과 관련하여, 특정 구현예에서 항원 전달 시스템은 수포성 구내염 바이러스(VSV) 벡터이다. 특정 구현예에서, 항원 전달 시스템은 아데노바이러스(예를 들어, Ad26, Ad5, Ad35 등)이다.
큰 서열은 프로모터에 작동적으로 연결된다. 특정 구현예에서, 프로모터는 일반 프로모터(예를 들어, CMV, CAG 등)이다. 특정 구현예에서, 프로모터는 폐 특이적 프로모터(예를 들어, SpB, CD144)이다. 특정 구현예에서, 큰 서열은 동일한 프로모터에 작동적으로 연결된다. 특정 구현예에서, 큰 서열 중 1개 이상은 제1 프로모터에 작동적으로 연결되고 1개 이상의 큰 서열은 제2 프로모터에 작동적으로 연결된다. 특정 구현예에서, 큰 서열은 2개 이상의 프로모터에 작동적으로 연결되고, 예를 들어, 일부는 제1 프로모터에 작동적으로 연결되고, 일부는 제2 프로모터에 작동적으로 연결된다. 특정 구현예에서, 큰 서열은 3개 이상의 프로모터에 작동적으로 연결되고, 예를 들어, 일부는 제1 프로모터에 작동적으로 연결되고, 일부는 제2 프로모터에 작동적으로 연결되고, 일부는 제3 프로모터에 작동적으로 연결된다. 특정 구현예에서, 제1 프로모터는 제2 프로모터와 동일하다. 특정 구현예에서, 제2 프로모터는 제1 프로모터와 상이하다. 특정 구현예에서, 프로모터는 일반 프로모터(예를 들어, CMV, CAG 등)이다. 특정 구현예에서, 프로모터는 폐 특이적 프로모터(예를 들어, SpB, CD144) 프로모터이다.
특정 구현예에서, 항원 전달 시스템 또는 별도의 항원 전달 시스템은 T 세포 유인 케모카인을 인코딩한다. 특정 구현예에서, 항원 전달 시스템 또는 별도의 항원 전달 시스템은 T 세포 증식을 촉진하는 조성물을 인코딩한다. 특정 구현예에서, 항원 전달 시스템 또는 별도의 항원 전달 시스템은 T 세포 유인 케모카인 및 T 세포 증식을 촉진하는 조성물 둘 다를 인코딩한다. 특정 구현예에서, 항원 전달 시스템 또는 별도의 항원 전달 시스템은 분자 보조제를 인코딩한다. 특정 구현예에서, 항원 전달 시스템 또는 별도의 항원 전달 시스템은 T 세포 유인 케모카인, T 세포 증식을 촉진하는 조성물 및 분자 보조제를 인코딩한다. 특정 구현예에서, 항원 전달 시스템 또는 별도의 항원 전달 시스템은 T 세포 유인 케모카인 및 분자 보조제를 인코딩한다. 일부 구현예에서, 항원 전달 시스템 또는 별도의 항원 전달 시스템은 T 세포 증식을 촉진하는 조성물 및 분자 보조제를 인코딩한다.
특정 구현예에서, T 세포 유인 케모카인은 CCL5, CXCL9, CXCL10, CXCL11, 또는 이들의 조합이다. 특정 구현예에서, T 세포 증식을 촉진하는 조성물은 IL-7 또는 IL-15 또는 IL-2이다. 일부 구현예에서, 분자 보조제는 CpG(예를 들어, CpG 중합체), 플라젤린 등)이다.
특정 구현예에서, T 세포 유인 케모카인은 폐 특이적 프로모터(예를 들어, SpB, CD144)에 작동적으로 연결된다. 특정 구현예에서, T 세포 유인 케모카인은 일반 프로모터(예를 들어, CMV, CAG 등)에 작동적으로 연결된다. 특정 구현예에서, T 세포 증식을 촉진하는 조성물은 폐 특이적 프로모터(예를 들어, SpB, CD144)에 작동적으로 연결된다. 특정 구현예에서, T 세포 증식을 촉진하는 조성물은 일반 프로모터(예를 들어, CMV, CAG 등)에 작동적으로 연결된다. 특정 구현예에서, 분자 보조제는 폐 특이적 프로모터(예를 들어, SpB, CD144)에 작동적으로 연결된다. 특정 구현예에서, 분자 보조제는 일반 프로모터(예를 들어, CMV, CAG 등)에 작동적으로 연결된다. 특정 구현예에서, T 세포 유인 케모카인 및 T 세포 증식을 촉진하는 조성물은 동일한 프로모터에 의해 구동된다. 특정 구현예에서, T 세포 유인 케모카인 및 T 세포 증식을 촉진하는 조성물은 상이한 프로모터에 의해 구동된다. 특정 구현예에서, 분자 보조제, T 세포 유인 케모카인, 및 T 세포 증식을 촉진하는 조성물은 동일한 프로모터에 의해 구동된다. 특정 구현예에서, 분자 보조제, T 세포 유인 케모카인, 및 T 세포 증식을 촉진하는 조성물은 상이한 프로모터에 의해 구동된다. 특정 구현예에서, 분자 보조제 및 T 세포 증식을 촉진하는 조성물은 상이한 프로모터에 의해 구동된다. 특정 구현예에서, 분자 보조제 및 T 세포 유인 케모카인은 상이한 프로모터에 의해 구동된다.
특정 구현예에서, T 세포 유인 케모카인 및 T 세포 증식을 촉진하는 조성물은 링커에 의해 분리된다. 특정 구현예에서, 링커는 T2A를 포함한다. 특정 구현예에서, 링커는 E2A를 포함한다. 특정 구현예에서, 링커는 P2A를 포함한다. 특정 구현예에서, 링커는 T2A, E2A, 및 P2A로부터 선택된다.
항원 전달 시스템과 관련하여, 특정 구현예에서, 링커는 각각의 열린 해독틀 사이에 배치된다. 특정 구현예에서, 상이한 링커는 각각의 열린 해독틀 사이에 배치된다. 특정 구현예에서, 특정 열린 해독틀 사이에 동일한 링커가 사용될 수 있고 다른 열린 해독틀 사이에 상이한 링커가 사용될 수 있다.
일부 구현예에서, 백신 조성물은 아데노바이러스를 사용하여 투여된다.
본 명세서의 조성물은 대상체에서 코로나바이러스 질환을 예방하기 위해 사용될 수 있다. 본 발명의 조성물은 대상체에서 코로나바이러스 감염을 예방적으로 방지하기 위해 사용될 수 있다. 본 명세서의 조성물은 대상체에서 면역 반응을 유도하기 위해 사용될 수 있다. 본 명세서에서 "대상체"라는 용어는 인간, 비-인간 영장류, 마우스, 쥐, 고양이, 개와 같은 동물, 코로나바이러스 감염에 걸리기 쉬운 기타 동물, 또는 전임상 모델링에 사용되는 기타 동물을 지칭할 수 있다. 본 명세서의 조성물은 범-코로나바이러스 재조합 백신 조성물에 의해 유도된 면역 반응을 연장하고 폐로의 T-세포 이동을 증가시킬 수 있다. 특정 구현예에서, 조성물은 상주 기억 T 세포(Trm)를 유도한다. 일부 구현예에서, 백신 조성물은 코로나바이러스 질환 또는 감염에 대해 효율적이고 강력한 보호를 유도한다. 일부 구현예에서, 백신 조성물은 항체(Abs), CD4+ T 헬퍼(Th1) 세포, 및 CD8+ 세포독성 T-세포(CTL)의 생산을 유도한다. 일부 구현예에서, T 세포 증식을 촉진하는 조성물은 장기간 면역을 촉진하는 데 도움이 된다. 일부 구현예에서, T-세포 유인 케모카인은 순환에서 폐로 T-세포를 끌어당기는 것을 돕는다.
특정 구현예에서, 조성물은 약제학적 담체를 추가로 포함한다.
본 발명은 본 명세서에 기재된 임의의 백신 조성물, 예를 들어 나노입자, 예를 들어 지질 나노입자와 함께 전달하기 위한 전술한 백신 조성물을 포함한다. 예를 들어, 본 발명은 지질 나노입자에 캡슐화된 본 명세서의 백신 조성물을 포함한다.
본 발명은 삼량체화된 SARS-CoV-2 수용체 결합 도메인(RBD) 및 구조적 단백질 (예를 들어, 핵단백질, 등) 및 비-구조적 단백질 (예를 들어, Nsp4, 등)로부터 선택된 하나 이상의 고도로 보존된 SARS-CoV-2 서열을 포함하고/하거나 이를 인코딩하는 본 명세서에 기재된 조성물을 포함한다. 일부 구현예에서, 삼량체화된 SARS-CoV-2 수용체 결합 도메인(RBD) 서열은 T4 피브리틴 유래 폴돈 삼량체화 도메인의 부가에 의해 변형된다. 일부 구현예에서, T4 피브리틴 유래 폴돈 삼량체화 도메인의 부가는 다가 디스플레이에 의해 면역원성을 증가시킨다.
본 발명은 또한 본 발명의 범-코로나바이러스 재조합 백신 조성물의 제조 방법을 특징으로 한다.
예를 들어, 일부 구현예에서, 방법은 하나 이상의 코로나바이러스 B-세포 에피토프; 하나 이상의 코로나바이러스 CD4+ T 세포 에피토프; 하나 이상의 코로나바이러스 CD8+ T 세포 에피토프를 포함하는 보존된 큰 서열을 적어도 선택하는 것을 포함한다. 다른 구현예에서, 방법은 하나 이상의 코로나바이러스 B-세포 에피토프; 하나 이상의 코로나바이러스 CD4+ T 세포 에피토프; 하나 이상의 코로나바이러스 CD8+ T 세포 에피토프를 포함하는 보존된 큰 서열 중 적어도 2개를 선택하는 것을 포함한다. 적어도 하나의 큰 서열은 비-스파이크 단백질에서 유래된다. 방법은 선택된 큰 서열을 포함하는 항원 또는 항원들을 합성하는 단계를 추가로 포함한다. 일부 구현예에서, 방법은 하나 이상의 코로나바이러스 B-세포 에피토프; 하나 이상의 코로나바이러스 CD4+ T 세포 에피토프; 및 하나 이상의 코로나바이러스 CD8+ T 세포 에피토프를 포함하는 1개 이상의 보존된 큰 서열을 선택하는 것을 포함한다. 적어도 하나의 큰 서열은 비-스파이크 단백질에서 유래된다. 방법은 선택된 큰 서열을 포함하는 항원 또는 항원들을 합성하는 단계를 추가로 포함한다. 일부 구현예에서, 방법은 백신 조성물을 약제학적 담체에 도입하는 것을 추가로 포함한다. 1개 이상의 보존된 큰 서열을 선택하는 단계가 본 명세서에 개시되어 있다. 재조합 단백질을 합성하는 방법은 당업자에게 잘 알려져 있다. 백신 조성물은 본 명세서에 개시되어 있다. 일부 구현예에서, 백신 조성물은 DNA, RNA, 변형된 RNA, 단백질 (또는 펩티드), 또는 이들의 조합의 형태이다.
일부 구현예에서, 방법은 하나 이상의 코로나바이러스 B-세포 에피토프; 하나 이상의 코로나바이러스 CD4+ T 세포 에피토프; 및 하나 이상의 코로나바이러스 CD8+ T 세포 에피토프를 포함하는 적어도 1개의 보존된 큰 서열을 선택하는 것을 포함한다. 적어도 하나의 큰 서열은 비-스파이크 단백질에서 유래된다. 방법은 선택된 큰 서열을 인코딩하는 항원 전달 시스템을 합성하는 단계를 추가로 포함한다. 일부 구현예에서, 방법은 백신 조성물을 약제학적 담체에 도입하는 것을 추가로 포함한다. 1개 이상의 보존된 큰 서열을 선택하는 단계가 본 명세서에 개시되어 있다. 항원 전달 시스템을 합성하는 방법은 당업자에게 잘 알려져 있다. 백신 조성물은 본 명세서에 개시되어 있다. 일부 구현예에서, 백신 조성물은 DNA, RNA, 변형된 RNA, 단백질 (또는 펩티드), 또는 이들의 조합의 형태이다.
예로서, 보존된 큰 서열을 선택하거나 확인하기 위한 단계 또는 방법은 먼저 서열 정렬 및 특정 수의 코로나바이러스 서열, 예를 들어, 50개 이상의 서열, 100개 이상의 서열, 200개 이상의 서열, 300개 이상의 서열, 400개 이상의 서열, 500개 이상의 서열, 1000개 이상의 서열, 2000개 이상의 서열, 3000개 이상의 서열, 4000개 이상의 서열, 5000개 이상의 서열, 10,000개 이상의 서열, 15,00개 이상의 서열, 15,000개 초과의 서열 등의 분석을 수행하여 분석된 서열 그룹 간의 서열 유사성 또는 동일성을 결정한다. 일부 구현예에서, 정렬에 사용되는 서열은 인간 및 동물 서열을 포함할 수 있다. 특정 구현예에서, 정렬에 사용되는 서열은 현재 순환 중인 하나 이상의 SARS-CoV-2 인간 균주 또는 변이체; 이전 인간 발병을 일으킨 하나 이상의 코로나바이러스; 박쥐, 천산갑, 사향고양이, 밍크, 낙타, 및 코로나바이러스에 수용적인 다른 동물로 이루어진 군으로부터 선택된 동물로부터 단리된 하나 이상의 코로나바이러스; 및/또는 보통 감기를 유발하는 하나 이상의 코로나바이러스 중 하나 이상으로부터 유래된다. 일부 구현예에서, 현재 순환 중인 하나 이상의 SARS-CoV-2 인간 균주 또는 변이체는 균주 B.1.177; 균주 B.1.160, 균주 B.1.1.7; 균주 B.1.351; 균주 P.1; 균주 B.1.427/B.1.429; 균주 B.1.258; 균주 B.1.221; 균주 B.1.367; 균주 B.1.1.277; 균주 B.1.1.302; 균주 B.1.525; 균주 B.1.526, 균주 S:677H, 및 균주 S:677P로부터 선택된다. 일부 구현예에서, 보통 감기를 유발하는 하나 이상의 코로나바이러스는 하기로부터 선택된다: 229E 알파 코로나바이러스, NL63 알파 코로나바이러스, OC43 베타 코로나바이러스 및 HKU1 베타 코로나바이러스. 일부 구현예에서, 보존된 큰 서열은 정렬에서 확인된 큰 서열의 가장 고도로 보존된 2개의 서열로 간주될 수 있다. 일부 구현예에서, 보존된 큰 서열은 정렬에서 확인된 큰 서열의 가장 고도로 보존된 5개의 서열로 간주될 수 있다. 일부 구현예에서, 보존된 큰 서열은 정렬에서 확인된 큰 서열의 가장 고도로 보존된 10개의 서열로 간주될 수 있다. 일부 구현예에서, 보존된 큰 서열은 정렬에서 확인된 큰 서열의 가장 고도로 보존된 15개의 서열로 간주될 수 있다.
본 발명은 또한 코로나바이러스 질환을 예방하는 방법을 특징으로 한다. 이 방법은 대상체에게 본 발명에 따른 범-코로나바이러스 재조합 백신 조성물의 치료적 유효량을 투여하는 것을 포함하며, 조성물은 대상체에서 면역 반응을 유도하고 코로나바이러스 질환을 예방하는 데 도움이 된다.
본 발명은 또한 대상체에서 코로나바이러스 감염을 예방적으로 방지하는 방법을 특징으로 한다. 일부 구현예에서, 방법은 본 발명에 따른 범-코로나바이러스 재조합 백신 조성물의 예방적 유효량을 대상체에게 투여하는 것을 포함하며, 백신 조성물은 코로나바이러스 감염을 예방한다.
본 발명은 또한 본 발명에 따른 조성물을 대상체에게 투여하는 것을 포함하는, 대상체에서 면역 반응을 유도하는 방법을 특징으로 하며, 백신 조성물은 대상체에서 면역 반응을 유도한다. 본 발명은 또한 본 발명에 따른 범-코로나바이러스 재조합 백신 조성물을 대상체에게 투여하는 것을 포함하는 방법을 특징으로 하며, 조성물은 바이러스는 복제되는 폐, 뇌 및 다른 구획에서 바이러스 복제를 방지한다. 본 발명은 또한 본 발명에 따른 범-코로나바이러스 재조합 백신 조성물을 대상체에게 투여하는 것을 포함하는 방법을 특징으로 하며, 조성물은 바이러스는 복제되는 폐, 뇌 및 다른 구획에서 사이토카인 폭풍을 방지한다. 본 발명은 또한 본 발명에 따른 범-코로나바이러스 재조합 백신 조성물을 대상체에게 투여하는 것을 포함하는 방법을 특징으로 하며, 조성물은 바이러스는 복제되는 폐, 뇌 및 다른 구획에서 염증 또는 염증 반응을 방지한다. 본 발명은 또한 본 발명에 따른 범-코로나바이러스 재조합 백신 조성물을 대상체에게 투여하는 것을 포함하는 방법을 특징으로 하며, 조성물은 바이러스는 복제되는 폐, 뇌 및 다른 구획에서 T 세포의 귀소 및 체류를 개선한다. 본 발명은 또한 대상체에서 코로나바이러스 질환을 예방하는 방법을 특징으로 하며; 방법은 본 발명에 따른 범-코로나바이러스 재조합 백신 조성물을 대상체에게 투여하는 것을 포함하며, 조성물은 기억 B 및 T 세포를 유도한다. 본 발명은 또한 범-코로나바이러스 재조합 백신에 의해 유도된 면역 반응을 연장하고 폐로의 T-세포 이동을 증가시키는 방법을 특징으로 하며, 방법은 T-세포 유인 케모카인, T 세포 증식을 촉진하는 조성물, 및 본 발명에 따른 범-코로나바이러스 재조합 백신을 동시 발현시키는 것을 포함한다. 본 발명은 또한 범-코로나바이러스 백신에 의해 유도된 폐로의 기억 T 세포의 체류를 연장하고 바이러스 특이적 조직 상주 기억 T-세포(TRM 세포)를 증가시키는 방법을 특징으로 하며, T-세포 유인 케모카인, T 세포 증식을 촉진하는 조성물, 및 본 발명에 따른 범-코로나바이러스 재조합 백신을 동시 발현시키는 것을 포함한다. 본 발명은 또한 본 발명에 따른 범-코로나바이러스 재조합 백신 조성물을 대상체에게 투여하는 것을 포함하는 방법을 특징으로 하며, 조성물은 코로나바이러스의 돌연변이 및 변이체의 발달을 예방한다.
간결함을 위해, 앞서 언급된 방법에서 언급된 백신 조성물은 이전에 논의된 백신 조성물, 하기에 기재된 구현예, 및 도면의 구현예를 포함한다는 점에 유의한다.
일부 구현예에서, 백신 조성물은 정맥내 경로(i.v.), 비강내 경로(i.n.), 또는 설하 경로(s.l.)를 통해 투여된다.
일부 구현예에서, 백신 조성물은 아데노바이러스 또는 다른 적절한 전달 시스템을 사용하여 투여된다.
이전에 논의된 바와 같이, 본 명세서의 조성물은 대상체에서 코로나바이러스 질환을 예방하기 위해 사용될 수 있다. 본 발명의 조성물은 대상체에서 코로나바이러스 감염을 예방적으로 방지하기 위해 사용될 수 있다. 본 명세서의 조성물은 대상체에서 면역 반응을 유도하기 위해 사용될 수 있다. 본 명세서에서 "대상체"라는 용어는 인간, 비-인간 영장류, 마우스, 쥐, 고양이, 개와 같은 동물, 코로나바이러스 감염에 걸리기 쉬운 기타 동물, 또는 전임상 모델링에 사용되는 기타 동물을 지칭할 수 있다. 본 명세서의 조성물은 범-코로나바이러스 재조합 백신 조성물에 의해 유도된 면역 반응을 연장하고 폐로의 T-세포 이동을 증가시킬 수 있다. 특정 구현예에서, 조성물은 상주 기억 T 세포(Trm)를 유도한다. 일부 구현예에서, 백신 조성물은 코로나바이러스 질환 또는 감염에 대해 효율적이고 강력한 보호를 유도한다. 일부 구현예에서, 백신 조성물은 항체(Abs), CD4+ T 헬퍼(Th1) 세포, 및 CD8+ 세포독성 T-세포(CTL)의 생산을 유도한다. 일부 구현예에서, T 세포 증식을 촉진하는 조성물은 장기간 면역을 촉진하는 데 도움이 된다. 일부 구현예에서, T-세포 유인 케모카인은 순환에서 폐로 T-세포를 끌어당기는 것을 돕는다.
본 발명은 또한 올리고뉴클레오티드 조성물을 특징으로 한다. 예를 들어, 본 발명은 서열 목록에 개시된 올리고뉴클레오티드를 포함한다. 본 발명은 또한 항원 전달 시스템 형태의 올리고뉴클레오티드를 포함한다. 본 발명은 또한 본 명세서에 개시된 보존된 큰 서열을 인코딩하는 올리고뉴클레오티드를 포함한다. 본 발명은 또한 본 발명에 따른 임의의 백신 조성물을 인코딩하는 하나 이상의 올리고뉴클레오티드를 포함하는 올리고뉴클레오티드 조성물을 포함한다. 일부 구현예에서, 올리고뉴클레오티드는 DNA를 포함한다. 일부 구현예에서, 올리고뉴클레오티드는 변형된 DNA를 포함한다. 일부 구현예에서, 올리고뉴클레오티드는 RNA를 포함한다. 일부 구현예에서, 올리고뉴클레오티드는 변형된 RNA를 포함한다. 일부 구현예에서, 올리고뉴클레오티드는 mRNA를 포함한다. 일부 구현예에서, 올리고뉴클레오티드는 변형된 mRNA를 포함한다.
본 발명은 또한 펩티드 조성물을 특징으로 한다. 예를 들어, 본 발명은 서열 목록에 개시된 펩티드를 포함한다. 본 발명은 또한 본 발명에 따른 임의의 백신 조성물을 포함하는 펩티드 조성물을 포함한다. 본 발명은 또한 본 발명에 따른 보존된 큰 서열 중 임의의 것을 포함하는 펩티드 조성물을 포함한다.
간결함을 위해, 앞서 언급된 올리고뉴클레오티드 및 펩티드 조성물에서 언급된 백신 조성물은 이전에 논의된 백신 조성물, 하기에 기재된 구현예, 및 도면의 구현예를 포함한다는 점에 유의한다.
본 발명은 또한 서열번호: 139-147(표 9)을 포함하는 범-코로나바이러스 재조합 백신 조성물을 특징으로 한다.
본 발명은 또한 서열번호: 139-147(표 9)과 적어도 99% 동일한 범-코로나바이러스 재조합 백신 조성물을 특징으로 한다.
본 발명은 또한 제1 전달 시스템을 사용하여 제1 범-코로나바이러스 재조합 백신 용량을 투여하는 단계, 및 제2 전달 시스템을 사용하여 제2 백신 용량을 투여하는 단계를 포함하는 방법을 특징으로 하며, 제1 및 제2 전달 시스템은 상이하다. 일부 구현예에서, 제1 전달 시스템은 RNA, 변형된 mRNA, 또는 펩티드 전달 시스템을 포함할 수 있다. 일부 구현예에서, 제2 전달 시스템은 RNA, 변형된 mRNA, 또는 펩티드 전달 시스템을 포함할 수 있다. 일부 구현예에서, 펩티드 전달 시스템은 아데노바이러스이다. 일부 구현예에서, 아데노바이러스 전달 시스템은 Ad26, Ad5, Ad35, 또는 이들의 조합이다. 일부 구현예에서, 펩티드 전달 시스템은 수포성 구내염 바이러스(VSV) 벡터이다. 일부 구현예에서, 제2 백신 용량은 제1 백신 용량 후 14일에 투여된다.
본 발명은 또한 본 발명에 따른 범-코로나바이러스 재조합 백신 조성물을 투여하는 단계; 및 범-코로나바이러스 재조합 백신 조성물을 투여한 후 적어도 하나의 T-세포 유인 케모카인을 투여하는 단계를 포함하는 방법을 특징으로 한다. 일부 구현예에서, 백신 조성물은 RNA, 변형된 mRNA, 또는 펩티드 전달 시스템을 통해 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 RNA, 변형된 mRNA, 또는 펩티드 전달 시스템을 통해 투여된다. 일부 구현예에서, 펩티드 전달 시스템은 아데노바이러스이다. 일부 구현예에서, 아데노바이러스 전달 시스템은 Ad26, Ad5, Ad35, 또는 이들의 조합이다. 일부 구현예에서, 펩티드 전달 시스템은 수포성 구내염 바이러스(VSV) 벡터이다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물의 투여 후 8일에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물의 투여 후 14일에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물의 투여 후 30일에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 CCL5, CXCL9, CXCL10, CXCL11, 또는 이들의 조합이다.
본 발명은 또한 본 발명에 따른 범-코로나바이러스 재조합 백신 조성물을 투여하는 단계; 범-코로나바이러스 재조합 백신 조성물을 투여한 후 적어도 하나의 T-세포 유인 케모카인을 투여하는 단계; 및 T-세포 유인 케모카인을 투여한 후 적어도 하나의 사이토카인을 투여하는 단계를 포함하는 방법을 특징으로 한다. 일부 구현예에서, 백신 조성물은 RNA, 변형된 mRNA, 또는 펩티드 전달 시스템을 통해 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 RNA, 변형된 mRNA, 또는 펩티드 전달 시스템을 통해 투여된다. 일부 구현예에서, 사이토카인은 RNA, 변형된 mRNA, 또는 펩티드 전달 시스템을 통해 투여된다. 일부 구현예에서, 펩티드 전달 시스템은 아데노바이러스이다. 일부 구현예에서, 아데노바이러스 전달 시스템은 Ad26, Ad5, Ad35, 또는 이들의 조합이다. 일부 구현예에서, 펩티드 전달 시스템은 수포성 구내염 바이러스(VSV) 벡터이다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물의 투여 후 14일에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 CCL5, CXCL9, CXCL10, CXCL11, 또는 이들의 조합이다. 일부 구현예에서, 사이토카인은 T-세포 유인 케모카인의 투여 후 10일에 투여된다. 일부 구현예에서, 사이토카인은 IL-7, IL-15, IL2 또는 이들의 조합이다.
본 발명은 또한 본 발명에 따른 범-코로나바이러스 재조합 백신 조성물을 투여하는 단계; 범-코로나바이러스 재조합 백신 조성물을 투여한 후 하나 이상의 T-세포 유인 케모카인을 투여하는 단계; 및 하나 이상의 점막 케모카인(들)을 투여하는 단계를 포함하는 방법을 특징으로 한다. 일부 구현예에서, 백신 조성물은 아데노바이러스를 사용하여 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 RNA, 변형된 mRNA, 또는 펩티드 전달 시스템, 또는 다른 전달 시스템을 통해 투여된다. 일부 구현예에서, 점막 케모카인은 RNA, 변형된 mRNA, 또는 펩티드 전달 시스템, 또는 다른 전달 시스템을 통해 투여된다. 일부 구현예에서, 아데노바이러스는 Ad26, Ad5, Ad35, 또는 이들의 조합이다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물의 투여 후 14일에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 CCL5, CXCL9, CXCL10, CXCL11, 또는 이들의 조합이다. 일부 구현예에서, 점막 케모카인은 T-세포 유인 케모카인의 투여 후 10일에 투여된다. 일부 구현예에서, 점막 케모카인은 CCL25, CCL28, CXCL14, 또는 CXCL17, 또는 이들의 조합이다.
간결함을 위해, 앞서 언급된 방법에서 언급된 백신 조성물은 이전에 논의된 백신 조성물, 하기에 기재된 구현예, 및 도면의 구현예를 포함한다는 점에 유의한다.
이전에 논의된 바와 같이, 일부 구현예에서, 백신 조성물은 인간에서 사용하기 위한 것이다. 일부 구현예에서, 백신 조성물은 동물, 예를 들어 고양이, 개 등에 사용하기 위한 것이다. 일부 구현예에서, 백신 조성물은 인간 CXCL-11 및/또는 인간 IL-7 (또는 IL-15, IL-2)을 포함한다. 일부 구현예에서, 백신 조성물은 동물 CLCL-11 및/또는 동물 IL-7 (또는 IL-15, IL-2)을 포함한다.
본 발명은 rVSV-panCoV 백신 조성물 형태의 백신 조성물을 포함한다. 본 발명은 rAdV-panCoV 백신 조성물 형태의 백신 조성물을 포함한다.
본 발명은 또한 본 명세서의 백신 조성물에 사용하기 위한 핵산을 포함한다. 본 발명은 또한 본 명세서의 백신 조성물에 사용하기 위한 벡터를 포함한다. 본 발명은 또한 본 명세서의 백신 조성물에 사용하기 위한 융합 단백질을 포함한다. 본 발명은 또한 본 명세서의 백신 조성물에 사용하기 위한 면역원성 조성물을 포함한다.
본 명세서의 백신 조성물은 18세 내지 55세의 성인에서 높은 수준의 바이러스 차단 및 바이러스 중화 항체뿐만 아니라 CD4+ T 세포 및 CD8+ T 세포 둘 다를 유도하도록 설계될 수 있다. 본 명세서의 백신 조성물은 55세 내지 65세의 성인에서 높은 수준의 바이러스 차단 및 바이러스 중화 항체뿐만 아니라 CD4+ T 세포 및 CD8+ T 세포 둘 다를 유도하도록 설계될 수 있다. 본 명세서의 백신 조성물은 65세 내지 85세의 성인에서 높은 수준의 바이러스 차단 및 바이러스 중화 항체뿐만 아니라 CD4+ T 세포 및 CD8+ T 세포 둘 다를 유도하도록 설계될 수 있다. 본 명세서의 백신 조성물은 85세 내지 100세의 성인에서 높은 수준의 바이러스 차단 및 바이러스 중화 항체뿐만 아니라 CD4+ T 세포 및 CD8+ T 세포 둘 다를 유도하도록 설계될 수 있다. 본 명세서의 백신 조성물은 12세 내지 18세 아동에서 높은 수준의 바이러스 차단 및 바이러스 중화 항체뿐만 아니라 CD4+ T 세포 및 CD8+ T 세포 둘 다를 유도하도록 설계될 수 있다. 본 명세서의 백신 조성물은 12세 미만의 아동에서 높은 수준의 바이러스 차단 및 바이러스 중화 항체뿐만 아니라 CD4+ T 세포 및 CD8+ T 세포 둘 다를 유도하도록 설계될 수 있다.
본 발명은 백신 조성물에 제한되지 않는다. 예를 들어, 특정 구현예에서, 보존된 큰 서열 중 하나 이상은 코로나바이러스를 검출하고/하거나 코로나바이러스 감염을 진단하기 위해 사용된다.
이전에 논의된 바와 같이, 일부 구현예에서, 1개 이상의 보존된 큰 서열은 인간 및 동물 코로나바이러스 중에서 고도로 보존된다. 일부 구현예에서, 보존된 큰 서열은 서열 정렬 및 특정 수의 코로나바이러스 서열의 분석에서 확인된 가장 고도로 보존된 큰 서열 중 하나이다. 예를 들어, 보존된 큰 서열은 확인된 2개의 가장 고도로 보존된 큰 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 확인된 5개의 가장 고도로 보존된 큰 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 확인된 8개의 가장 고도로 보존된 큰 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 확인된 10개의 가장 고도로 보존된 큰 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 확인된 15개의 가장 고도로 보존된 큰 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 확인된 20개의 가장 고도로 보존된 큰 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 확인된 30개의 가장 고도로 보존된 큰 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 확인된 40개의 가장 고도로 보존된 큰 서열일 수 있다. 일부 구현예에서, 1개 이상의 보존된 큰 서열은 확인된 5개의 가장 고도로 보존된 큰 서열은 SARS-CoV-2 단백질 중 적어도 하나로부터 유래될 수 있다. 일부 구현예에서, 1개 이상의 보존된 큰 서열은 확인된 5개의 가장 고도로 보존된 큰 서열은 하기중 하나 이상으로부터 유래된다: 현재 순환 중인 하나 이상의 SARS-CoV-2 인간 균주 또는 변이체; 이전 인간 발병을 일으킨 하나 이상의 코로나바이러스; 박쥐, 천산갑, 사향고양이, 밍크, 낙타, 및 코로나바이러스에 수용적인 다른 동물로 이루어진 군으로부터 선택된 동물로부터 단리된 하나 이상의 코로나바이러스; 또는 보통 감기를 유발하는 하나 이상의 코로나바이러스. 일부 구현예에서, 현재 순환 중인 하나 이상의 SARS-CoV-2 인간 균주 또는 변이체는 균주 B.1.177; 균주 B.1.160, 균주 B.1.1.7; 균주 B.1.351; 균주 P.1; 균주 B.1.427/B.1.429; 균주 B.1.258; 균주 B.1.221; 균주 B.1.367; 균주 B.1.1.277; 균주 B.1.1.302; 균주 B.1.525; 균주 B.1.526, 균주 S:677H, 및 균주 S:677P로부터 선택된다. 일부 구현예에서, 보통 감기를 유발하는 하나 이상의 코로나바이러스는 하기로부터 선택된다: 229E 알파 코로나바이러스, NL63 알파 코로나바이러스, OC43 베타 코로나바이러스 및 HKU1 베타 코로나바이러스. 일부 구현예에서, 백신 조성물은 인간을 위한 것이다. 일부 구현예에서, 백신 조성물은 동물을 위한 것이다.
본 발명은 또한 본 발명에 따른 1개 이상의 큰 서열(들)을 선택하고 선택된 큰 서열(들)을 포함하는 하나 이상의 항원을 합성하는 것을 포함하는, 범-코로나바이러스 조성물의 제조 방법을 특징으로 한다. 본 발명은 또한 하나 이상의 보존된 큰 서열(들)을 선택하는 단계; 및 선택된 큰 서열(들)을 인코딩하는 항원 전달 시스템을 합성하는 단계를 포함한다.
본 발명은 또한 범-코로나바이러스 재조합 백신 조성물을 포함하고, 이 조성물은 1개 이상의 큰 서열을 포함하고, 1개 이상의 큰 서열 각각은 전체 스파이크 단백질 또는 이의 일부; 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프 중 하나 이상을 포함하고; 적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래된다.
일부 구현예에서, 하나 이상의 보존된 에피토프는 인간 및 동물 코로나바이러스 중에서 고도로 보존된다. 일부 구현예에서, 하나 이상의 보존된 에피토프는 SARS-CoV-2 단백질 중 적어도 하나로부터 유래된다. 일부 구현예에서, 조성물은 2 내지 20개의 CD8+ T 세포 표적 에피토프를 포함한다. 일부 구현예에서, 조성물은 2 내지 20개의 CD4+ T 세포 표적 에피토프를 포함한다. 일부 구현예에서, 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프는 서열번호: 58-105 (ORF1a1350-1365, ORF1ab5019-5033, ORF612-26, ORF1ab6088-6102, ORF1ab6420-6434, ORF1a1801-1815, S1-13, E26-40, E20-34, M176-190, N388-403, ORF7a3-17, ORF7a1-15, ORF7b8-22, ORF7a98-112, 및 ORF81-15)으로부터 선택된다. 일부 구현예에서, 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프는 서열번호: 106-138 (S287-317, S524-598, S601-640, S802-819, S888-909, S369-393, S440-501, S1133-1172, S329-363, 및 S13-37)로부터 선택된다.
본 발명은 또한 1개 이상의 큰 서열을 포함하는 범-코로나바이러스 재조합 백신 조성물을 특징으로 하며, 1개 이상의 큰 서열 각각은 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프; 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및/또는 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프 중 하나 이상을 포함하고, 적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래된다.
일부 구현예에서, 하나 이상의 보존된 에피토프는 SARS-CoV-2 단백질 중 적어도 하나로부터 유래된다. 일부 구현예에서, 조성물은 2 내지 20개의 CD8+ T 세포 표적 에피토프를 포함한다. 일부 구현예에서, 조성물은 2 내지 20개의 CD4+ T 세포 표적 에피토프를 포함한다. 일부 구현예에서, 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프는 서열번호: 58-105 (ORF1a1350-1365, ORF1ab5019-5033, ORF612-26, ORF1ab6088-6102, ORF1ab6420-6434, ORF1a1801-1815, S1-13, E26-40, E20-34, M176-190, N388-403, ORF7a3-17, ORF7a1-15, ORF7b8-22, ORF7a98-112, 및 ORF81-15)으로부터 선택된다.
일부 구현예에서, 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프는 서열번호: 106-138 (S287-317, S524-598, S601-640, S802-819, S888-909, S369-393, S440-501, S1133-1172, S329-363, 및 S13-37)로부터 선택된다.
일부 구현예에서, 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프는 서열번호: 2-57 (S2-10, S1220-1228, S1000-1008, S958-966, E20-28, ORF1ab1675-1683, ORF1ab2363-2371, ORF1ab3013-3021, ORF1ab3183-3191, ORF1ab5470-5478, ORF1ab6749-6757, ORF7b26-34, ORF8a73-81, ORF103-11, 및 ORF105-13)로부터 선택된다.
본 발명은 또한 1개 이상의 큰 서열을 인코딩하는 항원 전달 시스템을 포함하는 범-코로나바이러스 재조합 백신 조성물을 특징으로 하며, 큰 서열은 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프; 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및/또는 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프 중 하나 이상을 포함하고; 적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래된다.
일부 구현예에서, 항원 전달 시스템은 아데노바이러스 기반 항원 전달 시스템이다. 일부 구현예에서, 아데노바이러스 기반 항원 전달 시스템은 Ad26, Ad5, Ad35, 또는 이들의 조합이다. 일부 구현예에서, 항원 전달 시스템은 T 세포 유인 케모카인을 추가로 인코딩한다. 일부 구현예에서, 항원 전달 시스템은 T 세포 증식을 촉진하는 조성물을 추가로 인코딩한다. 일부 구현예에서, 항원 전달 시스템은 분자 보조제를 추가로 인코딩한다. 일부 구현예에서, 큰 서열은 폐 특이적 프로모터에 작동적으로 연결된다.
일부 구현예에서, 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프는 서열번호: 2-57 (S2-10, S1220-1228, S1000-1008, S958-966, E20-28, ORF1ab1675-1683, ORF1ab2363-2371, ORF1ab3013-3021, ORF1ab3183-3191, ORF1ab5470-5478, ORF1ab6749-6757, ORF7b26-34, ORF8a73-81, ORF103-11, 및 ORF105-13)로부터 선택된다. 일부 구현예에서, 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프는 서열번호: 58-105 (ORF1a1350-1365, ORF1ab5019-5033, ORF612-26, ORF1ab6088-6102, ORF1ab6420-6434, ORF1a1801-1815, S1-13, E26-40, E20-34, M176-190, N388-403, ORF7a3-17, ORF7a1-15, ORF7b8-22, ORF7a98-112, 및 ORF81-15)으로부터 선택된다. 일부 구현예에서, 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프는 서열번호: 106-138 (S287-317, S524-598, S601-640, S802-819, S888-909, S369-393, S440-501, S1133-1172, S329-363, 및 S13-37)로부터 선택된다.
일부 구현예에서, 부분 스파이크 단백질은 삼량체화된 SARS-CoV-2 수용체 결합 도메인(RBD)을 포함한다. 일부 구현예에서, 전체 스파이크 단백질 또는 부분 스파이크 단백질은 온전한 S1-S2 절단 부위를 갖는다. 일부 구현예에서, 스파이크 단백질은 아미노산 위치 986 및 987에서 프롤린 치환으로 안정화된다.
본 발명은 또한 서열번호: 139-147 중 하나를 포함하는 범-코로나바이러스 재조합 백신 조성물을 특징으로 한다.
본 발명은 또한 본 명세서의 임의의 단백질 서열에 대한 상응하는 핵산 서열을 포함한다. 본 발명은 또한 본 명세서의 임의의 핵산 서열에 대한 상응하는 단백질 서열을 포함한다.
본 명세서의 구현예는 전체 스파이크 단백질 또는 스파이크 단백질의 일부를 포함할 수 있다. 전체 스파이크 단백질 및 이의 일부는 야생형 또는 원래의 서열로 제한되지 않으며 본 명세서에 기재된 돌연변이, 예컨대 개선하는 안정성을 개선하기 위한 것을 포함하는 점 돌연변이, 결실 등과 같은 하나 이상의 변형 및/또는 돌연변이를 갖는 스파이크 단백질 또는 이의 일부를 포함할 수 있다.
본 발명의 구현예는 상호 배타적이지 않다면 자유롭게 조합될 수 있다.
본 명세서에 기술된 임의의 특징 또는 특징의 조합은 본 발명의 범위에 포함되며, 단 임의의 그러한 조합에 포함된 특징은 문맥, 본 명세서, 및 당업자의 지식으로부터 명백할 바와 같이 상호 모순되지 않는다. 본 발명의 추가적인 이점 및 양태는 다음의 상세한 설명 및 청구범위에서 명백하다.
본 발명의 특징 및 이점은 첨부 도면과 관련하여 제공된 다음의 상세한 설명을 고려함으로써 명백해질 것이다.
도 1은 큰 서열의 범-코로나바이러스 재조합 백신 조성물의 예의 개략도를 보여준다. 재조합 백신 조성물 내의 각각의 큰 서열은 에피토프를 포함할 수 있다. CD8+ T 세포 에피토프는 정사각형으로 표시되고 CD4+ T 세포 에피토프는 원으로 표시되며 B-세포 에피토프는 마름모꼴로 표시된다. 각 모양(정사각형, 원형 또는 마름모꼴)은 다양한 에피토프를 나타낼 수 있으며 단일 에피토프에 제한되지 않는다. 다중 에피토프 범-코로나바이러스 백신은 표시된 대로 큰 서열의 특정 조합으로 제한되지 않는다. 큰 서열 범-코로나바이러스 백신은 다양한 수의 큰 서열을 포함할 수 있다.
도 2a는 인간 및 동물로부터 단리된 베타-코로나바이러스 균주의 게놈 서열의 진화적 비교를 나타낸다. 계통발생적 분석은 SARS-CoV-2 strainsp (박쥐 (라이놀러퍼스 아피니스, 라이놀러퍼스 말라야누스 (적색)), 천산갑 (마니스 야바니카 (청색)), 사향 고양이 (파구마 라바타 (녹색)), 및 낙타 (카멜루스 드로메다리에스 (갈색)로부터 수득된 동물의 SARS 유사 코로나바이러스 게놈 서열 (SL-CoV) 서열과 함께 인간 (호모사피엔스 (흑색))로부터 수득됨) 사이에서 수행된다. 포함된 SARS-CoV/MERS-CoV 균주는 이전의 발병 (수득된 from 인간 (Urbani, MERS-CoV, OC43, NL63, 229E, HKU1-유전자형-B), 박쥐 (WIV16, WIV1, YNLF-31C, Rs672, 재조합 균주), 낙타 (카멜루스 드로메다리에스, (KT368891.1, MN514967.1, KF917527.1, NC_028752.1), 및 사향 (Civet007, A022, B039)로부터 수득됨)로부터 유래된다. 인간 SARS-CoV-2 게놈 서열은 6개 대륙에서 제시될 수 있다.
도 2b는 6개 대륙에서 보고된 인간-SARS-CoV-2 게놈 서열 및 박쥐 (라이놀러퍼스 아피니스, 라이놀러퍼스 말라야누스), 및 천산갑 (마니스 야바니카))로부터 수득된 SARS-CoV-2 게놈 서열 간의 진화론적 분석을 나타낸 것이다.
도 3a는 폐, 심장, 신장, 장, 뇌 및 고환이 ACE2 수용체를 발현하고 SARS-CoV-2 바이러스에 의해 표적화됨을 나타낸다. SARS-CoV-2 바이러스는 스파이크 표면 단백질을 통해 안지오텐신 전환효소 2(ACE2) 수용체에 도킹한다.
도 3b는 본 발명에서 이용되는 시스템 생물학 분석 접근법을 보여준다.
도 4는 SARS-CoV-2, 보통 감기 CoV 균주, MERS, SARS-CoV-Urbani 및 SARS-CoV-2 우한(Wuhan) 균주 (쿼리 균주; hCoV-19/batYN01)를 갖는 동물 CoV에 대한 서열 상동성 분석을 보여준다. 5개의 단편 SARS-CoV-2 게놈은 고도로 보존된 고도로 보존된 (1bp- 1580bp (단편 1), 3547bp- 12830bp (단편 2), 17472bp- 21156bp (단편 3), 22584bp- 24682bp (단편 4), 및 26193bp- 27421bp (단편 5)인 것으로 밝혀졌다.
도 5는 ORF1a/b의 일부를 포함하는 단편 1(1bp-1580bp)에 대한 서열 상동성 분석을 보여준다. 쿼리 서열(1-1580bp hCoV-19/batYN01)는 모든 SARS-CoV-2 VOCs, 인간 CoV 균주, 박쥐, 천산갑, 사향 고양이로부터의 CoV 균주에 대한 BLAST였다. 이 쿼리된 영역에 대해 상당한 상동성을 갖는 28개의 변이체/균주가 발견되었다.
도 6은 단편 2(3547bp- 12830bp)에 대한 서열 상동성 분석을 보여준다. 쿼리 서열(3547-12830 bp hCoV-19/batYN01)는 모든 SARS-CoV-2 VOCs, 인간 CoV 균주, 박쥐, 천산갑, 사향 고양이로부터의 CoV 균주에 대한 BLAST였다. 이 쿼리된 영역에 대해 상당한 상동성을 갖는 30개의 변이체/균주가 발견되었다.
도 7은 단편 3 (17472bp- 21156bp)에 대한 서열 상동성 분석을 보여준다. 쿼리 서열(17472- 21156 bp hCoV-19/batYN01)는 모든 SARS-CoV-2 VOCs, 인간 CoV 균주, 박쥐, 천산갑, 사향 고양이로부터의 CoV 균주에 대한 BLAST였다. 이 쿼리된 영역에 대해 상당한 상동성을 갖는 29개의 변이체/균주가 발견되었다.
도 8은 스파이크 단백질을 포함하는 단편 4 (22584bp- 24682bp)에 대한 서열 상동성 분석을 보여준다. 쿼리 서열(22584- 24682 bp hCoV-19/batYN01)는 모든 SARS-CoV-2 VOCs, 인간 CoV 균주, 박쥐, 천산갑, 사향 고양이로부터의 CoV 균주에 대한 BLAST였다. 이 쿼리된 영역에 대해 상당한 상동성을 갖는 29개의 변이체/균주가 발견되었다.
도 9는 단편 5 (26193bp- 27421bp)에 대한 서열 상동성 분석을 보여준다. 쿼리 서열(26193- 27421 bp hCoV-19/batYN01)는 모든 SARS-CoV-2 VOCs, 인간 CoV 균주, 박쥐, 천산갑, 사향 고양이로부터의 CoV 균주에 대한 BLAST였다. 이 쿼리된 영역에 대해 상당한 상동성을 갖는 31개의 변이체/균주가 발견되었다.
도 10은 잠재적인 SARS-CoV-2 유래 인간 CD8+ T 세포 에피토프의 보존성을 스크리닝하기 위한 서열 상동성 분석을 보여준다. 81,963개의 SARS-CoV-2 균주(현재 6개 대륙 190개국에서 순환), 이전에 발병한 4가지 주요 '보통 감기' 코로나바이러스(즉 hCoV-OC43, hCoV-229E, hCoV-HKU1-유전자형 B, 및 hCoV-NL63) 및 박쥐, 사향 고양이, 천산갑 및 낙타로부터 단리된 SL-CoV 중에서 잠재적인 CD8+ T 세포 에피토프에 대한 서열 상동성의 비교를 보여준다. 노란색으로 강조 표시된 에피토프 서열은 현재 순환 중인 81,963개의 SARS-CoV-2 균주 간에 높은 수준의 상동성 및 이전의 발병으로부터의 2개 이상의 인간 SARS-CoV 균주, 및 본 명세서에 기재된 바와 같은 박쥐, 사향 고양이, 천산갑 및 낙타로부터 단리된 SL-CoV 균주 중에서 적어도 50% 보존성을 제공한다. 호모사피엔스- 흑색, 박쥐 (라이놀러퍼스 아피니스, 라이놀러퍼스 말라야누스-적색), 천산갑 (마니스 야바니카-청색), 사향 고양이 (파구마 라바타-녹색), 및 낙타 (카멜루스 드로메다리에스-갈색).
도 11a는 HLA-A*02:01 분자에 대한 고도로 보존된 SARS-CoV-2 유래 인간 CD8+ T 세포 에피토프의 도킹, 예를 들어 HLA-A*02:01 분자의 홈에 대한 27개의 고친화성 CD8+ T 세포 결합제 펩티드의 도킹을 보여준다.
도 11b는 단백질-펩티드 분자 도킹 분석에 의해 결정된 HLA-A*02:01 분자에 대한 27개의 고친화성 CD8+ T 세포 에피토프 펩티드의 상호작용 유사성 점수의 요약을 보여준다. 흑색 컬럼은 상호작용 유사성 점수가 높은 CD8+ T 세포 에피토프 펩티드를 도시한다.
도 12a는 CD8+ T 세포가 COVID-19 환자 및 노출되지 않은 건강한 개체에서 검출된 고도로 보존된 SARS-CoV-2 에피토프에 특이적임을 보여주는 실험 설계를 보여준다: HLA-A*02:01 양성 COVID-19 환자(n = 30) 및 대조군에 노출되지 않은 건강한 개체(n = 10)을 단리하고 27개의 SARS-CoV-2 유래 CD8+ T 세포 에피토프 각각 10μM으로 밤새 자극하였다. IFN-γ 생산 세포의 수는 ELISpot 분석을 사용하여 정량화되었다.
도 12b는 도 12a로부터의 결과를 보여준다. 점선은 반응의 상대적 크기를 평가하기 위한 역치를 나타낸다: 평균 SFC가 25 내지 50이면 중간/중간 반답에 해당하는 반면, 강한 반응은 평균 SFC > 50에 대해 정의된다.
도 12c는 HLA-A*02:01 양성 COVID-19 환자로부터의 PBMC가 CD107a 및 CD107b, 및 골지플러그(Golgi-plug) 및 골지스탑(Golgi-stop)에 특이적인 mAb의 존재 하에 추가로 5시간 동안 추가로 자극된 실험의 결과를 보여준다. 그 다음, 스파이크 에피토프, CD107a/b 및 CD69 및 TNF-발현에 특이적인 사량체를 FACS에 의해 측정하였다. 4개의 스파이크 CD8+ T 세포 에피토프 펩티드 그룹으로 프라이밍한 후 사량체+CD8+ T 세포, CD107a/b+CD8+ T 세포, CD69+CD8+ T 세포 및 TNF-+CD8+ T 세포의 빈도를 보여주는 대표적인 FACS 플롯. 사량체+CD8+ T 세포, CD107a/b+CD8+ T 세포, CD69+CD8+ T 세포 및 TNF-+CD8+ T 세포의 평균 빈도.
도 13a는 HLA-A*02:01/HLA-DRB1 이중 형질전환 마우스에서 게놈 전체에 걸쳐 확인된 인간 SARS-CoV-2 CD8+ T 에피토프의 면역원성을 시험하는 실험에 대한 면역화 및 면역학적 분석의 시각표을 보여준다. 8개 그룹의 연령 일치 HLA-A*02:01 형질전환 마우스(n = 3)를 명반 및 CpG1826 보조제로 전달된 4개의 SARS-CoV-2 유래 인간 CD8+ T 세포 펩티드 에피토프와 PADRE CD4+ T 헬퍼 에피토프가 혼합된 혼합물로 0일째와 14일째에 피하로 면역화하였다. 음성 대조군으로서, 마우스는 보조제만을 투여받았다(모의 면역화됨).
도 13b는 비장 유래 CD8+ T 세포를 특성화하기 위해 사용된 게이팅 전략을 보여준다. 림프구는 낮은 전방 산란 (FSC) 및 낮은 측방 산란 (SSC) 게이트에 의해 확인되었다. 전방 산란 면적(FSC-A) 대 전방 산란 높이(FSC-H)를 플로팅하여 단일항을 선택하였다. 그 다음 CD8 양성 세포는 CD8 및 CD3 마커의 발현에 의해 게이팅되었다.
도 13c는 SARS-CoV-2 구조적 및 비-구조적 단백질에서 유래한 27개의 CD8+ T 세포 펩티드의 총 풀 중 10 μM의 10개의 면역우성 CD8+ T 세포 펩티드와 1개의 아우성 CD8+ T 세포 펩티드로 48시간 동안 자극된 비장세포 (106개의 세포/웰)로부터의 IFN-γ 생산 세포 스팟의 대표적인 ELISpot 이미지 (왼쪽 패널) 및 평균 빈도 (오른쪽 패널)을 보여준다. 각 ELISpot 이미지의 상단에 있는 숫자는 100만 개의 비장세포당 IFN-γ 생성 스팟 형성 T 세포(SFC)의 수를 나타낸다.
도 13d는 FACS에 의해 결정된 SARS-CoV-2 구조적 및 비-구조적 단백질에서 유래한 27개의 CD8+ T 세포 펩티드의 총 풀 중 10 μM의 10개의 면역우성 CD8+ T 세포 펩티드와 1개의 아우성 CD8+ T 세포 펩티드에 의한 IFN-γ 및 TNF- 생산, 및 그에 대한 CD107a/b 및 CD69 발현의 대표적인 FACS 플롯 (왼쪽 패널) 및 평균 빈도 (오른쪽 패널)를 보여준다 숫자는 3마리의 면역화된 마우스에서 검출된 IFN-γ+CD8+ T 세포, CD107+CD8+ T 세포, CD69+CD8+ T 세포 및 TNF-+CD8+ T 세포의 빈도를 나타낸다.
도 14는 SARS-CoV/SARS-CoV-2 게놈이 16개의 비구조적 단백질(NSP1-NSP16)을 인코딩하는 2개의 큰 비-구조적 유전자 ORF1a(녹색) 및 ORF1b(회색)를 인코딩함을 보여준다. 게놈은 수, 게놈 조직, 서열 및 기능 면에서 SARS-CoV/SARS-CoV-2에 고유한 적어도 6개의 보조 단백질(밝은 회색 음영)을 인코딩한다. 일반적인 SARS-CoV, SARS-CoV-2 및 SL-CoV 유래 인간 B (청색), CD4+ (녹색) 및 CD8+ (흑색) T 세포 에피토프가 표시된다. 이 연구에 이용된 구조적 및 비구조적 열린 해독틀은 SARS-CoV-2-Wuhan-Hu-1 균주 (NCBI 수탁 번호 MN908947.3, 서열번호: 1)로부터의 것이다. SARS-CoV-2-Wuhan-Hu-1 구조적 및 비-구조적 단백질의 아미노산 서열은 본 명세서에 기재된 바와 같은 상이한 계산 알고리즘을 사용하여 인간 B, CD4+ 및 CD8+ T 세포 에피토프에 대해 스크리닝되었다. 인간과 동물 코로나바이러스 간에 고도로 보존된 게놈 전체 확인된 SARS-CoV-2 인간 B 세포 에피토프 (청색), CD4+ T 세포 에피토프 (녹색), CD8+ T 세포 에피토프 (흑색)가 보여진다.
도 15는 HLA-DR 분자에 높은 친화도로 결합하는 고도로 보존된 잠재적인 SARS-CoV-2 유래 인간 CD4+ T 세포 에피토프의 확인을 보여준다: SARS-CoV-2-Wuhan-Hu-1 균주(MN908947.3)의 전체 게놈 서열로부터의 잠재적인 HLA-DR-restricted CD4+ T 세포 에피토프 총 9,594개 중에서, HLA-DRB1 분자에 높은 친화도로 결합하는 16개의 에피토프가 선택되었다. 16개의 CD4+ T 세포 에피토프의 보존성은 인간 및 동물 코로나바이러스 중에서 분석되었다. 81,963개의 SARS-CoV-2 균주(현재 6개에서 순환), 이전에 발병한 4가지 주요 '보통 감기' 코로나바이러스(즉 hCoV-OC43, hCoV-229E, hCoV-HKU1, 및 hCoV-NL63) 및 박쥐, 사향 고양이, 천산갑 및 낙타로부터 단리된 SL-CoV 중에서 16 CD4+ T 세포 에피토프에 대한 서열 상동성의 비교를 보여준다. 녹색으로 강조 표시된 에피토프 서열은 현재 순환 중인 81,963개의 SARS-CoV-2 균주 간에 높은 수준의 상동성 및 이전의 발병으로부터의 2개 이상의 인간 SARS-CoV 균주, 및 물질 및 방법에 기재된 바와 같은 박쥐, 사향 고양이, 천산갑 및 낙타로부터 단리된 SL-CoV 균주 중에서 적어도 50% 보존성을 제공한다. 호모사피엔스- 흑색, 박쥐 (라이놀러퍼스 아피니스, 라이놀러퍼스 말라야누스-적색), 천산갑 (마니스 야바니카-청색), 사향 고양이 (파구마 라바타-녹색), 및 낙타 (카멜루스 드로메다리에스-갈색).
도 16a는 HLA-DRB1 분자에 대한 고도로 보존된 SARS-CoV-2 CD4+ T 세포 에피토프의 분자 도킹을 보여준다. 인간 SARS-CoV-2 균주, 이전의 인간 SARS/MERS-CoV 및 박쥐 SL-CoV 사이에 보존된 16개의 CD4+ T 세포 에피토프의 HLA-DRB1 단백질 결정 구조 (PDB 수탁 번호: 4UQ3)의 홈으로의 분자 도킹은 GalaxyPepDock 서버를 사용하여 결정되었다. 16개의 CD4+ T 세포 에피토프는 무차별적으로 HLA-DRB1*01:01, HLA-DRB1*11:01, HLA-DRB1*15:01, HLA-DRB1*03:01 및 HLA-DRB1*04:01 대립유전자로 제한되어 있다. CD4+ T 세포 펩타이드는 볼 및 스틱 구조로 표시되고 HLA-DRB1 단백질 결정 구조는 주형으로 표시된다. 예측 정확도는 선형 회귀에 의해 얻은 단백질 구조적 유사성 점수(TM 점수) 및 상호작용 유사성 점수(SInter)에 의해 측정된 주형-표적 유사성과 정확하게 예측된 결합 부위 잔기의 분율 간의 관계로 선형 모델에서 추정된다. SInter는 HLA-DRB1 주형 구조의 아미노산에서 접촉 잔기에 정렬된 CD8+ T 세포 펩티드의 아미노산의 유사성을 보여준다.
도 16b는 단백질-펩티드 분자 도킹 분석으로부터 관찰된 CD4+ T 세포 특이적 에피토프의 상호작용 유사성 점수를 나타내는 히스토그램을 보여준다.
도 17a는 CD4+ T 세포가 COVID-19 환자 및 노출되지 않은 건강한 개체에서 검출된 고도로 보존된 SARS-CoV-2 에피토프에 특이적임을 보여주는 실험 설계를 보여준다: HLA-DRB1 양성 COVID-19 환자(n = 30) 및 대조군에 노출되지 않은 건강한 개체(n = 10)을 단리하고 16개의 SARS-CoV-2 유래 CD4+ T 세포 에피토프 각각 10μM으로 28시간 동안 자극하였다. IFN-- 세포의 수는 ELISpot 분석을 사용하여 정량화되었다.
도 17b는 도 17a로부터의 결과를 보여준다. 점선은 반응의 상대적 크기를 평가하기 위한 역치를 나타낸다: 평균 SFC가 25 내지 50이면 중간/중간 반답에 해당하는 반면, 강한 반응은 평균 SFC > 50에 대해 정의된다. HLA-DRB1 양성 COVID-19 환자의 PBMC
도 17c는 CD107a 및 CD107b에 특이적인 mAb, 및 골지-플러그 및 골지-스톱의 존재 하에 추가로 5시간 동안 추가로 자극한 결과를 보여준다. 그 다음, 2개의 스파이크 에피토프, CD107a/b 및 CD69 및 TNF-알파 발현에 특이적인 사량체를 FACS에 의해 측정하였다. 2개의 스파이크 CD4+ T 세포 에피토프 펩티드 그룹으로 프라이밍한 후 사량체+CD4+ T 세포, CD107a/b+CD4+ T 세포, CD69+CD4+ T 세포 및 TNF-+CD4+ T 세포의 빈도를 보여주는 대표적인 FACS 플롯. 사량체+CD4+ T 세포, CD107a/b+CD4+ T 세포, CD69+CD4+ T 세포 및 TNF-+CD4+ T 세포에 대한 평균 빈도가 표시된다.
도 18a는 HLA-A*02:01/HLA-DRB1 이중 형질전환 마우스에서 게놈 전체에 걸쳐 확인된 인간 SARS-CoV-2 CD4+ T 에피토프의 면역원성을 시험하기 위한 면역화 및 면역학적 분석의 시각표을 보여준다. 4개 그룹의 연령 일치 HLA-DRB1 형질전환 마우스(n = 3)를 명반 및 CpG1826 보조제로 전달된 4개의 SARS-CoV-2 유래 인간 CD4+ T 세포 펩티드 에피토프의 혼합물로 0일째와 14일째에 피하로 면역화하였다. 음성 대조군으로서, 마우스는 보조제만을 투여받았다(모의 면역화됨).
도 18b는 비장 유래 CD4+ T 세포를 특성화하기 위해 사용된 게이팅 전략을 보여준다. CD4 양성 세포는 CD4 및 CD3 발현 마커에 의해 게이팅되었다.
도 18c는 SARS-CoV-2 구조적 및 비-구조적 단백질에서 유래한 16개의 CD4+ T 세포 펩티드의 총 풀 중 10 μM의 7개의 면역우성 CD4+ T 세포 펩티드와 1개의 아우성 CD4+ T 세포 펩티드로 48시간 동안 자극된 비장세포 (106개의 세포/웰)로부터의 IFN-γ 생산 세포 스팟의 대표적인 ELISpot 이미지 (왼쪽 패널) 및 평균 빈도 (오른쪽 패널)을 보여준다. 총 세포 100만 개당 IFN-γ 생성 스팟 형성 T 세포(SFC)의 수가 각 ELISpot 이미지의 상단에 제시된다.
도 18d는 FACS에 의해 결정된 SARS-CoV-2에서 유래한 16개의 CD4+ T 세포 펩티드의 총 풀 중 10 μM의 7개의 면역우성 CD4+ T 세포 펩티드와 1개의 아우성 CD4+ T 세포 펩티드에 의한 IFN-γ 및 TNF-α 생산, 및 그에 대한 CD107a/b 및 CD69 발현의 대표적인 FACS 플롯 (왼쪽 패널) 및 평균 빈도 (오른쪽 패널)를 보여준다 숫자는 3마리의 면역화된 마우스에서 검출된 IFN-γ+CD4+ T 세포, CD107+CD4+ T 세포, CD69+CD4+ T 세포 및 TNF- α+CD4+ T 세포의 백분율을 나타낸다.
도 19는 인간, 박쥐, 사향 고양이, 천산갑 및 낙타 코로나바이러스 균주 사이에서 스파이크 유래 B 세포 에피토프의 보존을 보여준다: 인간, 박쥐, 사향고양이, 천산갑, 및 낙타에서 얻은 SARS 코로나바이러스(SARS-CoV)의 29개의 균주 중 ClustalW를 사용하여 다중 서열 정렬을 수행하였다. 이는 7개의 인간 SARS/MERS-CoV 균주 (SARS-CoV-2-Wuhan (MN908947.3), SARS-HCoV-Urbani (AY278741.1), CoV-HKU1-유전자형-B (AY884001), CoV-OC43 (KF923903), CoV-NL63 (NC005831), CoV-229E (KY983587), MERS (NC019843)); 8개의 박쥐 SARS-CoV 균주 (BAT-SL-CoV-WIV16 (KT444582), BAT-SL-CoV-WIV1 (KF367457.1), BAT-SL-CoV-YNLF31C (KP886808.1), BAT-SARS-CoV-RS672 (FJ588686.1), BAT-CoV-RATG13 (MN996532.1), BAT-CoV-YN01 (EPIISL412976), BAT-CoV-YN02 (EPIISL412977), BAT-CoV-19-ZXC21 (MG772934.1); 3개의 사향고양이 SARS-CoV 균주 (SARS-CoV-Civet007 (AY572034.1), SARS-CoV-A022 (AY686863.1), SARS-CoV-B039 (AY686864.1)); 9개의 천산갑 SARS-CoV 균주 (PCoV-GX-P2V(MT072864.1), PCoV-GX-P5E(MT040336.1), PCoV-GX-P5L (MT040335.1), PCoV-GX-P1E (MT040334.1), PCoV-GX-P4L (MT040333.1), PCoV-MP789 (MT084071.1), PCoV-GX-P3B (MT072865.1), PCoV-Guangdong-P2S (EPIISL410544), PCoV-Guangdong (EPIISL410721)); 4개의 낙타 SARS-CoV 균주 (낙타-CoV-HKU23 (KT368891.1), DcCoV-HKU23 (MN514967.1), MERS-CoV-Jeddah (KF917527.1), Riyadh/RY141 (NC028752.1)) 및 1 재조합 균주 (FJ211859.1))을 포함한다. 청색으로 강조 표시된 영역은 서열 상동성을 나타낸다. SARS 코로나바이러스의 2개 이상의 균주 중에서 50% 이상의 보존성을 나타내거나 수용체 결합 도메인(RBD) 특정 아미노산을 보유하는 B 세포 에피토프를 후보 에피토프로 선택하였다.
도 20a는 인간 ACE2 수용체에 대한 SARS-CoV-2 스파이크 당단백질 유래 B 세포 에피토프의 도킹, 예를 들어 SARS-CoV-2 스파이크 당단백질로부터 확인된 22개의 B-세포 에피토프와 ACE2 수용체의 분자 도킹을 보여준다. B 세포 에피토프 펩티드는 볼 및 스틱 구조로 표시되는 반면 ACE2 수용체 단백질은 주형으로 표시된다. S471-501 및 S369-393 펩티드 에피토프는 수용체 결합 도메인 영역 특이적 아미노산 잔기를 보유한다. 예측 정확도는 선형 회귀에 의해 얻은 단백질 구조적 유사성 점수 및 상호작용 유사성 점수(SInter)에 의해 측정된 주형-표적 유사성과 정확하게 예측된 결합 부위 잔기의 분율 간의 관계로 선형 모델에서 추정된다. SInter는 ACE2 주형 구조의 아미노산에서 접촉 잔기에 정렬된 B 세포 펩티드의 아미노산 유사성을 보여준다. 더 높은 SInter 점수는 ACE2 분자와 B-세포 펩타이드 간의 더 중요한 결합 친화도를 나타낸다.
도 20b는 단백질-펩티드 분자 도킹 분석으로부터 관찰된 22개의 B 세포 특이적 에피토프의 상호작용 유사성 점수의 요약을 보여준다. 상호작용 유사성 점수가 높은 B 세포 에피토프는 흑색으로 표시된다.
도 21a는 면역화된 B6 마우스 및 회복기 COVID-19 환자에서 IgG 항체가 SARS-CoV-2 스파이크 단백질 유래 B-세포 에피토프에 특이적임을 보여주기 위한 시험을 위한 면역화 및 면역학적 분석의 시각표을 보여준다. SARS-CoV-2 Spike 단백질에서 선택되고 B6 마우스에서 테스트된 총 22개의 SARS-CoV-2 유래 B 세포 에피토프 펩타이드가 항체 반응을 유도할 수 있었다. 4개 그룹의 연령 일치 B6 마우스(n = 3)를 명반 및 CpG1826 보조제에 에멀젼화된 4개 또는 5개의 SARS-CoV-2 유래 B-세포 펩티드 에피토프의 혼합물로 0일째와 14일째에 피하로 면역화하였다. 명반/CpG1826 보조제만 음성 대조군으로 사용하였다(모의 면역화됨).
도 21b는 면역화된 마우스의 비장에서 유세포 분석에 의해 결정된 IgG 생성 CD3(-)CD138(+)B220(+) 혈장 B 세포의 빈도를 보여준다. 예를 들어, 도 21b는 게이팅 전략이 다음과 같다는 것을 보여준다: 림프구는 낮은 전방 산란(FSC) 및 낮은 측면 산란(SSC) 게이트에 의해 식별되었다. 전방 산란 면적(FSC-A) 대 전방 산란 높이(FSC-H)를 플로팅하여 단일항을 선택하였다. 그 다음 B 세포는 CD3(-) 및 B220(+) 세포의 발현에 의해 게이트되었고 혈장 B 세포에 대한 CD138 발현이 결정되었다.
도 21c는 면역화된 마우스의 비장에서 유세포 분석에 의해 결정된 IgG 생성 CD3(-)CD138(+)B220(+) 혈장 B 세포의 빈도를 보여준다. 예를 들어, FG 15C는 면역화된 마우스의 비장에서 검출된 혈장 B 세포의 대표적인 FACS 플롯(왼쪽 패널) 및 평균 빈도(오른쪽 패널)를 보여준다. 혈장 CD138(-)B220(+)B 세포의 백분율은 각 도트 플롯의 왼쪽 상단에 표시된다.
도 21d는 SARS-CoV-2 유래 B-세포 에피토프-특이적 IgG 반응이 2차 면역화 후 14일(즉, 28일째)에 ELISpot (IgG(+) 스팟의 수)에 의해 면역 혈청에서 정량화되었음을 보여준다. 마우스 Poly-S(면역스팟)를 사용한 시험관 내 B 세포 다클론 자극 4일 후 항-펩티드 특이적 IgG 생성 B 세포 스팟 (1x106 비장세포/웰)의 대표적인 ELISpot 이미지 (왼쪽 패널) 및 평균 빈도 (오른쪽 패널). 각 ELISpot 이미지의 상단/왼쪽은 50만 세포당 IgG 생성 B 세포의 수를 보여준다. ELISA 플레이트를 각각의 개별 면역화 펩티드로 코팅하였다.
도 21e는 모의 백신접종된 마우스로부터 측정된 배경을 뺀 후 펩티드-면역화된 B6 마우스에서 검출된 IgG의 수준에서 ELISA에 의해 측정된 B-세포 에피토프-특이적 IgG 농도(μg/mL)를 보여준다. 파선 수평선은 검출 한계를 나타낸다.
도 21f 및 도 21g는 노출되지 않은 건강한 개체(n=10)로부터 측정된 배경의 차감 후, 각각의 22명의 스파이크 펩티드 검출된 SARS-CoV-2 감염된 환자 (n=40)의 수준에서 ELISA에 의해 측정된 B-세포 에피토프 특이적 IgG 농도(μg/mL)를 보여준다. 흑색 막대와 회색 막대는 각각 높은 면역원성 B 세포 펩티드와 중간 수준의 면역원성 B 세포 펩티드를 보여준다. 파선 수평선은 감지 한계를 나타낸다.
도 22는 6개의 프롤린 돌연변이를 포함하는 돌연변이를 포함하는 전체 스파이크 단백질의 예를 보여준다. 6개의 프롤린 돌연변이는 단일점 돌연변이 F817P, A892P, A899P, A942P, K986P 및 V987P를 포함한다. 추가로, 스파이크 단백질은 프로테아제 내성을 위한 퓨린 절단 부위의 682-QQAQ-685 돌연변이를 포함한다. 일부 구현예에서, K986P 및 V987P 돌연변이는 관류 안정화를 허용한다. 도 22는 또한 하기 서열을 나타낸다: MFVFLVLLPLVSS(서열번호: 188), ATGTTCGTGTTCCTGGTGCTGCTGCCCCTGGTGAGCAGC(서열번호: 175), CAGCAGGCCCAG(서열번호: 189), 및 CCCCCC(서열번호: 190).
도 23은 본 명세서에 기재된 조성물의 큰 서열이 어떻게 배열될 수 있는지의 비제한적인 예를 보여준다.
도 24는 본 발명의 프로토타입 코로나바이러스 백신의 개략도를 보여준다. 본 발명은 도시된 바와 같은 프로토타입 코로나바이러스 백신에 제한되지 않는다.
도 25a는 인간에서 "프라임/당김(prime/pull)" 레지멘을 사용하여 본 명세서에 기재된 백신 조성물을 전달하기 위한 방법의 비제한적 예를 보여준다. 방법은 범-코로나바이러스 재조합 백신 조성물을 투여하고 범-코로나바이러스 재조합 백신 조성물을 투여한 후 적어도 하나의 T-세포 유인 케모카인(예를 들어, CXCL11)을 추가로 투여하는 것을 포함한다.
도 25b는 인간에서 "프라임/부스트(prime/boost)" 레지멘을 사용하여 본 명세서에 기재된 백신 조성물을 전달하기 위한 방법의 비제한적 예를 보여준다. 방법은 제1 전달 시스템을 사용하여 제1 조성물, 예를 들어, 제1 범-코로나바이러스 재조합 백신 조성물 용량을 투여하고 제2 전달 시스템을 사용하여 제2 조성물, 예를 들어, 제2 백신 조성물 용량을 추가로 투여하는 것을 포함한다. 일부 구현예에서, 제1 전달 시스템 및 제2 전달 시스템은 상이하다.
도 25c는 SARS-CoV-2로부터 보호하기 위해 폐 상주 B-세포, CD4+ T 세포 및 CD8+ T 세포의 크기 및 유지를 증가시키기 위해 인간에서 "프라임/당김/유지" 레지멘을 사용하여 본 명세서에 기재된 백신 조성물을 전달하는 방법의 비제한적 예를 보여준다. 방법은 범-코로나바이러스 재조합 백신 조성물을 투여하고 범-코로나바이러스 재조합 백신 조성물을 투여한 후 적어도 하나의 T-세포 유인 케모카인(예를 들어, CXCL11 또는 CXCL17)을 투여하는 것을 포함한다.
도 25d는 SARS-CoV-2로부터 보호하기 위해 폐 상주 B-세포, CD4+ T 세포 및 CD8+ T 세포의 크기 및 유지를 증가시키기 위해 인간에서 "프라임/당김/부스트" 레지멘을 사용하여 본 명세서에 기재된 백신 조성물을 전달하는 방법의 비제한적 예를 보여준다. 방법은 범-코로나바이러스 재조합 백신 조성물을 투여하고 범-코로나바이러스 재조합 백신 조성물을 투여한 후 적어도 하나의 T-세포 유인 케모카인(예를 들어, CXCL11 또는 CXCL17)을 투여하는 것을 포함한다. 방법은 T-세포 유인 케모카인(예를 들어, IL-7, IL-5, 또는 IL-2)을 투여한 후 적어도 하나의 사이토카인을 투여하는 단계를 추가로 포함한다.
도 26a는 가축 (예를 들어 고양이 또는 개)에서 "프라임/당김(prime/pull)" 레지멘을 사용하여 본 명세서에 기재된 백신 조성물을 전달하기 위한 방법의 비제한적 예를 보여준다. 방법은 범-코로나바이러스 재조합 백신 조성물을 투여하고 범-코로나바이러스 재조합 백신 조성물을 투여한 후 적어도 하나의 T-세포 유인 케모카인(예를 들어, CXCL11)을 추가로 투여하는 것을 포함한다.
도 26b는 가축 (예를 들어 고양이 또는 개)에서 "프라임/부스트(prime/boostl)" 레지멘을 사용하여 본 명세서에 기재된 백신 조성물을 전달하기 위한 방법의 비제한적 예를 보여준다. 방법은 제1 전달 시스템을 사용하여 제1 조성물, 예를 들어, 제1 범-코로나바이러스 재조합 백신 조성물 용량을 투여하고 제2 전달 시스템을 사용하여 제2 조성물, 예를 들어, 제2 백신 조성물 용량을 추가로 투여하는 것을 포함한다. 일부 구현예에서, 제1 전달 시스템 및 제2 전달 시스템은 상이하다.
도 26c는 SARS-CoV-2로부터 보호하기 위해 폐 상주 B-세포, CD4+ T 세포 및 CD8+ T 세포의 크기 및 유지를 증가시키기 위해 가축 (예를 들어 고양이 또는 개)에서 "프라임/당김/유지" 레지멘을 사용하여 본 명세서에 기재된 백신 조성물을 전달하는 방법의 비제한적 예를 보여준다. 방법은 범-코로나바이러스 재조합 백신 조성물을 투여하고 범-코로나바이러스 재조합 백신 조성물을 투여한 후 적어도 하나의 T-세포 유인 케모카인(예를 들어, CXCL11 또는 CXCL17)을 투여하는 것을 포함한다.
도 26d는 SARS-CoV-2로부터 보호하기 위해 폐 상주 B-세포, CD4+ T 세포 및 CD8+ T 세포의 크기 및 유지를 증가시키기 위해 가축 (예를 들어 고양이 또는 개)에서 "프라임/당김/부스트" 레지멘을 사용하여 본 명세서에 기재된 백신 조성물을 전달하는 방법의 비제한적 예를 보여준다. 방법은 범-코로나바이러스 재조합 백신 조성물을 투여하고 범-코로나바이러스 재조합 백신 조성물을 투여한 후 적어도 하나의 T-세포 유인 케모카인(예를 들어, CXCL11 또는 CXCL17)을 투여하는 것을 포함한다. 방법은 T-세포 유인 케모카인(예를 들어, IL-7, IL-5, 또는 IL-2)을 투여한 후 적어도 하나의 사이토카인을 투여하는 단계를 추가로 포함한다.
도 1은 큰 서열의 범-코로나바이러스 재조합 백신 조성물의 예의 개략도를 보여준다. 재조합 백신 조성물 내의 각각의 큰 서열은 에피토프를 포함할 수 있다. CD8+ T 세포 에피토프는 정사각형으로 표시되고 CD4+ T 세포 에피토프는 원으로 표시되며 B-세포 에피토프는 마름모꼴로 표시된다. 각 모양(정사각형, 원형 또는 마름모꼴)은 다양한 에피토프를 나타낼 수 있으며 단일 에피토프에 제한되지 않는다. 다중 에피토프 범-코로나바이러스 백신은 표시된 대로 큰 서열의 특정 조합으로 제한되지 않는다. 큰 서열 범-코로나바이러스 백신은 다양한 수의 큰 서열을 포함할 수 있다.
도 2a는 인간 및 동물로부터 단리된 베타-코로나바이러스 균주의 게놈 서열의 진화적 비교를 나타낸다. 계통발생적 분석은 SARS-CoV-2 strainsp (박쥐 (라이놀러퍼스 아피니스, 라이놀러퍼스 말라야누스 (적색)), 천산갑 (마니스 야바니카 (청색)), 사향 고양이 (파구마 라바타 (녹색)), 및 낙타 (카멜루스 드로메다리에스 (갈색)로부터 수득된 동물의 SARS 유사 코로나바이러스 게놈 서열 (SL-CoV) 서열과 함께 인간 (호모사피엔스 (흑색))로부터 수득됨) 사이에서 수행된다. 포함된 SARS-CoV/MERS-CoV 균주는 이전의 발병 (수득된 from 인간 (Urbani, MERS-CoV, OC43, NL63, 229E, HKU1-유전자형-B), 박쥐 (WIV16, WIV1, YNLF-31C, Rs672, 재조합 균주), 낙타 (카멜루스 드로메다리에스, (KT368891.1, MN514967.1, KF917527.1, NC_028752.1), 및 사향 (Civet007, A022, B039)로부터 수득됨)로부터 유래된다. 인간 SARS-CoV-2 게놈 서열은 6개 대륙에서 제시될 수 있다.
도 2b는 6개 대륙에서 보고된 인간-SARS-CoV-2 게놈 서열 및 박쥐 (라이놀러퍼스 아피니스, 라이놀러퍼스 말라야누스), 및 천산갑 (마니스 야바니카))로부터 수득된 SARS-CoV-2 게놈 서열 간의 진화론적 분석을 나타낸 것이다.
도 3a는 폐, 심장, 신장, 장, 뇌 및 고환이 ACE2 수용체를 발현하고 SARS-CoV-2 바이러스에 의해 표적화됨을 나타낸다. SARS-CoV-2 바이러스는 스파이크 표면 단백질을 통해 안지오텐신 전환효소 2(ACE2) 수용체에 도킹한다.
도 3b는 본 발명에서 이용되는 시스템 생물학 분석 접근법을 보여준다.
도 4는 SARS-CoV-2, 보통 감기 CoV 균주, MERS, SARS-CoV-Urbani 및 SARS-CoV-2 우한(Wuhan) 균주 (쿼리 균주; hCoV-19/batYN01)를 갖는 동물 CoV에 대한 서열 상동성 분석을 보여준다. 5개의 단편 SARS-CoV-2 게놈은 고도로 보존된 고도로 보존된 (1bp- 1580bp (단편 1), 3547bp- 12830bp (단편 2), 17472bp- 21156bp (단편 3), 22584bp- 24682bp (단편 4), 및 26193bp- 27421bp (단편 5)인 것으로 밝혀졌다.
도 5는 ORF1a/b의 일부를 포함하는 단편 1(1bp-1580bp)에 대한 서열 상동성 분석을 보여준다. 쿼리 서열(1-1580bp hCoV-19/batYN01)는 모든 SARS-CoV-2 VOCs, 인간 CoV 균주, 박쥐, 천산갑, 사향 고양이로부터의 CoV 균주에 대한 BLAST였다. 이 쿼리된 영역에 대해 상당한 상동성을 갖는 28개의 변이체/균주가 발견되었다.
도 6은 단편 2(3547bp- 12830bp)에 대한 서열 상동성 분석을 보여준다. 쿼리 서열(3547-12830 bp hCoV-19/batYN01)는 모든 SARS-CoV-2 VOCs, 인간 CoV 균주, 박쥐, 천산갑, 사향 고양이로부터의 CoV 균주에 대한 BLAST였다. 이 쿼리된 영역에 대해 상당한 상동성을 갖는 30개의 변이체/균주가 발견되었다.
도 7은 단편 3 (17472bp- 21156bp)에 대한 서열 상동성 분석을 보여준다. 쿼리 서열(17472- 21156 bp hCoV-19/batYN01)는 모든 SARS-CoV-2 VOCs, 인간 CoV 균주, 박쥐, 천산갑, 사향 고양이로부터의 CoV 균주에 대한 BLAST였다. 이 쿼리된 영역에 대해 상당한 상동성을 갖는 29개의 변이체/균주가 발견되었다.
도 8은 스파이크 단백질을 포함하는 단편 4 (22584bp- 24682bp)에 대한 서열 상동성 분석을 보여준다. 쿼리 서열(22584- 24682 bp hCoV-19/batYN01)는 모든 SARS-CoV-2 VOCs, 인간 CoV 균주, 박쥐, 천산갑, 사향 고양이로부터의 CoV 균주에 대한 BLAST였다. 이 쿼리된 영역에 대해 상당한 상동성을 갖는 29개의 변이체/균주가 발견되었다.
도 9는 단편 5 (26193bp- 27421bp)에 대한 서열 상동성 분석을 보여준다. 쿼리 서열(26193- 27421 bp hCoV-19/batYN01)는 모든 SARS-CoV-2 VOCs, 인간 CoV 균주, 박쥐, 천산갑, 사향 고양이로부터의 CoV 균주에 대한 BLAST였다. 이 쿼리된 영역에 대해 상당한 상동성을 갖는 31개의 변이체/균주가 발견되었다.
도 10은 잠재적인 SARS-CoV-2 유래 인간 CD8+ T 세포 에피토프의 보존성을 스크리닝하기 위한 서열 상동성 분석을 보여준다. 81,963개의 SARS-CoV-2 균주(현재 6개 대륙 190개국에서 순환), 이전에 발병한 4가지 주요 '보통 감기' 코로나바이러스(즉 hCoV-OC43, hCoV-229E, hCoV-HKU1-유전자형 B, 및 hCoV-NL63) 및 박쥐, 사향 고양이, 천산갑 및 낙타로부터 단리된 SL-CoV 중에서 잠재적인 CD8+ T 세포 에피토프에 대한 서열 상동성의 비교를 보여준다. 노란색으로 강조 표시된 에피토프 서열은 현재 순환 중인 81,963개의 SARS-CoV-2 균주 간에 높은 수준의 상동성 및 이전의 발병으로부터의 2개 이상의 인간 SARS-CoV 균주, 및 본 명세서에 기재된 바와 같은 박쥐, 사향 고양이, 천산갑 및 낙타로부터 단리된 SL-CoV 균주 중에서 적어도 50% 보존성을 제공한다. 호모사피엔스- 흑색, 박쥐 (라이놀러퍼스 아피니스, 라이놀러퍼스 말라야누스-적색), 천산갑 (마니스 야바니카-청색), 사향 고양이 (파구마 라바타-녹색), 및 낙타 (카멜루스 드로메다리에스-갈색).
도 11a는 HLA-A*02:01 분자에 대한 고도로 보존된 SARS-CoV-2 유래 인간 CD8+ T 세포 에피토프의 도킹, 예를 들어 HLA-A*02:01 분자의 홈에 대한 27개의 고친화성 CD8+ T 세포 결합제 펩티드의 도킹을 보여준다.
도 11b는 단백질-펩티드 분자 도킹 분석에 의해 결정된 HLA-A*02:01 분자에 대한 27개의 고친화성 CD8+ T 세포 에피토프 펩티드의 상호작용 유사성 점수의 요약을 보여준다. 흑색 컬럼은 상호작용 유사성 점수가 높은 CD8+ T 세포 에피토프 펩티드를 도시한다.
도 12a는 CD8+ T 세포가 COVID-19 환자 및 노출되지 않은 건강한 개체에서 검출된 고도로 보존된 SARS-CoV-2 에피토프에 특이적임을 보여주는 실험 설계를 보여준다: HLA-A*02:01 양성 COVID-19 환자(n = 30) 및 대조군에 노출되지 않은 건강한 개체(n = 10)을 단리하고 27개의 SARS-CoV-2 유래 CD8+ T 세포 에피토프 각각 10μM으로 밤새 자극하였다. IFN-γ 생산 세포의 수는 ELISpot 분석을 사용하여 정량화되었다.
도 12b는 도 12a로부터의 결과를 보여준다. 점선은 반응의 상대적 크기를 평가하기 위한 역치를 나타낸다: 평균 SFC가 25 내지 50이면 중간/중간 반답에 해당하는 반면, 강한 반응은 평균 SFC > 50에 대해 정의된다.
도 12c는 HLA-A*02:01 양성 COVID-19 환자로부터의 PBMC가 CD107a 및 CD107b, 및 골지플러그(Golgi-plug) 및 골지스탑(Golgi-stop)에 특이적인 mAb의 존재 하에 추가로 5시간 동안 추가로 자극된 실험의 결과를 보여준다. 그 다음, 스파이크 에피토프, CD107a/b 및 CD69 및 TNF-발현에 특이적인 사량체를 FACS에 의해 측정하였다. 4개의 스파이크 CD8+ T 세포 에피토프 펩티드 그룹으로 프라이밍한 후 사량체+CD8+ T 세포, CD107a/b+CD8+ T 세포, CD69+CD8+ T 세포 및 TNF-+CD8+ T 세포의 빈도를 보여주는 대표적인 FACS 플롯. 사량체+CD8+ T 세포, CD107a/b+CD8+ T 세포, CD69+CD8+ T 세포 및 TNF-+CD8+ T 세포의 평균 빈도.
도 13a는 HLA-A*02:01/HLA-DRB1 이중 형질전환 마우스에서 게놈 전체에 걸쳐 확인된 인간 SARS-CoV-2 CD8+ T 에피토프의 면역원성을 시험하는 실험에 대한 면역화 및 면역학적 분석의 시각표을 보여준다. 8개 그룹의 연령 일치 HLA-A*02:01 형질전환 마우스(n = 3)를 명반 및 CpG1826 보조제로 전달된 4개의 SARS-CoV-2 유래 인간 CD8+ T 세포 펩티드 에피토프와 PADRE CD4+ T 헬퍼 에피토프가 혼합된 혼합물로 0일째와 14일째에 피하로 면역화하였다. 음성 대조군으로서, 마우스는 보조제만을 투여받았다(모의 면역화됨).
도 13b는 비장 유래 CD8+ T 세포를 특성화하기 위해 사용된 게이팅 전략을 보여준다. 림프구는 낮은 전방 산란 (FSC) 및 낮은 측방 산란 (SSC) 게이트에 의해 확인되었다. 전방 산란 면적(FSC-A) 대 전방 산란 높이(FSC-H)를 플로팅하여 단일항을 선택하였다. 그 다음 CD8 양성 세포는 CD8 및 CD3 마커의 발현에 의해 게이팅되었다.
도 13c는 SARS-CoV-2 구조적 및 비-구조적 단백질에서 유래한 27개의 CD8+ T 세포 펩티드의 총 풀 중 10 μM의 10개의 면역우성 CD8+ T 세포 펩티드와 1개의 아우성 CD8+ T 세포 펩티드로 48시간 동안 자극된 비장세포 (106개의 세포/웰)로부터의 IFN-γ 생산 세포 스팟의 대표적인 ELISpot 이미지 (왼쪽 패널) 및 평균 빈도 (오른쪽 패널)을 보여준다. 각 ELISpot 이미지의 상단에 있는 숫자는 100만 개의 비장세포당 IFN-γ 생성 스팟 형성 T 세포(SFC)의 수를 나타낸다.
도 13d는 FACS에 의해 결정된 SARS-CoV-2 구조적 및 비-구조적 단백질에서 유래한 27개의 CD8+ T 세포 펩티드의 총 풀 중 10 μM의 10개의 면역우성 CD8+ T 세포 펩티드와 1개의 아우성 CD8+ T 세포 펩티드에 의한 IFN-γ 및 TNF- 생산, 및 그에 대한 CD107a/b 및 CD69 발현의 대표적인 FACS 플롯 (왼쪽 패널) 및 평균 빈도 (오른쪽 패널)를 보여준다 숫자는 3마리의 면역화된 마우스에서 검출된 IFN-γ+CD8+ T 세포, CD107+CD8+ T 세포, CD69+CD8+ T 세포 및 TNF-+CD8+ T 세포의 빈도를 나타낸다.
도 14는 SARS-CoV/SARS-CoV-2 게놈이 16개의 비구조적 단백질(NSP1-NSP16)을 인코딩하는 2개의 큰 비-구조적 유전자 ORF1a(녹색) 및 ORF1b(회색)를 인코딩함을 보여준다. 게놈은 수, 게놈 조직, 서열 및 기능 면에서 SARS-CoV/SARS-CoV-2에 고유한 적어도 6개의 보조 단백질(밝은 회색 음영)을 인코딩한다. 일반적인 SARS-CoV, SARS-CoV-2 및 SL-CoV 유래 인간 B (청색), CD4+ (녹색) 및 CD8+ (흑색) T 세포 에피토프가 표시된다. 이 연구에 이용된 구조적 및 비구조적 열린 해독틀은 SARS-CoV-2-Wuhan-Hu-1 균주 (NCBI 수탁 번호 MN908947.3, 서열번호: 1)로부터의 것이다. SARS-CoV-2-Wuhan-Hu-1 구조적 및 비-구조적 단백질의 아미노산 서열은 본 명세서에 기재된 바와 같은 상이한 계산 알고리즘을 사용하여 인간 B, CD4+ 및 CD8+ T 세포 에피토프에 대해 스크리닝되었다. 인간과 동물 코로나바이러스 간에 고도로 보존된 게놈 전체 확인된 SARS-CoV-2 인간 B 세포 에피토프 (청색), CD4+ T 세포 에피토프 (녹색), CD8+ T 세포 에피토프 (흑색)가 보여진다.
도 15는 HLA-DR 분자에 높은 친화도로 결합하는 고도로 보존된 잠재적인 SARS-CoV-2 유래 인간 CD4+ T 세포 에피토프의 확인을 보여준다: SARS-CoV-2-Wuhan-Hu-1 균주(MN908947.3)의 전체 게놈 서열로부터의 잠재적인 HLA-DR-restricted CD4+ T 세포 에피토프 총 9,594개 중에서, HLA-DRB1 분자에 높은 친화도로 결합하는 16개의 에피토프가 선택되었다. 16개의 CD4+ T 세포 에피토프의 보존성은 인간 및 동물 코로나바이러스 중에서 분석되었다. 81,963개의 SARS-CoV-2 균주(현재 6개에서 순환), 이전에 발병한 4가지 주요 '보통 감기' 코로나바이러스(즉 hCoV-OC43, hCoV-229E, hCoV-HKU1, 및 hCoV-NL63) 및 박쥐, 사향 고양이, 천산갑 및 낙타로부터 단리된 SL-CoV 중에서 16 CD4+ T 세포 에피토프에 대한 서열 상동성의 비교를 보여준다. 녹색으로 강조 표시된 에피토프 서열은 현재 순환 중인 81,963개의 SARS-CoV-2 균주 간에 높은 수준의 상동성 및 이전의 발병으로부터의 2개 이상의 인간 SARS-CoV 균주, 및 물질 및 방법에 기재된 바와 같은 박쥐, 사향 고양이, 천산갑 및 낙타로부터 단리된 SL-CoV 균주 중에서 적어도 50% 보존성을 제공한다. 호모사피엔스- 흑색, 박쥐 (라이놀러퍼스 아피니스, 라이놀러퍼스 말라야누스-적색), 천산갑 (마니스 야바니카-청색), 사향 고양이 (파구마 라바타-녹색), 및 낙타 (카멜루스 드로메다리에스-갈색).
도 16a는 HLA-DRB1 분자에 대한 고도로 보존된 SARS-CoV-2 CD4+ T 세포 에피토프의 분자 도킹을 보여준다. 인간 SARS-CoV-2 균주, 이전의 인간 SARS/MERS-CoV 및 박쥐 SL-CoV 사이에 보존된 16개의 CD4+ T 세포 에피토프의 HLA-DRB1 단백질 결정 구조 (PDB 수탁 번호: 4UQ3)의 홈으로의 분자 도킹은 GalaxyPepDock 서버를 사용하여 결정되었다. 16개의 CD4+ T 세포 에피토프는 무차별적으로 HLA-DRB1*01:01, HLA-DRB1*11:01, HLA-DRB1*15:01, HLA-DRB1*03:01 및 HLA-DRB1*04:01 대립유전자로 제한되어 있다. CD4+ T 세포 펩타이드는 볼 및 스틱 구조로 표시되고 HLA-DRB1 단백질 결정 구조는 주형으로 표시된다. 예측 정확도는 선형 회귀에 의해 얻은 단백질 구조적 유사성 점수(TM 점수) 및 상호작용 유사성 점수(SInter)에 의해 측정된 주형-표적 유사성과 정확하게 예측된 결합 부위 잔기의 분율 간의 관계로 선형 모델에서 추정된다. SInter는 HLA-DRB1 주형 구조의 아미노산에서 접촉 잔기에 정렬된 CD8+ T 세포 펩티드의 아미노산의 유사성을 보여준다.
도 16b는 단백질-펩티드 분자 도킹 분석으로부터 관찰된 CD4+ T 세포 특이적 에피토프의 상호작용 유사성 점수를 나타내는 히스토그램을 보여준다.
도 17a는 CD4+ T 세포가 COVID-19 환자 및 노출되지 않은 건강한 개체에서 검출된 고도로 보존된 SARS-CoV-2 에피토프에 특이적임을 보여주는 실험 설계를 보여준다: HLA-DRB1 양성 COVID-19 환자(n = 30) 및 대조군에 노출되지 않은 건강한 개체(n = 10)을 단리하고 16개의 SARS-CoV-2 유래 CD4+ T 세포 에피토프 각각 10μM으로 28시간 동안 자극하였다. IFN-- 세포의 수는 ELISpot 분석을 사용하여 정량화되었다.
도 17b는 도 17a로부터의 결과를 보여준다. 점선은 반응의 상대적 크기를 평가하기 위한 역치를 나타낸다: 평균 SFC가 25 내지 50이면 중간/중간 반답에 해당하는 반면, 강한 반응은 평균 SFC > 50에 대해 정의된다. HLA-DRB1 양성 COVID-19 환자의 PBMC
도 17c는 CD107a 및 CD107b에 특이적인 mAb, 및 골지-플러그 및 골지-스톱의 존재 하에 추가로 5시간 동안 추가로 자극한 결과를 보여준다. 그 다음, 2개의 스파이크 에피토프, CD107a/b 및 CD69 및 TNF-알파 발현에 특이적인 사량체를 FACS에 의해 측정하였다. 2개의 스파이크 CD4+ T 세포 에피토프 펩티드 그룹으로 프라이밍한 후 사량체+CD4+ T 세포, CD107a/b+CD4+ T 세포, CD69+CD4+ T 세포 및 TNF-+CD4+ T 세포의 빈도를 보여주는 대표적인 FACS 플롯. 사량체+CD4+ T 세포, CD107a/b+CD4+ T 세포, CD69+CD4+ T 세포 및 TNF-+CD4+ T 세포에 대한 평균 빈도가 표시된다.
도 18a는 HLA-A*02:01/HLA-DRB1 이중 형질전환 마우스에서 게놈 전체에 걸쳐 확인된 인간 SARS-CoV-2 CD4+ T 에피토프의 면역원성을 시험하기 위한 면역화 및 면역학적 분석의 시각표을 보여준다. 4개 그룹의 연령 일치 HLA-DRB1 형질전환 마우스(n = 3)를 명반 및 CpG1826 보조제로 전달된 4개의 SARS-CoV-2 유래 인간 CD4+ T 세포 펩티드 에피토프의 혼합물로 0일째와 14일째에 피하로 면역화하였다. 음성 대조군으로서, 마우스는 보조제만을 투여받았다(모의 면역화됨).
도 18b는 비장 유래 CD4+ T 세포를 특성화하기 위해 사용된 게이팅 전략을 보여준다. CD4 양성 세포는 CD4 및 CD3 발현 마커에 의해 게이팅되었다.
도 18c는 SARS-CoV-2 구조적 및 비-구조적 단백질에서 유래한 16개의 CD4+ T 세포 펩티드의 총 풀 중 10 μM의 7개의 면역우성 CD4+ T 세포 펩티드와 1개의 아우성 CD4+ T 세포 펩티드로 48시간 동안 자극된 비장세포 (106개의 세포/웰)로부터의 IFN-γ 생산 세포 스팟의 대표적인 ELISpot 이미지 (왼쪽 패널) 및 평균 빈도 (오른쪽 패널)을 보여준다. 총 세포 100만 개당 IFN-γ 생성 스팟 형성 T 세포(SFC)의 수가 각 ELISpot 이미지의 상단에 제시된다.
도 18d는 FACS에 의해 결정된 SARS-CoV-2에서 유래한 16개의 CD4+ T 세포 펩티드의 총 풀 중 10 μM의 7개의 면역우성 CD4+ T 세포 펩티드와 1개의 아우성 CD4+ T 세포 펩티드에 의한 IFN-γ 및 TNF-α 생산, 및 그에 대한 CD107a/b 및 CD69 발현의 대표적인 FACS 플롯 (왼쪽 패널) 및 평균 빈도 (오른쪽 패널)를 보여준다 숫자는 3마리의 면역화된 마우스에서 검출된 IFN-γ+CD4+ T 세포, CD107+CD4+ T 세포, CD69+CD4+ T 세포 및 TNF- α+CD4+ T 세포의 백분율을 나타낸다.
도 19는 인간, 박쥐, 사향 고양이, 천산갑 및 낙타 코로나바이러스 균주 사이에서 스파이크 유래 B 세포 에피토프의 보존을 보여준다: 인간, 박쥐, 사향고양이, 천산갑, 및 낙타에서 얻은 SARS 코로나바이러스(SARS-CoV)의 29개의 균주 중 ClustalW를 사용하여 다중 서열 정렬을 수행하였다. 이는 7개의 인간 SARS/MERS-CoV 균주 (SARS-CoV-2-Wuhan (MN908947.3), SARS-HCoV-Urbani (AY278741.1), CoV-HKU1-유전자형-B (AY884001), CoV-OC43 (KF923903), CoV-NL63 (NC005831), CoV-229E (KY983587), MERS (NC019843)); 8개의 박쥐 SARS-CoV 균주 (BAT-SL-CoV-WIV16 (KT444582), BAT-SL-CoV-WIV1 (KF367457.1), BAT-SL-CoV-YNLF31C (KP886808.1), BAT-SARS-CoV-RS672 (FJ588686.1), BAT-CoV-RATG13 (MN996532.1), BAT-CoV-YN01 (EPIISL412976), BAT-CoV-YN02 (EPIISL412977), BAT-CoV-19-ZXC21 (MG772934.1); 3개의 사향고양이 SARS-CoV 균주 (SARS-CoV-Civet007 (AY572034.1), SARS-CoV-A022 (AY686863.1), SARS-CoV-B039 (AY686864.1)); 9개의 천산갑 SARS-CoV 균주 (PCoV-GX-P2V(MT072864.1), PCoV-GX-P5E(MT040336.1), PCoV-GX-P5L (MT040335.1), PCoV-GX-P1E (MT040334.1), PCoV-GX-P4L (MT040333.1), PCoV-MP789 (MT084071.1), PCoV-GX-P3B (MT072865.1), PCoV-Guangdong-P2S (EPIISL410544), PCoV-Guangdong (EPIISL410721)); 4개의 낙타 SARS-CoV 균주 (낙타-CoV-HKU23 (KT368891.1), DcCoV-HKU23 (MN514967.1), MERS-CoV-Jeddah (KF917527.1), Riyadh/RY141 (NC028752.1)) 및 1 재조합 균주 (FJ211859.1))을 포함한다. 청색으로 강조 표시된 영역은 서열 상동성을 나타낸다. SARS 코로나바이러스의 2개 이상의 균주 중에서 50% 이상의 보존성을 나타내거나 수용체 결합 도메인(RBD) 특정 아미노산을 보유하는 B 세포 에피토프를 후보 에피토프로 선택하였다.
도 20a는 인간 ACE2 수용체에 대한 SARS-CoV-2 스파이크 당단백질 유래 B 세포 에피토프의 도킹, 예를 들어 SARS-CoV-2 스파이크 당단백질로부터 확인된 22개의 B-세포 에피토프와 ACE2 수용체의 분자 도킹을 보여준다. B 세포 에피토프 펩티드는 볼 및 스틱 구조로 표시되는 반면 ACE2 수용체 단백질은 주형으로 표시된다. S471-501 및 S369-393 펩티드 에피토프는 수용체 결합 도메인 영역 특이적 아미노산 잔기를 보유한다. 예측 정확도는 선형 회귀에 의해 얻은 단백질 구조적 유사성 점수 및 상호작용 유사성 점수(SInter)에 의해 측정된 주형-표적 유사성과 정확하게 예측된 결합 부위 잔기의 분율 간의 관계로 선형 모델에서 추정된다. SInter는 ACE2 주형 구조의 아미노산에서 접촉 잔기에 정렬된 B 세포 펩티드의 아미노산 유사성을 보여준다. 더 높은 SInter 점수는 ACE2 분자와 B-세포 펩타이드 간의 더 중요한 결합 친화도를 나타낸다.
도 20b는 단백질-펩티드 분자 도킹 분석으로부터 관찰된 22개의 B 세포 특이적 에피토프의 상호작용 유사성 점수의 요약을 보여준다. 상호작용 유사성 점수가 높은 B 세포 에피토프는 흑색으로 표시된다.
도 21a는 면역화된 B6 마우스 및 회복기 COVID-19 환자에서 IgG 항체가 SARS-CoV-2 스파이크 단백질 유래 B-세포 에피토프에 특이적임을 보여주기 위한 시험을 위한 면역화 및 면역학적 분석의 시각표을 보여준다. SARS-CoV-2 Spike 단백질에서 선택되고 B6 마우스에서 테스트된 총 22개의 SARS-CoV-2 유래 B 세포 에피토프 펩타이드가 항체 반응을 유도할 수 있었다. 4개 그룹의 연령 일치 B6 마우스(n = 3)를 명반 및 CpG1826 보조제에 에멀젼화된 4개 또는 5개의 SARS-CoV-2 유래 B-세포 펩티드 에피토프의 혼합물로 0일째와 14일째에 피하로 면역화하였다. 명반/CpG1826 보조제만 음성 대조군으로 사용하였다(모의 면역화됨).
도 21b는 면역화된 마우스의 비장에서 유세포 분석에 의해 결정된 IgG 생성 CD3(-)CD138(+)B220(+) 혈장 B 세포의 빈도를 보여준다. 예를 들어, 도 21b는 게이팅 전략이 다음과 같다는 것을 보여준다: 림프구는 낮은 전방 산란(FSC) 및 낮은 측면 산란(SSC) 게이트에 의해 식별되었다. 전방 산란 면적(FSC-A) 대 전방 산란 높이(FSC-H)를 플로팅하여 단일항을 선택하였다. 그 다음 B 세포는 CD3(-) 및 B220(+) 세포의 발현에 의해 게이트되었고 혈장 B 세포에 대한 CD138 발현이 결정되었다.
도 21c는 면역화된 마우스의 비장에서 유세포 분석에 의해 결정된 IgG 생성 CD3(-)CD138(+)B220(+) 혈장 B 세포의 빈도를 보여준다. 예를 들어, FG 15C는 면역화된 마우스의 비장에서 검출된 혈장 B 세포의 대표적인 FACS 플롯(왼쪽 패널) 및 평균 빈도(오른쪽 패널)를 보여준다. 혈장 CD138(-)B220(+)B 세포의 백분율은 각 도트 플롯의 왼쪽 상단에 표시된다.
도 21d는 SARS-CoV-2 유래 B-세포 에피토프-특이적 IgG 반응이 2차 면역화 후 14일(즉, 28일째)에 ELISpot (IgG(+) 스팟의 수)에 의해 면역 혈청에서 정량화되었음을 보여준다. 마우스 Poly-S(면역스팟)를 사용한 시험관 내 B 세포 다클론 자극 4일 후 항-펩티드 특이적 IgG 생성 B 세포 스팟 (1x106 비장세포/웰)의 대표적인 ELISpot 이미지 (왼쪽 패널) 및 평균 빈도 (오른쪽 패널). 각 ELISpot 이미지의 상단/왼쪽은 50만 세포당 IgG 생성 B 세포의 수를 보여준다. ELISA 플레이트를 각각의 개별 면역화 펩티드로 코팅하였다.
도 21e는 모의 백신접종된 마우스로부터 측정된 배경을 뺀 후 펩티드-면역화된 B6 마우스에서 검출된 IgG의 수준에서 ELISA에 의해 측정된 B-세포 에피토프-특이적 IgG 농도(μg/mL)를 보여준다. 파선 수평선은 검출 한계를 나타낸다.
도 21f 및 도 21g는 노출되지 않은 건강한 개체(n=10)로부터 측정된 배경의 차감 후, 각각의 22명의 스파이크 펩티드 검출된 SARS-CoV-2 감염된 환자 (n=40)의 수준에서 ELISA에 의해 측정된 B-세포 에피토프 특이적 IgG 농도(μg/mL)를 보여준다. 흑색 막대와 회색 막대는 각각 높은 면역원성 B 세포 펩티드와 중간 수준의 면역원성 B 세포 펩티드를 보여준다. 파선 수평선은 감지 한계를 나타낸다.
도 22는 6개의 프롤린 돌연변이를 포함하는 돌연변이를 포함하는 전체 스파이크 단백질의 예를 보여준다. 6개의 프롤린 돌연변이는 단일점 돌연변이 F817P, A892P, A899P, A942P, K986P 및 V987P를 포함한다. 추가로, 스파이크 단백질은 프로테아제 내성을 위한 퓨린 절단 부위의 682-QQAQ-685 돌연변이를 포함한다. 일부 구현예에서, K986P 및 V987P 돌연변이는 관류 안정화를 허용한다. 도 22는 또한 하기 서열을 나타낸다: MFVFLVLLPLVSS(서열번호: 188), ATGTTCGTGTTCCTGGTGCTGCTGCCCCTGGTGAGCAGC(서열번호: 175), CAGCAGGCCCAG(서열번호: 189), 및 CCCCCC(서열번호: 190).
도 23은 본 명세서에 기재된 조성물의 큰 서열이 어떻게 배열될 수 있는지의 비제한적인 예를 보여준다.
도 24는 본 발명의 프로토타입 코로나바이러스 백신의 개략도를 보여준다. 본 발명은 도시된 바와 같은 프로토타입 코로나바이러스 백신에 제한되지 않는다.
도 25a는 인간에서 "프라임/당김(prime/pull)" 레지멘을 사용하여 본 명세서에 기재된 백신 조성물을 전달하기 위한 방법의 비제한적 예를 보여준다. 방법은 범-코로나바이러스 재조합 백신 조성물을 투여하고 범-코로나바이러스 재조합 백신 조성물을 투여한 후 적어도 하나의 T-세포 유인 케모카인(예를 들어, CXCL11)을 추가로 투여하는 것을 포함한다.
도 25b는 인간에서 "프라임/부스트(prime/boost)" 레지멘을 사용하여 본 명세서에 기재된 백신 조성물을 전달하기 위한 방법의 비제한적 예를 보여준다. 방법은 제1 전달 시스템을 사용하여 제1 조성물, 예를 들어, 제1 범-코로나바이러스 재조합 백신 조성물 용량을 투여하고 제2 전달 시스템을 사용하여 제2 조성물, 예를 들어, 제2 백신 조성물 용량을 추가로 투여하는 것을 포함한다. 일부 구현예에서, 제1 전달 시스템 및 제2 전달 시스템은 상이하다.
도 25c는 SARS-CoV-2로부터 보호하기 위해 폐 상주 B-세포, CD4+ T 세포 및 CD8+ T 세포의 크기 및 유지를 증가시키기 위해 인간에서 "프라임/당김/유지" 레지멘을 사용하여 본 명세서에 기재된 백신 조성물을 전달하는 방법의 비제한적 예를 보여준다. 방법은 범-코로나바이러스 재조합 백신 조성물을 투여하고 범-코로나바이러스 재조합 백신 조성물을 투여한 후 적어도 하나의 T-세포 유인 케모카인(예를 들어, CXCL11 또는 CXCL17)을 투여하는 것을 포함한다.
도 25d는 SARS-CoV-2로부터 보호하기 위해 폐 상주 B-세포, CD4+ T 세포 및 CD8+ T 세포의 크기 및 유지를 증가시키기 위해 인간에서 "프라임/당김/부스트" 레지멘을 사용하여 본 명세서에 기재된 백신 조성물을 전달하는 방법의 비제한적 예를 보여준다. 방법은 범-코로나바이러스 재조합 백신 조성물을 투여하고 범-코로나바이러스 재조합 백신 조성물을 투여한 후 적어도 하나의 T-세포 유인 케모카인(예를 들어, CXCL11 또는 CXCL17)을 투여하는 것을 포함한다. 방법은 T-세포 유인 케모카인(예를 들어, IL-7, IL-5, 또는 IL-2)을 투여한 후 적어도 하나의 사이토카인을 투여하는 단계를 추가로 포함한다.
도 26a는 가축 (예를 들어 고양이 또는 개)에서 "프라임/당김(prime/pull)" 레지멘을 사용하여 본 명세서에 기재된 백신 조성물을 전달하기 위한 방법의 비제한적 예를 보여준다. 방법은 범-코로나바이러스 재조합 백신 조성물을 투여하고 범-코로나바이러스 재조합 백신 조성물을 투여한 후 적어도 하나의 T-세포 유인 케모카인(예를 들어, CXCL11)을 추가로 투여하는 것을 포함한다.
도 26b는 가축 (예를 들어 고양이 또는 개)에서 "프라임/부스트(prime/boostl)" 레지멘을 사용하여 본 명세서에 기재된 백신 조성물을 전달하기 위한 방법의 비제한적 예를 보여준다. 방법은 제1 전달 시스템을 사용하여 제1 조성물, 예를 들어, 제1 범-코로나바이러스 재조합 백신 조성물 용량을 투여하고 제2 전달 시스템을 사용하여 제2 조성물, 예를 들어, 제2 백신 조성물 용량을 추가로 투여하는 것을 포함한다. 일부 구현예에서, 제1 전달 시스템 및 제2 전달 시스템은 상이하다.
도 26c는 SARS-CoV-2로부터 보호하기 위해 폐 상주 B-세포, CD4+ T 세포 및 CD8+ T 세포의 크기 및 유지를 증가시키기 위해 가축 (예를 들어 고양이 또는 개)에서 "프라임/당김/유지" 레지멘을 사용하여 본 명세서에 기재된 백신 조성물을 전달하는 방법의 비제한적 예를 보여준다. 방법은 범-코로나바이러스 재조합 백신 조성물을 투여하고 범-코로나바이러스 재조합 백신 조성물을 투여한 후 적어도 하나의 T-세포 유인 케모카인(예를 들어, CXCL11 또는 CXCL17)을 투여하는 것을 포함한다.
도 26d는 SARS-CoV-2로부터 보호하기 위해 폐 상주 B-세포, CD4+ T 세포 및 CD8+ T 세포의 크기 및 유지를 증가시키기 위해 가축 (예를 들어 고양이 또는 개)에서 "프라임/당김/부스트" 레지멘을 사용하여 본 명세서에 기재된 백신 조성물을 전달하는 방법의 비제한적 예를 보여준다. 방법은 범-코로나바이러스 재조합 백신 조성물을 투여하고 범-코로나바이러스 재조합 백신 조성물을 투여한 후 적어도 하나의 T-세포 유인 케모카인(예를 들어, CXCL11 또는 CXCL17)을 투여하는 것을 포함한다. 방법은 T-세포 유인 케모카인(예를 들어, IL-7, IL-5, 또는 IL-2)을 투여한 후 적어도 하나의 사이토카인을 투여하는 단계를 추가로 포함한다.
용어
달리 설명되지 않는 한, 본원에 사용된 모든 기술적 및 과학적 용어는 통상적으로 개시된 발명이 속한 당해기술의 숙련가에에 의해 이해되는 것과 동일한 의미를 갖는다. 단수 용어 'a', 'an', 및 'the'는 맥락상 달리 명확하게 나타내지 않는 한, 복수의 지시대상을 포함한다. 이와 유사하게, 단어 '또는'은 맥락상 달리 명확하게 나타내지 않는 한, '및'을 포함하기 위한 것이다. 용어 '포함하는'은 제시된 정의된 요소 이외에도, 다른 요소가 존재할 수 있음을 의미한다다. '~을/를 포함하는'의 사용은 제한보다 포함을 나타낸다. 또 다른 방식으로 언급될 때, 용어 '~을/를 포함하는'은 주로 하기를 포함하지만, 반드시 하기만을 포함하지 않는'을 의미한다. 또한, 단어 '~을/를 포함하는', 예컨대 '~들을 포함하다' 및 '~을/를 포함하다'의 변화는 이에 상응하여 동일한 의미를 갖는다. 일 측면에서, 본원에 기재된 기술은, 본 발명에 필수적이나 필수적일 수도 또는 그렇지 않을 수도 있는 불특정 요소의 포함에도 개방된, 본원에 기재된 조성물, 방법, 및 이들의 각각의 구성요소(들)에 관한 것이었다.('~을/를 포함하는').
본 개시내용의 구현예의 실시 및/또는 시험을 위한 적합한 방법 및 물질이 아래에 기재되어 있다. 이와 같은 방법 및 물질은 단지 예시적인 것으로, 제한하는 것으로 의도되지 않는다. 본원에 기재된 것들과 유사하거나 동등한 다른 방법 및 물질이 사용될 수 있다. 예를 들어, 본 개시내용과 관련한 당해 기술에 잘 알려진 종래의 방법이 다양한 일반 참조 문헌 및 좀 더 구체적인 참조문헌, 예컨대, 예를 들어, Sambrook 등, Molecular Cloning: A Laboratory Manual, 2d ed., Cold Spring Harbor Laboratory Press, 1989; Sambrook 등, Molecular Cloning: A Laboratory Manual, 3d ed., Cold Spring Harbor Press, 2001; Ausubel 등, Current Protocols in Molecular Biology, Greene Publishing Associates, 1992 (and Supplements to 2000); Ausubel 등, Short Protocols in Molecular Biology: A Compendium of Methods from Current Protocols in Molecular Biology, 4th ed., Wiley & Sons, 1999; Harlow and Lane, Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory Press, 1990; 및 Harlow and Lane, Using Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory Press, 1999, Gene Expression Technology (Methods in Enzymology, Vol. 185, edited by D. Goeddel, 1991. Academic Press, San Diego, Calif.), "Guide to Protein Purification" in Methods in Enzymology (M. P. Deutshcer, ed., (1990) Academic Press, Inc.); PCR Protocols: A Guide to Methods and Applications (Innis, 등 1990. Academic Press, San Diego, Calif.), Culture of Animal Cells: A Manual of Basic Technique, 2nd Ed. (R. I. Freshney. 1987. Liss, Inc. New York, N.Y.), Gene Transfer and Expression Protocols, pp. 109-128, ed. E. J. Murray, The Humana Press Inc., Clifton, N.J.), and the Ambion 1998 Catalog (Ambion, Austin, Tex.)에 기재되어 있는데, 그 개시내용은 전체적으로 본원에 참조로 편입되었다.
본원에 기재된 것들과 유사하거나 동등한 방법 및 물질이 개시된 기술을 실시하거나 또는 실험하기 위해 사용될 수 있지만, 적합한 방법 및 물질이 아래에 기재되어 있다. 상기 물질, 방법, 및 예들은 단지 예시적인 것으로, 제한하는 것으로 의도되지는 않는다.
본원에서 사용된 바와 같이, 용어 '면역원성 단백질, 폴리펩티드, 또는 펩티드' 또는 '항원'은 숙주에 일단 투여되면, 상기 단백질을 겨냥하는 체액성 및/또는 세포 유형의 면역 반응을 유발할 수 있다는 점에서, 면역학적으로 활성인 폴리펩티드 또는 다른 분자 (또는 폴리펩티드와 다른 분자의 조합물)를 지칭한다. 구현예에서, 단백질 단편은 실질적으로 전체 단백질과 동일한 면역학적 활성을 갖는다. 따라서, 본 개시내용에 따른 단백질 단편은 적어도 하나의 에피토프 또는 항원 결정인자를 포함하거나 본질적으로 이들로 이루어지거나 또는 이들로 이루어질 수 있다. 본원에서 사용된 바와 같이 '면역원성' 단백질 또는 폴리펩티드는단백질의 전장 서열, 이것의 유사체, 또는 이것의 면역원성 단편을 포함할 수 있다. '면역원성 단편'은 하나 이상의 에피토프를 포함하고, 따라서 상기에 기재된 면역학적 반응을 유도하는 단백질의 단편을 지칭한다.
합성 항원은 또한 정의, 예를 들어, 폴리에피토프, 측접 에피토프, 및 다른 재조합 또는 합성으로 유래된 항원 내에 포함된다. 본 개시내용의 목적에 대한 면역원성 단편은 분자의 적어도 약 1개 아미노산, 적어도 약 3개 아미노산, 적어도 약 5개 아미노산, 적어도 약 10-15개 아미노산, 또는 약 15-25개 아미노산 또는 그 이상의 아미노산을 특징으로 할 수 있다. 단편의 길이에 임계 상한치는 존재하지 않으며, 단백질 서열의 거의 전장을, 또는 서열의 전장을 또는 상기 단백질의 적어도 하나의 에피토프를 포함하는 융합 단백질을 포함할 수 있다.
본원에서 사용된 바와 같이, 용어 '에피토프'는 특이적 B 세포 및/또는 T 세포가 반응하는 항원 또는 합텐 상의 부위를 지칭한다. 용어는 또한 '항원 결정인자' 또는 '항원 결정인자 부위'와 상호교환적으로 사용된다. 동일한 에피토프를 인식하는 항체들이 또 다른 항체의 표적 항원 결합을 차단하는 한 항체의 능력을 보여주는 단순한 면역검정에서 확인될 수 있다.
본원에서 사용된 바와 같이, 용어 조성물 또는 백신에 대한 '면역학적 반응'은 숙주에서 관심 대상 조성물 또는 백신에 대한 세포 및/또는 항체-매개 면역 반응의 전개를 지칭한다. 통상적으로, '면역학적 반응'은 다음의 효과들 중 하나 이상을, 비제한적으로, 포함한다: 관심 대상의 조성물 또는 백신에 포함된 항원 또는 항원에 특이적으로 지향된 항체, B 세포, 헬퍼 T 세포, 및/또는 세포독성 T 세포의 생산. 숙주는 치료적 또는 보호 면역학적 반응 중 하나를 보임으로써 새로운 감염에 대한 저항이 향상되거나 및/또는 질환의 임상적 중증도가 감소될 것이다. 이러한 보호가 감염된 숙주에 의해 정상적으로 드러나는 증상의 감소 또는 결여, 감염된 숙주에서 더 빨라진 회복 시간 및/또는 낮아진 바이러스 역가에 의해 입증될 것이다.
본원에서 사용된 바와 같이, 용어 '변이체'는 실질적으로 유사한 서열을 지칭한다. 폴리뉴클레오티드의 경우, 변이체는 천연(native) 폴리뉴클레오티드 내의 하나 이상의 부위에서 하나 이상의 뉴클레오티드의 결실 및/또는 첨가 및/또는 변경을 포함하고, 및/또는 천연 폴리뉴클레오티드의 하나 이상의 부위에서 하나 이상의 뉴클레오티드의 치환을 포함한다. 본원에서 사용된 바와 같이, '천연' 폴리뉴클레오티드 또는 폴리펩티드는 각각 자연 발생 뉴클레오티드 서열 또는 아미노산 서열을 포함한다. 본 개시내용의 특정 폴리뉴클레오티드(예를 들어, 기준 폴리뉴클레오티드)의 변이체는 또한 변이체 폴리뉴클레오티드에 의해 인코딩된 폴리펩티드와 기준 폴리뉴클레오티드에 의해 인코딩된 폴리펩티드 사이의 서열 동일성 퍼센트의 비교에 의해 평가될 수 있다. '변이체' 단백질은 천연 단백질의 하나 이상의 부위에서 하나 이상의 아미노산의 결실 또는 첨가에 의해 및/또는 천연 단백질의 하나 이상의 부위의 하나 이상의 아미노산의 치환에 의해 천연 단백질에서 유래된 단백질을 의미하기 위한 것이다. 본 개시내용에 의해 포괄된 변이체 단백질은 생물학적으로 활성으로, 즉, 면역 반응을 유발하는 능력을 가진다.
본원에 언급된 HLA-DR/HLA-A*0201/hACE2 삼중 형질전환 마우스 모델은 ACE2 형질전환 마우스를 고유한 HLA-DR/HLA-A*0201 이중 형질전환 마우스와 교차시킴으로써 유래된 인간 COVID-19 백신 후보의 전-임상 실험을 위한 새로운 민감한 동물 모델이다. ACE2 형질전환 마우스는 폐, 심장, 신장 및 장에서 인간 ACE2 수용체를 발현하는 hACE2 형질전환 마우스 모델이다(Jackson Laboratory, Bar Harbor, ME). HLA-DR/HLA-A*0201 이중 형질전환 마우스는 상응하는 마우스 MHC 분자(녹아웃됨) 대신에 인간 백혈구 항원 HLA-A*0201 클래스 I 및 HLA DR*0101 클래스 II를 발현하는 '인간화된' HLA 이중 형질전환 마우스이다. HLA-A*0201 일배체형은 인종 또는 민족과 무관하게 인간 집단에서 상당히 재현(> 50%)되기 때문에 선택되었다. HLA-DR/HLA-A*0201/hACE2 삼중 형질전환 마우스 모델은 '인간화된' 형질전환 마우스 모델이고 세 가지 이점을 갖는다: (1) 인간 SARS-CoV2에 감염되기 쉽다; (2) 인간의COVID-19에서 보여지는 증상들과 유사한 증상을 보인다; 및 (3) 인간 에피토프에 대한 CD4+ T 세포 및 CD8+ T 세포 반응을 보인다. 본 발명의 새로운 HLA-DR/HLA-A*0201/hACE2 삼중 형질전환 마우스 모델은 본 발명의 인간 다중-에피토프 COVID-19 백신 후보의 안전성, 면역원성 및 보호 효능의 전-임상 실험에 사용될 수 있다.
본원에서 사용된 바와 같이, 용어 '치료하다' 또는 '치료' 또는 '치료하는'은 요법적 치료 및 예방적 또는 방지적 방안을 지칭하되, 객체는 발병을 방지 또는 지연시키는 것으로, 예컨대 장애의 발달을 둔화시키거나, 또는 병태, 질환 또는 장애, 예를 들어, 장기 또는 조직의 불충분한 또는 바람직하지 않은 기능을 특징으로 하는 임의의 장애의 적어도 하나의 역효과 또는 증상을 감소시키는 것이다. 치료는 일반적으로 용어가 본원에 정의된 바와 같이, 하나 이상의 증상 또는 임상 마커가 감소될 경우, '효과적'이다. 대안적으로, 치료는 질병의 진행이 감소 또는 중단되는 경우에, '효과적'이다. 즉, '치료'는 증상의 개선 또는 질병의 마커의 쇠퇴 뿐만 아니라, 또한 치료의 부재 시 예상되는 증상의 진행 또는 악화의 중단 또는 서행을 포함한다. 유익한 또는 원하는 임상 결과에는, 검출가능하든 검출가능하지 않든지 간에, 비제한적으로, 하나 이상의 증상(들)의 완화, 질환 정도의 약화, 질병의 안정화된(예를 들어, 악화되지 않음) 상태, 질병 진행의 지연 또는 늦춤, 질병 상태의 개선 또는 경감 및 차도(부분적 또는 전체적으로)가 포함된다. '치료'는 또한 치료를 받지 않은 경우에 예상되는 생존율과 비교하여 생존 연장을 의미한다. '치료'는 또한 질병의 개선, 그것의 합병증의 중증도의 축소, 질병의 뚜렷한 발현 방비, 질병의 재발 방지, 단지 질병의 악화 방지, 거기에 포함되는 염증 반응의 경감, 또는 이와 같은 이 궁극적으로 성공하지 못한 경우라도 상기 언급된 것 중 어느 하나에라도 영향을 미치는 치료적 노력을 포함한다.
본원에서 사용된 바와 같이, 용어 '담체' 또는 '약제학적으로 허용가능한 담체' 또는 '약제학적으로 허용가능한 운반체'는 조성물을 개체에 유입시키기 위한 임의의 적절한 또는 유용한 담체 또는 운반체를 지칭한다. 약제학적으로 허용가능한 담체 또는 운반체는 종래의 것일 수 있으나, 종래의 운반체에 제한되지 않는다. 예를 들어, E. W. Martin, Remington's Pharmaceutical Sciences, Mack Publishing Co., Easton, PA, 15th Edition (1975) and D. B. Troy, ed. Remington: The Science and Practice of Pharmacy, Lippincott Williams & Wilkins, Baltimore MD and Philadelphia, PA, 21st Edition (2006)에 하나 이상의 치료 화합물 또는 분자의 약제학적 전달을 위해 적합한 조성물 및 제형이 기술되었다. 담체(예를 들어, 약제학적 담체, 약제학적 운반체, 약제학적 조성물, 약제학적 분자, 등)는 신체에 일반적으로 분자, 단백질, 세포 및/또는 약물 및/또는 다른 적절한 물질을 전달하는 것으로 알려진 물질이다. 일반적으로, 담체의 본질은 이용되는 특정 투여 방식 뿐만 아니라 전달되는 조성물의 본질에 따라 달라질 것이다. 생물학적-중성 담체 이외에, 투여되는 약제학적 조성물은 소량의 비독성 보조 물질, 예컨대 습윤제 또는 유화제, 보존제 및 pH 완충제 등을 함유할 수 있다. 약제학적 담체를 기술한 특허에는, 비제한적으로 하기가 포함된다: 미국 특허 번호 제6,667,371호; 미국 특허 번호 제6,613,355호; 미국 특허 번호 제6,596,296호; 미국 특허 번호 제6,413,536호; 미국 특허 번호 제5,968,543호; 미국 특허 번호 제4,079,038호; 미국 특허 번호 제4,093,709호; 미국 특허 번호 제4,131,648호; 미국 특허 번호 제4,138,344호; 미국 특허 번호 제4,180,646호; 미국 특허 번호 제 4,304,767호; 미국 특허 번호 제4,946,931호, 이들의 개시내용은 전체적으로 본원에 참조로 편입되었다. 담체는 예를 들어, 고체, 액체(예를 들어, 용액), 포말, 겔 등, 또는 이들의 조합일 수 있다. 일부 구현예에서, 담체는 생물학적 매트릭스(예를 들어, 생물학적 섬유, 등)를 포함한다. 일부 구현예에서, 담체는 합성 매트릭스(예를 들어, 합성 섬유 등)를 포함한다. 특정 구현예에서, 담체의 일부는 생물학적 매트릭스를 포함할 수 있고, 그것의 나머지는 합성 매트릭스를 포함할 수 있다.
본원에서 사용된 바와 같이 '코로나바이러스'는 관련된 바이러스 예컨대, 비제한적으로, 중증 급성 호흡기 증후군(SARS), 중동호흡기 증후군(MERS) 및 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2)의 그룹을 지칭한다. 모든 코로나바이러스는 포유동물에서 '경미한'에서 '치명적인'의 범위에 속하는 기도 감염을 유발한다. 코로나바이러스 균주의 몇 개의 비-제한적인 예가 본원에 기재되어 있다.
본원에서 사용된 바와 같이, '중증 급성 호흡기 증후군 코로나바이러스 2 (SARS-CoV2)'는 코로나바이러스 질환 19(COVID-19)를 유발하는 베타코로나바이러스이다.
'대상체'는 개인으로, 비제한적으로, 포유동물(예를 들어, 인간, 말, 돼지, 토끼, 개, 양, 염소, 비-인간 영장류, 소, 고양이, 기니아 피그, 또는 설치류), 어류, 조류, 파충류 또는 양서류를 포함한다. 상기 용어는 특정 연령 또는 성별을 나타내지 않는다. 따라서, 성체 및 태아 뿐 아니라 신생 대상체가, 수컷이든 암컷이든, 포함되는 것이다. '환자'는 질병 또는 장애로 고통받는 대상체이다. 용어 '환자'는 인간 및 수의과 대상체를 포함한다.
용어 '투여하는', 및 '투여'는 대상체에 약제학적 제제를 제공하는 방법을 지칭한다. 이러한 방법은 당업자에 잘 알려져있고, 비제한적으로, 경구로, 비경구로(예를 들어, 정맥내로 및 피하로), 근육내 주사로, 복강내 주사로, 척추강내로, 경피로, 체외로, 국소로 조성물을 투여하는 것을 포함한다.
조성물은 또한 국소 비강내 투여(비강내로)에 의해 또는 흡입제에 의한 투여에 의해 투여될 수 있다. 본원에서 사용된 바와 같이, '국소 비강내 투여'는 콧구멍 하나 또는 둘 모두를 통해 코 및 비강으로 조성물의 전달을 의미하고, 분무 기구(장치) 또는 액적 기구(장치)에 의한, 또는 조성물의 에어로졸화를 통한 전달을 포함할 수 있다. 흡입제에 의한 조성물의 투여는 분무 또는 액적 기구에 의한 전달을 통해 코 또는 입을 통해 이루어질 수 있다. 본원에서 사용된 바와 같이, '흡입기'는 약제학적으로 허용가능한 담체 중 백신 조성물을 포함하는 조성물을 대상체의 비강 및 상부 및/또는 하부 기도로 전달하기 위한 분무 장치 또는 액적 장치일 수 있다. 전달은 기관내 삽관을 통해 호흡계(예를 들어, 폐)의 임의의 부위에 직접적일 수 있다. 필요한 조성물의 정확한 양은 인종, 연령, 체중 및 대상체의 일반적인 상태, 치료 중인 장애의 중증도, 사용된 특정 조성물, 그것의 투여 방식 등에 따라, 대상체 별로, 달라질 것이다. 따라서, 모든 조성물에 대한 정확한 양을 명시하는 것은 가능하지 않다. 그러나, 적절한 양은 본원의 교시를 고려해 볼 때, 일상적인 실험만을 사용하는 당업자에 의해 결정될 수 있다.
조성물은 또한 협측 전달 또는 설하 전달에 의해 투여될 수 있다. 본원에서 사용된 바와 같이 '협측 전달'은 화합물이 뺨의 내부를 감싸는 점막을 통해 전달되는 투여 방법을 지칭할 수 있다. 일부 구현예에서, 협측 전달을 위해, 상기 백신 조성물은 환자의 잇몸과 뺨 사이에 놓인다. 본원에서 사용된 바와 같이 '설하 전달'은 화합물이 혀 아래 점막을 통해 전달되는 투여 방법을 지칭할 수 있다. 일부 구현예에서, 설하 전달을 위해, 상기 백신 조성물이 환자의 혀 아래에 투여된다.
조성물의 비경구 투여가 사용되는 경우, 일반적으로 주사로 특징지어 진다. 주사제는 종래의 형태, 액체 용액 또는 현탁액, 주사 이전에 액체 중 현탁액 용액에 적합한 고체 형태, 또는 에멀젼 중 하나로 제조될 수 있다. 가장 최근에 개정된 비경구 투여를 위한 접근법은 일정한 복용량이 유지되도록 서방형 또는 지속형 제제의 사용을 수반한다. 예를 들어, 미국 특허 번호 제3,610,795호를 참고할 수 있는데, 이것은 본원에 참조로 편입된다.
본 화합물, 조성물, 및/또는 방법이 개시되고 기재되기 전에, 본 발명이 특정 합성 방법 또는 특정 조성물이 물론 달라질 수 있으나, 이들에 제한되지 않음이 이해되어야 한다. 또한 본원에 사용된 용어가 특정 구현예를 기술하기 위한 것일뿐, 제한하는 것으로 의도되지 않음이 이해되어야 한다. 본 발명의 구현예들은 상호 배타적이지 않다면, 서로 자유롭게 조합될 수 있다.
범(Pan)-코로나바이러스 백신
본 발명은 선제적인 범-코로나바이러스 백신, 사용 방법, 및 백신의 생산 방법, 코로나바이러스 감염 예방 방법 등을 특징으로 한다. 본 발명은 또한 백신을 실험하는 방법, 예를 들어, 특정 동물 모델 및 임상 시험을 사용하는 방법을 제공한다. 본원의 백신 조성물은, 예를 들어, 항체(Abs), CD4+ T 헬퍼(Th1) 세포, 및 CD8+ 세포독성 T-세포(CTL)의 생산을 유도함으로써, 코로나바이러스 질병 또는 감염에 대한 효율적이고 강력한 보호를 유도할 수 있다.
상기 백신 조성물, 예를 들어, 본원의 항원은 다중 보존 에피토프를 포함할 수도 있고, 신체가 감염을 예방하기 위해 면역 반응을 전개시킬 다수의 기회를 제공하는 데 일조하는 다중 큰 서열을 특징으로 한다. 또한, 본원의 백신은 과거, 현재, 및 향후 코로나바이러스 발발에 대항하여 효과적이도록 설계될 수 있다.
상기 백신 조성물은 다중 큰 서열을 포함한다. 특정 구현예에서, 큰 서열은 보존된 큰 서열, 예를 들어, 인간 코로나바이러스 및/또는 동물 코로나바이러스(예를 들어, 코로나바이러스 감염에 취약한 동물에서 단리된 코로나바이러스) 사이에서 상당히 보존된 서열이다.
본 발명은 B 세포, CD4+ T 세포, 및 CD8+ T 세포 에피토프를 포함하는 보존된 큰 서열의 식별을 기술한다. 예를 들어, 도 1은 다중 B 세포 에피토프, 다중 보존된 CD8+ T 세포 에피토프, 및 다중 CD4+ T 세포 에피토프를 포함하는 다중 보존된 큰 서열을 특징으로 하는 선제적 범-코로나바이러스 백신의 개발의 개략도를 보여준다. 큰 서열은 많은 코로나바이러스의 서열 분석에서 유래된다.
보존된 큰 서열을 결정하기 위해 사용된 코로나바이러스는, 본원에 기재된 바와 같이, 동물 CoV(예를 들어, 박쥐, 천산갑, 사향 고양이, 밍크, 낙타, 등) 뿐만 아니라 인간 SARS-CoV를 포함할 수도 있다. 예로서, 도 2a 및 도 2b는 인간 및 동물에서 단리된 베타-코로나바이러스 균주들 사이에서 게놈 서열의 진화론적 비교를 보여준다. 도 2a는 박쥐에서 수득된 동물의 SARS-유사 코로나바이러스 게놈 서열(SL-CoVs) 서열(라이노로푸스 아피니스, 라이노로푸스 말라이아누스 (적색)), 천산값(마니스 자바니카(청색), 사향 고양이(파구마 라르바타(녹색), 및 낙타 (카멜루스 드로메다리우스(갈색))와 함께, SARS-CoV-2 균주들(인간(호모사피엔스(검정)에서 수득됨) 사이에서 수행된 계통발생적 분석을 보여준다. 포함된 SARS-CoV/MERS-CoV 균주는 이전의 발발에서 유래된다(인간(Urbani, MERS-CoV, OC43, NL63, 229E, HKU1-유전자형-B), 박쥐(WIV16, WIV1, YNLF-31C, Rs672, 재조합 균주), 낙타(카멜루스 드로메다리우스, (KT368891.1, MN514967.1, KF917527.1, NC_028752.1) 및 사향 고양이 (사향 고양이007, A022, B039)에서 수득됨). 인간 SARS-CoV-2 게놈 서열이 여섯 개 대륙에서 제시된다. 도 2b는 여섯 개 대륙에서 보고된 인간-SARS-CoV-2 게놈 서열과 박쥐에서 수득된 SARS-CoV-2 게놈 서열(라이노로푸스 아피니스, 라이노로푸스 말라이아누스), 및 천산갑(마니스 자바니카)) 사이에 수행된 진화론적 분석을 보여준다.
추가로, 다른 코로나바이러스는 '우려대상 변이체' 또는 '관심대상 변이체'로 분류된 기준을 충족시키는 보존된 큰 서열(동물 CoV(예를 들어, 박쥐, 천산갑, 사향 고양이, 밍크, 낙타, 등)) 뿐만 아니라 인간 SARS-CoVs를 포함)을 결정하기 위해 사용될 수도 있다. 하기에 언급되는 기준 중 하나 이상을 충족시키는 것으로 보이는 코로나바이러스 변이체는 이들 특성의 검증 및 유효성을 기다리는 동안 '관심대상 변이체' 또는 '연구 중인 변이체'로 표지될 수 있다. 일부 구현예에서, 기준은 증가된 전파력, 증가된 이환율, 증가된 사망률, '장기적 COVID'의 증가된 위험, 진단 시험에 의한 검출의 회피 능력, 항바이러스 약물(이와 같은 약물이 이용가능한 경우)에 대한 줄어든 감수성, 치료적이든(예를 들어, 회복 중인 플라즈마 또는 단클론성 항체) 또는 실험실 실험에서든, 중화 항체에 대한 줄어든 감수성, 자연 항체 회피 능력(예를 들어, 재감염 유발), 백신접종된 개체들을 감염시키는 능력, 특정 질환, 예컨대 다발계통 염증성 증후군 또는 장기적 COVID의 증가된 위험 또는, 특정 인구통계적 또는 임상 그룹, 예컨대 소아 또는 면역저하된 개체들에 대한 증가된 친화도를 포함할 수 있다. 일단 검증되면, 관심 대상의 변이체는 감시 조직, 예컨대 CDC에 의해 '우려대상 변이체'로 재명명된다.
보존된 큰 서열은 코로나바이러스의 구조적(예를 들어, 스파이크 당단백질, 외피 단백질, 막 단백질, 핵단백질) 또는 비-구조적 단백질(예를 들어, ORF1a/b에 의해 인코딩된 임의의 16 NSP)에서 유래될 수 있다.
일부 구현예에서, 큰 서열 각각은 하기 중 하나 또는 그 조합 사이에서 상당히 보존된다: SARS-CoV-2 인간 균주, 박쥐에서 단리된 SL-CoV, 천산갑에서 단리된 SL-CoV, 사향 고양이에서 단리된 SL-CoV, 및 낙타에서 단리된 MERS 균주. 예를 들어, 특정 구현예에서, 큰 서열 각각은 하기 중 하나 또는 그 조합 사이에서 상당히 보존된다: 적어도 50,000 SARS-CoV-2 인간 균주, 박쥐에서 단리된 5개 SL-CoV, 천산갑에서 단리된 5개 SL-CoV, 사향 고양이에서 단리된 3개 SL-CoV 및 낙타에서 단리된 4개 MERS 균주. 특정 구현예에서, 큰 서열 각각은 하기 중 하나 또는 그 조합 사이에서 상당히 보존된다: 적어도 80,000개 SARS-CoV-2 인간 균주, 박쥐에서 단리된 5개 SL-CoV, 천산갑에서 단리된 5개 SL-CoV, 사향 고양이에서 단리된 3개 SL-CoV, 및 낙타에서 단리된 4개 MERS 균주. 특정 구현예에서, 큰 서열 각각은 하기 중 하나 또는 그 조합 사이에서 상당히 보존된다: COVI-19 팬데믹 중 유행 중인 적어도 50,000개 SARS-CoV-2 인간 균주, 이전의 인간 발발을 유발했던 적어도 하나의 CoV, 박쥐에서 단리된 5개 SL-CoV, 천산갑에서 단리된 5개 SL-CoV, 사향 고양이에서 단리된 SL-CoV 및 낙타에서 단리된 4개의 MERS 균주. 특정 구현예에서, 큰 서열 각각은 현재 유행 중인 적어도 1개 SARS-CoV-2 인간 균주, 이전의 인간 발발을 유발했던 적어도 하나의 CoV, 박쥐에서 단리된 적어도 하나의 SL-CoV, 천산갑에서 단리된 적어도 하나의 SL-CoV, 사향 고양이에서 단리된 적어도 하나의 SL-CoV 및 낙타에서 단리된 적어도 하나의 MERS 균주 사이에서 상당히 보존된다. 특정 구현예에서, 큰 서열 각각은 현재 유행 중인 적어도 1,000개 SARS-CoV-2 인간 균주, 이전의 인간 발발을 유발하였던 적어도 2개의 CoV, 박쥐에서 단리된 적어도 2개의 SL-CoV, 천산갑에서 단리된 적어도 2개의 SL-CoV, 사향 고양이에서 단리된 적어도 2개의 SL-CoV 및 낙타에서 단리된 적어도 2개의 MERS 균주 사이에서 상당히 보존된다. 특정 구현예에서, 큰 서열 각각은 하기 중 하나 또는 그 조합 사이에서 상당히 보존된다: 현재 유행 중인 적어도 하나의 SARS-CoV-2 인간 균주, 이전의 인간 발발을 유도했던 적어도 하나의 CoV, 박쥐에서 단리된 적어도 하나의 SL-CoV, 천산갑에서 단리된 적어도 하나의 SL-CoV, 사향 고양이에서 단리된 적어도 하나의 SL-CoV 및 낙타에서 단리된 적어도 하나의 MERS 균주. 본 발명은 보존된 큰 서열을 식별하기 위해 사용될 수 있는 상기 언급된 코로나바이러스 균주에 제한되지 않는다.
특정 구현예에서, 보존된 큰 서열 중 하나 이상이 현재 유행 중인 하나 이상의 SARS-CoV-2 인간 균주 또는 변이체; 이전의 인간 발발을 유발했던 하나 이상의 코로나바이러스; 박쥐, 천산갑, 사향 고양이, 밍크, 낙타, 및 코로나바이러스를 잘 받아들이는 다른 동물로 이루어진 군에서 선택되는 동물에서 단리된 하나 이상의 코로나바이러스; 및/또는 보통 감기을 유발하는 하나 이상의 코로나바이러스. 현재 유행 중인 SARS-CoV-2 인간 균주 및 변이체는 원래 SARS-CoV-2 균주(SARS-CoV-2 단리물 Wuhan-Hu-1) 및 몇 개의 SARS-CoV-2 변이체, 비제한적으로, 스페인 균주 B.1.177; 오스트레일리아 균주 B.1.160, 잉글랜드 균주 B.1.1.7; 남아프리카 균주 B.1.351; 브라질 균주 P.1; 캘리포니아 균주 B.1.427/B.1.429; 스코틀랜드 균주 B.1.258; 벨기에/네덜란드 균주 B.1.221; 노르웨이/프랑스 균주 B.1.367; 노르웨이/덴마크.UK 균주 B.1.1.277; 스웨덴 균주 B.1.1.302; 북미, 유럽, 아시아, 아프리카 및 오스트레일리아 균주 B.1.525; 및 뉴욕 균주 B.1.526을 포함할 수 있다. 본 발명은 언급된 SARS-CoV-2 변이체에 제한되지 않고, 향후 확인되는 변이체를 아우른다. 보통 감기를 유발하는 하나 이상의 코로나바이러스는, 비제한적으로, 균주 229E(알파 코로나바이러스), NL63(알파 코로나바이러스), OC43(베타 코로나바이러스), HKU1(베타 코로나바이러스)를 포함할 수 있다.
본원에서 사용된 바와 같이, 용어 '보존된'은 서열 정렬 및 분석에서 식별된 가장 고도로 보존된 큰 서열에 속하는 큰 서열을 지칭한다. 예를 들어, 보존된 큰 서열은 식별된 2개의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 식별된 3개의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 식별된 4개의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 식별된 5개의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 식별된 6개의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 식별된 7개의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 식별된 8개의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 식별된 9개의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 식별된 10개의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 식별된 15개의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 식별된 20개의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 식별된 25개의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 식별된 30개의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 식별된 40개의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 식별된 50개의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존 서열은 식별된 50%의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 식별된 60%의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 큰 보존 서열은 식별된 70%의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 식별된 80%의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 식별된 90% 가장고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 식별된 95%의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 식별된 99%의 가장 고도로 보존된 서열일 수 있다. 본 발명은 언급된 역치에 제한되지 않는다.
도 3a는 본 발명에서 이용된 시스템 생물학 접근법의 예를 보여준다.
일부 구현예에서, 조성물은 1개 이상의 큰 서열을 포함한다. 일부 구현예에서, 1개 이상의 큰 서열은 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프; 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프 중 적어도 하나를 포함한다.
다른 구현예에서, 백신 조성물은 2개 이상의 큰 서열을 포함한다. 일부 구현예에서, 둘 이상이 큰 서열은 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프; 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프 중 적어도 하나를 포함한다.
일부 구현예에서, 큰 서열은 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프 및 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프를 포함한다. 일부 구현예에서, 큰 서열은 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프 및 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프를 포함한다. 일부 구현예에서, 큰 서열은 하나 이상의 보존된 코로나바이러스 CD8+ 표적 에피토프 및 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프를 포함한다. 일부 구현예에서, 큰 서열은 하나 이상의 보존된 코로나바이러스 CD8+ 표적 에피토프를 포함한다. 일부 구현예에서, 큰 서열은 하나 이상의 보존된 코로나바이러스 CD4+ 표적 에피토프를 포함한다. 일부 구현예에서, 큰 서열은 하나 이상의 보존된 코로나바이러스 B 세포 표적 에피토프를 포함한다.
일부 구현예에서, 백신 조성물은 하나 이상의 보존된 코로나바이러스 CD8+ 표적 에피토프를 포함한다. 일부 구현예에서, 백신 조성물은 하나 이상의 보존된 코로나바이러스 CD4+ 표적 에피토프를 포함한다. 일부 구현예에서, 백신 조성물은 하나 이상의 보존된 코로나바이러스 B 세포 표적 에피토프를 포함한다.
본원에서 논의되는 바와 같이, 특정 구현예에서, 백신 조성물은 전체의 스파이크 단백질, 하나 이상의 코로나바이러스 CD4+ T 세포 표적 에피토프; 및 하나 이상의 코로나바이러스 CD8+ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 적어도 스파이크 단백질의 일부분(예를 들어, 일부분은 삼량체화된 SARS-CoV-2 수용체 결합 도메인(RBD)를 포함함), 하나 이상의 코로나바이러스 CD4+ T 세포 표적 에피토프; 및 하나 이상의 코로나바이러스 CD8+ T 세포 표적 에피토프를 포함한다. 일부 구현예에서, 하나 이상의 코로나바이러스 CD4+ T 세포 표적 에피토프; 및 하나 이상의 코로나바이러스 CD8+ T 세포 표적 에피토프는 큰 서열의 형태로 존재할 수 있다.
상기 큰 서열 각각은 링커에 의해 분리될 수 있다. 특정 구현예에서, 링커는 큰 서열들 사이에서 쪼깨짐을 시행하는 효소를 허용한다. 본 발명은 특정 링커 또는 특정 길이의 링커에 제한되지 않는다. 예로서, 특정 구현예에서, 1개 이상의 큰 서열은 2 개의 아미노산 길이의 링커에 의해 분리될 수 있다. 특정 구현예에서, 1개 이상의 큰 서열은 링커 3 개의 아미노산 길이의 링커에 의해 분리될 수 있다. 특정 구현예에서, 1개 이상의 큰 서열은 4 개의 아미노산 길이의 링커에 의해 분리될 수 있다. 특정 구현예에서, 1개 이상의 큰 서열은 5 개의 아미노산 길이의 링커에 의해 분리될 수 있다. 특정 구현예에서, 1개 이상의 큰 서열은 6 개의 아미노산 길이의 링커에 의해 분리될 수 있다. 특정 구현예에서, 1개 이상의 큰 서열은 7 개의 아미노산 길이의 링커에 의해 분리될 수 있다. 특정 구현예에서, 1개 이상의 큰 서열은 8 개의 아미노산 길이의 링커에 의해 분리될 수 있다. 특정 구현예에서, 1개 이상의 큰 서열은 9 개의 아미노산 길이의 링커에 의해 분리될 수 있다. 특정 구현예에서, 1개 이상의 큰 서열은 10 개의 아미노산 길이의 링커에 의해 분리될 수 있다. 특정 구현예에서, 1개 이상의 큰 서열은 2 내지 10 개의 아미노산 길이의 링커에 의해 분리될 수 있다.
링커는 당업자에게 잘 알려져 있다. 링커의 비-제한적인 예에는 AAY, KK, 및 GPGPG가 포함된다.
상기 큰 서열은 구조 단백질, 비-구조 단백질, 또는 이들의 조합에서 유래될 수 있다. 예를 들어, 구조 단백질은 스파이크 단백질(S), 외피 단백질(E), 막 단백질(M), 또는 핵단백질(N)을 포함할 수 있다.
일부 구현예에서, 큰 서열은 적어도 하나의 SARS-CoV-2 단백질에서 유래된다. SARS-CoV-2 단백질은 ORF1ab 단백질, 스파이크 당단백질, ORF3a 단백질, 외피 단백질, 막 당단백질, ORF6 단백질, ORF7a 단백질, ORF7b 단백질, ORF8 단백질, 뉴클레오캡시드 단백질, 및 ORF10 단백질을 포함할 수 있다. ORF1ab 단백질은 비구조 단백질(Nsp), 예컨대 Nsp1, Nsp2, Nsp3(파파인-유사 프로테아제), Nsp4, Nsp5(3C-유사 프로테아제), Nsp6, Nsp7, Nsp8, Nsp9, Nsp10, Nsp11, Nsp12(RNA 중합효소), Nsp13(5' RNA 트리포스파타제 효소), Nsp14(구아노신N7-메틸트랜스퍼라제), Nsp15(엔도리보뉴클레아제) 및 Nsp16(2'-O-리보스-메틸트랜스퍼라제)을 제공한다.
상기 SARS-CoV-2는 게놈 길이가 29,903 염기쌍(bps) ssRNA(서열번호: 1)이다. 일반적으로, 266-21555 bps 사이의 영역이 ORF1ab 폴리펩티드의 유전 암호를 지정하고; 21563-25384 bps 사이의 영역이 구조 단백질(스파이크 단백질 또는 표면 당단백질) 중 하나의 유전 암호를 지정하고; 25393-26220 bps 사이의 영역이 ORF3a 유전자의 유전 암호를 지정하고; 26245-26472 bps 사이의 영역이 외피 단백질의 유전 암호를 지정하고; 26523-27191 사이의 영역이 막 당단백질(또는 막 단백질)의 유전 암호를 지정하고; 27202-27387 bps 사이의 영역이 ORF6 유전자의 유전 암호를 지정하고; 27394-27759 bps 사이의 영역이 ORF7a 유전자의 유전 암호를 지정하고; 27894-28259 bps 사이의 영역이 ORF8 유전자의 유전 암호를 지정하고; 28274-29533 bps 사이의 영역이 뉴클레오캡시드 인단백질(또는 뉴클레오캡시드 단백질)의 유전 암호를 지정하고; 및 29558-29674 bps 사이의 영역이 ORF10 유전자의 유전 암호를 지정한다.
상기 큰 서열은 다수의 인간 클래스 1 및 클래스 2 HLA 일배체형에 제한되고, 클래스 1의 경우 HLA-0201에, 클래스 2의 경우 HLA-DR에 제한되지 않는 T-세포 에피토프를 포함할 수 있다. 보존된 큰 서열은 인간 HLA 클래스 1 및 2 일배체형에 제한될 수 있다. 일부 구현예에서, 보존된 에피토프는 고양이 및 개 MHC 클래스 1 및 2 일배체형에 제한된다.
큰 서열
상기 항원은 큰 서열, 예컨대 인간 및 동물 코로나바이러스 중에서 상당히 보존된 보존된 큰 서열을 포함할 수 있다. 본원에서 사용된 바와 같이, 용어 큰 서열은 적어도 25개 아미노산 또는 적어도 75개 뉴클레오티드를 갖는 서열을 지칭한다. 큰 서열은 에피토프, 예컨대 본원에 기재된 보존된 에피토프를 포함한다.
보존된 큰 서열을 식별하기 위해, 하기 뿐만 아니라 본원에 기재된 바와 같이 서열 정렬 및 분석이 수행되었다.
SARS-CoV-2 및 이전의 코로나바이러스 균주 사이의 서열 비교: 서열 상동성 분석이 수행되었고, 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2) 단리물 Wuhan-Hu-1을, SARS-CoV-2 변이체, 보통 감기 코로나 바이러스 균주(HKU1 유전자형 B, CoV-OC43, CoV-NL63, 및 CoV-229E), SARS-CoV-Urbani, 박쥐(라이노로푸스 아피니스 및 R. 말라이아누스), 천산갑(마니스 자바니카), 사향 고양이 (파구마 라르바타), 및 낙타(카멜루스 드로메다리우스 및 C.박트리아누스)에서 유래된 MERS 및 코로나바이러스 균주의 서열을 가진 완전한 게놈과 비교하였다.
상기 인간 SARS-CoV-2 변이체 게놈 서열이 GISAID 데이터베이스에서 회수되었는데, 이것은 그것의 고도의 전파성 및 병원성으로 알려진 주요한 우려대상 변이체를 나타낸다. 본 연구에서 사용된 서열은 스페인의 20A.EU1(EPI_ISL_691726-hCoV-19-VOC-20A.EU1), 오스트레일리아의 20A.EU2(EPI_ISL_418799-hCoV-19-VOC-20A.EU2), 잉글랜드의 B.1.1.7(EPI_ISL_581117-hCoV-19-VOC-B.1.1.7), 남아프리카의 B.1.351(EPI_ISL_660615-hCoV-19-VOC-B.1.351), 브라질의 P.1(EPI_ISL_581117-hCoV-19-VOC-P.1), 캘리포니아의 CAL.20C(EPI_ISL_730092-hCoV-19-VOC-B.1.427/B.1.429), 스코틀랜드의 B.1.258(EPI_ISL_858559-hCoV-19-VOC-B.1.258), 벨기에/네덜란드의 B.1.221(EPI_ISL_734790-hCoV-19-VOC-B.1.221), 노르웨이/프랑스의 B.1.367(EPI_ISL_541518-hCoV-19-VOC-B.1.367), 네덜란드/덴마크/UK의 B.1.1.277(EPI_ISL_500783-hCoV-19-VOC-B.1.1.277), 스웨덴의 B.1.1.302(EPI_ISL_717929-hCoV-19-VOC-B.1.1.302)이다. 유사하게, HKU1 유전자형 B(AY884001), CoV-OC43(KF923903), CoV-NL63(NC_005831) 및 CoV-229E(KY983587), SARS-CoV-Urbani(AY278741.1), MERS(NC_019843).
본 분석에 사용된 박쥐 CoV 균주는 균주 RaTG13(MN996532.2), Rs672/2006(FJ588686.1), YNLF_31C(KP886808.1), WIV1(KF367457.1), WIV16(KT444582.1), ZXC21(MG772934.1), RmYN02(EPI_ISL_412977), 박쥐-RmYN01(EPI_ISL_412976), MERS-박쥐-CoV/P.khulii/이태리/206645-63/2011 (MG596803.1)을 포함한다. 더 나아가, 천산갑을 나타내는 5개 게놈 서열 (MT040333.1-PCoV_GX-P4L, MT040334.1-PCoV_GX-P1E, MT040335.1-PCoV_GX-P5L, MT040336.1-PCoV_GX-P5E, MT072864.1-PCoV_GX-P2V, MT121216.1-PCoV-MP789), 3개의 사향 고양이 특이적 게놈 서열(AY572034.1, AY686864.1, AY686863.1) 및 낙타에서 유래된 4개의 CoV 서열(NC_028752.1, KF917527.1, MN514967.1, KT368891.1)이 CoV 게놈의 상이한 구조적 및 비-구조 단백질에서 가장 보존된 영역을 평가하는 것을 목표로 하는 본 서열 상동성 분석에 포함되었다. 이들 서열은 국립 바이오 기술 정보 센터(NCBI) 또는 모든 인플루엔자 데이터를 공유하는 세계적인 계획(GISAID) 중 하나에서 수득되었다. 계통발생적 분석을 위해, SARS-CoV-2 전체-게놈 서열은 MEGAX를 사용하여 CLUSTAL W와 함께 정렬되었다. 모든 SARS-CoV-2 서열은 온라인 NCBI BLAST를 사용하여 기존 게놈과 비교되었다.
SARS-CoV-2 서열 보존의 결정: 각각의 Wuhan-Hu-1(GeneBank: NC_045512.2) 특이적 구조적(스파이크 당단백질 (YP_009724390.1), 막 단백질(YP_009724393.1), 외피 단백질(YP_009724392.1), 뉴클레오캡시드 인단백질(YP_009724397.2)) 및 비구조 단백질(ORF1a/b 다단백질(YP_009724389.1), ORF3a(YP_009724391.1), ORF6(YP_009724394.1), ORF7a(YP_009724395.1), ORF7b(YP_009725318.1), ORF8 (YP_009724396.1) 및 ORF10(YP_009725255.1)) 단백질 서열이, Wuhan-Hu-1 단백질 및 그것의 비교 표적 사이의 쌍별 동일성을 계산하기 위해 뉴클레오티드 BLAST(blastn) 알고리즘을 사용하여, SARSCoV 및 MERS-CoV의 공통 단백질 서열 및 가장 근접한 상대적 교차 종 CoV 균주의 단백질 서열에 대해 비교되었다.
추가적으로, 본 발명이 CoV 균주 전역의 매우 유사한 서열에 관심이 있으므로, 거대적모구가 수행되었다. 의문이 제기된 서열 각가에 대해, 질의 범위, E 값, 퍼센트 동일성이 결정되었다. 하나의 박쥐 CoV 균주 RmYN01에 대해 수득된 의문이 제기된 상동성은, 계통발생적으로 SARS-CoV-2와 덜 유사한 것으로 조기에 발견되었으나, SARS-CoV-Urbani와 유전적 유사성이 좀 더 있어서, CoV 균주 전체에 걸친 상동성 서열을 확인하기 윈한 표준으로 택해졌다. 전략은 상이한 CoV들 중에서 영역들이 유전적으로 얼마나 더 보존되었는지 파악하는 데 도움이 되었다. 이와 같은 서열은 SARS-CoV-2 게놈 서열을 상대로 비교한 경우, 질의 범위는 59%이고 퍼센트 동일성을 78.73%이다. 서열에는 더 나아가 다른 CoV들 사이에서도 서열 상동성을 보였던 5개의 매칭된 영역이 있다. 1bp-1580bp(단편) 사이에 걸쳐진 매칭된 영역 1이 nsp1(리더 단백질), nsp2, 및 nsp3이 있는 서열 상동성을 보인 반면, 3547bp-7096bp(단편 2) 사이에 걸쳐진 매칭된 영역 2는 ORF1a/b의 다중 서브유닛, 예컨대 3CLpro, nsp6, nsp7, nsp8, nsp9, nsp10, RNA 의존 RNA 중합효소, 헬리카제, nsp14, nsp15 및 nsp16이 있는 서열 상동성을 보였다. 흥미롭게도, 17472bp-21156bp (단편 3) 사이의 ORF1a/b의 비-주석 영역에서 펼쳐진 주요 영역 또한 서열 동일성을 보였다. 서열 동일성의 제4 구간이, 중요하게도 SARS-CoV-2에서 주요 수용체 결합 구역을 덮는, 스파이크 당단백질의 단면을 덮는 22584bp-24682bp(단편 4)를 통해, 펼쳐졌다. 상동성 서열의 마지막 세그먼트는 ORF3a, 외피 단백질, 막 단백질, ORF6, 및 ORF7a(26193bp-27421bp; 단편 5)에 특이적인 영역과 퍼센트 동일성을 보였다.
일부 구현예에서, SARS-CoV-2 Wuhan 균주의 5개 단편이 가장 고도로 보존되었음이 밝혀졌다(1bp-1580bp(단편 1), 3547bp-12830bp(단편 2), 17472bp-21156bp(단편 3), 22584bp-24682bp(단편 4) 및 26193bp-27421bp(단편 5). 다음으로, 각 단편에 또 한 차례의 서열 상동성 분석을 수행하였다.
일부 구현예에서, 백신 조성물은 하나의 큰 서열을 포함한다. 일부 구현예에서, 백신 조성물은 1개 이상의 큰 서열을 포함한다. 일부 구현예에서, 백신 조성물은 2개 이상의 큰 서열을 포함한다. 일부 구현예에서, 백신 조성물은 3개 이상의 큰 서열을 포함한다. 일부 구현예에서, 백신 조성물은 4개 이상의 큰 서열을 포함한다. 일부 구현예에서, 백신 조성물은 5개 이상의 큰 서열, 예를 들어, 5, 6, 7, 8개 등을 포함한다.
일부 구현예에서, 큰 서열은 SARS-CoV-2에 의해 발현된 전체 단백질 서열에서 유래된다. 다른 구현예에서, 큰 서열은 SARS-CoV-2에 의해 발현된 부분적인 단백질 서열에서 유래된다. 일부 구현예에서, 단백질의 큰 서열은 인간 클래스 1 및 클래스 2 HLA 일배체형의 집단(인종 및 민족과 무관하게)의 100%를 아우르는 큰 수의, 예를 들어, 3 내지 10개의 상이한 일배체형에 제한된 B 세포 에피토프 및 T-세포 에피토프를 포함함으로써, 이들은 클래스 1의 경우 HLA-0201 또는 클래스 2의 경우 HLA-DR1에만 제한되지 않는다.
이전에 논의된 바와 같이, 큰 서열은 인간 및 동물 코로나바이러스 사이에서 고도로 보존될 수 있다. 일부 구현예에서, 큰 서열은 하기 중 하나 또는 그 조합에서 유래된다: 현재 유행 중인 하나 이상의 SARS-CoV-2 인간 균주 또는 변이체; 이전의 인간 발발을 유발했던 하나 이상의 코로나바이러스; 박쥐, 천산갑, 사향 고양이, 밍크, 낙타, 및 코로나바이러스에 수용적인 다른 동물로 이루어진 군에서 선택된 동물에서 단리된 하나 이상의 코로나바이러스; 및/또는 보통 감기를 유발하는 하나 이상의 코로나바이러스.
이전에 논의된 바와 같이, 현재 유행 중인 SARS-CoV-2 인간 균주 또는 변이체는 균주 B.1.177; 균주 B.1.160, 균주 B.1.1.7; 균주 B.1.351; 균주 P.1; 균주 B.1.427/B.1.429; 균주 B.1.258; 균주 B.1.221; 균주 B.1.367; 균주 B.1.1.277; 균주 B.1.1.302; 균주 B.1.525; 균주 B.1.526, 균주 S:677H, 및 균주 S:677P를 포함할 수 있다. 보통 감기를 유발하는 코로나바이러스는 하기에서 선택될 수 있다: 229E 알파 코로나바이러스, NL63 알파 코로나바이러스, OC43 베타 코로나바이러스, 및 HKU1 베타 코로나바이러스.
상기 큰 서열(들)은 구조 단백질, 비-구조 단백질, 또는 이들의 조합에서 유래될 수 있다. 큰 서열(들)은 ORF1ab 단백질, 스파이크 당단백질(예를 들어, RBD), ORF3a 단백질, 외피 단백질, 막 당단백질, ORF6 단백질, ORF7a 단백질, ORF7b 단백질, ORF8 단백질, 뉴클레오캡시드 단백질, 및/또는 ORF10 단백질에서 선택될 수 있다. ORF1ab 단백질이 비구조 단백질(Nsp) 1, Nsp2, Nsp3, Nsp4, Nsp5, Nsp6, Nsp7, Nsp8, Nsp9, Nsp10, Nsp11, Nsp12, Nsp13, Nsp14, Nsp15 및 Nsp16을 포함함을 유의해야 한다.
일부 구현예에서, 큰 서열은 전 세계 대다수의 국가에서 유행 중인 150,000개 이상의 CoV 균주의 보존된 단편을 포함한다(표 1, 도 4). 일부 구현예에서, 단편 1은 염기쌍 1-1580을 포함한다. 일부 구현예에서, 단편 1은 주석이 달리지 않은 영역 뿐만 아니라 단백질 Nsp1, Nsp2, 및 Nsp3을 포함할 수 있다(도 5). 일부 구현예에서, 단편 2는 염기쌍 3547-12830을 포함한다. 일부 구현예에서, 단편 2는 주석이 달리지 않은 영역 뿐만 아니라 단백질 Nsp5, Nsp6, Nsp7, Nsp8, Nsp9, Nsp10, Nsp11, Nsp12, Nsp13, Nsp14, Nsp15, Nsp16을 포함할 수 있다(도 6). 일부 구현예에서, 단편 3은 염기쌍 17472-21156을 포함한다. 일부 구현예에서, 단편 3은 주석이 달리지 않은 영역을 포함한다(도 7). 일부 구현예에서, 단편 4는 염기쌍 22584-24682를 포함한다. 일부 구현예에서, 단편 4는 스파이크 당단백질을 포함한다(도 8). 일부 구현예에서, 단편 5는 염기쌍 26193-27421을 포함한다. 일부 구현예에서, 단편 5는 주석이 달리지 않은 영역 뿐만 아니라 단백질 ORF3a, 외피(E), 막(M), ORF6, ORF7a를 포함한다(도 9).
일부 구현예에서, 큰 서열은 언급된 보존된 단편에 제한되지 않는다.
특정 구현예에서, 큰 서열은 스파이크 당단백질(S) 또는 그의 일부(예를 들어, RBD), 핵단백질 또는 그의 일부, 막 단백질 또는 그의 일부, 및/또는 ORF1a/b 또는 그의 일부를 포함한다(참고 표 9, 서열번호: 139). 특정 구현예에서, 큰 서열은 스파이크 당단백질(S) 또는 그의 일부 (예를 들어, RBD), 핵단백질 또는 그의 일부, 및 ORF1a/b 또는 그의 일부를 포함한다. 추가 구현예에서, 큰 서열은 스파이크 당단백질(S) 또는 그의 일부(예를 들어, RBD), 및 뉴클레오캡시드 단백질 또는 그의 일부를 포함한다(참고 표. 9, 서열번호: 140).
본원에서 논의되는 바와 같이, 특정 구현예에서, 백신 조성물은 전체의 스파이크 단백질, 하나 이상의 코로나바이러스 CD4+ T 세포 표적 에피토프; 및 하나 이상의 코로나바이러스 CD8+ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 적어도 스파이크 단백질의 일부분(예를 들어, 일부분은 삼량체화된 SARS-CoV-2 수용체 결합 도메인(RBD)를 포함함), 하나 이상의 코로나바이러스 CD4+ T 세포 표적 에피토프; 및 하나 이상의 코로나바이러스 CD8+ T 세포 표적 에피토프를 포함한다. 일부 구현예에서, 하나 이상의 코로나바이러스 CD4+ T 세포 표적 에피토프; 및 하나 이상의 코로나바이러스 CD8+ T 세포 표적 에피토프는 큰 서열의 형태로 존재한다.
일부 구현예에서, 큰 서열(들)은 전장 스파이크 당단백질에서 유래된다. 다른 구현예에서, 큰 서열(들)은 스파이크 당단백질의 일부분에서 유래된다. 일부 구현예에서, 스파이크 단백질의 막관통 앵커는 온전한 S1-S2 절단 부위를 갖는다. 일부 구현예에서, 스파이크 단백질은 그것의 안정화된 형태로 존재한다. 일부 구현예에서, 스파이크 단백질은 S2 서브유닛의 중심 나선의 최상부에서 아미노산 위치 986 및 987에서의 프롤린 치환으로 안정화된다. 일부 구현예에서, 조성물은 SARS-CoV-2 수용체 결합 도메인(RBD)을 포함한다. 일부 구현예에서, 조성물은 삼량체화된 SARS-CoV-2 수용체 결합 도메인(RBD)을 포함한다. 일부 구현예에서, 삼량체화된 SARS-CoV-2 수용체 결합 도메인(RBD) 서열은 T4 피브리틴 유래 폴돈 삼량체화 도메인의 첨가에 의해 변형된다. 일부 구현예에서, T4 피브리틴 유래 폴돈 삼량체화 도메인의 첨가는 다가 표시(multivalent display)에 의한 면역원성을 증가시킨다.
일부 구현예에서, 스파이크 단백질은 Tyr-489 및 Asn-487 (예를 들어, ACE-2 상에서 Tyr 83 및 Gln-24와 상호작용 하는 Tyr-489 및 Asn-487 지원)을 포함한다. 일부 구현예에서, 스파이크 단백질은 Gln-493(예를 들어, ACE-2 상에서 Glu-35 및 Lys-31과 상호작용하는 Gln-493 지원)을 포함한다. 일부 구현예에서, 스파이크 단백질은 Tyr-505(예를 들어, ACE-2 상에서 Glu-37 및 Arg-393과 상호작용하는 Tyr-505 지원)를 포함한다. 일부 구현예에서, 조성물은 S1-S2 절단 부위에 돌연변이 682-RRAR-685 → 682-QQAQ-685를 포함한다.
일부 구현예에서, 큰 서열(들)을 포함하는 스파이크 단백질은 적어도 하나의 프롤린 치환을 포함한다. 일부 구현예에서, 큰 서열(들)을 포함하는 스파이크 단백질은 적어도 2개의 프롤린 치환을 포함한다. 예를 들어, 프롤린 치환은 위치 K986 및 V987에 존재할 수 있다.
서열의 비-제한적인 예가 표 2에 개시되었다.
이전에 논의된 바와 같이, 각각의 큰 서열은 링커에 의해 분리된다. 일부 구현예에서, 링커는 동일한 링커이다. 일부 구현예에서, 하나 이상의 링커는 상이하다. 예를 들어, 일부 구현예에서, 상이한 링커는 각각의 큰 서열 사이에 사용된다. 이전에 논의된 바와 같이, 링커의 비-제한적인 예에는 T2A, E2A, P2A 등이 포함된다.
이전에 논의된 바와 같이, 특정 구현예에서, 백신 전달 시스템은 담체, 예컨대 지질 나노입자, 폴리머, 펩티드 등 뿐만 아니라 아데노바이러스, 예컨대, 비제한적으로, Ad5, Ad26, Ad35 등을 포함한다.
CD8+
에피토프
잠재적 CD8+ T 세포 에피토프를 식별하고 잠재적 CD8+ T 세포 에피토프의 보존성을 선별하기 위한 방법의 예들이 본원에 기재되어 있다. 본 발명은 개시된 특정 소프트웨어 시스템에 제한되지 않고, 이와 같은 방법을 위해 다른 소프트웨어 시스템이 당업자에게 접근가능하다. 본 발명은 본원에 사용된 특이적 일배체형에 제한되지 않는다. 예를 들어, 당업자는 분자 도킹 연구를 위해 대안적인 분자(예를 들어, HLA 분자)를 선택할 수 있다.
도 10은 잠재적 CD8+ T 세포 에피토프의 보존성을 선별하기 위한 서열 상동성 분석, 예를 들어, 81,963 SARS-CoV-2 균주(현재 6대륙 190개 국가에서 유행 중), 이전의 발발을 유발했던 4개 주요 '보통 감기' 코로나바이러스 (예를 들어, hCoV-OC43, hCoV-229E, hCoV-HKU1-유전자형 B, 및 hCoV-NL63) 및 박쥐, 사향 고양이, 천산갑 및 낙타에서 단리된 SL-CoV 중에서 잠재적 CD8+ T 세포 에피토프에 대한 서열 상동성의 비교를 보여준다. 황색으로 강조 표시된 에피토프 서열은 현재 유행 중인 81,963 SARS-CoV-2 균주들 사이에 고도의 상동성을 제시하고, 이전의 발발에서 유래된 2개 이상의 인간 SARS-CoV 균주 및 박쥐, 사향 고양이, 천산갑 및 낙타에서 단리된 SL-CoV 균주에서 적어도 50% 보존성을 제시한다.
상기 분석에서, 27 CD8+ T 세포 에피토프가 가장 고도로 보존된 것으로 선택되었다. 도 11a 및 도 11b는 단백질-펩티드 분자 도킹 분석에 의해 결정된 상호작용 점수 뿐만 아니라 보존된 에피토프의 HLA-A*02:01 분자의 홈에 도킹을 보여준다.
도 12a, 도 12b, 및 도 12c는 본원에 개시된 몇 개의 가장 고도로 보존된 SARS-CoV-2 에피토프에 특이적인 CD8+ T 세포가 COVID-19 환자 및 미노출된 건강한 개체들에서 검출되었음을 보여준다. 도 13a, 도 13b, 도 13c 및 도 13d는 식별된 SARS-CoV-2 CD8+ T 세포 에피토프의 면역원성을 보여준다.
앞서 논의된 CD8+ T 세포 표적 에피토프에는 S2-10, S1220-1228, S1000-1008, S958-966, E20-28, ORF1ab1675-1683, ORF1ab2363-2371, ORF1ab3013-3021, ORF1ab3183-3191, ORF1ab5470-5478, ORF1ab6749-6757, ORF7b26-34, ORF8a73-81, ORF103-11 및 ORF105-13이 포함된다. 도 14는 에피토프의 게놈 전체 위치를 보여준다. 따라서, 특정 구현예에서, 백신 조성물은 S2-10, S1220-1228, S1000-1008, S958-966, E20-28, ORF1ab1675 -1683, ORF1ab2363 -2371, ORF1ab3013 -3021, ORF1ab3183-3191, ORF1ab5470 -5478, ORF1ab6749 -6757, ORF7b26 -34, ORF8a73 -81, ORF103 -11, ORF105 -13, 또는 이들의 조합에서 선택된 하나 이상의 CD8+ T 세포 에피토프를 포함할 수 있다. 하기의 표 3은 언급된 에피토프 영역에 대한 서열을 기술한다.
본 발명은 언급된 CD8+ T 세포 에피토프에 제한되지 않는다. 예를 들어, 본 발명 또한 언급된 CD8+ T 세포 에피토프의 변이체, 예를 들어 상기 언급된 CD8+ T 세포 에피토프가 하나의 아미노산에 의해 말단절단된 서열(예들이 하기 표 4에 보여짐)을 포함한다.
본 발명은 언급된 CD8+ T 세포 에피토프에 제한되지 않는다.
특정 구현예에서, 백신 조성물은 1-10개의 CD8+ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 2-10개의 CD8+ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 2-15개의 CD8+ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 2-20개의 CD8+ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 2-30개의 CD8+ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 2-15개의 CD8+ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 2-5개의 CD8+ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 5-10개의 CD8+ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 5-15개의 CD8+ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 5-20개의 CD8+ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 5-25개의 CD8+ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 5-30개의 CD8+ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 10-20개의 CD8+ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 10-30개의 CD8+ T 세포 표적 에피토프를 포함한다.
CD4+
에피토프
잠재적 CD4+ T 세포 에피토프를 식별하고 잠재적 CD4+ T 세포 에피토프의 보존성을 선별하기 위한 방법의 예들이 본원에 기재되어 있다. 본 발명은 개시된 특정 소프트웨어 시스템에 제한되지 않고, 이와 같은 방법을 위해 다른 소프트웨어 시스템이 당업자에게 접근가능하다. 본 발명은 본원에 사용된 특이적 일배체형에 제한되지 않는다. 예를 들어, 당업자는 분자 도킹 연구를 위한 대안적인 분자(예를 들어, HLA 분자)를 선택할 수 있다.
도 15는 고친화도로 HLA-DR 분자와 결합되는 가장 고도로 보존된 잠재적 SARS-CoV-2 유래 인간 CD4+ T 세포 에피토프의 식별을 보여준다. SARS-CoV-2-Wuhan-Hu-1 균주(MN908947.3)의 전체의 게놈 서열에서 유래된 총 9,594개 잠재적 HLA-DR-제한 CD4+ T 세포 에피토프 중에서, 고친화도로 HLA-DRB1 분자와 결합되는 16개의 에피토프가 선택되었다. 16 CD4+ T 세포 에피토프의 보존성이 인간 및 동물 코로나바이러스 사이에서 분석되었다. 81,963개의 SARS-CoV-2 균주(현재 6대륙에서 유행 중) 중 16개의 CD4+ T 세포 에피토프, 이전의 발발을 유발했던 4개의 주요 '보통 감기' 코로나바이러스(즉 hCoV-OC43, hCoV-229E, hCoV-HKU1, 및 hCoV-NL63) 및 박쥐, 사향 고양이, 천산갑 및 낙타에서 단리되었던 SL-CoV 사이의 서열 상동성의 비교가 나타나 있다. 초록색으로 강조 표시된 에피토프 서열은 현재 유행 중인 81,963개의 SARS-CoV-2 균주들 사이에 고도의 상동성을 제시하고, 이전의 발발에서 유래된 2개 이상의 인간 SARS-CoV 균주 및 박쥐, 사향 고양이, 천산갑 및 낙타에서 단리된 SL-CoV 균주에서 적어도 50% 보존성을 제시한다.
상기 분석에서, 16개의 CD4+ T 세포 에피토프가 가장 고도로 보존된 것으로 선택되었다. 도 16a 및 도 16b는 단백질-펩티드 분자 도킹 분석에 의해 결정된 상호작용 점수 뿐만 아니라 보존된 에피토프의 HLA-A*02:01 분자의 홈으로의 도킹을 보여준다.
도 17a, 도 17b, 및 도 17c는 본원에 개시된 몇 개의 가장 고도로 보존된 SARS-CoV-2 에피토프에 특이적인 CD4+ T 세포가 COVID-19 환자 및 미노출된 건강한 개체들에서 검출되었음을 보여준다. 도 18a, 도 18b, 도 18c, 및 도 18d는 식별된 SARS-CoV-2 CD4+ T 세포 에피토프의 면역원성을 보여준다.
앞서 논의된 CD4+ T 세포 표적 에피토프는 ORF1a1350-1365, ORF1ab5019-5033, ORF612-26, ORF1ab6088-6102, ORF1ab6420-6434, ORF1a1801-1815, S1-13, E26-40, E20-34, M176-190, N388-403, ORF7a3-17, ORF7a1-15, ORF7b8-22, ORF7a98-112 및 ORF81-15.를 포함한다. 도 14는 에피토프의 게놈 전체 위치를 보여준다. 따라서, 특정 구현예에서, 백신 조성물은 ORF1a1350-1365, ORF1ab5019-5033, ORF612-26, ORF1ab6088-6102, ORF1ab6420-6434, ORF1a1801-1815, S1-13, E26-40, E20-34, M176-190, N388-403, ORF7a3-17, ORF7a1-15, ORF7b8-22, ORF7a98-112, ORF81-15, 또는 이들의 조합에서 선택된 하나 이상의 CD4+ T 세포 표적 에피토프를 포함할 수 있다. 하기의 표 5는 상기 언급된 에피토프 영역에 대한 서열을 기술한다.
본 발명은 언급된 CD4+ T 세포 에피토프에 제한되지 않는다. 예를 들어, 본 발명은 또한 상기 언급된 CD4+ T 세포 에피토프의 변이체, 예를 들어, 상기 언급된 CD4+ T 세포 에피토프가 하나 이상의 아미노산에 의해 말단절단되거나, 또는 하나 이상의 아미노산에 의해 연장된 서열을 포함한다(하기 표 6에 예들이 보여짐).
본 발명은 언급된 CD4+ T 세포 에피토프에 제한되지 않는다.
특정 구현예에서, 백신 조성물은 1-10개의 CD4+ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 2-10개의 CD4+ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 2-15개의 CD4+ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 2-20개의 CD4+ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 2-30개의 CD4+ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 2-15개의 CD4+ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 2-5개의 CD4+ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 5-10의 CD4+ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 5-15개의 CD4+ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 5-20개의 CD4+ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 5-25개의 CD4+ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 5-30개의 CD4+ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 10-20개의 CD4+ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 10-30개의 CD4+ T 세포 표적 에피토프를 포함한다.
B 세포
에피토프
잠재적 B 세포 에피토프를 식별하고 잠재적 B 세포 에피토프의 보존성을 선별하는 방법의 예들이 본원에 기재되어 있다. 본 발명은 개시된 특정 소프트웨어 시스템에 제한되지 않고, 이와 같은 방법을 위해 다른 소프트웨어 시스템이 당업자에게 접근가능하다.
도 19는 인간, 박쥐, 사향 고양이, 천산갑, 및 낙타 코로나바이러스 균주에서 스파이크 유래 B 세포 에피토프의 보존을 보여준다. 인간, 박쥐, 사향 고양이, 천산갑, 및 낙타에서 수득된 SARS 코로나바이러스(SARS-CoV)의 29개의 균주에서 ClustalW를 사용하여 다중 서열 정렬을 수행하였다. 이것은 7개의 인간 SARS/MERS-CoV 균주(SARS-CoV-2-Wuhan(MN908947.3), SARS-HCoV-Urbani(AY278741.1), CoV-HKU1-유전자형-BAY884001), CoV-OC43(KF923903), CoV-NL63(NC005831), CoV-229E(KY983587), MERS(NC019843)); 8개의 박쥐 SARS-CoV 균주(박쥐-SL-CoV-WIV16(KT444582), 박쥐-SL-CoV-WIV1(KF367457.1), 박쥐-SL-CoV-YNLF31C(KP886808.1), 박쥐-SARS-CoV-RS672(FJ588686.1), 박쥐-CoV-RATG13(MN996532.1), 박쥐-CoV-YN01(EPIISL412976), 박쥐-CoV-YN02(EPIISL412977), 박쥐-CoV-19-ZXC21(MG772934.1); 3개의 사향 고양이 SARS-CoV 균주(SARS-CoV-사향 고양이007(AY572034.1), SARS-CoV-A022 (AY686863.1), SARS-CoV-B039(AY686864.1)); 9개의 천산갑 SARS-CoV 균주(PCoV-GX-P2V(MT072864.1), PCoV-GX-P5E(MT040336.1), PCoV-GX-P5L(MT040335.1), PCoV-GX-P1E(MT040334.1), PCoV-GX-P4L(MT040333.1), PCoV-MP789(MT084071.1), PCoV-GX-P3B(MT072865.1), PCoV-Guangdong-P2S(EPIISL410544), PCoV-Guangdong(EPIISL410721)); 4개의 낙타 SARS-CoV 균주(낙타-CoV-HKU23 (KT368891.1), DcCoV-HKU23(MN514967.1), MERS-CoV-Jeddah(KF917527.1), Riyadh/RY141(NC028752.1)) 및 1개의 재조합 균주(FJ211859.1))를 포함한다. 청색으로 강조 표시된 영역은 서열 상동성을 나타낸다. SARS 코로나바이러스의 2개 이상의 균주에서 적어도 50% 보존성을 보였거나 고, 또는 수용체 결합 도메인(RBD) 특이적 아미노산을 소유한 B 세포 에피토프가 후보 에피토프로서 선택되었다.
상기 분석에서, 22개의 B 세포 에피토프가 가장 고도로 보존된 것으로 선택되었다. 도 20a 및 도 20b는 단백질-펩티드 분자 도킹 분석에 의해 결정된 상호작용 점수 뿐만 아니라 보존된 에피토프의 ACE2 수용체로의 도킹을 보여준다. 도 21a, 도 21b, 도 21c, 도 21d, 도 21e, 도 21f 및 도 21g는 식별된 SARS-CoV-2 B 세포 에피토프의 면역원성을 보여준다.
앞서 논의된 B 세포 표적 에피토프는 S287-317, S524-598, S601-640, S802-819, S888-909, S369-393, S440-501, S1133-1172, S329-363, S59-81 및 S13-37을 포함한다. 도 2b는 에피토프의 게놈 전체 위치를 보여준다. 따라서, 특정 구현예에서, 백신 조성물은 S287-317, S524-598, S601-640, S802-819, S888-909, S369-393, S440-501, S1133-1172, S329-363, S59-81, 및 S13-37에서 선택된 하나 이상의 B 세포 표적 에피토프를 포함할 수 있다. 일부 구현예에서, B 세포 에피토프는 전체 스파이크 단백질이다. 일부 구현예에서, B 세포 에피토프는 스파이크 단백질의 일부분이다. 하기 표 7은 언급된 에피토프 영역에 대한 서열을 기술한다.
본 발명은 언급된 B 세포 에피토프에 제한되지 않는다. 예를 들어, 본 발명은 또한 상기 언급된 B 세포 에피토프의 변이체, 예를 들어 상기 언급된 B 세포 에피토프가 하나 이상의 아미노산에 의해 말단절단된, 또는 하나 이상의 아미노산에 의해 연장된 서열을 포함한다(하기 표 8에 예들이 보여짐).
이전에 논의된 바와 같이, 일부 구현예에서, B 세포 에피토프는 전체 스파이크 단백질의 형태롤 존재한다. 일부 구현예에서, B 세포 에피토프는 스파이크 단백질의 일부분의 형태로 존재한다. 일부 구현예에서, 스파이크 단백질의 막관통 앵커는 온전한 S1-S2 절단 부위를 갖는다. 일부 구현예에서, 스파이크 단백질은 그것의 안정화된 형태로 존재한다. 일부 구현예에서, 스파이크 단백질은 S2 서브유닛의 중심 나선의 최상부에 있는 아미노산 위치 986 및 987에서의 프롤린 치환으로 안정화된다. 일부 구현예에서, 조성물은 삼량체화된 SARS-CoV-2 수용체 결합 도메인(RBD)을 포함한다. 일부 구현예에서, 삼량체화된 SARS-CoV-2 수용체 결합 도메인(RBD) 서열은 T4 피브리틴 유래된 폴돈 삼량체화 도메인의 첨가에 의해 변형된다. 일부 구현예에서, T4 피브리틴 유래 폴돈 삼량체화 도메인의 첨가가 다가 표시에 의해 면역원성을 증가시킨다. 도 22는 하나 이상의 돌연변이를 포함하는 스파이크 단백질의 비-제한적인 예를 보인다.
일부 구현예에서, 스파이크 단백질은 Tyr-489 및 Asn-487(예를 들어,ACE-2 상에서 Tyr 83 및 Gln-24와의 상호작용을 갖는 Tyr-489 및 Asn-487 지원)을 포함한다. 일부 구현예에서, 스파이크 단백질은 Gln-493(예를 들어, ACE-2 상에서 Glu-35 및 Lys-31와의 상호작용을 갖는 Gln-493 지원)을 포함한다. 일부 구현예에서, 스파이크 단백질은 Tyr-505(예를 들어, ACE-2 상에서 Glu-37 및 Arg-393과의 상호작용을 갖는 Tyr-505 지원)를 포함한다. 일부 구현예에서, 조성물은 S1-S2 절단 부위에 돌연변이 682-RRAR-685→ 682-QQAQ-685를 포함한다.
일부 구현예에서, 조성물은 적어도 하나의 프롤린 치환을 포함한다. 일부 구현예에서, 조성물은 적어도 2개의 프롤린 치환을 포함한다. 예를 들어, 프롤린 치환은 위치 K986 및 V987에 존재할 수 있다.
특정 구현예에서, 백신 조성물은 1-10개의 B 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 2-10개의 B 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 2-15개의 B 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 2-20개의 B 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 2-30개의 B 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 2-15개의 B 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 2-5개의 B 세포 표적 에피토프를포함한다. 특정 구현예에서, 백신 조성물은 5-10개의 B 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 5-15개의 B 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 5-20개의 B 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 5-25개의 B 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 5-30개의 B 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 10-20개의 B 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 10-30개의 B 세포 표적 에피토프를 포함한다.
특정 구현예의 경우, 선택된 에피토프는 결합 검정(예를 들어, HLA 분자에 결합에 대한)에서 특정 점수를 달성하는 것일 수 있다. 예를 들어, 일부 구현예에서, 선택된 에피토프는 ELISA 결합 검정(예를 들어, HLA-DR/펩티드 조합, HLA-A*0201/펩티드 조합 등에 대한 특이적인 ELISA 결합 검정)에서 IC50 점수가 250 이하이거나, 또는 상이한 결합 검정에서 250 이하의 IC50 점수의 등가물을 갖는다. 결합 검정은 당업자에 잘 알려져 있다.
큰 서열(들) 배열
상기 기재된 조성물의 큰 서열은 다양한 구성으로 배열될 수 있다(도 23 참고). 일부 구현예에서, 큰 서열은 스파이크 당단백질(S) 또는 그의 일부분(예를 들어, RBD)에 이어서 ORF1a/b 단백질 또는 그의 일부분이 있고, 이어서 핵단백질 또는 그의 일부분이 있도록 배열될 수 있다. 일부 구현예에서, 큰 서열은 스파이크 당단백질(S) 또는 그의 일부분(예를 들어, RBD)에 이어서 ORF1a/b 단백질 또는 그의 일부분이 있고, 이어서 핵단백질 또는 그의 일부분이 있고, 이어서 막(M) 또는 그의 일부분이 있도록 배열될 수 있다.
일부 구현예에서, 큰 서열은 ORF1a/b 단백질 또는 그의 일부분에 이어서 핵단백질(N) 또는 그의 일부분이 있도록 배열될 수 있다. 일부 구현예에서, 큰 서열은 ORF1a/b 단백질 또는 그의 일부분에 이어서 핵단백질(N) 또는 그의 일부분이 있고, 이어서 막(M) 또는 그의 일부가 있도록 배열될 수 있다.
일부 구현예에서, 큰 서열은 스파이크 당단백질(S) 또는 그의 일부분(예를 들어, RBD)에 이어서 단편 1 또는 그의 일부분이 있도록 배열될 수 있다. 일부 구현예에서, 큰 서열은 스파이크 당단백질(S) 또는 그의 일부분(예를 들어, RBD)에 이어 단편 2 또는 그의 일부분이 있도록 배열될 수 있다. 일부 구현예에서, 큰 서열은 스파이크 당단백질(S) 또는 그의 일부분(예를 들어, RBD)에 이어서 단편 4 또는 그의 일부분이 있도록 배열될 수 있다. 일부 구현예에서, 큰 서열은 스파이크 당단백질(S) 또는 그의 일부분(예를 들어, RBD)에 이어서 단편 5 또는 그의 일부분이 있도록 배열될 수 있다. 일부 구현예에서, 큰 서열은 스파이크 당단백질(S) 또는 그의 일부분(예를 들어, RBD)에 이어서 단편 1 또는 그의 일부분이 있고, 이어서 단편 5 또는 그의 일부분이 있도록 배열될 수 있다.
일부 구현예에서, 큰 서열은 스파이크 당단백질(S) 또는 그의 일부분(예를 들어, RBD)에 이어서 뉴클레오캡시드 단백질 또는 그의 일부분이 있도록 배열될 수 있다. 일부 구현예에서, 큰 서열은 스파이크 당단백질(S) 또는 그의 일부분(예를 들어, RBD)에 이어서 ORF1ab 단백질 또는 그의 일부분이 있고, 이어서 ORF3 단백질 또는 그의 일부분이 있고, 이어서 외피 단백질 또는 그의 일부분이 있고, 이어서 막 단백질 또는 그의 일부분이 있고, 이어서 ORF6 단백질 또는 그의 일부분이 있고, 이어서 ORF7a 단백질 또는 그의 일부분이 있도록 배열될 수 있다. 일부 구현예에서, 큰 서열은 스파이크 당단백질(S) 또는 그의 일부분(예를 들어, RBD)에 이어서 막 단백질 또는 그의 일부분이 있고, 이어서 외피 단백질 또는 그의 일부분이 있고, 이어서 Nsp3 단백질 또는 그의 일부분이 있고, 이어서 Nsp5 단백질 또는 그의 일부분이 있고, 이어서 Nsp12 단백질 또는 그의 일부분이 있도록 배열될 수 있다.
일부 구현예에서, 큰 서열은 스파이크 당단백질(S) 또는 그의 일부분(예를 들어, RBD)에 이어서 하나의 큰 서열이 있도록 배열될 수 있다. 일부 구현예에서, 큰 서열은 스파이크 당단백질(S) 또는 그의 일부분(예를 들어, RBD)에 이어서 2개의 큰 서열이 있도록 배열될 수 있다. 일부 구현예에서, 큰 서열은 스파이크 당단백질(S) 또는 그의 일부분(예를 들어, RBD)에 이어서 3개의 큰 서열이 있도록 배열될 수 있다. 일부 구현예에서, 큰 서열은 스파이크 당단백질(S) 또는 그의 일부분(예를 들어, RBD)에 이어서 4개의 큰 서열이 있도록 배열될 수 있다. 일부 구현예에서, 큰 서열은 스파이크 당단백질(S) 또는 그의 일부분(예를 들어, RBD)에 이어서 5개의 큰 서열이 있도록 배열될 수 있다.
일부 구현예에서, 큰 서열은 스파이크 당단백질(S) 또는 그의 일부분(예를 들어, RBD)에 이어서 하나의 큰 서열이 있도록 배열될 수 있다. 둘 모두는 프로모터에 의해 각각 구동되거나, 또는 둘 모두 단일 프로모터에 의해서 구동되지만, 도 x, y 및 z에 예시된 바와 같이 링커에 의해 분리된다.
백신 후보
이전에 논의된 바와 같이, 본 발명은 하기를 특징으로 하는 항원을 포함하는 백신 조성물을 제공한다: 1개 이상의 큰 서열, 2개 이상의 큰 서열, 3개 이상의 큰 서열, 4개 이상의 큰 서열, 또는 5개 이상의 큰 서열. 일부 구현예에서, 큰 서열은 적어도 하나의 B 세포 에피토프 및 적어도 하나의 CD4+ T 세포 에피토프, 적어도 하나의 B 세포 에피토프 및 적어도 하나의 CD8+ T 세포 에피토프, 적어도 하나의 CD4+ T 세포 에피토프 및 적어도 하나의 CD8+ T 세포 에피토프, 또는 적어도 하나의 B 세포 에피토프, 적어도 하나의 CD4+ T 세포 에피토프, 및 적어도 하나의 CD8+ T 세포 에피토프를 포함한다.
표 9 및 도 24는 본원에 기재된 백신 조성물의 예들을 보여준다. 본 발명은 표 9의 예들에 제한되지 않는다.
상기에 언급된 바와 같이, 본 발명은 표 9의 예들에 제한되지 않는다. 일부 구현예에서, 백신 후보는 본원에 기재되어 보여지는 바와 같이 다양한 조각들(예를 들어 프로모터, 단백질, 보조제)을 포함할 수 있다.
표 10은 본원에 기재된 백신 조성물을 형성하기 위해 사용될 수 있는 단백질의 비-제한된 예들을 보여준다. 일부 구현예에서, 하기에 나열된 단백질은 복수의 조합으로 배열될 수 있다. 일부 구현예에서, 단백질들은 직접적으로 서로 연결될 수 있다. 다른 구현예에서, 단백질들은 링커를 통해 서로 연결된다.
표 10은 스파이크 단백질의 비-제한적인 예를 보여준다.
분자 보조제 및 T 세포 향상
특정 구현예에서, 백신 조성물은 분자 보조제 및/또는 하나 이상의 T 세포 향상 조성물을 포함한다. 보조제 및/또는 향상 조성물은 백신 조성물의 면역원성 및/또는 장기간 기억을 개선하는 데 일조할 수 있다. 분자 보조제의 비-제한적인 예는 CpG, 예컨대 CpG 폴리머, 및 플라젤린을 포함한다.
일부 구현예에서, 백신 조성물은 T 세포 유인 케모카인을 포함한다. T 세포 유인 케모카인은 순환계에서 적절한 조직, 예를 들어, 폐, 심장, 신장, 및 뇌로 T 세포를 끌어내는 데 일조한다. T 세포 유인 케모카인의 비-제한적인 예는 CCL5, CXCL9, CXCL10, CXCL11, CCL25, CCL28, CXCL14, CXCL17 또는 이들의 조합을 포함한다.
일부 구현예에서, 백신 조성물은 T 세포 증식을 촉진하는 조성물을 포함한다. T 세포 증식을 촉진하는 조성물의 비-제한적인 예는 IL-7, IL-15, IL-2, 또는 이들의 조합을 포함한다.
일부 구현예에서, 백신 조성물은 폐에서 T 세포 귀소를 촉진하는 조성물을 포함한다. T 세포 귀소를 촉진하는 조성물의 비-제한적인 예는 CCL25, CCL28, CXCL14, CXCL17 또는 이들의 조합을 포함한다.
특정 구현예에서, 분자 보조제 및/또는 T 세포 유인 케모카인 및/또는 T 세포 증식을 촉진하는 조성물은 큰 서열의 별개의 항원 전달 시스템을 이용하여 전달된다.
표 11는 본원에 기재된 백신 조성물을 형성하기 위해 사용될 수 있는 T-세포 향상의 비-제한적인 예를 보여준다.
바람직한 구현예에서, 본원에 기재된 T-세포 향상 조성물(예를 들어, CXCL9, CXCL10, IL-7, IL-2)은 백신 조성물의 별개의 전달 시스템으로 통합될 수 있다. 일부 구현예에서, 본원에 기재된 T-세포 향상 조성물(예를 들어 CXCL9, CXCL10, IL-7, IL-2)은 백신 조성물과 동일한 전달 시스템으로 통합될 수 있다.
특정 구현예에서, 백신 조성물은 태그를 포함한다. 예를 들어, 일부 구현예에서, 백신 조성물은 His 태그를 포함한다. 본 발명은 His 태그에 제한되지 않고, 다른 태그, 예컨대 당업자에게 알려진 것들, 예컨대 형광 태그(예를 들어, GFP, YFP, 등)을 포함한다.
항원 전달 시스템
본 발명은 또한 항원 전달 시스템의 형태인 백신 조성물을 특징으로 한다. 임의의 적절한 항원 전달 시스템이 본원에 기재된 항원의 전달을 위해 고려될 수 있다. 본 발명은 본원에 기재된 항원 전달 시스템에 제한되지 않는다.
특정 구현예에서, 항원 전달 시스템은 백신 조성물의 표적화된 전달을 위한 것으로, 예를 들어, 바이러스가 복제되는 신체의 조직에 표적화하기 위한 것이다.
특정 구현예에서, 항원 전달 시스템은 담체 예컨대 지질 나노입자, 폴리머, 펩티드 등 뿐만 아니라 아데노바이러스 예컨대, 비제한적으로, Ad5, Ad26, Ad35 등을 포함한다. 다른 구현예에서, 항원 전달 시스템은 수포성 구내염 바이러스(VSV) 벡터를 포함한다.
본 발명은 아데노바이러스 벡터계 항원 전달 시스템에 제한되지 않는다. 특정 구현예에서, 항원 전달 시스템은 아데노-연관된 바이러스 벡터계 항원 전달 시스템, 예컨대, 비제한적으로, 아데노-부속 바이러스 벡터 유형 9(AAV9 혈청형), AAV 유형 8(AAV8 혈청형) 등을 포함한다. 특정 구현예에서, 사용된 아데노-부속 바이러스 벡터는 국소적으로, 예를 들어, 폐, 뇌, 심장 및 신장, 예를 들어, ACE2 수용체를 발현하는 신체의 조직에 국소적이다(도 3A)). 예를 들어, AAV9는 신경친화성이 있다고 알려져 있는데, 이것이 백신 조성물이 뇌에서 발현되도록 도울 수 있을 것이다.
상기 항원 전달 시스템에서, 1개 이상의 큰 서열은 프로모터에 작동가능하게 연결된다. 특정 구현예에서, 1개 이상의 큰 서열은 일반적인 프로모터에 작동가능하게 연결된다. 예를 들어, 특정 구현예에서, 1개 이상의 큰 서열은 CMV 프로모터에 작동가능하게 연결된다. 특정 구현예에서, 1개 이상의 큰 서열은 CAG, EFIA, EFS, CBh, SFFV, MSCV, mPGK, hPGK, SV40, UBC, 또는 다른 적절한 프로모터에 작동가능하게 연결된다.
일부 구현예에서, 1개 이상의 큰 서열은 조직 특이적 프로모터(예를 들어, 폐-특이적 프로모터)에 작동가능하게 연결된다. 예를 들어, 항원은 SpB 프로모터 또는 CD144 프로모터에 작동가능하게 연결될 수 있다.
논의된 바와 같이, 특정 구현예에서, 백신 조성물은 분자 보조제를 포함한다. 특정 구현예에서, 분자 보조제는 예를 들어, 상기에 기재된 바와 같이 일반적인 프로모터에 작동가능하게 연결된다. 특정 구현예에서, 분자 보조제는 조직 특이적 프로모터, 예를 들어, 폐-특이적 프로모터, 예를 들어, SpB 또는 CD144에 작동가능하게 연결된다.
논의된 바와 같이, 특정 구현예에서, 백신 조성물은 T 세포 유인 케모카인을 포함한다. 특정 구현예에서, T 세포 유인 케모카인은 예를 들어, 상기에 기재된 바와 같이 일반적인 프로모터에 작동가능하게 연결된다. 특정 구현예에서, T 세포 유인 케모카인은 조직 특이적 프로모터, 예를 들어, 폐-특이적 프로모터, 예를 들어, SpB 또는 CD144에 작동가능하게 연결된다.
논의된 바와 같이, 특정 구현예에서, 백신 조성물은 T 세포 증식을 촉진하기 위한 조성물을 포함한다. 특정 구현예에서, T 세포 증식을 촉진하기 위한 조성물은 예를 들어, 상기에 기재된 바와 같이, 일반적인 프로모터에 작동가능하게 연결된다. 특정 구현예에서, T 세포 증식을 촉진하기 위한 조성물은 조직 특이적 프로모터, 예를 들어, 폐-특이적 프로모터, 예를 들어, SpB 또는 CD144에 작동 가능하게 연결된다.
표 12는 본원에 기재된 백신 조성물을 형성하기 위해 사용될 수 있는 프로모터의 비-제한적인 예들을 보여준다.
특정 구현예에서, T 세포 유인 케모카인 및 T 세포 증식을 촉진하는 조성물은 동일한 프로모터(예를 들어, T 세포 유인 케모카인 및 T 세포 증식을 촉진하는 조성물이 하나의 펩티드로 합성됨)에 의해 구동된다. 특정 구현예에서, T 세포 유인 케모카인 및 T 세포 증식을 촉진하는 조성물은 상이한 프로모터에 의해 구동된다. 특정 구현예에서, 항원, T 세포 유인 케모카인, 및 T 세포 증식을 촉진하는 조성물은 동일한 프로모터에 의해 구동된다. 특정 구현예에서, 항원, T 세포 유인 케모카인, 및 T 세포 증식을 촉진하는 조성물은 상이한 프로모터에 의해 구동된다. 특정 구현예에서, T 세포 유인 케모카인 및 T 세포 증식을 촉진하는 조성물은 동일한 프로모터에 의해 구동되고, 1개 이상의 큰 서열은 상이한 프로모터에 의해 구동된다.
일부 구현예에서, 항원 전달 시스템은 T 세포 유인 케모카인 및 T 세포 증식을 촉진하는 조성물 사이의 하나 이상의 링커를 포함한다. 일부 구현예에서, 링커는 에피토프들 중 하나 이상의 사이에서 사용된다. 링커는 별도 분자(예를 들어, 케모카인)의 절단을 허용할 수 있다. 예를 들어, 일부 구현예에서, 링커는 IL-7(또는 IL-2) 및 CCL5, CXCL9, CXCL10, CXCL11, CCL25, CCL28, CXCL14, CXCL17 등 사이에 위치한다. 일부 구현예에서, 링커는 IL-15 및 CCL5, CXCL9, CXCL10, CXCL11, CCL25, CCL28, CXCL14, CXCL17 등 사이에 위치한다. 일부 구현예에서, 링커는 항원 또는 큰 서열과 또 다른 조성물, 예를 들어, IL-15, IL-7, CCL5, CXCL9, CXCL10, CXCL11, CCL25, CCL28, CXCL14, CXCL17 등 사이에 위치한다. 링커의 비-제한적인 예는 T2A, E2A, P2A 등이다(표 13 참고). 조성물은 각각의 열린 해독틀 사이의 상이한 링커를 특징으로 할 수도 있다.
본 발명은 본원의 임의의 백신 조성물 또는 그의 일부분, 예를 들어, 분자 보조제, T 세포 향상 등을 인코딩하는 mRNA 서열을 포함한다. 본 발명은 또한 본원의 임의의 백신 조성물 또는 그의 일부분을 인코딩하는 변형된 mRNA 서열을 포함한다. 본 발명은 또한 본원의 임의의 백신 조성물 또는 그의 일부분을 인코딩하는 DNA 서열을 포함한다.
특정 구현예에서, 본원의 백신 조성물의 핵산은 화학적으로 변형된다. 일부 구현예에서, 본원의 백신 조성물의 핵산은 비변형된다. 일부 구현예에서, 열린 해독틀에서 우라실의 전부 또는 일부분이 화학적 변형을 갖는다. 일부 구현예에서, 화학적 변형은 우라실의 5-위치에 있다. 일부 구현예에서, 화학적 변형은 N1-메틸 슈도우리딘이다. 일부 구현예에서, 열린 해독틀에서 우라실의 전부 또는 일부분은 우라실의 5-위치에 N1-메틸 슈도우리딘을 갖는다.
특정 구현예에서, 본원의 백신 조성물의 열린 해독틀은 하나의 항원 또는 에피토프를 인코딩한다. 일부 구현예에서, 본원의 백신 조성물의 열린 해독틀은 2개 이상의 항원 또는 에피토프를 인코딩한다. 일부 구현예에서, 본원의 백신 조성물의 열린 해독틀은 다섯개 이상의 항원 또는 에피토프를 인코딩한다. 일부 구현예에서,본원의 백신 조성물의 열린 해독틀은 10개 이상의 항원 또는 에피토프를 인코딩한다. 일부 구현예에서, 본원의 백신 조성물의 열린 해독틀은 50개 이상의 항원 또는 에피토프를 인코딩한다.
방법
일부 구현예에서, 방법은 코로나바이러스 서열(예를 들어, SARS-CoV-2, 변이체, 보통 감기 코로나바이러스, 이전에 알려진 코로나바이러스 균주, 동물 코로나바이러스 등)에서 유래된 하나 이상의 보존된 큰 서열을 결정하는 단계를 포함한다. 방법은 적어도 하나의 큰 보존 서열을 선택하는 단계 및 선택된 큰 보존 서열(들)을 포함하는 항원(또는 항원들)을 합성하는 단계를 포함할 수 있다. 방법은 선택된 큰 보존 서열(들)을 포함하는 항원을 인코딩하는 뉴클레오티드 조성물(예를 들어, DNA, 변형된 DNA, mRNA, 변형된 mRNA, 항원 전달 시스템 등)을 합성하는 단계를 포함할 수 있다. 일부 구현예에서, 본 방법은 추가로 항원, 뉴클레오티드 조성물, 및/또는 항원 전달 시스템 및 약제학적 담체를 포함하는 백신 조성물을 형성하는 단계를 포함한다. 일부 구현예에서, 큰 서열은 본원에 기재된 하나 이상의 보존된 에피토프, 예를 들어, 하나 이상의 보존된 B-세포 표적 에피토프 및/또는 하나 이상의 보존된CD4+ T 세포 표적 에피토프 및/또는 하나 이상의 보존된CD8+ T 세포 표적 에피토프를 포함한다.
일부 구현예에서, 큰 서열의 각각은 하기 중 둘 또는 이들의 조합 사이에서 보존된다: 현재 유행 중인 적어도 2개의 SARS-CoV-2 인간 균주, 이전의 인간 발발을 유발했던 적어도 하나의 코로나바이러스, 박쥐에서 단리된 적어도 하나의 코로나바이러스, 천산갑에서 단리된 적어도 하나의 코로나바이러스, 사향 고양이에서 단리된 적어도 하나의 코로나바이러스, 밍크에서 단리된 적어도 하나의 코로나바이러스 균주 및 낙타 또는 코로나바이러스에 수용적인 임의의 다른 동물에서 단리된 적어도 하나의 코로나바이러스 균주.
이전에 논의된 바와 같이, 본원에 기재된 조성물, 예를 들어, 항원, 백신 조성물, 항원 전달 시스템, 케모카인, 보조제 등은 대상체에서 코로나바이러스 질환을 예방하기 위해 사용될 수 있다. 일부 구현예에서, 본원에 기재된 조성물, 예를 들어, 항원, 백신 조성물, 항원 전달 시스템, 케모카인, 보조제 등은 대상체에서 예방적으로 코로나바이러스 감염을 막기 위해 사용될 수 있다. 일부 구현예에서, 본원에 기재된 조성물, 예를 들어, 항원, 백신 조성물, 항원 전달 시스템, 케모카인, 보조제 등은 대상체에서 면역 반응을 유발할 수 있다. 일부 구현예에서, 본원에 기재된 조성물, 예를 들어, 항원, 백신 조성물, 항원 전달 시스템, 케모카인, 보조제 등은 다중-에피토프 범-코로나바이러스 백신 조성물에 의해 유도된 면역 반응을 연장할 수 있고, 폐로의 T-세포 이동을 증가시킨다.
대상체에서 코로나바이러스 질병을 예방하는 방법은 본 발명에 따른 범-코로나바이러스 백신 조성물의 치료적 유효량를 대상체에 투여하는 단계를 포함할 수 있다. 일부 구현예에서, 조성물은 대상체에서 면역 반응을 유도한다. 일부 구현예에서, 조성물은 기억 B 및 T 세포를 유도한다. 일부 구현예에서, 조성물은 상주하는 기억 T 세포(Trm)를 유도한다. 일부 구현예에서, 조성물은 예를 들어, 폐, 뇌, 심장, 및 신장과 같이 바이러스가 정상적으로 복제되는 영역에서의 바이러스 복제를 막는다. 일부 구현예에서, 조성물은 예를 들어, 폐, 뇌, 심장, 및 신장과 같이 바이러스가 정상적으로 복제되는 영역에서 사이토카인 폭풍을 막는다. 일부 구현예에서, 조성물은, 예를 들어, 폐, 뇌, 심장, 및 신장과 같이 바이러스가 정상적으로 복제되는 영역에서 염증 또는 염증 반응을 막는다. 일부 구현예에서, 조성물은, 예를 들어, 폐, 뇌, 심장, 및 신장과 같이 바이러스가 정상적으로 복제되는 영역에서 T 세포의 귀소 및 체류를 개선한다.
대상체에서 코로나바이러스 감염을 예방적으로 차단하기 위한 방법은 대상체에 본 발명에 따른 범-코로나바이러스 백신 조성물을 예방적 유효량만큼 투여하는 단계를 포함할 수 있다. 일부 구현예에서, 조성물은 대상체에서 면역 반응을 유도한다. 일부 구현예에서, 조성물은 기억 B 및 T 세포를 유도한다. 일부 구현예에서, 조성물은 상주하는 기억 T 세포(Trm)를 유도한다. 일부 구현예에서, 조성물은, 예를 들어, 폐, 뇌, 심장, 및 신장과 같이 바이러스가 정상적으로 복제되는 영역에서 바이러스 복제를 막는다. 일부 구현예에서, 조성물은, 예를 들어, 폐, 뇌, 심장, 및 신장과 같이 바이러스가 정상적으로 복제되는 영역에서, 사이토카인 폭풍을 막는다. 일부 구현예에서, 조성물은, 예를 들어, 폐, 뇌, 심장, 및 신장과 같이 바이러스가 정상적으로 복제되는 영역에서, 염증 또는 염증 반응을 막는다. 일부 구현예에서, 조성물은, 예를 들어, 폐, 뇌, 심장, 및 신장과 같이 바이러스가 정상적으로 복제되는 영역에서, T 세포의 귀소 및 체류를 개선한다.
대상체에서 면역 반응을 유발하는 방법은 대상체에 본 발명에 따르는 백신 조성물을 투여하는 단계를 포함하되, 조성물은 대상체에서 면역 반응을 유도한다. 일부 구현예에서, 조성물은 기억 B 및 T 세포를 유도한다. 일부 구현예에서, 조성물은 상주하는 메모리 T 세포(Trm)를 유도한다. 일부 구현예에서, 조성물은, 예를 들어, 폐, 뇌, 심장, 및 신장과 같이 바이러스가 정상적으로 복제되는 영역에서, 바이러스 복제를 막는다. 일부 구현예에서, 조성물은, 예를 들어, 폐, 뇌, 심장, 및 신장과 같이 바이러스가 정상적으로 복제되는 영역에서, 사이토카인 폭풍을 막는다. 일부 구현예에서, 조성물은, 예를 들어, 폐, 뇌, 심장, 및 신장과 같이 바이러스가 정상적으로 복제되는 영역에서, 염증 또는 염증 반응을 막는다. 일부 구현예에서, 조성물은, 예를 들어, 폐, 뇌, 심장, 및 신장과 같이 바이러스가 정상적으로 복제되는 영역에서, T 세포의 귀소 및 체류를 개선한다.
본 발명의 백신 조성물에 의해 유도된 면역 반응을 연장시키고 특정 조직(예를 들어, 폐, 뇌, 심장, 신장 등)으로 T 세포 이동을 증가시키는 방법은 T-세포 유인 케모카인, T 세포 증식을 촉진하는 조성물 및 본 발명에 따른 백신 조성물(예를 들어, 항원)을 공동발현하는 단계를 포함할 수 있다.
본 발명의 백신 조성물에 의해 유도된 폐에서 기억 T-세포의 체류를 연장하고 바이러스-특이적 조직 상주 기억 T-세포(TRM 세포)를 증가시키는 방법은 T-세포 유인 케모카인, T 세포 증식을 촉진하는 조성물, 및 본 발명에 따른 백신 조성물(예를 들어, 항원)을 공동 발현하는 단계를 포함할 수 있다.
상기 백신 조성물은 예를 들어, 정맥내 경로(i.v.), 비강내 경로(i.n.), 또는 설하 경로 (s.l.)를 통해 표준 수단을 통해, 투여될 수 있다.
특정 구현예에서, 방법은 대상체에 제2(예를 들어, 부스터) 용량을 투여하는 단계를 포함한다. 제2 용량은 동일한 백신 조성물이거나 또는 상이한 백신 조성물일 수 있다. 하나 이상의 백신 조성물의 추가 용량이 투여될 수 있다.
순차적인 백신 전달 방법론
일부 구현예에서, 본 발명은 백신을 전달하여 대상체에서 이종성 면역성을 유도하는 방법을 특징으로 한다(예를 들어, 프라임/부스트, 도 25b 및 도 26b 참고). 일부 구현예에서, 방법은 제1 전달 시스템을 사용하여 제1 범-코로나바이러스 백신 조성물 용량을 투여하는 단계를 포함한다. 추가 구현예에서, 방법은 제2 전달 시스템을 사용하여 제2 백신 조성물 용량을 투여하는 단계를 포함한다. 일부 구현예에서, 제2 조성물은 제1 조성물을 투여하고 8일 후에 투여된다. 일부 구현예에서, 제2 조성물은 제1 조성물을 투여하고 9일 후에 투여된다. 일부 구현예에서, 제2 조성물은 제1 조성물을 투여하고 10일 후에 투여된다. 일부 구현예에서, 제2 조성물은 제1 조성물을 투여하고 11일 후에 투여된다. 일부 구현예에서, 제2 조성물은 제1 조성물을 투여하고 12일 후에 투여된다. 일부 구현예에서, 제2 조성물은 제1 조성물을 투여하고 13일 후에 투여된다. 일부 구현예에서, 제2 조성물은 제1 조성물을 투여하고 14일 후에 투여된다. 일부 구현예에서, 제2 조성물은 제1 조성물을 투여하고 14 내지 30일 후에 투여된다. 일부 구현예에서, 제2 조성물은 제1 조성물을 투여하고 30 내지 60일 후에 투여된다. 다른 구현예에서, 제1 전달 시스템 및 제2 전달 시스템은 상이하다. 일부 구현예에서, 펩티드 백신 조성물은 제1 백신 조성물 용량을 투여하고 14일 후 투여된다. 일부 구현예에서, 펩티드 백신 조성물은 제1 백신 조성물 용량을 투여하고 30 또는 60일 후 투여된다.
일부 구현예에서, 제1 전달 시스템 또는 제2 전달 시스템은 mRNA, 변형된 mRNA 또는 펩티드 벡터를 포함한다. 다른 구현예에서, 펩티드 벡터는 아데노바이러스 또는 아데노-부속 바이러스 벡터를 포함한다.
일부 구현예에서, 본 발명은 백신을 전달하여 대상체에서 이종성 면역성을 유도하는 방법을 특징으로 한다(즉 프라임/풀(당김(pull)), 도 25a 및 도 26a 참고). 일부 구현예에서, 방법은 범-코로나바이러스 백신 조성물을 투여하는 단계를 포함한다. 추가 구현예에서, 방법은 범-코로나바이러스 백신 조성물을 투여한 후 적어도 하나의 T-세포 유인 케모카인을 투여하는 단계를 포함한다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 8일 후에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 9일 후에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 10일 후에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 11일 후에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 12일 후에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 13일 후에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 14일 후에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 14일 내지 30일 후 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 30일 내지 60일 후 투여된다. 일부 구현예에서, T 세포-유인 케모카인 조성물은 최종 백신 조성물 용량이 투여되고 8일 내지 14일 후 투여된다. 일부 구현예에서, 세포-유인 케모카인 조성물은 최종 백신 조성물 용량이 투여되고 30일 또는 60일 후 투여된다.
본 발명은 또한 새로운 '프라임, 당김(pull) 및 부스트' 전략을 특징으로 한다. 다른 구현예에서, 본 발명은 폐-상주 B-세포, CD4+ T 세포 및 CD8+ T 세포의 크기 및 유지를 증가시켜 SARS-CoV-2를 상대로 보호하는 방법을 특징으로 한다(도 25d 및 도 26d). 일부 구현예에서, 방법은 범-코로나바이러스 백신 조성물을 투여하는 단계를 포함한다. 다른 구현예에서, 방법은 범-코로나바이러스 백신 조성물을 투여한 후 적어도 하나의 T-세포 유인 케모카인을 투여하는 단계를 포함한다. 추가 구현예에서, 방법은 T-세포 유인 케모카인을 투여한 후 적어도 하나의 사이토카인을 투여하는 단계를 포함한다. 일부 구현예에서, T-세포 유인 케모카인은 범-코로나바이러스 조성물을 투여하고 14일 후 투여된다. 다른 구현예에서, 사이토카인은 T-세포 유인 케모카인을 투여하고 10일 후 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 8일 후에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 9일 후에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 10일 후에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 11일 후에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 12일 후에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 13일 후에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 14일 후에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 14 내지 30일 후 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 30 내지 60일 후 투여된다. 일부 구현예에서, 사이토카인은 T-세포 유인 케모카인을 투여하고 8일 후 투여된다. 일부 구현예에서, 사이토카인은 T-세포 유인 케모카인을 투여하고 9일 후 투여된다. 일부 구현예에서, 사이토카인은 T-세포 유인 케모카인을 투여하고 10일 후 투여된다. 일부 구현예에서, 사이토카인은 T-세포 유인 케모카인을 투여하고 11일 후 투여된다. 일부 구현예에서, 사이토카인은 T-세포 유인 케모카인을 투여하고 12일 후 투여된다. 일부 구현예에서, 사이토카인은 T-세포 유인 케모카인을 투여하고 13일 후 투여된다. 일부 구현예에서, 사이토카인은 T-세포 유인 케모카인을 투여하고 14일 후 투여된다. 일부 구현예에서, 사이토카인은 T-세포 유인 케모카인을 투여하고 14 내지 30일 후 투여된다. 일부 구현예에서, 사이토카인은 T-세포 유인 케모카인을 투여하고 30 내지 60일 후 투여된다. 일부 구현예에서, 사이토카인 조성물은 T 세포-유인 케모카인을 투여하고 8 내지 14일 후 투여된다. 일부 구현예에서, 사이토카인 조성물은 T 세포-유인 케모카인을 투여하고 30 또는 60일 후 투여된다.
본 발명은 추가로 새로운 "프라임, 당김(pull), 및 유지(keep)" 전략을 특징으로 한다(도 25c 및 도 26c). 추가 구현예에서, 본 발명은 폐-상주 B-세포, CD4+ T 세포 및 CD8+ T 세포의 크기 및 유지를 증가시켜 SARS-CoV-2를 상대로 보호하는 방법을 특징으로 한다. 일부 구현예에서, 방법은 범-코로나바이러스 백신 조성물을 투여하는 단계를 포함한다. 다른 구현예에서, 방법은 범-코로나바이러스 백신 조성물을 투여한 후 적어도 하나의 T-세포 유인 케모카인을 투여하는 단계를 포함한다. 추가 구현예에서, 방법은 T-세포 유인 케모카인을 투여한 후 적어도 하나의 점막 케모카인을 투여하는 단계를 포함한다. 일부 구현예에서, T-세포 유인 케모카인은 범-코로나바이러스 조성물을 투여하고 14일 후 투여된다. 다른 구현예에서, 점막 케모카인은 T-세포 유인 케모카인을 투여하고 10일 후 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 8일 후에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 9일 후에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 10일 후에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 11일 후에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 12일 후에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 13일 후에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 14일 후에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 14 내지 30일 후 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 30 내지 60일 후 투여된다. 일부 구현예에서, 점막 케모카인은 T-세포 유인 케모카인을 투여하고 8일 후 투여된다. 일부 구현예에서, 점막 케모카인은 T-세포 유인 케모카인을 투여하고 9일 후 투여된다. 일부 구현예에서, 점막 케모카인은 T-세포 유인 케모카인을 투여하고 10일 후 투여된다. 일부 구현예에서, 점막 케모카인은 T-세포 유인 케모카인을 투여하고 11일 후 투여된다. 일부 구현예에서, 점막 케모카인은 T-세포 유인 케모카인을 투여하고 12일 후 투여된다. 일부 구현예에서, 점막 케모카인은 T-세포 유인 케모카인을 투여하고 13일 후 투여된다. 일부 구현예에서, 점막 케모카인은 T-세포 유인 케모카인을 투여하고 14일 후 투여된다. 일부 구현예에서, 점막 케모카인은 T-세포 유인 케모카인을 투여하고 14 내지 30일 후 투여된다. 일부 구현예에서, 점막 케모카인은 T-세포 유인 케모카인을 투여하고 30 내지 60일 후 투여된다. 일부 구현예에서, 점막 케모카인 조성물은 T 세포-유인 케모카인을 투여하고 8 내지 14일 후 투여된다. 일부 구현예에서, 점막 사이토카인 조성물은 T 세포-유인 케모카인을 투여하고 30 또는 60일 후 투여된다.
일부 구현예에서, 점막 케모카인은 CCL25, CCL28,CXCL14, CXCL17, 또는 이들의 조합을 포함할 수 있다. 일부 구현예에서, T-세포 유인 케모카인은 CCL5, CXCL9, CXCL10, CXCL11, 또는 이들의 조합을 포함할 수 있다. 일부 구현예에서, 사이토카인은 IL-15, IL-2, IL-7 또는 이들의 조합을 포함할 수 있다.
일부 구현예에서, 본원의 백신 조성물의 효능(또는 유효성)은 60%를 초과한다. 일부 구현예에서, 본원의 백신 조성물의 효능(또는 유효성)은 70%를 초과한다. 일부 구현예에서, 본원의 백신 조성물의 효능(또는 유효성)은 80%를 초과한다. 일부 구현예에서, 본원의 백신 조성물의 효능(또는 유효성)은 90%를 초과한다. 일부 구현예에서, 본원의 백신 조성물의 효능(또는 유효성)은 95%를 초과한다.
백신 효능은 표준 분석(예를 들어, Weinberg 등, J Infect Dis. 2010 Jun. 1; 201(11):1607-10 참고)을 사용하여 평가될 수 있다. 예를 들어, 백신 효능은 이중 맹검, 램덤화된, 임상 제어된 시도에 의해 측정될 수 있다. 백신 효능은 백신미접종(ARU) 및 백신접종(ARV) 연구 코호트 사이의 질환 발병률(AR)에서 비례 감소로 표현될 수 있고, 다음의 식을 사용하여 백신접종 그룹 중 질병의 상대적 위험(RR)에서 계산될 수 있다: 효능=(ARU-ARV)/ARUХ100; 및 효능=(1-RR)Х100.
마찬가지로, 백신 유효성은 표준 분석을 사용하여 평가될 수 있다(참고, 예를 들어, Weinberg 등, J Infect Dis. 2010 Jun. 1; 201(11):1607-10). 백신 유효성은 백신(높은 백신 효능이 있는 것으로 이미 입증되었을 수도 있음)이 집단에서 질병을 얼마나 감소시키는지에 대한 평가이다. 이 수치는 제어된 임상 시험에서 보다 자연적인 현장 조건 하에서, 백신 자체 뿐만 아니라 백신접종 프로그램의 이점 및 역효과의 순 균형을 평가할 수 있다. 백신 유효성은 백신 효과(효능)에 비례하지만, 또한 입원, 외래 방문, 또는 비용의 '실제 상황' 결과에 영향을 미치는 다른 비-백신 관련 인자에 의해서만이 아니라, 집단의 표적 그룹이 얼마나 잘 면역화되는지에 의해 영향을 받는다. 예를 들어, 감염된 사례 및 적절한 통제의 세트 중 백신접종률이 비교되는 소급 사례 대조군 분석이 사용될 수 있다. 백신 유효성은 백신접종에도 불구하고 감염이 발생하는 가능성 비율(OR)을 사용하여, 발생률의 차이로 표현될 수 있다: 유효성=(1-OR)Х100.
일부 구현예에서, 백신은 코로나바이러스에 대해 대상체에 최대 1 년 동안 면역을 부여한다. 일부 구현예에서, 백신은 코로나바이러스에 대해 대상체에 최대 2 년 동안 면역을 부여한다. 일부 구현예에서, 백신은 코로나바이러스에 대해 대상체에 1년 넘게, 2년 넘게, 3년 넘게, 4년 넘게, 또는 5-10년 동안 면역을 부여한다.
일부 구현예에서, 대상체는 약 20세 내지 약 50세(예를 들어, 약 20, 25, 30, 35, 40, 45 또는 50세) 사이의 젊은 성체이다.
일부 구현예에서, 대상체는 약 60세, 약 70세, 또는 나이가 더 많은(예를 들어, 약 60, 65, 70, 75, 80, 85 또는 90세) 나이든 대상체이다.
일부 구현예에서, 대상체는 약 5세 이하이다. 예를 들어, 대상체는 약 1세부터 약 5세(예를 들어, 약 1, 2, 3, 5 또는 5세)의 나이이거나, 또는 약 6개월부터 약 1세(예를 들어, 약 6, 7, 8, 9, 10, 11 또는 12개월)의 나이일 수 있다. 일부 구현예에서, 대상체는 약 12개월 이하(예를 들어, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2 개월 또는 1개월)이다. 일부 구현예에서, 대상체는 약 6 개월 이하이다.
일부 구현예에서, 대상체는 만삭둥이였다(예를 들어, 약 37-42주). 일부 구현예에서, 대상체는 예를 들어, 임신 약 36주 차에 또는 조기에(예를 들어, 약 36, 35, 34, 33, 32, 31, 30, 29, 28, 27, 26 또는 25주) 태어난 이른 둥이였다. 예를 들어, 대상체는 임신 약 32 주차에 또는 더 이른 시기에 태어났을 수도 있다. 일부 구현예에서, 대상체는 임신 약 32주 내지 약 36주 차에 태어난 이른 둥이였다. 이와 같은 대상체에서, 생후, 예를 들어, 약 6 개월 내지 약 5 년, 또는 그 후, 백신이 투여될 수 있다.
일부 구현예에서, 대상체는 백신 투여 시 임산부(예를 들어, 첫, 두 번째, 세 번째 삼개월)이다.
일부 구현예에서, 대상체는 만성 폐 질환(예를 들어, 만성적 폐쇄성 폐 질환(COPD) 또는 천식)을 갖고 있거나, 또는 그것의 위험에 처해 있다. COPD의 두 가지 형태에는 점액과 함께 장기간 기침을 수반하는 만성 기관지염과 시간 경과에 따라 폐 손상을 수반하는 폐기종이 포함된다. 따라서, 백신이 투여된 대상체는 만성 기관지염 또는 폐기종이 있을 수 있다.
일부 구현예에서, 대상체는 코로나바이러스에 노출된 바 있다. 일부 구현예에서, 대상체는 코로나바이러스에 감염되었다. 일부 구현예에서, 대상체는 코로나바이러스에 의한 감염 위험이 있다.
일부 구현예에서, 대상체는 면역이 저하되어 있다(손상된 면역계를 가짐, 예를 들어, 면역 장애 또는 자가면역 장애 있음).
약제학적
담체
특정 구현예에서, 백신 조성물은 추가로 약제학적 담체를 포함한다. 약제학적 담체는 당업자에게 잘 알려져 있다. 예를 들어, 특정 구현예에서, 약제학적 담체는 물, 알코올, 천연 또는 경화된 오일, 천연 또는 경화된 왁스, 탄산칼슘, 탄산나트륨, 인산칼슘, 카올린, 탈크, 락토스 및 이들의 조합으로 이루어진 군에서 선택된다. 일부 구현예에서, 약제학적 담체는 지질 나노입자, 아데노바이러스 벡터, 또는 아데노-부속 바이러스 벡터를 포함할 수 있다. 일부 구현예에서, 백신 조성물은 아데노-부속 바이러스 벡터계 항원 전달 시스템을 사용하여 제작된다.
또한 전술한 단락 중 어느 하나의, 나노입자에 제형화된(예를 들어, 지질 나노입자) 백신이 본원에 제공된다. 일부 구현예에서, 나노입자는 평균 직경이 50-200nm이다. 일부 구현예에서, 나노입자는 지질 나노입자이다. 일부 구현예에서, 지질 나노입자는 양이온성 지질, PEG-변형된 지질, 스테롤 및 비-양이온성 지질을 포함한다. 일부 구현예에서, 지질 나노입자는 약 20-60% 양이온성 지질, 0.5-15% PEG-변형된 지질, 25-55% 스테롤, 및 25% 비-양이온성 지질의 몰비를 포함한다. 일부 구현예에서, 양이온성 지질은 이온화가능 양이온성 지질이고, 비-양이온성 지질은 중성 지질이며, 스테롤를 콜레스테롤이다. 일부 구현예에서, 양이온성 지질은 2,2-디리놀레일-4-디메틸아미노에틸-[1,3]-디옥솔란(DLin-KC2-DMA), 디리놀레일-메틸-4-디메틸아미노부티레이트(DLin-MC3-DMA) 및 디((Z)-논-2-엔-1-일) 9-((4-(디메틸아미노)부타노일)옥시)헵타데칸디오에이트(L319)에서 선택된다.
본 발명의 바람직한 구현예가 보여지고 기재된 바 있으나, 첨부된 청구항의 범위를 벗어나지 않는 변형이 그것에 이루어질 수 있음이 당업자에게 용이하게 명백할 것이다. 따라서, 본 발명의 범위는 다음의 청구항에 의해서만 제한될 것이다. 일부 구현예에서, 본 특허 출원에 제시된 도면은 각도, 치수 비율을 비롯한 척도에 따라 그려졌다. 일부 구현예에서, 도면은 나타내기 위한 것일 뿐, 청구항은 도면의 치수에 의해 제한되지 않는다. 일부 구현예에서, 문구 '포함하는'을 사용하여 본원에 기재된 본 발명의 설명은 '본질적으로 ~으로 이루어진' 또는 '~으로 이루어진'으로 기재될 수 있는 구현예를 포함하고, 그로써, 문구 '본질적으로 ~으로 이루어진' 또는 '~으로 이루어진'을 사용하여 본 발명의 하나 이상의 구현예를 주장하기 위한 서면 설명 요건이 충족된다.
<110> Benmohamed, Lbachir
<120> PAN-CORONAVIRUS VACCINE COMPOSITIONS
<130> UCI 20.06B
<160> 197
<170> PatentIn version 3.5
<210> 1
<211> 7096
<212> PRT
<213> Unknown
<220>
<223> Severe acute respiratory syndrome coronavirus 2
<400> 1
Met Glu Ser Leu Val Pro Gly Phe Asn Glu Lys Thr His Val Gln Leu
1 5 10 15
Ser Leu Pro Val Leu Gln Val Arg Asp Val Leu Val Arg Gly Phe Gly
20 25 30
Asp Ser Val Glu Glu Val Leu Ser Glu Ala Arg Gln His Leu Lys Asp
35 40 45
Gly Thr Cys Gly Leu Val Glu Val Glu Lys Gly Val Leu Pro Gln Leu
50 55 60
Glu Gln Pro Tyr Val Phe Ile Lys Arg Ser Asp Ala Arg Thr Ala Pro
65 70 75 80
His Gly His Val Met Val Glu Leu Val Ala Glu Leu Glu Gly Ile Gln
85 90 95
Tyr Gly Arg Ser Gly Glu Thr Leu Gly Val Leu Val Pro His Val Gly
100 105 110
Glu Ile Pro Val Ala Tyr Arg Lys Val Leu Leu Arg Lys Asn Gly Asn
115 120 125
Lys Gly Ala Gly Gly His Ser Tyr Gly Ala Asp Leu Lys Ser Phe Asp
130 135 140
Leu Gly Asp Glu Leu Gly Thr Asp Pro Tyr Glu Asp Phe Gln Glu Asn
145 150 155 160
Trp Asn Thr Lys His Ser Ser Gly Val Thr Arg Glu Leu Met Arg Glu
165 170 175
Leu Asn Gly Gly Ala Tyr Thr Arg Tyr Val Asp Asn Asn Phe Cys Gly
180 185 190
Pro Asp Gly Tyr Pro Leu Glu Cys Ile Lys Asp Leu Leu Ala Arg Ala
195 200 205
Gly Lys Ala Ser Cys Thr Leu Ser Glu Gln Leu Asp Phe Ile Asp Thr
210 215 220
Lys Arg Gly Val Tyr Cys Cys Arg Glu His Glu His Glu Ile Ala Trp
225 230 235 240
Tyr Thr Glu Arg Ser Glu Lys Ser Tyr Glu Leu Gln Thr Pro Phe Glu
245 250 255
Ile Lys Leu Ala Lys Lys Phe Asp Thr Phe Asn Gly Glu Cys Pro Asn
260 265 270
Phe Val Phe Pro Leu Asn Ser Ile Ile Lys Thr Ile Gln Pro Arg Val
275 280 285
Glu Lys Lys Lys Leu Asp Gly Phe Met Gly Arg Ile Arg Ser Val Tyr
290 295 300
Pro Val Ala Ser Pro Asn Glu Cys Asn Gln Met Cys Leu Ser Thr Leu
305 310 315 320
Met Lys Cys Asp His Cys Gly Glu Thr Ser Trp Gln Thr Gly Asp Phe
325 330 335
Val Lys Ala Thr Cys Glu Phe Cys Gly Thr Glu Asn Leu Thr Lys Glu
340 345 350
Gly Ala Thr Thr Cys Gly Tyr Leu Pro Gln Asn Ala Val Val Lys Ile
355 360 365
Tyr Cys Pro Ala Cys His Asn Ser Glu Val Gly Pro Glu His Ser Leu
370 375 380
Ala Glu Tyr His Asn Glu Ser Gly Leu Lys Thr Ile Leu Arg Lys Gly
385 390 395 400
Gly Arg Thr Ile Ala Phe Gly Gly Cys Val Phe Ser Tyr Val Gly Cys
405 410 415
His Asn Lys Cys Ala Tyr Trp Val Pro Arg Ala Ser Ala Asn Ile Gly
420 425 430
Cys Asn His Thr Gly Val Val Gly Glu Gly Ser Glu Gly Leu Asn Asp
435 440 445
Asn Leu Leu Glu Ile Leu Gln Lys Glu Lys Val Asn Ile Asn Ile Val
450 455 460
Gly Asp Phe Lys Leu Asn Glu Glu Ile Ala Ile Ile Leu Ala Ser Phe
465 470 475 480
Ser Ala Ser Thr Ser Ala Phe Val Glu Thr Val Lys Gly Leu Asp Tyr
485 490 495
Lys Ala Phe Lys Gln Ile Val Glu Ser Cys Gly Asn Phe Lys Val Thr
500 505 510
Lys Gly Lys Ala Lys Lys Gly Ala Trp Asn Ile Gly Glu Gln Lys Ser
515 520 525
Ile Leu Ser Pro Leu Tyr Ala Phe Ala Ser Glu Ala Ala Arg Val Val
530 535 540
Arg Ser Ile Phe Ser Arg Thr Leu Glu Thr Ala Gln Asn Ser Val Arg
545 550 555 560
Val Leu Gln Lys Ala Ala Ile Thr Ile Leu Asp Gly Ile Ser Gln Tyr
565 570 575
Ser Leu Arg Leu Ile Asp Ala Met Met Phe Thr Ser Asp Leu Ala Thr
580 585 590
Asn Asn Leu Val Val Met Ala Tyr Ile Thr Gly Gly Val Val Gln Leu
595 600 605
Thr Ser Gln Trp Leu Thr Asn Ile Phe Gly Thr Val Tyr Glu Lys Leu
610 615 620
Lys Pro Val Leu Asp Trp Leu Glu Glu Lys Phe Lys Glu Gly Val Glu
625 630 635 640
Phe Leu Arg Asp Gly Trp Glu Ile Val Lys Phe Ile Ser Thr Cys Ala
645 650 655
Cys Glu Ile Val Gly Gly Gln Ile Val Thr Cys Ala Lys Glu Ile Lys
660 665 670
Glu Ser Val Gln Thr Phe Phe Lys Leu Val Asn Lys Phe Leu Ala Leu
675 680 685
Cys Ala Asp Ser Ile Ile Ile Gly Gly Ala Lys Leu Lys Ala Leu Asn
690 695 700
Leu Gly Glu Thr Phe Val Thr His Ser Lys Gly Leu Tyr Arg Lys Cys
705 710 715 720
Val Lys Ser Arg Glu Glu Thr Gly Leu Leu Met Pro Leu Lys Ala Pro
725 730 735
Lys Glu Ile Ile Phe Leu Glu Gly Glu Thr Leu Pro Thr Glu Val Leu
740 745 750
Thr Glu Glu Val Val Leu Lys Thr Gly Asp Leu Gln Pro Leu Glu Gln
755 760 765
Pro Thr Ser Glu Ala Val Glu Ala Pro Leu Val Gly Thr Pro Val Cys
770 775 780
Ile Asn Gly Leu Met Leu Leu Glu Ile Lys Asp Thr Glu Lys Tyr Cys
785 790 795 800
Ala Leu Ala Pro Asn Met Met Val Thr Asn Asn Thr Phe Thr Leu Lys
805 810 815
Gly Gly Ala Pro Thr Lys Val Thr Phe Gly Asp Asp Thr Val Ile Glu
820 825 830
Val Gln Gly Tyr Lys Ser Val Asn Ile Thr Phe Glu Leu Asp Glu Arg
835 840 845
Ile Asp Lys Val Leu Asn Glu Lys Cys Ser Ala Tyr Thr Val Glu Leu
850 855 860
Gly Thr Glu Val Asn Glu Phe Ala Cys Val Val Ala Asp Ala Val Ile
865 870 875 880
Lys Thr Leu Gln Pro Val Ser Glu Leu Leu Thr Pro Leu Gly Ile Asp
885 890 895
Leu Asp Glu Trp Ser Met Ala Thr Tyr Tyr Leu Phe Asp Glu Ser Gly
900 905 910
Glu Phe Lys Leu Ala Ser His Met Tyr Cys Ser Phe Tyr Pro Pro Asp
915 920 925
Glu Asp Glu Glu Glu Gly Asp Cys Glu Glu Glu Glu Phe Glu Pro Ser
930 935 940
Thr Gln Tyr Glu Tyr Gly Thr Glu Asp Asp Tyr Gln Gly Lys Pro Leu
945 950 955 960
Glu Phe Gly Ala Thr Ser Ala Ala Leu Gln Pro Glu Glu Glu Gln Glu
965 970 975
Glu Asp Trp Leu Asp Asp Asp Ser Gln Gln Thr Val Gly Gln Gln Asp
980 985 990
Gly Ser Glu Asp Asn Gln Thr Thr Thr Ile Gln Thr Ile Val Glu Val
995 1000 1005
Gln Pro Gln Leu Glu Met Glu Leu Thr Pro Val Val Gln Thr Ile Glu
1010 1015 1020
Val Asn Ser Phe Ser Gly Tyr Leu Lys Leu Thr Asp Asn Val Tyr Ile
1025 1030 1035 1040
Lys Asn Ala Asp Ile Val Glu Glu Ala Lys Lys Val Lys Pro Thr Val
1045 1050 1055
Val Val Asn Ala Ala Asn Val Tyr Leu Lys His Gly Gly Gly Val Ala
1060 1065 1070
Gly Ala Leu Asn Lys Ala Thr Asn Asn Ala Met Gln Val Glu Ser Asp
1075 1080 1085
Asp Tyr Ile Ala Thr Asn Gly Pro Leu Lys Val Gly Gly Ser Cys Val
1090 1095 1100
Leu Ser Gly His Asn Leu Ala Lys His Cys Leu His Val Val Gly Pro
1105 1110 1115 1120
Asn Val Asn Lys Gly Glu Asp Ile Gln Leu Leu Lys Ser Ala Tyr Glu
1125 1130 1135
Asn Phe Asn Gln His Glu Val Leu Leu Ala Pro Leu Leu Ser Ala Gly
1140 1145 1150
Ile Phe Gly Ala Asp Pro Ile His Ser Leu Arg Val Cys Val Asp Thr
1155 1160 1165
Val Arg Thr Asn Val Tyr Leu Ala Val Phe Asp Lys Asn Leu Tyr Asp
1170 1175 1180
Lys Leu Val Ser Ser Phe Leu Glu Met Lys Ser Glu Lys Gln Val Glu
1185 1190 1195 1200
Gln Lys Ile Ala Glu Ile Pro Lys Glu Glu Val Lys Pro Phe Ile Thr
1205 1210 1215
Glu Ser Lys Pro Ser Val Glu Gln Arg Lys Gln Asp Asp Lys Lys Ile
1220 1225 1230
Lys Ala Cys Val Glu Glu Val Thr Thr Thr Leu Glu Glu Thr Lys Phe
1235 1240 1245
Leu Thr Glu Asn Leu Leu Leu Tyr Ile Asp Ile Asn Gly Asn Leu His
1250 1255 1260
Pro Asp Ser Ala Thr Leu Val Ser Asp Ile Asp Ile Thr Phe Leu Lys
1265 1270 1275 1280
Lys Asp Ala Pro Tyr Ile Val Gly Asp Val Val Gln Glu Gly Val Leu
1285 1290 1295
Thr Ala Val Val Ile Pro Thr Lys Lys Ala Gly Gly Thr Thr Glu Met
1300 1305 1310
Leu Ala Lys Ala Leu Arg Lys Val Pro Thr Asp Asn Tyr Ile Thr Thr
1315 1320 1325
Tyr Pro Gly Gln Gly Leu Asn Gly Tyr Thr Val Glu Glu Ala Lys Thr
1330 1335 1340
Val Leu Lys Lys Cys Lys Ser Ala Phe Tyr Ile Leu Pro Ser Ile Ile
1345 1350 1355 1360
Ser Asn Glu Lys Gln Glu Ile Leu Gly Thr Val Ser Trp Asn Leu Arg
1365 1370 1375
Glu Met Leu Ala His Ala Glu Glu Thr Arg Lys Leu Met Pro Val Cys
1380 1385 1390
Val Glu Thr Lys Ala Ile Val Ser Thr Ile Gln Arg Lys Tyr Lys Gly
1395 1400 1405
Ile Lys Ile Gln Glu Gly Val Val Asp Tyr Gly Ala Arg Phe Tyr Phe
1410 1415 1420
Tyr Thr Ser Lys Thr Thr Val Ala Ser Leu Ile Asn Thr Leu Asn Asp
1425 1430 1435 1440
Leu Asn Glu Thr Leu Val Thr Met Pro Leu Gly Tyr Val Thr His Gly
1445 1450 1455
Leu Asn Leu Glu Glu Ala Ala Arg Tyr Met Arg Ser Leu Lys Val Pro
1460 1465 1470
Ala Thr Val Ser Val Ser Ser Pro Asp Ala Val Thr Ala Tyr Asn Gly
1475 1480 1485
Tyr Leu Thr Ser Ser Ser Lys Thr Pro Glu Glu His Phe Ile Glu Thr
1490 1495 1500
Ile Ser Leu Ala Gly Ser Tyr Lys Asp Trp Ser Tyr Ser Gly Gln Ser
1505 1510 1515 1520
Thr Gln Leu Gly Ile Glu Phe Leu Lys Arg Gly Asp Lys Ser Val Tyr
1525 1530 1535
Tyr Thr Ser Asn Pro Thr Thr Phe His Leu Asp Gly Glu Val Ile Thr
1540 1545 1550
Phe Asp Asn Leu Lys Thr Leu Leu Ser Leu Arg Glu Val Arg Thr Ile
1555 1560 1565
Lys Val Phe Thr Thr Val Asp Asn Ile Asn Leu His Thr Gln Val Val
1570 1575 1580
Asp Met Ser Met Thr Tyr Gly Gln Gln Phe Gly Pro Thr Tyr Leu Asp
1585 1590 1595 1600
Gly Ala Asp Val Thr Lys Ile Lys Pro His Asn Ser His Glu Gly Lys
1605 1610 1615
Thr Phe Tyr Val Leu Pro Asn Asp Asp Thr Leu Arg Val Glu Ala Phe
1620 1625 1630
Glu Tyr Tyr His Thr Thr Asp Pro Ser Phe Leu Gly Arg Tyr Met Ser
1635 1640 1645
Ala Leu Asn His Thr Lys Lys Trp Lys Tyr Pro Gln Val Asn Gly Leu
1650 1655 1660
Thr Ser Ile Lys Trp Ala Asp Asn Asn Cys Tyr Leu Ala Thr Ala Leu
1665 1670 1675 1680
Leu Thr Leu Gln Gln Ile Glu Leu Lys Phe Asn Pro Pro Ala Leu Gln
1685 1690 1695
Asp Ala Tyr Tyr Arg Ala Arg Ala Gly Glu Ala Ala Asn Phe Cys Ala
1700 1705 1710
Leu Ile Leu Ala Tyr Cys Asn Lys Thr Val Gly Glu Leu Gly Asp Val
1715 1720 1725
Arg Glu Thr Met Ser Tyr Leu Phe Gln His Ala Asn Leu Asp Ser Cys
1730 1735 1740
Lys Arg Val Leu Asn Val Val Cys Lys Thr Cys Gly Gln Gln Gln Thr
1745 1750 1755 1760
Thr Leu Lys Gly Val Glu Ala Val Met Tyr Met Gly Thr Leu Ser Tyr
1765 1770 1775
Glu Gln Phe Lys Lys Gly Val Gln Ile Pro Cys Thr Cys Gly Lys Gln
1780 1785 1790
Ala Thr Lys Tyr Leu Val Gln Gln Glu Ser Pro Phe Val Met Met Ser
1795 1800 1805
Ala Pro Pro Ala Gln Tyr Glu Leu Lys His Gly Thr Phe Thr Cys Ala
1810 1815 1820
Ser Glu Tyr Thr Gly Asn Tyr Gln Cys Gly His Tyr Lys His Ile Thr
1825 1830 1835 1840
Ser Lys Glu Thr Leu Tyr Cys Ile Asp Gly Ala Leu Leu Thr Lys Ser
1845 1850 1855
Ser Glu Tyr Lys Gly Pro Ile Thr Asp Val Phe Tyr Lys Glu Asn Ser
1860 1865 1870
Tyr Thr Thr Thr Ile Lys Pro Val Thr Tyr Lys Leu Asp Gly Val Val
1875 1880 1885
Cys Thr Glu Ile Asp Pro Lys Leu Asp Asn Tyr Tyr Lys Lys Asp Asn
1890 1895 1900
Ser Tyr Phe Thr Glu Gln Pro Ile Asp Leu Val Pro Asn Gln Pro Tyr
1905 1910 1915 1920
Pro Asn Ala Ser Phe Asp Asn Phe Lys Phe Val Cys Asp Asn Ile Lys
1925 1930 1935
Phe Ala Asp Asp Leu Asn Gln Leu Thr Gly Tyr Lys Lys Pro Ala Ser
1940 1945 1950
Arg Glu Leu Lys Val Thr Phe Phe Pro Asp Leu Asn Gly Asp Val Val
1955 1960 1965
Ala Ile Asp Tyr Lys His Tyr Thr Pro Ser Phe Lys Lys Gly Ala Lys
1970 1975 1980
Leu Leu His Lys Pro Ile Val Trp His Val Asn Asn Ala Thr Asn Lys
1985 1990 1995 2000
Ala Thr Tyr Lys Pro Asn Thr Trp Cys Ile Arg Cys Leu Trp Ser Thr
2005 2010 2015
Lys Pro Val Glu Thr Ser Asn Ser Phe Asp Val Leu Lys Ser Glu Asp
2020 2025 2030
Ala Gln Gly Met Asp Asn Leu Ala Cys Glu Asp Leu Lys Pro Val Ser
2035 2040 2045
Glu Glu Val Val Glu Asn Pro Thr Ile Gln Lys Asp Val Leu Glu Cys
2050 2055 2060
Asn Val Lys Thr Thr Glu Val Val Gly Asp Ile Ile Leu Lys Pro Ala
2065 2070 2075 2080
Asn Asn Ser Leu Lys Ile Thr Glu Glu Val Gly His Thr Asp Leu Met
2085 2090 2095
Ala Ala Tyr Val Asp Asn Ser Ser Leu Thr Ile Lys Lys Pro Asn Glu
2100 2105 2110
Leu Ser Arg Val Leu Gly Leu Lys Thr Leu Ala Thr His Gly Leu Ala
2115 2120 2125
Ala Val Asn Ser Val Pro Trp Asp Thr Ile Ala Asn Tyr Ala Lys Pro
2130 2135 2140
Phe Leu Asn Lys Val Val Ser Thr Thr Thr Asn Ile Val Thr Arg Cys
2145 2150 2155 2160
Leu Asn Arg Val Cys Thr Asn Tyr Met Pro Tyr Phe Phe Thr Leu Leu
2165 2170 2175
Leu Gln Leu Cys Thr Phe Thr Arg Ser Thr Asn Ser Arg Ile Lys Ala
2180 2185 2190
Ser Met Pro Thr Thr Ile Ala Lys Asn Thr Val Lys Ser Val Gly Lys
2195 2200 2205
Phe Cys Leu Glu Ala Ser Phe Asn Tyr Leu Lys Ser Pro Asn Phe Ser
2210 2215 2220
Lys Leu Ile Asn Ile Ile Ile Trp Phe Leu Leu Leu Ser Val Cys Leu
2225 2230 2235 2240
Gly Ser Leu Ile Tyr Ser Thr Ala Ala Leu Gly Val Leu Met Ser Asn
2245 2250 2255
Leu Gly Met Pro Ser Tyr Cys Thr Gly Tyr Arg Glu Gly Tyr Leu Asn
2260 2265 2270
Ser Thr Asn Val Thr Ile Ala Thr Tyr Cys Thr Gly Ser Ile Pro Cys
2275 2280 2285
Ser Val Cys Leu Ser Gly Leu Asp Ser Leu Asp Thr Tyr Pro Ser Leu
2290 2295 2300
Glu Thr Ile Gln Ile Thr Ile Ser Ser Phe Lys Trp Asp Leu Thr Ala
2305 2310 2315 2320
Phe Gly Leu Val Ala Glu Trp Phe Leu Ala Tyr Ile Leu Phe Thr Arg
2325 2330 2335
Phe Phe Tyr Val Leu Gly Leu Ala Ala Ile Met Gln Leu Phe Phe Ser
2340 2345 2350
Tyr Phe Ala Val His Phe Ile Ser Asn Ser Trp Leu Met Trp Leu Ile
2355 2360 2365
Ile Asn Leu Val Gln Met Ala Pro Ile Ser Ala Met Val Arg Met Tyr
2370 2375 2380
Ile Phe Phe Ala Ser Phe Tyr Tyr Val Trp Lys Ser Tyr Val His Val
2385 2390 2395 2400
Val Asp Gly Cys Asn Ser Ser Thr Cys Met Met Cys Tyr Lys Arg Asn
2405 2410 2415
Arg Ala Thr Arg Val Glu Cys Thr Thr Ile Val Asn Gly Val Arg Arg
2420 2425 2430
Ser Phe Tyr Val Tyr Ala Asn Gly Gly Lys Gly Phe Cys Lys Leu His
2435 2440 2445
Asn Trp Asn Cys Val Asn Cys Asp Thr Phe Cys Ala Gly Ser Thr Phe
2450 2455 2460
Ile Ser Asp Glu Val Ala Arg Asp Leu Ser Leu Gln Phe Lys Arg Pro
2465 2470 2475 2480
Ile Asn Pro Thr Asp Gln Ser Ser Tyr Ile Val Asp Ser Val Thr Val
2485 2490 2495
Lys Asn Gly Ser Ile His Leu Tyr Phe Asp Lys Ala Gly Gln Lys Thr
2500 2505 2510
Tyr Glu Arg His Ser Leu Ser His Phe Val Asn Leu Asp Asn Leu Arg
2515 2520 2525
Ala Asn Asn Thr Lys Gly Ser Leu Pro Ile Asn Val Ile Val Phe Asp
2530 2535 2540
Gly Lys Ser Lys Cys Glu Glu Ser Ser Ala Lys Ser Ala Ser Val Tyr
2545 2550 2555 2560
Tyr Ser Gln Leu Met Cys Gln Pro Ile Leu Leu Leu Asp Gln Ala Leu
2565 2570 2575
Val Ser Asp Val Gly Asp Ser Ala Glu Val Ala Val Lys Met Phe Asp
2580 2585 2590
Ala Tyr Val Asn Thr Phe Ser Ser Thr Phe Asn Val Pro Met Glu Lys
2595 2600 2605
Leu Lys Thr Leu Val Ala Thr Ala Glu Ala Glu Leu Ala Lys Asn Val
2610 2615 2620
Ser Leu Asp Asn Val Leu Ser Thr Phe Ile Ser Ala Ala Arg Gln Gly
2625 2630 2635 2640
Phe Val Asp Ser Asp Val Glu Thr Lys Asp Val Val Glu Cys Leu Lys
2645 2650 2655
Leu Ser His Gln Ser Asp Ile Glu Val Thr Gly Asp Ser Cys Asn Asn
2660 2665 2670
Tyr Met Leu Thr Tyr Asn Lys Val Glu Asn Met Thr Pro Arg Asp Leu
2675 2680 2685
Gly Ala Cys Ile Asp Cys Ser Ala Arg His Ile Asn Ala Gln Val Ala
2690 2695 2700
Lys Ser His Asn Ile Ala Leu Ile Trp Asn Val Lys Asp Phe Met Ser
2705 2710 2715 2720
Leu Ser Glu Gln Leu Arg Lys Gln Ile Arg Ser Ala Ala Lys Lys Asn
2725 2730 2735
Asn Leu Pro Phe Lys Leu Thr Cys Ala Thr Thr Arg Gln Val Val Asn
2740 2745 2750
Val Val Thr Thr Lys Ile Ala Leu Lys Gly Gly Lys Ile Val Asn Asn
2755 2760 2765
Trp Leu Lys Gln Leu Ile Lys Val Thr Leu Val Phe Leu Phe Val Ala
2770 2775 2780
Ala Ile Phe Tyr Leu Ile Thr Pro Val His Val Met Ser Lys His Thr
2785 2790 2795 2800
Asp Phe Ser Ser Glu Ile Ile Gly Tyr Lys Ala Ile Asp Gly Gly Val
2805 2810 2815
Thr Arg Asp Ile Ala Ser Thr Asp Thr Cys Phe Ala Asn Lys His Ala
2820 2825 2830
Asp Phe Asp Thr Trp Phe Ser Gln Arg Gly Gly Ser Tyr Thr Asn Asp
2835 2840 2845
Lys Ala Cys Pro Leu Ile Ala Ala Val Ile Thr Arg Glu Val Gly Phe
2850 2855 2860
Val Val Pro Gly Leu Pro Gly Thr Ile Leu Arg Thr Thr Asn Gly Asp
2865 2870 2875 2880
Phe Leu His Phe Leu Pro Arg Val Phe Ser Ala Val Gly Asn Ile Cys
2885 2890 2895
Tyr Thr Pro Ser Lys Leu Ile Glu Tyr Thr Asp Phe Ala Thr Ser Ala
2900 2905 2910
Cys Val Leu Ala Ala Glu Cys Thr Ile Phe Lys Asp Ala Ser Gly Lys
2915 2920 2925
Pro Val Pro Tyr Cys Tyr Asp Thr Asn Val Leu Glu Gly Ser Val Ala
2930 2935 2940
Tyr Glu Ser Leu Arg Pro Asp Thr Arg Tyr Val Leu Met Asp Gly Ser
2945 2950 2955 2960
Ile Ile Gln Phe Pro Asn Thr Tyr Leu Glu Gly Ser Val Arg Val Val
2965 2970 2975
Thr Thr Phe Asp Ser Glu Tyr Cys Arg His Gly Thr Cys Glu Arg Ser
2980 2985 2990
Glu Ala Gly Val Cys Val Ser Thr Ser Gly Arg Trp Val Leu Asn Asn
2995 3000 3005
Asp Tyr Tyr Arg Ser Leu Pro Gly Val Phe Cys Gly Val Asp Ala Val
3010 3015 3020
Asn Leu Leu Thr Asn Met Phe Thr Pro Leu Ile Gln Pro Ile Gly Ala
3025 3030 3035 3040
Leu Asp Ile Ser Ala Ser Ile Val Ala Gly Gly Ile Val Ala Ile Val
3045 3050 3055
Val Thr Cys Leu Ala Tyr Tyr Phe Met Arg Phe Arg Arg Ala Phe Gly
3060 3065 3070
Glu Tyr Ser His Val Val Ala Phe Asn Thr Leu Leu Phe Leu Met Ser
3075 3080 3085
Phe Thr Val Leu Cys Leu Thr Pro Val Tyr Ser Phe Leu Pro Gly Val
3090 3095 3100
Tyr Ser Val Ile Tyr Leu Tyr Leu Thr Phe Tyr Leu Thr Asn Asp Val
3105 3110 3115 3120
Ser Phe Leu Ala His Ile Gln Trp Met Val Met Phe Thr Pro Leu Val
3125 3130 3135
Pro Phe Trp Ile Thr Ile Ala Tyr Ile Ile Cys Ile Ser Thr Lys His
3140 3145 3150
Phe Tyr Trp Phe Phe Ser Asn Tyr Leu Lys Arg Arg Val Val Phe Asn
3155 3160 3165
Gly Val Ser Phe Ser Thr Phe Glu Glu Ala Ala Leu Cys Thr Phe Leu
3170 3175 3180
Leu Asn Lys Glu Met Tyr Leu Lys Leu Arg Ser Asp Val Leu Leu Pro
3185 3190 3195 3200
Leu Thr Gln Tyr Asn Arg Tyr Leu Ala Leu Tyr Asn Lys Tyr Lys Tyr
3205 3210 3215
Phe Ser Gly Ala Met Asp Thr Thr Ser Tyr Arg Glu Ala Ala Cys Cys
3220 3225 3230
His Leu Ala Lys Ala Leu Asn Asp Phe Ser Asn Ser Gly Ser Asp Val
3235 3240 3245
Leu Tyr Gln Pro Pro Gln Thr Ser Ile Thr Ser Ala Val Leu Gln Ser
3250 3255 3260
Gly Phe Arg Lys Met Ala Phe Pro Ser Gly Lys Val Glu Gly Cys Met
3265 3270 3275 3280
Val Gln Val Thr Cys Gly Thr Thr Thr Leu Asn Gly Leu Trp Leu Asp
3285 3290 3295
Asp Val Val Tyr Cys Pro Arg His Val Ile Cys Thr Ser Glu Asp Met
3300 3305 3310
Leu Asn Pro Asn Tyr Glu Asp Leu Leu Ile Arg Lys Ser Asn His Asn
3315 3320 3325
Phe Leu Val Gln Ala Gly Asn Val Gln Leu Arg Val Ile Gly His Ser
3330 3335 3340
Met Gln Asn Cys Val Leu Lys Leu Lys Val Asp Thr Ala Asn Pro Lys
3345 3350 3355 3360
Thr Pro Lys Tyr Lys Phe Val Arg Ile Gln Pro Gly Gln Thr Phe Ser
3365 3370 3375
Val Leu Ala Cys Tyr Asn Gly Ser Pro Ser Gly Val Tyr Gln Cys Ala
3380 3385 3390
Met Arg Pro Asn Phe Thr Ile Lys Gly Ser Phe Leu Asn Gly Ser Cys
3395 3400 3405
Gly Ser Val Gly Phe Asn Ile Asp Tyr Asp Cys Val Ser Phe Cys Tyr
3410 3415 3420
Met His His Met Glu Leu Pro Thr Gly Val His Ala Gly Thr Asp Leu
3425 3430 3435 3440
Glu Gly Asn Phe Tyr Gly Pro Phe Val Asp Arg Gln Thr Ala Gln Ala
3445 3450 3455
Ala Gly Thr Asp Thr Thr Ile Thr Val Asn Val Leu Ala Trp Leu Tyr
3460 3465 3470
Ala Ala Val Ile Asn Gly Asp Arg Trp Phe Leu Asn Arg Phe Thr Thr
3475 3480 3485
Thr Leu Asn Asp Phe Asn Leu Val Ala Met Lys Tyr Asn Tyr Glu Pro
3490 3495 3500
Leu Thr Gln Asp His Val Asp Ile Leu Gly Pro Leu Ser Ala Gln Thr
3505 3510 3515 3520
Gly Ile Ala Val Leu Asp Met Cys Ala Ser Leu Lys Glu Leu Leu Gln
3525 3530 3535
Asn Gly Met Asn Gly Arg Thr Ile Leu Gly Ser Ala Leu Leu Glu Asp
3540 3545 3550
Glu Phe Thr Pro Phe Asp Val Val Arg Gln Cys Ser Gly Val Thr Phe
3555 3560 3565
Gln Ser Ala Val Lys Arg Thr Ile Lys Gly Thr His His Trp Leu Leu
3570 3575 3580
Leu Thr Ile Leu Thr Ser Leu Leu Val Leu Val Gln Ser Thr Gln Trp
3585 3590 3595 3600
Ser Leu Phe Phe Phe Leu Tyr Glu Asn Ala Phe Leu Pro Phe Ala Met
3605 3610 3615
Gly Ile Ile Ala Met Ser Ala Phe Ala Met Met Phe Val Lys His Lys
3620 3625 3630
His Ala Phe Leu Cys Leu Phe Leu Leu Pro Ser Leu Ala Thr Val Ala
3635 3640 3645
Tyr Phe Asn Met Val Tyr Met Pro Ala Ser Trp Val Met Arg Ile Met
3650 3655 3660
Thr Trp Leu Asp Met Val Asp Thr Ser Leu Ser Gly Phe Lys Leu Lys
3665 3670 3675 3680
Asp Cys Val Met Tyr Ala Ser Ala Val Val Leu Leu Ile Leu Met Thr
3685 3690 3695
Ala Arg Thr Val Tyr Asp Asp Gly Ala Arg Arg Val Trp Thr Leu Met
3700 3705 3710
Asn Val Leu Thr Leu Val Tyr Lys Val Tyr Tyr Gly Asn Ala Leu Asp
3715 3720 3725
Gln Ala Ile Ser Met Trp Ala Leu Ile Ile Ser Val Thr Ser Asn Tyr
3730 3735 3740
Ser Gly Val Val Thr Thr Val Met Phe Leu Ala Arg Gly Ile Val Phe
3745 3750 3755 3760
Met Cys Val Glu Tyr Cys Pro Ile Phe Phe Ile Thr Gly Asn Thr Leu
3765 3770 3775
Gln Cys Ile Met Leu Val Tyr Cys Phe Leu Gly Tyr Phe Cys Thr Cys
3780 3785 3790
Tyr Phe Gly Leu Phe Cys Leu Leu Asn Arg Tyr Phe Arg Leu Thr Leu
3795 3800 3805
Gly Val Tyr Asp Tyr Leu Val Ser Thr Gln Glu Phe Arg Tyr Met Asn
3810 3815 3820
Ser Gln Gly Leu Leu Pro Pro Lys Asn Ser Ile Asp Ala Phe Lys Leu
3825 3830 3835 3840
Asn Ile Lys Leu Leu Gly Val Gly Gly Lys Pro Cys Ile Lys Val Ala
3845 3850 3855
Thr Val Gln Ser Lys Met Ser Asp Val Lys Cys Thr Ser Val Val Leu
3860 3865 3870
Leu Ser Val Leu Gln Gln Leu Arg Val Glu Ser Ser Ser Lys Leu Trp
3875 3880 3885
Ala Gln Cys Val Gln Leu His Asn Asp Ile Leu Leu Ala Lys Asp Thr
3890 3895 3900
Thr Glu Ala Phe Glu Lys Met Val Ser Leu Leu Ser Val Leu Leu Ser
3905 3910 3915 3920
Met Gln Gly Ala Val Asp Ile Asn Lys Leu Cys Glu Glu Met Leu Asp
3925 3930 3935
Asn Arg Ala Thr Leu Gln Ala Ile Ala Ser Glu Phe Ser Ser Leu Pro
3940 3945 3950
Ser Tyr Ala Ala Phe Ala Thr Ala Gln Glu Ala Tyr Glu Gln Ala Val
3955 3960 3965
Ala Asn Gly Asp Ser Glu Val Val Leu Lys Lys Leu Lys Lys Ser Leu
3970 3975 3980
Asn Val Ala Lys Ser Glu Phe Asp Arg Asp Ala Ala Met Gln Arg Lys
3985 3990 3995 4000
Leu Glu Lys Met Ala Asp Gln Ala Met Thr Gln Met Tyr Lys Gln Ala
4005 4010 4015
Arg Ser Glu Asp Lys Arg Ala Lys Val Thr Ser Ala Met Gln Thr Met
4020 4025 4030
Leu Phe Thr Met Leu Arg Lys Leu Asp Asn Asp Ala Leu Asn Asn Ile
4035 4040 4045
Ile Asn Asn Ala Arg Asp Gly Cys Val Pro Leu Asn Ile Ile Pro Leu
4050 4055 4060
Thr Thr Ala Ala Lys Leu Met Val Val Ile Pro Asp Tyr Asn Thr Tyr
4065 4070 4075 4080
Lys Asn Thr Cys Asp Gly Thr Thr Phe Thr Tyr Ala Ser Ala Leu Trp
4085 4090 4095
Glu Ile Gln Gln Val Val Asp Ala Asp Ser Lys Ile Val Gln Leu Ser
4100 4105 4110
Glu Ile Ser Met Asp Asn Ser Pro Asn Leu Ala Trp Pro Leu Ile Val
4115 4120 4125
Thr Ala Leu Arg Ala Asn Ser Ala Val Lys Leu Gln Asn Asn Glu Leu
4130 4135 4140
Ser Pro Val Ala Leu Arg Gln Met Ser Cys Ala Ala Gly Thr Thr Gln
4145 4150 4155 4160
Thr Ala Cys Thr Asp Asp Asn Ala Leu Ala Tyr Tyr Asn Thr Thr Lys
4165 4170 4175
Gly Gly Arg Phe Val Leu Ala Leu Leu Ser Asp Leu Gln Asp Leu Lys
4180 4185 4190
Trp Ala Arg Phe Pro Lys Ser Asp Gly Thr Gly Thr Ile Tyr Thr Glu
4195 4200 4205
Leu Glu Pro Pro Cys Arg Phe Val Thr Asp Thr Pro Lys Gly Pro Lys
4210 4215 4220
Val Lys Tyr Leu Tyr Phe Ile Lys Gly Leu Asn Asn Leu Asn Arg Gly
4225 4230 4235 4240
Met Val Leu Gly Ser Leu Ala Ala Thr Val Arg Leu Gln Ala Gly Asn
4245 4250 4255
Ala Thr Glu Val Pro Ala Asn Ser Thr Val Leu Ser Phe Cys Ala Phe
4260 4265 4270
Ala Val Asp Ala Ala Lys Ala Tyr Lys Asp Tyr Leu Ala Ser Gly Gly
4275 4280 4285
Gln Pro Ile Thr Asn Cys Val Lys Met Leu Cys Thr His Thr Gly Thr
4290 4295 4300
Gly Gln Ala Ile Thr Val Thr Pro Glu Ala Asn Met Asp Gln Glu Ser
4305 4310 4315 4320
Phe Gly Gly Ala Ser Cys Cys Leu Tyr Cys Arg Cys His Ile Asp His
4325 4330 4335
Pro Asn Pro Lys Gly Phe Cys Asp Leu Lys Gly Lys Tyr Val Gln Ile
4340 4345 4350
Pro Thr Thr Cys Ala Asn Asp Pro Val Gly Phe Thr Leu Lys Asn Thr
4355 4360 4365
Val Cys Thr Val Cys Gly Met Trp Lys Gly Tyr Gly Cys Ser Cys Asp
4370 4375 4380
Gln Leu Arg Glu Pro Met Leu Gln Ser Ala Asp Ala Gln Ser Phe Leu
4385 4390 4395 4400
Asn Arg Val Cys Gly Val Ser Ala Ala Arg Leu Thr Pro Cys Gly Thr
4405 4410 4415
Gly Thr Ser Thr Asp Val Val Tyr Arg Ala Phe Asp Ile Tyr Asn Asp
4420 4425 4430
Lys Val Ala Gly Phe Ala Lys Phe Leu Lys Thr Asn Cys Cys Arg Phe
4435 4440 4445
Gln Glu Lys Asp Glu Asp Asp Asn Leu Ile Asp Ser Tyr Phe Val Val
4450 4455 4460
Lys Arg His Thr Phe Ser Asn Tyr Gln His Glu Glu Thr Ile Tyr Asn
4465 4470 4475 4480
Leu Leu Lys Asp Cys Pro Ala Val Ala Lys His Asp Phe Phe Lys Phe
4485 4490 4495
Arg Ile Asp Gly Asp Met Val Pro His Ile Ser Arg Gln Arg Leu Thr
4500 4505 4510
Lys Tyr Thr Met Ala Asp Leu Val Tyr Ala Leu Arg His Phe Asp Glu
4515 4520 4525
Gly Asn Cys Asp Thr Leu Lys Glu Ile Leu Val Thr Tyr Asn Cys Cys
4530 4535 4540
Asp Asp Asp Tyr Phe Asn Lys Lys Asp Trp Tyr Asp Phe Val Glu Asn
4545 4550 4555 4560
Pro Asp Ile Leu Arg Val Tyr Ala Asn Leu Gly Glu Arg Val Arg Gln
4565 4570 4575
Ala Leu Leu Lys Thr Val Gln Phe Cys Asp Ala Met Arg Asn Ala Gly
4580 4585 4590
Ile Val Gly Val Leu Thr Leu Asp Asn Gln Asp Leu Asn Gly Asn Trp
4595 4600 4605
Tyr Asp Phe Gly Asp Phe Ile Gln Thr Thr Pro Gly Ser Gly Val Pro
4610 4615 4620
Val Val Asp Ser Tyr Tyr Ser Leu Leu Met Pro Ile Leu Thr Leu Thr
4625 4630 4635 4640
Arg Ala Leu Thr Ala Glu Ser His Val Asp Thr Asp Leu Thr Lys Pro
4645 4650 4655
Tyr Ile Lys Trp Asp Leu Leu Lys Tyr Asp Phe Thr Glu Glu Arg Leu
4660 4665 4670
Lys Leu Phe Asp Arg Tyr Phe Lys Tyr Trp Asp Gln Thr Tyr His Pro
4675 4680 4685
Asn Cys Val Asn Cys Leu Asp Asp Arg Cys Ile Leu His Cys Ala Asn
4690 4695 4700
Phe Asn Val Leu Phe Ser Thr Val Phe Pro Pro Thr Ser Phe Gly Pro
4705 4710 4715 4720
Leu Val Arg Lys Ile Phe Val Asp Gly Val Pro Phe Val Val Ser Thr
4725 4730 4735
Gly Tyr His Phe Arg Glu Leu Gly Val Val His Asn Gln Asp Val Asn
4740 4745 4750
Leu His Ser Ser Arg Leu Ser Phe Lys Glu Leu Leu Val Tyr Ala Ala
4755 4760 4765
Asp Pro Ala Met His Ala Ala Ser Gly Asn Leu Leu Leu Asp Lys Arg
4770 4775 4780
Thr Thr Cys Phe Ser Val Ala Ala Leu Thr Asn Asn Val Ala Phe Gln
4785 4790 4795 4800
Thr Val Lys Pro Gly Asn Phe Asn Lys Asp Phe Tyr Asp Phe Ala Val
4805 4810 4815
Ser Lys Gly Phe Phe Lys Glu Gly Ser Ser Val Glu Leu Lys His Phe
4820 4825 4830
Phe Phe Ala Gln Asp Gly Asn Ala Ala Ile Ser Asp Tyr Asp Tyr Tyr
4835 4840 4845
Arg Tyr Asn Leu Pro Thr Met Cys Asp Ile Arg Gln Leu Leu Phe Val
4850 4855 4860
Val Glu Val Val Asp Lys Tyr Phe Asp Cys Tyr Asp Gly Gly Cys Ile
4865 4870 4875 4880
Asn Ala Asn Gln Val Ile Val Asn Asn Leu Asp Lys Ser Ala Gly Phe
4885 4890 4895
Pro Phe Asn Lys Trp Gly Lys Ala Arg Leu Tyr Tyr Asp Ser Met Ser
4900 4905 4910
Tyr Glu Asp Gln Asp Ala Leu Phe Ala Tyr Thr Lys Arg Asn Val Ile
4915 4920 4925
Pro Thr Ile Thr Gln Met Asn Leu Lys Tyr Ala Ile Ser Ala Lys Asn
4930 4935 4940
Arg Ala Arg Thr Val Ala Gly Val Ser Ile Cys Ser Thr Met Thr Asn
4945 4950 4955 4960
Arg Gln Phe His Gln Lys Leu Leu Lys Ser Ile Ala Ala Thr Arg Gly
4965 4970 4975
Ala Thr Val Val Ile Gly Thr Ser Lys Phe Tyr Gly Gly Trp His Asn
4980 4985 4990
Met Leu Lys Thr Val Tyr Ser Asp Val Glu Asn Pro His Leu Met Gly
4995 5000 5005
Trp Asp Tyr Pro Lys Cys Asp Arg Ala Met Pro Asn Met Leu Arg Ile
5010 5015 5020
Met Ala Ser Leu Val Leu Ala Arg Lys His Thr Thr Cys Cys Ser Leu
5025 5030 5035 5040
Ser His Arg Phe Tyr Arg Leu Ala Asn Glu Cys Ala Gln Val Leu Ser
5045 5050 5055
Glu Met Val Met Cys Gly Gly Ser Leu Tyr Val Lys Pro Gly Gly Thr
5060 5065 5070
Ser Ser Gly Asp Ala Thr Thr Ala Tyr Ala Asn Ser Val Phe Asn Ile
5075 5080 5085
Cys Gln Ala Val Thr Ala Asn Val Asn Ala Leu Leu Ser Thr Asp Gly
5090 5095 5100
Asn Lys Ile Ala Asp Lys Tyr Val Arg Asn Leu Gln His Arg Leu Tyr
5105 5110 5115 5120
Glu Cys Leu Tyr Arg Asn Arg Asp Val Asp Thr Asp Phe Val Asn Glu
5125 5130 5135
Phe Tyr Ala Tyr Leu Arg Lys His Phe Ser Met Met Ile Leu Ser Asp
5140 5145 5150
Asp Ala Val Val Cys Phe Asn Ser Thr Tyr Ala Ser Gln Gly Leu Val
5155 5160 5165
Ala Ser Ile Lys Asn Phe Lys Ser Val Leu Tyr Tyr Gln Asn Asn Val
5170 5175 5180
Phe Met Ser Glu Ala Lys Cys Trp Thr Glu Thr Asp Leu Thr Lys Gly
5185 5190 5195 5200
Pro His Glu Phe Cys Ser Gln His Thr Met Leu Val Lys Gln Gly Asp
5205 5210 5215
Asp Tyr Val Tyr Leu Pro Tyr Pro Asp Pro Ser Arg Ile Leu Gly Ala
5220 5225 5230
Gly Cys Phe Val Asp Asp Ile Val Lys Thr Asp Gly Thr Leu Met Ile
5235 5240 5245
Glu Arg Phe Val Ser Leu Ala Ile Asp Ala Tyr Pro Leu Thr Lys His
5250 5255 5260
Pro Asn Gln Glu Tyr Ala Asp Val Phe His Leu Tyr Leu Gln Tyr Ile
5265 5270 5275 5280
Arg Lys Leu His Asp Glu Leu Thr Gly His Met Leu Asp Met Tyr Ser
5285 5290 5295
Val Met Leu Thr Asn Asp Asn Thr Ser Arg Tyr Trp Glu Pro Glu Phe
5300 5305 5310
Tyr Glu Ala Met Tyr Thr Pro His Thr Val Leu Gln Ala Val Gly Ala
5315 5320 5325
Cys Val Leu Cys Asn Ser Gln Thr Ser Leu Arg Cys Gly Ala Cys Ile
5330 5335 5340
Arg Arg Pro Phe Leu Cys Cys Lys Cys Cys Tyr Asp His Val Ile Ser
5345 5350 5355 5360
Thr Ser His Lys Leu Val Leu Ser Val Asn Pro Tyr Val Cys Asn Ala
5365 5370 5375
Pro Gly Cys Asp Val Thr Asp Val Thr Gln Leu Tyr Leu Gly Gly Met
5380 5385 5390
Ser Tyr Tyr Cys Lys Ser His Lys Pro Pro Ile Ser Phe Pro Leu Cys
5395 5400 5405
Ala Asn Gly Gln Val Phe Gly Leu Tyr Lys Asn Thr Cys Val Gly Ser
5410 5415 5420
Asp Asn Val Thr Asp Phe Asn Ala Ile Ala Thr Cys Asp Trp Thr Asn
5425 5430 5435 5440
Ala Gly Asp Tyr Ile Leu Ala Asn Thr Cys Thr Glu Arg Leu Lys Leu
5445 5450 5455
Phe Ala Ala Glu Thr Leu Lys Ala Thr Glu Glu Thr Phe Lys Leu Ser
5460 5465 5470
Tyr Gly Ile Ala Thr Val Arg Glu Val Leu Ser Asp Arg Glu Leu His
5475 5480 5485
Leu Ser Trp Glu Val Gly Lys Pro Arg Pro Pro Leu Asn Arg Asn Tyr
5490 5495 5500
Val Phe Thr Gly Tyr Arg Val Thr Lys Asn Ser Lys Val Gln Ile Gly
5505 5510 5515 5520
Glu Tyr Thr Phe Glu Lys Gly Asp Tyr Gly Asp Ala Val Val Tyr Arg
5525 5530 5535
Gly Thr Thr Thr Tyr Lys Leu Asn Val Gly Asp Tyr Phe Val Leu Thr
5540 5545 5550
Ser His Thr Val Met Pro Leu Ser Ala Pro Thr Leu Val Pro Gln Glu
5555 5560 5565
His Tyr Val Arg Ile Thr Gly Leu Tyr Pro Thr Leu Asn Ile Ser Asp
5570 5575 5580
Glu Phe Ser Ser Asn Val Ala Asn Tyr Gln Lys Val Gly Met Gln Lys
5585 5590 5595 5600
Tyr Ser Thr Leu Gln Gly Pro Pro Gly Thr Gly Lys Ser His Phe Ala
5605 5610 5615
Ile Gly Leu Ala Leu Tyr Tyr Pro Ser Ala Arg Ile Val Tyr Thr Ala
5620 5625 5630
Cys Ser His Ala Ala Val Asp Ala Leu Cys Glu Lys Ala Leu Lys Tyr
5635 5640 5645
Leu Pro Ile Asp Lys Cys Ser Arg Ile Ile Pro Ala Arg Ala Arg Val
5650 5655 5660
Glu Cys Phe Asp Lys Phe Lys Val Asn Ser Thr Leu Glu Gln Tyr Val
5665 5670 5675 5680
Phe Cys Thr Val Asn Ala Leu Pro Glu Thr Thr Ala Asp Ile Val Val
5685 5690 5695
Phe Asp Glu Ile Ser Met Ala Thr Asn Tyr Asp Leu Ser Val Val Asn
5700 5705 5710
Ala Arg Leu Arg Ala Lys His Tyr Val Tyr Ile Gly Asp Pro Ala Gln
5715 5720 5725
Leu Pro Ala Pro Arg Thr Leu Leu Thr Lys Gly Thr Leu Glu Pro Glu
5730 5735 5740
Tyr Phe Asn Ser Val Cys Arg Leu Met Lys Thr Ile Gly Pro Asp Met
5745 5750 5755 5760
Phe Leu Gly Thr Cys Arg Arg Cys Pro Ala Glu Ile Val Asp Thr Val
5765 5770 5775
Ser Ala Leu Val Tyr Asp Asn Lys Leu Lys Ala His Lys Asp Lys Ser
5780 5785 5790
Ala Gln Cys Phe Lys Met Phe Tyr Lys Gly Val Ile Thr His Asp Val
5795 5800 5805
Ser Ser Ala Ile Asn Arg Pro Gln Ile Gly Val Val Arg Glu Phe Leu
5810 5815 5820
Thr Arg Asn Pro Ala Trp Arg Lys Ala Val Phe Ile Ser Pro Tyr Asn
5825 5830 5835 5840
Ser Gln Asn Ala Val Ala Ser Lys Ile Leu Gly Leu Pro Thr Gln Thr
5845 5850 5855
Val Asp Ser Ser Gln Gly Ser Glu Tyr Asp Tyr Val Ile Phe Thr Gln
5860 5865 5870
Thr Thr Glu Thr Ala His Ser Cys Asn Val Asn Arg Phe Asn Val Ala
5875 5880 5885
Ile Thr Arg Ala Lys Val Gly Ile Leu Cys Ile Met Ser Asp Arg Asp
5890 5895 5900
Leu Tyr Asp Lys Leu Gln Phe Thr Ser Leu Glu Ile Pro Arg Arg Asn
5905 5910 5915 5920
Val Ala Thr Leu Gln Ala Glu Asn Val Thr Gly Leu Phe Lys Asp Cys
5925 5930 5935
Ser Lys Val Ile Thr Gly Leu His Pro Thr Gln Ala Pro Thr His Leu
5940 5945 5950
Ser Val Asp Thr Lys Phe Lys Thr Glu Gly Leu Cys Val Asp Ile Pro
5955 5960 5965
Gly Ile Pro Lys Asp Met Thr Tyr Arg Arg Leu Ile Ser Met Met Gly
5970 5975 5980
Phe Lys Met Asn Tyr Gln Val Asn Gly Tyr Pro Asn Met Phe Ile Thr
5985 5990 5995 6000
Arg Glu Glu Ala Ile Arg His Val Arg Ala Trp Ile Gly Phe Asp Val
6005 6010 6015
Glu Gly Cys His Ala Thr Arg Glu Ala Val Gly Thr Asn Leu Pro Leu
6020 6025 6030
Gln Leu Gly Phe Ser Thr Gly Val Asn Leu Val Ala Val Pro Thr Gly
6035 6040 6045
Tyr Val Asp Thr Pro Asn Asn Thr Asp Phe Ser Arg Val Ser Ala Lys
6050 6055 6060
Pro Pro Pro Gly Asp Gln Phe Lys His Leu Ile Pro Leu Met Tyr Lys
6065 6070 6075 6080
Gly Leu Pro Trp Asn Val Val Arg Ile Lys Ile Val Gln Met Leu Ser
6085 6090 6095
Asp Thr Leu Lys Asn Leu Ser Asp Arg Val Val Phe Val Leu Trp Ala
6100 6105 6110
His Gly Phe Glu Leu Thr Ser Met Lys Tyr Phe Val Lys Ile Gly Pro
6115 6120 6125
Glu Arg Thr Cys Cys Leu Cys Asp Arg Arg Ala Thr Cys Phe Ser Thr
6130 6135 6140
Ala Ser Asp Thr Tyr Ala Cys Trp His His Ser Ile Gly Phe Asp Tyr
6145 6150 6155 6160
Val Tyr Asn Pro Phe Met Ile Asp Val Gln Gln Trp Gly Phe Thr Gly
6165 6170 6175
Asn Leu Gln Ser Asn His Asp Leu Tyr Cys Gln Val His Gly Asn Ala
6180 6185 6190
His Val Ala Ser Cys Asp Ala Ile Met Thr Arg Cys Leu Ala Val His
6195 6200 6205
Glu Cys Phe Val Lys Arg Val Asp Trp Thr Ile Glu Tyr Pro Ile Ile
6210 6215 6220
Gly Asp Glu Leu Lys Ile Asn Ala Ala Cys Arg Lys Val Gln His Met
6225 6230 6235 6240
Val Val Lys Ala Ala Leu Leu Ala Asp Lys Phe Pro Val Leu His Asp
6245 6250 6255
Ile Gly Asn Pro Lys Ala Ile Lys Cys Val Pro Gln Ala Asp Val Glu
6260 6265 6270
Trp Lys Phe Tyr Asp Ala Gln Pro Cys Ser Asp Lys Ala Tyr Lys Ile
6275 6280 6285
Glu Glu Leu Phe Tyr Ser Tyr Ala Thr His Ser Asp Lys Phe Thr Asp
6290 6295 6300
Gly Val Cys Leu Phe Trp Asn Cys Asn Val Asp Arg Tyr Pro Ala Asn
6305 6310 6315 6320
Ser Ile Val Cys Arg Phe Asp Thr Arg Val Leu Ser Asn Leu Asn Leu
6325 6330 6335
Pro Gly Cys Asp Gly Gly Ser Leu Tyr Val Asn Lys His Ala Phe His
6340 6345 6350
Thr Pro Ala Phe Asp Lys Ser Ala Phe Val Asn Leu Lys Gln Leu Pro
6355 6360 6365
Phe Phe Tyr Tyr Ser Asp Ser Pro Cys Glu Ser His Gly Lys Gln Val
6370 6375 6380
Val Ser Asp Ile Asp Tyr Val Pro Leu Lys Ser Ala Thr Cys Ile Thr
6385 6390 6395 6400
Arg Cys Asn Leu Gly Gly Ala Val Cys Arg His His Ala Asn Glu Tyr
6405 6410 6415
Arg Leu Tyr Leu Asp Ala Tyr Asn Met Met Ile Ser Ala Gly Phe Ser
6420 6425 6430
Leu Trp Val Tyr Lys Gln Phe Asp Thr Tyr Asn Leu Trp Asn Thr Phe
6435 6440 6445
Thr Arg Leu Gln Ser Leu Glu Asn Val Ala Phe Asn Val Val Asn Lys
6450 6455 6460
Gly His Phe Asp Gly Gln Gln Gly Glu Val Pro Val Ser Ile Ile Asn
6465 6470 6475 6480
Asn Thr Val Tyr Thr Lys Val Asp Gly Val Asp Val Glu Leu Phe Glu
6485 6490 6495
Asn Lys Thr Thr Leu Pro Val Asn Val Ala Phe Glu Leu Trp Ala Lys
6500 6505 6510
Arg Asn Ile Lys Pro Val Pro Glu Val Lys Ile Leu Asn Asn Leu Gly
6515 6520 6525
Val Asp Ile Ala Ala Asn Thr Val Ile Trp Asp Tyr Lys Arg Asp Ala
6530 6535 6540
Pro Ala His Ile Ser Thr Ile Gly Val Cys Ser Met Thr Asp Ile Ala
6545 6550 6555 6560
Lys Lys Pro Thr Glu Thr Ile Cys Ala Pro Leu Thr Val Phe Phe Asp
6565 6570 6575
Gly Arg Val Asp Gly Gln Val Asp Leu Phe Arg Asn Ala Arg Asn Gly
6580 6585 6590
Val Leu Ile Thr Glu Gly Ser Val Lys Gly Leu Gln Pro Ser Val Gly
6595 6600 6605
Pro Lys Gln Ala Ser Leu Asn Gly Val Thr Leu Ile Gly Glu Ala Val
6610 6615 6620
Lys Thr Gln Phe Asn Tyr Tyr Lys Lys Val Asp Gly Val Val Gln Gln
6625 6630 6635 6640
Leu Pro Glu Thr Tyr Phe Thr Gln Ser Arg Asn Leu Gln Glu Phe Lys
6645 6650 6655
Pro Arg Ser Gln Met Glu Ile Asp Phe Leu Glu Leu Ala Met Asp Glu
6660 6665 6670
Phe Ile Glu Arg Tyr Lys Leu Glu Gly Tyr Ala Phe Glu His Ile Val
6675 6680 6685
Tyr Gly Asp Phe Ser His Ser Gln Leu Gly Gly Leu His Leu Leu Ile
6690 6695 6700
Gly Leu Ala Lys Arg Phe Lys Glu Ser Pro Phe Glu Leu Glu Asp Phe
6705 6710 6715 6720
Ile Pro Met Asp Ser Thr Val Lys Asn Tyr Phe Ile Thr Asp Ala Gln
6725 6730 6735
Thr Gly Ser Ser Lys Cys Val Cys Ser Val Ile Asp Leu Leu Leu Asp
6740 6745 6750
Asp Phe Val Glu Ile Ile Lys Ser Gln Asp Leu Ser Val Val Ser Lys
6755 6760 6765
Val Val Lys Val Thr Ile Asp Tyr Thr Glu Ile Ser Phe Met Leu Trp
6770 6775 6780
Cys Lys Asp Gly His Val Glu Thr Phe Tyr Pro Lys Leu Gln Ser Ser
6785 6790 6795 6800
Gln Ala Trp Gln Pro Gly Val Ala Met Pro Asn Leu Tyr Lys Met Gln
6805 6810 6815
Arg Met Leu Leu Glu Lys Cys Asp Leu Gln Asn Tyr Gly Asp Ser Ala
6820 6825 6830
Thr Leu Pro Lys Gly Ile Met Met Asn Val Ala Lys Tyr Thr Gln Leu
6835 6840 6845
Cys Gln Tyr Leu Asn Thr Leu Thr Leu Ala Val Pro Tyr Asn Met Arg
6850 6855 6860
Val Ile His Phe Gly Ala Gly Ser Asp Lys Gly Val Ala Pro Gly Thr
6865 6870 6875 6880
Ala Val Leu Arg Gln Trp Leu Pro Thr Gly Thr Leu Leu Val Asp Ser
6885 6890 6895
Asp Leu Asn Asp Phe Val Ser Asp Ala Asp Ser Thr Leu Ile Gly Asp
6900 6905 6910
Cys Ala Thr Val His Thr Ala Asn Lys Trp Asp Leu Ile Ile Ser Asp
6915 6920 6925
Met Tyr Asp Pro Lys Thr Lys Asn Val Thr Lys Glu Asn Asp Ser Lys
6930 6935 6940
Glu Gly Phe Phe Thr Tyr Ile Cys Gly Phe Ile Gln Gln Lys Leu Ala
6945 6950 6955 6960
Leu Gly Gly Ser Val Ala Ile Lys Ile Thr Glu His Ser Trp Asn Ala
6965 6970 6975
Asp Leu Tyr Lys Leu Met Gly His Phe Ala Trp Trp Thr Ala Phe Val
6980 6985 6990
Thr Asn Val Asn Ala Ser Ser Ser Glu Ala Phe Leu Ile Gly Cys Asn
6995 7000 7005
Tyr Leu Gly Lys Pro Arg Glu Gln Ile Asp Gly Tyr Val Met His Ala
7010 7015 7020
Asn Tyr Ile Phe Trp Arg Asn Thr Asn Pro Ile Gln Leu Ser Ser Tyr
7025 7030 7035 7040
Ser Leu Phe Asp Met Ser Lys Phe Pro Leu Lys Leu Arg Gly Thr Ala
7045 7050 7055
Val Met Ser Leu Lys Glu Gly Gln Ile Asn Asp Met Ile Leu Ser Leu
7060 7065 7070
Leu Ser Lys Gly Arg Leu Ile Ile Arg Glu Asn Asn Arg Val Val Ile
7075 7080 7085
Ser Ser Asp Val Leu Val Asn Asn
7090 7095
<210> 2
<211> 9
<212> PRT
<213> Homo sapiens
<400> 2
Val Met Val Glu Leu Val Ala Glu Leu
1 5
<210> 3
<211> 9
<212> PRT
<213> Homo sapiens
<400> 3
Tyr Leu Ala Thr Ala Leu Leu Thr Leu
1 5
<210> 4
<211> 9
<212> PRT
<213> Homo sapiens
<400> 4
Cys Leu Glu Ala Ser Phe Asn Tyr Leu
1 5
<210> 5
<211> 9
<212> PRT
<213> Homo sapiens
<400> 5
Trp Leu Met Trp Leu Ile Ile Asn Leu
1 5
<210> 6
<211> 9
<212> PRT
<213> Homo sapiens
<400> 6
Ser Leu Pro Gly Val Phe Cys Gly Val
1 5
<210> 7
<211> 9
<212> PRT
<213> Homo sapiens
<400> 7
Phe Leu Leu Asn Lys Glu Met Tyr Leu
1 5
<210> 8
<211> 9
<212> PRT
<213> Homo sapiens
<400> 8
Ser Met Trp Ala Leu Ile Ile Ser Val
1 5
<210> 9
<211> 9
<212> PRT
<213> Homo sapiens
<400> 9
Tyr Leu Ala Ser Gly Gly Gln Pro Ile
1 5
<210> 10
<211> 9
<212> PRT
<213> Homo sapiens
<400> 10
Lys Leu Ser Tyr Gly Ile Ala Thr Val
1 5
<210> 11
<211> 9
<212> PRT
<213> Homo sapiens
<400> 11
Tyr Leu Asp Ala Tyr Asn Met Met Ile
1 5
<210> 12
<211> 9
<212> PRT
<213> Homo sapiens
<400> 12
Leu Leu Leu Asp Asp Phe Val Glu Ile
1 5
<210> 13
<211> 9
<212> PRT
<213> Homo sapiens
<400> 13
Phe Val Phe Leu Val Leu Leu Pro Leu
1 5
<210> 14
<211> 9
<212> PRT
<213> Homo sapiens
<400> 14
Ser Ile Ile Ala Tyr Thr Met Ser Leu
1 5
<210> 15
<211> 9
<212> PRT
<213> Homo sapiens
<400> 15
Ala Leu Asn Thr Leu Val Lys Gln Leu
1 5
<210> 16
<211> 9
<212> PRT
<213> Homo sapiens
<400> 16
Val Leu Asn Asp Ile Leu Ser Arg Leu
1 5
<210> 17
<211> 9
<212> PRT
<213> Homo sapiens
<400> 17
Arg Leu Gln Ser Leu Gln Thr Tyr Val
1 5
<210> 18
<211> 9
<212> PRT
<213> Homo sapiens
<400> 18
Phe Ile Ala Gly Leu Ile Ala Ile Val
1 5
<210> 19
<211> 9
<212> PRT
<213> Homo sapiens
<400> 19
Phe Leu Ala Phe Val Val Phe Leu Leu
1 5
<210> 20
<211> 9
<212> PRT
<213> Homo sapiens
<400> 20
Phe Leu Leu Val Thr Leu Ala Ile Leu
1 5
<210> 21
<211> 9
<212> PRT
<213> Homo sapiens
<400> 21
Phe Leu Leu Asn Lys Glu Met Tyr Leu
1 5
<210> 22
<211> 9
<212> PRT
<213> Homo sapiens
<400> 22
Ile Phe Leu Trp Leu Leu Trp Pro Val
1 5
<210> 23
<211> 9
<212> PRT
<213> Homo sapiens
<400> 23
Gly Leu Met Trp Leu Ser Tyr Phe Ile
1 5
<210> 24
<211> 9
<212> PRT
<213> Homo sapiens
<400> 24
His Leu Val Asp Phe Gln Val Thr Ile
1 5
<210> 25
<211> 9
<212> PRT
<213> Homo sapiens
<400> 25
Ile Ile Phe Trp Phe Ser Leu Glu Leu
1 5
<210> 26
<211> 9
<212> PRT
<213> Homo sapiens
<400> 26
Tyr Val Val Asp Asp Pro Cys Pro Ile
1 5
<210> 27
<211> 9
<212> PRT
<213> Homo sapiens
<400> 27
Tyr Ile Asp Ile Gly Asn Tyr Thr Val
1 5
<210> 28
<211> 9
<212> PRT
<213> Homo sapiens
<400> 28
Tyr Ile Asn Val Phe Ala Phe Pro Phe
1 5
<210> 29
<211> 9
<212> PRT
<213> Homo sapiens
<400> 29
Asn Val Phe Ala Phe Pro Phe Thr Ile
1 5
<210> 30
<211> 8
<212> PRT
<213> Homo sapiens
<400> 30
Val Met Val Glu Leu Val Ala Glu
1 5
<210> 31
<211> 8
<212> PRT
<213> Homo sapiens
<400> 31
Leu Ala Thr Ala Leu Leu Thr Leu
1 5
<210> 32
<211> 8
<212> PRT
<213> Homo sapiens
<400> 32
Cys Leu Glu Ala Ser Phe Asn Tyr
1 5
<210> 33
<211> 8
<212> PRT
<213> Homo sapiens
<400> 33
Leu Met Trp Leu Ile Ile Asn Leu
1 5
<210> 34
<211> 8
<212> PRT
<213> Homo sapiens
<400> 34
Ser Leu Pro Gly Val Phe Cys Gly
1 5
<210> 35
<211> 8
<212> PRT
<213> Homo sapiens
<400> 35
Leu Leu Asn Lys Glu Met Tyr Leu
1 5
<210> 36
<211> 8
<212> PRT
<213> Homo sapiens
<400> 36
Ser Met Trp Ala Leu Ile Ile Ser
1 5
<210> 37
<211> 8
<212> PRT
<213> Homo sapiens
<400> 37
Leu Ala Ser Gly Gly Gln Pro Ile
1 5
<210> 38
<211> 8
<212> PRT
<213> Homo sapiens
<400> 38
Lys Leu Ser Tyr Gly Ile Ala Thr
1 5
<210> 39
<211> 8
<212> PRT
<213> Homo sapiens
<400> 39
Leu Asp Ala Tyr Asn Met Met Ile
1 5
<210> 40
<211> 8
<212> PRT
<213> Homo sapiens
<400> 40
Leu Leu Leu Asp Asp Phe Val Glu
1 5
<210> 41
<211> 8
<212> PRT
<213> Homo sapiens
<400> 41
Val Phe Leu Val Leu Leu Pro Leu
1 5
<210> 42
<211> 8
<212> PRT
<213> Homo sapiens
<400> 42
Ser Ile Ile Ala Tyr Thr Met Ser
1 5
<210> 43
<211> 8
<212> PRT
<213> Homo sapiens
<400> 43
Leu Asn Thr Leu Val Lys Gln Leu
1 5
<210> 44
<211> 8
<212> PRT
<213> Homo sapiens
<400> 44
Val Leu Asn Asp Ile Leu Ser Arg
1 5
<210> 45
<211> 8
<212> PRT
<213> Homo sapiens
<400> 45
Leu Gln Ser Leu Gln Thr Tyr Val
1 5
<210> 46
<211> 8
<212> PRT
<213> Homo sapiens
<400> 46
Phe Ile Ala Gly Leu Ile Ala Ile
1 5
<210> 47
<211> 8
<212> PRT
<213> Homo sapiens
<400> 47
Leu Ala Phe Val Val Phe Leu Leu
1 5
<210> 48
<211> 8
<212> PRT
<213> Homo sapiens
<400> 48
Phe Leu Leu Val Thr Leu Ala Ile
1 5
<210> 49
<211> 8
<212> PRT
<213> Homo sapiens
<400> 49
Leu Leu Asn Lys Glu Met Tyr Leu
1 5
<210> 50
<211> 8
<212> PRT
<213> Homo sapiens
<400> 50
Ile Phe Leu Trp Leu Leu Trp Pro
1 5
<210> 51
<211> 8
<212> PRT
<213> Homo sapiens
<400> 51
Leu Met Trp Leu Ser Tyr Phe Ile
1 5
<210> 52
<211> 8
<212> PRT
<213> Homo sapiens
<400> 52
His Leu Val Asp Phe Gln Val Thr
1 5
<210> 53
<211> 8
<212> PRT
<213> Homo sapiens
<400> 53
Ile Phe Trp Phe Ser Leu Glu Leu
1 5
<210> 54
<211> 8
<212> PRT
<213> Homo sapiens
<400> 54
Tyr Val Val Asp Asp Pro Cys Pro
1 5
<210> 55
<211> 8
<212> PRT
<213> Homo sapiens
<400> 55
Ile Asp Ile Gly Asn Tyr Thr Val
1 5
<210> 56
<211> 8
<212> PRT
<213> Homo sapiens
<400> 56
Tyr Ile Asn Val Phe Ala Phe Pro
1 5
<210> 57
<211> 8
<212> PRT
<213> Homo sapiens
<400> 57
Val Phe Ala Phe Pro Phe Thr Ile
1 5
<210> 58
<211> 15
<212> PRT
<213> Homo sapiens
<400> 58
Lys Ser Ala Phe Tyr Ile Leu Pro Ser Ile Ile Ser Asn Glu Lys
1 5 10 15
<210> 59
<211> 15
<212> PRT
<213> Homo sapiens
<400> 59
Glu Ser Pro Phe Val Met Met Ser Ala Pro Pro Ala Gln Tyr Glu
1 5 10 15
<210> 60
<211> 15
<212> PRT
<213> Homo sapiens
<400> 60
Pro Asn Met Leu Arg Ile Met Ala Ser Leu Val Leu Ala Arg Lys
1 5 10 15
<210> 61
<211> 14
<212> PRT
<213> Homo sapiens
<400> 61
Arg Ile Lys Val Gln Met Leu Ser Asp Thr Leu Lys Asn Leu
1 5 10
<210> 62
<211> 15
<212> PRT
<213> Homo sapiens
<400> 62
Leu Asp Ala Tyr Asn Met Met Ile Ser Ala Gly Phe Ser Leu Trp
1 5 10 15
<210> 63
<211> 13
<212> PRT
<213> Homo sapiens
<400> 63
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser
1 5 10
<210> 64
<211> 15
<212> PRT
<213> Homo sapiens
<400> 64
Phe Leu Ala Phe Val Val Phe Leu Leu Val Thr Leu Ala Ile Leu
1 5 10 15
<210> 65
<211> 15
<212> PRT
<213> Homo sapiens
<400> 65
Phe Leu Leu Val Thr Leu Ala Ile Leu Thr Ala Leu Arg Leu Cys
1 5 10 15
<210> 66
<211> 15
<212> PRT
<213> Homo sapiens
<400> 66
Leu Ser Tyr Tyr Lys Leu Gly Ala Ser Gln Arg Val Ala Gly Asp
1 5 10 15
<210> 67
<211> 15
<212> PRT
<213> Homo sapiens
<400> 67
Ala Glu Ile Leu Leu Ile Ile Met Arg Thr Phe Lys Val Ser Ile
1 5 10 15
<210> 68
<211> 15
<212> PRT
<213> Homo sapiens
<400> 68
Met Lys Ile Ile Leu Phe Leu Ala Leu Ile Thr Leu Ala Thr Cys
1 5 10 15
<210> 69
<211> 14
<212> PRT
<213> Homo sapiens
<400> 69
Ile Ile Phe Leu Ala Leu Ile Thr Leu Ala Thr Cys Glu Leu
1 5 10
<210> 70
<211> 15
<212> PRT
<213> Homo sapiens
<400> 70
Ser Pro Ile Phe Leu Ile Val Ala Ala Ile Val Phe Ile Thr Leu
1 5 10 15
<210> 71
<211> 15
<212> PRT
<213> Homo sapiens
<400> 71
Asp Phe Tyr Leu Cys Phe Leu Ala Phe Leu Leu Phe Leu Val Leu
1 5 10 15
<210> 72
<211> 15
<212> PRT
<213> Homo sapiens
<400> 72
Met Lys Phe Leu Val Phe Leu Gly Ile Ile Thr Thr Val Ala Ala
1 5 10 15
<210> 73
<211> 16
<212> PRT
<213> Homo sapiens
<400> 73
Lys Gln Gln Thr Val Thr Leu Leu Pro Ala Ala Asp Leu Asp Asp Phe
1 5 10 15
<210> 74
<211> 14
<212> PRT
<213> Homo sapiens
<400> 74
Lys Ser Ala Phe Tyr Ile Leu Pro Ser Ile Ile Ser Asn Glu
1 5 10
<210> 75
<211> 14
<212> PRT
<213> Homo sapiens
<400> 75
Glu Ser Pro Phe Val Met Met Ser Ala Pro Pro Ala Gln Tyr
1 5 10
<210> 76
<211> 14
<212> PRT
<213> Homo sapiens
<400> 76
Pro Asn Met Leu Arg Ile Met Ala Ser Leu Val Leu Ala Arg
1 5 10
<210> 77
<211> 13
<212> PRT
<213> Homo sapiens
<400> 77
Arg Ile Lys Val Gln Met Leu Ser Asp Thr Leu Lys Asn
1 5 10
<210> 78
<211> 14
<212> PRT
<213> Homo sapiens
<400> 78
Leu Asp Ala Tyr Asn Met Met Ile Ser Ala Gly Phe Ser Leu
1 5 10
<210> 79
<211> 12
<212> PRT
<213> Homo sapiens
<400> 79
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser
1 5 10
<210> 80
<211> 14
<212> PRT
<213> Homo sapiens
<400> 80
Phe Leu Ala Phe Val Val Phe Leu Leu Val Thr Leu Ala Ile
1 5 10
<210> 81
<211> 14
<212> PRT
<213> Homo sapiens
<400> 81
Phe Leu Leu Val Thr Leu Ala Ile Leu Thr Ala Leu Arg Leu
1 5 10
<210> 82
<211> 14
<212> PRT
<213> Homo sapiens
<400> 82
Leu Ser Tyr Tyr Lys Leu Gly Ala Ser Gln Arg Val Ala Gly
1 5 10
<210> 83
<211> 14
<212> PRT
<213> Homo sapiens
<400> 83
Ala Glu Ile Leu Leu Ile Ile Met Arg Thr Phe Lys Val Ser
1 5 10
<210> 84
<211> 14
<212> PRT
<213> Homo sapiens
<400> 84
Met Lys Ile Ile Leu Phe Leu Ala Leu Ile Thr Leu Ala Thr
1 5 10
<210> 85
<211> 13
<212> PRT
<213> Homo sapiens
<400> 85
Ile Ile Phe Leu Ala Leu Ile Thr Leu Ala Thr Cys Glu
1 5 10
<210> 86
<211> 14
<212> PRT
<213> Homo sapiens
<400> 86
Ser Pro Ile Phe Leu Ile Val Ala Ala Ile Val Phe Ile Thr
1 5 10
<210> 87
<211> 14
<212> PRT
<213> Homo sapiens
<400> 87
Asp Phe Tyr Leu Cys Phe Leu Ala Phe Leu Leu Phe Leu Val
1 5 10
<210> 88
<211> 14
<212> PRT
<213> Homo sapiens
<400> 88
Met Lys Phe Leu Val Phe Leu Gly Ile Ile Thr Thr Val Ala
1 5 10
<210> 89
<211> 15
<212> PRT
<213> Homo sapiens
<400> 89
Lys Gln Gln Thr Val Thr Leu Leu Pro Ala Ala Asp Leu Asp Asp
1 5 10 15
<210> 90
<211> 14
<212> PRT
<213> Homo sapiens
<400> 90
Ser Ala Phe Tyr Ile Leu Pro Ser Ile Ile Ser Asn Glu Lys
1 5 10
<210> 91
<211> 14
<212> PRT
<213> Homo sapiens
<400> 91
Ser Pro Phe Val Met Met Ser Ala Pro Pro Ala Gln Tyr Glu
1 5 10
<210> 92
<211> 14
<212> PRT
<213> Homo sapiens
<400> 92
Asn Met Leu Arg Ile Met Ala Ser Leu Val Leu Ala Arg Lys
1 5 10
<210> 93
<211> 13
<212> PRT
<213> Homo sapiens
<400> 93
Ile Lys Val Gln Met Leu Ser Asp Thr Leu Lys Asn Leu
1 5 10
<210> 94
<211> 14
<212> PRT
<213> Homo sapiens
<400> 94
Asp Ala Tyr Asn Met Met Ile Ser Ala Gly Phe Ser Leu Trp
1 5 10
<210> 95
<211> 12
<212> PRT
<213> Homo sapiens
<400> 95
Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser
1 5 10
<210> 96
<211> 14
<212> PRT
<213> Homo sapiens
<400> 96
Leu Ala Phe Val Val Phe Leu Leu Val Thr Leu Ala Ile Leu
1 5 10
<210> 97
<211> 14
<212> PRT
<213> Homo sapiens
<400> 97
Leu Leu Val Thr Leu Ala Ile Leu Thr Ala Leu Arg Leu Cys
1 5 10
<210> 98
<211> 14
<212> PRT
<213> Homo sapiens
<400> 98
Ser Tyr Tyr Lys Leu Gly Ala Ser Gln Arg Val Ala Gly Asp
1 5 10
<210> 99
<211> 14
<212> PRT
<213> Homo sapiens
<400> 99
Glu Ile Leu Leu Ile Ile Met Arg Thr Phe Lys Val Ser Ile
1 5 10
<210> 100
<211> 14
<212> PRT
<213> Homo sapiens
<400> 100
Lys Ile Ile Leu Phe Leu Ala Leu Ile Thr Leu Ala Thr Cys
1 5 10
<210> 101
<211> 13
<212> PRT
<213> Homo sapiens
<400> 101
Ile Phe Leu Ala Leu Ile Thr Leu Ala Thr Cys Glu Leu
1 5 10
<210> 102
<211> 14
<212> PRT
<213> Homo sapiens
<400> 102
Pro Ile Phe Leu Ile Val Ala Ala Ile Val Phe Ile Thr Leu
1 5 10
<210> 103
<211> 14
<212> PRT
<213> Homo sapiens
<400> 103
Phe Tyr Leu Cys Phe Leu Ala Phe Leu Leu Phe Leu Val Leu
1 5 10
<210> 104
<211> 14
<212> PRT
<213> Homo sapiens
<400> 104
Lys Phe Leu Val Phe Leu Gly Ile Ile Thr Thr Val Ala Ala
1 5 10
<210> 105
<211> 15
<212> PRT
<213> Homo sapiens
<400> 105
Gln Gln Thr Val Thr Leu Leu Pro Ala Ala Asp Leu Asp Asp Phe
1 5 10 15
<210> 106
<211> 25
<212> PRT
<213> Homo sapiens
<400> 106
Ser Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr
1 5 10 15
Thr Asn Ser Phe Thr Arg Gly Val Tyr
20 25
<210> 107
<211> 23
<212> PRT
<213> Homo sapiens
<400> 107
Phe Ser Asn Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn
1 5 10 15
Gly Thr Lys Arg Phe Asp Asn
20
<210> 108
<211> 31
<212> PRT
<213> Homo sapiens
<400> 108
Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr
1 5 10 15
Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn
20 25 30
<210> 109
<211> 40
<212> PRT
<213> Homo sapiens
<400> 109
Gly Thr Asn Thr Ser Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn
1 5 10 15
Cys Thr Glu Val Pro Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr
20 25 30
Trp Arg Val Tyr Ser Thr Gly Ser
35 40
<210> 110
<211> 75
<212> PRT
<213> Homo sapiens
<400> 110
Val Cys Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val
1 5 10 15
Asn Phe Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser
20 25 30
Asn Lys Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp
35 40 45
Thr Thr Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile
50 55 60
Thr Pro Cys Ser Phe Gly Gly Val Ser Val Ile
65 70 75
<210> 111
<211> 62
<212> PRT
<213> Homo sapiens
<400> 111
Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu
1 5 10 15
Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu
20 25 30
Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn
35 40 45
Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Glu
50 55 60
<210> 112
<211> 25
<212> PRT
<213> Homo sapiens
<400> 112
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
1 5 10 15
Thr Lys Leu Asn Asp Leu Cys Phe Thr
20 25
<210> 113
<211> 35
<212> PRT
<213> Homo sapiens
<400> 113
Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala
1 5 10 15
Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn
20 25 30
Cys Val Ala
35
<210> 114
<211> 40
<212> PRT
<213> Homo sapiens
<400> 114
Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe
1 5 10 15
Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val
20 25 30
Asp Leu Gly Asp Ile Ser Gly Ile
35 40
<210> 115
<211> 18
<212> PRT
<213> Homo sapiens
<400> 115
Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe
1 5 10 15
Ile Glu
<210> 116
<211> 22
<212> PRT
<213> Homo sapiens
<400> 116
Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala
1 5 10 15
Tyr Arg Phe Asn Gly Ile
20
<210> 117
<211> 23
<212> PRT
<213> Homo sapiens
<400> 117
Ser Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr
1 5 10 15
Thr Asn Ser Phe Thr Arg Gly
20
<210> 118
<211> 21
<212> PRT
<213> Homo sapiens
<400> 118
Phe Ser Asn Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn
1 5 10 15
Gly Thr Lys Arg Phe
20
<210> 119
<211> 29
<212> PRT
<213> Homo sapiens
<400> 119
Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr
1 5 10 15
Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr
20 25
<210> 120
<211> 38
<212> PRT
<213> Homo sapiens
<400> 120
Gly Thr Asn Thr Ser Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn
1 5 10 15
Cys Thr Glu Val Pro Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr
20 25 30
Trp Arg Val Tyr Ser Thr
35
<210> 121
<211> 73
<212> PRT
<213> Homo sapiens
<400> 121
Val Cys Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val
1 5 10 15
Asn Phe Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser
20 25 30
Asn Lys Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp
35 40 45
Thr Thr Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile
50 55 60
Thr Pro Cys Ser Phe Gly Gly Val Ser
65 70
<210> 122
<211> 60
<212> PRT
<213> Homo sapiens
<400> 122
Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu
1 5 10 15
Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu
20 25 30
Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn
35 40 45
Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro
50 55 60
<210> 123
<211> 23
<212> PRT
<213> Homo sapiens
<400> 123
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
1 5 10 15
Thr Lys Leu Asn Asp Leu Cys
20
<210> 124
<211> 33
<212> PRT
<213> Homo sapiens
<400> 124
Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala
1 5 10 15
Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn
20 25 30
Cys
<210> 125
<211> 38
<212> PRT
<213> Homo sapiens
<400> 125
Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe
1 5 10 15
Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val
20 25 30
Asp Leu Gly Asp Ile Ser
35
<210> 126
<211> 16
<212> PRT
<213> Homo sapiens
<400> 126
Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe
1 5 10 15
<210> 127
<211> 20
<212> PRT
<213> Homo sapiens
<400> 127
Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala
1 5 10 15
Tyr Arg Phe Asn
20
<210> 128
<211> 23
<212> PRT
<213> Homo sapiens
<400> 128
Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn
1 5 10 15
Ser Phe Thr Arg Gly Val Tyr
20
<210> 129
<211> 21
<212> PRT
<213> Homo sapiens
<400> 129
Asn Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr
1 5 10 15
Lys Arg Phe Asp Asn
20
<210> 130
<211> 29
<212> PRT
<213> Homo sapiens
<400> 130
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
1 5 10 15
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn
20 25
<210> 131
<211> 38
<212> PRT
<213> Homo sapiens
<400> 131
Asn Thr Ser Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr
1 5 10 15
Glu Val Pro Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg
20 25 30
Val Tyr Ser Thr Gly Ser
35
<210> 132
<211> 73
<212> PRT
<213> Homo sapiens
<400> 132
Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe
1 5 10 15
Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys
20 25 30
Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr
35 40 45
Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro
50 55 60
Cys Ser Phe Gly Gly Val Ser Val Ile
65 70
<210> 133
<211> 60
<212> PRT
<213> Homo sapiens
<400> 133
Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg
1 5 10 15
Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr
20 25 30
Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr
35 40 45
Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Glu
50 55 60
<210> 134
<211> 23
<212> PRT
<213> Homo sapiens
<400> 134
Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys
1 5 10 15
Leu Asn Asp Leu Cys Phe Thr
20
<210> 135
<211> 33
<212> PRT
<213> Homo sapiens
<400> 135
Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg
1 5 10 15
Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val
20 25 30
Ala
<210> 136
<211> 38
<212> PRT
<213> Homo sapiens
<400> 136
Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu
1 5 10 15
Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu
20 25 30
Gly Asp Ile Ser Gly Ile
35
<210> 137
<211> 16
<212> PRT
<213> Homo sapiens
<400> 137
Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe Ile Glu
1 5 10 15
<210> 138
<211> 20
<212> PRT
<213> Homo sapiens
<400> 138
Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg
1 5 10 15
Phe Asn Gly Ile
20
<210> 139
<211> 7235
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthesized Vaccine Candidate 1
<400> 139
ctcgacattg attattgact agttattaat agtaatcaat tacggggtca ttagttcata 60
gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 120
ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag 180
ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac 240
atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg 300
cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg 360
tattagtcat cgctattacc atggtcgagg tgagccccac gttctgcttc actctcccca 420
tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta ttttgtgcag 480
cgatgggggc gggggggggg ggggggcgcg cgccaggcgg ggcggggcgg ggcgaggggc 540
ggggcggggc gaggcggaga ggtgcggcgg cagccaatca gagcggcgcg ctccgaaagt 600
ttccttttat ggcgaggcgg cggcggcggc ggccctataa aaagcgaagc gcgcggcggg 660
cgggagtcgc tgcgcgctgc cttcgccccg tgccccgctc cgccgccgcc tcgcgccgcc 720
cgccccggct ctgactgacc gcgttactcc cacaggtgag cgggcgggac ggcccttctc 780
ctccgggctg taattagcgc ttggtttaat gacggcttgt ttcttttctg tggctgcgtg 840
aaagccttga ggggctccgg gagggccctt tgtgcggggg gagcggctcg gggggtgcgt 900
gcgtgtgtgt gtgcgtgggg agcgccgcgt gcggctccgc gctgcccggc ggctgtgagc 960
gctgcgggcg cggcgcgggg ctttgtgcgc tccgcagtgt gcgcgagggg agcgcggccg 1020
ggggcggtgc cccgcggtgc ggggggggct gcgaggggaa caaaggctgc gtgcggggtg 1080
tgtgcgtggg ggggtgagca gggggtgtgg gcgcgtcggt cgggctgcaa ccccccctgc 1140
acccccctcc ccgagttgct gagcacggcc cggcttcggg tgcggggctc cgtacggggc 1200
gtggcgcggg gctcgccgtg ccgggcgggg ggtggcggca ggtgggggtg ccgggcgggg 1260
cggggccgcc tcgggccggg gagggctcgg gggaggggcg cggcggcccc cggagcgccg 1320
gcggctgtcg aggcgcggcg agccgcagcc attgcctttt atggtaatcg tgcgagaggg 1380
cgcagggact tcctttgtcc caaatctgtg cggagccgaa atctgggagg cgccgccgca 1440
ccccctctag cgggcgcggg gcgaagcggt gcggcgccgg caggaaggaa atgggcgggg 1500
agggccttcg tgcgtcgccg cgccgccgtc cccttctccc tctccagcct cggggctgtc 1560
cgcgggggga cggctgcctt cgggggggac ggggcagggc ggggttcggc ttctggcgtg 1620
tgaccggcgg ctctagagcc tctgctaacc atgttcatgc cttcttcttt ttcctacagc 1680
tcctgggcaa cgtgctggtt attgtgctgt ctcatcattt tggcaaagaa ttggagaata 1740
aactagtatt cttctggtcc ccacagactc agagagaacc cgccaccatg ttcgtgttcc 1800
tggtgctgct gcccctggtg agcagccagt gcgtgaacct gaccaccagg acccagctgc 1860
cccccgccta caccaacagc ttcaccaggg gcgtgtacta ccccgacaag gtgttcagga 1920
gcagcgtgct gcacagcacc caggacctgt tcctgccctt cttcagcaac gtgacctggt 1980
tccacgccat ccacgtgagc ggcaccaacg gcaccaagag gttcgacaac cccgtgctgc 2040
ccttcaacga cggcgtgtac ttcgccagca ccgagaagag caacatcatc aggggctgga 2100
tcttcggcac caccctggac agcaagaccc agagcctgct gatcgtgaac aacgccacca 2160
acgtggtgat caaggtgtgc gagttccagt tctgcaacga ccccttcctg ggcgtgtact 2220
accacaagaa caacaagagc tggatggaga gcgagttcag ggtgtacagc agcgccaaca 2280
actgcacctt cgagtacgtg agccagccct tcctgatgga cctggagggc aagcagggca 2340
acttcaagaa cctgagggag ttcgtgttca agaacatcga cggctacttc aagatctaca 2400
gcaagcacac ccccatcaac ctggtgaggg acctgcccca gggcttcagc gccctggagc 2460
ccctggtgga cctgcccatc ggcatcaaca tcaccaggtt ccagaccctg ctggccctgc 2520
acaggagcta cctgaccccc ggcgacagca gcagcggctg gaccgccggc gccgccgcct 2580
actacgtggg ctacctgcag cccaggacct tcctgctgaa gtacaacgag aacggcacca 2640
tcaccgacgc cgtggactgc gccctggacc ccctgagcga gaccaagtgc accctgaaga 2700
gcttcaccgt ggagaagggc atctaccaga ccagcaactt cagggtgcag cccaccgaga 2760
gcatcgtgag gttccccaac atcaccaacc tgtgcccctt cggcgaggtg ttcaacgcca 2820
ccaggttcgc cagcgtgtac gcctggaaca ggaagaggat cagcaactgc gtggccgact 2880
acagcgtgct gtacaacagc gccagcttca gcaccttcaa gtgctacggc gtgagcccca 2940
ccaagctgaa cgacctgtgc ttcaccaacg tgtacgccga cagcttcgtg atcaggggcg 3000
acgaggtgag gcagatcgcc cccggccaga ccggcaagat cgccgactac aactacaagc 3060
tgcccgacga cttcaccggc tgcgtgatcg cctggaacag caacaacctg gacagcaagg 3120
tgggcggcaa ctacaactac ctgtacaggc tgttcaggaa gagcaacctg aagcccttcg 3180
agagggacat cagcaccgag atctaccagg ccggcagcac cccctgcaac ggcgtggagg 3240
gcttcaactg ctacttcccc ctgcagagct acggcttcca gcccaccaac ggcgtgggct 3300
accagcccta cagggtggtg gtgctgagct tcgagctgct gcacgccccc gccaccgtgt 3360
gcggccccaa gaagagcacc aacctggtga agaacaagtg cgtgaacttc aacttcaacg 3420
gcctgaccgg caccggcgtg ctgaccgaga gcaacaagaa gttcctgccc ttccagcagt 3480
tcggcaggga catcgccgac accaccgacg ccgtgaggga cccccagacc ctggagatcc 3540
tggacatcac cccctgcagc ttcggcggcg tgagcgtgat cacccccggc accaacacca 3600
gcaaccaggt ggccgtgctg taccaggacg tgaactgcac cgaggtgccc gtggccatcc 3660
acgccgacca gctgaccccc acctggaggg tgtacagcac cggcagcaac gtgttccaga 3720
ccagggccgg ctgcctgatc ggcgccgagc acgtgaacaa cagctacgag tgcgacatcc 3780
ccatcggcgc cggcatctgc gccagctacc agacccagac caacagcccc ggcagcgcca 3840
gcagcgtggc cagccagagc atcatcgcct acaccatgag cctgggcgcc gagaacagcg 3900
tggcctacag caacaacagc atcgccatcc ccaccaactt caccatcagc gtgaccaccg 3960
agatcctgcc cgtgagcatg accaagacca gcgtggactg caccatgtac atctgcggcg 4020
acagcaccga gtgcagcaac ctgctgctgc agtacggcag cttctgcacc cagctgaaca 4080
gggccctgac cggcatcgcc gtggagcagg acaagaacac ccaggaggtg ttcgcccagg 4140
tgaagcagat ctacaagacc ccccccatca aggacttcgg cggcttcaac ttcagccaga 4200
tcctgcccga ccccagcaag cccagcaaga ggagccccat cgaggacctg ctgttcaaca 4260
aggtgaccct ggccgacgcc ggcttcatca agcagtacgg cgactgcctg ggcgacatcg 4320
ccgccaggga cctgatctgc gcccagaagt tcaacggcct gaccgtgctg ccccccctgc 4380
tgaccgacga gatgatcgcc cagtacacca gcgccctgct ggccggcacc atcaccagcg 4440
gctggacctt cggcgccggc cccgccctgc agatcccctt ccccatgcag atggcctaca 4500
ggttcaacgg catcggcgtg acccagaacg tgctgtacga gaaccagaag ctgatcgcca 4560
accagttcaa cagcgccatc ggcaagatcc aggacagcct gagcagcacc cccagcgccc 4620
tgggcaagct gcaggacgtg gtgaaccaga acgcccaggc cctgaacacc ctggtgaagc 4680
agctgagcag caacttcggc gccatcagca gcgtgctgaa cgacatcctg agcaggctgg 4740
acccccccga ggccgaggtg cagatcgaca ggctgatcac cggcaggctg cagagcctgc 4800
agacctacgt gacccagcag ctgatcaggg ccgccgagat cagggccagc gccaacctgg 4860
ccgccaccaa gatgagcgag tgcgtgctgg gccagagcaa gagggtggac ttctgcggca 4920
agggctacca cctgatgagc ttcccccaga gcgcccccca cggcgtggtg ttcctgcacg 4980
tgacctacgt gcccgcccag gagaagaact tcaccaccgc ccccgccatc tgccacgacg 5040
gcaaggccca cttccccagg gagggcgtgt tcgtgagcaa cggcacccac tggttcgtga 5100
cccagaggaa cttctacgag ccccagatca tcaccaccga caacaccttc gtgagcggca 5160
actgcgacgt ggtgatcggc atcgtgaaca acaccgtgta cgaccccctg cagcccgagc 5220
tggacagctt caaggaggag ctggacaagt acttcaagaa ccacaccagc cccgacgtgg 5280
acctgggcga catcagcggc atcaacgcca gcgtggtgaa catccagaag gagatcgaca 5340
ggctgaacga ggtggccaag aacctgaacg agagcctgat cgacctgcag gagctgggca 5400
agtacgagca gtacatcaag tggccctggt acatctggct gggcttcatc gccggcctga 5460
tcgccatcgt gatggtgacc atcatgctgt gctgcatgac cagctgctgc agctgcctga 5520
agggctgctg cagctgcggc agctgctgca agttcgacga ggacgacagc gagcccgtgc 5580
tgaagggcgt gaagctgcac tacaccggaa gcggagccac gaacttctct ctgttaaagc 5640
aagcaggaga tgttgaagaa aaccccgggc ctatgagcga caacggcccc cagaaccaga 5700
ggaacgcccc caggatcacc ttcggcggcc ccagcgacag caccggcagc aaccagaacg 5760
gcgagaggag cggcgccagg agcaagcaga ggaggcccca gggcctgccc aacaacaccg 5820
ccagctggtt caccgccctg acccagcacg gcaaggagga cctgaagttc cccaggggcc 5880
agggcgtgcc catcaacacc aacagcagcc ccgacgacca gatcggctac tacaggaggg 5940
ccaccaggag gatcaggggc ggcgacggca agatgaagga cctgagcccc aggtggtact 6000
tctactacct gggcaccggc cccgaggccg gcctgcccta cggcgccaac aaggacggca 6060
tcatctgggt ggccaccgag ggcgccctga acacccccaa ggaccacatc ggcaccagga 6120
accccgccaa caacgccgcc atcgtgctgc agctgcccca gggcaccacc ctgcccaagg 6180
gcttctacgc cgagggcagc aggggcggca gccaggccag cagcaggagc agcagcagga 6240
gcaggaacag cagcaggaac agcacccccg gcagcagcag gggcaccagc cccgccagga 6300
tggccggcaa cggcggcgac gccgccctgg ccctgctgct gctggacagg ctgaaccagc 6360
tggagagcaa gatgagcggc aagggccagc agcagcaggg ccagaccgtg accaagaaga 6420
gcgccgccga ggccagcaag aagcccaggc agaagaggac cgccaccaag gcctacaacg 6480
tgacccaggc cttcggcagg aggggccccg agcagaccca gggcaacttc ggcgaccagg 6540
agctgatcag gcagggcacc gactacaagc actggcccca gatcgcccag ttcgccccca 6600
gcgccagcgc cttcttcggc atgagcagga tcggcatgga ggtgaccccc agcggcacct 6660
ggctgaccta caccggcgcc atcaagctgg acgacaagga ccccaacttc aaggaccagg 6720
tgatcctgct gaacaagcac atcgacgcct acaagacctt cccccccacc gagcccaaga 6780
aggacaagaa gaagaaggcc gacgagaccc aggccctgcc ccagaggcag aagaagcagc 6840
agaccgtgac cctgctgccc gccgccgacc tggacgactt cagcaagcag ctgcagcaga 6900
gcatgagcag cgccgacagc acccaggcct gactcgagct ggtactgcat gcacgcaatg 6960
ctagctgccc ctttcccgtc ctgggtaccc cgagtctccc ccgacctcgg gtcccaggta 7020
tgctcccacc tccacctgcc ccactcacca cctctgctag ttccagacac ctcccaagca 7080
cgcagcaatg cagctcaaaa cgcttagcct agccacaccc ccacgggaaa cagcagtgat 7140
taacctttag caataaacga aagtttaact aagctatact aaccccaggg ttggtcaatt 7200
tcgtgccagc cacaccctgg agctagcaaa aaaaa 7235
<210> 140
<211> 9663
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthesized Vaccine Candidate 2
<400> 140
ctcgacattg attattgact agttattaat agtaatcaat tacggggtca ttagttcata 60
gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 120
ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag 180
ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac 240
atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg 300
cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg 360
tattagtcat cgctattacc atggtcgagg tgagccccac gttctgcttc actctcccca 420
tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta ttttgtgcag 480
cgatgggggc gggggggggg ggggggcgcg cgccaggcgg ggcggggcgg ggcgaggggc 540
ggggcggggc gaggcggaga ggtgcggcgg cagccaatca gagcggcgcg ctccgaaagt 600
ttccttttat ggcgaggcgg cggcggcggc ggccctataa aaagcgaagc gcgcggcggg 660
cgggagtcgc tgcgcgctgc cttcgccccg tgccccgctc cgccgccgcc tcgcgccgcc 720
cgccccggct ctgactgacc gcgttactcc cacaggtgag cgggcgggac ggcccttctc 780
ctccgggctg taattagcgc ttggtttaat gacggcttgt ttcttttctg tggctgcgtg 840
aaagccttga ggggctccgg gagggccctt tgtgcggggg gagcggctcg gggggtgcgt 900
gcgtgtgtgt gtgcgtgggg agcgccgcgt gcggctccgc gctgcccggc ggctgtgagc 960
gctgcgggcg cggcgcgggg ctttgtgcgc tccgcagtgt gcgcgagggg agcgcggccg 1020
ggggcggtgc cccgcggtgc ggggggggct gcgaggggaa caaaggctgc gtgcggggtg 1080
tgtgcgtggg ggggtgagca gggggtgtgg gcgcgtcggt cgggctgcaa ccccccctgc 1140
acccccctcc ccgagttgct gagcacggcc cggcttcggg tgcggggctc cgtacggggc 1200
gtggcgcggg gctcgccgtg ccgggcgggg ggtggcggca ggtgggggtg ccgggcgggg 1260
cggggccgcc tcgggccggg gagggctcgg gggaggggcg cggcggcccc cggagcgccg 1320
gcggctgtcg aggcgcggcg agccgcagcc attgcctttt atggtaatcg tgcgagaggg 1380
cgcagggact tcctttgtcc caaatctgtg cggagccgaa atctgggagg cgccgccgca 1440
ccccctctag cgggcgcggg gcgaagcggt gcggcgccgg caggaaggaa atgggcgggg 1500
agggccttcg tgcgtcgccg cgccgccgtc cccttctccc tctccagcct cggggctgtc 1560
cgcgggggga cggctgcctt cgggggggac ggggcagggc ggggttcggc ttctggcgtg 1620
tgaccggcgg ctctagagcc tctgctaacc atgttcatgc cttcttcttt ttcctacagc 1680
tcctgggcaa cgtgctggtt attgtgctgt ctcatcattt tggcaaagaa ttggagaata 1740
aactagtatt cttctggtcc ccacagactc agagagaacc cgccaccatg ttcgtgttcc 1800
tggtgctgct gcccctggtg agcagccagt gcgtgaacct gaccaccagg acccagctgc 1860
cccccgccta caccaacagc ttcaccaggg gcgtgtacta ccccgacaag gtgttcagga 1920
gcagcgtgct gcacagcacc caggacctgt tcctgccctt cttcagcaac gtgacctggt 1980
tccacgccat ccacgtgagc ggcaccaacg gcaccaagag gttcgacaac cccgtgctgc 2040
ccttcaacga cggcgtgtac ttcgccagca ccgagaagag caacatcatc aggggctgga 2100
tcttcggcac caccctggac agcaagaccc agagcctgct gatcgtgaac aacgccacca 2160
acgtggtgat caaggtgtgc gagttccagt tctgcaacga ccccttcctg ggcgtgtact 2220
accacaagaa caacaagagc tggatggaga gcgagttcag ggtgtacagc agcgccaaca 2280
actgcacctt cgagtacgtg agccagccct tcctgatgga cctggagggc aagcagggca 2340
acttcaagaa cctgagggag ttcgtgttca agaacatcga cggctacttc aagatctaca 2400
gcaagcacac ccccatcaac ctggtgaggg acctgcccca gggcttcagc gccctggagc 2460
ccctggtgga cctgcccatc ggcatcaaca tcaccaggtt ccagaccctg ctggccctgc 2520
acaggagcta cctgaccccc ggcgacagca gcagcggctg gaccgccggc gccgccgcct 2580
actacgtggg ctacctgcag cccaggacct tcctgctgaa gtacaacgag aacggcacca 2640
tcaccgacgc cgtggactgc gccctggacc ccctgagcga gaccaagtgc accctgaaga 2700
gcttcaccgt ggagaagggc atctaccaga ccagcaactt cagggtgcag cccaccgaga 2760
gcatcgtgag gttccccaac atcaccaacc tgtgcccctt cggcgaggtg ttcaacgcca 2820
ccaggttcgc cagcgtgtac gcctggaaca ggaagaggat cagcaactgc gtggccgact 2880
acagcgtgct gtacaacagc gccagcttca gcaccttcaa gtgctacggc gtgagcccca 2940
ccaagctgaa cgacctgtgc ttcaccaacg tgtacgccga cagcttcgtg atcaggggcg 3000
acgaggtgag gcagatcgcc cccggccaga ccggcaagat cgccgactac aactacaagc 3060
tgcccgacga cttcaccggc tgcgtgatcg cctggaacag caacaacctg gacagcaagg 3120
tgggcggcaa ctacaactac ctgtacaggc tgttcaggaa gagcaacctg aagcccttcg 3180
agagggacat cagcaccgag atctaccagg ccggcagcac cccctgcaac ggcgtggagg 3240
gcttcaactg ctacttcccc ctgcagagct acggcttcca gcccaccaac ggcgtgggct 3300
accagcccta cagggtggtg gtgctgagct tcgagctgct gcacgccccc gccaccgtgt 3360
gcggccccaa gaagagcacc aacctggtga agaacaagtg cgtgaacttc aacttcaacg 3420
gcctgaccgg caccggcgtg ctgaccgaga gcaacaagaa gttcctgccc ttccagcagt 3480
tcggcaggga catcgccgac accaccgacg ccgtgaggga cccccagacc ctggagatcc 3540
tggacatcac cccctgcagc ttcggcggcg tgagcgtgat cacccccggc accaacacca 3600
gcaaccaggt ggccgtgctg taccaggacg tgaactgcac cgaggtgccc gtggccatcc 3660
acgccgacca gctgaccccc acctggaggg tgtacagcac cggcagcaac gtgttccaga 3720
ccagggccgg ctgcctgatc ggcgccgagc acgtgaacaa cagctacgag tgcgacatcc 3780
ccatcggcgc cggcatctgc gccagctacc agacccagac caacagcccc ggcagcgcca 3840
gcagcgtggc cagccagagc atcatcgcct acaccatgag cctgggcgcc gagaacagcg 3900
tggcctacag caacaacagc atcgccatcc ccaccaactt caccatcagc gtgaccaccg 3960
agatcctgcc cgtgagcatg accaagacca gcgtggactg caccatgtac atctgcggcg 4020
acagcaccga gtgcagcaac ctgctgctgc agtacggcag cttctgcacc cagctgaaca 4080
gggccctgac cggcatcgcc gtggagcagg acaagaacac ccaggaggtg ttcgcccagg 4140
tgaagcagat ctacaagacc ccccccatca aggacttcgg cggcttcaac ttcagccaga 4200
tcctgcccga ccccagcaag cccagcaaga ggagccccat cgaggacctg ctgttcaaca 4260
aggtgaccct ggccgacgcc ggcttcatca agcagtacgg cgactgcctg ggcgacatcg 4320
ccgccaggga cctgatctgc gcccagaagt tcaacggcct gaccgtgctg ccccccctgc 4380
tgaccgacga gatgatcgcc cagtacacca gcgccctgct ggccggcacc atcaccagcg 4440
gctggacctt cggcgccggc cccgccctgc agatcccctt ccccatgcag atggcctaca 4500
ggttcaacgg catcggcgtg acccagaacg tgctgtacga gaaccagaag ctgatcgcca 4560
accagttcaa cagcgccatc ggcaagatcc aggacagcct gagcagcacc cccagcgccc 4620
tgggcaagct gcaggacgtg gtgaaccaga acgcccaggc cctgaacacc ctggtgaagc 4680
agctgagcag caacttcggc gccatcagca gcgtgctgaa cgacatcctg agcaggctgg 4740
acccccccga ggccgaggtg cagatcgaca ggctgatcac cggcaggctg cagagcctgc 4800
agacctacgt gacccagcag ctgatcaggg ccgccgagat cagggccagc gccaacctgg 4860
ccgccaccaa gatgagcgag tgcgtgctgg gccagagcaa gagggtggac ttctgcggca 4920
agggctacca cctgatgagc ttcccccaga gcgcccccca cggcgtggtg ttcctgcacg 4980
tgacctacgt gcccgcccag gagaagaact tcaccaccgc ccccgccatc tgccacgacg 5040
gcaaggccca cttccccagg gagggcgtgt tcgtgagcaa cggcacccac tggttcgtga 5100
cccagaggaa cttctacgag ccccagatca tcaccaccga caacaccttc gtgagcggca 5160
actgcgacgt ggtgatcggc atcgtgaaca acaccgtgta cgaccccctg cagcccgagc 5220
tggacagctt caaggaggag ctggacaagt acttcaagaa ccacaccagc cccgacgtgg 5280
acctgggcga catcagcggc atcaacgcca gcgtggtgaa catccagaag gagatcgaca 5340
ggctgaacga ggtggccaag aacctgaacg agagcctgat cgacctgcag gagctgggca 5400
agtacgagca gtacatcaag tggccctggt acatctggct gggcttcatc gccggcctga 5460
tcgccatcgt gatggtgacc atcatgctgt gctgcatgac cagctgctgc agctgcctga 5520
agggctgctg cagctgcggc agctgctgca agttcgacga ggacgacagc gagcccgtgc 5580
tgaagggcgt gaagctgcac tacaccggaa gcggagccac gaacttctct ctgttaaagc 5640
aagcaggaga tgttgaagaa aaccccgggc ctcaaaccac tgaaacagcw cactcttgta 5700
atgttaaccg ctttaatgtg gctattacaa gagcaaaaat tggcattttg tgcataatgt 5760
ctgacagaga tctttatgac aagctgcaat tcacaagtct agaagtaccg cgtcgtaacg 5820
tggctacatt acaagcggaa aatgtaactg gactctttaa ggactgtagt aagatcataa 5880
ctggtcttca tcctacacaa gcacctacac accttagtgt tgatacaaaa ttcaagactg 5940
agggactatg tgttgacata ccaggcatwc cwaaggacat gacctatmgw agactcatct 6000
cyatgatggg tttcaaaatg aattaycaag ttaatggtta ccctaayatg ttyatcaccc 6060
gygargaagc catmmgmcay gtwcgtgcat ggattggctt tgatgtagag ggktgtcatg 6120
ctactaggga tgctgtcggt actaacctac ctctccagtt aggattttct acaggtgtta 6180
acttagtagc tgtaccaact ggctatgttg acactgaaaa caatacagaa ttcaccagag 6240
ttaatgcaaa acctccacca ggtgaccaat ttaaacatct tataccactt atgtacaaag 6300
gtttaccctg gaacatagtg cgtatcaaga tagtacaaat gctcagtgat acactgaaag 6360
gattatcrga cagagttgtg tttgtcctat gggcacatgg ctttgaactt acatcaatga 6420
agtactttgt caagattgga cctgaaagaa cgtgttgtct gtgtgacaaa cgtgcaactt 6480
gtttttctac ttcatcagac aattatgcct gctggaacca ttctgtgggt tttgactatg 6540
tctataatcc atttatgatt gatgtccagc agtggggttt tacaggtaac cttcagagta 6600
atcacgatca gcattgccaa gtgcatggca acgctcatgt ggctagttgt gatgctatca 6660
tgactagatg tttagcagtc catgagtgct ttgttaagcg cgttgactgg tctgttgagt 6720
acccaattat aggtgatgaa ctgaagatca atgccgcatg cagaaaagtg caacatatgg 6780
ttgtaaagtc tgcattgctt gctgacaaat tcccagttct tcatgacatt ggaaacccaa 6840
aggctatcaa atgtgtcccr caggctgaag tggattggaa gttctatgat gctcagccct 6900
gcagtgacaa agcttataaa ataaaagaac tcttctattc ttatgctaca catcatgata 6960
aattcattga tggtgtttgt ttattttgga attgtaacgt tgatcgttac cctgccaatg 7020
ctattgtrtg caggttcgac acgagagtct tgtcaaattt gaacttgcca ggttgtgatg 7080
gtggtagttt gtatgtaaat aagcatgcat tccacactcc agcttttgat aaaagtgcat 7140
ttactaattt aaagcaattg cctttctttt attactctga cagtccctgt gagtcacatg 7200
gcaagcaggt tgtttctgac attgattatg taccactcaa atctgctacr tgtataacac 7260
gatgcaattt gggrggtgct gtttgcagac atcatgcaaa tgagtaccga cagtacttgg 7320
atgcatacaa tatgatgatt tctgctggct ttagcctctg gatttacaaa cagtttgaca 7380
cttataacct gtggaacacc tttaccaggt tacagagttt agaaaatgtg gcttacaatg 7440
ttgttaacaa aggacacttc gatggacaag ctggtgaagc acctgtttcc gtcattaata 7500
atgttgttta cacaaaggta gatggtgttg atgtagagat ctttgaaaac aagacaacac 7560
ttcctgttaa tgttgcattt gagctttggg ctaagcgtaa cattaaacca gtgccagaga 7620
ttaagatact caataatttg ggtgtcgata tcgctgctaa tactgtaatc tgggactaca 7680
agagagaagc accagcacat atgtcaacaa taggtgtctg cacaatgact gacattgcca 7740
agaaacctac tgagagtgct tgttcctcgc ttactgtctt atttgatggt agagtggaag 7800
gacaggtaga cctttttaga aatgcccgta atggtgtttt aataacagaa ggttcagtta 7860
aaggtttaat accttcaaag ggaccagcac aagctagtgt caatggagtc acattaattg 7920
gagaatcagt aaaaacacag tttaattatt ttaagaaagt agatggcatc attcaacagt 7980
tgcctgaaac ctactttact cagagccgag acttagagga tttcaagccc agatcacaaa 8040
tggaaactga ctttcttgag ctcgctatgg atgaattcat acaacggtac aagcttgaag 8100
gctatgcctt cgaacatatc gtttatggag attttagtca tggacagctt ggtggacttc 8160
atctaatgat tggtctagct aagcgctcac aagattcacc acttaaatta gaggatttta 8220
tccctacgga cagtacagtg aaaaattatt tcataacaga tgcgcaaaca ggttcatcaa 8280
aatgcgtgtg ctctgttatt gatcttctgc ttgatgactt tgttgagata ataaagtcac 8340
aagatttatc agtggtttca aaggtggtca aagtcacaat tgactatgct gaaatttcat 8400
tcatgttatg gtgtaaggat ggacatgttg aaacctttta cccaaaatta caagcgagtc 8460
aggcgtggca accaggagtt gcaatgccta acttgtataa gatgcagaga atgcttcttg 8520
aaaaatgtga ccttcagaat tatggtgaaa atgctgtcat accaaargga ataatgatga 8580
atgtcgcaaa atatactcaa ctgtgtcaat atttaaatac actyacatta gcygtgccat 8640
ataatatgag agttatccat tttggtgctg gctcrgacaa aggagttgca cccggcacag 8700
ctgttctcag acagtggttg ccaattggca cactacttgt tgattcagat cttaacgact 8760
tcgtctctga cgctgattcc actctaattg gagactgtgc aaccgtacat acagctaaca 8820
aatgggatct cattattagc gatatgtatg atcctaaaac caaacacgtg acaaaggaaa 8880
atgattcaaa agaaggattt ttcacttacc tgtgtggatt tattaaacaa aaattagccc 8940
tgggaggctc tgtggctgta aagataactg agcattcttg gaatgcggat ctctacaagc 9000
tcatgggaca tttctcatgg tggacagctt ttgttacaaa tgttaatgca tcttcatcag 9060
aagcattttt aattggagtt aactatcttg gtaagccaaa agaacaaatt gatggttaca 9120
ccatgcatgc taactacatt ttctggagga atacaaaccc gattcaattg tcttcctatt 9180
cactttttga catgagtaag ttccctctta aattaagggg aacagctgtc atgtctttaa 9240
aggagaacca aatcaatgaa atgatttatt ctctacttga aaaaggcaga cttatcatta 9300
gggaaaacaa cagagttgtt gtctcaagtg atgttcttgt taataactaa acgaacatga 9360
ctcgagctgg tactgcatgc acgcaatgct agctgcccct ttcccgtcct gggtaccccg 9420
agtctccccc gacctcgggt cccaggtatg ctcccacctc cacctgcccc actcaccacc 9480
tctgctagtt ccagacacct cccaagcacg cagcaatgca gctcaaaacg cttagcctag 9540
ccacaccccc acgggaaaca gcagtgatta acctttagca ataaacgaaa gtttaactaa 9600
gctatactaa ccccagggtt ggtcaatttc gtgccagcca caccctggag ctagcaaaaa 9660
aaa 9663
<210> 141
<211> 7088
<212> DNA
<213> Artificial Sequence
<220>
<223> Sythesized Vaccine Candidate 3
<400> 141
ctcgacattg attattgact agttattaat agtaatcaat tacggggtca ttagttcata 60
gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 120
ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag 180
ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac 240
atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg 300
cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg 360
tattagtcat cgctattacc atggtcgagg tgagccccac gttctgcttc actctcccca 420
tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta ttttgtgcag 480
cgatgggggc gggggggggg ggggggcgcg cgccaggcgg ggcggggcgg ggcgaggggc 540
ggggcggggc gaggcggaga ggtgcggcgg cagccaatca gagcggcgcg ctccgaaagt 600
ttccttttat ggcgaggcgg cggcggcggc ggccctataa aaagcgaagc gcgcggcggg 660
cgggagtcgc tgcgcgctgc cttcgccccg tgccccgctc cgccgccgcc tcgcgccgcc 720
cgccccggct ctgactgacc gcgttactcc cacaggtgag cgggcgggac ggcccttctc 780
ctccgggctg taattagcgc ttggtttaat gacggcttgt ttcttttctg tggctgcgtg 840
aaagccttga ggggctccgg gagggccctt tgtgcggggg gagcggctcg gggggtgcgt 900
gcgtgtgtgt gtgcgtgggg agcgccgcgt gcggctccgc gctgcccggc ggctgtgagc 960
gctgcgggcg cggcgcgggg ctttgtgcgc tccgcagtgt gcgcgagggg agcgcggccg 1020
ggggcggtgc cccgcggtgc ggggggggct gcgaggggaa caaaggctgc gtgcggggtg 1080
tgtgcgtggg ggggtgagca gggggtgtgg gcgcgtcggt cgggctgcaa ccccccctgc 1140
acccccctcc ccgagttgct gagcacggcc cggcttcggg tgcggggctc cgtacggggc 1200
gtggcgcggg gctcgccgtg ccgggcgggg ggtggcggca ggtgggggtg ccgggcgggg 1260
cggggccgcc tcgggccggg gagggctcgg gggaggggcg cggcggcccc cggagcgccg 1320
gcggctgtcg aggcgcggcg agccgcagcc attgcctttt atggtaatcg tgcgagaggg 1380
cgcagggact tcctttgtcc caaatctgtg cggagccgaa atctgggagg cgccgccgca 1440
ccccctctag cgggcgcggg gcgaagcggt gcggcgccgg caggaaggaa atgggcgggg 1500
agggccttcg tgcgtcgccg cgccgccgtc cccttctccc tctccagcct cggggctgtc 1560
cgcgggggga cggctgcctt cgggggggac ggggcagggc ggggttcggc ttctggcgtg 1620
tgaccggcgg ctctagagcc tctgctaacc atgttcatgc cttcttcttt ttcctacagc 1680
tcctgggcaa cgtgctggtt attgtgctgt ctcatcattt tggcaaagaa ttggagaata 1740
aactagtatt cttctggtcc ccacagactc agagagaacc cgccaccatg ttcgtgttcc 1800
tggtgctgct gcccctggtg agcagccagt gcgtgaacct gaccaccagg acccagctgc 1860
cccccgccta caccaacagc ttcaccaggg gcgtgtacta ccccgacaag gtgttcagga 1920
gcagcgtgct gcacagcacc caggacctgt tcctgccctt cttcagcaac gtgacctggt 1980
tccacgccat ccacgtgagc ggcaccaacg gcaccaagag gttcgacaac cccgtgctgc 2040
ccttcaacga cggcgtgtac ttcgccagca ccgagaagag caacatcatc aggggctgga 2100
tcttcggcac caccctggac agcaagaccc agagcctgct gatcgtgaac aacgccacca 2160
acgtggtgat caaggtgtgc gagttccagt tctgcaacga ccccttcctg ggcgtgtact 2220
accacaagaa caacaagagc tggatggaga gcgagttcag ggtgtacagc agcgccaaca 2280
actgcacctt cgagtacgtg agccagccct tcctgatgga cctggagggc aagcagggca 2340
acttcaagaa cctgagggag ttcgtgttca agaacatcga cggctacttc aagatctaca 2400
gcaagcacac ccccatcaac ctggtgaggg acctgcccca gggcttcagc gccctggagc 2460
ccctggtgga cctgcccatc ggcatcaaca tcaccaggtt ccagaccctg ctggccctgc 2520
acaggagcta cctgaccccc ggcgacagca gcagcggctg gaccgccggc gccgccgcct 2580
actacgtggg ctacctgcag cccaggacct tcctgctgaa gtacaacgag aacggcacca 2640
tcaccgacgc cgtggactgc gccctggacc ccctgagcga gaccaagtgc accctgaaga 2700
gcttcaccgt ggagaagggc atctaccaga ccagcaactt cagggtgcag cccaccgaga 2760
gcatcgtgag gttccccaac atcaccaacc tgtgcccctt cggcgaggtg ttcaacgcca 2820
ccaggttcgc cagcgtgtac gcctggaaca ggaagaggat cagcaactgc gtggccgact 2880
acagcgtgct gtacaacagc gccagcttca gcaccttcaa gtgctacggc gtgagcccca 2940
ccaagctgaa cgacctgtgc ttcaccaacg tgtacgccga cagcttcgtg atcaggggcg 3000
acgaggtgag gcagatcgcc cccggccaga ccggcaagat cgccgactac aactacaagc 3060
tgcccgacga cttcaccggc tgcgtgatcg cctggaacag caacaacctg gacagcaagg 3120
tgggcggcaa ctacaactac ctgtacaggc tgttcaggaa gagcaacctg aagcccttcg 3180
agagggacat cagcaccgag atctaccagg ccggcagcac cccctgcaac ggcgtggagg 3240
gcttcaactg ctacttcccc ctgcagagct acggcttcca gcccaccaac ggcgtgggct 3300
accagcccta cagggtggtg gtgctgagct tcgagctgct gcacgccccc gccaccgtgt 3360
gcggccccaa gaagagcacc aacctggtga agaacaagtg cgtgaacttc aacttcaacg 3420
gcctgaccgg caccggcgtg ctgaccgaga gcaacaagaa gttcctgccc ttccagcagt 3480
tcggcaggga catcgccgac accaccgacg ccgtgaggga cccccagacc ctggagatcc 3540
tggacatcac cccctgcagc ttcggcggcg tgagcgtgat cacccccggc accaacacca 3600
gcaaccaggt ggccgtgctg taccaggacg tgaactgcac cgaggtgccc gtggccatcc 3660
acgccgacca gctgaccccc acctggaggg tgtacagcac cggcagcaac gtgttccaga 3720
ccagggccgg ctgcctgatc ggcgccgagc acgtgaacaa cagctacgag tgcgacatcc 3780
ccatcggcgc cggcatctgc gccagctacc agacccagac caacagcccc ggcagcgcca 3840
gcagcgtggc cagccagagc atcatcgcct acaccatgag cctgggcgcc gagaacagcg 3900
tggcctacag caacaacagc atcgccatcc ccaccaactt caccatcagc gtgaccaccg 3960
agatcctgcc cgtgagcatg accaagacca gcgtggactg caccatgtac atctgcggcg 4020
acagcaccga gtgcagcaac ctgctgctgc agtacggcag cttctgcacc cagctgaaca 4080
gggccctgac cggcatcgcc gtggagcagg acaagaacac ccaggaggtg ttcgcccagg 4140
tgaagcagat ctacaagacc ccccccatca aggacttcgg cggcttcaac ttcagccaga 4200
tcctgcccga ccccagcaag cccagcaaga ggagccccat cgaggacctg ctgttcaaca 4260
aggtgaccct ggccgacgcc ggcttcatca agcagtacgg cgactgcctg ggcgacatcg 4320
ccgccaggga cctgatctgc gcccagaagt tcaacggcct gaccgtgctg ccccccctgc 4380
tgaccgacga gatgatcgcc cagtacacca gcgccctgct ggccggcacc atcaccagcg 4440
gctggacctt cggcgccggc cccgccctgc agatcccctt ccccatgcag atggcctaca 4500
ggttcaacgg catcggcgtg acccagaacg tgctgtacga gaaccagaag ctgatcgcca 4560
accagttcaa cagcgccatc ggcaagatcc aggacagcct gagcagcacc cccagcgccc 4620
tgggcaagct gcaggacgtg gtgaaccaga acgcccaggc cctgaacacc ctggtgaagc 4680
agctgagcag caacttcggc gccatcagca gcgtgctgaa cgacatcctg agcaggctgg 4740
acccccccga ggccgaggtg cagatcgaca ggctgatcac cggcaggctg cagagcctgc 4800
agacctacgt gacccagcag ctgatcaggg ccgccgagat cagggccagc gccaacctgg 4860
ccgccaccaa gatgagcgag tgcgtgctgg gccagagcaa gagggtggac ttctgcggca 4920
agggctacca cctgatgagc ttcccccaga gcgcccccca cggcgtggtg ttcctgcacg 4980
tgacctacgt gcccgcccag gagaagaact tcaccaccgc ccccgccatc tgccacgacg 5040
gcaaggccca cttccccagg gagggcgtgt tcgtgagcaa cggcacccac tggttcgtga 5100
cccagaggaa cttctacgag ccccagatca tcaccaccga caacaccttc gtgagcggca 5160
actgcgacgt ggtgatcggc atcgtgaaca acaccgtgta cgaccccctg cagcccgagc 5220
tggacagctt caaggaggag ctggacaagt acttcaagaa ccacaccagc cccgacgtgg 5280
acctgggcga catcagcggc atcaacgcca gcgtggtgaa catccagaag gagatcgaca 5340
ggctgaacga ggtggccaag aacctgaacg agagcctgat cgacctgcag gagctgggca 5400
agtacgagca gtacatcaag tggccctggt acatctggct gggcttcatc gccggcctga 5460
tcgccatcgt gatggtgacc atcatgctgt gctgcatgac cagctgctgc agctgcctga 5520
agggctgctg cagctgcggc agctgctgca agttcgacga ggacgacagc gagcccgtgc 5580
tgaagggcgt gaagctgcac tacaccggaa gcggagccac gaacttctct ctgttaaagc 5640
aagcaggaga tgttgaagaa aaccccgggc ctatgtacag cttcgtgagc gaggagaccg 5700
gcaccctgat cgtgaacagc gtgctgctgt tcctggcctt cgtggtgttc ctgctggtga 5760
ccctggccat cctgaccgcc ctgaggctgt gcgcctactg ctgcaacatc gtgaacgtga 5820
gcctggtgaa gcccagcttc tacgtgtaca gcagggtgaa gaacctgaac agcagcaggg 5880
tgcccgacct gctggtggga agcggagcca cgaacttctc tctgttaaag caagcaggag 5940
atgttgaaga aaaccccggg cctatggccg acagcaacgg caccatcacc gtggaggagc 6000
tgaagaagct gctggagcag tggaacctgg tgatcggctt cctgttcctg acctggatct 6060
gcctgctgca gttcgcctac gccaacagga acaggttcct gtacatcatc aagctgatct 6120
tcctgtggct gctgtggccc gtgaccctgg cctgcttcgt gctggccgcc gtgtacagga 6180
tcaactggat caccggcggc atcgccatcg ccatggcctg cctggtgggc ctgatgtggc 6240
tgagctactt catcgccagc ttcaggctgt tcgccaggac caggagcatg tggagcttca 6300
accccgagac caacatcctg ctgaacgtgc ccctgcacgg caccatcctg accaggcccc 6360
tgctggagag cgagctggtg atcggcgccg tgatcctgag gggccacctg aggatcgccg 6420
gccaccacct gggcaggtgc gacatcaagg acctgcccaa ggagatcacc gtggccacca 6480
gcaggaccct gagctactac aagctgggcg ccagccagag ggtggccggc gacagcggct 6540
tcgccgccta cagcaggtac aggatcggca actacaagct gaacaccgac cacagcagca 6600
gcagcgacaa catcgccctg ctggtgcagg gaagcggagc cacgaacttc tctctgttaa 6660
agcaagcagg agatgttgaa gaaaaccccg ggcctatgaa gatcatcctg ttcctggccc 6720
tgatcaccct ggccacctgc gagctgtacc actaccagga gtgcgtgagg ggcaccaccg 6780
tgtgactcga gctggtactg catgcacgca atgctagctg cccctttccc gtcctgggta 6840
ccccgagtct cccccgacct cgggtcccag gtatgctccc acctccacct gccccactca 6900
ccacctctgc tagttccaga cacctcccaa gcacgcagca atgcagctca aaacgcttag 6960
cctagccaca cccccacggg aaacagcagt gattaacctt tagcaataaa cgaaagttta 7020
actaagctat actaacccca gggttggtca atttcgtgcc agccacaccc tggagctagc 7080
aaaaaaaa 7088
<210> 142
<211> 6935
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthesized Vaccine Candidate 4
<400> 142
ctcgacattg attattgact agttattaat agtaatcaat tacggggtca ttagttcata 60
gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 120
ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag 180
ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac 240
atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg 300
cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg 360
tattagtcat cgctattacc atggtcgagg tgagccccac gttctgcttc actctcccca 420
tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta ttttgtgcag 480
cgatgggggc gggggggggg ggggggcgcg cgccaggcgg ggcggggcgg ggcgaggggc 540
ggggcggggc gaggcggaga ggtgcggcgg cagccaatca gagcggcgcg ctccgaaagt 600
ttccttttat ggcgaggcgg cggcggcggc ggccctataa aaagcgaagc gcgcggcggg 660
cgggagtcgc tgcgcgctgc cttcgccccg tgccccgctc cgccgccgcc tcgcgccgcc 720
cgccccggct ctgactgacc gcgttactcc cacaggtgag cgggcgggac ggcccttctc 780
ctccgggctg taattagcgc ttggtttaat gacggcttgt ttcttttctg tggctgcgtg 840
aaagccttga ggggctccgg gagggccctt tgtgcggggg gagcggctcg gggggtgcgt 900
gcgtgtgtgt gtgcgtgggg agcgccgcgt gcggctccgc gctgcccggc ggctgtgagc 960
gctgcgggcg cggcgcgggg ctttgtgcgc tccgcagtgt gcgcgagggg agcgcggccg 1020
ggggcggtgc cccgcggtgc ggggggggct gcgaggggaa caaaggctgc gtgcggggtg 1080
tgtgcgtggg ggggtgagca gggggtgtgg gcgcgtcggt cgggctgcaa ccccccctgc 1140
acccccctcc ccgagttgct gagcacggcc cggcttcggg tgcggggctc cgtacggggc 1200
gtggcgcggg gctcgccgtg ccgggcgggg ggtggcggca ggtgggggtg ccgggcgggg 1260
cggggccgcc tcgggccggg gagggctcgg gggaggggcg cggcggcccc cggagcgccg 1320
gcggctgtcg aggcgcggcg agccgcagcc attgcctttt atggtaatcg tgcgagaggg 1380
cgcagggact tcctttgtcc caaatctgtg cggagccgaa atctgggagg cgccgccgca 1440
ccccctctag cgggcgcggg gcgaagcggt gcggcgccgg caggaaggaa atgggcgggg 1500
agggccttcg tgcgtcgccg cgccgccgtc cccttctccc tctccagcct cggggctgtc 1560
cgcgggggga cggctgcctt cgggggggac ggggcagggc ggggttcggc ttctggcgtg 1620
tgaccggcgg ctctagagcc tctgctaacc atgttcatgc cttcttcttt ttcctacagc 1680
tcctgggcaa cgtgctggtt attgtgctgt ctcatcattt tggcaaagaa ttggagaata 1740
aactagtatt cttctggtcc ccacagactc agagagaacc cgccaccatg ttcgtgttcc 1800
tggtgctgct gcccctggtg agcagccagt gcgtgaacct gaccaccagg acccagctgc 1860
cccccgccta caccaacagc ttcaccaggg gcgtgtacta ccccgacaag gtgttcagga 1920
gcagcgtgct gcacagcacc caggacctgt tcctgccctt cttcagcaac gtgacctggt 1980
tccacgccat ccacgtgagc ggcaccaacg gcaccaagag gttcgacaac cccgtgctgc 2040
ccttcaacga cggcgtgtac ttcgccagca ccgagaagag caacatcatc aggggctgga 2100
tcttcggcac caccctggac agcaagaccc agagcctgct gatcgtgaac aacgccacca 2160
acgtggtgat caaggtgtgc gagttccagt tctgcaacga ccccttcctg ggcgtgtact 2220
accacaagaa caacaagagc tggatggaga gcgagttcag ggtgtacagc agcgccaaca 2280
actgcacctt cgagtacgtg agccagccct tcctgatgga cctggagggc aagcagggca 2340
acttcaagaa cctgagggag ttcgtgttca agaacatcga cggctacttc aagatctaca 2400
gcaagcacac ccccatcaac ctggtgaggg acctgcccca gggcttcagc gccctggagc 2460
ccctggtgga cctgcccatc ggcatcaaca tcaccaggtt ccagaccctg ctggccctgc 2520
acaggagcta cctgaccccc ggcgacagca gcagcggctg gaccgccggc gccgccgcct 2580
actacgtggg ctacctgcag cccaggacct tcctgctgaa gtacaacgag aacggcacca 2640
tcaccgacgc cgtggactgc gccctggacc ccctgagcga gaccaagtgc accctgaaga 2700
gcttcaccgt ggagaagggc atctaccaga ccagcaactt cagggtgcag cccaccgaga 2760
gcatcgtgag gttccccaac atcaccaacc tgtgcccctt cggcgaggtg ttcaacgcca 2820
ccaggttcgc cagcgtgtac gcctggaaca ggaagaggat cagcaactgc gtggccgact 2880
acagcgtgct gtacaacagc gccagcttca gcaccttcaa gtgctacggc gtgagcccca 2940
ccaagctgaa cgacctgtgc ttcaccaacg tgtacgccga cagcttcgtg atcaggggcg 3000
acgaggtgag gcagatcgcc cccggccaga ccggcaagat cgccgactac aactacaagc 3060
tgcccgacga cttcaccggc tgcgtgatcg cctggaacag caacaacctg gacagcaagg 3120
tgggcggcaa ctacaactac ctgtacaggc tgttcaggaa gagcaacctg aagcccttcg 3180
agagggacat cagcaccgag atctaccagg ccggcagcac cccctgcaac ggcgtggagg 3240
gcttcaactg ctacttcccc ctgcagagct acggcttcca gcccaccaac ggcgtgggct 3300
accagcccta cagggtggtg gtgctgagct tcgagctgct gcacgccccc gccaccgtgt 3360
gcggccccaa gaagagcacc aacctggtga agaacaagtg cgtgaacttc aacttcaacg 3420
gcctgaccgg caccggcgtg ctgaccgaga gcaacaagaa gttcctgccc ttccagcagt 3480
tcggcaggga catcgccgac accaccgacg ccgtgaggga cccccagacc ctggagatcc 3540
tggacatcac cccctgcagc ttcggcggcg tgagcgtgat cacccccggc accaacacca 3600
gcaaccaggt ggccgtgctg taccaggacg tgaactgcac cgaggtgccc gtggccatcc 3660
acgccgacca gctgaccccc acctggaggg tgtacagcac cggcagcaac gtgttccaga 3720
ccagggccgg ctgcctgatc ggcgccgagc acgtgaacaa cagctacgag tgcgacatcc 3780
ccatcggcgc cggcatctgc gccagctacc agacccagac caacagcccc ggcagcgcca 3840
gcagcgtggc cagccagagc atcatcgcct acaccatgag cctgggcgcc gagaacagcg 3900
tggcctacag caacaacagc atcgccatcc ccaccaactt caccatcagc gtgaccaccg 3960
agatcctgcc cgtgagcatg accaagacca gcgtggactg caccatgtac atctgcggcg 4020
acagcaccga gtgcagcaac ctgctgctgc agtacggcag cttctgcacc cagctgaaca 4080
gggccctgac cggcatcgcc gtggagcagg acaagaacac ccaggaggtg ttcgcccagg 4140
tgaagcagat ctacaagacc ccccccatca aggacttcgg cggcttcaac ttcagccaga 4200
tcctgcccga ccccagcaag cccagcaaga ggagccccat cgaggacctg ctgttcaaca 4260
aggtgaccct ggccgacgcc ggcttcatca agcagtacgg cgactgcctg ggcgacatcg 4320
ccgccaggga cctgatctgc gcccagaagt tcaacggcct gaccgtgctg ccccccctgc 4380
tgaccgacga gatgatcgcc cagtacacca gcgccctgct ggccggcacc atcaccagcg 4440
gctggacctt cggcgccggc cccgccctgc agatcccctt ccccatgcag atggcctaca 4500
ggttcaacgg catcggcgtg acccagaacg tgctgtacga gaaccagaag ctgatcgcca 4560
accagttcaa cagcgccatc ggcaagatcc aggacagcct gagcagcacc cccagcgccc 4620
tgggcaagct gcaggacgtg gtgaaccaga acgcccaggc cctgaacacc ctggtgaagc 4680
agctgagcag caacttcggc gccatcagca gcgtgctgaa cgacatcctg agcaggctgg 4740
acccccccga ggccgaggtg cagatcgaca ggctgatcac cggcaggctg cagagcctgc 4800
agacctacgt gacccagcag ctgatcaggg ccgccgagat cagggccagc gccaacctgg 4860
ccgccaccaa gatgagcgag tgcgtgctgg gccagagcaa gagggtggac ttctgcggca 4920
agggctacca cctgatgagc ttcccccaga gcgcccccca cggcgtggtg ttcctgcacg 4980
tgacctacgt gcccgcccag gagaagaact tcaccaccgc ccccgccatc tgccacgacg 5040
gcaaggccca cttccccagg gagggcgtgt tcgtgagcaa cggcacccac tggttcgtga 5100
cccagaggaa cttctacgag ccccagatca tcaccaccga caacaccttc gtgagcggca 5160
actgcgacgt ggtgatcggc atcgtgaaca acaccgtgta cgaccccctg cagcccgagc 5220
tggacagctt caaggaggag ctggacaagt acttcaagaa ccacaccagc cccgacgtgg 5280
acctgggcga catcagcggc atcaacgcca gcgtggtgaa catccagaag gagatcgaca 5340
ggctgaacga ggtggccaag aacctgaacg agagcctgat cgacctgcag gagctgggca 5400
agtacgagca gtacatcaag tggccctggt acatctggct gggcttcatc gccggcctga 5460
tcgccatcgt gatggtgacc atcatgctgt gctgcatgac cagctgctgc agctgcctga 5520
agggctgctg cagctgcggc agctgctgca agttcgacga ggacgacagc gagcccgtgc 5580
tgaagggcgt gaagctgcac tacaccggaa gcggagccac gaacttctct ctgttaaagc 5640
aagcaggaga tgttgaagaa aaccccgggc ctatggccga cagcaacggc accatcaccg 5700
tggaggagct gaagaagctg ctggagcagt ggaacctggt gatcggcttc ctgttcctga 5760
cctggatctg cctgctgcag ttcgcctacg ccaacaggaa caggttcctg tacatcatca 5820
agctgatctt cctgtggctg ctgtggcccg tgaccctggc ctgcttcgtg ctggccgccg 5880
tgtacaggat caactggatc accggcggca tcgccatcgc catggcctgc ctggtgggcc 5940
tgatgtggct gagctacttc atcgccagct tcaggctgtt cgccaggacc aggagcatgt 6000
ggagcttcaa ccccgagacc aacatcctgc tgaacgtgcc cctgcacggc accatcctga 6060
ccaggcccct gctggagagc gagctggtga tcggcgccgt gatcctgagg ggccacctga 6120
ggatcgccgg ccaccacctg ggcaggtgcg acatcaagga cctgcccaag gagatcaccg 6180
tggccaccag caggaccctg agctactaca agctgggcgc cagccagagg gtggccggcg 6240
acagcggctt cgccgcctac agcaggtaca ggatcggcaa ctacaagctg aacaccgacc 6300
acagcagcag cagcgacaac atcgccctgc tggtgcaggg aagcggagcc acgaacttct 6360
ctctgttaaa gcaagcagga gatgttgaag aaaaccccgg gcctatgtac agcttcgtga 6420
gcgaggagac cggcaccctg atcgtgaaca gcgtgctgct gttcctggcc ttcgtggtgt 6480
tcctgctggt gaccctggcc atcctgaccg ccctgaggct gtgcgcctac tgctgcaaca 6540
tcgtgaacgt gagcctggtg aagcccagct tctacgtgta cagcagggtg aagaacctga 6600
acagcagcag ggtgcccgac ctgctggtgt gactcgagct ggtactgcat gcacgcaatg 6660
ctagctgccc ctttcccgtc ctgggtaccc cgagtctccc ccgacctcgg gtcccaggta 6720
tgctcccacc tccacctgcc ccactcacca cctctgctag ttccagacac ctcccaagca 6780
cgcagcaatg cagctcaaaa cgcttagcct agccacaccc ccacgggaaa cagcagtgat 6840
taacctttag caataaacga aagtttaact aagctatact aaccccaggg ttggtcaatt 6900
tcgtgccagc cacaccctgg agctagcaaa aaaaa 6935
<210> 143
<211> 12110
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthesized Vaccine Candidate 5
<400> 143
ctcgacattg attattgact agttattaat agtaatcaat tacggggtca ttagttcata 60
gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 120
ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag 180
ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac 240
atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg 300
cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg 360
tattagtcat cgctattacc atggtcgagg tgagccccac gttctgcttc actctcccca 420
tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta ttttgtgcag 480
cgatgggggc gggggggggg ggggggcgcg cgccaggcgg ggcggggcgg ggcgaggggc 540
ggggcggggc gaggcggaga ggtgcggcgg cagccaatca gagcggcgcg ctccgaaagt 600
ttccttttat ggcgaggcgg cggcggcggc ggccctataa aaagcgaagc gcgcggcggg 660
cgggagtcgc tgcgcgctgc cttcgccccg tgccccgctc cgccgccgcc tcgcgccgcc 720
cgccccggct ctgactgacc gcgttactcc cacaggtgag cgggcgggac ggcccttctc 780
ctccgggctg taattagcgc ttggtttaat gacggcttgt ttcttttctg tggctgcgtg 840
aaagccttga ggggctccgg gagggccctt tgtgcggggg gagcggctcg gggggtgcgt 900
gcgtgtgtgt gtgcgtgggg agcgccgcgt gcggctccgc gctgcccggc ggctgtgagc 960
gctgcgggcg cggcgcgggg ctttgtgcgc tccgcagtgt gcgcgagggg agcgcggccg 1020
ggggcggtgc cccgcggtgc ggggggggct gcgaggggaa caaaggctgc gtgcggggtg 1080
tgtgcgtggg ggggtgagca gggggtgtgg gcgcgtcggt cgggctgcaa ccccccctgc 1140
acccccctcc ccgagttgct gagcacggcc cggcttcggg tgcggggctc cgtacggggc 1200
gtggcgcggg gctcgccgtg ccgggcgggg ggtggcggca ggtgggggtg ccgggcgggg 1260
cggggccgcc tcgggccggg gagggctcgg gggaggggcg cggcggcccc cggagcgccg 1320
gcggctgtcg aggcgcggcg agccgcagcc attgcctttt atggtaatcg tgcgagaggg 1380
cgcagggact tcctttgtcc caaatctgtg cggagccgaa atctgggagg cgccgccgca 1440
ccccctctag cgggcgcggg gcgaagcggt gcggcgccgg caggaaggaa atgggcgggg 1500
agggccttcg tgcgtcgccg cgccgccgtc cccttctccc tctccagcct cggggctgtc 1560
cgcgggggga cggctgcctt cgggggggac ggggcagggc ggggttcggc ttctggcgtg 1620
tgaccggcgg ctctagagcc tctgctaacc atgttcatgc cttcttcttt ttcctacagc 1680
tcctgggcaa cgtgctggtt attgtgctgt ctcatcattt tggcaaagaa ttggagaata 1740
aactagtatt cttctggtcc ccacagactc agagagaacc cgccaccatg ttcgtgttcc 1800
tggtgctgct gcccctggtg agcagccagt gcgtgaacct gaccaccagg acccagctgc 1860
cccccgccta caccaacagc ttcaccaggg gcgtgtacta ccccgacaag gtgttcagga 1920
gcagcgtgct gcacagcacc caggacctgt tcctgccctt cttcagcaac gtgacctggt 1980
tccacgccat ccacgtgagc ggcaccaacg gcaccaagag gttcgacaac cccgtgctgc 2040
ccttcaacga cggcgtgtac ttcgccagca ccgagaagag caacatcatc aggggctgga 2100
tcttcggcac caccctggac agcaagaccc agagcctgct gatcgtgaac aacgccacca 2160
acgtggtgat caaggtgtgc gagttccagt tctgcaacga ccccttcctg ggcgtgtact 2220
accacaagaa caacaagagc tggatggaga gcgagttcag ggtgtacagc agcgccaaca 2280
actgcacctt cgagtacgtg agccagccct tcctgatgga cctggagggc aagcagggca 2340
acttcaagaa cctgagggag ttcgtgttca agaacatcga cggctacttc aagatctaca 2400
gcaagcacac ccccatcaac ctggtgaggg acctgcccca gggcttcagc gccctggagc 2460
ccctggtgga cctgcccatc ggcatcaaca tcaccaggtt ccagaccctg ctggccctgc 2520
acaggagcta cctgaccccc ggcgacagca gcagcggctg gaccgccggc gccgccgcct 2580
actacgtggg ctacctgcag cccaggacct tcctgctgaa gtacaacgag aacggcacca 2640
tcaccgacgc cgtggactgc gccctggacc ccctgagcga gaccaagtgc accctgaaga 2700
gcttcaccgt ggagaagggc atctaccaga ccagcaactt cagggtgcag cccaccgaga 2760
gcatcgtgag gttccccaac atcaccaacc tgtgcccctt cggcgaggtg ttcaacgcca 2820
ccaggttcgc cagcgtgtac gcctggaaca ggaagaggat cagcaactgc gtggccgact 2880
acagcgtgct gtacaacagc gccagcttca gcaccttcaa gtgctacggc gtgagcccca 2940
ccaagctgaa cgacctgtgc ttcaccaacg tgtacgccga cagcttcgtg atcaggggcg 3000
acgaggtgag gcagatcgcc cccggccaga ccggcaagat cgccgactac aactacaagc 3060
tgcccgacga cttcaccggc tgcgtgatcg cctggaacag caacaacctg gacagcaagg 3120
tgggcggcaa ctacaactac ctgtacaggc tgttcaggaa gagcaacctg aagcccttcg 3180
agagggacat cagcaccgag atctaccagg ccggcagcac cccctgcaac ggcgtggagg 3240
gcttcaactg ctacttcccc ctgcagagct acggcttcca gcccaccaac ggcgtgggct 3300
accagcccta cagggtggtg gtgctgagct tcgagctgct gcacgccccc gccaccgtgt 3360
gcggccccaa gaagagcacc aacctggtga agaacaagtg cgtgaacttc aacttcaacg 3420
gcctgaccgg caccggcgtg ctgaccgaga gcaacaagaa gttcctgccc ttccagcagt 3480
tcggcaggga catcgccgac accaccgacg ccgtgaggga cccccagacc ctggagatcc 3540
tggacatcac cccctgcagc ttcggcggcg tgagcgtgat cacccccggc accaacacca 3600
gcaaccaggt ggccgtgctg taccaggacg tgaactgcac cgaggtgccc gtggccatcc 3660
acgccgacca gctgaccccc acctggaggg tgtacagcac cggcagcaac gtgttccaga 3720
ccagggccgg ctgcctgatc ggcgccgagc acgtgaacaa cagctacgag tgcgacatcc 3780
ccatcggcgc cggcatctgc gccagctacc agacccagac caacagcccc ggcagcgcca 3840
gcagcgtggc cagccagagc atcatcgcct acaccatgag cctgggcgcc gagaacagcg 3900
tggcctacag caacaacagc atcgccatcc ccaccaactt caccatcagc gtgaccaccg 3960
agatcctgcc cgtgagcatg accaagacca gcgtggactg caccatgtac atctgcggcg 4020
acagcaccga gtgcagcaac ctgctgctgc agtacggcag cttctgcacc cagctgaaca 4080
gggccctgac cggcatcgcc gtggagcagg acaagaacac ccaggaggtg ttcgcccagg 4140
tgaagcagat ctacaagacc ccccccatca aggacttcgg cggcttcaac ttcagccaga 4200
tcctgcccga ccccagcaag cccagcaaga ggagccccat cgaggacctg ctgttcaaca 4260
aggtgaccct ggccgacgcc ggcttcatca agcagtacgg cgactgcctg ggcgacatcg 4320
ccgccaggga cctgatctgc gcccagaagt tcaacggcct gaccgtgctg ccccccctgc 4380
tgaccgacga gatgatcgcc cagtacacca gcgccctgct ggccggcacc atcaccagcg 4440
gctggacctt cggcgccggc cccgccctgc agatcccctt ccccatgcag atggcctaca 4500
ggttcaacgg catcggcgtg acccagaacg tgctgtacga gaaccagaag ctgatcgcca 4560
accagttcaa cagcgccatc ggcaagatcc aggacagcct gagcagcacc cccagcgccc 4620
tgggcaagct gcaggacgtg gtgaaccaga acgcccaggc cctgaacacc ctggtgaagc 4680
agctgagcag caacttcggc gccatcagca gcgtgctgaa cgacatcctg agcaggctgg 4740
acccccccga ggccgaggtg cagatcgaca ggctgatcac cggcaggctg cagagcctgc 4800
agacctacgt gacccagcag ctgatcaggg ccgccgagat cagggccagc gccaacctgg 4860
ccgccaccaa gatgagcgag tgcgtgctgg gccagagcaa gagggtggac ttctgcggca 4920
agggctacca cctgatgagc ttcccccaga gcgcccccca cggcgtggtg ttcctgcacg 4980
tgacctacgt gcccgcccag gagaagaact tcaccaccgc ccccgccatc tgccacgacg 5040
gcaaggccca cttccccagg gagggcgtgt tcgtgagcaa cggcacccac tggttcgtga 5100
cccagaggaa cttctacgag ccccagatca tcaccaccga caacaccttc gtgagcggca 5160
actgcgacgt ggtgatcggc atcgtgaaca acaccgtgta cgaccccctg cagcccgagc 5220
tggacagctt caaggaggag ctggacaagt acttcaagaa ccacaccagc cccgacgtgg 5280
acctgggcga catcagcggc atcaacgcca gcgtggtgaa catccagaag gagatcgaca 5340
ggctgaacga ggtggccaag aacctgaacg agagcctgat cgacctgcag gagctgggca 5400
agtacgagca gtacatcaag tggccctggt acatctggct gggcttcatc gccggcctga 5460
tcgccatcgt gatggtgacc atcatgctgt gctgcatgac cagctgctgc agctgcctga 5520
agggctgctg cagctgcggc agctgctgca agttcgacga ggacgacagc gagcccgtgc 5580
tgaagggcgt gaagctgcac tacaccggaa gcggagccac gaacttctct ctgttaaagc 5640
aagcaggaga tgttgaagaa aaccccgggc ctgcccccac caaggtgacc ttcggcgacg 5700
acaccgtgat cgaggtgcag ggctacaaga gcgtgaacat caccttcgag ctggacgaga 5760
ggatcgacaa ggtgctgaac gagaagtgca gcgcctacac cgtggagctg ggcaccgagg 5820
tgaacgagtt cgcctgcgtg gtggccgacg ccgtgatcaa gaccctgcag cccgtgagcg 5880
agctgctgac ccccctgggc atcgacctgg acgagtggag catggccacc tactacctgt 5940
tcgacgagag cggcgagttc aagctggcca gccacatgta ctgcagcttc tacccccccg 6000
acgaggacga ggaggagggc gactgcgagg aggaggagtt cgagcccagc acccagtacg 6060
agtacggcac cgaggacgac taccagggca agcccctgga gttcggcgcc accagcgccg 6120
ccctgcagcc cgaggaggag caggaggagg actggctgga cgacgacagc cagcagaccg 6180
tgggccagca ggacggcagc gaggacaacc agaccaccac catccagacc atcgtggagg 6240
tgcagcccca gctggagatg gagctgaccc ccgtggtgca gaccatcgag gtgaacagct 6300
tcagcggcta cctgaagctg accgacaacg tgtacatcaa gaacgccgac atcgtggagg 6360
aggccaagaa ggtgaagccc accgtggtgg tgaacgccgc caacgtgtac ctgaagcacg 6420
gcggcggcgt ggccggcgcc ctgaacaagg ccaccaacaa cgccatgcag gtggagagcg 6480
acgactacat cgccaccaac ggccccctga aggtgggcgg cagctgcgtg ctgagcggcc 6540
acaacctggc caagcactgc ctgcacgtgg tgggccccaa cgtgaacaag ggcgaggaca 6600
tccagctgct gaagagcgcc tacgagaact tcaaccagca cgaggtgctg ctggcccccc 6660
tgctgagcgc cggcatcttc ggcgccgacc ccatccacag cctgagggtg tgcgtggaca 6720
ccgtgaggac caacgtgtac ctggccgtgt tcgacaagaa cctgtacgac aagctggtga 6780
gcagcttcct ggagatgaag agcgagaagc aggtggagca gaagatcgcc gagatcccca 6840
aggaggaggt gaagcccttc atcaccgaga gcaagcccag cgtggagcag aggaagcagg 6900
acgacaagaa gatcaaggcc tgcgtggagg aggtgaccac caccctggag gagaccaagt 6960
tcctgaccga gaacctgctg ctgtacatcg acatcaacgg caacctgcac cccgacagcg 7020
ccaccctggt gagcgacatc gacatcacct tcctgaagaa ggacgccccc tacatcgtgg 7080
gcgacgtggt gcaggagggc gtgctgaccg ccgtggtgat ccccaccaag aaggccggcg 7140
gcaccaccga gatgctggcc aaggccctga ggaaggtgcc caccgacaac tacatcacca 7200
cctaccccgg ccagggcctg aacggctaca ccgtggagga ggccaagacc gtgctgaaga 7260
agtgcaagag cgccttctac atcctgccca gcatcatcag caacgagaag caggagatcc 7320
tgggcaccgt gagctggaac ctgagggaga tgctggccca cgccgaggag accaggaagc 7380
tgatgcccgt gtgcgtggag accaaggcca tcgtgagcac catccagagg aagtacaagg 7440
gcatcaagat ccaggagggc gtggtggact acggcgccag gttctacttc tacaccagca 7500
agaccaccgt ggccagcctg atcaacaccc tgaacgacct gaacgagacc ctggtgacca 7560
tgcccctggg ctacgtgacc cacggcctga acctggagga ggccgccagg tacatgagga 7620
gcctgaaggt gcccgccacc gtgagcgtga gcagccccga cgccgtgacc gcctacaacg 7680
gctacctgac cagcagcagc aagacccccg aggagcactt catcgagacc atcagcctgg 7740
ccggcagcta caaggactgg agctacagcg gccagagcac ccagctgggc atcgagttcc 7800
tgaagagggg cgacaagagc gtgtactaca ccagcaaccc caccaccttc cacctggacg 7860
gcgaggtgat caccttcgac aacctgaaga ccctgctgag cctgagggag gtgaggacca 7920
tcaaggtgtt caccaccgtg gacaacatca acctgcacgg aagcggagcc acgaacttct 7980
ctctgttaaa gcaagcagga gatgttgaag aaaaccccgg gcctagcggc ttcaggaaga 8040
tggccttccc cagcggcaag gtggagggct gcatggtgca ggtgacctgc ggcaccacca 8100
ccctgaacgg cctgtggctg gacgacgtgg tgtactgccc caggcacgtg atctgcacca 8160
gcgaggacat gctgaacccc aactacgagg acctgctgat caggaagagc aaccacaact 8220
tcctggtgca ggccggcaac gtgcagctga gggtgatcgg ccacagcatg cagaactgcg 8280
tgctgaagct gaaggtggac accgccaacc ccaagacccc caagtacaag ttcgtgagga 8340
tccagcccgg ccagaccttc agcgtgctgg cctgctacaa cggcagcccc agcggcgtgt 8400
accagtgcgc catgaggccc aacttcacca tcaagggcag cttcctgaac ggcagctgcg 8460
gcagcgtggg cttcaacatc gactacgact gcgtgagctt ctgctacatg caccacatgg 8520
agctgcccac cggcgtgcac gccggcaccg acctggaggg caacttctac ggccccttcg 8580
tggacaggca gaccgcccag gccgccggca ccgacaccac catcaccgtg aacgtgctgg 8640
cctggctgta cgccgccgtg atcaacggcg acaggtggtt cctgaacagg ttcaccacca 8700
ccctgaacga cttcaacctg gtggccatga agtacaacta cgagcccctg acccaggacc 8760
acgtggacat cctgggcccc ctgagcgccc agaccggcat cgccgtgctg gacatgtgcg 8820
ccagcctgaa ggagctgctg cagaacggca tgaacggcag gaccatcctg ggcagcgccc 8880
tgctggagga cgagttcacc cccttcgacg tggtgaggca gtgcagcggc gtgaccttcc 8940
agggaagcgg agccacgaac ttctctctgt taaagcaagc aggagatgtt gaagaaaacc 9000
ccgggcctag cgccgacgcc cagagcttcc tgaacagggt gtgcggcgtg agcgccgcca 9060
ggctgacccc ctgcggcacc ggcaccagca ccgacgtggt gtacagggcc ttcgacatct 9120
acaacgacaa ggtggccggc ttcgccaagt tcctgaagac caactgctgc aggttccagg 9180
agaaggacga ggacgacaac ctgatcgaca gctacttcgt ggtgaagagg cacaccttca 9240
gcaactacca gcacgaggag accatctaca acctgctgaa ggactgcccc gccgtggcca 9300
agcacgactt cttcaagttc aggatcgacg gcgacatggt gccccacatc agcaggcaga 9360
ggctgaccaa gtacaccatg gccgacctgg tgtacgccct gaggcacttc gacgagggca 9420
actgcgacac cctgaaggag atcctggtga cctacaactg ctgcgacgac gactacttca 9480
acaagaagga ctggtacgac ttcgtggaga accccgacat cctgagggtg tacgccaacc 9540
tgggcgagag ggtgaggcag gccctgctga agaccgtgca gttctgcgac gccatgagga 9600
acgccggcat cgtgggcgtg ctgaccctgg acaaccagga cctgaacggc aactggtacg 9660
acttcggcga cttcatccag accacccccg gcagcggcgt gcccgtggtg gacagctact 9720
acagcctgct gatgcccatc ctgaccctga ccagggccct gaccgccgag agccacgtgg 9780
acaccgacct gaccaagccc tacatcaagt gggacctgct gaagtacgac ttcaccgagg 9840
agaggctgaa gctgttcgac aggtacttca agtactggga ccagacctac caccccaact 9900
gcgtgaactg cctggacgac aggtgcatcc tgcactgcgc caacttcaac gtgctgttca 9960
gcaccgtgtt cccccccacc agcttcggcc ccctggtgag gaagatcttc gtggacggcg 10020
tgcccttcgt ggtgagcacc ggctaccact tcagggagct gggcgtggtg cacaaccagg 10080
acgtgaacct gcacagcagc aggctgagct tcaaggagct gctggtgtac gccgccgacc 10140
ccgccatgca cgccgccagc ggcaacctgc tgctggacaa gaggaccacc tgcttcagcg 10200
tggccgccct gaccaacaac gtggccttcc agaccgtgaa gcccggcaac ttcaacaagg 10260
acttctacga cttcgccgtg agcaagggct tcttcaagga gggcagcagc gtggagctga 10320
agcacttctt cttcgcccag gacggcaacg ccgccatcag cgactacgac tactacaggt 10380
acaacctgcc caccatgtgc gacatcaggc agctgctgtt cgtggtggag gtggtggaca 10440
agtacttcga ctgctacgac ggcggctgca tcaacgccaa ccaggtgatc gtgaacaacc 10500
tggacaagag cgccggcttc cccttcaaca agtggggcaa ggccaggctg tactacgaca 10560
gcatgagcta cgaggaccag gacgccctgt tcgcctacac caagaggaac gtgatcccca 10620
ccatcaccca gatgaacctg aagtacgcca tcagcgccaa gaacagggcc aggaccgtgg 10680
ccggcgtgag catctgcagc accatgacca acaggcagtt ccaccagaag ctgctgaaga 10740
gcatcgccgc caccaggggc gccaccgtgg tgatcggcac cagcaagttc tacggcggct 10800
ggcacaacat gctgaagacc gtgtacagcg acgtggagaa cccccacctg atgggctggg 10860
actaccccaa gtgcgacagg gccatgccca acatgctgag gatcatggcc agcctggtgc 10920
tggccaggaa gcacaccacc tgctgcagcc tgagccacag gttctacagg ctggccaacg 10980
agtgcgccca ggtgctgagc gagatggtga tgtgcggcgg cagcctgtac gtgaagcccg 11040
gcggcaccag cagcggcgac gccaccaccg cctacgccaa cagcgtgttc aacatctgcc 11100
aggccgtgac cgccaacgtg aacgccctgc tgagcaccga cggcaacaag atcgccgaca 11160
agtacgtgag gaacctgcag cacaggctgt acgagtgcct gtacaggaac agggacgtgg 11220
acaccgactt cgtgaacgag ttctacgcct acctgaggaa gcacttcagc atgatgatcc 11280
tgagcgacga cgccgtggtg tgcttcaaca gcacctacgc cagccagggc ctggtggcca 11340
gcatcaagaa cttcaagagc gtgctgtact accagaacaa cgtgttcatg agcgaggcca 11400
agtgctggac cgagaccgac ctgaccaagg gcccccacga gttctgcagc cagcacacca 11460
tgctggtgaa gcagggcgac gactacgtgt acctgcccta ccccgacccc agcaggatcc 11520
tgggcgccgg ctgcttcgtg gacgacatcg tgaagaccga cggcaccctg atgatcgaga 11580
ggttcgtgag cctggccatc gacgcctacc ccctgaccaa gcaccccaac caggagtacg 11640
ccgacgtgtt ccacctgtac ctgcagtaca tcaggaagct gcacgacgag ctgaccggcc 11700
acatgctgga catgtacagc gtgatgctga ccaacgacaa caccagcagg tactgggagc 11760
ccgagttcta cgaggccatg tacacccccc acaccgtgct gcagtgactc gagctggtac 11820
tgcatgcacg caatgctagc tgcccctttc ccgtcctggg taccccgagt ctcccccgac 11880
ctcgggtccc aggtatgctc ccacctccac ctgccccact caccacctct gctagttcca 11940
gacacctccc aagcacgcag caatgcagct caaaacgctt agcctagcca cacccccacg 12000
ggaaacagca gtgattaacc tttagcaata aacgaaagtt taactaagct atactaaccc 12060
cagggttggt caatttcgtg ccagccacac cctggagcta gcaaaaaaaa 12110
<210> 144
<211> 8264
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthesized Vaccine Candidate 6
<400> 144
ctcgacattg attattgact agttattaat agtaatcaat tacggggtca ttagttcata 60
gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 120
ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag 180
ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac 240
atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg 300
cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg 360
tattagtcat cgctattacc atggtcgagg tgagccccac gttctgcttc actctcccca 420
tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta ttttgtgcag 480
cgatgggggc gggggggggg ggggggcgcg cgccaggcgg ggcggggcgg ggcgaggggc 540
ggggcggggc gaggcggaga ggtgcggcgg cagccaatca gagcggcgcg ctccgaaagt 600
ttccttttat ggcgaggcgg cggcggcggc ggccctataa aaagcgaagc gcgcggcggg 660
cgggagtcgc tgcgcgctgc cttcgccccg tgccccgctc cgccgccgcc tcgcgccgcc 720
cgccccggct ctgactgacc gcgttactcc cacaggtgag cgggcgggac ggcccttctc 780
ctccgggctg taattagcgc ttggtttaat gacggcttgt ttcttttctg tggctgcgtg 840
aaagccttga ggggctccgg gagggccctt tgtgcggggg gagcggctcg gggggtgcgt 900
gcgtgtgtgt gtgcgtgggg agcgccgcgt gcggctccgc gctgcccggc ggctgtgagc 960
gctgcgggcg cggcgcgggg ctttgtgcgc tccgcagtgt gcgcgagggg agcgcggccg 1020
ggggcggtgc cccgcggtgc ggggggggct gcgaggggaa caaaggctgc gtgcggggtg 1080
tgtgcgtggg ggggtgagca gggggtgtgg gcgcgtcggt cgggctgcaa ccccccctgc 1140
acccccctcc ccgagttgct gagcacggcc cggcttcggg tgcggggctc cgtacggggc 1200
gtggcgcggg gctcgccgtg ccgggcgggg ggtggcggca ggtgggggtg ccgggcgggg 1260
cggggccgcc tcgggccggg gagggctcgg gggaggggcg cggcggcccc cggagcgccg 1320
gcggctgtcg aggcgcggcg agccgcagcc attgcctttt atggtaatcg tgcgagaggg 1380
cgcagggact tcctttgtcc caaatctgtg cggagccgaa atctgggagg cgccgccgca 1440
ccccctctag cgggcgcggg gcgaagcggt gcggcgccgg caggaaggaa atgggcgggg 1500
agggccttcg tgcgtcgccg cgccgccgtc cccttctccc tctccagcct cggggctgtc 1560
cgcgggggga cggctgcctt cgggggggac ggggcagggc ggggttcggc ttctggcgtg 1620
tgaccggcgg ctctagagcc tctgctaacc atgttcatgc cttcttcttt ttcctacagc 1680
tcctgggcaa cgtgctggtt attgtgctgt ctcatcattt tggcaaagaa ttggagaata 1740
aactagtatt cttctggtcc ccacagactc agagagaacc cgccaccatg ttcgtgttcc 1800
tggtgctgct gcccctggtg agcagccagt gcgtgaacct gaccaccagg acccagctgc 1860
cccccgccta caccaacagc ttcaccaggg gcgtgtacta ccccgacaag gtgttcagga 1920
gcagcgtgct gcacagcacc caggacctgt tcctgccctt cttcagcaac gtgacctggt 1980
tccacgccat ccacgtgagc ggcaccaacg gcaccaagag gttcgacaac cccgtgctgc 2040
ccttcaacga cggcgtgtac ttcgccagca ccgagaagag caacatcatc aggggctgga 2100
tcttcggcac caccctggac agcaagaccc agagcctgct gatcgtgaac aacgccacca 2160
acgtggtgat caaggtgtgc gagttccagt tctgcaacga ccccttcctg ggcgtgtact 2220
accacaagaa caacaagagc tggatggaga gcgagttcag ggtgtacagc agcgccaaca 2280
actgcacctt cgagtacgtg agccagccct tcctgatgga cctggagggc aagcagggca 2340
acttcaagaa cctgagggag ttcgtgttca agaacatcga cggctacttc aagatctaca 2400
gcaagcacac ccccatcaac ctggtgaggg acctgcccca gggcttcagc gccctggagc 2460
ccctggtgga cctgcccatc ggcatcaaca tcaccaggtt ccagaccctg ctggccctgc 2520
acaggagcta cctgaccccc ggcgacagca gcagcggctg gaccgccggc gccgccgcct 2580
actacgtggg ctacctgcag cccaggacct tcctgctgaa gtacaacgag aacggcacca 2640
tcaccgacgc cgtggactgc gccctggacc ccctgagcga gaccaagtgc accctgaaga 2700
gcttcaccgt ggagaagggc atctaccaga ccagcaactt cagggtgcag cccaccgaga 2760
gcatcgtgag gttccccaac atcaccaacc tgtgcccctt cggcgaggtg ttcaacgcca 2820
ccaggttcgc cagcgtgtac gcctggaaca ggaagaggat cagcaactgc gtggccgact 2880
acagcgtgct gtacaacagc gccagcttca gcaccttcaa gtgctacggc gtgagcccca 2940
ccaagctgaa cgacctgtgc ttcaccaacg tgtacgccga cagcttcgtg atcaggggcg 3000
acgaggtgag gcagatcgcc cccggccaga ccggcaagat cgccgactac aactacaagc 3060
tgcccgacga cttcaccggc tgcgtgatcg cctggaacag caacaacctg gacagcaagg 3120
tgggcggcaa ctacaactac ctgtacaggc tgttcaggaa gagcaacctg aagcccttcg 3180
agagggacat cagcaccgag atctaccagg ccggcagcac cccctgcaac ggcgtggagg 3240
gcttcaactg ctacttcccc ctgcagagct acggcttcca gcccaccaac ggcgtgggct 3300
accagcccta cagggtggtg gtgctgagct tcgagctgct gcacgccccc gccaccgtgt 3360
gcggccccaa gaagagcacc aacctggtga agaacaagtg cgtgaacttc aacttcaacg 3420
gcctgaccgg caccggcgtg ctgaccgaga gcaacaagaa gttcctgccc ttccagcagt 3480
tcggcaggga catcgccgac accaccgacg ccgtgaggga cccccagacc ctggagatcc 3540
tggacatcac cccctgcagc ttcggcggcg tgagcgtgat cacccccggc accaacacca 3600
gcaaccaggt ggccgtgctg taccaggacg tgaactgcac cgaggtgccc gtggccatcc 3660
acgccgacca gctgaccccc acctggaggg tgtacagcac cggcagcaac gtgttccaga 3720
ccagggccgg ctgcctgatc ggcgccgagc acgtgaacaa cagctacgag tgcgacatcc 3780
ccatcggcgc cggcatctgc gccagctacc agacccagac caacagcccc ggcagcgcca 3840
gcagcgtggc cagccagagc atcatcgcct acaccatgag cctgggcgcc gagaacagcg 3900
tggcctacag caacaacagc atcgccatcc ccaccaactt caccatcagc gtgaccaccg 3960
agatcctgcc cgtgagcatg accaagacca gcgtggactg caccatgtac atctgcggcg 4020
acagcaccga gtgcagcaac ctgctgctgc agtacggcag cttctgcacc cagctgaaca 4080
gggccctgac cggcatcgcc gtggagcagg acaagaacac ccaggaggtg ttcgcccagg 4140
tgaagcagat ctacaagacc ccccccatca aggacttcgg cggcttcaac ttcagccaga 4200
tcctgcccga ccccagcaag cccagcaaga ggagccccat cgaggacctg ctgttcaaca 4260
aggtgaccct ggccgacgcc ggcttcatca agcagtacgg cgactgcctg ggcgacatcg 4320
ccgccaggga cctgatctgc gcccagaagt tcaacggcct gaccgtgctg ccccccctgc 4380
tgaccgacga gatgatcgcc cagtacacca gcgccctgct ggccggcacc atcaccagcg 4440
gctggacctt cggcgccggc cccgccctgc agatcccctt ccccatgcag atggcctaca 4500
ggttcaacgg catcggcgtg acccagaacg tgctgtacga gaaccagaag ctgatcgcca 4560
accagttcaa cagcgccatc ggcaagatcc aggacagcct gagcagcacc cccagcgccc 4620
tgggcaagct gcaggacgtg gtgaaccaga acgcccaggc cctgaacacc ctggtgaagc 4680
agctgagcag caacttcggc gccatcagca gcgtgctgaa cgacatcctg agcaggctgg 4740
acccccccga ggccgaggtg cagatcgaca ggctgatcac cggcaggctg cagagcctgc 4800
agacctacgt gacccagcag ctgatcaggg ccgccgagat cagggccagc gccaacctgg 4860
ccgccaccaa gatgagcgag tgcgtgctgg gccagagcaa gagggtggac ttctgcggca 4920
agggctacca cctgatgagc ttcccccaga gcgcccccca cggcgtggtg ttcctgcacg 4980
tgacctacgt gcccgcccag gagaagaact tcaccaccgc ccccgccatc tgccacgacg 5040
gcaaggccca cttccccagg gagggcgtgt tcgtgagcaa cggcacccac tggttcgtga 5100
cccagaggaa cttctacgag ccccagatca tcaccaccga caacaccttc gtgagcggca 5160
actgcgacgt ggtgatcggc atcgtgaaca acaccgtgta cgaccccctg cagcccgagc 5220
tggacagctt caaggaggag ctggacaagt acttcaagaa ccacaccagc cccgacgtgg 5280
acctgggcga catcagcggc atcaacgcca gcgtggtgaa catccagaag gagatcgaca 5340
ggctgaacga ggtggccaag aacctgaacg agagcctgat cgacctgcag gagctgggca 5400
agtacgagca gtacatcaag tggccctggt acatctggct gggcttcatc gccggcctga 5460
tcgccatcgt gatggtgacc atcatgctgt gctgcatgac cagctgctgc agctgcctga 5520
agggctgctg cagctgcggc agctgctgca agttcgacga ggacgacagc gagcccgtgc 5580
tgaagggcgt gaagctgcac tacaccggaa gcggagccac gaacttctct ctgttaaagc 5640
aagcaggaga tgttgaagaa aaccccgggc ctgcccccac caaggtgacc ttcggcgacg 5700
acaccgtgat cgaggtgcag ggctacaaga gcgtgaacat caccttcgag ctggacgaga 5760
ggatcgacaa ggtgctgaac gagaagtgca gcgcctacac cgtggagctg ggcaccgagg 5820
tgaacgagtt cgcctgcgtg gtggccgacg ccgtgatcaa gaccctgcag cccgtgagcg 5880
agctgctgac ccccctgggc atcgacctgg acgagtggag catggccacc tactacctgt 5940
tcgacgagag cggcgagttc aagctggcca gccacatgta ctgcagcttc tacccccccg 6000
acgaggacga ggaggagggc gactgcgagg aggaggagtt cgagcccagc acccagtacg 6060
agtacggcac cgaggacgac taccagggca agcccctgga gttcggcgcc accagcgccg 6120
ccctgcagcc cgaggaggag caggaggagg actggctgga cgacgacagc cagcagaccg 6180
tgggccagca ggacggcagc gaggacaacc agaccaccac catccagacc atcgtggagg 6240
tgcagcccca gctggagatg gagctgaccc ccgtggtgca gaccatcgag gtgaacagct 6300
tcagcggcta cctgaagctg accgacaacg tgtacatcaa gaacgccgac atcgtggagg 6360
aggccaagaa ggtgaagccc accgtggtgg tgaacgccgc caacgtgtac ctgaagcacg 6420
gcggcggcgt ggccggcgcc ctgaacaagg ccaccaacaa cgccatgcag gtggagagcg 6480
acgactacat cgccaccaac ggccccctga aggtgggcgg cagctgcgtg ctgagcggcc 6540
acaacctggc caagcactgc ctgcacgtgg tgggccccaa cgtgaacaag ggcgaggaca 6600
tccagctgct gaagagcgcc tacgagaact tcaaccagca cgaggtgctg ctggcccccc 6660
tgctgagcgc cggcatcttc ggcgccgacc ccatccacag cctgagggtg tgcgtggaca 6720
ccgtgaggac caacgtgtac ctggccgtgt tcgacaagaa cctgtacgac aagctggtga 6780
gcagcttcct ggagatgaag agcgagaagc aggtggagca gaagatcgcc gagatcccca 6840
aggaggaggt gaagcccttc atcaccgaga gcaagcccag cgtggagcag aggaagcagg 6900
acgacaagaa gatcaaggcc tgcgtggagg aggtgaccac caccctggag gagaccaagt 6960
tcctgaccga gaacctgctg ctgtacatcg acatcaacgg caacctgcac cccgacagcg 7020
ccaccctggt gagcgacatc gacatcacct tcctgaagaa ggacgccccc tacatcgtgg 7080
gcgacgtggt gcaggagggc gtgctgaccg ccgtggtgat ccccaccaag aaggccggcg 7140
gcaccaccga gatgctggcc aaggccctga ggaaggtgcc caccgacaac tacatcacca 7200
cctaccccgg ccagggcctg aacggctaca ccgtggagga ggccaagacc gtgctgaaga 7260
agtgcaagag cgccttctac atcctgccca gcatcatcag caacgagaag caggagatcc 7320
tgggcaccgt gagctggaac ctgagggaga tgctggccca cgccgaggag accaggaagc 7380
tgatgcccgt gtgcgtggag accaaggcca tcgtgagcac catccagagg aagtacaagg 7440
gcatcaagat ccaggagggc gtggtggact acggcgccag gttctacttc tacaccagca 7500
agaccaccgt ggccagcctg atcaacaccc tgaacgacct gaacgagacc ctggtgacca 7560
tgcccctggg ctacgtgacc cacggcctga acctggagga ggccgccagg tacatgagga 7620
gcctgaaggt gcccgccacc gtgagcgtga gcagccccga cgccgtgacc gcctacaacg 7680
gctacctgac cagcagcagc aagacccccg aggagcactt catcgagacc atcagcctgg 7740
ccggcagcta caaggactgg agctacagcg gccagagcac ccagctgggc atcgagttcc 7800
tgaagagggg cgacaagagc gtgtactaca ccagcaaccc caccaccttc cacctggacg 7860
gcgaggtgat caccttcgac aacctgaaga ccctgctgag cctgagggag gtgaggacca 7920
tcaaggtgtt caccaccgtg gacaacatca acctgcactg actcgagctg gtactgcatg 7980
cacgcaatgc tagctgcccc tttcccgtcc tgggtacccc gagtctcccc cgacctcggg 8040
tcccaggtat gctcccacct ccacctgccc cactcaccac ctctgctagt tccagacacc 8100
tcccaagcac gcagcaatgc agctcaaaac gcttagccta gccacacccc cacgggaaac 8160
agcagtgatt aacctttagc aataaacgaa agtttaacta agctatacta accccagggt 8220
tggtcaattt cgtgccagcc acaccctgga gctagcaaaa aaaa 8264
<210> 145
<211> 6896
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthesized Vaccine Candidate 7
<400> 145
ctcgacattg attattgact agttattaat agtaatcaat tacggggtca ttagttcata 60
gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 120
ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag 180
ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac 240
atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg 300
cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg 360
tattagtcat cgctattacc atggtcgagg tgagccccac gttctgcttc actctcccca 420
tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta ttttgtgcag 480
cgatgggggc gggggggggg ggggggcgcg cgccaggcgg ggcggggcgg ggcgaggggc 540
ggggcggggc gaggcggaga ggtgcggcgg cagccaatca gagcggcgcg ctccgaaagt 600
ttccttttat ggcgaggcgg cggcggcggc ggccctataa aaagcgaagc gcgcggcggg 660
cgggagtcgc tgcgcgctgc cttcgccccg tgccccgctc cgccgccgcc tcgcgccgcc 720
cgccccggct ctgactgacc gcgttactcc cacaggtgag cgggcgggac ggcccttctc 780
ctccgggctg taattagcgc ttggtttaat gacggcttgt ttcttttctg tggctgcgtg 840
aaagccttga ggggctccgg gagggccctt tgtgcggggg gagcggctcg gggggtgcgt 900
gcgtgtgtgt gtgcgtgggg agcgccgcgt gcggctccgc gctgcccggc ggctgtgagc 960
gctgcgggcg cggcgcgggg ctttgtgcgc tccgcagtgt gcgcgagggg agcgcggccg 1020
ggggcggtgc cccgcggtgc ggggggggct gcgaggggaa caaaggctgc gtgcggggtg 1080
tgtgcgtggg ggggtgagca gggggtgtgg gcgcgtcggt cgggctgcaa ccccccctgc 1140
acccccctcc ccgagttgct gagcacggcc cggcttcggg tgcggggctc cgtacggggc 1200
gtggcgcggg gctcgccgtg ccgggcgggg ggtggcggca ggtgggggtg ccgggcgggg 1260
cggggccgcc tcgggccggg gagggctcgg gggaggggcg cggcggcccc cggagcgccg 1320
gcggctgtcg aggcgcggcg agccgcagcc attgcctttt atggtaatcg tgcgagaggg 1380
cgcagggact tcctttgtcc caaatctgtg cggagccgaa atctgggagg cgccgccgca 1440
ccccctctag cgggcgcggg gcgaagcggt gcggcgccgg caggaaggaa atgggcgggg 1500
agggccttcg tgcgtcgccg cgccgccgtc cccttctccc tctccagcct cggggctgtc 1560
cgcgggggga cggctgcctt cgggggggac ggggcagggc ggggttcggc ttctggcgtg 1620
tgaccggcgg ctctagagcc tctgctaacc atgttcatgc cttcttcttt ttcctacagc 1680
tcctgggcaa cgtgctggtt attgtgctgt ctcatcattt tggcaaagaa ttggagaata 1740
aactagtatt cttctggtcc ccacagactc agagagaacc cgccaccatg ttcgtgttcc 1800
tggtgctgct gcccctggtg agcagccagt gcgtgaacct gaccaccagg acccagctgc 1860
cccccgccta caccaacagc ttcaccaggg gcgtgtacta ccccgacaag gtgttcagga 1920
gcagcgtgct gcacagcacc caggacctgt tcctgccctt cttcagcaac gtgacctggt 1980
tccacgccat ccacgtgagc ggcaccaacg gcaccaagag gttcgacaac cccgtgctgc 2040
ccttcaacga cggcgtgtac ttcgccagca ccgagaagag caacatcatc aggggctgga 2100
tcttcggcac caccctggac agcaagaccc agagcctgct gatcgtgaac aacgccacca 2160
acgtggtgat caaggtgtgc gagttccagt tctgcaacga ccccttcctg ggcgtgtact 2220
accacaagaa caacaagagc tggatggaga gcgagttcag ggtgtacagc agcgccaaca 2280
actgcacctt cgagtacgtg agccagccct tcctgatgga cctggagggc aagcagggca 2340
acttcaagaa cctgagggag ttcgtgttca agaacatcga cggctacttc aagatctaca 2400
gcaagcacac ccccatcaac ctggtgaggg acctgcccca gggcttcagc gccctggagc 2460
ccctggtgga cctgcccatc ggcatcaaca tcaccaggtt ccagaccctg ctggccctgc 2520
acaggagcta cctgaccccc ggcgacagca gcagcggctg gaccgccggc gccgccgcct 2580
actacgtggg ctacctgcag cccaggacct tcctgctgaa gtacaacgag aacggcacca 2640
tcaccgacgc cgtggactgc gccctggacc ccctgagcga gaccaagtgc accctgaaga 2700
gcttcaccgt ggagaagggc atctaccaga ccagcaactt cagggtgcag cccaccgaga 2760
gcatcgtgag gttccccaac atcaccaacc tgtgcccctt cggcgaggtg ttcaacgcca 2820
ccaggttcgc cagcgtgtac gcctggaaca ggaagaggat cagcaactgc gtggccgact 2880
acagcgtgct gtacaacagc gccagcttca gcaccttcaa gtgctacggc gtgagcccca 2940
ccaagctgaa cgacctgtgc ttcaccaacg tgtacgccga cagcttcgtg atcaggggcg 3000
acgaggtgag gcagatcgcc cccggccaga ccggcaagat cgccgactac aactacaagc 3060
tgcccgacga cttcaccggc tgcgtgatcg cctggaacag caacaacctg gacagcaagg 3120
tgggcggcaa ctacaactac ctgtacaggc tgttcaggaa gagcaacctg aagcccttcg 3180
agagggacat cagcaccgag atctaccagg ccggcagcac cccctgcaac ggcgtggagg 3240
gcttcaactg ctacttcccc ctgcagagct acggcttcca gcccaccaac ggcgtgggct 3300
accagcccta cagggtggtg gtgctgagct tcgagctgct gcacgccccc gccaccgtgt 3360
gcggccccaa gaagagcacc aacctggtga agaacaagtg cgtgaacttc aacttcaacg 3420
gcctgaccgg caccggcgtg ctgaccgaga gcaacaagaa gttcctgccc ttccagcagt 3480
tcggcaggga catcgccgac accaccgacg ccgtgaggga cccccagacc ctggagatcc 3540
tggacatcac cccctgcagc ttcggcggcg tgagcgtgat cacccccggc accaacacca 3600
gcaaccaggt ggccgtgctg taccaggacg tgaactgcac cgaggtgccc gtggccatcc 3660
acgccgacca gctgaccccc acctggaggg tgtacagcac cggcagcaac gtgttccaga 3720
ccagggccgg ctgcctgatc ggcgccgagc acgtgaacaa cagctacgag tgcgacatcc 3780
ccatcggcgc cggcatctgc gccagctacc agacccagac caacagcccc ggcagcgcca 3840
gcagcgtggc cagccagagc atcatcgcct acaccatgag cctgggcgcc gagaacagcg 3900
tggcctacag caacaacagc atcgccatcc ccaccaactt caccatcagc gtgaccaccg 3960
agatcctgcc cgtgagcatg accaagacca gcgtggactg caccatgtac atctgcggcg 4020
acagcaccga gtgcagcaac ctgctgctgc agtacggcag cttctgcacc cagctgaaca 4080
gggccctgac cggcatcgcc gtggagcagg acaagaacac ccaggaggtg ttcgcccagg 4140
tgaagcagat ctacaagacc ccccccatca aggacttcgg cggcttcaac ttcagccaga 4200
tcctgcccga ccccagcaag cccagcaaga ggagccccat cgaggacctg ctgttcaaca 4260
aggtgaccct ggccgacgcc ggcttcatca agcagtacgg cgactgcctg ggcgacatcg 4320
ccgccaggga cctgatctgc gcccagaagt tcaacggcct gaccgtgctg ccccccctgc 4380
tgaccgacga gatgatcgcc cagtacacca gcgccctgct ggccggcacc atcaccagcg 4440
gctggacctt cggcgccggc cccgccctgc agatcccctt ccccatgcag atggcctaca 4500
ggttcaacgg catcggcgtg acccagaacg tgctgtacga gaaccagaag ctgatcgcca 4560
accagttcaa cagcgccatc ggcaagatcc aggacagcct gagcagcacc cccagcgccc 4620
tgggcaagct gcaggacgtg gtgaaccaga acgcccaggc cctgaacacc ctggtgaagc 4680
agctgagcag caacttcggc gccatcagca gcgtgctgaa cgacatcctg agcaggctgg 4740
acccccccga ggccgaggtg cagatcgaca ggctgatcac cggcaggctg cagagcctgc 4800
agacctacgt gacccagcag ctgatcaggg ccgccgagat cagggccagc gccaacctgg 4860
ccgccaccaa gatgagcgag tgcgtgctgg gccagagcaa gagggtggac ttctgcggca 4920
agggctacca cctgatgagc ttcccccaga gcgcccccca cggcgtggtg ttcctgcacg 4980
tgacctacgt gcccgcccag gagaagaact tcaccaccgc ccccgccatc tgccacgacg 5040
gcaaggccca cttccccagg gagggcgtgt tcgtgagcaa cggcacccac tggttcgtga 5100
cccagaggaa cttctacgag ccccagatca tcaccaccga caacaccttc gtgagcggca 5160
actgcgacgt ggtgatcggc atcgtgaaca acaccgtgta cgaccccctg cagcccgagc 5220
tggacagctt caaggaggag ctggacaagt acttcaagaa ccacaccagc cccgacgtgg 5280
acctgggcga catcagcggc atcaacgcca gcgtggtgaa catccagaag gagatcgaca 5340
ggctgaacga ggtggccaag aacctgaacg agagcctgat cgacctgcag gagctgggca 5400
agtacgagca gtacatcaag tggccctggt acatctggct gggcttcatc gccggcctga 5460
tcgccatcgt gatggtgacc atcatgctgt gctgcatgac cagctgctgc agctgcctga 5520
agggctgctg cagctgcggc agctgctgca agttcgacga ggacgacagc gagcccgtgc 5580
tgaagggcgt gaagctgcac tacaccggaa gcggagccac gaacttctct ctgttaaagc 5640
aagcaggaga tgttgaagaa aaccccgggc ctagcggctt caggaagatg gccttcccca 5700
gcggcaaggt ggagggctgc atggtgcagg tgacctgcgg caccaccacc ctgaacggcc 5760
tgtggctgga cgacgtggtg tactgcccca ggcacgtgat ctgcaccagc gaggacatgc 5820
tgaaccccaa ctacgaggac ctgctgatca ggaagagcaa ccacaacttc ctggtgcagg 5880
ccggcaacgt gcagctgagg gtgatcggcc acagcatgca gaactgcgtg ctgaagctga 5940
aggtggacac cgccaacccc aagaccccca agtacaagtt cgtgaggatc cagcccggcc 6000
agaccttcag cgtgctggcc tgctacaacg gcagccccag cggcgtgtac cagtgcgcca 6060
tgaggcccaa cttcaccatc aagggcagct tcctgaacgg cagctgcggc agcgtgggct 6120
tcaacatcga ctacgactgc gtgagcttct gctacatgca ccacatggag ctgcccaccg 6180
gcgtgcacgc cggcaccgac ctggagggca acttctacgg ccccttcgtg gacaggcaga 6240
ccgcccaggc cgccggcacc gacaccacca tcaccgtgaa cgtgctggcc tggctgtacg 6300
ccgccgtgat caacggcgac aggtggttcc tgaacaggtt caccaccacc ctgaacgact 6360
tcaacctggt ggccatgaag tacaactacg agcccctgac ccaggaccac gtggacatcc 6420
tgggccccct gagcgcccag accggcatcg ccgtgctgga catgtgcgcc agcctgaagg 6480
agctgctgca gaacggcatg aacggcagga ccatcctggg cagcgccctg ctggaggacg 6540
agttcacccc cttcgacgtg gtgaggcagt gcagcggcgt gaccttccag tgactcgagc 6600
tggtactgca tgcacgcaat gctagctgcc cctttcccgt cctgggtacc ccgagtctcc 6660
cccgacctcg ggtcccaggt atgctcccac ctccacctgc cccactcacc acctctgcta 6720
gttccagaca cctcccaagc acgcagcaat gcagctcaaa acgcttagcc tagccacacc 6780
cccacgggaa acagcagtga ttaaccttta gcaataaacg aaagtttaac taagctatac 6840
taaccccagg gttggtcaat ttcgtgccag ccacaccctg gagctagcaa aaaaaa 6896
<210> 146
<211> 8774
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthesized Vaccine Candidate 8
<400> 146
ctcgacattg attattgact agttattaat agtaatcaat tacggggtca ttagttcata 60
gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 120
ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag 180
ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac 240
atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg 300
cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg 360
tattagtcat cgctattacc atggtcgagg tgagccccac gttctgcttc actctcccca 420
tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta ttttgtgcag 480
cgatgggggc gggggggggg ggggggcgcg cgccaggcgg ggcggggcgg ggcgaggggc 540
ggggcggggc gaggcggaga ggtgcggcgg cagccaatca gagcggcgcg ctccgaaagt 600
ttccttttat ggcgaggcgg cggcggcggc ggccctataa aaagcgaagc gcgcggcggg 660
cgggagtcgc tgcgcgctgc cttcgccccg tgccccgctc cgccgccgcc tcgcgccgcc 720
cgccccggct ctgactgacc gcgttactcc cacaggtgag cgggcgggac ggcccttctc 780
ctccgggctg taattagcgc ttggtttaat gacggcttgt ttcttttctg tggctgcgtg 840
aaagccttga ggggctccgg gagggccctt tgtgcggggg gagcggctcg gggggtgcgt 900
gcgtgtgtgt gtgcgtgggg agcgccgcgt gcggctccgc gctgcccggc ggctgtgagc 960
gctgcgggcg cggcgcgggg ctttgtgcgc tccgcagtgt gcgcgagggg agcgcggccg 1020
ggggcggtgc cccgcggtgc ggggggggct gcgaggggaa caaaggctgc gtgcggggtg 1080
tgtgcgtggg ggggtgagca gggggtgtgg gcgcgtcggt cgggctgcaa ccccccctgc 1140
acccccctcc ccgagttgct gagcacggcc cggcttcggg tgcggggctc cgtacggggc 1200
gtggcgcggg gctcgccgtg ccgggcgggg ggtggcggca ggtgggggtg ccgggcgggg 1260
cggggccgcc tcgggccggg gagggctcgg gggaggggcg cggcggcccc cggagcgccg 1320
gcggctgtcg aggcgcggcg agccgcagcc attgcctttt atggtaatcg tgcgagaggg 1380
cgcagggact tcctttgtcc caaatctgtg cggagccgaa atctgggagg cgccgccgca 1440
ccccctctag cgggcgcggg gcgaagcggt gcggcgccgg caggaaggaa atgggcgggg 1500
agggccttcg tgcgtcgccg cgccgccgtc cccttctccc tctccagcct cggggctgtc 1560
cgcgggggga cggctgcctt cgggggggac ggggcagggc ggggttcggc ttctggcgtg 1620
tgaccggcgg ctctagagcc tctgctaacc atgttcatgc cttcttcttt ttcctacagc 1680
tcctgggcaa cgtgctggtt attgtgctgt ctcatcattt tggcaaagaa ttggagaata 1740
aactagtatt cttctggtcc ccacagactc agagagaacc cgccaccatg ttcgtgttcc 1800
tggtgctgct gcccctggtg agcagccagt gcgtgaacct gaccaccagg acccagctgc 1860
cccccgccta caccaacagc ttcaccaggg gcgtgtacta ccccgacaag gtgttcagga 1920
gcagcgtgct gcacagcacc caggacctgt tcctgccctt cttcagcaac gtgacctggt 1980
tccacgccat ccacgtgagc ggcaccaacg gcaccaagag gttcgacaac cccgtgctgc 2040
ccttcaacga cggcgtgtac ttcgccagca ccgagaagag caacatcatc aggggctgga 2100
tcttcggcac caccctggac agcaagaccc agagcctgct gatcgtgaac aacgccacca 2160
acgtggtgat caaggtgtgc gagttccagt tctgcaacga ccccttcctg ggcgtgtact 2220
accacaagaa caacaagagc tggatggaga gcgagttcag ggtgtacagc agcgccaaca 2280
actgcacctt cgagtacgtg agccagccct tcctgatgga cctggagggc aagcagggca 2340
acttcaagaa cctgagggag ttcgtgttca agaacatcga cggctacttc aagatctaca 2400
gcaagcacac ccccatcaac ctggtgaggg acctgcccca gggcttcagc gccctggagc 2460
ccctggtgga cctgcccatc ggcatcaaca tcaccaggtt ccagaccctg ctggccctgc 2520
acaggagcta cctgaccccc ggcgacagca gcagcggctg gaccgccggc gccgccgcct 2580
actacgtggg ctacctgcag cccaggacct tcctgctgaa gtacaacgag aacggcacca 2640
tcaccgacgc cgtggactgc gccctggacc ccctgagcga gaccaagtgc accctgaaga 2700
gcttcaccgt ggagaagggc atctaccaga ccagcaactt cagggtgcag cccaccgaga 2760
gcatcgtgag gttccccaac atcaccaacc tgtgcccctt cggcgaggtg ttcaacgcca 2820
ccaggttcgc cagcgtgtac gcctggaaca ggaagaggat cagcaactgc gtggccgact 2880
acagcgtgct gtacaacagc gccagcttca gcaccttcaa gtgctacggc gtgagcccca 2940
ccaagctgaa cgacctgtgc ttcaccaacg tgtacgccga cagcttcgtg atcaggggcg 3000
acgaggtgag gcagatcgcc cccggccaga ccggcaagat cgccgactac aactacaagc 3060
tgcccgacga cttcaccggc tgcgtgatcg cctggaacag caacaacctg gacagcaagg 3120
tgggcggcaa ctacaactac ctgtacaggc tgttcaggaa gagcaacctg aagcccttcg 3180
agagggacat cagcaccgag atctaccagg ccggcagcac cccctgcaac ggcgtggagg 3240
gcttcaactg ctacttcccc ctgcagagct acggcttcca gcccaccaac ggcgtgggct 3300
accagcccta cagggtggtg gtgctgagct tcgagctgct gcacgccccc gccaccgtgt 3360
gcggccccaa gaagagcacc aacctggtga agaacaagtg cgtgaacttc aacttcaacg 3420
gcctgaccgg caccggcgtg ctgaccgaga gcaacaagaa gttcctgccc ttccagcagt 3480
tcggcaggga catcgccgac accaccgacg ccgtgaggga cccccagacc ctggagatcc 3540
tggacatcac cccctgcagc ttcggcggcg tgagcgtgat cacccccggc accaacacca 3600
gcaaccaggt ggccgtgctg taccaggacg tgaactgcac cgaggtgccc gtggccatcc 3660
acgccgacca gctgaccccc acctggaggg tgtacagcac cggcagcaac gtgttccaga 3720
ccagggccgg ctgcctgatc ggcgccgagc acgtgaacaa cagctacgag tgcgacatcc 3780
ccatcggcgc cggcatctgc gccagctacc agacccagac caacagcccc ggcagcgcca 3840
gcagcgtggc cagccagagc atcatcgcct acaccatgag cctgggcgcc gagaacagcg 3900
tggcctacag caacaacagc atcgccatcc ccaccaactt caccatcagc gtgaccaccg 3960
agatcctgcc cgtgagcatg accaagacca gcgtggactg caccatgtac atctgcggcg 4020
acagcaccga gtgcagcaac ctgctgctgc agtacggcag cttctgcacc cagctgaaca 4080
gggccctgac cggcatcgcc gtggagcagg acaagaacac ccaggaggtg ttcgcccagg 4140
tgaagcagat ctacaagacc ccccccatca aggacttcgg cggcttcaac ttcagccaga 4200
tcctgcccga ccccagcaag cccagcaaga ggagccccat cgaggacctg ctgttcaaca 4260
aggtgaccct ggccgacgcc ggcttcatca agcagtacgg cgactgcctg ggcgacatcg 4320
ccgccaggga cctgatctgc gcccagaagt tcaacggcct gaccgtgctg ccccccctgc 4380
tgaccgacga gatgatcgcc cagtacacca gcgccctgct ggccggcacc atcaccagcg 4440
gctggacctt cggcgccggc cccgccctgc agatcccctt ccccatgcag atggcctaca 4500
ggttcaacgg catcggcgtg acccagaacg tgctgtacga gaaccagaag ctgatcgcca 4560
accagttcaa cagcgccatc ggcaagatcc aggacagcct gagcagcacc cccagcgccc 4620
tgggcaagct gcaggacgtg gtgaaccaga acgcccaggc cctgaacacc ctggtgaagc 4680
agctgagcag caacttcggc gccatcagca gcgtgctgaa cgacatcctg agcaggctgg 4740
acccccccga ggccgaggtg cagatcgaca ggctgatcac cggcaggctg cagagcctgc 4800
agacctacgt gacccagcag ctgatcaggg ccgccgagat cagggccagc gccaacctgg 4860
ccgccaccaa gatgagcgag tgcgtgctgg gccagagcaa gagggtggac ttctgcggca 4920
agggctacca cctgatgagc ttcccccaga gcgcccccca cggcgtggtg ttcctgcacg 4980
tgacctacgt gcccgcccag gagaagaact tcaccaccgc ccccgccatc tgccacgacg 5040
gcaaggccca cttccccagg gagggcgtgt tcgtgagcaa cggcacccac tggttcgtga 5100
cccagaggaa cttctacgag ccccagatca tcaccaccga caacaccttc gtgagcggca 5160
actgcgacgt ggtgatcggc atcgtgaaca acaccgtgta cgaccccctg cagcccgagc 5220
tggacagctt caaggaggag ctggacaagt acttcaagaa ccacaccagc cccgacgtgg 5280
acctgggcga catcagcggc atcaacgcca gcgtggtgaa catccagaag gagatcgaca 5340
ggctgaacga ggtggccaag aacctgaacg agagcctgat cgacctgcag gagctgggca 5400
agtacgagca gtacatcaag tggccctggt acatctggct gggcttcatc gccggcctga 5460
tcgccatcgt gatggtgacc atcatgctgt gctgcatgac cagctgctgc agctgcctga 5520
agggctgctg cagctgcggc agctgctgca agttcgacga ggacgacagc gagcccgtgc 5580
tgaagggcgt gaagctgcac tacaccggaa gcggagccac gaacttctct ctgttaaagc 5640
aagcaggaga tgttgaagaa aaccccgggc ctagcgccga cgcccagagc ttcctgaaca 5700
gggtgtgcgg cgtgagcgcc gccaggctga ccccctgcgg caccggcacc agcaccgacg 5760
tggtgtacag ggccttcgac atctacaacg acaaggtggc cggcttcgcc aagttcctga 5820
agaccaactg ctgcaggttc caggagaagg acgaggacga caacctgatc gacagctact 5880
tcgtggtgaa gaggcacacc ttcagcaact accagcacga ggagaccatc tacaacctgc 5940
tgaaggactg ccccgccgtg gccaagcacg acttcttcaa gttcaggatc gacggcgaca 6000
tggtgcccca catcagcagg cagaggctga ccaagtacac catggccgac ctggtgtacg 6060
ccctgaggca cttcgacgag ggcaactgcg acaccctgaa ggagatcctg gtgacctaca 6120
actgctgcga cgacgactac ttcaacaaga aggactggta cgacttcgtg gagaaccccg 6180
acatcctgag ggtgtacgcc aacctgggcg agagggtgag gcaggccctg ctgaagaccg 6240
tgcagttctg cgacgccatg aggaacgccg gcatcgtggg cgtgctgacc ctggacaacc 6300
aggacctgaa cggcaactgg tacgacttcg gcgacttcat ccagaccacc cccggcagcg 6360
gcgtgcccgt ggtggacagc tactacagcc tgctgatgcc catcctgacc ctgaccaggg 6420
ccctgaccgc cgagagccac gtggacaccg acctgaccaa gccctacatc aagtgggacc 6480
tgctgaagta cgacttcacc gaggagaggc tgaagctgtt cgacaggtac ttcaagtact 6540
gggaccagac ctaccacccc aactgcgtga actgcctgga cgacaggtgc atcctgcact 6600
gcgccaactt caacgtgctg ttcagcaccg tgttcccccc caccagcttc ggccccctgg 6660
tgaggaagat cttcgtggac ggcgtgccct tcgtggtgag caccggctac cacttcaggg 6720
agctgggcgt ggtgcacaac caggacgtga acctgcacag cagcaggctg agcttcaagg 6780
agctgctggt gtacgccgcc gaccccgcca tgcacgccgc cagcggcaac ctgctgctgg 6840
acaagaggac cacctgcttc agcgtggccg ccctgaccaa caacgtggcc ttccagaccg 6900
tgaagcccgg caacttcaac aaggacttct acgacttcgc cgtgagcaag ggcttcttca 6960
aggagggcag cagcgtggag ctgaagcact tcttcttcgc ccaggacggc aacgccgcca 7020
tcagcgacta cgactactac aggtacaacc tgcccaccat gtgcgacatc aggcagctgc 7080
tgttcgtggt ggaggtggtg gacaagtact tcgactgcta cgacggcggc tgcatcaacg 7140
ccaaccaggt gatcgtgaac aacctggaca agagcgccgg cttccccttc aacaagtggg 7200
gcaaggccag gctgtactac gacagcatga gctacgagga ccaggacgcc ctgttcgcct 7260
acaccaagag gaacgtgatc cccaccatca cccagatgaa cctgaagtac gccatcagcg 7320
ccaagaacag ggccaggacc gtggccggcg tgagcatctg cagcaccatg accaacaggc 7380
agttccacca gaagctgctg aagagcatcg ccgccaccag gggcgccacc gtggtgatcg 7440
gcaccagcaa gttctacggc ggctggcaca acatgctgaa gaccgtgtac agcgacgtgg 7500
agaaccccca cctgatgggc tgggactacc ccaagtgcga cagggccatg cccaacatgc 7560
tgaggatcat ggccagcctg gtgctggcca ggaagcacac cacctgctgc agcctgagcc 7620
acaggttcta caggctggcc aacgagtgcg cccaggtgct gagcgagatg gtgatgtgcg 7680
gcggcagcct gtacgtgaag cccggcggca ccagcagcgg cgacgccacc accgcctacg 7740
ccaacagcgt gttcaacatc tgccaggccg tgaccgccaa cgtgaacgcc ctgctgagca 7800
ccgacggcaa caagatcgcc gacaagtacg tgaggaacct gcagcacagg ctgtacgagt 7860
gcctgtacag gaacagggac gtggacaccg acttcgtgaa cgagttctac gcctacctga 7920
ggaagcactt cagcatgatg atcctgagcg acgacgccgt ggtgtgcttc aacagcacct 7980
acgccagcca gggcctggtg gccagcatca agaacttcaa gagcgtgctg tactaccaga 8040
acaacgtgtt catgagcgag gccaagtgct ggaccgagac cgacctgacc aagggccccc 8100
acgagttctg cagccagcac accatgctgg tgaagcaggg cgacgactac gtgtacctgc 8160
cctaccccga ccccagcagg atcctgggcg ccggctgctt cgtggacgac atcgtgaaga 8220
ccgacggcac cctgatgatc gagaggttcg tgagcctggc catcgacgcc taccccctga 8280
ccaagcaccc caaccaggag tacgccgacg tgttccacct gtacctgcag tacatcagga 8340
agctgcacga cgagctgacc ggccacatgc tggacatgta cagcgtgatg ctgaccaacg 8400
acaacaccag caggtactgg gagcccgagt tctacgaggc catgtacacc ccccacaccg 8460
tgctgcagtg actcgagctg gtactgcatg cacgcaatgc tagctgcccc tttcccgtcc 8520
tgggtacccc gagtctcccc cgacctcggg tcccaggtat gctcccacct ccacctgccc 8580
cactcaccac ctctgctagt tccagacacc tcccaagcac gcagcaatgc agctcaaaac 8640
gcttagccta gccacacccc cacgggaaac agcagtgatt aacctttagc aataaacgaa 8700
agtttaacta agctatacta accccagggt tggtcaattt cgtgccagcc acaccctgga 8760
gctagcaaaa aaaa 8774
<210> 147
<211> 6812
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthesized Vaccine Candidate 9
<400> 147
ctcgacattg attattgact agttattaat agtaatcaat tacggggtca ttagttcata 60
gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 120
ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag 180
ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac 240
atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg 300
cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg 360
tattagtcat cgctattacc atggtcgagg tgagccccac gttctgcttc actctcccca 420
tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta ttttgtgcag 480
cgatgggggc gggggggggg ggggggcgcg cgccaggcgg ggcggggcgg ggcgaggggc 540
ggggcggggc gaggcggaga ggtgcggcgg cagccaatca gagcggcgcg ctccgaaagt 600
ttccttttat ggcgaggcgg cggcggcggc ggccctataa aaagcgaagc gcgcggcggg 660
cgggagtcgc tgcgcgctgc cttcgccccg tgccccgctc cgccgccgcc tcgcgccgcc 720
cgccccggct ctgactgacc gcgttactcc cacaggtgag cgggcgggac ggcccttctc 780
ctccgggctg taattagcgc ttggtttaat gacggcttgt ttcttttctg tggctgcgtg 840
aaagccttga ggggctccgg gagggccctt tgtgcggggg gagcggctcg gggggtgcgt 900
gcgtgtgtgt gtgcgtgggg agcgccgcgt gcggctccgc gctgcccggc ggctgtgagc 960
gctgcgggcg cggcgcgggg ctttgtgcgc tccgcagtgt gcgcgagggg agcgcggccg 1020
ggggcggtgc cccgcggtgc ggggggggct gcgaggggaa caaaggctgc gtgcggggtg 1080
tgtgcgtggg ggggtgagca gggggtgtgg gcgcgtcggt cgggctgcaa ccccccctgc 1140
acccccctcc ccgagttgct gagcacggcc cggcttcggg tgcggggctc cgtacggggc 1200
gtggcgcggg gctcgccgtg ccgggcgggg ggtggcggca ggtgggggtg ccgggcgggg 1260
cggggccgcc tcgggccggg gagggctcgg gggaggggcg cggcggcccc cggagcgccg 1320
gcggctgtcg aggcgcggcg agccgcagcc attgcctttt atggtaatcg tgcgagaggg 1380
cgcagggact tcctttgtcc caaatctgtg cggagccgaa atctgggagg cgccgccgca 1440
ccccctctag cgggcgcggg gcgaagcggt gcggcgccgg caggaaggaa atgggcgggg 1500
agggccttcg tgcgtcgccg cgccgccgtc cccttctccc tctccagcct cggggctgtc 1560
cgcgggggga cggctgcctt cgggggggac ggggcagggc ggggttcggc ttctggcgtg 1620
tgaccggcgg ctctagagcc tctgctaacc atgttcatgc cttcttcttt ttcctacagc 1680
tcctgggcaa cgtgctggtt attgtgctgt ctcatcattt tggcaaagaa ttggagaata 1740
aactagtatt cttctggtcc ccacagactc agagagaacc cgccaccatg ttcgtgttcc 1800
tggtgctgct gcccctggtg agcagccagt gcgtgaacct gaccaccagg acccagctgc 1860
cccccgccta caccaacagc ttcaccaggg gcgtgtacta ccccgacaag gtgttcagga 1920
gcagcgtgct gcacagcacc caggacctgt tcctgccctt cttcagcaac gtgacctggt 1980
tccacgccat ccacgtgagc ggcaccaacg gcaccaagag gttcgacaac cccgtgctgc 2040
ccttcaacga cggcgtgtac ttcgccagca ccgagaagag caacatcatc aggggctgga 2100
tcttcggcac caccctggac agcaagaccc agagcctgct gatcgtgaac aacgccacca 2160
acgtggtgat caaggtgtgc gagttccagt tctgcaacga ccccttcctg ggcgtgtact 2220
accacaagaa caacaagagc tggatggaga gcgagttcag ggtgtacagc agcgccaaca 2280
actgcacctt cgagtacgtg agccagccct tcctgatgga cctggagggc aagcagggca 2340
acttcaagaa cctgagggag ttcgtgttca agaacatcga cggctacttc aagatctaca 2400
gcaagcacac ccccatcaac ctggtgaggg acctgcccca gggcttcagc gccctggagc 2460
ccctggtgga cctgcccatc ggcatcaaca tcaccaggtt ccagaccctg ctggccctgc 2520
acaggagcta cctgaccccc ggcgacagca gcagcggctg gaccgccggc gccgccgcct 2580
actacgtggg ctacctgcag cccaggacct tcctgctgaa gtacaacgag aacggcacca 2640
tcaccgacgc cgtggactgc gccctggacc ccctgagcga gaccaagtgc accctgaaga 2700
gcttcaccgt ggagaagggc atctaccaga ccagcaactt cagggtgcag cccaccgaga 2760
gcatcgtgag gttccccaac atcaccaacc tgtgcccctt cggcgaggtg ttcaacgcca 2820
ccaggttcgc cagcgtgtac gcctggaaca ggaagaggat cagcaactgc gtggccgact 2880
acagcgtgct gtacaacagc gccagcttca gcaccttcaa gtgctacggc gtgagcccca 2940
ccaagctgaa cgacctgtgc ttcaccaacg tgtacgccga cagcttcgtg atcaggggcg 3000
acgaggtgag gcagatcgcc cccggccaga ccggcaagat cgccgactac aactacaagc 3060
tgcccgacga cttcaccggc tgcgtgatcg cctggaacag caacaacctg gacagcaagg 3120
tgggcggcaa ctacaactac ctgtacaggc tgttcaggaa gagcaacctg aagcccttcg 3180
agagggacat cagcaccgag atctaccagg ccggcagcac cccctgcaac ggcgtggagg 3240
gcttcaactg ctacttcccc ctgcagagct acggcttcca gcccaccaac ggcgtgggct 3300
accagcccta cagggtggtg gtgctgagct tcgagctgct gcacgccccc gccaccgtgt 3360
gcggccccaa gaagagcacc aacctggtga agaacaagtg cgtgaacttc aacttcaacg 3420
gcctgaccgg caccggcgtg ctgaccgaga gcaacaagaa gttcctgccc ttccagcagt 3480
tcggcaggga catcgccgac accaccgacg ccgtgaggga cccccagacc ctggagatcc 3540
tggacatcac cccctgcagc ttcggcggcg tgagcgtgat cacccccggc accaacacca 3600
gcaaccaggt ggccgtgctg taccaggacg tgaactgcac cgaggtgccc gtggccatcc 3660
acgccgacca gctgaccccc acctggaggg tgtacagcac cggcagcaac gtgttccaga 3720
ccagggccgg ctgcctgatc ggcgccgagc acgtgaacaa cagctacgag tgcgacatcc 3780
ccatcggcgc cggcatctgc gccagctacc agacccagac caacagcccc ggcagcgcca 3840
gcagcgtggc cagccagagc atcatcgcct acaccatgag cctgggcgcc gagaacagcg 3900
tggcctacag caacaacagc atcgccatcc ccaccaactt caccatcagc gtgaccaccg 3960
agatcctgcc cgtgagcatg accaagacca gcgtggactg caccatgtac atctgcggcg 4020
acagcaccga gtgcagcaac ctgctgctgc agtacggcag cttctgcacc cagctgaaca 4080
gggccctgac cggcatcgcc gtggagcagg acaagaacac ccaggaggtg ttcgcccagg 4140
tgaagcagat ctacaagacc ccccccatca aggacttcgg cggcttcaac ttcagccaga 4200
tcctgcccga ccccagcaag cccagcaaga ggagccccat cgaggacctg ctgttcaaca 4260
aggtgaccct ggccgacgcc ggcttcatca agcagtacgg cgactgcctg ggcgacatcg 4320
ccgccaggga cctgatctgc gcccagaagt tcaacggcct gaccgtgctg ccccccctgc 4380
tgaccgacga gatgatcgcc cagtacacca gcgccctgct ggccggcacc atcaccagcg 4440
gctggacctt cggcgccggc cccgccctgc agatcccctt ccccatgcag atggcctaca 4500
ggttcaacgg catcggcgtg acccagaacg tgctgtacga gaaccagaag ctgatcgcca 4560
accagttcaa cagcgccatc ggcaagatcc aggacagcct gagcagcacc cccagcgccc 4620
tgggcaagct gcaggacgtg gtgaaccaga acgcccaggc cctgaacacc ctggtgaagc 4680
agctgagcag caacttcggc gccatcagca gcgtgctgaa cgacatcctg agcaggctgg 4740
acccccccga ggccgaggtg cagatcgaca ggctgatcac cggcaggctg cagagcctgc 4800
agacctacgt gacccagcag ctgatcaggg ccgccgagat cagggccagc gccaacctgg 4860
ccgccaccaa gatgagcgag tgcgtgctgg gccagagcaa gagggtggac ttctgcggca 4920
agggctacca cctgatgagc ttcccccaga gcgcccccca cggcgtggtg ttcctgcacg 4980
tgacctacgt gcccgcccag gagaagaact tcaccaccgc ccccgccatc tgccacgacg 5040
gcaaggccca cttccccagg gagggcgtgt tcgtgagcaa cggcacccac tggttcgtga 5100
cccagaggaa cttctacgag ccccagatca tcaccaccga caacaccttc gtgagcggca 5160
actgcgacgt ggtgatcggc atcgtgaaca acaccgtgta cgaccccctg cagcccgagc 5220
tggacagctt caaggaggag ctggacaagt acttcaagaa ccacaccagc cccgacgtgg 5280
acctgggcga catcagcggc atcaacgcca gcgtggtgaa catccagaag gagatcgaca 5340
ggctgaacga ggtggccaag aacctgaacg agagcctgat cgacctgcag gagctgggca 5400
agtacgagca gtacatcaag tggccctggt acatctggct gggcttcatc gccggcctga 5460
tcgccatcgt gatggtgacc atcatgctgt gctgcatgac cagctgctgc agctgcctga 5520
agggctgctg cagctgcggc agctgctgca agttcgacga ggacgacagc gagcccgtgc 5580
tgaagggcgt gaagctgcac tacaccggaa gcggagccac gaacttctct ctgttaaagc 5640
aagcaggaga tgttgaagaa aaccccgggc ctatgaacag gaaggtgacc gccatcgccc 5700
tggccgccat catctgggcc accgccgccc agggcttcct gatgttcaag cagggcaggt 5760
gcctgtgcat cggccccggc atgaaggccg tgaagatggc cgagatcgag aaggccagcg 5820
tgatctaccc cagcaacggc tgcgacaagg tggaggtgat cgtgaccatg aaggcccaca 5880
agaggcagag gtgcctggac cccaggagca agcaggccag gctgatcatg caggccatcg 5940
agaagaagaa cttcctgagg aggcagaaca tgtgaggaag cggagccacg aacttctctc 6000
tgttaaagca agcaggagat gttgaagaaa accccgggcc tatgttccac gtgagcttca 6060
ggtacatctt cggcatcccc cccctgatcc tggtgctgct gcccgtgacc agcagcgagt 6120
gccacatcaa ggacaaggag ggcaaggcct acgagagcgt gctgatgatc agcatcgacg 6180
agctggacaa gatgaccggc accgacagca actgccccaa caacgagccc aacttcttca 6240
ggaagcacgt gtgcgacgac accaaggagg ccgccttcct gaacagggcc gccaggaagc 6300
tgaagcagtt cctgaagatg aacatcagcg aggagttcaa cgtgcacctg ctgaccgtga 6360
gccagggcac ccagaccctg gtgaactgca ccagcaagga ggagaagaac gtgaaggagc 6420
agaagaagaa cgacgcctgc ttcctgaaga ggctgctgag ggagatcaag acctgctgga 6480
acaagatcct gaagggcagc atctgatgac tcgagctggt actgcatgca cgcaatgcta 6540
gctgcccctt tcccgtcctg ggtaccccga gtctcccccg acctcgggtc ccaggtatgc 6600
tcccacctcc acctgcccca ctcaccacct ctgctagttc cagacacctc ccaagcacgc 6660
agcaatgcag ctcaaaacgc ttagcctagc cacaccccca cgggaaacag cagtgattaa 6720
cctttagcaa taaacgaaag tttaactaag ctatactaac cccagggttg gtcaatttcg 6780
tgccagccac accctggagc tagcaaaaaa aa 6812
<210> 148
<211> 3947
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthesized Spike glycoprotein with 6 stabilizing mutations
<400> 148
atgttcgtgt tcctggtgct gctgcccctg gtgagcagcc agtgcgtgaa cctgaccacc 60
cggacccagc tgccaccagc ctacaccaac agcttcaccc ggggcgtcta ctaccccgac 120
aaggtgttcc ggagcagcgt cctgcacagc acccaggacc tgttcctgcc cttcttcagc 180
aacgtgacct ggttccacgc catccacgtg agcggcacca acggcaccaa gcggttcgac 240
aaccccgtgc tgcccttcaa cgacggcgtg tacttcgcca gcaccgagaa gagcaacatc 300
atccggggct ggatcttcgg caccaccctg gacagcaaga cccagagcct gctgatcgtg 360
aataacgcca ccaacgtggt gatcaaggtg tgcgagttcc agttctgcaa cgaccccttc 420
ctgggcgtgt actaccacaa gaacaacaag agctggatgg agagcgagtt ccgggtgtac 480
agcagcgcca acaactgcac cttcgagtac gtgagccagc ccttcctgat ggacctggag 540
ggcaagcagg gcaacttcaa gaacctgcgg gagttcgtgt tcaagaacat cgacggctac 600
ttcaagatct acagcaagca caccccaatc aacctggtgc gggatctgcc ccagggcttc 660
tcagccctgg agcccctggt ggacctgccc atcggcatca acatcacccg gttccagacc 720
ctgctggccc tgcaccggag ctacctgacc ccaggcgaca gcagcagcgg gtggacagca 780
ggcgcggctg cttactacgt gggctacctg cagccccgga ccttcctgct gaagtacaac 840
gagaacggca ccatcaccga cgccgtggac tgcgccctgg accctctgag cgagaccaag 900
tgcaccctga agagcttcac cgtggagaag ggcatctacc agaccagcaa cttccgggtg 960
cagcccaccg agagcatcgt gcggttcccc aacatcacca acctgtgccc cttcggcgag 1020
gtgttcaacg ccacccggtt cgccagcgtg tacgcctgga accggaagcg gatcagcaac 1080
tgcgtggccg actacagcgt gctgtacaac agcgccagct tcagcacctt caagtgctac 1140
ggcgtgagcc ccaccaagct gaacgacctg tgcttcacca acgtgtacgc cgacagcttc 1200
gtgatccgtg gcgacgaggt gcggcagatc gcacccggcc agacaggcaa gatcgccgac 1260
tacaactaca agctgcccga cgacttcacc ggctgcgtga tcgcctggaa cagcaacaac 1320
ctcgacagca aggtgggcgg caactacaac tacctgtacc ggctgttccg gaagagcaac 1380
ctgaagccct tcgagcggga catcagcacc gagatctacc aagccggctc caccccttgc 1440
aacggcgtgg agggcttcaa ctgctacttc cctctgcaga gctacggctt ccagcccacc 1500
aacggcgtgg gctaccagcc ctaccgggtg gtggtgctga gcttcgagct gctgcacgcc 1560
ccagccaccg tgtgtggccc caagaagagc accaacctgg tgaagaacaa gtgcgtgaac 1620
ttcaacttca acggccttac cggcaccggc gtgctgaccg agagcaacaa gaaattcctg 1680
ccctttcagc agttcggccg ggacatcgcc gacaccaccg acgctgtgcg ggatccccag 1740
accctggaga tcctggacat caccccttgc agcttcggcg gcgtgagcgt gatcacccca 1800
ggcaccaaca ccagcaacca ggtggccgtg ctgtaccagg acgtgaactg caccgaggtg 1860
cccgtggcca tccacgccga ccagctgaca cccacctggc gggtctacag caccggcagc 1920
aacgtgttcc agacccgggc cggttgcctg atcggcgccg agcacgtgaa caacagctac 1980
gagtgcgaca tccccatcgg cgccggcatc tgtgccagct accagaccca gaccaattca 2040
cccggcagcg ccagcagcgt ggccagccag agcatcatcg cctacaccat gagcctgggc 2100
gccgagaaca gcgtggccta cagcaacaac agcatcgcca tccccaccaa cttcaccatc 2160
agcgtgacca ccgagattct gcccgtgagc atgaccaaga ccagcgtgga ctgcaccatg 2220
tacatctgcg gcgacagcac cgagtgcagc aacctgctgc tgcagtacgg cagcttctgc 2280
acccagctga accgggccct gaccggcatc gccgtggagc aggacaagaa cacccaggag 2340
gtgttcgccc aggtgaagca gatctacaag acccctccca tcaaggactt cggcggcttc 2400
aacttcagcc agatcctgcc cgaccccagc aagcccagca agcggagccc catcgaggac 2460
ctgctgttca acaaggtgac cctagccgac gccggcttca tcaagcagta cggcgactgc 2520
ctcggcgaca tagccgcccg ggacctgatc tgcgcccaga agttcaacgg cctgaccgtg 2580
ctgcctcccc tgctgaccga cgagatgatc gcccagtaca ccagcgccct gttagccgga 2640
accatcacca gcggctggac tttcggcgct ggccccgctc tgcagatccc cttccccatg 2700
cagatggcct accggttcaa cggcatcggc gtgacccaga acgtgctgta cgagaaccag 2760
aagctgatcg ccaaccagtt caacagcgcc atcggcaaga tccaggacag cctgagcagc 2820
acccctagcg ccctgggcaa gctgcaggac gtggtgaacc agaacgccca ggccctgaac 2880
accctggtga agcagctgag cagcaacttc ggcgccatca gcagcgtgct gaacgacatc 2940
ctgagccggc tggaccctcc cgaggccgag gtgcagatcg accggctgat cactggccgg 3000
ctgcagagcc tgcagaccta cgtgacccag cagctgatcc gggccgccga gattcgggcc 3060
agcgccaacc tggccgccac caagatgagc gagtgcgtgc tgggccagag caagcgggtg 3120
gacttctgcg gcaagggcta ccacctgatg agctttcccc agagcgcacc ccacggagtg 3180
gtgttcctgc acgtgaccta cgtgcccgcc caggagaaga acttcaccac cgccccagcc 3240
atctgccacg acggcaaggc ccactttccc cgggagggcg tgttcgtgag caacggcacc 3300
cactggttcg tgacccagcg gaacttctac gagccccaga tcatcaccac cgacaacacc 3360
ttcgtgagcg gcaactgcga cgtggtgatc ggcatcgtga acaacaccgt gtacgatccc 3420
ctgcagcccg agctggacag cttcaaggag gagctggaca agtacttcaa gaatcacacc 3480
agccccgacg tggacctggg cgacatcagc ggcatcaacg ccagcgtggt gaacatccag 3540
aaggagatcg atcggctgaa cgaggtggcc aagaacctga acgagagcct gatcgacctg 3600
caggagctgg gcaagtacga gcagtacatc aagtggccct ggtacatctg gctgggcttc 3660
atcgccggcc tgatcgccat cgtgatggtg accatcatgc tgtgctgcat gaccagctgc 3720
tgcagctgcc tgaagggctg ttgcagctgc ggcagctgct gcaagttcga cgaggacgac 3780
agcgagcccg tgctgaaggg cgtgaagctg cactacacct gataataggc tggagcctcg 3840
gtggcctagc ttcttgcccc ttgggcctcc ccccagcccc tcctcccctt cctgcacccg 3900
tacccccgtg gtctttgaat aaagtctgag tgggcggcaa aaaaaaa 3947
<210> 149
<211> 3947
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthesized Spike glycoprotein with one stabilizing mutations
<400> 149
atgttcgtgt tcctggtgct gctgcccctg gtgagcagcc agtgcgtgaa cctgaccacc 60
cggacccagc tgccaccagc ctacaccaac agcttcaccc ggggcgtcta ctaccccgac 120
aaggtgttcc ggagcagcgt cctgcacagc acccaggacc tgttcctgcc cttcttcagc 180
aacgtgacct ggttccacgc catccacgtg agcggcacca acggcaccaa gcggttcgac 240
aaccccgtgc tgcccttcaa cgacggcgtg tacttcgcca gcaccgagaa gagcaacatc 300
atccggggct ggatcttcgg caccaccctg gacagcaaga cccagagcct gctgatcgtg 360
aataacgcca ccaacgtggt gatcaaggtg tgcgagttcc agttctgcaa cgaccccttc 420
ctgggcgtgt actaccacaa gaacaacaag agctggatgg agagcgagtt ccgggtgtac 480
agcagcgcca acaactgcac cttcgagtac gtgagccagc ccttcctgat ggacctggag 540
ggcaagcagg gcaacttcaa gaacctgcgg gagttcgtgt tcaagaacat cgacggctac 600
ttcaagatct acagcaagca caccccaatc aacctggtgc gggatctgcc ccagggcttc 660
tcagccctgg agcccctggt ggacctgccc atcggcatca acatcacccg gttccagacc 720
ctgctggccc tgcaccggag ctacctgacc ccaggcgaca gcagcagcgg gtggacagca 780
ggcgcggctg cttactacgt gggctacctg cagccccgga ccttcctgct gaagtacaac 840
gagaacggca ccatcaccga cgccgtggac tgcgccctgg accctctgag cgagaccaag 900
tgcaccctga agagcttcac cgtggagaag ggcatctacc agaccagcaa cttccgggtg 960
cagcccaccg agagcatcgt gcggttcccc aacatcacca acctgtgccc cttcggcgag 1020
gtgttcaacg ccacccggtt cgccagcgtg tacgcctgga accggaagcg gatcagcaac 1080
tgcgtggccg actacagcgt gctgtacaac agcgccagct tcagcacctt caagtgctac 1140
ggcgtgagcc ccaccaagct gaacgacctg tgcttcacca acgtgtacgc cgacagcttc 1200
gtgatccgtg gcgacgaggt gcggcagatc gcacccggcc agacaggcaa gatcgccgac 1260
tacaactaca agctgcccga cgacttcacc ggctgcgtga tcgcctggaa cagcaacaac 1320
ctcgacagca aggtgggcgg caactacaac tacctgtacc ggctgttccg gaagagcaac 1380
ctgaagccct tcgagcggga catcagcacc gagatctacc aagccggctc caccccttgc 1440
aacggcgtgg agggcttcaa ctgctacttc cctctgcaga gctacggctt ccagcccacc 1500
aacggcgtgg gctaccagcc ctaccgggtg gtggtgctga gcttcgagct gctgcacgcc 1560
ccagccaccg tgtgtggccc caagaagagc accaacctgg tgaagaacaa gtgcgtgaac 1620
ttcaacttca acggccttac cggcaccggc gtgctgaccg agagcaacaa gaaattcctg 1680
ccctttcagc agttcggccg ggacatcgcc gacaccaccg acgctgtgcg ggatccccag 1740
accctggaga tcctggacat caccccttgc agcttcggcg gcgtgagcgt gatcacccca 1800
ggcaccaaca ccagcaacca ggtggccgtg ctgtaccagg acgtgaactg caccgaggtg 1860
cccgtggcca tccacgccga ccagctgaca cccacctggc gggtctacag caccggcagc 1920
aacgtgttcc agacccgggc cggttgcctg atcggcgccg agcacgtgaa caacagctac 1980
gagtgcgaca tccccatcgg cgccggcatc tgtgccagct accagaccca gaccaattca 2040
cccggcagcg ccagcagcgt ggccagccag agcatcatcg cctacaccat gagcctgggc 2100
gccgagaaca gcgtggccta cagcaacaac agcatcgcca tccccaccaa cttcaccatc 2160
agcgtgacca ccgagattct gcccgtgagc atgaccaaga ccagcgtgga ctgcaccatg 2220
tacatctgcg gcgacagcac cgagtgcagc aacctgctgc tgcagtacgg cagcttctgc 2280
acccagctga accgggccct gaccggcatc gccgtggagc aggacaagaa cacccaggag 2340
gtgttcgccc aggtgaagca gatctacaag acccctccca tcaaggactt cggcggcttc 2400
aacttcagcc agatcctgcc cgaccccagc aagcccagca agcggagccc catcgaggac 2460
ctgctgttca acaaggtgac cctagccgac gccggcttca tcaagcagta cggcgactgc 2520
ctcggcgaca tagccgcccg ggacctgatc tgcgcccaga agttcaacgg cctgaccgtg 2580
ctgcctcccc tgctgaccga cgagatgatc gcccagtaca ccagcgccct gttagccgga 2640
accatcacca gcggctggac tttcggcgct ggccccgctc tgcagatccc cttccccatg 2700
cagatggcct accggttcaa cggcatcggc gtgacccaga acgtgctgta cgagaaccag 2760
aagctgatcg ccaaccagtt caacagcgcc atcggcaaga tccaggacag cctgagcagc 2820
acccctagcg ccctgggcaa gctgcaggac gtggtgaacc agaacgccca ggccctgaac 2880
accctggtga agcagctgag cagcaacttc ggcgccatca gcagcgtgct gaacgacatc 2940
ctgagccggc tggaccctcc cgaggccgag gtgcagatcg accggctgat cactggccgg 3000
ctgcagagcc tgcagaccta cgtgacccag cagctgatcc gggccgccga gattcgggcc 3060
agcgccaacc tggccgccac caagatgagc gagtgcgtgc tgggccagag caagcgggtg 3120
gacttctgcg gcaagggcta ccacctgatg agctttcccc agagcgcacc ccacggagtg 3180
gtgttcctgc acgtgaccta cgtgcccgcc caggagaaga acttcaccac cgccccagcc 3240
atctgccacg acggcaaggc ccactttccc cgggagggcg tgttcgtgag caacggcacc 3300
cactggttcg tgacccagcg gaacttctac gagccccaga tcatcaccac cgacaacacc 3360
ttcgtgagcg gcaactgcga cgtggtgatc ggcatcgtga acaacaccgt gtacgatccc 3420
ctgcagcccg agctggacag cttcaaggag gagctggaca agtacttcaa gaatcacacc 3480
agccccgacg tggacctggg cgacatcagc ggcatcaacg ccagcgtggt gaacatccag 3540
aaggagatcg atcggctgaa cgaggtggcc aagaacctga acgagagcct gatcgacctg 3600
caggagctgg gcaagtacga gcagtacatc aagtggccct ggtacatctg gctgggcttc 3660
atcgccggcc tgatcgccat cgtgatggtg accatcatgc tgtgctgcat gaccagctgc 3720
tgcagctgcc tgaagggctg ttgcagctgc ggcagctgct gcaagttcga cgaggacgac 3780
agcgagcccg tgctgaaggg cgtgaagctg cactacacct gataataggc tggagcctcg 3840
gtggcctagc ttcttgcccc ttgggcctcc ccccagcccc tcctcccctt cctgcacccg 3900
tacccccgtg gtctttgaat aaagtctgag tgggcggcaa aaaaaaa 3947
<210> 150
<211> 1257
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleocaspid protein from SARS-CoV-2
<400> 150
atgagcgaca acggccccca gaaccagagg aacgccccca ggatcacctt cggcggcccc 60
agcgacagca ccggcagcaa ccagaacggc gagaggagcg gcgccaggag caagcagagg 120
aggccccagg gcctgcccaa caacaccgcc agctggttca ccgccctgac ccagcacggc 180
aaggaggacc tgaagttccc caggggccag ggcgtgccca tcaacaccaa cagcagcccc 240
gacgaccaga tcggctacta caggagggcc accaggagga tcaggggcgg cgacggcaag 300
atgaaggacc tgagccccag gtggtacttc tactacctgg gcaccggccc cgaggccggc 360
ctgccctacg gcgccaacaa ggacggcatc atctgggtgg ccaccgaggg cgccctgaac 420
acccccaagg accacatcgg caccaggaac cccgccaaca acgccgccat cgtgctgcag 480
ctgccccagg gcaccaccct gcccaagggc ttctacgccg agggcagcag gggcggcagc 540
caggccagca gcaggagcag cagcaggagc aggaacagca gcaggaacag cacccccggc 600
agcagcaggg gcaccagccc cgccaggatg gccggcaacg gcggcgacgc cgccctggcc 660
ctgctgctgc tggacaggct gaaccagctg gagagcaaga tgagcggcaa gggccagcag 720
cagcagggcc agaccgtgac caagaagagc gccgccgagg ccagcaagaa gcccaggcag 780
aagaggaccg ccaccaaggc ctacaacgtg acccaggcct tcggcaggag gggccccgag 840
cagacccagg gcaacttcgg cgaccaggag ctgatcaggc agggcaccga ctacaagcac 900
tggccccaga tcgcccagtt cgcccccagc gccagcgcct tcttcggcat gagcaggatc 960
ggcatggagg tgacccccag cggcacctgg ctgacctaca ccggcgccat caagctggac 1020
gacaaggacc ccaacttcaa ggaccaggtg atcctgctga acaagcacat cgacgcctac 1080
aagaccttcc cccccaccga gcccaagaag gacaagaaga agaaggccga cgagacccag 1140
gccctgcccc agaggcagaa gaagcagcag accgtgaccc tgctgcccgc cgccgacctg 1200
gacgacttca gcaagcagct gcagcagagc atgagcagcg ccgacagcac ccaggcc 1257
<210> 151
<211> 3685
<212> DNA
<213> Artificial Sequence
<220>
<223> ORF1ab protein (non-annotated) from SARS-CoV-2
<400> 151
caaaccactg aaacagcwca ctcttgtaat gttaaccgct ttaatgtggc tattacaaga 60
gcaaaaattg gcattttgtg cataatgtct gacagagatc tttatgacaa gctgcaattc 120
acaagtctag aagtaccgcg tcgtaacgtg gctacattac aagcggaaaa tgtaactgga 180
ctctttaagg actgtagtaa gatcataact ggtcttcatc ctacacaagc acctacacac 240
cttagtgttg atacaaaatt caagactgag ggactatgtg ttgacatacc aggcatwccw 300
aaggacatga cctatmgwag actcatctcy atgatgggtt tcaaaatgaa ttaycaagtt 360
aatggttacc ctaayatgtt yatcacccgy gargaagcca tmmgmcaygt wcgtgcatgg 420
attggctttg atgtagaggg ktgtcatgct actagggatg ctgtcggtac taacctacct 480
ctccagttag gattttctac aggtgttaac ttagtagctg taccaactgg ctatgttgac 540
actgaaaaca atacagaatt caccagagtt aatgcaaaac ctccaccagg tgaccaattt 600
aaacatctta taccacttat gtacaaaggt ttaccctgga acatagtgcg tatcaagata 660
gtacaaatgc tcagtgatac actgaaagga ttatcrgaca gagttgtgtt tgtcctatgg 720
gcacatggct ttgaacttac atcaatgaag tactttgtca agattggacc tgaaagaacg 780
tgttgtctgt gtgacaaacg tgcaacttgt ttttctactt catcagacaa ttatgcctgc 840
tggaaccatt ctgtgggttt tgactatgtc tataatccat ttatgattga tgtccagcag 900
tggggtttta caggtaacct tcagagtaat cacgatcagc attgccaagt gcatggcaac 960
gctcatgtgg ctagttgtga tgctatcatg actagatgtt tagcagtcca tgagtgcttt 1020
gttaagcgcg ttgactggtc tgttgagtac ccaattatag gtgatgaact gaagatcaat 1080
gccgcatgca gaaaagtgca acatatggtt gtaaagtctg cattgcttgc tgacaaattc 1140
ccagttcttc atgacattgg aaacccaaag gctatcaaat gtgtcccrca ggctgaagtg 1200
gattggaagt tctatgatgc tcagccctgc agtgacaaag cttataaaat aaaagaactc 1260
ttctattctt atgctacaca tcatgataaa ttcattgatg gtgtttgttt attttggaat 1320
tgtaacgttg atcgttaccc tgccaatgct attgtrtgca ggttcgacac gagagtcttg 1380
tcaaatttga acttgccagg ttgtgatggt ggtagtttgt atgtaaataa gcatgcattc 1440
cacactccag cttttgataa aagtgcattt actaatttaa agcaattgcc tttcttttat 1500
tactctgaca gtccctgtga gtcacatggc aagcaggttg tttctgacat tgattatgta 1560
ccactcaaat ctgctacrtg tataacacga tgcaatttgg grggtgctgt ttgcagacat 1620
catgcaaatg agtaccgaca gtacttggat gcatacaata tgatgatttc tgctggcttt 1680
agcctctgga tttacaaaca gtttgacact tataacctgt ggaacacctt taccaggtta 1740
cagagtttag aaaatgtggc ttacaatgtt gttaacaaag gacacttcga tggacaagct 1800
ggtgaagcac ctgtttccgt cattaataat gttgtttaca caaaggtaga tggtgttgat 1860
gtagagatct ttgaaaacaa gacaacactt cctgttaatg ttgcatttga gctttgggct 1920
aagcgtaaca ttaaaccagt gccagagatt aagatactca ataatttggg tgtcgatatc 1980
gctgctaata ctgtaatctg ggactacaag agagaagcac cagcacatat gtcaacaata 2040
ggtgtctgca caatgactga cattgccaag aaacctactg agagtgcttg ttcctcgctt 2100
actgtcttat ttgatggtag agtggaagga caggtagacc tttttagaaa tgcccgtaat 2160
ggtgttttaa taacagaagg ttcagttaaa ggtttaatac cttcaaaggg accagcacaa 2220
gctagtgtca atggagtcac attaattgga gaatcagtaa aaacacagtt taattatttt 2280
aagaaagtag atggcatcat tcaacagttg cctgaaacct actttactca gagccgagac 2340
ttagaggatt tcaagcccag atcacaaatg gaaactgact ttcttgagct cgctatggat 2400
gaattcatac aacggtacaa gcttgaaggc tatgccttcg aacatatcgt ttatggagat 2460
tttagtcatg gacagcttgg tggacttcat ctaatgattg gtctagctaa gcgctcacaa 2520
gattcaccac ttaaattaga ggattttatc cctacggaca gtacagtgaa aaattatttc 2580
ataacagatg cgcaaacagg ttcatcaaaa tgcgtgtgct ctgttattga tcttctgctt 2640
gatgactttg ttgagataat aaagtcacaa gatttatcag tggtttcaaa ggtggtcaaa 2700
gtcacaattg actatgctga aatttcattc atgttatggt gtaaggatgg acatgttgaa 2760
accttttacc caaaattaca agcgagtcag gcgtggcaac caggagttgc aatgcctaac 2820
ttgtataaga tgcagagaat gcttcttgaa aaatgtgacc ttcagaatta tggtgaaaat 2880
gctgtcatac caaarggaat aatgatgaat gtcgcaaaat atactcaact gtgtcaatat 2940
ttaaatacac tyacattagc ygtgccatat aatatgagag ttatccattt tggtgctggc 3000
tcrgacaaag gagttgcacc cggcacagct gttctcagac agtggttgcc aattggcaca 3060
ctacttgttg attcagatct taacgacttc gtctctgacg ctgattccac tctaattgga 3120
gactgtgcaa ccgtacatac agctaacaaa tgggatctca ttattagcga tatgtatgat 3180
cctaaaacca aacacgtgac aaaggaaaat gattcaaaag aaggattttt cacttacctg 3240
tgtggattta ttaaacaaaa attagccctg ggaggctctg tggctgtaaa gataactgag 3300
cattcttgga atgcggatct ctacaagctc atgggacatt tctcatggtg gacagctttt 3360
gttacaaatg ttaatgcatc ttcatcagaa gcatttttaa ttggagttaa ctatcttggt 3420
aagccaaaag aacaaattga tggttacacc atgcatgcta actacatttt ctggaggaat 3480
acaaacccga ttcaattgtc ttcctattca ctttttgaca tgagtaagtt ccctcttaaa 3540
ttaaggggaa cagctgtcat gtctttaaag gagaaccaaa tcaatgaaat gatttattct 3600
ctacttgaaa aaggcagact tatcattagg gaaaacaaca gagttgttgt ctcaagtgat 3660
gttcttgtta ataactaaac gaaca 3685
<210> 152
<211> 825
<212> DNA
<213> Artificial Sequence
<220>
<223> ORF3a protein from SARS-CoV-2
<400> 152
atggacctgt tcatgaggat cttcaccatc ggcaccgtga ccctgaagca gggcgagatc 60
aaggacgcca cccccagcga cttcgtgagg gccaccgcca ccatccccat ccaggccagc 120
ctgcccttcg gctggctgat cgtgggcgtg gccctgctgg ccgtgttcca gagcgccagc 180
aagatcatca ccctgaagaa gaggtggcag ctggccctga gcaagggcgt gcacttcgtg 240
tgcaacctgc tgctgctgtt cgtgaccgtg tacagccacc tgctgctggt ggccgccggc 300
ctggaggccc ccttcctgta cctgtacgcc ctggtgtact tcctgcagag catcaacttc 360
gtgaggatca tcatgaggct gtggctgtgc tggaagtgca ggagcaagaa ccccctgctg 420
tacgacgcca actacttcct gtgctggcac accaactgct acgactactg catcccctac 480
aacagcgtga ccagcagcat cgtgatcacc agcggcgacg gcaccaccag ccccatcagc 540
gagcacgact accagatcgg cggctacacc gagaagtggg agagcggcgt gaaggactgc 600
gtggtgctgc acagctactt caccagcgac tactaccagc tgtacagcac ccagctgagc 660
accgacaccg gcgtggagca cgtgaccttc ttcatctaca acaagatcgt ggacgagccc 720
gaggagcacg tgcagatcca caccatcgac ggcagcagcg gcgtggtgaa ccccgtgatg 780
gagcccatct acgacgagcc caccaccacc accagcgtgc ccctg 825
<210> 153
<211> 225
<212> DNA
<213> Artificial Sequence
<220>
<223> Envelope Protein from SARS-CoV-2
<400> 153
atgtacagct tcgtgagcga ggagaccggc accctgatcg tgaacagcgt gctgctgttc 60
ctggccttcg tggtgttcct gctggtgacc ctggccatcc tgaccgccct gaggctgtgc 120
gcctactgct gcaacatcgt gaacgtgagc ctggtgaagc ccagcttcta cgtgtacagc 180
agggtgaaga acctgaacag cagcagggtg cccgacctgc tggtg 225
<210> 154
<211> 666
<212> DNA
<213> Artificial Sequence
<220>
<223> Membrane protein from SARS-CoV-2
<400> 154
atggccgaca gcaacggcac catcaccgtg gaggagctga agaagctgct ggagcagtgg 60
aacctggtga tcggcttcct gttcctgacc tggatctgcc tgctgcagtt cgcctacgcc 120
aacaggaaca ggttcctgta catcatcaag ctgatcttcc tgtggctgct gtggcccgtg 180
accctggcct gcttcgtgct ggccgccgtg tacaggatca actggatcac cggcggcatc 240
gccatcgcca tggcctgcct ggtgggcctg atgtggctga gctacttcat cgccagcttc 300
aggctgttcg ccaggaccag gagcatgtgg agcttcaacc ccgagaccaa catcctgctg 360
aacgtgcccc tgcacggcac catcctgacc aggcccctgc tggagagcga gctggtgatc 420
ggcgccgtga tcctgagggg ccacctgagg atcgccggcc accacctggg caggtgcgac 480
atcaaggacc tgcccaagga gatcaccgtg gccaccagca ggaccctgag ctactacaag 540
ctgggcgcca gccagagggt ggccggcgac agcggcttcg ccgcctacag caggtacagg 600
atcggcaact acaagctgaa caccgaccac agcagcagca gcgacaacat cgccctgctg 660
gtgcag 666
<210> 155
<211> 183
<212> DNA
<213> Artificial Sequence
<220>
<223> ORF6 protein from SARS-CoV-2
<400> 155
atgttccacc tggtggactt ccaggtgacc atcgccgaga tcctgctgat catcatgagg 60
accttcaagg tgagcatctg gaacctggac tacatcatca acctgatcat caagaacctg 120
agcaagagcc tgaccgagaa caagtacagc cagctggacg aggagcagcc catggagatc 180
gac 183
<210> 156
<211> 87
<212> DNA
<213> Artificial Sequence
<220>
<223> ORF7a protein from SARS-CoV-2
<400> 156
atgaagatca tcctgttcct ggccctgatc accctggcca cctgcgagct gtaccactac 60
caggagtgcg tgaggggcac caccgtg 87
<210> 157
<211> 2286
<212> DNA
<213> Artificial Sequence
<220>
<223> Nsp3 from SARS-CoV-2
<400> 157
gcccccacca aggtgacctt cggcgacgac accgtgatcg aggtgcaggg ctacaagagc 60
gtgaacatca ccttcgagct ggacgagagg atcgacaagg tgctgaacga gaagtgcagc 120
gcctacaccg tggagctggg caccgaggtg aacgagttcg cctgcgtggt ggccgacgcc 180
gtgatcaaga ccctgcagcc cgtgagcgag ctgctgaccc ccctgggcat cgacctggac 240
gagtggagca tggccaccta ctacctgttc gacgagagcg gcgagttcaa gctggccagc 300
cacatgtact gcagcttcta cccccccgac gaggacgagg aggagggcga ctgcgaggag 360
gaggagttcg agcccagcac ccagtacgag tacggcaccg aggacgacta ccagggcaag 420
cccctggagt tcggcgccac cagcgccgcc ctgcagcccg aggaggagca ggaggaggac 480
tggctggacg acgacagcca gcagaccgtg ggccagcagg acggcagcga ggacaaccag 540
accaccacca tccagaccat cgtggaggtg cagccccagc tggagatgga gctgaccccc 600
gtggtgcaga ccatcgaggt gaacagcttc agcggctacc tgaagctgac cgacaacgtg 660
tacatcaaga acgccgacat cgtggaggag gccaagaagg tgaagcccac cgtggtggtg 720
aacgccgcca acgtgtacct gaagcacggc ggcggcgtgg ccggcgccct gaacaaggcc 780
accaacaacg ccatgcaggt ggagagcgac gactacatcg ccaccaacgg ccccctgaag 840
gtgggcggca gctgcgtgct gagcggccac aacctggcca agcactgcct gcacgtggtg 900
ggccccaacg tgaacaaggg cgaggacatc cagctgctga agagcgccta cgagaacttc 960
aaccagcacg aggtgctgct ggcccccctg ctgagcgccg gcatcttcgg cgccgacccc 1020
atccacagcc tgagggtgtg cgtggacacc gtgaggacca acgtgtacct ggccgtgttc 1080
gacaagaacc tgtacgacaa gctggtgagc agcttcctgg agatgaagag cgagaagcag 1140
gtggagcaga agatcgccga gatccccaag gaggaggtga agcccttcat caccgagagc 1200
aagcccagcg tggagcagag gaagcaggac gacaagaaga tcaaggcctg cgtggaggag 1260
gtgaccacca ccctggagga gaccaagttc ctgaccgaga acctgctgct gtacatcgac 1320
atcaacggca acctgcaccc cgacagcgcc accctggtga gcgacatcga catcaccttc 1380
ctgaagaagg acgcccccta catcgtgggc gacgtggtgc aggagggcgt gctgaccgcc 1440
gtggtgatcc ccaccaagaa ggccggcggc accaccgaga tgctggccaa ggccctgagg 1500
aaggtgccca ccgacaacta catcaccacc taccccggcc agggcctgaa cggctacacc 1560
gtggaggagg ccaagaccgt gctgaagaag tgcaagagcg ccttctacat cctgcccagc 1620
atcatcagca acgagaagca ggagatcctg ggcaccgtga gctggaacct gagggagatg 1680
ctggcccacg ccgaggagac caggaagctg atgcccgtgt gcgtggagac caaggccatc 1740
gtgagcacca tccagaggaa gtacaagggc atcaagatcc aggagggcgt ggtggactac 1800
ggcgccaggt tctacttcta caccagcaag accaccgtgg ccagcctgat caacaccctg 1860
aacgacctga acgagaccct ggtgaccatg cccctgggct acgtgaccca cggcctgaac 1920
ctggaggagg ccgccaggta catgaggagc ctgaaggtgc ccgccaccgt gagcgtgagc 1980
agccccgacg ccgtgaccgc ctacaacggc tacctgacca gcagcagcaa gacccccgag 2040
gagcacttca tcgagaccat cagcctggcc ggcagctaca aggactggag ctacagcggc 2100
cagagcaccc agctgggcat cgagttcctg aagaggggcg acaagagcgt gtactacacc 2160
agcaacccca ccaccttcca cctggacggc gaggtgatca ccttcgacaa cctgaagacc 2220
ctgctgagcc tgagggaggt gaggaccatc aaggtgttca ccaccgtgga caacatcaac 2280
ctgcac 2286
<210> 158
<211> 918
<212> DNA
<213> Artificial Sequence
<220>
<223> Nsp5 from SARS-CoV-2
<400> 158
agcggcttca ggaagatggc cttccccagc ggcaaggtgg agggctgcat ggtgcaggtg 60
acctgcggca ccaccaccct gaacggcctg tggctggacg acgtggtgta ctgccccagg 120
cacgtgatct gcaccagcga ggacatgctg aaccccaact acgaggacct gctgatcagg 180
aagagcaacc acaacttcct ggtgcaggcc ggcaacgtgc agctgagggt gatcggccac 240
agcatgcaga actgcgtgct gaagctgaag gtggacaccg ccaaccccaa gacccccaag 300
tacaagttcg tgaggatcca gcccggccag accttcagcg tgctggcctg ctacaacggc 360
agccccagcg gcgtgtacca gtgcgccatg aggcccaact tcaccatcaa gggcagcttc 420
ctgaacggca gctgcggcag cgtgggcttc aacatcgact acgactgcgt gagcttctgc 480
tacatgcacc acatggagct gcccaccggc gtgcacgccg gcaccgacct ggagggcaac 540
ttctacggcc ccttcgtgga caggcagacc gcccaggccg ccggcaccga caccaccatc 600
accgtgaacg tgctggcctg gctgtacgcc gccgtgatca acggcgacag gtggttcctg 660
aacaggttca ccaccaccct gaacgacttc aacctggtgg ccatgaagta caactacgag 720
cccctgaccc aggaccacgt ggacatcctg ggccccctga gcgcccagac cggcatcgcc 780
gtgctggaca tgtgcgccag cctgaaggag ctgctgcaga acggcatgaa cggcaggacc 840
atcctgggca gcgccctgct ggaggacgag ttcaccccct tcgacgtggt gaggcagtgc 900
agcggcgtga ccttccag 918
<210> 159
<211> 2796
<212> DNA
<213> Artificial Sequence
<220>
<223> Nsp12 from SARS-CoV-2
<400> 159
agcgccgacg cccagagctt cctgaacagg gtgtgcggcg tgagcgccgc caggctgacc 60
ccctgcggca ccggcaccag caccgacgtg gtgtacaggg ccttcgacat ctacaacgac 120
aaggtggccg gcttcgccaa gttcctgaag accaactgct gcaggttcca ggagaaggac 180
gaggacgaca acctgatcga cagctacttc gtggtgaaga ggcacacctt cagcaactac 240
cagcacgagg agaccatcta caacctgctg aaggactgcc ccgccgtggc caagcacgac 300
ttcttcaagt tcaggatcga cggcgacatg gtgccccaca tcagcaggca gaggctgacc 360
aagtacacca tggccgacct ggtgtacgcc ctgaggcact tcgacgaggg caactgcgac 420
accctgaagg agatcctggt gacctacaac tgctgcgacg acgactactt caacaagaag 480
gactggtacg acttcgtgga gaaccccgac atcctgaggg tgtacgccaa cctgggcgag 540
agggtgaggc aggccctgct gaagaccgtg cagttctgcg acgccatgag gaacgccggc 600
atcgtgggcg tgctgaccct ggacaaccag gacctgaacg gcaactggta cgacttcggc 660
gacttcatcc agaccacccc cggcagcggc gtgcccgtgg tggacagcta ctacagcctg 720
ctgatgccca tcctgaccct gaccagggcc ctgaccgccg agagccacgt ggacaccgac 780
ctgaccaagc cctacatcaa gtgggacctg ctgaagtacg acttcaccga ggagaggctg 840
aagctgttcg acaggtactt caagtactgg gaccagacct accaccccaa ctgcgtgaac 900
tgcctggacg acaggtgcat cctgcactgc gccaacttca acgtgctgtt cagcaccgtg 960
ttccccccca ccagcttcgg ccccctggtg aggaagatct tcgtggacgg cgtgcccttc 1020
gtggtgagca ccggctacca cttcagggag ctgggcgtgg tgcacaacca ggacgtgaac 1080
ctgcacagca gcaggctgag cttcaaggag ctgctggtgt acgccgccga ccccgccatg 1140
cacgccgcca gcggcaacct gctgctggac aagaggacca cctgcttcag cgtggccgcc 1200
ctgaccaaca acgtggcctt ccagaccgtg aagcccggca acttcaacaa ggacttctac 1260
gacttcgccg tgagcaaggg cttcttcaag gagggcagca gcgtggagct gaagcacttc 1320
ttcttcgccc aggacggcaa cgccgccatc agcgactacg actactacag gtacaacctg 1380
cccaccatgt gcgacatcag gcagctgctg ttcgtggtgg aggtggtgga caagtacttc 1440
gactgctacg acggcggctg catcaacgcc aaccaggtga tcgtgaacaa cctggacaag 1500
agcgccggct tccccttcaa caagtggggc aaggccaggc tgtactacga cagcatgagc 1560
tacgaggacc aggacgccct gttcgcctac accaagagga acgtgatccc caccatcacc 1620
cagatgaacc tgaagtacgc catcagcgcc aagaacaggg ccaggaccgt ggccggcgtg 1680
agcatctgca gcaccatgac caacaggcag ttccaccaga agctgctgaa gagcatcgcc 1740
gccaccaggg gcgccaccgt ggtgatcggc accagcaagt tctacggcgg ctggcacaac 1800
atgctgaaga ccgtgtacag cgacgtggag aacccccacc tgatgggctg ggactacccc 1860
aagtgcgaca gggccatgcc caacatgctg aggatcatgg ccagcctggt gctggccagg 1920
aagcacacca cctgctgcag cctgagccac aggttctaca ggctggccaa cgagtgcgcc 1980
caggtgctga gcgagatggt gatgtgcggc ggcagcctgt acgtgaagcc cggcggcacc 2040
agcagcggcg acgccaccac cgcctacgcc aacagcgtgt tcaacatctg ccaggccgtg 2100
accgccaacg tgaacgccct gctgagcacc gacggcaaca agatcgccga caagtacgtg 2160
aggaacctgc agcacaggct gtacgagtgc ctgtacagga acagggacgt ggacaccgac 2220
ttcgtgaacg agttctacgc ctacctgagg aagcacttca gcatgatgat cctgagcgac 2280
gacgccgtgg tgtgcttcaa cagcacctac gccagccagg gcctggtggc cagcatcaag 2340
aacttcaaga gcgtgctgta ctaccagaac aacgtgttca tgagcgaggc caagtgctgg 2400
accgagaccg acctgaccaa gggcccccac gagttctgca gccagcacac catgctggtg 2460
aagcagggcg acgactacgt gtacctgccc taccccgacc ccagcaggat cctgggcgcc 2520
ggctgcttcg tggacgacat cgtgaagacc gacggcaccc tgatgatcga gaggttcgtg 2580
agcctggcca tcgacgccta ccccctgacc aagcacccca accaggagta cgccgacgtg 2640
ttccacctgt acctgcagta catcaggaag ctgcacgacg agctgaccgg ccacatgctg 2700
gacatgtaca gcgtgatgct gaccaacgac aacaccagca ggtactggga gcccgagttc 2760
tacgaggcca tgtacacccc ccacaccgtg ctgcag 2796
<210> 160
<211> 303
<212> DNA
<213> Homo sapiens
<400> 160
atgaacagga aggtgaccgc catcgccctg gccgccatca tctgggccac cgccgcccag 60
ggcttcctga tgttcaagca gggcaggtgc ctgtgcatcg gccccggcat gaaggccgtg 120
aagatggccg agatcgagaa ggccagcgtg atctacccca gcaacggctg cgacaaggtg 180
gaggtgatcg tgaccatgaa ggcccacaag aggcagaggt gcctggaccc caggagcaag 240
caggccaggc tgatcatgca ggccatcgag aagaagaact tcctgaggag gcagaacatg 300
tga 303
<210> 161
<211> 465
<212> DNA
<213> Homo sapiens
<400> 161
atgaaggtct ccgcggcagc cctcgctgtc atcctcattg ctactgccct ctgcgctcct 60
gcatctgcct ccccatattc ctcggacacc acaccctgct gctttgccta cattgcccgc 120
ccactgcccc gtgcccacat caaggagtat ttctacacca gtggcaagtg ctccaaccca 180
gcagtcgtcc acaggtcaag gatgccaaag agagagggac agcaagtctg gcaggatttc 240
ctgtatgact cccggctgaa caagggcaag ctttgtcacc cgaaagaacc gccaagtgtg 300
tgccaaccca gagaagaaat gggttcggga gtacatcaac tctttggaga tgagctagga 360
tggagagtcc ttgaacctga acttacacaa atttgcctgt ttctgcttgc tcttgtccta 420
gcttgggagg cttcccctca ctatcctacc ccacccgctc cttga 465
<210> 162
<211> 378
<212> DNA
<213> Homo sapiens
<400> 162
atgaagaaaa gtggtgttct tttcctcttg ggcatcatct tgctggttct gattggagtg 60
caaggaaccc cagtagtgag aaagggtcgc tgttcctgca tcagcaccaa ccaagggact 120
atccacctac aatccttgaa agaccttaaa caatttgccc caagcccttc ctgcgagaaa 180
attgaaatca ttgctacact gaagaatgga gttcaaacat gtctaaaccc agattcagca 240
gatgtgaagg aactgattaa aaagtgggag aaacaggtca gccaaaagaa aaagcaaaag 300
aatgggaaaa aacatcaaaa aaagaaagtt ctgaaagttc gaaaatctca acgttctcgt 360
caaaagaaga ctacataa 378
<210> 163
<211> 297
<212> DNA
<213> Homo sapiens
<400> 163
atgaatcaaa ctgccattct gatttgctgc cttatctttc tgactctaag tggcattcaa 60
ggagtacctc tctctagaac tgtacgctgt acctgcatca gcattagtaa tcaacctgtt 120
aatccaaggt ctttagaaaa acttgaaatt attcctgcaa gccaattttg tccacgtgtt 180
gagatcattg ctacaatgaa aaagaagggt gagaagagat gtctgaatcc agaatcgaag 240
gccatcaaga atttactgaa agcagttagc aaggaaaggt ctaaaagatc tccttaa 297
<210> 164
<211> 300
<212> DNA
<213> Homo sapiens
<400> 164
atgaggctcc tggcggccgc gctgctcctg ctgctgctgg cgctgtacac cgcgcgtgtg 60
gacgggtcca aatgcaagtg ctcccggaag ggacccaaga tccgctacag cgacgtgaag 120
aagctggaaa tgaagccaaa gtacccgcac tgcgaggaga agatggttat catcaccacc 180
aagagcgtgt ccaggtaccg aggtcaggag cactgcctgc accccaagct gcagagcacc 240
aagcgcttca tcaagtggta caacgcctgg aacgagaagc gcagggtcta cgaagaatag 300
300
<210> 165
<211> 360
<212> DNA
<213> Homo sapiens
<400> 165
atgaaagttc taatctcttc cctcctcctg ttgctgccac taatgctgat gtccatggtc 60
tctagcagcc tgaatccagg ggtcgccaga ggccacaggg accgaggcca ggcttctagg 120
agatggctcc aggaaggcgg ccaagaatgt gagtgcaaag attggttcct gagagccccg 180
agaagaaaat tcatgacagt gtctgggctg ccaaagaagc agtgcccctg tgatcatttc 240
aagggcaatg tgaagaaaac aagacaccaa aggcaccaca gaaagccaaa caagcattcc 300
agagcctgcc agcaatttct caaacaatgt cagctaagaa gctttgctct gcctttgtag 360
360
<210> 166
<211> 453
<212> DNA
<213> Homo sapiens
<400> 166
atgaacctgt ggctcctggc ctgcctggtg gccggcttcc tgggagcctg ggcccccgct 60
gtccacaccc aaggtgtctt tgaggactgc tgcctggcct accactaccc cattgggtgg 120
gctgtgctcc ggcgcgcctg gacttaccgg atccaggagg tgagcgggag ctgcaatctg 180
cctgctgcga tattctacct ccccaagaga cacaggaagg tgtgtgggaa ccccaaaagc 240
agggaggtgc agagagccat gaagctcctg gatgctcgaa ataaggtttt tgcaaagctc 300
caccacaaca cgcagacctt ccaagcaggc cctcatgctg taaagaagtt gagttctgga 360
aactccaagt tatcatcgtc caagtttagc aatcccatca gcagcagtaa gaggaatgtc 420
tccctcctga tatcagctaa ttcaggactg tga 453
<210> 167
<211> 384
<212> DNA
<213> Homo sapiens
<400> 167
atgcagcaga gaggactcgc catcgtggcc ttggctgtct gtgcggccct acatgcctca 60
gaagccatac ttcccattgc ctccagctgt tgcacggagg tttcacatca tatttccaga 120
aggctcctgg aaagagtgaa tatgtgtcgc atccagagag ctgatgggga ttgtgacttg 180
gctgctgtca tccttcatgt caagcgcaga agaatctgtg tcagcccgca caaccatact 240
gttaagcagt ggatgaaagt gcaagctgcc aagaaaaatg gtaaaggaaa tgtttgccac 300
aggaagaaac accatggcaa gaggaacagt aacagggcac atcaggggaa acacgaaaca 360
tacggccata aaactcctta ttag 384
<210> 168
<211> 465
<212> DNA
<213> Homo sapiens
<400> 168
atgttccacg tgagcttcag gtacatcttc ggcatccccc ccctgatcct ggtgctgctg 60
cccgtgacca gcagcgagtg ccacatcaag gacaaggagg gcaaggccta cgagagcgtg 120
ctgatgatca gcatcgacga gctggacaag atgaccggca ccgacagcaa ctgccccaac 180
aacgagccca acttcttcag gaagcacgtg tgcgacgaca ccaaggaggc cgccttcctg 240
aacagggccg ccaggaagct gaagcagttc ctgaagatga acatcagcga ggagttcaac 300
gtgcacctgc tgaccgtgag ccagggcacc cagaccctgg tgaactgcac cagcaaggag 360
gagaagaacg tgaaggagca gaagaagaac gacgcctgct tcctgaagag gctgctgagg 420
gagatcaaga cctgctggaa caagatcctg aagggcagca tctga 465
<210> 169
<211> 489
<212> DNA
<213> Homo sapiens
<400> 169
atgagaattt cgaaaccaca tttgagaagt atttccatcc agtgctactt gtgtttactt 60
ctaaacagtc attttctaac tgaagctggc attcatgtct tcattttggg ctgtttcagt 120
gcagggcttc ctaaaacaga agccaactgg gtgaatgtaa taagtgattt gaaaaaaatt 180
gaagatctta ttcaatctat gcatattgat gctactttat atacggaaag tgatgttcac 240
cccagttgca aagtaacagc aatgaagtgc tttctcttgg agttacaagt tatttcactt 300
gagtccggag atgcaagtat tcatgataca gtagaaaatc tgatcatcct agcaaacaac 360
agtttgtctt ctaatgggaa tgtaacagaa tctggatgca aagaatgtga ggaactggag 420
gaaaaaaata ttaaagaatt tttgcagagt tttgtacata ttgtccaaat gttcatcaac 480
acttcttga 489
<210> 170
<211> 462
<212> DNA
<213> Homo sapiens
<400> 170
atgtacagga tgcaactcct gtcttgcatt gcactaagtc ttgcacttgt cacaaacagt 60
gcacctactt caagttctac aaagaaaaca cagctacaac tggagcattt actgctggat 120
ttacagatga ttttgaatgg aattaataat tacaagaatc ccaaactcac caggatgctc 180
acatttaagt tttacatgcc caagaaggcc acagaactga aacatcttca gtgtctagaa 240
gaagaactca aacctctgga ggaagtgcta aatttagctc aaagcaaaaa ctttcactta 300
agacccaggg acttaatcag caatatcaac gtaatagttc tggaactaaa gggatctgaa 360
acaacattca tgtgtgaata tgctgatgag acagcaacca ttgtagaatt tctgaacaga 420
tggattacct tttgtcaaag catcatctca acactgactt ga 462
<210> 171
<211> 1733
<212> DNA
<213> Artificial Sequence
<220>
<223> CAG promoter
<400> 171
ctcgacattg attattgact agttattaat agtaatcaat tacggggtca ttagttcata 60
gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 120
ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag 180
ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac 240
atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg 300
cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg 360
tattagtcat cgctattacc atggtcgagg tgagccccac gttctgcttc actctcccca 420
tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta ttttgtgcag 480
cgatgggggc gggggggggg ggggggcgcg cgccaggcgg ggcggggcgg ggcgaggggc 540
ggggcggggc gaggcggaga ggtgcggcgg cagccaatca gagcggcgcg ctccgaaagt 600
ttccttttat ggcgaggcgg cggcggcggc ggccctataa aaagcgaagc gcgcggcggg 660
cgggagtcgc tgcgcgctgc cttcgccccg tgccccgctc cgccgccgcc tcgcgccgcc 720
cgccccggct ctgactgacc gcgttactcc cacaggtgag cgggcgggac ggcccttctc 780
ctccgggctg taattagcgc ttggtttaat gacggcttgt ttcttttctg tggctgcgtg 840
aaagccttga ggggctccgg gagggccctt tgtgcggggg gagcggctcg gggggtgcgt 900
gcgtgtgtgt gtgcgtgggg agcgccgcgt gcggctccgc gctgcccggc ggctgtgagc 960
gctgcgggcg cggcgcgggg ctttgtgcgc tccgcagtgt gcgcgagggg agcgcggccg 1020
ggggcggtgc cccgcggtgc ggggggggct gcgaggggaa caaaggctgc gtgcggggtg 1080
tgtgcgtggg ggggtgagca gggggtgtgg gcgcgtcggt cgggctgcaa ccccccctgc 1140
acccccctcc ccgagttgct gagcacggcc cggcttcggg tgcggggctc cgtacggggc 1200
gtggcgcggg gctcgccgtg ccgggcgggg ggtggcggca ggtgggggtg ccgggcgggg 1260
cggggccgcc tcgggccggg gagggctcgg gggaggggcg cggcggcccc cggagcgccg 1320
gcggctgtcg aggcgcggcg agccgcagcc attgcctttt atggtaatcg tgcgagaggg 1380
cgcagggact tcctttgtcc caaatctgtg cggagccgaa atctgggagg cgccgccgca 1440
ccccctctag cgggcgcggg gcgaagcggt gcggcgccgg caggaaggaa atgggcgggg 1500
agggccttcg tgcgtcgccg cgccgccgtc cccttctccc tctccagcct cggggctgtc 1560
cgcgggggga cggctgcctt cgggggggac ggggcagggc ggggttcggc ttctggcgtg 1620
tgaccggcgg ctctagagcc tctgctaacc atgttcatgc cttcttcttt ttcctacagc 1680
tcctgggcaa cgtgctggtt attgtgctgt ctcatcattt tggcaaagaa ttg 1733
<210> 172
<211> 589
<212> DNA
<213> Artificial Sequence
<220>
<223> CMV Promoter
<400> 172
tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360
catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420
atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480
ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540
acggtgggag gtctatataa gcagagctgg tttagtgaac cgtcagatc 589
<210> 173
<211> 635
<212> DNA
<213> Homo sapiens
<400> 173
gtatagggct gtctgggagc cactccaggg ccacagaaat cttgtctctg actcagggta 60
ttttgttttc tgttttgtgt aaatgctctt ctgactaatg caaaccatgt gtccatagaa 120
ccagaagatt tttccagggg aaaaggtaag gaggtggtga gagtgtcctg ggtctgccct 180
tccagggctt gccctgggtt aagagccagg caggaagctc tcaagagcat tgctcaagag 240
tagagggggc ctgggaggcc cagggagggg atgggagggg aacacccagg ctgcccccaa 300
ccagatgccc tccaccctcc tcaacctccc tcccacggcc tggagaggtg ggaccaggta 360
tggaggcttg agagcccctg gttggaggaa gccacaagtc caggaacatg ggagtctggg 420
cagggggcaa aggaggcagg aacaggccat cagccaggac aggtggtaag gcaggcagga 480
gtgttcctgc tgggaaaagg tgggatcaag cacctggagg gctcttcaga gcaaagacaa 540
acactgaggt cgctgccact cctacagagc ccccacgccc cgcccagcta taaggggcca 600
tgcaccaagc agggtaccca ggctgcagag gtgcc 635
<210> 174
<211> 1559
<212> DNA
<213> Homo sapiens
<400> 174
catccatgcc catggcctca gatgccagcc ataagctgtt gggttccaaa cctcgactcc 60
aggctggact cacccctgtc tcccccacca gcctgacacc tccacctggg tatctaacga 120
gcatctcaaa ctcaacctgc ctgagacaga ggaatcacta tcccctcctc ctccaaaaat 180
atccttccat cacactcccc atcttgtgct ctgatttact aaacggccct gggccctctc 240
tttctcaggg tctctgcttg cccagctata taataaaaca agtttgggac ttcccaacca 300
ttcacccatg gaaaaacaga agcaactctt caaaggacag attcccagga tctgccctgg 360
gagattccaa atcagttgat ctggggtgag cccagtcctc tgtagttttt agaagctcct 420
cctatgtctc tcctggtcag cagaatcttg gcccctccct tccccccagc ctcttggttc 480
ttctgggctc tgatccagcc tcagcgtcac tgtcttccac gcccctcttt gattctcgtt 540
tatgtcaaaa gccttgtgag gatgaggctg tgattatccc cattttacag atgaggaaac 600
tgtggctcca ggatgacaca actggccaga ggtcacatca gaagcagagc tgggtcactt 660
gactccaccc aatatcccta aatgcaaaca tcccctacag accgaggctg gcaccttaga 720
gctggagtcc atgcccgctc tgaccaggag aagccaacct ggtcctccag agccaagagc 780
ttctgtccct ttcccatctc ctgaagcctc cctgtcacct ttaaagtcca ttcccacaaa 840
gacatcatgg gatcaccaca gaaaatcaag ctctggggct aggctgaccc cagctagatt 900
tttggctctt ttatacccca gctgggtgga caagcacctt aaacccgctg agcctcagct 960
tcccgggcta taaaatgggg gtgatgacac ctgcctgtag cattccaagg agggttaaat 1020
gtgatgctgc agccaagggt ccccacagcc aggctctttg caggtgctgg gttcagagtc 1080
ccagagctga ggccgggagt aggggttcaa gtggggtgcc ccaggcaggg tccagtgcca 1140
gccctctgtg gagacagcca tccggggccg aggcagccgc ccaccgcagg gcctgcctat 1200
ctgcagccag cccagccctc acaaaggaac aataacagga aaccatccca gggggaagtg 1260
ggccagggcc agctggaaaa cctgaagggg aggcagccag gcctccctcg ccagcggggt 1320
gtggctcccc tccaaagacg gtcggctgac aggctccaca gagctccact cacgctcagc 1380
cctggacgga caggcagtcc aacggaacag aaacatccct cagcccacag gcacggtgag 1440
tgggggctcc cacactcccc tccaccccaa acccgccacc ctgcgcccaa gatgggaggg 1500
tcctcagctt ccccatctgt agaatgggca tcgtcccact cccatgacag agaggctcc 1559
<210> 175
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> wild type native leader sequence from Spike protein from
SARS-CoV-2
<400> 175
atgttcgtgt tcctggtgct gctgcccctg gtgagcagc 39
<210> 176
<211> 63
<212> DNA
<213> Artificial Sequence
<220>
<223> T2A Linker
<400> 176
ggaagcggag agggcagggg aagtcttcta acatgcgggg acgtggagga aaatcccggc 60
ccc 63
<210> 177
<211> 69
<212> DNA
<213> Artificial Sequence
<220>
<223> E2A Linker
<400> 177
ggaagcggac agtgtactaa ttatgctctc ttgaaattgg ctggagatgt tgagagcaac 60
ccaggtccc 69
<210> 178
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> P2A Linker
<400> 178
ggaagcggag ccacgaactt ctctctgtta aagcaagcag gagatgttga agaaaacccc 60
gggcct 66
<210> 179
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> Linker
<400> 179
gccgcctac 9
<210> 180
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<223> Linker
<400> 180
ggccccggcc ccggc 15
<210> 181
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> 6-His Tag
<400> 181
catcaccatc accatcac 18
<210> 182
<211> 1580
<212> DNA
<213> Artificial Sequence
<220>
<223> Nsp1, Nsp2, and Nsp3 from SARS-CoV-2
<400> 182
gacgtgctag tacgtggctt cggggactct gtggaagagg ccctatcgga ggcacgtgaa 60
catcttaaaa gtggcacttg tggcatagta gagctggaaa aaggcgtatt gcctcagctt 120
gaacagccct atgtgttcat taaacgatct gacgcccagg gcactggtca tggccacaag 180
gtctgtgagc tagttgctga attggatggc gttcagttcg gtcgtagcgg tataacactg 240
ggagtactcg tgccacacgt tggcgagacc ccaattgcat accgcactgt tcttcttcgt 300
aagaatggta ataagggagc cggtggccat agctttggca tcgatctaaa gtcatatgac 360
ttaggtgacg agcttggcac tgatcccatt gaagattatg aacaaaactg gaacactaaa 420
catggcagtg gtgcccttcg tgaactcact cgtgagctca atggaggagt agttactcgc 480
tatgtcgaca acaatttctg tggcccagat ggctaccccc ttgaatgcat taaagacctt 540
ctcgctcgtg cgggcaagtc aatgtgcact ctttctgaac aacttgattt tatcgagtcg 600
aagagaggtg tctactgctg tcgtgaacat gagcatgaaa ttgcttggtt taccgaacgc 660
tctgaaaaga gctatgagca ccagacaccc ttcgagatca agagtgccaa gaaatttgac 720
actttcaaag gggaatgccc aaagtttgta tttcctctca attctagagt caaagtcatt 780
caaccacgtg ttgaaaagaa aaagactgaa ggtttcatgg ggcgtatacg ctctgtgtac 840
cctgttgcat cccctgggga ttgtaacgat atgcacttgt ctaccttgat gaaatgtaat 900
cattgtgatg aagtttcatg gcagacgtgc gactttctca aagccacttg tgaacaatgt 960
ggcactgaaa acttagtctg tgaaggaccc actacatgtg gatacctacc tactaatgct 1020
gtacttaaaa tgccttgtcc tgcttgtcaa gatccagaga ttggacctga gcatagtgtt 1080
gcagactatc acaaccactc aaacattgaa actcgactcc gcaagggagg taggactaaa 1140
tgttttggtg ggtgtgtgtt tgcctacgtt ggctgctata acaagcgtgc ctactgggtt 1200
cctcgtgcta gtgccgatat tggtgcaaac catactggca ttactggaga caatgtggag 1260
actttaaatg aagatctcct ggagatactg catcgtgaac gtgttaatgt taacattgtt 1320
ggcgattttc agttgaatga agaggttgct attattctag catctttctc tgcttctact 1380
agtgccttta ttgacactgt aaagggcctt gactacaaga ccttcaaagc cattgttgaa 1440
tcctgtggaa actacaaagt taccaaagga aaacctgtcc aaggagcttg gaacattggc 1500
cagcaaaaat ctattttgac accgctgtgt ggttttccat cacaggctgc cagtgtcatt 1560
agatcaatct tttctcgcac 1580
<210> 183
<211> 3550
<212> DNA
<213> Artificial Sequence
<220>
<223> Nsp5, Nsp6, Nsp7, Nsp8, Nsp9, Nsp10, Nsp11, Nsp12, Nsp13, Nsp14,
Nsp15, and Nsp16 from SARS-CoV-2
<400> 183
aaaattaagg cttgcatcga agaggtcact acaacactgg aagagactaa gtttcttacc 60
aataagttgc ttctttttgc tgatatcagc ggtaaacttt accaagattc tcagaatatg 120
cttagaggtg aggacgtgtc tttccttgag agagatgcgc cttacatggt aggtgatgtt 180
atcaatagtg gtgatattac ctgcgttgta ataccttcta agaaggctgg tggtactaca 240
gaaatgcttg caagagcatt gaagaaagtg ccarttgatg agtatataac cacataycct 300
ggwcaaggwt gtgctggtta tacacttgak gaagctarga ctgctcttaa raartgcaaa 360
tctgcaytkt aygtkttacc ttcagaatca cctaatgcta aggaagagat tctaggaacc 420
gtatcttgga atttgagaga aatgcttgct cacgctgaag agacaagaaa attaatgcct 480
atctgcatgg atgtcagagc cataatggcc accatccaac gcaagtacaa aggaattaaa 540
attcaagaag gcatcgttga ctatggtgtc cgattcttct tttatactag taaagagcct 600
gtagcttcta ttattacgaa gctgaactct ctaaatgagc cacttgtcac aatgccaatt 660
ggttatgtga cacatggttt taatcttgaa gaggctgcgc gctgtatgcg ttctcttaaa 720
gctcctgccg tagtgtcagt atcatcacca gatgcygtta ctacatataa tggatacctc 780
acttcgtcat caaagacatc tgaggagcac tttgtggaaa cagtttcttt ggctggctct 840
tacagagatt ggtcctattc aggacagcgt acagagttag gtgttgaatt tcttaagcgt 900
ggtgacaaaa ttgtgtacca cactttggag agccccgtca agttccatct tgacggtgag 960
gttcttccac ttgacaaatt aaagagtctc ttatccctac gggaggttaa gactataaaa 1020
gtgttcacaa ctgtggacaa tactaatctc cacacacatc ttgtggatat gtctatgaca 1080
tatggacagc agtttggtcc aacatatttg gatggtgctg atgttacaaa aattaaacct 1140
catgtaaatc atgagggtaa gactttcttt gtattaccta gtgatgacac actacgtagt 1200
gaagcttttg agtactacca cgctcttgat gagagtttcc ttggtagata catgtctgct 1260
ttaaaccaca caaagaaatg gaaattccct caagttggtg gtttgacttc cattaagtgg 1320
gctgataaca attgttattt gtctagtgtt ttattagcac ttcaacaaat tgaagttaaa 1380
tttaatgccc cagcactaca agaagcttac tatagagctc gtgctggtga tgctgctaat 1440
ttttgtgcac ttatactcgc ttacagtaat aaaactgttg gcgagctggg tgatgtcaga 1500
gaaactatgg cccatctttt acagcatgct aatttggaat ctgcaaagcg agttcttaat 1560
gtggtgtgta aacattgcgg ccagaaaact actaccttaa cgggtgtaga ggctgtgatg 1620
tacatgggta ctctgtctta tgataatctt aagacaggtg tttctgttcc atgtgtgtgt 1680
ggtcgtgacg ctacacaata tttagtacaa caagagtctt cttttgttat gatgtccgca 1740
ccacctgctg aatataaatt acagcaaggt acattcttat gtgcaaatga atacactggt 1800
aattatcagt gtggtcatta cactcatata actgctaagg agaccctcta tcgtattgat 1860
ggagctcacc ttacaaagat gtcagagtat aaagggccag tgactgatgt gttctacaag 1920
gaaacatctt acactacaac catcaagcct gtgtcatata aactcgatgg agttacttac 1980
acagagattg aaccaaaatt ggatgggtat tataaaaagg ataatgctta ctatacggag 2040
cagcctatag accttgtacc aactcaacca ctaccaaatg cgagttttga taatttcaaa 2100
ctcacatgtt ctaatataaa attcgctgat gatttaaatc aaatgacagg cttcacaaag 2160
ccagcttcac gagagctatc tgtcacattc tttccagact tgaatggcga tgtagtggct 2220
attgactata gacactactc agcgagtttc aagaaaggtg ctagattact gcataagcca 2280
attgtttggc atatcaatca ggctacaacc aagacaacgt tcagaccaaa cacttggtgt 2340
ttacgttgtc tttggagtac aaaaccagta gatacttcaa attcatttga agttctggca 2400
gtagaagaca cacaaggaat ggacaatctt gcttgtgaaa gtcaaagacc cacctctgaa 2460
gaagtagtgg aaaatcctac catacagaag gaagtcatag agtgtgacgt gaaaactacc 2520
gaagttgtag gcaatgtcat acttaaacca tcagatgaag gtgttaaagt aacacaagag 2580
ttagggcatg aggatcttat ggctgcctat gtggaaaata caagcattac cattaagaaa 2640
cctaatgagc tttcattagc cttaggttta aaaacaattg ccactcatgg tattgctgca 2700
attaacagtg ttccgtggag taaaattttg gcttatgtca gaccattcct aggacgaaca 2760
gcaatcacaa catcaaactg tgctaagaga ttagtacagc gtgtatttaa caactacatg 2820
ccctatgtgc ttacattatt gttccaattg tgtactttta ccaaaagtac aaattctaga 2880
attagagctt cactacctac gactattgct aaaaatagtg ttaagggtgt tgctaaatta 2940
tgtttggatg ctggcatcaa ttatgtaaag tcacccaaat tttctaaatt gttcactatt 3000
gcaatgtggc tattattgtt aagcatttgc ttaggttcac taatctatgt aactgcagct 3060
ttaggtgtat tattgtccaa ctttggagct ccttcctatt gtagtggcgt tagagaatcg 3120
tatctcaatt cctctaatgt tactactatg gacttctgtg aaggttcttt tccttgcagc 3180
gtttgtttaa gtggattaga ctcgcttgat tcctatccag ctcttgaaac catacaggta 3240
acgatttcat cgtataagct agacttgaca attttaggtc tggctgctga gtggtttttg 3300
gcatatatgt tgttcacaaa attcttttat ttattaggtc tttcagctat aatgcaggtg 3360
ttctttggct attttgctag tcatttcatc agcaattctt ggcttatgtg gtttatcatt 3420
agtatcgtac aaatggcacc cgtttccgca atggttagga tgtacatttt cgttgcttct 3480
ttctactaca tatggaagag ctatgttcat attatggatg gttgtacttc atctacttgc 3540
atgatgtgct 3550
<210> 184
<211> 2099
<212> DNA
<213> Artificial Sequence
<220>
<223> spike glycoprotein from SARS-CoV-2
<400> 184
taccaagcta ctagagtagt ggtactttca tttgagcttc taaatgcacc tgccacagtg 60
tgtggaccaa aattgtccac atcactaatt aagaaccagt gtgtcaattt taatttcaat 120
ggactcaagg gtactggtgt gttgactgac tcgtccaaaa agtttcagtc ttttcaacaa 180
tttggaaggg atgcatctga ttttactgac tcagtacgcg accctcagac acttcaaata 240
cttgacattt caccatgttc atttggtggt gtgagtgtaa taacaccagg aacaaatgct 300
tcatctgaag tagccgttct ataccaagat gtaaactgca ctgatgttcc cacggccata 360
cgtgctgacc aactcacacc tgcttggcgt gtttactctg ctggagtaaa tgtgtttcaa 420
actcaggctg gctgtttaat aggagcggaa catgtcaatg cttcatatga gtgtgacatt 480
cccattggtg caggcatttg tgctagttac catacagctt cccttttacg taatacaggc 540
cagaaatcaa ttgtggccta tactatgtca cttggtgctg aaaactcaat tgcttatgct 600
aataactcaa ttgccatacc tacaaatttt tcaatcagtg tcacaactga agtgatgcct 660
gtttcaatgg ctaagacatc agtagattgt acaatgtaca tctgtggtga ctctcaggag 720
tgcagcaact tactacttca gtatggtagc ttttgcacac aattaaatcg tgccctttca 780
ggcattgctg ttgaacagga caaaaacact caagaggttt ttgcccaagt taaacaaatg 840
tataagacac cagccataaa agattttggt ggctttaatt tctcacaaat attgcctgac 900
ccttctaagc caacaaaaag atcatttatt gaggatttac tcttcaacaa agtgactctc 960
gctgatgctg gctttatgaa gcaatacggc gaatgcctag gcgatattag tgctagagat 1020
ctcatttgtg cgcagaagtt caatggactc actgtccttc cacctctact cacggatgaa 1080
atgattgctg cttacaccgc cgctcttgtc agcggtactg ctactgctgg ttggacattt 1140
ggtgcaggtg ctgctctaca aatacctttt gctatgcaaa tggcttatag gttcaatggc 1200
attggagtta ctcaaaatgt tctctatgag aaccagaagc agatcgctaa ccaatttaac 1260
aaggcgatca gtcaaattca agaatcactt actactactt caactgcatt gggcaagctg 1320
caagacgtcg tcaaccagaa tgctcaagca ttgaacacac ttgttaaaca actaagttct 1380
aactttggtg caatttcaag tgttttaaat gacattctgt ctcgactyga caaagttgag 1440
gctgaagtgc aaattgatag gttgattact ggcagattac aaagccttca gacctatgta 1500
acacaacaac taatcagagc tgctgaaatc agagcttctg ccaatcttgc tgccactaag 1560
atgtccgagt gtgttcttgg acaatcaaaa agagttgact tttgtggaaa aggctatcat 1620
cttatgtctt tccctcaagc agccccacat ggtgtcgtct tcttacatgt cacatacgtg 1680
ccatcgcaag aaagaaactt caccactgcc ccagcaatct gccatcaagg caaggcacac 1740
ttccctcgtg aaggtgtttt tgtatctaat ggcacttctt ggtttatcac acagaggaac 1800
ttcttttcac cacaaataat tacaacagac aatacatttg tctctggaaa ttgtgatgtc 1860
gttattggca tcatcaacaa tactgtttat gatcctctgc aacctgagct tgactcattt 1920
aaagaagagc tggacaagta cttcaaaaac cacacgtcac ctgatgtrga tcttggcgac 1980
atctcaggca ttaatgcttc agtcgtcaat attcaaaaag aaattgaccg cctcaatgag 2040
gttgccaaaa atctaaatga atcgctcatc gatcttcaag aacttggaaa atatgagca 2099
<210> 185
<211> 1229
<212> DNA
<213> Artificial Sequence
<220>
<223> ORF3a, Envelope (E), Membrane (M), ORF6, and ORF7a from
SARS-CoV-2
<400> 185
cagtaacact tgcttgcttt gtgcttgctg ctgtttacag aattaattgg gtgactggcg 60
gaattgcrat tgcaatggct tgtattgtag gcttgatgtg gcttagctac ttcrttgctt 120
ctttcaggct gtttgcgcgc acccgctcwa tgtggtcatt caacccagaa acyaacattc 180
ttctcaatgt gcctcttcgr ggracaatyt tgaccagacc gctcatggar agtgaacttg 240
tcattggtgc tgtgatcatt cgtggtcacc tgcgaatggc tggacactcy ctwgggcgct 300
gtgacattaa ggacctgcca aaagagatca ctgtggctac atcacgaacg ctttcttatt 360
acaaattagg agcttcgcag cgtgtaggca ctgactcagg ttttgctgca tacaaccgct 420
accgtattgg aaactacaaa ttaaatacag accacgccgg tagcaacgac aatattgctt 480
tgctagtaca gtaagtgaca acagatgttt catctagttg acttccaggt tacaatagcg 540
gagatattga ttatcattat gaggactttc aggattgcca tctggaatct tgatgtaata 600
ataagttcaa tagtgagaca attatttaag cctctaacta agaagaatta ttctgagtta 660
gatgatgaag aacytatgga gattgattat ccataaaacg aacatgaaaa ttatcctctt 720
cctgactttg atttcacttg cattttgtga gttatatcat tatcaggagt gtgttagagg 780
tacaactgta ctattaaaag aaccttgccc atcrggaacg tacgagggca attcaccatt 840
tcaccctctt gctgacaaca aatttgcact aacttgcatt agcacacatt ttgcttttgc 900
ttgtgctgac ggtactcgac atacctatca gcttcgtgca agatcagttt ctccaaaact 960
cttcatcagg caagaggaat ttcatcaaga gctctattca ccactttttc tcattgttgc 1020
cgctctagta tttataatac tttgcttcac cattaagaga aagaccgaat gagtgagctc 1080
actttaattg acttctattt gtgcttttta gcctttctgc tattccttgt tttaataatg 1140
ctcatcatat tttggttctc cttggagatt caagattctg aagagccatg tccaaaagtc 1200
taaacgaaca tgaaacttct cattgtttt 1229
<210> 186
<211> 292
<212> PRT
<213> Artificial Sequence
<220>
<223> SARS-CoV-like Spike-S1-NTD
<400> 186
Ser Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr
1 5 10 15
Thr Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg
20 25 30
Ser Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser
35 40 45
Asn Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr
50 55 60
Lys Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe
65 70 75 80
Ala Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr
85 90 95
Thr Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr
100 105 110
Asn Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe
115 120 125
Leu Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu
130 135 140
Phe Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser
145 150 155 160
Gln Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn
165 170 175
Leu Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr
180 185 190
Ser Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe
195 200 205
Ser Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr
210 215 220
Arg Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly
225 230 235 240
Asp Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly
245 250 255
Tyr Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr
260 265 270
Ile Thr Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys
275 280 285
Cys Thr Leu Lys
290
<210> 187
<211> 223
<212> PRT
<213> Artificial Sequence
<220>
<223> SARS-CoV-2 Spike-S1-RBD
<400> 187
Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn
1 5 10 15
Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val
20 25 30
Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser
35 40 45
Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val
50 55 60
Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp
65 70 75 80
Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln
85 90 95
Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr
100 105 110
Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly
115 120 125
Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys
130 135 140
Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr
145 150 155 160
Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser
165 170 175
Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val
180 185 190
Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly
195 200 205
Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe
210 215 220
<210> 188
<211> 13
<212> PRT
<213> Artificial Sequence
<220>
<223> Wild Type Signal Sequence for the Spike protein from SARS-CoV-2
<400> 188
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser
1 5 10
<210> 189
<211> 12
<212> DNA
<213> Artificial Sequence
<220>
<223> 682-QQAQ-685 mutation
<400> 189
cagcaggccc ag 12
<210> 190
<211> 6
<212> DNA
<213> Artificial Sequence
<220>
<223> K986P and V987P Mutations
<400> 190
cccccc 6
<210> 191
<211> 1273
<212> PRT
<213> Artificial Sequence
<220>
<223> spike glycoprotein with 682-QQAQ-685 mutation in the S1-S2 from
SARS-CoV-2
<400> 191
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn Asn Ser Tyr
580 585 590
Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr Gln Thr
595 600 605
Gln Thr Asn Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro
610 615 620
Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser
625 630 635 640
Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro
645 650 655
Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser
660 665 670
Thr Gly Ser Asn Val Phe Gln Ser Pro Gln Gln Ala Gln Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu
1010 1015 1020
Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val
1025 1030 1035 1040
Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
1045 1050 1055
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu
1060 1065 1070
Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His
1075 1080 1085
Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val
1090 1095 1100
Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr
1105 1110 1115 1120
Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr
1125 1130 1135
Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu
1140 1145 1150
Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp
1155 1160 1165
Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp
1170 1175 1180
Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu
1185 1190 1195 1200
Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile
1205 1210 1215
Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile
1220 1225 1230
Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val
1250 1255 1260
Leu Lys Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 192
<211> 1273
<212> PRT
<213> Artificial Sequence
<220>
<223> spike glycoprotein with two proline substitutions (K986P, V987P)
<400> 192
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu
1010 1015 1020
Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val
1025 1030 1035 1040
Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
1045 1050 1055
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu
1060 1065 1070
Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His
1075 1080 1085
Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val
1090 1095 1100
Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr
1105 1110 1115 1120
Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr
1125 1130 1135
Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu
1140 1145 1150
Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp
1155 1160 1165
Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp
1170 1175 1180
Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu
1185 1190 1195 1200
Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile
1205 1210 1215
Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile
1220 1225 1230
Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val
1250 1255 1260
Leu Lys Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 193
<211> 1273
<212> PRT
<213> Artificial Sequence
<220>
<223> spike glycoprotein with four proline substitutions (F817P,
A892P, A899P, A942P)
<400> 193
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn Asn Ser Tyr
580 585 590
Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr Gln Thr
595 600 605
Gln Thr Asn Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro
610 615 620
Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser
625 630 635 640
Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro
645 650 655
Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser
660 665 670
Thr Gly Ser Asn Val Phe Gln Ser Pro Arg Arg Ala Arg Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile
885 890 895
Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu
1010 1015 1020
Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val
1025 1030 1035 1040
Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
1045 1050 1055
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu
1060 1065 1070
Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His
1075 1080 1085
Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val
1090 1095 1100
Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr
1105 1110 1115 1120
Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr
1125 1130 1135
Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu
1140 1145 1150
Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp
1155 1160 1165
Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp
1170 1175 1180
Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu
1185 1190 1195 1200
Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile
1205 1210 1215
Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile
1220 1225 1230
Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val
1250 1255 1260
Leu Lys Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 194
<211> 1273
<212> PRT
<213> Artificial Sequence
<220>
<223> spike glycoprotein with six proline substitutions (F817P, A892P,
A899P, A942P, K986P, V987P)
<400> 194
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn Asn Ser Tyr
580 585 590
Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr Gln Thr
595 600 605
Gln Thr Asn Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro
610 615 620
Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser
625 630 635 640
Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro
645 650 655
Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser
660 665 670
Thr Gly Ser Asn Val Phe Gln Ser Pro Arg Arg Ala Arg Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile
885 890 895
Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu
1010 1015 1020
Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val
1025 1030 1035 1040
Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
1045 1050 1055
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu
1060 1065 1070
Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His
1075 1080 1085
Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val
1090 1095 1100
Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr
1105 1110 1115 1120
Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr
1125 1130 1135
Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu
1140 1145 1150
Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp
1155 1160 1165
Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp
1170 1175 1180
Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu
1185 1190 1195 1200
Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile
1205 1210 1215
Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile
1220 1225 1230
Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val
1250 1255 1260
Leu Lys Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 195
<211> 1273
<212> PRT
<213> Artificial Sequence
<220>
<223> spike glycoprotein with six proline substitutions (F817P, A892P,
A899P, A942P, K986P, V987P) and a 682-QQAQ-685 mutation
<400> 195
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn Asn Ser Tyr
580 585 590
Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr Gln Thr
595 600 605
Gln Thr Asn Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro
610 615 620
Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser
625 630 635 640
Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro
645 650 655
Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser
660 665 670
Thr Gly Ser Asn Val Phe Gln Ser Pro Gln Gln Ala Gln Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile
885 890 895
Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu
1010 1015 1020
Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val
1025 1030 1035 1040
Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
1045 1050 1055
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu
1060 1065 1070
Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His
1075 1080 1085
Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val
1090 1095 1100
Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr
1105 1110 1115 1120
Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr
1125 1130 1135
Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu
1140 1145 1150
Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp
1155 1160 1165
Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp
1170 1175 1180
Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu
1185 1190 1195 1200
Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile
1205 1210 1215
Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile
1220 1225 1230
Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val
1250 1255 1260
Leu Lys Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 196
<211> 666
<212> PRT
<213> Artificial Sequence
<220>
<223> CoV Spike S1-S2_S2
<400> 196
Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys
1 5 10 15
Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp
20 25 30
Ala Val Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn Asn
35 40 45
Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr
50 55 60
Gln Thr Gln Thr Asn Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile
65 70 75 80
Thr Pro Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn
85 90 95
Thr Ser Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu
100 105 110
Val Pro Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val
115 120 125
Tyr Ser Thr Gly Ser Asn Val Phe Gln Ser Pro Arg Arg Ala Arg Ser
130 135 140
Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu
145 150 155 160
Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe
165 170 175
Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr
180 185 190
Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser
195 200 205
Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala
210 215 220
Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe
225 230 235 240
Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly
245 250 255
Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys
260 265 270
Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp
275 280 285
Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala
290 295 300
Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro
305 310 315 320
Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu
325 330 335
Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu
340 345 350
Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly
355 360 365
Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln
370 375 380
Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala
385 390 395 400
Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala
405 410 415
Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser
420 425 430
Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu
435 440 445
Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr
450 455 460
Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala
465 470 475 480
Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
485 490 495
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln
500 505 510
Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala
515 520 525
Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys
530 535 540
Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp
545 550 555 560
Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp
565 570 575
Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn
580 585 590
Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu
595 600 605
Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu
610 615 620
Gly Asp Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu
625 630 635 640
Ile Asp Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile
645 650 655
Asp Leu Gln Glu Leu Gly Lys Tyr Glu Gln
660 665
<210> 197
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Epitope Linker
<400> 197
Gly Pro Gly Pro Gly
1 5
Claims (255)
1개 이상의 큰 서열을 포함하는 범-코로나바이러스 재조합 백신 조성물로서, 1개 이상의 큰 서열 각각은 하기 중 적어도 하나를 포함하고:
a) 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프;
b) 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및/또는
c) 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프;
적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래되는, 범-코로나바이러스 재조합 백신 조성물.
a) 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프;
b) 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및/또는
c) 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프;
적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래되는, 범-코로나바이러스 재조합 백신 조성물.
2개 이상의 큰 서열을 포함하는 범-코로나바이러스 재조합 백신 조성물로서, 2개 이상의 큰 서열 각각은 하기 중 적어도 하나를 포함하고:
a) 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프;
b) 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및/또는
c) 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프;
적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래되는, 범-코로나바이러스 재조합 백신 조성물.
a) 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프;
b) 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및/또는
c) 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프;
적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래되는, 범-코로나바이러스 재조합 백신 조성물.
범-코로나바이러스 재조합 백신 조성물로서, 전체 스파이크 단백질; 및 하기 중 하나 또는 둘 다를 포함하고:
a) 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및/또는
b) 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프;
적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래되는, 범-코로나바이러스 재조합 백신 조성물.
a) 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및/또는
b) 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프;
적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래되는, 범-코로나바이러스 재조합 백신 조성물.
범-코로나바이러스 재조합 백신 조성물로서, 스파이크 단백질의 적어도 일부로서, 스파이크 단백질의 일부는 삼량체화된 SARS-CoV-2 수용체 결합 도메인(RBD)를 포함하는 스파이크 단백질의 적어도 일부; 및 다음 중 하나 또는 둘 다를 포함하고:
a) 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프;
b) 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프;
적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래되는, 범-코로나바이러스 재조합 백신 조성물.
a) 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프;
b) 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프;
적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래되는, 범-코로나바이러스 재조합 백신 조성물.
범-코로나바이러스 재조합 백신 조성물로서, 전체 스파이크 단백질; 및 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프를 포함하고; 적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래되는, 범-코로나바이러스 재조합 백신 조성물.
범-코로나바이러스 재조합 백신 조성물로서, 스파이크 단백질의 적어도 일부로서, 스파이크 단백질의 일부는 삼량체화된 SARS-CoV-2 수용체 결합 도메인 (RBD)을 포함하는 스파이크 단백질의 적어도 일부; 및 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프를 포함하고; 적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래되는, 범-코로나바이러스 재조합 백신 조성물.
제1항 내지 제6항 중 어느 한 항에 있어서, 비-스파이크 단백질은 ORF1ab 단백질, ORF3a 단백질, 외피 단백질, 멤브레인 당단백질, ORF6 단백질, ORF7a 단백질, ORF7b 단백질, ORF8 단백질, 뉴클레오캡시드 단백질 및 ORF10 단백질인, 조성물.
제1항 내지 제7항 중 어느 한 항에 있어서, 1개 이상의 큰 서열은 인간 및 동물 코로나바이러스 중에서 고도로 보존된 것인, 조성물.
제1항 내지 제8항 중 어느 한 항에 있어서, 1개 이상의 큰 서열은 SARS-CoV-2 단백질 중 적어도 하나로부터 유래된 것인, 조성물.
제1항 내지 제9항 중 어느 한 항에 있어서, 1개 이상의 큰 서열은 현재 순환 중인 하나 이상의 SARS-CoV-2 인간 균주 또는 변이체; 이전 인간 발병을 일으킨 하나 이상의 코로나바이러스; 박쥐, 천산갑, 사향고양이, 밍크, 낙타, 및 코로나바이러스에 수용적인 다른 동물로 이루어진 군으로부터 선택된 동물로부터 단리된 하나 이상의 코로나바이러스; 또는 보통 감기를 유발하는 하나 이상의 코로나바이러스 중 하나 이상으로부터 유래되는, 조성물.
제10항에 있어서, 현재 순환 중인 하나 이상의 SARS-CoV-2 인간 균주 또는 변이체는 균주 B.1.177; 균주 B.1.160, 균주 B.1.1.7; 균주 B.1.351; 균주 P.1; 균주 B.1.427/B.1.429; 균주 B.1.258; 균주 B.1.221; 균주 B.1.367; 균주 B.1.1.277; 균주 B.1.1.302; 균주 B.1.525; 균주 B.1.526, 균주 S:677H, 및 균주 S:677P로부터 선택되는, 조성물.
제10항에 있어서, 보통 감기를 유발하는 하나 이상의 코로나바이러스는 229E 알파 코로나바이러스, NL63 알파 코로나바이러스, OC43 베타 코로나바이러스 및 HKU1 베타 코로나바이러스로부터 선택되는, 조성물.
제1항 내지 제12항 중 어느 한 항에 있어서, 보존된 에피토프는 염려 변이체 또는 관심 변이체로부터 선택되는, 조성물.
제1항 내지 제13항 중 어느 한 항에 있어서, 1개 이상의 큰 서열은 SARS-CoV-2에 의해 발현되는 전체 단백질 서열로부터 유래된 것인, 조성물.
제1항 내지 제14항 중 어느 한 항에 있어서, 1개 이상의 큰 서열은 SARS-CoV-2에 의해 발현되는 부분 단백질 서열로부터 유래된 것인, 조성물.
제1항 내지 제15항 중 어느 한 항에 있어서, 1개 이상의 큰 보존 서열은 전장 스파이크 당단백질로부터 유래된 것인, 조성물.
제1항 내지 제15항 중 어느 한 항에 있어서, 1개 이상의 큰 보존 서열은 부분 스파이크 당단백질로부터 유래된 것인, 조성물.
제16항 또는 제17항 중 어느 한 항에 있어서, 스파이크 단백질은 아미노산 위치 986 및 987에서 2개의 연속적인 프롤린 치환을 갖는 것인, 조성물.
제16항 내지 제18항 중 어느 한 항에 있어서, 스파이크 당단백질은 Tyr-83 및 Tyr-489, Gln-24 및 Asn-487을 포함하는 아미노산 위치에서 단일 아미노산 치환을 갖는 것인, 조성물.
제1항 내지 제19항 중 어느 한 항에 있어서, 1개 이상의 큰 서열은 스파이크 당단백질(S) 또는 이의 일부, 핵단백질 또는 이의 일부, 막 단백질 또는 이의 일부, 및 ORF1a/b 또는 이의 일부를 포함하는, 조성물.
제1항 내지 제19항 중 어느 한 항에 있어서, 1개 이상의 큰 서열은 스파이크 당단백질(S) 또는 이의 일부, 핵단백질 또는 이의 일부, 및 ORF1a/b 또는 이의 일부를 포함하는, 조성물.
제16항 내지 제19항 중 어느 한 항에 있어서, 스파이크 당단백질의 일부는 RBD인, 조성물.
제1항 내지 제22항 중 어느 한 항에 있어서, 1개 이상의 큰 서열은 ORF1ab 단백질, 스파이크 당단백질, ORF3a 단백질, 외피 단백질, 막 당단백질, ORF6 단백질, ORF7a 단백질, ORF7b 단백질, ORF8 단백질, 뉴클레오캡시드 단백질 ORF10, 및 단백질로 이루어진 군으로부터 선택되는, 조성물.
제23항에 있어서, ORF1ab 단백질은 비-구조적 단백질 (Nsp) 1, Nsp2, Nsp3, Nsp4, Nsp5, Nsp6, Nsp7, Nsp8, Nsp9, Nsp10, Nsp11, Nsp12, Nsp13, Nsp14, Nsp15 및 Nsp16을 포함하는, 조성물.
제1항 내지 제24항 중 어느 한 항에 있어서, 큰 서열 중 1개 이상은 다수의 인간 클래스 1 및 클래스 2 HLA 일배체형으로 제한된 T-세포 에피토프를 포함하고 클래스 1에 대한 HLA-0201 또는 클래스 2에 대한 HLA-DR로 제한되는, 조성물.
제1항 내지 제25항 중 어느 한 항에 있어서, 큰 서열은 구조적 단백질, 비-구조적 단백질, 또는 이들의 조합으로부터 유래된 것인, 조성물.
제1항 내지 제26항 중 어느 한 항에 있어서, 큰 서열 중 1개 이상은 유래된 서열번호: 182-185, 서열번호: 148-159, 서열번호: 186-187, 및 서열번호: 191-196으로부터 선택된 단백질로부터 유래된 것인, 조성물.
제1항 내지 제27항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프는 스파이크 당단백질, 외피 단백질, ORF1ab 단백질, ORF7a 단백질, ORF8a 단백질, ORF10 단백질, 또는 이들의 조합으로부터 선택되는, 조성물.
제1항 내지 제28항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프는 S2-10, S1220-1228, S1000-1008, S958-966, E20-28, ORF1ab1675-1683, ORF1ab2363 -2371, ORF1ab3013 -3021, ORF1ab3183 -3191, ORF1ab5470 -5478, ORF1ab6749 -6757, ORF7b26 -34, ORF8a73 -81, ORF103 -11, 및 ORF105 -13으로부터 선택되는, 조성물.
제1항 내지 제29항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프는 서열번호: 2-29로부터 선택되는, 조성물.
제1항 내지 제29항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프는 서열번호: 30-57로부터 선택되는, 조성물.
제1항 내지 제31항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프는 스파이크 당단백질, 외피 단백질, 막 단백질, 뉴클레오캡시드 단백질, ORF1a 단백질, ORF1ab 단백질, ORF6 단백질, ORF7a 단백질, ORF7b 단백질, ORF8 단백질, 또는 이들의 조합으로부터 선택되는, 조성물.
제1항 내지 제32항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프는 ORF1a1350 -1365, ORF1ab5019 -5033, ORF612 -26, ORF1ab6088 -6102, ORF1ab6420 -6434, ORF1a1801 -1815, S1-13, E26-40, E20-34, M176-190, N388-403, ORF7a3 -17, ORF7a1-15, ORF7b8 -22, ORF7a98 -112, 및 ORF81 - 15으로부터 선택되는, 조성물.
제1항 내지 제33항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프는 서열번호: 58-73으로부터 선택되는, 조성물.
제1항 내지 제33항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프는 서열번호: 74-105으로부터 선택되는, 조성물.
제1항 내지 제35항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 B 세포 표적 에피토프는 스파이크 당단백질로부터 선택되는, 조성물.
제1항 내지 제36항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 B 세포 표적 에피토프는 S287-317, S524-598, S601-640, S802-819, S888-909, S369-393, S440-501, S1133-1172, S329-363, 및 S13-37로부터 선택되는, 조성물.
제1항 내지 제37항 중 어느 한 항에 있어서, 하나 이상의 코로나바이러스 B 세포 표적 에피토프는 서열번호: 106-116으로부터 선택되는, 조성물.
제1항 내지 제37항 중 어느 한 항에 있어서, 하나 이상의 코로나바이러스 B 세포 표적 에피토프는 서열번호: 117-138로부터 선택되는, 조성물.
제1항 내지 제39항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 B 세포 표적 에피토프는 큰 서열의 형태인, 조성물.
제40항에 있어서, 큰 서열은 전장 스파이크 당단백질인, 조성물.
제40항에 있어서, 큰 서열은 부분 스파이크 당단백질인, 조성물.
제1항 내지 제42항 중 어느 한 항에 있어서, 각각의 큰 서열은 링커에 의해 분리되는, 조성물.
제43항에 있어서, 링커는 그 길이가 2 내지 10개의 아미노산인, 조성물.
제1항 내지 제44항 중 어느 한 항에 있어서, T 세포 유인 케모카인을 추가로 포함하는, 조성물.
제45항에 있어서, T 세포 유인 케모카인은 CCL5, CXCL9, CXCL10, CXCL11, 또는 이들의 조합인, 조성물.
제1항 내지 제46항 중 어느 한 항에 있어서, T 세포 증식을 촉진하는 조성물을 추가로 포함하는, 조성물.
제47항에 있어서, T 세포 증식을 촉진하는 조성물은 IL-7, IL-2 또는 IL-15인, 조성물.
제1항 내지 제49항 중 어느 한 항에 있어서, 분자 보조제를 추가로 포함하는, 조성물.
제50항에 있어서, 분자 보조제는 CpG인, 조성물.
제54항에 있어서, 분자 보조제는 CpG 중합체인, 조성물.
제50항에 있어서, 분자 보조제는 플라젤린인, 조성물.
제1항 내지 제52항 중 어느 한 항에 있어서, 재조합 백신 조성물은 태그를 포함하는, 조성물.
제53항에 있어서, 태그는 His 태그인, 조성물.
제1항 내지 제54항 중 어느 한 항에 있어서, 약제학적 담체를 추가로 포함하는, 조성물.
제1항 내지 제55항 중 어느 한 항에 있어서, 대상체에서 코로나바이러스 질환을 예방하기 위해 사용되는, 조성물.
제1항 내지 제56항 중 어느 한 항에 있어서, 대상체에서 코로나바이러스 감염을 예방적으로 방지하기 위해 사용되는, 조성물.
제1항 내지 제57항 중 어느 한 항에 있어서, 대상체에서 면역 반응을 유도하는, 조성물.
제1항 내지 제58항 중 어느 한 항에 있어서, 다중 에피토프 범-코로나바이러스 재조합 백신 조성물에 의해 유도된 면역 반응을 연장하고 폐로의 T-세포 이동을 증가시키는, 조성물.
제1항 내지 제59항 중 어느 한 항에 있어서, 스파이크 단백질의 막횡단 앵커는 온전한 S1-S2 절단 부위를 갖는, 조성물.
제1항 내지 제60항 중 어느 한 항에 있어서, 스파이크 단백질은 안정화된 형태인, 조성물.
제1항 내지 제61항 중 어느 한 항에 있어서, 스파이크 단백질은 S2 서브유닛의 중심 나선 상단의 아미노산 위치 986 및 987에서 프롤린 치환으로 안정화되는, 조성물.
제1항 내지 제62항 중 어느 한 항에 있어서, 전장 스파이크 단백질을 포함하는, 재조합 백신 조성물.
제1항 내지 제62항 중 어느 한 항에 있어서, 전장 스파이크 단백질 또는 부분 스파이크 단백질을 포함하는, 재조합 백신 조성물.
제1항 내지 제64항 중 어느 한 항에 있어서, 스파이크 단백질은 Tyr-489 및 Asn-487을 포함하는, 조성물.
제1항 내지 제65항 중 어느 한 항에 있어서, 스파이크 단백질은 Gln-493을 포함하는, 조성물.
제1항 내지 제66항 중 어느 한 항에 있어서, 스파이크 단백질은 Tyr-505를 포함하는, 조성물.
제1항 내지 제67항 중 어느 한 항에 있어서, 삼량체화된 SARS-CoV-2 수용체 결합 도메인(RBD) 서열을 포함하는, 조성물.
제68항에 있어서, 삼량체화된 SARS-CoV-2 수용체 결합 도메인(RBD) 서열은 T4 피브리틴 유래 폴돈 삼량체화 도메인의 부가에 의해 변형되는, 조성물.
제69항에 있어서, T4 피브리틴 유래 폴돈 삼량체화 도메인의 부가는 다가 디스플레이에 의해 면역원성을 증가시키는, 조성물.
제1항 내지 제70항 중 어느 한 항에 있어서, 보존된 에피토프는 우려 변이체 및 관심 변이체로부터 선택되는, 조성물.
제1항 내지 제71항 중 어느 한 항에 있어서, S1-S2 절단 부위에 돌연변이 682-RRAR-685 → 682-QQAQ-685를 포함하는, 조성물.
제1항 내지 제72항 중 어느 한 항에 있어서, 적어도 1개의 프롤린 치환을 포함하는, 조성물.
제1항 내지 제72항 중 어느 한 항에 있어서, 적어도 2개의 프롤린 치환을 포함하는, 조성물.
제73항 또는 제74항에 있어서, 프롤린 치환은 위치 K986 및 V987에 있는 것인, 조성물.
제1항 내지 제75항 중 어느 한 항에 있어서, K986P 및 V987P 돌연변이를 포함하는, 조성물.
제1항 내지 제83항 중 어느 한 항에 있어서, 스파이크 단백질 또는 이의 일부는 서열번호: 195를 포함하는, 조성물.
제1항 내지 제83항 중 어느 한 항에 있어서, 스파이크 단백질 또는 이의 일부는 서열번호: 191 또는 서열번호: 192 중 하나를 포함하는, 조성물.
제1항 내지 제83항 중 어느 한 항에 있어서, 스파이크 단백질 또는 이의 일부는 서열번호: 186-187 및 서열번호: 191-196 중 하나를 포함하는, 조성물.
1개 이상의 큰 서열을 인코딩하는 항원 전달 시스템을 포함하는 범-코로나바이러스 재조합 백신 조성물로서, 1개 이상의 큰 서열 각각은 하기 중 적어도 하나를 포함하고:
a) 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프;
b) 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및/또는
c) 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프;
적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래되는, 범-코로나바이러스 재조합 백신 조성물.
a) 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프;
b) 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및/또는
c) 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프;
적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래되는, 범-코로나바이러스 재조합 백신 조성물.
2개 이상의 큰 서열을 인코딩하는 항원 전달 시스템을 포함하는 범-코로나바이러스 재조합 백신 조성물로서, 2개 이상의 큰 서열 각각은 하기 중 적어도 하나를 포함하고:
a) 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프;
b) 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및/또는
c) 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프;
적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래되는, 범-코로나바이러스 재조합 백신 조성물.
a) 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프;
b) 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및/또는
c) 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프;
적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래되는, 범-코로나바이러스 재조합 백신 조성물.
범-코로나바이러스 재조합 백신 조성물로서, 전체 스파이크 단백질을 인코딩하는 항원 전달 시스템; 및 하기 중 하나 또는 둘 다를 포함하고:
a) 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및/또는
b) 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프;
적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래되는, 범-코로나바이러스 재조합 백신 조성물.
a) 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및/또는
b) 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프;
적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래되는, 범-코로나바이러스 재조합 백신 조성물.
범-코로나바이러스 재조합 백신 조성물로서, 스파이크 단백질의 적어도 일부를 인코딩하는 항원 전달 시스템으로서, 스파이크 단백질의 일부는 삼량체화된 SARS-CoV-2 수용체 결합 도메인(RBD)를 포함하는 항원 전달 시스템; 및 다음 중 하나 또는 둘 다를 포함하고:
a) 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프;
b) 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프;
적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래되는, 범-코로나바이러스 재조합 백신 조성물.
a) 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프;
b) 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프;
적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래되는, 범-코로나바이러스 재조합 백신 조성물.
범-코로나바이러스 재조합 백신 조성물로서, 스파이크 단백질을 인코딩하는 항원 전달 시스템; 및 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프를 포함하고; 적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래되는, 범-코로나바이러스 재조합 백신 조성물.
범-코로나바이러스 재조합 백신 조성물로서, 스파이크 단백질의 적어도 일부를 인코딩하는 항원 전달 시스템로서, 스파이크 단백질의 일부는 삼량체화된 SARS-CoV-2 수용체 결합 도메인 (RBD)을 포함하는 항원 전달 시스템; 및 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프를 포함하고; 적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래되는, 범-코로나바이러스 재조합 백신 조성물.
제80항 내지 제85항 중 어느 한 항에 있어서, 2개 이상의 큰 서열을 포함하는, 조성물.
제80항 내지 제86항 중 어느 한 항에 있어서, 전달 시스템은 아데노바이러스 시스템인, 조성물.
제87항에 있어서, 아데노바이러스 전달 시스템은 Ad26, Ad5, Ad35, 또는 이들의 조합인, 조성물.
제80항 내지 제88항 중 어느 한 항에 있어서, 1개 이상의 큰 서열은 일반 프로모터에 작동적으로 연결된 것인, 조성물.
제89항에 있어서, 일반 프로모터는 CMV 또는 CAG 프로모터인, 조성물.
제80항 내지 제88항 중 어느 한 항에 있어서, 1개 이상의 큰 서열은 폐 특이적 프로모터에 작동적으로 연결된 것인, 조성물.
제91항에 있어서, 폐 특이적 프로모터는 SpB 또는 CD144인, 조성물.
제80항 내지 제92항 중 어느 한 항에 있어서, 항원 전달 시스템은 T 세포 유인 케모카인을 추가로 인코딩하는, 조성물.
제93항에 있어서, T 세포 유인 케모카인은 CCL5, CXCL9, CXCL10, CXCL11, 또는 이들의 조합인, 조성물.
제93항 또는 제94항에 있어서, T 세포 유인 케모카인은 폐 특이적 프로모터에 작동적으로 연결된 것인, 조성물.
제93항 또는 제94항에 있어서, T 세포 유인 케모카인은 일반 프로모터에 작동적으로 연결된 것인, 조성물.
제80항 내지 제96항 중 어느 한 항에 있어서, 항원 전달 시스템은 T 세포 증식을 촉진하는 조성물을 추가로 인코딩하는, 조성물.
제97항에 있어서, T 세포 증식을 촉진하는 조성물은 IL-7, IL-2 또는 IL-15인, 조성물.
제97항 또는 제98항에 있어서, T 세포 증식을 촉진하는 조성물은 폐 특이적 프로모터에 작동적으로 연결된 것인, 조성물.
제97항 또는 제98항에 있어서, T 세포 증식을 촉진하는 조성물은 일반 프로모터에 작동적으로 연결된 것인, 조성물.
제93항 내지 제100항 중 어느 한 항에 있어서, T 세포 유인 케모카인 및 T 세포 증식을 촉진하는 조성물은 동일한 프로모터에 의해 구동되는, 조성물.
제80항 내지 제101항 중 어느 한 항에 있어서, 백신은 T 세포 유인 케모카인 및 T 세포 증식을 촉진하는 조성물을 포함하는 펩티드를 추가로 인코딩하는, 조성물.
제102항에 있어서, 펩티드는 폐 특이적 프로모터에 작동적으로 연결된 것인, 조성물.
제102항에 있어서, 펩티드는 일반 프로모터에 작동적으로 연결된 것인, 조성물.
제80항 내지 제104항 중 어느 한 항에 있어서, 항원 전달 시스템은 분자 보조제를 추가로 인코딩하는, 조성물.
제105항에 있어서, 분자 보조제는 CpG인, 조성물.
제106항에 있어서, 분자 보조제는 CpG 중합체인, 조성물.
제105항에 있어서, 분자 보조제는 플라젤린인, 조성물.
제105항 내지 제108항 중 어느 한 항에 있어서, 분자 보조제는 프로모터에 작동적으로 연결된 것인, 조성물.
제109항에 있어서, 프로모터는 폐 특이적 프로모터 또는 일반 프로모터인, 조성물.
제80항 내지 제110항 중 어느 한 항에 있어서, 1개 이상의 큰 서열은 인간 및 동물 코로나바이러스 중에서 고도로 보존된 것인, 조성물.
제80항 내지 제111항 중 어느 한 항에 있어서, 1개 이상의 큰 서열은 SARS-CoV-2 단백질 중 적어도 하나로부터 유래된 것인, 조성물.
제80항 내지 제112항 중 어느 한 항에 있어서, 1개 이상의 큰 서열은 (a) 현재 순환 중인 하나 이상의 SARS-CoV-2 인간 균주 또는 변이체; (b) 이전 인간 발병을 일으킨 하나 이상의 코로나바이러스; (c) 박쥐, 천산갑, 사향고양이, 밍크, 낙타, 및 코로나바이러스에 수용적인 다른 동물로 이루어진 군으로부터 선택된 동물로부터 단리된 하나 이상의 코로나바이러스; 또는 (d) 보통 감기를 유발하는 하나 이상의 코로나바이러스 중 하나 이상으로부터 유래되는, 조성물.
제113항에 있어서, 현재 순환 중인 하나 이상의 SARS-CoV-2 인간 균주 또는 변이체는 균주 B.1.177; 균주 B.1.160, 균주 B.1.1.7; 균주 B.1.351; 균주 P.1; 균주 B.1.427/B.1.429; 균주 B.1.258; 균주 B.1.221; 균주 B.1.367; 균주 B.1.1.277; 균주 B.1.1.302; 균주 B.1.525; 균주 B.1.526, 균주 S:677H, 및 균주 S:677P로부터 선택되는, 조성물.
제113항에 있어서, 보통 감기를 유발하는 하나 이상의 코로나바이러스는 229E 알파 코로나바이러스, NL63 알파 코로나바이러스, OC43 베타 코로나바이러스 및 HKU1 베타 코로나바이러스로부터 선택되는, 조성물.
제80항 내지 제115항 중 어느 한 항에 있어서, 각각의 큰 서열은 링커에 의해 분리되는, 조성물.
제116항에 있어서, 링커는 그 길이가 2 내지 10개의 아미노산인, 조성물.
제80항 내지 제117항 중 어느 한 항에 있어서, 재조합 백신 조성물은 태그를 포함하는, 조성물.
제118항에 있어서, 태그는 His 태그인, 조성물.
제80항 내지 제119항 중 어느 한 항에 있어서, 큰 서열은 구조적 단백질, 비-구조적 단백질, 또는 이들의 조합으로부터 유래된 것인, 조성물.
제80항 내지 제120항 중 어느 한 항에 있어서, 표적 에피토프는 ORF1ab 단백질, 스파이크 당단백질, ORF3a 단백질, 외피 단백질, 막 당단백질, ORF6 단백질, ORF7a 단백질, ORF7b 단백질, ORF8 단백질, 뉴클레오캡시드 단백질 ORF10, 및 단백질로 이루어진 군으로부터 선택된 SARS-CoV-2 단백질로부터 유래되는, 조성물.
제121항에 있어서, 스파이크 당단백질로부터 유래된 표적 에피토프는 RBD인, 조성물.
제121항에 있어서, 스파이크 당단백질로부터 유래된 표적 에피토프는 NTD인, 조성물.
제121항에 있어서, 스파이크 당단백질로부터 유래된 표적 에피토프는 RBD 및 NTD 영역을 모두 포함하는, 조성물.
제121항 내지 제124항 중 어느 한 항에 있어서, 스파이크 당단백질로부터 유래된 표적 에피토프는 항체를 중화 및 차단함으로써 인식되는, 조성물.
제121항 내지 제124항 중 어느 한 항에 있어서, 스파이크 당단백질로부터 유래된 표적 에피토프는 항체의 중화 및 차단을 유도하는, 조성물.
제121항 내지 제124항 중 어느 한 항에 있어서, 스파이크 당단백질로부터 유래된 표적 에피토프는 바이러스를 인식하고 중화시키는 항체의 중화 및 차단을 유도하는, 조성물.
제121항 내지 제124항 중 어느 한 항에 있어서, 스파이크 당단백질로부터 유래된 표적 에피토프는 스파이크 단백질을 인식하는 항체의 중화 및 차단을 유도하는, 조성물.
제121항에 있어서, ORF1ab 단백질은 비-구조적 단백질 (Nsp) 1, Nsp2, Nsp3, Nsp4, Nsp5, Nsp6, Nsp7, Nsp8, Nsp9, Nsp10, Nsp11, Nsp12, Nsp13, Nsp14, Nsp15 및 Nsp16을 포함하는, 조성물.
제80항 내지 제129항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프는 스파이크 당단백질, 외피 단백질, ORF1ab 단백질, ORF7a 단백질, ORF8a 단백질, ORF10 단백질, 또는 이들의 조합으로부터 선택되는, 조성물.
제80항 내지 제130항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프는 S2-10, S1220-1228, S1000-1008, S958-966, E20-28, ORF1ab1675-1683, ORF1ab2363 -2371, ORF1ab3013 -3021, ORF1ab3183 -3191, ORF1ab5470 -5478, ORF1ab6749 -6757, ORF7b26 -34, ORF8a73 -81, ORF103 -11, 및 ORF105 -13으로부터 선택되는, 조성물.
제80항 내지 제131항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프는 서열번호: 2-29로부터 선택되는, 조성물.
제80항 내지 제131항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프는 서열번호: 30-57로부터 선택되는, 조성물.
제80항 내지 제133항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프는 스파이크 당단백질, 외피 단백질, 막 단백질, 뉴클레오캡시드 단백질, ORF1a 단백질, ORF1ab 단백질, ORF6 단백질, ORF7a 단백질, ORF7b 단백질, ORF8 단백질, 또는 이들의 조합으로부터 선택되는, 조성물.
제80항 내지 제134항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프는 ORF1a1350 -1365, ORF1ab5019 -5033, ORF612 -26, ORF1ab6088-6102, ORF1ab6420 -6434, ORF1a1801 -1815, S1-13, E26-40, E20-34, M176-190, N388-403, ORF7a3-17, ORF7a1 -15, ORF7b8 -22, ORF7a98 -112, 및 ORF81 - 15으로부터 선택되는, 조성물.
제80항 내지 제135항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프는 서열번호: 58-73으로부터 선택되는, 조성물.
제80항 내지 제135항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프는 서열번호: 74-105로부터 선택되는, 조성물.
제80항 내지 제136항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 B 세포 표적 에피토프는 스파이크 당단백질로부터 선택되는, 조성물.
제80항 내지 제137항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 B 세포 표적 에피토프는 S287-317, S524-598, S601-640, S802-819, S888-909, S369-393, S440-501, S1133-1172, S329-363, 및 S13-37로부터 선택되는, 조성물.
제80항 내지 제138항 중 어느 한 항에 있어서, 하나 이상의 코로나바이러스 B 세포 표적 에피토프는 서열번호: 106-116으로부터 선택되는, 조성물.
제80항 내지 제138항 중 어느 한 항에 있어서, 하나 이상의 코로나바이러스 B 세포 표적 에피토프는 서열번호: 117-138로부터 선택되는, 조성물.
제80항 내지 제141항 중 어느 한 항에 있어서, 각각의 큰 서열은 링커에 의해 분리되는, 조성물.
제80항 내지 제141항 중 어느 한 항에 있어서, 큰 서열 중 2개 이상은 링커에 의해 분리되는, 조성물.
제142항 내지 제143항 중 어느 한 항에 있어서, 링커는 그 길이가 2 내지 10개의 아미노산인, 조성물.
제142항 내지 제144항 중 어느 한 항에 있어서, 링커는 T2A를 포함하는, 조성물.
제142항 내지 제144항 중 어느 한 항에 있어서, 링커는 T2A, E2A, 및 P2A로부터 선택되는, 조성물.
제80항 내지 제146항 중 어느 한 항에 있어서, 상이한 링커는 각각의 열린 해독틀 사이에 배치되는, 조성물.
제80항 내지 제147항 중 어느 한 항에 있어서, 재조합 백신 조성물은 태그를 포함하는, 조성물.
제148항에 있어서, 태그는 His 태그인, 조성물.
제80항 내지 제149항 중 어느 한 항에 있어서, 약제학적 담체를 추가로 포함하는, 조성물.
제80항 내지 제150항 중 어느 한 항에 있어서, 조성물은 대상체에서 코로나바이러스 질환을 예방하기 위해 사용되는, 조성물.
제80항 내지 제151항 중 어느 한 항에 있어서, 대상체에서 코로나바이러스 감염을 예방적으로 방지하기 위해 사용되는, 조성물.
제80항 내지 제152항 중 어느 한 항에 있어서, 조성물은 대상체에서 면역 반응을 유도하는, 조성물.
제80항 내지 제153항 중 어느 한 항에 있어서, 다중 에피토프 범-코로나바이러스 재조합 백신 조성물에 의해 유도된 면역 반응을 연장하고 폐로의 T-세포 이동을 증가시키는, 조성물.
제80항 내지 제154항 중 어느 한 항에 있어서, 백신 작제물은 인간용인, 조성물.
제155항에 있어서, 재조합 백신 조성물은 인간 CXCL-11 및 IL-7 또는 IL-2 또는 IL-15를 포함하는, 조성물.
제1항 내지 제154항 중 어느 한 항에 있어서, 백신 작제물은 동물용인, 조성물.
제60항에 있어서, 재조합 백신 조성물은 동물 CXCL-11 및 IL-7 또는 IL-2 또는 IL-15를 포함하는, 조성물.
제157항 또는 제158항에 있어서, 동물은 고양이 및 개인, 조성물.
제1항 내지 제159항 중 어느 한 항에 있어서, 백신으로서 사용하기 위한 것인, 조성물.
제1항 내지 제160항 중 어느 한 항에 있어서, 조성물은 코로나바이러스 감염 및 질환의 예방 및 치료를 위한 면역요법으로서 사용하기 위한 것인, 조성물.
제1항 내지 제161항 중 어느 한 항에 따른 rVSV-panCoV 재조합 백신 조성물.
제1항 내지 제161항 중 어느 한 항에 따른 rAdV-panCoV 재조합 백신 조성물.
서열번호: 139-147 중 어느 하나를 포함하는 범-코로나바이러스 재조합 백신 조성물.
대상체에서 코로나바이러스 질환을 예방하는 방법으로서, 제1항 내지 제164항 중 어느 한 항에 따른 범-코로나바이러스 재조합 백신 조성물의 치료적 유효량을 대상체에게 투여하는 것을 포함하며, 조성물은 대상체에서 면역 반응을 유도하는, 방법.
대상체에서 코로나바이러스 질환을 예방적으로 방지하는 방법으로서, 제1항 내지 제164항 중 어느 한 항에 따른 범-코로나바이러스 재조합 백신 조성물의 예방적 유효량을 대상체에게 투여하는 것을 포함하는, 방법.
대상체에서 면역 반응을 유도하는 방법으로서, 대상체에게 제1항 내지 제164항 중 어느 한 항에 따른 조성물을 투여하는 것을 포함하는, 방법.
제1항 내지 제164항 중 어느 한 항에 따른 범-코로나바이러스 재조합 백신 조성물을 대상체에게 투여하는 것을 포함하는 방법으로서, 조성물은 바이러스는 복제되는 폐, 뇌 및 다른 구획에서 바이러스 복제를 예방하는, 방법.
제1항 내지 제164항 중 어느 한 항에 따른 범-코로나바이러스 재조합 백신 조성물을 대상체에게 투여하는 것을 포함하는 방법으로서, 조성물은 바이러스는 복제되는 폐, 뇌 및 다른 구획에서 사이토카인 폭풍을 예방하는, 방법.
제1항 내지 제164항 중 어느 한 항에 따른 범-코로나바이러스 재조합 백신 조성물을 대상체에게 투여하는 것을 포함하는 방법으로서, 조성물은 바이러스는 복제되는 폐, 뇌 및 다른 구획에서 염증 또는 염증 반응을 예방하는, 방법.
제1항 내지 제164항 중 어느 한 항에 따른 범-코로나바이러스 재조합 백신 조성물을 대상체에게 투여하는 것을 포함하는 방법으로서, 조성물은 바이러스는 복제되는 폐, 뇌 및 기타 구획에서 T 세포의 귀소 및 체류를 개선하는, 방법
대상체에서 코로나바이러스 질환을 예방하는 방법으로서, 제1항 내지 제164항 중 어느 한 항에 따른 범-코로나바이러스 재조합 백신 조성물을 대상체에게 투여하는 것을 포함하며, 조성물은 기억 B 및 T 세포를 유도하는, 방법.
제172항에 있어서, 조성물은 상주 기억 T 세포(Trm)를 유도하는, 방법.
범-코로나바이러스 백신에 의해 유도된 면역 반응을 연장하고 폐로의 T-세포 이동을 증가시키는 방법으로서, T-세포 유인 케모카인, T 세포 증식을 촉진하는 조성물, 및 제1항 내지 제164항 중 어느 한 항에 따른 범-코로나바이러스 재조합 백신 조성물을 동시 발현시키는 것을 포함하는, 방법.
범-코로나바이러스 백신에 의해 유도된 폐로의 기억 T 세포의 체류를 연장하고 바이러스 특이적 조직 상주 기억 T-세포(TRM 세포)를 증가시키는 방법으로서, T-세포 유인 케모카인, T 세포 증식을 촉진하는 조성물, 및 제1항 내지 제164항 중 어느 한 항에 따른 범-코로나바이러스 백신을 동시 발현시키는 것을 포함하는, 방법.
제1항 내지 제164항 중 어느 한 항에 따른 범-코로나바이러스 재조합 백신 조성물을 대상체에게 투여하는 것을 포함하는 방법으로서, 조성물은 코로나바이러스의 돌연변이 및 변이체의 발달을 예방하는, 방법.
제165항 내지 제176항 중 어느 한 항에 있어서, 백신은 정맥내 경로(i.v.), 비강내 경로(i.n.), 또는 설하 경로(s.l.)를 통해 투여되는, 방법.
제165항 내지 제177항 중 어느 한 항에 있어서, 재조합 백신 조성물은 코로나바이러스 질환 또는 감염에 대해 효율적이고 강력한 보호를 유도하는, 방법.
제165항 내지 제178항 중 어느 한 항에 있어서, 재조합 백신 조성물은 항체(Abs), CD4+ T 헬퍼(Th1) 세포, 및 CD8+ 세포독성 T-세포(CTL)의 생산을 유도하는, 방법.
제165항 내지 제179항 중 어느 한 항에 있어서, T-세포 유인 케모카인, T 세포 증식을 촉진하는 조성물, 및 범-코로나바이러스 백신 중 하나 이상이 프로모터에 작동적으로 연결되는, 방법.
제180항에 있어서, 프로모터는 폐 특이적 프로모터인, 방법.
제181항에 있어서, 폐 특이적 프로모터는 SP-B 또는 CD144인, 방법.
제180항에 있어서, 프로모터는 일반 프로모터인, 방법.
제183항에 있어서, 프로모터는 인간 사이토메갈로바이러스 즉시 초기 인핸서/프로모터(CMV)인, 방법.
제165항 내지 제185항 중 어느 한 항에 있어서, T 세포 증식을 촉진하는 조성물은 IL-7, IL-2, 또는 IL-15인, 방법.
제165항 내지 제186항 중 어느 한 항에 있어서, T 세포 증식을 촉진하는 조성물은 장기간 면역을 촉진하는 데 도움이 되는, 방법.
제165항 내지 제187항 중 어느 한 항에 있어서, T 세포 유인 케모카인은 CCL5, CXCL9, CXCL10, CXCL11, 또는 이들의 조합인, 방법.
제165항 내지 제188항 중 어느 한 항에 있어서, T-세포 유인 케모카인은 T-세포를 순환으로부터 폐로 끌어당기는 것을 돕는 것인, 방법.
방법으로서,
a. 제1 전달 시스템을 사용하여 제1항 내지 제164항 중 어느 한 항에 따른 범-코로나바이러스 백신 조성물의 제1 용량을 투여하는 단계; 및
b. 제2 전달 시스템을 사용하여 제2 용량을 투여하는 단계를 포함하고;
제1 및 제2 전달 시스템은 상이한 것인, 방법.
a. 제1 전달 시스템을 사용하여 제1항 내지 제164항 중 어느 한 항에 따른 범-코로나바이러스 백신 조성물의 제1 용량을 투여하는 단계; 및
b. 제2 전달 시스템을 사용하여 제2 용량을 투여하는 단계를 포함하고;
제1 및 제2 전달 시스템은 상이한 것인, 방법.
제189항에 있어서, 제1 전달 시스템은 RNA, 변형된 mRNA, 또는 펩티드 전달 시스템을 포함할 수 있는, 방법.
제189항 또는 제190항에 있어서, 제2 전달 시스템은 RNA, 변형된 mRNA, 또는 펩티드 전달 시스템을 포함할 수 있는, 방법.
제189항에 있어서, 펩티드 전달 시스템은 아데노바이러스 또는 아데노 연관 바이러스인, 방법.
제190항에 있어서, 아데노바이러스 전달 시스템은 Ad26, Ad5, Ad35, 또는 이들의 조합인, 방법.
제190항에 있어서, 아데노 연관 전달 시스템은 AAV8 또는 AAV9인, 방법.
제189항 내지 제194항 중 어느 한 항에 있어서, 제2 백신 용량은 제1 백신 용량 후 14일에 투여되는, 방법.
하기를 포함하는 방법:
a) 제1항 내지 제164항 중 어느 한 항에 따른 범-코로나바이러스 재조합 백신 조성물을 투여하는 단계; 및
b) 범-코로나바이러스 재조합 백신 조성물을 투여한 후 적어도 하나의 T-세포 유인 케모카인을 투여하는 단계.
a) 제1항 내지 제164항 중 어느 한 항에 따른 범-코로나바이러스 재조합 백신 조성물을 투여하는 단계; 및
b) 범-코로나바이러스 재조합 백신 조성물을 투여한 후 적어도 하나의 T-세포 유인 케모카인을 투여하는 단계.
제196항에 있어서, 재조합 백신 조성물은 RNA, 변형된 mRNA, 또는 펩티드 전달 시스템을 통해 투여되는, 방법.
제196항 또는 제197항에 있어서, T-세포 유인 케모카인은 RNA, 변형된 mRNA, 또는 펩티드 전달 시스템을 통해 투여되는, 방법.
제196항 내지 제198항 중 어느 한 항에 있어서, 펩티드 전달 시스템은 아데노바이러스 또는 아데노 연관 바이러스인, 방법.
제199항에 있어서, 아데노바이러스 전달 시스템은 Ad26, Ad5, Ad35, 또는 이들의 조합인, 방법.
제199항에 있어서, 아데노 연관 전달 시스템은 AAV8 또는 AAV9인, 방법.
제196항 내지 제201항 중 어느 한 항에 있어서, T-세포 유인 케모카인은 재조합 백신 조성물의 투여 후 14일에 투여되는, 방법.
제196항 내지 제202항 중 어느 한 항에 있어서, T-세포 유인 케모카인은 CCL5, CXCL9, CXCL10, CXCL11, 또는 이들의 조합인, 방법.
하기를 포함하는 방법:
a) 제1항 내지 제164항 중 어느 한 항에 따른 범-코로나바이러스 재조합 백신 조성물을 투여하는 단계; 및
b) 범-코로나바이러스 재조합 백신 조성물을 투여한 후 적어도 하나의 T-세포 유인 케모카인을 투여하는 단계; 및
c) T-세포 유인 케모카인을 투여한 후 적어도 하나의 사이토카인을 투여하는 단계.
a) 제1항 내지 제164항 중 어느 한 항에 따른 범-코로나바이러스 재조합 백신 조성물을 투여하는 단계; 및
b) 범-코로나바이러스 재조합 백신 조성물을 투여한 후 적어도 하나의 T-세포 유인 케모카인을 투여하는 단계; 및
c) T-세포 유인 케모카인을 투여한 후 적어도 하나의 사이토카인을 투여하는 단계.
제204항에 있어서, 재조합 백신 조성물은 RNA, 변형된 mRNA, 또는 펩티드 전달 시스템을 통해 투여되는, 방법.
제204항 내지 제205항 중 어느 한 항에 있어서, T-세포 유인 케모카인은 RNA, 변형된 mRNA, 또는 펩티드 전달 시스템을 통해 투여되는, 방법.
제204항 내지 제206항 중 어느 한 항에 있어서, 사이토카인은 RNA, 변형된 mRNA, 또는 펩티드 전달 시스템을 통해 투여되는, 방법.
제204항 내지 제207항 중 어느 한 항에 있어서, 펩티드 전달 시스템은 아데노바이러스 또는 아데노 연관 바이러스인, 방법.
제208항에 있어서, 아데노바이러스 전달 시스템은 Ad26, Ad5, Ad35, 또는 이들의 조합인, 방법.
제208항에 있어서, 아데노 연관 전달 시스템은 AAV8 또는 AAV9인, 방법.
제204항 내지 제210항 중 어느 한 항에 있어서, T-세포 유인 케모카인은 재조합 백신 조성물의 투여 후 14일에 투여되는, 방법.
제204항 내지 제211항 중 어느 한 항에 있어서, T-세포 유인 케모카인은 CCL5, CXCL9, CXCL10, CXCL11, 또는 이들의 조합인, 방법.
제204항 내지 제212항 중 어느 한 항에 있어서, 사이토카인은 T-세포 유인 케모카인의 투여 후 10일에 투여되는, 방법.
제16항에 있어서, 사이토카인은 IL-7, IL-15, 또는 이들의 조합인, 방법.
하기를 포함하는 방법:
a) 제1항 내지 제164항 중 어느 한 항에 따른 범-코로나바이러스 재조합 백신 조성물을 투여하는 단계; 및
b) 범-코로나바이러스 재조합 백신 조성물을 투여한 후 하나 이상의 T-세포 유인 케모카인을 투여하는 단계; 및
c) 하나 이상의 점막 케모카인을 투여하는 단계.
a) 제1항 내지 제164항 중 어느 한 항에 따른 범-코로나바이러스 재조합 백신 조성물을 투여하는 단계; 및
b) 범-코로나바이러스 재조합 백신 조성물을 투여한 후 하나 이상의 T-세포 유인 케모카인을 투여하는 단계; 및
c) 하나 이상의 점막 케모카인을 투여하는 단계.
제215항에 있어서, 재조합 백신 조성물은 변형된 RNA, 아데노 연관 바이러스, 또는 아데노바이러스를 사용하여 투여되는, 방법.
제215항 내지 제216항 중 어느 한 항에 있어서, T-세포 유인 케모카인은 RNA, 변형된 mRNA, 또는 펩티드 전달 시스템을 통해 투여되는, 방법.
제215항 내지 제216항 중 어느 한 항에 있어서, 점막 케모카인은 RNA, 변형된 mRNA, 또는 펩티드 전달 시스템을 통해 투여되는, 방법.
제218항에 있어서, 아데노 연관 바이러스는 AAV8 또는 AAV9인, 방법.
제218항에 있어서, 아데노바이러스는 Ad26, Ad5, Ad35, 또는 이들의 조합인, 방법.
제215항 내지 제220항 중 어느 한 항에 있어서, T-세포 유인 케모카인은 재조합 백신 조성물의 투여 후 14일에 투여되는, 방법.
제215항 내지 제221항 중 어느 한 항에 있어서, T-세포 유인 케모카인은 CCL5, CXCL9, CXCL10, CXCL11, 또는 이들의 조합인, 방법.
제215항 내지 제222항 중 어느 한 항에 있어서, 점막 케모카인은 T-세포 유인 케모카인의 투여 후 10일에 투여되는, 방법.
제215항 내지 제223항 중 어느 한 항에 있어서, 점막 케모카인은 CCL25, CCL28, CXCL14, 또는 CXCL17, 또는 이들의 조합인, 방법.
제215항 내지 제224항 중 어느 한 항에 있어서, 재조합 백신 조성물은 2회 용량을 통해 투여되는, 방법.
제215항 내지 제225항 중 어느 한 항에 있어서, 용량은 약 3주 간격인, 방법.
1개 이상의 큰 서열을 포함하는 범-코로나바이러스 재조합 백신 조성물로서, 1개 이상의 큰 서열 각각은 하기 중 적어도 하나를 포함하고:
a) 전체 스파이크 단백질 또는 이의 일부;
b) 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및
c) 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프;
적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래되는, 범-코로나바이러스 재조합 백신 조성물.
a) 전체 스파이크 단백질 또는 이의 일부;
b) 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및
c) 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프;
적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래되는, 범-코로나바이러스 재조합 백신 조성물.
제227항에 있어서, 하나 이상의 보존된 에피토프는 인간 및 동물 코로나바이러스 중에서 고도로 보존된 것인, 조성물.
제227항 내지 제228항 중 어느 한 항에 있어서, 하나 이상의 보존된 에피토프는 SARS-CoV-2 단백질 중 적어도 하나로부터 유래된 것인, 조성물.
제227항 내지 제229항 중 어느 한 항에 있어서, 조성물은 2 내지 20개의 CD8+ T 세포 표적 에피토프를 포함하는, 조성물.
제227항 내지 제230항 중 어느 한 항에 있어서, 조성물은 2 내지 20개의 CD4+ T 세포 표적 에피토프를 포함하는, 조성물.
제227항 내지 제231항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프는 서열번호: 58-105 (ORF1a1350 -1365, ORF1ab5019 -5033, ORF612 -26, ORF1ab6088 -6102, ORF1ab6420 -6434, ORF1a1801 -1815, S1-13, E26-40, E20-34, M176-190, N388-403, ORF7a3 -17, ORF7a1 -15, ORF7b8 -22, ORF7a98 -112, 및 ORF81 - 15)로부터 선택되는, 조성물.
제227항 내지 제232항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프는 서열번호: 106-138 (S287-317, S524-598, S601-640, S802-819, S888-909, S369-393, S440-501, S1133-1172, S329-363, 및 S13- 37)로부터 선택되는, 조성물.
1개 이상의 큰 서열을 포함하는 범-코로나바이러스 재조합 백신 조성물로서, 1개 이상의 큰 서열 각각은 하기 중 적어도 하나를 포함하고:
a) 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프;
b) 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및/또는
c) 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프;
적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래되는, 범-코로나바이러스 재조합 백신 조성물.
a) 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프;
b) 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및/또는
c) 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프;
적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래되는, 범-코로나바이러스 재조합 백신 조성물.
제234항에 있어서, 하나 이상의 보존된 에피토프는 SARS-CoV-2 단백질 중 적어도 하나로부터 유래된 것인, 조성물.
제234항 내지 제235항 중 어느 한 항에 있어서, 조성물은 2 내지 20개의 CD8+ T 세포 표적 에피토프를 포함하는, 조성물.
제234항 내지 제236항 중 어느 한 항에 있어서, 조성물은 2 내지 20개의 CD4+ T 세포 표적 에피토프를 포함하는, 조성물.
제234항 내지 제237항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프는 서열번호: 58-105 (ORF1a1350 -1365, ORF1ab5019 -5033, ORF612 -26, ORF1ab6088 -6102, ORF1ab6420 -6434, ORF1a1801 -1815, S1-13, E26-40, E20-34, M176-190, N388-403, ORF7a3 -17, ORF7a1 -15, ORF7b8 -22, ORF7a98 -112, 및 ORF81 - 15)로부터 선택되는, 조성물.
제234항 내지 제238항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프는 서열번호: 106-138 (S287-317, S524-598, S601-640, S802-819, S888-909, S369-393, S440-501, S1133-1172, S329-363, 및 S13- 37)로부터 선택되는, 조성물.
제234항 내지 제239항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프는 서열번호: 2-57 (S2-10, S1220-1228, S1000-1008, S958-966, E20-28, ORF1ab1675 -1683, ORF1ab2363 -2371, ORF1ab3013 -3021, ORF1ab3183 -3191, ORF1ab5470 -5478, ORF1ab6749-6757, ORF7b26 -34, ORF8a73 -81, ORF103 -11, 및 ORF105 - 13)으로부터 선택되는, 조성물.
1개 이상의 큰 서열을 인코딩하는 항원 전달 시스템을 포함하는 범-코로나바이러스 재조합 백신 조성물로서, 큰 서열은 하기 중 적어도 하나를 포함하고:
a) 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프;
b) 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및/또는
c) 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프;
적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래되는, 범-코로나바이러스 재조합 백신 조성물.
a) 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프;
b) 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및/또는
c) 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프;
적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래되는, 범-코로나바이러스 재조합 백신 조성물.
제241항에 있어서, 항원 전달 시스템은 아데노바이러스 기반 항원 전달 시스템인, 조성물.
제242항에 있어서, 아데노바이러스 기반 항원 전달 시스템은 Ad26, Ad5, Ad35, 또는 이들의 조합인, 조성물.
제241항 내지 제243항 중 어느 한 항에 있어서, 항원 전달 시스템은 T 세포 유인 케모카인을 추가로 인코딩하는, 조성물.
제241항 내지 제244항 중 어느 한 항에 있어서, 항원 전달 시스템은 T 세포 증식을 촉진하는 조성물을 추가로 인코딩하는, 조성물.
제241항 내지 제245항 중 어느 한 항에 있어서, 항원 전달 시스템은 분자 보조제를 추가로 인코딩하는, 조성물.
제241항 내지 제246항 중 어느 한 항에 있어서, 에피토프는 폐 특이적 프로모터에 작동적으로 연결된 것인, 조성물.
제241항 내지 제247항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프는 서열번호: 2-57 (S2-10, S1220-1228, S1000-1008, S958-966, E20-28, ORF1ab1675 -1683, ORF1ab2363 -2371, ORF1ab3013 -3021, ORF1ab3183 -3191, ORF1ab5470 -5478, ORF1ab6749-6757, ORF7b26 -34, ORF8a73 -81, ORF103 -11, 및 ORF105 - 13)으로부터 선택되는, 조성물.
제241항 내지 제248항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프는 서열번호: 58-105 (ORF1a1350 -1365, ORF1ab5019 -5033, ORF612 -26, ORF1ab6088 -6102, ORF1ab6420 -6434, ORF1a1801 -1815, S1-13, E26-40, E20-34, M176-190, N388-403, ORF7a3 -17, ORF7a1 -15, ORF7b8 -22, ORF7a98 -112, 및 ORF81 - 15)로부터 선택되는, 조성물.
제241항 내지 제249항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프는 서열번호: 106-138 (S287-317, S524-598, S601-640, S802-819, S888-909, S369-393, S440-501, S1133-1172, S329-363, 및 S13- 37)로부터 선택되는, 조성물.
제241항 내지 제250항 중 어느 한 항에 있어서, 스파이크 단백질 또는 부분 스파이크 단백질을 포함하는, 조성물.
제251항에 있어서, 부분 스파이크 단백질은 삼량체화된 SARS-CoV-2 수용체 결합 도메인(RBD)을 포함하는, 조성물.
제251항 내지 제252항 중 어느 한 항에 있어서, 전체 스파이크 단백질 또는 부분 스파이크 단백질은 온전한 S1-S2 절단 부위를 갖는 것인, 조성물.
제251항 내지 제253항 중 어느 한 항에 있어서, 스파이크 단백질은 아미노산 위치 986 및 987에서 프롤린 치환으로 안정화되는, 조성물.
서열번호: 139-147 중 어느 하나를 포함하는 범-코로나바이러스 재조합 백신 조성물.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063009907P | 2020-04-14 | 2020-04-14 | |
US63/009,907 | 2020-04-14 | ||
US202063084421P | 2020-09-28 | 2020-09-28 | |
US63/084,421 | 2020-09-28 | ||
PCT/US2021/027355 WO2021211760A1 (en) | 2020-04-14 | 2021-04-14 | Large sequence pan-coronavirus vaccine compositions |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230002571A true KR20230002571A (ko) | 2023-01-05 |
Family
ID=78084328
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227038797A KR20230002571A (ko) | 2020-04-14 | 2021-04-14 | 큰 서열 범-코로나바이러스 백신 조성물 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20230226173A1 (ko) |
EP (3) | EP4135762A4 (ko) |
JP (1) | JP2023521837A (ko) |
KR (1) | KR20230002571A (ko) |
CN (1) | CN116033920A (ko) |
AU (1) | AU2021254768A1 (ko) |
CA (1) | CA3178834A1 (ko) |
IL (1) | IL297335A (ko) |
WO (3) | WO2021211749A1 (ko) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB202307565D0 (en) | 2020-04-22 | 2023-07-05 | BioNTech SE | Coronavirus vaccine |
WO2022013609A1 (en) * | 2020-07-13 | 2022-01-20 | Immunovaccine Technologies, Inc. | Sars-cov-2 vaccine compositions and methods of preparation and use |
EP4333868A1 (en) * | 2021-05-04 | 2024-03-13 | King Abdullah University Of Science And Technology | Immuogenic compositions of mutant sars-cov-2 n protein and gene and methods of use thereof |
CN114560916A (zh) * | 2021-05-18 | 2022-05-31 | 深圳市因诺转化医学研究院 | SARS-CoV-2编码蛋白来源的T细胞表位多肽KLLEQWNLV及其应用 |
WO2023283642A2 (en) * | 2021-07-09 | 2023-01-12 | Modernatx, Inc. | Pan-human coronavirus concatemeric vaccines |
EP4366765A1 (en) * | 2021-07-09 | 2024-05-15 | Atossa Therapeutics, Inc. | Compositions and methods to increase coronavirus immune response |
WO2023044542A1 (en) * | 2021-09-24 | 2023-03-30 | The University Of Adelaide | Sars cov-2 vaccine |
CN114395017A (zh) * | 2021-10-29 | 2022-04-26 | 中国科学院深圳先进技术研究院 | SARS-CoV-2病毒样颗粒的制备方法及其应用 |
EP4176898A1 (en) * | 2021-11-08 | 2023-05-10 | Charité - Universitätsmedizin Berlin | Pan sars-cov2 vaccine antigen |
CN114181320B (zh) * | 2021-12-09 | 2023-04-25 | 新疆医科大学第一附属医院 | 一种针对新冠原始株和变异株的重组多表位疫苗rSMEV及其应用 |
CN114478716B (zh) * | 2021-12-28 | 2024-05-28 | 梅州市人民医院(梅州市医学科学院) | 一种多肽组合及其在新型冠状病毒抗体检测中的应用 |
WO2023159082A2 (en) * | 2022-02-15 | 2023-08-24 | Ohio State Innovation Foundation | Nanotechnology based intranasal vaccine for covid-19 comprising chitosan |
WO2023240148A2 (en) * | 2022-06-07 | 2023-12-14 | The Regents Of The University Of California | Hybrid flu-coronavirus vaccine |
US11878055B1 (en) | 2022-06-26 | 2024-01-23 | BioNTech SE | Coronavirus vaccine |
WO2024011163A1 (en) * | 2022-07-06 | 2024-01-11 | Georgia State University Research Foundation, Inc. | Coronavirus vaccines and methods of use thereof |
WO2024064965A2 (en) * | 2022-09-23 | 2024-03-28 | Advanced Rna Vaccine (Arv) Technologies, Inc. | Nucleic acid-based universal vaccine and methods of use thereof |
WO2024074634A1 (en) * | 2022-10-06 | 2024-04-11 | BioNTech SE | Rna compositions targeting claudin-18.2 |
CN116041540A (zh) * | 2022-11-18 | 2023-05-02 | 中山大学 | 一种增强新冠突变株疫苗广谱性的方法及新冠广谱疫苗 |
CN117330750A (zh) * | 2023-12-01 | 2024-01-02 | 北京生物制品研究所有限责任公司 | 一种筛选新冠病毒早期毒种的方法和制造疫苗的方法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005012337A2 (en) * | 2003-07-15 | 2005-02-10 | Crucell Holland B.V. | Antigenic peptides of sars coronavirus and uses thereof |
KR101206206B1 (ko) * | 2003-07-22 | 2012-11-29 | 크루셀 홀란드 비.브이. | 사스-코로나바이러스에 대한 결합분자 및 그것의 용도 |
CA2561245C (en) * | 2004-04-09 | 2013-06-18 | Wyeth | Synergistic attenuation of vesicular stomatitis virus, vectors thereof and immunogenic compositions thereof |
US8394386B2 (en) * | 2004-04-28 | 2013-03-12 | The Trustees Of The University Of Pennsylvania | Sequential delivery of immunogenic molecules via adenovirus and adeno-associated virus-mediated administrations |
JP2008545180A (ja) * | 2005-05-12 | 2008-12-11 | メルク エンド カムパニー インコーポレーテッド | T細胞エピトープの全自動選択システムおよび方法 |
EP2368569A3 (en) * | 2006-01-18 | 2012-05-02 | University Of Chicago | Compositions and methods related to staphylococcal bacterium proteins |
DK2134742T3 (da) * | 2007-02-27 | 2012-08-06 | Wyeth Llc | Immunogene sammensætninger til behandling og forebyggelse af infektioner hos dyr |
WO2009117134A2 (en) * | 2008-03-21 | 2009-09-24 | National Institutes Of Health | Aerosolized genetic vaccines and methods of use |
EP2358757B1 (en) * | 2008-11-18 | 2018-09-12 | Beth Israel Deaconess Medical Center | Antiviral vaccines with improved cellular immunogenicity |
KR102019728B1 (ko) * | 2009-04-17 | 2019-09-09 | 글로브이뮨 | 암에 대한 병용 면역요법 조성물 및 방법 |
CN101792491B (zh) * | 2009-11-05 | 2012-07-25 | 中国人民解放军第四军医大学 | 一种基于多串联表位的重组腺病毒hiv疫苗及其制备方法 |
-
2021
- 2021-04-14 CA CA3178834A patent/CA3178834A1/en active Pending
- 2021-04-14 WO PCT/US2021/027341 patent/WO2021211749A1/en unknown
- 2021-04-14 AU AU2021254768A patent/AU2021254768A1/en active Pending
- 2021-04-14 CN CN202180042301.9A patent/CN116033920A/zh active Pending
- 2021-04-14 EP EP21787613.5A patent/EP4135762A4/en active Pending
- 2021-04-14 EP EP21788911.2A patent/EP4135764A4/en active Pending
- 2021-04-14 EP EP21789197.7A patent/EP4135765A4/en active Pending
- 2021-04-14 WO PCT/US2021/027355 patent/WO2021211760A1/en unknown
- 2021-04-14 JP JP2022562334A patent/JP2023521837A/ja active Pending
- 2021-04-14 WO PCT/US2021/027340 patent/WO2021211748A1/en unknown
- 2021-04-14 KR KR1020227038797A patent/KR20230002571A/ko active Search and Examination
- 2021-04-14 IL IL297335A patent/IL297335A/en unknown
-
2022
- 2022-10-13 US US18/046,462 patent/US20230226173A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US20230226173A1 (en) | 2023-07-20 |
CN116033920A (zh) | 2023-04-28 |
WO2021211748A1 (en) | 2021-10-21 |
EP4135765A1 (en) | 2023-02-22 |
EP4135762A1 (en) | 2023-02-22 |
WO2021211749A1 (en) | 2021-10-21 |
CA3178834A1 (en) | 2021-10-21 |
EP4135765A4 (en) | 2024-05-08 |
JP2023521837A (ja) | 2023-05-25 |
EP4135762A4 (en) | 2024-05-15 |
EP4135764A1 (en) | 2023-02-22 |
EP4135764A4 (en) | 2024-05-08 |
AU2021254768A1 (en) | 2022-11-17 |
WO2021211760A1 (en) | 2021-10-21 |
IL297335A (en) | 2022-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20230002571A (ko) | 큰 서열 범-코로나바이러스 백신 조성물 | |
US20240042014A1 (en) | Nucleic acid vaccine against the sars-cov-2 coronavirus | |
AU2023202423A1 (en) | Alphavirus neoantigen vectors | |
KR20210013105A (ko) | 공유 항원 | |
KR20190098147A (ko) | 신생항원의 바이러스성 전달 | |
KR20220016137A (ko) | 변형된 아데노바이러스 | |
KR20210090650A (ko) | 알파바이러스 신생항원 벡터 및 인터페론 억제제 | |
KR20220041844A (ko) | Hiv 항원 및 mhc 복합체 | |
KR20210013589A (ko) | 면역 체크포인트 억제제 공동-발현 벡터 | |
US11872276B2 (en) | Zika virus chimeric polyepitope comprising non-structural proteins and its use in an immunogenic composition | |
US11767352B2 (en) | Histone anti-cancer vaccines | |
JPH08511936A (ja) | 多発性硬化症ウィルス | |
Olech | The genetic variability of small-ruminant lentiviruses and its impact on tropism, the development of diagnostic tests and vaccines and the effectiveness of control programmes | |
KR20230006825A (ko) | 전염성 질병 항원 및 백신 | |
US6855323B2 (en) | Identification of the domain of Plasmodium falciparum erythrocyte membrane protein 1 (PfEMP1) that mediates adhesion to chondroitin sulfate A | |
US20070190065A1 (en) | Nucleic acids, polypeptides, methods of expression, and immunogenic compositions associated with SARS corona virus spike protein | |
US20230173060A1 (en) | Large sequence pan-coronavirus vaccine compositions | |
RU2803566C2 (ru) | Неоантигенные векторы на основе альфавируса | |
KR20230117163A (ko) | 상동 아데노바이러스 백신접종 | |
RU2765658C9 (ru) | Выделение нового пестивируса, вызывающего врожденный тремор а | |
RU2765658C2 (ru) | Выделение нового пестивируса, вызывающего врожденный тремор а | |
TW201142027A (en) | High-yield transgenic mammalian expression system for generating virus-like particles |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination |