KR20230134487A - Rna 구조체 - Google Patents
Rna 구조체 Download PDFInfo
- Publication number
- KR20230134487A KR20230134487A KR1020237024302A KR20237024302A KR20230134487A KR 20230134487 A KR20230134487 A KR 20230134487A KR 1020237024302 A KR1020237024302 A KR 1020237024302A KR 20237024302 A KR20237024302 A KR 20237024302A KR 20230134487 A KR20230134487 A KR 20230134487A
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- rna
- variant
- fragment
- dna
- Prior art date
Links
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims abstract description 584
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 167
- 239000008194 pharmaceutical composition Substances 0.000 claims abstract description 42
- 238000000034 method Methods 0.000 claims abstract description 33
- 108020004999 messenger RNA Proteins 0.000 claims abstract description 21
- 239000003814 drug Substances 0.000 claims abstract description 12
- 229960005486 vaccine Drugs 0.000 claims abstract description 7
- 108091029810 SaRNA Proteins 0.000 claims abstract 2
- 229940078677 sarna Drugs 0.000 claims abstract 2
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 388
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 351
- 108090000623 proteins and genes Proteins 0.000 claims description 148
- 102000004169 proteins and genes Human genes 0.000 claims description 132
- 210000002230 centromere Anatomy 0.000 claims description 122
- 230000014509 gene expression Effects 0.000 claims description 93
- 239000013598 vector Substances 0.000 claims description 74
- 210000004027 cell Anatomy 0.000 claims description 72
- 230000001225 therapeutic effect Effects 0.000 claims description 58
- 241000700605 Viruses Species 0.000 claims description 55
- 239000000427 antigen Substances 0.000 claims description 41
- 108091007433 antigens Proteins 0.000 claims description 41
- 102000036639 antigens Human genes 0.000 claims description 41
- 101001086079 Severe acute respiratory syndrome coronavirus 2 Putative ORF3b protein Proteins 0.000 claims description 40
- 230000003612 virological effect Effects 0.000 claims description 37
- 108091006086 inhibitor proteins Proteins 0.000 claims description 34
- 208000025370 Middle East respiratory syndrome Diseases 0.000 claims description 26
- 206010028980 Neoplasm Diseases 0.000 claims description 23
- 239000000203 mixture Substances 0.000 claims description 18
- HDOVUKNUBWVHOX-QMMMGPOBSA-N Valacyclovir Chemical compound N1C(N)=NC(=O)C2=C1N(COCCOC(=O)[C@@H](N)C(C)C)C=N2 HDOVUKNUBWVHOX-QMMMGPOBSA-N 0.000 claims description 16
- 241000711573 Coronaviridae Species 0.000 claims description 15
- 241001502974 Human gammaherpesvirus 8 Species 0.000 claims description 15
- 238000004519 manufacturing process Methods 0.000 claims description 13
- 241000283966 Pholidota <mammal> Species 0.000 claims description 12
- 230000001580 bacterial effect Effects 0.000 claims description 12
- 201000011510 cancer Diseases 0.000 claims description 12
- 241000710929 Alphavirus Species 0.000 claims description 9
- 208000036142 Viral infection Diseases 0.000 claims description 9
- 230000002538 fungal effect Effects 0.000 claims description 9
- 238000011282 treatment Methods 0.000 claims description 9
- 208000035143 Bacterial infection Diseases 0.000 claims description 8
- 101100173936 Escherichia coli (strain K12) flmA gene Proteins 0.000 claims description 8
- 206010017533 Fungal infection Diseases 0.000 claims description 8
- 101100508081 Human herpesvirus 1 (strain 17) ICP34.5 gene Proteins 0.000 claims description 8
- 208000031888 Mycoses Diseases 0.000 claims description 8
- 101150104094 ORF52 gene Proteins 0.000 claims description 8
- 101100389785 Orgyia pseudotsugata multicapsid polyhedrosis virus ETM gene Proteins 0.000 claims description 8
- 101100481711 Pneumococcus phage Dp-1 TMP gene Proteins 0.000 claims description 8
- 101150027249 RL1 gene Proteins 0.000 claims description 8
- 208000022362 bacterial infectious disease Diseases 0.000 claims description 8
- 230000009385 viral infection Effects 0.000 claims description 8
- 101100540311 Human papillomavirus type 16 E6 gene Proteins 0.000 claims description 7
- 101710112706 Polymerase cofactor VP35 Proteins 0.000 claims description 7
- 230000028993 immune response Effects 0.000 claims description 7
- 241000710831 Flavivirus Species 0.000 claims description 6
- 241000709664 Picornaviridae Species 0.000 claims description 6
- 206010046865 Vaccinia virus infection Diseases 0.000 claims description 6
- 238000002560 therapeutic procedure Methods 0.000 claims description 6
- 208000007089 vaccinia Diseases 0.000 claims description 6
- 241000710780 Bovine viral diarrhea virus 1 Species 0.000 claims description 5
- 101710189062 Non-structural protein V Proteins 0.000 claims description 5
- 241000710778 Pestivirus Species 0.000 claims description 5
- 241000894006 Bacteria Species 0.000 claims description 4
- 241000233866 Fungi Species 0.000 claims description 4
- 241000710959 Venezuelan equine encephalitis virus Species 0.000 claims description 4
- 230000002265 prevention Effects 0.000 claims description 4
- 230000004936 stimulating effect Effects 0.000 claims description 4
- 241001559185 Mammalian rubulavirus 5 Species 0.000 claims description 3
- 230000006872 improvement Effects 0.000 claims description 3
- 241000711557 Hepacivirus Species 0.000 claims description 2
- 241001493065 dsRNA viruses Species 0.000 claims description 2
- 241001678559 COVID-19 virus Species 0.000 claims 5
- 206010037075 Protozoal infections Diseases 0.000 claims 1
- PPBOKXIGFIBOGK-BDTUAEFFSA-N bvdv Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)C(C)C)[C@@H](C)CC)C1=CN=CN1 PPBOKXIGFIBOGK-BDTUAEFFSA-N 0.000 claims 1
- 238000012258 culturing Methods 0.000 claims 1
- 239000010979 ruby Substances 0.000 claims 1
- 229910001750 ruby Inorganic materials 0.000 claims 1
- 102000039446 nucleic acids Human genes 0.000 abstract description 125
- 108020004707 nucleic acids Proteins 0.000 abstract description 125
- 201000010099 disease Diseases 0.000 abstract description 7
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 abstract description 7
- 239000013604 expression vector Substances 0.000 abstract description 2
- 239000012634 fragment Substances 0.000 description 461
- 239000002773 nucleotide Substances 0.000 description 374
- 125000003729 nucleotide group Chemical group 0.000 description 374
- 102000004196 processed proteins & peptides Human genes 0.000 description 360
- 229920001184 polypeptide Polymers 0.000 description 354
- 108020004414 DNA Proteins 0.000 description 324
- 108020004705 Codon Proteins 0.000 description 246
- 235000018102 proteins Nutrition 0.000 description 123
- 125000003275 alpha amino acid group Chemical group 0.000 description 115
- 102000035195 Peptidases Human genes 0.000 description 54
- 108091005804 Peptidases Proteins 0.000 description 54
- 239000004365 Protease Substances 0.000 description 48
- 235000019419 proteases Nutrition 0.000 description 48
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 35
- 101710144111 Non-structural protein 3 Proteins 0.000 description 30
- 108010076039 Polyproteins Proteins 0.000 description 30
- 241000282414 Homo sapiens Species 0.000 description 29
- 241000710198 Foot-and-mouth disease virus Species 0.000 description 24
- 108010050904 Interferons Proteins 0.000 description 24
- 102000014150 Interferons Human genes 0.000 description 24
- 241000700588 Human alphaherpesvirus 1 Species 0.000 description 22
- 102000034356 gene-regulatory proteins Human genes 0.000 description 21
- 108091006104 gene-regulatory proteins Proteins 0.000 description 21
- 101710172711 Structural protein Proteins 0.000 description 20
- 230000000694 effects Effects 0.000 description 20
- 229940079322 interferon Drugs 0.000 description 20
- 241001529459 Enterovirus A71 Species 0.000 description 19
- 101710144127 Non-structural protein 1 Proteins 0.000 description 19
- 108091027544 Subgenomic mRNA Proteins 0.000 description 19
- 238000005457 optimization Methods 0.000 description 19
- 208000001528 Coronaviridae Infections Diseases 0.000 description 18
- 241000709661 Enterovirus Species 0.000 description 17
- 241000701044 Human gammaherpesvirus 4 Species 0.000 description 17
- 239000003981 vehicle Substances 0.000 description 17
- 241000342334 Human metapneumovirus Species 0.000 description 16
- 101800001030 Non-structural protein 2A Proteins 0.000 description 16
- 230000014616 translation Effects 0.000 description 16
- 241000709675 Coxsackievirus B3 Species 0.000 description 15
- 241000991587 Enterovirus C Species 0.000 description 15
- -1 IFIT1-3 Proteins 0.000 description 15
- 102100029843 Interferon regulatory factor 3 Human genes 0.000 description 15
- 241000315672 SARS coronavirus Species 0.000 description 15
- 238000013519 translation Methods 0.000 description 15
- 241000283690 Bos taurus Species 0.000 description 14
- 241000700584 Simplexvirus Species 0.000 description 14
- 239000003112 inhibitor Substances 0.000 description 14
- 241000724653 Borna disease virus Species 0.000 description 13
- 101710128560 Initiator protein NS1 Proteins 0.000 description 13
- 101710144128 Non-structural protein 2 Proteins 0.000 description 13
- 101710111966 Non-structural protein NP-1 Proteins 0.000 description 13
- 241000710188 Encephalomyocarditis virus Species 0.000 description 12
- 102000004961 Furin Human genes 0.000 description 12
- 108090001126 Furin Proteins 0.000 description 12
- 101001011382 Homo sapiens Interferon regulatory factor 3 Proteins 0.000 description 12
- 102100038070 Interferon regulatory factor 7 Human genes 0.000 description 12
- 102100027353 Interferon-induced helicase C domain-containing protein 1 Human genes 0.000 description 12
- 102100038436 Neuronal pentraxin-1 Human genes 0.000 description 12
- 101710102575 Pre-neck appendage protein Proteins 0.000 description 12
- 238000003776 cleavage reaction Methods 0.000 description 12
- 201000010284 hepatitis E Diseases 0.000 description 12
- 239000007788 liquid Substances 0.000 description 12
- 230000007017 scission Effects 0.000 description 12
- 230000004913 activation Effects 0.000 description 11
- 238000000338 in vitro Methods 0.000 description 11
- 230000005764 inhibitory process Effects 0.000 description 11
- 101001032342 Homo sapiens Interferon regulatory factor 7 Proteins 0.000 description 10
- 102100033019 Tyrosine-protein phosphatase non-receptor type 11 Human genes 0.000 description 10
- 230000019491 signal transduction Effects 0.000 description 10
- 230000011664 signaling Effects 0.000 description 10
- 241000712891 Arenavirus Species 0.000 description 9
- 241000494545 Cordyline virus 2 Species 0.000 description 9
- 241000709721 Hepatovirus A Species 0.000 description 9
- 101800000268 Leader protease Proteins 0.000 description 9
- 241000711466 Murine hepatitis virus Species 0.000 description 9
- 230000015788 innate immune response Effects 0.000 description 9
- 201000001441 melanoma Diseases 0.000 description 9
- 230000037361 pathway Effects 0.000 description 9
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 8
- 102000004190 Enzymes Human genes 0.000 description 8
- 108090000790 Enzymes Proteins 0.000 description 8
- 241000701074 Human alphaherpesvirus 2 Species 0.000 description 8
- 201000005505 Measles Diseases 0.000 description 8
- 108060004795 Methyltransferase Proteins 0.000 description 8
- 101710119090 RING finger protein Z Proteins 0.000 description 8
- 241000711798 Rabies lyssavirus Species 0.000 description 8
- 239000013543 active substance Substances 0.000 description 8
- 229940024606 amino acid Drugs 0.000 description 8
- 235000001014 amino acid Nutrition 0.000 description 8
- 150000001413 amino acids Chemical class 0.000 description 8
- 230000000840 anti-viral effect Effects 0.000 description 8
- 230000027455 binding Effects 0.000 description 8
- 229940088598 enzyme Drugs 0.000 description 8
- 208000001726 Classical Swine Fever Diseases 0.000 description 7
- 206010009944 Colon cancer Diseases 0.000 description 7
- 241001429382 Coxsackievirus A16 Species 0.000 description 7
- 241001669084 Coxsackievirus A6 Species 0.000 description 7
- 101710158312 DNA-binding protein HU-beta Proteins 0.000 description 7
- 241000190708 Guanarito mammarenavirus Species 0.000 description 7
- 241000711549 Hepacivirus C Species 0.000 description 7
- 208000005176 Hepatitis C Diseases 0.000 description 7
- 241001529916 Hepatitis GB virus B Species 0.000 description 7
- 101000785414 Homo sapiens Ankyrin repeat, SAM and basic leucine zipper domain-containing protein 1 Proteins 0.000 description 7
- 241000712899 Lymphocytic choriomeningitis mammarenavirus Species 0.000 description 7
- 102000016397 Methyltransferase Human genes 0.000 description 7
- 208000005647 Mumps Diseases 0.000 description 7
- 101710138767 Non-structural glycoprotein 4 Proteins 0.000 description 7
- 101710199667 Nuclear export protein Proteins 0.000 description 7
- 241001135549 Porcine epidemic diarrhea virus Species 0.000 description 7
- 108010006510 Rotavirus NSP1 protein Proteins 0.000 description 7
- 102100031056 Serine protease 57 Human genes 0.000 description 7
- 101710197596 Serine protease 57 Proteins 0.000 description 7
- 101150010086 VP24 gene Proteins 0.000 description 7
- 101500019619 West Nile virus Non-structural protein 4A Proteins 0.000 description 7
- 101710130522 mRNA export factor Proteins 0.000 description 7
- 208000010805 mumps infectious disease Diseases 0.000 description 7
- 238000013518 transcription Methods 0.000 description 7
- 230000035897 transcription Effects 0.000 description 7
- 208000026310 Breast neoplasm Diseases 0.000 description 6
- 101150059079 EBNA1 gene Proteins 0.000 description 6
- 101900116105 Human herpesvirus 8 type P Protein ORF45 Proteins 0.000 description 6
- 108060003951 Immunoglobulin Proteins 0.000 description 6
- 101100028758 Influenza A virus (strain A/Swine/Wisconsin/1/1967 H1N1) PB1-F2 gene Proteins 0.000 description 6
- 241001500351 Influenzavirus A Species 0.000 description 6
- 101710085994 Interferon-induced helicase C domain-containing protein 1 Proteins 0.000 description 6
- 102100034170 Interferon-induced, double-stranded RNA-activated protein kinase Human genes 0.000 description 6
- 101710089751 Interferon-induced, double-stranded RNA-activated protein kinase Proteins 0.000 description 6
- 101150103632 M2-2 gene Proteins 0.000 description 6
- 241001529936 Murinae Species 0.000 description 6
- 101150103639 PB1 gene Proteins 0.000 description 6
- 241001361508 Porcine deltacoronavirus Species 0.000 description 6
- 102100022648 Reticulon-2 Human genes 0.000 description 6
- 108700003736 Rotavirus VP3 Proteins 0.000 description 6
- 102100031776 SH2 domain-containing protein 3A Human genes 0.000 description 6
- 102100021798 SH2 domain-containing protein 3C Human genes 0.000 description 6
- 101900218152 Torque teno virus Uncharacterized ORF2 protein Proteins 0.000 description 6
- 241000700618 Vaccinia virus Species 0.000 description 6
- 239000003795 chemical substances by application Substances 0.000 description 6
- 230000016396 cytokine production Effects 0.000 description 6
- 230000001419 dependent effect Effects 0.000 description 6
- 208000005252 hepatitis A Diseases 0.000 description 6
- 208000002672 hepatitis B Diseases 0.000 description 6
- 102000018358 immunoglobulin Human genes 0.000 description 6
- 238000001727 in vivo Methods 0.000 description 6
- 230000002401 inhibitory effect Effects 0.000 description 6
- 108700021074 nidoviral uridylate-specific endoribonuclease Proteins 0.000 description 6
- 230000001105 regulatory effect Effects 0.000 description 6
- 239000000243 solution Substances 0.000 description 6
- 210000001082 somatic cell Anatomy 0.000 description 6
- 239000000725 suspension Substances 0.000 description 6
- 102100037435 Antiviral innate immune response receptor RIG-I Human genes 0.000 description 5
- 101710127675 Antiviral innate immune response receptor RIG-I Proteins 0.000 description 5
- 206010006187 Breast cancer Diseases 0.000 description 5
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 5
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 5
- 102000004127 Cytokines Human genes 0.000 description 5
- 108090000695 Cytokines Proteins 0.000 description 5
- 241000282412 Homo Species 0.000 description 5
- 101000665442 Homo sapiens Serine/threonine-protein kinase TBK1 Proteins 0.000 description 5
- 241000712431 Influenza A virus Species 0.000 description 5
- 108060001084 Luciferase Proteins 0.000 description 5
- 239000005089 Luciferase Substances 0.000 description 5
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 5
- 101150094382 NSS gene Proteins 0.000 description 5
- 101800001020 Non-structural protein 4A Proteins 0.000 description 5
- 101710141454 Nucleoprotein Proteins 0.000 description 5
- 101800000345 Protein 3ABC Proteins 0.000 description 5
- 102100038192 Serine/threonine-protein kinase TBK1 Human genes 0.000 description 5
- 241000223238 Trichophyton Species 0.000 description 5
- 101500019620 West Nile virus Non-structural protein 4B Proteins 0.000 description 5
- GFFGJBXGBJISGV-UHFFFAOYSA-N adenyl group Chemical group N1=CN=C2N=CNC2=C1N GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 5
- 239000002671 adjuvant Substances 0.000 description 5
- 239000000839 emulsion Substances 0.000 description 5
- 239000003018 immunosuppressive agent Substances 0.000 description 5
- 230000003993 interaction Effects 0.000 description 5
- 201000005202 lung cancer Diseases 0.000 description 5
- 208000020816 lung neoplasm Diseases 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 5
- 230000001404 mediated effect Effects 0.000 description 5
- 239000013612 plasmid Substances 0.000 description 5
- 239000000843 powder Substances 0.000 description 5
- 102000005962 receptors Human genes 0.000 description 5
- 108020003175 receptors Proteins 0.000 description 5
- 230000008672 reprogramming Effects 0.000 description 5
- 239000007787 solid Substances 0.000 description 5
- 210000000130 stem cell Anatomy 0.000 description 5
- 102100020724 Ankyrin repeat, SAM and basic leucine zipper domain-containing protein 1 Human genes 0.000 description 4
- 241000228212 Aspergillus Species 0.000 description 4
- 241000701022 Cytomegalovirus Species 0.000 description 4
- 241000710827 Dengue virus 1 Species 0.000 description 4
- 241000146324 Enterovirus D68 Species 0.000 description 4
- 102000004269 Granulocyte Colony-Stimulating Factor Human genes 0.000 description 4
- 108010017080 Granulocyte Colony-Stimulating Factor Proteins 0.000 description 4
- 241000724675 Hepatitis E virus Species 0.000 description 4
- 101000959820 Homo sapiens Interferon alpha-1/13 Proteins 0.000 description 4
- 101001082073 Homo sapiens Interferon-induced helicase C domain-containing protein 1 Proteins 0.000 description 4
- 102000043138 IRF family Human genes 0.000 description 4
- 108091054729 IRF family Proteins 0.000 description 4
- 102100040019 Interferon alpha-1/13 Human genes 0.000 description 4
- 102100031413 L-dopachrome tautomerase Human genes 0.000 description 4
- 241000351643 Metapneumovirus Species 0.000 description 4
- 241000712045 Morbillivirus Species 0.000 description 4
- 101001055788 Mycolicibacterium smegmatis (strain ATCC 700084 / mc(2)155) Pentapeptide repeat protein MfpA Proteins 0.000 description 4
- 102000011931 Nucleoproteins Human genes 0.000 description 4
- 108010061100 Nucleoproteins Proteins 0.000 description 4
- 101800001491 Protease 3C Proteins 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- 101000936719 Streptococcus gordonii Accessory Sec system protein Asp3 Proteins 0.000 description 4
- 108010073929 Vascular Endothelial Growth Factor A Proteins 0.000 description 4
- 239000005557 antagonist Substances 0.000 description 4
- 230000000903 blocking effect Effects 0.000 description 4
- 239000012530 fluid Substances 0.000 description 4
- 238000009472 formulation Methods 0.000 description 4
- 229940088597 hormone Drugs 0.000 description 4
- 239000005556 hormone Substances 0.000 description 4
- 210000000987 immune system Anatomy 0.000 description 4
- 230000002163 immunogen Effects 0.000 description 4
- 230000006698 induction Effects 0.000 description 4
- 208000015181 infectious disease Diseases 0.000 description 4
- 239000007924 injection Substances 0.000 description 4
- 238000002347 injection Methods 0.000 description 4
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 4
- 150000002632 lipids Chemical class 0.000 description 4
- 238000003199 nucleic acid amplification method Methods 0.000 description 4
- 238000007911 parenteral administration Methods 0.000 description 4
- 208000028172 protozoa infectious disease Diseases 0.000 description 4
- 125000006850 spacer group Chemical group 0.000 description 4
- 238000011144 upstream manufacturing Methods 0.000 description 4
- LKKMLIBUAXYLOY-UHFFFAOYSA-N 3-Amino-1-methyl-5H-pyrido[4,3-b]indole Chemical compound N1C2=CC=CC=C2C2=C1C=C(N)N=C2C LKKMLIBUAXYLOY-UHFFFAOYSA-N 0.000 description 3
- WEVYNIUIFUYDGI-UHFFFAOYSA-N 3-[6-[4-(trifluoromethoxy)anilino]-4-pyrimidinyl]benzamide Chemical compound NC(=O)C1=CC=CC(C=2N=CN=C(NC=3C=CC(OC(F)(F)F)=CC=3)C=2)=C1 WEVYNIUIFUYDGI-UHFFFAOYSA-N 0.000 description 3
- 229930024421 Adenine Natural products 0.000 description 3
- 102000014914 Carrier Proteins Human genes 0.000 description 3
- 102100025064 Cellular tumor antigen p53 Human genes 0.000 description 3
- 102100031256 Cyclic GMP-AMP synthase Human genes 0.000 description 3
- 101710118064 Cyclic GMP-AMP synthase Proteins 0.000 description 3
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 3
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 3
- 241000196324 Embryophyta Species 0.000 description 3
- 101710166523 Genome polyprotein Proteins 0.000 description 3
- 101000721661 Homo sapiens Cellular tumor antigen p53 Proteins 0.000 description 3
- 101001032341 Homo sapiens Interferon regulatory factor 9 Proteins 0.000 description 3
- 102100038251 Interferon regulatory factor 9 Human genes 0.000 description 3
- 102100028389 Melanoma antigen recognized by T-cells 1 Human genes 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- 241000127282 Middle East respiratory syndrome-related coronavirus Species 0.000 description 3
- 102100022219 NF-kappa-B essential modulator Human genes 0.000 description 3
- 101710090077 NF-kappa-B essential modulator Proteins 0.000 description 3
- 206010033128 Ovarian cancer Diseases 0.000 description 3
- 206010061535 Ovarian neoplasm Diseases 0.000 description 3
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 3
- 241000711504 Paramyxoviridae Species 0.000 description 3
- 108010089430 Phosphoproteins Proteins 0.000 description 3
- 102000007982 Phosphoproteins Human genes 0.000 description 3
- 241000711902 Pneumovirus Species 0.000 description 3
- 102100030090 Probable ATP-dependent RNA helicase DHX58 Human genes 0.000 description 3
- 108091005685 RIG-I-like receptors Proteins 0.000 description 3
- 241000725643 Respiratory syncytial virus Species 0.000 description 3
- 101710144761 Reverse transcriptase Proteins 0.000 description 3
- 201000003176 Severe Acute Respiratory Syndrome Diseases 0.000 description 3
- 101001024647 Severe acute respiratory syndrome coronavirus Nucleoprotein Proteins 0.000 description 3
- 208000001203 Smallpox Diseases 0.000 description 3
- 208000004006 Tick-borne encephalitis Diseases 0.000 description 3
- 102000040945 Transcription factor Human genes 0.000 description 3
- 108091023040 Transcription factor Proteins 0.000 description 3
- 108700019146 Transgenes Proteins 0.000 description 3
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 3
- 101150077651 VP35 gene Proteins 0.000 description 3
- 102000009524 Vascular Endothelial Growth Factor A Human genes 0.000 description 3
- 229960000643 adenine Drugs 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 108091008324 binding proteins Proteins 0.000 description 3
- 230000037396 body weight Effects 0.000 description 3
- 210000000481 breast Anatomy 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 238000002659 cell therapy Methods 0.000 description 3
- 239000001913 cellulose Substances 0.000 description 3
- 229920002678 cellulose Polymers 0.000 description 3
- 235000010980 cellulose Nutrition 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 210000003527 eukaryotic cell Anatomy 0.000 description 3
- 201000010536 head and neck cancer Diseases 0.000 description 3
- 208000014829 head and neck neoplasm Diseases 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- 208000037797 influenza A Diseases 0.000 description 3
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 239000003921 oil Substances 0.000 description 3
- 235000019198 oils Nutrition 0.000 description 3
- 201000002528 pancreatic cancer Diseases 0.000 description 3
- 208000008443 pancreatic carcinoma Diseases 0.000 description 3
- 244000052769 pathogen Species 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 239000003755 preservative agent Substances 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 239000011780 sodium chloride Substances 0.000 description 3
- 239000008174 sterile solution Substances 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 239000000375 suspending agent Substances 0.000 description 3
- 241001529453 unidentified herpesvirus Species 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 108020005345 3' Untranslated Regions Proteins 0.000 description 2
- 102100030310 5,6-dihydroxyindole-2-carboxylic acid oxidase Human genes 0.000 description 2
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 2
- 241000710189 Aphthovirus Species 0.000 description 2
- 241000271566 Aves Species 0.000 description 2
- 241001519465 Avian metapneumovirus Species 0.000 description 2
- 102100035526 B melanoma antigen 1 Human genes 0.000 description 2
- 208000032791 BCR-ABL1 positive chronic myelogenous leukemia Diseases 0.000 description 2
- 241000193738 Bacillus anthracis Species 0.000 description 2
- 102000015735 Beta-catenin Human genes 0.000 description 2
- 108060000903 Beta-catenin Proteins 0.000 description 2
- 206010005003 Bladder cancer Diseases 0.000 description 2
- 102000004506 Blood Proteins Human genes 0.000 description 2
- 108010017384 Blood Proteins Proteins 0.000 description 2
- 241000588832 Bordetella pertussis Species 0.000 description 2
- 241001493054 Bovine rotavirus A Species 0.000 description 2
- 241000714198 Caliciviridae Species 0.000 description 2
- 241000222122 Candida albicans Species 0.000 description 2
- 101710167800 Capsid assembly scaffolding protein Proteins 0.000 description 2
- 102100025475 Carcinoembryonic antigen-related cell adhesion molecule 5 Human genes 0.000 description 2
- 241000710190 Cardiovirus Species 0.000 description 2
- 241000282693 Cercopithecidae Species 0.000 description 2
- 102000019034 Chemokines Human genes 0.000 description 2
- 108010012236 Chemokines Proteins 0.000 description 2
- 208000010833 Chronic myeloid leukaemia Diseases 0.000 description 2
- 102000007644 Colony-Stimulating Factors Human genes 0.000 description 2
- 108010071942 Colony-Stimulating Factors Proteins 0.000 description 2
- 108010047041 Complementarity Determining Regions Proteins 0.000 description 2
- 241000710815 Dengue virus 2 Species 0.000 description 2
- 201000011001 Ebola Hemorrhagic Fever Diseases 0.000 description 2
- 241001115402 Ebolavirus Species 0.000 description 2
- 241001466953 Echovirus Species 0.000 description 2
- 102000003951 Erythropoietin Human genes 0.000 description 2
- 108090000394 Erythropoietin Proteins 0.000 description 2
- 108010054218 Factor VIII Proteins 0.000 description 2
- 102000001690 Factor VIII Human genes 0.000 description 2
- 108091006027 G proteins Proteins 0.000 description 2
- 102000030782 GTP binding Human genes 0.000 description 2
- 108091000058 GTP-Binding Proteins 0.000 description 2
- 108010010803 Gelatin Proteins 0.000 description 2
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 2
- 102100041003 Glutamate carboxypeptidase 2 Human genes 0.000 description 2
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 102000004457 Granulocyte-Macrophage Colony-Stimulating Factor Human genes 0.000 description 2
- 108010017213 Granulocyte-Macrophage Colony-Stimulating Factor Proteins 0.000 description 2
- 108010051696 Growth Hormone Proteins 0.000 description 2
- 241000700721 Hepatitis B virus Species 0.000 description 2
- 241000724709 Hepatitis delta virus Species 0.000 description 2
- 101000874316 Homo sapiens B melanoma antigen 1 Proteins 0.000 description 2
- 101000578784 Homo sapiens Melanoma antigen recognized by T-cells 1 Proteins 0.000 description 2
- 101000880770 Homo sapiens Protein SSX2 Proteins 0.000 description 2
- 101000984042 Homo sapiens Protein lin-28 homolog A Proteins 0.000 description 2
- 101000687905 Homo sapiens Transcription factor SOX-2 Proteins 0.000 description 2
- 241000701085 Human alphaherpesvirus 3 Species 0.000 description 2
- 241000701041 Human betaherpesvirus 7 Species 0.000 description 2
- 241001207270 Human enterovirus Species 0.000 description 2
- 241001243761 Human hepatitis A virus Species 0.000 description 2
- 241000701027 Human herpesvirus 6 Species 0.000 description 2
- 241000701806 Human papillomavirus Species 0.000 description 2
- 241000709701 Human poliovirus 1 Species 0.000 description 2
- 241000710130 Human rhinovirus 1A Species 0.000 description 2
- 102000001284 I-kappa-B kinase Human genes 0.000 description 2
- 108060006678 I-kappa-B kinase Proteins 0.000 description 2
- 108010044240 IFIH1 Interferon-Induced Helicase Proteins 0.000 description 2
- 108090001061 Insulin Proteins 0.000 description 2
- 102000004877 Insulin Human genes 0.000 description 2
- 108010032038 Interferon Regulatory Factor-3 Proteins 0.000 description 2
- 108010032036 Interferon Regulatory Factor-7 Proteins 0.000 description 2
- 108010002350 Interleukin-2 Proteins 0.000 description 2
- 108010063738 Interleukins Proteins 0.000 description 2
- 102000015696 Interleukins Human genes 0.000 description 2
- 208000008839 Kidney Neoplasms Diseases 0.000 description 2
- 241000710912 Kunjin virus Species 0.000 description 2
- 101710093778 L-dopachrome tautomerase Proteins 0.000 description 2
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 102100034216 Melanocyte-stimulating hormone receptor Human genes 0.000 description 2
- 241001480037 Microsporum Species 0.000 description 2
- 241001260008 Microsporum equinum Species 0.000 description 2
- 101000982327 Middle East respiratory syndrome-related coronavirus (isolate United Kingdom/H123990006/2012) Non-structural protein ORF4a Proteins 0.000 description 2
- 241000701029 Murid betaherpesvirus 1 Species 0.000 description 2
- 241000699666 Mus <mouse, genus> Species 0.000 description 2
- 208000033761 Myelogenous Chronic BCR-ABL Positive Leukemia Diseases 0.000 description 2
- 102000003505 Myosin Human genes 0.000 description 2
- 108060008487 Myosin Proteins 0.000 description 2
- 102000003945 NF-kappa B Human genes 0.000 description 2
- 108010057466 NF-kappa B Proteins 0.000 description 2
- 108020004485 Nonsense Codon Proteins 0.000 description 2
- 101710113540 ORF2 protein Proteins 0.000 description 2
- 101710184164 ORF3b protein Proteins 0.000 description 2
- 101000783504 Orgyia pseudotsugata multicapsid polyhedrosis virus Uncharacterized 15.4 kDa protein Proteins 0.000 description 2
- 241000713112 Orthobunyavirus Species 0.000 description 2
- 241000150218 Orthonairovirus Species 0.000 description 2
- 102100034574 P protein Human genes 0.000 description 2
- 101710181008 P protein Proteins 0.000 description 2
- 108060006580 PRAME Proteins 0.000 description 2
- 102000036673 PRAME Human genes 0.000 description 2
- 102100034640 PWWP domain-containing DNA repair factor 3A Human genes 0.000 description 2
- 108050007154 PWWP domain-containing DNA repair factor 3A Proteins 0.000 description 2
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 2
- 241000713137 Phlebovirus Species 0.000 description 2
- 101710177166 Phosphoprotein Proteins 0.000 description 2
- 108091000080 Phosphotransferase Proteins 0.000 description 2
- 241000700625 Poxviridae Species 0.000 description 2
- 206010060862 Prostate cancer Diseases 0.000 description 2
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 2
- 101800000980 Protease nsP2 Proteins 0.000 description 2
- 102100037686 Protein SSX2 Human genes 0.000 description 2
- 102100025460 Protein lin-28 homolog A Human genes 0.000 description 2
- 241000125945 Protoparvovirus Species 0.000 description 2
- 208000010362 Protozoan Infections Diseases 0.000 description 2
- 101710090523 Putative movement protein Proteins 0.000 description 2
- 101800001758 RNA-directed RNA polymerase nsP4 Proteins 0.000 description 2
- 206010038389 Renal cancer Diseases 0.000 description 2
- 241000702263 Reovirus sp. Species 0.000 description 2
- 241000235527 Rhizopus Species 0.000 description 2
- 241001137860 Rotavirus A Species 0.000 description 2
- 241000710801 Rubivirus Species 0.000 description 2
- 102000004265 STAT2 Transcription Factor Human genes 0.000 description 2
- 108010081691 STAT2 Transcription Factor Proteins 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 2
- 101900072274 Sendai virus Protein V Proteins 0.000 description 2
- 101710173694 Short transient receptor potential channel 2 Proteins 0.000 description 2
- 102100038803 Somatotropin Human genes 0.000 description 2
- 208000005718 Stomach Neoplasms Diseases 0.000 description 2
- 108091008874 T cell receptors Proteins 0.000 description 2
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 description 2
- 102000005876 Tissue Inhibitor of Metalloproteinases Human genes 0.000 description 2
- 108010005246 Tissue Inhibitor of Metalloproteinases Proteins 0.000 description 2
- 108090000373 Tissue Plasminogen Activator Proteins 0.000 description 2
- 102000003978 Tissue Plasminogen Activator Human genes 0.000 description 2
- 241000960387 Torque teno virus Species 0.000 description 2
- 102100024270 Transcription factor SOX-2 Human genes 0.000 description 2
- 241000711484 Transmissible gastroenteritis virus Species 0.000 description 2
- 108700015934 Triose-phosphate isomerases Proteins 0.000 description 2
- 102100033598 Triosephosphate isomerase Human genes 0.000 description 2
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- 241000711970 Vesiculovirus Species 0.000 description 2
- 101710136524 X polypeptide Proteins 0.000 description 2
- 241000607479 Yersinia pestis Species 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 239000012190 activator Substances 0.000 description 2
- 150000001298 alcohols Chemical class 0.000 description 2
- XAGFODPZIPBFFR-UHFFFAOYSA-N aluminium Chemical compound [Al] XAGFODPZIPBFFR-UHFFFAOYSA-N 0.000 description 2
- 229910052782 aluminium Inorganic materials 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 2
- 239000011230 binding agent Substances 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 239000002775 capsule Substances 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000036755 cellular response Effects 0.000 description 2
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 2
- 210000001072 colon Anatomy 0.000 description 2
- 208000029742 colonic neoplasm Diseases 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 108091036078 conserved sequence Proteins 0.000 description 2
- 239000006071 cream Substances 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 108010051081 dopachrome isomerase Proteins 0.000 description 2
- VYFYYTLLBUKUHU-UHFFFAOYSA-N dopamine Chemical compound NCCC1=CC=C(O)C(O)=C1 VYFYYTLLBUKUHU-UHFFFAOYSA-N 0.000 description 2
- 239000003937 drug carrier Substances 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 239000000975 dye Substances 0.000 description 2
- 239000002158 endotoxin Substances 0.000 description 2
- 239000002532 enzyme inhibitor Substances 0.000 description 2
- 229940105423 erythropoietin Drugs 0.000 description 2
- 230000017188 evasion or tolerance of host immune response Effects 0.000 description 2
- 229960000301 factor viii Drugs 0.000 description 2
- 108700042480 filovirus VP35 Proteins 0.000 description 2
- 239000000796 flavoring agent Substances 0.000 description 2
- 235000013355 food flavoring agent Nutrition 0.000 description 2
- 235000003599 food sweetener Nutrition 0.000 description 2
- 206010017758 gastric cancer Diseases 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 239000008273 gelatin Substances 0.000 description 2
- 229920000159 gelatin Polymers 0.000 description 2
- 235000019322 gelatine Nutrition 0.000 description 2
- 235000011852 gelatine desserts Nutrition 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- 239000000122 growth hormone Substances 0.000 description 2
- 108010072285 growth inhibitory proteins Proteins 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 210000005260 human cell Anatomy 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- 230000002458 infectious effect Effects 0.000 description 2
- 210000005007 innate immune system Anatomy 0.000 description 2
- 229940125396 insulin Drugs 0.000 description 2
- 230000010468 interferon response Effects 0.000 description 2
- 229940047124 interferons Drugs 0.000 description 2
- 238000001990 intravenous administration Methods 0.000 description 2
- 239000003456 ion exchange resin Substances 0.000 description 2
- 229920003303 ion-exchange polymer Polymers 0.000 description 2
- 201000010982 kidney cancer Diseases 0.000 description 2
- 208000032839 leukemia Diseases 0.000 description 2
- 201000007270 liver cancer Diseases 0.000 description 2
- 208000014018 liver neoplasm Diseases 0.000 description 2
- 210000004072 lung Anatomy 0.000 description 2
- 210000004698 lymphocyte Anatomy 0.000 description 2
- 108010026228 mRNA guanylyltransferase Proteins 0.000 description 2
- HQKMJHAJHXVSDF-UHFFFAOYSA-L magnesium stearate Chemical compound [Mg+2].CCCCCCCCCCCCCCCCCC([O-])=O.CCCCCCCCCCCCCCCCCC([O-])=O HQKMJHAJHXVSDF-UHFFFAOYSA-L 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 229940035032 monophosphoryl lipid a Drugs 0.000 description 2
- PUPNJSIFIXXJCH-UHFFFAOYSA-N n-(4-hydroxyphenyl)-2-(1,1,3-trioxo-1,2-benzothiazol-2-yl)acetamide Chemical compound C1=CC(O)=CC=C1NC(=O)CN1S(=O)(=O)C2=CC=CC=C2C1=O PUPNJSIFIXXJCH-UHFFFAOYSA-N 0.000 description 2
- 239000002105 nanoparticle Substances 0.000 description 2
- 208000002154 non-small cell lung carcinoma Diseases 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 108010089193 pattern recognition receptors Proteins 0.000 description 2
- 102000007863 pattern recognition receptors Human genes 0.000 description 2
- 230000026731 phosphorylation Effects 0.000 description 2
- 238000006366 phosphorylation reaction Methods 0.000 description 2
- 102000020233 phosphotransferase Human genes 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- 235000013855 polyvinylpyrrolidone Nutrition 0.000 description 2
- 229920000036 polyvinylpyrrolidone Polymers 0.000 description 2
- 230000034190 positive regulation of NF-kappaB transcription factor activity Effects 0.000 description 2
- OXCMYAYHXIHQOA-UHFFFAOYSA-N potassium;[2-butyl-5-chloro-3-[[4-[2-(1,2,4-triaza-3-azanidacyclopenta-1,4-dien-5-yl)phenyl]phenyl]methyl]imidazol-4-yl]methanol Chemical compound [K+].CCCCC1=NC(Cl)=C(CO)N1CC1=CC=C(C=2C(=CC=CC=2)C2=N[N-]N=N2)C=C1 OXCMYAYHXIHQOA-UHFFFAOYSA-N 0.000 description 2
- 230000003389 potentiating effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 210000001236 prokaryotic cell Anatomy 0.000 description 2
- 235000019833 protease Nutrition 0.000 description 2
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 238000009097 single-agent therapy Methods 0.000 description 2
- 239000008247 solid mixture Substances 0.000 description 2
- 239000002904 solvent Substances 0.000 description 2
- 239000003381 stabilizer Substances 0.000 description 2
- 238000009168 stem cell therapy Methods 0.000 description 2
- 238000009580 stem-cell therapy Methods 0.000 description 2
- 230000000638 stimulation Effects 0.000 description 2
- 201000011549 stomach cancer Diseases 0.000 description 2
- 238000007920 subcutaneous administration Methods 0.000 description 2
- 239000003765 sweetening agent Substances 0.000 description 2
- 239000006188 syrup Substances 0.000 description 2
- 235000020357 syrup Nutrition 0.000 description 2
- 239000003826 tablet Substances 0.000 description 2
- 229960000187 tissue plasminogen activator Drugs 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- LWIHDJKSTIGBAC-UHFFFAOYSA-K tripotassium phosphate Chemical compound [K+].[K+].[K+].[O-]P([O-])([O-])=O LWIHDJKSTIGBAC-UHFFFAOYSA-K 0.000 description 2
- 230000004614 tumor growth Effects 0.000 description 2
- 102000003390 tumor necrosis factor Human genes 0.000 description 2
- 241001430294 unidentified retrovirus Species 0.000 description 2
- 201000005112 urinary bladder cancer Diseases 0.000 description 2
- 239000013603 viral vector Substances 0.000 description 2
- JNYAEWCLZODPBN-JGWLITMVSA-N (2r,3r,4s)-2-[(1r)-1,2-dihydroxyethyl]oxolane-3,4-diol Chemical compound OC[C@@H](O)[C@H]1OC[C@H](O)[C@H]1O JNYAEWCLZODPBN-JGWLITMVSA-N 0.000 description 1
- SSOORFWOBGFTHL-OTEJMHTDSA-N (4S)-5-[[(2S)-1-[[(2S)-1-[[(2S)-1-[[(2S)-1-[[(2S)-1-[[(2S)-1-[[(2S)-1-[[(2S)-6-amino-1-[[(2S)-1-[[(2S)-1-[[(2S)-1-[[(2S)-1-[[2-[(2S)-2-[[(2S)-1-[[(2S)-1-[[(2S)-1-[[(2S)-1-[[(2S)-1-[[(2S)-1-[[(2S)-6-amino-1-[[(2S)-1-[[(2S)-1-[[(2S,3S)-1-[[(2S)-1-[[(2S)-1-[[(2S)-6-amino-1-[[(2S)-1-[[(2S)-1-[[(2S)-1-[[(2S)-1-[[(2S)-1-[[(2S)-5-amino-1-[[(2S)-1-[[(2S)-1-[[(2S)-6-amino-1-[[(2S)-6-amino-1-[[(2S)-1-[[(2S)-1-[[(2S)-5-amino-1-[[(2S)-5-carbamimidamido-1-[[(2S)-5-carbamimidamido-1-[[(1S)-4-carbamimidamido-1-carboxybutyl]amino]-1-oxopentan-2-yl]amino]-1-oxopentan-2-yl]amino]-1,5-dioxopentan-2-yl]amino]-5-carbamimidamido-1-oxopentan-2-yl]amino]-5-carbamimidamido-1-oxopentan-2-yl]amino]-1-oxohexan-2-yl]amino]-1-oxohexan-2-yl]amino]-5-carbamimidamido-1-oxopentan-2-yl]amino]-4-methyl-1-oxopentan-2-yl]amino]-1,5-dioxopentan-2-yl]amino]-4-methyl-1-oxopentan-2-yl]amino]-3-hydroxy-1-oxopropan-2-yl]amino]-3-hydroxy-1-oxopropan-2-yl]amino]-3-hydroxy-1-oxopropan-2-yl]amino]-1-oxopropan-2-yl]amino]-1-oxohexan-2-yl]amino]-3-hydroxy-1-oxopropan-2-yl]amino]-1-oxo-3-phenylpropan-2-yl]amino]-3-methyl-1-oxopentan-2-yl]amino]-3-methyl-1-oxobutan-2-yl]amino]-5-carbamimidamido-1-oxopentan-2-yl]amino]-1-oxohexan-2-yl]amino]-3-methyl-1-oxobutan-2-yl]amino]-5-carbamimidamido-1-oxopentan-2-yl]amino]-3-methyl-1-oxobutan-2-yl]amino]-4-methyl-1-oxopentan-2-yl]amino]-1-oxopropan-2-yl]amino]-5-carbamimidamido-1-oxopentan-2-yl]carbamoyl]pyrrolidin-1-yl]-2-oxoethyl]amino]-3-(1H-indol-3-yl)-1-oxopropan-2-yl]amino]-4-methyl-1-oxopentan-2-yl]amino]-1-oxo-3-phenylpropan-2-yl]amino]-5-carbamimidamido-1-oxopentan-2-yl]amino]-1-oxohexan-2-yl]amino]-3-methyl-1-oxobutan-2-yl]amino]-5-carbamimidamido-1-oxopentan-2-yl]amino]-4-methyl-1-oxopentan-2-yl]amino]-1-oxo-3-phenylpropan-2-yl]amino]-3-(1H-imidazol-4-yl)-1-oxopropan-2-yl]amino]-3-methyl-1-oxobutan-2-yl]amino]-4-methyl-1-oxopentan-2-yl]amino]-4-[[(2S)-2-[[(2S)-2-[[(2S)-2,6-diaminohexanoyl]amino]-3-methylbutanoyl]amino]propanoyl]amino]-5-oxopentanoic acid Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H](Cc1c[nH]c2ccccc12)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@H](Cc1c[nH]cn1)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)C(C)C)C(C)C)C(C)C)C(C)C)C(C)C)C(C)C)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SSOORFWOBGFTHL-OTEJMHTDSA-N 0.000 description 1
- YYGNTYWPHWGJRM-UHFFFAOYSA-N (6E,10E,14E,18E)-2,6,10,15,19,23-hexamethyltetracosa-2,6,10,14,18,22-hexaene Chemical compound CC(C)=CCCC(C)=CCCC(C)=CCCC=C(C)CCC=C(C)CCC=C(C)C YYGNTYWPHWGJRM-UHFFFAOYSA-N 0.000 description 1
- SNKAWJBJQDLSFF-NVKMUCNASA-N 1,2-dioleoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCC\C=C/CCCCCCCC SNKAWJBJQDLSFF-NVKMUCNASA-N 0.000 description 1
- KZNQNBZMBZJQJO-UHFFFAOYSA-N 1-(2-azaniumylacetyl)pyrrolidine-2-carboxylate Chemical group NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 1
- WEYNBWVKOYCCQT-UHFFFAOYSA-N 1-(3-chloro-4-methylphenyl)-3-{2-[({5-[(dimethylamino)methyl]-2-furyl}methyl)thio]ethyl}urea Chemical compound O1C(CN(C)C)=CC=C1CSCCNC(=O)NC1=CC=C(C)C(Cl)=C1 WEYNBWVKOYCCQT-UHFFFAOYSA-N 0.000 description 1
- ZIIUUSVHCHPIQD-UHFFFAOYSA-N 2,4,6-trimethyl-N-[3-(trifluoromethyl)phenyl]benzenesulfonamide Chemical compound CC1=CC(C)=CC(C)=C1S(=O)(=O)NC1=CC=CC(C(F)(F)F)=C1 ZIIUUSVHCHPIQD-UHFFFAOYSA-N 0.000 description 1
- KRQUFUKTQHISJB-YYADALCUSA-N 2-[(E)-N-[2-(4-chlorophenoxy)propoxy]-C-propylcarbonimidoyl]-3-hydroxy-5-(thian-3-yl)cyclohex-2-en-1-one Chemical compound CCC\C(=N/OCC(C)OC1=CC=C(Cl)C=C1)C1=C(O)CC(CC1=O)C1CCCSC1 KRQUFUKTQHISJB-YYADALCUSA-N 0.000 description 1
- QCDWFXQBSFUVSP-UHFFFAOYSA-N 2-phenoxyethanol Chemical compound OCCOC1=CC=CC=C1 QCDWFXQBSFUVSP-UHFFFAOYSA-N 0.000 description 1
- 108010091324 3C proteases Proteins 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- HIQIXEFWDLTDED-UHFFFAOYSA-N 4-hydroxy-1-piperidin-4-ylpyrrolidin-2-one Chemical compound O=C1CC(O)CN1C1CCNCC1 HIQIXEFWDLTDED-UHFFFAOYSA-N 0.000 description 1
- 108020003589 5' Untranslated Regions Proteins 0.000 description 1
- 101710163881 5,6-dihydroxyindole-2-carboxylic acid oxidase Proteins 0.000 description 1
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 1
- 102100021324 5-azacytidine-induced protein 2 Human genes 0.000 description 1
- 239000013607 AAV vector Substances 0.000 description 1
- 241000235389 Absidia Species 0.000 description 1
- 101000768957 Acholeplasma phage L2 Uncharacterized 37.2 kDa protein Proteins 0.000 description 1
- 101000823746 Acidianus ambivalens Uncharacterized 17.7 kDa protein in bps2 3'region Proteins 0.000 description 1
- 101000916369 Acidianus ambivalens Uncharacterized protein in sor 5'region Proteins 0.000 description 1
- 101000769342 Acinetobacter guillouiae Uncharacterized protein in rpoN-murA intergenic region Proteins 0.000 description 1
- 101000823696 Actinobacillus pleuropneumoniae Uncharacterized glycosyltransferase in aroQ 3'region Proteins 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 101710137115 Adenylyl cyclase-associated protein 1 Proteins 0.000 description 1
- 101000786513 Agrobacterium tumefaciens (strain 15955) Uncharacterized protein outside the virF region Proteins 0.000 description 1
- 101000618005 Alkalihalobacillus pseudofirmus (strain ATCC BAA-2126 / JCM 17055 / OF4) Uncharacterized protein BpOF4_00885 Proteins 0.000 description 1
- 241000223600 Alternaria Species 0.000 description 1
- 102000052587 Anaphase-Promoting Complex-Cyclosome Apc3 Subunit Human genes 0.000 description 1
- 108700004606 Anaphase-Promoting Complex-Cyclosome Apc3 Subunit Proteins 0.000 description 1
- 102100023003 Ankyrin repeat domain-containing protein 30A Human genes 0.000 description 1
- 102000004411 Antithrombin III Human genes 0.000 description 1
- 108090000935 Antithrombin III Proteins 0.000 description 1
- 101100288313 Arabidopsis thaliana KTI4 gene Proteins 0.000 description 1
- 101000719121 Arabidopsis thaliana Protein MEI2-like 1 Proteins 0.000 description 1
- 235000003911 Arachis Nutrition 0.000 description 1
- 244000105624 Arachis hypogaea Species 0.000 description 1
- 102000014654 Aromatase Human genes 0.000 description 1
- 108010078554 Aromatase Proteins 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 241001225321 Aspergillus fumigatus Species 0.000 description 1
- 241000132177 Aspergillus glaucus Species 0.000 description 1
- 241000351920 Aspergillus nidulans Species 0.000 description 1
- 241000228245 Aspergillus niger Species 0.000 description 1
- 241001465318 Aspergillus terreus Species 0.000 description 1
- 241000711404 Avian avulavirus 1 Species 0.000 description 1
- 101000967489 Azorhizobium caulinodans (strain ATCC 43989 / DSM 5975 / JCM 20966 / LMG 6465 / NBRC 14845 / NCIMB 13405 / ORS 571) Uncharacterized protein AZC_3924 Proteins 0.000 description 1
- 208000003950 B-cell lymphoma Diseases 0.000 description 1
- 101000823761 Bacillus licheniformis Uncharacterized 9.4 kDa protein in flaL 3'region Proteins 0.000 description 1
- 101000819719 Bacillus methanolicus Uncharacterized N-acetyltransferase in lysA 3'region Proteins 0.000 description 1
- 101000789586 Bacillus subtilis (strain 168) UPF0702 transmembrane protein YkjA Proteins 0.000 description 1
- 101000792624 Bacillus subtilis (strain 168) Uncharacterized protein YbxH Proteins 0.000 description 1
- 101000790792 Bacillus subtilis (strain 168) Uncharacterized protein YckC Proteins 0.000 description 1
- 101000819705 Bacillus subtilis (strain 168) Uncharacterized protein YlxR Proteins 0.000 description 1
- 101000948218 Bacillus subtilis (strain 168) Uncharacterized protein YtxJ Proteins 0.000 description 1
- 101000718627 Bacillus thuringiensis subsp. kurstaki Putative RNA polymerase sigma-G factor Proteins 0.000 description 1
- 108091032955 Bacterial small RNA Proteins 0.000 description 1
- 231100000699 Bacterial toxin Toxicity 0.000 description 1
- 102100021663 Baculoviral IAP repeat-containing protein 5 Human genes 0.000 description 1
- 241000235579 Basidiobolus Species 0.000 description 1
- 241000608319 Bebaru virus Species 0.000 description 1
- 102100023995 Beta-nerve growth factor Human genes 0.000 description 1
- 241000335423 Blastomyces Species 0.000 description 1
- 101000641200 Bombyx mori densovirus Putative non-structural protein Proteins 0.000 description 1
- 241001118702 Border disease virus Species 0.000 description 1
- 241000589968 Borrelia Species 0.000 description 1
- 101001129912 Bos taurus Leptin Proteins 0.000 description 1
- 241000711895 Bovine orthopneumovirus Species 0.000 description 1
- 241000712005 Bovine respirovirus 3 Species 0.000 description 1
- 101900266865 Bovine viral diarrhea virus N-terminal protease Proteins 0.000 description 1
- 241000614861 Brachiola Species 0.000 description 1
- 241000589567 Brucella abortus Species 0.000 description 1
- 241001148106 Brucella melitensis Species 0.000 description 1
- 241001148112 Brucella neotomae Species 0.000 description 1
- 241000589568 Brucella ovis Species 0.000 description 1
- 241000508772 Brucella sp. Species 0.000 description 1
- 241001148111 Brucella suis Species 0.000 description 1
- 241001453380 Burkholderia Species 0.000 description 1
- 241000589513 Burkholderia cepacia Species 0.000 description 1
- 241001136175 Burkholderia pseudomallei Species 0.000 description 1
- 241001508395 Burkholderia sp. Species 0.000 description 1
- 101150108242 CDC27 gene Proteins 0.000 description 1
- 102100027674 CTD small phosphatase-like protein Human genes 0.000 description 1
- 101710156847 CTD small phosphatase-like protein Proteins 0.000 description 1
- 241000232908 Cabassous Species 0.000 description 1
- 101100438971 Caenorhabditis elegans mat-1 gene Proteins 0.000 description 1
- 101100314454 Caenorhabditis elegans tra-1 gene Proteins 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 241001493160 California encephalitis virus Species 0.000 description 1
- 241000282836 Camelus dromedarius Species 0.000 description 1
- 102100025570 Cancer/testis antigen 1 Human genes 0.000 description 1
- 102100039510 Cancer/testis antigen 2 Human genes 0.000 description 1
- 241000222173 Candida parapsilosis Species 0.000 description 1
- 241000222178 Candida tropicalis Species 0.000 description 1
- 101800001319 Capsid protein VP3 Proteins 0.000 description 1
- 101710140962 Capsid scaffolding protein Proteins 0.000 description 1
- 102000003846 Carbonic anhydrases Human genes 0.000 description 1
- 108090000209 Carbonic anhydrases Proteins 0.000 description 1
- 102100027668 Carboxy-terminal domain RNA polymerase II polypeptide A small phosphatase 1 Human genes 0.000 description 1
- 101710134395 Carboxy-terminal domain RNA polymerase II polypeptide A small phosphatase 1 Proteins 0.000 description 1
- 102100027667 Carboxy-terminal domain RNA polymerase II polypeptide A small phosphatase 2 Human genes 0.000 description 1
- 101710134389 Carboxy-terminal domain RNA polymerase II polypeptide A small phosphatase 2 Proteins 0.000 description 1
- 108010022366 Carcinoembryonic Antigen Proteins 0.000 description 1
- 102100026548 Caspase-8 Human genes 0.000 description 1
- 108090000538 Caspase-8 Proteins 0.000 description 1
- 108010059892 Cellulase Proteins 0.000 description 1
- 241000659008 Chapare mammarenavirus Species 0.000 description 1
- 101710163595 Chaperone protein DnaK Proteins 0.000 description 1
- 102000016951 Chemokine CXCL2 Human genes 0.000 description 1
- 108010014414 Chemokine CXCL2 Proteins 0.000 description 1
- 241001502567 Chikungunya virus Species 0.000 description 1
- 241001647372 Chlamydia pneumoniae Species 0.000 description 1
- 241000606153 Chlamydia trachomatis Species 0.000 description 1
- 108090000746 Chymosin Proteins 0.000 description 1
- 241001668502 Cladophialophora carrionii Species 0.000 description 1
- 241000222290 Cladosporium Species 0.000 description 1
- 241000710777 Classical swine fever virus Species 0.000 description 1
- 102100039518 Claudin-12 Human genes 0.000 description 1
- 101710197000 Claudin-12 Proteins 0.000 description 1
- 101000947633 Claviceps purpurea Uncharacterized 13.8 kDa protein Proteins 0.000 description 1
- 241001508813 Clavispora lusitaniae Species 0.000 description 1
- 241000193155 Clostridium botulinum Species 0.000 description 1
- 241000193468 Clostridium perfringens Species 0.000 description 1
- 241000193449 Clostridium tetani Species 0.000 description 1
- 102100022641 Coagulation factor IX Human genes 0.000 description 1
- 102100023804 Coagulation factor VII Human genes 0.000 description 1
- 101710094648 Coat protein Proteins 0.000 description 1
- 241000223205 Coccidioides immitis Species 0.000 description 1
- 108010035532 Collagen Proteins 0.000 description 1
- 102000008186 Collagen Human genes 0.000 description 1
- 241000702669 Coltivirus Species 0.000 description 1
- 241001480517 Conidiobolus Species 0.000 description 1
- 241000606678 Coxiella burnetii Species 0.000 description 1
- 241000709687 Coxsackievirus Species 0.000 description 1
- 241000699802 Cricetulus griseus Species 0.000 description 1
- 241000150230 Crimean-Congo hemorrhagic fever orthonairovirus Species 0.000 description 1
- 241001289493 Cripavirus Species 0.000 description 1
- 201000007336 Cryptococcosis Diseases 0.000 description 1
- 241000221204 Cryptococcus neoformans Species 0.000 description 1
- 241000223936 Cryptosporidium parvum Species 0.000 description 1
- 241000235555 Cunninghamella Species 0.000 description 1
- 241000223208 Curvularia Species 0.000 description 1
- 241000371644 Curvularia ravenelii Species 0.000 description 1
- 108010025464 Cyclin-Dependent Kinase 4 Proteins 0.000 description 1
- 102100036252 Cyclin-dependent kinase 4 Human genes 0.000 description 1
- 229920000858 Cyclodextrin Polymers 0.000 description 1
- 241000179197 Cyclospora Species 0.000 description 1
- 108010052832 Cytochromes Proteins 0.000 description 1
- 102000018832 Cytochromes Human genes 0.000 description 1
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 241000208654 Dandenong virus Species 0.000 description 1
- 101710088194 Dehydrogenase Proteins 0.000 description 1
- 208000001490 Dengue Diseases 0.000 description 1
- 206010012310 Dengue fever Diseases 0.000 description 1
- 241000710844 Dengue virus 4 Species 0.000 description 1
- 239000004375 Dextrin Substances 0.000 description 1
- 229920001353 Dextrin Polymers 0.000 description 1
- 101100216227 Dictyostelium discoideum anapc3 gene Proteins 0.000 description 1
- 208000002699 Digestive System Neoplasms Diseases 0.000 description 1
- 102100037070 Doublecortin domain-containing protein 2 Human genes 0.000 description 1
- 101100118093 Drosophila melanogaster eEF1alpha2 gene Proteins 0.000 description 1
- 108010031111 EBV-encoded nuclear antigen 1 Proteins 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 241000710945 Eastern equine encephalitis virus Species 0.000 description 1
- LVGKNOAMLMIIKO-UHFFFAOYSA-N Elaidinsaeure-aethylester Natural products CCCCCCCCC=CCCCCCCCC(=O)OCC LVGKNOAMLMIIKO-UHFFFAOYSA-N 0.000 description 1
- 108010014258 Elastin Proteins 0.000 description 1
- 102000016942 Elastin Human genes 0.000 description 1
- 241000243234 Encephalitozoon Species 0.000 description 1
- 241000596569 Encephalitozoon intestinalis Species 0.000 description 1
- 241000224432 Entamoeba histolytica Species 0.000 description 1
- 101000948901 Enterobacteria phage T4 Uncharacterized 16.0 kDa protein in segB-ipI intergenic region Proteins 0.000 description 1
- 241000194032 Enterococcus faecalis Species 0.000 description 1
- 241000194031 Enterococcus faecium Species 0.000 description 1
- 241001442406 Enterocytozoon bieneusi Species 0.000 description 1
- 206010066919 Epidemic polyarthritis Diseases 0.000 description 1
- 102400001368 Epidermal growth factor Human genes 0.000 description 1
- 101800003838 Epidermal growth factor Proteins 0.000 description 1
- 241001480035 Epidermophyton Species 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 101000805958 Equine herpesvirus 4 (strain 1942) Virion protein US10 homolog Proteins 0.000 description 1
- 241000214054 Equine rhinitis A virus Species 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 101000790442 Escherichia coli Insertion element IS2 uncharacterized 11.1 kDa protein Proteins 0.000 description 1
- 101000788354 Escherichia phage P2 Uncharacterized 8.2 kDa protein in gpA 5'region Proteins 0.000 description 1
- IAYPIBMASNFSPL-UHFFFAOYSA-N Ethylene oxide Chemical compound C1CO1 IAYPIBMASNFSPL-UHFFFAOYSA-N 0.000 description 1
- 241000223682 Exophiala Species 0.000 description 1
- 108010076282 Factor IX Proteins 0.000 description 1
- 108010023321 Factor VII Proteins 0.000 description 1
- 108010049003 Fibrinogen Proteins 0.000 description 1
- 102000008946 Fibrinogen Human genes 0.000 description 1
- 102100028043 Fibroblast growth factor 3 Human genes 0.000 description 1
- 108010022355 Fibroins Proteins 0.000 description 1
- 108010040721 Flagellin Proteins 0.000 description 1
- 241000122862 Fonsecaea Species 0.000 description 1
- 241000589601 Francisella Species 0.000 description 1
- 241000589602 Francisella tularensis Species 0.000 description 1
- 241000589599 Francisella tularensis subsp. novicida Species 0.000 description 1
- 101000770304 Frankia alni UPF0460 protein in nifX-nifW intergenic region Proteins 0.000 description 1
- 102000001390 Fructose-Bisphosphate Aldolase Human genes 0.000 description 1
- 108010068561 Fructose-Bisphosphate Aldolase Proteins 0.000 description 1
- 241000223218 Fusarium Species 0.000 description 1
- 102000000805 Galectin 4 Human genes 0.000 description 1
- 108010001515 Galectin 4 Proteins 0.000 description 1
- 102100031351 Galectin-9 Human genes 0.000 description 1
- 101710121810 Galectin-9 Proteins 0.000 description 1
- 102100031416 Gastric triacylglycerol lipase Human genes 0.000 description 1
- 102400000921 Gastrin Human genes 0.000 description 1
- 108010052343 Gastrins Proteins 0.000 description 1
- 206010017993 Gastrointestinal neoplasms Diseases 0.000 description 1
- 101000797344 Geobacillus stearothermophilus Putative tRNA (cytidine(34)-2'-O)-methyltransferase Proteins 0.000 description 1
- 101000748410 Geobacillus stearothermophilus Uncharacterized protein in fumA 3'region Proteins 0.000 description 1
- 241000178292 Geotrichum clavatum Species 0.000 description 1
- 241000608297 Getah virus Species 0.000 description 1
- 241000224466 Giardia Species 0.000 description 1
- 102000004547 Glucosylceramidase Human genes 0.000 description 1
- 108010017544 Glucosylceramidase Proteins 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 102000003886 Glycoproteins Human genes 0.000 description 1
- 108090000288 Glycoproteins Proteins 0.000 description 1
- 108010086677 Gonadotropins Proteins 0.000 description 1
- 102000006771 Gonadotropins Human genes 0.000 description 1
- 102000009465 Growth Factor Receptors Human genes 0.000 description 1
- 108010009202 Growth Factor Receptors Proteins 0.000 description 1
- 108010078321 Guanylate Cyclase Proteins 0.000 description 1
- 102000014469 Guanylate cyclase Human genes 0.000 description 1
- 241000606768 Haemophilus influenzae Species 0.000 description 1
- 101000772675 Haemophilus influenzae (strain ATCC 51907 / DSM 11121 / KW20 / Rd) UPF0438 protein HI_0847 Proteins 0.000 description 1
- 101000631019 Haemophilus influenzae (strain ATCC 51907 / DSM 11121 / KW20 / Rd) Uncharacterized protein HI_0350 Proteins 0.000 description 1
- 101000768938 Haemophilus phage HP1 (strain HP1c1) Uncharacterized 8.9 kDa protein in int-C1 intergenic region Proteins 0.000 description 1
- 241001466963 Hawaii calicivirus Species 0.000 description 1
- 101710178376 Heat shock 70 kDa protein Proteins 0.000 description 1
- 101710152018 Heat shock cognate 70 kDa protein Proteins 0.000 description 1
- 241000590002 Helicobacter pylori Species 0.000 description 1
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 1
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 1
- 241000035314 Henipavirus Species 0.000 description 1
- 208000037262 Hepatitis delta Diseases 0.000 description 1
- 241000228404 Histoplasma capsulatum Species 0.000 description 1
- 208000017604 Hodgkin disease Diseases 0.000 description 1
- 208000010747 Hodgkins lymphoma Diseases 0.000 description 1
- 101000895045 Homo sapiens 5-azacytidine-induced protein 2 Proteins 0.000 description 1
- 101000757191 Homo sapiens Ankyrin repeat domain-containing protein 30A Proteins 0.000 description 1
- 101000856237 Homo sapiens Cancer/testis antigen 1 Proteins 0.000 description 1
- 101000889345 Homo sapiens Cancer/testis antigen 2 Proteins 0.000 description 1
- 101000859758 Homo sapiens Cartilage-associated protein Proteins 0.000 description 1
- 101000916686 Homo sapiens Cytohesin-interacting protein Proteins 0.000 description 1
- 101000954709 Homo sapiens Doublecortin domain-containing protein 2 Proteins 0.000 description 1
- 101000892862 Homo sapiens Glutamate carboxypeptidase 2 Proteins 0.000 description 1
- 101000985516 Homo sapiens Hermansky-Pudlak syndrome 5 protein Proteins 0.000 description 1
- 101000726740 Homo sapiens Homeobox protein cut-like 1 Proteins 0.000 description 1
- 101001011442 Homo sapiens Interferon regulatory factor 5 Proteins 0.000 description 1
- 101000614481 Homo sapiens Kidney-associated antigen 1 Proteins 0.000 description 1
- 101001051093 Homo sapiens Low-density lipoprotein receptor Proteins 0.000 description 1
- 101001134060 Homo sapiens Melanocyte-stimulating hormone receptor Proteins 0.000 description 1
- 101001133056 Homo sapiens Mucin-1 Proteins 0.000 description 1
- 101001126234 Homo sapiens Phospholipid phosphatase 3 Proteins 0.000 description 1
- 101000874141 Homo sapiens Probable ATP-dependent RNA helicase DDX43 Proteins 0.000 description 1
- 101000864662 Homo sapiens Probable ATP-dependent RNA helicase DHX58 Proteins 0.000 description 1
- 101000761460 Homo sapiens Protein CASP Proteins 0.000 description 1
- 101000679365 Homo sapiens Putative tyrosine-protein phosphatase TPTE Proteins 0.000 description 1
- 101001109419 Homo sapiens RNA-binding protein NOB1 Proteins 0.000 description 1
- 101001012157 Homo sapiens Receptor tyrosine-protein kinase erbB-2 Proteins 0.000 description 1
- 101000857677 Homo sapiens Runt-related transcription factor 1 Proteins 0.000 description 1
- 101000821981 Homo sapiens Sarcoma antigen 1 Proteins 0.000 description 1
- 101000665137 Homo sapiens Scm-like with four MBT domains protein 1 Proteins 0.000 description 1
- 101000739178 Homo sapiens Secretoglobin family 3A member 2 Proteins 0.000 description 1
- 101000665387 Homo sapiens TANK-binding kinase 1-binding protein 1 Proteins 0.000 description 1
- 108010000521 Human Growth Hormone Proteins 0.000 description 1
- 102000002265 Human Growth Hormone Human genes 0.000 description 1
- 239000000854 Human Growth Hormone Substances 0.000 description 1
- 108091006905 Human Serum Albumin Proteins 0.000 description 1
- 102000008100 Human Serum Albumin Human genes 0.000 description 1
- 101900302016 Human enterovirus 71 Protease 3C Proteins 0.000 description 1
- 241000341655 Human papillomavirus type 16 Species 0.000 description 1
- 241000702617 Human parvovirus B19 Species 0.000 description 1
- 108700002232 Immediate-Early Genes Proteins 0.000 description 1
- 102000018071 Immunoglobulin Fc Fragments Human genes 0.000 description 1
- 108010091135 Immunoglobulin Fc Fragments Proteins 0.000 description 1
- 108010043496 Immunoglobulin Idiotypes Proteins 0.000 description 1
- 101900120552 Influenza A virus Non-structural protein 1 Proteins 0.000 description 1
- 108090000723 Insulin-Like Growth Factor I Proteins 0.000 description 1
- 108050002021 Integrator complex subunit 2 Proteins 0.000 description 1
- 102100030131 Interferon regulatory factor 5 Human genes 0.000 description 1
- 108010047761 Interferon-alpha Proteins 0.000 description 1
- 102000006992 Interferon-alpha Human genes 0.000 description 1
- 108090000467 Interferon-beta Proteins 0.000 description 1
- 102000003996 Interferon-beta Human genes 0.000 description 1
- 108010065805 Interleukin-12 Proteins 0.000 description 1
- 108090000172 Interleukin-15 Proteins 0.000 description 1
- 108090000978 Interleukin-4 Proteins 0.000 description 1
- 108090001005 Interleukin-6 Proteins 0.000 description 1
- 108010002586 Interleukin-7 Proteins 0.000 description 1
- 241000710842 Japanese encephalitis virus Species 0.000 description 1
- 241000712890 Junin mammarenavirus Species 0.000 description 1
- 101000782488 Junonia coenia densovirus (isolate pBRJ/1990) Putative non-structural protein NS2 Proteins 0.000 description 1
- 241000588748 Klebsiella Species 0.000 description 1
- 241000588747 Klebsiella pneumoniae Species 0.000 description 1
- 101000811523 Klebsiella pneumoniae Uncharacterized 55.8 kDa protein in cps region Proteins 0.000 description 1
- 241000588754 Klebsiella sp. Species 0.000 description 1
- 244000285963 Kluyveromyces fragilis Species 0.000 description 1
- 235000014663 Kluyveromyces fragilis Nutrition 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 101000818409 Lactococcus lactis subsp. lactis Uncharacterized HTH-type transcriptional regulator in lacX 3'region Proteins 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- 241000712902 Lassa mammarenavirus Species 0.000 description 1
- 241000589242 Legionella pneumophila Species 0.000 description 1
- 241000713666 Lentivirus Species 0.000 description 1
- 102000016267 Leptin Human genes 0.000 description 1
- 101000878851 Leptolyngbya boryana Putative Fe(2+) transport protein A Proteins 0.000 description 1
- 240000007472 Leucaena leucocephala Species 0.000 description 1
- 235000010643 Leucaena leucocephala Nutrition 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 102000004882 Lipase Human genes 0.000 description 1
- 108090001060 Lipase Proteins 0.000 description 1
- 239000004367 Lipase Substances 0.000 description 1
- 108010028921 Lipopeptides Proteins 0.000 description 1
- 108090001030 Lipoproteins Proteins 0.000 description 1
- 102000004895 Lipoproteins Human genes 0.000 description 1
- 241000186781 Listeria Species 0.000 description 1
- 102100024640 Low-density lipoprotein receptor Human genes 0.000 description 1
- 208000016604 Lyme disease Diseases 0.000 description 1
- 206010025323 Lymphomas Diseases 0.000 description 1
- 241000711828 Lyssavirus Species 0.000 description 1
- 108010010995 MART-1 Antigen Proteins 0.000 description 1
- 108010000410 MSH receptor Proteins 0.000 description 1
- 241000701076 Macacine alphaherpesvirus 1 Species 0.000 description 1
- 241000712898 Machupo mammarenavirus Species 0.000 description 1
- 101000915697 Machupo virus RING finger protein Z Proteins 0.000 description 1
- 241001539803 Magnusiomyces capitatus Species 0.000 description 1
- 101710141452 Major surface glycoprotein G Proteins 0.000 description 1
- 241000555676 Malassezia Species 0.000 description 1
- 241000555688 Malassezia furfur Species 0.000 description 1
- 241001601781 Mammarenavirus Species 0.000 description 1
- 101710085938 Matrix protein Proteins 0.000 description 1
- 241000608292 Mayaro virus Species 0.000 description 1
- 101710127721 Membrane protein Proteins 0.000 description 1
- 201000009906 Meningitis Diseases 0.000 description 1
- 101000761459 Mesocricetus auratus Calcium-dependent serine proteinase Proteins 0.000 description 1
- 101000758828 Methanosarcina barkeri (strain Fusaro / DSM 804) Uncharacterized protein Mbar_A1602 Proteins 0.000 description 1
- 241000235048 Meyerozyma guilliermondii Species 0.000 description 1
- 108700011259 MicroRNAs Proteins 0.000 description 1
- 241000243190 Microsporidia Species 0.000 description 1
- 241001295810 Microsporidium Species 0.000 description 1
- 241000893980 Microsporum canis Species 0.000 description 1
- 241001460074 Microsporum distortum Species 0.000 description 1
- 101001122401 Middle East respiratory syndrome-related coronavirus (isolate United Kingdom/H123990006/2012) Non-structural protein ORF3 Proteins 0.000 description 1
- 241000588655 Moraxella catarrhalis Species 0.000 description 1
- 241000235575 Mortierella Species 0.000 description 1
- 241000868135 Mucambo virus Species 0.000 description 1
- 102100034256 Mucin-1 Human genes 0.000 description 1
- 241000235395 Mucor Species 0.000 description 1
- 241000008906 Murine coronavirus Species 0.000 description 1
- 241001455073 Murine herpesvirus Species 0.000 description 1
- 241000711408 Murine respirovirus Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 241000187479 Mycobacterium tuberculosis Species 0.000 description 1
- 101800000021 N-terminal protease Proteins 0.000 description 1
- 241000893976 Nannizzia gypsea Species 0.000 description 1
- 241000264375 Nannizzia nana Species 0.000 description 1
- 241000588653 Neisseria Species 0.000 description 1
- 229930193140 Neomycin Natural products 0.000 description 1
- 108010025020 Nerve Growth Factor Proteins 0.000 description 1
- 102000007530 Neurofibromin 1 Human genes 0.000 description 1
- 108010085793 Neurofibromin 1 Proteins 0.000 description 1
- 241000526636 Nipah henipavirus Species 0.000 description 1
- 101000854974 Nipah virus Non-structural protein V Proteins 0.000 description 1
- 101800000515 Non-structural protein 3 Proteins 0.000 description 1
- 101710188663 Non-structural protein 5a Proteins 0.000 description 1
- 101710101547 Non-structural protein NS-S Proteins 0.000 description 1
- 101710091700 Non-structural protein ORF4b Proteins 0.000 description 1
- 241001263478 Norovirus Species 0.000 description 1
- 241000714209 Norwalk virus Species 0.000 description 1
- 241001126829 Nosema Species 0.000 description 1
- 108090001074 Nucleocapsid Proteins Proteins 0.000 description 1
- 241000702259 Orbivirus Species 0.000 description 1
- 101000740670 Orgyia pseudotsugata multicapsid polyhedrosis virus Protein C42 Proteins 0.000 description 1
- 241000702244 Orthoreovirus Species 0.000 description 1
- 102400000050 Oxytocin Human genes 0.000 description 1
- XNOPRXBHLZRZKH-UHFFFAOYSA-N Oxytocin Natural products N1C(=O)C(N)CSSCC(C(=O)N2C(CCC2)C(=O)NC(CC(C)C)C(=O)NCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(CCC(N)=O)NC(=O)C(C(C)CC)NC(=O)C1CC1=CC=C(O)C=C1 XNOPRXBHLZRZKH-UHFFFAOYSA-N 0.000 description 1
- 101800000989 Oxytocin Proteins 0.000 description 1
- 241001236817 Paecilomyces <Clavicipitaceae> Species 0.000 description 1
- 241001631646 Papillomaviridae Species 0.000 description 1
- 241000526686 Paracoccidioides brasiliensis Species 0.000 description 1
- 101900105692 Parainfluenza virus 5 Non-structural protein V Proteins 0.000 description 1
- 208000002606 Paramyxoviridae Infections Diseases 0.000 description 1
- 108700015463 Paramyxovirus V Proteins 0.000 description 1
- 241000991583 Parechovirus Species 0.000 description 1
- 241000228143 Penicillium Species 0.000 description 1
- 206010057249 Phagocytosis Diseases 0.000 description 1
- 102000015439 Phospholipases Human genes 0.000 description 1
- 108010064785 Phospholipases Proteins 0.000 description 1
- 102100030450 Phospholipid phosphatase 3 Human genes 0.000 description 1
- 102000012288 Phosphopyruvate Hydratase Human genes 0.000 description 1
- 108010022181 Phosphopyruvate Hydratase Proteins 0.000 description 1
- 102000004861 Phosphoric Diester Hydrolases Human genes 0.000 description 1
- 108090001050 Phosphoric Diester Hydrolases Proteins 0.000 description 1
- 101000769182 Photorhabdus luminescens Uncharacterized protein in pnp 3'region Proteins 0.000 description 1
- 241000235645 Pichia kudriavzevii Species 0.000 description 1
- 241000305299 Pithomyces Species 0.000 description 1
- 241000868134 Pixuna virus Species 0.000 description 1
- 206010035148 Plague Diseases 0.000 description 1
- 206010035226 Plasma cell myeloma Diseases 0.000 description 1
- 108010001014 Plasminogen Activators Proteins 0.000 description 1
- 102000001938 Plasminogen Activators Human genes 0.000 description 1
- 241001492488 Pleistophora Species 0.000 description 1
- 241000233872 Pneumocystis carinii Species 0.000 description 1
- 206010035664 Pneumonia Diseases 0.000 description 1
- 208000000474 Poliomyelitis Diseases 0.000 description 1
- 241001505332 Polyomavirus sp. Species 0.000 description 1
- 241001393771 Porcine bocavirus 1 Species 0.000 description 1
- 241001672814 Porcine teschovirus 1 Species 0.000 description 1
- 102000017033 Porins Human genes 0.000 description 1
- 108010013381 Porins Proteins 0.000 description 1
- 241001300940 Porphyromonas sp. Species 0.000 description 1
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 1
- 201000009754 Powassan encephalitis Diseases 0.000 description 1
- WVOXLKUUVCCCSU-ZPFDUUQYSA-N Pro-Glu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVOXLKUUVCCCSU-ZPFDUUQYSA-N 0.000 description 1
- 102100035724 Probable ATP-dependent RNA helicase DDX43 Human genes 0.000 description 1
- 102000003946 Prolactin Human genes 0.000 description 1
- 108010057464 Prolactin Proteins 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 102000006437 Proprotein Convertases Human genes 0.000 description 1
- 108010044159 Proprotein Convertases Proteins 0.000 description 1
- 102000004245 Proteasome Endopeptidase Complex Human genes 0.000 description 1
- 108090000708 Proteasome Endopeptidase Complex Proteins 0.000 description 1
- 101800004937 Protein C Proteins 0.000 description 1
- 102000017975 Protein C Human genes 0.000 description 1
- 102100024933 Protein CASP Human genes 0.000 description 1
- 101710132595 Protein E7 Proteins 0.000 description 1
- 102100040307 Protein FAM3B Human genes 0.000 description 1
- 101710183920 Protein M2-2 Proteins 0.000 description 1
- 101710137397 Protein ORF3 Proteins 0.000 description 1
- 101710121844 Protein PB1-F2 Proteins 0.000 description 1
- 101000961392 Pseudescherichia vulneris Uncharacterized 29.9 kDa protein in crtE 3'region Proteins 0.000 description 1
- 241000589517 Pseudomonas aeruginosa Species 0.000 description 1
- 101000731030 Pseudomonas oleovorans Poly(3-hydroxyalkanoate) polymerase 2 Proteins 0.000 description 1
- 101001065485 Pseudomonas putida Probable fatty acid methyltransferase Proteins 0.000 description 1
- 102100022578 Putative tyrosine-protein phosphatase TPTE Human genes 0.000 description 1
- 241000197220 Pythium insidiosum Species 0.000 description 1
- 108020005161 RNA Caps Proteins 0.000 description 1
- 102000004409 RNA Helicases Human genes 0.000 description 1
- 108090000944 RNA Helicases Proteins 0.000 description 1
- 102000044126 RNA-Binding Proteins Human genes 0.000 description 1
- 108700020471 RNA-Binding Proteins Proteins 0.000 description 1
- 102100022491 RNA-binding protein NOB1 Human genes 0.000 description 1
- 101710118046 RNA-directed RNA polymerase Proteins 0.000 description 1
- 101150066717 Rara gene Proteins 0.000 description 1
- 102100030086 Receptor tyrosine-protein kinase erbB-2 Human genes 0.000 description 1
- 208000015634 Rectal Neoplasms Diseases 0.000 description 1
- 208000006265 Renal cell carcinoma Diseases 0.000 description 1
- 101710200092 Replicase polyprotein Proteins 0.000 description 1
- 108091027981 Response element Proteins 0.000 description 1
- 206010051497 Rhinotracheitis Diseases 0.000 description 1
- 101000711023 Rhizobium leguminosarum bv. trifolii Uncharacterized protein in tfuA 3'region Proteins 0.000 description 1
- 241001361634 Rhizoctonia Species 0.000 description 1
- 101000948156 Rhodococcus erythropolis Uncharacterized 47.3 kDa protein in thcA 5'region Proteins 0.000 description 1
- 101000917565 Rhodococcus fascians Uncharacterized 33.6 kDa protein in fasciation locus Proteins 0.000 description 1
- 241000936948 Rhopalosiphum padi virus Species 0.000 description 1
- 101710091522 Ribonucleoside-diphosphate reductase large subunit-like protein Proteins 0.000 description 1
- 235000004443 Ricinus communis Nutrition 0.000 description 1
- 240000000528 Ricinus communis Species 0.000 description 1
- 241000606701 Rickettsia Species 0.000 description 1
- 241000713124 Rift Valley fever virus Species 0.000 description 1
- 241000710942 Ross River virus Species 0.000 description 1
- 241000702670 Rotavirus Species 0.000 description 1
- 102100025373 Runt-related transcription factor 1 Human genes 0.000 description 1
- 241000907329 Russian Spring-Summer encephalitis virus Species 0.000 description 1
- 108010044012 STAT1 Transcription Factor Proteins 0.000 description 1
- 241000192617 Sabia mammarenavirus Species 0.000 description 1
- 241000235070 Saccharomyces Species 0.000 description 1
- 101000790284 Saimiriine herpesvirus 2 (strain 488) Uncharacterized 9.5 kDa protein in DHFR 3'region Proteins 0.000 description 1
- 241000293026 Saksenaea Species 0.000 description 1
- 241000293871 Salmonella enterica subsp. enterica serovar Typhi Species 0.000 description 1
- 101800001700 Saposin-D Proteins 0.000 description 1
- 102100021466 Sarcoma antigen 1 Human genes 0.000 description 1
- 241000132889 Scedosporium Species 0.000 description 1
- 102100038689 Scm-like with four MBT domains protein 1 Human genes 0.000 description 1
- 102100037269 Secretoglobin family 3A member 2 Human genes 0.000 description 1
- 102000003800 Selectins Human genes 0.000 description 1
- 108090000184 Selectins Proteins 0.000 description 1
- 101710198360 Serine/threonine-protein kinase US3 Proteins 0.000 description 1
- 101710144355 Serine/threonine-protein kinase US3 homolog Proteins 0.000 description 1
- 108010071390 Serum Albumin Proteins 0.000 description 1
- 102000007562 Serum Albumin Human genes 0.000 description 1
- 101000992425 Severe acute respiratory syndrome coronavirus ORF9b protein Proteins 0.000 description 1
- 101710173693 Short transient receptor potential channel 1 Proteins 0.000 description 1
- 102100029904 Signal transducer and activator of transcription 1-alpha/beta Human genes 0.000 description 1
- 241000710960 Sindbis virus Species 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- 241000509413 Snow Mountain virus Species 0.000 description 1
- 102000013275 Somatomedins Human genes 0.000 description 1
- 241001149962 Sporothrix Species 0.000 description 1
- 241001149963 Sporothrix schenckii Species 0.000 description 1
- 241000713675 Spumavirus Species 0.000 description 1
- 102100035748 Squamous cell carcinoma antigen recognized by T-cells 3 Human genes 0.000 description 1
- 101710185775 Squamous cell carcinoma antigen recognized by T-cells 3 Proteins 0.000 description 1
- 241000710888 St. Louis encephalitis virus Species 0.000 description 1
- 241000191967 Staphylococcus aureus Species 0.000 description 1
- 241001147691 Staphylococcus saprophyticus Species 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 241000193985 Streptococcus agalactiae Species 0.000 description 1
- 241000193998 Streptococcus pneumoniae Species 0.000 description 1
- 241000193996 Streptococcus pyogenes Species 0.000 description 1
- 108010023197 Streptokinase Proteins 0.000 description 1
- 101000788499 Streptomyces coelicolor Uncharacterized oxidoreductase in mprA 5'region Proteins 0.000 description 1
- 101001102841 Streptomyces griseus Purine nucleoside phosphorylase ORF3 Proteins 0.000 description 1
- 101000708557 Streptomyces lincolnensis Uncharacterized 17.2 kDa protein in melC2-rnhH intergenic region Proteins 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 241000701093 Suid alphaherpesvirus 1 Species 0.000 description 1
- 241001485053 Suid betaherpesvirus 2 Species 0.000 description 1
- 101800001271 Surface protein Proteins 0.000 description 1
- 108010002687 Survivin Proteins 0.000 description 1
- 102100036234 Synaptonemal complex protein 1 Human genes 0.000 description 1
- 101710143177 Synaptonemal complex protein 1 Proteins 0.000 description 1
- 208000027585 T-cell non-Hodgkin lymphoma Diseases 0.000 description 1
- 210000001744 T-lymphocyte Anatomy 0.000 description 1
- 108700019889 TEL-AML1 fusion Proteins 0.000 description 1
- 102000004399 TNF receptor-associated factor 3 Human genes 0.000 description 1
- 102100033082 TNF receptor-associated factor 3 Human genes 0.000 description 1
- 108090000922 TNF receptor-associated factor 3 Proteins 0.000 description 1
- 101150033985 TPI gene Proteins 0.000 description 1
- 101150032817 TPI1 gene Proteins 0.000 description 1
- 241001523006 Talaromyces marneffei Species 0.000 description 1
- 108010017842 Telomerase Proteins 0.000 description 1
- 208000024313 Testicular Neoplasms Diseases 0.000 description 1
- 206010057644 Testis cancer Diseases 0.000 description 1
- 206010043376 Tetanus Diseases 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- BHEOSNUKNHRBNM-UHFFFAOYSA-N Tetramethylsqualene Natural products CC(=C)C(C)CCC(=C)C(C)CCC(C)=CCCC=C(C)CCC(C)C(=C)CCC(C)C(C)=C BHEOSNUKNHRBNM-UHFFFAOYSA-N 0.000 description 1
- 101000649826 Thermotoga neapolitana Putative anti-sigma factor antagonist TM1081 homolog Proteins 0.000 description 1
- 241001648840 Thosea asigna virus Species 0.000 description 1
- 108090000190 Thrombin Proteins 0.000 description 1
- AUYYCJSJGJYCDS-LBPRGKRZSA-N Thyrolar Chemical class IC1=CC(C[C@H](N)C(O)=O)=CC(I)=C1OC1=CC=C(O)C(I)=C1 AUYYCJSJGJYCDS-LBPRGKRZSA-N 0.000 description 1
- 101100080614 Toscana virus NSS gene Proteins 0.000 description 1
- 241000223996 Toxoplasma Species 0.000 description 1
- 241000223997 Toxoplasma gondii Species 0.000 description 1
- 241001249162 Trachipleistophora Species 0.000 description 1
- 101710107943 Trans-activator protein BZLF1 Proteins 0.000 description 1
- 241000589884 Treponema pallidum Species 0.000 description 1
- 241000893963 Trichophyton concentricum Species 0.000 description 1
- 241000893962 Trichophyton equinum Species 0.000 description 1
- 241001045770 Trichophyton mentagrophytes Species 0.000 description 1
- 241001609979 Trichophyton quinckeanum Species 0.000 description 1
- 241000223229 Trichophyton rubrum Species 0.000 description 1
- 241001480048 Trichophyton tonsurans Species 0.000 description 1
- 241000893966 Trichophyton verrucosum Species 0.000 description 1
- 241001480050 Trichophyton violaceum Species 0.000 description 1
- 241000223231 Trichosporon beigelii Species 0.000 description 1
- LVTKHGUGBGNBPL-UHFFFAOYSA-N Trp-P-1 Chemical compound N1C2=CC=CC=C2C2=C1C(C)=C(N)N=C2C LVTKHGUGBGNBPL-UHFFFAOYSA-N 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 108090000704 Tubulin Proteins 0.000 description 1
- 102000004243 Tubulin Human genes 0.000 description 1
- 208000037386 Typhoid Diseases 0.000 description 1
- 102000003425 Tyrosinase Human genes 0.000 description 1
- 108060008724 Tyrosinase Proteins 0.000 description 1
- 102100027244 U4/U6.U5 tri-snRNP-associated protein 1 Human genes 0.000 description 1
- 101710155955 U4/U6.U5 tri-snRNP-associated protein 1 Proteins 0.000 description 1
- 101150060044 UL26 gene Proteins 0.000 description 1
- 101710100251 US1 protein Proteins 0.000 description 1
- 101710134973 Uncharacterized 9.7 kDa protein in cox-rep intergenic region Proteins 0.000 description 1
- 101900337592 Vaccinia virus Protein C6 Proteins 0.000 description 1
- 101900001372 Vaccinia virus RNA-binding protein E3 Proteins 0.000 description 1
- 108700024019 Vaccinia virus pK3 Proteins 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 241000870995 Variola Species 0.000 description 1
- 102000005789 Vascular Endothelial Growth Factors Human genes 0.000 description 1
- 108010019530 Vascular Endothelial Growth Factors Proteins 0.000 description 1
- 208000002687 Venezuelan Equine Encephalomyelitis Diseases 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 101000827562 Vibrio alginolyticus Uncharacterized protein in proC 3'region Proteins 0.000 description 1
- 241000607626 Vibrio cholerae Species 0.000 description 1
- 101000778915 Vibrio parahaemolyticus serotype O3:K6 (strain RIMD 2210633) Uncharacterized membrane protein VP2115 Proteins 0.000 description 1
- 108020000999 Viral RNA Proteins 0.000 description 1
- 206010051511 Viral diarrhoea Diseases 0.000 description 1
- 241000144556 Vittaforma Species 0.000 description 1
- 201000006449 West Nile encephalitis Diseases 0.000 description 1
- 208000005466 Western Equine Encephalomyelitis Diseases 0.000 description 1
- 201000005806 Western equine encephalitis Diseases 0.000 description 1
- 101710086987 X protein Proteins 0.000 description 1
- 241000710772 Yellow fever virus Species 0.000 description 1
- 241000607447 Yersinia enterocolitica Species 0.000 description 1
- 229920000392 Zymosan Polymers 0.000 description 1
- GUIRUWRHBDQCQJ-UHFFFAOYSA-N [(6-oxo-1,7-dihydropurin-2-yl)amino]phosphonic acid Chemical compound P(=O)(O)(O)NC=1NC(C=2NC=NC=2N=1)=O GUIRUWRHBDQCQJ-UHFFFAOYSA-N 0.000 description 1
- 241000222126 [Candida] glabrata Species 0.000 description 1
- 241000606834 [Haemophilus] ducreyi Species 0.000 description 1
- DPXJVFZANSGRMM-UHFFFAOYSA-N acetic acid;2,3,4,5,6-pentahydroxyhexanal;sodium Chemical compound [Na].CC(O)=O.OCC(O)C(O)C(O)C(O)C=O DPXJVFZANSGRMM-UHFFFAOYSA-N 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- UDMBCSSLTHHNCD-KQYNXXCUSA-N adenosine 5'-monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O UDMBCSSLTHHNCD-KQYNXXCUSA-N 0.000 description 1
- 102000030621 adenylate cyclase Human genes 0.000 description 1
- 108060000200 adenylate cyclase Proteins 0.000 description 1
- 239000000443 aerosol Substances 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 102000013529 alpha-Fetoproteins Human genes 0.000 description 1
- 108010026331 alpha-Fetoproteins Proteins 0.000 description 1
- AZDRQVAHHNSJOQ-UHFFFAOYSA-N alumane Chemical class [AlH3] AZDRQVAHHNSJOQ-UHFFFAOYSA-N 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 230000033115 angiogenesis Effects 0.000 description 1
- 150000008064 anhydrides Chemical class 0.000 description 1
- 229960004977 anhydrous lactose Drugs 0.000 description 1
- 230000003042 antagnostic effect Effects 0.000 description 1
- 230000008485 antagonism Effects 0.000 description 1
- 239000003146 anticoagulant agent Substances 0.000 description 1
- 229940127219 anticoagulant drug Drugs 0.000 description 1
- 229960005348 antithrombin iii Drugs 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 229940091771 aspergillus fumigatus Drugs 0.000 description 1
- 210000004957 autophagosome Anatomy 0.000 description 1
- GLMQHZPGHAPYIO-UHFFFAOYSA-L azanium;2-hydroxypropane-1,2,3-tricarboxylate;iron(2+) Chemical compound [NH4+].[Fe+2].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O GLMQHZPGHAPYIO-UHFFFAOYSA-L 0.000 description 1
- 229940065181 bacillus anthracis Drugs 0.000 description 1
- 239000000688 bacterial toxin Substances 0.000 description 1
- VEZXCJBBBCKRPI-UHFFFAOYSA-N beta-propiolactone Chemical compound O=C1CCO1 VEZXCJBBBCKRPI-UHFFFAOYSA-N 0.000 description 1
- 239000003833 bile salt Substances 0.000 description 1
- 229940093761 bile salts Drugs 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000001851 biosynthetic effect Effects 0.000 description 1
- 229940126587 biotherapeutics Drugs 0.000 description 1
- 229910021538 borax Inorganic materials 0.000 description 1
- 208000008921 border disease Diseases 0.000 description 1
- 108010006025 bovine growth hormone Proteins 0.000 description 1
- 206010006451 bronchitis Diseases 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- RFCBNSCSPXMEBK-INFSMZHSSA-N c-GMP-AMP Chemical compound C([C@H]1O2)OP(O)(=O)O[C@H]3[C@@H](O)[C@H](N4C5=NC=NC(N)=C5N=C4)O[C@@H]3COP(O)(=O)O[C@H]1[C@@H](O)[C@@H]2N1C(N=C(NC2=O)N)=C2N=C1 RFCBNSCSPXMEBK-INFSMZHSSA-N 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 229940095731 candida albicans Drugs 0.000 description 1
- 208000032343 candida glabrata infection Diseases 0.000 description 1
- 229940055022 candida parapsilosis Drugs 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 239000001768 carboxy methyl cellulose Substances 0.000 description 1
- 150000001732 carboxylic acid derivatives Chemical class 0.000 description 1
- 150000003943 catecholamines Chemical class 0.000 description 1
- 230000007910 cell fusion Effects 0.000 description 1
- 230000002032 cellular defenses Effects 0.000 description 1
- 229940106157 cellulase Drugs 0.000 description 1
- AOXOCDRNSPFDPE-UKEONUMOSA-N chembl413654 Chemical compound C([C@H](C(=O)NCC(=O)N[C@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@H](CCSC)C(=O)N[C@H](CC(O)=O)C(=O)N[C@H](CC=1C=CC=CC=1)C(N)=O)NC(=O)[C@@H](C)NC(=O)[C@@H](CCC(O)=O)NC(=O)[C@@H](CCC(O)=O)NC(=O)[C@@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H]1N(CCC1)C(=O)CNC(=O)[C@@H](N)CCC(O)=O)C1=CC=C(O)C=C1 AOXOCDRNSPFDPE-UKEONUMOSA-N 0.000 description 1
- 229940038705 chlamydia trachomatis Drugs 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 235000012000 cholesterol Nutrition 0.000 description 1
- 229940080701 chymosin Drugs 0.000 description 1
- 235000015165 citric acid Nutrition 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 230000008045 co-localization Effects 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 235000019864 coconut oil Nutrition 0.000 description 1
- 239000003240 coconut oil Substances 0.000 description 1
- 229920001436 collagen Polymers 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000002648 combination therapy Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 108091092330 cytoplasmic RNA Proteins 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 230000005860 defense response to virus Effects 0.000 description 1
- 230000003413 degradative effect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 208000025729 dengue disease Diseases 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 235000019425 dextrin Nutrition 0.000 description 1
- 239000008121 dextrose Substances 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 230000037213 diet Effects 0.000 description 1
- WZISDKTXHMETKG-UHFFFAOYSA-H dimagnesium;dipotassium;trisulfate Chemical compound [Mg+2].[Mg+2].[K+].[K+].[O-]S([O-])(=O)=O.[O-]S([O-])(=O)=O.[O-]S([O-])(=O)=O WZISDKTXHMETKG-UHFFFAOYSA-H 0.000 description 1
- 206010013023 diphtheria Diseases 0.000 description 1
- WDRWZVWLVBXVOI-QTNFYWBSSA-L dipotassium;(2s)-2-aminopentanedioate Chemical compound [K+].[K+].[O-]C(=O)[C@@H](N)CCC([O-])=O WDRWZVWLVBXVOI-QTNFYWBSSA-L 0.000 description 1
- 230000006806 disease prevention Effects 0.000 description 1
- PRAKJMSDJKAYCZ-UHFFFAOYSA-N dodecahydrosqualene Natural products CC(C)CCCC(C)CCCC(C)CCCCC(C)CCCC(C)CCCC(C)C PRAKJMSDJKAYCZ-UHFFFAOYSA-N 0.000 description 1
- 229960003638 dopamine Drugs 0.000 description 1
- 230000007783 downstream signaling Effects 0.000 description 1
- 102000010982 eIF-2 Kinase Human genes 0.000 description 1
- 108010037623 eIF-2 Kinase Proteins 0.000 description 1
- 229920002549 elastin Polymers 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 239000003995 emulsifying agent Substances 0.000 description 1
- 230000001159 endocytotic effect Effects 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 229940007078 entamoeba histolytica Drugs 0.000 description 1
- 229940032049 enterococcus faecalis Drugs 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 229940125532 enzyme inhibitor Drugs 0.000 description 1
- 229940116977 epidermal growth factor Drugs 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- LVGKNOAMLMIIKO-QXMHVHEDSA-N ethyl oleate Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OCC LVGKNOAMLMIIKO-QXMHVHEDSA-N 0.000 description 1
- 229940093471 ethyl oleate Drugs 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 229960004222 factor ix Drugs 0.000 description 1
- 229940012413 factor vii Drugs 0.000 description 1
- 235000019197 fats Nutrition 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 229940012952 fibrinogen Drugs 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000002496 gastric effect Effects 0.000 description 1
- 108010091264 gastric triacylglycerol lipase Proteins 0.000 description 1
- 210000001035 gastrointestinal tract Anatomy 0.000 description 1
- 230000030279 gene silencing Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 235000011187 glycerol Nutrition 0.000 description 1
- 150000002334 glycols Chemical class 0.000 description 1
- 239000002622 gonadotropin Substances 0.000 description 1
- 239000008187 granular material Substances 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 102000028718 growth factor binding proteins Human genes 0.000 description 1
- 108091009353 growth factor binding proteins Proteins 0.000 description 1
- 239000010440 gypsum Substances 0.000 description 1
- 229910052602 gypsum Inorganic materials 0.000 description 1
- 150000008282 halocarbons Chemical class 0.000 description 1
- SHFKGANKURXVMY-LCWPZEQJSA-N hcv e2 protein Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](C)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)NC(=O)CNC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](C)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCSC)C(C)C)[C@@H](C)O)[C@@H](C)O)C(C)C)[C@@H](C)O)[C@@H](C)O)[C@@H](C)O)CC1=CC=CC=C1 SHFKGANKURXVMY-LCWPZEQJSA-N 0.000 description 1
- 229940037467 helicobacter pylori Drugs 0.000 description 1
- 108010080417 hemozoin Proteins 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 108700008776 hepatitis C virus NS-5 Proteins 0.000 description 1
- 208000029570 hepatitis D virus infection Diseases 0.000 description 1
- 230000013632 homeostatic process Effects 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 108700020697 human parainfluenza virus type 1 V Proteins 0.000 description 1
- 239000000017 hydrogel Substances 0.000 description 1
- 230000007124 immune defense Effects 0.000 description 1
- 230000005847 immunogenicity Effects 0.000 description 1
- 229940072221 immunoglobulins Drugs 0.000 description 1
- 229960003444 immunosuppressant agent Drugs 0.000 description 1
- 230000001861 immunosuppressant effect Effects 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 230000001976 improved effect Effects 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 230000003960 inflammatory cascade Effects 0.000 description 1
- 206010022000 influenza Diseases 0.000 description 1
- 208000037798 influenza B Diseases 0.000 description 1
- 208000037799 influenza C Diseases 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 102000006495 integrins Human genes 0.000 description 1
- 108010044426 integrins Proteins 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 108010074108 interleukin-21 Proteins 0.000 description 1
- 229940047122 interleukins Drugs 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 238000010255 intramuscular injection Methods 0.000 description 1
- 239000007927 intramuscular injection Substances 0.000 description 1
- 238000007912 intraperitoneal administration Methods 0.000 description 1
- 238000007913 intrathecal administration Methods 0.000 description 1
- 239000004313 iron ammonium citrate Substances 0.000 description 1
- 235000000011 iron ammonium citrate Nutrition 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 229960001375 lactose Drugs 0.000 description 1
- 229940115932 legionella pneumophila Drugs 0.000 description 1
- 229940039781 leptin Drugs 0.000 description 1
- NRYBAZVQPHGZNS-ZSOCWYAHSA-N leptin Chemical compound O=C([C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC(C)C)CCSC)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CS)C(O)=O NRYBAZVQPHGZNS-ZSOCWYAHSA-N 0.000 description 1
- 235000019421 lipase Nutrition 0.000 description 1
- GZQKNULLWNGMCW-PWQABINMSA-N lipid A (E. coli) Chemical compound O1[C@H](CO)[C@@H](OP(O)(O)=O)[C@H](OC(=O)C[C@@H](CCCCCCCCCCC)OC(=O)CCCCCCCCCCCCC)[C@@H](NC(=O)C[C@@H](CCCCCCCCCCC)OC(=O)CCCCCCCCCCC)[C@@H]1OC[C@@H]1[C@@H](O)[C@H](OC(=O)C[C@H](O)CCCCCCCCCCC)[C@@H](NC(=O)C[C@H](O)CCCCCCCCCCC)[C@@H](OP(O)(O)=O)O1 GZQKNULLWNGMCW-PWQABINMSA-N 0.000 description 1
- 229920006008 lipopolysaccharide Polymers 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 238000011866 long-term treatment Methods 0.000 description 1
- 239000000314 lubricant Substances 0.000 description 1
- 230000001926 lymphatic effect Effects 0.000 description 1
- 101710121537 mRNA (guanine-N(7))-methyltransferase Proteins 0.000 description 1
- 235000019359 magnesium stearate Nutrition 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- WSFSSNUMVMOOMR-NJFSPNSNSA-N methanone Chemical compound O=[14CH2] WSFSSNUMVMOOMR-NJFSPNSNSA-N 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 230000002438 mitochondrial effect Effects 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 235000013919 monopotassium glutamate Nutrition 0.000 description 1
- LPUQAYUQRXPFSQ-DFWYDOINSA-M monosodium L-glutamate Chemical compound [Na+].[O-]C(=O)[C@@H](N)CCC(O)=O LPUQAYUQRXPFSQ-DFWYDOINSA-M 0.000 description 1
- 235000013923 monosodium glutamate Nutrition 0.000 description 1
- 239000004223 monosodium glutamate Substances 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 201000000050 myeloid neoplasm Diseases 0.000 description 1
- GNOLWGAJQVLBSM-UHFFFAOYSA-N n,n,5,7-tetramethyl-1,2,3,4-tetrahydronaphthalen-1-amine Chemical group C1=C(C)C=C2C(N(C)C)CCCC2=C1C GNOLWGAJQVLBSM-UHFFFAOYSA-N 0.000 description 1
- 239000007922 nasal spray Substances 0.000 description 1
- 229940097496 nasal spray Drugs 0.000 description 1
- 230000027405 negative regulation of phosphorylation Effects 0.000 description 1
- 229960004927 neomycin Drugs 0.000 description 1
- 229940053128 nerve growth factor Drugs 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 239000007764 o/w emulsion Substances 0.000 description 1
- 239000002674 ointment Substances 0.000 description 1
- 229940049964 oleate Drugs 0.000 description 1
- 238000006384 oligomerization reaction Methods 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 229960001723 oxytocin Drugs 0.000 description 1
- XNOPRXBHLZRZKH-DSZYJQQASA-N oxytocin Chemical compound C([C@H]1C(=O)N[C@H](C(N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CSSC[C@H](N)C(=O)N1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(N)=O)=O)[C@@H](C)CC)C1=CC=C(O)C=C1 XNOPRXBHLZRZKH-DSZYJQQASA-N 0.000 description 1
- 244000045947 parasite Species 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 108010011903 peptide receptors Proteins 0.000 description 1
- 102000014187 peptide receptors Human genes 0.000 description 1
- 230000008782 phagocytosis Effects 0.000 description 1
- 239000000546 pharmaceutical excipient Substances 0.000 description 1
- 229960005323 phenoxyethanol Drugs 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 239000006187 pill Substances 0.000 description 1
- 108010025221 plasma protein Z Proteins 0.000 description 1
- 229940127126 plasminogen activator Drugs 0.000 description 1
- 229920000747 poly(lactic acid) Polymers 0.000 description 1
- 229920001606 poly(lactic acid-co-glycolic acid) Polymers 0.000 description 1
- 229920001481 poly(stearyl methacrylate) Polymers 0.000 description 1
- 239000000244 polyoxyethylene sorbitan monooleate Substances 0.000 description 1
- 235000010482 polyoxyethylene sorbitan monooleate Nutrition 0.000 description 1
- 229920000053 polysorbate 80 Polymers 0.000 description 1
- 229940068968 polysorbate 80 Drugs 0.000 description 1
- 229920002451 polyvinyl alcohol Polymers 0.000 description 1
- 239000001267 polyvinylpyrrolidone Substances 0.000 description 1
- 239000011591 potassium Substances 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 235000007686 potassium Nutrition 0.000 description 1
- GRLPQNLYRHEGIJ-UHFFFAOYSA-J potassium aluminium sulfate Chemical compound [Al+3].[K+].[O-]S([O-])(=O)=O.[O-]S([O-])(=O)=O GRLPQNLYRHEGIJ-UHFFFAOYSA-J 0.000 description 1
- 229910000160 potassium phosphate Inorganic materials 0.000 description 1
- 235000011009 potassium phosphates Nutrition 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000037452 priming Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000770 proinflammatory effect Effects 0.000 description 1
- 229940097325 prolactin Drugs 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- AAEVYOVXGOFMJO-UHFFFAOYSA-N prometryn Chemical compound CSC1=NC(NC(C)C)=NC(NC(C)C)=N1 AAEVYOVXGOFMJO-UHFFFAOYSA-N 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 239000003380 propellant Substances 0.000 description 1
- 229960000380 propiolactone Drugs 0.000 description 1
- 210000002307 prostate Anatomy 0.000 description 1
- 229960000856 protein c Drugs 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 125000000561 purinyl group Chemical group N1=C(N=C2N=CNC2=C1)* 0.000 description 1
- 229950010131 puromycin Drugs 0.000 description 1
- 206010038038 rectal cancer Diseases 0.000 description 1
- 201000001275 rectum cancer Diseases 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 230000000241 respiratory effect Effects 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 229960002181 saccharomyces boulardii Drugs 0.000 description 1
- 235000002020 sage Nutrition 0.000 description 1
- HFHDHCJBZVLPGP-UHFFFAOYSA-N schardinger α-dextrin Chemical compound O1C(C(C2O)O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC(C(O)C2O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC2C(O)C(O)C1OC2CO HFHDHCJBZVLPGP-UHFFFAOYSA-N 0.000 description 1
- 235000019812 sodium carboxymethyl cellulose Nutrition 0.000 description 1
- 229920001027 sodium carboxymethylcellulose Polymers 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- HRZFUMHJMZEROT-UHFFFAOYSA-L sodium disulfite Chemical compound [Na+].[Na+].[O-]S(=O)S([O-])(=O)=O HRZFUMHJMZEROT-UHFFFAOYSA-L 0.000 description 1
- 229940001584 sodium metabisulfite Drugs 0.000 description 1
- 235000010262 sodium metabisulphite Nutrition 0.000 description 1
- 235000010339 sodium tetraborate Nutrition 0.000 description 1
- 239000000600 sorbitol Substances 0.000 description 1
- 239000007921 spray Substances 0.000 description 1
- 229940031439 squalene Drugs 0.000 description 1
- TUHBEKDERLKLEC-UHFFFAOYSA-N squalene Natural products CC(=CCCC(=CCCC(=CCCC=C(/C)CCC=C(/C)CC=C(C)C)C)C)C TUHBEKDERLKLEC-UHFFFAOYSA-N 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000008223 sterile water Substances 0.000 description 1
- 108020003113 steroid hormone receptors Proteins 0.000 description 1
- 102000005969 steroid hormone receptors Human genes 0.000 description 1
- 230000000365 steroidogenetic effect Effects 0.000 description 1
- 229940031000 streptococcus pneumoniae Drugs 0.000 description 1
- 229960005202 streptokinase Drugs 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 210000003523 substantia nigra Anatomy 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000005846 sugar alcohols Polymers 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 208000006379 syphilis Diseases 0.000 description 1
- 239000000454 talc Substances 0.000 description 1
- 229910052623 talc Inorganic materials 0.000 description 1
- 235000012222 talc Nutrition 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 201000003120 testicular cancer Diseases 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 239000002562 thickening agent Substances 0.000 description 1
- RTKIYNMVFMVABJ-UHFFFAOYSA-L thimerosal Chemical compound [Na+].CC[Hg]SC1=CC=CC=C1C([O-])=O RTKIYNMVFMVABJ-UHFFFAOYSA-L 0.000 description 1
- 229940033663 thimerosal Drugs 0.000 description 1
- 229960004072 thrombin Drugs 0.000 description 1
- 239000005495 thyroid hormone Substances 0.000 description 1
- 229940036555 thyroid hormone Drugs 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000011269 treatment regimen Methods 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 229940055035 trichophyton verrucosum Drugs 0.000 description 1
- BSVBQGMMJUBVOD-UHFFFAOYSA-N trisodium borate Chemical compound [Na+].[Na+].[Na+].[O-]B([O-])[O-] BSVBQGMMJUBVOD-UHFFFAOYSA-N 0.000 description 1
- 201000008297 typhoid fever Diseases 0.000 description 1
- 108010014402 tyrosinase-related protein-1 Proteins 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- VBEQCZHXXJYVRD-GACYYNSASA-N uroanthelone Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C(C)C)[C@@H](C)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CCSC)NC(=O)[C@H](CS)NC(=O)[C@@H](NC(=O)CNC(=O)CNC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CS)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CS)NC(=O)CNC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O)C(C)C)[C@@H](C)CC)C1=CC=C(O)C=C1 VBEQCZHXXJYVRD-GACYYNSASA-N 0.000 description 1
- 238000002255 vaccination Methods 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 201000006266 variola major Diseases 0.000 description 1
- 201000000627 variola minor Diseases 0.000 description 1
- 208000014016 variola minor infection Diseases 0.000 description 1
- 229940118696 vibrio cholerae Drugs 0.000 description 1
- 230000001018 virulence Effects 0.000 description 1
- 239000004034 viscosity adjusting agent Substances 0.000 description 1
- 108010047303 von Willebrand Factor Proteins 0.000 description 1
- 102100036537 von Willebrand factor Human genes 0.000 description 1
- 229960001134 von willebrand factor Drugs 0.000 description 1
- 239000001993 wax Substances 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
- 229940051021 yellow-fever virus Drugs 0.000 description 1
- 229940098232 yersinia enterocolitica Drugs 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/39—Medicinal preparations containing antigens or antibodies characterised by the immunostimulating additives, e.g. chemical adjuvants
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/0008—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition
- A61K48/0025—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition wherein the non-active part clearly interacts with the delivered nucleic acid
- A61K48/0033—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition wherein the non-active part clearly interacts with the delivered nucleic acid the non-active part being non-polymeric
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/51—Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
- A61K2039/53—DNA (RNA) vaccination
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/555—Medicinal preparations containing antigens or antibodies characterised by a specific combination antigen/adjuvant
- A61K2039/55511—Organic adjuvants
- A61K2039/55516—Proteins; Peptides
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/60—Medicinal preparations containing antigens or antibodies characteristics by the carrier linked to the antigen
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/16011—Herpesviridae
- C12N2710/16022—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/24011—Poxviridae
- C12N2710/24111—Orthopoxvirus, e.g. vaccinia virus, variola
- C12N2710/24122—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/20011—Coronaviridae
- C12N2770/20022—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/24011—Flaviviridae
- C12N2770/24022—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/32011—Picornaviridae
- C12N2770/32022—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/36011—Togaviridae
- C12N2770/36111—Alphavirus, e.g. Sindbis virus, VEE, EEE, WEE, Semliki
- C12N2770/36121—Viruses as such, e.g. new isolates, mutants or their genomic sequences
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/36011—Togaviridae
- C12N2770/36111—Alphavirus, e.g. Sindbis virus, VEE, EEE, WEE, Semliki
- C12N2770/36122—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/36011—Togaviridae
- C12N2770/36111—Alphavirus, e.g. Sindbis virus, VEE, EEE, WEE, Semliki
- C12N2770/36134—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/30—Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- General Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Medicinal Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Animal Behavior & Ethology (AREA)
- Pharmacology & Pharmacy (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Epidemiology (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Mycology (AREA)
- Immunology (AREA)
- Virology (AREA)
- Plant Pathology (AREA)
- Gastroenterology & Hepatology (AREA)
- Physics & Mathematics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Communicable Diseases (AREA)
- Oncology (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
Abstract
본 발명은 RNA 구조체에 관한 것이며, 특히, 배타적인 것은 아니지만, mRNA 구조체 및 saRNA 레플리콘, 및 이러한 RNA 구조체를 암호화하는 핵산 및 발현 벡터에 관한 것이다. 본 발명은 이러한 RNA 구조체를 치료법에, 예를 들면 질환의 치료 및/또는 백신 운반에 사용하는 용도로 확장된다. 본 발명은 이러한 RNA 구조체를 포함하는 약학적 조성물, 및 그의 방법 및 용도로 확장된다.
Description
본 발명은 RNA 구조체(construct)에 관한 것이며, 특히, 배타적인 것은 아니지만, mRNA 구조체 및 saRNA 레플리콘(replicon), 및 이러한 RNA 구조체를 암호화하는 핵산 및 발현 벡터(expression vector)에 관한 것이다. 본 발명은 이러한 RNA 구조체를 치료법에, 예를 들면 질환의 치료 및/또는 백신 운반에 사용하는 용도로 확장된다. 본 발명은 이러한 RNA 구조체를 포함하는 약학적 조성물, 및 그의 방법 및 용도로 확장된다.
메신저 RNA(mRNA)는 생물치료제(biotherapeutics)를 위한 유망한 도구이다. 그러나, mRNA 치료제는 소동물에서 매우 효과적인 것으로 나타났지만, 그 결과는 상기 제형이 인간에서 용량-증량 연구로 번역될 때 선형으로 규모가 커지지는 않는다. 아울러, 인터페론 반응의 유도와 연관된 부작용은 증가된 용량의 RNA가 인간에서 효과적일 가능성과 관련한 속도-제한요인(rate-limiting)인 것으로 나타나 있다. 이러한 불일치의 이유는 명확하지 않지만, 본 발명자들은 인간 선천적 감지(innate sensing)에서의 내재하는 차이가 실험실로부터 임상으로 RNA 치료제를 번역하기 위한 장애물을 제공한다는 가설을 세운다. 아울러, RNA의 선천적 감지는 단백질 발현의 억제와 연관된다. 지금까지, 외인성(exogenous) RNA의 선천적 인식을 극복하기 위한 주된 접근법은 선천적 감지 메커니즘에 의해 검출이 덜되는 변형된 리보뉴클레오티드를 사용하는 것이다. 그러나, 변형된 mRNA는 완전히 검출불가능하지는 않으며, 인간에게 사용할 때 여전히 인터페론 생산의 일부 유도, 단백질 사일런싱(silencing) 및 감소된 내약성(tolerability)을 야기한다(도 2 참조).
다른 접근법은 전형적으로 그 비-구조 단백질 내에 폴리머라아제(polymerase) 활성을 암호화함으로써 그 자신의 RNA를 자가-증폭하는 능력을 갖고 있는 알파바이러스 백본(alphavirus backbone)에 기반하는 자가-증폭형(self-amplifying) 또는 saRNA 벡터를 이용하는 것이다. 종래 기술의 방법은 상기 벡터의 구조 단백질을, 예를 들면 관심있는 항원을 암호화하는 관심있는 유전자(GOI)로 교체하여 이를 백신 구조체로 하거나, 치료 단백질을 암호화하는 것을 수반한다. 다른 버전의 saRNA는 피코르나바이러스(picornavirus), 플라비바이러스(flavivirus), 및 코로나바이러스(coronavirus)에 기반한다. saRNA가 표적 세포의 세포질 내로 들어갈 때, 이것은 상기 암호화된 폴리머라아제 기구(machinery)에 의한 RNA의 증폭 및 GOI의 매우 높은 발현 레벨(level)을 유도한다. 결과적으로, saRNA는 mRNA보다 낮은(10 내지 100배 낮은) 용량의 saRNA로 면역 반응을 유도하는 것으로 나타났고, 마우스에서 최대 60일까지 연장된 단백질 발현을 야기한다.
그러나, 도 3에 나타낸 것과 같이, saRNA를 이용하는 결점은 이것은 또한 선천적 감지 패턴 인식 수용체에 의해 감지되어 상기 종래 기술의 saRNA의 단백질 발현 및 자가-증폭을 제한하는 항-바이러스(인터페론) 반응을 촉발하게 된다는 것이다. saRNA의 선천적 감지는 그 큰 크기(전형적으로 >5,000 염기) 및 이중 가닥 영역(dsRNA)을 포함하는 고도한 2차 구조로 인해 mRNA의 경우와 상이하다. 길고 이중 가닥인 RNA는 다른 센서들 중에서도 DA5(흑색종 분화-연관 단백질 5) 경로를 통해 선천적 반응을 촉발한다. 이것은 길고 dsRNA인 RNA에 대한 PACT(PKR 활성화 단백질)의 결합에 의해 MDA5의 올리고머화(oligomerization)를 촉진하고, 이어서 saRNA의 복제 및 발현을 억제하는 하류의 신호전달 캐스케이드(cascade)를 촉발함으로써 용이하게 된다.
따라서, 본 기술분야에는 RNA 치료제가 mRNA- 또는 saRNA 기반이고, 환자에게 운반 및 발현되어 선천적 면역 시스템 감지를 극복할 수 있는 새로운 수단을 생성하기 위한 필요성이 있다.
본 발명자들은 면역 시스템 기구의 활성을 차단 또는 감소시키는 바이러스 면역 억제제 단백질을 발현함으로써 RNA를 감지하는 선천적 면역 시스템을 유리하게 극복하고, 숙주 세포에서 개선된 번역(mRNA의 경우) 및 증가된 자가-증폭 및 이후의 번역(saRNA 시스템의 경우)과, 이에 따른 관심있는 유전자, 예컨대 항원의 더 큰 단백질 발현 레벨을 야기하는 신규한 RNA 구조체(saRNA 및 mRNA)를 개발하였다.
따라서, 본 발명의 제1 측면에서, (ⅰ) 적어도 하나의 치료 생체분자(biomolecule); 및 (ⅱ) 적어도 하나의 바이러스 선천적 억제제 단백질(innate inhibitor protein, IIP);을 암호화하는 RNA 구조체가 제공된다.
RNA 구조체, 예컨대 mRNA 및 saRNA 레플리콘은 백신 및 치료제에 대한 관심있는 유전자의 운반 및 발현을 위한 잠재적인 도구로 상정되어 왔다. 그러나, 단일 가닥 mRNA(ssRNA) 및 이중 가닥 RNA(dsRNA)는 단백질 번역을 억제하는 반응을 촉발하는 선천적 감지 메커니즘에 의해 세포내에서 검출된다. 결과적으로, RNA 구조체에 의해 암호화되는 관심있는 유전자의 발현은 현저하게 손상되고, 따라서 saRNA 및 mRNA를 포함하는 RNA 구조체의 면역원성 또는 치료 잠재력은 제한된다. 유리하게는, 본 발명의 RNA 구조체는 숙주 세포 내에서 전이유전자(transgene) 발현의 하류 선천적 억제를 감소시키거나 제거하는 하나 이상의 바이러스 선천적 억제제 단백질(IIP)을 암호화하기 때문에 이러한 문제점을 극복한다.
인터페론의 유도는 선천적 인식의 하류 결과 중 하나이지만, 아래에 논의된 것과 같이, 다른 분자 및 경로가 유도되거나 유도될 수 있고, 이들 중 임의의 것은 RNA 구조체가 갖고 있는 하나 이상의 바이러스 선천적 면역 억제제 단백질에 의해 억제될 것임이 인식될 것이다. 따라서, 바람직하게는 적어도 하나의 선천적 억제제 단백질(IIP)은 본 발명의 RNA 구조체로 처리된 대상체에서 RNA에 대한 선천적 면역 반응을 억제할 수 있다. 따라서, 상기 IIP는 선천적 면역의 억제제로서 기술될 수 있다. 이것은 또한 일부 구현예에서 인터페론 억제 분자로 기술될 수 있다.
saRNA를 이용해 인터페론 반응을 제거하는 이전에 공개된 한 접근법은 백시니아(vaccinia) 바이러스 유래의 인터페론 억제 단백질인 E3, K3 및 B18을 이용하였다. 그러나, 상기 연구에서, 인터페론 억제 단백질은 saRNA와 조합된 별도의 mRNA 분자로서 운반 및 제형화되었다. 이것은 saRNA 및 mRNA 모두의 제조를 필요로 하고, 단백질 발현에서 임의의 관찰가능한 향상을 제공하기 위하여 본 발명에 따른 saRNA 레플리콘 구조체보다 적어도 3-6배 더 많은 백시니아 mRNA를 사용하는 것을 필요하게 하였다.
유리하게는, 제1 측면의 RNA 구조체에서, 하나 이상의 바이러스 선천적 억제제 단백질의 존재는 생물치료제 분자, 즉 관심있는 펩티드 또는 단백질을 이용한 이중 단백질 발현을 가능하게 한다. 종래 기술에서 기술된 것과 같이 하나는 관심있는 펩티드/단백질을 암호화하고 하나는 선천적 조절 단백질을 암호화하는 2개의 상이한 가닥의 RNA를 운반하는 것과 대조적으로, 본 발명의 RNA 구조체를 이용할 때 단지 하나의 단일 가닥만이 표적 세포로 운반되고, 이로 인해 RNA 분자 및 바이러스 면역 억제제 단백질의 동시국소화(colocalization)를 보장한다. 상기 바이러스 면역 억제제 단백질은 숙주 세포에서 RNA의 선천적 감지를 억제하고, 이로 인해 더 높은 단백질 발현 및 번역을 가능하게 하며, 상기 바이러스 면역 억제제 단백질의 발현 자체는 치료 생체분자와 동일한 RNA 분자로부터 공동-발현 및 번역된다.
실시예에 기술된 것과 같이, (GOI로서) ("스틸티콘(Stealthicon)"으로도 알려져 있는) 루시퍼라아제(luciferase) 또는 VEGF-A를 암호화하는 본 발명의 RNA 구조체는 놀랍게도 온전한 선천적 감지 시스템을 갖는 인간 세포주에서 시험관내 루시퍼라아제 또는 VEGF-A 단백질 발현 레벨을 최대 12배까지 증가시키는 것으로 나타났다. 상기 RNA 구조체는 본 발명의 RNA 분자가 갖고 있는 유전자를 발현할 수 있는 것으로 판명되었기 때문에, 숙련된 기술자는 루시퍼라아제 리포터(reporter)가 치료 생체분자를 정확히 대표함을 용이하게 인식할 것이다. 이와 같이, 상기 루시퍼라아제는 본 발명의 RNA 구조체가 임의의 치료적으로 활성인 생체분자를 발현하기 위해 사용될 수 있다는 개념 증명(proof of concept)의 강력한 증거를 제공한다. 또한, VEGF-A(도 11 참조)는 GOI로서 루시퍼라아제에 대한 대안적 예를 나타낸다.
제1 측면의 RNA 구조체는 단일 가닥 RNA 또는 이중 가닥 RNA일 수 있다.
상기 RNA 구조체는 mRNA 분자 또는 saRNA 분자를 포함할 수 있다.
한 구현예에서, 상기 RNA 구조체는 mRNA를 포함한다. 도 1(오른쪽)은 mRNA 분자로서 RNA 구조체의 다양한 구현예를 실증한다.
그러나, 바람직한 구현예에서, 상기 RNA 구조체는 자가-증폭형 RNA(saRNA)를 포함한다. 도 1(왼쪽)은 saRNA 분자로서 RNA 구조체의 다양한 구현예를 실증한다. 숙련된 기술자는 이러한 RNA 구조체가 또한 자가-복제(self-replicating) RNA 바이러스 벡터, 또는 RNA 레플리콘으로 나타낼 수 있음을 이해할 것이다.
바람직하게는, 상기 saRNA 구조체는 알파바이러스; 피코르나바이러스; 플라비바이러스; 루비바이러스(rubivirus); 페스티바이러스(pestivirus); 헤파시바이러스(hepacivirus); 칼리시바이러스(calicivirus); 및 코로나바이러스;로 이루어진 속(genus)의 군으로부터 선택되는 양성 가닥(positive stranded) RNA 바이러스를 포함하거나 이로부터 유래된다.
바람직하게는, 상기 RNA 구조체는 알파바이러스를 포함하거나 이로부터 유래된다. 적합한 야생형 알파바이러스 서열은 잘 알려져 있다. 적합한 알파바이러스의 대표적인 예는 아우라(Aura), 베바루(Bebaru) 바이러스, 카바소우(Cabassou), 치쿤군야(Chikungunya) 바이러스, 동부 말 뇌척수염 바이러스, 포트 모건(Fort Morgan), 게타(Getah) 바이러스, 키질라가치(Kyzylagach), 마야로(Mayaro), 마야로 바이러스, 미들버그(Middleburg), 무캄보(Mucambo) 바이러스, 은두무(Ndumu), 픽수나(Pixuna) 바이러스, 로스 리버(Ross River) 바이러스, 셈리키 포레스트(Semliki Forest), 신드비스(Sindbis) 바이러스, 토나테(Tonate), 트리니티(Triniti), 우나(Una), 베네주엘라 말 뇌척수염, 서부 말 뇌척수염, 와타로아(Whataroa Whataroa), 및 Y-62-33을 포함한다. 따라서, 바람직하게는 상기 RNA 구조체는 임의의 상기 알파바이러스를 포함하거나 이로부터 유래된다.
바람직하게는, 상기 RNA 구조체는 베네주엘라 말 뇌염 바이러스(VEEV); 엔테로바이러스(enterovirus) 71; 뇌심근염 바이러스; 쿤진(Kunjin) 바이러스; 및 중동 호흡기 증후군 바이러스;로 이루어진 종의 군으로부터 선택되는 바이러스를 포함하거나 이로부터 유래된다. 한 바람직한 구현예에서, 상기 RNA 구조체는 쿤진 바이러스를 포함하거나 이로부터 유래된다. 바람직하게는, 상기 RNA 구조체는 VEEV로부터 유래된다.
바람직하게는, 상기 RNA 구조체는 RNA에 대한 선천적 면역 반응을 감소, 제거, 또는 차단할 수 있는 적어도 하나의 선천적 억제제 단백질(IIP)을 암호화하는 뉴클레오티드 서열을 포함한다. 따라서, 상기 IIP는 선천적 면역의 억제제이고, 따라서 바이러스 선천적 면역 억제제 단백질로 기술될 수 있다. 상기 IIP는 또한 인터페론 신호전달의 억제제일 수 있다.
해당 RNA 분자(즉, 비-내인성으로 생산된 RNA)로 형질전환된 숙주 세포에서 RNA에 대한 선천적 면역 반응의 감소, 제거, 또는 차단은 선천적 신호전달 경로를 억제하고, 및/또는 RNA 인식을 억제하는 IIP 조절성 인터페론 생산에 의해 달성될 수 있다. 인터페론 생산의 조절은 선천적 신호전달의 억제로서 기술될 수 있음이 인식될 것이다. 따라서, 선천적 감지 및 선천적 신호전달 시스템은 (a) RNA 인식 시스템, (b) 인터페론 생산을 유도하고 인터페론-자극 유전자의 자극을 야기하는 경로, 및 (c) 인터페론 신호전달 시스템을 포함한다.
따라서, 상기 IIP는 다음의 4가지 넓은 카테고리 중 하나에 속할 수 있다:
(ⅰ) 카테고리 1: 인터페론 조절 인자 활성의 억제제;
(ⅱ) 카테고리 2: 인터페론 생산을 유도하고 인터페론-자극 유전자의 자극을 야기하는 경로의 억제제;
(ⅲ) 카테고리 3: 인터페론 신호전달의 억제제; 및/또는
(ⅳ) 카테고리 4: RNA 인식 시스템의 억제제.
일부 IIP는 다수의 작용을 가질 수 있음이 인식될 것이다. 예를 들어, 카테고리 4의 IIP는 또한 카테고리 2의 IIP(예컨대, IRF3, IRF7) 및 카테고리 3의 IIP(예컨대, IRF9)로 분류될 수 있다.
한 구현예에서, RNA에 대한 선천적 면역 반응의 감소, 제거, 또는 차단은 바람직하게는 다양한 항-바이러스 유전자(예컨대, RNA 발현을 저해하는 것으로 알려진 IFIT1-3, Mx1, Mx2), 그 생성물이 선천적 면역 반응을 조직하는 전염증성(proinflammatory) 유전자, 및 임의의 인터페론 의존성 캐스케이드 상류의 정규적(canonically) IFN-자극 유전자(ISG)의 직접적인 활성화를 직접 촉발하는 인터페론 조절 인자 3 및 7(IRF3 및 IRF7) 및 NF-κB 전사 인자의 활성화를 유도하는 패턴 인식 수용체에 의한 세포기질 RNA의 인식을 감소 또는 방지함으로써 IIP에 의해 달성된다. 상기 경로는 많은 항-바이러스 반응을 추가로 증폭하는 양성 피드백 루프(feedback loop)를 제공하는 타입 I & III 인터페론을 유도함으로써 향상될 수 있다.
적어도 하나의 IIP는 헤르페스 심플렉스 바이러스(herpes simplex virus)로부터 유래될 수 있다. 상기 IIP는 간염 바이러스, 임의적으로 C형 간염 바이러스로부터 유래될 수 있다. 상기 IIP는 백시니아 바이러스로부터 유래될 수 있다. 상기 IIP는 코로나바이러스, 임의적으로 중동 호흡기 증후군(MERS) 바이러스 또는 중증 급성 호흡기 증후군(SARS) 바이러스로부터 유래될 수 있다. 상기 SARS 바이러스는 SARS-Cov 또는 SARS-CoV-2일 수 있다. 상기 IIP는 카포시 육종(Kaposi's sarcoma)-연관 헤르페스바이러스(KSHV)로부터 유래될 수 있다. 상기 IIP는 에볼라 바이러스(Ebola virus)로부터 유래될 수 있다.
적어도 하나의 선천적 억제제 단백질(IIP)은 HPV16 E6; HSV ICP34.5; HCV E2; HCV NS5a; VACV E3L; VACV K3L; MERS ORF8B; KSHV ORF52; EBOV VP35; SARS-2 ORF3b 및 VACV C6; 또는 그의 동원체(orthologue)로 이루어진 바이러스 IIP의 군으로부터 선택될 수 있다. 상기 IIP는 IFN 생산을 유도하는 선천적 신호전달 시스템의 억제를 일으킬 수 있음이 인식될 것이다.
한 구현예에서, 적어도 하나의 IIP는 HPV16 E6(인간 파필로마바이러스 E6; NP_041325.1; 접근 번호 - NCBI 참조 서열: NC_001526.4; UniProtKB - P03126(VE6_HPV16)), 또는 그의 동원체일 수 있다. 상기 단백질은 PKR, IRF3 및 IRF9를 포함하는 선천적 신호전달 캐스케이드 내의 다수의 단백질에 대해 작용함으로써 세포의 항-바이러스 상태의 확립을 방지하는 것으로 여겨진다. [Warren CJ, Pyeon D. (2017). Evasion of host immune defenses by human papillomavirus. Virus Res. 2017 231, 21-33. doi: 10.1016/j.virusres.2016.11.023]; [Noguchi T, Satoh S, Noshi T, Hatada E, Fukuda R, Kawai A, Ikeda S, Hijikata M, Shimotohno K (2001). Effects of Mutation in Hepatitis C Virus Nonstructural Protein 5A on Interferon Resistance Mediated by Inhibition of PKR Kinase Activity in Mammalian Cells. Microbiol. Immunol., 45, 829-840. doi: 10.1111/j.1348-0421.2001.tb01322.x.].
상기 HPV16 E6 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 1로 나타낸다:
MHQKRTAMFQDPQERPRKLPQLCTELQTTIHDIILECVYCKQQLLRREVYDFAFRDLCIVYRDGNPYAVCDKCLKFYSKISEYRHYCYSLYGTTLEQQYNKPLCDLLIRCINCQKPLCPEEKQRHLDKKQRFHNIRGRWTGRCMSCCRSSRTRRETQL [서열번호 1]
따라서, 바람직하게는 제1 측면의 RNA 구조체는 서열번호 1에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 HPV16 E6 폴리펩티드는 다음과 같은 서열번호 2의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGCACCAAAAGAGAACTGCAATGTTTCAGGACCCACAGGAGCGACCCAGAAAGTTACCACAGTTATGCACAGAGCTGCAAACAACTATACATGATATAATATTAGAATGTGTGTACTGCAAGCAACAGTTACTGCGACGTGAGGTATATGACTTTGCTTTTCGGGATTTATGCATAGTATATAGAGATGGGAATCCATATGCTGTATGTGATAAATGTTTAAAGTTTTATTCTAAAATTAGTGAGTATAGACATTATTGTTATAGTTTGTATGGAACAACATTAGAACAGCAATACAACAAACCGTTGTGTGATTTGTTAATTAGGTGTATTAACTGTCAAAAGCCACTGTGTCCTGAAGAAAAGCAAAGACATCTGGACAAAAAGCAAAGATTCCATAATATAAGGGGTCGGTGGACCGGTCGATGTATGTCTTGTTGCAGATCATCAAGAACACGTAGAGAAACCCAGCTG [서열번호 2]
따라서, 바람직하게는 상기 HPV16 E6 폴리펩티드는 실질적으로 서열번호 2에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 상기 RNA 구조체는 다음과 같은 서열번호 3의 RNA 뉴클레오티드 서열을 포함할 수 있다:
AUGCACCAAAAGAGAACUGCAAUGUUUCAGGACCCACAGGAGCGACCCAGAAAGUUACCACAGUUAUGCACAGAGCUGCAAACAACUAUACAUGAUAUAAUAUUAGAAUGUGUGUACUGCAAGCAACAGUUACUGCGACGUGAGGUAUAUGACUUUGCUUUUCGGGAUUUAUGCAUAGUAUAUAGAGAUGGGAAUCCAUAUGCUGUAUGUGAUAAAUGUUUAAAGUUUUAUUCUAAAAUUAGUGAGUAUAGACAUUAUUGUUAUAGUUUGUAUGGAACAACAUUAGAACAGCAAUACAACAAACCGUUGUGUGAUUUGUUAAUUAGGUGUAUUAACUGUCAAAAGCCACUGUGUCCUGAAGAAAAGCAAAGACAUCUGGACAAAAAGCAAAGAUUCCAUAAUAUAAGGGGUCGGUGGACCGGUCGAUGUAUGUCUUGUUGCAGAUCAUCAAGAACACGUAGAGAAACCCAGCUG [서열번호 3]
아울러, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 3에 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
따라서, 본 발명자들은 서열번호 1의 단백질 서열에 인간 발현을 위한 코돈 최적화(codon optimisation)를 하였고, 개시(ATG) 및 종결(TGA) 코돈을 포함하는 코돈 최적화된 핵산(DNA) 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 4로 제공된다:
ATGCACCAGAAACGGACCGCCATGTTCCAGGATCCTCAAGAGAGGCCCAGAAAGCTGCCTCAGCTGTGTACCGAGCTGCAGACCACCATCCACGACATCATCCTGGAATGCGTGTACTGCAAGCAGCAGCTCCTGCGGAGAGAGGTGTACGATTTCGCCTTCCGGGACCTGTGCATCGTGTACAGAGATGGCAACCCCTACGCCGTGTGCGACAAGTGCCTGAAGTTCTACAGCAAGATCAGCGAGTACCGGCACTACTGCTACAGCCTGTACGGCACCACACTGGAACAGCAGTACAACAAGCCCCTGTGCGACCTGCTGATCCGGTGCATCAACTGCCAGAAACCTCTGTGCCCCGAGGAAAAGCAGCGGCACCTGGACAAGAAGCAGCGGTTCCACAACATCAGAGGCCGGTGGACCGGCAGATGCATGAGCTGTTGTCGGAGCAGCAGAACCAGACGGGAAACCCAGCTGTGA [서열번호 4]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 4에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 개시(AUG) 및 종결(UGA) 코돈을 포함하는 서열번호 4의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 5로 제공된다:
AUGCACCAGAAACGGACCGCCAUGUUCCAGGAUCCUCAAGAGAGGCCCAGAAAGCUGCCUCAGCUGUGUACCGAGCUGCAGACCACCAUCCACGACAUCAUCCUGGAAUGCGUGUACUGCAAGCAGCAGCUCCUGCGGAGAGAGGUGUACGAUUUCGCCUUCCGGGACCUGUGCAUCGUGUACAGAGAUGGCAACCCCUACGCCGUGUGCGACAAGUGCCUGAAGUUCUACAGCAAGAUCAGCGAGUACCGGCACUACUGCUACAGCCUGUACGGCACCACACUGGAACAGCAGUACAACAAGCCCCUGUGCGACCUGCUGAUCCGGUGCAUCAACUGCCAGAAACCUCUGUGCCCCGAGGAAAAGCAGCGGCACCUGGACAAGAAGCAGCGGUUCCACAACAUCAGAGGCCGGUGGACCGGCAGAUGCAUGAGCUGUUGUCGGAGCAGCAGAACCAGACGGGAAACCCAGCUGUGA [서열번호 5]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 5에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 HSV ICP34.5(헤르페스 심플렉스 바이러스 ICP34.5; YP_009137073.1; 접근 번호 - NCBI 참조 서열: NC_001806.2; UniProtKB - P36313(ICP34_HHV11)), 또는 그의 동원체일 수 있다. HSV ICP34.5는 TBK1을 격리하고 TBK1 및 IRF3 사이의 상호작용을 간섭하여, 최종적으로 IRF3의 불활성화를 유도하는 것으로 나타났다. [Zhu H, Zheng C (2020). The race between host antiviral innate immunity and the immune evasion strategies of Herpes simplex virus 1. Microbiol Mol Biol Rev., 84(4): e00099-20]. 상기 HSV ICP34.5 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 6으로 나타낸다:
MARRRRHRGPRRPRPPGPTGAVPTAQSQVTSTPNSEPAVRSAPAAAPPPPPAGGPPPSCSLLLRQWLHVPESASDDDDDDDWPDSPPPEPAPEARPTAAAPRPRPPPPGVGPGGGADPSHPPSRPFRLPPRLALRLRVTAEHLARLRLRRAGGEGAPEPPATPATPATPATPATPARVRFSPHVRVRHLVVWASAARLARRGSWARERADRARFRRRVAEAEAVIGPCLGPEARARALARGAGPANSV [서열번호 6]
따라서, 바람직하게는 제1 측면의 RNA 구조체는 실질적으로 서열번호 6에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 HSV ICP34.5 폴리펩티드는 다음과 같은 서열번호 7의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGCCCGCCGCCGCCGCCATCGCGGCCCCCGCCGCCCCCGGCCGCCCGGGCCCACGGGCGCCGTCCCAACCGCACAGTCCCAGGTAACCTCCACGCCCAACTCGGAACCCGCGGTCAGGAGCGCGCCCGCGGCCGCCCCGCCGCCGCCCCCCGCCGGTGGGCCCCCGCCTTCTTGTTCGCTGCTGCTGCGCCAGTGGCTCCACGTTCCCGAGTCCGCGTCCGACGACGACGATGACGACGACTGGCCGGACAGCCCCCCGCCCGAGCCGGCGCCAGAGGCCCGGCCCACCGCCGCCGCCCCCCGGCCCCGGCCCCCACCGCCCGGCGTGGGCCCGGGGGGCGGGGCTGACCCCTCCCACCCCCCCTCGCGCCCCTTCCGCCTTCCGCCGCGCCTCGCCCTCCGCCTGCGCGTCACCGCGGAGCACCTGGCGCGCCTGCGCCTGCGACGCGCGGGCGGGGAGGGGGCGCCGGAGCCCCCCGCGACCCCCGCGACCCCCGCGACCCCCGCGACCCCCGCGACCCCCGCGCGGGTGCGCTTCTCGCCCCACGTCCGGGTGCGCCACCTGGTGGTCTGGGCCTCGGCCGCCCGCCTGGCGCGCCGCGGCTCGTGGGCCCGCGAGCGGGCCGACCGGGCTCGGTTCCGGCGCCGGGTGGCGGAGGCCGAGGCGGTCATCGGGCCGTGCCTGGGGCCCGAGGCCCGTGCCCGGGCCCTGGCCCGCGGAGCCGGCCCGGCGAACTCGGTC [서열번호 7]
따라서, 바람직하게는 상기 HSV ICP34.5 폴리펩티드는 실질적으로 서열번호 7에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 상기 RNA 구조체는 다음과 같은 서열번호 8의 RNA 뉴클레오티드 서열을 포함할 수 있다:
AUGGCCCGCCGCCGCCGCCAUCGCGGCCCCCGCCGCCCCCGGCCGCCCGGGCCCACGGGCGCCGUCCCAACCGCACAGUCCCAGGUAACCUCCACGCCCAACUCGGAACCCGCGGUCAGGAGCGCGCCCGCGGCCGCCCCGCCGCCGCCCCCCGCCGGUGGGCCCCCGCCUUCUUGUUCGCUGCUGCUGCGCCAGUGGCUCCACGUUCCCGAGUCCGCGUCCGACGACGACGAUGACGACGACUGGCCGGACAGCCCCCCGCCCGAGCCGGCGCCAGAGGCCCGGCCCACCGCCGCCGCCCCCCGGCCCCGGCCCCCACCGCCCGGCGUGGGCCCGGGGGGCGGGGCUGACCCCUCCCACCCCCCCUCGCGCCCCUUCCGCCUUCCGCCGCGCCUCGCCCUCCGCCUGCGCGUCACCGCGGAGCACCUGGCGCGCCUGCGCCUGCGACGCGCGGGCGGGGAGGGGGCGCCGGAGCCCCCCGCGACCCCCGCGACCCCCGCGACCCCCGCGACCCCCGCGACCCCCGCGCGGGUGCGCUUCUCGCCCCACGUCCGGGUGCGCCACCUGGUGGUCUGGGCCUCGGCCGCCCGCCUGGCGCGCCGCGGCUCGUGGGCCCGCGAGCGGGCCGACCGGGCUCGGUUCCGGCGCCGGGUGGCGGAGGCCGAGGCGGUCAUCGGGCCGUGCCUGGGGCCCGAGGCCCGUGCCCGGGCCCUGGCCCGCGGAGCCGGCCCGGCGAACUCGGUC [서열번호 8]
아울러, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 8에 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
따라서, 본 발명자들은 서열번호 6의 단백질 서열에 인간 발현을 위한 코돈 최적화를 하였고, 개시(ATG) 및 종결(TGA) 코돈을 포함하는 코돈 최적화된 핵산(DNA) 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 9로 제공된다:
ATGGCCAGAAGAAGGCGGCACAGAGGACCCAGAAGGCCTAGACCTCCTGGACCAACAGGTGCCGTTCCTACCGCTCAGAGCCAAGTGACCAGCACACCCAATTCTGAACCTGCCGTCAGAAGCGCCCCTGCTGCTGCTCCTCCACCTCCACCAGCTGGCGGACCTCCACCTTCTTGTTCTCTGCTGCTGAGACAGTGGCTGCACGTGCCAGAGTCCGCCTCCGACGATGATGACGATGACGACTGGCCTGACAGCCCTCCTCCAGAACCTGCTCCTGAAGCCAGACCTACAGCCGCTGCTCCTAGACCTAGACCACCACCTCCAGGTGTTGGACCTGGTGGCGGAGCTGATCCTTCTCACCCTCCTAGCAGACCCTTCCGGCTTCCTCCTAGACTGGCCCTGAGACTGAGAGTGACAGCCGAACACCTGGCCAGACTGAGACTTCGTAGAGCAGGCGGAGAAGGCGCTCCTGAACCTCCTGCTACACCAGCCACACCAGCTACTCCCGCAACTCCTGCCACTCCTGCTAGAGTGCGGTTTAGCCCTCACGTCCGCGTCAGACATCTGGTCGTTTGGGCCTCTGCTGCCCGGCTTGCTAGAAGAGGATCTTGGGCCAGAGAGAGAGCCGACCGGGCTAGATTTCGGAGAAGAGTGGCCGAAGCCGAGGCCGTGATTGGACCTTGTCTTGGCCCTGAAGCTCGGGCTAGAGCACTTGCTAGAGGTGCCGGACCTGCCAACAGCGTGTGA [서열번호 9]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 9에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 개시(AUG) 및 종결(UGA) 코돈을 포함하는 서열번호 9의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 10으로 제공된다:
AUGGCCAGAAGAAGGCGGCACAGAGGACCCAGAAGGCCUAGACCUCCUGGACCAACAGGUGCCGUUCCUACCGCUCAGAGCCAAGUGACCAGCACACCCAAUUCUGAACCUGCCGUCAGAAGCGCCCCUGCUGCUGCUCCUCCACCUCCACCAGCUGGCGGACCUCCACCUUCUUGUUCUCUGCUGCUGAGACAGUGGCUGCACGUGCCAGAGUCCGCCUCCGACGAUGAUGACGAUGACGACUGGCCUGACAGCCCUCCUCCAGAACCUGCUCCUGAAGCCAGACCUACAGCCGCUGCUCCUAGACCUAGACCACCACCUCCAGGUGUUGGACCUGGUGGCGGAGCUGAUCCUUCUCACCCUCCUAGCAGACCCUUCCGGCUUCCUCCUAGACUGGCCCUGAGACUGAGAGUGACAGCCGAACACCUGGCCAGACUGAGACUUCGUAGAGCAGGCGGAGAAGGCGCUCCUGAACCUCCUGCUACACCAGCCACACCAGCUACUCCCGCAACUCCUGCCACUCCUGCUAGAGUGCGGUUUAGCCCUCACGUCCGCGUCAGACAUCUGGUCGUUUGGGCCUCUGCUGCCCGGCUUGCUAGAAGAGGAUCUUGGGCCAGAGAGAGAGCCGACCGGGCUAGAUUUCGGAGAAGAGUGGCCGAAGCCGAGGCCGUGAUUGGACCUUGUCUUGGCCCUGAAGCUCGGGCUAGAGCACUUGCUAGAGGUGCCGGACCUGCCAACAGCGUGUGA [서열번호 10]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 10에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 HCV E2(C형 간염 바이러스 E2; 폴리단백질(polyprotein) ADC54662.1로부터의 NS1 단백질; 접근 번호 - 게놈 RNA 번역 ADC54662.1; UniProtKB - D3W8R2(D3W8R2_9HEPC)), 또는 그의 동원체일 수 있다.
HCV E2의 한 작용은 PKR을 억제하는 것이다. [Taylor DR, Shi ST, Romano PR, Barber GN, Lai MMC (1999). Inhibition of the interferon-inducible protein kinase PKR by HCV E2 protein. Science, 285, 107-110. doi: 10.1126/science.285.5424.107]. 상기 HCV E2 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 11로 나타낸다:
METHVTGGSAGHTVSGFVSLLAPGAKQNVQLINTNGSWHLNSTALNCNDSLNTGWLAGLFYHHKFNSSGCPERLASCRPLTDFDQGWGPISYANGSGPDQRPYCWHYPPKPCGIVPAKSVCGPVYCFTPSPVVVGTTDRSGAPTYSWGENDTDVFVLNNTRPPLGNWFGCTWMNSTGFTKVCGAPPCVIGGAGNNTLHCPTDCFRKHPDATYSRCGSGPWITPRCLVDYPYRLWHYPCTINYTIFKIRMYVGGVEHRLEAACNWTRGERCDLEDRDRSELSPLLLTTTQWQVLPCSFTTLPALSTGLIHLHQNIVDVQYLYGVGSSIASWAIKWEYVVLLFLLLADARVCSCLWMMLLISQAEA [서열번호 11]
따라서, 바람직하게는 제1 측면의 RNA 구조체는 실질적으로 서열번호 11에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 HCV E2 폴리펩티드는 다음과 같은 서열번호 12의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGAAACCCACGTCACCGGGGGAAGTGCCGGCCACACTGTGTCTGGATTTGTTAGCCTCCTCGCACCAGGCGCCAAGCAGAACGTCCAGCTGATCAACACCAACGGCAGTTGGCACCTCAATAGCACGGCCCTGAACTGCAATGATAGCCTTAACACCGGCTGGTTAGCAGGGCTTTTCTATCACCACAAGTTCAACTCTTCAGGCTGTCCTGAGAGGCTAGCCAGCTGCCGACCCCTTACCGATTTTGACCAGGGCTGGGGCCCTATCAGTTATGCCAACGGAAGCGGCCCCGACCAGCGCCCCTACTGCTGGCACTACCCCCCTAAACCTTGCGGTGTTGTGCCCGCGAAGAGTGTGTGTGGTCCGGTATATTGCTTCACTCCCAGCCCCGTGGTGGTGGGAACGACCGACAGGTCGGGCGCGCCTACCTACAGCTGGGGTGAAAATGATACGGACGTCTTCGTCCTTAACAATACCAGGCCACCGCTGGGCAATTGGTTCGGTTGTACCTGGATGAACTCAACTGGATTCACCAAAGTGTGCGGAGCGCCTCCCTGTGTCATCGGAGGGGCGGGCAACAACACCCTGCACTGCCCCACTGATTGCTTCCGCAAGCATCCGGACGCCACATACTCTCGGTGCGGCTCCGGTCCCTGGATCACACCCAGGTGCCTGGTCGACTACCCGTATAGGCTTTGGCATTATCCTTGTACCATCAACTACACCATATTTAAAATCAGGATGTACGTGGGAGGGGTCGAGCACAGGCTGGAAGCTGCTTGCAACTGGACGCGGGGCGAACGTTGCGATCTGGAAGACAGGGACAGGTCCGAGCTCAGCCCGTTACTGCTGACCACTACACAGTGGCAGGTCCTCCCGTGTTCCTTCACAACCCTGCCAGCCTTGTCCACCGGCCTCATCCACCTCCACCAGAACATTGTGGACGTGCAGTACTTGTACGGGGTGGGGTCAAGCATCGCGTCCTGGGCCATTAAGTGGGAGTACGTCGTTCTCCTGTTCCTTCTGCTTGCAGACGCGCGCGTCTGCTCCTGCTTGTGGATGATGCTACTCATATCCCAAGCGGAGGCG [서열번호 12]
따라서, 바람직하게는 상기 HCV E2 폴리펩티드는 실질적으로 서열번호 12에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 상기 RNA 구조체는 다음과 같은 서열번호 13의 RNA 뉴클레오티드 서열을 포함할 수 있다:
AUGGAAACCCACGUCACCGGGGGAAGUGCCGGCCACACUGUGUCUGGAUUUGUUAGCCUCCUCGCACCAGGCGCCAAGCAGAACGUCCAGCUGAUCAACACCAACGGCAGUUGGCACCUCAAUAGCACGGCCCUGAACUGCAAUGAUAGCCUUAACACCGGCUGGUUAGCAGGGCUUUUCUAUCACCACAAGUUCAACUCUUCAGGCUGUCCUGAGAGGCUAGCCAGCUGCCGACCCCUUACCGAUUUUGACCAGGGCUGGGGCCCUAUCAGUUAUGCCAACGGAAGCGGCCCCGACCAGCGCCCCUACUGCUGGCACUACCCCCCUAAACCUUGCGGUGUUGUGCCCGCGAAGAGUGUGUGUGGUCCGGUAUAUUGCUUCACUCCCAGCCCCGUGGUGGUGGGAACGACCGACAGGUCGGGCGCGCCUACCUACAGCUGGGGUGAAAAUGAUACGGACGUCUUCGUCCUUAACAAUACCAGGCCACCGCUGGGCAAUUGGUUCGGUUGUACCUGGAUGAACUCAACUGGAUUCACCAAAGUGUGCGGAGCGCCUCCCUGUGUCAUCGGAGGGGCGGGCAACAACACCCUGCACUGCCCCACUGAUUGCUUCCGCAAGCAUCCGGACGCCACAUACUCUCGGUGCGGCUCCGGUCCCUGGAUCACACCCAGGUGCCUGGUCGACUACCCGUAUAGGCUUUGGCAUUAUCCUUGUACCAUCAACUACACCAUAUUUAAAAUCAGGAUGUACGUGGGAGGGGUCGAGCACAGGCUGGAAGCUGCUUGCAACUGGACGCGGGGCGAACGUUGCGAUCUGGAAGACAGGGACAGGUCCGAGCUCAGCCCGUUACUGCUGACCACUACACAGUGGCAGGUCCUCCCGUGUUCCUUCACAACCCUGCCAGCCUUGUCCACCGGCCUCAUCCACCUCCACCAGAACAUUGUGGACGUGCAGUACUUGUACGGGGUGGGGUCAAGCAUCGCGUCCUGGGCCAUUAAGUGGGAGUACGUCGUUCUCCUGUUCCUUCUGCUUGCAGACGCGCGCGUCUGCUCCUGCUUGUGGAUGAUGCUACUCAUAUCCCAAGCGGAGGCG [서열번호 13]
아울러, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 13에 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
따라서, 본 발명자들은 서열번호 11의 단백질 서열에 인간 발현을 위한 코돈 최적화를 하였고, 개시(ATG) 및 종결(TGA) 코돈을 포함하는 코돈 최적화된 핵산(DNA) 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 14로 제공된다:
ATGGAAACCCACGTGACAGGCGGATCTGCCGGCCATACAGTGTCCGGCTTTGTGTCTCTTCTGGCCCCTGGCGCCAAGCAGAATGTGCAGCTGATCAACACCAACGGCAGCTGGCACCTGAACAGCACAGCCCTGAACTGCAACGACAGCCTGAATACCGGATGGCTGGCCGGCCTGTTCTACCACCACAAGTTCAATAGCAGCGGCTGCCCCGAGAGACTGGCCTCTTGTAGACCTCTGACCGACTTCGATCAAGGCTGGGGCCCTATCAGCTACGCCAATGGCTCTGGACCTGACCAGAGGCCTTACTGCTGGCACTACCCTCCAAAGCCTTGCGGAATCGTGCCTGCCAAGTCTGTGTGTGGCCCCGTGTACTGCTTCACCCCATCTCCAGTGGTCGTGGGCACCACCGATAGATCTGGCGCCCCAACATATAGCTGGGGCGAGAACGACACCGACGTGTTCGTGCTGAACAACACCCGGCCTCCACTCGGAAATTGGTTCGGCTGCACCTGGATGAACTCCACCGGCTTCACAAAAGTGTGCGGAGCCCCTCCTTGTGTGATTGGCGGAGCCGGAAACAATACCCTGCACTGCCCTACCGACTGCTTCAGAAAGCACCCCGACGCCACCTACAGCAGATGTGGATCTGGCCCTTGGATCACCCCTAGATGCCTGGTGGACTACCCCTACCGGCTGTGGCACTATCCCTGCACCATCAACTACACCATCTTCAAGATCCGTATGTACGTCGGCGGCGTGGAACACAGACTGGAAGCCGCCTGTAACTGGACCAGGGGCGAGAGATGCGACCTGGAAGATAGAGACAGAAGCGAGCTGAGCCCTCTGCTGCTGACCACCACACAGTGGCAGGTCCTGCCTTGCAGCTTCACCACACTGCCTGCTCTGAGCACCGGCCTGATTCATCTGCACCAGAACATCGTGGACGTGCAGTACCTGTACGGCGTGGGAAGCTCTATTGCCAGCTGGGCCATCAAGTGGGAGTACGTGGTGCTGCTGTTCCTGCTGCTGGCCGATGCCAGAGTGTGTAGCTGCCTGTGGATGATGCTGCTGATCTCTCAGGCCGAGGCCTGA [서열번호 14]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 14에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 개시(AUG) 및 종결(UGA) 코돈을 포함하는 서열번호 14의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 15로 제공된다:
AUGGAAACCCACGUGACAGGCGGAUCUGCCGGCCAUACAGUGUCCGGCUUUGUGUCUCUUCUGGCCCCUGGCGCCAAGCAGAAUGUGCAGCUGAUCAACACCAACGGCAGCUGGCACCUGAACAGCACAGCCCUGAACUGCAACGACAGCCUGAAUACCGGAUGGCUGGCCGGCCUGUUCUACCACCACAAGUUCAAUAGCAGCGGCUGCCCCGAGAGACUGGCCUCUUGUAGACCUCUGACCGACUUCGAUCAAGGCUGGGGCCCUAUCAGCUACGCCAAUGGCUCUGGACCUGACCAGAGGCCUUACUGCUGGCACUACCCUCCAAAGCCUUGCGGAAUCGUGCCUGCCAAGUCUGUGUGUGGCCCCGUGUACUGCUUCACCCCAUCUCCAGUGGUCGUGGGCACCACCGAUAGAUCUGGCGCCCCAACAUAUAGCUGGGGCGAGAACGACACCGACGUGUUCGUGCUGAACAACACCCGGCCUCCACUCGGAAAUUGGUUCGGCUGCACCUGGAUGAACUCCACCGGCUUCACAAAAGUGUGCGGAGCCCCUCCUUGUGUGAUUGGCGGAGCCGGAAACAAUACCCUGCACUGCCCUACCGACUGCUUCAGAAAGCACCCCGACGCCACCUACAGCAGAUGUGGAUCUGGCCCUUGGAUCACCCCUAGAUGCCUGGUGGACUACCCCUACCGGCUGUGGCACUAUCCCUGCACCAUCAACUACACCAUCUUCAAGAUCCGUAUGUACGUCGGCGGCGUGGAACACAGACUGGAAGCCGCCUGUAACUGGACCAGGGGCGAGAGAUGCGACCUGGAAGAUAGAGACAGAAGCGAGCUGAGCCCUCUGCUGCUGACCACCACACAGUGGCAGGUCCUGCCUUGCAGCUUCACCACACUGCCUGCUCUGAGCACCGGCCUGAUUCAUCUGCACCAGAACAUCGUGGACGUGCAGUACCUGUACGGCGUGGGAAGCUCUAUUGCCAGCUGGGCCAUCAAGUGGGAGUACGUGGUGCUGCUGUUCCUGCUGCUGGCCGAUGCCAGAGUGUGUAGCUGCCUGUGGAUGAUGCUGCUGAUCUCUCAGGCCGAGGCCUGA [서열번호 15]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 15에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 may be HCV NS5a(C형 간염 바이러스 NS5a; 단리물(isolate) H - 게놈 RNA 번역: AAA45534.1; UniProtKB - P27958(POLG_HCV77)), 또는 그의 동원체일 수 있다. 상기 HCV NS5a 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 16으로 나타낸다:
MSGSWLRDIWDWICEVLSDFKTWLKAKLMPQLPGIPFVSCQRGYRGVWRGDGIMHTRCHCGAEITGHVKNGTMRIVGPRTCKNMWSGTFFINAYTTGPCTPLPAPNYKFALWRVSAEEYVEIRRVGDFHYVSGMTTDNLKCPCQIPSPEFFTELDGVRLHRFAPPCKPLLREEVSFRVGLHEYPVGSQLPCEPEPDVAVLTSMLTDPSHITAEAAGRRLARGSPPSMASSSASQLSAPSLKATCTANHDSPDAELIEANLLWRQEMGGNITRVESENKVVILDSFDPLVAEEDEREVSVPAEILRKSRRFAPALPVWARPDYNPLLVETWKKPDYEPPVVHGCPLPPPRSPPVPPPRKKRTVVLTESTLPTALAELATKSFGSSSTSGITGDNTTTSSEPAPSGCPPDSDVESYSSMPPLEGEPGDPDLSDGSWSTVSSGADTEDVVCC [서열번호 16]
따라서, 바람직하게는 제1 측면의 RNA 구조체는 실질적으로 서열번호 16에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 HCV NS5a 폴리펩티드는 다음과 같은 서열번호 17의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGTCCGGTTCCTGGCTAAGGGACATCTGGGACTGGATATGCGAGGTGCTGAGCGACTTTAAGACCTGGCTGAAAGCCAAGCTCATGCCACAACTGCCTGGGATTCCCTTTGTGTCCTGCCAGCGCGGGTATAGGGGGGTCTGGCGAGGAGACGGCATTATGCACACTCGCTGCCACTGTGGAGCTGAGATCACTGGACATGTCAAAAACGGGACGATGAGGATCGTCGGTCCTAGGACCTGCAAGAACATGTGGAGTGGGACGTTCTTCATTAATGCCTACACCACGGGCCCCTGTACTCCCCTTCCTGCGCCGAACTATAAGTTCGCGCTGTGGAGGGTGTCTGCAGAGGAATACGTGGAGATAAGGCGGGTGGGGGACTTCCACTACGTATCGGGCATGACTACTGACAATCTCAAATGCCCGTGCCAGATCCCATCGCCCGAATTTTTCACAGAATTGGACGGGGTGCGCCTACATAGGTTTGCGCCCCCTTGCAAGCCCTTGCTGCGGGAGGAGGTATCATTCAGAGTAGGACTCCACGAGTACCCGGTGGGGTCGCAATTACCTTGCGAGCCCGAACCGGACGTAGCCGTGTTGACGTCCATGCTCACTGATCCCTCCCATATAACAGCAGAGGCGGCCGGGAGAAGGTTGGCGAGAGGGTCACCCCCTTCTATGGCCAGCTCCTCGGCTAGCCAGCTGTCCGCTCCATCTCTCAAGGCAACTTGCACCGCCAACCATGACTCCCCTGACGCCGAGCTCATAGAGGCTAACCTCCTGTGGAGGCAGGAGATGGGCGGCAACATCACCAGGGTTGAGTCAGAGAACAAAGTGGTGATTCTGGACTCCTTCGATCCGCTTGTGGCAGAGGAGGATGAGCGGGAGGTCTCCGTACCCGCAGAAATTCTGCGGAAGTCTCGGAGATTCGCCCCAGCCCTGCCCGTCTGGGCGCGGCCGGACTACAACCCCCTGCTAGTAGAGACGTGGAAAAAGCCTGACTACGAACCACCTGTGGTCCATGGCTGCCCGCTACCACCTCCACGGTCCCCTCCTGTGCCTCCGCCTCGGAAAAAGCGTACGGTGGTCCTCACCGAATCAACCCTACCTACTGCCTTGGCCGAGCTTGCCACCAAAAGTTTTGGCAGCTCCTCAACTTCCGGCATTACGGGCGACAATACGACAACATCCTCTGAGCCCGCCCCTTCTGGCTGCCCCCCCGACTCCGACGTTGAGTCCTATTCTTCCATGCCCCCCCTGGAGGGGGAGCCTGGGGATCCGGATCTCAGCGACGGGTCATGGTCGACGGTCAGTAGTGGGGCCGACACGGAAGATGTCGTGTGCTGC [서열번호 17]
따라서, 바람직하게는 상기 HCV NS5a 폴리펩티드는 실질적으로 서열번호 17에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 상기 RNA 구조체는 다음과 같은 서열번호 18의 RNA 뉴클레오티드 서열을 포함할 수 있다:
AUGUCCGGUUCCUGGCUAAGGGACAUCUGGGACUGGAUAUGCGAGGUGCUGAGCGACUUUAAGACCUGGCUGAAAGCCAAGCUCAUGCCACAACUGCCUGGGAUUCCCUUUGUGUCCUGCCAGCGCGGGUAUAGGGGGGUCUGGCGAGGAGACGGCAUUAUGCACACUCGCUGCCACUGUGGAGCUGAGAUCACUGGACAUGUCAAAAACGGGACGAUGAGGAUCGUCGGUCCUAGGACCUGCAAGAACAUGUGGAGUGGGACGUUCUUCAUUAAUGCCUACACCACGGGCCCCUGUACUCCCCUUCCUGCGCCGAACUAUAAGUUCGCGCUGUGGAGGGUGUCUGCAGAGGAAUACGUGGAGAUAAGGCGGGUGGGGGACUUCCACUACGUAUCGGGCAUGACUACUGACAAUCUCAAAUGCCCGUGCCAGAUCCCAUCGCCCGAAUUUUUCACAGAAUUGGACGGGGUGCGCCUACAUAGGUUUGCGCCCCCUUGCAAGCCCUUGCUGCGGGAGGAGGUAUCAUUCAGAGUAGGACUCCACGAGUACCCGGUGGGGUCGCAAUUACCUUGCGAGCCCGAACCGGACGUAGCCGUGUUGACGUCCAUGCUCACUGAUCCCUCCCAUAUAACAGCAGAGGCGGCCGGGAGAAGGUUGGCGAGAGGGUCACCCCCUUCUAUGGCCAGCUCCUCGGCUAGCCAGCUGUCCGCUCCAUCUCUCAAGGCAACUUGCACCGCCAACCAUGACUCCCCUGACGCCGAGCUCAUAGAGGCUAACCUCCUGUGGAGGCAGGAGAUGGGCGGCAACAUCACCAGGGUUGAGUCAGAGAACAAAGUGGUGAUUCUGGACUCCUUCGAUCCGCUUGUGGCAGAGGAGGAUGAGCGGGAGGUCUCCGUACCCGCAGAAAUUCUGCGGAAGUCUCGGAGAUUCGCCCCAGCCCUGCCCGUCUGGGCGCGGCCGGACUACAACCCCCUGCUAGUAGAGACGUGGAAAAAGCCUGACUACGAACCACCUGUGGUCCAUGGCUGCCCGCUACCACCUCCACGGUCCCCUCCUGUGCCUCCGCCUCGGAAAAAGCGUACGGUGGUCCUCACCGAAUCAACCCUACCUACUGCCUUGGCCGAGCUUGCCACCAAAAGUUUUGGCAGCUCCUCAACUUCCGGCAUUACGGGCGACAAUACGACAACAUCCUCUGAGCCCGCCCCUUCUGGCUGCCCCCCCGACUCCGACGUUGAGUCCUAUUCUUCCAUGCCCCCCCUGGAGGGGGAGCCUGGGGAUCCGGAUCUCAGCGACGGGUCAUGGUCGACGGUCAGUAGUGGGGCCGACACGGAAGAUGUCGUGUGCUGC [서열번호 18]
아울러, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 18에 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
따라서, 본 발명자들은 서열번호 16의 단백질 서열에 인간 발현을 위한 코돈 최적화를 하였고, 개시(ATG) 및 종결(TGA) 코돈을 포함하는 코돈 최적화된 핵산(DNA) 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 19로 제공된다:
ATGTCTGGCAGCTGGCTGAGAGACATCTGGGACTGGATTTGCGAGGTGCTGAGCGACTTCAAGACCTGGCTGAAGGCCAAGCTGATGCCTCAGCTGCCTGGCATCCCTTTCGTGTCCTGTCAGAGGGGCTATAGAGGCGTTTGGAGAGGCGACGGCATCATGCACACCAGATGTCACTGTGGCGCCGAGATCACAGGCCACGTGAAGAACGGCACCATGAGAATCGTGGGCCCCAGAACCTGCAAGAATATGTGGAGCGGCACCTTCTTCATCAACGCCTACACCACCGGACCTTGCACACCTCTGCCTGCTCCTAACTACAAGTTCGCCCTGTGGCGGGTGTCCGCCGAGGAATACGTGGAAATCAGAAGAGTGGGCGACTTCCACTACGTGTCCGGCATGACCACCGACAACCTGAAGTGCCCCTGTCAGATCCCATCTCCTGAGTTCTTCACCGAGCTGGATGGCGTGCGGCTGCACAGATTTGCCCCTCCATGTAAACCCCTGCTGAGAGAAGAGGTGTCCTTTAGAGTGGGCCTGCACGAGTACCCTGTGGGTTCTCAGCTCCCTTGCGAGCCTGAACCTGATGTGGCCGTGCTGACCTCCATGCTGACAGACCCTTCTCACATCACAGCCGAGGCCGCTGGAAGAAGGCTGGCTAGAGGATCTCCTCCTAGCATGGCCTCTAGCAGCGCCTCTCAACTGTCTGCCCCAAGCCTGAAAGCCACCTGTACCGCCAATCACGACAGCCCTGATGCCGAGCTGATCGAGGCTAACCTGCTGTGGCGGCAAGAGATGGGCGGCAACATCACCAGAGTGGAAAGCGAGAACAAGGTGGTCATCCTGGATAGCTTCGACCCTCTGGTGGCCGAAGAGGACGAGAGGGAAGTGTCTGTGCCTGCCGAGATCCTGAGAAAGAGCAGAAGATTCGCCCCTGCTCTGCCCGTGTGGGCCAGACCTGATTACAATCCCCTGCTGGTGGAAACATGGAAGAAGCCCGACTACGAGCCTCCTGTGGTGCACGGATGTCCACTGCCTCCACCTAGATCTCCACCTGTGCCACCTCCACGGAAGAAAAGAACCGTGGTGCTGACCGAGAGCACCCTGCCTACAGCTCTGGCTGAGCTGGCCACAAAGAGCTTTGGCAGCAGCAGCACCTCTGGCATCACCGGCGATAATACCACCACCAGCTCTGAGCCTGCTCCAAGCGGATGTCCTCCTGACTCCGACGTGGAAAGCTACAGCAGCATGCCTCCTCTGGAAGGCGAACCCGGCGATCCTGATCTGTCTGATGGCTCTTGGAGCACCGTGTCCTCTGGCGCCGATACAGAGGATGTCGTGTGCTGCTGA [서열번호 19]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 19에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 개시(AUG) 및 종결(UGA) 코돈을 포함하는 서열번호 19의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 20으로 제공된다:
AUGUCUGGCAGCUGGCUGAGAGACAUCUGGGACUGGAUUUGCGAGGUGCUGAGCGACUUCAAGACCUGGCUGAAGGCCAAGCUGAUGCCUCAGCUGCCUGGCAUCCCUUUCGUGUCCUGUCAGAGGGGCUAUAGAGGCGUUUGGAGAGGCGACGGCAUCAUGCACACCAGAUGUCACUGUGGCGCCGAGAUCACAGGCCACGUGAAGAACGGCACCAUGAGAAUCGUGGGCCCCAGAACCUGCAAGAAUAUGUGGAGCGGCACCUUCUUCAUCAACGCCUACACCACCGGACCUUGCACACCUCUGCCUGCUCCUAACUACAAGUUCGCCCUGUGGCGGGUGUCCGCCGAGGAAUACGUGGAAAUCAGAAGAGUGGGCGACUUCCACUACGUGUCCGGCAUGACCACCGACAACCUGAAGUGCCCCUGUCAGAUCCCAUCUCCUGAGUUCUUCACCGAGCUGGAUGGCGUGCGGCUGCACAGAUUUGCCCCUCCAUGUAAACCCCUGCUGAGAGAAGAGGUGUCCUUUAGAGUGGGCCUGCACGAGUACCCUGUGGGUUCUCAGCUCCCUUGCGAGCCUGAACCUGAUGUGGCCGUGCUGACCUCCAUGCUGACAGACCCUUCUCACAUCACAGCCGAGGCCGCUGGAAGAAGGCUGGCUAGAGGAUCUCCUCCUAGCAUGGCCUCUAGCAGCGCCUCUCAACUGUCUGCCCCAAGCCUGAAAGCCACCUGUACCGCCAAUCACGACAGCCCUGAUGCCGAGCUGAUCGAGGCUAACCUGCUGUGGCGGCAAGAGAUGGGCGGCAACAUCACCAGAGUGGAAAGCGAGAACAAGGUGGUCAUCCUGGAUAGCUUCGACCCUCUGGUGGCCGAAGAGGACGAGAGGGAAGUGUCUGUGCCUGCCGAGAUCCUGAGAAAGAGCAGAAGAUUCGCCCCUGCUCUGCCCGUGUGGGCCAGACCUGAUUACAAUCCCCUGCUGGUGGAAACAUGGAAGAAGCCCGACUACGAGCCUCCUGUGGUGCACGGAUGUCCACUGCCUCCACCUAGAUCUCCACCUGUGCCACCUCCACGGAAGAAAAGAACCGUGGUGCUGACCGAGAGCACCCUGCCUACAGCUCUGGCUGAGCUGGCCACAAAGAGCUUUGGCAGCAGCAGCACCUCUGGCAUCACCGGCGAUAAUACCACCACCAGCUCUGAGCCUGCUCCAAGCGGAUGUCCUCCUGACUCCGACGUGGAAAGCUACAGCAGCAUGCCUCCUCUGGAAGGCGAACCCGGCGAUCCUGAUCUGUCUGAUGGCUCUUGGAGCACCGUGUCCUCUGGCGCCGAUACAGAGGAUGUCGUGUGCUGCUGA [서열번호 20]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 20에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 VACV E3L(백시니아 바이러스 E3L; AEY72868.1; 접근 번호 - 게놈 DNA 번역: AEY72868.1; UniProtKB - H2DSW3(H2DSW3_9POXV)), 또는 그의 동원체일 수 있다. VACV E3L은 PKR 및 IRF3 및 7의 억제를 통해 선천적 감지 시스템을 억제할 것이다. [Perdiuero B, Esteban M (2009) The interferon system and vaccinia virus evasion mechanisms. J Interferon Cytokine Res, 29, 9, 581-198].
상기 VACV E3L 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 21로 나타낸다:
MSKIYIDERSDAEIVCAAIKNIGIEGATAAQLTRQLNMEKREVNKALYDLQRSAMVYSSDDIPPRWFMTTEADKPDADAMADVIIDDVSREKSMREDHKSFDDVIPAKKIIDWKDANPVTIINEYCQITKRDWSFRIESVGPSNSPTFYACVDIDGRVFDKADGKSKRDAKNNAAKLAVDKLLGYVIIRF [서열번호 21]
따라서, 바람직하게는 제1 측면의 RNA 구조체는 실질적으로 서열번호 21에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 VACV E3L 폴리펩티드는 다음과 같은 서열번호 22의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGTCTAAGATCTATATCGACGAGCGTTCTGACGCAGAGATTGTGTGTGCGGCTATTAAAAACATTGGAATCGAAGGAGCTACTGCTGCACAACTAACTAGACAACTTAATATGGAGAAGCGAGAAGTTAATAAAGCTCTGTACGATCTTCAACGTAGTGCTATGGTGTACAGCTCCGACGATATTCCTCCTCGTTGGTTTATGACAACGGAGGCGGATAAGCCGGATGCTGATGCTATGGCTGACGTCATAATAGATGATGTATCCCGCGAAAAATCAATGAGAGAGGATCATAAGTCTTTTGATGATGTTATTCCGGCTAAAAAAATTATTGATTGGAAAGATGCTAACCCTGTCACCATTATTAATGAGTACTGCCAAATAACTAAGAGAGATTGGTCTTTTCGTATTGAATCAGTTGGGCCTAGTAACTCTCCTACATTTTATGCCTGTGTAGATATCGACGGAAGAGTATTCGATAAGGCCGATGGAAAATCTAAACGAGATGCTAAAAATAATGCAGCTAAATTGGCTGTAGATAAACTTCTTGGGTACGTCATCATTAGATTC [서열번호 22]
따라서, 바람직하게는 상기 VACV E3L 폴리펩티드는 실질적으로 서열번호 22에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 상기 RNA 구조체는 다음과 같은 서열번호 23의 RNA 뉴클레오티드 서열을 포함할 수 있다:
AUGUCUAAGAUCUAUAUCGACGAGCGUUCUGACGCAGAGAUUGUGUGUGCGGCUAUUAAAAACAUUGGAAUCGAAGGAGCUACUGCUGCACAACUAACUAGACAACUUAAUAUGGAGAAGCGAGAAGUUAAUAAAGCUCUGUACGAUCUUCAACGUAGUGCUAUGGUGUACAGCUCCGACGAUAUUCCUCCUCGUUGGUUUAUGACAACGGAGGCGGAUAAGCCGGAUGCUGAUGCUAUGGCUGACGUCAUAAUAGAUGAUGUAUCCCGCGAAAAAUCAAUGAGAGAGGAUCAUAAGUCUUUUGAUGAUGUUAUUCCGGCUAAAAAAAUUAUUGAUUGGAAAGAUGCUAACCCUGUCACCAUUAUUAAUGAGUACUGCCAAAUAACUAAGAGAGAUUGGUCUUUUCGUAUUGAAUCAGUUGGGCCUAGUAACUCUCCUACAUUUUAUGCCUGUGUAGAUAUCGACGGAAGAGUAUUCGAUAAGGCCGAUGGAAAAUCUAAACGAGAUGCUAAAAAUAAUGCAGCUAAAUUGGCUGUAGAUAAACUUCUUGGGUACGUCAUCAUUAGAUUC [서열번호 23]
아울러, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 23에 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
따라서, 본 발명자들은 서열번호 21의 단백질 서열에 인간 발현을 위한 코돈 최적화를 하였고, 개시(ATG) 및 종결(TGA) 코돈을 포함하는 코돈 최적화된 핵산(DNA) 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 24로 제공된다:
ATGAGCAAGATCTACATCGACGAGCGGAGCGACGCCGAGATTGTGTGTGCCGCCATCAAGAACATCGGCATCGAAGGCGCTACAGCCGCTCAGCTGACCAGACAGCTGAACATGGAAAAGCGGGAAGTGAACAAGGCCCTGTACGACCTGCAGAGAAGCGCCATGGTGTACAGCAGCGACGACATCCCTCCTCGGTGGTTTATGACCACAGAGGCCGACAAGCCCGACGCCGATGCTATGGCCGATGTGATCATCGACGACGTGTCCCGCGAGAAGTCCATGAGAGAGGACCACAAGAGCTTCGATGACGTGATCCCCGCCAAGAAGATCATCGATTGGAAGGACGCCAATCCTGTGACCATCATCAACGAGTACTGCCAGATCACCAAGCGCGACTGGTCCTTCAGAATCGAGAGCGTGGGCCCCAGCAACAGCCCTACCTTTTATGCCTGCGTGGACATCGACGGCCGGGTGTTCGATAAGGCCGATGGCAAGAGCAAGCGGGACGCCAAAAACAACGCCGCCAAACTGGCCGTGGATAAGCTGCTGGGCTACGTGATCATCCGGTTCTGA [서열번호 24]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 24에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 개시(AUG) 및 종결(UGA) 코돈을 포함하는 서열번호 24의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 25로 제공된다:
AUGAGCAAGAUCUACAUCGACGAGCGGAGCGACGCCGAGAUUGUGUGUGCCGCCAUCAAGAACAUCGGCAUCGAAGGCGCUACAGCCGCUCAGCUGACCAGACAGCUGAACAUGGAAAAGCGGGAAGUGAACAAGGCCCUGUACGACCUGCAGAGAAGCGCCAUGGUGUACAGCAGCGACGACAUCCCUCCUCGGUGGUUUAUGACCACAGAGGCCGACAAGCCCGACGCCGAUGCUAUGGCCGAUGUGAUCAUCGACGACGUGUCCCGCGAGAAGUCCAUGAGAGAGGACCACAAGAGCUUCGAUGACGUGAUCCCCGCCAAGAAGAUCAUCGAUUGGAAGGACGCCAAUCCUGUGACCAUCAUCAACGAGUACUGCCAGAUCACCAAGCGCGACUGGUCCUUCAGAAUCGAGAGCGUGGGCCCCAGCAACAGCCCUACCUUUUAUGCCUGCGUGGACAUCGACGGCCGGGUGUUCGAUAAGGCCGAUGGCAAGAGCAAGCGGGACGCCAAAAACAACGCCGCCAAACUGGCCGUGGAUAAGCUGCUGGGCUACGUGAUCAUCCGGUUCUGA [서열번호 25]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 25에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 VACV K3L(백시니아 바이러스 K3L; P20639.1; 접근 번호 - 게놈 DNA 번역: AAA48009.1; UniProtKB - P20639(K3_VACCC)), 또는 그의 동원체일 수 있다. VACV K3L은 PKR을 억제한다. [Perdiuero B, Esteban M (2009) The interferon system and vaccinia virus evasion mechanisms. J Interferon Cytokine Res, 29, 9, 581-198]. 상기 VACV K3L 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 26으로 나타낸다:
MLAFCYSLPNAGDVIKGRVYEKDYALYIYLFDYPHSEAILAESVKMHMDRYVEYRDKLVGKTVKVKVIRVDYTKGYIDVNYKRMCRHQ [서열번호 26]
따라서, 바람직하게는 제1 측면의 RNA 구조체는 실질적으로 서열번호 26에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 VACV K3L 폴리펩티드는 다음과 같은 서열번호 27의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGCTTGCATTTTGTTATTCGTTGCCCAATGCGGGCGATGTAATAAAGGGCAGAGTATACGAGAAGGATTATGCTCTATACATTTATCTTTTTGACTATCCTCACTCTGAAGCTATCTTGGCAGAGAGTGTTAAGATGCATATGGATAGATATGTTGAATATAGGGATAAACTGGTAGGGAAAACTGTAAAAGTTAAAGTGATTAGAGTTGATTATACAAAAGGATATATAGATGTCAATTACAAAAGGATGTGTAGACATCAA [서열번호 27]
따라서, 바람직하게는 상기 VACV K3L 폴리펩티드는 실질적으로 서열번호 27에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 상기 RNA 구조체는 다음과 같은 서열번호 28의 RNA 뉴클레오티드 서열을 포함할 수 있다:
AUGCUUGCAUUUUGUUAUUCGUUGCCCAAUGCGGGCGAUGUAAUAAAGGGCAGAGUAUACGAGAAGGAUUAUGCUCUAUACAUUUAUCUUUUUGACUAUCCUCACUCUGAAGCUAUCUUGGCAGAGAGUGUUAAGAUGCAUAUGGAUAGAUAUGUUGAAUAUAGGGAUAAACUGGUAGGGAAAACUGUAAAAGUUAAAGUGAUUAGAGUUGAUUAUACAAAAGGAUAUAUAGAUGUCAAUUACAAAAGGAUGUGUAGACAUCAA [서열번호 28]
아울러, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 28에 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
따라서, 본 발명자들은 서열번호 26의 단백질 서열에 인간 발현을 위한 코돈 최적화를 하였고, 개시(ATG) 및 종결(TGA) 코돈을 포함하는 코돈 최적화된 핵산(DNA) 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 29로 제공된다:
ATGCTGGCCTTCTGCTACAGCCTGCCTAATGCCGGCGACGTGATCAAGGGCAGAGTGTACGAGAAGGACTACGCCCTGTACATCTACCTGTTCGACTACCCTCACAGCGAGGCCATCCTGGCCGAGTCTGTGAAGATGCACATGGACAGATACGTGGAATACCGGGACAAGCTCGTGGGCAAGACCGTGAAAGTGAAAGTCATCAGAGTGGACTACACCAAGGGCTACATCGACGTGAACTACAAGCGGATGTGCAGGCACCAGTGA [서열번호 29]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 29에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 개시(AUG) 및 종결(UGA) 코돈을 포함하는 서열번호 29의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 30으로 제공된다:
AUGCUGGCCUUCUGCUACAGCCUGCCUAAUGCCGGCGACGUGAUCAAGGGCAGAGUGUACGAGAAGGACUACGCCCUGUACAUCUACCUGUUCGACUACCCUCACAGCGAGGCCAUCCUGGCCGAGUCUGUGAAGAUGCACAUGGACAGAUACGUGGAAUACCGGGACAAGCUCGUGGGCAAGACCGUGAAAGUGAAAGUCAUCAGAGUGGACUACACCAAGGGCUACAUCGACGUGAACUACAAGCGGAUGUGCAGGCACCAGUGA [서열번호 30]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 30에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 백시니아 C6(VACV C6 - 백시니아 바이러스 C6; 접근 번호 - 게놈 DNA 번역: AAA69602.1; UniProtKB - P17362(C6_VACCW)), 또는 그의 동원체일 수 있다. 상기 단백질은 인터페론 알파 및 베타의 유도를 위해 핵심적인 전사 인자인 인터페론 조절 인자 3/IRF3 및 7/IRF7의 바이러스-유도성 인산화 및 활성화를 차단함으로써 세포의 항-바이러스 상태의 확립을 방지하는 것으로 여겨진다. 상기 차단은 숙주의 TBK1 어댑터(adapter) 단백질 TBKBP1 및 AZI2에 결합하고, 이로 인해 IRF3 및 IRF7의 인산화 및 활성화의 강한 억제를 생성함으로써, 숙주 TBK1의 억제를 통해 생성될 수 있다. 이것은 또한 숙주 STAT2와 상호작용함으로써 타입 I IFN에 대한 세포 반응의 억제제로서 작용할 수 있다. 기계론적으로, 이것은 인터페론 자극 반응 요소에 대한 숙주 ISGF3 복합체(STAT1, STAT2 및 IRF9로 구성됨) 결합 후에 그 억제 효과를 추가로 발휘할 수 있다. [Smith GL. Vaccinia Virus Protein C6: A Multifunctional Interferon Antagonist. Adv Exp Med Biol. 2018; 1052:1-7. doi: 10.1007/978-981-10-7572-8_1. PMID: 29785476]. 상기 백시니아 C6 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 31로 나타낸다:
MNAYNKADSFSLESDSIKDVIHDYICWLSMTDEMRPSIGNVFKAMETFKIDAVRYYDGNIYELAKDINAMSFDGFIRSLQTIASKKDKLTVYGTMGLLSIVVDINKGCDISNIKFAAGIIILMEYIFDDTDMSHLKVALYRRIQRRDDVDR [서열번호 31]
따라서, 바람직하게는 제1 측면의 RNA 구조체는 실질적으로 서열번호 31에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 백시니아 C6 폴리펩티드는 다음과 같은 서열번호 32의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGAATGCGTATAATAAAGCCGATTCGTTTTCTTTAGAGTCTGATTCTATCAAAGATGTTATACACGATTATATTTGTTGGCTCAGTATGACTGATGAAATGAGACCATCTATCGGAAACGTCTTTAAAGCGATGGAAACGTTTAAGATAGACGCGGTTAGATATTACGATGGTAACATATATGAATTAGCTAAAGATATAAATGCGATGTCGTTTGACGGTTTTATAAGATCTCTACAAACTATCGCTTCAAAGAAAGATAAACTCACTGTTTATGGAACCATGGGACTGCTGTCTATTGTCGTAGATATTAACAAAGGTTGTGATATATCCAATATCAAGTTCGCTGCCGGAATAATCATTTTAATGGAGTATATTTTTGATGACACGGATATGTCTCATCTTAAAGTAGCACTCTATCGTAGAATACAGAGACGTGATGATGTAGATAGA [서열번호 32]
따라서, 바람직하게는 상기 백시니아 C6 폴리펩티드는 실질적으로 서열번호 32에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 상기 RNA 구조체는 다음과 같은 서열번호 33의 RNA 뉴클레오티드 서열을 포함할 수 있다:
AUGAAUGCGUAUAAUAAAGCCGAUUCGUUUUCUUUAGAGUCUGAUUCUAUCAAAGAUGUUAUACACGAUUAUAUUUGUUGGCUCAGUAUGACUGAUGAAAUGAGACCAUCUAUCGGAAACGUCUUUAAAGCGAUGGAAACGUUUAAGAUAGACGCGGUUAGAUAUUACGAUGGUAACAUAUAUGAAUUAGCUAAAGAUAUAAAUGCGAUGUCGUUUGACGGUUUUAUAAGAUCUCUACAAACUAUCGCUUCAAAGAAAGAUAAACUCACUGUUUAUGGAACCAUGGGACUGCUGUCUAUUGUCGUAGAUAUUAACAAAGGUUGUGAUAUAUCCAAUAUCAAGUUCGCUGCCGGAAUAAUCAUUUUAAUGGAGUAUAUUUUUGAUGACACGGAUAUGUCUCAUCUUAAAGUAGCACUCUAUCGUAGAAUACAGAGACGUGAUGAUGUAGAUAGA [서열번호 33]
아울러, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 33에 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
따라서, 본 발명자들은 서열번호 31의 단백질 서열에 인간 발현을 위한 코돈 최적화를 하였고, 개시(ATG) 및 종결(TGA) 코돈을 포함하는 코돈 최적화된 핵산(DNA) 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 34로 제공된다:
ATGAACGCCTACAACAAGGCCGACAGCTTCAGCCTGGAAAGCGACAGCATCAAGGACGTGATCCACGACTACATCTGCTGGCTGAGCATGACCGACGAGATGAGGCCCAGCATCGGCAACGTGTTCAAGGCCATGGAAACCTTCAAGATCGACGCCGTGCGGTACTACGACGGCAACATCTATGAGCTGGCCAAGGACATCAACGCCATGAGCTTCGACGGCTTCATCAGAAGCCTGCAGACAATCGCCAGCAAGAAAGACAAGCTGACCGTGTACGGCACCATGGGCCTGCTGTCTATCGTGGTGGATATCAACAAGGGCTGCGACATCAGCAACATCAAGTTCGCCGCTGGCATCATCATCCTGATGGAGTACATCTTCGACGACACCGACATGAGCCACCTGAAGGTGGCCCTGTACAGAAGAATCCAGCGGAGGGACGACGTGGACAGATGA [서열번호 34]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 34에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 개시(AUG) 및 종결(UGA) 코돈을 포함하는 서열번호 34의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 35로 제공된다:
AUGAACGCCUACAACAAGGCCGACAGCUUCAGCCUGGAAAGCGACAGCAUCAAGGACGUGAUCCACGACUACAUCUGCUGGCUGAGCAUGACCGACGAGAUGAGGCCCAGCAUCGGCAACGUGUUCAAGGCCAUGGAAACCUUCAAGAUCGACGCCGUGCGGUACUACGACGGCAACAUCUAUGAGCUGGCCAAGGACAUCAACGCCAUGAGCUUCGACGGCUUCAUCAGAAGCCUGCAGACAAUCGCCAGCAAGAAAGACAAGCUGACCGUGUACGGCACCAUGGGCCUGCUGUCUAUCGUGGUGGAUAUCAACAAGGGCUGCGACAUCAGCAACAUCAAGUUCGCCGCUGGCAUCAUCAUCCUGAUGGAGUACAUCUUCGACGACACCGACAUGAGCCACCUGAAGGUGGCCCUGUACAGAAGAAUCCAGCGGAGGGACGACGUGGACAGAUGA [서열번호 35]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 35에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 MERS ORF8b(중동 호흡기 증후군 바이러스 ORF8b; 접근 번호 - 진뱅크(GenBank): ANF29170.1; UniProtKB - A0A1W5LGP6(A0A1W5LGP6_MERS)), 또는 그의 동원체일 수 있다. MERS ORF8b는 MDA5-매개 NF-κB 활성화 및 IRF3 활성화의 길항제(antagonist)인 것으로 여겨진다. [Lee J-Y, Bae S, Myoung J (2019) Middle East Respiratory Syndrome Coronavirus-Encoded Accessory Proteins Impair MDA5-and TBK1-Mediated Activation of NF-κB. J Microbiol Biotechnol, 29, 8,1316-1323 doi: 10.4014/jmb.1908.08004]; [Wong, L-yR, Ye ZW, Lui P-Y, Zheng X, Yuan S, Zhu L, Fung S-Y et al. (2020) Middle East respiratory syndrome coronavirus ORF8b accessory protein suppresses type I IFN expression by impeding HSP70-dependent activation of IRF3 kinase IKK€. J Immunol, 205, 6, 1564-1579].
상기 MERS ORF8b 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 36으로 나타낸다:
MPIPPLRKMLGIGGDRTEKLIPGMELSNWLPGGTSTTLELDPKQHSHSGLLRMASFGSMKMAPLMLLQLLGRGTLTMIQLLLHNSRPVLSFLKTSTLRGLEAIVNHLQEPLAQAETLPDLVHKVQDQETLPAALLQVHLESEQ [서열번호 36]
따라서, 바람직하게는 제1 측면의 RNA 구조체는 실질적으로 서열번호 36에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 MERS ORF8b 폴리펩티드는 다음과 같은 서열번호 37의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGCCAATTCCACCCCTGCGCAAAATGCTGGGTATTGGCGGAGACAGGACAGAAAAATTAATACCGGGAATGGAATTAAGCAACTGGCTCCCAGGTGGTACTTCTACTACACTGGAACTGGACCCGAAGCAGCACTCCCATTCCGGGCTGTTAAGGATGGCATCGTTTGGGTCCATGAAGATGGCGCCACTGATGCTCCTTCAACTTTTGGGACGCGGAACCCTAACAATGATTCAGCTATTGTTACACAATTCGCGCCCGGTACTAAGCTTCCTAAAAACTTCCACATTGAGGGGACTGGAGGCAATAGTCAATCATCTTCAAGAGCCTCTAGCGCAAGCAGAAACTCTTCCAGATCTAGTTCACAAGGTTCAAGATCAGGAAACTCTACCCGCGGCACTTCTCCAGGTCCATCTGGAATCGGAGCAG [서열번호 37]
따라서, 바람직하게는 상기 MERS ORF8b 폴리펩티드는 실질적으로 서열번호 37에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 상기 RNA 구조체는 다음과 같은 서열번호 38의 RNA 뉴클레오티드 서열을 포함할 수 있다:
AUGCCAAUUCCACCCCUGCGCAAAAUGCUGGGUAUUGGCGGAGACAGGACAGAAAAAUUAAUACCGGGAAUGGAAUUAAGCAACUGGCUCCCAGGUGGUACUUCUACUACACUGGAACUGGACCCGAAGCAGCACUCCCAUUCCGGGCUGUUAAGGAUGGCAUCGUUUGGGUCCAUGAAGAUGGCGCCACUGAUGCUCCUUCAACUUUUGGGACGCGGAACCCUAACAAUGAUUCAGCUAUUGUUACACAAUUCGCGCCCGGUACUAAGCUUCCUAAAAACUUCCACAUUGAGGGGACUGGAGGCAAUAGUCAAUCAUCUUCAAGAGCCUCUAGCGCAAGCAGAAACUCUUCCAGAUCUAGUUCACAAGGUUCAAGAUCAGGAAACUCUACCCGCGGCACUUCUCCAGGUCCAUCUGGAAUCGGAGCAG [서열번호 38]
아울러, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 38에 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
따라서, 본 발명자들은 서열번호 36의 단백질 서열에 인간 발현을 위한 코돈 최적화를 하였고, 개시(ATG) 및 종결(TGA) 코돈을 포함하는 코돈 최적화된 핵산(DNA) 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 39로 제공된다:
ATGCCCATTCCTCCACTGAGAAAGATGCTCGGCATCGGCGGCGACAGAACCGAGAAGCTGATCCCTGGCATGGAACTGAGCAACTGGCTGCCTGGCGGCACCAGCACAACACTGGAACTGGATCCTAAGCAGCACAGCCACAGCGGCCTGCTGAGAATGGCCAGCTTTGGCAGCATGAAGATGGCCCCTCTGATGCTGCTGCAGCTGCTCGGAAGAGGCACCCTGACAATGATCCAGCTGCTGCTCCACAACAGCAGACCCGTGCTGAGCTTCCTGAAAACCAGCACACTGAGAGGCCTGGAAGCCATCGTGAACCATCTGCAAGAGCCCCTGGCTCAGGCCGAGACACTGCCTGATCTGGTGCACAAGGTGCAGGACCAAGAAACCCTGCCTGCCGCTCTGCTGCAGGTCCACCTGGAATCTGAGCAGTGA [서열번호 39]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 39에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 개시(AUG) 및 종결(UGA) 코돈을 포함하는 서열번호 39의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 40으로 제공된다:
AUGCCCAUUCCUCCACUGAGAAAGAUGCUCGGCAUCGGCGGCGACAGAACCGAGAAGCUGAUCCCUGGCAUGGAACUGAGCAACUGGCUGCCUGGCGGCACCAGCACAACACUGGAACUGGAUCCUAAGCAGCACAGCCACAGCGGCCUGCUGAGAAUGGCCAGCUUUGGCAGCAUGAAGAUGGCCCCUCUGAUGCUGCUGCAGCUGCUCGGAAGAGGCACCCUGACAAUGAUCCAGCUGCUGCUCCACAACAGCAGACCCGUGCUGAGCUUCCUGAAAACCAGCACACUGAGAGGCCUGGAAGCCAUCGUGAACCAUCUGCAAGAGCCCCUGGCUCAGGCCGAGACACUGCCUGAUCUGGUGCACAAGGUGCAGGACCAAGAAACCCUGCCUGCCGCUCUGCUGCAGGUCCACCUGGAAUCUGAGCAGUGA [서열번호 40]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 40에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 KSHV ORF52(카포시 육종-연관 헤르페스바이러스 ORF52; 접근 번호 - 게놈 DNA 번역: ACY00451.1; UniProtKB - F5HBL8(F5HBL8_HHV8)), 또는 그의 동원체일 수 있다. 카포시 육종-연관 헤르페스바이러스(KSHV)의 ORF52 단백질은 cGAS 효소 활성을 직접 억제하고, 이에 따라 cGAS 및 DNA 모두에 대한 결합에 의해 신호전달 분자 cGAMP의 생성을 방지하는 것으로 여겨진다. [Wu J-J, Li W, Shao Y, Avey D et al. (2015) Inhibition of cGAS DNA Sensing by a Herpesvirus Virion Protein. Cell Host Microbe. 18, 3, 333-344.. doi: 10.1016/j.chom.2015.07.015].
상기 KSHV ORF52 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 41로 나타낸다:
MAAPRGRPKKDLTMEDLTAKISQLTVENRELRKALGSTADPRDRPLTATEKEAQLTATVGALSAAAAKKIEARVRTIFSKVVTQKQVDDALKGLSLRIDVCMSDGGTAKPPPGANNRRRRGASTTRAGVDD [서열번호 41]
따라서, 바람직하게는 제1 측면의 RNA 구조체는 실질적으로 서열번호 41에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 KSHV ORF52 폴리펩티드는 다음과 같은 서열번호 42의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGCCGCGCCCAGGGGCAGACCCAAAAAGGACCTTACGATGGAAGACCTAACCGCAAAGATAAGCCAATTGACTGTGGAGAATCGGGAGCTTCGGAAAGCACTGGGATCCACTGCCGATCCGAGAGATCGGCCTCTGACGGCCACCGAGAAGGAAGCGCAGCTTACCGCTACTGTGGGTGCACTGAGTGCGGCGGCCGCTAAGAAAATCGAAGCCAGGGTCAGGACAATATTCAGCAAGGTTGTAACACAAAAGCAAGTGGACGATGCCCTGAAGGGACTTTCGCTTAGAATCGACGTCTGCATGTCAGACGGGGGCACCGCTAAACCGCCTCCTGGTGCCAATAACAGGCGACGAAGAGGAGCCTCGACAACACGGGCGGGGGTTGATGAC [서열번호 42]
따라서, 바람직하게는 상기 KSHV ORF52 폴리펩티드는 실질적으로 서열번호 42에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 상기 RNA 구조체는 다음과 같은 서열번호 43의 RNA 뉴클레오티드 서열을 포함할 수 있다:
AUGGCCGCGCCCAGGGGCAGACCCAAAAAGGACCUUACGAUGGAAGACCUAACCGCAAAGAUAAGCCAAUUGACUGUGGAGAAUCGGGAGCUUCGGAAAGCACUGGGAUCCACUGCCGAUCCGAGAGAUCGGCCUCUGACGGCCACCGAGAAGGAAGCGCAGCUUACCGCUACUGUGGGUGCACUGAGUGCGGCGGCCGCUAAGAAAAUCGAAGCCAGGGUCAGGACAAUAUUCAGCAAGGUUGUAACACAAAAGCAAGUGGACGAUGCCCUGAAGGGACUUUCGCUUAGAAUCGACGUCUGCAUGUCAGACGGGGGCACCGCUAAACCGCCUCCUGGUGCCAAUAACAGGCGACGAAGAGGAGCCUCGACAACACGGGCGGGGGUUGAUGAC [서열번호 43]
아울러, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 43에 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
따라서, 본 발명자들은 서열번호 41의 단백질 서열에 인간 발현을 위한 코돈 최적화를 하였고, 개시(ATG) 및 종결(TGA) 코돈을 포함하는 코돈 최적화된 핵산(DNA) 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 44로 제공된다:
ATGGCTGCTCCTAGAGGCAGACCCAAGAAAGACCTGACCATGGAAGATCTGACCGCCAAGATCAGCCAGCTGACCGTGGAAAACAGAGAGCTGAGAAAGGCCCTGGGCAGCACCGCCGATCCTAGAGATAGACCTCTGACAGCCACCGAGAAAGAGGCCCAGCTGACAGCTACAGTGGGAGCCCTTTCTGCCGCCGCTGCCAAGAAAATTGAAGCCAGAGTGCGGACCATCTTCAGCAAGGTGGTCACCCAGAAACAGGTGGACGATGCCCTGAAGGGCCTGAGCCTGAGAATCGACGTGTGTATGTCTGACGGCGGCACCGCCAAACCTCCACCTGGCGCTAACAACAGAAGAAGAAGAGGCGCCAGCACCACCAGAGCTGGCGTGGACGATTGA [서열번호 44]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 44에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 개시(AUG) 및 종결(UGA) 코돈을 포함하는 서열번호 44의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 45로 제공된다:
AUGGCUGCUCCUAGAGGCAGACCCAAGAAAGACCUGACCAUGGAAGAUCUGACCGCCAAGAUCAGCCAGCUGACCGUGGAAAACAGAGAGCUGAGAAAGGCCCUGGGCAGCACCGCCGAUCCUAGAGAUAGACCUCUGACAGCCACCGAGAAAGAGGCCCAGCUGACAGCUACAGUGGGAGCCCUUUCUGCCGCCGCUGCCAAGAAAAUUGAAGCCAGAGUGCGGACCAUCUUCAGCAAGGUGGUCACCCAGAAACAGGUGGACGAUGCCCUGAAGGGCCUGAGCCUGAGAAUCGACGUGUGUAUGUCUGACGGCGGCACCGCCAAACCUCCACCUGGCGCUAACAACAGAAGAAGAAGAGGCGCCAGCACCACCAGAGCUGGCGUGGACGAUUGA [서열번호 45]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 45에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 에볼라 VP35(EBOV VP35; NP_066244.1; 접근 번호 - NCBI 참조 서열: NC_002549.1; UniProtKB - Q05127(VP35_EBOZM)), 또는 그의 동원체일 수 있다. 에볼라 바이러스 VP35 단백질은 (선천적 신호전달 캐스케이드에 대한 다른 효과들 중에서도) RIG-I의 활성화를 위해 필요한 세포 dsRNA 결합 단백질인 세포 단백질 PACT에 결합하고, IRF3 및 IRF7 활성을 억제하는 것으로 생각된다. [Luthra P, Raman P, Mire CE, Weisand C, Isuda Y et al. (2013) Mutual antagonism between Ebola virus VP35 protein and the RIG-I activator PACT determines infection outcome. Cell Host Microbe., 14(1):74-84. doi: 10.1016/j.chom.2013.06.010]; [Hartman AL, Bird BH, Towner JS, Anoniadou Z-A, Zaki SR, Nichol ST (2008) Inhibition of IRF-3 activation by VP35 is critical for the high level of virulence of Ebola virus. J Virol. 82, 6, 2699-2704. Audet J, Kobinger GP (2015). Immune evasion in ebolavirus infections. Viral Immunol., 28, 1, 10-18].
상기 에볼라 VP35 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 46으로 나타낸다:
MTTRTKGRGHTAATTQNDRMPGPELSGWISEQLMTGRIPVSDIFCDIENNPGLCYASQMQQTKPNPKTRNSQTQTDPICNHSFEEVVQTLASLATVVQQQTIASESLEQRITSLENGLKPVYDMAKTISSLNRVCAEMVAKYDLLVMTTGRATATAAATEAYWAEHGQPPPGPSLYEESAIRGKIESRDETVPQSVREAFNNLNSTTSLTEENFGKPDISAKDLRNIMYDHLPGFGTAFHQLVQVICKLGKDSNSLDIIHAEFQASLAEGDSPQCALIQITKRVPIFQDAAPPVIHIRSRGDIPRACQKSLRPVPPSPKIDRGWVCVFQLQDGKTLGLKI [서열번호 46]
따라서, 바람직하게는 제1 측면의 RNA 구조체는 실질적으로 서열번호 46에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편에 의해 암호화되는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 에볼라 VP35 폴리펩티드는 다음과 같은 서열번호 47의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGACAACTAGAACAAAGGGCAGGGGCCATACTGCGGCCACGACTCAAAACGACAGAATGCCAGGCCCTGAGCTTTCGGGCTGGATCTCTGAGCAGCTAATGACCGGAAGAATTCCTGTAAGCGACATCTTCTGTGATATTGAGAACAATCCAGGATTATGCTACGCATCCCAAATGCAACAAACGAAGCCAAACCCGAAGACGCGCAACAGTCAAACCCAAACGGACCCAATTTGCAATCATAGTTTTGAGGAGGTAGTACAAACATTGGCTTCATTGGCTACTGTTGTGCAACAACAAACCATCGCATCAGAATCATTAGAACAACGCATTACGAGTCTTGAGAATGGTCTAAAGCCAGTTTATGATATGGCAAAAACAATCTCCTCATTGAACAGGGTTTGTGCTGAGATGGTTGCAAAATATGATCTTCTGGTGATGACAACCGGTCGGGCAACAGCAACCGCTGCGGCAACTGAGGCTTATTGGGCCGAACATGGTCAACCACCACCTGGACCATCACTTTATGAAGAAAGTGCGATTCGGGGTAAGATTGAATCTAGAGATGAGACCGTCCCTCAAAGTGTTAGGGAGGCATTCAACAATCTAAACAGTACCACTTCACTAACTGAGGAAAATTTTGGGAAACCTGACATTTCGGCAAAGGATTTGAGAAACATTATGTATGATCACTTGCCTGGTTTTGGAACTGCTTTCCACCAATTAGTACAAGTGATTTGTAAATTGGGAAAAGATAGCAACTCATTGGACATCATTCATGCTGAGTTCCAGGCCAGCCTGGCTGAAGGAGACTCTCCTCAATGTGCCCTAATTCAAATTACAAAAAGAGTTCCAATCTTCCAAGATGCTGCTCCACCTGTCATCCACATCCGCTCTCGAGGTGACATTCCCCGAGCTTGCCAGAAAAGCTTGCGTCCAGTCCCACCATCGCCCAAGATTGATCGAGGTTGGGTATGTGTTTTTCAGCTTCAAGATGGTAAAACACTTGGACTCAAAATT [서열번호 47]
따라서, 바람직하게는 상기 에볼라 VP35 폴리펩티드는 실질적으로 서열번호 47에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 상기 RNA 구조체는 다음과 같은 서열번호 48의 RNA 뉴클레오티드 서열을 포함할 수 있다:
AUGACAACUAGAACAAAGGGCAGGGGCCAUACUGCGGCCACGACUCAAAACGACAGAAUGCCAGGCCCUGAGCUUUCGGGCUGGAUCUCUGAGCAGCUAAUGACCGGAAGAAUUCCUGUAAGCGACAUCUUCUGUGAUAUUGAGAACAAUCCAGGAUUAUGCUACGCAUCCCAAAUGCAACAAACGAAGCCAAACCCGAAGACGCGCAACAGUCAAACCCAAACGGACCCAAUUUGCAAUCAUAGUUUUGAGGAGGUAGUACAAACAUUGGCUUCAUUGGCUACUGUUGUGCAACAACAAACCAUCGCAUCAGAAUCAUUAGAACAACGCAUUACGAGUCUUGAGAAUGGUCUAAAGCCAGUUUAUGAUAUGGCAAAAACAAUCUCCUCAUUGAACAGGGUUUGUGCUGAGAUGGUUGCAAAAUAUGAUCUUCUGGUGAUGACAACCGGUCGGGCAACAGCAACCGCUGCGGCAACUGAGGCUUAUUGGGCCGAACAUGGUCAACCACCACCUGGACCAUCACUUUAUGAAGAAAGUGCGAUUCGGGGUAAGAUUGAAUCUAGAGAUGAGACCGUCCCUCAAAGUGUUAGGGAGGCAUUCAACAAUCUAAACAGUACCACUUCACUAACUGAGGAAAAUUUUGGGAAACCUGACAUUUCGGCAAAGGAUUUGAGAAACAUUAUGUAUGAUCACUUGCCUGGUUUUGGAACUGCUUUCCACCAAUUAGUACAAGUGAUUUGUAAAUUGGGAAAAGAUAGCAACUCAUUGGACAUCAUUCAUGCUGAGUUCCAGGCCAGCCUGGCUGAAGGAGACUCUCCUCAAUGUGCCCUAAUUCAAAUUACAAAAAGAGUUCCAAUCUUCCAAGAUGCUGCUCCACCUGUCAUCCACAUCCGCUCUCGAGGUGACAUUCCCCGAGCUUGCCAGAAAAGCUUGCGUCCAGUCCCACCAUCGCCCAAGAUUGAUCGAGGUUGGGUAUGUGUUUUUCAGCUUCAAGAUGGUAAAACACUUGGACUCAAAAUU [서열번호 48]
아울러, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 48에 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
따라서, 본 발명자들은 서열번호 46의 단백질 서열에 인간 발현을 위한 코돈 최적화를 하였고, 개시(ATG) 및 종결(TGA) 코돈을 포함하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 49로 제공된다:
ATGACCACCAGGACCAAAGGCAGAGGACACACCGCCGCCACCACACAGAACGACAGAATGCCTGGACCTGAGCTGAGCGGCTGGATCTCTGAGCAGCTGATGACAGGCAGAATCCCCGTGTCCGACATCTTCTGCGACATCGAGAACAACCCCGGCCTGTGTTACGCCAGCCAGATGCAGCAGACCAAGCCTAATCCTAAGACACGGAACAGCCAGACACAGACAGACCCCATCTGCAACCACAGCTTCGAGGAAGTGGTGCAGACACTGGCCAGCCTGGCTACAGTTGTGCAGCAGCAGACAATCGCCAGCGAGAGCCTGGAACAGAGAATCACCAGCCTGGAAAACGGCCTGAAGCCTGTGTACGACATGGCCAAGACCATCAGCTCCCTGAACAGAGTGTGCGCCGAGATGGTGGCCAAATACGACCTGCTCGTGATGACCACCGGCAGAGCCACAGCTACAGCCGCTGCCACAGAAGCCTATTGGGCCGAACATGGACAGCCTCCACCTGGACCTAGCCTGTACGAGGAATCTGCCATCCGGGGCAAGATCGAGAGCAGGGATGAGACAGTGCCCCAGTCTGTGCGCGAGGCCTTCAACAACCTGAACAGCACCACAAGCCTGACCGAGGAAAACTTCGGCAAGCCCGACATCAGCGCCAAGGACCTGCGGAACATTATGTACGACCATCTGCCTGGCTTCGGCACCGCCTTCCATCAGCTGGTGCAAGTGATCTGCAAGCTGGGCAAAGACAGCAACAGCCTGGACATCATCCACGCCGAGTTTCAGGCCTCTCTGGCCGAAGGCGATTCTCCTCAGTGTGCCCTGATCCAGATCACCAAGCGGGTGCCCATCTTCCAGGATGCTGCCCCTCCTGTGATCCACATCAGAAGCAGAGGCGACATCCCCAGAGCCTGCCAGAAATCTCTCAGACCCGTGCCTCCATCTCCTAAGATCGACAGAGGCTGGGTCTGCGTGTTCCAGCTGCAAGATGGCAAGACCCTGGGCCTGAAGATCTGA [서열번호 49]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 49에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 개시(AUG) 및 종결(UGA) 코돈을 포함하는 서열번호 49의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 50으로 제공된다:
AUGACCACCAGGACCAAAGGCAGAGGACACACCGCCGCCACCACACAGAACGACAGAAUGCCUGGACCUGAGCUGAGCGGCUGGAUCUCUGAGCAGCUGAUGACAGGCAGAAUCCCCGUGUCCGACAUCUUCUGCGACAUCGAGAACAACCCCGGCCUGUGUUACGCCAGCCAGAUGCAGCAGACCAAGCCUAAUCCUAAGACACGGAACAGCCAGACACAGACAGACCCCAUCUGCAACCACAGCUUCGAGGAAGUGGUGCAGACACUGGCCAGCCUGGCUACAGUUGUGCAGCAGCAGACAAUCGCCAGCGAGAGCCUGGAACAGAGAAUCACCAGCCUGGAAAACGGCCUGAAGCCUGUGUACGACAUGGCCAAGACCAUCAGCUCCCUGAACAGAGUGUGCGCCGAGAUGGUGGCCAAAUACGACCUGCUCGUGAUGACCACCGGCAGAGCCACAGCUACAGCCGCUGCCACAGAAGCCUAUUGGGCCGAACAUGGACAGCCUCCACCUGGACCUAGCCUGUACGAGGAAUCUGCCAUCCGGGGCAAGAUCGAGAGCAGGGAUGAGACAGUGCCCCAGUCUGUGCGCGAGGCCUUCAACAACCUGAACAGCACCACAAGCCUGACCGAGGAAAACUUCGGCAAGCCCGACAUCAGCGCCAAGGACCUGCGGAACAUUAUGUACGACCAUCUGCCUGGCUUCGGCACCGCCUUCCAUCAGCUGGUGCAAGUGAUCUGCAAGCUGGGCAAAGACAGCAACAGCCUGGACAUCAUCCACGCCGAGUUUCAGGCCUCUCUGGCCGAAGGCGAUUCUCCUCAGUGUGCCCUGAUCCAGAUCACCAAGCGGGUGCCCAUCUUCCAGGAUGCUGCCCCUCCUGUGAUCCACAUCAGAAGCAGAGGCGACAUCCCCAGAGCCUGCCAGAAAUCUCUCAGACCCGUGCCUCCAUCUCCUAAGAUCGACAGAGGCUGGGUCUGCGUGUUCCAGCUGCAAGAUGGCAAGACCCUGGGCCUGAAGAUCUGA [서열번호 50]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 50에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
다른 구현예에서, 상기 적어도 하나의 IIP는 SARS-CoV-2 ORF3b(접근 번호 - NCBI 참조 서열: NC_045512.2) 또는 그의 동원체로부터 유래될 수 있다. 적어도 하나의 IIP가 유래될 수 있는 야생형 SARS-CoV-2 ORF3b 폴리펩티드 서열의 한 구현예는 본 명세서에서 서열번호 51로 나타낸다. 별표는 야생형 서열에서 종결 코돈을 나타내고, 이들 중 하나 이상은 상기 유래된 IIP에서 돌연변이될 수 있다. 서열번호 51은 다음과 같다:
MMPTIFFAGILIVTTIVYLTIV*LLQLSLLQVMAQQVLFLNMTTRLVVILKNGNLE*KTVLYYTVTSLQTITSCTQLN*VQTLVLNMLPSSSTIKLLMSLKNMSKFTQSTVHPELLIQ*WNQFMMNRRRLLACLCKHKLMSTNLCTHSFRKRQVR* [서열번호 51]
한 구현예에서, 상기 적어도 하나의 IIP는 야생형 SARS-CoV-2 ORF3b의 ORF3b*57 변이체, 또는 그의 동원체일 수 있다. 상기 SARS-CoV-2 ORF3b*57 변이체 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 52로 나타낸다:
MMPTIFFAGILIVTTIVYLTIVQLLQLSLLQVMAQQVLFLNMTTRLVVILKNGNLE [서열번호 52]
따라서, 바람직하게는 제1 측면의 RNA 구조체는 실질적으로 서열번호 52에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 SARS-CoV-2 ORF3b*57 변이체 폴리펩티드는 다음과 같은 서열번호 53의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGATGCCAACTATTTTCTTTGCTGGCATACTAATTGTTACGACTATTGTATACCTTACAATAGTGCAACTTCTTCAATTGTCATTACTTCAGGTGATGGCACAACAAGTCCTATTTCTGAACATGACTACCAGATTGGTGGTTATACTGAAAAATGGGAATCTGGAG [서열번호 53]
따라서, 바람직하게는 상기 SARS-CoV-2 ORF3b*57 변이체 폴리펩티드는 실질적으로 서열번호 53에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 상기 RNA 구조체는 다음과 같은 서열번호 54의 RNA 뉴클레오티드 서열을 포함할 수 있다:
AUGAUGCCAACUAUUUUCUUUGCUGGCAUACUAAUUGUUACGACUAUUGUAUACCUUACAAUAGUGCAACUUCUUCAAUUGUCAUUACUUCAGGUGAUGGCACAACAAGUCCUAUUUCUGAACAUGACUACCAGAUUGGUGGUUAUACUGAAAAAUGGGAAUCUGGAG [서열번호 54]
아울러, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 54에 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
따라서, 본 발명자들은 서열번호 52의 단백질 서열에 인간 발현을 위한 코돈 최적화를 하였고, 개시(ATG) 및 종결(TGA) 코돈을 포함하는 코돈 최적화된 핵산(DNA) 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 55로 제공된다:
ATGATGCCGACCATCTTCTTCGCCGGCATCCTGATCGTGACCACCATCGTGTACCTGACCATCGTGCAGCTGCTGCAGCTCAGCCTGCTGCAAGTGATGGCTCAGCAGGTCCTGTTCCTGAATATGACCACCAGACTGGTCGTGATCCTGAAGAACGGCAACCTGGAATGA [서열번호 55]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 55에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 개시(AUG) 및 종결(UGA) 코돈을 포함하는 서열번호 55의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 56으로 제공된다:
AUGAUGCCGACCAUCUUCUUCGCCGGCAUCCUGAUCGUGACCACCAUCGUGUACCUGACCAUCGUGCAGCUGCUGCAGCUCAGCCUGCUGCAAGUGAUGGCUCAGCAGGUCCUGUUCCUGAAUAUGACCACCAGACUGGUCGUGAUCCUGAAGAACGGCAACCUGGAAUGA [서열번호 56]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 56에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
다른 구현예에서, 상기 적어도 하나의 IIP는 야생형 SARS-CoV-2 ORF3b의 ORF3b*79 변이체, 또는 그의 동원체일 수 있다. 상기 SARS-CoV-2 ORF3b*79 변이체 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 57로 나타낸다:
MMPTIFFAGILIVTTIVYLTIVQLLQLSLLQVMAQQVLFLNMTTRLVVILKNGNLELKTVLYYTVTSLQTITSCTQLN [서열번호 57]
따라서, 바람직하게는 제1 측면의 RNA 구조체는 실질적으로 서열번호 57에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 SARS-CoV-2 ORF3b*79 변이체 폴리펩티드는 다음과 같은 서열번호 58의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGATGCCAACTATTTTCTTTGCTGGCATACTAATTGTTACGACTATTGTATACCTTACAATAGTGCAACTTCTTCAATTGTCATTACTTCAGGTGATGGCACAACAAGTCCTATTTCTGAACATGACTACCAGATTGGTGGTTATACTGAAAAATGGGAATCTGGAGTTAAAGACTGTGTTGTATTACACAGTTACTTCACTTCAGACTATTACCAGCTGTACTCAACTCAAT [서열번호 58]
따라서, 바람직하게는 상기 SARS-CoV-2 ORF3b*79 변이체 폴리펩티드는 실질적으로 서열번호 58에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 상기 RNA 구조체는 다음과 같은 서열번호 59의 RNA 뉴클레오티드 서열을 포함할 수 있다:
AUGAUGCCAACUAUUUUCUUUGCUGGCAUACUAAUUGUUACGACUAUUGUAUACCUUACAAUAGUGCAACUUCUUCAAUUGUCAUUACUUCAGGUGAUGGCACAACAAGUCCUAUUUCUGAACAUGACUACCAGAUUGGUGGUUAUACUGAAAAAUGGGAAUCUGGAGUUAAAGACUGUGUUGUAUUACACAGUUACUUCACUUCAGACUAUUACCAGCUGUACUCAACUCAAU [서열번호 59]
아울러, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 59에 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
따라서, 본 발명자들은 서열번호 57의 단백질 서열에 인간 발현을 위한 코돈 최적화를 하였고, 개시(ATG) 및 종결(TGA) 코돈을 포함하는 코돈 최적화된 핵산(DNA) 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 60으로 제공된다:
ATGATGCCGACCATCTTCTTCGCCGGCATCCTGATCGTGACCACCATCGTGTACCTGACCATCGTGCAGCTGCTGCAGCTCAGCCTGCTGCAAGTGATGGCTCAGCAGGTCCTGTTCCTGAATATGACCACCAGACTGGTCGTGATCCTGAAGAACGGCAACCTGGAACTGAAAACCGTGCTGTACTACACCGTGACCAGCCTGCAGACCATCACCAGCTGCACCCAGCTGAACTGA [서열번호 60]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 60에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 개시(AUG) 및 종결(UGA) 코돈을 포함하는 서열번호 60의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 61로 제공된다:
AUGAUGCCGACCAUCUUCUUCGCCGGCAUCCUGAUCGUGACCACCAUCGUGUACCUGACCAUCGUGCAGCUGCUGCAGCUCAGCCUGCUGCAAGUGAUGGCUCAGCAGGUCCUGUUCCUGAAUAUGACCACCAGACUGGUCGUGAUCCUGAAGAACGGCAACCUGGAACUGAAAACCGUGCUGUACUACACCGUGACCAGCCUGCAGACCAUCACCAGCUGCACCCAGCUGAACUGA [서열번호 61]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 61에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
또 다른 구현예에서, 상기 적어도 하나의 IIP는 야생형 SARS-CoV-2 ORF3b의 ORF3b*57 에콰도르 변이체, 또는 그의 동원체일 수 있다. 상기 SARS-CoV-2 ORF3b*57 에콰도르 변이체 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 62로 나타낸다:
MMPTIFFAGILIVTTIVYLTIVQMLQLSLLQVMAQQVLFLNMTTRLVVILKNGNLE [서열번호 62]
따라서, 바람직하게는 제1 측면의 RNA 구조체는 실질적으로 서열번호 62에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 SARS-CoV-2 ORF3b*57 에콰도르 변이체 폴리펩티드는 다음과 같은 서열번호 63의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGATGCCAACTATTTTCTTTGCTGGCATACTAATTGTTACGACTATTGTATACCTTACAATAGTGCAAATGCTTCAATTGTCATTACTTCAGGTGATGGCACAACAAGTCCTATTTCTGAACATGACTACCAGATTGGTGGTTATACTGAAAAATGGGAATCTGGAGTAA [서열번호 63]
따라서, 바람직하게는 상기 SARS-CoV-2 ORF3b*57 에콰도르 변이체 폴리펩티드는 서열번호 63에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 상기 RNA 구조체는 다음과 같은 서열번호 64의 RNA 뉴클레오티드 서열을 포함할 수 있다:
AUGAUGCCAACUAUUUUCUUUGCUGGCAUACUAAUUGUUACGACUAUUGUAUACCUUACAAUAGUGCAAAUGCUUCAAUUGUCAUUACUUCAGGUGAUGGCACAACAAGUCCUAUUUCUGAACAUGACUACCAGAUUGGUGGUUAUACUGAAAAAUGGGAAUCUGGAGUAA [서열번호 64]
아울러, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 64에 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
따라서, 본 발명자들은 서열번호 62의 단백질 서열에 인간 발현을 위한 코돈 최적화를 하였고, 개시(ATG) 및 종결(TGA) 코돈을 포함하는 코돈 최적화된 핵산(DNA) 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 65로 제공된다:
ATGATGCCGACCATCTTCTTCGCCGGCATCCTGATCGTGACCACCATCGTGTACCTGACCATCGTGCAGATGCTGCAGCTGAGCCTGCTGCAAGTGATGGCCCAGCAGGTCCTGTTCCTGAATATGACCACCAGACTGGTCGTGATCCTGAAGAACGGCAACCTGGAATGA [서열번호 65]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 65에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 개시(AUG) 및 종결(UGA) 코돈을 포함하는 서열번호 65의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 66으로 제공된다:
AUGAUGCCGACCAUCUUCUUCGCCGGCAUCCUGAUCGUGACCACCAUCGUGUACCUGACCAUCGUGCAGAUGCUGCAGCUGAGCCUGCUGCAAGUGAUGGCCCAGCAGGUCCUGUUCCUGAAUAUGACCACCAGACUGGUCGUGAUCCUGAAGAACGGCAACCUGGAAUGA [서열번호 66]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 66에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
다른 구현예에서, 상기 적어도 하나의 IIP는 MDA-5의 활성을 차단 또는 억제하는 바이러스 억제성 단백질일 수 있고, 다음으로 이루어진 군으로부터 선택된다:
(ⅰ) 파라믹소비리대 V 단백질; 임의적으로 SV5B, PIV2, 볼거리, SeV, 홍역, 또는 NiV;
(ⅱ) 뇌심근염 바이러스 2C;
(ⅲ) 버나바이러스(Birnavirus) VP3; 및
(ⅳ) 돼지 델타 코로나바이러스 NS6.
다른 구현예에서, 상기 적어도 하나의 IIP는 LASV; DANV; LCMV; LUJV; CHPV; MACV; GTOV; JUNV; 및 SABV;로 이루어진 군으로부터 선택되는 아레나바이러스(Arenavirus) Z 단백질일 수 있다. 상기 IIP는 RLR, RIG-I 및 MDA-5와 상호작용하고, 미토콘드리아 항-바이러스 신호전달(MAVS)과의 상호작용을 억제하는 것으로 여겨진다.
다른 구현예에서, 상기 적어도 하나의 IIP는 콕사키바이러스(Coxsackievirus) CV-A16 또는 CV-A6; EV D-68 또는 71; 및 폴리오바이러스(Poliovirus) HEV-C;로 이루어진 군으로부터 선택되는 3C 프로테아제(protease) 단백질일 수 있다. 상기 IIP는 MAVS와 MDA의 상호작용을 억제하는 것으로 여겨진다.
다른 구현예에서, 상기 적어도 하나의 IIP는 폴리오바이러스 HEV-C; CVB3; 및 EV71;로 이루어진 군으로부터 선택되는 2A 프로테아제 단백질일 수 있다. 상기 IIP는 MDA-5 및 MAVS의 절단에 의해 RLR 경로를 억제하는 것으로 여겨진다.
다른 구현예에서, 상기 적어도 하나의 IIP는 RIG-I를 분해하거나 여기에 작용하고, hMPV G; CVB3 3C 프로테아제; 폴리오 바이러스 3Cpro; C형 간염 NS3/4A; DENV NS3; EV71 3Cpro; FMDV Lpro 및 3Cpro; 토스카나 바이러스(Toscana virus) NSS; 인플루엔자(Influenza) A/PR/8/34 NS1; 및 MERS ORF8b;로 이루어진 군으로부터 선택되는 단백질일 수 있다. 상기 IIP는 RNA 구조체가 saRNA 또는 mRNA를 포함하는 구현예에서 바람직하다.
다른 구현예에서, 상기 적어도 하나의 IIP는 SARS CoV N 단백질; 및 MHV N;으로 이루어진 군으로부터 선택되는 PACT에 작용하는 단백질일 수 있다.
다른 구현예에서, 상기 적어도 하나의 IIP는, 예를 들면, FMDV Lpro, 3Cpro 및 2B를 포함하는 (MDA2 신호전달을 향상시키는) LGP2에 대해 작용하는 단백질일 수 있다.
다른 구현예에서, 상기 적어도 하나의 IIP는, 예를 들면, MERS CoV M을 포함하는 TRAF3의 활성에 영향을 미치는 단백질일 수 있다.
다른 구현예에서, 상기 적어도 하나의 IIP는 인플루엔자 바이러스 A PB1-F2; A형 간염 ABC; B형 간염 X; C형 간염 NS3/4A; SARS-CoV NSP15; SARS CoV ORF9 (96); 콕사키바이러스 B3 2Apro 및 3Cpro; 리노바이러스(Rhinovirus) 2Apro 및 3Cpro; 로타바이러스(Rotavirus) VP3; GB 바이러스 B NS3/4A; EV71 2Apro; HAV 3Cpro; 인간 메타뉴모바이러스(metapneumovirus) M2-2; 및 엔테로바이러스 EV71 2A;로 이루어진 군으로부터 선택되는 MAVS에 작용하는 단백질일 수 있다.
다른 구현예에서, 상기 적어도 하나의 IIP는 HCV 및 NSP1B; 에볼라 vNS3; HPV16 E6; E형 간염 메틸트랜스퍼라아제(methyltransferase); PRV Npro; HSV1 Us3; HSV2 Us1; CSFV Npro; BDV Npro; 소 RV NS1 및 NS2; B형 간염 바이러스 Orf3; PBoV NP1; E형 간염 ORF3; 및 MERS ORF8b;로 이루어진 군으로부터 선택되는 IRF-3 활성을 차단하는 단백질일 수 있다.
다른 구현예에서, 상기 적어도 하나의 IIP는 로타바이러스 NSP1; KSHV ORF45; EBV BZLF-1; 에볼라 VP35; 및 엔테로바이러스 71 및 68 3CPro;로 이루어진 군으로부터 선택되는 IRF7 활성을 억제하는 단백질일 수 있다.
다른 구현예에서, 상기 적어도 하나의 IIP는 폴리오 3C; FMDV Lpro; MERS CoV ORF4b(246aa); MuHV ORF73; 토크 테노 바이러스(Torque Teno virus) ORF2; EBV EBNA1; 및 SV5 및 hPIV2 V 단백질;로 이루어진 군으로부터 선택되는 NF-kβ 활성에 영향을 미치는 단백질일 수 있다.
다른 구현예에서, 상기 적어도 하나의 IIP는 TBK-1 또는 IKKε 활성에 영향을 미치고, BDV P; HPV E6 및 HPV E7; 아레나바이러스 NP1; HCV NS3 단백질; DENV1 NS4A; DENV1, 2 및 4 NS2A 및 NS2B; WNV NS4A; 에볼라 VP35; 광견병 바이러스 PP; PEDV N 단백질; 및 HSV1 ICP27 및 VP24;로 이루어진 군으로부터 선택되는 단백질일 수 있다.
다른 구현예에서, 상기 적어도 하나의 IIP는, 예를 들면, 뮤린(murine) CTMV M45과 같은 NEMO의 활성에 영향을 미치는 단백질일 수 있다.
다음의 바이러스 IIP는 MDA-5의 활성화를 차단 또는 억제하는 것으로 여겨진다.
상기 V 단백질은 MDA-5의 헬리카아제 도메인(helicase domain)에 결합하고, dsRNA 결합 및 결과적인 자가-연합(self-association)을 억제함으로써 그 활성화를 차단한다. [Childs KS, Andresjeva J, Randall RE & Goobourn S (2009) Mechanism of MDA-5 inhibition by paramyxovirus V proteins. J Virol 83, 3, 1465-1473]. 한 구현예에서, 상기 적어도 하나의 IIP는 SV5B, 또는 그의 동원체이다. 원숭이 바이러스 5의 폴리펩티드 서열(PIV5 비-구조 단백질 V)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 95로 나타낸다:
MDPTDLSFSPDEINKLIETGLNTVEYFTSQQVTGTSSLGKNTIPPGVTGLLTNAAEAKIQESTNHQKGSVGGGAKPKKPRPKIAIVPADDKTVPGKPIPNPLLGLDSTPSTQTVLDLSGKTLPSGSYKGVKLAKFGKENLMTRFIEEPRENPIATSSPIDFKRGRDTGGFHRREYSIGWVGDEVKVTEWCNPSCSPITAAARRFECTCHQCPVTCSECERDT [서열번호 95]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 95에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 SV5B 폴리펩티드는 다음과 같은 서열번호 96의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGATCCCACTGATCTGAGCTTCTCCCCAGATGAGATCAATAAGCTCATAGAGACAGGCCTGAATACTGTAGAGTATTTTACTTCCCAACAAGTCACAGGAACATCCTCTCTTGGAAAGAATACAATACCACCAGGGGTCACAGGACTACTAACCAATGCTGCAGAGGCAAAGATCCAAGAGTCAACTAACCATCAGAAGGGCTCAGTTGGTGGGGGTGCAAAACCAAAGAAACCGCGACCAAAAATTGCCATTGTGCCAGCAGATGACAAAACAGTGCCCGGAAAGCCGATCCCAAACCCTCTATTAGGTCTGGACTCCACCCCGAGCACCCAAACTGTGCTTGATCTAAGTGGGAAAACATTACCATCAGGATCCTATAAGGGGGTTAAGCTTGCGAAATTTGGAAAAGAAAATCTGATGACACGGTTCATCGAGGAACCCAGAGAGAATCCTATCGCAACCAGTTCCCCCATCGATTTTAAGAGGGGCAGGGATACCGGCGGGTTCCATAGAAGGGAGTACTCAATCGGATGGGTGGGAGATGAAGTCAAGGTCACTGAGTGGTGCAATCCATCCTGTTCTCCAATCACCGCTGCAGCAAGGCGATTTGAATGCACTTGTCACCAGTGTCCAGTCACTTGCTCTGAATGTGAACGAGATACT [서열번호 96]
따라서, 바람직하게는 상기 SV5B 폴리펩티드는 실질적으로 서열번호 96에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 SV5B 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 97로 제공된다:
ATGGACCCTACCGACCTGAGCTTCAGCCCCGACGAGATCAACAAGCTGATCGAGACAGGCCTGAACACCGTGGAATACTTCACCAGCCAGCAAGTGACCGGCACAAGCAGCCTGGGCAAGAACACAATTCCTCCAGGCGTGACCGGCCTGCTGACAAATGCTGCCGAGGCCAAGATCCAAGAGAGCACCAACCACCAGAAGGGCTCTGTTGGAGGCGGAGCCAAGCCTAAGAAGCCCAGACCTAAGATCGCCATCGTGCCCGCCGACGATAAGACAGTGCCTGGCAAGCCCATTCCTAATCCTCTGCTGGGCCTCGACAGCACCCCTAGCACACAGACAGTGCTGGATCTGAGCGGCAAGACACTGCCTAGCGGCAGCTATAAGGGCGTGAAGCTGGCCAAGTTCGGCAAAGAAAACCTGATGACCCGGTTCATCGAGGAACCCAGAGAGAACCCTATCGCCACCAGCTCTCCCATCGACTTCAAGAGAGGCAGAGACACCGGCGGCTTCCACAGAAGAGAGTACAGCATTGGCTGGGTCGGAGATGAAGTGAAAGTGACCGAGTGGTGCAACCCCAGCTGCAGCCCTATTACAGCCGCCGCTAGAAGATTCGAGTGCACCTGTCACCAGTGTCCTGTGACCTGTAGCGAGTGCGAGAGAGACACA [서열번호 97]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 97에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 97의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 98로 제공된다:
AUGGACCCUACCGACCUGAGCUUCAGCCCCGACGAGAUCAACAAGCUGAUCGAGACAGGCCUGAACACCGUGGAAUACUUCACCAGCCAGCAAGUGACCGGCACAAGCAGCCUGGGCAAGAACACAAUUCCUCCAGGCGUGACCGGCCUGCUGACAAAUGCUGCCGAGGCCAAGAUCCAAGAGAGCACCAACCACCAGAAGGGCUCUGUUGGAGGCGGAGCCAAGCCUAAGAAGCCCAGACCUAAGAUCGCCAUCGUGCCCGCCGACGAUAAGACAGUGCCUGGCAAGCCCAUUCCUAAUCCUCUGCUGGGCCUCGACAGCACCCCUAGCACACAGACAGUGCUGGAUCUGAGCGGCAAGACACUGCCUAGCGGCAGCUAUAAGGGCGUGAAGCUGGCCAAGUUCGGCAAAGAAAACCUGAUGACCCGGUUCAUCGAGGAACCCAGAGAGAACCCUAUCGCCACCAGCUCUCCCAUCGACUUCAAGAGAGGCAGAGACACCGGCGGCUUCCACAGAAGAGAGUACAGCAUUGGCUGGGUCGGAGAUGAAGUGAAAGUGACCGAGUGGUGCAACCCCAGCUGCAGCCCUAUUACAGCCGCCGCUAGAAGAUUCGAGUGCACCUGUCACCAGUGUCCUGUGACCUGUAGCGAGUGCGAGAGAGACACA [서열번호 98]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 98에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 PIV2 비-구조 단백질 V(P19847), 또는 그의 동원체이다. PIV2의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 99로 나타낸다:
MAEEPTYTTEQVDELIHAGLGTVDFFLSRPIDAQSSLGKGSIPPGVTAVLTSAAEAKSKPVAAGPVKPRRKKVISNTTPYTIADNIPPEKLPINTPIPNPLLPLARPHGKMTDIDIVTGNITEGSYKGVELAKLGKQTLLTRFTSNEPVSSAGSAQDPNFKRGGANRERARGNHRREWSIAWVGDQVKVFEWCNPRCAPVTASARKFTCTCGSCPSICGECEGDH [서열번호 99]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 99에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 PIV2 폴리펩티드는 다음과 같은 서열번호 100의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGCCGAGGAACCAACATACACCACTGAGCAAGTTGATGAATTAATCCATGCTGGACTGGGAACAGTAGATTTCTTCCTATCTAGACCCATAGATGCTCAGTCTTCTTTAGGCAAAGGCAGCATCCCACCAGGTGTCACAGCTGTTCTAACTAGTGCAGCGGAGGCAAAATCCAAACCAGTTGCTGCTGGTCCAGTTAAACCCAGGCGGAAGAAAGTGATCAGCAATACTACTCCATACACTATTGCAGACAATATTCCACCTGAGAAGCTACCGATCAACACTCCAATACCCAATCCATTACTTCCACTGGCACGCCCTCACGGAAAGATGACAGACATTGACATTGTCACTGGGAACATTACAGAAGGATCGTACAAAGGTGTGGAGCTTGCTAAATTAGGGAAGCAGACACTACTCACAAGGTTCACCTCGAATGAGCCAGTCTCCTCAGCTGGATCCGCCCAAGACCCCAACTTTAAGAGGGGGGGAGCTAATAGAGAAAGAGCAAGAGGCAACCATAGGAGAGAATGGAGTATTGCATGGGTCGGAGATCAGGTCAAAGTCTTCGAGTGGTGTAATCCCAGGTGTGCCCCAGTCACGGCCTCAGCTCGCAAGTTCACCTGCACATGCGGATCCTGCCCCAGCATCTGCGGAGAATGTGAAGGAGATCAT [서열번호 100]
따라서, 바람직하게는 상기 PIV2 폴리펩티드는 실질적으로 서열번호 100에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 PIV2 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 101로 제공된다:
ATGGCCGAGGAACCTACCTACACCACCGAACAGGTGGACGAGCTGATTCACGCCGGACTGGGAACCGTGGACTTCTTTCTGTCCCGGCCTATCGATGCCCAGAGCAGCCTCGGCAAGGGATCTATTCCTCCTGGCGTGACAGCCGTGCTGACATCTGCCGCCGAGGCCAAGTCTAAACCTGTGGCTGCTGGACCCGTGAAGCCCAGACGGAAGAAAGTGATCAGCAACACCACACCTTACACGATCGCCGACAACATCCCTCCTGAGAAGCTGCCCATCAACACCCCTATTCCTAATCCTCTGCTGCCCCTGGCCAGACCTCACGGCAAGATGACCGACATCGATATCGTGACCGGCAACATCACCGAGGGCAGCTACAAAGGCGTGGAACTGGCCAAGCTGGGCAAGCAGACACTGCTGACCAGATTCACCAGCAACGAGCCTGTGTCTAGCGCCGGCTCTGCCCAGGATCCTAACTTCAAAAGAGGCGGAGCCAACAGAGAGAGAGCCAGAGGCAACCATCGGAGAGAGTGGTCTATTGCCTGGGTCGGAGATCAAGTGAAGGTGTTCGAGTGGTGCAACCCCAGATGTGCCCCTGTGACAGCCAGCGCCAGAAAGTTCACCTGTACCTGCGGCAGCTGTCCCAGCATTTGCGGAGAGTGTGAAGGCGACCAT [서열번호 101]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 101에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 101의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 102로 제공된다:
AUGGCCGAGGAACCUACCUACACCACCGAACAGGUGGACGAGCUGAUUCACGCCGGACUGGGAACCGUGGACUUCUUUCUGUCCCGGCCUAUCGAUGCCCAGAGCAGCCUCGGCAAGGGAUCUAUUCCUCCUGGCGUGACAGCCGUGCUGACAUCUGCCGCCGAGGCCAAGUCUAAACCUGUGGCUGCUGGACCCGUGAAGCCCAGACGGAAGAAAGUGAUCAGCAACACCACACCUUACACGAUCGCCGACAACAUCCCUCCUGAGAAGCUGCCCAUCAACACCCCUAUUCCUAAUCCUCUGCUGCCCCUGGCCAGACCUCACGGCAAGAUGACCGACAUCGAUAUCGUGACCGGCAACAUCACCGAGGGCAGCUACAAAGGCGUGGAACUGGCCAAGCUGGGCAAGCAGACACUGCUGACCAGAUUCACCAGCAACGAGCCUGUGUCUAGCGCCGGCUCUGCCCAGGAUCCUAACUUCAAAAGAGGCGGAGCCAACAGAGAGAGAGCCAGAGGCAACCAUCGGAGAGAGUGGUCUAUUGCCUGGGUCGGAGAUCAAGUGAAGGUGUUCGAGUGGUGCAACCCCAGAUGUGCCCCUGUGACAGCCAGCGCCAGAAAGUUCACCUGUACCUGCGGCAGCUGUCCCAGCAUUUGCGGAGAGUGUGAAGGCGACCAU [서열번호 102]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 102에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 볼거리(Mumps) 비-구조 단백질 V(P30928), 또는 그의 동원체이다. 볼거리 V 단백질의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 103으로 나타낸다:
MDQFIKQDETGDLIETGMNVANHFLSAPIQGTNSLSKATIIPGVAPVLIGNPEQKNIQYPTTSHQGSKSKGRGSGARPIIVSSSEGGTGGTQVPEPLFAQTGQGGIVTTVYQDPTIQPTGSYRSVELAKIGKERMINRFVEKPRTSTPVTEFKRGAGSGCSRPDNPRGGHRREWSLSWVQGEVRVFEWCNPICSPITAAARFHSCKCGNCPAKCDQCERDYGPP [서열번호 103]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 103에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 볼거리 V 폴리펩티드는 다음과 같은 서열번호 104의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGACCAATTTATAAAACAAGATGAGACTGGTGATTTAATTGAGACAGGAATGAACGTTGCAAATCATTTCCTATCCGCCCCCATTCAGGGAACCAACTCGTTGAGCAAGGCCACAATCATCCCTGGCGTTGCACCAGTACTCATTGGCAATCCAGAGCAAAAGAACATTCAGTACCCCACCACATCACATCAGGGATCCAAGTCAAAGGGCAGAGGCTCAGGGGCCAGGCCCATCATAGTCTCATCCTCCGAAGGAGGCACTGGAGGGACTCAGGTTCCTGAGCCCCTTTTCGCACAAACAGGACAAGGTGGCATTGTCACCACCGTTTATCAGGATCCAACTATCCAACCAACAGGTTCATATCGAAGTGTGGAATTGGCTAAGATAGGAAAAGAGAGAATGATTAATCGATTTGTTGAAAAACCAAGAACCTCAACGCCGGTAACAGAATTTAAGAGGGGGGCCGGGAGCGGCTGCTCAAGGCCAGACAATCCAAGAGGAGGGCATAGACGGGAATGGAGCCTCAGCTGGGTCCAAGGAGAGGTCCGGGTCTTTGAGTGGTGCAACCCCATATGCTCACCTATCACTGCCGCAGCAAGATTCCACTCCTGCAAATGTGGGAATTGCCCCGCAAAGTGCGATCAGTGCGAACGAGATTATGGACCTCCT [서열번호 104]
따라서, 바람직하게는 상기 볼거리 V 폴리펩티드는 실질적으로 서열번호 104에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 볼거리 V 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 105로 제공된다:
ATGGACCAGTTCATCAAGCAGGACGAGACAGGCGACCTGATCGAAACCGGCATGAACGTGGCCAACCACTTCCTGTCTGCCCCTATCCAGGGCACCAACAGCCTGAGCAAGGCCACAATTATCCCTGGCGTGGCCCCTGTGCTGATCGGCAATCCTGAGCAGAAGAACATTCAGTACCCCACCACCAGCCACCAGGGCAGCAAGTCTAAAGGCAGAGGCTCTGGCGCTCGGCCCATCATCGTTTCTAGTAGCGAAGGCGGCACCGGCGGAACACAGGTTCCAGAACCTCTGTTTGCCCAGACAGGCCAAGGCGGCATCGTGACCACAGTGTACCAGGATCCTACCATCCAGCCTACCGGCAGCTACAGAAGCGTGGAACTGGCCAAGATCGGCAAAGAACGGATGATCAACCGCTTCGTGGAAAAGCCCAGAACCAGCACACCCGTGACCGAGTTCAAAAGAGGCGCCGGAAGCGGCTGCAGCAGACCCGATAATCCTAGAGGCGGCCATCGGAGAGAGTGGTCCCTGTCTTGGGTTCAGGGCGAAGTGCGGGTGTTCGAGTGGTGCAATCCTATCTGCAGCCCCATCACAGCCGCCGCTAGATTCCACAGCTGCAAGTGCGGAAACTGCCCCGCCAAGTGTGACCAGTGCGAGAGAGATTACGGCCCTCCT [서열번호 105]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 105에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 105의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 106으로 제공된다:
AUGGACCAGUUCAUCAAGCAGGACGAGACAGGCGACCUGAUCGAAACCGGCAUGAACGUGGCCAACCACUUCCUGUCUGCCCCUAUCCAGGGCACCAACAGCCUGAGCAAGGCCACAAUUAUCCCUGGCGUGGCCCCUGUGCUGAUCGGCAAUCCUGAGCAGAAGAACAUUCAGUACCCCACCACCAGCCACCAGGGCAGCAAGUCUAAAGGCAGAGGCUCUGGCGCUCGGCCCAUCAUCGUUUCUAGUAGCGAAGGCGGCACCGGCGGAACACAGGUUCCAGAACCUCUGUUUGCCCAGACAGGCCAAGGCGGCAUCGUGACCACAGUGUACCAGGAUCCUACCAUCCAGCCUACCGGCAGCUACAGAAGCGUGGAACUGGCCAAGAUCGGCAAAGAACGGAUGAUCAACCGCUUCGUGGAAAAGCCCAGAACCAGCACACCCGUGACCGAGUUCAAAAGAGGCGCCGGAAGCGGCUGCAGCAGACCCGAUAAUCCUAGAGGCGGCCAUCGGAGAGAGUGGUCCCUGUCUUGGGUUCAGGGCGAAGUGCGGGUGUUCGAGUGGUGCAAUCCUAUCUGCAGCCCCAUCACAGCCGCCGCUAGAUUCCACAGCUGCAAGUGCGGAAACUGCCCCGCCAAGUGUGACCAGUGCGAGAGAGAUUACGGCCCUCCU [서열번호 106]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 106에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP 센다이 바이러스(Sendai virus) 단백질 V(Fushimi 바이러스주)(P69284), 또는 그의 동원체이다. 센다이 바이러스 단백질 V(SeV V 단백질)의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 107로 나타낸다:
MDQDAFILKEDSEVEREAPGGRESLSDVIGFLDAVLSSEPTDIGGDRSWLHNTINTPQGPGSAHRAKSEGEGEVSTPSTQDNRSGEESRVSGRTSKPEAEAHAGNLDKQNIHRAFGGRTGTNSVSQDLGDGGDSGILENPPNERGYPRSGIEDENREMAAHPDKRGEDQAEGLPEEVRGGTSLPDEGEGGASNNGRSMEPGSSHSARVTGVLVIPSPELEEAVLRRNKRRPTNSGSKPLTPATVPGTRSPPLNRYNSTGSPPGKPPSTQDEHINSGDTPAVRVKDRKPPIGTRSVSDCPANGRPIHPGLETDSTKKGHRREHIIYERDGYIVDESWCNPVCSRIRVIPRRELCVCKTCPKVCKLCRDDIQCMRPDPFCREIFRS [서열번호 107]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 107에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 SeV V 폴리펩티드는 다음과 같은 서열번호 108의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGATCAAGATGCCTTCATTCTTAAAGAAGATTCTGAAGTTGAGAGGGAGGCGCCAGGAGGAAGAGAGTCGCTCTCGGATGTTATCGGATTCCTCGATGCTGTCCTGTCGAGTGAACCAACTGACATCGGAGGGGACAGAAGCTGGCTCCACAACACCATCAACACTCCCCAAGGACCAGGCTCTGCCCATAGAGCCAAAAGTGAGGGCGAAGGAGAAGTCTCAACACCGTCGACCCAAGATAATCGATCAGGTGAGGAGAGTAGAGTCTCTGGGAGAACAAGCAAGCCAGAGGCAGAAGCACATGCTGGAAACCTTGATAAACAAAATATACACCGGGCCTTTGGGGGAAGAACTGGTACAAACTCTGTATCTCAGGATCTGGGCGATGGAGGAGACTCCGGAATCCTTGAAAATCCCCCAAATGAGAGAGGATATCCGAGATCAGGTATTGAAGATGAAAACAGAGAGATGGCTGCGCACCCTGATAAGAGGGGAGAAGACCAAGCTGAAGGACTTCCAGAAGAGGTACGAGGAGGTACATCCCTACCTGATGAAGGAGAAGGTGGAGCAAGTAATAATGGAAGAAGCATGGAGCCTGGCAGCTCACATAGTGCAAGAGTAACTGGGGTCCTGGTGATTCCTAGCCCCGAACTCGAAGAGGCTGTGCTACGGAGGAACAAAAGAAGACCTACCAACAGTGGGTCCAAACCTCTTACTCCAGCAACCGTGCCTGGCACCCGGTCCCCACCGCTGAATCGTTACAACAGCACAGGGTCACCACCAGGAAAACCCCCATCTACACAGGATGAGCACATCAACTCTGGGGACACCCCCGCCGTCAGGGTCAAAGACCGGAAACCACCAATAGGGACCCGCTCTGTCTCAGATTGTCCAGCCAACGGCCGCCCAATCCACCCGGGTCTAGAGACCGACTCAACAAAAAAGGGgCATAGGAGAGAACACATCATCTATGAAAGAGATGGCTACATTGTTGACGAGTCTTGGTGTAATCCAGTCTGCTCAAGAATTCGAGTCATCCCGAGACGCGAGTTATGTGTTTGCAAGACGTGCCCTAAAGTCTGCAAACTATGCAGAGATGACATTCAATGTATGCGGCCTGATCCTTTCTGCCGAGAAATCTTCCGCTCG [서열번호 108]
따라서, 바람직하게는 상기 SeV V 폴리펩티드는 실질적으로 서열번호 108에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 SeV V 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 109로 제공된다:
ATGGACCAGGACGCCTTCATCCTGAAAGAGGACAGCGAGGTCGAGAGAGAAGCCCCTGGCGGAAGAGAAAGCCTGTCCGATGTGATCGGCTTCCTGGATGCCGTGCTGAGCAGCGAGCCTACAGATATCGGCGGCGATAGAAGCTGGCTGCACAACACCATCAACACCCCTCAAGGCCCTGGCTCTGCCCACAGAGCTAAGTCTGAAGGCGAGGGCGAAGTGTCTACCCCTAGCACACAGGACAACAGAAGCGGCGAGGAATCCAGAGTGTCCGGCAGAACAAGCAAGCCTGAGGCCGAAGCTCACGCCGGCAATCTGGACAAGCAGAACATCCACAGAGCCTTCGGCGGCAGAACCGGCACAAATAGCGTGTCACAGGACCTCGGAGATGGCGGCGATTCTGGCATCCTGGAAAACCCTCCAAACGAGCGGGGCTACCCTAGAAGCGGAATCGAGGACGAGAACAGAGAGATGGCCGCTCATCCCGACAAGAGAGGCGAAGATCAGGCCGAGGGACTGCCTGAAGAAGTGCGCGGAGGAACAAGCCTGCCTGACGAAGGCGAAGGCGGAGCCTCTAACAACGGCAGATCTATGGAACCCGGCAGCAGCCATAGCGCCAGAGTTACAGGCGTGCTGGTCATCCCATCTCCAGAGCTGGAAGAGGCTGTGCTGAGGCGGAACAAGAGAAGGCCTACCAACAGCGGCAGCAAGCCTCTGACACCAGCTACAGTGCCTGGCACAAGAAGCCCTCCACTGAACCGGTACAACAGCACAGGCTCTCCACCTGGCAAGCCTCCATCCACACAGGATGAGCACATCAACTCCGGCGATACCCCTGCCGTCAGAGTGAAGGACAGAAAGCCTCCTATCGGCACCAGAAGCGTGTCCGACTGTCCTGCCAATGGCAGACCTATTCACCCCGGCCTGGAAACCGACAGCACCAAGAAGGGACACAGACGGGAACACATCATCTACGAGCGCGACGGCTACATCGTGGACGAGAGCTGGTGCAACCCTGTGTGCAGCCGGATCAGAGTGATCCCTCGGAGAGAACTGTGCGTGTGCAAGACATGCCCCAAAGTGTGCAAGCTGTGCCGGGACGACATCCAGTGTATGCGGCCCGATCCTTTCTGCAGAGAGATCTTCAGAAGC [서열번호 109]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 109에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 109의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 110으로 제공된다:
AUGGACCAGGACGCCUUCAUCCUGAAAGAGGACAGCGAGGUCGAGAGAGAAGCCCCUGGCGGAAGAGAAAGCCUGUCCGAUGUGAUCGGCUUCCUGGAUGCCGUGCUGAGCAGCGAGCCUACAGAUAUCGGCGGCGAUAGAAGCUGGCUGCACAACACCAUCAACACCCCUCAAGGCCCUGGCUCUGCCCACAGAGCUAAGUCUGAAGGCGAGGGCGAAGUGUCUACCCCUAGCACACAGGACAACAGAAGCGGCGAGGAAUCCAGAGUGUCCGGCAGAACAAGCAAGCCUGAGGCCGAAGCUCACGCCGGCAAUCUGGACAAGCAGAACAUCCACAGAGCCUUCGGCGGCAGAACCGGCACAAAUAGCGUGUCACAGGACCUCGGAGAUGGCGGCGAUUCUGGCAUCCUGGAAAACCCUCCAAACGAGCGGGGCUACCCUAGAAGCGGAAUCGAGGACGAGAACAGAGAGAUGGCCGCUCAUCCCGACAAGAGAGGCGAAGAUCAGGCCGAGGGACUGCCUGAAGAAGUGCGCGGAGGAACAAGCCUGCCUGACGAAGGCGAAGGCGGAGCCUCUAACAACGGCAGAUCUAUGGAACCCGGCAGCAGCCAUAGCGCCAGAGUUACAGGCGUGCUGGUCAUCCCAUCUCCAGAGCUGGAAGAGGCUGUGCUGAGGCGGAACAAGAGAAGGCCUACCAACAGCGGCAGCAAGCCUCUGACACCAGCUACAGUGCCUGGCACAAGAAGCCCUCCACUGAACCGGUACAACAGCACAGGCUCUCCACCUGGCAAGCCUCCAUCCACACAGGAUGAGCACAUCAACUCCGGCGAUACCCCUGCCGUCAGAGUGAAGGACAGAAAGCCUCCUAUCGGCACCAGAAGCGUGUCCGACUGUCCUGCCAAUGGCAGACCUAUUCACCCCGGCCUGGAAACCGACAGCACCAAGAAGGGACACAGACGGGAACACAUCAUCUACGAGCGCGACGGCUACAUCGUGGACGAGAGCUGGUGCAACCCUGUGUGCAGCCGGAUCAGAGUGAUCCCUCGGAGAGAACUGUGCGUGUGCAAGACAUGCCCCAAAGUGUGCAAGCUGUGCCGGGACGACAUCCAGUGUAUGCGGCCCGAUCCUUUCUGCAGAGAGAUCUUCAGAAGC [서열번호 110]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 110에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 홍역 비-구조 단백질 V(Ichinose-B95a 바이러스주)(P0C774), 또는 그의 동원체이다. 홍역 V 단백질의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 111로 나타낸다:
MAEEQARHVKNGLECIRALKAEPIGSLAVEEAMAAWSEISDNPGQDRATCKEEEAGSSGLSKPCLSAIGSTEGGAPRIRGQGSGESDDDAETLGIPSRNLQASSTGLQCYHVYDHSGEAVKGIQDADSIMVQSGLDGDSTLSGGDDESENSDVDIGEPDTEGYAITDRGSAPISMGFRASDVETAEGGEIHELLKLQSRGNNFPKLGKTLNVPPPPNPSRASTSETPIKKGHRREIGLIWNGDRVFIDRWCNPMCSKVTLGTIRARCTCGECPRVCEQCRTDTGVDTRIWYHNLPEIPE [서열번호 111]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 111에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 홍역 V 폴리펩티드는 다음과 같은 서열번호 112의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGCAGAAGAGCAGGCACGCCATGTCAAAAACGGACTGGAATGCATCCGGGCTCTCAAGGCCGAGCCCATCGGCTCACTGGCCGTCGAGGAAGCCATGGCAGCATGGTCAGAAATATCAGACAACCCAGGACAGGACCGAGCCACCTGCAAGGAAGAGGAGGCAGGCAGTTCGGGTCTCAGCAAACCATGCCTCTCAGCAATTGGATCAACTGAAGGCGGTGCACCTCGCATCCGCGGTCAGGGATCTGGAGAAAGCGATGACGACGCTGAAACTTTGGGAATCCCCTCAAGAAATCTCCAGGCATCAAGCACTGGGTTACAGTGTTATCATGTTTATGATCACAGCGGTGAAGCGGTTAAGGGAATCCAAGATGCTGACTCTATCATGGTTCAATCAGGCCTTGATGGTGATAGCACCCTCTCAGGAGGAGACGATGAATCTGAAAACAGCGATGTGGATATTGGCGAACCTGATACCGAGGGATATGCTATCACTGACCGGGGATCTGCTCCCATCTCTATGGGGTTCAGGGCTTCTGATGTTGAAACTGCAGAAGGAGGGGAGATCCACGAGCTCCTGAAACTCCAATCCAGAGGCAACAACTTTCCGAAGCTTGGGAAAACTCTCAATGTTCCTCCGCCCCCGAACCCCAGTAGGGCCAGCACTTCCGAGACACCCATTAAAAAGGGgCACAGACGCGAGATTGGCCTCATTTGGAACGGAGATCGCGTCTTTATTGACAGGTGGTGCAACCCAATGTGCTCGAAAGTCACCCTCGGAACCATCAGGGCCAGGTGCACCTGCGGGGAATGTCCCCGAGTGTGTGAGCAATGCCGCACTGATACAGGAGTGGACACCCGAATCTGGTACCACAATCTCCCCGAGATCCCAGAA [서열번호 112]
따라서, 바람직하게는 상기 홍역 V 폴리펩티드는 실질적으로 서열번호 112에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 홍역 V 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 113으로 제공된다:
ATGGCCGAAGAACAGGCCAGACACGTGAAGAACGGCCTGGAATGCATCAGAGCCCTGAAGGCCGAGCCTATCGGATCTCTGGCTGTGGAAGAAGCCATGGCCGCTTGGAGCGAGATCAGCGATAATCCCGGCCAGGACCGGGCCACCTGTAAAGAAGAAGAGGCCGGATCTAGCGGCCTGAGCAAGCCTTGTCTGTCTGCCATCGGCTCTACAGAAGGCGGCGCTCCTAGAATCAGAGGCCAAGGATCTGGCGAGAGCGACGACGATGCTGAGACACTGGGCATCCCCAGCAGAAATCTGCAGGCCAGCTCTACCGGCCTGCAGTGCTATCACGTGTACGATCACTCTGGCGAGGCCGTGAAGGGAATCCAGGATGCCGATAGCATCATGGTGCAGAGCGGCCTGGATGGCGACTCTACACTTAGCGGCGGAGATGACGAGAGCGAGAACTCCGATGTGGACATCGGCGAGCCTGATACAGAGGGCTACGCCATCACAGACAGAGGCAGCGCCCCTATCAGCATGGGCTTTAGAGCCAGCGACGTGGAAACAGCCGAAGGCGGAGAGATTCACGAGCTGCTGAAGCTGCAGAGCCGGGGCAACAACTTTCCCAAGCTGGGCAAGACCCTGAACGTGCCACCTCCTCCAAATCCTAGCAGAGCCAGCACCAGCGAGACACCCATCAAGAAGGGCCACAGAAGAGAGATCGGCCTGATCTGGAACGGCGACCGGGTGTTCATCGACAGATGGTGCAACCCCATGTGCAGCAAAGTGACCCTGGGCACCATCCGGGCCAGATGTACATGCGGAGAGTGCCCTAGAGTGTGCGAGCAGTGCAGAACCGATACCGGCGTGGACACCCGGATCTGGTATCACAACCTGCCTGAGATCCCCGAG [서열번호 113]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 113에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 113의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 114로 제공된다:
AUGGCCGAAGAACAGGCCAGACACGUGAAGAACGGCCUGGAAUGCAUCAGAGCCCUGAAGGCCGAGCCUAUCGGAUCUCUGGCUGUGGAAGAAGCCAUGGCCGCUUGGAGCGAGAUCAGCGAUAAUCCCGGCCAGGACCGGGCCACCUGUAAAGAAGAAGAGGCCGGAUCUAGCGGCCUGAGCAAGCCUUGUCUGUCUGCCAUCGGCUCUACAGAAGGCGGCGCUCCUAGAAUCAGAGGCCAAGGAUCUGGCGAGAGCGACGACGAUGCUGAGACACUGGGCAUCCCCAGCAGAAAUCUGCAGGCCAGCUCUACCGGCCUGCAGUGCUAUCACGUGUACGAUCACUCUGGCGAGGCCGUGAAGGGAAUCCAGGAUGCCGAUAGCAUCAUGGUGCAGAGCGGCCUGGAUGGCGACUCUACACUUAGCGGCGGAGAUGACGAGAGCGAGAACUCCGAUGUGGACAUCGGCGAGCCUGAUACAGAGGGCUACGCCAUCACAGACAGAGGCAGCGCCCCUAUCAGCAUGGGCUUUAGAGCCAGCGACGUGGAAACAGCCGAAGGCGGAGAGAUUCACGAGCUGCUGAAGCUGCAGAGCCGGGGCAACAACUUUCCCAAGCUGGGCAAGACCCUGAACGUGCCACCUCCUCCAAAUCCUAGCAGAGCCAGCACCAGCGAGACACCCAUCAAGAAGGGCCACAGAAGAGAGAUCGGCCUGAUCUGGAACGGCGACCGGGUGUUCAUCGACAGAUGGUGCAACCCCAUGUGCAGCAAAGUGACCCUGGGCACCAUCCGGGCCAGAUGUACAUGCGGAGAGUGCCCUAGAGUGUGCGAGCAGUGCAGAACCGAUACCGGCGUGGACACCCGGAUCUGGUAUCACAACCUGCCUGAGAUCCCCGAG [서열번호 114]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 114에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 니파 바이러스(Nipah virus) 비-구조 단백질 V(NiV V 단백질)(Q997F2; V_NIPAV), 또는 그의 동원체이다. NiV V 단백질의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 115로 나타낸다:
MDKLELVNDGLNIIDFIQKNQKEIQKTYGRSSIQQPSIKDQTKAWEDFLQCTSGESEQVEGGMSKDDGDVERRNLEDLSSTSPTDGTIGKRVSNTRDWAEGSDDIQLDPVVTDVVYHDHGGECTGYGFTSSPERGWSDYTSGANNGNVCLVSDAKMLSYAPEIAVSKEDRETDLVHLENKLSTTGLNPTAVPFTLRNLSDPAKDSPVIAEHYYGLGVKEQNVGPQTSRNVNLDSIKLYTSDDEEADQLEFEDEFAGSSSEVIVGISPEDEEPSSVGGKPNESIGRTIEGQSIRDNLQAKDNKSTDVPGAGPKDSAVKEEPPQKRLPMLAEEFECSGSEDPIIRELLKENSLINCQQGKDAQPPYHWSIERSISPDKTEIVNGAVQTADRQRPGTPMPKSRGIPIKKGHRREISICWDGKRAWVEEWCNPACSRITPLPRRQECQCGECPTECFHCG [서열번호 115]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 115에 나타낸 것과 같은 아미노산 서열을 암호화하는 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
한 구현예에서, 상기 NiV V 폴리펩티드는 다음과 같은 서열번호 116의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGATAAATTGGAACTAGTCAATGATGGCCTCAATATTATTGACTTTATTCAGAAGAACCAAAAAGAAATACAGAAGACATACGGACGATCAAGTATTCAACAACCCAGCATCAAAGATCAAACAAAAGCCTGGGAAGATTTTCTGCAGTGCACCAGTGGAGAATCTGAACAAGTTGAGGGGGGAATGTCTAAGGATGATGGAGATGTTGAAAGAAGAAACTTGGAGGATCTATCCAGTACTTCTCCCACAGATGGAACTATTGGAAAGAGAGTGTCGAACACCCGTGACTGGGCAGAAGGTTCAGATGACATACAACTGGACCCAGTGGTTACAGACGTTGTATACCATGATCATGGAGGAGAATGTACCGGATATGGATTTACTTCAAGCCCTGAGAGAGGGTGGAGTGATTACACATCAGGAGCAAACAATGGGAATGTATGTCTTGTATCTGATGCAAAGATGCTGTCCTATGCTCCCGAAATTGCAGTTTCTAAAGAAGATCGGGAAACTGATCTAGTTCATCTTGAGAATAAACTATCTACTACAGGACTGAATCCCACAGCAGTACCGTTCACTCTGAGAAACCTGTCTGATCCTGCAAAAGACTCTCCTGTGATTGCTGAACACTACTACGGACTAGGAGTTAAAGAGCAAAACGTTGGCCCTCAGACTAGCAGAAATGTCAATTTGGACAGCATCAAATTGTACACATCAGATGACGAAGAGGCAGATCAGCTTGAATTCGAAGATGAGTTTGCAGGAAGCTCAAGTGAAGTGATAGTCGGCATTTCTCCTGAAGATGAAGAGCCTTCAAGTGTTGGCGGAAAACCCAATGAATCCATTGGACGTACAATCGAAGGCCAATCAATCCGAGACAACCTTCAAGCCAAGGACAACAAATCAACAGATGTACCAGGAGCAGGACCGAAAGATTCAGCAGTGAAGGAAGAACCACCCCAGAAGAGGCTACCTATGTTAGCTGAAGAATTTGAGTGCTCTGGATCGGAAGACCCAATCATTCGGGAGCTGCTGAAGGAGAACTCACTCATAAATTGTCAGCAAGGGAAAGATGCTCAGCCTCCATATCATTGGAGCATCGAGAGGTCAATAAGCCCGGATAAAACTGAGATCGTCAACGGTGCTGTGCAAACTGCTGACAGGCAAAGACCAGGAACTCCGATGCCAAAGTCCCGAGGTATTCCCATTAAAAAGGGGCACAGACGCGAAATATCCATCTGCTGGGACGGAAAACGTGCCTGGGTCGAAGAGTGGTGCAACCCGGCATGTTCGAGGATCACCCCCCTACCAAGAAGGCAAGAGTGTCAATGCGGAGAATGTCCAACTGAATGCTTCCACTGCGGT [서열번호 116]
따라서, 바람직하게는 상기 NiV V 폴리펩티드는 실질적으로 서열번호 116에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 NiV V 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 117로 제공된다:
ATGGACAAGCTGGAACTGGTCAACGACGGCCTGAACATCATCGACTTCATCCAGAAGAACCAGAAAGAGATCCAGAAAACCTACGGCCGGTCCAGCATCCAGCAGCCTAGCATCAAGGATCAGACCAAGGCCTGGGAAGATTTCCTGCAGTGTACCAGCGGCGAGAGCGAACAGGTTGAAGGCGGCATGAGCAAGGACGACGGCGACGTGGAAAGACGGAACCTGGAAGATCTGAGCAGCACAAGCCCTACCGATGGCACCATCGGCAAGCGGGTGTCCAACACAAGAGATTGGGCCGAGGGCAGCGACGACATTCAGCTGGATCCTGTGGTCACCGATGTGGTGTACCACGATCACGGCGGCGAGTGTACAGGCTACGGCTTTACAAGCAGCCCCGAGAGAGGCTGGAGCGATTATACAAGCGGCGCCAACAACGGCAACGTGTGCCTGGTGTCTGACGCCAAGATGCTGAGCTACGCCCCTGAGATCGCCGTGTCCAAAGAGGACAGAGAAACCGACCTGGTGCACCTGGAAAACAAGCTGAGCACCACCGGACTGAACCCTACCGCCGTGCCTTTCACACTGAGAAACCTGAGCGACCCCGCCAAGGACTCTCCTGTGATTGCCGAGCACTACTACGGCCTGGGCGTGAAAGAACAGAACGTGGGCCCTCAGACCAGCCGGAACGTGAACCTGGATTCCATCAAGCTGTACACCTCCGACGACGAGGAAGCCGACCAGCTGGAATTCGAGGATGAGTTTGCCGGCAGCAGCAGCGAAGTGATTGTGGGCATCAGCCCTGAGGACGAGGAACCTAGCTCTGTTGGCGGCAAGCCCAATGAGAGCATCGGCAGAACAATCGAGGGCCAGAGCATCCGGGATAACCTGCAGGCCAAGGACAACAAGAGCACCGATGTTCCAGGCGCTGGCCCTAAGGATAGCGCCGTGAAAGAGGAACCACCTCAGAAACGGCTGCCCATGCTGGCCGAGGAATTTGAGTGTAGCGGCAGCGAGGACCCCATCATCAGAGAGCTGCTGAAAGAGAACAGCCTGATCAACTGCCAGCAGGGCAAAGACGCCCAGCCTCCTTACCACTGGTCCATCGAGAGATCTATCAGCCCCGACAAGACCGAGATCGTGAATGGCGCTGTGCAGACCGCCGATAGACAGAGGCCTGGAACTCCCATGCCTAAGAGCAGAGGCATCCCCATCAAGAAGGGCCACAGAAGAGAGATCAGCATCTGCTGGGACGGCAAGCGCGCCTGGGTTGAAGAGTGGTGTAATCCCGCCTGCAGCCGGATCACACCTCTGCCTAGAAGGCAAGAGTGCCAGTGTGGCGAGTGTCCCACCGAGTGTTTTCACTGTGGA [서열번호 117]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 117에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 117의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 118로 제공된다:
AUGGACAAGCUGGAACUGGUCAACGACGGCCUGAACAUCAUCGACUUCAUCCAGAAGAACCAGAAAGAGAUCCAGAAAACCUACGGCCGGUCCAGCAUCCAGCAGCCUAGCAUCAAGGAUCAGACCAAGGCCUGGGAAGAUUUCCUGCAGUGUACCAGCGGCGAGAGCGAACAGGUUGAAGGCGGCAUGAGCAAGGACGACGGCGACGUGGAAAGACGGAACCUGGAAGAUCUGAGCAGCACAAGCCCUACCGAUGGCACCAUCGGCAAGCGGGUGUCCAACACAAGAGAUUGGGCCGAGGGCAGCGACGACAUUCAGCUGGAUCCUGUGGUCACCGAUGUGGUGUACCACGAUCACGGCGGCGAGUGUACAGGCUACGGCUUUACAAGCAGCCCCGAGAGAGGCUGGAGCGAUUAUACAAGCGGCGCCAACAACGGCAACGUGUGCCUGGUGUCUGACGCCAAGAUGCUGAGCUACGCCCCUGAGAUCGCCGUGUCCAAAGAGGACAGAGAAACCGACCUGGUGCACCUGGAAAACAAGCUGAGCACCACCGGACUGAACCCUACCGCCGUGCCUUUCACACUGAGAAACCUGAGCGACCCCGCCAAGGACUCUCCUGUGAUUGCCGAGCACUACUACGGCCUGGGCGUGAAAGAACAGAACGUGGGCCCUCAGACCAGCCGGAACGUGAACCUGGAUUCCAUCAAGCUGUACACCUCCGACGACGAGGAAGCCGACCAGCUGGAAUUCGAGGAUGAGUUUGCCGGCAGCAGCAGCGAAGUGAUUGUGGGCAUCAGCCCUGAGGACGAGGAACCUAGCUCUGUUGGCGGCAAGCCCAAUGAGAGCAUCGGCAGAACAAUCGAGGGCCAGAGCAUCCGGGAUAACCUGCAGGCCAAGGACAACAAGAGCACCGAUGUUCCAGGCGCUGGCCCUAAGGAUAGCGCCGUGAAAGAGGAACCACCUCAGAAACGGCUGCCCAUGCUGGCCGAGGAAUUUGAGUGUAGCGGCAGCGAGGACCCCAUCAUCAGAGAGCUGCUGAAAGAGAACAGCCUGAUCAACUGCCAGCAGGGCAAAGACGCCCAGCCUCCUUACCACUGGUCCAUCGAGAGAUCUAUCAGCCCCGACAAGACCGAGAUCGUGAAUGGCGCUGUGCAGACCGCCGAUAGACAGAGGCCUGGAACUCCCAUGCCUAAGAGCAGAGGCAUCCCCAUCAAGAAGGGCCACAGAAGAGAGAUCAGCAUCUGCUGGGACGGCAAGCGCGCCUGGGUUGAAGAGUGGUGUAAUCCCGCCUGCAGCCGGAUCACACCUCUGCCUAGAAGGCAAGAGUGCCAGUGUGGCGAGUGUCCCACCGAGUGUUUUCACUGUGGA [서열번호 118]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 118에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 POLG_EMCV(뇌심근염 바이러스 2C) 게놈 폴리단백질(Li L, Fan H, Song Z, Liu X, Bai J, Jiang P (2019) Encephalomyocarditis virus 2C protein antagonizes interferon-B signaling pathway through interaction with MDA5 Antiviral Res, 161, 70-84), 또는 그의 동원체이다. EMCV의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 119로 나타낸다:
LKARDINDIFAILKNGEWLVKLILAIRDWIKAWIASEEKFVTMTDLVPGILEKQRDLNDPSKYKEAKEWLDNARQACLKSGNVHIANLCKVVAPAPSKSRPEPVVVCLRGKSGQGKSFLANVLAQAISTHFTGRIDSVWYCPPDPDHFDGYNQQTVVVMDDLGQNPDGKDFKYFAQMVSTTGFIPPMASLEDKGKPFNSKVIIATTNLYSGFTPRTMVCPDALNRRFHFDIDVSAKDGYKINSKLDIIKALEDTHANPVAMFQYDCALLNGMAVEMKRMQQDMFKPQPPLQNVYQLVQEVIDRVELHEKVSSHPIFKQ [서열번호 119]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 119에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 EMCV 폴리펩티드는 다음과 같은 서열번호 120의 DNA 뉴클레오티드 서열에 의해 암호화된다:
CTCAAAGCACGTGACATCAACGACATCTTCGCCATTCTCAAGAACGGCGAGTGGCTGGTCAAACTGATCCTTGCCATCCGCGACTGGATTAAGGCTTGGATCGCCTCAGAAGAGAAGTTTGTCACCATGACAGACTTGGTGCCTGGCATCCTTGAAAAGCAGCGGGACCTGAACGACCCGAGCAAGTACAAGGAAGCCAAGGAGTGGCTCGACAACGCGCGCCAAGCGTGTTTGAAGAGCGGGAACGTCCACATTGCCAACCTGTGCAAAGTGGTCGCACCAGCACCCAGCAAGTCGAGGCCCGAACCCGTGGTTGTTTGCCTCCGCGGCAAATCTGGCCAGGGCAAGAGCTTCCTTGCAAACGTGCTTGCACAGGCAATTTCCACCCACTTCACCGGCAGAATCGACTCAGTGTGGTACTGCCCACCTGACCCTGACCACTTCGACGGTTACAACCAGCAAACCGTTGTTGTGATGGATGATTTGGGCCAGAACCCTGACGGCAAGGACTTCAAATACTTTGCCCAAATGGTCTCGACCACAGGGTTTATCCCGCCCATGGCATCACTCGAGGACAAAGGTAAACCTTTCAACAGCAAAGTCATCATCGCGACCACCAACTTGTACTCGGGCTTCACCCCGAGGACCATGGTATGTCCCGACGCACTGAACCGGAGGTTTCACTTTGACATCGATGTGAGTGCTAAGGATGGGTACAAAATTAACAGCAAATTGGACATTATCAAAGCACTCGAAGACACCCACGCCAACCCAGTGGCAATGTTTCAATACGACTGTGCCCTTCTCAACGGCATGGCCGTTGAAATGAAGAGAATGCAACAAGACATGTTCAAGCCTCAACCACCCCTCCAGAATGTGTACCAGCTTGTTCAGGAGGTGATCGATCGGGTCGAGCTCCACGAGAAAGTGTCGAGTCACCCGATCTTCAAGCAG [서열번호 120]
따라서, 바람직하게는 상기 EMCV 폴리펩티드는 실질적으로 서열번호 120에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 EMCV 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 121로 제공된다:
CTGAAGGCCAGAGACATCAACGACATCTTCGCCATCCTGAAGAACGGCGAGTGGCTGGTCAAGCTGATCCTGGCCATCAGAGACTGGATCAAGGCCTGGATCGCCAGCGAAGAGAAGTTCGTGACCATGACCGATCTGGTGCCCGGCATCCTGGAAAAGCAGAGGGACCTGAACGACCCCAGCAAGTACAAAGAGGCCAAAGAATGGCTGGACAACGCCAGACAGGCCTGCCTGAAGTCCGGCAATGTGCATATCGCCAACCTGTGCAAGGTGGTGGCCCCTGCTCCTAGCAAGTCTAGACCTGAGCCTGTGGTCGTGTGCCTGAGAGGCAAATCTGGCCAGGGCAAGAGCTTCCTGGCCAATGTTCTGGCCCAGGCCATCAGCACCCACTTCACCGGAAGAATCGACAGCGTGTGGTACTGCCCTCCTGATCCTGACCACTTCGACGGCTACAACCAGCAGACCGTGGTGGTCATGGACGACCTGGGACAGAACCCCGACGGCAAGGACTTCAAGTACTTCGCCCAGATGGTGTCCACCACCGGCTTCATTCCTCCAATGGCCAGCCTGGAAGATAAGGGCAAGCCCTTCAACAGCAAAGTGATCATTGCCACCACCAACCTGTACAGCGGCTTCACCCCTAGAACCATGGTCTGCCCCGACGCTCTGAACAGACGGTTCCACTTTGACATCGACGTGTCCGCCAAGGATGGCTACAAGATCAACTCCAAGCTGGACATCATCAAGGCCCTCGAGGACACCCACGCCAATCCTGTGGCCATGTTCCAGTACGATTGCGCCCTGCTGAATGGCATGGCCGTGGAAATGAAGCGGATGCAGCAGGACATGTTCAAGCCCCAGCCTCCACTGCAGAACGTGTACCAGCTCGTGCAAGAAGTGATCGACCGGGTCGAGCTGCACGAGAAGGTGTCCTCTCATCCCATCTTCAAGCAG [서열번호 121]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 121에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 121의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 122로 제공된다:
CUGAAGGCCAGAGACAUCAACGACAUCUUCGCCAUCCUGAAGAACGGCGAGUGGCUGGUCAAGCUGAUCCUGGCCAUCAGAGACUGGAUCAAGGCCUGGAUCGCCAGCGAAGAGAAGUUCGUGACCAUGACCGAUCUGGUGCCCGGCAUCCUGGAAAAGCAGAGGGACCUGAACGACCCCAGCAAGUACAAAGAGGCCAAAGAAUGGCUGGACAACGCCAGACAGGCCUGCCUGAAGUCCGGCAAUGUGCAUAUCGCCAACCUGUGCAAGGUGGUGGCCCCUGCUCCUAGCAAGUCUAGACCUGAGCCUGUGGUCGUGUGCCUGAGAGGCAAAUCUGGCCAGGGCAAGAGCUUCCUGGCCAAUGUUCUGGCCCAGGCCAUCAGCACCCACUUCACCGGAAGAAUCGACAGCGUGUGGUACUGCCCUCCUGAUCCUGACCACUUCGACGGCUACAACCAGCAGACCGUGGUGGUCAUGGACGACCUGGGACAGAACCCCGACGGCAAGGACUUCAAGUACUUCGCCCAGAUGGUGUCCACCACCGGCUUCAUUCCUCCAAUGGCCAGCCUGGAAGAUAAGGGCAAGCCCUUCAACAGCAAAGUGAUCAUUGCCACCACCAACCUGUACAGCGGCUUCACCCCUAGAACCAUGGUCUGCCCCGACGCUCUGAACAGACGGUUCCACUUUGACAUCGACGUGUCCGCCAAGGAUGGCUACAAGAUCAACUCCAAGCUGGACAUCAUCAAGGCCCUCGAGGACACCCACGCCAAUCCUGUGGCCAUGUUCCAGUACGAUUGCGCCCUGCUGAAUGGCAUGGCCGUGGAAAUGAAGCGGAUGCAGCAGGACAUGUUCAAGCCCCAGCCUCCACUGCAGAACGUGUACCAGCUCGUGCAAGAAGUGAUCGACCGGGUCGAGCUGCACGAGAAGGUGUCCUCUCAUCCCAUCUUCAAGCAG [서열번호 122]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 122에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 버나바이러스 VP3(조류 전염성 파브리우스낭병 바이러스(IBDV)(감보로(Gumboro) 질환 바이러스) 캡시드 단백질 VP3), 또는 그의 동원체이다. [Ye C, Jia L, Sun Y, Hu B, Wang L, Xingmeng L, Zu J (2014) Inhibition of antiviral innate immunity by birnavirus VP3 protein via blockage of viral double-stranded RNA binding to the host cytoplasmic RNA detector MDA5. J Virol. 88, 18, 11154-11156]. 버나바이러스 VP3의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 123으로 나타낸다:
ASEFKETPELESAVRAMEAAANVDPLFQSALSVFMWLEENGIVTDMANFALSDPNAHRMRNFLANAPQAGSKSQRAKYGTAGYGVEARGPTPEEAQREKDTRISKKMETMGIYFATPEWVALNGHRGPSPGQLKYWQNTREIPDPNEDYLDYVHAEKSRLASEEQILRAATSIYGAPGQAEPPQAFIDEVAKVYEINHGRGPNQEQMKDLLLTAMEMKHRNPRRALPKPKPKPNAPTQRPPGRLGRWIRTVSDEDLE [서열번호 123]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 123에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 버나바이러스 VP3 폴리펩티드는 다음과 같은 서열번호 124의 DNA 뉴클레오티드 서열에 의해 암호화된다:
GCATCAGAGTTCAAAGAGACCCCCGAACTCGAGAGTGCCGTCAGAGCAATGGAAGCAGCAGCCAACGTGGACCCACTATTCCAATCTGCACTCAGTGTGTTCATGTGGCTGGAAGAGAATGGGATTGTGACTGACATGGCCAACTTCGCACTCAGCGACCCGAACGCCCATCGGATGCGAAATTTTCTTGCAAACGCACCACAAGCAGGCAGCAAGTCGCAAAGGGCCAAGTACGGGACAGCAGGCTACGGAGTGGAGGCTCGGGGCCCCACACCAGAGGAAGCACAGAGGGAAAAAGACACACGGATCTCAAAGAAGATGGAGACCATGGGCATCTACTTTGCAACACCAGAATGGGTAGCACTCAATGGGCACCGAGGGCCAAGCCCCGGCCAGCTAAAGTACTGGCAGAACACACGAGAAATACCGGACCCAAACGAGGACTATCTAGACTACGTGCATGCAGAGAAGAGCCGGTTGGCATCAGAAGAACAAATCCTAAGGGCAGCTACGTCGATCTACGGGGCTCCAGGACAGGCAGAGCCACCCCAAGCTTTCATAGACGAAGTTGCCAAAGTCTATGAAATCAACCATGGACGTGGCCCAAACCAAGAACAGATGAAAGATCTGCTCTTGACTGCGATGGAGATGAAGCATCGCAATCCCAGGCGGGCTCTACCAAAGCCCAAGCCAAAACCCAATGCTCCAACACAGAGACCCCCTGGTCGGCTGGGCCGCTGGATCAGGACCGTCTCTGATGAGGACCTTGAG [서열번호 124]
따라서, 바람직하게는 상기 버나바이러스 VP3 폴리펩티드는 실질적으로 서열번호 124에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 버나바이러스 VP3 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 125로 제공된다:
GCCAGCGAGTTCAAAGAGACACCCGAGCTGGAAAGCGCCGTCAGAGCTATGGAAGCCGCCGCTAATGTGGACCCTCTGTTTCAGTCTGCCCTGAGCGTGTTCATGTGGCTGGAAGAGAACGGCATCGTGACCGACATGGCCAACTTCGCCCTGTCTGACCCCAACGCTCACCGGATGAGAAACTTTCTGGCCAACGCTCCTCAGGCCGGCAGCAAGTCTCAGAGAGCCAAATACGGCACAGCCGGCTACGGCGTGGAAGCCAGAGGACCTACACCTGAGGAAGCCCAGAGAGAGAAGGACACCCGGATCAGCAAGAAAATGGAAACCATGGGCATCTACTTCGCCACACCTGAGTGGGTCGCCCTGAATGGACACAGAGGACCATCTCCAGGCCAGCTGAAGTACTGGCAGAACACCAGAGAGATCCCCGATCCTAACGAGGACTACCTGGACTACGTGCACGCCGAGAAAAGCAGACTGGCCAGCGAGGAACAGATCCTGAGAGCCGCCACATCCATCTATGGCGCTCCAGGACAAGCCGAACCTCCACAGGCCTTTATCGACGAGGTGGCCAAGGTGTACGAGATCAACCACGGCAGAGGCCCCAATCAAGAGCAGATGAAGGACCTGCTGCTGACCGCCATGGAAATGAAGCACAGAAACCCCAGACGGGCCCTGCCTAAGCCAAAGCCTAAACCTAACGCTCCCACACAGCGGCCTCCAGGCAGACTCGGAAGATGGATCAGAACCGTGTCCGACGAGGACCTGGAA [서열번호 125]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 125에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 125의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 126으로 제공된다:
GCCAGCGAGUUCAAAGAGACACCCGAGCUGGAAAGCGCCGUCAGAGCUAUGGAAGCCGCCGCUAAUGUGGACCCUCUGUUUCAGUCUGCCCUGAGCGUGUUCAUGUGGCUGGAAGAGAACGGCAUCGUGACCGACAUGGCCAACUUCGCCCUGUCUGACCCCAACGCUCACCGGAUGAGAAACUUUCUGGCCAACGCUCCUCAGGCCGGCAGCAAGUCUCAGAGAGCCAAAUACGGCACAGCCGGCUACGGCGUGGAAGCCAGAGGACCUACACCUGAGGAAGCCCAGAGAGAGAAGGACACCCGGAUCAGCAAGAAAAUGGAAACCAUGGGCAUCUACUUCGCCACACCUGAGUGGGUCGCCCUGAAUGGACACAGAGGACCAUCUCCAGGCCAGCUGAAGUACUGGCAGAACACCAGAGAGAUCCCCGAUCCUAACGAGGACUACCUGGACUACGUGCACGCCGAGAAAAGCAGACUGGCCAGCGAGGAACAGAUCCUGAGAGCCGCCACAUCCAUCUAUGGCGCUCCAGGACAAGCCGAACCUCCACAGGCCUUUAUCGACGAGGUGGCCAAGGUGUACGAGAUCAACCACGGCAGAGGCCCCAAUCAAGAGCAGAUGAAGGACCUGCUGCUGACCGCCAUGGAAAUGAAGCACAGAAACCCCAGACGGGCCCUGCCUAAGCCAAAGCCUAAACCUAACGCUCCCACACAGCGGCCUCCAGGCAGACUCGGAAGAUGGAUCAGAACCGUGUCCGACGAGGACCUGGAA [서열번호 126]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 126에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 돼지 델타 코로나바이러스 NS6 단백질(A0A0K2D1N4), 또는 그의 동원체이다. [Fang P, Fang L, Ren J, Hong Y, Liu X, Zhao Y, Wang D, Peng G, Xiai S (2018) Porcine deltacoronavirus accessory protein NS6 antagonises interferon beta production by interfering with the binding of RIG-I/MDA-5 to double stranded RNA. J Virol., 92, 15, e00712-18]. 돼지 델타 코로나바이러스 NS6의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 127로 나타낸다:
MCNCHLQLRDLYRLCNKLHIRRDDVPELIDPLVKTRCFAYSLVVLANANPIAFSILPRKILINGEPLLLEYGSIYGKDFIIRPSLQVILEDELN [서열번호 127]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 127에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 돼지 델타 코로나바이러스 NS6 폴리펩티드는 다음과 같은 서열번호 128의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGTGCAACTGCCATCTGCAGCTGCGAGATTTATATAGATTGTGCAATAAGCTGCACATCAGAAGAGACGATGTTCCTGAGCTTATTGACCCTCTCGTTAAAACTCGCTGTTTTGCTTACAGTCTCGTGGTTCTTGCTAATGCTAATCCAATTGCATTTAGCATACTACCTCGGAAAATTCTTATCAATGGTGAGCCTTTACTGCTTGAATATGGTAGCATATATGGTAAAGACTTTATCATTAGACCATCGCTCCAAGTCATTCTTGAAGATGAATTAAAT [서열번호 128]
따라서, 바람직하게는 상기 돼지 델타 코로나바이러스 NS6 폴리펩티드는 실질적으로 서열번호 128에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 돼지 델타 코로나바이러스 NS6 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 129로 제공된다:
ATGTGCAACTGCCATCTGCAGCTGCGGGACCTGTACCGGCTGTGTAACAAGCTGCACATCAGACGGGACGACGTGCCCGAGCTGATCGATCCTCTGGTCAAGACCAGATGCTTCGCCTACAGCCTGGTGGTGCTGGCCAACGCCAATCCTATCGCCTTCAGCATCCTGCCTCGGAAGATCCTGATCAACGGCGAGCCTCTGCTGCTGGAATACGGCAGCATCTACGGCAAGGACTTCATCATCAGACCCAGCCTGCAAGTGATCCTGGAAGATGAGCTGAACTGA [서열번호 129]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 129에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 129의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 130으로 제공된다:
AUGUGCAACUGCCAUCUGCAGCUGCGGGACCUGUACCGGCUGUGUAACAAGCUGCACAUCAGACGGGACGACGUGCCCGAGCUGAUCGAUCCUCUGGUCAAGACCAGAUGCUUCGCCUACAGCCUGGUGGUGCUGGCCAACGCCAAUCCUAUCGCCUUCAGCAUCCUGCCUCGGAAGAUCCUGAUCAACGGCGAGCCUCUGCUGCUGGAAUACGGCAGCAUCUACGGCAAGGACUUCAUCAUCAGACCCAGCCUGCAAGUGAUCCUGGAAGAUGAGCUGAACUGA [서열번호 130]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 130에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 LASV Z 단백질(O73557|RING 핑거(finger) 단백질 Z 라사 바이러스(Lassa virus)(마우스/시에라리온/조시아/1976 바이러스주), 또는 그의 동원체이다. [Xing J, Ly H, Liang YJ (2015) The Z proteins of pathogenic but not nonpathogenic arenaviruses inhibit RIG-I-like receptor-dependent interferon production. J Virol., 89, 5, 2944-2955]. LASV Z의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 131로 나타낸다:
MGNKQAKAPESKDSPRASLIPDATHLGPQFCKSCWFENKGLVECNNHYLCLNCLTLLLSVSNRCPICKMPLPTKLRPSAAPTAPPTGAADSIRPPPYSP [서열번호 131]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 131에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 LASV Z 폴리펩티드는 다음과 같은 서열번호 132의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGGAAACAAGCAAGCCAAAGCCCCAGAATCAAAAGACAGTCCGAGAGCCAGCCTGATCCCAGATGCCACACATCTAGGGCCACAGTTCTGTAAGAGCTGCTGGTTCGAAAACAAGGGCCTGGTTGAGTGCAACAACCACTATCTGTGTCTCAACTGCCTCACCTTACTTCTAAGTGTCAGCAACAGGTGTCCCATTTGCAAGATGCCTCTCCCCACAAAACTGAGACCATCAGCCGCTCCAACAGCACCTCCAACCGGAGCAGCGGACAGCATCAGACCCCCACCCTACAGTCCC [서열번호 132]
따라서, 바람직하게는 상기 LASV Z 폴리펩티드는 실질적으로 서열번호 132에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 LASV Z 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 133으로 제공된다:
ATGGGCAACAAGCAGGCCAAGGCTCCCGAGAGCAAGGATAGCCCTAGAGCCTCTCTGATCCCCGACGCCACACATCTGGGACCCCAGTTCTGCAAGAGCTGTTGGTTCGAGAACAAAGGCCTGGTGGAATGCAACAACCACTACCTGTGCCTGAACTGTCTGACCCTGCTGCTGAGCGTGTCCAACAGATGCCCCATCTGCAAGATGCCCCTGCCTACCAAGCTGAGGCCTTCTGCTGCTCCTACAGCTCCTCCAACAGGCGCCGCTGATAGCATCAGACCTCCACCTTATAGCCCC [서열번호 133]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 133에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 133의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 134로 제공된다:
AUGGGCAACAAGCAGGCCAAGGCUCCCGAGAGCAAGGAUAGCCCUAGAGCCUCUCUGAUCCCCGACGCCACACAUCUGGGACCCCAGUUCUGCAAGAGCUGUUGGUUCGAGAACAAAGGCCUGGUGGAAUGCAACAACCACUACCUGUGCCUGAACUGUCUGACCCUGCUGCUGAGCGUGUCCAACAGAUGCCCCAUCUGCAAGAUGCCCCUGCCUACCAAGCUGAGGCCUUCUGCUGCUCCUACAGCUCCUCCAACAGGCGCCGCUGAUAGCAUCAGACCUCCACCUUAUAGCCCC [서열번호 134]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 134에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 DANV Z 단백질(B1NX60; RING 핑거 단백질 Z 단데농 바이러스(Dandenong virus)), 또는 그의 동원체이다. DANV Z의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 135로 나타낸다:
MGQAKSKETKLSKKEDRAEVLPDATYLGPLNCKSCWQRFDSLVRCHDHYLCRQCLNLLLTVSDRCPLCKHPLPTKLRVSTAPSSPPPYEE [서열번호 135]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 135에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 DANV Z 폴리펩티드는 다음과 같은 서열번호 136의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGGTCAAGCAAAATCCAAAGAAACAAAGCTCTCCAAGAAAGAGGACAGAGCAGAGGTTCTACCTGACGCAACCTATCTTGGTCCTCTGAACTGCAAATCATGCTGGCAAAGGTTCGACAGTTTGGTTAGGTGCCATGACCACTACCTATGCAGGCAATGTCTGAACCTTTTGTTGACAGTCTCAGACAGATGCCCTCTCTGCAAACACCCTCTACCGACCAAGCTGAGGGTGTCGACAGCCCCCAGCTCACCTCCCCCCTACGAGGAG [서열번호 136]
따라서, 바람직하게는 상기 DANV Z 폴리펩티드는 실질적으로 서열번호 136에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 DANV Z 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 137로 제공된다:
ATGGGCCAAGCCAAGAGCAAAGAGACAAAGCTGAGCAAGAAAGAGGACCGCGCCGAGGTTCTGCCCGATGCCACATATCTGGGCCCTCTGAACTGCAAGAGCTGCTGGCAGAGATTCGACAGCCTCGTGCGGTGCCACGATCACTACCTGTGCAGACAGTGCCTGAACCTGCTGCTGACCGTGTCCGATAGATGCCCTCTGTGCAAGCACCCTCTGCCTACCAAGCTGAGAGTGTCCACCGCTCCTAGCAGCCCTCCACCTTATGAGGAA [서열번호 137]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 137에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 137의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 138로 제공된다:
AUGGGCCAAGCCAAGAGCAAAGAGACAAAGCUGAGCAAGAAAGAGGACCGCGCCGAGGUUCUGCCCGAUGCCACAUAUCUGGGCCCUCUGAACUGCAAGAGCUGCUGGCAGAGAUUCGACAGCCUCGUGCGGUGCCACGAUCACUACCUGUGCAGACAGUGCCUGAACCUGCUGCUGACCGUGUCCGAUAGAUGCCCUCUGUGCAAGCACCCUCUGCCUACCAAGCUGAGAGUGUCCACCGCUCCUAGCAGCCCUCCACCUUAUGAGGAA [서열번호 138]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 138에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 LCMV Z 단백질(P18541; RING 핑거 단백질 Z 림프구성 맥락수막염 바이러스(암스트롱 바이러스주), 또는 그의 동원체이다. LCMV Z 단백질의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 139로 제공된다:
MGQGKSREEKGTNSTNRAEILPDTTYLGPLSCKSCWQKFDSLVRCHDHYLCRHCLNLLLSVSDRCPLCKYPLPTRLKISTAPSSPPPYEE [서열번호 139]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 139에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 LCMV Z 폴리펩티드는 다음과 같은 서열번호 140의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGGTCAAGGCAAGTCCAGAGAGGAGAAAGGCACCAATAGTACAAACAGGGCCGAAATCCTACCAGATACCACCTATCTTGGCCCTTTAAGCTGCAAATCTTGCTGGCAGAAATTTGACAGCTTGGTAAGATGCCATGACCACTACCTTTGCAGGCACTGTTTAAACCTTCTGCTGTCAGTATCCGACAGGTGTCCTCTTTGTAAATATCCATTACCAACCAGATTGAAGATATCAACAGCCCCAAGCTCTCCACCTCCCTACGAAGAG [서열번호 140]
따라서, 바람직하게는 상기 LCMV Z 폴리펩티드는 실질적으로 서열번호 140에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 LCMV Z 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 141로 제공된다:
ATGGGCCAGGGCAAGTCCAGAGAGGAAAAGGGCACCAACTCCACCAACCGGGCCGAGATCCTGCCTGACACCACATATCTGGGCCCTCTGAGCTGCAAGAGCTGCTGGCAGAAATTCGACAGCCTCGTGCGGTGCCACGACCACTACCTGTGTAGACACTGCCTGAACCTGCTGCTGAGCGTGTCCGATAGATGCCCTCTGTGCAAGTACCCTCTGCCTACCAGACTGAAGATCAGCACAGCCCCTAGCAGCCCTCCACCTTACGAAGAA [서열번호 141]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 141에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 141의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 142로 제공된다:
AUGGGCCAGGGCAAGUCCAGAGAGGAAAAGGGCACCAACUCCACCAACCGGGCCGAGAUCCUGCCUGACACCACAUAUCUGGGCCCUCUGAGCUGCAAGAGCUGCUGGCAGAAAUUCGACAGCCUCGUGCGGUGCCACGACCACUACCUGUGUAGACACUGCCUGAACCUGCUGCUGAGCGUGUCCGAUAGAUGCCCUCUGUGCAAGUACCCUCUGCCUACCAGACUGAAGAUCAGCACAGCCCCUAGCAGCCCUCCACCUUACGAAGAA [서열번호 142]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 142에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 LUJV Z 단백질(C5ILC3; 다기능성 매트릭스-유사 단백질 Z Lujp 맘마레나바이러스(mammarenavirus)), 또는 그의 동원체이다. LUJV Z 단백질의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 143으로 나타낸다:
MGQRHSSGSGQPNPKPSDSDHEARRSELHSDASHLGPLNCKSCWKSKKALVKCYDHYLCLNCLSLLMGITPRCPFCYRELPKNLDLAEAPSAPPL [서열번호 143]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 143에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 LUJV Z 폴리펩티드는 다음과 같은 서열번호 144의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGGTCAGAGACATTCCTCTGGCTCCGGCCAACCCAACCCCAAGCCGAGTGACAGCGATCATGAAGCGAGAAGGTCAGAGCTTCACTCGGACGCCTCCCATCTCGGACCTCTGAACTGCAAATCTTGCTGGAAGTCAAAGAAGGCACTGGTGAAGTGCTATGATCACTACCTCTGTCTAAACTGCTTAAGCCTTCTAATGGGCATCACCCCAAGATGTCCCTTCTGTTACAGAGAGCTACCCAAAAATCTGGACCTTGCAGAGGCACCAAGCGCACCACCCCTC [서열번호 144]
따라서, 바람직하게는 상기 LUJV Z 폴리펩티드는 실질적으로 서열번호 144에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 LUJV Z 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 145로 제공된다:
ATGGGCCAGAGACACAGCTCTGGAAGCGGCCAGCCTAATCCTAAGCCTAGCGACAGCGATCACGAGGCCAGAAGAAGCGAGCTGCACTCCGATGCCTCTCACCTGGGACCTCTGAACTGCAAGAGCTGCTGGAAGTCCAAGAAAGCCCTGGTCAAGTGCTACGACCACTACCTGTGCCTGAACTGCCTGAGCCTGCTGATGGGCATTACCCCTAGATGCCCCTTCTGCTACAGAGAGCTGCCCAAGAACCTGGACCTGGCCGAAGCTCCTTCTGCTCCTCCTCTG [서열번호 145]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 145에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 145의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 146으로 제공된다:
AUGGGCCAGAGACACAGCUCUGGAAGCGGCCAGCCUAAUCCUAAGCCUAGCGACAGCGAUCACGAGGCCAGAAGAAGCGAGCUGCACUCCGAUGCCUCUCACCUGGGACCUCUGAACUGCAAGAGCUGCUGGAAGUCCAAGAAAGCCCUGGUCAAGUGCUACGACCACUACCUGUGCCUGAACUGCCUGAGCCUGCUGAUGGGCAUUACCCCUAGAUGCCCCUUCUGCUACAGAGAGCUGCCCAAGAACCUGGACCUGGCCGAAGCUCCUUCUGCUCCUCCUCUG [서열번호 146]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 146에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 CHPV Z 단백질(B2C4J2; RING 핑거 단백질 Z 차파레(Chapare) 맘마레나바이러스(인간/볼리비아/810419/2003 단리물)), 또는 그의 동원체이다. CHPV Z 단백질의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 147로 나타낸다:
MGNTKTKDRQYQSNSSQPTNTSAPVLLRRQAEPSLYGRHNCRCCWFADTNLVNCSNHYLCLKCLNTMLRRSNLCDICGEELPTTIIVPVEPSAPLPGQ [서열번호 147]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 147에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 CHPV Z 폴리펩티드는 다음과 같은 서열번호 148의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGGTAACACCAAAACAAAGGACAGACAGTATCAATCGAACTCAAGCCAACCCACAAACACATCTGCACCAGTTCTGCTGAGAAGGCAGGCAGAACCAAGTCTGTATGGGAGACACAACTGCAGATGCTGTTGGTTTGCAGACACAAACCTAGTCAATTGTTCCAACCACTACCTTTGCCTTAAATGTCTGAACACAATGTTAAGAAGATCCAATCTCTGTGACATATGCGGTGAAGAACTTCCCACAACAATCATTGTTCCAGTGGAACCATCAGCACCACTGCCCGGACAA [서열번호 148]
따라서, 바람직하게는 상기 CHPV Z 폴리펩티드는 실질적으로 서열번호 148에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 CHPV Z 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 149로 제공된다:
ATGGGCAACACCAAGACCAAGGACCGGCAGTACCAGAGCAACAGCAGCCAGCCTACCAACACATCTGCCCCTGTGCTGCTGAGAAGGCAGGCCGAGCCTTCTCTGTACGGCAGACACAACTGCCGGTGCTGTTGGTTCGCCGACACCAACCTGGTCAACTGCAGCAACCACTACCTGTGCCTGAAGTGTCTGAACACCATGCTGCGGCGGAGCAACCTGTGCGATATCTGTGGCGAGGAACTGCCCACCACCATCATCGTGCCTGTGGAACCTTCTGCTCCTCTGCCTGGACAG [서열번호 149]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 149에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 149의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 150으로 제공된다:
AUGGGCAACACCAAGACCAAGGACCGGCAGUACCAGAGCAACAGCAGCCAGCCUACCAACACAUCUGCCCCUGUGCUGCUGAGAAGGCAGGCCGAGCCUUCUCUGUACGGCAGACACAACUGCCGGUGCUGUUGGUUCGCCGACACCAACCUGGUCAACUGCAGCAACCACUACCUGUGCCUGAAGUGUCUGAACACCAUGCUGCGGCGGAGCAACCUGUGCGAUAUCUGUGGCGAGGAACUGCCCACCACCAUCAUCGUGCCUGUGGAACCUUCUGCUCCUCUGCCUGGACAG [서열번호 150]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 150에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 MACV Z 단백질(Q6IUF9; RING 핑거 단백질 Z 마추포 바이러스(Machupo virus)), 또는 그의 동원체이다. MACV Z 단백질의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 151로 나타낸다:
MGNCNKPPKRPPNTQTSAAQPSAEFRRTALPSLYGRYNCKCCWFADTNLITCNDHYLCLRCHQTMLRNSELCHICWKPLPTSITVPVEPSAPPP [서열번호 151]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 151에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 MACV Z 폴리펩티드는 다음과 같은 서열번호 152의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGGCAACTGTAACAAGCCTCCCAAGAGGCCTCCCAACACACAAACATCAGCCGCCCAGCCCTCAGCAGAGTTCAGGAGAACAGCCCTACCCAGTCTCTATGGTCGCTACAACTGCAAATGTTGTTGGTTTGCCGACACAAACTTGATTACATGTAACGACCACTACTTGTGTCTGAGATGTCATCAAACAATGCTCAGGAATTCTGAACTCTGTCACATATGCTGGAAACCACTACCGACATCCATCACAGTCCCCGTGGAGCCAAGCGCCCCCCCACCA [서열번호 152]
따라서, 바람직하게는 상기 MACV Z 폴리펩티드는 실질적으로 서열번호 152에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 MACV Z 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 153으로 제공된다:
ATGGGCAACTGCAACAAGCCTCCTAAGCGGCCTCCTAACACACAGACATCTGCCGCTCAGCCTAGCGCCGAGTTCAGAAGAACAGCCCTGCCTAGCCTGTACGGCCGGTACAACTGCAAGTGCTGTTGGTTCGCCGACACCAACCTGATCACCTGTAACGACCACTACCTGTGCCTGCGGTGCCACCAGACCATGCTGAGAAATAGCGAGCTGTGCCACATCTGCTGGAAGCCCCTGCCTACCAGCATCACCGTGCCTGTGGAACCTTCTGCTCCTCCTCCT [서열번호 153]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 153에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 153의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 154로 제공된다:
AUGGGCAACUGCAACAAGCCUCCUAAGCGGCCUCCUAACACACAGACAUCUGCCGCUCAGCCUAGCGCCGAGUUCAGAAGAACAGCCCUGCCUAGCCUGUACGGCCGGUACAACUGCAAGUGCUGUUGGUUCGCCGACACCAACCUGAUCACCUGUAACGACCACUACCUGUGCCUGCGGUGCCACCAGACCAUGCUGAGAAAUAGCGAGCUGUGCCACAUCUGCUGGAAGCCCCUGCCUACCAGCAUCACCGUGCCUGUGGAACCUUCUGCUCCUCCUCCU [서열번호 154]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 154에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 GTOV Z 단백질(Q6UY71; RING 핑거 단백질 Z 구아나리토(Guanarito) 맘마레나바이러스(인간/베네수엘라/NH-95551/1990 단리물)), 또는 그의 동원체이다. GTOV Z 단백질의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 155로 나타낸다:
MGNSKSKSNPSSSSESQKGAPTVTEFRRTAIHSLYGRYNCKCCWFADKNLIKCSDHYLCLRCLNVMLKNSDLCNICWEQLPTCITVPEEPSAPPE [서열번호 155]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 155에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 GTOV Z 폴리펩티드는 다음과 같은 서열번호 156의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGGCAATTCAAAATCTAAATCCAACCCATCCAGTTCCTCAGAGTCTCAAAAAGGGGCACCAACAGTCACAGAATTTAGGAGGACTGCCATTCACAGTCTCTATGGGAGGTACAACTGCAAGTGTTGCTGGTTTGCTGACAAGAATCTGATTAAATGCTCTGATCATTACCTCTGCTTGAGGTGTTTAAATGTCATGCTGAAAAACTCTGATCTTTGCAACATTTGTTGGGAGCAGCTGCCCACATGCATCACAGTTCCGGAGGAGCCAAGCGCTCCACCGGAA [서열번호 156]
따라서, 바람직하게는 상기 GTOV Z 폴리펩티드는 실질적으로 서열번호 156에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 GTOV Z 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 157로 제공된다:
ATGGGCAACAGCAAGTCCAAGAGCAACCCCAGCAGCAGCTCCGAGTCTCAGAAAGGCGCTCCTACCGTGACCGAGTTCAGAAGAACAGCCATCCACAGCCTGTACGGCCGGTACAACTGCAAGTGCTGTTGGTTCGCCGACAAGAACCTGATCAAGTGCAGCGACCACTACCTGTGCCTGCGGTGCCTGAACGTGATGCTGAAGAACTCCGACCTGTGCAACATCTGCTGGGAGCAGCTGCCTACCTGCATCACCGTGCCTGAGGAACCTTCTGCTCCTCCTGAA [서열번호 157]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 157에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 157의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 158로 제공된다:
AUGGGCAACAGCAAGUCCAAGAGCAACCCCAGCAGCAGCUCCGAGUCUCAGAAAGGCGCUCCUACCGUGACCGAGUUCAGAAGAACAGCCAUCCACAGCCUGUACGGCCGGUACAACUGCAAGUGCUGUUGGUUCGCCGACAAGAACCUGAUCAAGUGCAGCGACCACUACCUGUGCCUGCGGUGCCUGAACGUGAUGCUGAAGAACUCCGACCUGUGCAACAUCUGCUGGGAGCAGCUGCCUACCUGCAUCACCGUGCCUGAGGAACCUUCUGCUCCUCCUGAA [서열번호 158]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 158에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 JUNV Z 단백질(Q6IVU5; RING 핑거 단백질 Z OS=주닌(Junin) 맘마레나바이러스), 또는 그의 동원체이다. JUNV Z의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 159로 나타낸다:
MGNCNGASKSNQPDSSRVTQPAAEFRRVAHSSLYGRYNCKCCWFADTNLITCNDHYLCLRCHQVMLRNSDLCNICWKPLPTTITVPVEPTAPPP [서열번호 159]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 159에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 JUNV Z 폴리펩티드는 다음과 같은 서열번호 160의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGGCAACTGCAACGGGGCATCCAAGTCAAACCAGCCAGACTCTTCAAGGGTCACACAGCCAGCCGCAGAATTCAGGAGGGTGGCTCACAGCAGTCTATATGGTAGATACAACTGCAAGTGCTGCTGGTTTGCTGACACCAATCTGATAACCTGCAATGATCACTACCTTTGTTTAAGGTGCCATCAGGTTATGTTAAGGAATTCGGACCTCTGCAATATCTGTTGGAAGCCCCTACCTACCACAATCACAGTGCCGGTGGAGCCAACAGCACCACCACCA [서열번호 160]
따라서, 바람직하게는 상기 JUNV Z 폴리펩티드는 실질적으로 서열번호 160에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 JUNV Z 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 161로 제공된다:
ATGGGCAATTGCAACGGCGCCAGCAAGAGCAACCAGCCTGATAGCAGCAGAGTGACACAGCCTGCCGCCGAGTTTAGAAGAGTGGCCCACAGCAGCCTGTACGGCCGGTACAATTGCAAGTGCTGTTGGTTCGCCGACACCAACCTGATCACCTGTAACGACCACTACCTGTGCCTGCGGTGCCACCAAGTGATGCTGAGAAACAGCGACCTGTGCAACATCTGCTGGAAGCCCCTGCCTACCACCATCACCGTGCCTGTGGAACCTACAGCTCCTCCTCCT [서열번호 161]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 161에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 161의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 162로 제공된다:
AUGGGCAAUUGCAACGGCGCCAGCAAGAGCAACCAGCCUGAUAGCAGCAGAGUGACACAGCCUGCCGCCGAGUUUAGAAGAGUGGCCCACAGCAGCCUGUACGGCCGGUACAAUUGCAAGUGCUGUUGGUUCGCCGACACCAACCUGAUCACCUGUAACGACCACUACCUGUGCCUGCGGUGCCACCAAGUGAUGCUGAGAAACAGCGACCUGUGCAACAUCUGCUGGAAGCCCCUGCCUACCACCAUCACCGUGCCUGUGGAACCUACAGCUCCUCCUCCU [서열번호 162]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 162에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 SABV Z 단백질(Q6UY62; RING 핑거 단백질 Z 사비아(Sabia) 맘마레나바이러스(인간/브라질/SPH114202/1990) 단리물), 또는 그의 동원체이다. SABV Z 단백질의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 163으로 나타낸다:
MGNSKSKSKLSANQYEQQTVNSTKQVAILKRQAEPSLYGRHNCRCCWFANTNLIKCSDHYICLKCLNIMLGKSSFCDICGEELPTSIVVPIEPSAPPPED [서열번호 163]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 163에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 SABV Z 폴리펩티드는 다음과 같은 서열번호 164의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGGTAACTCCAAGTCAAAATCAAAGCTGTCTGCTAACCAGTATGAACAGCAAACAGTCAATAGCACCAAACAGGTAGCCATTTTAAAGAGACAGGCTGAACCTAGTCTGTATGGAAGACACAACTGCAGGTGCTGCTGGTTCGCCAATACAAATCTAATAAAATGTTCCGACCATTATATTTGTCTAAAATGTTTGAACATAATGTTGGGGAAGTCTTCTTTTTGTGACATTTGTGGTGAAGAGCTCCCCACATCCATTGTGGTGCCCATCGAACCAAGTGCTCCACCTCCAGAAGAC [서열번호 164]
따라서, 바람직하게는 상기 SABV Z 폴리펩티드는 실질적으로 서열번호 164에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 SABV Z 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 165로 제공된다:
ATGGGCAACAGCAAGAGCAAGTCCAAGCTGAGCGCCAACCAGTACGAGCAGCAGACCGTGAACAGCACCAAACAGGTGGCCATCCTGAAGAGACAGGCCGAGCCTAGCCTGTACGGCAGACACAACTGCCGGTGTTGTTGGTTCGCCAACACCAACCTGATCAAGTGCAGCGACCACTACATCTGCCTGAAGTGCCTGAACATCATGCTGGGCAAGAGCAGCTTCTGCGACATCTGCGGAGAGGAACTGCCCACCTCTATCGTGGTGCCTATCGAGCCTTCTGCTCCTCCACCTGAGGAT [서열번호 165]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 165에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 165의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 166으로 제공된다:
AUGGGCAACAGCAAGAGCAAGUCCAAGCUGAGCGCCAACCAGUACGAGCAGCAGACCGUGAACAGCACCAAACAGGUGGCCAUCCUGAAGAGACAGGCCGAGCCUAGCCUGUACGGCAGACACAACUGCCGGUGUUGUUGGUUCGCCAACACCAACCUGAUCAAGUGCAGCGACCACUACAUCUGCCUGAAGUGCCUGAACAUCAUGCUGGGCAAGAGCAGCUUCUGCGACAUCUGCGGAGAGGAACUGCCCACCUCUAUCGUGGUGCCUAUCGAGCCUUCUGCUCCUCCACCUGAGGAU [서열번호 166]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 166에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
다른 구현예에서, 상기 적어도 하나의 IIP는 3C 프로테아제 단백질일 수 있다.
한 구현예에서, 상기 적어도 하나의 IIP는 CV-A16 3C 프로테아제(Q9QF31; 콕사키바이러스 A16(타이난/5079/98 프로테아제 3C 바이러스주), 또는 그의 동원체이다. [Rui Y, Su Jm Wang H, Chang J, Wang S, Zhenf W, Cai Y, Gordy JT, Markham R, Kong W, Zhang W, Yu X-F. (2017) Disruption of MDA5-Mediated Innate Immune Responses by the 3C Proteins of Coxsackievirus A16, Coxsackievirus A6, and Enterovirus D68. J Virol 91, 13, e00546-17]. CV-A16 3C 프로테아제의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 167로 나타낸다:
GPSLDFALSLLRRNIRQVQTDQGHFTMLGVRDRLAILPRHSQPGKTIWVEHKLINVLDAVELVDEQGVNLELTLVTLDTNEKFRDVTKFIPETITGASDATLVINTEHMPSMFVPVGDVVQYGFLNLSGKPTHRTMMYNFPTKAGQCGGVVTSVGKIIGIHIGGNGRQGFCAGLKRGYFASEQ [서열번호 167]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 167에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 CV-A16 3C 프로테아제 폴리펩티드는 다음과 같은 서열번호 168의 DNA 뉴클레오티드 서열에 의해 암호화된다:
GGACCGAGCTTAGACTTTGCCTTATCCCTCCTAAGGCGCAACATTAGACAGGTGCAAACCGACCAAGGACACTTCACTATGTTAGGGGTGCGAGATCGCCTAGCCATTTTGCCACGCCACTCGCAACCAGGAAAAACTATCTGGGTGGAGCACAAGTTAATTAATGTGCTGGATGCTGTCGAATTAGTGGATGAGCAAGGTGTAAACTTGGAACTCACACTAGTAACCTTAGACACCAACGAAAAGTTTAGGGATGTTACCAAGTTTATTCCAGAGACGATCACCGGGGCAAGCGACGCAACCTTGGTCATCAACACTGAGCACATGCCCTCAATGTTCGTTCCAGTGGGTGATGTTGTACAATATGGATTTCTGAATCTCAGCGGTAAGCCCACACACCGAACCATGATGTACAATTTCCCCACAAAGGCAGGACAGTGTGGAGGGGTGGTCACCTCAGTCGGTAAGATCATAGGAATTCACATTGGTGGGAATGGACGCCAGGGTTTCTGCGCTGGACTGAAGAGAGGCTATTTTGCCAGTGAACAG [서열번호 168]
따라서, 바람직하게는 상기 CV-A16 3C 프로테아제 폴리펩티드는 실질적으로 서열번호 168에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 CV-A16 3C 프로테아제 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 169로 제공된다:
GGCCCTTCTCTGGATTTTGCCCTGAGCCTGCTGCGGCGGAACATCAGACAGGTGCAGACAGATCAGGGCCACTTCACCATGCTGGGCGTCAGAGACAGACTGGCCATCCTGCCTAGACACAGCCAGCCTGGCAAGACCATCTGGGTCGAGCACAAGCTGATCAACGTGCTGGACGCCGTGGAACTGGTGGATGAACAGGGCGTGAACCTGGAACTGACCCTGGTCACCCTGGACACCAACGAGAAGTTCCGGGACGTGACCAAGTTCATCCCCGAGACAATCACCGGCGCCTCCGATGCCACACTGGTCATCAATACCGAGCACATGCCCTCCATGTTCGTGCCTGTGGGAGATGTGGTGCAGTACGGCTTCCTGAACCTGAGCGGCAAGCCCACACACCGGACCATGATGTACAACTTCCCTACCAAGGCCGGCCAGTGCGGCGGAGTGGTTACATCTGTGGGCAAGATCATCGGCATCCACATCGGCGGCAATGGCAGACAGGGATTTTGTGCCGGCCTGAAGAGAGGCTACTTCGCCTCTGAACAG [서열번호 169]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 169에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 169의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 170으로 제공된다:
GGCCCUUCUCUGGAUUUUGCCCUGAGCCUGCUGCGGCGGAACAUCAGACAGGUGCAGACAGAUCAGGGCCACUUCACCAUGCUGGGCGUCAGAGACAGACUGGCCAUCCUGCCUAGACACAGCCAGCCUGGCAAGACCAUCUGGGUCGAGCACAAGCUGAUCAACGUGCUGGACGCCGUGGAACUGGUGGAUGAACAGGGCGUGAACCUGGAACUGACCCUGGUCACCCUGGACACCAACGAGAAGUUCCGGGACGUGACCAAGUUCAUCCCCGAGACAAUCACCGGCGCCUCCGAUGCCACACUGGUCAUCAAUACCGAGCACAUGCCCUCCAUGUUCGUGCCUGUGGGAGAUGUGGUGCAGUACGGCUUCCUGAACCUGAGCGGCAAGCCCACACACCGGACCAUGAUGUACAACUUCCCUACCAAGGCCGGCCAGUGCGGCGGAGUGGUUACAUCUGUGGGCAAGAUCAUCGGCAUCCACAUCGGCGGCAAUGGCAGACAGGGAUUUUGUGCCGGCCUGAAGAGAGGCUACUUCGCCUCUGAACAG [서열번호 170]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 170에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 CV-A6 3C 프로테아제(L7P6C4; 게놈 폴리단백질 콕사키바이러스 A6 프로테아제 3C), 또는 그의 동원체이다. CV-A6 3C 프로테아제의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 171로 나타낸다:
GPSLDFALSLLRRNIRQVQTDQGHFTMLGVRDRLAVLPRHSQPGKTIWVEHKLVNVVDAVELVDEQGVNLELTLITLDTNEKFRDITKFIPENISAASDATLVINTEHMPSMFVPVGDVVQYGFLNLSGKPTHRTMMYNFPTKAGQCGGVVTSVGKVIGIHIGGNGRQGFCAGLKRSYF [서열번호 171]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 171에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 CV-A6 3C 프로테아제 폴리펩티드는 다음과 같은 서열번호 172의 DNA 뉴클레오티드 서열에 의해 암호화된다:
GGACCTAGCCTTGATTTTGCCCTATCCCTACTGAGAAGGAACATCAGACAAGTTCAAACGGACCAAGGGCACTTCACCATGCTAGGAGTCAGAGATCGCTTGGCCGTCCTCCCACGACACTCACAACCCGGAAAAACTATCTGGGTAGAGCACAAGCTAGTGAATGTTGTGGATGCTGTCGAACTAGTGGATGAGCAGGGGGTCAACTTAGAGCTGACTTTAATCACCCTCGACACTAATGAGAAGTTTAGAGACATCACCAAATTTATTCCAGAGAATATCAGCGCTGCCAGCGATGCCACTCTAGTGATTAATACAGAGCACATGCCTTCTATGTTTGTGCCAGTAGGTGATGTTGTTCAGTATGGTTTCCTGAATCTTAGTGGGAAACCAACCCACCGCACTATGATGTATAACTTCCCTACCAAGGCAGGACAGTGTGGAGGGGTAGTCACATCAGTTGGAAAGGTCATTGGTATCCACATAGGAGGCAATGGCAGGCAAGGTTTCTGTGCAGGGCTCAAGAGAAGCTACTTT [서열번호 172]
따라서, 바람직하게는 상기 CV-A6 3C 프로테아제 폴리펩티드는 실질적으로 서열번호 172에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 CV-A6 3C 프로테아제 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 173으로 제공된다:
GGCCCTTCTCTGGATTTTGCCCTGAGCCTGCTGCGGCGGAACATCAGACAGGTGCAGACAGATCAGGGCCACTTCACCATGCTGGGCGTCAGAGATAGACTGGCCGTGCTGCCTAGACACAGCCAGCCTGGAAAGACCATCTGGGTCGAGCACAAGCTGGTCAACGTGGTGGATGCCGTGGAACTGGTGGATGAGCAGGGCGTGAACCTGGAACTGACCCTGATCACCCTGGACACCAACGAGAAGTTCCGGGACATCACCAAGTTCATCCCCGAGAACATCAGCGCCGCCTCCGATGCCACACTGGTCATCAATACCGAGCACATGCCCTCCATGTTCGTGCCTGTGGGAGATGTGGTGCAGTACGGCTTCCTGAACCTGAGCGGCAAGCCCACACACCGGACCATGATGTACAACTTCCCTACCAAGGCCGGCCAGTGCGGCGGAGTGGTTACATCTGTGGGCAAAGTGATCGGAATCCACATCGGCGGCAATGGCAGACAGGGCTTTTGTGCCGGCCTGAAGAGAAGCTACTTC [서열번호 173]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 173에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 173의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 174로 제공된다:
GGCCCUUCUCUGGAUUUUGCCCUGAGCCUGCUGCGGCGGAACAUCAGACAGGUGCAGACAGAUCAGGGCCACUUCACCAUGCUGGGCGUCAGAGAUAGACUGGCCGUGCUGCCUAGACACAGCCAGCCUGGAAAGACCAUCUGGGUCGAGCACAAGCUGGUCAACGUGGUGGAUGCCGUGGAACUGGUGGAUGAGCAGGGCGUGAACCUGGAACUGACCCUGAUCACCCUGGACACCAACGAGAAGUUCCGGGACAUCACCAAGUUCAUCCCCGAGAACAUCAGCGCCGCCUCCGAUGCCACACUGGUCAUCAAUACCGAGCACAUGCCCUCCAUGUUCGUGCCUGUGGGAGAUGUGGUGCAGUACGGCUUCCUGAACCUGAGCGGCAAGCCCACACACCGGACCAUGAUGUACAACUUCCCUACCAAGGCCGGCCAGUGCGGCGGAGUGGUUACAUCUGUGGGCAAAGUGAUCGGAAUCCACAUCGGCGGCAAUGGCAGACAGGGCUUUUGUGCCGGCCUGAAGAGAAGCUACUUC [서열번호 174]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 174에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 EV D-68 3C 프로테아제(Q68T42; 게놈 폴리단백질 인간 엔테로바이러스 D68; IRF7 절단), 또는 그의 동원체이다. [Xiang Z, Liu L, Lei X, Zhou Z, He B, Wang J (2015) 3C protease of enterovirus D68 inhibits cellular defense mediated interferon regulatory factor. J Virol., 90, 3, 1613-2161. doi: 10.1128/JVI.02395-15. Print 2016 Feb 1]. EV D-68 3C 프로테아제의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 175로 나타낸다:
GPGFDFAQAIMKKNTVIARTEKGEFTMLGVYDRVAVIPTHASVGEIIYINDVETRVLDACALRDLTDTNLEITIVKLDRNQKFRDIRHFLPRCEDDYNDAVLSVHTSKFPNMYIPVGQVTNYGFLNLGGTPTHRILMYNFPTRAGQCGGVVTTTGKVIGIHVGGNGAQGFAAMLLHSYFTDTQ [서열번호 175]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 175에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 EV D-68 3C 프로테아제 폴리펩티드는 다음과 같은 서열번호 176의 DNA 뉴클레오티드 서열에 의해 암호화된다:
GGACCAGGATTTGATTTTGCGCAAGCCATAATGAAGAAAAATACTGTTATTGCTAGAACTGAAAAAGGCGAGTTCACAATGCTTGGTGTGTATGATAGAGTGGCAGTCATTCCAACACATGCATCTGTTGGAGAAATCATTTACATCAACGATGTAGAAACCAGAGTTCTAGATGCATGTGCACTTAGAGACTTGACAGACACAAACCTAGAAATAACTATAGTCAAATTGGATCGCAATCAAAAATTTAGAGACATCAGACACTTTTTACCCAGATGTGAGGATGATTACAATGATGCTGTGCTTAGTGTACATACATCAAAATTCCCTAACATGTACATTCCAGTTGGACAAGTCACTAACTACGGCTTCTTGAACCTGGGCGGCACACCAACACATCGGATTTTAATGTATAATTTTCCAACAAGAGCTGGTCAGTGTGGTGGTGTGGTGACAACCACAGGTAAAGTGATAGGAATACACGTGGGCGGGAATGGAGCTCAGGGATTCGCAGCAATGTTGCTCCACTCTTACTTTACTGATACACAA [서열번호 176]
따라서, 바람직하게는 상기 EV D-68 3C 프로테아제 폴리펩티드는 실질적으로 서열번호 176에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 EV D-68 3C 프로테아제 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 177로 제공된다:
GGCCCTGGCTTTGATTTTGCCCAGGCCATCATGAAGAAAAACACCGTGATCGCCCGGACCGAGAAGGGCGAGTTTACAATGCTGGGCGTGTACGACAGAGTGGCCGTGATTCCTACACACGCCTCTGTGGGCGAGATCATCTACATCAACGACGTGGAAACCAGAGTGCTGGACGCCTGCGCTCTGAGAGATCTGACCGACACCAACCTGGAAATCACCATCGTGAAGCTGGACCGGAACCAGAAGTTCCGGGACATCCGGCACTTTCTGCCCAGATGCGAGGACGACTACAACGACGCTGTGCTGAGCGTGCACACCAGCAAGTTCCCCAACATGTACATCCCCGTGGGCCAAGTGACCAACTACGGCTTCCTGAATCTCGGCGGCACCCCTACACACCGGATCCTGATGTACAACTTCCCCACCAGAGCCGGCCAGTGTGGCGGAGTGGTTACCACAACAGGCAAAGTGATCGGCATCCACGTCGGCGGAAATGGCGCTCAGGGATTTGCTGCCATGCTGCTGCACAGCTACTTCACCGACACACAG [서열번호 177]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 177에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 177의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 178로 제공된다:
GGCCCUGGCUUUGAUUUUGCCCAGGCCAUCAUGAAGAAAAACACCGUGAUCGCCCGGACCGAGAAGGGCGAGUUUACAAUGCUGGGCGUGUACGACAGAGUGGCCGUGAUUCCUACACACGCCUCUGUGGGCGAGAUCAUCUACAUCAACGACGUGGAAACCAGAGUGCUGGACGCCUGCGCUCUGAGAGAUCUGACCGACACCAACCUGGAAAUCACCAUCGUGAAGCUGGACCGGAACCAGAAGUUCCGGGACAUCCGGCACUUUCUGCCCAGAUGCGAGGACGACUACAACGACGCUGUGCUGAGCGUGCACACCAGCAAGUUCCCCAACAUGUACAUCCCCGUGGGCCAAGUGACCAACUACGGCUUCCUGAAUCUCGGCGGCACCCCUACACACCGGAUCCUGAUGUACAACUUCCCCACCAGAGCCGGCCAGUGUGGCGGAGUGGUUACCACAACAGGCAAAGUGAUCGGCAUCCACGUCGGCGGAAAUGGCGCUCAGGGAUUUGCUGCCAUGCUGCUGCACAGCUACUUCACCGACACACAG [서열번호 178]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 178에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 EVD-71 3C 프로테아제(Q0JRV3; 게놈 폴리단백질 인간 엔테로바이러스 71 프로테아제 3C), 또는 그의 동원체이다. EVD-71 3C 프로테아제 단백질의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 179로 나타낸다:
GPSLDFALSLLRRNIRQVQTDQGHFTMLGVRDHLAVLPRHSQPGKTIWVEHKLVKIVDAVELVDEQGVNLELTLVTLDTNEKFRDITRFIPETISPASDATLVINTEHMPSMFVPVGDVVQYGFLNLSGKPTHRTMMYNFPTKAGQCGGAVTAVGKVIGIHIGGNGRQGFCAALKRGYF [서열번호 179]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 179에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 EVD-71 3C 프로테아제 폴리펩티드는 다음과 같은 서열번호 180의 DNA 뉴클레오티드 서열에 의해 암호화된다:
GGGCCGAGCTTGGACTTCGCCCTATCTCTACTTAGGAGGAACATTAGGCAGGTCCAAACCGACCAGGGCCACTTTACAATGTTAGGAGTGCGAGACCACTTGGCTGTGCTCCCCAGACACTCCCAACCAGGAAAGACCATCTGGGTTGAACACAAATTAGTGAAGATCGTAGACGCTGTGGAGCTAGTAGATGAACAAGGGGTTAACCTAGAGCTCACACTGGTAACGCTTGACACCAACGAAAAATTTAGAGACATCACAAGATTCATACCAGAAACAATTAGTCCTGCTAGTGATGCCACTTTAGTTATAAATACTGAACATATGCCCAGTATGTTTGTGCCAGTTGGAGATGTGGTCCAGTATGGATTTTTGAACCTTAGTGGTAAGCCCACTCACAGGACTATGATGTACAATTTCCCAACAAAAGCAGGACAGTGTGGTGGTGCTGTGACTGCCGTAGGTAAAGTGATTGGGATTCACATTGGTGGCAACGGTAGACAAGGTTTCTGCGCTGCCCTGAAGAGGGGTTACTTT [서열번호 180]
따라서, 바람직하게는 상기 EVD-71 3C 프로테아제 폴리펩티드는 실질적으로 서열번호 180에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 EVD-71 3C 프로테아제 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 181로 제공된다:
GGCCCTTCTCTGGATTTTGCCCTGAGCCTGCTGCGGCGGAACATCAGACAGGTGCAGACAGATCAGGGCCACTTCACCATGCTGGGCGTCAGAGATCATCTGGCCGTGCTGCCTAGACACAGCCAGCCTGGAAAGACCATCTGGGTCGAGCACAAGCTGGTCAAGATCGTGGACGCCGTGGAACTGGTGGATGAGCAGGGCGTTAACCTGGAACTGACCCTGGTCACCCTGGACACCAACGAGAAGTTCCGGGACATCACCCGGTTCATCCCCGAGACAATTAGCCCTGCCTCCGACGCCACACTGGTCATCAATACCGAGCACATGCCCTCCATGTTCGTGCCTGTGGGAGATGTGGTGCAGTACGGCTTCCTGAACCTGAGCGGCAAGCCCACACACCGGACCATGATGTACAACTTCCCTACCAAGGCCGGCCAGTGCGGCGGAGCTGTTACAGCTGTGGGAAAAGTGATCGGCATCCACATCGGCGGCAATGGCAGACAGGGATTCTGTGCCGCTCTGAAGAGAGGCTACTTC [서열번호 181]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 181에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 181의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 182로 제공된다:
GGCCCUUCUCUGGAUUUUGCCCUGAGCCUGCUGCGGCGGAACAUCAGACAGGUGCAGACAGAUCAGGGCCACUUCACCAUGCUGGGCGUCAGAGAUCAUCUGGCCGUGCUGCCUAGACACAGCCAGCCUGGAAAGACCAUCUGGGUCGAGCACAAGCUGGUCAAGAUCGUGGACGCCGUGGAACUGGUGGAUGAGCAGGGCGUUAACCUGGAACUGACCCUGGUCACCCUGGACACCAACGAGAAGUUCCGGGACAUCACCCGGUUCAUCCCCGAGACAAUUAGCCCUGCCUCCGACGCCACACUGGUCAUCAAUACCGAGCACAUGCCCUCCAUGUUCGUGCCUGUGGGAGAUGUGGUGCAGUACGGCUUCCUGAACCUGAGCGGCAAGCCCACACACCGGACCAUGAUGUACAACUUCCCUACCAAGGCCGGCCAGUGCGGCGGAGCUGUUACAGCUGUGGGAAAAGUGAUCGGCAUCCACAUCGGCGGCAAUGGCAGACAGGGAUUCUGUGCCGCUCUGAAGAGAGGCUACUUC [서열번호 182]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 182에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 폴리오 바이러스 HEV-C 3C 프로테아제(P03300; 게놈 폴리단백질 폴리오바이러스 타입 1(마호니(Mahoney) 바이러스주) 인간 엔테로바이러스), 또는 그의 동원체이다. [Lei X, Xiao X, Wang J (2016) Innate Immunity Evasion by Enteroviruses: Insights into Virus-Host Interaction. Viruses 8, 22; doi:10.3390/v8010022]. 폴리오 바이러스 HEV-C 3C 프로테아제의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 183으로 나타낸다:
GPGFDYAVAMAKRNIVTATTSKGEFTMLGVHDNVAILPTHASPGESIVIDGKEVEILDAKALEDQAGTNLEITIITLKRNEKFRDIRPHIPTQITETNDGVLIVNTSKYPNMYVPVGAVTEQGYLNLGGRQTARTLMYNFPTRAGQCGGVITCTGKVIGMHVGGNGSHGFAAALKRSYFTQSQ [서열번호 183]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 183에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 폴리오 바이러스 HEV-C 3C 프로테아제 폴리펩티드는 다음과 같은 서열번호 184의 DNA 뉴클레오티드 서열에 의해 암호화된다:
GGACCAGGGTTCGATTACGCAGTGGCTATGGCTAAAAGAAACATTGTTACAGCAACTACTAGCAAGGGAGAGTTCACTATGTTAGGAGTCCACGACAACGTGGCTATTTTACCAACCCACGCTTCACCTGGTGAAAGCATTGTGATCGATGGCAAAGAAGTGGAGATCTTGGATGCCAAAGCGCTCGAAGATCAAGCAGGAACCAATCTTGAAATCACTATAATCACTCTAAAGAGAAATGAAAAGTTCAGAGACATTAGACCACATATACCTACTCAAATCACTGAGACAAATGATGGAGTCTTGATCGTGAACACTAGCAAGTACCCCAATATGTATGTTCCTGTCGGTGCTGTGACTGAACAGGGATATCTAAATCTCGGTGGGCGCCAAACTGCTCGTACTCTAATGTACAACTTTCCAACCAGAGCAGGACAGTGTGGTGGAGTCATCACATGTACTGGGAAAGTCATCGGGATGCATGTTGGTGGGAACGGTTCACACGGGTTTGCAGCGGCCCTGAAGCGATCATACTTCACTCAGAGTCAA [서열번호 184]
따라서, 바람직하게는 상기 폴리오 바이러스 HEV-C 3C 프로테아제 폴리펩티드는 실질적으로 서열번호 184에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 폴리오 바이러스 HEV-C 3C 프로테아제 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 185로 제공된다:
GGCCCTGGCTTTGATTATGCCGTGGCCATGGCTAAGCGGAACATCGTGACAGCCACCACCAGCAAGGGCGAGTTTACAATGCTGGGCGTGCACGACAACGTGGCCATCCTGCCTACACATGCTAGCCCTGGCGAGAGCATCGTGATCGACGGCAAAGAGGTGGAAATCCTGGACGCCAAGGCTCTGGAAGATCAGGCCGGCACCAACCTGGAAATCACCATCATCACCCTGAAGCGGAACGAGAAGTTCCGGGACATCAGACCTCACATCCCCACACAGATCACCGAGACAAACGACGGCGTGCTGATCGTGAATACCAGCAAGTACCCCAATATGTACGTGCCCGTGGGCGCCGTGACAGAGCAGGGATATCTGAATCTCGGCGGCAGACAGACCGCCAGAACACTGATGTACAACTTCCCCACCAGAGCCGGCCAGTGCGGCGGAGTGATTACATGTACCGGCAAAGTGATCGGCATGCACGTCGGCGGCAATGGCTCTCACGGATTTGCTGCCGCTCTGAAGAGAAGCTACTTCACCCAGAGCCAG [서열번호 185]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 185에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 185의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 186으로 제공된다:
GGCCCUGGCUUUGAUUAUGCCGUGGCCAUGGCUAAGCGGAACAUCGUGACAGCCACCACCAGCAAGGGCGAGUUUACAAUGCUGGGCGUGCACGACAACGUGGCCAUCCUGCCUACACAUGCUAGCCCUGGCGAGAGCAUCGUGAUCGACGGCAAAGAGGUGGAAAUCCUGGACGCCAAGGCUCUGGAAGAUCAGGCCGGCACCAACCUGGAAAUCACCAUCAUCACCCUGAAGCGGAACGAGAAGUUCCGGGACAUCAGACCUCACAUCCCCACACAGAUCACCGAGACAAACGACGGCGUGCUGAUCGUGAAUACCAGCAAGUACCCCAAUAUGUACGUGCCCGUGGGCGCCGUGACAGAGCAGGGAUAUCUGAAUCUCGGCGGCAGACAGACCGCCAGAACACUGAUGUACAACUUCCCCACCAGAGCCGGCCAGUGCGGCGGAGUGAUUACAUGUACCGGCAAAGUGAUCGGCAUGCACGUCGGCGGCAAUGGCUCUCACGGAUUUGCUGCCGCUCUGAAGAGAAGCUACUUCACCCAGAGCCAG [서열번호 186]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 186에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 폴리오바이러스 HEV-C 2A 프로테아제(P03300; 게놈 폴리단백질 폴리오바이러스 타입 1(마호니 바이러스주) 인간 엔테로바이러스), 또는 그의 동원체이다. [Feng Q, Langeris MA, Lork M, Nguyen M, Hato SV, Lanke K, Endad L, Bhoopathi P, Fisher PB, Lloyd RE, van Kuppeveld FJM (2014) Enterovirus 2Apro targets MDA5 and MAVS in infected cells. J Virol., 88, 6, 3369-3377]. 폴리오바이러스 HEV-C 2A 프로테아제의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 187로 나타낸다:
GFGHQNKAVYTAGYKICNYHLATQDDLQNAVNVMWSRDLLVTESRAQGTDSIARCNCNAGVYYCESRRKYYPVSFVGPTFQYMEANNYYPARYQSHMLIGHGFASPGDCGGILRCHHGVIGIITAGGEGLVAFSDIRDLYAYEEEAMEQ [서열번호 187]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 187에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 폴리오바이러스 HEV-C 2A 프로테아제 폴리펩티드는 다음과 같은 서열번호 188의 DNA 뉴클레오티드 서열에 의해 암호화된다:
GGATTCGGACACCAAAACAAAGCGGTGTACACTGCAGGTTACAAAATTTGCAACTACCACTTGGCCACTCAGGATGATTTGCAAAACGCAGTGAACGTCATGTGGAGTAGAGACCTCTTAGTCACAGAATCAAGAGCCCAGGGCACCGATTCAATCGCAAGGTGCAATTGCAACGCAGGGGTGTACTACTGCGAGTCTAGAAGGAAATACTACCCAGTATCCTTCGTTGGCCCAACGTTCCAGTACATGGAGGCTAATAACTATTACCCAGCTAGGTACCAGTCCCATATGCTCATTGGCCATGGATTCGCATCTCCAGGGGATTGTGGTGGCATACTCAGATGTCACCACGGGGTGATAGGGATCATTACTGCTGGTGGCGAAGGGTTGGTTGCATTTTCAGACATTAGAGACTTGTATGCCTACGAAGAAGAAGCCATGGAACAA [서열번호 188]
따라서, 바람직하게는 상기 폴리오바이러스 HEV-C 2A 프로테아제 폴리펩티드는 실질적으로 서열번호 188에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 폴리오바이러스 HEV-C 2A 프로테아제 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 189로 제공된다:
GGCTTTGGCCACCAGAACAAGGCCGTGTACACAGCCGGCTACAAGATCTGCAACTACCACCTGGCCACACAGGACGACCTGCAGAACGCCGTGAATGTGATGTGGTCCAGGGACCTGCTGGTCACCGAATCTAGAGCCCAGGGCACCGACTCTATCGCCAGATGCAACTGTAATGCCGGCGTGTACTACTGCGAGAGCCGGCGGAAGTACTACCCCGTGTCTTTTGTGGGCCCCACCTTCCAGTACATGGAAGCCAACAACTACTACCCTGCCAGATACCAGAGCCACATGCTGATCGGCCACGGCTTTGCTAGCCCTGGCGATTGTGGCGGCATCCTGAGATGTCACCATGGCGTGATCGGCATCATCACCGCTGGCGGAGAAGGACTGGTGGCCTTCAGCGACATCAGAGATCTGTACGCCTACGAAGAGGAAGCCATGGAACAG [서열번호 189]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 189에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 189의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 190으로 제공된다:
GGCUUUGGCCACCAGAACAAGGCCGUGUACACAGCCGGCUACAAGAUCUGCAACUACCACCUGGCCACACAGGACGACCUGCAGAACGCCGUGAAUGUGAUGUGGUCCAGGGACCUGCUGGUCACCGAAUCUAGAGCCCAGGGCACCGACUCUAUCGCCAGAUGCAACUGUAAUGCCGGCGUGUACUACUGCGAGAGCCGGCGGAAGUACUACCCCGUGUCUUUUGUGGGCCCCACCUUCCAGUACAUGGAAGCCAACAACUACUACCCUGCCAGAUACCAGAGCCACAUGCUGAUCGGCCACGGCUUUGCUAGCCCUGGCGAUUGUGGCGGCAUCCUGAGAUGUCACCAUGGCGUGAUCGGCAUCAUCACCGCUGGCGGAGAAGGACUGGUGGCCUUCAGCGACAUCAGAGAUCUGUACGCCUACGAAGAGGAAGCCAUGGAACAG [서열번호 190]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 190에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 CVB3 2A 프로테아제(P03313; 게놈 폴리단백질 콕사키바이러스 B3(낸시(Nancy) 바이러스주)), 또는 그의 동원체이다. CVB3 2A 프로테아제의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 191로 나타낸다:
GAFGQQSGAVYVGNYRVVNRHLATSADWQNCVWESYNRDLLVSTTTAHGCDIIARCQCTTGVYFCASKNKHYPISFEGPGLVEVQESEYYPRRYQSHVLLAAGFSEPGDCGGILRCEHGVIGIVTMGGEGVVGFADIRDLLWLEDDAMEQ [서열번호 191]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 191에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 CVB3 2A 프로테아제 폴리펩티드는 다음과 같은 서열번호 192의 DNA 뉴클레오티드 서열에 의해 암호화된다:
GGCGCATTTGGACAACAATCAGGGGCAGTGTATGTGGGGAACTACAGGGTGGTAAATAGACATCTAGCTACCAGTGCTGACTGGCAAAACTGTGTGTGGGAAAGTTACAACAGAGACCTCTTAGTGAGCACGACCACAGCACATGGATGTGATATTATAGCCAGATGTCAGTGCACAACGGGAGTGTACTTTTGTGCGTCCAAAAACAAGCACTACCCAATTTCGTTTGAAGGACCAGGTCTAGTAGAGGTCCAAGAGAGTGAATACTACCCCAGGAGATACCAATCCCATGTGCTTTTAGCAGCTGGATTTTCCGAACCAGGTGACTGTGGCGGTATCCTAAGGTGTGAGCATGGTGTCATTGGCATTGTGACCATGGGGGGTGAAGGCGTGGTCGGCTTTGCAGACATCCGTGATCTCCTGTGGCTGGAAGATGATGCAATGGAACAG [서열번호 192]
따라서, 바람직하게는 상기 CVB3 2A 프로테아제 폴리펩티드는 실질적으로 서열번호 192에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 CVB3 2A 프로테아제 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 193으로 제공된다:
GGAGCTTTTGGACAGCAGTCTGGCGCCGTGTACGTGGGCAATTACCGGGTCGTGAATAGACACCTGGCCACCTCTGCCGACTGGCAGAATTGTGTGTGGGAGAGCTACAACCGGGACCTGCTGGTGTCTACCACAACAGCCCACGGCTGCGACATCATTGCCAGATGCCAGTGTACAACCGGCGTGTACTTCTGCGCCAGCAAGAACAAGCACTACCCCATCAGCTTCGAAGGCCCTGGCCTGGTGGAAGTGCAAGAGAGCGAGTACTACCCTCGGAGATACCAGAGCCACGTGCTGCTGGCCGCTGGCTTTTCTGAACCTGGCGATTGTGGCGGCATCCTGAGATGTGAACACGGCGTGATCGGCATCGTGACCATGGGCGGAGAAGGCGTTGTGGGCTTCGCCGACATTAGAGATCTGCTGTGGCTGGAAGATGACGCCATGGAACAG [서열번호 193]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 193에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 193의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 194로 제공된다:
GGAGCUUUUGGACAGCAGUCUGGCGCCGUGUACGUGGGCAAUUACCGGGUCGUGAAUAGACACCUGGCCACCUCUGCCGACUGGCAGAAUUGUGUGUGGGAGAGCUACAACCGGGACCUGCUGGUGUCUACCACAACAGCCCACGGCUGCGACAUCAUUGCCAGAUGCCAGUGUACAACCGGCGUGUACUUCUGCGCCAGCAAGAACAAGCACUACCCCAUCAGCUUCGAAGGCCCUGGCCUGGUGGAAGUGCAAGAGAGCGAGUACUACCCUCGGAGAUACCAGAGCCACGUGCUGCUGGCCGCUGGCUUUUCUGAACCUGGCGAUUGUGGCGGCAUCCUGAGAUGUGAACACGGCGUGAUCGGCAUCGUGACCAUGGGCGGAGAAGGCGUUGUGGGCUUCGCCGACAUUAGAGAUCUGCUGUGGCUGGAAGAUGACGCCAUGGAACAG [서열번호 194]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 194에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 EV71 2A 프로테아제(B9VUU3; 게놈 폴리단백질 인간 엔테로바이러스 71), 또는 그의 동원체이다. EV71 2A 프로테아제의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 195로 나타낸다:
GKFGQQSGAIYVGNFRVVNRHLATHNDWANLVWEDSSRDLLVSSTTAQGCDTIARCNCQTGVYYCNSRRKHYPVSFSKPSLIYVEASEYYPARYQSHLMLAQGHSEPGDCGGILRCQHGVVGIVSTGGNGLVGFADVRDLLWLDEEAMEQ [서열번호 195]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 195에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 EV71 2A 프로테아제 폴리펩티드는 다음과 같은 서열번호 196의 DNA 뉴클레오티드 서열에 의해 암호화된다:
GGAAAATTTGGGCAACAGTCTGGGGCCATTTATGTGGGTAACTTTAGAGTGGTCAACCGTCATCTTGCCACTCACAATGATTGGGCAAATCTTGTTTGGGAAGACAGCTCTCGCGACTTACTCGTGTCATCCACCACCGCCCAAGGTTGTGACACGATTGCCCGCTGCAATTGCCAGACAGGGGTGTACTACTGTAACTCGAGGAGAAAACACTACCCAGTCAGTTTTTCAAAACCCAGTCTGATCTATGTAGAGGCTAGCGAGTATTACCCAGCCAGGTACCAGTCACATCTTATGCTCGCACAGGGCCACTCAGAGCCTGGTGATTGCGGTGGTATCCTTAGATGCCAACATGGCGTCGTCGGTATAGTGTCAACTGGTGGTAACGGGCTCGTTGGCTTTGCAGACGTCAGGGACCTCTTGTGGTTAGATGAAGAAGCTATGGAGCAG [서열번호 196]
따라서, 바람직하게는 상기 EV71 2A 프로테아제 폴리펩티드는 실질적으로 서열번호 196에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 EV71 2A 프로테아제 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 197로 제공된다:
GGCAAGTTTGGACAGCAGAGCGGCGCCATCTACGTGGGCAATTTCCGGGTCGTGAACCGGCACCTGGCCACACATAACGACTGGGCCAATCTCGTGTGGGAAGATAGCAGCAGGGACCTGCTGGTGTCCAGCACAACAGCCCAGGGCTGCGATACAATCGCCAGATGCAATTGCCAGACCGGCGTGTACTACTGCAACAGCAGACGGAAGCACTACCCCGTGTCCTTCAGCAAGCCCAGCCTGATCTATGTGGAAGCCAGCGAGTACTACCCCGCCAGATACCAGTCTCACCTGATGCTGGCCCAGGGCCATTCTGAGCCAGGCGATTGTGGCGGAATCCTGAGATGCCAGCATGGCGTCGTGGGCATTGTGTCTACCGGCGGAAATGGCCTCGTGGGATTTGCCGATGTTCGCGACCTGCTGTGGCTGGACGAAGAGGCTATGGAACAG [서열번호 197]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 197에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 197의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 198로 제공된다:
GGCAAGUUUGGACAGCAGAGCGGCGCCAUCUACGUGGGCAAUUUCCGGGUCGUGAACCGGCACCUGGCCACACAUAACGACUGGGCCAAUCUCGUGUGGGAAGAUAGCAGCAGGGACCUGCUGGUGUCCAGCACAACAGCCCAGGGCUGCGAUACAAUCGCCAGAUGCAAUUGCCAGACCGGCGUGUACUACUGCAACAGCAGACGGAAGCACUACCCCGUGUCCUUCAGCAAGCCCAGCCUGAUCUAUGUGGAAGCCAGCGAGUACUACCCCGCCAGAUACCAGUCUCACCUGAUGCUGGCCCAGGGCCAUUCUGAGCCAGGCGAUUGUGGCGGAAUCCUGAGAUGCCAGCAUGGCGUCGUGGGCAUUGUGUCUACCGGCGGAAAUGGCCUCGUGGGAUUUGCCGAUGUUCGCGACCUGCUGUGGCUGGACGAAGAGGCUAUGGAACAG [서열번호 198]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 198에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 hMPV G 단백질(Q6WB94; 주요 표면 당단백질 G 인간 메타뉴모바이러스(CAN97-83 바이러스주)), 또는 그의 동원체이다. [Bao X, Liu T, Shan Y, Li K, Garofolo RP, Casola A (2008) Human Metapneumovirus Glycoprotein G Inhibits Innate Immune Responses. PLOS Pathogens, 4, 5, e1000077]. hMPV G 단백질의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 199로 제공된다:
MEVKVENIRAIDMLKARVKNRVARSKCFKNASLILIGITTLSIALNIYLIINYTIQKTSSESEHHTSSPPTESNKEASTISTDNPDINPNSQHPTQQSTENPTLNPAASVSPSETEPASTPDTTNRLSSVDRSTAQPSESRTKTKPTVHTRNNPSTASSTQSPPRATTKAIRRATTFRMSSTGKRPTTTSVQSDSSTTTQNHEETGSANPQASVSTMQN [서열번호 199]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 199에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 hMPV G 폴리펩티드는 다음과 같은 서열번호 200의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGAGGTGAAAGTAGAGAACATTCGAGCAATAGACATGCTCAAAGCAAGAGTGAAAAATCGTGTGGCACGTAGCAAATGCTTTAAAAATGCTTCTTTAATCCTCATAGGAATAACTACACTGAGTATAGCTCTCAATATCTATCTGATCATAAACTACACAATACAAAAAACCTCATCTGAATCAGAACACCACACCAGCTCACCACCCACAGAATCCAACAAGGAAGCTTCAACAATCTCCACAGACAACCCAGACATCAATCCAAACTCACAGCATCCAACTCAACAGTCCACAGAAAACCCCACACTCAACCCCGCAGCATCAGTGAGCCCATCAGAAACAGAACCAGCATCAACACCAGACACAACAAACCGCCTGTCCTCCGTAGACAGGTCCACAGCACAACCAAGTGAAAGCAGAACAAAGACAAAACCGACAGTCCACACAAGAAACAACCCAAGCACAGCTTCCAGTACACAATCCCCACCACGGGCAACAACGAAGGCAATCCGCAGAGCCACCACTTTCCGCATGAGCAGCACAGGAAAAAGACCAACCACAACATCAGTCCAGTCCGACAGCAGCACCACAACCCAAAATCATGAAGAAACAGGTTCAGCGAACCCACAGGCATCTGTAAGCACAATGCAAAAC [서열번호 200]
따라서, 바람직하게는 상기 hMPV G 폴리펩티드는 실질적으로 서열번호 200에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 hMPV G 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 201로 제공된다:
ATGGAAGTGAAGGTCGAGAACATCCGGGCCATCGACATGCTGAAGGCCAGAGTGAAGAACAGAGTGGCCCGGTCCAAGTGCTTCAAGAACGCCAGCCTGATCCTGATCGGCATCACCACACTGTCTATCGCCCTGAACATCTACCTGATCATCAACTACACCATCCAGAAAACCAGCAGCGAGAGCGAGCACCACACAAGCTCTCCACCTACCGAGAGCAACAAAGAGGCCAGCACCATCAGCACCGACAATCCCGACATCAACCCCAACTCTCAGCACCCCACACAGCAGTCCACCGAGAATCCCACACTGAACCCTGCCGCCTCTGTGTCCCCATCTGAGACAGAACCTGCCAGCACACCCGACACCACCAACAGACTGTCTAGCGTGGACAGAAGCACAGCCCAGCCTAGCGAGAGCCGGACCAAGACAAAACCTACCGTGCACACCCGGAACAACCCTAGCACAGCCAGCTCTACACAGAGCCCTCCAAGAGCCACCACCAAGGCCATTAGAAGGGCCACCACCTTCCGGATGAGCAGCACCGGCAAAAGACCTACCACCACCAGCGTGCAGAGCGACAGCAGCACAACCACACAGAACCACGAGGAAACCGGCAGCGCCAATCCTCAGGCTAGCGTGTCCACCATGCAGAAC [서열번호 201]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 201에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 201의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 202로 제공된다:
AUGGAAGUGAAGGUCGAGAACAUCCGGGCCAUCGACAUGCUGAAGGCCAGAGUGAAGAACAGAGUGGCCCGGUCCAAGUGCUUCAAGAACGCCAGCCUGAUCCUGAUCGGCAUCACCACACUGUCUAUCGCCCUGAACAUCUACCUGAUCAUCAACUACACCAUCCAGAAAACCAGCAGCGAGAGCGAGCACCACACAAGCUCUCCACCUACCGAGAGCAACAAAGAGGCCAGCACCAUCAGCACCGACAAUCCCGACAUCAACCCCAACUCUCAGCACCCCACACAGCAGUCCACCGAGAAUCCCACACUGAACCCUGCCGCCUCUGUGUCCCCAUCUGAGACAGAACCUGCCAGCACACCCGACACCACCAACAGACUGUCUAGCGUGGACAGAAGCACAGCCCAGCCUAGCGAGAGCCGGACCAAGACAAAACCUACCGUGCACACCCGGAACAACCCUAGCACAGCCAGCUCUACACAGAGCCCUCCAAGAGCCACCACCAAGGCCAUUAGAAGGGCCACCACCUUCCGGAUGAGCAGCACCGGCAAAAGACCUACCACCACCAGCGUGCAGAGCGACAGCAGCACAACCACACAGAACCACGAGGAAACCGGCAGCGCCAAUCCUCAGGCUAGCGUGUCCACCAUGCAGAAC [서열번호 202]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 202에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
다음의 바이러스 IIP는 RIG-I의 절단을 유발하는 것으로 여겨진다.
한 구현예에서, 상기 적어도 하나의 IIP는 CVB3 3C 프로테아제(P03313; 게놈 폴리단백질 콕사키바이러스 B3(낸시 바이러스주)), 또는 그의 동원체이다. [Xiao H, Li J, Yang X, Li Z, Wang Y, Rui Y, Liu R, Zhang W (2021) Ectopic Expression of TRIM25 Restores RIG-I Expression and IFN Production Reduced by Multiple Enteroviruses 3Cpro. Virol Sin,: 1-12.doi: 10.1007/s12250-021-00410-x]. CVB3 3C 프로테아제의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 203으로 나타낸다:
GPAFEFAVAMMKRNSSTVKTEYGEFTMLGIYDRWAVLPRHAKPGPTILMNDQEVGVLDAKELVDKDGTNLELTLLKLNRNEKFRDIRGFLAKEEVEVNEAVLAINTSKFPNMYIPVGQVTEYGFLNLGGTPTKRMLMYNFPTRAGQCGGVLMSTGKVLGIHVGGNGHQGFSAALLKHYFNDEQ [서열번호 203]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 203에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 CVB3 3C 프로테아제 폴리펩티드는 다음과 같은 서열번호 204의 DNA 뉴클레오티드 서열에 의해 암호화된다:
GGCCCTGCCTTTGAGTTCGCCGTCGCAATGATGAAAAGGAACTCAAGCACGGTGAAAACTGAATATGGCGAGTTTACCATGCTGGGCATCTATGACAGGTGGGCCGTTTTGCCACGCCACGCCAAACCTGGGCCAACCATCTTGATGAATGATCAAGAGGTTGGTGTGCTAGATGCCAAGGAGCTAGTAGACAAGGACGGCACCAACTTAGAACTGACACTACTCAAATTGAACCGGAATGAGAAGTTCAGAGACATCAGAGGCTTCTTAGCCAAGGAGGAAGTGGAGGTTAATGAGGCAGTGCTAGCAATTAACACCAGCAAGTTTCCCAACATGTACATTCCAGTAGGACAGGTCACAGAATACGGCTTCCTAAACCTAGGTGGCACACCCACCAAGAGAATGCTTATGTACAACTTCCCCACAAGAGCAGGCCAGTGTGGTGGAGTGCTCATGTCCACCGGCAAGGTACTGGGTATCCATGTTGGTGGAAATGGCCATCAGGGCTTCTCAGCAGCACTCCTCAAACACTACTTCAATGATGAGCAA [서열번호 204]
따라서, 바람직하게는 상기 CVB3 3C 프로테아제 폴리펩티드는 실질적으로 서열번호 204에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 CVB3 3C 프로테아제 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 205로 제공된다:
GGACCTGCCTTTGAATTCGCCGTGGCCATGATGAAGCGGAACAGCAGCACCGTGAAAACCGAGTACGGCGAGTTCACCATGCTGGGCATCTACGACAGATGGGCCGTGCTGCCTAGACACGCCAAACCTGGACCTACCATCCTGATGAACGACCAAGAAGTGGGCGTTCTGGACGCCAAAGAACTGGTGGACAAGGACGGCACCAACCTGGAACTGACCCTGCTGAAGCTGAACCGGAACGAGAAGTTCCGGGATATCAGAGGCTTCCTGGCCAAAGAAGAGGTGGAAGTCAACGAAGCCGTGCTGGCCATCAACACCAGCAAGTTCCCCAACATGTACATCCCCGTGGGCCAAGTGACAGAGTACGGCTTCCTGAATCTCGGCGGCACCCCTACCAAGCGGATGCTGATGTACAACTTCCCCACCAGAGCCGGCCAGTGTGGCGGAGTTCTTATGTCTACCGGCAAGGTGCTGGGAATCCACGTTGGCGGAAATGGCCACCAGGGCTTTTCTGCCGCTCTGCTGAAACACTACTTCAACGACGAGCAG [서열번호 205]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 205에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 205의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 206으로 제공된다:
GGACCUGCCUUUGAAUUCGCCGUGGCCAUGAUGAAGCGGAACAGCAGCACCGUGAAAACCGAGUACGGCGAGUUCACCAUGCUGGGCAUCUACGACAGAUGGGCCGUGCUGCCUAGACACGCCAAACCUGGACCUACCAUCCUGAUGAACGACCAAGAAGUGGGCGUUCUGGACGCCAAAGAACUGGUGGACAAGGACGGCACCAACCUGGAACUGACCCUGCUGAAGCUGAACCGGAACGAGAAGUUCCGGGAUAUCAGAGGCUUCCUGGCCAAAGAAGAGGUGGAAGUCAACGAAGCCGUGCUGGCCAUCAACACCAGCAAGUUCCCCAACAUGUACAUCCCCGUGGGCCAAGUGACAGAGUACGGCUUCCUGAAUCUCGGCGGCACCCCUACCAAGCGGAUGCUGAUGUACAACUUCCCCACCAGAGCCGGCCAGUGUGGCGGAGUUCUUAUGUCUACCGGCAAGGUGCUGGGAAUCCACGUUGGCGGAAAUGGCCACCAGGGCUUUUCUGCCGCUCUGCUGAAACACUACUUCAACGACGAGCAG [서열번호 206]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 206에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 C형 간염 NS3/4A(O39929; 게놈 폴리단백질 C형 간염 바이러스 유전자형 4a(ED43 단리물)), 또는 그의 동원체이다. C형 간염 NS3/4A의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 207로 나타낸다:
APITAYAQQTRGLFSTIVTSLTGRDTNENCGEVQVLSTATQSFLGTAVNGVMWTVYHGAGAKTISGPKGPVNQMYTNVDQDLVGWPAPPGVRSLAPCTCGSADLYLVTRHADVIPVRRRGDTRGALLSPRPISILKGSSGGPLLCPMGHRAGIFRAAVCTRGVAKAVDFVPVESLETTMRSPVFTDNSTPPAVPQTYQVAHLHAPTGSGKSTKVPAAHAAQGYKVLVLNPSVAATLGFGVYMSKAYGIDPNIRSGVRTITTGAPITYSTYGKFLADGGCSGGAYDIIICDECYSTDSTTILGIGTVLDQAETAGVRLTVLATATPPGSVTTPHSNIEEVALPTTGEIPFYGKAIPLELIKGGRHLIFCHSKKKCDELARQLTSLGLNAVAYYRGLDVSVIPTSGDVVVCATDALMTGFTGDFDSVIDCNTSVIQTVDFSLDPTFSIEITTVPQDAVSRSQRRGRTGRGRLGTYRYVTPGERPSGMFDTAELCECYDAGCAWYELTPAETTTRLKAYFDTPGLPVCQDHLEFWESVFTGLTHIDGHFLSQTKQSGENFPYLVAYQATVSAKVWLAPPSWDTMWKCLIRLKPTLHGPTPLLYRLGSVQNEVVLTHPITKYIMACMSADLEVVT [서열번호 207]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 207에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 C형 간염 NS3/4A 폴리펩티드는 다음과 같은 서열번호 208의 DNA 뉴클레오티드 서열에 의해 암호화된다:
GCCCCCATCACAGCATACGCaCAGCAGACCCGCGGCTTGTTCAGCACCATCGTAACGAGCCTCACTGGCAGGGACACCAATGAGAATTGTGGCGAAGTGCAGGTCTTATCCACCGCTACGCAGTCCTTCCTGGGTACTGCGGTTAACGGCGTGATGTGGACCGTCTACCACGGGGCGGGTGCCAAGACCATCAGCGGCCCGAAGGGACCTGTCAATCAAATGTACACTAATGTTGACCAAGACTTGGTGGGGTGGCCAGCACCCCCCGGAGTCAGATCTCTTGCTCCGTGCACCTGCGGCTCGGCAGACTTGTATCTAGTCACCAGGCACGCGGATGTAATACCCGTGCGCAGGAGAGGAGACACCAGAGGAGCTCTCTTGAGCCCTAGACCAATATCCATTCTTAAGGGATCTTCCGGAGGTCCGCTGCTGTGCCCCATGGGACACCGCGCCGGCATATTCCGTGCGGCGGTGTGTACTCGGGGGGTAGCCAAGGCGGTAGACTTCGTCCCGGTTGAATCTCTTGAGACTACCATGAGATCACCAGTGTTCACTGACAACTCAACACCCCCAGCAGTGCCCCAGACCTACCAGGTCGCGCACCTACACGCACCAACAGGAAGTGGCAAGAGCACTAAGGTCCCGGCGGCGCATGCTGCCCAAGGCTATAAAGTGCTAGTGCTCAATCCTTCGGTTGCGGCCACACTGGGTTTTGGGGTATACATGTCCAAGGCATATGGCATCGACCCGAACATCCGGTCGGGAGTCAGGACCATCACCACGGGTGCGCCAATCACGTACTCAACGTATGGTAAGTTCCTGGCTGATGGAGGTTGCAGCGGAGGGGCATACGACATAATCATCTGTGACGAGTGCTATTCCACTGACTCCACAACGATCCTTGGCATAGGCACAGTCCTGGACCAAGCGGAGACCGCTGGAGTGCGCCTCACCGTGCTCGCGACTGCTACTCCGCCAGGGTCAGTGACTACACCTCATTCCAACATAGAGGAGGTCGCCCTGCCAACAACGGGGGAAATACCCTTTTACGGCAAGGCGATCCCTCTGGAGCTGATCAAGGGGGGCAGACATCTCATCTTCTGCCATTCAAAGAAAAAGTGCGATGAACTGGCCAGACAACTGACATCTCTTGGTCTGAATGCCGTAGCCTACTACAGAGGCTTAGACGTTTCGGTGATTCCCACGTCTGGGGACGTCGTGGTATGCGCCACGGACGCCCTCATGACGGGTTTCACCGGCGACTTTGACTCAGTGATAGACTGCAATACATCTGTGATACAGACTGTTGACTTCAGCTTGGACCCCACCTTCTCCATAGAGATTACAACCGTTCCCCAGGACGCGGTATCCCGCAGCCAGCGGAGAGGCCGCACTGGTAGGGGGAGGTTGGGCACATACCGGTATGTCACCCCGGGAGAGAGACCATCAGGCATGTTTGACACTGCAGAGCTTTGCGAGTGCTACGATGCCGGGTGCGCCTGGTACGAGCTGACACCTGCTGAAACCACAACAAGGCTGAAAGCTTACTTCGACACACCAGGCCTTCCTGTGTGCCAAGACCATCTGGAATTCTGGGAGAGCGTCTTTACAGGGTTAACCCACATAGACGGTCATTTCCTATCCCAGACCAAGCAATCGGGTGAGAATTTCCCGTATCTTGTTGCTTACCAAGCGACGGTGTCGGCCAAGGTCTGGCTCGCTCCACCAAGCTGGGACACCATGTGGAAGTGCCTAATTCGCCTTAAGCCCACCCTGCACGGGCCCACGCCCCTCCTCTACAGACTGGGGTCTGTGCAGAATGAAGTGGTGCTCACCCATCCCATCACCAAATACATCATGGCTTGCATGTCAGCTGATCTCGAGGTAGTGACA [서열번호 208]
따라서, 바람직하게는 상기 C형 간염 NS3/4A 폴리펩티드는 실질적으로 서열번호 208에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 C형 간염 NS3/4A 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 209로 제공된다:
GCCCCTATCACAGCCTACGCTCAGCAGACCAGAGGCCTGTTCAGCACCATCGTGACAAGCCTGACCGGCAGAGACACCAACGAGAATTGTGGCGAGGTGCAGGTCCTGTCTACAGCTACCCAGAGCTTTCTGGGCACCGCCGTGAATGGCGTGATGTGGACAGTGTATCATGGCGCTGGCGCCAAGACAATCTCTGGCCCTAAGGGCCCCGTGAACCAGATGTACACCAACGTGGACCAGGACCTCGTTGGCTGGCCTGCTCCTCCTGGTGTTAGAAGCCTGGCTCCTTGTACATGCGGCAGCGCCGATCTGTACCTGGTCACAAGACACGCCGACGTGATCCCCGTCAGAAGAAGAGGCGATACAAGAGGCGCCCTGCTGAGCCCTAGACCTATCTCTATCCTGAAGGGCAGCTCTGGCGGCCCTCTGCTTTGTCCTATGGGACACAGAGCCGGCATCTTCAGAGCCGCCGTGTGTACTAGAGGCGTGGCCAAGGCTGTGGACTTCGTGCCTGTGGAAAGCCTGGAAACCACCATGAGAAGCCCCGTGTTCACCGACAACAGCACCCCTCCAGCTGTGCCTCAGACATACCAGGTGGCCCATCTGCATGCCCCTACAGGCTCTGGCAAGAGCACAAAAGTGCCTGCCGCTCATGCTGCCCAGGGCTATAAGGTGCTGGTGCTCAATCCTAGCGTGGCCGCCACACTCGGCTTTGGCGTGTACATGTCTAAGGCCTACGGCATCGACCCCAACATCAGATCTGGCGTGCGGACCATCACAACAGGCGCCCCAATCACCTACTCTACCTACGGCAAGTTCCTGGCCGATGGCGGATGTTCTGGCGGAGCCTACGACATCATCATCTGCGACGAGTGCTACAGCACCGACAGCACCACAATCCTCGGCATCGGCACAGTGCTGGATCAGGCTGAAACAGCCGGCGTCAGACTGACTGTGCTGGCCACAGCTACACCTCCAGGCAGCGTGACAACCCCTCACAGCAACATCGAGGAAGTGGCCCTGCCTACAACCGGCGAGATCCCATTCTATGGCAAGGCCATTCCTCTCGAGCTGATCAAAGGCGGCAGACACCTGATCTTTTGCCACAGCAAGAAGAAGTGCGACGAGCTGGCCAGACAGCTGACATCCCTGGGACTGAATGCCGTGGCCTACTACAGAGGACTGGACGTGTCCGTGATTCCCACATCTGGCGACGTGGTCGTGTGTGCCACAGATGCCCTGATGACCGGCTTCACCGGCGACTTCGATAGCGTGATCGACTGCAACACCAGCGTGATCCAGACCGTGGACTTCTCTCTGGACCCCACCTTCAGCATCGAGATCACCACCGTTCCTCAGGACGCCGTGTCTCGGTCACAGAGAAGAGGCAGAACAGGCAGAGGCCGGCTGGGCACATACAGATATGTGACACCCGGCGAAAGACCCAGCGGCATGTTTGATACAGCCGAGCTGTGCGAGTGTTACGACGCCGGATGTGCTTGGTACGAGCTGACACCAGCCGAGACAACCACCAGACTGAAGGCCTACTTCGACACCCCTGGCCTGCCTGTGTGTCAGGACCACCTGGAATTTTGGGAGAGCGTGTTCACAGGACTGACCCACATCGACGGCCACTTTCTGAGCCAGACCAAGCAGAGCGGCGAGAACTTCCCTTACCTGGTGGCCTATCAGGCTACCGTGTCCGCCAAAGTTTGGCTGGCTCCTCCTAGCTGGGACACCATGTGGAAGTGCCTGATCCGGCTGAAGCCTACACTGCACGGACCTACACCTCTGCTGTACAGACTGGGCAGCGTGCAGAATGAGGTGGTGCTGACCCATCCTATCACCAAGTACATCATGGCCTGCATGAGCGCCGACCTGGAAGTGGTTACA [서열번호 209]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 209에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 209의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 210으로 제공된다:
GCCCCUAUCACAGCCUACGCUCAGCAGACCAGAGGCCUGUUCAGCACCAUCGUGACAAGCCUGACCGGCAGAGACACCAACGAGAAUUGUGGCGAGGUGCAGGUCCUGUCUACAGCUACCCAGAGCUUUCUGGGCACCGCCGUGAAUGGCGUGAUGUGGACAGUGUAUCAUGGCGCUGGCGCCAAGACAAUCUCUGGCCCUAAGGGCCCCGUGAACCAGAUGUACACCAACGUGGACCAGGACCUCGUUGGCUGGCCUGCUCCUCCUGGUGUUAGAAGCCUGGCUCCUUGUACAUGCGGCAGCGCCGAUCUGUACCUGGUCACAAGACACGCCGACGUGAUCCCCGUCAGAAGAAGAGGCGAUACAAGAGGCGCCCUGCUGAGCCCUAGACCUAUCUCUAUCCUGAAGGGCAGCUCUGGCGGCCCUCUGCUUUGUCCUAUGGGACACAGAGCCGGCAUCUUCAGAGCCGCCGUGUGUACUAGAGGCGUGGCCAAGGCUGUGGACUUCGUGCCUGUGGAAAGCCUGGAAACCACCAUGAGAAGCCCCGUGUUCACCGACAACAGCACCCCUCCAGCUGUGCCUCAGACAUACCAGGUGGCCCAUCUGCAUGCCCCUACAGGCUCUGGCAAGAGCACAAAAGUGCCUGCCGCUCAUGCUGCCCAGGGCUAUAAGGUGCUGGUGCUCAAUCCUAGCGUGGCCGCCACACUCGGCUUUGGCGUGUACAUGUCUAAGGCCUACGGCAUCGACCCCAACAUCAGAUCUGGCGUGCGGACCAUCACAACAGGCGCCCCAAUCACCUACUCUACCUACGGCAAGUUCCUGGCCGAUGGCGGAUGUUCUGGCGGAGCCUACGACAUCAUCAUCUGCGACGAGUGCUACAGCACCGACAGCACCACAAUCCUCGGCAUCGGCACAGUGCUGGAUCAGGCUGAAACAGCCGGCGUCAGACUGACUGUGCUGGCCACAGCUACACCUCCAGGCAGCGUGACAACCCCUCACAGCAACAUCGAGGAAGUGGCCCUGCCUACAACCGGCGAGAUCCCAUUCUAUGGCAAGGCCAUUCCUCUCGAGCUGAUCAAAGGCGGCAGACACCUGAUCUUUUGCCACAGCAAGAAGAAGUGCGACGAGCUGGCCAGACAGCUGACAUCCCUGGGACUGAAUGCCGUGGCCUACUACAGAGGACUGGACGUGUCCGUGAUUCCCACAUCUGGCGACGUGGUCGUGUGUGCCACAGAUGCCCUGAUGACCGGCUUCACCGGCGACUUCGAUAGCGUGAUCGACUGCAACACCAGCGUGAUCCAGACCGUGGACUUCUCUCUGGACCCCACCUUCAGCAUCGAGAUCACCACCGUUCCUCAGGACGCCGUGUCUCGGUCACAGAGAAGAGGCAGAACAGGCAGAGGCCGGCUGGGCACAUACAGAUAUGUGACACCCGGCGAAAGACCCAGCGGCAUGUUUGAUACAGCCGAGCUGUGCGAGUGUUACGACGCCGGAUGUGCUUGGUACGAGCUGACACCAGCCGAGACAACCACCAGACUGAAGGCCUACUUCGACACCCCUGGCCUGCCUGUGUGUCAGGACCACCUGGAAUUUUGGGAGAGCGUGUUCACAGGACUGACCCACAUCGACGGCCACUUUCUGAGCCAGACCAAGCAGAGCGGCGAGAACUUCCCUUACCUGGUGGCCUAUCAGGCUACCGUGUCCGCCAAAGUUUGGCUGGCUCCUCCUAGCUGGGACACCAUGUGGAAGUGCCUGAUCCGGCUGAAGCCUACACUGCACGGACCUACACCUCUGCUGUACAGACUGGGCAGCGUGCAGAAUGAGGUGGUGCUGACCCAUCCUAUCACCAAGUACAUCAUGGCCUGCAUGAGCGCCGACCUGGAAGUGGUUACA [서열번호 210]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 210에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 DENV NS3 단백질(P17763; 게놈 폴리단백질 뎅기(Dengue) 바이러스 타입 1(나우루(Nauru)/West Pac/1974 바이러스주)), 또는 그의 동원체이다. DENV NS3 단백질의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 211로 나타낸다:
SGVLWDTPSPPEVERAVLDDGIYRILQRGLLGRSQVGVGVFQEGVFHTMWHVTRGAVLMYQGKRLEPSWASVKKDLISYGGGWRFQGSWNAGEEVQVIAVEPGKNPKNVQTAPGTFKTPEGEVGAIALDFKPGTSGSPIVNREGKIVGLYGNGVVTTSGTYVSAIAQAKASQEGPLPEIEDEVFRKRNLTIMDLHPGSGKTRRYLPAIVREAIRRNVRTLVLAPTRVVASEMAEALKGMPIRYQTTAVKSEHTGKEIVDLMCHATFTMRLLSPVRVPNYNMIIMDEAHFTDPASIAARGYISTRVGMGEAAAIFMTATPPGSVEAFPQSNAVIQDEERDIPERSWNSGYDWITDFPGKTVWFVPSIKSGNDIANCLRKNGKRVVQLSRKTFDTEYQKTKNNDWDYVVTTDISEMGANFRADRVIDPRRCLKPVILKDGPERVILAGPMPVTVASAAQRRGRIGRNQNKEGDQYIYMGQPLNNDEDHAHWTEAKMLLDNINTPEGIIPALFEPEREKSAAIDGEYRLRGEARKTFVELMRRGDLPVWLSYKVASEGFQYSDRRWCFDGERNNQVLEENMDVEIWTKEGERKKLRPRWLDARTYSDPLALREFKEFAAGRR [서열번호 211]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 211에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 DENV NS3 폴리펩티드는 다음과 같은 서열번호 212의 DNA 뉴클레오티드 서열에 의해 암호화된다:
TCAGGAGTGCTATGGGACACACCCAGCCCTCCAGAAGTGGAAAGAGCAGTCCTTGATGATGGCATTTATAGAATTCTCCAAAGAGGATTGTTGGGCAGGTCTCAAGTAGGAGTAGGAGTTTTTCAAGAAGGCGTGTTCCACACAATGTGGCACGTCACCAGGGGAGCTGTCCTCATGTACCAAGGGAAGAGACTGGAACCAAGTTGGGCCAGTGTCAAAAAAGACTTGATCTCATATGGAGGAGGTTGGAGGTTTCAAGGATCCTGGAACGCGGGAGAAGAAGTGCAGGTGATTGCTGTTGAACCGGGGAAGAACCCCAAAAATGTACAGACAGCGCCGGGTACCTTCAAGACCCCTGAAGGCGAAGTTGGAGCCATAGCTCTAGACTTTAAACCCGGCACATCTGGATCTCCTATCGTGAACAGAGAGGGAAAAATAGTAGGTCTTTATGGAAATGGAGTGGTGACAACAAGTGGTACCTACGTCAGCGCCATAGCTCAAGCTAAAGCATCACAAGAAGGGCCTCTACCAGAGATTGAGGACGAGGTGTTTAGGAAAAGAAACTTAACAATAATGGACCTACATCCAGGATCGGGGAAAACAAGAAGATATCTTCCAGCCATAGTCCGTGAGGCCATAAGAAGGAACGTGCGCACGCTAGTCTTAGCTCCCACAAGAGTTGTCGCTTCTGAAATGGCAGAGGCGCTCAAGGGAATGCCAATAAGGTATCAGACAACAGCAGTGAAGAGTGAACACACAGGAAAAGAGATAGTTGACCTTATGTGTCACGCCACTTTCACTATGCGTCTCCTGTCTCCTGTGAGAGTTCCCAATTATAATATGATTATCATGGATGAAGCACATTTTACCGATCCAGCCAGCATAGCAGCCAGAGGGTATATCTCAACCCGAGTGGGTATGGGTGAAGCAGCTGCGATTTTCATGACAGCCACTCCCCCCGGATCGGTGGAGGCCTTTCCACAGAGCAATGCAGTTATCCAAGATGAGGAAAGAGACATTCCTGAAAGATCATGGAACTCAGGCTATGACTGGATCACTGATTTCCCAGGTAAAACAGTCTGGTTTGTTCCAAGCATCAAATCAGGAAATGACATTGCCAACTGTTTAAGAAAGAATGGGAAACGGGTGGTCCAATTGAGCAGAAAAACTTTTGACACTGAGTACCAGAAAACAAAAAATAACGACTGGGACTATGTTGTCACAACAGACATATCCGAAATGGGAGCAAACTTCCGAGCCGACAGGGTAATAGACCCGAGGCGGTGCCTGAAACCGGTAATACTAAAAGATGGCCCAGAGCGTGTCATTCTAGCCGGACCGATGCCAGTGACTGTGGCTAGCGCCGCCCAGAGGAGAGGAAGAATTGGAAGGAACCAAAATAAGGAAGGCGATCAGTATATTTACATGGGACAGCCTCTAAACAATGATGAGGACCACGCCCATTGGACAGAAGCAAAAATGCTCCTTGACAACATAAACACACCAGAAGGGATTATCCCAGCCCTCTTTGAGCCGGAGAGAGAAAAGAGTGCAGCAATAGACGGGGAATACAGACTACGGGGTGAAGCGAGGAAAACGTTCGTGGAGCTCATGAGAAGAGGAGATCTACCTGTCTGGCTATCCTACAAAGTTGCCTCAGAAGGCTTCCAGTACTCCGACAGAAGGTGGTGCTTTGATGGGGAAAGGAACAACCAGGTGTTGGAGGAGAACATGGACGTGGAGATCTGGACAAAAGAAGGAGAAAGAAAGAAACTACGACCCCGCTGGCTGGATGCCAGAACATACTCTGACCCACTGGCTCTGCGCGAATTCAAAGAGTTCGCAGCAGGAAGAAGA [서열번호 212]
따라서, 바람직하게는 상기 DENV NS3 폴리펩티드는 실질적으로 서열번호 212에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 DENV NS3 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 213으로 제공된다:
TCTGGCGTGCTGTGGGATACACCTTCTCCACCAGAGGTGGAAAGAGCCGTGCTGGACGACGGCATCTACCGGATTCTGCAGAGAGGACTGCTGGGCAGATCTCAAGTTGGCGTGGGCGTGTTCCAAGAAGGGGTGTTCCACACCATGTGGCACGTGACAAGAGGCGCCGTGCTGATGTACCAGGGCAAGAGACTGGAACCTAGCTGGGCCAGCGTGAAGAAGGACCTGATCTCTTACGGCGGAGGCTGGCGGTTTCAAGGCTCTTGGAATGCCGGCGAAGAGGTGCAAGTGATCGCCGTGGAACCCGGCAAGAACCCCAAGAACGTTCAGACAGCCCCTGGCACCTTCAAGACCCCTGAAGGCGAAGTGGGAGCTATCGCCCTGGATTTCAAGCCTGGCACAAGCGGCAGCCCCATCGTGAACAGAGAAGGCAAGATCGTGGGCCTGTACGGCAATGGCGTGGTCACCACATCTGGCACCTACGTGTCAGCCATTGCTCAGGCCAAGGCCTCTCAAGAGGGACCCCTGCCTGAGATCGAGGACGAGGTGTTCCGGAAGCGGAACCTGACCATCATGGATCTGCACCCTGGCAGCGGCAAGACCAGAAGATATCTGCCCGCCATTGTGCGCGAGGCCATCCGAAGAAATGTGCGGACACTGGTGCTGGCCCCTACAAGAGTGGTGGCCTCTGAAATGGCCGAGGCTCTGAAGGGCATGCCTATCAGATACCAGACCACCGCCGTGAAGTCTGAGCACACCGGCAAAGAAATCGTGGACCTGATGTGCCACGCCACCTTCACCATGAGACTGCTGAGCCCTGTGCGGGTGCCCAACTACAACATGATCATCATGGACGAGGCCCACTTCACAGACCCCGCCTCTATTGCCGCCAGAGGCTACATCTCTACCAGAGTCGGCATGGGAGAAGCCGCCGCTATCTTCATGACAGCCACACCTCCAGGCAGCGTGGAAGCCTTTCCTCAGTCCAATGCCGTGATCCAGGACGAAGAGAGAGACATCCCCGAGCGGAGCTGGAACAGCGGCTACGACTGGATCACCGACTTTCCAGGCAAGACCGTTTGGTTCGTGCCCAGCATCAAGAGCGGCAACGATATCGCCAACTGCCTGCGGAAGAACGGCAAGAGAGTGGTGCAGCTGAGCAGAAAGACCTTCGACACCGAGTACCAAAAGACCAAGAACAACGACTGGGACTACGTCGTGACCACCGACATCTCTGAGATGGGCGCCAACTTCAGGGCCGACAGAGTGATCGACCCTCGGAGATGTCTGAAGCCCGTGATCCTGAAGGACGGCCCTGAGAGAGTGATTCTGGCCGGACCTATGCCTGTGACAGTGGCTTCTGCCGCTCAGAGAAGAGGCCGGATCGGCCGGAATCAGAACAAAGAGGGCGACCAGTACATCTACATGGGCCAGCCTCTGAACAACGATGAGGATCACGCCCACTGGACCGAGGCCAAGATGCTGCTGGACAACATCAACACCCCTGAGGGCATCATCCCCGCTCTGTTCGAGCCCGAGAGAGAGAAGTCTGCCGCAATCGACGGCGAGTACAGACTGAGAGGCGAGGCCAGAAAGACATTTGTGGAACTGATGCGGAGAGGCGACCTGCCTGTGTGGCTGAGTTACAAGGTGGCCAGCGAGGGCTTCCAGTACAGCGATAGAAGATGGTGCTTCGATGGCGAGCGGAACAACCAGGTGCTGGAAGAGAACATGGACGTGGAAATCTGGACCAAAGAAGGCGAGCGCAAGAAACTGCGGCCCAGATGGCTGGATGCCCGGACATATTCTGACCCTCTGGCTCTGCGCGAGTTCAAAGAGTTTGCCGCCGGAAGAAGA [서열번호 213]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 213에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 213의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 214로 제공된다:
UCUGGCGUGCUGUGGGAUACACCUUCUCCACCAGAGGUGGAAAGAGCCGUGCUGGACGACGGCAUCUACCGGAUUCUGCAGAGAGGACUGCUGGGCAGAUCUCAAGUUGGCGUGGGCGUGUUCCAAGAAGGGGUGUUCCACACCAUGUGGCACGUGACAAGAGGCGCCGUGCUGAUGUACCAGGGCAAGAGACUGGAACCUAGCUGGGCCAGCGUGAAGAAGGACCUGAUCUCUUACGGCGGAGGCUGGCGGUUUCAAGGCUCUUGGAAUGCCGGCGAAGAGGUGCAAGUGAUCGCCGUGGAACCCGGCAAGAACCCCAAGAACGUUCAGACAGCCCCUGGCACCUUCAAGACCCCUGAAGGCGAAGUGGGAGCUAUCGCCCUGGAUUUCAAGCCUGGCACAAGCGGCAGCCCCAUCGUGAACAGAGAAGGCAAGAUCGUGGGCCUGUACGGCAAUGGCGUGGUCACCACAUCUGGCACCUACGUGUCAGCCAUUGCUCAGGCCAAGGCCUCUCAAGAGGGACCCCUGCCUGAGAUCGAGGACGAGGUGUUCCGGAAGCGGAACCUGACCAUCAUGGAUCUGCACCCUGGCAGCGGCAAGACCAGAAGAUAUCUGCCCGCCAUUGUGCGCGAGGCCAUCCGAAGAAAUGUGCGGACACUGGUGCUGGCCCCUACAAGAGUGGUGGCCUCUGAAAUGGCCGAGGCUCUGAAGGGCAUGCCUAUCAGAUACCAGACCACCGCCGUGAAGUCUGAGCACACCGGCAAAGAAAUCGUGGACCUGAUGUGCCACGCCACCUUCACCAUGAGACUGCUGAGCCCUGUGCGGGUGCCCAACUACAACAUGAUCAUCAUGGACGAGGCCCACUUCACAGACCCCGCCUCUAUUGCCGCCAGAGGCUACAUCUCUACCAGAGUCGGCAUGGGAGAAGCCGCCGCUAUCUUCAUGACAGCCACACCUCCAGGCAGCGUGGAAGCCUUUCCUCAGUCCAAUGCCGUGAUCCAGGACGAAGAGAGAGACAUCCCCGAGCGGAGCUGGAACAGCGGCUACGACUGGAUCACCGACUUUCCAGGCAAGACCGUUUGGUUCGUGCCCAGCAUCAAGAGCGGCAACGAUAUCGCCAACUGCCUGCGGAAGAACGGCAAGAGAGUGGUGCAGCUGAGCAGAAAGACCUUCGACACCGAGUACCAAAAGACCAAGAACAACGACUGGGACUACGUCGUGACCACCGACAUCUCUGAGAUGGGCGCCAACUUCAGGGCCGACAGAGUGAUCGACCCUCGGAGAUGUCUGAAGCCCGUGAUCCUGAAGGACGGCCCUGAGAGAGUGAUUCUGGCCGGACCUAUGCCUGUGACAGUGGCUUCUGCCGCUCAGAGAAGAGGCCGGAUCGGCCGGAAUCAGAACAAAGAGGGCGACCAGUACAUCUACAUGGGCCAGCCUCUGAACAACGAUGAGGAUCACGCCCACUGGACCGAGGCCAAGAUGCUGCUGGACAACAUCAACACCCCUGAGGGCAUCAUCCCCGCUCUGUUCGAGCCCGAGAGAGAGAAGUCUGCCGCAAUCGACGGCGAGUACAGACUGAGAGGCGAGGCCAGAAAGACAUUUGUGGAACUGAUGCGGAGAGGCGACCUGCCUGUGUGGCUGAGUUACAAGGUGGCCAGCGAGGGCUUCCAGUACAGCGAUAGAAGAUGGUGCUUCGAUGGCGAGCGGAACAACCAGGUGCUGGAAGAGAACAUGGACGUGGAAAUCUGGACCAAAGAAGGCGAGCGCAAGAAACUGCGGCCCAGAUGGCUGGAUGCCCGGACAUAUUCUGACCCUCUGGCUCUGCGCGAGUUCAAAGAGUUUGCCGCCGGAAGAAGA [서열번호 214]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 214에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 EV71 3Cpro(B9VUU3; 게놈 폴리단백질 인간 엔테로바이러스 71), 또는 그의 동원체이다. [Lei X, Xiao X, Xue Q, Jin Q, He B, Wang JJ. (2013) Cleavage of interferon regulatory factor 7 by enterovirus 71 3C suppresses cellular responses. J Virol, 87, 3, 1690-1698. doi: 10.1128/JVI.01855-12. Epub 2012 Nov 21]. 상기 IIP는 IRF7을 절단하는 것으로 여겨진다. EV71 3Cpro의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 215로 나타낸다:
GPSLDFALSLLRRNVRQVQTDQGHFTMLGVRDRLAVLPRHSQPGKTIWIEHKLVNVLDAVELVDEQGVNLELTLITLDTNEKFRDITKFIPENISTASDATLVINTEHMPSMFVPVGDVVQYGFLNLSGKPTHRTMMYNFPTKAGQCGGVVTSVGKVIGIHIGGNGRQGFCAGLKRSYFASEQ [서열번호 215]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 215에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 EV71 3Cpro 폴리펩티드는 다음과 같은 서열번호 216의 DNA 뉴클레오티드 서열에 의해 암호화된다:
GGCCCGAGCCTTGATTTTGCTCTCTCCCTACTGAGGAGGAACGTCAGGCAAGTCCAAACAGACCAGGGGCATTTCACCATGTTGGGTGTTAGGGATCGCTTAGCAGTCCTCCCACGCCACTCACAACCCGGCAAAACTATTTGGATTGAGCACAAACTCGTGAACGTCCTTGATGCAGTTGAATTGGTGGATGAGCAAGGAGTCAACCTGGAATTAACCCTCATCACTCTTGATACCAACGAGAAGTTTAGGGATATCACCAAATTCATCCCGGAAAATATTAGCACTGCTAGTGATGCCACCCTAGTGATCAACACGGAGCACATGCCCTCGATGTTTGTCCCGGTGGGTGACGTTGTGCAGTATGGTTTCCTGAATCTCAGTGGTAAGCCTACTCATCGCACCATGATGTACAACTTTCCTACTAAGGCAGGGCAATGTGGAGGGGTGGTGACATCAGTTGGAAAAGTCATCGGTATACACATAGGTGGCAACGGTAGACAAGGATTTTGTGCAGGTCTTAAGAGAAGCTACTTTGCCAGCGAGCAA [서열번호 216]
따라서, 바람직하게는 상기 EV71 3Cpro 폴리펩티드는 실질적으로 서열번호 216에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 EV71 3Cpro 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 217로 제공된다:
GGCCCTTCTCTGGATTTTGCCCTGAGCCTGCTGCGGAGAAATGTGCGCCAGGTGCAGACAGATCAGGGCCACTTTACAATGCTGGGCGTCAGAGACAGACTGGCCGTGCTGCCTAGACACTCTCAGCCTGGCAAGACCATCTGGATCGAGCACAAGCTGGTCAACGTGCTGGACGCCGTGGAACTGGTTGATGAGCAGGGCGTGAACCTGGAACTGACCCTGATCACCCTGGACACCAACGAGAAGTTCCGGGACATCACCAAGTTCATCCCCGAGAACATCAGCACCGCCAGCGACGCCACACTGGTCATCAATACCGAGCACATGCCCAGCATGTTCGTGCCTGTGGGAGATGTGGTGCAGTACGGCTTCCTGAACCTGAGCGGCAAGCCCACACACCGGACCATGATGTACAACTTCCCTACCAAGGCCGGCCAGTGCGGCGGAGTGGTTACATCTGTGGGCAAAGTGATCGGCATCCACATCGGCGGCAATGGCAGACAGGGATTTTGTGCCGGCCTGAAGAGAAGCTACTTCGCCTCTGAACAG [서열번호 217]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 217에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 217의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 218로 제공된다:
GGCCCUUCUCUGGAUUUUGCCCUGAGCCUGCUGCGGAGAAAUGUGCGCCAGGUGCAGACAGAUCAGGGCCACUUUACAAUGCUGGGCGUCAGAGACAGACUGGCCGUGCUGCCUAGACACUCUCAGCCUGGCAAGACCAUCUGGAUCGAGCACAAGCUGGUCAACGUGCUGGACGCCGUGGAACUGGUUGAUGAGCAGGGCGUGAACCUGGAACUGACCCUGAUCACCCUGGACACCAACGAGAAGUUCCGGGACAUCACCAAGUUCAUCCCCGAGAACAUCAGCACCGCCAGCGACGCCACACUGGUCAUCAAUACCGAGCACAUGCCCAGCAUGUUCGUGCCUGUGGGAGAUGUGGUGCAGUACGGCUUCCUGAACCUGAGCGGCAAGCCCACACACCGGACCAUGAUGUACAACUUCCCUACCAAGGCCGGCCAGUGCGGCGGAGUGGUUACAUCUGUGGGCAAAGUGAUCGGCAUCCACAUCGGCGGCAAUGGCAGACAGGGAUUUUGUGCCGGCCUGAAGAGAAGCUACUUCGCCUCUGAACAG [서열번호 218]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 218에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 FMDV Lpro(P03307; 리더(Leader) 프로테아제 게놈 폴리단백질 구제역 바이러스(단리물-/독일/A5 베스터발트(Westerwald)/1951 혈청형 A)), 또는 그의 동원체이다. FMDV Lpro의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 219로 나타낸다:
MHTTDCFIALVHAIREIRALFLPRTTGKMELTLHNGEKKTFYSRPNNHDNCWLNTILQLFRYVDEPFFDWVYNSPENLTLEAINQLEELTGLELHEGGPPALVIWNIKHLLHTGIGTASRPSEVCMVDGTDMCLADFHAGIFLKGQEHAVFACVTSNGWYAIDDEEFYPWTPDPSDVLVFVPYDQEPLNGDWKAMVQRKLK [서열번호 219]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 219에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 FMDV Lpro 폴리펩티드는 다음과 같은 서열번호 220의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGCATACAACTGACTGTTTTATCGCTTTGGTGCACGCTATCAGAGAGATCAGAGCACTTTTTCTACCACGAACCACAGGAAAGATGGAACTCACCCTGCACAACGGCGAGAAAAAGACTTTTTACTCTAGACCCAACAACCACGACAACTGCTGGTTGAACACCATCCTTCAGTTGTTCAGGTATGTCGATGAACCCTTCTTCGACTGGGTCTACAACTCGCCCGAGAACCTCACGCTTGAAGCCATCAACCAATTGGAGGAACTCACAGGACTTGAGTTGCACGAGGGCGGACCGCCTGCCCTTGTGATCTGGAACATCAAACACTTGCTCCACACCGGCATCGGCACCGCCTCACGACCCAGTGAGGTGTGTATGGTGGACGGCACGGACATGTGTCTTGCTGACTTCCACGCAGGCATTTTCCTGAAGGGACAGGAACACGCAGTCTTTGCGTGTGTCACCTCCAACGGGTGGTACGCGATTGACGACGAGGAATTTTACCCCTGGACGCCTGACCCGTCAGACGTCCTGGTGTTTGTCCCGTACGATCAAGAACCACTCAACGGGGACTGGAAAGCGATGGTTCAGAGGAAGCTTAAG [서열번호 220]
따라서, 바람직하게는 상기 FMDV Lpro 폴리펩티드는 실질적으로 서열번호 220에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 FMDV Lpro 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 221로 제공된다:
ATGCACACCACCGACTGCTTTATCGCCCTGGTGCACGCCATCAGAGAGATCAGAGCCCTGTTCCTGCCTCGGACCACCGGCAAGATGGAACTGACACTGCACAACGGCGAGAAGAAAACCTTCTACAGCAGACCCAACAACCACGACAACTGCTGGCTGAACACCATCCTGCAGCTGTTCAGATACGTGGACGAGCCCTTCTTCGACTGGGTGTACAACAGCCCCGAGAATCTGACCCTGGAAGCCATCAACCAGCTGGAAGAACTGACCGGCCTGGAACTGCATGAAGGCGGACCTCCAGCTCTGGTCATCTGGAACATCAAACATCTGCTGCACACCGGCATCGGCACCGCCTCTAGACCATCTGAAGTGTGCATGGTGGACGGCACCGATATGTGCCTGGCCGATTTTCACGCCGGCATCTTTCTGAAGGGCCAAGAGCATGCCGTGTTCGCCTGCGTGACAAGCAATGGATGGTACGCCATCGACGACGAGGAATTCTACCCCTGGACACCCGATCCTAGCGACGTGCTGGTGTTCGTGCCCTACGATCAAGAGCCCCTGAACGGCGATTGGAAGGCCATGGTGCAGCGGAAGCTGAAG [서열번호 221]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 221에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 221의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 222로 제공된다:
AUGCACACCACCGACUGCUUUAUCGCCCUGGUGCACGCCAUCAGAGAGAUCAGAGCCCUGUUCCUGCCUCGGACCACCGGCAAGAUGGAACUGACACUGCACAACGGCGAGAAGAAAACCUUCUACAGCAGACCCAACAACCACGACAACUGCUGGCUGAACACCAUCCUGCAGCUGUUCAGAUACGUGGACGAGCCCUUCUUCGACUGGGUGUACAACAGCCCCGAGAAUCUGACCCUGGAAGCCAUCAACCAGCUGGAAGAACUGACCGGCCUGGAACUGCAUGAAGGCGGACCUCCAGCUCUGGUCAUCUGGAACAUCAAACAUCUGCUGCACACCGGCAUCGGCACCGCCUCUAGACCAUCUGAAGUGUGCAUGGUGGACGGCACCGAUAUGUGCCUGGCCGAUUUUCACGCCGGCAUCUUUCUGAAGGGCCAAGAGCAUGCCGUGUUCGCCUGCGUGACAAGCAAUGGAUGGUACGCCAUCGACGACGAGGAAUUCUACCCCUGGACACCCGAUCCUAGCGACGUGCUGGUGUUCGUGCCCUACGAUCAAGAGCCCCUGAACGGCGAUUGGAAGGCCAUGGUGCAGCGGAAGCUGAAG [서열번호 222]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 222에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 FMDV 3Cpro(P03307; 프로테아제 3C 게놈 폴리단백질 구제역 바이러스(단리물-/독일/A5 베스터발트/1951 혈청형 A), 또는 그의 동원체이다. [Ekanayaka P, Shin SH, Weeratunga P, Lee H, Kim T-H, Chathuranga K, Subasinghe A, Park J-H, Lee J-S (2021) Foot and mouth disease virus 3C protease antagonises interferon signaling and C142T substitution attenuates the FMD virus. Front Microbiol., 21, 737031. doi: 10.3389/fmicb.2021.737031].
FMDV 3Cpro의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 223으로 나타낸다:
SGAPPTDLQKMVMGNTKPVELILDGKTVAICCATGVFGTAYLVPRHLFAEKYDKIMLDGRAMTDSDYRVFEFEIKVKGQDMLSDAALMVLHRGNRVRDITKHFRDTARMKKGTPVVGVINNADVGRLIFSGEALTYKDIVVCMDGDTMPGLFAYRAATKAGYCGGAVLAKDGADTFIVGTHSAGGNGVGYCSCVSRSMLLKMKAHIDPEPHHE [서열번호 223]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 223에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 FMDV 3Cpro 폴리펩티드는 다음과 같은 서열번호 224의 DNA 뉴클레오티드 서열에 의해 암호화된다:
AGTGGTGCCCCCCCGACCGACTTGCAAAAGATGGTCATGGGCAACACAAAGCCTGTTGAGCTCATCCTCGACGGGAAGACAGTAGCCATCTGCTGTGCTACTGGAGTGTTTGGCACTGCCTACCTCGTGCCTCGTCATCTTTTCGCTGAGAAGTATGACAAGATCATGTTGGACGGCAGAGCCATGACAGACAGTGACTACAGAGTGTTTGAGTTCGAGATCAAAGTAAAAGGACAGGACATGCTCTCAGACGCCGCACTCATGGTGCTCCACCGTGGGAACCGCGTGAGAGACATCACGAAGCACTTTCGTGACACAGCAAGAATGAAGAAAGGCACCCCCGTTGTCGGCGTGATCAACAATGCCGATGTCGGGAGACTGATTTTCTCTGGCGAAGCCCTTACCTACAAAGACATTGTAGTGTGCATGGACGGAGACACCATGCCCGGGCTTTTTGCCTACAGAGCCGCCACTAAGGCAGGCTACTGCGGGGGAGCCGTTCTCGCTAAGGACGGGGCTGACACTTTCATCGTTGGCACTCACTCTGCAGGAGGTAATGGAGTTGGATACTGCTCATGCGTTTCCAGGTCCATGCTTCTCAAGATGAAGGCACACATTGACCCTGAGCCGCACCACGAG [서열번호 224]
따라서, 바람직하게는 상기 FMDV 3Cpro 폴리펩티드는 실질적으로 서열번호 224에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 FMDV 3Cpro 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 225로 제공된다:
TCTGGTGCCCCTCCTACCGACCTGCAGAAAATGGTCATGGGCAACACCAAGCCTGTGGAACTGATCCTGGACGGCAAGACCGTGGCCATCTGTTGTGCAACAGGCGTGTTCGGCACCGCCTACCTGGTTCCTAGACACCTGTTCGCCGAGAAGTACGACAAGATCATGCTGGATGGCAGAGCCATGACCGACAGCGACTACCGGGTGTTCGAGTTCGAGATCAAAGTGAAAGGCCAGGACATGCTGAGCGACGCCGCTCTGATGGTTCTGCACAGAGGCAACAGAGTGCGGGACATCACCAAGCACTTCCGGGACACCGCCAGAATGAAGAAAGGCACACCTGTCGTGGGCGTGATCAACAACGCTGACGTGGGCAGACTGATCTTCTCTGGCGAGGCCCTGACCTACAAGGACATCGTCGTGTGCATGGACGGCGACACAATGCCTGGCCTGTTTGCCTATAGAGCCGCCACAAAGGCCGGCTACTGTGGCGGAGCTGTGCTGGCTAAAGATGGCGCCGATACCTTCATCGTGGGCACACATTCTGCCGGCGGAAATGGCGTGGGCTACTGCTCTTGTGTGTCCAGATCCATGCTGCTGAAGATGAAGGCCCACATCGACCCCGAGCCTCACCATGAA [서열번호 225]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 225에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 225의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 226으로 제공된다:
UCUGGUGCCCCUCCUACCGACCUGCAGAAAAUGGUCAUGGGCAACACCAAGCCUGUGGAACUGAUCCUGGACGGCAAGACCGUGGCCAUCUGUUGUGCAACAGGCGUGUUCGGCACCGCCUACCUGGUUCCUAGACACCUGUUCGCCGAGAAGUACGACAAGAUCAUGCUGGAUGGCAGAGCCAUGACCGACAGCGACUACCGGGUGUUCGAGUUCGAGAUCAAAGUGAAAGGCCAGGACAUGCUGAGCGACGCCGCUCUGAUGGUUCUGCACAGAGGCAACAGAGUGCGGGACAUCACCAAGCACUUCCGGGACACCGCCAGAAUGAAGAAAGGCACACCUGUCGUGGGCGUGAUCAACAACGCUGACGUGGGCAGACUGAUCUUCUCUGGCGAGGCCCUGACCUACAAGGACAUCGUCGUGUGCAUGGACGGCGACACAAUGCCUGGCCUGUUUGCCUAUAGAGCCGCCACAAAGGCCGGCUACUGUGGCGGAGCUGUGCUGGCUAAAGAUGGCGCCGAUACCUUCAUCGUGGGCACACAUUCUGCCGGCGGAAAUGGCGUGGGCUACUGCUCUUGUGUGUCCAGAUCCAUGCUGCUGAAGAUGAAGGCCCACAUCGACCCCGAGCCUCACCAUGAA [서열번호 226]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 226에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 토스카나 바이러스 NSS 단백질(RIG 1 분해)(P21699; 비-구조 단백질 NS-S 토스카나 바이러스), 또는 그의 동원체이다. 토스카나 바이러스 NSS 단백질의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 227로 나타낸다:
MQSRAVILKYRSGSGHKRSLPRFYIDCDLDTFDFEKDCSLIENEFPIYINNYKVVYKSKPTLSHFLIEKEFPAVLGPGMISAVRTRLYEPTMRELYQESIHQLKRSNKKYLLSALRWPTGIPTLEFIDYYFEELLFLSEFDPGSIQRYLKLLVKASGLYNSTNEEQIVEIHRRVLIEGKKHGLTAFDLPGNDILGDICVVQAARVTRLVAKTFSKMTRDTHLMIYFSISPVELVLSKLDKKGDKRAKAKGLMSMSAARSYDYFMRTDLGFRETALSTFWAKDWPTPQETILSDKRCLKEDMRVTKWLPSPPHYPPL [서열번호 227]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 227에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 토스카나 바이러스 NSS 폴리펩티드는 다음과 같은 서열번호 228의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGCAATCCAGAGCTGTCATCTTGAAGTATAGATCTGGTTCAGGCCACAAGAGGTCTTTGCCCAGGTTCTACATAGACTGTGATTTGGACACCTTTGATTTTGAGAAGGATTGCTCTCTGATTGAGAATGAGTTCCCCATTTACATAAACAATTATAAGGTGGTCTATAAGTCAAAGCCAACTCTCTCACATTTCCTCATTGAGAAGGAGTTTCCTGCTGTGCTGGGGCCTGGTATGATCAGTGCAGTTCGAACCAGACTTTACGAGCCAACTATGAGAGAGCTCTACCAGGAATCGATTCACCAACTAAAGAGGAGCAACAAGAAATACCTTTTGTCTGCTCTCAGGTGGCCCACAGGGATTCCTACTCTAGAGTTTATAGACTATTACTTCGAGGAGCTCCTGTTCTTGTCAGAGTTTGACCCGGGGTCTATCCAGAGATACCTGAAATTACTGGTTAAGGCCTCTGGGCTTTACAACTCCACTAATGAGGAGCAGATAGTGGAGATTCACAGACGAGTGCTCATAGAAGGCAAAAAGCACGGATTGACTGCTTTTGATCTCCCAGGAAATGACATCCTTGGAGACATCTGTGTGGTCCAAGCAGCACGGGTGACAAGACTGGTTGCTAAGACATTCTCTAAGATGACCAGAGACACCCATCTGATGATATACTTCTCGATAAGCCCAGTTGAGTTGGTTTTGAGTAAACTTGATAAGAAAGGGGACAAGAGGGCTAAAGCAAAAGGGTTGATGTCTATGAGTGCCGCTAGGTCTTATGACTATTTTATGAGAACTGACTTGGGATTCAGAGAGACTGCTCTTTCCACCTTTTGGGCTAAGGACTGGCCTACCCCACAAGAGACCATTCTATCTGACAAACGATGCCTTAAAGAAGACATGAGAGTGACAAAGTGGCTGCCTAGTCCCCCCCACTACCCACCCTTA [서열번호 228]
따라서, 바람직하게는 상기 토스카나 바이러스 NSS 폴리펩티드는 실질적으로 서열번호 228에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 토스카나 바이러스 NSS 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 229로 제공된다:
ATGCAGAGCAGAGCCGTGATCCTGAAGTACAGAAGCGGCAGCGGCCACAAGAGAAGCCTGCCTAGATTCTACATCGACTGCGACCTGGACACCTTCGACTTCGAGAAGGACTGCAGCCTGATCGAGAACGAGTTCCCCATCTACATCAACAACTACAAGGTGGTGTACAAGAGCAAGCCAACTCTGAGCCACTTCCTCATCGAGAAAGAATTCCCTGCCGTGCTCGGCCCTGGCATGATCTCTGCCGTTAGAACCAGACTGTACGAGCCCACCATGAGAGAGCTGTACCAAGAGAGCATCCACCAGCTGAAGCGGAGCAACAAGAAGTACCTGCTGAGCGCCCTGAGATGGCCCACAGGCATTCCCACACTGGAATTCATCGACTACTACTTCGAGGAACTGCTGTTCCTGAGCGAGTTCGACCCTGGCAGCATCCAGAGATACCTGAAGCTGCTGGTCAAGGCCAGCGGCCTGTACAACAGCACCAACGAGGAACAGATCGTGGAAATCCACCGGCGGGTGCTGATCGAGGGAAAGAAGCACGGACTGACCGCCTTCGACCTGCCTGGCAATGATATCCTGGGCGACATCTGCGTGGTGCAGGCCGCTAGAGTGACAAGACTGGTGGCCAAGACCTTCAGCAAGATGACCAGAGACACCCACCTGATGATCTACTTCAGCATCAGCCCCGTGGAACTGGTGCTGAGCAAGCTGGACAAGAAGGGCGACAAGAGAGCCAAGGCCAAGGGCCTGATGAGCATGTCTGCCGCCAGATCCTACGACTACTTCATGAGAACCGACCTGGGCTTCAGAGAGACAGCCCTGAGCACCTTCTGGGCCAAAGACTGGCCCACACCTCAAGAGACAATCCTGTCCGACAAGCGGTGCCTGAAAGAAGATATGCGGGTCACCAAGTGGCTGCCCTCTCCACCTCATTACCCTCCACTT [서열번호 229]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 229에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 229의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 230으로 제공된다:
AUGCAGAGCAGAGCCGUGAUCCUGAAGUACAGAAGCGGCAGCGGCCACAAGAGAAGCCUGCCUAGAUUCUACAUCGACUGCGACCUGGACACCUUCGACUUCGAGAAGGACUGCAGCCUGAUCGAGAACGAGUUCCCCAUCUACAUCAACAACUACAAGGUGGUGUACAAGAGCAAGCCAACUCUGAGCCACUUCCUCAUCGAGAAAGAAUUCCCUGCCGUGCUCGGCCCUGGCAUGAUCUCUGCCGUUAGAACCAGACUGUACGAGCCCACCAUGAGAGAGCUGUACCAAGAGAGCAUCCACCAGCUGAAGCGGAGCAACAAGAAGUACCUGCUGAGCGCCCUGAGAUGGCCCACAGGCAUUCCCACACUGGAAUUCAUCGACUACUACUUCGAGGAACUGCUGUUCCUGAGCGAGUUCGACCCUGGCAGCAUCCAGAGAUACCUGAAGCUGCUGGUCAAGGCCAGCGGCCUGUACAACAGCACCAACGAGGAACAGAUCGUGGAAAUCCACCGGCGGGUGCUGAUCGAGGGAAAGAAGCACGGACUGACCGCCUUCGACCUGCCUGGCAAUGAUAUCCUGGGCGACAUCUGCGUGGUGCAGGCCGCUAGAGUGACAAGACUGGUGGCCAAGACCUUCAGCAAGAUGACCAGAGACACCCACCUGAUGAUCUACUUCAGCAUCAGCCCCGUGGAACUGGUGCUGAGCAAGCUGGACAAGAAGGGCGACAAGAGAGCCAAGGCCAAGGGCCUGAUGAGCAUGUCUGCCGCCAGAUCCUACGACUACUUCAUGAGAACCGACCUGGGCUUCAGAGAGACAGCCCUGAGCACCUUCUGGGCCAAAGACUGGCCCACACCUCAAGAGACAAUCCUGUCCGACAAGCGGUGCCUGAAAGAAGAUAUGCGGGUCACCAAGUGGCUGCCCUCUCCACCUCAUUACCCUCCACUU [서열번호 230]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 230에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 비-구조 단백질 1 인플루엔자 A 바이러스(바이러스주 A/푸에르토리코/8/1934 H1N1)(P03496; 인플루엔자 A/PR/8/34 NS1), 또는 그의 동원체이다. 인플루엔자 A 바이러스 비-구조 단백질 1의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 231로 나타낸다:
MDPNTVSSFQVDCFLWHVRKRVADQELGDAPFLDRLRRDQKSLRGRGSTLGLDIETATRAGKQIVERILKEESDEALKMTMASVPASRYLTDMTLEEMSREWSMLIPKQKVAGPLCIRMDQAIMDKNIILKANFSVIFDRLETLILLRAFTEEGAIVGEISPLPSLPGHTAEDVKNAVGVLIGGLEWNDNTVRVSETLQRFAWRSSNENGRPPLTPKQKREMAGTIRSEV [서열번호 231]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 231에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 비-구조 단백질 1 인플루엔자 A 바이러스 폴리펩티드는 다음과 같은 서열번호 232의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGATCCAAACACTGTGTCAAGCTTTCAGGTAGATTGCTTTCTTTGGCATGTCCGCAAACGAGTTGCAGACCAAGAACTAGGTGATGCCCCATTCCTTGATCGGCTTCGCCGAGATCAGAAATCCCTAAGAGGAAGGGGCAGCACTCTTGGTCTGGACATCGAGACAGCCACACGTGCTGGAAAGCAGATAGTGGAGCGGATTCTGAAAGAAGAATCCGATGAGGCACTTAAAATGACCATGGCCTCTGTACCTGCGTCGCGTTACCTAACCGACATGACTCTTGAGGAAATGTCAAGGGAATGGTCCATGCTCATACCCAAGCAGAAAGTGGCAGGCCCTCTTTGTATCAGAATGGACCAGGCGATCATGGATAAAAACATCATACTGAAAGCGAACTTCAGTGTGATTTTTGACCGGCTGGAGACTCTAATATTGCTAAGGGCTTTCACCGAAGAGGGAGCAATTGTTGGCGAAATTTCACCATTGCCTTCTCTTCCAGGACATACTGCTGAGGATGTCAAAAATGCAGTTGGAGTCCTCATCGGAGGACTTGAATGGAATGATAACACAGTTCGAGTCTCTGAAACTCTACAGAGATTCGCTTGGAGAAGCAGTAATGAGAATGGGAGACCTCCACTCACTCCAAAACAGAAACGAGAAATGGCGGGAACAATTAGGTCAGAAGTTTGA [서열번호 232]
따라서, 바람직하게는 상기 비-구조 단백질 1 인플루엔자 A 바이러스 폴리펩티드는 실질적으로 서열번호 232에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 비-구조 단백질 1 인플루엔자 A 바이러스 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 233으로 제공된다:
ATGGACCCCAATACCGTCAGCAGCTTCCAGGTGGACTGCTTCCTGTGGCACGTGCGGAAAAGAGTGGCCGATCAAGAACTGGGCGACGCCCCATTCCTGGACAGACTGAGAAGAGATCAGAAGTCCCTGAGAGGCAGAGGCAGCACACTGGGCCTCGACATTGAGACAGCCACAAGAGCCGGCAAGCAGATCGTGGAACGGATCCTGAAAGAGGAAAGCGACGAGGCCCTGAAGATGACCATGGCCTCTGTGCCTGCCAGCAGATACCTGACCGACATGACCCTGGAAGAGATGAGCCGCGAGTGGTCCATGCTGATCCCCAAGCAGAAAGTGGCCGGACCTCTGTGCATCAGAATGGATCAGGCCATCATGGACAAGAACATCATCCTGAAGGCCAACTTCAGCGTGATCTTCGACCGGCTGGAAACCCTGATCCTGCTGAGAGCCTTTACCGAAGAGGGCGCCATCGTGGGAGAGATCAGTCCTCTGCCTTCTCTGCCTGGACACACCGCCGAGGATGTGAAGAATGCTGTGGGCGTGCTGATCGGCGGCCTGGAATGGAACGATAACACCGTCAGAGTGTCCGAGACACTGCAGAGATTTGCCTGGCGGAGCAGCAACGAGAACGGCAGACCTCCTCTGACACCTAAGCAGAAAAGAGAGATGGCCGGCACCATCCGCAGCGAAGTGTAA [서열번호 233]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 233에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 233의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 234로 제공된다:
AUGGACCCCAAUACCGUCAGCAGCUUCCAGGUGGACUGCUUCCUGUGGCACGUGCGGAAAAGAGUGGCCGAUCAAGAACUGGGCGACGCCCCAUUCCUGGACAGACUGAGAAGAGAUCAGAAGUCCCUGAGAGGCAGAGGCAGCACACUGGGCCUCGACAUUGAGACAGCCACAAGAGCCGGCAAGCAGAUCGUGGAACGGAUCCUGAAAGAGGAAAGCGACGAGGCCCUGAAGAUGACCAUGGCCUCUGUGCCUGCCAGCAGAUACCUGACCGACAUGACCCUGGAAGAGAUGAGCCGCGAGUGGUCCAUGCUGAUCCCCAAGCAGAAAGUGGCCGGACCUCUGUGCAUCAGAAUGGAUCAGGCCAUCAUGGACAAGAACAUCAUCCUGAAGGCCAACUUCAGCGUGAUCUUCGACCGGCUGGAAACCCUGAUCCUGCUGAGAGCCUUUACCGAAGAGGGCGCCAUCGUGGGAGAGAUCAGUCCUCUGCCUUCUCUGCCUGGACACACCGCCGAGGAUGUGAAGAAUGCUGUGGGCGUGCUGAUCGGCGGCCUGGAAUGGAACGAUAACACCGUCAGAGUGUCCGAGACACUGCAGAGAUUUGCCUGGCGGAGCAGCAACGAGAACGGCAGACCUCCUCUGACACCUAAGCAGAAAAGAGAGAUGGCCGGCACCAUCCGCAGCGAAGUGUAA [서열번호 234]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 234에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 SARS CoV N 단백질(P59595; 핵단백질 중증 급성 호흡기 증후군 코로나바이러스), 또는 그의 동원체이다. SARS CoV N 단백질의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 235로 나타낸다:
MSDNGPQSNQRSAPRITFGGPTDSTDNNQNGGRNGARPKQRRPQGLPNNTASWFTALTQHGKEELRFPRGQGVPINTNSGPDDQIGYYRRATRRVRGGDGKMKELSPRWYFYYLGTGPEASLPYGANKEGIVWVATEGALNTPKDHIGTRNPNNNAATVLQLPQGTTLPKGFYAEGSRGGSQASSRSSSRSRGNSRNSTPGSSRGNSPARMASGGGETALALLLLDRLNQLESKVSGKGQQQQGQTVTKKSAAEASKKPRQKRTATKQYNVTQAFGRRGPEQTQGNFGDQDLIRQGTDYKHWPQIAQFAPSASAFFGMSRIGMEVTPSGTWLTYHGAIKLDDKDPQFKDNVILLNKHIDAYKTFPPTEPKKDKKKKTDEAQPLPQRQKKQPTVTLLPAADMDDFSRQLQNSMSGASADSTQA [서열번호 235]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 235에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 SARS CoV N 폴리펩티드는 다음과 같은 서열번호 236의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGTCTGATAATGGACCCCAATCAAACCAACGTAGTGCCCCCCGCATTACATTTGGTGGACCCACAGATTCAACTGACAATAACCAGAATGGAGGACGCAATGGGGCAAGGCCAAAACAGCGCCGACCCCAAGGTTTACCCAATAATACTGCGTCTTGGTTCACAGCTCTCACTCAGCATGGCAAGGAGGAACTTAGATTCCCTCGAGGCCAGGGCGTTCCAATCAACACCAATAGTGGTCCAGATGACCAAATTGGCTACTACCGAAGAGCTACCCGACGAGTTCGTGGTGGTGACGGCAAAATGAAAGAGCTCAGCCCCAGATGGTACTTCTATTACCTAGGAACTGGCCCAGAAGCTTCACTTCCCTACGGCGCTAACAAAGAAGGCATCGTATGGGTTGCAACTGAGGGAGCCTTGAATACACCCAAAGACCACATTGGCACCCGCAATCCTAATAACAATGCTGCCACCGTGCTACAACTTCCTCAAGGAACAACATTGCCAAAAGGCTTCTACGCAGAGGGAAGCAGAGGCGGCAGTCAAGCCTCTTCTCGCTCCTCATCACGTAGTCGCGGTAATTCAAGAAATTCAACTCCTGGCAGCAGTAGGGGAAATTCTCCTGCTCGAATGGCTAGCGGAGGTGGTGAAACTGCCCTCGCGCTATTGCTGCTAGACAGATTGAACCAGCTTGAGAGCAAAGTTTCTGGTAAAGGCCAACAACAACAAGGCCAAACTGTCACTAAGAAATCTGCTGCTGAGGCATCTAAAAAGCCTCGCCAAAAACGTACTGCCACAAAACAGTACAACGTCACTCAAGCATTTGGGAGACGTGGTCCAGAACAAACCCAAGGAAATTTCGGGGACCAAGACCTAATCAGACAAGGAACTGATTACAAACATTGGCCGCAAATTGCACAATTTGCTCCAAGTGCCTCTGCATTCTTTGGAATGTCACGCATTGGCATGGAAGTCACACCTTCGGGAACATGGCTGACTTATCATGGAGCCATTAAATTGGATGACAAAGATCCACAATTCAAAGACAACGTCATACTGCTGAACAAGCACATTGACGCATACAAAACATTCCCACCAACAGAGCCTAAAAAGGACAAAAAGAAAAAGACTGATGAAGCTCAGCCTTTGCCGCAGAGACAAAAGAAGCAGCCCACTGTGACTCTTCTTCCTGCGGCTGACATGGATGATTTCTCCAGACAACTTCAAAATTCCATGAGTGGAGCTTCTGCTGATTCAACTCAGGCA [서열번호 236]
따라서, 바람직하게는 상기 SARS CoV N 폴리펩티드는 실질적으로 서열번호 236에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 SARS CoV N 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 237로 제공된다:
ATGAGCGACAATGGCCCTCAGAGCAACCAGAGAAGCGCCCCTAGAATCACCTTTGGCGGCCCTACCGACAGCACCGACAACAACCAGAACGGCGGCAGAAATGGCGCCAGACCTAAGCAGAGAAGGCCTCAGGGCCTGCCTAACAATACCGCCAGCTGGTTCACAGCCCTGACACAGCACGGCAAAGAGGAACTGAGATTCCCCAGAGGACAGGGCGTGCCCATCAACACAAATAGCGGCCCTGACGACCAGATCGGCTACTACAGACGGGCCACCAGAAGAGTTAGAGGCGGCGACGGCAAGATGAAGGAACTGTCCCCTCGGTGGTACTTCTACTACCTCGGCACAGGACCCGAAGCCAGCCTTCCTTATGGCGCCAACAAAGAGGGCATCGTCTGGGTTGCAACAGAAGGCGCCCTGAACACCCCTAAGGACCACATCGGCACCAGAAATCCCAACAACAACGCCGCCACAGTGCTGCAGTTGCCACAGGGAACAACACTGCCCAAGGGCTTCTACGCCGAGGGATCTAGAGGCGGATCTCAGGCCAGCAGCAGAAGCAGCTCTAGAAGCAGAGGCAACAGCCGGAATAGCACCCCTGGCAGCTCCAGAGGCAATTCCCCTGCCAGAATGGCTTCTGGCGGCGGAGAAACAGCTCTGGCACTGCTGCTGCTCGACCGGCTGAATCAGCTGGAATCTAAGGTGTCCGGCAAGGGCCAGCAACAGCAGGGACAGACCGTGACCAAGAAGTCTGCCGCTGAGGCCAGCAAGAAGCCCAGACAGAAGAGAACCGCCACCAAGCAGTACAACGTGACCCAGGCCTTTGGCAGAAGAGGCCCAGAACAGACCCAGGGCAATTTCGGCGACCAGGACCTGATCAGACAGGGCACCGATTACAAGCACTGGCCCCAGATCGCCCAGTTTGCCCCTTCTGCCTCTGCCTTTTTCGGCATGAGCCGGATCGGCATGGAAGTGACACCTAGCGGCACCTGGCTGACATATCACGGCGCCATCAAGCTGGACGACAAGGACCCTCAGTTCAAGGACAACGTGATCCTGCTGAACAAGCACATCGACGCCTACAAGACATTCCCTCCAACCGAGCCTAAGAAGGACAAGAAGAAGAAAACCGACGAGGCCCAGCCTCTGCCACAGAGACAGAAAAAGCAGCCCACCGTGACACTGCTGCCTGCCGCCGATATGGACGACTTCTCTAGACAGCTGCAGAACAGCATGAGCGGCGCCAGCGCTGATTCTACACAAGCT [서열번호 237]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 237에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 237의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 238로 제공된다:
AUGAGCGACAAUGGCCCUCAGAGCAACCAGAGAAGCGCCCCUAGAAUCACCUUUGGCGGCCCUACCGACAGCACCGACAACAACCAGAACGGCGGCAGAAAUGGCGCCAGACCUAAGCAGAGAAGGCCUCAGGGCCUGCCUAACAAUACCGCCAGCUGGUUCACAGCCCUGACACAGCACGGCAAAGAGGAACUGAGAUUCCCCAGAGGACAGGGCGUGCCCAUCAACACAAAUAGCGGCCCUGACGACCAGAUCGGCUACUACAGACGGGCCACCAGAAGAGUUAGAGGCGGCGACGGCAAGAUGAAGGAACUGUCCCCUCGGUGGUACUUCUACUACCUCGGCACAGGACCCGAAGCCAGCCUUCCUUAUGGCGCCAACAAAGAGGGCAUCGUCUGGGUUGCAACAGAAGGCGCCCUGAACACCCCUAAGGACCACAUCGGCACCAGAAAUCCCAACAACAACGCCGCCACAGUGCUGCAGUUGCCACAGGGAACAACACUGCCCAAGGGCUUCUACGCCGAGGGAUCUAGAGGCGGAUCUCAGGCCAGCAGCAGAAGCAGCUCUAGAAGCAGAGGCAACAGCCGGAAUAGCACCCCUGGCAGCUCCAGAGGCAAUUCCCCUGCCAGAAUGGCUUCUGGCGGCGGAGAAACAGCUCUGGCACUGCUGCUGCUCGACCGGCUGAAUCAGCUGGAAUCUAAGGUGUCCGGCAAGGGCCAGCAACAGCAGGGACAGACCGUGACCAAGAAGUCUGCCGCUGAGGCCAGCAAGAAGCCCAGACAGAAGAGAACCGCCACCAAGCAGUACAACGUGACCCAGGCCUUUGGCAGAAGAGGCCCAGAACAGACCCAGGGCAAUUUCGGCGACCAGGACCUGAUCAGACAGGGCACCGAUUACAAGCACUGGCCCCAGAUCGCCCAGUUUGCCCCUUCUGCCUCUGCCUUUUUCGGCAUGAGCCGGAUCGGCAUGGAAGUGACACCUAGCGGCACCUGGCUGACAUAUCACGGCGCCAUCAAGCUGGACGACAAGGACCCUCAGUUCAAGGACAACGUGAUCCUGCUGAACAAGCACAUCGACGCCUACAAGACAUUCCCUCCAACCGAGCCUAAGAAGGACAAGAAGAAGAAAACCGACGAGGCCCAGCCUCUGCCACAGAGACAGAAAAAGCAGCCCACCGUGACACUGCUGCCUGCCGCCGAUAUGGACGACUUCUCUAGACAGCUGCAGAACAGCAUGAGCGGCGCCAGCGCUGAUUCUACACAAGCU [서열번호 238]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 238에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 MHV N 단백질(P03416; 핵단백질 뮤린 코로나바이러스(A59 바이러스주)), 또는 그의 동원체이다. MHV N 단백질의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 239로 나타낸다:
MSFVPGQENAGGRSSSVNRAGNGILKKTTWADQTERGPNNQNRGRRNQPKQTATTQPNSGSVVPHYSWFSGITQFQKGKEFQFAEGQGVPIANGIPASEQKGYWYRHNRRSFKTPDGQQKQLLPRWYFYYLGTGPHAGASYGDSIEGVFWVANSQADTNTRSDIVERDPSSHEAIPTRFAPGTVLPQGFYVEGSGRSAPASRSGSRSQSRGPNNRARSSSNQRQPASTVKPDMAEEIAALVLAKLGKDAGQPKQVTKQSAKEVRQKILNKPRQKRTPNKQCPVQQCFGKRGPNQNFGGSEMLKLGTSDPQFPILAELAPTVGAFFFGSKLELVKKNSGGADEPTKDVYELQYSGAVRFDSTLPGFETIMKVLNENLNAYQKDGGADVVSPKPQRKGRRQAQEKKDEVDNVSVAKPKSSVQRNVSRELTPEDRSLLAQILDDGVVPDGLEDDSNV [서열번호 239]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 239에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 MHV N 폴리펩티드는 다음과 같은 서열번호 240의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGTCTTTTGTTCCTGGGCAAGAAAATGCCGGTGGCAGAAGCTCCTCTGTAAACCGCGCTGGTAATGGAATCCTCAAGAAGACCACTTGGGCTGACCAAACCGAGCGTGGACCAAATAATCAAAATAGAGGCAGAAGGAATCAGCCAAAGCAGACTGCAACTACTCAACCCAACTCCGGGAGTGTGGTTCCCCATTACTCCTGGTTTTCTGGCATTACCCAGTTCCAAAAGGGAAAGGAGTTTCAGTTTGCAGAAGGACAAGGAGTGCCTATTGCCAATGGAATCCCCGCTTCAGAGCAAAAGGGATATTGGTATAGACACAACCGCCGTTCTTTTAAAACACCTGATGGGCAGCAGAAGCAATTACTGCCCAGATGGTATTTTTACTATCTTGGCACAGGGCCCCATGCTGGAGCCAGTTATGGAGACAGCATTGAAGGTGTCTTCTGGGTTGCAAACAGCCAAGCGGACACCAATACCCGCTCTGATATTGTCGAAAGGGACCCAAGCAGTCATGAGGCTATTCCTACTAGGTTTGCGCCCGGCACGGTATTGCCTCAGGGCTTTTATGTTGAAGGCTCTGGAAGGTCTGCACCTGCTAGCCGATCTGGTTCGCGGTCACAATCCCGTGGGCCAAATAATCGCGCTAGAAGCAGTTCCAACCAGCGCCAGCCTGCCTCTACTGTAAAACCTGATATGGCCGAAGAAATTGCTGCTCTTGTTTTGGCTAAGCTCGGTAAAGATGCCGGCCAGCCCAAGCAAGTAACGAAGCAAAGTGCCAAAGAAGTCAGGCAGAAAATTTTAAACAAGCCTCGCCAAAAGAGGACTCCAAACAAGCAGTGCCCAGTGCAGCAGTGTTTTGGAAAGAGAGGCCCCAATCAGAATTTTGGAGGCTCTGAAATGTTAAAACTTGGAACTAGTGATCCACAGTTCCCCATTCTTGCAGAGTTGGCTCCAACAGTTGGTGCCTTCTTCTTTGGATCTAAATTAGAATTGGTCAAAAAGAATTCTGGTGGTGCTGATGAACCCACCAAAGATGTGTATGAGCTGCAATATTCAGGTGCAGTTAGATTTGATAGTACTCTACCTGGTTTTGAGACTATCATGAAAGTGTTGAATGAGAATTTGAATGCCTACCAGAAGGATGGTGGTGCAGATGTGGTGAGCCCAAAGCCCCAAAGAAAAGGGCGTAGACAGGCTCAGGAAAAGAAAGATGAAGTAGATAATGTAAGCGTTGCAAAGCCCAAAAGCTCTGTGCAGCGAAATGTAAGTAGAGAATTAACCCCAGAGGATAGAAGTCTGTTGGCTCAGATCCTTGATGATGGCGTAGTGCCAGATGGGTTAGAAGATGACTCTAATGTG [서열번호 240]
따라서, 바람직하게는 상기 MHV N 폴리펩티드 실질적으로 서열번호 240에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 MHV N 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 241로 제공된다:
ATGAGCTTCGTGCCCGGCCAAGAAAATGCCGGCGGAAGATCTAGCAGCGTGAACAGAGCCGGCAACGGCATCCTGAAGAAAACCACCTGGGCCGACCAGACCGAGAGAGGCCCCAACAACCAGAACCGGGGCAGAAGAAACCAGCCTAAGCAGACCGCCACCACACAGCCTAATAGCGGCTCTGTGGTGCCCCACTACAGCTGGTTTAGCGGCATCACCCAGTTCCAGAAGGGCAAAGAGTTCCAGTTCGCCGAAGGACAGGGCGTGCCAATCGCCAATGGAATCCCTGCCTCTGAGCAGAAAGGCTACTGGTACAGACACAACCGGCGGAGCTTCAAGACCCCTGATGGACAGCAGAAACAGCTGCTGCCCAGATGGTACTTCTACTACCTCGGCACAGGACCTCACGCAGGCGCCTCTTATGGCGATTCTATCGAGGGCGTGTTCTGGGTCGCCAACAGCCAGGCCGATACCAACACCAGATCCGACATCGTGGAACGGGACCCTAGCAGCCACGAGGCCATTCCTACAAGATTTGCCCCTGGCACCGTGCTGCCTCAGGGCTTTTATGTGGAAGGCAGCGGAAGAAGCGCCCCTGCCAGTAGATCTGGCAGCAGATCTCAGAGCAGGGGCCCTAACAACAGAGCCAGAAGCAGCAGCAACCAGAGACAGCCTGCCAGCACCGTGAAGCCCGATATGGCCGAAGAAATCGCCGCTCTGGTGCTGGCCAAGCTGGGAAAAGATGCCGGCCAGCCAAAGCAAGTGACCAAGCAGAGCGCCAAAGAAGTGCGGCAGAAGATCCTGAACAAGCCCCGGCAGAAGCGGACCCCTAACAAGCAGTGTCCTGTGCAGCAGTGCTTCGGCAAGAGGGGCCCCAATCAGAATTTTGGCGGCAGCGAGATGCTGAAGCTGGGCACAAGCGATCCTCAGTTCCCTATCCTGGCCGAGCTGGCTCCTACAGTGGGCGCATTTTTCTTTGGCTCCAAACTCGAGCTGGTCAAGAAGAACAGCGGCGGAGCCGATGAGCCCACCAAGGATGTGTACGAGCTGCAGTACTCTGGCGCCGTCAGATTCGATAGCACCCTGCCTGGCTTCGAGACAATCATGAAGGTGCTGAACGAGAACCTGAACGCCTACCAGAAGGATGGCGGCGCTGACGTGGTGTCTCCTAAGCCTCAGAGAAAAGGCAGACGGCAGGCCCAAGAGAAGAAAGACGAGGTGGACAACGTGTCCGTGGCCAAGCCTAAGAGCAGCGTGCAGAGAAACGTGTCCAGAGAGCTGACCCCAGAGGACAGATCTCTGCTGGCTCAGATCCTGGACGATGGCGTGGTGCCAGATGGCCTGGAAGATGACAGCAACGTG [서열번호 241]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 241에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 241의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 242로 제공된다:
AUGAGCUUCGUGCCCGGCCAAGAAAAUGCCGGCGGAAGAUCUAGCAGCGUGAACAGAGCCGGCAACGGCAUCCUGAAGAAAACCACCUGGGCCGACCAGACCGAGAGAGGCCCCAACAACCAGAACCGGGGCAGAAGAAACCAGCCUAAGCAGACCGCCACCACACAGCCUAAUAGCGGCUCUGUGGUGCCCCACUACAGCUGGUUUAGCGGCAUCACCCAGUUCCAGAAGGGCAAAGAGUUCCAGUUCGCCGAAGGACAGGGCGUGCCAAUCGCCAAUGGAAUCCCUGCCUCUGAGCAGAAAGGCUACUGGUACAGACACAACCGGCGGAGCUUCAAGACCCCUGAUGGACAGCAGAAACAGCUGCUGCCCAGAUGGUACUUCUACUACCUCGGCACAGGACCUCACGCAGGCGCCUCUUAUGGCGAUUCUAUCGAGGGCGUGUUCUGGGUCGCCAACAGCCAGGCCGAUACCAACACCAGAUCCGACAUCGUGGAACGGGACCCUAGCAGCCACGAGGCCAUUCCUACAAGAUUUGCCCCUGGCACCGUGCUGCCUCAGGGCUUUUAUGUGGAAGGCAGCGGAAGAAGCGCCCCUGCCAGUAGAUCUGGCAGCAGAUCUCAGAGCAGGGGCCCUAACAACAGAGCCAGAAGCAGCAGCAACCAGAGACAGCCUGCCAGCACCGUGAAGCCCGAUAUGGCCGAAGAAAUCGCCGCUCUGGUGCUGGCCAAGCUGGGAAAAGAUGCCGGCCAGCCAAAGCAAGUGACCAAGCAGAGCGCCAAAGAAGUGCGGCAGAAGAUCCUGAACAAGCCCCGGCAGAAGCGGACCCCUAACAAGCAGUGUCCUGUGCAGCAGUGCUUCGGCAAGAGGGGCCCCAAUCAGAAUUUUGGCGGCAGCGAGAUGCUGAAGCUGGGCACAAGCGAUCCUCAGUUCCCUAUCCUGGCCGAGCUGGCUCCUACAGUGGGCGCAUUUUUCUUUGGCUCCAAACUCGAGCUGGUCAAGAAGAACAGCGGCGGAGCCGAUGAGCCCACCAAGGAUGUGUACGAGCUGCAGUACUCUGGCGCCGUCAGAUUCGAUAGCACCCUGCCUGGCUUCGAGACAAUCAUGAAGGUGCUGAACGAGAACCUGAACGCCUACCAGAAGGAUGGCGGCGCUGACGUGGUGUCUCCUAAGCCUCAGAGAAAAGGCAGACGGCAGGCCCAAGAGAAGAAAGACGAGGUGGACAACGUGUCCGUGGCCAAGCCUAAGAGCAGCGUGCAGAGAAACGUGUCCAGAGAGCUGACCCCAGAGGACAGAUCUCUGCUGGCUCAGAUCCUGGACGAUGGCGUGGUGCCAGAUGGCCUGGAAGAUGACAGCAACGUG [서열번호 242]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 242에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 FMDV 2B 단백질(P03307; 프로테아제 3C 게놈 폴리단백질 구제역 바이러스(단리물-/독일/A5 베스터발트/1951 혈청형 A), 또는 그의 동원체이다. FMDV 2B 단백질의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 243으로 제공된다:
PFFFSDVRSNFSKLVETINQMQEDMSTKHGPDFNRLVSAFEELAAGVKAIRTGLDEAKPWYKLIKLLSRLSCMAAVAARSKDPVLVAIMLADTGLEILDSTFVVKKISDSLSSLFHVPAPVFSFGAPILLAGLVKVASSFFRSTPEDLERAEKQ [서열번호 243]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 243에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 FMDV 2B 폴리펩티드는 다음과 같은 서열번호 244의 DNA 뉴클레오티드 서열에 의해 암호화된다:
CCCTTCTTCTTCTCTGACGTTAGGTCAAACTTTTCTAAGCTGGTGGAAACCATCAACCAGATGCAGGAAGACATGTCAACAAAACACGGGCCCGACTTTAACCGGTTGGTGTCCGCCTTTGAGGAACTGGCCGCTGGAGTAAAAGCCATCAGGACCGGCCTCGACGAGGCCAAACCCTGGTACAAGCTTATCAAACTCCTAAGCCGCCTGTCGTGCATGGCCGCTGTGGCAGCACGGTCCAAGGACCCAGTCCTTGTGGCCATCATGCTGGCCGACACCGGTCTCGAGATTCTGGACAGCACTTTCGTCGTGAAGAAGATCTCCGACTCGCTCTCCAGTCTCTTCCACGTGCCGGCCCCCGTCTTCAGTTTCGGAGCCCCGATTCTGCTAGCCGGGCTGGTCAAGGTCGCCTCGAGTTTCTTCCGGTCCACGCCCGAAGACCTTGAGAGAGCAGAGAAACAG [서열번호 244]
따라서, 바람직하게는 상기 FMDV 2B 폴리펩티드는 실질적으로 서열번호 244에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 FMDV 2B 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 245로 제공된다:
CCGTTCTTCTTTAGCGACGTGCGGAGCAACTTCAGCAAGCTGGTGGAAACCATCAACCAGATGCAAGAGGACATGAGCACCAAGCACGGCCCCGACTTCAACAGACTGGTGTCCGCCTTTGAGGAACTGGCCGCTGGCGTGAAGGCCATCAGAACAGGACTGGATGAGGCCAAGCCTTGGTACAAGCTGATCAAGCTGCTGAGCCGGCTGAGCTGTATGGCTGCTGTGGCCGCCAGATCCAAGGATCCTGTGCTGGTGGCCATCATGCTGGCCGATACAGGCCTGGAAATCCTGGACAGCACCTTCGTGGTCAAGAAGATCAGCGACAGCCTGAGCAGCCTGTTCCACGTGCCAGCTCCAGTGTTCTCTTTTGGCGCCCCTATTCTGCTGGCCGGCCTGGTCAAAGTGGCCAGCAGCTTCTTTAGAAGCACCCCTGAGGACCTGGAACGGGCCGAAAAACAA [서열번호 245]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 245에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 245의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 246으로 제공된다:
CCGUUCUUCUUUAGCGACGUGCGGAGCAACUUCAGCAAGCUGGUGGAAACCAUCAACCAGAUGCAAGAGGACAUGAGCACCAAGCACGGCCCCGACUUCAACAGACUGGUGUCCGCCUUUGAGGAACUGGCCGCUGGCGUGAAGGCCAUCAGAACAGGACUGGAUGAGGCCAAGCCUUGGUACAAGCUGAUCAAGCUGCUGAGCCGGCUGAGCUGUAUGGCUGCUGUGGCCGCCAGAUCCAAGGAUCCUGUGCUGGUGGCCAUCAUGCUGGCCGAUACAGGCCUGGAAAUCCUGGACAGCACCUUCGUGGUCAAGAAGAUCAGCGACAGCCUGAGCAGCCUGUUCCACGUGCCAGCUCCAGUGUUCUCUUUUGGCGCCCCUAUUCUGCUGGCCGGCCUGGUCAAAGUGGCCAGCAGCUUCUUUAGAAGCACCCCUGAGGACCUGGAACGGGCCGAAAAACAA [서열번호 246]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 246에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 인플루엔자 바이러스 A PB1-F2(B4URE5; 단백질 PB1-F2 인플루엔자 A 바이러스(바이러스주 A/러시아:상트 페테르부르크/8/2006 H1N1 바이러스주), 또는 그의 동원체이다. 인플루엔자 바이러스 A PB1-F2의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 247로 나타낸다:
MGQEQDTPWILSTGHISTQKREDGQQTPKLEHRNSTRLMGHFQKTMNQVVMPKQIVYWRRWLSLRNPILVFLKTRVLKRWRLFSKHE [서열번호 247]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 247에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 인플루엔자 바이러스 A PB1-F2 폴리펩티드는 다음과 같은 서열번호 248의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGGACAGGAACAGGATACACCATGGATACTGTCAACAGGACACATCAGTACTCAGAAAAGGGAAGATGGACAACAAACACCGAAACTGGAGCACCGCAACTCAACCCGATTGATGGGCCACTTCCAGAAGACAATGAACCAAGTGGTTATGCCCAAACAGATTGTGTATTGGAGGCGATGGCTTTCCTTGAGGAATCCCATCCTGGTATTTTTGAAAACTCGTGTATTGAAACGATGGAGGTTGTTCAGCAAACACGAG [서열번호 248]
따라서, 바람직하게는 상기 인플루엔자 바이러스 A PB1-F2 폴리펩티드는 실질적으로 서열번호 248에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 인플루엔자 바이러스 A PB1-F2 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 249로 제공된다:
ATGGGCCAAGAGCAGGACACACCTTGGATCCTGAGCACCGGCCACATCAGCACCCAGAAGAGAGAGGACGGACAGCAGACCCCTAAGCTGGAACACCGGAACAGCACCAGACTGATGGGCCACTTCCAGAAAACCATGAACCAGGTGGTCATGCCCAAGCAGATCGTGTACTGGCGGAGATGGCTGAGCCTGCGGAATCCTATCCTGGTGTTCCTGAAAACCCGGGTGCTGAAGAGATGGCGGCTGTTCTCTAAGCACGAG [서열번호 249]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 249에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 249의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 250으로 제공된다:
AUGGGCCAAGAGCAGGACACACCUUGGAUCCUGAGCACCGGCCACAUCAGCACCCAGAAGAGAGAGGACGGACAGCAGACCCCUAAGCUGGAACACCGGAACAGCACCAGACUGAUGGGCCACUUCCAGAAAACCAUGAACCAGGUGGUCAUGCCCAAGCAGAUCGUGUACUGGCGGAGAUGGCUGAGCCUGCGGAAUCCUAUCCUGGUGUUCCUGAAAACCCGGGUGCUGAAGAGAUGGCGGCUGUUCUCUAAGCACGAG [서열번호 250]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 250에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 A형 간염 단백질 3ABC(Q05794; 게놈 폴리단백질 인간 A형 간염 바이러스 유전자형 IA(HAS-15 단리물)), 또는 그의 동원체이다. A형 간염 단백질 3ABC의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 251로 나타낸다:
GISDDDSAVAEFFQSFPSGEPSNSKLSSFFQSVTNHKWVAVGAAVGILGLLVGGWFVYKHFSRKEEEPIPAEGVYHGVTKPKQVIKLDADPVESQSTLEIAGLVRKNLVQFGVGEKNGCVRWVMNALGVKDDWLLVPSHAYKFEKDYEMMEFYFNRGGTYYSISAGNVVIQSLDVGFQDVVLMKVPTIPKFRDITQHFIKKGDVPRALNRLATLVTTVNGTPMLISEGPLKMEEKATYVHKKNDGTTVDLTVDQAWRGKGEGLPGMCGGALVSSNQSIQNAILGIHVAGGNSILVAKLITQEMFQNIDKKIESQ [서열번호 251]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 251에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 A형 간염 단백질 3ABC 폴리펩티드는 다음과 같은 서열번호 252의 DNA 뉴클레오티드 서열에 의해 암호화된다:
GGAATTTCAGATGATGACAGTGCAGTAGCTGAGTTTTTCCAGTCTTTTCCATCTGGTGAACCATCAAATTCCAAGTTATCTAGTTTTTTCCAATCTGTCACTAATCACAAGTGGGTTGCTGTGGGAGCTGCAGTTGGTATTCTTGGATTGCTAGTGGGAGGATGGTTTGTGTATAAGCATTTTTCCCGCAAAGAGGAAGAACCAATTCCAGCTGAAGGGGTTTATCATGGAGTGACTAAGCCCAAACAAGTGATTAAATTGGATGCAGATCCAGTAGAGTCCCAGTCAACTCTAGAAATAGCAGGATTAGTTAGGAAAAATTTGGTTCAGTTTGGAGTTGGTGAGAAAAATGGATGTGTGAGATGGGTCATGAATGCCTTAGGAGTGAAGGATGATTGGTTGTTAGTACCTTCTCATGCTTATAAATTTGAAAAGGATTATGAAATGATGGAGTTTTATTTCAATAGAGGTGGAACTTACTATTCAATTTCAGCTGGTAATGTTGTTATTCAATCTTTAGATGTGGGATTCCAAGATGTTGTTCTAATGAAGGTTCCTACAATTCCCAAGTTTAGAGATATTACTCAACATTTTATTAAGAAAGGAGATGTGCCTAGAGCCTTGAATCGCTTGGCAACATTAGTGACAACCGTTAATGGAACTCCTATGTTAATTTCTGAGGGACCTTTAAAAATGGAAGAAAAAGCCACTTATGTTCATAAGAAGAACGATGGTACTACGGTTGATTTGACTGTAGATCAGGCATGGAGAGGAAAAGGTGAAGGTCTTCCTGGAATGTGTGGTGGGGCCCTAGTGTCATCAAATCAGTCCATACAAAATGCAATTTTGGGTATTCATGTTGCTGGAGGAAATTCAATTCTTGTGGCAAAGTTGATTACTCAAGAAATGTTTCAAAACATTGATAAGAAAATTGAAAGTCAG [서열번호 252]
따라서, 바람직하게는 상기 A형 간염 단백질 3ABC 폴리펩티드는 실질적으로 서열번호 252에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 A형 간염 단백질 3ABC 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 253으로 제공된다:
GGCATCAGCGACGATGATTCTGCCGTGGCCGAGTTCTTCCAGAGCTTTCCTAGCGGCGAGCCCAGCAACAGCAAGCTGAGCAGCTTCTTCCAGTCCGTGACCAACCACAAATGGGTCGCCGTGGGAGCCGCTGTGGGAATTCTGGGACTTCTCGTTGGCGGATGGTTCGTGTACAAGCACTTCAGCCGGAAAGAGGAAGAACCCATTCCTGCCGAGGGCGTGTACCACGGCGTGACCAAACCTAAGCAAGTGATCAAGCTGGACGCCGATCCTGTGGAAAGCCAGAGCACACTGGAAATCGCCGGACTCGTGCGGAAGAACCTGGTGCAGTTTGGCGTGGGCGAGAAGAACGGCTGTGTCAGATGGGTCATGAACGCCCTGGGCGTGAAGGACGATTGGCTGCTGGTTCCTAGCCACGCCTACAAGTTCGAGAAGGACTACGAGATGATGGAATTCTACTTCAACAGAGGCGGCACCTACTACAGCATCAGCGCCGGCAATGTGGTCATCCAGTCTCTGGATGTGGGCTTCCAGGACGTGGTGCTGATGAAGGTGCCAACAATCCCCAAGTTCCGGGACATCACCCAGCACTTCATCAAGAAAGGCGACGTGCCCAGGGCTCTGAACAGACTGGCTACCCTGGTCACCACCGTGAACGGCACACCCATGCTGATCTCTGAGGGCCCACTGAAGATGGAAGAGAAGGCCACCTACGTGCACAAGAAGAACGACGGCACCACAGTGGACCTGACCGTGGATCAAGCTTGGAGAGGCAAAGGCGAGGGCCTGCCTGGAATGTGTGGCGGAGCACTGGTGTCCAGCAACCAGAGCATCCAGAATGCCATCCTGGGCATCCATGTGGCTGGCGGCAATTCTATCCTGGTGGCCAAGCTGATCACCCAAGAGATGTTCCAGAACATCGACAAGAAGATCGAGAGCCAG [서열번호 253]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 253에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 253의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 254로 제공된다:
GGCAUCAGCGACGAUGAUUCUGCCGUGGCCGAGUUCUUCCAGAGCUUUCCUAGCGGCGAGCCCAGCAACAGCAAGCUGAGCAGCUUCUUCCAGUCCGUGACCAACCACAAAUGGGUCGCCGUGGGAGCCGCUGUGGGAAUUCUGGGACUUCUCGUUGGCGGAUGGUUCGUGUACAAGCACUUCAGCCGGAAAGAGGAAGAACCCAUUCCUGCCGAGGGCGUGUACCACGGCGUGACCAAACCUAAGCAAGUGAUCAAGCUGGACGCCGAUCCUGUGGAAAGCCAGAGCACACUGGAAAUCGCCGGACUCGUGCGGAAGAACCUGGUGCAGUUUGGCGUGGGCGAGAAGAACGGCUGUGUCAGAUGGGUCAUGAACGCCCUGGGCGUGAAGGACGAUUGGCUGCUGGUUCCUAGCCACGCCUACAAGUUCGAGAAGGACUACGAGAUGAUGGAAUUCUACUUCAACAGAGGCGGCACCUACUACAGCAUCAGCGCCGGCAAUGUGGUCAUCCAGUCUCUGGAUGUGGGCUUCCAGGACGUGGUGCUGAUGAAGGUGCCAACAAUCCCCAAGUUCCGGGACAUCACCCAGCACUUCAUCAAGAAAGGCGACGUGCCCAGGGCUCUGAACAGACUGGCUACCCUGGUCACCACCGUGAACGGCACACCCAUGCUGAUCUCUGAGGGCCCACUGAAGAUGGAAGAGAAGGCCACCUACGUGCACAAGAAGAACGACGGCACCACAGUGGACCUGACCGUGGAUCAAGCUUGGAGAGGCAAAGGCGAGGGCCUGCCUGGAAUGUGUGGCGGAGCACUGGUGUCCAGCAACCAGAGCAUCCAGAAUGCCAUCCUGGGCAUCCAUGUGGCUGGCGGCAAUUCUAUCCUGGUGGCCAAGCUGAUCACCCAAGAGAUGUUCCAGAACAUCGACAAGAAGAUCGAGAGCCAG [서열번호 254]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 254에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 B형 간염 X 단백질(P03165; 단백질 X B형 간염 바이러스 유전자형 D), 또는 그의 동원체이다. B형 간염 X 단백질의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 255로 나타낸다:
MAARLCCQLDPARDVLCLRPVGAESRGRPFSGSLGTLSSPSPSAVSTDHGAHLSLRGLPVCAFSSAGPCALRFTSARRMETTVKAQPFLPKVLHKRTLGLSVMSTTDLEAYFKDCLFKDWEELGEEIRLKVFVLGGCRHKLVCAPAPCNFFTSA [서열번호 255]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 255에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 B형 간염 X 폴리펩티드는 다음과 같은 서열번호 256의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGCTGCTAGGCTGTGCTGCCAACTGGATCCTGCGCGGGACGTCCTTTGTTTACGTCCCGTCGGCGCTGAATCCCGCGGACGACCCTTCTCGGGGTCGCTTGGGACTCTCTCGTCCCCTTCTCCGTCTGCCGTTTCGACCGACCACGGGGCGCACCTCTCTTTACGCGGACTCCCCGTCTGTGCCTTCTCATCTGCCGGACCGTGTGCACTTCGCTTCACCTCTGCACGTCGCATGGAGACCACCGTGAAAGCCCAACCATTCTTGCCCAAGGTCTTACATAAGAGGACTCTTGGACTCTCTGTAATGTCAACGACCGACCTTGAGGCATACTTCAAAGACTGTTTGTTTAAAGACTGGGAGGAGTTGGGGGAGGAGATTAGATTAAAGGTCTTTGTATTAGGAGGCTGTAGGCATAAATTGGTCTGCGCACCAGCACCATGCAACTTTTTCACCTCTGCC [서열번호 256]
따라서, 바람직하게는 상기 B형 간염 X 폴리펩티드는 실질적으로 서열번호 256에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 B형 간염 X 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 257로 제공된다:
ATGGCCGCCAGACTGTGCTGTCAACTGGACCCTGCTAGGGACGTGCTGTGTCTCAGACCTGTGGGAGCCGAGTCTAGAGGCAGACCTTTTTCTGGCTCTCTGGGCACCCTGAGCAGCCCATCTCCATCTGCCGTGTCTACAGATCACGGCGCCCACCTGTCTCTGAGAGGACTGCCTGTGTGTGCCTTTAGCAGCGCCGGACCTTGCGCTCTGAGATTCACATCTGCCAGACGGATGGAAACCACCGTGAAGGCCCAGCCTTTCCTGCCTAAGGTGCTGCACAAGAGAACCCTGGGCCTGAGCGTGATGAGCACCACAGATCTGGAAGCCTACTTCAAGGATTGCCTGTTCAAGGACTGGGAAGAACTGGGCGAAGAGATCCGGCTGAAGGTGTTCGTGCTCGGCGGATGCAGACACAAGCTCGTGTGTGCTCCCGCTCCTTGCAACTTCTTTACCAGCGCT [서열번호 257]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 257에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 257의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 258로 제공된다:
AUGGCCGCCAGACUGUGCUGUCAACUGGACCCUGCUAGGGACGUGCUGUGUCUCAGACCUGUGGGAGCCGAGUCUAGAGGCAGACCUUUUUCUGGCUCUCUGGGCACCCUGAGCAGCCCAUCUCCAUCUGCCGUGUCUACAGAUCACGGCGCCCACCUGUCUCUGAGAGGACUGCCUGUGUGUGCCUUUAGCAGCGCCGGACCUUGCGCUCUGAGAUUCACAUCUGCCAGACGGAUGGAAACCACCGUGAAGGCCCAGCCUUUCCUGCCUAAGGUGCUGCACAAGAGAACCCUGGGCCUGAGCGUGAUGAGCACCACAGAUCUGGAAGCCUACUUCAAGGAUUGCCUGUUCAAGGACUGGGAAGAACUGGGCGAAGAGAUCCGGCUGAAGGUGUUCGUGCUCGGCGGAUGCAGACACAAGCUCGUGUGUGCUCCCGCUCCUUGCAACUUCUUUACCAGCGCU [서열번호 258]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 258에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 SARS-CoV NSP15(P0C6X7; 레플리카아제(replicase) 폴리단백질 중증 급성 호흡기 증후군 코로나바이러스), 또는 그의 동원체이다. SARS-CoV NSP15의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 259로 나타낸다:
SLENVAYNVVNKGHFDGHAGEAPVSIINNAVYTKVDGIDVEIFENKTTLPVNVAFELWAKRNIKPVPEIKILNNLGVDIAANTVIWDYKREAPAHVSTIGVCTMTDIAKKPTESACSSLTVLFDGRVEGQVDLFRNARNGVLITEGSVKGLTPSKGPAQASVNGVTLIGESVKTQFNYFKKVDGIIQQLPETYFTQSRDLEDFKPRSQMETDFLELAMDEFIQRYKLEGYAFEHIVYGDFSHGQLGGLHLMIGLAKRSQDSPLKLEDFIPMDSTVKNYFITDAQTGSSKCVCSVIDLLLDDFVEIIKSQDLSVISKVVKVTIDYAEISFMLWCKDGHVETFYPKLQ [서열번호 259]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 259에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 SARS-CoV NSP15 폴리펩티드는 다음과 같은 서열번호 260의 DNA 뉴클레오티드 서열에 의해 암호화된다:
AGTTTAGAAAATGTGGCTTATAATGTTGTTAATAAAGGACACTTTGATGGACACGCCGGCGAAGCACCTGTTTCCATCATTAATAATGCTGTTTACACAAAGGTAGATGGTATTGATGTGGAGATCTTTGAAAATAAGACAACACTTCCTGTTAATGTTGCATTTGAGCTTTGGGCTAAGCGTAACATTAAACCAGTGCCAGAGATTAAGATACTCAATAATTTGGGTGTTGATATCGCTGCTAATACTGTAATCTGGGACTACAAAAGAGAAGCCCCAGCACATGTATCTACAATAGGTGTCTGCACAATGACTGACATTGCCAAGAAACCTACTGAGAGTGCTTGTTCTTCACTTACTGTCTTGTTTGATGGTAGAGTGGAAGGACAGGTAGACCTTTTTAGAAACGCCCGTAATGGTGTTTTAATAACAGAAGGTTCAGTCAAAGGTCTAACACCTTCAAAGGGACCAGCACAAGCTAGCGTCAATGGAGTCACATTAATTGGAGAATCAGTAAAAACACAGTTTAACTACTTTAAGAAAGTAGACGGCATTATTCAACAGTTGCCTGAAACCTACTTTACTCAGAGCAGAGACTTAGAGGATTTTAAGCCCAGATCACAAATGGAAACTGACTTTCTCGAGCTCGCTATGGATGAATTCATACAGCGATATAAGCTCGAGGGCTATGCCTTCGAACACATCGTTTATGGAGATTTCAGTCATGGACAACTTGGCGGTCTTCATTTAATGATAGGCTTAGCCAAGCGCTCACAAGATTCACCACTTAAATTAGAGGATTTTATCCCTATGGACAGCACAGTGAAAAATTACTTCATAACAGATGCGCAAACAGGTTCATCAAAATGTGTGTGTTCTGTGATTGATCTTTTACTTGATGACTTTGTCGAGATAATAAAGTCACAAGATTTGTCAGTGATTTCAAAAGTGGTCAAGGTTACAATTGACTATGCTGAAATTTCATTCATGCTTTGGTGTAAGGATGGACATGTTGAAACCTTCTACCCAAAACTACAA [서열번호 260]
따라서, 바람직하게는 상기 SARS-CoV NSP15 폴리펩티드는 실질적으로 서열번호 260에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 SARS-CoV NSP15 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 261로 제공된다:
AGCCTGGAAAACGTGGCCTACAACGTGGTCAACAAGGGCCACTTTGATGGCCACGCTGGCGAAGCCCCTGTGTCCATCATTAACAACGCCGTGTACACCAAGGTGGACGGCATCGACGTGGAAATCTTCGAGAACAAGACCACACTGCCCGTGAATGTGGCCTTCGAGCTGTGGGCCAAGCGGAACATTAAGCCCGTGCCTGAGATCAAGATCCTGAACAACCTGGGCGTCGACATTGCCGCCAACACCGTGATCTGGGACTACAAGAGAGAAGCCCCAGCTCACGTGTCCACCATCGGCGTGTGTACCATGACCGATATCGCCAAGAAGCCCACCGAGAGCGCCTGTAGCTCTCTGACCGTGCTGTTCGACGGCAGAGTGGAAGGCCAGGTGGACCTGTTCAGAAACGCCAGAAACGGCGTGCTGATCACCGAGGGCTCTGTGAAGGGACTGACCCCTTCTAAGGGACCTGCTCAGGCCTCTGTGAATGGCGTGACACTGATCGGCGAGAGCGTGAAAACCCAGTTCAACTACTTCAAGAAGGTCGACGGGATCATCCAGCAGCTGCCCGAGACATACTTCACCCAGAGCCGCGACCTGGAAGATTTCAAGCCTCGGAGCCAGATGGAAACCGACTTCCTGGAACTGGCCATGGACGAGTTCATCCAGCGGTACAAGCTGGAAGGCTACGCCTTTGAGCACATCGTGTACGGCGATTTCAGCCACGGACAGCTCGGAGGACTGCACCTGATGATTGGCCTGGCCAAGAGAAGCCAGGACAGCCCTCTGAAGCTCGAGGACTTCATCCCCATGGACAGCACCGTGAAGAATTACTTCATCACAGACGCCCAGACCGGCAGCTCTAAGTGCGTGTGTAGCGTGATCGACCTGCTGCTGGACGACTTTGTGGAAATCATCAAGAGCCAGGACCTGAGCGTGATCTCCAAGGTGGTCAAAGTGACCATCGACTACGCCGAGATCAGCTTCATGCTGTGGTGCAAGGACGGCCACGTGGAAACATTCTACCCCAAGCTGCAG [서열번호 261]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 261에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 261의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 262로 제공된다:
AGCCUGGAAAACGUGGCCUACAACGUGGUCAACAAGGGCCACUUUGAUGGCCACGCUGGCGAAGCCCCUGUGUCCAUCAUUAACAACGCCGUGUACACCAAGGUGGACGGCAUCGACGUGGAAAUCUUCGAGAACAAGACCACACUGCCCGUGAAUGUGGCCUUCGAGCUGUGGGCCAAGCGGAACAUUAAGCCCGUGCCUGAGAUCAAGAUCCUGAACAACCUGGGCGUCGACAUUGCCGCCAACACCGUGAUCUGGGACUACAAGAGAGAAGCCCCAGCUCACGUGUCCACCAUCGGCGUGUGUACCAUGACCGAUAUCGCCAAGAAGCCCACCGAGAGCGCCUGUAGCUCUCUGACCGUGCUGUUCGACGGCAGAGUGGAAGGCCAGGUGGACCUGUUCAGAAACGCCAGAAACGGCGUGCUGAUCACCGAGGGCUCUGUGAAGGGACUGACCCCUUCUAAGGGACCUGCUCAGGCCUCUGUGAAUGGCGUGACACUGAUCGGCGAGAGCGUGAAAACCCAGUUCAACUACUUCAAGAAGGUCGACGGGAUCAUCCAGCAGCUGCCCGAGACAUACUUCACCCAGAGCCGCGACCUGGAAGAUUUCAAGCCUCGGAGCCAGAUGGAAACCGACUUCCUGGAACUGGCCAUGGACGAGUUCAUCCAGCGGUACAAGCUGGAAGGCUACGCCUUUGAGCACAUCGUGUACGGCGAUUUCAGCCACGGACAGCUCGGAGGACUGCACCUGAUGAUUGGCCUGGCCAAGAGAAGCCAGGACAGCCCUCUGAAGCUCGAGGACUUCAUCCCCAUGGACAGCACCGUGAAGAAUUACUUCAUCACAGACGCCCAGACCGGCAGCUCUAAGUGCGUGUGUAGCGUGAUCGACCUGCUGCUGGACGACUUUGUGGAAAUCAUCAAGAGCCAGGACCUGAGCGUGAUCUCCAAGGUGGUCAAAGUGACCAUCGACUACGCCGAGAUCAGCUUCAUGCUGUGGUGCAAGGACGGCCACGUGGAAACAUUCUACCCCAAGCUGCAG [서열번호 262]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 262에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 SARS CoV Orf9b(P59636; SARS ORF9b 단백질 중증 급성 호흡기 증후군 코로나바이러스), 또는 그의 동원체이다. SARS CoV Orf9b의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 263으로 나타낸다:
MDPNQTNVVPPALHLVDPQIQLTITRMEDAMGQGQNSADPKVYPIILRLGSQLSLSMARRNLDSLEARAFQSTPIVVQMTKLATTEELPDEFVVVTAK [서열번호 263]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 263에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 SARS CoV Orf9b 폴리펩티드는 다음과 같은 서열번호 264의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGACCCCAATCAAACCAACGTAGTGCCCCCCGCATTACATTTGGTGGACCCACAGATTCAACTGACAATAACCAGAATGGAGGACGCAATGGGGCAAGGCCAAAACAGCGCCGACCCCAAGGTTTACCCAATAATACTGCGTCTTGGTTCACAGCTCTCACTCAGCATGGCAAGGAGGAACTTAGATTCCCTCGAGGCCAGGGCGTTCCAATCAACACCAATAGTGGTCCAGATGACCAAATTGGCTACTACCGAAGAGCTACCCGACGAGTTCGTGGTGGTGACGGCAAAA [서열번호 264]
따라서, 바람직하게는 상기 SARS CoV Orf9b 폴리펩티드는 실질적으로 서열번호 264에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 SARS CoV Orf9b 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 265로 제공된다:
ATGGACCCCAACCAGACCAATGTGGTGCCTCCTGCTCTGCACCTGGTGGACCCTCAGATCCAGCTGACCATCACCAGAATGGAAGATGCCATGGGCCAGGGCCAGAACAGCGCCGATCCTAAGGTGTACCCCATCATCCTGAGACTGGGCAGCCAGCTGAGCCTGAGCATGGCCAGAAGAAACCTGGACAGCCTGGAAGCCAGAGCCTTCCAGAGCACACCTATCGTGGTGCAGATGACCAAGCTGGCCACCACCGAGGAACTGCCCGATGAGTTTGTGGTGGTCACCGCCAAA [서열번호 265]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 265에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 265의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 266으로 제공된다:
AUGGACCCCAACCAGACCAAUGUGGUGCCUCCUGCUCUGCACCUGGUGGACCCUCAGAUCCAGCUGACCAUCACCAGAAUGGAAGAUGCCAUGGGCCAGGGCCAGAACAGCGCCGAUCCUAAGGUGUACCCCAUCAUCCUGAGACUGGGCAGCCAGCUGAGCCUGAGCAUGGCCAGAAGAAACCUGGACAGCCUGGAAGCCAGAGCCUUCCAGAGCACACCUAUCGUGGUGCAGAUGACCAAGCUGGCCACCACCGAGGAACUGCCCGAUGAGUUUGUGGUGGUCACCGCCAAA [서열번호 266]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 266에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 리노바이러스 2Apro(P23008; 게놈 폴리단백질 인간 리노바이러스 1A), 또는 그의 동원체이다. 리노바이러스 2Apro의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 267로 나타낸다:
GPSDLYVHVGNLIYRNLHLFNSEMHDSILISYSSDLIIYRTNTIGDDYIPNCNCTEATYYCRHKNRYYPIKVTPHDWYEIQESEYYPKHIQYNLLIGEGPCEPGDCGGKLLCRHGVIGIITAGGEGHVAFIDLRQFHCAEEQ [서열번호 267]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 267에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 리노바이러스 2Apro 폴리펩티드는 다음과 같은 서열번호 268의 DNA 뉴클레오티드 서열에 의해 암호화된다:
GGGCCCAGTGATCTATATGTGCATGTAGGTAACTTAATATATAGAAACTTACATCTGTTCAATTCTGAAATGCATGATTCAATTTTGATTTCATACTCTTCTGATTTAATCATATACCGCACAAACACTATAGGTGATGATTATATTCCCAATTGTAACTGCACTGAGGCTACTTATTATTGTAGACACAAAAATAGGTATTACCCAATAAAAGTTACTCCACATGATTGGTATGAAATACAAGAGAGTGAATATTACCCCAAACACATCCAATACAACCTATTAATTGGTGAAGGACCATGTGAACCTGGTGATTGTGGTGGAAAACTTCTTTGTAGACATGGTGTCATTGGCATAATCACAGCAGGTGGTGAAGGTCATGTAGCATTTATAGATCTTAGACAATTTCACTGTGCTGAGGAACAA [서열번호 268]
따라서, 바람직하게는 상기 리노바이러스 2Apro 폴리펩티드는 실질적으로 서열번호 268에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 리노바이러스 2Apro 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 269로 제공된다:
GGCCCTAGCGATCTGTATGTGCACGTGGGCAACCTGATCTACCGGAACCTGCACCTGTTCAACAGCGAGATGCACGACAGCATCCTGATCAGCTACAGCAGCGACCTGATCATCTATCGGACCAACACCATCGGCGACGACTACATCCCCAACTGCAACTGTACCGAGGCCACCTACTACTGCCGGCACAAGAACCGGTACTACCCCATCAAAGTGACCCCTCACGATTGGTACGAGATCCAAGAGAGCGAGTACTACCCTAAGCACATCCAGTACAACCTGCTGATCGGCGAGGGACCTTGCGAGCCTGGCGATTGTGGTGGAAAGCTGCTGTGTAGACACGGCGTGATCGGCATCATTACAGCCGGCGGAGAAGGACACGTGGCCTTTATCGACCTGCGGCAGTTTCACTGCGCCGAGGAACAG [서열번호 269]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 269에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 269의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 270으로 제공된다:
GGCCCUAGCGAUCUGUAUGUGCACGUGGGCAACCUGAUCUACCGGAACCUGCACCUGUUCAACAGCGAGAUGCACGACAGCAUCCUGAUCAGCUACAGCAGCGACCUGAUCAUCUAUCGGACCAACACCAUCGGCGACGACUACAUCCCCAACUGCAACUGUACCGAGGCCACCUACUACUGCCGGCACAAGAACCGGUACUACCCCAUCAAAGUGACCCCUCACGAUUGGUACGAGAUCCAAGAGAGCGAGUACUACCCUAAGCACAUCCAGUACAACCUGCUGAUCGGCGAGGGACCUUGCGAGCCUGGCGAUUGUGGUGGAAAGCUGCUGUGUAGACACGGCGUGAUCGGCAUCAUUACAGCCGGCGGAGAAGGACACGUGGCCUUUAUCGACCUGCGGCAGUUUCACUGCGCCGAGGAACAG [서열번호 270]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 270에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 리노바이러스 3Cpro(P23008; 게놈 폴리단백질 인간 리노바이러스 1A), 또는 그의 동원체이다. 리노바이러스 3Cpro의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 271로 나타낸다:
GPEEEFGRSILKNNTCVITTGNGKFTGLGIHDRILIIPTHADPGREVQVNGVHTKVLDSYDLYNRDGVKLEITVIQLDRNEKFRDIRKYIPETEDDYPECNLALSANQDEPTIIKVGDVVSYGNILLSGNQTARMLKYNYPTKSGYCGGVLYKIGQILGIHVGGNGRDGFSAMLLRSYFTDTQ [서열번호 271]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 271에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 리노바이러스 3Cpro 폴리펩티드는 다음과 같은 서열번호 272의 DNA 뉴클레오티드 서열에 의해 암호화된다:
GGTCCAGAAGAAGAATTTGGAAGGTCAATTCTCAAAAACAATACTTGTGTGATTACTACAGGTAATGGAAAATTTACAGGTCTTGGTATACATGACAGAATTCTAATCATCCCAACACATGCTGATCCAGGTAGAGAGGTCCAAGTTAATGGTGTCCACACTAAGGTTCTAGACTCATATGATCTTTATAATAGAGATGGAGTTAAACTTGAAATAACGGTCATACAATTAGATAGAAATGAAAAATTTAGGGACATTAGAAAGTATATACCTGAAACAGAAGACGATTATCCAGAATGCAATTTGGCACTTTCAGCTAATCAAGATGAACCAACTATAATTAAAGTAGGAGATGTAGTGTCCTATGGCAATATTTTGCTTAGTGGAAATCAAACAGCCAGAATGCTTAAATATAATTACCCCACAAAATCAGGGTATTGTGGAGGGGTACTATATAAAATTGGTCAAATTCTAGGTATTCATGTGGGTGGAAATGGAAGGGATGGTTTTTCAGCTATGTTACTTAGATCATACTTTACAGATACTCAG [서열번호 272]
따라서, 바람직하게는 상기 리노바이러스 3Cpro 폴리펩티드는 실질적으로 서열번호 272에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 리노바이러스 3Cpro 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 273으로 제공된다:
GGACCTGAGGAAGAGTTCGGCAGATCCATCCTGAAGAACAATACCTGCGTGATCACCACCGGCAACGGCAAGTTTACAGGCCTGGGCATCCACGACCGGATCCTGATCATTCCCACACACGCCGATCCTGGCCGGGAAGTGCAAGTGAATGGCGTGCACACCAAGGTGCTGGACAGCTACGACCTGTACAACCGCGACGGCGTGAAGCTGGAAATCACCGTGATTCAGCTGGACCGGAACGAGAAGTTCCGGGACATCCGGAAGTACATCCCCGAGACAGAGGACGACTACCCCGAGTGTAATCTGGCCCTGAGCGCCAACCAGGACGAGCCCACAATTATCAAAGTGGGCGACGTGGTGTCCTACGGCAACATCCTGCTGTCCGGCAATCAGACCGCCAGAATGCTGAAGTACAACTACCCCACCAAGAGCGGCTACTGTGGCGGCGTGCTGTATAAGATCGGCCAGATCCTGGGAATTCACGTCGGCGGCAATGGCAGAGATGGCTTCTCTGCTATGCTGCTGCGGAGCTACTTCACCGACACACAG [서열번호 273]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 273에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 273의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 274로 제공된다:
GGACCUGAGGAAGAGUUCGGCAGAUCCAUCCUGAAGAACAAUACCUGCGUGAUCACCACCGGCAACGGCAAGUUUACAGGCCUGGGCAUCCACGACCGGAUCCUGAUCAUUCCCACACACGCCGAUCCUGGCCGGGAAGUGCAAGUGAAUGGCGUGCACACCAAGGUGCUGGACAGCUACGACCUGUACAACCGCGACGGCGUGAAGCUGGAAAUCACCGUGAUUCAGCUGGACCGGAACGAGAAGUUCCGGGACAUCCGGAAGUACAUCCCCGAGACAGAGGACGACUACCCCGAGUGUAAUCUGGCCCUGAGCGCCAACCAGGACGAGCCCACAAUUAUCAAAGUGGGCGACGUGGUGUCCUACGGCAACAUCCUGCUGUCCGGCAAUCAGACCGCCAGAAUGCUGAAGUACAACUACCCCACCAAGAGCGGCUACUGUGGCGGCGUGCUGUAUAAGAUCGGCCAGAUCCUGGGAAUUCACGUCGGCGGCAAUGGCAGAGAUGGCUUCUCUGCUAUGCUGCUGCGGAGCUACUUCACCGACACACAG [서열번호 274]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 274에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 로타바이러스 VP3(A2T3S5; 단백질 VP3 로타바이러스 A(RVA/원숭이/남아프리카/SA11-H96/1958/G3P5B[2] 단리물)), 또는 그의 동원체이다. 로타바이러스 VP3의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 275로 나타낸다:
MKVLALRHSVAQVYADTQVYVHDDTKDSYENAFLISNLTTHNILYLNYSIKTLEILNKSGIAAIALQSLEELFTLIRCNFTYDYELDIIYLHDYSYYTNNEIRTDQHWITKTNIEEYLLPGWKLTYVGYNGSETRGHYNFSFKCQNAATDDDLIIEYIYSEALDFQNFMLKKIKERMTTSLPIARLSNRVFRDKLFPSLLKEHKNVVNVGPRNESMFTFLNYPTIKQFSNGAYLVKDTIKLKQERWLGKRISQFDIGQYKNMLNVLTAIYYYYNLYKSKPIIYMIGSAPSYWIYDVRHYSDFFFETWDPLDTPYSSIHHKELFFINDVKKLKDNSILYIDIRTDRGNADWKKWRKTVEEQTINNLDIAYEYLRTGKAKVCCVKMTAMDLELPISAKLLHHPTTEIRSEFYLLLDTWDLTNIRRFIPKGVLYSFINNIITENVFIQQPFKVKVLNDSYIVALYALSNDFNNRSEVIKLINNQKQSLITVRINNTFKDEPKVGFKNIYDWTFLPTDFDTKEAIITSYDGCLGLFGLSISLASKPTGNNHLFILSGTDKYYKLDQFANHTSISRRSHQIRFSESATSYSGYIFRDLSNNNFNLIGTNIENSVSGHVYNALIYYRYNYSFDLKRWIYLHSIDKVDIEGGKYYELAPIELIYACRSAKEFATLQDDLTVLRYSNEIENYINTVYSITYADDPNYFIGIQFRNIPYKYDVKIPHLTFGVLHISDNMVPDVIDILKIMKNELFKMDITTSYTYMLSDGIYVANVSGVLSTYFKIYNVFYKNQITFGQSRMFIPHITLSFNNMRTVRIETTKLQIKSIYLRKIKGDTVFDMVE [서열번호 275]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 275에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 로타바이러스 VP3 폴리펩티드는 다음과 같은 서열번호 276의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGAAAGTACTAGCTTTAAGACACAGTGTGGCTCAAGTGTATGCAGACACTCAAGTCTACGTTCATGATGATACAAAAGATAGTTATGAAAACGCTTTTTTAATCTCTAATCTTACGACCCATAATATTTTATACTTAAATTATAGCATTAAAACATTAGAAATATTAAATAAGTCAGGAATAGCTGCAATTGCTTTACAATCACTTGAAGAATTATTCACATTAATAAGGTGTAATTTCACTTATGATTATGAACTTGATATAATATATTTACATGATTATTCATATTATACCAATAATGAAATTAGAACAGACCAACATTGGATAACAAAAACAAATATTGAAGAATATTTACTACCTGGATGGAAATTAACATATGTTGGTTATAATGGAAGTGAAACTAGAGGACATTATAACTTTTCATTTAAATGTCAAAACGCTGCAACAGATGATGATCTAATAATTGAATACATTTATTCAGAAGCGTTGGACTTCCAAAATTTTATGTTAAAAAAGATAAAGGAAAGAATGACTACATCGTTGCCTATAGCTAGATTATCTAACAGAGTATTTAGGGATAAGTTATTCCCATCATTATTGAAAGAACATAAGAATGTAGTGAACGTTGGTCCGCGTAATGAATCTATGTTTACATTTTTAAATTATCCAACTATAAAACAATTTTCAAATGGTGCGTATTTAGTAAAAGATACTATAAAATTAAAACAAGAACGATGGTTAGGTAAAAGGATATCTCAGTTTGATATTGGTCAGTATAAAAATATGCTGAATGTTCTTACAGCAATTTATTATTACTATAATTTATATAAAAGTAAACCAATTATATATATGATCGGATCTGCTCCATCTTATTGGATATATGACGTTAGGCATTATTCCGATTTTTTCTTTGAAACTTGGGATCCATTGGACACACCATATTCATCAATCCATCACAAAGAATTATTTTTTATAAATGATGTGAAGAAACTGAAGGATAACTCAATATTGTATATTGATATAAGAACCGATAGGGGCAATGCTGATTGGAAAAAATGGAGAAAGACAGTAGAAGAACAAACTATTAATAATTTGGACATAGCTTATGAATATTTACGAACGGGTAAAGCGAAGGTGTGTTGTGTTAAGATGACAGCTATGGATTTGGAACTGCCAATTTCAGCTAAATTACTGCACCACCCAACTACGGAAATAAGATCAGAATTTTATTTATTACTAGATACTTGGGATTTAACTAACATTAGGAGGTTCATTCCTAAAGGCGTGTTATATTCATTTATAAACAATATAATAACTGAAAATGTGTTTATTCAACAACCATTTAAAGTAAAAGTACTGAATGATAGTTATATTGTAGCGTTATATGCATTATCAAATGATTTTAATAATAGATCAGAAGTAATTAAATTAATTAATAATCAGAAACAATCTCTAATAACTGTTAGAATAAATAATACGTTTAAGGATGAACCAAAAGTTGGGTTCAAAAATATCTATGATTGGACCTTTCTTCCAACCGACTTTGATACCAAAGAAGCTATAATTACTTCATACGACGGTTGTTTAGGACTCTTTGGTTTGTCTATATCGTTAGCATCAAAACCAACAGGGAATAATCATTTATTCATTTTAAGTGGTACAGATAAGTATTATAAATTGGATCAATTTGCTAATCACACCAGTATATCGAGAAGATCACACCAAATTAGGTTTTCGGAATCTGCTACTTCATATTCAGGTTATATATTTAGAGATTTGTCCAATAATAATTTTAATCTAATTGGTACTAATATAGAGAATTCAGTATCAGGTCATGTATATAATGCTTTAATTTATTATAGATATAATTATTCATTTGATCTTAAACGCTGGATTTATTTACATTCTATAGATAAAGTTGATATAGAAGGAGGAAAGTATTATGAACTCGCACCAATAGAATTAATTTATGCATGTAGATCAGCAAAAGAATTTGCTACATTGCAGGATGACTTAACTGTATTGAGATATTCAAACGAAATAGAGAATTATATTAATACAGTATATAGTATAACATACGCTGATGATCCGAATTACTTTATCGGAATACAATTTAGAAATATACCATATAAATATGATGTTAAAATACCGCATTTAACCTTCGGAGTATTACATATTTCTGATAACATGGTGCCAGACGTGATTGACATACTAAAGATAATGAAGAATGAATTATTTAAAATGGATATTACGACCAGTTATACATATATGTTATCAGATGGAATCTACGTAGCAAATGTTAGTGGAGTATTATCTACATACTTTAAAATCTATAACGTATTTTATAAAAATCAAATAACTTTTGGCCAATCCAGAATGTTTATTCCGCACATAACATTAAGCTTCAATAACATGAGAACAGTAAGGATAGAGACTACTAAATTACAAATTAAATCCATTTATTTAAGAAAGATTAAGGGTGATACAGTGTTTGATATGGTTGAG [서열번호 276]
따라서, 바람직하게는 상기 로타바이러스 VP3 폴리펩티드는 실질적으로 서열번호 276에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 로타바이러스 VP3 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 277로 제공된다:
ATGAAGGTGCTGGCCCTGAGACATTCTGTGGCCCAGGTGTACGCCGACACACAGGTCTACGTGCACGACGACACCAAGGACAGCTACGAGAACGCCTTCCTGATCAGCAACCTGACCACACACAACATCCTGTACCTGAACTACAGCATCAAGACCCTCGAGATCCTGAACAAGAGCGGAATCGCCGCTATCGCCCTGCAGAGCCTGGAAGAACTGTTCACCCTGATCCGGTGCAACTTCACCTACGACTACGAGCTGGACATCATCTACCTGCACGATTACAGCTACTACACCAACAACGAGATCCGGACCGACCAGCACTGGATCACCAAGACCAACATCGAGGAATACCTGCTGCCTGGCTGGAAGCTGACCTACGTGGGCTACAATGGCAGCGAGACACGGGGCCACTACAACTTCAGCTTCAAGTGCCAGAACGCCGCCACCGACGACGACCTGATCATCGAGTACATCTACAGCGAGGCCCTGGACTTCCAGAACTTCATGCTGAAGAAAATCAAAGAACGGATGACCACCAGCCTGCCTATCGCCAGACTGAGCAACCGGGTGTTCCGGGACAAGCTGTTTCCCAGCCTGCTGAAAGAACACAAGAACGTGGTCAACGTGGGCCCCAGAAACGAGAGCATGTTCACCTTTCTGAACTACCCCACCATCAAGCAGTTCAGCAACGGCGCCTACCTGGTCAAGGACACAATCAAGCTGAAGCAAGAGAGATGGCTGGGCAAGAGAATCAGCCAGTTCGACATCGGCCAGTACAAGAACATGCTGAACGTGCTGACCGCCATCTACTACTACTATAACCTGTACAAGAGCAAGCCGATCATCTACATGATTGGCAGCGCCCCTAGCTACTGGATCTACGACGTGCGGCACTACAGCGACTTTTTCTTCGAAACCTGGGATCCCCTGGACACCCCTTACAGCAGCATCCACCACAAAGAGCTGTTCTTCATCAACGACGTGAAGAAGCTCAAGGACAACAGCATCCTCTACATCGACATCAGAACCGACCGGGGCAACGCCGACTGGAAGAAATGGCGGAAAACCGTGGAAGAACAGACCATCAACAACCTGGATATCGCCTACGAGTACCTGCGGACCGGCAAGGCCAAAGTGTGCTGCGTGAAGATGACAGCCATGGACCTGGAACTGCCCATCAGCGCCAAACTGCTGCACCATCCTACCACCGAGATCAGAAGCGAGTTCTATCTGCTGCTGGACACCTGGGACCTGACCAATATCAGACGGTTCATCCCCAAGGGCGTGCTGTACTCCTTTATCAACAACATCATCACCGAGAACGTGTTCATCCAGCAGCCGTTCAAAGTGAAAGTGCTGAACGACAGCTACATCGTGGCCCTGTACGCCCTGAGCAACGACTTCAACAATCGGAGCGAAGTGATCAAACTGATCAACAATCAGAAGCAGTCCCTGATCACCGTGCGCATCAACAATACCTTCAAGGACGAGCCCAAAGTGGGCTTCAAGAATATCTACGACTGGACCTTCCTGCCTACCGACTTCGACACCAAAGAGGCCATCATCACAAGCTACGACGGCTGCCTGGGCCTGTTTGGCCTGTCTATTAGCCTGGCCAGCAAGCCCACCGGCAACAACCACCTGTTTATCCTGAGCGGCACCGACAAGTACTACAAGCTGGATCAGTTCGCCAACCACACCAGCATCAGCAGAAGAAGCCACCAGATCCGGTTCAGCGAGAGCGCCACAAGCTATAGCGGCTACATCTTCCGGGACCTGTCCAACAACAACTTCAACCTGATCGGCACGAACATCGAGAACAGCGTGTCCGGCCACGTGTACAACGCCCTGATCTACTACCGGTACAACTACTCCTTCGACCTGAAGCGGTGGATCTATCTGCACAGCATCGACAAGGTGGACATCGAAGGCGGCAAGTACTATGAGCTGGCCCCTATCGAGCTGATCTACGCCTGCAGAAGCGCCAAAGAGTTCGCCACACTGCAGGACGATCTGACCGTGCTGAGATACAGCAATGAGATCGAGAACTACATCAACACCGTGTACTCCATCACCTACGCCGACGATCCCAACTACTTCATCGGAATCCAGTTCCGCAACATCCCCTATAAGTACGACGTCAAGATCCCTCACCTGACCTTCGGCGTGCTGCACATCAGCGACAACATGGTGCCCGACGTGATCGACATCCTGAAGATCATGAAGAATGAGCTGTTCAAGATGGACATCACCACCAGCTACACCTACATGCTGAGCGACGGCATCTACGTGGCCAATGTGTCTGGCGTGCTGAGCACCTACTTCAAGATCTACAACGTGTTCTACAAGAACCAGATCACCTTCGGCCAGAGCCGGATGTTCATCCCTCACATCACCCTGAGCTTTAACAACATGCGGACCGTGCGGATCGAAACCACCAAGCTGCAGATCAAGAGCATCTACCTCCGGAAGATCAAGGGCGACACCGTGTTCGACATGGTGGAA [서열번호 277]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 277에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 277의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 278로 제공된다:
AUGAAGGUGCUGGCCCUGAGACAUUCUGUGGCCCAGGUGUACGCCGACACACAGGUCUACGUGCACGACGACACCAAGGACAGCUACGAGAACGCCUUCCUGAUCAGCAACCUGACCACACACAACAUCCUGUACCUGAACUACAGCAUCAAGACCCUCGAGAUCCUGAACAAGAGCGGAAUCGCCGCUAUCGCCCUGCAGAGCCUGGAAGAACUGUUCACCCUGAUCCGGUGCAACUUCACCUACGACUACGAGCUGGACAUCAUCUACCUGCACGAUUACAGCUACUACACCAACAACGAGAUCCGGACCGACCAGCACUGGAUCACCAAGACCAACAUCGAGGAAUACCUGCUGCCUGGCUGGAAGCUGACCUACGUGGGCUACAAUGGCAGCGAGACACGGGGCCACUACAACUUCAGCUUCAAGUGCCAGAACGCCGCCACCGACGACGACCUGAUCAUCGAGUACAUCUACAGCGAGGCCCUGGACUUCCAGAACUUCAUGCUGAAGAAAAUCAAAGAACGGAUGACCACCAGCCUGCCUAUCGCCAGACUGAGCAACCGGGUGUUCCGGGACAAGCUGUUUCCCAGCCUGCUGAAAGAACACAAGAACGUGGUCAACGUGGGCCCCAGAAACGAGAGCAUGUUCACCUUUCUGAACUACCCCACCAUCAAGCAGUUCAGCAACGGCGCCUACCUGGUCAAGGACACAAUCAAGCUGAAGCAAGAGAGAUGGCUGGGCAAGAGAAUCAGCCAGUUCGACAUCGGCCAGUACAAGAACAUGCUGAACGUGCUGACCGCCAUCUACUACUACUAUAACCUGUACAAGAGCAAGCCGAUCAUCUACAUGAUUGGCAGCGCCCCUAGCUACUGGAUCUACGACGUGCGGCACUACAGCGACUUUUUCUUCGAAACCUGGGAUCCCCUGGACACCCCUUACAGCAGCAUCCACCACAAAGAGCUGUUCUUCAUCAACGACGUGAAGAAGCUCAAGGACAACAGCAUCCUCUACAUCGACAUCAGAACCGACCGGGGCAACGCCGACUGGAAGAAAUGGCGGAAAACCGUGGAAGAACAGACCAUCAACAACCUGGAUAUCGCCUACGAGUACCUGCGGACCGGCAAGGCCAAAGUGUGCUGCGUGAAGAUGACAGCCAUGGACCUGGAACUGCCCAUCAGCGCCAAACUGCUGCACCAUCCUACCACCGAGAUCAGAAGCGAGUUCUAUCUGCUGCUGGACACCUGGGACCUGACCAAUAUCAGACGGUUCAUCCCCAAGGGCGUGCUGUACUCCUUUAUCAACAACAUCAUCACCGAGAACGUGUUCAUCCAGCAGCCGUUCAAAGUGAAAGUGCUGAACGACAGCUACAUCGUGGCCCUGUACGCCCUGAGCAACGACUUCAACAAUCGGAGCGAAGUGAUCAAACUGAUCAACAAUCAGAAGCAGUCCCUGAUCACCGUGCGCAUCAACAAUACCUUCAAGGACGAGCCCAAAGUGGGCUUCAAGAAUAUCUACGACUGGACCUUCCUGCCUACCGACUUCGACACCAAAGAGGCCAUCAUCACAAGCUACGACGGCUGCCUGGGCCUGUUUGGCCUGUCUAUUAGCCUGGCCAGCAAGCCCACCGGCAACAACCACCUGUUUAUCCUGAGCGGCACCGACAAGUACUACAAGCUGGAUCAGUUCGCCAACCACACCAGCAUCAGCAGAAGAAGCCACCAGAUCCGGUUCAGCGAGAGCGCCACAAGCUAUAGCGGCUACAUCUUCCGGGACCUGUCCAACAACAACUUCAACCUGAUCGGCACGAACAUCGAGAACAGCGUGUCCGGCCACGUGUACAACGCCCUGAUCUACUACCGGUACAACUACUCCUUCGACCUGAAGCGGUGGAUCUAUCUGCACAGCAUCGACAAGGUGGACAUCGAAGGCGGCAAGUACUAUGAGCUGGCCCCUAUCGAGCUGAUCUACGCCUGCAGAAGCGCCAAAGAGUUCGCCACACUGCAGGACGAUCUGACCGUGCUGAGAUACAGCAAUGAGAUCGAGAACUACAUCAACACCGUGUACUCCAUCACCUACGCCGACGAUCCCAACUACUUCAUCGGAAUCCAGUUCCGCAACAUCCCCUAUAAGUACGACGUCAAGAUCCCUCACCUGACCUUCGGCGUGCUGCACAUCAGCGACAACAUGGUGCCCGACGUGAUCGACAUCCUGAAGAUCAUGAAGAAUGAGCUGUUCAAGAUGGACAUCACCACCAGCUACACCUACAUGCUGAGCGACGGCAUCUACGUGGCCAAUGUGUCUGGCGUGCUGAGCACCUACUUCAAGAUCUACAACGUGUUCUACAAGAACCAGAUCACCUUCGGCCAGAGCCGGAUGUUCAUCCCUCACAUCACCCUGAGCUUUAACAACAUGCGGACCGUGCGGAUCGAAACCACCAAGCUGCAGAUCAAGAGCAUCUACCUCCGGAAGAUCAAGGGCGACACCGUGUUCGACAUGGUGGAA [서열번호 278]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 278에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 GB 바이러스 B NS3/4A(Q69422; 게놈 폴리단백질 간염 GB 바이러스 B), 또는 그의 동원체이다. GB 바이러스 B NS3/4A의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 279로 나타낸다:
APFTLQCLSERGTLSAMAVVMTGIDPRTWTGTIFRLGSLATSYMGFVCDNVLYTAHHGSKGRRLAHPTGSIHPITVDAANDQDIYQPPCGAGSLTRCSCGETKGYLVTRLGSLVEVNKSDDPYWCVCGALPMAVAKGSSGAPILCSSGHVIGMFTAARNSGGSVSQIRVRPLVCAGYHPQYTAHATLDTKPTVPNEYSVQILIAPTGSGKSTKLPLSYMQEKYEVLVLNPSVATTASMPKYMHATYGVNPNCYFNGKCTNTGASLTYSTYGMYLTGACSRNYDVIICDECHATDATTVLGIGKVLTEAPSKNVRLVVLATATPPGVIPTPHANITEIQLTDEGTIPFHGKKIKEENLKKGRHLIFEATKKHCDELANELARKGITAVSYYRGCDISKIPEGDCVVVATDALCTGYTGDFDSVYDCSLMVEGTCHVDLDPTFTMGVRVCGVSAIVKGQRRGRTGRGRAGIYYYVDGSCTPSGMVPECNIVEAFDAAKAWYGLSSTEAQTILDTYRTQPGLPAIGANLDEWADLFSMVNPEPSFVNTAKRTADNYVLLTAAQLQLCHQYGYAAPNDAPRWQGARLGKKPCGVLWRLDGADACPGPEPSEVTRYQMCFTEVNTSGTAALAVGVGVAMAYLAIDTFGATCVRRCWSITSVPTGATVAPVVDEEEIVEEC [서열번호 279]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 279에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 GB 바이러스 B NS3/4A 폴리펩티드는 다음과 같은 서열번호 280의 DNA 뉴클레오티드 서열에 의해 암호화된다:
GCACCTTTTACGCTGCAGTGTCTCTCTGAACGTGGCACGCTGTCAGCGATGGCAGTGGTCATGACTGGTATAGACCCCCGAACTTGGACTGGAACTATCTTCAGATTAGGATCTCTGGCCACTAGCTACATGGGATTTGTTTGTGACAACGTGTTGTATACTGCTCACCATGGCAGCAAGGGGCGCCGGTTGGCTCATCCCACAGGCTCCATACACCCAATAACCGTTGACGCGGCTAATGACCAGGACATCTATCAACCACCATGTGGAGCTGGGTCCCTTACTCGGTGCTCTTGCGGGGAGACCAAGGGGTATCTGGTAACACGACTGGGGTCATTGGTTGAGGTCAACAAATCCGATGACCCTTATTGGTGTGTGTGCGGGGCCCTTCCCATGGCTGTTGCCAAGGGTTCTTCAGGTGCCCCGATTCTGTGCTCCTCCGGGCATGTTATTGGGATGTTCACCGCTGCTAGAAATTCTGGCGGTTCAGTCAGCCAGATTAGGGTTAGGCCGTTGGTGTGTGCTGGATACCATCCCCAGTACACAGCACATGCCACTCTTGATACAAAACCTACTGTGCCTAACGAGTATTCAGTGCAAATTTTAATTGCCCCCACTGGCAGCGGCAAGTCAACCAAATTACCACTTTCTTACATGCAGGAGAAGTATGAGGTCTTGGTCCTAAATCCCAGTGTGGCTACAACAGCATCAATGCCAAAGTACATGCACGCGACGTACGGCGTGAATCCAAATTGCTATTTTAATGGCAAATGTACCAACACAGGGGCTTCACTTACGTACAGCACATATGGCATGTACCTGACCGGAGCATGTTCCCGGAACTATGACGTCATCATTTGTGACGAATGCCATGCTACCGATGCAACCACCGTGTTGGGCATTGGAAAGGTTCTAACCGAAGCTCCATCCAAAAATGTTAGGCTAGTGGTTCTTGCCACGGCTACCCCCCCTGGAGTAATCCCTACACCACATGCCAACATAACTGAGATTCAATTAACCGATGAAGGCACTATCCCCTTTCATGGAAAAAAGATTAAGGAGGAAAATCTGAAGAAAGGGAGACACCTTATCTTTGAGGCTACCAAAAAACACTGTGATGAGCTTGCTAACGAGTTAGCTCGAAAGGGAATAACAGCTGTCTCTTACTATAGGGGATGTGACATCTCAAAAATCCCTGAGGGCGACTGTGTAGTAGTTGCCACTGATGCCTTGTGTACAGGGTACACTGGTGACTTTGATTCCGTGTATGACTGCAGCCTCATGGTAGAAGGCACATGCCATGTTGACCTTGACCCTACTTTCACCATGGGTGTTCGTGTGTGCGGGGTCTCAGCAATAGTTAAAGGCCAGCGTAGGGGCCGCACAGGCCGTGGGAGAGCTGGCATATACTACTATGTAGACGGGAGTTGTACCCCTTCGGGTATGGTTCCTGAATGCAACATTGTTGAAGCCTTCGACGCAGCCAAGGCATGGTATGGTTTGTCATCAACAGAAGCTCAAACTATTCTGGACACCTATCGCACCCAACCTGGGTTACCTGCGATAGGAGCAAATTTGGACGAGTGGGCTGATCTCTTTTCTATGGTCAACCCCGAACCTTCATTTGTCAATACTGCAAAAAGAACTGCTGACAATTATGTTTTGTTGACTGCAGCCCAACTACAACTGTGTCATCAGTATGGCTATGCTGCTCCCAATGACGCACCACGGTGGCAGGGAGCCCGGCTTGGGAAAAAACCTTGTGGGGTTCTGTGGCGCTTGGACGGCGCTGACGCCTGTCCTGGCCCAGAGCCCAGCGAGGTGACCAGATACCAAATGTGCTTCACTGAAGTCAATACTTCTGGGACAGCCGCACTCGCTGTTGGCGTTGGAGTGGCTATGGCTTATCTAGCCATTGACACTTTTGGCGCCACTTGTGTGCGGCGTTGCTGGTCTATTACATCAGTCCCTACCGGTGCTACTGTCGCCCCAGTGGTTGACGAAGAAGAAATCGTGGAGGAGTGT [서열번호 280]
따라서, 바람직하게는 상기 GB 바이러스 B NS3/4A 폴리펩티드는 실질적으로 서열번호 280에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 GB 바이러스 B NS3/4A 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 281로 제공된다:
GCCCCTTTCACACTGCAATGCCTGAGCGAGAGAGGCACCCTGTCTGCCATGGCCGTGGTTATGACAGGCATCGACCCTAGAACCTGGACCGGCACCATCTTCAGACTGGGAAGCCTGGCCACAAGCTACATGGGCTTCGTGTGCGACAACGTGCTGTACACAGCCCACCACGGCAGCAAAGGCAGAAGGCTGGCTCACCCTACAGGCAGCATTCACCCCATCACAGTGGACGCCGCCAACGACCAGGATATCTACCAACCTCCTTGCGGCGCTGGCAGCCTGACCAGATGTTCTTGTGGCGAGACAAAGGGCTACCTGGTCACCAGGCTGGGATCCCTGGTGGAAGTGAACAAGAGCGACGACCCCTATTGGTGCGTGTGTGGCGCACTGCCTATGGCTGTGGCCAAAGGATCTTCTGGCGCCCCTATCCTGTGTAGCTCTGGCCACGTGATCGGCATGTTTACCGCCGCCAGAAATAGCGGCGGCAGCGTGTCACAGATTAGAGTGCGGCCTCTTGTGTGCGCCGGCTATCACCCTCAGTATACAGCCCACGCCACACTGGACACCAAGCCTACCGTGCCTAACGAGTACAGCGTGCAGATCCTGATCGCCCCAACAGGCAGCGGCAAGAGCACAAAACTGCCCCTGAGCTACATGCAAGAGAAGTACGAGGTGCTGGTGCTGAACCCTAGCGTGGCCACAACAGCCAGCATGCCCAAGTACATGCACGCCACCTATGGCGTGAACCCCAACTGCTACTTCAACGGCAAGTGCACCAATACCGGCGCCAGCCTGACATACAGCACCTACGGCATGTATCTGACCGGCGCCTGCAGCAGAAACTACGACGTGATCATCTGCGACGAGTGCCACGCCACCGATGCCACAACTGTGCTCGGAATCGGCAAGGTGCTGACAGAGGCCCCTAGCAAGAATGTGCGACTGGTGGTGCTGGCCACTGCTACACCACCTGGCGTTATCCCTACACCTCACGCCAACATCACCGAGATCCAGCTGACCGACGAGGGCACAATCCCATTCCACGGCAAGAAGATCAAAGAGGAAAACCTGAAGAAGGGCCGCCACCTGATCTTCGAGGCCACCAAGAAACACTGTGACGAGCTGGCCAACGAACTGGCCAGAAAGGGCATCACCGCCGTGTCCTACTACAGAGGCTGCGACATCAGCAAGATCCCCGAGGGCGATTGTGTGGTGGTGGCTACAGATGCCCTGTGTACCGGCTACACCGGCGACTTCGATAGCGTGTACGACTGCAGCCTGATGGTGGAAGGCACCTGTCATGTGGATCTGGACCCCACCTTTACCATGGGCGTCAGAGTGTGCGGAGTGTCCGCCATCGTGAAGGGCCAGAGAAGAGGCAGAACTGGCAGAGGCAGAGCCGGCATCTACTACTATGTGGACGGCAGCTGTACCCCTAGCGGCATGGTGCCTGAGTGCAACATCGTGGAAGCCTTCGATGCCGCCAAGGCTTGGTACGGCCTGTCTAGCACAGAGGCTCAGACCATCCTGGACACCTACAGAACCCAGCCAGGACTGCCTGCCATCGGCGCCAATCTTGATGAATGGGCCGACCTGTTCAGCATGGTCAACCCCGAGCCTAGCTTCGTGAACACCGCCAAGAGAACCGCCGACAACTACGTGCTGCTGACAGCCGCTCAGCTCCAGCTGTGTCACCAGTACGGATACGCCGCTCCTAACGACGCCCCTAGATGGCAAGGCGCTAGACTGGGCAAGAAACCATGTGGCGTTCTGTGGCGACTGGATGGCGCTGATGCTTGTCCTGGACCTGAGCCTAGCGAAGTGACCAGATACCAGATGTGCTTCACCGAAGTGAATACCAGCGGCACAGCTGCCCTGGCCGTTGGTGTTGGAGTGGCCATGGCTTACCTGGCCATCGATACCTTTGGCGCCACATGCGTGCGGAGATGCTGGTCTATCACCAGCGTTCCAACAGGCGCTACAGTGGCCCCTGTGGTGGATGAGGAAGAGATTGTGGAAGAGTGC [서열번호 281]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 281에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 281의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 282로 제공된다:
GCCCCUUUCACACUGCAAUGCCUGAGCGAGAGAGGCACCCUGUCUGCCAUGGCCGUGGUUAUGACAGGCAUCGACCCUAGAACCUGGACCGGCACCAUCUUCAGACUGGGAAGCCUGGCCACAAGCUACAUGGGCUUCGUGUGCGACAACGUGCUGUACACAGCCCACCACGGCAGCAAAGGCAGAAGGCUGGCUCACCCUACAGGCAGCAUUCACCCCAUCACAGUGGACGCCGCCAACGACCAGGAUAUCUACCAACCUCCUUGCGGCGCUGGCAGCCUGACCAGAUGUUCUUGUGGCGAGACAAAGGGCUACCUGGUCACCAGGCUGGGAUCCCUGGUGGAAGUGAACAAGAGCGACGACCCCUAUUGGUGCGUGUGUGGCGCACUGCCUAUGGCUGUGGCCAAAGGAUCUUCUGGCGCCCCUAUCCUGUGUAGCUCUGGCCACGUGAUCGGCAUGUUUACCGCCGCCAGAAAUAGCGGCGGCAGCGUGUCACAGAUUAGAGUGCGGCCUCUUGUGUGCGCCGGCUAUCACCCUCAGUAUACAGCCCACGCCACACUGGACACCAAGCCUACCGUGCCUAACGAGUACAGCGUGCAGAUCCUGAUCGCCCCAACAGGCAGCGGCAAGAGCACAAAACUGCCCCUGAGCUACAUGCAAGAGAAGUACGAGGUGCUGGUGCUGAACCCUAGCGUGGCCACAACAGCCAGCAUGCCCAAGUACAUGCACGCCACCUAUGGCGUGAACCCCAACUGCUACUUCAACGGCAAGUGCACCAAUACCGGCGCCAGCCUGACAUACAGCACCUACGGCAUGUAUCUGACCGGCGCCUGCAGCAGAAACUACGACGUGAUCAUCUGCGACGAGUGCCACGCCACCGAUGCCACAACUGUGCUCGGAAUCGGCAAGGUGCUGACAGAGGCCCCUAGCAAGAAUGUGCGACUGGUGGUGCUGGCCACUGCUACACCACCUGGCGUUAUCCCUACACCUCACGCCAACAUCACCGAGAUCCAGCUGACCGACGAGGGCACAAUCCCAUUCCACGGCAAGAAGAUCAAAGAGGAAAACCUGAAGAAGGGCCGCCACCUGAUCUUCGAGGCCACCAAGAAACACUGUGACGAGCUGGCCAACGAACUGGCCAGAAAGGGCAUCACCGCCGUGUCCUACUACAGAGGCUGCGACAUCAGCAAGAUCCCCGAGGGCGAUUGUGUGGUGGUGGCUACAGAUGCCCUGUGUACCGGCUACACCGGCGACUUCGAUAGCGUGUACGACUGCAGCCUGAUGGUGGAAGGCACCUGUCAUGUGGAUCUGGACCCCACCUUUACCAUGGGCGUCAGAGUGUGCGGAGUGUCCGCCAUCGUGAAGGGCCAGAGAAGAGGCAGAACUGGCAGAGGCAGAGCCGGCAUCUACUACUAUGUGGACGGCAGCUGUACCCCUAGCGGCAUGGUGCCUGAGUGCAACAUCGUGGAAGCCUUCGAUGCCGCCAAGGCUUGGUACGGCCUGUCUAGCACAGAGGCUCAGACCAUCCUGGACACCUACAGAACCCAGCCAGGACUGCCUGCCAUCGGCGCCAAUCUUGAUGAAUGGGCCGACCUGUUCAGCAUGGUCAACCCCGAGCCUAGCUUCGUGAACACCGCCAAGAGAACCGCCGACAACUACGUGCUGCUGACAGCCGCUCAGCUCCAGCUGUGUCACCAGUACGGAUACGCCGCUCCUAACGACGCCCCUAGAUGGCAAGGCGCUAGACUGGGCAAGAAACCAUGUGGCGUUCUGUGGCGACUGGAUGGCGCUGAUGCUUGUCCUGGACCUGAGCCUAGCGAAGUGACCAGAUACCAGAUGUGCUUCACCGAAGUGAAUACCAGCGGCACAGCUGCCCUGGCCGUUGGUGUUGGAGUGGCCAUGGCUUACCUGGCCAUCGAUACCUUUGGCGCCACAUGCGUGCGGAGAUGCUGGUCUAUCACCAGCGUUCCAACAGGCGCUACAGUGGCCCCUGUGGUGGAUGAGGAAGAGAUUGUGGAAGAGUGC [서열번호 282]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 282에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 HAV 3Cpro(P08617; 게놈 폴리단백질 인간 A형 간염 바이러스 유전자형 IB(HM175 단리물)), 또는 그의 동원체이다. HAV 3Cpro의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 283으로 나타낸다:
STLEIAGLVRKNLVQFGVGEKNGCVRWVMNALGVKDDWLLVPSHAYKFEKDYEMMEFYFNRGGTYYSISAGNVVIQSLDVGFQDVVLMKVPTIPKFRDITQHFIKKGDVPRALNRLATLVTTVNGTPMLISEGPLKMEEKATYVHKKNDGTTVDLTVDQAWRGKGEGLPGMCGGALVSSNQSIQNAILGIHVAGGNSILVAKLVTQEMFQNIDKKIESQ [서열번호 283]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 283에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 HAV 3Cpro 폴리펩티드는 다음과 같은 서열번호 284의 DNA 뉴클레오티드 서열에 의해 암호화된다:
TCAACTTTGGAAATAGCAGGACTGGTTAGGAAGAACTTGGTTCAGTTTGGAGTTGGAGAGAAGAATGGATGTGTGAGATGGGTTATGAATGCCTTGGGAGTGAAAGATGATTGGCTGCTTGTGCCTTCCCATGCTTATAAATTTGAGAAAGATTATGAAATGATGGAGTTTTATTTTAATAGAGGTGGAACTTACTATTCAATTTCAGCTGGTAATGTTGTTATTCAATCTTTGGATGTGGGATTCCAGGATGTTGTTCTGATGAAGGTTCCTACAATTCCTAAGTTTAGAGATATTACTCAGCATTTTATTAAGAAAGGGGATGTGCCTAGAGCTTTGAATCGCCTGGCAACATTAGTGACAACTGTAAATGGAACCCCTATGTTAATTTCTGAGGGCCCACTAAAGATGGAAGAGAAAGCTACTTATGTTCATAAGAAAAATGATGGTACAACAGTTGATTTAACTGTGGATCAGGCATGGAGAGGAAAAGGCGAAGGTCTTCCTGGAATGTGTGGTGGGGCCTTGGTTTCATCGAATCAATCTATACAGAATGCAATCTTGGGCATCCATGTTGCTGGAGGAAATTCAATTCTTGTTGCAAAATTGGTTACTCAAGAAATGTTCCAAAATATTGATAAGAAAATTGAAAGTCAG [서열번호 284]
따라서, 바람직하게는 상기 HAV 3Cpro 폴리펩티드는 실질적으로 서열번호 284에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 HAV 3Cpro 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 285로 제공된다:
AGCACACTGGAAATCGCCGGACTCGTGCGGAAGAACCTGGTGCAGTTTGGCGTGGGCGAGAAGAACGGCTGTGTCAGATGGGTCATGAACGCCCTGGGCGTGAAGGACGATTGGCTGCTGGTTCCTAGCCACGCCTACAAGTTCGAGAAGGACTACGAGATGATGGAATTCTACTTCAACAGAGGCGGCACCTACTACAGCATCAGCGCCGGCAATGTGGTCATCCAGTCTCTGGATGTGGGCTTCCAGGACGTGGTGCTGATGAAGGTGCCAACAATCCCCAAGTTCCGGGACATCACCCAGCACTTCATCAAGAAAGGCGACGTGCCCAGGGCTCTGAACAGACTGGCTACCCTGGTCACCACCGTGAACGGCACACCCATGCTGATCTCTGAGGGCCCACTGAAGATGGAAGAGAAGGCCACCTACGTGCACAAGAAGAACGACGGCACCACAGTGGACCTGACCGTGGATCAAGCTTGGAGAGGCAAAGGCGAGGGCCTGCCTGGAATGTGTGGCGGAGCACTGGTGTCCAGCAACCAGAGCATCCAGAATGCCATCCTGGGCATCCATGTGGCTGGCGGCAATTCTATCCTGGTGGCCAAGCTGGTCACCCAAGAGATGTTCCAGAACATCGACAAGAAGATCGAGAGCCAG [서열번호 285]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 285에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 285의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 286으로 제공된다:
AGCACACUGGAAAUCGCCGGACUCGUGCGGAAGAACCUGGUGCAGUUUGGCGUGGGCGAGAAGAACGGCUGUGUCAGAUGGGUCAUGAACGCCCUGGGCGUGAAGGACGAUUGGCUGCUGGUUCCUAGCCACGCCUACAAGUUCGAGAAGGACUACGAGAUGAUGGAAUUCUACUUCAACAGAGGCGGCACCUACUACAGCAUCAGCGCCGGCAAUGUGGUCAUCCAGUCUCUGGAUGUGGGCUUCCAGGACGUGGUGCUGAUGAAGGUGCCAACAAUCCCCAAGUUCCGGGACAUCACCCAGCACUUCAUCAAGAAAGGCGACGUGCCCAGGGCUCUGAACAGACUGGCUACCCUGGUCACCACCGUGAACGGCACACCCAUGCUGAUCUCUGAGGGCCCACUGAAGAUGGAAGAGAAGGCCACCUACGUGCACAAGAAGAACGACGGCACCACAGUGGACCUGACCGUGGAUCAAGCUUGGAGAGGCAAAGGCGAGGGCCUGCCUGGAAUGUGUGGCGGAGCACUGGUGUCCAGCAACCAGAGCAUCCAGAAUGCCAUCCUGGGCAUCCAUGUGGCUGGCGGCAAUUCUAUCCUGGUGGCCAAGCUGGUCACCCAAGAGAUGUUCCAGAACAUCGACAAGAAGAUCGAGAGCCAG [서열번호 286]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 286에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 인간 메타뉴모바이러스 M2-2(Q6WB96; 단백질 M2-2 인간 메타뉴모바이러스(CAN97-83 바이러스주)), 또는 그의 동원체이다. 인간 메타뉴모바이러스 M2-2의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 287로 나타낸다:
MTLHMPCKTVKALIKCSEHGPVFITIEVDEMIWTQKELKEALSDGIVKSHTNIYNCYLENIEIIYVKAYLS [서열번호 287]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 287에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 인간 메타뉴모바이러스 M2-2 폴리펩티드는 다음과 같은 서열번호 288의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGACTCTTCATATGCCCTGCAAGACAGTGAAAGCATTAATCAAGTGCAGTGAGCATGGTCCTGTTTTCATTACTATAGAGGTTGATGAAATGATATGGACTCAAAAAGAATTAAAAGAAGCTTTGTCCGATGGGATAGTGAAGTCTCACACCAACATTTACAATTGTTATTTAGAAAACATAGAAATTATATATGTCAAGGCTTACTTAAGT [서열번호 288]
따라서, 바람직하게는 상기 인간 메타뉴모바이러스 M2-2 폴리펩티드는 실질적으로 서열번호 288에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 인간 메타뉴모바이러스 M2-2 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 289로 제공된다:
ATGACCCTGCACATGCCCTGCAAGACAGTGAAGGCCCTGATCAAGTGTAGCGAGCACGGCCCCGTGTTCATCACCATTGAGGTGGACGAGATGATCTGGACCCAGAAAGAGCTGAAAGAGGCCCTGAGCGACGGCATCGTGAAGTCCCACACCAACATCTACAACTGCTACCTCGAGAACATCGAGATCATCTACGTGAAGGCCTACCTGAGC [서열번호 289]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 289에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 289의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 290으로 제공된다:
AUGACCCUGCACAUGCCCUGCAAGACAGUGAAGGCCCUGAUCAAGUGUAGCGAGCACGGCCCCGUGUUCAUCACCAUUGAGGUGGACGAGAUGAUCUGGACCCAGAAAGAGCUGAAAGAGGCCCUGAGCGACGGCAUCGUGAAGUCCCACACCAACAUCUACAACUGCUACCUCGAGAACAUCGAGAUCAUCUACGUGAAGGCCUACCUGAGC [서열번호 290]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 290에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 E형 간염 메틸트랜스퍼라아제(Q9WC28; 비-구조 폴리단백질 pORF1 메틸트랜스퍼라아제 E형 간염 바이러스 유전자형 1), 또는 그의 동원체이다. E형 간염 메틸트랜스퍼라아제의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 291로 나타낸다:
EVFWNQPIQRVIHNELELYCRARSGRCLEIGAHPRSINDNPNVVHRCFLRPVGRDVQRWYTAPTRGPAANCRRSALRGLPAADRTYCFDGFSGCSCPAETGIALYSLHDMSPSDVAEAMFRHGMTRLYAALHLPPEVLLPPGTYRTASYLLIHDGRRVVVTYEGDTSAGYNHDVSNLRSWI [서열번호 291]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 291에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 E형 간염 메틸트랜스퍼라아제 폴리펩티드는 다음과 같은 서열번호 292의 DNA 뉴클레오티드 서열에 의해 암호화된다:
GAGGTTTTCTGGAATCAACCCATCCAGCGTGTCATTCATAACGAGCTGGAGCTTTACTGCCGCGCTCGCTCCGGCCGCTGTCTTGAAATTGGCGCCCATCCCCGCTCAATAAATGATAATCCTAATGTGGTCCACCGCTGCTTCCTCCGCCCTGTTGGGCGTGATGTTCAGCGCTGGTATACTGCTCCCACTCGCGGGCCGGCTGCTAATTGCCGCCGTTCCGCGTTGCGTGGGCTTCCCGCTGCTGACCGCACATACTGCTTCGACGGGTTTTCTGGCTGTAGCTGCCCCGCCGAGACGGGTATCGCCCTTTACTCCCTCCATGATATGTCACCATCTGATGTTGCCGAGGCCATGTTCCGCCATGGTATGACGCGGCTTTATGCTGCCCTCCATCTTCCGCCTGAGGTCTTGCTGCCCCCTGGCACATATCGCACCGCATCGTATTTGCTGATTCATGACGGCAGGCGCGTTGTGGTGACGTATGAGGGTGATACTAGTGCTGGTTACAACCACGATGTCTCCAACTTGCGCTCCTGGATT [서열번호 292]
따라서, 바람직하게는 상기 E형 간염 메틸트랜스퍼라아제 폴리펩티드는 실질적으로 서열번호 292에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 E형 간염 메틸트랜스퍼라아제 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 293으로 제공된다:
GAGGTGTTCTGGAACCAGCCTATCCAGAGAGTGATCCACAACGAGCTGGAACTGTACTGCAGAGCCAGATCCGGCCGGTGTCTGGAAATTGGAGCCCATCCTCGGAGCATCAACGACAACCCCAACGTGGTGCACAGATGCTTTCTGAGGCCCGTGGGCAGAGATGTGCAGCGGTGGTATACAGCCCCTACAAGAGGACCTGCCGCCAACTGTAGAAGAAGCGCCCTGAGAGGACTGCCTGCCGCCGATAGAACCTACTGCTTCGATGGCTTCAGCGGCTGCAGCTGTCCTGCCGAAACTGGAATCGCCCTGTACAGCCTGCACGACATGAGCCCATCTGATGTGGCCGAGGCCATGTTCAGACACGGCATGACCAGACTGTACGCCGCTCTGCATCTGCCTCCAGAAGTTCTGCTGCCTCCTGGCACCTACAGAACCGCCAGCTATCTGCTGATCCACGATGGGAGAAGAGTGGTGGTCACCTACGAGGGCGATACAAGCGCCGGCTACAACCACGACGTGTCCAACCTGAGAAGCTGGATC [서열번호 293]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 293에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 293의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 294로 제공된다:
GAGGUGUUCUGGAACCAGCCUAUCCAGAGAGUGAUCCACAACGAGCUGGAACUGUACUGCAGAGCCAGAUCCGGCCGGUGUCUGGAAAUUGGAGCCCAUCCUCGGAGCAUCAACGACAACCCCAACGUGGUGCACAGAUGCUUUCUGAGGCCCGUGGGCAGAGAUGUGCAGCGGUGGUAUACAGCCCCUACAAGAGGACCUGCCGCCAACUGUAGAAGAAGCGCCCUGAGAGGACUGCCUGCCGCCGAUAGAACCUACUGCUUCGAUGGCUUCAGCGGCUGCAGCUGUCCUGCCGAAACUGGAAUCGCCCUGUACAGCCUGCACGACAUGAGCCCAUCUGAUGUGGCCGAGGCCAUGUUCAGACACGGCAUGACCAGACUGUACGCCGCUCUGCAUCUGCCUCCAGAAGUUCUGCUGCCUCCUGGCACCUACAGAACCGCCAGCUAUCUGCUGAUCCACGAUGGGAGAAGAGUGGUGGUCACCUACGAGGGCGAUACAAGCGCCGGCUACAACCACGACGUGUCCAACCUGAGAAGCUGGAUC [서열번호 294]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 294에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 PRRV Npro(P24381; 세린/트레오닌-단백질 키나아제(kinase) US3 동족체(homolog) 수이드(Suid) 헤르페스바이러스 2(NIA-3 바이러스주) 가성광견병(Pseudorabies) 바이러스), 또는 그의 동원체이다. PRRV Npro의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 295로 나타낸다:
MLAMWRWVTKRSRLRRGHAHLGGNKGVRGICSLYLAGLSRGLSRVHAQRSHAATMADAGIPDEILYSDISDDEIIIDGDGDGDSSGDEDDDDGGLTRQAASRIATDLGFEVLQPLQSGSEGRVFVARRPGEADTVVLKVGQKPSTLMEGMLLKRLAHDNVMSLKQMLARGPVTCLVLPHFRCDLYSYLTMRDGPLDMRDAGRVIRSVLRGLAYLHGMRIMHRDVKAENIFLEDVDTVCLGDLGAARCNVAAPNFYGLAGTIETNAPEVLARDRYDTKVDVWGAGVVLFETLAYPKTIAGGDEPAINGEMHLIDLIRALGVHPEEFPPDTRLRSEFVRYAGTHRQPYTQYARVARLGLPETGAFLIYKMLTFDPVRRPSADEILNFGMWTV [서열번호 295]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 295에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 PRRV Npro 폴리펩티드는 다음과 같은 서열번호 296의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGCTGGCGATGTGGAGATGGGTCACCAAGAGGTCGCGGCTCCGCCGAGGCCACGCCCATCTTGGGGGAAATAAAGGAGTCCGGGGAATTTGTTCCTTATACCTTGCCGGGCTCAGCAGGGGGTTGTCGCGCGTCCACGCCCAGCGCTCGCACGCAGCAACAATGGCCGACGCCGGAATCCCCGACGAGATCCTGTACTCGGACATCAGCGACGACGAGATCATCATCGACGGCGACGGCGACGGCGACAGCAGCGGGGACGAGGACGACGATGACGGGGGGCTGACGCGGCAGGCCGCGTCGCGCATCGCCACGGACCTGGGCTTCGAGGTGCTGCAGCCCCTGCAGTCGGGCTCGGAGGGCCGCGTCTTCGTGGCCCGCCGGCCCGGCGAGGCGGACACGGTGGTGCTGAAGGTGGGCCAGAAGCCCTCGACGCTGATGGAGGGCATGCTGCTGAAGCGCCTGGCCCACGATAACGTCATGAGCCTGAAGCAGATGCTCGCCCGGGGCCCGGTGACGTGCCTGGTCCTGCCGCACTTTCGGTGCGATCTGTACAGCTACCTGACCATGCGGGACGGGCCGCTGGACATGCGCGACGCCGGGCGCGTGATCCGGTCCGTGCTCCGCGGGCTCGCCTACCTGCACGGGATGCGCATCATGCACCGCGACGTCAAGGCGGAGAACATCTTCCTCGAGGACGTGGACACGGTGTGCCTGGGGGACCTCGGGGCCGCGCGCTGCAACGTGGCGGCGCCCAACTTTTACGGGCTCGCCGGGACCATCGAGACCAACGCCCCCGAGGTGCTCGCGCGCGACCGCTACGACACCAAGGTCGACGTCTGGGGCGCGGGGGTGGTGCTCTTCGAGACGCTGGCCTACCCCAAGACGATCGCCGGCGGGGACGAGCCCGCGATCAACGGGGAGATGCACCTGATCGACCTCATCCGCGCCCTCGGGGTGCACCCCGAGGAGTTCCCGCCCGACACGCGCCTCCGGAGCGAGTTCGTCCGGTACGCCGGGACCCACCGCCAGCCGTACACGCAGTACGCGCGCGTGGCTCGCCTCGGGCTGCCCGAGACGGGGGCTTTCCTGATTTACAAGATGTTGACGTTTGATCCCGTCCGCCGCCCTTCCGCTGATGAGATACTCAACTTTGGAATGTGGACCGTA [서열번호 296]
따라서, 바람직하게는 상기 PRRV Npro 폴리펩티드는 실질적으로 서열번호 296에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 PRRV Npro 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 297로 제공된다:
ATGCTGGCCATGTGGCGCTGGGTCACCAAGAGAAGCAGACTGAGAAGAGGACACGCCCACCTCGGCGGAAACAAGGGCGTTAGAGGCATCTGCAGCCTGTATCTGGCCGGCCTGTCTAGAGGACTGAGCAGAGTGCATGCCCAGAGATCTCACGCCGCCACAATGGCCGATGCTGGCATCCCTGATGAGATCCTGTACAGCGACATCAGCGACGACGAGATCATCATCGATGGCGACGGCGACGGGGATAGCAGCGGAGATGAGGATGACGATGATGGCGGCCTGACAAGACAGGCTGCCAGCAGAATTGCCACCGACCTGGGATTTGAGGTGCTGCAGCCTCTGCAGTCTGGCTCTGAGGGCAGAGTGTTCGTGGCTAGAAGGCCTGGCGAAGCCGATACCGTGGTGCTGAAAGTGGGCCAGAAACCTAGCACACTGATGGAAGGCATGCTGCTGAAGAGACTGGCCCACGACAACGTGATGAGCCTGAAGCAGATGCTGGCTAGAGGCCCTGTGACCTGTCTGGTGCTGCCTCACTTCAGATGCGACCTGTACTCCTACCTGACCATGAGAGATGGCCCTCTGGATATGCGCGACGCCGGCAGAGTGATCAGATCTGTGCTGAGAGGCCTGGCCTACCTGCACGGCATGAGAATCATGCACAGGGACGTGAAGGCCGAGAACATCTTTCTGGAAGATGTGGACACCGTGTGCCTGGGCGATCTGGGAGCCGCTAGATGTAATGTGGCCGCTCCTAACTTCTACGGCCTGGCCGGAACCATCGAGACAAATGCCCCTGAAGTGCTGGCCCGGGACAGATACGATACCAAGGTGGACGTTTGGGGAGCCGGCGTGGTCCTGTTTGAGACACTGGCTTACCCCAAGACAATCGCTGGCGGCGACGAGCCTGCTATCAATGGCGAGATGCACCTGATCGACCTGATCAGAGCCCTGGGCGTGCACCCTGAGGAATTCCCTCCAGACACACGGCTGCGGAGCGAGTTCGTTAGATACGCCGGAACACACAGACAGCCCTACACACAGTATGCCAGAGTGGCCAGACTGGGCCTGCCTGAAACAGGCGCCTTCCTGATCTACAAGATGCTGACCTTCGATCCCGTGCGGAGGCCTTCTGCCGATGAGATTCTGAACTTCGGCATGTGGACCGTG [서열번호 297]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 297에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 297의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 298로 제공된다:
AUGCUGGCCAUGUGGCGCUGGGUCACCAAGAGAAGCAGACUGAGAAGAGGACACGCCCACCUCGGCGGAAACAAGGGCGUUAGAGGCAUCUGCAGCCUGUAUCUGGCCGGCCUGUCUAGAGGACUGAGCAGAGUGCAUGCCCAGAGAUCUCACGCCGCCACAAUGGCCGAUGCUGGCAUCCCUGAUGAGAUCCUGUACAGCGACAUCAGCGACGACGAGAUCAUCAUCGAUGGCGACGGCGACGGGGAUAGCAGCGGAGAUGAGGAUGACGAUGAUGGCGGCCUGACAAGACAGGCUGCCAGCAGAAUUGCCACCGACCUGGGAUUUGAGGUGCUGCAGCCUCUGCAGUCUGGCUCUGAGGGCAGAGUGUUCGUGGCUAGAAGGCCUGGCGAAGCCGAUACCGUGGUGCUGAAAGUGGGCCAGAAACCUAGCACACUGAUGGAAGGCAUGCUGCUGAAGAGACUGGCCCACGACAACGUGAUGAGCCUGAAGCAGAUGCUGGCUAGAGGCCCUGUGACCUGUCUGGUGCUGCCUCACUUCAGAUGCGACCUGUACUCCUACCUGACCAUGAGAGAUGGCCCUCUGGAUAUGCGCGACGCCGGCAGAGUGAUCAGAUCUGUGCUGAGAGGCCUGGCCUACCUGCACGGCAUGAGAAUCAUGCACAGGGACGUGAAGGCCGAGAACAUCUUUCUGGAAGAUGUGGACACCGUGUGCCUGGGCGAUCUGGGAGCCGCUAGAUGUAAUGUGGCCGCUCCUAACUUCUACGGCCUGGCCGGAACCAUCGAGACAAAUGCCCCUGAAGUGCUGGCCCGGGACAGAUACGAUACCAAGGUGGACGUUUGGGGAGCCGGCGUGGUCCUGUUUGAGACACUGGCUUACCCCAAGACAAUCGCUGGCGGCGACGAGCCUGCUAUCAAUGGCGAGAUGCACCUGAUCGACCUGAUCAGAGCCCUGGGCGUGCACCCUGAGGAAUUCCCUCCAGACACACGGCUGCGGAGCGAGUUCGUUAGAUACGCCGGAACACACAGACAGCCCUACACACAGUAUGCCAGAGUGGCCAGACUGGGCCUGCCUGAAACAGGCGCCUUCCUGAUCUACAAGAUGCUGACCUUCGAUCCCGUGCGGAGGCCUUCUGCCGAUGAGAUUCUGAACUUCGGCAUGUGGACCGUG [서열번호 298]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 298에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 HSV1 US3(P04413; 세린/트레오닌-단백질 키나아제 US3 인간 헤르페스바이러스 1(17 바이러스주)), 또는 그의 동원체이다. HSV1 US3의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 299로 나타낸다:
MACRKFCRVYGGQGRRKEEAVPPETKPSRVFPHGPFYTPAEDACLDSPPPETPKPSHTTPPSEAERLCHLQEILAQMYGNQDYPIEDDPSADAADDVDEDAPDDVAYPEEYAEELFLPGDATGPLIGANDHIPPPCGASPPGIRRRSRDEIGATGFTAEELDAMDREAARAISRGGKPPSTMAKLVTGMGFTIHGALTPGSEGCVFDSSHPDYPQRVIVKAGWYTSTSHEARLLRRLDHPAILPLLDLHVVSGVTCLVLPKYQADLYTYLSRRLNPLGRPQIAAVSRQLLSAVDYIHRQGIIHRDIKTENIFINTPEDICLGDFGAACFVQGSRSSPFPYGIAGTIDTNAPEVLAGDPYTTTVDIWSAGLVIFETAVHNASLFSAPRGPKRGPCDSQITRIIRQAQVHVDEFSPHPESRLTSRYRSRAAGNNRPPYTRPAWTRYYKMDIDVEYLVCKALTFDGALRPSAAELLCLPLFQQK [서열번호 299]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 299에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 HSV1 US3 폴리펩티드는 다음과 같은 서열번호 300의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGCCTGTCGTAAGTTTTGTCGCGTTTACGGGGGACAGGGCAGGAGGAAGGAGGAGGCCGTCCCGCCGGAGACAAAGCCGTCCCGGGTGTTTCCTCATGGCCCCTTTTATACCCCAGCCGAGGACGCGTGCCTGGACTCCCCGCCCCCGGAGACCCCCAAACCTTCCCACACCACACCACCCAGCGAGGCCGAGCGCCTGTGTCATCTGCAGGAGATCCTTGCCCAGATGTACGGAAACCAGGACTACCCCATAGAGGACGACCCCAGCGCGGATGCCGCGGACGATGTCGACGAGGACGCCCCGGACGACGTGGCCTATCCGGAGGAATACGCAGAGGAGCTTTTTCTGCCCGGGGACGCGACCGGTCCCCTTATCGGGGCCAACGACCACATCCCTCCCCCGTGTGGCGCATCTCCCCCCGGTATACGACGACGCAGCCGGGATGAGATTGGGGCCACGGGATTTACCGCGGAAGAGCTGGACGCCATGGACAGGGAGGCGGCTCGAGCCATCAGCCGCGGCGGCAAGCCCCCCTCGACCATGGCCAAGCTGGTGACTGGCATGGGCTTTACGATCCACGGAGCGCTCACCCCAGGATCGGAGGGGTGTGTCTTTGACAGCAGCCATCCAGATTACCCCCAACGGGTAATCGTGAAGGCGGGGTGGTACACGAGCACGAGCCACGAGGCGCGACTGCTGAGGCGACTGGACCACCCGGCGATCCTGCCCCTCCTGGACCTGCATGTCGTCTCCGGGGTCACGTGTCTGGTCCTCCCCAAGTACCAGGCCGACCTGTATACCTATCTGAGTAGGCGCCTGAACCCACTGGGACGCCCGCAGATCGCAGCGGTCTCCCGGCAGCTCCTAAGCGCCGTTGACTACATTCACCGCCAGGGCATTATCCACCGCGACATTAAGACCGAAAATATTTTTATTAACACCCCCGAGGACATTTGCCTGGGGGACTTTGGCGCCGCGTGCTTCGTGCAGGGTTCCCGATCAAGCCCCTTCCCCTACGGAATCGCCGGAACCATCGACACCAACGCCCCCGAGGTCCTGGCCGGGGATCCGTATACCACGACCGTCGACATTTGGAGCGCCGGTCTGGTGATCTTCGAGACTGCCGTCCACAACGCGTCCTTGTTCTCGGCCCCCCGCGGCCCCAAAAGGGGCCCGTGCGACAGTCAGATCACCCGCATCATCCGACAGGCCCAGGTCCACGTTGACGAGTTTTCCCCGCATCCAGAATCGCGCCTCACCTCGCGCTACCGCTCCCGCGCGGCCGGGAACAATCGCCCGCCGTACACCCGACCGGCCTGGACCCGCTACTACAAGATGGACATAGACGTCGAATATCTGGTTTGCAAAGCCCTCACCTTCGACGGCGCGCTTCGCCCCAGCGCCGCAGAGCTGCTTTGTTTGCCGCTGTTTCAACAGAAA [서열번호 300]
따라서, 바람직하게는 상기 HSV1 US3 폴리펩티드는 실질적으로 서열번호 300에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 HSV1 US3 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 301로 제공된다:
ATGGCCTGCCGGAAGTTCTGTAGAGTGTACGGCGGACAGGGGCGCAGAAAAGAGGAAGCCGTTCCTCCTGAGACAAAGCCCAGCAGAGTGTTCCCTCACGGCCCCTTTTACACCCCTGCCGAAGATGCCTGTCTGGACAGCCCTCCTCCAGAAACACCTAAGCCTAGCCACACCACACCTCCAAGCGAGGCCGAAAGACTGTGCCATCTGCAAGAGATTCTGGCCCAGATGTACGGCAACCAGGACTACCCCATCGAGGACGATCCATCTGCCGATGCCGCCGACGATGTGGATGAAGATGCCCCTGATGACGTGGCCTATCCTGAGGAATACGCCGAGGAACTGTTCCTGCCTGGCGACGCTACAGGACCTCTGATCGGAGCCAACGATCACATCCCTCCACCTTGTGGCGCTAGCCCTCCTGGCATCAGAAGAAGAAGCAGGGACGAGATCGGCGCCACCGGCTTTACAGCCGAAGAACTGGACGCCATGGACAGAGAAGCCGCCAGAGCCATTTCTAGAGGCGGCAAGCCTCCTAGCACCATGGCCAAACTGGTTACCGGCATGGGCTTCACCATTCACGGCGCTCTGACACCTGGCTCTGAGGGCTGTGTGTTCGACAGCTCTCACCCCGACTATCCCCAGCGCGTGATCGTGAAAGCCGGCTGGTACACAAGCACAAGCCACGAGGCCAGACTGCTGCGGAGACTGGATCATCCTGCCATCCTGCCTCTGCTGGATCTGCATGTGGTGTCCGGCGTGACATGTCTGGTGCTGCCTAAGTACCAGGCCGACCTGTACACCTACCTGAGCAGAAGGCTGAACCCTCTGGGCAGACCTCAGATTGCCGCTGTGTCAAGACAGCTGCTGAGCGCTGTGGACTACATCCACAGACAGGGCATCATCCACCGGGACATCAAGACCGAGAATATCTTCATCAACACGCCCGAGGACATCTGCCTGGGCGATTTTGGCGCCGCTTGCTTCGTGCAAGGCAGCAGAAGCAGCCCCTTTCCTTATGGAATCGCCGGCACCATCGACACAAACGCCCCTGAAGTTCTGGCCGGCGATCCTTACACCACCACCGTGGATATTTGGAGCGCCGGACTGGTCATCTTCGAGACAGCCGTGCATAACGCCAGCCTGTTCTCTGCCCCTAGAGGCCCTAAAAGAGGCCCCTGCGATAGCCAGATCACCCGGATCATTAGACAGGCCCAGGTGCACGTGGACGAGTTCTCTCCACATCCTGAGAGCCGGCTGACCAGCCGGTACAGATCTAGAGCCGCCGGAAACAACCGGCCTCCATACACAAGACCTGCCTGGACACGGTACTACAAGATGGACATCGACGTGGAATACCTCGTGTGCAAGGCCCTGACCTTCGATGGCGCCCTTAGACCTTCTGCCGCCGAACTGCTTTGCCTGCCACTGTTCCAGCAGAAG [서열번호 301]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 301에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 301의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 302로 제공된다:
AUGGCCUGCCGGAAGUUCUGUAGAGUGUACGGCGGACAGGGGCGCAGAAAAGAGGAAGCCGUUCCUCCUGAGACAAAGCCCAGCAGAGUGUUCCCUCACGGCCCCUUUUACACCCCUGCCGAAGAUGCCUGUCUGGACAGCCCUCCUCCAGAAACACCUAAGCCUAGCCACACCACACCUCCAAGCGAGGCCGAAAGACUGUGCCAUCUGCAAGAGAUUCUGGCCCAGAUGUACGGCAACCAGGACUACCCCAUCGAGGACGAUCCAUCUGCCGAUGCCGCCGACGAUGUGGAUGAAGAUGCCCCUGAUGACGUGGCCUAUCCUGAGGAAUACGCCGAGGAACUGUUCCUGCCUGGCGACGCUACAGGACCUCUGAUCGGAGCCAACGAUCACAUCCCUCCACCUUGUGGCGCUAGCCCUCCUGGCAUCAGAAGAAGAAGCAGGGACGAGAUCGGCGCCACCGGCUUUACAGCCGAAGAACUGGACGCCAUGGACAGAGAAGCCGCCAGAGCCAUUUCUAGAGGCGGCAAGCCUCCUAGCACCAUGGCCAAACUGGUUACCGGCAUGGGCUUCACCAUUCACGGCGCUCUGACACCUGGCUCUGAGGGCUGUGUGUUCGACAGCUCUCACCCCGACUAUCCCCAGCGCGUGAUCGUGAAAGCCGGCUGGUACACAAGCACAAGCCACGAGGCCAGACUGCUGCGGAGACUGGAUCAUCCUGCCAUCCUGCCUCUGCUGGAUCUGCAUGUGGUGUCCGGCGUGACAUGUCUGGUGCUGCCUAAGUACCAGGCCGACCUGUACACCUACCUGAGCAGAAGGCUGAACCCUCUGGGCAGACCUCAGAUUGCCGCUGUGUCAAGACAGCUGCUGAGCGCUGUGGACUACAUCCACAGACAGGGCAUCAUCCACCGGGACAUCAAGACCGAGAAUAUCUUCAUCAACACGCCCGAGGACAUCUGCCUGGGCGAUUUUGGCGCCGCUUGCUUCGUGCAAGGCAGCAGAAGCAGCCCCUUUCCUUAUGGAAUCGCCGGCACCAUCGACACAAACGCCCCUGAAGUUCUGGCCGGCGAUCCUUACACCACCACCGUGGAUAUUUGGAGCGCCGGACUGGUCAUCUUCGAGACAGCCGUGCAUAACGCCAGCCUGUUCUCUGCCCCUAGAGGCCCUAAAAGAGGCCCCUGCGAUAGCCAGAUCACCCGGAUCAUUAGACAGGCCCAGGUGCACGUGGACGAGUUCUCUCCACAUCCUGAGAGCCGGCUGACCAGCCGGUACAGAUCUAGAGCCGCCGGAAACAACCGGCCUCCAUACACAAGACCUGCCUGGACACGGUACUACAAGAUGGACAUCGACGUGGAAUACCUCGUGUGCAAGGCCCUGACCUUCGAUGGCGCCCUUAGACCUUCUGCCGCCGAACUGCUUUGCCUGCCACUGUUCCAGCAGAAG [서열번호 302]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 302에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 HSV2 US1(A0A290Y3Z3; A0A290Y3Z3_HHV2 US1 인간 헤르페스바이러스 2), 또는 그의 동원체이다. HSV2 US1의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 303으로 나타낸다:
MADIPPDPPALNTTPVNHAPPSPPPGSRKRRRPVLPSSSESEGKPDTESESSSTESSEDEAGDLRGGRRRSPRELGGRYFLDLSAESTTGTESEGTGPSDDDDDDASDGWLVDTPPRKSKRPRINLRLTSSPDRRAGVVFPEVWRNDRPIRAAQPQAPAQSSGDRAAAPRRSARQAQMRSGAAWTLDLHYIRQCVNQLFRILRAAPNPPGSANRLRHLVRDCYLMGYCRTRLGPRTWGRLLQISGGTWDVRLRNAIREVEARFEPAAEPVCELPCLNARRYGPECDVGNLETNGGSTSDDEISDATDSDDTLASHSDTEGGPSPAGRENPESASGGAIAARLECEFGTFDWTSEEGSQPWLSAVVADTSSAERSGLPAPGACRATEAPEREDGCRKMRFPAACPYPCGHTFLRP [서열번호 303]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 303에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 HSV2 US1 폴리펩티드는 다음과 같은 서열번호 304의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGCAGACATCCCCCCGGACCCGCCCGCGCTCAACACGACGCCTGTGAATCATGCTCCCCCATCCCCGCCCCCGGGTTCACGGAAGCGCAGACGCCCCGTCCTCCCCAGCTCGTCGGAATCTGAGGGTAAGCCCGACACAGAATCGGAATCCTCCTCGACCGAGTCGTCCGAGGATGAGGCGGGAGACCTACGCGGCGGGCGCCGTCGCTCCCCGCGGGAGCTCGGGGGGAGGTATTTTTTGGATCTGTCGGCAGAATCGACCACGGGGACGGAATCGGAGGGAACGGGGCCGTCGGACGACGATGATGATGATGCGTCAGACGGCTGGTTGGTTGACACCCCCCCCCGTAAATCCAAGCGACCCCGAATCAACCTGCGATTAACGAGCTCCCCCGACCGGCGCGCGGGTGTGGTTTTCCCCGAGGTGTGGAGAAACGACAGACCTATCCGCGCGGCGCAACCCCAGGCCCCGGCCCAGTCTTCCGGGGATCGCGCAGCCGCACCGCGGCGCTCTGCTCGCCAGGCCCAGATGCGGAGCGGAGCCGCCTGGACGCTTGATCTGCATTACATACGCCAGTGCGTCAACCAGCTCTTTCGGATCCTGCGTGCCGCCCCGAACCCGCCCGGCAGCGCCAACCGCCTGCGCCACCTGGTGCGAGACTGCTACCTCATGGGCTACTGCCGGACCCGCCTGGGGCCGCGCACGTGGGGCCGCCTGCTGCAGATCTCGGGCGGAACCTGGGACGTGCGCCTGCGAAACGCAATCCGGGAGGTCGAGGCGCGTTTTGAACCCGCCGCCGAGCCCGTGTGCGAGCTGCCCTGTCTGAACGCCAGGCGTTACGGCCCCGAGTGTGATGTTGGCAATCTCGAGACCAACGGCGGCTCGACGAGCGATGATGAGATATCGGATGCGACGGACTCGGACGATACCCTCGCGTCCCATTCCGACACGGAGGGGGGGCCCTCCCCGGCCGGCCGGGAGAACCCGGAATCCGCGTCCGGCGGGGCTATCGCGGCTCGGCTGGAGTGTGAGTTTGGGACGTTTGACTGGACGTCCGAGGAGGGCTCCCAGCCCTGGCTGTCCGCGGTGGTCGCCGATACCAGCTCCGCCGAACGCTCTGGCCTACCCGCCCCGGGCGCGTGTCGCGCAACGGAAGCCCCAGAACGCGAGGACGGGTGCCGAAAAATGCGCTTCCCCGCCGCCTGCCCCTATCCCTGCGGCCACACATTTCTCCGGCCA [서열번호 304]
따라서, 바람직하게는 상기 HSV2 US1 폴리펩티드는 실질적으로 서열번호 304에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 HSV2 US1 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 305로 제공된다:
ATGGCCGACATTCCTCCTGATCCTCCAGCTCTGAACACCACACCTGTGAATCACGCCCCTCCATCTCCACCACCTGGCAGCAGAAAGAGAAGAAGGCCTGTCCTGCCTAGCAGCAGCGAGTCTGAGGGCAAGCCTGATACAGAGAGCGAGAGCAGCAGCACAGAGAGCAGCGAGGACGAAGCTGGCGATCTTAGAGGCGGCAGAAGAAGAAGCCCCAGAGAACTCGGCGGCAGATACTTCCTGGATCTGAGCGCCGAGAGCACCACCGGCACTGAATCTGAAGGCACAGGCCCCAGCGACGACGATGACGATGATGCCTCTGATGGCTGGCTGGTGGACACCCCTCCTAGAAAGTCCAAGCGGCCCAGAATCAACCTGCGGCTGACAAGCTCTCCTGATCGCAGAGCTGGCGTGGTGTTCCCCGAAGTGTGGCGGAACGACAGACCTATCAGAGCCGCTCAGCCTCAGGCTCCTGCTCAGTCTAGCGGAGATAGAGCTGCCGCTCCTAGAAGATCTGCCAGACAGGCCCAGATGAGAAGCGGAGCTGCTTGGACACTGGACCTGCACTACATCCGGCAGTGCGTGAACCAGCTGTTCCGGATCCTTCGGGCTGCCCCTAATCCACCTGGCTCCGCCAATAGACTGAGACACCTTGTGCGGGACTGCTACCTGATGGGCTACTGCAGAACAAGACTGGGCCCCAGAACATGGGGCAGACTGCTGCAAATCTCTGGCGGCACATGGGACGTGCGGCTGAGAAACGCCATTAGAGAGGTGGAAGCCAGATTCGAGCCAGCCGCTGAGCCTGTGTGTGAACTGCCTTGTCTGAACGCTCGGAGATACGGCCCCGAGTGTGATGTGGGCAACCTGGAAACAAATGGCGGCAGCACCTCCGACGACGAGATCTCTGATGCCACCGACAGCGACGATACACTGGCCAGCCACAGCGATACAGAAGGCGGACCATCTCCTGCCGGAAGAGAGAATCCTGAGTCTGCCTCTGGCGGAGCTATCGCCGCAAGACTGGAATGCGAGTTCGGCACCTTCGACTGGACAAGCGAGGAAGGCTCTCAGCCTTGGCTGTCTGCTGTGGTGGCCGATACCTCTAGCGCCGAAAGATCTGGACTTCCTGCTCCTGGCGCCTGCAGAGCTACAGAAGCTCCTGAAAGAGAGGACGGCTGCAGAAAGATGCGGTTCCCTGCCGCCTGTCCTTATCCTTGCGGCCACACATTTCTGCGGCCT [서열번호 305]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 305에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 305의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 306으로 제공된다:
AUGGCCGACAUUCCUCCUGAUCCUCCAGCUCUGAACACCACACCUGUGAAUCACGCCCCUCCAUCUCCACCACCUGGCAGCAGAAAGAGAAGAAGGCCUGUCCUGCCUAGCAGCAGCGAGUCUGAGGGCAAGCCUGAUACAGAGAGCGAGAGCAGCAGCACAGAGAGCAGCGAGGACGAAGCUGGCGAUCUUAGAGGCGGCAGAAGAAGAAGCCCCAGAGAACUCGGCGGCAGAUACUUCCUGGAUCUGAGCGCCGAGAGCACCACCGGCACUGAAUCUGAAGGCACAGGCCCCAGCGACGACGAUGACGAUGAUGCCUCUGAUGGCUGGCUGGUGGACACCCCUCCUAGAAAGUCCAAGCGGCCCAGAAUCAACCUGCGGCUGACAAGCUCUCCUGAUCGCAGAGCUGGCGUGGUGUUCCCCGAAGUGUGGCGGAACGACAGACCUAUCAGAGCCGCUCAGCCUCAGGCUCCUGCUCAGUCUAGCGGAGAUAGAGCUGCCGCUCCUAGAAGAUCUGCCAGACAGGCCCAGAUGAGAAGCGGAGCUGCUUGGACACUGGACCUGCACUACAUCCGGCAGUGCGUGAACCAGCUGUUCCGGAUCCUUCGGGCUGCCCCUAAUCCACCUGGCUCCGCCAAUAGACUGAGACACCUUGUGCGGGACUGCUACCUGAUGGGCUACUGCAGAACAAGACUGGGCCCCAGAACAUGGGGCAGACUGCUGCAAAUCUCUGGCGGCACAUGGGACGUGCGGCUGAGAAACGCCAUUAGAGAGGUGGAAGCCAGAUUCGAGCCAGCCGCUGAGCCUGUGUGUGAACUGCCUUGUCUGAACGCUCGGAGAUACGGCCCCGAGUGUGAUGUGGGCAACCUGGAAACAAAUGGCGGCAGCACCUCCGACGACGAGAUCUCUGAUGCCACCGACAGCGACGAUACACUGGCCAGCCACAGCGAUACAGAAGGCGGACCAUCUCCUGCCGGAAGAGAGAAUCCUGAGUCUGCCUCUGGCGGAGCUAUCGCCGCAAGACUGGAAUGCGAGUUCGGCACCUUCGACUGGACAAGCGAGGAAGGCUCUCAGCCUUGGCUGUCUGCUGUGGUGGCCGAUACCUCUAGCGCCGAAAGAUCUGGACUUCCUGCUCCUGGCGCCUGCAGAGCUACAGAAGCUCCUGAAAGAGAGGACGGCUGCAGAAAGAUGCGGUUCCCUGCCGCCUGUCCUUAUCCUUGCGGCCACACAUUUCUGCGGCCU [서열번호 306]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 306에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 CSFV NPro(P19712; 게놈 폴리단백질 고전적 돼지 열병 바이러스(알포트(Alfort) 바이러스주)), 또는 그의 동원체이다. CSFV NPro의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 307로 나타낸다:
MELNHFELLYKTSKQKPVGVEEPVYDTAGRPLFGNPSEVHPQSTLKLPHDRGRGDIRTTLRDLPRKGDCRSGNHLGPVSGIYIKPGPVYYQDYTGPVYHRAPLEFFDEAQFCEVTKRIGRVTGSDGKLYHIYVCVDGCILLKLAKRGTPRTLKWIRNFTNCPLWVTSC [서열번호 307]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 307에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 CSFV NPro 폴리펩티드는 다음과 같은 서열번호 308의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGAGTTGAATCATTTTGAATTATTATACAAAACAAGCAAACAAAAACCAGTGGGAGTGGAGGAACCGGTGTATGACACCGCGGGGAGACCACTATTTGGGAACCCAAGTGAGGTACACCCACAATCAACGCTGAAGCTGCCACACGACAGGGGGAGAGGAGATATCAGAACAACACTGAGGGACCTACCCAGGAAAGGTGACTGTAGGAGTGGCAACCATCTAGGCCCGGTTAGTGGGATATACATAAAGCCCGGCCCTGTCTACTATCAGGACTACACGGGCCCAGTCTATCACAGAGCTCCTTTAGAGTTCTTTGATGAGGCCCAGTTCTGCGAGGTGACTAAGAGAATAGGCAGGGTCACGGGTAGTGATGGTAAGCTTTACCACATATATGTGTGCGTCGATGGTTGCATACTGCTGAAATTAGCCAAAAGGGGCACACCCAGAACCCTAAAGTGGATTAGGAACTTCACCAACTGTCCATTATGGGTAACCAGTTGC [서열번호 308]
따라서, 바람직하게는 상기 CSFV NPro 폴리펩티드는 실질적으로 서열번호 308에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 CSFV NPro 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 309로 제공된다:
ATGGAACTGAACCACTTCGAGCTGCTGTACAAGACCAGCAAGCAGAAACCCGTGGGCGTCGAGGAACCCGTGTATGATACAGCTGGCAGACCCCTGTTCGGCAACCCCTCTGAAGTGCACCCTCAGAGCACACTGAAGCTGCCCCACGATAGAGGCAGAGGCGACATCAGAACCACACTGCGGGACCTGCCTAGAAAGGGCGATTGCAGAAGCGGCAATCATCTGGGCCCTGTGTCCGGCATCTACATCAAGCCTGGACCAGTGTACTACCAGGACTACACAGGCCCCGTGTACCACAGAGCCCCTCTGGAATTCTTCGACGAGGCCCAGTTCTGCGAAGTGACCAAGAGAATCGGCAGAGTGACCGGCTCCGACGGCAAGCTGTACCACATCTACGTGTGCGTGGACGGCTGCATCCTGCTGAAGCTGGCCAAGAGAGGCACCCCTAGAACACTGAAGTGGATCCGGAACTTCACCAACTGTCCTCTGTGGGTCACCAGCTGC [서열번호 309]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 309에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 309의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 310으로 제공된다:
AUGGAACUGAACCACUUCGAGCUGCUGUACAAGACCAGCAAGCAGAAACCCGUGGGCGUCGAGGAACCCGUGUAUGAUACAGCUGGCAGACCCCUGUUCGGCAACCCCUCUGAAGUGCACCCUCAGAGCACACUGAAGCUGCCCCACGAUAGAGGCAGAGGCGACAUCAGAACCACACUGCGGGACCUGCCUAGAAAGGGCGAUUGCAGAAGCGGCAAUCAUCUGGGCCCUGUGUCCGGCAUCUACAUCAAGCCUGGACCAGUGUACUACCAGGACUACACAGGCCCCGUGUACCACAGAGCCCCUCUGGAAUUCUUCGACGAGGCCCAGUUCUGCGAAGUGACCAAGAGAAUCGGCAGAGUGACCGGCUCCGACGGCAAGCUGUACCACAUCUACGUGUGCGUGGACGGCUGCAUCCUGCUGAAGCUGGCCAAGAGAGGCACCCCUAGAACACUGAAGUGGAUCCGGAACUUCACCAACUGUCCUCUGUGGGUCACCAGCUGC [서열번호 310]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 310에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 BDV Npro(A0A290YXI0; 오토프로테아제(Autoprotease) p20 보더 질환(Border disease) 바이러스), 또는 그의 동원체이다. BDV Npro의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 311로 나타낸다:
MELNKFELLYKTSKQRPVGAVEPVYDSAGNPLYGERTTVHPQATLKLPHHRGVAEVITTLKDLPRKGDCRSGNHRGPVSGIYIKPGPVIYQDYKRPVYHRAPLEQFTKVQICEATKRVGRVTGSDGKLYHLYVCMDGCILLKLASRTVNAVLKWTHNTLDCPLWVTSC [서열번호 311]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 311에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 BDV Npro 폴리펩티드는 다음과 같은 서열번호 312의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGAGTTGAATAAGTTTGAACTTTTATACAAAACAAGTAAACAAAGACCAGTAGGGGCTGTTGAACCAGTTTATGACTCAGCGGGTAACCCCCTATATGGTGAAAGAACAACAGTACACCCGCAAGCCACTCTGAAACTACCACATCACAGGGGAGTAGCCGAGGTGATAACAACCCTGAAGGATTTGCCCAGGAAAGGAGACTGCAGGAGTGGAAACCATCGAGGCCCAGTGAGTGGTATATACATCAAGCCAGGTCCAGTCATATACCAGGATTACAAGAGACCGGTGTACCACAGGGCTCCTCTGGAGCAGTTCACGAAGGTACAAATCTGTGAGGCTACGAAAAGGGTGGGGAGAGTCACTGGCAGCGATGGCAAATTGTACCACCTATACGTTTGCATGGATGGTTGCATATTGCTGAAACTGGCAAGCAGGACCGTGAATGCAGTGCTAAAATGGACACATAACACTCTGGACTGTCCACTTTGGGTTACAAGCTGC [서열번호 312]
따라서, 바람직하게는 상기 BDV Npro 폴리펩티드는 실질적으로 서열번호 312에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 BDV Npro 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 313으로 제공된다:
ATGGAACTGAACAAGTTCGAGCTGCTGTACAAGACCAGCAAGCAGAGGCCTGTGGGAGCCGTGGAACCTGTGTATGATAGCGCCGGCAATCCCCTGTACGGCGAGAGAACAACAGTGCACCCTCAGGCCACACTGAAGCTGCCTCATCATAGAGGCGTGGCCGAAGTGATCACAACCCTGAAGGACCTGCCTCGGAAGGGCGATTGCAGAAGCGGCAATCACAGAGGCCCTGTGTCCGGCATCTACATCAAGCCCGGACCTGTGATCTACCAGGACTACAAGCGGCCCGTGTACCACAGAGCACCCCTGGAACAGTTCACCAAGGTGCAGATTTGCGAGGCCACCAAGCGCGTGGGAAGAGTGACAGGCTCTGACGGCAAGCTGTACCACCTGTACGTGTGCATGGACGGCTGCATCCTGCTGAAACTGGCCAGCAGAACCGTGAACGCCGTGCTGAAGTGGACCCACAACACCCTGGATTGCCCTCTGTGGGTCACCAGCTGT [서열번호 313]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 313에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 313의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 314로 제공된다:
AUGGAACUGAACAAGUUCGAGCUGCUGUACAAGACCAGCAAGCAGAGGCCUGUGGGAGCCGUGGAACCUGUGUAUGAUAGCGCCGGCAAUCCCCUGUACGGCGAGAGAACAACAGUGCACCCUCAGGCCACACUGAAGCUGCCUCAUCAUAGAGGCGUGGCCGAAGUGAUCACAACCCUGAAGGACCUGCCUCGGAAGGGCGAUUGCAGAAGCGGCAAUCACAGAGGCCCUGUGUCCGGCAUCUACAUCAAGCCCGGACCUGUGAUCUACCAGGACUACAAGCGGCCCGUGUACCACAGAGCACCCCUGGAACAGUUCACCAAGGUGCAGAUUUGCGAGGCCACCAAGCGCGUGGGAAGAGUGACAGGCUCUGACGGCAAGCUGUACCACCUGUACGUGUGCAUGGACGGCUGCAUCCUGCUGAAACUGGCCAGCAGAACCGUGAACGCCGUGCUGAAGUGGACCCACAACACCCUGGAUUGCCCUCUGUGGGUCACCAGCUGU [서열번호 314]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 314에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 소 RV NS1(Q8JZ13; 비-구조 단백질 1 소 로타바이러스 A), 또는 그의 동원체이다. 소 RV NS1의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 315로 나타낸다:
MATFKDACYHYKKLNKLNSLVLKLGANDEWRPAPVTKYKGWCLDCCQYTNLTYCRGCALYHVCQWCSQYNRCFLDEEPHLLRMRTFKDVVTKEDIEGLLTMYETLFPINEKLVNKFINSVKQRKCRNEYLLEWYNHLLMPITLQALTINLEDNVYYMFGYYDCMEHENQTPFQFVNLLEKYDKLLLDDRNFHRMSHLPVILQQEYALRYFSKSRFLSKGKKRLSRSDFSDNLMEDRHSPTSLMQVVRNCISIHIDDCEWNKACTLIVDARNYISIMNSSYTEHYSVSQRCKLFTKYKFGIVSKLVKPNYIFSSHESCALNVHNCKWCQINNHYKVWEDFRLRKIYNNVMDFIRALVKSNVNVGHCSSQESVYKYVPDLFLICKTEKWSEAVEMLFNYLEPVNVNGTEYVLLDYEVNWEVRGLVMQNMDGKVPRILNMNDTKKILSAMIFDWFDTRYMRETPMTTSTTNQLRTLNKRNELIDEYDLELSDVE [서열번호 315]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 315에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하느 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 소 RV NS1 폴리펩티드는 다음과 같은 서열번호 316의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGCGACTTTTAAGGACGCTTGTTATCATTATAAAAAGTTGAATAAATTAAATAGTTTAGTGCTCAAACTAGGAGCAAATGATGAATGGAGGCCAGCACCAGTGACAAAATATAAAGGATGGTGTTTAGATTGTTGTCAATATACAAATTTGACATATTGCAGAGGGTGCGCTCTATACCATGTATGTCAGTGGTGCAGTCAGTATAACAGGTGTTTCTTAGATGAAGAACCCCATTTGCTGAGAATGCGAACATTTAAAGATGTAGTAACAAAAGAAGATATAGAAGGACTGCTAACCATGTATGAAACGTTGTTTCCAATAAATGAAAAGTTAGTGAATAAATTCATAAACTCTGTGAAGCAGCGTAAGTGTAGGAATGAGTATTTGTTAGAATGGTATAACCACTTACTAATGCCAATAACATTGCAAGCATTGACTATAAATCTTGAGGATAATGTATATTATATGTTTGGATACTATGATTGCATGGAGCATGAAAACCAAACACCATTCCAATTTGTTAACCTACTAGAAAAATATGATAAATTGCTACTAGATGATAGAAATTTCCATAGAATGTCACACTTACCAGTAATATTGCAACAAGAGTATGCGTTGAGATATTTTTCAAAATCAAGATTTTTAAGTAAAGGGAAGAAAAGATTGAGTAGGAGTGATTTCTCAGATAATCTTATGGAAGATAGACATAGTCCAACATCATTAATGCAAGTGGTACGTAACTGCATCAGTATACACATAGATGATTGTGAATGGAATAAAGCGTGTACGCTTATAGTTGATGCTAGAAATTATATTAGTATTATGAATTCATCGTATACTGAGCATTACAGTGTGTCACAAAGATGTAAACTGTTCACTAAGTATAAATTTGGGATTGTATCAAAATTGGTGAAACCGAATTACATTTTTTCTAGCCATGAATCATGCGCATTAAACGTACACAATTGTAAATGGTGTCAGATCAATAACCATTACAAAGTGTGGGAAGATTTTAGACTTAGGAAAATATACAATAATGTAATGGATTTTATCAGGGCACTTGTGAAATCGAATGTAAACGTTGGACATTGTTCATCACAGGAATCAGTGTATAAGTATGTACCGGATTTATTTTTAATTTGTAAAACGGAAAAATGGAGCGAAGCTGTCGAAATGTTATTTAATTATCTAGAACCAGTGAACGTAAATGGAACGGAGTATGTATTATTAGACTATGAAGTGAACTGGGAAGTGAGGGGACTAGTCATGCAAAACATGGACGGGAAAGTACCAAGAATTTTGAATATGAATGATACAAAGAAGATACTGAGTGCAATGATATTTGACTGGTTTGACACAAGATATATGAGAGAAACACCAATGACGACGTCAACAACAAACCAACTTCGAACACTGAACAAAAGGAATGAGCTCATAGATGAGTACGATTTAGAACTTTCAGATGTTGAA [서열번호 316]
따라서, 바람직하게는 상기 소 RV NS1 폴리펩티드는 실질적으로 서열번호 316에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 소 RV NS1 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 317로 제공된다:
ATGGCCACCTTCAAGGACGCCTGCTACCACTACAAGAAGCTGAACAAGCTGAATAGCCTGGTGCTGAAGCTGGGCGCCAATGATGAATGGCGACCTGCTCCTGTGACCAAGTACAAAGGCTGGTGCCTGGACTGCTGCCAGTACACCAATCTGACCTACTGCAGAGGCTGCGCCCTGTACCACGTCTGTCAGTGGTGCAGCCAGTACAACCGGTGCTTCCTGGACGAGGAACCCCATCTGCTGCGGATGCGGACCTTTAAGGACGTGGTCACCAAAGAGGACATCGAGGGCCTGCTGACTATGTACGAGACACTGTTCCCCATCAACGAGAAGCTGGTCAACAAGTTCATCAACAGCGTGAAGCAGCGGAAGTGCCGGAACGAGTACCTGCTGGAATGGTACAATCATCTGCTGATGCCCATCACACTGCAGGCCCTGACCATCAACCTGGAAGATAACGTGTACTACATGTTCGGCTACTACGACTGCATGGAACACGAGAATCAGACCCCTTTCCAGTTCGTGAACCTGCTCGAGAAGTACGACAAGCTGCTGCTGGACGACCGGAACTTCCACCGGATGTCTCATCTGCCCGTGATCCTGCAGCAAGAGTACGCCCTGCGGTACTTCAGCAAGAGCCGGTTTCTGAGCAAGGGCAAGAAGCGGCTGAGCAGAAGCGACTTCAGCGACAACCTGATGGAAGATCGGCACAGCCCCACCAGCCTGATGCAGGTCGTCAGAAACTGCATCAGCATCCACATCGACGACTGTGAATGGAACAAGGCCTGCACACTGATCGTGGACGCCCGCAACTACATCTCCATCATGAACAGCAGCTACACCGAGCACTACAGCGTGTCCCAGCGGTGCAAGCTGTTCACAAAGTACAAGTTCGGCATCGTGTCCAAGCTCGTGAAGCCCAATTACATCTTCAGCAGCCACGAGAGCTGTGCCCTGAACGTGCACAACTGCAAGTGGTGCCAGATCAACAATCACTACAAAGTGTGGGAAGATTTCCGGCTGCGGAAGATCTACAACAACGTGATGGACTTCATCCGCGCTCTGGTCAAGAGCAACGTGAACGTGGGCCACTGCAGCAGCCAAGAGTCCGTGTACAAATACGTGCCCGACCTGTTCCTGATCTGCAAGACCGAGAAGTGGAGCGAGGCCGTGGAAATGCTGTTCAACTACCTGGAACCTGTGAACGTCAACGGCACCGAGTACGTCCTGCTGGACTACGAAGTGAACTGGGAAGTGCGGGGCCTCGTGATGCAGAACATGGATGGCAAGGTGCCCCGGATCCTGAACATGAACGACACCAAGAAAATCCTGAGCGCCATGATCTTCGATTGGTTCGACACCCGGTACATGCGCGAGACACCTATGACCACCAGCACCACCAACCAGCTGCGGACCCTGAACAAGAGAAACGAGCTGATCGACGAGTACGACCTGGAACTGAGCGACGTGGAA [서열번호 317]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 317에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 317의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 318로 제공된다:
AUGGCCACCUUCAAGGACGCCUGCUACCACUACAAGAAGCUGAACAAGCUGAAUAGCCUGGUGCUGAAGCUGGGCGCCAAUGAUGAAUGGCGACCUGCUCCUGUGACCAAGUACAAAGGCUGGUGCCUGGACUGCUGCCAGUACACCAAUCUGACCUACUGCAGAGGCUGCGCCCUGUACCACGUCUGUCAGUGGUGCAGCCAGUACAACCGGUGCUUCCUGGACGAGGAACCCCAUCUGCUGCGGAUGCGGACCUUUAAGGACGUGGUCACCAAAGAGGACAUCGAGGGCCUGCUGACUAUGUACGAGACACUGUUCCCCAUCAACGAGAAGCUGGUCAACAAGUUCAUCAACAGCGUGAAGCAGCGGAAGUGCCGGAACGAGUACCUGCUGGAAUGGUACAAUCAUCUGCUGAUGCCCAUCACACUGCAGGCCCUGACCAUCAACCUGGAAGAUAACGUGUACUACAUGUUCGGCUACUACGACUGCAUGGAACACGAGAAUCAGACCCCUUUCCAGUUCGUGAACCUGCUCGAGAAGUACGACAAGCUGCUGCUGGACGACCGGAACUUCCACCGGAUGUCUCAUCUGCCCGUGAUCCUGCAGCAAGAGUACGCCCUGCGGUACUUCAGCAAGAGCCGGUUUCUGAGCAAGGGCAAGAAGCGGCUGAGCAGAAGCGACUUCAGCGACAACCUGAUGGAAGAUCGGCACAGCCCCACCAGCCUGAUGCAGGUCGUCAGAAACUGCAUCAGCAUCCACAUCGACGACUGUGAAUGGAACAAGGCCUGCACACUGAUCGUGGACGCCCGCAACUACAUCUCCAUCAUGAACAGCAGCUACACCGAGCACUACAGCGUGUCCCAGCGGUGCAAGCUGUUCACAAAGUACAAGUUCGGCAUCGUGUCCAAGCUCGUGAAGCCCAAUUACAUCUUCAGCAGCCACGAGAGCUGUGCCCUGAACGUGCACAACUGCAAGUGGUGCCAGAUCAACAAUCACUACAAAGUGUGGGAAGAUUUCCGGCUGCGGAAGAUCUACAACAACGUGAUGGACUUCAUCCGCGCUCUGGUCAAGAGCAACGUGAACGUGGGCCACUGCAGCAGCCAAGAGUCCGUGUACAAAUACGUGCCCGACCUGUUCCUGAUCUGCAAGACCGAGAAGUGGAGCGAGGCCGUGGAAAUGCUGUUCAACUACCUGGAACCUGUGAACGUCAACGGCACCGAGUACGUCCUGCUGGACUACGAAGUGAACUGGGAAGUGCGGGGCCUCGUGAUGCAGAACAUGGAUGGCAAGGUGCCCCGGAUCCUGAACAUGAACGACACCAAGAAAAUCCUGAGCGCCAUGAUCUUCGAUUGGUUCGACACCCGGUACAUGCGCGAGACACCUAUGACCACCAGCACCACCAACCAGCUGCGGACCCUGAACAAGAGAAACGAGCUGAUCGACGAGUACGACCUGGAACUGAGCGACGUGGAA [서열번호 318]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 318에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 소 RV NS2(Q86505; 비-구조 단백질 2 소 로타바이러스 A), 또는 그의 동원체이다. 소 RV NS2의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 319로 나타낸다:
MAELACFCYPHLESDTYRFIPFNSLAIKCMLTAKVDKKDQDKFYNSIIYGIAPPPQFKKRYNTNDNSRGMNYETPMFNKVAVLICEALNSIKVTQSDVASVLSKVISVRHLENLVLRRENHQDVLFHSKELLLRSVLIAIGHSKEIETTATAEGGEVVFQNAAFTMWKLTYLEHRLMPILDQNFIEYKITVNEDKPISESHVRELIAELRWQYNKFAVITHGKGHYRVVKYSSVANHADRVYATFKSNNKNGNVIEFNLLDQRIIWQNWYAFTSSMKQGNTLEICKKLLFQKMKRESNPFKGLSTDRKMDEVSQIGI [서열번호 319]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 319에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 소 RV NS2 폴리펩티드는 다음과 같은 서열번호 320의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGCTGAGCTAGCTTGCTTTTGTTATCCCCATTTGGAGAGCGATACGTATAGATTCATTCCATTTAACAGTTTAGCTATAAAATGTATGTTGACAGCAAAAGTGGACAAAAAAGATCAGGATAAGTTTTACAATTCAATAATTTATGGCATTGCACCACCGCCACAGTTCAAAAAACGTTATAACACAAATGATAATTCGAGAGGAATGAATTATGAAACTCCAATGTTTAATAAAGTGGCGGTATTAATTTGTGAAGCGTTGAATTCAATTAAAGTTACTCAATCTGATGTTGCGAGTGTACTTTCAAAAGTAATTTCTGTAAGACATTTAGAGAATTTGGTACTGAGAAGAGAGAACCATCAGGACGTGCTTTTCCATTCAAAAGAGTTGTTGCTGAGATCAGTACTAATAGCTATTGGTCACTCAAAAGAAATTGAAACAACTGCCACTGCTGAAGGAGGGGAAGTAGTTTTTCAAAATGCAGCTTTTACAATGTGGAAACTGACATACCTGGAGCATAGACTAATGCCAATTTTGGATCAAAATTTTATCGAATATAAAATAACAGTGAATGAAGATAAACCAATTTCAGAATCACATGTAAGAGAACTCATTGCTGAATTGCGGTGGCAATACAACAAATTTGCAGTAATTACACATGGTAAAGGTCACTACAGAGTTGTAAAATATTCATCAGTTGCGAATCATGCAGATAGAGTTTACGCTACTTTCAAGAGCAATAATAAGAATGGGAATGTGATAGAGTTTAATCTACTTGATCAAAGAATAATATGGCAGAACTGGTATGCGTTTACATCCTCAATGAAACAAGGCAACACTCTTGAAATATGCAAGAAACTACTGTTCCAAAAGATGAAGCGAGAAAGTAATCCGTTTAAGGGACTGTCAACTGATAGAAAGATGGATGAGGTCTCTCAAATAGGAATT [서열번호 320]
따라서, 바람직하게는 상기 소 RV NS2 폴리펩티드는 실질적으로 서열번호 320에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 소 RV NS2 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 321로 제공된다:
ATGGCCGAGCTGGCCTGCTTTTGTTACCCTCACCTGGAAAGCGATACCTACCGGTTCATCCCCTTCAACAGCCTGGCCATCAAGTGCATGCTGACCGCCAAGGTGGACAAGAAGGACCAGGACAAGTTCTACAACAGCATCATCTACGGAATCGCCCCTCCACCTCAGTTCAAGAAGCGGTACAACACCAACGACAACAGCCGGGGCATGAACTACGAGACACCCATGTTCAACAAGGTGGCCGTGCTGATCTGCGAGGCCCTGAACTCCATCAAAGTGACCCAGTCCGATGTGGCCAGCGTGCTGAGCAAAGTGATCTCTGTGCGGCACCTCGAGAACCTGGTGCTGCGGAGAGAAAACCACCAGGACGTGCTGTTCCACAGCAAAGAGCTGCTGCTGAGATCTGTGCTGATCGCCATCGGCCACTCCAAAGAGATCGAGACAACCGCCACAGCCGAAGGCGGAGAGGTGGTGTTTCAGAATGCCGCCTTCACCATGTGGAAGCTGACCTACCTGGAACACCGGCTGATGCCCATCCTGGACCAGAACTTCATCGAGTACAAGATCACCGTGAACGAGGACAAGCCCATCAGCGAGTCTCACGTGCGGGAACTGATTGCCGAGCTGCGGTGGCAGTACAACAAGTTCGCCGTGATCACACACGGCAAGGGCCACTACAGAGTGGTCAAGTACAGCAGCGTGGCCAACCACGCCGATAGAGTGTACGCCACCTTCAAGAGCAACAACAAGAACGGCAACGTGATCGAGTTCAACCTGCTGGACCAGCGGATCATCTGGCAGAATTGGTACGCCTTTACCAGCAGCATGAAGCAGGGCAACACCCTGGAAATCTGCAAGAAGCTCCTGTTCCAGAAGATGAAGAGAGAGAGCAACCCCTTCAAGGGCCTGAGCACCGACCGGAAGATGGATGAGGTGTCCCAGATCGGCATC [서열번호 321]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 321에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 321의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 322로 제공된다:
AUGGCCGAGCUGGCCUGCUUUUGUUACCCUCACCUGGAAAGCGAUACCUACCGGUUCAUCCCCUUCAACAGCCUGGCCAUCAAGUGCAUGCUGACCGCCAAGGUGGACAAGAAGGACCAGGACAAGUUCUACAACAGCAUCAUCUACGGAAUCGCCCCUCCACCUCAGUUCAAGAAGCGGUACAACACCAACGACAACAGCCGGGGCAUGAACUACGAGACACCCAUGUUCAACAAGGUGGCCGUGCUGAUCUGCGAGGCCCUGAACUCCAUCAAAGUGACCCAGUCCGAUGUGGCCAGCGUGCUGAGCAAAGUGAUCUCUGUGCGGCACCUCGAGAACCUGGUGCUGCGGAGAGAAAACCACCAGGACGUGCUGUUCCACAGCAAAGAGCUGCUGCUGAGAUCUGUGCUGAUCGCCAUCGGCCACUCCAAAGAGAUCGAGACAACCGCCACAGCCGAAGGCGGAGAGGUGGUGUUUCAGAAUGCCGCCUUCACCAUGUGGAAGCUGACCUACCUGGAACACCGGCUGAUGCCCAUCCUGGACCAGAACUUCAUCGAGUACAAGAUCACCGUGAACGAGGACAAGCCCAUCAGCGAGUCUCACGUGCGGGAACUGAUUGCCGAGCUGCGGUGGCAGUACAACAAGUUCGCCGUGAUCACACACGGCAAGGGCCACUACAGAGUGGUCAAGUACAGCAGCGUGGCCAACCACGCCGAUAGAGUGUACGCCACCUUCAAGAGCAACAACAAGAACGGCAACGUGAUCGAGUUCAACCUGCUGGACCAGCGGAUCAUCUGGCAGAAUUGGUACGCCUUUACCAGCAGCAUGAAGCAGGGCAACACCCUGGAAAUCUGCAAGAAGCUCCUGUUCCAGAAGAUGAAGAGAGAGAGCAACCCCUUCAAGGGCCUGAGCACCGACCGGAAGAUGGAUGAGGUGUCCCAGAUCGGCAUC [서열번호 322]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 322에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 PBoV NP1(D7RF52; 비-구조 단백질 NP-1 돼지 보카바이러스(bocavirus) 1), 또는 그의 동원체이다. PBoV NP1의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 323으로 나타낸다:
MSSARSDTDTGRRGKRSRSRSRSRDRDQAPGLPPKKRDYRRRSGERGSESSPDRSTRGSPSCSTASRTSRVTSATWRRPNDSRDGGKIWGNKNKKNKTNPYEVFSQHMARFKPDKSYCGFYWHSCRMARKGTDYIFTEGMRDFQKRCKDNKCEWKDVREIMFGLKKVLDQGYRNMMYHFRHTQCEKCNYWDEVYKMHLANVSPSETEPQELTDEEILAAAMEVDGTHE [서열번호 323]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 323에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 PBoV NP1 폴리펩티드는 다음과 같은 서열번호 324의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGAGCTCAGCGAGATCCGACACAGACACAGGCAGGAGAGGGAAGCGGTCGAGGAGCCGGTCGAGGAGCCGCGACCGGGACCAAGCACCGGGGCTGCCTCCGAAAAAAAGGGACTATCGCCGTCGGAGTGGGGAGAGAGGCTCGGAGTCCTCACCAGATCGCTCGACGAGGGGGAGCCCATCGTGCTCCACTGCTTCGAGAACATCCCGAGTGACTTCAGCGACATGGAGGAGACCGAATGACTCTCGGGACGGGGGGAAAATATGGGGAAATAAAAATAAAAAGAATAAAACAAACCCTTACGAGGTATTCAGCCAGCACATGGCCAGGTTCAAGCCAGATAAAAGCTATTGTGGCTTCTACTGGCACAGCTGCCGGATGGCTCGTAAGGGCACAGATTATATCTTTACCGAGGGAATGAGGGATTTCCAAAAACGCTGTAAAGACAATAAATGTGAGTGGAAAGATGTCAGGGAGATCATGTTCGGCCTCAAAAAGGTCTTAGATCAGGGATATAGAAATATGATGTATCACTTTAGACATACCCAGTGTGAGAAATGTAACTACTGGGATGAAGTGTATAAAATGCACCTGGCTAACGTGTCTCCTTCTGAAACAGAACCGCAGGAACTGACAGACGAGGAGATATTAGCCGCGGCCATGGAGGTCGATGGCACCCACGAA [서열번호 324]
따라서, 바람직하게는 상기 PBoV NP1 폴리펩티드는 실질적으로 서열번호 324에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 PBoV NP1 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 325로 제공된다:
ATGAGCAGCGCCAGAAGCGATACCGACACAGGCAGACGGGGCAAGAGAAGCAGAAGCCGGTCCAGAAGCAGAGACAGAGATCAGGCTCCTGGCCTGCCTCCTAAGAAGCGGGACTACAGAAGAAGATCCGGCGAGAGAGGCAGCGAGAGCAGCCCTGATAGAAGCACAAGAGGCAGCCCTAGCTGTAGCACCGCCAGCAGAACAAGCAGAGTGACCTCTGCCACTTGGCGGAGGCCCAACGATTCTAGAGATGGCGGCAAGATCTGGGGCAACAAGAACAAGAAGAACAAAACGAACCCCTACGAGGTGTTCAGCCAGCACATGGCCAGATTCAAGCCCGACAAGAGCTACTGCGGCTTCTACTGGCACAGCTGCCGGATGGCCAGAAAGGGCACCGACTACATCTTCACCGAGGGCATGAGAGACTTCCAGAAGCGGTGCAAGGACAACAAGTGCGAGTGGAAGGACGTGCGCGAGATCATGTTCGGCCTGAAGAAGGTGCTGGACCAGGGCTACAGAAACATGATGTACCACTTCCGGCACACCCAGTGCGAGAAGTGCAACTACTGGGACGAAGTGTACAAGATGCACCTGGCCAACGTGTCCCCATCCGAGACAGAGCCTCAAGAGCTGACCGACGAGGAAATTCTGGCCGCTGCCATGGAAGTGGATGGCACACATGAA [서열번호 325]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 325에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 325의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 326으로 제공된다:
AUGAGCAGCGCCAGAAGCGAUACCGACACAGGCAGACGGGGCAAGAGAAGCAGAAGCCGGUCCAGAAGCAGAGACAGAGAUCAGGCUCCUGGCCUGCCUCCUAAGAAGCGGGACUACAGAAGAAGAUCCGGCGAGAGAGGCAGCGAGAGCAGCCCUGAUAGAAGCACAAGAGGCAGCCCUAGCUGUAGCACCGCCAGCAGAACAAGCAGAGUGACCUCUGCCACUUGGCGGAGGCCCAACGAUUCUAGAGAUGGCGGCAAGAUCUGGGGCAACAAGAACAAGAAGAACAAAACGAACCCCUACGAGGUGUUCAGCCAGCACAUGGCCAGAUUCAAGCCCGACAAGAGCUACUGCGGCUUCUACUGGCACAGCUGCCGGAUGGCCAGAAAGGGCACCGACUACAUCUUCACCGAGGGCAUGAGAGACUUCCAGAAGCGGUGCAAGGACAACAAGUGCGAGUGGAAGGACGUGCGCGAGAUCAUGUUCGGCCUGAAGAAGGUGCUGGACCAGGGCUACAGAAACAUGAUGUACCACUUCCGGCACACCCAGUGCGAGAAGUGCAACUACUGGGACGAAGUGUACAAGAUGCACCUGGCCAACGUGUCCCCAUCCGAGACAGAGCCUCAAGAGCUGACCGACGAGGAAAUUCUGGCCGCUGCCAUGGAAGUGGAUGGCACACAUGAA [서열번호 326]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 326에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 E형 간염 Orf3(P69616; 단백질 ORF3 E형 간염 바이러스 유전자형 1), 또는 그의 동원체이다. E형 간염 Orf3의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 327로 나타낸다:
MGSRPCALGLFCCCSSCFCLCCPRHRPVSRLAAVVGGAAAVPAVVSGVTGLILSPSQSPIFIQPTPSPPMSPLRPGLDLVFANPPDHSAPLGVTRPSAPPLPHVVDLPQLGPRR [서열번호 327]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 327에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 E형 간염 Orf3 폴리펩티드는 다음과 같은 서열번호 328의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGGTTCGCGACCATGCGCCCTCGGCCTATTTTGTTGCTGCTCCTCATGTTTTTGCCTATGCTGCCCGCGCCACCGCCCGGTCAGCCGTCTGGCCGCCGTCGTGGGCGGCGCAGCGGCGGTTCCGGCGGTGGTTTCTGGGGTGACCGGGTTGATTCTCAGCCCTTCGCAATCCCCTATATTCATCCAACCAACCCCTTCGCCCCCGATGTCACCGCTGCGGCCGGGGCTGGACCTCGTGTTCGCCAACCCGCCCGACCACTCGGCTCCGCTTGGCGTGACCAGGCCCAGCGCCCCGCCGTTGCCTCACGTCGTAGACCTACCACAGCTGGGGCCGCGCCGC [서열번호 328]
따라서, 바람직하게는 상기 E형 간염 Orf3 폴리펩티드는 실질적으로 서열번호 328에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 E형 간염 Orf3 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 329로 제공된다:
ATGGGCAGCAGACCTTGTGCTCTGGGCCTGTTCTGCTGCTGCAGCTCCTGCTTCTGCCTGTGCTGCCCTAGACACAGACCCGTGTCTAGACTGGCCGCTGTTGTTGGCGGAGCTGCTGCTGTTCCAGCTGTGGTGTCTGGCGTGACAGGCCTGATTCTGAGCCCTTCTCAGAGCCCCATCTTCATCCAGCCTACACCTAGTCCTCCAATGAGCCCTCTGAGGCCTGGACTGGATCTGGTGTTCGCCAATCCTCCTGATCACTCTGCCCCTCTGGGCGTGACAAGACCTTCTGCTCCTCCTCTGCCACACGTGGTGGATCTGCCTCAACTGGGCCCTAGAAGA [서열번호 329]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 329에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 329의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 330으로 제공된다:
AUGGGCAGCAGACCUUGUGCUCUGGGCCUGUUCUGCUGCUGCAGCUCCUGCUUCUGCCUGUGCUGCCCUAGACACAGACCCGUGUCUAGACUGGCCGCUGUUGUUGGCGGAGCUGCUGCUGUUCCAGCUGUGGUGUCUGGCGUGACAGGCCUGAUUCUGAGCCCUUCUCAGAGCCCCAUCUUCAUCCAGCCUACACCUAGUCCUCCAAUGAGCCCUCUGAGGCCUGGACUGGAUCUGGUGUUCGCCAAUCCUCCUGAUCACUCUGCCCCUCUGGGCGUGACAAGACCUUCUGCUCCUCCUCUGCCACACGUGGUGGAUCUGCCUCAACUGGGCCCUAGAAGA [서열번호 330]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 330에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 로타바이러스 NSP1(Q99FX5; 비-구조 단백질 1 로타바이러스 A(RVA/SA11-4F/G3P6[1]) 바이러스주), 또는 그의 동원체이다. [Barro M, Patton JT (2007) Rotavirus NSP1 inhibits expression of type 1 interferon by antagonising the function of interferon regulatory factors IRF3, IRF5 and IRF7. J Virol, 81, 9, 4473-4481]. 상기 IIP는 IRF7의 분해를 유도하는 것으로 여겨진다. 로타바이러스 NSP1의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 331로 나타낸다:
MATFKDACFHYRRLTALNRRLCNIGANSICMPVPDAKIKGWCLECCQIADLTHCYGCSLPHVCKWCVQNRRCFLDNEPHLLKLRTVKHPITKDKLQCIIDLYNIIFPINDKVIRKFERMIKQRKCRNQYKIEWYNHLLLPITLNAAAFKFDENNLYYVFGLYEKSVSDIYAPYRIVNFINEFDKLLLDDINFTRMSNLPIELRNHYAKKYFQLSRLPSSKLKQIYFSDFTKETVIFNTYTKTPGRSIYRNVTEFNWRDELELYSDLKNDKNKLIAAMMTSKYTRFYAHDNNFGRLKMTIFELGHHCQPNYVASNHPGNASDIQYCKWCNIKYFLSKIDWRIRDMYNLLMEFIKDCYKSNVNVGHCSSVENIYPLIKRLIWSLFTNHMDQTIEEVFNHMSPVSVEGTNVIMLILGLNISLYNEIKRTLNVDSIPMVLNLNEFSSIVKSISSKWYNVDELDKLPMSIKSTEELIEMKNSGTLTEEFELLISNSEDDNE [서열번호 331]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 331에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 로타바이러스 NSP1 폴리펩티드는 다음과 같은 서열번호 332의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGCTACTTTTAAAGATGCATGCTTTCATTATCGTAGATTAACTGCTTTAAATCGGAGATTATGCAACATTGGTGCAAATTCTATTTGCATGCCAGTTCCTGATGCGAAGATTAAGGGGTGGTGTTTAGAATGTTGTCAAATAGCTGATTTAACCCATTGTTATGGTTGCTCATTGCCGCATGTTTGCAAATGGTGTGTTCAGAACAGAAGATGCTTCCTTGACAATGAACCTCATTTGCTTAAGCTTAGAACTGTGAAACATCCAATTACCAAAGACAAATTACAGTGTATCATAGACTTGTACAATATAATATTTCCAATTAATGATAAAGTAATTAGAAAATTTGAAAGAATGATAAAGCAAAGAAAATGTAGGAATCAATATAAAATTGAATGGTATAATCATTTGCTGCTCCCAATTACATTAAATGCTGCTGCATTTAAGTTTGATGAAAATAATCTTTATTATGTTTTTGGGTTATATGAGAAATCAGTCAGTGATATATATGCTCCATATAGAATTGTTAACTTTATAAATGAATTTGATAAATTATTGCTTGATGATATTAACTTTACAAGAATGTCCAATCTACCAATAGAGTTGAGAAACCATTATGCAAAGAAATACTTCCAATTATCAAGACTGCCATCATCAAAACTAAAGCAAATTTACTTTTCAGATTTTACTAAAGAAACTGTGATTTTTAATACTTATACAAAAACGCCAGGAAGATCAATATACAGAAATGTAACTGAATTTAATTGGAGAGATGAATTGGAGCTTTATTCTGATTTAAAAAATGATAAGAATAAATTAATTGCTGCAATGATGACGAGTAAGTATACTCGGTTCTATGCTCATGATAATAATTTTGGAAGGTTGAAAATGACAATATTTGAGTTGGGACATCATTGTCAGCCTAACTACGTGGCATCTAATCACCCAGGCAATGCTTCCGATATCCAGTACTGTAAATGGTGTAATATAAAATATTTTCTTAGTAAAATTGATTGGCGGATTCGTGATATGTATAATTTATTGATGGAATTTATTAAGGATTGTTATAAAAGTAATGTTAACGTTGGACATTGTAGTTCTGTTGAAAACATATATCCTTTAATTAAAAGATTAATTTGGAGTTTGTTTACTAATCACATGGATCAAACAATTGAAGAAGTGTTTAATCACATGTCGCCAGTGTCAGTTGAAGGTACGAATGTCATCATGTTGATTCTTGGATTGAATATTAGTTTGTATAATGAAATTAAGCGCACTTTGAATGTAGATAGCATACCAATGGTACTTAATTTAAATGAATTCAGTAGTATAGTTAAATCAATTAGCAGTAAATGGTATAATGTTGATGAATTGGATAAATTGCCAATGTCAATAAAATCAACGGAGGAACTGATTGAAATGAAGAATTCTGGAACTTTAACTGAAGAATTTGAGCTACTGATCTCCAACTCAGAAGATGACAATGAG [서열번호 332]
따라서, 바람직하게는 상기 로타바이러스 NSP1 폴리펩티드는 실질적으로 서열번호 332에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 로타바이러스 NSP1 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 333으로 제공된다:
ATGGCCACCTTCAAGGACGCCTGCTTCCACTACAGACGGCTGACAGCCCTGAATCGGCGGCTGTGTAATATCGGCGCCAACAGCATCTGCATGCCCGTGCCTGACGCCAAGATCAAAGGCTGGTGCCTGGAATGCTGCCAGATCGCCGATCTCACCCACTGCTACGGCTGTTCTCTGCCCCATGTGTGCAAGTGGTGCGTGCAGAACAGACGGTGCTTCCTGGACAACGAGCCCCATCTGCTGAAGCTGAGAACCGTGAAGCACCCCATCACCAAGGACAAGCTGCAGTGCATCATCGACCTGTACAACATCATCTTCCCCATCAACGACAAAGTGATCCGGAAGTTCGAGCGGATGATCAAGCAGCGGAAGTGCCGGAACCAGTACAAGATCGAGTGGTACAATCATCTGCTGCTGCCCATCACACTGAACGCCGCTGCCTTCAAGTTCGACGAGAACAACCTGTACTACGTGTTCGGCCTGTACGAGAAGTCCGTGTCCGACATCTACGCCCCTTACCGGATCGTGAACTTCATCAACGAGTTCGATAAGCTGCTGCTGGACGACATCAACTTCACCCGGATGAGCAACCTGCCTATCGAGCTGAGAAACCACTACGCCAAGAAGTACTTTCAGCTGAGCAGACTGCCCAGCAGCAAGCTGAAGCAGATCTACTTCTCCGACTTCACCAAAGAAACCGTGATCTTCAACACCTACACCAAGACACCCGGCAGATCCATCTACCGGAACGTGACCGAGTTCAACTGGCGGGACGAGCTGGAACTGTACAGCGACCTGAAGAACGACAAGAACAAGCTGATCGCCGCCATGATGACCAGCAAGTACACCCGGTTCTACGCCCACGACAACAATTTCGGCCGGCTGAAGATGACCATCTTCGAGCTGGGCCACCACTGCCAGCCTAATTACGTGGCCTCTAATCACCCCGGCAACGCCAGCGATATCCAGTACTGCAAATGGTGCAATATCAAGTACTTCCTGAGCAAGATCGACTGGCGGATCCGGGACATGTACAACCTGCTGATGGAATTCATCAAGGACTGCTACAAGAGCAACGTGAACGTGGGCCACTGCAGCAGCGTCGAGAACATCTACCCTCTGATCAAGCGGCTGATCTGGTCCCTGTTCACCAACCACATGGACCAGACCATCGAAGAGGTGTTCAATCACATGAGCCCCGTGTCCGTGGAAGGCACCAACGTGATCATGCTGATCCTGGGCCTGAACATCAGCCTGTACAATGAGATCAAGCGCACCCTGAACGTGGACAGCATCCCCATGGTGCTGAACCTGAACGAGTTCAGCAGCATCGTGAAGTCCATCTCCAGCAAGTGGTATAACGTGGACGAACTGGACAAACTGCCCATGAGCATCAAGTCCACCGAGGAACTGATCGAGATGAAGAACAGCGGCACCCTGACCGAGGAATTCGAGCTGCTGATCTCCAACAGCGAGGACGACAACGAG [서열번호 333]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 333에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 333의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 334로 제공된다:
AUGGCCACCUUCAAGGACGCCUGCUUCCACUACAGACGGCUGACAGCCCUGAAUCGGCGGCUGUGUAAUAUCGGCGCCAACAGCAUCUGCAUGCCCGUGCCUGACGCCAAGAUCAAAGGCUGGUGCCUGGAAUGCUGCCAGAUCGCCGAUCUCACCCACUGCUACGGCUGUUCUCUGCCCCAUGUGUGCAAGUGGUGCGUGCAGAACAGACGGUGCUUCCUGGACAACGAGCCCCAUCUGCUGAAGCUGAGAACCGUGAAGCACCCCAUCACCAAGGACAAGCUGCAGUGCAUCAUCGACCUGUACAACAUCAUCUUCCCCAUCAACGACAAAGUGAUCCGGAAGUUCGAGCGGAUGAUCAAGCAGCGGAAGUGCCGGAACCAGUACAAGAUCGAGUGGUACAAUCAUCUGCUGCUGCCCAUCACACUGAACGCCGCUGCCUUCAAGUUCGACGAGAACAACCUGUACUACGUGUUCGGCCUGUACGAGAAGUCCGUGUCCGACAUCUACGCCCCUUACCGGAUCGUGAACUUCAUCAACGAGUUCGAUAAGCUGCUGCUGGACGACAUCAACUUCACCCGGAUGAGCAACCUGCCUAUCGAGCUGAGAAACCACUACGCCAAGAAGUACUUUCAGCUGAGCAGACUGCCCAGCAGCAAGCUGAAGCAGAUCUACUUCUCCGACUUCACCAAAGAAACCGUGAUCUUCAACACCUACACCAAGACACCCGGCAGAUCCAUCUACCGGAACGUGACCGAGUUCAACUGGCGGGACGAGCUGGAACUGUACAGCGACCUGAAGAACGACAAGAACAAGCUGAUCGCCGCCAUGAUGACCAGCAAGUACACCCGGUUCUACGCCCACGACAACAAUUUCGGCCGGCUGAAGAUGACCAUCUUCGAGCUGGGCCACCACUGCCAGCCUAAUUACGUGGCCUCUAAUCACCCCGGCAACGCCAGCGAUAUCCAGUACUGCAAAUGGUGCAAUAUCAAGUACUUCCUGAGCAAGAUCGACUGGCGGAUCCGGGACAUGUACAACCUGCUGAUGGAAUUCAUCAAGGACUGCUACAAGAGCAACGUGAACGUGGGCCACUGCAGCAGCGUCGAGAACAUCUACCCUCUGAUCAAGCGGCUGAUCUGGUCCCUGUUCACCAACCACAUGGACCAGACCAUCGAAGAGGUGUUCAAUCACAUGAGCCCCGUGUCCGUGGAAGGCACCAACGUGAUCAUGCUGAUCCUGGGCCUGAACAUCAGCCUGUACAAUGAGAUCAAGCGCACCCUGAACGUGGACAGCAUCCCCAUGGUGCUGAACCUGAACGAGUUCAGCAGCAUCGUGAAGUCCAUCUCCAGCAAGUGGUAUAACGUGGACGAACUGGACAAACUGCCCAUGAGCAUCAAGUCCACCGAGGAACUGAUCGAGAUGAAGAACAGCGGCACCCUGACCGAGGAAUUCGAGCUGCUGAUCUCCAACAGCGAGGACGACAACGAG [서열번호 334]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 334에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 KSHV ORF45(Q77UV9; HHV8 ORF 45 인간 헤르페스바이러스 8 OX), 또는 그의 동원체이다. KSHV ORF45의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 335로 나타낸다:
MAMFVRTSSSTHDEERMLPIEGAPRRRPPVKFIFPPPPLSSLPGFGRPRGYAGPTVIDMSAPDDVFAEDTPSPPATPLDLQISPDQSSGESEYDEDEEDEDEEENDDVQEEDEPEGYPADFFQPLSHLRPRPLARRAHTPKPVAVVAGRVRSSTDTAESEASMGWVSQDDGFSPAGLSPSDDEGVAILEPMAAYTGTGAYGLSPASRNSVPGTQSSPYSDPDEGPSWRPLRAAPTAIVDLTSDSDSDDSSNSPDVNNEAAFTDARHFSHQPPSSEEDGEDQGEVLSQRIGLMDVGQKRKRQSTASSGSEDVVRCQRQPNLSRKAVASVIIISSGSDTDEEPSSAVSVIVSPSSTKGHLPTQSPSTSAHSISSGSTTTAGSRCSDPTRILASTPPLCGNGAYNWPWLD [서열번호 335]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 335에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 KSHV ORF45 폴리펩티드는 다음과 같은 서열번호 336의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGCGATGTTTGTGAGGACCTCGTCTAGCACACACGATGAAGAGAGAATGCTTCCAATTGAAGGAGCGCCTCGCAGACGACCCCCCGTGAAGTTCATATTCCCACCTCCACCTCTTTCATCACTTCCAGGATTTGGCAGGCCGCGCGGCTATGCTGGACCCACGGTGATAGATATGTCTGCCCCAGACGACGTCTTCGCCGAGGACACGCCATCGCCGCCAGCAACCCCTCTGGATCTACAGATATCCCCGGATCAGTCGAGCGGCGAATCTGAATATGACGAGGATGAGGAAGATGAAGATGAAGAAGAAAATGACGATGTTCAGGAGGAAGACGAGCCAGAGGGGTACCCTGCAGACTTTTTTCAACCTTTATCTCACTTGCGCCCGAGGCCTCTGGCCAGACGGGCCCATACGCCCAAACCGGTAGCAGTGGTAGCGGGCCGCGTGCGCAGTTCAACGGACACGGCGGAGTCCGAGGCGTCCATGGGATGGGTTAGTCAGGATGACGGATTTTCCCCTGCTGGGCTCTCACCTTCAGACGACGAGGGGGTTGCTATCCTGGAACCGATGGCGGCATACACTGGGACCGGGGCATACGGACTTTCACCTGCTTCCAGAAATAGTGTACCTGGAACACAAAGTTCACCATACAGCGACCCTGATGAAGGGCCCTCGTGGCGCCCCCTGCGCGCCGCACCCACCGCGATCGTCGACCTGACATCGGACTCTGATAGCGATGACAGTTCCAACTCTCCGGACGTGAACAATGAGGCCGCGTTTACCGACGCGCGCCATTTTTCCCACCAGCCACCCTCGTCCGAGGAGGACGGAGAAGACCAAGGGGAAGTATTGAGTCAGAGAATCGGGCTCATGGACGTGGGCCAGAAGCGCAAAAGGCAGTCTACCGCCTCCTCTGGTAGCGAGGATGTGGTGCGCTGCCAGAGACAACCAAACTTAAGCCGCAAAGCAGTGGCGTCTGTGATAATTATATCCTCGGGGAGTGACACAGACGAGGAGCCCTCGTCCGCCGTGAGCGTGATCGTGTCTCCGTCGAGCACAAAGGGTCACCTCCCAACCCAATCTCCCAGTACTTCCGCCCACTCGATTTCATCAGGAAGCACAACTACCGCGGGGTCCAGGTGCAGCGACCCAACCCGCATCCTGGCCTCCACGCCACCCCTGTGTGGAAACGGTGCATATAACTGGCCGTGGCTGGAC [서열번호 336]
따라서, 바람직하게는 상기 KSHV ORF45 폴리펩티드는 실질적으로 서열번호 336에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 KSHV ORF45 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 337로 제공된다:
ATGGCCATGTTTGTGCGGACCAGCAGCAGCACCCACGACGAGGAAAGAATGCTGCCTATCGAGGGCGCTCCTCGGAGAAGGCCTCCTGTGAAGTTCATCTTCCCACCTCCACCACTGAGCAGCCTGCCTGGATTTGGCAGACCTAGAGGCTACGCCGGACCTACCGTGATCGATATGAGCGCCCCTGACGATGTGTTCGCCGAGGATACACCTTCTCCACCAGCCACACCTCTGGACCTGCAGATCAGCCCTGATCAGTCTAGCGGCGAGAGCGAGTACGATGAGGACGAAGAGGACGAGGATGAGGAAGAGAACGACGACGTCCAAGAGGAAGATGAGCCCGAGGGCTACCCCGCCGATTTCTTTCAGCCTCTGTCTCACCTGAGGCCTCGGCCTCTTGCTAGAAGGGCCCACACACCTAAACCTGTGGCTGTGGTGGCCGGAAGAGTGCGGTCTAGCACAGATACAGCCGAGTCCGAAGCCAGCATGGGATGGGTGTCACAGGACGATGGATTCAGCCCTGCCGGACTGAGCCCTTCCGATGATGAAGGCGTGGCCATCCTGGAACCTATGGCCGCCTATACTGGCACAGGCGCCTATGGACTGTCTCCCGCCAGCAGAAATAGCGTGCCAGGCACACAGAGCAGCCCCTACTCTGATCCTGATGAGGGCCCATCTTGGAGGCCCCTTAGAGCTGCTCCTACCGCCATCGTGGATCTGACCAGCGACAGCGATAGCGACGACAGCAGCAATAGCCCCGACGTGAACAATGAGGCCGCCTTCACAGACGCCCGGCACTTTTCTCATCAGCCTCCAAGCAGCGAAGAGGATGGCGAGGATCAGGGCGAAGTGCTGTCTCAGAGAATCGGCCTGATGGACGTGGGCCAGAAGCGGAAGAGACAGAGCACAGCCAGCAGCGGCTCTGAGGATGTCGTCAGATGCCAGAGACAGCCCAACCTGAGCAGAAAGGCCGTGGCCAGCGTGATCATCATCAGCTCTGGCAGCGACACCGATGAGGAACCTAGCTCTGCCGTGTCCGTGATCGTGTCTCCTAGCAGCACCAAGGGCCATCTGCCTACACAGAGCCCTAGCACAAGCGCCCACTCTATCTCTAGCGGCAGCACAACAACAGCCGGCAGCAGATGCAGCGACCCCACAAGAATTCTGGCCAGCACACCTCCTCTGTGCGGCAACGGCGCTTACAATTGGCCTTGGCTGGAT [서열번호 337]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 337에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 337의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 338로 제공된다:
AUGGCCAUGUUUGUGCGGACCAGCAGCAGCACCCACGACGAGGAAAGAAUGCUGCCUAUCGAGGGCGCUCCUCGGAGAAGGCCUCCUGUGAAGUUCAUCUUCCCACCUCCACCACUGAGCAGCCUGCCUGGAUUUGGCAGACCUAGAGGCUACGCCGGACCUACCGUGAUCGAUAUGAGCGCCCCUGACGAUGUGUUCGCCGAGGAUACACCUUCUCCACCAGCCACACCUCUGGACCUGCAGAUCAGCCCUGAUCAGUCUAGCGGCGAGAGCGAGUACGAUGAGGACGAAGAGGACGAGGAUGAGGAAGAGAACGACGACGUCCAAGAGGAAGAUGAGCCCGAGGGCUACCCCGCCGAUUUCUUUCAGCCUCUGUCUCACCUGAGGCCUCGGCCUCUUGCUAGAAGGGCCCACACACCUAAACCUGUGGCUGUGGUGGCCGGAAGAGUGCGGUCUAGCACAGAUACAGCCGAGUCCGAAGCCAGCAUGGGAUGGGUGUCACAGGACGAUGGAUUCAGCCCUGCCGGACUGAGCCCUUCCGAUGAUGAAGGCGUGGCCAUCCUGGAACCUAUGGCCGCCUAUACUGGCACAGGCGCCUAUGGACUGUCUCCCGCCAGCAGAAAUAGCGUGCCAGGCACACAGAGCAGCCCCUACUCUGAUCCUGAUGAGGGCCCAUCUUGGAGGCCCCUUAGAGCUGCUCCUACCGCCAUCGUGGAUCUGACCAGCGACAGCGAUAGCGACGACAGCAGCAAUAGCCCCGACGUGAACAAUGAGGCCGCCUUCACAGACGCCCGGCACUUUUCUCAUCAGCCUCCAAGCAGCGAAGAGGAUGGCGAGGAUCAGGGCGAAGUGCUGUCUCAGAGAAUCGGCCUGAUGGACGUGGGCCAGAAGCGGAAGAGACAGAGCACAGCCAGCAGCGGCUCUGAGGAUGUCGUCAGAUGCCAGAGACAGCCCAACCUGAGCAGAAAGGCCGUGGCCAGCGUGAUCAUCAUCAGCUCUGGCAGCGACACCGAUGAGGAACCUAGCUCUGCCGUGUCCGUGAUCGUGUCUCCUAGCAGCACCAAGGGCCAUCUGCCUACACAGAGCCCUAGCACAAGCGCCCACUCUAUCUCUAGCGGCAGCACAACAACAGCCGGCAGCAGAUGCAGCGACCCCACAAGAAUUCUGGCCAGCACACCUCCUCUGUGCGGCAACGGCGCUUACAAUUGGCCUUGGCUGGAU [서열번호 338]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 338에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 EBV BZLF-1(P03206; 트랜스-활성화제(Trans-activator) 단백질 BZLF1 엡스타인-바 바이러스(Epstein-Barr virus)(B95-8 바이러스주)), 또는 그의 동원체이다. [Hahn AM, Huye LE, Ning S, Webster-Cyriaque JM Pagano JS (2005) Interferon Regulatory Factor 7 Is Negatively Regulated by the Epstein-Barr Virus Immediate-Early Gene, J Virol, 79, 15, 10040-10052 doi:10.1128/JVI.79.15.10040-10052.2005]. EBV BZLF-1의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 339로 나타낸다:
MMDPNSTSEDVKFTPDPYQVPFVQAFDQATRVYQDLGGPSQAPLPCVLWPVLPEPLPQGQLTAYHVSTAPTGSWFSAPQPAPENAYQAYAAPQLFPVSDITQNQQTNQAGGEAPQPGDNSTVQTAAAVVFACPGANQGQQLADIGVPQPAPVAAPARRTRKPQQPESLEECDSELEIKRYKNRVASRKCRAKFKQLLQHYREVAAAKSSENDRLRLLLKQMCPSLDVDSIIPRTPDVLHEDLLNF [서열번호 339]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 339에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 EBV BZLF-1 폴리펩티드는 다음과 같은 서열번호 340의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGATGGACCCAAACTCGACTTCTGAAGATGTAAAATTTACACCTGACCCATACCAGGTGCCTTTTGTACAAGCTTTTGACCAAGCTACCAGAGTCTATCAGGACCTGGGAGGGCCATCGCAAGCTCCTTTGCCTTGTGTGCTGTGGCCGGTGCTGCCAGAGCCTCTGCCACAAGGCCAGCTAACTGCCTATCATGTTTCAACCGCTCCGACTGGGTCGTGGTTTTCTGCCCCTCAGCCTGCTCCTGAGAATGCTTATCAAGCTTATGCAGCACCTCAGCTGTTCCCAGTCTCCGACATAACCCAGAATCAACAGACTAACCAAGCCGGGGGAGAAGCACCTCAACCTGGAGACAATTCTACTGTTCAAACAGCAGCAGCAGTGGTGTTTGCTTGCCCCGGGGCTAACCAAGGACAACAGCTAGCAGACATTGGTGTTCCACAGCCTGCACCAGTGGCTGCCCCGGCACGACGCACACGGAAACCACAACAGCCAGAATCGCTGGAGGAATGCGATTCTGAACTAGAAATAAAGCGATACAAGAATCGGGTGGCTTCCAGAAAATGCCGGGCCAAGTTTAAGCAACTGCTGCAGCACTACCGTGAGGTCGCTGCTGCCAAATCATCTGAAAATGACAGGCTGCGCCTCCTGTTGAAGCAGATGTGCCCAAGCCTGGATGTTGACTCCATTATCCCCCGGACACCAGATGTTTTACACGAGGATCTCTTAAATTTC [서열번호 340]
따라서, 바람직하게는 상기 EBV BZLF-1 폴리펩티드는 실질적으로 서열번호 340에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 EBV BZLF-1 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 341로 제공된다:
ATGATGGACCCCAACAGCACCAGCGAGGACGTGAAGTTCACCCCTGATCCTTACCAGGTGCCATTCGTGCAGGCCTTCGATCAGGCCACCAGAGTGTACCAGGATCTCGGCGGACCTTCTCAGGCTCCTCTGCCTTGTGTTCTGTGGCCTGTGCTGCCTGAACCTCTGCCTCAGGGACAGCTGACAGCCTACCATGTGTCTACAGCCCCTACCGGCAGCTGGTTTTCTGCTCCTCAACCTGCTCCTGAGAACGCCTACCAGGCCTATGCTGCCCCTCAGCTGTTTCCCGTGTCCGACATCACCCAGAACCAGCAGACAAATCAGGCTGGCGGAGAAGCTCCTCAGCCTGGCGATAATAGCACCGTGCAGACAGCTGCCGCCGTGGTGTTTGCTTGTCCTGGCGCTAATCAGGGCCAGCAGCTGGCTGATATTGGCGTGCCACAACCAGCTCCAGTGGCCGCTCCTGCCAGAAGAACAAGAAAGCCTCAGCAGCCCGAGAGCCTGGAAGAGTGCGATAGCGAGCTGGAAATCAAGCGGTACAAGAACAGAGTGGCCAGCCGGAAGTGCCGGGCCAAGTTTAAACAGCTGCTCCAGCACTACAGAGAGGTGGCCGCTGCCAAGAGCAGCGAGAACGATAGACTGCGGCTGCTGCTGAAGCAGATGTGCCCTAGCCTGGACGTGGACAGCATCATCCCCAGAACACCCGATGTGCTGCACGAGGACCTGCTGAACTTT [서열번호 341]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 341에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 341의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 342로 제공된다:
AUGAUGGACCCCAACAGCACCAGCGAGGACGUGAAGUUCACCCCUGAUCCUUACCAGGUGCCAUUCGUGCAGGCCUUCGAUCAGGCCACCAGAGUGUACCAGGAUCUCGGCGGACCUUCUCAGGCUCCUCUGCCUUGUGUUCUGUGGCCUGUGCUGCCUGAACCUCUGCCUCAGGGACAGCUGACAGCCUACCAUGUGUCUACAGCCCCUACCGGCAGCUGGUUUUCUGCUCCUCAACCUGCUCCUGAGAACGCCUACCAGGCCUAUGCUGCCCCUCAGCUGUUUCCCGUGUCCGACAUCACCCAGAACCAGCAGACAAAUCAGGCUGGCGGAGAAGCUCCUCAGCCUGGCGAUAAUAGCACCGUGCAGACAGCUGCCGCCGUGGUGUUUGCUUGUCCUGGCGCUAAUCAGGGCCAGCAGCUGGCUGAUAUUGGCGUGCCACAACCAGCUCCAGUGGCCGCUCCUGCCAGAAGAACAAGAAAGCCUCAGCAGCCCGAGAGCCUGGAAGAGUGCGAUAGCGAGCUGGAAAUCAAGCGGUACAAGAACAGAGUGGCCAGCCGGAAGUGCCGGGCCAAGUUUAAACAGCUGCUCCAGCACUACAGAGAGGUGGCCGCUGCCAAGAGCAGCGAGAACGAUAGACUGCGGCUGCUGCUGAAGCAGAUGUGCCCUAGCCUGGACGUGGACAGCAUCAUCCCCAGAACACCCGAUGUGCUGCACGAGGACCUGCUGAACUUU [서열번호 342]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 342에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 MuHV Orf73(O41974; MHV68 ORF73 단백질 뮤린 헤르페스바이러스 4), 또는 그의 동원체이다. MuHV Orf73의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 343으로 나타낸다:
MPTSPPTTRNTTSGKTRSGCKRRCFNKPAAMPPKRRRAPKRPAPPPPPGCQGDEESSQGTQTPNPPSPPVPPSSPTLPSSPVPPSSPVHEPPSPSPPPAPPSPDVDVEGLDVGETDDPGPPPPKRYSRYQKPHNPSDPLPKKYQGMRRHLQVTAPRLFDPEGHPPTHFKSAVMFSSTHPYTLNKLHKCIQSKHVLSTPVSCLPLVPGTTQQCVTYYLLSFVEDKKQAKKLKRVVLAYCEKYHSSVEGTIVKAKPYFPLPEPPTEPPTDPEQPSTSTQASGTQHGPTASLDAGAEQGATGSPGSSPGQQGQGSQT [서열번호 343]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 343에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 MuHV Orf73 폴리펩티드는 다음과 같은 서열번호 344의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGCCCACATCCCCACCGACTACACGCAACACAACCTCAGGCAAAACCAGATCAGGGTGCAAACGTAGGTGCTTCAACAAACCAGCAGCCATGCCTCCTAAAAGACGCCGCGCTCCAAAAAGACCAGCCCCTCCTCCACCACCGGGATGCCAAGGTGATGAGGAGTCCAGCCAGGGAACTCAAACGCCAAACCCCCCATCACCACCAGTGCCCCCTTCATCACCAACACTTCCCTCATCCCCCGTCCCTCCTTCATCACCAGTACATGAGCCACCATCTCCTTCCCCCCCACCAGCCCCACCATCACCAGATGTTGATGTTGAAGGTTTAGATGTAGGAGAGACAGACGATCCCGGTCCCCCTCCACCAAAAAGATACTCCAGGTATCAAAAACCGCATAATCCATCTGATCCATTGCCTAAAAAATATCAGGGAATGCGAAGACACCTGCAGGTGACAGCACCCAGGTTATTTGATCCCGAGGGTCACCCCCCAACACATTTTAAGTCAGCTGTTATGTTTAGTAGCACACATCCCTACACTTTGAATAAACTTCACAAGTGTATCCAAAGCAAACATGTACTCTCAACACCAGTTAGCTGTTTACCCTTGGTACCAGGCACAACACAACAGTGTGTAACATACTATTTACTTTCATTTGTTGAAGACAAGAAACAGGCCAAAAAACTAAAAAGGGTTGTCTTGGCCTACTGTGAAAAATACCACAGCAGCGTAGAAGGTACTATAGTCAAGGCAAAGCCTTATTTTCCCTTACCAGAGCCCCCTACAGAGCCCCCTACAGACCCCGAGCAGCCATCCACAAGTACACAAGCTTCTGGCACACAACATGGTCCCACAGCATCTCTGGATGCCGGTGCAGAGCAAGGTGCCACAGGATCACCTGGATCTAGTCCAGGACAACAGGGACAAGGGTCTCAGACA [서열번호 344]
따라서, 바람직하게는 상기 MuHV Orf73 폴리펩티드는 실질적으로 서열번호 344에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 MuHV Orf73 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 345로 제공된다:
ATGCCTACAAGCCCTCCTACCACCAGAAACACCACCAGCGGCAAGACAAGAAGCGGCTGCAAGCGGCGGTGCTTCAACAAACCTGCTGCCATGCCTCCTAAGCGGCGGAGAGCACCTAAAAGACCTGCTCCTCCTCCACCTCCTGGTTGCCAAGGCGACGAGGAATCTTCTCAGGGCACCCAGACACCTAATCCTCCATCTCCACCTGTGCCTCCAAGCAGCCCTACACTGCCATCTTCTCCAGTGCCACCTAGCAGCCCAGTGCACGAACCACCTAGTCCAAGTCCTCCACCAGCTCCACCTTCTCCAGACGTGGACGTGGAAGGACTGGATGTGGGCGAGACAGACGATCCTGGACCTCCACCACCTAAGCGGTACAGCAGATACCAGAAGCCTCACAACCCCAGCGATCCTCTGCCTAAGAAATACCAGGGCATGCGCCGGCATCTGCAAGTGACAGCCCCTAGACTGTTCGACCCTGAGGGACACCCTCCTACACACTTCAAGAGCGCCGTGATGTTCAGCAGCACACACCCCTACACTCTGAACAAGCTGCACAAGTGCATCCAGAGCAAACACGTGCTGAGCACCCCTGTGTCCTGTCTGCCTCTGGTGCCTGGAACCACACAGCAGTGCGTGACCTACTACCTGCTGAGCTTCGTGGAAGATAAGAAGCAGGCCAAGAAACTGAAGAGAGTGGTGCTGGCCTACTGCGAGAAGTACCACAGCAGCGTGGAAGGCACCATCGTGAAGGCCAAGCCTTACTTCCCACTGCCTGAGCCTCCAACCGAGCCACCTACAGATCCTGAGCAGCCTAGCACAAGCACACAGGCCTCTGGAACACAGCACGGACCTACAGCTAGTCTGGATGCTGGTGCTGAACAGGGCGCCACAGGATCACCTGGAAGTAGCCCTGGACAGCAAGGCCAGGGATCTCAGACA [서열번호 345]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 345에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 345의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 346으로 제공된다:
AUGCCUACAAGCCCUCCUACCACCAGAAACACCACCAGCGGCAAGACAAGAAGCGGCUGCAAGCGGCGGUGCUUCAACAAACCUGCUGCCAUGCCUCCUAAGCGGCGGAGAGCACCUAAAAGACCUGCUCCUCCUCCACCUCCUGGUUGCCAAGGCGACGAGGAAUCUUCUCAGGGCACCCAGACACCUAAUCCUCCAUCUCCACCUGUGCCUCCAAGCAGCCCUACACUGCCAUCUUCUCCAGUGCCACCUAGCAGCCCAGUGCACGAACCACCUAGUCCAAGUCCUCCACCAGCUCCACCUUCUCCAGACGUGGACGUGGAAGGACUGGAUGUGGGCGAGACAGACGAUCCUGGACCUCCACCACCUAAGCGGUACAGCAGAUACCAGAAGCCUCACAACCCCAGCGAUCCUCUGCCUAAGAAAUACCAGGGCAUGCGCCGGCAUCUGCAAGUGACAGCCCCUAGACUGUUCGACCCUGAGGGACACCCUCCUACACACUUCAAGAGCGCCGUGAUGUUCAGCAGCACACACCCCUACACUCUGAACAAGCUGCACAAGUGCAUCCAGAGCAAACACGUGCUGAGCACCCCUGUGUCCUGUCUGCCUCUGGUGCCUGGAACCACACAGCAGUGCGUGACCUACUACCUGCUGAGCUUCGUGGAAGAUAAGAAGCAGGCCAAGAAACUGAAGAGAGUGGUGCUGGCCUACUGCGAGAAGUACCACAGCAGCGUGGAAGGCACCAUCGUGAAGGCCAAGCCUUACUUCCCACUGCCUGAGCCUCCAACCGAGCCACCUACAGAUCCUGAGCAGCCUAGCACAAGCACACAGGCCUCUGGAACACAGCACGGACCUACAGCUAGUCUGGAUGCUGGUGCUGAACAGGGCGCCACAGGAUCACCUGGAAGUAGCCCUGGACAGCAAGGCCAGGGAUCUCAGACA [서열번호 346]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 346에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 토크 테노 바이러스 Orf2(A7XCD9; ORF2 단백질 토크 테노 바이러스(인간/핀란드/Hel32/2002 단리물)), 또는 그의 동원체이다. [Zheng H, Ye L, Fang X, Li B, Wang Y, Xiang X, Kong L, Wang W et al. (2007) Torque teno virus (SANBAN isolate) ORF2 protein suppresses NF-kB pathways via interaction with IkappaB kinases. J Virol, 81, 21, 11917-11924]. 상기 IIP는 정규적 및 비-정규적 Nf-KB 경로를 저해하는 것으로 여겨진다. 토크 테노 바이러스 Orf2의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 347로 나타낸다:
MWQPPTQNGTQLERHWFESVWRSHAAFCSCGDCIGHLQHLATNLGRPPAPQPPRDQHPPHIRGLPALPAPPSNRNSWPGTGGDAAGGEAGGSRGAGDGGDGELADEDLLDAIALAAE [서열번호 347]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 347에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 토크 테노 바이러스 Orf2 폴리펩티드는 다음과 같은 서열번호 348의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGTGGCAGCCACCTACCCAGAATGGAACCCAACTCGAACGGCACTGGTTCGAGTCCGTTTGGCGTTCGCATGCTGCCTTTTGTAGCTGTGGCGACTGTATTGGCCATCTTCAGCATCTGGCTACTAACCTGGGTCGACCACCTGCTCCACAACCGCCGCGAGACCAACACCCACCGCACATAAGAGGGCTCCCGGCACTCCCGGCACCTCCCAGTAACAGAAACTCATGGCCTGGTACTGGTGGAGACGCCGCCGGAGGAGAGGCTGGTGGAAGCCGAGGCGCAGGAGATGGAGGAGACGGAGAGCTCGCAGACGAGGACCTGCTAGACGCCATCGCGCTCGCCGCAGAG [서열번호 348]
따라서, 바람직하게는 상기 토크 테노 바이러스 Orf2 폴리펩티드는 실질적으로 서열번호 348에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 토크 테노 바이러스 Orf2 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 349로 제공된다:
ATGTGGCAGCCTCCTACACAGAATGGCACCCAGCTGGAACGGCATTGGTTCGAGAGCGTTTGGAGAAGCCACGCCGCTTTCTGCAGCTGCGGAGATTGCATCGGACATCTGCAGCACCTGGCCACCAATCTGGGTAGACCTCCAGCTCCTCAGCCTCCTCGAGATCAGCACCCTCCTCACATCAGAGGACTGCCTGCACTTCCTGCTCCTCCAAGCAACAGAAACAGCTGGCCTGGCACAGGCGGAGATGCTGCTGGCGGAGAAGCTGGTGGATCTAGAGGTGCCGGCGACGGTGGCGACGGCGAACTTGCTGATGAAGATCTGCTGGACGCTATCGCCCTGGCCGCTGAA [서열번호 349]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 349에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 349의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 350으로 제공된다:
AUGUGGCAGCCUCCUACACAGAAUGGCACCCAGCUGGAACGGCAUUGGUUCGAGAGCGUUUGGAGAAGCCACGCCGCUUUCUGCAGCUGCGGAGAUUGCAUCGGACAUCUGCAGCACCUGGCCACCAAUCUGGGUAGACCUCCAGCUCCUCAGCCUCCUCGAGAUCAGCACCCUCCUCACAUCAGAGGACUGCCUGCACUUCCUGCUCCUCCAAGCAACAGAAACAGCUGGCCUGGCACAGGCGGAGAUGCUGCUGGCGGAGAAGCUGGUGGAUCUAGAGGUGCCGGCGACGGUGGCGACGGCGAACUUGCUGAUGAAGAUCUGCUGGACGCUAUCGCCCUGGCCGCUGAA [서열번호 350]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 350에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 EBV EBNA1(P03211; 엡스타인-바 핵 항원 1 엡스타인-바 바이러스(B95-8 바이러스주)), 또는 그의 동원체이다. EBV EBNA1의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 351로 나타낸다:
MSDEGPGTGPGNGLGEKGDTSGPEGSGGSGPQRRGGDNHGRGRGRGRGRGGGRPGAPGGSGSGPRHRDGVRRPQKRPSCIGCKGTHGGTGAGAGAGGAGAGGAGAGGGAGAGGGAGGAGGAGGAGAGGGAGAGGGAGGAGGAGAGGGAGAGGGAGGAGAGGGAGGAGGAGAGGGAGAGGGAGGAGAGGGAGGAGGAGAGGGAGAGGAGGAGGAGAGGAGAGGGAGGAGGAGAGGAGAGGAGAGGAGAGGAGGAGAGGAGGAGAGGAGGAGAGGGAGGAGAGGGAGGAGAGGAGGAGAGGAGGAGAGGAGGAGAGGGAGAGGAGAGGGGRGRGGSGGRGRGGSGGRGRGGSGGRRGRGRERARGGSRERARGRGRGRGEKRPRSPSSQSSSSGSPPRRPPPGRRPFFHPVGEADYFEYHQEGGPDGEPDVPPGAIEQGPADDPGEGPSTGPRGQGDGGRRKKGGWFGKHRGQGGSNPKFENIAEGLRALLARSHVERTTDEGTWVAGVFVYGGSKTSLYNLRRGTALAIPQCRLTPLSRLPFGMAPGPGPQPGPLRESIVCYFMVFLQTHIFAEVLKDAIKDLVMTKPAPTCNIRVTVCSFDDGVDLPPWFPPMVEGAAAEGDDGDDGDEGGDGDEGEEGQE [서열번호 351]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 351에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 EBV EBNA1 폴리펩티드는 다음과 같은 서열번호 352의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGTCTGACGAGGGGCCAGGTACAGGACCTGGAAATGGCCTAGGAGAGAAGGGAGACACATCTGGACCAGAAGGCTCCGGCGGCAGTGGACCTCAAAGAAGAGGGGGTGATAACCATGGACGAGGACGGGGAAGAGGACGAGGACGAGGAGGCGGAAGACCAGGAGCCCCGGGCGGCTCAGGATCAGGGCCAAGACATAGAGATGGTGTCCGGAGACCCCAAAAACGTCCAAGTTGCATTGGCTGCAAAGGGACCCACGGTGGAACAGGAGCAGGAGCAGGAGCGGGAGGGGCAGGAGCAGGAGGGGCAGGAGCAGGAGGAGGGGCAGGAGCAGGAGGAGGGGCAGGAGGGGCAGGAGGGGCAGGAGGGGCAGGAGCAGGAGGAGGGGCAGGAGCAGGAGGAGGGGCAGGAGGGGCAGGAGGGGCAGGAGCAGGAGGAGGGGCAGGAGCAGGAGGAGGGGCAGGAGGGGCAGGAGCAGGAGGAGGGGCAGGAGGGGCAGGAGGGGCAGGAGCAGGAGGAGGGGCAGGAGCAGGAGGAGGGGCAGGAGGGGCAGGAGCAGGAGGAGGGGCAGGAGGGGCAGGAGGGGCAGGAGCAGGAGGAGGGGCAGGAGCAGGAGGGGCAGGAGGGGCAGGAGGGGCAGGAGCAGGAGGGGCAGGAGCAGGAGGAGGGGCAGGAGGGGCAGGAGGGGCAGGAGCAGGAGGGGCAGGAGCAGGAGGGGCAGGAGCAGGAGGGGCAGGAGCAGGAGGGGCAGGAGGGGCAGGAGCAGGAGGGGCAGGAGGGGCAGGAGCAGGAGGGGCAGGAGGGGCAGGAGCAGGAGGAGGGGCAGGAGGGGCAGGAGCAGGAGGAGGGGCAGGAGGGGCAGGAGCAGGAGGGGCAGGAGGGGCAGGAGCAGGAGGGGCAGGAGGGGCAGGAGCAGGAGGGGCAGGAGGGGCAGGAGCAGGAGGAGGGGCAGGAGCAGGAGGGGCAGGAGCAGGAGGTGGAGGCCGGGGTCGAGGAGGCAGTGGAGGCCGGGGTCGAGGAGGTAGTGGAGGCCGGGGTCGAGGAGGTAGTGGAGGCCGCCGGGGTAGAGGACGTGAAAGAGCCAGGGGGGGAAGTCGTGAAAGAGCCAGGGGGAGAGGTCGTGGACGTGGAGAAAAGAGGCCCAGGAGTCCCAGTAGTCAGTCATCATCATCCGGGTCTCCACCGCGCAGGCCCCCTCCAGGTAGAAGGCCATTTTTCCACCCTGTAGGGGAAGCCGATTATTTTGAATACCACCAAGAAGGTGGCCCAGATGGTGAGCCTGACGTGCCCCCGGGAGCGATAGAGCAGGGCCCCGCAGATGACCCAGGAGAAGGCCCAAGCACTGGACCCCGGGGTCAGGGTGATGGAGGCAGGCGCAAAAAAGGAGGGTGGTTTGGAAAGCATCGTGGTCAAGGAGGTTCCAACCCGAAATTTGAGAACATTGCAGAAGGTTTAAGAGCTCTCCTGGCTAGGAGTCACGTAGAAAGGACTACCGACGAAGGAACTTGGGTCGCCGGTGTGTTCGTATATGGAGGTAGTAAGACCTCCCTTTACAACCTAAGGCGAGGAACTGCCCTTGCTATTCCACAATGTCGTCTTACACCATTGAGTCGTCTCCCCTTTGGAATGGCCCCTGGACCCGGCCCACAACCTGGCCCGCTAAGGGAGTCCATTGTCTGTTATTTCATGGTCTTTTTACAAACTCATATATTTGCTGAGGTTTTGAAGGATGCGATTAAGGACCTTGTTATGACAAAGCCCGCTCCTACCTGCAATATCAGGGTGACTGTGTGCAGCTTTGACGATGGAGTAGATTTGCCTCCCTGGTTTCCACCTATGGTGGAAGGGGCTGCCGCGGAGGGTGATGACGGAGATGACGGAGATGAAGGAGGTGATGGAGATGAGGGTGAGGAAGGGCAGGAGTGA [서열번호 352]
따라서, 바람직하게는 상기 EBV EBNA1 폴리펩티드는 실질적으로 서열번호 352에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 EBV EBNA1 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 353으로 제공된다:
ATGTCCGATGAAGGCCCTGGAACAGGCCCTGGCAATGGACTGGGAGAGAAGGGCGATACAAGCGGCCCTGAAGGTTCTGGCGGATCTGGCCCTCAAAGAAGAGGCGGCGATAATCACGGCAGAGGACGCGGAAGAGGTAGAGGCAGAGGCGGAGGTAGACCTGGTGCTCCTGGTGGTTCTGGCTCTGGCCCTAGACATAGAGATGGCGTCAGACGGCCTCAGAAGAGGCCTTCTTGTATCGGCTGCAAGGGCACACATGGCGGAACAGGTGCTGGTGCTGGCGCAGGCGGAGCAGGCGCTGGTGGTGCAGGCGCTGGCGGCGGTGCCGGTGCAGGCGGCGGAGCTGGTGGCGCTGGCGGTGCTGGCGGAGCTGGTGCAGGCGGAGGTGCCGGCGCTGGTGGCGGAGCAGGCGGAGCTGGCGGAGCCGGCGCTGGCGGTGGCGCTGGTGCCGGCGGAGGCGCAGGCGGCGCTGGTGCTGGTGGTGGTGCTGGCGGCGCAGGCGGTGCAGGCGCAGGCGGAGGCGCTGGCGCTGGCGGTGGTGCAGGCGGTGCTGGCGCTGGCGGCGGTGCTGGCGGAGCCGGTGGTGCTGGTGCTGGTGGCGGAGCTGGCGCTGGCGGAGCTGGCGGTGCAGGCGGCGCAGGCGCTGGTGGCGCTGGCGCAGGCGGTGGCGCTGGCGGAGCAGGCGGAGCTGGCGCTGGCGGCGCAGGCGCAGGCGGAGCCGGTGCTGGCGGAGCTGGTGCTGGTGGTGCAGGCGGAGCTGGTGCCGGTGGCGCTGGTGGTGCCGGTGCCGGTGGTGCCGGCGGAGCCGGCGCAGGCGGCGGTGCAGGCGGAGCAGGCGCAGGCGGCGGAGCTGGTGGTGCCGGCGCAGGCGGCGCTGGTGGTGCTGGTGCCGGCGGAGCTGGTGGCGCAGGCGCTGGCGGTGCAGGCGGTGCCGGTGCCGGTGGTGGTGCAGGCGCAGGCGGTGCTGGTGCCGGCGGTGGCGGAAGAGGAAGAGGTGGTAGCGGAGGCCGAGGACGAGGCGGAAGTGGTGGTCGTGGTAGAGGCGGCAGCGGAGGAAGAAGAGGACGGGGTAGAGAACGAGCTAGAGGCGGATCTAGAGAGAGAGCCCGAGGCAGAGGAAGAGGCCGCGGAGAGAAAAGACCTAGAAGCCCTAGCAGCCAGAGCAGCTCTAGCGGATCTCCACCTAGAAGGCCACCTCCAGGCAGACGGCCATTCTTTCACCCTGTGGGCGAAGCCGACTACTTCGAGTACCACCAAGAAGGCGGACCTGACGGCGAACCTGATGTTCCTCCTGGCGCCATTGAACAGGGCCCAGCTGATGATCCTGGCGAGGGACCTTCTACAGGCCCTAGAGGACAAGGCGACGGCGGCAGACGAAAGAAAGGCGGATGGTTCGGCAAGCACAGAGGCCAAGGTGGCAGCAACCCCAAGTTCGAGAATATCGCCGAGGGCCTGAGAGCCCTGCTGGCCAGATCTCACGTGGAAAGAACCACCGACGAAGGCACATGGGTGGCAGGCGTGTTCGTTTACGGCGGCTCTAAGACCAGCCTGTACAACCTGAGAAGAGGCACAGCCCTGGCCATTCCTCAGTGCAGACTGACCCCTCTGAGCAGACTGCCTTTTGGCATGGCTCCTGGACCTGGACCTCAACCTGGACCACTGAGAGAATCCATCGTGTGCTACTTCATGGTGTTTCTGCAGACCCACATCTTCGCCGAGGTGCTGAAGGACGCCATCAAGGACCTGGTCATGACAAAGCCCGCTCCTACCTGCAACATCAGAGTGACCGTGTGCAGCTTCGACGACGGCGTTGACCTGCCTCCTTGGTTTCCTCCAATGGTGGAAGGCGCTGCTGCCGAAGGCGACGATGGCGACGACGGCGACGAAGGTGGCGACGGCGACGAGGGCGAAGAAGGACAAGAGTAA [서열번호 353]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 353에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 353의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 354로 제공된다:
AUGUCCGAUGAAGGCCCUGGAACAGGCCCUGGCAAUGGACUGGGAGAGAAGGGCGAUACAAGCGGCCCUGAAGGUUCUGGCGGAUCUGGCCCUCAAAGAAGAGGCGGCGAUAAUCACGGCAGAGGACGCGGAAGAGGUAGAGGCAGAGGCGGAGGUAGACCUGGUGCUCCUGGUGGUUCUGGCUCUGGCCCUAGACAUAGAGAUGGCGUCAGACGGCCUCAGAAGAGGCCUUCUUGUAUCGGCUGCAAGGGCACACAUGGCGGAACAGGUGCUGGUGCUGGCGCAGGCGGAGCAGGCGCUGGUGGUGCAGGCGCUGGCGGCGGUGCCGGUGCAGGCGGCGGAGCUGGUGGCGCUGGCGGUGCUGGCGGAGCUGGUGCAGGCGGAGGUGCCGGCGCUGGUGGCGGAGCAGGCGGAGCUGGCGGAGCCGGCGCUGGCGGUGGCGCUGGUGCCGGCGGAGGCGCAGGCGGCGCUGGUGCUGGUGGUGGUGCUGGCGGCGCAGGCGGUGCAGGCGCAGGCGGAGGCGCUGGCGCUGGCGGUGGUGCAGGCGGUGCUGGCGCUGGCGGCGGUGCUGGCGGAGCCGGUGGUGCUGGUGCUGGUGGCGGAGCUGGCGCUGGCGGAGCUGGCGGUGCAGGCGGCGCAGGCGCUGGUGGCGCUGGCGCAGGCGGUGGCGCUGGCGGAGCAGGCGGAGCUGGCGCUGGCGGCGCAGGCGCAGGCGGAGCCGGUGCUGGCGGAGCUGGUGCUGGUGGUGCAGGCGGAGCUGGUGCCGGUGGCGCUGGUGGUGCCGGUGCCGGUGGUGCCGGCGGAGCCGGCGCAGGCGGCGGUGCAGGCGGAGCAGGCGCAGGCGGCGGAGCUGGUGGUGCCGGCGCAGGCGGCGCUGGUGGUGCUGGUGCCGGCGGAGCUGGUGGCGCAGGCGCUGGCGGUGCAGGCGGUGCCGGUGCCGGUGGUGGUGCAGGCGCAGGCGGUGCUGGUGCCGGCGGUGGCGGAAGAGGAAGAGGUGGUAGCGGAGGCCGAGGACGAGGCGGAAGUGGUGGUCGUGGUAGAGGCGGCAGCGGAGGAAGAAGAGGACGGGGUAGAGAACGAGCUAGAGGCGGAUCUAGAGAGAGAGCCCGAGGCAGAGGAAGAGGCCGCGGAGAGAAAAGACCUAGAAGCCCUAGCAGCCAGAGCAGCUCUAGCGGAUCUCCACCUAGAAGGCCACCUCCAGGCAGACGGCCAUUCUUUCACCCUGUGGGCGAAGCCGACUACUUCGAGUACCACCAAGAAGGCGGACCUGACGGCGAACCUGAUGUUCCUCCUGGCGCCAUUGAACAGGGCCCAGCUGAUGAUCCUGGCGAGGGACCUUCUACAGGCCCUAGAGGACAAGGCGACGGCGGCAGACGAAAGAAAGGCGGAUGGUUCGGCAAGCACAGAGGCCAAGGUGGCAGCAACCCCAAGUUCGAGAAUAUCGCCGAGGGCCUGAGAGCCCUGCUGGCCAGAUCUCACGUGGAAAGAACCACCGACGAAGGCACAUGGGUGGCAGGCGUGUUCGUUUACGGCGGCUCUAAGACCAGCCUGUACAACCUGAGAAGAGGCACAGCCCUGGCCAUUCCUCAGUGCAGACUGACCCCUCUGAGCAGACUGCCUUUUGGCAUGGCUCCUGGACCUGGACCUCAACCUGGACCACUGAGAGAAUCCAUCGUGUGCUACUUCAUGGUGUUUCUGCAGACCCACAUCUUCGCCGAGGUGCUGAAGGACGCCAUCAAGGACCUGGUCAUGACAAAGCCCGCUCCUACCUGCAACAUCAGAGUGACCGUGUGCAGCUUCGACGACGGCGUUGACCUGCCUCCUUGGUUUCCUCCAAUGGUGGAAGGCGCUGCUGCCGAAGGCGACGAUGGCGACGACGGCGACGAAGGUGGCGACGGCGACGAGGGCGAAGAAGGACAAGAGUAA [서열번호 354]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 354에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 BDV P 단백질(P0C799; 인단백질 보르나 질환 바이러스(Borna disease virus)(V 바이러스주)), 또는 그의 동원체이다. 상기 IIP는 TBK에 의한 인산화를 위한 유인 단백질로 작용하여서, IRF3 및 7의 TBK 활성 및 활성화를 감소시키는 효과를 갖는 것으로 여겨진다. BDV P 단백질의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 355로 나타낸다:
MATRPSSLVDSLEDEEDPQTLRRERPGSPRPRKVPRNALTQPVDQLLKDLRKNPSMISDPDQRTGREQLSNDELIKKLVTELAENSMIEAEEVRGTLGDISARIEAGFESLSALQVETIQTAQRCDHSDSIRILGENIKILDRSMKTMMETMKLMMEKVDLLYASTAVGTSAPMLPSHPAPPRIYPQLPSAPTTDEWDIIP [서열번호 355]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 355에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 BDV P 폴리펩티드는 다음과 같은 서열번호 356의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGCAACGCGACCATCGAGTCTGGTCGACTCCCTGGAGGACGAAGAAGATCCCCAGACACTACGACGGGAACGACCGGGGTCACCAAGACCACGGAAGGTCCCAAGGAATGCATTGACCCAACCAGTAGACCAGCTCCTGAAGGACCTCAGGAAGAACCCCTCCATGATCTCAGACCCAGACCAGCGAACCGGAAGGGAGCAGCTGTCGAATGATGAGCTAATCAAGAAGTTAGTGACGGAGCTGGCCGAGAATAGCATGATCGAGGCTGAGGAGGTGCGGGGCACTCTTGGAGACATCTCGGCTCGTATCGAGGCAGGGTTTGAGTCCCTGTCCGCCCTCCAAGTGGAAACCATCCAGACAGCTCAGCGGTGCGATCACTCCGACAGCATCAGGATCCTCGGCGAGAACATCAAGATACTAGATCGCTCCATGAAGACAATGATGGAGACAATGAAGCTCATGATGGAGAAGGTGGATCTCCTCTACGCATCAACCGCCGTTGGGACCTCTGCACCCATGTTGCCCTCCCATCCTGCACCTCCGCGCATTTATCCCCAGCTCCCAAGTGCCCCGACAACGGATGAATGGGACATCATACCA [서열번호 356]
따라서, 바람직하게는 상기 BDV P 폴리펩티드는 실질적으로 서열번호 356에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 BDV P 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 357로 제공된다:
ATGGCCACAAGACCTAGCAGCCTGGTGGACAGCCTGGAAGATGAGGAAGATCCCCAGACACTGCGGAGAGAGAGGCCTGGATCTCCCAGACCTAGAAAGGTGCCCAGAAACGCCCTGACACAGCCCGTTGATCAGCTGCTGAAGGACCTGAGAAAGAACCCCAGCATGATCAGCGACCCCGACCAGAGAACCGGAAGAGAGCAGCTGTCTAACGACGAGCTGATTAAGAAGCTGGTCACCGAGCTGGCCGAGAACTCCATGATTGAGGCCGAAGAAGTGCGGGGCACCCTGGGCGATATCTCTGCCAGAATCGAGGCCGGCTTTGAGTCTCTGAGCGCCCTGCAGGTTGAGACAATCCAGACAGCCCAGAGATGCGACCACAGCGACAGCATCAGAATCCTGGGCGAGAACATCAAGATCCTGGATCGGAGCATGAAGACCATGATGGAAACCATGAAGCTGATGATGGAAAAGGTGGACCTGCTGTACGCCAGCACAGCCGTGGGAACATCTGCTCCCATGCTGCCTTCTCACCCCGCTCCTCCAAGAATCTACCCTCAGCTGCCTAGCGCTCCCACCACCGATGAGTGGGATATCATCCCT [서열번호 357]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 357에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 357의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 358로 제공된다:
AUGGCCACAAGACCUAGCAGCCUGGUGGACAGCCUGGAAGAUGAGGAAGAUCCCCAGACACUGCGGAGAGAGAGGCCUGGAUCUCCCAGACCUAGAAAGGUGCCCAGAAACGCCCUGACACAGCCCGUUGAUCAGCUGCUGAAGGACCUGAGAAAGAACCCCAGCAUGAUCAGCGACCCCGACCAGAGAACCGGAAGAGAGCAGCUGUCUAACGACGAGCUGAUUAAGAAGCUGGUCACCGAGCUGGCCGAGAACUCCAUGAUUGAGGCCGAAGAAGUGCGGGGCACCCUGGGCGAUAUCUCUGCCAGAAUCGAGGCCGGCUUUGAGUCUCUGAGCGCCCUGCAGGUUGAGACAAUCCAGACAGCCCAGAGAUGCGACCACAGCGACAGCAUCAGAAUCCUGGGCGAGAACAUCAAGAUCCUGGAUCGGAGCAUGAAGACCAUGAUGGAAACCAUGAAGCUGAUGAUGGAAAAGGUGGACCUGCUGUACGCCAGCACAGCCGUGGGAACAUCUGCUCCCAUGCUGCCUUCUCACCCCGCUCCUCCAAGAAUCUACCCUCAGCUGCCUAGCGCUCCCACCACCGAUGAGUGGGAUAUCAUCCCU [서열번호 358]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 358에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 HPV E7(P03129; 단백질 E7 인간 파필로마바이러스 타입 16), 또는 그의 동원체이다. HPV E7의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 359로 나타낸다:
MHGDTPTLHEYMLDLQPETTDLYCYEQLNDSSEEEDEIDGPAGQAEPDRAHYNIVTFCCKCDSTLRLCVQSTHVDIRTLEDLLMGTLGIVCPICSQKP [서열번호 359]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 359에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 HPV E7 폴리펩티드는 다음과 같은 서열번호 360의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGCATGGAGATACACCTACATTGCATGAATATATGTTAGATTTGCAACCAGAGACAACTGATCTCTACTGTTATGAGCAATTAAATGACAGCTCAGAGGAGGAGGATGAAATAGATGGTCCAGCTGGACAAGCAGAACCGGACAGAGCCCATTACAATATTGTAACCTTTTGTTGCAAGTGTGACTCTACGCTTCGGTTGTGCGTACAAAGCACACACGTAGACATTCGTACTTTGGAAGACCTGTTAATGGGCACACTAGGAATTGTGTGCCCCATCTGTTCTCAGAAACCA [서열번호 360]
따라서, 바람직하게는 상기 HPV E7 폴리펩티드는 실질적으로 서열번호 360에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 HPV E7 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 361로 제공된다:
ATGCACGGCGATACCCCTACACTGCACGAGTACATGCTGGACCTGCAGCCTGAGACAACCGACCTGTACTGCTACGAGCAGCTGAACGACAGCAGCGAGGAAGAGGACGAGATTGACGGACCTGCCGGACAGGCCGAACCTGATAGAGCCCACTACAATATCGTGACCTTCTGCTGCAAGTGCGACAGCACCCTGAGACTGTGTGTGCAGAGCACCCACGTGGACATCAGAACCCTGGAAGATCTGCTGATGGGCACCCTGGGCATCGTGTGCCCTATCTGTTCTCAGAAGCCC [서열번호 361]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 361에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 361의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 362로 제공된다:
AUGCACGGCGAUACCCCUACACUGCACGAGUACAUGCUGGACCUGCAGCCUGAGACAACCGACCUGUACUGCUACGAGCAGCUGAACGACAGCAGCGAGGAAGAGGACGAGAUUGACGGACCUGCCGGACAGGCCGAACCUGAUAGAGCCCACUACAAUAUCGUGACCUUCUGCUGCAAGUGCGACAGCACCCUGAGACUGUGUGUGCAGAGCACCCACGUGGACAUCAGAACCCUGGAAGAUCUGCUGAUGGGCACCCUGGGCAUCGUGUGCCCUAUCUGUUCUCAGAAGCCC [서열번호 362]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 362에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 아레나바이러스 NP1 단백질(A0A2H4RDN2; 핵단백질 아레나바이러스 속(sp.)), 또는 그의 동원체이다. 아레나바이러스 NP1 단백질의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 363으로 나타낸다:
MSNSKEVKSFLWTQALRRELSPYCTSVKLQVIKDAQSLLHSLDFSEVSNVQRLMRKDKRDDGDLKRLRDLNQAVNNLVELKSQQQKNVLSVGQLSSDDLLVLAADIDRLKAKITRTERPQSNGVYMGNLTAQQLEQRKKLLELVGMTRPNLRAGSDGVVRVWDVKNPDLLNNQFGTMPSLTIACMTKQGQSDINDVVQALTDLGLIYTAKYPNSSDLDQLVKTHPVLGIIDTEKSAINVSGYNFSLSAAVKAGACMLDGGNMLETIKVTPQNIDPILKKTLAVKKSVGMFVSDTPGDRNPYENLLYKICLSGNGWPYIASRTSILGRAWDNTVVDLGSSNPITKPLNQQARDKVPGLQQTVGLTYSQIMCLKDIMTGMDPTSKTWIDIEGRAEDPVEIAIYQPAGGQYIHFYREPTDAKQFKQDSKYSHGIDIVDLFRVQPGLTSAVIESLPKGMVLTCQGSEDIRKLLDSQGRRDIKLIDVMMSKIDARKFENEVWDDLKTLCNMHTGVVHEKKKRGGKQEITPHCALLDCIMYEAATQGSYKTPKLTPLLPTDLVFRAGAPKVTL [서열번호 363]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 363에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 아레나바이러스 NP1 폴리펩티드는 다음과 같은 서열번호 364의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGAGCAACTCCAAGGAGGTGAAGTCCTTTCTTTGGACTCAAGCCCTTAGGAGGGAATTATCACCATACTGCACAAGTGTCAAACTTCAAGTTATCAAGGATGCTCAGAGTCTCCTTCACAGCTTGGATTTCTCAGAAGTGAGTAATGTACAACGCTTGATGAGGAAGGACAAAAGGGATGACGGTGACTTGAAGAGGCTGAGAGATTTAAATCAGGCAGTCAACAATCTTGTTGAACTAAAATCTCAACAGCAGAAAAATGTCTTAAGTGTGGGGCAGCTGTCATCTGATGACCTTTTAGTCCTCGCTGCTGACATTGACAGGCTGAAAGCAAAGATAACCAGGACAGAGAGGCCCCAATCTAATGGGGTCTACATGGGGAACCTCACAGCTCAGCAACTTGAACAACGAAAGAAGCTCCTAGAGTTGGTGGGGATGACCAGACCAAACTTAAGAGCTGGTTCTGATGGTGTTGTCAGGGTGTGGGACGTGAAGAATCCTGATCTCTTGAATAACCAATTTGGCACAATGCCCAGTCTAACGATTGCCTGCATGACAAAACAAGGACAATCAGACATAAATGATGTTGTTCAGGCATTAACTGACTTGGGGCTAATTTATACAGCTAAGTACCCAAATTCATCAGATCTTGATCAACTTGTCAAAACCCATCCAGTTTTGGGCATCATAGACACAGAAAAATCTGCCATCAATGTTTCAGGTTACAACTTCAGCCTGTCAGCTGCAGTTAAGGCAGGTGCATGTATGCTAGATGGGGGTAACATGCTCGAGACCATAAAGGTAACACCTCAGAATATTGATCCAATTCTGAAGAAGACTCTGGCAGTTAAAAAGTCTGTTGGCATGTTTGTCTCAGACACACCAGGTGACAGAAACCCATATGAAAACTTACTATACAAGATCTGCCTCTCAGGCAATGGATGGCCCTACATTGCTAGCAGAACTTCAATTCTCGGGAGGGCCTGGGACAACACAGTTGTGGACTTGGGCAGCAGTAACCCAATCACAAAGCCCCTCAATCAGCAAGCTAGAGACAAAGTTCCTGGTTTGCAGCAAACAGTTGGACTCACATACTCACAAATCATGTGTCTCAAAGACATAATGACCGGTATGGACCCGACAAGTAAGACTTGGATTGACATTGAGGGCAGGGCTGAGGACCCAGTGGAGATTGCCATCTACCAGCCAGCTGGTGGGCAATATATTCATTTCTACAGAGAACCAACAGATGCCAAGCAATTTAAGCAGGATTCTAAGTACTCACATGGCATTGACATTGTTGACCTGTTTAGGGTGCAACCAGGCCTTACAAGTGCTGTGATAGAGAGTCTACCGAAAGGGATGGTCTTAACTTGTCAGGGATCTGAGGACATAAGAAAGCTGTTAGATAGTCAGGGGCGCCGAGACATCAAGTTAATTGATGTGATGATGAGCAAGATTGATGCACGGAAGTTTGAAAATGAGGTCTGGGATGATCTTAAAACACTGTGCAACATGCACACTGGGGTGGTCCATGAGAAGAAGAAGAGAGGTGGTAAACAAGAAATAACACCTCACTGTGCACTTCTAGACTGCATTATGTATGAGGCAGCCACCCAGGGGTCATACAAGACCCCCAAATTAACACCTCTGCTACCAACTGACTTGGTGTTTAGAGCAGGAGCACCCAAAGTCACTCTG [서열번호 364]
따라서, 바람직하게는 상기 아레나바이러스 NP1 폴리펩티드는 실질적으로 서열번호 364에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 아레나바이러스 NP1 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 365로 제공된다:
ATGAGCAACAGCAAAGAAGTCAAGAGCTTCCTCTGGACACAGGCCCTGAGAAGAGAGCTGAGCCCTTACTGCACCAGCGTGAAGCTGCAAGTGATCAAGGACGCCCAGAGCCTGCTGCACAGCCTGGATTTTTCCGAGGTGTCCAACGTGCAGCGGCTGATGCGGAAGGACAAGAGAGATGACGGCGACCTGAAGCGGCTGAGGGATCTGAATCAGGCCGTGAACAACCTGGTGGAACTGAAGTCCCAGCAGCAGAAAAACGTGCTGAGCGTGGGCCAGCTGAGCAGCGACGATCTGCTTGTTCTGGCCGCCGACATCGACAGACTGAAGGCCAAGATCACCAGAACCGAGCGGCCTCAGAGCAACGGCGTGTACATGGGAAATCTGACAGCCCAGCAGCTGGAACAGCGGAAGAAACTGCTGGAACTCGTGGGCATGACCCGGCCTAATCTGAGAGCTGGCTCTGATGGCGTCGTCAGAGTGTGGGACGTGAAGAACCCCGACCTGCTGAACAACCAGTTCGGCACCATGCCTAGCCTGACAATCGCCTGCATGACCAAGCAGGGCCAGAGCGACATCAACGATGTGGTGCAGGCACTGACCGACCTGGGCCTGATCTACACCGCCAAGTATCCCAACAGCAGCGACCTGGATCAGCTGGTCAAGACACACCCTGTGCTGGGCATCATCGACACCGAGAAGTCCGCCATCAACGTGTCCGGCTACAACTTCTCTCTGTCTGCCGCCGTGAAAGCCGGCGCTTGTATGCTGGATGGCGGCAACATGCTGGAAACCATCAAAGTGACCCCTCAGAACATCGACCCCATCCTGAAGAAAACCCTGGCCGTGAAGAAAAGCGTGGGGATGTTCGTGTCTGACACCCCTGGCGACAGAAACCCCTACGAGAACCTGCTGTACAAGATCTGCCTGAGCGGCAACGGCTGGCCCTATATCGCCAGCAGAACCAGCATTCTGGGCAGAGCCTGGGACAACACCGTGGTGGATCTGGGCAGCAGCAACCCCATCACCAAGCCTCTGAACCAGCAGGCCAGAGATAAGGTGCCAGGCCTGCAGCAGACAGTGGGCCTGACATACAGCCAGATCATGTGCCTGAAGGACATCATGACCGGCATGGACCCCACCAGCAAGACATGGATCGACATCGAGGGCAGAGCTGAGGACCCTGTGGAAATCGCCATCTACCAACCTGCCGGCGGACAGTACATCCACTTCTACAGAGAGCCCACCGACGCCAAGCAGTTCAAGCAGGACAGCAAGTACAGCCACGGCATCGATATCGTGGACCTGTTCAGAGTGCAGCCCGGACTGACATCTGCCGTGATCGAGTCTCTGCCCAAAGGCATGGTCCTGACCTGTCAGGGCAGCGAGGACATCAGAAAGCTGCTCGACAGCCAGGGCAGAAGAGACATCAAGCTGATCGACGTGATGATGAGCAAGATCGACGCCCGGAAGTTCGAGAACGAAGTGTGGGATGACCTGAAAACCCTCTGCAACATGCACACCGGCGTGGTGCACGAGAAGAAGAAGAGAGGCGGCAAGCAAGAGATCACCCCTCACTGTGCTCTGCTGGACTGCATTATGTACGAGGCCGCCACACAGGGCAGCTACAAGACCCCTAAACTGACCCCTCTGCTGCCTACCGATCTGGTGTTTAGAGCCGGCGCACCCAAAGTGACACTG [서열번호 365]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 365에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 365의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 366으로 제공된다:
AUGAGCAACAGCAAAGAAGUCAAGAGCUUCCUCUGGACACAGGCCCUGAGAAGAGAGCUGAGCCCUUACUGCACCAGCGUGAAGCUGCAAGUGAUCAAGGACGCCCAGAGCCUGCUGCACAGCCUGGAUUUUUCCGAGGUGUCCAACGUGCAGCGGCUGAUGCGGAAGGACAAGAGAGAUGACGGCGACCUGAAGCGGCUGAGGGAUCUGAAUCAGGCCGUGAACAACCUGGUGGAACUGAAGUCCCAGCAGCAGAAAAACGUGCUGAGCGUGGGCCAGCUGAGCAGCGACGAUCUGCUUGUUCUGGCCGCCGACAUCGACAGACUGAAGGCCAAGAUCACCAGAACCGAGCGGCCUCAGAGCAACGGCGUGUACAUGGGAAAUCUGACAGCCCAGCAGCUGGAACAGCGGAAGAAACUGCUGGAACUCGUGGGCAUGACCCGGCCUAAUCUGAGAGCUGGCUCUGAUGGCGUCGUCAGAGUGUGGGACGUGAAGAACCCCGACCUGCUGAACAACCAGUUCGGCACCAUGCCUAGCCUGACAAUCGCCUGCAUGACCAAGCAGGGCCAGAGCGACAUCAACGAUGUGGUGCAGGCACUGACCGACCUGGGCCUGAUCUACACCGCCAAGUAUCCCAACAGCAGCGACCUGGAUCAGCUGGUCAAGACACACCCUGUGCUGGGCAUCAUCGACACCGAGAAGUCCGCCAUCAACGUGUCCGGCUACAACUUCUCUCUGUCUGCCGCCGUGAAAGCCGGCGCUUGUAUGCUGGAUGGCGGCAACAUGCUGGAAACCAUCAAAGUGACCCCUCAGAACAUCGACCCCAUCCUGAAGAAAACCCUGGCCGUGAAGAAAAGCGUGGGGAUGUUCGUGUCUGACACCCCUGGCGACAGAAACCCCUACGAGAACCUGCUGUACAAGAUCUGCCUGAGCGGCAACGGCUGGCCCUAUAUCGCCAGCAGAACCAGCAUUCUGGGCAGAGCCUGGGACAACACCGUGGUGGAUCUGGGCAGCAGCAACCCCAUCACCAAGCCUCUGAACCAGCAGGCCAGAGAUAAGGUGCCAGGCCUGCAGCAGACAGUGGGCCUGACAUACAGCCAGAUCAUGUGCCUGAAGGACAUCAUGACCGGCAUGGACCCCACCAGCAAGACAUGGAUCGACAUCGAGGGCAGAGCUGAGGACCCUGUGGAAAUCGCCAUCUACCAACCUGCCGGCGGACAGUACAUCCACUUCUACAGAGAGCCCACCGACGCCAAGCAGUUCAAGCAGGACAGCAAGUACAGCCACGGCAUCGAUAUCGUGGACCUGUUCAGAGUGCAGCCCGGACUGACAUCUGCCGUGAUCGAGUCUCUGCCCAAAGGCAUGGUCCUGACCUGUCAGGGCAGCGAGGACAUCAGAAAGCUGCUCGACAGCCAGGGCAGAAGAGACAUCAAGCUGAUCGACGUGAUGAUGAGCAAGAUCGACGCCCGGAAGUUCGAGAACGAAGUGUGGGAUGACCUGAAAACCCUCUGCAACAUGCACACCGGCGUGGUGCACGAGAAGAAGAAGAGAGGCGGCAAGCAAGAGAUCACCCCUCACUGUGCUCUGCUGGACUGCAUUAUGUACGAGGCCGCCACACAGGGCAGCUACAAGACCCCUAAACUGACCCCUCUGCUGCCUACCGAUCUGGUGUUUAGAGCCGGCGCACCCAAAGUGACACUG [서열번호 366]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 366에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 HCV NS3 단백질(P27958; 게놈 폴리단백질 C형 간염 바이러스 유전자형 1a(H77 단리물)), 또는 그의 동원체이다. HCV NS3 단백질의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 367로 나타낸다:
APITAYAQQTRGLLGCIITSLTGRDKNQVEGEVQIVSTATQTFLATCINGVCWTVYHGAGTRTIASPKGPVIQTYTNVDQDLVGWPAPQGSRSLTPCTCGSSDLYLVTRHADVIPVRRRGDSRGSLLSPRPISYLKGSSGGPLLCPTGHAVGLFRAAVCTRGVAKAVDFIPVENLETTMRSPVFTDNSSPPAVPQSFQVAHLHAPTGSGKSTKVPAAYAAKGYKVLVLNPSVAATLGFGAYMSKAHGVDPNIRTGVRTITTGSPITYSTYGKFLADAGCSGGAYDIIICDECHSTDATSISGIGTVLDQAETAGARLVVLATATPPGSVTVSHPNIEEVALSTTGEIPFYGKAIPLEVIKGGRHLIFCHSKKKCDELAAKLVALGINAVAYYRGLDVSVIPTSGDVVVVSTDALMTGFTGDFDSVIDCNTCVTQTVDFSLDPTFTIETTTLPQDAVSRTQRRGRTGRGKPGIYRFVAPGERPSGMFDSSVLCECYDAGCAWYELTPAETTVRLRAYMNTPGLPVCQDHLGFWEGVFTGLTHIDAHFLSQTKQSGENFPYLVAYQATVCARAQAPPPSWDQMRKCLIRLKPTLHGPTPLLYRLGAVQNEVTLTHPITKYIMTCMSADLEVVT [서열번호 367]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 367에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 HCV NS3 폴리펩티드는 다음과 같은 서열번호 368의 DNA 뉴클레오티드 서열에 의해 암호화된다:
GCGCCCATCACGGCGTACGCCCAGCAGACGAGAGGCCTCCTAGGGTGTATAATCACCAGCCTGACTGGCCGGGACAAAAACCAAGTGGAGGGTGAGGTCCAGATCGTGTCAACTGCTACCCAGACCTTCCTGGCAACGTGCATCAATGGGGTATGCTGGACTGTCTACCACGGGGCCGGAACGAGGACCATCGCATCACCCAAGGGTCCTGTCATCCAGACGTATACCAATGTGGATCAAGACCTCGTGGGCTGGCCCGCTCCTCAAGGTTCCCGCTCATTGACACCCTGCACCTGCGGCTCCTCGGACCTTTACCTGGTCACGAGGCACGCCGATGTCATTCCCGTGCGCCGGCGAGGTGATAGCAGGGGTAGCCTGCTTTCGCCCCGGCCCATTTCCTACTTGAAAGGCTCCTCGGGGGGTCCGCTGTTGTGCCCCACGGGACACGCCGTGGGCCTATTCAGGGCCGCGGTGTGCACCCGTGGAGTGGCTAAGGCGGTGGACTTTATCCCTGTGGAGAACCTAGAGACAACCATGAGATCCCCGGTGTTCACGGACAACTCCTCTCCACCAGCAGTGCCCCAGAGCTTCCAGGTGGCCCACCTGCATGCTCCCACCGGCAGCGGTAAGAGCACCAAGGTCCCGGCTGCGTACGCAGCCAAGGGCTACAAGGTGTTGGTGCTCAACCCCTCTGTTGCTGCAACACTGGGCTTTGGTGCTTACATGTCCAAGGCCCATGGGGTTGATCCTAATATCAGGACCGGGGTGAGAACAATTACCACTGGCAGCCCCATCACGTACTCCACCTACGGCAAGTTCCTTGCCGACGCCGGGTGCTCAGGAGGTGCTTATGACATAATAATTTGTGACGAGTGCCACTCCACGGATGCCACATCCATCTCGGGCATCGGCACTGTCCTTGACCAAGCAGAGACTGCGGGGGCGAGACTGGTTGTGCTCGCCACTGCTACCCCTCCGGGCTCCGTCACTGTGTCCCATCCTAACATCGAGGAGGTTGCTCTGTCCACCACCGGAGAGATCCCCTTTTACGGCAAGGCTATCCCCCTCGAGGTGATCAAGGGGGGAAGACATCTCATCTTCTGCCACTCAAAGAAGAAGTGCGACGAGCTCGCCGCGAAGCTGGTCGCATTGGGCATCAATGCCGTGGCCTACTACCGCGGTCTTGACGTGTCTGTCATCCCGACCAGCGGCGATGTTGTCGTCGTGTCGACCGATGCTCTCATGACTGGCTTTACCGGCGACTTCGACTCTGTGATAGACTGCAACACGTGTGTCACTCAGACAGTCGATTTTAGCCTTGACCCTACCTTTACCATTGAGACAACCACGCTCCCCCAGGATGCTGTCTCCAGGACTCAACGCCGGGGCAGGACTGGCAGGGGGAAGCCAGGCATCTATAGATTTGTGGCACCGGGGGAGCGCCCCTCCGGCATGTTCGACTCGTCCGTCCTCTGTGAGTGCTATGACGCGGGCTGTGCTTGGTATGAGCTCACGCCCGCCGAGACTACAGTTAGGCTACGAGCGTACATGAACACCCCGGGGCTTCCCGTGTGCCAGGACCATCTTGGATTTTGGGAGGGCGTCTTTACGGGCCTCACTCATATAGATGCCCACTTTCTATCCCAGACAAAGCAGAGTGGGGAGAACTTTCCTTACCTGGTAGCGTACCAAGCCACCGTGTGCGCTAGGGCTCAAGCCCCTCCCCCATCGTGGGACCAGATGCGGAAGTGTTTGATCCGCCTTAAACCCACCCTCCATGGGCCAACACCCCTGCTATACAGACTGGGCGCTGTTCAGAATGAAGTCACCCTGACGCACCCAATCACCAAATACATCATGACATGCATGTCGGCCGACCTGGAGGTCGTCACG [서열번호 368]
따라서, 바람직하게는 상기 HCV NS3 폴리펩티드는 실질적으로 서열번호 368에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 HCV NS3 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 369로 제공된다:
GCCCCTATCACAGCCTACGCTCAGCAGACAAGAGGCCTGCTGGGCTGCATCATCACAAGCCTGACCGGCAGAGACAAGAACCAGGTGGAAGGCGAGGTGCAGATCGTGTCTACAGCTACCCAGACCTTCCTGGCCACCTGTATCAATGGCGTGTGCTGGACCGTGTATCACGGCGCTGGCACCAGAACAATCGCCTCTCCAAAGGGCCCTGTGATCCAGACCTACACCAACGTGGACCAGGATCTCGTTGGCTGGCCTGCTCCTCAGGGCAGCAGATCTCTGACCCCTTGTACATGCGGCAGCAGCGACCTGTACCTGGTCACAAGACACGCCGACGTGATCCCCGTCAGAAGAAGAGGCGATAGCAGAGGCAGCCTGCTGAGCCCTAGACCTATCAGCTACCTGAAGGGCAGCTCTGGCGGACCTCTGCTGTGTCCAACAGGACATGCCGTGGGCCTGTTTAGAGCCGCCGTGTGTACAAGAGGCGTGGCCAAAGCCGTGGACTTCATCCCCGTGGAAAACCTGGAAACCACCATGCGGAGCCCCGTGTTCACCGACAATTCTAGCCCTCCAGCCGTGCCTCAGAGCTTCCAAGTGGCTCATCTGCATGCCCCTACAGGCAGCGGCAAGAGCACAAAAGTGCCTGCCGCCTATGCCGCCAAGGGCTATAAGGTGCTGGTGCTGAATCCCAGCGTGGCCGCCACACTTGGCTTTGGCGCCTATATGTCTAAAGCCCACGGCGTGGACCCCAACATCAGAACCGGCGTGCGGACAATCACAACAGGCAGCCCTATCACCTACTCTACCTACGGCAAGTTCCTGGCCGATGCCGGATGTTCTGGCGGAGCCTACGACATCATCATCTGCGACGAGTGCCACAGCACCGACGCCACATCTATCTCTGGCATCGGCACCGTGCTGGATCAGGCCGAAACAGCTGGTGCTAGACTGGTGGTGCTGGCCACAGCTACACCTCCAGGCTCTGTGACAGTGTCTCACCCCAATATCGAGGAAGTGGCCCTGTCTACAACCGGCGAGATCCCATTCTATGGCAAGGCCATTCCTCTGGAAGTGATCAAAGGCGGCAGACACCTGATCTTTTGCCACTCCAAGAAGAAGTGCGACGAGCTGGCCGCCAAACTGGTGGCCCTTGGAATCAATGCCGTGGCCTACTACAGAGGACTGGACGTGTCCGTGATTCCCACATCTGGCGACGTGGTGGTGGTGTCCACTGATGCCCTGATGACCGGCTTCACCGGCGACTTCGATAGCGTGATCGACTGCAATACCTGCGTGACCCAGACCGTGGATTTCTCTCTGGACCCCACCTTCACCATCGAGACAACCACACTGCCTCAGGACGCCGTGTCTCGGACACAGAGAAGAGGCAGAACCGGAAGAGGCAAGCCCGGCATCTACAGATTTGTGGCCCCTGGCGAAAGACCCAGCGGCATGTTTGATAGCAGCGTGCTGTGCGAGTGCTACGATGCTGGCTGTGCTTGGTACGAGCTGACCCCTGCCGAGACTACCGTTAGACTGCGGGCCTACATGAACACCCCTGGCCTGCCTGTGTGTCAGGACCACCTCGGATTTTGGGAGGGCGTGTTCACAGGACTGACCCACATCGACGCCCACTTTCTGAGCCAGACAAAGCAGAGCGGCGAGAACTTCCCTTACCTGGTGGCTTACCAGGCCACCGTGTGTGCTAGAGCACAAGCCCCTCCACCTAGCTGGGACCAGATGAGGAAGTGCCTGATCCGGCTGAAGCCTACACTGCACGGACCAACACCACTGCTGTATAGACTGGGCGCCGTGCAGAACGAAGTGACCCTGACACATCCCATCACCAAGTACATCATGACCTGCATGAGCGCCGACCTGGAAGTGGTCACA [서열번호 369]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 369에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 369의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 370으로 제공된다:
GCCCCUAUCACAGCCUACGCUCAGCAGACAAGAGGCCUGCUGGGCUGCAUCAUCACAAGCCUGACCGGCAGAGACAAGAACCAGGUGGAAGGCGAGGUGCAGAUCGUGUCUACAGCUACCCAGACCUUCCUGGCCACCUGUAUCAAUGGCGUGUGCUGGACCGUGUAUCACGGCGCUGGCACCAGAACAAUCGCCUCUCCAAAGGGCCCUGUGAUCCAGACCUACACCAACGUGGACCAGGAUCUCGUUGGCUGGCCUGCUCCUCAGGGCAGCAGAUCUCUGACCCCUUGUACAUGCGGCAGCAGCGACCUGUACCUGGUCACAAGACACGCCGACGUGAUCCCCGUCAGAAGAAGAGGCGAUAGCAGAGGCAGCCUGCUGAGCCCUAGACCUAUCAGCUACCUGAAGGGCAGCUCUGGCGGACCUCUGCUGUGUCCAACAGGACAUGCCGUGGGCCUGUUUAGAGCCGCCGUGUGUACAAGAGGCGUGGCCAAAGCCGUGGACUUCAUCCCCGUGGAAAACCUGGAAACCACCAUGCGGAGCCCCGUGUUCACCGACAAUUCUAGCCCUCCAGCCGUGCCUCAGAGCUUCCAAGUGGCUCAUCUGCAUGCCCCUACAGGCAGCGGCAAGAGCACAAAAGUGCCUGCCGCCUAUGCCGCCAAGGGCUAUAAGGUGCUGGUGCUGAAUCCCAGCGUGGCCGCCACACUUGGCUUUGGCGCCUAUAUGUCUAAAGCCCACGGCGUGGACCCCAACAUCAGAACCGGCGUGCGGACAAUCACAACAGGCAGCCCUAUCACCUACUCUACCUACGGCAAGUUCCUGGCCGAUGCCGGAUGUUCUGGCGGAGCCUACGACAUCAUCAUCUGCGACGAGUGCCACAGCACCGACGCCACAUCUAUCUCUGGCAUCGGCACCGUGCUGGAUCAGGCCGAAACAGCUGGUGCUAGACUGGUGGUGCUGGCCACAGCUACACCUCCAGGCUCUGUGACAGUGUCUCACCCCAAUAUCGAGGAAGUGGCCCUGUCUACAACCGGCGAGAUCCCAUUCUAUGGCAAGGCCAUUCCUCUGGAAGUGAUCAAAGGCGGCAGACACCUGAUCUUUUGCCACUCCAAGAAGAAGUGCGACGAGCUGGCCGCCAAACUGGUGGCCCUUGGAAUCAAUGCCGUGGCCUACUACAGAGGACUGGACGUGUCCGUGAUUCCCACAUCUGGCGACGUGGUGGUGGUGUCCACUGAUGCCCUGAUGACCGGCUUCACCGGCGACUUCGAUAGCGUGAUCGACUGCAAUACCUGCGUGACCCAGACCGUGGAUUUCUCUCUGGACCCCACCUUCACCAUCGAGACAACCACACUGCCUCAGGACGCCGUGUCUCGGACACAGAGAAGAGGCAGAACCGGAAGAGGCAAGCCCGGCAUCUACAGAUUUGUGGCCCCUGGCGAAAGACCCAGCGGCAUGUUUGAUAGCAGCGUGCUGUGCGAGUGCUACGAUGCUGGCUGUGCUUGGUACGAGCUGACCCCUGCCGAGACUACCGUUAGACUGCGGGCCUACAUGAACACCCCUGGCCUGCCUGUGUGUCAGGACCACCUCGGAUUUUGGGAGGGCGUGUUCACAGGACUGACCCACAUCGACGCCCACUUUCUGAGCCAGACAAAGCAGAGCGGCGAGAACUUCCCUUACCUGGUGGCUUACCAGGCCACCGUGUGUGCUAGAGCACAAGCCCCUCCACCUAGCUGGGACCAGAUGAGGAAGUGCCUGAUCCGGCUGAAGCCUACACUGCACGGACCAACACCACUGCUGUAUAGACUGGGCGCCGUGCAGAACGAAGUGACCCUGACACAUCCCAUCACCAAGUACAUCAUGACCUGCAUGAGCGCCGACCUGGAAGUGGUCACA [서열번호 370]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 370에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 DENV 1 NS4A 단백질(P17763; 게놈 폴리단백질 뎅기 바이러스 타입 1(나우루/West Pac/1974 바이러스주)), 또는 그의 동원체이다. DENV 1 NS4A 단백질의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 371로 나타낸다:
SVSGDLILEIGKLPQHLTQRAQNALDNLVMLHNSEQGGKAYRHAMEELPDTIETLMLLALIAVLTGGVTLFFLSGRGLGKTSIGLLCVIASSALLWMASVEPHWIAASIILEFFLMVLLIPEPDRQR [서열번호 371]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 371에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 DENV 1 NS4A 폴리펩티드는 다음과 같은 서열번호 372의 DNA 뉴클레오티드 서열에 의해 암호화된다:
AGCGTCTCAGGTGACCTAATATTAGAAATAGGGAAACTTCCACAACATTTAACGCAAAGGGCCCAGAACGCCTTGGACAATCTGGTTATGTTGCACAACTCTGAACAAGGAGGAAAAGCCTATAGACACGCCATGGAAGAACTACCAGACACCATAGAAACGTTAATGCTCCTAGCTTTGATAGCTGTGCTGACTGGTGGAGTGACGTTGTTCTTCCTATCAGGAAGGGGTCTAGGAAAAACATCCATTGGCCTACTCTGCGTGATTGCCTCAAGCGCACTGCTATGGATGGCCAGTGTGGAACCCCATTGGATAGCGGCCTCTATCATACTGGAGTTCTTTCTGATGGTGTTGCTTATTCCAGAGCCGGACAGACAGCGC [서열번호 372]
따라서, 바람직하게는 상기 DENV 1 NS4A 폴리펩티드는 실질적으로 서열번호 372에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 DENV 1 NS4A 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 373으로 제공된다:
TCCGTTAGCGGCGACCTGATCCTGGAAATCGGCAAGCTGCCTCAGCACCTGACACAGAGAGCACAGAACGCCCTGGACAACCTGGTCATGCTGCACAACTCTGAGCAAGGCGGCAAGGCCTACAGACACGCCATGGAAGAACTGCCCGACACCATCGAGACACTGATGCTGCTGGCCCTGATCGCTGTTCTGACAGGCGGAGTGACCCTGTTCTTCCTGTCTGGCAGAGGCCTGGGCAAGACCTCTATCGGACTGCTGTGTGTGATCGCCAGCTCTGCCCTGCTGTGGATGGCTTCTGTGGAACCTCATTGGATCGCCGCCTCTATTATCCTGGAATTCTTCCTGATGGTGCTGCTGATCCCCGAGCCTGACAGACAGAGA [서열번호 373]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 373에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 373의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 374로 제공된다:
UCCGUUAGCGGCGACCUGAUCCUGGAAAUCGGCAAGCUGCCUCAGCACCUGACACAGAGAGCACAGAACGCCCUGGACAACCUGGUCAUGCUGCACAACUCUGAGCAAGGCGGCAAGGCCUACAGACACGCCAUGGAAGAACUGCCCGACACCAUCGAGACACUGAUGCUGCUGGCCCUGAUCGCUGUUCUGACAGGCGGAGUGACCCUGUUCUUCCUGUCUGGCAGAGGCCUGGGCAAGACCUCUAUCGGACUGCUGUGUGUGAUCGCCAGCUCUGCCCUGCUGUGGAUGGCUUCUGUGGAACCUCAUUGGAUCGCCGCCUCUAUUAUCCUGGAAUUCUUCCUGAUGGUGCUGCUGAUCCCCGAGCCUGACAGACAGAGA [서열번호 374]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 374에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 DENV 1 NS2A(P17763; 게놈 폴리단백질 뎅기 바이러스 타입 1(나우루/West Pac/1974 바이러스주)), 또는 그의 동원체이다. DENV 1 NS2A의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 375로 나타낸다:
GSGEVDSFSLGLLCISIMIEEVMRSRWSRKMLMTGTLAVFLLLTMGQLTWNDLIRLCIMVGANASDKMGMGTTYLALMATFRMRPMFAVGLLFRRLTSREVLLLTVGLSLVASVELPNSLEELGDGLAMGIMMLKLLTDFQSHQLWATLLSLTFVKTTFSLHYAWKTMAMILSIVSLFPLCLSTTSQKTTWLPVLLGSLGCKPLTMFLITENKIWGRK [서열번호 375]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 375에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 DENV 1 NS2A 폴리펩티드는 다음과 같은 서열번호 376의 DNA 뉴클레오티드 서열에 의해 암호화된다:
GGGTCAGGAGAAGTGGACAGTTTTTCACTAGGACTGCTATGCATATCAATAATGATCGAAGAGGTAATGAGATCCAGATGGAGCAGAAAAATGCTGATGACTGGAACATTGGCTGTGTTCCTCCTTCTCACAATGGGACAATTGACATGGAATGATCTGATCAGGCTATGTATCATGGTTGGAGCCAACGCTTCAGACAAGATGGGGATGGGAACAACGTACCTAGCTTTGATGGCCACTTTCAGAATGAGACCAATGTTCGCAGTCGGGCTACTGTTTCGCAGATTAACATCTAGAGAAGTTCTTCTTCTTACAGTTGGATTGAGTCTGGTGGCATCTGTAGAACTACCAAATTCCTTAGAGGAGCTAGGGGATGGACTTGCAATGGGCATCATGATGTTGAAATTACTGACTGATTTTCAGTCACATCAGCTATGGGCTACCTTGCTGTCTTTAACATTTGTCAAAACAACTTTTTCATTGCACTATGCATGGAAGACAATGGCTATGATACTGTCAATTGTATCTCTCTTCCCTTTATGCCTGTCCACGACTTCTCAAAAAACAACATGGCTTCCGGTGTTGCTGGGATCTCTTGGATGCAAACCACTAACCATGTTTCTTATAACAGAAAACAAAATCTGGGGAAGGAAA [서열번호 376]
따라서, 바람직하게는 상기 DENV 1 NS2A 폴리펩티드는 실질적으로 서열번호 376에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 DENV 1 NS2A 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 377로 제공된다:
GGATCTGGCGAGGTGGACTCTTTTTCTCTGGGCCTGCTGTGCATCAGCATCATGATCGAGGAAGTGATGCGGAGCCGCTGGTCCCGGAAAATGCTGATGACTGGAACCCTGGCCGTGTTCCTGCTGCTGACAATGGGACAGCTGACCTGGAACGACCTGATCCGGCTGTGTATCATGGTCGGAGCCAACGCCAGCGACAAGATGGGCATGGGCACAACCTATCTGGCCCTGATGGCCACCTTCCGGATGAGGCCTATGTTTGCCGTGGGACTGCTGTTCAGAAGGCTGACCTCTAGAGAGGTGCTGCTGCTCACAGTGGGCCTGTCTCTGGTGGCTTCTGTGGAACTGCCCAACAGCCTGGAAGAACTCGGAGATGGACTGGCCATGGGCATTATGATGCTCAAGCTGCTGACCGACTTCCAGAGCCACCAGCTGTGGGCTACACTGCTGAGCCTGACCTTCGTGAAAACCACCTTCAGCCTGCACTACGCCTGGAAAACAATGGCCATGATCCTGAGCATCGTGTCTCTGTTCCCTCTGTGCCTGAGCACCACCAGCCAGAAAACCACATGGCTGCCTGTGCTGCTGGGCTCTCTGGGCTGTAAACCCCTGACCATGTTCCTGATCACCGAGAACAAGATCTGGGGCAGAAAG [서열번호 377]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 377에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 377의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 378로 제공된다:
GGAUCUGGCGAGGUGGACUCUUUUUCUCUGGGCCUGCUGUGCAUCAGCAUCAUGAUCGAGGAAGUGAUGCGGAGCCGCUGGUCCCGGAAAAUGCUGAUGACUGGAACCCUGGCCGUGUUCCUGCUGCUGACAAUGGGACAGCUGACCUGGAACGACCUGAUCCGGCUGUGUAUCAUGGUCGGAGCCAACGCCAGCGACAAGAUGGGCAUGGGCACAACCUAUCUGGCCCUGAUGGCCACCUUCCGGAUGAGGCCUAUGUUUGCCGUGGGACUGCUGUUCAGAAGGCUGACCUCUAGAGAGGUGCUGCUGCUCACAGUGGGCCUGUCUCUGGUGGCUUCUGUGGAACUGCCCAACAGCCUGGAAGAACUCGGAGAUGGACUGGCCAUGGGCAUUAUGAUGCUCAAGCUGCUGACCGACUUCCAGAGCCACCAGCUGUGGGCUACACUGCUGAGCCUGACCUUCGUGAAAACCACCUUCAGCCUGCACUACGCCUGGAAAACAAUGGCCAUGAUCCUGAGCAUCGUGUCUCUGUUCCCUCUGUGCCUGAGCACCACCAGCCAGAAAACCACAUGGCUGCCUGUGCUGCUGGGCUCUCUGGGCUGUAAACCCCUGACCAUGUUCCUGAUCACCGAGAACAAGAUCUGGGGCAGAAAG [서열번호 378]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 378에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 DENV 2 NS2A(P29990; 게놈 폴리단백질 뎅기 바이러스 타입 2(태국/16681/1984 바이러스주)), 또는 그의 동원체이다. DENV 2 NS2A의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 379로 나타낸다:
GHGQVDNFSLGVLGMALFLEEMLRTRVGTKHAILLVAVSFVTLIIGNMSFRDLGRVMVMVGATMTDDIGMGVTYLALLAAFKVRPTFAAGLLLRKLTSKALMMTTIGIVLSSQSTTPETILELTDALALGMMVLKMVRNMEKYQLAVTIMAILCVPNAVILQNAWKVSCTILAVVSVSPLFLTSSQQKTDWIPLALTIKGLNPTAIFLTTLSRTSKKR [서열번호 379]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 379에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 DENV 2 NS2A 폴리펩티드는 다음과 같은 서열번호 380의 DNA 뉴클레오티드 서열에 의해 암호화된다:
GGACATGGGCAGGTCGACAACTTTTCACTAGGAGTCTTGGGAATGGCATTGTTCCTGGAGGAAATGCTTAGGACCCGAGTAGGAACGAAACATGCAATACTACTAGTTGCAGTTTCTTTTGTGACATTGATCATAGGGAACATGTCCTTTAGAGACCTGGGAAGAGTAATGGTTATGGTAGGCGCCACTATGACGGATGACATAGGTATGGGCGTGACTTATCTTGCCCTACTAGCAGCCTTCAAAGTCAGACCAACTTTTGCAGCTGGACTACTCTTGAGAAAGCTGACCTCCAAGGCATTGATGATGACTACTATAGGAATTGTACTCTCCTCCCAGAGCACTACACCAGAGACCATTCTTGAGTTGACTGATGCGTTAGCCTTAGGCATGATGGTCCTCAAAATGGTGAGAAATATGGAAAAGTATCAATTGGCAGTGACTATCATGGCTATCTTGTGCGTCCCAAACGCAGTGATATTACAAAACGCATGGAAAGTGAGTTGCACGATATTGGCAGTGGTGTCCGTTTCCCCACTGTTCTTAACATCCTCACAGCAAAAAACGGATTGGATACCATTAGCGTTGACGATCAAAGGTCTCAATCCAACAGCTATTTTTCTAACAACCCTCTCAAGAACCAGCAAGAAAAGG [서열번호 380]
따라서, 바람직하게는 상기 DENV 2 NS2A 폴리펩티드는 실질적으로 서열번호 380에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 DENV 2 NS2A 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 381로 제공된다:
GGACACGGACAGGTGGACAATTTTTCCCTGGGCGTGCTCGGCATGGCCCTGTTTCTGGAAGAGATGCTGAGAACCAGAGTGGGCACCAAGCACGCCATTCTGCTGGTGGCCGTGTCCTTCGTGACACTGATCATCGGCAACATGAGCTTCCGCGACCTGGGCAGAGTGATGGTCATGGTCGGAGCCACCATGACCGACGATATCGGCATGGGCGTGACCTATCTGGCTCTGCTGGCCGCTTTTAAAGTGCGGCCTACATTTGCCGCCGGACTGCTGCTGAGAAAGCTGACATCTAAGGCCCTGATGATGACCACCATCGGCATCGTGCTGAGCAGCCAGAGCACCACACCTGAGACAATCCTGGAACTGACCGACGCTCTGGCCCTGGGAATGATGGTGCTGAAGATGGTCCGAAACATGGAAAAGTACCAGCTGGCCGTGACCATCATGGCCATCCTGTGTGTGCCCAACGCCGTGATCCTGCAGAACGCCTGGAAGGTGTCCTGTACCATCCTGGCCGTGGTGTCTGTGTCCCCTCTGTTTCTGACCAGCAGCCAGCAGAAAACCGACTGGATCCCACTGGCTCTGACCATCAAGGGCCTGAATCCTACCGCCATCTTCCTGACCACACTGAGCCGGACCAGCAAGAAGAGA [서열번호 381]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 381에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 381의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 382로 제공된다:
GGACACGGACAGGUGGACAAUUUUUCCCUGGGCGUGCUCGGCAUGGCCCUGUUUCUGGAAGAGAUGCUGAGAACCAGAGUGGGCACCAAGCACGCCAUUCUGCUGGUGGCCGUGUCCUUCGUGACACUGAUCAUCGGCAACAUGAGCUUCCGCGACCUGGGCAGAGUGAUGGUCAUGGUCGGAGCCACCAUGACCGACGAUAUCGGCAUGGGCGUGACCUAUCUGGCUCUGCUGGCCGCUUUUAAAGUGCGGCCUACAUUUGCCGCCGGACUGCUGCUGAGAAAGCUGACAUCUAAGGCCCUGAUGAUGACCACCAUCGGCAUCGUGCUGAGCAGCCAGAGCACCACACCUGAGACAAUCCUGGAACUGACCGACGCUCUGGCCCUGGGAAUGAUGGUGCUGAAGAUGGUCCGAAACAUGGAAAAGUACCAGCUGGCCGUGACCAUCAUGGCCAUCCUGUGUGUGCCCAACGCCGUGAUCCUGCAGAACGCCUGGAAGGUGUCCUGUACCAUCCUGGCCGUGGUGUCUGUGUCCCCUCUGUUUCUGACCAGCAGCCAGCAGAAAACCGACUGGAUCCCACUGGCUCUGACCAUCAAGGGCCUGAAUCCUACCGCCAUCUUCCUGACCACACUGAGCCGGACCAGCAAGAAGAGA [서열번호 382]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 382에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 DENV 4 NS2A(P09866; 게놈 폴리단백질 뎅기 바이러스 타입 4(도미니카/814669/1981 바이러스주)), 또는 그의 동원체이다. DENV 4 NS2A의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 383으로 나타낸다:
GQGTSETFSMGLLCLTLFVEECLRRRVTRKHMILVVVITLCAIILGGLTWMDLLRALIMLGDTMSGRIGGQIHLAIMAVFKMSPGYVLGVFLRKLTSRETALMVIGMAMTTVLSIPHDLMELIDGISLGLILLKIVTQFDNTQVGTLALSLTFIRSTMPLVMAWRTIMAVLFVVTLIPLCRTSCLQKQSHWVEITALILGAQALPVYLMTLMKGASRR [서열번호 383]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 383에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 DENV 4 NS2A 폴리펩티드는 다음과 같은 서열번호 384의 DNA 뉴클레오티드 서열에 의해 암호화된다:
GGACAGGGCACATCAGAAACTTTTTCTATGGGTCTGTTGTGCCTGACCTTGTTTGTGGAAGAATGCTTGAGGAGAAGAGTCACTAGGAAACACATGATATTAGTTGTGGTGATCACTCTTTGTGCTATCATCCTGGGAGGCCTCACATGGATGGACTTACTACGAGCCCTCATCATGTTGGGGGACACTATGTCTGGTAGAATAGGAGGACAGATCCACCTAGCCATCATGGCAGTGTTCAAGATGTCACCAGGATACGTGCTGGGTGTGTTTTTAAGGAAACTCACTTCAAGAGAGACAGCACTAATGGTAATAGGAATGGCCATGACAACGGTGCTTTCAATTCCACATGACCTTATGGAACTCATTGATGGAATATCACTGGGACTAATTTTGCTAAAAATAGTAACACAGTTTGACAACACCCAAGTGGGAACCTTAGCTCTTTCCTTGACTTTCATAAGATCAACAATGCCATTGGTCATGGCTTGGAGGACCATTATGGCTGTGTTGTTTGTGGTCACACTCATTCCTTTGTGCAGGACAAGCTGTCTTCAAAAACAGTCTCATTGGGTAGAAATAACAGCACTCATCCTAGGAGCCCAAGCTCTGCCAGTGTACCTAATGACTCTTATGAAAGGAGCCTCAAGAAGA [서열번호 384]
따라서, 바람직하게는 상기 DENV 4 NS2A 폴리펩티드는 실질적으로 서열번호 384에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 DENV 4 NS2A 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 385로 제공된다:
GGCCAGGGAACAAGCGAGACATTTTCCATGGGCCTGCTGTGTCTGACCCTGTTCGTGGAAGAGTGCCTGCGGAGAAGAGTGACCCGGAAGCACATGATCCTGGTGGTGGTCATCACCCTGTGCGCCATCATTCTCGGCGGCCTGACATGGATGGATCTGCTGAGAGCCCTGATCATGCTGGGCGATACCATGAGCGGCAGAATCGGCGGACAGATCCACCTGGCCATCATGGCCGTGTTCAAGATGAGCCCTGGCTACGTGCTGGGCGTGTTCCTGAGAAAGCTGACCAGCAGAGAAACAGCCCTGATGGTCATCGGAATGGCCATGACCACCGTGCTGAGCATCCCTCACGACCTGATGGAACTGATCGACGGCATCAGCCTGGGCCTGATCCTGCTGAAGATCGTGACCCAGTTCGACAACACCCAAGTGGGCACACTGGCCCTGAGCCTGACCTTCATCAGATCCACAATGCCCCTCGTGATGGCCTGGCGGACAATTATGGCCGTGCTGTTCGTCGTGACACTGATCCCTCTGTGCAGAACCAGCTGCCTGCAGAAACAGAGCCACTGGGTCGAGATCACCGCTCTGATTCTGGGAGCACAGGCCCTGCCTGTGTACCTGATGACACTTATGAAGGGCGCCAGCAGACGG [서열번호 385]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 385에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 385의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 386으로 제공된다:
GGCCAGGGAACAAGCGAGACAUUUUCCAUGGGCCUGCUGUGUCUGACCCUGUUCGUGGAAGAGUGCCUGCGGAGAAGAGUGACCCGGAAGCACAUGAUCCUGGUGGUGGUCAUCACCCUGUGCGCCAUCAUUCUCGGCGGCCUGACAUGGAUGGAUCUGCUGAGAGCCCUGAUCAUGCUGGGCGAUACCAUGAGCGGCAGAAUCGGCGGACAGAUCCACCUGGCCAUCAUGGCCGUGUUCAAGAUGAGCCCUGGCUACGUGCUGGGCGUGUUCCUGAGAAAGCUGACCAGCAGAGAAACAGCCCUGAUGGUCAUCGGAAUGGCCAUGACCACCGUGCUGAGCAUCCCUCACGACCUGAUGGAACUGAUCGACGGCAUCAGCCUGGGCCUGAUCCUGCUGAAGAUCGUGACCCAGUUCGACAACACCCAAGUGGGCACACUGGCCCUGAGCCUGACCUUCAUCAGAUCCACAAUGCCCCUCGUGAUGGCCUGGCGGACAAUUAUGGCCGUGCUGUUCGUCGUGACACUGAUCCCUCUGUGCAGAACCAGCUGCCUGCAGAAACAGAGCCACUGGGUCGAGAUCACCGCUCUGAUUCUGGGAGCACAGGCCCUGCCUGUGUACCUGAUGACACUUAUGAAGGGCGCCAGCAGACGG [서열번호 386]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 386에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 DENV 1 NS2B(P17763; 게놈 폴리단백질 뎅기 바이러스 타입 1(나우루/West Pac/1974 바이러스주)), 또는 그의 동원체이다. DENV 1 NS2B의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 387로 나타낸다:
SWPLNEGIMAVGIVSILLSSLLKNDVPLAGPLIAGGMLIACYVISGSSADLSLEKAAEVSWEEEAEHSGASHNILVEVQDDGTMKIKDEERDDTLTILLKATLLAISGVYPMSIPATLFVWYFWQKKKQR [서열번호 387]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 387에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 DENV 1 NS2B 폴리펩티드는 다음과 같은 서열번호 388의 DNA 뉴클레오티드 서열에 의해 암호화된다:
AGCTGGCCTCTCAATGAAGGAATTATGGCTGTTGGAATAGTTAGCATTCTTCTAAGTTCACTTCTCAAGAATGATGTGCCACTAGCTGGCCCACTAATAGCTGGAGGCATGCTAATAGCATGTTATGTCATATCTGGAAGCTCGGCCGATTTATCACTGGAGAAAGCGGCTGAGGTCTCCTGGGAAGAAGAAGCAGAACACTCTGGTGCCTCACACAACATACTAGTGGAGGTCCAAGATGATGGAACCATGAAGATAAAGGATGAAGAGAGAGATGACACACTCACCATTCTCCTCAAAGCAACTCTGCTAGCAATCTCAGGGGTATACCCAATGTCAATACCGGCGACCCTCTTTGTGTGGTATTTTTGGCAGAAAAAGAAACAGAGA [서열번호 388]
따라서, 바람직하게는 상기 DENV 1 NS2B 폴리펩티드는 실질적으로 서열번호 388에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 DENV 1 NS2B 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 389로 제공된다:
AGCTGGCCTCTGAACGAGGGAATTATGGCCGTGGGCATCGTGTCCATCCTGCTGTCTAGCCTGCTGAAGAACGACGTGCCACTGGCCGGACCTCTTATTGCTGGCGGAATGCTGATCGCCTGCTACGTGATCAGCGGCAGCTCTGCCGATCTGAGCCTGGAAAAAGCCGCCGAGGTGTCCTGGGAAGAAGAGGCCGAACATTCTGGCGCCTCTCACAACATCCTGGTGGAAGTGCAGGACGACGGCACCATGAAGATCAAGGACGAGGAACGGGACGACACCCTGACCATTCTGCTGAAGGCTACCCTGCTGGCCATCAGCGGAGTGTACCCTATGAGCATCCCCGCCACTCTGTTCGTGTGGTACTTCTGGCAGAAGAAGAAGCAGCGG [서열번호 389]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 389에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 389의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 390으로 제공된다:
AGCUGGCCUCUGAACGAGGGAAUUAUGGCCGUGGGCAUCGUGUCCAUCCUGCUGUCUAGCCUGCUGAAGAACGACGUGCCACUGGCCGGACCUCUUAUUGCUGGCGGAAUGCUGAUCGCCUGCUACGUGAUCAGCGGCAGCUCUGCCGAUCUGAGCCUGGAAAAAGCCGCCGAGGUGUCCUGGGAAGAAGAGGCCGAACAUUCUGGCGCCUCUCACAACAUCCUGGUGGAAGUGCAGGACGACGGCACCAUGAAGAUCAAGGACGAGGAACGGGACGACACCCUGACCAUUCUGCUGAAGGCUACCCUGCUGGCCAUCAGCGGAGUGUACCCUAUGAGCAUCCCCGCCACUCUGUUCGUGUGGUACUUCUGGCAGAAGAAGAAGCAGCGG [서열번호 390]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 390에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 DENV 2 NS2B(P29990; 게놈 폴리단백질 뎅기 바이러스 타입 2(태국/16681/1984 바이러스주)), 또는 그의 동원체이다. DENV 2 NS2B의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 391로 나타낸다:
SWPLNEAIMAVGMVSILASSLLKNDIPMTGPLVAGGPLTVCYVLTGRSADLELERAADVKWEDQAEISGSSPILSITISEDGSMSIKNEEEEQTLTILIRTGLLVISGLFPVSIPITAAAWYLWEVKKQR [서열번호 391]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 391에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 DENV 2 NS2B 폴리펩티드는 다음과 같은 서열번호 392의 DNA 뉴클레오티드 서열에 의해 암호화된다:
AGCTGGCCATTAAATGAGGCTATCATGGCAGTCGGGATGGTGAGCATTTTAGCCAGTTCTCTCCTAAAAAATGATATTCCCATGACAGGACCATTAGTGGCTGGAGGGCCCCTCACTGTGTGCTACGTGCTCACTGGACGATCGGCCGATTTGGAACTGGAGAGAGCAGCCGATGTCAAATGGGAAGACCAGGCAGAGATATCAGGAAGCAGCCCAATCCTGTCAATAACAATATCAGAAGATGGTAGCATGTCGATAAAAAATGAAGAGGAAGAACAAACACTGACCATACTCATTAGAACAGGATTGCTGGTGATCTCAGGACTTTTTCCTGTATCAATACCAATCACGGCAGCAGCATGGTACCTGTGGGAAGTGAAGAAACAACGG [서열번호 392]
따라서, 바람직하게는 상기 DENV 2 NS2B 폴리펩티드는 실질적으로 서열번호 392에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 DENV 2 NS2B 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 393으로 제공된다:
AGCTGGCCTCTGAACGAGGCCATTATGGCCGTCGGCATGGTGTCTATCCTGGCCAGCAGCCTGCTGAAGAACGACATCCCTATGACAGGCCCTCTGGTGGCTGGTGGACCTCTGACAGTGTGTTACGTGCTGACAGGCAGAAGCGCCGACCTGGAACTTGAAAGGGCCGCTGATGTGAAGTGGGAAGATCAGGCCGAGATCAGCGGCAGCAGCCCTATCCTGAGCATCACCATCAGCGAGGACGGCAGCATGAGCATCAAGAACGAGGAAGAGGAACAGACCCTGACCATCCTGATCAGAACCGGCCTGCTGGTCATCAGCGGACTGTTCCCTGTGTCAATCCCCATCACAGCCGCCGCTTGGTATCTGTGGGAAGTGAAGAAGCAGCGG [서열번호 393]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 393에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 393의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 394로 제공된다:
AGCUGGCCUCUGAACGAGGCCAUUAUGGCCGUCGGCAUGGUGUCUAUCCUGGCCAGCAGCCUGCUGAAGAACGACAUCCCUAUGACAGGCCCUCUGGUGGCUGGUGGACCUCUGACAGUGUGUUACGUGCUGACAGGCAGAAGCGCCGACCUGGAACUUGAAAGGGCCGCUGAUGUGAAGUGGGAAGAUCAGGCCGAGAUCAGCGGCAGCAGCCCUAUCCUGAGCAUCACCAUCAGCGAGGACGGCAGCAUGAGCAUCAAGAACGAGGAAGAGGAACAGACCCUGACCAUCCUGAUCAGAACCGGCCUGCUGGUCAUCAGCGGACUGUUCCCUGUGUCAAUCCCCAUCACAGCCGCCGCUUGGUAUCUGUGGGAAGUGAAGAAGCAGCGG [서열번호 394]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 394에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 DENV 4 NS2B(P09866; 게놈 폴리단백질 바이러스 타입 4(도미니카/814669/1981 바이러스주)), 또는 그의 동원체이다. DENV 4 NS2B의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 395로 나타낸다:
SWPLNEGIMAVGLVSLLGSALLKNDVPLAGPMVAGGLLLAAYVMSGSSADLSLEKAANVQWDEMADITGSSPIIEVKQDEDGSFSIRDVEETNMITLLVKLALITVSGLYPLAIPVTMTLWYMWQVKTQR [서열번호 395]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 395에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 DENV 4 NS2B 폴리펩티드는 다음과 같은 서열번호 396의 DNA 뉴클레오티드 서열에 의해 암호화된다:
TCTTGGCCTCTTAACGAGGGCATAATGGCTGTGGGTTTGGTTAGTCTCTTAGGAAGCGCTCTTTTAAAGAATGATGTCCCTTTAGCTGGCCCAATGGTGGCAGGAGGCTTACTTCTGGCGGCTTACGTGATGAGTGGTAGCTCAGCAGATCTGTCACTAGAGAAGGCCGCCAACGTGCAGTGGGATGAAATGGCAGACATAACAGGCTCAAGCCCAATCATAGAAGTGAAGCAGGATGAAGATGGCTCTTTCTCCATACGGGACGTCGAGGAAACCAATATGATAACCCTTTTGGTGAAACTGGCACTGATAACAGTGTCAGGTCTCTACCCCTTGGCAATTCCAGTCACAATGACCTTATGGTACATGTGGCAAGTGAAAACACAAAGA [서열번호 396]
따라서, 바람직하게는 상기 DENV 4 NS2B 폴리펩티드는 실질적으로 서열번호 396에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 DENV 4 NS2B 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 397로 제공된다:
AGCTGGCCTCTGAACGAGGGAATCATGGCCGTTGGCCTGGTGTCTCTGCTGGGATCTGCCCTGCTGAAGAACGATGTGCCTCTGGCCGGACCTATGGTTGCTGGTGGACTGCTGCTGGCCGCCTATGTGATGTCTGGAAGCAGCGCCGATCTGAGCCTGGAAAAGGCCGCTAACGTGCAGTGGGACGAGATGGCCGATATCACAGGCAGCAGCCCCATCATCGAAGTGAAGCAGGATGAGGACGGCAGCTTCAGCATCCGCGACGTGGAAGAGACAAACATGATCACCCTGCTGGTCAAGCTGGCCCTGATCACCGTGTCTGGCCTGTATCCTCTGGCTATCCCCGTGACCATGACACTGTGGTACATGTGGCAAGTGAAAACCCAGCGG [서열번호 397]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 397에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 397의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 398로 제공된다:
AGCUGGCCUCUGAACGAGGGAAUCAUGGCCGUUGGCCUGGUGUCUCUGCUGGGAUCUGCCCUGCUGAAGAACGAUGUGCCUCUGGCCGGACCUAUGGUUGCUGGUGGACUGCUGCUGGCCGCCUAUGUGAUGUCUGGAAGCAGCGCCGAUCUGAGCCUGGAAAAGGCCGCUAACGUGCAGUGGGACGAGAUGGCCGAUAUCACAGGCAGCAGCCCCAUCAUCGAAGUGAAGCAGGAUGAGGACGGCAGCUUCAGCAUCCGCGACGUGGAAGAGACAAACAUGAUCACCCUGCUGGUCAAGCUGGCCCUGAUCACCGUGUCUGGCCUGUAUCCUCUGGCUAUCCCCGUGACCAUGACACUGUGGUACAUGUGGCAAGUGAAAACCCAGCGG [서열번호 398]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 398에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 WNV NS4A(P06935; 게놈 폴리단백질 웨스트 나일 바이러스(West Nile virus) NS4A), 또는 그의 동원체이다. WNV NS4A의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 399로 나타낸다:
SQIGLVEVLGRMPEHFMVKTWEALDTMYVVATAEKGGRAHRMALEELPDALQTIVLIALLSVMSLGVFFLLMQRKGIGKIGLGGVILGAATFFCWMAEVPGTKIAGMLLLSLLLMIVLIPEPEKQR [서열번호 399]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 399에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 WNV NS4A 폴리펩티드는 다음과 같은 서열번호 400의 DNA 뉴클레오티드 서열에 의해 암호화된다:
TCACAAATCGGGCTCGTTGAGGTGCTCGGGAGAATGCCTGAACACTTCATGGTGAAAACTTGGGAGGCATTGGACACGATGTATGTGGTGGCGACCGCTGAAAAAGGAGGCCGAGCTCACAGGATGGCTCTTGAGGAGCTACCGGACGCCCTTCAGACAATAGTTTTGATTGCACTATTGAGTGTGATGTCCTTAGGTGTGTTTTTTCTACTCATGCAAAGGAAGGGCATTGGTAAGATTGGCTTGGGAGGAGTAATCTTAGGAGCTGCCACATTCTTCTGCTGGATGGCTGAAGTCCCAGGAACGAAAATAGCAGGCATGCTCCTGCTTTCCCTGCTGCTCATGATTGTTTTGATTCCGGAGCCGGAAAAGCAGCGC [서열번호 400]
따라서, 바람직하게는 상기 WNV NS4A 폴리펩티드는 실질적으로 서열번호 400에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 WNV NS4A 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 401로 제공된다:
TCTCAGATCGGCCTGGTGGAAGTGCTGGGCAGAATGCCTGAGCACTTCATGGTCAAGACCTGGGAAGCCCTGGACACTATGTACGTGGTGGCCACAGCCGAGAAAGGCGGCAGAGCACATAGAATGGCCCTGGAAGAACTGCCCGACGCTCTGCAGACAATCGTGCTGATTGCCCTGCTGAGCGTGATGAGCCTGGGCGTGTTCTTCCTGCTGATGCAGAGAAAAGGCATCGGCAAGATCGGACTCGGCGGCGTTATACTGGGAGCCGCCACCTTCTTTTGCTGGATGGCTGAAGTGCCCGGCACCAAGATTGCCGGAATGCTGCTGCTGTCCCTGCTGCTGATGATTGTGCTGATCCCCGAGCCTGAGAAGCAGAGA [서열번호 401]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 401에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 401의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 402로 제공된다:
UCUCAGAUCGGCCUGGUGGAAGUGCUGGGCAGAAUGCCUGAGCACUUCAUGGUCAAGACCUGGGAAGCCCUGGACACUAUGUACGUGGUGGCCACAGCCGAGAAAGGCGGCAGAGCACAUAGAAUGGCCCUGGAAGAACUGCCCGACGCUCUGCAGACAAUCGUGCUGAUUGCCCUGCUGAGCGUGAUGAGCCUGGGCGUGUUCUUCCUGCUGAUGCAGAGAAAAGGCAUCGGCAAGAUCGGACUCGGCGGCGUUAUACUGGGAGCCGCCACCUUCUUUUGCUGGAUGGCUGAAGUGCCCGGCACCAAGAUUGCCGGAAUGCUGCUGCUGUCCCUGCUGCUGAUGAUUGUGCUGAUCCCCGAGCCUGAGAAGCAGAGA [서열번호 402]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 402에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 WNV NS4B(P06935; 게놈 폴리단백질 웨스트 나일 바이러스 NS4A), 또는 그의 동원체이다. WNV NS4B의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 403으로 나타낸다:
NEMGWLDKTKNDIGSLLGHRPEARETTLGVESFLLDLRPATAWSLYAVTTAVLTPLLKHLITSDYINTSLTSINVQASALFTLARGFPFVDVGVSALLLAVGCWGQVTLTVTVTAAALLFCHYAYMVPGWQAEAMRSAQRRTAAGIMKNVVVDGIVATDVPELERTTPVMQKKVGQIILILVSMAAVVVNPSVRTVREAGILTTAAAVTLWENGASSVWNATTAIGLCHIMRGGWLSCLSIMWTLIKNMEKPGLKR [서열번호 403]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 403에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 WNV NS4B 폴리펩티드는 다음과 같은 서열번호 404의 DNA 뉴클레오티드 서열에 의해 암호화된다:
AATGAAATGGGCTGGCTGGACAAGACCAAGAATGACATTGGCAGCCTGTTGGGGCACAGGCCAGAAGCTAGAGAGACGACCCTGGGAGTTGAGAGCTTCTTACTTGATCTGCGGCCGGCCACGGCATGGTCGCTCTATGCCGTAACGACAGCCGTTCTCACCCCTTTGCTGAAGCATCTAATCACGTCAGACTACATCAACACTTCGTTGACCTCAATAAACGTCCAAGCCAGCGCGTTGTTCACTTTGGCCAGAGGCTTCCCTTTTGTGGACGTTGGTGTGTCAGCTCTCTTGCTGGCGGTCGGGTGCTGGGGTCAGGTGACTCTGACTGTGACTGTGACTGCAGCTGCTCTGCTCTTTTGCCACTATGCTTACATGGTGCCAGGCTGGCAAGCGGAAGCCATGCGATCTGCCCAGCGGCGGACAGCTGCTGGCATCATGAAAAATGTAGTGGTGGATGGGATCGTGGCCACTGATGTACCTGAACTTGAACGAACAACTCCAGTCATGCAGAAAAAAGTTGGACAGATCATATTGATCTTGGTATCAATGGCCGCGGTGGTCGTCAATCCATCAGTGAGAACCGTCAGAGAGGCCGGAATTCTGACTACAGCAGCAGCAGTCACCCTATGGGAGAATGGTGCTAGTTCAGTGTGGAATGCAACGACAGCTATTGGCCTTTGTCACATCATGCGAGGAGGATGGCTCTCGTGTCTCTCCATCATGTGGACTCTCATCAAAAACATGGAGAAACCAGGCCTCAAGAGG [서열번호 404]
따라서, 바람직하게는 상기 WNV NS4B 폴리펩티드는 실질적으로 서열번호 404에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 WNV NS4B 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 405로 제공된다:
AACGAGATGGGCTGGCTGGACAAGACCAAGAACGACATCGGAAGCCTGCTGGGCCACAGACCTGAGGCCAGAGAAACAACCCTGGGCGTCGAGAGCTTCCTGCTGGATCTTAGACCTGCCACCGCTTGGAGCCTGTACGCCGTTACAACAGCCGTGCTGACCCCTCTGCTGAAGCACCTGATCACCAGCGACTACATCAACACCAGCCTGACCAGCATCAACGTGCAGGCCAGCGCTCTGTTTACCCTGGCCAGAGGCTTCCCCTTTGTGGACGTGGGAGTTTCTGCTCTGCTGCTGGCCGTTGGCTGTTGGGGACAAGTGACCCTGACCGTGACAGTGACTGCTGCCGCTCTGCTGTTCTGCCACTACGCCTATATGGTGCCTGGATGGCAGGCCGAGGCCATGAGATCTGCCCAGAGAAGAACAGCCGCCGGAATCATGAAGAACGTGGTGGTGGATGGCATCGTGGCCACCGACGTTCCAGAGCTGGAAAGAACCACACCTGTGATGCAGAAGAAAGTCGGCCAGATCATCCTGATCCTGGTGTCCATGGCCGCCGTGGTGGTCAATCCTAGCGTGCGGACAGTTAGAGAGGCCGGCATCCTGACAACAGCTGCCGCTGTTACCCTGTGGGAGAATGGCGCTAGCAGCGTGTGGAATGCCACCACAGCCATCGGCCTGTGCCACATCATGAGAGGCGGCTGGCTGAGCTGCCTGAGCATCATGTGGACCCTGATCAAGAACATGGAAAAGCCCGGCCTGAAGCGG [서열번호 405]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 405에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 405의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 406으로 제공된다:
AACGAGAUGGGCUGGCUGGACAAGACCAAGAACGACAUCGGAAGCCUGCUGGGCCACAGACCUGAGGCCAGAGAAACAACCCUGGGCGUCGAGAGCUUCCUGCUGGAUCUUAGACCUGCCACCGCUUGGAGCCUGUACGCCGUUACAACAGCCGUGCUGACCCCUCUGCUGAAGCACCUGAUCACCAGCGACUACAUCAACACCAGCCUGACCAGCAUCAACGUGCAGGCCAGCGCUCUGUUUACCCUGGCCAGAGGCUUCCCCUUUGUGGACGUGGGAGUUUCUGCUCUGCUGCUGGCCGUUGGCUGUUGGGGACAAGUGACCCUGACCGUGACAGUGACUGCUGCCGCUCUGCUGUUCUGCCACUACGCCUAUAUGGUGCCUGGAUGGCAGGCCGAGGCCAUGAGAUCUGCCCAGAGAAGAACAGCCGCCGGAAUCAUGAAGAACGUGGUGGUGGAUGGCAUCGUGGCCACCGACGUUCCAGAGCUGGAAAGAACCACACCUGUGAUGCAGAAGAAAGUCGGCCAGAUCAUCCUGAUCCUGGUGUCCAUGGCCGCCGUGGUGGUCAAUCCUAGCGUGCGGACAGUUAGAGAGGCCGGCAUCCUGACAACAGCUGCCGCUGUUACCCUGUGGGAGAAUGGCGCUAGCAGCGUGUGGAAUGCCACCACAGCCAUCGGCCUGUGCCACAUCAUGAGAGGCGGCUGGCUGAGCUGCCUGAGCAUCAUGUGGACCCUGAUCAAGAACAUGGAAAAGCCCGGCCUGAAGCGG [서열번호 406]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 406에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 광견병 바이러스 PP(P69479; 인단백질 광견병 바이러스(ERA 바이러스주)), 또는 그의 동원체이다. 광견병 바이러스 PP의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 407로 나타낸다:
MSKIFVNPSAIRAGLADLEMAEETVDLINRNIEDNQAHLQGEPIEVDNLPEDMGRLHLDDGKSPNPGEMAKVGEGKYREDFQMDEGEDPSFLFQSYLENVGVQIVRQMRSGERFLKIWSQTVEEIISYVAVNFPNPPGKSSEDKSTQTTGRELKKETTPTPSQRESQSSKARMAAQTASGPPALEWSATNEKDDLSVEAEIAHQIAESFSKKYKFPSRSSGILLYNFEQLKMNLDDIVKEAKNVPGVTRLAHDGSKLPLRCVLGWVALANSKKFQLLVESDKLSKIMQDDLNRYTSC [서열번호 407]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 407에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 광견병 바이러스 PP 폴리펩티드는 다음과 같은 서열번호 408의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGAGCAAGATCTTTGTCAATCCTAGTGCTATTAGAGCCGGTCTGGCCGATCTTGAGATGGCTGAAGAAACTGTTGATCTGATCAATAGAAATATCGAAGACAATCAGGCTCATCTCCAAGGGGAACCCATAGAAGTGGACAATCTCCCTGAGGATATGGGGCGACTTCACCTGGATGATGGAAAATCGCCCAACCCTGGTGAGATGGCCAAGGTGGGAGAAGGCAAGTATCGAGAGGACTTTCAGATGGATGAAGGAGAGGATCCTAGCTTCCTGTTCCAGTCATACCTGGAAAATGTTGGAGTCCAAATAGTCAGACAAATGAGGTCAGGAGAGAGATTTCTCAAGATATGGTCACAGACCGTAGAAGAGATTATATCCTATGTCGCGGTCAACTTTCCCAACCCTCCAGGAAAGTCTTCAGAGGATAAATCAACCCAGACTACTGGCCGAGAGCTCAAGAAGGAGACAACACCCACTCCTTCTCAGAGAGAAAGCCAATCATCGAAAGCCAGGATGGCGGCTCAAACTGCTTCTGGCCCTCCAGCCCTTGAATGGTCGGCCACCAATGAAAAGGATGATCTATCAGTGGAGGCTGAGATCGCTCACCAGATTGCAGAAAGTTTCTCCAAAAAATATAAGTTTCCCTCTCGATCCTCAGGGATACTCTTGTATAATTTTGAGCAATTGAAAATGAACCTTGATGATATAGTTAAAGAGGCAAAAAATGTACCAGGTGTGACCCGTTTAGCCCATGACGGGTCCAAACTCCCCCTAAGATGTGTACTGGGATGGGTCGCTTTGGCCAACTCTAAGAAATTCCAGTTGTTAGTCGAATCCGACAAGCTGAGTAAAATCATGCAAGATGACTTGAATCGCTATACATCTTGC [서열번호 408]
따라서, 바람직하게는 상기 광견병 바이러스 PP 폴리펩티드는 실질적으로 서열번호 408에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 광견병 바이러스 PP 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 409로 제공된다:
ATGAGCAAGATCTTCGTGAACCCCAGCGCCATCAGAGCCGGACTGGCTGATCTGGAAATGGCCGAGGAAACCGTGGACCTGATCAACCGGAACATCGAGGACAATCAGGCCCATCTGCAGGGCGAGCCTATCGAGGTTGACAACCTGCCTGAGGACATGGGCAGACTGCACCTGGATGATGGCAAGAGCCCTAATCCTGGCGAGATGGCCAAAGTCGGCGAGGGCAAGTACCGCGAGGACTTCCAAATGGACGAGGGCGAAGATCCCAGCTTCCTGTTCCAGTCCTACCTGGAAAACGTGGGCGTGCAGATCGTGCGGCAGATGAGAAGCGGCGAGCGGTTCCTGAAGATCTGGTCCCAGACCGTGGAAGAGATCATCAGCTACGTGGCCGTGAACTTCCCCAATCCTCCAGGCAAGAGCAGCGAGGACAAGAGCACACAGACCACCGGCAGAGAGCTGAAGAAAGAGACAACCCCTACACCTAGCCAGAGAGAGAGCCAGAGCAGCAAGGCCAGAATGGCCGCTCAGACAGCTTCTGGACCTCCTGCACTTGAGTGGAGCGCCACCAACGAGAAGGACGACCTGTCTGTGGAAGCCGAGATCGCCCACCAGATCGCCGAGAGCTTCAGCAAGAAGTACAAGTTCCCCAGCAGAAGCAGCGGCATCCTGCTGTACAACTTCGAGCAGCTGAAGATGAACCTGGACGACATCGTGAAAGAGGCCAAGAACGTCCCCGGCGTGACAAGACTGGCCCACGATGGATCTAAGCTGCCCCTGAGATGTGTGCTCGGATGGGTTGCCCTGGCCAACAGCAAGAAATTCCAGCTGCTGGTGGAAAGCGACAAGCTGTCCAAGATCATGCAGGACGATCTGAACCGGTACACCAGCTGC [서열번호 409]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 409에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 409의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 410으로 제공된다:
AUGAGCAAGAUCUUCGUGAACCCCAGCGCCAUCAGAGCCGGACUGGCUGAUCUGGAAAUGGCCGAGGAAACCGUGGACCUGAUCAACCGGAACAUCGAGGACAAUCAGGCCCAUCUGCAGGGCGAGCCUAUCGAGGUUGACAACCUGCCUGAGGACAUGGGCAGACUGCACCUGGAUGAUGGCAAGAGCCCUAAUCCUGGCGAGAUGGCCAAAGUCGGCGAGGGCAAGUACCGCGAGGACUUCCAAAUGGACGAGGGCGAAGAUCCCAGCUUCCUGUUCCAGUCCUACCUGGAAAACGUGGGCGUGCAGAUCGUGCGGCAGAUGAGAAGCGGCGAGCGGUUCCUGAAGAUCUGGUCCCAGACCGUGGAAGAGAUCAUCAGCUACGUGGCCGUGAACUUCCCCAAUCCUCCAGGCAAGAGCAGCGAGGACAAGAGCACACAGACCACCGGCAGAGAGCUGAAGAAAGAGACAACCCCUACACCUAGCCAGAGAGAGAGCCAGAGCAGCAAGGCCAGAAUGGCCGCUCAGACAGCUUCUGGACCUCCUGCACUUGAGUGGAGCGCCACCAACGAGAAGGACGACCUGUCUGUGGAAGCCGAGAUCGCCCACCAGAUCGCCGAGAGCUUCAGCAAGAAGUACAAGUUCCCCAGCAGAAGCAGCGGCAUCCUGCUGUACAACUUCGAGCAGCUGAAGAUGAACCUGGACGACAUCGUGAAAGAGGCCAAGAACGUCCCCGGCGUGACAAGACUGGCCCACGAUGGAUCUAAGCUGCCCCUGAGAUGUGUGCUCGGAUGGGUUGCCCUGGCCAACAGCAAGAAAUUCCAGCUGCUGGUGGAAAGCGACAAGCUGUCCAAGAUCAUGCAGGACGAUCUGAACCGGUACACCAGCUGC [서열번호 410]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 410에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 PEDV N 단백질(Q07499; 핵단백질 돼지 유행성 설사 바이러스(CV777 바이러스주)), 또는 그의 동원체이다. PEDV N 단백질의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 411로 나타낸다:
MASVSFQDRGRKRVPLSLYAPLRVTNDKPLSKVLANNAVPTNKGNKDQQIGYWNEQIRWRMRRGERIEQPSNWHFYYLGTGPHGDLRYRTRTEGVFWVAKEGAKTEPTNLGVRKASEKPIIPKFSQQLPSVVEIVEPNTPPASRANSRSRSRGNGNNRSRSPSNNRGNNQSRGNSQNRGNNQGRGASQNRGGNNNNNNKSRNQSNNRNQSNDRGGVTSRDDLVAAVKDALKSLGIGENPDRHKQQQKPKQEKSDNSGKNTPKKNKSRATSKERDLKDIPEWRRIPKGENSVAACFGPRGGFKNFGDAEFVEKGVDASGYAQIASLAPNVAALLFGGNVAVRELADSYEITYNYKMTVPKSDPNVELLVSQVDAFKTGNAKLQRKKEKKNKRETTLQQHEEAIYDDVGAPSDVTHANLEWDTAVDGGDTAVEIINEIFDTGN [서열번호 411]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 411에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 PEDV N 폴리펩티드는 다음과 같은 서열번호 412의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGCTTCTGTCAGCTTTCAGGATCGTGGCCGCAAACGGGTGCCATTATCTCTCTATGCCCCTCTTAGGGTTACTAATGACAAGCCCCTTTCTAAGGTACTTGCAAACAACGCTGTACCCACTAACAAGGGGAATAAGGACCAGCAAATTGGGTACTGGAATGAGCAAATTCGCTGGCGCATGCGCCGTGGTGAGCGAATTGAACAACCTTCCAATTGGCATTTCTACTACCTCGGAACAGGACCTCACGGCGACCTCCGTTATAGGACTCGTACTGAGGGTGTTTTCTGGGTTGCTAAAGAAGGCGCAAAGACTGAACCCACTAATTTGGGTGTCAGAAAGGCGTCTGAAAAGCCAATCATTCCAAAATTCTCTCAACAGCTCCCCAGTGTAGTTGAGATTGTTGAACCTAACACACCTCCTGCTTCACGTGCAAATTCGCGTAGCAGGAGTCGTGGCAATGGCAACAATAGGTCTAGATCTCCAAGTAACAACAGAGGCAATAACCAGTCCCGTGGTAATTCACAGAATCGTGGAAATAACCAGGGTCGTGGAGCTTCTCAGAACAGAGGAGGCAATAATAATAACAATAACAAGTCTCGTAACCAGTCCAATAACAGGAACCAGTCAAATGACCGTGGTGGTGTAACATCACGCGATGATCTGGTGGCTGCTGTCAAGGATGCACTTAAATCTTTGGGTATTGGAGAAAATCCTGACAGGCATAAGCAACAGCAGAAGCCTAAGCAGGAAAAGTCTGACAACAGCGGCAAAAATACACCTAAGAAGAACAAATCCAGGGCCACTTCGAAGGAACGTGACCTCAAAGACATCCCAGAGTGGAGGAGAATTCCCAAGGGCGAAAATAGCGTAGCAGCTTGCTTCGGACCCAGAGGGGGCTTCAAAAACTTTGGAGATGCGGAATTTGTCGAAAAAGGTGTTGATGCGTCAGGCTATGCTCAGATCGCCAGTTTAGCACCAAATGTTGCAGCATTGCTCTTTGGTGGTAATGTGGCTGTTCGTGAGCTAGCGGACTCTTACGAGATTACATACAACTATAAAATGACTGTGCCAAAGTCAGATCCAAATGTTGAGCTTCTTGTTTCACAGGTGGATGCATTTAAAACTGGGAATGCAAAACTCCAGAGAAAGAAGGAAAAGAAGAACAAGCGTGAAACCACGCTGCAGCAGCATGAAGAGGCCATCTACGATGATGTGGGTGCGCCATCTGATGTGACCCATGCCAATCTGGAATGGGACACAGCTGTTGATGGTGGTGATACGGCCGTTGAAATTATCAACGAGATCTTCGATACAGGAAAT [서열번호 412]
따라서, 바람직하게는 상기 PEDV N 폴리펩티드는 실질적으로 서열번호 412에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 PEDV N 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 413으로 제공된다:
ATGGCCAGCGTCAGCTTTCAGGACCGGGGCAGAAAAAGAGTGCCCCTGTCTCTGTACGCCCCTCTGAGAGTGACCAACGACAAGCCCCTGAGCAAGGTGCTGGCCAACAATGCCGTGCCTACCAACAAGGGCAACAAGGACCAGCAGATCGGCTACTGGAACGAGCAGATCCGGTGGCGGATGAGAAGAGGCGAGAGAATCGAGCAGCCCAGCAACTGGCACTTCTACTACCTCGGCACAGGCCCTCACGGCGACCTGAGATACAGAACCAGAACCGAGGGCGTGTTCTGGGTCGCCAAAGAGGGCGCCAAGACCGAGCCTACAAATCTCGGCGTCAGAAAGGCCAGCGAGAAGCCTATCATCCCCAAGTTCAGCCAGCAGCTGCCCAGCGTGGTGGAAATCGTGGAACCCAATACTCCTCCTGCCAGCCGGGCCAACAGCAGAAGCAGATCTAGAGGCAACGGCAACAATCGGAGCAGAAGCCCCAGCAACAACCGGGGCAACAACCAGTCCAGAGGCAACAGCCAGAACCGCGGAAACAATCAAGGCAGAGGCGCTAGCCAGAACAGAGGCGGCAACAACAACAATAACAACAAGAGCCGGAACCAGTCTAACAACCGCAACCAGAGCAACGATAGAGGCGGCGTGACCAGCAGGGATGATCTGGTGGCTGCCGTGAAGGATGCCCTGAAGTCTCTCGGCATCGGCGAGAACCCCGACAGACACAAGCAGCAGCAGAAACCCAAGCAAGAGAAGTCCGACAACAGCGGCAAGAACACCCCTAAGAAGAACAAGAGCAGGGCCACCAGCAAAGAGCGGGACCTGAAGGATATTCCCGAGTGGCGGAGAATCCCCAAGGGCGAGAATTCTGTGGCCGCCTGCTTTGGACCAAGAGGCGGCTTCAAGAATTTCGGCGACGCCGAGTTCGTGGAAAAAGGCGTGGACGCCTCTGGCTATGCCCAGATTGCATCTCTGGCCCCTAATGTGGCTGCCCTGCTGTTTGGCGGAAACGTGGCCGTTAGAGAGCTGGCCGATAGCTACGAGATCACCTACAACTACAAGATGACCGTGCCTAAGAGCGACCCCAACGTGGAACTGCTGGTGTCTCAGGTGGACGCATTCAAGACCGGCAACGCCAAGCTGCAGCGCAAGAAAGAGAAGAAAAACAAGCGCGAGACAACCCTGCAGCAGCACGAGGAAGCTATCTACGACGACGTGGGAGCCCCTTCCGATGTGACACACGCCAACCTGGAATGGGACACAGCAGTGGATGGCGGCGATACCGCCGTGGAAATCATCAACGAGATCTTCGACACCGGCAAC [서열번호 413]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 413에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 413의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 414로 제공된다:
AUGGCCAGCGUCAGCUUUCAGGACCGGGGCAGAAAAAGAGUGCCCCUGUCUCUGUACGCCCCUCUGAGAGUGACCAACGACAAGCCCCUGAGCAAGGUGCUGGCCAACAAUGCCGUGCCUACCAACAAGGGCAACAAGGACCAGCAGAUCGGCUACUGGAACGAGCAGAUCCGGUGGCGGAUGAGAAGAGGCGAGAGAAUCGAGCAGCCCAGCAACUGGCACUUCUACUACCUCGGCACAGGCCCUCACGGCGACCUGAGAUACAGAACCAGAACCGAGGGCGUGUUCUGGGUCGCCAAAGAGGGCGCCAAGACCGAGCCUACAAAUCUCGGCGUCAGAAAGGCCAGCGAGAAGCCUAUCAUCCCCAAGUUCAGCCAGCAGCUGCCCAGCGUGGUGGAAAUCGUGGAACCCAAUACUCCUCCUGCCAGCCGGGCCAACAGCAGAAGCAGAUCUAGAGGCAACGGCAACAAUCGGAGCAGAAGCCCCAGCAACAACCGGGGCAACAACCAGUCCAGAGGCAACAGCCAGAACCGCGGAAACAAUCAAGGCAGAGGCGCUAGCCAGAACAGAGGCGGCAACAACAACAAUAACAACAAGAGCCGGAACCAGUCUAACAACCGCAACCAGAGCAACGAUAGAGGCGGCGUGACCAGCAGGGAUGAUCUGGUGGCUGCCGUGAAGGAUGCCCUGAAGUCUCUCGGCAUCGGCGAGAACCCCGACAGACACAAGCAGCAGCAGAAACCCAAGCAAGAGAAGUCCGACAACAGCGGCAAGAACACCCCUAAGAAGAACAAGAGCAGGGCCACCAGCAAAGAGCGGGACCUGAAGGAUAUUCCCGAGUGGCGGAGAAUCCCCAAGGGCGAGAAUUCUGUGGCCGCCUGCUUUGGACCAAGAGGCGGCUUCAAGAAUUUCGGCGACGCCGAGUUCGUGGAAAAAGGCGUGGACGCCUCUGGCUAUGCCCAGAUUGCAUCUCUGGCCCCUAAUGUGGCUGCCCUGCUGUUUGGCGGAAACGUGGCCGUUAGAGAGCUGGCCGAUAGCUACGAGAUCACCUACAACUACAAGAUGACCGUGCCUAAGAGCGACCCCAACGUGGAACUGCUGGUGUCUCAGGUGGACGCAUUCAAGACCGGCAACGCCAAGCUGCAGCGCAAGAAAGAGAAGAAAAACAAGCGCGAGACAACCCUGCAGCAGCACGAGGAAGCUAUCUACGACGACGUGGGAGCCCCUUCCGAUGUGACACACGCCAACCUGGAAUGGGACACAGCAGUGGAUGGCGGCGAUACCGCCGUGGAAAUCAUCAACGAGAUCUUCGACACCGGCAAC [서열번호 414]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 414에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 HSV1 ICP27(P10238; ICP27 mRNA 내보냄(export) 인자 인간 헤르페스바이러스 1(17 바이러스주)), 또는 그의 동원체이다. HSV1 ICP27의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 415로 나타낸다:
MATDIDMLIDLGLDLSDSDLDEDPPEPAESRRDDLESDSSGECSSSDEDMEDPHGEDGPEPILDAARPAVRPSRPEDPGVPSTQTPRPTERQGPNDPQPAPHSVWSRLGARRPSCSPEQHGGKVARLQPPPTKAQPARGGRRGRRRGRGRGGPGAADGLSDPRRRAPRTNRNPGGPRPGAGWTDGPGAPHGEAWRGSEQPDPPGGQRTRGVRQAPPPLMTLAIAPPPADPRAPAPERKAPAADTIDATTRLVLRSISERAAVDRISESFGRSAQVMHDPFGGQPFPAANSPWAPVLAGQGGPFDAETRRVSWETLVAHGPSLYRTFAGNPRAASTAKAMRDCVLRQENFIEALASADETLAWCKMCIHHNLPLRPQDPIIGTTAAVLDNLATRLRPFLQCYLKARGLCGLDELCSRRRLADIKDIASFVFVILARLANRVERGVAEIDYATLGVGVGEKMHFYLPGACMAGLIEILDTHRQECSSRVCELTASHIVAPPYVHGKYFYCNSLF [서열번호 415]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 415에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 HSV1 ICP27 폴리펩티드는 다음과 같은 서열번호 416의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGCGACTGACATTGATATGCTAATTGACCTCGGCCTGGACCTCTCCGACAGCGATCTGGACGAGGACCCCCCCGAGCCGGCGGAGAGCCGCCGCGACGACCTGGAATCGGACAGCAGCGGGGAGTGTTCCTCGTCGGACGAGGACATGGAAGACCCCCACGGAGAGGACGGACCGGAGCCGATACTCGACGCCGCTCGCCCGGCGGTCCGCCCGTCTCGTCCAGAAGACCCCGGCGTACCCAGCACCCAGACGCCTCGTCCGACGGAGCGGCAGGGCCCCAACGATCCTCAACCAGCGCCCCACAGTGTGTGGTCGCGCCTCGGGGCCCGGCGACCGTCTTGCTCCCCCGAGCAGCACGGGGGCAAGGTGGCCCGCCTCCAACCCCCACCGACCAAAGCCCAGCCTGCCCGCGGCGGACGCCGTGGGCGTCGCAGGGGTCGGGGTCGCGGTGGTCCCGGGGCTGCCGATGGTTTGTCGGACCCCCGCCGGCGTGCCCCCAGAACCAATCGCAACCCTGGGGGACCCCGCCCCGGGGCGGGGTGGACGGACGGCCCCGGCGCCCCCCATGGCGAGGCGTGGCGCGGCAGTGAGCAGCCCGACCCACCCGGAGGCCAGCGGACACGGGGCGTGCGCCAAGCACCCCCCCCGCTAATGACGCTGGCGATTGCCCCCCCGCCCGCGGACCCCCGCGCCCCGGCCCCGGAGCGAAAGGCGCCCGCCGCCGACACCATCGACGCCACCACGCGGTTGGTCCTGCGCTCCATCTCCGAGCGCGCGGCGGTCGACCGCATCAGCGAGAGCTTTGGCCGCAGCGCACAGGTCATGCACGACCCCTTTGGGGGGCAGCCGTTTCCCGCCGCGAATAGCCCCTGGGCCCCGGTGCTGGCGGGCCAAGGAGGGCCCTTTGACGCCGAGACCAGACGGGTCTCCTGGGAAACCTTGGTCGCCCACGGCCCGAGCCTCTATCGCACTTTTGCCGGCAATCCTCGGGCCGCATCGACCGCCAAGGCCATGCGCGACTGCGTGCTGCGCCAAGAAAATTTCATCGAGGCGCTGGCCTCCGCCGACGAGACGCTGGCGTGGTGCAAGATGTGCATCCACCACAACCTGCCGCTGCGCCCCCAGGACCCCATTATCGGGACGACCGCGGCTGTGCTGGATAACCTCGCCACGCGCCTGCGGCCCTTTCTCCAGTGCTACCTGAAGGCGCGAGGCCTGTGCGGCCTGGACGAACTGTGTTCGCGGCGGCGTCTGGCGGACATTAAGGACATTGCATCCTTCGTGTTTGTCATTCTGGCCAGGCTCGCCAACCGCGTCGAGCGTGGCGTCGCGGAGATCGACTACGCGACCCTTGGTGTCGGGGTCGGAGAGAAGATGCATTTCTACCTCCCCGGGGCCTGCATGGCGGGCCTGATCGAAATCCTAGACACGCACCGCCAGGAGTGTTCGAGTCGTGTCTGCGAGTTGACGGCCAGTCACATCGTCGCCCCCCCGTACGTGCACGGCAAATATTTTTATTGCAACTCCCTGTTT [서열번호 416]
따라서, 바람직하게는 상기 HSV1 ICP27 폴리펩티드는 실질적으로 서열번호 416에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 HSV1 ICP27 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 417로 제공된다:
ATGGCCACCGACATCGACATGCTGATCGACCTGGGCCTCGACCTGAGCGACTCTGACCTGGATGAAGATCCTCCTGAGCCTGCCGAGAGCAGAAGGGACGATCTGGAAAGCGATAGCAGCGGCGAGTGTAGCAGCAGCGACGAGGACATGGAAGATCCCCACGGCGAGGATGGACCTGAGCCTATTCTGGATGCCGCCAGACCTGCCGTCAGACCTTCTAGACCTGAAGATCCAGGCGTGCCCAGCACACAGACCCCTAGACCTACAGAGAGACAGGGCCCCAACGATCCTCAGCCTGCTCCTCATAGCGTGTGGTCTAGACTGGGAGCCAGAAGGCCTAGCTGTAGCCCTGAACAGCACGGCGGAAAAGTGGCCAGACTGCAGCCTCCTCCAACAAAGGCTCAACCTGCTAGAGGCGGCAGACGGGGCAGAAGAAGAGGTAGAGGAAGAGGTGGACCTGGCGCCGCTGATGGACTGTCTGATCCTAGAAGAAGGGCCCCTCGGACCAACAGAAATCCTGGCGGACCTAGACCAGGCGCCGGATGGACAGATGGACCAGGTGCTCCACATGGCGAGGCTTGGAGAGGATCTGAGCAGCCTGATCCTCCAGGCGGCCAAAGAACAAGAGGCGTTAGACAGGCTCCTCCTCCTCTGATGACCCTGGCTATTGCTCCTCCACCAGCCGATCCTAGAGCACCCGCTCCAGAAAGAAAAGCCCCTGCCGCCGATACCATCGACGCCACAACAAGACTGGTGCTGCGGAGCATCTCTGAGAGGGCCGCTGTGGATAGAATCAGCGAGAGCTTTGGGAGAAGCGCCCAAGTGATGCACGACCCTTTTGGCGGCCAGCCTTTTCCTGCCGCCAATTCTCCTTGGGCTCCTGTGCTTGCTGGACAAGGCGGCCCTTTTGACGCCGAGACAAGAAGAGTGTCCTGGGAGACACTGGTGGCCCACGGACCTAGCCTGTACAGAACATTCGCCGGCAATCCAAGAGCCGCCAGCACAGCCAAAGCCATGAGAGACTGCGTGCTGAGACAAGAGAACTTCATCGAGGCCCTGGCCAGCGCCGATGAGACACTTGCTTGGTGCAAGATGTGCATCCACCACAACCTGCCTCTGAGGCCACAGGACCCTATCATCGGAACAACAGCTGCCGTGCTGGATAACCTGGCTACCAGACTGAGGCCCTTCCTGCAGTGCTACCTGAAGGCCAGAGGACTGTGTGGCCTGGATGAGCTGTGCTCCAGAAGAAGGCTGGCTGACATCAAGGATATCGCCAGCTTCGTGTTCGTGATTCTGGCCCGGCTGGCCAACAGAGTGGAAAGAGGCGTGGCCGAGATCGACTATGCCACACTCGGAGTTGGCGTGGGCGAGAAGATGCACTTTTATCTGCCTGGCGCCTGCATGGCCGGCCTGATCGAAATTCTGGACACCCACAGACAAGAGTGCAGCTCCAGAGTGTGCGAGCTGACAGCCTCTCACATTGTGGCCCCTCCATACGTGCACGGCAAGTACTTCTACTGCAACAGCCTGTTC [서열번호 417]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 417에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 417의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 418로 제공된다:
AUGGCCACCGACAUCGACAUGCUGAUCGACCUGGGCCUCGACCUGAGCGACUCUGACCUGGAUGAAGAUCCUCCUGAGCCUGCCGAGAGCAGAAGGGACGAUCUGGAAAGCGAUAGCAGCGGCGAGUGUAGCAGCAGCGACGAGGACAUGGAAGAUCCCCACGGCGAGGAUGGACCUGAGCCUAUUCUGGAUGCCGCCAGACCUGCCGUCAGACCUUCUAGACCUGAAGAUCCAGGCGUGCCCAGCACACAGACCCCUAGACCUACAGAGAGACAGGGCCCCAACGAUCCUCAGCCUGCUCCUCAUAGCGUGUGGUCUAGACUGGGAGCCAGAAGGCCUAGCUGUAGCCCUGAACAGCACGGCGGAAAAGUGGCCAGACUGCAGCCUCCUCCAACAAAGGCUCAACCUGCUAGAGGCGGCAGACGGGGCAGAAGAAGAGGUAGAGGAAGAGGUGGACCUGGCGCCGCUGAUGGACUGUCUGAUCCUAGAAGAAGGGCCCCUCGGACCAACAGAAAUCCUGGCGGACCUAGACCAGGCGCCGGAUGGACAGAUGGACCAGGUGCUCCACAUGGCGAGGCUUGGAGAGGAUCUGAGCAGCCUGAUCCUCCAGGCGGCCAAAGAACAAGAGGCGUUAGACAGGCUCCUCCUCCUCUGAUGACCCUGGCUAUUGCUCCUCCACCAGCCGAUCCUAGAGCACCCGCUCCAGAAAGAAAAGCCCCUGCCGCCGAUACCAUCGACGCCACAACAAGACUGGUGCUGCGGAGCAUCUCUGAGAGGGCCGCUGUGGAUAGAAUCAGCGAGAGCUUUGGGAGAAGCGCCCAAGUGAUGCACGACCCUUUUGGCGGCCAGCCUUUUCCUGCCGCCAAUUCUCCUUGGGCUCCUGUGCUUGCUGGACAAGGCGGCCCUUUUGACGCCGAGACAAGAAGAGUGUCCUGGGAGACACUGGUGGCCCACGGACCUAGCCUGUACAGAACAUUCGCCGGCAAUCCAAGAGCCGCCAGCACAGCCAAAGCCAUGAGAGACUGCGUGCUGAGACAAGAGAACUUCAUCGAGGCCCUGGCCAGCGCCGAUGAGACACUUGCUUGGUGCAAGAUGUGCAUCCACCACAACCUGCCUCUGAGGCCACAGGACCCUAUCAUCGGAACAACAGCUGCCGUGCUGGAUAACCUGGCUACCAGACUGAGGCCCUUCCUGCAGUGCUACCUGAAGGCCAGAGGACUGUGUGGCCUGGAUGAGCUGUGCUCCAGAAGAAGGCUGGCUGACAUCAAGGAUAUCGCCAGCUUCGUGUUCGUGAUUCUGGCCCGGCUGGCCAACAGAGUGGAAAGAGGCGUGGCCGAGAUCGACUAUGCCACACUCGGAGUUGGCGUGGGCGAGAAGAUGCACUUUUAUCUGCCUGGCGCCUGCAUGGCCGGCCUGAUCGAAAUUCUGGACACCCACAGACAAGAGUGCAGCUCCAGAGUGUGCGAGCUGACAGCCUCUCACAUUGUGGCCCCUCCAUACGUGCACGGCAAGUACUUCUACUGCAACAGCCUGUUC [서열번호 418]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 418에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 HSV1 VP24(F8RDC3; UL26 인간 헤르페스바이러스 1의 캡시드 스캐폴딩(scaffolding) 단백질 VP24 절단 생성물), 또는 그의 동원체이다. HSV1 VP24의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 419로 나타낸다:
MAADAPGDRMEEPLPDRAVPIYVAGFLALYDSGDSGELALDPDTVRAALPPDNPLPINVDHRAGCEVGRVLAVVDDPRGPFFVGLIACVQLERVLETAASAAIFERRGPPLSREERLLYLITNYLPSVSLATKRLGGEAHPDRTLFAHVALCAIGRRLGTIVTYDTGLDAAIAPFRHLSPASREGARRLAAEAELALSGRTWAPGVEALTHTLLSTAVNNMMLRDRWSLVAERRRQAGIAGHTYLQA [서열번호 419]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 419에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 HSV1 VP24 폴리펩티드는 다음과 같은 서열번호 420의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGCAGCCGATGCCCCGGGAGACAGGATGGAGGAGCCCCTGCCAGACAGGGCCGTGCCCATTTACGTGGCTGGGTTTTTGGCCCTGTATGACAGCGGGGACTCGGGCGAGTTGGCATTGGATCCGGATACGGTGCGGGCGGCCCTGCCTCCGGATAACCCACTCCCGATTAACGTGGACCACCGCGCTGGCTGCGAGGTGGGGCGGGTGCTGGCCGTGGTCGACGACCCCCGCGGGCCGTTTTTTGTGGGGCTGATCGCCTGCGTGCAGCTGGAGCGCGTCCTCGAGACGGCCGCCAGCGCTGCGATTTTCGAGCGCCGCGGGCCGCCGCTCTCCCGGGAGGAGCGCCTGTTGTACCTGATCACCAACTACCTGCCCTCGGTCTCCCTGGCCACAAAACGCCTGGGGGGCGAGGCGCACCCCGATCGCACGCTGTTCGCGCACGTCGCGCTGTGCGCGATCGGGAGGCGCCTCGGCACTATCGTCACCTACGACACCGGTCTCGACGCCGCCATCGCGCCCTTTCGCCACCTGTCGCCGGCGTCTCGCGAGGGGGCGCGGCGACTGGCCGCCGAGGCCGAGCTCGCGCTGTCCGGACGCACCTGGGCGCCCGGCGTGGAGGCGCTGACCCACACGCTGCTTTCCACCGCCGTTAACAACATGATGCTGCGGGACCGCTGGAGCCTGGTGGCCGAGCGGCGGCGGCAGGCCGGGATTGCCGGACACACCTACCTCCAGGCG [서열번호 420]
따라서, 바람직하게는 상기 HSV1 VP24 폴리펩티드는 실질적으로 서열번호 420에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 HSV1 VP24 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 421로 제공된다:
ATGGCTGCTGATGCCCCTGGCGACAGAATGGAAGAACCCCTGCCTGATAGAGCCGTGCCTATCTACGTGGCCGGATTTCTGGCCCTGTACGACTCTGGCGATTCTGGCGAACTGGCCCTGGATCCTGATACAGTCAGAGCCGCTCTGCCTCCTGACAACCCTCTGCCAATCAACGTGGACCACAGAGCCGGCTGTGAAGTGGGAAGAGTGCTGGCCGTGGTGGACGATCCTAGAGGCCCTTTCTTTGTGGGCCTGATCGCCTGCGTGCAGCTGGAAAGAGTTCTGGAAACAGCCGCCAGCGCCGCCATCTTCGAAAGAAGAGGACCTCCTCTGAGCCGGGAAGAGAGACTGCTGTACCTGATCACCAACTACCTGCCTAGCGTGTCCCTGGCCACAAAGAGACTTGGCGGAGAGGCCCATCCTGACAGAACCCTGTTTGCCCATGTGGCCCTGTGTGCCATTGGTAGAAGGCTGGGCACCATCGTGACCTACGATACAGGACTGGACGCCGCTATCGCCCCATTCAGACATCTGAGCCCTGCCAGCAGAGAAGGCGCCAGAAGGCTTGCTGCTGAAGCCGAACTGGCTCTGAGCGGCAGAACATGGGCTCCAGGTGTTGAAGCCCTGACACACACCCTGCTGAGCACCGCCGTGAACAACATGATGCTGCGGGACAGATGGTCCCTGGTGGCCGAGAGAAGAAGGCAGGCTGGAATTGCCGGCCACACATATCTGCAGGCT [서열번호 421]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 421에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 421의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 422로 제공된다:
AUGGCUGCUGAUGCCCCUGGCGACAGAAUGGAAGAACCCCUGCCUGAUAGAGCCGUGCCUAUCUACGUGGCCGGAUUUCUGGCCCUGUACGACUCUGGCGAUUCUGGCGAACUGGCCCUGGAUCCUGAUACAGUCAGAGCCGCUCUGCCUCCUGACAACCCUCUGCCAAUCAACGUGGACCACAGAGCCGGCUGUGAAGUGGGAAGAGUGCUGGCCGUGGUGGACGAUCCUAGAGGCCCUUUCUUUGUGGGCCUGAUCGCCUGCGUGCAGCUGGAAAGAGUUCUGGAAACAGCCGCCAGCGCCGCCAUCUUCGAAAGAAGAGGACCUCCUCUGAGCCGGGAAGAGAGACUGCUGUACCUGAUCACCAACUACCUGCCUAGCGUGUCCCUGGCCACAAAGAGACUUGGCGGAGAGGCCCAUCCUGACAGAACCCUGUUUGCCCAUGUGGCCCUGUGUGCCAUUGGUAGAAGGCUGGGCACCAUCGUGACCUACGAUACAGGACUGGACGCCGCUAUCGCCCCAUUCAGACAUCUGAGCCCUGCCAGCAGAGAAGGCGCCAGAAGGCUUGCUGCUGAAGCCGAACUGGCUCUGAGCGGCAGAACAUGGGCUCCAGGUGUUGAAGCCCUGACACACACCCUGCUGAGCACCGCCGUGAACAACAUGAUGCUGCGGGACAGAUGGUCCCUGGUGGCCGAGAGAAGAAGGCAGGCUGGAAUUGCCGGCCACACAUAUCUGCAGGCU [서열번호 422]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 422에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 뮤린 CTMV M45(Q06A28; 리보뉴클레오시드-디포스페이트 리덕타아제(reductase) 큰 서브유닛-유사 단백질 뮤린 헤르페스바이러스 1(스미스 바이러스주) 뮤린 사이토메갈로바이러스(Cytomegalovirus) M45 단백질), 또는 그의 동원체이다. [Fliss P, Pechenick Jowers T et al (2012) Viral Mediated Redirection of NEMO/IKKγ to Autophagosomes Curtails the Inflammatory Cascade. PLoS Pathogens 8, 2]. M45는 NEMO의 프로테아좀(proteasome)-독립적 분해를 유도하는 것으로 여겨진다. 뮤린 CTMV M45의 폴리펩티드 서열의 한 구현예 본 명세서에서 다음과 같은 서열번호 423으로 나타낸다:
MDRQPKVYSDPDNGFFFLDVPMPDDGQGGQQTATTAAGGAFGVGGGHSVPYVRIMNGVSGIQIGNHNAMSIASCWSPSYTDRRRRSYPKTATNAAADRVAAAVSAANAAVNAAAAAAAAGGGGGANLLAAAVTCANQRGCCGGNGGHSLPPTRMPKTNATAAAAPAVAGASNAKSDNNHANATSGAGSAAATPAATTPAATAVENRRPSPSPSTASTAPCDEGSSPRHHRPSHVSVGTQATPSTPIPIPAPRCSTGQQQQQPQAKKLKPAKADPLLYAATMPPPASVTTAAAAAVAPESESSPAASAPPAAAAMATGGDDEDQSSFSFVSDDVLGEFEDLRIAGLPVRDEMRPPTPTMTVIPVSRPFRAGRDSGRDALFDDAVESVRCYCHGILGNSRFCALVNEKCSEPAKERMARIRRYAADVTRCGPLALYTAIVSSANRLIQTDPSCDLDLAECYVETASKRNAVPLSAFYRDCDRLRDAVAAFFKTYGMVVDAMAQRITERVGPALGRGLYSTVVMMDRCGNSFQGREETPISVFARVAAALAVECEVDGGVSYKILSSKPVDAAQAFDAFLSALCSFAIIPSPRVLAYAGFGGSNPIFDAVSYRAQFYSAESTINGTLHDICDMVTNGLSVSVSAADLGGDIVASLHILGQQCKALRPYARFKTVLRIYFDIWSVDALKIFSFILDVGREYEGLMAFAVNTPRIFWDRYLDSSGDKMWLMFARREAAALCGLDLKSFRNVYEKMERDGRSAITVSPWWAVCQLDACVARGNTAVVFPHNVKSMIPENIGRPAVCGPGVSVVSGGFVGCTPIHELCINLENCVLEGAAVESSVDVVLGLGCRFSFKALESLVRDAVVLGNLLIDMTVRTNAYGAGKLLTLYRDLHIGVVGFHAVMNRLGQKFADMESYDLNQRIAEFIYYTAVRASVDLCMAGADPFPKFPKSLYAAGRFYPDLFDDDERGPRRMTKEFLEKLREDVVKHGIRNASFITGCSADEAANLAGTTPGFWPRRDNVFLEQTPLMMTPTKDQMLDECVRSVKIEPHRLHEEDLSCLGENRPVELPVLNSRLRQISKESATVAVRRGRSAPFYDDSDDEDEVACSETGWTVSTDAVIKMCVDRQPFVDHAQSLPVAIGFGGSSVELARHLRRGNALGLSVGVYKCSMPPSVNYR [서열번호 423]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 423에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 뮤린 CTMV M45 폴리펩티드는 다음과 같은 서열번호 424의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGATCGCCAGCCCAAAGTCTACTCCGACCCGGACAACGGATTCTTCTTTTTGGATGTCCCCATGCCTGACGACGGGCAGGGAGGCCAGCAGACCGCCACCACCGCTGCCGGGGGAGCCTTCGGGGTGGGTGGGGGGCACAGCGTGCCCTACGTCAGGATCATGAATGGAGTCTCTGGAATACAGATCGGAAACCATAATGCTATGAGCATCGCCTCTTGCTGGAGTCCCTCCTACACTGACCGACGCCGCAGGAGCTACCCCAAGACCGCGACCAACGCGGCGGCAGACAGGGTCGCCGCTGCCGTCTCCGCCGCCAATGCTGCTGTCAATGCTGCTGCCGCGGCTGCTGCCGCCGGCGGGGGCGGCGGCGCTAACCTACTGGCTGCTGCTGTCACTTGTGCAAATCAGCGAGGTTGCTGCGGAGGAAATGGGGGGCATTCCCTCCCTCCCACCCGAATGCCGAAGACCAACGCTACCGCCGCGGCCGCTCCTGCCGTCGCCGGTGCTTCCAACGCCAAGAGTGACAACAATCACGCTAACGCCACCTCTGGTGCTGGATCCGCGGCCGCCACCCCCGCCGCCACCACCCCCGCCGCCACCGCCGTCGAAAACCGACGACCCAGCCCGAGCCCCTCTACAGCCTCGACTGCGCCCTGTGACGAGGGATCTTCTCCTCGCCACCATCGTCCTAGTCACGTTAGTGTCGGCACTCAGGCGACTCCGTCGACTCCTATCCCGATTCCCGCTCCCCGGTGCAGCACAGGCCAACAACAACAGCAACCTCAAGCCAAGAAGCTTAAGCCCGCTAAAGCTGATCCCCTCCTGTACGCGGCGACGATGCCGCCTCCCGCGAGCGTAACGACCGCCGCTGCCGCTGCCGTCGCCCCTGAATCCGAATCCTCACCTGCCGCTTCGGCACCACCAGCAGCAGCAGCGATGGCGACCGGGGGAGACGACGAAGATCAGTCGTCTTTCTCGTTCGTGAGCGACGACGTCCTCGGAGAATTCGAAGATCTGCGCATCGCCGGGCTCCCCGTCAGGGACGAGATGCGCCCCCCGACCCCGACGATGACGGTCATTCCCGTCAGCAGGCCCTTCCGCGCGGGGCGCGACAGCGGGCGCGACGCCTTGTTTGACGACGCCGTCGAGTCCGTGCGCTGCTACTGCCACGGCATCCTCGGCAACAGCCGATTCTGCGCCCTCGTCAACGAGAAGTGCTCCGAACCCGCCAAGGAGCGCATGGCTCGCATCCGCCGCTACGCCGCGGACGTGACGCGCTGCGGACCCCTCGCGCTCTACACCGCCATCGTCTCCAGCGCCAACCGTCTCATCCAGACCGACCCGTCGTGCGACCTGGATCTCGCCGAATGTTACGTCGAGACGGCGTCCAAGAGGAACGCCGTCCCCCTCTCGGCCTTCTACCGCGACTGCGATCGCCTGCGGGATGCTGTCGCCGCGTTCTTCAAGACCTACGGCATGGTGGTGGACGCCATGGCGCAGCGCATCACGGAGCGGGTCGGGCCGGCCCTGGGTAGGGGCCTCTACTCGACCGTCGTCATGATGGATCGCTGCGGAAACAGCTTCCAGGGACGCGAGGAGACCCCCATCTCCGTCTTCGCCCGGGTCGCCGCGGCTCTCGCCGTCGAGTGCGAGGTCGACGGGGGCGTCTCGTACAAGATCCTCAGCTCCAAGCCCGTCGACGCCGCGCAGGCCTTCGACGCCTTCCTCTCCGCCCTCTGCTCCTTCGCCATCATCCCCTCGCCGCGGGTCCTGGCCTACGCCGGGTTCGGCGGTTCCAACCCGATCTTCGACGCCGTTTCTTACCGCGCTCAGTTCTACTCGGCCGAGAGCACGATCAACGGCACCCTGCACGACATCTGCGACATGGTGACCAACGGCCTCTCGGTGTCCGTCAGCGCGGCGGACCTCGGAGGCGACATCGTGGCCTCTCTGCACATCCTCGGACAGCAGTGCAAGGCGCTGCGGCCGTACGCGCGATTCAAGACCGTCTTGAGGATCTACTTCGACATCTGGTCCGTCGACGCTCTCAAGATCTTCTCTTTCATCCTCGACGTCGGGCGGGAATACGAGGGCCTGATGGCCTTCGCGGTCAACACGCCGAGGATCTTCTGGGATCGCTACCTAGACAGCTCCGGCGACAAGATGTGGCTCATGTTCGCGAGGCGGGAGGCCGCGGCCCTGTGCGGCCTCGACCTCAAGTCCTTCCGTAACGTCTACGAGAAGATGGAGCGTGACGGGCGCAGCGCCATCACCGTCTCGCCCTGGTGGGCCGTCTGTCAGCTCGACGCGTGCGTGGCGCGGGGCAACACGGCCGTGGTCTTCCCTCACAACGTCAAGAGTATGATCCCCGAGAACATCGGGCGCCCCGCCGTGTGCGGACCCGGCGTCTCCGTCGTCTCCGGCGGCTTCGTCGGCTGTACCCCCATCCACGAGCTGTGCATCAACCTGGAGAACTGCGTCCTGGAGGGCGCGGCAGTCGAGAGCTCCGTCGACGTGGTCCTCGGTCTCGGTTGCCGCTTCAGCTTCAAGGCCCTGGAGTCCCTGGTCCGCGACGCGGTGGTGCTGGGTAACCTGCTCATCGACATGACCGTGCGCACCAACGCGTACGGCGCCGGCAAGCTCCTGACGCTCTATCGCGACCTGCACATCGGGGTCGTCGGCTTCCACGCTGTGATGAATCGCCTCGGGCAGAAGTTCGCCGACATGGAGTCTTACGACCTCAACCAGCGTATCGCGGAGTTTATCTACTACACCGCCGTGCGGGCCAGCGTCGACCTGTGCATGGCGGGCGCCGATCCGTTCCCCAAGTTCCCTAAGAGCCTGTACGCGGCCGGCCGCTTCTACCCCGACCTCTTCGACGACGACGAGCGCGGCCCGCGTCGCATGACCAAGGAGTTCCTCGAGAAACTACGTGAAGACGTGGTGAAACACGGCATCAGGAACGCCTCCTTCATCACCGGCTGCTCGGCCGACGAAGCCGCCAACCTGGCGGGCACCACTCCGGGCTTCTGGCCGCGCCGCGACAACGTCTTTCTCGAGCAGACGCCGCTCATGATGACCCCGACGAAGGATCAGATGCTCGATGAGTGCGTGCGCTCCGTCAAGATCGAGCCCCATCGCCTGCACGAGGAGGATCTCTCCTGTCTCGGCGAGAACCGGCCCGTCGAGCTGCCCGTGCTCAACAGCCGCCTCAGGCAGATCTCGAAAGAGTCCGCGACGGTCGCCGTGCGCCGCGGCCGCTCGGCGCCCTTCTACGACGACTCGGACGACGAGGACGAGGTGGCGTGCTCCGAGACCGGCTGGACCGTGTCGACCGACGCGGTCATCAAGATGTGCGTCGACAGACAGCCGTTCGTCGACCATGCGCAGTCGCTGCCCGTCGCCATCGGCTTCGGGGGGTCTTCGGTGGAATTGGCGCGTCATCTGAGACGAGGGAACGCTCTGGGACTGTCCGTCGGAGTATATAAATGTAGTATGCCCCCTTCCGTGAATTATCGC [서열번호 424]
따라서, 바람직하게는 상기 뮤린 CTMV M45 폴리펩티드는 실질적으로 서열번호 424에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 뮤린 CTMV M45 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 425로 제공된다:
ATGGACAGACAGCCCAAGGTGTACAGCGACCCCGACAACGGCTTCTTCTTCCTGGATGTGCCCATGCCTGACGATGGCCAAGGCGGACAGCAGACAGCTACAACAGCTGCCGGCGGAGCCTTTGGAGTTGGCGGAGGACATTCTGTGCCCTACGTGCGGATCATGAATGGCGTGTCCGGCATCCAGATCGGCAACCACAACGCCATGTCTATCGCCAGCTGTTGGAGCCCCAGCTACACCGATCGGCGGAGAAGAAGCTACCCTAAGACCGCCACAAACGCCGCTGCCGATAGAGTGGCTGCTGCTGTGTCTGCCGCTAACGCTGCTGTGAATGCTGCTGCCGCTGCTGCAGCCGCAGGCGGCGGAGGCGGAGCTAATCTTCTTGCAGCAGCCGTGACCTGCGCCAACCAGAGAGGATGTTGCGGAGGAAATGGCGGCCACAGCCTGCCTCCAACCAGAATGCCTAAGACCAATGCCACAGCCGCTGCAGCTCCAGCAGTTGCCGGTGCCTCTAATGCCAAGAGCGACAACAACCACGCCAACGCCACATCTGGCGCTGGATCTGCTGCTGCTACACCAGCCGCTACAACACCAGCTGCCACCGCCGTTGAGAACAGAAGGCCATCTCCAAGTCCTAGCACCGCCAGCACAGCCCCTTGTGATGAGGGAAGCAGCCCCAGACACCACAGACCTAGCCATGTGTCTGTGGGCACACAGGCCACACCTAGCACACCAATTCCTATTCCAGCTCCTCGGTGCTCCACAGGCCAGCAGCAACAACAGCCTCAGGCCAAGAAGCTGAAGCCCGCCAAAGCTGACCCTCTGCTGTATGCCGCAACCATGCCTCCTCCAGCCTCTGTGACTACTGCCGCAGCAGCTGCAGTGGCCCCTGAGTCTGAATCTTCTCCTGCCGCTTCTGCCCCTCCAGCAGCCGCCGCTATGGCTACAGGCGGAGATGATGAGGACCAGAGCAGCTTCTCCTTCGTGTCCGATGATGTGCTGGGCGAGTTCGAGGACCTGAGAATTGCTGGACTGCCCGTGCGGGATGAGATGAGGCCTCCTACACCTACCATGACAGTGATCCCCGTGTCTCGGCCTTTCAGAGCCGGCAGAGATTCTGGCAGAGATGCCCTGTTCGACGACGCCGTGGAAAGCGTGCGGTGTTACTGTCACGGCATCCTGGGCAACAGCAGATTCTGCGCCCTGGTCAACGAGAAGTGTAGCGAGCCTGCCAAAGAACGGATGGCCCGGATTAGAAGATACGCCGCCGACGTGACAAGATGCGGACCTCTGGCTCTGTACACCGCCATTGTGTCTAGCGCCAACCGGCTGATCCAGACAGACCCTAGCTGTGACCTGGATCTGGCCGAGTGCTACGTGGAAACCGCCTCCAAGAGAAACGCCGTGCCTCTGAGCGCCTTCTACAGAGACTGCGACAGACTGAGAGATGCCGTGGCCGCCTTCTTCAAGACCTACGGCATGGTGGTGGACGCCATGGCTCAGAGAATCACCGAGAGAGTGGGACCCGCTCTCGGCAGAGGACTGTATTCTACCGTGGTCATGATGGACAGATGCGGCAACAGCTTCCAGGGCAGAGAAGAGACACCCATCAGCGTGTTCGCCAGAGTGGCTGCTGCTCTGGCCGTGGAATGTGAAGTGGATGGCGGCGTGTCCTACAAGATCCTGAGCAGCAAGCCTGTGGATGCCGCTCAGGCCTTCGATGCCTTTCTGAGCGCCCTGTGCAGCTTCGCCATCATTCCATCTCCAAGAGTGCTGGCCTACGCCGGCTTTGGCGGCAGCAATCCTATCTTTGACGCCGTGTCTTACAGGGCCCAGTTCTACAGCGCCGAGAGCACCATCAATGGCACCCTGCACGACATCTGCGACATGGTCACAAACGGCCTGTCCGTGTCTGTGTCTGCCGCTGATCTCGGCGGAGATATCGTGGCCTCTCTGCACATTCTGGGCCAGCAGTGCAAAGCCCTGAGGCCTTACGCCAGATTCAAGACCGTGCTGCGGATCTACTTCGACATTTGGAGCGTGGACGCCCTGAAGATCTTTAGCTTCATCCTGGACGTGGGGCGCGAGTACGAAGGACTGATGGCCTTTGCCGTGAATACCCCTCGGATCTTCTGGGACAGATACCTGGACAGCAGCGGCGACAAGATGTGGCTGATGTTTGCCAGAAGAGAAGCCGCCGCTCTGTGCGGCCTGGATCTGAAGTCCTTCCGGAACGTGTACGAGAAGATGGAACGCGACGGCCGCTCTGCCATCACAGTTAGTCCTTGGTGGGCCGTGTGTCAGCTGGATGCCTGTGTGGCCAGAGGCAATACCGCCGTGGTGTTCCCTCACAACGTGAAGTCTATGATCCCCGAGAACATCGGCAGGCCAGCCGTGTGTGGACCTGGCGTTAGTGTTGTGTCTGGCGGCTTCGTGGGCTGCACACCTATTCACGAGCTGTGCATCAACCTGGAAAACTGCGTGCTGGAAGGCGCCGCTGTGGAATCCTCTGTGGATGTGGTGCTCGGCCTGGGCTGCAGATTCAGCTTTAAGGCCCTGGAAAGCCTCGTGCGGGATGCTGTGGTTCTGGGCAACCTGCTGATCGACATGACCGTGCGGACCAATGCCTATGGCGCTGGCAAACTGCTGACCCTGTACCGGGATCTGCACATCGGCGTTGTGGGATTCCACGCCGTGATGAACAGACTGGGCCAGAAATTCGCCGACATGGAAAGCTACGACCTGAACCAGCGGATCGCCGAGTTCATCTACTACACAGCCGTCAGAGCCAGCGTGGACCTGTGTATGGCTGGCGCCGATCCATTTCCTAAGTTCCCCAAGAGCCTGTACGCCGCTGGCAGATTCTACCCCGACCTGTTCGACGACGATGAGAGGGGCCCTAGACGGATGACCAAAGAGTTCCTGGAAAAGCTGAGGGAAGATGTGGTCAAGCACGGCATCCGGAACGCCAGCTTTATCACAGGCTGTAGCGCCGACGAGGCCGCCAATCTTGCTGGAACAACACCCGGCTTTTGGCCCAGACGGGACAATGTGTTTCTGGAACAGACCCCTCTGATGATGACCCCTACCAAGGACCAGATGCTGGACGAGTGCGTGCGGAGCGTGAAGATCGAACCTCACAGACTGCACGAAGAGGACCTGAGCTGCCTGGGCGAGAACAGACCTGTGGAACTGCCCGTGCTGAACAGCAGACTGCGGCAGATCAGCAAAGAAAGCGCCACCGTGGCCGTGCGGAGAGGAAGAAGTGCTCCATTCTACGACGACAGCGACGACGAGGATGAAGTGGCCTGTTCTGAGACAGGCTGGACCGTGTCTACCGATGCCGTGATCAAGATGTGCGTGGACAGACAGCCCTTCGTGGATCACGCTCAGTCTCTGCCTGTGGCCATCGGCTTTGGAGGCTCTAGCGTGGAACTGGCCAGACACCTGAGAAGAGGCAATGCCCTGGGACTGTCTGTGGGCGTGTACAAGTGTAGCATGCCTCCTAGCGTGAACTACCGG [서열번호 425]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 425에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 425의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 426으로 제공된다:
AUGGACAGACAGCCCAAGGUGUACAGCGACCCCGACAACGGCUUCUUCUUCCUGGAUGUGCCCAUGCCUGACGAUGGCCAAGGCGGACAGCAGACAGCUACAACAGCUGCCGGCGGAGCCUUUGGAGUUGGCGGAGGACAUUCUGUGCCCUACGUGCGGAUCAUGAAUGGCGUGUCCGGCAUCCAGAUCGGCAACCACAACGCCAUGUCUAUCGCCAGCUGUUGGAGCCCCAGCUACACCGAUCGGCGGAGAAGAAGCUACCCUAAGACCGCCACAAACGCCGCUGCCGAUAGAGUGGCUGCUGCUGUGUCUGCCGCUAACGCUGCUGUGAAUGCUGCUGCCGCUGCUGCAGCCGCAGGCGGCGGAGGCGGAGCUAAUCUUCUUGCAGCAGCCGUGACCUGCGCCAACCAGAGAGGAUGUUGCGGAGGAAAUGGCGGCCACAGCCUGCCUCCAACCAGAAUGCCUAAGACCAAUGCCACAGCCGCUGCAGCUCCAGCAGUUGCCGGUGCCUCUAAUGCCAAGAGCGACAACAACCACGCCAACGCCACAUCUGGCGCUGGAUCUGCUGCUGCUACACCAGCCGCUACAACACCAGCUGCCACCGCCGUUGAGAACAGAAGGCCAUCUCCAAGUCCUAGCACCGCCAGCACAGCCCCUUGUGAUGAGGGAAGCAGCCCCAGACACCACAGACCUAGCCAUGUGUCUGUGGGCACACAGGCCACACCUAGCACACCAAUUCCUAUUCCAGCUCCUCGGUGCUCCACAGGCCAGCAGCAACAACAGCCUCAGGCCAAGAAGCUGAAGCCCGCCAAAGCUGACCCUCUGCUGUAUGCCGCAACCAUGCCUCCUCCAGCCUCUGUGACUACUGCCGCAGCAGCUGCAGUGGCCCCUGAGUCUGAAUCUUCUCCUGCCGCUUCUGCCCCUCCAGCAGCCGCCGCUAUGGCUACAGGCGGAGAUGAUGAGGACCAGAGCAGCUUCUCCUUCGUGUCCGAUGAUGUGCUGGGCGAGUUCGAGGACCUGAGAAUUGCUGGACUGCCCGUGCGGGAUGAGAUGAGGCCUCCUACACCUACCAUGACAGUGAUCCCCGUGUCUCGGCCUUUCAGAGCCGGCAGAGAUUCUGGCAGAGAUGCCCUGUUCGACGACGCCGUGGAAAGCGUGCGGUGUUACUGUCACGGCAUCCUGGGCAACAGCAGAUUCUGCGCCCUGGUCAACGAGAAGUGUAGCGAGCCUGCCAAAGAACGGAUGGCCCGGAUUAGAAGAUACGCCGCCGACGUGACAAGAUGCGGACCUCUGGCUCUGUACACCGCCAUUGUGUCUAGCGCCAACCGGCUGAUCCAGACAGACCCUAGCUGUGACCUGGAUCUGGCCGAGUGCUACGUGGAAACCGCCUCCAAGAGAAACGCCGUGCCUCUGAGCGCCUUCUACAGAGACUGCGACAGACUGAGAGAUGCCGUGGCCGCCUUCUUCAAGACCUACGGCAUGGUGGUGGACGCCAUGGCUCAGAGAAUCACCGAGAGAGUGGGACCCGCUCUCGGCAGAGGACUGUAUUCUACCGUGGUCAUGAUGGACAGAUGCGGCAACAGCUUCCAGGGCAGAGAAGAGACACCCAUCAGCGUGUUCGCCAGAGUGGCUGCUGCUCUGGCCGUGGAAUGUGAAGUGGAUGGCGGCGUGUCCUACAAGAUCCUGAGCAGCAAGCCUGUGGAUGCCGCUCAGGCCUUCGAUGCCUUUCUGAGCGCCCUGUGCAGCUUCGCCAUCAUUCCAUCUCCAAGAGUGCUGGCCUACGCCGGCUUUGGCGGCAGCAAUCCUAUCUUUGACGCCGUGUCUUACAGGGCCCAGUUCUACAGCGCCGAGAGCACCAUCAAUGGCACCCUGCACGACAUCUGCGACAUGGUCACAAACGGCCUGUCCGUGUCUGUGUCUGCCGCUGAUCUCGGCGGAGAUAUCGUGGCCUCUCUGCACAUUCUGGGCCAGCAGUGCAAAGCCCUGAGGCCUUACGCCAGAUUCAAGACCGUGCUGCGGAUCUACUUCGACAUUUGGAGCGUGGACGCCCUGAAGAUCUUUAGCUUCAUCCUGGACGUGGGGCGCGAGUACGAAGGACUGAUGGCCUUUGCCGUGAAUACCCCUCGGAUCUUCUGGGACAGAUACCUGGACAGCAGCGGCGACAAGAUGUGGCUGAUGUUUGCCAGAAGAGAAGCCGCCGCUCUGUGCGGCCUGGAUCUGAAGUCCUUCCGGAACGUGUACGAGAAGAUGGAACGCGACGGCCGCUCUGCCAUCACAGUUAGUCCUUGGUGGGCCGUGUGUCAGCUGGAUGCCUGUGUGGCCAGAGGCAAUACCGCCGUGGUGUUCCCUCACAACGUGAAGUCUAUGAUCCCCGAGAACAUCGGCAGGCCAGCCGUGUGUGGACCUGGCGUUAGUGUUGUGUCUGGCGGCUUCGUGGGCUGCACACCUAUUCACGAGCUGUGCAUCAACCUGGAAAACUGCGUGCUGGAAGGCGCCGCUGUGGAAUCCUCUGUGGAUGUGGUGCUCGGCCUGGGCUGCAGAUUCAGCUUUAAGGCCCUGGAAAGCCUCGUGCGGGAUGCUGUGGUUCUGGGCAACCUGCUGAUCGACAUGACCGUGCGGACCAAUGCCUAUGGCGCUGGCAAACUGCUGACCCUGUACCGGGAUCUGCACAUCGGCGUUGUGGGAUUCCACGCCGUGAUGAACAGACUGGGCCAGAAAUUCGCCGACAUGGAAAGCUACGACCUGAACCAGCGGAUCGCCGAGUUCAUCUACUACACAGCCGUCAGAGCCAGCGUGGACCUGUGUAUGGCUGGCGCCGAUCCAUUUCCUAAGUUCCCCAAGAGCCUGUACGCCGCUGGCAGAUUCUACCCCGACCUGUUCGACGACGAUGAGAGGGGCCCUAGACGGAUGACCAAAGAGUUCCUGGAAAAGCUGAGGGAAGAUGUGGUCAAGCACGGCAUCCGGAACGCCAGCUUUAUCACAGGCUGUAGCGCCGACGAGGCCGCCAAUCUUGCUGGAACAACACCCGGCUUUUGGCCCAGACGGGACAAUGUGUUUCUGGAACAGACCCCUCUGAUGAUGACCCCUACCAAGGACCAGAUGCUGGACGAGUGCGUGCGGAGCGUGAAGAUCGAACCUCACAGACUGCACGAAGAGGACCUGAGCUGCCUGGGCGAGAACAGACCUGUGGAACUGCCCGUGCUGAACAGCAGACUGCGGCAGAUCAGCAAAGAAAGCGCCACCGUGGCCGUGCGGAGAGGAAGAAGUGCUCCAUUCUACGACGACAGCGACGACGAGGAUGAAGUGGCCUGUUCUGAGACAGGCUGGACCGUGUCUACCGAUGCCGUGAUCAAGAUGUGCGUGGACAGACAGCCCUUCGUGGAUCACGCUCAGUCUCUGCCUGUGGCCAUCGGCUUUGGAGGCUCUAGCGUGGAACUGGCCAGACACCUGAGAAGAGGCAAUGCCCUGGGACUGUCUGUGGGCGUGUACAAGUGUAGCAUGCCUCCUAGCGUGAACUACCGG [서열번호 426]
다른 구현예에서, 선천적 신호전달 경로의 억제제는 천산갑(Pangolin) CoV-2 ORF3b*57 변이체 단백질(즉, 미성숙 종결 코돈이 AA 글루타민으로 변경된 천산갑 CoV-2 ORF3b 단백질의 돌연변이 형태(NCBI 참조 서열: QIG55946.1; UniProtKB - A0A6M3G7Q4(A0A6M3G7Q4_9BETC)), 또는 그의 동원체이다. [Konno Y, Kimura I, Uriu K, Fukushi M, Irie T, Koyanagi Y, Sauter D, Gifford R, USFQ-COVID19 Consortium, Nakagawa S and Sato K. 2020. SARS-CoV-2 ORF3b is a potent interferon antagonist whose activity is increased by a naturally occurring elongation variant. Cell Reports 32: Issue 12. doi.org/10.1016/j.celrep.2020.108185]. 상기 천산갑 CoV-2 ORF3b*57의 한 구현예는 본 명세서에서 다음과 같은 서열번호 427로 나타낸다:
MMLTTSCVGILIVTTIVFHTIVQLLQLSLPPVMAQQIPLQNMTTKLVVILRNGNLE [서열번호 427]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 427에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 천산갑 CoV-2 ORF3b*57 폴리펩티드는 다음과 같은 서열번호 428의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGATGCTAACTACTTCCTGTGTTGGCATACTAATTGTTACGACTATTGTATTCCATACAATAGTGCAACTTCTTCAATTGTCATTACCTCCGGTGATGGCACAACAAATCCCATTACAGAACATGACTACCAAATTGGTGGTTATTTTGAGAAATGGGAATCTGGAG [서열번호 428]
따라서, 바람직하게는 상기 천산갑 CoV-2 ORF3b*57 폴리펩티드는 실질적으로 서열번호 428에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 상기 RNA 구조체는 다음과 같은 서열번호 429의 RNA 뉴클레오티드 서열을 포함할 수 있다:
AUGAUGCUAACUACUUCCUGUGUUGGCAUACUAAUUGUUACGACUAUUGUAUUCCAUACAAUAGUGCAACUUCUUCAAUUGUCAUUACCUCCGGUGAUGGCACAACAAAUCCCAUUACAGAACAUGACUACCAAAUUGGUGGUUAUUUUGAGAAAUGGGAAUCUGGAG [서열번호 429]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 429에 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
따라서, 본 발명자들은 서열번호 442의 단백질 서열에 인간 발현을 위한 코돈 최적화를 하였고, 개시(ATG) 및 종결(TGA) 코돈을 포함하는 코돈 최적화된 핵산(DNA) 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 430으로 제공된다:
ATGATGCTGACCACCAGCTGTGTGGGCATCCTGATCGTGACCACCATCGTGTTCCACACAATCGTGCAGCTGCTGCAGCTCAGCCTGCCTCCTGTTATGGCCCAGCAGATCCCTCTGCAGAACATGACCACAAAGCTGGTCGTGATCCTGCGGAACGGCAACCTGGAATGA [서열번호 430]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 430에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 개시(AUG) 및 종결(UGA) 코돈을 포함하는 서열번호 430의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 431로 제공된다:
AUGAUGCUGACCACCAGCUGUGUGGGCAUCCUGAUCGUGACCACCAUCGUGUUCCACACAAUCGUGCAGCUGCUGCAGCUCAGCCUGCCUCCUGUUAUGGCCCAGCAGAUCCCUCUGCAGAACAUGACCACAAAGCUGGUCGUGAUCCUGCGGAACGGCAACCUGGAAUGA [서열번호 431]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 431에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
다른 구현예에서, 선천적 신호전달 경로의 억제제는 천산갑 CoV-2 ORF3b*79 변이체 단백질(즉, 미성숙 종결 코돈이 AA 글루타민으로 변경된 천산갑 CoV-2 ORF3b 단백질의 돌연변이 형태(NCBI 참조 서열: QIG55946.1; UniProtKB - A0A6M3G7Q4(A0A6M3G7Q4_9BETC)), 또는 그의 동원체이다. [Konno Y, Kimura I, Uriu K, Fukushi M, Irie T, Koyanagi Y, Sauter D, Gifford R, USFQ-COVID19 Consortium, Nakagawa S and Sato K. 2020. SARS-CoV-2 ORF3b is a potent interferon antagonist whose activity is increased by a naturally occurring elongation variant. Cell Reports 32: Issue 12. doi.org/10.1016/j.celrep.2020.108185]. 상기 천산갑 CoV-2 ORF3b*79의 한 구현예는 본 명세서에서 다음과 같은 서열번호 432로 나타낸다:
MMLTTSCVGILIVTTIVFHTIVQLLQLSLPPVMAQQIPLQNMTTKLVVILRNGNLELKTVLYYTATSLQITTSCTQLN [서열번호 432]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 432에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 천산갑 CoV-2 ORF3b*79 폴리펩티드는 다음과 같은 서열번호 433의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGATGCTAACTACTTCCTGTGTTGGCATACTAATTGTTACGACTATTGTATTCCATACAATAGTGCAACTTCTTCAATTGTCATTACCTCCGGTGATGGCACAACAAATCCCATTACAGAACATGACTACCAAATTGGTGGTTATTTTGAGAAATGGGAATCTGGAGCTGAAGACTGTGTTGTATTACACAGCTACTTCACTTCAGATTACTACCAGCTGTACTCAACTCAAT [서열번호 433]
따라서, 바람직하게는 상기 천산갑 CoV-2 ORF3b*79 폴리펩티드는 실질적으로 서열번호 433에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 상기 RNA 구조체는 다음과 같은 서열번호 434의 RNA 뉴클레오티드 서열을 포함할 수 있다:
AUGAUGCUAACUACUUCCUGUGUUGGCAUACUAAUUGUUACGACUAUUGUAUUCCAUACAAUAGUGCAACUUCUUCAAUUGUCAUUACCUCCGGUGAUGGCACAACAAAUCCCAUUACAGAACAUGACUACCAAAUUGGUGGUUAUUUUGAGAAAUGGGAAUCUGGAGCUGAAGACUGUGUUGUAUUACACAGCUACUUCACUUCAGAUUACUACCAGCUGUACUCAACUCAAU [서열번호 434]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 434에 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
따라서, 본 발명자들은 서열번호 432의 단백질 서열에 인간 발현을 위한 코돈 최적화를 하였고, 개시(ATG) 및 종결(TGA) 코돈을 포함하는 코돈 최적화된 핵산(DNA) 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 435로 제공된다:
ATGATGCTGACCACCAGCTGTGTGGGCATCCTGATCGTGACCACCATCGTGTTCCACACAATCGTGCAGCTGCTGCAGCTCAGCCTGCCTCCTGTTATGGCCCAGCAGATCCCTCTGCAGAACATGACCACAAAGCTGGTCGTGATCCTGCGGAACGGCAACCTGGAACTGAAAACCGTGCTGTACTACACCGCCACCAGCCTGCAGATCACCACAAGCTGCACCCAGCTGAACTGA [서열번호 435]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 435에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 개시(AUG) 및 종결(UGA) 코돈을 포함하는 서열번호 435의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 436으로 제공된다:
AUGAUGCUGACCACCAGCUGUGUGGGCAUCCUGAUCGUGACCACCAUCGUGUUCCACACAAUCGUGCAGCUGCUGCAGCUCAGCCUGCCUCCUGUUAUGGCCCAGCAGAUCCCUCUGCAGAACAUGACCACAAAGCUGGUCGUGAUCCUGCGGAACGGCAACCUGGAACUGAAAACCGUGCUGUACUACACCGCCACCAGCCUGCAGAUCACCACAAGCUGCACCCAGCUGAACUGA [서열번호 436]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 436에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
다른 구현예에서, 선천적 신호전달 경로의 억제제는 MERS-ORF4a 단백질(NCBI 참조 서열: AGV08457.1; UniProtKB - T2BBG6(T2BBG6_MERS)), 또는 그의 동원체이다. 상기 MERS-ORF4a의 한 구현예는 본 명세서에서 다음과 같은 서열번호 437로 나타낸다:
MDYVSLLNQIWQKYLNSPYTTCLYIPKPTAKYTPLVGTSLHPVLWNCQLSFAGYTESAVNSTKALAKQDAAQRIAWLLHKDGGIPDGCSLYLRHSSLFAQSEEEESFSN [서열번호 437]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 437에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 MERS-ORF4a 폴리펩티드는 다음과 같은 서열번호 438의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGACTACGTGTCCCTGCTGAACCAGATTTGGCAGAAGTACCTGAACAGCCCCTACACCACCTGTCTGTACATCCCCAAGCCTACCGCCAAGTACACACCTCTCGTGGGCACATCTCTGCACCCCGTGCTGTGGAATTGCCAGCTGAGCTTTGCCGGCTACACCGAGTCTGCCGTGAACAGCACAAAGGCCCTGGCCAAACAGGACGCCGCTCAGAGAATTGCCTGGCTGCTGCACAAGGATGGCGGCATCCCTGATGGCTGTAGCCTGTACCTGAGACACAGCAGCCTGTTCGCCCAGAGCGAGGAAGAGGAATCCTTCAGCAAC [서열번호 438]
따라서, 바람직하게는 상기 MERS-ORF4a 폴리펩티드는 실질적으로 서열번호 438에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 상기 RNA 구조체는 다음과 같은 서열번호 439의 RNA 뉴클레오티드 서열을 포함할 수 있다:
AUGGACUACGUGUCCCUGCUGAACCAGAUUUGGCAGAAGUACCUGAACAGCCCCUACACCACCUGUCUGUACAUCCCCAAGCCUACCGCCAAGUACACACCUCUCGUGGGCACAUCUCUGCACCCCGUGCUGUGGAAUUGCCAGCUGAGCUUUGCCGGCUACACCGAGUCUGCCGUGAACAGCACAAAGGCCCUGGCCAAACAGGACGCCGCUCAGAGAAUUGCCUGGCUGCUGCACAAGGAUGGCGGCAUCCCUGAUGGCUGUAGCCUGUACCUGAGACACAGCAGCCUGUUCGCCCAGAGCGAGGAAGAGGAAUCCUUCAGCAAC [서열번호 439]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 439에 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
따라서, 본 발명자들은 서열번호 437의 단백질 서열에 인간 발현을 위한 코돈 최적화를 하였고, 개시(ATG) 및 종결(TGA) 코돈을 포함하는 코돈 최적화된 핵산(DNA) 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 440으로 제공된다:
ATGGACTACGTGTCCCTGCTGAATCAGATCTGGCAGAAGTACCTGAACAGCCCCTACACCACCTGTCTGTACATCCCCAAGCCTACCGCCAAGTACACACCTCTCGTGGGCACATCTCTGCACCCCGTGCTGTGGAATTGCCAGCTGAGCTTTGCCGGCTACACCGAGAGCGCCGTGAATAGCACAAAGGCCCTGGCCAAACAGGACGCCGCTCAGAGAATTGCCTGGCTGCTGCACAAGGATGGCGGCATCCCTGATGGCTGTAGCCTGTACCTGAGACACAGCAGCCTGTTCGCCCAGAGCGAGGAAGAGGAATCCTTCAGCAACTGA [서열번호 440]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 440에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 개시(AUG) 및 종결(UGA) 코돈을 포함하는 서열번호 440의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 441로 제공된다:
AUGGACUACGUGUCCCUGCUGAAUCAGAUCUGGCAGAAGUACCUGAACAGCCCCUACACCACCUGUCUGUACAUCCCCAAGCCUACCGCCAAGUACACACCUCUCGUGGGCACAUCUCUGCACCCCGUGCUGUGGAAUUGCCAGCUGAGCUUUGCCGGCUACACCGAGAGCGCCGUGAAUAGCACAAAGGCCCUGGCCAAACAGGACGCCGCUCAGAGAAUUGCCUGGCUGCUGCACAAGGAUGGCGGCAUCCCUGAUGGCUGUAGCCUGUACCUGAGACACAGCAGCCUGUUCGCCCAGAGCGAGGAAGAGGAAUCCUUCAGCAACUGA [서열번호 441]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 441에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
다른 구현예에서, 선천적 신호전달 경로의 억제제는 BVDV nPro 단백질(NCBI 참조 서열: AAA42854.1; UniProtKB - P19711(POLG_BVDVN)), 또는 그의 동원체이다. 상기 BVDV nPro의 한 구현예는 본 명세서에서 다음과 같은 서열번호 442로 나타낸다:
MELITNELLYKTYKQKPVGVEEPVYDQAGDPLFGERGAVHPQSTLKLPHKRGERDVPTNLASLPKRGDCRTGNSRGPVSGIYLKPGPLFYQDYKGPVYHRAPLELFEEGSMCETTKRIGRVTGSDGKLYHIYVCIDGCIIIKSATRSYQRVFRWVHNRLDCPLWVTSC [서열번호 442]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 442에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 BVDV nPro 폴리펩티드는 다음과 같은 서열번호 443의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGAGTTGATCACAAATGAACTTTTATACAAAACATACAAACAAAAACCCGTCGGGGTGGAGGAACCTGTTTATGATCAGGCAGGTGATCCCTTATTTGGTGAAAGGGGAGCAGTCCACCCTCAATCGACGCTAAAGCTCCCACACAAGAGAGGGGAACGCGATGTTCCAACCAACTTGGCATCCTTACCAAAAAGAGGTGACTGCAGGACGGGTAATAGCAGAGGACCTGTGAGCGGGATCTACCTGAAGCCAGGGCCACTATTTTACCAGGACTATAAAGGTCCCGTCTATCACAGGGCCCCGCTGGAGCTCTTTGAGGAGGGATCCATGTGTGAAACGACTAAACGGATAGGGAGAGTAACTGGAAGTGACGGAAAGCTGTACCACATTTATGTGTGTATAGATGGATGTATAATAATAAAAAGTGCCACGAGAAGTTACCAAAGGGTGTTCAGGTGGGTCCATAATAGGCTTGACTGCCCTCTATGGGTCACAAGTTGC [서열번호 443]
따라서, 바람직하게는 상기 BVDV nPro 폴리펩티드는 실질적으로 서열번호 443에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 상기 RNA 구조체는 다음과 같은 서열번호 444의 RNA 뉴클레오티드 서열을 포함할 수 있다:
AUGGAGUUGAUCACAAAUGAACUUUUAUACAAAACAUACAAACAAAAACCCGUCGGGGUGGAGGAACCUGUUUAUGAUCAGGCAGGUGAUCCCUUAUUUGGUGAAAGGGGAGCAGUCCACCCUCAAUCGACGCUAAAGCUCCCACACAAGAGAGGGGAACGCGAUGUUCCAACCAACUUGGCAUCCUUACCAAAAAGAGGUGACUGCAGGACGGGUAAUAGCAGAGGACCUGUGAGCGGGAUCUACCUGAAGCCAGGGCCACUAUUUUACCAGGACUAUAAAGGUCCCGUCUAUCACAGGGCCCCGCUGGAGCUCUUUGAGGAGGGAUCCAUGUGUGAAACGACUAAACGGAUAGGGAGAGUAACUGGAAGUGACGGAAAGCUGUACCACAUUUAUGUGUGUAUAGAUGGAUGUAUAAUAAUAAAAAGUGCCACGAGAAGUUACCAAAGGGUGUUCAGGUGGGUCCAUAAUAGGCUUGACUGCCCUCUAUGGGUCACAAGUUGC [서열번호 444]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 444에 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
따라서, 본 발명자들은 서열번호 442의 단백질 서열에 인간 발현을 위한 코돈 최적화를 하였고, 개시(ATG) 및 종결(TGA) 코돈을 포함하는 코돈 최적화된 핵산(DNA) 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 445로 제공된다:
ATGGAACTGATCACCAACGAGCTGCTGTACAAGACCTACAAGCAGAAACCCGTGGGCGTCGAGGAACCCGTGTATGATCAAGCTGGCGACCCTCTGTTTGGCGAGAGAGGCGCTGTTCACCCTCAGAGCACACTGAAGCTGCCCCACAAGCGGGGCGAAAGAGATGTGCCTACCAACCTGGCCAGCCTGCCTAAGAGAGGCGATTGCAGAACCGGCAATAGCAGAGGCCCTGTGTCCGGCATCTACCTGAAACCTGGACCACTGTTCTACCAGGACTACAAGGGCCCCGTGTACCACAGAGCACCCCTGGAACTTTTCGAAGAGGGCAGCATGTGCGAAACCACCAAGCGGATCGGAAGAGTGACCGGCTCTGACGGCAAGCTGTACCACATCTACGTGTGCATCGACGGCTGCATCATCATCAAGAGCGCCACCAGATCCTACCAGCGGGTGTTCAGATGGGTGCACAACAGACTGGACTGCCCTCTGTGGGTCACCAGCTGCTGA [서열번호 445]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 445에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 개시(AUG) 및 종결(UGA) 코돈을 포함하는 서열번호 445의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 446으로 제공된다:
AUGGAACUGAUCACCAACGAGCUGCUGUACAAGACCUACAAGCAGAAACCCGUGGGCGUCGAGGAACCCGUGUAUGAUCAAGCUGGCGACCCUCUGUUUGGCGAGAGAGGCGCUGUUCACCCUCAGAGCACACUGAAGCUGCCCCACAAGCGGGGCGAAAGAGAUGUGCCUACCAACCUGGCCAGCCUGCCUAAGAGAGGCGAUUGCAGAACCGGCAAUAGCAGAGGCCCUGUGUCCGGCAUCUACCUGAAACCUGGACCACUGUUCUACCAGGACUACAAGGGCCCCGUGUACCACAGAGCACCCCUGGAACUUUUCGAAGAGGGCAGCAUGUGCGAAACCACCAAGCGGAUCGGAAGAGUGACCGGCUCUGACGGCAAGCUGUACCACAUCUACGUGUGCAUCGACGGCUGCAUCAUCAUCAAGAGCGCCACCAGAUCCUACCAGCGGGUGUUCAGAUGGGUGCACAACAGACUGGACUGCCCUCUGUGGGUCACCAGCUGCUGA [서열번호 446]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 446에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
다른 구현예에서, 선천적 신호전달 경로의 억제제는 HSV US1 단백질(NCBI 참조 서열: CAB06708.1; UniProtKB - P89474(ICP22_HHV2H)), 또는 그의 동원체이다. 상기 HSV US1의 한 구현예는 본 명세서에서 다음과 같은 서열번호 447로 나타낸다:
MVRDCYLMGYCRTRLGPRTWGRLLQISGGTWDVRLRNAIREVEAHFEPAAEPVCELPCLNARRYGPECDVGNLETNGGSTSDDEISDATDSDDTLASHSDTEGGPSPAGRENPESASGGAIAARLECEFGTFDWTSEEGSQPWLSAVVADTSSAERSGLPAPGACRATEAPEREDGCRKMRFPAACPYPCGHTFLRP [서열번호 447]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 447에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 HSV US1폴리펩티드는 다음과 같은 서열번호 448의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGTGCGAGACTGCTACCTCATGGGCTACTGCCGGACCCGCCTGGGGCCGCGCACGTGGGGCCGCCTGCTGCAGATCTCGGGCGGAACCTGGGACGTGCGCCTGCGAAACGCAATCCGGGAGGTCGAGGCGCATTTTGAACCCGCCGCCGAGCCCGTGTGCGAGCTGCCCTGTCTGAACGCCAGGCGTTACGGCCCCGAGTGTGATGTTGGCAATCTCGAGACCAACGGCGGCTCGACGAGCGATGATGAGATATCGGATGCGACGGACTCGGACGATACCCTCGCGTCCCATTCCGACACGGAGGGGGGGCCCTCCCCGGCCGGCCGGGAGAACCCGGAATCCGCGTCCGGCGGGGCTATCGCGGCTCGGCTGGAGTGTGAGTTTGGGACGTTTGACTGGACGTCCGAGGAGGGCTCCCAGCCCTGGCTGTCCGCGGTGGTCGCCGATACCAGCTCCGCCGAACGCTCTGGCCTACCCGCCCCGGGCGCGTGTCGCGCAACGGAAGCCCCAGAACGCGAGGACGGGTGCCGAAAAATGCGCTTCCCCGCCGCCTGCCCCTATCCCTGCGGCCACACATTTCTCCGGCCA [서열번호 448]
따라서, 바람직하게는 상기 HSV US1 폴리펩티드는 실질적으로 서열번호 448에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 상기 RNA 구조체는 다음과 같은 서열번호 449의 RNA 뉴클레오티드 서열을 포함할 수 있다:
AUGGUGCGAGACUGCUACCUCAUGGGCUACUGCCGGACCCGCCUGGGGCCGCGCACGUGGGGCCGCCUGCUGCAGAUCUCGGGCGGAACCUGGGACGUGCGCCUGCGAAACGCAAUCCGGGAGGUCGAGGCGCAUUUUGAACCCGCCGCCGAGCCCGUGUGCGAGCUGCCCUGUCUGAACGCCAGGCGUUACGGCCCCGAGUGUGAUGUUGGCAAUCUCGAGACCAACGGCGGCUCGACGAGCGAUGAUGAGAUAUCGGAUGCGACGGACUCGGACGAUACCCUCGCGUCCCAUUCCGACACGGAGGGGGGGCCCUCCCCGGCCGGCCGGGAGAACCCGGAAUCCGCGUCCGGCGGGGCUAUCGCGGCUCGGCUGGAGUGUGAGUUUGGGACGUUUGACUGGACGUCCGAGGAGGGCUCCCAGCCCUGGCUGUCCGCGGUGGUCGCCGAUACCAGCUCCGCCGAACGCUCUGGCCUACCCGCCCCGGGCGCGUGUCGCGCAACGGAAGCCCCAGAACGCGAGGACGGGUGCCGAAAAAUGCGCUUCCCCGCCGCCUGCCCCUAUCCCUGCGGCCACACAUUUCUCCGGCCA [서열번호 449]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 449에 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
따라서, 본 발명자들은 서열번호 447의 단백질 서열에 인간 발현을 위한 코돈 최적화를 하였고, 개시(ATG) 및 종결(TGA) 코돈을 포함하는 코돈 최적화된 핵산(DNA) 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 450으로 제공된다:
ATGGTCCGAGACTGCTACCTGATGGGCTACTGCAGAACCAGACTGGGCCCTAGAACATGGGGCAGACTGCTGCAGATCTCTGGCGGCACATGGGATGTGCGGCTGAGAAACGCCATCAGAGAGGTGGAAGCCCACTTCGAGCCTGCCGCTGAACCTGTGTGTGAACTGCCCTGTCTGAACGCTAGAAGATACGGCCCTGAGTGCGACGTGGGCAACCTGGAAACAAATGGCGGCAGCACCAGCGACGACGAGATCTCTGATGCCACCGACAGCGACGATACACTGGCCAGCCACAGCGATACAGAAGGCGGACCATCTCCTGCCGGAAGAGAGAATCCTGAGTCTGCCTCTGGCGGAGCTATCGCCGCTAGACTGGAATGCGAGTTCGGCACCTTCGACTGGACAAGCGAGGAAGGCTCTCAGCCTTGGCTGTCTGCTGTGGTGGCCGATACAAGCAGCGCCGAAAGATCTGGACTTCCTGCTCCTGGCGCCTGCAGAGCTACAGAAGCTCCTGAAAGAGAGGACGGCTGCAGAAAGATGCGGTTCCCTGCCGCCTGTCCTTATCCTTGCGGCCACACATTTCTGCGGCCCTGA [서열번호 450]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 450에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 개시(AUG) 및 종결(UGA) 코돈을 포함하는 서열번호 450의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 451로 제공된다:
AUGGUCCGAGACUGCUACCUGAUGGGCUACUGCAGAACCAGACUGGGCCCUAGAACAUGGGGCAGACUGCUGCAGAUCUCUGGCGGCACAUGGGAUGUGCGGCUGAGAAACGCCAUCAGAGAGGUGGAAGCCCACUUCGAGCCUGCCGCUGAACCUGUGUGUGAACUGCCCUGUCUGAACGCUAGAAGAUACGGCCCUGAGUGCGACGUGGGCAACCUGGAAACAAAUGGCGGCAGCACCAGCGACGACGAGAUCUCUGAUGCCACCGACAGCGACGAUACACUGGCCAGCCACAGCGAUACAGAAGGCGGACCAUCUCCUGCCGGAAGAGAGAAUCCUGAGUCUGCCUCUGGCGGAGCUAUCGCCGCUAGACUGGAAUGCGAGUUCGGCACCUUCGACUGGACAAGCGAGGAAGGCUCUCAGCCUUGGCUGUCUGCUGUGGUGGCCGAUACAAGCAGCGCCGAAAGAUCUGGACUUCCUGCUCCUGGCGCCUGCAGAGCUACAGAAGCUCCUGAAAGAGAGGACGGCUGCAGAAAGAUGCGGUUCCCUGCCGCCUGUCCUUAUCCUUGCGGCCACACAUUUCUGCGGCCCUGA [서열번호 451]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 452에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
다른 구현예에서, 선천적 신호전달 경로의 억제제는 MERS CoV M 단백질(NCBI 참조 서열: AGV08396.1; UniProtKB - T2BB40(T2BB40_MERS)), 또는 그의 동원체이다. 상기 MERS CoV M의 한 구현예는 본 명세서에서 다음과 같은 서열번호 452로 나타낸다:
MSNMTQLTEAQIIAIIKDWNFAWSLIFLLITIVLQYGYPSRSMTVYVFKMFVLWLLWPSSMALSIFSAIYPIDLASQIISGIVAAVSAMMWISYFVQSIRLFMRTGSWWSFNPETNCLLNVPFGGTTVVRPLVEDSTSVTAVVTNGHLKMAGMHFGACDYDRLPNEVTVAKPNVLIALKMVKRQSYGTNSGVAIYHRYKAGNYRSPPITADIELALLR [서열번호 452]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 452에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 MERS CoV M 폴리펩티드는 다음과 같은 서열번호 453의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGTCTAATATGACGCAACTCACTGAGGCGCAGATTATTGCCATTATTAAAGACTGGAACTTTGCATGGTCCCTGATCTTTCTCTTAATTACTATCGTACTACAGTATGGATACCCATCCCGTAGTATGACTGTCTATGTCTTTAAAATGTTTGTTTTATGGCTCCTATGGCCATCTTCCATGGCGCTATCAATATTTAGCGCCATTTATCCAATTGATCTAGCTTCCCAGATAATCTCTGGCATTGTAGCAGCTGTTTCAGCTATGATGTGGATTTCCTACTTTGTGCAGAGTATCCGGCTGTTTATGAGAACTGGATCATGGTGGTCATTCAATCCTGAGACTAATTGCCTTTTGAACGTTCCATTTGGTGGTACAACTGTCGTACGTCCACTCGTAGAGGACTCCACCAGTGTAACTGCTGTTGTAACCAATGGCCACCTCAAAATGGCTGGCATGCATTTCGGTGCTTGTGACTACGACAGACTTCCTAATGAAGTCACCGTGGCCAAACCCAATGTGCTGATTGCTTTAAAAATGGTGAAGCGGCAAAGCTACGGAACTAATTCCGGCGTTGCCATTTACCATAGATATAAGGCAGGTAATTACAGGAGTCCGCCTATTACGGCGGATATTGAACTTGCATTGCTTCGA [서열번호 453]
따라서, 바람직하게는 상기 MERS CoV M 폴리펩티드는 실질적으로 서열번호 453에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 상기 RNA 구조체는 다음과 같은 서열번호 454의 RNA 뉴클레오티드 서열을 포함할 수 있다:
AUGUCUAAUAUGACGCAACUCACUGAGGCGCAGAUUAUUGCCAUUAUUAAAGACUGGAACUUUGCAUGGUCCCUGAUCUUUCUCUUAAUUACUAUCGUACUACAGUAUGGAUACCCAUCCCGUAGUAUGACUGUCUAUGUCUUUAAAAUGUUUGUUUUAUGGCUCCUAUGGCCAUCUUCCAUGGCGCUAUCAAUAUUUAGCGCCAUUUAUCCAAUUGAUCUAGCUUCCCAGAUAAUCUCUGGCAUUGUAGCAGCUGUUUCAGCUAUGAUGUGGAUUUCCUACUUUGUGCAGAGUAUCCGGCUGUUUAUGAGAACUGGAUCAUGGUGGUCAUUCAAUCCUGAGACUAAUUGCCUUUUGAACGUUCCAUUUGGUGGUACAACUGUCGUACGUCCACUCGUAGAGGACUCCACCAGUGUAACUGCUGUUGUAACCAAUGGCCACCUCAAAAUGGCUGGCAUGCAUUUCGGUGCUUGUGACUACGACAGACUUCCUAAUGAAGUCACCGUGGCCAAACCCAAUGUGCUGAUUGCUUUAAAAAUGGUGAAGCGGCAAAGCUACGGAACUAAUUCCGGCGUUGCCAUUUACCAUAGAUAUAAGGCAGGUAAUUACAGGAGUCCGCCUAUUACGGCGGAUAUUGAACUUGCAUUGCUUCGA [서열번호 454]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 454에 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
따라서, 본 발명자들은 서열번호 452의 단백질 서열에 인간 발현을 위한 코돈 최적화를 하였고, 개시(ATG) 및 종결(TGA) 코돈을 포함하는 코돈 최적화된 핵산(DNA) 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 455로 제공된다:
ATGAGCAACATGACCCAGCTGACAGAGGCCCAGATCATTGCCATCATCAAGGACTGGAACTTCGCTTGGAGCCTGATCTTCCTGCTGATCACCATCGTGCTGCAGTACGGCTACCCCAGCAGATCCATGACCGTGTACGTGTTCAAGATGTTCGTCCTGTGGCTGCTGTGGCCCAGCTCTATGGCCCTGAGCATCTTCAGCGCCATCTATCCCATCGACCTGGCCAGCCAGATCATCTCTGGAATCGTGGCCGCCGTGTCCGCCATGATGTGGATCAGCTACTTCGTGCAGAGCATCCGGCTGTTCATGAGAACCGGCAGCTGGTGGTCCTTCAATCCCGAGACAAACTGCCTGCTGAACGTGCCCTTTGGCGGCACTACAGTCGTCAGACCCCTGGTGGAAGATAGCACCTCTGTGACCGCCGTGGTCACCAATGGCCACCTGAAAATGGCCGGCATGCACTTCGGCGCCTGCGACTATGACAGACTGCCCAACGAAGTGACCGTGGCCAAGCCTAATGTGCTGATCGCCCTGAAGATGGTCAAGCGGCAGAGCTACGGCACCAATTCTGGCGTGGCCATCTACCACAGATACAAGGCCGGCAACTACAGAAGCCCTCCTATCACCGCCGACATCGAGCTGGCTCTGCTGAGATGA [서열번호 455]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 455에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 개시(AUG) 및 종결(UGA) 코돈을 포함하는 서열번호 455의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 456으로 제공된다:
AUGAGCAACAUGACCCAGCUGACAGAGGCCCAGAUCAUUGCCAUCAUCAAGGACUGGAACUUCGCUUGGAGCCUGAUCUUCCUGCUGAUCACCAUCGUGCUGCAGUACGGCUACCCCAGCAGAUCCAUGACCGUGUACGUGUUCAAGAUGUUCGUCCUGUGGCUGCUGUGGCCCAGCUCUAUGGCCCUGAGCAUCUUCAGCGCCAUCUAUCCCAUCGACCUGGCCAGCCAGAUCAUCUCUGGAAUCGUGGCCGCCGUGUCCGCCAUGAUGUGGAUCAGCUACUUCGUGCAGAGCAUCCGGCUGUUCAUGAGAACCGGCAGCUGGUGGUCCUUCAAUCCCGAGACAAACUGCCUGCUGAACGUGCCCUUUGGCGGCACUACAGUCGUCAGACCCCUGGUGGAAGAUAGCACCUCUGUGACCGCCGUGGUCACCAAUGGCCACCUGAAAAUGGCCGGCAUGCACUUCGGCGCCUGCGACUAUGACAGACUGCCCAACGAAGUGACCGUGGCCAAGCCUAAUGUGCUGAUCGCCCUGAAGAUGGUCAAGCGGCAGAGCUACGGCACCAAUUCUGGCGUGGCCAUCUACCACAGAUACAAGGCCGGCAACUACAGAAGCCCUCCUAUCACCGCCGACAUCGAGCUGGCUCUGCUGAGAUGA [서열번호 456]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 456에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
상기 적어도 하나의 선천적 억제제 단백질(IIP)은 임의의 코로나바이러스의 ORF4a(NS4a), 임의의 코로나바이러스의 ORF3b, 또는 마우스 간염 바이러스 및 SARS(코로나바이러스)의 뉴클레오캡시드 단백질; 및 그의 동원체로 이루어진 IIP의 군으로부터 선택되지 않을 수 있다.
상기 적어도 하나의 선천적 억제제 단백질(IIP)은 HSV-2 Us1; HSV-1 Us1; HSV-1Us11; ORF V20.0L; BVDV Npro; Langat NS5; 인플루엔자 NS1; PIV-5 V; SARS-CoV-2 ORF3b; 및 MERS-CoV ORF4a;로 이루어진 IIP의 군으로부터 선택되지 않을 수 있다.
상기 RNA 구조체는 적어도 하나의 치료 생체분자를 암호화하는 뉴클레오티드 서열을 포함한다. 이것은 도 1에서 관심있는 유전자(GOI)로 나타낸다.
상기 적어도 하나의 치료 생체분자는 치료 단백질을 포함할 수 있다. 숙련된 기술자는 치료 단백질이 바람직하게는 인간에서 치료 적용분야를 갖는 임의의 단백질에 관한 것임을 이해할 것이다. 상기 RNA 분자에 의해 암호화될 수 있는 예시적인 치료 생체분자는 박테리아, 바이러스, 진균, 원생동물/또는 기생충과 같은 병원체로부터 유래되는 단백질 또는 펩티드를 포함한다. 상기 단백질 또는 펩티드는 항원, 즉 숙주에서 면역 반응을 자극 또는 촉발할 수 있는 항원일 수 있다. 그러므로, 상기 적어도 하나의 치료 생체분자가 항원인 구현예에서, 제1 측면의 RNA 구조체는 백신으로 간주될 수 있다.
바이러스로부터 유래되는 단백질 또는 펩티드는 바이러스 항원일 수 있다. 상기 바이러스 항원은 오르토믹소바이러스(Orthomyxovirus); 파라믹소비리대(Paramyxoviridae) 바이러스; 메타뉴모바이러스 및 모르빌리바이러스(Morbillivirus); 뉴모바이러스; 파라믹소바이러스(Paramyxovirus); 폭스비리대(Poxviridae); 메타뉴모바이러스; 모르빌리바이러스; 피코르나바이러스; 엔테로바이러스; 분야바이러스(Bunyavirus); 플레보바이러스(Phlebovirus); 나이로바이러스(Nairovirus); 헤파르나바이러스(Heparnavirus); 토가바이러스(Togavirus); 알파바이러스; 아르테리바이러스(Arterivirus); 플라비바이러스; 페스티바이러스; 헤파드나바이러스(Hepadnavirus); 라브도바이러스(Rhabdovirus); 칼리시비리대(Caliciviridae); 코로나바이러스; 레트로바이러스(Retroviruses); 레오바이러스(Reovirus); 파르보바이러스(Parvovirus); 델타 간염 바이러스(HDV); E형 간염 바이러스(HEV); 인간 헤르페스바이러스 및 파포바바이러스(Papovavirus);로 이루어진 군으로부터 선택되는 바이러스로부터 유래될 수 있다.
상기 오르토믹소바이러스는 인플루엔자(인플루엔자) A, B 및 C일 수 있다. 상기 파라믹소비리대 바이러스는 뉴모바이러스(RSV), 파라믹소바이러스(PIV)일 수 있다. 상기 메타뉴모바이러스는 모르빌리바이러스(예컨대, 홍역)일 수 있다. 상기 뉴모바이러스는 호흡기 세포융합 바이러스(RSV), 소 호흡기 세포융합 바이러스, 마우스의 폐렴 바이러스, 또는 터키 비기관염(rhinotracheitis) 바이러스일 수 있다. 상기 파라믹소바이러스는 파라인쿠엔자(Parainfluenza) 바이러스 타입 1 - 4(PIV), 볼거리, 센다이 바이러스, 원숭이 바이러스 5, 소 파라인플루엔자 바이러스, 니파바이러스, 헤니파바이러스(Henipavirus) 또는 뉴캐슬(Newcastle) 질환 바이러스일 수 있다. 상기 폭스비리대는 바리올라 베라(Variola vera), 예를 들면 바리올라 메이저(major) 및 바리올라 마이너(minor)일 수 있다. 상기 메타뉴모바이러스는 인간 메타뉴모바이러스(hMPV) 또는 조류 메타뉴모바이러스(aMPV)일 수 있다. 상기 모르빌리바이러스는 홍역일 수 있다. 상기 피코르나바이러스는 엔테로바이러스, 리노바이러스, 헤파르나바이러스, 파레코바이러스(Parechovirus), 카디오바이러스(Cardiovirus) 및 아프토바이러스(Aphthovirus)일 수 있다. 상기 엔테로바이러스는 폴리오바이러스 타입 1, 2 또는 3, 콕사키 A 바이러스 타입 1 내지 22 및 24, 콕사키 B 바이러스 타입 1 내지 6, 에코바이러스(Echovirus)(ECHO) 바이러스) 타입 1 내지 9, 11 내지 27 및 29 내지 34 또는 엔테로바이러스 68 내지 71일 수 있다. 상기 분야바이러스는 캘리포니아 뇌염 바이러스일 수 있다. 상기 플레보바이러스는 리프트 계곡열 바이러스일 수 있다. 상기 나이로바이러스는 크림-콩고(Crimean-Congo) 출혈열 바이러스일 수 있다. 상기 헤파르나바이러스는 A형 간염 바이러스(HAV)일 수 있다. 상기 토가바이러스는 루비바이러스일 수 있다. 상기 플라비바이러스는 진드기-매개 뇌염(TBE) 바이러스, 뎅기(타입 1, 2, 3 또는 4) 바이러스, 황열 바이러스, 일본 뇌염 바이러스, 키아사누 삼림 바이러스(Kyasanur Forest Virus), 웨스트 나일 뇌염 바이러스, 세인트 루이스 뇌염 바이러스, 러시아 봄-여름 뇌염 바이러스 또는 포와산(Powassan) 뇌염 바이러스일 수 있다. 상기 페스티바이러스는 소 바이러스 설사(BVDV), 고전적 돼지 열병(CSFV) 또는 보더 질환(BDV)일 수 있다. 상기 헤파드나바이러스는 B형 간염 바이러스 또는 C형 간염 바이러스일 수 있다. 상기 라브도바이러스는 리사바이러스(Lyssavirus)(광견병 바이러스) 또는 수포성바이러스(Vesiculovirus)(VSV)일 수 있다. 상기 칼리시비리대는 노워크(Norwalk) 바이러스, 또는 노워크-유사 바이러스, 예컨대 하와이 바이러스 및 스노우 마운틴 바이러스(Snow Mountain Virus)일 수 있다. 상기 코로나바이러스는 SARS CoV-1, SARS-CoV-2, MERS, 인간 호흡기 코로나바이러스, 조류 전염성 기관지염(IBV), 마우스 간염 바이러스(MHV), 또는 돼지 전염성 위장염 바이러스(TGEV)일 수 있다. 상기 레트로바이러스는 온코바이러스(Oncovirus), 렌티바이러스(Lentivirus) 또는 스푸마바이러스(Spumavirus)일 수 있다. 상기 레오바이러스는 오르토레오(Orthoreo) 바이러스, 로타바이러스, 오르비바이러스(Orbivirus), 또는 콜티바이러스(Coltivirus)일 수 있다. 상기 파르보바이러스는 파르보바이러스 B 19일 수 있다. 상기 인간 헤르페스바이러스는 헤르페스 심플렉스 바이러스(HSV), 바리셀라-조스터(Varicella-zoster) 바이러스(VZV), 엡스테인-바 바이러스(EBV), 사이토메갈로바이러스(CMV), 인간 헤르페스바이러스 6(HHV6), 인간 헤르페스바이러스 7(HHV7), 또는 인간 헤르페스바이러스 8(HHV8)일 수 있다. 상기 파포바바이러스는 유두종 바이러스, 폴리오마바이러스(Polyomavirus), 아데노바이러스(Adenovirus) 또는 아레나바이러스일 수 있다.
박테리아로부터 유래되는 단백질 또는 펩티드는 박테리아 항원일 수 있다.
상기 박테리아 항원은 나이세리아 메닝기티데스(Neisseria meningitides), 스트렙토코커스 뉴모니애(Streptococcus pneumoniae), 스트렙토코커스 피로게네스(Streptococcus pyogenes), 모락셀라 카타랄리스(Moraxella catarrhalis), 보르데텔라 페르투시스(Bordetella pertussis), 부르크홀데리아 속(Burkholderia sp.)(예컨대, 부르크홀데리아 말레이, 부르크홀데리아 슈도말레이 및 부르크홀데리아 세파시아), 스타필로코커스 아우레우스(Staphylococcus aureus), 해모필러스 인쿠엔자에(Haemophilus influenzae), 클로스트리디움 테타니(Clostridium tetani)(파상풍), 클로스트리디움 퍼프린젠스(Clostridium perfringens), 클로스트리디움 보툴리눔스(Clostridium botulinums), 코리네박테리움 디프테리애(Cornynebacterium diphtheriae)(디프테리아), 슈도모나스 애루기노사(Pseudomonas aeruginosa), 레지오넬라 뉴모필라(Legionella pneumophila), 콕시엘라 부르네티이(Coxiella burnetii), 브루셀라 속(Brucella sp.)(예컨대, B. 아보르투스, B. 카니스, B. 멜리텐시스, B. 네오토마에, B. 오비스, B. 수이스 및 B. 피니페디애), 프란시셀라 속(Francisella sp.)(예컨대, F. 노비시다, F. 필로미라지아 및 F. 툴라렌시스), 스트렙토코커스 아갈락티애(Streptococcus agalactiae), 나이세리아 고노레애(Neiserria gonorrhoeae), 클라미디아 트라코마티스(Chlamydia trachomatis), 트레포네마 팔리둠(Treponema pallidum)(매독), 해모필러스 두크레이이(Haemophilus ducreyi), 엔테로코커스 패칼리스(Enterococcus faecalis), 엔테로코커스 패시움(Enterococcus faecium), 헬리코박터 파일로리(Helicobacter pylori), 스타필로코커스 사프로피티쿠스(Staphylococcus saprophyticus), 예르시니아 엔테로콜리티카(Yersinia enterocolitica), 대장균(E. coli), 바실러스 안트라시스(Bacillus anthracis)(탄저병), 예르시니아 페스티스(Yersinia pestis)(페스트), 미코박테리움 투베르쿨로시스(Mycobacterium tuberculosis), 리케챠(Rickettsia), 리스테리아(Listeria), 클라미디아 뉴모니애(Chlamydia pneumoniae), 비브리오 콜레라에(Vibrio cholerae), 살모넬라 타이피(Salmonella typhi)(장티푸스), 보렐리아 부르그도르퍼(Borrelia burgdorfer), 포르필라모나스 속(Porphyromonas sp.) 및 클레브시엘라 속(Klebsiella sp.)으로 이루어진 군으로부터 선택되는 박테리아로부터 유래될 수 있다.
진균으로부터 유래되는 단백질 또는 펩티드는 진균 항원일 수 있다.
상기 진균 항원은 에피더모피톤 코쿠숨(Epidermophyton koccusum), 마이크로스포룸 아우도우이니(Microsporum audouini), 마이크로스로품 카니스(Microsporum canis), 마이크로스포룸 디스토르툼(Microsporum distortum), 마이크로스포룸 에퀴눔(Microsporum equinum), 마이크로스포룸 기프숨(Microsporum gypsum), 마이크로스포룸 나눔(Microsporum nanum), 트리코피톤 콘센트리쿰(Trichophyton concentricum), 트리코피톤 에퀴눔(Trichophyton equinum), 트리코피톤 갈리나에(Trichophyton gallinae), 트리코피톤 기프세움(Trichophyton gypseum), 트리코피톤 메그니니(Trichophyton megnini), 트리코피톤 멘타그로피테스(Trichophyton mentagrophytes), 트리코피톤 퀸케아눔(Trichophyton quinckeanum), 트리코피톤루브룸(Trichophyton rubrum), 트리코피톤 쇼엔레이니(Trichophyton schoenleini), 트리코피톤 톤수란스(Trichophyton tonsurans), 트리코피톤 베루코숨(Trichophyton verrucosum), T 베루코숨 var. album, var. 디스코이데스, var. 오크라세움, 트리코피톤 비올라세움(Trichophyton violaceum), 및/또는 트리코피톤 파비포르메(Trichophyton faviforme)을 포함하는 피부사상균(Dermatophytres); 또는 아스페르길루스 푸미가투스(Aspergillus fumigatus), 아스페르길루스 카부스(Aspergillus kavus), 아스페르길루스 나이거(Aspergillus niger), 아스페르길루스 니둘란스(Aspergillus nidulans), 아스페르길루스 테레우스(Aspergillus terreus), 아스페르길루스 시도위(Aspergillus sydowi), 아스페르길루스 카바투스(Aspergillus kavatus), 아스페르길루스 글라우쿠스(Aspergillus glaucus), 블라스토키조마이세스 카피타투스(Blastoschizomyces capitatus), 칸디다 알비칸스(Candida albicans), 칸디다 에놀라세(Candida enolase), 칸디다 트로피칼리스(Candida tropicalis), 칸디다 글라브라타(Candida glabrata), 칸디다 크루세이(Candida krusei), 칸디다 파라프실로시스(Candida parapsilosis), 칸디다 스텔라토이데아(Candida stellatoidea), 칸디다 쿠세이(Candida kusei), 칸디다 파라쿠세이(Candida parakwsei), 칸디다 루시타니애(Candida lusitaniae), 칸디다 슈도트로피칼리스(Candida pseudotropicalis), 칸디다 구일리에르몬디(Candida guilliermondi), 클라도스포리움 카리오니이(Cladosporium carrionii), 코시디오이데스 이미티스(Coccidioides immitis), 블라스토마이세스 더마티디스(Blastomyces dermatidis), 크립토코커스 네오포르만스(Cryptococcus neoformans), 게오트리쿰 클라바툼(Geotrichum clavatum), 히스토플라스마 카프술라툼(Histoplasma capsulatum), 클레브시엘라 뉴모니애(Klebsiella pneumoniae), 마이크로스포리디아(Microsporidia), 엔세팔리토준 속(Encephalitozoon spp.), 세프타타 인테스티날리스(Septata intestinalis) 및 엔테로시토준 비에네우시(Enterocytozoon bieneusi); 브라키올라 속(Brachiola spp.), 마이크로스포룸 속(Microsporidium spp.), 노세마 속(Nosema spp.), 플레이스토포라 속(Pleistophora spp.), 트라키플레이스토포라 속(Trachipleistophora spp.), 비타포르마 속(Vittaforma spp.), 파라코시디오이데스 브라실리엔시스(Paracoccidioides 브라질iensis), 뉴모시스티스 카리니이(Pneumocystis carinii), 피티움 인시디오숨(Pythiumn insidiosum), 피티로스포룸 오발레(Pityrosporum ovale), 사카로마이세스 세레비지애(Sacharomyces cerevisiae), 사카로마이세스 보울라르디이(Saccharomyces boulardii), 사카로마이세스 폼베(Saccharomyces pombe), 세도스포리움 아디오스페룸(Scedosporium apiosperum), 스포로트릭스 센키이(Sporothrix schenckii), 트리코스포론 베이겔리이(Trichosporon beigelii), 톡소플라스마 곤디이(Toxoplasma gondii), 페니실리움 마르네페이(Penicillium marneffei), 말라세지아 속(Malassezia spp.), 폰세카애 속(Fonsecaea spp.), 완지엘라 속(Wangiella spp.), 스포로트릭스 속(Sporothrix spp.), 바시디오볼루스 속(Basidiobolus spp.), 코니디오볼루스 속(Conidiobolus spp.), 리조푸스 속(Rhizopus spp.), 무코르 속(Mucor spp.), 아브시디아 속(Absidia spp.), 모르티에렐라 속(Mortierella spp.), 쿠닝가멜라 속(Cunninghamella spp.), 사크세나애 속(Saksenaea spp.), 알테르나리아 속(Alternaria spp.), 쿠르불라리아 속(Curvularia spp.), 헬민토스포리움 속(Helminthosporium spp.), 푸사리움 속(Fusarium spp.), 아스페르길루스 속(Aspergillus spp.), 페니실리움 속(Penicillium spp.), 모놀리니아 속(Monolinia spp.), 리조크토니아 속(Rhizoctonia spp.), 패실로마이세스 속(Paecilomyces spp.), 피토마이세스 속(Pithomyces spp.), 및 클라도스포리움 속(Cladosporium spp.)으로 이루어진 군으로부터 선택되는 진균으로부터 유래될 수 있다.
원생동물로부터 유래되는 단백질 또는 펩티드는 원생동물 항원일 수 있다.
상기 원생동물 항원은 엔타모에바 히스톨리티카(Entamoeba histolytica), 지아르디아 람블리(Giardia lambli), 크립토스포리디움 파르붐(Cryptosporidium parvum), 시클로스포라 카야타넨시스(Cyclospora cayatanensis) 및 톡소플라스마(Toxoplasma)로 이루어진 군으로부터 선택되는 원생동물로부터 유래될 수 있다.
상기 치료 생체분자는 식물로부터 유래되는 단백질 또는 펩티드일 수 있다. 바람직하게는, 상기 단백질 또는 펩티드는 식물 항원이다. 예를 들면, 상기 식물 항원은 리시누스 코무니스(Ricinus communis)로부터 유래될 수 있다.
다른 구현예에서, 상기 치료 생체분자는 면역원 또는 항원일 수 있다. 바람직하게는, 상기 면역원 또는 항원은 종양 면역원 또는 항원, 또는 암 면역원 또는 항원이다. 상기 종양 면역원 및 항원은 펩티드-함유 종양 항원, 예컨대 폴리펩티드 종양 항원 또는 당단백질 종양 항원일 수 있다.
상기 종양 항원은 (a) 암 세포와 연관된 전장(full length) 분자, (b) 결실, 부가 및/또는 치환된 부분을 갖는 분자를 포함하는 상동체(homolog) 및 그의 변형된 형태, 및 (c) 그의 단편일 수 있다.
적합한 종양 면역원은 CD8+ 림프구에 의해 인식되는 클래스(class) I-제한(restricted) 항원 또는 CD4+ 림프구에 의해 인식되는 클래스 II-제한 항원을 포함한다.
상기 종양 항원은 고환암, 흑색종, 폐암, 두경부암, NSCLC, 유방암, 위장암, 방광암, 결장직장암, 췌장암, 림프종, 백혈병, 신장암, 간암, 난소암, 위암 및 전립선암으로 이루어진 군으로부터 선택되는 암과 연관된 항원일 수 있다.
상기 종양 항원은 다음으로부터 선택될 수 있다:
(a) 암-고환 항원, 예컨대 NY-ESO-I, SSX2, SCP-1뿐만 아니라 RAGE, BAGE, GAGE 및 MAGE 패밀리 폴리펩티드, 예를 들면, (예를 들면, 흑색종, 폐, 두경부, NSCLC, 유방, 위장, 및 방광 종양을 다루기 위해 사용될 수 있는) GAGE-I, GAGE-2, MAGE-I, MAGE-2, MAGE-3, MAGE-4, MAGE-5, MAGE-6, 및 MAGE-12;
(b) 돌연변이된 항원, 예를 들면, (다양한 고형 종양, 예컨대, 결장직장암, 폐암, 두경부암과 연관되는) p53, (예컨대, 흑색종, 췌장암 및 결장직장암과 연관되는) p21/Ras, (예컨대, 흑색종과 연관되는) CDK4, (예컨대, 흑색종과 연관되는) MUM-1, (예컨대, 두경부암과 연관되는) 카스파아제(caspase)-8, (예컨대, 방광암과 연관되는) CIA 0205, HLA-A2-R1701, (예컨대, 흑색종과 연관되는) 베타 카테닌, (예컨대, T-세포 비-호지킨 림프종과 연관되는) TCR, (예컨대, 만성 골수성 백혈병과 연관되는) BCR-abl, 트리오스포스페이트 아이소머라아제(triosephosphate isomerase), KIA 0205, CDC-27, 및 LDLR-FUT;
(c) 과발현된 항원, 예를 들면, (예컨대, 결장직장암과 연관되는) 갈렉틴(Galectin) 4, (예컨대, 호지킨 질환과 연관되는) 갈렉틴 9, (예컨대, 만성 골수성 백혈병과 연관되는) 프로티나아제 3, (예컨대, 다양한 백혈병과 연관되는) WT 1, (예컨대, 신장암과 연관되는) 탄산 탈수효소(carbonic anhydrase), (예컨대, 폐암과 연관되는) 알돌라아제(aldolase) A, (예컨대, 흑색종과 연관되는) PRAME, (예컨대, 유방암, 결장암, 폐암 및 난소암과 연관되는) HER-2/neu, (예컨대, 간암과 연관되는) 알파-페토단백질, (예컨대, 결장직장암과 연관되는) KSA, (예컨대, 췌장암 및 위암과 연관되는) 가스트린(gastrin), 텔로머라아제 촉매화 단백질, (예컨대, 유방암 및 난소암과 연관되는) MUC-I, (예컨대, 신장 세포 암종과 연관되는) G-250, (예컨대, 유방암, 결장암과 연관되는) p53, 및 (예컨대, 유방암, 폐암, 및 결장직장암과 같은 위장관의 암과 연관되는) 암태아성 항원;
(d) 공유된 항원, 예를 들면, (예컨대, 흑색종과 연관되는) 흑색종-멜라닌세포 분화 항원, 예컨대 MART-1/멜란(Melan) A, gp100, MClR, 멜라닌세포-자극 호르몬 수용체, 티로시나아제, 티로시나아제 관련 단백질-1/TRPl 및 티로시나아제 관련 단백질-2/TRP2;
(e) 예컨대, 전립선 암과 연관되는 전립선-연관 항원, 예컨대 PAP, PSA, PSMA, PSH-Pl, PSM-Pl, PSM-P2; 및/또는
(f) (예를 들면, 골수종 및 B 세포 림프종과 연관되는) 면역글로불린 이디오타입(idiotype).
상기 치료 생체분자는 진핵생물 단백질 또는 펩티드일 수 있다. 한 구현예에서, 상기 진핵생물 단백질 또는 펩티드는 포유동물 단백질 또는 펩티드이다. 상기 포유동물 단백질 또는 펩티드는 효소; 효소 억제제; 호르몬; 면역 시스템 단백질; 수용체; 결합 단백질; 전사 인자; 번역 인자; 종양 성장 저해 단백질; 구조 단백질 및 혈액 단백질;로 이루어진 군으로부터 선택될 수 있다.
상기 면역 시스템 단백질은 항체 또는 그의 항원 결합 단편일 수 있다. 따라서, 상기 치료 생체분자는 항체 또는 그의 항원 결합 단편일 수 있다. 상기 항원 결합 단편은 개별 중쇄 또는 경쇄, 또는 그의 단편, 예컨대 VL, VH 및 Fd; 1가(monovalent) 단편, 예컨대 Fv, Fab, 및 Fab'; 2가(bivalent) 단편, 예컨대 F(ab')2; 단일쇄 Fv(scFv); 하나 이상의 상보성 결정 영역(CDR); 또는 Fc 단편;을 포함할 수 있다.
상기 효소는 키모신; 위 리파아제; 조직 플라스미노겐 활성화제; 스트렙토키나아제; 콜레스테롤 생합성 또는 분해성 스테로이드생성 효소; 키나아제; 포스포디에스테라아제; 메틸라아제; 탈-메틸라아제; 탈수소효소; 셀룰라아제; 프로테아제; 리파아제; 포스포리파아제; 아로마타아제; 시토크롬; 아데닐레이트 또는 구아닐레이트 시클라아제 및 뉴라미다아제;로 이루어진 군으로부터 선택될 수 있다.
상기 효소 억제제는 메탈로프로티나아제(TIMP)의 조직 억제제일 수 있다. 상기 호르몬 성장 호르몬일 수 있다.
상기 면역 시스템 단백질은 사이토카인; 케모카인; 림포카인; 에리트로포이에틴; 인테그린; 아드레신; 셀렉틴; 귀소(homing) 수용체; T 세포 수용체 및 면역글로불린;으로 이루어진 군으로부터 선택될 수 있다.
상기 사이토카인은 인터루킨, 예를 들면 IL-2, IL-4 및/또는 IL-6, 콜로니 자극 인자(CSF), 과립구 콜로니 자극 인자(G-CSF), 과립구-대식세포 콜로니 자극 인자(GM-CSF) 또는 종양 괴사 인자(TNF)일 수 있다.
상기 케모카인은 대식세포 염증성 단백질-2 및/또는 플라스미노겐 활성화제일 수 있다.
상기 림포카인은 인터페론일 수 있다.
상기 면역글로불린은 자연형, 변형된 또는 키메라 면역글로불린 또는 그의 단편일 수 있다. 바람직하게는, 상기 면역글로불린은 이중 활성을 갖는 키메라 면역글로불린, 예컨대 항체 효소 또는 항체-독소 키메라이다.
상기 호르몬은 인슐린, 갑상선 호르몬, 카테콜아민, 고나도트로핀, 자극 호르몬, 프로락틴, 옥시토신, 도파민, 소 소마토트로핀, 렙틴; 성장 호르몬(예컨대, 인간 성장 호르몬), 성장 인자(예컨대, 표피 성장 인자, 신경 성장 인자, 인슐린-유사 성장 인자 등);로 이루어진 군으로부터 선택될 수 있다.
상기 수용체는 스테로이드 호르몬 수용체 또는 펩티드 수용체일 수 있다. 바람직하게는, 상기 수용체는 성장 인자 수용체이다.
상기 결합 단백질은 성장 인자 결합 단백질일 수 있다.
상기 종양 성장 저해 단백질은 혈관형성을 억제하는 단백질일 수 있다.
상기 구조 단백질은 콜라겐; 피브로인; 피브리노겐; 엘라스틴; 튜불린; 액틴; 및 미오신;으로 이루어진 군으로부터 선택될 수 있다.
상기 혈액 단백질은 트롬빈; 혈청 알부민; 인자 VII; 인자 VIII; 인슐린; 인자 IX; 인자 X; 조직 플라스미노겐 활성화제; 단백질 C; 본 빌레브란트 인자; 항-트롬빈 III; 글루코세레브로시다아제; 에리트로포이에틴 과립구 콜로니 자극 인자(GCSF) 또는 변형된 인자 VIII; 및 항응고제;로 이루어진 군으로부터 선택될 수 있다.
한 바람직한 구현예에서, 상기 치료 생체분자는 림프 항상성을 조절할 수 있는 사이토카인, 바람직하게는 T 세포의 발생, 프라이밍, 확장, 분화 및/또는 생존에 수반되고, 바람직하게는 이를 유도 또는 향상시키는 사이토카인이다. 따라서, 바람직하게는 상기 사이토카인은 인터루킨이다. 가장 바람직하게는, IL-2, IL-7, IL-12, IL-15, 또는 IL-21이다.
상기 치료 생체분자는 줄기 세포 특징을 갖는 세포로 체세포의 재프로그래밍(reprogramming)을 향상시킬 수 있는 단백질일 수 있다. 줄기 세포 특징을 갖는 세포로 체세포의 재프로그래밍을 향상시킬 수 있는 단백질은 OCT4, SOX2, NANOG, LIN28, p53, ART-4, BAGE, ss-카테닌/m, Bcr-abL CAMEL, CAP-1, CASP-8, CDC27/m, CD 4/m, CEA, CLAUDIN-12, c-MYC, CT, Cyp-B, DAM, ELF2M, ETV6-AML1, G250, GAGE, GnT-V, Gap100, HAGE, HER-2/neu, HPV-E7, HPV-E6, HAST-2, hTERT(또는 hTRT), LAGE, LDLR/FUT, MAGE-A, MAGE-B, MAGE-C, MART-1/멜란-A, MC1R, 마이오신/m, MUC1, MUM-1, -2, -3, NA88-A, NF1, NY-ESO-1, NY-BR-1, pl90 마이너 BCR-abL, Plac-1, Pml/RARa, PRAME, 프로티나아제 3, PSA, PSM, RAGE, RU1 또는 RU2, SAGE, SART-1 또는 SART-3, SCGB3A2, SCP1, SCP2, SCP3, SSX, SURVIVIN, TEL/AML1, TPI/m, TRP-1, TRP-2, TRP-2/INT2, TPTE 및 WT로 이루어진 군으로부터 선택될 수 있고, 바람직하게는 WT-1이다.
바람직하게는, MAGE-A는 MAGE-A1, MAGE-A2, MAGE-A3, MAGE-A4, MAGE-A5, MAGE-A6, MAGE-A7, MAGE-A8, MAGE-A9, MAGE-A10, MAGE-A11, 또는 MAGE-A12로 이루어진 군으로부터 선택된다.
바람직하게는, 줄기 세포 특징을 갖는 세포로 체세포의 재프로그래밍을 향상시킬 수 있는 단백질은 OCT4, SOX2, LF4; c-MYC; NANOG; LIN28;이다.
상기 치료 생체분자는 세포-치료법 적응증을 위해 생체외(ex vivo)에서 세포를 변형하기 위해 이용될 수 있는 생체분자일 수 있다. 따라서, 바람직하게는 상기 치료 생체분자는 면역글로불린, T-세포 수용체 및 NK 수용체로 이루어진 군으로부터 선택될 수 있다.
상기 치료 생체분자는 내인성(endogenous) 숙주 유전자의 발현을 조절할 수 있는 RNA 분자, 예를 들면 간섭 RNA, 예컨대 작은 RNA, siRNA 또는 microRNA일 수 있다.
상기 적어도 하나의 바이러스 선천적 억제제 단백질(IIP)을 암호화하는 서열은 제1 측면의 RNA 구조체 내의 임의의 곳에 배치될 수 있으며, 예컨대 상기 치료 생체분자(즉, 도 1에서의 GOI)를 암호화하는 서열은 상기 적어도 하나의 IIP를 암호화하는 서열의 5' 또는 3'에 배치될 수 있다.
예를 들면, 한 구현예에서, 상기 치료 생체분자를 암호화하는 서열은 바람직하게는 상기 적어도 하나의 선천적 조절 단백질을 암호화하는 서열의 5'에 배치된다. 예를 들면, 도 1에 나타낸 saRNA 구현예 2a, 3a, 4a, 및 mRNA 구현예 6a 및 7a 참조.
그러나, 다른 구현예에서, 상기 치료 생체분자를 암호화하는 서열은 바람직하게는 상기 적어도 하나의 선천적 조절 단백질을 암호화하는 서열의 3'에 배치된다. 예를 들면, 도 1에 나타낸 saRNA 구현예 2b, 3b, 4b, 및 mRNA 구현예 6b 및 7b 참조.
바람직하게는, 제1 측면에 따른 RNA 구조체는 게놈성 또는 서브게놈성일 수 있는 적어도 하나의 프로모터(promoter)를 포함한다. 그러나, 바람직하게는 상기 프로모터는 도 1(구현예 1-4b)에 나타낸 것과 같이 서브게놈성 프로모터이다. 따라서, 바람직하게는 본 발명의 saRNA 구조체는 프로모터를 포함한다. 숙련된 기술자는 상기 서브게놈성 프로모터가 적어도 하나의 치료 생체분자 및 적어도 하나의 선천적 억제제 단백질을 암호화하는 서열에 작동가능하게 연결되어서, 상기 치료 생체분자 및 적어도 하나의 선천적 조절 단백질을 암호화하는 뉴클레오티드 서열을 전사할 수 있는 프로모터에 관한 것임을 이해할 것이다.
바람직하게는, 상기 서브게놈성 프로모터는 본 명세서에서 다음과 같은 서열번호 67로 제공되는 26S이다:
GGGCCCCTATAACTCTCTACGGCTAACCTGAATGGACTACGACAT [서열번호 67]
따라서, 바람직하게는 (바람직하게는, 서브게놈성 프로모터일 수 있는) 상기 프로모터는 실질적으로 서열번호 67에 나타낸 것, 또는 그의 변이체 또는 단편이다.
한 구현예에서, 동일한 프로모터가 관심있는 적어도 하나의 치료 생체분자를 암호화하는 서열 및 적어도 하나의 선천적 조절 단백질을 암호화하는 서열에 작동가능하게 연결된다.
상기 치료 생체분자(즉, GOI) 및 IIP가 모두 RNA의 단일 가닥에 의해 암호화되는 본 발명자들의 디자인은 유리하게는 훨씬 적은 용량의 RNA를 사용하는 것을 가능하게 하는데, 그 이유는 단백질이 상기 RNA에 의해 감지되는 동일한 세포에서 발현되고, 또한 복제될 수 있으며, 이에 따라 선천적 조절 성분이 발현 및 증폭되는 부가적인 측면을 갖기 때문이다.
따라서, 상기 RNA 구조체의 한 구현예에서, 상기 프로모터는 적어도 하나의 치료 생체분자를 암호화하는 서열 및 적어도 하나의 선천적 억제제 단백질을 암호화하는 서열의 5'에 배치되어서, 상기 프로모터는 양쪽 서열 모두에 작동가능하게 연결되고, 이로 인해 양쪽 모두의 발현을 구동한다.
그러나, 다른 구현예에서, 제1 프로모터는 관심있는 적어도 하나의 치료 생체분자를 암호화하는 서열에 작동가능하게 연결되고, 제2 프로모터는 적어도 하나의 선천적 억제제 단백질을 암호화하는 서열에 작동가능하게 연결된다. 이것은 2중 게놈 구조체로 나타낸다. 바람직하게는, 상기 제1 및/또는 제2 프로모터는 게놈성 또는 서브게놈성이다. 바람직하게는, 양쪽 프로모터는 모두 서브게놈성 프로모터, 예컨대 26S이다.
상기 RNA 구조체는 적어도 2개, 3개, 4개 또는 5개 IIP를 암호화할 수 있다. 선천적 조절 단백질을 암호화하는 서열이 1개 이상인 구현예에서, 단일 프로모터는 선천적 조절 단백질을 암호화하는 모든 서열에 작동가능하게 연결될 수 있다. 대안적으로, 프로모터는 선천적 조절 단백질을 암호화하는 각각의 서열에 연결되어서, 각각의 선천적 조절 단백질이 별도의 프로모터에 작동가능하게 연결될 수 있다. 상기 구현예에서, 별도의 프로모터는 동일한 프로모터 서열 또는 상이한 프로모터 서열을 포함할 수 있다. 다른 구현예에서, 상이한 프로모터는 선천적 조절 단백질을 암호화하는 각각의 서열에 작동가능하게 연결된다.
상기 RNA 구조체는 관심있는 적어도 하나의 치료 생체분자를 암호화하는 서열 및 적어도 하나의 선천적 조절 단백질을 암호화하는 서열 사이에 배치된 링커(linker) 서열을 추가로 포함할 수 있다. 상기 링커 서열은 단일 프로모터로부터 IIP의 생산 및 치료 분자의 생산을 가능하게 한다. 한 구현예에서, 상기 링커 서열은 번역 후에 소화되거나 절단됨으로써 숙주 세포에서 적어도 하나의 치료 생체분자 및 적어도 하나의 선천적 조절 단백질을 분리하도록 구성되는 펩티드 링커를 암호화한다. 이와 같이, 상기 링커 서열은 바람직하게는 절단 부위를 형성할 수 있는 절단가능한 펩티드, 예를 들면 2A 펩티드이다. [Furler S, Paterna J-C, Weibel M and Bueler H Recombinant AAV vectors containing the foot and mouth disease virus 2A sequence confer efficient bicistronic gene expression in cultured cells and rat substantia nigra neurons Gene Ther. 2001, vol. 8, PP: 864-873].
바람직하게는, 상기 2A 펩티드 서열을 암호화하는 링커 서열은 2개의 코딩 서열을 함께 연결한다. 이것은 상기 RNA 구조체가 다양한 벡터에서의 발현시에 일어날 수 있는 크기 제한을 극복할 수 있게 하고, 제1 측면의 RNA 구조체에 의해 암호화되는 모든 펩티드의 발현 및 번역이 단일 프로모터의 제어 하에 단일 단백질로서 일어날 수 있게 한다. 따라서, 상기 IIP, 2A 펩티드, 및 치료 생체분자의 서열을 포함하는 단일 단백질의 번역 이후에, 말단 글리신-프롤린 연결부에서 바이러스 2A 펩티드 서열의 절단이 일어나고, 이로 인해 2개의 폴리펩티드가 자유롭게 된다.
상기 2A 스페이서(spacer) 서열은 [Wang Y et al. Scientific Reports 2015, 5]에 개시된 것과 같이 E2A, F2A, P2A 및 T2A로 나타내는 서열을 포함하는 임의의 공지된 변이체일 수 있으며, 즉 적합한 2A 펩티드는 돼지 테스코바이러스(teschovirus)-1 2A(P2A) - ATNFSLLKQAGDVEENPGP(서열번호 68), 토세아 아시그나(thosea asigna) 바이러스 2A(T2A) - QCTNYALLKLAGDVESNPGP(서열번호 69), 말 비염 A 바이러스 2A(E2A), 및 구제역 바이러스 2A(F2A) - VKQTLNFDLLKLAGDVESNPGP(서열번호 70)를 포함한다. 바람직하게는, 상기 2A 펩티드는 토세아 아시그나 바이러스 2A(T2A)이다.
다른 구현예에서, 상기 절단가능한 펩티드는 자가-절단 펩티드이다. 구현예에서, 상기 링커는 바이러스 2A 펩티드 스페이서를 포함하고, 푸린(furin) 절단 부위를 추가로 포함한다. 바람직하게는, 상기 자가-절단 펩티드는 푸린/2A 펩티드이다. 상류에 푸린 절단 부위를 삽입하면, 그렇지 않을 경우 상류 단백질에 부착되어 남아있게 되는 2A 잔기의 제거를 가능하게 한다.
상기 푸린 서열은 상기 2A 서열의 3' 또는 5'에 배치될 수 있다. 그러나, 바람직하게는 상기 푸린 서열은 상기 2A 서열의 5'에 배치되고, 바람직하게는 GSG 스페이서가 상기 푸린 및 2A 서열 사이에 배치된다.
숙련된 기술자는 푸린이 특이적 인식 서열(정규적으로 R-X-R/K/X-R(서열번호 71))에서 전구체 단백질을 절단하고, 최종 R 후에 전구단백질을 절단하는 (주로 골지 및 트랜스-골지 네트워크 내의) 분비 경로에 위치하는 편재성(ubiquitous) 칼슘-의존형 전구단백질 컨버타아제(convertase)임을 인식할 것이다. 따라서, 한 구현예에서, 상기 푸린 서열은 R-X-R/K/X-R이다. 그러나, 바람직하게는 상기 푸린 서열은 최적화된 서열 RRRRRR(서열번호 72) GSG 서열이다. 바람직하게는, 상기 GSG 상기 푸린 서열의 3' 및 상기 2A 서열의 5'에 배치된다.
따라서, 바람직하게는 상기 스페이서 서열은 NCBI 참조 서열: 진뱅크: AAC97195.1에 의해 제공되고, 본 명세서에서 다음과 같은 서열번호 73으로 제공되는 푸린/T2A이다:
RRRRRRGSGEGRGSLLTCGDVEENPGP [서열번호 73]
그러므로, 바람직하게는 상기 스페이서 서열은 서열번호 73에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 포함한다.
도 1은 상기 GOI 및 IIP가 푸린-T2a 절단 부위를 암호화하는 뉴클레오티드 서열에 의해 연결되는 구현예 2a, 2b 및 6a, 6b를 보여준다. 한 구현예에서, 도 1에서 2a 또는 6a로 나타낸 것과 같이, 상기 F-T2a 절단 부위는 5' GOI 및 3' IIP를 분리시킨다. 한 구현예에서, 도 1에서 2b 또는 6b로 나타낸 것과 같이, 상기 F-T2a 절단 부위는 3' GOI 및 5' IIP를 분리시킨다.
RNA 구조체 또는 레플리콘이 선천적 조절 단백질을 암호화하는 하나 이상의 서열을 포함하는 구현예에서, 상기 구조체는 선천적 조절 단백질을 암호화하는 각각의 서열 사이, 또는 일부 IIP 사이에만 배치되는 링커 서열을 포함할 수 있다.
한 구현예에서, 상기 적어도 하나의 치료 생체분자를 암호화하는 서열 및 적어도 하나의 선천적 조절 단백질을 암호화하는 서열은, 그 서열이 무엇이든 간에(즉, 도 1에서 구현예 3a, 3b, 7a 또는 7b에 나타낸 것과 같은 GOI 또는 IIP), 종결 코돈에 의해 분리되고, 이어서 하류 서열의 번역을 시작할 수 있는 내부 리보솜 도입 부위(IRES) 서열이 뒤따를 수 있으며, 그 서열은 어느 것이나 될 수 있다. 따라서, 바람직하게는 상기 IRES 서열은 상기 적어도 하나의 치료 생체분자를 암호화하는 서열 및 상기 적어도 하나의 선천적 조절 단백질을 암호화하는 서열 사이에 배치된다. 적어도 하나의 선천적 조절 단백질을 암호화하는 서열이 다수 사용된다면, 링커 서열은 공지된 절단 서열 및/또는 IRES 서열의 조합을 포함할 수 있다. 한 구현예에서, 도 1에서 3a 또는 7a로 나타낸 것과 같이, 상기 IRES 분위는 5' GOI 및 3' IIP를 분리한다. 한 구현예에서, 도 1에서 3b 또는 7b로 나타낸 것과 같이, 상기 IRES 부위는 3' GOI 및 5' IIP를 분리한다.
구현예에서, 상기 IRES는 피코르나바이러스 IRES이다. 다른 전형적인 IRES 서열은 뇌심근염 바이러스(EMCV) 또는 혈관 내피 성장 인자 및 타입 1 콜라겐-유도성 단백질(VCIP)의 IRES 서열과 같은 것을 포함하며, 본 기술분야의 기술자에게 알려져 있다.
다른 구현예에서, 상기 IRES는 리노바이러스 IRES, A형 간염 바이러스 IRES, C형 간염 바이러스 IRES, 폴리오바이러스 IRES, 엔테로바이러스 IRES, 카디오바이러스(cardiovirus) IRES, 아프토바이러스(aphthovirus) IRES, 플라비바이러스 IRES, 페스티바이러스 IRES, 크리파바이러스(cripavirus) IRES, 로팔로시품 파디 바이러스(rhopalosiphum padi virus) IRES, 또는 임의의 적합한 IRES로부터 선택될 수 있다. 특히, 상기 IRES는 실험적으로 검증된 IRES 구조의 데이터베이스를 제공하는 "IRESite"(http://www.iresite.org/)에 의해 기술되거나, "New Messenger RNA Research Communications" (ISBN: 1-60021-488-6)에 개시된 것과 같은 임의의 IRES일 수 있다.
바람직한 구현예에서, 상기 IRES는 다음과 같은 서열번호 74에 나타낸 것과 같을 수 있는 구제역 바이러스(FMDV) IRES, 또는 그의 단편 또는 변이체이다:
AGCAGGTTTCCCCAACTGACACAAAACGTGCAACTTGAAACTCCGCCTGGTCTTTCCAGGTCTAGAGGGGTAACACTTTGTACTGCGTTTGGCTCCACGCTCGATCCACTGGCGAGTGTTAGTAACAGCACTGTTGCTTCGTAGCGGAGCATGACGGCCGTGGGAACTCCTCCTTGGTAACAAGGACCCACGGGGCCAAAAGCCACGCCCACACGGGCCCGTCATGTGTGCAACCCCAGCACGGCGACTTTACTGCGAAACCCACTTTAAAGTGACATTGAAACTGGTACCCACACACTGGTGACAGGCTAAGGATGCCCTTCAGGTACCCCGAGGTAACACGCGACACTCGGGATCTGAGAAGGGGACTGGGGCTTCTATAAAAGCGCTCGGTTTAAAAAGCTTCTATGCCTGAATAGGTGACCGGAGGTCGGCACCTTTCCTTTGCAATTACTGACCAC [서열번호 74]
다른 바람직한 구현예에서, 상기 IRES는 뇌심근염 바이러스(EMCV) IRES이다. 상기 EMCV IRES는 다음과 같은 서열번호 75에 나타낸 것, 또는 그의 단편 또는 변이체일 수 있다:
cgttactggccgaagccgcttggaataaggccggtgtgcgtttgtctatatgttattttccaccatattgccgtcttttggcaatgtgagggcccggaaacctggccctgtcttcttgacgagcattcctaggggtctttcccctctcgccaaaggaatgcaaggtctgttgaatgtcgtgaaggaagcagttcctctggaagcttcttgaagacaaacaacgtctgtagcgaccctttgcaggcagcggaaccccccacctggcgacaggtgcctctgcggccaaaagccacgtgtataagatacacctgcaaaggcggcacaaccccagtgccacgttgtgagttggatagttgtggaaagagtcaaatggctcccctcaagcgtattcaacaaggggctgaaggatgcccagaaggtaccccattgtatgggatctgatctggggcctcggtgcacatgcttttcatgtgtttagtcgaggttaaaaaacgtctaggccccccgaaccacggggacgtggttttcctttgaaaaacacgatgataata [서열번호 75]
따라서, 바람직하게는 상기 IRES는 실질적으로 서열번호 74 또는 75에 나타낸 것과 같은 뉴클레오티드 서열, 또는 그의 단편 또는 변이체를 포함한다.
대안적으로, IRES 또는 2A 링커 대신에, 상기 링커 서열은 상기 치료 생체분자 및 IIP 모두를 단일 폴리펩티드 사슬로서 발현하게 하는 유연성 링커를 암호화하는 서열을 포함할 수 있지만, 상기 치료 생체분자 및 IIP는 독립적인 단백질로서 작용한다. 그러므로, 상기 단백질들은 이들이 개별적으로 발현된 것과 동일한 방식으로 그 효과를 발휘한다.
상기 유연성 링커 서열은 WO 2013/061076 A1(Oxford Biomedica)에 개시된 것과 같을 수 있다. 상기 유연성 링커 서열은 본 명세서에서 다음과 같은 서열번호 76, 또는 그의 단편 또는 변이체로 나타낼 수 있다:
ggaggtggcgggtccgggggcgggggtagcggtggcgggggctcc [서열번호 76]
바람직하게는, 따라서, 상기 유연성 링커 서열은 실질적으로 서열번호 76에 나타낸 것과 같은 뉴클레오티드 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 바람직한 구현예에서, 상기 유연성 링커 서열은 본 명세서에서 아래에 나타낸 것과 같은 서열번호 77로 나타낸 아미노산 서열, 또는 그의 단편 또는 변이체를 암호화하는 뉴클레오티드 서열을 포함한다:
GGGGSGGGGSGGGGS [서열번호 77]
따라서, 바람직하게는 상기 유연성 링커 서열은 실질적으로 서열번호 77에 나타낸 것과 같은 아미노산 서열, 또는 그의 단편 또는 변이체를 암호화한다.
또 다른 구현예에서, 상기 적어도 하나의 치료 생체분자 및 적어도 하나의 선천적 억제제 단백질을 암호화하는 서열은 종결 코돈에 의해 분리되고, 이어서 하류 서열의 전사를 시작할 수 있는 제2 서브게놈성 프로모터 서열이 뒤따를 수 있다. 상기 구현예의 예는 도 1, 구현예 4a 및 4b에서 실증된다.
(바람직하게는 saRNA 구조체일 때) 상기 RNA 구조체는 적어도 하나의 치료 생체분자 및 적어도 하나의 선천적 조절 단백질을 암호화하는 서열의 5' 또는 3'에 배치된 적어도 하나의 비-구조 단백질(NSP)을 암호화할 수 있다. 바람직하게는, 상기 적어도 하나의 NSP를 암호화하는 서열은 치료 생체분자 및 적어도 하나의 선천적 조절 단백질을 암호화하는 서열의 5'에 배치된다. 따라서, 바람직하게는 상기 적어도 하나의 NSP를 암호화하는 서열은 상기 RNA 구조체의 5' 말단에 배치된다.
상기 RNA 구조체에 의해 암호화되는 적어도 하나의 비-구조 단백질은 RNA 폴리머라아제 NSP4일 수 있다. 상기 하나 이상의 비-구조 단백질은 바람직하게는 레플리카아제르 암호화한다. 바람직하게는, 상기 구조체는 NSP1, NSP2, NSP3 및 NSP4를 암호화한다. 숙련된 기술자는 NSP1은 바이러스 캡핑 효소 및 복제 복합체(RC)의 막 앵커(anchor)이지만, NSP2는 ns 폴리단백질 처리를 담당하는 RNA 헬리카아제 및 프로테아제임을 이해할 것이다. NSP3은 몇 가지 숙주 단백질과 상호작용하고, 단백질 폴리- 및 모노-ADP-리보실화를 조정할 수 있으며, NSP4는 코어 바이러스 RNA-의존형 RNA 폴리머라아제이다.
한 구현예에서, NSP1은 본 명세서에서 다음과 같은 서열번호 78로 제공된다:
MEKVHVDIEEDSPFLRALQRSFPQFEVEAKQVTDNDHANARAFSHLASKLIETEVDPSDTILDIGSAPARRMYSKHKYHCICPMRCAEDPDRLYKYATKLKKNCKEITDKELDKKMKELAAVMSDPDLETETMCLHDDESCRYEGQVAVYQDVYAVDGPTSLYHQANKGVRVAYWIGFDTTPFMFKNLAGAYPSYSTNWADETVLTARNIGLCSSDVMERSRRGMSILRKKYLKPSNNVLFSVGSTIYHEKRDLLRSWHLPSVFHLRGKQNYTCRCETIVSCDGYVVKRIAISPGLYGKPSGYAATMHREGFLCCKVTDTLNGERVSFPVCTYVPATLCDQMTGILATDVSADDAQKLLVGLNQRIVVNGRTQRNTNTMKNYLLPVVAQAFARWAKEYKEDQEDERPLGLRDRQLVMGCCWAFRRHKITSIYKRPDTQTIIKVNSDFHSFVLPRIGSNTLEIGLRTRIRKMLEEHKEPSPLITAEDVQEAKCAADEAKEVREAEELRAALPPLAADVEEPTLEADVDLMLQEAGA [서열번호 78]
따라서, NSP1은 바람직하게는 실질적으로 서열번호 78에 나타낸 것과 같은 아미노산 서열, 또는 그의 생물학적 활성 변이체 또는 단편을 포함한다.
한 구현예에서, NSP1은 다음과 같은 서열번호 79에 정의된 것과 같은 뉴클레오티드 서열에 의해 암호화된다:
ATGGAGAAAGTTCACGTTGACATCGAGGAAGACAGCCCATTCCTCAGAGCTTTGCAGCGGAGCTTCCCGCAGTTTGAGGTAGAAGCCAAGCAGGTCACTGATAATGACCATGCTAATGCCAGAGCGTTTTCGCATCTGGCTTCAAAACTGATCGAAACGGAGGTGGACCCATCCGACACGATCCTTGACATTGGAAGTGCGCCCGCCCGCAGAATGTATTCTAAGCACAAGTATCATTGTATCTGTCCGATGAGATGTGCGGAAGATCCGGACAGATTGTATAAGTATGCAACTAAGCTGAAGAAAAACTGTAAGGAAATAACTGATAAGGAATTGGACAAGAAAATGAAGGAGCTGGCCGCCGTCATGAGCGACCCTGACCTGGAAACTGAGACTATGTGCCTCCACGACGACGAGTCGTGTCGCTACGAAGGGCAAGTCGCTGTTTACCAGGATGTATACGCGGTTGACGGACCGACAAGTCTCTATCACCAAGCCAATAAGGGAGTTAGAGTCGCCTACTGGATAGGCTTTGACACCACCCCTTTTATGTTTAAGAACTTGGCTGGAGCATATCCATCATACTCTACCAACTGGGCCGACGAAACCGTGTTAACGGCTCGTAACATAGGCCTATGCAGCTCTGACGTTATGGAGCGGTCACGTAGAGGGATGTCCATTCTTAGAAAGAAGTATTTGAAACCATCCAACAATGTTCTATTCTCTGTTGGCTCGACCATCTACCACGAGAAGAGGGACTTACTGAGGAGCTGGCACCTGCCGTCTGTATTTCACTTACGTGGCAAGCAAAATTACACATGTCGGTGTGAGACTATAGTTAGTTGCGACGGGTACGTCGTTAAAAGAATAGCTATCAGTCCAGGCCTGTATGGGAAGCCTTCAGGCTATGCTGCTACGATGCACCGCGAGGGATTCTTGTGCTGCAAAGTGACAGACACATTGAACGGGGAGAGGGTCTCTTTTCCCGTGTGCACGTATGTGCCAGCTACATTGTGTGACCAAATGACTGGCATACTGGCAACAGATGTCAGTGCGGACGACGCGCAAAAACTGCTGGTTGGGCTCAACCAGCGTATAGTCGTCAACGGTCGCACCCAGAGAAACACCAATACCATGAAAAATTACCTTTTGCCCGTAGTGGCCCAGGCATTTGCTAGGTGGGCAAAGGAATATAAGGAAGATCAAGAAGATGAAAGGCCACTAGGACTACGAGATAGACAGTTAGTCATGGGGTGTTGTTGGGCTTTTAGAAGGCACAAGATAACATCTATTTATAAGCGCCCGGATACCCAAACCATCATCAAAGTGAACAGCGATTTCCACTCATTCGTGCTGCCCAGGATAGGCAGTAACACATTGGAGATCGGGCTGAGAACAAGAATCAGGAAAATGTTAGAGGAGCACAAGGAGCCGTCACCTCTCATTACCGCCGAGGACGTACAAGAAGCTAAGTGCGCAGCCGATGAGGCTAAGGAGGTGCGTGAAGCCGAGGAGTTGCGCGCAGCTCTACCACCTTTGGCAGCTGATGTTGAGGAGCCCACTCTGGAAGCCGATGTCGACTTGATGTTACAAGAGGCTGGGGCC [서열번호 79]
따라서, NSP1은 바람직하게는 실질적으로 서열번호 79에 나타낸 것과 같은 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 80으로 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
AUGGAGAAAGUUCACGUUGACAUCGAGGAAGACAGCCCAUUCCUCAGAGCUUUGCAGCGGAGCUUCCCGCAGUUUGAGGUAGAAGCCAAGCAGGUCACUGAUAAUGACCAUGCUAAUGCCAGAGCGUUUUCGCAUCUGGCUUCAAAACUGAUCGAAACGGAGGUGGACCCAUCCGACACGAUCCUUGACAUUGGAAGUGCGCCCGCCCGCAGAAUGUAUUCUAAGCACAAGUAUCAUUGUAUCUGUCCGAUGAGAUGUGCGGAAGAUCCGGACAGAUUGUAUAAGUAUGCAACUAAGCUGAAGAAAAACUGUAAGGAAAUAACUGAUAAGGAAUUGGACAAGAAAAUGAAGGAGCUGGCCGCCGUCAUGAGCGACCCUGACCUGGAAACUGAGACUAUGUGCCUCCACGACGACGAGUCGUGUCGCUACGAAGGGCAAGUCGCUGUUUACCAGGAUGUAUACGCGGUUGACGGACCGACAAGUCUCUAUCACCAAGCCAAUAAGGGAGUUAGAGUCGCCUACUGGAUAGGCUUUGACACCACCCCUUUUAUGUUUAAGAACUUGGCUGGAGCAUAUCCAUCAUACUCUACCAACUGGGCCGACGAAACCGUGUUAACGGCUCGUAACAUAGGCCUAUGCAGCUCUGACGUUAUGGAGCGGUCACGUAGAGGGAUGUCCAUUCUUAGAAAGAAGUAUUUGAAACCAUCCAACAAUGUUCUAUUCUCUGUUGGCUCGACCAUCUACCACGAGAAGAGGGACUUACUGAGGAGCUGGCACCUGCCGUCUGUAUUUCACUUACGUGGCAAGCAAAAUUACACAUGUCGGUGUGAGACUAUAGUUAGUUGCGACGGGUACGUCGUUAAAAGAAUAGCUAUCAGUCCAGGCCUGUAUGGGAAGCCUUCAGGCUAUGCUGCUACGAUGCACCGCGAGGGAUUCUUGUGCUGCAAAGUGACAGACACAUUGAACGGGGAGAGGGUCUCUUUUCCCGUGUGCACGUAUGUGCCAGCUACAUUGUGUGACCAAAUGACUGGCAUACUGGCAACAGAUGUCAGUGCGGACGACGCGCAAAAACUGCUGGUUGGGCUCAACCAGCGUAUAGUCGUCAACGGUCGCACCCAGAGAAACACCAAUACCAUGAAAAAUUACCUUUUGCCCGUAGUGGCCCAGGCAUUUGCUAGGUGGGCAAAGGAAUAUAAGGAAGAUCAAGAAGAUGAAAGGCCACUAGGACUACGAGAUAGACAGUUAGUCAUGGGGUGUUGUUGGGCUUUUAGAAGGCACAAGAUAACAUCUAUUUAUAAGCGCCCGGAUACCCAAACCAUCAUCAAAGUGAACAGCGAUUUCCACUCAUUCGUGCUGCCCAGGAUAGGCAGUAACACAUUGGAGAUCGGGCUGAGAACAAGAAUCAGGAAAAUGUUAGAGGAGCACAAGGAGCCGUCACCUCUCAUUACCGCCGAGGACGUACAAGAAGCUAAGUGCGCAGCCGAUGAGGCUAAGGAGGUGCGUGAAGCCGAGGAGUUGCGCGCAGCUCUACCACCUUUGGCAGCUGAUGUUGAGGAGCCCACUCUGGAAGCCGAUGUCGACUUGAUGUUACAAGAGGCUGGGGCC [서열번호 80]
한 구현예에서, NSP2는 본 명세서에서 다음과 같은 서열번호 81로 제공된다:
GSVETPRGLIKVTSYDGEDKIGSYAVLSPQAVLKSEKLSCIHPLAEQVIVITHSGRKGRYAVEPYHGKVVVPEGHAIPVQDFQALSESATIVYNEREFVNRYLHHIATHGGALNTDEEYYKTVKPSEHDGEYLYDIDRKQCVKKELVTGLGLTGELVDPPFHEFAYESLRTRPAAPYQVPTIGVYGVPGSGKSGIIKSAVTKKDLVVSAKKENCAEIIRDVKKMKGLDVNARTVDSVLLNGCKHPVETLYIDEAFACHAGTLRALIAIIRPKKAVLCGDPKQCGFFNMMCLKVHFNHEICTQVFHKSISRRCTKSVTSVVSTLFYDKKMRTTNPKETKIVIDTTGSTKPKQDDLILTCFRGWVKQLQIDYKGNEIMTAAASQGLTRKGVYAVRYKVNENPLYAPTSEHVNVLLTRTEDRIVWKTLAGDPWIKTLTAKYPGNFTATIEEWQAEHDAIMRHILERPDPTDVFQNKANVCWAKALVPVLKTAGIDMTTEQWNTVDYFETDKAHSAEIVLNQLCVRFFGLDLDSGLFSAPTVPLSIRNNHWDNSPSPNMYGLNKEVVRQLSRRYPQLPRAVATGRVYDMNTGTLRNYDPRINLVPVNRRLPHALVLHHNEHPQSDFSSFVSKLKGRTVLVVGEKLSVPGKMVDWLSDRPEATFRARLDLGIPGDVPKYDIIFVNVRTPYKYHHYQQCEDHAIKLSMLTKKACLHLNPGGTCVSIGYGYADRASESIIGAIARQFKFSRVCKPKSSLEETEVLFVFIGYDRKARTHNSYKLSSTLTNIYTGSRLHEAGC [서열번호 81]
따라서, NSP2는 바람직하게는 실질적으로 서열번호 81에 나타낸 것과 같은 아미노산 서열, 또는 그의 생물학적 활성 변이체 또는 단편을 포함한다.
한 구현예에서, NSP2는 다음과 같은 서열번호 82에 정의된 것과 같은 뉴클레오티드 서열에 의해 암호화된다:
GGCTCAGTGGAGACACCTCGTGGCTTGATAAAGGTTACCAGCTACGATGGCGAGGACAAGATCGGCTCTTACGCTGTGCTTTCTCCGCAGGCTGTACTCAAGAGTGAAAAATTATCTTGCATCCACCCTCTCGCTGAACAAGTCATAGTGATAACACACTCTGGCCGAAAAGGGCGTTATGCCGTGGAACCATACCATGGTAAAGTAGTGGTGCCAGAGGGACATGCAATACCCGTCCAGGACTTTCAAGCTCTGAGTGAAAGTGCCACCATTGTGTACAACGAACGTGAGTTCGTAAACAGGTACCTGCACCATATTGCCACACATGGAGGAGCGCTGAACACTGATGAAGAATATTACAAAACTGTCAAGCCCAGCGAGCACGACGGCGAATACCTGTACGACATCGACAGGAAACAGTGCGTCAAGAAAGAACTAGTCACTGGGCTAGGGCTCACAGGCGAGCTGGTGGATCCTCCCTTCCATGAATTCGCCTACGAGAGTCTGAGAACACGACCAGCCGCTCCTTACCAAGTACCAACCATAGGGGTGTATGGCGTGCCAGGATCAGGCAAGTCTGGCATCATTAAAAGCGCAGTCACCAAAAAAGATCTAGTGGTGAGCGCCAAGAAAGAAAACTGTGCAGAAATTATAAGGGACGTCAAGAAAATGAAAGGGCTGGACGTCAATGCCAGAACTGTGGACTCAGTGCTCTTGAATGGATGCAAACACCCCGTAGAGACCCTGTATATTGACGAAGCTTTTGCTTGTCATGCAGGTACTCTCAGAGCGCTCATAGCCATTATAAGACCTAAAAAGGCAGTGCTCTGCGGGGATCCCAAACAGTGCGGTTTTTTTAACATGATGTGCCTGAAAGTGCATTTTAACCACGAGATTTGCACACAAGTCTTCCACAAAAGCATCTCTCGCCGTTGCACTAAATCTGTGACTTCGGTCGTCTCAACCTTGTTTTACGACAAAAAAATGAGAACGACGAATCCGAAAGAGACTAAGATTGTGATTGACACTACCGGCAGTACCAAACCTAAGCAGGACGATCTCATTCTCACTTGTTTCAGAGGGTGGGTGAAGCAGTTGCAAATAGATTACAAAGGCAACGAAATAATGACGGCAGCTGCCTCTCAAGGGCTGACCCGTAAAGGTGTGTATGCCGTTCGGTACAAGGTGAATGAAAATCCTCTGTACGCACCCACCTCAGAACATGTGAACGTCCTACTGACCCGCACGGAGGACCGCATCGTGTGGAAAACACTAGCCGGCGACCCATGGATAAAAACACTGACTGCCAAGTACCCTGGGAATTTCACTGCCACGATAGAGGAGTGGCAAGCAGAGCATGATGCCATCATGAGGCACATCTTGGAGAGACCGGACCCTACCGACGTCTTCCAGAATAAGGCAAACGTGTGTTGGGCCAAGGCTTTAGTGCCGGTGCTGAAGACCGCTGGCATAGACATGACCACTGAACAATGGAACACTGTGGATTATTTTGAAACGGACAAAGCTCACTCAGCAGAGATAGTATTGAACCAACTATGCGTGAGGTTCTTTGGACTCGATCTGGACTCCGGTCTATTTTCTGCACCCACTGTTCCGTTATCCATTAGGAATAATCACTGGGATAACTCCCCGTCGCCTAACATGTACGGGCTGAATAAAGAAGTGGTCCGTCAGCTCTCTCGCAGGTACCCACAACTGCCTCGGGCAGTTGCCACTGGAAGAGTCTATGACATGAACACTGGTACACTGCGCAATTATGATCCGCGCATAAACCTAGTACCTGTAAACAGAAGACTGCCTCATGCTTTAGTCCTCCACCATAATGAACACCCACAGAGTGACTTTTCTTCATTCGTCAGCAAATTGAAGGGCAGAACTGTCCTGGTGGTCGGGGAAAAGTTGTCCGTCCCAGGCAAAATGGTTGACTGGTTGTCAGACCGGCCTGAGGCTACCTTCAGAGCTCGGCTGGATTTAGGCATCCCAGGTGATGTGCCCAAATATGACATAATATTTGTTAATGTGAGGACCCCATATAAATACCATCACTATCAGCAGTGTGAAGACCATGCCATTAAGCTTAGCATGTTGACCAAGAAAGCTTGTCTGCATCTGAATCCCGGCGGAACCTGTGTCAGCATAGGTTATGGTTACGCTGACAGGGCCAGCGAAAGCATCATTGGTGCTATAGCGCGGCAGTTCAAGTTTTCCCGGGTATGCAAACCGAAATCCTCACTTGAAGAGACGGAAGTTCTGTTTGTATTCATTGGGTACGATCGCAAGGCCCGTACGCACAATTCTTACAAGCTTTCATCAACCTTGACCAACATTTATACAGGTTCCAGACTCCACGAAGCCGGATGT [서열번호 82]
따라서, 바람직하게는 NSP2는 실질적으로 서열번호 82에 나타낸 것과 같은 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 상기 RNA 구조체는 다음과 같은 서열번호 83을 포함할 수 있다:
GGCUCAGUGGAGACACCUCGUGGCUUGAUAAAGGUUACCAGCUACGAUGGCGAGGACAAGAUCGGCUCUUACGCUGUGCUUUCUCCGCAGGCUGUACUCAAGAGUGAAAAAUUAUCUUGCAUCCACCCUCUCGCUGAACAAGUCAUAGUGAUAACACACUCUGGCCGAAAAGGGCGUUAUGCCGUGGAACCAUACCAUGGUAAAGUAGUGGUGCCAGAGGGACAUGCAAUACCCGUCCAGGACUUUCAAGCUCUGAGUGAAAGUGCCACCAUUGUGUACAACGAACGUGAGUUCGUAAACAGGUACCUGCACCAUAUUGCCACACAUGGAGGAGCGCUGAACACUGAUGAAGAAUAUUACAAAACUGUCAAGCCCAGCGAGCACGACGGCGAAUACCUGUACGACAUCGACAGGAAACAGUGCGUCAAGAAAGAACUAGUCACUGGGCUAGGGCUCACAGGCGAGCUGGUGGAUCCUCCCUUCCAUGAAUUCGCCUACGAGAGUCUGAGAACACGACCAGCCGCUCCUUACCAAGUACCAACCAUAGGGGUGUAUGGCGUGCCAGGAUCAGGCAAGUCUGGCAUCAUUAAAAGCGCAGUCACCAAAAAAGAUCUAGUGGUGAGCGCCAAGAAAGAAAACUGUGCAGAAAUUAUAAGGGACGUCAAGAAAAUGAAAGGGCUGGACGUCAAUGCCAGAACUGUGGACUCAGUGCUCUUGAAUGGAUGCAAACACCCCGUAGAGACCCUGUAUAUUGACGAAGCUUUUGCUUGUCAUGCAGGUACUCUCAGAGCGCUCAUAGCCAUUAUAAGACCUAAAAAGGCAGUGCUCUGCGGGGAUCCCAAACAGUGCGGUUUUUUUAACAUGAUGUGCCUGAAAGUGCAUUUUAACCACGAGAUUUGCACACAAGUCUUCCACAAAAGCAUCUCUCGCCGUUGCACUAAAUCUGUGACUUCGGUCGUCUCAACCUUGUUUUACGACAAAAAAAUGAGAACGACGAAUCCGAAAGAGACUAAGAUUGUGAUUGACACUACCGGCAGUACCAAACCUAAGCAGGACGAUCUCAUUCUCACUUGUUUCAGAGGGUGGGUGAAGCAGUUGCAAAUAGAUUACAAAGGCAACGAAAUAAUGACGGCAGCUGCCUCUCAAGGGCUGACCCGUAAAGGUGUGUAUGCCGUUCGGUACAAGGUGAAUGAAAAUCCUCUGUACGCACCCACCUCAGAACAUGUGAACGUCCUACUGACCCGCACGGAGGACCGCAUCGUGUGGAAAACACUAGCCGGCGACCCAUGGAUAAAAACACUGACUGCCAAGUACCCUGGGAAUUUCACUGCCACGAUAGAGGAGUGGCAAGCAGAGCAUGAUGCCAUCAUGAGGCACAUCUUGGAGAGACCGGACCCUACCGACGUCUUCCAGAAUAAGGCAAACGUGUGUUGGGCCAAGGCUUUAGUGCCGGUGCUGAAGACCGCUGGCAUAGACAUGACCACUGAACAAUGGAACACUGUGGAUUAUUUUGAAACGGACAAAGCUCACUCAGCAGAGAUAGUAUUGAACCAACUAUGCGUGAGGUUCUUUGGACUCGAUCUGGACUCCGGUCUAUUUUCUGCACCCACUGUUCCGUUAUCCAUUAGGAAUAAUCACUGGGAUAACUCCCCGUCGCCUAACAUGUACGGGCUGAAUAAAGAAGUGGUCCGUCAGCUCUCUCGCAGGUACCCACAACUGCCUCGGGCAGUUGCCACUGGAAGAGUCUAUGACAUGAACACUGGUACACUGCGCAAUUAUGAUCCGCGCAUAAACCUAGUACCUGUAAACAGAAGACUGCCUCAUGCUUUAGUCCUCCACCAUAAUGAACACCCACAGAGUGACUUUUCUUCAUUCGUCAGCAAAUUGAAGGGCAGAACUGUCCUGGUGGUCGGGGAAAAGUUGUCCGUCCCAGGCAAAAUGGUUGACUGGUUGUCAGACCGGCCUGAGGCUACCUUCAGAGCUCGGCUGGAUUUAGGCAUCCCAGGUGAUGUGCCCAAAUAUGACAUAAUAUUUGUUAAUGUGAGGACCCCAUAUAAAUACCAUCACUAUCAGCAGUGUGAAGACCAUGCCAUUAAGCUUAGCAUGUUGACCAAGAAAGCUUGUCUGCAUCUGAAUCCCGGCGGAACCUGUGUCAGCAUAGGUUAUGGUUACGCUGACAGGGCCAGCGAAAGCAUCAUUGGUGCUAUAGCGCGGCAGUUCAAGUUUUCCCGGGUAUGCAAACCGAAAUCCUCACUUGAAGAGACGGAAGUUCUGUUUGUAUUCAUUGGGUACGAUCGCAAGGCCCGUACGCACAAUUCUUACAAGCUUUCAUCAACCUUGACCAACAUUUAUACAGGUUCCAGACUCCACGAAGCCGGAUGU [서열번호 83]
따라서, 그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 83으로 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
한 구현예에서, NSP3은 본 명세서에서 다음과 같은 서열번호 84로 제공된다:
APSYHVVRGDIATATEGVIINAANSKGQPGGGVCGALYKKFPESFDLQPIEVGKARLVKGAAKHIIHAVGPNFNKVSEVEGDKQLAEAYESIAKIVNDNNYKSVAIPLLSTGIFSGNKDRLTQSLNHLLTALDTTDADVAIYCRDKKWEMTLKEAVARREAVEEICISDDSSVTEPDAELVRVHPKSSLAGRKGYSTSDGKTFSYLEGTKFHQAAKDIAEINAMWPVATEANEQVCMYILGESMSSIRSKCPVEESEASTPPSTLPCLCIHAMTPERVQRLKASRPEQITVCSSFPLPKYRITGVQKIQCSQPILFSPKVPAYIHPRKYLVETPPVDETPEPSAENQSTEGTPEQPPLITEDETRTRTPEPIIIEEEEEDSISLLSDGPTHQVLQVEADIHGPPSVSSSSWSIPHASDFDVDSLSILDTLEGASVTSGATSAETNSYFAKSMEFLARPVPAPRTVFRNPPHPAPRTRTPSLAPSRACSRTSLVSTPPGVNRVITREELEALTPSRTPSRSVSRTSLVSNPPGVNRVITREEFEAFVAQQQRFDAGA [서열번호 84]
따라서, 바람직하게는 NSP3은 실질적으로 서열번호 84에 나타낸 것과 같은 아미노산 서열, 또는 그의 생물학적 활성 변이체 또는 단편을 포함한다.
한 구현예에서, NSP3은 다음과 같은 서열번호 85에 정의된 것과 같은 뉴클레오티드 서열에 의해 암호화된다:
GCACCCTCATATCATGTGGTGCGAGGGGATATTGCCACGGCCACCGAAGGAGTGATTATAAATGCTGCTAACAGCAAAGGACAACCTGGCGGAGGGGTGTGCGGAGCGCTGTATAAGAAATTCCCGGAAAGCTTCGATTTACAGCCGATCGAAGTAGGAAAAGCGCGACTGGTCAAAGGTGCAGCTAAACATATCATTCATGCCGTAGGACCAAACTTCAACAAAGTTTCGGAGGTTGAAGGTGACAAACAGTTGGCAGAGGCTTATGAGTCCATCGCTAAGATTGTCAACGATAACAATTACAAGTCAGTAGCGATTCCACTGTTGTCCACCGGCATCTTTTCCGGGAACAAAGATCGACTAACCCAATCATTGAACCATTTGCTGACAGCTTTAGACACCACTGATGCAGATGTAGCCATATACTGCAGGGACAAGAAATGGGAAATGACTCTCAAGGAAGCAGTGGCTAGGAGAGAAGCAGTGGAGGAGATATGCATATCCGACGACTCTTCAGTGACAGAACCTGATGCAGAGCTGGTGAGGGTGCATCCGAAGAGTTCTTTGGCTGGAAGGAAGGGCTACAGCACAAGCGATGGCAAAACTTTCTCATATTTGGAAGGGACCAAGTTTCACCAGGCGGCCAAGGATATAGCAGAAATTAATGCCATGTGGCCCGTTGCAACGGAGGCCAATGAGCAGGTATGCATGTATATCCTCGGAGAAAGCATGAGCAGTATTAGGTCGAAATGCCCCGTCGAAGAGTCGGAAGCCTCCACACCACCTAGCACGCTGCCTTGCTTGTGCATCCATGCCATGACTCCAGAAAGAGTACAGCGCCTAAAAGCCTCACGTCCAGAACAAATTACTGTGTGCTCATCCTTTCCATTGCCGAAGTATAGAATCACTGGTGTGCAGAAGATCCAATGCTCCCAGCCTATATTGTTCTCACCGAAAGTGCCTGCGTATATTCATCCAAGGAAGTATCTCGTGGAAACACCACCGGTAGACGAGACTCCGGAGCCATCGGCAGAGAACCAATCCACAGAGGGGACACCTGAACAACCACCACTTATAACCGAGGATGAGACCAGGACTAGAACGCCTGAGCCGATCATCATCGAAGAGGAAGAAGAGGATAGCATAAGTTTGCTGTCAGATGGCCCGACCCACCAGGTGCTGCAAGTCGAGGCAGACATTCACGGGCCGCCCTCTGTATCTAGCTCATCCTGGTCCATTCCTCATGCATCCGACTTTGATGTGGACAGTTTATCCATACTTGACACCCTGGAGGGAGCTAGCGTGACCAGCGGGGCAACGTCAGCCGAGACTAACTCTTACTTCGCAAAGAGTATGGAGTTTCTGGCGCGACCGGTGCCTGCGCCTCGAACAGTATTCAGGAACCCTCCACATCCCGCTCCGCGCACAAGAACACCGTCACTTGCACCCAGCAGGGCCTGCTCGAGAACCAGCCTAGTTTCCACCCCGCCAGGCGTGAATAGGGTGATCACTAGAGAGGAGCTCGAGGCGCTTACCCCGTCACGCACTCCTAGCAGGTCGGTCTCGAGAACCAGCCTGGTCTCCAACCCGCCAGGCGTAAATAGGGTGATTACAAGAGAGGAGTTTGAGGCGTTCGTAGCACAACAACAATGACGGTTTGATGCGGGTGCA [서열번호 85]
따라서, 바람직하게는 NSP3은 실질적으로 서열번호 85에 나타낸 것과 같은 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 상기 RNA 구조체는 다음과 같은 서열번호 86을 포함할 수 있다:
GCACCCUCAUAUCAUGUGGUGCGAGGGGAUAUUGCCACGGCCACCGAAGGAGUGAUUAUAAAUGCUGCUAACAGCAAAGGACAACCUGGCGGAGGGGUGUGCGGAGCGCUGUAUAAGAAAUUCCCGGAAAGCUUCGAUUUACAGCCGAUCGAAGUAGGAAAAGCGCGACUGGUCAAAGGUGCAGCUAAACAUAUCAUUCAUGCCGUAGGACCAAACUUCAACAAAGUUUCGGAGGUUGAAGGUGACAAACAGUUGGCAGAGGCUUAUGAGUCCAUCGCUAAGAUUGUCAACGAUAACAAUUACAAGUCAGUAGCGAUUCCACUGUUGUCCACCGGCAUCUUUUCCGGGAACAAAGAUCGACUAACCCAAUCAUUGAACCAUUUGCUGACAGCUUUAGACACCACUGAUGCAGAUGUAGCCAUAUACUGCAGGGACAAGAAAUGGGAAAUGACUCUCAAGGAAGCAGUGGCUAGGAGAGAAGCAGUGGAGGAGAUAUGCAUAUCCGACGACUCUUCAGUGACAGAACCUGAUGCAGAGCUGGUGAGGGUGCAUCCGAAGAGUUCUUUGGCUGGAAGGAAGGGCUACAGCACAAGCGAUGGCAAAACUUUCUCAUAUUUGGAAGGGACCAAGUUUCACCAGGCGGCCAAGGAUAUAGCAGAAAUUAAUGCCAUGUGGCCCGUUGCAACGGAGGCCAAUGAGCAGGUAUGCAUGUAUAUCCUCGGAGAAAGCAUGAGCAGUAUUAGGUCGAAAUGCCCCGUCGAAGAGUCGGAAGCCUCCACACCACCUAGCACGCUGCCUUGCUUGUGCAUCCAUGCCAUGACUCCAGAAAGAGUACAGCGCCUAAAAGCCUCACGUCCAGAACAAAUUACUGUGUGCUCAUCCUUUCCAUUGCCGAAGUAUAGAAUCACUGGUGUGCAGAAGAUCCAAUGCUCCCAGCCUAUAUUGUUCUCACCGAAAGUGCCUGCGUAUAUUCAUCCAAGGAAGUAUCUCGUGGAAACACCACCGGUAGACGAGACUCCGGAGCCAUCGGCAGAGAACCAAUCCACAGAGGGGACACCUGAACAACCACCACUUAUAACCGAGGAUGAGACCAGGACUAGAACGCCUGAGCCGAUCAUCAUCGAAGAGGAAGAAGAGGAUAGCAUAAGUUUGCUGUCAGAUGGCCCGACCCACCAGGUGCUGCAAGUCGAGGCAGACAUUCACGGGCCGCCCUCUGUAUCUAGCUCAUCCUGGUCCAUUCCUCAUGCAUCCGACUUUGAUGUGGACAGUUUAUCCAUACUUGACACCCUGGAGGGAGCUAGCGUGACCAGCGGGGCAACGUCAGCCGAGACUAACUCUUACUUCGCAAAGAGUAUGGAGUUUCUGGCGCGACCGGUGCCUGCGCCUCGAACAGUAUUCAGGAACCCUCCACAUCCCGCUCCGCGCACAAGAACACCGUCACUUGCACCCAGCAGGGCCUGCUCGAGAACCAGCCUAGUUUCCACCCCGCCAGGCGUGAAUAGGGUGAUCACUAGAGAGGAGCUCGAGGCGCUUACCCCGUCACGCACUCCUAGCAGGUCGGUCUCGAGAACCAGCCUGGUCUCCAACCCGCCAGGCGUAAAUAGGGUGAUUACAAGAGAGGAGUUUGAGGCGUUCGUAGCACAACAACAAUGACGGUUUGAUGCGGGUGCA [서열번호 86]
따라서, 그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 86으로 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
한 구현예에서, NSP4는 본 명세서에서 다음과 같은 서열번호 87로 제공된다:
YIFSSDTGQGHLQQKSVRQTVLSEVVLERTELEISYAPRLDQEKEELLRKKLQLNPTPANRSRYQSRKVENMKAITARRILQGLGHYLKAEGKVECYRTLHPVPLYSSSVNRAFSSPKVAVEACNAMLKENFPTVASYCIIPEYDAYLDMVDGASCCLDTASFCPAKLRSFPKKHSYLEPTIRSAVPSAIQNTLQNVLAAATKRNCNVTQMRELPVLDSAAFNVECFKKYACNNEYWETFKENPIRLTEENVVNYITKLKGPKAAALFAKTHNLNMLQDIPMDRFVMDLKRDVKVTPGTKHTEERPKVQVIQAADPLATAYLCGIHRELVRRLNAVLLPNIHTLFDMSAEDFDAIIAEHFQPGDCVLETDIASFDKSEDDAMALTALMILEDLGVDAELLTLIEAAFGEISSIHLPTKTKFKFGAMMKSGMFLTLFVNTVINIVIASRVLRERLTGSPCAAFIGDDNIVKGVKSDKLMADRCATWLNMEVKIIDAVVGEKAPYFCGGFILCDSVTGTACRVADPLKRLFKLGKPLAADDEHDDDRRRALHEESTRWNRVGILSELCKAVESRYETVGTSIIVMAMTTLASSVKSFSYLRGAPITLYG [서열번호 87]
따라서, 바람직하게는 NSP4는 실질적으로 서열번호 87에 나타낸 것과 같은 아미노산 서열, 또는 그의 생물학적 활성 변이체 또는 단편을 포함한다.
한 구현예에서, NSP4는 다음과 같은 서열번호 88에 정의된 것과 같은 뉴클레오티드 서열에 의해 암호화된다:
TACATCTTTTCCTCCGACACCGGTCAAGGGCATTTACAACAAAAATCAGTAAGGCAAACGGTGCTATCCGAAGTGGTGTTGGAGAGGACCGAATTGGAGATTTCGTATGCCCCGCGCCTCGACCAAGAAAAAGAAGAATTACTACGCAAGAAATTACAGTTAAATCCCACACCTGCTAACAGAAGCAGATACCAGTCCAGGAAGGTGGAGAACATGAAAGCCATAACAGCTAGACGTATTCTGCAAGGCCTAGGGCATTATTTGAAGGCAGAAGGAAAAGTGGAGTGCTACCGAACCCTGCATCCTGTTCCTTTGTATTCATCTAGTGTGAACCGTGCCTTTTCAAGCCCCAAGGTCGCAGTGGAAGCCTGTAACGCCATGTTGAAAGAGAACTTTCCGACTGTGGCTTCTTACTGTATTATTCCAGAGTACGATGCCTATTTGGACATGGTTGACGGAGCTTCATGCTGCTTAGACACTGCCAGTTTTTGCCCTGCAAAGCTGCGCAGCTTTCCAAAGAAACACTCCTATTTGGAACCCACAATACGATCGGCAGTGCCTTCAGCGATCCAGAACACGCTCCAGAACGTCCTGGCAGCTGCCACAAAAAGAAATTGCAATGTCACGCAAATGAGAGAATTGCCCGTATTGGATTCGGCGGCCTTTAATGTGGAATGCTTCAAGAAATATGCGTGTAATAATGAATATTGGGAAACGTTTAAAGAAAACCCCATCAGGCTTACTGAAGAAAACGTGGTAAATTACATTACCAAATTAAAAGGACCAAAAGCTGCTGCTCTTTTTGCGAAGACACATAATTTGAATATGTTGCAGGACATACCAATGGACAGGTTTGTAATGGACTTAAAGAGAGACGTGAAAGTGACTCCAGGAACAAAACATACTGAAGAACGGCCCAAGGTACAGGTGATCCAGGCTGCCGATCCGCTAGCAACAGCGTATCTGTGCGGAATCCACCGAGAGCTGGTTAGGAGATTAAATGCGGTCCTGCTTCCGAACATTCATACACTGTTTGATATGTCGGCTGAAGACTTTGACGCTATTATAGCCGAGCACTTCCAGCCTGGGGATTGTGTTCTGGAAACTGACATCGCGTCGTTTGATAAAAGTGAGGACGACGCCATGGCTCTGACCGCGTTAATGATTCTGGAAGACTTAGGTGTGGACGCAGAGCTGTTGACGCTGATTGAGGCGGCTTTCGGCGAAATTTCATCAATACATTTGCCCACTAAAACTAAATTTAAATTCGGAGCCATGATGAAATCTGGAATGTTCCTCACACTGTTTGTGAACACAGTCATTAACATTGTAATCGCAAGCAGAGTGTTGAGAGAACGGCTAACCGGATCACCATGTGCAGCATTCATTGGAGATGACAATATCGTGAAAGGAGTCAAATCGGACAAATTAATGGCAGACAGGTGCGCCACCTGGTTGAATATGGAAGTCAAGATTATAGATGCTGTGGTGGGCGAGAAAGCGCCTTATTTCTGTGGAGGGTTTATTTTGTGTGACTCCGTGACCGGCACAGCGTGCCGTGTGGCAGACCCCCTAAAAAGGCTGTTTAAGCTTGGCAAACCTCTGGCAGCAGACGATGAACATGATGATGACAGGAGAAGGGCATTGCATGAAGAGTCAACACGCTGGAACCGAGTGGGTATTCTTTCAGAGCTGTGCAAGGCAGTAGAATCAAGGTATGAAACCGTAGGAACTTCCATCATAGTTATGGCCATGACTACTCTAGCTAGCAGTGTTAAATCATTCAGCTACCTGAGAGGGGCCCCTATAACTCTCTACGGC [서열번호 88]
따라서, 바람직하게는 NSP4는 실질적으로 서열번호 88에 나타낸 것과 같은 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 상기 RNA 구조체는 다음과 같은 서열번호 89를 포함할 수 있다:
UACAUCUUUUCCUCCGACACCGGUCAAGGGCAUUUACAACAAAAAUCAGUAAGGCAAACGGUGCUAUCCGAAGUGGUGUUGGAGAGGACCGAAUUGGAGAUUUCGUAUGCCCCGCGCCUCGACCAAGAAAAAGAAGAAUUACUACGCAAGAAAUUACAGUUAAAUCCCACACCUGCUAACAGAAGCAGAUACCAGUCCAGGAAGGUGGAGAACAUGAAAGCCAUAACAGCUAGACGUAUUCUGCAAGGCCUAGGGCAUUAUUUGAAGGCAGAAGGAAAAGUGGAGUGCUACCGAACCCUGCAUCCUGUUCCUUUGUAUUCAUCUAGUGUGAACCGUGCCUUUUCAAGCCCCAAGGUCGCAGUGGAAGCCUGUAACGCCAUGUUGAAAGAGAACUUUCCGACUGUGGCUUCUUACUGUAUUAUUCCAGAGUACGAUGCCUAUUUGGACAUGGUUGACGGAGCUUCAUGCUGCUUAGACACUGCCAGUUUUUGCCCUGCAAAGCUGCGCAGCUUUCCAAAGAAACACUCCUAUUUGGAACCCACAAUACGAUCGGCAGUGCCUUCAGCGAUCCAGAACACGCUCCAGAACGUCCUGGCAGCUGCCACAAAAAGAAAUUGCAAUGUCACGCAAAUGAGAGAAUUGCCCGUAUUGGAUUCGGCGGCCUUUAAUGUGGAAUGCUUCAAGAAAUAUGCGUGUAAUAAUGAAUAUUGGGAAACGUUUAAAGAAAACCCCAUCAGGCUUACUGAAGAAAACGUGGUAAAUUACAUUACCAAAUUAAAAGGACCAAAAGCUGCUGCUCUUUUUGCGAAGACACAUAAUUUGAAUAUGUUGCAGGACAUACCAAUGGACAGGUUUGUAAUGGACUUAAAGAGAGACGUGAAAGUGACUCCAGGAACAAAACAUACUGAAGAACGGCCCAAGGUACAGGUGAUCCAGGCUGCCGAUCCGCUAGCAACAGCGUAUCUGUGCGGAAUCCACCGAGAGCUGGUUAGGAGAUUAAAUGCGGUCCUGCUUCCGAACAUUCAUACACUGUUUGAUAUGUCGGCUGAAGACUUUGACGCUAUUAUAGCCGAGCACUUCCAGCCUGGGGAUUGUGUUCUGGAAACUGACAUCGCGUCGUUUGAUAAAAGUGAGGACGACGCCAUGGCUCUGACCGCGUUAAUGAUUCUGGAAGACUUAGGUGUGGACGCAGAGCUGUUGACGCUGAUUGAGGCGGCUUUCGGCGAAAUUUCAUCAAUACAUUUGCCCACUAAAACUAAAUUUAAAUUCGGAGCCAUGAUGAAAUCUGGAAUGUUCCUCACACUGUUUGUGAACACAGUCAUUAACAUUGUAAUCGCAAGCAGAGUGUUGAGAGAACGGCUAACCGGAUCACCAUGUGCAGCAUUCAUUGGAGAUGACAAUAUCGUGAAAGGAGUCAAAUCGGACAAAUUAAUGGCAGACAGGUGCGCCACCUGGUUGAAUAUGGAAGUCAAGAUUAUAGAUGCUGUGGUGGGCGAGAAAGCGCCUUAUUUCUGUGGAGGGUUUAUUUUGUGUGACUCCGUGACCGGCACAGCGUGCCGUGUGGCAGACCCCCUAAAAAGGCUGUUUAAGCUUGGCAAACCUCUGGCAGCAGACGAUGAACAUGAUGAUGACAGGAGAAGGGCAUUGCAUGAAGAGUCAACACGCUGGAACCGAGUGGGUAUUCUUUCAGAGCUGUGCAAGGCAGUAGAAUCAAGGUAUGAAACCGUAGGAACUUCCAUCAUAGUUAUGGCCAUGACUACUCUAGCUAGCAGUGUUAAAUCAUUCAGCUACCUGAGAGGGGCCCCUAUAACUCUCUACGGC [서열번호 89]
따라서, 그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 89로 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
바람직하게는, 숙주 세포에 존재하는 단백질과 함께, 본 발명의 RNA 구조체에 의해 암호화되는 비-구조 단백질은 적어도 하나의 치료 생체분자 및 적어도 하나의 선천적 조절 단백질을 암호화하는 서열의 게놈 복제 및 전사를 위해 필요한 효소 복합체(즉, 레플리카아제)를 형성한다. 예를 들면, 상기 하나 이상의 비-구조 단백질은 상기 구조체가 관심있는 적어도 하나의 펩티드 또는 단백질(즉, 치료 생체분자) 및 적어도 하나의 선천적 조절 단백질을 암호화하는 뉴클레오티드 서열을 증폭하게 할 수 있는 폴리머라아제를 암호화할 수 있다.
상기 숙주 세포는 진핵생물 또는 원핵생물 숙주 세포일 수 있다. 바람직하게는, 상기 숙주 세포는 진핵생물 숙주 세포이다. 보다 바람직하게는, 상기 숙주 세포는 포유동물 숙주 세포이다.
상기 RNA 구조체는 적어도 하나의 비-구조 단백질의 5'에 배치된 프로모터를 추가로 포함할 수 있으며, 상기 프로모터는 적어도 하나의 비-구조 단백질을 암호화하는 서열에 작동가능하게 연결되고, 숙주 세포에서 적어도 하나의 비-구조 단백질을 발현할 수 있다.
바람직하게는, 상기 RNA 구조체는 본 명세서에서 다음과 같은 서열번호 90으로 나타낼 수 있는 5' UTR 보존된 서열 요소를 포함한다:
AUGGGCGGCGCAUGAGAGAAGCCCAGACCAAUUACCUACCCAAA [서열번호 90]
따라서, 바람직하게는 상기 UTR은 적어도 하나의 비-구조 단백질의 5'에 배치되고, 실질적으로 서열번호 90에 나타낸 것과 같은 뉴클레오티드 서열, 또는 그의 단편 또는 변이체를 포함한다.
바람직하게는, 상기 RNA 구조체는 본 명세서에서 다음과 같은 서열번호 91로 나타낼 수 있는 3' UTR 보존된 서열 요소를 포함한다:
AAUUGGCAAGCUGCUUACAUAGAACUCGCGGCGAUUGGCAUGCCGCCUUAAAAUUUUUAUUUUAUUUUUCUUUUCUUUUCCGAAUCGGAUUUUGUUUUUAAUAUUUCAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA [서열번호 91]
따라서, 바람직하게는 상기 3' UTR은 상기 적어도 하나의 비-구조 단백질의 3'에 배치되고, 실질적으로 서열번호 91에 나타낸 것과 같은 뉴클레오티드 서열, 또는 그의 단편 또는 변이체를 포함한다.
바람직하게는, 상기 RNA 구조체는 폴리A 꼬리(polyA tail)를 포함한다. 바람직하게는, 상기 폴리A 꼬리는 상기 구조체의 3' 말단에 배치된다. 상기 폴리A 꼬리는 적어도 35개 nt, 또는 적어도 40개 nt, 또는 적어도 45개 nt, 또는 적어도 50개 nt를 포함할 수 있으며, 여기서 각각의 nt는 아데닌이다. 다른 구현예에서, 상기 폴리A 꼬리는 적어도 55개 nt 또는 적어도 60개 nt를 포함할 수 있으며, 여기서 각각의 nt는 아데닌이다. 또 다른 구현예에서, 상기 폴리A 꼬리는 적어도 60개 아데닌과, 이어서 하나 이상의 비-아데닌 뉴클레오티드(즉, G, C 또는 T, 바람직하게는 구아닌), 이후 다른 적어도 35개 nt, 또는 적어도 40개 nt, 또는 적어도 45개 nt, 또는 적어도 50개 nt, 또는 적어도 55개 nt, 또는 적어도 60개 nt를 포함할 수 있으며, 여기서 각각의 nt는 아데닌이다.
상기 RNA 구조체는 5' 캡을 추가로 포함할 수 있다. 본 발명의 문맥에서, 용어 "5'-캡"은 RNA 캡 구조를 닮은 5'-캡 유사체를 포함하며, 바람직하게는 생체내 및/또는 세포에서 여기에 부착될 경우 RNA를 안정화하거나, 및/또는 RNA의 번역을 향상시키는 능력을 갖도록 변형된다.
5'-캡을 갖는 RNA는 상기 5'-캡의 존재시에 DNA 주형의 시험관내 전사에 의해 달성될 수 있으며, 여기서 상기 5'-캡은 생성된 RNA 가닥 내로 공동-전사적으로 통합되거나, 상기 RNA는, 예를 들면, 시험관내 전사에 의해 생성될 수 있고, 상기 5' -캡은 캡핑 효소, 예를 들면, 백시니아 바이러스의 캡핑 효소를 이용하여 사후-전사적으로 RNA에 부착될 수 있다. 캡핑된 RNA에서, (캡핑된) RNA 분자의 제1 염기의 3' 위치는 포스포디에스테르 결합을 통해 RNA 분자의 후속 염기("제2 염기")의 5' 위치에 연결된다.
한 구현예에서, 상기 RNA 구조체는, 바람직하게는 5'에서 3'으로, 프로모터, 적어도 하나의 치료 생체분자를 암호화하는 서열, 링커 서열, 및 IIP를 암호화하는 적어도 하나의 서열을 포함한다. 한 구현예에서, 상기 RNA 구조체는, 바람직하게는 5'에서 3'으로, 프로모터, 적어도 하나의 IIP를 암호화하는 서열, 링커 서열, 및 적어도 하나의 치료 생체분자를 암호화하는 서열을 포함한다. 양쪽 구현예에서, 상기 링커는 F-T2a 또는 IRES일 수 있다.
다른 구현예에서, 상기 RNA 구조체는, 바람직하게는 5'에서 3'으로, 프로모터, 적어도 하나의 비-구조 단백질을 암호화하는 서열, 서브게놈성 프로모터, 적어도 하나의 치료 생체분자를 암호화하는 서열, 링커 서열, 및 적어도 하나의 바이러스 IIP를 암호화하는 서열을 포함한다. 다른 구현예에서, 상기 RNA 구조체는, 바람직하게는 5'에서 3'으로, 프로모터, 적어도 하나의 비-구조 단백질을 암호화하는 서열, 서브게놈성 프로모터, 적어도 하나의 바이러스 IIP를 암호화하는 서열, 링커 서열, 및 적어도 하나의 치료 생체분자를 암호화하는 서열을 포함한다. 양쪽 구현예에서, 상기 링커는 F-T2a 또는 IRES일 수 있다.
또 다른 구현예에서, 상기 RNA 구조체는, 바람직하게는 5'에서 3'으로, 프로모터, 적어도 하나의 비-구조 단백질을 암호화하는 서열, 서브게놈성 프로모터, 적어도 하나의 치료 생체분자를 암호화하는 서열, 링커 서열, 및 적어도 하나의 바이러스 IIP를 암호화하는 서열, 및 폴리A 꼬리를 포함한다. 또 다른 구현예에서, 상기 RNA 구조체는, 바람직하게는 5'에서 3'으로, 프로모터, 적어도 하나의 비-구조 단백질을 암호화하는 서열, 서브게놈성 프로모터, 적어도 하나의 바이러스 IIP를 암호화하는 서열, 링커 서열, 적어도 하나의 치료 생체분자를 암호화하는 서열, 및 폴리A 꼬리를 포함한다. 양쪽 구현예에서, 상기 링커는 F-T2a 또는 IRES일 수 있다.
다른 구현예에서, 상기 RNA 구조체는, 바람직하게는 5'에서 3'으로, 프로모터, 적어도 하나의 비-구조 단백질을 암호화하는 서열, 제1 서브게놈성 프로모터, 적어도 하나의 치료 생체분자를 암호화하는 서열, 제2 서브게놈성 프로모터, 적어도 하나의 바이러스 IIP를 암호화하는 서열, 및 폴리A 꼬리를 포함한다. 다른 구현예에서, 상기 RNA 구조체는, 바람직하게는 5'에서 3'으로, 프로모터, 적어도 하나의 비-구조 단백질을 암호화하는 서열, 제1 서브게놈성 프로모터, 적어도 하나의 바이러스 IIP를 암호화하는 서열, 제2 서브게놈성 프로모터, 적어도 하나의 치료 생체분자를 암호화하는 서열, 및 폴리A 꼬리를 포함한다.
가장 바람직하게는, 상기 RNA 구조체는, 5'에서 3'으로, 5' 캡, 프로모터, nsP1, nsP2, nsP3, nsP4, 서브게놈성 프로모터 26S, 치료 생체분자를 암호화하는 서열, 링커 서열, 바이러스 IIP를 암호화하는 서열, 및 폴리A 꼬리를 포함한다. 가장 바람직하게는, 상기 RNA 구조체는, 5'에서 3'으로, 5' 캡, 프로모터, nsP1, nsP2, nsP3v, nsP4, 서브게놈성 프로모터 26S, 바이러스 IIP를 암호화하는 서열, 링커 서열, 치료 생체분자를 암호화하는 서열; 및 폴리A 꼬리를 포함한다.
따라서, 한 구현예에서, 상기 RNA 구조체는 GOI - 푸린 T2A - HCV E6을 암호화하거나 이를 포함할 수 있다(이것은 본 명세서에서 인용된 첫번째 바이러스 IIP이지만, 본 명세서에 개시된 임의의 IIP 또는 링커가 사용될 수 있음이 인식될 것이다). 그러므로, 상기 RNA 구조체는 단일 RNA 구조체 내에 서열번호 92를 포함하거나 이로 이루어지는 단일 RNA 구조체, GOI, 및 서열번호 457을 포함하거나 이로 이루어질 수 있다. 서열번호 92 및 서열번호 457는 다음과 같다:
AUGGGCGGCGCAUGAGAGAAGCCCAGACCAAUUACCUACCCAAAAUGGAGAAAGUUCACGUUGACAUCGAGGAAGACAGCCCAUUCCUCAGAGCUUUGCAGCGGAGCUUCCCGCAGUUUGAGGUAGAAGCCAAGCAGGUCACUGAUAAUGACCAUGCUAAUGCCAGAGCGUUUUCGCAUCUGGCUUCAAAACUGAUCGAAACGGAGGUGGACCCAUCCGACACGAUCCUUGACAUUGGAAGUGCGCCCGCCCGCAGAAUGUAUUCUAAGCACAAGUAUCAUUGUAUCUGUCCGAUGAGAUGUGCGGAAGAUCCGGACAGAUUGUAUAAGUAUGCAACUAAGCUGAAGAAAAACUGUAAGGAAAUAACUGAUAAGGAAUUGGACAAGAAAAUGAAGGAGCUGGCCGCCGUCAUGAGCGACCCUGACCUGGAAACUGAGACUAUGUGCCUCCACGACGACGAGUCGUGUCGCUACGAAGGGCAAGUCGCUGUUUACCAGGAUGUAUACGCGGUUGACGGACCGACAAGUCUCUAUCACCAAGCCAAUAAGGGAGUUAGAGUCGCCUACUGGAUAGGCUUUGACACCACCCCUUUUAUGUUUAAGAACUUGGCUGGAGCAUAUCCAUCAUACUCUACCAACUGGGCCGACGAAACCGUGUUAACGGCUCGUAACAUAGGCCUAUGCAGCUCUGACGUUAUGGAGCGGUCACGUAGAGGGAUGUCCAUUCUUAGAAAGAAGUAUUUGAAACCAUCCAACAAUGUUCUAUUCUCUGUUGGCUCGACCAUCUACCACGAGAAGAGGGACUUACUGAGGAGCUGGCACCUGCCGUCUGUAUUUCACUUACGUGGCAAGCAAAAUUACACAUGUCGGUGUGAGACUAUAGUUAGUUGCGACGGGUACGUCGUUAAAAGAAUAGCUAUCAGUCCAGGCCUGUAUGGGAAGCCUUCAGGCUAUGCUGCUACGAUGCACCGCGAGGGAUUCUUGUGCUGCAAAGUGACAGACACAUUGAACGGGGAGAGGGUCUCUUUUCCCGUGUGCACGUAUGUGCCAGCUACAUUGUGUGACCAAAUGACUGGCAUACUGGCAACAGAUGUCAGUGCGGACGACGCGCAAAAACUGCUGGUUGGGCUCAACCAGCGUAUAGUCGUCAACGGUCGCACCCAGAGAAACACCAAUACCAUGAAAAAUUACCUUUUGCCCGUAGUGGCCCAGGCAUUUGCUAGGUGGGCAAAGGAAUAUAAGGAAGAUCAAGAAGAUGAAAGGCCACUAGGACUACGAGAUAGACAGUUAGUCAUGGGGUGUUGUUGGGCUUUUAGAAGGCACAAGAUAACAUCUAUUUAUAAGCGCCCGGAUACCCAAACCAUCAUCAAAGUGAACAGCGAUUUCCACUCAUUCGUGCUGCCCAGGAUAGGCAGUAACACAUUGGAGAUCGGGCUGAGAACAAGAAUCAGGAAAAUGUUAGAGGAGCACAAGGAGCCGUCACCUCUCAUUACCGCCGAGGACGUACAAGAAGCUAAGUGCGCAGCCGAUGAGGCUAAGGAGGUGCGUGAAGCCGAGGAGUUGCGCGCAGCUCUACCACCUUUGGCAGCUGAUGUUGAGGAGCCCACUCUGGAAGCCGAUGUCGACUUGAUGUUACAAGAGGCUGGGGCCGGCUCAGUGGAGACACCUCGUGGCUUGAUAAAGGUUACCAGCUACGAUGGCGAGGACAAGAUCGGCUCUUACGCUGUGCUUUCUCCGCAGGCUGUACUCAAGAGUGAAAAAUUAUCUUGCAUCCACCCUCUCGCUGAACAAGUCAUAGUGAUAACACACUCUGGCCGAAAAGGGCGUUAUGCCGUGGAACCAUACCAUGGUAAAGUAGUGGUGCCAGAGGGACAUGCAAUACCCGUCCAGGACUUUCAAGCUCUGAGUGAAAGUGCCACCAUUGUGUACAACGAACGUGAGUUCGUAAACAGGUACCUGCACCAUAUUGCCACACAUGGAGGAGCGCUGAACACUGAUGAAGAAUAUUACAAAACUGUCAAGCCCAGCGAGCACGACGGCGAAUACCUGUACGACAUCGACAGGAAACAGUGCGUCAAGAAAGAACUAGUCACUGGGCUAGGGCUCACAGGCGAGCUGGUGGAUCCUCCCUUCCAUGAAUUCGCCUACGAGAGUCUGAGAACACGACCAGCCGCUCCUUACCAAGUACCAACCAUAGGGGUGUAUGGCGUGCCAGGAUCAGGCAAGUCUGGCAUCAUUAAAAGCGCAGUCACCAAAAAAGAUCUAGUGGUGAGCGCCAAGAAAGAAAACUGUGCAGAAAUUAUAAGGGACGUCAAGAAAAUGAAAGGGCUGGACGUCAAUGCCAGAACUGUGGACUCAGUGCUCUUGAAUGGAUGCAAACACCCCGUAGAGACCCUGUAUAUUGACGAAGCUUUUGCUUGUCAUGCAGGUACUCUCAGAGCGCUCAUAGCCAUUAUAAGACCUAAAAAGGCAGUGCUCUGCGGGGAUCCCAAACAGUGCGGUUUUUUUAACAUGAUGUGCCUGAAAGUGCAUUUUAACCACGAGAUUUGCACACAAGUCUUCCACAAAAGCAUCUCUCGCCGUUGCACUAAAUCUGUGACUUCGGUCGUCUCAACCUUGUUUUACGACAAAAAAAUGAGAACGACGAAUCCGAAAGAGACUAAGAUUGUGAUUGACACUACCGGCAGUACCAAACCUAAGCAGGACGAUCUCAUUCUCACUUGUUUCAGAGGGUGGGUGAAGCAGUUGCAAAUAGAUUACAAAGGCAACGAAAUAAUGACGGCAGCUGCCUCUCAAGGGCUGACCCGUAAAGGUGUGUAUGCCGUUCGGUACAAGGUGAAUGAAAAUCCUCUGUACGCACCCACCUCAGAACAUGUGAACGUCCUACUGACCCGCACGGAGGACCGCAUCGUGUGGAAAACACUAGCCGGCGACCCAUGGAUAAAAACACUGACUGCCAAGUACCCUGGGAAUUUCACUGCCACGAUAGAGGAGUGGCAAGCAGAGCAUGAUGCCAUCAUGAGGCACAUCUUGGAGAGACCGGACCCUACCGACGUCUUCCAGAAUAAGGCAAACGUGUGUUGGGCCAAGGCUUUAGUGCCGGUGCUGAAGACCGCUGGCAUAGACAUGACCACUGAACAAUGGAACACUGUGGAUUAUUUUGAAACGGACAAAGCUCACUCAGCAGAGAUAGUAUUGAACCAACUAUGCGUGAGGUUCUUUGGACUCGAUCUGGACUCCGGUCUAUUUUCUGCACCCACUGUUCCGUUAUCCAUUAGGAAUAAUCACUGGGAUAACUCCCCGUCGCCUAACAUGUACGGGCUGAAUAAAGAAGUGGUCCGUCAGCUCUCUCGCAGGUACCCACAACUGCCUCGGGCAGUUGCCACUGGAAGAGUCUAUGACAUGAACACUGGUACACUGCGCAAUUAUGAUCCGCGCAUAAACCUAGUACCUGUAAACAGAAGACUGCCUCAUGCUUUAGUCCUCCACCAUAAUGAACACCCACAGAGUGACUUUUCUUCAUUCGUCAGCAAAUUGAAGGGCAGAACUGUCCUGGUGGUCGGGGAAAAGUUGUCCGUCCCAGGCAAAAUGGUUGACUGGUUGUCAGACCGGCCUGAGGCUACCUUCAGAGCUCGGCUGGAUUUAGGCAUCCCAGGUGAUGUGCCCAAAUAUGACAUAAUAUUUGUUAAUGUGAGGACCCCAUAUAAAUACCAUCACUAUCAGCAGUGUGAAGACCAUGCCAUUAAGCUUAGCAUGUUGACCAAGAAAGCUUGUCUGCAUCUGAAUCCCGGCGGAACCUGUGUCAGCAUAGGUUAUGGUUACGCUGACAGGGCCAGCGAAAGCAUCAUUGGUGCUAUAGCGCGGCAGUUCAAGUUUUCCCGGGUAUGCAAACCGAAAUCCUCACUUGAAGAGACGGAAGUUCUGUUUGUAUUCAUUGGGUACGAUCGCAAGGCCCGUACGCACAAUUCUUACAAGCUUUCAUCAACCUUGACCAACAUUUAUACAGGUUCCAGACUCCACGAAGCCGGAUGUGCACCCUCAUAUCAUGUGGUGCGAGGGGAUAUUGCCACGGCCACCGAAGGAGUGAUUAUAAAUGCUGCUAACAGCAAAGGACAACCUGGCGGAGGGGUGUGCGGAGCGCUGUAUAAGAAAUUCCCGGAAAGCUUCGAUUUACAGCCGAUCGAAGUAGGAAAAGCGCGACUGGUCAAAGGUGCAGCUAAACAUAUCAUUCAUGCCGUAGGACCAAACUUCAACAAAGUUUCGGAGGUUGAAGGUGACAAACAGUUGGCAGAGGCUUAUGAGUCCAUCGCUAAGAUUGUCAACGAUAACAAUUACAAGUCAGUAGCGAUUCCACUGUUGUCCACCGGCAUCUUUUCCGGGAACAAAGAUCGACUAACCCAAUCAUUGAACCAUUUGCUGACAGCUUUAGACACCACUGAUGCAGAUGUAGCCAUAUACUGCAGGGACAAGAAAUGGGAAAUGACUCUCAAGGAAGCAGUGGCUAGGAGAGAAGCAGUGGAGGAGAUAUGCAUAUCCGACGACUCUUCAGUGACAGAACCUGAUGCAGAGCUGGUGAGGGUGCAUCCGAAGAGUUCUUUGGCUGGAAGGAAGGGCUACAGCACAAGCGAUGGCAAAACUUUCUCAUAUUUGGAAGGGACCAAGUUUCACCAGGCGGCCAAGGAUAUAGCAGAAAUUAAUGCCAUGUGGCCCGUUGCAACGGAGGCCAAUGAGCAGGUAUGCAUGUAUAUCCUCGGAGAAAGCAUGAGCAGUAUUAGGUCGAAAUGCCCCGUCGAAGAGUCGGAAGCCUCCACACCACCUAGCACGCUGCCUUGCUUGUGCAUCCAUGCCAUGACUCCAGAAAGAGUACAGCGCCUAAAAGCCUCACGUCCAGAACAAAUUACUGUGUGCUCAUCCUUUCCAUUGCCGAAGUAUAGAAUCACUGGUGUGCAGAAGAUCCAAUGCUCCCAGCCUAUAUUGUUCUCACCGAAAGUGCCUGCGUAUAUUCAUCCAAGGAAGUAUCUCGUGGAAACACCACCGGUAGACGAGACUCCGGAGCCAUCGGCAGAGAACCAAUCCACAGAGGGGACACCUGAACAACCACCACUUAUAACCGAGGAUGAGACCAGGACUAGAACGCCUGAGCCGAUCAUCAUCGAAGAGGAAGAAGAGGAUAGCAUAAGUUUGCUGUCAGAUGGCCCGACCCACCAGGUGCUGCAAGUCGAGGCAGACAUUCACGGGCCGCCCUCUGUAUCUAGCUCAUCCUGGUCCAUUCCUCAUGCAUCCGACUUUGAUGUGGACAGUUUAUCCAUACUUGACACCCUGGAGGGAGCUAGCGUGACCAGCGGGGCAACGUCAGCCGAGACUAACUCUUACUUCGCAAAGAGUAUGGAGUUUCUGGCGCGACCGGUGCCUGCGCCUCGAACAGUAUUCAGGAACCCUCCACAUCCCGCUCCGCGCACAAGAACACCGUCACUUGCACCCAGCAGGGCCUGCUCGAGAACCAGCCUAGUUUCCACCCCGCCAGGCGUGAAUAGGGUGAUCACUAGAGAGGAGCUCGAGGCGCUUACCCCGUCACGCACUCCUAGCAGGUCGGUCUCGAGAACCAGCCUGGUCUCCAACCCGCCAGGCGUAAAUAGGGUGAUUACAAGAGAGGAGUUUGAGGCGUUCGUAGCACAACAACAAUGACGGUUUGAUGCGGGUGCAUACAUCUUUUCCUCCGACACCGGUCAAGGGCAUUUACAACAAAAAUCAGUAAGGCAAACGGUGCUAUCCGAAGUGGUGUUGGAGAGGACCGAAUUGGAGAUUUCGUAUGCCCCGCGCCUCGACCAAGAAAAAGAAGAAUUACUACGCAAGAAAUUACAGUUAAAUCCCACACCUGCUAACAGAAGCAGAUACCAGUCCAGGAAGGUGGAGAACAUGAAAGCCAUAACAGCUAGACGUAUUCUGCAAGGCCUAGGGCAUUAUUUGAAGGCAGAAGGAAAAGUGGAGUGCUACCGAACCCUGCAUCCUGUUCCUUUGUAUUCAUCUAGUGUGAACCGUGCCUUUUCAAGCCCCAAGGUCGCAGUGGAAGCCUGUAACGCCAUGUUGAAAGAGAACUUUCCGACUGUGGCUUCUUACUGUAUUAUUCCAGAGUACGAUGCCUAUUUGGACAUGGUUGACGGAGCUUCAUGCUGCUUAGACACUGCCAGUUUUUGCCCUGCAAAGCUGCGCAGCUUUCCAAAGAAACACUCCUAUUUGGAACCCACAAUACGAUCGGCAGUGCCUUCAGCGAUCCAGAACACGCUCCAGAACGUCCUGGCAGCUGCCACAAAAAGAAAUUGCAAUGUCACGCAAAUGAGAGAAUUGCCCGUAUUGGAUUCGGCGGCCUUUAAUGUGGAAUGCUUCAAGAAAUAUGCGUGUAAUAAUGAAUAUUGGGAAACGUUUAAAGAAAACCCCAUCAGGCUUACUGAAGAAAACGUGGUAAAUUACAUUACCAAAUUAAAAGGACCAAAAGCUGCUGCUCUUUUUGCGAAGACACAUAAUUUGAAUAUGUUGCAGGACAUACCAAUGGACAGGUUUGUAAUGGACUUAAAGAGAGACGUGAAAGUGACUCCAGGAACAAAACAUACUGAAGAACGGCCCAAGGUACAGGUGAUCCAGGCUGCCGAUCCGCUAGCAACAGCGUAUCUGUGCGGAAUCCACCGAGAGCUGGUUAGGAGAUUAAAUGCGGUCCUGCUUCCGAACAUUCAUACACUGUUUGAUAUGUCGGCUGAAGACUUUGACGCUAUUAUAGCCGAGCACUUCCAGCCUGGGGAUUGUGUUCUGGAAACUGACAUCGCGUCGUUUGAUAAAAGUGAGGACGACGCCAUGGCUCUGACCGCGUUAAUGAUUCUGGAAGACUUAGGUGUGGACGCAGAGCUGUUGACGCUGAUUGAGGCGGCUUUCGGCGAAAUUUCAUCAAUACAUUUGCCCACUAAAACUAAAUUUAAAUUCGGAGCCAUGAUGAAAUCUGGAAUGUUCCUCACACUGUUUGUGAACACAGUCAUUAACAUUGUAAUCGCAAGCAGAGUGUUGAGAGAACGGCUAACCGGAUCACCAUGUGCAGCAUUCAUUGGAGAUGACAAUAUCGUGAAAGGAGUCAAAUCGGACAAAUUAAUGGCAGACAGGUGCGCCACCUGGUUGAAUAUGGAAGUCAAGAUUAUAGAUGCUGUGGUGGGCGAGAAAGCGCCUUAUUUCUGUGGAGGGUUUAUUUUGUGUGACUCCGUGACCGGCACAGCGUGCCGUGUGGCAGACCCCCUAAAAAGGCUGUUUAAGCUUGGCAAACCUCUGGCAGCAGACGAUGAACAUGAUGAUGACAGGAGAAGGGCAUUGCAUGAAGAGUCAACACGCUGGAACCGAGUGGGUAUUCUUUCAGAGCUGUGCAAGGCAGUAGAAUCAAGGUAUGAAACCGUAGGAACUUCCAUCAUAGUUAUGGCCAUGACUACUCUAGCUAGCAGUGUUAAAUCAUUCAGCUACCUGAGAGGGGCCCCUAUAACUCUCUACGGCUAACCUGAAUGGACUACGACAUAGUCUAGUCCGCCAAGUCUAGCAUAUGGCCACC [서열번호 92]----------------GOI---------------------CGGAGACGGCGCAGAAGAAGAGGAUCUGGCGAAGGCAGAGGCAGCCUGCUUACAUGUGGCGACGUGGAAGAGAACCCCGGACCUAUGCACCAGAAACGGACCGCCAUGUUCCAGGAUCCUCAAGAGAGGCCCAGAAAGCUGCCUCAGCUGUGUACCGAGCUGCAGACCACCAUCCACGACAUCAUCCUGGAAUGCGUGUACUGCAAGCAGCAGCUCCUGCGGAGAGAGGUGUACGAUUUCGCCUUCCGGGACCUGUGCAUCGUGUACAGAGAUGGCAACCCCUACGCCGUGUGCGACAAGUGCCUGAAGUUCUACAGCAAGAUCAGCGAGUACCGGCACUACUGCUACAGCCUGUACGGCACCACACUGGAACAGCAGUACAACAAGCCCCUGUGCGACCUGCUGAUCCGGUGCAUCAACUGCCAGAAACCUCUGUGCCCCGAGGAAAAGCAGCGGCACCUGGACAAGAAGCAGCGGUUCCACAACAUCAGAGGCCGGUGGACCGGCAGAUGCAUGAGCUGUUGUCGGAGCAGCAGAACCAGACGGGAAACCCAGCUGUGAGCGGCCGCGAAUUGGCAAGCUGCUUACAUAGAACUCGCGGCGAUUGGCAUGCCGCCUUAAAAUUUUUAUUUUAUUUUUCUUUUCUUUUCCGAAUCGGAUUUUGUUUUUAAUAUUUCAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA [서열번호 457]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 92, GOI, 및 서열번호 457, 또는 그의 단편 또는 변이체를 포함하거나 이로 이루어지는 상기에 나타낸 것과 같은 뉴클레오티드 서열을 포함한다.
본 발명의 제2 측면에서, 제1 측면의 RNA 구조체를 암호화하는 핵산 서열이 제공된다.
한 구현예에서, 상기 핵산 서열은 GOI - 푸린 T2A - HCV E6을 암호화할 수 있다(이것은 본 명세서에서 인용된 첫번째 바이러스 IIP이지만, 본 명세서에 개시된 임의의 IIP 또는 링커가 사용될 수 있음이 인식될 것이다). 따라서, 상기 핵산 서열은 서열번호 93, GOI, 및 서열번호 458을 포함하거나 이로 이루어질 수 있다. 서열번호 93 및 서열번호 458은 다음과 같다:
ATGGGCGGCGCATGAGAGAAGCCCAGACCAATTACCTACCCAAAATGGAGAAAGTTCACGTTGACATCGAGGAAGACAGCCCATTCCTCAGAGCTTTGCAGCGGAGCTTCCCGCAGTTTGAGGTAGAAGCCAAGCAGGTCACTGATAATGACCATGCTAATGCCAGAGCGTTTTCGCATCTGGCTTCAAAACTGATCGAAACGGAGGTGGACCCATCCGACACGATCCTTGACATTGGAAGTGCGCCCGCCCGCAGAATGTATTCTAAGCACAAGTATCATTGTATCTGTCCGATGAGATGTGCGGAAGATCCGGACAGATTGTATAAGTATGCAACTAAGCTGAAGAAAAACTGTAAGGAAATAACTGATAAGGAATTGGACAAGAAAATGAAGGAGCTGGCCGCCGTCATGAGCGACCCTGACCTGGAAACTGAGACTATGTGCCTCCACGACGACGAGTCGTGTCGCTACGAAGGGCAAGTCGCTGTTTACCAGGATGTATACGCGGTTGACGGACCGACAAGTCTCTATCACCAAGCCAATAAGGGAGTTAGAGTCGCCTACTGGATAGGCTTTGACACCACCCCTTTTATGTTTAAGAACTTGGCTGGAGCATATCCATCATACTCTACCAACTGGGCCGACGAAACCGTGTTAACGGCTCGTAACATAGGCCTATGCAGCTCTGACGTTATGGAGCGGTCACGTAGAGGGATGTCCATTCTTAGAAAGAAGTATTTGAAACCATCCAACAATGTTCTATTCTCTGTTGGCTCGACCATCTACCACGAGAAGAGGGACTTACTGAGGAGCTGGCACCTGCCGTCTGTATTTCACTTACGTGGCAAGCAAAATTACACATGTCGGTGTGAGACTATAGTTAGTTGCGACGGGTACGTCGTTAAAAGAATAGCTATCAGTCCAGGCCTGTATGGGAAGCCTTCAGGCTATGCTGCTACGATGCACCGCGAGGGATTCTTGTGCTGCAAAGTGACAGACACATTGAACGGGGAGAGGGTCTCTTTTCCCGTGTGCACGTATGTGCCAGCTACATTGTGTGACCAAATGACTGGCATACTGGCAACAGATGTCAGTGCGGACGACGCGCAAAAACTGCTGGTTGGGCTCAACCAGCGTATAGTCGTCAACGGTCGCACCCAGAGAAACACCAATACCATGAAAAATTACCTTTTGCCCGTAGTGGCCCAGGCATTTGCTAGGTGGGCAAAGGAATATAAGGAAGATCAAGAAGATGAAAGGCCACTAGGACTACGAGATAGACAGTTAGTCATGGGGTGTTGTTGGGCTTTTAGAAGGCACAAGATAACATCTATTTATAAGCGCCCGGATACCCAAACCATCATCAAAGTGAACAGCGATTTCCACTCATTCGTGCTGCCCAGGATAGGCAGTAACACATTGGAGATCGGGCTGAGAACAAGAATCAGGAAAATGTTAGAGGAGCACAAGGAGCCGTCACCTCTCATTACCGCCGAGGACGTACAAGAAGCTAAGTGCGCAGCCGATGAGGCTAAGGAGGTGCGTGAAGCCGAGGAGTTGCGCGCAGCTCTACCACCTTTGGCAGCTGATGTTGAGGAGCCCACTCTGGAAGCCGATGTCGACTTGATGTTACAAGAGGCTGGGGCCGGCTCAGTGGAGACACCTCGTGGCTTGATAAAGGTTACCAGCTACGATGGCGAGGACAAGATCGGCTCTTACGCTGTGCTTTCTCCGCAGGCTGTACTCAAGAGTGAAAAATTATCTTGCATCCACCCTCTCGCTGAACAAGTCATAGTGATAACACACTCTGGCCGAAAAGGGCGTTATGCCGTGGAACCATACCATGGTAAAGTAGTGGTGCCAGAGGGACATGCAATACCCGTCCAGGACTTTCAAGCTCTGAGTGAAAGTGCCACCATTGTGTACAACGAACGTGAGTTCGTAAACAGGTACCTGCACCATATTGCCACACATGGAGGAGCGCTGAACACTGATGAAGAATATTACAAAACTGTCAAGCCCAGCGAGCACGACGGCGAATACCTGTACGACATCGACAGGAAACAGTGCGTCAAGAAAGAACTAGTCACTGGGCTAGGGCTCACAGGCGAGCTGGTGGATCCTCCCTTCCATGAATTCGCCTACGAGAGTCTGAGAACACGACCAGCCGCTCCTTACCAAGTACCAACCATAGGGGTGTATGGCGTGCCAGGATCAGGCAAGTCTGGCATCATTAAAAGCGCAGTCACCAAAAAAGATCTAGTGGTGAGCGCCAAGAAAGAAAACTGTGCAGAAATTATAAGGGACGTCAAGAAAATGAAAGGGCTGGACGTCAATGCCAGAACTGTGGACTCAGTGCTCTTGAATGGATGCAAACACCCCGTAGAGACCCTGTATATTGACGAAGCTTTTGCTTGTCATGCAGGTACTCTCAGAGCGCTCATAGCCATTATAAGACCTAAAAAGGCAGTGCTCTGCGGGGATCCCAAACAGTGCGGTTTTTTTAACATGATGTGCCTGAAAGTGCATTTTAACCACGAGATTTGCACACAAGTCTTCCACAAAAGCATCTCTCGCCGTTGCACTAAATCTGTGACTTCGGTCGTCTCAACCTTGTTTTACGACAAAAAAATGAGAACGACGAATCCGAAAGAGACTAAGATTGTGATTGACACTACCGGCAGTACCAAACCTAAGCAGGACGATCTCATTCTCACTTGTTTCAGAGGGTGGGTGAAGCAGTTGCAAATAGATTACAAAGGCAACGAAATAATGACGGCAGCTGCCTCTCAAGGGCTGACCCGTAAAGGTGTGTATGCCGTTCGGTACAAGGTGAATGAAAATCCTCTGTACGCACCCACCTCAGAACATGTGAACGTCCTACTGACCCGCACGGAGGACCGCATCGTGTGGAAAACACTAGCCGGCGACCCATGGATAAAAACACTGACTGCCAAGTACCCTGGGAATTTCACTGCCACGATAGAGGAGTGGCAAGCAGAGCATGATGCCATCATGAGGCACATCTTGGAGAGACCGGACCCTACCGACGTCTTCCAGAATAAGGCAAACGTGTGTTGGGCCAAGGCTTTAGTGCCGGTGCTGAAGACCGCTGGCATAGACATGACCACTGAACAATGGAACACTGTGGATTATTTTGAAACGGACAAAGCTCACTCAGCAGAGATAGTATTGAACCAACTATGCGTGAGGTTCTTTGGACTCGATCTGGACTCCGGTCTATTTTCTGCACCCACTGTTCCGTTATCCATTAGGAATAATCACTGGGATAACTCCCCGTCGCCTAACATGTACGGGCTGAATAAAGAAGTGGTCCGTCAGCTCTCTCGCAGGTACCCACAACTGCCTCGGGCAGTTGCCACTGGAAGAGTCTATGACATGAACACTGGTACACTGCGCAATTATGATCCGCGCATAAACCTAGTACCTGTAAACAGAAGACTGCCTCATGCTTTAGTCCTCCACCATAATGAACACCCACAGAGTGACTTTTCTTCATTCGTCAGCAAATTGAAGGGCAGAACTGTCCTGGTGGTCGGGGAAAAGTTGTCCGTCCCAGGCAAAATGGTTGACTGGTTGTCAGACCGGCCTGAGGCTACCTTCAGAGCTCGGCTGGATTTAGGCATCCCAGGTGATGTGCCCAAATATGACATAATATTTGTTAATGTGAGGACCCCATATAAATACCATCACTATCAGCAGTGTGAAGACCATGCCATTAAGCTTAGCATGTTGACCAAGAAAGCTTGTCTGCATCTGAATCCCGGCGGAACCTGTGTCAGCATAGGTTATGGTTACGCTGACAGGGCCAGCGAAAGCATCATTGGTGCTATAGCGCGGCAGTTCAAGTTTTCCCGGGTATGCAAACCGAAATCCTCACTTGAAGAGACGGAAGTTCTGTTTGTATTCATTGGGTACGATCGCAAGGCCCGTACGCACAATTCTTACAAGCTTTCATCAACCTTGACCAACATTTATACAGGTTCCAGACTCCACGAAGCCGGATGTGCACCCTCATATCATGTGGTGCGAGGGGATATTGCCACGGCCACCGAAGGAGTGATTATAAATGCTGCTAACAGCAAAGGACAACCTGGCGGAGGGGTGTGCGGAGCGCTGTATAAGAAATTCCCGGAAAGCTTCGATTTACAGCCGATCGAAGTAGGAAAAGCGCGACTGGTCAAAGGTGCAGCTAAACATATCATTCATGCCGTAGGACCAAACTTCAACAAAGTTTCGGAGGTTGAAGGTGACAAACAGTTGGCAGAGGCTTATGAGTCCATCGCTAAGATTGTCAACGATAACAATTACAAGTCAGTAGCGATTCCACTGTTGTCCACCGGCATCTTTTCCGGGAACAAAGATCGACTAACCCAATCATTGAACCATTTGCTGACAGCTTTAGACACCACTGATGCAGATGTAGCCATATACTGCAGGGACAAGAAATGGGAAATGACTCTCAAGGAAGCAGTGGCTAGGAGAGAAGCAGTGGAGGAGATATGCATATCCGACGACTCTTCAGTGACAGAACCTGATGCAGAGCTGGTGAGGGTGCATCCGAAGAGTTCTTTGGCTGGAAGGAAGGGCTACAGCACAAGCGATGGCAAAACTTTCTCATATTTGGAAGGGACCAAGTTTCACCAGGCGGCCAAGGATATAGCAGAAATTAATGCCATGTGGCCCGTTGCAACGGAGGCCAATGAGCAGGTATGCATGTATATCCTCGGAGAAAGCATGAGCAGTATTAGGTCGAAATGCCCCGTCGAAGAGTCGGAAGCCTCCACACCACCTAGCACGCTGCCTTGCTTGTGCATCCATGCCATGACTCCAGAAAGAGTACAGCGCCTAAAAGCCTCACGTCCAGAACAAATTACTGTGTGCTCATCCTTTCCATTGCCGAAGTATAGAATCACTGGTGTGCAGAAGATCCAATGCTCCCAGCCTATATTGTTCTCACCGAAAGTGCCTGCGTATATTCATCCAAGGAAGTATCTCGTGGAAACACCACCGGTAGACGAGACTCCGGAGCCATCGGCAGAGAACCAATCCACAGAGGGGACACCTGAACAACCACCACTTATAACCGAGGATGAGACCAGGACTAGAACGCCTGAGCCGATCATCATCGAAGAGGAAGAAGAGGATAGCATAAGTTTGCTGTCAGATGGCCCGACCCACCAGGTGCTGCAAGTCGAGGCAGACATTCACGGGCCGCCCTCTGTATCTAGCTCATCCTGGTCCATTCCTCATGCATCCGACTTTGATGTGGACAGTTTATCCATACTTGACACCCTGGAGGGAGCTAGCGTGACCAGCGGGGCAACGTCAGCCGAGACTAACTCTTACTTCGCAAAGAGTATGGAGTTTCTGGCGCGACCGGTGCCTGCGCCTCGAACAGTATTCAGGAACCCTCCACATCCCGCTCCGCGCACAAGAACACCGTCACTTGCACCCAGCAGGGCCTGCTCGAGAACCAGCCTAGTTTCCACCCCGCCAGGCGTGAATAGGGTGATCACTAGAGAGGAGCTCGAGGCGCTTACCCCGTCACGCACTCCTAGCAGGTCGGTCTCGAGAACCAGCCTGGTCTCCAACCCGCCAGGCGTAAATAGGGTGATTACAAGAGAGGAGTTTGAGGCGTTCGTAGCACAACAACAATGACGGTTTGATGCGGGTGCATACATCTTTTCCTCCGACACCGGTCAAGGGCATTTACAACAAAAATCAGTAAGGCAAACGGTGCTATCCGAAGTGGTGTTGGAGAGGACCGAATTGGAGATTTCGTATGCCCCGCGCCTCGACCAAGAAAAAGAAGAATTACTACGCAAGAAATTACAGTTAAATCCCACACCTGCTAACAGAAGCAGATACCAGTCCAGGAAGGTGGAGAACATGAAAGCCATAACAGCTAGACGTATTCTGCAAGGCCTAGGGCATTATTTGAAGGCAGAAGGAAAAGTGGAGTGCTACCGAACCCTGCATCCTGTTCCTTTGTATTCATCTAGTGTGAACCGTGCCTTTTCAAGCCCCAAGGTCGCAGTGGAAGCCTGTAACGCCATGTTGAAAGAGAACTTTCCGACTGTGGCTTCTTACTGTATTATTCCAGAGTACGATGCCTATTTGGACATGGTTGACGGAGCTTCATGCTGCTTAGACACTGCCAGTTTTTGCCCTGCAAAGCTGCGCAGCTTTCCAAAGAAACACTCCTATTTGGAACCCACAATACGATCGGCAGTGCCTTCAGCGATCCAGAACACGCTCCAGAACGTCCTGGCAGCTGCCACAAAAAGAAATTGCAATGTCACGCAAATGAGAGAATTGCCCGTATTGGATTCGGCGGCCTTTAATGTGGAATGCTTCAAGAAATATGCGTGTAATAATGAATATTGGGAAACGTTTAAAGAAAACCCCATCAGGCTTACTGAAGAAAACGTGGTAAATTACATTACCAAATTAAAAGGACCAAAAGCTGCTGCTCTTTTTGCGAAGACACATAATTTGAATATGTTGCAGGACATACCAATGGACAGGTTTGTAATGGACTTAAAGAGAGACGTGAAAGTGACTCCAGGAACAAAACATACTGAAGAACGGCCCAAGGTACAGGTGATCCAGGCTGCCGATCCGCTAGCAACAGCGTATCTGTGCGGAATCCACCGAGAGCTGGTTAGGAGATTAAATGCGGTCCTGCTTCCGAACATTCATACACTGTTTGATATGTCGGCTGAAGACTTTGACGCTATTATAGCCGAGCACTTCCAGCCTGGGGATTGTGTTCTGGAAACTGACATCGCGTCGTTTGATAAAAGTGAGGACGACGCCATGGCTCTGACCGCGTTAATGATTCTGGAAGACTTAGGTGTGGACGCAGAGCTGTTGACGCTGATTGAGGCGGCTTTCGGCGAAATTTCATCAATACATTTGCCCACTAAAACTAAATTTAAATTCGGAGCCATGATGAAATCTGGAATGTTCCTCACACTGTTTGTGAACACAGTCATTAACATTGTAATCGCAAGCAGAGTGTTGAGAGAACGGCTAACCGGATCACCATGTGCAGCATTCATTGGAGATGACAATATCGTGAAAGGAGTCAAATCGGACAAATTAATGGCAGACAGGTGCGCCACCTGGTTGAATATGGAAGTCAAGATTATAGATGCTGTGGTGGGCGAGAAAGCGCCTTATTTCTGTGGAGGGTTTATTTTGTGTGACTCCGTGACCGGCACAGCGTGCCGTGTGGCAGACCCCCTAAAAAGGCTGTTTAAGCTTGGCAAACCTCTGGCAGCAGACGATGAACATGATGATGACAGGAGAAGGGCATTGCATGAAGAGTCAACACGCTGGAACCGAGTGGGTATTCTTTCAGAGCTGTGCAAGGCAGTAGAATCAAGGTATGAAACCGTAGGAACTTCCATCATAGTTATGGCCATGACTACTCTAGCTAGCAGTGTTAAATCATTCAGCTACCTGAGAGGGGCCCCTATAACTCTCTACGGCTAACCTGAATGGACTACGACATAGTCTAGTCCGCCAAGTCTAGCATATGGCCACC [서열번호 93]----------------GOI---------------------CGGAGACGGCGCAGAAGAAGAGGATCTGGCGAAGGCAGAGGCAGCCTGCTTACATGTGGCGACGTGGAAGAGAACCCCGGACCTATGCACCAGAAACGGACCGCCATGTTCCAGGATCCTCAAGAGAGGCCCAGAAAGCTGCCTCAGCTGTGTACCGAGCTGCAGACCACCATCCACGACATCATCCTGGAATGCGTGTACTGCAAGCAGCAGCTCCTGCGGAGAGAGGTGTACGATTTCGCCTTCCGGGACCTGTGCATCGTGTACAGAGATGGCAACCCCTACGCCGTGTGCGACAAGTGCCTGAAGTTCTACAGCAAGATCAGCGAGTACCGGCACTACTGCTACAGCCTGTACGGCACCACACTGGAACAGCAGTACAACAAGCCCCTGTGCGACCTGCTGATCCGGTGCATCAACTGCCAGAAACCTCTGTGCCCCGAGGAAAAGCAGCGGCACCTGGACAAGAAGCAGCGGTTCCACAACATCAGAGGCCGGTGGACCGGCAGATGCATGAGCTGTTGTCGGAGCAGCAGAACCAGACGGGAAACCCAGCTGTGAGCGGCCGCGAATTGGCAAGCTGCTTACATAGAACTCGCGGCGATTGGCATGCCGCCTTAAAATTTTTATTTTATTTTTCTTTTCTTTTCCGAATCGGATTTTGTTTTTAATATTTCAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA [서열번호 458]
따라서, 바람직하게는 상기 핵산 서열은 실질적으로 서열번호 93을 포함하거나 이로 이루어지는 상기 나타낸 것과 같은 뉴클레오티드 서열, GOI, 및 서열번호 458, 또는 그의 단편 또는 변이체를 포함한다.
제3 측면에서, 제2 측면에 따른 핵산 서열을 포함하는 발현 카세트(cassette)가 제공된다.
본 발명의 핵산 서열은 바람직하게는 재조합 벡터, 예를 들면 상기 RNA 구조체를 생산할 수 있도록 관심있는 숙주 세포 내로 운반하기 위한 재조합 벡터 내에 포함된다.
본 발명의 핵산 서열은 바람직하게는 재조합 벡터, 예를 들면 상기 RNA 구조체를 생산할 수 있도록 관심있는 숙주 세포 내로 운반하기 위한 재조합 벡터 내에 포함된다.
따라서, 제4 측면에서, 제3 측면에 따른 발현 카세트를 포함하는 재조합 벡터가 제공된다.
한 구현예에서, 상기 벡터는 GOI - 푸린 T2A - HCV E6를 갖고 있는 saRNA 플라스미드 구조체를 암호화하거나 이를 포함하는 DNA 서열을 포함할 수 있다(이것은 본 명세서에서 인용된 첫번째 바이러스 IIP이지만, 본 명세서에 개시된 임의의 IIP 또는 링커가 사용될 수 있음이 인식될 것이다). 따라서, 상기 벡터는 단일 벡터 내에 서열번호 94의 핵산 서열, GOI, 및 서열번호 459의 핵산 서열을 포함할 수 있다. 서열번호 94 및 서열번호 459는 다음과 같으며, 여기서 "GOI"는 치료 생체분자를 암호화하는 서열의 위치를 나타낸다:
TAATACGACTCACTATAGATGGGCGGCGCATGAGAGAAGCCCAGACCAATTACCTACCCAAAATGGAGAAAGTTCACGTTGACATCGAGGAAGACAGCCCATTCCTCAGAGCTTTGCAGCGGAGCTTCCCGCAGTTTGAGGTAGAAGCCAAGCAGGTCACTGATAATGACCATGCTAATGCCAGAGCGTTTTCGCATCTGGCTTCAAAACTGATCGAAACGGAGGTGGACCCATCCGACACGATCCTTGACATTGGAAGTGCGCCCGCCCGCAGAATGTATTCTAAGCACAAGTATCATTGTATCTGTCCGATGAGATGTGCGGAAGATCCGGACAGATTGTATAAGTATGCAACTAAGCTGAAGAAAAACTGTAAGGAAATAACTGATAAGGAATTGGACAAGAAAATGAAGGAGCTGGCCGCCGTCATGAGCGACCCTGACCTGGAAACTGAGACTATGTGCCTCCACGACGACGAGTCGTGTCGCTACGAAGGGCAAGTCGCTGTTTACCAGGATGTATACGCGGTTGACGGACCGACAAGTCTCTATCACCAAGCCAATAAGGGAGTTAGAGTCGCCTACTGGATAGGCTTTGACACCACCCCTTTTATGTTTAAGAACTTGGCTGGAGCATATCCATCATACTCTACCAACTGGGCCGACGAAACCGTGTTAACGGCTCGTAACATAGGCCTATGCAGCTCTGACGTTATGGAGCGGTCACGTAGAGGGATGTCCATTCTTAGAAAGAAGTATTTGAAACCATCCAACAATGTTCTATTCTCTGTTGGCTCGACCATCTACCACGAGAAGAGGGACTTACTGAGGAGCTGGCACCTGCCGTCTGTATTTCACTTACGTGGCAAGCAAAATTACACATGTCGGTGTGAGACTATAGTTAGTTGCGACGGGTACGTCGTTAAAAGAATAGCTATCAGTCCAGGCCTGTATGGGAAGCCTTCAGGCTATGCTGCTACGATGCACCGCGAGGGATTCTTGTGCTGCAAAGTGACAGACACATTGAACGGGGAGAGGGTCTCTTTTCCCGTGTGCACGTATGTGCCAGCTACATTGTGTGACCAAATGACTGGCATACTGGCAACAGATGTCAGTGCGGACGACGCGCAAAAACTGCTGGTTGGGCTCAACCAGCGTATAGTCGTCAACGGTCGCACCCAGAGAAACACCAATACCATGAAAAATTACCTTTTGCCCGTAGTGGCCCAGGCATTTGCTAGGTGGGCAAAGGAATATAAGGAAGATCAAGAAGATGAAAGGCCACTAGGACTACGAGATAGACAGTTAGTCATGGGGTGTTGTTGGGCTTTTAGAAGGCACAAGATAACATCTATTTATAAGCGCCCGGATACCCAAACCATCATCAAAGTGAACAGCGATTTCCACTCATTCGTGCTGCCCAGGATAGGCAGTAACACATTGGAGATCGGGCTGAGAACAAGAATCAGGAAAATGTTAGAGGAGCACAAGGAGCCGTCACCTCTCATTACCGCCGAGGACGTACAAGAAGCTAAGTGCGCAGCCGATGAGGCTAAGGAGGTGCGTGAAGCCGAGGAGTTGCGCGCAGCTCTACCACCTTTGGCAGCTGATGTTGAGGAGCCCACTCTGGAAGCCGATGTCGACTTGATGTTACAAGAGGCTGGGGCCGGCTCAGTGGAGACACCTCGTGGCTTGATAAAGGTTACCAGCTACGATGGCGAGGACAAGATCGGCTCTTACGCTGTGCTTTCTCCGCAGGCTGTACTCAAGAGTGAAAAATTATCTTGCATCCACCCTCTCGCTGAACAAGTCATAGTGATAACACACTCTGGCCGAAAAGGGCGTTATGCCGTGGAACCATACCATGGTAAAGTAGTGGTGCCAGAGGGACATGCAATACCCGTCCAGGACTTTCAAGCTCTGAGTGAAAGTGCCACCATTGTGTACAACGAACGTGAGTTCGTAAACAGGTACCTGCACCATATTGCCACACATGGAGGAGCGCTGAACACTGATGAAGAATATTACAAAACTGTCAAGCCCAGCGAGCACGACGGCGAATACCTGTACGACATCGACAGGAAACAGTGCGTCAAGAAAGAACTAGTCACTGGGCTAGGGCTCACAGGCGAGCTGGTGGATCCTCCCTTCCATGAATTCGCCTACGAGAGTCTGAGAACACGACCAGCCGCTCCTTACCAAGTACCAACCATAGGGGTGTATGGCGTGCCAGGATCAGGCAAGTCTGGCATCATTAAAAGCGCAGTCACCAAAAAAGATCTAGTGGTGAGCGCCAAGAAAGAAAACTGTGCAGAAATTATAAGGGACGTCAAGAAAATGAAAGGGCTGGACGTCAATGCCAGAACTGTGGACTCAGTGCTCTTGAATGGATGCAAACACCCCGTAGAGACCCTGTATATTGACGAAGCTTTTGCTTGTCATGCAGGTACTCTCAGAGCGCTCATAGCCATTATAAGACCTAAAAAGGCAGTGCTCTGCGGGGATCCCAAACAGTGCGGTTTTTTTAACATGATGTGCCTGAAAGTGCATTTTAACCACGAGATTTGCACACAAGTCTTCCACAAAAGCATCTCTCGCCGTTGCACTAAATCTGTGACTTCGGTCGTCTCAACCTTGTTTTACGACAAAAAAATGAGAACGACGAATCCGAAAGAGACTAAGATTGTGATTGACACTACCGGCAGTACCAAACCTAAGCAGGACGATCTCATTCTCACTTGTTTCAGAGGGTGGGTGAAGCAGTTGCAAATAGATTACAAAGGCAACGAAATAATGACGGCAGCTGCCTCTCAAGGGCTGACCCGTAAAGGTGTGTATGCCGTTCGGTACAAGGTGAATGAAAATCCTCTGTACGCACCCACCTCAGAACATGTGAACGTCCTACTGACCCGCACGGAGGACCGCATCGTGTGGAAAACACTAGCCGGCGACCCATGGATAAAAACACTGACTGCCAAGTACCCTGGGAATTTCACTGCCACGATAGAGGAGTGGCAAGCAGAGCATGATGCCATCATGAGGCACATCTTGGAGAGACCGGACCCTACCGACGTCTTCCAGAATAAGGCAAACGTGTGTTGGGCCAAGGCTTTAGTGCCGGTGCTGAAGACCGCTGGCATAGACATGACCACTGAACAATGGAACACTGTGGATTATTTTGAAACGGACAAAGCTCACTCAGCAGAGATAGTATTGAACCAACTATGCGTGAGGTTCTTTGGACTCGATCTGGACTCCGGTCTATTTTCTGCACCCACTGTTCCGTTATCCATTAGGAATAATCACTGGGATAACTCCCCGTCGCCTAACATGTACGGGCTGAATAAAGAAGTGGTCCGTCAGCTCTCTCGCAGGTACCCACAACTGCCTCGGGCAGTTGCCACTGGAAGAGTCTATGACATGAACACTGGTACACTGCGCAATTATGATCCGCGCATAAACCTAGTACCTGTAAACAGAAGACTGCCTCATGCTTTAGTCCTCCACCATAATGAACACCCACAGAGTGACTTTTCTTCATTCGTCAGCAAATTGAAGGGCAGAACTGTCCTGGTGGTCGGGGAAAAGTTGTCCGTCCCAGGCAAAATGGTTGACTGGTTGTCAGACCGGCCTGAGGCTACCTTCAGAGCTCGGCTGGATTTAGGCATCCCAGGTGATGTGCCCAAATATGACATAATATTTGTTAATGTGAGGACCCCATATAAATACCATCACTATCAGCAGTGTGAAGACCATGCCATTAAGCTTAGCATGTTGACCAAGAAAGCTTGTCTGCATCTGAATCCCGGCGGAACCTGTGTCAGCATAGGTTATGGTTACGCTGACAGGGCCAGCGAAAGCATCATTGGTGCTATAGCGCGGCAGTTCAAGTTTTCCCGGGTATGCAAACCGAAATCCTCACTTGAAGAGACGGAAGTTCTGTTTGTATTCATTGGGTACGATCGCAAGGCCCGTACGCACAATTCTTACAAGCTTTCATCAACCTTGACCAACATTTATACAGGTTCCAGACTCCACGAAGCCGGATGTGCACCCTCATATCATGTGGTGCGAGGGGATATTGCCACGGCCACCGAAGGAGTGATTATAAATGCTGCTAACAGCAAAGGACAACCTGGCGGAGGGGTGTGCGGAGCGCTGTATAAGAAATTCCCGGAAAGCTTCGATTTACAGCCGATCGAAGTAGGAAAAGCGCGACTGGTCAAAGGTGCAGCTAAACATATCATTCATGCCGTAGGACCAAACTTCAACAAAGTTTCGGAGGTTGAAGGTGACAAACAGTTGGCAGAGGCTTATGAGTCCATCGCTAAGATTGTCAACGATAACAATTACAAGTCAGTAGCGATTCCACTGTTGTCCACCGGCATCTTTTCCGGGAACAAAGATCGACTAACCCAATCATTGAACCATTTGCTGACAGCTTTAGACACCACTGATGCAGATGTAGCCATATACTGCAGGGACAAGAAATGGGAAATGACTCTCAAGGAAGCAGTGGCTAGGAGAGAAGCAGTGGAGGAGATATGCATATCCGACGACTCTTCAGTGACAGAACCTGATGCAGAGCTGGTGAGGGTGCATCCGAAGAGTTCTTTGGCTGGAAGGAAGGGCTACAGCACAAGCGATGGCAAAACTTTCTCATATTTGGAAGGGACCAAGTTTCACCAGGCGGCCAAGGATATAGCAGAAATTAATGCCATGTGGCCCGTTGCAACGGAGGCCAATGAGCAGGTATGCATGTATATCCTCGGAGAAAGCATGAGCAGTATTAGGTCGAAATGCCCCGTCGAAGAGTCGGAAGCCTCCACACCACCTAGCACGCTGCCTTGCTTGTGCATCCATGCCATGACTCCAGAAAGAGTACAGCGCCTAAAAGCCTCACGTCCAGAACAAATTACTGTGTGCTCATCCTTTCCATTGCCGAAGTATAGAATCACTGGTGTGCAGAAGATCCAATGCTCCCAGCCTATATTGTTCTCACCGAAAGTGCCTGCGTATATTCATCCAAGGAAGTATCTCGTGGAAACACCACCGGTAGACGAGACTCCGGAGCCATCGGCAGAGAACCAATCCACAGAGGGGACACCTGAACAACCACCACTTATAACCGAGGATGAGACCAGGACTAGAACGCCTGAGCCGATCATCATCGAAGAGGAAGAAGAGGATAGCATAAGTTTGCTGTCAGATGGCCCGACCCACCAGGTGCTGCAAGTCGAGGCAGACATTCACGGGCCGCCCTCTGTATCTAGCTCATCCTGGTCCATTCCTCATGCATCCGACTTTGATGTGGACAGTTTATCCATACTTGACACCCTGGAGGGAGCTAGCGTGACCAGCGGGGCAACGTCAGCCGAGACTAACTCTTACTTCGCAAAGAGTATGGAGTTTCTGGCGCGACCGGTGCCTGCGCCTCGAACAGTATTCAGGAACCCTCCACATCCCGCTCCGCGCACAAGAACACCGTCACTTGCACCCAGCAGGGCCTGCTCGAGAACCAGCCTAGTTTCCACCCCGCCAGGCGTGAATAGGGTGATCACTAGAGAGGAGCTCGAGGCGCTTACCCCGTCACGCACTCCTAGCAGGTCGGTCTCGAGAACCAGCCTGGTCTCCAACCCGCCAGGCGTAAATAGGGTGATTACAAGAGAGGAGTTTGAGGCGTTCGTAGCACAACAACAATGACGGTTTGATGCGGGTGCATACATCTTTTCCTCCGACACCGGTCAAGGGCATTTACAACAAAAATCAGTAAGGCAAACGGTGCTATCCGAAGTGGTGTTGGAGAGGACCGAATTGGAGATTTCGTATGCCCCGCGCCTCGACCAAGAAAAAGAAGAATTACTACGCAAGAAATTACAGTTAAATCCCACACCTGCTAACAGAAGCAGATACCAGTCCAGGAAGGTGGAGAACATGAAAGCCATAACAGCTAGACGTATTCTGCAAGGCCTAGGGCATTATTTGAAGGCAGAAGGAAAAGTGGAGTGCTACCGAACCCTGCATCCTGTTCCTTTGTATTCATCTAGTGTGAACCGTGCCTTTTCAAGCCCCAAGGTCGCAGTGGAAGCCTGTAACGCCATGTTGAAAGAGAACTTTCCGACTGTGGCTTCTTACTGTATTATTCCAGAGTACGATGCCTATTTGGACATGGTTGACGGAGCTTCATGCTGCTTAGACACTGCCAGTTTTTGCCCTGCAAAGCTGCGCAGCTTTCCAAAGAAACACTCCTATTTGGAACCCACAATACGATCGGCAGTGCCTTCAGCGATCCAGAACACGCTCCAGAACGTCCTGGCAGCTGCCACAAAAAGAAATTGCAATGTCACGCAAATGAGAGAATTGCCCGTATTGGATTCGGCGGCCTTTAATGTGGAATGCTTCAAGAAATATGCGTGTAATAATGAATATTGGGAAACGTTTAAAGAAAACCCCATCAGGCTTACTGAAGAAAACGTGGTAAATTACATTACCAAATTAAAAGGACCAAAAGCTGCTGCTCTTTTTGCGAAGACACATAATTTGAATATGTTGCAGGACATACCAATGGACAGGTTTGTAATGGACTTAAAGAGAGACGTGAAAGTGACTCCAGGAACAAAACATACTGAAGAACGGCCCAAGGTACAGGTGATCCAGGCTGCCGATCCGCTAGCAACAGCGTATCTGTGCGGAATCCACCGAGAGCTGGTTAGGAGATTAAATGCGGTCCTGCTTCCGAACATTCATACACTGTTTGATATGTCGGCTGAAGACTTTGACGCTATTATAGCCGAGCACTTCCAGCCTGGGGATTGTGTTCTGGAAACTGACATCGCGTCGTTTGATAAAAGTGAGGACGACGCCATGGCTCTGACCGCGTTAATGATTCTGGAAGACTTAGGTGTGGACGCAGAGCTGTTGACGCTGATTGAGGCGGCTTTCGGCGAAATTTCATCAATACATTTGCCCACTAAAACTAAATTTAAATTCGGAGCCATGATGAAATCTGGAATGTTCCTCACACTGTTTGTGAACACAGTCATTAACATTGTAATCGCAAGCAGAGTGTTGAGAGAACGGCTAACCGGATCACCATGTGCAGCATTCATTGGAGATGACAATATCGTGAAAGGAGTCAAATCGGACAAATTAATGGCAGACAGGTGCGCCACCTGGTTGAATATGGAAGTCAAGATTATAGATGCTGTGGTGGGCGAGAAAGCGCCTTATTTCTGTGGAGGGTTTATTTTGTGTGACTCCGTGACCGGCACAGCGTGCCGTGTGGCAGACCCCCTAAAAAGGCTGTTTAAGCTTGGCAAACCTCTGGCAGCAGACGATGAACATGATGATGACAGGAGAAGGGCATTGCATGAAGAGTCAACACGCTGGAACCGAGTGGGTATTCTTTCAGAGCTGTGCAAGGCAGTAGAATCAAGGTATGAAACCGTAGGAACTTCCATCATAGTTATGGCCATGACTACTCTAGCTAGCAGTGTTAAATCATTCAGCTACCTGAGAGGGGCCCCTATAACTCTCTACGGCTAACCTGAATGGACTACGACATAGTCTAGTCCGCCAAGTCTAGCATATGGCCACC [서열번호 94]----------GOI----------CGGAGACGGCGCAGAAGAAGAGGATCTGGCGAAGGCAGAGGCAGCCTGCTTACATGTGGCGACGTGGAAGAGAACCCCGGACCTATGCACCAGAAACGGACCGCCATGTTCCAGGATCCTCAAGAGAGGCCCAGAAAGCTGCCTCAGCTGTGTACCGAGCTGCAGACCACCATCCACGACATCATCCTGGAATGCGTGTACTGCAAGCAGCAGCTCCTGCGGAGAGAGGTGTACGATTTCGCCTTCCGGGACCTGTGCATCGTGTACAGAGATGGCAACCCCTACGCCGTGTGCGACAAGTGCCTGAAGTTCTACAGCAAGATCAGCGAGTACCGGCACTACTGCTACAGCCTGTACGGCACCACACTGGAACAGCAGTACAACAAGCCCCTGTGCGACCTGCTGATCCGGTGCATCAACTGCCAGAAACCTCTGTGCCCCGAGGAAAAGCAGCGGCACCTGGACAAGAAGCAGCGGTTCCACAACATCAGAGGCCGGTGGACCGGCAGATGCATGAGCTGTTGTCGGAGCAGCAGAACCAGACGGGAAACCCAGCTGTGAGCGGCCGCGAATTGGCAAGCTGCTTACATAGAACTCGCGGCGATTGGCATGCCGCCTTAAAATTTTTATTTTATTTTTCTTTTCTTTTCCGAATCGGATTTTGTTTTTAATATTTCAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAACGCGTCGAGGGGAATTAATTCTTGAAGACGAAAGGGCCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTATGAGTATTCAACATTTCCGTGTCGCCCTTATTCCCTTTTTTGCGGCATTTTGCCTTCCTGTTTTTGCTCACCCAGAAACGCTGGTGAAAGTAAAAGATGCTGAAGATCAGTTGGGTGCACGAGTGGGTTACATCGAACTGGATCTCAACAGCGGTAAGATCCTTGAGAGTTTTCGCCCCGAAGAACGTTTTCCAATGATGAGCACTTTTAAAGTTCTGCTATGTGGCGCGGTATTATCCCGTGTTGACGCCGGGCAAGAGCAACTCGGTCGCCGCATACACTATTCTCAGAATGACTTGGTTGAGTACTCACCAGTCACAGAAAAGCATCTTACGGATGGCATGACAGTAAGAGAATTATGCAGTGCTGCCATAACCATGAGTGATAACACTGCGGCCAACTTACTTCTGACAACGATCGGAGGACCGAAGGAGCTAACCGCTTTTTTGCACAACATGGGGGATCATGTAACTCGCCTTGATCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAACGACGAGCGTGACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCATTGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGAGCTC [서열번호 459]
따라서, 바람직하게는 상기 벡터는 실질적으로 서열번호 94, GOI, 및 서열번호 459를 포함하거나 이로 이루어지는 상기 나타낸 것과 같은 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
본 발명의 saRNA 구조체는 주형으로서 DNA 플라스미드를 이용해 만들어질 수 있다. 이후, RNA 사본(copy)은 폴리머라아제, 예컨대 T7 폴리머라아제를 이용한 시험관내 전사에 의해 만들어질 수 있고, 상기 T7 프로모터는 saRNA의 상류일 수 있다. 그러므로, 본 발명의 saRNA 구조체는 주형으로서 실질적으로 서열번호 94, GOI, 및 서열번호 459를 포함하거나 이로 이루어지는 상기 나타낸 것과 같은 핵산 서열, 또는 그의 변이체 또는 단편을 갖는 DNA 플라스미드를 이용해 만들어질 수 있다. 물론, 다른 RNA 폴리머라아제, 예를 들면 SP6 또는 T3 폴리머라아제가 T7 폴리머라아제 대신에 사용될 수 있음이 인식될 것이며, 이 경우 상기 saRNA 구조체는 대신에 SP6 또는 T3 프로모터를 포함할 수 있다.
제1 측면의 RNA 구조체를 암호화하는 제4 측면의 벡터는 예를 들면 플라스미드, 코스미드(cosmid) 또는 파지(phage)이거나, 및/또는 바이러스 벡터일 수 있다. 이러한 재조합 벡터는 세포를 뉴클레오티드 서열로 형질전환하기 위한 본 발명의 운반 시스템에서 매우 유용하다. 상기 뉴클레오티드 서열은 바람직하게는 DNA 서열일 수 있고, 상기 DNA 서열이 제1 측면의 RNA 구조체를 형성하는 RNA 서열을 암호화한다.
제1 측면의 RNA 구조체를 암호화하는 재조합 벡터는 또한 다른 기능적 요소를 포함할 수 있다. 예를 들면, 재조합 벡터는 숙주 세포에서 벡터의 도입시 전이유전자 발현을 시작하기 위한 적합한 프로모터를 포함하는 다양한 다른 기능적 요소를 추가로 포함할 수 있다. 예를 들어, 상기 벡터는 바람직하게는 숙주 세포, 예컨대 박테리아 세포의 핵에서 자발적으로 복제할 수 있다. 이 경우, DNA 복제를 유도 또는 조절하는 요소가 상기 재조합 벡터에 필요할 수 있다. 대안적으로, 상기 재조합 벡터는 숙주 세포의 게놈 내로 통합되도록 디자인될 수 있다. 이 경우, (예컨대 상동성 재조합에 의한) 표적화된 통합에 유리한 DNA 서열이 예측된다. 적합한 프로모터는 예로서 SV40 프로모터, CMV, EF1a, PGK, 바이러스 긴 말단 반복뿐만 아니라 유도가능한 프로모터, 예컨대 테트라사이클린 유도가능한 시스템을 포함할 수 있다. 상기 카세트 또는 벡터는 또한 종결자(terminator), 예컨대 베타 글로빈, SV40 폴리아데닐화 서열 또는 합성 폴리아데닐화 서열을 포함할 수 있다. 상기 재조합 벡터는 또한 필요시 핵산의 발현을 제어하기 위한 프로모터 또는 조절자 또는 인핸서(enhancer)를 포함할 수 있다.
상기 벡터는 또한 형질감염(transfection) 또는 형질전환(transformation)된 세포의 선택을 가능하게 하고, 이종성 DNA가 통합된 벡터를 갖고 있는 세포의 선택을 가능하게 하는 클로닝 공정에서 선택가능한 마커로서 사용될 수 있는 유전자를 코딩하는 DNA를 포함할 수 있다. 예를 들면, 암피실린, 네오마이신, 푸로마이신 또는 클로람페니콜 저항성이 예측된다. 대안적으로, 상기 선택가능한 마커 유전자는 전이유전자(들)를 함유하는 벡터와 동시에 사용될 수 있는 상이한 벡터에 있을 수 있다. 상기 카세트 또는 벡터는 또한 뉴클레오티드 서열의 발현을 조절하거나, 발현된 폴리펩티드를 숙주 세포의 소정 부분으로 표적화하는데 관여되는 DNA를 포함할 수 있다.
정제된 벡터는 적합한 수단, 예컨대 직접 식작용 섭취(endocytotic uptake)에 의해 숙주 세포 내로 직접적으로 삽입될 수 있다. 상기 벡터는 형질감염, 감염, 전기천공, 미세주사, 세포 융합, 원형질체 융합 또는 탄도적 충격(ballistic bombardment)에 의해 숙주 세포(예컨대, 진핵생물 또는 원핵생물 세포) 내로 직접 도입될 수 있다. 대안적으로, 본 발명의 벡터는 입자 총을 이용해 숙주 세포 내로 직접 도입될 수 있다.
상기 핵산 분자는 (필수적인 것은 아니지만) 숙주 세포의 DNA에 통합되게 되는 것일 수 있다. 미분화된 세포는 인정적으로 형질전환되어 유전적으로 변형된 딸세포의 생산을 유도할 수 있다(이 경우, 예컨대 특정 전사 인자 또는 유전자 활성화제를 이용한 대상체에서의 발현의 조절이 필요할 수 있다). 대안적으로, 상기 운반 시스템은 분화된 세포의 불안정하거나 일시적인 형질전환을 선호하도록 디자인될 수 있다. 이 경우일 때는 발현의 조절이 덜 중요할 수 있는데, 그 이유는 형질전환된 세포가 죽거나 단백질의 발현을 중단할 때 상기 DNA 분자의 발현이 중단될 것이기 때문이다.
대안적으로, 상기 운반 시스템은 벡터에 통합되지 않고 숙주 세포에 핵산 분자를 제공할 수 있다. 예를 들어, 상기 핵산 분자는 리포좀 또는 바이러스 입자 내에 통합될 수 있다. 대안적으로, "네이키드(naked)" 핵산 분자가 적합한 수단, 예컨대 직접 식작용 섭취에 의해 숙주 세포 내로 삽입될 수 있다.
제5 측면에서, 제1 측면의 RNA 구조체, 제2 측면의 핵산 서열, 제3 측면의 발현 카세트 또는 제4 측면의 벡터, 및 약학적으로 허용가능한 비히클(vehicle)을 포함하는 약학적 조성물이 제공된다.
제6 측면에서, 제5 측면에 따른 약학적 조성물을 제조하기 위한 공정이 제공되며, 상기 방법은 제1 측면의 RNA 구조체, 제2 측면의 핵산 서열, 제3 측면의 발현 카세트 또는 제4 측면의 벡터를 약학적으로 허용가능한 비히클과 접촉시키는 단계를 포함한다.
제7 측면에서, 제1 측면의 RNA 구조체의 제조 방법이 제공되며, 상기 방법은
a) ⅰ) 숙주 세포 내로 제4 측면의 벡터를 도입하는 단계; 및
ⅱ) 제1 측면의 RNA 구조체의 생산을 야기하기 위한 조건 하에 상기 숙주 세포를 배양하는 단계를 포함하거나; 또는
b) 제4 측면에 따른 벡터로부터 RNA 구조체를 전사하는 단계를 포함한다.
단계 a)의 숙주 세포는 진핵생물 또는 원핵생물 숙주 세포일 수 있다. 바람직하게는, 상기 숙주 세포는 진핵생물 숙주 세포이다. 보다 바람직하게는, 상기 숙주 세포는 포유동물 숙주 세포, 예컨대 인간 배아 신장 293 세포 또는 중국 햄스터 난소(CHO) 세포이다. 단계 (b)는 시험관내 또는 생체내에서, 바람직하게는 시험관내에서 수행될 수 있다.
시험관내 전사의 적합한 방법은 본 기술분야에 잘 알려져 있으며, 본 기술분야의 기술자에게 알려져 있을 것이다. 예를 들면, [Molecular Cloning, A Laboratory Manual, 2nd edition. (1989) editor C Nolan, Cold Spring Harbor Laboratory Press]에 기술되어 있다.
제1 측면의 RNA 레플리콘은 치료법용으로 특히 적합하다.
본 발명자들은 제1 측면의 RNA 구조체가 치료법에서 생체내에서 사용하기 위해 시험관내 전사에 의해 생성될 것으로 예측했지만, 본 기술분야의 숙련자는 상기 RNA 구조체는 제2 측면에 따른 핵산, 제3 측면에 따른 발현 카세트, 제4 측면에 따른 벡터를 대상체에게 생체내 운반함으로써 치료법을 위해 대상체에서 생체내에서 생성될 수 있음을 인식할 것이다.
그러므로, 제8 측면에 따르면, 약제로서 또는 치료법에서 사용하기 위한 제1 측면에 따른 RNA 구조체, 제2 측면에 따른 핵산, 제3 측면에 따른 발현 카세트, 제4 측면에 따른 벡터 또는 제5 측면에 따른 약학적 조성물이 제공된다.
본 발명의 제9 측면에서, 원생동물, 진균, 박테리아 또는 바이러스 감염의 예방, 개선 또는 치료에 사용하기 위한 제1 측면에 따른 RNA 구조체, 제2 측면에 따른 핵산, 제3 측면에 따른 발현 카세트, 제4 측면에 따른 벡터 또는 제5 측면에 따른 약학적 조성물이 제공된다.
상기 원생동물, 진균, 박테리아 또는 바이러스 감염은 제1 측면에서 정의된 것과 같은 원생동물, 진균, 박테리아 또는 바이러스의 감염일 수 있다.
본 발명의 제10 측면에서, 암의 예방, 개선 또는 치료에 사용하기 위한 제1 측면에 따른 RNA 구조체, 제2 측면에 따른 핵산, 제3 측면에 따른 발현 카세트, 제4 측면에 따른 벡터 또는 제5 측면에 따른 약학적 조성물이 제공된다.
상기 암은 제1 측면에서 정의된 것일 수 있다.
본 발명의 제11 측면에서, 원생동물, 진균, 박테리아 또는 바이러스 감염을 치료하기 위한 방법이 제공되며, 상기 방법은 이를 필요로 하는 대상체에게, 치료적 유효량의 제1 측면에 따른 RNA 구조체, 제2 측면에 따른 핵산, 제3 측면에 따른 발현 카세트, 제4 측면에 따른 벡터 또는 제5 측면에 따른 약학적 조성물을 투여하는 단계를 포함한다.
치료되어야 하는 원생동물, 진균, 박테리아 또는 바이러스 감염은 제1 측면에서 정의된 것과 같은 원생동물, 진균, 박테리아 또는 바이러스의 감염일 수 있다.
본 발명의 제12 측면에서, 암을 치료하기 위한 방법이 제공되며, 상기 방법은 이를 필요로 하는 대상체에게 치료적 유효량의 제1 측면에 따른 RNA 구조체, 제2 측면에 따른 핵산, 제3 측면에 따른 발현 카세트, 제4 측면에 따른 벡터 또는 제5 측면에 따른 약학적 조성물을 투여하는 단계를 포함한다.
치료되어야 하는 암은 제1 측면에서 정의된 것일 수 있다.
본 명세서에 기술된 RNA 구조체는 (예컨대, 바이러스, 박테리아 또는 진균 감염에 대해) 대상체 및 암을 백신화하는 효과적인 수단을 제공한다.
따라서, 본 발명의 제13 측면에서, 제1 측면에 따른 RNA 구조체, 제2 측면에 따른 핵산, 제3 측면에 따른 발현 카세트, 제4 측면에 따른 벡터 또는 제5 측면에 따른 약학적 조성물를 포함하는 백신이 제공된다.
운반 제형 내로 통합된 어주번트(adjuvant)는 박테리아 지질펩티드, 지질단백질 및 리포테이코산; 마이코박테리아 지질글리칸; 효모 자이모산, 포린, 지질폴리사카라이드, 지질 A, 모노포스포릴 지질 A(MPL), 플라젤린, CpG DNA, 헤모조인, 토마틴, ISCOM, ISCOMATRIXTM, 스쿠알렌계 에멀전, 폴리머, 예컨대 PEI, 카르보폴, 지질 나노입자 및 박테리아 독소(CT, LT)로 이루어진 군으로부터 선택될 수 있다. 운반 제형 내로 통합된 어주번트의 다른 예는 알루미늄 염, 합성 형태의 DNA, 탄수화물, 정제 결합제, 이온 교환 수지, 보존제, 폴리머, 에멀전 및/또는 지질을 포함할 수 있다. 어주번트의 예는 일나트륨 글루타메이트, 수크로오스, 덱스트로오스, 알루미늄 소, 인간 혈청 알부민, 시토신 포스포구아닌, 인산칼륨, 플라스돈 C, 무수 락토오스, 셀룰로오스, 폴라크릴린 칼륨, 글리세린, 아스파라긴, 시트르산, 인산칼륨 황산마그네슘, 철 암모늄 시트레이트, 2-페녹시에탄올, 알루미늄, 베타-프로피오락톤, 소 추출물, DOPC, EDTA, 포름알데히드, 티메로살, 페놀, 칼륨 알루미늄 설페이트, 글루탐산칼륨, 붕산나트륨, 나트륨 메타비설파이트, 우레아, PLGA, PVA, PLA, PVP, 시클로덱스트린계 안정화제, 수중유(oil in water) 에멀전 어주번트 및/또는 지질계 어주번트를 포함할 수 있다.
본 발명의 제14 측면에서, 대상체에서 면역 반응을 자극하는데 사용하기 위한 제1 측면에 따른 RNA 구조체, 제2 측면에 따른 핵산, 제3 측면에 따른 발현 카세트, 제4 측면에 따른 벡터 또는 제5 측면에 따른 약학적 조성물이 제공된다.
상기 면역 반응은 제1 측면에서 정의된 항원에 다른 원생동물, 박테리아, 바이러스, 진균 또는 암에 대해 자극될 수 있다.
다른 측면에서, 대상체를 백신화하는 방법이 제공되며, 상기 방법은 이를 필요로 하는 대상체에게 치료적 유효량의 제1 측면에 따른 RNA 구조체, 제2 측면에 따른 핵산, 제3 측면에 따른 발현 카세트, 제4 측면에 따른 벡터 또는 제5 측면에 따른 약학적 조성물을 투여하거나, 투여한 단계를 포함한다.
제15 측면에 따르면, 줄기 세포 치료법에서 사용하기 위한 제1 측면에 따른 RNA 구조체, 제2 측면에 따른 핵산, 제3 측면에 따른 발현 카세트, 제4 측면에 따른 벡터 또는 제5 측면에 따른 약학적 조성물이 제공된다.
줄기 세포 치료법은 체세포를 줄기 세포 특징을 갖는 세포로 재프로그래밍하는 것에 관한 것일 수 있다.
체세포는 제1 측면에서 정의된 것과 같은 줄기 세포 특징을 갖는 세포로 체세포를 재프로그래밍 하는 것을 향상시킬 수 있는 하나 이상의 단백질을 운반함으로써 재프로그래밍될 수 있다.
제16 측면에 따르면, 제1 측면에 따른 RNA 구조체, 제2 측면에 따른 핵산, 제3 측면에 따른 발현 카세트, 제4 측면에 따른 벡터 또는 제5 측면에 따른 약학적 조성물을 세포로 운반하는 단계를 포함하는 생체외 또는 시험관내에서 세포를 변형시키는 방법이 제공된다.
바람직하게는, 상기 방법은 생체외에서 수행된다.
상기 세포는 진핵생물 또는 원핵생물 세포일 수 있다. 바람직하게는, 상기 세포는 진핵생물 세포이다. 보다 바람직하게는, 상기 세포는 포유동물 숙주 세포이다. 가장 바람직하게는, 상기 세포는 인간 세포이다.
바람직하게는, 상기 변형된 세포는 세포-치료법 적응증을 위해 적합하다.
제17 측면에서, 제16 측면의 방법으로부터 수득되거나 이것에 의해 수득가능한 변형된 세포가 제공된다.
제18 측면에서, 치료법, 선택적으로 세포 치료법에서 사용하기 위한 제17 측면의 변형된 세포가 제공된다.
제1 측면에 따른 RNA 구조체, 제2 측면에 따른 핵산, 제3 측면에 따른 발현 카세트, 제4 측면에 따른 벡터 또는 제5 측면에 따른 약학적 조성물(본 명세서에서 활성제로 알려짐)이 질환을 치료, 개선, 또는 예방하거나 백신화하기 위한 단일치료법(즉, 상기 활성제의 사용)으로서 사용될 수 있는 약제에서 사용될 수 있음이 인식될 것이다. 대안적으로, 본 발명에 따른 활성제는 질환의 치료, 개선, 또는 예방을 위해 알려진 치료법에 부가하여, 또는 이와 조합하여 사용될 수 있다.
본 발명의 RNA 구조체, 핵산 서열, 발현 카세트, 벡터 또는 약학적 조성물은 특히 조성물이 사용되어야 하는 방식에 따라 다수의 상이한 형태를 갖는 조성물에 조합될 수 있다. 따라서, 예를 들면, 상기 조성물은 분말, 정제, 캡슐, 액체, 연고, 크림, 겔, 히드로겔, 에어로졸, 스프레이, 미셀 용액, 경피 패치, 리포좀 현탁액, 폴리플렉스, 에멀전, (표면에 RNA를 갖거나 캡슐화된) 지질 나노입자의 형태 또는 치료 또는 백신화를 필요로 하는 인간 또는 동물에게 투여될 수 있는 임의의 다른 적합한 형태일 수 있다. 본 발명에 따른 약제의 비히클은 이것이 제공되는 대상체에 의해 잘-용인되는 것이어야 함이 인식될 것이다.
본 발명의 RNA 구조체, 핵산 서열, 발현 카세트, 벡터 또는 약학적 조성물은 또한 느린-또는 지연된-방출 장치 내에 통합될 수 있다. 이러한 장치는, 예를 들면, 피부 위 또는 아래에 삽입될 수 있고, 상기 약제는 수 주 또는 심지어 수 개월에 걸쳐 방출될 수 있다. 상기 장치는 치료 부위와 적어도 인접하게 위치될 수 있다. 이러한 장치는 상기 RNA 구조체 또는 재조합 벡터를 이용한 장기간의 치료가 필요하고 정상적으로 빈번한 투여(예컨대, 적어도 매일 주사)가 필요할 때 특히 유리할 수 있다.
그러나, 바람직한 구현예에서, 본 발명에 따른 약제는 혈류, 근육, 피부 내로, 또는 치료를 필요로 하는 부위 내로 직접 주사함으로써 대상체에게 투여될 수 있다. 가장 바람직하게는, 상기 RNA 구조체를 포함하는 약제는 근육 내로 주사된다. 주사는 정맥내(볼루스 또는 수액) 또는 피하(볼루스 또는 수액), 또는 진피내(볼루스 또는 수액), 또는 근육내(볼루스 또는 수액)일 수 있다.
필요한 RNA 구조체, 핵산 서열, 발현 카세트, 벡터 또는 약학적 조성물의 양은 그 생물학적 활성 및 생체이용성에 의해 결정되고, 차례로 상기 RNA 구조체, 핵산 서열, 발현 카세트, 벡터 또는 약학적 조성물의 투여 방식, 물리화학적 특성 및 단일치료법 또는 조합 치료법으로 사용되는지 여부에 의존할 것임이 인식될 것이다. 투여의 빈도는 또한 치료되는 대상체 내에서 상기 활성제의 반감기에 의해 영향을 받을 것이다. 투여되어야 하는 최적의 복용량은 본 기술분야의 기술자에 의해 결정될 수 있고, 사용되는 특정 RNA 구조체, 핵산 서열, 발현 카세트, 벡터 또는 약학적 조성물, 약학적 조성물의 강도, 투여 방식, 및 바이러스 감염의 타입 및 진행에 따라 변할 것이다. 대상체의 연령, 중량, 성별, 식이, 및 투여 시간을 포함하는 치료되는 특정 대상체에 의존하는 부가적인 인자는 복용량을 조정할 필요성을 야기할 것이다.
일반적으로, 0.001 ㎍/㎏의 체중 내지 10 ㎎/㎏의 체중, 또는 0.01 ㎍/㎏의 체중 내지 1 ㎎/㎏의 체중의 본 발명의 RNA 구조체, 핵산 서열, 발현 카세트, 벡터 또는 약학적 조성물의 일일 용량이 사용되는 활성제에 따라 질환을 치료, 개선, 또는 예방하기 위해 사용될 수 있다.
일일 용량은 단일 투여(예컨대 단일 일일 주사 또는 코 스프레이의 흡입)로서 제공될 수 있다. 대안적으로, 상기 RNA 구조체, 핵산 서열, 발현 카세트, 벡터 또는 약학적 조성물은 하루 동안에 2회 이상의 투여가 필요할 수 있다. 예로서, 상기 RNA 구조체, 핵산 서열, 발현 카세트, 벡터 또는 약학적 조성물은 0.07 ㎍ 내지 700 ㎎(즉, 70 ㎏의 체중으로 추정함)의 2회(또는 치료되는 질환의 증세에 따라 그 이상)의 일일 용량으로 투여될 수 있다. 치료를 받는 환자는 기상시 제1 용량을, 이후 저녁(2회 용량 요법이라면)에 또는 이후에 3 또는 4시간 간격으로 제2 용량을 취할 수 있다. 대안적으로, 느린 방출 장치는 본 발명에 따른 RNA 구조체, 핵산 서열, 발현 카세트, 벡터 또는 약학적 조성물을 반복된 용량을 투여할 필요 없이 환자에게 최적의 용량을 제공하기 위해 사용될 수 있다.
그러나, 바람직하게는 본 발명에 따른 RNA 구조체, 핵산 서열, 발현 카세트, 벡터 또는 약학적 조성물은 매주 용량, 보다 바람직하게는 격주 용량으로 제공될 수 있다.
제약 산업에 의해 종래 도입되는 것들과 같은 공지된 절차(예컨대 생체내 실험, 임상 시험, 등)는 본 발명에 따른 RNA 구조체, 핵산 서열, 발현 카세트 또는 벡터의 구체적인 제형 및 정확한 치료 요법(예컨대, 제제의 일일 용량 및 투여 빈도)을 형성하기 위해 사용될 수 있다.
"대상체"는 척추동물, 포유동물, 또는 가축일 수 있다. 따라서, 본 발명에 따른 조성물 및 약제는 임의의 포유동물, 예를 들면 가축(예컨대, 말), 애완동물을 치료하기 dnlgo 사용될 수 있거나, 다른 수의과 적용분야에 사용될 수 있다. 그러나, 가장 바람직하게는, 상기 대상체는 인간이다.
상기 RNA 구조체, 핵산 서열, 발현 카세트, 벡터 또는 약학적 조성물의 "치료적 유효량"은 대상체에게 투여될 때 임의의 해당 질환을 개선, 예방 또는 치료하기 위해 필요한 전술한 양인 임의의 양이다.
예를 들면, 본 발명의 RNA 구조체, 핵산 서열, 발현 카세트, 벡터 또는 약학적 조성물은 약 0.0001 ㎎ 내지 약 800 ㎎, 바람직하게는 약 0.001 ㎎ 내지 약 500 ㎎으로 사용될 수 있다. 상기 레플리콘, 핵산 서열, 발현 카세트, 벡터 또는 약학적 조성물의 양은 약 0.01 ㎎ 내지 약 250 ㎎, 가장 바람직하게는 약 0.01 ㎎ 내지 약 1 ㎎의 양인 것이 바람직하다. 바람직하게는, 본 발명에 따른 RNA 구조체, 핵산 서열, 발현 카세트, 벡터 또는 약학적 조성물은 1-200 ㎍의 용량으로 투여된다.
본 명세서에서 나타낼 때, "약학적으로 허용가능한 비히클"은 약학적 조성물을 제형화하는데 유용하다고 본 기술분야의 기술자에게 알려진 임의의 공지된 화합물 또는 공지된 화합물들의 조합이다.
한 구현예에서, 상기 약학적으로 허용가능한 비히클은 고체일 수 있고, 상기 조성물은 분말 또는 정제의 형태일 수 있다. 고체인 약학적으로 허용가능한 비히클은 향미제, 윤활제, 가용화제, 현탁화제, 염료, 충진제, 활택제, 압착 보조제, 불활성 결합제, 감미제, 보존제, 염료, 코팅물, 또는 정제-붕괴제로서도 작용할 수 있는 하나 이상의 물질을 포함할 수 있다. 상기 비히클은 또한 캡슐화 물질일 수 있다. 분말에서, 상기 비히클은 본 발명에 따른 세분된 활성제와 혼합되는 세분된 고체이다. 정제에서, 상기 활성제(예컨대, 본 발명에 따른 RNA 구조체, 핵산 서열, 발현 카세트, 벡터 또는 약학적 조성물)는 필요한 압착 특성을 갖는 비히클과 적합한 비율로 혼합되고 원하는 형태 및 크기로 압착될 수 있다. 상기 분말 및 정제는 바람직하게는 상기 활성제를 최대 99%까지 함유한다. 적합한 고체 비히클은, 예를 들면 인산칼슘, 스테아르산마그네슘, 탈크, 당, 락토오스, 덱스트린, 전분, 젤라틴, 셀룰로오스, 폴리비닐피롤리돈, 저융점 왁스 및 이온 교환 수지를 포함한다. 다른 구현예에서, 상기 약학적 비히클은 겔일 수 있고, 상기 조성물은 크림 등의 형태일 수 있다.
그러나, 상기 약학적 비히클은 액체일 수 있고, 상기 약학적 조성물은 용액의 형태이다. 액체 비히클은 용액, 현탁액, 에멀전, 시럽, 엘릭시르 및 가압 조성물의 제조에 사용된다. 본 발명에 따른 RNA 구조체, 핵산 서열, 발현 카세트, 벡터 또는 약학적 조성물은 약학적으로 허용가능한 액체 비히클, 예컨대 물, 유기 용매, 이들의 혼합물 또는 약학적으로 허용가능한 오일 또는 지방에 용해 또는 현탁될 수 있다. 상기 액체 비히클은 다른 적합한 약학적 첨가제, 예컨대 가용화제, 에멀전화제, 버퍼, 보존제, 감미제, 향미제, 현탁화제, 증점제, 착색제, 점도 조절제, 안정화제 또는 삼투-조절제를 함유할 수 있다. 경구 및 비경구 투여를 위한 액체 비히클의 적합한 예는 (상기와 같은 첨가제, 예컨대 셀룰로오스 유도체, 바람직하게는 나트륨 카르복시메틸 셀룰로오스 용액을 부분적으로 함유하는) 물, (1가 알코올 및 다가 알코올, 예컨대 글리콜을 포함하는) 알코올 및 그의 유도체, 및 오일(예컨대 분획화된 코코넛 오일 및 아라키스 오일)을 포함한다. 비경구 투여의 경우, 상기 비히클은 또한 오일성 에스테르, 예컨대 에틸 올레에이트 및 이소프로필 미리스테이트일 수 있다. 멸균 액체 비히클은 비경구 투여용 멸균 액체 형태 조성물에서 유용하다. 가압 조성물을 위한 액체 비히클은 할로겐화 탄화수소 또는 다른 약학적으로 허용가능한 추진제(propellant)일 수 있다.
멸균 용액 또는 현탁액인 액체 약학적 조성물은, 예를 들면, 피하, 진피내, 척추강내, 경막외, 복강내, 정맥내, 특히 근육내 주사에 의해 이용될 수 있다. 본 발명의 핵산 서열, 또는 발현 카세트는 멸균수, 식염수, 또는 다른 적절한 멸균 주사가능한 매체를 이용하여 투여 시점에 용해 또는 현탁될 수 있는 멸균 고체 조성물로서 제조될 수 있다.
본 발명의 RNA 구조체, 핵산 서열, 발현 카세트, 벡터 또는 약학적 조성물은 다른 용질 또는 현탁화제(예를 들면, 용액이 등장이 되게 하기에 충분한 식염수 또는 글루코오스), 담즙 염, 아카시아, 젤라틴, 소르비탄 모노올레이이트, 폴리소르베이트 80(소르비톨의 올레에이트 에스테르 및 에틸렌 옥사이드로 공중합된 그의 무수물) 등을 함유하는 멸균 용액 또는 현탁액의 형태로 경구 투여될 수 있다. 본 발명에 따른 RNA 구조체, 핵산 서열, 발현 카세트, 벡터 또는 약학적 조성물은 또한 액체 또는 고체 조성물 형태로 경구 투여될 수 있다. 경구 투여용으로 적합한 조성물은 알약, 캡슐, 과립, 정제, 및 분말과 같은 고체 형태, 및 용액, 시럽, 엘릭시르, 및 현탁액과 같은 액체 형태를 포함한다. 비경구 투여를 위해 유용한 형태는 멸균 용액, 에멀전, 및 현탁액을 포함한다.
본 발명은 그의 변이체 또는 단편을 포함하여 실질적으로 본 명세서에 나타낸 임의의 서열의 아미노산 또는 핵산 서열을 포함하는 임의의 핵산 또는 펩티드 또는 그의 변이체, 유도체 또는 유사체로 확장됨이 인식될 것이다. 용어 "실질적으로 아미노산/뉴클레오티드/펩티드 서열", "변이체" 및 "단편"은 본 명세서에 나타낸 어느 한 서열의 아미노산/뉴클레오티드/펩티드 서열과 적어도 40% 서열 동일성(identity), 예를 들면 본명세서에서 확인된 임의의 서열과 40% 동일성을 갖는 서열일 수 있다.
나타낸 임의의 서열과 65% 이상, 보다 바람직하게는 70% 이상, 보다 더 바람직하게는 75% 이상의 서열 동일성, 보다 더 바람직하게는 80% 이상의 서열 동일성을 갖는 아미노산/폴리뉴클레오티드/폴리펩티드 서열이 또한 예측된다. 바람직하게는, 상기 아미노산/폴리뉴클레오티드/폴리펩티드 서열은 나타낸 임의의 서열과 적어도 85% 동일성, 보다 바람직하게는 적어도 90% 동일성, 보다 더 바람직하게는 적어도 92% 동일성, 보다 더 바람직하게는 적어도 95% 동일성, 보다 더 바람직하게는 적어도 97% 동일성, 보다 더 바람직하게는 적어도 98% 동일성, 가장 바람직하게는 본 명세서에 나타낸 임의의 서열과 적어도 99% 동일성을 갖는다.
숙련된 기술자는 2개의 아미노산/폴리뉴클레오티드/폴리펩티드 서열 사이에 동일성 백분율을 계산하는 방법을 인식할 것이다. 2개의 아미노산/폴리뉴클레오티드/폴리펩티드 서열 사이의 동일성 백분율을 계산하기 위하여, 상기 2개의 서열의 정렬이 먼저 준비되어야 하고, 이어서 서열 동일성 값을 계산한다. 2개의 서열에 대한 동일성 백분율은 다음에 따라 상이한 값을 취할 수 있다: (ⅰ) 서열을 정렬하기 위해 사용된 방법, 예를 들면, ClustalW, BLAST, FASTA, 스미스-워터맨(상이한 프로그램에서 실행됨), 또는 3D 비교로부터의 구조적 정렬; 및 (ⅱ) 정렬 방법에 의해 사용된 파라미터, 예를 들면, 국소 대 전체 정렬, 사용된 쌍별-점수 매트릭스(예컨대 BLOSUM62, PAM250, Gonnet 등), 및 갭-페널티, 예컨대 기능적 형태 및 상수.
정렬을 만든 후, 2개의 서열 사이에 동일성 백분율을 계산하는 많은 다양한 방식이 있다. 예를 들면, 동일성의 수를 다음에 의해 나눌 수 있다: (ⅰ) 가장 짧은 서열의 길이; (ⅱ) 정렬의 길이; (ⅲ) 서열의 평균 길이; (ⅳ) 비-갭 위치의 수; 또는 (ⅴ) 돌출부(overhang)를 배제한 등가물 위치의 수. 아울러, 동일성 백분율은 또한 매우 길이 의존성임이 인식될 것이다. 따라서, 서열의 쌍이 짧을수록 더 높은 서열 동일성이 우연히 일어날 것으로 예상할 수 있다.
그러므로, 단백질 또는 DNA 서열의 정확한 정렬은 복잡한 공정임이 인식될 것이다. 대중적인 다중 정렬 프로그램 ClustalW(Thompson et al., 1994, Nucleic Acids Research, 22, 4673-4680; Thompson et al., 1997, Nucleic Acids Research, 24, 4876-4882)는 본 발명에 따른 단백질 또는 DNA의 다중 정렬을 생성하기 위한 바람직한 방법이다. ClustalW에 대한 적합한 파라미터는 다음과 같을 수 있다: DNA 정렬의 경우: 갭 개방 페널티 = 15.0, 갭 연장 패널티 = 6.66, 및 매트릭스 = 동일성. 단백질 정렬의 경우: 갭 개방 페널티 = 10.0, 갭 연장 페널티 = 0.2, 및 매트릭스 = Gonnet. DNA 및 단백질 정렬의 경우: ENDGAP = -1, 및 GAPDIST = 4. 본 기술분야의 기술자는 최적의 서열 정렬을 위해서는 상기 및 다른 파라미터들을 변화시킬 필요가 있을 수 있음을 인식할 것이다.
바람직하게는, 2개의 아미노산/폴리뉴클레오티드/폴리펩티드 서열 사이의 동일성 백분율의 계산은 이후 이러한 정렬로부터 (N/T)×100으로서 계산될 수 있으며, 여기서 N은 서열이 동일한 잔기를 공유하는 위치의 수이고, T는 갭을 포함하고 돌출부를 포함하거나 배제한 비교된 위치의 총 수이다. 바람직하게는, 돌출부는 상기 계산에 포함된다. 따라서, 2개의 서열 사이의 동일성 백분율을 계산하기 위한 가장 바람직한 방법은 (ⅰ) 예를 들면, 상기에 나타낸 것과 같은 적합한 세트의 파라미터를 이용하여 ClustalW 프로그램을 이용하여 서열 정렬을 준비하는 단계; 및 (ⅱ) N 및 T의 값을 다음의 식: 서열 동일성 = (N/T)×100 내로 삽입하는 단계를 포함한다.
유사한 서열을 확인하기 위한 대안적인 방법은 본 기술분야의 기술자에게 알려질 것이다. 예를 들면, 실질적으로 유사한 뉴클레오티드 서열은 엄격한 조건 하에서 DNA 서열 또는 그의 상보체(complement)와 교잡하는 서열에 의해 암호화될 것이다. 엄격한 조건이란 것은, 본 발명자들은 뉴클레오티드가 대략 45℃에서 3× 염화나트륨/시트르산나트륨(SSC)과, 이어서 대략 20-65℃에서 0.2× SSC/0.1% SDS에서 적어도 1회의 세척 후 필터-결합된 DNA 또는 RNA에 혼성화하는 것을 의미한다. 대안적으로, 실질적으로 유사한 폴리펩티드는 본 명세서에 기술된 임의의 서열과 적어도 1개이지만, 5, 10, 20, 50 또는 100개 미만의 아미노산이 상이할 수 있다.
유전자 코드의 축퇴(degeneracy)로 인하여, 본 명세서에 기술된 임의의 핵산 서열은 이것에 의해 암호화된 단백질의 서열에 실질적으로 영향을 미치지 않으면서 다양해지거나 변화되어 그의 기능적 변이체를 제공할 수 있음이 명확하다. 적합한 뉴클레오티드 변이체는 서열 내에서 동일한 아미노산을 암호화하여 침묵적(동의적) 변화를 생산하는 상이한 코돈의 치환에 의해 변경된 서열을 갖는 것들이다. 다른 적합한 변이체는 상동성 뉴클레오티드 서열을 갖지만 치환되는 아미노산과 유사한 생물물리학적 특성의 측쇄를 갖는 아미노산을 암호화하는 상이한 코돈의 치환에 의해 변경되어 보존된 변화를 생산하는 서열의 전부 또는 일부를 포함하는 것들이다. 예를 들면, 작은 비극성의 소수성 아미노산은 글리신, 알라닌, 루이신, 이소루이신, 발린, 프롤린, 및 메티오닝을 포함한다. 큰 비극성의 소수성 아미노산은 페닐알라닌, 트립토판 및 티로신을 포함한다. 극성의 중성 아미노산은 세린, 트레오닌, 시스테인, 아스파라긴 및 글루타민을 포함한다. 양을 대전된(염기성) 아미노산은 리신, 아르기닌 및 히스티딘을 포함한다. 음으로 대전된(산성) 아미노산은 아스파르트산 및 글루탐산을 포함한다. 따라서, 어느 아미노산이 유사한 생물물리학적 특성을 갖는 아미노산으로 교체될 수 있음이 인식될 것이고, 숙련된 기술자는 상기 아미노산을 암호화하는 뉴클레오티드 서열을 알 것이다.
(임의의 부속 청구항, 요약 및 도면을 포함하는) 본 명세서에 기술된 모든 특성들 및/또는 여기에 개시된 임의의 방법 또는 공정의 모든 단계들은, 이러한 특성 및/또는 단계의 적어도 일부가 상호 배타적인 조합을 제외하고는, 임의의 조합으로 임의의 상기 측면들과 조합될 수 있다.
본 발명을 보다 잘 이해하고, 본 발명의 구현예가 효과를 내기 위해 수행될 수 있는 방식을 보이기 위하여, 이제 실시예로서 부속하는 도면에 대한 참조가 행해질 것이다:
도 1은 본 발명의 RNA 구조체의 다양한 구현예(1-7로 나타냄)의 개략도를 보여준다(예컨대, 왼쪽의 saRNA 레플리콘, 또는 mRNA 구조체). 상기 saRNA 레플리콘(1-4)은 알파 바이러스 백본에 기반하고 있다. 상기 소위 '스틸티콘' 벡터는 5' UTR과, 이어지는 알파바이러스, 예컨대 VEEV로부터의 비-구조 단백질(NSP1-4)을 암호화하는 핵산, 서브게놈성 프로모터(SGP), GOI(관심있는 유전자), 예컨대 바이러스, 박테리아, 진균 또는 포유동물 단백질 또는 항원, 바이러스 선천적 억제제 단백질(IIP), 3' UTR 및 폴리A 꼬리를 포함한다. 상기 mRNA 구조체(5-7)는 5' UTR, GOI(관심있는 유전자), 예컨대 바이러스, 박테리아, 진균 또는 포유동물 단백질 또는 항원, 바이러스 선천적 억제제 단백질(IIP), 3' UTR 및 3' 폴리A 꼬리를 포함한다. 상기 IIP 및 GOI의 순서는 상이한 실증적 구현예에 나타낸 것과 같이 saRNA 및 mRNA 모두에 대해 다양할 수 있다;
도 2는 메신저 RNA(mRNA) 백신으로 백신화된 대상체(최초 프라이머(primer) 예방접종(jab)과, 이어지는 후속 부스트(boost) 예방접종)에서의 면역 반응을 실증한다;
도 3은 표준 자가-증폭형 (saRNA) 백신으로 백신화된 대상체(최초 프라이머 예방접종과, 이어지는 부스트 예방접종)에서의 면역 반응을 실증한다;
도 4는 본 발명의 RNA 구조체의 한 구현예, 예를 들면 도 1에 나타낸 스틸티콘 벡터로 백신화된 대상체(최초 프라이머 예방접종과, 이어지는 부스트 예방접종)에서의 면역 반응을 실증한다;
도 5는 본 발명의 RNA 구조체의 한 구현예, 즉 도 1에 나타낸 스틸티콘 벡터로 백신화된 대상체(최초 프라이머 예방접종과, 이어지는 부스트 예방접종)에서의 항원 발현 레벨을 실증한다;
도 6은 F-T2A 형상(configuration)에서 선택된 IIP를 함유하는 VEEV 레플리콘으로 형질감염된 이후 HeLa 세포에서의 f-Luc 발현을 HEK293T/17 세포에서의 발현과 대비하여 보여준다. HEK293T/17 및 HeLa 세포는 리포터 단백질로서 루시퍼라아제를 함유하는 saRNA(100 ng)로 형질감염되었고, 24시간 후 단백질 발현에 대해 평가하였다;
도 7은 F-T2A 형상에서 선택된 IIP를 함유하는 VEEV 레플리콘으로 형질감염된 이후 HeLa 세포에서의 f-Luc 발현을 HEK293T/17 세포에서의 발현과 대비하여 보여준다. HEK293T/17 및 HeLa 세포는 리포터 단백질로서 루시퍼라아제를 함유하는 saRNA(100 ng)로 형질감염되었고, 24시간 후 단백질 발현에 대해 평가하였다;
도 8은 F-T2A 형상에서 IIP를 함유하는 선택된 VEEV 레플리콘으로 형질감염된 이후 HeLa 세포에서의 f-Luc 발현을 HEK293T/17 세포에서의 발현과 대비하여 보여준다. HEK293T/17 및 HeLa 세포는 리포터 단백질로서 루시퍼라아제를 함유하는 saRNA(100 ng)로 형질감염되었고, 24시간 후 단백질 발현에 대해 평가하였다;
도 9는 이중 서브게놈성 프로모터(DSGP) 형상에서 IIP를 함유하는 VEEV 레플리콘으로 형질감염된 이후 HeLa 세포에서의 f-Luc 발현을 HEK293T/17 세포에서의 발현과 대비하여 보여준다. HEK293T/17 및 HeLa 세포는 리포터 단백질로서 루시퍼라아제를 함유하는 saRNA(100 ng)로 형질감염되었고, 24시간 후 단백질 발현에 대해 평가하였다;
도 10은 F-T2A 형상에서 IIP가 없는 saRNA와 비교하여 IIP HSV ICP34.5를 함유하는 saRNA로 형질감염된 이후 HeLa 세포에서 VEGF-A 발현에서의 증가를 HEK293T/17 세포에서의 발현과 대비하여 보여준다. HEK293T/17 및 HeLa 세포는 분비된 리포터 단백질로서 VEGF-A를 함유하는 saRNA(100 ng)로 형질감염되었고, 48시간 후 ELISA에 의해 배양 배지에서 단백질 발현에 대해 평가하였다;
도 11은 도 1에 나타낸 F-T2A 형상(구조체 2a 및 2b), IRES 형상(구조체 3b) 및 DSGP 형상(구조체 4a 및 4b)에서 GOI(구조체 1)로서 f-Luc를 함유하는 saRNA 및 IIP MERS ORF4a로 형질감염된 이후 HeLa 세포에서의 f-Luc 발현을 비교한다. HeLa 세포는 리포터 단백질로서 루시퍼라아제를 함유하는 RNA(100 ng)로 형질감염되었고, 24시간 후 단백질 발현에 대해 평가하였다; 및
도 12는 F-T2A 형상에서 IIP를 함유하는 mRNA로 형질감염된 이후 HeLa 세포에서의 n-Luc 발현 및 f-Luc 발현을 HEK293T/17 세포에서의 발현과 대비하여 보여준다. HEK293T/17 및 HeLa 세포는 리포터 단백질로서 루시퍼라아제를 함유하는 RNA(100 ng)로 형질감염되었고, 24시간 후 단백질 발현에 대해 평가하였다.
도 1은 본 발명의 RNA 구조체의 다양한 구현예(1-7로 나타냄)의 개략도를 보여준다(예컨대, 왼쪽의 saRNA 레플리콘, 또는 mRNA 구조체). 상기 saRNA 레플리콘(1-4)은 알파 바이러스 백본에 기반하고 있다. 상기 소위 '스틸티콘' 벡터는 5' UTR과, 이어지는 알파바이러스, 예컨대 VEEV로부터의 비-구조 단백질(NSP1-4)을 암호화하는 핵산, 서브게놈성 프로모터(SGP), GOI(관심있는 유전자), 예컨대 바이러스, 박테리아, 진균 또는 포유동물 단백질 또는 항원, 바이러스 선천적 억제제 단백질(IIP), 3' UTR 및 폴리A 꼬리를 포함한다. 상기 mRNA 구조체(5-7)는 5' UTR, GOI(관심있는 유전자), 예컨대 바이러스, 박테리아, 진균 또는 포유동물 단백질 또는 항원, 바이러스 선천적 억제제 단백질(IIP), 3' UTR 및 3' 폴리A 꼬리를 포함한다. 상기 IIP 및 GOI의 순서는 상이한 실증적 구현예에 나타낸 것과 같이 saRNA 및 mRNA 모두에 대해 다양할 수 있다;
도 2는 메신저 RNA(mRNA) 백신으로 백신화된 대상체(최초 프라이머(primer) 예방접종(jab)과, 이어지는 후속 부스트(boost) 예방접종)에서의 면역 반응을 실증한다;
도 3은 표준 자가-증폭형 (saRNA) 백신으로 백신화된 대상체(최초 프라이머 예방접종과, 이어지는 부스트 예방접종)에서의 면역 반응을 실증한다;
도 4는 본 발명의 RNA 구조체의 한 구현예, 예를 들면 도 1에 나타낸 스틸티콘 벡터로 백신화된 대상체(최초 프라이머 예방접종과, 이어지는 부스트 예방접종)에서의 면역 반응을 실증한다;
도 5는 본 발명의 RNA 구조체의 한 구현예, 즉 도 1에 나타낸 스틸티콘 벡터로 백신화된 대상체(최초 프라이머 예방접종과, 이어지는 부스트 예방접종)에서의 항원 발현 레벨을 실증한다;
도 6은 F-T2A 형상(configuration)에서 선택된 IIP를 함유하는 VEEV 레플리콘으로 형질감염된 이후 HeLa 세포에서의 f-Luc 발현을 HEK293T/17 세포에서의 발현과 대비하여 보여준다. HEK293T/17 및 HeLa 세포는 리포터 단백질로서 루시퍼라아제를 함유하는 saRNA(100 ng)로 형질감염되었고, 24시간 후 단백질 발현에 대해 평가하였다;
도 7은 F-T2A 형상에서 선택된 IIP를 함유하는 VEEV 레플리콘으로 형질감염된 이후 HeLa 세포에서의 f-Luc 발현을 HEK293T/17 세포에서의 발현과 대비하여 보여준다. HEK293T/17 및 HeLa 세포는 리포터 단백질로서 루시퍼라아제를 함유하는 saRNA(100 ng)로 형질감염되었고, 24시간 후 단백질 발현에 대해 평가하였다;
도 8은 F-T2A 형상에서 IIP를 함유하는 선택된 VEEV 레플리콘으로 형질감염된 이후 HeLa 세포에서의 f-Luc 발현을 HEK293T/17 세포에서의 발현과 대비하여 보여준다. HEK293T/17 및 HeLa 세포는 리포터 단백질로서 루시퍼라아제를 함유하는 saRNA(100 ng)로 형질감염되었고, 24시간 후 단백질 발현에 대해 평가하였다;
도 9는 이중 서브게놈성 프로모터(DSGP) 형상에서 IIP를 함유하는 VEEV 레플리콘으로 형질감염된 이후 HeLa 세포에서의 f-Luc 발현을 HEK293T/17 세포에서의 발현과 대비하여 보여준다. HEK293T/17 및 HeLa 세포는 리포터 단백질로서 루시퍼라아제를 함유하는 saRNA(100 ng)로 형질감염되었고, 24시간 후 단백질 발현에 대해 평가하였다;
도 10은 F-T2A 형상에서 IIP가 없는 saRNA와 비교하여 IIP HSV ICP34.5를 함유하는 saRNA로 형질감염된 이후 HeLa 세포에서 VEGF-A 발현에서의 증가를 HEK293T/17 세포에서의 발현과 대비하여 보여준다. HEK293T/17 및 HeLa 세포는 분비된 리포터 단백질로서 VEGF-A를 함유하는 saRNA(100 ng)로 형질감염되었고, 48시간 후 ELISA에 의해 배양 배지에서 단백질 발현에 대해 평가하였다;
도 11은 도 1에 나타낸 F-T2A 형상(구조체 2a 및 2b), IRES 형상(구조체 3b) 및 DSGP 형상(구조체 4a 및 4b)에서 GOI(구조체 1)로서 f-Luc를 함유하는 saRNA 및 IIP MERS ORF4a로 형질감염된 이후 HeLa 세포에서의 f-Luc 발현을 비교한다. HeLa 세포는 리포터 단백질로서 루시퍼라아제를 함유하는 RNA(100 ng)로 형질감염되었고, 24시간 후 단백질 발현에 대해 평가하였다; 및
도 12는 F-T2A 형상에서 IIP를 함유하는 mRNA로 형질감염된 이후 HeLa 세포에서의 n-Luc 발현 및 f-Luc 발현을 HEK293T/17 세포에서의 발현과 대비하여 보여준다. HEK293T/17 및 HeLa 세포는 리포터 단백질로서 루시퍼라아제를 함유하는 RNA(100 ng)로 형질감염되었고, 24시간 후 단백질 발현에 대해 평가하였다.
실시예
본 발명자들은 saRNA 또는 mRNA의 선천적 인식을 억제하는 것으로 알려져 있는 비-바이러스 공급원, 예컨대 인간 및 다른 포유동물 유래의 시스 암호화 단백질이 숙주 세포에서 선천적 감지를 약화시키고 RNA 백신의 단백질 발현 및 면역원성 모두를 향상시킬 것임을 가정하였다. 따라서, 본 발명자들은 바이러스 선천적 면역 억제제 단백질(IIP) 및 관심있는 유전자(GOI)를 함유하는 다양한 RNA 구조체(saRNA 및 mRNA)를 디자인 및 테스트한 후, 상기 구조체가 (관심있는 유전자에 의해 암호화된) 세포내 및 분비된 단백질 발현 모두를 향상시키는지 여부를 특징분석하였다.
재료 및 방법
IIP를 함유하는 saRNA 레플리콘 플라스미드의 클로닝
반딧불이 루시퍼라아제(fLuc) 및 베네주엘라 말 뇌염 바이러스(VEEV)로부터 유래되는 레플리카아제를 암호화하는 saRNA를 종래 기술된 것과 같이 플라스미드 벡터 내로 클로닝하였다(1). IIP(반딧불이 루시퍼라아제 f-Luc; Uniprot: Q27758)에 이어서 리포터 유전자를 함유하는 레플리콘 플라스미드를 푸린-T2A 또는 이중 서브게놈성 프로모터를 이용해 생성하였다. 이중 서브게놈성(DSG) 구조체는 상기 fLuc 및 IIP를 암호화하는 별도의 RNA 분자의 전사를 시작하도록 디자인하였고, Gibson 조립체 및 뉴클레오티드 염기 중첩부를 이용해 기본 이중 서브게놈성 벡터 내로 클로닝함으로써 생산하였다. 간략하게, 플라스미드 DNA를 37℃에서 2시간 동안 제한 소화시켰고, 제조사의 프로토콜(New England BioLabs, UK)에 따라 GeneArt(Regensburg, Germany) 또는 Integrated DNA Technologies(IDT)(Iowa, USA)에 의해 합성된 유전자 단편 스트링(string)을 이용한 NEB Builder HiFi DNA 조립 반응물에 사용하였다. fLuc 번역을 위하여 종결 코돈 없이 VEEV 일차적(primary) 서브게놈성 프로모터로부터 단일 RNA 전사체를 생성하기 위해 디자인된 푸린-T2A(F-T2A) 구조체는 F-T2A 서열을 갖는 IIP를 대응하는 DSG 플라스미드 벡터의 제한 효소 부위 내로 클로닝함으로써 생산하였다. 50℃에서 30분 동안 인큐베이션한 후, 2 ㎕의 NEB Builder HiFi 조립 반응물을 사용하여 NEB 10-알파 박테리아를 형질전환시켰고, 상기 형질전환체를 LB 아가 플레이트에 플레이팅한 후, 밤새 인큐베이션하였다. 콜로니(colony)를 선택하였고, 밤새 확장시켰고, 퀴아젠 플라스미드 미니프렙 키트(Qiagen, UK)를 이용해 재조합 플라스미드를 정제하였다. 정제된 클론성 플라스미드를 진단적 제한 효소 소화를 이용해 분석하였고, 올바른 소화 패턴을 나타내는 것을 완전히 시퀀싱하여 뉴클레오티드 동일성을 확인하였다(Eurofins, Germany).
IIP에 이어서 F-T2A 또는 DSG 형태로 리포터 유전자를 가질 뿐만 아니라, ECMV IRES 내부 리보솜 도입 서열(메신저 RNA 전사체 내부 부위의 IRES 요소로부터 단백질 번역을 시작함; Bochkov and Palmenburg, Biotechniques 41(3):283-4, 2006)을 이용하는 구조체를 갖는 플라스미드를 표준 분자 기술을 이용하여 벡터빌더(VectorBuilder, Germany)에 의해 생성하였다.
통합된 인터페론 억제 단백질(IIP)은 다음의 데이터베이스 식별자/접근 번호를 이용해 발견될 수 있다:
EBOV VP35(에볼라 바이러스 VP35; NP_066244.1; 접근 번호 - NCBI 참조 서열: NC_002549.1; UniProtKB - Q05127(VP35_EBOZM); EV71- 2Apro(엔테로바이러스 71 2A pro; 접근 번호 - 진뱅크 KC875402.1 및 AGO28195.1; UniProtKB - Q66478(POLG_HE71B); HCV E2(C형 간염 바이러스 E2; 폴리단백질 AAA45534.1로부터의 NS1 단백질; 접근 번호 - 게놈 RNA 번역 AAA45534.1; UniProtKB - P27958(384-746)(POLG_HCV77)); HCV NS5a(C형 간염 바이러스 NS5a; 단리물 H - 게놈 RNA 번역: AAA45534.1; UniProtKB - P27958(POLG_HCV77)); HPV E6(인간 파필로마바이러스 E6; NP_041325.1; 접근 번호 - NCBI 참조 서열: NC_001526.4; UniProtKB - P03126(VE6_HPV16)); HSV ICP34.5(헤르페스 심플렉스 바이러스 ICP34.5; YP_009137073.1; 접근 번호 - NCBI 참조 서열: NC_001806.2; UniProtKB - P36313(ICP34_HHV11)); KSHV ORF52(카포시 육종-연관 헤르페스바이러스 ORF52; 접근 번호 - 게놈 DNA 번역: ACY00451.1; UniProtKB - F5HBL8(F5HBL8_HHV8)); MERS ORF8b(중동 호흡기 증후군 바이러스 ORF8b; 접근 번호 - 게놈 RNA 번역 ANF29170.1; UniProtKB - A0A1W5LGP6(A0A1W5LGP6_MERS)); VACV C6 백시니아 C6(백시니아 바이러스 C6; 접근 번호 - 게놈 DNA 번역: AAA69602.1; UniProtKB - P17362(C6_VACCW)); VACV K3L(백시니아 바이러스 K3L; 접근 번호 - 게놈 DNA 번역: AAA48009.1; UniProtKB - P20639(K3_VACCC)); PIV 5 V(파라인플루엔자 바이러스 5 V; ENA 단백질 ID: AAA47882.1; 진뱅크 접근 번호 J03142.1; UniProtKB - P11207; V_PIV5)); SARS ORF3b*57 변이체(중증 급성 호흡기 증후군 코로나바이러스 2(2019-nCoV)(SARS-CoV-2) ORF3b 단백질 - AA 23에서 돌연변이된 종결 코돈; 게놈 RNA 번역 QTT40181.1; UniProtKB - P0DTF1(ORF3B_SARS2)); SARS ORF3b*79 변이체(중증 급성 호흡기 증후군 코로나바이러스 2(2019-nCoV)(SARS-CoV-2) ORF3b 단백질 - AA 23 및 AA 57에서 돌연변이된 종결 코돈; 게놈 RNA 번역 QTT40181.1; UniProtKB - P0DTF1(ORF3B_SARS2)); SARS ORF3b*57 에콰도르 변이체(중증 급성 호흡기 증후군 코로나바이러스 2(2019-nCoV)(SARS-CoV-2) ORF3b 단백질 - AA 23에서 돌연변이된 종결 코돈; AA 24에서 에콰도르 돌연변이(L24M); 게놈 RNA 번역 QTT40181.1; UniProtKB - P0DTF1(ORF3B_SARS2)); 천산갑 ORF3b *57(천산갑 코로나바이러스 - 게놈 RNA 번역: QIG55946.1; ORF3b 단백질 - AA 23에서 돌연변이된 종결 코돈; UniProtKB - A0A6M3G7Q4(A0A6M3G7Q4_9BETC)); 천산갑 ORF3b *79(천산갑 코로나바이러스 - 게놈 RNA 번역: QIG55946.1; ORF3b 단백질 - AA 23 및 AA 57에서 돌연변이된 종결 코돈; UniProtKB - A0A6M3G7Q4(A0A6M3G7Q4_9BETC)); MERS ORF4a(중동 호흡기 증후군-연관 코로나바이러스(MERS-CoV) NS4A 단백질 - 게놈 RNA 번역: AGV08457.1; UniProtKB: T2BBG6(T2BBG6_MERS)); BVDV nPro(소 바이러스성 설사 바이러스(BVDV)(점막 질환 바이러스) N-말단 프로테아제(aa 1-168) - 게놈 RNA 번역: AAA42854.1; UniProtKB: P19711(POLG_BVDVN)); HSV US1(인간 헤르페스바이러스 2(HG52 바이러스주)(HHV-2)(인간 헤르페스 심플렉스 바이러스 2) E3 유비퀴틴 리가아제(ubiquitin ligase) ICP22 US1 - 게놈 DNA 번역: CAB06708.1; UniProtKB: P89474(ICP22_HHV2H)); MERS CoV M(중동 호흡기 증후군-연관 코로나바이러스(MERS-CoV) 막 단백질(M) - 게놈 RNA 번역: AGV08396.1; UniProtKB: T2BB40(T2BB40_MERS)).
(1) A. K. Blakney, P. F. McKay, R. J. Shattock, Structural Components for Amplification of Positive and Negative Strand VEEV Splitzicons. Frontiers in Molecular Biosciences 5, 71 (2018).
RNA 전사를 위한 IIP를 함유하는 플라스미드의 클로닝
제한 소화와, 이어서 뉴클레오티드 염기 중첩부 영역을 갖고 F-T2A 서열을 포함하는 Gibson 조립체를 이용함으로써 IIP를 n-Luc과, 이어서 IIP의 단일 전사체 발현을 가능하게 하는 기본 플라스미드 내로 삽입하였다. 상기 기본 플라스미드는 T7 프로모터, 알파-글로빈 5' UTR 및 베타-글로빈 3' UTR을 갖는 발광성 새우 나노루시퍼라아제(n-Luc) 발현 카세트를 암호화하는 mRNA로 이루어졌다. 간략하게, 상기 n-Luc 플라스미드 구조체를 제한 효소를 이용해 37℃에서 2시간 동안 선형화한 후, NEB Builder HiFi 조립체 프로토콜(New England BioLabs, UK)에 본질적으로 기술된 것과 같은 NEB Builder HiFi DNA 조립 반응물에서 사용하였다. 50℃에서 30분 동안 인큐베이션한 후, 2 ㎕의 조립 반응물을 사용하여 프로토콜에 따라 NEB 10-알파 박테리아를 형질전환시켰고, 상기 형질전환체를 LB 아가 플레이트에 플레이팅하였고, 콜로니 성장을 위해 밤새 인큐베이션하였다. 콜로니를 선택하였고, 밤새 확장하였고, 재조합 플라스미드를 퀴아젠 플라스미드 미니프렙 키트(Qiagen, UK)를 이용해 박테리아로부터 정제하였고, 정제된 클론성 플라스미드를 처음에 진단적 제한 효소 소화물을 이용해 분석하였고, 올바른 소화 패턴을 나타내는 것을 완전히 시퀀싱하여 뉴클레오티드 동일성을 확인하였다(Eurofins, Germany).
saRNA 레플리콘 및 mRNA 전사를 위해 사용된 플라스미드 모두에 대하여 IIP에 이어서 F-T2A 또는 DSG 형태로 n-Luc를 가질 뿐만 아니라, ECMV IRES 내부 리보솜 도입 서열(메신저 RNA 전사체 내부 부위의 IRES 요소로부터 단백질 번역을 시작함; Bochkov and Palmenburg, Biotechniques 41(3):283-4, 2006)을 이용하는 구조체를 갖는 플라스미드를 표준 분자 기술을 이용하여 벡터빌더(VectorBuilder, Germany)에 의해 생성하였다.
saRNA의 시험관내 전사
플라스미드 DNA(pDNA)를 대장균(E. coli)(New England BioLabs, UK) 내로 형질전환시켰고, 100 ㎍/㎖의 카르베니실린(Sigma Aldrich, UK)을 갖는 100 ㎖의 Luria Broth(LB)에서 배양하였다. pDNA를 플라스미드 플러스 맥시프렙 키트(QIAGEN, UK)를 이용해 단리하였고, 최종 농도를 NanoDrop One(ThermoFisher, UK)에서 측정하였다. CleanCap Reagent AG(Tebu-bio, France)를 이용해 pDNA 주형으로부터 saRNA를 전사하여 자연 발생형 Cap 1 구조를 갖는 RNA 전사체를 생산하였다. 간략하게, 상기 pDNA 주형을 37℃에서 3시간 동안 선형화시킨 후, 1 ㎍의 선형화된 pDNA 주형을 제조사의 프로토콜에 따라 표준 CleanCap 전사 프로토콜(Tebu-bio, France)에 사용하였다. -20℃에서 적어도 30분 동안 LiCl 침전함으로써 전사체를 정제하였고, 20,000 g로 4℃에서 20분 동안 원심분리하여 RNA를 펠렛화하였고, 70% EtOH로 1회 세정하였고, 다시 20,000 g로 4℃에서 5분 동안 원심분리하였고, UltraPure H2O(Ambion, UK)에 재부유시켰고, 이후 사용할 때까지 -80℃에 보관하였다.
RNA의 시험관내 전사
pDNA를 대장균(New England BioLabs, UK) 내로 형질전환시켰고, 100 ㎍/㎖의 카르베니실린(Sigma Aldrich, UK)을 갖는 100 ㎖의 Luria Broth(LB)에서 배양하였다. 플라스미드 플러스 맥시프렙 키트(QIAGEN, UK)를 이용해 플라스미드를 정제하였고, 농도 및 순도를 NanoDrop One(ThermoFisher, UK)으로 측정하였다. MEGAscript™ T7 전사 프로토콜(ThermoFisher, UK)을 이용하고, 이어서 ScriptCap™ m7G 캡핑 시스템 포스트 번역(Cambio, UK)에 의해 상기 플라스미드 DNA 주형으로부터 RNA를 전사하였다. 간략하게, pDNA를 37℃에서 3시간 동안 선형화하였고, 1 ㎍의 선형화된 pDNA 주형을 표준 반응 프로토콜에 사용하였다. MEGAscript™ T7 전사 후, 상기 전사체를 -20℃에서 적어도 30분 동안 LiCl 침전에 의해 정제한 후, 20,000 g로 4℃에서 20분 동안 원심분리하여 RNA를 펠렛화하였고, 70% EtOH로 1회 세정하였고, 다시 20,000 g로 4℃에서 5분 동안 원심분리하였고, UltraPure H2O(Ambion, UK)에 재부유시켰다. 이후, 상기 전사체를 ScriptCap™ m7G 캡핑 시스템 표준 프로토콜을 이용해 전사-후 캡핑시켰고, 마지막으로 상기 기술된 것과 같이 LiCl 침전시켰다. 이후, 정제되고 Cap 1 캡핑된 RNA를 UltraPure H2O(Ambion, UK)에 재부유시켰고, 이후 사용할 때까지 -80℃에 보관하였다.
IIP 활성의 측정
바이러스 IIP를 함유하는 saRNA가 IIP가 없는 saRNA에 대비하여 saRNA f-luc 발현을 증가시키는 능력; IIP를 함유하는 mRNA가 IIP가 없는 mRNA에 대비하여 mRNA n-luc 발현을 증가시키는 능력, 및 IIP를 함유하는 mRNA가 IIP가 없는 saRNA로부터 f-luc 발현을 증가시키는 능력을 확립하기 위하여, 구조체를 인터페론 적격(competent) HeLa 세포에서 테스트하였고, 기능적 항-바이러스 신호전달 경로를 갖지 않는 HEK293T/17 세포에서 얻어진 경우와 그 발현을 비교하였다. 양쪽 세포주 모두 10%(v/v) 소 태아 혈청(FBS), 5 ㎎/㎖ L-글루타민(Gibco, ThermoFisher, UK) 및 5 ㎎/㎖ 페니실린/스트렙토마이신(Sigma-Aldrich, Merck, UK)을 함유하는 높은 글루코오스의 둘베코 변형 이글 배지(cDMEM)(Sigma-Aldrich, Merck, UK)에서 배양하였다.
saRNA 반딧불이 루시퍼라아제(f-Luc) 발현에 대한 IIP의 평가
평평한 투명 바닥 96-웰 플레이트(Corning Costar) 내로 HEK293T/17 세포를 웰 당 25,000 세포의 밀도로, 그리고 HeLa 세포를 웰 당 10,000 세포의 밀도로 플레이팅한 후, 24시간 동안 인큐베이션하였다. 0.15 ㎕의 리포펙타민(lipofectamine) MessengerMAX(ThermoFisher, UK) 및 100 ng의 saRNA IIP 구조체 또는 saRNA 대조군(IIP 없음)을 함유하는 10 ㎕의 OptiMEM(ThermoFisher, UK)을 웰에 삼중으로 첨가하였고, 추가로 24시간 후, 플레이트를 630 g로 실온에서 5분 동안 원심분리하였고, 50 ㎕의 배지를 각각의 웰로부터 제거하였고, 50 ㎕의 ONE-Glo™ Ex Reagent D-루시페린 시약(Promega, UK)을 첨가하였고, 피펫팅(pipetting)에 의해 혼합하였다. 이후, 각각의 웰로부터의 총 부피를 평평 바닥 불투명 백색 96-웰 플레이트(Corning Costar)로 전달하였고, 10분 이내에 FLUOstar OMEGA 플레이트 판독기(BMG LABTECH, UK)에서 형광을 측정하였다. saRNA를 함유하지 않은 대조군 웰로부터의 배경 형광을 saRNA를 함유하는 각각의 웰에 대한 신호로부터 뺐다. 이후, HeLa 세포에서 IIP를 함유하는 saRNA에 대해 수득된 신호를 대조군 saRNA를 이용해 수득된 신호 및 HEK293T/17 세포에서 수득된 신호로부터의 배수 변화로 표현하였다.
saRNA VEGF-A 발현에 대한 IIP의 평가
HEK293T/17 또는 Hela 세포를 f-Luc를 발현하는 구조체의 테스트에 대해 기술된 것과 동일한 방법을 이용하여 VEGF-A 유전자를 함유하는 100 ng의 saRNA로 형질감염시켰다. 48시간 후, 세포 배양 배지 내의 VEGF-A를 인간 VEGF-A ELISA 키트(Invitrogen, UK)를 이용해 측정하였다. 간략하게, 분석 플레이트 웰을 400 ㎕의 세척 버퍼로 2회 세척한 후, 테스트 샘플 또는 VEGF-A 표준물(15.6 pg/㎖ 내지 1,000 pg/㎖)을 첨가하였다. 이후, 플레이트를 마이크로플레이트 교반기(300 rpm; Jencons Scientific Ltd, UK)에서 실온에서 2시간 동안 인큐베이션한 후, 400 ㎕의 세척 버퍼로 6회 세척하였고, 100 ㎕의 바이오틴-접합체 검출 항체(1:100 희석)를 각각의 웰에 첨가하였고, 플레이트를 마이크로플레이트 교반기(실온에서 1시간, 300 rpm)에서 인큐베이션하였다. 400 ㎕의 세척 버퍼로 6회 세척한 후, 스트렙트아비딘-HRP(1:100 희석) 제2 층 접합체(100 ㎕)를 첨가하였고, 이후 1시간 추가로 인큐베이션하였고, 6회 추가로 세척하였고, 100 ㎕의 TMB 기질을 각각의 웰에 첨가하였다. 암소에서 실온에서 30분 동안 인큐베이션한 후, 100 ㎕의 중단 용액을 첨가하였고, 각각의 웰의 흡광도를 VersaMax 마이크로플레이트 분광광도계(Molecular Devices, UK)로 450 nm에서 판독하였다. 표준 곡선에 내삽(interpolation)함으로써 샘플 내의 VEGF-A 레벨을 결정하였다.
RNA 나노-루시퍼라아제(n-luc) 발현에 대한 IIP의 평가
평평한 투명 바닥 96-웰 플레이트(Corning Costar) 내로 HEK293T/17 세포를 웰 당 25,000 세포의 밀도로, 그리고 HeLa 세포를 웰 당 10,000 세포의 밀도로 플레이팅한 후, 24시간 동안 인큐베이션하였다. 0.15 ㎕의 리포펙타민 MessengerMAX(ThermoFisher, UK) 및 100 ng의 saRNA IIP 구조체 또는 saRNA 대조군(IIP 없음)을 함유하는 10 ㎕의 OptiMEM(ThermoFisher, UK)을 웰에 삼중으로 첨가하였고, 추가로 24시간 후, 플레이트를 630 g로 실온에서 5분 동안 원심분리하였고, 50 ㎕의 배지를 각각의 웰로부터 제거하였고, 50 ㎕의 NanoDLR™ Stop & Glo® 시약(Promega, UK)을 첨가하였고, 피펫팅에 의해 혼합하였다. 이후, 각각의 웰로부터의 총 부피를 평평 바닥 불투명 백색 96-웰 플레이트(Corning Costar)로 전달하였고, 10분 이내에 FLUOstar OMEGA 플레이트 판독기(BMG LABTECH, UK)에서 형광을 측정하였다. RNA를 함유하지 않은 대조군 웰로부터의 배경 형광을 RNA를 함유하는 각각의 웰에 대한 신호로부터 뺐다. 이후, HeLa 세포에서 IIP를 함유하는 RNA에 대해 수득된 신호를 대조군 RNA를 이용해 수득된 신호 및 HEK293T/17 세포에서 수득된 신호로부터의 배수 변화로 표현하였다.
실시예 1 - 바이러스 선천적 억제제 단백질(IIP) 구조체의 구조 디자인
바이러스 선천적 억제제 단백질(IIP)은 자가-증폭형 RNA(saRNA) 또는 메신저 RNA(mRNA)일 수 있는 본 발명의 RNA 구조체 내로 통합되어서, 단백질 발현 및 번역, 즉 임의의 치료 생체분자일 수 있는 관심있는 유전자(GOI)에 의해 암호화되는 단백질을 변형 또는 감소시킬 수 있는 선천적 인식 및 반응을 감소 또는 제거할 수 있다.
본 발명의 RNA 구조체에 대한 디자인 형상의 다양한 구현예는 도 1에 나타나 있다. saRNA 발현 구조체는 알파바이러스 백본을 기반으로 하며, 여기서 비-구조 단백질은 유지되지만, 관심있는 유전자(GOI)는 서브게놈성 프로모터(SGP)의 하류에 삽입되어 바이러스의 구조 유전자를 교체한다(도 1에서 구현예 "1" 참조). 상기 GOI는 임의의 단백질일 수 있으며, 바이러스, 박테리아, 진균 또는 포유동물 단백질, 즉 생물치료제 단백질일 수 있다. 그러나, 본 발명자들은 본 발명의 RNA 구조체가 백신 공간에서 현저한 유용성을 실증할 것으로 예측하며, 따라서 상기 GOI는 백신 항원, 예컨대 바이러스, 박테리아 또는 진균 단백질, 예컨대 코트 단백질을 암호화할 것이다.
saRNA 구조체(도 1의 좌측)
임의의 IIP가 다음의 디자인 접근법을 이용하여 saRNA 내에 암호화될 수 있다:
- 도 1에서 구현예 "2a"는 펩티드 절단 모티프(motif)(예컨대, 푸린-T2A)를 포함하는 융합 단백질을 암호화하는 saRNA 구조체를 보여주며, GOI(예컨대, 관심있는 항원) 및 IIP에 의해 암호화되는 단백질은 숙주 세포에서 번역시 별개의 단백질로 절단된다;
- 도 1의 구현예 "2b"에서, GOI 및 IIP의 순서가 반대이며, IIP는 GOI의 5'에 있고, 다시 상기 IIP와 GOI 사이에 펩티드 절단 모티프가 있어서, saRNA 구조체가 번역된 후 숙주 세포에서 2개의 별개의 단백질이 생산된다;
- 구현예 "3a"에서, IIP는 GOI 종결 코돈의 하류에 삽입된다. 서브게놈성 프로모터는 GOI의 번역을 구동하고, IIP의 발현/번역은 내부 리보솜 도입 부위(IRES)를 포함시킴으로써 구동된다;
- 구현예 "3b"에서, GOI 및 IIP의 순서가 반대이며, IIP의 번역은 서브게놈성 프로모터에 의해, 그리고 GOI는 IRES에 의해 촉진된다;
- 구현예 "4a"에서, IIP는 GOI 종결 코돈의 하류에 삽입된다. GOI의 번역은 제1 서브게놈성 프로모터에 의해 촉진되고, IIP의 번역은 제2 서브게놈성 프로모터를 포함시킴으로써 구동된다;
- 구현예 "4b"에서, IIP 및 GOI의 위치가 바뀌었으며, 즉 IIP가 GOI의 앞에 있다.
mRNA 구조체(도 1의 오른쪽)
도 1을 참조하면, 임의의 IIP가 다음의 디자인 접근법을 이용하여 mRNA 내에 암호화될 수 있다(구현예 "5" 참조):
- 구현예 "6a"에서, mRNA 구조체는 펩티드 절단 모티프(예컨대, F-T2a)를 포함하는 융합 단백질을 암호화하며, GOI 및 IIP는 번역시 별개의 단백질로 절단된다;
- 구현예 "6b"에서, GOI 및 IIP의 순서가 반대이며, IIP는 GOI의 5'에 있다;
- 구현예 "7a"에서, IIP는 GOI 종결 코돈의 하류에 삽입되며, 여기서 번역은 내부 리보솜 도입 부위(IRES)를 포함시킴으로써 구동된다;
- 구현예 "7b"에서, GOI 및 IIP의 순서가 반대이며, 번역은 서브게놈성 프로모터에 의해, 그리고 GOI는 IRES에 의해 촉진된다.
본 발명자들은 도 1에 실증된 RNA 구조체의 다양한 구현예에서 많은 수의 바이러스 IIP를 테스트하였으며, 이들이 각각 saRNA 및 RNA에 대한 발현 및 반응을 변형할 잠재력을 갖는 것으로 여긴다.
실시예 2 - 바이러스 선천적 억제제 단백질(IIP)을 포함하는 saRNA 구조체의 구축 및 테스트
본 발명자들은 리포터 유전자, f-Luc 또는 VEGF-A의 발현시 상이한 레플리콘 형상에서 일련의 다양한 바이러스 IIP를 디자인하고, 구축하고, 이후 테스트하였으며, 발현 연구의 결과는 도 6 내지 도 11에 나타나 있다.
도 6을 참조하면, F-T2A 형상에서 HPV E6, HSV ICP34.5, HCV E2, VACV E3L, MERS ORF8b 또는 VACV K3L을 함유하는 VEEV 레플리콘으로 형질감염된 후 HeLa 세포에서 f-Luc 발현에서의 배수 증가를 보여준다. HEK293T/17 및 HeLa 세포는 리포터 단백질로서 루시퍼라아제를 함유하는 saRNA(100 ng)로 형질감염되었고, 24시간 후 단백질 발현에 대해 평가하였다. HeLa 세포는 HEK293T/17와 비교하여 보다 온전한 IFN 발현 경로를 갖는 것으로 알려져 있고, 따라서 대조군(리포터 단백질로서 루시퍼라아제를 함유하고 IIP는 없는 saRNA)과 대비하여 증가된 발현(배수 증가)은 상기 IIP가 saRNA 발현을 증가시키는 것을 시사한다. 상기 IIP 중에서, HSV ICP34.5는 f-Luc 발현에서 가장 큰 증가를 생성하였다. 나타낸 데이터는 HeLa 세포에서의 루시퍼라아제 발현이 HEK293T/17 세포에서의 발현과 대비하여 ∼2배 이상 증가를 제공하는 구조체이며, 3개의 별개의 saRNA의 배치를 이용하여 3번의 독립적 실험에서 수득된 데이터의 평균±SEM이다.
도 7을 참조하면, F-T2A 형상에서 KHSV ORF52, EBOV VP35, SARS ORF3b* 57 변이체, SARS ORF3b*79 변이체, SARS ORF3b*57 에콰도르 변이체 또는 천산갑 ORF3b* 57을 함유하는 VEEV 레플리콘으로 형질감염된 후 HeLa 세포에서의 f-Luc 발현을 HEK293T/17 세포에서의 발현과 대비하여 보여준다. 실험 방법의 상세 내용은 도 6에 제공된다. 이들 중에서, EBOV VP35 및 SARS ORF3b*79 변이체는 f-Luc 발현에서 가장 큰 증가를 생성하였다. 나타낸 데이터는 HeLa 세포에서의 루시퍼라아제 발현이 HEK293T/17 세포에서의 발현과 대비하여 ∼2배 이상 증가를 제공하는 구조체이며, 3개의 별개의 saRNA의 배치를 이용하여 3번의 독립적 실험에서 수득된 데이터의 평균±SEM이다.
도 8을 참조하면, F-T2A 형상에서 IIP를 함유하는 선택된 VEEV 레플리콘으로 형질감염된 후 HeLa 세포에서의 f-Luc 발현을 HEK293T/17 세포에서의 발현과 대비하여 보여준다. 실험 방법의 상세 내용은 도 6에 제공된다. PIV V5 및 MERS ORF4a는 f-Luc 발현에서 가장 큰 증가를 생성하였다. 나타낸 데이터는 HeLa 세포에서의 루시퍼라아제 발현이 HEK293T/17 세포에서의 발현과 대비하여 ∼2배 이상 증가를 제공하는 구조체이며, 3개의 별개의 saRNA의 배치를 이용하여 3번의 독립적 실험에서 수득된 데이터의 평균±SEM이다.
도 9를 참조하면, 이중 서브게놈성 프로모터(DSGP) 형상에서 IIP를 함유하는 VEEV 레플리콘으로 형질감염된 후 HeLa 세포에서의 f-Luc 발현을 HEK293T/17 세포에서의 발현과 대비하여 보여준다. 실험 방법의 상세 내용은 도 6에 제공된다. HCV E2, VACV E3L 및 PIV 5V는 f-Luc 발현에서 유사한 증가를 생성하였다. 나타낸 데이터는 HeLa 세포에서의 루시퍼라아제 발현이 HEK293T/17 세포에서의 발현과 대비하여 ∼2배 이상 증가를 제공하는 구조체이며, 3개의 별개의 saRNA의 배치를 이용하여 3번의 독립적 실험에서 수득된 데이터의 평균±SEM이다.
도 10을 참조하면, IIP가 없는 saRNA와 비교하고 HEK293T/17 세포에서의 발현과 대비하여 F-T2A 형상에서 IIP HSV ICP34.5를 함유하는 saRNA로 형질감염된 후 HeLa 세포로부터 VEGF-A 분비에서의 증가를 보여준다. HEK293T/17 및 HeLa 세포는 리포터 단백질로서 VEGF-A를 함유하는 RNA(100 ng)로 형질감염되었고, 48시간 후 배양 배지 내로 단백질 발현 및 분비를 ELISA에 의해 평가하였다. HeLa 세포는 HEK293T/17과 비교하여 보다 온전한 IFN 발현 경로를 갖는 것으로 알려져 있으며, 따라서 대조군(GOI로서 VEGF-A를 함유하고 IIP는 없는 RNA)과 대비하여 증가된 발현은 HSV ICP34.5가 saRNA GOI 발현을 증가시켰음을 시사한다. 데이터는 1회 실험으로부터 유래되며, 3번의 반복 측정의 평균±SEM을 나타낸다.
도 11을 참조하면, 도 1에 나타낸 F-T2A 형상(구조체 2a 및 2b), IRES 형상(구조체 3b) 및 DSGP 형상(구조체 4a 및 4b)에서 GOI로서 f-Luc(구조체 1) 및 IIP MERS ORF4a를 함유하는 saRNA로 형질감염된 후 HeLa 세포에서 f-Luc 발현을 보여준다. 실험 방법의 상세 내용은 도 6에 제공된다. 데이터는 3개의 별개의 saRNA의 배치를 이용하여 3번의 독립적 실험에서 수득된 데이터의 평균±SEM이다. P<0.05는 IIP가 없는 구조체와 비교하여 ANOVA 측정에서 유의함을 나타낸다.
실시예 3 - 바이러스 선천적 억제제 단백질(IIP)을 포함하는 RNA 구조체의 구축 및 테스트
본 발명자들은 일련의 다양한 바이러스 IIP를 디자인하고, 구축하고, 이후 테스트하였으며, 발현 연구의 결과는 도 12에 나타나 있다.
도 12를 참조하면, F-T2A 형상에서 IIP를 함유하는 RNA로 형질감염된 후 HeLa 세포에서의 n-Luc 발현을 HEK293T/17 세포에서의 발현과 대비하여 보여준다. 실험 방법의 상세 내용은 도 6에 제공된다. 나타낸 데이터는 루시퍼라아제 발현이 ∼2배 이상 증가를 제공하는 구조체이며, 3개의 별개의 RNA의 배치를 이용하여 3번의 독립적 실험에서 수득된 데이터의 평균±SEM이다.
결론
본 발명자들은 본 명세서에 기술된 구조체가 다음을 포함하여 종래 기술에 기술된 것들보다 많은 이점을 나타낸다고 여긴다:
ⅰ) RNA 구조체, 예컨대 mRNA 또는 saRNA 내로 직접 임의의 선천적 조절 단백질을 암호화하는 뉴클레오티드 서열을 삽입하고, IIP 단백질 및 관심있는 유전자에 의해 암호화되는 생물치료제 분자의 이중 단백질 발현을 가능하게 한다;
ⅱ) 하나는 관심있는 유전자(GOI), 즉 치료 생체분자를 암호화하고 하나는 IIP를 암호화하는 2개의 상이한 별개 가닥의 RNA를 운반하는 것과 대조적으로, 단일 가닥의 운반만이 필요하다;
ⅲ) IIP는 RNA의 선천적 감지를 억제하고, 이에 따라 더 높은 단백질 발현을 가능하게 한다;
ⅳ) RNA 구조체가 saRNA일 때, IIP 발현 자체는 서브게놈성 가닥에서 GOI와 공동 발현됨으로 인해 자가-증폭된다; 및/또는
ⅴ) 종래의 VEEV RNA 레플리콘 구조체와 비교하여 단백질 발현의 규모 및 기간 모두 증가된다.
번호가 매겨진 문단
다음의 문단은 청구항이 아니라 발명의 설명의 일부를 형성한다:
1. (ⅰ) 적어도 하나의 치료 생체분자; 및 (ⅱ) 적어도 하나의 바이러스 선천적 억제제 단백질(IIP);을 암호화하는 RNA 구조체.
2. 상기 구조체가 mRNA, saRNA 또는 트랜스-레플리콘 시스템이고, 가장 바람직하게는 saRNA인, 문단 1에 따른 RNA 구조체.
3. 상기 구조체가 알파바이러스; 피코르나바이러스; 플라비바이러스; 루비바이러스; 페스티바이러스; 헤파시바이러스; 칼리시바이러스 및 코로나바이러스;로 이루어진 속의 군으로부터 선택되양성 가닥 RNA 바이러스, 바람직하게는 알파바이러스, 임의적으로는 VEEV를 포함하거나 이로부터 유래되는, 문단 1 또는 문단 2에 따른 RNA 구조체.
4. 상기 적어도 하나의 선천적 억제제 단백질(IIP)이 HPV E6 또는 HSV ICP34.5, 또는 그의 동원체인, 문단 1 내지 문단 3 중 어느 하나에 따른 RNA 구조체.
5. 상기 적어도 하나의 선천적 억제제 단백질(IIP)이 HCV E2 또는 HCV NS5a, 또는 그의 동원체인, 문단 1 내지 문단 3 중 어느 하나에 따른 RNA 구조체.
6. 상기 적어도 하나의 선천적 억제제 단백질(IIP)이 VACV E3L 또는 VACV K3L, 또는 그의 동원체인, 문단 1 내지 문단 3 중 어느 하나에 따른 RNA 구조체.
7. 상기 적어도 하나의 선천적 억제제 단백질(IIP)이 MERS ORF8B, 또는 그의 동원체인, 문단 1 내지 문단 3 중 어느 하나에 따른 RNA 구조체.
8. 상기 적어도 하나의 선천적 억제제 단백질(IIP)이 KSHV ORF52, 또는 그의 동원체인, 문단 1 내지 문단 3 중 어느 하나에 따른 RNA 구조체.
9. 상기 적어도 하나의 선천적 억제제 단백질(IIP)이 에볼라 VP35, 또는 그의 동원체인, 문단 1 내지 문단 3 중 어느 하나에 따른 RNA 구조체.
10. 상기 적어도 하나의 선천적 억제제 단백질(IIP)이 백시니아 C6, 또는 그의 동원체인, 문단 1 내지 문단 3 중 어느 하나에 따른 RNA 구조체.
11. 상기 적어도 하나의 선천적 억제제 단백질(IIP)이 야생형 SARS-CoV-2 ORF3b의 ORF3b*57 변이체, 또는 그의 동원체인, 문단 1 내지 문단 3 중 어느 하나에 따른 RNA 구조체.
12. 상기 적어도 하나의 선천적 억제제 단백질(IIP)이 야생형 SARS-CoV-2 ORF3b의 ORF3b*79 변이체, 또는 그의 동원체인, 문단 1 내지 문단 3 중 어느 하나에 따른 RNA 구조체.
13. 상기 적어도 하나의 선천적 억제제 단백질(IIP)이 야생형 SARS-CoV-2 ORF3b의 ORF3b*57 에콰도르 변이체, 또는 그의 동원체인, 문단 1 내지 문단 3 중 어느 하나에 따른 RNA 구조체.
14. 상기 치료 생체분자가 치료 단백질을 포함하고, 바람직하게는 상기 단백질 또는 펩티드가 항원, 보다 바람직하게는 바이러스 항원인, 임의의 선행한 문단에 따른 RNA 구조체.
15. 임의의 선행한 문단에 따른 RNA 구조체를 암호화하는 핵산 서열.
16. 문단 15에 따른 핵산 서열을 포함하는 발현 카세트.
17. 문단 16에 따른 발현 카세트를 포함하는 재조합 벡터.
18. 문단 1 내지 문단 14 중 어느 하나에 따른 RNA 구조체, 문단 15에 따른 핵산 서열, 문단 16에 따른 발현 카세트 또는 문단 17에 따른 벡터, 및 약학적으로 허용가능한 비히클을 포함하는 약학적 조성물.
19. 문단 1 내지 문단 14 중 어느 하나에 따른 RNA 구조체의 제조 방법으로서, 상기 방법은
a) ⅰ) 숙주 세포 내로 문단 17에 따른 벡터를 도입하는 단계; 및
ⅱ) 상기 숙주 세포를 문단 1 내지 문단 14 중 어느 하나에 따른 RNA 구조체의 생산을 야기하는 조건 하에 배양하는 단계; 또는
b) 문단 17에 따른 벡터로부터 RNA 구조체를 전사하는 단계;를 포함하는 방법.
20. 약제로서 또는 치료법에 사용하기 위한 문단 1 내지 문단 14 중 어느 하나에 따른 RNA 구조체, 문단 15에 따른 핵산 서열, 문단 16에 따른 발현 카세트 또는 문단 17에 따른 벡터 또는 문단 18에 따른 약학적 조성물.
21. 원생동물, 진균, 박테리아 또는 바이러스 감염의 예방, 개선 또는 치료에 사용하기 위한 문단 1 내지 문단 14 중 어느 하나에 따른 RNA 구조체, 문단 15에 따른 핵산 서열, 문단 16에 따른 발현 카세트 또는 문단 17에 따른 벡터 또는 문단 18에 따른 약학적 조성물.
22. 암의 예방, 개선 또는 치료에 사용하기 위한 문단 1 내지 문단 14 중 어느 하나에 따른 RNA 구조체, 문단 15에 따른 핵산 서열, 문단 16에 따른 발현 카세트, 문단 17에 따른 벡터 또는 문단 18에 따른 약학적 조성물.
23. 문단 1 내지 문단 14 중 어느 하나에 따른 RNA 구조체, 문단 15에 따른 핵산 서열, 문단 16에 따른 발현 카세트, 문단 17에 따른 벡터 또는 문단 18에 따른 약학적 조성물을 포함하는 백신.
24. 대상체에서 면역 반응의 자극에 사용하기 위한 문단 1 내지 문단 14 중 어느 하나에 따른 RNA 구조체, 문단 15에 따른 핵산 서열, 문단 16에 따른 발현 카세트, 문단 17에 따른 벡터 또는 문단 18에 따른 약학적 조성물.
<110> IMPERIAL COLLEGE INNOVATIONS LIMITED
VaxEquity LtdVaxEquity Ltd
<120> RNA construct
<130> 2023-FPA-2153
<150> 2020061.4
<151> 2020-12-17
<160> 459
<170> PatentIn version 3.5
<210> 1
<211> 158
<212> PRT
<213> Human papillomavirus type 16
<400> 1
Met His Gln Lys Arg Thr Ala Met Phe Gln Asp Pro Gln Glu Arg Pro
1 5 10 15
Arg Lys Leu Pro Gln Leu Cys Thr Glu Leu Gln Thr Thr Ile His Asp
20 25 30
Ile Ile Leu Glu Cys Val Tyr Cys Lys Gln Gln Leu Leu Arg Arg Glu
35 40 45
Val Tyr Asp Phe Ala Phe Arg Asp Leu Cys Ile Val Tyr Arg Asp Gly
50 55 60
Asn Pro Tyr Ala Val Cys Asp Lys Cys Leu Lys Phe Tyr Ser Lys Ile
65 70 75 80
Ser Glu Tyr Arg His Tyr Cys Tyr Ser Leu Tyr Gly Thr Thr Leu Glu
85 90 95
Gln Gln Tyr Asn Lys Pro Leu Cys Asp Leu Leu Ile Arg Cys Ile Asn
100 105 110
Cys Gln Lys Pro Leu Cys Pro Glu Glu Lys Gln Arg His Leu Asp Lys
115 120 125
Lys Gln Arg Phe His Asn Ile Arg Gly Arg Trp Thr Gly Arg Cys Met
130 135 140
Ser Cys Cys Arg Ser Ser Arg Thr Arg Arg Glu Thr Gln Leu
145 150 155
<210> 2
<211> 474
<212> DNA
<213> Human papillomavirus type 16
<400> 2
atgcaccaaa agagaactgc aatgtttcag gacccacagg agcgacccag aaagttacca 60
cagttatgca cagagctgca aacaactata catgatataa tattagaatg tgtgtactgc 120
aagcaacagt tactgcgacg tgaggtatat gactttgctt ttcgggattt atgcatagta 180
tatagagatg ggaatccata tgctgtatgt gataaatgtt taaagtttta ttctaaaatt 240
agtgagtata gacattattg ttatagtttg tatggaacaa cattagaaca gcaatacaac 300
aaaccgttgt gtgatttgtt aattaggtgt attaactgtc aaaagccact gtgtcctgaa 360
gaaaagcaaa gacatctgga caaaaagcaa agattccata atataagggg tcggtggacc 420
ggtcgatgta tgtcttgttg cagatcatca agaacacgta gagaaaccca gctg 474
<210> 3
<211> 474
<212> RNA
<213> Human papillomavirus type 16
<400> 3
augcaccaaa agagaacugc aauguuucag gacccacagg agcgacccag aaaguuacca 60
caguuaugca cagagcugca aacaacuaua caugauauaa uauuagaaug uguguacugc 120
aagcaacagu uacugcgacg ugagguauau gacuuugcuu uucgggauuu augcauagua 180
uauagagaug ggaauccaua ugcuguaugu gauaaauguu uaaaguuuua uucuaaaauu 240
agugaguaua gacauuauug uuauaguuug uauggaacaa cauuagaaca gcaauacaac 300
aaaccguugu gugauuuguu aauuaggugu auuaacuguc aaaagccacu guguccugaa 360
gaaaagcaaa gacaucugga caaaaagcaa agauuccaua auauaagggg ucgguggacc 420
ggucgaugua ugucuuguug cagaucauca agaacacgua gagaaaccca gcug 474
<210> 4
<211> 477
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding HPV16 E6 protein
<400> 4
atgcaccaga aacggaccgc catgttccag gatcctcaag agaggcccag aaagctgcct 60
cagctgtgta ccgagctgca gaccaccatc cacgacatca tcctggaatg cgtgtactgc 120
aagcagcagc tcctgcggag agaggtgtac gatttcgcct tccgggacct gtgcatcgtg 180
tacagagatg gcaaccccta cgccgtgtgc gacaagtgcc tgaagttcta cagcaagatc 240
agcgagtacc ggcactactg ctacagcctg tacggcacca cactggaaca gcagtacaac 300
aagcccctgt gcgacctgct gatccggtgc atcaactgcc agaaacctct gtgccccgag 360
gaaaagcagc ggcacctgga caagaagcag cggttccaca acatcagagg ccggtggacc 420
ggcagatgca tgagctgttg tcggagcagc agaaccagac gggaaaccca gctgtga 477
<210> 5
<211> 477
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding HPV16 E6 protein
<400> 5
augcaccaga aacggaccgc cauguuccag gauccucaag agaggcccag aaagcugccu 60
cagcugugua ccgagcugca gaccaccauc cacgacauca uccuggaaug cguguacugc 120
aagcagcagc uccugcggag agagguguac gauuucgccu uccgggaccu gugcaucgug 180
uacagagaug gcaaccccua cgccgugugc gacaagugcc ugaaguucua cagcaagauc 240
agcgaguacc ggcacuacug cuacagccug uacggcacca cacuggaaca gcaguacaac 300
aagccccugu gcgaccugcu gauccggugc aucaacugcc agaaaccucu gugccccgag 360
gaaaagcagc ggcaccugga caagaagcag cgguuccaca acaucagagg ccgguggacc 420
ggcagaugca ugagcuguug ucggagcagc agaaccagac gggaaaccca gcuguga 477
<210> 6
<211> 248
<212> PRT
<213> human herpesvirus 1
<400> 6
Met Ala Arg Arg Arg Arg His Arg Gly Pro Arg Arg Pro Arg Pro Pro
1 5 10 15
Gly Pro Thr Gly Ala Val Pro Thr Ala Gln Ser Gln Val Thr Ser Thr
20 25 30
Pro Asn Ser Glu Pro Ala Val Arg Ser Ala Pro Ala Ala Ala Pro Pro
35 40 45
Pro Pro Pro Ala Gly Gly Pro Pro Pro Ser Cys Ser Leu Leu Leu Arg
50 55 60
Gln Trp Leu His Val Pro Glu Ser Ala Ser Asp Asp Asp Asp Asp Asp
65 70 75 80
Asp Trp Pro Asp Ser Pro Pro Pro Glu Pro Ala Pro Glu Ala Arg Pro
85 90 95
Thr Ala Ala Ala Pro Arg Pro Arg Pro Pro Pro Pro Gly Val Gly Pro
100 105 110
Gly Gly Gly Ala Asp Pro Ser His Pro Pro Ser Arg Pro Phe Arg Leu
115 120 125
Pro Pro Arg Leu Ala Leu Arg Leu Arg Val Thr Ala Glu His Leu Ala
130 135 140
Arg Leu Arg Leu Arg Arg Ala Gly Gly Glu Gly Ala Pro Glu Pro Pro
145 150 155 160
Ala Thr Pro Ala Thr Pro Ala Thr Pro Ala Thr Pro Ala Thr Pro Ala
165 170 175
Arg Val Arg Phe Ser Pro His Val Arg Val Arg His Leu Val Val Trp
180 185 190
Ala Ser Ala Ala Arg Leu Ala Arg Arg Gly Ser Trp Ala Arg Glu Arg
195 200 205
Ala Asp Arg Ala Arg Phe Arg Arg Arg Val Ala Glu Ala Glu Ala Val
210 215 220
Ile Gly Pro Cys Leu Gly Pro Glu Ala Arg Ala Arg Ala Leu Ala Arg
225 230 235 240
Gly Ala Gly Pro Ala Asn Ser Val
245
<210> 7
<211> 744
<212> DNA
<213> human herpesvirus 1
<400> 7
atggcccgcc gccgccgcca tcgcggcccc cgccgccccc ggccgcccgg gcccacgggc 60
gccgtcccaa ccgcacagtc ccaggtaacc tccacgccca actcggaacc cgcggtcagg 120
agcgcgcccg cggccgcccc gccgccgccc cccgccggtg ggcccccgcc ttcttgttcg 180
ctgctgctgc gccagtggct ccacgttccc gagtccgcgt ccgacgacga cgatgacgac 240
gactggccgg acagcccccc gcccgagccg gcgccagagg cccggcccac cgccgccgcc 300
ccccggcccc ggcccccacc gcccggcgtg ggcccggggg gcggggctga cccctcccac 360
cccccctcgc gccccttccg ccttccgccg cgcctcgccc tccgcctgcg cgtcaccgcg 420
gagcacctgg cgcgcctgcg cctgcgacgc gcgggcgggg agggggcgcc ggagcccccc 480
gcgacccccg cgacccccgc gacccccgcg acccccgcga cccccgcgcg ggtgcgcttc 540
tcgccccacg tccgggtgcg ccacctggtg gtctgggcct cggccgcccg cctggcgcgc 600
cgcggctcgt gggcccgcga gcgggccgac cgggctcggt tccggcgccg ggtggcggag 660
gccgaggcgg tcatcgggcc gtgcctgggg cccgaggccc gtgcccgggc cctggcccgc 720
ggagccggcc cggcgaactc ggtc 744
<210> 8
<211> 744
<212> RNA
<213> human herpesvirus 1
<400> 8
auggcccgcc gccgccgcca ucgcggcccc cgccgccccc ggccgcccgg gcccacgggc 60
gccgucccaa ccgcacaguc ccagguaacc uccacgccca acucggaacc cgcggucagg 120
agcgcgcccg cggccgcccc gccgccgccc cccgccggug ggcccccgcc uucuuguucg 180
cugcugcugc gccaguggcu ccacguuccc gaguccgcgu ccgacgacga cgaugacgac 240
gacuggccgg acagcccccc gcccgagccg gcgccagagg cccggcccac cgccgccgcc 300
ccccggcccc ggcccccacc gcccggcgug ggcccggggg gcggggcuga ccccucccac 360
ccccccucgc gccccuuccg ccuuccgccg cgccucgccc uccgccugcg cgucaccgcg 420
gagcaccugg cgcgccugcg ccugcgacgc gcgggcgggg agggggcgcc ggagcccccc 480
gcgacccccg cgacccccgc gacccccgcg acccccgcga cccccgcgcg ggugcgcuuc 540
ucgccccacg uccgggugcg ccaccuggug gucugggccu cggccgcccg ccuggcgcgc 600
cgcggcucgu gggcccgcga gcgggccgac cgggcucggu uccggcgccg gguggcggag 660
gccgaggcgg ucaucgggcc gugccugggg cccgaggccc gugcccgggc ccuggcccgc 720
ggagccggcc cggcgaacuc gguc 744
<210> 9
<211> 747
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding HSV ICP34.5 protein
<400> 9
atggccagaa gaaggcggca cagaggaccc agaaggccta gacctcctgg accaacaggt 60
gccgttccta ccgctcagag ccaagtgacc agcacaccca attctgaacc tgccgtcaga 120
agcgcccctg ctgctgctcc tccacctcca ccagctggcg gacctccacc ttcttgttct 180
ctgctgctga gacagtggct gcacgtgcca gagtccgcct ccgacgatga tgacgatgac 240
gactggcctg acagccctcc tccagaacct gctcctgaag ccagacctac agccgctgct 300
cctagaccta gaccaccacc tccaggtgtt ggacctggtg gcggagctga tccttctcac 360
cctcctagca gacccttccg gcttcctcct agactggccc tgagactgag agtgacagcc 420
gaacacctgg ccagactgag acttcgtaga gcaggcggag aaggcgctcc tgaacctcct 480
gctacaccag ccacaccagc tactcccgca actcctgcca ctcctgctag agtgcggttt 540
agccctcacg tccgcgtcag acatctggtc gtttgggcct ctgctgcccg gcttgctaga 600
agaggatctt gggccagaga gagagccgac cgggctagat ttcggagaag agtggccgaa 660
gccgaggccg tgattggacc ttgtcttggc cctgaagctc gggctagagc acttgctaga 720
ggtgccggac ctgccaacag cgtgtga 747
<210> 10
<211> 747
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding HSV ICP34.5 protein
<400> 10
auggccagaa gaaggcggca cagaggaccc agaaggccua gaccuccugg accaacaggu 60
gccguuccua ccgcucagag ccaagugacc agcacaccca auucugaacc ugccgucaga 120
agcgccccug cugcugcucc uccaccucca ccagcuggcg gaccuccacc uucuuguucu 180
cugcugcuga gacaguggcu gcacgugcca gaguccgccu ccgacgauga ugacgaugac 240
gacuggccug acagcccucc uccagaaccu gcuccugaag ccagaccuac agccgcugcu 300
ccuagaccua gaccaccacc uccagguguu ggaccuggug gcggagcuga uccuucucac 360
ccuccuagca gacccuuccg gcuuccuccu agacuggccc ugagacugag agugacagcc 420
gaacaccugg ccagacugag acuucguaga gcaggcggag aaggcgcucc ugaaccuccu 480
gcuacaccag ccacaccagc uacucccgca acuccugcca cuccugcuag agugcgguuu 540
agcccucacg uccgcgucag acaucugguc guuugggccu cugcugcccg gcuugcuaga 600
agaggaucuu gggccagaga gagagccgac cgggcuagau uucggagaag aguggccgaa 660
gccgaggccg ugauuggacc uugucuuggc ccugaagcuc gggcuagagc acuugcuaga 720
ggugccggac cugccaacag cguguga 747
<210> 11
<211> 364
<212> PRT
<213> Hepatitis C virus
<400> 11
Met Glu Thr His Val Thr Gly Gly Ser Ala Gly His Thr Val Ser Gly
1 5 10 15
Phe Val Ser Leu Leu Ala Pro Gly Ala Lys Gln Asn Val Gln Leu Ile
20 25 30
Asn Thr Asn Gly Ser Trp His Leu Asn Ser Thr Ala Leu Asn Cys Asn
35 40 45
Asp Ser Leu Asn Thr Gly Trp Leu Ala Gly Leu Phe Tyr His His Lys
50 55 60
Phe Asn Ser Ser Gly Cys Pro Glu Arg Leu Ala Ser Cys Arg Pro Leu
65 70 75 80
Thr Asp Phe Asp Gln Gly Trp Gly Pro Ile Ser Tyr Ala Asn Gly Ser
85 90 95
Gly Pro Asp Gln Arg Pro Tyr Cys Trp His Tyr Pro Pro Lys Pro Cys
100 105 110
Gly Ile Val Pro Ala Lys Ser Val Cys Gly Pro Val Tyr Cys Phe Thr
115 120 125
Pro Ser Pro Val Val Val Gly Thr Thr Asp Arg Ser Gly Ala Pro Thr
130 135 140
Tyr Ser Trp Gly Glu Asn Asp Thr Asp Val Phe Val Leu Asn Asn Thr
145 150 155 160
Arg Pro Pro Leu Gly Asn Trp Phe Gly Cys Thr Trp Met Asn Ser Thr
165 170 175
Gly Phe Thr Lys Val Cys Gly Ala Pro Pro Cys Val Ile Gly Gly Ala
180 185 190
Gly Asn Asn Thr Leu His Cys Pro Thr Asp Cys Phe Arg Lys His Pro
195 200 205
Asp Ala Thr Tyr Ser Arg Cys Gly Ser Gly Pro Trp Ile Thr Pro Arg
210 215 220
Cys Leu Val Asp Tyr Pro Tyr Arg Leu Trp His Tyr Pro Cys Thr Ile
225 230 235 240
Asn Tyr Thr Ile Phe Lys Ile Arg Met Tyr Val Gly Gly Val Glu His
245 250 255
Arg Leu Glu Ala Ala Cys Asn Trp Thr Arg Gly Glu Arg Cys Asp Leu
260 265 270
Glu Asp Arg Asp Arg Ser Glu Leu Ser Pro Leu Leu Leu Thr Thr Thr
275 280 285
Gln Trp Gln Val Leu Pro Cys Ser Phe Thr Thr Leu Pro Ala Leu Ser
290 295 300
Thr Gly Leu Ile His Leu His Gln Asn Ile Val Asp Val Gln Tyr Leu
305 310 315 320
Tyr Gly Val Gly Ser Ser Ile Ala Ser Trp Ala Ile Lys Trp Glu Tyr
325 330 335
Val Val Leu Leu Phe Leu Leu Leu Ala Asp Ala Arg Val Cys Ser Cys
340 345 350
Leu Trp Met Met Leu Leu Ile Ser Gln Ala Glu Ala
355 360
<210> 12
<211> 1092
<212> DNA
<213> Hepatitis C virus
<400> 12
atggaaaccc acgtcaccgg gggaagtgcc ggccacactg tgtctggatt tgttagcctc 60
ctcgcaccag gcgccaagca gaacgtccag ctgatcaaca ccaacggcag ttggcacctc 120
aatagcacgg ccctgaactg caatgatagc cttaacaccg gctggttagc agggcttttc 180
tatcaccaca agttcaactc ttcaggctgt cctgagaggc tagccagctg ccgacccctt 240
accgattttg accagggctg gggccctatc agttatgcca acggaagcgg ccccgaccag 300
cgcccctact gctggcacta cccccctaaa ccttgcggtg ttgtgcccgc gaagagtgtg 360
tgtggtccgg tatattgctt cactcccagc cccgtggtgg tgggaacgac cgacaggtcg 420
ggcgcgccta cctacagctg gggtgaaaat gatacggacg tcttcgtcct taacaatacc 480
aggccaccgc tgggcaattg gttcggttgt acctggatga actcaactgg attcaccaaa 540
gtgtgcggag cgcctccctg tgtcatcgga ggggcgggca acaacaccct gcactgcccc 600
actgattgct tccgcaagca tccggacgcc acatactctc ggtgcggctc cggtccctgg 660
atcacaccca ggtgcctggt cgactacccg tataggcttt ggcattatcc ttgtaccatc 720
aactacacca tatttaaaat caggatgtac gtgggagggg tcgagcacag gctggaagct 780
gcttgcaact ggacgcgggg cgaacgttgc gatctggaag acagggacag gtccgagctc 840
agcccgttac tgctgaccac tacacagtgg caggtcctcc cgtgttcctt cacaaccctg 900
ccagccttgt ccaccggcct catccacctc caccagaaca ttgtggacgt gcagtacttg 960
tacggggtgg ggtcaagcat cgcgtcctgg gccattaagt gggagtacgt cgttctcctg 1020
ttccttctgc ttgcagacgc gcgcgtctgc tcctgcttgt ggatgatgct actcatatcc 1080
caagcggagg cg 1092
<210> 13
<211> 1092
<212> RNA
<213> Hepatitis C virus
<400> 13
auggaaaccc acgucaccgg gggaagugcc ggccacacug ugucuggauu uguuagccuc 60
cucgcaccag gcgccaagca gaacguccag cugaucaaca ccaacggcag uuggcaccuc 120
aauagcacgg cccugaacug caaugauagc cuuaacaccg gcugguuagc agggcuuuuc 180
uaucaccaca aguucaacuc uucaggcugu ccugagaggc uagccagcug ccgaccccuu 240
accgauuuug accagggcug gggcccuauc aguuaugcca acggaagcgg ccccgaccag 300
cgccccuacu gcuggcacua ccccccuaaa ccuugcggug uugugcccgc gaagagugug 360
ugugguccgg uauauugcuu cacucccagc cccguggugg ugggaacgac cgacaggucg 420
ggcgcgccua ccuacagcug gggugaaaau gauacggacg ucuucguccu uaacaauacc 480
aggccaccgc ugggcaauug guucgguugu accuggauga acucaacugg auucaccaaa 540
gugugcggag cgccucccug ugucaucgga ggggcgggca acaacacccu gcacugcccc 600
acugauugcu uccgcaagca uccggacgcc acauacucuc ggugcggcuc cggucccugg 660
aucacaccca ggugccuggu cgacuacccg uauaggcuuu ggcauuaucc uuguaccauc 720
aacuacacca uauuuaaaau caggauguac gugggagggg ucgagcacag gcuggaagcu 780
gcuugcaacu ggacgcgggg cgaacguugc gaucuggaag acagggacag guccgagcuc 840
agcccguuac ugcugaccac uacacagugg cagguccucc cguguuccuu cacaacccug 900
ccagccuugu ccaccggccu cauccaccuc caccagaaca uuguggacgu gcaguacuug 960
uacggggugg ggucaagcau cgcguccugg gccauuaagu gggaguacgu cguucuccug 1020
uuccuucugc uugcagacgc gcgcgucugc uccugcuugu ggaugaugcu acucauaucc 1080
caagcggagg cg 1092
<210> 14
<211> 1095
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding HCV E2 protein
<400> 14
atggaaaccc acgtgacagg cggatctgcc ggccatacag tgtccggctt tgtgtctctt 60
ctggcccctg gcgccaagca gaatgtgcag ctgatcaaca ccaacggcag ctggcacctg 120
aacagcacag ccctgaactg caacgacagc ctgaataccg gatggctggc cggcctgttc 180
taccaccaca agttcaatag cagcggctgc cccgagagac tggcctcttg tagacctctg 240
accgacttcg atcaaggctg gggccctatc agctacgcca atggctctgg acctgaccag 300
aggccttact gctggcacta ccctccaaag ccttgcggaa tcgtgcctgc caagtctgtg 360
tgtggccccg tgtactgctt caccccatct ccagtggtcg tgggcaccac cgatagatct 420
ggcgccccaa catatagctg gggcgagaac gacaccgacg tgttcgtgct gaacaacacc 480
cggcctccac tcggaaattg gttcggctgc acctggatga actccaccgg cttcacaaaa 540
gtgtgcggag cccctccttg tgtgattggc ggagccggaa acaataccct gcactgccct 600
accgactgct tcagaaagca ccccgacgcc acctacagca gatgtggatc tggcccttgg 660
atcaccccta gatgcctggt ggactacccc taccggctgt ggcactatcc ctgcaccatc 720
aactacacca tcttcaagat ccgtatgtac gtcggcggcg tggaacacag actggaagcc 780
gcctgtaact ggaccagggg cgagagatgc gacctggaag atagagacag aagcgagctg 840
agccctctgc tgctgaccac cacacagtgg caggtcctgc cttgcagctt caccacactg 900
cctgctctga gcaccggcct gattcatctg caccagaaca tcgtggacgt gcagtacctg 960
tacggcgtgg gaagctctat tgccagctgg gccatcaagt gggagtacgt ggtgctgctg 1020
ttcctgctgc tggccgatgc cagagtgtgt agctgcctgt ggatgatgct gctgatctct 1080
caggccgagg cctga 1095
<210> 15
<211> 1095
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding HCV E2 protein
<400> 15
auggaaaccc acgugacagg cggaucugcc ggccauacag uguccggcuu ugugucucuu 60
cuggccccug gcgccaagca gaaugugcag cugaucaaca ccaacggcag cuggcaccug 120
aacagcacag cccugaacug caacgacagc cugaauaccg gauggcuggc cggccuguuc 180
uaccaccaca aguucaauag cagcggcugc cccgagagac uggccucuug uagaccucug 240
accgacuucg aucaaggcug gggcccuauc agcuacgcca auggcucugg accugaccag 300
aggccuuacu gcuggcacua cccuccaaag ccuugcggaa ucgugccugc caagucugug 360
uguggccccg uguacugcuu caccccaucu ccaguggucg ugggcaccac cgauagaucu 420
ggcgccccaa cauauagcug gggcgagaac gacaccgacg uguucgugcu gaacaacacc 480
cggccuccac ucggaaauug guucggcugc accuggauga acuccaccgg cuucacaaaa 540
gugugcggag ccccuccuug ugugauuggc ggagccggaa acaauacccu gcacugcccu 600
accgacugcu ucagaaagca ccccgacgcc accuacagca gauguggauc uggcccuugg 660
aucaccccua gaugccuggu ggacuacccc uaccggcugu ggcacuaucc cugcaccauc 720
aacuacacca ucuucaagau ccguauguac gucggcggcg uggaacacag acuggaagcc 780
gccuguaacu ggaccagggg cgagagaugc gaccuggaag auagagacag aagcgagcug 840
agcccucugc ugcugaccac cacacagugg cagguccugc cuugcagcuu caccacacug 900
ccugcucuga gcaccggccu gauucaucug caccagaaca ucguggacgu gcaguaccug 960
uacggcgugg gaagcucuau ugccagcugg gccaucaagu gggaguacgu ggugcugcug 1020
uuccugcugc uggccgaugc cagagugugu agcugccugu ggaugaugcu gcugaucucu 1080
caggccgagg ccuga 1095
<210> 16
<211> 449
<212> PRT
<213> Hepatitis C virus
<400> 16
Met Ser Gly Ser Trp Leu Arg Asp Ile Trp Asp Trp Ile Cys Glu Val
1 5 10 15
Leu Ser Asp Phe Lys Thr Trp Leu Lys Ala Lys Leu Met Pro Gln Leu
20 25 30
Pro Gly Ile Pro Phe Val Ser Cys Gln Arg Gly Tyr Arg Gly Val Trp
35 40 45
Arg Gly Asp Gly Ile Met His Thr Arg Cys His Cys Gly Ala Glu Ile
50 55 60
Thr Gly His Val Lys Asn Gly Thr Met Arg Ile Val Gly Pro Arg Thr
65 70 75 80
Cys Lys Asn Met Trp Ser Gly Thr Phe Phe Ile Asn Ala Tyr Thr Thr
85 90 95
Gly Pro Cys Thr Pro Leu Pro Ala Pro Asn Tyr Lys Phe Ala Leu Trp
100 105 110
Arg Val Ser Ala Glu Glu Tyr Val Glu Ile Arg Arg Val Gly Asp Phe
115 120 125
His Tyr Val Ser Gly Met Thr Thr Asp Asn Leu Lys Cys Pro Cys Gln
130 135 140
Ile Pro Ser Pro Glu Phe Phe Thr Glu Leu Asp Gly Val Arg Leu His
145 150 155 160
Arg Phe Ala Pro Pro Cys Lys Pro Leu Leu Arg Glu Glu Val Ser Phe
165 170 175
Arg Val Gly Leu His Glu Tyr Pro Val Gly Ser Gln Leu Pro Cys Glu
180 185 190
Pro Glu Pro Asp Val Ala Val Leu Thr Ser Met Leu Thr Asp Pro Ser
195 200 205
His Ile Thr Ala Glu Ala Ala Gly Arg Arg Leu Ala Arg Gly Ser Pro
210 215 220
Pro Ser Met Ala Ser Ser Ser Ala Ser Gln Leu Ser Ala Pro Ser Leu
225 230 235 240
Lys Ala Thr Cys Thr Ala Asn His Asp Ser Pro Asp Ala Glu Leu Ile
245 250 255
Glu Ala Asn Leu Leu Trp Arg Gln Glu Met Gly Gly Asn Ile Thr Arg
260 265 270
Val Glu Ser Glu Asn Lys Val Val Ile Leu Asp Ser Phe Asp Pro Leu
275 280 285
Val Ala Glu Glu Asp Glu Arg Glu Val Ser Val Pro Ala Glu Ile Leu
290 295 300
Arg Lys Ser Arg Arg Phe Ala Pro Ala Leu Pro Val Trp Ala Arg Pro
305 310 315 320
Asp Tyr Asn Pro Leu Leu Val Glu Thr Trp Lys Lys Pro Asp Tyr Glu
325 330 335
Pro Pro Val Val His Gly Cys Pro Leu Pro Pro Pro Arg Ser Pro Pro
340 345 350
Val Pro Pro Pro Arg Lys Lys Arg Thr Val Val Leu Thr Glu Ser Thr
355 360 365
Leu Pro Thr Ala Leu Ala Glu Leu Ala Thr Lys Ser Phe Gly Ser Ser
370 375 380
Ser Thr Ser Gly Ile Thr Gly Asp Asn Thr Thr Thr Ser Ser Glu Pro
385 390 395 400
Ala Pro Ser Gly Cys Pro Pro Asp Ser Asp Val Glu Ser Tyr Ser Ser
405 410 415
Met Pro Pro Leu Glu Gly Glu Pro Gly Asp Pro Asp Leu Ser Asp Gly
420 425 430
Ser Trp Ser Thr Val Ser Ser Gly Ala Asp Thr Glu Asp Val Val Cys
435 440 445
Cys
<210> 17
<211> 1347
<212> DNA
<213> Hepatitis C virus
<400> 17
atgtccggtt cctggctaag ggacatctgg gactggatat gcgaggtgct gagcgacttt 60
aagacctggc tgaaagccaa gctcatgcca caactgcctg ggattccctt tgtgtcctgc 120
cagcgcgggt ataggggggt ctggcgagga gacggcatta tgcacactcg ctgccactgt 180
ggagctgaga tcactggaca tgtcaaaaac gggacgatga ggatcgtcgg tcctaggacc 240
tgcaagaaca tgtggagtgg gacgttcttc attaatgcct acaccacggg cccctgtact 300
ccccttcctg cgccgaacta taagttcgcg ctgtggaggg tgtctgcaga ggaatacgtg 360
gagataaggc gggtggggga cttccactac gtatcgggca tgactactga caatctcaaa 420
tgcccgtgcc agatcccatc gcccgaattt ttcacagaat tggacggggt gcgcctacat 480
aggtttgcgc ccccttgcaa gcccttgctg cgggaggagg tatcattcag agtaggactc 540
cacgagtacc cggtggggtc gcaattacct tgcgagcccg aaccggacgt agccgtgttg 600
acgtccatgc tcactgatcc ctcccatata acagcagagg cggccgggag aaggttggcg 660
agagggtcac ccccttctat ggccagctcc tcggctagcc agctgtccgc tccatctctc 720
aaggcaactt gcaccgccaa ccatgactcc cctgacgccg agctcataga ggctaacctc 780
ctgtggaggc aggagatggg cggcaacatc accagggttg agtcagagaa caaagtggtg 840
attctggact ccttcgatcc gcttgtggca gaggaggatg agcgggaggt ctccgtaccc 900
gcagaaattc tgcggaagtc tcggagattc gccccagccc tgcccgtctg ggcgcggccg 960
gactacaacc ccctgctagt agagacgtgg aaaaagcctg actacgaacc acctgtggtc 1020
catggctgcc cgctaccacc tccacggtcc cctcctgtgc ctccgcctcg gaaaaagcgt 1080
acggtggtcc tcaccgaatc aaccctacct actgccttgg ccgagcttgc caccaaaagt 1140
tttggcagct cctcaacttc cggcattacg ggcgacaata cgacaacatc ctctgagccc 1200
gccccttctg gctgcccccc cgactccgac gttgagtcct attcttccat gccccccctg 1260
gagggggagc ctggggatcc ggatctcagc gacgggtcat ggtcgacggt cagtagtggg 1320
gccgacacgg aagatgtcgt gtgctgc 1347
<210> 18
<211> 1347
<212> RNA
<213> Hepatitis C virus
<400> 18
auguccgguu ccuggcuaag ggacaucugg gacuggauau gcgaggugcu gagcgacuuu 60
aagaccuggc ugaaagccaa gcucaugcca caacugccug ggauucccuu uguguccugc 120
cagcgcgggu auaggggggu cuggcgagga gacggcauua ugcacacucg cugccacugu 180
ggagcugaga ucacuggaca ugucaaaaac gggacgauga ggaucgucgg uccuaggacc 240
ugcaagaaca uguggagugg gacguucuuc auuaaugccu acaccacggg ccccuguacu 300
ccccuuccug cgccgaacua uaaguucgcg cuguggaggg ugucugcaga ggaauacgug 360
gagauaaggc ggguggggga cuuccacuac guaucgggca ugacuacuga caaucucaaa 420
ugcccgugcc agaucccauc gcccgaauuu uucacagaau uggacggggu gcgccuacau 480
agguuugcgc ccccuugcaa gcccuugcug cgggaggagg uaucauucag aguaggacuc 540
cacgaguacc cggugggguc gcaauuaccu ugcgagcccg aaccggacgu agccguguug 600
acguccaugc ucacugaucc cucccauaua acagcagagg cggccgggag aagguuggcg 660
agagggucac ccccuucuau ggccagcucc ucggcuagcc agcuguccgc uccaucucuc 720
aaggcaacuu gcaccgccaa ccaugacucc ccugacgccg agcucauaga ggcuaaccuc 780
cuguggaggc aggagauggg cggcaacauc accaggguug agucagagaa caaaguggug 840
auucuggacu ccuucgaucc gcuuguggca gaggaggaug agcgggaggu cuccguaccc 900
gcagaaauuc ugcggaaguc ucggagauuc gccccagccc ugcccgucug ggcgcggccg 960
gacuacaacc cccugcuagu agagacgugg aaaaagccug acuacgaacc accugugguc 1020
cauggcugcc cgcuaccacc uccacggucc ccuccugugc cuccgccucg gaaaaagcgu 1080
acgguggucc ucaccgaauc aacccuaccu acugccuugg ccgagcuugc caccaaaagu 1140
uuuggcagcu ccucaacuuc cggcauuacg ggcgacaaua cgacaacauc cucugagccc 1200
gccccuucug gcugcccccc cgacuccgac guugaguccu auucuuccau gcccccccug 1260
gagggggagc cuggggaucc ggaucucagc gacgggucau ggucgacggu caguaguggg 1320
gccgacacgg aagaugucgu gugcugc 1347
<210> 19
<211> 1350
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding HCV NS5a protein
<400> 19
atgtctggca gctggctgag agacatctgg gactggattt gcgaggtgct gagcgacttc 60
aagacctggc tgaaggccaa gctgatgcct cagctgcctg gcatcccttt cgtgtcctgt 120
cagaggggct atagaggcgt ttggagaggc gacggcatca tgcacaccag atgtcactgt 180
ggcgccgaga tcacaggcca cgtgaagaac ggcaccatga gaatcgtggg ccccagaacc 240
tgcaagaata tgtggagcgg caccttcttc atcaacgcct acaccaccgg accttgcaca 300
cctctgcctg ctcctaacta caagttcgcc ctgtggcggg tgtccgccga ggaatacgtg 360
gaaatcagaa gagtgggcga cttccactac gtgtccggca tgaccaccga caacctgaag 420
tgcccctgtc agatcccatc tcctgagttc ttcaccgagc tggatggcgt gcggctgcac 480
agatttgccc ctccatgtaa acccctgctg agagaagagg tgtcctttag agtgggcctg 540
cacgagtacc ctgtgggttc tcagctccct tgcgagcctg aacctgatgt ggccgtgctg 600
acctccatgc tgacagaccc ttctcacatc acagccgagg ccgctggaag aaggctggct 660
agaggatctc ctcctagcat ggcctctagc agcgcctctc aactgtctgc cccaagcctg 720
aaagccacct gtaccgccaa tcacgacagc cctgatgccg agctgatcga ggctaacctg 780
ctgtggcggc aagagatggg cggcaacatc accagagtgg aaagcgagaa caaggtggtc 840
atcctggata gcttcgaccc tctggtggcc gaagaggacg agagggaagt gtctgtgcct 900
gccgagatcc tgagaaagag cagaagattc gcccctgctc tgcccgtgtg ggccagacct 960
gattacaatc ccctgctggt ggaaacatgg aagaagcccg actacgagcc tcctgtggtg 1020
cacggatgtc cactgcctcc acctagatct ccacctgtgc cacctccacg gaagaaaaga 1080
accgtggtgc tgaccgagag caccctgcct acagctctgg ctgagctggc cacaaagagc 1140
tttggcagca gcagcacctc tggcatcacc ggcgataata ccaccaccag ctctgagcct 1200
gctccaagcg gatgtcctcc tgactccgac gtggaaagct acagcagcat gcctcctctg 1260
gaaggcgaac ccggcgatcc tgatctgtct gatggctctt ggagcaccgt gtcctctggc 1320
gccgatacag aggatgtcgt gtgctgctga 1350
<210> 20
<211> 1350
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding HCV NS5a protein
<400> 20
augucuggca gcuggcugag agacaucugg gacuggauuu gcgaggugcu gagcgacuuc 60
aagaccuggc ugaaggccaa gcugaugccu cagcugccug gcaucccuuu cguguccugu 120
cagaggggcu auagaggcgu uuggagaggc gacggcauca ugcacaccag augucacugu 180
ggcgccgaga ucacaggcca cgugaagaac ggcaccauga gaaucguggg ccccagaacc 240
ugcaagaaua uguggagcgg caccuucuuc aucaacgccu acaccaccgg accuugcaca 300
ccucugccug cuccuaacua caaguucgcc cuguggcggg uguccgccga ggaauacgug 360
gaaaucagaa gagugggcga cuuccacuac guguccggca ugaccaccga caaccugaag 420
ugccccuguc agaucccauc uccugaguuc uucaccgagc uggauggcgu gcggcugcac 480
agauuugccc cuccauguaa accccugcug agagaagagg uguccuuuag agugggccug 540
cacgaguacc cuguggguuc ucagcucccu ugcgagccug aaccugaugu ggccgugcug 600
accuccaugc ugacagaccc uucucacauc acagccgagg ccgcuggaag aaggcuggcu 660
agaggaucuc cuccuagcau ggccucuagc agcgccucuc aacugucugc cccaagccug 720
aaagccaccu guaccgccaa ucacgacagc ccugaugccg agcugaucga ggcuaaccug 780
cuguggcggc aagagauggg cggcaacauc accagagugg aaagcgagaa caaggugguc 840
auccuggaua gcuucgaccc ucugguggcc gaagaggacg agagggaagu gucugugccu 900
gccgagaucc ugagaaagag cagaagauuc gccccugcuc ugcccgugug ggccagaccu 960
gauuacaauc cccugcuggu ggaaacaugg aagaagcccg acuacgagcc uccuguggug 1020
cacggauguc cacugccucc accuagaucu ccaccugugc caccuccacg gaagaaaaga 1080
accguggugc ugaccgagag cacccugccu acagcucugg cugagcuggc cacaaagagc 1140
uuuggcagca gcagcaccuc uggcaucacc ggcgauaaua ccaccaccag cucugagccu 1200
gcuccaagcg gauguccucc ugacuccgac guggaaagcu acagcagcau gccuccucug 1260
gaaggcgaac ccggcgaucc ugaucugucu gauggcucuu ggagcaccgu guccucuggc 1320
gccgauacag aggaugucgu gugcugcuga 1350
<210> 21
<211> 190
<212> PRT
<213> Vaccinia virus
<400> 21
Met Ser Lys Ile Tyr Ile Asp Glu Arg Ser Asp Ala Glu Ile Val Cys
1 5 10 15
Ala Ala Ile Lys Asn Ile Gly Ile Glu Gly Ala Thr Ala Ala Gln Leu
20 25 30
Thr Arg Gln Leu Asn Met Glu Lys Arg Glu Val Asn Lys Ala Leu Tyr
35 40 45
Asp Leu Gln Arg Ser Ala Met Val Tyr Ser Ser Asp Asp Ile Pro Pro
50 55 60
Arg Trp Phe Met Thr Thr Glu Ala Asp Lys Pro Asp Ala Asp Ala Met
65 70 75 80
Ala Asp Val Ile Ile Asp Asp Val Ser Arg Glu Lys Ser Met Arg Glu
85 90 95
Asp His Lys Ser Phe Asp Asp Val Ile Pro Ala Lys Lys Ile Ile Asp
100 105 110
Trp Lys Asp Ala Asn Pro Val Thr Ile Ile Asn Glu Tyr Cys Gln Ile
115 120 125
Thr Lys Arg Asp Trp Ser Phe Arg Ile Glu Ser Val Gly Pro Ser Asn
130 135 140
Ser Pro Thr Phe Tyr Ala Cys Val Asp Ile Asp Gly Arg Val Phe Asp
145 150 155 160
Lys Ala Asp Gly Lys Ser Lys Arg Asp Ala Lys Asn Asn Ala Ala Lys
165 170 175
Leu Ala Val Asp Lys Leu Leu Gly Tyr Val Ile Ile Arg Phe
180 185 190
<210> 22
<211> 570
<212> DNA
<213> Vaccinia virus
<400> 22
atgtctaaga tctatatcga cgagcgttct gacgcagaga ttgtgtgtgc ggctattaaa 60
aacattggaa tcgaaggagc tactgctgca caactaacta gacaacttaa tatggagaag 120
cgagaagtta ataaagctct gtacgatctt caacgtagtg ctatggtgta cagctccgac 180
gatattcctc ctcgttggtt tatgacaacg gaggcggata agccggatgc tgatgctatg 240
gctgacgtca taatagatga tgtatcccgc gaaaaatcaa tgagagagga tcataagtct 300
tttgatgatg ttattccggc taaaaaaatt attgattgga aagatgctaa ccctgtcacc 360
attattaatg agtactgcca aataactaag agagattggt cttttcgtat tgaatcagtt 420
gggcctagta actctcctac attttatgcc tgtgtagata tcgacggaag agtattcgat 480
aaggccgatg gaaaatctaa acgagatgct aaaaataatg cagctaaatt ggctgtagat 540
aaacttcttg ggtacgtcat cattagattc 570
<210> 23
<211> 570
<212> RNA
<213> Vaccinia virus
<400> 23
augucuaaga ucuauaucga cgagcguucu gacgcagaga uugugugugc ggcuauuaaa 60
aacauuggaa ucgaaggagc uacugcugca caacuaacua gacaacuuaa uauggagaag 120
cgagaaguua auaaagcucu guacgaucuu caacguagug cuauggugua cagcuccgac 180
gauauuccuc cucguugguu uaugacaacg gaggcggaua agccggaugc ugaugcuaug 240
gcugacguca uaauagauga uguaucccgc gaaaaaucaa ugagagagga ucauaagucu 300
uuugaugaug uuauuccggc uaaaaaaauu auugauugga aagaugcuaa cccugucacc 360
auuauuaaug aguacugcca aauaacuaag agagauuggu cuuuucguau ugaaucaguu 420
gggccuagua acucuccuac auuuuaugcc uguguagaua ucgacggaag aguauucgau 480
aaggccgaug gaaaaucuaa acgagaugcu aaaaauaaug cagcuaaauu ggcuguagau 540
aaacuucuug gguacgucau cauuagauuc 570
<210> 24
<211> 573
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding VACV E3L protein
<400> 24
atgagcaaga tctacatcga cgagcggagc gacgccgaga ttgtgtgtgc cgccatcaag 60
aacatcggca tcgaaggcgc tacagccgct cagctgacca gacagctgaa catggaaaag 120
cgggaagtga acaaggccct gtacgacctg cagagaagcg ccatggtgta cagcagcgac 180
gacatccctc ctcggtggtt tatgaccaca gaggccgaca agcccgacgc cgatgctatg 240
gccgatgtga tcatcgacga cgtgtcccgc gagaagtcca tgagagagga ccacaagagc 300
ttcgatgacg tgatccccgc caagaagatc atcgattgga aggacgccaa tcctgtgacc 360
atcatcaacg agtactgcca gatcaccaag cgcgactggt ccttcagaat cgagagcgtg 420
ggccccagca acagccctac cttttatgcc tgcgtggaca tcgacggccg ggtgttcgat 480
aaggccgatg gcaagagcaa gcgggacgcc aaaaacaacg ccgccaaact ggccgtggat 540
aagctgctgg gctacgtgat catccggttc tga 573
<210> 25
<211> 573
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding VACV E3L protein
<400> 25
augagcaaga ucuacaucga cgagcggagc gacgccgaga uugugugugc cgccaucaag 60
aacaucggca ucgaaggcgc uacagccgcu cagcugacca gacagcugaa cauggaaaag 120
cgggaaguga acaaggcccu guacgaccug cagagaagcg ccauggugua cagcagcgac 180
gacaucccuc cucggugguu uaugaccaca gaggccgaca agcccgacgc cgaugcuaug 240
gccgauguga ucaucgacga cgugucccgc gagaagucca ugagagagga ccacaagagc 300
uucgaugacg ugauccccgc caagaagauc aucgauugga aggacgccaa uccugugacc 360
aucaucaacg aguacugcca gaucaccaag cgcgacuggu ccuucagaau cgagagcgug 420
ggccccagca acagcccuac cuuuuaugcc ugcguggaca ucgacggccg gguguucgau 480
aaggccgaug gcaagagcaa gcgggacgcc aaaaacaacg ccgccaaacu ggccguggau 540
aagcugcugg gcuacgugau cauccgguuc uga 573
<210> 26
<211> 88
<212> PRT
<213> Vaccinia virus
<400> 26
Met Leu Ala Phe Cys Tyr Ser Leu Pro Asn Ala Gly Asp Val Ile Lys
1 5 10 15
Gly Arg Val Tyr Glu Lys Asp Tyr Ala Leu Tyr Ile Tyr Leu Phe Asp
20 25 30
Tyr Pro His Ser Glu Ala Ile Leu Ala Glu Ser Val Lys Met His Met
35 40 45
Asp Arg Tyr Val Glu Tyr Arg Asp Lys Leu Val Gly Lys Thr Val Lys
50 55 60
Val Lys Val Ile Arg Val Asp Tyr Thr Lys Gly Tyr Ile Asp Val Asn
65 70 75 80
Tyr Lys Arg Met Cys Arg His Gln
85
<210> 27
<211> 264
<212> DNA
<213> Vaccinia virus
<400> 27
atgcttgcat tttgttattc gttgcccaat gcgggcgatg taataaaggg cagagtatac 60
gagaaggatt atgctctata catttatctt tttgactatc ctcactctga agctatcttg 120
gcagagagtg ttaagatgca tatggataga tatgttgaat atagggataa actggtaggg 180
aaaactgtaa aagttaaagt gattagagtt gattatacaa aaggatatat agatgtcaat 240
tacaaaagga tgtgtagaca tcaa 264
<210> 28
<211> 264
<212> RNA
<213> Vaccinia virus
<400> 28
augcuugcau uuuguuauuc guugcccaau gcgggcgaug uaauaaaggg cagaguauac 60
gagaaggauu augcucuaua cauuuaucuu uuugacuauc cucacucuga agcuaucuug 120
gcagagagug uuaagaugca uauggauaga uauguugaau auagggauaa acugguaggg 180
aaaacuguaa aaguuaaagu gauuagaguu gauuauacaa aaggauauau agaugucaau 240
uacaaaagga uguguagaca ucaa 264
<210> 29
<211> 267
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding VACV K3L protein
<400> 29
atgctggcct tctgctacag cctgcctaat gccggcgacg tgatcaaggg cagagtgtac 60
gagaaggact acgccctgta catctacctg ttcgactacc ctcacagcga ggccatcctg 120
gccgagtctg tgaagatgca catggacaga tacgtggaat accgggacaa gctcgtgggc 180
aagaccgtga aagtgaaagt catcagagtg gactacacca agggctacat cgacgtgaac 240
tacaagcgga tgtgcaggca ccagtga 267
<210> 30
<211> 267
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding VACV K3L protein
<400> 30
augcuggccu ucugcuacag ccugccuaau gccggcgacg ugaucaaggg cagaguguac 60
gagaaggacu acgcccugua caucuaccug uucgacuacc cucacagcga ggccauccug 120
gccgagucug ugaagaugca cauggacaga uacguggaau accgggacaa gcucgugggc 180
aagaccguga aagugaaagu caucagagug gacuacacca agggcuacau cgacgugaac 240
uacaagcgga ugugcaggca ccaguga 267
<210> 31
<211> 151
<212> PRT
<213> Vaccinia virus
<400> 31
Met Asn Ala Tyr Asn Lys Ala Asp Ser Phe Ser Leu Glu Ser Asp Ser
1 5 10 15
Ile Lys Asp Val Ile His Asp Tyr Ile Cys Trp Leu Ser Met Thr Asp
20 25 30
Glu Met Arg Pro Ser Ile Gly Asn Val Phe Lys Ala Met Glu Thr Phe
35 40 45
Lys Ile Asp Ala Val Arg Tyr Tyr Asp Gly Asn Ile Tyr Glu Leu Ala
50 55 60
Lys Asp Ile Asn Ala Met Ser Phe Asp Gly Phe Ile Arg Ser Leu Gln
65 70 75 80
Thr Ile Ala Ser Lys Lys Asp Lys Leu Thr Val Tyr Gly Thr Met Gly
85 90 95
Leu Leu Ser Ile Val Val Asp Ile Asn Lys Gly Cys Asp Ile Ser Asn
100 105 110
Ile Lys Phe Ala Ala Gly Ile Ile Ile Leu Met Glu Tyr Ile Phe Asp
115 120 125
Asp Thr Asp Met Ser His Leu Lys Val Ala Leu Tyr Arg Arg Ile Gln
130 135 140
Arg Arg Asp Asp Val Asp Arg
145 150
<210> 32
<211> 453
<212> DNA
<213> Vaccinia virus
<400> 32
atgaatgcgt ataataaagc cgattcgttt tctttagagt ctgattctat caaagatgtt 60
atacacgatt atatttgttg gctcagtatg actgatgaaa tgagaccatc tatcggaaac 120
gtctttaaag cgatggaaac gtttaagata gacgcggtta gatattacga tggtaacata 180
tatgaattag ctaaagatat aaatgcgatg tcgtttgacg gttttataag atctctacaa 240
actatcgctt caaagaaaga taaactcact gtttatggaa ccatgggact gctgtctatt 300
gtcgtagata ttaacaaagg ttgtgatata tccaatatca agttcgctgc cggaataatc 360
attttaatgg agtatatttt tgatgacacg gatatgtctc atcttaaagt agcactctat 420
cgtagaatac agagacgtga tgatgtagat aga 453
<210> 33
<211> 453
<212> RNA
<213> Vaccinia virus
<400> 33
augaaugcgu auaauaaagc cgauucguuu ucuuuagagu cugauucuau caaagauguu 60
auacacgauu auauuuguug gcucaguaug acugaugaaa ugagaccauc uaucggaaac 120
gucuuuaaag cgauggaaac guuuaagaua gacgcgguua gauauuacga ugguaacaua 180
uaugaauuag cuaaagauau aaaugcgaug ucguuugacg guuuuauaag aucucuacaa 240
acuaucgcuu caaagaaaga uaaacucacu guuuauggaa ccaugggacu gcugucuauu 300
gucguagaua uuaacaaagg uugugauaua uccaauauca aguucgcugc cggaauaauc 360
auuuuaaugg aguauauuuu ugaugacacg gauaugucuc aucuuaaagu agcacucuau 420
cguagaauac agagacguga ugauguagau aga 453
<210> 34
<211> 456
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding Vaccinia C6 protein
<400> 34
atgaacgcct acaacaaggc cgacagcttc agcctggaaa gcgacagcat caaggacgtg 60
atccacgact acatctgctg gctgagcatg accgacgaga tgaggcccag catcggcaac 120
gtgttcaagg ccatggaaac cttcaagatc gacgccgtgc ggtactacga cggcaacatc 180
tatgagctgg ccaaggacat caacgccatg agcttcgacg gcttcatcag aagcctgcag 240
acaatcgcca gcaagaaaga caagctgacc gtgtacggca ccatgggcct gctgtctatc 300
gtggtggata tcaacaaggg ctgcgacatc agcaacatca agttcgccgc tggcatcatc 360
atcctgatgg agtacatctt cgacgacacc gacatgagcc acctgaaggt ggccctgtac 420
agaagaatcc agcggaggga cgacgtggac agatga 456
<210> 35
<211> 456
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding Vaccinia C6 protein
<400> 35
augaacgccu acaacaaggc cgacagcuuc agccuggaaa gcgacagcau caaggacgug 60
auccacgacu acaucugcug gcugagcaug accgacgaga ugaggcccag caucggcaac 120
guguucaagg ccauggaaac cuucaagauc gacgccgugc gguacuacga cggcaacauc 180
uaugagcugg ccaaggacau caacgccaug agcuucgacg gcuucaucag aagccugcag 240
acaaucgcca gcaagaaaga caagcugacc guguacggca ccaugggccu gcugucuauc 300
gugguggaua ucaacaaggg cugcgacauc agcaacauca aguucgccgc uggcaucauc 360
auccugaugg aguacaucuu cgacgacacc gacaugagcc accugaaggu ggcccuguac 420
agaagaaucc agcggaggga cgacguggac agauga 456
<210> 36
<211> 143
<212> PRT
<213> Middle East Respiratory Syndrome virus
<400> 36
Met Pro Ile Pro Pro Leu Arg Lys Met Leu Gly Ile Gly Gly Asp Arg
1 5 10 15
Thr Glu Lys Leu Ile Pro Gly Met Glu Leu Ser Asn Trp Leu Pro Gly
20 25 30
Gly Thr Ser Thr Thr Leu Glu Leu Asp Pro Lys Gln His Ser His Ser
35 40 45
Gly Leu Leu Arg Met Ala Ser Phe Gly Ser Met Lys Met Ala Pro Leu
50 55 60
Met Leu Leu Gln Leu Leu Gly Arg Gly Thr Leu Thr Met Ile Gln Leu
65 70 75 80
Leu Leu His Asn Ser Arg Pro Val Leu Ser Phe Leu Lys Thr Ser Thr
85 90 95
Leu Arg Gly Leu Glu Ala Ile Val Asn His Leu Gln Glu Pro Leu Ala
100 105 110
Gln Ala Glu Thr Leu Pro Asp Leu Val His Lys Val Gln Asp Gln Glu
115 120 125
Thr Leu Pro Ala Ala Leu Leu Gln Val His Leu Glu Ser Glu Gln
130 135 140
<210> 37
<211> 429
<212> DNA
<213> Middle East Respiratory Syndrome virus
<400> 37
atgccaattc cacccctgcg caaaatgctg ggtattggcg gagacaggac agaaaaatta 60
ataccgggaa tggaattaag caactggctc ccaggtggta cttctactac actggaactg 120
gacccgaagc agcactccca ttccgggctg ttaaggatgg catcgtttgg gtccatgaag 180
atggcgccac tgatgctcct tcaacttttg ggacgcggaa ccctaacaat gattcagcta 240
ttgttacaca attcgcgccc ggtactaagc ttcctaaaaa cttccacatt gaggggactg 300
gaggcaatag tcaatcatct tcaagagcct ctagcgcaag cagaaactct tccagatcta 360
gttcacaagg ttcaagatca ggaaactcta cccgcggcac ttctccaggt ccatctggaa 420
tcggagcag 429
<210> 38
<211> 429
<212> RNA
<213> Middle East Respiratory Syndrome virus
<400> 38
augccaauuc caccccugcg caaaaugcug gguauuggcg gagacaggac agaaaaauua 60
auaccgggaa uggaauuaag caacuggcuc ccagguggua cuucuacuac acuggaacug 120
gacccgaagc agcacuccca uuccgggcug uuaaggaugg caucguuugg guccaugaag 180
auggcgccac ugaugcuccu ucaacuuuug ggacgcggaa cccuaacaau gauucagcua 240
uuguuacaca auucgcgccc gguacuaagc uuccuaaaaa cuuccacauu gaggggacug 300
gaggcaauag ucaaucaucu ucaagagccu cuagcgcaag cagaaacucu uccagaucua 360
guucacaagg uucaagauca ggaaacucua cccgcggcac uucuccaggu ccaucuggaa 420
ucggagcag 429
<210> 39
<211> 432
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding MERS ORF8b protein
<400> 39
atgcccattc ctccactgag aaagatgctc ggcatcggcg gcgacagaac cgagaagctg 60
atccctggca tggaactgag caactggctg cctggcggca ccagcacaac actggaactg 120
gatcctaagc agcacagcca cagcggcctg ctgagaatgg ccagctttgg cagcatgaag 180
atggcccctc tgatgctgct gcagctgctc ggaagaggca ccctgacaat gatccagctg 240
ctgctccaca acagcagacc cgtgctgagc ttcctgaaaa ccagcacact gagaggcctg 300
gaagccatcg tgaaccatct gcaagagccc ctggctcagg ccgagacact gcctgatctg 360
gtgcacaagg tgcaggacca agaaaccctg cctgccgctc tgctgcaggt ccacctggaa 420
tctgagcagt ga 432
<210> 40
<211> 432
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding MERS ORF8b protein
<400> 40
augcccauuc cuccacugag aaagaugcuc ggcaucggcg gcgacagaac cgagaagcug 60
aucccuggca uggaacugag caacuggcug ccuggcggca ccagcacaac acuggaacug 120
gauccuaagc agcacagcca cagcggccug cugagaaugg ccagcuuugg cagcaugaag 180
auggccccuc ugaugcugcu gcagcugcuc ggaagaggca cccugacaau gauccagcug 240
cugcuccaca acagcagacc cgugcugagc uuccugaaaa ccagcacacu gagaggccug 300
gaagccaucg ugaaccaucu gcaagagccc cuggcucagg ccgagacacu gccugaucug 360
gugcacaagg ugcaggacca agaaacccug ccugccgcuc ugcugcaggu ccaccuggaa 420
ucugagcagu ga 432
<210> 41
<211> 131
<212> PRT
<213> Kaposi's sarcoma-associated herpesvirus
<400> 41
Met Ala Ala Pro Arg Gly Arg Pro Lys Lys Asp Leu Thr Met Glu Asp
1 5 10 15
Leu Thr Ala Lys Ile Ser Gln Leu Thr Val Glu Asn Arg Glu Leu Arg
20 25 30
Lys Ala Leu Gly Ser Thr Ala Asp Pro Arg Asp Arg Pro Leu Thr Ala
35 40 45
Thr Glu Lys Glu Ala Gln Leu Thr Ala Thr Val Gly Ala Leu Ser Ala
50 55 60
Ala Ala Ala Lys Lys Ile Glu Ala Arg Val Arg Thr Ile Phe Ser Lys
65 70 75 80
Val Val Thr Gln Lys Gln Val Asp Asp Ala Leu Lys Gly Leu Ser Leu
85 90 95
Arg Ile Asp Val Cys Met Ser Asp Gly Gly Thr Ala Lys Pro Pro Pro
100 105 110
Gly Ala Asn Asn Arg Arg Arg Arg Gly Ala Ser Thr Thr Arg Ala Gly
115 120 125
Val Asp Asp
130
<210> 42
<211> 393
<212> DNA
<213> Kaposi's sarcoma-associated herpesvirus
<400> 42
atggccgcgc ccaggggcag acccaaaaag gaccttacga tggaagacct aaccgcaaag 60
ataagccaat tgactgtgga gaatcgggag cttcggaaag cactgggatc cactgccgat 120
ccgagagatc ggcctctgac ggccaccgag aaggaagcgc agcttaccgc tactgtgggt 180
gcactgagtg cggcggccgc taagaaaatc gaagccaggg tcaggacaat attcagcaag 240
gttgtaacac aaaagcaagt ggacgatgcc ctgaagggac tttcgcttag aatcgacgtc 300
tgcatgtcag acgggggcac cgctaaaccg cctcctggtg ccaataacag gcgacgaaga 360
ggagcctcga caacacgggc gggggttgat gac 393
<210> 43
<211> 393
<212> RNA
<213> Kaposi's sarcoma-associated herpesvirus
<400> 43
auggccgcgc ccaggggcag acccaaaaag gaccuuacga uggaagaccu aaccgcaaag 60
auaagccaau ugacugugga gaaucgggag cuucggaaag cacugggauc cacugccgau 120
ccgagagauc ggccucugac ggccaccgag aaggaagcgc agcuuaccgc uacugugggu 180
gcacugagug cggcggccgc uaagaaaauc gaagccaggg ucaggacaau auucagcaag 240
guuguaacac aaaagcaagu ggacgaugcc cugaagggac uuucgcuuag aaucgacguc 300
ugcaugucag acgggggcac cgcuaaaccg ccuccuggug ccaauaacag gcgacgaaga 360
ggagccucga caacacgggc ggggguugau gac 393
<210> 44
<211> 396
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding KSHV ORF52 protein
<400> 44
atggctgctc ctagaggcag acccaagaaa gacctgacca tggaagatct gaccgccaag 60
atcagccagc tgaccgtgga aaacagagag ctgagaaagg ccctgggcag caccgccgat 120
cctagagata gacctctgac agccaccgag aaagaggccc agctgacagc tacagtggga 180
gccctttctg ccgccgctgc caagaaaatt gaagccagag tgcggaccat cttcagcaag 240
gtggtcaccc agaaacaggt ggacgatgcc ctgaagggcc tgagcctgag aatcgacgtg 300
tgtatgtctg acggcggcac cgccaaacct ccacctggcg ctaacaacag aagaagaaga 360
ggcgccagca ccaccagagc tggcgtggac gattga 396
<210> 45
<211> 396
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding KSHV ORF52 protein
<400> 45
auggcugcuc cuagaggcag acccaagaaa gaccugacca uggaagaucu gaccgccaag 60
aucagccagc ugaccgugga aaacagagag cugagaaagg cccugggcag caccgccgau 120
ccuagagaua gaccucugac agccaccgag aaagaggccc agcugacagc uacaguggga 180
gcccuuucug ccgccgcugc caagaaaauu gaagccagag ugcggaccau cuucagcaag 240
guggucaccc agaaacaggu ggacgaugcc cugaagggcc ugagccugag aaucgacgug 300
uguaugucug acggcggcac cgccaaaccu ccaccuggcg cuaacaacag aagaagaaga 360
ggcgccagca ccaccagagc uggcguggac gauuga 396
<210> 46
<211> 340
<212> PRT
<213> Ebola virus
<400> 46
Met Thr Thr Arg Thr Lys Gly Arg Gly His Thr Ala Ala Thr Thr Gln
1 5 10 15
Asn Asp Arg Met Pro Gly Pro Glu Leu Ser Gly Trp Ile Ser Glu Gln
20 25 30
Leu Met Thr Gly Arg Ile Pro Val Ser Asp Ile Phe Cys Asp Ile Glu
35 40 45
Asn Asn Pro Gly Leu Cys Tyr Ala Ser Gln Met Gln Gln Thr Lys Pro
50 55 60
Asn Pro Lys Thr Arg Asn Ser Gln Thr Gln Thr Asp Pro Ile Cys Asn
65 70 75 80
His Ser Phe Glu Glu Val Val Gln Thr Leu Ala Ser Leu Ala Thr Val
85 90 95
Val Gln Gln Gln Thr Ile Ala Ser Glu Ser Leu Glu Gln Arg Ile Thr
100 105 110
Ser Leu Glu Asn Gly Leu Lys Pro Val Tyr Asp Met Ala Lys Thr Ile
115 120 125
Ser Ser Leu Asn Arg Val Cys Ala Glu Met Val Ala Lys Tyr Asp Leu
130 135 140
Leu Val Met Thr Thr Gly Arg Ala Thr Ala Thr Ala Ala Ala Thr Glu
145 150 155 160
Ala Tyr Trp Ala Glu His Gly Gln Pro Pro Pro Gly Pro Ser Leu Tyr
165 170 175
Glu Glu Ser Ala Ile Arg Gly Lys Ile Glu Ser Arg Asp Glu Thr Val
180 185 190
Pro Gln Ser Val Arg Glu Ala Phe Asn Asn Leu Asn Ser Thr Thr Ser
195 200 205
Leu Thr Glu Glu Asn Phe Gly Lys Pro Asp Ile Ser Ala Lys Asp Leu
210 215 220
Arg Asn Ile Met Tyr Asp His Leu Pro Gly Phe Gly Thr Ala Phe His
225 230 235 240
Gln Leu Val Gln Val Ile Cys Lys Leu Gly Lys Asp Ser Asn Ser Leu
245 250 255
Asp Ile Ile His Ala Glu Phe Gln Ala Ser Leu Ala Glu Gly Asp Ser
260 265 270
Pro Gln Cys Ala Leu Ile Gln Ile Thr Lys Arg Val Pro Ile Phe Gln
275 280 285
Asp Ala Ala Pro Pro Val Ile His Ile Arg Ser Arg Gly Asp Ile Pro
290 295 300
Arg Ala Cys Gln Lys Ser Leu Arg Pro Val Pro Pro Ser Pro Lys Ile
305 310 315 320
Asp Arg Gly Trp Val Cys Val Phe Gln Leu Gln Asp Gly Lys Thr Leu
325 330 335
Gly Leu Lys Ile
340
<210> 47
<211> 1020
<212> DNA
<213> Ebola virus
<400> 47
atgacaacta gaacaaaggg caggggccat actgcggcca cgactcaaaa cgacagaatg 60
ccaggccctg agctttcggg ctggatctct gagcagctaa tgaccggaag aattcctgta 120
agcgacatct tctgtgatat tgagaacaat ccaggattat gctacgcatc ccaaatgcaa 180
caaacgaagc caaacccgaa gacgcgcaac agtcaaaccc aaacggaccc aatttgcaat 240
catagttttg aggaggtagt acaaacattg gcttcattgg ctactgttgt gcaacaacaa 300
accatcgcat cagaatcatt agaacaacgc attacgagtc ttgagaatgg tctaaagcca 360
gtttatgata tggcaaaaac aatctcctca ttgaacaggg tttgtgctga gatggttgca 420
aaatatgatc ttctggtgat gacaaccggt cgggcaacag caaccgctgc ggcaactgag 480
gcttattggg ccgaacatgg tcaaccacca cctggaccat cactttatga agaaagtgcg 540
attcggggta agattgaatc tagagatgag accgtccctc aaagtgttag ggaggcattc 600
aacaatctaa acagtaccac ttcactaact gaggaaaatt ttgggaaacc tgacatttcg 660
gcaaaggatt tgagaaacat tatgtatgat cacttgcctg gttttggaac tgctttccac 720
caattagtac aagtgatttg taaattggga aaagatagca actcattgga catcattcat 780
gctgagttcc aggccagcct ggctgaagga gactctcctc aatgtgccct aattcaaatt 840
acaaaaagag ttccaatctt ccaagatgct gctccacctg tcatccacat ccgctctcga 900
ggtgacattc cccgagcttg ccagaaaagc ttgcgtccag tcccaccatc gcccaagatt 960
gatcgaggtt gggtatgtgt ttttcagctt caagatggta aaacacttgg actcaaaatt 1020
1020
<210> 48
<211> 1020
<212> RNA
<213> Ebola virus
<400> 48
augacaacua gaacaaaggg caggggccau acugcggcca cgacucaaaa cgacagaaug 60
ccaggcccug agcuuucggg cuggaucucu gagcagcuaa ugaccggaag aauuccugua 120
agcgacaucu ucugugauau ugagaacaau ccaggauuau gcuacgcauc ccaaaugcaa 180
caaacgaagc caaacccgaa gacgcgcaac agucaaaccc aaacggaccc aauuugcaau 240
cauaguuuug aggagguagu acaaacauug gcuucauugg cuacuguugu gcaacaacaa 300
accaucgcau cagaaucauu agaacaacgc auuacgaguc uugagaaugg ucuaaagcca 360
guuuaugaua uggcaaaaac aaucuccuca uugaacaggg uuugugcuga gaugguugca 420
aaauaugauc uucuggugau gacaaccggu cgggcaacag caaccgcugc ggcaacugag 480
gcuuauuggg ccgaacaugg ucaaccacca ccuggaccau cacuuuauga agaaagugcg 540
auucggggua agauugaauc uagagaugag accgucccuc aaaguguuag ggaggcauuc 600
aacaaucuaa acaguaccac uucacuaacu gaggaaaauu uugggaaacc ugacauuucg 660
gcaaaggauu ugagaaacau uauguaugau cacuugccug guuuuggaac ugcuuuccac 720
caauuaguac aagugauuug uaaauuggga aaagauagca acucauugga caucauucau 780
gcugaguucc aggccagccu ggcugaagga gacucuccuc aaugugcccu aauucaaauu 840
acaaaaagag uuccaaucuu ccaagaugcu gcuccaccug ucauccacau ccgcucucga 900
ggugacauuc cccgagcuug ccagaaaagc uugcguccag ucccaccauc gcccaagauu 960
gaucgagguu ggguaugugu uuuucagcuu caagauggua aaacacuugg acucaaaauu 1020
1020
<210> 49
<211> 1023
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding Ebola VP35 protein
<400> 49
atgaccacca ggaccaaagg cagaggacac accgccgcca ccacacagaa cgacagaatg 60
cctggacctg agctgagcgg ctggatctct gagcagctga tgacaggcag aatccccgtg 120
tccgacatct tctgcgacat cgagaacaac cccggcctgt gttacgccag ccagatgcag 180
cagaccaagc ctaatcctaa gacacggaac agccagacac agacagaccc catctgcaac 240
cacagcttcg aggaagtggt gcagacactg gccagcctgg ctacagttgt gcagcagcag 300
acaatcgcca gcgagagcct ggaacagaga atcaccagcc tggaaaacgg cctgaagcct 360
gtgtacgaca tggccaagac catcagctcc ctgaacagag tgtgcgccga gatggtggcc 420
aaatacgacc tgctcgtgat gaccaccggc agagccacag ctacagccgc tgccacagaa 480
gcctattggg ccgaacatgg acagcctcca cctggaccta gcctgtacga ggaatctgcc 540
atccggggca agatcgagag cagggatgag acagtgcccc agtctgtgcg cgaggccttc 600
aacaacctga acagcaccac aagcctgacc gaggaaaact tcggcaagcc cgacatcagc 660
gccaaggacc tgcggaacat tatgtacgac catctgcctg gcttcggcac cgccttccat 720
cagctggtgc aagtgatctg caagctgggc aaagacagca acagcctgga catcatccac 780
gccgagtttc aggcctctct ggccgaaggc gattctcctc agtgtgccct gatccagatc 840
accaagcggg tgcccatctt ccaggatgct gcccctcctg tgatccacat cagaagcaga 900
ggcgacatcc ccagagcctg ccagaaatct ctcagacccg tgcctccatc tcctaagatc 960
gacagaggct gggtctgcgt gttccagctg caagatggca agaccctggg cctgaagatc 1020
tga 1023
<210> 50
<211> 1023
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding Ebola VP35 protein
<400> 50
augaccacca ggaccaaagg cagaggacac accgccgcca ccacacagaa cgacagaaug 60
ccuggaccug agcugagcgg cuggaucucu gagcagcuga ugacaggcag aauccccgug 120
uccgacaucu ucugcgacau cgagaacaac cccggccugu guuacgccag ccagaugcag 180
cagaccaagc cuaauccuaa gacacggaac agccagacac agacagaccc caucugcaac 240
cacagcuucg aggaaguggu gcagacacug gccagccugg cuacaguugu gcagcagcag 300
acaaucgcca gcgagagccu ggaacagaga aucaccagcc uggaaaacgg ccugaagccu 360
guguacgaca uggccaagac caucagcucc cugaacagag ugugcgccga gaugguggcc 420
aaauacgacc ugcucgugau gaccaccggc agagccacag cuacagccgc ugccacagaa 480
gccuauuggg ccgaacaugg acagccucca ccuggaccua gccuguacga ggaaucugcc 540
auccggggca agaucgagag cagggaugag acagugcccc agucugugcg cgaggccuuc 600
aacaaccuga acagcaccac aagccugacc gaggaaaacu ucggcaagcc cgacaucagc 660
gccaaggacc ugcggaacau uauguacgac caucugccug gcuucggcac cgccuuccau 720
cagcuggugc aagugaucug caagcugggc aaagacagca acagccugga caucauccac 780
gccgaguuuc aggccucucu ggccgaaggc gauucuccuc agugugcccu gauccagauc 840
accaagcggg ugcccaucuu ccaggaugcu gccccuccug ugauccacau cagaagcaga 900
ggcgacaucc ccagagccug ccagaaaucu cucagacccg ugccuccauc uccuaagauc 960
gacagaggcu gggucugcgu guuccagcug caagauggca agacccuggg ccugaagauc 1020
uga 1023
<210> 51
<211> 156
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<220>
<221> MISC_FEATURE
<222> (23)
<223> X is a stop codon
<220>
<221> MISC_FEATURE
<222> (57)
<223> X is a stop codon
<220>
<221> MISC_FEATURE
<222> (79)
<223> X is a stop codon
<220>
<221> MISC_FEATURE
<222> (119)
<223> X is a stop codon
<220>
<221> MISC_FEATURE
<222> (156)
<223> X is a stop codon
<400> 51
Met Met Pro Thr Ile Phe Phe Ala Gly Ile Leu Ile Val Thr Thr Ile
1 5 10 15
Val Tyr Leu Thr Ile Val Xaa Leu Leu Gln Leu Ser Leu Leu Gln Val
20 25 30
Met Ala Gln Gln Val Leu Phe Leu Asn Met Thr Thr Arg Leu Val Val
35 40 45
Ile Leu Lys Asn Gly Asn Leu Glu Xaa Lys Thr Val Leu Tyr Tyr Thr
50 55 60
Val Thr Ser Leu Gln Thr Ile Thr Ser Cys Thr Gln Leu Asn Xaa Val
65 70 75 80
Gln Thr Leu Val Leu Asn Met Leu Pro Ser Ser Ser Thr Ile Lys Leu
85 90 95
Leu Met Ser Leu Lys Asn Met Ser Lys Phe Thr Gln Ser Thr Val His
100 105 110
Pro Glu Leu Leu Ile Gln Xaa Trp Asn Gln Phe Met Met Asn Arg Arg
115 120 125
Arg Leu Leu Ala Cys Leu Cys Lys His Lys Leu Met Ser Thr Asn Leu
130 135 140
Cys Thr His Ser Phe Arg Lys Arg Gln Val Arg Xaa
145 150 155
<210> 52
<211> 56
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 52
Met Met Pro Thr Ile Phe Phe Ala Gly Ile Leu Ile Val Thr Thr Ile
1 5 10 15
Val Tyr Leu Thr Ile Val Gln Leu Leu Gln Leu Ser Leu Leu Gln Val
20 25 30
Met Ala Gln Gln Val Leu Phe Leu Asn Met Thr Thr Arg Leu Val Val
35 40 45
Ile Leu Lys Asn Gly Asn Leu Glu
50 55
<210> 53
<211> 168
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 53
atgatgccaa ctattttctt tgctggcata ctaattgtta cgactattgt ataccttaca 60
atagtgcaac ttcttcaatt gtcattactt caggtgatgg cacaacaagt cctatttctg 120
aacatgacta ccagattggt ggttatactg aaaaatggga atctggag 168
<210> 54
<211> 168
<212> RNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 54
augaugccaa cuauuuucuu ugcuggcaua cuaauuguua cgacuauugu auaccuuaca 60
auagugcaac uucuucaauu gucauuacuu caggugaugg cacaacaagu ccuauuucug 120
aacaugacua ccagauuggu gguuauacug aaaaauggga aucuggag 168
<210> 55
<211> 171
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding SARS-CoV-2 ORF3b*57 protein
<400> 55
atgatgccga ccatcttctt cgccggcatc ctgatcgtga ccaccatcgt gtacctgacc 60
atcgtgcagc tgctgcagct cagcctgctg caagtgatgg ctcagcaggt cctgttcctg 120
aatatgacca ccagactggt cgtgatcctg aagaacggca acctggaatg a 171
<210> 56
<211> 171
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding SARS-CoV-2 ORF3b*57 protein
<400> 56
augaugccga ccaucuucuu cgccggcauc cugaucguga ccaccaucgu guaccugacc 60
aucgugcagc ugcugcagcu cagccugcug caagugaugg cucagcaggu ccuguuccug 120
aauaugacca ccagacuggu cgugauccug aagaacggca accuggaaug a 171
<210> 57
<211> 78
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 57
Met Met Pro Thr Ile Phe Phe Ala Gly Ile Leu Ile Val Thr Thr Ile
1 5 10 15
Val Tyr Leu Thr Ile Val Gln Leu Leu Gln Leu Ser Leu Leu Gln Val
20 25 30
Met Ala Gln Gln Val Leu Phe Leu Asn Met Thr Thr Arg Leu Val Val
35 40 45
Ile Leu Lys Asn Gly Asn Leu Glu Leu Lys Thr Val Leu Tyr Tyr Thr
50 55 60
Val Thr Ser Leu Gln Thr Ile Thr Ser Cys Thr Gln Leu Asn
65 70 75
<210> 58
<211> 234
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 58
atgatgccaa ctattttctt tgctggcata ctaattgtta cgactattgt ataccttaca 60
atagtgcaac ttcttcaatt gtcattactt caggtgatgg cacaacaagt cctatttctg 120
aacatgacta ccagattggt ggttatactg aaaaatggga atctggagtt aaagactgtg 180
ttgtattaca cagttacttc acttcagact attaccagct gtactcaact caat 234
<210> 59
<211> 234
<212> RNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 59
augaugccaa cuauuuucuu ugcuggcaua cuaauuguua cgacuauugu auaccuuaca 60
auagugcaac uucuucaauu gucauuacuu caggugaugg cacaacaagu ccuauuucug 120
aacaugacua ccagauuggu gguuauacug aaaaauggga aucuggaguu aaagacugug 180
uuguauuaca caguuacuuc acuucagacu auuaccagcu guacucaacu caau 234
<210> 60
<211> 237
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding SARS-Cov-2 ORF3b*79 protein
<400> 60
atgatgccga ccatcttctt cgccggcatc ctgatcgtga ccaccatcgt gtacctgacc 60
atcgtgcagc tgctgcagct cagcctgctg caagtgatgg ctcagcaggt cctgttcctg 120
aatatgacca ccagactggt cgtgatcctg aagaacggca acctggaact gaaaaccgtg 180
ctgtactaca ccgtgaccag cctgcagacc atcaccagct gcacccagct gaactga 237
<210> 61
<211> 237
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding SARS-CoV-2 ORF3b*79 protein
<400> 61
augaugccga ccaucuucuu cgccggcauc cugaucguga ccaccaucgu guaccugacc 60
aucgugcagc ugcugcagcu cagccugcug caagugaugg cucagcaggu ccuguuccug 120
aauaugacca ccagacuggu cgugauccug aagaacggca accuggaacu gaaaaccgug 180
cuguacuaca ccgugaccag ccugcagacc aucaccagcu gcacccagcu gaacuga 237
<210> 62
<211> 56
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 62
Met Met Pro Thr Ile Phe Phe Ala Gly Ile Leu Ile Val Thr Thr Ile
1 5 10 15
Val Tyr Leu Thr Ile Val Gln Met Leu Gln Leu Ser Leu Leu Gln Val
20 25 30
Met Ala Gln Gln Val Leu Phe Leu Asn Met Thr Thr Arg Leu Val Val
35 40 45
Ile Leu Lys Asn Gly Asn Leu Glu
50 55
<210> 63
<211> 171
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 63
atgatgccaa ctattttctt tgctggcata ctaattgtta cgactattgt ataccttaca 60
atagtgcaaa tgcttcaatt gtcattactt caggtgatgg cacaacaagt cctatttctg 120
aacatgacta ccagattggt ggttatactg aaaaatggga atctggagta a 171
<210> 64
<211> 171
<212> RNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 64
augaugccaa cuauuuucuu ugcuggcaua cuaauuguua cgacuauugu auaccuuaca 60
auagugcaaa ugcuucaauu gucauuacuu caggugaugg cacaacaagu ccuauuucug 120
aacaugacua ccagauuggu gguuauacug aaaaauggga aucuggagua a 171
<210> 65
<211> 171
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding SARS-CoV-2 ORF3b*57 protein
<400> 65
atgatgccga ccatcttctt cgccggcatc ctgatcgtga ccaccatcgt gtacctgacc 60
atcgtgcaga tgctgcagct gagcctgctg caagtgatgg cccagcaggt cctgttcctg 120
aatatgacca ccagactggt cgtgatcctg aagaacggca acctggaatg a 171
<210> 66
<211> 171
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding SARS-CoV-2 ORF3b*57 protein
<400> 66
augaugccga ccaucuucuu cgccggcauc cugaucguga ccaccaucgu guaccugacc 60
aucgugcaga ugcugcagcu gagccugcug caagugaugg cccagcaggu ccuguuccug 120
aauaugacca ccagacuggu cgugauccug aagaacggca accuggaaug a 171
<210> 67
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> 26S promoter
<400> 67
gggcccctat aactctctac ggctaacctg aatggactac gacat 45
<210> 68
<211> 19
<212> PRT
<213> Artificial Sequence
<220>
<223> P2A spacer sequence
<400> 68
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
1 5 10 15
Pro Gly Pro
<210> 69
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> T2A spacer sequence
<400> 69
Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp Val Glu Ser
1 5 10 15
Asn Pro Gly Pro
20
<210> 70
<211> 22
<212> PRT
<213> Artificial Sequence
<220>
<223> F2A spacer sequence
<400> 70
Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val
1 5 10 15
Glu Ser Asn Pro Gly Pro
20
<210> 71
<211> 6
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<222> (2)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (5)
<223> Xaa can be any naturally occurring amino acid
<400> 71
Arg Xaa Arg Lys Xaa Arg
1 5
<210> 72
<211> 6
<212> PRT
<213> Homo sapiens
<400> 72
Arg Arg Arg Arg Arg Arg
1 5
<210> 73
<211> 27
<212> PRT
<213> Artificial Sequence
<220>
<223> Furin/T2A spacer sequence
<400> 73
Arg Arg Arg Arg Arg Arg Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu
1 5 10 15
Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro
20 25
<210> 74
<211> 461
<212> DNA
<213> Foot-and-mouth disease virus
<400> 74
agcaggtttc cccaactgac acaaaacgtg caacttgaaa ctccgcctgg tctttccagg 60
tctagagggg taacactttg tactgcgttt ggctccacgc tcgatccact ggcgagtgtt 120
agtaacagca ctgttgcttc gtagcggagc atgacggccg tgggaactcc tccttggtaa 180
caaggaccca cggggccaaa agccacgccc acacgggccc gtcatgtgtg caaccccagc 240
acggcgactt tactgcgaaa cccactttaa agtgacattg aaactggtac ccacacactg 300
gtgacaggct aaggatgccc ttcaggtacc ccgaggtaac acgcgacact cgggatctga 360
gaaggggact ggggcttcta taaaagcgct cggtttaaaa agcttctatg cctgaatagg 420
tgaccggagg tcggcacctt tcctttgcaa ttactgacca c 461
<210> 75
<211> 551
<212> DNA
<213> Encephalomyocarditis virus
<400> 75
cgttactggc cgaagccgct tggaataagg ccggtgtgcg tttgtctata tgttattttc 60
caccatattg ccgtcttttg gcaatgtgag ggcccggaaa cctggccctg tcttcttgac 120
gagcattcct aggggtcttt cccctctcgc caaaggaatg caaggtctgt tgaatgtcgt 180
gaaggaagca gttcctctgg aagcttcttg aagacaaaca acgtctgtag cgaccctttg 240
caggcagcgg aaccccccac ctggcgacag gtgcctctgc ggccaaaagc cacgtgtata 300
agatacacct gcaaaggcgg cacaacccca gtgccacgtt gtgagttgga tagttgtgga 360
aagagtcaaa tggctcccct caagcgtatt caacaagggg ctgaaggatg cccagaaggt 420
accccattgt atgggatctg atctggggcc tcggtgcaca tgcttttcat gtgtttagtc 480
gaggttaaaa aacgtctagg ccccccgaac cacggggacg tggttttcct ttgaaaaaca 540
cgatgataat a 551
<210> 76
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Flexible linker sequence
<400> 76
ggaggtggcg ggtccggggg cgggggtagc ggtggcgggg gctcc 45
<210> 77
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> Flexible linker sequence
<400> 77
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
1 5 10 15
<210> 78
<211> 535
<212> PRT
<213> Unknown
<220>
<223> Non-structural protein 1
<400> 78
Met Glu Lys Val His Val Asp Ile Glu Glu Asp Ser Pro Phe Leu Arg
1 5 10 15
Ala Leu Gln Arg Ser Phe Pro Gln Phe Glu Val Glu Ala Lys Gln Val
20 25 30
Thr Asp Asn Asp His Ala Asn Ala Arg Ala Phe Ser His Leu Ala Ser
35 40 45
Lys Leu Ile Glu Thr Glu Val Asp Pro Ser Asp Thr Ile Leu Asp Ile
50 55 60
Gly Ser Ala Pro Ala Arg Arg Met Tyr Ser Lys His Lys Tyr His Cys
65 70 75 80
Ile Cys Pro Met Arg Cys Ala Glu Asp Pro Asp Arg Leu Tyr Lys Tyr
85 90 95
Ala Thr Lys Leu Lys Lys Asn Cys Lys Glu Ile Thr Asp Lys Glu Leu
100 105 110
Asp Lys Lys Met Lys Glu Leu Ala Ala Val Met Ser Asp Pro Asp Leu
115 120 125
Glu Thr Glu Thr Met Cys Leu His Asp Asp Glu Ser Cys Arg Tyr Glu
130 135 140
Gly Gln Val Ala Val Tyr Gln Asp Val Tyr Ala Val Asp Gly Pro Thr
145 150 155 160
Ser Leu Tyr His Gln Ala Asn Lys Gly Val Arg Val Ala Tyr Trp Ile
165 170 175
Gly Phe Asp Thr Thr Pro Phe Met Phe Lys Asn Leu Ala Gly Ala Tyr
180 185 190
Pro Ser Tyr Ser Thr Asn Trp Ala Asp Glu Thr Val Leu Thr Ala Arg
195 200 205
Asn Ile Gly Leu Cys Ser Ser Asp Val Met Glu Arg Ser Arg Arg Gly
210 215 220
Met Ser Ile Leu Arg Lys Lys Tyr Leu Lys Pro Ser Asn Asn Val Leu
225 230 235 240
Phe Ser Val Gly Ser Thr Ile Tyr His Glu Lys Arg Asp Leu Leu Arg
245 250 255
Ser Trp His Leu Pro Ser Val Phe His Leu Arg Gly Lys Gln Asn Tyr
260 265 270
Thr Cys Arg Cys Glu Thr Ile Val Ser Cys Asp Gly Tyr Val Val Lys
275 280 285
Arg Ile Ala Ile Ser Pro Gly Leu Tyr Gly Lys Pro Ser Gly Tyr Ala
290 295 300
Ala Thr Met His Arg Glu Gly Phe Leu Cys Cys Lys Val Thr Asp Thr
305 310 315 320
Leu Asn Gly Glu Arg Val Ser Phe Pro Val Cys Thr Tyr Val Pro Ala
325 330 335
Thr Leu Cys Asp Gln Met Thr Gly Ile Leu Ala Thr Asp Val Ser Ala
340 345 350
Asp Asp Ala Gln Lys Leu Leu Val Gly Leu Asn Gln Arg Ile Val Val
355 360 365
Asn Gly Arg Thr Gln Arg Asn Thr Asn Thr Met Lys Asn Tyr Leu Leu
370 375 380
Pro Val Val Ala Gln Ala Phe Ala Arg Trp Ala Lys Glu Tyr Lys Glu
385 390 395 400
Asp Gln Glu Asp Glu Arg Pro Leu Gly Leu Arg Asp Arg Gln Leu Val
405 410 415
Met Gly Cys Cys Trp Ala Phe Arg Arg His Lys Ile Thr Ser Ile Tyr
420 425 430
Lys Arg Pro Asp Thr Gln Thr Ile Ile Lys Val Asn Ser Asp Phe His
435 440 445
Ser Phe Val Leu Pro Arg Ile Gly Ser Asn Thr Leu Glu Ile Gly Leu
450 455 460
Arg Thr Arg Ile Arg Lys Met Leu Glu Glu His Lys Glu Pro Ser Pro
465 470 475 480
Leu Ile Thr Ala Glu Asp Val Gln Glu Ala Lys Cys Ala Ala Asp Glu
485 490 495
Ala Lys Glu Val Arg Glu Ala Glu Glu Leu Arg Ala Ala Leu Pro Pro
500 505 510
Leu Ala Ala Asp Val Glu Glu Pro Thr Leu Glu Ala Asp Val Asp Leu
515 520 525
Met Leu Gln Glu Ala Gly Ala
530 535
<210> 79
<211> 1605
<212> DNA
<213> Unknown
<220>
<223> Non-structural protein 1
<400> 79
atggagaaag ttcacgttga catcgaggaa gacagcccat tcctcagagc tttgcagcgg 60
agcttcccgc agtttgaggt agaagccaag caggtcactg ataatgacca tgctaatgcc 120
agagcgtttt cgcatctggc ttcaaaactg atcgaaacgg aggtggaccc atccgacacg 180
atccttgaca ttggaagtgc gcccgcccgc agaatgtatt ctaagcacaa gtatcattgt 240
atctgtccga tgagatgtgc ggaagatccg gacagattgt ataagtatgc aactaagctg 300
aagaaaaact gtaaggaaat aactgataag gaattggaca agaaaatgaa ggagctggcc 360
gccgtcatga gcgaccctga cctggaaact gagactatgt gcctccacga cgacgagtcg 420
tgtcgctacg aagggcaagt cgctgtttac caggatgtat acgcggttga cggaccgaca 480
agtctctatc accaagccaa taagggagtt agagtcgcct actggatagg ctttgacacc 540
acccctttta tgtttaagaa cttggctgga gcatatccat catactctac caactgggcc 600
gacgaaaccg tgttaacggc tcgtaacata ggcctatgca gctctgacgt tatggagcgg 660
tcacgtagag ggatgtccat tcttagaaag aagtatttga aaccatccaa caatgttcta 720
ttctctgttg gctcgaccat ctaccacgag aagagggact tactgaggag ctggcacctg 780
ccgtctgtat ttcacttacg tggcaagcaa aattacacat gtcggtgtga gactatagtt 840
agttgcgacg ggtacgtcgt taaaagaata gctatcagtc caggcctgta tgggaagcct 900
tcaggctatg ctgctacgat gcaccgcgag ggattcttgt gctgcaaagt gacagacaca 960
ttgaacgggg agagggtctc ttttcccgtg tgcacgtatg tgccagctac attgtgtgac 1020
caaatgactg gcatactggc aacagatgtc agtgcggacg acgcgcaaaa actgctggtt 1080
gggctcaacc agcgtatagt cgtcaacggt cgcacccaga gaaacaccaa taccatgaaa 1140
aattaccttt tgcccgtagt ggcccaggca tttgctaggt gggcaaagga atataaggaa 1200
gatcaagaag atgaaaggcc actaggacta cgagatagac agttagtcat ggggtgttgt 1260
tgggctttta gaaggcacaa gataacatct atttataagc gcccggatac ccaaaccatc 1320
atcaaagtga acagcgattt ccactcattc gtgctgccca ggataggcag taacacattg 1380
gagatcgggc tgagaacaag aatcaggaaa atgttagagg agcacaagga gccgtcacct 1440
ctcattaccg ccgaggacgt acaagaagct aagtgcgcag ccgatgaggc taaggaggtg 1500
cgtgaagccg aggagttgcg cgcagctcta ccacctttgg cagctgatgt tgaggagccc 1560
actctggaag ccgatgtcga cttgatgtta caagaggctg gggcc 1605
<210> 80
<211> 1605
<212> RNA
<213> Unknown
<220>
<223> Non-structural protein 1
<400> 80
auggagaaag uucacguuga caucgaggaa gacagcccau uccucagagc uuugcagcgg 60
agcuucccgc aguuugaggu agaagccaag caggucacug auaaugacca ugcuaaugcc 120
agagcguuuu cgcaucuggc uucaaaacug aucgaaacgg agguggaccc auccgacacg 180
auccuugaca uuggaagugc gcccgcccgc agaauguauu cuaagcacaa guaucauugu 240
aucuguccga ugagaugugc ggaagauccg gacagauugu auaaguaugc aacuaagcug 300
aagaaaaacu guaaggaaau aacugauaag gaauuggaca agaaaaugaa ggagcuggcc 360
gccgucauga gcgacccuga ccuggaaacu gagacuaugu gccuccacga cgacgagucg 420
ugucgcuacg aagggcaagu cgcuguuuac caggauguau acgcgguuga cggaccgaca 480
agucucuauc accaagccaa uaagggaguu agagucgccu acuggauagg cuuugacacc 540
accccuuuua uguuuaagaa cuuggcugga gcauauccau cauacucuac caacugggcc 600
gacgaaaccg uguuaacggc ucguaacaua ggccuaugca gcucugacgu uauggagcgg 660
ucacguagag ggauguccau ucuuagaaag aaguauuuga aaccauccaa caauguucua 720
uucucuguug gcucgaccau cuaccacgag aagagggacu uacugaggag cuggcaccug 780
ccgucuguau uucacuuacg uggcaagcaa aauuacacau gucgguguga gacuauaguu 840
aguugcgacg gguacgucgu uaaaagaaua gcuaucaguc caggccugua ugggaagccu 900
ucaggcuaug cugcuacgau gcaccgcgag ggauucuugu gcugcaaagu gacagacaca 960
uugaacgggg agagggucuc uuuucccgug ugcacguaug ugccagcuac auugugugac 1020
caaaugacug gcauacuggc aacagauguc agugcggacg acgcgcaaaa acugcugguu 1080
gggcucaacc agcguauagu cgucaacggu cgcacccaga gaaacaccaa uaccaugaaa 1140
aauuaccuuu ugcccguagu ggcccaggca uuugcuaggu gggcaaagga auauaaggaa 1200
gaucaagaag augaaaggcc acuaggacua cgagauagac aguuagucau gggguguugu 1260
ugggcuuuua gaaggcacaa gauaacaucu auuuauaagc gcccggauac ccaaaccauc 1320
aucaaaguga acagcgauuu ccacucauuc gugcugccca ggauaggcag uaacacauug 1380
gagaucgggc ugagaacaag aaucaggaaa auguuagagg agcacaagga gccgucaccu 1440
cucauuaccg ccgaggacgu acaagaagcu aagugcgcag ccgaugaggc uaaggaggug 1500
cgugaagccg aggaguugcg cgcagcucua ccaccuuugg cagcugaugu ugaggagccc 1560
acucuggaag ccgaugucga cuugauguua caagaggcug gggcc 1605
<210> 81
<211> 794
<212> PRT
<213> Unknown
<220>
<223> Non-structural protein 2
<400> 81
Gly Ser Val Glu Thr Pro Arg Gly Leu Ile Lys Val Thr Ser Tyr Asp
1 5 10 15
Gly Glu Asp Lys Ile Gly Ser Tyr Ala Val Leu Ser Pro Gln Ala Val
20 25 30
Leu Lys Ser Glu Lys Leu Ser Cys Ile His Pro Leu Ala Glu Gln Val
35 40 45
Ile Val Ile Thr His Ser Gly Arg Lys Gly Arg Tyr Ala Val Glu Pro
50 55 60
Tyr His Gly Lys Val Val Val Pro Glu Gly His Ala Ile Pro Val Gln
65 70 75 80
Asp Phe Gln Ala Leu Ser Glu Ser Ala Thr Ile Val Tyr Asn Glu Arg
85 90 95
Glu Phe Val Asn Arg Tyr Leu His His Ile Ala Thr His Gly Gly Ala
100 105 110
Leu Asn Thr Asp Glu Glu Tyr Tyr Lys Thr Val Lys Pro Ser Glu His
115 120 125
Asp Gly Glu Tyr Leu Tyr Asp Ile Asp Arg Lys Gln Cys Val Lys Lys
130 135 140
Glu Leu Val Thr Gly Leu Gly Leu Thr Gly Glu Leu Val Asp Pro Pro
145 150 155 160
Phe His Glu Phe Ala Tyr Glu Ser Leu Arg Thr Arg Pro Ala Ala Pro
165 170 175
Tyr Gln Val Pro Thr Ile Gly Val Tyr Gly Val Pro Gly Ser Gly Lys
180 185 190
Ser Gly Ile Ile Lys Ser Ala Val Thr Lys Lys Asp Leu Val Val Ser
195 200 205
Ala Lys Lys Glu Asn Cys Ala Glu Ile Ile Arg Asp Val Lys Lys Met
210 215 220
Lys Gly Leu Asp Val Asn Ala Arg Thr Val Asp Ser Val Leu Leu Asn
225 230 235 240
Gly Cys Lys His Pro Val Glu Thr Leu Tyr Ile Asp Glu Ala Phe Ala
245 250 255
Cys His Ala Gly Thr Leu Arg Ala Leu Ile Ala Ile Ile Arg Pro Lys
260 265 270
Lys Ala Val Leu Cys Gly Asp Pro Lys Gln Cys Gly Phe Phe Asn Met
275 280 285
Met Cys Leu Lys Val His Phe Asn His Glu Ile Cys Thr Gln Val Phe
290 295 300
His Lys Ser Ile Ser Arg Arg Cys Thr Lys Ser Val Thr Ser Val Val
305 310 315 320
Ser Thr Leu Phe Tyr Asp Lys Lys Met Arg Thr Thr Asn Pro Lys Glu
325 330 335
Thr Lys Ile Val Ile Asp Thr Thr Gly Ser Thr Lys Pro Lys Gln Asp
340 345 350
Asp Leu Ile Leu Thr Cys Phe Arg Gly Trp Val Lys Gln Leu Gln Ile
355 360 365
Asp Tyr Lys Gly Asn Glu Ile Met Thr Ala Ala Ala Ser Gln Gly Leu
370 375 380
Thr Arg Lys Gly Val Tyr Ala Val Arg Tyr Lys Val Asn Glu Asn Pro
385 390 395 400
Leu Tyr Ala Pro Thr Ser Glu His Val Asn Val Leu Leu Thr Arg Thr
405 410 415
Glu Asp Arg Ile Val Trp Lys Thr Leu Ala Gly Asp Pro Trp Ile Lys
420 425 430
Thr Leu Thr Ala Lys Tyr Pro Gly Asn Phe Thr Ala Thr Ile Glu Glu
435 440 445
Trp Gln Ala Glu His Asp Ala Ile Met Arg His Ile Leu Glu Arg Pro
450 455 460
Asp Pro Thr Asp Val Phe Gln Asn Lys Ala Asn Val Cys Trp Ala Lys
465 470 475 480
Ala Leu Val Pro Val Leu Lys Thr Ala Gly Ile Asp Met Thr Thr Glu
485 490 495
Gln Trp Asn Thr Val Asp Tyr Phe Glu Thr Asp Lys Ala His Ser Ala
500 505 510
Glu Ile Val Leu Asn Gln Leu Cys Val Arg Phe Phe Gly Leu Asp Leu
515 520 525
Asp Ser Gly Leu Phe Ser Ala Pro Thr Val Pro Leu Ser Ile Arg Asn
530 535 540
Asn His Trp Asp Asn Ser Pro Ser Pro Asn Met Tyr Gly Leu Asn Lys
545 550 555 560
Glu Val Val Arg Gln Leu Ser Arg Arg Tyr Pro Gln Leu Pro Arg Ala
565 570 575
Val Ala Thr Gly Arg Val Tyr Asp Met Asn Thr Gly Thr Leu Arg Asn
580 585 590
Tyr Asp Pro Arg Ile Asn Leu Val Pro Val Asn Arg Arg Leu Pro His
595 600 605
Ala Leu Val Leu His His Asn Glu His Pro Gln Ser Asp Phe Ser Ser
610 615 620
Phe Val Ser Lys Leu Lys Gly Arg Thr Val Leu Val Val Gly Glu Lys
625 630 635 640
Leu Ser Val Pro Gly Lys Met Val Asp Trp Leu Ser Asp Arg Pro Glu
645 650 655
Ala Thr Phe Arg Ala Arg Leu Asp Leu Gly Ile Pro Gly Asp Val Pro
660 665 670
Lys Tyr Asp Ile Ile Phe Val Asn Val Arg Thr Pro Tyr Lys Tyr His
675 680 685
His Tyr Gln Gln Cys Glu Asp His Ala Ile Lys Leu Ser Met Leu Thr
690 695 700
Lys Lys Ala Cys Leu His Leu Asn Pro Gly Gly Thr Cys Val Ser Ile
705 710 715 720
Gly Tyr Gly Tyr Ala Asp Arg Ala Ser Glu Ser Ile Ile Gly Ala Ile
725 730 735
Ala Arg Gln Phe Lys Phe Ser Arg Val Cys Lys Pro Lys Ser Ser Leu
740 745 750
Glu Glu Thr Glu Val Leu Phe Val Phe Ile Gly Tyr Asp Arg Lys Ala
755 760 765
Arg Thr His Asn Ser Tyr Lys Leu Ser Ser Thr Leu Thr Asn Ile Tyr
770 775 780
Thr Gly Ser Arg Leu His Glu Ala Gly Cys
785 790
<210> 82
<211> 2382
<212> DNA
<213> Unknown
<220>
<223> Non-structural protein 2
<400> 82
ggctcagtgg agacacctcg tggcttgata aaggttacca gctacgatgg cgaggacaag 60
atcggctctt acgctgtgct ttctccgcag gctgtactca agagtgaaaa attatcttgc 120
atccaccctc tcgctgaaca agtcatagtg ataacacact ctggccgaaa agggcgttat 180
gccgtggaac cataccatgg taaagtagtg gtgccagagg gacatgcaat acccgtccag 240
gactttcaag ctctgagtga aagtgccacc attgtgtaca acgaacgtga gttcgtaaac 300
aggtacctgc accatattgc cacacatgga ggagcgctga acactgatga agaatattac 360
aaaactgtca agcccagcga gcacgacggc gaatacctgt acgacatcga caggaaacag 420
tgcgtcaaga aagaactagt cactgggcta gggctcacag gcgagctggt ggatcctccc 480
ttccatgaat tcgcctacga gagtctgaga acacgaccag ccgctcctta ccaagtacca 540
accatagggg tgtatggcgt gccaggatca ggcaagtctg gcatcattaa aagcgcagtc 600
accaaaaaag atctagtggt gagcgccaag aaagaaaact gtgcagaaat tataagggac 660
gtcaagaaaa tgaaagggct ggacgtcaat gccagaactg tggactcagt gctcttgaat 720
ggatgcaaac accccgtaga gaccctgtat attgacgaag cttttgcttg tcatgcaggt 780
actctcagag cgctcatagc cattataaga cctaaaaagg cagtgctctg cggggatccc 840
aaacagtgcg gtttttttaa catgatgtgc ctgaaagtgc attttaacca cgagatttgc 900
acacaagtct tccacaaaag catctctcgc cgttgcacta aatctgtgac ttcggtcgtc 960
tcaaccttgt tttacgacaa aaaaatgaga acgacgaatc cgaaagagac taagattgtg 1020
attgacacta ccggcagtac caaacctaag caggacgatc tcattctcac ttgtttcaga 1080
gggtgggtga agcagttgca aatagattac aaaggcaacg aaataatgac ggcagctgcc 1140
tctcaagggc tgacccgtaa aggtgtgtat gccgttcggt acaaggtgaa tgaaaatcct 1200
ctgtacgcac ccacctcaga acatgtgaac gtcctactga cccgcacgga ggaccgcatc 1260
gtgtggaaaa cactagccgg cgacccatgg ataaaaacac tgactgccaa gtaccctggg 1320
aatttcactg ccacgataga ggagtggcaa gcagagcatg atgccatcat gaggcacatc 1380
ttggagagac cggaccctac cgacgtcttc cagaataagg caaacgtgtg ttgggccaag 1440
gctttagtgc cggtgctgaa gaccgctggc atagacatga ccactgaaca atggaacact 1500
gtggattatt ttgaaacgga caaagctcac tcagcagaga tagtattgaa ccaactatgc 1560
gtgaggttct ttggactcga tctggactcc ggtctatttt ctgcacccac tgttccgtta 1620
tccattagga ataatcactg ggataactcc ccgtcgccta acatgtacgg gctgaataaa 1680
gaagtggtcc gtcagctctc tcgcaggtac ccacaactgc ctcgggcagt tgccactgga 1740
agagtctatg acatgaacac tggtacactg cgcaattatg atccgcgcat aaacctagta 1800
cctgtaaaca gaagactgcc tcatgcttta gtcctccacc ataatgaaca cccacagagt 1860
gacttttctt cattcgtcag caaattgaag ggcagaactg tcctggtggt cggggaaaag 1920
ttgtccgtcc caggcaaaat ggttgactgg ttgtcagacc ggcctgaggc taccttcaga 1980
gctcggctgg atttaggcat cccaggtgat gtgcccaaat atgacataat atttgttaat 2040
gtgaggaccc catataaata ccatcactat cagcagtgtg aagaccatgc cattaagctt 2100
agcatgttga ccaagaaagc ttgtctgcat ctgaatcccg gcggaacctg tgtcagcata 2160
ggttatggtt acgctgacag ggccagcgaa agcatcattg gtgctatagc gcggcagttc 2220
aagttttccc gggtatgcaa accgaaatcc tcacttgaag agacggaagt tctgtttgta 2280
ttcattgggt acgatcgcaa ggcccgtacg cacaattctt acaagctttc atcaaccttg 2340
accaacattt atacaggttc cagactccac gaagccggat gt 2382
<210> 83
<211> 2382
<212> RNA
<213> Unknown
<220>
<223> Non-structural protein 2
<400> 83
ggcucagugg agacaccucg uggcuugaua aagguuacca gcuacgaugg cgaggacaag 60
aucggcucuu acgcugugcu uucuccgcag gcuguacuca agagugaaaa auuaucuugc 120
auccacccuc ucgcugaaca agucauagug auaacacacu cuggccgaaa agggcguuau 180
gccguggaac cauaccaugg uaaaguagug gugccagagg gacaugcaau acccguccag 240
gacuuucaag cucugaguga aagugccacc auuguguaca acgaacguga guucguaaac 300
agguaccugc accauauugc cacacaugga ggagcgcuga acacugauga agaauauuac 360
aaaacuguca agcccagcga gcacgacggc gaauaccugu acgacaucga caggaaacag 420
ugcgucaaga aagaacuagu cacugggcua gggcucacag gcgagcuggu ggauccuccc 480
uuccaugaau ucgccuacga gagucugaga acacgaccag ccgcuccuua ccaaguacca 540
accauagggg uguauggcgu gccaggauca ggcaagucug gcaucauuaa aagcgcaguc 600
accaaaaaag aucuaguggu gagcgccaag aaagaaaacu gugcagaaau uauaagggac 660
gucaagaaaa ugaaagggcu ggacgucaau gccagaacug uggacucagu gcucuugaau 720
ggaugcaaac accccguaga gacccuguau auugacgaag cuuuugcuug ucaugcaggu 780
acucucagag cgcucauagc cauuauaaga ccuaaaaagg cagugcucug cggggauccc 840
aaacagugcg guuuuuuuaa caugaugugc cugaaagugc auuuuaacca cgagauuugc 900
acacaagucu uccacaaaag caucucucgc cguugcacua aaucugugac uucggucguc 960
ucaaccuugu uuuacgacaa aaaaaugaga acgacgaauc cgaaagagac uaagauugug 1020
auugacacua ccggcaguac caaaccuaag caggacgauc ucauucucac uuguuucaga 1080
ggguggguga agcaguugca aauagauuac aaaggcaacg aaauaaugac ggcagcugcc 1140
ucucaagggc ugacccguaa agguguguau gccguucggu acaaggugaa ugaaaauccu 1200
cuguacgcac ccaccucaga acaugugaac guccuacuga cccgcacgga ggaccgcauc 1260
guguggaaaa cacuagccgg cgacccaugg auaaaaacac ugacugccaa guacccuggg 1320
aauuucacug ccacgauaga ggaguggcaa gcagagcaug augccaucau gaggcacauc 1380
uuggagagac cggacccuac cgacgucuuc cagaauaagg caaacgugug uugggccaag 1440
gcuuuagugc cggugcugaa gaccgcuggc auagacauga ccacugaaca auggaacacu 1500
guggauuauu uugaaacgga caaagcucac ucagcagaga uaguauugaa ccaacuaugc 1560
gugagguucu uuggacucga ucuggacucc ggucuauuuu cugcacccac uguuccguua 1620
uccauuagga auaaucacug ggauaacucc ccgucgccua acauguacgg gcugaauaaa 1680
gaaguggucc gucagcucuc ucgcagguac ccacaacugc cucgggcagu ugccacugga 1740
agagucuaug acaugaacac ugguacacug cgcaauuaug auccgcgcau aaaccuagua 1800
ccuguaaaca gaagacugcc ucaugcuuua guccuccacc auaaugaaca cccacagagu 1860
gacuuuucuu cauucgucag caaauugaag ggcagaacug uccugguggu cggggaaaag 1920
uuguccgucc caggcaaaau gguugacugg uugucagacc ggccugaggc uaccuucaga 1980
gcucggcugg auuuaggcau cccaggugau gugcccaaau augacauaau auuuguuaau 2040
gugaggaccc cauauaaaua ccaucacuau cagcagugug aagaccaugc cauuaagcuu 2100
agcauguuga ccaagaaagc uugucugcau cugaaucccg gcggaaccug ugucagcaua 2160
gguuaugguu acgcugacag ggccagcgaa agcaucauug gugcuauagc gcggcaguuc 2220
aaguuuuccc ggguaugcaa accgaaaucc ucacuugaag agacggaagu ucuguuugua 2280
uucauugggu acgaucgcaa ggcccguacg cacaauucuu acaagcuuuc aucaaccuug 2340
accaacauuu auacagguuc cagacuccac gaagccggau gu 2382
<210> 84
<211> 556
<212> PRT
<213> Unknown
<220>
<223> Non-structural protein 3
<400> 84
Ala Pro Ser Tyr His Val Val Arg Gly Asp Ile Ala Thr Ala Thr Glu
1 5 10 15
Gly Val Ile Ile Asn Ala Ala Asn Ser Lys Gly Gln Pro Gly Gly Gly
20 25 30
Val Cys Gly Ala Leu Tyr Lys Lys Phe Pro Glu Ser Phe Asp Leu Gln
35 40 45
Pro Ile Glu Val Gly Lys Ala Arg Leu Val Lys Gly Ala Ala Lys His
50 55 60
Ile Ile His Ala Val Gly Pro Asn Phe Asn Lys Val Ser Glu Val Glu
65 70 75 80
Gly Asp Lys Gln Leu Ala Glu Ala Tyr Glu Ser Ile Ala Lys Ile Val
85 90 95
Asn Asp Asn Asn Tyr Lys Ser Val Ala Ile Pro Leu Leu Ser Thr Gly
100 105 110
Ile Phe Ser Gly Asn Lys Asp Arg Leu Thr Gln Ser Leu Asn His Leu
115 120 125
Leu Thr Ala Leu Asp Thr Thr Asp Ala Asp Val Ala Ile Tyr Cys Arg
130 135 140
Asp Lys Lys Trp Glu Met Thr Leu Lys Glu Ala Val Ala Arg Arg Glu
145 150 155 160
Ala Val Glu Glu Ile Cys Ile Ser Asp Asp Ser Ser Val Thr Glu Pro
165 170 175
Asp Ala Glu Leu Val Arg Val His Pro Lys Ser Ser Leu Ala Gly Arg
180 185 190
Lys Gly Tyr Ser Thr Ser Asp Gly Lys Thr Phe Ser Tyr Leu Glu Gly
195 200 205
Thr Lys Phe His Gln Ala Ala Lys Asp Ile Ala Glu Ile Asn Ala Met
210 215 220
Trp Pro Val Ala Thr Glu Ala Asn Glu Gln Val Cys Met Tyr Ile Leu
225 230 235 240
Gly Glu Ser Met Ser Ser Ile Arg Ser Lys Cys Pro Val Glu Glu Ser
245 250 255
Glu Ala Ser Thr Pro Pro Ser Thr Leu Pro Cys Leu Cys Ile His Ala
260 265 270
Met Thr Pro Glu Arg Val Gln Arg Leu Lys Ala Ser Arg Pro Glu Gln
275 280 285
Ile Thr Val Cys Ser Ser Phe Pro Leu Pro Lys Tyr Arg Ile Thr Gly
290 295 300
Val Gln Lys Ile Gln Cys Ser Gln Pro Ile Leu Phe Ser Pro Lys Val
305 310 315 320
Pro Ala Tyr Ile His Pro Arg Lys Tyr Leu Val Glu Thr Pro Pro Val
325 330 335
Asp Glu Thr Pro Glu Pro Ser Ala Glu Asn Gln Ser Thr Glu Gly Thr
340 345 350
Pro Glu Gln Pro Pro Leu Ile Thr Glu Asp Glu Thr Arg Thr Arg Thr
355 360 365
Pro Glu Pro Ile Ile Ile Glu Glu Glu Glu Glu Asp Ser Ile Ser Leu
370 375 380
Leu Ser Asp Gly Pro Thr His Gln Val Leu Gln Val Glu Ala Asp Ile
385 390 395 400
His Gly Pro Pro Ser Val Ser Ser Ser Ser Trp Ser Ile Pro His Ala
405 410 415
Ser Asp Phe Asp Val Asp Ser Leu Ser Ile Leu Asp Thr Leu Glu Gly
420 425 430
Ala Ser Val Thr Ser Gly Ala Thr Ser Ala Glu Thr Asn Ser Tyr Phe
435 440 445
Ala Lys Ser Met Glu Phe Leu Ala Arg Pro Val Pro Ala Pro Arg Thr
450 455 460
Val Phe Arg Asn Pro Pro His Pro Ala Pro Arg Thr Arg Thr Pro Ser
465 470 475 480
Leu Ala Pro Ser Arg Ala Cys Ser Arg Thr Ser Leu Val Ser Thr Pro
485 490 495
Pro Gly Val Asn Arg Val Ile Thr Arg Glu Glu Leu Glu Ala Leu Thr
500 505 510
Pro Ser Arg Thr Pro Ser Arg Ser Val Ser Arg Thr Ser Leu Val Ser
515 520 525
Asn Pro Pro Gly Val Asn Arg Val Ile Thr Arg Glu Glu Phe Glu Ala
530 535 540
Phe Val Ala Gln Gln Gln Arg Phe Asp Ala Gly Ala
545 550 555
<210> 85
<211> 1671
<212> DNA
<213> Unknown
<220>
<223> Non-structural protein 3
<400> 85
gcaccctcat atcatgtggt gcgaggggat attgccacgg ccaccgaagg agtgattata 60
aatgctgcta acagcaaagg acaacctggc ggaggggtgt gcggagcgct gtataagaaa 120
ttcccggaaa gcttcgattt acagccgatc gaagtaggaa aagcgcgact ggtcaaaggt 180
gcagctaaac atatcattca tgccgtagga ccaaacttca acaaagtttc ggaggttgaa 240
ggtgacaaac agttggcaga ggcttatgag tccatcgcta agattgtcaa cgataacaat 300
tacaagtcag tagcgattcc actgttgtcc accggcatct tttccgggaa caaagatcga 360
ctaacccaat cattgaacca tttgctgaca gctttagaca ccactgatgc agatgtagcc 420
atatactgca gggacaagaa atgggaaatg actctcaagg aagcagtggc taggagagaa 480
gcagtggagg agatatgcat atccgacgac tcttcagtga cagaacctga tgcagagctg 540
gtgagggtgc atccgaagag ttctttggct ggaaggaagg gctacagcac aagcgatggc 600
aaaactttct catatttgga agggaccaag tttcaccagg cggccaagga tatagcagaa 660
attaatgcca tgtggcccgt tgcaacggag gccaatgagc aggtatgcat gtatatcctc 720
ggagaaagca tgagcagtat taggtcgaaa tgccccgtcg aagagtcgga agcctccaca 780
ccacctagca cgctgccttg cttgtgcatc catgccatga ctccagaaag agtacagcgc 840
ctaaaagcct cacgtccaga acaaattact gtgtgctcat cctttccatt gccgaagtat 900
agaatcactg gtgtgcagaa gatccaatgc tcccagccta tattgttctc accgaaagtg 960
cctgcgtata ttcatccaag gaagtatctc gtggaaacac caccggtaga cgagactccg 1020
gagccatcgg cagagaacca atccacagag gggacacctg aacaaccacc acttataacc 1080
gaggatgaga ccaggactag aacgcctgag ccgatcatca tcgaagagga agaagaggat 1140
agcataagtt tgctgtcaga tggcccgacc caccaggtgc tgcaagtcga ggcagacatt 1200
cacgggccgc cctctgtatc tagctcatcc tggtccattc ctcatgcatc cgactttgat 1260
gtggacagtt tatccatact tgacaccctg gagggagcta gcgtgaccag cggggcaacg 1320
tcagccgaga ctaactctta cttcgcaaag agtatggagt ttctggcgcg accggtgcct 1380
gcgcctcgaa cagtattcag gaaccctcca catcccgctc cgcgcacaag aacaccgtca 1440
cttgcaccca gcagggcctg ctcgagaacc agcctagttt ccaccccgcc aggcgtgaat 1500
agggtgatca ctagagagga gctcgaggcg cttaccccgt cacgcactcc tagcaggtcg 1560
gtctcgagaa ccagcctggt ctccaacccg ccaggcgtaa atagggtgat tacaagagag 1620
gagtttgagg cgttcgtagc acaacaacaa tgacggtttg atgcgggtgc a 1671
<210> 86
<211> 1671
<212> RNA
<213> Unknown
<220>
<223> Non-structural protein 3
<400> 86
gcacccucau aucauguggu gcgaggggau auugccacgg ccaccgaagg agugauuaua 60
aaugcugcua acagcaaagg acaaccuggc ggaggggugu gcggagcgcu guauaagaaa 120
uucccggaaa gcuucgauuu acagccgauc gaaguaggaa aagcgcgacu ggucaaaggu 180
gcagcuaaac auaucauuca ugccguagga ccaaacuuca acaaaguuuc ggagguugaa 240
ggugacaaac aguuggcaga ggcuuaugag uccaucgcua agauugucaa cgauaacaau 300
uacaagucag uagcgauucc acuguugucc accggcaucu uuuccgggaa caaagaucga 360
cuaacccaau cauugaacca uuugcugaca gcuuuagaca ccacugaugc agauguagcc 420
auauacugca gggacaagaa augggaaaug acucucaagg aagcaguggc uaggagagaa 480
gcaguggagg agauaugcau auccgacgac ucuucaguga cagaaccuga ugcagagcug 540
gugagggugc auccgaagag uucuuuggcu ggaaggaagg gcuacagcac aagcgauggc 600
aaaacuuucu cauauuugga agggaccaag uuucaccagg cggccaagga uauagcagaa 660
auuaaugcca uguggcccgu ugcaacggag gccaaugagc agguaugcau guauauccuc 720
ggagaaagca ugagcaguau uaggucgaaa ugccccgucg aagagucgga agccuccaca 780
ccaccuagca cgcugccuug cuugugcauc caugccauga cuccagaaag aguacagcgc 840
cuaaaagccu cacguccaga acaaauuacu gugugcucau ccuuuccauu gccgaaguau 900
agaaucacug gugugcagaa gauccaaugc ucccagccua uauuguucuc accgaaagug 960
ccugcguaua uucauccaag gaaguaucuc guggaaacac caccgguaga cgagacuccg 1020
gagccaucgg cagagaacca auccacagag gggacaccug aacaaccacc acuuauaacc 1080
gaggaugaga ccaggacuag aacgccugag ccgaucauca ucgaagagga agaagaggau 1140
agcauaaguu ugcugucaga uggcccgacc caccaggugc ugcaagucga ggcagacauu 1200
cacgggccgc ccucuguauc uagcucaucc ugguccauuc cucaugcauc cgacuuugau 1260
guggacaguu uauccauacu ugacacccug gagggagcua gcgugaccag cggggcaacg 1320
ucagccgaga cuaacucuua cuucgcaaag aguauggagu uucuggcgcg accggugccu 1380
gcgccucgaa caguauucag gaacccucca caucccgcuc cgcgcacaag aacaccguca 1440
cuugcaccca gcagggccug cucgagaacc agccuaguuu ccaccccgcc aggcgugaau 1500
agggugauca cuagagagga gcucgaggcg cuuaccccgu cacgcacucc uagcaggucg 1560
gucucgagaa ccagccuggu cuccaacccg ccaggcguaa auagggugau uacaagagag 1620
gaguuugagg cguucguagc acaacaacaa ugacgguuug augcgggugc a 1671
<210> 87
<211> 607
<212> PRT
<213> Unknown
<220>
<223> Non-structural protein 4
<400> 87
Tyr Ile Phe Ser Ser Asp Thr Gly Gln Gly His Leu Gln Gln Lys Ser
1 5 10 15
Val Arg Gln Thr Val Leu Ser Glu Val Val Leu Glu Arg Thr Glu Leu
20 25 30
Glu Ile Ser Tyr Ala Pro Arg Leu Asp Gln Glu Lys Glu Glu Leu Leu
35 40 45
Arg Lys Lys Leu Gln Leu Asn Pro Thr Pro Ala Asn Arg Ser Arg Tyr
50 55 60
Gln Ser Arg Lys Val Glu Asn Met Lys Ala Ile Thr Ala Arg Arg Ile
65 70 75 80
Leu Gln Gly Leu Gly His Tyr Leu Lys Ala Glu Gly Lys Val Glu Cys
85 90 95
Tyr Arg Thr Leu His Pro Val Pro Leu Tyr Ser Ser Ser Val Asn Arg
100 105 110
Ala Phe Ser Ser Pro Lys Val Ala Val Glu Ala Cys Asn Ala Met Leu
115 120 125
Lys Glu Asn Phe Pro Thr Val Ala Ser Tyr Cys Ile Ile Pro Glu Tyr
130 135 140
Asp Ala Tyr Leu Asp Met Val Asp Gly Ala Ser Cys Cys Leu Asp Thr
145 150 155 160
Ala Ser Phe Cys Pro Ala Lys Leu Arg Ser Phe Pro Lys Lys His Ser
165 170 175
Tyr Leu Glu Pro Thr Ile Arg Ser Ala Val Pro Ser Ala Ile Gln Asn
180 185 190
Thr Leu Gln Asn Val Leu Ala Ala Ala Thr Lys Arg Asn Cys Asn Val
195 200 205
Thr Gln Met Arg Glu Leu Pro Val Leu Asp Ser Ala Ala Phe Asn Val
210 215 220
Glu Cys Phe Lys Lys Tyr Ala Cys Asn Asn Glu Tyr Trp Glu Thr Phe
225 230 235 240
Lys Glu Asn Pro Ile Arg Leu Thr Glu Glu Asn Val Val Asn Tyr Ile
245 250 255
Thr Lys Leu Lys Gly Pro Lys Ala Ala Ala Leu Phe Ala Lys Thr His
260 265 270
Asn Leu Asn Met Leu Gln Asp Ile Pro Met Asp Arg Phe Val Met Asp
275 280 285
Leu Lys Arg Asp Val Lys Val Thr Pro Gly Thr Lys His Thr Glu Glu
290 295 300
Arg Pro Lys Val Gln Val Ile Gln Ala Ala Asp Pro Leu Ala Thr Ala
305 310 315 320
Tyr Leu Cys Gly Ile His Arg Glu Leu Val Arg Arg Leu Asn Ala Val
325 330 335
Leu Leu Pro Asn Ile His Thr Leu Phe Asp Met Ser Ala Glu Asp Phe
340 345 350
Asp Ala Ile Ile Ala Glu His Phe Gln Pro Gly Asp Cys Val Leu Glu
355 360 365
Thr Asp Ile Ala Ser Phe Asp Lys Ser Glu Asp Asp Ala Met Ala Leu
370 375 380
Thr Ala Leu Met Ile Leu Glu Asp Leu Gly Val Asp Ala Glu Leu Leu
385 390 395 400
Thr Leu Ile Glu Ala Ala Phe Gly Glu Ile Ser Ser Ile His Leu Pro
405 410 415
Thr Lys Thr Lys Phe Lys Phe Gly Ala Met Met Lys Ser Gly Met Phe
420 425 430
Leu Thr Leu Phe Val Asn Thr Val Ile Asn Ile Val Ile Ala Ser Arg
435 440 445
Val Leu Arg Glu Arg Leu Thr Gly Ser Pro Cys Ala Ala Phe Ile Gly
450 455 460
Asp Asp Asn Ile Val Lys Gly Val Lys Ser Asp Lys Leu Met Ala Asp
465 470 475 480
Arg Cys Ala Thr Trp Leu Asn Met Glu Val Lys Ile Ile Asp Ala Val
485 490 495
Val Gly Glu Lys Ala Pro Tyr Phe Cys Gly Gly Phe Ile Leu Cys Asp
500 505 510
Ser Val Thr Gly Thr Ala Cys Arg Val Ala Asp Pro Leu Lys Arg Leu
515 520 525
Phe Lys Leu Gly Lys Pro Leu Ala Ala Asp Asp Glu His Asp Asp Asp
530 535 540
Arg Arg Arg Ala Leu His Glu Glu Ser Thr Arg Trp Asn Arg Val Gly
545 550 555 560
Ile Leu Ser Glu Leu Cys Lys Ala Val Glu Ser Arg Tyr Glu Thr Val
565 570 575
Gly Thr Ser Ile Ile Val Met Ala Met Thr Thr Leu Ala Ser Ser Val
580 585 590
Lys Ser Phe Ser Tyr Leu Arg Gly Ala Pro Ile Thr Leu Tyr Gly
595 600 605
<210> 88
<211> 1821
<212> DNA
<213> Unknown
<220>
<223> Non-structural protein 4
<400> 88
tacatctttt cctccgacac cggtcaaggg catttacaac aaaaatcagt aaggcaaacg 60
gtgctatccg aagtggtgtt ggagaggacc gaattggaga tttcgtatgc cccgcgcctc 120
gaccaagaaa aagaagaatt actacgcaag aaattacagt taaatcccac acctgctaac 180
agaagcagat accagtccag gaaggtggag aacatgaaag ccataacagc tagacgtatt 240
ctgcaaggcc tagggcatta tttgaaggca gaaggaaaag tggagtgcta ccgaaccctg 300
catcctgttc ctttgtattc atctagtgtg aaccgtgcct tttcaagccc caaggtcgca 360
gtggaagcct gtaacgccat gttgaaagag aactttccga ctgtggcttc ttactgtatt 420
attccagagt acgatgccta tttggacatg gttgacggag cttcatgctg cttagacact 480
gccagttttt gccctgcaaa gctgcgcagc tttccaaaga aacactccta tttggaaccc 540
acaatacgat cggcagtgcc ttcagcgatc cagaacacgc tccagaacgt cctggcagct 600
gccacaaaaa gaaattgcaa tgtcacgcaa atgagagaat tgcccgtatt ggattcggcg 660
gcctttaatg tggaatgctt caagaaatat gcgtgtaata atgaatattg ggaaacgttt 720
aaagaaaacc ccatcaggct tactgaagaa aacgtggtaa attacattac caaattaaaa 780
ggaccaaaag ctgctgctct ttttgcgaag acacataatt tgaatatgtt gcaggacata 840
ccaatggaca ggtttgtaat ggacttaaag agagacgtga aagtgactcc aggaacaaaa 900
catactgaag aacggcccaa ggtacaggtg atccaggctg ccgatccgct agcaacagcg 960
tatctgtgcg gaatccaccg agagctggtt aggagattaa atgcggtcct gcttccgaac 1020
attcatacac tgtttgatat gtcggctgaa gactttgacg ctattatagc cgagcacttc 1080
cagcctgggg attgtgttct ggaaactgac atcgcgtcgt ttgataaaag tgaggacgac 1140
gccatggctc tgaccgcgtt aatgattctg gaagacttag gtgtggacgc agagctgttg 1200
acgctgattg aggcggcttt cggcgaaatt tcatcaatac atttgcccac taaaactaaa 1260
tttaaattcg gagccatgat gaaatctgga atgttcctca cactgtttgt gaacacagtc 1320
attaacattg taatcgcaag cagagtgttg agagaacggc taaccggatc accatgtgca 1380
gcattcattg gagatgacaa tatcgtgaaa ggagtcaaat cggacaaatt aatggcagac 1440
aggtgcgcca cctggttgaa tatggaagtc aagattatag atgctgtggt gggcgagaaa 1500
gcgccttatt tctgtggagg gtttattttg tgtgactccg tgaccggcac agcgtgccgt 1560
gtggcagacc ccctaaaaag gctgtttaag cttggcaaac ctctggcagc agacgatgaa 1620
catgatgatg acaggagaag ggcattgcat gaagagtcaa cacgctggaa ccgagtgggt 1680
attctttcag agctgtgcaa ggcagtagaa tcaaggtatg aaaccgtagg aacttccatc 1740
atagttatgg ccatgactac tctagctagc agtgttaaat cattcagcta cctgagaggg 1800
gcccctataa ctctctacgg c 1821
<210> 89
<211> 1821
<212> RNA
<213> Unknown
<220>
<223> Non-structural protein 4
<400> 89
uacaucuuuu ccuccgacac cggucaaggg cauuuacaac aaaaaucagu aaggcaaacg 60
gugcuauccg aagugguguu ggagaggacc gaauuggaga uuucguaugc cccgcgccuc 120
gaccaagaaa aagaagaauu acuacgcaag aaauuacagu uaaaucccac accugcuaac 180
agaagcagau accaguccag gaagguggag aacaugaaag ccauaacagc uagacguauu 240
cugcaaggcc uagggcauua uuugaaggca gaaggaaaag uggagugcua ccgaacccug 300
cauccuguuc cuuuguauuc aucuagugug aaccgugccu uuucaagccc caaggucgca 360
guggaagccu guaacgccau guugaaagag aacuuuccga cuguggcuuc uuacuguauu 420
auuccagagu acgaugccua uuuggacaug guugacggag cuucaugcug cuuagacacu 480
gccaguuuuu gcccugcaaa gcugcgcagc uuuccaaaga aacacuccua uuuggaaccc 540
acaauacgau cggcagugcc uucagcgauc cagaacacgc uccagaacgu ccuggcagcu 600
gccacaaaaa gaaauugcaa ugucacgcaa augagagaau ugcccguauu ggauucggcg 660
gccuuuaaug uggaaugcuu caagaaauau gcguguaaua augaauauug ggaaacguuu 720
aaagaaaacc ccaucaggcu uacugaagaa aacgugguaa auuacauuac caaauuaaaa 780
ggaccaaaag cugcugcucu uuuugcgaag acacauaauu ugaauauguu gcaggacaua 840
ccaauggaca gguuuguaau ggacuuaaag agagacguga aagugacucc aggaacaaaa 900
cauacugaag aacggcccaa gguacaggug auccaggcug ccgauccgcu agcaacagcg 960
uaucugugcg gaauccaccg agagcugguu aggagauuaa augcgguccu gcuuccgaac 1020
auucauacac uguuugauau gucggcugaa gacuuugacg cuauuauagc cgagcacuuc 1080
cagccugggg auuguguucu ggaaacugac aucgcgucgu uugauaaaag ugaggacgac 1140
gccauggcuc ugaccgcguu aaugauucug gaagacuuag guguggacgc agagcuguug 1200
acgcugauug aggcggcuuu cggcgaaauu ucaucaauac auuugcccac uaaaacuaaa 1260
uuuaaauucg gagccaugau gaaaucugga auguuccuca cacuguuugu gaacacaguc 1320
auuaacauug uaaucgcaag cagaguguug agagaacggc uaaccggauc accaugugca 1380
gcauucauug gagaugacaa uaucgugaaa ggagucaaau cggacaaauu aauggcagac 1440
aggugcgcca ccugguugaa uauggaaguc aagauuauag augcuguggu gggcgagaaa 1500
gcgccuuauu ucuguggagg guuuauuuug ugugacuccg ugaccggcac agcgugccgu 1560
guggcagacc cccuaaaaag gcuguuuaag cuuggcaaac cucuggcagc agacgaugaa 1620
caugaugaug acaggagaag ggcauugcau gaagagucaa cacgcuggaa ccgagugggu 1680
auucuuucag agcugugcaa ggcaguagaa ucaagguaug aaaccguagg aacuuccauc 1740
auaguuaugg ccaugacuac ucuagcuagc aguguuaaau cauucagcua ccugagaggg 1800
gccccuauaa cucucuacgg c 1821
<210> 90
<211> 44
<212> RNA
<213> Artificial Sequence
<220>
<223> 5'UTR
<400> 90
augggcggcg caugagagaa gcccagacca auuaccuacc caaa 44
<210> 91
<211> 142
<212> RNA
<213> Artificial Sequence
<220>
<223> 3'UTR
<400> 91
aauuggcaag cugcuuacau agaacucgcg gcgauuggca ugccgccuua aaauuuuuau 60
uuuauuuuuc uuuucuuuuc cgaaucggau uuuguuuuua auauuucaaa aaaaaaaaaa 120
aaaaaaaaaa aaaaaaaaaa aa 142
<210> 92
<211> 7578
<212> RNA
<213> Artificial Sequence
<220>
<223> RNA construct
<400> 92
augggcggcg caugagagaa gcccagacca auuaccuacc caaaauggag aaaguucacg 60
uugacaucga ggaagacagc ccauuccuca gagcuuugca gcggagcuuc ccgcaguuug 120
agguagaagc caagcagguc acugauaaug accaugcuaa ugccagagcg uuuucgcauc 180
uggcuucaaa acugaucgaa acggaggugg acccauccga cacgauccuu gacauuggaa 240
gugcgcccgc ccgcagaaug uauucuaagc acaaguauca uuguaucugu ccgaugagau 300
gugcggaaga uccggacaga uuguauaagu augcaacuaa gcugaagaaa aacuguaagg 360
aaauaacuga uaaggaauug gacaagaaaa ugaaggagcu ggccgccguc augagcgacc 420
cugaccugga aacugagacu augugccucc acgacgacga gucgugucgc uacgaagggc 480
aagucgcugu uuaccaggau guauacgcgg uugacggacc gacaagucuc uaucaccaag 540
ccaauaaggg aguuagaguc gccuacugga uaggcuuuga caccaccccu uuuauguuua 600
agaacuuggc uggagcauau ccaucauacu cuaccaacug ggccgacgaa accguguuaa 660
cggcucguaa cauaggccua ugcagcucug acguuaugga gcggucacgu agagggaugu 720
ccauucuuag aaagaaguau uugaaaccau ccaacaaugu ucuauucucu guuggcucga 780
ccaucuacca cgagaagagg gacuuacuga ggagcuggca ccugccgucu guauuucacu 840
uacguggcaa gcaaaauuac acaugucggu gugagacuau aguuaguugc gacggguacg 900
ucguuaaaag aauagcuauc aguccaggcc uguaugggaa gccuucaggc uaugcugcua 960
cgaugcaccg cgagggauuc uugugcugca aagugacaga cacauugaac ggggagaggg 1020
ucucuuuucc cgugugcacg uaugugccag cuacauugug ugaccaaaug acuggcauac 1080
uggcaacaga ugucagugcg gacgacgcgc aaaaacugcu gguugggcuc aaccagcgua 1140
uagucgucaa cggucgcacc cagagaaaca ccaauaccau gaaaaauuac cuuuugcccg 1200
uaguggccca ggcauuugcu aggugggcaa aggaauauaa ggaagaucaa gaagaugaaa 1260
ggccacuagg acuacgagau agacaguuag ucauggggug uuguugggcu uuuagaaggc 1320
acaagauaac aucuauuuau aagcgcccgg auacccaaac caucaucaaa gugaacagcg 1380
auuuccacuc auucgugcug cccaggauag gcaguaacac auuggagauc gggcugagaa 1440
caagaaucag gaaaauguua gaggagcaca aggagccguc accucucauu accgccgagg 1500
acguacaaga agcuaagugc gcagccgaug aggcuaagga ggugcgugaa gccgaggagu 1560
ugcgcgcagc ucuaccaccu uuggcagcug auguugagga gcccacucug gaagccgaug 1620
ucgacuugau guuacaagag gcuggggccg gcucagugga gacaccucgu ggcuugauaa 1680
agguuaccag cuacgauggc gaggacaaga ucggcucuua cgcugugcuu ucuccgcagg 1740
cuguacucaa gagugaaaaa uuaucuugca uccacccucu cgcugaacaa gucauaguga 1800
uaacacacuc uggccgaaaa gggcguuaug ccguggaacc auaccauggu aaaguagugg 1860
ugccagaggg acaugcaaua cccguccagg acuuucaagc ucugagugaa agugccacca 1920
uuguguacaa cgaacgugag uucguaaaca gguaccugca ccauauugcc acacauggag 1980
gagcgcugaa cacugaugaa gaauauuaca aaacugucaa gcccagcgag cacgacggcg 2040
aauaccugua cgacaucgac aggaaacagu gcgucaagaa agaacuaguc acugggcuag 2100
ggcucacagg cgagcuggug gauccucccu uccaugaauu cgccuacgag agucugagaa 2160
cacgaccagc cgcuccuuac caaguaccaa ccauaggggu guauggcgug ccaggaucag 2220
gcaagucugg caucauuaaa agcgcaguca ccaaaaaaga ucuaguggug agcgccaaga 2280
aagaaaacug ugcagaaauu auaagggacg ucaagaaaau gaaagggcug gacgucaaug 2340
ccagaacugu ggacucagug cucuugaaug gaugcaaaca ccccguagag acccuguaua 2400
uugacgaagc uuuugcuugu caugcaggua cucucagagc gcucauagcc auuauaagac 2460
cuaaaaaggc agugcucugc ggggauccca aacagugcgg uuuuuuuaac augaugugcc 2520
ugaaagugca uuuuaaccac gagauuugca cacaagucuu ccacaaaagc aucucucgcc 2580
guugcacuaa aucugugacu ucggucgucu caaccuuguu uuacgacaaa aaaaugagaa 2640
cgacgaaucc gaaagagacu aagauuguga uugacacuac cggcaguacc aaaccuaagc 2700
aggacgaucu cauucucacu uguuucagag ggugggugaa gcaguugcaa auagauuaca 2760
aaggcaacga aauaaugacg gcagcugccu cucaagggcu gacccguaaa gguguguaug 2820
ccguucggua caaggugaau gaaaauccuc uguacgcacc caccucagaa caugugaacg 2880
uccuacugac ccgcacggag gaccgcaucg uguggaaaac acuagccggc gacccaugga 2940
uaaaaacacu gacugccaag uacccuggga auuucacugc cacgauagag gaguggcaag 3000
cagagcauga ugccaucaug aggcacaucu uggagagacc ggacccuacc gacgucuucc 3060
agaauaaggc aaacgugugu ugggccaagg cuuuagugcc ggugcugaag accgcuggca 3120
uagacaugac cacugaacaa uggaacacug uggauuauuu ugaaacggac aaagcucacu 3180
cagcagagau aguauugaac caacuaugcg ugagguucuu uggacucgau cuggacuccg 3240
gucuauuuuc ugcacccacu guuccguuau ccauuaggaa uaaucacugg gauaacuccc 3300
cgucgccuaa cauguacggg cugaauaaag aagugguccg ucagcucucu cgcagguacc 3360
cacaacugcc ucgggcaguu gccacuggaa gagucuauga caugaacacu gguacacugc 3420
gcaauuauga uccgcgcaua aaccuaguac cuguaaacag aagacugccu caugcuuuag 3480
uccuccacca uaaugaacac ccacagagug acuuuucuuc auucgucagc aaauugaagg 3540
gcagaacugu ccuggugguc ggggaaaagu uguccguccc aggcaaaaug guugacuggu 3600
ugucagaccg gccugaggcu accuucagag cucggcugga uuuaggcauc ccaggugaug 3660
ugcccaaaua ugacauaaua uuuguuaaug ugaggacccc auauaaauac caucacuauc 3720
agcaguguga agaccaugcc auuaagcuua gcauguugac caagaaagcu ugucugcauc 3780
ugaaucccgg cggaaccugu gucagcauag guuaugguua cgcugacagg gccagcgaaa 3840
gcaucauugg ugcuauagcg cggcaguuca aguuuucccg gguaugcaaa ccgaaauccu 3900
cacuugaaga gacggaaguu cuguuuguau ucauugggua cgaucgcaag gcccguacgc 3960
acaauucuua caagcuuuca ucaaccuuga ccaacauuua uacagguucc agacuccacg 4020
aagccggaug ugcacccuca uaucaugugg ugcgagggga uauugccacg gccaccgaag 4080
gagugauuau aaaugcugcu aacagcaaag gacaaccugg cggaggggug ugcggagcgc 4140
uguauaagaa auucccggaa agcuucgauu uacagccgau cgaaguagga aaagcgcgac 4200
uggucaaagg ugcagcuaaa cauaucauuc augccguagg accaaacuuc aacaaaguuu 4260
cggagguuga aggugacaaa caguuggcag aggcuuauga guccaucgcu aagauuguca 4320
acgauaacaa uuacaaguca guagcgauuc cacuguuguc caccggcauc uuuuccggga 4380
acaaagaucg acuaacccaa ucauugaacc auuugcugac agcuuuagac accacugaug 4440
cagauguagc cauauacugc agggacaaga aaugggaaau gacucucaag gaagcagugg 4500
cuaggagaga agcaguggag gagauaugca uauccgacga cucuucagug acagaaccug 4560
augcagagcu ggugagggug cauccgaaga guucuuuggc uggaaggaag ggcuacagca 4620
caagcgaugg caaaacuuuc ucauauuugg aagggaccaa guuucaccag gcggccaagg 4680
auauagcaga aauuaaugcc auguggcccg uugcaacgga ggccaaugag cagguaugca 4740
uguauauccu cggagaaagc augagcagua uuaggucgaa augccccguc gaagagucgg 4800
aagccuccac accaccuagc acgcugccuu gcuugugcau ccaugccaug acuccagaaa 4860
gaguacagcg ccuaaaagcc ucacguccag aacaaauuac ugugugcuca uccuuuccau 4920
ugccgaagua uagaaucacu ggugugcaga agauccaaug cucccagccu auauuguucu 4980
caccgaaagu gccugcguau auucauccaa ggaaguaucu cguggaaaca ccaccgguag 5040
acgagacucc ggagccaucg gcagagaacc aauccacaga ggggacaccu gaacaaccac 5100
cacuuauaac cgaggaugag accaggacua gaacgccuga gccgaucauc aucgaagagg 5160
aagaagagga uagcauaagu uugcugucag auggcccgac ccaccaggug cugcaagucg 5220
aggcagacau ucacgggccg cccucuguau cuagcucauc cugguccauu ccucaugcau 5280
ccgacuuuga uguggacagu uuauccauac uugacacccu ggagggagcu agcgugacca 5340
gcggggcaac gucagccgag acuaacucuu acuucgcaaa gaguauggag uuucuggcgc 5400
gaccggugcc ugcgccucga acaguauuca ggaacccucc acaucccgcu ccgcgcacaa 5460
gaacaccguc acuugcaccc agcagggccu gcucgagaac cagccuaguu uccaccccgc 5520
caggcgugaa uagggugauc acuagagagg agcucgaggc gcuuaccccg ucacgcacuc 5580
cuagcagguc ggucucgaga accagccugg ucuccaaccc gccaggcgua aauaggguga 5640
uuacaagaga ggaguuugag gcguucguag cacaacaaca augacgguuu gaugcgggug 5700
cauacaucuu uuccuccgac accggucaag ggcauuuaca acaaaaauca guaaggcaaa 5760
cggugcuauc cgaaguggug uuggagagga ccgaauugga gauuucguau gccccgcgcc 5820
ucgaccaaga aaaagaagaa uuacuacgca agaaauuaca guuaaauccc acaccugcua 5880
acagaagcag auaccagucc aggaaggugg agaacaugaa agccauaaca gcuagacgua 5940
uucugcaagg ccuagggcau uauuugaagg cagaaggaaa aguggagugc uaccgaaccc 6000
ugcauccugu uccuuuguau ucaucuagug ugaaccgugc cuuuucaagc cccaaggucg 6060
caguggaagc cuguaacgcc auguugaaag agaacuuucc gacuguggcu ucuuacugua 6120
uuauuccaga guacgaugcc uauuuggaca ugguugacgg agcuucaugc ugcuuagaca 6180
cugccaguuu uugcccugca aagcugcgca gcuuuccaaa gaaacacucc uauuuggaac 6240
ccacaauacg aucggcagug ccuucagcga uccagaacac gcuccagaac guccuggcag 6300
cugccacaaa aagaaauugc aaugucacgc aaaugagaga auugcccgua uuggauucgg 6360
cggccuuuaa uguggaaugc uucaagaaau augcguguaa uaaugaauau ugggaaacgu 6420
uuaaagaaaa ccccaucagg cuuacugaag aaaacguggu aaauuacauu accaaauuaa 6480
aaggaccaaa agcugcugcu cuuuuugcga agacacauaa uuugaauaug uugcaggaca 6540
uaccaaugga cagguuugua auggacuuaa agagagacgu gaaagugacu ccaggaacaa 6600
aacauacuga agaacggccc aagguacagg ugauccaggc ugccgauccg cuagcaacag 6660
cguaucugug cggaauccac cgagagcugg uuaggagauu aaaugcgguc cugcuuccga 6720
acauucauac acuguuugau augucggcug aagacuuuga cgcuauuaua gccgagcacu 6780
uccagccugg ggauuguguu cuggaaacug acaucgcguc guuugauaaa agugaggacg 6840
acgccauggc ucugaccgcg uuaaugauuc uggaagacuu agguguggac gcagagcugu 6900
ugacgcugau ugaggcggcu uucggcgaaa uuucaucaau acauuugccc acuaaaacua 6960
aauuuaaauu cggagccaug augaaaucug gaauguuccu cacacuguuu gugaacacag 7020
ucauuaacau uguaaucgca agcagagugu ugagagaacg gcuaaccgga ucaccaugug 7080
cagcauucau uggagaugac aauaucguga aaggagucaa aucggacaaa uuaauggcag 7140
acaggugcgc caccugguug aauauggaag ucaagauuau agaugcugug gugggcgaga 7200
aagcgccuua uuucugugga ggguuuauuu ugugugacuc cgugaccggc acagcgugcc 7260
guguggcaga cccccuaaaa aggcuguuua agcuuggcaa accucuggca gcagacgaug 7320
aacaugauga ugacaggaga agggcauugc augaagaguc aacacgcugg aaccgagugg 7380
guauucuuuc agagcugugc aaggcaguag aaucaaggua ugaaaccgua ggaacuucca 7440
ucauaguuau ggccaugacu acucuagcua gcaguguuaa aucauucagc uaccugagag 7500
gggccccuau aacucucuac ggcuaaccug aauggacuac gacauagucu aguccgccaa 7560
gucuagcaua uggccacc 7578
<210> 93
<211> 7578
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleic acid sequence encoding RNA construct
<400> 93
atgggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300
gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360
aaataactga taaggaattg gacaagaaaa tgaaggagct ggccgccgtc atgagcgacc 420
ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480
aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540
ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600
agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660
cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720
ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780
ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840
tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900
tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960
cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020
tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080
tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140
tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200
tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260
ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320
acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380
atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440
caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500
acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560
tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620
tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680
aggttaccag ctacgatggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740
ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800
taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860
tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920
ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980
gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040
aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100
ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160
cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220
gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280
aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340
ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400
ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460
ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520
tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580
gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640
cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700
aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760
aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820
ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880
tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940
taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000
cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060
agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120
tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180
cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240
gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300
cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360
cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420
gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480
tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540
gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600
tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660
tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720
agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780
tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840
gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900
cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960
acaattctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020
aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080
gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140
tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200
tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260
cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320
acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380
acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440
cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500
ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560
atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620
caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680
atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740
tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800
aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860
gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920
tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980
caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040
acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100
cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160
aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220
aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280
ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340
gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400
gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460
gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520
caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580
ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640
ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700
catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760
cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820
tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880
acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940
ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000
tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060
cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120
ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180
ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240
ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300
ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360
cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420
ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480
aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540
taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600
aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660
cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720
acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780
tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840
acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900
tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960
aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020
tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080
cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140
acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200
aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260
gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320
aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380
gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440
tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500
gggcccctat aactctctac ggctaacctg aatggactac gacatagtct agtccgccaa 7560
gtctagcata tggccacc 7578
<210> 94
<211> 7596
<212> DNA
<213> Artificial Sequence
<220>
<223> Recombinant vector
<400> 94
taatacgact cactatagat gggcggcgca tgagagaagc ccagaccaat tacctaccca 60
aaatggagaa agttcacgtt gacatcgagg aagacagccc attcctcaga gctttgcagc 120
ggagcttccc gcagtttgag gtagaagcca agcaggtcac tgataatgac catgctaatg 180
ccagagcgtt ttcgcatctg gcttcaaaac tgatcgaaac ggaggtggac ccatccgaca 240
cgatccttga cattggaagt gcgcccgccc gcagaatgta ttctaagcac aagtatcatt 300
gtatctgtcc gatgagatgt gcggaagatc cggacagatt gtataagtat gcaactaagc 360
tgaagaaaaa ctgtaaggaa ataactgata aggaattgga caagaaaatg aaggagctgg 420
ccgccgtcat gagcgaccct gacctggaaa ctgagactat gtgcctccac gacgacgagt 480
cgtgtcgcta cgaagggcaa gtcgctgttt accaggatgt atacgcggtt gacggaccga 540
caagtctcta tcaccaagcc aataagggag ttagagtcgc ctactggata ggctttgaca 600
ccaccccttt tatgtttaag aacttggctg gagcatatcc atcatactct accaactggg 660
ccgacgaaac cgtgttaacg gctcgtaaca taggcctatg cagctctgac gttatggagc 720
ggtcacgtag agggatgtcc attcttagaa agaagtattt gaaaccatcc aacaatgttc 780
tattctctgt tggctcgacc atctaccacg agaagaggga cttactgagg agctggcacc 840
tgccgtctgt atttcactta cgtggcaagc aaaattacac atgtcggtgt gagactatag 900
ttagttgcga cgggtacgtc gttaaaagaa tagctatcag tccaggcctg tatgggaagc 960
cttcaggcta tgctgctacg atgcaccgcg agggattctt gtgctgcaaa gtgacagaca 1020
cattgaacgg ggagagggtc tcttttcccg tgtgcacgta tgtgccagct acattgtgtg 1080
accaaatgac tggcatactg gcaacagatg tcagtgcgga cgacgcgcaa aaactgctgg 1140
ttgggctcaa ccagcgtata gtcgtcaacg gtcgcaccca gagaaacacc aataccatga 1200
aaaattacct tttgcccgta gtggcccagg catttgctag gtgggcaaag gaatataagg 1260
aagatcaaga agatgaaagg ccactaggac tacgagatag acagttagtc atggggtgtt 1320
gttgggcttt tagaaggcac aagataacat ctatttataa gcgcccggat acccaaacca 1380
tcatcaaagt gaacagcgat ttccactcat tcgtgctgcc caggataggc agtaacacat 1440
tggagatcgg gctgagaaca agaatcagga aaatgttaga ggagcacaag gagccgtcac 1500
ctctcattac cgccgaggac gtacaagaag ctaagtgcgc agccgatgag gctaaggagg 1560
tgcgtgaagc cgaggagttg cgcgcagctc taccaccttt ggcagctgat gttgaggagc 1620
ccactctgga agccgatgtc gacttgatgt tacaagaggc tggggccggc tcagtggaga 1680
cacctcgtgg cttgataaag gttaccagct acgatggcga ggacaagatc ggctcttacg 1740
ctgtgctttc tccgcaggct gtactcaaga gtgaaaaatt atcttgcatc caccctctcg 1800
ctgaacaagt catagtgata acacactctg gccgaaaagg gcgttatgcc gtggaaccat 1860
accatggtaa agtagtggtg ccagagggac atgcaatacc cgtccaggac tttcaagctc 1920
tgagtgaaag tgccaccatt gtgtacaacg aacgtgagtt cgtaaacagg tacctgcacc 1980
atattgccac acatggagga gcgctgaaca ctgatgaaga atattacaaa actgtcaagc 2040
ccagcgagca cgacggcgaa tacctgtacg acatcgacag gaaacagtgc gtcaagaaag 2100
aactagtcac tgggctaggg ctcacaggcg agctggtgga tcctcccttc catgaattcg 2160
cctacgagag tctgagaaca cgaccagccg ctccttacca agtaccaacc ataggggtgt 2220
atggcgtgcc aggatcaggc aagtctggca tcattaaaag cgcagtcacc aaaaaagatc 2280
tagtggtgag cgccaagaaa gaaaactgtg cagaaattat aagggacgtc aagaaaatga 2340
aagggctgga cgtcaatgcc agaactgtgg actcagtgct cttgaatgga tgcaaacacc 2400
ccgtagagac cctgtatatt gacgaagctt ttgcttgtca tgcaggtact ctcagagcgc 2460
tcatagccat tataagacct aaaaaggcag tgctctgcgg ggatcccaaa cagtgcggtt 2520
tttttaacat gatgtgcctg aaagtgcatt ttaaccacga gatttgcaca caagtcttcc 2580
acaaaagcat ctctcgccgt tgcactaaat ctgtgacttc ggtcgtctca accttgtttt 2640
acgacaaaaa aatgagaacg acgaatccga aagagactaa gattgtgatt gacactaccg 2700
gcagtaccaa acctaagcag gacgatctca ttctcacttg tttcagaggg tgggtgaagc 2760
agttgcaaat agattacaaa ggcaacgaaa taatgacggc agctgcctct caagggctga 2820
cccgtaaagg tgtgtatgcc gttcggtaca aggtgaatga aaatcctctg tacgcaccca 2880
cctcagaaca tgtgaacgtc ctactgaccc gcacggagga ccgcatcgtg tggaaaacac 2940
tagccggcga cccatggata aaaacactga ctgccaagta ccctgggaat ttcactgcca 3000
cgatagagga gtggcaagca gagcatgatg ccatcatgag gcacatcttg gagagaccgg 3060
accctaccga cgtcttccag aataaggcaa acgtgtgttg ggccaaggct ttagtgccgg 3120
tgctgaagac cgctggcata gacatgacca ctgaacaatg gaacactgtg gattattttg 3180
aaacggacaa agctcactca gcagagatag tattgaacca actatgcgtg aggttctttg 3240
gactcgatct ggactccggt ctattttctg cacccactgt tccgttatcc attaggaata 3300
atcactggga taactccccg tcgcctaaca tgtacgggct gaataaagaa gtggtccgtc 3360
agctctctcg caggtaccca caactgcctc gggcagttgc cactggaaga gtctatgaca 3420
tgaacactgg tacactgcgc aattatgatc cgcgcataaa cctagtacct gtaaacagaa 3480
gactgcctca tgctttagtc ctccaccata atgaacaccc acagagtgac ttttcttcat 3540
tcgtcagcaa attgaagggc agaactgtcc tggtggtcgg ggaaaagttg tccgtcccag 3600
gcaaaatggt tgactggttg tcagaccggc ctgaggctac cttcagagct cggctggatt 3660
taggcatccc aggtgatgtg cccaaatatg acataatatt tgttaatgtg aggaccccat 3720
ataaatacca tcactatcag cagtgtgaag accatgccat taagcttagc atgttgacca 3780
agaaagcttg tctgcatctg aatcccggcg gaacctgtgt cagcataggt tatggttacg 3840
ctgacagggc cagcgaaagc atcattggtg ctatagcgcg gcagttcaag ttttcccggg 3900
tatgcaaacc gaaatcctca cttgaagaga cggaagttct gtttgtattc attgggtacg 3960
atcgcaaggc ccgtacgcac aattcttaca agctttcatc aaccttgacc aacatttata 4020
caggttccag actccacgaa gccggatgtg caccctcata tcatgtggtg cgaggggata 4080
ttgccacggc caccgaagga gtgattataa atgctgctaa cagcaaagga caacctggcg 4140
gaggggtgtg cggagcgctg tataagaaat tcccggaaag cttcgattta cagccgatcg 4200
aagtaggaaa agcgcgactg gtcaaaggtg cagctaaaca tatcattcat gccgtaggac 4260
caaacttcaa caaagtttcg gaggttgaag gtgacaaaca gttggcagag gcttatgagt 4320
ccatcgctaa gattgtcaac gataacaatt acaagtcagt agcgattcca ctgttgtcca 4380
ccggcatctt ttccgggaac aaagatcgac taacccaatc attgaaccat ttgctgacag 4440
ctttagacac cactgatgca gatgtagcca tatactgcag ggacaagaaa tgggaaatga 4500
ctctcaagga agcagtggct aggagagaag cagtggagga gatatgcata tccgacgact 4560
cttcagtgac agaacctgat gcagagctgg tgagggtgca tccgaagagt tctttggctg 4620
gaaggaaggg ctacagcaca agcgatggca aaactttctc atatttggaa gggaccaagt 4680
ttcaccaggc ggccaaggat atagcagaaa ttaatgccat gtggcccgtt gcaacggagg 4740
ccaatgagca ggtatgcatg tatatcctcg gagaaagcat gagcagtatt aggtcgaaat 4800
gccccgtcga agagtcggaa gcctccacac cacctagcac gctgccttgc ttgtgcatcc 4860
atgccatgac tccagaaaga gtacagcgcc taaaagcctc acgtccagaa caaattactg 4920
tgtgctcatc ctttccattg ccgaagtata gaatcactgg tgtgcagaag atccaatgct 4980
cccagcctat attgttctca ccgaaagtgc ctgcgtatat tcatccaagg aagtatctcg 5040
tggaaacacc accggtagac gagactccgg agccatcggc agagaaccaa tccacagagg 5100
ggacacctga acaaccacca cttataaccg aggatgagac caggactaga acgcctgagc 5160
cgatcatcat cgaagaggaa gaagaggata gcataagttt gctgtcagat ggcccgaccc 5220
accaggtgct gcaagtcgag gcagacattc acgggccgcc ctctgtatct agctcatcct 5280
ggtccattcc tcatgcatcc gactttgatg tggacagttt atccatactt gacaccctgg 5340
agggagctag cgtgaccagc ggggcaacgt cagccgagac taactcttac ttcgcaaaga 5400
gtatggagtt tctggcgcga ccggtgcctg cgcctcgaac agtattcagg aaccctccac 5460
atcccgctcc gcgcacaaga acaccgtcac ttgcacccag cagggcctgc tcgagaacca 5520
gcctagtttc caccccgcca ggcgtgaata gggtgatcac tagagaggag ctcgaggcgc 5580
ttaccccgtc acgcactcct agcaggtcgg tctcgagaac cagcctggtc tccaacccgc 5640
caggcgtaaa tagggtgatt acaagagagg agtttgaggc gttcgtagca caacaacaat 5700
gacggtttga tgcgggtgca tacatctttt cctccgacac cggtcaaggg catttacaac 5760
aaaaatcagt aaggcaaacg gtgctatccg aagtggtgtt ggagaggacc gaattggaga 5820
tttcgtatgc cccgcgcctc gaccaagaaa aagaagaatt actacgcaag aaattacagt 5880
taaatcccac acctgctaac agaagcagat accagtccag gaaggtggag aacatgaaag 5940
ccataacagc tagacgtatt ctgcaaggcc tagggcatta tttgaaggca gaaggaaaag 6000
tggagtgcta ccgaaccctg catcctgttc ctttgtattc atctagtgtg aaccgtgcct 6060
tttcaagccc caaggtcgca gtggaagcct gtaacgccat gttgaaagag aactttccga 6120
ctgtggcttc ttactgtatt attccagagt acgatgccta tttggacatg gttgacggag 6180
cttcatgctg cttagacact gccagttttt gccctgcaaa gctgcgcagc tttccaaaga 6240
aacactccta tttggaaccc acaatacgat cggcagtgcc ttcagcgatc cagaacacgc 6300
tccagaacgt cctggcagct gccacaaaaa gaaattgcaa tgtcacgcaa atgagagaat 6360
tgcccgtatt ggattcggcg gcctttaatg tggaatgctt caagaaatat gcgtgtaata 6420
atgaatattg ggaaacgttt aaagaaaacc ccatcaggct tactgaagaa aacgtggtaa 6480
attacattac caaattaaaa ggaccaaaag ctgctgctct ttttgcgaag acacataatt 6540
tgaatatgtt gcaggacata ccaatggaca ggtttgtaat ggacttaaag agagacgtga 6600
aagtgactcc aggaacaaaa catactgaag aacggcccaa ggtacaggtg atccaggctg 6660
ccgatccgct agcaacagcg tatctgtgcg gaatccaccg agagctggtt aggagattaa 6720
atgcggtcct gcttccgaac attcatacac tgtttgatat gtcggctgaa gactttgacg 6780
ctattatagc cgagcacttc cagcctgggg attgtgttct ggaaactgac atcgcgtcgt 6840
ttgataaaag tgaggacgac gccatggctc tgaccgcgtt aatgattctg gaagacttag 6900
gtgtggacgc agagctgttg acgctgattg aggcggcttt cggcgaaatt tcatcaatac 6960
atttgcccac taaaactaaa tttaaattcg gagccatgat gaaatctgga atgttcctca 7020
cactgtttgt gaacacagtc attaacattg taatcgcaag cagagtgttg agagaacggc 7080
taaccggatc accatgtgca gcattcattg gagatgacaa tatcgtgaaa ggagtcaaat 7140
cggacaaatt aatggcagac aggtgcgcca cctggttgaa tatggaagtc aagattatag 7200
atgctgtggt gggcgagaaa gcgccttatt tctgtggagg gtttattttg tgtgactccg 7260
tgaccggcac agcgtgccgt gtggcagacc ccctaaaaag gctgtttaag cttggcaaac 7320
ctctggcagc agacgatgaa catgatgatg acaggagaag ggcattgcat gaagagtcaa 7380
cacgctggaa ccgagtgggt attctttcag agctgtgcaa ggcagtagaa tcaaggtatg 7440
aaaccgtagg aacttccatc atagttatgg ccatgactac tctagctagc agtgttaaat 7500
cattcagcta cctgagaggg gcccctataa ctctctacgg ctaacctgaa tggactacga 7560
catagtctag tccgccaagt ctagcatatg gccacc 7596
<210> 95
<211> 222
<212> PRT
<213> Simian Virus 5
<400> 95
Met Asp Pro Thr Asp Leu Ser Phe Ser Pro Asp Glu Ile Asn Lys Leu
1 5 10 15
Ile Glu Thr Gly Leu Asn Thr Val Glu Tyr Phe Thr Ser Gln Gln Val
20 25 30
Thr Gly Thr Ser Ser Leu Gly Lys Asn Thr Ile Pro Pro Gly Val Thr
35 40 45
Gly Leu Leu Thr Asn Ala Ala Glu Ala Lys Ile Gln Glu Ser Thr Asn
50 55 60
His Gln Lys Gly Ser Val Gly Gly Gly Ala Lys Pro Lys Lys Pro Arg
65 70 75 80
Pro Lys Ile Ala Ile Val Pro Ala Asp Asp Lys Thr Val Pro Gly Lys
85 90 95
Pro Ile Pro Asn Pro Leu Leu Gly Leu Asp Ser Thr Pro Ser Thr Gln
100 105 110
Thr Val Leu Asp Leu Ser Gly Lys Thr Leu Pro Ser Gly Ser Tyr Lys
115 120 125
Gly Val Lys Leu Ala Lys Phe Gly Lys Glu Asn Leu Met Thr Arg Phe
130 135 140
Ile Glu Glu Pro Arg Glu Asn Pro Ile Ala Thr Ser Ser Pro Ile Asp
145 150 155 160
Phe Lys Arg Gly Arg Asp Thr Gly Gly Phe His Arg Arg Glu Tyr Ser
165 170 175
Ile Gly Trp Val Gly Asp Glu Val Lys Val Thr Glu Trp Cys Asn Pro
180 185 190
Ser Cys Ser Pro Ile Thr Ala Ala Ala Arg Arg Phe Glu Cys Thr Cys
195 200 205
His Gln Cys Pro Val Thr Cys Ser Glu Cys Glu Arg Asp Thr
210 215 220
<210> 96
<211> 666
<212> DNA
<213> Simian Virus 5
<400> 96
atggatccca ctgatctgag cttctcccca gatgagatca ataagctcat agagacaggc 60
ctgaatactg tagagtattt tacttcccaa caagtcacag gaacatcctc tcttggaaag 120
aatacaatac caccaggggt cacaggacta ctaaccaatg ctgcagaggc aaagatccaa 180
gagtcaacta accatcagaa gggctcagtt ggtgggggtg caaaaccaaa gaaaccgcga 240
ccaaaaattg ccattgtgcc agcagatgac aaaacagtgc ccggaaagcc gatcccaaac 300
cctctattag gtctggactc caccccgagc acccaaactg tgcttgatct aagtgggaaa 360
acattaccat caggatccta taagggggtt aagcttgcga aatttggaaa agaaaatctg 420
atgacacggt tcatcgagga acccagagag aatcctatcg caaccagttc ccccatcgat 480
tttaagaggg gcagggatac cggcgggttc catagaaggg agtactcaat cggatgggtg 540
ggagatgaag tcaaggtcac tgagtggtgc aatccatcct gttctccaat caccgctgca 600
gcaaggcgat ttgaatgcac ttgtcaccag tgtccagtca cttgctctga atgtgaacga 660
gatact 666
<210> 97
<211> 666
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding SV5B protein
<400> 97
atggacccta ccgacctgag cttcagcccc gacgagatca acaagctgat cgagacaggc 60
ctgaacaccg tggaatactt caccagccag caagtgaccg gcacaagcag cctgggcaag 120
aacacaattc ctccaggcgt gaccggcctg ctgacaaatg ctgccgaggc caagatccaa 180
gagagcacca accaccagaa gggctctgtt ggaggcggag ccaagcctaa gaagcccaga 240
cctaagatcg ccatcgtgcc cgccgacgat aagacagtgc ctggcaagcc cattcctaat 300
cctctgctgg gcctcgacag cacccctagc acacagacag tgctggatct gagcggcaag 360
acactgccta gcggcagcta taagggcgtg aagctggcca agttcggcaa agaaaacctg 420
atgacccggt tcatcgagga acccagagag aaccctatcg ccaccagctc tcccatcgac 480
ttcaagagag gcagagacac cggcggcttc cacagaagag agtacagcat tggctgggtc 540
ggagatgaag tgaaagtgac cgagtggtgc aaccccagct gcagccctat tacagccgcc 600
gctagaagat tcgagtgcac ctgtcaccag tgtcctgtga cctgtagcga gtgcgagaga 660
gacaca 666
<210> 98
<211> 666
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding SV5B protein
<400> 98
auggacccua ccgaccugag cuucagcccc gacgagauca acaagcugau cgagacaggc 60
cugaacaccg uggaauacuu caccagccag caagugaccg gcacaagcag ccugggcaag 120
aacacaauuc cuccaggcgu gaccggccug cugacaaaug cugccgaggc caagauccaa 180
gagagcacca accaccagaa gggcucuguu ggaggcggag ccaagccuaa gaagcccaga 240
ccuaagaucg ccaucgugcc cgccgacgau aagacagugc cuggcaagcc cauuccuaau 300
ccucugcugg gccucgacag caccccuagc acacagacag ugcuggaucu gagcggcaag 360
acacugccua gcggcagcua uaagggcgug aagcuggcca aguucggcaa agaaaaccug 420
augacccggu ucaucgagga acccagagag aacccuaucg ccaccagcuc ucccaucgac 480
uucaagagag gcagagacac cggcggcuuc cacagaagag aguacagcau uggcuggguc 540
ggagaugaag ugaaagugac cgaguggugc aaccccagcu gcagcccuau uacagccgcc 600
gcuagaagau ucgagugcac cugucaccag uguccuguga ccuguagcga gugcgagaga 660
gacaca 666
<210> 99
<211> 225
<212> PRT
<213> Simian Virus 5
<400> 99
Met Ala Glu Glu Pro Thr Tyr Thr Thr Glu Gln Val Asp Glu Leu Ile
1 5 10 15
His Ala Gly Leu Gly Thr Val Asp Phe Phe Leu Ser Arg Pro Ile Asp
20 25 30
Ala Gln Ser Ser Leu Gly Lys Gly Ser Ile Pro Pro Gly Val Thr Ala
35 40 45
Val Leu Thr Ser Ala Ala Glu Ala Lys Ser Lys Pro Val Ala Ala Gly
50 55 60
Pro Val Lys Pro Arg Arg Lys Lys Val Ile Ser Asn Thr Thr Pro Tyr
65 70 75 80
Thr Ile Ala Asp Asn Ile Pro Pro Glu Lys Leu Pro Ile Asn Thr Pro
85 90 95
Ile Pro Asn Pro Leu Leu Pro Leu Ala Arg Pro His Gly Lys Met Thr
100 105 110
Asp Ile Asp Ile Val Thr Gly Asn Ile Thr Glu Gly Ser Tyr Lys Gly
115 120 125
Val Glu Leu Ala Lys Leu Gly Lys Gln Thr Leu Leu Thr Arg Phe Thr
130 135 140
Ser Asn Glu Pro Val Ser Ser Ala Gly Ser Ala Gln Asp Pro Asn Phe
145 150 155 160
Lys Arg Gly Gly Ala Asn Arg Glu Arg Ala Arg Gly Asn His Arg Arg
165 170 175
Glu Trp Ser Ile Ala Trp Val Gly Asp Gln Val Lys Val Phe Glu Trp
180 185 190
Cys Asn Pro Arg Cys Ala Pro Val Thr Ala Ser Ala Arg Lys Phe Thr
195 200 205
Cys Thr Cys Gly Ser Cys Pro Ser Ile Cys Gly Glu Cys Glu Gly Asp
210 215 220
His
225
<210> 100
<211> 675
<212> DNA
<213> Simian Virus 5
<400> 100
atggccgagg aaccaacata caccactgag caagttgatg aattaatcca tgctggactg 60
ggaacagtag atttcttcct atctagaccc atagatgctc agtcttcttt aggcaaaggc 120
agcatcccac caggtgtcac agctgttcta actagtgcag cggaggcaaa atccaaacca 180
gttgctgctg gtccagttaa acccaggcgg aagaaagtga tcagcaatac tactccatac 240
actattgcag acaatattcc acctgagaag ctaccgatca acactccaat acccaatcca 300
ttacttccac tggcacgccc tcacggaaag atgacagaca ttgacattgt cactgggaac 360
attacagaag gatcgtacaa aggtgtggag cttgctaaat tagggaagca gacactactc 420
acaaggttca cctcgaatga gccagtctcc tcagctggat ccgcccaaga ccccaacttt 480
aagagggggg gagctaatag agaaagagca agaggcaacc ataggagaga atggagtatt 540
gcatgggtcg gagatcaggt caaagtcttc gagtggtgta atcccaggtg tgccccagtc 600
acggcctcag ctcgcaagtt cacctgcaca tgcggatcct gccccagcat ctgcggagaa 660
tgtgaaggag atcat 675
<210> 101
<211> 675
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding PIV2 Non-structural protein V
<400> 101
atggccgagg aacctaccta caccaccgaa caggtggacg agctgattca cgccggactg 60
ggaaccgtgg acttctttct gtcccggcct atcgatgccc agagcagcct cggcaaggga 120
tctattcctc ctggcgtgac agccgtgctg acatctgccg ccgaggccaa gtctaaacct 180
gtggctgctg gacccgtgaa gcccagacgg aagaaagtga tcagcaacac cacaccttac 240
acgatcgccg acaacatccc tcctgagaag ctgcccatca acacccctat tcctaatcct 300
ctgctgcccc tggccagacc tcacggcaag atgaccgaca tcgatatcgt gaccggcaac 360
atcaccgagg gcagctacaa aggcgtggaa ctggccaagc tgggcaagca gacactgctg 420
accagattca ccagcaacga gcctgtgtct agcgccggct ctgcccagga tcctaacttc 480
aaaagaggcg gagccaacag agagagagcc agaggcaacc atcggagaga gtggtctatt 540
gcctgggtcg gagatcaagt gaaggtgttc gagtggtgca accccagatg tgcccctgtg 600
acagccagcg ccagaaagtt cacctgtacc tgcggcagct gtcccagcat ttgcggagag 660
tgtgaaggcg accat 675
<210> 102
<211> 675
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding PIV2 Non-structural protein V
<400> 102
auggccgagg aaccuaccua caccaccgaa cagguggacg agcugauuca cgccggacug 60
ggaaccgugg acuucuuucu gucccggccu aucgaugccc agagcagccu cggcaaggga 120
ucuauuccuc cuggcgugac agccgugcug acaucugccg ccgaggccaa gucuaaaccu 180
guggcugcug gacccgugaa gcccagacgg aagaaaguga ucagcaacac cacaccuuac 240
acgaucgccg acaacauccc uccugagaag cugcccauca acaccccuau uccuaauccu 300
cugcugcccc uggccagacc ucacggcaag augaccgaca ucgauaucgu gaccggcaac 360
aucaccgagg gcagcuacaa aggcguggaa cuggccaagc ugggcaagca gacacugcug 420
accagauuca ccagcaacga gccugugucu agcgccggcu cugcccagga uccuaacuuc 480
aaaagaggcg gagccaacag agagagagcc agaggcaacc aucggagaga guggucuauu 540
gccugggucg gagaucaagu gaagguguuc gaguggugca accccagaug ugccccugug 600
acagccagcg ccagaaaguu caccuguacc ugcggcagcu gucccagcau uugcggagag 660
ugugaaggcg accau 675
<210> 103
<211> 224
<212> PRT
<213> Mumps virus
<400> 103
Met Asp Gln Phe Ile Lys Gln Asp Glu Thr Gly Asp Leu Ile Glu Thr
1 5 10 15
Gly Met Asn Val Ala Asn His Phe Leu Ser Ala Pro Ile Gln Gly Thr
20 25 30
Asn Ser Leu Ser Lys Ala Thr Ile Ile Pro Gly Val Ala Pro Val Leu
35 40 45
Ile Gly Asn Pro Glu Gln Lys Asn Ile Gln Tyr Pro Thr Thr Ser His
50 55 60
Gln Gly Ser Lys Ser Lys Gly Arg Gly Ser Gly Ala Arg Pro Ile Ile
65 70 75 80
Val Ser Ser Ser Glu Gly Gly Thr Gly Gly Thr Gln Val Pro Glu Pro
85 90 95
Leu Phe Ala Gln Thr Gly Gln Gly Gly Ile Val Thr Thr Val Tyr Gln
100 105 110
Asp Pro Thr Ile Gln Pro Thr Gly Ser Tyr Arg Ser Val Glu Leu Ala
115 120 125
Lys Ile Gly Lys Glu Arg Met Ile Asn Arg Phe Val Glu Lys Pro Arg
130 135 140
Thr Ser Thr Pro Val Thr Glu Phe Lys Arg Gly Ala Gly Ser Gly Cys
145 150 155 160
Ser Arg Pro Asp Asn Pro Arg Gly Gly His Arg Arg Glu Trp Ser Leu
165 170 175
Ser Trp Val Gln Gly Glu Val Arg Val Phe Glu Trp Cys Asn Pro Ile
180 185 190
Cys Ser Pro Ile Thr Ala Ala Ala Arg Phe His Ser Cys Lys Cys Gly
195 200 205
Asn Cys Pro Ala Lys Cys Asp Gln Cys Glu Arg Asp Tyr Gly Pro Pro
210 215 220
<210> 104
<211> 672
<212> DNA
<213> Mumps virus
<400> 104
atggaccaat ttataaaaca agatgagact ggtgatttaa ttgagacagg aatgaacgtt 60
gcaaatcatt tcctatccgc ccccattcag ggaaccaact cgttgagcaa ggccacaatc 120
atccctggcg ttgcaccagt actcattggc aatccagagc aaaagaacat tcagtacccc 180
accacatcac atcagggatc caagtcaaag ggcagaggct caggggccag gcccatcata 240
gtctcatcct ccgaaggagg cactggaggg actcaggttc ctgagcccct tttcgcacaa 300
acaggacaag gtggcattgt caccaccgtt tatcaggatc caactatcca accaacaggt 360
tcatatcgaa gtgtggaatt ggctaagata ggaaaagaga gaatgattaa tcgatttgtt 420
gaaaaaccaa gaacctcaac gccggtaaca gaatttaaga ggggggccgg gagcggctgc 480
tcaaggccag acaatccaag aggagggcat agacgggaat ggagcctcag ctgggtccaa 540
ggagaggtcc gggtctttga gtggtgcaac cccatatgct cacctatcac tgccgcagca 600
agattccact cctgcaaatg tgggaattgc cccgcaaagt gcgatcagtg cgaacgagat 660
tatggacctc ct 672
<210> 105
<211> 672
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding Mumps V protein
<400> 105
atggaccagt tcatcaagca ggacgagaca ggcgacctga tcgaaaccgg catgaacgtg 60
gccaaccact tcctgtctgc ccctatccag ggcaccaaca gcctgagcaa ggccacaatt 120
atccctggcg tggcccctgt gctgatcggc aatcctgagc agaagaacat tcagtacccc 180
accaccagcc accagggcag caagtctaaa ggcagaggct ctggcgctcg gcccatcatc 240
gtttctagta gcgaaggcgg caccggcgga acacaggttc cagaacctct gtttgcccag 300
acaggccaag gcggcatcgt gaccacagtg taccaggatc ctaccatcca gcctaccggc 360
agctacagaa gcgtggaact ggccaagatc ggcaaagaac ggatgatcaa ccgcttcgtg 420
gaaaagccca gaaccagcac acccgtgacc gagttcaaaa gaggcgccgg aagcggctgc 480
agcagacccg ataatcctag aggcggccat cggagagagt ggtccctgtc ttgggttcag 540
ggcgaagtgc gggtgttcga gtggtgcaat cctatctgca gccccatcac agccgccgct 600
agattccaca gctgcaagtg cggaaactgc cccgccaagt gtgaccagtg cgagagagat 660
tacggccctc ct 672
<210> 106
<211> 672
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding Mumps V protein
<400> 106
auggaccagu ucaucaagca ggacgagaca ggcgaccuga ucgaaaccgg caugaacgug 60
gccaaccacu uccugucugc cccuauccag ggcaccaaca gccugagcaa ggccacaauu 120
aucccuggcg uggccccugu gcugaucggc aauccugagc agaagaacau ucaguacccc 180
accaccagcc accagggcag caagucuaaa ggcagaggcu cuggcgcucg gcccaucauc 240
guuucuagua gcgaaggcgg caccggcgga acacagguuc cagaaccucu guuugcccag 300
acaggccaag gcggcaucgu gaccacagug uaccaggauc cuaccaucca gccuaccggc 360
agcuacagaa gcguggaacu ggccaagauc ggcaaagaac ggaugaucaa ccgcuucgug 420
gaaaagccca gaaccagcac acccgugacc gaguucaaaa gaggcgccgg aagcggcugc 480
agcagacccg auaauccuag aggcggccau cggagagagu ggucccuguc uuggguucag 540
ggcgaagugc ggguguucga guggugcaau ccuaucugca gccccaucac agccgccgcu 600
agauuccaca gcugcaagug cggaaacugc cccgccaagu gugaccagug cgagagagau 660
uacggcccuc cu 672
<210> 107
<211> 384
<212> PRT
<213> Sendai virus
<400> 107
Met Asp Gln Asp Ala Phe Ile Leu Lys Glu Asp Ser Glu Val Glu Arg
1 5 10 15
Glu Ala Pro Gly Gly Arg Glu Ser Leu Ser Asp Val Ile Gly Phe Leu
20 25 30
Asp Ala Val Leu Ser Ser Glu Pro Thr Asp Ile Gly Gly Asp Arg Ser
35 40 45
Trp Leu His Asn Thr Ile Asn Thr Pro Gln Gly Pro Gly Ser Ala His
50 55 60
Arg Ala Lys Ser Glu Gly Glu Gly Glu Val Ser Thr Pro Ser Thr Gln
65 70 75 80
Asp Asn Arg Ser Gly Glu Glu Ser Arg Val Ser Gly Arg Thr Ser Lys
85 90 95
Pro Glu Ala Glu Ala His Ala Gly Asn Leu Asp Lys Gln Asn Ile His
100 105 110
Arg Ala Phe Gly Gly Arg Thr Gly Thr Asn Ser Val Ser Gln Asp Leu
115 120 125
Gly Asp Gly Gly Asp Ser Gly Ile Leu Glu Asn Pro Pro Asn Glu Arg
130 135 140
Gly Tyr Pro Arg Ser Gly Ile Glu Asp Glu Asn Arg Glu Met Ala Ala
145 150 155 160
His Pro Asp Lys Arg Gly Glu Asp Gln Ala Glu Gly Leu Pro Glu Glu
165 170 175
Val Arg Gly Gly Thr Ser Leu Pro Asp Glu Gly Glu Gly Gly Ala Ser
180 185 190
Asn Asn Gly Arg Ser Met Glu Pro Gly Ser Ser His Ser Ala Arg Val
195 200 205
Thr Gly Val Leu Val Ile Pro Ser Pro Glu Leu Glu Glu Ala Val Leu
210 215 220
Arg Arg Asn Lys Arg Arg Pro Thr Asn Ser Gly Ser Lys Pro Leu Thr
225 230 235 240
Pro Ala Thr Val Pro Gly Thr Arg Ser Pro Pro Leu Asn Arg Tyr Asn
245 250 255
Ser Thr Gly Ser Pro Pro Gly Lys Pro Pro Ser Thr Gln Asp Glu His
260 265 270
Ile Asn Ser Gly Asp Thr Pro Ala Val Arg Val Lys Asp Arg Lys Pro
275 280 285
Pro Ile Gly Thr Arg Ser Val Ser Asp Cys Pro Ala Asn Gly Arg Pro
290 295 300
Ile His Pro Gly Leu Glu Thr Asp Ser Thr Lys Lys Gly His Arg Arg
305 310 315 320
Glu His Ile Ile Tyr Glu Arg Asp Gly Tyr Ile Val Asp Glu Ser Trp
325 330 335
Cys Asn Pro Val Cys Ser Arg Ile Arg Val Ile Pro Arg Arg Glu Leu
340 345 350
Cys Val Cys Lys Thr Cys Pro Lys Val Cys Lys Leu Cys Arg Asp Asp
355 360 365
Ile Gln Cys Met Arg Pro Asp Pro Phe Cys Arg Glu Ile Phe Arg Ser
370 375 380
<210> 108
<211> 1152
<212> DNA
<213> Sendai virus
<400> 108
atggatcaag atgccttcat tcttaaagaa gattctgaag ttgagaggga ggcgccagga 60
ggaagagagt cgctctcgga tgttatcgga ttcctcgatg ctgtcctgtc gagtgaacca 120
actgacatcg gaggggacag aagctggctc cacaacacca tcaacactcc ccaaggacca 180
ggctctgccc atagagccaa aagtgagggc gaaggagaag tctcaacacc gtcgacccaa 240
gataatcgat caggtgagga gagtagagtc tctgggagaa caagcaagcc agaggcagaa 300
gcacatgctg gaaaccttga taaacaaaat atacaccggg cctttggggg aagaactggt 360
acaaactctg tatctcagga tctgggcgat ggaggagact ccggaatcct tgaaaatccc 420
ccaaatgaga gaggatatcc gagatcaggt attgaagatg aaaacagaga gatggctgcg 480
caccctgata agaggggaga agaccaagct gaaggacttc cagaagaggt acgaggaggt 540
acatccctac ctgatgaagg agaaggtgga gcaagtaata atggaagaag catggagcct 600
ggcagctcac atagtgcaag agtaactggg gtcctggtga ttcctagccc cgaactcgaa 660
gaggctgtgc tacggaggaa caaaagaaga cctaccaaca gtgggtccaa acctcttact 720
ccagcaaccg tgcctggcac ccggtcccca ccgctgaatc gttacaacag cacagggtca 780
ccaccaggaa aacccccatc tacacaggat gagcacatca actctgggga cacccccgcc 840
gtcagggtca aagaccggaa accaccaata gggacccgct ctgtctcaga ttgtccagcc 900
aacggccgcc caatccaccc gggtctagag accgactcaa caaaaaaggg gcataggaga 960
gaacacatca tctatgaaag agatggctac attgttgacg agtcttggtg taatccagtc 1020
tgctcaagaa ttcgagtcat cccgagacgc gagttatgtg tttgcaagac gtgccctaaa 1080
gtctgcaaac tatgcagaga tgacattcaa tgtatgcggc ctgatccttt ctgccgagaa 1140
atcttccgct cg 1152
<210> 109
<211> 1152
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding SeV V protein
<400> 109
atggaccagg acgccttcat cctgaaagag gacagcgagg tcgagagaga agcccctggc 60
ggaagagaaa gcctgtccga tgtgatcggc ttcctggatg ccgtgctgag cagcgagcct 120
acagatatcg gcggcgatag aagctggctg cacaacacca tcaacacccc tcaaggccct 180
ggctctgccc acagagctaa gtctgaaggc gagggcgaag tgtctacccc tagcacacag 240
gacaacagaa gcggcgagga atccagagtg tccggcagaa caagcaagcc tgaggccgaa 300
gctcacgccg gcaatctgga caagcagaac atccacagag ccttcggcgg cagaaccggc 360
acaaatagcg tgtcacagga cctcggagat ggcggcgatt ctggcatcct ggaaaaccct 420
ccaaacgagc ggggctaccc tagaagcgga atcgaggacg agaacagaga gatggccgct 480
catcccgaca agagaggcga agatcaggcc gagggactgc ctgaagaagt gcgcggagga 540
acaagcctgc ctgacgaagg cgaaggcgga gcctctaaca acggcagatc tatggaaccc 600
ggcagcagcc atagcgccag agttacaggc gtgctggtca tcccatctcc agagctggaa 660
gaggctgtgc tgaggcggaa caagagaagg cctaccaaca gcggcagcaa gcctctgaca 720
ccagctacag tgcctggcac aagaagccct ccactgaacc ggtacaacag cacaggctct 780
ccacctggca agcctccatc cacacaggat gagcacatca actccggcga tacccctgcc 840
gtcagagtga aggacagaaa gcctcctatc ggcaccagaa gcgtgtccga ctgtcctgcc 900
aatggcagac ctattcaccc cggcctggaa accgacagca ccaagaaggg acacagacgg 960
gaacacatca tctacgagcg cgacggctac atcgtggacg agagctggtg caaccctgtg 1020
tgcagccgga tcagagtgat ccctcggaga gaactgtgcg tgtgcaagac atgccccaaa 1080
gtgtgcaagc tgtgccggga cgacatccag tgtatgcggc ccgatccttt ctgcagagag 1140
atcttcagaa gc 1152
<210> 110
<211> 1152
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding SeV V protein
<400> 110
auggaccagg acgccuucau ccugaaagag gacagcgagg ucgagagaga agccccuggc 60
ggaagagaaa gccuguccga ugugaucggc uuccuggaug ccgugcugag cagcgagccu 120
acagauaucg gcggcgauag aagcuggcug cacaacacca ucaacacccc ucaaggcccu 180
ggcucugccc acagagcuaa gucugaaggc gagggcgaag ugucuacccc uagcacacag 240
gacaacagaa gcggcgagga auccagagug uccggcagaa caagcaagcc ugaggccgaa 300
gcucacgccg gcaaucugga caagcagaac auccacagag ccuucggcgg cagaaccggc 360
acaaauagcg ugucacagga ccucggagau ggcggcgauu cuggcauccu ggaaaacccu 420
ccaaacgagc ggggcuaccc uagaagcgga aucgaggacg agaacagaga gauggccgcu 480
caucccgaca agagaggcga agaucaggcc gagggacugc cugaagaagu gcgcggagga 540
acaagccugc cugacgaagg cgaaggcgga gccucuaaca acggcagauc uauggaaccc 600
ggcagcagcc auagcgccag aguuacaggc gugcugguca ucccaucucc agagcuggaa 660
gaggcugugc ugaggcggaa caagagaagg ccuaccaaca gcggcagcaa gccucugaca 720
ccagcuacag ugccuggcac aagaagcccu ccacugaacc gguacaacag cacaggcucu 780
ccaccuggca agccuccauc cacacaggau gagcacauca acuccggcga uaccccugcc 840
gucagaguga aggacagaaa gccuccuauc ggcaccagaa gcguguccga cuguccugcc 900
aauggcagac cuauucaccc cggccuggaa accgacagca ccaagaaggg acacagacgg 960
gaacacauca ucuacgagcg cgacggcuac aucguggacg agagcuggug caacccugug 1020
ugcagccgga ucagagugau cccucggaga gaacugugcg ugugcaagac augccccaaa 1080
gugugcaagc ugugccggga cgacauccag uguaugcggc ccgauccuuu cugcagagag 1140
aucuucagaa gc 1152
<210> 111
<211> 299
<212> PRT
<213> Measles virus
<400> 111
Met Ala Glu Glu Gln Ala Arg His Val Lys Asn Gly Leu Glu Cys Ile
1 5 10 15
Arg Ala Leu Lys Ala Glu Pro Ile Gly Ser Leu Ala Val Glu Glu Ala
20 25 30
Met Ala Ala Trp Ser Glu Ile Ser Asp Asn Pro Gly Gln Asp Arg Ala
35 40 45
Thr Cys Lys Glu Glu Glu Ala Gly Ser Ser Gly Leu Ser Lys Pro Cys
50 55 60
Leu Ser Ala Ile Gly Ser Thr Glu Gly Gly Ala Pro Arg Ile Arg Gly
65 70 75 80
Gln Gly Ser Gly Glu Ser Asp Asp Asp Ala Glu Thr Leu Gly Ile Pro
85 90 95
Ser Arg Asn Leu Gln Ala Ser Ser Thr Gly Leu Gln Cys Tyr His Val
100 105 110
Tyr Asp His Ser Gly Glu Ala Val Lys Gly Ile Gln Asp Ala Asp Ser
115 120 125
Ile Met Val Gln Ser Gly Leu Asp Gly Asp Ser Thr Leu Ser Gly Gly
130 135 140
Asp Asp Glu Ser Glu Asn Ser Asp Val Asp Ile Gly Glu Pro Asp Thr
145 150 155 160
Glu Gly Tyr Ala Ile Thr Asp Arg Gly Ser Ala Pro Ile Ser Met Gly
165 170 175
Phe Arg Ala Ser Asp Val Glu Thr Ala Glu Gly Gly Glu Ile His Glu
180 185 190
Leu Leu Lys Leu Gln Ser Arg Gly Asn Asn Phe Pro Lys Leu Gly Lys
195 200 205
Thr Leu Asn Val Pro Pro Pro Pro Asn Pro Ser Arg Ala Ser Thr Ser
210 215 220
Glu Thr Pro Ile Lys Lys Gly His Arg Arg Glu Ile Gly Leu Ile Trp
225 230 235 240
Asn Gly Asp Arg Val Phe Ile Asp Arg Trp Cys Asn Pro Met Cys Ser
245 250 255
Lys Val Thr Leu Gly Thr Ile Arg Ala Arg Cys Thr Cys Gly Glu Cys
260 265 270
Pro Arg Val Cys Glu Gln Cys Arg Thr Asp Thr Gly Val Asp Thr Arg
275 280 285
Ile Trp Tyr His Asn Leu Pro Glu Ile Pro Glu
290 295
<210> 112
<211> 897
<212> DNA
<213> Measles virus
<400> 112
atggcagaag agcaggcacg ccatgtcaaa aacggactgg aatgcatccg ggctctcaag 60
gccgagccca tcggctcact ggccgtcgag gaagccatgg cagcatggtc agaaatatca 120
gacaacccag gacaggaccg agccacctgc aaggaagagg aggcaggcag ttcgggtctc 180
agcaaaccat gcctctcagc aattggatca actgaaggcg gtgcacctcg catccgcggt 240
cagggatctg gagaaagcga tgacgacgct gaaactttgg gaatcccctc aagaaatctc 300
caggcatcaa gcactgggtt acagtgttat catgtttatg atcacagcgg tgaagcggtt 360
aagggaatcc aagatgctga ctctatcatg gttcaatcag gccttgatgg tgatagcacc 420
ctctcaggag gagacgatga atctgaaaac agcgatgtgg atattggcga acctgatacc 480
gagggatatg ctatcactga ccggggatct gctcccatct ctatggggtt cagggcttct 540
gatgttgaaa ctgcagaagg aggggagatc cacgagctcc tgaaactcca atccagaggc 600
aacaactttc cgaagcttgg gaaaactctc aatgttcctc cgcccccgaa ccccagtagg 660
gccagcactt ccgagacacc cattaaaaag gggcacagac gcgagattgg cctcatttgg 720
aacggagatc gcgtctttat tgacaggtgg tgcaacccaa tgtgctcgaa agtcaccctc 780
ggaaccatca gggccaggtg cacctgcggg gaatgtcccc gagtgtgtga gcaatgccgc 840
actgatacag gagtggacac ccgaatctgg taccacaatc tccccgagat cccagaa 897
<210> 113
<211> 897
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding Measles V protein
<400> 113
atggccgaag aacaggccag acacgtgaag aacggcctgg aatgcatcag agccctgaag 60
gccgagccta tcggatctct ggctgtggaa gaagccatgg ccgcttggag cgagatcagc 120
gataatcccg gccaggaccg ggccacctgt aaagaagaag aggccggatc tagcggcctg 180
agcaagcctt gtctgtctgc catcggctct acagaaggcg gcgctcctag aatcagaggc 240
caaggatctg gcgagagcga cgacgatgct gagacactgg gcatccccag cagaaatctg 300
caggccagct ctaccggcct gcagtgctat cacgtgtacg atcactctgg cgaggccgtg 360
aagggaatcc aggatgccga tagcatcatg gtgcagagcg gcctggatgg cgactctaca 420
cttagcggcg gagatgacga gagcgagaac tccgatgtgg acatcggcga gcctgataca 480
gagggctacg ccatcacaga cagaggcagc gcccctatca gcatgggctt tagagccagc 540
gacgtggaaa cagccgaagg cggagagatt cacgagctgc tgaagctgca gagccggggc 600
aacaactttc ccaagctggg caagaccctg aacgtgccac ctcctccaaa tcctagcaga 660
gccagcacca gcgagacacc catcaagaag ggccacagaa gagagatcgg cctgatctgg 720
aacggcgacc gggtgttcat cgacagatgg tgcaacccca tgtgcagcaa agtgaccctg 780
ggcaccatcc gggccagatg tacatgcgga gagtgcccta gagtgtgcga gcagtgcaga 840
accgataccg gcgtggacac ccggatctgg tatcacaacc tgcctgagat ccccgag 897
<210> 114
<211> 897
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding Measles V protein
<400> 114
auggccgaag aacaggccag acacgugaag aacggccugg aaugcaucag agcccugaag 60
gccgagccua ucggaucucu ggcuguggaa gaagccaugg ccgcuuggag cgagaucagc 120
gauaaucccg gccaggaccg ggccaccugu aaagaagaag aggccggauc uagcggccug 180
agcaagccuu gucugucugc caucggcucu acagaaggcg gcgcuccuag aaucagaggc 240
caaggaucug gcgagagcga cgacgaugcu gagacacugg gcauccccag cagaaaucug 300
caggccagcu cuaccggccu gcagugcuau cacguguacg aucacucugg cgaggccgug 360
aagggaaucc aggaugccga uagcaucaug gugcagagcg gccuggaugg cgacucuaca 420
cuuagcggcg gagaugacga gagcgagaac uccgaugugg acaucggcga gccugauaca 480
gagggcuacg ccaucacaga cagaggcagc gccccuauca gcaugggcuu uagagccagc 540
gacguggaaa cagccgaagg cggagagauu cacgagcugc ugaagcugca gagccggggc 600
aacaacuuuc ccaagcuggg caagacccug aacgugccac cuccuccaaa uccuagcaga 660
gccagcacca gcgagacacc caucaagaag ggccacagaa gagagaucgg ccugaucugg 720
aacggcgacc ggguguucau cgacagaugg ugcaacccca ugugcagcaa agugacccug 780
ggcaccaucc gggccagaug uacaugcgga gagugcccua gagugugcga gcagugcaga 840
accgauaccg gcguggacac ccggaucugg uaucacaacc ugccugagau ccccgag 897
<210> 115
<211> 456
<212> PRT
<213> Nipah Virus
<400> 115
Met Asp Lys Leu Glu Leu Val Asn Asp Gly Leu Asn Ile Ile Asp Phe
1 5 10 15
Ile Gln Lys Asn Gln Lys Glu Ile Gln Lys Thr Tyr Gly Arg Ser Ser
20 25 30
Ile Gln Gln Pro Ser Ile Lys Asp Gln Thr Lys Ala Trp Glu Asp Phe
35 40 45
Leu Gln Cys Thr Ser Gly Glu Ser Glu Gln Val Glu Gly Gly Met Ser
50 55 60
Lys Asp Asp Gly Asp Val Glu Arg Arg Asn Leu Glu Asp Leu Ser Ser
65 70 75 80
Thr Ser Pro Thr Asp Gly Thr Ile Gly Lys Arg Val Ser Asn Thr Arg
85 90 95
Asp Trp Ala Glu Gly Ser Asp Asp Ile Gln Leu Asp Pro Val Val Thr
100 105 110
Asp Val Val Tyr His Asp His Gly Gly Glu Cys Thr Gly Tyr Gly Phe
115 120 125
Thr Ser Ser Pro Glu Arg Gly Trp Ser Asp Tyr Thr Ser Gly Ala Asn
130 135 140
Asn Gly Asn Val Cys Leu Val Ser Asp Ala Lys Met Leu Ser Tyr Ala
145 150 155 160
Pro Glu Ile Ala Val Ser Lys Glu Asp Arg Glu Thr Asp Leu Val His
165 170 175
Leu Glu Asn Lys Leu Ser Thr Thr Gly Leu Asn Pro Thr Ala Val Pro
180 185 190
Phe Thr Leu Arg Asn Leu Ser Asp Pro Ala Lys Asp Ser Pro Val Ile
195 200 205
Ala Glu His Tyr Tyr Gly Leu Gly Val Lys Glu Gln Asn Val Gly Pro
210 215 220
Gln Thr Ser Arg Asn Val Asn Leu Asp Ser Ile Lys Leu Tyr Thr Ser
225 230 235 240
Asp Asp Glu Glu Ala Asp Gln Leu Glu Phe Glu Asp Glu Phe Ala Gly
245 250 255
Ser Ser Ser Glu Val Ile Val Gly Ile Ser Pro Glu Asp Glu Glu Pro
260 265 270
Ser Ser Val Gly Gly Lys Pro Asn Glu Ser Ile Gly Arg Thr Ile Glu
275 280 285
Gly Gln Ser Ile Arg Asp Asn Leu Gln Ala Lys Asp Asn Lys Ser Thr
290 295 300
Asp Val Pro Gly Ala Gly Pro Lys Asp Ser Ala Val Lys Glu Glu Pro
305 310 315 320
Pro Gln Lys Arg Leu Pro Met Leu Ala Glu Glu Phe Glu Cys Ser Gly
325 330 335
Ser Glu Asp Pro Ile Ile Arg Glu Leu Leu Lys Glu Asn Ser Leu Ile
340 345 350
Asn Cys Gln Gln Gly Lys Asp Ala Gln Pro Pro Tyr His Trp Ser Ile
355 360 365
Glu Arg Ser Ile Ser Pro Asp Lys Thr Glu Ile Val Asn Gly Ala Val
370 375 380
Gln Thr Ala Asp Arg Gln Arg Pro Gly Thr Pro Met Pro Lys Ser Arg
385 390 395 400
Gly Ile Pro Ile Lys Lys Gly His Arg Arg Glu Ile Ser Ile Cys Trp
405 410 415
Asp Gly Lys Arg Ala Trp Val Glu Glu Trp Cys Asn Pro Ala Cys Ser
420 425 430
Arg Ile Thr Pro Leu Pro Arg Arg Gln Glu Cys Gln Cys Gly Glu Cys
435 440 445
Pro Thr Glu Cys Phe His Cys Gly
450 455
<210> 116
<211> 1368
<212> DNA
<213> Nipah Virus
<400> 116
atggataaat tggaactagt caatgatggc ctcaatatta ttgactttat tcagaagaac 60
caaaaagaaa tacagaagac atacggacga tcaagtattc aacaacccag catcaaagat 120
caaacaaaag cctgggaaga ttttctgcag tgcaccagtg gagaatctga acaagttgag 180
gggggaatgt ctaaggatga tggagatgtt gaaagaagaa acttggagga tctatccagt 240
acttctccca cagatggaac tattggaaag agagtgtcga acacccgtga ctgggcagaa 300
ggttcagatg acatacaact ggacccagtg gttacagacg ttgtatacca tgatcatgga 360
ggagaatgta ccggatatgg atttacttca agccctgaga gagggtggag tgattacaca 420
tcaggagcaa acaatgggaa tgtatgtctt gtatctgatg caaagatgct gtcctatgct 480
cccgaaattg cagtttctaa agaagatcgg gaaactgatc tagttcatct tgagaataaa 540
ctatctacta caggactgaa tcccacagca gtaccgttca ctctgagaaa cctgtctgat 600
cctgcaaaag actctcctgt gattgctgaa cactactacg gactaggagt taaagagcaa 660
aacgttggcc ctcagactag cagaaatgtc aatttggaca gcatcaaatt gtacacatca 720
gatgacgaag aggcagatca gcttgaattc gaagatgagt ttgcaggaag ctcaagtgaa 780
gtgatagtcg gcatttctcc tgaagatgaa gagccttcaa gtgttggcgg aaaacccaat 840
gaatccattg gacgtacaat cgaaggccaa tcaatccgag acaaccttca agccaaggac 900
aacaaatcaa cagatgtacc aggagcagga ccgaaagatt cagcagtgaa ggaagaacca 960
ccccagaaga ggctacctat gttagctgaa gaatttgagt gctctggatc ggaagaccca 1020
atcattcggg agctgctgaa ggagaactca ctcataaatt gtcagcaagg gaaagatgct 1080
cagcctccat atcattggag catcgagagg tcaataagcc cggataaaac tgagatcgtc 1140
aacggtgctg tgcaaactgc tgacaggcaa agaccaggaa ctccgatgcc aaagtcccga 1200
ggtattccca ttaaaaaggg gcacagacgc gaaatatcca tctgctggga cggaaaacgt 1260
gcctgggtcg aagagtggtg caacccggca tgttcgagga tcacccccct accaagaagg 1320
caagagtgtc aatgcggaga atgtccaact gaatgcttcc actgcggt 1368
<210> 117
<211> 1368
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding NiV V protein
<400> 117
atggacaagc tggaactggt caacgacggc ctgaacatca tcgacttcat ccagaagaac 60
cagaaagaga tccagaaaac ctacggccgg tccagcatcc agcagcctag catcaaggat 120
cagaccaagg cctgggaaga tttcctgcag tgtaccagcg gcgagagcga acaggttgaa 180
ggcggcatga gcaaggacga cggcgacgtg gaaagacgga acctggaaga tctgagcagc 240
acaagcccta ccgatggcac catcggcaag cgggtgtcca acacaagaga ttgggccgag 300
ggcagcgacg acattcagct ggatcctgtg gtcaccgatg tggtgtacca cgatcacggc 360
ggcgagtgta caggctacgg ctttacaagc agccccgaga gaggctggag cgattataca 420
agcggcgcca acaacggcaa cgtgtgcctg gtgtctgacg ccaagatgct gagctacgcc 480
cctgagatcg ccgtgtccaa agaggacaga gaaaccgacc tggtgcacct ggaaaacaag 540
ctgagcacca ccggactgaa ccctaccgcc gtgcctttca cactgagaaa cctgagcgac 600
cccgccaagg actctcctgt gattgccgag cactactacg gcctgggcgt gaaagaacag 660
aacgtgggcc ctcagaccag ccggaacgtg aacctggatt ccatcaagct gtacacctcc 720
gacgacgagg aagccgacca gctggaattc gaggatgagt ttgccggcag cagcagcgaa 780
gtgattgtgg gcatcagccc tgaggacgag gaacctagct ctgttggcgg caagcccaat 840
gagagcatcg gcagaacaat cgagggccag agcatccggg ataacctgca ggccaaggac 900
aacaagagca ccgatgttcc aggcgctggc cctaaggata gcgccgtgaa agaggaacca 960
cctcagaaac ggctgcccat gctggccgag gaatttgagt gtagcggcag cgaggacccc 1020
atcatcagag agctgctgaa agagaacagc ctgatcaact gccagcaggg caaagacgcc 1080
cagcctcctt accactggtc catcgagaga tctatcagcc ccgacaagac cgagatcgtg 1140
aatggcgctg tgcagaccgc cgatagacag aggcctggaa ctcccatgcc taagagcaga 1200
ggcatcccca tcaagaaggg ccacagaaga gagatcagca tctgctggga cggcaagcgc 1260
gcctgggttg aagagtggtg taatcccgcc tgcagccgga tcacacctct gcctagaagg 1320
caagagtgcc agtgtggcga gtgtcccacc gagtgttttc actgtgga 1368
<210> 118
<211> 1368
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding NiV V protein
<400> 118
auggacaagc uggaacuggu caacgacggc cugaacauca ucgacuucau ccagaagaac 60
cagaaagaga uccagaaaac cuacggccgg uccagcaucc agcagccuag caucaaggau 120
cagaccaagg ccugggaaga uuuccugcag uguaccagcg gcgagagcga acagguugaa 180
ggcggcauga gcaaggacga cggcgacgug gaaagacgga accuggaaga ucugagcagc 240
acaagcccua ccgauggcac caucggcaag cgggugucca acacaagaga uugggccgag 300
ggcagcgacg acauucagcu ggauccugug gucaccgaug ugguguacca cgaucacggc 360
ggcgagugua caggcuacgg cuuuacaagc agccccgaga gaggcuggag cgauuauaca 420
agcggcgcca acaacggcaa cgugugccug gugucugacg ccaagaugcu gagcuacgcc 480
ccugagaucg ccguguccaa agaggacaga gaaaccgacc uggugcaccu ggaaaacaag 540
cugagcacca ccggacugaa cccuaccgcc gugccuuuca cacugagaaa ccugagcgac 600
cccgccaagg acucuccugu gauugccgag cacuacuacg gccugggcgu gaaagaacag 660
aacgugggcc cucagaccag ccggaacgug aaccuggauu ccaucaagcu guacaccucc 720
gacgacgagg aagccgacca gcuggaauuc gaggaugagu uugccggcag cagcagcgaa 780
gugauugugg gcaucagccc ugaggacgag gaaccuagcu cuguuggcgg caagcccaau 840
gagagcaucg gcagaacaau cgagggccag agcauccggg auaaccugca ggccaaggac 900
aacaagagca ccgauguucc aggcgcuggc ccuaaggaua gcgccgugaa agaggaacca 960
ccucagaaac ggcugcccau gcuggccgag gaauuugagu guagcggcag cgaggacccc 1020
aucaucagag agcugcugaa agagaacagc cugaucaacu gccagcaggg caaagacgcc 1080
cagccuccuu accacugguc caucgagaga ucuaucagcc ccgacaagac cgagaucgug 1140
aauggcgcug ugcagaccgc cgauagacag aggccuggaa cucccaugcc uaagagcaga 1200
ggcaucccca ucaagaaggg ccacagaaga gagaucagca ucugcuggga cggcaagcgc 1260
gccuggguug aagaguggug uaaucccgcc ugcagccgga ucacaccucu gccuagaagg 1320
caagagugcc aguguggcga gugucccacc gaguguuuuc acugugga 1368
<210> 119
<211> 318
<212> PRT
<213> Encephalomyocarditis virus
<400> 119
Leu Lys Ala Arg Asp Ile Asn Asp Ile Phe Ala Ile Leu Lys Asn Gly
1 5 10 15
Glu Trp Leu Val Lys Leu Ile Leu Ala Ile Arg Asp Trp Ile Lys Ala
20 25 30
Trp Ile Ala Ser Glu Glu Lys Phe Val Thr Met Thr Asp Leu Val Pro
35 40 45
Gly Ile Leu Glu Lys Gln Arg Asp Leu Asn Asp Pro Ser Lys Tyr Lys
50 55 60
Glu Ala Lys Glu Trp Leu Asp Asn Ala Arg Gln Ala Cys Leu Lys Ser
65 70 75 80
Gly Asn Val His Ile Ala Asn Leu Cys Lys Val Val Ala Pro Ala Pro
85 90 95
Ser Lys Ser Arg Pro Glu Pro Val Val Val Cys Leu Arg Gly Lys Ser
100 105 110
Gly Gln Gly Lys Ser Phe Leu Ala Asn Val Leu Ala Gln Ala Ile Ser
115 120 125
Thr His Phe Thr Gly Arg Ile Asp Ser Val Trp Tyr Cys Pro Pro Asp
130 135 140
Pro Asp His Phe Asp Gly Tyr Asn Gln Gln Thr Val Val Val Met Asp
145 150 155 160
Asp Leu Gly Gln Asn Pro Asp Gly Lys Asp Phe Lys Tyr Phe Ala Gln
165 170 175
Met Val Ser Thr Thr Gly Phe Ile Pro Pro Met Ala Ser Leu Glu Asp
180 185 190
Lys Gly Lys Pro Phe Asn Ser Lys Val Ile Ile Ala Thr Thr Asn Leu
195 200 205
Tyr Ser Gly Phe Thr Pro Arg Thr Met Val Cys Pro Asp Ala Leu Asn
210 215 220
Arg Arg Phe His Phe Asp Ile Asp Val Ser Ala Lys Asp Gly Tyr Lys
225 230 235 240
Ile Asn Ser Lys Leu Asp Ile Ile Lys Ala Leu Glu Asp Thr His Ala
245 250 255
Asn Pro Val Ala Met Phe Gln Tyr Asp Cys Ala Leu Leu Asn Gly Met
260 265 270
Ala Val Glu Met Lys Arg Met Gln Gln Asp Met Phe Lys Pro Gln Pro
275 280 285
Pro Leu Gln Asn Val Tyr Gln Leu Val Gln Glu Val Ile Asp Arg Val
290 295 300
Glu Leu His Glu Lys Val Ser Ser His Pro Ile Phe Lys Gln
305 310 315
<210> 120
<211> 954
<212> DNA
<213> Encephalomyocarditis virus
<400> 120
ctcaaagcac gtgacatcaa cgacatcttc gccattctca agaacggcga gtggctggtc 60
aaactgatcc ttgccatccg cgactggatt aaggcttgga tcgcctcaga agagaagttt 120
gtcaccatga cagacttggt gcctggcatc cttgaaaagc agcgggacct gaacgacccg 180
agcaagtaca aggaagccaa ggagtggctc gacaacgcgc gccaagcgtg tttgaagagc 240
gggaacgtcc acattgccaa cctgtgcaaa gtggtcgcac cagcacccag caagtcgagg 300
cccgaacccg tggttgtttg cctccgcggc aaatctggcc agggcaagag cttccttgca 360
aacgtgcttg cacaggcaat ttccacccac ttcaccggca gaatcgactc agtgtggtac 420
tgcccacctg accctgacca cttcgacggt tacaaccagc aaaccgttgt tgtgatggat 480
gatttgggcc agaaccctga cggcaaggac ttcaaatact ttgcccaaat ggtctcgacc 540
acagggttta tcccgcccat ggcatcactc gaggacaaag gtaaaccttt caacagcaaa 600
gtcatcatcg cgaccaccaa cttgtactcg ggcttcaccc cgaggaccat ggtatgtccc 660
gacgcactga accggaggtt tcactttgac atcgatgtga gtgctaagga tgggtacaaa 720
attaacagca aattggacat tatcaaagca ctcgaagaca cccacgccaa cccagtggca 780
atgtttcaat acgactgtgc ccttctcaac ggcatggccg ttgaaatgaa gagaatgcaa 840
caagacatgt tcaagcctca accacccctc cagaatgtgt accagcttgt tcaggaggtg 900
atcgatcggg tcgagctcca cgagaaagtg tcgagtcacc cgatcttcaa gcag 954
<210> 121
<211> 954
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding EMCV protein
<400> 121
ctgaaggcca gagacatcaa cgacatcttc gccatcctga agaacggcga gtggctggtc 60
aagctgatcc tggccatcag agactggatc aaggcctgga tcgccagcga agagaagttc 120
gtgaccatga ccgatctggt gcccggcatc ctggaaaagc agagggacct gaacgacccc 180
agcaagtaca aagaggccaa agaatggctg gacaacgcca gacaggcctg cctgaagtcc 240
ggcaatgtgc atatcgccaa cctgtgcaag gtggtggccc ctgctcctag caagtctaga 300
cctgagcctg tggtcgtgtg cctgagaggc aaatctggcc agggcaagag cttcctggcc 360
aatgttctgg cccaggccat cagcacccac ttcaccggaa gaatcgacag cgtgtggtac 420
tgccctcctg atcctgacca cttcgacggc tacaaccagc agaccgtggt ggtcatggac 480
gacctgggac agaaccccga cggcaaggac ttcaagtact tcgcccagat ggtgtccacc 540
accggcttca ttcctccaat ggccagcctg gaagataagg gcaagccctt caacagcaaa 600
gtgatcattg ccaccaccaa cctgtacagc ggcttcaccc ctagaaccat ggtctgcccc 660
gacgctctga acagacggtt ccactttgac atcgacgtgt ccgccaagga tggctacaag 720
atcaactcca agctggacat catcaaggcc ctcgaggaca cccacgccaa tcctgtggcc 780
atgttccagt acgattgcgc cctgctgaat ggcatggccg tggaaatgaa gcggatgcag 840
caggacatgt tcaagcccca gcctccactg cagaacgtgt accagctcgt gcaagaagtg 900
atcgaccggg tcgagctgca cgagaaggtg tcctctcatc ccatcttcaa gcag 954
<210> 122
<211> 954
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding EMCV protein
<400> 122
cugaaggcca gagacaucaa cgacaucuuc gccauccuga agaacggcga guggcugguc 60
aagcugaucc uggccaucag agacuggauc aaggccugga ucgccagcga agagaaguuc 120
gugaccauga ccgaucuggu gcccggcauc cuggaaaagc agagggaccu gaacgacccc 180
agcaaguaca aagaggccaa agaauggcug gacaacgcca gacaggccug ccugaagucc 240
ggcaaugugc auaucgccaa ccugugcaag gugguggccc cugcuccuag caagucuaga 300
ccugagccug uggucgugug ccugagaggc aaaucuggcc agggcaagag cuuccuggcc 360
aauguucugg cccaggccau cagcacccac uucaccggaa gaaucgacag cgugugguac 420
ugcccuccug auccugacca cuucgacggc uacaaccagc agaccguggu ggucauggac 480
gaccugggac agaaccccga cggcaaggac uucaaguacu ucgcccagau gguguccacc 540
accggcuuca uuccuccaau ggccagccug gaagauaagg gcaagcccuu caacagcaaa 600
gugaucauug ccaccaccaa ccuguacagc ggcuucaccc cuagaaccau ggucugcccc 660
gacgcucuga acagacgguu ccacuuugac aucgacgugu ccgccaagga uggcuacaag 720
aucaacucca agcuggacau caucaaggcc cucgaggaca cccacgccaa uccuguggcc 780
auguuccagu acgauugcgc ccugcugaau ggcauggccg uggaaaugaa gcggaugcag 840
caggacaugu ucaagcccca gccuccacug cagaacgugu accagcucgu gcaagaagug 900
aucgaccggg ucgagcugca cgagaaggug uccucucauc ccaucuucaa gcag 954
<210> 123
<211> 257
<212> PRT
<213> Avian infectious bursal disease virus
<400> 123
Ala Ser Glu Phe Lys Glu Thr Pro Glu Leu Glu Ser Ala Val Arg Ala
1 5 10 15
Met Glu Ala Ala Ala Asn Val Asp Pro Leu Phe Gln Ser Ala Leu Ser
20 25 30
Val Phe Met Trp Leu Glu Glu Asn Gly Ile Val Thr Asp Met Ala Asn
35 40 45
Phe Ala Leu Ser Asp Pro Asn Ala His Arg Met Arg Asn Phe Leu Ala
50 55 60
Asn Ala Pro Gln Ala Gly Ser Lys Ser Gln Arg Ala Lys Tyr Gly Thr
65 70 75 80
Ala Gly Tyr Gly Val Glu Ala Arg Gly Pro Thr Pro Glu Glu Ala Gln
85 90 95
Arg Glu Lys Asp Thr Arg Ile Ser Lys Lys Met Glu Thr Met Gly Ile
100 105 110
Tyr Phe Ala Thr Pro Glu Trp Val Ala Leu Asn Gly His Arg Gly Pro
115 120 125
Ser Pro Gly Gln Leu Lys Tyr Trp Gln Asn Thr Arg Glu Ile Pro Asp
130 135 140
Pro Asn Glu Asp Tyr Leu Asp Tyr Val His Ala Glu Lys Ser Arg Leu
145 150 155 160
Ala Ser Glu Glu Gln Ile Leu Arg Ala Ala Thr Ser Ile Tyr Gly Ala
165 170 175
Pro Gly Gln Ala Glu Pro Pro Gln Ala Phe Ile Asp Glu Val Ala Lys
180 185 190
Val Tyr Glu Ile Asn His Gly Arg Gly Pro Asn Gln Glu Gln Met Lys
195 200 205
Asp Leu Leu Leu Thr Ala Met Glu Met Lys His Arg Asn Pro Arg Arg
210 215 220
Ala Leu Pro Lys Pro Lys Pro Lys Pro Asn Ala Pro Thr Gln Arg Pro
225 230 235 240
Pro Gly Arg Leu Gly Arg Trp Ile Arg Thr Val Ser Asp Glu Asp Leu
245 250 255
Glu
<210> 124
<211> 771
<212> DNA
<213> Avian infectious bursal disease virus
<400> 124
gcatcagagt tcaaagagac ccccgaactc gagagtgccg tcagagcaat ggaagcagca 60
gccaacgtgg acccactatt ccaatctgca ctcagtgtgt tcatgtggct ggaagagaat 120
gggattgtga ctgacatggc caacttcgca ctcagcgacc cgaacgccca tcggatgcga 180
aattttcttg caaacgcacc acaagcaggc agcaagtcgc aaagggccaa gtacgggaca 240
gcaggctacg gagtggaggc tcggggcccc acaccagagg aagcacagag ggaaaaagac 300
acacggatct caaagaagat ggagaccatg ggcatctact ttgcaacacc agaatgggta 360
gcactcaatg ggcaccgagg gccaagcccc ggccagctaa agtactggca gaacacacga 420
gaaataccgg acccaaacga ggactatcta gactacgtgc atgcagagaa gagccggttg 480
gcatcagaag aacaaatcct aagggcagct acgtcgatct acggggctcc aggacaggca 540
gagccacccc aagctttcat agacgaagtt gccaaagtct atgaaatcaa ccatggacgt 600
ggcccaaacc aagaacagat gaaagatctg ctcttgactg cgatggagat gaagcatcgc 660
aatcccaggc gggctctacc aaagcccaag ccaaaaccca atgctccaac acagagaccc 720
cctggtcggc tgggccgctg gatcaggacc gtctctgatg aggaccttga g 771
<210> 125
<211> 771
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding Birnavirus VP3 protein
<400> 125
gccagcgagt tcaaagagac acccgagctg gaaagcgccg tcagagctat ggaagccgcc 60
gctaatgtgg accctctgtt tcagtctgcc ctgagcgtgt tcatgtggct ggaagagaac 120
ggcatcgtga ccgacatggc caacttcgcc ctgtctgacc ccaacgctca ccggatgaga 180
aactttctgg ccaacgctcc tcaggccggc agcaagtctc agagagccaa atacggcaca 240
gccggctacg gcgtggaagc cagaggacct acacctgagg aagcccagag agagaaggac 300
acccggatca gcaagaaaat ggaaaccatg ggcatctact tcgccacacc tgagtgggtc 360
gccctgaatg gacacagagg accatctcca ggccagctga agtactggca gaacaccaga 420
gagatccccg atcctaacga ggactacctg gactacgtgc acgccgagaa aagcagactg 480
gccagcgagg aacagatcct gagagccgcc acatccatct atggcgctcc aggacaagcc 540
gaacctccac aggcctttat cgacgaggtg gccaaggtgt acgagatcaa ccacggcaga 600
ggccccaatc aagagcagat gaaggacctg ctgctgaccg ccatggaaat gaagcacaga 660
aaccccagac gggccctgcc taagccaaag cctaaaccta acgctcccac acagcggcct 720
ccaggcagac tcggaagatg gatcagaacc gtgtccgacg aggacctgga a 771
<210> 126
<211> 771
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding Birnavirus VP3 protein
<400> 126
gccagcgagu ucaaagagac acccgagcug gaaagcgccg ucagagcuau ggaagccgcc 60
gcuaaugugg acccucuguu ucagucugcc cugagcgugu ucauguggcu ggaagagaac 120
ggcaucguga ccgacauggc caacuucgcc cugucugacc ccaacgcuca ccggaugaga 180
aacuuucugg ccaacgcucc ucaggccggc agcaagucuc agagagccaa auacggcaca 240
gccggcuacg gcguggaagc cagaggaccu acaccugagg aagcccagag agagaaggac 300
acccggauca gcaagaaaau ggaaaccaug ggcaucuacu ucgccacacc ugaguggguc 360
gcccugaaug gacacagagg accaucucca ggccagcuga aguacuggca gaacaccaga 420
gagauccccg auccuaacga ggacuaccug gacuacgugc acgccgagaa aagcagacug 480
gccagcgagg aacagauccu gagagccgcc acauccaucu auggcgcucc aggacaagcc 540
gaaccuccac aggccuuuau cgacgaggug gccaaggugu acgagaucaa ccacggcaga 600
ggccccaauc aagagcagau gaaggaccug cugcugaccg ccauggaaau gaagcacaga 660
aaccccagac gggcccugcc uaagccaaag ccuaaaccua acgcucccac acagcggccu 720
ccaggcagac ucggaagaug gaucagaacc guguccgacg aggaccugga a 771
<210> 127
<211> 94
<212> PRT
<213> Porcine delta coronavirus
<400> 127
Met Cys Asn Cys His Leu Gln Leu Arg Asp Leu Tyr Arg Leu Cys Asn
1 5 10 15
Lys Leu His Ile Arg Arg Asp Asp Val Pro Glu Leu Ile Asp Pro Leu
20 25 30
Val Lys Thr Arg Cys Phe Ala Tyr Ser Leu Val Val Leu Ala Asn Ala
35 40 45
Asn Pro Ile Ala Phe Ser Ile Leu Pro Arg Lys Ile Leu Ile Asn Gly
50 55 60
Glu Pro Leu Leu Leu Glu Tyr Gly Ser Ile Tyr Gly Lys Asp Phe Ile
65 70 75 80
Ile Arg Pro Ser Leu Gln Val Ile Leu Glu Asp Glu Leu Asn
85 90
<210> 128
<211> 282
<212> DNA
<213> Porcine delta coronavirus
<400> 128
atgtgcaact gccatctgca gctgcgagat ttatatagat tgtgcaataa gctgcacatc 60
agaagagacg atgttcctga gcttattgac cctctcgtta aaactcgctg ttttgcttac 120
agtctcgtgg ttcttgctaa tgctaatcca attgcattta gcatactacc tcggaaaatt 180
cttatcaatg gtgagccttt actgcttgaa tatggtagca tatatggtaa agactttatc 240
attagaccat cgctccaagt cattcttgaa gatgaattaa at 282
<210> 129
<211> 285
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding Porcine delta coronavirus NS6
protein
<400> 129
atgtgcaact gccatctgca gctgcgggac ctgtaccggc tgtgtaacaa gctgcacatc 60
agacgggacg acgtgcccga gctgatcgat cctctggtca agaccagatg cttcgcctac 120
agcctggtgg tgctggccaa cgccaatcct atcgccttca gcatcctgcc tcggaagatc 180
ctgatcaacg gcgagcctct gctgctggaa tacggcagca tctacggcaa ggacttcatc 240
atcagaccca gcctgcaagt gatcctggaa gatgagctga actga 285
<210> 130
<211> 285
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA sequence encoding Porcine delta coronavirus
NS6 protein
<400> 130
augugcaacu gccaucugca gcugcgggac cuguaccggc uguguaacaa gcugcacauc 60
agacgggacg acgugcccga gcugaucgau ccucugguca agaccagaug cuucgccuac 120
agccuggugg ugcuggccaa cgccaauccu aucgccuuca gcauccugcc ucggaagauc 180
cugaucaacg gcgagccucu gcugcuggaa uacggcagca ucuacggcaa ggacuucauc 240
aucagaccca gccugcaagu gauccuggaa gaugagcuga acuga 285
<210> 131
<211> 99
<212> PRT
<213> Lassa virus
<400> 131
Met Gly Asn Lys Gln Ala Lys Ala Pro Glu Ser Lys Asp Ser Pro Arg
1 5 10 15
Ala Ser Leu Ile Pro Asp Ala Thr His Leu Gly Pro Gln Phe Cys Lys
20 25 30
Ser Cys Trp Phe Glu Asn Lys Gly Leu Val Glu Cys Asn Asn His Tyr
35 40 45
Leu Cys Leu Asn Cys Leu Thr Leu Leu Leu Ser Val Ser Asn Arg Cys
50 55 60
Pro Ile Cys Lys Met Pro Leu Pro Thr Lys Leu Arg Pro Ser Ala Ala
65 70 75 80
Pro Thr Ala Pro Pro Thr Gly Ala Ala Asp Ser Ile Arg Pro Pro Pro
85 90 95
Tyr Ser Pro
<210> 132
<211> 297
<212> DNA
<213> Lassa virus
<400> 132
atgggaaaca agcaagccaa agccccagaa tcaaaagaca gtccgagagc cagcctgatc 60
ccagatgcca cacatctagg gccacagttc tgtaagagct gctggttcga aaacaagggc 120
ctggttgagt gcaacaacca ctatctgtgt ctcaactgcc tcaccttact tctaagtgtc 180
agcaacaggt gtcccatttg caagatgcct ctccccacaa aactgagacc atcagccgct 240
ccaacagcac ctccaaccgg agcagcggac agcatcagac ccccacccta cagtccc 297
<210> 133
<211> 297
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding LASV Z protein
<400> 133
atgggcaaca agcaggccaa ggctcccgag agcaaggata gccctagagc ctctctgatc 60
cccgacgcca cacatctggg accccagttc tgcaagagct gttggttcga gaacaaaggc 120
ctggtggaat gcaacaacca ctacctgtgc ctgaactgtc tgaccctgct gctgagcgtg 180
tccaacagat gccccatctg caagatgccc ctgcctacca agctgaggcc ttctgctgct 240
cctacagctc ctccaacagg cgccgctgat agcatcagac ctccacctta tagcccc 297
<210> 134
<211> 297
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding LASV Z protein
<400> 134
augggcaaca agcaggccaa ggcucccgag agcaaggaua gcccuagagc cucucugauc 60
cccgacgcca cacaucuggg accccaguuc ugcaagagcu guugguucga gaacaaaggc 120
cugguggaau gcaacaacca cuaccugugc cugaacuguc ugacccugcu gcugagcgug 180
uccaacagau gccccaucug caagaugccc cugccuacca agcugaggcc uucugcugcu 240
ccuacagcuc cuccaacagg cgccgcugau agcaucagac cuccaccuua uagcccc 297
<210> 135
<211> 90
<212> PRT
<213> Dandenong virus
<400> 135
Met Gly Gln Ala Lys Ser Lys Glu Thr Lys Leu Ser Lys Lys Glu Asp
1 5 10 15
Arg Ala Glu Val Leu Pro Asp Ala Thr Tyr Leu Gly Pro Leu Asn Cys
20 25 30
Lys Ser Cys Trp Gln Arg Phe Asp Ser Leu Val Arg Cys His Asp His
35 40 45
Tyr Leu Cys Arg Gln Cys Leu Asn Leu Leu Leu Thr Val Ser Asp Arg
50 55 60
Cys Pro Leu Cys Lys His Pro Leu Pro Thr Lys Leu Arg Val Ser Thr
65 70 75 80
Ala Pro Ser Ser Pro Pro Pro Tyr Glu Glu
85 90
<210> 136
<211> 270
<212> DNA
<213> Dandenong virus
<400> 136
atgggtcaag caaaatccaa agaaacaaag ctctccaaga aagaggacag agcagaggtt 60
ctacctgacg caacctatct tggtcctctg aactgcaaat catgctggca aaggttcgac 120
agtttggtta ggtgccatga ccactaccta tgcaggcaat gtctgaacct tttgttgaca 180
gtctcagaca gatgccctct ctgcaaacac cctctaccga ccaagctgag ggtgtcgaca 240
gcccccagct cacctccccc ctacgaggag 270
<210> 137
<211> 270
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding DANV Z protein
<400> 137
atgggccaag ccaagagcaa agagacaaag ctgagcaaga aagaggaccg cgccgaggtt 60
ctgcccgatg ccacatatct gggccctctg aactgcaaga gctgctggca gagattcgac 120
agcctcgtgc ggtgccacga tcactacctg tgcagacagt gcctgaacct gctgctgacc 180
gtgtccgata gatgccctct gtgcaagcac cctctgccta ccaagctgag agtgtccacc 240
gctcctagca gccctccacc ttatgaggaa 270
<210> 138
<211> 270
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding DANV Z protein
<400> 138
augggccaag ccaagagcaa agagacaaag cugagcaaga aagaggaccg cgccgagguu 60
cugcccgaug ccacauaucu gggcccucug aacugcaaga gcugcuggca gagauucgac 120
agccucgugc ggugccacga ucacuaccug ugcagacagu gccugaaccu gcugcugacc 180
guguccgaua gaugcccucu gugcaagcac ccucugccua ccaagcugag aguguccacc 240
gcuccuagca gcccuccacc uuaugaggaa 270
<210> 139
<211> 90
<212> PRT
<213> Lymphocytic choriomeningitis virus
<400> 139
Met Gly Gln Gly Lys Ser Arg Glu Glu Lys Gly Thr Asn Ser Thr Asn
1 5 10 15
Arg Ala Glu Ile Leu Pro Asp Thr Thr Tyr Leu Gly Pro Leu Ser Cys
20 25 30
Lys Ser Cys Trp Gln Lys Phe Asp Ser Leu Val Arg Cys His Asp His
35 40 45
Tyr Leu Cys Arg His Cys Leu Asn Leu Leu Leu Ser Val Ser Asp Arg
50 55 60
Cys Pro Leu Cys Lys Tyr Pro Leu Pro Thr Arg Leu Lys Ile Ser Thr
65 70 75 80
Ala Pro Ser Ser Pro Pro Pro Tyr Glu Glu
85 90
<210> 140
<211> 270
<212> DNA
<213> Lymphocytic choriomeningitis virus
<400> 140
atgggtcaag gcaagtccag agaggagaaa ggcaccaata gtacaaacag ggccgaaatc 60
ctaccagata ccacctatct tggcccttta agctgcaaat cttgctggca gaaatttgac 120
agcttggtaa gatgccatga ccactacctt tgcaggcact gtttaaacct tctgctgtca 180
gtatccgaca ggtgtcctct ttgtaaatat ccattaccaa ccagattgaa gatatcaaca 240
gccccaagct ctccacctcc ctacgaagag 270
<210> 141
<211> 270
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding LCMV Z protein
<400> 141
atgggccagg gcaagtccag agaggaaaag ggcaccaact ccaccaaccg ggccgagatc 60
ctgcctgaca ccacatatct gggccctctg agctgcaaga gctgctggca gaaattcgac 120
agcctcgtgc ggtgccacga ccactacctg tgtagacact gcctgaacct gctgctgagc 180
gtgtccgata gatgccctct gtgcaagtac cctctgccta ccagactgaa gatcagcaca 240
gcccctagca gccctccacc ttacgaagaa 270
<210> 142
<211> 270
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding LCMV Z protein
<400> 142
augggccagg gcaaguccag agaggaaaag ggcaccaacu ccaccaaccg ggccgagauc 60
cugccugaca ccacauaucu gggcccucug agcugcaaga gcugcuggca gaaauucgac 120
agccucgugc ggugccacga ccacuaccug uguagacacu gccugaaccu gcugcugagc 180
guguccgaua gaugcccucu gugcaaguac ccucugccua ccagacugaa gaucagcaca 240
gccccuagca gcccuccacc uuacgaagaa 270
<210> 143
<211> 95
<212> PRT
<213> Lujo mammarenavirus
<400> 143
Met Gly Gln Arg His Ser Ser Gly Ser Gly Gln Pro Asn Pro Lys Pro
1 5 10 15
Ser Asp Ser Asp His Glu Ala Arg Arg Ser Glu Leu His Ser Asp Ala
20 25 30
Ser His Leu Gly Pro Leu Asn Cys Lys Ser Cys Trp Lys Ser Lys Lys
35 40 45
Ala Leu Val Lys Cys Tyr Asp His Tyr Leu Cys Leu Asn Cys Leu Ser
50 55 60
Leu Leu Met Gly Ile Thr Pro Arg Cys Pro Phe Cys Tyr Arg Glu Leu
65 70 75 80
Pro Lys Asn Leu Asp Leu Ala Glu Ala Pro Ser Ala Pro Pro Leu
85 90 95
<210> 144
<211> 285
<212> DNA
<213> Lujo mammarenavirus
<400> 144
atgggtcaga gacattcctc tggctccggc caacccaacc ccaagccgag tgacagcgat 60
catgaagcga gaaggtcaga gcttcactcg gacgcctccc atctcggacc tctgaactgc 120
aaatcttgct ggaagtcaaa gaaggcactg gtgaagtgct atgatcacta cctctgtcta 180
aactgcttaa gccttctaat gggcatcacc ccaagatgtc ccttctgtta cagagagcta 240
cccaaaaatc tggaccttgc agaggcacca agcgcaccac ccctc 285
<210> 145
<211> 285
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding LUJV Z protein
<400> 145
atgggccaga gacacagctc tggaagcggc cagcctaatc ctaagcctag cgacagcgat 60
cacgaggcca gaagaagcga gctgcactcc gatgcctctc acctgggacc tctgaactgc 120
aagagctgct ggaagtccaa gaaagccctg gtcaagtgct acgaccacta cctgtgcctg 180
aactgcctga gcctgctgat gggcattacc cctagatgcc ccttctgcta cagagagctg 240
cccaagaacc tggacctggc cgaagctcct tctgctcctc ctctg 285
<210> 146
<211> 285
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding LUJV Z protein
<400> 146
augggccaga gacacagcuc uggaagcggc cagccuaauc cuaagccuag cgacagcgau 60
cacgaggcca gaagaagcga gcugcacucc gaugccucuc accugggacc ucugaacugc 120
aagagcugcu ggaaguccaa gaaagcccug gucaagugcu acgaccacua ccugugccug 180
aacugccuga gccugcugau gggcauuacc ccuagaugcc ccuucugcua cagagagcug 240
cccaagaacc uggaccuggc cgaagcuccu ucugcuccuc cucug 285
<210> 147
<211> 98
<212> PRT
<213> Chapare mammarenavirus
<400> 147
Met Gly Asn Thr Lys Thr Lys Asp Arg Gln Tyr Gln Ser Asn Ser Ser
1 5 10 15
Gln Pro Thr Asn Thr Ser Ala Pro Val Leu Leu Arg Arg Gln Ala Glu
20 25 30
Pro Ser Leu Tyr Gly Arg His Asn Cys Arg Cys Cys Trp Phe Ala Asp
35 40 45
Thr Asn Leu Val Asn Cys Ser Asn His Tyr Leu Cys Leu Lys Cys Leu
50 55 60
Asn Thr Met Leu Arg Arg Ser Asn Leu Cys Asp Ile Cys Gly Glu Glu
65 70 75 80
Leu Pro Thr Thr Ile Ile Val Pro Val Glu Pro Ser Ala Pro Leu Pro
85 90 95
Gly Gln
<210> 148
<211> 294
<212> DNA
<213> Chapare mammarenavirus
<400> 148
atgggtaaca ccaaaacaaa ggacagacag tatcaatcga actcaagcca acccacaaac 60
acatctgcac cagttctgct gagaaggcag gcagaaccaa gtctgtatgg gagacacaac 120
tgcagatgct gttggtttgc agacacaaac ctagtcaatt gttccaacca ctacctttgc 180
cttaaatgtc tgaacacaat gttaagaaga tccaatctct gtgacatatg cggtgaagaa 240
cttcccacaa caatcattgt tccagtggaa ccatcagcac cactgcccgg acaa 294
<210> 149
<211> 294
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding CHPV Z protein
<400> 149
atgggcaaca ccaagaccaa ggaccggcag taccagagca acagcagcca gcctaccaac 60
acatctgccc ctgtgctgct gagaaggcag gccgagcctt ctctgtacgg cagacacaac 120
tgccggtgct gttggttcgc cgacaccaac ctggtcaact gcagcaacca ctacctgtgc 180
ctgaagtgtc tgaacaccat gctgcggcgg agcaacctgt gcgatatctg tggcgaggaa 240
ctgcccacca ccatcatcgt gcctgtggaa ccttctgctc ctctgcctgg acag 294
<210> 150
<211> 294
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding CHPV Z protein
<400> 150
augggcaaca ccaagaccaa ggaccggcag uaccagagca acagcagcca gccuaccaac 60
acaucugccc cugugcugcu gagaaggcag gccgagccuu cucuguacgg cagacacaac 120
ugccggugcu guugguucgc cgacaccaac cuggucaacu gcagcaacca cuaccugugc 180
cugaaguguc ugaacaccau gcugcggcgg agcaaccugu gcgauaucug uggcgaggaa 240
cugcccacca ccaucaucgu gccuguggaa ccuucugcuc cucugccugg acag 294
<210> 151
<211> 94
<212> PRT
<213> Machupo virus
<400> 151
Met Gly Asn Cys Asn Lys Pro Pro Lys Arg Pro Pro Asn Thr Gln Thr
1 5 10 15
Ser Ala Ala Gln Pro Ser Ala Glu Phe Arg Arg Thr Ala Leu Pro Ser
20 25 30
Leu Tyr Gly Arg Tyr Asn Cys Lys Cys Cys Trp Phe Ala Asp Thr Asn
35 40 45
Leu Ile Thr Cys Asn Asp His Tyr Leu Cys Leu Arg Cys His Gln Thr
50 55 60
Met Leu Arg Asn Ser Glu Leu Cys His Ile Cys Trp Lys Pro Leu Pro
65 70 75 80
Thr Ser Ile Thr Val Pro Val Glu Pro Ser Ala Pro Pro Pro
85 90
<210> 152
<211> 282
<212> DNA
<213> Machupo virus
<400> 152
atgggcaact gtaacaagcc tcccaagagg cctcccaaca cacaaacatc agccgcccag 60
ccctcagcag agttcaggag aacagcccta cccagtctct atggtcgcta caactgcaaa 120
tgttgttggt ttgccgacac aaacttgatt acatgtaacg accactactt gtgtctgaga 180
tgtcatcaaa caatgctcag gaattctgaa ctctgtcaca tatgctggaa accactaccg 240
acatccatca cagtccccgt ggagccaagc gcccccccac ca 282
<210> 153
<211> 282
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding MACV Z protein
<400> 153
atgggcaact gcaacaagcc tcctaagcgg cctcctaaca cacagacatc tgccgctcag 60
cctagcgccg agttcagaag aacagccctg cctagcctgt acggccggta caactgcaag 120
tgctgttggt tcgccgacac caacctgatc acctgtaacg accactacct gtgcctgcgg 180
tgccaccaga ccatgctgag aaatagcgag ctgtgccaca tctgctggaa gcccctgcct 240
accagcatca ccgtgcctgt ggaaccttct gctcctcctc ct 282
<210> 154
<211> 282
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding MACV Z protein
<400> 154
augggcaacu gcaacaagcc uccuaagcgg ccuccuaaca cacagacauc ugccgcucag 60
ccuagcgccg aguucagaag aacagcccug ccuagccugu acggccggua caacugcaag 120
ugcuguuggu ucgccgacac caaccugauc accuguaacg accacuaccu gugccugcgg 180
ugccaccaga ccaugcugag aaauagcgag cugugccaca ucugcuggaa gccccugccu 240
accagcauca ccgugccugu ggaaccuucu gcuccuccuc cu 282
<210> 155
<211> 95
<212> PRT
<213> Guanarito virus
<400> 155
Met Gly Asn Ser Lys Ser Lys Ser Asn Pro Ser Ser Ser Ser Glu Ser
1 5 10 15
Gln Lys Gly Ala Pro Thr Val Thr Glu Phe Arg Arg Thr Ala Ile His
20 25 30
Ser Leu Tyr Gly Arg Tyr Asn Cys Lys Cys Cys Trp Phe Ala Asp Lys
35 40 45
Asn Leu Ile Lys Cys Ser Asp His Tyr Leu Cys Leu Arg Cys Leu Asn
50 55 60
Val Met Leu Lys Asn Ser Asp Leu Cys Asn Ile Cys Trp Glu Gln Leu
65 70 75 80
Pro Thr Cys Ile Thr Val Pro Glu Glu Pro Ser Ala Pro Pro Glu
85 90 95
<210> 156
<211> 285
<212> DNA
<213> Guanarito virus
<400> 156
atgggcaatt caaaatctaa atccaaccca tccagttcct cagagtctca aaaaggggca 60
ccaacagtca cagaatttag gaggactgcc attcacagtc tctatgggag gtacaactgc 120
aagtgttgct ggtttgctga caagaatctg attaaatgct ctgatcatta cctctgcttg 180
aggtgtttaa atgtcatgct gaaaaactct gatctttgca acatttgttg ggagcagctg 240
cccacatgca tcacagttcc ggaggagcca agcgctccac cggaa 285
<210> 157
<211> 285
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding GTOV Z protein
<400> 157
atgggcaaca gcaagtccaa gagcaacccc agcagcagct ccgagtctca gaaaggcgct 60
cctaccgtga ccgagttcag aagaacagcc atccacagcc tgtacggccg gtacaactgc 120
aagtgctgtt ggttcgccga caagaacctg atcaagtgca gcgaccacta cctgtgcctg 180
cggtgcctga acgtgatgct gaagaactcc gacctgtgca acatctgctg ggagcagctg 240
cctacctgca tcaccgtgcc tgaggaacct tctgctcctc ctgaa 285
<210> 158
<211> 285
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding GTOV Z protein
<400> 158
augggcaaca gcaaguccaa gagcaacccc agcagcagcu ccgagucuca gaaaggcgcu 60
ccuaccguga ccgaguucag aagaacagcc auccacagcc uguacggccg guacaacugc 120
aagugcuguu gguucgccga caagaaccug aucaagugca gcgaccacua ccugugccug 180
cggugccuga acgugaugcu gaagaacucc gaccugugca acaucugcug ggagcagcug 240
ccuaccugca ucaccgugcc ugaggaaccu ucugcuccuc cugaa 285
<210> 159
<211> 94
<212> PRT
<213> Junin virus
<400> 159
Met Gly Asn Cys Asn Gly Ala Ser Lys Ser Asn Gln Pro Asp Ser Ser
1 5 10 15
Arg Val Thr Gln Pro Ala Ala Glu Phe Arg Arg Val Ala His Ser Ser
20 25 30
Leu Tyr Gly Arg Tyr Asn Cys Lys Cys Cys Trp Phe Ala Asp Thr Asn
35 40 45
Leu Ile Thr Cys Asn Asp His Tyr Leu Cys Leu Arg Cys His Gln Val
50 55 60
Met Leu Arg Asn Ser Asp Leu Cys Asn Ile Cys Trp Lys Pro Leu Pro
65 70 75 80
Thr Thr Ile Thr Val Pro Val Glu Pro Thr Ala Pro Pro Pro
85 90
<210> 160
<211> 282
<212> DNA
<213> Junin virus
<400> 160
atgggcaact gcaacggggc atccaagtca aaccagccag actcttcaag ggtcacacag 60
ccagccgcag aattcaggag ggtggctcac agcagtctat atggtagata caactgcaag 120
tgctgctggt ttgctgacac caatctgata acctgcaatg atcactacct ttgtttaagg 180
tgccatcagg ttatgttaag gaattcggac ctctgcaata tctgttggaa gcccctacct 240
accacaatca cagtgccggt ggagccaaca gcaccaccac ca 282
<210> 161
<211> 282
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon otpimised DNA encoding JUNV Z protein
<400> 161
atgggcaatt gcaacggcgc cagcaagagc aaccagcctg atagcagcag agtgacacag 60
cctgccgccg agtttagaag agtggcccac agcagcctgt acggccggta caattgcaag 120
tgctgttggt tcgccgacac caacctgatc acctgtaacg accactacct gtgcctgcgg 180
tgccaccaag tgatgctgag aaacagcgac ctgtgcaaca tctgctggaa gcccctgcct 240
accaccatca ccgtgcctgt ggaacctaca gctcctcctc ct 282
<210> 162
<211> 282
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding JUNV Z protein
<400> 162
augggcaauu gcaacggcgc cagcaagagc aaccagccug auagcagcag agugacacag 60
ccugccgccg aguuuagaag aguggcccac agcagccugu acggccggua caauugcaag 120
ugcuguuggu ucgccgacac caaccugauc accuguaacg accacuaccu gugccugcgg 180
ugccaccaag ugaugcugag aaacagcgac cugugcaaca ucugcuggaa gccccugccu 240
accaccauca ccgugccugu ggaaccuaca gcuccuccuc cu 282
<210> 163
<211> 100
<212> PRT
<213> Sabia virus
<400> 163
Met Gly Asn Ser Lys Ser Lys Ser Lys Leu Ser Ala Asn Gln Tyr Glu
1 5 10 15
Gln Gln Thr Val Asn Ser Thr Lys Gln Val Ala Ile Leu Lys Arg Gln
20 25 30
Ala Glu Pro Ser Leu Tyr Gly Arg His Asn Cys Arg Cys Cys Trp Phe
35 40 45
Ala Asn Thr Asn Leu Ile Lys Cys Ser Asp His Tyr Ile Cys Leu Lys
50 55 60
Cys Leu Asn Ile Met Leu Gly Lys Ser Ser Phe Cys Asp Ile Cys Gly
65 70 75 80
Glu Glu Leu Pro Thr Ser Ile Val Val Pro Ile Glu Pro Ser Ala Pro
85 90 95
Pro Pro Glu Asp
100
<210> 164
<211> 300
<212> DNA
<213> Sabia virus
<400> 164
atgggtaact ccaagtcaaa atcaaagctg tctgctaacc agtatgaaca gcaaacagtc 60
aatagcacca aacaggtagc cattttaaag agacaggctg aacctagtct gtatggaaga 120
cacaactgca ggtgctgctg gttcgccaat acaaatctaa taaaatgttc cgaccattat 180
atttgtctaa aatgtttgaa cataatgttg gggaagtctt ctttttgtga catttgtggt 240
gaagagctcc ccacatccat tgtggtgccc atcgaaccaa gtgctccacc tccagaagac 300
300
<210> 165
<211> 300
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding SABV Z protein
<400> 165
atgggcaaca gcaagagcaa gtccaagctg agcgccaacc agtacgagca gcagaccgtg 60
aacagcacca aacaggtggc catcctgaag agacaggccg agcctagcct gtacggcaga 120
cacaactgcc ggtgttgttg gttcgccaac accaacctga tcaagtgcag cgaccactac 180
atctgcctga agtgcctgaa catcatgctg ggcaagagca gcttctgcga catctgcgga 240
gaggaactgc ccacctctat cgtggtgcct atcgagcctt ctgctcctcc acctgaggat 300
300
<210> 166
<211> 300
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding SABV Z protein
<400> 166
augggcaaca gcaagagcaa guccaagcug agcgccaacc aguacgagca gcagaccgug 60
aacagcacca aacagguggc cauccugaag agacaggccg agccuagccu guacggcaga 120
cacaacugcc gguguuguug guucgccaac accaaccuga ucaagugcag cgaccacuac 180
aucugccuga agugccugaa caucaugcug ggcaagagca gcuucugcga caucugcgga 240
gaggaacugc ccaccucuau cguggugccu aucgagccuu cugcuccucc accugaggau 300
300
<210> 167
<211> 183
<212> PRT
<213> Coxsackievirus
<400> 167
Gly Pro Ser Leu Asp Phe Ala Leu Ser Leu Leu Arg Arg Asn Ile Arg
1 5 10 15
Gln Val Gln Thr Asp Gln Gly His Phe Thr Met Leu Gly Val Arg Asp
20 25 30
Arg Leu Ala Ile Leu Pro Arg His Ser Gln Pro Gly Lys Thr Ile Trp
35 40 45
Val Glu His Lys Leu Ile Asn Val Leu Asp Ala Val Glu Leu Val Asp
50 55 60
Glu Gln Gly Val Asn Leu Glu Leu Thr Leu Val Thr Leu Asp Thr Asn
65 70 75 80
Glu Lys Phe Arg Asp Val Thr Lys Phe Ile Pro Glu Thr Ile Thr Gly
85 90 95
Ala Ser Asp Ala Thr Leu Val Ile Asn Thr Glu His Met Pro Ser Met
100 105 110
Phe Val Pro Val Gly Asp Val Val Gln Tyr Gly Phe Leu Asn Leu Ser
115 120 125
Gly Lys Pro Thr His Arg Thr Met Met Tyr Asn Phe Pro Thr Lys Ala
130 135 140
Gly Gln Cys Gly Gly Val Val Thr Ser Val Gly Lys Ile Ile Gly Ile
145 150 155 160
His Ile Gly Gly Asn Gly Arg Gln Gly Phe Cys Ala Gly Leu Lys Arg
165 170 175
Gly Tyr Phe Ala Ser Glu Gln
180
<210> 168
<211> 549
<212> DNA
<213> Coxsackievirus
<400> 168
ggaccgagct tagactttgc cttatccctc ctaaggcgca acattagaca ggtgcaaacc 60
gaccaaggac acttcactat gttaggggtg cgagatcgcc tagccatttt gccacgccac 120
tcgcaaccag gaaaaactat ctgggtggag cacaagttaa ttaatgtgct ggatgctgtc 180
gaattagtgg atgagcaagg tgtaaacttg gaactcacac tagtaacctt agacaccaac 240
gaaaagttta gggatgttac caagtttatt ccagagacga tcaccggggc aagcgacgca 300
accttggtca tcaacactga gcacatgccc tcaatgttcg ttccagtggg tgatgttgta 360
caatatggat ttctgaatct cagcggtaag cccacacacc gaaccatgat gtacaatttc 420
cccacaaagg caggacagtg tggaggggtg gtcacctcag tcggtaagat cataggaatt 480
cacattggtg ggaatggacg ccagggtttc tgcgctggac tgaagagagg ctattttgcc 540
agtgaacag 549
<210> 169
<211> 549
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding CV-A16 3C protease
<400> 169
ggcccttctc tggattttgc cctgagcctg ctgcggcgga acatcagaca ggtgcagaca 60
gatcagggcc acttcaccat gctgggcgtc agagacagac tggccatcct gcctagacac 120
agccagcctg gcaagaccat ctgggtcgag cacaagctga tcaacgtgct ggacgccgtg 180
gaactggtgg atgaacaggg cgtgaacctg gaactgaccc tggtcaccct ggacaccaac 240
gagaagttcc gggacgtgac caagttcatc cccgagacaa tcaccggcgc ctccgatgcc 300
acactggtca tcaataccga gcacatgccc tccatgttcg tgcctgtggg agatgtggtg 360
cagtacggct tcctgaacct gagcggcaag cccacacacc ggaccatgat gtacaacttc 420
cctaccaagg ccggccagtg cggcggagtg gttacatctg tgggcaagat catcggcatc 480
cacatcggcg gcaatggcag acagggattt tgtgccggcc tgaagagagg ctacttcgcc 540
tctgaacag 549
<210> 170
<211> 549
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding CV-A16 3C protease
<400> 170
ggcccuucuc uggauuuugc ccugagccug cugcggcgga acaucagaca ggugcagaca 60
gaucagggcc acuucaccau gcugggcguc agagacagac uggccauccu gccuagacac 120
agccagccug gcaagaccau cugggucgag cacaagcuga ucaacgugcu ggacgccgug 180
gaacuggugg augaacaggg cgugaaccug gaacugaccc uggucacccu ggacaccaac 240
gagaaguucc gggacgugac caaguucauc cccgagacaa ucaccggcgc cuccgaugcc 300
acacugguca ucaauaccga gcacaugccc uccauguucg ugccuguggg agauguggug 360
caguacggcu uccugaaccu gagcggcaag cccacacacc ggaccaugau guacaacuuc 420
ccuaccaagg ccggccagug cggcggagug guuacaucug ugggcaagau caucggcauc 480
cacaucggcg gcaauggcag acagggauuu ugugccggcc ugaagagagg cuacuucgcc 540
ucugaacag 549
<210> 171
<211> 179
<212> PRT
<213> Coxsackievirus
<400> 171
Gly Pro Ser Leu Asp Phe Ala Leu Ser Leu Leu Arg Arg Asn Ile Arg
1 5 10 15
Gln Val Gln Thr Asp Gln Gly His Phe Thr Met Leu Gly Val Arg Asp
20 25 30
Arg Leu Ala Val Leu Pro Arg His Ser Gln Pro Gly Lys Thr Ile Trp
35 40 45
Val Glu His Lys Leu Val Asn Val Val Asp Ala Val Glu Leu Val Asp
50 55 60
Glu Gln Gly Val Asn Leu Glu Leu Thr Leu Ile Thr Leu Asp Thr Asn
65 70 75 80
Glu Lys Phe Arg Asp Ile Thr Lys Phe Ile Pro Glu Asn Ile Ser Ala
85 90 95
Ala Ser Asp Ala Thr Leu Val Ile Asn Thr Glu His Met Pro Ser Met
100 105 110
Phe Val Pro Val Gly Asp Val Val Gln Tyr Gly Phe Leu Asn Leu Ser
115 120 125
Gly Lys Pro Thr His Arg Thr Met Met Tyr Asn Phe Pro Thr Lys Ala
130 135 140
Gly Gln Cys Gly Gly Val Val Thr Ser Val Gly Lys Val Ile Gly Ile
145 150 155 160
His Ile Gly Gly Asn Gly Arg Gln Gly Phe Cys Ala Gly Leu Lys Arg
165 170 175
Ser Tyr Phe
<210> 172
<211> 537
<212> DNA
<213> Coxsackievirus
<400> 172
ggacctagcc ttgattttgc cctatcccta ctgagaagga acatcagaca agttcaaacg 60
gaccaagggc acttcaccat gctaggagtc agagatcgct tggccgtcct cccacgacac 120
tcacaacccg gaaaaactat ctgggtagag cacaagctag tgaatgttgt ggatgctgtc 180
gaactagtgg atgagcaggg ggtcaactta gagctgactt taatcaccct cgacactaat 240
gagaagttta gagacatcac caaatttatt ccagagaata tcagcgctgc cagcgatgcc 300
actctagtga ttaatacaga gcacatgcct tctatgtttg tgccagtagg tgatgttgtt 360
cagtatggtt tcctgaatct tagtgggaaa ccaacccacc gcactatgat gtataacttc 420
cctaccaagg caggacagtg tggaggggta gtcacatcag ttggaaaggt cattggtatc 480
cacataggag gcaatggcag gcaaggtttc tgtgcagggc tcaagagaag ctacttt 537
<210> 173
<211> 537
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding CV-A6 3C protease
<400> 173
ggcccttctc tggattttgc cctgagcctg ctgcggcgga acatcagaca ggtgcagaca 60
gatcagggcc acttcaccat gctgggcgtc agagatagac tggccgtgct gcctagacac 120
agccagcctg gaaagaccat ctgggtcgag cacaagctgg tcaacgtggt ggatgccgtg 180
gaactggtgg atgagcaggg cgtgaacctg gaactgaccc tgatcaccct ggacaccaac 240
gagaagttcc gggacatcac caagttcatc cccgagaaca tcagcgccgc ctccgatgcc 300
acactggtca tcaataccga gcacatgccc tccatgttcg tgcctgtggg agatgtggtg 360
cagtacggct tcctgaacct gagcggcaag cccacacacc ggaccatgat gtacaacttc 420
cctaccaagg ccggccagtg cggcggagtg gttacatctg tgggcaaagt gatcggaatc 480
cacatcggcg gcaatggcag acagggcttt tgtgccggcc tgaagagaag ctacttc 537
<210> 174
<211> 537
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding CV-A6 3C protease
<400> 174
ggcccuucuc uggauuuugc ccugagccug cugcggcgga acaucagaca ggugcagaca 60
gaucagggcc acuucaccau gcugggcguc agagauagac uggccgugcu gccuagacac 120
agccagccug gaaagaccau cugggucgag cacaagcugg ucaacguggu ggaugccgug 180
gaacuggugg augagcaggg cgugaaccug gaacugaccc ugaucacccu ggacaccaac 240
gagaaguucc gggacaucac caaguucauc cccgagaaca ucagcgccgc cuccgaugcc 300
acacugguca ucaauaccga gcacaugccc uccauguucg ugccuguggg agauguggug 360
caguacggcu uccugaaccu gagcggcaag cccacacacc ggaccaugau guacaacuuc 420
ccuaccaagg ccggccagug cggcggagug guuacaucug ugggcaaagu gaucggaauc 480
cacaucggcg gcaauggcag acagggcuuu ugugccggcc ugaagagaag cuacuuc 537
<210> 175
<211> 183
<212> PRT
<213> Enterovirus 68
<400> 175
Gly Pro Gly Phe Asp Phe Ala Gln Ala Ile Met Lys Lys Asn Thr Val
1 5 10 15
Ile Ala Arg Thr Glu Lys Gly Glu Phe Thr Met Leu Gly Val Tyr Asp
20 25 30
Arg Val Ala Val Ile Pro Thr His Ala Ser Val Gly Glu Ile Ile Tyr
35 40 45
Ile Asn Asp Val Glu Thr Arg Val Leu Asp Ala Cys Ala Leu Arg Asp
50 55 60
Leu Thr Asp Thr Asn Leu Glu Ile Thr Ile Val Lys Leu Asp Arg Asn
65 70 75 80
Gln Lys Phe Arg Asp Ile Arg His Phe Leu Pro Arg Cys Glu Asp Asp
85 90 95
Tyr Asn Asp Ala Val Leu Ser Val His Thr Ser Lys Phe Pro Asn Met
100 105 110
Tyr Ile Pro Val Gly Gln Val Thr Asn Tyr Gly Phe Leu Asn Leu Gly
115 120 125
Gly Thr Pro Thr His Arg Ile Leu Met Tyr Asn Phe Pro Thr Arg Ala
130 135 140
Gly Gln Cys Gly Gly Val Val Thr Thr Thr Gly Lys Val Ile Gly Ile
145 150 155 160
His Val Gly Gly Asn Gly Ala Gln Gly Phe Ala Ala Met Leu Leu His
165 170 175
Ser Tyr Phe Thr Asp Thr Gln
180
<210> 176
<211> 549
<212> DNA
<213> Enterovirus 68
<400> 176
ggaccaggat ttgattttgc gcaagccata atgaagaaaa atactgttat tgctagaact 60
gaaaaaggcg agttcacaat gcttggtgtg tatgatagag tggcagtcat tccaacacat 120
gcatctgttg gagaaatcat ttacatcaac gatgtagaaa ccagagttct agatgcatgt 180
gcacttagag acttgacaga cacaaaccta gaaataacta tagtcaaatt ggatcgcaat 240
caaaaattta gagacatcag acacttttta cccagatgtg aggatgatta caatgatgct 300
gtgcttagtg tacatacatc aaaattccct aacatgtaca ttccagttgg acaagtcact 360
aactacggct tcttgaacct gggcggcaca ccaacacatc ggattttaat gtataatttt 420
ccaacaagag ctggtcagtg tggtggtgtg gtgacaacca caggtaaagt gataggaata 480
cacgtgggcg ggaatggagc tcagggattc gcagcaatgt tgctccactc ttactttact 540
gatacacaa 549
<210> 177
<211> 549
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding EV D-68 3C protease
<400> 177
ggccctggct ttgattttgc ccaggccatc atgaagaaaa acaccgtgat cgcccggacc 60
gagaagggcg agtttacaat gctgggcgtg tacgacagag tggccgtgat tcctacacac 120
gcctctgtgg gcgagatcat ctacatcaac gacgtggaaa ccagagtgct ggacgcctgc 180
gctctgagag atctgaccga caccaacctg gaaatcacca tcgtgaagct ggaccggaac 240
cagaagttcc gggacatccg gcactttctg cccagatgcg aggacgacta caacgacgct 300
gtgctgagcg tgcacaccag caagttcccc aacatgtaca tccccgtggg ccaagtgacc 360
aactacggct tcctgaatct cggcggcacc cctacacacc ggatcctgat gtacaacttc 420
cccaccagag ccggccagtg tggcggagtg gttaccacaa caggcaaagt gatcggcatc 480
cacgtcggcg gaaatggcgc tcagggattt gctgccatgc tgctgcacag ctacttcacc 540
gacacacag 549
<210> 178
<211> 549
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding EV D-68 3C protease
<400> 178
ggcccuggcu uugauuuugc ccaggccauc augaagaaaa acaccgugau cgcccggacc 60
gagaagggcg aguuuacaau gcugggcgug uacgacagag uggccgugau uccuacacac 120
gccucugugg gcgagaucau cuacaucaac gacguggaaa ccagagugcu ggacgccugc 180
gcucugagag aucugaccga caccaaccug gaaaucacca ucgugaagcu ggaccggaac 240
cagaaguucc gggacauccg gcacuuucug cccagaugcg aggacgacua caacgacgcu 300
gugcugagcg ugcacaccag caaguucccc aacauguaca uccccguggg ccaagugacc 360
aacuacggcu uccugaaucu cggcggcacc ccuacacacc ggauccugau guacaacuuc 420
cccaccagag ccggccagug uggcggagug guuaccacaa caggcaaagu gaucggcauc 480
cacgucggcg gaaauggcgc ucagggauuu gcugccaugc ugcugcacag cuacuucacc 540
gacacacag 549
<210> 179
<211> 179
<212> PRT
<213> Enterovirus 71
<400> 179
Gly Pro Ser Leu Asp Phe Ala Leu Ser Leu Leu Arg Arg Asn Ile Arg
1 5 10 15
Gln Val Gln Thr Asp Gln Gly His Phe Thr Met Leu Gly Val Arg Asp
20 25 30
His Leu Ala Val Leu Pro Arg His Ser Gln Pro Gly Lys Thr Ile Trp
35 40 45
Val Glu His Lys Leu Val Lys Ile Val Asp Ala Val Glu Leu Val Asp
50 55 60
Glu Gln Gly Val Asn Leu Glu Leu Thr Leu Val Thr Leu Asp Thr Asn
65 70 75 80
Glu Lys Phe Arg Asp Ile Thr Arg Phe Ile Pro Glu Thr Ile Ser Pro
85 90 95
Ala Ser Asp Ala Thr Leu Val Ile Asn Thr Glu His Met Pro Ser Met
100 105 110
Phe Val Pro Val Gly Asp Val Val Gln Tyr Gly Phe Leu Asn Leu Ser
115 120 125
Gly Lys Pro Thr His Arg Thr Met Met Tyr Asn Phe Pro Thr Lys Ala
130 135 140
Gly Gln Cys Gly Gly Ala Val Thr Ala Val Gly Lys Val Ile Gly Ile
145 150 155 160
His Ile Gly Gly Asn Gly Arg Gln Gly Phe Cys Ala Ala Leu Lys Arg
165 170 175
Gly Tyr Phe
<210> 180
<211> 537
<212> DNA
<213> Enterovirus 71
<400> 180
gggccgagct tggacttcgc cctatctcta cttaggagga acattaggca ggtccaaacc 60
gaccagggcc actttacaat gttaggagtg cgagaccact tggctgtgct ccccagacac 120
tcccaaccag gaaagaccat ctgggttgaa cacaaattag tgaagatcgt agacgctgtg 180
gagctagtag atgaacaagg ggttaaccta gagctcacac tggtaacgct tgacaccaac 240
gaaaaattta gagacatcac aagattcata ccagaaacaa ttagtcctgc tagtgatgcc 300
actttagtta taaatactga acatatgccc agtatgtttg tgccagttgg agatgtggtc 360
cagtatggat ttttgaacct tagtggtaag cccactcaca ggactatgat gtacaatttc 420
ccaacaaaag caggacagtg tggtggtgct gtgactgccg taggtaaagt gattgggatt 480
cacattggtg gcaacggtag acaaggtttc tgcgctgccc tgaagagggg ttacttt 537
<210> 181
<211> 537
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding EVD-71 3C protease
<400> 181
ggcccttctc tggattttgc cctgagcctg ctgcggcgga acatcagaca ggtgcagaca 60
gatcagggcc acttcaccat gctgggcgtc agagatcatc tggccgtgct gcctagacac 120
agccagcctg gaaagaccat ctgggtcgag cacaagctgg tcaagatcgt ggacgccgtg 180
gaactggtgg atgagcaggg cgttaacctg gaactgaccc tggtcaccct ggacaccaac 240
gagaagttcc gggacatcac ccggttcatc cccgagacaa ttagccctgc ctccgacgcc 300
acactggtca tcaataccga gcacatgccc tccatgttcg tgcctgtggg agatgtggtg 360
cagtacggct tcctgaacct gagcggcaag cccacacacc ggaccatgat gtacaacttc 420
cctaccaagg ccggccagtg cggcggagct gttacagctg tgggaaaagt gatcggcatc 480
cacatcggcg gcaatggcag acagggattc tgtgccgctc tgaagagagg ctacttc 537
<210> 182
<211> 537
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding EVD-71 3C protease
<400> 182
ggcccuucuc uggauuuugc ccugagccug cugcggcgga acaucagaca ggugcagaca 60
gaucagggcc acuucaccau gcugggcguc agagaucauc uggccgugcu gccuagacac 120
agccagccug gaaagaccau cugggucgag cacaagcugg ucaagaucgu ggacgccgug 180
gaacuggugg augagcaggg cguuaaccug gaacugaccc uggucacccu ggacaccaac 240
gagaaguucc gggacaucac ccgguucauc cccgagacaa uuagcccugc cuccgacgcc 300
acacugguca ucaauaccga gcacaugccc uccauguucg ugccuguggg agauguggug 360
caguacggcu uccugaaccu gagcggcaag cccacacacc ggaccaugau guacaacuuc 420
ccuaccaagg ccggccagug cggcggagcu guuacagcug ugggaaaagu gaucggcauc 480
cacaucggcg gcaauggcag acagggauuc ugugccgcuc ugaagagagg cuacuuc 537
<210> 183
<211> 183
<212> PRT
<213> Poliovirus
<400> 183
Gly Pro Gly Phe Asp Tyr Ala Val Ala Met Ala Lys Arg Asn Ile Val
1 5 10 15
Thr Ala Thr Thr Ser Lys Gly Glu Phe Thr Met Leu Gly Val His Asp
20 25 30
Asn Val Ala Ile Leu Pro Thr His Ala Ser Pro Gly Glu Ser Ile Val
35 40 45
Ile Asp Gly Lys Glu Val Glu Ile Leu Asp Ala Lys Ala Leu Glu Asp
50 55 60
Gln Ala Gly Thr Asn Leu Glu Ile Thr Ile Ile Thr Leu Lys Arg Asn
65 70 75 80
Glu Lys Phe Arg Asp Ile Arg Pro His Ile Pro Thr Gln Ile Thr Glu
85 90 95
Thr Asn Asp Gly Val Leu Ile Val Asn Thr Ser Lys Tyr Pro Asn Met
100 105 110
Tyr Val Pro Val Gly Ala Val Thr Glu Gln Gly Tyr Leu Asn Leu Gly
115 120 125
Gly Arg Gln Thr Ala Arg Thr Leu Met Tyr Asn Phe Pro Thr Arg Ala
130 135 140
Gly Gln Cys Gly Gly Val Ile Thr Cys Thr Gly Lys Val Ile Gly Met
145 150 155 160
His Val Gly Gly Asn Gly Ser His Gly Phe Ala Ala Ala Leu Lys Arg
165 170 175
Ser Tyr Phe Thr Gln Ser Gln
180
<210> 184
<211> 549
<212> DNA
<213> Poliovirus
<400> 184
ggaccagggt tcgattacgc agtggctatg gctaaaagaa acattgttac agcaactact 60
agcaagggag agttcactat gttaggagtc cacgacaacg tggctatttt accaacccac 120
gcttcacctg gtgaaagcat tgtgatcgat ggcaaagaag tggagatctt ggatgccaaa 180
gcgctcgaag atcaagcagg aaccaatctt gaaatcacta taatcactct aaagagaaat 240
gaaaagttca gagacattag accacatata cctactcaaa tcactgagac aaatgatgga 300
gtcttgatcg tgaacactag caagtacccc aatatgtatg ttcctgtcgg tgctgtgact 360
gaacagggat atctaaatct cggtgggcgc caaactgctc gtactctaat gtacaacttt 420
ccaaccagag caggacagtg tggtggagtc atcacatgta ctgggaaagt catcgggatg 480
catgttggtg ggaacggttc acacgggttt gcagcggccc tgaagcgatc atacttcact 540
cagagtcaa 549
<210> 185
<211> 549
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding Poliovirus HEV-C 3C protease
<400> 185
ggccctggct ttgattatgc cgtggccatg gctaagcgga acatcgtgac agccaccacc 60
agcaagggcg agtttacaat gctgggcgtg cacgacaacg tggccatcct gcctacacat 120
gctagccctg gcgagagcat cgtgatcgac ggcaaagagg tggaaatcct ggacgccaag 180
gctctggaag atcaggccgg caccaacctg gaaatcacca tcatcaccct gaagcggaac 240
gagaagttcc gggacatcag acctcacatc cccacacaga tcaccgagac aaacgacggc 300
gtgctgatcg tgaataccag caagtacccc aatatgtacg tgcccgtggg cgccgtgaca 360
gagcagggat atctgaatct cggcggcaga cagaccgcca gaacactgat gtacaacttc 420
cccaccagag ccggccagtg cggcggagtg attacatgta ccggcaaagt gatcggcatg 480
cacgtcggcg gcaatggctc tcacggattt gctgccgctc tgaagagaag ctacttcacc 540
cagagccag 549
<210> 186
<211> 549
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encpding Poliovirus HEV-C 3C protease
<400> 186
ggcccuggcu uugauuaugc cguggccaug gcuaagcgga acaucgugac agccaccacc 60
agcaagggcg aguuuacaau gcugggcgug cacgacaacg uggccauccu gccuacacau 120
gcuagcccug gcgagagcau cgugaucgac ggcaaagagg uggaaauccu ggacgccaag 180
gcucuggaag aucaggccgg caccaaccug gaaaucacca ucaucacccu gaagcggaac 240
gagaaguucc gggacaucag accucacauc cccacacaga ucaccgagac aaacgacggc 300
gugcugaucg ugaauaccag caaguacccc aauauguacg ugcccguggg cgccgugaca 360
gagcagggau aucugaaucu cggcggcaga cagaccgcca gaacacugau guacaacuuc 420
cccaccagag ccggccagug cggcggagug auuacaugua ccggcaaagu gaucggcaug 480
cacgucggcg gcaauggcuc ucacggauuu gcugccgcuc ugaagagaag cuacuucacc 540
cagagccag 549
<210> 187
<211> 149
<212> PRT
<213> Poliovirus
<400> 187
Gly Phe Gly His Gln Asn Lys Ala Val Tyr Thr Ala Gly Tyr Lys Ile
1 5 10 15
Cys Asn Tyr His Leu Ala Thr Gln Asp Asp Leu Gln Asn Ala Val Asn
20 25 30
Val Met Trp Ser Arg Asp Leu Leu Val Thr Glu Ser Arg Ala Gln Gly
35 40 45
Thr Asp Ser Ile Ala Arg Cys Asn Cys Asn Ala Gly Val Tyr Tyr Cys
50 55 60
Glu Ser Arg Arg Lys Tyr Tyr Pro Val Ser Phe Val Gly Pro Thr Phe
65 70 75 80
Gln Tyr Met Glu Ala Asn Asn Tyr Tyr Pro Ala Arg Tyr Gln Ser His
85 90 95
Met Leu Ile Gly His Gly Phe Ala Ser Pro Gly Asp Cys Gly Gly Ile
100 105 110
Leu Arg Cys His His Gly Val Ile Gly Ile Ile Thr Ala Gly Gly Glu
115 120 125
Gly Leu Val Ala Phe Ser Asp Ile Arg Asp Leu Tyr Ala Tyr Glu Glu
130 135 140
Glu Ala Met Glu Gln
145
<210> 188
<211> 447
<212> DNA
<213> Poliovirus
<400> 188
ggattcggac accaaaacaa agcggtgtac actgcaggtt acaaaatttg caactaccac 60
ttggccactc aggatgattt gcaaaacgca gtgaacgtca tgtggagtag agacctctta 120
gtcacagaat caagagccca gggcaccgat tcaatcgcaa ggtgcaattg caacgcaggg 180
gtgtactact gcgagtctag aaggaaatac tacccagtat ccttcgttgg cccaacgttc 240
cagtacatgg aggctaataa ctattaccca gctaggtacc agtcccatat gctcattggc 300
catggattcg catctccagg ggattgtggt ggcatactca gatgtcacca cggggtgata 360
gggatcatta ctgctggtgg cgaagggttg gttgcatttt cagacattag agacttgtat 420
gcctacgaag aagaagccat ggaacaa 447
<210> 189
<211> 447
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding Poliovirus HEV-C 2A protease
<400> 189
ggctttggcc accagaacaa ggccgtgtac acagccggct acaagatctg caactaccac 60
ctggccacac aggacgacct gcagaacgcc gtgaatgtga tgtggtccag ggacctgctg 120
gtcaccgaat ctagagccca gggcaccgac tctatcgcca gatgcaactg taatgccggc 180
gtgtactact gcgagagccg gcggaagtac taccccgtgt cttttgtggg ccccaccttc 240
cagtacatgg aagccaacaa ctactaccct gccagatacc agagccacat gctgatcggc 300
cacggctttg ctagccctgg cgattgtggc ggcatcctga gatgtcacca tggcgtgatc 360
ggcatcatca ccgctggcgg agaaggactg gtggccttca gcgacatcag agatctgtac 420
gcctacgaag aggaagccat ggaacag 447
<210> 190
<211> 447
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding Poliovirus HEV-C 2A protease
<400> 190
ggcuuuggcc accagaacaa ggccguguac acagccggcu acaagaucug caacuaccac 60
cuggccacac aggacgaccu gcagaacgcc gugaauguga ugugguccag ggaccugcug 120
gucaccgaau cuagagccca gggcaccgac ucuaucgcca gaugcaacug uaaugccggc 180
guguacuacu gcgagagccg gcggaaguac uaccccgugu cuuuuguggg ccccaccuuc 240
caguacaugg aagccaacaa cuacuacccu gccagauacc agagccacau gcugaucggc 300
cacggcuuug cuagcccugg cgauuguggc ggcauccuga gaugucacca uggcgugauc 360
ggcaucauca ccgcuggcgg agaaggacug guggccuuca gcgacaucag agaucuguac 420
gccuacgaag aggaagccau ggaacag 447
<210> 191
<211> 150
<212> PRT
<213> Coxsackievirus
<400> 191
Gly Ala Phe Gly Gln Gln Ser Gly Ala Val Tyr Val Gly Asn Tyr Arg
1 5 10 15
Val Val Asn Arg His Leu Ala Thr Ser Ala Asp Trp Gln Asn Cys Val
20 25 30
Trp Glu Ser Tyr Asn Arg Asp Leu Leu Val Ser Thr Thr Thr Ala His
35 40 45
Gly Cys Asp Ile Ile Ala Arg Cys Gln Cys Thr Thr Gly Val Tyr Phe
50 55 60
Cys Ala Ser Lys Asn Lys His Tyr Pro Ile Ser Phe Glu Gly Pro Gly
65 70 75 80
Leu Val Glu Val Gln Glu Ser Glu Tyr Tyr Pro Arg Arg Tyr Gln Ser
85 90 95
His Val Leu Leu Ala Ala Gly Phe Ser Glu Pro Gly Asp Cys Gly Gly
100 105 110
Ile Leu Arg Cys Glu His Gly Val Ile Gly Ile Val Thr Met Gly Gly
115 120 125
Glu Gly Val Val Gly Phe Ala Asp Ile Arg Asp Leu Leu Trp Leu Glu
130 135 140
Asp Asp Ala Met Glu Gln
145 150
<210> 192
<211> 450
<212> DNA
<213> Coxsackievirus
<400> 192
ggcgcatttg gacaacaatc aggggcagtg tatgtgggga actacagggt ggtaaataga 60
catctagcta ccagtgctga ctggcaaaac tgtgtgtggg aaagttacaa cagagacctc 120
ttagtgagca cgaccacagc acatggatgt gatattatag ccagatgtca gtgcacaacg 180
ggagtgtact tttgtgcgtc caaaaacaag cactacccaa tttcgtttga aggaccaggt 240
ctagtagagg tccaagagag tgaatactac cccaggagat accaatccca tgtgctttta 300
gcagctggat tttccgaacc aggtgactgt ggcggtatcc taaggtgtga gcatggtgtc 360
attggcattg tgaccatggg gggtgaaggc gtggtcggct ttgcagacat ccgtgatctc 420
ctgtggctgg aagatgatgc aatggaacag 450
<210> 193
<211> 450
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding CVB3 2A protease
<400> 193
ggagcttttg gacagcagtc tggcgccgtg tacgtgggca attaccgggt cgtgaataga 60
cacctggcca cctctgccga ctggcagaat tgtgtgtggg agagctacaa ccgggacctg 120
ctggtgtcta ccacaacagc ccacggctgc gacatcattg ccagatgcca gtgtacaacc 180
ggcgtgtact tctgcgccag caagaacaag cactacccca tcagcttcga aggccctggc 240
ctggtggaag tgcaagagag cgagtactac cctcggagat accagagcca cgtgctgctg 300
gccgctggct tttctgaacc tggcgattgt ggcggcatcc tgagatgtga acacggcgtg 360
atcggcatcg tgaccatggg cggagaaggc gttgtgggct tcgccgacat tagagatctg 420
ctgtggctgg aagatgacgc catggaacag 450
<210> 194
<211> 450
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding CVB3 2A protease
<400> 194
ggagcuuuug gacagcaguc uggcgccgug uacgugggca auuaccgggu cgugaauaga 60
caccuggcca ccucugccga cuggcagaau uguguguggg agagcuacaa ccgggaccug 120
cuggugucua ccacaacagc ccacggcugc gacaucauug ccagaugcca guguacaacc 180
ggcguguacu ucugcgccag caagaacaag cacuacccca ucagcuucga aggcccuggc 240
cugguggaag ugcaagagag cgaguacuac ccucggagau accagagcca cgugcugcug 300
gccgcuggcu uuucugaacc uggcgauugu ggcggcaucc ugagauguga acacggcgug 360
aucggcaucg ugaccauggg cggagaaggc guugugggcu ucgccgacau uagagaucug 420
cuguggcugg aagaugacgc cauggaacag 450
<210> 195
<211> 150
<212> PRT
<213> Enterovirus 71
<400> 195
Gly Lys Phe Gly Gln Gln Ser Gly Ala Ile Tyr Val Gly Asn Phe Arg
1 5 10 15
Val Val Asn Arg His Leu Ala Thr His Asn Asp Trp Ala Asn Leu Val
20 25 30
Trp Glu Asp Ser Ser Arg Asp Leu Leu Val Ser Ser Thr Thr Ala Gln
35 40 45
Gly Cys Asp Thr Ile Ala Arg Cys Asn Cys Gln Thr Gly Val Tyr Tyr
50 55 60
Cys Asn Ser Arg Arg Lys His Tyr Pro Val Ser Phe Ser Lys Pro Ser
65 70 75 80
Leu Ile Tyr Val Glu Ala Ser Glu Tyr Tyr Pro Ala Arg Tyr Gln Ser
85 90 95
His Leu Met Leu Ala Gln Gly His Ser Glu Pro Gly Asp Cys Gly Gly
100 105 110
Ile Leu Arg Cys Gln His Gly Val Val Gly Ile Val Ser Thr Gly Gly
115 120 125
Asn Gly Leu Val Gly Phe Ala Asp Val Arg Asp Leu Leu Trp Leu Asp
130 135 140
Glu Glu Ala Met Glu Gln
145 150
<210> 196
<211> 450
<212> DNA
<213> Enterovirus 71
<400> 196
ggaaaatttg ggcaacagtc tggggccatt tatgtgggta actttagagt ggtcaaccgt 60
catcttgcca ctcacaatga ttgggcaaat cttgtttggg aagacagctc tcgcgactta 120
ctcgtgtcat ccaccaccgc ccaaggttgt gacacgattg cccgctgcaa ttgccagaca 180
ggggtgtact actgtaactc gaggagaaaa cactacccag tcagtttttc aaaacccagt 240
ctgatctatg tagaggctag cgagtattac ccagccaggt accagtcaca tcttatgctc 300
gcacagggcc actcagagcc tggtgattgc ggtggtatcc ttagatgcca acatggcgtc 360
gtcggtatag tgtcaactgg tggtaacggg ctcgttggct ttgcagacgt cagggacctc 420
ttgtggttag atgaagaagc tatggagcag 450
<210> 197
<211> 450
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding EV71 2A protease
<400> 197
ggcaagtttg gacagcagag cggcgccatc tacgtgggca atttccgggt cgtgaaccgg 60
cacctggcca cacataacga ctgggccaat ctcgtgtggg aagatagcag cagggacctg 120
ctggtgtcca gcacaacagc ccagggctgc gatacaatcg ccagatgcaa ttgccagacc 180
ggcgtgtact actgcaacag cagacggaag cactaccccg tgtccttcag caagcccagc 240
ctgatctatg tggaagccag cgagtactac cccgccagat accagtctca cctgatgctg 300
gcccagggcc attctgagcc aggcgattgt ggcggaatcc tgagatgcca gcatggcgtc 360
gtgggcattg tgtctaccgg cggaaatggc ctcgtgggat ttgccgatgt tcgcgacctg 420
ctgtggctgg acgaagaggc tatggaacag 450
<210> 198
<211> 450
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding EV71 2A protease
<400> 198
ggcaaguuug gacagcagag cggcgccauc uacgugggca auuuccgggu cgugaaccgg 60
caccuggcca cacauaacga cugggccaau cucguguggg aagauagcag cagggaccug 120
cuggugucca gcacaacagc ccagggcugc gauacaaucg ccagaugcaa uugccagacc 180
ggcguguacu acugcaacag cagacggaag cacuaccccg uguccuucag caagcccagc 240
cugaucuaug uggaagccag cgaguacuac cccgccagau accagucuca ccugaugcug 300
gcccagggcc auucugagcc aggcgauugu ggcggaaucc ugagaugcca gcauggcguc 360
gugggcauug ugucuaccgg cggaaauggc cucgugggau uugccgaugu ucgcgaccug 420
cuguggcugg acgaagaggc uauggaacag 450
<210> 199
<211> 219
<212> PRT
<213> Human metapneumovirus
<400> 199
Met Glu Val Lys Val Glu Asn Ile Arg Ala Ile Asp Met Leu Lys Ala
1 5 10 15
Arg Val Lys Asn Arg Val Ala Arg Ser Lys Cys Phe Lys Asn Ala Ser
20 25 30
Leu Ile Leu Ile Gly Ile Thr Thr Leu Ser Ile Ala Leu Asn Ile Tyr
35 40 45
Leu Ile Ile Asn Tyr Thr Ile Gln Lys Thr Ser Ser Glu Ser Glu His
50 55 60
His Thr Ser Ser Pro Pro Thr Glu Ser Asn Lys Glu Ala Ser Thr Ile
65 70 75 80
Ser Thr Asp Asn Pro Asp Ile Asn Pro Asn Ser Gln His Pro Thr Gln
85 90 95
Gln Ser Thr Glu Asn Pro Thr Leu Asn Pro Ala Ala Ser Val Ser Pro
100 105 110
Ser Glu Thr Glu Pro Ala Ser Thr Pro Asp Thr Thr Asn Arg Leu Ser
115 120 125
Ser Val Asp Arg Ser Thr Ala Gln Pro Ser Glu Ser Arg Thr Lys Thr
130 135 140
Lys Pro Thr Val His Thr Arg Asn Asn Pro Ser Thr Ala Ser Ser Thr
145 150 155 160
Gln Ser Pro Pro Arg Ala Thr Thr Lys Ala Ile Arg Arg Ala Thr Thr
165 170 175
Phe Arg Met Ser Ser Thr Gly Lys Arg Pro Thr Thr Thr Ser Val Gln
180 185 190
Ser Asp Ser Ser Thr Thr Thr Gln Asn His Glu Glu Thr Gly Ser Ala
195 200 205
Asn Pro Gln Ala Ser Val Ser Thr Met Gln Asn
210 215
<210> 200
<211> 657
<212> DNA
<213> Human metapneumovirus
<400> 200
atggaggtga aagtagagaa cattcgagca atagacatgc tcaaagcaag agtgaaaaat 60
cgtgtggcac gtagcaaatg ctttaaaaat gcttctttaa tcctcatagg aataactaca 120
ctgagtatag ctctcaatat ctatctgatc ataaactaca caatacaaaa aacctcatct 180
gaatcagaac accacaccag ctcaccaccc acagaatcca acaaggaagc ttcaacaatc 240
tccacagaca acccagacat caatccaaac tcacagcatc caactcaaca gtccacagaa 300
aaccccacac tcaaccccgc agcatcagtg agcccatcag aaacagaacc agcatcaaca 360
ccagacacaa caaaccgcct gtcctccgta gacaggtcca cagcacaacc aagtgaaagc 420
agaacaaaga caaaaccgac agtccacaca agaaacaacc caagcacagc ttccagtaca 480
caatccccac cacgggcaac aacgaaggca atccgcagag ccaccacttt ccgcatgagc 540
agcacaggaa aaagaccaac cacaacatca gtccagtccg acagcagcac cacaacccaa 600
aatcatgaag aaacaggttc agcgaaccca caggcatctg taagcacaat gcaaaac 657
<210> 201
<211> 657
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding hMPV G protein
<400> 201
atggaagtga aggtcgagaa catccgggcc atcgacatgc tgaaggccag agtgaagaac 60
agagtggccc ggtccaagtg cttcaagaac gccagcctga tcctgatcgg catcaccaca 120
ctgtctatcg ccctgaacat ctacctgatc atcaactaca ccatccagaa aaccagcagc 180
gagagcgagc accacacaag ctctccacct accgagagca acaaagaggc cagcaccatc 240
agcaccgaca atcccgacat caaccccaac tctcagcacc ccacacagca gtccaccgag 300
aatcccacac tgaaccctgc cgcctctgtg tccccatctg agacagaacc tgccagcaca 360
cccgacacca ccaacagact gtctagcgtg gacagaagca cagcccagcc tagcgagagc 420
cggaccaaga caaaacctac cgtgcacacc cggaacaacc ctagcacagc cagctctaca 480
cagagccctc caagagccac caccaaggcc attagaaggg ccaccacctt ccggatgagc 540
agcaccggca aaagacctac caccaccagc gtgcagagcg acagcagcac aaccacacag 600
aaccacgagg aaaccggcag cgccaatcct caggctagcg tgtccaccat gcagaac 657
<210> 202
<211> 657
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding hMPV G protein
<400> 202
auggaaguga aggucgagaa cauccgggcc aucgacaugc ugaaggccag agugaagaac 60
agaguggccc gguccaagug cuucaagaac gccagccuga uccugaucgg caucaccaca 120
cugucuaucg cccugaacau cuaccugauc aucaacuaca ccauccagaa aaccagcagc 180
gagagcgagc accacacaag cucuccaccu accgagagca acaaagaggc cagcaccauc 240
agcaccgaca aucccgacau caaccccaac ucucagcacc ccacacagca guccaccgag 300
aaucccacac ugaacccugc cgccucugug uccccaucug agacagaacc ugccagcaca 360
cccgacacca ccaacagacu gucuagcgug gacagaagca cagcccagcc uagcgagagc 420
cggaccaaga caaaaccuac cgugcacacc cggaacaacc cuagcacagc cagcucuaca 480
cagagcccuc caagagccac caccaaggcc auuagaaggg ccaccaccuu ccggaugagc 540
agcaccggca aaagaccuac caccaccagc gugcagagcg acagcagcac aaccacacag 600
aaccacgagg aaaccggcag cgccaauccu caggcuagcg uguccaccau gcagaac 657
<210> 203
<211> 183
<212> PRT
<213> Coxsackievirus
<400> 203
Gly Pro Ala Phe Glu Phe Ala Val Ala Met Met Lys Arg Asn Ser Ser
1 5 10 15
Thr Val Lys Thr Glu Tyr Gly Glu Phe Thr Met Leu Gly Ile Tyr Asp
20 25 30
Arg Trp Ala Val Leu Pro Arg His Ala Lys Pro Gly Pro Thr Ile Leu
35 40 45
Met Asn Asp Gln Glu Val Gly Val Leu Asp Ala Lys Glu Leu Val Asp
50 55 60
Lys Asp Gly Thr Asn Leu Glu Leu Thr Leu Leu Lys Leu Asn Arg Asn
65 70 75 80
Glu Lys Phe Arg Asp Ile Arg Gly Phe Leu Ala Lys Glu Glu Val Glu
85 90 95
Val Asn Glu Ala Val Leu Ala Ile Asn Thr Ser Lys Phe Pro Asn Met
100 105 110
Tyr Ile Pro Val Gly Gln Val Thr Glu Tyr Gly Phe Leu Asn Leu Gly
115 120 125
Gly Thr Pro Thr Lys Arg Met Leu Met Tyr Asn Phe Pro Thr Arg Ala
130 135 140
Gly Gln Cys Gly Gly Val Leu Met Ser Thr Gly Lys Val Leu Gly Ile
145 150 155 160
His Val Gly Gly Asn Gly His Gln Gly Phe Ser Ala Ala Leu Leu Lys
165 170 175
His Tyr Phe Asn Asp Glu Gln
180
<210> 204
<211> 549
<212> DNA
<213> Coxsackievirus
<400> 204
ggccctgcct ttgagttcgc cgtcgcaatg atgaaaagga actcaagcac ggtgaaaact 60
gaatatggcg agtttaccat gctgggcatc tatgacaggt gggccgtttt gccacgccac 120
gccaaacctg ggccaaccat cttgatgaat gatcaagagg ttggtgtgct agatgccaag 180
gagctagtag acaaggacgg caccaactta gaactgacac tactcaaatt gaaccggaat 240
gagaagttca gagacatcag aggcttctta gccaaggagg aagtggaggt taatgaggca 300
gtgctagcaa ttaacaccag caagtttccc aacatgtaca ttccagtagg acaggtcaca 360
gaatacggct tcctaaacct aggtggcaca cccaccaaga gaatgcttat gtacaacttc 420
cccacaagag caggccagtg tggtggagtg ctcatgtcca ccggcaaggt actgggtatc 480
catgttggtg gaaatggcca tcagggcttc tcagcagcac tcctcaaaca ctacttcaat 540
gatgagcaa 549
<210> 205
<211> 549
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding CVB3 3C protease
<400> 205
ggacctgcct ttgaattcgc cgtggccatg atgaagcgga acagcagcac cgtgaaaacc 60
gagtacggcg agttcaccat gctgggcatc tacgacagat gggccgtgct gcctagacac 120
gccaaacctg gacctaccat cctgatgaac gaccaagaag tgggcgttct ggacgccaaa 180
gaactggtgg acaaggacgg caccaacctg gaactgaccc tgctgaagct gaaccggaac 240
gagaagttcc gggatatcag aggcttcctg gccaaagaag aggtggaagt caacgaagcc 300
gtgctggcca tcaacaccag caagttcccc aacatgtaca tccccgtggg ccaagtgaca 360
gagtacggct tcctgaatct cggcggcacc cctaccaagc ggatgctgat gtacaacttc 420
cccaccagag ccggccagtg tggcggagtt cttatgtcta ccggcaaggt gctgggaatc 480
cacgttggcg gaaatggcca ccagggcttt tctgccgctc tgctgaaaca ctacttcaac 540
gacgagcag 549
<210> 206
<211> 549
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding CVB3 3C protease
<400> 206
ggaccugccu uugaauucgc cguggccaug augaagcgga acagcagcac cgugaaaacc 60
gaguacggcg aguucaccau gcugggcauc uacgacagau gggccgugcu gccuagacac 120
gccaaaccug gaccuaccau ccugaugaac gaccaagaag ugggcguucu ggacgccaaa 180
gaacuggugg acaaggacgg caccaaccug gaacugaccc ugcugaagcu gaaccggaac 240
gagaaguucc gggauaucag aggcuuccug gccaaagaag agguggaagu caacgaagcc 300
gugcuggcca ucaacaccag caaguucccc aacauguaca uccccguggg ccaagugaca 360
gaguacggcu uccugaaucu cggcggcacc ccuaccaagc ggaugcugau guacaacuuc 420
cccaccagag ccggccagug uggcggaguu cuuaugucua ccggcaaggu gcugggaauc 480
cacguuggcg gaaauggcca ccagggcuuu ucugccgcuc ugcugaaaca cuacuucaac 540
gacgagcag 549
<210> 207
<211> 631
<212> PRT
<213> Hepatitis C virus
<400> 207
Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Phe Ser Thr
1 5 10 15
Ile Val Thr Ser Leu Thr Gly Arg Asp Thr Asn Glu Asn Cys Gly Glu
20 25 30
Val Gln Val Leu Ser Thr Ala Thr Gln Ser Phe Leu Gly Thr Ala Val
35 40 45
Asn Gly Val Met Trp Thr Val Tyr His Gly Ala Gly Ala Lys Thr Ile
50 55 60
Ser Gly Pro Lys Gly Pro Val Asn Gln Met Tyr Thr Asn Val Asp Gln
65 70 75 80
Asp Leu Val Gly Trp Pro Ala Pro Pro Gly Val Arg Ser Leu Ala Pro
85 90 95
Cys Thr Cys Gly Ser Ala Asp Leu Tyr Leu Val Thr Arg His Ala Asp
100 105 110
Val Ile Pro Val Arg Arg Arg Gly Asp Thr Arg Gly Ala Leu Leu Ser
115 120 125
Pro Arg Pro Ile Ser Ile Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu
130 135 140
Cys Pro Met Gly His Arg Ala Gly Ile Phe Arg Ala Ala Val Cys Thr
145 150 155 160
Arg Gly Val Ala Lys Ala Val Asp Phe Val Pro Val Glu Ser Leu Glu
165 170 175
Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Thr Pro Pro Ala
180 185 190
Val Pro Gln Thr Tyr Gln Val Ala His Leu His Ala Pro Thr Gly Ser
195 200 205
Gly Lys Ser Thr Lys Val Pro Ala Ala His Ala Ala Gln Gly Tyr Lys
210 215 220
Val Leu Val Leu Asn Pro Ser Val Ala Ala Thr Leu Gly Phe Gly Val
225 230 235 240
Tyr Met Ser Lys Ala Tyr Gly Ile Asp Pro Asn Ile Arg Ser Gly Val
245 250 255
Arg Thr Ile Thr Thr Gly Ala Pro Ile Thr Tyr Ser Thr Tyr Gly Lys
260 265 270
Phe Leu Ala Asp Gly Gly Cys Ser Gly Gly Ala Tyr Asp Ile Ile Ile
275 280 285
Cys Asp Glu Cys Tyr Ser Thr Asp Ser Thr Thr Ile Leu Gly Ile Gly
290 295 300
Thr Val Leu Asp Gln Ala Glu Thr Ala Gly Val Arg Leu Thr Val Leu
305 310 315 320
Ala Thr Ala Thr Pro Pro Gly Ser Val Thr Thr Pro His Ser Asn Ile
325 330 335
Glu Glu Val Ala Leu Pro Thr Thr Gly Glu Ile Pro Phe Tyr Gly Lys
340 345 350
Ala Ile Pro Leu Glu Leu Ile Lys Gly Gly Arg His Leu Ile Phe Cys
355 360 365
His Ser Lys Lys Lys Cys Asp Glu Leu Ala Arg Gln Leu Thr Ser Leu
370 375 380
Gly Leu Asn Ala Val Ala Tyr Tyr Arg Gly Leu Asp Val Ser Val Ile
385 390 395 400
Pro Thr Ser Gly Asp Val Val Val Cys Ala Thr Asp Ala Leu Met Thr
405 410 415
Gly Phe Thr Gly Asp Phe Asp Ser Val Ile Asp Cys Asn Thr Ser Val
420 425 430
Ile Gln Thr Val Asp Phe Ser Leu Asp Pro Thr Phe Ser Ile Glu Ile
435 440 445
Thr Thr Val Pro Gln Asp Ala Val Ser Arg Ser Gln Arg Arg Gly Arg
450 455 460
Thr Gly Arg Gly Arg Leu Gly Thr Tyr Arg Tyr Val Thr Pro Gly Glu
465 470 475 480
Arg Pro Ser Gly Met Phe Asp Thr Ala Glu Leu Cys Glu Cys Tyr Asp
485 490 495
Ala Gly Cys Ala Trp Tyr Glu Leu Thr Pro Ala Glu Thr Thr Thr Arg
500 505 510
Leu Lys Ala Tyr Phe Asp Thr Pro Gly Leu Pro Val Cys Gln Asp His
515 520 525
Leu Glu Phe Trp Glu Ser Val Phe Thr Gly Leu Thr His Ile Asp Gly
530 535 540
His Phe Leu Ser Gln Thr Lys Gln Ser Gly Glu Asn Phe Pro Tyr Leu
545 550 555 560
Val Ala Tyr Gln Ala Thr Val Ser Ala Lys Val Trp Leu Ala Pro Pro
565 570 575
Ser Trp Asp Thr Met Trp Lys Cys Leu Ile Arg Leu Lys Pro Thr Leu
580 585 590
His Gly Pro Thr Pro Leu Leu Tyr Arg Leu Gly Ser Val Gln Asn Glu
595 600 605
Val Val Leu Thr His Pro Ile Thr Lys Tyr Ile Met Ala Cys Met Ser
610 615 620
Ala Asp Leu Glu Val Val Thr
625 630
<210> 208
<211> 1893
<212> DNA
<213> Hepatitis C virus
<400> 208
gcccccatca cagcatacgc acagcagacc cgcggcttgt tcagcaccat cgtaacgagc 60
ctcactggca gggacaccaa tgagaattgt ggcgaagtgc aggtcttatc caccgctacg 120
cagtccttcc tgggtactgc ggttaacggc gtgatgtgga ccgtctacca cggggcgggt 180
gccaagacca tcagcggccc gaagggacct gtcaatcaaa tgtacactaa tgttgaccaa 240
gacttggtgg ggtggccagc accccccgga gtcagatctc ttgctccgtg cacctgcggc 300
tcggcagact tgtatctagt caccaggcac gcggatgtaa tacccgtgcg caggagagga 360
gacaccagag gagctctctt gagccctaga ccaatatcca ttcttaaggg atcttccgga 420
ggtccgctgc tgtgccccat gggacaccgc gccggcatat tccgtgcggc ggtgtgtact 480
cggggggtag ccaaggcggt agacttcgtc ccggttgaat ctcttgagac taccatgaga 540
tcaccagtgt tcactgacaa ctcaacaccc ccagcagtgc cccagaccta ccaggtcgcg 600
cacctacacg caccaacagg aagtggcaag agcactaagg tcccggcggc gcatgctgcc 660
caaggctata aagtgctagt gctcaatcct tcggttgcgg ccacactggg ttttggggta 720
tacatgtcca aggcatatgg catcgacccg aacatccggt cgggagtcag gaccatcacc 780
acgggtgcgc caatcacgta ctcaacgtat ggtaagttcc tggctgatgg aggttgcagc 840
ggaggggcat acgacataat catctgtgac gagtgctatt ccactgactc cacaacgatc 900
cttggcatag gcacagtcct ggaccaagcg gagaccgctg gagtgcgcct caccgtgctc 960
gcgactgcta ctccgccagg gtcagtgact acacctcatt ccaacataga ggaggtcgcc 1020
ctgccaacaa cgggggaaat acccttttac ggcaaggcga tccctctgga gctgatcaag 1080
gggggcagac atctcatctt ctgccattca aagaaaaagt gcgatgaact ggccagacaa 1140
ctgacatctc ttggtctgaa tgccgtagcc tactacagag gcttagacgt ttcggtgatt 1200
cccacgtctg gggacgtcgt ggtatgcgcc acggacgccc tcatgacggg tttcaccggc 1260
gactttgact cagtgataga ctgcaataca tctgtgatac agactgttga cttcagcttg 1320
gaccccacct tctccataga gattacaacc gttccccagg acgcggtatc ccgcagccag 1380
cggagaggcc gcactggtag ggggaggttg ggcacatacc ggtatgtcac cccgggagag 1440
agaccatcag gcatgtttga cactgcagag ctttgcgagt gctacgatgc cgggtgcgcc 1500
tggtacgagc tgacacctgc tgaaaccaca acaaggctga aagcttactt cgacacacca 1560
ggccttcctg tgtgccaaga ccatctggaa ttctgggaga gcgtctttac agggttaacc 1620
cacatagacg gtcatttcct atcccagacc aagcaatcgg gtgagaattt cccgtatctt 1680
gttgcttacc aagcgacggt gtcggccaag gtctggctcg ctccaccaag ctgggacacc 1740
atgtggaagt gcctaattcg ccttaagccc accctgcacg ggcccacgcc cctcctctac 1800
agactggggt ctgtgcagaa tgaagtggtg ctcacccatc ccatcaccaa atacatcatg 1860
gcttgcatgt cagctgatct cgaggtagtg aca 1893
<210> 209
<211> 1893
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding Hepatitis C NS3/4A protein
<400> 209
gcccctatca cagcctacgc tcagcagacc agaggcctgt tcagcaccat cgtgacaagc 60
ctgaccggca gagacaccaa cgagaattgt ggcgaggtgc aggtcctgtc tacagctacc 120
cagagctttc tgggcaccgc cgtgaatggc gtgatgtgga cagtgtatca tggcgctggc 180
gccaagacaa tctctggccc taagggcccc gtgaaccaga tgtacaccaa cgtggaccag 240
gacctcgttg gctggcctgc tcctcctggt gttagaagcc tggctccttg tacatgcggc 300
agcgccgatc tgtacctggt cacaagacac gccgacgtga tccccgtcag aagaagaggc 360
gatacaagag gcgccctgct gagccctaga cctatctcta tcctgaaggg cagctctggc 420
ggccctctgc tttgtcctat gggacacaga gccggcatct tcagagccgc cgtgtgtact 480
agaggcgtgg ccaaggctgt ggacttcgtg cctgtggaaa gcctggaaac caccatgaga 540
agccccgtgt tcaccgacaa cagcacccct ccagctgtgc ctcagacata ccaggtggcc 600
catctgcatg cccctacagg ctctggcaag agcacaaaag tgcctgccgc tcatgctgcc 660
cagggctata aggtgctggt gctcaatcct agcgtggccg ccacactcgg ctttggcgtg 720
tacatgtcta aggcctacgg catcgacccc aacatcagat ctggcgtgcg gaccatcaca 780
acaggcgccc caatcaccta ctctacctac ggcaagttcc tggccgatgg cggatgttct 840
ggcggagcct acgacatcat catctgcgac gagtgctaca gcaccgacag caccacaatc 900
ctcggcatcg gcacagtgct ggatcaggct gaaacagccg gcgtcagact gactgtgctg 960
gccacagcta cacctccagg cagcgtgaca acccctcaca gcaacatcga ggaagtggcc 1020
ctgcctacaa ccggcgagat cccattctat ggcaaggcca ttcctctcga gctgatcaaa 1080
ggcggcagac acctgatctt ttgccacagc aagaagaagt gcgacgagct ggccagacag 1140
ctgacatccc tgggactgaa tgccgtggcc tactacagag gactggacgt gtccgtgatt 1200
cccacatctg gcgacgtggt cgtgtgtgcc acagatgccc tgatgaccgg cttcaccggc 1260
gacttcgata gcgtgatcga ctgcaacacc agcgtgatcc agaccgtgga cttctctctg 1320
gaccccacct tcagcatcga gatcaccacc gttcctcagg acgccgtgtc tcggtcacag 1380
agaagaggca gaacaggcag aggccggctg ggcacataca gatatgtgac acccggcgaa 1440
agacccagcg gcatgtttga tacagccgag ctgtgcgagt gttacgacgc cggatgtgct 1500
tggtacgagc tgacaccagc cgagacaacc accagactga aggcctactt cgacacccct 1560
ggcctgcctg tgtgtcagga ccacctggaa ttttgggaga gcgtgttcac aggactgacc 1620
cacatcgacg gccactttct gagccagacc aagcagagcg gcgagaactt cccttacctg 1680
gtggcctatc aggctaccgt gtccgccaaa gtttggctgg ctcctcctag ctgggacacc 1740
atgtggaagt gcctgatccg gctgaagcct acactgcacg gacctacacc tctgctgtac 1800
agactgggca gcgtgcagaa tgaggtggtg ctgacccatc ctatcaccaa gtacatcatg 1860
gcctgcatga gcgccgacct ggaagtggtt aca 1893
<210> 210
<211> 1893
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding Hepatitis C NS3/4A protein
<400> 210
gccccuauca cagccuacgc ucagcagacc agaggccugu ucagcaccau cgugacaagc 60
cugaccggca gagacaccaa cgagaauugu ggcgaggugc agguccuguc uacagcuacc 120
cagagcuuuc ugggcaccgc cgugaauggc gugaugugga caguguauca uggcgcuggc 180
gccaagacaa ucucuggccc uaagggcccc gugaaccaga uguacaccaa cguggaccag 240
gaccucguug gcuggccugc uccuccuggu guuagaagcc uggcuccuug uacaugcggc 300
agcgccgauc uguaccuggu cacaagacac gccgacguga uccccgucag aagaagaggc 360
gauacaagag gcgcccugcu gagcccuaga ccuaucucua uccugaaggg cagcucuggc 420
ggcccucugc uuuguccuau gggacacaga gccggcaucu ucagagccgc cguguguacu 480
agaggcgugg ccaaggcugu ggacuucgug ccuguggaaa gccuggaaac caccaugaga 540
agccccgugu ucaccgacaa cagcaccccu ccagcugugc cucagacaua ccagguggcc 600
caucugcaug ccccuacagg cucuggcaag agcacaaaag ugccugccgc ucaugcugcc 660
cagggcuaua aggugcuggu gcucaauccu agcguggccg ccacacucgg cuuuggcgug 720
uacaugucua aggccuacgg caucgacccc aacaucagau cuggcgugcg gaccaucaca 780
acaggcgccc caaucaccua cucuaccuac ggcaaguucc uggccgaugg cggauguucu 840
ggcggagccu acgacaucau caucugcgac gagugcuaca gcaccgacag caccacaauc 900
cucggcaucg gcacagugcu ggaucaggcu gaaacagccg gcgucagacu gacugugcug 960
gccacagcua caccuccagg cagcgugaca accccucaca gcaacaucga ggaaguggcc 1020
cugccuacaa ccggcgagau cccauucuau ggcaaggcca uuccucucga gcugaucaaa 1080
ggcggcagac accugaucuu uugccacagc aagaagaagu gcgacgagcu ggccagacag 1140
cugacauccc ugggacugaa ugccguggcc uacuacagag gacuggacgu guccgugauu 1200
cccacaucug gcgacguggu cgugugugcc acagaugccc ugaugaccgg cuucaccggc 1260
gacuucgaua gcgugaucga cugcaacacc agcgugaucc agaccgugga cuucucucug 1320
gaccccaccu ucagcaucga gaucaccacc guuccucagg acgccguguc ucggucacag 1380
agaagaggca gaacaggcag aggccggcug ggcacauaca gauaugugac acccggcgaa 1440
agacccagcg gcauguuuga uacagccgag cugugcgagu guuacgacgc cggaugugcu 1500
ugguacgagc ugacaccagc cgagacaacc accagacuga aggccuacuu cgacaccccu 1560
ggccugccug ugugucagga ccaccuggaa uuuugggaga gcguguucac aggacugacc 1620
cacaucgacg gccacuuucu gagccagacc aagcagagcg gcgagaacuu cccuuaccug 1680
guggccuauc aggcuaccgu guccgccaaa guuuggcugg cuccuccuag cugggacacc 1740
auguggaagu gccugauccg gcugaagccu acacugcacg gaccuacacc ucugcuguac 1800
agacugggca gcgugcagaa ugagguggug cugacccauc cuaucaccaa guacaucaug 1860
gccugcauga gcgccgaccu ggaagugguu aca 1893
<210> 211
<211> 619
<212> PRT
<213> Dengue virus
<400> 211
Ser Gly Val Leu Trp Asp Thr Pro Ser Pro Pro Glu Val Glu Arg Ala
1 5 10 15
Val Leu Asp Asp Gly Ile Tyr Arg Ile Leu Gln Arg Gly Leu Leu Gly
20 25 30
Arg Ser Gln Val Gly Val Gly Val Phe Gln Glu Gly Val Phe His Thr
35 40 45
Met Trp His Val Thr Arg Gly Ala Val Leu Met Tyr Gln Gly Lys Arg
50 55 60
Leu Glu Pro Ser Trp Ala Ser Val Lys Lys Asp Leu Ile Ser Tyr Gly
65 70 75 80
Gly Gly Trp Arg Phe Gln Gly Ser Trp Asn Ala Gly Glu Glu Val Gln
85 90 95
Val Ile Ala Val Glu Pro Gly Lys Asn Pro Lys Asn Val Gln Thr Ala
100 105 110
Pro Gly Thr Phe Lys Thr Pro Glu Gly Glu Val Gly Ala Ile Ala Leu
115 120 125
Asp Phe Lys Pro Gly Thr Ser Gly Ser Pro Ile Val Asn Arg Glu Gly
130 135 140
Lys Ile Val Gly Leu Tyr Gly Asn Gly Val Val Thr Thr Ser Gly Thr
145 150 155 160
Tyr Val Ser Ala Ile Ala Gln Ala Lys Ala Ser Gln Glu Gly Pro Leu
165 170 175
Pro Glu Ile Glu Asp Glu Val Phe Arg Lys Arg Asn Leu Thr Ile Met
180 185 190
Asp Leu His Pro Gly Ser Gly Lys Thr Arg Arg Tyr Leu Pro Ala Ile
195 200 205
Val Arg Glu Ala Ile Arg Arg Asn Val Arg Thr Leu Val Leu Ala Pro
210 215 220
Thr Arg Val Val Ala Ser Glu Met Ala Glu Ala Leu Lys Gly Met Pro
225 230 235 240
Ile Arg Tyr Gln Thr Thr Ala Val Lys Ser Glu His Thr Gly Lys Glu
245 250 255
Ile Val Asp Leu Met Cys His Ala Thr Phe Thr Met Arg Leu Leu Ser
260 265 270
Pro Val Arg Val Pro Asn Tyr Asn Met Ile Ile Met Asp Glu Ala His
275 280 285
Phe Thr Asp Pro Ala Ser Ile Ala Ala Arg Gly Tyr Ile Ser Thr Arg
290 295 300
Val Gly Met Gly Glu Ala Ala Ala Ile Phe Met Thr Ala Thr Pro Pro
305 310 315 320
Gly Ser Val Glu Ala Phe Pro Gln Ser Asn Ala Val Ile Gln Asp Glu
325 330 335
Glu Arg Asp Ile Pro Glu Arg Ser Trp Asn Ser Gly Tyr Asp Trp Ile
340 345 350
Thr Asp Phe Pro Gly Lys Thr Val Trp Phe Val Pro Ser Ile Lys Ser
355 360 365
Gly Asn Asp Ile Ala Asn Cys Leu Arg Lys Asn Gly Lys Arg Val Val
370 375 380
Gln Leu Ser Arg Lys Thr Phe Asp Thr Glu Tyr Gln Lys Thr Lys Asn
385 390 395 400
Asn Asp Trp Asp Tyr Val Val Thr Thr Asp Ile Ser Glu Met Gly Ala
405 410 415
Asn Phe Arg Ala Asp Arg Val Ile Asp Pro Arg Arg Cys Leu Lys Pro
420 425 430
Val Ile Leu Lys Asp Gly Pro Glu Arg Val Ile Leu Ala Gly Pro Met
435 440 445
Pro Val Thr Val Ala Ser Ala Ala Gln Arg Arg Gly Arg Ile Gly Arg
450 455 460
Asn Gln Asn Lys Glu Gly Asp Gln Tyr Ile Tyr Met Gly Gln Pro Leu
465 470 475 480
Asn Asn Asp Glu Asp His Ala His Trp Thr Glu Ala Lys Met Leu Leu
485 490 495
Asp Asn Ile Asn Thr Pro Glu Gly Ile Ile Pro Ala Leu Phe Glu Pro
500 505 510
Glu Arg Glu Lys Ser Ala Ala Ile Asp Gly Glu Tyr Arg Leu Arg Gly
515 520 525
Glu Ala Arg Lys Thr Phe Val Glu Leu Met Arg Arg Gly Asp Leu Pro
530 535 540
Val Trp Leu Ser Tyr Lys Val Ala Ser Glu Gly Phe Gln Tyr Ser Asp
545 550 555 560
Arg Arg Trp Cys Phe Asp Gly Glu Arg Asn Asn Gln Val Leu Glu Glu
565 570 575
Asn Met Asp Val Glu Ile Trp Thr Lys Glu Gly Glu Arg Lys Lys Leu
580 585 590
Arg Pro Arg Trp Leu Asp Ala Arg Thr Tyr Ser Asp Pro Leu Ala Leu
595 600 605
Arg Glu Phe Lys Glu Phe Ala Ala Gly Arg Arg
610 615
<210> 212
<211> 1857
<212> DNA
<213> Dengue virus
<400> 212
tcaggagtgc tatgggacac acccagccct ccagaagtgg aaagagcagt ccttgatgat 60
ggcatttata gaattctcca aagaggattg ttgggcaggt ctcaagtagg agtaggagtt 120
tttcaagaag gcgtgttcca cacaatgtgg cacgtcacca ggggagctgt cctcatgtac 180
caagggaaga gactggaacc aagttgggcc agtgtcaaaa aagacttgat ctcatatgga 240
ggaggttgga ggtttcaagg atcctggaac gcgggagaag aagtgcaggt gattgctgtt 300
gaaccgggga agaaccccaa aaatgtacag acagcgccgg gtaccttcaa gacccctgaa 360
ggcgaagttg gagccatagc tctagacttt aaacccggca catctggatc tcctatcgtg 420
aacagagagg gaaaaatagt aggtctttat ggaaatggag tggtgacaac aagtggtacc 480
tacgtcagcg ccatagctca agctaaagca tcacaagaag ggcctctacc agagattgag 540
gacgaggtgt ttaggaaaag aaacttaaca ataatggacc tacatccagg atcggggaaa 600
acaagaagat atcttccagc catagtccgt gaggccataa gaaggaacgt gcgcacgcta 660
gtcttagctc ccacaagagt tgtcgcttct gaaatggcag aggcgctcaa gggaatgcca 720
ataaggtatc agacaacagc agtgaagagt gaacacacag gaaaagagat agttgacctt 780
atgtgtcacg ccactttcac tatgcgtctc ctgtctcctg tgagagttcc caattataat 840
atgattatca tggatgaagc acattttacc gatccagcca gcatagcagc cagagggtat 900
atctcaaccc gagtgggtat gggtgaagca gctgcgattt tcatgacagc cactcccccc 960
ggatcggtgg aggcctttcc acagagcaat gcagttatcc aagatgagga aagagacatt 1020
cctgaaagat catggaactc aggctatgac tggatcactg atttcccagg taaaacagtc 1080
tggtttgttc caagcatcaa atcaggaaat gacattgcca actgtttaag aaagaatggg 1140
aaacgggtgg tccaattgag cagaaaaact tttgacactg agtaccagaa aacaaaaaat 1200
aacgactggg actatgttgt cacaacagac atatccgaaa tgggagcaaa cttccgagcc 1260
gacagggtaa tagacccgag gcggtgcctg aaaccggtaa tactaaaaga tggcccagag 1320
cgtgtcattc tagccggacc gatgccagtg actgtggcta gcgccgccca gaggagagga 1380
agaattggaa ggaaccaaaa taaggaaggc gatcagtata tttacatggg acagcctcta 1440
aacaatgatg aggaccacgc ccattggaca gaagcaaaaa tgctccttga caacataaac 1500
acaccagaag ggattatccc agccctcttt gagccggaga gagaaaagag tgcagcaata 1560
gacggggaat acagactacg gggtgaagcg aggaaaacgt tcgtggagct catgagaaga 1620
ggagatctac ctgtctggct atcctacaaa gttgcctcag aaggcttcca gtactccgac 1680
agaaggtggt gctttgatgg ggaaaggaac aaccaggtgt tggaggagaa catggacgtg 1740
gagatctgga caaaagaagg agaaagaaag aaactacgac cccgctggct ggatgccaga 1800
acatactctg acccactggc tctgcgcgaa ttcaaagagt tcgcagcagg aagaaga 1857
<210> 213
<211> 1857
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding DENV NS3 protein
<400> 213
tctggcgtgc tgtgggatac accttctcca ccagaggtgg aaagagccgt gctggacgac 60
ggcatctacc ggattctgca gagaggactg ctgggcagat ctcaagttgg cgtgggcgtg 120
ttccaagaag gggtgttcca caccatgtgg cacgtgacaa gaggcgccgt gctgatgtac 180
cagggcaaga gactggaacc tagctgggcc agcgtgaaga aggacctgat ctcttacggc 240
ggaggctggc ggtttcaagg ctcttggaat gccggcgaag aggtgcaagt gatcgccgtg 300
gaacccggca agaaccccaa gaacgttcag acagcccctg gcaccttcaa gacccctgaa 360
ggcgaagtgg gagctatcgc cctggatttc aagcctggca caagcggcag ccccatcgtg 420
aacagagaag gcaagatcgt gggcctgtac ggcaatggcg tggtcaccac atctggcacc 480
tacgtgtcag ccattgctca ggccaaggcc tctcaagagg gacccctgcc tgagatcgag 540
gacgaggtgt tccggaagcg gaacctgacc atcatggatc tgcaccctgg cagcggcaag 600
accagaagat atctgcccgc cattgtgcgc gaggccatcc gaagaaatgt gcggacactg 660
gtgctggccc ctacaagagt ggtggcctct gaaatggccg aggctctgaa gggcatgcct 720
atcagatacc agaccaccgc cgtgaagtct gagcacaccg gcaaagaaat cgtggacctg 780
atgtgccacg ccaccttcac catgagactg ctgagccctg tgcgggtgcc caactacaac 840
atgatcatca tggacgaggc ccacttcaca gaccccgcct ctattgccgc cagaggctac 900
atctctacca gagtcggcat gggagaagcc gccgctatct tcatgacagc cacacctcca 960
ggcagcgtgg aagcctttcc tcagtccaat gccgtgatcc aggacgaaga gagagacatc 1020
cccgagcgga gctggaacag cggctacgac tggatcaccg actttccagg caagaccgtt 1080
tggttcgtgc ccagcatcaa gagcggcaac gatatcgcca actgcctgcg gaagaacggc 1140
aagagagtgg tgcagctgag cagaaagacc ttcgacaccg agtaccaaaa gaccaagaac 1200
aacgactggg actacgtcgt gaccaccgac atctctgaga tgggcgccaa cttcagggcc 1260
gacagagtga tcgaccctcg gagatgtctg aagcccgtga tcctgaagga cggccctgag 1320
agagtgattc tggccggacc tatgcctgtg acagtggctt ctgccgctca gagaagaggc 1380
cggatcggcc ggaatcagaa caaagagggc gaccagtaca tctacatggg ccagcctctg 1440
aacaacgatg aggatcacgc ccactggacc gaggccaaga tgctgctgga caacatcaac 1500
acccctgagg gcatcatccc cgctctgttc gagcccgaga gagagaagtc tgccgcaatc 1560
gacggcgagt acagactgag aggcgaggcc agaaagacat ttgtggaact gatgcggaga 1620
ggcgacctgc ctgtgtggct gagttacaag gtggccagcg agggcttcca gtacagcgat 1680
agaagatggt gcttcgatgg cgagcggaac aaccaggtgc tggaagagaa catggacgtg 1740
gaaatctgga ccaaagaagg cgagcgcaag aaactgcggc ccagatggct ggatgcccgg 1800
acatattctg accctctggc tctgcgcgag ttcaaagagt ttgccgccgg aagaaga 1857
<210> 214
<211> 1857
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding DENV NS3 protein
<400> 214
ucuggcgugc ugugggauac accuucucca ccagaggugg aaagagccgu gcuggacgac 60
ggcaucuacc ggauucugca gagaggacug cugggcagau cucaaguugg cgugggcgug 120
uuccaagaag ggguguucca caccaugugg cacgugacaa gaggcgccgu gcugauguac 180
cagggcaaga gacuggaacc uagcugggcc agcgugaaga aggaccugau cucuuacggc 240
ggaggcuggc gguuucaagg cucuuggaau gccggcgaag aggugcaagu gaucgccgug 300
gaacccggca agaaccccaa gaacguucag acagccccug gcaccuucaa gaccccugaa 360
ggcgaagugg gagcuaucgc ccuggauuuc aagccuggca caagcggcag ccccaucgug 420
aacagagaag gcaagaucgu gggccuguac ggcaauggcg uggucaccac aucuggcacc 480
uacgugucag ccauugcuca ggccaaggcc ucucaagagg gaccccugcc ugagaucgag 540
gacgaggugu uccggaagcg gaaccugacc aucauggauc ugcacccugg cagcggcaag 600
accagaagau aucugcccgc cauugugcgc gaggccaucc gaagaaaugu gcggacacug 660
gugcuggccc cuacaagagu gguggccucu gaaauggccg aggcucugaa gggcaugccu 720
aucagauacc agaccaccgc cgugaagucu gagcacaccg gcaaagaaau cguggaccug 780
augugccacg ccaccuucac caugagacug cugagcccug ugcgggugcc caacuacaac 840
augaucauca uggacgaggc ccacuucaca gaccccgccu cuauugccgc cagaggcuac 900
aucucuacca gagucggcau gggagaagcc gccgcuaucu ucaugacagc cacaccucca 960
ggcagcgugg aagccuuucc ucaguccaau gccgugaucc aggacgaaga gagagacauc 1020
cccgagcgga gcuggaacag cggcuacgac uggaucaccg acuuuccagg caagaccguu 1080
ugguucgugc ccagcaucaa gagcggcaac gauaucgcca acugccugcg gaagaacggc 1140
aagagagugg ugcagcugag cagaaagacc uucgacaccg aguaccaaaa gaccaagaac 1200
aacgacuggg acuacgucgu gaccaccgac aucucugaga ugggcgccaa cuucagggcc 1260
gacagaguga ucgacccucg gagaugucug aagcccguga uccugaagga cggcccugag 1320
agagugauuc uggccggacc uaugccugug acaguggcuu cugccgcuca gagaagaggc 1380
cggaucggcc ggaaucagaa caaagagggc gaccaguaca ucuacauggg ccagccucug 1440
aacaacgaug aggaucacgc ccacuggacc gaggccaaga ugcugcugga caacaucaac 1500
accccugagg gcaucauccc cgcucuguuc gagcccgaga gagagaaguc ugccgcaauc 1560
gacggcgagu acagacugag aggcgaggcc agaaagacau uuguggaacu gaugcggaga 1620
ggcgaccugc cuguguggcu gaguuacaag guggccagcg agggcuucca guacagcgau 1680
agaagauggu gcuucgaugg cgagcggaac aaccaggugc uggaagagaa cauggacgug 1740
gaaaucugga ccaaagaagg cgagcgcaag aaacugcggc ccagauggcu ggaugcccgg 1800
acauauucug acccucuggc ucugcgcgag uucaaagagu uugccgccgg aagaaga 1857
<210> 215
<211> 183
<212> PRT
<213> Enterovirus 71
<400> 215
Gly Pro Ser Leu Asp Phe Ala Leu Ser Leu Leu Arg Arg Asn Val Arg
1 5 10 15
Gln Val Gln Thr Asp Gln Gly His Phe Thr Met Leu Gly Val Arg Asp
20 25 30
Arg Leu Ala Val Leu Pro Arg His Ser Gln Pro Gly Lys Thr Ile Trp
35 40 45
Ile Glu His Lys Leu Val Asn Val Leu Asp Ala Val Glu Leu Val Asp
50 55 60
Glu Gln Gly Val Asn Leu Glu Leu Thr Leu Ile Thr Leu Asp Thr Asn
65 70 75 80
Glu Lys Phe Arg Asp Ile Thr Lys Phe Ile Pro Glu Asn Ile Ser Thr
85 90 95
Ala Ser Asp Ala Thr Leu Val Ile Asn Thr Glu His Met Pro Ser Met
100 105 110
Phe Val Pro Val Gly Asp Val Val Gln Tyr Gly Phe Leu Asn Leu Ser
115 120 125
Gly Lys Pro Thr His Arg Thr Met Met Tyr Asn Phe Pro Thr Lys Ala
130 135 140
Gly Gln Cys Gly Gly Val Val Thr Ser Val Gly Lys Val Ile Gly Ile
145 150 155 160
His Ile Gly Gly Asn Gly Arg Gln Gly Phe Cys Ala Gly Leu Lys Arg
165 170 175
Ser Tyr Phe Ala Ser Glu Gln
180
<210> 216
<211> 549
<212> DNA
<213> Enterovirus 71
<400> 216
ggcccgagcc ttgattttgc tctctcccta ctgaggagga acgtcaggca agtccaaaca 60
gaccaggggc atttcaccat gttgggtgtt agggatcgct tagcagtcct cccacgccac 120
tcacaacccg gcaaaactat ttggattgag cacaaactcg tgaacgtcct tgatgcagtt 180
gaattggtgg atgagcaagg agtcaacctg gaattaaccc tcatcactct tgataccaac 240
gagaagttta gggatatcac caaattcatc ccggaaaata ttagcactgc tagtgatgcc 300
accctagtga tcaacacgga gcacatgccc tcgatgtttg tcccggtggg tgacgttgtg 360
cagtatggtt tcctgaatct cagtggtaag cctactcatc gcaccatgat gtacaacttt 420
cctactaagg cagggcaatg tggaggggtg gtgacatcag ttggaaaagt catcggtata 480
cacataggtg gcaacggtag acaaggattt tgtgcaggtc ttaagagaag ctactttgcc 540
agcgagcaa 549
<210> 217
<211> 549
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding EV71 3Cpro protein
<400> 217
ggcccttctc tggattttgc cctgagcctg ctgcggagaa atgtgcgcca ggtgcagaca 60
gatcagggcc actttacaat gctgggcgtc agagacagac tggccgtgct gcctagacac 120
tctcagcctg gcaagaccat ctggatcgag cacaagctgg tcaacgtgct ggacgccgtg 180
gaactggttg atgagcaggg cgtgaacctg gaactgaccc tgatcaccct ggacaccaac 240
gagaagttcc gggacatcac caagttcatc cccgagaaca tcagcaccgc cagcgacgcc 300
acactggtca tcaataccga gcacatgccc agcatgttcg tgcctgtggg agatgtggtg 360
cagtacggct tcctgaacct gagcggcaag cccacacacc ggaccatgat gtacaacttc 420
cctaccaagg ccggccagtg cggcggagtg gttacatctg tgggcaaagt gatcggcatc 480
cacatcggcg gcaatggcag acagggattt tgtgccggcc tgaagagaag ctacttcgcc 540
tctgaacag 549
<210> 218
<211> 549
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding EV71 3Cpro protein
<400> 218
ggcccuucuc uggauuuugc ccugagccug cugcggagaa augugcgcca ggugcagaca 60
gaucagggcc acuuuacaau gcugggcguc agagacagac uggccgugcu gccuagacac 120
ucucagccug gcaagaccau cuggaucgag cacaagcugg ucaacgugcu ggacgccgug 180
gaacugguug augagcaggg cgugaaccug gaacugaccc ugaucacccu ggacaccaac 240
gagaaguucc gggacaucac caaguucauc cccgagaaca ucagcaccgc cagcgacgcc 300
acacugguca ucaauaccga gcacaugccc agcauguucg ugccuguggg agauguggug 360
caguacggcu uccugaaccu gagcggcaag cccacacacc ggaccaugau guacaacuuc 420
ccuaccaagg ccggccagug cggcggagug guuacaucug ugggcaaagu gaucggcauc 480
cacaucggcg gcaauggcag acagggauuu ugugccggcc ugaagagaag cuacuucgcc 540
ucugaacag 549
<210> 219
<211> 201
<212> PRT
<213> Foot-and-mouth disease virus
<400> 219
Met His Thr Thr Asp Cys Phe Ile Ala Leu Val His Ala Ile Arg Glu
1 5 10 15
Ile Arg Ala Leu Phe Leu Pro Arg Thr Thr Gly Lys Met Glu Leu Thr
20 25 30
Leu His Asn Gly Glu Lys Lys Thr Phe Tyr Ser Arg Pro Asn Asn His
35 40 45
Asp Asn Cys Trp Leu Asn Thr Ile Leu Gln Leu Phe Arg Tyr Val Asp
50 55 60
Glu Pro Phe Phe Asp Trp Val Tyr Asn Ser Pro Glu Asn Leu Thr Leu
65 70 75 80
Glu Ala Ile Asn Gln Leu Glu Glu Leu Thr Gly Leu Glu Leu His Glu
85 90 95
Gly Gly Pro Pro Ala Leu Val Ile Trp Asn Ile Lys His Leu Leu His
100 105 110
Thr Gly Ile Gly Thr Ala Ser Arg Pro Ser Glu Val Cys Met Val Asp
115 120 125
Gly Thr Asp Met Cys Leu Ala Asp Phe His Ala Gly Ile Phe Leu Lys
130 135 140
Gly Gln Glu His Ala Val Phe Ala Cys Val Thr Ser Asn Gly Trp Tyr
145 150 155 160
Ala Ile Asp Asp Glu Glu Phe Tyr Pro Trp Thr Pro Asp Pro Ser Asp
165 170 175
Val Leu Val Phe Val Pro Tyr Asp Gln Glu Pro Leu Asn Gly Asp Trp
180 185 190
Lys Ala Met Val Gln Arg Lys Leu Lys
195 200
<210> 220
<211> 603
<212> DNA
<213> Foot-and-mouth disease virus
<400> 220
atgcatacaa ctgactgttt tatcgctttg gtgcacgcta tcagagagat cagagcactt 60
tttctaccac gaaccacagg aaagatggaa ctcaccctgc acaacggcga gaaaaagact 120
ttttactcta gacccaacaa ccacgacaac tgctggttga acaccatcct tcagttgttc 180
aggtatgtcg atgaaccctt cttcgactgg gtctacaact cgcccgagaa cctcacgctt 240
gaagccatca accaattgga ggaactcaca ggacttgagt tgcacgaggg cggaccgcct 300
gcccttgtga tctggaacat caaacacttg ctccacaccg gcatcggcac cgcctcacga 360
cccagtgagg tgtgtatggt ggacggcacg gacatgtgtc ttgctgactt ccacgcaggc 420
attttcctga agggacagga acacgcagtc tttgcgtgtg tcacctccaa cgggtggtac 480
gcgattgacg acgaggaatt ttacccctgg acgcctgacc cgtcagacgt cctggtgttt 540
gtcccgtacg atcaagaacc actcaacggg gactggaaag cgatggttca gaggaagctt 600
aag 603
<210> 221
<211> 603
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding FMDV Lpro protein
<400> 221
atgcacacca ccgactgctt tatcgccctg gtgcacgcca tcagagagat cagagccctg 60
ttcctgcctc ggaccaccgg caagatggaa ctgacactgc acaacggcga gaagaaaacc 120
ttctacagca gacccaacaa ccacgacaac tgctggctga acaccatcct gcagctgttc 180
agatacgtgg acgagccctt cttcgactgg gtgtacaaca gccccgagaa tctgaccctg 240
gaagccatca accagctgga agaactgacc ggcctggaac tgcatgaagg cggacctcca 300
gctctggtca tctggaacat caaacatctg ctgcacaccg gcatcggcac cgcctctaga 360
ccatctgaag tgtgcatggt ggacggcacc gatatgtgcc tggccgattt tcacgccggc 420
atctttctga agggccaaga gcatgccgtg ttcgcctgcg tgacaagcaa tggatggtac 480
gccatcgacg acgaggaatt ctacccctgg acacccgatc ctagcgacgt gctggtgttc 540
gtgccctacg atcaagagcc cctgaacggc gattggaagg ccatggtgca gcggaagctg 600
aag 603
<210> 222
<211> 603
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding FMDV Lpro protein
<400> 222
augcacacca ccgacugcuu uaucgcccug gugcacgcca ucagagagau cagagcccug 60
uuccugccuc ggaccaccgg caagauggaa cugacacugc acaacggcga gaagaaaacc 120
uucuacagca gacccaacaa ccacgacaac ugcuggcuga acaccauccu gcagcuguuc 180
agauacgugg acgagcccuu cuucgacugg guguacaaca gccccgagaa ucugacccug 240
gaagccauca accagcugga agaacugacc ggccuggaac ugcaugaagg cggaccucca 300
gcucugguca ucuggaacau caaacaucug cugcacaccg gcaucggcac cgccucuaga 360
ccaucugaag ugugcauggu ggacggcacc gauaugugcc uggccgauuu ucacgccggc 420
aucuuucuga agggccaaga gcaugccgug uucgccugcg ugacaagcaa uggaugguac 480
gccaucgacg acgaggaauu cuaccccugg acacccgauc cuagcgacgu gcugguguuc 540
gugcccuacg aucaagagcc ccugaacggc gauuggaagg ccauggugca gcggaagcug 600
aag 603
<210> 223
<211> 213
<212> PRT
<213> Foot-and-mouth disease virus
<400> 223
Ser Gly Ala Pro Pro Thr Asp Leu Gln Lys Met Val Met Gly Asn Thr
1 5 10 15
Lys Pro Val Glu Leu Ile Leu Asp Gly Lys Thr Val Ala Ile Cys Cys
20 25 30
Ala Thr Gly Val Phe Gly Thr Ala Tyr Leu Val Pro Arg His Leu Phe
35 40 45
Ala Glu Lys Tyr Asp Lys Ile Met Leu Asp Gly Arg Ala Met Thr Asp
50 55 60
Ser Asp Tyr Arg Val Phe Glu Phe Glu Ile Lys Val Lys Gly Gln Asp
65 70 75 80
Met Leu Ser Asp Ala Ala Leu Met Val Leu His Arg Gly Asn Arg Val
85 90 95
Arg Asp Ile Thr Lys His Phe Arg Asp Thr Ala Arg Met Lys Lys Gly
100 105 110
Thr Pro Val Val Gly Val Ile Asn Asn Ala Asp Val Gly Arg Leu Ile
115 120 125
Phe Ser Gly Glu Ala Leu Thr Tyr Lys Asp Ile Val Val Cys Met Asp
130 135 140
Gly Asp Thr Met Pro Gly Leu Phe Ala Tyr Arg Ala Ala Thr Lys Ala
145 150 155 160
Gly Tyr Cys Gly Gly Ala Val Leu Ala Lys Asp Gly Ala Asp Thr Phe
165 170 175
Ile Val Gly Thr His Ser Ala Gly Gly Asn Gly Val Gly Tyr Cys Ser
180 185 190
Cys Val Ser Arg Ser Met Leu Leu Lys Met Lys Ala His Ile Asp Pro
195 200 205
Glu Pro His His Glu
210
<210> 224
<211> 639
<212> DNA
<213> Foot-and-mouth disease virus
<400> 224
agtggtgccc ccccgaccga cttgcaaaag atggtcatgg gcaacacaaa gcctgttgag 60
ctcatcctcg acgggaagac agtagccatc tgctgtgcta ctggagtgtt tggcactgcc 120
tacctcgtgc ctcgtcatct tttcgctgag aagtatgaca agatcatgtt ggacggcaga 180
gccatgacag acagtgacta cagagtgttt gagttcgaga tcaaagtaaa aggacaggac 240
atgctctcag acgccgcact catggtgctc caccgtggga accgcgtgag agacatcacg 300
aagcactttc gtgacacagc aagaatgaag aaaggcaccc ccgttgtcgg cgtgatcaac 360
aatgccgatg tcgggagact gattttctct ggcgaagccc ttacctacaa agacattgta 420
gtgtgcatgg acggagacac catgcccggg ctttttgcct acagagccgc cactaaggca 480
ggctactgcg ggggagccgt tctcgctaag gacggggctg acactttcat cgttggcact 540
cactctgcag gaggtaatgg agttggatac tgctcatgcg tttccaggtc catgcttctc 600
aagatgaagg cacacattga ccctgagccg caccacgag 639
<210> 225
<211> 639
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding FMDV 3Cpro protein
<400> 225
tctggtgccc ctcctaccga cctgcagaaa atggtcatgg gcaacaccaa gcctgtggaa 60
ctgatcctgg acggcaagac cgtggccatc tgttgtgcaa caggcgtgtt cggcaccgcc 120
tacctggttc ctagacacct gttcgccgag aagtacgaca agatcatgct ggatggcaga 180
gccatgaccg acagcgacta ccgggtgttc gagttcgaga tcaaagtgaa aggccaggac 240
atgctgagcg acgccgctct gatggttctg cacagaggca acagagtgcg ggacatcacc 300
aagcacttcc gggacaccgc cagaatgaag aaaggcacac ctgtcgtggg cgtgatcaac 360
aacgctgacg tgggcagact gatcttctct ggcgaggccc tgacctacaa ggacatcgtc 420
gtgtgcatgg acggcgacac aatgcctggc ctgtttgcct atagagccgc cacaaaggcc 480
ggctactgtg gcggagctgt gctggctaaa gatggcgccg ataccttcat cgtgggcaca 540
cattctgccg gcggaaatgg cgtgggctac tgctcttgtg tgtccagatc catgctgctg 600
aagatgaagg cccacatcga ccccgagcct caccatgaa 639
<210> 226
<211> 639
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding FMDV 3Cpro protein
<400> 226
ucuggugccc cuccuaccga ccugcagaaa auggucaugg gcaacaccaa gccuguggaa 60
cugauccugg acggcaagac cguggccauc uguugugcaa caggcguguu cggcaccgcc 120
uaccugguuc cuagacaccu guucgccgag aaguacgaca agaucaugcu ggauggcaga 180
gccaugaccg acagcgacua ccggguguuc gaguucgaga ucaaagugaa aggccaggac 240
augcugagcg acgccgcucu gaugguucug cacagaggca acagagugcg ggacaucacc 300
aagcacuucc gggacaccgc cagaaugaag aaaggcacac cugucguggg cgugaucaac 360
aacgcugacg ugggcagacu gaucuucucu ggcgaggccc ugaccuacaa ggacaucguc 420
gugugcaugg acggcgacac aaugccuggc cuguuugccu auagagccgc cacaaaggcc 480
ggcuacugug gcggagcugu gcuggcuaaa gauggcgccg auaccuucau cgugggcaca 540
cauucugccg gcggaaaugg cgugggcuac ugcucuugug uguccagauc caugcugcug 600
aagaugaagg cccacaucga ccccgagccu caccaugaa 639
<210> 227
<211> 316
<212> PRT
<213> Toscana virus
<400> 227
Met Gln Ser Arg Ala Val Ile Leu Lys Tyr Arg Ser Gly Ser Gly His
1 5 10 15
Lys Arg Ser Leu Pro Arg Phe Tyr Ile Asp Cys Asp Leu Asp Thr Phe
20 25 30
Asp Phe Glu Lys Asp Cys Ser Leu Ile Glu Asn Glu Phe Pro Ile Tyr
35 40 45
Ile Asn Asn Tyr Lys Val Val Tyr Lys Ser Lys Pro Thr Leu Ser His
50 55 60
Phe Leu Ile Glu Lys Glu Phe Pro Ala Val Leu Gly Pro Gly Met Ile
65 70 75 80
Ser Ala Val Arg Thr Arg Leu Tyr Glu Pro Thr Met Arg Glu Leu Tyr
85 90 95
Gln Glu Ser Ile His Gln Leu Lys Arg Ser Asn Lys Lys Tyr Leu Leu
100 105 110
Ser Ala Leu Arg Trp Pro Thr Gly Ile Pro Thr Leu Glu Phe Ile Asp
115 120 125
Tyr Tyr Phe Glu Glu Leu Leu Phe Leu Ser Glu Phe Asp Pro Gly Ser
130 135 140
Ile Gln Arg Tyr Leu Lys Leu Leu Val Lys Ala Ser Gly Leu Tyr Asn
145 150 155 160
Ser Thr Asn Glu Glu Gln Ile Val Glu Ile His Arg Arg Val Leu Ile
165 170 175
Glu Gly Lys Lys His Gly Leu Thr Ala Phe Asp Leu Pro Gly Asn Asp
180 185 190
Ile Leu Gly Asp Ile Cys Val Val Gln Ala Ala Arg Val Thr Arg Leu
195 200 205
Val Ala Lys Thr Phe Ser Lys Met Thr Arg Asp Thr His Leu Met Ile
210 215 220
Tyr Phe Ser Ile Ser Pro Val Glu Leu Val Leu Ser Lys Leu Asp Lys
225 230 235 240
Lys Gly Asp Lys Arg Ala Lys Ala Lys Gly Leu Met Ser Met Ser Ala
245 250 255
Ala Arg Ser Tyr Asp Tyr Phe Met Arg Thr Asp Leu Gly Phe Arg Glu
260 265 270
Thr Ala Leu Ser Thr Phe Trp Ala Lys Asp Trp Pro Thr Pro Gln Glu
275 280 285
Thr Ile Leu Ser Asp Lys Arg Cys Leu Lys Glu Asp Met Arg Val Thr
290 295 300
Lys Trp Leu Pro Ser Pro Pro His Tyr Pro Pro Leu
305 310 315
<210> 228
<211> 948
<212> DNA
<213> Toscana virus
<400> 228
atgcaatcca gagctgtcat cttgaagtat agatctggtt caggccacaa gaggtctttg 60
cccaggttct acatagactg tgatttggac acctttgatt ttgagaagga ttgctctctg 120
attgagaatg agttccccat ttacataaac aattataagg tggtctataa gtcaaagcca 180
actctctcac atttcctcat tgagaaggag tttcctgctg tgctggggcc tggtatgatc 240
agtgcagttc gaaccagact ttacgagcca actatgagag agctctacca ggaatcgatt 300
caccaactaa agaggagcaa caagaaatac cttttgtctg ctctcaggtg gcccacaggg 360
attcctactc tagagtttat agactattac ttcgaggagc tcctgttctt gtcagagttt 420
gacccggggt ctatccagag atacctgaaa ttactggtta aggcctctgg gctttacaac 480
tccactaatg aggagcagat agtggagatt cacagacgag tgctcataga aggcaaaaag 540
cacggattga ctgcttttga tctcccagga aatgacatcc ttggagacat ctgtgtggtc 600
caagcagcac gggtgacaag actggttgct aagacattct ctaagatgac cagagacacc 660
catctgatga tatacttctc gataagccca gttgagttgg ttttgagtaa acttgataag 720
aaaggggaca agagggctaa agcaaaaggg ttgatgtcta tgagtgccgc taggtcttat 780
gactatttta tgagaactga cttgggattc agagagactg ctctttccac cttttgggct 840
aaggactggc ctaccccaca agagaccatt ctatctgaca aacgatgcct taaagaagac 900
atgagagtga caaagtggct gcctagtccc ccccactacc caccctta 948
<210> 229
<211> 948
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding Toscana virus NSS protein
<400> 229
atgcagagca gagccgtgat cctgaagtac agaagcggca gcggccacaa gagaagcctg 60
cctagattct acatcgactg cgacctggac accttcgact tcgagaagga ctgcagcctg 120
atcgagaacg agttccccat ctacatcaac aactacaagg tggtgtacaa gagcaagcca 180
actctgagcc acttcctcat cgagaaagaa ttccctgccg tgctcggccc tggcatgatc 240
tctgccgtta gaaccagact gtacgagccc accatgagag agctgtacca agagagcatc 300
caccagctga agcggagcaa caagaagtac ctgctgagcg ccctgagatg gcccacaggc 360
attcccacac tggaattcat cgactactac ttcgaggaac tgctgttcct gagcgagttc 420
gaccctggca gcatccagag atacctgaag ctgctggtca aggccagcgg cctgtacaac 480
agcaccaacg aggaacagat cgtggaaatc caccggcggg tgctgatcga gggaaagaag 540
cacggactga ccgccttcga cctgcctggc aatgatatcc tgggcgacat ctgcgtggtg 600
caggccgcta gagtgacaag actggtggcc aagaccttca gcaagatgac cagagacacc 660
cacctgatga tctacttcag catcagcccc gtggaactgg tgctgagcaa gctggacaag 720
aagggcgaca agagagccaa ggccaagggc ctgatgagca tgtctgccgc cagatcctac 780
gactacttca tgagaaccga cctgggcttc agagagacag ccctgagcac cttctgggcc 840
aaagactggc ccacacctca agagacaatc ctgtccgaca agcggtgcct gaaagaagat 900
atgcgggtca ccaagtggct gccctctcca cctcattacc ctccactt 948
<210> 230
<211> 948
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding Toscana virus NSS protein
<400> 230
augcagagca gagccgugau ccugaaguac agaagcggca gcggccacaa gagaagccug 60
ccuagauucu acaucgacug cgaccuggac accuucgacu ucgagaagga cugcagccug 120
aucgagaacg aguuccccau cuacaucaac aacuacaagg ugguguacaa gagcaagcca 180
acucugagcc acuuccucau cgagaaagaa uucccugccg ugcucggccc uggcaugauc 240
ucugccguua gaaccagacu guacgagccc accaugagag agcuguacca agagagcauc 300
caccagcuga agcggagcaa caagaaguac cugcugagcg cccugagaug gcccacaggc 360
auucccacac uggaauucau cgacuacuac uucgaggaac ugcuguuccu gagcgaguuc 420
gacccuggca gcauccagag auaccugaag cugcugguca aggccagcgg ccuguacaac 480
agcaccaacg aggaacagau cguggaaauc caccggcggg ugcugaucga gggaaagaag 540
cacggacuga ccgccuucga ccugccuggc aaugauaucc ugggcgacau cugcguggug 600
caggccgcua gagugacaag acugguggcc aagaccuuca gcaagaugac cagagacacc 660
caccugauga ucuacuucag caucagcccc guggaacugg ugcugagcaa gcuggacaag 720
aagggcgaca agagagccaa ggccaagggc cugaugagca ugucugccgc cagauccuac 780
gacuacuuca ugagaaccga ccugggcuuc agagagacag cccugagcac cuucugggcc 840
aaagacuggc ccacaccuca agagacaauc cuguccgaca agcggugccu gaaagaagau 900
augcggguca ccaaguggcu gcccucucca ccucauuacc cuccacuu 948
<210> 231
<211> 230
<212> PRT
<213> Influenza A virus
<400> 231
Met Asp Pro Asn Thr Val Ser Ser Phe Gln Val Asp Cys Phe Leu Trp
1 5 10 15
His Val Arg Lys Arg Val Ala Asp Gln Glu Leu Gly Asp Ala Pro Phe
20 25 30
Leu Asp Arg Leu Arg Arg Asp Gln Lys Ser Leu Arg Gly Arg Gly Ser
35 40 45
Thr Leu Gly Leu Asp Ile Glu Thr Ala Thr Arg Ala Gly Lys Gln Ile
50 55 60
Val Glu Arg Ile Leu Lys Glu Glu Ser Asp Glu Ala Leu Lys Met Thr
65 70 75 80
Met Ala Ser Val Pro Ala Ser Arg Tyr Leu Thr Asp Met Thr Leu Glu
85 90 95
Glu Met Ser Arg Glu Trp Ser Met Leu Ile Pro Lys Gln Lys Val Ala
100 105 110
Gly Pro Leu Cys Ile Arg Met Asp Gln Ala Ile Met Asp Lys Asn Ile
115 120 125
Ile Leu Lys Ala Asn Phe Ser Val Ile Phe Asp Arg Leu Glu Thr Leu
130 135 140
Ile Leu Leu Arg Ala Phe Thr Glu Glu Gly Ala Ile Val Gly Glu Ile
145 150 155 160
Ser Pro Leu Pro Ser Leu Pro Gly His Thr Ala Glu Asp Val Lys Asn
165 170 175
Ala Val Gly Val Leu Ile Gly Gly Leu Glu Trp Asn Asp Asn Thr Val
180 185 190
Arg Val Ser Glu Thr Leu Gln Arg Phe Ala Trp Arg Ser Ser Asn Glu
195 200 205
Asn Gly Arg Pro Pro Leu Thr Pro Lys Gln Lys Arg Glu Met Ala Gly
210 215 220
Thr Ile Arg Ser Glu Val
225 230
<210> 232
<211> 693
<212> DNA
<213> Influenza A virus
<400> 232
atggatccaa acactgtgtc aagctttcag gtagattgct ttctttggca tgtccgcaaa 60
cgagttgcag accaagaact aggtgatgcc ccattccttg atcggcttcg ccgagatcag 120
aaatccctaa gaggaagggg cagcactctt ggtctggaca tcgagacagc cacacgtgct 180
ggaaagcaga tagtggagcg gattctgaaa gaagaatccg atgaggcact taaaatgacc 240
atggcctctg tacctgcgtc gcgttaccta accgacatga ctcttgagga aatgtcaagg 300
gaatggtcca tgctcatacc caagcagaaa gtggcaggcc ctctttgtat cagaatggac 360
caggcgatca tggataaaaa catcatactg aaagcgaact tcagtgtgat ttttgaccgg 420
ctggagactc taatattgct aagggctttc accgaagagg gagcaattgt tggcgaaatt 480
tcaccattgc cttctcttcc aggacatact gctgaggatg tcaaaaatgc agttggagtc 540
ctcatcggag gacttgaatg gaatgataac acagttcgag tctctgaaac tctacagaga 600
ttcgcttgga gaagcagtaa tgagaatggg agacctccac tcactccaaa acagaaacga 660
gaaatggcgg gaacaattag gtcagaagtt tga 693
<210> 233
<211> 693
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding Influenza A Non-structural protein 1
<400> 233
atggacccca ataccgtcag cagcttccag gtggactgct tcctgtggca cgtgcggaaa 60
agagtggccg atcaagaact gggcgacgcc ccattcctgg acagactgag aagagatcag 120
aagtccctga gaggcagagg cagcacactg ggcctcgaca ttgagacagc cacaagagcc 180
ggcaagcaga tcgtggaacg gatcctgaaa gaggaaagcg acgaggccct gaagatgacc 240
atggcctctg tgcctgccag cagatacctg accgacatga ccctggaaga gatgagccgc 300
gagtggtcca tgctgatccc caagcagaaa gtggccggac ctctgtgcat cagaatggat 360
caggccatca tggacaagaa catcatcctg aaggccaact tcagcgtgat cttcgaccgg 420
ctggaaaccc tgatcctgct gagagccttt accgaagagg gcgccatcgt gggagagatc 480
agtcctctgc cttctctgcc tggacacacc gccgaggatg tgaagaatgc tgtgggcgtg 540
ctgatcggcg gcctggaatg gaacgataac accgtcagag tgtccgagac actgcagaga 600
tttgcctggc ggagcagcaa cgagaacggc agacctcctc tgacacctaa gcagaaaaga 660
gagatggccg gcaccatccg cagcgaagtg taa 693
<210> 234
<211> 693
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding Influenza A Non-structural protein 1
<400> 234
auggacccca auaccgucag cagcuuccag guggacugcu uccuguggca cgugcggaaa 60
agaguggccg aucaagaacu gggcgacgcc ccauuccugg acagacugag aagagaucag 120
aagucccuga gaggcagagg cagcacacug ggccucgaca uugagacagc cacaagagcc 180
ggcaagcaga ucguggaacg gauccugaaa gaggaaagcg acgaggcccu gaagaugacc 240
auggccucug ugccugccag cagauaccug accgacauga cccuggaaga gaugagccgc 300
gaguggucca ugcugauccc caagcagaaa guggccggac cucugugcau cagaauggau 360
caggccauca uggacaagaa caucauccug aaggccaacu ucagcgugau cuucgaccgg 420
cuggaaaccc ugauccugcu gagagccuuu accgaagagg gcgccaucgu gggagagauc 480
aguccucugc cuucucugcc uggacacacc gccgaggaug ugaagaaugc ugugggcgug 540
cugaucggcg gccuggaaug gaacgauaac accgucagag uguccgagac acugcagaga 600
uuugccuggc ggagcagcaa cgagaacggc agaccuccuc ugacaccuaa gcagaaaaga 660
gagauggccg gcaccauccg cagcgaagug uaa 693
<210> 235
<211> 422
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 235
Met Ser Asp Asn Gly Pro Gln Ser Asn Gln Arg Ser Ala Pro Arg Ile
1 5 10 15
Thr Phe Gly Gly Pro Thr Asp Ser Thr Asp Asn Asn Gln Asn Gly Gly
20 25 30
Arg Asn Gly Ala Arg Pro Lys Gln Arg Arg Pro Gln Gly Leu Pro Asn
35 40 45
Asn Thr Ala Ser Trp Phe Thr Ala Leu Thr Gln His Gly Lys Glu Glu
50 55 60
Leu Arg Phe Pro Arg Gly Gln Gly Val Pro Ile Asn Thr Asn Ser Gly
65 70 75 80
Pro Asp Asp Gln Ile Gly Tyr Tyr Arg Arg Ala Thr Arg Arg Val Arg
85 90 95
Gly Gly Asp Gly Lys Met Lys Glu Leu Ser Pro Arg Trp Tyr Phe Tyr
100 105 110
Tyr Leu Gly Thr Gly Pro Glu Ala Ser Leu Pro Tyr Gly Ala Asn Lys
115 120 125
Glu Gly Ile Val Trp Val Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys
130 135 140
Asp His Ile Gly Thr Arg Asn Pro Asn Asn Asn Ala Ala Thr Val Leu
145 150 155 160
Gln Leu Pro Gln Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala Glu Gly
165 170 175
Ser Arg Gly Gly Ser Gln Ala Ser Ser Arg Ser Ser Ser Arg Ser Arg
180 185 190
Gly Asn Ser Arg Asn Ser Thr Pro Gly Ser Ser Arg Gly Asn Ser Pro
195 200 205
Ala Arg Met Ala Ser Gly Gly Gly Glu Thr Ala Leu Ala Leu Leu Leu
210 215 220
Leu Asp Arg Leu Asn Gln Leu Glu Ser Lys Val Ser Gly Lys Gly Gln
225 230 235 240
Gln Gln Gln Gly Gln Thr Val Thr Lys Lys Ser Ala Ala Glu Ala Ser
245 250 255
Lys Lys Pro Arg Gln Lys Arg Thr Ala Thr Lys Gln Tyr Asn Val Thr
260 265 270
Gln Ala Phe Gly Arg Arg Gly Pro Glu Gln Thr Gln Gly Asn Phe Gly
275 280 285
Asp Gln Asp Leu Ile Arg Gln Gly Thr Asp Tyr Lys His Trp Pro Gln
290 295 300
Ile Ala Gln Phe Ala Pro Ser Ala Ser Ala Phe Phe Gly Met Ser Arg
305 310 315 320
Ile Gly Met Glu Val Thr Pro Ser Gly Thr Trp Leu Thr Tyr His Gly
325 330 335
Ala Ile Lys Leu Asp Asp Lys Asp Pro Gln Phe Lys Asp Asn Val Ile
340 345 350
Leu Leu Asn Lys His Ile Asp Ala Tyr Lys Thr Phe Pro Pro Thr Glu
355 360 365
Pro Lys Lys Asp Lys Lys Lys Lys Thr Asp Glu Ala Gln Pro Leu Pro
370 375 380
Gln Arg Gln Lys Lys Gln Pro Thr Val Thr Leu Leu Pro Ala Ala Asp
385 390 395 400
Met Asp Asp Phe Ser Arg Gln Leu Gln Asn Ser Met Ser Gly Ala Ser
405 410 415
Ala Asp Ser Thr Gln Ala
420
<210> 236
<211> 1266
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 236
atgtctgata atggacccca atcaaaccaa cgtagtgccc cccgcattac atttggtgga 60
cccacagatt caactgacaa taaccagaat ggaggacgca atggggcaag gccaaaacag 120
cgccgacccc aaggtttacc caataatact gcgtcttggt tcacagctct cactcagcat 180
ggcaaggagg aacttagatt ccctcgaggc cagggcgttc caatcaacac caatagtggt 240
ccagatgacc aaattggcta ctaccgaaga gctacccgac gagttcgtgg tggtgacggc 300
aaaatgaaag agctcagccc cagatggtac ttctattacc taggaactgg cccagaagct 360
tcacttccct acggcgctaa caaagaaggc atcgtatggg ttgcaactga gggagccttg 420
aatacaccca aagaccacat tggcacccgc aatcctaata acaatgctgc caccgtgcta 480
caacttcctc aaggaacaac attgccaaaa ggcttctacg cagagggaag cagaggcggc 540
agtcaagcct cttctcgctc ctcatcacgt agtcgcggta attcaagaaa ttcaactcct 600
ggcagcagta ggggaaattc tcctgctcga atggctagcg gaggtggtga aactgccctc 660
gcgctattgc tgctagacag attgaaccag cttgagagca aagtttctgg taaaggccaa 720
caacaacaag gccaaactgt cactaagaaa tctgctgctg aggcatctaa aaagcctcgc 780
caaaaacgta ctgccacaaa acagtacaac gtcactcaag catttgggag acgtggtcca 840
gaacaaaccc aaggaaattt cggggaccaa gacctaatca gacaaggaac tgattacaaa 900
cattggccgc aaattgcaca atttgctcca agtgcctctg cattctttgg aatgtcacgc 960
attggcatgg aagtcacacc ttcgggaaca tggctgactt atcatggagc cattaaattg 1020
gatgacaaag atccacaatt caaagacaac gtcatactgc tgaacaagca cattgacgca 1080
tacaaaacat tcccaccaac agagcctaaa aaggacaaaa agaaaaagac tgatgaagct 1140
cagcctttgc cgcagagaca aaagaagcag cccactgtga ctcttcttcc tgcggctgac 1200
atggatgatt tctccagaca acttcaaaat tccatgagtg gagcttctgc tgattcaact 1260
caggca 1266
<210> 237
<211> 1266
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding SARS CoV N protein
<400> 237
atgagcgaca atggccctca gagcaaccag agaagcgccc ctagaatcac ctttggcggc 60
cctaccgaca gcaccgacaa caaccagaac ggcggcagaa atggcgccag acctaagcag 120
agaaggcctc agggcctgcc taacaatacc gccagctggt tcacagccct gacacagcac 180
ggcaaagagg aactgagatt ccccagagga cagggcgtgc ccatcaacac aaatagcggc 240
cctgacgacc agatcggcta ctacagacgg gccaccagaa gagttagagg cggcgacggc 300
aagatgaagg aactgtcccc tcggtggtac ttctactacc tcggcacagg acccgaagcc 360
agccttcctt atggcgccaa caaagagggc atcgtctggg ttgcaacaga aggcgccctg 420
aacaccccta aggaccacat cggcaccaga aatcccaaca acaacgccgc cacagtgctg 480
cagttgccac agggaacaac actgcccaag ggcttctacg ccgagggatc tagaggcgga 540
tctcaggcca gcagcagaag cagctctaga agcagaggca acagccggaa tagcacccct 600
ggcagctcca gaggcaattc ccctgccaga atggcttctg gcggcggaga aacagctctg 660
gcactgctgc tgctcgaccg gctgaatcag ctggaatcta aggtgtccgg caagggccag 720
caacagcagg gacagaccgt gaccaagaag tctgccgctg aggccagcaa gaagcccaga 780
cagaagagaa ccgccaccaa gcagtacaac gtgacccagg cctttggcag aagaggccca 840
gaacagaccc agggcaattt cggcgaccag gacctgatca gacagggcac cgattacaag 900
cactggcccc agatcgccca gtttgcccct tctgcctctg cctttttcgg catgagccgg 960
atcggcatgg aagtgacacc tagcggcacc tggctgacat atcacggcgc catcaagctg 1020
gacgacaagg accctcagtt caaggacaac gtgatcctgc tgaacaagca catcgacgcc 1080
tacaagacat tccctccaac cgagcctaag aaggacaaga agaagaaaac cgacgaggcc 1140
cagcctctgc cacagagaca gaaaaagcag cccaccgtga cactgctgcc tgccgccgat 1200
atggacgact tctctagaca gctgcagaac agcatgagcg gcgccagcgc tgattctaca 1260
caagct 1266
<210> 238
<211> 1266
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding SARS CoV N protein
<400> 238
augagcgaca auggcccuca gagcaaccag agaagcgccc cuagaaucac cuuuggcggc 60
ccuaccgaca gcaccgacaa caaccagaac ggcggcagaa auggcgccag accuaagcag 120
agaaggccuc agggccugcc uaacaauacc gccagcuggu ucacagcccu gacacagcac 180
ggcaaagagg aacugagauu ccccagagga cagggcgugc ccaucaacac aaauagcggc 240
ccugacgacc agaucggcua cuacagacgg gccaccagaa gaguuagagg cggcgacggc 300
aagaugaagg aacugucccc ucggugguac uucuacuacc ucggcacagg acccgaagcc 360
agccuuccuu auggcgccaa caaagagggc aucgucuggg uugcaacaga aggcgcccug 420
aacaccccua aggaccacau cggcaccaga aaucccaaca acaacgccgc cacagugcug 480
caguugccac agggaacaac acugcccaag ggcuucuacg ccgagggauc uagaggcgga 540
ucucaggcca gcagcagaag cagcucuaga agcagaggca acagccggaa uagcaccccu 600
ggcagcucca gaggcaauuc cccugccaga auggcuucug gcggcggaga aacagcucug 660
gcacugcugc ugcucgaccg gcugaaucag cuggaaucua agguguccgg caagggccag 720
caacagcagg gacagaccgu gaccaagaag ucugccgcug aggccagcaa gaagcccaga 780
cagaagagaa ccgccaccaa gcaguacaac gugacccagg ccuuuggcag aagaggccca 840
gaacagaccc agggcaauuu cggcgaccag gaccugauca gacagggcac cgauuacaag 900
cacuggcccc agaucgccca guuugccccu ucugccucug ccuuuuucgg caugagccgg 960
aucggcaugg aagugacacc uagcggcacc uggcugacau aucacggcgc caucaagcug 1020
gacgacaagg acccucaguu caaggacaac gugauccugc ugaacaagca caucgacgcc 1080
uacaagacau ucccuccaac cgagccuaag aaggacaaga agaagaaaac cgacgaggcc 1140
cagccucugc cacagagaca gaaaaagcag cccaccguga cacugcugcc ugccgccgau 1200
auggacgacu ucucuagaca gcugcagaac agcaugagcg gcgccagcgc ugauucuaca 1260
caagcu 1266
<210> 239
<211> 454
<212> PRT
<213> Murine coronavirus
<400> 239
Met Ser Phe Val Pro Gly Gln Glu Asn Ala Gly Gly Arg Ser Ser Ser
1 5 10 15
Val Asn Arg Ala Gly Asn Gly Ile Leu Lys Lys Thr Thr Trp Ala Asp
20 25 30
Gln Thr Glu Arg Gly Pro Asn Asn Gln Asn Arg Gly Arg Arg Asn Gln
35 40 45
Pro Lys Gln Thr Ala Thr Thr Gln Pro Asn Ser Gly Ser Val Val Pro
50 55 60
His Tyr Ser Trp Phe Ser Gly Ile Thr Gln Phe Gln Lys Gly Lys Glu
65 70 75 80
Phe Gln Phe Ala Glu Gly Gln Gly Val Pro Ile Ala Asn Gly Ile Pro
85 90 95
Ala Ser Glu Gln Lys Gly Tyr Trp Tyr Arg His Asn Arg Arg Ser Phe
100 105 110
Lys Thr Pro Asp Gly Gln Gln Lys Gln Leu Leu Pro Arg Trp Tyr Phe
115 120 125
Tyr Tyr Leu Gly Thr Gly Pro His Ala Gly Ala Ser Tyr Gly Asp Ser
130 135 140
Ile Glu Gly Val Phe Trp Val Ala Asn Ser Gln Ala Asp Thr Asn Thr
145 150 155 160
Arg Ser Asp Ile Val Glu Arg Asp Pro Ser Ser His Glu Ala Ile Pro
165 170 175
Thr Arg Phe Ala Pro Gly Thr Val Leu Pro Gln Gly Phe Tyr Val Glu
180 185 190
Gly Ser Gly Arg Ser Ala Pro Ala Ser Arg Ser Gly Ser Arg Ser Gln
195 200 205
Ser Arg Gly Pro Asn Asn Arg Ala Arg Ser Ser Ser Asn Gln Arg Gln
210 215 220
Pro Ala Ser Thr Val Lys Pro Asp Met Ala Glu Glu Ile Ala Ala Leu
225 230 235 240
Val Leu Ala Lys Leu Gly Lys Asp Ala Gly Gln Pro Lys Gln Val Thr
245 250 255
Lys Gln Ser Ala Lys Glu Val Arg Gln Lys Ile Leu Asn Lys Pro Arg
260 265 270
Gln Lys Arg Thr Pro Asn Lys Gln Cys Pro Val Gln Gln Cys Phe Gly
275 280 285
Lys Arg Gly Pro Asn Gln Asn Phe Gly Gly Ser Glu Met Leu Lys Leu
290 295 300
Gly Thr Ser Asp Pro Gln Phe Pro Ile Leu Ala Glu Leu Ala Pro Thr
305 310 315 320
Val Gly Ala Phe Phe Phe Gly Ser Lys Leu Glu Leu Val Lys Lys Asn
325 330 335
Ser Gly Gly Ala Asp Glu Pro Thr Lys Asp Val Tyr Glu Leu Gln Tyr
340 345 350
Ser Gly Ala Val Arg Phe Asp Ser Thr Leu Pro Gly Phe Glu Thr Ile
355 360 365
Met Lys Val Leu Asn Glu Asn Leu Asn Ala Tyr Gln Lys Asp Gly Gly
370 375 380
Ala Asp Val Val Ser Pro Lys Pro Gln Arg Lys Gly Arg Arg Gln Ala
385 390 395 400
Gln Glu Lys Lys Asp Glu Val Asp Asn Val Ser Val Ala Lys Pro Lys
405 410 415
Ser Ser Val Gln Arg Asn Val Ser Arg Glu Leu Thr Pro Glu Asp Arg
420 425 430
Ser Leu Leu Ala Gln Ile Leu Asp Asp Gly Val Val Pro Asp Gly Leu
435 440 445
Glu Asp Asp Ser Asn Val
450
<210> 240
<211> 1362
<212> DNA
<213> Murine coronavirus
<400> 240
atgtcttttg ttcctgggca agaaaatgcc ggtggcagaa gctcctctgt aaaccgcgct 60
ggtaatggaa tcctcaagaa gaccacttgg gctgaccaaa ccgagcgtgg accaaataat 120
caaaatagag gcagaaggaa tcagccaaag cagactgcaa ctactcaacc caactccggg 180
agtgtggttc cccattactc ctggttttct ggcattaccc agttccaaaa gggaaaggag 240
tttcagtttg cagaaggaca aggagtgcct attgccaatg gaatccccgc ttcagagcaa 300
aagggatatt ggtatagaca caaccgccgt tcttttaaaa cacctgatgg gcagcagaag 360
caattactgc ccagatggta tttttactat cttggcacag ggccccatgc tggagccagt 420
tatggagaca gcattgaagg tgtcttctgg gttgcaaaca gccaagcgga caccaatacc 480
cgctctgata ttgtcgaaag ggacccaagc agtcatgagg ctattcctac taggtttgcg 540
cccggcacgg tattgcctca gggcttttat gttgaaggct ctggaaggtc tgcacctgct 600
agccgatctg gttcgcggtc acaatcccgt gggccaaata atcgcgctag aagcagttcc 660
aaccagcgcc agcctgcctc tactgtaaaa cctgatatgg ccgaagaaat tgctgctctt 720
gttttggcta agctcggtaa agatgccggc cagcccaagc aagtaacgaa gcaaagtgcc 780
aaagaagtca ggcagaaaat tttaaacaag cctcgccaaa agaggactcc aaacaagcag 840
tgcccagtgc agcagtgttt tggaaagaga ggccccaatc agaattttgg aggctctgaa 900
atgttaaaac ttggaactag tgatccacag ttccccattc ttgcagagtt ggctccaaca 960
gttggtgcct tcttctttgg atctaaatta gaattggtca aaaagaattc tggtggtgct 1020
gatgaaccca ccaaagatgt gtatgagctg caatattcag gtgcagttag atttgatagt 1080
actctacctg gttttgagac tatcatgaaa gtgttgaatg agaatttgaa tgcctaccag 1140
aaggatggtg gtgcagatgt ggtgagccca aagccccaaa gaaaagggcg tagacaggct 1200
caggaaaaga aagatgaagt agataatgta agcgttgcaa agcccaaaag ctctgtgcag 1260
cgaaatgtaa gtagagaatt aaccccagag gatagaagtc tgttggctca gatccttgat 1320
gatggcgtag tgccagatgg gttagaagat gactctaatg tg 1362
<210> 241
<211> 1362
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding MHV N protein
<400> 241
atgagcttcg tgcccggcca agaaaatgcc ggcggaagat ctagcagcgt gaacagagcc 60
ggcaacggca tcctgaagaa aaccacctgg gccgaccaga ccgagagagg ccccaacaac 120
cagaaccggg gcagaagaaa ccagcctaag cagaccgcca ccacacagcc taatagcggc 180
tctgtggtgc cccactacag ctggtttagc ggcatcaccc agttccagaa gggcaaagag 240
ttccagttcg ccgaaggaca gggcgtgcca atcgccaatg gaatccctgc ctctgagcag 300
aaaggctact ggtacagaca caaccggcgg agcttcaaga cccctgatgg acagcagaaa 360
cagctgctgc ccagatggta cttctactac ctcggcacag gacctcacgc aggcgcctct 420
tatggcgatt ctatcgaggg cgtgttctgg gtcgccaaca gccaggccga taccaacacc 480
agatccgaca tcgtggaacg ggaccctagc agccacgagg ccattcctac aagatttgcc 540
cctggcaccg tgctgcctca gggcttttat gtggaaggca gcggaagaag cgcccctgcc 600
agtagatctg gcagcagatc tcagagcagg ggccctaaca acagagccag aagcagcagc 660
aaccagagac agcctgccag caccgtgaag cccgatatgg ccgaagaaat cgccgctctg 720
gtgctggcca agctgggaaa agatgccggc cagccaaagc aagtgaccaa gcagagcgcc 780
aaagaagtgc ggcagaagat cctgaacaag ccccggcaga agcggacccc taacaagcag 840
tgtcctgtgc agcagtgctt cggcaagagg ggccccaatc agaattttgg cggcagcgag 900
atgctgaagc tgggcacaag cgatcctcag ttccctatcc tggccgagct ggctcctaca 960
gtgggcgcat ttttctttgg ctccaaactc gagctggtca agaagaacag cggcggagcc 1020
gatgagccca ccaaggatgt gtacgagctg cagtactctg gcgccgtcag attcgatagc 1080
accctgcctg gcttcgagac aatcatgaag gtgctgaacg agaacctgaa cgcctaccag 1140
aaggatggcg gcgctgacgt ggtgtctcct aagcctcaga gaaaaggcag acggcaggcc 1200
caagagaaga aagacgaggt ggacaacgtg tccgtggcca agcctaagag cagcgtgcag 1260
agaaacgtgt ccagagagct gaccccagag gacagatctc tgctggctca gatcctggac 1320
gatggcgtgg tgccagatgg cctggaagat gacagcaacg tg 1362
<210> 242
<211> 1362
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding MHV N protein
<400> 242
augagcuucg ugcccggcca agaaaaugcc ggcggaagau cuagcagcgu gaacagagcc 60
ggcaacggca uccugaagaa aaccaccugg gccgaccaga ccgagagagg ccccaacaac 120
cagaaccggg gcagaagaaa ccagccuaag cagaccgcca ccacacagcc uaauagcggc 180
ucuguggugc cccacuacag cugguuuagc ggcaucaccc aguuccagaa gggcaaagag 240
uuccaguucg ccgaaggaca gggcgugcca aucgccaaug gaaucccugc cucugagcag 300
aaaggcuacu gguacagaca caaccggcgg agcuucaaga ccccugaugg acagcagaaa 360
cagcugcugc ccagauggua cuucuacuac cucggcacag gaccucacgc aggcgccucu 420
uauggcgauu cuaucgaggg cguguucugg gucgccaaca gccaggccga uaccaacacc 480
agauccgaca ucguggaacg ggacccuagc agccacgagg ccauuccuac aagauuugcc 540
ccuggcaccg ugcugccuca gggcuuuuau guggaaggca gcggaagaag cgccccugcc 600
aguagaucug gcagcagauc ucagagcagg ggcccuaaca acagagccag aagcagcagc 660
aaccagagac agccugccag caccgugaag cccgauaugg ccgaagaaau cgccgcucug 720
gugcuggcca agcugggaaa agaugccggc cagccaaagc aagugaccaa gcagagcgcc 780
aaagaagugc ggcagaagau ccugaacaag ccccggcaga agcggacccc uaacaagcag 840
uguccugugc agcagugcuu cggcaagagg ggccccaauc agaauuuugg cggcagcgag 900
augcugaagc ugggcacaag cgauccucag uucccuaucc uggccgagcu ggcuccuaca 960
gugggcgcau uuuucuuugg cuccaaacuc gagcugguca agaagaacag cggcggagcc 1020
gaugagccca ccaaggaugu guacgagcug caguacucug gcgccgucag auucgauagc 1080
acccugccug gcuucgagac aaucaugaag gugcugaacg agaaccugaa cgccuaccag 1140
aaggauggcg gcgcugacgu ggugucuccu aagccucaga gaaaaggcag acggcaggcc 1200
caagagaaga aagacgaggu ggacaacgug uccguggcca agccuaagag cagcgugcag 1260
agaaacgugu ccagagagcu gaccccagag gacagaucuc ugcuggcuca gauccuggac 1320
gauggcgugg ugccagaugg ccuggaagau gacagcaacg ug 1362
<210> 243
<211> 154
<212> PRT
<213> Foot-and-mouth disease virus
<400> 243
Pro Phe Phe Phe Ser Asp Val Arg Ser Asn Phe Ser Lys Leu Val Glu
1 5 10 15
Thr Ile Asn Gln Met Gln Glu Asp Met Ser Thr Lys His Gly Pro Asp
20 25 30
Phe Asn Arg Leu Val Ser Ala Phe Glu Glu Leu Ala Ala Gly Val Lys
35 40 45
Ala Ile Arg Thr Gly Leu Asp Glu Ala Lys Pro Trp Tyr Lys Leu Ile
50 55 60
Lys Leu Leu Ser Arg Leu Ser Cys Met Ala Ala Val Ala Ala Arg Ser
65 70 75 80
Lys Asp Pro Val Leu Val Ala Ile Met Leu Ala Asp Thr Gly Leu Glu
85 90 95
Ile Leu Asp Ser Thr Phe Val Val Lys Lys Ile Ser Asp Ser Leu Ser
100 105 110
Ser Leu Phe His Val Pro Ala Pro Val Phe Ser Phe Gly Ala Pro Ile
115 120 125
Leu Leu Ala Gly Leu Val Lys Val Ala Ser Ser Phe Phe Arg Ser Thr
130 135 140
Pro Glu Asp Leu Glu Arg Ala Glu Lys Gln
145 150
<210> 244
<211> 462
<212> DNA
<213> Foot-and-mouth disease virus
<400> 244
cccttcttct tctctgacgt taggtcaaac ttttctaagc tggtggaaac catcaaccag 60
atgcaggaag acatgtcaac aaaacacggg cccgacttta accggttggt gtccgccttt 120
gaggaactgg ccgctggagt aaaagccatc aggaccggcc tcgacgaggc caaaccctgg 180
tacaagctta tcaaactcct aagccgcctg tcgtgcatgg ccgctgtggc agcacggtcc 240
aaggacccag tccttgtggc catcatgctg gccgacaccg gtctcgagat tctggacagc 300
actttcgtcg tgaagaagat ctccgactcg ctctccagtc tcttccacgt gccggccccc 360
gtcttcagtt tcggagcccc gattctgcta gccgggctgg tcaaggtcgc ctcgagtttc 420
ttccggtcca cgcccgaaga ccttgagaga gcagagaaac ag 462
<210> 245
<211> 462
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding FMDV 2B protein
<400> 245
ccgttcttct ttagcgacgt gcggagcaac ttcagcaagc tggtggaaac catcaaccag 60
atgcaagagg acatgagcac caagcacggc cccgacttca acagactggt gtccgccttt 120
gaggaactgg ccgctggcgt gaaggccatc agaacaggac tggatgaggc caagccttgg 180
tacaagctga tcaagctgct gagccggctg agctgtatgg ctgctgtggc cgccagatcc 240
aaggatcctg tgctggtggc catcatgctg gccgatacag gcctggaaat cctggacagc 300
accttcgtgg tcaagaagat cagcgacagc ctgagcagcc tgttccacgt gccagctcca 360
gtgttctctt ttggcgcccc tattctgctg gccggcctgg tcaaagtggc cagcagcttc 420
tttagaagca cccctgagga cctggaacgg gccgaaaaac aa 462
<210> 246
<211> 462
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding FMDV 2B protein
<400> 246
ccguucuucu uuagcgacgu gcggagcaac uucagcaagc ugguggaaac caucaaccag 60
augcaagagg acaugagcac caagcacggc cccgacuuca acagacuggu guccgccuuu 120
gaggaacugg ccgcuggcgu gaaggccauc agaacaggac uggaugaggc caagccuugg 180
uacaagcuga ucaagcugcu gagccggcug agcuguaugg cugcuguggc cgccagaucc 240
aaggauccug ugcugguggc caucaugcug gccgauacag gccuggaaau ccuggacagc 300
accuucgugg ucaagaagau cagcgacagc cugagcagcc uguuccacgu gccagcucca 360
guguucucuu uuggcgcccc uauucugcug gccggccugg ucaaaguggc cagcagcuuc 420
uuuagaagca ccccugagga ccuggaacgg gccgaaaaac aa 462
<210> 247
<211> 87
<212> PRT
<213> Influenza A virus
<400> 247
Met Gly Gln Glu Gln Asp Thr Pro Trp Ile Leu Ser Thr Gly His Ile
1 5 10 15
Ser Thr Gln Lys Arg Glu Asp Gly Gln Gln Thr Pro Lys Leu Glu His
20 25 30
Arg Asn Ser Thr Arg Leu Met Gly His Phe Gln Lys Thr Met Asn Gln
35 40 45
Val Val Met Pro Lys Gln Ile Val Tyr Trp Arg Arg Trp Leu Ser Leu
50 55 60
Arg Asn Pro Ile Leu Val Phe Leu Lys Thr Arg Val Leu Lys Arg Trp
65 70 75 80
Arg Leu Phe Ser Lys His Glu
85
<210> 248
<211> 261
<212> DNA
<213> Influenza A virus
<400> 248
atgggacagg aacaggatac accatggata ctgtcaacag gacacatcag tactcagaaa 60
agggaagatg gacaacaaac accgaaactg gagcaccgca actcaacccg attgatgggc 120
cacttccaga agacaatgaa ccaagtggtt atgcccaaac agattgtgta ttggaggcga 180
tggctttcct tgaggaatcc catcctggta tttttgaaaa ctcgtgtatt gaaacgatgg 240
aggttgttca gcaaacacga g 261
<210> 249
<211> 261
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding Influenza A virus PB1-F2 protein
<400> 249
atgggccaag agcaggacac accttggatc ctgagcaccg gccacatcag cacccagaag 60
agagaggacg gacagcagac ccctaagctg gaacaccgga acagcaccag actgatgggc 120
cacttccaga aaaccatgaa ccaggtggtc atgcccaagc agatcgtgta ctggcggaga 180
tggctgagcc tgcggaatcc tatcctggtg ttcctgaaaa cccgggtgct gaagagatgg 240
cggctgttct ctaagcacga g 261
<210> 250
<211> 261
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding Influenza A virus PB1-F2 protein
<400> 250
augggccaag agcaggacac accuuggauc cugagcaccg gccacaucag cacccagaag 60
agagaggacg gacagcagac cccuaagcug gaacaccgga acagcaccag acugaugggc 120
cacuuccaga aaaccaugaa ccaggugguc augcccaagc agaucgugua cuggcggaga 180
uggcugagcc ugcggaaucc uauccuggug uuccugaaaa cccgggugcu gaagagaugg 240
cggcuguucu cuaagcacga g 261
<210> 251
<211> 314
<212> PRT
<213> Hepatitis A virus
<400> 251
Gly Ile Ser Asp Asp Asp Ser Ala Val Ala Glu Phe Phe Gln Ser Phe
1 5 10 15
Pro Ser Gly Glu Pro Ser Asn Ser Lys Leu Ser Ser Phe Phe Gln Ser
20 25 30
Val Thr Asn His Lys Trp Val Ala Val Gly Ala Ala Val Gly Ile Leu
35 40 45
Gly Leu Leu Val Gly Gly Trp Phe Val Tyr Lys His Phe Ser Arg Lys
50 55 60
Glu Glu Glu Pro Ile Pro Ala Glu Gly Val Tyr His Gly Val Thr Lys
65 70 75 80
Pro Lys Gln Val Ile Lys Leu Asp Ala Asp Pro Val Glu Ser Gln Ser
85 90 95
Thr Leu Glu Ile Ala Gly Leu Val Arg Lys Asn Leu Val Gln Phe Gly
100 105 110
Val Gly Glu Lys Asn Gly Cys Val Arg Trp Val Met Asn Ala Leu Gly
115 120 125
Val Lys Asp Asp Trp Leu Leu Val Pro Ser His Ala Tyr Lys Phe Glu
130 135 140
Lys Asp Tyr Glu Met Met Glu Phe Tyr Phe Asn Arg Gly Gly Thr Tyr
145 150 155 160
Tyr Ser Ile Ser Ala Gly Asn Val Val Ile Gln Ser Leu Asp Val Gly
165 170 175
Phe Gln Asp Val Val Leu Met Lys Val Pro Thr Ile Pro Lys Phe Arg
180 185 190
Asp Ile Thr Gln His Phe Ile Lys Lys Gly Asp Val Pro Arg Ala Leu
195 200 205
Asn Arg Leu Ala Thr Leu Val Thr Thr Val Asn Gly Thr Pro Met Leu
210 215 220
Ile Ser Glu Gly Pro Leu Lys Met Glu Glu Lys Ala Thr Tyr Val His
225 230 235 240
Lys Lys Asn Asp Gly Thr Thr Val Asp Leu Thr Val Asp Gln Ala Trp
245 250 255
Arg Gly Lys Gly Glu Gly Leu Pro Gly Met Cys Gly Gly Ala Leu Val
260 265 270
Ser Ser Asn Gln Ser Ile Gln Asn Ala Ile Leu Gly Ile His Val Ala
275 280 285
Gly Gly Asn Ser Ile Leu Val Ala Lys Leu Ile Thr Gln Glu Met Phe
290 295 300
Gln Asn Ile Asp Lys Lys Ile Glu Ser Gln
305 310
<210> 252
<211> 942
<212> DNA
<213> Hepatitis A virus
<400> 252
ggaatttcag atgatgacag tgcagtagct gagtttttcc agtcttttcc atctggtgaa 60
ccatcaaatt ccaagttatc tagttttttc caatctgtca ctaatcacaa gtgggttgct 120
gtgggagctg cagttggtat tcttggattg ctagtgggag gatggtttgt gtataagcat 180
ttttcccgca aagaggaaga accaattcca gctgaagggg tttatcatgg agtgactaag 240
cccaaacaag tgattaaatt ggatgcagat ccagtagagt cccagtcaac tctagaaata 300
gcaggattag ttaggaaaaa tttggttcag tttggagttg gtgagaaaaa tggatgtgtg 360
agatgggtca tgaatgcctt aggagtgaag gatgattggt tgttagtacc ttctcatgct 420
tataaatttg aaaaggatta tgaaatgatg gagttttatt tcaatagagg tggaacttac 480
tattcaattt cagctggtaa tgttgttatt caatctttag atgtgggatt ccaagatgtt 540
gttctaatga aggttcctac aattcccaag tttagagata ttactcaaca ttttattaag 600
aaaggagatg tgcctagagc cttgaatcgc ttggcaacat tagtgacaac cgttaatgga 660
actcctatgt taatttctga gggaccttta aaaatggaag aaaaagccac ttatgttcat 720
aagaagaacg atggtactac ggttgatttg actgtagatc aggcatggag aggaaaaggt 780
gaaggtcttc ctggaatgtg tggtggggcc ctagtgtcat caaatcagtc catacaaaat 840
gcaattttgg gtattcatgt tgctggagga aattcaattc ttgtggcaaa gttgattact 900
caagaaatgt ttcaaaacat tgataagaaa attgaaagtc ag 942
<210> 253
<211> 942
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding Hepatitis A protein 3ABC
<400> 253
ggcatcagcg acgatgattc tgccgtggcc gagttcttcc agagctttcc tagcggcgag 60
cccagcaaca gcaagctgag cagcttcttc cagtccgtga ccaaccacaa atgggtcgcc 120
gtgggagccg ctgtgggaat tctgggactt ctcgttggcg gatggttcgt gtacaagcac 180
ttcagccgga aagaggaaga acccattcct gccgagggcg tgtaccacgg cgtgaccaaa 240
cctaagcaag tgatcaagct ggacgccgat cctgtggaaa gccagagcac actggaaatc 300
gccggactcg tgcggaagaa cctggtgcag tttggcgtgg gcgagaagaa cggctgtgtc 360
agatgggtca tgaacgccct gggcgtgaag gacgattggc tgctggttcc tagccacgcc 420
tacaagttcg agaaggacta cgagatgatg gaattctact tcaacagagg cggcacctac 480
tacagcatca gcgccggcaa tgtggtcatc cagtctctgg atgtgggctt ccaggacgtg 540
gtgctgatga aggtgccaac aatccccaag ttccgggaca tcacccagca cttcatcaag 600
aaaggcgacg tgcccagggc tctgaacaga ctggctaccc tggtcaccac cgtgaacggc 660
acacccatgc tgatctctga gggcccactg aagatggaag agaaggccac ctacgtgcac 720
aagaagaacg acggcaccac agtggacctg accgtggatc aagcttggag aggcaaaggc 780
gagggcctgc ctggaatgtg tggcggagca ctggtgtcca gcaaccagag catccagaat 840
gccatcctgg gcatccatgt ggctggcggc aattctatcc tggtggccaa gctgatcacc 900
caagagatgt tccagaacat cgacaagaag atcgagagcc ag 942
<210> 254
<211> 942
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding Hepatitis A protein 3ABC
<400> 254
ggcaucagcg acgaugauuc ugccguggcc gaguucuucc agagcuuucc uagcggcgag 60
cccagcaaca gcaagcugag cagcuucuuc caguccguga ccaaccacaa augggucgcc 120
gugggagccg cugugggaau ucugggacuu cucguuggcg gaugguucgu guacaagcac 180
uucagccgga aagaggaaga acccauuccu gccgagggcg uguaccacgg cgugaccaaa 240
ccuaagcaag ugaucaagcu ggacgccgau ccuguggaaa gccagagcac acuggaaauc 300
gccggacucg ugcggaagaa ccuggugcag uuuggcgugg gcgagaagaa cggcuguguc 360
agauggguca ugaacgcccu gggcgugaag gacgauuggc ugcugguucc uagccacgcc 420
uacaaguucg agaaggacua cgagaugaug gaauucuacu ucaacagagg cggcaccuac 480
uacagcauca gcgccggcaa uguggucauc cagucucugg augugggcuu ccaggacgug 540
gugcugauga aggugccaac aauccccaag uuccgggaca ucacccagca cuucaucaag 600
aaaggcgacg ugcccagggc ucugaacaga cuggcuaccc uggucaccac cgugaacggc 660
acacccaugc ugaucucuga gggcccacug aagauggaag agaaggccac cuacgugcac 720
aagaagaacg acggcaccac aguggaccug accguggauc aagcuuggag aggcaaaggc 780
gagggccugc cuggaaugug uggcggagca cuggugucca gcaaccagag cauccagaau 840
gccauccugg gcauccaugu ggcuggcggc aauucuaucc ugguggccaa gcugaucacc 900
caagagaugu uccagaacau cgacaagaag aucgagagcc ag 942
<210> 255
<211> 154
<212> PRT
<213> Hepatitis B virus
<400> 255
Met Ala Ala Arg Leu Cys Cys Gln Leu Asp Pro Ala Arg Asp Val Leu
1 5 10 15
Cys Leu Arg Pro Val Gly Ala Glu Ser Arg Gly Arg Pro Phe Ser Gly
20 25 30
Ser Leu Gly Thr Leu Ser Ser Pro Ser Pro Ser Ala Val Ser Thr Asp
35 40 45
His Gly Ala His Leu Ser Leu Arg Gly Leu Pro Val Cys Ala Phe Ser
50 55 60
Ser Ala Gly Pro Cys Ala Leu Arg Phe Thr Ser Ala Arg Arg Met Glu
65 70 75 80
Thr Thr Val Lys Ala Gln Pro Phe Leu Pro Lys Val Leu His Lys Arg
85 90 95
Thr Leu Gly Leu Ser Val Met Ser Thr Thr Asp Leu Glu Ala Tyr Phe
100 105 110
Lys Asp Cys Leu Phe Lys Asp Trp Glu Glu Leu Gly Glu Glu Ile Arg
115 120 125
Leu Lys Val Phe Val Leu Gly Gly Cys Arg His Lys Leu Val Cys Ala
130 135 140
Pro Ala Pro Cys Asn Phe Phe Thr Ser Ala
145 150
<210> 256
<211> 462
<212> DNA
<213> Hepatitis B virus
<400> 256
atggctgcta ggctgtgctg ccaactggat cctgcgcggg acgtcctttg tttacgtccc 60
gtcggcgctg aatcccgcgg acgacccttc tcggggtcgc ttgggactct ctcgtcccct 120
tctccgtctg ccgtttcgac cgaccacggg gcgcacctct ctttacgcgg actccccgtc 180
tgtgccttct catctgccgg accgtgtgca cttcgcttca cctctgcacg tcgcatggag 240
accaccgtga aagcccaacc attcttgccc aaggtcttac ataagaggac tcttggactc 300
tctgtaatgt caacgaccga ccttgaggca tacttcaaag actgtttgtt taaagactgg 360
gaggagttgg gggaggagat tagattaaag gtctttgtat taggaggctg taggcataaa 420
ttggtctgcg caccagcacc atgcaacttt ttcacctctg cc 462
<210> 257
<211> 462
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding Hepatitis B X protein
<400> 257
atggccgcca gactgtgctg tcaactggac cctgctaggg acgtgctgtg tctcagacct 60
gtgggagccg agtctagagg cagacctttt tctggctctc tgggcaccct gagcagccca 120
tctccatctg ccgtgtctac agatcacggc gcccacctgt ctctgagagg actgcctgtg 180
tgtgccttta gcagcgccgg accttgcgct ctgagattca catctgccag acggatggaa 240
accaccgtga aggcccagcc tttcctgcct aaggtgctgc acaagagaac cctgggcctg 300
agcgtgatga gcaccacaga tctggaagcc tacttcaagg attgcctgtt caaggactgg 360
gaagaactgg gcgaagagat ccggctgaag gtgttcgtgc tcggcggatg cagacacaag 420
ctcgtgtgtg ctcccgctcc ttgcaacttc tttaccagcg ct 462
<210> 258
<211> 462
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding Hepatitis B X protein
<400> 258
auggccgcca gacugugcug ucaacuggac ccugcuaggg acgugcugug ucucagaccu 60
gugggagccg agucuagagg cagaccuuuu ucuggcucuc ugggcacccu gagcagccca 120
ucuccaucug ccgugucuac agaucacggc gcccaccugu cucugagagg acugccugug 180
ugugccuuua gcagcgccgg accuugcgcu cugagauuca caucugccag acggauggaa 240
accaccguga aggcccagcc uuuccugccu aaggugcugc acaagagaac ccugggccug 300
agcgugauga gcaccacaga ucuggaagcc uacuucaagg auugccuguu caaggacugg 360
gaagaacugg gcgaagagau ccggcugaag guguucgugc ucggcggaug cagacacaag 420
cucgugugug cucccgcucc uugcaacuuc uuuaccagcg cu 462
<210> 259
<211> 346
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 259
Ser Leu Glu Asn Val Ala Tyr Asn Val Val Asn Lys Gly His Phe Asp
1 5 10 15
Gly His Ala Gly Glu Ala Pro Val Ser Ile Ile Asn Asn Ala Val Tyr
20 25 30
Thr Lys Val Asp Gly Ile Asp Val Glu Ile Phe Glu Asn Lys Thr Thr
35 40 45
Leu Pro Val Asn Val Ala Phe Glu Leu Trp Ala Lys Arg Asn Ile Lys
50 55 60
Pro Val Pro Glu Ile Lys Ile Leu Asn Asn Leu Gly Val Asp Ile Ala
65 70 75 80
Ala Asn Thr Val Ile Trp Asp Tyr Lys Arg Glu Ala Pro Ala His Val
85 90 95
Ser Thr Ile Gly Val Cys Thr Met Thr Asp Ile Ala Lys Lys Pro Thr
100 105 110
Glu Ser Ala Cys Ser Ser Leu Thr Val Leu Phe Asp Gly Arg Val Glu
115 120 125
Gly Gln Val Asp Leu Phe Arg Asn Ala Arg Asn Gly Val Leu Ile Thr
130 135 140
Glu Gly Ser Val Lys Gly Leu Thr Pro Ser Lys Gly Pro Ala Gln Ala
145 150 155 160
Ser Val Asn Gly Val Thr Leu Ile Gly Glu Ser Val Lys Thr Gln Phe
165 170 175
Asn Tyr Phe Lys Lys Val Asp Gly Ile Ile Gln Gln Leu Pro Glu Thr
180 185 190
Tyr Phe Thr Gln Ser Arg Asp Leu Glu Asp Phe Lys Pro Arg Ser Gln
195 200 205
Met Glu Thr Asp Phe Leu Glu Leu Ala Met Asp Glu Phe Ile Gln Arg
210 215 220
Tyr Lys Leu Glu Gly Tyr Ala Phe Glu His Ile Val Tyr Gly Asp Phe
225 230 235 240
Ser His Gly Gln Leu Gly Gly Leu His Leu Met Ile Gly Leu Ala Lys
245 250 255
Arg Ser Gln Asp Ser Pro Leu Lys Leu Glu Asp Phe Ile Pro Met Asp
260 265 270
Ser Thr Val Lys Asn Tyr Phe Ile Thr Asp Ala Gln Thr Gly Ser Ser
275 280 285
Lys Cys Val Cys Ser Val Ile Asp Leu Leu Leu Asp Asp Phe Val Glu
290 295 300
Ile Ile Lys Ser Gln Asp Leu Ser Val Ile Ser Lys Val Val Lys Val
305 310 315 320
Thr Ile Asp Tyr Ala Glu Ile Ser Phe Met Leu Trp Cys Lys Asp Gly
325 330 335
His Val Glu Thr Phe Tyr Pro Lys Leu Gln
340 345
<210> 260
<211> 1038
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 260
agtttagaaa atgtggctta taatgttgtt aataaaggac actttgatgg acacgccggc 60
gaagcacctg tttccatcat taataatgct gtttacacaa aggtagatgg tattgatgtg 120
gagatctttg aaaataagac aacacttcct gttaatgttg catttgagct ttgggctaag 180
cgtaacatta aaccagtgcc agagattaag atactcaata atttgggtgt tgatatcgct 240
gctaatactg taatctggga ctacaaaaga gaagccccag cacatgtatc tacaataggt 300
gtctgcacaa tgactgacat tgccaagaaa cctactgaga gtgcttgttc ttcacttact 360
gtcttgtttg atggtagagt ggaaggacag gtagaccttt ttagaaacgc ccgtaatggt 420
gttttaataa cagaaggttc agtcaaaggt ctaacacctt caaagggacc agcacaagct 480
agcgtcaatg gagtcacatt aattggagaa tcagtaaaaa cacagtttaa ctactttaag 540
aaagtagacg gcattattca acagttgcct gaaacctact ttactcagag cagagactta 600
gaggatttta agcccagatc acaaatggaa actgactttc tcgagctcgc tatggatgaa 660
ttcatacagc gatataagct cgagggctat gccttcgaac acatcgttta tggagatttc 720
agtcatggac aacttggcgg tcttcattta atgataggct tagccaagcg ctcacaagat 780
tcaccactta aattagagga ttttatccct atggacagca cagtgaaaaa ttacttcata 840
acagatgcgc aaacaggttc atcaaaatgt gtgtgttctg tgattgatct tttacttgat 900
gactttgtcg agataataaa gtcacaagat ttgtcagtga tttcaaaagt ggtcaaggtt 960
acaattgact atgctgaaat ttcattcatg ctttggtgta aggatggaca tgttgaaacc 1020
ttctacccaa aactacaa 1038
<210> 261
<211> 1038
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding SARS-CoV NSP15 protein
<400> 261
agcctggaaa acgtggccta caacgtggtc aacaagggcc actttgatgg ccacgctggc 60
gaagcccctg tgtccatcat taacaacgcc gtgtacacca aggtggacgg catcgacgtg 120
gaaatcttcg agaacaagac cacactgccc gtgaatgtgg ccttcgagct gtgggccaag 180
cggaacatta agcccgtgcc tgagatcaag atcctgaaca acctgggcgt cgacattgcc 240
gccaacaccg tgatctggga ctacaagaga gaagccccag ctcacgtgtc caccatcggc 300
gtgtgtacca tgaccgatat cgccaagaag cccaccgaga gcgcctgtag ctctctgacc 360
gtgctgttcg acggcagagt ggaaggccag gtggacctgt tcagaaacgc cagaaacggc 420
gtgctgatca ccgagggctc tgtgaaggga ctgacccctt ctaagggacc tgctcaggcc 480
tctgtgaatg gcgtgacact gatcggcgag agcgtgaaaa cccagttcaa ctacttcaag 540
aaggtcgacg ggatcatcca gcagctgccc gagacatact tcacccagag ccgcgacctg 600
gaagatttca agcctcggag ccagatggaa accgacttcc tggaactggc catggacgag 660
ttcatccagc ggtacaagct ggaaggctac gcctttgagc acatcgtgta cggcgatttc 720
agccacggac agctcggagg actgcacctg atgattggcc tggccaagag aagccaggac 780
agccctctga agctcgagga cttcatcccc atggacagca ccgtgaagaa ttacttcatc 840
acagacgccc agaccggcag ctctaagtgc gtgtgtagcg tgatcgacct gctgctggac 900
gactttgtgg aaatcatcaa gagccaggac ctgagcgtga tctccaaggt ggtcaaagtg 960
accatcgact acgccgagat cagcttcatg ctgtggtgca aggacggcca cgtggaaaca 1020
ttctacccca agctgcag 1038
<210> 262
<211> 1038
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding SARS-CoV NSP15 protein
<400> 262
agccuggaaa acguggccua caacgugguc aacaagggcc acuuugaugg ccacgcuggc 60
gaagccccug uguccaucau uaacaacgcc guguacacca agguggacgg caucgacgug 120
gaaaucuucg agaacaagac cacacugccc gugaaugugg ccuucgagcu gugggccaag 180
cggaacauua agcccgugcc ugagaucaag auccugaaca accugggcgu cgacauugcc 240
gccaacaccg ugaucuggga cuacaagaga gaagccccag cucacguguc caccaucggc 300
guguguacca ugaccgauau cgccaagaag cccaccgaga gcgccuguag cucucugacc 360
gugcuguucg acggcagagu ggaaggccag guggaccugu ucagaaacgc cagaaacggc 420
gugcugauca ccgagggcuc ugugaaggga cugaccccuu cuaagggacc ugcucaggcc 480
ucugugaaug gcgugacacu gaucggcgag agcgugaaaa cccaguucaa cuacuucaag 540
aaggucgacg ggaucaucca gcagcugccc gagacauacu ucacccagag ccgcgaccug 600
gaagauuuca agccucggag ccagauggaa accgacuucc uggaacuggc cauggacgag 660
uucauccagc gguacaagcu ggaaggcuac gccuuugagc acaucgugua cggcgauuuc 720
agccacggac agcucggagg acugcaccug augauuggcc uggccaagag aagccaggac 780
agcccucuga agcucgagga cuucaucccc auggacagca ccgugaagaa uuacuucauc 840
acagacgccc agaccggcag cucuaagugc guguguagcg ugaucgaccu gcugcuggac 900
gacuuugugg aaaucaucaa gagccaggac cugagcguga ucuccaaggu ggucaaagug 960
accaucgacu acgccgagau cagcuucaug cuguggugca aggacggcca cguggaaaca 1020
uucuacccca agcugcag 1038
<210> 263
<211> 98
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 263
Met Asp Pro Asn Gln Thr Asn Val Val Pro Pro Ala Leu His Leu Val
1 5 10 15
Asp Pro Gln Ile Gln Leu Thr Ile Thr Arg Met Glu Asp Ala Met Gly
20 25 30
Gln Gly Gln Asn Ser Ala Asp Pro Lys Val Tyr Pro Ile Ile Leu Arg
35 40 45
Leu Gly Ser Gln Leu Ser Leu Ser Met Ala Arg Arg Asn Leu Asp Ser
50 55 60
Leu Glu Ala Arg Ala Phe Gln Ser Thr Pro Ile Val Val Gln Met Thr
65 70 75 80
Lys Leu Ala Thr Thr Glu Glu Leu Pro Asp Glu Phe Val Val Val Thr
85 90 95
Ala Lys
<210> 264
<211> 294
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 264
atggacccca atcaaaccaa cgtagtgccc cccgcattac atttggtgga cccacagatt 60
caactgacaa taaccagaat ggaggacgca atggggcaag gccaaaacag cgccgacccc 120
aaggtttacc caataatact gcgtcttggt tcacagctct cactcagcat ggcaaggagg 180
aacttagatt ccctcgaggc cagggcgttc caatcaacac caatagtggt ccagatgacc 240
aaattggcta ctaccgaaga gctacccgac gagttcgtgg tggtgacggc aaaa 294
<210> 265
<211> 294
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding SARS-CoV Orf9b protein
<400> 265
atggacccca accagaccaa tgtggtgcct cctgctctgc acctggtgga ccctcagatc 60
cagctgacca tcaccagaat ggaagatgcc atgggccagg gccagaacag cgccgatcct 120
aaggtgtacc ccatcatcct gagactgggc agccagctga gcctgagcat ggccagaaga 180
aacctggaca gcctggaagc cagagccttc cagagcacac ctatcgtggt gcagatgacc 240
aagctggcca ccaccgagga actgcccgat gagtttgtgg tggtcaccgc caaa 294
<210> 266
<211> 294
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding SARS-CoV Orf9b protein
<400> 266
auggacccca accagaccaa uguggugccu ccugcucugc accuggugga cccucagauc 60
cagcugacca ucaccagaau ggaagaugcc augggccagg gccagaacag cgccgauccu 120
aagguguacc ccaucauccu gagacugggc agccagcuga gccugagcau ggccagaaga 180
aaccuggaca gccuggaagc cagagccuuc cagagcacac cuaucguggu gcagaugacc 240
aagcuggcca ccaccgagga acugcccgau gaguuugugg uggucaccgc caaa 294
<210> 267
<211> 142
<212> PRT
<213> Human rhinovirus
<400> 267
Gly Pro Ser Asp Leu Tyr Val His Val Gly Asn Leu Ile Tyr Arg Asn
1 5 10 15
Leu His Leu Phe Asn Ser Glu Met His Asp Ser Ile Leu Ile Ser Tyr
20 25 30
Ser Ser Asp Leu Ile Ile Tyr Arg Thr Asn Thr Ile Gly Asp Asp Tyr
35 40 45
Ile Pro Asn Cys Asn Cys Thr Glu Ala Thr Tyr Tyr Cys Arg His Lys
50 55 60
Asn Arg Tyr Tyr Pro Ile Lys Val Thr Pro His Asp Trp Tyr Glu Ile
65 70 75 80
Gln Glu Ser Glu Tyr Tyr Pro Lys His Ile Gln Tyr Asn Leu Leu Ile
85 90 95
Gly Glu Gly Pro Cys Glu Pro Gly Asp Cys Gly Gly Lys Leu Leu Cys
100 105 110
Arg His Gly Val Ile Gly Ile Ile Thr Ala Gly Gly Glu Gly His Val
115 120 125
Ala Phe Ile Asp Leu Arg Gln Phe His Cys Ala Glu Glu Gln
130 135 140
<210> 268
<211> 426
<212> DNA
<213> Human rhinovirus
<400> 268
gggcccagtg atctatatgt gcatgtaggt aacttaatat atagaaactt acatctgttc 60
aattctgaaa tgcatgattc aattttgatt tcatactctt ctgatttaat catataccgc 120
acaaacacta taggtgatga ttatattccc aattgtaact gcactgaggc tacttattat 180
tgtagacaca aaaataggta ttacccaata aaagttactc cacatgattg gtatgaaata 240
caagagagtg aatattaccc caaacacatc caatacaacc tattaattgg tgaaggacca 300
tgtgaacctg gtgattgtgg tggaaaactt ctttgtagac atggtgtcat tggcataatc 360
acagcaggtg gtgaaggtca tgtagcattt atagatctta gacaatttca ctgtgctgag 420
gaacaa 426
<210> 269
<211> 426
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding Rhinovirus 2Apro protein
<400> 269
ggccctagcg atctgtatgt gcacgtgggc aacctgatct accggaacct gcacctgttc 60
aacagcgaga tgcacgacag catcctgatc agctacagca gcgacctgat catctatcgg 120
accaacacca tcggcgacga ctacatcccc aactgcaact gtaccgaggc cacctactac 180
tgccggcaca agaaccggta ctaccccatc aaagtgaccc ctcacgattg gtacgagatc 240
caagagagcg agtactaccc taagcacatc cagtacaacc tgctgatcgg cgagggacct 300
tgcgagcctg gcgattgtgg tggaaagctg ctgtgtagac acggcgtgat cggcatcatt 360
acagccggcg gagaaggaca cgtggccttt atcgacctgc ggcagtttca ctgcgccgag 420
gaacag 426
<210> 270
<211> 426
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding Rhinovirus 2Apro protein
<400> 270
ggcccuagcg aucuguaugu gcacgugggc aaccugaucu accggaaccu gcaccuguuc 60
aacagcgaga ugcacgacag cauccugauc agcuacagca gcgaccugau caucuaucgg 120
accaacacca ucggcgacga cuacaucccc aacugcaacu guaccgaggc caccuacuac 180
ugccggcaca agaaccggua cuaccccauc aaagugaccc cucacgauug guacgagauc 240
caagagagcg aguacuaccc uaagcacauc caguacaacc ugcugaucgg cgagggaccu 300
ugcgagccug gcgauugugg uggaaagcug cuguguagac acggcgugau cggcaucauu 360
acagccggcg gagaaggaca cguggccuuu aucgaccugc ggcaguuuca cugcgccgag 420
gaacag 426
<210> 271
<211> 183
<212> PRT
<213> Human rhinovirus
<400> 271
Gly Pro Glu Glu Glu Phe Gly Arg Ser Ile Leu Lys Asn Asn Thr Cys
1 5 10 15
Val Ile Thr Thr Gly Asn Gly Lys Phe Thr Gly Leu Gly Ile His Asp
20 25 30
Arg Ile Leu Ile Ile Pro Thr His Ala Asp Pro Gly Arg Glu Val Gln
35 40 45
Val Asn Gly Val His Thr Lys Val Leu Asp Ser Tyr Asp Leu Tyr Asn
50 55 60
Arg Asp Gly Val Lys Leu Glu Ile Thr Val Ile Gln Leu Asp Arg Asn
65 70 75 80
Glu Lys Phe Arg Asp Ile Arg Lys Tyr Ile Pro Glu Thr Glu Asp Asp
85 90 95
Tyr Pro Glu Cys Asn Leu Ala Leu Ser Ala Asn Gln Asp Glu Pro Thr
100 105 110
Ile Ile Lys Val Gly Asp Val Val Ser Tyr Gly Asn Ile Leu Leu Ser
115 120 125
Gly Asn Gln Thr Ala Arg Met Leu Lys Tyr Asn Tyr Pro Thr Lys Ser
130 135 140
Gly Tyr Cys Gly Gly Val Leu Tyr Lys Ile Gly Gln Ile Leu Gly Ile
145 150 155 160
His Val Gly Gly Asn Gly Arg Asp Gly Phe Ser Ala Met Leu Leu Arg
165 170 175
Ser Tyr Phe Thr Asp Thr Gln
180
<210> 272
<211> 549
<212> DNA
<213> Human rhinovirus
<400> 272
ggtccagaag aagaatttgg aaggtcaatt ctcaaaaaca atacttgtgt gattactaca 60
ggtaatggaa aatttacagg tcttggtata catgacagaa ttctaatcat cccaacacat 120
gctgatccag gtagagaggt ccaagttaat ggtgtccaca ctaaggttct agactcatat 180
gatctttata atagagatgg agttaaactt gaaataacgg tcatacaatt agatagaaat 240
gaaaaattta gggacattag aaagtatata cctgaaacag aagacgatta tccagaatgc 300
aatttggcac tttcagctaa tcaagatgaa ccaactataa ttaaagtagg agatgtagtg 360
tcctatggca atattttgct tagtggaaat caaacagcca gaatgcttaa atataattac 420
cccacaaaat cagggtattg tggaggggta ctatataaaa ttggtcaaat tctaggtatt 480
catgtgggtg gaaatggaag ggatggtttt tcagctatgt tacttagatc atactttaca 540
gatactcag 549
<210> 273
<211> 549
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding Rhinovirus 3Cpro protein
<400> 273
ggacctgagg aagagttcgg cagatccatc ctgaagaaca atacctgcgt gatcaccacc 60
ggcaacggca agtttacagg cctgggcatc cacgaccgga tcctgatcat tcccacacac 120
gccgatcctg gccgggaagt gcaagtgaat ggcgtgcaca ccaaggtgct ggacagctac 180
gacctgtaca accgcgacgg cgtgaagctg gaaatcaccg tgattcagct ggaccggaac 240
gagaagttcc gggacatccg gaagtacatc cccgagacag aggacgacta ccccgagtgt 300
aatctggccc tgagcgccaa ccaggacgag cccacaatta tcaaagtggg cgacgtggtg 360
tcctacggca acatcctgct gtccggcaat cagaccgcca gaatgctgaa gtacaactac 420
cccaccaaga gcggctactg tggcggcgtg ctgtataaga tcggccagat cctgggaatt 480
cacgtcggcg gcaatggcag agatggcttc tctgctatgc tgctgcggag ctacttcacc 540
gacacacag 549
<210> 274
<211> 549
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding Rhinovirus 3Cpro protein
<400> 274
ggaccugagg aagaguucgg cagauccauc cugaagaaca auaccugcgu gaucaccacc 60
ggcaacggca aguuuacagg ccugggcauc cacgaccgga uccugaucau ucccacacac 120
gccgauccug gccgggaagu gcaagugaau ggcgugcaca ccaaggugcu ggacagcuac 180
gaccuguaca accgcgacgg cgugaagcug gaaaucaccg ugauucagcu ggaccggaac 240
gagaaguucc gggacauccg gaaguacauc cccgagacag aggacgacua ccccgagugu 300
aaucuggccc ugagcgccaa ccaggacgag cccacaauua ucaaaguggg cgacguggug 360
uccuacggca acauccugcu guccggcaau cagaccgcca gaaugcugaa guacaacuac 420
cccaccaaga gcggcuacug uggcggcgug cuguauaaga ucggccagau ccugggaauu 480
cacgucggcg gcaauggcag agauggcuuc ucugcuaugc ugcugcggag cuacuucacc 540
gacacacag 549
<210> 275
<211> 835
<212> PRT
<213> Rotavirus A
<400> 275
Met Lys Val Leu Ala Leu Arg His Ser Val Ala Gln Val Tyr Ala Asp
1 5 10 15
Thr Gln Val Tyr Val His Asp Asp Thr Lys Asp Ser Tyr Glu Asn Ala
20 25 30
Phe Leu Ile Ser Asn Leu Thr Thr His Asn Ile Leu Tyr Leu Asn Tyr
35 40 45
Ser Ile Lys Thr Leu Glu Ile Leu Asn Lys Ser Gly Ile Ala Ala Ile
50 55 60
Ala Leu Gln Ser Leu Glu Glu Leu Phe Thr Leu Ile Arg Cys Asn Phe
65 70 75 80
Thr Tyr Asp Tyr Glu Leu Asp Ile Ile Tyr Leu His Asp Tyr Ser Tyr
85 90 95
Tyr Thr Asn Asn Glu Ile Arg Thr Asp Gln His Trp Ile Thr Lys Thr
100 105 110
Asn Ile Glu Glu Tyr Leu Leu Pro Gly Trp Lys Leu Thr Tyr Val Gly
115 120 125
Tyr Asn Gly Ser Glu Thr Arg Gly His Tyr Asn Phe Ser Phe Lys Cys
130 135 140
Gln Asn Ala Ala Thr Asp Asp Asp Leu Ile Ile Glu Tyr Ile Tyr Ser
145 150 155 160
Glu Ala Leu Asp Phe Gln Asn Phe Met Leu Lys Lys Ile Lys Glu Arg
165 170 175
Met Thr Thr Ser Leu Pro Ile Ala Arg Leu Ser Asn Arg Val Phe Arg
180 185 190
Asp Lys Leu Phe Pro Ser Leu Leu Lys Glu His Lys Asn Val Val Asn
195 200 205
Val Gly Pro Arg Asn Glu Ser Met Phe Thr Phe Leu Asn Tyr Pro Thr
210 215 220
Ile Lys Gln Phe Ser Asn Gly Ala Tyr Leu Val Lys Asp Thr Ile Lys
225 230 235 240
Leu Lys Gln Glu Arg Trp Leu Gly Lys Arg Ile Ser Gln Phe Asp Ile
245 250 255
Gly Gln Tyr Lys Asn Met Leu Asn Val Leu Thr Ala Ile Tyr Tyr Tyr
260 265 270
Tyr Asn Leu Tyr Lys Ser Lys Pro Ile Ile Tyr Met Ile Gly Ser Ala
275 280 285
Pro Ser Tyr Trp Ile Tyr Asp Val Arg His Tyr Ser Asp Phe Phe Phe
290 295 300
Glu Thr Trp Asp Pro Leu Asp Thr Pro Tyr Ser Ser Ile His His Lys
305 310 315 320
Glu Leu Phe Phe Ile Asn Asp Val Lys Lys Leu Lys Asp Asn Ser Ile
325 330 335
Leu Tyr Ile Asp Ile Arg Thr Asp Arg Gly Asn Ala Asp Trp Lys Lys
340 345 350
Trp Arg Lys Thr Val Glu Glu Gln Thr Ile Asn Asn Leu Asp Ile Ala
355 360 365
Tyr Glu Tyr Leu Arg Thr Gly Lys Ala Lys Val Cys Cys Val Lys Met
370 375 380
Thr Ala Met Asp Leu Glu Leu Pro Ile Ser Ala Lys Leu Leu His His
385 390 395 400
Pro Thr Thr Glu Ile Arg Ser Glu Phe Tyr Leu Leu Leu Asp Thr Trp
405 410 415
Asp Leu Thr Asn Ile Arg Arg Phe Ile Pro Lys Gly Val Leu Tyr Ser
420 425 430
Phe Ile Asn Asn Ile Ile Thr Glu Asn Val Phe Ile Gln Gln Pro Phe
435 440 445
Lys Val Lys Val Leu Asn Asp Ser Tyr Ile Val Ala Leu Tyr Ala Leu
450 455 460
Ser Asn Asp Phe Asn Asn Arg Ser Glu Val Ile Lys Leu Ile Asn Asn
465 470 475 480
Gln Lys Gln Ser Leu Ile Thr Val Arg Ile Asn Asn Thr Phe Lys Asp
485 490 495
Glu Pro Lys Val Gly Phe Lys Asn Ile Tyr Asp Trp Thr Phe Leu Pro
500 505 510
Thr Asp Phe Asp Thr Lys Glu Ala Ile Ile Thr Ser Tyr Asp Gly Cys
515 520 525
Leu Gly Leu Phe Gly Leu Ser Ile Ser Leu Ala Ser Lys Pro Thr Gly
530 535 540
Asn Asn His Leu Phe Ile Leu Ser Gly Thr Asp Lys Tyr Tyr Lys Leu
545 550 555 560
Asp Gln Phe Ala Asn His Thr Ser Ile Ser Arg Arg Ser His Gln Ile
565 570 575
Arg Phe Ser Glu Ser Ala Thr Ser Tyr Ser Gly Tyr Ile Phe Arg Asp
580 585 590
Leu Ser Asn Asn Asn Phe Asn Leu Ile Gly Thr Asn Ile Glu Asn Ser
595 600 605
Val Ser Gly His Val Tyr Asn Ala Leu Ile Tyr Tyr Arg Tyr Asn Tyr
610 615 620
Ser Phe Asp Leu Lys Arg Trp Ile Tyr Leu His Ser Ile Asp Lys Val
625 630 635 640
Asp Ile Glu Gly Gly Lys Tyr Tyr Glu Leu Ala Pro Ile Glu Leu Ile
645 650 655
Tyr Ala Cys Arg Ser Ala Lys Glu Phe Ala Thr Leu Gln Asp Asp Leu
660 665 670
Thr Val Leu Arg Tyr Ser Asn Glu Ile Glu Asn Tyr Ile Asn Thr Val
675 680 685
Tyr Ser Ile Thr Tyr Ala Asp Asp Pro Asn Tyr Phe Ile Gly Ile Gln
690 695 700
Phe Arg Asn Ile Pro Tyr Lys Tyr Asp Val Lys Ile Pro His Leu Thr
705 710 715 720
Phe Gly Val Leu His Ile Ser Asp Asn Met Val Pro Asp Val Ile Asp
725 730 735
Ile Leu Lys Ile Met Lys Asn Glu Leu Phe Lys Met Asp Ile Thr Thr
740 745 750
Ser Tyr Thr Tyr Met Leu Ser Asp Gly Ile Tyr Val Ala Asn Val Ser
755 760 765
Gly Val Leu Ser Thr Tyr Phe Lys Ile Tyr Asn Val Phe Tyr Lys Asn
770 775 780
Gln Ile Thr Phe Gly Gln Ser Arg Met Phe Ile Pro His Ile Thr Leu
785 790 795 800
Ser Phe Asn Asn Met Arg Thr Val Arg Ile Glu Thr Thr Lys Leu Gln
805 810 815
Ile Lys Ser Ile Tyr Leu Arg Lys Ile Lys Gly Asp Thr Val Phe Asp
820 825 830
Met Val Glu
835
<210> 276
<211> 2505
<212> DNA
<213> Rotavirus A
<400> 276
atgaaagtac tagctttaag acacagtgtg gctcaagtgt atgcagacac tcaagtctac 60
gttcatgatg atacaaaaga tagttatgaa aacgcttttt taatctctaa tcttacgacc 120
cataatattt tatacttaaa ttatagcatt aaaacattag aaatattaaa taagtcagga 180
atagctgcaa ttgctttaca atcacttgaa gaattattca cattaataag gtgtaatttc 240
acttatgatt atgaacttga tataatatat ttacatgatt attcatatta taccaataat 300
gaaattagaa cagaccaaca ttggataaca aaaacaaata ttgaagaata tttactacct 360
ggatggaaat taacatatgt tggttataat ggaagtgaaa ctagaggaca ttataacttt 420
tcatttaaat gtcaaaacgc tgcaacagat gatgatctaa taattgaata catttattca 480
gaagcgttgg acttccaaaa ttttatgtta aaaaagataa aggaaagaat gactacatcg 540
ttgcctatag ctagattatc taacagagta tttagggata agttattccc atcattattg 600
aaagaacata agaatgtagt gaacgttggt ccgcgtaatg aatctatgtt tacattttta 660
aattatccaa ctataaaaca attttcaaat ggtgcgtatt tagtaaaaga tactataaaa 720
ttaaaacaag aacgatggtt aggtaaaagg atatctcagt ttgatattgg tcagtataaa 780
aatatgctga atgttcttac agcaatttat tattactata atttatataa aagtaaacca 840
attatatata tgatcggatc tgctccatct tattggatat atgacgttag gcattattcc 900
gattttttct ttgaaacttg ggatccattg gacacaccat attcatcaat ccatcacaaa 960
gaattatttt ttataaatga tgtgaagaaa ctgaaggata actcaatatt gtatattgat 1020
ataagaaccg ataggggcaa tgctgattgg aaaaaatgga gaaagacagt agaagaacaa 1080
actattaata atttggacat agcttatgaa tatttacgaa cgggtaaagc gaaggtgtgt 1140
tgtgttaaga tgacagctat ggatttggaa ctgccaattt cagctaaatt actgcaccac 1200
ccaactacgg aaataagatc agaattttat ttattactag atacttggga tttaactaac 1260
attaggaggt tcattcctaa aggcgtgtta tattcattta taaacaatat aataactgaa 1320
aatgtgttta ttcaacaacc atttaaagta aaagtactga atgatagtta tattgtagcg 1380
ttatatgcat tatcaaatga ttttaataat agatcagaag taattaaatt aattaataat 1440
cagaaacaat ctctaataac tgttagaata aataatacgt ttaaggatga accaaaagtt 1500
gggttcaaaa atatctatga ttggaccttt cttccaaccg actttgatac caaagaagct 1560
ataattactt catacgacgg ttgtttagga ctctttggtt tgtctatatc gttagcatca 1620
aaaccaacag ggaataatca tttattcatt ttaagtggta cagataagta ttataaattg 1680
gatcaatttg ctaatcacac cagtatatcg agaagatcac accaaattag gttttcggaa 1740
tctgctactt catattcagg ttatatattt agagatttgt ccaataataa ttttaatcta 1800
attggtacta atatagagaa ttcagtatca ggtcatgtat ataatgcttt aatttattat 1860
agatataatt attcatttga tcttaaacgc tggatttatt tacattctat agataaagtt 1920
gatatagaag gaggaaagta ttatgaactc gcaccaatag aattaattta tgcatgtaga 1980
tcagcaaaag aatttgctac attgcaggat gacttaactg tattgagata ttcaaacgaa 2040
atagagaatt atattaatac agtatatagt ataacatacg ctgatgatcc gaattacttt 2100
atcggaatac aatttagaaa tataccatat aaatatgatg ttaaaatacc gcatttaacc 2160
ttcggagtat tacatatttc tgataacatg gtgccagacg tgattgacat actaaagata 2220
atgaagaatg aattatttaa aatggatatt acgaccagtt atacatatat gttatcagat 2280
ggaatctacg tagcaaatgt tagtggagta ttatctacat actttaaaat ctataacgta 2340
ttttataaaa atcaaataac ttttggccaa tccagaatgt ttattccgca cataacatta 2400
agcttcaata acatgagaac agtaaggata gagactacta aattacaaat taaatccatt 2460
tatttaagaa agattaaggg tgatacagtg tttgatatgg ttgag 2505
<210> 277
<211> 2505
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding Rotavirus VP3 protein
<400> 277
atgaaggtgc tggccctgag acattctgtg gcccaggtgt acgccgacac acaggtctac 60
gtgcacgacg acaccaagga cagctacgag aacgccttcc tgatcagcaa cctgaccaca 120
cacaacatcc tgtacctgaa ctacagcatc aagaccctcg agatcctgaa caagagcgga 180
atcgccgcta tcgccctgca gagcctggaa gaactgttca ccctgatccg gtgcaacttc 240
acctacgact acgagctgga catcatctac ctgcacgatt acagctacta caccaacaac 300
gagatccgga ccgaccagca ctggatcacc aagaccaaca tcgaggaata cctgctgcct 360
ggctggaagc tgacctacgt gggctacaat ggcagcgaga cacggggcca ctacaacttc 420
agcttcaagt gccagaacgc cgccaccgac gacgacctga tcatcgagta catctacagc 480
gaggccctgg acttccagaa cttcatgctg aagaaaatca aagaacggat gaccaccagc 540
ctgcctatcg ccagactgag caaccgggtg ttccgggaca agctgtttcc cagcctgctg 600
aaagaacaca agaacgtggt caacgtgggc cccagaaacg agagcatgtt cacctttctg 660
aactacccca ccatcaagca gttcagcaac ggcgcctacc tggtcaagga cacaatcaag 720
ctgaagcaag agagatggct gggcaagaga atcagccagt tcgacatcgg ccagtacaag 780
aacatgctga acgtgctgac cgccatctac tactactata acctgtacaa gagcaagccg 840
atcatctaca tgattggcag cgcccctagc tactggatct acgacgtgcg gcactacagc 900
gactttttct tcgaaacctg ggatcccctg gacacccctt acagcagcat ccaccacaaa 960
gagctgttct tcatcaacga cgtgaagaag ctcaaggaca acagcatcct ctacatcgac 1020
atcagaaccg accggggcaa cgccgactgg aagaaatggc ggaaaaccgt ggaagaacag 1080
accatcaaca acctggatat cgcctacgag tacctgcgga ccggcaaggc caaagtgtgc 1140
tgcgtgaaga tgacagccat ggacctggaa ctgcccatca gcgccaaact gctgcaccat 1200
cctaccaccg agatcagaag cgagttctat ctgctgctgg acacctggga cctgaccaat 1260
atcagacggt tcatccccaa gggcgtgctg tactccttta tcaacaacat catcaccgag 1320
aacgtgttca tccagcagcc gttcaaagtg aaagtgctga acgacagcta catcgtggcc 1380
ctgtacgccc tgagcaacga cttcaacaat cggagcgaag tgatcaaact gatcaacaat 1440
cagaagcagt ccctgatcac cgtgcgcatc aacaatacct tcaaggacga gcccaaagtg 1500
ggcttcaaga atatctacga ctggaccttc ctgcctaccg acttcgacac caaagaggcc 1560
atcatcacaa gctacgacgg ctgcctgggc ctgtttggcc tgtctattag cctggccagc 1620
aagcccaccg gcaacaacca cctgtttatc ctgagcggca ccgacaagta ctacaagctg 1680
gatcagttcg ccaaccacac cagcatcagc agaagaagcc accagatccg gttcagcgag 1740
agcgccacaa gctatagcgg ctacatcttc cgggacctgt ccaacaacaa cttcaacctg 1800
atcggcacga acatcgagaa cagcgtgtcc ggccacgtgt acaacgccct gatctactac 1860
cggtacaact actccttcga cctgaagcgg tggatctatc tgcacagcat cgacaaggtg 1920
gacatcgaag gcggcaagta ctatgagctg gcccctatcg agctgatcta cgcctgcaga 1980
agcgccaaag agttcgccac actgcaggac gatctgaccg tgctgagata cagcaatgag 2040
atcgagaact acatcaacac cgtgtactcc atcacctacg ccgacgatcc caactacttc 2100
atcggaatcc agttccgcaa catcccctat aagtacgacg tcaagatccc tcacctgacc 2160
ttcggcgtgc tgcacatcag cgacaacatg gtgcccgacg tgatcgacat cctgaagatc 2220
atgaagaatg agctgttcaa gatggacatc accaccagct acacctacat gctgagcgac 2280
ggcatctacg tggccaatgt gtctggcgtg ctgagcacct acttcaagat ctacaacgtg 2340
ttctacaaga accagatcac cttcggccag agccggatgt tcatccctca catcaccctg 2400
agctttaaca acatgcggac cgtgcggatc gaaaccacca agctgcagat caagagcatc 2460
tacctccgga agatcaaggg cgacaccgtg ttcgacatgg tggaa 2505
<210> 278
<211> 2505
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding Rotavirus VP3 protein
<400> 278
augaaggugc uggcccugag acauucugug gcccaggugu acgccgacac acaggucuac 60
gugcacgacg acaccaagga cagcuacgag aacgccuucc ugaucagcaa ccugaccaca 120
cacaacaucc uguaccugaa cuacagcauc aagacccucg agauccugaa caagagcgga 180
aucgccgcua ucgcccugca gagccuggaa gaacuguuca cccugauccg gugcaacuuc 240
accuacgacu acgagcugga caucaucuac cugcacgauu acagcuacua caccaacaac 300
gagauccgga ccgaccagca cuggaucacc aagaccaaca ucgaggaaua ccugcugccu 360
ggcuggaagc ugaccuacgu gggcuacaau ggcagcgaga cacggggcca cuacaacuuc 420
agcuucaagu gccagaacgc cgccaccgac gacgaccuga ucaucgagua caucuacagc 480
gaggcccugg acuuccagaa cuucaugcug aagaaaauca aagaacggau gaccaccagc 540
cugccuaucg ccagacugag caaccgggug uuccgggaca agcuguuucc cagccugcug 600
aaagaacaca agaacguggu caacgugggc cccagaaacg agagcauguu caccuuucug 660
aacuacccca ccaucaagca guucagcaac ggcgccuacc uggucaagga cacaaucaag 720
cugaagcaag agagauggcu gggcaagaga aucagccagu ucgacaucgg ccaguacaag 780
aacaugcuga acgugcugac cgccaucuac uacuacuaua accuguacaa gagcaagccg 840
aucaucuaca ugauuggcag cgccccuagc uacuggaucu acgacgugcg gcacuacagc 900
gacuuuuucu ucgaaaccug ggauccccug gacaccccuu acagcagcau ccaccacaaa 960
gagcuguucu ucaucaacga cgugaagaag cucaaggaca acagcauccu cuacaucgac 1020
aucagaaccg accggggcaa cgccgacugg aagaaauggc ggaaaaccgu ggaagaacag 1080
accaucaaca accuggauau cgccuacgag uaccugcgga ccggcaaggc caaagugugc 1140
ugcgugaaga ugacagccau ggaccuggaa cugcccauca gcgccaaacu gcugcaccau 1200
ccuaccaccg agaucagaag cgaguucuau cugcugcugg acaccuggga ccugaccaau 1260
aucagacggu ucauccccaa gggcgugcug uacuccuuua ucaacaacau caucaccgag 1320
aacguguuca uccagcagcc guucaaagug aaagugcuga acgacagcua caucguggcc 1380
cuguacgccc ugagcaacga cuucaacaau cggagcgaag ugaucaaacu gaucaacaau 1440
cagaagcagu cccugaucac cgugcgcauc aacaauaccu ucaaggacga gcccaaagug 1500
ggcuucaaga auaucuacga cuggaccuuc cugccuaccg acuucgacac caaagaggcc 1560
aucaucacaa gcuacgacgg cugccugggc cuguuuggcc ugucuauuag ccuggccagc 1620
aagcccaccg gcaacaacca ccuguuuauc cugagcggca ccgacaagua cuacaagcug 1680
gaucaguucg ccaaccacac cagcaucagc agaagaagcc accagauccg guucagcgag 1740
agcgccacaa gcuauagcgg cuacaucuuc cgggaccugu ccaacaacaa cuucaaccug 1800
aucggcacga acaucgagaa cagcgugucc ggccacgugu acaacgcccu gaucuacuac 1860
cgguacaacu acuccuucga ccugaagcgg uggaucuauc ugcacagcau cgacaaggug 1920
gacaucgaag gcggcaagua cuaugagcug gccccuaucg agcugaucua cgccugcaga 1980
agcgccaaag aguucgccac acugcaggac gaucugaccg ugcugagaua cagcaaugag 2040
aucgagaacu acaucaacac cguguacucc aucaccuacg ccgacgaucc caacuacuuc 2100
aucggaaucc aguuccgcaa cauccccuau aaguacgacg ucaagauccc ucaccugacc 2160
uucggcgugc ugcacaucag cgacaacaug gugcccgacg ugaucgacau ccugaagauc 2220
augaagaaug agcuguucaa gauggacauc accaccagcu acaccuacau gcugagcgac 2280
ggcaucuacg uggccaaugu gucuggcgug cugagcaccu acuucaagau cuacaacgug 2340
uucuacaaga accagaucac cuucggccag agccggaugu ucaucccuca caucacccug 2400
agcuuuaaca acaugcggac cgugcggauc gaaaccacca agcugcagau caagagcauc 2460
uaccuccgga agaucaaggg cgacaccgug uucgacaugg uggaa 2505
<210> 279
<211> 675
<212> PRT
<213> Hepatitis GB virus B
<400> 279
Ala Pro Phe Thr Leu Gln Cys Leu Ser Glu Arg Gly Thr Leu Ser Ala
1 5 10 15
Met Ala Val Val Met Thr Gly Ile Asp Pro Arg Thr Trp Thr Gly Thr
20 25 30
Ile Phe Arg Leu Gly Ser Leu Ala Thr Ser Tyr Met Gly Phe Val Cys
35 40 45
Asp Asn Val Leu Tyr Thr Ala His His Gly Ser Lys Gly Arg Arg Leu
50 55 60
Ala His Pro Thr Gly Ser Ile His Pro Ile Thr Val Asp Ala Ala Asn
65 70 75 80
Asp Gln Asp Ile Tyr Gln Pro Pro Cys Gly Ala Gly Ser Leu Thr Arg
85 90 95
Cys Ser Cys Gly Glu Thr Lys Gly Tyr Leu Val Thr Arg Leu Gly Ser
100 105 110
Leu Val Glu Val Asn Lys Ser Asp Asp Pro Tyr Trp Cys Val Cys Gly
115 120 125
Ala Leu Pro Met Ala Val Ala Lys Gly Ser Ser Gly Ala Pro Ile Leu
130 135 140
Cys Ser Ser Gly His Val Ile Gly Met Phe Thr Ala Ala Arg Asn Ser
145 150 155 160
Gly Gly Ser Val Ser Gln Ile Arg Val Arg Pro Leu Val Cys Ala Gly
165 170 175
Tyr His Pro Gln Tyr Thr Ala His Ala Thr Leu Asp Thr Lys Pro Thr
180 185 190
Val Pro Asn Glu Tyr Ser Val Gln Ile Leu Ile Ala Pro Thr Gly Ser
195 200 205
Gly Lys Ser Thr Lys Leu Pro Leu Ser Tyr Met Gln Glu Lys Tyr Glu
210 215 220
Val Leu Val Leu Asn Pro Ser Val Ala Thr Thr Ala Ser Met Pro Lys
225 230 235 240
Tyr Met His Ala Thr Tyr Gly Val Asn Pro Asn Cys Tyr Phe Asn Gly
245 250 255
Lys Cys Thr Asn Thr Gly Ala Ser Leu Thr Tyr Ser Thr Tyr Gly Met
260 265 270
Tyr Leu Thr Gly Ala Cys Ser Arg Asn Tyr Asp Val Ile Ile Cys Asp
275 280 285
Glu Cys His Ala Thr Asp Ala Thr Thr Val Leu Gly Ile Gly Lys Val
290 295 300
Leu Thr Glu Ala Pro Ser Lys Asn Val Arg Leu Val Val Leu Ala Thr
305 310 315 320
Ala Thr Pro Pro Gly Val Ile Pro Thr Pro His Ala Asn Ile Thr Glu
325 330 335
Ile Gln Leu Thr Asp Glu Gly Thr Ile Pro Phe His Gly Lys Lys Ile
340 345 350
Lys Glu Glu Asn Leu Lys Lys Gly Arg His Leu Ile Phe Glu Ala Thr
355 360 365
Lys Lys His Cys Asp Glu Leu Ala Asn Glu Leu Ala Arg Lys Gly Ile
370 375 380
Thr Ala Val Ser Tyr Tyr Arg Gly Cys Asp Ile Ser Lys Ile Pro Glu
385 390 395 400
Gly Asp Cys Val Val Val Ala Thr Asp Ala Leu Cys Thr Gly Tyr Thr
405 410 415
Gly Asp Phe Asp Ser Val Tyr Asp Cys Ser Leu Met Val Glu Gly Thr
420 425 430
Cys His Val Asp Leu Asp Pro Thr Phe Thr Met Gly Val Arg Val Cys
435 440 445
Gly Val Ser Ala Ile Val Lys Gly Gln Arg Arg Gly Arg Thr Gly Arg
450 455 460
Gly Arg Ala Gly Ile Tyr Tyr Tyr Val Asp Gly Ser Cys Thr Pro Ser
465 470 475 480
Gly Met Val Pro Glu Cys Asn Ile Val Glu Ala Phe Asp Ala Ala Lys
485 490 495
Ala Trp Tyr Gly Leu Ser Ser Thr Glu Ala Gln Thr Ile Leu Asp Thr
500 505 510
Tyr Arg Thr Gln Pro Gly Leu Pro Ala Ile Gly Ala Asn Leu Asp Glu
515 520 525
Trp Ala Asp Leu Phe Ser Met Val Asn Pro Glu Pro Ser Phe Val Asn
530 535 540
Thr Ala Lys Arg Thr Ala Asp Asn Tyr Val Leu Leu Thr Ala Ala Gln
545 550 555 560
Leu Gln Leu Cys His Gln Tyr Gly Tyr Ala Ala Pro Asn Asp Ala Pro
565 570 575
Arg Trp Gln Gly Ala Arg Leu Gly Lys Lys Pro Cys Gly Val Leu Trp
580 585 590
Arg Leu Asp Gly Ala Asp Ala Cys Pro Gly Pro Glu Pro Ser Glu Val
595 600 605
Thr Arg Tyr Gln Met Cys Phe Thr Glu Val Asn Thr Ser Gly Thr Ala
610 615 620
Ala Leu Ala Val Gly Val Gly Val Ala Met Ala Tyr Leu Ala Ile Asp
625 630 635 640
Thr Phe Gly Ala Thr Cys Val Arg Arg Cys Trp Ser Ile Thr Ser Val
645 650 655
Pro Thr Gly Ala Thr Val Ala Pro Val Val Asp Glu Glu Glu Ile Val
660 665 670
Glu Glu Cys
675
<210> 280
<211> 2025
<212> DNA
<213> Hepatitis GB virus B
<400> 280
gcacctttta cgctgcagtg tctctctgaa cgtggcacgc tgtcagcgat ggcagtggtc 60
atgactggta tagacccccg aacttggact ggaactatct tcagattagg atctctggcc 120
actagctaca tgggatttgt ttgtgacaac gtgttgtata ctgctcacca tggcagcaag 180
gggcgccggt tggctcatcc cacaggctcc atacacccaa taaccgttga cgcggctaat 240
gaccaggaca tctatcaacc accatgtgga gctgggtccc ttactcggtg ctcttgcggg 300
gagaccaagg ggtatctggt aacacgactg gggtcattgg ttgaggtcaa caaatccgat 360
gacccttatt ggtgtgtgtg cggggccctt cccatggctg ttgccaaggg ttcttcaggt 420
gccccgattc tgtgctcctc cgggcatgtt attgggatgt tcaccgctgc tagaaattct 480
ggcggttcag tcagccagat tagggttagg ccgttggtgt gtgctggata ccatccccag 540
tacacagcac atgccactct tgatacaaaa cctactgtgc ctaacgagta ttcagtgcaa 600
attttaattg cccccactgg cagcggcaag tcaaccaaat taccactttc ttacatgcag 660
gagaagtatg aggtcttggt cctaaatccc agtgtggcta caacagcatc aatgccaaag 720
tacatgcacg cgacgtacgg cgtgaatcca aattgctatt ttaatggcaa atgtaccaac 780
acaggggctt cacttacgta cagcacatat ggcatgtacc tgaccggagc atgttcccgg 840
aactatgacg tcatcatttg tgacgaatgc catgctaccg atgcaaccac cgtgttgggc 900
attggaaagg ttctaaccga agctccatcc aaaaatgtta ggctagtggt tcttgccacg 960
gctacccccc ctggagtaat ccctacacca catgccaaca taactgagat tcaattaacc 1020
gatgaaggca ctatcccctt tcatggaaaa aagattaagg aggaaaatct gaagaaaggg 1080
agacacctta tctttgaggc taccaaaaaa cactgtgatg agcttgctaa cgagttagct 1140
cgaaagggaa taacagctgt ctcttactat aggggatgtg acatctcaaa aatccctgag 1200
ggcgactgtg tagtagttgc cactgatgcc ttgtgtacag ggtacactgg tgactttgat 1260
tccgtgtatg actgcagcct catggtagaa ggcacatgcc atgttgacct tgaccctact 1320
ttcaccatgg gtgttcgtgt gtgcggggtc tcagcaatag ttaaaggcca gcgtaggggc 1380
cgcacaggcc gtgggagagc tggcatatac tactatgtag acgggagttg taccccttcg 1440
ggtatggttc ctgaatgcaa cattgttgaa gccttcgacg cagccaaggc atggtatggt 1500
ttgtcatcaa cagaagctca aactattctg gacacctatc gcacccaacc tgggttacct 1560
gcgataggag caaatttgga cgagtgggct gatctctttt ctatggtcaa ccccgaacct 1620
tcatttgtca atactgcaaa aagaactgct gacaattatg ttttgttgac tgcagcccaa 1680
ctacaactgt gtcatcagta tggctatgct gctcccaatg acgcaccacg gtggcaggga 1740
gcccggcttg ggaaaaaacc ttgtggggtt ctgtggcgct tggacggcgc tgacgcctgt 1800
cctggcccag agcccagcga ggtgaccaga taccaaatgt gcttcactga agtcaatact 1860
tctgggacag ccgcactcgc tgttggcgtt ggagtggcta tggcttatct agccattgac 1920
acttttggcg ccacttgtgt gcggcgttgc tggtctatta catcagtccc taccggtgct 1980
actgtcgccc cagtggttga cgaagaagaa atcgtggagg agtgt 2025
<210> 281
<211> 2025
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding GB virus B NS3/4A protein
<400> 281
gcccctttca cactgcaatg cctgagcgag agaggcaccc tgtctgccat ggccgtggtt 60
atgacaggca tcgaccctag aacctggacc ggcaccatct tcagactggg aagcctggcc 120
acaagctaca tgggcttcgt gtgcgacaac gtgctgtaca cagcccacca cggcagcaaa 180
ggcagaaggc tggctcaccc tacaggcagc attcacccca tcacagtgga cgccgccaac 240
gaccaggata tctaccaacc tccttgcggc gctggcagcc tgaccagatg ttcttgtggc 300
gagacaaagg gctacctggt caccaggctg ggatccctgg tggaagtgaa caagagcgac 360
gacccctatt ggtgcgtgtg tggcgcactg cctatggctg tggccaaagg atcttctggc 420
gcccctatcc tgtgtagctc tggccacgtg atcggcatgt ttaccgccgc cagaaatagc 480
ggcggcagcg tgtcacagat tagagtgcgg cctcttgtgt gcgccggcta tcaccctcag 540
tatacagccc acgccacact ggacaccaag cctaccgtgc ctaacgagta cagcgtgcag 600
atcctgatcg ccccaacagg cagcggcaag agcacaaaac tgcccctgag ctacatgcaa 660
gagaagtacg aggtgctggt gctgaaccct agcgtggcca caacagccag catgcccaag 720
tacatgcacg ccacctatgg cgtgaacccc aactgctact tcaacggcaa gtgcaccaat 780
accggcgcca gcctgacata cagcacctac ggcatgtatc tgaccggcgc ctgcagcaga 840
aactacgacg tgatcatctg cgacgagtgc cacgccaccg atgccacaac tgtgctcgga 900
atcggcaagg tgctgacaga ggcccctagc aagaatgtgc gactggtggt gctggccact 960
gctacaccac ctggcgttat ccctacacct cacgccaaca tcaccgagat ccagctgacc 1020
gacgagggca caatcccatt ccacggcaag aagatcaaag aggaaaacct gaagaagggc 1080
cgccacctga tcttcgaggc caccaagaaa cactgtgacg agctggccaa cgaactggcc 1140
agaaagggca tcaccgccgt gtcctactac agaggctgcg acatcagcaa gatccccgag 1200
ggcgattgtg tggtggtggc tacagatgcc ctgtgtaccg gctacaccgg cgacttcgat 1260
agcgtgtacg actgcagcct gatggtggaa ggcacctgtc atgtggatct ggaccccacc 1320
tttaccatgg gcgtcagagt gtgcggagtg tccgccatcg tgaagggcca gagaagaggc 1380
agaactggca gaggcagagc cggcatctac tactatgtgg acggcagctg tacccctagc 1440
ggcatggtgc ctgagtgcaa catcgtggaa gccttcgatg ccgccaaggc ttggtacggc 1500
ctgtctagca cagaggctca gaccatcctg gacacctaca gaacccagcc aggactgcct 1560
gccatcggcg ccaatcttga tgaatgggcc gacctgttca gcatggtcaa ccccgagcct 1620
agcttcgtga acaccgccaa gagaaccgcc gacaactacg tgctgctgac agccgctcag 1680
ctccagctgt gtcaccagta cggatacgcc gctcctaacg acgcccctag atggcaaggc 1740
gctagactgg gcaagaaacc atgtggcgtt ctgtggcgac tggatggcgc tgatgcttgt 1800
cctggacctg agcctagcga agtgaccaga taccagatgt gcttcaccga agtgaatacc 1860
agcggcacag ctgccctggc cgttggtgtt ggagtggcca tggcttacct ggccatcgat 1920
acctttggcg ccacatgcgt gcggagatgc tggtctatca ccagcgttcc aacaggcgct 1980
acagtggccc ctgtggtgga tgaggaagag attgtggaag agtgc 2025
<210> 282
<211> 2025
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding GB Virus B NS3/4A protein
<400> 282
gccccuuuca cacugcaaug ccugagcgag agaggcaccc ugucugccau ggccgugguu 60
augacaggca ucgacccuag aaccuggacc ggcaccaucu ucagacuggg aagccuggcc 120
acaagcuaca ugggcuucgu gugcgacaac gugcuguaca cagcccacca cggcagcaaa 180
ggcagaaggc uggcucaccc uacaggcagc auucacccca ucacagugga cgccgccaac 240
gaccaggaua ucuaccaacc uccuugcggc gcuggcagcc ugaccagaug uucuuguggc 300
gagacaaagg gcuaccuggu caccaggcug ggaucccugg uggaagugaa caagagcgac 360
gaccccuauu ggugcgugug uggcgcacug ccuauggcug uggccaaagg aucuucuggc 420
gccccuaucc uguguagcuc uggccacgug aucggcaugu uuaccgccgc cagaaauagc 480
ggcggcagcg ugucacagau uagagugcgg ccucuugugu gcgccggcua ucacccucag 540
uauacagccc acgccacacu ggacaccaag ccuaccgugc cuaacgagua cagcgugcag 600
auccugaucg ccccaacagg cagcggcaag agcacaaaac ugccccugag cuacaugcaa 660
gagaaguacg aggugcuggu gcugaacccu agcguggcca caacagccag caugcccaag 720
uacaugcacg ccaccuaugg cgugaacccc aacugcuacu ucaacggcaa gugcaccaau 780
accggcgcca gccugacaua cagcaccuac ggcauguauc ugaccggcgc cugcagcaga 840
aacuacgacg ugaucaucug cgacgagugc cacgccaccg augccacaac ugugcucgga 900
aucggcaagg ugcugacaga ggccccuagc aagaaugugc gacugguggu gcuggccacu 960
gcuacaccac cuggcguuau cccuacaccu cacgccaaca ucaccgagau ccagcugacc 1020
gacgagggca caaucccauu ccacggcaag aagaucaaag aggaaaaccu gaagaagggc 1080
cgccaccuga ucuucgaggc caccaagaaa cacugugacg agcuggccaa cgaacuggcc 1140
agaaagggca ucaccgccgu guccuacuac agaggcugcg acaucagcaa gauccccgag 1200
ggcgauugug uggugguggc uacagaugcc cuguguaccg gcuacaccgg cgacuucgau 1260
agcguguacg acugcagccu gaugguggaa ggcaccuguc auguggaucu ggaccccacc 1320
uuuaccaugg gcgucagagu gugcggagug uccgccaucg ugaagggcca gagaagaggc 1380
agaacuggca gaggcagagc cggcaucuac uacuaugugg acggcagcug uaccccuagc 1440
ggcauggugc cugagugcaa caucguggaa gccuucgaug ccgccaaggc uugguacggc 1500
cugucuagca cagaggcuca gaccauccug gacaccuaca gaacccagcc aggacugccu 1560
gccaucggcg ccaaucuuga ugaaugggcc gaccuguuca gcauggucaa ccccgagccu 1620
agcuucguga acaccgccaa gagaaccgcc gacaacuacg ugcugcugac agccgcucag 1680
cuccagcugu gucaccagua cggauacgcc gcuccuaacg acgccccuag auggcaaggc 1740
gcuagacugg gcaagaaacc auguggcguu cuguggcgac uggauggcgc ugaugcuugu 1800
ccuggaccug agccuagcga agugaccaga uaccagaugu gcuucaccga agugaauacc 1860
agcggcacag cugcccuggc cguugguguu ggaguggcca uggcuuaccu ggccaucgau 1920
accuuuggcg ccacaugcgu gcggagaugc uggucuauca ccagcguucc aacaggcgcu 1980
acaguggccc cuguggugga ugaggaagag auuguggaag agugc 2025
<210> 283
<211> 219
<212> PRT
<213> Hepatitis A virus
<400> 283
Ser Thr Leu Glu Ile Ala Gly Leu Val Arg Lys Asn Leu Val Gln Phe
1 5 10 15
Gly Val Gly Glu Lys Asn Gly Cys Val Arg Trp Val Met Asn Ala Leu
20 25 30
Gly Val Lys Asp Asp Trp Leu Leu Val Pro Ser His Ala Tyr Lys Phe
35 40 45
Glu Lys Asp Tyr Glu Met Met Glu Phe Tyr Phe Asn Arg Gly Gly Thr
50 55 60
Tyr Tyr Ser Ile Ser Ala Gly Asn Val Val Ile Gln Ser Leu Asp Val
65 70 75 80
Gly Phe Gln Asp Val Val Leu Met Lys Val Pro Thr Ile Pro Lys Phe
85 90 95
Arg Asp Ile Thr Gln His Phe Ile Lys Lys Gly Asp Val Pro Arg Ala
100 105 110
Leu Asn Arg Leu Ala Thr Leu Val Thr Thr Val Asn Gly Thr Pro Met
115 120 125
Leu Ile Ser Glu Gly Pro Leu Lys Met Glu Glu Lys Ala Thr Tyr Val
130 135 140
His Lys Lys Asn Asp Gly Thr Thr Val Asp Leu Thr Val Asp Gln Ala
145 150 155 160
Trp Arg Gly Lys Gly Glu Gly Leu Pro Gly Met Cys Gly Gly Ala Leu
165 170 175
Val Ser Ser Asn Gln Ser Ile Gln Asn Ala Ile Leu Gly Ile His Val
180 185 190
Ala Gly Gly Asn Ser Ile Leu Val Ala Lys Leu Val Thr Gln Glu Met
195 200 205
Phe Gln Asn Ile Asp Lys Lys Ile Glu Ser Gln
210 215
<210> 284
<211> 657
<212> DNA
<213> Hepatitis A virus
<400> 284
tcaactttgg aaatagcagg actggttagg aagaacttgg ttcagtttgg agttggagag 60
aagaatggat gtgtgagatg ggttatgaat gccttgggag tgaaagatga ttggctgctt 120
gtgccttccc atgcttataa atttgagaaa gattatgaaa tgatggagtt ttattttaat 180
agaggtggaa cttactattc aatttcagct ggtaatgttg ttattcaatc tttggatgtg 240
ggattccagg atgttgttct gatgaaggtt cctacaattc ctaagtttag agatattact 300
cagcatttta ttaagaaagg ggatgtgcct agagctttga atcgcctggc aacattagtg 360
acaactgtaa atggaacccc tatgttaatt tctgagggcc cactaaagat ggaagagaaa 420
gctacttatg ttcataagaa aaatgatggt acaacagttg atttaactgt ggatcaggca 480
tggagaggaa aaggcgaagg tcttcctgga atgtgtggtg gggccttggt ttcatcgaat 540
caatctatac agaatgcaat cttgggcatc catgttgctg gaggaaattc aattcttgtt 600
gcaaaattgg ttactcaaga aatgttccaa aatattgata agaaaattga aagtcag 657
<210> 285
<211> 657
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding HAV 3Cpro protein
<400> 285
agcacactgg aaatcgccgg actcgtgcgg aagaacctgg tgcagtttgg cgtgggcgag 60
aagaacggct gtgtcagatg ggtcatgaac gccctgggcg tgaaggacga ttggctgctg 120
gttcctagcc acgcctacaa gttcgagaag gactacgaga tgatggaatt ctacttcaac 180
agaggcggca cctactacag catcagcgcc ggcaatgtgg tcatccagtc tctggatgtg 240
ggcttccagg acgtggtgct gatgaaggtg ccaacaatcc ccaagttccg ggacatcacc 300
cagcacttca tcaagaaagg cgacgtgccc agggctctga acagactggc taccctggtc 360
accaccgtga acggcacacc catgctgatc tctgagggcc cactgaagat ggaagagaag 420
gccacctacg tgcacaagaa gaacgacggc accacagtgg acctgaccgt ggatcaagct 480
tggagaggca aaggcgaggg cctgcctgga atgtgtggcg gagcactggt gtccagcaac 540
cagagcatcc agaatgccat cctgggcatc catgtggctg gcggcaattc tatcctggtg 600
gccaagctgg tcacccaaga gatgttccag aacatcgaca agaagatcga gagccag 657
<210> 286
<211> 657
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding HAV 3Cpro protein
<400> 286
agcacacugg aaaucgccgg acucgugcgg aagaaccugg ugcaguuugg cgugggcgag 60
aagaacggcu gugucagaug ggucaugaac gcccugggcg ugaaggacga uuggcugcug 120
guuccuagcc acgccuacaa guucgagaag gacuacgaga ugauggaauu cuacuucaac 180
agaggcggca ccuacuacag caucagcgcc ggcaaugugg ucauccaguc ucuggaugug 240
ggcuuccagg acguggugcu gaugaaggug ccaacaaucc ccaaguuccg ggacaucacc 300
cagcacuuca ucaagaaagg cgacgugccc agggcucuga acagacuggc uacccugguc 360
accaccguga acggcacacc caugcugauc ucugagggcc cacugaagau ggaagagaag 420
gccaccuacg ugcacaagaa gaacgacggc accacagugg accugaccgu ggaucaagcu 480
uggagaggca aaggcgaggg ccugccugga auguguggcg gagcacuggu guccagcaac 540
cagagcaucc agaaugccau ccugggcauc cauguggcug gcggcaauuc uauccuggug 600
gccaagcugg ucacccaaga gauguuccag aacaucgaca agaagaucga gagccag 657
<210> 287
<211> 71
<212> PRT
<213> Human metapneumovirus
<400> 287
Met Thr Leu His Met Pro Cys Lys Thr Val Lys Ala Leu Ile Lys Cys
1 5 10 15
Ser Glu His Gly Pro Val Phe Ile Thr Ile Glu Val Asp Glu Met Ile
20 25 30
Trp Thr Gln Lys Glu Leu Lys Glu Ala Leu Ser Asp Gly Ile Val Lys
35 40 45
Ser His Thr Asn Ile Tyr Asn Cys Tyr Leu Glu Asn Ile Glu Ile Ile
50 55 60
Tyr Val Lys Ala Tyr Leu Ser
65 70
<210> 288
<211> 213
<212> DNA
<213> Human metapneumovirus
<400> 288
atgactcttc atatgccctg caagacagtg aaagcattaa tcaagtgcag tgagcatggt 60
cctgttttca ttactataga ggttgatgaa atgatatgga ctcaaaaaga attaaaagaa 120
gctttgtccg atgggatagt gaagtctcac accaacattt acaattgtta tttagaaaac 180
atagaaatta tatatgtcaa ggcttactta agt 213
<210> 289
<211> 213
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding Human metapneumovirus M2-2 protein
<400> 289
atgaccctgc acatgccctg caagacagtg aaggccctga tcaagtgtag cgagcacggc 60
cccgtgttca tcaccattga ggtggacgag atgatctgga cccagaaaga gctgaaagag 120
gccctgagcg acggcatcgt gaagtcccac accaacatct acaactgcta cctcgagaac 180
atcgagatca tctacgtgaa ggcctacctg agc 213
<210> 290
<211> 213
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding Human metapneumovirus M2-2 protein
<400> 290
augacccugc acaugcccug caagacagug aaggcccuga ucaaguguag cgagcacggc 60
cccguguuca ucaccauuga gguggacgag augaucugga cccagaaaga gcugaaagag 120
gcccugagcg acggcaucgu gaagucccac accaacaucu acaacugcua ccucgagaac 180
aucgagauca ucuacgugaa ggccuaccug agc 213
<210> 291
<211> 181
<212> PRT
<213> Hepatitis E virus
<400> 291
Glu Val Phe Trp Asn Gln Pro Ile Gln Arg Val Ile His Asn Glu Leu
1 5 10 15
Glu Leu Tyr Cys Arg Ala Arg Ser Gly Arg Cys Leu Glu Ile Gly Ala
20 25 30
His Pro Arg Ser Ile Asn Asp Asn Pro Asn Val Val His Arg Cys Phe
35 40 45
Leu Arg Pro Val Gly Arg Asp Val Gln Arg Trp Tyr Thr Ala Pro Thr
50 55 60
Arg Gly Pro Ala Ala Asn Cys Arg Arg Ser Ala Leu Arg Gly Leu Pro
65 70 75 80
Ala Ala Asp Arg Thr Tyr Cys Phe Asp Gly Phe Ser Gly Cys Ser Cys
85 90 95
Pro Ala Glu Thr Gly Ile Ala Leu Tyr Ser Leu His Asp Met Ser Pro
100 105 110
Ser Asp Val Ala Glu Ala Met Phe Arg His Gly Met Thr Arg Leu Tyr
115 120 125
Ala Ala Leu His Leu Pro Pro Glu Val Leu Leu Pro Pro Gly Thr Tyr
130 135 140
Arg Thr Ala Ser Tyr Leu Leu Ile His Asp Gly Arg Arg Val Val Val
145 150 155 160
Thr Tyr Glu Gly Asp Thr Ser Ala Gly Tyr Asn His Asp Val Ser Asn
165 170 175
Leu Arg Ser Trp Ile
180
<210> 292
<211> 543
<212> DNA
<213> Hepatitis E virus
<400> 292
gaggttttct ggaatcaacc catccagcgt gtcattcata acgagctgga gctttactgc 60
cgcgctcgct ccggccgctg tcttgaaatt ggcgcccatc cccgctcaat aaatgataat 120
cctaatgtgg tccaccgctg cttcctccgc cctgttgggc gtgatgttca gcgctggtat 180
actgctccca ctcgcgggcc ggctgctaat tgccgccgtt ccgcgttgcg tgggcttccc 240
gctgctgacc gcacatactg cttcgacggg ttttctggct gtagctgccc cgccgagacg 300
ggtatcgccc tttactccct ccatgatatg tcaccatctg atgttgccga ggccatgttc 360
cgccatggta tgacgcggct ttatgctgcc ctccatcttc cgcctgaggt cttgctgccc 420
cctggcacat atcgcaccgc atcgtatttg ctgattcatg acggcaggcg cgttgtggtg 480
acgtatgagg gtgatactag tgctggttac aaccacgatg tctccaactt gcgctcctgg 540
att 543
<210> 293
<211> 543
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding Hepatitis E methyltransferase
protein
<400> 293
gaggtgttct ggaaccagcc tatccagaga gtgatccaca acgagctgga actgtactgc 60
agagccagat ccggccggtg tctggaaatt ggagcccatc ctcggagcat caacgacaac 120
cccaacgtgg tgcacagatg ctttctgagg cccgtgggca gagatgtgca gcggtggtat 180
acagccccta caagaggacc tgccgccaac tgtagaagaa gcgccctgag aggactgcct 240
gccgccgata gaacctactg cttcgatggc ttcagcggct gcagctgtcc tgccgaaact 300
ggaatcgccc tgtacagcct gcacgacatg agcccatctg atgtggccga ggccatgttc 360
agacacggca tgaccagact gtacgccgct ctgcatctgc ctccagaagt tctgctgcct 420
cctggcacct acagaaccgc cagctatctg ctgatccacg atgggagaag agtggtggtc 480
acctacgagg gcgatacaag cgccggctac aaccacgacg tgtccaacct gagaagctgg 540
atc 543
<210> 294
<211> 543
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding Hepatitis E methyltransferase
protein
<400> 294
gagguguucu ggaaccagcc uauccagaga gugauccaca acgagcugga acuguacugc 60
agagccagau ccggccggug ucuggaaauu ggagcccauc cucggagcau caacgacaac 120
cccaacgugg ugcacagaug cuuucugagg cccgugggca gagaugugca gcggugguau 180
acagccccua caagaggacc ugccgccaac uguagaagaa gcgcccugag aggacugccu 240
gccgccgaua gaaccuacug cuucgauggc uucagcggcu gcagcugucc ugccgaaacu 300
ggaaucgccc uguacagccu gcacgacaug agcccaucug auguggccga ggccauguuc 360
agacacggca ugaccagacu guacgccgcu cugcaucugc cuccagaagu ucugcugccu 420
ccuggcaccu acagaaccgc cagcuaucug cugauccacg augggagaag aguggugguc 480
accuacgagg gcgauacaag cgccggcuac aaccacgacg uguccaaccu gagaagcugg 540
auc 543
<210> 295
<211> 390
<212> PRT
<213> Suid herpesvirus 2
<400> 295
Met Leu Ala Met Trp Arg Trp Val Thr Lys Arg Ser Arg Leu Arg Arg
1 5 10 15
Gly His Ala His Leu Gly Gly Asn Lys Gly Val Arg Gly Ile Cys Ser
20 25 30
Leu Tyr Leu Ala Gly Leu Ser Arg Gly Leu Ser Arg Val His Ala Gln
35 40 45
Arg Ser His Ala Ala Thr Met Ala Asp Ala Gly Ile Pro Asp Glu Ile
50 55 60
Leu Tyr Ser Asp Ile Ser Asp Asp Glu Ile Ile Ile Asp Gly Asp Gly
65 70 75 80
Asp Gly Asp Ser Ser Gly Asp Glu Asp Asp Asp Asp Gly Gly Leu Thr
85 90 95
Arg Gln Ala Ala Ser Arg Ile Ala Thr Asp Leu Gly Phe Glu Val Leu
100 105 110
Gln Pro Leu Gln Ser Gly Ser Glu Gly Arg Val Phe Val Ala Arg Arg
115 120 125
Pro Gly Glu Ala Asp Thr Val Val Leu Lys Val Gly Gln Lys Pro Ser
130 135 140
Thr Leu Met Glu Gly Met Leu Leu Lys Arg Leu Ala His Asp Asn Val
145 150 155 160
Met Ser Leu Lys Gln Met Leu Ala Arg Gly Pro Val Thr Cys Leu Val
165 170 175
Leu Pro His Phe Arg Cys Asp Leu Tyr Ser Tyr Leu Thr Met Arg Asp
180 185 190
Gly Pro Leu Asp Met Arg Asp Ala Gly Arg Val Ile Arg Ser Val Leu
195 200 205
Arg Gly Leu Ala Tyr Leu His Gly Met Arg Ile Met His Arg Asp Val
210 215 220
Lys Ala Glu Asn Ile Phe Leu Glu Asp Val Asp Thr Val Cys Leu Gly
225 230 235 240
Asp Leu Gly Ala Ala Arg Cys Asn Val Ala Ala Pro Asn Phe Tyr Gly
245 250 255
Leu Ala Gly Thr Ile Glu Thr Asn Ala Pro Glu Val Leu Ala Arg Asp
260 265 270
Arg Tyr Asp Thr Lys Val Asp Val Trp Gly Ala Gly Val Val Leu Phe
275 280 285
Glu Thr Leu Ala Tyr Pro Lys Thr Ile Ala Gly Gly Asp Glu Pro Ala
290 295 300
Ile Asn Gly Glu Met His Leu Ile Asp Leu Ile Arg Ala Leu Gly Val
305 310 315 320
His Pro Glu Glu Phe Pro Pro Asp Thr Arg Leu Arg Ser Glu Phe Val
325 330 335
Arg Tyr Ala Gly Thr His Arg Gln Pro Tyr Thr Gln Tyr Ala Arg Val
340 345 350
Ala Arg Leu Gly Leu Pro Glu Thr Gly Ala Phe Leu Ile Tyr Lys Met
355 360 365
Leu Thr Phe Asp Pro Val Arg Arg Pro Ser Ala Asp Glu Ile Leu Asn
370 375 380
Phe Gly Met Trp Thr Val
385 390
<210> 296
<211> 1170
<212> DNA
<213> Suid herpesvirus 2
<400> 296
atgctggcga tgtggagatg ggtcaccaag aggtcgcggc tccgccgagg ccacgcccat 60
cttgggggaa ataaaggagt ccggggaatt tgttccttat accttgccgg gctcagcagg 120
gggttgtcgc gcgtccacgc ccagcgctcg cacgcagcaa caatggccga cgccggaatc 180
cccgacgaga tcctgtactc ggacatcagc gacgacgaga tcatcatcga cggcgacggc 240
gacggcgaca gcagcgggga cgaggacgac gatgacgggg ggctgacgcg gcaggccgcg 300
tcgcgcatcg ccacggacct gggcttcgag gtgctgcagc ccctgcagtc gggctcggag 360
ggccgcgtct tcgtggcccg ccggcccggc gaggcggaca cggtggtgct gaaggtgggc 420
cagaagccct cgacgctgat ggagggcatg ctgctgaagc gcctggccca cgataacgtc 480
atgagcctga agcagatgct cgcccggggc ccggtgacgt gcctggtcct gccgcacttt 540
cggtgcgatc tgtacagcta cctgaccatg cgggacgggc cgctggacat gcgcgacgcc 600
gggcgcgtga tccggtccgt gctccgcggg ctcgcctacc tgcacgggat gcgcatcatg 660
caccgcgacg tcaaggcgga gaacatcttc ctcgaggacg tggacacggt gtgcctgggg 720
gacctcgggg ccgcgcgctg caacgtggcg gcgcccaact tttacgggct cgccgggacc 780
atcgagacca acgcccccga ggtgctcgcg cgcgaccgct acgacaccaa ggtcgacgtc 840
tggggcgcgg gggtggtgct cttcgagacg ctggcctacc ccaagacgat cgccggcggg 900
gacgagcccg cgatcaacgg ggagatgcac ctgatcgacc tcatccgcgc cctcggggtg 960
caccccgagg agttcccgcc cgacacgcgc ctccggagcg agttcgtccg gtacgccggg 1020
acccaccgcc agccgtacac gcagtacgcg cgcgtggctc gcctcgggct gcccgagacg 1080
ggggctttcc tgatttacaa gatgttgacg tttgatcccg tccgccgccc ttccgctgat 1140
gagatactca actttggaat gtggaccgta 1170
<210> 297
<211> 1170
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding PRRV Npro protein
<400> 297
atgctggcca tgtggcgctg ggtcaccaag agaagcagac tgagaagagg acacgcccac 60
ctcggcggaa acaagggcgt tagaggcatc tgcagcctgt atctggccgg cctgtctaga 120
ggactgagca gagtgcatgc ccagagatct cacgccgcca caatggccga tgctggcatc 180
cctgatgaga tcctgtacag cgacatcagc gacgacgaga tcatcatcga tggcgacggc 240
gacggggata gcagcggaga tgaggatgac gatgatggcg gcctgacaag acaggctgcc 300
agcagaattg ccaccgacct gggatttgag gtgctgcagc ctctgcagtc tggctctgag 360
ggcagagtgt tcgtggctag aaggcctggc gaagccgata ccgtggtgct gaaagtgggc 420
cagaaaccta gcacactgat ggaaggcatg ctgctgaaga gactggccca cgacaacgtg 480
atgagcctga agcagatgct ggctagaggc cctgtgacct gtctggtgct gcctcacttc 540
agatgcgacc tgtactccta cctgaccatg agagatggcc ctctggatat gcgcgacgcc 600
ggcagagtga tcagatctgt gctgagaggc ctggcctacc tgcacggcat gagaatcatg 660
cacagggacg tgaaggccga gaacatcttt ctggaagatg tggacaccgt gtgcctgggc 720
gatctgggag ccgctagatg taatgtggcc gctcctaact tctacggcct ggccggaacc 780
atcgagacaa atgcccctga agtgctggcc cgggacagat acgataccaa ggtggacgtt 840
tggggagccg gcgtggtcct gtttgagaca ctggcttacc ccaagacaat cgctggcggc 900
gacgagcctg ctatcaatgg cgagatgcac ctgatcgacc tgatcagagc cctgggcgtg 960
caccctgagg aattccctcc agacacacgg ctgcggagcg agttcgttag atacgccgga 1020
acacacagac agccctacac acagtatgcc agagtggcca gactgggcct gcctgaaaca 1080
ggcgccttcc tgatctacaa gatgctgacc ttcgatcccg tgcggaggcc ttctgccgat 1140
gagattctga acttcggcat gtggaccgtg 1170
<210> 298
<211> 1170
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding PRRV Npro protein
<400> 298
augcuggcca uguggcgcug ggucaccaag agaagcagac ugagaagagg acacgcccac 60
cucggcggaa acaagggcgu uagaggcauc ugcagccugu aucuggccgg ccugucuaga 120
ggacugagca gagugcaugc ccagagaucu cacgccgcca caauggccga ugcuggcauc 180
ccugaugaga uccuguacag cgacaucagc gacgacgaga ucaucaucga uggcgacggc 240
gacggggaua gcagcggaga ugaggaugac gaugauggcg gccugacaag acaggcugcc 300
agcagaauug ccaccgaccu gggauuugag gugcugcagc cucugcaguc uggcucugag 360
ggcagagugu ucguggcuag aaggccuggc gaagccgaua ccguggugcu gaaagugggc 420
cagaaaccua gcacacugau ggaaggcaug cugcugaaga gacuggccca cgacaacgug 480
augagccuga agcagaugcu ggcuagaggc ccugugaccu gucuggugcu gccucacuuc 540
agaugcgacc uguacuccua ccugaccaug agagauggcc cucuggauau gcgcgacgcc 600
ggcagaguga ucagaucugu gcugagaggc cuggccuacc ugcacggcau gagaaucaug 660
cacagggacg ugaaggccga gaacaucuuu cuggaagaug uggacaccgu gugccugggc 720
gaucugggag ccgcuagaug uaauguggcc gcuccuaacu ucuacggccu ggccggaacc 780
aucgagacaa augccccuga agugcuggcc cgggacagau acgauaccaa gguggacguu 840
uggggagccg gcgugguccu guuugagaca cuggcuuacc ccaagacaau cgcuggcggc 900
gacgagccug cuaucaaugg cgagaugcac cugaucgacc ugaucagagc ccugggcgug 960
cacccugagg aauucccucc agacacacgg cugcggagcg aguucguuag auacgccgga 1020
acacacagac agcccuacac acaguaugcc agaguggcca gacugggccu gccugaaaca 1080
ggcgccuucc ugaucuacaa gaugcugacc uucgaucccg ugcggaggcc uucugccgau 1140
gagauucuga acuucggcau guggaccgug 1170
<210> 299
<211> 481
<212> PRT
<213> human herpesvirus 1
<400> 299
Met Ala Cys Arg Lys Phe Cys Arg Val Tyr Gly Gly Gln Gly Arg Arg
1 5 10 15
Lys Glu Glu Ala Val Pro Pro Glu Thr Lys Pro Ser Arg Val Phe Pro
20 25 30
His Gly Pro Phe Tyr Thr Pro Ala Glu Asp Ala Cys Leu Asp Ser Pro
35 40 45
Pro Pro Glu Thr Pro Lys Pro Ser His Thr Thr Pro Pro Ser Glu Ala
50 55 60
Glu Arg Leu Cys His Leu Gln Glu Ile Leu Ala Gln Met Tyr Gly Asn
65 70 75 80
Gln Asp Tyr Pro Ile Glu Asp Asp Pro Ser Ala Asp Ala Ala Asp Asp
85 90 95
Val Asp Glu Asp Ala Pro Asp Asp Val Ala Tyr Pro Glu Glu Tyr Ala
100 105 110
Glu Glu Leu Phe Leu Pro Gly Asp Ala Thr Gly Pro Leu Ile Gly Ala
115 120 125
Asn Asp His Ile Pro Pro Pro Cys Gly Ala Ser Pro Pro Gly Ile Arg
130 135 140
Arg Arg Ser Arg Asp Glu Ile Gly Ala Thr Gly Phe Thr Ala Glu Glu
145 150 155 160
Leu Asp Ala Met Asp Arg Glu Ala Ala Arg Ala Ile Ser Arg Gly Gly
165 170 175
Lys Pro Pro Ser Thr Met Ala Lys Leu Val Thr Gly Met Gly Phe Thr
180 185 190
Ile His Gly Ala Leu Thr Pro Gly Ser Glu Gly Cys Val Phe Asp Ser
195 200 205
Ser His Pro Asp Tyr Pro Gln Arg Val Ile Val Lys Ala Gly Trp Tyr
210 215 220
Thr Ser Thr Ser His Glu Ala Arg Leu Leu Arg Arg Leu Asp His Pro
225 230 235 240
Ala Ile Leu Pro Leu Leu Asp Leu His Val Val Ser Gly Val Thr Cys
245 250 255
Leu Val Leu Pro Lys Tyr Gln Ala Asp Leu Tyr Thr Tyr Leu Ser Arg
260 265 270
Arg Leu Asn Pro Leu Gly Arg Pro Gln Ile Ala Ala Val Ser Arg Gln
275 280 285
Leu Leu Ser Ala Val Asp Tyr Ile His Arg Gln Gly Ile Ile His Arg
290 295 300
Asp Ile Lys Thr Glu Asn Ile Phe Ile Asn Thr Pro Glu Asp Ile Cys
305 310 315 320
Leu Gly Asp Phe Gly Ala Ala Cys Phe Val Gln Gly Ser Arg Ser Ser
325 330 335
Pro Phe Pro Tyr Gly Ile Ala Gly Thr Ile Asp Thr Asn Ala Pro Glu
340 345 350
Val Leu Ala Gly Asp Pro Tyr Thr Thr Thr Val Asp Ile Trp Ser Ala
355 360 365
Gly Leu Val Ile Phe Glu Thr Ala Val His Asn Ala Ser Leu Phe Ser
370 375 380
Ala Pro Arg Gly Pro Lys Arg Gly Pro Cys Asp Ser Gln Ile Thr Arg
385 390 395 400
Ile Ile Arg Gln Ala Gln Val His Val Asp Glu Phe Ser Pro His Pro
405 410 415
Glu Ser Arg Leu Thr Ser Arg Tyr Arg Ser Arg Ala Ala Gly Asn Asn
420 425 430
Arg Pro Pro Tyr Thr Arg Pro Ala Trp Thr Arg Tyr Tyr Lys Met Asp
435 440 445
Ile Asp Val Glu Tyr Leu Val Cys Lys Ala Leu Thr Phe Asp Gly Ala
450 455 460
Leu Arg Pro Ser Ala Ala Glu Leu Leu Cys Leu Pro Leu Phe Gln Gln
465 470 475 480
Lys
<210> 300
<211> 1443
<212> DNA
<213> human herpesvirus 1
<400> 300
atggcctgtc gtaagttttg tcgcgtttac gggggacagg gcaggaggaa ggaggaggcc 60
gtcccgccgg agacaaagcc gtcccgggtg tttcctcatg gcccctttta taccccagcc 120
gaggacgcgt gcctggactc cccgcccccg gagaccccca aaccttccca caccacacca 180
cccagcgagg ccgagcgcct gtgtcatctg caggagatcc ttgcccagat gtacggaaac 240
caggactacc ccatagagga cgaccccagc gcggatgccg cggacgatgt cgacgaggac 300
gccccggacg acgtggccta tccggaggaa tacgcagagg agctttttct gcccggggac 360
gcgaccggtc cccttatcgg ggccaacgac cacatccctc ccccgtgtgg cgcatctccc 420
cccggtatac gacgacgcag ccgggatgag attggggcca cgggatttac cgcggaagag 480
ctggacgcca tggacaggga ggcggctcga gccatcagcc gcggcggcaa gcccccctcg 540
accatggcca agctggtgac tggcatgggc tttacgatcc acggagcgct caccccagga 600
tcggaggggt gtgtctttga cagcagccat ccagattacc cccaacgggt aatcgtgaag 660
gcggggtggt acacgagcac gagccacgag gcgcgactgc tgaggcgact ggaccacccg 720
gcgatcctgc ccctcctgga cctgcatgtc gtctccgggg tcacgtgtct ggtcctcccc 780
aagtaccagg ccgacctgta tacctatctg agtaggcgcc tgaacccact gggacgcccg 840
cagatcgcag cggtctcccg gcagctccta agcgccgttg actacattca ccgccagggc 900
attatccacc gcgacattaa gaccgaaaat atttttatta acacccccga ggacatttgc 960
ctgggggact ttggcgccgc gtgcttcgtg cagggttccc gatcaagccc cttcccctac 1020
ggaatcgccg gaaccatcga caccaacgcc cccgaggtcc tggccgggga tccgtatacc 1080
acgaccgtcg acatttggag cgccggtctg gtgatcttcg agactgccgt ccacaacgcg 1140
tccttgttct cggccccccg cggccccaaa aggggcccgt gcgacagtca gatcacccgc 1200
atcatccgac aggcccaggt ccacgttgac gagttttccc cgcatccaga atcgcgcctc 1260
acctcgcgct accgctcccg cgcggccggg aacaatcgcc cgccgtacac ccgaccggcc 1320
tggacccgct actacaagat ggacatagac gtcgaatatc tggtttgcaa agccctcacc 1380
ttcgacggcg cgcttcgccc cagcgccgca gagctgcttt gtttgccgct gtttcaacag 1440
aaa 1443
<210> 301
<211> 1443
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding HSV1 US3 protein
<400> 301
atggcctgcc ggaagttctg tagagtgtac ggcggacagg ggcgcagaaa agaggaagcc 60
gttcctcctg agacaaagcc cagcagagtg ttccctcacg gcccctttta cacccctgcc 120
gaagatgcct gtctggacag ccctcctcca gaaacaccta agcctagcca caccacacct 180
ccaagcgagg ccgaaagact gtgccatctg caagagattc tggcccagat gtacggcaac 240
caggactacc ccatcgagga cgatccatct gccgatgccg ccgacgatgt ggatgaagat 300
gcccctgatg acgtggccta tcctgaggaa tacgccgagg aactgttcct gcctggcgac 360
gctacaggac ctctgatcgg agccaacgat cacatccctc caccttgtgg cgctagccct 420
cctggcatca gaagaagaag cagggacgag atcggcgcca ccggctttac agccgaagaa 480
ctggacgcca tggacagaga agccgccaga gccatttcta gaggcggcaa gcctcctagc 540
accatggcca aactggttac cggcatgggc ttcaccattc acggcgctct gacacctggc 600
tctgagggct gtgtgttcga cagctctcac cccgactatc cccagcgcgt gatcgtgaaa 660
gccggctggt acacaagcac aagccacgag gccagactgc tgcggagact ggatcatcct 720
gccatcctgc ctctgctgga tctgcatgtg gtgtccggcg tgacatgtct ggtgctgcct 780
aagtaccagg ccgacctgta cacctacctg agcagaaggc tgaaccctct gggcagacct 840
cagattgccg ctgtgtcaag acagctgctg agcgctgtgg actacatcca cagacagggc 900
atcatccacc gggacatcaa gaccgagaat atcttcatca acacgcccga ggacatctgc 960
ctgggcgatt ttggcgccgc ttgcttcgtg caaggcagca gaagcagccc ctttccttat 1020
ggaatcgccg gcaccatcga cacaaacgcc cctgaagttc tggccggcga tccttacacc 1080
accaccgtgg atatttggag cgccggactg gtcatcttcg agacagccgt gcataacgcc 1140
agcctgttct ctgcccctag aggccctaaa agaggcccct gcgatagcca gatcacccgg 1200
atcattagac aggcccaggt gcacgtggac gagttctctc cacatcctga gagccggctg 1260
accagccggt acagatctag agccgccgga aacaaccggc ctccatacac aagacctgcc 1320
tggacacggt actacaagat ggacatcgac gtggaatacc tcgtgtgcaa ggccctgacc 1380
ttcgatggcg cccttagacc ttctgccgcc gaactgcttt gcctgccact gttccagcag 1440
aag 1443
<210> 302
<211> 1443
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding HSV1 US3 protein
<400> 302
auggccugcc ggaaguucug uagaguguac ggcggacagg ggcgcagaaa agaggaagcc 60
guuccuccug agacaaagcc cagcagagug uucccucacg gccccuuuua caccccugcc 120
gaagaugccu gucuggacag cccuccucca gaaacaccua agccuagcca caccacaccu 180
ccaagcgagg ccgaaagacu gugccaucug caagagauuc uggcccagau guacggcaac 240
caggacuacc ccaucgagga cgauccaucu gccgaugccg ccgacgaugu ggaugaagau 300
gccccugaug acguggccua uccugaggaa uacgccgagg aacuguuccu gccuggcgac 360
gcuacaggac cucugaucgg agccaacgau cacaucccuc caccuugugg cgcuagcccu 420
ccuggcauca gaagaagaag cagggacgag aucggcgcca ccggcuuuac agccgaagaa 480
cuggacgcca uggacagaga agccgccaga gccauuucua gaggcggcaa gccuccuagc 540
accauggcca aacugguuac cggcaugggc uucaccauuc acggcgcucu gacaccuggc 600
ucugagggcu guguguucga cagcucucac cccgacuauc cccagcgcgu gaucgugaaa 660
gccggcuggu acacaagcac aagccacgag gccagacugc ugcggagacu ggaucauccu 720
gccauccugc cucugcugga ucugcaugug guguccggcg ugacaugucu ggugcugccu 780
aaguaccagg ccgaccugua caccuaccug agcagaaggc ugaacccucu gggcagaccu 840
cagauugccg cugugucaag acagcugcug agcgcugugg acuacaucca cagacagggc 900
aucauccacc gggacaucaa gaccgagaau aucuucauca acacgcccga ggacaucugc 960
cugggcgauu uuggcgccgc uugcuucgug caaggcagca gaagcagccc cuuuccuuau 1020
ggaaucgccg gcaccaucga cacaaacgcc ccugaaguuc uggccggcga uccuuacacc 1080
accaccgugg auauuuggag cgccggacug gucaucuucg agacagccgu gcauaacgcc 1140
agccuguucu cugccccuag aggcccuaaa agaggccccu gcgauagcca gaucacccgg 1200
aucauuagac aggcccaggu gcacguggac gaguucucuc cacauccuga gagccggcug 1260
accagccggu acagaucuag agccgccgga aacaaccggc cuccauacac aagaccugcc 1320
uggacacggu acuacaagau ggacaucgac guggaauacc ucgugugcaa ggcccugacc 1380
uucgauggcg cccuuagacc uucugccgcc gaacugcuuu gccugccacu guuccagcag 1440
aag 1443
<210> 303
<211> 414
<212> PRT
<213> human herpesvirus 2
<400> 303
Met Ala Asp Ile Pro Pro Asp Pro Pro Ala Leu Asn Thr Thr Pro Val
1 5 10 15
Asn His Ala Pro Pro Ser Pro Pro Pro Gly Ser Arg Lys Arg Arg Arg
20 25 30
Pro Val Leu Pro Ser Ser Ser Glu Ser Glu Gly Lys Pro Asp Thr Glu
35 40 45
Ser Glu Ser Ser Ser Thr Glu Ser Ser Glu Asp Glu Ala Gly Asp Leu
50 55 60
Arg Gly Gly Arg Arg Arg Ser Pro Arg Glu Leu Gly Gly Arg Tyr Phe
65 70 75 80
Leu Asp Leu Ser Ala Glu Ser Thr Thr Gly Thr Glu Ser Glu Gly Thr
85 90 95
Gly Pro Ser Asp Asp Asp Asp Asp Asp Ala Ser Asp Gly Trp Leu Val
100 105 110
Asp Thr Pro Pro Arg Lys Ser Lys Arg Pro Arg Ile Asn Leu Arg Leu
115 120 125
Thr Ser Ser Pro Asp Arg Arg Ala Gly Val Val Phe Pro Glu Val Trp
130 135 140
Arg Asn Asp Arg Pro Ile Arg Ala Ala Gln Pro Gln Ala Pro Ala Gln
145 150 155 160
Ser Ser Gly Asp Arg Ala Ala Ala Pro Arg Arg Ser Ala Arg Gln Ala
165 170 175
Gln Met Arg Ser Gly Ala Ala Trp Thr Leu Asp Leu His Tyr Ile Arg
180 185 190
Gln Cys Val Asn Gln Leu Phe Arg Ile Leu Arg Ala Ala Pro Asn Pro
195 200 205
Pro Gly Ser Ala Asn Arg Leu Arg His Leu Val Arg Asp Cys Tyr Leu
210 215 220
Met Gly Tyr Cys Arg Thr Arg Leu Gly Pro Arg Thr Trp Gly Arg Leu
225 230 235 240
Leu Gln Ile Ser Gly Gly Thr Trp Asp Val Arg Leu Arg Asn Ala Ile
245 250 255
Arg Glu Val Glu Ala Arg Phe Glu Pro Ala Ala Glu Pro Val Cys Glu
260 265 270
Leu Pro Cys Leu Asn Ala Arg Arg Tyr Gly Pro Glu Cys Asp Val Gly
275 280 285
Asn Leu Glu Thr Asn Gly Gly Ser Thr Ser Asp Asp Glu Ile Ser Asp
290 295 300
Ala Thr Asp Ser Asp Asp Thr Leu Ala Ser His Ser Asp Thr Glu Gly
305 310 315 320
Gly Pro Ser Pro Ala Gly Arg Glu Asn Pro Glu Ser Ala Ser Gly Gly
325 330 335
Ala Ile Ala Ala Arg Leu Glu Cys Glu Phe Gly Thr Phe Asp Trp Thr
340 345 350
Ser Glu Glu Gly Ser Gln Pro Trp Leu Ser Ala Val Val Ala Asp Thr
355 360 365
Ser Ser Ala Glu Arg Ser Gly Leu Pro Ala Pro Gly Ala Cys Arg Ala
370 375 380
Thr Glu Ala Pro Glu Arg Glu Asp Gly Cys Arg Lys Met Arg Phe Pro
385 390 395 400
Ala Ala Cys Pro Tyr Pro Cys Gly His Thr Phe Leu Arg Pro
405 410
<210> 304
<211> 1242
<212> DNA
<213> human herpesvirus 2
<400> 304
atggcagaca tccccccgga cccgcccgcg ctcaacacga cgcctgtgaa tcatgctccc 60
ccatccccgc ccccgggttc acggaagcgc agacgccccg tcctccccag ctcgtcggaa 120
tctgagggta agcccgacac agaatcggaa tcctcctcga ccgagtcgtc cgaggatgag 180
gcgggagacc tacgcggcgg gcgccgtcgc tccccgcggg agctcggggg gaggtatttt 240
ttggatctgt cggcagaatc gaccacgggg acggaatcgg agggaacggg gccgtcggac 300
gacgatgatg atgatgcgtc agacggctgg ttggttgaca cccccccccg taaatccaag 360
cgaccccgaa tcaacctgcg attaacgagc tcccccgacc ggcgcgcggg tgtggttttc 420
cccgaggtgt ggagaaacga cagacctatc cgcgcggcgc aaccccaggc cccggcccag 480
tcttccgggg atcgcgcagc cgcaccgcgg cgctctgctc gccaggccca gatgcggagc 540
ggagccgcct ggacgcttga tctgcattac atacgccagt gcgtcaacca gctctttcgg 600
atcctgcgtg ccgccccgaa cccgcccggc agcgccaacc gcctgcgcca cctggtgcga 660
gactgctacc tcatgggcta ctgccggacc cgcctggggc cgcgcacgtg gggccgcctg 720
ctgcagatct cgggcggaac ctgggacgtg cgcctgcgaa acgcaatccg ggaggtcgag 780
gcgcgttttg aacccgccgc cgagcccgtg tgcgagctgc cctgtctgaa cgccaggcgt 840
tacggccccg agtgtgatgt tggcaatctc gagaccaacg gcggctcgac gagcgatgat 900
gagatatcgg atgcgacgga ctcggacgat accctcgcgt cccattccga cacggagggg 960
gggccctccc cggccggccg ggagaacccg gaatccgcgt ccggcggggc tatcgcggct 1020
cggctggagt gtgagtttgg gacgtttgac tggacgtccg aggagggctc ccagccctgg 1080
ctgtccgcgg tggtcgccga taccagctcc gccgaacgct ctggcctacc cgccccgggc 1140
gcgtgtcgcg caacggaagc cccagaacgc gaggacgggt gccgaaaaat gcgcttcccc 1200
gccgcctgcc cctatccctg cggccacaca tttctccggc ca 1242
<210> 305
<211> 1242
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding HSV2 US1 protein
<400> 305
atggccgaca ttcctcctga tcctccagct ctgaacacca cacctgtgaa tcacgcccct 60
ccatctccac cacctggcag cagaaagaga agaaggcctg tcctgcctag cagcagcgag 120
tctgagggca agcctgatac agagagcgag agcagcagca cagagagcag cgaggacgaa 180
gctggcgatc ttagaggcgg cagaagaaga agccccagag aactcggcgg cagatacttc 240
ctggatctga gcgccgagag caccaccggc actgaatctg aaggcacagg ccccagcgac 300
gacgatgacg atgatgcctc tgatggctgg ctggtggaca cccctcctag aaagtccaag 360
cggcccagaa tcaacctgcg gctgacaagc tctcctgatc gcagagctgg cgtggtgttc 420
cccgaagtgt ggcggaacga cagacctatc agagccgctc agcctcaggc tcctgctcag 480
tctagcggag atagagctgc cgctcctaga agatctgcca gacaggccca gatgagaagc 540
ggagctgctt ggacactgga cctgcactac atccggcagt gcgtgaacca gctgttccgg 600
atccttcggg ctgcccctaa tccacctggc tccgccaata gactgagaca ccttgtgcgg 660
gactgctacc tgatgggcta ctgcagaaca agactgggcc ccagaacatg gggcagactg 720
ctgcaaatct ctggcggcac atgggacgtg cggctgagaa acgccattag agaggtggaa 780
gccagattcg agccagccgc tgagcctgtg tgtgaactgc cttgtctgaa cgctcggaga 840
tacggccccg agtgtgatgt gggcaacctg gaaacaaatg gcggcagcac ctccgacgac 900
gagatctctg atgccaccga cagcgacgat acactggcca gccacagcga tacagaaggc 960
ggaccatctc ctgccggaag agagaatcct gagtctgcct ctggcggagc tatcgccgca 1020
agactggaat gcgagttcgg caccttcgac tggacaagcg aggaaggctc tcagccttgg 1080
ctgtctgctg tggtggccga tacctctagc gccgaaagat ctggacttcc tgctcctggc 1140
gcctgcagag ctacagaagc tcctgaaaga gaggacggct gcagaaagat gcggttccct 1200
gccgcctgtc cttatccttg cggccacaca tttctgcggc ct 1242
<210> 306
<211> 1242
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding HSV2 US1 protein
<400> 306
auggccgaca uuccuccuga uccuccagcu cugaacacca caccugugaa ucacgccccu 60
ccaucuccac caccuggcag cagaaagaga agaaggccug uccugccuag cagcagcgag 120
ucugagggca agccugauac agagagcgag agcagcagca cagagagcag cgaggacgaa 180
gcuggcgauc uuagaggcgg cagaagaaga agccccagag aacucggcgg cagauacuuc 240
cuggaucuga gcgccgagag caccaccggc acugaaucug aaggcacagg ccccagcgac 300
gacgaugacg augaugccuc ugauggcugg cugguggaca ccccuccuag aaaguccaag 360
cggcccagaa ucaaccugcg gcugacaagc ucuccugauc gcagagcugg cgugguguuc 420
cccgaagugu ggcggaacga cagaccuauc agagccgcuc agccucaggc uccugcucag 480
ucuagcggag auagagcugc cgcuccuaga agaucugcca gacaggccca gaugagaagc 540
ggagcugcuu ggacacugga ccugcacuac auccggcagu gcgugaacca gcuguuccgg 600
auccuucggg cugccccuaa uccaccuggc uccgccaaua gacugagaca ccuugugcgg 660
gacugcuacc ugaugggcua cugcagaaca agacugggcc ccagaacaug gggcagacug 720
cugcaaaucu cuggcggcac augggacgug cggcugagaa acgccauuag agagguggaa 780
gccagauucg agccagccgc ugagccugug ugugaacugc cuugucugaa cgcucggaga 840
uacggccccg agugugaugu gggcaaccug gaaacaaaug gcggcagcac cuccgacgac 900
gagaucucug augccaccga cagcgacgau acacuggcca gccacagcga uacagaaggc 960
ggaccaucuc cugccggaag agagaauccu gagucugccu cuggcggagc uaucgccgca 1020
agacuggaau gcgaguucgg caccuucgac uggacaagcg aggaaggcuc ucagccuugg 1080
cugucugcug ugguggccga uaccucuagc gccgaaagau cuggacuucc ugcuccuggc 1140
gccugcagag cuacagaagc uccugaaaga gaggacggcu gcagaaagau gcgguucccu 1200
gccgccuguc cuuauccuug cggccacaca uuucugcggc cu 1242
<210> 307
<211> 168
<212> PRT
<213> Classical swine fever virus
<400> 307
Met Glu Leu Asn His Phe Glu Leu Leu Tyr Lys Thr Ser Lys Gln Lys
1 5 10 15
Pro Val Gly Val Glu Glu Pro Val Tyr Asp Thr Ala Gly Arg Pro Leu
20 25 30
Phe Gly Asn Pro Ser Glu Val His Pro Gln Ser Thr Leu Lys Leu Pro
35 40 45
His Asp Arg Gly Arg Gly Asp Ile Arg Thr Thr Leu Arg Asp Leu Pro
50 55 60
Arg Lys Gly Asp Cys Arg Ser Gly Asn His Leu Gly Pro Val Ser Gly
65 70 75 80
Ile Tyr Ile Lys Pro Gly Pro Val Tyr Tyr Gln Asp Tyr Thr Gly Pro
85 90 95
Val Tyr His Arg Ala Pro Leu Glu Phe Phe Asp Glu Ala Gln Phe Cys
100 105 110
Glu Val Thr Lys Arg Ile Gly Arg Val Thr Gly Ser Asp Gly Lys Leu
115 120 125
Tyr His Ile Tyr Val Cys Val Asp Gly Cys Ile Leu Leu Lys Leu Ala
130 135 140
Lys Arg Gly Thr Pro Arg Thr Leu Lys Trp Ile Arg Asn Phe Thr Asn
145 150 155 160
Cys Pro Leu Trp Val Thr Ser Cys
165
<210> 308
<211> 504
<212> DNA
<213> Classical swine fever virus
<400> 308
atggagttga atcattttga attattatac aaaacaagca aacaaaaacc agtgggagtg 60
gaggaaccgg tgtatgacac cgcggggaga ccactatttg ggaacccaag tgaggtacac 120
ccacaatcaa cgctgaagct gccacacgac agggggagag gagatatcag aacaacactg 180
agggacctac ccaggaaagg tgactgtagg agtggcaacc atctaggccc ggttagtggg 240
atatacataa agcccggccc tgtctactat caggactaca cgggcccagt ctatcacaga 300
gctcctttag agttctttga tgaggcccag ttctgcgagg tgactaagag aataggcagg 360
gtcacgggta gtgatggtaa gctttaccac atatatgtgt gcgtcgatgg ttgcatactg 420
ctgaaattag ccaaaagggg cacacccaga accctaaagt ggattaggaa cttcaccaac 480
tgtccattat gggtaaccag ttgc 504
<210> 309
<211> 504
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding CSFV NPro protein
<400> 309
atggaactga accacttcga gctgctgtac aagaccagca agcagaaacc cgtgggcgtc 60
gaggaacccg tgtatgatac agctggcaga cccctgttcg gcaacccctc tgaagtgcac 120
cctcagagca cactgaagct gccccacgat agaggcagag gcgacatcag aaccacactg 180
cgggacctgc ctagaaaggg cgattgcaga agcggcaatc atctgggccc tgtgtccggc 240
atctacatca agcctggacc agtgtactac caggactaca caggccccgt gtaccacaga 300
gcccctctgg aattcttcga cgaggcccag ttctgcgaag tgaccaagag aatcggcaga 360
gtgaccggct ccgacggcaa gctgtaccac atctacgtgt gcgtggacgg ctgcatcctg 420
ctgaagctgg ccaagagagg cacccctaga acactgaagt ggatccggaa cttcaccaac 480
tgtcctctgt gggtcaccag ctgc 504
<210> 310
<211> 504
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding CSFV NPro protein
<400> 310
auggaacuga accacuucga gcugcuguac aagaccagca agcagaaacc cgugggcguc 60
gaggaacccg uguaugauac agcuggcaga ccccuguucg gcaaccccuc ugaagugcac 120
ccucagagca cacugaagcu gccccacgau agaggcagag gcgacaucag aaccacacug 180
cgggaccugc cuagaaaggg cgauugcaga agcggcaauc aucugggccc uguguccggc 240
aucuacauca agccuggacc aguguacuac caggacuaca caggccccgu guaccacaga 300
gccccucugg aauucuucga cgaggcccag uucugcgaag ugaccaagag aaucggcaga 360
gugaccggcu ccgacggcaa gcuguaccac aucuacgugu gcguggacgg cugcauccug 420
cugaagcugg ccaagagagg caccccuaga acacugaagu ggauccggaa cuucaccaac 480
uguccucugu gggucaccag cugc 504
<210> 311
<211> 168
<212> PRT
<213> Border disease virus
<400> 311
Met Glu Leu Asn Lys Phe Glu Leu Leu Tyr Lys Thr Ser Lys Gln Arg
1 5 10 15
Pro Val Gly Ala Val Glu Pro Val Tyr Asp Ser Ala Gly Asn Pro Leu
20 25 30
Tyr Gly Glu Arg Thr Thr Val His Pro Gln Ala Thr Leu Lys Leu Pro
35 40 45
His His Arg Gly Val Ala Glu Val Ile Thr Thr Leu Lys Asp Leu Pro
50 55 60
Arg Lys Gly Asp Cys Arg Ser Gly Asn His Arg Gly Pro Val Ser Gly
65 70 75 80
Ile Tyr Ile Lys Pro Gly Pro Val Ile Tyr Gln Asp Tyr Lys Arg Pro
85 90 95
Val Tyr His Arg Ala Pro Leu Glu Gln Phe Thr Lys Val Gln Ile Cys
100 105 110
Glu Ala Thr Lys Arg Val Gly Arg Val Thr Gly Ser Asp Gly Lys Leu
115 120 125
Tyr His Leu Tyr Val Cys Met Asp Gly Cys Ile Leu Leu Lys Leu Ala
130 135 140
Ser Arg Thr Val Asn Ala Val Leu Lys Trp Thr His Asn Thr Leu Asp
145 150 155 160
Cys Pro Leu Trp Val Thr Ser Cys
165
<210> 312
<211> 504
<212> DNA
<213> Border disease virus
<400> 312
atggagttga ataagtttga acttttatac aaaacaagta aacaaagacc agtaggggct 60
gttgaaccag tttatgactc agcgggtaac cccctatatg gtgaaagaac aacagtacac 120
ccgcaagcca ctctgaaact accacatcac aggggagtag ccgaggtgat aacaaccctg 180
aaggatttgc ccaggaaagg agactgcagg agtggaaacc atcgaggccc agtgagtggt 240
atatacatca agccaggtcc agtcatatac caggattaca agagaccggt gtaccacagg 300
gctcctctgg agcagttcac gaaggtacaa atctgtgagg ctacgaaaag ggtggggaga 360
gtcactggca gcgatggcaa attgtaccac ctatacgttt gcatggatgg ttgcatattg 420
ctgaaactgg caagcaggac cgtgaatgca gtgctaaaat ggacacataa cactctggac 480
tgtccacttt gggttacaag ctgc 504
<210> 313
<211> 504
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding BDV Npro protein
<400> 313
atggaactga acaagttcga gctgctgtac aagaccagca agcagaggcc tgtgggagcc 60
gtggaacctg tgtatgatag cgccggcaat cccctgtacg gcgagagaac aacagtgcac 120
cctcaggcca cactgaagct gcctcatcat agaggcgtgg ccgaagtgat cacaaccctg 180
aaggacctgc ctcggaaggg cgattgcaga agcggcaatc acagaggccc tgtgtccggc 240
atctacatca agcccggacc tgtgatctac caggactaca agcggcccgt gtaccacaga 300
gcacccctgg aacagttcac caaggtgcag atttgcgagg ccaccaagcg cgtgggaaga 360
gtgacaggct ctgacggcaa gctgtaccac ctgtacgtgt gcatggacgg ctgcatcctg 420
ctgaaactgg ccagcagaac cgtgaacgcc gtgctgaagt ggacccacaa caccctggat 480
tgccctctgt gggtcaccag ctgt 504
<210> 314
<211> 504
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding BDV Npro protein
<400> 314
auggaacuga acaaguucga gcugcuguac aagaccagca agcagaggcc ugugggagcc 60
guggaaccug uguaugauag cgccggcaau ccccuguacg gcgagagaac aacagugcac 120
ccucaggcca cacugaagcu gccucaucau agaggcgugg ccgaagugau cacaacccug 180
aaggaccugc cucggaaggg cgauugcaga agcggcaauc acagaggccc uguguccggc 240
aucuacauca agcccggacc ugugaucuac caggacuaca agcggcccgu guaccacaga 300
gcaccccugg aacaguucac caaggugcag auuugcgagg ccaccaagcg cgugggaaga 360
gugacaggcu cugacggcaa gcuguaccac cuguacgugu gcauggacgg cugcauccug 420
cugaaacugg ccagcagaac cgugaacgcc gugcugaagu ggacccacaa cacccuggau 480
ugcccucugu gggucaccag cugu 504
<210> 315
<211> 491
<212> PRT
<213> Bovine rotavirus A
<400> 315
Met Ala Thr Phe Lys Asp Ala Cys Tyr His Tyr Lys Lys Leu Asn Lys
1 5 10 15
Leu Asn Ser Leu Val Leu Lys Leu Gly Ala Asn Asp Glu Trp Arg Pro
20 25 30
Ala Pro Val Thr Lys Tyr Lys Gly Trp Cys Leu Asp Cys Cys Gln Tyr
35 40 45
Thr Asn Leu Thr Tyr Cys Arg Gly Cys Ala Leu Tyr His Val Cys Gln
50 55 60
Trp Cys Ser Gln Tyr Asn Arg Cys Phe Leu Asp Glu Glu Pro His Leu
65 70 75 80
Leu Arg Met Arg Thr Phe Lys Asp Val Val Thr Lys Glu Asp Ile Glu
85 90 95
Gly Leu Leu Thr Met Tyr Glu Thr Leu Phe Pro Ile Asn Glu Lys Leu
100 105 110
Val Asn Lys Phe Ile Asn Ser Val Lys Gln Arg Lys Cys Arg Asn Glu
115 120 125
Tyr Leu Leu Glu Trp Tyr Asn His Leu Leu Met Pro Ile Thr Leu Gln
130 135 140
Ala Leu Thr Ile Asn Leu Glu Asp Asn Val Tyr Tyr Met Phe Gly Tyr
145 150 155 160
Tyr Asp Cys Met Glu His Glu Asn Gln Thr Pro Phe Gln Phe Val Asn
165 170 175
Leu Leu Glu Lys Tyr Asp Lys Leu Leu Leu Asp Asp Arg Asn Phe His
180 185 190
Arg Met Ser His Leu Pro Val Ile Leu Gln Gln Glu Tyr Ala Leu Arg
195 200 205
Tyr Phe Ser Lys Ser Arg Phe Leu Ser Lys Gly Lys Lys Arg Leu Ser
210 215 220
Arg Ser Asp Phe Ser Asp Asn Leu Met Glu Asp Arg His Ser Pro Thr
225 230 235 240
Ser Leu Met Gln Val Val Arg Asn Cys Ile Ser Ile His Ile Asp Asp
245 250 255
Cys Glu Trp Asn Lys Ala Cys Thr Leu Ile Val Asp Ala Arg Asn Tyr
260 265 270
Ile Ser Ile Met Asn Ser Ser Tyr Thr Glu His Tyr Ser Val Ser Gln
275 280 285
Arg Cys Lys Leu Phe Thr Lys Tyr Lys Phe Gly Ile Val Ser Lys Leu
290 295 300
Val Lys Pro Asn Tyr Ile Phe Ser Ser His Glu Ser Cys Ala Leu Asn
305 310 315 320
Val His Asn Cys Lys Trp Cys Gln Ile Asn Asn His Tyr Lys Val Trp
325 330 335
Glu Asp Phe Arg Leu Arg Lys Ile Tyr Asn Asn Val Met Asp Phe Ile
340 345 350
Arg Ala Leu Val Lys Ser Asn Val Asn Val Gly His Cys Ser Ser Gln
355 360 365
Glu Ser Val Tyr Lys Tyr Val Pro Asp Leu Phe Leu Ile Cys Lys Thr
370 375 380
Glu Lys Trp Ser Glu Ala Val Glu Met Leu Phe Asn Tyr Leu Glu Pro
385 390 395 400
Val Asn Val Asn Gly Thr Glu Tyr Val Leu Leu Asp Tyr Glu Val Asn
405 410 415
Trp Glu Val Arg Gly Leu Val Met Gln Asn Met Asp Gly Lys Val Pro
420 425 430
Arg Ile Leu Asn Met Asn Asp Thr Lys Lys Ile Leu Ser Ala Met Ile
435 440 445
Phe Asp Trp Phe Asp Thr Arg Tyr Met Arg Glu Thr Pro Met Thr Thr
450 455 460
Ser Thr Thr Asn Gln Leu Arg Thr Leu Asn Lys Arg Asn Glu Leu Ile
465 470 475 480
Asp Glu Tyr Asp Leu Glu Leu Ser Asp Val Glu
485 490
<210> 316
<211> 1473
<212> DNA
<213> Bovine rotavirus A
<400> 316
atggcgactt ttaaggacgc ttgttatcat tataaaaagt tgaataaatt aaatagttta 60
gtgctcaaac taggagcaaa tgatgaatgg aggccagcac cagtgacaaa atataaagga 120
tggtgtttag attgttgtca atatacaaat ttgacatatt gcagagggtg cgctctatac 180
catgtatgtc agtggtgcag tcagtataac aggtgtttct tagatgaaga accccatttg 240
ctgagaatgc gaacatttaa agatgtagta acaaaagaag atatagaagg actgctaacc 300
atgtatgaaa cgttgtttcc aataaatgaa aagttagtga ataaattcat aaactctgtg 360
aagcagcgta agtgtaggaa tgagtatttg ttagaatggt ataaccactt actaatgcca 420
ataacattgc aagcattgac tataaatctt gaggataatg tatattatat gtttggatac 480
tatgattgca tggagcatga aaaccaaaca ccattccaat ttgttaacct actagaaaaa 540
tatgataaat tgctactaga tgatagaaat ttccatagaa tgtcacactt accagtaata 600
ttgcaacaag agtatgcgtt gagatatttt tcaaaatcaa gatttttaag taaagggaag 660
aaaagattga gtaggagtga tttctcagat aatcttatgg aagatagaca tagtccaaca 720
tcattaatgc aagtggtacg taactgcatc agtatacaca tagatgattg tgaatggaat 780
aaagcgtgta cgcttatagt tgatgctaga aattatatta gtattatgaa ttcatcgtat 840
actgagcatt acagtgtgtc acaaagatgt aaactgttca ctaagtataa atttgggatt 900
gtatcaaaat tggtgaaacc gaattacatt ttttctagcc atgaatcatg cgcattaaac 960
gtacacaatt gtaaatggtg tcagatcaat aaccattaca aagtgtggga agattttaga 1020
cttaggaaaa tatacaataa tgtaatggat tttatcaggg cacttgtgaa atcgaatgta 1080
aacgttggac attgttcatc acaggaatca gtgtataagt atgtaccgga tttattttta 1140
atttgtaaaa cggaaaaatg gagcgaagct gtcgaaatgt tatttaatta tctagaacca 1200
gtgaacgtaa atggaacgga gtatgtatta ttagactatg aagtgaactg ggaagtgagg 1260
ggactagtca tgcaaaacat ggacgggaaa gtaccaagaa ttttgaatat gaatgataca 1320
aagaagatac tgagtgcaat gatatttgac tggtttgaca caagatatat gagagaaaca 1380
ccaatgacga cgtcaacaac aaaccaactt cgaacactga acaaaaggaa tgagctcata 1440
gatgagtacg atttagaact ttcagatgtt gaa 1473
<210> 317
<211> 1473
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding Bovine RV NS1 protein
<400> 317
atggccacct tcaaggacgc ctgctaccac tacaagaagc tgaacaagct gaatagcctg 60
gtgctgaagc tgggcgccaa tgatgaatgg cgacctgctc ctgtgaccaa gtacaaaggc 120
tggtgcctgg actgctgcca gtacaccaat ctgacctact gcagaggctg cgccctgtac 180
cacgtctgtc agtggtgcag ccagtacaac cggtgcttcc tggacgagga accccatctg 240
ctgcggatgc ggacctttaa ggacgtggtc accaaagagg acatcgaggg cctgctgact 300
atgtacgaga cactgttccc catcaacgag aagctggtca acaagttcat caacagcgtg 360
aagcagcgga agtgccggaa cgagtacctg ctggaatggt acaatcatct gctgatgccc 420
atcacactgc aggccctgac catcaacctg gaagataacg tgtactacat gttcggctac 480
tacgactgca tggaacacga gaatcagacc cctttccagt tcgtgaacct gctcgagaag 540
tacgacaagc tgctgctgga cgaccggaac ttccaccgga tgtctcatct gcccgtgatc 600
ctgcagcaag agtacgccct gcggtacttc agcaagagcc ggtttctgag caagggcaag 660
aagcggctga gcagaagcga cttcagcgac aacctgatgg aagatcggca cagccccacc 720
agcctgatgc aggtcgtcag aaactgcatc agcatccaca tcgacgactg tgaatggaac 780
aaggcctgca cactgatcgt ggacgcccgc aactacatct ccatcatgaa cagcagctac 840
accgagcact acagcgtgtc ccagcggtgc aagctgttca caaagtacaa gttcggcatc 900
gtgtccaagc tcgtgaagcc caattacatc ttcagcagcc acgagagctg tgccctgaac 960
gtgcacaact gcaagtggtg ccagatcaac aatcactaca aagtgtggga agatttccgg 1020
ctgcggaaga tctacaacaa cgtgatggac ttcatccgcg ctctggtcaa gagcaacgtg 1080
aacgtgggcc actgcagcag ccaagagtcc gtgtacaaat acgtgcccga cctgttcctg 1140
atctgcaaga ccgagaagtg gagcgaggcc gtggaaatgc tgttcaacta cctggaacct 1200
gtgaacgtca acggcaccga gtacgtcctg ctggactacg aagtgaactg ggaagtgcgg 1260
ggcctcgtga tgcagaacat ggatggcaag gtgccccgga tcctgaacat gaacgacacc 1320
aagaaaatcc tgagcgccat gatcttcgat tggttcgaca cccggtacat gcgcgagaca 1380
cctatgacca ccagcaccac caaccagctg cggaccctga acaagagaaa cgagctgatc 1440
gacgagtacg acctggaact gagcgacgtg gaa 1473
<210> 318
<211> 1473
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding Bovine RV NS1 protein
<400> 318
auggccaccu ucaaggacgc cugcuaccac uacaagaagc ugaacaagcu gaauagccug 60
gugcugaagc ugggcgccaa ugaugaaugg cgaccugcuc cugugaccaa guacaaaggc 120
uggugccugg acugcugcca guacaccaau cugaccuacu gcagaggcug cgcccuguac 180
cacgucuguc aguggugcag ccaguacaac cggugcuucc uggacgagga accccaucug 240
cugcggaugc ggaccuuuaa ggacgugguc accaaagagg acaucgaggg ccugcugacu 300
auguacgaga cacuguuccc caucaacgag aagcugguca acaaguucau caacagcgug 360
aagcagcgga agugccggaa cgaguaccug cuggaauggu acaaucaucu gcugaugccc 420
aucacacugc aggcccugac caucaaccug gaagauaacg uguacuacau guucggcuac 480
uacgacugca uggaacacga gaaucagacc ccuuuccagu ucgugaaccu gcucgagaag 540
uacgacaagc ugcugcugga cgaccggaac uuccaccgga ugucucaucu gcccgugauc 600
cugcagcaag aguacgcccu gcgguacuuc agcaagagcc gguuucugag caagggcaag 660
aagcggcuga gcagaagcga cuucagcgac aaccugaugg aagaucggca cagccccacc 720
agccugaugc aggucgucag aaacugcauc agcauccaca ucgacgacug ugaauggaac 780
aaggccugca cacugaucgu ggacgcccgc aacuacaucu ccaucaugaa cagcagcuac 840
accgagcacu acagcguguc ccagcggugc aagcuguuca caaaguacaa guucggcauc 900
guguccaagc ucgugaagcc caauuacauc uucagcagcc acgagagcug ugcccugaac 960
gugcacaacu gcaaguggug ccagaucaac aaucacuaca aaguguggga agauuuccgg 1020
cugcggaaga ucuacaacaa cgugauggac uucauccgcg cucuggucaa gagcaacgug 1080
aacgugggcc acugcagcag ccaagagucc guguacaaau acgugcccga ccuguuccug 1140
aucugcaaga ccgagaagug gagcgaggcc guggaaaugc uguucaacua ccuggaaccu 1200
gugaacguca acggcaccga guacguccug cuggacuacg aagugaacug ggaagugcgg 1260
ggccucguga ugcagaacau ggauggcaag gugccccgga uccugaacau gaacgacacc 1320
aagaaaaucc ugagcgccau gaucuucgau ugguucgaca cccgguacau gcgcgagaca 1380
ccuaugacca ccagcaccac caaccagcug cggacccuga acaagagaaa cgagcugauc 1440
gacgaguacg accuggaacu gagcgacgug gaa 1473
<210> 319
<211> 317
<212> PRT
<213> Bovine rotavirus A
<400> 319
Met Ala Glu Leu Ala Cys Phe Cys Tyr Pro His Leu Glu Ser Asp Thr
1 5 10 15
Tyr Arg Phe Ile Pro Phe Asn Ser Leu Ala Ile Lys Cys Met Leu Thr
20 25 30
Ala Lys Val Asp Lys Lys Asp Gln Asp Lys Phe Tyr Asn Ser Ile Ile
35 40 45
Tyr Gly Ile Ala Pro Pro Pro Gln Phe Lys Lys Arg Tyr Asn Thr Asn
50 55 60
Asp Asn Ser Arg Gly Met Asn Tyr Glu Thr Pro Met Phe Asn Lys Val
65 70 75 80
Ala Val Leu Ile Cys Glu Ala Leu Asn Ser Ile Lys Val Thr Gln Ser
85 90 95
Asp Val Ala Ser Val Leu Ser Lys Val Ile Ser Val Arg His Leu Glu
100 105 110
Asn Leu Val Leu Arg Arg Glu Asn His Gln Asp Val Leu Phe His Ser
115 120 125
Lys Glu Leu Leu Leu Arg Ser Val Leu Ile Ala Ile Gly His Ser Lys
130 135 140
Glu Ile Glu Thr Thr Ala Thr Ala Glu Gly Gly Glu Val Val Phe Gln
145 150 155 160
Asn Ala Ala Phe Thr Met Trp Lys Leu Thr Tyr Leu Glu His Arg Leu
165 170 175
Met Pro Ile Leu Asp Gln Asn Phe Ile Glu Tyr Lys Ile Thr Val Asn
180 185 190
Glu Asp Lys Pro Ile Ser Glu Ser His Val Arg Glu Leu Ile Ala Glu
195 200 205
Leu Arg Trp Gln Tyr Asn Lys Phe Ala Val Ile Thr His Gly Lys Gly
210 215 220
His Tyr Arg Val Val Lys Tyr Ser Ser Val Ala Asn His Ala Asp Arg
225 230 235 240
Val Tyr Ala Thr Phe Lys Ser Asn Asn Lys Asn Gly Asn Val Ile Glu
245 250 255
Phe Asn Leu Leu Asp Gln Arg Ile Ile Trp Gln Asn Trp Tyr Ala Phe
260 265 270
Thr Ser Ser Met Lys Gln Gly Asn Thr Leu Glu Ile Cys Lys Lys Leu
275 280 285
Leu Phe Gln Lys Met Lys Arg Glu Ser Asn Pro Phe Lys Gly Leu Ser
290 295 300
Thr Asp Arg Lys Met Asp Glu Val Ser Gln Ile Gly Ile
305 310 315
<210> 320
<211> 951
<212> DNA
<213> Bovine rotavirus A
<400> 320
atggctgagc tagcttgctt ttgttatccc catttggaga gcgatacgta tagattcatt 60
ccatttaaca gtttagctat aaaatgtatg ttgacagcaa aagtggacaa aaaagatcag 120
gataagtttt acaattcaat aatttatggc attgcaccac cgccacagtt caaaaaacgt 180
tataacacaa atgataattc gagaggaatg aattatgaaa ctccaatgtt taataaagtg 240
gcggtattaa tttgtgaagc gttgaattca attaaagtta ctcaatctga tgttgcgagt 300
gtactttcaa aagtaatttc tgtaagacat ttagagaatt tggtactgag aagagagaac 360
catcaggacg tgcttttcca ttcaaaagag ttgttgctga gatcagtact aatagctatt 420
ggtcactcaa aagaaattga aacaactgcc actgctgaag gaggggaagt agtttttcaa 480
aatgcagctt ttacaatgtg gaaactgaca tacctggagc atagactaat gccaattttg 540
gatcaaaatt ttatcgaata taaaataaca gtgaatgaag ataaaccaat ttcagaatca 600
catgtaagag aactcattgc tgaattgcgg tggcaataca acaaatttgc agtaattaca 660
catggtaaag gtcactacag agttgtaaaa tattcatcag ttgcgaatca tgcagataga 720
gtttacgcta ctttcaagag caataataag aatgggaatg tgatagagtt taatctactt 780
gatcaaagaa taatatggca gaactggtat gcgtttacat cctcaatgaa acaaggcaac 840
actcttgaaa tatgcaagaa actactgttc caaaagatga agcgagaaag taatccgttt 900
aagggactgt caactgatag aaagatggat gaggtctctc aaataggaat t 951
<210> 321
<211> 951
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding Bovine RV NS2 protein
<400> 321
atggccgagc tggcctgctt ttgttaccct cacctggaaa gcgataccta ccggttcatc 60
cccttcaaca gcctggccat caagtgcatg ctgaccgcca aggtggacaa gaaggaccag 120
gacaagttct acaacagcat catctacgga atcgcccctc cacctcagtt caagaagcgg 180
tacaacacca acgacaacag ccggggcatg aactacgaga cacccatgtt caacaaggtg 240
gccgtgctga tctgcgaggc cctgaactcc atcaaagtga cccagtccga tgtggccagc 300
gtgctgagca aagtgatctc tgtgcggcac ctcgagaacc tggtgctgcg gagagaaaac 360
caccaggacg tgctgttcca cagcaaagag ctgctgctga gatctgtgct gatcgccatc 420
ggccactcca aagagatcga gacaaccgcc acagccgaag gcggagaggt ggtgtttcag 480
aatgccgcct tcaccatgtg gaagctgacc tacctggaac accggctgat gcccatcctg 540
gaccagaact tcatcgagta caagatcacc gtgaacgagg acaagcccat cagcgagtct 600
cacgtgcggg aactgattgc cgagctgcgg tggcagtaca acaagttcgc cgtgatcaca 660
cacggcaagg gccactacag agtggtcaag tacagcagcg tggccaacca cgccgataga 720
gtgtacgcca ccttcaagag caacaacaag aacggcaacg tgatcgagtt caacctgctg 780
gaccagcgga tcatctggca gaattggtac gcctttacca gcagcatgaa gcagggcaac 840
accctggaaa tctgcaagaa gctcctgttc cagaagatga agagagagag caaccccttc 900
aagggcctga gcaccgaccg gaagatggat gaggtgtccc agatcggcat c 951
<210> 322
<211> 951
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding Bovine RV NS2 protein
<400> 322
auggccgagc uggccugcuu uuguuacccu caccuggaaa gcgauaccua ccgguucauc 60
cccuucaaca gccuggccau caagugcaug cugaccgcca agguggacaa gaaggaccag 120
gacaaguucu acaacagcau caucuacgga aucgccccuc caccucaguu caagaagcgg 180
uacaacacca acgacaacag ccggggcaug aacuacgaga cacccauguu caacaaggug 240
gccgugcuga ucugcgaggc ccugaacucc aucaaaguga cccaguccga uguggccagc 300
gugcugagca aagugaucuc ugugcggcac cucgagaacc uggugcugcg gagagaaaac 360
caccaggacg ugcuguucca cagcaaagag cugcugcuga gaucugugcu gaucgccauc 420
ggccacucca aagagaucga gacaaccgcc acagccgaag gcggagaggu gguguuucag 480
aaugccgccu ucaccaugug gaagcugacc uaccuggaac accggcugau gcccauccug 540
gaccagaacu ucaucgagua caagaucacc gugaacgagg acaagcccau cagcgagucu 600
cacgugcggg aacugauugc cgagcugcgg uggcaguaca acaaguucgc cgugaucaca 660
cacggcaagg gccacuacag aguggucaag uacagcagcg uggccaacca cgccgauaga 720
guguacgcca ccuucaagag caacaacaag aacggcaacg ugaucgaguu caaccugcug 780
gaccagcgga ucaucuggca gaauugguac gccuuuacca gcagcaugaa gcagggcaac 840
acccuggaaa ucugcaagaa gcuccuguuc cagaagauga agagagagag caaccccuuc 900
aagggccuga gcaccgaccg gaagauggau gagguguccc agaucggcau c 951
<210> 323
<211> 228
<212> PRT
<213> Porcine bocavirus 1
<400> 323
Met Ser Ser Ala Arg Ser Asp Thr Asp Thr Gly Arg Arg Gly Lys Arg
1 5 10 15
Ser Arg Ser Arg Ser Arg Ser Arg Asp Arg Asp Gln Ala Pro Gly Leu
20 25 30
Pro Pro Lys Lys Arg Asp Tyr Arg Arg Arg Ser Gly Glu Arg Gly Ser
35 40 45
Glu Ser Ser Pro Asp Arg Ser Thr Arg Gly Ser Pro Ser Cys Ser Thr
50 55 60
Ala Ser Arg Thr Ser Arg Val Thr Ser Ala Thr Trp Arg Arg Pro Asn
65 70 75 80
Asp Ser Arg Asp Gly Gly Lys Ile Trp Gly Asn Lys Asn Lys Lys Asn
85 90 95
Lys Thr Asn Pro Tyr Glu Val Phe Ser Gln His Met Ala Arg Phe Lys
100 105 110
Pro Asp Lys Ser Tyr Cys Gly Phe Tyr Trp His Ser Cys Arg Met Ala
115 120 125
Arg Lys Gly Thr Asp Tyr Ile Phe Thr Glu Gly Met Arg Asp Phe Gln
130 135 140
Lys Arg Cys Lys Asp Asn Lys Cys Glu Trp Lys Asp Val Arg Glu Ile
145 150 155 160
Met Phe Gly Leu Lys Lys Val Leu Asp Gln Gly Tyr Arg Asn Met Met
165 170 175
Tyr His Phe Arg His Thr Gln Cys Glu Lys Cys Asn Tyr Trp Asp Glu
180 185 190
Val Tyr Lys Met His Leu Ala Asn Val Ser Pro Ser Glu Thr Glu Pro
195 200 205
Gln Glu Leu Thr Asp Glu Glu Ile Leu Ala Ala Ala Met Glu Val Asp
210 215 220
Gly Thr His Glu
225
<210> 324
<211> 684
<212> DNA
<213> Porcine bocavirus 1
<400> 324
atgagctcag cgagatccga cacagacaca ggcaggagag ggaagcggtc gaggagccgg 60
tcgaggagcc gcgaccggga ccaagcaccg gggctgcctc cgaaaaaaag ggactatcgc 120
cgtcggagtg gggagagagg ctcggagtcc tcaccagatc gctcgacgag ggggagccca 180
tcgtgctcca ctgcttcgag aacatcccga gtgacttcag cgacatggag gagaccgaat 240
gactctcggg acggggggaa aatatgggga aataaaaata aaaagaataa aacaaaccct 300
tacgaggtat tcagccagca catggccagg ttcaagccag ataaaagcta ttgtggcttc 360
tactggcaca gctgccggat ggctcgtaag ggcacagatt atatctttac cgagggaatg 420
agggatttcc aaaaacgctg taaagacaat aaatgtgagt ggaaagatgt cagggagatc 480
atgttcggcc tcaaaaaggt cttagatcag ggatatagaa atatgatgta tcactttaga 540
catacccagt gtgagaaatg taactactgg gatgaagtgt ataaaatgca cctggctaac 600
gtgtctcctt ctgaaacaga accgcaggaa ctgacagacg aggagatatt agccgcggcc 660
atggaggtcg atggcaccca cgaa 684
<210> 325
<211> 684
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding PBoV NP1 protein
<400> 325
atgagcagcg ccagaagcga taccgacaca ggcagacggg gcaagagaag cagaagccgg 60
tccagaagca gagacagaga tcaggctcct ggcctgcctc ctaagaagcg ggactacaga 120
agaagatccg gcgagagagg cagcgagagc agccctgata gaagcacaag aggcagccct 180
agctgtagca ccgccagcag aacaagcaga gtgacctctg ccacttggcg gaggcccaac 240
gattctagag atggcggcaa gatctggggc aacaagaaca agaagaacaa aacgaacccc 300
tacgaggtgt tcagccagca catggccaga ttcaagcccg acaagagcta ctgcggcttc 360
tactggcaca gctgccggat ggccagaaag ggcaccgact acatcttcac cgagggcatg 420
agagacttcc agaagcggtg caaggacaac aagtgcgagt ggaaggacgt gcgcgagatc 480
atgttcggcc tgaagaaggt gctggaccag ggctacagaa acatgatgta ccacttccgg 540
cacacccagt gcgagaagtg caactactgg gacgaagtgt acaagatgca cctggccaac 600
gtgtccccat ccgagacaga gcctcaagag ctgaccgacg aggaaattct ggccgctgcc 660
atggaagtgg atggcacaca tgaa 684
<210> 326
<211> 684
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding PBoV NP1
<400> 326
augagcagcg ccagaagcga uaccgacaca ggcagacggg gcaagagaag cagaagccgg 60
uccagaagca gagacagaga ucaggcuccu ggccugccuc cuaagaagcg ggacuacaga 120
agaagauccg gcgagagagg cagcgagagc agcccugaua gaagcacaag aggcagcccu 180
agcuguagca ccgccagcag aacaagcaga gugaccucug ccacuuggcg gaggcccaac 240
gauucuagag auggcggcaa gaucuggggc aacaagaaca agaagaacaa aacgaacccc 300
uacgaggugu ucagccagca cauggccaga uucaagcccg acaagagcua cugcggcuuc 360
uacuggcaca gcugccggau ggccagaaag ggcaccgacu acaucuucac cgagggcaug 420
agagacuucc agaagcggug caaggacaac aagugcgagu ggaaggacgu gcgcgagauc 480
auguucggcc ugaagaaggu gcuggaccag ggcuacagaa acaugaugua ccacuuccgg 540
cacacccagu gcgagaagug caacuacugg gacgaagugu acaagaugca ccuggccaac 600
guguccccau ccgagacaga gccucaagag cugaccgacg aggaaauucu ggccgcugcc 660
auggaagugg auggcacaca ugaa 684
<210> 327
<211> 114
<212> PRT
<213> Hepatitis E virus
<400> 327
Met Gly Ser Arg Pro Cys Ala Leu Gly Leu Phe Cys Cys Cys Ser Ser
1 5 10 15
Cys Phe Cys Leu Cys Cys Pro Arg His Arg Pro Val Ser Arg Leu Ala
20 25 30
Ala Val Val Gly Gly Ala Ala Ala Val Pro Ala Val Val Ser Gly Val
35 40 45
Thr Gly Leu Ile Leu Ser Pro Ser Gln Ser Pro Ile Phe Ile Gln Pro
50 55 60
Thr Pro Ser Pro Pro Met Ser Pro Leu Arg Pro Gly Leu Asp Leu Val
65 70 75 80
Phe Ala Asn Pro Pro Asp His Ser Ala Pro Leu Gly Val Thr Arg Pro
85 90 95
Ser Ala Pro Pro Leu Pro His Val Val Asp Leu Pro Gln Leu Gly Pro
100 105 110
Arg Arg
<210> 328
<211> 342
<212> DNA
<213> Hepatitis E virus
<400> 328
atgggttcgc gaccatgcgc cctcggccta ttttgttgct gctcctcatg tttttgccta 60
tgctgcccgc gccaccgccc ggtcagccgt ctggccgccg tcgtgggcgg cgcagcggcg 120
gttccggcgg tggtttctgg ggtgaccggg ttgattctca gcccttcgca atcccctata 180
ttcatccaac caaccccttc gcccccgatg tcaccgctgc ggccggggct ggacctcgtg 240
ttcgccaacc cgcccgacca ctcggctccg cttggcgtga ccaggcccag cgccccgccg 300
ttgcctcacg tcgtagacct accacagctg gggccgcgcc gc 342
<210> 329
<211> 342
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding Hepatitis E Orf3 protein
<400> 329
atgggcagca gaccttgtgc tctgggcctg ttctgctgct gcagctcctg cttctgcctg 60
tgctgcccta gacacagacc cgtgtctaga ctggccgctg ttgttggcgg agctgctgct 120
gttccagctg tggtgtctgg cgtgacaggc ctgattctga gcccttctca gagccccatc 180
ttcatccagc ctacacctag tcctccaatg agccctctga ggcctggact ggatctggtg 240
ttcgccaatc ctcctgatca ctctgcccct ctgggcgtga caagaccttc tgctcctcct 300
ctgccacacg tggtggatct gcctcaactg ggccctagaa ga 342
<210> 330
<211> 342
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding Hepatitis E Orf3 polypeptide
<400> 330
augggcagca gaccuugugc ucugggccug uucugcugcu gcagcuccug cuucugccug 60
ugcugcccua gacacagacc cgugucuaga cuggccgcug uuguuggcgg agcugcugcu 120
guuccagcug uggugucugg cgugacaggc cugauucuga gcccuucuca gagccccauc 180
uucauccagc cuacaccuag uccuccaaug agcccucuga ggccuggacu ggaucuggug 240
uucgccaauc cuccugauca cucugccccu cugggcguga caagaccuuc ugcuccuccu 300
cugccacacg ugguggaucu gccucaacug ggcccuagaa ga 342
<210> 331
<211> 496
<212> PRT
<213> Rotavirus A
<400> 331
Met Ala Thr Phe Lys Asp Ala Cys Phe His Tyr Arg Arg Leu Thr Ala
1 5 10 15
Leu Asn Arg Arg Leu Cys Asn Ile Gly Ala Asn Ser Ile Cys Met Pro
20 25 30
Val Pro Asp Ala Lys Ile Lys Gly Trp Cys Leu Glu Cys Cys Gln Ile
35 40 45
Ala Asp Leu Thr His Cys Tyr Gly Cys Ser Leu Pro His Val Cys Lys
50 55 60
Trp Cys Val Gln Asn Arg Arg Cys Phe Leu Asp Asn Glu Pro His Leu
65 70 75 80
Leu Lys Leu Arg Thr Val Lys His Pro Ile Thr Lys Asp Lys Leu Gln
85 90 95
Cys Ile Ile Asp Leu Tyr Asn Ile Ile Phe Pro Ile Asn Asp Lys Val
100 105 110
Ile Arg Lys Phe Glu Arg Met Ile Lys Gln Arg Lys Cys Arg Asn Gln
115 120 125
Tyr Lys Ile Glu Trp Tyr Asn His Leu Leu Leu Pro Ile Thr Leu Asn
130 135 140
Ala Ala Ala Phe Lys Phe Asp Glu Asn Asn Leu Tyr Tyr Val Phe Gly
145 150 155 160
Leu Tyr Glu Lys Ser Val Ser Asp Ile Tyr Ala Pro Tyr Arg Ile Val
165 170 175
Asn Phe Ile Asn Glu Phe Asp Lys Leu Leu Leu Asp Asp Ile Asn Phe
180 185 190
Thr Arg Met Ser Asn Leu Pro Ile Glu Leu Arg Asn His Tyr Ala Lys
195 200 205
Lys Tyr Phe Gln Leu Ser Arg Leu Pro Ser Ser Lys Leu Lys Gln Ile
210 215 220
Tyr Phe Ser Asp Phe Thr Lys Glu Thr Val Ile Phe Asn Thr Tyr Thr
225 230 235 240
Lys Thr Pro Gly Arg Ser Ile Tyr Arg Asn Val Thr Glu Phe Asn Trp
245 250 255
Arg Asp Glu Leu Glu Leu Tyr Ser Asp Leu Lys Asn Asp Lys Asn Lys
260 265 270
Leu Ile Ala Ala Met Met Thr Ser Lys Tyr Thr Arg Phe Tyr Ala His
275 280 285
Asp Asn Asn Phe Gly Arg Leu Lys Met Thr Ile Phe Glu Leu Gly His
290 295 300
His Cys Gln Pro Asn Tyr Val Ala Ser Asn His Pro Gly Asn Ala Ser
305 310 315 320
Asp Ile Gln Tyr Cys Lys Trp Cys Asn Ile Lys Tyr Phe Leu Ser Lys
325 330 335
Ile Asp Trp Arg Ile Arg Asp Met Tyr Asn Leu Leu Met Glu Phe Ile
340 345 350
Lys Asp Cys Tyr Lys Ser Asn Val Asn Val Gly His Cys Ser Ser Val
355 360 365
Glu Asn Ile Tyr Pro Leu Ile Lys Arg Leu Ile Trp Ser Leu Phe Thr
370 375 380
Asn His Met Asp Gln Thr Ile Glu Glu Val Phe Asn His Met Ser Pro
385 390 395 400
Val Ser Val Glu Gly Thr Asn Val Ile Met Leu Ile Leu Gly Leu Asn
405 410 415
Ile Ser Leu Tyr Asn Glu Ile Lys Arg Thr Leu Asn Val Asp Ser Ile
420 425 430
Pro Met Val Leu Asn Leu Asn Glu Phe Ser Ser Ile Val Lys Ser Ile
435 440 445
Ser Ser Lys Trp Tyr Asn Val Asp Glu Leu Asp Lys Leu Pro Met Ser
450 455 460
Ile Lys Ser Thr Glu Glu Leu Ile Glu Met Lys Asn Ser Gly Thr Leu
465 470 475 480
Thr Glu Glu Phe Glu Leu Leu Ile Ser Asn Ser Glu Asp Asp Asn Glu
485 490 495
<210> 332
<211> 1488
<212> DNA
<213> Rotavirus A
<400> 332
atggctactt ttaaagatgc atgctttcat tatcgtagat taactgcttt aaatcggaga 60
ttatgcaaca ttggtgcaaa ttctatttgc atgccagttc ctgatgcgaa gattaagggg 120
tggtgtttag aatgttgtca aatagctgat ttaacccatt gttatggttg ctcattgccg 180
catgtttgca aatggtgtgt tcagaacaga agatgcttcc ttgacaatga acctcatttg 240
cttaagctta gaactgtgaa acatccaatt accaaagaca aattacagtg tatcatagac 300
ttgtacaata taatatttcc aattaatgat aaagtaatta gaaaatttga aagaatgata 360
aagcaaagaa aatgtaggaa tcaatataaa attgaatggt ataatcattt gctgctccca 420
attacattaa atgctgctgc atttaagttt gatgaaaata atctttatta tgtttttggg 480
ttatatgaga aatcagtcag tgatatatat gctccatata gaattgttaa ctttataaat 540
gaatttgata aattattgct tgatgatatt aactttacaa gaatgtccaa tctaccaata 600
gagttgagaa accattatgc aaagaaatac ttccaattat caagactgcc atcatcaaaa 660
ctaaagcaaa tttacttttc agattttact aaagaaactg tgatttttaa tacttataca 720
aaaacgccag gaagatcaat atacagaaat gtaactgaat ttaattggag agatgaattg 780
gagctttatt ctgatttaaa aaatgataag aataaattaa ttgctgcaat gatgacgagt 840
aagtatactc ggttctatgc tcatgataat aattttggaa ggttgaaaat gacaatattt 900
gagttgggac atcattgtca gcctaactac gtggcatcta atcacccagg caatgcttcc 960
gatatccagt actgtaaatg gtgtaatata aaatattttc ttagtaaaat tgattggcgg 1020
attcgtgata tgtataattt attgatggaa tttattaagg attgttataa aagtaatgtt 1080
aacgttggac attgtagttc tgttgaaaac atatatcctt taattaaaag attaatttgg 1140
agtttgttta ctaatcacat ggatcaaaca attgaagaag tgtttaatca catgtcgcca 1200
gtgtcagttg aaggtacgaa tgtcatcatg ttgattcttg gattgaatat tagtttgtat 1260
aatgaaatta agcgcacttt gaatgtagat agcataccaa tggtacttaa tttaaatgaa 1320
ttcagtagta tagttaaatc aattagcagt aaatggtata atgttgatga attggataaa 1380
ttgccaatgt caataaaatc aacggaggaa ctgattgaaa tgaagaattc tggaacttta 1440
actgaagaat ttgagctact gatctccaac tcagaagatg acaatgag 1488
<210> 333
<211> 1488
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding Rotavirus NSP1 protein
<400> 333
atggccacct tcaaggacgc ctgcttccac tacagacggc tgacagccct gaatcggcgg 60
ctgtgtaata tcggcgccaa cagcatctgc atgcccgtgc ctgacgccaa gatcaaaggc 120
tggtgcctgg aatgctgcca gatcgccgat ctcacccact gctacggctg ttctctgccc 180
catgtgtgca agtggtgcgt gcagaacaga cggtgcttcc tggacaacga gccccatctg 240
ctgaagctga gaaccgtgaa gcaccccatc accaaggaca agctgcagtg catcatcgac 300
ctgtacaaca tcatcttccc catcaacgac aaagtgatcc ggaagttcga gcggatgatc 360
aagcagcgga agtgccggaa ccagtacaag atcgagtggt acaatcatct gctgctgccc 420
atcacactga acgccgctgc cttcaagttc gacgagaaca acctgtacta cgtgttcggc 480
ctgtacgaga agtccgtgtc cgacatctac gccccttacc ggatcgtgaa cttcatcaac 540
gagttcgata agctgctgct ggacgacatc aacttcaccc ggatgagcaa cctgcctatc 600
gagctgagaa accactacgc caagaagtac tttcagctga gcagactgcc cagcagcaag 660
ctgaagcaga tctacttctc cgacttcacc aaagaaaccg tgatcttcaa cacctacacc 720
aagacacccg gcagatccat ctaccggaac gtgaccgagt tcaactggcg ggacgagctg 780
gaactgtaca gcgacctgaa gaacgacaag aacaagctga tcgccgccat gatgaccagc 840
aagtacaccc ggttctacgc ccacgacaac aatttcggcc ggctgaagat gaccatcttc 900
gagctgggcc accactgcca gcctaattac gtggcctcta atcaccccgg caacgccagc 960
gatatccagt actgcaaatg gtgcaatatc aagtacttcc tgagcaagat cgactggcgg 1020
atccgggaca tgtacaacct gctgatggaa ttcatcaagg actgctacaa gagcaacgtg 1080
aacgtgggcc actgcagcag cgtcgagaac atctaccctc tgatcaagcg gctgatctgg 1140
tccctgttca ccaaccacat ggaccagacc atcgaagagg tgttcaatca catgagcccc 1200
gtgtccgtgg aaggcaccaa cgtgatcatg ctgatcctgg gcctgaacat cagcctgtac 1260
aatgagatca agcgcaccct gaacgtggac agcatcccca tggtgctgaa cctgaacgag 1320
ttcagcagca tcgtgaagtc catctccagc aagtggtata acgtggacga actggacaaa 1380
ctgcccatga gcatcaagtc caccgaggaa ctgatcgaga tgaagaacag cggcaccctg 1440
accgaggaat tcgagctgct gatctccaac agcgaggacg acaacgag 1488
<210> 334
<211> 1488
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding Rotavirus NSP1 protein
<400> 334
auggccaccu ucaaggacgc cugcuuccac uacagacggc ugacagcccu gaaucggcgg 60
cuguguaaua ucggcgccaa cagcaucugc augcccgugc cugacgccaa gaucaaaggc 120
uggugccugg aaugcugcca gaucgccgau cucacccacu gcuacggcug uucucugccc 180
caugugugca aguggugcgu gcagaacaga cggugcuucc uggacaacga gccccaucug 240
cugaagcuga gaaccgugaa gcaccccauc accaaggaca agcugcagug caucaucgac 300
cuguacaaca ucaucuuccc caucaacgac aaagugaucc ggaaguucga gcggaugauc 360
aagcagcgga agugccggaa ccaguacaag aucgaguggu acaaucaucu gcugcugccc 420
aucacacuga acgccgcugc cuucaaguuc gacgagaaca accuguacua cguguucggc 480
cuguacgaga aguccguguc cgacaucuac gccccuuacc ggaucgugaa cuucaucaac 540
gaguucgaua agcugcugcu ggacgacauc aacuucaccc ggaugagcaa ccugccuauc 600
gagcugagaa accacuacgc caagaaguac uuucagcuga gcagacugcc cagcagcaag 660
cugaagcaga ucuacuucuc cgacuucacc aaagaaaccg ugaucuucaa caccuacacc 720
aagacacccg gcagauccau cuaccggaac gugaccgagu ucaacuggcg ggacgagcug 780
gaacuguaca gcgaccugaa gaacgacaag aacaagcuga ucgccgccau gaugaccagc 840
aaguacaccc gguucuacgc ccacgacaac aauuucggcc ggcugaagau gaccaucuuc 900
gagcugggcc accacugcca gccuaauuac guggccucua aucaccccgg caacgccagc 960
gauauccagu acugcaaaug gugcaauauc aaguacuucc ugagcaagau cgacuggcgg 1020
auccgggaca uguacaaccu gcugauggaa uucaucaagg acugcuacaa gagcaacgug 1080
aacgugggcc acugcagcag cgucgagaac aucuacccuc ugaucaagcg gcugaucugg 1140
ucccuguuca ccaaccacau ggaccagacc aucgaagagg uguucaauca caugagcccc 1200
guguccgugg aaggcaccaa cgugaucaug cugauccugg gccugaacau cagccuguac 1260
aaugagauca agcgcacccu gaacguggac agcaucccca uggugcugaa ccugaacgag 1320
uucagcagca ucgugaaguc caucuccagc aagugguaua acguggacga acuggacaaa 1380
cugcccauga gcaucaaguc caccgaggaa cugaucgaga ugaagaacag cggcacccug 1440
accgaggaau ucgagcugcu gaucuccaac agcgaggacg acaacgag 1488
<210> 335
<211> 407
<212> PRT
<213> Human herpesvirus 8
<400> 335
Met Ala Met Phe Val Arg Thr Ser Ser Ser Thr His Asp Glu Glu Arg
1 5 10 15
Met Leu Pro Ile Glu Gly Ala Pro Arg Arg Arg Pro Pro Val Lys Phe
20 25 30
Ile Phe Pro Pro Pro Pro Leu Ser Ser Leu Pro Gly Phe Gly Arg Pro
35 40 45
Arg Gly Tyr Ala Gly Pro Thr Val Ile Asp Met Ser Ala Pro Asp Asp
50 55 60
Val Phe Ala Glu Asp Thr Pro Ser Pro Pro Ala Thr Pro Leu Asp Leu
65 70 75 80
Gln Ile Ser Pro Asp Gln Ser Ser Gly Glu Ser Glu Tyr Asp Glu Asp
85 90 95
Glu Glu Asp Glu Asp Glu Glu Glu Asn Asp Asp Val Gln Glu Glu Asp
100 105 110
Glu Pro Glu Gly Tyr Pro Ala Asp Phe Phe Gln Pro Leu Ser His Leu
115 120 125
Arg Pro Arg Pro Leu Ala Arg Arg Ala His Thr Pro Lys Pro Val Ala
130 135 140
Val Val Ala Gly Arg Val Arg Ser Ser Thr Asp Thr Ala Glu Ser Glu
145 150 155 160
Ala Ser Met Gly Trp Val Ser Gln Asp Asp Gly Phe Ser Pro Ala Gly
165 170 175
Leu Ser Pro Ser Asp Asp Glu Gly Val Ala Ile Leu Glu Pro Met Ala
180 185 190
Ala Tyr Thr Gly Thr Gly Ala Tyr Gly Leu Ser Pro Ala Ser Arg Asn
195 200 205
Ser Val Pro Gly Thr Gln Ser Ser Pro Tyr Ser Asp Pro Asp Glu Gly
210 215 220
Pro Ser Trp Arg Pro Leu Arg Ala Ala Pro Thr Ala Ile Val Asp Leu
225 230 235 240
Thr Ser Asp Ser Asp Ser Asp Asp Ser Ser Asn Ser Pro Asp Val Asn
245 250 255
Asn Glu Ala Ala Phe Thr Asp Ala Arg His Phe Ser His Gln Pro Pro
260 265 270
Ser Ser Glu Glu Asp Gly Glu Asp Gln Gly Glu Val Leu Ser Gln Arg
275 280 285
Ile Gly Leu Met Asp Val Gly Gln Lys Arg Lys Arg Gln Ser Thr Ala
290 295 300
Ser Ser Gly Ser Glu Asp Val Val Arg Cys Gln Arg Gln Pro Asn Leu
305 310 315 320
Ser Arg Lys Ala Val Ala Ser Val Ile Ile Ile Ser Ser Gly Ser Asp
325 330 335
Thr Asp Glu Glu Pro Ser Ser Ala Val Ser Val Ile Val Ser Pro Ser
340 345 350
Ser Thr Lys Gly His Leu Pro Thr Gln Ser Pro Ser Thr Ser Ala His
355 360 365
Ser Ile Ser Ser Gly Ser Thr Thr Thr Ala Gly Ser Arg Cys Ser Asp
370 375 380
Pro Thr Arg Ile Leu Ala Ser Thr Pro Pro Leu Cys Gly Asn Gly Ala
385 390 395 400
Tyr Asn Trp Pro Trp Leu Asp
405
<210> 336
<211> 1221
<212> DNA
<213> Human herpesvirus 8
<400> 336
atggcgatgt ttgtgaggac ctcgtctagc acacacgatg aagagagaat gcttccaatt 60
gaaggagcgc ctcgcagacg accccccgtg aagttcatat tcccacctcc acctctttca 120
tcacttccag gatttggcag gccgcgcggc tatgctggac ccacggtgat agatatgtct 180
gccccagacg acgtcttcgc cgaggacacg ccatcgccgc cagcaacccc tctggatcta 240
cagatatccc cggatcagtc gagcggcgaa tctgaatatg acgaggatga ggaagatgaa 300
gatgaagaag aaaatgacga tgttcaggag gaagacgagc cagaggggta ccctgcagac 360
ttttttcaac ctttatctca cttgcgcccg aggcctctgg ccagacgggc ccatacgccc 420
aaaccggtag cagtggtagc gggccgcgtg cgcagttcaa cggacacggc ggagtccgag 480
gcgtccatgg gatgggttag tcaggatgac ggattttccc ctgctgggct ctcaccttca 540
gacgacgagg gggttgctat cctggaaccg atggcggcat acactgggac cggggcatac 600
ggactttcac ctgcttccag aaatagtgta cctggaacac aaagttcacc atacagcgac 660
cctgatgaag ggccctcgtg gcgccccctg cgcgccgcac ccaccgcgat cgtcgacctg 720
acatcggact ctgatagcga tgacagttcc aactctccgg acgtgaacaa tgaggccgcg 780
tttaccgacg cgcgccattt ttcccaccag ccaccctcgt ccgaggagga cggagaagac 840
caaggggaag tattgagtca gagaatcggg ctcatggacg tgggccagaa gcgcaaaagg 900
cagtctaccg cctcctctgg tagcgaggat gtggtgcgct gccagagaca accaaactta 960
agccgcaaag cagtggcgtc tgtgataatt atatcctcgg ggagtgacac agacgaggag 1020
ccctcgtccg ccgtgagcgt gatcgtgtct ccgtcgagca caaagggtca cctcccaacc 1080
caatctccca gtacttccgc ccactcgatt tcatcaggaa gcacaactac cgcggggtcc 1140
aggtgcagcg acccaacccg catcctggcc tccacgccac ccctgtgtgg aaacggtgca 1200
tataactggc cgtggctgga c 1221
<210> 337
<211> 1221
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding KSHV ORF45 protein
<400> 337
atggccatgt ttgtgcggac cagcagcagc acccacgacg aggaaagaat gctgcctatc 60
gagggcgctc ctcggagaag gcctcctgtg aagttcatct tcccacctcc accactgagc 120
agcctgcctg gatttggcag acctagaggc tacgccggac ctaccgtgat cgatatgagc 180
gcccctgacg atgtgttcgc cgaggataca ccttctccac cagccacacc tctggacctg 240
cagatcagcc ctgatcagtc tagcggcgag agcgagtacg atgaggacga agaggacgag 300
gatgaggaag agaacgacga cgtccaagag gaagatgagc ccgagggcta ccccgccgat 360
ttctttcagc ctctgtctca cctgaggcct cggcctcttg ctagaagggc ccacacacct 420
aaacctgtgg ctgtggtggc cggaagagtg cggtctagca cagatacagc cgagtccgaa 480
gccagcatgg gatgggtgtc acaggacgat ggattcagcc ctgccggact gagcccttcc 540
gatgatgaag gcgtggccat cctggaacct atggccgcct atactggcac aggcgcctat 600
ggactgtctc ccgccagcag aaatagcgtg ccaggcacac agagcagccc ctactctgat 660
cctgatgagg gcccatcttg gaggcccctt agagctgctc ctaccgccat cgtggatctg 720
accagcgaca gcgatagcga cgacagcagc aatagccccg acgtgaacaa tgaggccgcc 780
ttcacagacg cccggcactt ttctcatcag cctccaagca gcgaagagga tggcgaggat 840
cagggcgaag tgctgtctca gagaatcggc ctgatggacg tgggccagaa gcggaagaga 900
cagagcacag ccagcagcgg ctctgaggat gtcgtcagat gccagagaca gcccaacctg 960
agcagaaagg ccgtggccag cgtgatcatc atcagctctg gcagcgacac cgatgaggaa 1020
cctagctctg ccgtgtccgt gatcgtgtct cctagcagca ccaagggcca tctgcctaca 1080
cagagcccta gcacaagcgc ccactctatc tctagcggca gcacaacaac agccggcagc 1140
agatgcagcg accccacaag aattctggcc agcacacctc ctctgtgcgg caacggcgct 1200
tacaattggc cttggctgga t 1221
<210> 338
<211> 1221
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding KSHV ORF45 protein
<400> 338
auggccaugu uugugcggac cagcagcagc acccacgacg aggaaagaau gcugccuauc 60
gagggcgcuc cucggagaag gccuccugug aaguucaucu ucccaccucc accacugagc 120
agccugccug gauuuggcag accuagaggc uacgccggac cuaccgugau cgauaugagc 180
gccccugacg auguguucgc cgaggauaca ccuucuccac cagccacacc ucuggaccug 240
cagaucagcc cugaucaguc uagcggcgag agcgaguacg augaggacga agaggacgag 300
gaugaggaag agaacgacga cguccaagag gaagaugagc ccgagggcua ccccgccgau 360
uucuuucagc cucugucuca ccugaggccu cggccucuug cuagaagggc ccacacaccu 420
aaaccugugg cugugguggc cggaagagug cggucuagca cagauacagc cgaguccgaa 480
gccagcaugg gauggguguc acaggacgau ggauucagcc cugccggacu gagcccuucc 540
gaugaugaag gcguggccau ccuggaaccu auggccgccu auacuggcac aggcgccuau 600
ggacugucuc ccgccagcag aaauagcgug ccaggcacac agagcagccc cuacucugau 660
ccugaugagg gcccaucuug gaggccccuu agagcugcuc cuaccgccau cguggaucug 720
accagcgaca gcgauagcga cgacagcagc aauagccccg acgugaacaa ugaggccgcc 780
uucacagacg cccggcacuu uucucaucag ccuccaagca gcgaagagga uggcgaggau 840
cagggcgaag ugcugucuca gagaaucggc cugauggacg ugggccagaa gcggaagaga 900
cagagcacag ccagcagcgg cucugaggau gucgucagau gccagagaca gcccaaccug 960
agcagaaagg ccguggccag cgugaucauc aucagcucug gcagcgacac cgaugaggaa 1020
ccuagcucug ccguguccgu gaucgugucu ccuagcagca ccaagggcca ucugccuaca 1080
cagagcccua gcacaagcgc ccacucuauc ucuagcggca gcacaacaac agccggcagc 1140
agaugcagcg accccacaag aauucuggcc agcacaccuc cucugugcgg caacggcgcu 1200
uacaauuggc cuuggcugga u 1221
<210> 339
<211> 245
<212> PRT
<213> Epstein-Barr virus
<400> 339
Met Met Asp Pro Asn Ser Thr Ser Glu Asp Val Lys Phe Thr Pro Asp
1 5 10 15
Pro Tyr Gln Val Pro Phe Val Gln Ala Phe Asp Gln Ala Thr Arg Val
20 25 30
Tyr Gln Asp Leu Gly Gly Pro Ser Gln Ala Pro Leu Pro Cys Val Leu
35 40 45
Trp Pro Val Leu Pro Glu Pro Leu Pro Gln Gly Gln Leu Thr Ala Tyr
50 55 60
His Val Ser Thr Ala Pro Thr Gly Ser Trp Phe Ser Ala Pro Gln Pro
65 70 75 80
Ala Pro Glu Asn Ala Tyr Gln Ala Tyr Ala Ala Pro Gln Leu Phe Pro
85 90 95
Val Ser Asp Ile Thr Gln Asn Gln Gln Thr Asn Gln Ala Gly Gly Glu
100 105 110
Ala Pro Gln Pro Gly Asp Asn Ser Thr Val Gln Thr Ala Ala Ala Val
115 120 125
Val Phe Ala Cys Pro Gly Ala Asn Gln Gly Gln Gln Leu Ala Asp Ile
130 135 140
Gly Val Pro Gln Pro Ala Pro Val Ala Ala Pro Ala Arg Arg Thr Arg
145 150 155 160
Lys Pro Gln Gln Pro Glu Ser Leu Glu Glu Cys Asp Ser Glu Leu Glu
165 170 175
Ile Lys Arg Tyr Lys Asn Arg Val Ala Ser Arg Lys Cys Arg Ala Lys
180 185 190
Phe Lys Gln Leu Leu Gln His Tyr Arg Glu Val Ala Ala Ala Lys Ser
195 200 205
Ser Glu Asn Asp Arg Leu Arg Leu Leu Leu Lys Gln Met Cys Pro Ser
210 215 220
Leu Asp Val Asp Ser Ile Ile Pro Arg Thr Pro Asp Val Leu His Glu
225 230 235 240
Asp Leu Leu Asn Phe
245
<210> 340
<211> 735
<212> DNA
<213> Epstein-Barr virus
<400> 340
atgatggacc caaactcgac ttctgaagat gtaaaattta cacctgaccc ataccaggtg 60
ccttttgtac aagcttttga ccaagctacc agagtctatc aggacctggg agggccatcg 120
caagctcctt tgccttgtgt gctgtggccg gtgctgccag agcctctgcc acaaggccag 180
ctaactgcct atcatgtttc aaccgctccg actgggtcgt ggttttctgc ccctcagcct 240
gctcctgaga atgcttatca agcttatgca gcacctcagc tgttcccagt ctccgacata 300
acccagaatc aacagactaa ccaagccggg ggagaagcac ctcaacctgg agacaattct 360
actgttcaaa cagcagcagc agtggtgttt gcttgccccg gggctaacca aggacaacag 420
ctagcagaca ttggtgttcc acagcctgca ccagtggctg ccccggcacg acgcacacgg 480
aaaccacaac agccagaatc gctggaggaa tgcgattctg aactagaaat aaagcgatac 540
aagaatcggg tggcttccag aaaatgccgg gccaagttta agcaactgct gcagcactac 600
cgtgaggtcg ctgctgccaa atcatctgaa aatgacaggc tgcgcctcct gttgaagcag 660
atgtgcccaa gcctggatgt tgactccatt atcccccgga caccagatgt tttacacgag 720
gatctcttaa atttc 735
<210> 341
<211> 735
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding EBV BZLF-1 protein
<400> 341
atgatggacc ccaacagcac cagcgaggac gtgaagttca cccctgatcc ttaccaggtg 60
ccattcgtgc aggccttcga tcaggccacc agagtgtacc aggatctcgg cggaccttct 120
caggctcctc tgccttgtgt tctgtggcct gtgctgcctg aacctctgcc tcagggacag 180
ctgacagcct accatgtgtc tacagcccct accggcagct ggttttctgc tcctcaacct 240
gctcctgaga acgcctacca ggcctatgct gcccctcagc tgtttcccgt gtccgacatc 300
acccagaacc agcagacaaa tcaggctggc ggagaagctc ctcagcctgg cgataatagc 360
accgtgcaga cagctgccgc cgtggtgttt gcttgtcctg gcgctaatca gggccagcag 420
ctggctgata ttggcgtgcc acaaccagct ccagtggccg ctcctgccag aagaacaaga 480
aagcctcagc agcccgagag cctggaagag tgcgatagcg agctggaaat caagcggtac 540
aagaacagag tggccagccg gaagtgccgg gccaagttta aacagctgct ccagcactac 600
agagaggtgg ccgctgccaa gagcagcgag aacgatagac tgcggctgct gctgaagcag 660
atgtgcccta gcctggacgt ggacagcatc atccccagaa cacccgatgt gctgcacgag 720
gacctgctga acttt 735
<210> 342
<211> 735
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding EBV BZLF-1
<400> 342
augauggacc ccaacagcac cagcgaggac gugaaguuca ccccugaucc uuaccaggug 60
ccauucgugc aggccuucga ucaggccacc agaguguacc aggaucucgg cggaccuucu 120
caggcuccuc ugccuugugu ucuguggccu gugcugccug aaccucugcc ucagggacag 180
cugacagccu accauguguc uacagccccu accggcagcu gguuuucugc uccucaaccu 240
gcuccugaga acgccuacca ggccuaugcu gccccucagc uguuucccgu guccgacauc 300
acccagaacc agcagacaaa ucaggcuggc ggagaagcuc cucagccugg cgauaauagc 360
accgugcaga cagcugccgc cgugguguuu gcuuguccug gcgcuaauca gggccagcag 420
cuggcugaua uuggcgugcc acaaccagcu ccaguggccg cuccugccag aagaacaaga 480
aagccucagc agcccgagag ccuggaagag ugcgauagcg agcuggaaau caagcgguac 540
aagaacagag uggccagccg gaagugccgg gccaaguuua aacagcugcu ccagcacuac 600
agagaggugg ccgcugccaa gagcagcgag aacgauagac ugcggcugcu gcugaagcag 660
augugcccua gccuggacgu ggacagcauc auccccagaa cacccgaugu gcugcacgag 720
gaccugcuga acuuu 735
<210> 343
<211> 314
<212> PRT
<213> Murine herpesvirus 4
<400> 343
Met Pro Thr Ser Pro Pro Thr Thr Arg Asn Thr Thr Ser Gly Lys Thr
1 5 10 15
Arg Ser Gly Cys Lys Arg Arg Cys Phe Asn Lys Pro Ala Ala Met Pro
20 25 30
Pro Lys Arg Arg Arg Ala Pro Lys Arg Pro Ala Pro Pro Pro Pro Pro
35 40 45
Gly Cys Gln Gly Asp Glu Glu Ser Ser Gln Gly Thr Gln Thr Pro Asn
50 55 60
Pro Pro Ser Pro Pro Val Pro Pro Ser Ser Pro Thr Leu Pro Ser Ser
65 70 75 80
Pro Val Pro Pro Ser Ser Pro Val His Glu Pro Pro Ser Pro Ser Pro
85 90 95
Pro Pro Ala Pro Pro Ser Pro Asp Val Asp Val Glu Gly Leu Asp Val
100 105 110
Gly Glu Thr Asp Asp Pro Gly Pro Pro Pro Pro Lys Arg Tyr Ser Arg
115 120 125
Tyr Gln Lys Pro His Asn Pro Ser Asp Pro Leu Pro Lys Lys Tyr Gln
130 135 140
Gly Met Arg Arg His Leu Gln Val Thr Ala Pro Arg Leu Phe Asp Pro
145 150 155 160
Glu Gly His Pro Pro Thr His Phe Lys Ser Ala Val Met Phe Ser Ser
165 170 175
Thr His Pro Tyr Thr Leu Asn Lys Leu His Lys Cys Ile Gln Ser Lys
180 185 190
His Val Leu Ser Thr Pro Val Ser Cys Leu Pro Leu Val Pro Gly Thr
195 200 205
Thr Gln Gln Cys Val Thr Tyr Tyr Leu Leu Ser Phe Val Glu Asp Lys
210 215 220
Lys Gln Ala Lys Lys Leu Lys Arg Val Val Leu Ala Tyr Cys Glu Lys
225 230 235 240
Tyr His Ser Ser Val Glu Gly Thr Ile Val Lys Ala Lys Pro Tyr Phe
245 250 255
Pro Leu Pro Glu Pro Pro Thr Glu Pro Pro Thr Asp Pro Glu Gln Pro
260 265 270
Ser Thr Ser Thr Gln Ala Ser Gly Thr Gln His Gly Pro Thr Ala Ser
275 280 285
Leu Asp Ala Gly Ala Glu Gln Gly Ala Thr Gly Ser Pro Gly Ser Ser
290 295 300
Pro Gly Gln Gln Gly Gln Gly Ser Gln Thr
305 310
<210> 344
<211> 942
<212> DNA
<213> Murine herpesvirus 4
<400> 344
atgcccacat ccccaccgac tacacgcaac acaacctcag gcaaaaccag atcagggtgc 60
aaacgtaggt gcttcaacaa accagcagcc atgcctccta aaagacgccg cgctccaaaa 120
agaccagccc ctcctccacc accgggatgc caaggtgatg aggagtccag ccagggaact 180
caaacgccaa accccccatc accaccagtg cccccttcat caccaacact tccctcatcc 240
cccgtccctc cttcatcacc agtacatgag ccaccatctc cttccccccc accagcccca 300
ccatcaccag atgttgatgt tgaaggttta gatgtaggag agacagacga tcccggtccc 360
cctccaccaa aaagatactc caggtatcaa aaaccgcata atccatctga tccattgcct 420
aaaaaatatc agggaatgcg aagacacctg caggtgacag cacccaggtt atttgatccc 480
gagggtcacc ccccaacaca ttttaagtca gctgttatgt ttagtagcac acatccctac 540
actttgaata aacttcacaa gtgtatccaa agcaaacatg tactctcaac accagttagc 600
tgtttaccct tggtaccagg cacaacacaa cagtgtgtaa catactattt actttcattt 660
gttgaagaca agaaacaggc caaaaaacta aaaagggttg tcttggccta ctgtgaaaaa 720
taccacagca gcgtagaagg tactatagtc aaggcaaagc cttattttcc cttaccagag 780
ccccctacag agccccctac agaccccgag cagccatcca caagtacaca agcttctggc 840
acacaacatg gtcccacagc atctctggat gccggtgcag agcaaggtgc cacaggatca 900
cctggatcta gtccaggaca acagggacaa gggtctcaga ca 942
<210> 345
<211> 942
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding MuHV Orf73 protein
<400> 345
atgcctacaa gccctcctac caccagaaac accaccagcg gcaagacaag aagcggctgc 60
aagcggcggt gcttcaacaa acctgctgcc atgcctccta agcggcggag agcacctaaa 120
agacctgctc ctcctccacc tcctggttgc caaggcgacg aggaatcttc tcagggcacc 180
cagacaccta atcctccatc tccacctgtg cctccaagca gccctacact gccatcttct 240
ccagtgccac ctagcagccc agtgcacgaa ccacctagtc caagtcctcc accagctcca 300
ccttctccag acgtggacgt ggaaggactg gatgtgggcg agacagacga tcctggacct 360
ccaccaccta agcggtacag cagataccag aagcctcaca accccagcga tcctctgcct 420
aagaaatacc agggcatgcg ccggcatctg caagtgacag cccctagact gttcgaccct 480
gagggacacc ctcctacaca cttcaagagc gccgtgatgt tcagcagcac acacccctac 540
actctgaaca agctgcacaa gtgcatccag agcaaacacg tgctgagcac ccctgtgtcc 600
tgtctgcctc tggtgcctgg aaccacacag cagtgcgtga cctactacct gctgagcttc 660
gtggaagata agaagcaggc caagaaactg aagagagtgg tgctggccta ctgcgagaag 720
taccacagca gcgtggaagg caccatcgtg aaggccaagc cttacttccc actgcctgag 780
cctccaaccg agccacctac agatcctgag cagcctagca caagcacaca ggcctctgga 840
acacagcacg gacctacagc tagtctggat gctggtgctg aacagggcgc cacaggatca 900
cctggaagta gccctggaca gcaaggccag ggatctcaga ca 942
<210> 346
<211> 942
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding MuHV Orf73 protein
<400> 346
augccuacaa gcccuccuac caccagaaac accaccagcg gcaagacaag aagcggcugc 60
aagcggcggu gcuucaacaa accugcugcc augccuccua agcggcggag agcaccuaaa 120
agaccugcuc cuccuccacc uccugguugc caaggcgacg aggaaucuuc ucagggcacc 180
cagacaccua auccuccauc uccaccugug ccuccaagca gcccuacacu gccaucuucu 240
ccagugccac cuagcagccc agugcacgaa ccaccuaguc caaguccucc accagcucca 300
ccuucuccag acguggacgu ggaaggacug gaugugggcg agacagacga uccuggaccu 360
ccaccaccua agcgguacag cagauaccag aagccucaca accccagcga uccucugccu 420
aagaaauacc agggcaugcg ccggcaucug caagugacag ccccuagacu guucgacccu 480
gagggacacc cuccuacaca cuucaagagc gccgugaugu ucagcagcac acaccccuac 540
acucugaaca agcugcacaa gugcauccag agcaaacacg ugcugagcac cccugugucc 600
ugucugccuc uggugccugg aaccacacag cagugcguga ccuacuaccu gcugagcuuc 660
guggaagaua agaagcaggc caagaaacug aagagagugg ugcuggccua cugcgagaag 720
uaccacagca gcguggaagg caccaucgug aaggccaagc cuuacuuccc acugccugag 780
ccuccaaccg agccaccuac agauccugag cagccuagca caagcacaca ggccucugga 840
acacagcacg gaccuacagc uagucuggau gcuggugcug aacagggcgc cacaggauca 900
ccuggaagua gcccuggaca gcaaggccag ggaucucaga ca 942
<210> 347
<211> 117
<212> PRT
<213> Torque Teno virus
<400> 347
Met Trp Gln Pro Pro Thr Gln Asn Gly Thr Gln Leu Glu Arg His Trp
1 5 10 15
Phe Glu Ser Val Trp Arg Ser His Ala Ala Phe Cys Ser Cys Gly Asp
20 25 30
Cys Ile Gly His Leu Gln His Leu Ala Thr Asn Leu Gly Arg Pro Pro
35 40 45
Ala Pro Gln Pro Pro Arg Asp Gln His Pro Pro His Ile Arg Gly Leu
50 55 60
Pro Ala Leu Pro Ala Pro Pro Ser Asn Arg Asn Ser Trp Pro Gly Thr
65 70 75 80
Gly Gly Asp Ala Ala Gly Gly Glu Ala Gly Gly Ser Arg Gly Ala Gly
85 90 95
Asp Gly Gly Asp Gly Glu Leu Ala Asp Glu Asp Leu Leu Asp Ala Ile
100 105 110
Ala Leu Ala Ala Glu
115
<210> 348
<211> 351
<212> DNA
<213> Torque Teno virus
<400> 348
atgtggcagc cacctaccca gaatggaacc caactcgaac ggcactggtt cgagtccgtt 60
tggcgttcgc atgctgcctt ttgtagctgt ggcgactgta ttggccatct tcagcatctg 120
gctactaacc tgggtcgacc acctgctcca caaccgccgc gagaccaaca cccaccgcac 180
ataagagggc tcccggcact cccggcacct cccagtaaca gaaactcatg gcctggtact 240
ggtggagacg ccgccggagg agaggctggt ggaagccgag gcgcaggaga tggaggagac 300
ggagagctcg cagacgagga cctgctagac gccatcgcgc tcgccgcaga g 351
<210> 349
<211> 351
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding Torque Teno virus Orf2 protein
<400> 349
atgtggcagc ctcctacaca gaatggcacc cagctggaac ggcattggtt cgagagcgtt 60
tggagaagcc acgccgcttt ctgcagctgc ggagattgca tcggacatct gcagcacctg 120
gccaccaatc tgggtagacc tccagctcct cagcctcctc gagatcagca ccctcctcac 180
atcagaggac tgcctgcact tcctgctcct ccaagcaaca gaaacagctg gcctggcaca 240
ggcggagatg ctgctggcgg agaagctggt ggatctagag gtgccggcga cggtggcgac 300
ggcgaacttg ctgatgaaga tctgctggac gctatcgccc tggccgctga a 351
<210> 350
<211> 351
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding Torque Teno virus Orf2 protein
<400> 350
auguggcagc cuccuacaca gaauggcacc cagcuggaac ggcauugguu cgagagcguu 60
uggagaagcc acgccgcuuu cugcagcugc ggagauugca ucggacaucu gcagcaccug 120
gccaccaauc uggguagacc uccagcuccu cagccuccuc gagaucagca cccuccucac 180
aucagaggac ugccugcacu uccugcuccu ccaagcaaca gaaacagcug gccuggcaca 240
ggcggagaug cugcuggcgg agaagcuggu ggaucuagag gugccggcga cgguggcgac 300
ggcgaacuug cugaugaaga ucugcuggac gcuaucgccc uggccgcuga a 351
<210> 351
<211> 641
<212> PRT
<213> Epstein-Barr virus
<400> 351
Met Ser Asp Glu Gly Pro Gly Thr Gly Pro Gly Asn Gly Leu Gly Glu
1 5 10 15
Lys Gly Asp Thr Ser Gly Pro Glu Gly Ser Gly Gly Ser Gly Pro Gln
20 25 30
Arg Arg Gly Gly Asp Asn His Gly Arg Gly Arg Gly Arg Gly Arg Gly
35 40 45
Arg Gly Gly Gly Arg Pro Gly Ala Pro Gly Gly Ser Gly Ser Gly Pro
50 55 60
Arg His Arg Asp Gly Val Arg Arg Pro Gln Lys Arg Pro Ser Cys Ile
65 70 75 80
Gly Cys Lys Gly Thr His Gly Gly Thr Gly Ala Gly Ala Gly Ala Gly
85 90 95
Gly Ala Gly Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala Gly Ala Gly
100 105 110
Gly Gly Ala Gly Gly Ala Gly Gly Ala Gly Gly Ala Gly Ala Gly Gly
115 120 125
Gly Ala Gly Ala Gly Gly Gly Ala Gly Gly Ala Gly Gly Ala Gly Ala
130 135 140
Gly Gly Gly Ala Gly Ala Gly Gly Gly Ala Gly Gly Ala Gly Ala Gly
145 150 155 160
Gly Gly Ala Gly Gly Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala Gly
165 170 175
Ala Gly Gly Gly Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala Gly Gly
180 185 190
Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala Gly Ala Gly Gly Ala Gly
195 200 205
Gly Ala Gly Gly Ala Gly Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala
210 215 220
Gly Gly Ala Gly Gly Ala Gly Ala Gly Gly Ala Gly Ala Gly Gly Ala
225 230 235 240
Gly Ala Gly Gly Ala Gly Ala Gly Gly Ala Gly Gly Ala Gly Ala Gly
245 250 255
Gly Ala Gly Gly Ala Gly Ala Gly Gly Ala Gly Gly Ala Gly Ala Gly
260 265 270
Gly Gly Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala Gly Gly Ala Gly
275 280 285
Ala Gly Gly Ala Gly Gly Ala Gly Ala Gly Gly Ala Gly Gly Ala Gly
290 295 300
Ala Gly Gly Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala Gly Ala Gly
305 310 315 320
Gly Ala Gly Ala Gly Gly Gly Gly Arg Gly Arg Gly Gly Ser Gly Gly
325 330 335
Arg Gly Arg Gly Gly Ser Gly Gly Arg Gly Arg Gly Gly Ser Gly Gly
340 345 350
Arg Arg Gly Arg Gly Arg Glu Arg Ala Arg Gly Gly Ser Arg Glu Arg
355 360 365
Ala Arg Gly Arg Gly Arg Gly Arg Gly Glu Lys Arg Pro Arg Ser Pro
370 375 380
Ser Ser Gln Ser Ser Ser Ser Gly Ser Pro Pro Arg Arg Pro Pro Pro
385 390 395 400
Gly Arg Arg Pro Phe Phe His Pro Val Gly Glu Ala Asp Tyr Phe Glu
405 410 415
Tyr His Gln Glu Gly Gly Pro Asp Gly Glu Pro Asp Val Pro Pro Gly
420 425 430
Ala Ile Glu Gln Gly Pro Ala Asp Asp Pro Gly Glu Gly Pro Ser Thr
435 440 445
Gly Pro Arg Gly Gln Gly Asp Gly Gly Arg Arg Lys Lys Gly Gly Trp
450 455 460
Phe Gly Lys His Arg Gly Gln Gly Gly Ser Asn Pro Lys Phe Glu Asn
465 470 475 480
Ile Ala Glu Gly Leu Arg Ala Leu Leu Ala Arg Ser His Val Glu Arg
485 490 495
Thr Thr Asp Glu Gly Thr Trp Val Ala Gly Val Phe Val Tyr Gly Gly
500 505 510
Ser Lys Thr Ser Leu Tyr Asn Leu Arg Arg Gly Thr Ala Leu Ala Ile
515 520 525
Pro Gln Cys Arg Leu Thr Pro Leu Ser Arg Leu Pro Phe Gly Met Ala
530 535 540
Pro Gly Pro Gly Pro Gln Pro Gly Pro Leu Arg Glu Ser Ile Val Cys
545 550 555 560
Tyr Phe Met Val Phe Leu Gln Thr His Ile Phe Ala Glu Val Leu Lys
565 570 575
Asp Ala Ile Lys Asp Leu Val Met Thr Lys Pro Ala Pro Thr Cys Asn
580 585 590
Ile Arg Val Thr Val Cys Ser Phe Asp Asp Gly Val Asp Leu Pro Pro
595 600 605
Trp Phe Pro Pro Met Val Glu Gly Ala Ala Ala Glu Gly Asp Asp Gly
610 615 620
Asp Asp Gly Asp Glu Gly Gly Asp Gly Asp Glu Gly Glu Glu Gly Gln
625 630 635 640
Glu
<210> 352
<211> 1926
<212> DNA
<213> Epstein-Barr virus
<400> 352
atgtctgacg aggggccagg tacaggacct ggaaatggcc taggagagaa gggagacaca 60
tctggaccag aaggctccgg cggcagtgga cctcaaagaa gagggggtga taaccatgga 120
cgaggacggg gaagaggacg aggacgagga ggcggaagac caggagcccc gggcggctca 180
ggatcagggc caagacatag agatggtgtc cggagacccc aaaaacgtcc aagttgcatt 240
ggctgcaaag ggacccacgg tggaacagga gcaggagcag gagcgggagg ggcaggagca 300
ggaggggcag gagcaggagg aggggcagga gcaggaggag gggcaggagg ggcaggaggg 360
gcaggagggg caggagcagg aggaggggca ggagcaggag gaggggcagg aggggcagga 420
ggggcaggag caggaggagg ggcaggagca ggaggagggg caggaggggc aggagcagga 480
ggaggggcag gaggggcagg aggggcagga gcaggaggag gggcaggagc aggaggaggg 540
gcaggagggg caggagcagg aggaggggca ggaggggcag gaggggcagg agcaggagga 600
ggggcaggag caggaggggc aggaggggca ggaggggcag gagcaggagg ggcaggagca 660
ggaggagggg caggaggggc aggaggggca ggagcaggag gggcaggagc aggaggggca 720
ggagcaggag gggcaggagc aggaggggca ggaggggcag gagcaggagg ggcaggaggg 780
gcaggagcag gaggggcagg aggggcagga gcaggaggag gggcaggagg ggcaggagca 840
ggaggagggg caggaggggc aggagcagga ggggcaggag gggcaggagc aggaggggca 900
ggaggggcag gagcaggagg ggcaggaggg gcaggagcag gaggaggggc aggagcagga 960
ggggcaggag caggaggtgg aggccggggt cgaggaggca gtggaggccg gggtcgagga 1020
ggtagtggag gccggggtcg aggaggtagt ggaggccgcc ggggtagagg acgtgaaaga 1080
gccagggggg gaagtcgtga aagagccagg gggagaggtc gtggacgtgg agaaaagagg 1140
cccaggagtc ccagtagtca gtcatcatca tccgggtctc caccgcgcag gccccctcca 1200
ggtagaaggc catttttcca ccctgtaggg gaagccgatt attttgaata ccaccaagaa 1260
ggtggcccag atggtgagcc tgacgtgccc ccgggagcga tagagcaggg ccccgcagat 1320
gacccaggag aaggcccaag cactggaccc cggggtcagg gtgatggagg caggcgcaaa 1380
aaaggagggt ggtttggaaa gcatcgtggt caaggaggtt ccaacccgaa atttgagaac 1440
attgcagaag gtttaagagc tctcctggct aggagtcacg tagaaaggac taccgacgaa 1500
ggaacttggg tcgccggtgt gttcgtatat ggaggtagta agacctccct ttacaaccta 1560
aggcgaggaa ctgcccttgc tattccacaa tgtcgtctta caccattgag tcgtctcccc 1620
tttggaatgg cccctggacc cggcccacaa cctggcccgc taagggagtc cattgtctgt 1680
tatttcatgg tctttttaca aactcatata tttgctgagg ttttgaagga tgcgattaag 1740
gaccttgtta tgacaaagcc cgctcctacc tgcaatatca gggtgactgt gtgcagcttt 1800
gacgatggag tagatttgcc tccctggttt ccacctatgg tggaaggggc tgccgcggag 1860
ggtgatgacg gagatgacgg agatgaagga ggtgatggag atgagggtga ggaagggcag 1920
gagtga 1926
<210> 353
<211> 1926
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding EBV EBNA1 protein
<400> 353
atgtccgatg aaggccctgg aacaggccct ggcaatggac tgggagagaa gggcgataca 60
agcggccctg aaggttctgg cggatctggc cctcaaagaa gaggcggcga taatcacggc 120
agaggacgcg gaagaggtag aggcagaggc ggaggtagac ctggtgctcc tggtggttct 180
ggctctggcc ctagacatag agatggcgtc agacggcctc agaagaggcc ttcttgtatc 240
ggctgcaagg gcacacatgg cggaacaggt gctggtgctg gcgcaggcgg agcaggcgct 300
ggtggtgcag gcgctggcgg cggtgccggt gcaggcggcg gagctggtgg cgctggcggt 360
gctggcggag ctggtgcagg cggaggtgcc ggcgctggtg gcggagcagg cggagctggc 420
ggagccggcg ctggcggtgg cgctggtgcc ggcggaggcg caggcggcgc tggtgctggt 480
ggtggtgctg gcggcgcagg cggtgcaggc gcaggcggag gcgctggcgc tggcggtggt 540
gcaggcggtg ctggcgctgg cggcggtgct ggcggagccg gtggtgctgg tgctggtggc 600
ggagctggcg ctggcggagc tggcggtgca ggcggcgcag gcgctggtgg cgctggcgca 660
ggcggtggcg ctggcggagc aggcggagct ggcgctggcg gcgcaggcgc aggcggagcc 720
ggtgctggcg gagctggtgc tggtggtgca ggcggagctg gtgccggtgg cgctggtggt 780
gccggtgccg gtggtgccgg cggagccggc gcaggcggcg gtgcaggcgg agcaggcgca 840
ggcggcggag ctggtggtgc cggcgcaggc ggcgctggtg gtgctggtgc cggcggagct 900
ggtggcgcag gcgctggcgg tgcaggcggt gccggtgccg gtggtggtgc aggcgcaggc 960
ggtgctggtg ccggcggtgg cggaagagga agaggtggta gcggaggccg aggacgaggc 1020
ggaagtggtg gtcgtggtag aggcggcagc ggaggaagaa gaggacgggg tagagaacga 1080
gctagaggcg gatctagaga gagagcccga ggcagaggaa gaggccgcgg agagaaaaga 1140
cctagaagcc ctagcagcca gagcagctct agcggatctc cacctagaag gccacctcca 1200
ggcagacggc cattctttca ccctgtgggc gaagccgact acttcgagta ccaccaagaa 1260
ggcggacctg acggcgaacc tgatgttcct cctggcgcca ttgaacaggg cccagctgat 1320
gatcctggcg agggaccttc tacaggccct agaggacaag gcgacggcgg cagacgaaag 1380
aaaggcggat ggttcggcaa gcacagaggc caaggtggca gcaaccccaa gttcgagaat 1440
atcgccgagg gcctgagagc cctgctggcc agatctcacg tggaaagaac caccgacgaa 1500
ggcacatggg tggcaggcgt gttcgtttac ggcggctcta agaccagcct gtacaacctg 1560
agaagaggca cagccctggc cattcctcag tgcagactga cccctctgag cagactgcct 1620
tttggcatgg ctcctggacc tggacctcaa cctggaccac tgagagaatc catcgtgtgc 1680
tacttcatgg tgtttctgca gacccacatc ttcgccgagg tgctgaagga cgccatcaag 1740
gacctggtca tgacaaagcc cgctcctacc tgcaacatca gagtgaccgt gtgcagcttc 1800
gacgacggcg ttgacctgcc tccttggttt cctccaatgg tggaaggcgc tgctgccgaa 1860
ggcgacgatg gcgacgacgg cgacgaaggt ggcgacggcg acgagggcga agaaggacaa 1920
gagtaa 1926
<210> 354
<211> 1926
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding EBV EBNA1 protein
<400> 354
auguccgaug aaggcccugg aacaggcccu ggcaauggac ugggagagaa gggcgauaca 60
agcggcccug aagguucugg cggaucuggc ccucaaagaa gaggcggcga uaaucacggc 120
agaggacgcg gaagagguag aggcagaggc ggagguagac cuggugcucc uggugguucu 180
ggcucuggcc cuagacauag agauggcguc agacggccuc agaagaggcc uucuuguauc 240
ggcugcaagg gcacacaugg cggaacaggu gcuggugcug gcgcaggcgg agcaggcgcu 300
gguggugcag gcgcuggcgg cggugccggu gcaggcggcg gagcuggugg cgcuggcggu 360
gcuggcggag cuggugcagg cggaggugcc ggcgcuggug gcggagcagg cggagcuggc 420
ggagccggcg cuggcggugg cgcuggugcc ggcggaggcg caggcggcgc uggugcuggu 480
gguggugcug gcggcgcagg cggugcaggc gcaggcggag gcgcuggcgc uggcgguggu 540
gcaggcggug cuggcgcugg cggcggugcu ggcggagccg guggugcugg ugcugguggc 600
ggagcuggcg cuggcggagc uggcggugca ggcggcgcag gcgcuggugg cgcuggcgca 660
ggcgguggcg cuggcggagc aggcggagcu ggcgcuggcg gcgcaggcgc aggcggagcc 720
ggugcuggcg gagcuggugc ugguggugca ggcggagcug gugccggugg cgcugguggu 780
gccggugccg guggugccgg cggagccggc gcaggcggcg gugcaggcgg agcaggcgca 840
ggcggcggag cugguggugc cggcgcaggc ggcgcuggug gugcuggugc cggcggagcu 900
gguggcgcag gcgcuggcgg ugcaggcggu gccggugccg gugguggugc aggcgcaggc 960
ggugcuggug ccggcggugg cggaagagga agagguggua gcggaggccg aggacgaggc 1020
ggaaguggug gucgugguag aggcggcagc ggaggaagaa gaggacgggg uagagaacga 1080
gcuagaggcg gaucuagaga gagagcccga ggcagaggaa gaggccgcgg agagaaaaga 1140
ccuagaagcc cuagcagcca gagcagcucu agcggaucuc caccuagaag gccaccucca 1200
ggcagacggc cauucuuuca cccugugggc gaagccgacu acuucgagua ccaccaagaa 1260
ggcggaccug acggcgaacc ugauguuccu ccuggcgcca uugaacaggg cccagcugau 1320
gauccuggcg agggaccuuc uacaggcccu agaggacaag gcgacggcgg cagacgaaag 1380
aaaggcggau gguucggcaa gcacagaggc caagguggca gcaaccccaa guucgagaau 1440
aucgccgagg gccugagagc ccugcuggcc agaucucacg uggaaagaac caccgacgaa 1500
ggcacauggg uggcaggcgu guucguuuac ggcggcucua agaccagccu guacaaccug 1560
agaagaggca cagcccuggc cauuccucag ugcagacuga ccccucugag cagacugccu 1620
uuuggcaugg cuccuggacc uggaccucaa ccuggaccac ugagagaauc caucgugugc 1680
uacuucaugg uguuucugca gacccacauc uucgccgagg ugcugaagga cgccaucaag 1740
gaccugguca ugacaaagcc cgcuccuacc ugcaacauca gagugaccgu gugcagcuuc 1800
gacgacggcg uugaccugcc uccuugguuu ccuccaaugg uggaaggcgc ugcugccgaa 1860
ggcgacgaug gcgacgacgg cgacgaaggu ggcgacggcg acgagggcga agaaggacaa 1920
gaguaa 1926
<210> 355
<211> 201
<212> PRT
<213> Borna disease virus
<400> 355
Met Ala Thr Arg Pro Ser Ser Leu Val Asp Ser Leu Glu Asp Glu Glu
1 5 10 15
Asp Pro Gln Thr Leu Arg Arg Glu Arg Pro Gly Ser Pro Arg Pro Arg
20 25 30
Lys Val Pro Arg Asn Ala Leu Thr Gln Pro Val Asp Gln Leu Leu Lys
35 40 45
Asp Leu Arg Lys Asn Pro Ser Met Ile Ser Asp Pro Asp Gln Arg Thr
50 55 60
Gly Arg Glu Gln Leu Ser Asn Asp Glu Leu Ile Lys Lys Leu Val Thr
65 70 75 80
Glu Leu Ala Glu Asn Ser Met Ile Glu Ala Glu Glu Val Arg Gly Thr
85 90 95
Leu Gly Asp Ile Ser Ala Arg Ile Glu Ala Gly Phe Glu Ser Leu Ser
100 105 110
Ala Leu Gln Val Glu Thr Ile Gln Thr Ala Gln Arg Cys Asp His Ser
115 120 125
Asp Ser Ile Arg Ile Leu Gly Glu Asn Ile Lys Ile Leu Asp Arg Ser
130 135 140
Met Lys Thr Met Met Glu Thr Met Lys Leu Met Met Glu Lys Val Asp
145 150 155 160
Leu Leu Tyr Ala Ser Thr Ala Val Gly Thr Ser Ala Pro Met Leu Pro
165 170 175
Ser His Pro Ala Pro Pro Arg Ile Tyr Pro Gln Leu Pro Ser Ala Pro
180 185 190
Thr Thr Asp Glu Trp Asp Ile Ile Pro
195 200
<210> 356
<211> 603
<212> DNA
<213> Borna disease virus
<400> 356
atggcaacgc gaccatcgag tctggtcgac tccctggagg acgaagaaga tccccagaca 60
ctacgacggg aacgaccggg gtcaccaaga ccacggaagg tcccaaggaa tgcattgacc 120
caaccagtag accagctcct gaaggacctc aggaagaacc cctccatgat ctcagaccca 180
gaccagcgaa ccggaaggga gcagctgtcg aatgatgagc taatcaagaa gttagtgacg 240
gagctggccg agaatagcat gatcgaggct gaggaggtgc ggggcactct tggagacatc 300
tcggctcgta tcgaggcagg gtttgagtcc ctgtccgccc tccaagtgga aaccatccag 360
acagctcagc ggtgcgatca ctccgacagc atcaggatcc tcggcgagaa catcaagata 420
ctagatcgct ccatgaagac aatgatggag acaatgaagc tcatgatgga gaaggtggat 480
ctcctctacg catcaaccgc cgttgggacc tctgcaccca tgttgccctc ccatcctgca 540
cctccgcgca tttatcccca gctcccaagt gccccgacaa cggatgaatg ggacatcata 600
cca 603
<210> 357
<211> 603
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding BDV P protein
<400> 357
atggccacaa gacctagcag cctggtggac agcctggaag atgaggaaga tccccagaca 60
ctgcggagag agaggcctgg atctcccaga cctagaaagg tgcccagaaa cgccctgaca 120
cagcccgttg atcagctgct gaaggacctg agaaagaacc ccagcatgat cagcgacccc 180
gaccagagaa ccggaagaga gcagctgtct aacgacgagc tgattaagaa gctggtcacc 240
gagctggccg agaactccat gattgaggcc gaagaagtgc ggggcaccct gggcgatatc 300
tctgccagaa tcgaggccgg ctttgagtct ctgagcgccc tgcaggttga gacaatccag 360
acagcccaga gatgcgacca cagcgacagc atcagaatcc tgggcgagaa catcaagatc 420
ctggatcgga gcatgaagac catgatggaa accatgaagc tgatgatgga aaaggtggac 480
ctgctgtacg ccagcacagc cgtgggaaca tctgctccca tgctgccttc tcaccccgct 540
cctccaagaa tctaccctca gctgcctagc gctcccacca ccgatgagtg ggatatcatc 600
cct 603
<210> 358
<211> 603
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding BDV P protein
<400> 358
auggccacaa gaccuagcag ccugguggac agccuggaag augaggaaga uccccagaca 60
cugcggagag agaggccugg aucucccaga ccuagaaagg ugcccagaaa cgcccugaca 120
cagcccguug aucagcugcu gaaggaccug agaaagaacc ccagcaugau cagcgacccc 180
gaccagagaa ccggaagaga gcagcugucu aacgacgagc ugauuaagaa gcuggucacc 240
gagcuggccg agaacuccau gauugaggcc gaagaagugc ggggcacccu gggcgauauc 300
ucugccagaa ucgaggccgg cuuugagucu cugagcgccc ugcagguuga gacaauccag 360
acagcccaga gaugcgacca cagcgacagc aucagaaucc ugggcgagaa caucaagauc 420
cuggaucgga gcaugaagac caugauggaa accaugaagc ugaugaugga aaagguggac 480
cugcuguacg ccagcacagc cgugggaaca ucugcuccca ugcugccuuc ucaccccgcu 540
ccuccaagaa ucuacccuca gcugccuagc gcucccacca ccgaugagug ggauaucauc 600
ccu 603
<210> 359
<211> 98
<212> PRT
<213> Human papillomavirus type 16
<400> 359
Met His Gly Asp Thr Pro Thr Leu His Glu Tyr Met Leu Asp Leu Gln
1 5 10 15
Pro Glu Thr Thr Asp Leu Tyr Cys Tyr Glu Gln Leu Asn Asp Ser Ser
20 25 30
Glu Glu Glu Asp Glu Ile Asp Gly Pro Ala Gly Gln Ala Glu Pro Asp
35 40 45
Arg Ala His Tyr Asn Ile Val Thr Phe Cys Cys Lys Cys Asp Ser Thr
50 55 60
Leu Arg Leu Cys Val Gln Ser Thr His Val Asp Ile Arg Thr Leu Glu
65 70 75 80
Asp Leu Leu Met Gly Thr Leu Gly Ile Val Cys Pro Ile Cys Ser Gln
85 90 95
Lys Pro
<210> 360
<211> 294
<212> DNA
<213> Human papillomavirus type 16
<400> 360
atgcatggag atacacctac attgcatgaa tatatgttag atttgcaacc agagacaact 60
gatctctact gttatgagca attaaatgac agctcagagg aggaggatga aatagatggt 120
ccagctggac aagcagaacc ggacagagcc cattacaata ttgtaacctt ttgttgcaag 180
tgtgactcta cgcttcggtt gtgcgtacaa agcacacacg tagacattcg tactttggaa 240
gacctgttaa tgggcacact aggaattgtg tgccccatct gttctcagaa acca 294
<210> 361
<211> 294
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding HPV E7 protein
<400> 361
atgcacggcg atacccctac actgcacgag tacatgctgg acctgcagcc tgagacaacc 60
gacctgtact gctacgagca gctgaacgac agcagcgagg aagaggacga gattgacgga 120
cctgccggac aggccgaacc tgatagagcc cactacaata tcgtgacctt ctgctgcaag 180
tgcgacagca ccctgagact gtgtgtgcag agcacccacg tggacatcag aaccctggaa 240
gatctgctga tgggcaccct gggcatcgtg tgccctatct gttctcagaa gccc 294
<210> 362
<211> 294
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding HPV E7 protein
<400> 362
augcacggcg auaccccuac acugcacgag uacaugcugg accugcagcc ugagacaacc 60
gaccuguacu gcuacgagca gcugaacgac agcagcgagg aagaggacga gauugacgga 120
ccugccggac aggccgaacc ugauagagcc cacuacaaua ucgugaccuu cugcugcaag 180
ugcgacagca cccugagacu gugugugcag agcacccacg uggacaucag aacccuggaa 240
gaucugcuga ugggcacccu gggcaucgug ugcccuaucu guucucagaa gccc 294
<210> 363
<211> 567
<212> PRT
<213> Arenavirus
<400> 363
Met Ser Asn Ser Lys Glu Val Lys Ser Phe Leu Trp Thr Gln Ala Leu
1 5 10 15
Arg Arg Glu Leu Ser Pro Tyr Cys Thr Ser Val Lys Leu Gln Val Ile
20 25 30
Lys Asp Ala Gln Ser Leu Leu His Ser Leu Asp Phe Ser Glu Val Ser
35 40 45
Asn Val Gln Arg Leu Met Arg Lys Asp Lys Arg Asp Asp Gly Asp Leu
50 55 60
Lys Arg Leu Arg Asp Leu Asn Gln Ala Val Asn Asn Leu Val Glu Leu
65 70 75 80
Lys Ser Gln Gln Gln Lys Asn Val Leu Ser Val Gly Gln Leu Ser Ser
85 90 95
Asp Asp Leu Leu Val Leu Ala Ala Asp Ile Asp Arg Leu Lys Ala Lys
100 105 110
Ile Thr Arg Thr Glu Arg Pro Gln Ser Asn Gly Val Tyr Met Gly Asn
115 120 125
Leu Thr Ala Gln Gln Leu Glu Gln Arg Lys Lys Leu Leu Glu Leu Val
130 135 140
Gly Met Thr Arg Pro Asn Leu Arg Ala Gly Ser Asp Gly Val Val Arg
145 150 155 160
Val Trp Asp Val Lys Asn Pro Asp Leu Leu Asn Asn Gln Phe Gly Thr
165 170 175
Met Pro Ser Leu Thr Ile Ala Cys Met Thr Lys Gln Gly Gln Ser Asp
180 185 190
Ile Asn Asp Val Val Gln Ala Leu Thr Asp Leu Gly Leu Ile Tyr Thr
195 200 205
Ala Lys Tyr Pro Asn Ser Ser Asp Leu Asp Gln Leu Val Lys Thr His
210 215 220
Pro Val Leu Gly Ile Ile Asp Thr Glu Lys Ser Ala Ile Asn Val Ser
225 230 235 240
Gly Tyr Asn Phe Ser Leu Ser Ala Ala Val Lys Ala Gly Ala Cys Met
245 250 255
Leu Asp Gly Gly Asn Met Leu Glu Thr Ile Lys Val Thr Pro Gln Asn
260 265 270
Ile Asp Pro Ile Leu Lys Lys Thr Leu Ala Val Lys Lys Ser Val Gly
275 280 285
Met Phe Val Ser Asp Thr Pro Gly Asp Arg Asn Pro Tyr Glu Asn Leu
290 295 300
Leu Tyr Lys Ile Cys Leu Ser Gly Asn Gly Trp Pro Tyr Ile Ala Ser
305 310 315 320
Arg Thr Ser Ile Leu Gly Arg Ala Trp Asp Asn Thr Val Val Asp Leu
325 330 335
Gly Ser Ser Asn Pro Ile Thr Lys Pro Leu Asn Gln Gln Ala Arg Asp
340 345 350
Lys Val Pro Gly Leu Gln Gln Thr Val Gly Leu Thr Tyr Ser Gln Ile
355 360 365
Met Cys Leu Lys Asp Ile Met Thr Gly Met Asp Pro Thr Ser Lys Thr
370 375 380
Trp Ile Asp Ile Glu Gly Arg Ala Glu Asp Pro Val Glu Ile Ala Ile
385 390 395 400
Tyr Gln Pro Ala Gly Gly Gln Tyr Ile His Phe Tyr Arg Glu Pro Thr
405 410 415
Asp Ala Lys Gln Phe Lys Gln Asp Ser Lys Tyr Ser His Gly Ile Asp
420 425 430
Ile Val Asp Leu Phe Arg Val Gln Pro Gly Leu Thr Ser Ala Val Ile
435 440 445
Glu Ser Leu Pro Lys Gly Met Val Leu Thr Cys Gln Gly Ser Glu Asp
450 455 460
Ile Arg Lys Leu Leu Asp Ser Gln Gly Arg Arg Asp Ile Lys Leu Ile
465 470 475 480
Asp Val Met Met Ser Lys Ile Asp Ala Arg Lys Phe Glu Asn Glu Val
485 490 495
Trp Asp Asp Leu Lys Thr Leu Cys Asn Met His Thr Gly Val Val His
500 505 510
Glu Lys Lys Lys Arg Gly Gly Lys Gln Glu Ile Thr Pro His Cys Ala
515 520 525
Leu Leu Asp Cys Ile Met Tyr Glu Ala Ala Thr Gln Gly Ser Tyr Lys
530 535 540
Thr Pro Lys Leu Thr Pro Leu Leu Pro Thr Asp Leu Val Phe Arg Ala
545 550 555 560
Gly Ala Pro Lys Val Thr Leu
565
<210> 364
<211> 1701
<212> DNA
<213> Arenavirus
<400> 364
atgagcaact ccaaggaggt gaagtccttt ctttggactc aagcccttag gagggaatta 60
tcaccatact gcacaagtgt caaacttcaa gttatcaagg atgctcagag tctccttcac 120
agcttggatt tctcagaagt gagtaatgta caacgcttga tgaggaagga caaaagggat 180
gacggtgact tgaagaggct gagagattta aatcaggcag tcaacaatct tgttgaacta 240
aaatctcaac agcagaaaaa tgtcttaagt gtggggcagc tgtcatctga tgacctttta 300
gtcctcgctg ctgacattga caggctgaaa gcaaagataa ccaggacaga gaggccccaa 360
tctaatgggg tctacatggg gaacctcaca gctcagcaac ttgaacaacg aaagaagctc 420
ctagagttgg tggggatgac cagaccaaac ttaagagctg gttctgatgg tgttgtcagg 480
gtgtgggacg tgaagaatcc tgatctcttg aataaccaat ttggcacaat gcccagtcta 540
acgattgcct gcatgacaaa acaaggacaa tcagacataa atgatgttgt tcaggcatta 600
actgacttgg ggctaattta tacagctaag tacccaaatt catcagatct tgatcaactt 660
gtcaaaaccc atccagtttt gggcatcata gacacagaaa aatctgccat caatgtttca 720
ggttacaact tcagcctgtc agctgcagtt aaggcaggtg catgtatgct agatgggggt 780
aacatgctcg agaccataaa ggtaacacct cagaatattg atccaattct gaagaagact 840
ctggcagtta aaaagtctgt tggcatgttt gtctcagaca caccaggtga cagaaaccca 900
tatgaaaact tactatacaa gatctgcctc tcaggcaatg gatggcccta cattgctagc 960
agaacttcaa ttctcgggag ggcctgggac aacacagttg tggacttggg cagcagtaac 1020
ccaatcacaa agcccctcaa tcagcaagct agagacaaag ttcctggttt gcagcaaaca 1080
gttggactca catactcaca aatcatgtgt ctcaaagaca taatgaccgg tatggacccg 1140
acaagtaaga cttggattga cattgagggc agggctgagg acccagtgga gattgccatc 1200
taccagccag ctggtgggca atatattcat ttctacagag aaccaacaga tgccaagcaa 1260
tttaagcagg attctaagta ctcacatggc attgacattg ttgacctgtt tagggtgcaa 1320
ccaggcctta caagtgctgt gatagagagt ctaccgaaag ggatggtctt aacttgtcag 1380
ggatctgagg acataagaaa gctgttagat agtcaggggc gccgagacat caagttaatt 1440
gatgtgatga tgagcaagat tgatgcacgg aagtttgaaa atgaggtctg ggatgatctt 1500
aaaacactgt gcaacatgca cactggggtg gtccatgaga agaagaagag aggtggtaaa 1560
caagaaataa cacctcactg tgcacttcta gactgcatta tgtatgaggc agccacccag 1620
gggtcataca agacccccaa attaacacct ctgctaccaa ctgacttggt gtttagagca 1680
ggagcaccca aagtcactct g 1701
<210> 365
<211> 1701
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding Arenavirus NP1 protein
<400> 365
atgagcaaca gcaaagaagt caagagcttc ctctggacac aggccctgag aagagagctg 60
agcccttact gcaccagcgt gaagctgcaa gtgatcaagg acgcccagag cctgctgcac 120
agcctggatt tttccgaggt gtccaacgtg cagcggctga tgcggaagga caagagagat 180
gacggcgacc tgaagcggct gagggatctg aatcaggccg tgaacaacct ggtggaactg 240
aagtcccagc agcagaaaaa cgtgctgagc gtgggccagc tgagcagcga cgatctgctt 300
gttctggccg ccgacatcga cagactgaag gccaagatca ccagaaccga gcggcctcag 360
agcaacggcg tgtacatggg aaatctgaca gcccagcagc tggaacagcg gaagaaactg 420
ctggaactcg tgggcatgac ccggcctaat ctgagagctg gctctgatgg cgtcgtcaga 480
gtgtgggacg tgaagaaccc cgacctgctg aacaaccagt tcggcaccat gcctagcctg 540
acaatcgcct gcatgaccaa gcagggccag agcgacatca acgatgtggt gcaggcactg 600
accgacctgg gcctgatcta caccgccaag tatcccaaca gcagcgacct ggatcagctg 660
gtcaagacac accctgtgct gggcatcatc gacaccgaga agtccgccat caacgtgtcc 720
ggctacaact tctctctgtc tgccgccgtg aaagccggcg cttgtatgct ggatggcggc 780
aacatgctgg aaaccatcaa agtgacccct cagaacatcg accccatcct gaagaaaacc 840
ctggccgtga agaaaagcgt ggggatgttc gtgtctgaca cccctggcga cagaaacccc 900
tacgagaacc tgctgtacaa gatctgcctg agcggcaacg gctggcccta tatcgccagc 960
agaaccagca ttctgggcag agcctgggac aacaccgtgg tggatctggg cagcagcaac 1020
cccatcacca agcctctgaa ccagcaggcc agagataagg tgccaggcct gcagcagaca 1080
gtgggcctga catacagcca gatcatgtgc ctgaaggaca tcatgaccgg catggacccc 1140
accagcaaga catggatcga catcgagggc agagctgagg accctgtgga aatcgccatc 1200
taccaacctg ccggcggaca gtacatccac ttctacagag agcccaccga cgccaagcag 1260
ttcaagcagg acagcaagta cagccacggc atcgatatcg tggacctgtt cagagtgcag 1320
cccggactga catctgccgt gatcgagtct ctgcccaaag gcatggtcct gacctgtcag 1380
ggcagcgagg acatcagaaa gctgctcgac agccagggca gaagagacat caagctgatc 1440
gacgtgatga tgagcaagat cgacgcccgg aagttcgaga acgaagtgtg ggatgacctg 1500
aaaaccctct gcaacatgca caccggcgtg gtgcacgaga agaagaagag aggcggcaag 1560
caagagatca cccctcactg tgctctgctg gactgcatta tgtacgaggc cgccacacag 1620
ggcagctaca agacccctaa actgacccct ctgctgccta ccgatctggt gtttagagcc 1680
ggcgcaccca aagtgacact g 1701
<210> 366
<211> 1701
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding Arenavirus NP1 protein
<400> 366
augagcaaca gcaaagaagu caagagcuuc cucuggacac aggcccugag aagagagcug 60
agcccuuacu gcaccagcgu gaagcugcaa gugaucaagg acgcccagag ccugcugcac 120
agccuggauu uuuccgaggu guccaacgug cagcggcuga ugcggaagga caagagagau 180
gacggcgacc ugaagcggcu gagggaucug aaucaggccg ugaacaaccu gguggaacug 240
aagucccagc agcagaaaaa cgugcugagc gugggccagc ugagcagcga cgaucugcuu 300
guucuggccg ccgacaucga cagacugaag gccaagauca ccagaaccga gcggccucag 360
agcaacggcg uguacauggg aaaucugaca gcccagcagc uggaacagcg gaagaaacug 420
cuggaacucg ugggcaugac ccggccuaau cugagagcug gcucugaugg cgucgucaga 480
gugugggacg ugaagaaccc cgaccugcug aacaaccagu ucggcaccau gccuagccug 540
acaaucgccu gcaugaccaa gcagggccag agcgacauca acgauguggu gcaggcacug 600
accgaccugg gccugaucua caccgccaag uaucccaaca gcagcgaccu ggaucagcug 660
gucaagacac acccugugcu gggcaucauc gacaccgaga aguccgccau caacgugucc 720
ggcuacaacu ucucucuguc ugccgccgug aaagccggcg cuuguaugcu ggauggcggc 780
aacaugcugg aaaccaucaa agugaccccu cagaacaucg accccauccu gaagaaaacc 840
cuggccguga agaaaagcgu ggggauguuc gugucugaca ccccuggcga cagaaacccc 900
uacgagaacc ugcuguacaa gaucugccug agcggcaacg gcuggcccua uaucgccagc 960
agaaccagca uucugggcag agccugggac aacaccgugg uggaucuggg cagcagcaac 1020
cccaucacca agccucugaa ccagcaggcc agagauaagg ugccaggccu gcagcagaca 1080
gugggccuga cauacagcca gaucaugugc cugaaggaca ucaugaccgg cauggacccc 1140
accagcaaga cauggaucga caucgagggc agagcugagg acccugugga aaucgccauc 1200
uaccaaccug ccggcggaca guacauccac uucuacagag agcccaccga cgccaagcag 1260
uucaagcagg acagcaagua cagccacggc aucgauaucg uggaccuguu cagagugcag 1320
cccggacuga caucugccgu gaucgagucu cugcccaaag gcaugguccu gaccugucag 1380
ggcagcgagg acaucagaaa gcugcucgac agccagggca gaagagacau caagcugauc 1440
gacgugauga ugagcaagau cgacgcccgg aaguucgaga acgaagugug ggaugaccug 1500
aaaacccucu gcaacaugca caccggcgug gugcacgaga agaagaagag aggcggcaag 1560
caagagauca ccccucacug ugcucugcug gacugcauua uguacgaggc cgccacacag 1620
ggcagcuaca agaccccuaa acugaccccu cugcugccua ccgaucuggu guuuagagcc 1680
ggcgcaccca aagugacacu g 1701
<210> 367
<211> 631
<212> PRT
<213> Hepatitis C virus
<400> 367
Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly Cys
1 5 10 15
Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu
20 25 30
Val Gln Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr Cys Ile
35 40 45
Asn Gly Val Cys Trp Thr Val Tyr His Gly Ala Gly Thr Arg Thr Ile
50 55 60
Ala Ser Pro Lys Gly Pro Val Ile Gln Thr Tyr Thr Asn Val Asp Gln
65 70 75 80
Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu Thr Pro
85 90 95
Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp
100 105 110
Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser
115 120 125
Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu
130 135 140
Cys Pro Thr Gly His Ala Val Gly Leu Phe Arg Ala Ala Val Cys Thr
145 150 155 160
Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Asn Leu Glu
165 170 175
Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser Pro Pro Ala
180 185 190
Val Pro Gln Ser Phe Gln Val Ala His Leu His Ala Pro Thr Gly Ser
195 200 205
Gly Lys Ser Thr Lys Val Pro Ala Ala Tyr Ala Ala Lys Gly Tyr Lys
210 215 220
Val Leu Val Leu Asn Pro Ser Val Ala Ala Thr Leu Gly Phe Gly Ala
225 230 235 240
Tyr Met Ser Lys Ala His Gly Val Asp Pro Asn Ile Arg Thr Gly Val
245 250 255
Arg Thr Ile Thr Thr Gly Ser Pro Ile Thr Tyr Ser Thr Tyr Gly Lys
260 265 270
Phe Leu Ala Asp Ala Gly Cys Ser Gly Gly Ala Tyr Asp Ile Ile Ile
275 280 285
Cys Asp Glu Cys His Ser Thr Asp Ala Thr Ser Ile Ser Gly Ile Gly
290 295 300
Thr Val Leu Asp Gln Ala Glu Thr Ala Gly Ala Arg Leu Val Val Leu
305 310 315 320
Ala Thr Ala Thr Pro Pro Gly Ser Val Thr Val Ser His Pro Asn Ile
325 330 335
Glu Glu Val Ala Leu Ser Thr Thr Gly Glu Ile Pro Phe Tyr Gly Lys
340 345 350
Ala Ile Pro Leu Glu Val Ile Lys Gly Gly Arg His Leu Ile Phe Cys
355 360 365
His Ser Lys Lys Lys Cys Asp Glu Leu Ala Ala Lys Leu Val Ala Leu
370 375 380
Gly Ile Asn Ala Val Ala Tyr Tyr Arg Gly Leu Asp Val Ser Val Ile
385 390 395 400
Pro Thr Ser Gly Asp Val Val Val Val Ser Thr Asp Ala Leu Met Thr
405 410 415
Gly Phe Thr Gly Asp Phe Asp Ser Val Ile Asp Cys Asn Thr Cys Val
420 425 430
Thr Gln Thr Val Asp Phe Ser Leu Asp Pro Thr Phe Thr Ile Glu Thr
435 440 445
Thr Thr Leu Pro Gln Asp Ala Val Ser Arg Thr Gln Arg Arg Gly Arg
450 455 460
Thr Gly Arg Gly Lys Pro Gly Ile Tyr Arg Phe Val Ala Pro Gly Glu
465 470 475 480
Arg Pro Ser Gly Met Phe Asp Ser Ser Val Leu Cys Glu Cys Tyr Asp
485 490 495
Ala Gly Cys Ala Trp Tyr Glu Leu Thr Pro Ala Glu Thr Thr Val Arg
500 505 510
Leu Arg Ala Tyr Met Asn Thr Pro Gly Leu Pro Val Cys Gln Asp His
515 520 525
Leu Gly Phe Trp Glu Gly Val Phe Thr Gly Leu Thr His Ile Asp Ala
530 535 540
His Phe Leu Ser Gln Thr Lys Gln Ser Gly Glu Asn Phe Pro Tyr Leu
545 550 555 560
Val Ala Tyr Gln Ala Thr Val Cys Ala Arg Ala Gln Ala Pro Pro Pro
565 570 575
Ser Trp Asp Gln Met Arg Lys Cys Leu Ile Arg Leu Lys Pro Thr Leu
580 585 590
His Gly Pro Thr Pro Leu Leu Tyr Arg Leu Gly Ala Val Gln Asn Glu
595 600 605
Val Thr Leu Thr His Pro Ile Thr Lys Tyr Ile Met Thr Cys Met Ser
610 615 620
Ala Asp Leu Glu Val Val Thr
625 630
<210> 368
<211> 1893
<212> DNA
<213> Hepatitis C virus
<400> 368
gcgcccatca cggcgtacgc ccagcagacg agaggcctcc tagggtgtat aatcaccagc 60
ctgactggcc gggacaaaaa ccaagtggag ggtgaggtcc agatcgtgtc aactgctacc 120
cagaccttcc tggcaacgtg catcaatggg gtatgctgga ctgtctacca cggggccgga 180
acgaggacca tcgcatcacc caagggtcct gtcatccaga cgtataccaa tgtggatcaa 240
gacctcgtgg gctggcccgc tcctcaaggt tcccgctcat tgacaccctg cacctgcggc 300
tcctcggacc tttacctggt cacgaggcac gccgatgtca ttcccgtgcg ccggcgaggt 360
gatagcaggg gtagcctgct ttcgccccgg cccatttcct acttgaaagg ctcctcgggg 420
ggtccgctgt tgtgccccac gggacacgcc gtgggcctat tcagggccgc ggtgtgcacc 480
cgtggagtgg ctaaggcggt ggactttatc cctgtggaga acctagagac aaccatgaga 540
tccccggtgt tcacggacaa ctcctctcca ccagcagtgc cccagagctt ccaggtggcc 600
cacctgcatg ctcccaccgg cagcggtaag agcaccaagg tcccggctgc gtacgcagcc 660
aagggctaca aggtgttggt gctcaacccc tctgttgctg caacactggg ctttggtgct 720
tacatgtcca aggcccatgg ggttgatcct aatatcagga ccggggtgag aacaattacc 780
actggcagcc ccatcacgta ctccacctac ggcaagttcc ttgccgacgc cgggtgctca 840
ggaggtgctt atgacataat aatttgtgac gagtgccact ccacggatgc cacatccatc 900
tcgggcatcg gcactgtcct tgaccaagca gagactgcgg gggcgagact ggttgtgctc 960
gccactgcta cccctccggg ctccgtcact gtgtcccatc ctaacatcga ggaggttgct 1020
ctgtccacca ccggagagat ccccttttac ggcaaggcta tccccctcga ggtgatcaag 1080
gggggaagac atctcatctt ctgccactca aagaagaagt gcgacgagct cgccgcgaag 1140
ctggtcgcat tgggcatcaa tgccgtggcc tactaccgcg gtcttgacgt gtctgtcatc 1200
ccgaccagcg gcgatgttgt cgtcgtgtcg accgatgctc tcatgactgg ctttaccggc 1260
gacttcgact ctgtgataga ctgcaacacg tgtgtcactc agacagtcga ttttagcctt 1320
gaccctacct ttaccattga gacaaccacg ctcccccagg atgctgtctc caggactcaa 1380
cgccggggca ggactggcag ggggaagcca ggcatctata gatttgtggc accgggggag 1440
cgcccctccg gcatgttcga ctcgtccgtc ctctgtgagt gctatgacgc gggctgtgct 1500
tggtatgagc tcacgcccgc cgagactaca gttaggctac gagcgtacat gaacaccccg 1560
gggcttcccg tgtgccagga ccatcttgga ttttgggagg gcgtctttac gggcctcact 1620
catatagatg cccactttct atcccagaca aagcagagtg gggagaactt tccttacctg 1680
gtagcgtacc aagccaccgt gtgcgctagg gctcaagccc ctcccccatc gtgggaccag 1740
atgcggaagt gtttgatccg ccttaaaccc accctccatg ggccaacacc cctgctatac 1800
agactgggcg ctgttcagaa tgaagtcacc ctgacgcacc caatcaccaa atacatcatg 1860
acatgcatgt cggccgacct ggaggtcgtc acg 1893
<210> 369
<211> 1893
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding HCV NS3 protein
<400> 369
gcccctatca cagcctacgc tcagcagaca agaggcctgc tgggctgcat catcacaagc 60
ctgaccggca gagacaagaa ccaggtggaa ggcgaggtgc agatcgtgtc tacagctacc 120
cagaccttcc tggccacctg tatcaatggc gtgtgctgga ccgtgtatca cggcgctggc 180
accagaacaa tcgcctctcc aaagggccct gtgatccaga cctacaccaa cgtggaccag 240
gatctcgttg gctggcctgc tcctcagggc agcagatctc tgaccccttg tacatgcggc 300
agcagcgacc tgtacctggt cacaagacac gccgacgtga tccccgtcag aagaagaggc 360
gatagcagag gcagcctgct gagccctaga cctatcagct acctgaaggg cagctctggc 420
ggacctctgc tgtgtccaac aggacatgcc gtgggcctgt ttagagccgc cgtgtgtaca 480
agaggcgtgg ccaaagccgt ggacttcatc cccgtggaaa acctggaaac caccatgcgg 540
agccccgtgt tcaccgacaa ttctagccct ccagccgtgc ctcagagctt ccaagtggct 600
catctgcatg cccctacagg cagcggcaag agcacaaaag tgcctgccgc ctatgccgcc 660
aagggctata aggtgctggt gctgaatccc agcgtggccg ccacacttgg ctttggcgcc 720
tatatgtcta aagcccacgg cgtggacccc aacatcagaa ccggcgtgcg gacaatcaca 780
acaggcagcc ctatcaccta ctctacctac ggcaagttcc tggccgatgc cggatgttct 840
ggcggagcct acgacatcat catctgcgac gagtgccaca gcaccgacgc cacatctatc 900
tctggcatcg gcaccgtgct ggatcaggcc gaaacagctg gtgctagact ggtggtgctg 960
gccacagcta cacctccagg ctctgtgaca gtgtctcacc ccaatatcga ggaagtggcc 1020
ctgtctacaa ccggcgagat cccattctat ggcaaggcca ttcctctgga agtgatcaaa 1080
ggcggcagac acctgatctt ttgccactcc aagaagaagt gcgacgagct ggccgccaaa 1140
ctggtggccc ttggaatcaa tgccgtggcc tactacagag gactggacgt gtccgtgatt 1200
cccacatctg gcgacgtggt ggtggtgtcc actgatgccc tgatgaccgg cttcaccggc 1260
gacttcgata gcgtgatcga ctgcaatacc tgcgtgaccc agaccgtgga tttctctctg 1320
gaccccacct tcaccatcga gacaaccaca ctgcctcagg acgccgtgtc tcggacacag 1380
agaagaggca gaaccggaag aggcaagccc ggcatctaca gatttgtggc ccctggcgaa 1440
agacccagcg gcatgtttga tagcagcgtg ctgtgcgagt gctacgatgc tggctgtgct 1500
tggtacgagc tgacccctgc cgagactacc gttagactgc gggcctacat gaacacccct 1560
ggcctgcctg tgtgtcagga ccacctcgga ttttgggagg gcgtgttcac aggactgacc 1620
cacatcgacg cccactttct gagccagaca aagcagagcg gcgagaactt cccttacctg 1680
gtggcttacc aggccaccgt gtgtgctaga gcacaagccc ctccacctag ctgggaccag 1740
atgaggaagt gcctgatccg gctgaagcct acactgcacg gaccaacacc actgctgtat 1800
agactgggcg ccgtgcagaa cgaagtgacc ctgacacatc ccatcaccaa gtacatcatg 1860
acctgcatga gcgccgacct ggaagtggtc aca 1893
<210> 370
<211> 1893
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding HCV NS3 protein
<400> 370
gccccuauca cagccuacgc ucagcagaca agaggccugc ugggcugcau caucacaagc 60
cugaccggca gagacaagaa ccagguggaa ggcgaggugc agaucguguc uacagcuacc 120
cagaccuucc uggccaccug uaucaauggc gugugcugga ccguguauca cggcgcuggc 180
accagaacaa ucgccucucc aaagggcccu gugauccaga ccuacaccaa cguggaccag 240
gaucucguug gcuggccugc uccucagggc agcagaucuc ugaccccuug uacaugcggc 300
agcagcgacc uguaccuggu cacaagacac gccgacguga uccccgucag aagaagaggc 360
gauagcagag gcagccugcu gagcccuaga ccuaucagcu accugaaggg cagcucuggc 420
ggaccucugc uguguccaac aggacaugcc gugggccugu uuagagccgc cguguguaca 480
agaggcgugg ccaaagccgu ggacuucauc cccguggaaa accuggaaac caccaugcgg 540
agccccgugu ucaccgacaa uucuagcccu ccagccgugc cucagagcuu ccaaguggcu 600
caucugcaug ccccuacagg cagcggcaag agcacaaaag ugccugccgc cuaugccgcc 660
aagggcuaua aggugcuggu gcugaauccc agcguggccg ccacacuugg cuuuggcgcc 720
uauaugucua aagcccacgg cguggacccc aacaucagaa ccggcgugcg gacaaucaca 780
acaggcagcc cuaucaccua cucuaccuac ggcaaguucc uggccgaugc cggauguucu 840
ggcggagccu acgacaucau caucugcgac gagugccaca gcaccgacgc cacaucuauc 900
ucuggcaucg gcaccgugcu ggaucaggcc gaaacagcug gugcuagacu gguggugcug 960
gccacagcua caccuccagg cucugugaca gugucucacc ccaauaucga ggaaguggcc 1020
cugucuacaa ccggcgagau cccauucuau ggcaaggcca uuccucugga agugaucaaa 1080
ggcggcagac accugaucuu uugccacucc aagaagaagu gcgacgagcu ggccgccaaa 1140
cugguggccc uuggaaucaa ugccguggcc uacuacagag gacuggacgu guccgugauu 1200
cccacaucug gcgacguggu gguggugucc acugaugccc ugaugaccgg cuucaccggc 1260
gacuucgaua gcgugaucga cugcaauacc ugcgugaccc agaccgugga uuucucucug 1320
gaccccaccu ucaccaucga gacaaccaca cugccucagg acgccguguc ucggacacag 1380
agaagaggca gaaccggaag aggcaagccc ggcaucuaca gauuuguggc cccuggcgaa 1440
agacccagcg gcauguuuga uagcagcgug cugugcgagu gcuacgaugc uggcugugcu 1500
ugguacgagc ugaccccugc cgagacuacc guuagacugc gggccuacau gaacaccccu 1560
ggccugccug ugugucagga ccaccucgga uuuugggagg gcguguucac aggacugacc 1620
cacaucgacg cccacuuucu gagccagaca aagcagagcg gcgagaacuu cccuuaccug 1680
guggcuuacc aggccaccgu gugugcuaga gcacaagccc cuccaccuag cugggaccag 1740
augaggaagu gccugauccg gcugaagccu acacugcacg gaccaacacc acugcuguau 1800
agacugggcg ccgugcagaa cgaagugacc cugacacauc ccaucaccaa guacaucaug 1860
accugcauga gcgccgaccu ggaagugguc aca 1893
<210> 371
<211> 127
<212> PRT
<213> Dengue virus type 1
<400> 371
Ser Val Ser Gly Asp Leu Ile Leu Glu Ile Gly Lys Leu Pro Gln His
1 5 10 15
Leu Thr Gln Arg Ala Gln Asn Ala Leu Asp Asn Leu Val Met Leu His
20 25 30
Asn Ser Glu Gln Gly Gly Lys Ala Tyr Arg His Ala Met Glu Glu Leu
35 40 45
Pro Asp Thr Ile Glu Thr Leu Met Leu Leu Ala Leu Ile Ala Val Leu
50 55 60
Thr Gly Gly Val Thr Leu Phe Phe Leu Ser Gly Arg Gly Leu Gly Lys
65 70 75 80
Thr Ser Ile Gly Leu Leu Cys Val Ile Ala Ser Ser Ala Leu Leu Trp
85 90 95
Met Ala Ser Val Glu Pro His Trp Ile Ala Ala Ser Ile Ile Leu Glu
100 105 110
Phe Phe Leu Met Val Leu Leu Ile Pro Glu Pro Asp Arg Gln Arg
115 120 125
<210> 372
<211> 381
<212> DNA
<213> Dengue virus type 1
<400> 372
agcgtctcag gtgacctaat attagaaata gggaaacttc cacaacattt aacgcaaagg 60
gcccagaacg ccttggacaa tctggttatg ttgcacaact ctgaacaagg aggaaaagcc 120
tatagacacg ccatggaaga actaccagac accatagaaa cgttaatgct cctagctttg 180
atagctgtgc tgactggtgg agtgacgttg ttcttcctat caggaagggg tctaggaaaa 240
acatccattg gcctactctg cgtgattgcc tcaagcgcac tgctatggat ggccagtgtg 300
gaaccccatt ggatagcggc ctctatcata ctggagttct ttctgatggt gttgcttatt 360
ccagagccgg acagacagcg c 381
<210> 373
<211> 381
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding DENV 1 NS4A
<400> 373
tccgttagcg gcgacctgat cctggaaatc ggcaagctgc ctcagcacct gacacagaga 60
gcacagaacg ccctggacaa cctggtcatg ctgcacaact ctgagcaagg cggcaaggcc 120
tacagacacg ccatggaaga actgcccgac accatcgaga cactgatgct gctggccctg 180
atcgctgttc tgacaggcgg agtgaccctg ttcttcctgt ctggcagagg cctgggcaag 240
acctctatcg gactgctgtg tgtgatcgcc agctctgccc tgctgtggat ggcttctgtg 300
gaacctcatt ggatcgccgc ctctattatc ctggaattct tcctgatggt gctgctgatc 360
cccgagcctg acagacagag a 381
<210> 374
<211> 381
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding DENV 1 NS4A
<400> 374
uccguuagcg gcgaccugau ccuggaaauc ggcaagcugc cucagcaccu gacacagaga 60
gcacagaacg cccuggacaa ccuggucaug cugcacaacu cugagcaagg cggcaaggcc 120
uacagacacg ccauggaaga acugcccgac accaucgaga cacugaugcu gcuggcccug 180
aucgcuguuc ugacaggcgg agugacccug uucuuccugu cuggcagagg ccugggcaag 240
accucuaucg gacugcugug ugugaucgcc agcucugccc ugcuguggau ggcuucugug 300
gaaccucauu ggaucgccgc cucuauuauc cuggaauucu uccugauggu gcugcugauc 360
cccgagccug acagacagag a 381
<210> 375
<211> 218
<212> PRT
<213> Dengue virus type 1
<400> 375
Gly Ser Gly Glu Val Asp Ser Phe Ser Leu Gly Leu Leu Cys Ile Ser
1 5 10 15
Ile Met Ile Glu Glu Val Met Arg Ser Arg Trp Ser Arg Lys Met Leu
20 25 30
Met Thr Gly Thr Leu Ala Val Phe Leu Leu Leu Thr Met Gly Gln Leu
35 40 45
Thr Trp Asn Asp Leu Ile Arg Leu Cys Ile Met Val Gly Ala Asn Ala
50 55 60
Ser Asp Lys Met Gly Met Gly Thr Thr Tyr Leu Ala Leu Met Ala Thr
65 70 75 80
Phe Arg Met Arg Pro Met Phe Ala Val Gly Leu Leu Phe Arg Arg Leu
85 90 95
Thr Ser Arg Glu Val Leu Leu Leu Thr Val Gly Leu Ser Leu Val Ala
100 105 110
Ser Val Glu Leu Pro Asn Ser Leu Glu Glu Leu Gly Asp Gly Leu Ala
115 120 125
Met Gly Ile Met Met Leu Lys Leu Leu Thr Asp Phe Gln Ser His Gln
130 135 140
Leu Trp Ala Thr Leu Leu Ser Leu Thr Phe Val Lys Thr Thr Phe Ser
145 150 155 160
Leu His Tyr Ala Trp Lys Thr Met Ala Met Ile Leu Ser Ile Val Ser
165 170 175
Leu Phe Pro Leu Cys Leu Ser Thr Thr Ser Gln Lys Thr Thr Trp Leu
180 185 190
Pro Val Leu Leu Gly Ser Leu Gly Cys Lys Pro Leu Thr Met Phe Leu
195 200 205
Ile Thr Glu Asn Lys Ile Trp Gly Arg Lys
210 215
<210> 376
<211> 654
<212> DNA
<213> Dengue virus type 1
<400> 376
gggtcaggag aagtggacag tttttcacta ggactgctat gcatatcaat aatgatcgaa 60
gaggtaatga gatccagatg gagcagaaaa atgctgatga ctggaacatt ggctgtgttc 120
ctccttctca caatgggaca attgacatgg aatgatctga tcaggctatg tatcatggtt 180
ggagccaacg cttcagacaa gatggggatg ggaacaacgt acctagcttt gatggccact 240
ttcagaatga gaccaatgtt cgcagtcggg ctactgtttc gcagattaac atctagagaa 300
gttcttcttc ttacagttgg attgagtctg gtggcatctg tagaactacc aaattcctta 360
gaggagctag gggatggact tgcaatgggc atcatgatgt tgaaattact gactgatttt 420
cagtcacatc agctatgggc taccttgctg tctttaacat ttgtcaaaac aactttttca 480
ttgcactatg catggaagac aatggctatg atactgtcaa ttgtatctct cttcccttta 540
tgcctgtcca cgacttctca aaaaacaaca tggcttccgg tgttgctggg atctcttgga 600
tgcaaaccac taaccatgtt tcttataaca gaaaacaaaa tctggggaag gaaa 654
<210> 377
<211> 654
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding DENV 1 NS2A
<400> 377
ggatctggcg aggtggactc tttttctctg ggcctgctgt gcatcagcat catgatcgag 60
gaagtgatgc ggagccgctg gtcccggaaa atgctgatga ctggaaccct ggccgtgttc 120
ctgctgctga caatgggaca gctgacctgg aacgacctga tccggctgtg tatcatggtc 180
ggagccaacg ccagcgacaa gatgggcatg ggcacaacct atctggccct gatggccacc 240
ttccggatga ggcctatgtt tgccgtggga ctgctgttca gaaggctgac ctctagagag 300
gtgctgctgc tcacagtggg cctgtctctg gtggcttctg tggaactgcc caacagcctg 360
gaagaactcg gagatggact ggccatgggc attatgatgc tcaagctgct gaccgacttc 420
cagagccacc agctgtgggc tacactgctg agcctgacct tcgtgaaaac caccttcagc 480
ctgcactacg cctggaaaac aatggccatg atcctgagca tcgtgtctct gttccctctg 540
tgcctgagca ccaccagcca gaaaaccaca tggctgcctg tgctgctggg ctctctgggc 600
tgtaaacccc tgaccatgtt cctgatcacc gagaacaaga tctggggcag aaag 654
<210> 378
<211> 654
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding DENV 1 NS2A
<400> 378
ggaucuggcg agguggacuc uuuuucucug ggccugcugu gcaucagcau caugaucgag 60
gaagugaugc ggagccgcug gucccggaaa augcugauga cuggaacccu ggccguguuc 120
cugcugcuga caaugggaca gcugaccugg aacgaccuga uccggcugug uaucaugguc 180
ggagccaacg ccagcgacaa gaugggcaug ggcacaaccu aucuggcccu gauggccacc 240
uuccggauga ggccuauguu ugccguggga cugcuguuca gaaggcugac cucuagagag 300
gugcugcugc ucacaguggg ccugucucug guggcuucug uggaacugcc caacagccug 360
gaagaacucg gagauggacu ggccaugggc auuaugaugc ucaagcugcu gaccgacuuc 420
cagagccacc agcugugggc uacacugcug agccugaccu ucgugaaaac caccuucagc 480
cugcacuacg ccuggaaaac aauggccaug auccugagca ucgugucucu guucccucug 540
ugccugagca ccaccagcca gaaaaccaca uggcugccug ugcugcuggg cucucugggc 600
uguaaacccc ugaccauguu ccugaucacc gagaacaaga ucuggggcag aaag 654
<210> 379
<211> 218
<212> PRT
<213> Dengue virus type 2
<400> 379
Gly His Gly Gln Val Asp Asn Phe Ser Leu Gly Val Leu Gly Met Ala
1 5 10 15
Leu Phe Leu Glu Glu Met Leu Arg Thr Arg Val Gly Thr Lys His Ala
20 25 30
Ile Leu Leu Val Ala Val Ser Phe Val Thr Leu Ile Ile Gly Asn Met
35 40 45
Ser Phe Arg Asp Leu Gly Arg Val Met Val Met Val Gly Ala Thr Met
50 55 60
Thr Asp Asp Ile Gly Met Gly Val Thr Tyr Leu Ala Leu Leu Ala Ala
65 70 75 80
Phe Lys Val Arg Pro Thr Phe Ala Ala Gly Leu Leu Leu Arg Lys Leu
85 90 95
Thr Ser Lys Ala Leu Met Met Thr Thr Ile Gly Ile Val Leu Ser Ser
100 105 110
Gln Ser Thr Thr Pro Glu Thr Ile Leu Glu Leu Thr Asp Ala Leu Ala
115 120 125
Leu Gly Met Met Val Leu Lys Met Val Arg Asn Met Glu Lys Tyr Gln
130 135 140
Leu Ala Val Thr Ile Met Ala Ile Leu Cys Val Pro Asn Ala Val Ile
145 150 155 160
Leu Gln Asn Ala Trp Lys Val Ser Cys Thr Ile Leu Ala Val Val Ser
165 170 175
Val Ser Pro Leu Phe Leu Thr Ser Ser Gln Gln Lys Thr Asp Trp Ile
180 185 190
Pro Leu Ala Leu Thr Ile Lys Gly Leu Asn Pro Thr Ala Ile Phe Leu
195 200 205
Thr Thr Leu Ser Arg Thr Ser Lys Lys Arg
210 215
<210> 380
<211> 654
<212> DNA
<213> Dengue virus type 2
<400> 380
ggacatgggc aggtcgacaa cttttcacta ggagtcttgg gaatggcatt gttcctggag 60
gaaatgctta ggacccgagt aggaacgaaa catgcaatac tactagttgc agtttctttt 120
gtgacattga tcatagggaa catgtccttt agagacctgg gaagagtaat ggttatggta 180
ggcgccacta tgacggatga cataggtatg ggcgtgactt atcttgccct actagcagcc 240
ttcaaagtca gaccaacttt tgcagctgga ctactcttga gaaagctgac ctccaaggca 300
ttgatgatga ctactatagg aattgtactc tcctcccaga gcactacacc agagaccatt 360
cttgagttga ctgatgcgtt agccttaggc atgatggtcc tcaaaatggt gagaaatatg 420
gaaaagtatc aattggcagt gactatcatg gctatcttgt gcgtcccaaa cgcagtgata 480
ttacaaaacg catggaaagt gagttgcacg atattggcag tggtgtccgt ttccccactg 540
ttcttaacat cctcacagca aaaaacggat tggataccat tagcgttgac gatcaaaggt 600
ctcaatccaa cagctatttt tctaacaacc ctctcaagaa ccagcaagaa aagg 654
<210> 381
<211> 654
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding DENV 2 NS2A protein
<400> 381
ggacacggac aggtggacaa tttttccctg ggcgtgctcg gcatggccct gtttctggaa 60
gagatgctga gaaccagagt gggcaccaag cacgccattc tgctggtggc cgtgtccttc 120
gtgacactga tcatcggcaa catgagcttc cgcgacctgg gcagagtgat ggtcatggtc 180
ggagccacca tgaccgacga tatcggcatg ggcgtgacct atctggctct gctggccgct 240
tttaaagtgc ggcctacatt tgccgccgga ctgctgctga gaaagctgac atctaaggcc 300
ctgatgatga ccaccatcgg catcgtgctg agcagccaga gcaccacacc tgagacaatc 360
ctggaactga ccgacgctct ggccctggga atgatggtgc tgaagatggt ccgaaacatg 420
gaaaagtacc agctggccgt gaccatcatg gccatcctgt gtgtgcccaa cgccgtgatc 480
ctgcagaacg cctggaaggt gtcctgtacc atcctggccg tggtgtctgt gtcccctctg 540
tttctgacca gcagccagca gaaaaccgac tggatcccac tggctctgac catcaagggc 600
ctgaatccta ccgccatctt cctgaccaca ctgagccgga ccagcaagaa gaga 654
<210> 382
<211> 654
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding DENV 2 NS2A
<400> 382
ggacacggac agguggacaa uuuuucccug ggcgugcucg gcauggcccu guuucuggaa 60
gagaugcuga gaaccagagu gggcaccaag cacgccauuc ugcugguggc cguguccuuc 120
gugacacuga ucaucggcaa caugagcuuc cgcgaccugg gcagagugau ggucaugguc 180
ggagccacca ugaccgacga uaucggcaug ggcgugaccu aucuggcucu gcuggccgcu 240
uuuaaagugc ggccuacauu ugccgccgga cugcugcuga gaaagcugac aucuaaggcc 300
cugaugauga ccaccaucgg caucgugcug agcagccaga gcaccacacc ugagacaauc 360
cuggaacuga ccgacgcucu ggcccuggga augauggugc ugaagauggu ccgaaacaug 420
gaaaaguacc agcuggccgu gaccaucaug gccauccugu gugugcccaa cgccgugauc 480
cugcagaacg ccuggaaggu guccuguacc auccuggccg uggugucugu guccccucug 540
uuucugacca gcagccagca gaaaaccgac uggaucccac uggcucugac caucaagggc 600
cugaauccua ccgccaucuu ccugaccaca cugagccgga ccagcaagaa gaga 654
<210> 383
<211> 218
<212> PRT
<213> Dengue virus type 4
<400> 383
Gly Gln Gly Thr Ser Glu Thr Phe Ser Met Gly Leu Leu Cys Leu Thr
1 5 10 15
Leu Phe Val Glu Glu Cys Leu Arg Arg Arg Val Thr Arg Lys His Met
20 25 30
Ile Leu Val Val Val Ile Thr Leu Cys Ala Ile Ile Leu Gly Gly Leu
35 40 45
Thr Trp Met Asp Leu Leu Arg Ala Leu Ile Met Leu Gly Asp Thr Met
50 55 60
Ser Gly Arg Ile Gly Gly Gln Ile His Leu Ala Ile Met Ala Val Phe
65 70 75 80
Lys Met Ser Pro Gly Tyr Val Leu Gly Val Phe Leu Arg Lys Leu Thr
85 90 95
Ser Arg Glu Thr Ala Leu Met Val Ile Gly Met Ala Met Thr Thr Val
100 105 110
Leu Ser Ile Pro His Asp Leu Met Glu Leu Ile Asp Gly Ile Ser Leu
115 120 125
Gly Leu Ile Leu Leu Lys Ile Val Thr Gln Phe Asp Asn Thr Gln Val
130 135 140
Gly Thr Leu Ala Leu Ser Leu Thr Phe Ile Arg Ser Thr Met Pro Leu
145 150 155 160
Val Met Ala Trp Arg Thr Ile Met Ala Val Leu Phe Val Val Thr Leu
165 170 175
Ile Pro Leu Cys Arg Thr Ser Cys Leu Gln Lys Gln Ser His Trp Val
180 185 190
Glu Ile Thr Ala Leu Ile Leu Gly Ala Gln Ala Leu Pro Val Tyr Leu
195 200 205
Met Thr Leu Met Lys Gly Ala Ser Arg Arg
210 215
<210> 384
<211> 654
<212> DNA
<213> Dengue virus type 4
<400> 384
ggacagggca catcagaaac tttttctatg ggtctgttgt gcctgacctt gtttgtggaa 60
gaatgcttga ggagaagagt cactaggaaa cacatgatat tagttgtggt gatcactctt 120
tgtgctatca tcctgggagg cctcacatgg atggacttac tacgagccct catcatgttg 180
ggggacacta tgtctggtag aataggagga cagatccacc tagccatcat ggcagtgttc 240
aagatgtcac caggatacgt gctgggtgtg tttttaagga aactcacttc aagagagaca 300
gcactaatgg taataggaat ggccatgaca acggtgcttt caattccaca tgaccttatg 360
gaactcattg atggaatatc actgggacta attttgctaa aaatagtaac acagtttgac 420
aacacccaag tgggaacctt agctctttcc ttgactttca taagatcaac aatgccattg 480
gtcatggctt ggaggaccat tatggctgtg ttgtttgtgg tcacactcat tcctttgtgc 540
aggacaagct gtcttcaaaa acagtctcat tgggtagaaa taacagcact catcctagga 600
gcccaagctc tgccagtgta cctaatgact cttatgaaag gagcctcaag aaga 654
<210> 385
<211> 654
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding DENV 4 NS2A
<400> 385
ggccagggaa caagcgagac attttccatg ggcctgctgt gtctgaccct gttcgtggaa 60
gagtgcctgc ggagaagagt gacccggaag cacatgatcc tggtggtggt catcaccctg 120
tgcgccatca ttctcggcgg cctgacatgg atggatctgc tgagagccct gatcatgctg 180
ggcgatacca tgagcggcag aatcggcgga cagatccacc tggccatcat ggccgtgttc 240
aagatgagcc ctggctacgt gctgggcgtg ttcctgagaa agctgaccag cagagaaaca 300
gccctgatgg tcatcggaat ggccatgacc accgtgctga gcatccctca cgacctgatg 360
gaactgatcg acggcatcag cctgggcctg atcctgctga agatcgtgac ccagttcgac 420
aacacccaag tgggcacact ggccctgagc ctgaccttca tcagatccac aatgcccctc 480
gtgatggcct ggcggacaat tatggccgtg ctgttcgtcg tgacactgat ccctctgtgc 540
agaaccagct gcctgcagaa acagagccac tgggtcgaga tcaccgctct gattctggga 600
gcacaggccc tgcctgtgta cctgatgaca cttatgaagg gcgccagcag acgg 654
<210> 386
<211> 654
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding DENV 4 NS2A protein
<400> 386
ggccagggaa caagcgagac auuuuccaug ggccugcugu gucugacccu guucguggaa 60
gagugccugc ggagaagagu gacccggaag cacaugaucc uggugguggu caucacccug 120
ugcgccauca uucucggcgg ccugacaugg auggaucugc ugagagcccu gaucaugcug 180
ggcgauacca ugagcggcag aaucggcgga cagauccacc uggccaucau ggccguguuc 240
aagaugagcc cuggcuacgu gcugggcgug uuccugagaa agcugaccag cagagaaaca 300
gcccugaugg ucaucggaau ggccaugacc accgugcuga gcaucccuca cgaccugaug 360
gaacugaucg acggcaucag ccugggccug auccugcuga agaucgugac ccaguucgac 420
aacacccaag ugggcacacu ggcccugagc cugaccuuca ucagauccac aaugccccuc 480
gugauggccu ggcggacaau uauggccgug cuguucgucg ugacacugau cccucugugc 540
agaaccagcu gccugcagaa acagagccac ugggucgaga ucaccgcucu gauucuggga 600
gcacaggccc ugccugugua ccugaugaca cuuaugaagg gcgccagcag acgg 654
<210> 387
<211> 130
<212> PRT
<213> Dengue virus type 1
<400> 387
Ser Trp Pro Leu Asn Glu Gly Ile Met Ala Val Gly Ile Val Ser Ile
1 5 10 15
Leu Leu Ser Ser Leu Leu Lys Asn Asp Val Pro Leu Ala Gly Pro Leu
20 25 30
Ile Ala Gly Gly Met Leu Ile Ala Cys Tyr Val Ile Ser Gly Ser Ser
35 40 45
Ala Asp Leu Ser Leu Glu Lys Ala Ala Glu Val Ser Trp Glu Glu Glu
50 55 60
Ala Glu His Ser Gly Ala Ser His Asn Ile Leu Val Glu Val Gln Asp
65 70 75 80
Asp Gly Thr Met Lys Ile Lys Asp Glu Glu Arg Asp Asp Thr Leu Thr
85 90 95
Ile Leu Leu Lys Ala Thr Leu Leu Ala Ile Ser Gly Val Tyr Pro Met
100 105 110
Ser Ile Pro Ala Thr Leu Phe Val Trp Tyr Phe Trp Gln Lys Lys Lys
115 120 125
Gln Arg
130
<210> 388
<211> 390
<212> DNA
<213> Dengue virus type 1
<400> 388
agctggcctc tcaatgaagg aattatggct gttggaatag ttagcattct tctaagttca 60
cttctcaaga atgatgtgcc actagctggc ccactaatag ctggaggcat gctaatagca 120
tgttatgtca tatctggaag ctcggccgat ttatcactgg agaaagcggc tgaggtctcc 180
tgggaagaag aagcagaaca ctctggtgcc tcacacaaca tactagtgga ggtccaagat 240
gatggaacca tgaagataaa ggatgaagag agagatgaca cactcaccat tctcctcaaa 300
gcaactctgc tagcaatctc aggggtatac ccaatgtcaa taccggcgac cctctttgtg 360
tggtattttt ggcagaaaaa gaaacagaga 390
<210> 389
<211> 390
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding DENV 1 NS2B protein
<400> 389
agctggcctc tgaacgaggg aattatggcc gtgggcatcg tgtccatcct gctgtctagc 60
ctgctgaaga acgacgtgcc actggccgga cctcttattg ctggcggaat gctgatcgcc 120
tgctacgtga tcagcggcag ctctgccgat ctgagcctgg aaaaagccgc cgaggtgtcc 180
tgggaagaag aggccgaaca ttctggcgcc tctcacaaca tcctggtgga agtgcaggac 240
gacggcacca tgaagatcaa ggacgaggaa cgggacgaca ccctgaccat tctgctgaag 300
gctaccctgc tggccatcag cggagtgtac cctatgagca tccccgccac tctgttcgtg 360
tggtacttct ggcagaagaa gaagcagcgg 390
<210> 390
<211> 390
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding DENV 1 NS2B protein
<400> 390
agcuggccuc ugaacgaggg aauuauggcc gugggcaucg uguccauccu gcugucuagc 60
cugcugaaga acgacgugcc acuggccgga ccucuuauug cuggcggaau gcugaucgcc 120
ugcuacguga ucagcggcag cucugccgau cugagccugg aaaaagccgc cgaggugucc 180
ugggaagaag aggccgaaca uucuggcgcc ucucacaaca uccuggugga agugcaggac 240
gacggcacca ugaagaucaa ggacgaggaa cgggacgaca cccugaccau ucugcugaag 300
gcuacccugc uggccaucag cggaguguac ccuaugagca uccccgccac ucuguucgug 360
ugguacuucu ggcagaagaa gaagcagcgg 390
<210> 391
<211> 130
<212> PRT
<213> Dengue virus type 2
<400> 391
Ser Trp Pro Leu Asn Glu Ala Ile Met Ala Val Gly Met Val Ser Ile
1 5 10 15
Leu Ala Ser Ser Leu Leu Lys Asn Asp Ile Pro Met Thr Gly Pro Leu
20 25 30
Val Ala Gly Gly Pro Leu Thr Val Cys Tyr Val Leu Thr Gly Arg Ser
35 40 45
Ala Asp Leu Glu Leu Glu Arg Ala Ala Asp Val Lys Trp Glu Asp Gln
50 55 60
Ala Glu Ile Ser Gly Ser Ser Pro Ile Leu Ser Ile Thr Ile Ser Glu
65 70 75 80
Asp Gly Ser Met Ser Ile Lys Asn Glu Glu Glu Glu Gln Thr Leu Thr
85 90 95
Ile Leu Ile Arg Thr Gly Leu Leu Val Ile Ser Gly Leu Phe Pro Val
100 105 110
Ser Ile Pro Ile Thr Ala Ala Ala Trp Tyr Leu Trp Glu Val Lys Lys
115 120 125
Gln Arg
130
<210> 392
<211> 390
<212> DNA
<213> Dengue virus type 2
<400> 392
agctggccat taaatgaggc tatcatggca gtcgggatgg tgagcatttt agccagttct 60
ctcctaaaaa atgatattcc catgacagga ccattagtgg ctggagggcc cctcactgtg 120
tgctacgtgc tcactggacg atcggccgat ttggaactgg agagagcagc cgatgtcaaa 180
tgggaagacc aggcagagat atcaggaagc agcccaatcc tgtcaataac aatatcagaa 240
gatggtagca tgtcgataaa aaatgaagag gaagaacaaa cactgaccat actcattaga 300
acaggattgc tggtgatctc aggacttttt cctgtatcaa taccaatcac ggcagcagca 360
tggtacctgt gggaagtgaa gaaacaacgg 390
<210> 393
<211> 390
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding DENV 2 NS2B protein
<400> 393
agctggcctc tgaacgaggc cattatggcc gtcggcatgg tgtctatcct ggccagcagc 60
ctgctgaaga acgacatccc tatgacaggc cctctggtgg ctggtggacc tctgacagtg 120
tgttacgtgc tgacaggcag aagcgccgac ctggaacttg aaagggccgc tgatgtgaag 180
tgggaagatc aggccgagat cagcggcagc agccctatcc tgagcatcac catcagcgag 240
gacggcagca tgagcatcaa gaacgaggaa gaggaacaga ccctgaccat cctgatcaga 300
accggcctgc tggtcatcag cggactgttc cctgtgtcaa tccccatcac agccgccgct 360
tggtatctgt gggaagtgaa gaagcagcgg 390
<210> 394
<211> 390
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding DENV 2 NS2B protein
<400> 394
agcuggccuc ugaacgaggc cauuauggcc gucggcaugg ugucuauccu ggccagcagc 60
cugcugaaga acgacauccc uaugacaggc ccucuggugg cugguggacc ucugacagug 120
uguuacgugc ugacaggcag aagcgccgac cuggaacuug aaagggccgc ugaugugaag 180
ugggaagauc aggccgagau cagcggcagc agcccuaucc ugagcaucac caucagcgag 240
gacggcagca ugagcaucaa gaacgaggaa gaggaacaga cccugaccau ccugaucaga 300
accggccugc uggucaucag cggacuguuc ccugugucaa uccccaucac agccgccgcu 360
ugguaucugu gggaagugaa gaagcagcgg 390
<210> 395
<211> 130
<212> PRT
<213> Dengue virus type 4
<400> 395
Ser Trp Pro Leu Asn Glu Gly Ile Met Ala Val Gly Leu Val Ser Leu
1 5 10 15
Leu Gly Ser Ala Leu Leu Lys Asn Asp Val Pro Leu Ala Gly Pro Met
20 25 30
Val Ala Gly Gly Leu Leu Leu Ala Ala Tyr Val Met Ser Gly Ser Ser
35 40 45
Ala Asp Leu Ser Leu Glu Lys Ala Ala Asn Val Gln Trp Asp Glu Met
50 55 60
Ala Asp Ile Thr Gly Ser Ser Pro Ile Ile Glu Val Lys Gln Asp Glu
65 70 75 80
Asp Gly Ser Phe Ser Ile Arg Asp Val Glu Glu Thr Asn Met Ile Thr
85 90 95
Leu Leu Val Lys Leu Ala Leu Ile Thr Val Ser Gly Leu Tyr Pro Leu
100 105 110
Ala Ile Pro Val Thr Met Thr Leu Trp Tyr Met Trp Gln Val Lys Thr
115 120 125
Gln Arg
130
<210> 396
<211> 390
<212> DNA
<213> Dengue virus type 4
<400> 396
tcttggcctc ttaacgaggg cataatggct gtgggtttgg ttagtctctt aggaagcgct 60
cttttaaaga atgatgtccc tttagctggc ccaatggtgg caggaggctt acttctggcg 120
gcttacgtga tgagtggtag ctcagcagat ctgtcactag agaaggccgc caacgtgcag 180
tgggatgaaa tggcagacat aacaggctca agcccaatca tagaagtgaa gcaggatgaa 240
gatggctctt tctccatacg ggacgtcgag gaaaccaata tgataaccct tttggtgaaa 300
ctggcactga taacagtgtc aggtctctac cccttggcaa ttccagtcac aatgacctta 360
tggtacatgt ggcaagtgaa aacacaaaga 390
<210> 397
<211> 390
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding DENV 4 NS2B protein
<400> 397
agctggcctc tgaacgaggg aatcatggcc gttggcctgg tgtctctgct gggatctgcc 60
ctgctgaaga acgatgtgcc tctggccgga cctatggttg ctggtggact gctgctggcc 120
gcctatgtga tgtctggaag cagcgccgat ctgagcctgg aaaaggccgc taacgtgcag 180
tgggacgaga tggccgatat cacaggcagc agccccatca tcgaagtgaa gcaggatgag 240
gacggcagct tcagcatccg cgacgtggaa gagacaaaca tgatcaccct gctggtcaag 300
ctggccctga tcaccgtgtc tggcctgtat cctctggcta tccccgtgac catgacactg 360
tggtacatgt ggcaagtgaa aacccagcgg 390
<210> 398
<211> 390
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding DENV 4 NS2B protein
<400> 398
agcuggccuc ugaacgaggg aaucauggcc guuggccugg ugucucugcu gggaucugcc 60
cugcugaaga acgaugugcc ucuggccgga ccuaugguug cugguggacu gcugcuggcc 120
gccuauguga ugucuggaag cagcgccgau cugagccugg aaaaggccgc uaacgugcag 180
ugggacgaga uggccgauau cacaggcagc agccccauca ucgaagugaa gcaggaugag 240
gacggcagcu ucagcauccg cgacguggaa gagacaaaca ugaucacccu gcuggucaag 300
cuggcccuga ucaccguguc uggccuguau ccucuggcua uccccgugac caugacacug 360
ugguacaugu ggcaagugaa aacccagcgg 390
<210> 399
<211> 126
<212> PRT
<213> West Nile virus
<400> 399
Ser Gln Ile Gly Leu Val Glu Val Leu Gly Arg Met Pro Glu His Phe
1 5 10 15
Met Val Lys Thr Trp Glu Ala Leu Asp Thr Met Tyr Val Val Ala Thr
20 25 30
Ala Glu Lys Gly Gly Arg Ala His Arg Met Ala Leu Glu Glu Leu Pro
35 40 45
Asp Ala Leu Gln Thr Ile Val Leu Ile Ala Leu Leu Ser Val Met Ser
50 55 60
Leu Gly Val Phe Phe Leu Leu Met Gln Arg Lys Gly Ile Gly Lys Ile
65 70 75 80
Gly Leu Gly Gly Val Ile Leu Gly Ala Ala Thr Phe Phe Cys Trp Met
85 90 95
Ala Glu Val Pro Gly Thr Lys Ile Ala Gly Met Leu Leu Leu Ser Leu
100 105 110
Leu Leu Met Ile Val Leu Ile Pro Glu Pro Glu Lys Gln Arg
115 120 125
<210> 400
<211> 378
<212> DNA
<213> West Nile virus
<400> 400
tcacaaatcg ggctcgttga ggtgctcggg agaatgcctg aacacttcat ggtgaaaact 60
tgggaggcat tggacacgat gtatgtggtg gcgaccgctg aaaaaggagg ccgagctcac 120
aggatggctc ttgaggagct accggacgcc cttcagacaa tagttttgat tgcactattg 180
agtgtgatgt ccttaggtgt gttttttcta ctcatgcaaa ggaagggcat tggtaagatt 240
ggcttgggag gagtaatctt aggagctgcc acattcttct gctggatggc tgaagtccca 300
ggaacgaaaa tagcaggcat gctcctgctt tccctgctgc tcatgattgt tttgattccg 360
gagccggaaa agcagcgc 378
<210> 401
<211> 378
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding WNV NS4A protein
<400> 401
tctcagatcg gcctggtgga agtgctgggc agaatgcctg agcacttcat ggtcaagacc 60
tgggaagccc tggacactat gtacgtggtg gccacagccg agaaaggcgg cagagcacat 120
agaatggccc tggaagaact gcccgacgct ctgcagacaa tcgtgctgat tgccctgctg 180
agcgtgatga gcctgggcgt gttcttcctg ctgatgcaga gaaaaggcat cggcaagatc 240
ggactcggcg gcgttatact gggagccgcc accttctttt gctggatggc tgaagtgccc 300
ggcaccaaga ttgccggaat gctgctgctg tccctgctgc tgatgattgt gctgatcccc 360
gagcctgaga agcagaga 378
<210> 402
<211> 378
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding WNV NS4A protein
<400> 402
ucucagaucg gccuggugga agugcugggc agaaugccug agcacuucau ggucaagacc 60
ugggaagccc uggacacuau guacguggug gccacagccg agaaaggcgg cagagcacau 120
agaauggccc uggaagaacu gcccgacgcu cugcagacaa ucgugcugau ugcccugcug 180
agcgugauga gccugggcgu guucuuccug cugaugcaga gaaaaggcau cggcaagauc 240
ggacucggcg gcguuauacu gggagccgcc accuucuuuu gcuggauggc ugaagugccc 300
ggcaccaaga uugccggaau gcugcugcug ucccugcugc ugaugauugu gcugaucccc 360
gagccugaga agcagaga 378
<210> 403
<211> 256
<212> PRT
<213> West Nile virus
<400> 403
Asn Glu Met Gly Trp Leu Asp Lys Thr Lys Asn Asp Ile Gly Ser Leu
1 5 10 15
Leu Gly His Arg Pro Glu Ala Arg Glu Thr Thr Leu Gly Val Glu Ser
20 25 30
Phe Leu Leu Asp Leu Arg Pro Ala Thr Ala Trp Ser Leu Tyr Ala Val
35 40 45
Thr Thr Ala Val Leu Thr Pro Leu Leu Lys His Leu Ile Thr Ser Asp
50 55 60
Tyr Ile Asn Thr Ser Leu Thr Ser Ile Asn Val Gln Ala Ser Ala Leu
65 70 75 80
Phe Thr Leu Ala Arg Gly Phe Pro Phe Val Asp Val Gly Val Ser Ala
85 90 95
Leu Leu Leu Ala Val Gly Cys Trp Gly Gln Val Thr Leu Thr Val Thr
100 105 110
Val Thr Ala Ala Ala Leu Leu Phe Cys His Tyr Ala Tyr Met Val Pro
115 120 125
Gly Trp Gln Ala Glu Ala Met Arg Ser Ala Gln Arg Arg Thr Ala Ala
130 135 140
Gly Ile Met Lys Asn Val Val Val Asp Gly Ile Val Ala Thr Asp Val
145 150 155 160
Pro Glu Leu Glu Arg Thr Thr Pro Val Met Gln Lys Lys Val Gly Gln
165 170 175
Ile Ile Leu Ile Leu Val Ser Met Ala Ala Val Val Val Asn Pro Ser
180 185 190
Val Arg Thr Val Arg Glu Ala Gly Ile Leu Thr Thr Ala Ala Ala Val
195 200 205
Thr Leu Trp Glu Asn Gly Ala Ser Ser Val Trp Asn Ala Thr Thr Ala
210 215 220
Ile Gly Leu Cys His Ile Met Arg Gly Gly Trp Leu Ser Cys Leu Ser
225 230 235 240
Ile Met Trp Thr Leu Ile Lys Asn Met Glu Lys Pro Gly Leu Lys Arg
245 250 255
<210> 404
<211> 768
<212> DNA
<213> West Nile virus
<400> 404
aatgaaatgg gctggctgga caagaccaag aatgacattg gcagcctgtt ggggcacagg 60
ccagaagcta gagagacgac cctgggagtt gagagcttct tacttgatct gcggccggcc 120
acggcatggt cgctctatgc cgtaacgaca gccgttctca cccctttgct gaagcatcta 180
atcacgtcag actacatcaa cacttcgttg acctcaataa acgtccaagc cagcgcgttg 240
ttcactttgg ccagaggctt cccttttgtg gacgttggtg tgtcagctct cttgctggcg 300
gtcgggtgct ggggtcaggt gactctgact gtgactgtga ctgcagctgc tctgctcttt 360
tgccactatg cttacatggt gccaggctgg caagcggaag ccatgcgatc tgcccagcgg 420
cggacagctg ctggcatcat gaaaaatgta gtggtggatg ggatcgtggc cactgatgta 480
cctgaacttg aacgaacaac tccagtcatg cagaaaaaag ttggacagat catattgatc 540
ttggtatcaa tggccgcggt ggtcgtcaat ccatcagtga gaaccgtcag agaggccgga 600
attctgacta cagcagcagc agtcacccta tgggagaatg gtgctagttc agtgtggaat 660
gcaacgacag ctattggcct ttgtcacatc atgcgaggag gatggctctc gtgtctctcc 720
atcatgtgga ctctcatcaa aaacatggag aaaccaggcc tcaagagg 768
<210> 405
<211> 768
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding WNV NS4B protein
<400> 405
aacgagatgg gctggctgga caagaccaag aacgacatcg gaagcctgct gggccacaga 60
cctgaggcca gagaaacaac cctgggcgtc gagagcttcc tgctggatct tagacctgcc 120
accgcttgga gcctgtacgc cgttacaaca gccgtgctga cccctctgct gaagcacctg 180
atcaccagcg actacatcaa caccagcctg accagcatca acgtgcaggc cagcgctctg 240
tttaccctgg ccagaggctt cccctttgtg gacgtgggag tttctgctct gctgctggcc 300
gttggctgtt ggggacaagt gaccctgacc gtgacagtga ctgctgccgc tctgctgttc 360
tgccactacg cctatatggt gcctggatgg caggccgagg ccatgagatc tgcccagaga 420
agaacagccg ccggaatcat gaagaacgtg gtggtggatg gcatcgtggc caccgacgtt 480
ccagagctgg aaagaaccac acctgtgatg cagaagaaag tcggccagat catcctgatc 540
ctggtgtcca tggccgccgt ggtggtcaat cctagcgtgc ggacagttag agaggccggc 600
atcctgacaa cagctgccgc tgttaccctg tgggagaatg gcgctagcag cgtgtggaat 660
gccaccacag ccatcggcct gtgccacatc atgagaggcg gctggctgag ctgcctgagc 720
atcatgtgga ccctgatcaa gaacatggaa aagcccggcc tgaagcgg 768
<210> 406
<211> 768
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding WNV NS4B protein
<400> 406
aacgagaugg gcuggcugga caagaccaag aacgacaucg gaagccugcu gggccacaga 60
ccugaggcca gagaaacaac ccugggcguc gagagcuucc ugcuggaucu uagaccugcc 120
accgcuugga gccuguacgc cguuacaaca gccgugcuga ccccucugcu gaagcaccug 180
aucaccagcg acuacaucaa caccagccug accagcauca acgugcaggc cagcgcucug 240
uuuacccugg ccagaggcuu ccccuuugug gacgugggag uuucugcucu gcugcuggcc 300
guuggcuguu ggggacaagu gacccugacc gugacaguga cugcugccgc ucugcuguuc 360
ugccacuacg ccuauauggu gccuggaugg caggccgagg ccaugagauc ugcccagaga 420
agaacagccg ccggaaucau gaagaacgug gugguggaug gcaucguggc caccgacguu 480
ccagagcugg aaagaaccac accugugaug cagaagaaag ucggccagau cauccugauc 540
cuggugucca uggccgccgu gguggucaau ccuagcgugc ggacaguuag agaggccggc 600
auccugacaa cagcugccgc uguuacccug ugggagaaug gcgcuagcag cguguggaau 660
gccaccacag ccaucggccu gugccacauc augagaggcg gcuggcugag cugccugagc 720
aucaugugga cccugaucaa gaacauggaa aagcccggcc ugaagcgg 768
<210> 407
<211> 297
<212> PRT
<213> Rabies virus
<400> 407
Met Ser Lys Ile Phe Val Asn Pro Ser Ala Ile Arg Ala Gly Leu Ala
1 5 10 15
Asp Leu Glu Met Ala Glu Glu Thr Val Asp Leu Ile Asn Arg Asn Ile
20 25 30
Glu Asp Asn Gln Ala His Leu Gln Gly Glu Pro Ile Glu Val Asp Asn
35 40 45
Leu Pro Glu Asp Met Gly Arg Leu His Leu Asp Asp Gly Lys Ser Pro
50 55 60
Asn Pro Gly Glu Met Ala Lys Val Gly Glu Gly Lys Tyr Arg Glu Asp
65 70 75 80
Phe Gln Met Asp Glu Gly Glu Asp Pro Ser Phe Leu Phe Gln Ser Tyr
85 90 95
Leu Glu Asn Val Gly Val Gln Ile Val Arg Gln Met Arg Ser Gly Glu
100 105 110
Arg Phe Leu Lys Ile Trp Ser Gln Thr Val Glu Glu Ile Ile Ser Tyr
115 120 125
Val Ala Val Asn Phe Pro Asn Pro Pro Gly Lys Ser Ser Glu Asp Lys
130 135 140
Ser Thr Gln Thr Thr Gly Arg Glu Leu Lys Lys Glu Thr Thr Pro Thr
145 150 155 160
Pro Ser Gln Arg Glu Ser Gln Ser Ser Lys Ala Arg Met Ala Ala Gln
165 170 175
Thr Ala Ser Gly Pro Pro Ala Leu Glu Trp Ser Ala Thr Asn Glu Lys
180 185 190
Asp Asp Leu Ser Val Glu Ala Glu Ile Ala His Gln Ile Ala Glu Ser
195 200 205
Phe Ser Lys Lys Tyr Lys Phe Pro Ser Arg Ser Ser Gly Ile Leu Leu
210 215 220
Tyr Asn Phe Glu Gln Leu Lys Met Asn Leu Asp Asp Ile Val Lys Glu
225 230 235 240
Ala Lys Asn Val Pro Gly Val Thr Arg Leu Ala His Asp Gly Ser Lys
245 250 255
Leu Pro Leu Arg Cys Val Leu Gly Trp Val Ala Leu Ala Asn Ser Lys
260 265 270
Lys Phe Gln Leu Leu Val Glu Ser Asp Lys Leu Ser Lys Ile Met Gln
275 280 285
Asp Asp Leu Asn Arg Tyr Thr Ser Cys
290 295
<210> 408
<211> 891
<212> DNA
<213> Rabies virus
<400> 408
atgagcaaga tctttgtcaa tcctagtgct attagagccg gtctggccga tcttgagatg 60
gctgaagaaa ctgttgatct gatcaataga aatatcgaag acaatcaggc tcatctccaa 120
ggggaaccca tagaagtgga caatctccct gaggatatgg ggcgacttca cctggatgat 180
ggaaaatcgc ccaaccctgg tgagatggcc aaggtgggag aaggcaagta tcgagaggac 240
tttcagatgg atgaaggaga ggatcctagc ttcctgttcc agtcatacct ggaaaatgtt 300
ggagtccaaa tagtcagaca aatgaggtca ggagagagat ttctcaagat atggtcacag 360
accgtagaag agattatatc ctatgtcgcg gtcaactttc ccaaccctcc aggaaagtct 420
tcagaggata aatcaaccca gactactggc cgagagctca agaaggagac aacacccact 480
ccttctcaga gagaaagcca atcatcgaaa gccaggatgg cggctcaaac tgcttctggc 540
cctccagccc ttgaatggtc ggccaccaat gaaaaggatg atctatcagt ggaggctgag 600
atcgctcacc agattgcaga aagtttctcc aaaaaatata agtttccctc tcgatcctca 660
gggatactct tgtataattt tgagcaattg aaaatgaacc ttgatgatat agttaaagag 720
gcaaaaaatg taccaggtgt gacccgttta gcccatgacg ggtccaaact ccccctaaga 780
tgtgtactgg gatgggtcgc tttggccaac tctaagaaat tccagttgtt agtcgaatcc 840
gacaagctga gtaaaatcat gcaagatgac ttgaatcgct atacatcttg c 891
<210> 409
<211> 891
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding Rabies virus PP protein
<400> 409
atgagcaaga tcttcgtgaa ccccagcgcc atcagagccg gactggctga tctggaaatg 60
gccgaggaaa ccgtggacct gatcaaccgg aacatcgagg acaatcaggc ccatctgcag 120
ggcgagccta tcgaggttga caacctgcct gaggacatgg gcagactgca cctggatgat 180
ggcaagagcc ctaatcctgg cgagatggcc aaagtcggcg agggcaagta ccgcgaggac 240
ttccaaatgg acgagggcga agatcccagc ttcctgttcc agtcctacct ggaaaacgtg 300
ggcgtgcaga tcgtgcggca gatgagaagc ggcgagcggt tcctgaagat ctggtcccag 360
accgtggaag agatcatcag ctacgtggcc gtgaacttcc ccaatcctcc aggcaagagc 420
agcgaggaca agagcacaca gaccaccggc agagagctga agaaagagac aacccctaca 480
cctagccaga gagagagcca gagcagcaag gccagaatgg ccgctcagac agcttctgga 540
cctcctgcac ttgagtggag cgccaccaac gagaaggacg acctgtctgt ggaagccgag 600
atcgcccacc agatcgccga gagcttcagc aagaagtaca agttccccag cagaagcagc 660
ggcatcctgc tgtacaactt cgagcagctg aagatgaacc tggacgacat cgtgaaagag 720
gccaagaacg tccccggcgt gacaagactg gcccacgatg gatctaagct gcccctgaga 780
tgtgtgctcg gatgggttgc cctggccaac agcaagaaat tccagctgct ggtggaaagc 840
gacaagctgt ccaagatcat gcaggacgat ctgaaccggt acaccagctg c 891
<210> 410
<211> 891
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding Rabies virus PP protein
<400> 410
augagcaaga ucuucgugaa ccccagcgcc aucagagccg gacuggcuga ucuggaaaug 60
gccgaggaaa ccguggaccu gaucaaccgg aacaucgagg acaaucaggc ccaucugcag 120
ggcgagccua ucgagguuga caaccugccu gaggacaugg gcagacugca ccuggaugau 180
ggcaagagcc cuaauccugg cgagauggcc aaagucggcg agggcaagua ccgcgaggac 240
uuccaaaugg acgagggcga agaucccagc uuccuguucc aguccuaccu ggaaaacgug 300
ggcgugcaga ucgugcggca gaugagaagc ggcgagcggu uccugaagau cuggucccag 360
accguggaag agaucaucag cuacguggcc gugaacuucc ccaauccucc aggcaagagc 420
agcgaggaca agagcacaca gaccaccggc agagagcuga agaaagagac aaccccuaca 480
ccuagccaga gagagagcca gagcagcaag gccagaaugg ccgcucagac agcuucugga 540
ccuccugcac uugaguggag cgccaccaac gagaaggacg accugucugu ggaagccgag 600
aucgcccacc agaucgccga gagcuucagc aagaaguaca aguuccccag cagaagcagc 660
ggcauccugc uguacaacuu cgagcagcug aagaugaacc uggacgacau cgugaaagag 720
gccaagaacg uccccggcgu gacaagacug gcccacgaug gaucuaagcu gccccugaga 780
ugugugcucg gauggguugc ccuggccaac agcaagaaau uccagcugcu gguggaaagc 840
gacaagcugu ccaagaucau gcaggacgau cugaaccggu acaccagcug c 891
<210> 411
<211> 441
<212> PRT
<213> porcine epidemic diarrhea virus
<400> 411
Met Ala Ser Val Ser Phe Gln Asp Arg Gly Arg Lys Arg Val Pro Leu
1 5 10 15
Ser Leu Tyr Ala Pro Leu Arg Val Thr Asn Asp Lys Pro Leu Ser Lys
20 25 30
Val Leu Ala Asn Asn Ala Val Pro Thr Asn Lys Gly Asn Lys Asp Gln
35 40 45
Gln Ile Gly Tyr Trp Asn Glu Gln Ile Arg Trp Arg Met Arg Arg Gly
50 55 60
Glu Arg Ile Glu Gln Pro Ser Asn Trp His Phe Tyr Tyr Leu Gly Thr
65 70 75 80
Gly Pro His Gly Asp Leu Arg Tyr Arg Thr Arg Thr Glu Gly Val Phe
85 90 95
Trp Val Ala Lys Glu Gly Ala Lys Thr Glu Pro Thr Asn Leu Gly Val
100 105 110
Arg Lys Ala Ser Glu Lys Pro Ile Ile Pro Lys Phe Ser Gln Gln Leu
115 120 125
Pro Ser Val Val Glu Ile Val Glu Pro Asn Thr Pro Pro Ala Ser Arg
130 135 140
Ala Asn Ser Arg Ser Arg Ser Arg Gly Asn Gly Asn Asn Arg Ser Arg
145 150 155 160
Ser Pro Ser Asn Asn Arg Gly Asn Asn Gln Ser Arg Gly Asn Ser Gln
165 170 175
Asn Arg Gly Asn Asn Gln Gly Arg Gly Ala Ser Gln Asn Arg Gly Gly
180 185 190
Asn Asn Asn Asn Asn Asn Lys Ser Arg Asn Gln Ser Asn Asn Arg Asn
195 200 205
Gln Ser Asn Asp Arg Gly Gly Val Thr Ser Arg Asp Asp Leu Val Ala
210 215 220
Ala Val Lys Asp Ala Leu Lys Ser Leu Gly Ile Gly Glu Asn Pro Asp
225 230 235 240
Arg His Lys Gln Gln Gln Lys Pro Lys Gln Glu Lys Ser Asp Asn Ser
245 250 255
Gly Lys Asn Thr Pro Lys Lys Asn Lys Ser Arg Ala Thr Ser Lys Glu
260 265 270
Arg Asp Leu Lys Asp Ile Pro Glu Trp Arg Arg Ile Pro Lys Gly Glu
275 280 285
Asn Ser Val Ala Ala Cys Phe Gly Pro Arg Gly Gly Phe Lys Asn Phe
290 295 300
Gly Asp Ala Glu Phe Val Glu Lys Gly Val Asp Ala Ser Gly Tyr Ala
305 310 315 320
Gln Ile Ala Ser Leu Ala Pro Asn Val Ala Ala Leu Leu Phe Gly Gly
325 330 335
Asn Val Ala Val Arg Glu Leu Ala Asp Ser Tyr Glu Ile Thr Tyr Asn
340 345 350
Tyr Lys Met Thr Val Pro Lys Ser Asp Pro Asn Val Glu Leu Leu Val
355 360 365
Ser Gln Val Asp Ala Phe Lys Thr Gly Asn Ala Lys Leu Gln Arg Lys
370 375 380
Lys Glu Lys Lys Asn Lys Arg Glu Thr Thr Leu Gln Gln His Glu Glu
385 390 395 400
Ala Ile Tyr Asp Asp Val Gly Ala Pro Ser Asp Val Thr His Ala Asn
405 410 415
Leu Glu Trp Asp Thr Ala Val Asp Gly Gly Asp Thr Ala Val Glu Ile
420 425 430
Ile Asn Glu Ile Phe Asp Thr Gly Asn
435 440
<210> 412
<211> 1323
<212> DNA
<213> porcine epidemic diarrhea virus
<400> 412
atggcttctg tcagctttca ggatcgtggc cgcaaacggg tgccattatc tctctatgcc 60
cctcttaggg ttactaatga caagcccctt tctaaggtac ttgcaaacaa cgctgtaccc 120
actaacaagg ggaataagga ccagcaaatt gggtactgga atgagcaaat tcgctggcgc 180
atgcgccgtg gtgagcgaat tgaacaacct tccaattggc atttctacta cctcggaaca 240
ggacctcacg gcgacctccg ttataggact cgtactgagg gtgttttctg ggttgctaaa 300
gaaggcgcaa agactgaacc cactaatttg ggtgtcagaa aggcgtctga aaagccaatc 360
attccaaaat tctctcaaca gctccccagt gtagttgaga ttgttgaacc taacacacct 420
cctgcttcac gtgcaaattc gcgtagcagg agtcgtggca atggcaacaa taggtctaga 480
tctccaagta acaacagagg caataaccag tcccgtggta attcacagaa tcgtggaaat 540
aaccagggtc gtggagcttc tcagaacaga ggaggcaata ataataacaa taacaagtct 600
cgtaaccagt ccaataacag gaaccagtca aatgaccgtg gtggtgtaac atcacgcgat 660
gatctggtgg ctgctgtcaa ggatgcactt aaatctttgg gtattggaga aaatcctgac 720
aggcataagc aacagcagaa gcctaagcag gaaaagtctg acaacagcgg caaaaataca 780
cctaagaaga acaaatccag ggccacttcg aaggaacgtg acctcaaaga catcccagag 840
tggaggagaa ttcccaaggg cgaaaatagc gtagcagctt gcttcggacc cagagggggc 900
ttcaaaaact ttggagatgc ggaatttgtc gaaaaaggtg ttgatgcgtc aggctatgct 960
cagatcgcca gtttagcacc aaatgttgca gcattgctct ttggtggtaa tgtggctgtt 1020
cgtgagctag cggactctta cgagattaca tacaactata aaatgactgt gccaaagtca 1080
gatccaaatg ttgagcttct tgtttcacag gtggatgcat ttaaaactgg gaatgcaaaa 1140
ctccagagaa agaaggaaaa gaagaacaag cgtgaaacca cgctgcagca gcatgaagag 1200
gccatctacg atgatgtggg tgcgccatct gatgtgaccc atgccaatct ggaatgggac 1260
acagctgttg atggtggtga tacggccgtt gaaattatca acgagatctt cgatacagga 1320
aat 1323
<210> 413
<211> 1323
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding PEDV N protein
<400> 413
atggccagcg tcagctttca ggaccggggc agaaaaagag tgcccctgtc tctgtacgcc 60
cctctgagag tgaccaacga caagcccctg agcaaggtgc tggccaacaa tgccgtgcct 120
accaacaagg gcaacaagga ccagcagatc ggctactgga acgagcagat ccggtggcgg 180
atgagaagag gcgagagaat cgagcagccc agcaactggc acttctacta cctcggcaca 240
ggccctcacg gcgacctgag atacagaacc agaaccgagg gcgtgttctg ggtcgccaaa 300
gagggcgcca agaccgagcc tacaaatctc ggcgtcagaa aggccagcga gaagcctatc 360
atccccaagt tcagccagca gctgcccagc gtggtggaaa tcgtggaacc caatactcct 420
cctgccagcc gggccaacag cagaagcaga tctagaggca acggcaacaa tcggagcaga 480
agccccagca acaaccgggg caacaaccag tccagaggca acagccagaa ccgcggaaac 540
aatcaaggca gaggcgctag ccagaacaga ggcggcaaca acaacaataa caacaagagc 600
cggaaccagt ctaacaaccg caaccagagc aacgatagag gcggcgtgac cagcagggat 660
gatctggtgg ctgccgtgaa ggatgccctg aagtctctcg gcatcggcga gaaccccgac 720
agacacaagc agcagcagaa acccaagcaa gagaagtccg acaacagcgg caagaacacc 780
cctaagaaga acaagagcag ggccaccagc aaagagcggg acctgaagga tattcccgag 840
tggcggagaa tccccaaggg cgagaattct gtggccgcct gctttggacc aagaggcggc 900
ttcaagaatt tcggcgacgc cgagttcgtg gaaaaaggcg tggacgcctc tggctatgcc 960
cagattgcat ctctggcccc taatgtggct gccctgctgt ttggcggaaa cgtggccgtt 1020
agagagctgg ccgatagcta cgagatcacc tacaactaca agatgaccgt gcctaagagc 1080
gaccccaacg tggaactgct ggtgtctcag gtggacgcat tcaagaccgg caacgccaag 1140
ctgcagcgca agaaagagaa gaaaaacaag cgcgagacaa ccctgcagca gcacgaggaa 1200
gctatctacg acgacgtggg agccccttcc gatgtgacac acgccaacct ggaatgggac 1260
acagcagtgg atggcggcga taccgccgtg gaaatcatca acgagatctt cgacaccggc 1320
aac 1323
<210> 414
<211> 1323
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding PEDV N protein
<400> 414
auggccagcg ucagcuuuca ggaccggggc agaaaaagag ugccccuguc ucuguacgcc 60
ccucugagag ugaccaacga caagccccug agcaaggugc uggccaacaa ugccgugccu 120
accaacaagg gcaacaagga ccagcagauc ggcuacugga acgagcagau ccgguggcgg 180
augagaagag gcgagagaau cgagcagccc agcaacuggc acuucuacua ccucggcaca 240
ggcccucacg gcgaccugag auacagaacc agaaccgagg gcguguucug ggucgccaaa 300
gagggcgcca agaccgagcc uacaaaucuc ggcgucagaa aggccagcga gaagccuauc 360
auccccaagu ucagccagca gcugcccagc gugguggaaa ucguggaacc caauacuccu 420
ccugccagcc gggccaacag cagaagcaga ucuagaggca acggcaacaa ucggagcaga 480
agccccagca acaaccgggg caacaaccag uccagaggca acagccagaa ccgcggaaac 540
aaucaaggca gaggcgcuag ccagaacaga ggcggcaaca acaacaauaa caacaagagc 600
cggaaccagu cuaacaaccg caaccagagc aacgauagag gcggcgugac cagcagggau 660
gaucuggugg cugccgugaa ggaugcccug aagucucucg gcaucggcga gaaccccgac 720
agacacaagc agcagcagaa acccaagcaa gagaaguccg acaacagcgg caagaacacc 780
ccuaagaaga acaagagcag ggccaccagc aaagagcggg accugaagga uauucccgag 840
uggcggagaa uccccaaggg cgagaauucu guggccgccu gcuuuggacc aagaggcggc 900
uucaagaauu ucggcgacgc cgaguucgug gaaaaaggcg uggacgccuc uggcuaugcc 960
cagauugcau cucuggcccc uaauguggcu gcccugcugu uuggcggaaa cguggccguu 1020
agagagcugg ccgauagcua cgagaucacc uacaacuaca agaugaccgu gccuaagagc 1080
gaccccaacg uggaacugcu ggugucucag guggacgcau ucaagaccgg caacgccaag 1140
cugcagcgca agaaagagaa gaaaaacaag cgcgagacaa cccugcagca gcacgaggaa 1200
gcuaucuacg acgacguggg agccccuucc gaugugacac acgccaaccu ggaaugggac 1260
acagcagugg auggcggcga uaccgccgug gaaaucauca acgagaucuu cgacaccggc 1320
aac 1323
<210> 415
<211> 512
<212> PRT
<213> human herpesvirus 1
<400> 415
Met Ala Thr Asp Ile Asp Met Leu Ile Asp Leu Gly Leu Asp Leu Ser
1 5 10 15
Asp Ser Asp Leu Asp Glu Asp Pro Pro Glu Pro Ala Glu Ser Arg Arg
20 25 30
Asp Asp Leu Glu Ser Asp Ser Ser Gly Glu Cys Ser Ser Ser Asp Glu
35 40 45
Asp Met Glu Asp Pro His Gly Glu Asp Gly Pro Glu Pro Ile Leu Asp
50 55 60
Ala Ala Arg Pro Ala Val Arg Pro Ser Arg Pro Glu Asp Pro Gly Val
65 70 75 80
Pro Ser Thr Gln Thr Pro Arg Pro Thr Glu Arg Gln Gly Pro Asn Asp
85 90 95
Pro Gln Pro Ala Pro His Ser Val Trp Ser Arg Leu Gly Ala Arg Arg
100 105 110
Pro Ser Cys Ser Pro Glu Gln His Gly Gly Lys Val Ala Arg Leu Gln
115 120 125
Pro Pro Pro Thr Lys Ala Gln Pro Ala Arg Gly Gly Arg Arg Gly Arg
130 135 140
Arg Arg Gly Arg Gly Arg Gly Gly Pro Gly Ala Ala Asp Gly Leu Ser
145 150 155 160
Asp Pro Arg Arg Arg Ala Pro Arg Thr Asn Arg Asn Pro Gly Gly Pro
165 170 175
Arg Pro Gly Ala Gly Trp Thr Asp Gly Pro Gly Ala Pro His Gly Glu
180 185 190
Ala Trp Arg Gly Ser Glu Gln Pro Asp Pro Pro Gly Gly Gln Arg Thr
195 200 205
Arg Gly Val Arg Gln Ala Pro Pro Pro Leu Met Thr Leu Ala Ile Ala
210 215 220
Pro Pro Pro Ala Asp Pro Arg Ala Pro Ala Pro Glu Arg Lys Ala Pro
225 230 235 240
Ala Ala Asp Thr Ile Asp Ala Thr Thr Arg Leu Val Leu Arg Ser Ile
245 250 255
Ser Glu Arg Ala Ala Val Asp Arg Ile Ser Glu Ser Phe Gly Arg Ser
260 265 270
Ala Gln Val Met His Asp Pro Phe Gly Gly Gln Pro Phe Pro Ala Ala
275 280 285
Asn Ser Pro Trp Ala Pro Val Leu Ala Gly Gln Gly Gly Pro Phe Asp
290 295 300
Ala Glu Thr Arg Arg Val Ser Trp Glu Thr Leu Val Ala His Gly Pro
305 310 315 320
Ser Leu Tyr Arg Thr Phe Ala Gly Asn Pro Arg Ala Ala Ser Thr Ala
325 330 335
Lys Ala Met Arg Asp Cys Val Leu Arg Gln Glu Asn Phe Ile Glu Ala
340 345 350
Leu Ala Ser Ala Asp Glu Thr Leu Ala Trp Cys Lys Met Cys Ile His
355 360 365
His Asn Leu Pro Leu Arg Pro Gln Asp Pro Ile Ile Gly Thr Thr Ala
370 375 380
Ala Val Leu Asp Asn Leu Ala Thr Arg Leu Arg Pro Phe Leu Gln Cys
385 390 395 400
Tyr Leu Lys Ala Arg Gly Leu Cys Gly Leu Asp Glu Leu Cys Ser Arg
405 410 415
Arg Arg Leu Ala Asp Ile Lys Asp Ile Ala Ser Phe Val Phe Val Ile
420 425 430
Leu Ala Arg Leu Ala Asn Arg Val Glu Arg Gly Val Ala Glu Ile Asp
435 440 445
Tyr Ala Thr Leu Gly Val Gly Val Gly Glu Lys Met His Phe Tyr Leu
450 455 460
Pro Gly Ala Cys Met Ala Gly Leu Ile Glu Ile Leu Asp Thr His Arg
465 470 475 480
Gln Glu Cys Ser Ser Arg Val Cys Glu Leu Thr Ala Ser His Ile Val
485 490 495
Ala Pro Pro Tyr Val His Gly Lys Tyr Phe Tyr Cys Asn Ser Leu Phe
500 505 510
<210> 416
<211> 1536
<212> DNA
<213> human herpesvirus 1
<400> 416
atggcgactg acattgatat gctaattgac ctcggcctgg acctctccga cagcgatctg 60
gacgaggacc cccccgagcc ggcggagagc cgccgcgacg acctggaatc ggacagcagc 120
ggggagtgtt cctcgtcgga cgaggacatg gaagaccccc acggagagga cggaccggag 180
ccgatactcg acgccgctcg cccggcggtc cgcccgtctc gtccagaaga ccccggcgta 240
cccagcaccc agacgcctcg tccgacggag cggcagggcc ccaacgatcc tcaaccagcg 300
ccccacagtg tgtggtcgcg cctcggggcc cggcgaccgt cttgctcccc cgagcagcac 360
gggggcaagg tggcccgcct ccaaccccca ccgaccaaag cccagcctgc ccgcggcgga 420
cgccgtgggc gtcgcagggg tcggggtcgc ggtggtcccg gggctgccga tggtttgtcg 480
gacccccgcc ggcgtgcccc cagaaccaat cgcaaccctg ggggaccccg ccccggggcg 540
gggtggacgg acggccccgg cgccccccat ggcgaggcgt ggcgcggcag tgagcagccc 600
gacccacccg gaggccagcg gacacggggc gtgcgccaag cacccccccc gctaatgacg 660
ctggcgattg cccccccgcc cgcggacccc cgcgccccgg ccccggagcg aaaggcgccc 720
gccgccgaca ccatcgacgc caccacgcgg ttggtcctgc gctccatctc cgagcgcgcg 780
gcggtcgacc gcatcagcga gagctttggc cgcagcgcac aggtcatgca cgaccccttt 840
ggggggcagc cgtttcccgc cgcgaatagc ccctgggccc cggtgctggc gggccaagga 900
gggccctttg acgccgagac cagacgggtc tcctgggaaa ccttggtcgc ccacggcccg 960
agcctctatc gcacttttgc cggcaatcct cgggccgcat cgaccgccaa ggccatgcgc 1020
gactgcgtgc tgcgccaaga aaatttcatc gaggcgctgg cctccgccga cgagacgctg 1080
gcgtggtgca agatgtgcat ccaccacaac ctgccgctgc gcccccagga ccccattatc 1140
gggacgaccg cggctgtgct ggataacctc gccacgcgcc tgcggccctt tctccagtgc 1200
tacctgaagg cgcgaggcct gtgcggcctg gacgaactgt gttcgcggcg gcgtctggcg 1260
gacattaagg acattgcatc cttcgtgttt gtcattctgg ccaggctcgc caaccgcgtc 1320
gagcgtggcg tcgcggagat cgactacgcg acccttggtg tcggggtcgg agagaagatg 1380
catttctacc tccccggggc ctgcatggcg ggcctgatcg aaatcctaga cacgcaccgc 1440
caggagtgtt cgagtcgtgt ctgcgagttg acggccagtc acatcgtcgc ccccccgtac 1500
gtgcacggca aatattttta ttgcaactcc ctgttt 1536
<210> 417
<211> 1536
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding HSV1 ICP27 protein
<400> 417
atggccaccg acatcgacat gctgatcgac ctgggcctcg acctgagcga ctctgacctg 60
gatgaagatc ctcctgagcc tgccgagagc agaagggacg atctggaaag cgatagcagc 120
ggcgagtgta gcagcagcga cgaggacatg gaagatcccc acggcgagga tggacctgag 180
cctattctgg atgccgccag acctgccgtc agaccttcta gacctgaaga tccaggcgtg 240
cccagcacac agacccctag acctacagag agacagggcc ccaacgatcc tcagcctgct 300
cctcatagcg tgtggtctag actgggagcc agaaggccta gctgtagccc tgaacagcac 360
ggcggaaaag tggccagact gcagcctcct ccaacaaagg ctcaacctgc tagaggcggc 420
agacggggca gaagaagagg tagaggaaga ggtggacctg gcgccgctga tggactgtct 480
gatcctagaa gaagggcccc tcggaccaac agaaatcctg gcggacctag accaggcgcc 540
ggatggacag atggaccagg tgctccacat ggcgaggctt ggagaggatc tgagcagcct 600
gatcctccag gcggccaaag aacaagaggc gttagacagg ctcctcctcc tctgatgacc 660
ctggctattg ctcctccacc agccgatcct agagcacccg ctccagaaag aaaagcccct 720
gccgccgata ccatcgacgc cacaacaaga ctggtgctgc ggagcatctc tgagagggcc 780
gctgtggata gaatcagcga gagctttggg agaagcgccc aagtgatgca cgaccctttt 840
ggcggccagc cttttcctgc cgccaattct ccttgggctc ctgtgcttgc tggacaaggc 900
ggcccttttg acgccgagac aagaagagtg tcctgggaga cactggtggc ccacggacct 960
agcctgtaca gaacattcgc cggcaatcca agagccgcca gcacagccaa agccatgaga 1020
gactgcgtgc tgagacaaga gaacttcatc gaggccctgg ccagcgccga tgagacactt 1080
gcttggtgca agatgtgcat ccaccacaac ctgcctctga ggccacagga ccctatcatc 1140
ggaacaacag ctgccgtgct ggataacctg gctaccagac tgaggccctt cctgcagtgc 1200
tacctgaagg ccagaggact gtgtggcctg gatgagctgt gctccagaag aaggctggct 1260
gacatcaagg atatcgccag cttcgtgttc gtgattctgg cccggctggc caacagagtg 1320
gaaagaggcg tggccgagat cgactatgcc acactcggag ttggcgtggg cgagaagatg 1380
cacttttatc tgcctggcgc ctgcatggcc ggcctgatcg aaattctgga cacccacaga 1440
caagagtgca gctccagagt gtgcgagctg acagcctctc acattgtggc ccctccatac 1500
gtgcacggca agtacttcta ctgcaacagc ctgttc 1536
<210> 418
<211> 1536
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding HSV1 ICP27 protein
<400> 418
auggccaccg acaucgacau gcugaucgac cugggccucg accugagcga cucugaccug 60
gaugaagauc cuccugagcc ugccgagagc agaagggacg aucuggaaag cgauagcagc 120
ggcgagugua gcagcagcga cgaggacaug gaagaucccc acggcgagga uggaccugag 180
ccuauucugg augccgccag accugccguc agaccuucua gaccugaaga uccaggcgug 240
cccagcacac agaccccuag accuacagag agacagggcc ccaacgaucc ucagccugcu 300
ccucauagcg uguggucuag acugggagcc agaaggccua gcuguagccc ugaacagcac 360
ggcggaaaag uggccagacu gcagccuccu ccaacaaagg cucaaccugc uagaggcggc 420
agacggggca gaagaagagg uagaggaaga gguggaccug gcgccgcuga uggacugucu 480
gauccuagaa gaagggcccc ucggaccaac agaaauccug gcggaccuag accaggcgcc 540
ggauggacag auggaccagg ugcuccacau ggcgaggcuu ggagaggauc ugagcagccu 600
gauccuccag gcggccaaag aacaagaggc guuagacagg cuccuccucc ucugaugacc 660
cuggcuauug cuccuccacc agccgauccu agagcacccg cuccagaaag aaaagccccu 720
gccgccgaua ccaucgacgc cacaacaaga cuggugcugc ggagcaucuc ugagagggcc 780
gcuguggaua gaaucagcga gagcuuuggg agaagcgccc aagugaugca cgacccuuuu 840
ggcggccagc cuuuuccugc cgccaauucu ccuugggcuc cugugcuugc uggacaaggc 900
ggcccuuuug acgccgagac aagaagagug uccugggaga cacugguggc ccacggaccu 960
agccuguaca gaacauucgc cggcaaucca agagccgcca gcacagccaa agccaugaga 1020
gacugcgugc ugagacaaga gaacuucauc gaggcccugg ccagcgccga ugagacacuu 1080
gcuuggugca agaugugcau ccaccacaac cugccucuga ggccacagga cccuaucauc 1140
ggaacaacag cugccgugcu ggauaaccug gcuaccagac ugaggcccuu ccugcagugc 1200
uaccugaagg ccagaggacu guguggccug gaugagcugu gcuccagaag aaggcuggcu 1260
gacaucaagg auaucgccag cuucguguuc gugauucugg cccggcuggc caacagagug 1320
gaaagaggcg uggccgagau cgacuaugcc acacucggag uuggcguggg cgagaagaug 1380
cacuuuuauc ugccuggcgc cugcauggcc ggccugaucg aaauucugga cacccacaga 1440
caagagugca gcuccagagu gugcgagcug acagccucuc acauuguggc cccuccauac 1500
gugcacggca aguacuucua cugcaacagc cuguuc 1536
<210> 419
<211> 247
<212> PRT
<213> human herpesvirus 1
<400> 419
Met Ala Ala Asp Ala Pro Gly Asp Arg Met Glu Glu Pro Leu Pro Asp
1 5 10 15
Arg Ala Val Pro Ile Tyr Val Ala Gly Phe Leu Ala Leu Tyr Asp Ser
20 25 30
Gly Asp Ser Gly Glu Leu Ala Leu Asp Pro Asp Thr Val Arg Ala Ala
35 40 45
Leu Pro Pro Asp Asn Pro Leu Pro Ile Asn Val Asp His Arg Ala Gly
50 55 60
Cys Glu Val Gly Arg Val Leu Ala Val Val Asp Asp Pro Arg Gly Pro
65 70 75 80
Phe Phe Val Gly Leu Ile Ala Cys Val Gln Leu Glu Arg Val Leu Glu
85 90 95
Thr Ala Ala Ser Ala Ala Ile Phe Glu Arg Arg Gly Pro Pro Leu Ser
100 105 110
Arg Glu Glu Arg Leu Leu Tyr Leu Ile Thr Asn Tyr Leu Pro Ser Val
115 120 125
Ser Leu Ala Thr Lys Arg Leu Gly Gly Glu Ala His Pro Asp Arg Thr
130 135 140
Leu Phe Ala His Val Ala Leu Cys Ala Ile Gly Arg Arg Leu Gly Thr
145 150 155 160
Ile Val Thr Tyr Asp Thr Gly Leu Asp Ala Ala Ile Ala Pro Phe Arg
165 170 175
His Leu Ser Pro Ala Ser Arg Glu Gly Ala Arg Arg Leu Ala Ala Glu
180 185 190
Ala Glu Leu Ala Leu Ser Gly Arg Thr Trp Ala Pro Gly Val Glu Ala
195 200 205
Leu Thr His Thr Leu Leu Ser Thr Ala Val Asn Asn Met Met Leu Arg
210 215 220
Asp Arg Trp Ser Leu Val Ala Glu Arg Arg Arg Gln Ala Gly Ile Ala
225 230 235 240
Gly His Thr Tyr Leu Gln Ala
245
<210> 420
<211> 741
<212> DNA
<213> human herpesvirus 1
<400> 420
atggcagccg atgccccggg agacaggatg gaggagcccc tgccagacag ggccgtgccc 60
atttacgtgg ctgggttttt ggccctgtat gacagcgggg actcgggcga gttggcattg 120
gatccggata cggtgcgggc ggccctgcct ccggataacc cactcccgat taacgtggac 180
caccgcgctg gctgcgaggt ggggcgggtg ctggccgtgg tcgacgaccc ccgcgggccg 240
ttttttgtgg ggctgatcgc ctgcgtgcag ctggagcgcg tcctcgagac ggccgccagc 300
gctgcgattt tcgagcgccg cgggccgccg ctctcccggg aggagcgcct gttgtacctg 360
atcaccaact acctgccctc ggtctccctg gccacaaaac gcctgggggg cgaggcgcac 420
cccgatcgca cgctgttcgc gcacgtcgcg ctgtgcgcga tcgggaggcg cctcggcact 480
atcgtcacct acgacaccgg tctcgacgcc gccatcgcgc cctttcgcca cctgtcgccg 540
gcgtctcgcg agggggcgcg gcgactggcc gccgaggccg agctcgcgct gtccggacgc 600
acctgggcgc ccggcgtgga ggcgctgacc cacacgctgc tttccaccgc cgttaacaac 660
atgatgctgc gggaccgctg gagcctggtg gccgagcggc ggcggcaggc cgggattgcc 720
ggacacacct acctccaggc g 741
<210> 421
<211> 741
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding HSV1 VP24 protein
<400> 421
atggctgctg atgcccctgg cgacagaatg gaagaacccc tgcctgatag agccgtgcct 60
atctacgtgg ccggatttct ggccctgtac gactctggcg attctggcga actggccctg 120
gatcctgata cagtcagagc cgctctgcct cctgacaacc ctctgccaat caacgtggac 180
cacagagccg gctgtgaagt gggaagagtg ctggccgtgg tggacgatcc tagaggccct 240
ttctttgtgg gcctgatcgc ctgcgtgcag ctggaaagag ttctggaaac agccgccagc 300
gccgccatct tcgaaagaag aggacctcct ctgagccggg aagagagact gctgtacctg 360
atcaccaact acctgcctag cgtgtccctg gccacaaaga gacttggcgg agaggcccat 420
cctgacagaa ccctgtttgc ccatgtggcc ctgtgtgcca ttggtagaag gctgggcacc 480
atcgtgacct acgatacagg actggacgcc gctatcgccc cattcagaca tctgagccct 540
gccagcagag aaggcgccag aaggcttgct gctgaagccg aactggctct gagcggcaga 600
acatgggctc caggtgttga agccctgaca cacaccctgc tgagcaccgc cgtgaacaac 660
atgatgctgc gggacagatg gtccctggtg gccgagagaa gaaggcaggc tggaattgcc 720
ggccacacat atctgcaggc t 741
<210> 422
<211> 663
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding HSV1 VP24
<400> 422
cuggcccugu acgacucugg cgauucuggc gaacuggccc uggauccuga uacagucaga 60
gccgcucugc cuccugacaa cccucugcca aucaacgugg accacagagc cggcugugaa 120
gugggaagag ugcuggccgu gguggacgau ccuagaggcc cuuucuuugu gggccugauc 180
gccugcgugc agcuggaaag aguucuggaa acagccgcca gcgccgccau cuucgaaaga 240
agaggaccuc cucugagccg ggaagagaga cugcuguacc ugaucaccaa cuaccugccu 300
agcguguccc uggccacaaa gagacuuggc ggagaggccc auccugacag aacccuguuu 360
gcccaugugg cccugugugc cauugguaga aggcugggca ccaucgugac cuacgauaca 420
ggacuggacg ccgcuaucgc cccauucaga caucugagcc cugccagcag agaaggcgcc 480
agaaggcuug cugcugaagc cgaacuggcu cugagcggca gaacaugggc uccagguguu 540
gaagcccuga cacacacccu gcugagcacc gccgugaaca acaugaugcu gcgggacaga 600
uggucccugg uggccgagag aagaaggcag gcuggaauug ccggccacac auaucugcag 660
gcu 663
<210> 423
<211> 1174
<212> PRT
<213> Murine Cytomegalovirus
<400> 423
Met Asp Arg Gln Pro Lys Val Tyr Ser Asp Pro Asp Asn Gly Phe Phe
1 5 10 15
Phe Leu Asp Val Pro Met Pro Asp Asp Gly Gln Gly Gly Gln Gln Thr
20 25 30
Ala Thr Thr Ala Ala Gly Gly Ala Phe Gly Val Gly Gly Gly His Ser
35 40 45
Val Pro Tyr Val Arg Ile Met Asn Gly Val Ser Gly Ile Gln Ile Gly
50 55 60
Asn His Asn Ala Met Ser Ile Ala Ser Cys Trp Ser Pro Ser Tyr Thr
65 70 75 80
Asp Arg Arg Arg Arg Ser Tyr Pro Lys Thr Ala Thr Asn Ala Ala Ala
85 90 95
Asp Arg Val Ala Ala Ala Val Ser Ala Ala Asn Ala Ala Val Asn Ala
100 105 110
Ala Ala Ala Ala Ala Ala Ala Gly Gly Gly Gly Gly Ala Asn Leu Leu
115 120 125
Ala Ala Ala Val Thr Cys Ala Asn Gln Arg Gly Cys Cys Gly Gly Asn
130 135 140
Gly Gly His Ser Leu Pro Pro Thr Arg Met Pro Lys Thr Asn Ala Thr
145 150 155 160
Ala Ala Ala Ala Pro Ala Val Ala Gly Ala Ser Asn Ala Lys Ser Asp
165 170 175
Asn Asn His Ala Asn Ala Thr Ser Gly Ala Gly Ser Ala Ala Ala Thr
180 185 190
Pro Ala Ala Thr Thr Pro Ala Ala Thr Ala Val Glu Asn Arg Arg Pro
195 200 205
Ser Pro Ser Pro Ser Thr Ala Ser Thr Ala Pro Cys Asp Glu Gly Ser
210 215 220
Ser Pro Arg His His Arg Pro Ser His Val Ser Val Gly Thr Gln Ala
225 230 235 240
Thr Pro Ser Thr Pro Ile Pro Ile Pro Ala Pro Arg Cys Ser Thr Gly
245 250 255
Gln Gln Gln Gln Gln Pro Gln Ala Lys Lys Leu Lys Pro Ala Lys Ala
260 265 270
Asp Pro Leu Leu Tyr Ala Ala Thr Met Pro Pro Pro Ala Ser Val Thr
275 280 285
Thr Ala Ala Ala Ala Ala Val Ala Pro Glu Ser Glu Ser Ser Pro Ala
290 295 300
Ala Ser Ala Pro Pro Ala Ala Ala Ala Met Ala Thr Gly Gly Asp Asp
305 310 315 320
Glu Asp Gln Ser Ser Phe Ser Phe Val Ser Asp Asp Val Leu Gly Glu
325 330 335
Phe Glu Asp Leu Arg Ile Ala Gly Leu Pro Val Arg Asp Glu Met Arg
340 345 350
Pro Pro Thr Pro Thr Met Thr Val Ile Pro Val Ser Arg Pro Phe Arg
355 360 365
Ala Gly Arg Asp Ser Gly Arg Asp Ala Leu Phe Asp Asp Ala Val Glu
370 375 380
Ser Val Arg Cys Tyr Cys His Gly Ile Leu Gly Asn Ser Arg Phe Cys
385 390 395 400
Ala Leu Val Asn Glu Lys Cys Ser Glu Pro Ala Lys Glu Arg Met Ala
405 410 415
Arg Ile Arg Arg Tyr Ala Ala Asp Val Thr Arg Cys Gly Pro Leu Ala
420 425 430
Leu Tyr Thr Ala Ile Val Ser Ser Ala Asn Arg Leu Ile Gln Thr Asp
435 440 445
Pro Ser Cys Asp Leu Asp Leu Ala Glu Cys Tyr Val Glu Thr Ala Ser
450 455 460
Lys Arg Asn Ala Val Pro Leu Ser Ala Phe Tyr Arg Asp Cys Asp Arg
465 470 475 480
Leu Arg Asp Ala Val Ala Ala Phe Phe Lys Thr Tyr Gly Met Val Val
485 490 495
Asp Ala Met Ala Gln Arg Ile Thr Glu Arg Val Gly Pro Ala Leu Gly
500 505 510
Arg Gly Leu Tyr Ser Thr Val Val Met Met Asp Arg Cys Gly Asn Ser
515 520 525
Phe Gln Gly Arg Glu Glu Thr Pro Ile Ser Val Phe Ala Arg Val Ala
530 535 540
Ala Ala Leu Ala Val Glu Cys Glu Val Asp Gly Gly Val Ser Tyr Lys
545 550 555 560
Ile Leu Ser Ser Lys Pro Val Asp Ala Ala Gln Ala Phe Asp Ala Phe
565 570 575
Leu Ser Ala Leu Cys Ser Phe Ala Ile Ile Pro Ser Pro Arg Val Leu
580 585 590
Ala Tyr Ala Gly Phe Gly Gly Ser Asn Pro Ile Phe Asp Ala Val Ser
595 600 605
Tyr Arg Ala Gln Phe Tyr Ser Ala Glu Ser Thr Ile Asn Gly Thr Leu
610 615 620
His Asp Ile Cys Asp Met Val Thr Asn Gly Leu Ser Val Ser Val Ser
625 630 635 640
Ala Ala Asp Leu Gly Gly Asp Ile Val Ala Ser Leu His Ile Leu Gly
645 650 655
Gln Gln Cys Lys Ala Leu Arg Pro Tyr Ala Arg Phe Lys Thr Val Leu
660 665 670
Arg Ile Tyr Phe Asp Ile Trp Ser Val Asp Ala Leu Lys Ile Phe Ser
675 680 685
Phe Ile Leu Asp Val Gly Arg Glu Tyr Glu Gly Leu Met Ala Phe Ala
690 695 700
Val Asn Thr Pro Arg Ile Phe Trp Asp Arg Tyr Leu Asp Ser Ser Gly
705 710 715 720
Asp Lys Met Trp Leu Met Phe Ala Arg Arg Glu Ala Ala Ala Leu Cys
725 730 735
Gly Leu Asp Leu Lys Ser Phe Arg Asn Val Tyr Glu Lys Met Glu Arg
740 745 750
Asp Gly Arg Ser Ala Ile Thr Val Ser Pro Trp Trp Ala Val Cys Gln
755 760 765
Leu Asp Ala Cys Val Ala Arg Gly Asn Thr Ala Val Val Phe Pro His
770 775 780
Asn Val Lys Ser Met Ile Pro Glu Asn Ile Gly Arg Pro Ala Val Cys
785 790 795 800
Gly Pro Gly Val Ser Val Val Ser Gly Gly Phe Val Gly Cys Thr Pro
805 810 815
Ile His Glu Leu Cys Ile Asn Leu Glu Asn Cys Val Leu Glu Gly Ala
820 825 830
Ala Val Glu Ser Ser Val Asp Val Val Leu Gly Leu Gly Cys Arg Phe
835 840 845
Ser Phe Lys Ala Leu Glu Ser Leu Val Arg Asp Ala Val Val Leu Gly
850 855 860
Asn Leu Leu Ile Asp Met Thr Val Arg Thr Asn Ala Tyr Gly Ala Gly
865 870 875 880
Lys Leu Leu Thr Leu Tyr Arg Asp Leu His Ile Gly Val Val Gly Phe
885 890 895
His Ala Val Met Asn Arg Leu Gly Gln Lys Phe Ala Asp Met Glu Ser
900 905 910
Tyr Asp Leu Asn Gln Arg Ile Ala Glu Phe Ile Tyr Tyr Thr Ala Val
915 920 925
Arg Ala Ser Val Asp Leu Cys Met Ala Gly Ala Asp Pro Phe Pro Lys
930 935 940
Phe Pro Lys Ser Leu Tyr Ala Ala Gly Arg Phe Tyr Pro Asp Leu Phe
945 950 955 960
Asp Asp Asp Glu Arg Gly Pro Arg Arg Met Thr Lys Glu Phe Leu Glu
965 970 975
Lys Leu Arg Glu Asp Val Val Lys His Gly Ile Arg Asn Ala Ser Phe
980 985 990
Ile Thr Gly Cys Ser Ala Asp Glu Ala Ala Asn Leu Ala Gly Thr Thr
995 1000 1005
Pro Gly Phe Trp Pro Arg Arg Asp Asn Val Phe Leu Glu Gln Thr Pro
1010 1015 1020
Leu Met Met Thr Pro Thr Lys Asp Gln Met Leu Asp Glu Cys Val Arg
1025 1030 1035 1040
Ser Val Lys Ile Glu Pro His Arg Leu His Glu Glu Asp Leu Ser Cys
1045 1050 1055
Leu Gly Glu Asn Arg Pro Val Glu Leu Pro Val Leu Asn Ser Arg Leu
1060 1065 1070
Arg Gln Ile Ser Lys Glu Ser Ala Thr Val Ala Val Arg Arg Gly Arg
1075 1080 1085
Ser Ala Pro Phe Tyr Asp Asp Ser Asp Asp Glu Asp Glu Val Ala Cys
1090 1095 1100
Ser Glu Thr Gly Trp Thr Val Ser Thr Asp Ala Val Ile Lys Met Cys
1105 1110 1115 1120
Val Asp Arg Gln Pro Phe Val Asp His Ala Gln Ser Leu Pro Val Ala
1125 1130 1135
Ile Gly Phe Gly Gly Ser Ser Val Glu Leu Ala Arg His Leu Arg Arg
1140 1145 1150
Gly Asn Ala Leu Gly Leu Ser Val Gly Val Tyr Lys Cys Ser Met Pro
1155 1160 1165
Pro Ser Val Asn Tyr Arg
1170
<210> 424
<211> 3522
<212> DNA
<213> Murine Cytomegalovirus
<400> 424
atggatcgcc agcccaaagt ctactccgac ccggacaacg gattcttctt tttggatgtc 60
cccatgcctg acgacgggca gggaggccag cagaccgcca ccaccgctgc cgggggagcc 120
ttcggggtgg gtggggggca cagcgtgccc tacgtcagga tcatgaatgg agtctctgga 180
atacagatcg gaaaccataa tgctatgagc atcgcctctt gctggagtcc ctcctacact 240
gaccgacgcc gcaggagcta ccccaagacc gcgaccaacg cggcggcaga cagggtcgcc 300
gctgccgtct ccgccgccaa tgctgctgtc aatgctgctg ccgcggctgc tgccgccggc 360
gggggcggcg gcgctaacct actggctgct gctgtcactt gtgcaaatca gcgaggttgc 420
tgcggaggaa atggggggca ttccctccct cccacccgaa tgccgaagac caacgctacc 480
gccgcggccg ctcctgccgt cgccggtgct tccaacgcca agagtgacaa caatcacgct 540
aacgccacct ctggtgctgg atccgcggcc gccacccccg ccgccaccac ccccgccgcc 600
accgccgtcg aaaaccgacg acccagcccg agcccctcta cagcctcgac tgcgccctgt 660
gacgagggat cttctcctcg ccaccatcgt cctagtcacg ttagtgtcgg cactcaggcg 720
actccgtcga ctcctatccc gattcccgct ccccggtgca gcacaggcca acaacaacag 780
caacctcaag ccaagaagct taagcccgct aaagctgatc ccctcctgta cgcggcgacg 840
atgccgcctc ccgcgagcgt aacgaccgcc gctgccgctg ccgtcgcccc tgaatccgaa 900
tcctcacctg ccgcttcggc accaccagca gcagcagcga tggcgaccgg gggagacgac 960
gaagatcagt cgtctttctc gttcgtgagc gacgacgtcc tcggagaatt cgaagatctg 1020
cgcatcgccg ggctccccgt cagggacgag atgcgccccc cgaccccgac gatgacggtc 1080
attcccgtca gcaggccctt ccgcgcgggg cgcgacagcg ggcgcgacgc cttgtttgac 1140
gacgccgtcg agtccgtgcg ctgctactgc cacggcatcc tcggcaacag ccgattctgc 1200
gccctcgtca acgagaagtg ctccgaaccc gccaaggagc gcatggctcg catccgccgc 1260
tacgccgcgg acgtgacgcg ctgcggaccc ctcgcgctct acaccgccat cgtctccagc 1320
gccaaccgtc tcatccagac cgacccgtcg tgcgacctgg atctcgccga atgttacgtc 1380
gagacggcgt ccaagaggaa cgccgtcccc ctctcggcct tctaccgcga ctgcgatcgc 1440
ctgcgggatg ctgtcgccgc gttcttcaag acctacggca tggtggtgga cgccatggcg 1500
cagcgcatca cggagcgggt cgggccggcc ctgggtaggg gcctctactc gaccgtcgtc 1560
atgatggatc gctgcggaaa cagcttccag ggacgcgagg agacccccat ctccgtcttc 1620
gcccgggtcg ccgcggctct cgccgtcgag tgcgaggtcg acgggggcgt ctcgtacaag 1680
atcctcagct ccaagcccgt cgacgccgcg caggccttcg acgccttcct ctccgccctc 1740
tgctccttcg ccatcatccc ctcgccgcgg gtcctggcct acgccgggtt cggcggttcc 1800
aacccgatct tcgacgccgt ttcttaccgc gctcagttct actcggccga gagcacgatc 1860
aacggcaccc tgcacgacat ctgcgacatg gtgaccaacg gcctctcggt gtccgtcagc 1920
gcggcggacc tcggaggcga catcgtggcc tctctgcaca tcctcggaca gcagtgcaag 1980
gcgctgcggc cgtacgcgcg attcaagacc gtcttgagga tctacttcga catctggtcc 2040
gtcgacgctc tcaagatctt ctctttcatc ctcgacgtcg ggcgggaata cgagggcctg 2100
atggccttcg cggtcaacac gccgaggatc ttctgggatc gctacctaga cagctccggc 2160
gacaagatgt ggctcatgtt cgcgaggcgg gaggccgcgg ccctgtgcgg cctcgacctc 2220
aagtccttcc gtaacgtcta cgagaagatg gagcgtgacg ggcgcagcgc catcaccgtc 2280
tcgccctggt gggccgtctg tcagctcgac gcgtgcgtgg cgcggggcaa cacggccgtg 2340
gtcttccctc acaacgtcaa gagtatgatc cccgagaaca tcgggcgccc cgccgtgtgc 2400
ggacccggcg tctccgtcgt ctccggcggc ttcgtcggct gtacccccat ccacgagctg 2460
tgcatcaacc tggagaactg cgtcctggag ggcgcggcag tcgagagctc cgtcgacgtg 2520
gtcctcggtc tcggttgccg cttcagcttc aaggccctgg agtccctggt ccgcgacgcg 2580
gtggtgctgg gtaacctgct catcgacatg accgtgcgca ccaacgcgta cggcgccggc 2640
aagctcctga cgctctatcg cgacctgcac atcggggtcg tcggcttcca cgctgtgatg 2700
aatcgcctcg ggcagaagtt cgccgacatg gagtcttacg acctcaacca gcgtatcgcg 2760
gagtttatct actacaccgc cgtgcgggcc agcgtcgacc tgtgcatggc gggcgccgat 2820
ccgttcccca agttccctaa gagcctgtac gcggccggcc gcttctaccc cgacctcttc 2880
gacgacgacg agcgcggccc gcgtcgcatg accaaggagt tcctcgagaa actacgtgaa 2940
gacgtggtga aacacggcat caggaacgcc tccttcatca ccggctgctc ggccgacgaa 3000
gccgccaacc tggcgggcac cactccgggc ttctggccgc gccgcgacaa cgtctttctc 3060
gagcagacgc cgctcatgat gaccccgacg aaggatcaga tgctcgatga gtgcgtgcgc 3120
tccgtcaaga tcgagcccca tcgcctgcac gaggaggatc tctcctgtct cggcgagaac 3180
cggcccgtcg agctgcccgt gctcaacagc cgcctcaggc agatctcgaa agagtccgcg 3240
acggtcgccg tgcgccgcgg ccgctcggcg cccttctacg acgactcgga cgacgaggac 3300
gaggtggcgt gctccgagac cggctggacc gtgtcgaccg acgcggtcat caagatgtgc 3360
gtcgacagac agccgttcgt cgaccatgcg cagtcgctgc ccgtcgccat cggcttcggg 3420
gggtcttcgg tggaattggc gcgtcatctg agacgaggga acgctctggg actgtccgtc 3480
ggagtatata aatgtagtat gcccccttcc gtgaattatc gc 3522
<210> 425
<211> 3522
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding Murine CTMV M45 protein
<400> 425
atggacagac agcccaaggt gtacagcgac cccgacaacg gcttcttctt cctggatgtg 60
cccatgcctg acgatggcca aggcggacag cagacagcta caacagctgc cggcggagcc 120
tttggagttg gcggaggaca ttctgtgccc tacgtgcgga tcatgaatgg cgtgtccggc 180
atccagatcg gcaaccacaa cgccatgtct atcgccagct gttggagccc cagctacacc 240
gatcggcgga gaagaagcta ccctaagacc gccacaaacg ccgctgccga tagagtggct 300
gctgctgtgt ctgccgctaa cgctgctgtg aatgctgctg ccgctgctgc agccgcaggc 360
ggcggaggcg gagctaatct tcttgcagca gccgtgacct gcgccaacca gagaggatgt 420
tgcggaggaa atggcggcca cagcctgcct ccaaccagaa tgcctaagac caatgccaca 480
gccgctgcag ctccagcagt tgccggtgcc tctaatgcca agagcgacaa caaccacgcc 540
aacgccacat ctggcgctgg atctgctgct gctacaccag ccgctacaac accagctgcc 600
accgccgttg agaacagaag gccatctcca agtcctagca ccgccagcac agccccttgt 660
gatgagggaa gcagccccag acaccacaga cctagccatg tgtctgtggg cacacaggcc 720
acacctagca caccaattcc tattccagct cctcggtgct ccacaggcca gcagcaacaa 780
cagcctcagg ccaagaagct gaagcccgcc aaagctgacc ctctgctgta tgccgcaacc 840
atgcctcctc cagcctctgt gactactgcc gcagcagctg cagtggcccc tgagtctgaa 900
tcttctcctg ccgcttctgc ccctccagca gccgccgcta tggctacagg cggagatgat 960
gaggaccaga gcagcttctc cttcgtgtcc gatgatgtgc tgggcgagtt cgaggacctg 1020
agaattgctg gactgcccgt gcgggatgag atgaggcctc ctacacctac catgacagtg 1080
atccccgtgt ctcggccttt cagagccggc agagattctg gcagagatgc cctgttcgac 1140
gacgccgtgg aaagcgtgcg gtgttactgt cacggcatcc tgggcaacag cagattctgc 1200
gccctggtca acgagaagtg tagcgagcct gccaaagaac ggatggcccg gattagaaga 1260
tacgccgccg acgtgacaag atgcggacct ctggctctgt acaccgccat tgtgtctagc 1320
gccaaccggc tgatccagac agaccctagc tgtgacctgg atctggccga gtgctacgtg 1380
gaaaccgcct ccaagagaaa cgccgtgcct ctgagcgcct tctacagaga ctgcgacaga 1440
ctgagagatg ccgtggccgc cttcttcaag acctacggca tggtggtgga cgccatggct 1500
cagagaatca ccgagagagt gggacccgct ctcggcagag gactgtattc taccgtggtc 1560
atgatggaca gatgcggcaa cagcttccag ggcagagaag agacacccat cagcgtgttc 1620
gccagagtgg ctgctgctct ggccgtggaa tgtgaagtgg atggcggcgt gtcctacaag 1680
atcctgagca gcaagcctgt ggatgccgct caggccttcg atgcctttct gagcgccctg 1740
tgcagcttcg ccatcattcc atctccaaga gtgctggcct acgccggctt tggcggcagc 1800
aatcctatct ttgacgccgt gtcttacagg gcccagttct acagcgccga gagcaccatc 1860
aatggcaccc tgcacgacat ctgcgacatg gtcacaaacg gcctgtccgt gtctgtgtct 1920
gccgctgatc tcggcggaga tatcgtggcc tctctgcaca ttctgggcca gcagtgcaaa 1980
gccctgaggc cttacgccag attcaagacc gtgctgcgga tctacttcga catttggagc 2040
gtggacgccc tgaagatctt tagcttcatc ctggacgtgg ggcgcgagta cgaaggactg 2100
atggcctttg ccgtgaatac ccctcggatc ttctgggaca gatacctgga cagcagcggc 2160
gacaagatgt ggctgatgtt tgccagaaga gaagccgccg ctctgtgcgg cctggatctg 2220
aagtccttcc ggaacgtgta cgagaagatg gaacgcgacg gccgctctgc catcacagtt 2280
agtccttggt gggccgtgtg tcagctggat gcctgtgtgg ccagaggcaa taccgccgtg 2340
gtgttccctc acaacgtgaa gtctatgatc cccgagaaca tcggcaggcc agccgtgtgt 2400
ggacctggcg ttagtgttgt gtctggcggc ttcgtgggct gcacacctat tcacgagctg 2460
tgcatcaacc tggaaaactg cgtgctggaa ggcgccgctg tggaatcctc tgtggatgtg 2520
gtgctcggcc tgggctgcag attcagcttt aaggccctgg aaagcctcgt gcgggatgct 2580
gtggttctgg gcaacctgct gatcgacatg accgtgcgga ccaatgccta tggcgctggc 2640
aaactgctga ccctgtaccg ggatctgcac atcggcgttg tgggattcca cgccgtgatg 2700
aacagactgg gccagaaatt cgccgacatg gaaagctacg acctgaacca gcggatcgcc 2760
gagttcatct actacacagc cgtcagagcc agcgtggacc tgtgtatggc tggcgccgat 2820
ccatttccta agttccccaa gagcctgtac gccgctggca gattctaccc cgacctgttc 2880
gacgacgatg agaggggccc tagacggatg accaaagagt tcctggaaaa gctgagggaa 2940
gatgtggtca agcacggcat ccggaacgcc agctttatca caggctgtag cgccgacgag 3000
gccgccaatc ttgctggaac aacacccggc ttttggccca gacgggacaa tgtgtttctg 3060
gaacagaccc ctctgatgat gacccctacc aaggaccaga tgctggacga gtgcgtgcgg 3120
agcgtgaaga tcgaacctca cagactgcac gaagaggacc tgagctgcct gggcgagaac 3180
agacctgtgg aactgcccgt gctgaacagc agactgcggc agatcagcaa agaaagcgcc 3240
accgtggccg tgcggagagg aagaagtgct ccattctacg acgacagcga cgacgaggat 3300
gaagtggcct gttctgagac aggctggacc gtgtctaccg atgccgtgat caagatgtgc 3360
gtggacagac agcccttcgt ggatcacgct cagtctctgc ctgtggccat cggctttgga 3420
ggctctagcg tggaactggc cagacacctg agaagaggca atgccctggg actgtctgtg 3480
ggcgtgtaca agtgtagcat gcctcctagc gtgaactacc gg 3522
<210> 426
<211> 3522
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding Murine CTMV M45 protein
<400> 426
auggacagac agcccaaggu guacagcgac cccgacaacg gcuucuucuu ccuggaugug 60
cccaugccug acgauggcca aggcggacag cagacagcua caacagcugc cggcggagcc 120
uuuggaguug gcggaggaca uucugugccc uacgugcgga ucaugaaugg cguguccggc 180
auccagaucg gcaaccacaa cgccaugucu aucgccagcu guuggagccc cagcuacacc 240
gaucggcgga gaagaagcua cccuaagacc gccacaaacg ccgcugccga uagaguggcu 300
gcugcugugu cugccgcuaa cgcugcugug aaugcugcug ccgcugcugc agccgcaggc 360
ggcggaggcg gagcuaaucu ucuugcagca gccgugaccu gcgccaacca gagaggaugu 420
ugcggaggaa auggcggcca cagccugccu ccaaccagaa ugccuaagac caaugccaca 480
gccgcugcag cuccagcagu ugccggugcc ucuaaugcca agagcgacaa caaccacgcc 540
aacgccacau cuggcgcugg aucugcugcu gcuacaccag ccgcuacaac accagcugcc 600
accgccguug agaacagaag gccaucucca aguccuagca ccgccagcac agccccuugu 660
gaugagggaa gcagccccag acaccacaga ccuagccaug ugucuguggg cacacaggcc 720
acaccuagca caccaauucc uauuccagcu ccucggugcu ccacaggcca gcagcaacaa 780
cagccucagg ccaagaagcu gaagcccgcc aaagcugacc cucugcugua ugccgcaacc 840
augccuccuc cagccucugu gacuacugcc gcagcagcug caguggcccc ugagucugaa 900
ucuucuccug ccgcuucugc cccuccagca gccgccgcua uggcuacagg cggagaugau 960
gaggaccaga gcagcuucuc cuucgugucc gaugaugugc ugggcgaguu cgaggaccug 1020
agaauugcug gacugcccgu gcgggaugag augaggccuc cuacaccuac caugacagug 1080
auccccgugu cucggccuuu cagagccggc agagauucug gcagagaugc ccuguucgac 1140
gacgccgugg aaagcgugcg guguuacugu cacggcaucc ugggcaacag cagauucugc 1200
gcccugguca acgagaagug uagcgagccu gccaaagaac ggauggcccg gauuagaaga 1260
uacgccgccg acgugacaag augcggaccu cuggcucugu acaccgccau ugugucuagc 1320
gccaaccggc ugauccagac agacccuagc ugugaccugg aucuggccga gugcuacgug 1380
gaaaccgccu ccaagagaaa cgccgugccu cugagcgccu ucuacagaga cugcgacaga 1440
cugagagaug ccguggccgc cuucuucaag accuacggca ugguggugga cgccauggcu 1500
cagagaauca ccgagagagu gggacccgcu cucggcagag gacuguauuc uaccgugguc 1560
augauggaca gaugcggcaa cagcuuccag ggcagagaag agacacccau cagcguguuc 1620
gccagagugg cugcugcucu ggccguggaa ugugaagugg auggcggcgu guccuacaag 1680
auccugagca gcaagccugu ggaugccgcu caggccuucg augccuuucu gagcgcccug 1740
ugcagcuucg ccaucauucc aucuccaaga gugcuggccu acgccggcuu uggcggcagc 1800
aauccuaucu uugacgccgu gucuuacagg gcccaguucu acagcgccga gagcaccauc 1860
aauggcaccc ugcacgacau cugcgacaug gucacaaacg gccuguccgu gucugugucu 1920
gccgcugauc ucggcggaga uaucguggcc ucucugcaca uucugggcca gcagugcaaa 1980
gcccugaggc cuuacgccag auucaagacc gugcugcgga ucuacuucga cauuuggagc 2040
guggacgccc ugaagaucuu uagcuucauc cuggacgugg ggcgcgagua cgaaggacug 2100
auggccuuug ccgugaauac cccucggauc uucugggaca gauaccugga cagcagcggc 2160
gacaagaugu ggcugauguu ugccagaaga gaagccgccg cucugugcgg ccuggaucug 2220
aaguccuucc ggaacgugua cgagaagaug gaacgcgacg gccgcucugc caucacaguu 2280
aguccuuggu gggccgugug ucagcuggau gccugugugg ccagaggcaa uaccgccgug 2340
guguucccuc acaacgugaa gucuaugauc cccgagaaca ucggcaggcc agccgugugu 2400
ggaccuggcg uuaguguugu gucuggcggc uucgugggcu gcacaccuau ucacgagcug 2460
ugcaucaacc uggaaaacug cgugcuggaa ggcgccgcug uggaauccuc uguggaugug 2520
gugcucggcc ugggcugcag auucagcuuu aaggcccugg aaagccucgu gcgggaugcu 2580
gugguucugg gcaaccugcu gaucgacaug accgugcgga ccaaugccua uggcgcuggc 2640
aaacugcuga cccuguaccg ggaucugcac aucggcguug ugggauucca cgccgugaug 2700
aacagacugg gccagaaauu cgccgacaug gaaagcuacg accugaacca gcggaucgcc 2760
gaguucaucu acuacacagc cgucagagcc agcguggacc uguguauggc uggcgccgau 2820
ccauuuccua aguuccccaa gagccuguac gccgcuggca gauucuaccc cgaccuguuc 2880
gacgacgaug agaggggccc uagacggaug accaaagagu uccuggaaaa gcugagggaa 2940
gaugugguca agcacggcau ccggaacgcc agcuuuauca caggcuguag cgccgacgag 3000
gccgccaauc uugcuggaac aacacccggc uuuuggccca gacgggacaa uguguuucug 3060
gaacagaccc cucugaugau gaccccuacc aaggaccaga ugcuggacga gugcgugcgg 3120
agcgugaaga ucgaaccuca cagacugcac gaagaggacc ugagcugccu gggcgagaac 3180
agaccugugg aacugcccgu gcugaacagc agacugcggc agaucagcaa agaaagcgcc 3240
accguggccg ugcggagagg aagaagugcu ccauucuacg acgacagcga cgacgaggau 3300
gaaguggccu guucugagac aggcuggacc gugucuaccg augccgugau caagaugugc 3360
guggacagac agcccuucgu ggaucacgcu cagucucugc cuguggccau cggcuuugga 3420
ggcucuagcg uggaacuggc cagacaccug agaagaggca augcccuggg acugucugug 3480
ggcguguaca aguguagcau gccuccuagc gugaacuacc gg 3522
<210> 427
<211> 56
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 427
Met Met Leu Thr Thr Ser Cys Val Gly Ile Leu Ile Val Thr Thr Ile
1 5 10 15
Val Phe His Thr Ile Val Gln Leu Leu Gln Leu Ser Leu Pro Pro Val
20 25 30
Met Ala Gln Gln Ile Pro Leu Gln Asn Met Thr Thr Lys Leu Val Val
35 40 45
Ile Leu Arg Asn Gly Asn Leu Glu
50 55
<210> 428
<211> 168
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 428
atgatgctaa ctacttcctg tgttggcata ctaattgtta cgactattgt attccataca 60
atagtgcaac ttcttcaatt gtcattacct ccggtgatgg cacaacaaat cccattacag 120
aacatgacta ccaaattggt ggttattttg agaaatggga atctggag 168
<210> 429
<211> 168
<212> RNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 429
augaugcuaa cuacuuccug uguuggcaua cuaauuguua cgacuauugu auuccauaca 60
auagugcaac uucuucaauu gucauuaccu ccggugaugg cacaacaaau cccauuacag 120
aacaugacua ccaaauuggu gguuauuuug agaaauggga aucuggag 168
<210> 430
<211> 171
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding Pangolin CoV-2 ORF3b*57
<400> 430
atgatgctga ccaccagctg tgtgggcatc ctgatcgtga ccaccatcgt gttccacaca 60
atcgtgcagc tgctgcagct cagcctgcct cctgttatgg cccagcagat ccctctgcag 120
aacatgacca caaagctggt cgtgatcctg cggaacggca acctggaatg a 171
<210> 431
<211> 171
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding Pangolin CoV-2 ORF3b*57
<400> 431
augaugcuga ccaccagcug ugugggcauc cugaucguga ccaccaucgu guuccacaca 60
aucgugcagc ugcugcagcu cagccugccu ccuguuaugg cccagcagau cccucugcag 120
aacaugacca caaagcuggu cgugauccug cggaacggca accuggaaug a 171
<210> 432
<211> 78
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 432
Met Met Leu Thr Thr Ser Cys Val Gly Ile Leu Ile Val Thr Thr Ile
1 5 10 15
Val Phe His Thr Ile Val Gln Leu Leu Gln Leu Ser Leu Pro Pro Val
20 25 30
Met Ala Gln Gln Ile Pro Leu Gln Asn Met Thr Thr Lys Leu Val Val
35 40 45
Ile Leu Arg Asn Gly Asn Leu Glu Leu Lys Thr Val Leu Tyr Tyr Thr
50 55 60
Ala Thr Ser Leu Gln Ile Thr Thr Ser Cys Thr Gln Leu Asn
65 70 75
<210> 433
<211> 234
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 433
atgatgctaa ctacttcctg tgttggcata ctaattgtta cgactattgt attccataca 60
atagtgcaac ttcttcaatt gtcattacct ccggtgatgg cacaacaaat cccattacag 120
aacatgacta ccaaattggt ggttattttg agaaatggga atctggagct gaagactgtg 180
ttgtattaca cagctacttc acttcagatt actaccagct gtactcaact caat 234
<210> 434
<211> 234
<212> RNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 434
augaugcuaa cuacuuccug uguuggcaua cuaauuguua cgacuauugu auuccauaca 60
auagugcaac uucuucaauu gucauuaccu ccggugaugg cacaacaaau cccauuacag 120
aacaugacua ccaaauuggu gguuauuuug agaaauggga aucuggagcu gaagacugug 180
uuguauuaca cagcuacuuc acuucagauu acuaccagcu guacucaacu caau 234
<210> 435
<211> 237
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding Pangolin CoV-2 ORF3b*79
<400> 435
atgatgctga ccaccagctg tgtgggcatc ctgatcgtga ccaccatcgt gttccacaca 60
atcgtgcagc tgctgcagct cagcctgcct cctgttatgg cccagcagat ccctctgcag 120
aacatgacca caaagctggt cgtgatcctg cggaacggca acctggaact gaaaaccgtg 180
ctgtactaca ccgccaccag cctgcagatc accacaagct gcacccagct gaactga 237
<210> 436
<211> 237
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding Pangolin CoV-2 ORF3b*79
<400> 436
augaugcuga ccaccagcug ugugggcauc cugaucguga ccaccaucgu guuccacaca 60
aucgugcagc ugcugcagcu cagccugccu ccuguuaugg cccagcagau cccucugcag 120
aacaugacca caaagcuggu cgugauccug cggaacggca accuggaacu gaaaaccgug 180
cuguacuaca ccgccaccag ccugcagauc accacaagcu gcacccagcu gaacuga 237
<210> 437
<211> 109
<212> PRT
<213> Middle East Respiratory Syndrome virus
<400> 437
Met Asp Tyr Val Ser Leu Leu Asn Gln Ile Trp Gln Lys Tyr Leu Asn
1 5 10 15
Ser Pro Tyr Thr Thr Cys Leu Tyr Ile Pro Lys Pro Thr Ala Lys Tyr
20 25 30
Thr Pro Leu Val Gly Thr Ser Leu His Pro Val Leu Trp Asn Cys Gln
35 40 45
Leu Ser Phe Ala Gly Tyr Thr Glu Ser Ala Val Asn Ser Thr Lys Ala
50 55 60
Leu Ala Lys Gln Asp Ala Ala Gln Arg Ile Ala Trp Leu Leu His Lys
65 70 75 80
Asp Gly Gly Ile Pro Asp Gly Cys Ser Leu Tyr Leu Arg His Ser Ser
85 90 95
Leu Phe Ala Gln Ser Glu Glu Glu Glu Ser Phe Ser Asn
100 105
<210> 438
<211> 327
<212> DNA
<213> Middle East Respiratory Syndrome virus
<400> 438
atggactacg tgtccctgct gaaccagatt tggcagaagt acctgaacag cccctacacc 60
acctgtctgt acatccccaa gcctaccgcc aagtacacac ctctcgtggg cacatctctg 120
caccccgtgc tgtggaattg ccagctgagc tttgccggct acaccgagtc tgccgtgaac 180
agcacaaagg ccctggccaa acaggacgcc gctcagagaa ttgcctggct gctgcacaag 240
gatggcggca tccctgatgg ctgtagcctg tacctgagac acagcagcct gttcgcccag 300
agcgaggaag aggaatcctt cagcaac 327
<210> 439
<211> 327
<212> RNA
<213> Middle East Respiratory Syndrome virus
<400> 439
auggacuacg ugucccugcu gaaccagauu uggcagaagu accugaacag ccccuacacc 60
accugucugu acauccccaa gccuaccgcc aaguacacac cucucguggg cacaucucug 120
caccccgugc uguggaauug ccagcugagc uuugccggcu acaccgaguc ugccgugaac 180
agcacaaagg cccuggccaa acaggacgcc gcucagagaa uugccuggcu gcugcacaag 240
gauggcggca ucccugaugg cuguagccug uaccugagac acagcagccu guucgcccag 300
agcgaggaag aggaauccuu cagcaac 327
<210> 440
<211> 330
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding MERS-ORF4a
<400> 440
atggactacg tgtccctgct gaatcagatc tggcagaagt acctgaacag cccctacacc 60
acctgtctgt acatccccaa gcctaccgcc aagtacacac ctctcgtggg cacatctctg 120
caccccgtgc tgtggaattg ccagctgagc tttgccggct acaccgagag cgccgtgaat 180
agcacaaagg ccctggccaa acaggacgcc gctcagagaa ttgcctggct gctgcacaag 240
gatggcggca tccctgatgg ctgtagcctg tacctgagac acagcagcct gttcgcccag 300
agcgaggaag aggaatcctt cagcaactga 330
<210> 441
<211> 330
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding MERS-ORF4a
<400> 441
auggacuacg ugucccugcu gaaucagauc uggcagaagu accugaacag ccccuacacc 60
accugucugu acauccccaa gccuaccgcc aaguacacac cucucguggg cacaucucug 120
caccccgugc uguggaauug ccagcugagc uuugccggcu acaccgagag cgccgugaau 180
agcacaaagg cccuggccaa acaggacgcc gcucagagaa uugccuggcu gcugcacaag 240
gauggcggca ucccugaugg cuguagccug uaccugagac acagcagccu guucgcccag 300
agcgaggaag aggaauccuu cagcaacuga 330
<210> 442
<211> 168
<212> PRT
<213> Bovine viral diarrhea virus
<400> 442
Met Glu Leu Ile Thr Asn Glu Leu Leu Tyr Lys Thr Tyr Lys Gln Lys
1 5 10 15
Pro Val Gly Val Glu Glu Pro Val Tyr Asp Gln Ala Gly Asp Pro Leu
20 25 30
Phe Gly Glu Arg Gly Ala Val His Pro Gln Ser Thr Leu Lys Leu Pro
35 40 45
His Lys Arg Gly Glu Arg Asp Val Pro Thr Asn Leu Ala Ser Leu Pro
50 55 60
Lys Arg Gly Asp Cys Arg Thr Gly Asn Ser Arg Gly Pro Val Ser Gly
65 70 75 80
Ile Tyr Leu Lys Pro Gly Pro Leu Phe Tyr Gln Asp Tyr Lys Gly Pro
85 90 95
Val Tyr His Arg Ala Pro Leu Glu Leu Phe Glu Glu Gly Ser Met Cys
100 105 110
Glu Thr Thr Lys Arg Ile Gly Arg Val Thr Gly Ser Asp Gly Lys Leu
115 120 125
Tyr His Ile Tyr Val Cys Ile Asp Gly Cys Ile Ile Ile Lys Ser Ala
130 135 140
Thr Arg Ser Tyr Gln Arg Val Phe Arg Trp Val His Asn Arg Leu Asp
145 150 155 160
Cys Pro Leu Trp Val Thr Ser Cys
165
<210> 443
<211> 504
<212> DNA
<213> Bovine viral diarrhea virus
<400> 443
atggagttga tcacaaatga acttttatac aaaacataca aacaaaaacc cgtcggggtg 60
gaggaacctg tttatgatca ggcaggtgat cccttatttg gtgaaagggg agcagtccac 120
cctcaatcga cgctaaagct cccacacaag agaggggaac gcgatgttcc aaccaacttg 180
gcatccttac caaaaagagg tgactgcagg acgggtaata gcagaggacc tgtgagcggg 240
atctacctga agccagggcc actattttac caggactata aaggtcccgt ctatcacagg 300
gccccgctgg agctctttga ggagggatcc atgtgtgaaa cgactaaacg gatagggaga 360
gtaactggaa gtgacggaaa gctgtaccac atttatgtgt gtatagatgg atgtataata 420
ataaaaagtg ccacgagaag ttaccaaagg gtgttcaggt gggtccataa taggcttgac 480
tgccctctat gggtcacaag ttgc 504
<210> 444
<211> 504
<212> RNA
<213> Bovine viral diarrhea virus
<400> 444
auggaguuga ucacaaauga acuuuuauac aaaacauaca aacaaaaacc cgucggggug 60
gaggaaccug uuuaugauca ggcaggugau cccuuauuug gugaaagggg agcaguccac 120
ccucaaucga cgcuaaagcu cccacacaag agaggggaac gcgauguucc aaccaacuug 180
gcauccuuac caaaaagagg ugacugcagg acggguaaua gcagaggacc ugugagcggg 240
aucuaccuga agccagggcc acuauuuuac caggacuaua aaggucccgu cuaucacagg 300
gccccgcugg agcucuuuga ggagggaucc augugugaaa cgacuaaacg gauagggaga 360
guaacuggaa gugacggaaa gcuguaccac auuuaugugu guauagaugg auguauaaua 420
auaaaaagug ccacgagaag uuaccaaagg guguucaggu ggguccauaa uaggcuugac 480
ugcccucuau gggucacaag uugc 504
<210> 445
<211> 507
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding BVDV nPro
<400> 445
atggaactga tcaccaacga gctgctgtac aagacctaca agcagaaacc cgtgggcgtc 60
gaggaacccg tgtatgatca agctggcgac cctctgtttg gcgagagagg cgctgttcac 120
cctcagagca cactgaagct gccccacaag cggggcgaaa gagatgtgcc taccaacctg 180
gccagcctgc ctaagagagg cgattgcaga accggcaata gcagaggccc tgtgtccggc 240
atctacctga aacctggacc actgttctac caggactaca agggccccgt gtaccacaga 300
gcacccctgg aacttttcga agagggcagc atgtgcgaaa ccaccaagcg gatcggaaga 360
gtgaccggct ctgacggcaa gctgtaccac atctacgtgt gcatcgacgg ctgcatcatc 420
atcaagagcg ccaccagatc ctaccagcgg gtgttcagat gggtgcacaa cagactggac 480
tgccctctgt gggtcaccag ctgctga 507
<210> 446
<211> 507
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding BVDV nPro
<400> 446
auggaacuga ucaccaacga gcugcuguac aagaccuaca agcagaaacc cgugggcguc 60
gaggaacccg uguaugauca agcuggcgac ccucuguuug gcgagagagg cgcuguucac 120
ccucagagca cacugaagcu gccccacaag cggggcgaaa gagaugugcc uaccaaccug 180
gccagccugc cuaagagagg cgauugcaga accggcaaua gcagaggccc uguguccggc 240
aucuaccuga aaccuggacc acuguucuac caggacuaca agggccccgu guaccacaga 300
gcaccccugg aacuuuucga agagggcagc augugcgaaa ccaccaagcg gaucggaaga 360
gugaccggcu cugacggcaa gcuguaccac aucuacgugu gcaucgacgg cugcaucauc 420
aucaagagcg ccaccagauc cuaccagcgg guguucagau gggugcacaa cagacuggac 480
ugcccucugu gggucaccag cugcuga 507
<210> 447
<211> 197
<212> PRT
<213> human herpesvirus 2
<400> 447
Met Val Arg Asp Cys Tyr Leu Met Gly Tyr Cys Arg Thr Arg Leu Gly
1 5 10 15
Pro Arg Thr Trp Gly Arg Leu Leu Gln Ile Ser Gly Gly Thr Trp Asp
20 25 30
Val Arg Leu Arg Asn Ala Ile Arg Glu Val Glu Ala His Phe Glu Pro
35 40 45
Ala Ala Glu Pro Val Cys Glu Leu Pro Cys Leu Asn Ala Arg Arg Tyr
50 55 60
Gly Pro Glu Cys Asp Val Gly Asn Leu Glu Thr Asn Gly Gly Ser Thr
65 70 75 80
Ser Asp Asp Glu Ile Ser Asp Ala Thr Asp Ser Asp Asp Thr Leu Ala
85 90 95
Ser His Ser Asp Thr Glu Gly Gly Pro Ser Pro Ala Gly Arg Glu Asn
100 105 110
Pro Glu Ser Ala Ser Gly Gly Ala Ile Ala Ala Arg Leu Glu Cys Glu
115 120 125
Phe Gly Thr Phe Asp Trp Thr Ser Glu Glu Gly Ser Gln Pro Trp Leu
130 135 140
Ser Ala Val Val Ala Asp Thr Ser Ser Ala Glu Arg Ser Gly Leu Pro
145 150 155 160
Ala Pro Gly Ala Cys Arg Ala Thr Glu Ala Pro Glu Arg Glu Asp Gly
165 170 175
Cys Arg Lys Met Arg Phe Pro Ala Ala Cys Pro Tyr Pro Cys Gly His
180 185 190
Thr Phe Leu Arg Pro
195
<210> 448
<211> 591
<212> DNA
<213> human herpesvirus 2
<400> 448
atggtgcgag actgctacct catgggctac tgccggaccc gcctggggcc gcgcacgtgg 60
ggccgcctgc tgcagatctc gggcggaacc tgggacgtgc gcctgcgaaa cgcaatccgg 120
gaggtcgagg cgcattttga acccgccgcc gagcccgtgt gcgagctgcc ctgtctgaac 180
gccaggcgtt acggccccga gtgtgatgtt ggcaatctcg agaccaacgg cggctcgacg 240
agcgatgatg agatatcgga tgcgacggac tcggacgata ccctcgcgtc ccattccgac 300
acggaggggg ggccctcccc ggccggccgg gagaacccgg aatccgcgtc cggcggggct 360
atcgcggctc ggctggagtg tgagtttggg acgtttgact ggacgtccga ggagggctcc 420
cagccctggc tgtccgcggt ggtcgccgat accagctccg ccgaacgctc tggcctaccc 480
gccccgggcg cgtgtcgcgc aacggaagcc ccagaacgcg aggacgggtg ccgaaaaatg 540
cgcttccccg ccgcctgccc ctatccctgc ggccacacat ttctccggcc a 591
<210> 449
<211> 591
<212> RNA
<213> human herpesvirus 2
<400> 449
auggugcgag acugcuaccu caugggcuac ugccggaccc gccuggggcc gcgcacgugg 60
ggccgccugc ugcagaucuc gggcggaacc ugggacgugc gccugcgaaa cgcaauccgg 120
gaggucgagg cgcauuuuga acccgccgcc gagcccgugu gcgagcugcc cugucugaac 180
gccaggcguu acggccccga gugugauguu ggcaaucucg agaccaacgg cggcucgacg 240
agcgaugaug agauaucgga ugcgacggac ucggacgaua cccucgcguc ccauuccgac 300
acggaggggg ggcccucccc ggccggccgg gagaacccgg aauccgcguc cggcggggcu 360
aucgcggcuc ggcuggagug ugaguuuggg acguuugacu ggacguccga ggagggcucc 420
cagcccuggc uguccgcggu ggucgccgau accagcuccg ccgaacgcuc uggccuaccc 480
gccccgggcg cgugucgcgc aacggaagcc ccagaacgcg aggacgggug ccgaaaaaug 540
cgcuuccccg ccgccugccc cuaucccugc ggccacacau uucuccggcc a 591
<210> 450
<211> 594
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding HSV US1
<400> 450
atggtccgag actgctacct gatgggctac tgcagaacca gactgggccc tagaacatgg 60
ggcagactgc tgcagatctc tggcggcaca tgggatgtgc ggctgagaaa cgccatcaga 120
gaggtggaag cccacttcga gcctgccgct gaacctgtgt gtgaactgcc ctgtctgaac 180
gctagaagat acggccctga gtgcgacgtg ggcaacctgg aaacaaatgg cggcagcacc 240
agcgacgacg agatctctga tgccaccgac agcgacgata cactggccag ccacagcgat 300
acagaaggcg gaccatctcc tgccggaaga gagaatcctg agtctgcctc tggcggagct 360
atcgccgcta gactggaatg cgagttcggc accttcgact ggacaagcga ggaaggctct 420
cagccttggc tgtctgctgt ggtggccgat acaagcagcg ccgaaagatc tggacttcct 480
gctcctggcg cctgcagagc tacagaagct cctgaaagag aggacggctg cagaaagatg 540
cggttccctg ccgcctgtcc ttatccttgc ggccacacat ttctgcggcc ctga 594
<210> 451
<211> 594
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding HSV US1
<400> 451
augguccgag acugcuaccu gaugggcuac ugcagaacca gacugggccc uagaacaugg 60
ggcagacugc ugcagaucuc uggcggcaca ugggaugugc ggcugagaaa cgccaucaga 120
gagguggaag cccacuucga gccugccgcu gaaccugugu gugaacugcc cugucugaac 180
gcuagaagau acggcccuga gugcgacgug ggcaaccugg aaacaaaugg cggcagcacc 240
agcgacgacg agaucucuga ugccaccgac agcgacgaua cacuggccag ccacagcgau 300
acagaaggcg gaccaucucc ugccggaaga gagaauccug agucugccuc uggcggagcu 360
aucgccgcua gacuggaaug cgaguucggc accuucgacu ggacaagcga ggaaggcucu 420
cagccuuggc ugucugcugu gguggccgau acaagcagcg ccgaaagauc uggacuuccu 480
gcuccuggcg ccugcagagc uacagaagcu ccugaaagag aggacggcug cagaaagaug 540
cgguucccug ccgccugucc uuauccuugc ggccacacau uucugcggcc cuga 594
<210> 452
<211> 218
<212> PRT
<213> Middle East Respiratory Syndrome virus
<400> 452
Met Ser Asn Met Thr Gln Leu Thr Glu Ala Gln Ile Ile Ala Ile Ile
1 5 10 15
Lys Asp Trp Asn Phe Ala Trp Ser Leu Ile Phe Leu Leu Ile Thr Ile
20 25 30
Val Leu Gln Tyr Gly Tyr Pro Ser Arg Ser Met Thr Val Tyr Val Phe
35 40 45
Lys Met Phe Val Leu Trp Leu Leu Trp Pro Ser Ser Met Ala Leu Ser
50 55 60
Ile Phe Ser Ala Ile Tyr Pro Ile Asp Leu Ala Ser Gln Ile Ile Ser
65 70 75 80
Gly Ile Val Ala Ala Val Ser Ala Met Met Trp Ile Ser Tyr Phe Val
85 90 95
Gln Ser Ile Arg Leu Phe Met Arg Thr Gly Ser Trp Trp Ser Phe Asn
100 105 110
Pro Glu Thr Asn Cys Leu Leu Asn Val Pro Phe Gly Gly Thr Thr Val
115 120 125
Val Arg Pro Leu Val Glu Asp Ser Thr Ser Val Thr Ala Val Val Thr
130 135 140
Asn Gly His Leu Lys Met Ala Gly Met His Phe Gly Ala Cys Asp Tyr
145 150 155 160
Asp Arg Leu Pro Asn Glu Val Thr Val Ala Lys Pro Asn Val Leu Ile
165 170 175
Ala Leu Lys Met Val Lys Arg Gln Ser Tyr Gly Thr Asn Ser Gly Val
180 185 190
Ala Ile Tyr His Arg Tyr Lys Ala Gly Asn Tyr Arg Ser Pro Pro Ile
195 200 205
Thr Ala Asp Ile Glu Leu Ala Leu Leu Arg
210 215
<210> 453
<211> 654
<212> DNA
<213> Middle East Respiratory Syndrome virus
<400> 453
atgtctaata tgacgcaact cactgaggcg cagattattg ccattattaa agactggaac 60
tttgcatggt ccctgatctt tctcttaatt actatcgtac tacagtatgg atacccatcc 120
cgtagtatga ctgtctatgt ctttaaaatg tttgttttat ggctcctatg gccatcttcc 180
atggcgctat caatatttag cgccatttat ccaattgatc tagcttccca gataatctct 240
ggcattgtag cagctgtttc agctatgatg tggatttcct actttgtgca gagtatccgg 300
ctgtttatga gaactggatc atggtggtca ttcaatcctg agactaattg ccttttgaac 360
gttccatttg gtggtacaac tgtcgtacgt ccactcgtag aggactccac cagtgtaact 420
gctgttgtaa ccaatggcca cctcaaaatg gctggcatgc atttcggtgc ttgtgactac 480
gacagacttc ctaatgaagt caccgtggcc aaacccaatg tgctgattgc tttaaaaatg 540
gtgaagcggc aaagctacgg aactaattcc ggcgttgcca tttaccatag atataaggca 600
ggtaattaca ggagtccgcc tattacggcg gatattgaac ttgcattgct tcga 654
<210> 454
<211> 654
<212> RNA
<213> Middle East Respiratory Syndrome virus
<400> 454
augucuaaua ugacgcaacu cacugaggcg cagauuauug ccauuauuaa agacuggaac 60
uuugcauggu cccugaucuu ucucuuaauu acuaucguac uacaguaugg auacccaucc 120
cguaguauga cugucuaugu cuuuaaaaug uuuguuuuau ggcuccuaug gccaucuucc 180
auggcgcuau caauauuuag cgccauuuau ccaauugauc uagcuuccca gauaaucucu 240
ggcauuguag cagcuguuuc agcuaugaug uggauuuccu acuuugugca gaguauccgg 300
cuguuuauga gaacuggauc auggugguca uucaauccug agacuaauug ccuuuugaac 360
guuccauuug gugguacaac ugucguacgu ccacucguag aggacuccac caguguaacu 420
gcuguuguaa ccaauggcca ccucaaaaug gcuggcaugc auuucggugc uugugacuac 480
gacagacuuc cuaaugaagu caccguggcc aaacccaaug ugcugauugc uuuaaaaaug 540
gugaagcggc aaagcuacgg aacuaauucc ggcguugcca uuuaccauag auauaaggca 600
gguaauuaca ggaguccgcc uauuacggcg gauauugaac uugcauugcu ucga 654
<210> 455
<211> 657
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised DNA encoding MERS CoV M
<400> 455
atgagcaaca tgacccagct gacagaggcc cagatcattg ccatcatcaa ggactggaac 60
ttcgcttgga gcctgatctt cctgctgatc accatcgtgc tgcagtacgg ctaccccagc 120
agatccatga ccgtgtacgt gttcaagatg ttcgtcctgt ggctgctgtg gcccagctct 180
atggccctga gcatcttcag cgccatctat cccatcgacc tggccagcca gatcatctct 240
ggaatcgtgg ccgccgtgtc cgccatgatg tggatcagct acttcgtgca gagcatccgg 300
ctgttcatga gaaccggcag ctggtggtcc ttcaatcccg agacaaactg cctgctgaac 360
gtgccctttg gcggcactac agtcgtcaga cccctggtgg aagatagcac ctctgtgacc 420
gccgtggtca ccaatggcca cctgaaaatg gccggcatgc acttcggcgc ctgcgactat 480
gacagactgc ccaacgaagt gaccgtggcc aagcctaatg tgctgatcgc cctgaagatg 540
gtcaagcggc agagctacgg caccaattct ggcgtggcca tctaccacag atacaaggcc 600
ggcaactaca gaagccctcc tatcaccgcc gacatcgagc tggctctgct gagatga 657
<210> 456
<211> 657
<212> RNA
<213> Artificial Sequence
<220>
<223> Codon optimised RNA encoding MERS CoV M
<400> 456
augagcaaca ugacccagcu gacagaggcc cagaucauug ccaucaucaa ggacuggaac 60
uucgcuugga gccugaucuu ccugcugauc accaucgugc ugcaguacgg cuaccccagc 120
agauccauga ccguguacgu guucaagaug uucguccugu ggcugcugug gcccagcucu 180
auggcccuga gcaucuucag cgccaucuau cccaucgacc uggccagcca gaucaucucu 240
ggaaucgugg ccgccguguc cgccaugaug uggaucagcu acuucgugca gagcauccgg 300
cuguucauga gaaccggcag cugguggucc uucaaucccg agacaaacug ccugcugaac 360
gugcccuuug gcggcacuac agucgucaga ccccuggugg aagauagcac cucugugacc 420
gccgugguca ccaauggcca ccugaaaaug gccggcaugc acuucggcgc cugcgacuau 480
gacagacugc ccaacgaagu gaccguggcc aagccuaaug ugcugaucgc ccugaagaug 540
gucaagcggc agagcuacgg caccaauucu ggcguggcca ucuaccacag auacaaggcc 600
ggcaacuaca gaagcccucc uaucaccgcc gacaucgagc uggcucugcu gagauga 657
<210> 457
<211> 712
<212> RNA
<213> Artificial Sequence
<220>
<223> RNA construct
<400> 457
cggagacggc gcagaagaag aggaucuggc gaaggcagag gcagccugcu uacauguggc 60
gacguggaag agaaccccgg accuaugcac cagaaacgga ccgccauguu ccaggauccu 120
caagagaggc ccagaaagcu gccucagcug uguaccgagc ugcagaccac cauccacgac 180
aucauccugg aaugcgugua cugcaagcag cagcuccugc ggagagaggu guacgauuuc 240
gccuuccggg accugugcau cguguacaga gauggcaacc ccuacgccgu gugcgacaag 300
ugccugaagu ucuacagcaa gaucagcgag uaccggcacu acugcuacag ccuguacggc 360
accacacugg aacagcagua caacaagccc cugugcgacc ugcugauccg gugcaucaac 420
ugccagaaac cucugugccc cgaggaaaag cagcggcacc uggacaagaa gcagcgguuc 480
cacaacauca gaggccggug gaccggcaga ugcaugagcu guugucggag cagcagaacc 540
agacgggaaa cccagcugug agcggccgcg aauuggcaag cugcuuacau agaacucgcg 600
gcgauuggca ugccgccuua aaauuuuuau uuuauuuuuc uuuucuuuuc cgaaucggau 660
uuuguuuuua auauuucaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aa 712
<210> 458
<211> 712
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleic acid sequence encoding RNA construct
<400> 458
cggagacggc gcagaagaag aggatctggc gaaggcagag gcagcctgct tacatgtggc 60
gacgtggaag agaaccccgg acctatgcac cagaaacgga ccgccatgtt ccaggatcct 120
caagagaggc ccagaaagct gcctcagctg tgtaccgagc tgcagaccac catccacgac 180
atcatcctgg aatgcgtgta ctgcaagcag cagctcctgc ggagagaggt gtacgatttc 240
gccttccggg acctgtgcat cgtgtacaga gatggcaacc cctacgccgt gtgcgacaag 300
tgcctgaagt tctacagcaa gatcagcgag taccggcact actgctacag cctgtacggc 360
accacactgg aacagcagta caacaagccc ctgtgcgacc tgctgatccg gtgcatcaac 420
tgccagaaac ctctgtgccc cgaggaaaag cagcggcacc tggacaagaa gcagcggttc 480
cacaacatca gaggccggtg gaccggcaga tgcatgagct gttgtcggag cagcagaacc 540
agacgggaaa cccagctgtg agcggccgcg aattggcaag ctgcttacat agaactcgcg 600
gcgattggca tgccgcctta aaatttttat tttatttttc ttttcttttc cgaatcggat 660
tttgttttta atatttcaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aa 712
<210> 459
<211> 2520
<212> DNA
<213> Artificial Sequence
<220>
<223> Recombinant vector
<400> 459
cggagacggc gcagaagaag aggatctggc gaaggcagag gcagcctgct tacatgtggc 60
gacgtggaag agaaccccgg acctatgcac cagaaacgga ccgccatgtt ccaggatcct 120
caagagaggc ccagaaagct gcctcagctg tgtaccgagc tgcagaccac catccacgac 180
atcatcctgg aatgcgtgta ctgcaagcag cagctcctgc ggagagaggt gtacgatttc 240
gccttccggg acctgtgcat cgtgtacaga gatggcaacc cctacgccgt gtgcgacaag 300
tgcctgaagt tctacagcaa gatcagcgag taccggcact actgctacag cctgtacggc 360
accacactgg aacagcagta caacaagccc ctgtgcgacc tgctgatccg gtgcatcaac 420
tgccagaaac ctctgtgccc cgaggaaaag cagcggcacc tggacaagaa gcagcggttc 480
cacaacatca gaggccggtg gaccggcaga tgcatgagct gttgtcggag cagcagaacc 540
agacgggaaa cccagctgtg agcggccgcg aattggcaag ctgcttacat agaactcgcg 600
gcgattggca tgccgcctta aaatttttat tttatttttc ttttcttttc cgaatcggat 660
tttgttttta atatttcaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aacgcgtcga 720
ggggaattaa ttcttgaaga cgaaagggcc aggtggcact tttcggggaa atgtgcgcgg 780
aacccctatt tgtttatttt tctaaataca ttcaaatatg tatccgctca tgagacaata 840
accctgataa atgcttcaat aatattgaaa aaggaagagt atgagtattc aacatttccg 900
tgtcgccctt attccctttt ttgcggcatt ttgccttcct gtttttgctc acccagaaac 960
gctggtgaaa gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt acatcgaact 1020
ggatctcaac agcggtaaga tccttgagag ttttcgcccc gaagaacgtt ttccaatgat 1080
gagcactttt aaagttctgc tatgtggcgc ggtattatcc cgtgttgacg ccgggcaaga 1140
gcaactcggt cgccgcatac actattctca gaatgacttg gttgagtact caccagtcac 1200
agaaaagcat cttacggatg gcatgacagt aagagaatta tgcagtgctg ccataaccat 1260
gagtgataac actgcggcca acttacttct gacaacgatc ggaggaccga aggagctaac 1320
cgcttttttg cacaacatgg gggatcatgt aactcgcctt gatcgttggg aaccggagct 1380
gaatgaagcc ataccaaacg acgagcgtga caccacgatg cctgtagcaa tggcaacaac 1440
gttgcgcaaa ctattaactg gcgaactact tactctagct tcccggcaac aattaataga 1500
ctggatggag gcggataaag ttgcaggacc acttctgcgc tcggcccttc cggctggctg 1560
gtttattgct gataaatctg gagccggtga gcgtgggtct cgcggtatca ttgcagcact 1620
ggggccagat ggtaagccct cccgtatcgt agttatctac acgacgggga gtcaggcaac 1680
tatggatgaa cgaaatagac agatcgctga gataggtgcc tcactgatta agcattggta 1740
actgtcagac caagtttact catatatact ttagattgat ttaaaacttc atttttaatt 1800
taaaaggatc taggtgaaga tcctttttga taatctcatg accaaaatcc cttaacgtga 1860
gttttcgttc cactgagcgt cagaccccgt agaaaagatc aaaggatctt cttgagatcc 1920
tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt 1980
ttgtttgccg gatcaagagc taccaactct ttttccgaag gtaactggct tcagcagagc 2040
gcagatacca aatactgtcc ttctagtgta gccgtagtta ggccaccact tcaagaactc 2100
tgtagcaccg cctacatacc tcgctctgct aatcctgtta ccagtggctg ctgccagtgg 2160
cgataagtcg tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg 2220
gtcgggctga acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga 2280
actgagatac ctacagcgtg agcattgaga aagcgccacg cttcccgaag ggagaaaggc 2340
ggacaggtat ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg 2400
gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg 2460
atttttgtga tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcgagctc 2520
2520
Claims (24)
- (ⅰ) 적어도 하나의 치료 생체분자; 및 (ⅱ) 적어도 하나의 바이러스 선천적 억제제 단백질(IIP);을 암호화하는 RNA 구조체.
- 청구항 1에 있어서,
상기 구조체는 mRNA 분자인 RNA 구조체. - 청구항 1에 있어서,
상기 구조체는 saRNA 분자인 RNA 구조체. - 청구항 1 내지 청구항 3 중 어느 한 항에 있어서,
상기 구조체는 알파바이러스; 피코르나바이러스; 플라비바이러스; 루비바이러스; 페스티바이러스; 헤파시바이러스; 칼리시바이러스 및 코로나바이러스;로 이루어진 속의 군으로부터 선택되는 양성 가닥 RNA 바이러스, 바람직하게는 알파바이러스, 임의적으로는 VEEV를 포함하거나 이로부터 유래되는 RNA 구조체. - 청구항 1 내지 청구항 4 중 어느 한 항에 있어서,
상기 적어도 하나의 선천적 억제제 단백질(IIP)은
(ⅰ) HPV16 E6, 또는 그의 동원체;
(ⅱ) HSV ICP34.5, 또는 그의 동원체;
(ⅲ) HCV E2, 또는 그의 동원체;
(ⅳ) HCV NS5a, 또는 그의 동원체;
(ⅴ) VACV E3L, 또는 그의 동원체;
(ⅵ) VACV K3L, 또는 그의 동원체;
(ⅶ) MERS ORF8B, 또는 그의 동원체;
(ⅷ) KSHV ORF52, 또는 그의 동원체; 및/또는
(ⅸ) 에볼라 VP35, 또는 그의 동원체;인 RNA 구조체. - 청구항 1 내지 청구항 5 중 어느 한 항에 있어서,
상기 적어도 하나의 선천적 억제제 단백질(IIP)은 백시니아 C6, 또는 그의 동원체인 RNA 구조체. - 청구항 1 내지 청구항 6 중 어느 한 항에 있어서,
상기 적어도 하나의 선천적 억제제 단백질(IIP)은 EV71-2Apro, 또는 그의 동원체인 RNA 구조체. - 청구항 1 내지 청구항 7 중 어느 한 항에 있어서,
상기 적어도 하나의 선천적 억제제 단백질(IIP)은 BVDV nPro, 또는 그의 동원체인 RNA 구조체. - 청구항 1 내지 청구항 8 중 어느 한 항에 있어서,
상기 적어도 하나의 선천적 억제제 단백질(IIP)은 HSV Us1, 또는 그의 동원체인 RNA 구조체. - 청구항 1 내지 청구항 9 중 어느 한 항에 있어서,
상기 적어도 하나의 선천적 억제제 단백질(IIP)은 원숭이 바이러스 5(PIV5 비-구조 단백질 V), 또는 그의 동원체인 RNA 구조체. - 청구항 1 내지 청구항 10 중 어느 한 항에 있어서,
상기 적어도 하나의 선천적 억제제 단백질(IIP)은 (i) 야생형 SARS-CoV-2 ORF3b의 ORF3b*57 변이체, 또는 그의 동원체, 또는 (ii) 야생형 SARS-CoV-2 ORF3b의 ORF3b*57 에콰도르 변이체, 또는 그의 동원체인 RNA 구조체. - 청구항 1 내지 청구항 11 중 어느 한 항에 있어서,
상기 적어도 하나의 선천적 억제제 단백질(IIP)은 (i) 야생형 SARS-CoV-2 ORF3b의 ORF3b*57 천산갑 변이체, 또는 그의 동원체, 또는 (ii) 야생형 SARS-CoV-2 ORF3b의 ORF3b*79 변이체, 또는 그의 동원체인 RNA 구조체. - 청구항 1 내지 청구항 12 중 어느 한 항에 있어서,
상기 적어도 하나의 선천적 억제제 단백질(IIP)은 야생형 SARS-CoV-2 ORF3b의 ORF3b*79 천산갑 변이체, 또는 그의 동원체인 RNA 구조체. - 청구항 1 내지 청구항 13 중 어느 한 항에 있어서,
상기 치료 생체분자는 치료 단백질을 포함하고, 바람직하게는 상기 단백질 또는 펩티드는 항원, 보다 바람직하게는 바이러스 항원인 RNA 구조체. - 청구항 1 내지 청구항 14 중 어느 한 항에 따른 RNA 구조체를 암호화하는 핵산 서열.
- 청구항 15에 따른 핵산 서열을 포함하는 발현 카세트.
- 청구항 16에 따른 발현 카세트를 포함하는 재조합 벡터.
- 청구항 1 내지 청구항 14 중 어느 한 항에 따른 RNA 구조체, 청구항 15에 따른 핵산 서열, 청구항 16에 따른 발현 카세트 또는 청구항 17에 따른 벡터, 및 약학적으로 허용가능한 비히클을 포함하는 약학적 조성물.
- 청구항 1 내지 청구항 14 중 어느 한 항에 따른 RNA 구조체의 제조 방법으로서,
상기 방법은
a) ⅰ) 숙주 세포 내로 청구항 17에 따른 벡터를 도입하는 단계; 및
ⅱ) 상기 숙주 세포를 청구항 1 내지 청구항 14 중 어느 한 항에 따른 RNA 구조체의 생산을 야기하는 조건 하에 배양하는 단계; 또는
b) 청구항 17에 따른 벡터로부터 RNA 구조체를 전사하는 단계;를 포함하는 방법. - 약제로서 또는 치료법에 사용하기 위한 청구항 1 내지 청구항 14 중 어느 한 항에 따른 RNA 구조체, 청구항 15에 따른 핵산 서열, 청구항 16에 따른 발현 카세트 또는 청구항 17에 따른 벡터 또는 청구항 18에 따른 약학적 조성물.
- 원생동물, 진균, 박테리아 또는 바이러스 감염의 예방, 개선 또는 치료에 사용하기 위한 청구항 1 내지 청구항 14 중 어느 한 항에 따른 RNA 구조체, 청구항 15에 따른 핵산 서열, 청구항 16에 따른 발현 카세트 또는 청구항 17에 따른 벡터 또는 청구항 18에 따른 약학적 조성물.
- 암의 예방, 개선 또는 치료에 사용하기 위한 청구항 1 내지 청구항 14 중 어느 한 항에 따른 RNA 구조체, 청구항 15에 따른 핵산 서열, 청구항 16에 따른 발현 카세트, 청구항 17에 따른 벡터 또는 청구항 18에 따른 약학적 조성물.
- 청구항 1 내지 청구항 14 중 어느 한 항에 따른 RNA 구조체, 청구항 15에 따른 핵산 서열, 청구항 16에 따른 발현 카세트, 청구항 17에 따른 벡터 또는 청구항 18에 따른 약학적 조성물을 포함하는 백신.
- 대상체에서 면역 반응의 자극에 사용하기 위한 것이고, 임의적으로 상기 면역 반응은 원생동물, 박테리아, 바이러스, 진균 또는 암에 대해 자극되는 것인 청구항 1 내지 청구항 14 중 어느 한 항에 따른 RNA 구조체, 청구항 15에 따른 핵산 서열, 청구항 16에 따른 발현 카세트, 청구항 17에 따른 벡터 또는 청구항 18에 따른 약학적 조성물.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB2020061.4 | 2020-12-17 | ||
GBGB2020061.4A GB202020061D0 (en) | 2020-12-17 | 2020-12-17 | RNA construct |
PCT/GB2021/053362 WO2022129945A1 (en) | 2020-12-17 | 2021-12-17 | Rna construct |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230134487A true KR20230134487A (ko) | 2023-09-21 |
Family
ID=74221314
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237024302A KR20230134487A (ko) | 2020-12-17 | 2021-12-17 | Rna 구조체 |
Country Status (11)
Country | Link |
---|---|
US (1) | US20230364226A1 (ko) |
EP (1) | EP4262855A1 (ko) |
JP (1) | JP2024501085A (ko) |
KR (1) | KR20230134487A (ko) |
CN (1) | CN116847877A (ko) |
BR (1) | BR112023012205A2 (ko) |
CA (1) | CA3205247A1 (ko) |
GB (1) | GB202020061D0 (ko) |
IL (1) | IL303721A (ko) |
MX (1) | MX2023007228A (ko) |
WO (1) | WO2022129945A1 (ko) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110117124A1 (en) * | 2007-08-31 | 2011-05-19 | Sadoff Jerald C | Enhancement of transgene expression from viral-based vaccine vectors by expression of suppressors of the type i interferon response |
WO2017162265A1 (en) | 2016-03-21 | 2017-09-28 | Biontech Rna Pharmaceuticals Gmbh | Trans-replicating rna |
JP2020500536A (ja) * | 2016-12-05 | 2020-01-16 | シンセティック ジェノミクス インコーポレーテッド | 遺伝子発現増強のための組成物および方法 |
GB201908729D0 (en) * | 2019-06-18 | 2019-07-31 | Imp College Innovations Ltd | RNA construct |
GB202004493D0 (en) * | 2020-03-27 | 2020-05-13 | Imp College Innovations Ltd | Coronavirus vaccine |
-
2020
- 2020-12-17 GB GBGB2020061.4A patent/GB202020061D0/en not_active Ceased
-
2021
- 2021-12-17 IL IL303721A patent/IL303721A/en unknown
- 2021-12-17 KR KR1020237024302A patent/KR20230134487A/ko unknown
- 2021-12-17 MX MX2023007228A patent/MX2023007228A/es unknown
- 2021-12-17 CN CN202180094096.0A patent/CN116847877A/zh active Pending
- 2021-12-17 US US18/257,548 patent/US20230364226A1/en active Pending
- 2021-12-17 JP JP2023561928A patent/JP2024501085A/ja active Pending
- 2021-12-17 EP EP21836222.6A patent/EP4262855A1/en active Pending
- 2021-12-17 WO PCT/GB2021/053362 patent/WO2022129945A1/en active Application Filing
- 2021-12-17 BR BR112023012205A patent/BR112023012205A2/pt unknown
- 2021-12-17 CA CA3205247A patent/CA3205247A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
CA3205247A1 (en) | 2022-06-23 |
EP4262855A1 (en) | 2023-10-25 |
WO2022129945A1 (en) | 2022-06-23 |
BR112023012205A2 (pt) | 2023-12-12 |
US20230364226A1 (en) | 2023-11-16 |
GB202020061D0 (en) | 2021-02-03 |
IL303721A (en) | 2023-08-01 |
MX2023007228A (es) | 2023-09-08 |
CN116847877A (zh) | 2023-10-03 |
JP2024501085A (ja) | 2024-01-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2020202369B2 (en) | Isolated polynucleotides and polypeptides, and methods of using same for increasing plant yield and/or agricultural characteristics | |
AU2020204196B2 (en) | Optimal maize loci | |
AU2020203872B2 (en) | Optimal maize loci | |
AU2021200054B2 (en) | Isolated polynucleotides and polypeptides, and methods of using same for increasing yield of plants | |
AU2018203835B2 (en) | Recombinant dna constructs and methods for modulating expression of a target gene | |
AU2020203837B2 (en) | Isolated polynucleotides and polypeptides, and methods of using same for increasing plant yield and/or agricultural characteristics | |
AU2020267286B2 (en) | Isolated polynucleotides and polypeptides, and methods of using same for increasing plant yield and/or agricultural characteristics | |
AU2020204520B2 (en) | Isolated polynucleotides and polypeptides, and methods of using same for increasing plant yield and/or agricultural characteristics | |
AU2020202204B2 (en) | Isolated polynucleotides and polypeptides, and methods of using same for increasing nitrogen use efficiency, yield, growth rate, vigor, biomass, oil content, and/or abiotic stress tolerance | |
AU2020267257C1 (en) | Isolated polynucleotides and polypeptides, and methods of using same for increasing nitrogen use efficiency, yield, growth rate, vigor, biomass, oil content, and/or abiotic stress tolerance | |
AU2019204982B2 (en) | Recombinant HCMV and RhCMV Vectors and Uses Thereof | |
AU2019253901B2 (en) | Isolated polynucleotides and polypeptides, and methods of using same for increasing nitrogen use efficiency of plants | |
AU2023214237A1 (en) | Modified polynucleotides for the production of biologics and proteins associated with human disease | |
AU2023251441A1 (en) | RNA containing composition for treatment of tumor diseases | |
AU2021266196A9 (en) | Isolated polynucleotides and polypeptides, construct and plants comprising same and methods of using same for increasing nitrogen use efficiency of plants | |
AU2021232838A1 (en) | Isolated polynucleotides and polypeptides, and methods of using same for increasing nitrogen use efficiency, yield, growth rate, vigor, biomass, oil content, and/or abiotic stress tolerance | |
AU2021218140A1 (en) | Isolated polynucleotides and polypeptides, and methods of using same for increasing plant yield and/or agricultural characteristics | |
KR20220113442A (ko) | 입자 전달 시스템 | |
RU2729065C2 (ru) | Композиции и способы получения (R)-ретикулина и его предшественников | |
KR20220038669A (ko) | Rna 구조체 | |
KR20170005829A (ko) | 모기 제어를 위한 조성물 및 그의 용도 | |
KR20130117753A (ko) | 포스포케톨라아제를 포함하는 재조합 숙주 세포 | |
AU2017289886A1 (en) | Engineered parasites for delivering protein to the central nervous system (CNS) | |
KR20230134487A (ko) | Rna 구조체 | |
KR101561591B1 (ko) | 지질 분해효소 LipT를 생산하는 신규한 내냉성 슈도모나스 만델리 JR-1 균주 및 그 유전체의 염기서열 |