KR20230134487A - Rna 구조체 - Google Patents

Rna 구조체 Download PDF

Info

Publication number
KR20230134487A
KR20230134487A KR1020237024302A KR20237024302A KR20230134487A KR 20230134487 A KR20230134487 A KR 20230134487A KR 1020237024302 A KR1020237024302 A KR 1020237024302A KR 20237024302 A KR20237024302 A KR 20237024302A KR 20230134487 A KR20230134487 A KR 20230134487A
Authority
KR
South Korea
Prior art keywords
seq
rna
variant
fragment
dna
Prior art date
Application number
KR1020237024302A
Other languages
English (en)
Inventor
마이클 왓슨
Original Assignee
임피리얼 컬리지 이노베이션스 리미티드
백스에쿼티 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 임피리얼 컬리지 이노베이션스 리미티드, 백스에쿼티 리미티드 filed Critical 임피리얼 컬리지 이노베이션스 리미티드
Publication of KR20230134487A publication Critical patent/KR20230134487A/ko

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/39Medicinal preparations containing antigens or antibodies characterised by the immunostimulating additives, e.g. chemical adjuvants
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/0008Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition
    • A61K48/0025Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition wherein the non-active part clearly interacts with the delivered nucleic acid
    • A61K48/0033Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition wherein the non-active part clearly interacts with the delivered nucleic acid the non-active part being non-polymeric
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • A61K2039/53DNA (RNA) vaccination
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/555Medicinal preparations containing antigens or antibodies characterised by a specific combination antigen/adjuvant
    • A61K2039/55511Organic adjuvants
    • A61K2039/55516Proteins; Peptides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/60Medicinal preparations containing antigens or antibodies characteristics by the carrier linked to the antigen
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/16011Herpesviridae
    • C12N2710/16022New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/24011Poxviridae
    • C12N2710/24111Orthopoxvirus, e.g. vaccinia virus, variola
    • C12N2710/24122New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20022New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/24011Flaviviridae
    • C12N2770/24022New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/32011Picornaviridae
    • C12N2770/32022New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/36011Togaviridae
    • C12N2770/36111Alphavirus, e.g. Sindbis virus, VEE, EEE, WEE, Semliki
    • C12N2770/36121Viruses as such, e.g. new isolates, mutants or their genomic sequences
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/36011Togaviridae
    • C12N2770/36111Alphavirus, e.g. Sindbis virus, VEE, EEE, WEE, Semliki
    • C12N2770/36122New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/36011Togaviridae
    • C12N2770/36111Alphavirus, e.g. Sindbis virus, VEE, EEE, WEE, Semliki
    • C12N2770/36134Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Epidemiology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mycology (AREA)
  • Immunology (AREA)
  • Virology (AREA)
  • Plant Pathology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Communicable Diseases (AREA)
  • Oncology (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

본 발명은 RNA 구조체에 관한 것이며, 특히, 배타적인 것은 아니지만, mRNA 구조체 및 saRNA 레플리콘, 및 이러한 RNA 구조체를 암호화하는 핵산 및 발현 벡터에 관한 것이다. 본 발명은 이러한 RNA 구조체를 치료법에, 예를 들면 질환의 치료 및/또는 백신 운반에 사용하는 용도로 확장된다. 본 발명은 이러한 RNA 구조체를 포함하는 약학적 조성물, 및 그의 방법 및 용도로 확장된다.

Description

RNA 구조체
본 발명은 RNA 구조체(construct)에 관한 것이며, 특히, 배타적인 것은 아니지만, mRNA 구조체 및 saRNA 레플리콘(replicon), 및 이러한 RNA 구조체를 암호화하는 핵산 및 발현 벡터(expression vector)에 관한 것이다. 본 발명은 이러한 RNA 구조체를 치료법에, 예를 들면 질환의 치료 및/또는 백신 운반에 사용하는 용도로 확장된다. 본 발명은 이러한 RNA 구조체를 포함하는 약학적 조성물, 및 그의 방법 및 용도로 확장된다.
메신저 RNA(mRNA)는 생물치료제(biotherapeutics)를 위한 유망한 도구이다. 그러나, mRNA 치료제는 소동물에서 매우 효과적인 것으로 나타났지만, 그 결과는 상기 제형이 인간에서 용량-증량 연구로 번역될 때 선형으로 규모가 커지지는 않는다. 아울러, 인터페론 반응의 유도와 연관된 부작용은 증가된 용량의 RNA가 인간에서 효과적일 가능성과 관련한 속도-제한요인(rate-limiting)인 것으로 나타나 있다. 이러한 불일치의 이유는 명확하지 않지만, 본 발명자들은 인간 선천적 감지(innate sensing)에서의 내재하는 차이가 실험실로부터 임상으로 RNA 치료제를 번역하기 위한 장애물을 제공한다는 가설을 세운다. 아울러, RNA의 선천적 감지는 단백질 발현의 억제와 연관된다. 지금까지, 외인성(exogenous) RNA의 선천적 인식을 극복하기 위한 주된 접근법은 선천적 감지 메커니즘에 의해 검출이 덜되는 변형된 리보뉴클레오티드를 사용하는 것이다. 그러나, 변형된 mRNA는 완전히 검출불가능하지는 않으며, 인간에게 사용할 때 여전히 인터페론 생산의 일부 유도, 단백질 사일런싱(silencing) 및 감소된 내약성(tolerability)을 야기한다(도 2 참조).
다른 접근법은 전형적으로 그 비-구조 단백질 내에 폴리머라아제(polymerase) 활성을 암호화함으로써 그 자신의 RNA를 자가-증폭하는 능력을 갖고 있는 알파바이러스 백본(alphavirus backbone)에 기반하는 자가-증폭형(self-amplifying) 또는 saRNA 벡터를 이용하는 것이다. 종래 기술의 방법은 상기 벡터의 구조 단백질을, 예를 들면 관심있는 항원을 암호화하는 관심있는 유전자(GOI)로 교체하여 이를 백신 구조체로 하거나, 치료 단백질을 암호화하는 것을 수반한다. 다른 버전의 saRNA는 피코르나바이러스(picornavirus), 플라비바이러스(flavivirus), 및 코로나바이러스(coronavirus)에 기반한다. saRNA가 표적 세포의 세포질 내로 들어갈 때, 이것은 상기 암호화된 폴리머라아제 기구(machinery)에 의한 RNA의 증폭 및 GOI의 매우 높은 발현 레벨(level)을 유도한다. 결과적으로, saRNA는 mRNA보다 낮은(10 내지 100배 낮은) 용량의 saRNA로 면역 반응을 유도하는 것으로 나타났고, 마우스에서 최대 60일까지 연장된 단백질 발현을 야기한다.
그러나, 도 3에 나타낸 것과 같이, saRNA를 이용하는 결점은 이것은 또한 선천적 감지 패턴 인식 수용체에 의해 감지되어 상기 종래 기술의 saRNA의 단백질 발현 및 자가-증폭을 제한하는 항-바이러스(인터페론) 반응을 촉발하게 된다는 것이다. saRNA의 선천적 감지는 그 큰 크기(전형적으로 >5,000 염기) 및 이중 가닥 영역(dsRNA)을 포함하는 고도한 2차 구조로 인해 mRNA의 경우와 상이하다. 길고 이중 가닥인 RNA는 다른 센서들 중에서도 DA5(흑색종 분화-연관 단백질 5) 경로를 통해 선천적 반응을 촉발한다. 이것은 길고 dsRNA인 RNA에 대한 PACT(PKR 활성화 단백질)의 결합에 의해 MDA5의 올리고머화(oligomerization)를 촉진하고, 이어서 saRNA의 복제 및 발현을 억제하는 하류의 신호전달 캐스케이드(cascade)를 촉발함으로써 용이하게 된다.
따라서, 본 기술분야에는 RNA 치료제가 mRNA- 또는 saRNA 기반이고, 환자에게 운반 및 발현되어 선천적 면역 시스템 감지를 극복할 수 있는 새로운 수단을 생성하기 위한 필요성이 있다.
본 발명자들은 면역 시스템 기구의 활성을 차단 또는 감소시키는 바이러스 면역 억제제 단백질을 발현함으로써 RNA를 감지하는 선천적 면역 시스템을 유리하게 극복하고, 숙주 세포에서 개선된 번역(mRNA의 경우) 및 증가된 자가-증폭 및 이후의 번역(saRNA 시스템의 경우)과, 이에 따른 관심있는 유전자, 예컨대 항원의 더 큰 단백질 발현 레벨을 야기하는 신규한 RNA 구조체(saRNA 및 mRNA)를 개발하였다.
따라서, 본 발명의 제1 측면에서, (ⅰ) 적어도 하나의 치료 생체분자(biomolecule); 및 (ⅱ) 적어도 하나의 바이러스 선천적 억제제 단백질(innate inhibitor protein, IIP);을 암호화하는 RNA 구조체가 제공된다.
RNA 구조체, 예컨대 mRNA 및 saRNA 레플리콘은 백신 및 치료제에 대한 관심있는 유전자의 운반 및 발현을 위한 잠재적인 도구로 상정되어 왔다. 그러나, 단일 가닥 mRNA(ssRNA) 및 이중 가닥 RNA(dsRNA)는 단백질 번역을 억제하는 반응을 촉발하는 선천적 감지 메커니즘에 의해 세포내에서 검출된다. 결과적으로, RNA 구조체에 의해 암호화되는 관심있는 유전자의 발현은 현저하게 손상되고, 따라서 saRNA 및 mRNA를 포함하는 RNA 구조체의 면역원성 또는 치료 잠재력은 제한된다. 유리하게는, 본 발명의 RNA 구조체는 숙주 세포 내에서 전이유전자(transgene) 발현의 하류 선천적 억제를 감소시키거나 제거하는 하나 이상의 바이러스 선천적 억제제 단백질(IIP)을 암호화하기 때문에 이러한 문제점을 극복한다.
인터페론의 유도는 선천적 인식의 하류 결과 중 하나이지만, 아래에 논의된 것과 같이, 다른 분자 및 경로가 유도되거나 유도될 수 있고, 이들 중 임의의 것은 RNA 구조체가 갖고 있는 하나 이상의 바이러스 선천적 면역 억제제 단백질에 의해 억제될 것임이 인식될 것이다. 따라서, 바람직하게는 적어도 하나의 선천적 억제제 단백질(IIP)은 본 발명의 RNA 구조체로 처리된 대상체에서 RNA에 대한 선천적 면역 반응을 억제할 수 있다. 따라서, 상기 IIP는 선천적 면역의 억제제로서 기술될 수 있다. 이것은 또한 일부 구현예에서 인터페론 억제 분자로 기술될 수 있다.
saRNA를 이용해 인터페론 반응을 제거하는 이전에 공개된 한 접근법은 백시니아(vaccinia) 바이러스 유래의 인터페론 억제 단백질인 E3, K3 및 B18을 이용하였다. 그러나, 상기 연구에서, 인터페론 억제 단백질은 saRNA와 조합된 별도의 mRNA 분자로서 운반 및 제형화되었다. 이것은 saRNA 및 mRNA 모두의 제조를 필요로 하고, 단백질 발현에서 임의의 관찰가능한 향상을 제공하기 위하여 본 발명에 따른 saRNA 레플리콘 구조체보다 적어도 3-6배 더 많은 백시니아 mRNA를 사용하는 것을 필요하게 하였다.
유리하게는, 제1 측면의 RNA 구조체에서, 하나 이상의 바이러스 선천적 억제제 단백질의 존재는 생물치료제 분자, 즉 관심있는 펩티드 또는 단백질을 이용한 이중 단백질 발현을 가능하게 한다. 종래 기술에서 기술된 것과 같이 하나는 관심있는 펩티드/단백질을 암호화하고 하나는 선천적 조절 단백질을 암호화하는 2개의 상이한 가닥의 RNA를 운반하는 것과 대조적으로, 본 발명의 RNA 구조체를 이용할 때 단지 하나의 단일 가닥만이 표적 세포로 운반되고, 이로 인해 RNA 분자 및 바이러스 면역 억제제 단백질의 동시국소화(colocalization)를 보장한다. 상기 바이러스 면역 억제제 단백질은 숙주 세포에서 RNA의 선천적 감지를 억제하고, 이로 인해 더 높은 단백질 발현 및 번역을 가능하게 하며, 상기 바이러스 면역 억제제 단백질의 발현 자체는 치료 생체분자와 동일한 RNA 분자로부터 공동-발현 및 번역된다.
실시예에 기술된 것과 같이, (GOI로서) ("스틸티콘(Stealthicon)"으로도 알려져 있는) 루시퍼라아제(luciferase) 또는 VEGF-A를 암호화하는 본 발명의 RNA 구조체는 놀랍게도 온전한 선천적 감지 시스템을 갖는 인간 세포주에서 시험관내 루시퍼라아제 또는 VEGF-A 단백질 발현 레벨을 최대 12배까지 증가시키는 것으로 나타났다. 상기 RNA 구조체는 본 발명의 RNA 분자가 갖고 있는 유전자를 발현할 수 있는 것으로 판명되었기 때문에, 숙련된 기술자는 루시퍼라아제 리포터(reporter)가 치료 생체분자를 정확히 대표함을 용이하게 인식할 것이다. 이와 같이, 상기 루시퍼라아제는 본 발명의 RNA 구조체가 임의의 치료적으로 활성인 생체분자를 발현하기 위해 사용될 수 있다는 개념 증명(proof of concept)의 강력한 증거를 제공한다. 또한, VEGF-A(도 11 참조)는 GOI로서 루시퍼라아제에 대한 대안적 예를 나타낸다.
제1 측면의 RNA 구조체는 단일 가닥 RNA 또는 이중 가닥 RNA일 수 있다.
상기 RNA 구조체는 mRNA 분자 또는 saRNA 분자를 포함할 수 있다.
한 구현예에서, 상기 RNA 구조체는 mRNA를 포함한다. 도 1(오른쪽)은 mRNA 분자로서 RNA 구조체의 다양한 구현예를 실증한다.
그러나, 바람직한 구현예에서, 상기 RNA 구조체는 자가-증폭형 RNA(saRNA)를 포함한다. 도 1(왼쪽)은 saRNA 분자로서 RNA 구조체의 다양한 구현예를 실증한다. 숙련된 기술자는 이러한 RNA 구조체가 또한 자가-복제(self-replicating) RNA 바이러스 벡터, 또는 RNA 레플리콘으로 나타낼 수 있음을 이해할 것이다.
바람직하게는, 상기 saRNA 구조체는 알파바이러스; 피코르나바이러스; 플라비바이러스; 루비바이러스(rubivirus); 페스티바이러스(pestivirus); 헤파시바이러스(hepacivirus); 칼리시바이러스(calicivirus); 및 코로나바이러스;로 이루어진 속(genus)의 군으로부터 선택되는 양성 가닥(positive stranded) RNA 바이러스를 포함하거나 이로부터 유래된다.
바람직하게는, 상기 RNA 구조체는 알파바이러스를 포함하거나 이로부터 유래된다. 적합한 야생형 알파바이러스 서열은 잘 알려져 있다. 적합한 알파바이러스의 대표적인 예는 아우라(Aura), 베바루(Bebaru) 바이러스, 카바소우(Cabassou), 치쿤군야(Chikungunya) 바이러스, 동부 말 뇌척수염 바이러스, 포트 모건(Fort Morgan), 게타(Getah) 바이러스, 키질라가치(Kyzylagach), 마야로(Mayaro), 마야로 바이러스, 미들버그(Middleburg), 무캄보(Mucambo) 바이러스, 은두무(Ndumu), 픽수나(Pixuna) 바이러스, 로스 리버(Ross River) 바이러스, 셈리키 포레스트(Semliki Forest), 신드비스(Sindbis) 바이러스, 토나테(Tonate), 트리니티(Triniti), 우나(Una), 베네주엘라 말 뇌척수염, 서부 말 뇌척수염, 와타로아(Whataroa Whataroa), 및 Y-62-33을 포함한다. 따라서, 바람직하게는 상기 RNA 구조체는 임의의 상기 알파바이러스를 포함하거나 이로부터 유래된다.
바람직하게는, 상기 RNA 구조체는 베네주엘라 말 뇌염 바이러스(VEEV); 엔테로바이러스(enterovirus) 71; 뇌심근염 바이러스; 쿤진(Kunjin) 바이러스; 및 중동 호흡기 증후군 바이러스;로 이루어진 종의 군으로부터 선택되는 바이러스를 포함하거나 이로부터 유래된다. 한 바람직한 구현예에서, 상기 RNA 구조체는 쿤진 바이러스를 포함하거나 이로부터 유래된다. 바람직하게는, 상기 RNA 구조체는 VEEV로부터 유래된다.
바람직하게는, 상기 RNA 구조체는 RNA에 대한 선천적 면역 반응을 감소, 제거, 또는 차단할 수 있는 적어도 하나의 선천적 억제제 단백질(IIP)을 암호화하는 뉴클레오티드 서열을 포함한다. 따라서, 상기 IIP는 선천적 면역의 억제제이고, 따라서 바이러스 선천적 면역 억제제 단백질로 기술될 수 있다. 상기 IIP는 또한 인터페론 신호전달의 억제제일 수 있다.
해당 RNA 분자(즉, 비-내인성으로 생산된 RNA)로 형질전환된 숙주 세포에서 RNA에 대한 선천적 면역 반응의 감소, 제거, 또는 차단은 선천적 신호전달 경로를 억제하고, 및/또는 RNA 인식을 억제하는 IIP 조절성 인터페론 생산에 의해 달성될 수 있다. 인터페론 생산의 조절은 선천적 신호전달의 억제로서 기술될 수 있음이 인식될 것이다. 따라서, 선천적 감지 및 선천적 신호전달 시스템은 (a) RNA 인식 시스템, (b) 인터페론 생산을 유도하고 인터페론-자극 유전자의 자극을 야기하는 경로, 및 (c) 인터페론 신호전달 시스템을 포함한다.
따라서, 상기 IIP는 다음의 4가지 넓은 카테고리 중 하나에 속할 수 있다:
(ⅰ) 카테고리 1: 인터페론 조절 인자 활성의 억제제;
(ⅱ) 카테고리 2: 인터페론 생산을 유도하고 인터페론-자극 유전자의 자극을 야기하는 경로의 억제제;
(ⅲ) 카테고리 3: 인터페론 신호전달의 억제제; 및/또는
(ⅳ) 카테고리 4: RNA 인식 시스템의 억제제.
일부 IIP는 다수의 작용을 가질 수 있음이 인식될 것이다. 예를 들어, 카테고리 4의 IIP는 또한 카테고리 2의 IIP(예컨대, IRF3, IRF7) 및 카테고리 3의 IIP(예컨대, IRF9)로 분류될 수 있다.
한 구현예에서, RNA에 대한 선천적 면역 반응의 감소, 제거, 또는 차단은 바람직하게는 다양한 항-바이러스 유전자(예컨대, RNA 발현을 저해하는 것으로 알려진 IFIT1-3, Mx1, Mx2), 그 생성물이 선천적 면역 반응을 조직하는 전염증성(proinflammatory) 유전자, 및 임의의 인터페론 의존성 캐스케이드 상류의 정규적(canonically) IFN-자극 유전자(ISG)의 직접적인 활성화를 직접 촉발하는 인터페론 조절 인자 3 및 7(IRF3 및 IRF7) 및 NF-κB 전사 인자의 활성화를 유도하는 패턴 인식 수용체에 의한 세포기질 RNA의 인식을 감소 또는 방지함으로써 IIP에 의해 달성된다. 상기 경로는 많은 항-바이러스 반응을 추가로 증폭하는 양성 피드백 루프(feedback loop)를 제공하는 타입 I & III 인터페론을 유도함으로써 향상될 수 있다.
적어도 하나의 IIP는 헤르페스 심플렉스 바이러스(herpes simplex virus)로부터 유래될 수 있다. 상기 IIP는 간염 바이러스, 임의적으로 C형 간염 바이러스로부터 유래될 수 있다. 상기 IIP는 백시니아 바이러스로부터 유래될 수 있다. 상기 IIP는 코로나바이러스, 임의적으로 중동 호흡기 증후군(MERS) 바이러스 또는 중증 급성 호흡기 증후군(SARS) 바이러스로부터 유래될 수 있다. 상기 SARS 바이러스는 SARS-Cov 또는 SARS-CoV-2일 수 있다. 상기 IIP는 카포시 육종(Kaposi's sarcoma)-연관 헤르페스바이러스(KSHV)로부터 유래될 수 있다. 상기 IIP는 에볼라 바이러스(Ebola virus)로부터 유래될 수 있다.
적어도 하나의 선천적 억제제 단백질(IIP)은 HPV16 E6; HSV ICP34.5; HCV E2; HCV NS5a; VACV E3L; VACV K3L; MERS ORF8B; KSHV ORF52; EBOV VP35; SARS-2 ORF3b 및 VACV C6; 또는 그의 동원체(orthologue)로 이루어진 바이러스 IIP의 군으로부터 선택될 수 있다. 상기 IIP는 IFN 생산을 유도하는 선천적 신호전달 시스템의 억제를 일으킬 수 있음이 인식될 것이다.
한 구현예에서, 적어도 하나의 IIP는 HPV16 E6(인간 파필로마바이러스 E6; NP_041325.1; 접근 번호 - NCBI 참조 서열: NC_001526.4; UniProtKB - P03126(VE6_HPV16)), 또는 그의 동원체일 수 있다. 상기 단백질은 PKR, IRF3 및 IRF9를 포함하는 선천적 신호전달 캐스케이드 내의 다수의 단백질에 대해 작용함으로써 세포의 항-바이러스 상태의 확립을 방지하는 것으로 여겨진다. [Warren CJ, Pyeon D. (2017). Evasion of host immune defenses by human papillomavirus. Virus Res. 2017 231, 21-33. doi: 10.1016/j.virusres.2016.11.023]; [Noguchi T, Satoh S, Noshi T, Hatada E, Fukuda R, Kawai A, Ikeda S, Hijikata M, Shimotohno K (2001). Effects of Mutation in Hepatitis C Virus Nonstructural Protein 5A on Interferon Resistance Mediated by Inhibition of PKR Kinase Activity in Mammalian Cells. Microbiol. Immunol., 45, 829-840. doi: 10.1111/j.1348-0421.2001.tb01322.x.].
상기 HPV16 E6 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 1로 나타낸다:
MHQKRTAMFQDPQERPRKLPQLCTELQTTIHDIILECVYCKQQLLRREVYDFAFRDLCIVYRDGNPYAVCDKCLKFYSKISEYRHYCYSLYGTTLEQQYNKPLCDLLIRCINCQKPLCPEEKQRHLDKKQRFHNIRGRWTGRCMSCCRSSRTRRETQL [서열번호 1]
따라서, 바람직하게는 제1 측면의 RNA 구조체는 서열번호 1에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 HPV16 E6 폴리펩티드는 다음과 같은 서열번호 2의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGCACCAAAAGAGAACTGCAATGTTTCAGGACCCACAGGAGCGACCCAGAAAGTTACCACAGTTATGCACAGAGCTGCAAACAACTATACATGATATAATATTAGAATGTGTGTACTGCAAGCAACAGTTACTGCGACGTGAGGTATATGACTTTGCTTTTCGGGATTTATGCATAGTATATAGAGATGGGAATCCATATGCTGTATGTGATAAATGTTTAAAGTTTTATTCTAAAATTAGTGAGTATAGACATTATTGTTATAGTTTGTATGGAACAACATTAGAACAGCAATACAACAAACCGTTGTGTGATTTGTTAATTAGGTGTATTAACTGTCAAAAGCCACTGTGTCCTGAAGAAAAGCAAAGACATCTGGACAAAAAGCAAAGATTCCATAATATAAGGGGTCGGTGGACCGGTCGATGTATGTCTTGTTGCAGATCATCAAGAACACGTAGAGAAACCCAGCTG [서열번호 2]
따라서, 바람직하게는 상기 HPV16 E6 폴리펩티드는 실질적으로 서열번호 2에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 상기 RNA 구조체는 다음과 같은 서열번호 3의 RNA 뉴클레오티드 서열을 포함할 수 있다:
AUGCACCAAAAGAGAACUGCAAUGUUUCAGGACCCACAGGAGCGACCCAGAAAGUUACCACAGUUAUGCACAGAGCUGCAAACAACUAUACAUGAUAUAAUAUUAGAAUGUGUGUACUGCAAGCAACAGUUACUGCGACGUGAGGUAUAUGACUUUGCUUUUCGGGAUUUAUGCAUAGUAUAUAGAGAUGGGAAUCCAUAUGCUGUAUGUGAUAAAUGUUUAAAGUUUUAUUCUAAAAUUAGUGAGUAUAGACAUUAUUGUUAUAGUUUGUAUGGAACAACAUUAGAACAGCAAUACAACAAACCGUUGUGUGAUUUGUUAAUUAGGUGUAUUAACUGUCAAAAGCCACUGUGUCCUGAAGAAAAGCAAAGACAUCUGGACAAAAAGCAAAGAUUCCAUAAUAUAAGGGGUCGGUGGACCGGUCGAUGUAUGUCUUGUUGCAGAUCAUCAAGAACACGUAGAGAAACCCAGCUG [서열번호 3]
아울러, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 3에 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
따라서, 본 발명자들은 서열번호 1의 단백질 서열에 인간 발현을 위한 코돈 최적화(codon optimisation)를 하였고, 개시(ATG) 및 종결(TGA) 코돈을 포함하는 코돈 최적화된 핵산(DNA) 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 4로 제공된다:
ATGCACCAGAAACGGACCGCCATGTTCCAGGATCCTCAAGAGAGGCCCAGAAAGCTGCCTCAGCTGTGTACCGAGCTGCAGACCACCATCCACGACATCATCCTGGAATGCGTGTACTGCAAGCAGCAGCTCCTGCGGAGAGAGGTGTACGATTTCGCCTTCCGGGACCTGTGCATCGTGTACAGAGATGGCAACCCCTACGCCGTGTGCGACAAGTGCCTGAAGTTCTACAGCAAGATCAGCGAGTACCGGCACTACTGCTACAGCCTGTACGGCACCACACTGGAACAGCAGTACAACAAGCCCCTGTGCGACCTGCTGATCCGGTGCATCAACTGCCAGAAACCTCTGTGCCCCGAGGAAAAGCAGCGGCACCTGGACAAGAAGCAGCGGTTCCACAACATCAGAGGCCGGTGGACCGGCAGATGCATGAGCTGTTGTCGGAGCAGCAGAACCAGACGGGAAACCCAGCTGTGA [서열번호 4]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 4에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 개시(AUG) 및 종결(UGA) 코돈을 포함하는 서열번호 4의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 5로 제공된다:
AUGCACCAGAAACGGACCGCCAUGUUCCAGGAUCCUCAAGAGAGGCCCAGAAAGCUGCCUCAGCUGUGUACCGAGCUGCAGACCACCAUCCACGACAUCAUCCUGGAAUGCGUGUACUGCAAGCAGCAGCUCCUGCGGAGAGAGGUGUACGAUUUCGCCUUCCGGGACCUGUGCAUCGUGUACAGAGAUGGCAACCCCUACGCCGUGUGCGACAAGUGCCUGAAGUUCUACAGCAAGAUCAGCGAGUACCGGCACUACUGCUACAGCCUGUACGGCACCACACUGGAACAGCAGUACAACAAGCCCCUGUGCGACCUGCUGAUCCGGUGCAUCAACUGCCAGAAACCUCUGUGCCCCGAGGAAAAGCAGCGGCACCUGGACAAGAAGCAGCGGUUCCACAACAUCAGAGGCCGGUGGACCGGCAGAUGCAUGAGCUGUUGUCGGAGCAGCAGAACCAGACGGGAAACCCAGCUGUGA [서열번호 5]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 5에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 HSV ICP34.5(헤르페스 심플렉스 바이러스 ICP34.5; YP_009137073.1; 접근 번호 - NCBI 참조 서열: NC_001806.2; UniProtKB - P36313(ICP34_HHV11)), 또는 그의 동원체일 수 있다. HSV ICP34.5는 TBK1을 격리하고 TBK1 및 IRF3 사이의 상호작용을 간섭하여, 최종적으로 IRF3의 불활성화를 유도하는 것으로 나타났다. [Zhu H, Zheng C (2020). The race between host antiviral innate immunity and the immune evasion strategies of Herpes simplex virus 1. Microbiol Mol Biol Rev., 84(4): e00099-20]. 상기 HSV ICP34.5 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 6으로 나타낸다:
MARRRRHRGPRRPRPPGPTGAVPTAQSQVTSTPNSEPAVRSAPAAAPPPPPAGGPPPSCSLLLRQWLHVPESASDDDDDDDWPDSPPPEPAPEARPTAAAPRPRPPPPGVGPGGGADPSHPPSRPFRLPPRLALRLRVTAEHLARLRLRRAGGEGAPEPPATPATPATPATPATPARVRFSPHVRVRHLVVWASAARLARRGSWARERADRARFRRRVAEAEAVIGPCLGPEARARALARGAGPANSV [서열번호 6]
따라서, 바람직하게는 제1 측면의 RNA 구조체는 실질적으로 서열번호 6에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 HSV ICP34.5 폴리펩티드는 다음과 같은 서열번호 7의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGCCCGCCGCCGCCGCCATCGCGGCCCCCGCCGCCCCCGGCCGCCCGGGCCCACGGGCGCCGTCCCAACCGCACAGTCCCAGGTAACCTCCACGCCCAACTCGGAACCCGCGGTCAGGAGCGCGCCCGCGGCCGCCCCGCCGCCGCCCCCCGCCGGTGGGCCCCCGCCTTCTTGTTCGCTGCTGCTGCGCCAGTGGCTCCACGTTCCCGAGTCCGCGTCCGACGACGACGATGACGACGACTGGCCGGACAGCCCCCCGCCCGAGCCGGCGCCAGAGGCCCGGCCCACCGCCGCCGCCCCCCGGCCCCGGCCCCCACCGCCCGGCGTGGGCCCGGGGGGCGGGGCTGACCCCTCCCACCCCCCCTCGCGCCCCTTCCGCCTTCCGCCGCGCCTCGCCCTCCGCCTGCGCGTCACCGCGGAGCACCTGGCGCGCCTGCGCCTGCGACGCGCGGGCGGGGAGGGGGCGCCGGAGCCCCCCGCGACCCCCGCGACCCCCGCGACCCCCGCGACCCCCGCGACCCCCGCGCGGGTGCGCTTCTCGCCCCACGTCCGGGTGCGCCACCTGGTGGTCTGGGCCTCGGCCGCCCGCCTGGCGCGCCGCGGCTCGTGGGCCCGCGAGCGGGCCGACCGGGCTCGGTTCCGGCGCCGGGTGGCGGAGGCCGAGGCGGTCATCGGGCCGTGCCTGGGGCCCGAGGCCCGTGCCCGGGCCCTGGCCCGCGGAGCCGGCCCGGCGAACTCGGTC [서열번호 7]
따라서, 바람직하게는 상기 HSV ICP34.5 폴리펩티드는 실질적으로 서열번호 7에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 상기 RNA 구조체는 다음과 같은 서열번호 8의 RNA 뉴클레오티드 서열을 포함할 수 있다:
AUGGCCCGCCGCCGCCGCCAUCGCGGCCCCCGCCGCCCCCGGCCGCCCGGGCCCACGGGCGCCGUCCCAACCGCACAGUCCCAGGUAACCUCCACGCCCAACUCGGAACCCGCGGUCAGGAGCGCGCCCGCGGCCGCCCCGCCGCCGCCCCCCGCCGGUGGGCCCCCGCCUUCUUGUUCGCUGCUGCUGCGCCAGUGGCUCCACGUUCCCGAGUCCGCGUCCGACGACGACGAUGACGACGACUGGCCGGACAGCCCCCCGCCCGAGCCGGCGCCAGAGGCCCGGCCCACCGCCGCCGCCCCCCGGCCCCGGCCCCCACCGCCCGGCGUGGGCCCGGGGGGCGGGGCUGACCCCUCCCACCCCCCCUCGCGCCCCUUCCGCCUUCCGCCGCGCCUCGCCCUCCGCCUGCGCGUCACCGCGGAGCACCUGGCGCGCCUGCGCCUGCGACGCGCGGGCGGGGAGGGGGCGCCGGAGCCCCCCGCGACCCCCGCGACCCCCGCGACCCCCGCGACCCCCGCGACCCCCGCGCGGGUGCGCUUCUCGCCCCACGUCCGGGUGCGCCACCUGGUGGUCUGGGCCUCGGCCGCCCGCCUGGCGCGCCGCGGCUCGUGGGCCCGCGAGCGGGCCGACCGGGCUCGGUUCCGGCGCCGGGUGGCGGAGGCCGAGGCGGUCAUCGGGCCGUGCCUGGGGCCCGAGGCCCGUGCCCGGGCCCUGGCCCGCGGAGCCGGCCCGGCGAACUCGGUC [서열번호 8]
아울러, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 8에 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
따라서, 본 발명자들은 서열번호 6의 단백질 서열에 인간 발현을 위한 코돈 최적화를 하였고, 개시(ATG) 및 종결(TGA) 코돈을 포함하는 코돈 최적화된 핵산(DNA) 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 9로 제공된다:
ATGGCCAGAAGAAGGCGGCACAGAGGACCCAGAAGGCCTAGACCTCCTGGACCAACAGGTGCCGTTCCTACCGCTCAGAGCCAAGTGACCAGCACACCCAATTCTGAACCTGCCGTCAGAAGCGCCCCTGCTGCTGCTCCTCCACCTCCACCAGCTGGCGGACCTCCACCTTCTTGTTCTCTGCTGCTGAGACAGTGGCTGCACGTGCCAGAGTCCGCCTCCGACGATGATGACGATGACGACTGGCCTGACAGCCCTCCTCCAGAACCTGCTCCTGAAGCCAGACCTACAGCCGCTGCTCCTAGACCTAGACCACCACCTCCAGGTGTTGGACCTGGTGGCGGAGCTGATCCTTCTCACCCTCCTAGCAGACCCTTCCGGCTTCCTCCTAGACTGGCCCTGAGACTGAGAGTGACAGCCGAACACCTGGCCAGACTGAGACTTCGTAGAGCAGGCGGAGAAGGCGCTCCTGAACCTCCTGCTACACCAGCCACACCAGCTACTCCCGCAACTCCTGCCACTCCTGCTAGAGTGCGGTTTAGCCCTCACGTCCGCGTCAGACATCTGGTCGTTTGGGCCTCTGCTGCCCGGCTTGCTAGAAGAGGATCTTGGGCCAGAGAGAGAGCCGACCGGGCTAGATTTCGGAGAAGAGTGGCCGAAGCCGAGGCCGTGATTGGACCTTGTCTTGGCCCTGAAGCTCGGGCTAGAGCACTTGCTAGAGGTGCCGGACCTGCCAACAGCGTGTGA [서열번호 9]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 9에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 개시(AUG) 및 종결(UGA) 코돈을 포함하는 서열번호 9의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 10으로 제공된다:
AUGGCCAGAAGAAGGCGGCACAGAGGACCCAGAAGGCCUAGACCUCCUGGACCAACAGGUGCCGUUCCUACCGCUCAGAGCCAAGUGACCAGCACACCCAAUUCUGAACCUGCCGUCAGAAGCGCCCCUGCUGCUGCUCCUCCACCUCCACCAGCUGGCGGACCUCCACCUUCUUGUUCUCUGCUGCUGAGACAGUGGCUGCACGUGCCAGAGUCCGCCUCCGACGAUGAUGACGAUGACGACUGGCCUGACAGCCCUCCUCCAGAACCUGCUCCUGAAGCCAGACCUACAGCCGCUGCUCCUAGACCUAGACCACCACCUCCAGGUGUUGGACCUGGUGGCGGAGCUGAUCCUUCUCACCCUCCUAGCAGACCCUUCCGGCUUCCUCCUAGACUGGCCCUGAGACUGAGAGUGACAGCCGAACACCUGGCCAGACUGAGACUUCGUAGAGCAGGCGGAGAAGGCGCUCCUGAACCUCCUGCUACACCAGCCACACCAGCUACUCCCGCAACUCCUGCCACUCCUGCUAGAGUGCGGUUUAGCCCUCACGUCCGCGUCAGACAUCUGGUCGUUUGGGCCUCUGCUGCCCGGCUUGCUAGAAGAGGAUCUUGGGCCAGAGAGAGAGCCGACCGGGCUAGAUUUCGGAGAAGAGUGGCCGAAGCCGAGGCCGUGAUUGGACCUUGUCUUGGCCCUGAAGCUCGGGCUAGAGCACUUGCUAGAGGUGCCGGACCUGCCAACAGCGUGUGA [서열번호 10]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 10에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 HCV E2(C형 간염 바이러스 E2; 폴리단백질(polyprotein) ADC54662.1로부터의 NS1 단백질; 접근 번호 - 게놈 RNA 번역 ADC54662.1; UniProtKB - D3W8R2(D3W8R2_9HEPC)), 또는 그의 동원체일 수 있다.
HCV E2의 한 작용은 PKR을 억제하는 것이다. [Taylor DR, Shi ST, Romano PR, Barber GN, Lai MMC (1999). Inhibition of the interferon-inducible protein kinase PKR by HCV E2 protein. Science, 285, 107-110. doi: 10.1126/science.285.5424.107]. 상기 HCV E2 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 11로 나타낸다:
METHVTGGSAGHTVSGFVSLLAPGAKQNVQLINTNGSWHLNSTALNCNDSLNTGWLAGLFYHHKFNSSGCPERLASCRPLTDFDQGWGPISYANGSGPDQRPYCWHYPPKPCGIVPAKSVCGPVYCFTPSPVVVGTTDRSGAPTYSWGENDTDVFVLNNTRPPLGNWFGCTWMNSTGFTKVCGAPPCVIGGAGNNTLHCPTDCFRKHPDATYSRCGSGPWITPRCLVDYPYRLWHYPCTINYTIFKIRMYVGGVEHRLEAACNWTRGERCDLEDRDRSELSPLLLTTTQWQVLPCSFTTLPALSTGLIHLHQNIVDVQYLYGVGSSIASWAIKWEYVVLLFLLLADARVCSCLWMMLLISQAEA [서열번호 11]
따라서, 바람직하게는 제1 측면의 RNA 구조체는 실질적으로 서열번호 11에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 HCV E2 폴리펩티드는 다음과 같은 서열번호 12의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGAAACCCACGTCACCGGGGGAAGTGCCGGCCACACTGTGTCTGGATTTGTTAGCCTCCTCGCACCAGGCGCCAAGCAGAACGTCCAGCTGATCAACACCAACGGCAGTTGGCACCTCAATAGCACGGCCCTGAACTGCAATGATAGCCTTAACACCGGCTGGTTAGCAGGGCTTTTCTATCACCACAAGTTCAACTCTTCAGGCTGTCCTGAGAGGCTAGCCAGCTGCCGACCCCTTACCGATTTTGACCAGGGCTGGGGCCCTATCAGTTATGCCAACGGAAGCGGCCCCGACCAGCGCCCCTACTGCTGGCACTACCCCCCTAAACCTTGCGGTGTTGTGCCCGCGAAGAGTGTGTGTGGTCCGGTATATTGCTTCACTCCCAGCCCCGTGGTGGTGGGAACGACCGACAGGTCGGGCGCGCCTACCTACAGCTGGGGTGAAAATGATACGGACGTCTTCGTCCTTAACAATACCAGGCCACCGCTGGGCAATTGGTTCGGTTGTACCTGGATGAACTCAACTGGATTCACCAAAGTGTGCGGAGCGCCTCCCTGTGTCATCGGAGGGGCGGGCAACAACACCCTGCACTGCCCCACTGATTGCTTCCGCAAGCATCCGGACGCCACATACTCTCGGTGCGGCTCCGGTCCCTGGATCACACCCAGGTGCCTGGTCGACTACCCGTATAGGCTTTGGCATTATCCTTGTACCATCAACTACACCATATTTAAAATCAGGATGTACGTGGGAGGGGTCGAGCACAGGCTGGAAGCTGCTTGCAACTGGACGCGGGGCGAACGTTGCGATCTGGAAGACAGGGACAGGTCCGAGCTCAGCCCGTTACTGCTGACCACTACACAGTGGCAGGTCCTCCCGTGTTCCTTCACAACCCTGCCAGCCTTGTCCACCGGCCTCATCCACCTCCACCAGAACATTGTGGACGTGCAGTACTTGTACGGGGTGGGGTCAAGCATCGCGTCCTGGGCCATTAAGTGGGAGTACGTCGTTCTCCTGTTCCTTCTGCTTGCAGACGCGCGCGTCTGCTCCTGCTTGTGGATGATGCTACTCATATCCCAAGCGGAGGCG [서열번호 12]
따라서, 바람직하게는 상기 HCV E2 폴리펩티드는 실질적으로 서열번호 12에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 상기 RNA 구조체는 다음과 같은 서열번호 13의 RNA 뉴클레오티드 서열을 포함할 수 있다:
AUGGAAACCCACGUCACCGGGGGAAGUGCCGGCCACACUGUGUCUGGAUUUGUUAGCCUCCUCGCACCAGGCGCCAAGCAGAACGUCCAGCUGAUCAACACCAACGGCAGUUGGCACCUCAAUAGCACGGCCCUGAACUGCAAUGAUAGCCUUAACACCGGCUGGUUAGCAGGGCUUUUCUAUCACCACAAGUUCAACUCUUCAGGCUGUCCUGAGAGGCUAGCCAGCUGCCGACCCCUUACCGAUUUUGACCAGGGCUGGGGCCCUAUCAGUUAUGCCAACGGAAGCGGCCCCGACCAGCGCCCCUACUGCUGGCACUACCCCCCUAAACCUUGCGGUGUUGUGCCCGCGAAGAGUGUGUGUGGUCCGGUAUAUUGCUUCACUCCCAGCCCCGUGGUGGUGGGAACGACCGACAGGUCGGGCGCGCCUACCUACAGCUGGGGUGAAAAUGAUACGGACGUCUUCGUCCUUAACAAUACCAGGCCACCGCUGGGCAAUUGGUUCGGUUGUACCUGGAUGAACUCAACUGGAUUCACCAAAGUGUGCGGAGCGCCUCCCUGUGUCAUCGGAGGGGCGGGCAACAACACCCUGCACUGCCCCACUGAUUGCUUCCGCAAGCAUCCGGACGCCACAUACUCUCGGUGCGGCUCCGGUCCCUGGAUCACACCCAGGUGCCUGGUCGACUACCCGUAUAGGCUUUGGCAUUAUCCUUGUACCAUCAACUACACCAUAUUUAAAAUCAGGAUGUACGUGGGAGGGGUCGAGCACAGGCUGGAAGCUGCUUGCAACUGGACGCGGGGCGAACGUUGCGAUCUGGAAGACAGGGACAGGUCCGAGCUCAGCCCGUUACUGCUGACCACUACACAGUGGCAGGUCCUCCCGUGUUCCUUCACAACCCUGCCAGCCUUGUCCACCGGCCUCAUCCACCUCCACCAGAACAUUGUGGACGUGCAGUACUUGUACGGGGUGGGGUCAAGCAUCGCGUCCUGGGCCAUUAAGUGGGAGUACGUCGUUCUCCUGUUCCUUCUGCUUGCAGACGCGCGCGUCUGCUCCUGCUUGUGGAUGAUGCUACUCAUAUCCCAAGCGGAGGCG [서열번호 13]
아울러, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 13에 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
따라서, 본 발명자들은 서열번호 11의 단백질 서열에 인간 발현을 위한 코돈 최적화를 하였고, 개시(ATG) 및 종결(TGA) 코돈을 포함하는 코돈 최적화된 핵산(DNA) 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 14로 제공된다:
ATGGAAACCCACGTGACAGGCGGATCTGCCGGCCATACAGTGTCCGGCTTTGTGTCTCTTCTGGCCCCTGGCGCCAAGCAGAATGTGCAGCTGATCAACACCAACGGCAGCTGGCACCTGAACAGCACAGCCCTGAACTGCAACGACAGCCTGAATACCGGATGGCTGGCCGGCCTGTTCTACCACCACAAGTTCAATAGCAGCGGCTGCCCCGAGAGACTGGCCTCTTGTAGACCTCTGACCGACTTCGATCAAGGCTGGGGCCCTATCAGCTACGCCAATGGCTCTGGACCTGACCAGAGGCCTTACTGCTGGCACTACCCTCCAAAGCCTTGCGGAATCGTGCCTGCCAAGTCTGTGTGTGGCCCCGTGTACTGCTTCACCCCATCTCCAGTGGTCGTGGGCACCACCGATAGATCTGGCGCCCCAACATATAGCTGGGGCGAGAACGACACCGACGTGTTCGTGCTGAACAACACCCGGCCTCCACTCGGAAATTGGTTCGGCTGCACCTGGATGAACTCCACCGGCTTCACAAAAGTGTGCGGAGCCCCTCCTTGTGTGATTGGCGGAGCCGGAAACAATACCCTGCACTGCCCTACCGACTGCTTCAGAAAGCACCCCGACGCCACCTACAGCAGATGTGGATCTGGCCCTTGGATCACCCCTAGATGCCTGGTGGACTACCCCTACCGGCTGTGGCACTATCCCTGCACCATCAACTACACCATCTTCAAGATCCGTATGTACGTCGGCGGCGTGGAACACAGACTGGAAGCCGCCTGTAACTGGACCAGGGGCGAGAGATGCGACCTGGAAGATAGAGACAGAAGCGAGCTGAGCCCTCTGCTGCTGACCACCACACAGTGGCAGGTCCTGCCTTGCAGCTTCACCACACTGCCTGCTCTGAGCACCGGCCTGATTCATCTGCACCAGAACATCGTGGACGTGCAGTACCTGTACGGCGTGGGAAGCTCTATTGCCAGCTGGGCCATCAAGTGGGAGTACGTGGTGCTGCTGTTCCTGCTGCTGGCCGATGCCAGAGTGTGTAGCTGCCTGTGGATGATGCTGCTGATCTCTCAGGCCGAGGCCTGA [서열번호 14]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 14에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 개시(AUG) 및 종결(UGA) 코돈을 포함하는 서열번호 14의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 15로 제공된다:
AUGGAAACCCACGUGACAGGCGGAUCUGCCGGCCAUACAGUGUCCGGCUUUGUGUCUCUUCUGGCCCCUGGCGCCAAGCAGAAUGUGCAGCUGAUCAACACCAACGGCAGCUGGCACCUGAACAGCACAGCCCUGAACUGCAACGACAGCCUGAAUACCGGAUGGCUGGCCGGCCUGUUCUACCACCACAAGUUCAAUAGCAGCGGCUGCCCCGAGAGACUGGCCUCUUGUAGACCUCUGACCGACUUCGAUCAAGGCUGGGGCCCUAUCAGCUACGCCAAUGGCUCUGGACCUGACCAGAGGCCUUACUGCUGGCACUACCCUCCAAAGCCUUGCGGAAUCGUGCCUGCCAAGUCUGUGUGUGGCCCCGUGUACUGCUUCACCCCAUCUCCAGUGGUCGUGGGCACCACCGAUAGAUCUGGCGCCCCAACAUAUAGCUGGGGCGAGAACGACACCGACGUGUUCGUGCUGAACAACACCCGGCCUCCACUCGGAAAUUGGUUCGGCUGCACCUGGAUGAACUCCACCGGCUUCACAAAAGUGUGCGGAGCCCCUCCUUGUGUGAUUGGCGGAGCCGGAAACAAUACCCUGCACUGCCCUACCGACUGCUUCAGAAAGCACCCCGACGCCACCUACAGCAGAUGUGGAUCUGGCCCUUGGAUCACCCCUAGAUGCCUGGUGGACUACCCCUACCGGCUGUGGCACUAUCCCUGCACCAUCAACUACACCAUCUUCAAGAUCCGUAUGUACGUCGGCGGCGUGGAACACAGACUGGAAGCCGCCUGUAACUGGACCAGGGGCGAGAGAUGCGACCUGGAAGAUAGAGACAGAAGCGAGCUGAGCCCUCUGCUGCUGACCACCACACAGUGGCAGGUCCUGCCUUGCAGCUUCACCACACUGCCUGCUCUGAGCACCGGCCUGAUUCAUCUGCACCAGAACAUCGUGGACGUGCAGUACCUGUACGGCGUGGGAAGCUCUAUUGCCAGCUGGGCCAUCAAGUGGGAGUACGUGGUGCUGCUGUUCCUGCUGCUGGCCGAUGCCAGAGUGUGUAGCUGCCUGUGGAUGAUGCUGCUGAUCUCUCAGGCCGAGGCCUGA [서열번호 15]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 15에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 may be HCV NS5a(C형 간염 바이러스 NS5a; 단리물(isolate) H - 게놈 RNA 번역: AAA45534.1; UniProtKB - P27958(POLG_HCV77)), 또는 그의 동원체일 수 있다. 상기 HCV NS5a 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 16으로 나타낸다:
MSGSWLRDIWDWICEVLSDFKTWLKAKLMPQLPGIPFVSCQRGYRGVWRGDGIMHTRCHCGAEITGHVKNGTMRIVGPRTCKNMWSGTFFINAYTTGPCTPLPAPNYKFALWRVSAEEYVEIRRVGDFHYVSGMTTDNLKCPCQIPSPEFFTELDGVRLHRFAPPCKPLLREEVSFRVGLHEYPVGSQLPCEPEPDVAVLTSMLTDPSHITAEAAGRRLARGSPPSMASSSASQLSAPSLKATCTANHDSPDAELIEANLLWRQEMGGNITRVESENKVVILDSFDPLVAEEDEREVSVPAEILRKSRRFAPALPVWARPDYNPLLVETWKKPDYEPPVVHGCPLPPPRSPPVPPPRKKRTVVLTESTLPTALAELATKSFGSSSTSGITGDNTTTSSEPAPSGCPPDSDVESYSSMPPLEGEPGDPDLSDGSWSTVSSGADTEDVVCC [서열번호 16]
따라서, 바람직하게는 제1 측면의 RNA 구조체는 실질적으로 서열번호 16에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 HCV NS5a 폴리펩티드는 다음과 같은 서열번호 17의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGTCCGGTTCCTGGCTAAGGGACATCTGGGACTGGATATGCGAGGTGCTGAGCGACTTTAAGACCTGGCTGAAAGCCAAGCTCATGCCACAACTGCCTGGGATTCCCTTTGTGTCCTGCCAGCGCGGGTATAGGGGGGTCTGGCGAGGAGACGGCATTATGCACACTCGCTGCCACTGTGGAGCTGAGATCACTGGACATGTCAAAAACGGGACGATGAGGATCGTCGGTCCTAGGACCTGCAAGAACATGTGGAGTGGGACGTTCTTCATTAATGCCTACACCACGGGCCCCTGTACTCCCCTTCCTGCGCCGAACTATAAGTTCGCGCTGTGGAGGGTGTCTGCAGAGGAATACGTGGAGATAAGGCGGGTGGGGGACTTCCACTACGTATCGGGCATGACTACTGACAATCTCAAATGCCCGTGCCAGATCCCATCGCCCGAATTTTTCACAGAATTGGACGGGGTGCGCCTACATAGGTTTGCGCCCCCTTGCAAGCCCTTGCTGCGGGAGGAGGTATCATTCAGAGTAGGACTCCACGAGTACCCGGTGGGGTCGCAATTACCTTGCGAGCCCGAACCGGACGTAGCCGTGTTGACGTCCATGCTCACTGATCCCTCCCATATAACAGCAGAGGCGGCCGGGAGAAGGTTGGCGAGAGGGTCACCCCCTTCTATGGCCAGCTCCTCGGCTAGCCAGCTGTCCGCTCCATCTCTCAAGGCAACTTGCACCGCCAACCATGACTCCCCTGACGCCGAGCTCATAGAGGCTAACCTCCTGTGGAGGCAGGAGATGGGCGGCAACATCACCAGGGTTGAGTCAGAGAACAAAGTGGTGATTCTGGACTCCTTCGATCCGCTTGTGGCAGAGGAGGATGAGCGGGAGGTCTCCGTACCCGCAGAAATTCTGCGGAAGTCTCGGAGATTCGCCCCAGCCCTGCCCGTCTGGGCGCGGCCGGACTACAACCCCCTGCTAGTAGAGACGTGGAAAAAGCCTGACTACGAACCACCTGTGGTCCATGGCTGCCCGCTACCACCTCCACGGTCCCCTCCTGTGCCTCCGCCTCGGAAAAAGCGTACGGTGGTCCTCACCGAATCAACCCTACCTACTGCCTTGGCCGAGCTTGCCACCAAAAGTTTTGGCAGCTCCTCAACTTCCGGCATTACGGGCGACAATACGACAACATCCTCTGAGCCCGCCCCTTCTGGCTGCCCCCCCGACTCCGACGTTGAGTCCTATTCTTCCATGCCCCCCCTGGAGGGGGAGCCTGGGGATCCGGATCTCAGCGACGGGTCATGGTCGACGGTCAGTAGTGGGGCCGACACGGAAGATGTCGTGTGCTGC [서열번호 17]
따라서, 바람직하게는 상기 HCV NS5a 폴리펩티드는 실질적으로 서열번호 17에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 상기 RNA 구조체는 다음과 같은 서열번호 18의 RNA 뉴클레오티드 서열을 포함할 수 있다:
AUGUCCGGUUCCUGGCUAAGGGACAUCUGGGACUGGAUAUGCGAGGUGCUGAGCGACUUUAAGACCUGGCUGAAAGCCAAGCUCAUGCCACAACUGCCUGGGAUUCCCUUUGUGUCCUGCCAGCGCGGGUAUAGGGGGGUCUGGCGAGGAGACGGCAUUAUGCACACUCGCUGCCACUGUGGAGCUGAGAUCACUGGACAUGUCAAAAACGGGACGAUGAGGAUCGUCGGUCCUAGGACCUGCAAGAACAUGUGGAGUGGGACGUUCUUCAUUAAUGCCUACACCACGGGCCCCUGUACUCCCCUUCCUGCGCCGAACUAUAAGUUCGCGCUGUGGAGGGUGUCUGCAGAGGAAUACGUGGAGAUAAGGCGGGUGGGGGACUUCCACUACGUAUCGGGCAUGACUACUGACAAUCUCAAAUGCCCGUGCCAGAUCCCAUCGCCCGAAUUUUUCACAGAAUUGGACGGGGUGCGCCUACAUAGGUUUGCGCCCCCUUGCAAGCCCUUGCUGCGGGAGGAGGUAUCAUUCAGAGUAGGACUCCACGAGUACCCGGUGGGGUCGCAAUUACCUUGCGAGCCCGAACCGGACGUAGCCGUGUUGACGUCCAUGCUCACUGAUCCCUCCCAUAUAACAGCAGAGGCGGCCGGGAGAAGGUUGGCGAGAGGGUCACCCCCUUCUAUGGCCAGCUCCUCGGCUAGCCAGCUGUCCGCUCCAUCUCUCAAGGCAACUUGCACCGCCAACCAUGACUCCCCUGACGCCGAGCUCAUAGAGGCUAACCUCCUGUGGAGGCAGGAGAUGGGCGGCAACAUCACCAGGGUUGAGUCAGAGAACAAAGUGGUGAUUCUGGACUCCUUCGAUCCGCUUGUGGCAGAGGAGGAUGAGCGGGAGGUCUCCGUACCCGCAGAAAUUCUGCGGAAGUCUCGGAGAUUCGCCCCAGCCCUGCCCGUCUGGGCGCGGCCGGACUACAACCCCCUGCUAGUAGAGACGUGGAAAAAGCCUGACUACGAACCACCUGUGGUCCAUGGCUGCCCGCUACCACCUCCACGGUCCCCUCCUGUGCCUCCGCCUCGGAAAAAGCGUACGGUGGUCCUCACCGAAUCAACCCUACCUACUGCCUUGGCCGAGCUUGCCACCAAAAGUUUUGGCAGCUCCUCAACUUCCGGCAUUACGGGCGACAAUACGACAACAUCCUCUGAGCCCGCCCCUUCUGGCUGCCCCCCCGACUCCGACGUUGAGUCCUAUUCUUCCAUGCCCCCCCUGGAGGGGGAGCCUGGGGAUCCGGAUCUCAGCGACGGGUCAUGGUCGACGGUCAGUAGUGGGGCCGACACGGAAGAUGUCGUGUGCUGC [서열번호 18]
아울러, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 18에 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
따라서, 본 발명자들은 서열번호 16의 단백질 서열에 인간 발현을 위한 코돈 최적화를 하였고, 개시(ATG) 및 종결(TGA) 코돈을 포함하는 코돈 최적화된 핵산(DNA) 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 19로 제공된다:
ATGTCTGGCAGCTGGCTGAGAGACATCTGGGACTGGATTTGCGAGGTGCTGAGCGACTTCAAGACCTGGCTGAAGGCCAAGCTGATGCCTCAGCTGCCTGGCATCCCTTTCGTGTCCTGTCAGAGGGGCTATAGAGGCGTTTGGAGAGGCGACGGCATCATGCACACCAGATGTCACTGTGGCGCCGAGATCACAGGCCACGTGAAGAACGGCACCATGAGAATCGTGGGCCCCAGAACCTGCAAGAATATGTGGAGCGGCACCTTCTTCATCAACGCCTACACCACCGGACCTTGCACACCTCTGCCTGCTCCTAACTACAAGTTCGCCCTGTGGCGGGTGTCCGCCGAGGAATACGTGGAAATCAGAAGAGTGGGCGACTTCCACTACGTGTCCGGCATGACCACCGACAACCTGAAGTGCCCCTGTCAGATCCCATCTCCTGAGTTCTTCACCGAGCTGGATGGCGTGCGGCTGCACAGATTTGCCCCTCCATGTAAACCCCTGCTGAGAGAAGAGGTGTCCTTTAGAGTGGGCCTGCACGAGTACCCTGTGGGTTCTCAGCTCCCTTGCGAGCCTGAACCTGATGTGGCCGTGCTGACCTCCATGCTGACAGACCCTTCTCACATCACAGCCGAGGCCGCTGGAAGAAGGCTGGCTAGAGGATCTCCTCCTAGCATGGCCTCTAGCAGCGCCTCTCAACTGTCTGCCCCAAGCCTGAAAGCCACCTGTACCGCCAATCACGACAGCCCTGATGCCGAGCTGATCGAGGCTAACCTGCTGTGGCGGCAAGAGATGGGCGGCAACATCACCAGAGTGGAAAGCGAGAACAAGGTGGTCATCCTGGATAGCTTCGACCCTCTGGTGGCCGAAGAGGACGAGAGGGAAGTGTCTGTGCCTGCCGAGATCCTGAGAAAGAGCAGAAGATTCGCCCCTGCTCTGCCCGTGTGGGCCAGACCTGATTACAATCCCCTGCTGGTGGAAACATGGAAGAAGCCCGACTACGAGCCTCCTGTGGTGCACGGATGTCCACTGCCTCCACCTAGATCTCCACCTGTGCCACCTCCACGGAAGAAAAGAACCGTGGTGCTGACCGAGAGCACCCTGCCTACAGCTCTGGCTGAGCTGGCCACAAAGAGCTTTGGCAGCAGCAGCACCTCTGGCATCACCGGCGATAATACCACCACCAGCTCTGAGCCTGCTCCAAGCGGATGTCCTCCTGACTCCGACGTGGAAAGCTACAGCAGCATGCCTCCTCTGGAAGGCGAACCCGGCGATCCTGATCTGTCTGATGGCTCTTGGAGCACCGTGTCCTCTGGCGCCGATACAGAGGATGTCGTGTGCTGCTGA [서열번호 19]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 19에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 개시(AUG) 및 종결(UGA) 코돈을 포함하는 서열번호 19의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 20으로 제공된다:
AUGUCUGGCAGCUGGCUGAGAGACAUCUGGGACUGGAUUUGCGAGGUGCUGAGCGACUUCAAGACCUGGCUGAAGGCCAAGCUGAUGCCUCAGCUGCCUGGCAUCCCUUUCGUGUCCUGUCAGAGGGGCUAUAGAGGCGUUUGGAGAGGCGACGGCAUCAUGCACACCAGAUGUCACUGUGGCGCCGAGAUCACAGGCCACGUGAAGAACGGCACCAUGAGAAUCGUGGGCCCCAGAACCUGCAAGAAUAUGUGGAGCGGCACCUUCUUCAUCAACGCCUACACCACCGGACCUUGCACACCUCUGCCUGCUCCUAACUACAAGUUCGCCCUGUGGCGGGUGUCCGCCGAGGAAUACGUGGAAAUCAGAAGAGUGGGCGACUUCCACUACGUGUCCGGCAUGACCACCGACAACCUGAAGUGCCCCUGUCAGAUCCCAUCUCCUGAGUUCUUCACCGAGCUGGAUGGCGUGCGGCUGCACAGAUUUGCCCCUCCAUGUAAACCCCUGCUGAGAGAAGAGGUGUCCUUUAGAGUGGGCCUGCACGAGUACCCUGUGGGUUCUCAGCUCCCUUGCGAGCCUGAACCUGAUGUGGCCGUGCUGACCUCCAUGCUGACAGACCCUUCUCACAUCACAGCCGAGGCCGCUGGAAGAAGGCUGGCUAGAGGAUCUCCUCCUAGCAUGGCCUCUAGCAGCGCCUCUCAACUGUCUGCCCCAAGCCUGAAAGCCACCUGUACCGCCAAUCACGACAGCCCUGAUGCCGAGCUGAUCGAGGCUAACCUGCUGUGGCGGCAAGAGAUGGGCGGCAACAUCACCAGAGUGGAAAGCGAGAACAAGGUGGUCAUCCUGGAUAGCUUCGACCCUCUGGUGGCCGAAGAGGACGAGAGGGAAGUGUCUGUGCCUGCCGAGAUCCUGAGAAAGAGCAGAAGAUUCGCCCCUGCUCUGCCCGUGUGGGCCAGACCUGAUUACAAUCCCCUGCUGGUGGAAACAUGGAAGAAGCCCGACUACGAGCCUCCUGUGGUGCACGGAUGUCCACUGCCUCCACCUAGAUCUCCACCUGUGCCACCUCCACGGAAGAAAAGAACCGUGGUGCUGACCGAGAGCACCCUGCCUACAGCUCUGGCUGAGCUGGCCACAAAGAGCUUUGGCAGCAGCAGCACCUCUGGCAUCACCGGCGAUAAUACCACCACCAGCUCUGAGCCUGCUCCAAGCGGAUGUCCUCCUGACUCCGACGUGGAAAGCUACAGCAGCAUGCCUCCUCUGGAAGGCGAACCCGGCGAUCCUGAUCUGUCUGAUGGCUCUUGGAGCACCGUGUCCUCUGGCGCCGAUACAGAGGAUGUCGUGUGCUGCUGA [서열번호 20]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 20에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 VACV E3L(백시니아 바이러스 E3L; AEY72868.1; 접근 번호 - 게놈 DNA 번역: AEY72868.1; UniProtKB - H2DSW3(H2DSW3_9POXV)), 또는 그의 동원체일 수 있다. VACV E3L은 PKR 및 IRF3 및 7의 억제를 통해 선천적 감지 시스템을 억제할 것이다. [Perdiuero B, Esteban M (2009) The interferon system and vaccinia virus evasion mechanisms. J Interferon Cytokine Res, 29, 9, 581-198].
상기 VACV E3L 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 21로 나타낸다:
MSKIYIDERSDAEIVCAAIKNIGIEGATAAQLTRQLNMEKREVNKALYDLQRSAMVYSSDDIPPRWFMTTEADKPDADAMADVIIDDVSREKSMREDHKSFDDVIPAKKIIDWKDANPVTIINEYCQITKRDWSFRIESVGPSNSPTFYACVDIDGRVFDKADGKSKRDAKNNAAKLAVDKLLGYVIIRF [서열번호 21]
따라서, 바람직하게는 제1 측면의 RNA 구조체는 실질적으로 서열번호 21에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 VACV E3L 폴리펩티드는 다음과 같은 서열번호 22의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGTCTAAGATCTATATCGACGAGCGTTCTGACGCAGAGATTGTGTGTGCGGCTATTAAAAACATTGGAATCGAAGGAGCTACTGCTGCACAACTAACTAGACAACTTAATATGGAGAAGCGAGAAGTTAATAAAGCTCTGTACGATCTTCAACGTAGTGCTATGGTGTACAGCTCCGACGATATTCCTCCTCGTTGGTTTATGACAACGGAGGCGGATAAGCCGGATGCTGATGCTATGGCTGACGTCATAATAGATGATGTATCCCGCGAAAAATCAATGAGAGAGGATCATAAGTCTTTTGATGATGTTATTCCGGCTAAAAAAATTATTGATTGGAAAGATGCTAACCCTGTCACCATTATTAATGAGTACTGCCAAATAACTAAGAGAGATTGGTCTTTTCGTATTGAATCAGTTGGGCCTAGTAACTCTCCTACATTTTATGCCTGTGTAGATATCGACGGAAGAGTATTCGATAAGGCCGATGGAAAATCTAAACGAGATGCTAAAAATAATGCAGCTAAATTGGCTGTAGATAAACTTCTTGGGTACGTCATCATTAGATTC [서열번호 22]
따라서, 바람직하게는 상기 VACV E3L 폴리펩티드는 실질적으로 서열번호 22에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 상기 RNA 구조체는 다음과 같은 서열번호 23의 RNA 뉴클레오티드 서열을 포함할 수 있다:
AUGUCUAAGAUCUAUAUCGACGAGCGUUCUGACGCAGAGAUUGUGUGUGCGGCUAUUAAAAACAUUGGAAUCGAAGGAGCUACUGCUGCACAACUAACUAGACAACUUAAUAUGGAGAAGCGAGAAGUUAAUAAAGCUCUGUACGAUCUUCAACGUAGUGCUAUGGUGUACAGCUCCGACGAUAUUCCUCCUCGUUGGUUUAUGACAACGGAGGCGGAUAAGCCGGAUGCUGAUGCUAUGGCUGACGUCAUAAUAGAUGAUGUAUCCCGCGAAAAAUCAAUGAGAGAGGAUCAUAAGUCUUUUGAUGAUGUUAUUCCGGCUAAAAAAAUUAUUGAUUGGAAAGAUGCUAACCCUGUCACCAUUAUUAAUGAGUACUGCCAAAUAACUAAGAGAGAUUGGUCUUUUCGUAUUGAAUCAGUUGGGCCUAGUAACUCUCCUACAUUUUAUGCCUGUGUAGAUAUCGACGGAAGAGUAUUCGAUAAGGCCGAUGGAAAAUCUAAACGAGAUGCUAAAAAUAAUGCAGCUAAAUUGGCUGUAGAUAAACUUCUUGGGUACGUCAUCAUUAGAUUC [서열번호 23]
아울러, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 23에 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
따라서, 본 발명자들은 서열번호 21의 단백질 서열에 인간 발현을 위한 코돈 최적화를 하였고, 개시(ATG) 및 종결(TGA) 코돈을 포함하는 코돈 최적화된 핵산(DNA) 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 24로 제공된다:
ATGAGCAAGATCTACATCGACGAGCGGAGCGACGCCGAGATTGTGTGTGCCGCCATCAAGAACATCGGCATCGAAGGCGCTACAGCCGCTCAGCTGACCAGACAGCTGAACATGGAAAAGCGGGAAGTGAACAAGGCCCTGTACGACCTGCAGAGAAGCGCCATGGTGTACAGCAGCGACGACATCCCTCCTCGGTGGTTTATGACCACAGAGGCCGACAAGCCCGACGCCGATGCTATGGCCGATGTGATCATCGACGACGTGTCCCGCGAGAAGTCCATGAGAGAGGACCACAAGAGCTTCGATGACGTGATCCCCGCCAAGAAGATCATCGATTGGAAGGACGCCAATCCTGTGACCATCATCAACGAGTACTGCCAGATCACCAAGCGCGACTGGTCCTTCAGAATCGAGAGCGTGGGCCCCAGCAACAGCCCTACCTTTTATGCCTGCGTGGACATCGACGGCCGGGTGTTCGATAAGGCCGATGGCAAGAGCAAGCGGGACGCCAAAAACAACGCCGCCAAACTGGCCGTGGATAAGCTGCTGGGCTACGTGATCATCCGGTTCTGA [서열번호 24]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 24에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 개시(AUG) 및 종결(UGA) 코돈을 포함하는 서열번호 24의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 25로 제공된다:
AUGAGCAAGAUCUACAUCGACGAGCGGAGCGACGCCGAGAUUGUGUGUGCCGCCAUCAAGAACAUCGGCAUCGAAGGCGCUACAGCCGCUCAGCUGACCAGACAGCUGAACAUGGAAAAGCGGGAAGUGAACAAGGCCCUGUACGACCUGCAGAGAAGCGCCAUGGUGUACAGCAGCGACGACAUCCCUCCUCGGUGGUUUAUGACCACAGAGGCCGACAAGCCCGACGCCGAUGCUAUGGCCGAUGUGAUCAUCGACGACGUGUCCCGCGAGAAGUCCAUGAGAGAGGACCACAAGAGCUUCGAUGACGUGAUCCCCGCCAAGAAGAUCAUCGAUUGGAAGGACGCCAAUCCUGUGACCAUCAUCAACGAGUACUGCCAGAUCACCAAGCGCGACUGGUCCUUCAGAAUCGAGAGCGUGGGCCCCAGCAACAGCCCUACCUUUUAUGCCUGCGUGGACAUCGACGGCCGGGUGUUCGAUAAGGCCGAUGGCAAGAGCAAGCGGGACGCCAAAAACAACGCCGCCAAACUGGCCGUGGAUAAGCUGCUGGGCUACGUGAUCAUCCGGUUCUGA [서열번호 25]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 25에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 VACV K3L(백시니아 바이러스 K3L; P20639.1; 접근 번호 - 게놈 DNA 번역: AAA48009.1; UniProtKB - P20639(K3_VACCC)), 또는 그의 동원체일 수 있다. VACV K3L은 PKR을 억제한다. [Perdiuero B, Esteban M (2009) The interferon system and vaccinia virus evasion mechanisms. J Interferon Cytokine Res, 29, 9, 581-198]. 상기 VACV K3L 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 26으로 나타낸다:
MLAFCYSLPNAGDVIKGRVYEKDYALYIYLFDYPHSEAILAESVKMHMDRYVEYRDKLVGKTVKVKVIRVDYTKGYIDVNYKRMCRHQ [서열번호 26]
따라서, 바람직하게는 제1 측면의 RNA 구조체는 실질적으로 서열번호 26에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 VACV K3L 폴리펩티드는 다음과 같은 서열번호 27의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGCTTGCATTTTGTTATTCGTTGCCCAATGCGGGCGATGTAATAAAGGGCAGAGTATACGAGAAGGATTATGCTCTATACATTTATCTTTTTGACTATCCTCACTCTGAAGCTATCTTGGCAGAGAGTGTTAAGATGCATATGGATAGATATGTTGAATATAGGGATAAACTGGTAGGGAAAACTGTAAAAGTTAAAGTGATTAGAGTTGATTATACAAAAGGATATATAGATGTCAATTACAAAAGGATGTGTAGACATCAA [서열번호 27]
따라서, 바람직하게는 상기 VACV K3L 폴리펩티드는 실질적으로 서열번호 27에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 상기 RNA 구조체는 다음과 같은 서열번호 28의 RNA 뉴클레오티드 서열을 포함할 수 있다:
AUGCUUGCAUUUUGUUAUUCGUUGCCCAAUGCGGGCGAUGUAAUAAAGGGCAGAGUAUACGAGAAGGAUUAUGCUCUAUACAUUUAUCUUUUUGACUAUCCUCACUCUGAAGCUAUCUUGGCAGAGAGUGUUAAGAUGCAUAUGGAUAGAUAUGUUGAAUAUAGGGAUAAACUGGUAGGGAAAACUGUAAAAGUUAAAGUGAUUAGAGUUGAUUAUACAAAAGGAUAUAUAGAUGUCAAUUACAAAAGGAUGUGUAGACAUCAA [서열번호 28]
아울러, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 28에 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
따라서, 본 발명자들은 서열번호 26의 단백질 서열에 인간 발현을 위한 코돈 최적화를 하였고, 개시(ATG) 및 종결(TGA) 코돈을 포함하는 코돈 최적화된 핵산(DNA) 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 29로 제공된다:
ATGCTGGCCTTCTGCTACAGCCTGCCTAATGCCGGCGACGTGATCAAGGGCAGAGTGTACGAGAAGGACTACGCCCTGTACATCTACCTGTTCGACTACCCTCACAGCGAGGCCATCCTGGCCGAGTCTGTGAAGATGCACATGGACAGATACGTGGAATACCGGGACAAGCTCGTGGGCAAGACCGTGAAAGTGAAAGTCATCAGAGTGGACTACACCAAGGGCTACATCGACGTGAACTACAAGCGGATGTGCAGGCACCAGTGA [서열번호 29]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 29에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 개시(AUG) 및 종결(UGA) 코돈을 포함하는 서열번호 29의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 30으로 제공된다:
AUGCUGGCCUUCUGCUACAGCCUGCCUAAUGCCGGCGACGUGAUCAAGGGCAGAGUGUACGAGAAGGACUACGCCCUGUACAUCUACCUGUUCGACUACCCUCACAGCGAGGCCAUCCUGGCCGAGUCUGUGAAGAUGCACAUGGACAGAUACGUGGAAUACCGGGACAAGCUCGUGGGCAAGACCGUGAAAGUGAAAGUCAUCAGAGUGGACUACACCAAGGGCUACAUCGACGUGAACUACAAGCGGAUGUGCAGGCACCAGUGA [서열번호 30]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 30에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 백시니아 C6(VACV C6 - 백시니아 바이러스 C6; 접근 번호 - 게놈 DNA 번역: AAA69602.1; UniProtKB - P17362(C6_VACCW)), 또는 그의 동원체일 수 있다. 상기 단백질은 인터페론 알파 및 베타의 유도를 위해 핵심적인 전사 인자인 인터페론 조절 인자 3/IRF3 및 7/IRF7의 바이러스-유도성 인산화 및 활성화를 차단함으로써 세포의 항-바이러스 상태의 확립을 방지하는 것으로 여겨진다. 상기 차단은 숙주의 TBK1 어댑터(adapter) 단백질 TBKBP1 및 AZI2에 결합하고, 이로 인해 IRF3 및 IRF7의 인산화 및 활성화의 강한 억제를 생성함으로써, 숙주 TBK1의 억제를 통해 생성될 수 있다. 이것은 또한 숙주 STAT2와 상호작용함으로써 타입 I IFN에 대한 세포 반응의 억제제로서 작용할 수 있다. 기계론적으로, 이것은 인터페론 자극 반응 요소에 대한 숙주 ISGF3 복합체(STAT1, STAT2 및 IRF9로 구성됨) 결합 후에 그 억제 효과를 추가로 발휘할 수 있다. [Smith GL. Vaccinia Virus Protein C6: A Multifunctional Interferon Antagonist. Adv Exp Med Biol. 2018; 1052:1-7. doi: 10.1007/978-981-10-7572-8_1. PMID: 29785476]. 상기 백시니아 C6 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 31로 나타낸다:
MNAYNKADSFSLESDSIKDVIHDYICWLSMTDEMRPSIGNVFKAMETFKIDAVRYYDGNIYELAKDINAMSFDGFIRSLQTIASKKDKLTVYGTMGLLSIVVDINKGCDISNIKFAAGIIILMEYIFDDTDMSHLKVALYRRIQRRDDVDR [서열번호 31]
따라서, 바람직하게는 제1 측면의 RNA 구조체는 실질적으로 서열번호 31에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 백시니아 C6 폴리펩티드는 다음과 같은 서열번호 32의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGAATGCGTATAATAAAGCCGATTCGTTTTCTTTAGAGTCTGATTCTATCAAAGATGTTATACACGATTATATTTGTTGGCTCAGTATGACTGATGAAATGAGACCATCTATCGGAAACGTCTTTAAAGCGATGGAAACGTTTAAGATAGACGCGGTTAGATATTACGATGGTAACATATATGAATTAGCTAAAGATATAAATGCGATGTCGTTTGACGGTTTTATAAGATCTCTACAAACTATCGCTTCAAAGAAAGATAAACTCACTGTTTATGGAACCATGGGACTGCTGTCTATTGTCGTAGATATTAACAAAGGTTGTGATATATCCAATATCAAGTTCGCTGCCGGAATAATCATTTTAATGGAGTATATTTTTGATGACACGGATATGTCTCATCTTAAAGTAGCACTCTATCGTAGAATACAGAGACGTGATGATGTAGATAGA [서열번호 32]
따라서, 바람직하게는 상기 백시니아 C6 폴리펩티드는 실질적으로 서열번호 32에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 상기 RNA 구조체는 다음과 같은 서열번호 33의 RNA 뉴클레오티드 서열을 포함할 수 있다:
AUGAAUGCGUAUAAUAAAGCCGAUUCGUUUUCUUUAGAGUCUGAUUCUAUCAAAGAUGUUAUACACGAUUAUAUUUGUUGGCUCAGUAUGACUGAUGAAAUGAGACCAUCUAUCGGAAACGUCUUUAAAGCGAUGGAAACGUUUAAGAUAGACGCGGUUAGAUAUUACGAUGGUAACAUAUAUGAAUUAGCUAAAGAUAUAAAUGCGAUGUCGUUUGACGGUUUUAUAAGAUCUCUACAAACUAUCGCUUCAAAGAAAGAUAAACUCACUGUUUAUGGAACCAUGGGACUGCUGUCUAUUGUCGUAGAUAUUAACAAAGGUUGUGAUAUAUCCAAUAUCAAGUUCGCUGCCGGAAUAAUCAUUUUAAUGGAGUAUAUUUUUGAUGACACGGAUAUGUCUCAUCUUAAAGUAGCACUCUAUCGUAGAAUACAGAGACGUGAUGAUGUAGAUAGA [서열번호 33]
아울러, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 33에 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
따라서, 본 발명자들은 서열번호 31의 단백질 서열에 인간 발현을 위한 코돈 최적화를 하였고, 개시(ATG) 및 종결(TGA) 코돈을 포함하는 코돈 최적화된 핵산(DNA) 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 34로 제공된다:
ATGAACGCCTACAACAAGGCCGACAGCTTCAGCCTGGAAAGCGACAGCATCAAGGACGTGATCCACGACTACATCTGCTGGCTGAGCATGACCGACGAGATGAGGCCCAGCATCGGCAACGTGTTCAAGGCCATGGAAACCTTCAAGATCGACGCCGTGCGGTACTACGACGGCAACATCTATGAGCTGGCCAAGGACATCAACGCCATGAGCTTCGACGGCTTCATCAGAAGCCTGCAGACAATCGCCAGCAAGAAAGACAAGCTGACCGTGTACGGCACCATGGGCCTGCTGTCTATCGTGGTGGATATCAACAAGGGCTGCGACATCAGCAACATCAAGTTCGCCGCTGGCATCATCATCCTGATGGAGTACATCTTCGACGACACCGACATGAGCCACCTGAAGGTGGCCCTGTACAGAAGAATCCAGCGGAGGGACGACGTGGACAGATGA [서열번호 34]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 34에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 개시(AUG) 및 종결(UGA) 코돈을 포함하는 서열번호 34의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 35로 제공된다:
AUGAACGCCUACAACAAGGCCGACAGCUUCAGCCUGGAAAGCGACAGCAUCAAGGACGUGAUCCACGACUACAUCUGCUGGCUGAGCAUGACCGACGAGAUGAGGCCCAGCAUCGGCAACGUGUUCAAGGCCAUGGAAACCUUCAAGAUCGACGCCGUGCGGUACUACGACGGCAACAUCUAUGAGCUGGCCAAGGACAUCAACGCCAUGAGCUUCGACGGCUUCAUCAGAAGCCUGCAGACAAUCGCCAGCAAGAAAGACAAGCUGACCGUGUACGGCACCAUGGGCCUGCUGUCUAUCGUGGUGGAUAUCAACAAGGGCUGCGACAUCAGCAACAUCAAGUUCGCCGCUGGCAUCAUCAUCCUGAUGGAGUACAUCUUCGACGACACCGACAUGAGCCACCUGAAGGUGGCCCUGUACAGAAGAAUCCAGCGGAGGGACGACGUGGACAGAUGA [서열번호 35]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 35에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 MERS ORF8b(중동 호흡기 증후군 바이러스 ORF8b; 접근 번호 - 진뱅크(GenBank): ANF29170.1; UniProtKB - A0A1W5LGP6(A0A1W5LGP6_MERS)), 또는 그의 동원체일 수 있다. MERS ORF8b는 MDA5-매개 NF-κB 활성화 및 IRF3 활성화의 길항제(antagonist)인 것으로 여겨진다. [Lee J-Y, Bae S, Myoung J (2019) Middle East Respiratory Syndrome Coronavirus-Encoded Accessory Proteins Impair MDA5-and TBK1-Mediated Activation of NF-κB. J Microbiol Biotechnol, 29, 8,1316-1323 doi: 10.4014/jmb.1908.08004]; [Wong, L-yR, Ye ZW, Lui P-Y, Zheng X, Yuan S, Zhu L, Fung S-Y et al. (2020) Middle East respiratory syndrome coronavirus ORF8b accessory protein suppresses type I IFN expression by impeding HSP70-dependent activation of IRF3 kinase IKK€. J Immunol, 205, 6, 1564-1579].
상기 MERS ORF8b 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 36으로 나타낸다:
MPIPPLRKMLGIGGDRTEKLIPGMELSNWLPGGTSTTLELDPKQHSHSGLLRMASFGSMKMAPLMLLQLLGRGTLTMIQLLLHNSRPVLSFLKTSTLRGLEAIVNHLQEPLAQAETLPDLVHKVQDQETLPAALLQVHLESEQ [서열번호 36]
따라서, 바람직하게는 제1 측면의 RNA 구조체는 실질적으로 서열번호 36에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 MERS ORF8b 폴리펩티드는 다음과 같은 서열번호 37의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGCCAATTCCACCCCTGCGCAAAATGCTGGGTATTGGCGGAGACAGGACAGAAAAATTAATACCGGGAATGGAATTAAGCAACTGGCTCCCAGGTGGTACTTCTACTACACTGGAACTGGACCCGAAGCAGCACTCCCATTCCGGGCTGTTAAGGATGGCATCGTTTGGGTCCATGAAGATGGCGCCACTGATGCTCCTTCAACTTTTGGGACGCGGAACCCTAACAATGATTCAGCTATTGTTACACAATTCGCGCCCGGTACTAAGCTTCCTAAAAACTTCCACATTGAGGGGACTGGAGGCAATAGTCAATCATCTTCAAGAGCCTCTAGCGCAAGCAGAAACTCTTCCAGATCTAGTTCACAAGGTTCAAGATCAGGAAACTCTACCCGCGGCACTTCTCCAGGTCCATCTGGAATCGGAGCAG [서열번호 37]
따라서, 바람직하게는 상기 MERS ORF8b 폴리펩티드는 실질적으로 서열번호 37에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 상기 RNA 구조체는 다음과 같은 서열번호 38의 RNA 뉴클레오티드 서열을 포함할 수 있다:
AUGCCAAUUCCACCCCUGCGCAAAAUGCUGGGUAUUGGCGGAGACAGGACAGAAAAAUUAAUACCGGGAAUGGAAUUAAGCAACUGGCUCCCAGGUGGUACUUCUACUACACUGGAACUGGACCCGAAGCAGCACUCCCAUUCCGGGCUGUUAAGGAUGGCAUCGUUUGGGUCCAUGAAGAUGGCGCCACUGAUGCUCCUUCAACUUUUGGGACGCGGAACCCUAACAAUGAUUCAGCUAUUGUUACACAAUUCGCGCCCGGUACUAAGCUUCCUAAAAACUUCCACAUUGAGGGGACUGGAGGCAAUAGUCAAUCAUCUUCAAGAGCCUCUAGCGCAAGCAGAAACUCUUCCAGAUCUAGUUCACAAGGUUCAAGAUCAGGAAACUCUACCCGCGGCACUUCUCCAGGUCCAUCUGGAAUCGGAGCAG [서열번호 38]
아울러, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 38에 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
따라서, 본 발명자들은 서열번호 36의 단백질 서열에 인간 발현을 위한 코돈 최적화를 하였고, 개시(ATG) 및 종결(TGA) 코돈을 포함하는 코돈 최적화된 핵산(DNA) 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 39로 제공된다:
ATGCCCATTCCTCCACTGAGAAAGATGCTCGGCATCGGCGGCGACAGAACCGAGAAGCTGATCCCTGGCATGGAACTGAGCAACTGGCTGCCTGGCGGCACCAGCACAACACTGGAACTGGATCCTAAGCAGCACAGCCACAGCGGCCTGCTGAGAATGGCCAGCTTTGGCAGCATGAAGATGGCCCCTCTGATGCTGCTGCAGCTGCTCGGAAGAGGCACCCTGACAATGATCCAGCTGCTGCTCCACAACAGCAGACCCGTGCTGAGCTTCCTGAAAACCAGCACACTGAGAGGCCTGGAAGCCATCGTGAACCATCTGCAAGAGCCCCTGGCTCAGGCCGAGACACTGCCTGATCTGGTGCACAAGGTGCAGGACCAAGAAACCCTGCCTGCCGCTCTGCTGCAGGTCCACCTGGAATCTGAGCAGTGA [서열번호 39]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 39에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 개시(AUG) 및 종결(UGA) 코돈을 포함하는 서열번호 39의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 40으로 제공된다:
AUGCCCAUUCCUCCACUGAGAAAGAUGCUCGGCAUCGGCGGCGACAGAACCGAGAAGCUGAUCCCUGGCAUGGAACUGAGCAACUGGCUGCCUGGCGGCACCAGCACAACACUGGAACUGGAUCCUAAGCAGCACAGCCACAGCGGCCUGCUGAGAAUGGCCAGCUUUGGCAGCAUGAAGAUGGCCCCUCUGAUGCUGCUGCAGCUGCUCGGAAGAGGCACCCUGACAAUGAUCCAGCUGCUGCUCCACAACAGCAGACCCGUGCUGAGCUUCCUGAAAACCAGCACACUGAGAGGCCUGGAAGCCAUCGUGAACCAUCUGCAAGAGCCCCUGGCUCAGGCCGAGACACUGCCUGAUCUGGUGCACAAGGUGCAGGACCAAGAAACCCUGCCUGCCGCUCUGCUGCAGGUCCACCUGGAAUCUGAGCAGUGA [서열번호 40]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 40에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 KSHV ORF52(카포시 육종-연관 헤르페스바이러스 ORF52; 접근 번호 - 게놈 DNA 번역: ACY00451.1; UniProtKB - F5HBL8(F5HBL8_HHV8)), 또는 그의 동원체일 수 있다. 카포시 육종-연관 헤르페스바이러스(KSHV)의 ORF52 단백질은 cGAS 효소 활성을 직접 억제하고, 이에 따라 cGAS 및 DNA 모두에 대한 결합에 의해 신호전달 분자 cGAMP의 생성을 방지하는 것으로 여겨진다. [Wu J-J, Li W, Shao Y, Avey D et al. (2015) Inhibition of cGAS DNA Sensing by a Herpesvirus Virion Protein. Cell Host Microbe. 18, 3, 333-344.. doi: 10.1016/j.chom.2015.07.015].
상기 KSHV ORF52 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 41로 나타낸다:
MAAPRGRPKKDLTMEDLTAKISQLTVENRELRKALGSTADPRDRPLTATEKEAQLTATVGALSAAAAKKIEARVRTIFSKVVTQKQVDDALKGLSLRIDVCMSDGGTAKPPPGANNRRRRGASTTRAGVDD [서열번호 41]
따라서, 바람직하게는 제1 측면의 RNA 구조체는 실질적으로 서열번호 41에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 KSHV ORF52 폴리펩티드는 다음과 같은 서열번호 42의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGCCGCGCCCAGGGGCAGACCCAAAAAGGACCTTACGATGGAAGACCTAACCGCAAAGATAAGCCAATTGACTGTGGAGAATCGGGAGCTTCGGAAAGCACTGGGATCCACTGCCGATCCGAGAGATCGGCCTCTGACGGCCACCGAGAAGGAAGCGCAGCTTACCGCTACTGTGGGTGCACTGAGTGCGGCGGCCGCTAAGAAAATCGAAGCCAGGGTCAGGACAATATTCAGCAAGGTTGTAACACAAAAGCAAGTGGACGATGCCCTGAAGGGACTTTCGCTTAGAATCGACGTCTGCATGTCAGACGGGGGCACCGCTAAACCGCCTCCTGGTGCCAATAACAGGCGACGAAGAGGAGCCTCGACAACACGGGCGGGGGTTGATGAC [서열번호 42]
따라서, 바람직하게는 상기 KSHV ORF52 폴리펩티드는 실질적으로 서열번호 42에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 상기 RNA 구조체는 다음과 같은 서열번호 43의 RNA 뉴클레오티드 서열을 포함할 수 있다:
AUGGCCGCGCCCAGGGGCAGACCCAAAAAGGACCUUACGAUGGAAGACCUAACCGCAAAGAUAAGCCAAUUGACUGUGGAGAAUCGGGAGCUUCGGAAAGCACUGGGAUCCACUGCCGAUCCGAGAGAUCGGCCUCUGACGGCCACCGAGAAGGAAGCGCAGCUUACCGCUACUGUGGGUGCACUGAGUGCGGCGGCCGCUAAGAAAAUCGAAGCCAGGGUCAGGACAAUAUUCAGCAAGGUUGUAACACAAAAGCAAGUGGACGAUGCCCUGAAGGGACUUUCGCUUAGAAUCGACGUCUGCAUGUCAGACGGGGGCACCGCUAAACCGCCUCCUGGUGCCAAUAACAGGCGACGAAGAGGAGCCUCGACAACACGGGCGGGGGUUGAUGAC [서열번호 43]
아울러, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 43에 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
따라서, 본 발명자들은 서열번호 41의 단백질 서열에 인간 발현을 위한 코돈 최적화를 하였고, 개시(ATG) 및 종결(TGA) 코돈을 포함하는 코돈 최적화된 핵산(DNA) 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 44로 제공된다:
ATGGCTGCTCCTAGAGGCAGACCCAAGAAAGACCTGACCATGGAAGATCTGACCGCCAAGATCAGCCAGCTGACCGTGGAAAACAGAGAGCTGAGAAAGGCCCTGGGCAGCACCGCCGATCCTAGAGATAGACCTCTGACAGCCACCGAGAAAGAGGCCCAGCTGACAGCTACAGTGGGAGCCCTTTCTGCCGCCGCTGCCAAGAAAATTGAAGCCAGAGTGCGGACCATCTTCAGCAAGGTGGTCACCCAGAAACAGGTGGACGATGCCCTGAAGGGCCTGAGCCTGAGAATCGACGTGTGTATGTCTGACGGCGGCACCGCCAAACCTCCACCTGGCGCTAACAACAGAAGAAGAAGAGGCGCCAGCACCACCAGAGCTGGCGTGGACGATTGA [서열번호 44]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 44에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 개시(AUG) 및 종결(UGA) 코돈을 포함하는 서열번호 44의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 45로 제공된다:
AUGGCUGCUCCUAGAGGCAGACCCAAGAAAGACCUGACCAUGGAAGAUCUGACCGCCAAGAUCAGCCAGCUGACCGUGGAAAACAGAGAGCUGAGAAAGGCCCUGGGCAGCACCGCCGAUCCUAGAGAUAGACCUCUGACAGCCACCGAGAAAGAGGCCCAGCUGACAGCUACAGUGGGAGCCCUUUCUGCCGCCGCUGCCAAGAAAAUUGAAGCCAGAGUGCGGACCAUCUUCAGCAAGGUGGUCACCCAGAAACAGGUGGACGAUGCCCUGAAGGGCCUGAGCCUGAGAAUCGACGUGUGUAUGUCUGACGGCGGCACCGCCAAACCUCCACCUGGCGCUAACAACAGAAGAAGAAGAGGCGCCAGCACCACCAGAGCUGGCGUGGACGAUUGA [서열번호 45]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 45에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 에볼라 VP35(EBOV VP35; NP_066244.1; 접근 번호 - NCBI 참조 서열: NC_002549.1; UniProtKB - Q05127(VP35_EBOZM)), 또는 그의 동원체일 수 있다. 에볼라 바이러스 VP35 단백질은 (선천적 신호전달 캐스케이드에 대한 다른 효과들 중에서도) RIG-I의 활성화를 위해 필요한 세포 dsRNA 결합 단백질인 세포 단백질 PACT에 결합하고, IRF3 및 IRF7 활성을 억제하는 것으로 생각된다. [Luthra P, Raman P, Mire CE, Weisand C, Isuda Y et al. (2013) Mutual antagonism between Ebola virus VP35 protein and the RIG-I activator PACT determines infection outcome. Cell Host Microbe., 14(1):74-84. doi: 10.1016/j.chom.2013.06.010]; [Hartman AL, Bird BH, Towner JS, Anoniadou Z-A, Zaki SR, Nichol ST (2008) Inhibition of IRF-3 activation by VP35 is critical for the high level of virulence of Ebola virus. J Virol. 82, 6, 2699-2704. Audet J, Kobinger GP (2015). Immune evasion in ebolavirus infections. Viral Immunol., 28, 1, 10-18].
상기 에볼라 VP35 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 46으로 나타낸다:
MTTRTKGRGHTAATTQNDRMPGPELSGWISEQLMTGRIPVSDIFCDIENNPGLCYASQMQQTKPNPKTRNSQTQTDPICNHSFEEVVQTLASLATVVQQQTIASESLEQRITSLENGLKPVYDMAKTISSLNRVCAEMVAKYDLLVMTTGRATATAAATEAYWAEHGQPPPGPSLYEESAIRGKIESRDETVPQSVREAFNNLNSTTSLTEENFGKPDISAKDLRNIMYDHLPGFGTAFHQLVQVICKLGKDSNSLDIIHAEFQASLAEGDSPQCALIQITKRVPIFQDAAPPVIHIRSRGDIPRACQKSLRPVPPSPKIDRGWVCVFQLQDGKTLGLKI [서열번호 46]
따라서, 바람직하게는 제1 측면의 RNA 구조체는 실질적으로 서열번호 46에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편에 의해 암호화되는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 에볼라 VP35 폴리펩티드는 다음과 같은 서열번호 47의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGACAACTAGAACAAAGGGCAGGGGCCATACTGCGGCCACGACTCAAAACGACAGAATGCCAGGCCCTGAGCTTTCGGGCTGGATCTCTGAGCAGCTAATGACCGGAAGAATTCCTGTAAGCGACATCTTCTGTGATATTGAGAACAATCCAGGATTATGCTACGCATCCCAAATGCAACAAACGAAGCCAAACCCGAAGACGCGCAACAGTCAAACCCAAACGGACCCAATTTGCAATCATAGTTTTGAGGAGGTAGTACAAACATTGGCTTCATTGGCTACTGTTGTGCAACAACAAACCATCGCATCAGAATCATTAGAACAACGCATTACGAGTCTTGAGAATGGTCTAAAGCCAGTTTATGATATGGCAAAAACAATCTCCTCATTGAACAGGGTTTGTGCTGAGATGGTTGCAAAATATGATCTTCTGGTGATGACAACCGGTCGGGCAACAGCAACCGCTGCGGCAACTGAGGCTTATTGGGCCGAACATGGTCAACCACCACCTGGACCATCACTTTATGAAGAAAGTGCGATTCGGGGTAAGATTGAATCTAGAGATGAGACCGTCCCTCAAAGTGTTAGGGAGGCATTCAACAATCTAAACAGTACCACTTCACTAACTGAGGAAAATTTTGGGAAACCTGACATTTCGGCAAAGGATTTGAGAAACATTATGTATGATCACTTGCCTGGTTTTGGAACTGCTTTCCACCAATTAGTACAAGTGATTTGTAAATTGGGAAAAGATAGCAACTCATTGGACATCATTCATGCTGAGTTCCAGGCCAGCCTGGCTGAAGGAGACTCTCCTCAATGTGCCCTAATTCAAATTACAAAAAGAGTTCCAATCTTCCAAGATGCTGCTCCACCTGTCATCCACATCCGCTCTCGAGGTGACATTCCCCGAGCTTGCCAGAAAAGCTTGCGTCCAGTCCCACCATCGCCCAAGATTGATCGAGGTTGGGTATGTGTTTTTCAGCTTCAAGATGGTAAAACACTTGGACTCAAAATT [서열번호 47]
따라서, 바람직하게는 상기 에볼라 VP35 폴리펩티드는 실질적으로 서열번호 47에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 상기 RNA 구조체는 다음과 같은 서열번호 48의 RNA 뉴클레오티드 서열을 포함할 수 있다:
AUGACAACUAGAACAAAGGGCAGGGGCCAUACUGCGGCCACGACUCAAAACGACAGAAUGCCAGGCCCUGAGCUUUCGGGCUGGAUCUCUGAGCAGCUAAUGACCGGAAGAAUUCCUGUAAGCGACAUCUUCUGUGAUAUUGAGAACAAUCCAGGAUUAUGCUACGCAUCCCAAAUGCAACAAACGAAGCCAAACCCGAAGACGCGCAACAGUCAAACCCAAACGGACCCAAUUUGCAAUCAUAGUUUUGAGGAGGUAGUACAAACAUUGGCUUCAUUGGCUACUGUUGUGCAACAACAAACCAUCGCAUCAGAAUCAUUAGAACAACGCAUUACGAGUCUUGAGAAUGGUCUAAAGCCAGUUUAUGAUAUGGCAAAAACAAUCUCCUCAUUGAACAGGGUUUGUGCUGAGAUGGUUGCAAAAUAUGAUCUUCUGGUGAUGACAACCGGUCGGGCAACAGCAACCGCUGCGGCAACUGAGGCUUAUUGGGCCGAACAUGGUCAACCACCACCUGGACCAUCACUUUAUGAAGAAAGUGCGAUUCGGGGUAAGAUUGAAUCUAGAGAUGAGACCGUCCCUCAAAGUGUUAGGGAGGCAUUCAACAAUCUAAACAGUACCACUUCACUAACUGAGGAAAAUUUUGGGAAACCUGACAUUUCGGCAAAGGAUUUGAGAAACAUUAUGUAUGAUCACUUGCCUGGUUUUGGAACUGCUUUCCACCAAUUAGUACAAGUGAUUUGUAAAUUGGGAAAAGAUAGCAACUCAUUGGACAUCAUUCAUGCUGAGUUCCAGGCCAGCCUGGCUGAAGGAGACUCUCCUCAAUGUGCCCUAAUUCAAAUUACAAAAAGAGUUCCAAUCUUCCAAGAUGCUGCUCCACCUGUCAUCCACAUCCGCUCUCGAGGUGACAUUCCCCGAGCUUGCCAGAAAAGCUUGCGUCCAGUCCCACCAUCGCCCAAGAUUGAUCGAGGUUGGGUAUGUGUUUUUCAGCUUCAAGAUGGUAAAACACUUGGACUCAAAAUU [서열번호 48]
아울러, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 48에 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
따라서, 본 발명자들은 서열번호 46의 단백질 서열에 인간 발현을 위한 코돈 최적화를 하였고, 개시(ATG) 및 종결(TGA) 코돈을 포함하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 49로 제공된다:
ATGACCACCAGGACCAAAGGCAGAGGACACACCGCCGCCACCACACAGAACGACAGAATGCCTGGACCTGAGCTGAGCGGCTGGATCTCTGAGCAGCTGATGACAGGCAGAATCCCCGTGTCCGACATCTTCTGCGACATCGAGAACAACCCCGGCCTGTGTTACGCCAGCCAGATGCAGCAGACCAAGCCTAATCCTAAGACACGGAACAGCCAGACACAGACAGACCCCATCTGCAACCACAGCTTCGAGGAAGTGGTGCAGACACTGGCCAGCCTGGCTACAGTTGTGCAGCAGCAGACAATCGCCAGCGAGAGCCTGGAACAGAGAATCACCAGCCTGGAAAACGGCCTGAAGCCTGTGTACGACATGGCCAAGACCATCAGCTCCCTGAACAGAGTGTGCGCCGAGATGGTGGCCAAATACGACCTGCTCGTGATGACCACCGGCAGAGCCACAGCTACAGCCGCTGCCACAGAAGCCTATTGGGCCGAACATGGACAGCCTCCACCTGGACCTAGCCTGTACGAGGAATCTGCCATCCGGGGCAAGATCGAGAGCAGGGATGAGACAGTGCCCCAGTCTGTGCGCGAGGCCTTCAACAACCTGAACAGCACCACAAGCCTGACCGAGGAAAACTTCGGCAAGCCCGACATCAGCGCCAAGGACCTGCGGAACATTATGTACGACCATCTGCCTGGCTTCGGCACCGCCTTCCATCAGCTGGTGCAAGTGATCTGCAAGCTGGGCAAAGACAGCAACAGCCTGGACATCATCCACGCCGAGTTTCAGGCCTCTCTGGCCGAAGGCGATTCTCCTCAGTGTGCCCTGATCCAGATCACCAAGCGGGTGCCCATCTTCCAGGATGCTGCCCCTCCTGTGATCCACATCAGAAGCAGAGGCGACATCCCCAGAGCCTGCCAGAAATCTCTCAGACCCGTGCCTCCATCTCCTAAGATCGACAGAGGCTGGGTCTGCGTGTTCCAGCTGCAAGATGGCAAGACCCTGGGCCTGAAGATCTGA [서열번호 49]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 49에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 개시(AUG) 및 종결(UGA) 코돈을 포함하는 서열번호 49의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 50으로 제공된다:
AUGACCACCAGGACCAAAGGCAGAGGACACACCGCCGCCACCACACAGAACGACAGAAUGCCUGGACCUGAGCUGAGCGGCUGGAUCUCUGAGCAGCUGAUGACAGGCAGAAUCCCCGUGUCCGACAUCUUCUGCGACAUCGAGAACAACCCCGGCCUGUGUUACGCCAGCCAGAUGCAGCAGACCAAGCCUAAUCCUAAGACACGGAACAGCCAGACACAGACAGACCCCAUCUGCAACCACAGCUUCGAGGAAGUGGUGCAGACACUGGCCAGCCUGGCUACAGUUGUGCAGCAGCAGACAAUCGCCAGCGAGAGCCUGGAACAGAGAAUCACCAGCCUGGAAAACGGCCUGAAGCCUGUGUACGACAUGGCCAAGACCAUCAGCUCCCUGAACAGAGUGUGCGCCGAGAUGGUGGCCAAAUACGACCUGCUCGUGAUGACCACCGGCAGAGCCACAGCUACAGCCGCUGCCACAGAAGCCUAUUGGGCCGAACAUGGACAGCCUCCACCUGGACCUAGCCUGUACGAGGAAUCUGCCAUCCGGGGCAAGAUCGAGAGCAGGGAUGAGACAGUGCCCCAGUCUGUGCGCGAGGCCUUCAACAACCUGAACAGCACCACAAGCCUGACCGAGGAAAACUUCGGCAAGCCCGACAUCAGCGCCAAGGACCUGCGGAACAUUAUGUACGACCAUCUGCCUGGCUUCGGCACCGCCUUCCAUCAGCUGGUGCAAGUGAUCUGCAAGCUGGGCAAAGACAGCAACAGCCUGGACAUCAUCCACGCCGAGUUUCAGGCCUCUCUGGCCGAAGGCGAUUCUCCUCAGUGUGCCCUGAUCCAGAUCACCAAGCGGGUGCCCAUCUUCCAGGAUGCUGCCCCUCCUGUGAUCCACAUCAGAAGCAGAGGCGACAUCCCCAGAGCCUGCCAGAAAUCUCUCAGACCCGUGCCUCCAUCUCCUAAGAUCGACAGAGGCUGGGUCUGCGUGUUCCAGCUGCAAGAUGGCAAGACCCUGGGCCUGAAGAUCUGA [서열번호 50]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 50에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
다른 구현예에서, 상기 적어도 하나의 IIP는 SARS-CoV-2 ORF3b(접근 번호 - NCBI 참조 서열: NC_045512.2) 또는 그의 동원체로부터 유래될 수 있다. 적어도 하나의 IIP가 유래될 수 있는 야생형 SARS-CoV-2 ORF3b 폴리펩티드 서열의 한 구현예는 본 명세서에서 서열번호 51로 나타낸다. 별표는 야생형 서열에서 종결 코돈을 나타내고, 이들 중 하나 이상은 상기 유래된 IIP에서 돌연변이될 수 있다. 서열번호 51은 다음과 같다:
MMPTIFFAGILIVTTIVYLTIV*LLQLSLLQVMAQQVLFLNMTTRLVVILKNGNLE*KTVLYYTVTSLQTITSCTQLN*VQTLVLNMLPSSSTIKLLMSLKNMSKFTQSTVHPELLIQ*WNQFMMNRRRLLACLCKHKLMSTNLCTHSFRKRQVR* [서열번호 51]
한 구현예에서, 상기 적어도 하나의 IIP는 야생형 SARS-CoV-2 ORF3b의 ORF3b*57 변이체, 또는 그의 동원체일 수 있다. 상기 SARS-CoV-2 ORF3b*57 변이체 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 52로 나타낸다:
MMPTIFFAGILIVTTIVYLTIVQLLQLSLLQVMAQQVLFLNMTTRLVVILKNGNLE [서열번호 52]
따라서, 바람직하게는 제1 측면의 RNA 구조체는 실질적으로 서열번호 52에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 SARS-CoV-2 ORF3b*57 변이체 폴리펩티드는 다음과 같은 서열번호 53의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGATGCCAACTATTTTCTTTGCTGGCATACTAATTGTTACGACTATTGTATACCTTACAATAGTGCAACTTCTTCAATTGTCATTACTTCAGGTGATGGCACAACAAGTCCTATTTCTGAACATGACTACCAGATTGGTGGTTATACTGAAAAATGGGAATCTGGAG [서열번호 53]
따라서, 바람직하게는 상기 SARS-CoV-2 ORF3b*57 변이체 폴리펩티드는 실질적으로 서열번호 53에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 상기 RNA 구조체는 다음과 같은 서열번호 54의 RNA 뉴클레오티드 서열을 포함할 수 있다:
AUGAUGCCAACUAUUUUCUUUGCUGGCAUACUAAUUGUUACGACUAUUGUAUACCUUACAAUAGUGCAACUUCUUCAAUUGUCAUUACUUCAGGUGAUGGCACAACAAGUCCUAUUUCUGAACAUGACUACCAGAUUGGUGGUUAUACUGAAAAAUGGGAAUCUGGAG [서열번호 54]
아울러, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 54에 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
따라서, 본 발명자들은 서열번호 52의 단백질 서열에 인간 발현을 위한 코돈 최적화를 하였고, 개시(ATG) 및 종결(TGA) 코돈을 포함하는 코돈 최적화된 핵산(DNA) 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 55로 제공된다:
ATGATGCCGACCATCTTCTTCGCCGGCATCCTGATCGTGACCACCATCGTGTACCTGACCATCGTGCAGCTGCTGCAGCTCAGCCTGCTGCAAGTGATGGCTCAGCAGGTCCTGTTCCTGAATATGACCACCAGACTGGTCGTGATCCTGAAGAACGGCAACCTGGAATGA [서열번호 55]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 55에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 개시(AUG) 및 종결(UGA) 코돈을 포함하는 서열번호 55의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 56으로 제공된다:
AUGAUGCCGACCAUCUUCUUCGCCGGCAUCCUGAUCGUGACCACCAUCGUGUACCUGACCAUCGUGCAGCUGCUGCAGCUCAGCCUGCUGCAAGUGAUGGCUCAGCAGGUCCUGUUCCUGAAUAUGACCACCAGACUGGUCGUGAUCCUGAAGAACGGCAACCUGGAAUGA [서열번호 56]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 56에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
다른 구현예에서, 상기 적어도 하나의 IIP는 야생형 SARS-CoV-2 ORF3b의 ORF3b*79 변이체, 또는 그의 동원체일 수 있다. 상기 SARS-CoV-2 ORF3b*79 변이체 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 57로 나타낸다:
MMPTIFFAGILIVTTIVYLTIVQLLQLSLLQVMAQQVLFLNMTTRLVVILKNGNLELKTVLYYTVTSLQTITSCTQLN [서열번호 57]
따라서, 바람직하게는 제1 측면의 RNA 구조체는 실질적으로 서열번호 57에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 SARS-CoV-2 ORF3b*79 변이체 폴리펩티드는 다음과 같은 서열번호 58의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGATGCCAACTATTTTCTTTGCTGGCATACTAATTGTTACGACTATTGTATACCTTACAATAGTGCAACTTCTTCAATTGTCATTACTTCAGGTGATGGCACAACAAGTCCTATTTCTGAACATGACTACCAGATTGGTGGTTATACTGAAAAATGGGAATCTGGAGTTAAAGACTGTGTTGTATTACACAGTTACTTCACTTCAGACTATTACCAGCTGTACTCAACTCAAT [서열번호 58]
따라서, 바람직하게는 상기 SARS-CoV-2 ORF3b*79 변이체 폴리펩티드는 실질적으로 서열번호 58에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 상기 RNA 구조체는 다음과 같은 서열번호 59의 RNA 뉴클레오티드 서열을 포함할 수 있다:
AUGAUGCCAACUAUUUUCUUUGCUGGCAUACUAAUUGUUACGACUAUUGUAUACCUUACAAUAGUGCAACUUCUUCAAUUGUCAUUACUUCAGGUGAUGGCACAACAAGUCCUAUUUCUGAACAUGACUACCAGAUUGGUGGUUAUACUGAAAAAUGGGAAUCUGGAGUUAAAGACUGUGUUGUAUUACACAGUUACUUCACUUCAGACUAUUACCAGCUGUACUCAACUCAAU [서열번호 59]
아울러, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 59에 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
따라서, 본 발명자들은 서열번호 57의 단백질 서열에 인간 발현을 위한 코돈 최적화를 하였고, 개시(ATG) 및 종결(TGA) 코돈을 포함하는 코돈 최적화된 핵산(DNA) 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 60으로 제공된다:
ATGATGCCGACCATCTTCTTCGCCGGCATCCTGATCGTGACCACCATCGTGTACCTGACCATCGTGCAGCTGCTGCAGCTCAGCCTGCTGCAAGTGATGGCTCAGCAGGTCCTGTTCCTGAATATGACCACCAGACTGGTCGTGATCCTGAAGAACGGCAACCTGGAACTGAAAACCGTGCTGTACTACACCGTGACCAGCCTGCAGACCATCACCAGCTGCACCCAGCTGAACTGA [서열번호 60]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 60에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 개시(AUG) 및 종결(UGA) 코돈을 포함하는 서열번호 60의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 61로 제공된다:
AUGAUGCCGACCAUCUUCUUCGCCGGCAUCCUGAUCGUGACCACCAUCGUGUACCUGACCAUCGUGCAGCUGCUGCAGCUCAGCCUGCUGCAAGUGAUGGCUCAGCAGGUCCUGUUCCUGAAUAUGACCACCAGACUGGUCGUGAUCCUGAAGAACGGCAACCUGGAACUGAAAACCGUGCUGUACUACACCGUGACCAGCCUGCAGACCAUCACCAGCUGCACCCAGCUGAACUGA [서열번호 61]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 61에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
또 다른 구현예에서, 상기 적어도 하나의 IIP는 야생형 SARS-CoV-2 ORF3b의 ORF3b*57 에콰도르 변이체, 또는 그의 동원체일 수 있다. 상기 SARS-CoV-2 ORF3b*57 에콰도르 변이체 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 62로 나타낸다:
MMPTIFFAGILIVTTIVYLTIVQMLQLSLLQVMAQQVLFLNMTTRLVVILKNGNLE [서열번호 62]
따라서, 바람직하게는 제1 측면의 RNA 구조체는 실질적으로 서열번호 62에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 SARS-CoV-2 ORF3b*57 에콰도르 변이체 폴리펩티드는 다음과 같은 서열번호 63의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGATGCCAACTATTTTCTTTGCTGGCATACTAATTGTTACGACTATTGTATACCTTACAATAGTGCAAATGCTTCAATTGTCATTACTTCAGGTGATGGCACAACAAGTCCTATTTCTGAACATGACTACCAGATTGGTGGTTATACTGAAAAATGGGAATCTGGAGTAA [서열번호 63]
따라서, 바람직하게는 상기 SARS-CoV-2 ORF3b*57 에콰도르 변이체 폴리펩티드는 서열번호 63에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 상기 RNA 구조체는 다음과 같은 서열번호 64의 RNA 뉴클레오티드 서열을 포함할 수 있다:
AUGAUGCCAACUAUUUUCUUUGCUGGCAUACUAAUUGUUACGACUAUUGUAUACCUUACAAUAGUGCAAAUGCUUCAAUUGUCAUUACUUCAGGUGAUGGCACAACAAGUCCUAUUUCUGAACAUGACUACCAGAUUGGUGGUUAUACUGAAAAAUGGGAAUCUGGAGUAA [서열번호 64]
아울러, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 64에 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
따라서, 본 발명자들은 서열번호 62의 단백질 서열에 인간 발현을 위한 코돈 최적화를 하였고, 개시(ATG) 및 종결(TGA) 코돈을 포함하는 코돈 최적화된 핵산(DNA) 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 65로 제공된다:
ATGATGCCGACCATCTTCTTCGCCGGCATCCTGATCGTGACCACCATCGTGTACCTGACCATCGTGCAGATGCTGCAGCTGAGCCTGCTGCAAGTGATGGCCCAGCAGGTCCTGTTCCTGAATATGACCACCAGACTGGTCGTGATCCTGAAGAACGGCAACCTGGAATGA [서열번호 65]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 65에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 개시(AUG) 및 종결(UGA) 코돈을 포함하는 서열번호 65의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 66으로 제공된다:
AUGAUGCCGACCAUCUUCUUCGCCGGCAUCCUGAUCGUGACCACCAUCGUGUACCUGACCAUCGUGCAGAUGCUGCAGCUGAGCCUGCUGCAAGUGAUGGCCCAGCAGGUCCUGUUCCUGAAUAUGACCACCAGACUGGUCGUGAUCCUGAAGAACGGCAACCUGGAAUGA [서열번호 66]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 66에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
다른 구현예에서, 상기 적어도 하나의 IIP는 MDA-5의 활성을 차단 또는 억제하는 바이러스 억제성 단백질일 수 있고, 다음으로 이루어진 군으로부터 선택된다:
(ⅰ) 파라믹소비리대 V 단백질; 임의적으로 SV5B, PIV2, 볼거리, SeV, 홍역, 또는 NiV;
(ⅱ) 뇌심근염 바이러스 2C;
(ⅲ) 버나바이러스(Birnavirus) VP3; 및
(ⅳ) 돼지 델타 코로나바이러스 NS6.
다른 구현예에서, 상기 적어도 하나의 IIP는 LASV; DANV; LCMV; LUJV; CHPV; MACV; GTOV; JUNV; 및 SABV;로 이루어진 군으로부터 선택되는 아레나바이러스(Arenavirus) Z 단백질일 수 있다. 상기 IIP는 RLR, RIG-I 및 MDA-5와 상호작용하고, 미토콘드리아 항-바이러스 신호전달(MAVS)과의 상호작용을 억제하는 것으로 여겨진다.
다른 구현예에서, 상기 적어도 하나의 IIP는 콕사키바이러스(Coxsackievirus) CV-A16 또는 CV-A6; EV D-68 또는 71; 및 폴리오바이러스(Poliovirus) HEV-C;로 이루어진 군으로부터 선택되는 3C 프로테아제(protease) 단백질일 수 있다. 상기 IIP는 MAVS와 MDA의 상호작용을 억제하는 것으로 여겨진다.
다른 구현예에서, 상기 적어도 하나의 IIP는 폴리오바이러스 HEV-C; CVB3; 및 EV71;로 이루어진 군으로부터 선택되는 2A 프로테아제 단백질일 수 있다. 상기 IIP는 MDA-5 및 MAVS의 절단에 의해 RLR 경로를 억제하는 것으로 여겨진다.
다른 구현예에서, 상기 적어도 하나의 IIP는 RIG-I를 분해하거나 여기에 작용하고, hMPV G; CVB3 3C 프로테아제; 폴리오 바이러스 3Cpro; C형 간염 NS3/4A; DENV NS3; EV71 3Cpro; FMDV Lpro 및 3Cpro; 토스카나 바이러스(Toscana virus) NSS; 인플루엔자(Influenza) A/PR/8/34 NS1; 및 MERS ORF8b;로 이루어진 군으로부터 선택되는 단백질일 수 있다. 상기 IIP는 RNA 구조체가 saRNA 또는 mRNA를 포함하는 구현예에서 바람직하다.
다른 구현예에서, 상기 적어도 하나의 IIP는 SARS CoV N 단백질; 및 MHV N;으로 이루어진 군으로부터 선택되는 PACT에 작용하는 단백질일 수 있다.
다른 구현예에서, 상기 적어도 하나의 IIP는, 예를 들면, FMDV Lpro, 3Cpro 및 2B를 포함하는 (MDA2 신호전달을 향상시키는) LGP2에 대해 작용하는 단백질일 수 있다.
다른 구현예에서, 상기 적어도 하나의 IIP는, 예를 들면, MERS CoV M을 포함하는 TRAF3의 활성에 영향을 미치는 단백질일 수 있다.
다른 구현예에서, 상기 적어도 하나의 IIP는 인플루엔자 바이러스 A PB1-F2; A형 간염 ABC; B형 간염 X; C형 간염 NS3/4A; SARS-CoV NSP15; SARS CoV ORF9 (96); 콕사키바이러스 B3 2Apro 및 3Cpro; 리노바이러스(Rhinovirus) 2Apro 및 3Cpro; 로타바이러스(Rotavirus) VP3; GB 바이러스 B NS3/4A; EV71 2Apro; HAV 3Cpro; 인간 메타뉴모바이러스(metapneumovirus) M2-2; 및 엔테로바이러스 EV71 2A;로 이루어진 군으로부터 선택되는 MAVS에 작용하는 단백질일 수 있다.
다른 구현예에서, 상기 적어도 하나의 IIP는 HCV 및 NSP1B; 에볼라 vNS3; HPV16 E6; E형 간염 메틸트랜스퍼라아제(methyltransferase); PRV Npro; HSV1 Us3; HSV2 Us1; CSFV Npro; BDV Npro; 소 RV NS1 및 NS2; B형 간염 바이러스 Orf3; PBoV NP1; E형 간염 ORF3; 및 MERS ORF8b;로 이루어진 군으로부터 선택되는 IRF-3 활성을 차단하는 단백질일 수 있다.
다른 구현예에서, 상기 적어도 하나의 IIP는 로타바이러스 NSP1; KSHV ORF45; EBV BZLF-1; 에볼라 VP35; 및 엔테로바이러스 71 및 68 3CPro;로 이루어진 군으로부터 선택되는 IRF7 활성을 억제하는 단백질일 수 있다.
다른 구현예에서, 상기 적어도 하나의 IIP는 폴리오 3C; FMDV Lpro; MERS CoV ORF4b(246aa); MuHV ORF73; 토크 테노 바이러스(Torque Teno virus) ORF2; EBV EBNA1; 및 SV5 및 hPIV2 V 단백질;로 이루어진 군으로부터 선택되는 NF-kβ 활성에 영향을 미치는 단백질일 수 있다.
다른 구현예에서, 상기 적어도 하나의 IIP는 TBK-1 또는 IKKε 활성에 영향을 미치고, BDV P; HPV E6 및 HPV E7; 아레나바이러스 NP1; HCV NS3 단백질; DENV1 NS4A; DENV1, 2 및 4 NS2A 및 NS2B; WNV NS4A; 에볼라 VP35; 광견병 바이러스 PP; PEDV N 단백질; 및 HSV1 ICP27 및 VP24;로 이루어진 군으로부터 선택되는 단백질일 수 있다.
다른 구현예에서, 상기 적어도 하나의 IIP는, 예를 들면, 뮤린(murine) CTMV M45과 같은 NEMO의 활성에 영향을 미치는 단백질일 수 있다.
다음의 바이러스 IIP는 MDA-5의 활성화를 차단 또는 억제하는 것으로 여겨진다.
상기 V 단백질은 MDA-5의 헬리카아제 도메인(helicase domain)에 결합하고, dsRNA 결합 및 결과적인 자가-연합(self-association)을 억제함으로써 그 활성화를 차단한다. [Childs KS, Andresjeva J, Randall RE & Goobourn S (2009) Mechanism of MDA-5 inhibition by paramyxovirus V proteins. J Virol 83, 3, 1465-1473]. 한 구현예에서, 상기 적어도 하나의 IIP는 SV5B, 또는 그의 동원체이다. 원숭이 바이러스 5의 폴리펩티드 서열(PIV5 비-구조 단백질 V)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 95로 나타낸다:
MDPTDLSFSPDEINKLIETGLNTVEYFTSQQVTGTSSLGKNTIPPGVTGLLTNAAEAKIQESTNHQKGSVGGGAKPKKPRPKIAIVPADDKTVPGKPIPNPLLGLDSTPSTQTVLDLSGKTLPSGSYKGVKLAKFGKENLMTRFIEEPRENPIATSSPIDFKRGRDTGGFHRREYSIGWVGDEVKVTEWCNPSCSPITAAARRFECTCHQCPVTCSECERDT [서열번호 95]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 95에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 SV5B 폴리펩티드는 다음과 같은 서열번호 96의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGATCCCACTGATCTGAGCTTCTCCCCAGATGAGATCAATAAGCTCATAGAGACAGGCCTGAATACTGTAGAGTATTTTACTTCCCAACAAGTCACAGGAACATCCTCTCTTGGAAAGAATACAATACCACCAGGGGTCACAGGACTACTAACCAATGCTGCAGAGGCAAAGATCCAAGAGTCAACTAACCATCAGAAGGGCTCAGTTGGTGGGGGTGCAAAACCAAAGAAACCGCGACCAAAAATTGCCATTGTGCCAGCAGATGACAAAACAGTGCCCGGAAAGCCGATCCCAAACCCTCTATTAGGTCTGGACTCCACCCCGAGCACCCAAACTGTGCTTGATCTAAGTGGGAAAACATTACCATCAGGATCCTATAAGGGGGTTAAGCTTGCGAAATTTGGAAAAGAAAATCTGATGACACGGTTCATCGAGGAACCCAGAGAGAATCCTATCGCAACCAGTTCCCCCATCGATTTTAAGAGGGGCAGGGATACCGGCGGGTTCCATAGAAGGGAGTACTCAATCGGATGGGTGGGAGATGAAGTCAAGGTCACTGAGTGGTGCAATCCATCCTGTTCTCCAATCACCGCTGCAGCAAGGCGATTTGAATGCACTTGTCACCAGTGTCCAGTCACTTGCTCTGAATGTGAACGAGATACT [서열번호 96]
따라서, 바람직하게는 상기 SV5B 폴리펩티드는 실질적으로 서열번호 96에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 SV5B 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 97로 제공된다:
ATGGACCCTACCGACCTGAGCTTCAGCCCCGACGAGATCAACAAGCTGATCGAGACAGGCCTGAACACCGTGGAATACTTCACCAGCCAGCAAGTGACCGGCACAAGCAGCCTGGGCAAGAACACAATTCCTCCAGGCGTGACCGGCCTGCTGACAAATGCTGCCGAGGCCAAGATCCAAGAGAGCACCAACCACCAGAAGGGCTCTGTTGGAGGCGGAGCCAAGCCTAAGAAGCCCAGACCTAAGATCGCCATCGTGCCCGCCGACGATAAGACAGTGCCTGGCAAGCCCATTCCTAATCCTCTGCTGGGCCTCGACAGCACCCCTAGCACACAGACAGTGCTGGATCTGAGCGGCAAGACACTGCCTAGCGGCAGCTATAAGGGCGTGAAGCTGGCCAAGTTCGGCAAAGAAAACCTGATGACCCGGTTCATCGAGGAACCCAGAGAGAACCCTATCGCCACCAGCTCTCCCATCGACTTCAAGAGAGGCAGAGACACCGGCGGCTTCCACAGAAGAGAGTACAGCATTGGCTGGGTCGGAGATGAAGTGAAAGTGACCGAGTGGTGCAACCCCAGCTGCAGCCCTATTACAGCCGCCGCTAGAAGATTCGAGTGCACCTGTCACCAGTGTCCTGTGACCTGTAGCGAGTGCGAGAGAGACACA [서열번호 97]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 97에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 97의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 98로 제공된다:
AUGGACCCUACCGACCUGAGCUUCAGCCCCGACGAGAUCAACAAGCUGAUCGAGACAGGCCUGAACACCGUGGAAUACUUCACCAGCCAGCAAGUGACCGGCACAAGCAGCCUGGGCAAGAACACAAUUCCUCCAGGCGUGACCGGCCUGCUGACAAAUGCUGCCGAGGCCAAGAUCCAAGAGAGCACCAACCACCAGAAGGGCUCUGUUGGAGGCGGAGCCAAGCCUAAGAAGCCCAGACCUAAGAUCGCCAUCGUGCCCGCCGACGAUAAGACAGUGCCUGGCAAGCCCAUUCCUAAUCCUCUGCUGGGCCUCGACAGCACCCCUAGCACACAGACAGUGCUGGAUCUGAGCGGCAAGACACUGCCUAGCGGCAGCUAUAAGGGCGUGAAGCUGGCCAAGUUCGGCAAAGAAAACCUGAUGACCCGGUUCAUCGAGGAACCCAGAGAGAACCCUAUCGCCACCAGCUCUCCCAUCGACUUCAAGAGAGGCAGAGACACCGGCGGCUUCCACAGAAGAGAGUACAGCAUUGGCUGGGUCGGAGAUGAAGUGAAAGUGACCGAGUGGUGCAACCCCAGCUGCAGCCCUAUUACAGCCGCCGCUAGAAGAUUCGAGUGCACCUGUCACCAGUGUCCUGUGACCUGUAGCGAGUGCGAGAGAGACACA [서열번호 98]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 98에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 PIV2 비-구조 단백질 V(P19847), 또는 그의 동원체이다. PIV2의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 99로 나타낸다:
MAEEPTYTTEQVDELIHAGLGTVDFFLSRPIDAQSSLGKGSIPPGVTAVLTSAAEAKSKPVAAGPVKPRRKKVISNTTPYTIADNIPPEKLPINTPIPNPLLPLARPHGKMTDIDIVTGNITEGSYKGVELAKLGKQTLLTRFTSNEPVSSAGSAQDPNFKRGGANRERARGNHRREWSIAWVGDQVKVFEWCNPRCAPVTASARKFTCTCGSCPSICGECEGDH [서열번호 99]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 99에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 PIV2 폴리펩티드는 다음과 같은 서열번호 100의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGCCGAGGAACCAACATACACCACTGAGCAAGTTGATGAATTAATCCATGCTGGACTGGGAACAGTAGATTTCTTCCTATCTAGACCCATAGATGCTCAGTCTTCTTTAGGCAAAGGCAGCATCCCACCAGGTGTCACAGCTGTTCTAACTAGTGCAGCGGAGGCAAAATCCAAACCAGTTGCTGCTGGTCCAGTTAAACCCAGGCGGAAGAAAGTGATCAGCAATACTACTCCATACACTATTGCAGACAATATTCCACCTGAGAAGCTACCGATCAACACTCCAATACCCAATCCATTACTTCCACTGGCACGCCCTCACGGAAAGATGACAGACATTGACATTGTCACTGGGAACATTACAGAAGGATCGTACAAAGGTGTGGAGCTTGCTAAATTAGGGAAGCAGACACTACTCACAAGGTTCACCTCGAATGAGCCAGTCTCCTCAGCTGGATCCGCCCAAGACCCCAACTTTAAGAGGGGGGGAGCTAATAGAGAAAGAGCAAGAGGCAACCATAGGAGAGAATGGAGTATTGCATGGGTCGGAGATCAGGTCAAAGTCTTCGAGTGGTGTAATCCCAGGTGTGCCCCAGTCACGGCCTCAGCTCGCAAGTTCACCTGCACATGCGGATCCTGCCCCAGCATCTGCGGAGAATGTGAAGGAGATCAT [서열번호 100]
따라서, 바람직하게는 상기 PIV2 폴리펩티드는 실질적으로 서열번호 100에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 PIV2 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 101로 제공된다:
ATGGCCGAGGAACCTACCTACACCACCGAACAGGTGGACGAGCTGATTCACGCCGGACTGGGAACCGTGGACTTCTTTCTGTCCCGGCCTATCGATGCCCAGAGCAGCCTCGGCAAGGGATCTATTCCTCCTGGCGTGACAGCCGTGCTGACATCTGCCGCCGAGGCCAAGTCTAAACCTGTGGCTGCTGGACCCGTGAAGCCCAGACGGAAGAAAGTGATCAGCAACACCACACCTTACACGATCGCCGACAACATCCCTCCTGAGAAGCTGCCCATCAACACCCCTATTCCTAATCCTCTGCTGCCCCTGGCCAGACCTCACGGCAAGATGACCGACATCGATATCGTGACCGGCAACATCACCGAGGGCAGCTACAAAGGCGTGGAACTGGCCAAGCTGGGCAAGCAGACACTGCTGACCAGATTCACCAGCAACGAGCCTGTGTCTAGCGCCGGCTCTGCCCAGGATCCTAACTTCAAAAGAGGCGGAGCCAACAGAGAGAGAGCCAGAGGCAACCATCGGAGAGAGTGGTCTATTGCCTGGGTCGGAGATCAAGTGAAGGTGTTCGAGTGGTGCAACCCCAGATGTGCCCCTGTGACAGCCAGCGCCAGAAAGTTCACCTGTACCTGCGGCAGCTGTCCCAGCATTTGCGGAGAGTGTGAAGGCGACCAT [서열번호 101]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 101에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 101의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 102로 제공된다:
AUGGCCGAGGAACCUACCUACACCACCGAACAGGUGGACGAGCUGAUUCACGCCGGACUGGGAACCGUGGACUUCUUUCUGUCCCGGCCUAUCGAUGCCCAGAGCAGCCUCGGCAAGGGAUCUAUUCCUCCUGGCGUGACAGCCGUGCUGACAUCUGCCGCCGAGGCCAAGUCUAAACCUGUGGCUGCUGGACCCGUGAAGCCCAGACGGAAGAAAGUGAUCAGCAACACCACACCUUACACGAUCGCCGACAACAUCCCUCCUGAGAAGCUGCCCAUCAACACCCCUAUUCCUAAUCCUCUGCUGCCCCUGGCCAGACCUCACGGCAAGAUGACCGACAUCGAUAUCGUGACCGGCAACAUCACCGAGGGCAGCUACAAAGGCGUGGAACUGGCCAAGCUGGGCAAGCAGACACUGCUGACCAGAUUCACCAGCAACGAGCCUGUGUCUAGCGCCGGCUCUGCCCAGGAUCCUAACUUCAAAAGAGGCGGAGCCAACAGAGAGAGAGCCAGAGGCAACCAUCGGAGAGAGUGGUCUAUUGCCUGGGUCGGAGAUCAAGUGAAGGUGUUCGAGUGGUGCAACCCCAGAUGUGCCCCUGUGACAGCCAGCGCCAGAAAGUUCACCUGUACCUGCGGCAGCUGUCCCAGCAUUUGCGGAGAGUGUGAAGGCGACCAU [서열번호 102]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 102에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 볼거리(Mumps) 비-구조 단백질 V(P30928), 또는 그의 동원체이다. 볼거리 V 단백질의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 103으로 나타낸다:
MDQFIKQDETGDLIETGMNVANHFLSAPIQGTNSLSKATIIPGVAPVLIGNPEQKNIQYPTTSHQGSKSKGRGSGARPIIVSSSEGGTGGTQVPEPLFAQTGQGGIVTTVYQDPTIQPTGSYRSVELAKIGKERMINRFVEKPRTSTPVTEFKRGAGSGCSRPDNPRGGHRREWSLSWVQGEVRVFEWCNPICSPITAAARFHSCKCGNCPAKCDQCERDYGPP [서열번호 103]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 103에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 볼거리 V 폴리펩티드는 다음과 같은 서열번호 104의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGACCAATTTATAAAACAAGATGAGACTGGTGATTTAATTGAGACAGGAATGAACGTTGCAAATCATTTCCTATCCGCCCCCATTCAGGGAACCAACTCGTTGAGCAAGGCCACAATCATCCCTGGCGTTGCACCAGTACTCATTGGCAATCCAGAGCAAAAGAACATTCAGTACCCCACCACATCACATCAGGGATCCAAGTCAAAGGGCAGAGGCTCAGGGGCCAGGCCCATCATAGTCTCATCCTCCGAAGGAGGCACTGGAGGGACTCAGGTTCCTGAGCCCCTTTTCGCACAAACAGGACAAGGTGGCATTGTCACCACCGTTTATCAGGATCCAACTATCCAACCAACAGGTTCATATCGAAGTGTGGAATTGGCTAAGATAGGAAAAGAGAGAATGATTAATCGATTTGTTGAAAAACCAAGAACCTCAACGCCGGTAACAGAATTTAAGAGGGGGGCCGGGAGCGGCTGCTCAAGGCCAGACAATCCAAGAGGAGGGCATAGACGGGAATGGAGCCTCAGCTGGGTCCAAGGAGAGGTCCGGGTCTTTGAGTGGTGCAACCCCATATGCTCACCTATCACTGCCGCAGCAAGATTCCACTCCTGCAAATGTGGGAATTGCCCCGCAAAGTGCGATCAGTGCGAACGAGATTATGGACCTCCT [서열번호 104]
따라서, 바람직하게는 상기 볼거리 V 폴리펩티드는 실질적으로 서열번호 104에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 볼거리 V 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 105로 제공된다:
ATGGACCAGTTCATCAAGCAGGACGAGACAGGCGACCTGATCGAAACCGGCATGAACGTGGCCAACCACTTCCTGTCTGCCCCTATCCAGGGCACCAACAGCCTGAGCAAGGCCACAATTATCCCTGGCGTGGCCCCTGTGCTGATCGGCAATCCTGAGCAGAAGAACATTCAGTACCCCACCACCAGCCACCAGGGCAGCAAGTCTAAAGGCAGAGGCTCTGGCGCTCGGCCCATCATCGTTTCTAGTAGCGAAGGCGGCACCGGCGGAACACAGGTTCCAGAACCTCTGTTTGCCCAGACAGGCCAAGGCGGCATCGTGACCACAGTGTACCAGGATCCTACCATCCAGCCTACCGGCAGCTACAGAAGCGTGGAACTGGCCAAGATCGGCAAAGAACGGATGATCAACCGCTTCGTGGAAAAGCCCAGAACCAGCACACCCGTGACCGAGTTCAAAAGAGGCGCCGGAAGCGGCTGCAGCAGACCCGATAATCCTAGAGGCGGCCATCGGAGAGAGTGGTCCCTGTCTTGGGTTCAGGGCGAAGTGCGGGTGTTCGAGTGGTGCAATCCTATCTGCAGCCCCATCACAGCCGCCGCTAGATTCCACAGCTGCAAGTGCGGAAACTGCCCCGCCAAGTGTGACCAGTGCGAGAGAGATTACGGCCCTCCT [서열번호 105]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 105에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 105의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 106으로 제공된다:
AUGGACCAGUUCAUCAAGCAGGACGAGACAGGCGACCUGAUCGAAACCGGCAUGAACGUGGCCAACCACUUCCUGUCUGCCCCUAUCCAGGGCACCAACAGCCUGAGCAAGGCCACAAUUAUCCCUGGCGUGGCCCCUGUGCUGAUCGGCAAUCCUGAGCAGAAGAACAUUCAGUACCCCACCACCAGCCACCAGGGCAGCAAGUCUAAAGGCAGAGGCUCUGGCGCUCGGCCCAUCAUCGUUUCUAGUAGCGAAGGCGGCACCGGCGGAACACAGGUUCCAGAACCUCUGUUUGCCCAGACAGGCCAAGGCGGCAUCGUGACCACAGUGUACCAGGAUCCUACCAUCCAGCCUACCGGCAGCUACAGAAGCGUGGAACUGGCCAAGAUCGGCAAAGAACGGAUGAUCAACCGCUUCGUGGAAAAGCCCAGAACCAGCACACCCGUGACCGAGUUCAAAAGAGGCGCCGGAAGCGGCUGCAGCAGACCCGAUAAUCCUAGAGGCGGCCAUCGGAGAGAGUGGUCCCUGUCUUGGGUUCAGGGCGAAGUGCGGGUGUUCGAGUGGUGCAAUCCUAUCUGCAGCCCCAUCACAGCCGCCGCUAGAUUCCACAGCUGCAAGUGCGGAAACUGCCCCGCCAAGUGUGACCAGUGCGAGAGAGAUUACGGCCCUCCU [서열번호 106]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 106에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP 센다이 바이러스(Sendai virus) 단백질 V(Fushimi 바이러스주)(P69284), 또는 그의 동원체이다. 센다이 바이러스 단백질 V(SeV V 단백질)의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 107로 나타낸다:
MDQDAFILKEDSEVEREAPGGRESLSDVIGFLDAVLSSEPTDIGGDRSWLHNTINTPQGPGSAHRAKSEGEGEVSTPSTQDNRSGEESRVSGRTSKPEAEAHAGNLDKQNIHRAFGGRTGTNSVSQDLGDGGDSGILENPPNERGYPRSGIEDENREMAAHPDKRGEDQAEGLPEEVRGGTSLPDEGEGGASNNGRSMEPGSSHSARVTGVLVIPSPELEEAVLRRNKRRPTNSGSKPLTPATVPGTRSPPLNRYNSTGSPPGKPPSTQDEHINSGDTPAVRVKDRKPPIGTRSVSDCPANGRPIHPGLETDSTKKGHRREHIIYERDGYIVDESWCNPVCSRIRVIPRRELCVCKTCPKVCKLCRDDIQCMRPDPFCREIFRS [서열번호 107]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 107에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 SeV V 폴리펩티드는 다음과 같은 서열번호 108의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGATCAAGATGCCTTCATTCTTAAAGAAGATTCTGAAGTTGAGAGGGAGGCGCCAGGAGGAAGAGAGTCGCTCTCGGATGTTATCGGATTCCTCGATGCTGTCCTGTCGAGTGAACCAACTGACATCGGAGGGGACAGAAGCTGGCTCCACAACACCATCAACACTCCCCAAGGACCAGGCTCTGCCCATAGAGCCAAAAGTGAGGGCGAAGGAGAAGTCTCAACACCGTCGACCCAAGATAATCGATCAGGTGAGGAGAGTAGAGTCTCTGGGAGAACAAGCAAGCCAGAGGCAGAAGCACATGCTGGAAACCTTGATAAACAAAATATACACCGGGCCTTTGGGGGAAGAACTGGTACAAACTCTGTATCTCAGGATCTGGGCGATGGAGGAGACTCCGGAATCCTTGAAAATCCCCCAAATGAGAGAGGATATCCGAGATCAGGTATTGAAGATGAAAACAGAGAGATGGCTGCGCACCCTGATAAGAGGGGAGAAGACCAAGCTGAAGGACTTCCAGAAGAGGTACGAGGAGGTACATCCCTACCTGATGAAGGAGAAGGTGGAGCAAGTAATAATGGAAGAAGCATGGAGCCTGGCAGCTCACATAGTGCAAGAGTAACTGGGGTCCTGGTGATTCCTAGCCCCGAACTCGAAGAGGCTGTGCTACGGAGGAACAAAAGAAGACCTACCAACAGTGGGTCCAAACCTCTTACTCCAGCAACCGTGCCTGGCACCCGGTCCCCACCGCTGAATCGTTACAACAGCACAGGGTCACCACCAGGAAAACCCCCATCTACACAGGATGAGCACATCAACTCTGGGGACACCCCCGCCGTCAGGGTCAAAGACCGGAAACCACCAATAGGGACCCGCTCTGTCTCAGATTGTCCAGCCAACGGCCGCCCAATCCACCCGGGTCTAGAGACCGACTCAACAAAAAAGGGgCATAGGAGAGAACACATCATCTATGAAAGAGATGGCTACATTGTTGACGAGTCTTGGTGTAATCCAGTCTGCTCAAGAATTCGAGTCATCCCGAGACGCGAGTTATGTGTTTGCAAGACGTGCCCTAAAGTCTGCAAACTATGCAGAGATGACATTCAATGTATGCGGCCTGATCCTTTCTGCCGAGAAATCTTCCGCTCG [서열번호 108]
따라서, 바람직하게는 상기 SeV V 폴리펩티드는 실질적으로 서열번호 108에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 SeV V 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 109로 제공된다:
ATGGACCAGGACGCCTTCATCCTGAAAGAGGACAGCGAGGTCGAGAGAGAAGCCCCTGGCGGAAGAGAAAGCCTGTCCGATGTGATCGGCTTCCTGGATGCCGTGCTGAGCAGCGAGCCTACAGATATCGGCGGCGATAGAAGCTGGCTGCACAACACCATCAACACCCCTCAAGGCCCTGGCTCTGCCCACAGAGCTAAGTCTGAAGGCGAGGGCGAAGTGTCTACCCCTAGCACACAGGACAACAGAAGCGGCGAGGAATCCAGAGTGTCCGGCAGAACAAGCAAGCCTGAGGCCGAAGCTCACGCCGGCAATCTGGACAAGCAGAACATCCACAGAGCCTTCGGCGGCAGAACCGGCACAAATAGCGTGTCACAGGACCTCGGAGATGGCGGCGATTCTGGCATCCTGGAAAACCCTCCAAACGAGCGGGGCTACCCTAGAAGCGGAATCGAGGACGAGAACAGAGAGATGGCCGCTCATCCCGACAAGAGAGGCGAAGATCAGGCCGAGGGACTGCCTGAAGAAGTGCGCGGAGGAACAAGCCTGCCTGACGAAGGCGAAGGCGGAGCCTCTAACAACGGCAGATCTATGGAACCCGGCAGCAGCCATAGCGCCAGAGTTACAGGCGTGCTGGTCATCCCATCTCCAGAGCTGGAAGAGGCTGTGCTGAGGCGGAACAAGAGAAGGCCTACCAACAGCGGCAGCAAGCCTCTGACACCAGCTACAGTGCCTGGCACAAGAAGCCCTCCACTGAACCGGTACAACAGCACAGGCTCTCCACCTGGCAAGCCTCCATCCACACAGGATGAGCACATCAACTCCGGCGATACCCCTGCCGTCAGAGTGAAGGACAGAAAGCCTCCTATCGGCACCAGAAGCGTGTCCGACTGTCCTGCCAATGGCAGACCTATTCACCCCGGCCTGGAAACCGACAGCACCAAGAAGGGACACAGACGGGAACACATCATCTACGAGCGCGACGGCTACATCGTGGACGAGAGCTGGTGCAACCCTGTGTGCAGCCGGATCAGAGTGATCCCTCGGAGAGAACTGTGCGTGTGCAAGACATGCCCCAAAGTGTGCAAGCTGTGCCGGGACGACATCCAGTGTATGCGGCCCGATCCTTTCTGCAGAGAGATCTTCAGAAGC [서열번호 109]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 109에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 109의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 110으로 제공된다:
AUGGACCAGGACGCCUUCAUCCUGAAAGAGGACAGCGAGGUCGAGAGAGAAGCCCCUGGCGGAAGAGAAAGCCUGUCCGAUGUGAUCGGCUUCCUGGAUGCCGUGCUGAGCAGCGAGCCUACAGAUAUCGGCGGCGAUAGAAGCUGGCUGCACAACACCAUCAACACCCCUCAAGGCCCUGGCUCUGCCCACAGAGCUAAGUCUGAAGGCGAGGGCGAAGUGUCUACCCCUAGCACACAGGACAACAGAAGCGGCGAGGAAUCCAGAGUGUCCGGCAGAACAAGCAAGCCUGAGGCCGAAGCUCACGCCGGCAAUCUGGACAAGCAGAACAUCCACAGAGCCUUCGGCGGCAGAACCGGCACAAAUAGCGUGUCACAGGACCUCGGAGAUGGCGGCGAUUCUGGCAUCCUGGAAAACCCUCCAAACGAGCGGGGCUACCCUAGAAGCGGAAUCGAGGACGAGAACAGAGAGAUGGCCGCUCAUCCCGACAAGAGAGGCGAAGAUCAGGCCGAGGGACUGCCUGAAGAAGUGCGCGGAGGAACAAGCCUGCCUGACGAAGGCGAAGGCGGAGCCUCUAACAACGGCAGAUCUAUGGAACCCGGCAGCAGCCAUAGCGCCAGAGUUACAGGCGUGCUGGUCAUCCCAUCUCCAGAGCUGGAAGAGGCUGUGCUGAGGCGGAACAAGAGAAGGCCUACCAACAGCGGCAGCAAGCCUCUGACACCAGCUACAGUGCCUGGCACAAGAAGCCCUCCACUGAACCGGUACAACAGCACAGGCUCUCCACCUGGCAAGCCUCCAUCCACACAGGAUGAGCACAUCAACUCCGGCGAUACCCCUGCCGUCAGAGUGAAGGACAGAAAGCCUCCUAUCGGCACCAGAAGCGUGUCCGACUGUCCUGCCAAUGGCAGACCUAUUCACCCCGGCCUGGAAACCGACAGCACCAAGAAGGGACACAGACGGGAACACAUCAUCUACGAGCGCGACGGCUACAUCGUGGACGAGAGCUGGUGCAACCCUGUGUGCAGCCGGAUCAGAGUGAUCCCUCGGAGAGAACUGUGCGUGUGCAAGACAUGCCCCAAAGUGUGCAAGCUGUGCCGGGACGACAUCCAGUGUAUGCGGCCCGAUCCUUUCUGCAGAGAGAUCUUCAGAAGC [서열번호 110]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 110에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 홍역 비-구조 단백질 V(Ichinose-B95a 바이러스주)(P0C774), 또는 그의 동원체이다. 홍역 V 단백질의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 111로 나타낸다:
MAEEQARHVKNGLECIRALKAEPIGSLAVEEAMAAWSEISDNPGQDRATCKEEEAGSSGLSKPCLSAIGSTEGGAPRIRGQGSGESDDDAETLGIPSRNLQASSTGLQCYHVYDHSGEAVKGIQDADSIMVQSGLDGDSTLSGGDDESENSDVDIGEPDTEGYAITDRGSAPISMGFRASDVETAEGGEIHELLKLQSRGNNFPKLGKTLNVPPPPNPSRASTSETPIKKGHRREIGLIWNGDRVFIDRWCNPMCSKVTLGTIRARCTCGECPRVCEQCRTDTGVDTRIWYHNLPEIPE [서열번호 111]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 111에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 홍역 V 폴리펩티드는 다음과 같은 서열번호 112의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGCAGAAGAGCAGGCACGCCATGTCAAAAACGGACTGGAATGCATCCGGGCTCTCAAGGCCGAGCCCATCGGCTCACTGGCCGTCGAGGAAGCCATGGCAGCATGGTCAGAAATATCAGACAACCCAGGACAGGACCGAGCCACCTGCAAGGAAGAGGAGGCAGGCAGTTCGGGTCTCAGCAAACCATGCCTCTCAGCAATTGGATCAACTGAAGGCGGTGCACCTCGCATCCGCGGTCAGGGATCTGGAGAAAGCGATGACGACGCTGAAACTTTGGGAATCCCCTCAAGAAATCTCCAGGCATCAAGCACTGGGTTACAGTGTTATCATGTTTATGATCACAGCGGTGAAGCGGTTAAGGGAATCCAAGATGCTGACTCTATCATGGTTCAATCAGGCCTTGATGGTGATAGCACCCTCTCAGGAGGAGACGATGAATCTGAAAACAGCGATGTGGATATTGGCGAACCTGATACCGAGGGATATGCTATCACTGACCGGGGATCTGCTCCCATCTCTATGGGGTTCAGGGCTTCTGATGTTGAAACTGCAGAAGGAGGGGAGATCCACGAGCTCCTGAAACTCCAATCCAGAGGCAACAACTTTCCGAAGCTTGGGAAAACTCTCAATGTTCCTCCGCCCCCGAACCCCAGTAGGGCCAGCACTTCCGAGACACCCATTAAAAAGGGgCACAGACGCGAGATTGGCCTCATTTGGAACGGAGATCGCGTCTTTATTGACAGGTGGTGCAACCCAATGTGCTCGAAAGTCACCCTCGGAACCATCAGGGCCAGGTGCACCTGCGGGGAATGTCCCCGAGTGTGTGAGCAATGCCGCACTGATACAGGAGTGGACACCCGAATCTGGTACCACAATCTCCCCGAGATCCCAGAA [서열번호 112]
따라서, 바람직하게는 상기 홍역 V 폴리펩티드는 실질적으로 서열번호 112에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 홍역 V 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 113으로 제공된다:
ATGGCCGAAGAACAGGCCAGACACGTGAAGAACGGCCTGGAATGCATCAGAGCCCTGAAGGCCGAGCCTATCGGATCTCTGGCTGTGGAAGAAGCCATGGCCGCTTGGAGCGAGATCAGCGATAATCCCGGCCAGGACCGGGCCACCTGTAAAGAAGAAGAGGCCGGATCTAGCGGCCTGAGCAAGCCTTGTCTGTCTGCCATCGGCTCTACAGAAGGCGGCGCTCCTAGAATCAGAGGCCAAGGATCTGGCGAGAGCGACGACGATGCTGAGACACTGGGCATCCCCAGCAGAAATCTGCAGGCCAGCTCTACCGGCCTGCAGTGCTATCACGTGTACGATCACTCTGGCGAGGCCGTGAAGGGAATCCAGGATGCCGATAGCATCATGGTGCAGAGCGGCCTGGATGGCGACTCTACACTTAGCGGCGGAGATGACGAGAGCGAGAACTCCGATGTGGACATCGGCGAGCCTGATACAGAGGGCTACGCCATCACAGACAGAGGCAGCGCCCCTATCAGCATGGGCTTTAGAGCCAGCGACGTGGAAACAGCCGAAGGCGGAGAGATTCACGAGCTGCTGAAGCTGCAGAGCCGGGGCAACAACTTTCCCAAGCTGGGCAAGACCCTGAACGTGCCACCTCCTCCAAATCCTAGCAGAGCCAGCACCAGCGAGACACCCATCAAGAAGGGCCACAGAAGAGAGATCGGCCTGATCTGGAACGGCGACCGGGTGTTCATCGACAGATGGTGCAACCCCATGTGCAGCAAAGTGACCCTGGGCACCATCCGGGCCAGATGTACATGCGGAGAGTGCCCTAGAGTGTGCGAGCAGTGCAGAACCGATACCGGCGTGGACACCCGGATCTGGTATCACAACCTGCCTGAGATCCCCGAG [서열번호 113]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 113에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 113의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 114로 제공된다:
AUGGCCGAAGAACAGGCCAGACACGUGAAGAACGGCCUGGAAUGCAUCAGAGCCCUGAAGGCCGAGCCUAUCGGAUCUCUGGCUGUGGAAGAAGCCAUGGCCGCUUGGAGCGAGAUCAGCGAUAAUCCCGGCCAGGACCGGGCCACCUGUAAAGAAGAAGAGGCCGGAUCUAGCGGCCUGAGCAAGCCUUGUCUGUCUGCCAUCGGCUCUACAGAAGGCGGCGCUCCUAGAAUCAGAGGCCAAGGAUCUGGCGAGAGCGACGACGAUGCUGAGACACUGGGCAUCCCCAGCAGAAAUCUGCAGGCCAGCUCUACCGGCCUGCAGUGCUAUCACGUGUACGAUCACUCUGGCGAGGCCGUGAAGGGAAUCCAGGAUGCCGAUAGCAUCAUGGUGCAGAGCGGCCUGGAUGGCGACUCUACACUUAGCGGCGGAGAUGACGAGAGCGAGAACUCCGAUGUGGACAUCGGCGAGCCUGAUACAGAGGGCUACGCCAUCACAGACAGAGGCAGCGCCCCUAUCAGCAUGGGCUUUAGAGCCAGCGACGUGGAAACAGCCGAAGGCGGAGAGAUUCACGAGCUGCUGAAGCUGCAGAGCCGGGGCAACAACUUUCCCAAGCUGGGCAAGACCCUGAACGUGCCACCUCCUCCAAAUCCUAGCAGAGCCAGCACCAGCGAGACACCCAUCAAGAAGGGCCACAGAAGAGAGAUCGGCCUGAUCUGGAACGGCGACCGGGUGUUCAUCGACAGAUGGUGCAACCCCAUGUGCAGCAAAGUGACCCUGGGCACCAUCCGGGCCAGAUGUACAUGCGGAGAGUGCCCUAGAGUGUGCGAGCAGUGCAGAACCGAUACCGGCGUGGACACCCGGAUCUGGUAUCACAACCUGCCUGAGAUCCCCGAG [서열번호 114]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 114에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 니파 바이러스(Nipah virus) 비-구조 단백질 V(NiV V 단백질)(Q997F2; V_NIPAV), 또는 그의 동원체이다. NiV V 단백질의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 115로 나타낸다:
MDKLELVNDGLNIIDFIQKNQKEIQKTYGRSSIQQPSIKDQTKAWEDFLQCTSGESEQVEGGMSKDDGDVERRNLEDLSSTSPTDGTIGKRVSNTRDWAEGSDDIQLDPVVTDVVYHDHGGECTGYGFTSSPERGWSDYTSGANNGNVCLVSDAKMLSYAPEIAVSKEDRETDLVHLENKLSTTGLNPTAVPFTLRNLSDPAKDSPVIAEHYYGLGVKEQNVGPQTSRNVNLDSIKLYTSDDEEADQLEFEDEFAGSSSEVIVGISPEDEEPSSVGGKPNESIGRTIEGQSIRDNLQAKDNKSTDVPGAGPKDSAVKEEPPQKRLPMLAEEFECSGSEDPIIRELLKENSLINCQQGKDAQPPYHWSIERSISPDKTEIVNGAVQTADRQRPGTPMPKSRGIPIKKGHRREISICWDGKRAWVEEWCNPACSRITPLPRRQECQCGECPTECFHCG [서열번호 115]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 115에 나타낸 것과 같은 아미노산 서열을 암호화하는 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
한 구현예에서, 상기 NiV V 폴리펩티드는 다음과 같은 서열번호 116의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGATAAATTGGAACTAGTCAATGATGGCCTCAATATTATTGACTTTATTCAGAAGAACCAAAAAGAAATACAGAAGACATACGGACGATCAAGTATTCAACAACCCAGCATCAAAGATCAAACAAAAGCCTGGGAAGATTTTCTGCAGTGCACCAGTGGAGAATCTGAACAAGTTGAGGGGGGAATGTCTAAGGATGATGGAGATGTTGAAAGAAGAAACTTGGAGGATCTATCCAGTACTTCTCCCACAGATGGAACTATTGGAAAGAGAGTGTCGAACACCCGTGACTGGGCAGAAGGTTCAGATGACATACAACTGGACCCAGTGGTTACAGACGTTGTATACCATGATCATGGAGGAGAATGTACCGGATATGGATTTACTTCAAGCCCTGAGAGAGGGTGGAGTGATTACACATCAGGAGCAAACAATGGGAATGTATGTCTTGTATCTGATGCAAAGATGCTGTCCTATGCTCCCGAAATTGCAGTTTCTAAAGAAGATCGGGAAACTGATCTAGTTCATCTTGAGAATAAACTATCTACTACAGGACTGAATCCCACAGCAGTACCGTTCACTCTGAGAAACCTGTCTGATCCTGCAAAAGACTCTCCTGTGATTGCTGAACACTACTACGGACTAGGAGTTAAAGAGCAAAACGTTGGCCCTCAGACTAGCAGAAATGTCAATTTGGACAGCATCAAATTGTACACATCAGATGACGAAGAGGCAGATCAGCTTGAATTCGAAGATGAGTTTGCAGGAAGCTCAAGTGAAGTGATAGTCGGCATTTCTCCTGAAGATGAAGAGCCTTCAAGTGTTGGCGGAAAACCCAATGAATCCATTGGACGTACAATCGAAGGCCAATCAATCCGAGACAACCTTCAAGCCAAGGACAACAAATCAACAGATGTACCAGGAGCAGGACCGAAAGATTCAGCAGTGAAGGAAGAACCACCCCAGAAGAGGCTACCTATGTTAGCTGAAGAATTTGAGTGCTCTGGATCGGAAGACCCAATCATTCGGGAGCTGCTGAAGGAGAACTCACTCATAAATTGTCAGCAAGGGAAAGATGCTCAGCCTCCATATCATTGGAGCATCGAGAGGTCAATAAGCCCGGATAAAACTGAGATCGTCAACGGTGCTGTGCAAACTGCTGACAGGCAAAGACCAGGAACTCCGATGCCAAAGTCCCGAGGTATTCCCATTAAAAAGGGGCACAGACGCGAAATATCCATCTGCTGGGACGGAAAACGTGCCTGGGTCGAAGAGTGGTGCAACCCGGCATGTTCGAGGATCACCCCCCTACCAAGAAGGCAAGAGTGTCAATGCGGAGAATGTCCAACTGAATGCTTCCACTGCGGT [서열번호 116]
따라서, 바람직하게는 상기 NiV V 폴리펩티드는 실질적으로 서열번호 116에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 NiV V 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 117로 제공된다:
ATGGACAAGCTGGAACTGGTCAACGACGGCCTGAACATCATCGACTTCATCCAGAAGAACCAGAAAGAGATCCAGAAAACCTACGGCCGGTCCAGCATCCAGCAGCCTAGCATCAAGGATCAGACCAAGGCCTGGGAAGATTTCCTGCAGTGTACCAGCGGCGAGAGCGAACAGGTTGAAGGCGGCATGAGCAAGGACGACGGCGACGTGGAAAGACGGAACCTGGAAGATCTGAGCAGCACAAGCCCTACCGATGGCACCATCGGCAAGCGGGTGTCCAACACAAGAGATTGGGCCGAGGGCAGCGACGACATTCAGCTGGATCCTGTGGTCACCGATGTGGTGTACCACGATCACGGCGGCGAGTGTACAGGCTACGGCTTTACAAGCAGCCCCGAGAGAGGCTGGAGCGATTATACAAGCGGCGCCAACAACGGCAACGTGTGCCTGGTGTCTGACGCCAAGATGCTGAGCTACGCCCCTGAGATCGCCGTGTCCAAAGAGGACAGAGAAACCGACCTGGTGCACCTGGAAAACAAGCTGAGCACCACCGGACTGAACCCTACCGCCGTGCCTTTCACACTGAGAAACCTGAGCGACCCCGCCAAGGACTCTCCTGTGATTGCCGAGCACTACTACGGCCTGGGCGTGAAAGAACAGAACGTGGGCCCTCAGACCAGCCGGAACGTGAACCTGGATTCCATCAAGCTGTACACCTCCGACGACGAGGAAGCCGACCAGCTGGAATTCGAGGATGAGTTTGCCGGCAGCAGCAGCGAAGTGATTGTGGGCATCAGCCCTGAGGACGAGGAACCTAGCTCTGTTGGCGGCAAGCCCAATGAGAGCATCGGCAGAACAATCGAGGGCCAGAGCATCCGGGATAACCTGCAGGCCAAGGACAACAAGAGCACCGATGTTCCAGGCGCTGGCCCTAAGGATAGCGCCGTGAAAGAGGAACCACCTCAGAAACGGCTGCCCATGCTGGCCGAGGAATTTGAGTGTAGCGGCAGCGAGGACCCCATCATCAGAGAGCTGCTGAAAGAGAACAGCCTGATCAACTGCCAGCAGGGCAAAGACGCCCAGCCTCCTTACCACTGGTCCATCGAGAGATCTATCAGCCCCGACAAGACCGAGATCGTGAATGGCGCTGTGCAGACCGCCGATAGACAGAGGCCTGGAACTCCCATGCCTAAGAGCAGAGGCATCCCCATCAAGAAGGGCCACAGAAGAGAGATCAGCATCTGCTGGGACGGCAAGCGCGCCTGGGTTGAAGAGTGGTGTAATCCCGCCTGCAGCCGGATCACACCTCTGCCTAGAAGGCAAGAGTGCCAGTGTGGCGAGTGTCCCACCGAGTGTTTTCACTGTGGA [서열번호 117]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 117에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 117의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 118로 제공된다:
AUGGACAAGCUGGAACUGGUCAACGACGGCCUGAACAUCAUCGACUUCAUCCAGAAGAACCAGAAAGAGAUCCAGAAAACCUACGGCCGGUCCAGCAUCCAGCAGCCUAGCAUCAAGGAUCAGACCAAGGCCUGGGAAGAUUUCCUGCAGUGUACCAGCGGCGAGAGCGAACAGGUUGAAGGCGGCAUGAGCAAGGACGACGGCGACGUGGAAAGACGGAACCUGGAAGAUCUGAGCAGCACAAGCCCUACCGAUGGCACCAUCGGCAAGCGGGUGUCCAACACAAGAGAUUGGGCCGAGGGCAGCGACGACAUUCAGCUGGAUCCUGUGGUCACCGAUGUGGUGUACCACGAUCACGGCGGCGAGUGUACAGGCUACGGCUUUACAAGCAGCCCCGAGAGAGGCUGGAGCGAUUAUACAAGCGGCGCCAACAACGGCAACGUGUGCCUGGUGUCUGACGCCAAGAUGCUGAGCUACGCCCCUGAGAUCGCCGUGUCCAAAGAGGACAGAGAAACCGACCUGGUGCACCUGGAAAACAAGCUGAGCACCACCGGACUGAACCCUACCGCCGUGCCUUUCACACUGAGAAACCUGAGCGACCCCGCCAAGGACUCUCCUGUGAUUGCCGAGCACUACUACGGCCUGGGCGUGAAAGAACAGAACGUGGGCCCUCAGACCAGCCGGAACGUGAACCUGGAUUCCAUCAAGCUGUACACCUCCGACGACGAGGAAGCCGACCAGCUGGAAUUCGAGGAUGAGUUUGCCGGCAGCAGCAGCGAAGUGAUUGUGGGCAUCAGCCCUGAGGACGAGGAACCUAGCUCUGUUGGCGGCAAGCCCAAUGAGAGCAUCGGCAGAACAAUCGAGGGCCAGAGCAUCCGGGAUAACCUGCAGGCCAAGGACAACAAGAGCACCGAUGUUCCAGGCGCUGGCCCUAAGGAUAGCGCCGUGAAAGAGGAACCACCUCAGAAACGGCUGCCCAUGCUGGCCGAGGAAUUUGAGUGUAGCGGCAGCGAGGACCCCAUCAUCAGAGAGCUGCUGAAAGAGAACAGCCUGAUCAACUGCCAGCAGGGCAAAGACGCCCAGCCUCCUUACCACUGGUCCAUCGAGAGAUCUAUCAGCCCCGACAAGACCGAGAUCGUGAAUGGCGCUGUGCAGACCGCCGAUAGACAGAGGCCUGGAACUCCCAUGCCUAAGAGCAGAGGCAUCCCCAUCAAGAAGGGCCACAGAAGAGAGAUCAGCAUCUGCUGGGACGGCAAGCGCGCCUGGGUUGAAGAGUGGUGUAAUCCCGCCUGCAGCCGGAUCACACCUCUGCCUAGAAGGCAAGAGUGCCAGUGUGGCGAGUGUCCCACCGAGUGUUUUCACUGUGGA [서열번호 118]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 118에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 POLG_EMCV(뇌심근염 바이러스 2C) 게놈 폴리단백질(Li L, Fan H, Song Z, Liu X, Bai J, Jiang P (2019) Encephalomyocarditis virus 2C protein antagonizes interferon-B signaling pathway through interaction with MDA5 Antiviral Res, 161, 70-84), 또는 그의 동원체이다. EMCV의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 119로 나타낸다:
LKARDINDIFAILKNGEWLVKLILAIRDWIKAWIASEEKFVTMTDLVPGILEKQRDLNDPSKYKEAKEWLDNARQACLKSGNVHIANLCKVVAPAPSKSRPEPVVVCLRGKSGQGKSFLANVLAQAISTHFTGRIDSVWYCPPDPDHFDGYNQQTVVVMDDLGQNPDGKDFKYFAQMVSTTGFIPPMASLEDKGKPFNSKVIIATTNLYSGFTPRTMVCPDALNRRFHFDIDVSAKDGYKINSKLDIIKALEDTHANPVAMFQYDCALLNGMAVEMKRMQQDMFKPQPPLQNVYQLVQEVIDRVELHEKVSSHPIFKQ [서열번호 119]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 119에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 EMCV 폴리펩티드는 다음과 같은 서열번호 120의 DNA 뉴클레오티드 서열에 의해 암호화된다:
CTCAAAGCACGTGACATCAACGACATCTTCGCCATTCTCAAGAACGGCGAGTGGCTGGTCAAACTGATCCTTGCCATCCGCGACTGGATTAAGGCTTGGATCGCCTCAGAAGAGAAGTTTGTCACCATGACAGACTTGGTGCCTGGCATCCTTGAAAAGCAGCGGGACCTGAACGACCCGAGCAAGTACAAGGAAGCCAAGGAGTGGCTCGACAACGCGCGCCAAGCGTGTTTGAAGAGCGGGAACGTCCACATTGCCAACCTGTGCAAAGTGGTCGCACCAGCACCCAGCAAGTCGAGGCCCGAACCCGTGGTTGTTTGCCTCCGCGGCAAATCTGGCCAGGGCAAGAGCTTCCTTGCAAACGTGCTTGCACAGGCAATTTCCACCCACTTCACCGGCAGAATCGACTCAGTGTGGTACTGCCCACCTGACCCTGACCACTTCGACGGTTACAACCAGCAAACCGTTGTTGTGATGGATGATTTGGGCCAGAACCCTGACGGCAAGGACTTCAAATACTTTGCCCAAATGGTCTCGACCACAGGGTTTATCCCGCCCATGGCATCACTCGAGGACAAAGGTAAACCTTTCAACAGCAAAGTCATCATCGCGACCACCAACTTGTACTCGGGCTTCACCCCGAGGACCATGGTATGTCCCGACGCACTGAACCGGAGGTTTCACTTTGACATCGATGTGAGTGCTAAGGATGGGTACAAAATTAACAGCAAATTGGACATTATCAAAGCACTCGAAGACACCCACGCCAACCCAGTGGCAATGTTTCAATACGACTGTGCCCTTCTCAACGGCATGGCCGTTGAAATGAAGAGAATGCAACAAGACATGTTCAAGCCTCAACCACCCCTCCAGAATGTGTACCAGCTTGTTCAGGAGGTGATCGATCGGGTCGAGCTCCACGAGAAAGTGTCGAGTCACCCGATCTTCAAGCAG [서열번호 120]
따라서, 바람직하게는 상기 EMCV 폴리펩티드는 실질적으로 서열번호 120에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 EMCV 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 121로 제공된다:
CTGAAGGCCAGAGACATCAACGACATCTTCGCCATCCTGAAGAACGGCGAGTGGCTGGTCAAGCTGATCCTGGCCATCAGAGACTGGATCAAGGCCTGGATCGCCAGCGAAGAGAAGTTCGTGACCATGACCGATCTGGTGCCCGGCATCCTGGAAAAGCAGAGGGACCTGAACGACCCCAGCAAGTACAAAGAGGCCAAAGAATGGCTGGACAACGCCAGACAGGCCTGCCTGAAGTCCGGCAATGTGCATATCGCCAACCTGTGCAAGGTGGTGGCCCCTGCTCCTAGCAAGTCTAGACCTGAGCCTGTGGTCGTGTGCCTGAGAGGCAAATCTGGCCAGGGCAAGAGCTTCCTGGCCAATGTTCTGGCCCAGGCCATCAGCACCCACTTCACCGGAAGAATCGACAGCGTGTGGTACTGCCCTCCTGATCCTGACCACTTCGACGGCTACAACCAGCAGACCGTGGTGGTCATGGACGACCTGGGACAGAACCCCGACGGCAAGGACTTCAAGTACTTCGCCCAGATGGTGTCCACCACCGGCTTCATTCCTCCAATGGCCAGCCTGGAAGATAAGGGCAAGCCCTTCAACAGCAAAGTGATCATTGCCACCACCAACCTGTACAGCGGCTTCACCCCTAGAACCATGGTCTGCCCCGACGCTCTGAACAGACGGTTCCACTTTGACATCGACGTGTCCGCCAAGGATGGCTACAAGATCAACTCCAAGCTGGACATCATCAAGGCCCTCGAGGACACCCACGCCAATCCTGTGGCCATGTTCCAGTACGATTGCGCCCTGCTGAATGGCATGGCCGTGGAAATGAAGCGGATGCAGCAGGACATGTTCAAGCCCCAGCCTCCACTGCAGAACGTGTACCAGCTCGTGCAAGAAGTGATCGACCGGGTCGAGCTGCACGAGAAGGTGTCCTCTCATCCCATCTTCAAGCAG [서열번호 121]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 121에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 121의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 122로 제공된다:
CUGAAGGCCAGAGACAUCAACGACAUCUUCGCCAUCCUGAAGAACGGCGAGUGGCUGGUCAAGCUGAUCCUGGCCAUCAGAGACUGGAUCAAGGCCUGGAUCGCCAGCGAAGAGAAGUUCGUGACCAUGACCGAUCUGGUGCCCGGCAUCCUGGAAAAGCAGAGGGACCUGAACGACCCCAGCAAGUACAAAGAGGCCAAAGAAUGGCUGGACAACGCCAGACAGGCCUGCCUGAAGUCCGGCAAUGUGCAUAUCGCCAACCUGUGCAAGGUGGUGGCCCCUGCUCCUAGCAAGUCUAGACCUGAGCCUGUGGUCGUGUGCCUGAGAGGCAAAUCUGGCCAGGGCAAGAGCUUCCUGGCCAAUGUUCUGGCCCAGGCCAUCAGCACCCACUUCACCGGAAGAAUCGACAGCGUGUGGUACUGCCCUCCUGAUCCUGACCACUUCGACGGCUACAACCAGCAGACCGUGGUGGUCAUGGACGACCUGGGACAGAACCCCGACGGCAAGGACUUCAAGUACUUCGCCCAGAUGGUGUCCACCACCGGCUUCAUUCCUCCAAUGGCCAGCCUGGAAGAUAAGGGCAAGCCCUUCAACAGCAAAGUGAUCAUUGCCACCACCAACCUGUACAGCGGCUUCACCCCUAGAACCAUGGUCUGCCCCGACGCUCUGAACAGACGGUUCCACUUUGACAUCGACGUGUCCGCCAAGGAUGGCUACAAGAUCAACUCCAAGCUGGACAUCAUCAAGGCCCUCGAGGACACCCACGCCAAUCCUGUGGCCAUGUUCCAGUACGAUUGCGCCCUGCUGAAUGGCAUGGCCGUGGAAAUGAAGCGGAUGCAGCAGGACAUGUUCAAGCCCCAGCCUCCACUGCAGAACGUGUACCAGCUCGUGCAAGAAGUGAUCGACCGGGUCGAGCUGCACGAGAAGGUGUCCUCUCAUCCCAUCUUCAAGCAG [서열번호 122]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 122에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 버나바이러스 VP3(조류 전염성 파브리우스낭병 바이러스(IBDV)(감보로(Gumboro) 질환 바이러스) 캡시드 단백질 VP3), 또는 그의 동원체이다. [Ye C, Jia L, Sun Y, Hu B, Wang L, Xingmeng L, Zu J (2014) Inhibition of antiviral innate immunity by birnavirus VP3 protein via blockage of viral double-stranded RNA binding to the host cytoplasmic RNA detector MDA5. J Virol. 88, 18, 11154-11156]. 버나바이러스 VP3의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 123으로 나타낸다:
ASEFKETPELESAVRAMEAAANVDPLFQSALSVFMWLEENGIVTDMANFALSDPNAHRMRNFLANAPQAGSKSQRAKYGTAGYGVEARGPTPEEAQREKDTRISKKMETMGIYFATPEWVALNGHRGPSPGQLKYWQNTREIPDPNEDYLDYVHAEKSRLASEEQILRAATSIYGAPGQAEPPQAFIDEVAKVYEINHGRGPNQEQMKDLLLTAMEMKHRNPRRALPKPKPKPNAPTQRPPGRLGRWIRTVSDEDLE [서열번호 123]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 123에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 버나바이러스 VP3 폴리펩티드는 다음과 같은 서열번호 124의 DNA 뉴클레오티드 서열에 의해 암호화된다:
GCATCAGAGTTCAAAGAGACCCCCGAACTCGAGAGTGCCGTCAGAGCAATGGAAGCAGCAGCCAACGTGGACCCACTATTCCAATCTGCACTCAGTGTGTTCATGTGGCTGGAAGAGAATGGGATTGTGACTGACATGGCCAACTTCGCACTCAGCGACCCGAACGCCCATCGGATGCGAAATTTTCTTGCAAACGCACCACAAGCAGGCAGCAAGTCGCAAAGGGCCAAGTACGGGACAGCAGGCTACGGAGTGGAGGCTCGGGGCCCCACACCAGAGGAAGCACAGAGGGAAAAAGACACACGGATCTCAAAGAAGATGGAGACCATGGGCATCTACTTTGCAACACCAGAATGGGTAGCACTCAATGGGCACCGAGGGCCAAGCCCCGGCCAGCTAAAGTACTGGCAGAACACACGAGAAATACCGGACCCAAACGAGGACTATCTAGACTACGTGCATGCAGAGAAGAGCCGGTTGGCATCAGAAGAACAAATCCTAAGGGCAGCTACGTCGATCTACGGGGCTCCAGGACAGGCAGAGCCACCCCAAGCTTTCATAGACGAAGTTGCCAAAGTCTATGAAATCAACCATGGACGTGGCCCAAACCAAGAACAGATGAAAGATCTGCTCTTGACTGCGATGGAGATGAAGCATCGCAATCCCAGGCGGGCTCTACCAAAGCCCAAGCCAAAACCCAATGCTCCAACACAGAGACCCCCTGGTCGGCTGGGCCGCTGGATCAGGACCGTCTCTGATGAGGACCTTGAG [서열번호 124]
따라서, 바람직하게는 상기 버나바이러스 VP3 폴리펩티드는 실질적으로 서열번호 124에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 버나바이러스 VP3 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 125로 제공된다:
GCCAGCGAGTTCAAAGAGACACCCGAGCTGGAAAGCGCCGTCAGAGCTATGGAAGCCGCCGCTAATGTGGACCCTCTGTTTCAGTCTGCCCTGAGCGTGTTCATGTGGCTGGAAGAGAACGGCATCGTGACCGACATGGCCAACTTCGCCCTGTCTGACCCCAACGCTCACCGGATGAGAAACTTTCTGGCCAACGCTCCTCAGGCCGGCAGCAAGTCTCAGAGAGCCAAATACGGCACAGCCGGCTACGGCGTGGAAGCCAGAGGACCTACACCTGAGGAAGCCCAGAGAGAGAAGGACACCCGGATCAGCAAGAAAATGGAAACCATGGGCATCTACTTCGCCACACCTGAGTGGGTCGCCCTGAATGGACACAGAGGACCATCTCCAGGCCAGCTGAAGTACTGGCAGAACACCAGAGAGATCCCCGATCCTAACGAGGACTACCTGGACTACGTGCACGCCGAGAAAAGCAGACTGGCCAGCGAGGAACAGATCCTGAGAGCCGCCACATCCATCTATGGCGCTCCAGGACAAGCCGAACCTCCACAGGCCTTTATCGACGAGGTGGCCAAGGTGTACGAGATCAACCACGGCAGAGGCCCCAATCAAGAGCAGATGAAGGACCTGCTGCTGACCGCCATGGAAATGAAGCACAGAAACCCCAGACGGGCCCTGCCTAAGCCAAAGCCTAAACCTAACGCTCCCACACAGCGGCCTCCAGGCAGACTCGGAAGATGGATCAGAACCGTGTCCGACGAGGACCTGGAA [서열번호 125]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 125에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 125의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 126으로 제공된다:
GCCAGCGAGUUCAAAGAGACACCCGAGCUGGAAAGCGCCGUCAGAGCUAUGGAAGCCGCCGCUAAUGUGGACCCUCUGUUUCAGUCUGCCCUGAGCGUGUUCAUGUGGCUGGAAGAGAACGGCAUCGUGACCGACAUGGCCAACUUCGCCCUGUCUGACCCCAACGCUCACCGGAUGAGAAACUUUCUGGCCAACGCUCCUCAGGCCGGCAGCAAGUCUCAGAGAGCCAAAUACGGCACAGCCGGCUACGGCGUGGAAGCCAGAGGACCUACACCUGAGGAAGCCCAGAGAGAGAAGGACACCCGGAUCAGCAAGAAAAUGGAAACCAUGGGCAUCUACUUCGCCACACCUGAGUGGGUCGCCCUGAAUGGACACAGAGGACCAUCUCCAGGCCAGCUGAAGUACUGGCAGAACACCAGAGAGAUCCCCGAUCCUAACGAGGACUACCUGGACUACGUGCACGCCGAGAAAAGCAGACUGGCCAGCGAGGAACAGAUCCUGAGAGCCGCCACAUCCAUCUAUGGCGCUCCAGGACAAGCCGAACCUCCACAGGCCUUUAUCGACGAGGUGGCCAAGGUGUACGAGAUCAACCACGGCAGAGGCCCCAAUCAAGAGCAGAUGAAGGACCUGCUGCUGACCGCCAUGGAAAUGAAGCACAGAAACCCCAGACGGGCCCUGCCUAAGCCAAAGCCUAAACCUAACGCUCCCACACAGCGGCCUCCAGGCAGACUCGGAAGAUGGAUCAGAACCGUGUCCGACGAGGACCUGGAA [서열번호 126]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 126에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 돼지 델타 코로나바이러스 NS6 단백질(A0A0K2D1N4), 또는 그의 동원체이다. [Fang P, Fang L, Ren J, Hong Y, Liu X, Zhao Y, Wang D, Peng G, Xiai S (2018) Porcine deltacoronavirus accessory protein NS6 antagonises interferon beta production by interfering with the binding of RIG-I/MDA-5 to double stranded RNA. J Virol., 92, 15, e00712-18]. 돼지 델타 코로나바이러스 NS6의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 127로 나타낸다:
MCNCHLQLRDLYRLCNKLHIRRDDVPELIDPLVKTRCFAYSLVVLANANPIAFSILPRKILINGEPLLLEYGSIYGKDFIIRPSLQVILEDELN [서열번호 127]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 127에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 돼지 델타 코로나바이러스 NS6 폴리펩티드는 다음과 같은 서열번호 128의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGTGCAACTGCCATCTGCAGCTGCGAGATTTATATAGATTGTGCAATAAGCTGCACATCAGAAGAGACGATGTTCCTGAGCTTATTGACCCTCTCGTTAAAACTCGCTGTTTTGCTTACAGTCTCGTGGTTCTTGCTAATGCTAATCCAATTGCATTTAGCATACTACCTCGGAAAATTCTTATCAATGGTGAGCCTTTACTGCTTGAATATGGTAGCATATATGGTAAAGACTTTATCATTAGACCATCGCTCCAAGTCATTCTTGAAGATGAATTAAAT [서열번호 128]
따라서, 바람직하게는 상기 돼지 델타 코로나바이러스 NS6 폴리펩티드는 실질적으로 서열번호 128에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 돼지 델타 코로나바이러스 NS6 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 129로 제공된다:
ATGTGCAACTGCCATCTGCAGCTGCGGGACCTGTACCGGCTGTGTAACAAGCTGCACATCAGACGGGACGACGTGCCCGAGCTGATCGATCCTCTGGTCAAGACCAGATGCTTCGCCTACAGCCTGGTGGTGCTGGCCAACGCCAATCCTATCGCCTTCAGCATCCTGCCTCGGAAGATCCTGATCAACGGCGAGCCTCTGCTGCTGGAATACGGCAGCATCTACGGCAAGGACTTCATCATCAGACCCAGCCTGCAAGTGATCCTGGAAGATGAGCTGAACTGA [서열번호 129]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 129에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 129의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 130으로 제공된다:
AUGUGCAACUGCCAUCUGCAGCUGCGGGACCUGUACCGGCUGUGUAACAAGCUGCACAUCAGACGGGACGACGUGCCCGAGCUGAUCGAUCCUCUGGUCAAGACCAGAUGCUUCGCCUACAGCCUGGUGGUGCUGGCCAACGCCAAUCCUAUCGCCUUCAGCAUCCUGCCUCGGAAGAUCCUGAUCAACGGCGAGCCUCUGCUGCUGGAAUACGGCAGCAUCUACGGCAAGGACUUCAUCAUCAGACCCAGCCUGCAAGUGAUCCUGGAAGAUGAGCUGAACUGA [서열번호 130]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 130에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 LASV Z 단백질(O73557|RING 핑거(finger) 단백질 Z 라사 바이러스(Lassa virus)(마우스/시에라리온/조시아/1976 바이러스주), 또는 그의 동원체이다. [Xing J, Ly H, Liang YJ (2015) The Z proteins of pathogenic but not nonpathogenic arenaviruses inhibit RIG-I-like receptor-dependent interferon production. J Virol., 89, 5, 2944-2955]. LASV Z의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 131로 나타낸다:
MGNKQAKAPESKDSPRASLIPDATHLGPQFCKSCWFENKGLVECNNHYLCLNCLTLLLSVSNRCPICKMPLPTKLRPSAAPTAPPTGAADSIRPPPYSP [서열번호 131]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 131에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 LASV Z 폴리펩티드는 다음과 같은 서열번호 132의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGGAAACAAGCAAGCCAAAGCCCCAGAATCAAAAGACAGTCCGAGAGCCAGCCTGATCCCAGATGCCACACATCTAGGGCCACAGTTCTGTAAGAGCTGCTGGTTCGAAAACAAGGGCCTGGTTGAGTGCAACAACCACTATCTGTGTCTCAACTGCCTCACCTTACTTCTAAGTGTCAGCAACAGGTGTCCCATTTGCAAGATGCCTCTCCCCACAAAACTGAGACCATCAGCCGCTCCAACAGCACCTCCAACCGGAGCAGCGGACAGCATCAGACCCCCACCCTACAGTCCC [서열번호 132]
따라서, 바람직하게는 상기 LASV Z 폴리펩티드는 실질적으로 서열번호 132에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 LASV Z 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 133으로 제공된다:
ATGGGCAACAAGCAGGCCAAGGCTCCCGAGAGCAAGGATAGCCCTAGAGCCTCTCTGATCCCCGACGCCACACATCTGGGACCCCAGTTCTGCAAGAGCTGTTGGTTCGAGAACAAAGGCCTGGTGGAATGCAACAACCACTACCTGTGCCTGAACTGTCTGACCCTGCTGCTGAGCGTGTCCAACAGATGCCCCATCTGCAAGATGCCCCTGCCTACCAAGCTGAGGCCTTCTGCTGCTCCTACAGCTCCTCCAACAGGCGCCGCTGATAGCATCAGACCTCCACCTTATAGCCCC [서열번호 133]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 133에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 133의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 134로 제공된다:
AUGGGCAACAAGCAGGCCAAGGCUCCCGAGAGCAAGGAUAGCCCUAGAGCCUCUCUGAUCCCCGACGCCACACAUCUGGGACCCCAGUUCUGCAAGAGCUGUUGGUUCGAGAACAAAGGCCUGGUGGAAUGCAACAACCACUACCUGUGCCUGAACUGUCUGACCCUGCUGCUGAGCGUGUCCAACAGAUGCCCCAUCUGCAAGAUGCCCCUGCCUACCAAGCUGAGGCCUUCUGCUGCUCCUACAGCUCCUCCAACAGGCGCCGCUGAUAGCAUCAGACCUCCACCUUAUAGCCCC [서열번호 134]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 134에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 DANV Z 단백질(B1NX60; RING 핑거 단백질 Z 단데농 바이러스(Dandenong virus)), 또는 그의 동원체이다. DANV Z의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 135로 나타낸다:
MGQAKSKETKLSKKEDRAEVLPDATYLGPLNCKSCWQRFDSLVRCHDHYLCRQCLNLLLTVSDRCPLCKHPLPTKLRVSTAPSSPPPYEE [서열번호 135]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 135에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 DANV Z 폴리펩티드는 다음과 같은 서열번호 136의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGGTCAAGCAAAATCCAAAGAAACAAAGCTCTCCAAGAAAGAGGACAGAGCAGAGGTTCTACCTGACGCAACCTATCTTGGTCCTCTGAACTGCAAATCATGCTGGCAAAGGTTCGACAGTTTGGTTAGGTGCCATGACCACTACCTATGCAGGCAATGTCTGAACCTTTTGTTGACAGTCTCAGACAGATGCCCTCTCTGCAAACACCCTCTACCGACCAAGCTGAGGGTGTCGACAGCCCCCAGCTCACCTCCCCCCTACGAGGAG [서열번호 136]
따라서, 바람직하게는 상기 DANV Z 폴리펩티드는 실질적으로 서열번호 136에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 DANV Z 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 137로 제공된다:
ATGGGCCAAGCCAAGAGCAAAGAGACAAAGCTGAGCAAGAAAGAGGACCGCGCCGAGGTTCTGCCCGATGCCACATATCTGGGCCCTCTGAACTGCAAGAGCTGCTGGCAGAGATTCGACAGCCTCGTGCGGTGCCACGATCACTACCTGTGCAGACAGTGCCTGAACCTGCTGCTGACCGTGTCCGATAGATGCCCTCTGTGCAAGCACCCTCTGCCTACCAAGCTGAGAGTGTCCACCGCTCCTAGCAGCCCTCCACCTTATGAGGAA [서열번호 137]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 137에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 137의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 138로 제공된다:
AUGGGCCAAGCCAAGAGCAAAGAGACAAAGCUGAGCAAGAAAGAGGACCGCGCCGAGGUUCUGCCCGAUGCCACAUAUCUGGGCCCUCUGAACUGCAAGAGCUGCUGGCAGAGAUUCGACAGCCUCGUGCGGUGCCACGAUCACUACCUGUGCAGACAGUGCCUGAACCUGCUGCUGACCGUGUCCGAUAGAUGCCCUCUGUGCAAGCACCCUCUGCCUACCAAGCUGAGAGUGUCCACCGCUCCUAGCAGCCCUCCACCUUAUGAGGAA [서열번호 138]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 138에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 LCMV Z 단백질(P18541; RING 핑거 단백질 Z 림프구성 맥락수막염 바이러스(암스트롱 바이러스주), 또는 그의 동원체이다. LCMV Z 단백질의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 139로 제공된다:
MGQGKSREEKGTNSTNRAEILPDTTYLGPLSCKSCWQKFDSLVRCHDHYLCRHCLNLLLSVSDRCPLCKYPLPTRLKISTAPSSPPPYEE [서열번호 139]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 139에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 LCMV Z 폴리펩티드는 다음과 같은 서열번호 140의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGGTCAAGGCAAGTCCAGAGAGGAGAAAGGCACCAATAGTACAAACAGGGCCGAAATCCTACCAGATACCACCTATCTTGGCCCTTTAAGCTGCAAATCTTGCTGGCAGAAATTTGACAGCTTGGTAAGATGCCATGACCACTACCTTTGCAGGCACTGTTTAAACCTTCTGCTGTCAGTATCCGACAGGTGTCCTCTTTGTAAATATCCATTACCAACCAGATTGAAGATATCAACAGCCCCAAGCTCTCCACCTCCCTACGAAGAG [서열번호 140]
따라서, 바람직하게는 상기 LCMV Z 폴리펩티드는 실질적으로 서열번호 140에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 LCMV Z 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 141로 제공된다:
ATGGGCCAGGGCAAGTCCAGAGAGGAAAAGGGCACCAACTCCACCAACCGGGCCGAGATCCTGCCTGACACCACATATCTGGGCCCTCTGAGCTGCAAGAGCTGCTGGCAGAAATTCGACAGCCTCGTGCGGTGCCACGACCACTACCTGTGTAGACACTGCCTGAACCTGCTGCTGAGCGTGTCCGATAGATGCCCTCTGTGCAAGTACCCTCTGCCTACCAGACTGAAGATCAGCACAGCCCCTAGCAGCCCTCCACCTTACGAAGAA [서열번호 141]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 141에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 141의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 142로 제공된다:
AUGGGCCAGGGCAAGUCCAGAGAGGAAAAGGGCACCAACUCCACCAACCGGGCCGAGAUCCUGCCUGACACCACAUAUCUGGGCCCUCUGAGCUGCAAGAGCUGCUGGCAGAAAUUCGACAGCCUCGUGCGGUGCCACGACCACUACCUGUGUAGACACUGCCUGAACCUGCUGCUGAGCGUGUCCGAUAGAUGCCCUCUGUGCAAGUACCCUCUGCCUACCAGACUGAAGAUCAGCACAGCCCCUAGCAGCCCUCCACCUUACGAAGAA [서열번호 142]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 142에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 LUJV Z 단백질(C5ILC3; 다기능성 매트릭스-유사 단백질 Z Lujp 맘마레나바이러스(mammarenavirus)), 또는 그의 동원체이다. LUJV Z 단백질의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 143으로 나타낸다:
MGQRHSSGSGQPNPKPSDSDHEARRSELHSDASHLGPLNCKSCWKSKKALVKCYDHYLCLNCLSLLMGITPRCPFCYRELPKNLDLAEAPSAPPL [서열번호 143]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 143에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 LUJV Z 폴리펩티드는 다음과 같은 서열번호 144의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGGTCAGAGACATTCCTCTGGCTCCGGCCAACCCAACCCCAAGCCGAGTGACAGCGATCATGAAGCGAGAAGGTCAGAGCTTCACTCGGACGCCTCCCATCTCGGACCTCTGAACTGCAAATCTTGCTGGAAGTCAAAGAAGGCACTGGTGAAGTGCTATGATCACTACCTCTGTCTAAACTGCTTAAGCCTTCTAATGGGCATCACCCCAAGATGTCCCTTCTGTTACAGAGAGCTACCCAAAAATCTGGACCTTGCAGAGGCACCAAGCGCACCACCCCTC [서열번호 144]
따라서, 바람직하게는 상기 LUJV Z 폴리펩티드는 실질적으로 서열번호 144에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 LUJV Z 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 145로 제공된다:
ATGGGCCAGAGACACAGCTCTGGAAGCGGCCAGCCTAATCCTAAGCCTAGCGACAGCGATCACGAGGCCAGAAGAAGCGAGCTGCACTCCGATGCCTCTCACCTGGGACCTCTGAACTGCAAGAGCTGCTGGAAGTCCAAGAAAGCCCTGGTCAAGTGCTACGACCACTACCTGTGCCTGAACTGCCTGAGCCTGCTGATGGGCATTACCCCTAGATGCCCCTTCTGCTACAGAGAGCTGCCCAAGAACCTGGACCTGGCCGAAGCTCCTTCTGCTCCTCCTCTG [서열번호 145]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 145에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 145의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 146으로 제공된다:
AUGGGCCAGAGACACAGCUCUGGAAGCGGCCAGCCUAAUCCUAAGCCUAGCGACAGCGAUCACGAGGCCAGAAGAAGCGAGCUGCACUCCGAUGCCUCUCACCUGGGACCUCUGAACUGCAAGAGCUGCUGGAAGUCCAAGAAAGCCCUGGUCAAGUGCUACGACCACUACCUGUGCCUGAACUGCCUGAGCCUGCUGAUGGGCAUUACCCCUAGAUGCCCCUUCUGCUACAGAGAGCUGCCCAAGAACCUGGACCUGGCCGAAGCUCCUUCUGCUCCUCCUCUG [서열번호 146]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 146에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 CHPV Z 단백질(B2C4J2; RING 핑거 단백질 Z 차파레(Chapare) 맘마레나바이러스(인간/볼리비아/810419/2003 단리물)), 또는 그의 동원체이다. CHPV Z 단백질의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 147로 나타낸다:
MGNTKTKDRQYQSNSSQPTNTSAPVLLRRQAEPSLYGRHNCRCCWFADTNLVNCSNHYLCLKCLNTMLRRSNLCDICGEELPTTIIVPVEPSAPLPGQ [서열번호 147]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 147에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 CHPV Z 폴리펩티드는 다음과 같은 서열번호 148의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGGTAACACCAAAACAAAGGACAGACAGTATCAATCGAACTCAAGCCAACCCACAAACACATCTGCACCAGTTCTGCTGAGAAGGCAGGCAGAACCAAGTCTGTATGGGAGACACAACTGCAGATGCTGTTGGTTTGCAGACACAAACCTAGTCAATTGTTCCAACCACTACCTTTGCCTTAAATGTCTGAACACAATGTTAAGAAGATCCAATCTCTGTGACATATGCGGTGAAGAACTTCCCACAACAATCATTGTTCCAGTGGAACCATCAGCACCACTGCCCGGACAA [서열번호 148]
따라서, 바람직하게는 상기 CHPV Z 폴리펩티드는 실질적으로 서열번호 148에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 CHPV Z 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 149로 제공된다:
ATGGGCAACACCAAGACCAAGGACCGGCAGTACCAGAGCAACAGCAGCCAGCCTACCAACACATCTGCCCCTGTGCTGCTGAGAAGGCAGGCCGAGCCTTCTCTGTACGGCAGACACAACTGCCGGTGCTGTTGGTTCGCCGACACCAACCTGGTCAACTGCAGCAACCACTACCTGTGCCTGAAGTGTCTGAACACCATGCTGCGGCGGAGCAACCTGTGCGATATCTGTGGCGAGGAACTGCCCACCACCATCATCGTGCCTGTGGAACCTTCTGCTCCTCTGCCTGGACAG [서열번호 149]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 149에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 149의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 150으로 제공된다:
AUGGGCAACACCAAGACCAAGGACCGGCAGUACCAGAGCAACAGCAGCCAGCCUACCAACACAUCUGCCCCUGUGCUGCUGAGAAGGCAGGCCGAGCCUUCUCUGUACGGCAGACACAACUGCCGGUGCUGUUGGUUCGCCGACACCAACCUGGUCAACUGCAGCAACCACUACCUGUGCCUGAAGUGUCUGAACACCAUGCUGCGGCGGAGCAACCUGUGCGAUAUCUGUGGCGAGGAACUGCCCACCACCAUCAUCGUGCCUGUGGAACCUUCUGCUCCUCUGCCUGGACAG [서열번호 150]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 150에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 MACV Z 단백질(Q6IUF9; RING 핑거 단백질 Z 마추포 바이러스(Machupo virus)), 또는 그의 동원체이다. MACV Z 단백질의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 151로 나타낸다:
MGNCNKPPKRPPNTQTSAAQPSAEFRRTALPSLYGRYNCKCCWFADTNLITCNDHYLCLRCHQTMLRNSELCHICWKPLPTSITVPVEPSAPPP [서열번호 151]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 151에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 MACV Z 폴리펩티드는 다음과 같은 서열번호 152의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGGCAACTGTAACAAGCCTCCCAAGAGGCCTCCCAACACACAAACATCAGCCGCCCAGCCCTCAGCAGAGTTCAGGAGAACAGCCCTACCCAGTCTCTATGGTCGCTACAACTGCAAATGTTGTTGGTTTGCCGACACAAACTTGATTACATGTAACGACCACTACTTGTGTCTGAGATGTCATCAAACAATGCTCAGGAATTCTGAACTCTGTCACATATGCTGGAAACCACTACCGACATCCATCACAGTCCCCGTGGAGCCAAGCGCCCCCCCACCA [서열번호 152]
따라서, 바람직하게는 상기 MACV Z 폴리펩티드는 실질적으로 서열번호 152에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 MACV Z 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 153으로 제공된다:
ATGGGCAACTGCAACAAGCCTCCTAAGCGGCCTCCTAACACACAGACATCTGCCGCTCAGCCTAGCGCCGAGTTCAGAAGAACAGCCCTGCCTAGCCTGTACGGCCGGTACAACTGCAAGTGCTGTTGGTTCGCCGACACCAACCTGATCACCTGTAACGACCACTACCTGTGCCTGCGGTGCCACCAGACCATGCTGAGAAATAGCGAGCTGTGCCACATCTGCTGGAAGCCCCTGCCTACCAGCATCACCGTGCCTGTGGAACCTTCTGCTCCTCCTCCT [서열번호 153]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 153에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 153의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 154로 제공된다:
AUGGGCAACUGCAACAAGCCUCCUAAGCGGCCUCCUAACACACAGACAUCUGCCGCUCAGCCUAGCGCCGAGUUCAGAAGAACAGCCCUGCCUAGCCUGUACGGCCGGUACAACUGCAAGUGCUGUUGGUUCGCCGACACCAACCUGAUCACCUGUAACGACCACUACCUGUGCCUGCGGUGCCACCAGACCAUGCUGAGAAAUAGCGAGCUGUGCCACAUCUGCUGGAAGCCCCUGCCUACCAGCAUCACCGUGCCUGUGGAACCUUCUGCUCCUCCUCCU [서열번호 154]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 154에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 GTOV Z 단백질(Q6UY71; RING 핑거 단백질 Z 구아나리토(Guanarito) 맘마레나바이러스(인간/베네수엘라/NH-95551/1990 단리물)), 또는 그의 동원체이다. GTOV Z 단백질의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 155로 나타낸다:
MGNSKSKSNPSSSSESQKGAPTVTEFRRTAIHSLYGRYNCKCCWFADKNLIKCSDHYLCLRCLNVMLKNSDLCNICWEQLPTCITVPEEPSAPPE [서열번호 155]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 155에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 GTOV Z 폴리펩티드는 다음과 같은 서열번호 156의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGGCAATTCAAAATCTAAATCCAACCCATCCAGTTCCTCAGAGTCTCAAAAAGGGGCACCAACAGTCACAGAATTTAGGAGGACTGCCATTCACAGTCTCTATGGGAGGTACAACTGCAAGTGTTGCTGGTTTGCTGACAAGAATCTGATTAAATGCTCTGATCATTACCTCTGCTTGAGGTGTTTAAATGTCATGCTGAAAAACTCTGATCTTTGCAACATTTGTTGGGAGCAGCTGCCCACATGCATCACAGTTCCGGAGGAGCCAAGCGCTCCACCGGAA [서열번호 156]
따라서, 바람직하게는 상기 GTOV Z 폴리펩티드는 실질적으로 서열번호 156에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 GTOV Z 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 157로 제공된다:
ATGGGCAACAGCAAGTCCAAGAGCAACCCCAGCAGCAGCTCCGAGTCTCAGAAAGGCGCTCCTACCGTGACCGAGTTCAGAAGAACAGCCATCCACAGCCTGTACGGCCGGTACAACTGCAAGTGCTGTTGGTTCGCCGACAAGAACCTGATCAAGTGCAGCGACCACTACCTGTGCCTGCGGTGCCTGAACGTGATGCTGAAGAACTCCGACCTGTGCAACATCTGCTGGGAGCAGCTGCCTACCTGCATCACCGTGCCTGAGGAACCTTCTGCTCCTCCTGAA [서열번호 157]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 157에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 157의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 158로 제공된다:
AUGGGCAACAGCAAGUCCAAGAGCAACCCCAGCAGCAGCUCCGAGUCUCAGAAAGGCGCUCCUACCGUGACCGAGUUCAGAAGAACAGCCAUCCACAGCCUGUACGGCCGGUACAACUGCAAGUGCUGUUGGUUCGCCGACAAGAACCUGAUCAAGUGCAGCGACCACUACCUGUGCCUGCGGUGCCUGAACGUGAUGCUGAAGAACUCCGACCUGUGCAACAUCUGCUGGGAGCAGCUGCCUACCUGCAUCACCGUGCCUGAGGAACCUUCUGCUCCUCCUGAA [서열번호 158]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 158에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 JUNV Z 단백질(Q6IVU5; RING 핑거 단백질 Z OS=주닌(Junin) 맘마레나바이러스), 또는 그의 동원체이다. JUNV Z의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 159로 나타낸다:
MGNCNGASKSNQPDSSRVTQPAAEFRRVAHSSLYGRYNCKCCWFADTNLITCNDHYLCLRCHQVMLRNSDLCNICWKPLPTTITVPVEPTAPPP [서열번호 159]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 159에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 JUNV Z 폴리펩티드는 다음과 같은 서열번호 160의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGGCAACTGCAACGGGGCATCCAAGTCAAACCAGCCAGACTCTTCAAGGGTCACACAGCCAGCCGCAGAATTCAGGAGGGTGGCTCACAGCAGTCTATATGGTAGATACAACTGCAAGTGCTGCTGGTTTGCTGACACCAATCTGATAACCTGCAATGATCACTACCTTTGTTTAAGGTGCCATCAGGTTATGTTAAGGAATTCGGACCTCTGCAATATCTGTTGGAAGCCCCTACCTACCACAATCACAGTGCCGGTGGAGCCAACAGCACCACCACCA [서열번호 160]
따라서, 바람직하게는 상기 JUNV Z 폴리펩티드는 실질적으로 서열번호 160에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 JUNV Z 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 161로 제공된다:
ATGGGCAATTGCAACGGCGCCAGCAAGAGCAACCAGCCTGATAGCAGCAGAGTGACACAGCCTGCCGCCGAGTTTAGAAGAGTGGCCCACAGCAGCCTGTACGGCCGGTACAATTGCAAGTGCTGTTGGTTCGCCGACACCAACCTGATCACCTGTAACGACCACTACCTGTGCCTGCGGTGCCACCAAGTGATGCTGAGAAACAGCGACCTGTGCAACATCTGCTGGAAGCCCCTGCCTACCACCATCACCGTGCCTGTGGAACCTACAGCTCCTCCTCCT [서열번호 161]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 161에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 161의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 162로 제공된다:
AUGGGCAAUUGCAACGGCGCCAGCAAGAGCAACCAGCCUGAUAGCAGCAGAGUGACACAGCCUGCCGCCGAGUUUAGAAGAGUGGCCCACAGCAGCCUGUACGGCCGGUACAAUUGCAAGUGCUGUUGGUUCGCCGACACCAACCUGAUCACCUGUAACGACCACUACCUGUGCCUGCGGUGCCACCAAGUGAUGCUGAGAAACAGCGACCUGUGCAACAUCUGCUGGAAGCCCCUGCCUACCACCAUCACCGUGCCUGUGGAACCUACAGCUCCUCCUCCU [서열번호 162]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 162에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 SABV Z 단백질(Q6UY62; RING 핑거 단백질 Z 사비아(Sabia) 맘마레나바이러스(인간/브라질/SPH114202/1990) 단리물), 또는 그의 동원체이다. SABV Z 단백질의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 163으로 나타낸다:
MGNSKSKSKLSANQYEQQTVNSTKQVAILKRQAEPSLYGRHNCRCCWFANTNLIKCSDHYICLKCLNIMLGKSSFCDICGEELPTSIVVPIEPSAPPPED [서열번호 163]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 163에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 SABV Z 폴리펩티드는 다음과 같은 서열번호 164의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGGTAACTCCAAGTCAAAATCAAAGCTGTCTGCTAACCAGTATGAACAGCAAACAGTCAATAGCACCAAACAGGTAGCCATTTTAAAGAGACAGGCTGAACCTAGTCTGTATGGAAGACACAACTGCAGGTGCTGCTGGTTCGCCAATACAAATCTAATAAAATGTTCCGACCATTATATTTGTCTAAAATGTTTGAACATAATGTTGGGGAAGTCTTCTTTTTGTGACATTTGTGGTGAAGAGCTCCCCACATCCATTGTGGTGCCCATCGAACCAAGTGCTCCACCTCCAGAAGAC [서열번호 164]
따라서, 바람직하게는 상기 SABV Z 폴리펩티드는 실질적으로 서열번호 164에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 SABV Z 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 165로 제공된다:
ATGGGCAACAGCAAGAGCAAGTCCAAGCTGAGCGCCAACCAGTACGAGCAGCAGACCGTGAACAGCACCAAACAGGTGGCCATCCTGAAGAGACAGGCCGAGCCTAGCCTGTACGGCAGACACAACTGCCGGTGTTGTTGGTTCGCCAACACCAACCTGATCAAGTGCAGCGACCACTACATCTGCCTGAAGTGCCTGAACATCATGCTGGGCAAGAGCAGCTTCTGCGACATCTGCGGAGAGGAACTGCCCACCTCTATCGTGGTGCCTATCGAGCCTTCTGCTCCTCCACCTGAGGAT [서열번호 165]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 165에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 165의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 166으로 제공된다:
AUGGGCAACAGCAAGAGCAAGUCCAAGCUGAGCGCCAACCAGUACGAGCAGCAGACCGUGAACAGCACCAAACAGGUGGCCAUCCUGAAGAGACAGGCCGAGCCUAGCCUGUACGGCAGACACAACUGCCGGUGUUGUUGGUUCGCCAACACCAACCUGAUCAAGUGCAGCGACCACUACAUCUGCCUGAAGUGCCUGAACAUCAUGCUGGGCAAGAGCAGCUUCUGCGACAUCUGCGGAGAGGAACUGCCCACCUCUAUCGUGGUGCCUAUCGAGCCUUCUGCUCCUCCACCUGAGGAU [서열번호 166]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 166에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
다른 구현예에서, 상기 적어도 하나의 IIP는 3C 프로테아제 단백질일 수 있다.
한 구현예에서, 상기 적어도 하나의 IIP는 CV-A16 3C 프로테아제(Q9QF31; 콕사키바이러스 A16(타이난/5079/98 프로테아제 3C 바이러스주), 또는 그의 동원체이다. [Rui Y, Su Jm Wang H, Chang J, Wang S, Zhenf W, Cai Y, Gordy JT, Markham R, Kong W, Zhang W, Yu X-F. (2017) Disruption of MDA5-Mediated Innate Immune Responses by the 3C Proteins of Coxsackievirus A16, Coxsackievirus A6, and Enterovirus D68. J Virol 91, 13, e00546-17]. CV-A16 3C 프로테아제의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 167로 나타낸다:
GPSLDFALSLLRRNIRQVQTDQGHFTMLGVRDRLAILPRHSQPGKTIWVEHKLINVLDAVELVDEQGVNLELTLVTLDTNEKFRDVTKFIPETITGASDATLVINTEHMPSMFVPVGDVVQYGFLNLSGKPTHRTMMYNFPTKAGQCGGVVTSVGKIIGIHIGGNGRQGFCAGLKRGYFASEQ [서열번호 167]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 167에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 CV-A16 3C 프로테아제 폴리펩티드는 다음과 같은 서열번호 168의 DNA 뉴클레오티드 서열에 의해 암호화된다:
GGACCGAGCTTAGACTTTGCCTTATCCCTCCTAAGGCGCAACATTAGACAGGTGCAAACCGACCAAGGACACTTCACTATGTTAGGGGTGCGAGATCGCCTAGCCATTTTGCCACGCCACTCGCAACCAGGAAAAACTATCTGGGTGGAGCACAAGTTAATTAATGTGCTGGATGCTGTCGAATTAGTGGATGAGCAAGGTGTAAACTTGGAACTCACACTAGTAACCTTAGACACCAACGAAAAGTTTAGGGATGTTACCAAGTTTATTCCAGAGACGATCACCGGGGCAAGCGACGCAACCTTGGTCATCAACACTGAGCACATGCCCTCAATGTTCGTTCCAGTGGGTGATGTTGTACAATATGGATTTCTGAATCTCAGCGGTAAGCCCACACACCGAACCATGATGTACAATTTCCCCACAAAGGCAGGACAGTGTGGAGGGGTGGTCACCTCAGTCGGTAAGATCATAGGAATTCACATTGGTGGGAATGGACGCCAGGGTTTCTGCGCTGGACTGAAGAGAGGCTATTTTGCCAGTGAACAG [서열번호 168]
따라서, 바람직하게는 상기 CV-A16 3C 프로테아제 폴리펩티드는 실질적으로 서열번호 168에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 CV-A16 3C 프로테아제 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 169로 제공된다:
GGCCCTTCTCTGGATTTTGCCCTGAGCCTGCTGCGGCGGAACATCAGACAGGTGCAGACAGATCAGGGCCACTTCACCATGCTGGGCGTCAGAGACAGACTGGCCATCCTGCCTAGACACAGCCAGCCTGGCAAGACCATCTGGGTCGAGCACAAGCTGATCAACGTGCTGGACGCCGTGGAACTGGTGGATGAACAGGGCGTGAACCTGGAACTGACCCTGGTCACCCTGGACACCAACGAGAAGTTCCGGGACGTGACCAAGTTCATCCCCGAGACAATCACCGGCGCCTCCGATGCCACACTGGTCATCAATACCGAGCACATGCCCTCCATGTTCGTGCCTGTGGGAGATGTGGTGCAGTACGGCTTCCTGAACCTGAGCGGCAAGCCCACACACCGGACCATGATGTACAACTTCCCTACCAAGGCCGGCCAGTGCGGCGGAGTGGTTACATCTGTGGGCAAGATCATCGGCATCCACATCGGCGGCAATGGCAGACAGGGATTTTGTGCCGGCCTGAAGAGAGGCTACTTCGCCTCTGAACAG [서열번호 169]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 169에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 169의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 170으로 제공된다:
GGCCCUUCUCUGGAUUUUGCCCUGAGCCUGCUGCGGCGGAACAUCAGACAGGUGCAGACAGAUCAGGGCCACUUCACCAUGCUGGGCGUCAGAGACAGACUGGCCAUCCUGCCUAGACACAGCCAGCCUGGCAAGACCAUCUGGGUCGAGCACAAGCUGAUCAACGUGCUGGACGCCGUGGAACUGGUGGAUGAACAGGGCGUGAACCUGGAACUGACCCUGGUCACCCUGGACACCAACGAGAAGUUCCGGGACGUGACCAAGUUCAUCCCCGAGACAAUCACCGGCGCCUCCGAUGCCACACUGGUCAUCAAUACCGAGCACAUGCCCUCCAUGUUCGUGCCUGUGGGAGAUGUGGUGCAGUACGGCUUCCUGAACCUGAGCGGCAAGCCCACACACCGGACCAUGAUGUACAACUUCCCUACCAAGGCCGGCCAGUGCGGCGGAGUGGUUACAUCUGUGGGCAAGAUCAUCGGCAUCCACAUCGGCGGCAAUGGCAGACAGGGAUUUUGUGCCGGCCUGAAGAGAGGCUACUUCGCCUCUGAACAG [서열번호 170]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 170에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 CV-A6 3C 프로테아제(L7P6C4; 게놈 폴리단백질 콕사키바이러스 A6 프로테아제 3C), 또는 그의 동원체이다. CV-A6 3C 프로테아제의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 171로 나타낸다:
GPSLDFALSLLRRNIRQVQTDQGHFTMLGVRDRLAVLPRHSQPGKTIWVEHKLVNVVDAVELVDEQGVNLELTLITLDTNEKFRDITKFIPENISAASDATLVINTEHMPSMFVPVGDVVQYGFLNLSGKPTHRTMMYNFPTKAGQCGGVVTSVGKVIGIHIGGNGRQGFCAGLKRSYF [서열번호 171]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 171에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 CV-A6 3C 프로테아제 폴리펩티드는 다음과 같은 서열번호 172의 DNA 뉴클레오티드 서열에 의해 암호화된다:
GGACCTAGCCTTGATTTTGCCCTATCCCTACTGAGAAGGAACATCAGACAAGTTCAAACGGACCAAGGGCACTTCACCATGCTAGGAGTCAGAGATCGCTTGGCCGTCCTCCCACGACACTCACAACCCGGAAAAACTATCTGGGTAGAGCACAAGCTAGTGAATGTTGTGGATGCTGTCGAACTAGTGGATGAGCAGGGGGTCAACTTAGAGCTGACTTTAATCACCCTCGACACTAATGAGAAGTTTAGAGACATCACCAAATTTATTCCAGAGAATATCAGCGCTGCCAGCGATGCCACTCTAGTGATTAATACAGAGCACATGCCTTCTATGTTTGTGCCAGTAGGTGATGTTGTTCAGTATGGTTTCCTGAATCTTAGTGGGAAACCAACCCACCGCACTATGATGTATAACTTCCCTACCAAGGCAGGACAGTGTGGAGGGGTAGTCACATCAGTTGGAAAGGTCATTGGTATCCACATAGGAGGCAATGGCAGGCAAGGTTTCTGTGCAGGGCTCAAGAGAAGCTACTTT [서열번호 172]
따라서, 바람직하게는 상기 CV-A6 3C 프로테아제 폴리펩티드는 실질적으로 서열번호 172에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 CV-A6 3C 프로테아제 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 173으로 제공된다:
GGCCCTTCTCTGGATTTTGCCCTGAGCCTGCTGCGGCGGAACATCAGACAGGTGCAGACAGATCAGGGCCACTTCACCATGCTGGGCGTCAGAGATAGACTGGCCGTGCTGCCTAGACACAGCCAGCCTGGAAAGACCATCTGGGTCGAGCACAAGCTGGTCAACGTGGTGGATGCCGTGGAACTGGTGGATGAGCAGGGCGTGAACCTGGAACTGACCCTGATCACCCTGGACACCAACGAGAAGTTCCGGGACATCACCAAGTTCATCCCCGAGAACATCAGCGCCGCCTCCGATGCCACACTGGTCATCAATACCGAGCACATGCCCTCCATGTTCGTGCCTGTGGGAGATGTGGTGCAGTACGGCTTCCTGAACCTGAGCGGCAAGCCCACACACCGGACCATGATGTACAACTTCCCTACCAAGGCCGGCCAGTGCGGCGGAGTGGTTACATCTGTGGGCAAAGTGATCGGAATCCACATCGGCGGCAATGGCAGACAGGGCTTTTGTGCCGGCCTGAAGAGAAGCTACTTC [서열번호 173]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 173에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 173의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 174로 제공된다:
GGCCCUUCUCUGGAUUUUGCCCUGAGCCUGCUGCGGCGGAACAUCAGACAGGUGCAGACAGAUCAGGGCCACUUCACCAUGCUGGGCGUCAGAGAUAGACUGGCCGUGCUGCCUAGACACAGCCAGCCUGGAAAGACCAUCUGGGUCGAGCACAAGCUGGUCAACGUGGUGGAUGCCGUGGAACUGGUGGAUGAGCAGGGCGUGAACCUGGAACUGACCCUGAUCACCCUGGACACCAACGAGAAGUUCCGGGACAUCACCAAGUUCAUCCCCGAGAACAUCAGCGCCGCCUCCGAUGCCACACUGGUCAUCAAUACCGAGCACAUGCCCUCCAUGUUCGUGCCUGUGGGAGAUGUGGUGCAGUACGGCUUCCUGAACCUGAGCGGCAAGCCCACACACCGGACCAUGAUGUACAACUUCCCUACCAAGGCCGGCCAGUGCGGCGGAGUGGUUACAUCUGUGGGCAAAGUGAUCGGAAUCCACAUCGGCGGCAAUGGCAGACAGGGCUUUUGUGCCGGCCUGAAGAGAAGCUACUUC [서열번호 174]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 174에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 EV D-68 3C 프로테아제(Q68T42; 게놈 폴리단백질 인간 엔테로바이러스 D68; IRF7 절단), 또는 그의 동원체이다. [Xiang Z, Liu L, Lei X, Zhou Z, He B, Wang J (2015) 3C protease of enterovirus D68 inhibits cellular defense mediated interferon regulatory factor. J Virol., 90, 3, 1613-2161. doi: 10.1128/JVI.02395-15. Print 2016 Feb 1]. EV D-68 3C 프로테아제의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 175로 나타낸다:
GPGFDFAQAIMKKNTVIARTEKGEFTMLGVYDRVAVIPTHASVGEIIYINDVETRVLDACALRDLTDTNLEITIVKLDRNQKFRDIRHFLPRCEDDYNDAVLSVHTSKFPNMYIPVGQVTNYGFLNLGGTPTHRILMYNFPTRAGQCGGVVTTTGKVIGIHVGGNGAQGFAAMLLHSYFTDTQ [서열번호 175]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 175에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 EV D-68 3C 프로테아제 폴리펩티드는 다음과 같은 서열번호 176의 DNA 뉴클레오티드 서열에 의해 암호화된다:
GGACCAGGATTTGATTTTGCGCAAGCCATAATGAAGAAAAATACTGTTATTGCTAGAACTGAAAAAGGCGAGTTCACAATGCTTGGTGTGTATGATAGAGTGGCAGTCATTCCAACACATGCATCTGTTGGAGAAATCATTTACATCAACGATGTAGAAACCAGAGTTCTAGATGCATGTGCACTTAGAGACTTGACAGACACAAACCTAGAAATAACTATAGTCAAATTGGATCGCAATCAAAAATTTAGAGACATCAGACACTTTTTACCCAGATGTGAGGATGATTACAATGATGCTGTGCTTAGTGTACATACATCAAAATTCCCTAACATGTACATTCCAGTTGGACAAGTCACTAACTACGGCTTCTTGAACCTGGGCGGCACACCAACACATCGGATTTTAATGTATAATTTTCCAACAAGAGCTGGTCAGTGTGGTGGTGTGGTGACAACCACAGGTAAAGTGATAGGAATACACGTGGGCGGGAATGGAGCTCAGGGATTCGCAGCAATGTTGCTCCACTCTTACTTTACTGATACACAA [서열번호 176]
따라서, 바람직하게는 상기 EV D-68 3C 프로테아제 폴리펩티드는 실질적으로 서열번호 176에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 EV D-68 3C 프로테아제 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 177로 제공된다:
GGCCCTGGCTTTGATTTTGCCCAGGCCATCATGAAGAAAAACACCGTGATCGCCCGGACCGAGAAGGGCGAGTTTACAATGCTGGGCGTGTACGACAGAGTGGCCGTGATTCCTACACACGCCTCTGTGGGCGAGATCATCTACATCAACGACGTGGAAACCAGAGTGCTGGACGCCTGCGCTCTGAGAGATCTGACCGACACCAACCTGGAAATCACCATCGTGAAGCTGGACCGGAACCAGAAGTTCCGGGACATCCGGCACTTTCTGCCCAGATGCGAGGACGACTACAACGACGCTGTGCTGAGCGTGCACACCAGCAAGTTCCCCAACATGTACATCCCCGTGGGCCAAGTGACCAACTACGGCTTCCTGAATCTCGGCGGCACCCCTACACACCGGATCCTGATGTACAACTTCCCCACCAGAGCCGGCCAGTGTGGCGGAGTGGTTACCACAACAGGCAAAGTGATCGGCATCCACGTCGGCGGAAATGGCGCTCAGGGATTTGCTGCCATGCTGCTGCACAGCTACTTCACCGACACACAG [서열번호 177]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 177에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 177의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 178로 제공된다:
GGCCCUGGCUUUGAUUUUGCCCAGGCCAUCAUGAAGAAAAACACCGUGAUCGCCCGGACCGAGAAGGGCGAGUUUACAAUGCUGGGCGUGUACGACAGAGUGGCCGUGAUUCCUACACACGCCUCUGUGGGCGAGAUCAUCUACAUCAACGACGUGGAAACCAGAGUGCUGGACGCCUGCGCUCUGAGAGAUCUGACCGACACCAACCUGGAAAUCACCAUCGUGAAGCUGGACCGGAACCAGAAGUUCCGGGACAUCCGGCACUUUCUGCCCAGAUGCGAGGACGACUACAACGACGCUGUGCUGAGCGUGCACACCAGCAAGUUCCCCAACAUGUACAUCCCCGUGGGCCAAGUGACCAACUACGGCUUCCUGAAUCUCGGCGGCACCCCUACACACCGGAUCCUGAUGUACAACUUCCCCACCAGAGCCGGCCAGUGUGGCGGAGUGGUUACCACAACAGGCAAAGUGAUCGGCAUCCACGUCGGCGGAAAUGGCGCUCAGGGAUUUGCUGCCAUGCUGCUGCACAGCUACUUCACCGACACACAG [서열번호 178]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 178에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 EVD-71 3C 프로테아제(Q0JRV3; 게놈 폴리단백질 인간 엔테로바이러스 71 프로테아제 3C), 또는 그의 동원체이다. EVD-71 3C 프로테아제 단백질의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 179로 나타낸다:
GPSLDFALSLLRRNIRQVQTDQGHFTMLGVRDHLAVLPRHSQPGKTIWVEHKLVKIVDAVELVDEQGVNLELTLVTLDTNEKFRDITRFIPETISPASDATLVINTEHMPSMFVPVGDVVQYGFLNLSGKPTHRTMMYNFPTKAGQCGGAVTAVGKVIGIHIGGNGRQGFCAALKRGYF [서열번호 179]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 179에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 EVD-71 3C 프로테아제 폴리펩티드는 다음과 같은 서열번호 180의 DNA 뉴클레오티드 서열에 의해 암호화된다:
GGGCCGAGCTTGGACTTCGCCCTATCTCTACTTAGGAGGAACATTAGGCAGGTCCAAACCGACCAGGGCCACTTTACAATGTTAGGAGTGCGAGACCACTTGGCTGTGCTCCCCAGACACTCCCAACCAGGAAAGACCATCTGGGTTGAACACAAATTAGTGAAGATCGTAGACGCTGTGGAGCTAGTAGATGAACAAGGGGTTAACCTAGAGCTCACACTGGTAACGCTTGACACCAACGAAAAATTTAGAGACATCACAAGATTCATACCAGAAACAATTAGTCCTGCTAGTGATGCCACTTTAGTTATAAATACTGAACATATGCCCAGTATGTTTGTGCCAGTTGGAGATGTGGTCCAGTATGGATTTTTGAACCTTAGTGGTAAGCCCACTCACAGGACTATGATGTACAATTTCCCAACAAAAGCAGGACAGTGTGGTGGTGCTGTGACTGCCGTAGGTAAAGTGATTGGGATTCACATTGGTGGCAACGGTAGACAAGGTTTCTGCGCTGCCCTGAAGAGGGGTTACTTT [서열번호 180]
따라서, 바람직하게는 상기 EVD-71 3C 프로테아제 폴리펩티드는 실질적으로 서열번호 180에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 EVD-71 3C 프로테아제 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 181로 제공된다:
GGCCCTTCTCTGGATTTTGCCCTGAGCCTGCTGCGGCGGAACATCAGACAGGTGCAGACAGATCAGGGCCACTTCACCATGCTGGGCGTCAGAGATCATCTGGCCGTGCTGCCTAGACACAGCCAGCCTGGAAAGACCATCTGGGTCGAGCACAAGCTGGTCAAGATCGTGGACGCCGTGGAACTGGTGGATGAGCAGGGCGTTAACCTGGAACTGACCCTGGTCACCCTGGACACCAACGAGAAGTTCCGGGACATCACCCGGTTCATCCCCGAGACAATTAGCCCTGCCTCCGACGCCACACTGGTCATCAATACCGAGCACATGCCCTCCATGTTCGTGCCTGTGGGAGATGTGGTGCAGTACGGCTTCCTGAACCTGAGCGGCAAGCCCACACACCGGACCATGATGTACAACTTCCCTACCAAGGCCGGCCAGTGCGGCGGAGCTGTTACAGCTGTGGGAAAAGTGATCGGCATCCACATCGGCGGCAATGGCAGACAGGGATTCTGTGCCGCTCTGAAGAGAGGCTACTTC [서열번호 181]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 181에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 181의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 182로 제공된다:
GGCCCUUCUCUGGAUUUUGCCCUGAGCCUGCUGCGGCGGAACAUCAGACAGGUGCAGACAGAUCAGGGCCACUUCACCAUGCUGGGCGUCAGAGAUCAUCUGGCCGUGCUGCCUAGACACAGCCAGCCUGGAAAGACCAUCUGGGUCGAGCACAAGCUGGUCAAGAUCGUGGACGCCGUGGAACUGGUGGAUGAGCAGGGCGUUAACCUGGAACUGACCCUGGUCACCCUGGACACCAACGAGAAGUUCCGGGACAUCACCCGGUUCAUCCCCGAGACAAUUAGCCCUGCCUCCGACGCCACACUGGUCAUCAAUACCGAGCACAUGCCCUCCAUGUUCGUGCCUGUGGGAGAUGUGGUGCAGUACGGCUUCCUGAACCUGAGCGGCAAGCCCACACACCGGACCAUGAUGUACAACUUCCCUACCAAGGCCGGCCAGUGCGGCGGAGCUGUUACAGCUGUGGGAAAAGUGAUCGGCAUCCACAUCGGCGGCAAUGGCAGACAGGGAUUCUGUGCCGCUCUGAAGAGAGGCUACUUC [서열번호 182]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 182에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 폴리오 바이러스 HEV-C 3C 프로테아제(P03300; 게놈 폴리단백질 폴리오바이러스 타입 1(마호니(Mahoney) 바이러스주) 인간 엔테로바이러스), 또는 그의 동원체이다. [Lei X, Xiao X, Wang J (2016) Innate Immunity Evasion by Enteroviruses: Insights into Virus-Host Interaction. Viruses 8, 22; doi:10.3390/v8010022]. 폴리오 바이러스 HEV-C 3C 프로테아제의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 183으로 나타낸다:
GPGFDYAVAMAKRNIVTATTSKGEFTMLGVHDNVAILPTHASPGESIVIDGKEVEILDAKALEDQAGTNLEITIITLKRNEKFRDIRPHIPTQITETNDGVLIVNTSKYPNMYVPVGAVTEQGYLNLGGRQTARTLMYNFPTRAGQCGGVITCTGKVIGMHVGGNGSHGFAAALKRSYFTQSQ [서열번호 183]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 183에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 폴리오 바이러스 HEV-C 3C 프로테아제 폴리펩티드는 다음과 같은 서열번호 184의 DNA 뉴클레오티드 서열에 의해 암호화된다:
GGACCAGGGTTCGATTACGCAGTGGCTATGGCTAAAAGAAACATTGTTACAGCAACTACTAGCAAGGGAGAGTTCACTATGTTAGGAGTCCACGACAACGTGGCTATTTTACCAACCCACGCTTCACCTGGTGAAAGCATTGTGATCGATGGCAAAGAAGTGGAGATCTTGGATGCCAAAGCGCTCGAAGATCAAGCAGGAACCAATCTTGAAATCACTATAATCACTCTAAAGAGAAATGAAAAGTTCAGAGACATTAGACCACATATACCTACTCAAATCACTGAGACAAATGATGGAGTCTTGATCGTGAACACTAGCAAGTACCCCAATATGTATGTTCCTGTCGGTGCTGTGACTGAACAGGGATATCTAAATCTCGGTGGGCGCCAAACTGCTCGTACTCTAATGTACAACTTTCCAACCAGAGCAGGACAGTGTGGTGGAGTCATCACATGTACTGGGAAAGTCATCGGGATGCATGTTGGTGGGAACGGTTCACACGGGTTTGCAGCGGCCCTGAAGCGATCATACTTCACTCAGAGTCAA [서열번호 184]
따라서, 바람직하게는 상기 폴리오 바이러스 HEV-C 3C 프로테아제 폴리펩티드는 실질적으로 서열번호 184에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 폴리오 바이러스 HEV-C 3C 프로테아제 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 185로 제공된다:
GGCCCTGGCTTTGATTATGCCGTGGCCATGGCTAAGCGGAACATCGTGACAGCCACCACCAGCAAGGGCGAGTTTACAATGCTGGGCGTGCACGACAACGTGGCCATCCTGCCTACACATGCTAGCCCTGGCGAGAGCATCGTGATCGACGGCAAAGAGGTGGAAATCCTGGACGCCAAGGCTCTGGAAGATCAGGCCGGCACCAACCTGGAAATCACCATCATCACCCTGAAGCGGAACGAGAAGTTCCGGGACATCAGACCTCACATCCCCACACAGATCACCGAGACAAACGACGGCGTGCTGATCGTGAATACCAGCAAGTACCCCAATATGTACGTGCCCGTGGGCGCCGTGACAGAGCAGGGATATCTGAATCTCGGCGGCAGACAGACCGCCAGAACACTGATGTACAACTTCCCCACCAGAGCCGGCCAGTGCGGCGGAGTGATTACATGTACCGGCAAAGTGATCGGCATGCACGTCGGCGGCAATGGCTCTCACGGATTTGCTGCCGCTCTGAAGAGAAGCTACTTCACCCAGAGCCAG [서열번호 185]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 185에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 185의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 186으로 제공된다:
GGCCCUGGCUUUGAUUAUGCCGUGGCCAUGGCUAAGCGGAACAUCGUGACAGCCACCACCAGCAAGGGCGAGUUUACAAUGCUGGGCGUGCACGACAACGUGGCCAUCCUGCCUACACAUGCUAGCCCUGGCGAGAGCAUCGUGAUCGACGGCAAAGAGGUGGAAAUCCUGGACGCCAAGGCUCUGGAAGAUCAGGCCGGCACCAACCUGGAAAUCACCAUCAUCACCCUGAAGCGGAACGAGAAGUUCCGGGACAUCAGACCUCACAUCCCCACACAGAUCACCGAGACAAACGACGGCGUGCUGAUCGUGAAUACCAGCAAGUACCCCAAUAUGUACGUGCCCGUGGGCGCCGUGACAGAGCAGGGAUAUCUGAAUCUCGGCGGCAGACAGACCGCCAGAACACUGAUGUACAACUUCCCCACCAGAGCCGGCCAGUGCGGCGGAGUGAUUACAUGUACCGGCAAAGUGAUCGGCAUGCACGUCGGCGGCAAUGGCUCUCACGGAUUUGCUGCCGCUCUGAAGAGAAGCUACUUCACCCAGAGCCAG [서열번호 186]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 186에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 폴리오바이러스 HEV-C 2A 프로테아제(P03300; 게놈 폴리단백질 폴리오바이러스 타입 1(마호니 바이러스주) 인간 엔테로바이러스), 또는 그의 동원체이다. [Feng Q, Langeris MA, Lork M, Nguyen M, Hato SV, Lanke K, Endad L, Bhoopathi P, Fisher PB, Lloyd RE, van Kuppeveld FJM (2014) Enterovirus 2Apro targets MDA5 and MAVS in infected cells. J Virol., 88, 6, 3369-3377]. 폴리오바이러스 HEV-C 2A 프로테아제의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 187로 나타낸다:
GFGHQNKAVYTAGYKICNYHLATQDDLQNAVNVMWSRDLLVTESRAQGTDSIARCNCNAGVYYCESRRKYYPVSFVGPTFQYMEANNYYPARYQSHMLIGHGFASPGDCGGILRCHHGVIGIITAGGEGLVAFSDIRDLYAYEEEAMEQ [서열번호 187]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 187에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 폴리오바이러스 HEV-C 2A 프로테아제 폴리펩티드는 다음과 같은 서열번호 188의 DNA 뉴클레오티드 서열에 의해 암호화된다:
GGATTCGGACACCAAAACAAAGCGGTGTACACTGCAGGTTACAAAATTTGCAACTACCACTTGGCCACTCAGGATGATTTGCAAAACGCAGTGAACGTCATGTGGAGTAGAGACCTCTTAGTCACAGAATCAAGAGCCCAGGGCACCGATTCAATCGCAAGGTGCAATTGCAACGCAGGGGTGTACTACTGCGAGTCTAGAAGGAAATACTACCCAGTATCCTTCGTTGGCCCAACGTTCCAGTACATGGAGGCTAATAACTATTACCCAGCTAGGTACCAGTCCCATATGCTCATTGGCCATGGATTCGCATCTCCAGGGGATTGTGGTGGCATACTCAGATGTCACCACGGGGTGATAGGGATCATTACTGCTGGTGGCGAAGGGTTGGTTGCATTTTCAGACATTAGAGACTTGTATGCCTACGAAGAAGAAGCCATGGAACAA [서열번호 188]
따라서, 바람직하게는 상기 폴리오바이러스 HEV-C 2A 프로테아제 폴리펩티드는 실질적으로 서열번호 188에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 폴리오바이러스 HEV-C 2A 프로테아제 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 189로 제공된다:
GGCTTTGGCCACCAGAACAAGGCCGTGTACACAGCCGGCTACAAGATCTGCAACTACCACCTGGCCACACAGGACGACCTGCAGAACGCCGTGAATGTGATGTGGTCCAGGGACCTGCTGGTCACCGAATCTAGAGCCCAGGGCACCGACTCTATCGCCAGATGCAACTGTAATGCCGGCGTGTACTACTGCGAGAGCCGGCGGAAGTACTACCCCGTGTCTTTTGTGGGCCCCACCTTCCAGTACATGGAAGCCAACAACTACTACCCTGCCAGATACCAGAGCCACATGCTGATCGGCCACGGCTTTGCTAGCCCTGGCGATTGTGGCGGCATCCTGAGATGTCACCATGGCGTGATCGGCATCATCACCGCTGGCGGAGAAGGACTGGTGGCCTTCAGCGACATCAGAGATCTGTACGCCTACGAAGAGGAAGCCATGGAACAG [서열번호 189]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 189에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 189의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 190으로 제공된다:
GGCUUUGGCCACCAGAACAAGGCCGUGUACACAGCCGGCUACAAGAUCUGCAACUACCACCUGGCCACACAGGACGACCUGCAGAACGCCGUGAAUGUGAUGUGGUCCAGGGACCUGCUGGUCACCGAAUCUAGAGCCCAGGGCACCGACUCUAUCGCCAGAUGCAACUGUAAUGCCGGCGUGUACUACUGCGAGAGCCGGCGGAAGUACUACCCCGUGUCUUUUGUGGGCCCCACCUUCCAGUACAUGGAAGCCAACAACUACUACCCUGCCAGAUACCAGAGCCACAUGCUGAUCGGCCACGGCUUUGCUAGCCCUGGCGAUUGUGGCGGCAUCCUGAGAUGUCACCAUGGCGUGAUCGGCAUCAUCACCGCUGGCGGAGAAGGACUGGUGGCCUUCAGCGACAUCAGAGAUCUGUACGCCUACGAAGAGGAAGCCAUGGAACAG [서열번호 190]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 190에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 CVB3 2A 프로테아제(P03313; 게놈 폴리단백질 콕사키바이러스 B3(낸시(Nancy) 바이러스주)), 또는 그의 동원체이다. CVB3 2A 프로테아제의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 191로 나타낸다:
GAFGQQSGAVYVGNYRVVNRHLATSADWQNCVWESYNRDLLVSTTTAHGCDIIARCQCTTGVYFCASKNKHYPISFEGPGLVEVQESEYYPRRYQSHVLLAAGFSEPGDCGGILRCEHGVIGIVTMGGEGVVGFADIRDLLWLEDDAMEQ [서열번호 191]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 191에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 CVB3 2A 프로테아제 폴리펩티드는 다음과 같은 서열번호 192의 DNA 뉴클레오티드 서열에 의해 암호화된다:
GGCGCATTTGGACAACAATCAGGGGCAGTGTATGTGGGGAACTACAGGGTGGTAAATAGACATCTAGCTACCAGTGCTGACTGGCAAAACTGTGTGTGGGAAAGTTACAACAGAGACCTCTTAGTGAGCACGACCACAGCACATGGATGTGATATTATAGCCAGATGTCAGTGCACAACGGGAGTGTACTTTTGTGCGTCCAAAAACAAGCACTACCCAATTTCGTTTGAAGGACCAGGTCTAGTAGAGGTCCAAGAGAGTGAATACTACCCCAGGAGATACCAATCCCATGTGCTTTTAGCAGCTGGATTTTCCGAACCAGGTGACTGTGGCGGTATCCTAAGGTGTGAGCATGGTGTCATTGGCATTGTGACCATGGGGGGTGAAGGCGTGGTCGGCTTTGCAGACATCCGTGATCTCCTGTGGCTGGAAGATGATGCAATGGAACAG [서열번호 192]
따라서, 바람직하게는 상기 CVB3 2A 프로테아제 폴리펩티드는 실질적으로 서열번호 192에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 CVB3 2A 프로테아제 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 193으로 제공된다:
GGAGCTTTTGGACAGCAGTCTGGCGCCGTGTACGTGGGCAATTACCGGGTCGTGAATAGACACCTGGCCACCTCTGCCGACTGGCAGAATTGTGTGTGGGAGAGCTACAACCGGGACCTGCTGGTGTCTACCACAACAGCCCACGGCTGCGACATCATTGCCAGATGCCAGTGTACAACCGGCGTGTACTTCTGCGCCAGCAAGAACAAGCACTACCCCATCAGCTTCGAAGGCCCTGGCCTGGTGGAAGTGCAAGAGAGCGAGTACTACCCTCGGAGATACCAGAGCCACGTGCTGCTGGCCGCTGGCTTTTCTGAACCTGGCGATTGTGGCGGCATCCTGAGATGTGAACACGGCGTGATCGGCATCGTGACCATGGGCGGAGAAGGCGTTGTGGGCTTCGCCGACATTAGAGATCTGCTGTGGCTGGAAGATGACGCCATGGAACAG [서열번호 193]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 193에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 193의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 194로 제공된다:
GGAGCUUUUGGACAGCAGUCUGGCGCCGUGUACGUGGGCAAUUACCGGGUCGUGAAUAGACACCUGGCCACCUCUGCCGACUGGCAGAAUUGUGUGUGGGAGAGCUACAACCGGGACCUGCUGGUGUCUACCACAACAGCCCACGGCUGCGACAUCAUUGCCAGAUGCCAGUGUACAACCGGCGUGUACUUCUGCGCCAGCAAGAACAAGCACUACCCCAUCAGCUUCGAAGGCCCUGGCCUGGUGGAAGUGCAAGAGAGCGAGUACUACCCUCGGAGAUACCAGAGCCACGUGCUGCUGGCCGCUGGCUUUUCUGAACCUGGCGAUUGUGGCGGCAUCCUGAGAUGUGAACACGGCGUGAUCGGCAUCGUGACCAUGGGCGGAGAAGGCGUUGUGGGCUUCGCCGACAUUAGAGAUCUGCUGUGGCUGGAAGAUGACGCCAUGGAACAG [서열번호 194]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 194에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 EV71 2A 프로테아제(B9VUU3; 게놈 폴리단백질 인간 엔테로바이러스 71), 또는 그의 동원체이다. EV71 2A 프로테아제의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 195로 나타낸다:
GKFGQQSGAIYVGNFRVVNRHLATHNDWANLVWEDSSRDLLVSSTTAQGCDTIARCNCQTGVYYCNSRRKHYPVSFSKPSLIYVEASEYYPARYQSHLMLAQGHSEPGDCGGILRCQHGVVGIVSTGGNGLVGFADVRDLLWLDEEAMEQ [서열번호 195]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 195에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 EV71 2A 프로테아제 폴리펩티드는 다음과 같은 서열번호 196의 DNA 뉴클레오티드 서열에 의해 암호화된다:
GGAAAATTTGGGCAACAGTCTGGGGCCATTTATGTGGGTAACTTTAGAGTGGTCAACCGTCATCTTGCCACTCACAATGATTGGGCAAATCTTGTTTGGGAAGACAGCTCTCGCGACTTACTCGTGTCATCCACCACCGCCCAAGGTTGTGACACGATTGCCCGCTGCAATTGCCAGACAGGGGTGTACTACTGTAACTCGAGGAGAAAACACTACCCAGTCAGTTTTTCAAAACCCAGTCTGATCTATGTAGAGGCTAGCGAGTATTACCCAGCCAGGTACCAGTCACATCTTATGCTCGCACAGGGCCACTCAGAGCCTGGTGATTGCGGTGGTATCCTTAGATGCCAACATGGCGTCGTCGGTATAGTGTCAACTGGTGGTAACGGGCTCGTTGGCTTTGCAGACGTCAGGGACCTCTTGTGGTTAGATGAAGAAGCTATGGAGCAG [서열번호 196]
따라서, 바람직하게는 상기 EV71 2A 프로테아제 폴리펩티드는 실질적으로 서열번호 196에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 EV71 2A 프로테아제 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 197로 제공된다:
GGCAAGTTTGGACAGCAGAGCGGCGCCATCTACGTGGGCAATTTCCGGGTCGTGAACCGGCACCTGGCCACACATAACGACTGGGCCAATCTCGTGTGGGAAGATAGCAGCAGGGACCTGCTGGTGTCCAGCACAACAGCCCAGGGCTGCGATACAATCGCCAGATGCAATTGCCAGACCGGCGTGTACTACTGCAACAGCAGACGGAAGCACTACCCCGTGTCCTTCAGCAAGCCCAGCCTGATCTATGTGGAAGCCAGCGAGTACTACCCCGCCAGATACCAGTCTCACCTGATGCTGGCCCAGGGCCATTCTGAGCCAGGCGATTGTGGCGGAATCCTGAGATGCCAGCATGGCGTCGTGGGCATTGTGTCTACCGGCGGAAATGGCCTCGTGGGATTTGCCGATGTTCGCGACCTGCTGTGGCTGGACGAAGAGGCTATGGAACAG [서열번호 197]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 197에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 197의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 198로 제공된다:
GGCAAGUUUGGACAGCAGAGCGGCGCCAUCUACGUGGGCAAUUUCCGGGUCGUGAACCGGCACCUGGCCACACAUAACGACUGGGCCAAUCUCGUGUGGGAAGAUAGCAGCAGGGACCUGCUGGUGUCCAGCACAACAGCCCAGGGCUGCGAUACAAUCGCCAGAUGCAAUUGCCAGACCGGCGUGUACUACUGCAACAGCAGACGGAAGCACUACCCCGUGUCCUUCAGCAAGCCCAGCCUGAUCUAUGUGGAAGCCAGCGAGUACUACCCCGCCAGAUACCAGUCUCACCUGAUGCUGGCCCAGGGCCAUUCUGAGCCAGGCGAUUGUGGCGGAAUCCUGAGAUGCCAGCAUGGCGUCGUGGGCAUUGUGUCUACCGGCGGAAAUGGCCUCGUGGGAUUUGCCGAUGUUCGCGACCUGCUGUGGCUGGACGAAGAGGCUAUGGAACAG [서열번호 198]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 198에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 hMPV G 단백질(Q6WB94; 주요 표면 당단백질 G 인간 메타뉴모바이러스(CAN97-83 바이러스주)), 또는 그의 동원체이다. [Bao X, Liu T, Shan Y, Li K, Garofolo RP, Casola A (2008) Human Metapneumovirus Glycoprotein G Inhibits Innate Immune Responses. PLOS Pathogens, 4, 5, e1000077]. hMPV G 단백질의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 199로 제공된다:
MEVKVENIRAIDMLKARVKNRVARSKCFKNASLILIGITTLSIALNIYLIINYTIQKTSSESEHHTSSPPTESNKEASTISTDNPDINPNSQHPTQQSTENPTLNPAASVSPSETEPASTPDTTNRLSSVDRSTAQPSESRTKTKPTVHTRNNPSTASSTQSPPRATTKAIRRATTFRMSSTGKRPTTTSVQSDSSTTTQNHEETGSANPQASVSTMQN [서열번호 199]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 199에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 hMPV G 폴리펩티드는 다음과 같은 서열번호 200의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGAGGTGAAAGTAGAGAACATTCGAGCAATAGACATGCTCAAAGCAAGAGTGAAAAATCGTGTGGCACGTAGCAAATGCTTTAAAAATGCTTCTTTAATCCTCATAGGAATAACTACACTGAGTATAGCTCTCAATATCTATCTGATCATAAACTACACAATACAAAAAACCTCATCTGAATCAGAACACCACACCAGCTCACCACCCACAGAATCCAACAAGGAAGCTTCAACAATCTCCACAGACAACCCAGACATCAATCCAAACTCACAGCATCCAACTCAACAGTCCACAGAAAACCCCACACTCAACCCCGCAGCATCAGTGAGCCCATCAGAAACAGAACCAGCATCAACACCAGACACAACAAACCGCCTGTCCTCCGTAGACAGGTCCACAGCACAACCAAGTGAAAGCAGAACAAAGACAAAACCGACAGTCCACACAAGAAACAACCCAAGCACAGCTTCCAGTACACAATCCCCACCACGGGCAACAACGAAGGCAATCCGCAGAGCCACCACTTTCCGCATGAGCAGCACAGGAAAAAGACCAACCACAACATCAGTCCAGTCCGACAGCAGCACCACAACCCAAAATCATGAAGAAACAGGTTCAGCGAACCCACAGGCATCTGTAAGCACAATGCAAAAC [서열번호 200]
따라서, 바람직하게는 상기 hMPV G 폴리펩티드는 실질적으로 서열번호 200에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 hMPV G 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 201로 제공된다:
ATGGAAGTGAAGGTCGAGAACATCCGGGCCATCGACATGCTGAAGGCCAGAGTGAAGAACAGAGTGGCCCGGTCCAAGTGCTTCAAGAACGCCAGCCTGATCCTGATCGGCATCACCACACTGTCTATCGCCCTGAACATCTACCTGATCATCAACTACACCATCCAGAAAACCAGCAGCGAGAGCGAGCACCACACAAGCTCTCCACCTACCGAGAGCAACAAAGAGGCCAGCACCATCAGCACCGACAATCCCGACATCAACCCCAACTCTCAGCACCCCACACAGCAGTCCACCGAGAATCCCACACTGAACCCTGCCGCCTCTGTGTCCCCATCTGAGACAGAACCTGCCAGCACACCCGACACCACCAACAGACTGTCTAGCGTGGACAGAAGCACAGCCCAGCCTAGCGAGAGCCGGACCAAGACAAAACCTACCGTGCACACCCGGAACAACCCTAGCACAGCCAGCTCTACACAGAGCCCTCCAAGAGCCACCACCAAGGCCATTAGAAGGGCCACCACCTTCCGGATGAGCAGCACCGGCAAAAGACCTACCACCACCAGCGTGCAGAGCGACAGCAGCACAACCACACAGAACCACGAGGAAACCGGCAGCGCCAATCCTCAGGCTAGCGTGTCCACCATGCAGAAC [서열번호 201]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 201에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 201의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 202로 제공된다:
AUGGAAGUGAAGGUCGAGAACAUCCGGGCCAUCGACAUGCUGAAGGCCAGAGUGAAGAACAGAGUGGCCCGGUCCAAGUGCUUCAAGAACGCCAGCCUGAUCCUGAUCGGCAUCACCACACUGUCUAUCGCCCUGAACAUCUACCUGAUCAUCAACUACACCAUCCAGAAAACCAGCAGCGAGAGCGAGCACCACACAAGCUCUCCACCUACCGAGAGCAACAAAGAGGCCAGCACCAUCAGCACCGACAAUCCCGACAUCAACCCCAACUCUCAGCACCCCACACAGCAGUCCACCGAGAAUCCCACACUGAACCCUGCCGCCUCUGUGUCCCCAUCUGAGACAGAACCUGCCAGCACACCCGACACCACCAACAGACUGUCUAGCGUGGACAGAAGCACAGCCCAGCCUAGCGAGAGCCGGACCAAGACAAAACCUACCGUGCACACCCGGAACAACCCUAGCACAGCCAGCUCUACACAGAGCCCUCCAAGAGCCACCACCAAGGCCAUUAGAAGGGCCACCACCUUCCGGAUGAGCAGCACCGGCAAAAGACCUACCACCACCAGCGUGCAGAGCGACAGCAGCACAACCACACAGAACCACGAGGAAACCGGCAGCGCCAAUCCUCAGGCUAGCGUGUCCACCAUGCAGAAC [서열번호 202]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 202에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
다음의 바이러스 IIP는 RIG-I의 절단을 유발하는 것으로 여겨진다.
한 구현예에서, 상기 적어도 하나의 IIP는 CVB3 3C 프로테아제(P03313; 게놈 폴리단백질 콕사키바이러스 B3(낸시 바이러스주)), 또는 그의 동원체이다. [Xiao H, Li J, Yang X, Li Z, Wang Y, Rui Y, Liu R, Zhang W (2021) Ectopic Expression of TRIM25 Restores RIG-I Expression and IFN Production Reduced by Multiple Enteroviruses 3Cpro. Virol Sin,: 1-12.doi: 10.1007/s12250-021-00410-x]. CVB3 3C 프로테아제의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 203으로 나타낸다:
GPAFEFAVAMMKRNSSTVKTEYGEFTMLGIYDRWAVLPRHAKPGPTILMNDQEVGVLDAKELVDKDGTNLELTLLKLNRNEKFRDIRGFLAKEEVEVNEAVLAINTSKFPNMYIPVGQVTEYGFLNLGGTPTKRMLMYNFPTRAGQCGGVLMSTGKVLGIHVGGNGHQGFSAALLKHYFNDEQ [서열번호 203]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 203에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 CVB3 3C 프로테아제 폴리펩티드는 다음과 같은 서열번호 204의 DNA 뉴클레오티드 서열에 의해 암호화된다:
GGCCCTGCCTTTGAGTTCGCCGTCGCAATGATGAAAAGGAACTCAAGCACGGTGAAAACTGAATATGGCGAGTTTACCATGCTGGGCATCTATGACAGGTGGGCCGTTTTGCCACGCCACGCCAAACCTGGGCCAACCATCTTGATGAATGATCAAGAGGTTGGTGTGCTAGATGCCAAGGAGCTAGTAGACAAGGACGGCACCAACTTAGAACTGACACTACTCAAATTGAACCGGAATGAGAAGTTCAGAGACATCAGAGGCTTCTTAGCCAAGGAGGAAGTGGAGGTTAATGAGGCAGTGCTAGCAATTAACACCAGCAAGTTTCCCAACATGTACATTCCAGTAGGACAGGTCACAGAATACGGCTTCCTAAACCTAGGTGGCACACCCACCAAGAGAATGCTTATGTACAACTTCCCCACAAGAGCAGGCCAGTGTGGTGGAGTGCTCATGTCCACCGGCAAGGTACTGGGTATCCATGTTGGTGGAAATGGCCATCAGGGCTTCTCAGCAGCACTCCTCAAACACTACTTCAATGATGAGCAA [서열번호 204]
따라서, 바람직하게는 상기 CVB3 3C 프로테아제 폴리펩티드는 실질적으로 서열번호 204에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 CVB3 3C 프로테아제 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 205로 제공된다:
GGACCTGCCTTTGAATTCGCCGTGGCCATGATGAAGCGGAACAGCAGCACCGTGAAAACCGAGTACGGCGAGTTCACCATGCTGGGCATCTACGACAGATGGGCCGTGCTGCCTAGACACGCCAAACCTGGACCTACCATCCTGATGAACGACCAAGAAGTGGGCGTTCTGGACGCCAAAGAACTGGTGGACAAGGACGGCACCAACCTGGAACTGACCCTGCTGAAGCTGAACCGGAACGAGAAGTTCCGGGATATCAGAGGCTTCCTGGCCAAAGAAGAGGTGGAAGTCAACGAAGCCGTGCTGGCCATCAACACCAGCAAGTTCCCCAACATGTACATCCCCGTGGGCCAAGTGACAGAGTACGGCTTCCTGAATCTCGGCGGCACCCCTACCAAGCGGATGCTGATGTACAACTTCCCCACCAGAGCCGGCCAGTGTGGCGGAGTTCTTATGTCTACCGGCAAGGTGCTGGGAATCCACGTTGGCGGAAATGGCCACCAGGGCTTTTCTGCCGCTCTGCTGAAACACTACTTCAACGACGAGCAG [서열번호 205]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 205에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 205의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 206으로 제공된다:
GGACCUGCCUUUGAAUUCGCCGUGGCCAUGAUGAAGCGGAACAGCAGCACCGUGAAAACCGAGUACGGCGAGUUCACCAUGCUGGGCAUCUACGACAGAUGGGCCGUGCUGCCUAGACACGCCAAACCUGGACCUACCAUCCUGAUGAACGACCAAGAAGUGGGCGUUCUGGACGCCAAAGAACUGGUGGACAAGGACGGCACCAACCUGGAACUGACCCUGCUGAAGCUGAACCGGAACGAGAAGUUCCGGGAUAUCAGAGGCUUCCUGGCCAAAGAAGAGGUGGAAGUCAACGAAGCCGUGCUGGCCAUCAACACCAGCAAGUUCCCCAACAUGUACAUCCCCGUGGGCCAAGUGACAGAGUACGGCUUCCUGAAUCUCGGCGGCACCCCUACCAAGCGGAUGCUGAUGUACAACUUCCCCACCAGAGCCGGCCAGUGUGGCGGAGUUCUUAUGUCUACCGGCAAGGUGCUGGGAAUCCACGUUGGCGGAAAUGGCCACCAGGGCUUUUCUGCCGCUCUGCUGAAACACUACUUCAACGACGAGCAG [서열번호 206]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 206에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 C형 간염 NS3/4A(O39929; 게놈 폴리단백질 C형 간염 바이러스 유전자형 4a(ED43 단리물)), 또는 그의 동원체이다. C형 간염 NS3/4A의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 207로 나타낸다:
APITAYAQQTRGLFSTIVTSLTGRDTNENCGEVQVLSTATQSFLGTAVNGVMWTVYHGAGAKTISGPKGPVNQMYTNVDQDLVGWPAPPGVRSLAPCTCGSADLYLVTRHADVIPVRRRGDTRGALLSPRPISILKGSSGGPLLCPMGHRAGIFRAAVCTRGVAKAVDFVPVESLETTMRSPVFTDNSTPPAVPQTYQVAHLHAPTGSGKSTKVPAAHAAQGYKVLVLNPSVAATLGFGVYMSKAYGIDPNIRSGVRTITTGAPITYSTYGKFLADGGCSGGAYDIIICDECYSTDSTTILGIGTVLDQAETAGVRLTVLATATPPGSVTTPHSNIEEVALPTTGEIPFYGKAIPLELIKGGRHLIFCHSKKKCDELARQLTSLGLNAVAYYRGLDVSVIPTSGDVVVCATDALMTGFTGDFDSVIDCNTSVIQTVDFSLDPTFSIEITTVPQDAVSRSQRRGRTGRGRLGTYRYVTPGERPSGMFDTAELCECYDAGCAWYELTPAETTTRLKAYFDTPGLPVCQDHLEFWESVFTGLTHIDGHFLSQTKQSGENFPYLVAYQATVSAKVWLAPPSWDTMWKCLIRLKPTLHGPTPLLYRLGSVQNEVVLTHPITKYIMACMSADLEVVT [서열번호 207]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 207에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 C형 간염 NS3/4A 폴리펩티드는 다음과 같은 서열번호 208의 DNA 뉴클레오티드 서열에 의해 암호화된다:
GCCCCCATCACAGCATACGCaCAGCAGACCCGCGGCTTGTTCAGCACCATCGTAACGAGCCTCACTGGCAGGGACACCAATGAGAATTGTGGCGAAGTGCAGGTCTTATCCACCGCTACGCAGTCCTTCCTGGGTACTGCGGTTAACGGCGTGATGTGGACCGTCTACCACGGGGCGGGTGCCAAGACCATCAGCGGCCCGAAGGGACCTGTCAATCAAATGTACACTAATGTTGACCAAGACTTGGTGGGGTGGCCAGCACCCCCCGGAGTCAGATCTCTTGCTCCGTGCACCTGCGGCTCGGCAGACTTGTATCTAGTCACCAGGCACGCGGATGTAATACCCGTGCGCAGGAGAGGAGACACCAGAGGAGCTCTCTTGAGCCCTAGACCAATATCCATTCTTAAGGGATCTTCCGGAGGTCCGCTGCTGTGCCCCATGGGACACCGCGCCGGCATATTCCGTGCGGCGGTGTGTACTCGGGGGGTAGCCAAGGCGGTAGACTTCGTCCCGGTTGAATCTCTTGAGACTACCATGAGATCACCAGTGTTCACTGACAACTCAACACCCCCAGCAGTGCCCCAGACCTACCAGGTCGCGCACCTACACGCACCAACAGGAAGTGGCAAGAGCACTAAGGTCCCGGCGGCGCATGCTGCCCAAGGCTATAAAGTGCTAGTGCTCAATCCTTCGGTTGCGGCCACACTGGGTTTTGGGGTATACATGTCCAAGGCATATGGCATCGACCCGAACATCCGGTCGGGAGTCAGGACCATCACCACGGGTGCGCCAATCACGTACTCAACGTATGGTAAGTTCCTGGCTGATGGAGGTTGCAGCGGAGGGGCATACGACATAATCATCTGTGACGAGTGCTATTCCACTGACTCCACAACGATCCTTGGCATAGGCACAGTCCTGGACCAAGCGGAGACCGCTGGAGTGCGCCTCACCGTGCTCGCGACTGCTACTCCGCCAGGGTCAGTGACTACACCTCATTCCAACATAGAGGAGGTCGCCCTGCCAACAACGGGGGAAATACCCTTTTACGGCAAGGCGATCCCTCTGGAGCTGATCAAGGGGGGCAGACATCTCATCTTCTGCCATTCAAAGAAAAAGTGCGATGAACTGGCCAGACAACTGACATCTCTTGGTCTGAATGCCGTAGCCTACTACAGAGGCTTAGACGTTTCGGTGATTCCCACGTCTGGGGACGTCGTGGTATGCGCCACGGACGCCCTCATGACGGGTTTCACCGGCGACTTTGACTCAGTGATAGACTGCAATACATCTGTGATACAGACTGTTGACTTCAGCTTGGACCCCACCTTCTCCATAGAGATTACAACCGTTCCCCAGGACGCGGTATCCCGCAGCCAGCGGAGAGGCCGCACTGGTAGGGGGAGGTTGGGCACATACCGGTATGTCACCCCGGGAGAGAGACCATCAGGCATGTTTGACACTGCAGAGCTTTGCGAGTGCTACGATGCCGGGTGCGCCTGGTACGAGCTGACACCTGCTGAAACCACAACAAGGCTGAAAGCTTACTTCGACACACCAGGCCTTCCTGTGTGCCAAGACCATCTGGAATTCTGGGAGAGCGTCTTTACAGGGTTAACCCACATAGACGGTCATTTCCTATCCCAGACCAAGCAATCGGGTGAGAATTTCCCGTATCTTGTTGCTTACCAAGCGACGGTGTCGGCCAAGGTCTGGCTCGCTCCACCAAGCTGGGACACCATGTGGAAGTGCCTAATTCGCCTTAAGCCCACCCTGCACGGGCCCACGCCCCTCCTCTACAGACTGGGGTCTGTGCAGAATGAAGTGGTGCTCACCCATCCCATCACCAAATACATCATGGCTTGCATGTCAGCTGATCTCGAGGTAGTGACA [서열번호 208]
따라서, 바람직하게는 상기 C형 간염 NS3/4A 폴리펩티드는 실질적으로 서열번호 208에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 C형 간염 NS3/4A 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 209로 제공된다:
GCCCCTATCACAGCCTACGCTCAGCAGACCAGAGGCCTGTTCAGCACCATCGTGACAAGCCTGACCGGCAGAGACACCAACGAGAATTGTGGCGAGGTGCAGGTCCTGTCTACAGCTACCCAGAGCTTTCTGGGCACCGCCGTGAATGGCGTGATGTGGACAGTGTATCATGGCGCTGGCGCCAAGACAATCTCTGGCCCTAAGGGCCCCGTGAACCAGATGTACACCAACGTGGACCAGGACCTCGTTGGCTGGCCTGCTCCTCCTGGTGTTAGAAGCCTGGCTCCTTGTACATGCGGCAGCGCCGATCTGTACCTGGTCACAAGACACGCCGACGTGATCCCCGTCAGAAGAAGAGGCGATACAAGAGGCGCCCTGCTGAGCCCTAGACCTATCTCTATCCTGAAGGGCAGCTCTGGCGGCCCTCTGCTTTGTCCTATGGGACACAGAGCCGGCATCTTCAGAGCCGCCGTGTGTACTAGAGGCGTGGCCAAGGCTGTGGACTTCGTGCCTGTGGAAAGCCTGGAAACCACCATGAGAAGCCCCGTGTTCACCGACAACAGCACCCCTCCAGCTGTGCCTCAGACATACCAGGTGGCCCATCTGCATGCCCCTACAGGCTCTGGCAAGAGCACAAAAGTGCCTGCCGCTCATGCTGCCCAGGGCTATAAGGTGCTGGTGCTCAATCCTAGCGTGGCCGCCACACTCGGCTTTGGCGTGTACATGTCTAAGGCCTACGGCATCGACCCCAACATCAGATCTGGCGTGCGGACCATCACAACAGGCGCCCCAATCACCTACTCTACCTACGGCAAGTTCCTGGCCGATGGCGGATGTTCTGGCGGAGCCTACGACATCATCATCTGCGACGAGTGCTACAGCACCGACAGCACCACAATCCTCGGCATCGGCACAGTGCTGGATCAGGCTGAAACAGCCGGCGTCAGACTGACTGTGCTGGCCACAGCTACACCTCCAGGCAGCGTGACAACCCCTCACAGCAACATCGAGGAAGTGGCCCTGCCTACAACCGGCGAGATCCCATTCTATGGCAAGGCCATTCCTCTCGAGCTGATCAAAGGCGGCAGACACCTGATCTTTTGCCACAGCAAGAAGAAGTGCGACGAGCTGGCCAGACAGCTGACATCCCTGGGACTGAATGCCGTGGCCTACTACAGAGGACTGGACGTGTCCGTGATTCCCACATCTGGCGACGTGGTCGTGTGTGCCACAGATGCCCTGATGACCGGCTTCACCGGCGACTTCGATAGCGTGATCGACTGCAACACCAGCGTGATCCAGACCGTGGACTTCTCTCTGGACCCCACCTTCAGCATCGAGATCACCACCGTTCCTCAGGACGCCGTGTCTCGGTCACAGAGAAGAGGCAGAACAGGCAGAGGCCGGCTGGGCACATACAGATATGTGACACCCGGCGAAAGACCCAGCGGCATGTTTGATACAGCCGAGCTGTGCGAGTGTTACGACGCCGGATGTGCTTGGTACGAGCTGACACCAGCCGAGACAACCACCAGACTGAAGGCCTACTTCGACACCCCTGGCCTGCCTGTGTGTCAGGACCACCTGGAATTTTGGGAGAGCGTGTTCACAGGACTGACCCACATCGACGGCCACTTTCTGAGCCAGACCAAGCAGAGCGGCGAGAACTTCCCTTACCTGGTGGCCTATCAGGCTACCGTGTCCGCCAAAGTTTGGCTGGCTCCTCCTAGCTGGGACACCATGTGGAAGTGCCTGATCCGGCTGAAGCCTACACTGCACGGACCTACACCTCTGCTGTACAGACTGGGCAGCGTGCAGAATGAGGTGGTGCTGACCCATCCTATCACCAAGTACATCATGGCCTGCATGAGCGCCGACCTGGAAGTGGTTACA [서열번호 209]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 209에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 209의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 210으로 제공된다:
GCCCCUAUCACAGCCUACGCUCAGCAGACCAGAGGCCUGUUCAGCACCAUCGUGACAAGCCUGACCGGCAGAGACACCAACGAGAAUUGUGGCGAGGUGCAGGUCCUGUCUACAGCUACCCAGAGCUUUCUGGGCACCGCCGUGAAUGGCGUGAUGUGGACAGUGUAUCAUGGCGCUGGCGCCAAGACAAUCUCUGGCCCUAAGGGCCCCGUGAACCAGAUGUACACCAACGUGGACCAGGACCUCGUUGGCUGGCCUGCUCCUCCUGGUGUUAGAAGCCUGGCUCCUUGUACAUGCGGCAGCGCCGAUCUGUACCUGGUCACAAGACACGCCGACGUGAUCCCCGUCAGAAGAAGAGGCGAUACAAGAGGCGCCCUGCUGAGCCCUAGACCUAUCUCUAUCCUGAAGGGCAGCUCUGGCGGCCCUCUGCUUUGUCCUAUGGGACACAGAGCCGGCAUCUUCAGAGCCGCCGUGUGUACUAGAGGCGUGGCCAAGGCUGUGGACUUCGUGCCUGUGGAAAGCCUGGAAACCACCAUGAGAAGCCCCGUGUUCACCGACAACAGCACCCCUCCAGCUGUGCCUCAGACAUACCAGGUGGCCCAUCUGCAUGCCCCUACAGGCUCUGGCAAGAGCACAAAAGUGCCUGCCGCUCAUGCUGCCCAGGGCUAUAAGGUGCUGGUGCUCAAUCCUAGCGUGGCCGCCACACUCGGCUUUGGCGUGUACAUGUCUAAGGCCUACGGCAUCGACCCCAACAUCAGAUCUGGCGUGCGGACCAUCACAACAGGCGCCCCAAUCACCUACUCUACCUACGGCAAGUUCCUGGCCGAUGGCGGAUGUUCUGGCGGAGCCUACGACAUCAUCAUCUGCGACGAGUGCUACAGCACCGACAGCACCACAAUCCUCGGCAUCGGCACAGUGCUGGAUCAGGCUGAAACAGCCGGCGUCAGACUGACUGUGCUGGCCACAGCUACACCUCCAGGCAGCGUGACAACCCCUCACAGCAACAUCGAGGAAGUGGCCCUGCCUACAACCGGCGAGAUCCCAUUCUAUGGCAAGGCCAUUCCUCUCGAGCUGAUCAAAGGCGGCAGACACCUGAUCUUUUGCCACAGCAAGAAGAAGUGCGACGAGCUGGCCAGACAGCUGACAUCCCUGGGACUGAAUGCCGUGGCCUACUACAGAGGACUGGACGUGUCCGUGAUUCCCACAUCUGGCGACGUGGUCGUGUGUGCCACAGAUGCCCUGAUGACCGGCUUCACCGGCGACUUCGAUAGCGUGAUCGACUGCAACACCAGCGUGAUCCAGACCGUGGACUUCUCUCUGGACCCCACCUUCAGCAUCGAGAUCACCACCGUUCCUCAGGACGCCGUGUCUCGGUCACAGAGAAGAGGCAGAACAGGCAGAGGCCGGCUGGGCACAUACAGAUAUGUGACACCCGGCGAAAGACCCAGCGGCAUGUUUGAUACAGCCGAGCUGUGCGAGUGUUACGACGCCGGAUGUGCUUGGUACGAGCUGACACCAGCCGAGACAACCACCAGACUGAAGGCCUACUUCGACACCCCUGGCCUGCCUGUGUGUCAGGACCACCUGGAAUUUUGGGAGAGCGUGUUCACAGGACUGACCCACAUCGACGGCCACUUUCUGAGCCAGACCAAGCAGAGCGGCGAGAACUUCCCUUACCUGGUGGCCUAUCAGGCUACCGUGUCCGCCAAAGUUUGGCUGGCUCCUCCUAGCUGGGACACCAUGUGGAAGUGCCUGAUCCGGCUGAAGCCUACACUGCACGGACCUACACCUCUGCUGUACAGACUGGGCAGCGUGCAGAAUGAGGUGGUGCUGACCCAUCCUAUCACCAAGUACAUCAUGGCCUGCAUGAGCGCCGACCUGGAAGUGGUUACA [서열번호 210]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 210에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 DENV NS3 단백질(P17763; 게놈 폴리단백질 뎅기(Dengue) 바이러스 타입 1(나우루(Nauru)/West Pac/1974 바이러스주)), 또는 그의 동원체이다. DENV NS3 단백질의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 211로 나타낸다:
SGVLWDTPSPPEVERAVLDDGIYRILQRGLLGRSQVGVGVFQEGVFHTMWHVTRGAVLMYQGKRLEPSWASVKKDLISYGGGWRFQGSWNAGEEVQVIAVEPGKNPKNVQTAPGTFKTPEGEVGAIALDFKPGTSGSPIVNREGKIVGLYGNGVVTTSGTYVSAIAQAKASQEGPLPEIEDEVFRKRNLTIMDLHPGSGKTRRYLPAIVREAIRRNVRTLVLAPTRVVASEMAEALKGMPIRYQTTAVKSEHTGKEIVDLMCHATFTMRLLSPVRVPNYNMIIMDEAHFTDPASIAARGYISTRVGMGEAAAIFMTATPPGSVEAFPQSNAVIQDEERDIPERSWNSGYDWITDFPGKTVWFVPSIKSGNDIANCLRKNGKRVVQLSRKTFDTEYQKTKNNDWDYVVTTDISEMGANFRADRVIDPRRCLKPVILKDGPERVILAGPMPVTVASAAQRRGRIGRNQNKEGDQYIYMGQPLNNDEDHAHWTEAKMLLDNINTPEGIIPALFEPEREKSAAIDGEYRLRGEARKTFVELMRRGDLPVWLSYKVASEGFQYSDRRWCFDGERNNQVLEENMDVEIWTKEGERKKLRPRWLDARTYSDPLALREFKEFAAGRR [서열번호 211]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 211에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 DENV NS3 폴리펩티드는 다음과 같은 서열번호 212의 DNA 뉴클레오티드 서열에 의해 암호화된다:
TCAGGAGTGCTATGGGACACACCCAGCCCTCCAGAAGTGGAAAGAGCAGTCCTTGATGATGGCATTTATAGAATTCTCCAAAGAGGATTGTTGGGCAGGTCTCAAGTAGGAGTAGGAGTTTTTCAAGAAGGCGTGTTCCACACAATGTGGCACGTCACCAGGGGAGCTGTCCTCATGTACCAAGGGAAGAGACTGGAACCAAGTTGGGCCAGTGTCAAAAAAGACTTGATCTCATATGGAGGAGGTTGGAGGTTTCAAGGATCCTGGAACGCGGGAGAAGAAGTGCAGGTGATTGCTGTTGAACCGGGGAAGAACCCCAAAAATGTACAGACAGCGCCGGGTACCTTCAAGACCCCTGAAGGCGAAGTTGGAGCCATAGCTCTAGACTTTAAACCCGGCACATCTGGATCTCCTATCGTGAACAGAGAGGGAAAAATAGTAGGTCTTTATGGAAATGGAGTGGTGACAACAAGTGGTACCTACGTCAGCGCCATAGCTCAAGCTAAAGCATCACAAGAAGGGCCTCTACCAGAGATTGAGGACGAGGTGTTTAGGAAAAGAAACTTAACAATAATGGACCTACATCCAGGATCGGGGAAAACAAGAAGATATCTTCCAGCCATAGTCCGTGAGGCCATAAGAAGGAACGTGCGCACGCTAGTCTTAGCTCCCACAAGAGTTGTCGCTTCTGAAATGGCAGAGGCGCTCAAGGGAATGCCAATAAGGTATCAGACAACAGCAGTGAAGAGTGAACACACAGGAAAAGAGATAGTTGACCTTATGTGTCACGCCACTTTCACTATGCGTCTCCTGTCTCCTGTGAGAGTTCCCAATTATAATATGATTATCATGGATGAAGCACATTTTACCGATCCAGCCAGCATAGCAGCCAGAGGGTATATCTCAACCCGAGTGGGTATGGGTGAAGCAGCTGCGATTTTCATGACAGCCACTCCCCCCGGATCGGTGGAGGCCTTTCCACAGAGCAATGCAGTTATCCAAGATGAGGAAAGAGACATTCCTGAAAGATCATGGAACTCAGGCTATGACTGGATCACTGATTTCCCAGGTAAAACAGTCTGGTTTGTTCCAAGCATCAAATCAGGAAATGACATTGCCAACTGTTTAAGAAAGAATGGGAAACGGGTGGTCCAATTGAGCAGAAAAACTTTTGACACTGAGTACCAGAAAACAAAAAATAACGACTGGGACTATGTTGTCACAACAGACATATCCGAAATGGGAGCAAACTTCCGAGCCGACAGGGTAATAGACCCGAGGCGGTGCCTGAAACCGGTAATACTAAAAGATGGCCCAGAGCGTGTCATTCTAGCCGGACCGATGCCAGTGACTGTGGCTAGCGCCGCCCAGAGGAGAGGAAGAATTGGAAGGAACCAAAATAAGGAAGGCGATCAGTATATTTACATGGGACAGCCTCTAAACAATGATGAGGACCACGCCCATTGGACAGAAGCAAAAATGCTCCTTGACAACATAAACACACCAGAAGGGATTATCCCAGCCCTCTTTGAGCCGGAGAGAGAAAAGAGTGCAGCAATAGACGGGGAATACAGACTACGGGGTGAAGCGAGGAAAACGTTCGTGGAGCTCATGAGAAGAGGAGATCTACCTGTCTGGCTATCCTACAAAGTTGCCTCAGAAGGCTTCCAGTACTCCGACAGAAGGTGGTGCTTTGATGGGGAAAGGAACAACCAGGTGTTGGAGGAGAACATGGACGTGGAGATCTGGACAAAAGAAGGAGAAAGAAAGAAACTACGACCCCGCTGGCTGGATGCCAGAACATACTCTGACCCACTGGCTCTGCGCGAATTCAAAGAGTTCGCAGCAGGAAGAAGA [서열번호 212]
따라서, 바람직하게는 상기 DENV NS3 폴리펩티드는 실질적으로 서열번호 212에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 DENV NS3 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 213으로 제공된다:
TCTGGCGTGCTGTGGGATACACCTTCTCCACCAGAGGTGGAAAGAGCCGTGCTGGACGACGGCATCTACCGGATTCTGCAGAGAGGACTGCTGGGCAGATCTCAAGTTGGCGTGGGCGTGTTCCAAGAAGGGGTGTTCCACACCATGTGGCACGTGACAAGAGGCGCCGTGCTGATGTACCAGGGCAAGAGACTGGAACCTAGCTGGGCCAGCGTGAAGAAGGACCTGATCTCTTACGGCGGAGGCTGGCGGTTTCAAGGCTCTTGGAATGCCGGCGAAGAGGTGCAAGTGATCGCCGTGGAACCCGGCAAGAACCCCAAGAACGTTCAGACAGCCCCTGGCACCTTCAAGACCCCTGAAGGCGAAGTGGGAGCTATCGCCCTGGATTTCAAGCCTGGCACAAGCGGCAGCCCCATCGTGAACAGAGAAGGCAAGATCGTGGGCCTGTACGGCAATGGCGTGGTCACCACATCTGGCACCTACGTGTCAGCCATTGCTCAGGCCAAGGCCTCTCAAGAGGGACCCCTGCCTGAGATCGAGGACGAGGTGTTCCGGAAGCGGAACCTGACCATCATGGATCTGCACCCTGGCAGCGGCAAGACCAGAAGATATCTGCCCGCCATTGTGCGCGAGGCCATCCGAAGAAATGTGCGGACACTGGTGCTGGCCCCTACAAGAGTGGTGGCCTCTGAAATGGCCGAGGCTCTGAAGGGCATGCCTATCAGATACCAGACCACCGCCGTGAAGTCTGAGCACACCGGCAAAGAAATCGTGGACCTGATGTGCCACGCCACCTTCACCATGAGACTGCTGAGCCCTGTGCGGGTGCCCAACTACAACATGATCATCATGGACGAGGCCCACTTCACAGACCCCGCCTCTATTGCCGCCAGAGGCTACATCTCTACCAGAGTCGGCATGGGAGAAGCCGCCGCTATCTTCATGACAGCCACACCTCCAGGCAGCGTGGAAGCCTTTCCTCAGTCCAATGCCGTGATCCAGGACGAAGAGAGAGACATCCCCGAGCGGAGCTGGAACAGCGGCTACGACTGGATCACCGACTTTCCAGGCAAGACCGTTTGGTTCGTGCCCAGCATCAAGAGCGGCAACGATATCGCCAACTGCCTGCGGAAGAACGGCAAGAGAGTGGTGCAGCTGAGCAGAAAGACCTTCGACACCGAGTACCAAAAGACCAAGAACAACGACTGGGACTACGTCGTGACCACCGACATCTCTGAGATGGGCGCCAACTTCAGGGCCGACAGAGTGATCGACCCTCGGAGATGTCTGAAGCCCGTGATCCTGAAGGACGGCCCTGAGAGAGTGATTCTGGCCGGACCTATGCCTGTGACAGTGGCTTCTGCCGCTCAGAGAAGAGGCCGGATCGGCCGGAATCAGAACAAAGAGGGCGACCAGTACATCTACATGGGCCAGCCTCTGAACAACGATGAGGATCACGCCCACTGGACCGAGGCCAAGATGCTGCTGGACAACATCAACACCCCTGAGGGCATCATCCCCGCTCTGTTCGAGCCCGAGAGAGAGAAGTCTGCCGCAATCGACGGCGAGTACAGACTGAGAGGCGAGGCCAGAAAGACATTTGTGGAACTGATGCGGAGAGGCGACCTGCCTGTGTGGCTGAGTTACAAGGTGGCCAGCGAGGGCTTCCAGTACAGCGATAGAAGATGGTGCTTCGATGGCGAGCGGAACAACCAGGTGCTGGAAGAGAACATGGACGTGGAAATCTGGACCAAAGAAGGCGAGCGCAAGAAACTGCGGCCCAGATGGCTGGATGCCCGGACATATTCTGACCCTCTGGCTCTGCGCGAGTTCAAAGAGTTTGCCGCCGGAAGAAGA [서열번호 213]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 213에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 213의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 214로 제공된다:
UCUGGCGUGCUGUGGGAUACACCUUCUCCACCAGAGGUGGAAAGAGCCGUGCUGGACGACGGCAUCUACCGGAUUCUGCAGAGAGGACUGCUGGGCAGAUCUCAAGUUGGCGUGGGCGUGUUCCAAGAAGGGGUGUUCCACACCAUGUGGCACGUGACAAGAGGCGCCGUGCUGAUGUACCAGGGCAAGAGACUGGAACCUAGCUGGGCCAGCGUGAAGAAGGACCUGAUCUCUUACGGCGGAGGCUGGCGGUUUCAAGGCUCUUGGAAUGCCGGCGAAGAGGUGCAAGUGAUCGCCGUGGAACCCGGCAAGAACCCCAAGAACGUUCAGACAGCCCCUGGCACCUUCAAGACCCCUGAAGGCGAAGUGGGAGCUAUCGCCCUGGAUUUCAAGCCUGGCACAAGCGGCAGCCCCAUCGUGAACAGAGAAGGCAAGAUCGUGGGCCUGUACGGCAAUGGCGUGGUCACCACAUCUGGCACCUACGUGUCAGCCAUUGCUCAGGCCAAGGCCUCUCAAGAGGGACCCCUGCCUGAGAUCGAGGACGAGGUGUUCCGGAAGCGGAACCUGACCAUCAUGGAUCUGCACCCUGGCAGCGGCAAGACCAGAAGAUAUCUGCCCGCCAUUGUGCGCGAGGCCAUCCGAAGAAAUGUGCGGACACUGGUGCUGGCCCCUACAAGAGUGGUGGCCUCUGAAAUGGCCGAGGCUCUGAAGGGCAUGCCUAUCAGAUACCAGACCACCGCCGUGAAGUCUGAGCACACCGGCAAAGAAAUCGUGGACCUGAUGUGCCACGCCACCUUCACCAUGAGACUGCUGAGCCCUGUGCGGGUGCCCAACUACAACAUGAUCAUCAUGGACGAGGCCCACUUCACAGACCCCGCCUCUAUUGCCGCCAGAGGCUACAUCUCUACCAGAGUCGGCAUGGGAGAAGCCGCCGCUAUCUUCAUGACAGCCACACCUCCAGGCAGCGUGGAAGCCUUUCCUCAGUCCAAUGCCGUGAUCCAGGACGAAGAGAGAGACAUCCCCGAGCGGAGCUGGAACAGCGGCUACGACUGGAUCACCGACUUUCCAGGCAAGACCGUUUGGUUCGUGCCCAGCAUCAAGAGCGGCAACGAUAUCGCCAACUGCCUGCGGAAGAACGGCAAGAGAGUGGUGCAGCUGAGCAGAAAGACCUUCGACACCGAGUACCAAAAGACCAAGAACAACGACUGGGACUACGUCGUGACCACCGACAUCUCUGAGAUGGGCGCCAACUUCAGGGCCGACAGAGUGAUCGACCCUCGGAGAUGUCUGAAGCCCGUGAUCCUGAAGGACGGCCCUGAGAGAGUGAUUCUGGCCGGACCUAUGCCUGUGACAGUGGCUUCUGCCGCUCAGAGAAGAGGCCGGAUCGGCCGGAAUCAGAACAAAGAGGGCGACCAGUACAUCUACAUGGGCCAGCCUCUGAACAACGAUGAGGAUCACGCCCACUGGACCGAGGCCAAGAUGCUGCUGGACAACAUCAACACCCCUGAGGGCAUCAUCCCCGCUCUGUUCGAGCCCGAGAGAGAGAAGUCUGCCGCAAUCGACGGCGAGUACAGACUGAGAGGCGAGGCCAGAAAGACAUUUGUGGAACUGAUGCGGAGAGGCGACCUGCCUGUGUGGCUGAGUUACAAGGUGGCCAGCGAGGGCUUCCAGUACAGCGAUAGAAGAUGGUGCUUCGAUGGCGAGCGGAACAACCAGGUGCUGGAAGAGAACAUGGACGUGGAAAUCUGGACCAAAGAAGGCGAGCGCAAGAAACUGCGGCCCAGAUGGCUGGAUGCCCGGACAUAUUCUGACCCUCUGGCUCUGCGCGAGUUCAAAGAGUUUGCCGCCGGAAGAAGA [서열번호 214]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 214에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 EV71 3Cpro(B9VUU3; 게놈 폴리단백질 인간 엔테로바이러스 71), 또는 그의 동원체이다. [Lei X, Xiao X, Xue Q, Jin Q, He B, Wang JJ. (2013) Cleavage of interferon regulatory factor 7 by enterovirus 71 3C suppresses cellular responses. J Virol, 87, 3, 1690-1698. doi: 10.1128/JVI.01855-12. Epub 2012 Nov 21]. 상기 IIP는 IRF7을 절단하는 것으로 여겨진다. EV71 3Cpro의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 215로 나타낸다:
GPSLDFALSLLRRNVRQVQTDQGHFTMLGVRDRLAVLPRHSQPGKTIWIEHKLVNVLDAVELVDEQGVNLELTLITLDTNEKFRDITKFIPENISTASDATLVINTEHMPSMFVPVGDVVQYGFLNLSGKPTHRTMMYNFPTKAGQCGGVVTSVGKVIGIHIGGNGRQGFCAGLKRSYFASEQ [서열번호 215]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 215에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 EV71 3Cpro 폴리펩티드는 다음과 같은 서열번호 216의 DNA 뉴클레오티드 서열에 의해 암호화된다:
GGCCCGAGCCTTGATTTTGCTCTCTCCCTACTGAGGAGGAACGTCAGGCAAGTCCAAACAGACCAGGGGCATTTCACCATGTTGGGTGTTAGGGATCGCTTAGCAGTCCTCCCACGCCACTCACAACCCGGCAAAACTATTTGGATTGAGCACAAACTCGTGAACGTCCTTGATGCAGTTGAATTGGTGGATGAGCAAGGAGTCAACCTGGAATTAACCCTCATCACTCTTGATACCAACGAGAAGTTTAGGGATATCACCAAATTCATCCCGGAAAATATTAGCACTGCTAGTGATGCCACCCTAGTGATCAACACGGAGCACATGCCCTCGATGTTTGTCCCGGTGGGTGACGTTGTGCAGTATGGTTTCCTGAATCTCAGTGGTAAGCCTACTCATCGCACCATGATGTACAACTTTCCTACTAAGGCAGGGCAATGTGGAGGGGTGGTGACATCAGTTGGAAAAGTCATCGGTATACACATAGGTGGCAACGGTAGACAAGGATTTTGTGCAGGTCTTAAGAGAAGCTACTTTGCCAGCGAGCAA [서열번호 216]
따라서, 바람직하게는 상기 EV71 3Cpro 폴리펩티드는 실질적으로 서열번호 216에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 EV71 3Cpro 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 217로 제공된다:
GGCCCTTCTCTGGATTTTGCCCTGAGCCTGCTGCGGAGAAATGTGCGCCAGGTGCAGACAGATCAGGGCCACTTTACAATGCTGGGCGTCAGAGACAGACTGGCCGTGCTGCCTAGACACTCTCAGCCTGGCAAGACCATCTGGATCGAGCACAAGCTGGTCAACGTGCTGGACGCCGTGGAACTGGTTGATGAGCAGGGCGTGAACCTGGAACTGACCCTGATCACCCTGGACACCAACGAGAAGTTCCGGGACATCACCAAGTTCATCCCCGAGAACATCAGCACCGCCAGCGACGCCACACTGGTCATCAATACCGAGCACATGCCCAGCATGTTCGTGCCTGTGGGAGATGTGGTGCAGTACGGCTTCCTGAACCTGAGCGGCAAGCCCACACACCGGACCATGATGTACAACTTCCCTACCAAGGCCGGCCAGTGCGGCGGAGTGGTTACATCTGTGGGCAAAGTGATCGGCATCCACATCGGCGGCAATGGCAGACAGGGATTTTGTGCCGGCCTGAAGAGAAGCTACTTCGCCTCTGAACAG [서열번호 217]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 217에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 217의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 218로 제공된다:
GGCCCUUCUCUGGAUUUUGCCCUGAGCCUGCUGCGGAGAAAUGUGCGCCAGGUGCAGACAGAUCAGGGCCACUUUACAAUGCUGGGCGUCAGAGACAGACUGGCCGUGCUGCCUAGACACUCUCAGCCUGGCAAGACCAUCUGGAUCGAGCACAAGCUGGUCAACGUGCUGGACGCCGUGGAACUGGUUGAUGAGCAGGGCGUGAACCUGGAACUGACCCUGAUCACCCUGGACACCAACGAGAAGUUCCGGGACAUCACCAAGUUCAUCCCCGAGAACAUCAGCACCGCCAGCGACGCCACACUGGUCAUCAAUACCGAGCACAUGCCCAGCAUGUUCGUGCCUGUGGGAGAUGUGGUGCAGUACGGCUUCCUGAACCUGAGCGGCAAGCCCACACACCGGACCAUGAUGUACAACUUCCCUACCAAGGCCGGCCAGUGCGGCGGAGUGGUUACAUCUGUGGGCAAAGUGAUCGGCAUCCACAUCGGCGGCAAUGGCAGACAGGGAUUUUGUGCCGGCCUGAAGAGAAGCUACUUCGCCUCUGAACAG [서열번호 218]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 218에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 FMDV Lpro(P03307; 리더(Leader) 프로테아제 게놈 폴리단백질 구제역 바이러스(단리물-/독일/A5 베스터발트(Westerwald)/1951 혈청형 A)), 또는 그의 동원체이다. FMDV Lpro의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 219로 나타낸다:
MHTTDCFIALVHAIREIRALFLPRTTGKMELTLHNGEKKTFYSRPNNHDNCWLNTILQLFRYVDEPFFDWVYNSPENLTLEAINQLEELTGLELHEGGPPALVIWNIKHLLHTGIGTASRPSEVCMVDGTDMCLADFHAGIFLKGQEHAVFACVTSNGWYAIDDEEFYPWTPDPSDVLVFVPYDQEPLNGDWKAMVQRKLK [서열번호 219]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 219에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 FMDV Lpro 폴리펩티드는 다음과 같은 서열번호 220의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGCATACAACTGACTGTTTTATCGCTTTGGTGCACGCTATCAGAGAGATCAGAGCACTTTTTCTACCACGAACCACAGGAAAGATGGAACTCACCCTGCACAACGGCGAGAAAAAGACTTTTTACTCTAGACCCAACAACCACGACAACTGCTGGTTGAACACCATCCTTCAGTTGTTCAGGTATGTCGATGAACCCTTCTTCGACTGGGTCTACAACTCGCCCGAGAACCTCACGCTTGAAGCCATCAACCAATTGGAGGAACTCACAGGACTTGAGTTGCACGAGGGCGGACCGCCTGCCCTTGTGATCTGGAACATCAAACACTTGCTCCACACCGGCATCGGCACCGCCTCACGACCCAGTGAGGTGTGTATGGTGGACGGCACGGACATGTGTCTTGCTGACTTCCACGCAGGCATTTTCCTGAAGGGACAGGAACACGCAGTCTTTGCGTGTGTCACCTCCAACGGGTGGTACGCGATTGACGACGAGGAATTTTACCCCTGGACGCCTGACCCGTCAGACGTCCTGGTGTTTGTCCCGTACGATCAAGAACCACTCAACGGGGACTGGAAAGCGATGGTTCAGAGGAAGCTTAAG [서열번호 220]
따라서, 바람직하게는 상기 FMDV Lpro 폴리펩티드는 실질적으로 서열번호 220에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 FMDV Lpro 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 221로 제공된다:
ATGCACACCACCGACTGCTTTATCGCCCTGGTGCACGCCATCAGAGAGATCAGAGCCCTGTTCCTGCCTCGGACCACCGGCAAGATGGAACTGACACTGCACAACGGCGAGAAGAAAACCTTCTACAGCAGACCCAACAACCACGACAACTGCTGGCTGAACACCATCCTGCAGCTGTTCAGATACGTGGACGAGCCCTTCTTCGACTGGGTGTACAACAGCCCCGAGAATCTGACCCTGGAAGCCATCAACCAGCTGGAAGAACTGACCGGCCTGGAACTGCATGAAGGCGGACCTCCAGCTCTGGTCATCTGGAACATCAAACATCTGCTGCACACCGGCATCGGCACCGCCTCTAGACCATCTGAAGTGTGCATGGTGGACGGCACCGATATGTGCCTGGCCGATTTTCACGCCGGCATCTTTCTGAAGGGCCAAGAGCATGCCGTGTTCGCCTGCGTGACAAGCAATGGATGGTACGCCATCGACGACGAGGAATTCTACCCCTGGACACCCGATCCTAGCGACGTGCTGGTGTTCGTGCCCTACGATCAAGAGCCCCTGAACGGCGATTGGAAGGCCATGGTGCAGCGGAAGCTGAAG [서열번호 221]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 221에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 221의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 222로 제공된다:
AUGCACACCACCGACUGCUUUAUCGCCCUGGUGCACGCCAUCAGAGAGAUCAGAGCCCUGUUCCUGCCUCGGACCACCGGCAAGAUGGAACUGACACUGCACAACGGCGAGAAGAAAACCUUCUACAGCAGACCCAACAACCACGACAACUGCUGGCUGAACACCAUCCUGCAGCUGUUCAGAUACGUGGACGAGCCCUUCUUCGACUGGGUGUACAACAGCCCCGAGAAUCUGACCCUGGAAGCCAUCAACCAGCUGGAAGAACUGACCGGCCUGGAACUGCAUGAAGGCGGACCUCCAGCUCUGGUCAUCUGGAACAUCAAACAUCUGCUGCACACCGGCAUCGGCACCGCCUCUAGACCAUCUGAAGUGUGCAUGGUGGACGGCACCGAUAUGUGCCUGGCCGAUUUUCACGCCGGCAUCUUUCUGAAGGGCCAAGAGCAUGCCGUGUUCGCCUGCGUGACAAGCAAUGGAUGGUACGCCAUCGACGACGAGGAAUUCUACCCCUGGACACCCGAUCCUAGCGACGUGCUGGUGUUCGUGCCCUACGAUCAAGAGCCCCUGAACGGCGAUUGGAAGGCCAUGGUGCAGCGGAAGCUGAAG [서열번호 222]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 222에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 FMDV 3Cpro(P03307; 프로테아제 3C 게놈 폴리단백질 구제역 바이러스(단리물-/독일/A5 베스터발트/1951 혈청형 A), 또는 그의 동원체이다. [Ekanayaka P, Shin SH, Weeratunga P, Lee H, Kim T-H, Chathuranga K, Subasinghe A, Park J-H, Lee J-S (2021) Foot and mouth disease virus 3C protease antagonises interferon signaling and C142T substitution attenuates the FMD virus. Front Microbiol., 21, 737031. doi: 10.3389/fmicb.2021.737031].
FMDV 3Cpro의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 223으로 나타낸다:
SGAPPTDLQKMVMGNTKPVELILDGKTVAICCATGVFGTAYLVPRHLFAEKYDKIMLDGRAMTDSDYRVFEFEIKVKGQDMLSDAALMVLHRGNRVRDITKHFRDTARMKKGTPVVGVINNADVGRLIFSGEALTYKDIVVCMDGDTMPGLFAYRAATKAGYCGGAVLAKDGADTFIVGTHSAGGNGVGYCSCVSRSMLLKMKAHIDPEPHHE [서열번호 223]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 223에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 FMDV 3Cpro 폴리펩티드는 다음과 같은 서열번호 224의 DNA 뉴클레오티드 서열에 의해 암호화된다:
AGTGGTGCCCCCCCGACCGACTTGCAAAAGATGGTCATGGGCAACACAAAGCCTGTTGAGCTCATCCTCGACGGGAAGACAGTAGCCATCTGCTGTGCTACTGGAGTGTTTGGCACTGCCTACCTCGTGCCTCGTCATCTTTTCGCTGAGAAGTATGACAAGATCATGTTGGACGGCAGAGCCATGACAGACAGTGACTACAGAGTGTTTGAGTTCGAGATCAAAGTAAAAGGACAGGACATGCTCTCAGACGCCGCACTCATGGTGCTCCACCGTGGGAACCGCGTGAGAGACATCACGAAGCACTTTCGTGACACAGCAAGAATGAAGAAAGGCACCCCCGTTGTCGGCGTGATCAACAATGCCGATGTCGGGAGACTGATTTTCTCTGGCGAAGCCCTTACCTACAAAGACATTGTAGTGTGCATGGACGGAGACACCATGCCCGGGCTTTTTGCCTACAGAGCCGCCACTAAGGCAGGCTACTGCGGGGGAGCCGTTCTCGCTAAGGACGGGGCTGACACTTTCATCGTTGGCACTCACTCTGCAGGAGGTAATGGAGTTGGATACTGCTCATGCGTTTCCAGGTCCATGCTTCTCAAGATGAAGGCACACATTGACCCTGAGCCGCACCACGAG [서열번호 224]
따라서, 바람직하게는 상기 FMDV 3Cpro 폴리펩티드는 실질적으로 서열번호 224에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 FMDV 3Cpro 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 225로 제공된다:
TCTGGTGCCCCTCCTACCGACCTGCAGAAAATGGTCATGGGCAACACCAAGCCTGTGGAACTGATCCTGGACGGCAAGACCGTGGCCATCTGTTGTGCAACAGGCGTGTTCGGCACCGCCTACCTGGTTCCTAGACACCTGTTCGCCGAGAAGTACGACAAGATCATGCTGGATGGCAGAGCCATGACCGACAGCGACTACCGGGTGTTCGAGTTCGAGATCAAAGTGAAAGGCCAGGACATGCTGAGCGACGCCGCTCTGATGGTTCTGCACAGAGGCAACAGAGTGCGGGACATCACCAAGCACTTCCGGGACACCGCCAGAATGAAGAAAGGCACACCTGTCGTGGGCGTGATCAACAACGCTGACGTGGGCAGACTGATCTTCTCTGGCGAGGCCCTGACCTACAAGGACATCGTCGTGTGCATGGACGGCGACACAATGCCTGGCCTGTTTGCCTATAGAGCCGCCACAAAGGCCGGCTACTGTGGCGGAGCTGTGCTGGCTAAAGATGGCGCCGATACCTTCATCGTGGGCACACATTCTGCCGGCGGAAATGGCGTGGGCTACTGCTCTTGTGTGTCCAGATCCATGCTGCTGAAGATGAAGGCCCACATCGACCCCGAGCCTCACCATGAA [서열번호 225]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 225에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 225의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 226으로 제공된다:
UCUGGUGCCCCUCCUACCGACCUGCAGAAAAUGGUCAUGGGCAACACCAAGCCUGUGGAACUGAUCCUGGACGGCAAGACCGUGGCCAUCUGUUGUGCAACAGGCGUGUUCGGCACCGCCUACCUGGUUCCUAGACACCUGUUCGCCGAGAAGUACGACAAGAUCAUGCUGGAUGGCAGAGCCAUGACCGACAGCGACUACCGGGUGUUCGAGUUCGAGAUCAAAGUGAAAGGCCAGGACAUGCUGAGCGACGCCGCUCUGAUGGUUCUGCACAGAGGCAACAGAGUGCGGGACAUCACCAAGCACUUCCGGGACACCGCCAGAAUGAAGAAAGGCACACCUGUCGUGGGCGUGAUCAACAACGCUGACGUGGGCAGACUGAUCUUCUCUGGCGAGGCCCUGACCUACAAGGACAUCGUCGUGUGCAUGGACGGCGACACAAUGCCUGGCCUGUUUGCCUAUAGAGCCGCCACAAAGGCCGGCUACUGUGGCGGAGCUGUGCUGGCUAAAGAUGGCGCCGAUACCUUCAUCGUGGGCACACAUUCUGCCGGCGGAAAUGGCGUGGGCUACUGCUCUUGUGUGUCCAGAUCCAUGCUGCUGAAGAUGAAGGCCCACAUCGACCCCGAGCCUCACCAUGAA [서열번호 226]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 226에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 토스카나 바이러스 NSS 단백질(RIG 1 분해)(P21699; 비-구조 단백질 NS-S 토스카나 바이러스), 또는 그의 동원체이다. 토스카나 바이러스 NSS 단백질의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 227로 나타낸다:
MQSRAVILKYRSGSGHKRSLPRFYIDCDLDTFDFEKDCSLIENEFPIYINNYKVVYKSKPTLSHFLIEKEFPAVLGPGMISAVRTRLYEPTMRELYQESIHQLKRSNKKYLLSALRWPTGIPTLEFIDYYFEELLFLSEFDPGSIQRYLKLLVKASGLYNSTNEEQIVEIHRRVLIEGKKHGLTAFDLPGNDILGDICVVQAARVTRLVAKTFSKMTRDTHLMIYFSISPVELVLSKLDKKGDKRAKAKGLMSMSAARSYDYFMRTDLGFRETALSTFWAKDWPTPQETILSDKRCLKEDMRVTKWLPSPPHYPPL [서열번호 227]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 227에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 토스카나 바이러스 NSS 폴리펩티드는 다음과 같은 서열번호 228의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGCAATCCAGAGCTGTCATCTTGAAGTATAGATCTGGTTCAGGCCACAAGAGGTCTTTGCCCAGGTTCTACATAGACTGTGATTTGGACACCTTTGATTTTGAGAAGGATTGCTCTCTGATTGAGAATGAGTTCCCCATTTACATAAACAATTATAAGGTGGTCTATAAGTCAAAGCCAACTCTCTCACATTTCCTCATTGAGAAGGAGTTTCCTGCTGTGCTGGGGCCTGGTATGATCAGTGCAGTTCGAACCAGACTTTACGAGCCAACTATGAGAGAGCTCTACCAGGAATCGATTCACCAACTAAAGAGGAGCAACAAGAAATACCTTTTGTCTGCTCTCAGGTGGCCCACAGGGATTCCTACTCTAGAGTTTATAGACTATTACTTCGAGGAGCTCCTGTTCTTGTCAGAGTTTGACCCGGGGTCTATCCAGAGATACCTGAAATTACTGGTTAAGGCCTCTGGGCTTTACAACTCCACTAATGAGGAGCAGATAGTGGAGATTCACAGACGAGTGCTCATAGAAGGCAAAAAGCACGGATTGACTGCTTTTGATCTCCCAGGAAATGACATCCTTGGAGACATCTGTGTGGTCCAAGCAGCACGGGTGACAAGACTGGTTGCTAAGACATTCTCTAAGATGACCAGAGACACCCATCTGATGATATACTTCTCGATAAGCCCAGTTGAGTTGGTTTTGAGTAAACTTGATAAGAAAGGGGACAAGAGGGCTAAAGCAAAAGGGTTGATGTCTATGAGTGCCGCTAGGTCTTATGACTATTTTATGAGAACTGACTTGGGATTCAGAGAGACTGCTCTTTCCACCTTTTGGGCTAAGGACTGGCCTACCCCACAAGAGACCATTCTATCTGACAAACGATGCCTTAAAGAAGACATGAGAGTGACAAAGTGGCTGCCTAGTCCCCCCCACTACCCACCCTTA [서열번호 228]
따라서, 바람직하게는 상기 토스카나 바이러스 NSS 폴리펩티드는 실질적으로 서열번호 228에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 토스카나 바이러스 NSS 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 229로 제공된다:
ATGCAGAGCAGAGCCGTGATCCTGAAGTACAGAAGCGGCAGCGGCCACAAGAGAAGCCTGCCTAGATTCTACATCGACTGCGACCTGGACACCTTCGACTTCGAGAAGGACTGCAGCCTGATCGAGAACGAGTTCCCCATCTACATCAACAACTACAAGGTGGTGTACAAGAGCAAGCCAACTCTGAGCCACTTCCTCATCGAGAAAGAATTCCCTGCCGTGCTCGGCCCTGGCATGATCTCTGCCGTTAGAACCAGACTGTACGAGCCCACCATGAGAGAGCTGTACCAAGAGAGCATCCACCAGCTGAAGCGGAGCAACAAGAAGTACCTGCTGAGCGCCCTGAGATGGCCCACAGGCATTCCCACACTGGAATTCATCGACTACTACTTCGAGGAACTGCTGTTCCTGAGCGAGTTCGACCCTGGCAGCATCCAGAGATACCTGAAGCTGCTGGTCAAGGCCAGCGGCCTGTACAACAGCACCAACGAGGAACAGATCGTGGAAATCCACCGGCGGGTGCTGATCGAGGGAAAGAAGCACGGACTGACCGCCTTCGACCTGCCTGGCAATGATATCCTGGGCGACATCTGCGTGGTGCAGGCCGCTAGAGTGACAAGACTGGTGGCCAAGACCTTCAGCAAGATGACCAGAGACACCCACCTGATGATCTACTTCAGCATCAGCCCCGTGGAACTGGTGCTGAGCAAGCTGGACAAGAAGGGCGACAAGAGAGCCAAGGCCAAGGGCCTGATGAGCATGTCTGCCGCCAGATCCTACGACTACTTCATGAGAACCGACCTGGGCTTCAGAGAGACAGCCCTGAGCACCTTCTGGGCCAAAGACTGGCCCACACCTCAAGAGACAATCCTGTCCGACAAGCGGTGCCTGAAAGAAGATATGCGGGTCACCAAGTGGCTGCCCTCTCCACCTCATTACCCTCCACTT [서열번호 229]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 229에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 229의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 230으로 제공된다:
AUGCAGAGCAGAGCCGUGAUCCUGAAGUACAGAAGCGGCAGCGGCCACAAGAGAAGCCUGCCUAGAUUCUACAUCGACUGCGACCUGGACACCUUCGACUUCGAGAAGGACUGCAGCCUGAUCGAGAACGAGUUCCCCAUCUACAUCAACAACUACAAGGUGGUGUACAAGAGCAAGCCAACUCUGAGCCACUUCCUCAUCGAGAAAGAAUUCCCUGCCGUGCUCGGCCCUGGCAUGAUCUCUGCCGUUAGAACCAGACUGUACGAGCCCACCAUGAGAGAGCUGUACCAAGAGAGCAUCCACCAGCUGAAGCGGAGCAACAAGAAGUACCUGCUGAGCGCCCUGAGAUGGCCCACAGGCAUUCCCACACUGGAAUUCAUCGACUACUACUUCGAGGAACUGCUGUUCCUGAGCGAGUUCGACCCUGGCAGCAUCCAGAGAUACCUGAAGCUGCUGGUCAAGGCCAGCGGCCUGUACAACAGCACCAACGAGGAACAGAUCGUGGAAAUCCACCGGCGGGUGCUGAUCGAGGGAAAGAAGCACGGACUGACCGCCUUCGACCUGCCUGGCAAUGAUAUCCUGGGCGACAUCUGCGUGGUGCAGGCCGCUAGAGUGACAAGACUGGUGGCCAAGACCUUCAGCAAGAUGACCAGAGACACCCACCUGAUGAUCUACUUCAGCAUCAGCCCCGUGGAACUGGUGCUGAGCAAGCUGGACAAGAAGGGCGACAAGAGAGCCAAGGCCAAGGGCCUGAUGAGCAUGUCUGCCGCCAGAUCCUACGACUACUUCAUGAGAACCGACCUGGGCUUCAGAGAGACAGCCCUGAGCACCUUCUGGGCCAAAGACUGGCCCACACCUCAAGAGACAAUCCUGUCCGACAAGCGGUGCCUGAAAGAAGAUAUGCGGGUCACCAAGUGGCUGCCCUCUCCACCUCAUUACCCUCCACUU [서열번호 230]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 230에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 비-구조 단백질 1 인플루엔자 A 바이러스(바이러스주 A/푸에르토리코/8/1934 H1N1)(P03496; 인플루엔자 A/PR/8/34 NS1), 또는 그의 동원체이다. 인플루엔자 A 바이러스 비-구조 단백질 1의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 231로 나타낸다:
MDPNTVSSFQVDCFLWHVRKRVADQELGDAPFLDRLRRDQKSLRGRGSTLGLDIETATRAGKQIVERILKEESDEALKMTMASVPASRYLTDMTLEEMSREWSMLIPKQKVAGPLCIRMDQAIMDKNIILKANFSVIFDRLETLILLRAFTEEGAIVGEISPLPSLPGHTAEDVKNAVGVLIGGLEWNDNTVRVSETLQRFAWRSSNENGRPPLTPKQKREMAGTIRSEV [서열번호 231]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 231에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 비-구조 단백질 1 인플루엔자 A 바이러스 폴리펩티드는 다음과 같은 서열번호 232의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGATCCAAACACTGTGTCAAGCTTTCAGGTAGATTGCTTTCTTTGGCATGTCCGCAAACGAGTTGCAGACCAAGAACTAGGTGATGCCCCATTCCTTGATCGGCTTCGCCGAGATCAGAAATCCCTAAGAGGAAGGGGCAGCACTCTTGGTCTGGACATCGAGACAGCCACACGTGCTGGAAAGCAGATAGTGGAGCGGATTCTGAAAGAAGAATCCGATGAGGCACTTAAAATGACCATGGCCTCTGTACCTGCGTCGCGTTACCTAACCGACATGACTCTTGAGGAAATGTCAAGGGAATGGTCCATGCTCATACCCAAGCAGAAAGTGGCAGGCCCTCTTTGTATCAGAATGGACCAGGCGATCATGGATAAAAACATCATACTGAAAGCGAACTTCAGTGTGATTTTTGACCGGCTGGAGACTCTAATATTGCTAAGGGCTTTCACCGAAGAGGGAGCAATTGTTGGCGAAATTTCACCATTGCCTTCTCTTCCAGGACATACTGCTGAGGATGTCAAAAATGCAGTTGGAGTCCTCATCGGAGGACTTGAATGGAATGATAACACAGTTCGAGTCTCTGAAACTCTACAGAGATTCGCTTGGAGAAGCAGTAATGAGAATGGGAGACCTCCACTCACTCCAAAACAGAAACGAGAAATGGCGGGAACAATTAGGTCAGAAGTTTGA [서열번호 232]
따라서, 바람직하게는 상기 비-구조 단백질 1 인플루엔자 A 바이러스 폴리펩티드는 실질적으로 서열번호 232에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 비-구조 단백질 1 인플루엔자 A 바이러스 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 233으로 제공된다:
ATGGACCCCAATACCGTCAGCAGCTTCCAGGTGGACTGCTTCCTGTGGCACGTGCGGAAAAGAGTGGCCGATCAAGAACTGGGCGACGCCCCATTCCTGGACAGACTGAGAAGAGATCAGAAGTCCCTGAGAGGCAGAGGCAGCACACTGGGCCTCGACATTGAGACAGCCACAAGAGCCGGCAAGCAGATCGTGGAACGGATCCTGAAAGAGGAAAGCGACGAGGCCCTGAAGATGACCATGGCCTCTGTGCCTGCCAGCAGATACCTGACCGACATGACCCTGGAAGAGATGAGCCGCGAGTGGTCCATGCTGATCCCCAAGCAGAAAGTGGCCGGACCTCTGTGCATCAGAATGGATCAGGCCATCATGGACAAGAACATCATCCTGAAGGCCAACTTCAGCGTGATCTTCGACCGGCTGGAAACCCTGATCCTGCTGAGAGCCTTTACCGAAGAGGGCGCCATCGTGGGAGAGATCAGTCCTCTGCCTTCTCTGCCTGGACACACCGCCGAGGATGTGAAGAATGCTGTGGGCGTGCTGATCGGCGGCCTGGAATGGAACGATAACACCGTCAGAGTGTCCGAGACACTGCAGAGATTTGCCTGGCGGAGCAGCAACGAGAACGGCAGACCTCCTCTGACACCTAAGCAGAAAAGAGAGATGGCCGGCACCATCCGCAGCGAAGTGTAA [서열번호 233]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 233에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 233의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 234로 제공된다:
AUGGACCCCAAUACCGUCAGCAGCUUCCAGGUGGACUGCUUCCUGUGGCACGUGCGGAAAAGAGUGGCCGAUCAAGAACUGGGCGACGCCCCAUUCCUGGACAGACUGAGAAGAGAUCAGAAGUCCCUGAGAGGCAGAGGCAGCACACUGGGCCUCGACAUUGAGACAGCCACAAGAGCCGGCAAGCAGAUCGUGGAACGGAUCCUGAAAGAGGAAAGCGACGAGGCCCUGAAGAUGACCAUGGCCUCUGUGCCUGCCAGCAGAUACCUGACCGACAUGACCCUGGAAGAGAUGAGCCGCGAGUGGUCCAUGCUGAUCCCCAAGCAGAAAGUGGCCGGACCUCUGUGCAUCAGAAUGGAUCAGGCCAUCAUGGACAAGAACAUCAUCCUGAAGGCCAACUUCAGCGUGAUCUUCGACCGGCUGGAAACCCUGAUCCUGCUGAGAGCCUUUACCGAAGAGGGCGCCAUCGUGGGAGAGAUCAGUCCUCUGCCUUCUCUGCCUGGACACACCGCCGAGGAUGUGAAGAAUGCUGUGGGCGUGCUGAUCGGCGGCCUGGAAUGGAACGAUAACACCGUCAGAGUGUCCGAGACACUGCAGAGAUUUGCCUGGCGGAGCAGCAACGAGAACGGCAGACCUCCUCUGACACCUAAGCAGAAAAGAGAGAUGGCCGGCACCAUCCGCAGCGAAGUGUAA [서열번호 234]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 234에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 SARS CoV N 단백질(P59595; 핵단백질 중증 급성 호흡기 증후군 코로나바이러스), 또는 그의 동원체이다. SARS CoV N 단백질의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 235로 나타낸다:
MSDNGPQSNQRSAPRITFGGPTDSTDNNQNGGRNGARPKQRRPQGLPNNTASWFTALTQHGKEELRFPRGQGVPINTNSGPDDQIGYYRRATRRVRGGDGKMKELSPRWYFYYLGTGPEASLPYGANKEGIVWVATEGALNTPKDHIGTRNPNNNAATVLQLPQGTTLPKGFYAEGSRGGSQASSRSSSRSRGNSRNSTPGSSRGNSPARMASGGGETALALLLLDRLNQLESKVSGKGQQQQGQTVTKKSAAEASKKPRQKRTATKQYNVTQAFGRRGPEQTQGNFGDQDLIRQGTDYKHWPQIAQFAPSASAFFGMSRIGMEVTPSGTWLTYHGAIKLDDKDPQFKDNVILLNKHIDAYKTFPPTEPKKDKKKKTDEAQPLPQRQKKQPTVTLLPAADMDDFSRQLQNSMSGASADSTQA [서열번호 235]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 235에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 SARS CoV N 폴리펩티드는 다음과 같은 서열번호 236의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGTCTGATAATGGACCCCAATCAAACCAACGTAGTGCCCCCCGCATTACATTTGGTGGACCCACAGATTCAACTGACAATAACCAGAATGGAGGACGCAATGGGGCAAGGCCAAAACAGCGCCGACCCCAAGGTTTACCCAATAATACTGCGTCTTGGTTCACAGCTCTCACTCAGCATGGCAAGGAGGAACTTAGATTCCCTCGAGGCCAGGGCGTTCCAATCAACACCAATAGTGGTCCAGATGACCAAATTGGCTACTACCGAAGAGCTACCCGACGAGTTCGTGGTGGTGACGGCAAAATGAAAGAGCTCAGCCCCAGATGGTACTTCTATTACCTAGGAACTGGCCCAGAAGCTTCACTTCCCTACGGCGCTAACAAAGAAGGCATCGTATGGGTTGCAACTGAGGGAGCCTTGAATACACCCAAAGACCACATTGGCACCCGCAATCCTAATAACAATGCTGCCACCGTGCTACAACTTCCTCAAGGAACAACATTGCCAAAAGGCTTCTACGCAGAGGGAAGCAGAGGCGGCAGTCAAGCCTCTTCTCGCTCCTCATCACGTAGTCGCGGTAATTCAAGAAATTCAACTCCTGGCAGCAGTAGGGGAAATTCTCCTGCTCGAATGGCTAGCGGAGGTGGTGAAACTGCCCTCGCGCTATTGCTGCTAGACAGATTGAACCAGCTTGAGAGCAAAGTTTCTGGTAAAGGCCAACAACAACAAGGCCAAACTGTCACTAAGAAATCTGCTGCTGAGGCATCTAAAAAGCCTCGCCAAAAACGTACTGCCACAAAACAGTACAACGTCACTCAAGCATTTGGGAGACGTGGTCCAGAACAAACCCAAGGAAATTTCGGGGACCAAGACCTAATCAGACAAGGAACTGATTACAAACATTGGCCGCAAATTGCACAATTTGCTCCAAGTGCCTCTGCATTCTTTGGAATGTCACGCATTGGCATGGAAGTCACACCTTCGGGAACATGGCTGACTTATCATGGAGCCATTAAATTGGATGACAAAGATCCACAATTCAAAGACAACGTCATACTGCTGAACAAGCACATTGACGCATACAAAACATTCCCACCAACAGAGCCTAAAAAGGACAAAAAGAAAAAGACTGATGAAGCTCAGCCTTTGCCGCAGAGACAAAAGAAGCAGCCCACTGTGACTCTTCTTCCTGCGGCTGACATGGATGATTTCTCCAGACAACTTCAAAATTCCATGAGTGGAGCTTCTGCTGATTCAACTCAGGCA [서열번호 236]
따라서, 바람직하게는 상기 SARS CoV N 폴리펩티드는 실질적으로 서열번호 236에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 SARS CoV N 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 237로 제공된다:
ATGAGCGACAATGGCCCTCAGAGCAACCAGAGAAGCGCCCCTAGAATCACCTTTGGCGGCCCTACCGACAGCACCGACAACAACCAGAACGGCGGCAGAAATGGCGCCAGACCTAAGCAGAGAAGGCCTCAGGGCCTGCCTAACAATACCGCCAGCTGGTTCACAGCCCTGACACAGCACGGCAAAGAGGAACTGAGATTCCCCAGAGGACAGGGCGTGCCCATCAACACAAATAGCGGCCCTGACGACCAGATCGGCTACTACAGACGGGCCACCAGAAGAGTTAGAGGCGGCGACGGCAAGATGAAGGAACTGTCCCCTCGGTGGTACTTCTACTACCTCGGCACAGGACCCGAAGCCAGCCTTCCTTATGGCGCCAACAAAGAGGGCATCGTCTGGGTTGCAACAGAAGGCGCCCTGAACACCCCTAAGGACCACATCGGCACCAGAAATCCCAACAACAACGCCGCCACAGTGCTGCAGTTGCCACAGGGAACAACACTGCCCAAGGGCTTCTACGCCGAGGGATCTAGAGGCGGATCTCAGGCCAGCAGCAGAAGCAGCTCTAGAAGCAGAGGCAACAGCCGGAATAGCACCCCTGGCAGCTCCAGAGGCAATTCCCCTGCCAGAATGGCTTCTGGCGGCGGAGAAACAGCTCTGGCACTGCTGCTGCTCGACCGGCTGAATCAGCTGGAATCTAAGGTGTCCGGCAAGGGCCAGCAACAGCAGGGACAGACCGTGACCAAGAAGTCTGCCGCTGAGGCCAGCAAGAAGCCCAGACAGAAGAGAACCGCCACCAAGCAGTACAACGTGACCCAGGCCTTTGGCAGAAGAGGCCCAGAACAGACCCAGGGCAATTTCGGCGACCAGGACCTGATCAGACAGGGCACCGATTACAAGCACTGGCCCCAGATCGCCCAGTTTGCCCCTTCTGCCTCTGCCTTTTTCGGCATGAGCCGGATCGGCATGGAAGTGACACCTAGCGGCACCTGGCTGACATATCACGGCGCCATCAAGCTGGACGACAAGGACCCTCAGTTCAAGGACAACGTGATCCTGCTGAACAAGCACATCGACGCCTACAAGACATTCCCTCCAACCGAGCCTAAGAAGGACAAGAAGAAGAAAACCGACGAGGCCCAGCCTCTGCCACAGAGACAGAAAAAGCAGCCCACCGTGACACTGCTGCCTGCCGCCGATATGGACGACTTCTCTAGACAGCTGCAGAACAGCATGAGCGGCGCCAGCGCTGATTCTACACAAGCT [서열번호 237]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 237에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 237의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 238로 제공된다:
AUGAGCGACAAUGGCCCUCAGAGCAACCAGAGAAGCGCCCCUAGAAUCACCUUUGGCGGCCCUACCGACAGCACCGACAACAACCAGAACGGCGGCAGAAAUGGCGCCAGACCUAAGCAGAGAAGGCCUCAGGGCCUGCCUAACAAUACCGCCAGCUGGUUCACAGCCCUGACACAGCACGGCAAAGAGGAACUGAGAUUCCCCAGAGGACAGGGCGUGCCCAUCAACACAAAUAGCGGCCCUGACGACCAGAUCGGCUACUACAGACGGGCCACCAGAAGAGUUAGAGGCGGCGACGGCAAGAUGAAGGAACUGUCCCCUCGGUGGUACUUCUACUACCUCGGCACAGGACCCGAAGCCAGCCUUCCUUAUGGCGCCAACAAAGAGGGCAUCGUCUGGGUUGCAACAGAAGGCGCCCUGAACACCCCUAAGGACCACAUCGGCACCAGAAAUCCCAACAACAACGCCGCCACAGUGCUGCAGUUGCCACAGGGAACAACACUGCCCAAGGGCUUCUACGCCGAGGGAUCUAGAGGCGGAUCUCAGGCCAGCAGCAGAAGCAGCUCUAGAAGCAGAGGCAACAGCCGGAAUAGCACCCCUGGCAGCUCCAGAGGCAAUUCCCCUGCCAGAAUGGCUUCUGGCGGCGGAGAAACAGCUCUGGCACUGCUGCUGCUCGACCGGCUGAAUCAGCUGGAAUCUAAGGUGUCCGGCAAGGGCCAGCAACAGCAGGGACAGACCGUGACCAAGAAGUCUGCCGCUGAGGCCAGCAAGAAGCCCAGACAGAAGAGAACCGCCACCAAGCAGUACAACGUGACCCAGGCCUUUGGCAGAAGAGGCCCAGAACAGACCCAGGGCAAUUUCGGCGACCAGGACCUGAUCAGACAGGGCACCGAUUACAAGCACUGGCCCCAGAUCGCCCAGUUUGCCCCUUCUGCCUCUGCCUUUUUCGGCAUGAGCCGGAUCGGCAUGGAAGUGACACCUAGCGGCACCUGGCUGACAUAUCACGGCGCCAUCAAGCUGGACGACAAGGACCCUCAGUUCAAGGACAACGUGAUCCUGCUGAACAAGCACAUCGACGCCUACAAGACAUUCCCUCCAACCGAGCCUAAGAAGGACAAGAAGAAGAAAACCGACGAGGCCCAGCCUCUGCCACAGAGACAGAAAAAGCAGCCCACCGUGACACUGCUGCCUGCCGCCGAUAUGGACGACUUCUCUAGACAGCUGCAGAACAGCAUGAGCGGCGCCAGCGCUGAUUCUACACAAGCU [서열번호 238]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 238에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 MHV N 단백질(P03416; 핵단백질 뮤린 코로나바이러스(A59 바이러스주)), 또는 그의 동원체이다. MHV N 단백질의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 239로 나타낸다:
MSFVPGQENAGGRSSSVNRAGNGILKKTTWADQTERGPNNQNRGRRNQPKQTATTQPNSGSVVPHYSWFSGITQFQKGKEFQFAEGQGVPIANGIPASEQKGYWYRHNRRSFKTPDGQQKQLLPRWYFYYLGTGPHAGASYGDSIEGVFWVANSQADTNTRSDIVERDPSSHEAIPTRFAPGTVLPQGFYVEGSGRSAPASRSGSRSQSRGPNNRARSSSNQRQPASTVKPDMAEEIAALVLAKLGKDAGQPKQVTKQSAKEVRQKILNKPRQKRTPNKQCPVQQCFGKRGPNQNFGGSEMLKLGTSDPQFPILAELAPTVGAFFFGSKLELVKKNSGGADEPTKDVYELQYSGAVRFDSTLPGFETIMKVLNENLNAYQKDGGADVVSPKPQRKGRRQAQEKKDEVDNVSVAKPKSSVQRNVSRELTPEDRSLLAQILDDGVVPDGLEDDSNV [서열번호 239]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 239에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 MHV N 폴리펩티드는 다음과 같은 서열번호 240의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGTCTTTTGTTCCTGGGCAAGAAAATGCCGGTGGCAGAAGCTCCTCTGTAAACCGCGCTGGTAATGGAATCCTCAAGAAGACCACTTGGGCTGACCAAACCGAGCGTGGACCAAATAATCAAAATAGAGGCAGAAGGAATCAGCCAAAGCAGACTGCAACTACTCAACCCAACTCCGGGAGTGTGGTTCCCCATTACTCCTGGTTTTCTGGCATTACCCAGTTCCAAAAGGGAAAGGAGTTTCAGTTTGCAGAAGGACAAGGAGTGCCTATTGCCAATGGAATCCCCGCTTCAGAGCAAAAGGGATATTGGTATAGACACAACCGCCGTTCTTTTAAAACACCTGATGGGCAGCAGAAGCAATTACTGCCCAGATGGTATTTTTACTATCTTGGCACAGGGCCCCATGCTGGAGCCAGTTATGGAGACAGCATTGAAGGTGTCTTCTGGGTTGCAAACAGCCAAGCGGACACCAATACCCGCTCTGATATTGTCGAAAGGGACCCAAGCAGTCATGAGGCTATTCCTACTAGGTTTGCGCCCGGCACGGTATTGCCTCAGGGCTTTTATGTTGAAGGCTCTGGAAGGTCTGCACCTGCTAGCCGATCTGGTTCGCGGTCACAATCCCGTGGGCCAAATAATCGCGCTAGAAGCAGTTCCAACCAGCGCCAGCCTGCCTCTACTGTAAAACCTGATATGGCCGAAGAAATTGCTGCTCTTGTTTTGGCTAAGCTCGGTAAAGATGCCGGCCAGCCCAAGCAAGTAACGAAGCAAAGTGCCAAAGAAGTCAGGCAGAAAATTTTAAACAAGCCTCGCCAAAAGAGGACTCCAAACAAGCAGTGCCCAGTGCAGCAGTGTTTTGGAAAGAGAGGCCCCAATCAGAATTTTGGAGGCTCTGAAATGTTAAAACTTGGAACTAGTGATCCACAGTTCCCCATTCTTGCAGAGTTGGCTCCAACAGTTGGTGCCTTCTTCTTTGGATCTAAATTAGAATTGGTCAAAAAGAATTCTGGTGGTGCTGATGAACCCACCAAAGATGTGTATGAGCTGCAATATTCAGGTGCAGTTAGATTTGATAGTACTCTACCTGGTTTTGAGACTATCATGAAAGTGTTGAATGAGAATTTGAATGCCTACCAGAAGGATGGTGGTGCAGATGTGGTGAGCCCAAAGCCCCAAAGAAAAGGGCGTAGACAGGCTCAGGAAAAGAAAGATGAAGTAGATAATGTAAGCGTTGCAAAGCCCAAAAGCTCTGTGCAGCGAAATGTAAGTAGAGAATTAACCCCAGAGGATAGAAGTCTGTTGGCTCAGATCCTTGATGATGGCGTAGTGCCAGATGGGTTAGAAGATGACTCTAATGTG [서열번호 240]
따라서, 바람직하게는 상기 MHV N 폴리펩티드 실질적으로 서열번호 240에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 MHV N 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 241로 제공된다:
ATGAGCTTCGTGCCCGGCCAAGAAAATGCCGGCGGAAGATCTAGCAGCGTGAACAGAGCCGGCAACGGCATCCTGAAGAAAACCACCTGGGCCGACCAGACCGAGAGAGGCCCCAACAACCAGAACCGGGGCAGAAGAAACCAGCCTAAGCAGACCGCCACCACACAGCCTAATAGCGGCTCTGTGGTGCCCCACTACAGCTGGTTTAGCGGCATCACCCAGTTCCAGAAGGGCAAAGAGTTCCAGTTCGCCGAAGGACAGGGCGTGCCAATCGCCAATGGAATCCCTGCCTCTGAGCAGAAAGGCTACTGGTACAGACACAACCGGCGGAGCTTCAAGACCCCTGATGGACAGCAGAAACAGCTGCTGCCCAGATGGTACTTCTACTACCTCGGCACAGGACCTCACGCAGGCGCCTCTTATGGCGATTCTATCGAGGGCGTGTTCTGGGTCGCCAACAGCCAGGCCGATACCAACACCAGATCCGACATCGTGGAACGGGACCCTAGCAGCCACGAGGCCATTCCTACAAGATTTGCCCCTGGCACCGTGCTGCCTCAGGGCTTTTATGTGGAAGGCAGCGGAAGAAGCGCCCCTGCCAGTAGATCTGGCAGCAGATCTCAGAGCAGGGGCCCTAACAACAGAGCCAGAAGCAGCAGCAACCAGAGACAGCCTGCCAGCACCGTGAAGCCCGATATGGCCGAAGAAATCGCCGCTCTGGTGCTGGCCAAGCTGGGAAAAGATGCCGGCCAGCCAAAGCAAGTGACCAAGCAGAGCGCCAAAGAAGTGCGGCAGAAGATCCTGAACAAGCCCCGGCAGAAGCGGACCCCTAACAAGCAGTGTCCTGTGCAGCAGTGCTTCGGCAAGAGGGGCCCCAATCAGAATTTTGGCGGCAGCGAGATGCTGAAGCTGGGCACAAGCGATCCTCAGTTCCCTATCCTGGCCGAGCTGGCTCCTACAGTGGGCGCATTTTTCTTTGGCTCCAAACTCGAGCTGGTCAAGAAGAACAGCGGCGGAGCCGATGAGCCCACCAAGGATGTGTACGAGCTGCAGTACTCTGGCGCCGTCAGATTCGATAGCACCCTGCCTGGCTTCGAGACAATCATGAAGGTGCTGAACGAGAACCTGAACGCCTACCAGAAGGATGGCGGCGCTGACGTGGTGTCTCCTAAGCCTCAGAGAAAAGGCAGACGGCAGGCCCAAGAGAAGAAAGACGAGGTGGACAACGTGTCCGTGGCCAAGCCTAAGAGCAGCGTGCAGAGAAACGTGTCCAGAGAGCTGACCCCAGAGGACAGATCTCTGCTGGCTCAGATCCTGGACGATGGCGTGGTGCCAGATGGCCTGGAAGATGACAGCAACGTG [서열번호 241]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 241에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 241의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 242로 제공된다:
AUGAGCUUCGUGCCCGGCCAAGAAAAUGCCGGCGGAAGAUCUAGCAGCGUGAACAGAGCCGGCAACGGCAUCCUGAAGAAAACCACCUGGGCCGACCAGACCGAGAGAGGCCCCAACAACCAGAACCGGGGCAGAAGAAACCAGCCUAAGCAGACCGCCACCACACAGCCUAAUAGCGGCUCUGUGGUGCCCCACUACAGCUGGUUUAGCGGCAUCACCCAGUUCCAGAAGGGCAAAGAGUUCCAGUUCGCCGAAGGACAGGGCGUGCCAAUCGCCAAUGGAAUCCCUGCCUCUGAGCAGAAAGGCUACUGGUACAGACACAACCGGCGGAGCUUCAAGACCCCUGAUGGACAGCAGAAACAGCUGCUGCCCAGAUGGUACUUCUACUACCUCGGCACAGGACCUCACGCAGGCGCCUCUUAUGGCGAUUCUAUCGAGGGCGUGUUCUGGGUCGCCAACAGCCAGGCCGAUACCAACACCAGAUCCGACAUCGUGGAACGGGACCCUAGCAGCCACGAGGCCAUUCCUACAAGAUUUGCCCCUGGCACCGUGCUGCCUCAGGGCUUUUAUGUGGAAGGCAGCGGAAGAAGCGCCCCUGCCAGUAGAUCUGGCAGCAGAUCUCAGAGCAGGGGCCCUAACAACAGAGCCAGAAGCAGCAGCAACCAGAGACAGCCUGCCAGCACCGUGAAGCCCGAUAUGGCCGAAGAAAUCGCCGCUCUGGUGCUGGCCAAGCUGGGAAAAGAUGCCGGCCAGCCAAAGCAAGUGACCAAGCAGAGCGCCAAAGAAGUGCGGCAGAAGAUCCUGAACAAGCCCCGGCAGAAGCGGACCCCUAACAAGCAGUGUCCUGUGCAGCAGUGCUUCGGCAAGAGGGGCCCCAAUCAGAAUUUUGGCGGCAGCGAGAUGCUGAAGCUGGGCACAAGCGAUCCUCAGUUCCCUAUCCUGGCCGAGCUGGCUCCUACAGUGGGCGCAUUUUUCUUUGGCUCCAAACUCGAGCUGGUCAAGAAGAACAGCGGCGGAGCCGAUGAGCCCACCAAGGAUGUGUACGAGCUGCAGUACUCUGGCGCCGUCAGAUUCGAUAGCACCCUGCCUGGCUUCGAGACAAUCAUGAAGGUGCUGAACGAGAACCUGAACGCCUACCAGAAGGAUGGCGGCGCUGACGUGGUGUCUCCUAAGCCUCAGAGAAAAGGCAGACGGCAGGCCCAAGAGAAGAAAGACGAGGUGGACAACGUGUCCGUGGCCAAGCCUAAGAGCAGCGUGCAGAGAAACGUGUCCAGAGAGCUGACCCCAGAGGACAGAUCUCUGCUGGCUCAGAUCCUGGACGAUGGCGUGGUGCCAGAUGGCCUGGAAGAUGACAGCAACGUG [서열번호 242]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 242에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 FMDV 2B 단백질(P03307; 프로테아제 3C 게놈 폴리단백질 구제역 바이러스(단리물-/독일/A5 베스터발트/1951 혈청형 A), 또는 그의 동원체이다. FMDV 2B 단백질의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 243으로 제공된다:
PFFFSDVRSNFSKLVETINQMQEDMSTKHGPDFNRLVSAFEELAAGVKAIRTGLDEAKPWYKLIKLLSRLSCMAAVAARSKDPVLVAIMLADTGLEILDSTFVVKKISDSLSSLFHVPAPVFSFGAPILLAGLVKVASSFFRSTPEDLERAEKQ [서열번호 243]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 243에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 FMDV 2B 폴리펩티드는 다음과 같은 서열번호 244의 DNA 뉴클레오티드 서열에 의해 암호화된다:
CCCTTCTTCTTCTCTGACGTTAGGTCAAACTTTTCTAAGCTGGTGGAAACCATCAACCAGATGCAGGAAGACATGTCAACAAAACACGGGCCCGACTTTAACCGGTTGGTGTCCGCCTTTGAGGAACTGGCCGCTGGAGTAAAAGCCATCAGGACCGGCCTCGACGAGGCCAAACCCTGGTACAAGCTTATCAAACTCCTAAGCCGCCTGTCGTGCATGGCCGCTGTGGCAGCACGGTCCAAGGACCCAGTCCTTGTGGCCATCATGCTGGCCGACACCGGTCTCGAGATTCTGGACAGCACTTTCGTCGTGAAGAAGATCTCCGACTCGCTCTCCAGTCTCTTCCACGTGCCGGCCCCCGTCTTCAGTTTCGGAGCCCCGATTCTGCTAGCCGGGCTGGTCAAGGTCGCCTCGAGTTTCTTCCGGTCCACGCCCGAAGACCTTGAGAGAGCAGAGAAACAG [서열번호 244]
따라서, 바람직하게는 상기 FMDV 2B 폴리펩티드는 실질적으로 서열번호 244에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 FMDV 2B 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 245로 제공된다:
CCGTTCTTCTTTAGCGACGTGCGGAGCAACTTCAGCAAGCTGGTGGAAACCATCAACCAGATGCAAGAGGACATGAGCACCAAGCACGGCCCCGACTTCAACAGACTGGTGTCCGCCTTTGAGGAACTGGCCGCTGGCGTGAAGGCCATCAGAACAGGACTGGATGAGGCCAAGCCTTGGTACAAGCTGATCAAGCTGCTGAGCCGGCTGAGCTGTATGGCTGCTGTGGCCGCCAGATCCAAGGATCCTGTGCTGGTGGCCATCATGCTGGCCGATACAGGCCTGGAAATCCTGGACAGCACCTTCGTGGTCAAGAAGATCAGCGACAGCCTGAGCAGCCTGTTCCACGTGCCAGCTCCAGTGTTCTCTTTTGGCGCCCCTATTCTGCTGGCCGGCCTGGTCAAAGTGGCCAGCAGCTTCTTTAGAAGCACCCCTGAGGACCTGGAACGGGCCGAAAAACAA [서열번호 245]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 245에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 245의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 246으로 제공된다:
CCGUUCUUCUUUAGCGACGUGCGGAGCAACUUCAGCAAGCUGGUGGAAACCAUCAACCAGAUGCAAGAGGACAUGAGCACCAAGCACGGCCCCGACUUCAACAGACUGGUGUCCGCCUUUGAGGAACUGGCCGCUGGCGUGAAGGCCAUCAGAACAGGACUGGAUGAGGCCAAGCCUUGGUACAAGCUGAUCAAGCUGCUGAGCCGGCUGAGCUGUAUGGCUGCUGUGGCCGCCAGAUCCAAGGAUCCUGUGCUGGUGGCCAUCAUGCUGGCCGAUACAGGCCUGGAAAUCCUGGACAGCACCUUCGUGGUCAAGAAGAUCAGCGACAGCCUGAGCAGCCUGUUCCACGUGCCAGCUCCAGUGUUCUCUUUUGGCGCCCCUAUUCUGCUGGCCGGCCUGGUCAAAGUGGCCAGCAGCUUCUUUAGAAGCACCCCUGAGGACCUGGAACGGGCCGAAAAACAA [서열번호 246]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 246에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 인플루엔자 바이러스 A PB1-F2(B4URE5; 단백질 PB1-F2 인플루엔자 A 바이러스(바이러스주 A/러시아:상트 페테르부르크/8/2006 H1N1 바이러스주), 또는 그의 동원체이다. 인플루엔자 바이러스 A PB1-F2의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 247로 나타낸다:
MGQEQDTPWILSTGHISTQKREDGQQTPKLEHRNSTRLMGHFQKTMNQVVMPKQIVYWRRWLSLRNPILVFLKTRVLKRWRLFSKHE [서열번호 247]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 247에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 인플루엔자 바이러스 A PB1-F2 폴리펩티드는 다음과 같은 서열번호 248의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGGACAGGAACAGGATACACCATGGATACTGTCAACAGGACACATCAGTACTCAGAAAAGGGAAGATGGACAACAAACACCGAAACTGGAGCACCGCAACTCAACCCGATTGATGGGCCACTTCCAGAAGACAATGAACCAAGTGGTTATGCCCAAACAGATTGTGTATTGGAGGCGATGGCTTTCCTTGAGGAATCCCATCCTGGTATTTTTGAAAACTCGTGTATTGAAACGATGGAGGTTGTTCAGCAAACACGAG [서열번호 248]
따라서, 바람직하게는 상기 인플루엔자 바이러스 A PB1-F2 폴리펩티드는 실질적으로 서열번호 248에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 인플루엔자 바이러스 A PB1-F2 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 249로 제공된다:
ATGGGCCAAGAGCAGGACACACCTTGGATCCTGAGCACCGGCCACATCAGCACCCAGAAGAGAGAGGACGGACAGCAGACCCCTAAGCTGGAACACCGGAACAGCACCAGACTGATGGGCCACTTCCAGAAAACCATGAACCAGGTGGTCATGCCCAAGCAGATCGTGTACTGGCGGAGATGGCTGAGCCTGCGGAATCCTATCCTGGTGTTCCTGAAAACCCGGGTGCTGAAGAGATGGCGGCTGTTCTCTAAGCACGAG [서열번호 249]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 249에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 249의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 250으로 제공된다:
AUGGGCCAAGAGCAGGACACACCUUGGAUCCUGAGCACCGGCCACAUCAGCACCCAGAAGAGAGAGGACGGACAGCAGACCCCUAAGCUGGAACACCGGAACAGCACCAGACUGAUGGGCCACUUCCAGAAAACCAUGAACCAGGUGGUCAUGCCCAAGCAGAUCGUGUACUGGCGGAGAUGGCUGAGCCUGCGGAAUCCUAUCCUGGUGUUCCUGAAAACCCGGGUGCUGAAGAGAUGGCGGCUGUUCUCUAAGCACGAG [서열번호 250]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 250에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 A형 간염 단백질 3ABC(Q05794; 게놈 폴리단백질 인간 A형 간염 바이러스 유전자형 IA(HAS-15 단리물)), 또는 그의 동원체이다. A형 간염 단백질 3ABC의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 251로 나타낸다:
GISDDDSAVAEFFQSFPSGEPSNSKLSSFFQSVTNHKWVAVGAAVGILGLLVGGWFVYKHFSRKEEEPIPAEGVYHGVTKPKQVIKLDADPVESQSTLEIAGLVRKNLVQFGVGEKNGCVRWVMNALGVKDDWLLVPSHAYKFEKDYEMMEFYFNRGGTYYSISAGNVVIQSLDVGFQDVVLMKVPTIPKFRDITQHFIKKGDVPRALNRLATLVTTVNGTPMLISEGPLKMEEKATYVHKKNDGTTVDLTVDQAWRGKGEGLPGMCGGALVSSNQSIQNAILGIHVAGGNSILVAKLITQEMFQNIDKKIESQ [서열번호 251]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 251에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 A형 간염 단백질 3ABC 폴리펩티드는 다음과 같은 서열번호 252의 DNA 뉴클레오티드 서열에 의해 암호화된다:
GGAATTTCAGATGATGACAGTGCAGTAGCTGAGTTTTTCCAGTCTTTTCCATCTGGTGAACCATCAAATTCCAAGTTATCTAGTTTTTTCCAATCTGTCACTAATCACAAGTGGGTTGCTGTGGGAGCTGCAGTTGGTATTCTTGGATTGCTAGTGGGAGGATGGTTTGTGTATAAGCATTTTTCCCGCAAAGAGGAAGAACCAATTCCAGCTGAAGGGGTTTATCATGGAGTGACTAAGCCCAAACAAGTGATTAAATTGGATGCAGATCCAGTAGAGTCCCAGTCAACTCTAGAAATAGCAGGATTAGTTAGGAAAAATTTGGTTCAGTTTGGAGTTGGTGAGAAAAATGGATGTGTGAGATGGGTCATGAATGCCTTAGGAGTGAAGGATGATTGGTTGTTAGTACCTTCTCATGCTTATAAATTTGAAAAGGATTATGAAATGATGGAGTTTTATTTCAATAGAGGTGGAACTTACTATTCAATTTCAGCTGGTAATGTTGTTATTCAATCTTTAGATGTGGGATTCCAAGATGTTGTTCTAATGAAGGTTCCTACAATTCCCAAGTTTAGAGATATTACTCAACATTTTATTAAGAAAGGAGATGTGCCTAGAGCCTTGAATCGCTTGGCAACATTAGTGACAACCGTTAATGGAACTCCTATGTTAATTTCTGAGGGACCTTTAAAAATGGAAGAAAAAGCCACTTATGTTCATAAGAAGAACGATGGTACTACGGTTGATTTGACTGTAGATCAGGCATGGAGAGGAAAAGGTGAAGGTCTTCCTGGAATGTGTGGTGGGGCCCTAGTGTCATCAAATCAGTCCATACAAAATGCAATTTTGGGTATTCATGTTGCTGGAGGAAATTCAATTCTTGTGGCAAAGTTGATTACTCAAGAAATGTTTCAAAACATTGATAAGAAAATTGAAAGTCAG [서열번호 252]
따라서, 바람직하게는 상기 A형 간염 단백질 3ABC 폴리펩티드는 실질적으로 서열번호 252에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 A형 간염 단백질 3ABC 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 253으로 제공된다:
GGCATCAGCGACGATGATTCTGCCGTGGCCGAGTTCTTCCAGAGCTTTCCTAGCGGCGAGCCCAGCAACAGCAAGCTGAGCAGCTTCTTCCAGTCCGTGACCAACCACAAATGGGTCGCCGTGGGAGCCGCTGTGGGAATTCTGGGACTTCTCGTTGGCGGATGGTTCGTGTACAAGCACTTCAGCCGGAAAGAGGAAGAACCCATTCCTGCCGAGGGCGTGTACCACGGCGTGACCAAACCTAAGCAAGTGATCAAGCTGGACGCCGATCCTGTGGAAAGCCAGAGCACACTGGAAATCGCCGGACTCGTGCGGAAGAACCTGGTGCAGTTTGGCGTGGGCGAGAAGAACGGCTGTGTCAGATGGGTCATGAACGCCCTGGGCGTGAAGGACGATTGGCTGCTGGTTCCTAGCCACGCCTACAAGTTCGAGAAGGACTACGAGATGATGGAATTCTACTTCAACAGAGGCGGCACCTACTACAGCATCAGCGCCGGCAATGTGGTCATCCAGTCTCTGGATGTGGGCTTCCAGGACGTGGTGCTGATGAAGGTGCCAACAATCCCCAAGTTCCGGGACATCACCCAGCACTTCATCAAGAAAGGCGACGTGCCCAGGGCTCTGAACAGACTGGCTACCCTGGTCACCACCGTGAACGGCACACCCATGCTGATCTCTGAGGGCCCACTGAAGATGGAAGAGAAGGCCACCTACGTGCACAAGAAGAACGACGGCACCACAGTGGACCTGACCGTGGATCAAGCTTGGAGAGGCAAAGGCGAGGGCCTGCCTGGAATGTGTGGCGGAGCACTGGTGTCCAGCAACCAGAGCATCCAGAATGCCATCCTGGGCATCCATGTGGCTGGCGGCAATTCTATCCTGGTGGCCAAGCTGATCACCCAAGAGATGTTCCAGAACATCGACAAGAAGATCGAGAGCCAG [서열번호 253]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 253에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 253의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 254로 제공된다:
GGCAUCAGCGACGAUGAUUCUGCCGUGGCCGAGUUCUUCCAGAGCUUUCCUAGCGGCGAGCCCAGCAACAGCAAGCUGAGCAGCUUCUUCCAGUCCGUGACCAACCACAAAUGGGUCGCCGUGGGAGCCGCUGUGGGAAUUCUGGGACUUCUCGUUGGCGGAUGGUUCGUGUACAAGCACUUCAGCCGGAAAGAGGAAGAACCCAUUCCUGCCGAGGGCGUGUACCACGGCGUGACCAAACCUAAGCAAGUGAUCAAGCUGGACGCCGAUCCUGUGGAAAGCCAGAGCACACUGGAAAUCGCCGGACUCGUGCGGAAGAACCUGGUGCAGUUUGGCGUGGGCGAGAAGAACGGCUGUGUCAGAUGGGUCAUGAACGCCCUGGGCGUGAAGGACGAUUGGCUGCUGGUUCCUAGCCACGCCUACAAGUUCGAGAAGGACUACGAGAUGAUGGAAUUCUACUUCAACAGAGGCGGCACCUACUACAGCAUCAGCGCCGGCAAUGUGGUCAUCCAGUCUCUGGAUGUGGGCUUCCAGGACGUGGUGCUGAUGAAGGUGCCAACAAUCCCCAAGUUCCGGGACAUCACCCAGCACUUCAUCAAGAAAGGCGACGUGCCCAGGGCUCUGAACAGACUGGCUACCCUGGUCACCACCGUGAACGGCACACCCAUGCUGAUCUCUGAGGGCCCACUGAAGAUGGAAGAGAAGGCCACCUACGUGCACAAGAAGAACGACGGCACCACAGUGGACCUGACCGUGGAUCAAGCUUGGAGAGGCAAAGGCGAGGGCCUGCCUGGAAUGUGUGGCGGAGCACUGGUGUCCAGCAACCAGAGCAUCCAGAAUGCCAUCCUGGGCAUCCAUGUGGCUGGCGGCAAUUCUAUCCUGGUGGCCAAGCUGAUCACCCAAGAGAUGUUCCAGAACAUCGACAAGAAGAUCGAGAGCCAG [서열번호 254]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 254에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 B형 간염 X 단백질(P03165; 단백질 X B형 간염 바이러스 유전자형 D), 또는 그의 동원체이다. B형 간염 X 단백질의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 255로 나타낸다:
MAARLCCQLDPARDVLCLRPVGAESRGRPFSGSLGTLSSPSPSAVSTDHGAHLSLRGLPVCAFSSAGPCALRFTSARRMETTVKAQPFLPKVLHKRTLGLSVMSTTDLEAYFKDCLFKDWEELGEEIRLKVFVLGGCRHKLVCAPAPCNFFTSA [서열번호 255]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 255에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 B형 간염 X 폴리펩티드는 다음과 같은 서열번호 256의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGCTGCTAGGCTGTGCTGCCAACTGGATCCTGCGCGGGACGTCCTTTGTTTACGTCCCGTCGGCGCTGAATCCCGCGGACGACCCTTCTCGGGGTCGCTTGGGACTCTCTCGTCCCCTTCTCCGTCTGCCGTTTCGACCGACCACGGGGCGCACCTCTCTTTACGCGGACTCCCCGTCTGTGCCTTCTCATCTGCCGGACCGTGTGCACTTCGCTTCACCTCTGCACGTCGCATGGAGACCACCGTGAAAGCCCAACCATTCTTGCCCAAGGTCTTACATAAGAGGACTCTTGGACTCTCTGTAATGTCAACGACCGACCTTGAGGCATACTTCAAAGACTGTTTGTTTAAAGACTGGGAGGAGTTGGGGGAGGAGATTAGATTAAAGGTCTTTGTATTAGGAGGCTGTAGGCATAAATTGGTCTGCGCACCAGCACCATGCAACTTTTTCACCTCTGCC [서열번호 256]
따라서, 바람직하게는 상기 B형 간염 X 폴리펩티드는 실질적으로 서열번호 256에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 B형 간염 X 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 257로 제공된다:
ATGGCCGCCAGACTGTGCTGTCAACTGGACCCTGCTAGGGACGTGCTGTGTCTCAGACCTGTGGGAGCCGAGTCTAGAGGCAGACCTTTTTCTGGCTCTCTGGGCACCCTGAGCAGCCCATCTCCATCTGCCGTGTCTACAGATCACGGCGCCCACCTGTCTCTGAGAGGACTGCCTGTGTGTGCCTTTAGCAGCGCCGGACCTTGCGCTCTGAGATTCACATCTGCCAGACGGATGGAAACCACCGTGAAGGCCCAGCCTTTCCTGCCTAAGGTGCTGCACAAGAGAACCCTGGGCCTGAGCGTGATGAGCACCACAGATCTGGAAGCCTACTTCAAGGATTGCCTGTTCAAGGACTGGGAAGAACTGGGCGAAGAGATCCGGCTGAAGGTGTTCGTGCTCGGCGGATGCAGACACAAGCTCGTGTGTGCTCCCGCTCCTTGCAACTTCTTTACCAGCGCT [서열번호 257]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 257에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 257의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 258로 제공된다:
AUGGCCGCCAGACUGUGCUGUCAACUGGACCCUGCUAGGGACGUGCUGUGUCUCAGACCUGUGGGAGCCGAGUCUAGAGGCAGACCUUUUUCUGGCUCUCUGGGCACCCUGAGCAGCCCAUCUCCAUCUGCCGUGUCUACAGAUCACGGCGCCCACCUGUCUCUGAGAGGACUGCCUGUGUGUGCCUUUAGCAGCGCCGGACCUUGCGCUCUGAGAUUCACAUCUGCCAGACGGAUGGAAACCACCGUGAAGGCCCAGCCUUUCCUGCCUAAGGUGCUGCACAAGAGAACCCUGGGCCUGAGCGUGAUGAGCACCACAGAUCUGGAAGCCUACUUCAAGGAUUGCCUGUUCAAGGACUGGGAAGAACUGGGCGAAGAGAUCCGGCUGAAGGUGUUCGUGCUCGGCGGAUGCAGACACAAGCUCGUGUGUGCUCCCGCUCCUUGCAACUUCUUUACCAGCGCU [서열번호 258]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 258에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 SARS-CoV NSP15(P0C6X7; 레플리카아제(replicase) 폴리단백질 중증 급성 호흡기 증후군 코로나바이러스), 또는 그의 동원체이다. SARS-CoV NSP15의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 259로 나타낸다:
SLENVAYNVVNKGHFDGHAGEAPVSIINNAVYTKVDGIDVEIFENKTTLPVNVAFELWAKRNIKPVPEIKILNNLGVDIAANTVIWDYKREAPAHVSTIGVCTMTDIAKKPTESACSSLTVLFDGRVEGQVDLFRNARNGVLITEGSVKGLTPSKGPAQASVNGVTLIGESVKTQFNYFKKVDGIIQQLPETYFTQSRDLEDFKPRSQMETDFLELAMDEFIQRYKLEGYAFEHIVYGDFSHGQLGGLHLMIGLAKRSQDSPLKLEDFIPMDSTVKNYFITDAQTGSSKCVCSVIDLLLDDFVEIIKSQDLSVISKVVKVTIDYAEISFMLWCKDGHVETFYPKLQ [서열번호 259]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 259에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 SARS-CoV NSP15 폴리펩티드는 다음과 같은 서열번호 260의 DNA 뉴클레오티드 서열에 의해 암호화된다:
AGTTTAGAAAATGTGGCTTATAATGTTGTTAATAAAGGACACTTTGATGGACACGCCGGCGAAGCACCTGTTTCCATCATTAATAATGCTGTTTACACAAAGGTAGATGGTATTGATGTGGAGATCTTTGAAAATAAGACAACACTTCCTGTTAATGTTGCATTTGAGCTTTGGGCTAAGCGTAACATTAAACCAGTGCCAGAGATTAAGATACTCAATAATTTGGGTGTTGATATCGCTGCTAATACTGTAATCTGGGACTACAAAAGAGAAGCCCCAGCACATGTATCTACAATAGGTGTCTGCACAATGACTGACATTGCCAAGAAACCTACTGAGAGTGCTTGTTCTTCACTTACTGTCTTGTTTGATGGTAGAGTGGAAGGACAGGTAGACCTTTTTAGAAACGCCCGTAATGGTGTTTTAATAACAGAAGGTTCAGTCAAAGGTCTAACACCTTCAAAGGGACCAGCACAAGCTAGCGTCAATGGAGTCACATTAATTGGAGAATCAGTAAAAACACAGTTTAACTACTTTAAGAAAGTAGACGGCATTATTCAACAGTTGCCTGAAACCTACTTTACTCAGAGCAGAGACTTAGAGGATTTTAAGCCCAGATCACAAATGGAAACTGACTTTCTCGAGCTCGCTATGGATGAATTCATACAGCGATATAAGCTCGAGGGCTATGCCTTCGAACACATCGTTTATGGAGATTTCAGTCATGGACAACTTGGCGGTCTTCATTTAATGATAGGCTTAGCCAAGCGCTCACAAGATTCACCACTTAAATTAGAGGATTTTATCCCTATGGACAGCACAGTGAAAAATTACTTCATAACAGATGCGCAAACAGGTTCATCAAAATGTGTGTGTTCTGTGATTGATCTTTTACTTGATGACTTTGTCGAGATAATAAAGTCACAAGATTTGTCAGTGATTTCAAAAGTGGTCAAGGTTACAATTGACTATGCTGAAATTTCATTCATGCTTTGGTGTAAGGATGGACATGTTGAAACCTTCTACCCAAAACTACAA [서열번호 260]
따라서, 바람직하게는 상기 SARS-CoV NSP15 폴리펩티드는 실질적으로 서열번호 260에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 SARS-CoV NSP15 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 261로 제공된다:
AGCCTGGAAAACGTGGCCTACAACGTGGTCAACAAGGGCCACTTTGATGGCCACGCTGGCGAAGCCCCTGTGTCCATCATTAACAACGCCGTGTACACCAAGGTGGACGGCATCGACGTGGAAATCTTCGAGAACAAGACCACACTGCCCGTGAATGTGGCCTTCGAGCTGTGGGCCAAGCGGAACATTAAGCCCGTGCCTGAGATCAAGATCCTGAACAACCTGGGCGTCGACATTGCCGCCAACACCGTGATCTGGGACTACAAGAGAGAAGCCCCAGCTCACGTGTCCACCATCGGCGTGTGTACCATGACCGATATCGCCAAGAAGCCCACCGAGAGCGCCTGTAGCTCTCTGACCGTGCTGTTCGACGGCAGAGTGGAAGGCCAGGTGGACCTGTTCAGAAACGCCAGAAACGGCGTGCTGATCACCGAGGGCTCTGTGAAGGGACTGACCCCTTCTAAGGGACCTGCTCAGGCCTCTGTGAATGGCGTGACACTGATCGGCGAGAGCGTGAAAACCCAGTTCAACTACTTCAAGAAGGTCGACGGGATCATCCAGCAGCTGCCCGAGACATACTTCACCCAGAGCCGCGACCTGGAAGATTTCAAGCCTCGGAGCCAGATGGAAACCGACTTCCTGGAACTGGCCATGGACGAGTTCATCCAGCGGTACAAGCTGGAAGGCTACGCCTTTGAGCACATCGTGTACGGCGATTTCAGCCACGGACAGCTCGGAGGACTGCACCTGATGATTGGCCTGGCCAAGAGAAGCCAGGACAGCCCTCTGAAGCTCGAGGACTTCATCCCCATGGACAGCACCGTGAAGAATTACTTCATCACAGACGCCCAGACCGGCAGCTCTAAGTGCGTGTGTAGCGTGATCGACCTGCTGCTGGACGACTTTGTGGAAATCATCAAGAGCCAGGACCTGAGCGTGATCTCCAAGGTGGTCAAAGTGACCATCGACTACGCCGAGATCAGCTTCATGCTGTGGTGCAAGGACGGCCACGTGGAAACATTCTACCCCAAGCTGCAG [서열번호 261]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 261에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 261의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 262로 제공된다:
AGCCUGGAAAACGUGGCCUACAACGUGGUCAACAAGGGCCACUUUGAUGGCCACGCUGGCGAAGCCCCUGUGUCCAUCAUUAACAACGCCGUGUACACCAAGGUGGACGGCAUCGACGUGGAAAUCUUCGAGAACAAGACCACACUGCCCGUGAAUGUGGCCUUCGAGCUGUGGGCCAAGCGGAACAUUAAGCCCGUGCCUGAGAUCAAGAUCCUGAACAACCUGGGCGUCGACAUUGCCGCCAACACCGUGAUCUGGGACUACAAGAGAGAAGCCCCAGCUCACGUGUCCACCAUCGGCGUGUGUACCAUGACCGAUAUCGCCAAGAAGCCCACCGAGAGCGCCUGUAGCUCUCUGACCGUGCUGUUCGACGGCAGAGUGGAAGGCCAGGUGGACCUGUUCAGAAACGCCAGAAACGGCGUGCUGAUCACCGAGGGCUCUGUGAAGGGACUGACCCCUUCUAAGGGACCUGCUCAGGCCUCUGUGAAUGGCGUGACACUGAUCGGCGAGAGCGUGAAAACCCAGUUCAACUACUUCAAGAAGGUCGACGGGAUCAUCCAGCAGCUGCCCGAGACAUACUUCACCCAGAGCCGCGACCUGGAAGAUUUCAAGCCUCGGAGCCAGAUGGAAACCGACUUCCUGGAACUGGCCAUGGACGAGUUCAUCCAGCGGUACAAGCUGGAAGGCUACGCCUUUGAGCACAUCGUGUACGGCGAUUUCAGCCACGGACAGCUCGGAGGACUGCACCUGAUGAUUGGCCUGGCCAAGAGAAGCCAGGACAGCCCUCUGAAGCUCGAGGACUUCAUCCCCAUGGACAGCACCGUGAAGAAUUACUUCAUCACAGACGCCCAGACCGGCAGCUCUAAGUGCGUGUGUAGCGUGAUCGACCUGCUGCUGGACGACUUUGUGGAAAUCAUCAAGAGCCAGGACCUGAGCGUGAUCUCCAAGGUGGUCAAAGUGACCAUCGACUACGCCGAGAUCAGCUUCAUGCUGUGGUGCAAGGACGGCCACGUGGAAACAUUCUACCCCAAGCUGCAG [서열번호 262]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 262에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 SARS CoV Orf9b(P59636; SARS ORF9b 단백질 중증 급성 호흡기 증후군 코로나바이러스), 또는 그의 동원체이다. SARS CoV Orf9b의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 263으로 나타낸다:
MDPNQTNVVPPALHLVDPQIQLTITRMEDAMGQGQNSADPKVYPIILRLGSQLSLSMARRNLDSLEARAFQSTPIVVQMTKLATTEELPDEFVVVTAK [서열번호 263]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 263에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 SARS CoV Orf9b 폴리펩티드는 다음과 같은 서열번호 264의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGACCCCAATCAAACCAACGTAGTGCCCCCCGCATTACATTTGGTGGACCCACAGATTCAACTGACAATAACCAGAATGGAGGACGCAATGGGGCAAGGCCAAAACAGCGCCGACCCCAAGGTTTACCCAATAATACTGCGTCTTGGTTCACAGCTCTCACTCAGCATGGCAAGGAGGAACTTAGATTCCCTCGAGGCCAGGGCGTTCCAATCAACACCAATAGTGGTCCAGATGACCAAATTGGCTACTACCGAAGAGCTACCCGACGAGTTCGTGGTGGTGACGGCAAAA [서열번호 264]
따라서, 바람직하게는 상기 SARS CoV Orf9b 폴리펩티드는 실질적으로 서열번호 264에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 SARS CoV Orf9b 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 265로 제공된다:
ATGGACCCCAACCAGACCAATGTGGTGCCTCCTGCTCTGCACCTGGTGGACCCTCAGATCCAGCTGACCATCACCAGAATGGAAGATGCCATGGGCCAGGGCCAGAACAGCGCCGATCCTAAGGTGTACCCCATCATCCTGAGACTGGGCAGCCAGCTGAGCCTGAGCATGGCCAGAAGAAACCTGGACAGCCTGGAAGCCAGAGCCTTCCAGAGCACACCTATCGTGGTGCAGATGACCAAGCTGGCCACCACCGAGGAACTGCCCGATGAGTTTGTGGTGGTCACCGCCAAA [서열번호 265]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 265에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 265의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 266으로 제공된다:
AUGGACCCCAACCAGACCAAUGUGGUGCCUCCUGCUCUGCACCUGGUGGACCCUCAGAUCCAGCUGACCAUCACCAGAAUGGAAGAUGCCAUGGGCCAGGGCCAGAACAGCGCCGAUCCUAAGGUGUACCCCAUCAUCCUGAGACUGGGCAGCCAGCUGAGCCUGAGCAUGGCCAGAAGAAACCUGGACAGCCUGGAAGCCAGAGCCUUCCAGAGCACACCUAUCGUGGUGCAGAUGACCAAGCUGGCCACCACCGAGGAACUGCCCGAUGAGUUUGUGGUGGUCACCGCCAAA [서열번호 266]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 266에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 리노바이러스 2Apro(P23008; 게놈 폴리단백질 인간 리노바이러스 1A), 또는 그의 동원체이다. 리노바이러스 2Apro의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 267로 나타낸다:
GPSDLYVHVGNLIYRNLHLFNSEMHDSILISYSSDLIIYRTNTIGDDYIPNCNCTEATYYCRHKNRYYPIKVTPHDWYEIQESEYYPKHIQYNLLIGEGPCEPGDCGGKLLCRHGVIGIITAGGEGHVAFIDLRQFHCAEEQ [서열번호 267]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 267에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 리노바이러스 2Apro 폴리펩티드는 다음과 같은 서열번호 268의 DNA 뉴클레오티드 서열에 의해 암호화된다:
GGGCCCAGTGATCTATATGTGCATGTAGGTAACTTAATATATAGAAACTTACATCTGTTCAATTCTGAAATGCATGATTCAATTTTGATTTCATACTCTTCTGATTTAATCATATACCGCACAAACACTATAGGTGATGATTATATTCCCAATTGTAACTGCACTGAGGCTACTTATTATTGTAGACACAAAAATAGGTATTACCCAATAAAAGTTACTCCACATGATTGGTATGAAATACAAGAGAGTGAATATTACCCCAAACACATCCAATACAACCTATTAATTGGTGAAGGACCATGTGAACCTGGTGATTGTGGTGGAAAACTTCTTTGTAGACATGGTGTCATTGGCATAATCACAGCAGGTGGTGAAGGTCATGTAGCATTTATAGATCTTAGACAATTTCACTGTGCTGAGGAACAA [서열번호 268]
따라서, 바람직하게는 상기 리노바이러스 2Apro 폴리펩티드는 실질적으로 서열번호 268에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 리노바이러스 2Apro 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 269로 제공된다:
GGCCCTAGCGATCTGTATGTGCACGTGGGCAACCTGATCTACCGGAACCTGCACCTGTTCAACAGCGAGATGCACGACAGCATCCTGATCAGCTACAGCAGCGACCTGATCATCTATCGGACCAACACCATCGGCGACGACTACATCCCCAACTGCAACTGTACCGAGGCCACCTACTACTGCCGGCACAAGAACCGGTACTACCCCATCAAAGTGACCCCTCACGATTGGTACGAGATCCAAGAGAGCGAGTACTACCCTAAGCACATCCAGTACAACCTGCTGATCGGCGAGGGACCTTGCGAGCCTGGCGATTGTGGTGGAAAGCTGCTGTGTAGACACGGCGTGATCGGCATCATTACAGCCGGCGGAGAAGGACACGTGGCCTTTATCGACCTGCGGCAGTTTCACTGCGCCGAGGAACAG [서열번호 269]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 269에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 269의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 270으로 제공된다:
GGCCCUAGCGAUCUGUAUGUGCACGUGGGCAACCUGAUCUACCGGAACCUGCACCUGUUCAACAGCGAGAUGCACGACAGCAUCCUGAUCAGCUACAGCAGCGACCUGAUCAUCUAUCGGACCAACACCAUCGGCGACGACUACAUCCCCAACUGCAACUGUACCGAGGCCACCUACUACUGCCGGCACAAGAACCGGUACUACCCCAUCAAAGUGACCCCUCACGAUUGGUACGAGAUCCAAGAGAGCGAGUACUACCCUAAGCACAUCCAGUACAACCUGCUGAUCGGCGAGGGACCUUGCGAGCCUGGCGAUUGUGGUGGAAAGCUGCUGUGUAGACACGGCGUGAUCGGCAUCAUUACAGCCGGCGGAGAAGGACACGUGGCCUUUAUCGACCUGCGGCAGUUUCACUGCGCCGAGGAACAG [서열번호 270]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 270에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 리노바이러스 3Cpro(P23008; 게놈 폴리단백질 인간 리노바이러스 1A), 또는 그의 동원체이다. 리노바이러스 3Cpro의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 271로 나타낸다:
GPEEEFGRSILKNNTCVITTGNGKFTGLGIHDRILIIPTHADPGREVQVNGVHTKVLDSYDLYNRDGVKLEITVIQLDRNEKFRDIRKYIPETEDDYPECNLALSANQDEPTIIKVGDVVSYGNILLSGNQTARMLKYNYPTKSGYCGGVLYKIGQILGIHVGGNGRDGFSAMLLRSYFTDTQ [서열번호 271]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 271에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 리노바이러스 3Cpro 폴리펩티드는 다음과 같은 서열번호 272의 DNA 뉴클레오티드 서열에 의해 암호화된다:
GGTCCAGAAGAAGAATTTGGAAGGTCAATTCTCAAAAACAATACTTGTGTGATTACTACAGGTAATGGAAAATTTACAGGTCTTGGTATACATGACAGAATTCTAATCATCCCAACACATGCTGATCCAGGTAGAGAGGTCCAAGTTAATGGTGTCCACACTAAGGTTCTAGACTCATATGATCTTTATAATAGAGATGGAGTTAAACTTGAAATAACGGTCATACAATTAGATAGAAATGAAAAATTTAGGGACATTAGAAAGTATATACCTGAAACAGAAGACGATTATCCAGAATGCAATTTGGCACTTTCAGCTAATCAAGATGAACCAACTATAATTAAAGTAGGAGATGTAGTGTCCTATGGCAATATTTTGCTTAGTGGAAATCAAACAGCCAGAATGCTTAAATATAATTACCCCACAAAATCAGGGTATTGTGGAGGGGTACTATATAAAATTGGTCAAATTCTAGGTATTCATGTGGGTGGAAATGGAAGGGATGGTTTTTCAGCTATGTTACTTAGATCATACTTTACAGATACTCAG [서열번호 272]
따라서, 바람직하게는 상기 리노바이러스 3Cpro 폴리펩티드는 실질적으로 서열번호 272에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 리노바이러스 3Cpro 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 273으로 제공된다:
GGACCTGAGGAAGAGTTCGGCAGATCCATCCTGAAGAACAATACCTGCGTGATCACCACCGGCAACGGCAAGTTTACAGGCCTGGGCATCCACGACCGGATCCTGATCATTCCCACACACGCCGATCCTGGCCGGGAAGTGCAAGTGAATGGCGTGCACACCAAGGTGCTGGACAGCTACGACCTGTACAACCGCGACGGCGTGAAGCTGGAAATCACCGTGATTCAGCTGGACCGGAACGAGAAGTTCCGGGACATCCGGAAGTACATCCCCGAGACAGAGGACGACTACCCCGAGTGTAATCTGGCCCTGAGCGCCAACCAGGACGAGCCCACAATTATCAAAGTGGGCGACGTGGTGTCCTACGGCAACATCCTGCTGTCCGGCAATCAGACCGCCAGAATGCTGAAGTACAACTACCCCACCAAGAGCGGCTACTGTGGCGGCGTGCTGTATAAGATCGGCCAGATCCTGGGAATTCACGTCGGCGGCAATGGCAGAGATGGCTTCTCTGCTATGCTGCTGCGGAGCTACTTCACCGACACACAG [서열번호 273]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 273에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 273의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 274로 제공된다:
GGACCUGAGGAAGAGUUCGGCAGAUCCAUCCUGAAGAACAAUACCUGCGUGAUCACCACCGGCAACGGCAAGUUUACAGGCCUGGGCAUCCACGACCGGAUCCUGAUCAUUCCCACACACGCCGAUCCUGGCCGGGAAGUGCAAGUGAAUGGCGUGCACACCAAGGUGCUGGACAGCUACGACCUGUACAACCGCGACGGCGUGAAGCUGGAAAUCACCGUGAUUCAGCUGGACCGGAACGAGAAGUUCCGGGACAUCCGGAAGUACAUCCCCGAGACAGAGGACGACUACCCCGAGUGUAAUCUGGCCCUGAGCGCCAACCAGGACGAGCCCACAAUUAUCAAAGUGGGCGACGUGGUGUCCUACGGCAACAUCCUGCUGUCCGGCAAUCAGACCGCCAGAAUGCUGAAGUACAACUACCCCACCAAGAGCGGCUACUGUGGCGGCGUGCUGUAUAAGAUCGGCCAGAUCCUGGGAAUUCACGUCGGCGGCAAUGGCAGAGAUGGCUUCUCUGCUAUGCUGCUGCGGAGCUACUUCACCGACACACAG [서열번호 274]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 274에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 로타바이러스 VP3(A2T3S5; 단백질 VP3 로타바이러스 A(RVA/원숭이/남아프리카/SA11-H96/1958/G3P5B[2] 단리물)), 또는 그의 동원체이다. 로타바이러스 VP3의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 275로 나타낸다:
MKVLALRHSVAQVYADTQVYVHDDTKDSYENAFLISNLTTHNILYLNYSIKTLEILNKSGIAAIALQSLEELFTLIRCNFTYDYELDIIYLHDYSYYTNNEIRTDQHWITKTNIEEYLLPGWKLTYVGYNGSETRGHYNFSFKCQNAATDDDLIIEYIYSEALDFQNFMLKKIKERMTTSLPIARLSNRVFRDKLFPSLLKEHKNVVNVGPRNESMFTFLNYPTIKQFSNGAYLVKDTIKLKQERWLGKRISQFDIGQYKNMLNVLTAIYYYYNLYKSKPIIYMIGSAPSYWIYDVRHYSDFFFETWDPLDTPYSSIHHKELFFINDVKKLKDNSILYIDIRTDRGNADWKKWRKTVEEQTINNLDIAYEYLRTGKAKVCCVKMTAMDLELPISAKLLHHPTTEIRSEFYLLLDTWDLTNIRRFIPKGVLYSFINNIITENVFIQQPFKVKVLNDSYIVALYALSNDFNNRSEVIKLINNQKQSLITVRINNTFKDEPKVGFKNIYDWTFLPTDFDTKEAIITSYDGCLGLFGLSISLASKPTGNNHLFILSGTDKYYKLDQFANHTSISRRSHQIRFSESATSYSGYIFRDLSNNNFNLIGTNIENSVSGHVYNALIYYRYNYSFDLKRWIYLHSIDKVDIEGGKYYELAPIELIYACRSAKEFATLQDDLTVLRYSNEIENYINTVYSITYADDPNYFIGIQFRNIPYKYDVKIPHLTFGVLHISDNMVPDVIDILKIMKNELFKMDITTSYTYMLSDGIYVANVSGVLSTYFKIYNVFYKNQITFGQSRMFIPHITLSFNNMRTVRIETTKLQIKSIYLRKIKGDTVFDMVE [서열번호 275]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 275에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 로타바이러스 VP3 폴리펩티드는 다음과 같은 서열번호 276의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGAAAGTACTAGCTTTAAGACACAGTGTGGCTCAAGTGTATGCAGACACTCAAGTCTACGTTCATGATGATACAAAAGATAGTTATGAAAACGCTTTTTTAATCTCTAATCTTACGACCCATAATATTTTATACTTAAATTATAGCATTAAAACATTAGAAATATTAAATAAGTCAGGAATAGCTGCAATTGCTTTACAATCACTTGAAGAATTATTCACATTAATAAGGTGTAATTTCACTTATGATTATGAACTTGATATAATATATTTACATGATTATTCATATTATACCAATAATGAAATTAGAACAGACCAACATTGGATAACAAAAACAAATATTGAAGAATATTTACTACCTGGATGGAAATTAACATATGTTGGTTATAATGGAAGTGAAACTAGAGGACATTATAACTTTTCATTTAAATGTCAAAACGCTGCAACAGATGATGATCTAATAATTGAATACATTTATTCAGAAGCGTTGGACTTCCAAAATTTTATGTTAAAAAAGATAAAGGAAAGAATGACTACATCGTTGCCTATAGCTAGATTATCTAACAGAGTATTTAGGGATAAGTTATTCCCATCATTATTGAAAGAACATAAGAATGTAGTGAACGTTGGTCCGCGTAATGAATCTATGTTTACATTTTTAAATTATCCAACTATAAAACAATTTTCAAATGGTGCGTATTTAGTAAAAGATACTATAAAATTAAAACAAGAACGATGGTTAGGTAAAAGGATATCTCAGTTTGATATTGGTCAGTATAAAAATATGCTGAATGTTCTTACAGCAATTTATTATTACTATAATTTATATAAAAGTAAACCAATTATATATATGATCGGATCTGCTCCATCTTATTGGATATATGACGTTAGGCATTATTCCGATTTTTTCTTTGAAACTTGGGATCCATTGGACACACCATATTCATCAATCCATCACAAAGAATTATTTTTTATAAATGATGTGAAGAAACTGAAGGATAACTCAATATTGTATATTGATATAAGAACCGATAGGGGCAATGCTGATTGGAAAAAATGGAGAAAGACAGTAGAAGAACAAACTATTAATAATTTGGACATAGCTTATGAATATTTACGAACGGGTAAAGCGAAGGTGTGTTGTGTTAAGATGACAGCTATGGATTTGGAACTGCCAATTTCAGCTAAATTACTGCACCACCCAACTACGGAAATAAGATCAGAATTTTATTTATTACTAGATACTTGGGATTTAACTAACATTAGGAGGTTCATTCCTAAAGGCGTGTTATATTCATTTATAAACAATATAATAACTGAAAATGTGTTTATTCAACAACCATTTAAAGTAAAAGTACTGAATGATAGTTATATTGTAGCGTTATATGCATTATCAAATGATTTTAATAATAGATCAGAAGTAATTAAATTAATTAATAATCAGAAACAATCTCTAATAACTGTTAGAATAAATAATACGTTTAAGGATGAACCAAAAGTTGGGTTCAAAAATATCTATGATTGGACCTTTCTTCCAACCGACTTTGATACCAAAGAAGCTATAATTACTTCATACGACGGTTGTTTAGGACTCTTTGGTTTGTCTATATCGTTAGCATCAAAACCAACAGGGAATAATCATTTATTCATTTTAAGTGGTACAGATAAGTATTATAAATTGGATCAATTTGCTAATCACACCAGTATATCGAGAAGATCACACCAAATTAGGTTTTCGGAATCTGCTACTTCATATTCAGGTTATATATTTAGAGATTTGTCCAATAATAATTTTAATCTAATTGGTACTAATATAGAGAATTCAGTATCAGGTCATGTATATAATGCTTTAATTTATTATAGATATAATTATTCATTTGATCTTAAACGCTGGATTTATTTACATTCTATAGATAAAGTTGATATAGAAGGAGGAAAGTATTATGAACTCGCACCAATAGAATTAATTTATGCATGTAGATCAGCAAAAGAATTTGCTACATTGCAGGATGACTTAACTGTATTGAGATATTCAAACGAAATAGAGAATTATATTAATACAGTATATAGTATAACATACGCTGATGATCCGAATTACTTTATCGGAATACAATTTAGAAATATACCATATAAATATGATGTTAAAATACCGCATTTAACCTTCGGAGTATTACATATTTCTGATAACATGGTGCCAGACGTGATTGACATACTAAAGATAATGAAGAATGAATTATTTAAAATGGATATTACGACCAGTTATACATATATGTTATCAGATGGAATCTACGTAGCAAATGTTAGTGGAGTATTATCTACATACTTTAAAATCTATAACGTATTTTATAAAAATCAAATAACTTTTGGCCAATCCAGAATGTTTATTCCGCACATAACATTAAGCTTCAATAACATGAGAACAGTAAGGATAGAGACTACTAAATTACAAATTAAATCCATTTATTTAAGAAAGATTAAGGGTGATACAGTGTTTGATATGGTTGAG [서열번호 276]
따라서, 바람직하게는 상기 로타바이러스 VP3 폴리펩티드는 실질적으로 서열번호 276에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 로타바이러스 VP3 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 277로 제공된다:
ATGAAGGTGCTGGCCCTGAGACATTCTGTGGCCCAGGTGTACGCCGACACACAGGTCTACGTGCACGACGACACCAAGGACAGCTACGAGAACGCCTTCCTGATCAGCAACCTGACCACACACAACATCCTGTACCTGAACTACAGCATCAAGACCCTCGAGATCCTGAACAAGAGCGGAATCGCCGCTATCGCCCTGCAGAGCCTGGAAGAACTGTTCACCCTGATCCGGTGCAACTTCACCTACGACTACGAGCTGGACATCATCTACCTGCACGATTACAGCTACTACACCAACAACGAGATCCGGACCGACCAGCACTGGATCACCAAGACCAACATCGAGGAATACCTGCTGCCTGGCTGGAAGCTGACCTACGTGGGCTACAATGGCAGCGAGACACGGGGCCACTACAACTTCAGCTTCAAGTGCCAGAACGCCGCCACCGACGACGACCTGATCATCGAGTACATCTACAGCGAGGCCCTGGACTTCCAGAACTTCATGCTGAAGAAAATCAAAGAACGGATGACCACCAGCCTGCCTATCGCCAGACTGAGCAACCGGGTGTTCCGGGACAAGCTGTTTCCCAGCCTGCTGAAAGAACACAAGAACGTGGTCAACGTGGGCCCCAGAAACGAGAGCATGTTCACCTTTCTGAACTACCCCACCATCAAGCAGTTCAGCAACGGCGCCTACCTGGTCAAGGACACAATCAAGCTGAAGCAAGAGAGATGGCTGGGCAAGAGAATCAGCCAGTTCGACATCGGCCAGTACAAGAACATGCTGAACGTGCTGACCGCCATCTACTACTACTATAACCTGTACAAGAGCAAGCCGATCATCTACATGATTGGCAGCGCCCCTAGCTACTGGATCTACGACGTGCGGCACTACAGCGACTTTTTCTTCGAAACCTGGGATCCCCTGGACACCCCTTACAGCAGCATCCACCACAAAGAGCTGTTCTTCATCAACGACGTGAAGAAGCTCAAGGACAACAGCATCCTCTACATCGACATCAGAACCGACCGGGGCAACGCCGACTGGAAGAAATGGCGGAAAACCGTGGAAGAACAGACCATCAACAACCTGGATATCGCCTACGAGTACCTGCGGACCGGCAAGGCCAAAGTGTGCTGCGTGAAGATGACAGCCATGGACCTGGAACTGCCCATCAGCGCCAAACTGCTGCACCATCCTACCACCGAGATCAGAAGCGAGTTCTATCTGCTGCTGGACACCTGGGACCTGACCAATATCAGACGGTTCATCCCCAAGGGCGTGCTGTACTCCTTTATCAACAACATCATCACCGAGAACGTGTTCATCCAGCAGCCGTTCAAAGTGAAAGTGCTGAACGACAGCTACATCGTGGCCCTGTACGCCCTGAGCAACGACTTCAACAATCGGAGCGAAGTGATCAAACTGATCAACAATCAGAAGCAGTCCCTGATCACCGTGCGCATCAACAATACCTTCAAGGACGAGCCCAAAGTGGGCTTCAAGAATATCTACGACTGGACCTTCCTGCCTACCGACTTCGACACCAAAGAGGCCATCATCACAAGCTACGACGGCTGCCTGGGCCTGTTTGGCCTGTCTATTAGCCTGGCCAGCAAGCCCACCGGCAACAACCACCTGTTTATCCTGAGCGGCACCGACAAGTACTACAAGCTGGATCAGTTCGCCAACCACACCAGCATCAGCAGAAGAAGCCACCAGATCCGGTTCAGCGAGAGCGCCACAAGCTATAGCGGCTACATCTTCCGGGACCTGTCCAACAACAACTTCAACCTGATCGGCACGAACATCGAGAACAGCGTGTCCGGCCACGTGTACAACGCCCTGATCTACTACCGGTACAACTACTCCTTCGACCTGAAGCGGTGGATCTATCTGCACAGCATCGACAAGGTGGACATCGAAGGCGGCAAGTACTATGAGCTGGCCCCTATCGAGCTGATCTACGCCTGCAGAAGCGCCAAAGAGTTCGCCACACTGCAGGACGATCTGACCGTGCTGAGATACAGCAATGAGATCGAGAACTACATCAACACCGTGTACTCCATCACCTACGCCGACGATCCCAACTACTTCATCGGAATCCAGTTCCGCAACATCCCCTATAAGTACGACGTCAAGATCCCTCACCTGACCTTCGGCGTGCTGCACATCAGCGACAACATGGTGCCCGACGTGATCGACATCCTGAAGATCATGAAGAATGAGCTGTTCAAGATGGACATCACCACCAGCTACACCTACATGCTGAGCGACGGCATCTACGTGGCCAATGTGTCTGGCGTGCTGAGCACCTACTTCAAGATCTACAACGTGTTCTACAAGAACCAGATCACCTTCGGCCAGAGCCGGATGTTCATCCCTCACATCACCCTGAGCTTTAACAACATGCGGACCGTGCGGATCGAAACCACCAAGCTGCAGATCAAGAGCATCTACCTCCGGAAGATCAAGGGCGACACCGTGTTCGACATGGTGGAA [서열번호 277]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 277에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 277의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 278로 제공된다:
AUGAAGGUGCUGGCCCUGAGACAUUCUGUGGCCCAGGUGUACGCCGACACACAGGUCUACGUGCACGACGACACCAAGGACAGCUACGAGAACGCCUUCCUGAUCAGCAACCUGACCACACACAACAUCCUGUACCUGAACUACAGCAUCAAGACCCUCGAGAUCCUGAACAAGAGCGGAAUCGCCGCUAUCGCCCUGCAGAGCCUGGAAGAACUGUUCACCCUGAUCCGGUGCAACUUCACCUACGACUACGAGCUGGACAUCAUCUACCUGCACGAUUACAGCUACUACACCAACAACGAGAUCCGGACCGACCAGCACUGGAUCACCAAGACCAACAUCGAGGAAUACCUGCUGCCUGGCUGGAAGCUGACCUACGUGGGCUACAAUGGCAGCGAGACACGGGGCCACUACAACUUCAGCUUCAAGUGCCAGAACGCCGCCACCGACGACGACCUGAUCAUCGAGUACAUCUACAGCGAGGCCCUGGACUUCCAGAACUUCAUGCUGAAGAAAAUCAAAGAACGGAUGACCACCAGCCUGCCUAUCGCCAGACUGAGCAACCGGGUGUUCCGGGACAAGCUGUUUCCCAGCCUGCUGAAAGAACACAAGAACGUGGUCAACGUGGGCCCCAGAAACGAGAGCAUGUUCACCUUUCUGAACUACCCCACCAUCAAGCAGUUCAGCAACGGCGCCUACCUGGUCAAGGACACAAUCAAGCUGAAGCAAGAGAGAUGGCUGGGCAAGAGAAUCAGCCAGUUCGACAUCGGCCAGUACAAGAACAUGCUGAACGUGCUGACCGCCAUCUACUACUACUAUAACCUGUACAAGAGCAAGCCGAUCAUCUACAUGAUUGGCAGCGCCCCUAGCUACUGGAUCUACGACGUGCGGCACUACAGCGACUUUUUCUUCGAAACCUGGGAUCCCCUGGACACCCCUUACAGCAGCAUCCACCACAAAGAGCUGUUCUUCAUCAACGACGUGAAGAAGCUCAAGGACAACAGCAUCCUCUACAUCGACAUCAGAACCGACCGGGGCAACGCCGACUGGAAGAAAUGGCGGAAAACCGUGGAAGAACAGACCAUCAACAACCUGGAUAUCGCCUACGAGUACCUGCGGACCGGCAAGGCCAAAGUGUGCUGCGUGAAGAUGACAGCCAUGGACCUGGAACUGCCCAUCAGCGCCAAACUGCUGCACCAUCCUACCACCGAGAUCAGAAGCGAGUUCUAUCUGCUGCUGGACACCUGGGACCUGACCAAUAUCAGACGGUUCAUCCCCAAGGGCGUGCUGUACUCCUUUAUCAACAACAUCAUCACCGAGAACGUGUUCAUCCAGCAGCCGUUCAAAGUGAAAGUGCUGAACGACAGCUACAUCGUGGCCCUGUACGCCCUGAGCAACGACUUCAACAAUCGGAGCGAAGUGAUCAAACUGAUCAACAAUCAGAAGCAGUCCCUGAUCACCGUGCGCAUCAACAAUACCUUCAAGGACGAGCCCAAAGUGGGCUUCAAGAAUAUCUACGACUGGACCUUCCUGCCUACCGACUUCGACACCAAAGAGGCCAUCAUCACAAGCUACGACGGCUGCCUGGGCCUGUUUGGCCUGUCUAUUAGCCUGGCCAGCAAGCCCACCGGCAACAACCACCUGUUUAUCCUGAGCGGCACCGACAAGUACUACAAGCUGGAUCAGUUCGCCAACCACACCAGCAUCAGCAGAAGAAGCCACCAGAUCCGGUUCAGCGAGAGCGCCACAAGCUAUAGCGGCUACAUCUUCCGGGACCUGUCCAACAACAACUUCAACCUGAUCGGCACGAACAUCGAGAACAGCGUGUCCGGCCACGUGUACAACGCCCUGAUCUACUACCGGUACAACUACUCCUUCGACCUGAAGCGGUGGAUCUAUCUGCACAGCAUCGACAAGGUGGACAUCGAAGGCGGCAAGUACUAUGAGCUGGCCCCUAUCGAGCUGAUCUACGCCUGCAGAAGCGCCAAAGAGUUCGCCACACUGCAGGACGAUCUGACCGUGCUGAGAUACAGCAAUGAGAUCGAGAACUACAUCAACACCGUGUACUCCAUCACCUACGCCGACGAUCCCAACUACUUCAUCGGAAUCCAGUUCCGCAACAUCCCCUAUAAGUACGACGUCAAGAUCCCUCACCUGACCUUCGGCGUGCUGCACAUCAGCGACAACAUGGUGCCCGACGUGAUCGACAUCCUGAAGAUCAUGAAGAAUGAGCUGUUCAAGAUGGACAUCACCACCAGCUACACCUACAUGCUGAGCGACGGCAUCUACGUGGCCAAUGUGUCUGGCGUGCUGAGCACCUACUUCAAGAUCUACAACGUGUUCUACAAGAACCAGAUCACCUUCGGCCAGAGCCGGAUGUUCAUCCCUCACAUCACCCUGAGCUUUAACAACAUGCGGACCGUGCGGAUCGAAACCACCAAGCUGCAGAUCAAGAGCAUCUACCUCCGGAAGAUCAAGGGCGACACCGUGUUCGACAUGGUGGAA [서열번호 278]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 278에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 GB 바이러스 B NS3/4A(Q69422; 게놈 폴리단백질 간염 GB 바이러스 B), 또는 그의 동원체이다. GB 바이러스 B NS3/4A의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 279로 나타낸다:
APFTLQCLSERGTLSAMAVVMTGIDPRTWTGTIFRLGSLATSYMGFVCDNVLYTAHHGSKGRRLAHPTGSIHPITVDAANDQDIYQPPCGAGSLTRCSCGETKGYLVTRLGSLVEVNKSDDPYWCVCGALPMAVAKGSSGAPILCSSGHVIGMFTAARNSGGSVSQIRVRPLVCAGYHPQYTAHATLDTKPTVPNEYSVQILIAPTGSGKSTKLPLSYMQEKYEVLVLNPSVATTASMPKYMHATYGVNPNCYFNGKCTNTGASLTYSTYGMYLTGACSRNYDVIICDECHATDATTVLGIGKVLTEAPSKNVRLVVLATATPPGVIPTPHANITEIQLTDEGTIPFHGKKIKEENLKKGRHLIFEATKKHCDELANELARKGITAVSYYRGCDISKIPEGDCVVVATDALCTGYTGDFDSVYDCSLMVEGTCHVDLDPTFTMGVRVCGVSAIVKGQRRGRTGRGRAGIYYYVDGSCTPSGMVPECNIVEAFDAAKAWYGLSSTEAQTILDTYRTQPGLPAIGANLDEWADLFSMVNPEPSFVNTAKRTADNYVLLTAAQLQLCHQYGYAAPNDAPRWQGARLGKKPCGVLWRLDGADACPGPEPSEVTRYQMCFTEVNTSGTAALAVGVGVAMAYLAIDTFGATCVRRCWSITSVPTGATVAPVVDEEEIVEEC [서열번호 279]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 279에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 GB 바이러스 B NS3/4A 폴리펩티드는 다음과 같은 서열번호 280의 DNA 뉴클레오티드 서열에 의해 암호화된다:
GCACCTTTTACGCTGCAGTGTCTCTCTGAACGTGGCACGCTGTCAGCGATGGCAGTGGTCATGACTGGTATAGACCCCCGAACTTGGACTGGAACTATCTTCAGATTAGGATCTCTGGCCACTAGCTACATGGGATTTGTTTGTGACAACGTGTTGTATACTGCTCACCATGGCAGCAAGGGGCGCCGGTTGGCTCATCCCACAGGCTCCATACACCCAATAACCGTTGACGCGGCTAATGACCAGGACATCTATCAACCACCATGTGGAGCTGGGTCCCTTACTCGGTGCTCTTGCGGGGAGACCAAGGGGTATCTGGTAACACGACTGGGGTCATTGGTTGAGGTCAACAAATCCGATGACCCTTATTGGTGTGTGTGCGGGGCCCTTCCCATGGCTGTTGCCAAGGGTTCTTCAGGTGCCCCGATTCTGTGCTCCTCCGGGCATGTTATTGGGATGTTCACCGCTGCTAGAAATTCTGGCGGTTCAGTCAGCCAGATTAGGGTTAGGCCGTTGGTGTGTGCTGGATACCATCCCCAGTACACAGCACATGCCACTCTTGATACAAAACCTACTGTGCCTAACGAGTATTCAGTGCAAATTTTAATTGCCCCCACTGGCAGCGGCAAGTCAACCAAATTACCACTTTCTTACATGCAGGAGAAGTATGAGGTCTTGGTCCTAAATCCCAGTGTGGCTACAACAGCATCAATGCCAAAGTACATGCACGCGACGTACGGCGTGAATCCAAATTGCTATTTTAATGGCAAATGTACCAACACAGGGGCTTCACTTACGTACAGCACATATGGCATGTACCTGACCGGAGCATGTTCCCGGAACTATGACGTCATCATTTGTGACGAATGCCATGCTACCGATGCAACCACCGTGTTGGGCATTGGAAAGGTTCTAACCGAAGCTCCATCCAAAAATGTTAGGCTAGTGGTTCTTGCCACGGCTACCCCCCCTGGAGTAATCCCTACACCACATGCCAACATAACTGAGATTCAATTAACCGATGAAGGCACTATCCCCTTTCATGGAAAAAAGATTAAGGAGGAAAATCTGAAGAAAGGGAGACACCTTATCTTTGAGGCTACCAAAAAACACTGTGATGAGCTTGCTAACGAGTTAGCTCGAAAGGGAATAACAGCTGTCTCTTACTATAGGGGATGTGACATCTCAAAAATCCCTGAGGGCGACTGTGTAGTAGTTGCCACTGATGCCTTGTGTACAGGGTACACTGGTGACTTTGATTCCGTGTATGACTGCAGCCTCATGGTAGAAGGCACATGCCATGTTGACCTTGACCCTACTTTCACCATGGGTGTTCGTGTGTGCGGGGTCTCAGCAATAGTTAAAGGCCAGCGTAGGGGCCGCACAGGCCGTGGGAGAGCTGGCATATACTACTATGTAGACGGGAGTTGTACCCCTTCGGGTATGGTTCCTGAATGCAACATTGTTGAAGCCTTCGACGCAGCCAAGGCATGGTATGGTTTGTCATCAACAGAAGCTCAAACTATTCTGGACACCTATCGCACCCAACCTGGGTTACCTGCGATAGGAGCAAATTTGGACGAGTGGGCTGATCTCTTTTCTATGGTCAACCCCGAACCTTCATTTGTCAATACTGCAAAAAGAACTGCTGACAATTATGTTTTGTTGACTGCAGCCCAACTACAACTGTGTCATCAGTATGGCTATGCTGCTCCCAATGACGCACCACGGTGGCAGGGAGCCCGGCTTGGGAAAAAACCTTGTGGGGTTCTGTGGCGCTTGGACGGCGCTGACGCCTGTCCTGGCCCAGAGCCCAGCGAGGTGACCAGATACCAAATGTGCTTCACTGAAGTCAATACTTCTGGGACAGCCGCACTCGCTGTTGGCGTTGGAGTGGCTATGGCTTATCTAGCCATTGACACTTTTGGCGCCACTTGTGTGCGGCGTTGCTGGTCTATTACATCAGTCCCTACCGGTGCTACTGTCGCCCCAGTGGTTGACGAAGAAGAAATCGTGGAGGAGTGT [서열번호 280]
따라서, 바람직하게는 상기 GB 바이러스 B NS3/4A 폴리펩티드는 실질적으로 서열번호 280에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 GB 바이러스 B NS3/4A 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 281로 제공된다:
GCCCCTTTCACACTGCAATGCCTGAGCGAGAGAGGCACCCTGTCTGCCATGGCCGTGGTTATGACAGGCATCGACCCTAGAACCTGGACCGGCACCATCTTCAGACTGGGAAGCCTGGCCACAAGCTACATGGGCTTCGTGTGCGACAACGTGCTGTACACAGCCCACCACGGCAGCAAAGGCAGAAGGCTGGCTCACCCTACAGGCAGCATTCACCCCATCACAGTGGACGCCGCCAACGACCAGGATATCTACCAACCTCCTTGCGGCGCTGGCAGCCTGACCAGATGTTCTTGTGGCGAGACAAAGGGCTACCTGGTCACCAGGCTGGGATCCCTGGTGGAAGTGAACAAGAGCGACGACCCCTATTGGTGCGTGTGTGGCGCACTGCCTATGGCTGTGGCCAAAGGATCTTCTGGCGCCCCTATCCTGTGTAGCTCTGGCCACGTGATCGGCATGTTTACCGCCGCCAGAAATAGCGGCGGCAGCGTGTCACAGATTAGAGTGCGGCCTCTTGTGTGCGCCGGCTATCACCCTCAGTATACAGCCCACGCCACACTGGACACCAAGCCTACCGTGCCTAACGAGTACAGCGTGCAGATCCTGATCGCCCCAACAGGCAGCGGCAAGAGCACAAAACTGCCCCTGAGCTACATGCAAGAGAAGTACGAGGTGCTGGTGCTGAACCCTAGCGTGGCCACAACAGCCAGCATGCCCAAGTACATGCACGCCACCTATGGCGTGAACCCCAACTGCTACTTCAACGGCAAGTGCACCAATACCGGCGCCAGCCTGACATACAGCACCTACGGCATGTATCTGACCGGCGCCTGCAGCAGAAACTACGACGTGATCATCTGCGACGAGTGCCACGCCACCGATGCCACAACTGTGCTCGGAATCGGCAAGGTGCTGACAGAGGCCCCTAGCAAGAATGTGCGACTGGTGGTGCTGGCCACTGCTACACCACCTGGCGTTATCCCTACACCTCACGCCAACATCACCGAGATCCAGCTGACCGACGAGGGCACAATCCCATTCCACGGCAAGAAGATCAAAGAGGAAAACCTGAAGAAGGGCCGCCACCTGATCTTCGAGGCCACCAAGAAACACTGTGACGAGCTGGCCAACGAACTGGCCAGAAAGGGCATCACCGCCGTGTCCTACTACAGAGGCTGCGACATCAGCAAGATCCCCGAGGGCGATTGTGTGGTGGTGGCTACAGATGCCCTGTGTACCGGCTACACCGGCGACTTCGATAGCGTGTACGACTGCAGCCTGATGGTGGAAGGCACCTGTCATGTGGATCTGGACCCCACCTTTACCATGGGCGTCAGAGTGTGCGGAGTGTCCGCCATCGTGAAGGGCCAGAGAAGAGGCAGAACTGGCAGAGGCAGAGCCGGCATCTACTACTATGTGGACGGCAGCTGTACCCCTAGCGGCATGGTGCCTGAGTGCAACATCGTGGAAGCCTTCGATGCCGCCAAGGCTTGGTACGGCCTGTCTAGCACAGAGGCTCAGACCATCCTGGACACCTACAGAACCCAGCCAGGACTGCCTGCCATCGGCGCCAATCTTGATGAATGGGCCGACCTGTTCAGCATGGTCAACCCCGAGCCTAGCTTCGTGAACACCGCCAAGAGAACCGCCGACAACTACGTGCTGCTGACAGCCGCTCAGCTCCAGCTGTGTCACCAGTACGGATACGCCGCTCCTAACGACGCCCCTAGATGGCAAGGCGCTAGACTGGGCAAGAAACCATGTGGCGTTCTGTGGCGACTGGATGGCGCTGATGCTTGTCCTGGACCTGAGCCTAGCGAAGTGACCAGATACCAGATGTGCTTCACCGAAGTGAATACCAGCGGCACAGCTGCCCTGGCCGTTGGTGTTGGAGTGGCCATGGCTTACCTGGCCATCGATACCTTTGGCGCCACATGCGTGCGGAGATGCTGGTCTATCACCAGCGTTCCAACAGGCGCTACAGTGGCCCCTGTGGTGGATGAGGAAGAGATTGTGGAAGAGTGC [서열번호 281]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 281에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 281의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 282로 제공된다:
GCCCCUUUCACACUGCAAUGCCUGAGCGAGAGAGGCACCCUGUCUGCCAUGGCCGUGGUUAUGACAGGCAUCGACCCUAGAACCUGGACCGGCACCAUCUUCAGACUGGGAAGCCUGGCCACAAGCUACAUGGGCUUCGUGUGCGACAACGUGCUGUACACAGCCCACCACGGCAGCAAAGGCAGAAGGCUGGCUCACCCUACAGGCAGCAUUCACCCCAUCACAGUGGACGCCGCCAACGACCAGGAUAUCUACCAACCUCCUUGCGGCGCUGGCAGCCUGACCAGAUGUUCUUGUGGCGAGACAAAGGGCUACCUGGUCACCAGGCUGGGAUCCCUGGUGGAAGUGAACAAGAGCGACGACCCCUAUUGGUGCGUGUGUGGCGCACUGCCUAUGGCUGUGGCCAAAGGAUCUUCUGGCGCCCCUAUCCUGUGUAGCUCUGGCCACGUGAUCGGCAUGUUUACCGCCGCCAGAAAUAGCGGCGGCAGCGUGUCACAGAUUAGAGUGCGGCCUCUUGUGUGCGCCGGCUAUCACCCUCAGUAUACAGCCCACGCCACACUGGACACCAAGCCUACCGUGCCUAACGAGUACAGCGUGCAGAUCCUGAUCGCCCCAACAGGCAGCGGCAAGAGCACAAAACUGCCCCUGAGCUACAUGCAAGAGAAGUACGAGGUGCUGGUGCUGAACCCUAGCGUGGCCACAACAGCCAGCAUGCCCAAGUACAUGCACGCCACCUAUGGCGUGAACCCCAACUGCUACUUCAACGGCAAGUGCACCAAUACCGGCGCCAGCCUGACAUACAGCACCUACGGCAUGUAUCUGACCGGCGCCUGCAGCAGAAACUACGACGUGAUCAUCUGCGACGAGUGCCACGCCACCGAUGCCACAACUGUGCUCGGAAUCGGCAAGGUGCUGACAGAGGCCCCUAGCAAGAAUGUGCGACUGGUGGUGCUGGCCACUGCUACACCACCUGGCGUUAUCCCUACACCUCACGCCAACAUCACCGAGAUCCAGCUGACCGACGAGGGCACAAUCCCAUUCCACGGCAAGAAGAUCAAAGAGGAAAACCUGAAGAAGGGCCGCCACCUGAUCUUCGAGGCCACCAAGAAACACUGUGACGAGCUGGCCAACGAACUGGCCAGAAAGGGCAUCACCGCCGUGUCCUACUACAGAGGCUGCGACAUCAGCAAGAUCCCCGAGGGCGAUUGUGUGGUGGUGGCUACAGAUGCCCUGUGUACCGGCUACACCGGCGACUUCGAUAGCGUGUACGACUGCAGCCUGAUGGUGGAAGGCACCUGUCAUGUGGAUCUGGACCCCACCUUUACCAUGGGCGUCAGAGUGUGCGGAGUGUCCGCCAUCGUGAAGGGCCAGAGAAGAGGCAGAACUGGCAGAGGCAGAGCCGGCAUCUACUACUAUGUGGACGGCAGCUGUACCCCUAGCGGCAUGGUGCCUGAGUGCAACAUCGUGGAAGCCUUCGAUGCCGCCAAGGCUUGGUACGGCCUGUCUAGCACAGAGGCUCAGACCAUCCUGGACACCUACAGAACCCAGCCAGGACUGCCUGCCAUCGGCGCCAAUCUUGAUGAAUGGGCCGACCUGUUCAGCAUGGUCAACCCCGAGCCUAGCUUCGUGAACACCGCCAAGAGAACCGCCGACAACUACGUGCUGCUGACAGCCGCUCAGCUCCAGCUGUGUCACCAGUACGGAUACGCCGCUCCUAACGACGCCCCUAGAUGGCAAGGCGCUAGACUGGGCAAGAAACCAUGUGGCGUUCUGUGGCGACUGGAUGGCGCUGAUGCUUGUCCUGGACCUGAGCCUAGCGAAGUGACCAGAUACCAGAUGUGCUUCACCGAAGUGAAUACCAGCGGCACAGCUGCCCUGGCCGUUGGUGUUGGAGUGGCCAUGGCUUACCUGGCCAUCGAUACCUUUGGCGCCACAUGCGUGCGGAGAUGCUGGUCUAUCACCAGCGUUCCAACAGGCGCUACAGUGGCCCCUGUGGUGGAUGAGGAAGAGAUUGUGGAAGAGUGC [서열번호 282]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 282에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 HAV 3Cpro(P08617; 게놈 폴리단백질 인간 A형 간염 바이러스 유전자형 IB(HM175 단리물)), 또는 그의 동원체이다. HAV 3Cpro의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 283으로 나타낸다:
STLEIAGLVRKNLVQFGVGEKNGCVRWVMNALGVKDDWLLVPSHAYKFEKDYEMMEFYFNRGGTYYSISAGNVVIQSLDVGFQDVVLMKVPTIPKFRDITQHFIKKGDVPRALNRLATLVTTVNGTPMLISEGPLKMEEKATYVHKKNDGTTVDLTVDQAWRGKGEGLPGMCGGALVSSNQSIQNAILGIHVAGGNSILVAKLVTQEMFQNIDKKIESQ [서열번호 283]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 283에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 HAV 3Cpro 폴리펩티드는 다음과 같은 서열번호 284의 DNA 뉴클레오티드 서열에 의해 암호화된다:
TCAACTTTGGAAATAGCAGGACTGGTTAGGAAGAACTTGGTTCAGTTTGGAGTTGGAGAGAAGAATGGATGTGTGAGATGGGTTATGAATGCCTTGGGAGTGAAAGATGATTGGCTGCTTGTGCCTTCCCATGCTTATAAATTTGAGAAAGATTATGAAATGATGGAGTTTTATTTTAATAGAGGTGGAACTTACTATTCAATTTCAGCTGGTAATGTTGTTATTCAATCTTTGGATGTGGGATTCCAGGATGTTGTTCTGATGAAGGTTCCTACAATTCCTAAGTTTAGAGATATTACTCAGCATTTTATTAAGAAAGGGGATGTGCCTAGAGCTTTGAATCGCCTGGCAACATTAGTGACAACTGTAAATGGAACCCCTATGTTAATTTCTGAGGGCCCACTAAAGATGGAAGAGAAAGCTACTTATGTTCATAAGAAAAATGATGGTACAACAGTTGATTTAACTGTGGATCAGGCATGGAGAGGAAAAGGCGAAGGTCTTCCTGGAATGTGTGGTGGGGCCTTGGTTTCATCGAATCAATCTATACAGAATGCAATCTTGGGCATCCATGTTGCTGGAGGAAATTCAATTCTTGTTGCAAAATTGGTTACTCAAGAAATGTTCCAAAATATTGATAAGAAAATTGAAAGTCAG [서열번호 284]
따라서, 바람직하게는 상기 HAV 3Cpro 폴리펩티드는 실질적으로 서열번호 284에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 HAV 3Cpro 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 285로 제공된다:
AGCACACTGGAAATCGCCGGACTCGTGCGGAAGAACCTGGTGCAGTTTGGCGTGGGCGAGAAGAACGGCTGTGTCAGATGGGTCATGAACGCCCTGGGCGTGAAGGACGATTGGCTGCTGGTTCCTAGCCACGCCTACAAGTTCGAGAAGGACTACGAGATGATGGAATTCTACTTCAACAGAGGCGGCACCTACTACAGCATCAGCGCCGGCAATGTGGTCATCCAGTCTCTGGATGTGGGCTTCCAGGACGTGGTGCTGATGAAGGTGCCAACAATCCCCAAGTTCCGGGACATCACCCAGCACTTCATCAAGAAAGGCGACGTGCCCAGGGCTCTGAACAGACTGGCTACCCTGGTCACCACCGTGAACGGCACACCCATGCTGATCTCTGAGGGCCCACTGAAGATGGAAGAGAAGGCCACCTACGTGCACAAGAAGAACGACGGCACCACAGTGGACCTGACCGTGGATCAAGCTTGGAGAGGCAAAGGCGAGGGCCTGCCTGGAATGTGTGGCGGAGCACTGGTGTCCAGCAACCAGAGCATCCAGAATGCCATCCTGGGCATCCATGTGGCTGGCGGCAATTCTATCCTGGTGGCCAAGCTGGTCACCCAAGAGATGTTCCAGAACATCGACAAGAAGATCGAGAGCCAG [서열번호 285]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 285에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 285의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 286으로 제공된다:
AGCACACUGGAAAUCGCCGGACUCGUGCGGAAGAACCUGGUGCAGUUUGGCGUGGGCGAGAAGAACGGCUGUGUCAGAUGGGUCAUGAACGCCCUGGGCGUGAAGGACGAUUGGCUGCUGGUUCCUAGCCACGCCUACAAGUUCGAGAAGGACUACGAGAUGAUGGAAUUCUACUUCAACAGAGGCGGCACCUACUACAGCAUCAGCGCCGGCAAUGUGGUCAUCCAGUCUCUGGAUGUGGGCUUCCAGGACGUGGUGCUGAUGAAGGUGCCAACAAUCCCCAAGUUCCGGGACAUCACCCAGCACUUCAUCAAGAAAGGCGACGUGCCCAGGGCUCUGAACAGACUGGCUACCCUGGUCACCACCGUGAACGGCACACCCAUGCUGAUCUCUGAGGGCCCACUGAAGAUGGAAGAGAAGGCCACCUACGUGCACAAGAAGAACGACGGCACCACAGUGGACCUGACCGUGGAUCAAGCUUGGAGAGGCAAAGGCGAGGGCCUGCCUGGAAUGUGUGGCGGAGCACUGGUGUCCAGCAACCAGAGCAUCCAGAAUGCCAUCCUGGGCAUCCAUGUGGCUGGCGGCAAUUCUAUCCUGGUGGCCAAGCUGGUCACCCAAGAGAUGUUCCAGAACAUCGACAAGAAGAUCGAGAGCCAG [서열번호 286]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 286에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 인간 메타뉴모바이러스 M2-2(Q6WB96; 단백질 M2-2 인간 메타뉴모바이러스(CAN97-83 바이러스주)), 또는 그의 동원체이다. 인간 메타뉴모바이러스 M2-2의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 287로 나타낸다:
MTLHMPCKTVKALIKCSEHGPVFITIEVDEMIWTQKELKEALSDGIVKSHTNIYNCYLENIEIIYVKAYLS [서열번호 287]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 287에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 인간 메타뉴모바이러스 M2-2 폴리펩티드는 다음과 같은 서열번호 288의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGACTCTTCATATGCCCTGCAAGACAGTGAAAGCATTAATCAAGTGCAGTGAGCATGGTCCTGTTTTCATTACTATAGAGGTTGATGAAATGATATGGACTCAAAAAGAATTAAAAGAAGCTTTGTCCGATGGGATAGTGAAGTCTCACACCAACATTTACAATTGTTATTTAGAAAACATAGAAATTATATATGTCAAGGCTTACTTAAGT [서열번호 288]
따라서, 바람직하게는 상기 인간 메타뉴모바이러스 M2-2 폴리펩티드는 실질적으로 서열번호 288에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 인간 메타뉴모바이러스 M2-2 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 289로 제공된다:
ATGACCCTGCACATGCCCTGCAAGACAGTGAAGGCCCTGATCAAGTGTAGCGAGCACGGCCCCGTGTTCATCACCATTGAGGTGGACGAGATGATCTGGACCCAGAAAGAGCTGAAAGAGGCCCTGAGCGACGGCATCGTGAAGTCCCACACCAACATCTACAACTGCTACCTCGAGAACATCGAGATCATCTACGTGAAGGCCTACCTGAGC [서열번호 289]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 289에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 289의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 290으로 제공된다:
AUGACCCUGCACAUGCCCUGCAAGACAGUGAAGGCCCUGAUCAAGUGUAGCGAGCACGGCCCCGUGUUCAUCACCAUUGAGGUGGACGAGAUGAUCUGGACCCAGAAAGAGCUGAAAGAGGCCCUGAGCGACGGCAUCGUGAAGUCCCACACCAACAUCUACAACUGCUACCUCGAGAACAUCGAGAUCAUCUACGUGAAGGCCUACCUGAGC [서열번호 290]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 290에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 E형 간염 메틸트랜스퍼라아제(Q9WC28; 비-구조 폴리단백질 pORF1 메틸트랜스퍼라아제 E형 간염 바이러스 유전자형 1), 또는 그의 동원체이다. E형 간염 메틸트랜스퍼라아제의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 291로 나타낸다:
EVFWNQPIQRVIHNELELYCRARSGRCLEIGAHPRSINDNPNVVHRCFLRPVGRDVQRWYTAPTRGPAANCRRSALRGLPAADRTYCFDGFSGCSCPAETGIALYSLHDMSPSDVAEAMFRHGMTRLYAALHLPPEVLLPPGTYRTASYLLIHDGRRVVVTYEGDTSAGYNHDVSNLRSWI [서열번호 291]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 291에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 E형 간염 메틸트랜스퍼라아제 폴리펩티드는 다음과 같은 서열번호 292의 DNA 뉴클레오티드 서열에 의해 암호화된다:
GAGGTTTTCTGGAATCAACCCATCCAGCGTGTCATTCATAACGAGCTGGAGCTTTACTGCCGCGCTCGCTCCGGCCGCTGTCTTGAAATTGGCGCCCATCCCCGCTCAATAAATGATAATCCTAATGTGGTCCACCGCTGCTTCCTCCGCCCTGTTGGGCGTGATGTTCAGCGCTGGTATACTGCTCCCACTCGCGGGCCGGCTGCTAATTGCCGCCGTTCCGCGTTGCGTGGGCTTCCCGCTGCTGACCGCACATACTGCTTCGACGGGTTTTCTGGCTGTAGCTGCCCCGCCGAGACGGGTATCGCCCTTTACTCCCTCCATGATATGTCACCATCTGATGTTGCCGAGGCCATGTTCCGCCATGGTATGACGCGGCTTTATGCTGCCCTCCATCTTCCGCCTGAGGTCTTGCTGCCCCCTGGCACATATCGCACCGCATCGTATTTGCTGATTCATGACGGCAGGCGCGTTGTGGTGACGTATGAGGGTGATACTAGTGCTGGTTACAACCACGATGTCTCCAACTTGCGCTCCTGGATT [서열번호 292]
따라서, 바람직하게는 상기 E형 간염 메틸트랜스퍼라아제 폴리펩티드는 실질적으로 서열번호 292에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 E형 간염 메틸트랜스퍼라아제 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 293으로 제공된다:
GAGGTGTTCTGGAACCAGCCTATCCAGAGAGTGATCCACAACGAGCTGGAACTGTACTGCAGAGCCAGATCCGGCCGGTGTCTGGAAATTGGAGCCCATCCTCGGAGCATCAACGACAACCCCAACGTGGTGCACAGATGCTTTCTGAGGCCCGTGGGCAGAGATGTGCAGCGGTGGTATACAGCCCCTACAAGAGGACCTGCCGCCAACTGTAGAAGAAGCGCCCTGAGAGGACTGCCTGCCGCCGATAGAACCTACTGCTTCGATGGCTTCAGCGGCTGCAGCTGTCCTGCCGAAACTGGAATCGCCCTGTACAGCCTGCACGACATGAGCCCATCTGATGTGGCCGAGGCCATGTTCAGACACGGCATGACCAGACTGTACGCCGCTCTGCATCTGCCTCCAGAAGTTCTGCTGCCTCCTGGCACCTACAGAACCGCCAGCTATCTGCTGATCCACGATGGGAGAAGAGTGGTGGTCACCTACGAGGGCGATACAAGCGCCGGCTACAACCACGACGTGTCCAACCTGAGAAGCTGGATC [서열번호 293]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 293에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 293의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 294로 제공된다:
GAGGUGUUCUGGAACCAGCCUAUCCAGAGAGUGAUCCACAACGAGCUGGAACUGUACUGCAGAGCCAGAUCCGGCCGGUGUCUGGAAAUUGGAGCCCAUCCUCGGAGCAUCAACGACAACCCCAACGUGGUGCACAGAUGCUUUCUGAGGCCCGUGGGCAGAGAUGUGCAGCGGUGGUAUACAGCCCCUACAAGAGGACCUGCCGCCAACUGUAGAAGAAGCGCCCUGAGAGGACUGCCUGCCGCCGAUAGAACCUACUGCUUCGAUGGCUUCAGCGGCUGCAGCUGUCCUGCCGAAACUGGAAUCGCCCUGUACAGCCUGCACGACAUGAGCCCAUCUGAUGUGGCCGAGGCCAUGUUCAGACACGGCAUGACCAGACUGUACGCCGCUCUGCAUCUGCCUCCAGAAGUUCUGCUGCCUCCUGGCACCUACAGAACCGCCAGCUAUCUGCUGAUCCACGAUGGGAGAAGAGUGGUGGUCACCUACGAGGGCGAUACAAGCGCCGGCUACAACCACGACGUGUCCAACCUGAGAAGCUGGAUC [서열번호 294]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 294에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 PRRV Npro(P24381; 세린/트레오닌-단백질 키나아제(kinase) US3 동족체(homolog) 수이드(Suid) 헤르페스바이러스 2(NIA-3 바이러스주) 가성광견병(Pseudorabies) 바이러스), 또는 그의 동원체이다. PRRV Npro의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 295로 나타낸다:
MLAMWRWVTKRSRLRRGHAHLGGNKGVRGICSLYLAGLSRGLSRVHAQRSHAATMADAGIPDEILYSDISDDEIIIDGDGDGDSSGDEDDDDGGLTRQAASRIATDLGFEVLQPLQSGSEGRVFVARRPGEADTVVLKVGQKPSTLMEGMLLKRLAHDNVMSLKQMLARGPVTCLVLPHFRCDLYSYLTMRDGPLDMRDAGRVIRSVLRGLAYLHGMRIMHRDVKAENIFLEDVDTVCLGDLGAARCNVAAPNFYGLAGTIETNAPEVLARDRYDTKVDVWGAGVVLFETLAYPKTIAGGDEPAINGEMHLIDLIRALGVHPEEFPPDTRLRSEFVRYAGTHRQPYTQYARVARLGLPETGAFLIYKMLTFDPVRRPSADEILNFGMWTV [서열번호 295]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 295에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 PRRV Npro 폴리펩티드는 다음과 같은 서열번호 296의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGCTGGCGATGTGGAGATGGGTCACCAAGAGGTCGCGGCTCCGCCGAGGCCACGCCCATCTTGGGGGAAATAAAGGAGTCCGGGGAATTTGTTCCTTATACCTTGCCGGGCTCAGCAGGGGGTTGTCGCGCGTCCACGCCCAGCGCTCGCACGCAGCAACAATGGCCGACGCCGGAATCCCCGACGAGATCCTGTACTCGGACATCAGCGACGACGAGATCATCATCGACGGCGACGGCGACGGCGACAGCAGCGGGGACGAGGACGACGATGACGGGGGGCTGACGCGGCAGGCCGCGTCGCGCATCGCCACGGACCTGGGCTTCGAGGTGCTGCAGCCCCTGCAGTCGGGCTCGGAGGGCCGCGTCTTCGTGGCCCGCCGGCCCGGCGAGGCGGACACGGTGGTGCTGAAGGTGGGCCAGAAGCCCTCGACGCTGATGGAGGGCATGCTGCTGAAGCGCCTGGCCCACGATAACGTCATGAGCCTGAAGCAGATGCTCGCCCGGGGCCCGGTGACGTGCCTGGTCCTGCCGCACTTTCGGTGCGATCTGTACAGCTACCTGACCATGCGGGACGGGCCGCTGGACATGCGCGACGCCGGGCGCGTGATCCGGTCCGTGCTCCGCGGGCTCGCCTACCTGCACGGGATGCGCATCATGCACCGCGACGTCAAGGCGGAGAACATCTTCCTCGAGGACGTGGACACGGTGTGCCTGGGGGACCTCGGGGCCGCGCGCTGCAACGTGGCGGCGCCCAACTTTTACGGGCTCGCCGGGACCATCGAGACCAACGCCCCCGAGGTGCTCGCGCGCGACCGCTACGACACCAAGGTCGACGTCTGGGGCGCGGGGGTGGTGCTCTTCGAGACGCTGGCCTACCCCAAGACGATCGCCGGCGGGGACGAGCCCGCGATCAACGGGGAGATGCACCTGATCGACCTCATCCGCGCCCTCGGGGTGCACCCCGAGGAGTTCCCGCCCGACACGCGCCTCCGGAGCGAGTTCGTCCGGTACGCCGGGACCCACCGCCAGCCGTACACGCAGTACGCGCGCGTGGCTCGCCTCGGGCTGCCCGAGACGGGGGCTTTCCTGATTTACAAGATGTTGACGTTTGATCCCGTCCGCCGCCCTTCCGCTGATGAGATACTCAACTTTGGAATGTGGACCGTA [서열번호 296]
따라서, 바람직하게는 상기 PRRV Npro 폴리펩티드는 실질적으로 서열번호 296에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 PRRV Npro 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 297로 제공된다:
ATGCTGGCCATGTGGCGCTGGGTCACCAAGAGAAGCAGACTGAGAAGAGGACACGCCCACCTCGGCGGAAACAAGGGCGTTAGAGGCATCTGCAGCCTGTATCTGGCCGGCCTGTCTAGAGGACTGAGCAGAGTGCATGCCCAGAGATCTCACGCCGCCACAATGGCCGATGCTGGCATCCCTGATGAGATCCTGTACAGCGACATCAGCGACGACGAGATCATCATCGATGGCGACGGCGACGGGGATAGCAGCGGAGATGAGGATGACGATGATGGCGGCCTGACAAGACAGGCTGCCAGCAGAATTGCCACCGACCTGGGATTTGAGGTGCTGCAGCCTCTGCAGTCTGGCTCTGAGGGCAGAGTGTTCGTGGCTAGAAGGCCTGGCGAAGCCGATACCGTGGTGCTGAAAGTGGGCCAGAAACCTAGCACACTGATGGAAGGCATGCTGCTGAAGAGACTGGCCCACGACAACGTGATGAGCCTGAAGCAGATGCTGGCTAGAGGCCCTGTGACCTGTCTGGTGCTGCCTCACTTCAGATGCGACCTGTACTCCTACCTGACCATGAGAGATGGCCCTCTGGATATGCGCGACGCCGGCAGAGTGATCAGATCTGTGCTGAGAGGCCTGGCCTACCTGCACGGCATGAGAATCATGCACAGGGACGTGAAGGCCGAGAACATCTTTCTGGAAGATGTGGACACCGTGTGCCTGGGCGATCTGGGAGCCGCTAGATGTAATGTGGCCGCTCCTAACTTCTACGGCCTGGCCGGAACCATCGAGACAAATGCCCCTGAAGTGCTGGCCCGGGACAGATACGATACCAAGGTGGACGTTTGGGGAGCCGGCGTGGTCCTGTTTGAGACACTGGCTTACCCCAAGACAATCGCTGGCGGCGACGAGCCTGCTATCAATGGCGAGATGCACCTGATCGACCTGATCAGAGCCCTGGGCGTGCACCCTGAGGAATTCCCTCCAGACACACGGCTGCGGAGCGAGTTCGTTAGATACGCCGGAACACACAGACAGCCCTACACACAGTATGCCAGAGTGGCCAGACTGGGCCTGCCTGAAACAGGCGCCTTCCTGATCTACAAGATGCTGACCTTCGATCCCGTGCGGAGGCCTTCTGCCGATGAGATTCTGAACTTCGGCATGTGGACCGTG [서열번호 297]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 297에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 297의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 298로 제공된다:
AUGCUGGCCAUGUGGCGCUGGGUCACCAAGAGAAGCAGACUGAGAAGAGGACACGCCCACCUCGGCGGAAACAAGGGCGUUAGAGGCAUCUGCAGCCUGUAUCUGGCCGGCCUGUCUAGAGGACUGAGCAGAGUGCAUGCCCAGAGAUCUCACGCCGCCACAAUGGCCGAUGCUGGCAUCCCUGAUGAGAUCCUGUACAGCGACAUCAGCGACGACGAGAUCAUCAUCGAUGGCGACGGCGACGGGGAUAGCAGCGGAGAUGAGGAUGACGAUGAUGGCGGCCUGACAAGACAGGCUGCCAGCAGAAUUGCCACCGACCUGGGAUUUGAGGUGCUGCAGCCUCUGCAGUCUGGCUCUGAGGGCAGAGUGUUCGUGGCUAGAAGGCCUGGCGAAGCCGAUACCGUGGUGCUGAAAGUGGGCCAGAAACCUAGCACACUGAUGGAAGGCAUGCUGCUGAAGAGACUGGCCCACGACAACGUGAUGAGCCUGAAGCAGAUGCUGGCUAGAGGCCCUGUGACCUGUCUGGUGCUGCCUCACUUCAGAUGCGACCUGUACUCCUACCUGACCAUGAGAGAUGGCCCUCUGGAUAUGCGCGACGCCGGCAGAGUGAUCAGAUCUGUGCUGAGAGGCCUGGCCUACCUGCACGGCAUGAGAAUCAUGCACAGGGACGUGAAGGCCGAGAACAUCUUUCUGGAAGAUGUGGACACCGUGUGCCUGGGCGAUCUGGGAGCCGCUAGAUGUAAUGUGGCCGCUCCUAACUUCUACGGCCUGGCCGGAACCAUCGAGACAAAUGCCCCUGAAGUGCUGGCCCGGGACAGAUACGAUACCAAGGUGGACGUUUGGGGAGCCGGCGUGGUCCUGUUUGAGACACUGGCUUACCCCAAGACAAUCGCUGGCGGCGACGAGCCUGCUAUCAAUGGCGAGAUGCACCUGAUCGACCUGAUCAGAGCCCUGGGCGUGCACCCUGAGGAAUUCCCUCCAGACACACGGCUGCGGAGCGAGUUCGUUAGAUACGCCGGAACACACAGACAGCCCUACACACAGUAUGCCAGAGUGGCCAGACUGGGCCUGCCUGAAACAGGCGCCUUCCUGAUCUACAAGAUGCUGACCUUCGAUCCCGUGCGGAGGCCUUCUGCCGAUGAGAUUCUGAACUUCGGCAUGUGGACCGUG [서열번호 298]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 298에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 HSV1 US3(P04413; 세린/트레오닌-단백질 키나아제 US3 인간 헤르페스바이러스 1(17 바이러스주)), 또는 그의 동원체이다. HSV1 US3의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 299로 나타낸다:
MACRKFCRVYGGQGRRKEEAVPPETKPSRVFPHGPFYTPAEDACLDSPPPETPKPSHTTPPSEAERLCHLQEILAQMYGNQDYPIEDDPSADAADDVDEDAPDDVAYPEEYAEELFLPGDATGPLIGANDHIPPPCGASPPGIRRRSRDEIGATGFTAEELDAMDREAARAISRGGKPPSTMAKLVTGMGFTIHGALTPGSEGCVFDSSHPDYPQRVIVKAGWYTSTSHEARLLRRLDHPAILPLLDLHVVSGVTCLVLPKYQADLYTYLSRRLNPLGRPQIAAVSRQLLSAVDYIHRQGIIHRDIKTENIFINTPEDICLGDFGAACFVQGSRSSPFPYGIAGTIDTNAPEVLAGDPYTTTVDIWSAGLVIFETAVHNASLFSAPRGPKRGPCDSQITRIIRQAQVHVDEFSPHPESRLTSRYRSRAAGNNRPPYTRPAWTRYYKMDIDVEYLVCKALTFDGALRPSAAELLCLPLFQQK [서열번호 299]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 299에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 HSV1 US3 폴리펩티드는 다음과 같은 서열번호 300의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGCCTGTCGTAAGTTTTGTCGCGTTTACGGGGGACAGGGCAGGAGGAAGGAGGAGGCCGTCCCGCCGGAGACAAAGCCGTCCCGGGTGTTTCCTCATGGCCCCTTTTATACCCCAGCCGAGGACGCGTGCCTGGACTCCCCGCCCCCGGAGACCCCCAAACCTTCCCACACCACACCACCCAGCGAGGCCGAGCGCCTGTGTCATCTGCAGGAGATCCTTGCCCAGATGTACGGAAACCAGGACTACCCCATAGAGGACGACCCCAGCGCGGATGCCGCGGACGATGTCGACGAGGACGCCCCGGACGACGTGGCCTATCCGGAGGAATACGCAGAGGAGCTTTTTCTGCCCGGGGACGCGACCGGTCCCCTTATCGGGGCCAACGACCACATCCCTCCCCCGTGTGGCGCATCTCCCCCCGGTATACGACGACGCAGCCGGGATGAGATTGGGGCCACGGGATTTACCGCGGAAGAGCTGGACGCCATGGACAGGGAGGCGGCTCGAGCCATCAGCCGCGGCGGCAAGCCCCCCTCGACCATGGCCAAGCTGGTGACTGGCATGGGCTTTACGATCCACGGAGCGCTCACCCCAGGATCGGAGGGGTGTGTCTTTGACAGCAGCCATCCAGATTACCCCCAACGGGTAATCGTGAAGGCGGGGTGGTACACGAGCACGAGCCACGAGGCGCGACTGCTGAGGCGACTGGACCACCCGGCGATCCTGCCCCTCCTGGACCTGCATGTCGTCTCCGGGGTCACGTGTCTGGTCCTCCCCAAGTACCAGGCCGACCTGTATACCTATCTGAGTAGGCGCCTGAACCCACTGGGACGCCCGCAGATCGCAGCGGTCTCCCGGCAGCTCCTAAGCGCCGTTGACTACATTCACCGCCAGGGCATTATCCACCGCGACATTAAGACCGAAAATATTTTTATTAACACCCCCGAGGACATTTGCCTGGGGGACTTTGGCGCCGCGTGCTTCGTGCAGGGTTCCCGATCAAGCCCCTTCCCCTACGGAATCGCCGGAACCATCGACACCAACGCCCCCGAGGTCCTGGCCGGGGATCCGTATACCACGACCGTCGACATTTGGAGCGCCGGTCTGGTGATCTTCGAGACTGCCGTCCACAACGCGTCCTTGTTCTCGGCCCCCCGCGGCCCCAAAAGGGGCCCGTGCGACAGTCAGATCACCCGCATCATCCGACAGGCCCAGGTCCACGTTGACGAGTTTTCCCCGCATCCAGAATCGCGCCTCACCTCGCGCTACCGCTCCCGCGCGGCCGGGAACAATCGCCCGCCGTACACCCGACCGGCCTGGACCCGCTACTACAAGATGGACATAGACGTCGAATATCTGGTTTGCAAAGCCCTCACCTTCGACGGCGCGCTTCGCCCCAGCGCCGCAGAGCTGCTTTGTTTGCCGCTGTTTCAACAGAAA [서열번호 300]
따라서, 바람직하게는 상기 HSV1 US3 폴리펩티드는 실질적으로 서열번호 300에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 HSV1 US3 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 301로 제공된다:
ATGGCCTGCCGGAAGTTCTGTAGAGTGTACGGCGGACAGGGGCGCAGAAAAGAGGAAGCCGTTCCTCCTGAGACAAAGCCCAGCAGAGTGTTCCCTCACGGCCCCTTTTACACCCCTGCCGAAGATGCCTGTCTGGACAGCCCTCCTCCAGAAACACCTAAGCCTAGCCACACCACACCTCCAAGCGAGGCCGAAAGACTGTGCCATCTGCAAGAGATTCTGGCCCAGATGTACGGCAACCAGGACTACCCCATCGAGGACGATCCATCTGCCGATGCCGCCGACGATGTGGATGAAGATGCCCCTGATGACGTGGCCTATCCTGAGGAATACGCCGAGGAACTGTTCCTGCCTGGCGACGCTACAGGACCTCTGATCGGAGCCAACGATCACATCCCTCCACCTTGTGGCGCTAGCCCTCCTGGCATCAGAAGAAGAAGCAGGGACGAGATCGGCGCCACCGGCTTTACAGCCGAAGAACTGGACGCCATGGACAGAGAAGCCGCCAGAGCCATTTCTAGAGGCGGCAAGCCTCCTAGCACCATGGCCAAACTGGTTACCGGCATGGGCTTCACCATTCACGGCGCTCTGACACCTGGCTCTGAGGGCTGTGTGTTCGACAGCTCTCACCCCGACTATCCCCAGCGCGTGATCGTGAAAGCCGGCTGGTACACAAGCACAAGCCACGAGGCCAGACTGCTGCGGAGACTGGATCATCCTGCCATCCTGCCTCTGCTGGATCTGCATGTGGTGTCCGGCGTGACATGTCTGGTGCTGCCTAAGTACCAGGCCGACCTGTACACCTACCTGAGCAGAAGGCTGAACCCTCTGGGCAGACCTCAGATTGCCGCTGTGTCAAGACAGCTGCTGAGCGCTGTGGACTACATCCACAGACAGGGCATCATCCACCGGGACATCAAGACCGAGAATATCTTCATCAACACGCCCGAGGACATCTGCCTGGGCGATTTTGGCGCCGCTTGCTTCGTGCAAGGCAGCAGAAGCAGCCCCTTTCCTTATGGAATCGCCGGCACCATCGACACAAACGCCCCTGAAGTTCTGGCCGGCGATCCTTACACCACCACCGTGGATATTTGGAGCGCCGGACTGGTCATCTTCGAGACAGCCGTGCATAACGCCAGCCTGTTCTCTGCCCCTAGAGGCCCTAAAAGAGGCCCCTGCGATAGCCAGATCACCCGGATCATTAGACAGGCCCAGGTGCACGTGGACGAGTTCTCTCCACATCCTGAGAGCCGGCTGACCAGCCGGTACAGATCTAGAGCCGCCGGAAACAACCGGCCTCCATACACAAGACCTGCCTGGACACGGTACTACAAGATGGACATCGACGTGGAATACCTCGTGTGCAAGGCCCTGACCTTCGATGGCGCCCTTAGACCTTCTGCCGCCGAACTGCTTTGCCTGCCACTGTTCCAGCAGAAG [서열번호 301]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 301에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 301의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 302로 제공된다:
AUGGCCUGCCGGAAGUUCUGUAGAGUGUACGGCGGACAGGGGCGCAGAAAAGAGGAAGCCGUUCCUCCUGAGACAAAGCCCAGCAGAGUGUUCCCUCACGGCCCCUUUUACACCCCUGCCGAAGAUGCCUGUCUGGACAGCCCUCCUCCAGAAACACCUAAGCCUAGCCACACCACACCUCCAAGCGAGGCCGAAAGACUGUGCCAUCUGCAAGAGAUUCUGGCCCAGAUGUACGGCAACCAGGACUACCCCAUCGAGGACGAUCCAUCUGCCGAUGCCGCCGACGAUGUGGAUGAAGAUGCCCCUGAUGACGUGGCCUAUCCUGAGGAAUACGCCGAGGAACUGUUCCUGCCUGGCGACGCUACAGGACCUCUGAUCGGAGCCAACGAUCACAUCCCUCCACCUUGUGGCGCUAGCCCUCCUGGCAUCAGAAGAAGAAGCAGGGACGAGAUCGGCGCCACCGGCUUUACAGCCGAAGAACUGGACGCCAUGGACAGAGAAGCCGCCAGAGCCAUUUCUAGAGGCGGCAAGCCUCCUAGCACCAUGGCCAAACUGGUUACCGGCAUGGGCUUCACCAUUCACGGCGCUCUGACACCUGGCUCUGAGGGCUGUGUGUUCGACAGCUCUCACCCCGACUAUCCCCAGCGCGUGAUCGUGAAAGCCGGCUGGUACACAAGCACAAGCCACGAGGCCAGACUGCUGCGGAGACUGGAUCAUCCUGCCAUCCUGCCUCUGCUGGAUCUGCAUGUGGUGUCCGGCGUGACAUGUCUGGUGCUGCCUAAGUACCAGGCCGACCUGUACACCUACCUGAGCAGAAGGCUGAACCCUCUGGGCAGACCUCAGAUUGCCGCUGUGUCAAGACAGCUGCUGAGCGCUGUGGACUACAUCCACAGACAGGGCAUCAUCCACCGGGACAUCAAGACCGAGAAUAUCUUCAUCAACACGCCCGAGGACAUCUGCCUGGGCGAUUUUGGCGCCGCUUGCUUCGUGCAAGGCAGCAGAAGCAGCCCCUUUCCUUAUGGAAUCGCCGGCACCAUCGACACAAACGCCCCUGAAGUUCUGGCCGGCGAUCCUUACACCACCACCGUGGAUAUUUGGAGCGCCGGACUGGUCAUCUUCGAGACAGCCGUGCAUAACGCCAGCCUGUUCUCUGCCCCUAGAGGCCCUAAAAGAGGCCCCUGCGAUAGCCAGAUCACCCGGAUCAUUAGACAGGCCCAGGUGCACGUGGACGAGUUCUCUCCACAUCCUGAGAGCCGGCUGACCAGCCGGUACAGAUCUAGAGCCGCCGGAAACAACCGGCCUCCAUACACAAGACCUGCCUGGACACGGUACUACAAGAUGGACAUCGACGUGGAAUACCUCGUGUGCAAGGCCCUGACCUUCGAUGGCGCCCUUAGACCUUCUGCCGCCGAACUGCUUUGCCUGCCACUGUUCCAGCAGAAG [서열번호 302]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 302에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 HSV2 US1(A0A290Y3Z3; A0A290Y3Z3_HHV2 US1 인간 헤르페스바이러스 2), 또는 그의 동원체이다. HSV2 US1의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 303으로 나타낸다:
MADIPPDPPALNTTPVNHAPPSPPPGSRKRRRPVLPSSSESEGKPDTESESSSTESSEDEAGDLRGGRRRSPRELGGRYFLDLSAESTTGTESEGTGPSDDDDDDASDGWLVDTPPRKSKRPRINLRLTSSPDRRAGVVFPEVWRNDRPIRAAQPQAPAQSSGDRAAAPRRSARQAQMRSGAAWTLDLHYIRQCVNQLFRILRAAPNPPGSANRLRHLVRDCYLMGYCRTRLGPRTWGRLLQISGGTWDVRLRNAIREVEARFEPAAEPVCELPCLNARRYGPECDVGNLETNGGSTSDDEISDATDSDDTLASHSDTEGGPSPAGRENPESASGGAIAARLECEFGTFDWTSEEGSQPWLSAVVADTSSAERSGLPAPGACRATEAPEREDGCRKMRFPAACPYPCGHTFLRP [서열번호 303]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 303에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 HSV2 US1 폴리펩티드는 다음과 같은 서열번호 304의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGCAGACATCCCCCCGGACCCGCCCGCGCTCAACACGACGCCTGTGAATCATGCTCCCCCATCCCCGCCCCCGGGTTCACGGAAGCGCAGACGCCCCGTCCTCCCCAGCTCGTCGGAATCTGAGGGTAAGCCCGACACAGAATCGGAATCCTCCTCGACCGAGTCGTCCGAGGATGAGGCGGGAGACCTACGCGGCGGGCGCCGTCGCTCCCCGCGGGAGCTCGGGGGGAGGTATTTTTTGGATCTGTCGGCAGAATCGACCACGGGGACGGAATCGGAGGGAACGGGGCCGTCGGACGACGATGATGATGATGCGTCAGACGGCTGGTTGGTTGACACCCCCCCCCGTAAATCCAAGCGACCCCGAATCAACCTGCGATTAACGAGCTCCCCCGACCGGCGCGCGGGTGTGGTTTTCCCCGAGGTGTGGAGAAACGACAGACCTATCCGCGCGGCGCAACCCCAGGCCCCGGCCCAGTCTTCCGGGGATCGCGCAGCCGCACCGCGGCGCTCTGCTCGCCAGGCCCAGATGCGGAGCGGAGCCGCCTGGACGCTTGATCTGCATTACATACGCCAGTGCGTCAACCAGCTCTTTCGGATCCTGCGTGCCGCCCCGAACCCGCCCGGCAGCGCCAACCGCCTGCGCCACCTGGTGCGAGACTGCTACCTCATGGGCTACTGCCGGACCCGCCTGGGGCCGCGCACGTGGGGCCGCCTGCTGCAGATCTCGGGCGGAACCTGGGACGTGCGCCTGCGAAACGCAATCCGGGAGGTCGAGGCGCGTTTTGAACCCGCCGCCGAGCCCGTGTGCGAGCTGCCCTGTCTGAACGCCAGGCGTTACGGCCCCGAGTGTGATGTTGGCAATCTCGAGACCAACGGCGGCTCGACGAGCGATGATGAGATATCGGATGCGACGGACTCGGACGATACCCTCGCGTCCCATTCCGACACGGAGGGGGGGCCCTCCCCGGCCGGCCGGGAGAACCCGGAATCCGCGTCCGGCGGGGCTATCGCGGCTCGGCTGGAGTGTGAGTTTGGGACGTTTGACTGGACGTCCGAGGAGGGCTCCCAGCCCTGGCTGTCCGCGGTGGTCGCCGATACCAGCTCCGCCGAACGCTCTGGCCTACCCGCCCCGGGCGCGTGTCGCGCAACGGAAGCCCCAGAACGCGAGGACGGGTGCCGAAAAATGCGCTTCCCCGCCGCCTGCCCCTATCCCTGCGGCCACACATTTCTCCGGCCA [서열번호 304]
따라서, 바람직하게는 상기 HSV2 US1 폴리펩티드는 실질적으로 서열번호 304에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 HSV2 US1 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 305로 제공된다:
ATGGCCGACATTCCTCCTGATCCTCCAGCTCTGAACACCACACCTGTGAATCACGCCCCTCCATCTCCACCACCTGGCAGCAGAAAGAGAAGAAGGCCTGTCCTGCCTAGCAGCAGCGAGTCTGAGGGCAAGCCTGATACAGAGAGCGAGAGCAGCAGCACAGAGAGCAGCGAGGACGAAGCTGGCGATCTTAGAGGCGGCAGAAGAAGAAGCCCCAGAGAACTCGGCGGCAGATACTTCCTGGATCTGAGCGCCGAGAGCACCACCGGCACTGAATCTGAAGGCACAGGCCCCAGCGACGACGATGACGATGATGCCTCTGATGGCTGGCTGGTGGACACCCCTCCTAGAAAGTCCAAGCGGCCCAGAATCAACCTGCGGCTGACAAGCTCTCCTGATCGCAGAGCTGGCGTGGTGTTCCCCGAAGTGTGGCGGAACGACAGACCTATCAGAGCCGCTCAGCCTCAGGCTCCTGCTCAGTCTAGCGGAGATAGAGCTGCCGCTCCTAGAAGATCTGCCAGACAGGCCCAGATGAGAAGCGGAGCTGCTTGGACACTGGACCTGCACTACATCCGGCAGTGCGTGAACCAGCTGTTCCGGATCCTTCGGGCTGCCCCTAATCCACCTGGCTCCGCCAATAGACTGAGACACCTTGTGCGGGACTGCTACCTGATGGGCTACTGCAGAACAAGACTGGGCCCCAGAACATGGGGCAGACTGCTGCAAATCTCTGGCGGCACATGGGACGTGCGGCTGAGAAACGCCATTAGAGAGGTGGAAGCCAGATTCGAGCCAGCCGCTGAGCCTGTGTGTGAACTGCCTTGTCTGAACGCTCGGAGATACGGCCCCGAGTGTGATGTGGGCAACCTGGAAACAAATGGCGGCAGCACCTCCGACGACGAGATCTCTGATGCCACCGACAGCGACGATACACTGGCCAGCCACAGCGATACAGAAGGCGGACCATCTCCTGCCGGAAGAGAGAATCCTGAGTCTGCCTCTGGCGGAGCTATCGCCGCAAGACTGGAATGCGAGTTCGGCACCTTCGACTGGACAAGCGAGGAAGGCTCTCAGCCTTGGCTGTCTGCTGTGGTGGCCGATACCTCTAGCGCCGAAAGATCTGGACTTCCTGCTCCTGGCGCCTGCAGAGCTACAGAAGCTCCTGAAAGAGAGGACGGCTGCAGAAAGATGCGGTTCCCTGCCGCCTGTCCTTATCCTTGCGGCCACACATTTCTGCGGCCT [서열번호 305]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 305에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 305의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 306으로 제공된다:
AUGGCCGACAUUCCUCCUGAUCCUCCAGCUCUGAACACCACACCUGUGAAUCACGCCCCUCCAUCUCCACCACCUGGCAGCAGAAAGAGAAGAAGGCCUGUCCUGCCUAGCAGCAGCGAGUCUGAGGGCAAGCCUGAUACAGAGAGCGAGAGCAGCAGCACAGAGAGCAGCGAGGACGAAGCUGGCGAUCUUAGAGGCGGCAGAAGAAGAAGCCCCAGAGAACUCGGCGGCAGAUACUUCCUGGAUCUGAGCGCCGAGAGCACCACCGGCACUGAAUCUGAAGGCACAGGCCCCAGCGACGACGAUGACGAUGAUGCCUCUGAUGGCUGGCUGGUGGACACCCCUCCUAGAAAGUCCAAGCGGCCCAGAAUCAACCUGCGGCUGACAAGCUCUCCUGAUCGCAGAGCUGGCGUGGUGUUCCCCGAAGUGUGGCGGAACGACAGACCUAUCAGAGCCGCUCAGCCUCAGGCUCCUGCUCAGUCUAGCGGAGAUAGAGCUGCCGCUCCUAGAAGAUCUGCCAGACAGGCCCAGAUGAGAAGCGGAGCUGCUUGGACACUGGACCUGCACUACAUCCGGCAGUGCGUGAACCAGCUGUUCCGGAUCCUUCGGGCUGCCCCUAAUCCACCUGGCUCCGCCAAUAGACUGAGACACCUUGUGCGGGACUGCUACCUGAUGGGCUACUGCAGAACAAGACUGGGCCCCAGAACAUGGGGCAGACUGCUGCAAAUCUCUGGCGGCACAUGGGACGUGCGGCUGAGAAACGCCAUUAGAGAGGUGGAAGCCAGAUUCGAGCCAGCCGCUGAGCCUGUGUGUGAACUGCCUUGUCUGAACGCUCGGAGAUACGGCCCCGAGUGUGAUGUGGGCAACCUGGAAACAAAUGGCGGCAGCACCUCCGACGACGAGAUCUCUGAUGCCACCGACAGCGACGAUACACUGGCCAGCCACAGCGAUACAGAAGGCGGACCAUCUCCUGCCGGAAGAGAGAAUCCUGAGUCUGCCUCUGGCGGAGCUAUCGCCGCAAGACUGGAAUGCGAGUUCGGCACCUUCGACUGGACAAGCGAGGAAGGCUCUCAGCCUUGGCUGUCUGCUGUGGUGGCCGAUACCUCUAGCGCCGAAAGAUCUGGACUUCCUGCUCCUGGCGCCUGCAGAGCUACAGAAGCUCCUGAAAGAGAGGACGGCUGCAGAAAGAUGCGGUUCCCUGCCGCCUGUCCUUAUCCUUGCGGCCACACAUUUCUGCGGCCU [서열번호 306]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 306에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 CSFV NPro(P19712; 게놈 폴리단백질 고전적 돼지 열병 바이러스(알포트(Alfort) 바이러스주)), 또는 그의 동원체이다. CSFV NPro의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 307로 나타낸다:
MELNHFELLYKTSKQKPVGVEEPVYDTAGRPLFGNPSEVHPQSTLKLPHDRGRGDIRTTLRDLPRKGDCRSGNHLGPVSGIYIKPGPVYYQDYTGPVYHRAPLEFFDEAQFCEVTKRIGRVTGSDGKLYHIYVCVDGCILLKLAKRGTPRTLKWIRNFTNCPLWVTSC [서열번호 307]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 307에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 CSFV NPro 폴리펩티드는 다음과 같은 서열번호 308의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGAGTTGAATCATTTTGAATTATTATACAAAACAAGCAAACAAAAACCAGTGGGAGTGGAGGAACCGGTGTATGACACCGCGGGGAGACCACTATTTGGGAACCCAAGTGAGGTACACCCACAATCAACGCTGAAGCTGCCACACGACAGGGGGAGAGGAGATATCAGAACAACACTGAGGGACCTACCCAGGAAAGGTGACTGTAGGAGTGGCAACCATCTAGGCCCGGTTAGTGGGATATACATAAAGCCCGGCCCTGTCTACTATCAGGACTACACGGGCCCAGTCTATCACAGAGCTCCTTTAGAGTTCTTTGATGAGGCCCAGTTCTGCGAGGTGACTAAGAGAATAGGCAGGGTCACGGGTAGTGATGGTAAGCTTTACCACATATATGTGTGCGTCGATGGTTGCATACTGCTGAAATTAGCCAAAAGGGGCACACCCAGAACCCTAAAGTGGATTAGGAACTTCACCAACTGTCCATTATGGGTAACCAGTTGC [서열번호 308]
따라서, 바람직하게는 상기 CSFV NPro 폴리펩티드는 실질적으로 서열번호 308에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 CSFV NPro 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 309로 제공된다:
ATGGAACTGAACCACTTCGAGCTGCTGTACAAGACCAGCAAGCAGAAACCCGTGGGCGTCGAGGAACCCGTGTATGATACAGCTGGCAGACCCCTGTTCGGCAACCCCTCTGAAGTGCACCCTCAGAGCACACTGAAGCTGCCCCACGATAGAGGCAGAGGCGACATCAGAACCACACTGCGGGACCTGCCTAGAAAGGGCGATTGCAGAAGCGGCAATCATCTGGGCCCTGTGTCCGGCATCTACATCAAGCCTGGACCAGTGTACTACCAGGACTACACAGGCCCCGTGTACCACAGAGCCCCTCTGGAATTCTTCGACGAGGCCCAGTTCTGCGAAGTGACCAAGAGAATCGGCAGAGTGACCGGCTCCGACGGCAAGCTGTACCACATCTACGTGTGCGTGGACGGCTGCATCCTGCTGAAGCTGGCCAAGAGAGGCACCCCTAGAACACTGAAGTGGATCCGGAACTTCACCAACTGTCCTCTGTGGGTCACCAGCTGC [서열번호 309]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 309에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 309의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 310으로 제공된다:
AUGGAACUGAACCACUUCGAGCUGCUGUACAAGACCAGCAAGCAGAAACCCGUGGGCGUCGAGGAACCCGUGUAUGAUACAGCUGGCAGACCCCUGUUCGGCAACCCCUCUGAAGUGCACCCUCAGAGCACACUGAAGCUGCCCCACGAUAGAGGCAGAGGCGACAUCAGAACCACACUGCGGGACCUGCCUAGAAAGGGCGAUUGCAGAAGCGGCAAUCAUCUGGGCCCUGUGUCCGGCAUCUACAUCAAGCCUGGACCAGUGUACUACCAGGACUACACAGGCCCCGUGUACCACAGAGCCCCUCUGGAAUUCUUCGACGAGGCCCAGUUCUGCGAAGUGACCAAGAGAAUCGGCAGAGUGACCGGCUCCGACGGCAAGCUGUACCACAUCUACGUGUGCGUGGACGGCUGCAUCCUGCUGAAGCUGGCCAAGAGAGGCACCCCUAGAACACUGAAGUGGAUCCGGAACUUCACCAACUGUCCUCUGUGGGUCACCAGCUGC [서열번호 310]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 310에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 BDV Npro(A0A290YXI0; 오토프로테아제(Autoprotease) p20 보더 질환(Border disease) 바이러스), 또는 그의 동원체이다. BDV Npro의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 311로 나타낸다:
MELNKFELLYKTSKQRPVGAVEPVYDSAGNPLYGERTTVHPQATLKLPHHRGVAEVITTLKDLPRKGDCRSGNHRGPVSGIYIKPGPVIYQDYKRPVYHRAPLEQFTKVQICEATKRVGRVTGSDGKLYHLYVCMDGCILLKLASRTVNAVLKWTHNTLDCPLWVTSC [서열번호 311]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 311에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 BDV Npro 폴리펩티드는 다음과 같은 서열번호 312의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGAGTTGAATAAGTTTGAACTTTTATACAAAACAAGTAAACAAAGACCAGTAGGGGCTGTTGAACCAGTTTATGACTCAGCGGGTAACCCCCTATATGGTGAAAGAACAACAGTACACCCGCAAGCCACTCTGAAACTACCACATCACAGGGGAGTAGCCGAGGTGATAACAACCCTGAAGGATTTGCCCAGGAAAGGAGACTGCAGGAGTGGAAACCATCGAGGCCCAGTGAGTGGTATATACATCAAGCCAGGTCCAGTCATATACCAGGATTACAAGAGACCGGTGTACCACAGGGCTCCTCTGGAGCAGTTCACGAAGGTACAAATCTGTGAGGCTACGAAAAGGGTGGGGAGAGTCACTGGCAGCGATGGCAAATTGTACCACCTATACGTTTGCATGGATGGTTGCATATTGCTGAAACTGGCAAGCAGGACCGTGAATGCAGTGCTAAAATGGACACATAACACTCTGGACTGTCCACTTTGGGTTACAAGCTGC [서열번호 312]
따라서, 바람직하게는 상기 BDV Npro 폴리펩티드는 실질적으로 서열번호 312에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 BDV Npro 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 313으로 제공된다:
ATGGAACTGAACAAGTTCGAGCTGCTGTACAAGACCAGCAAGCAGAGGCCTGTGGGAGCCGTGGAACCTGTGTATGATAGCGCCGGCAATCCCCTGTACGGCGAGAGAACAACAGTGCACCCTCAGGCCACACTGAAGCTGCCTCATCATAGAGGCGTGGCCGAAGTGATCACAACCCTGAAGGACCTGCCTCGGAAGGGCGATTGCAGAAGCGGCAATCACAGAGGCCCTGTGTCCGGCATCTACATCAAGCCCGGACCTGTGATCTACCAGGACTACAAGCGGCCCGTGTACCACAGAGCACCCCTGGAACAGTTCACCAAGGTGCAGATTTGCGAGGCCACCAAGCGCGTGGGAAGAGTGACAGGCTCTGACGGCAAGCTGTACCACCTGTACGTGTGCATGGACGGCTGCATCCTGCTGAAACTGGCCAGCAGAACCGTGAACGCCGTGCTGAAGTGGACCCACAACACCCTGGATTGCCCTCTGTGGGTCACCAGCTGT [서열번호 313]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 313에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 313의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 314로 제공된다:
AUGGAACUGAACAAGUUCGAGCUGCUGUACAAGACCAGCAAGCAGAGGCCUGUGGGAGCCGUGGAACCUGUGUAUGAUAGCGCCGGCAAUCCCCUGUACGGCGAGAGAACAACAGUGCACCCUCAGGCCACACUGAAGCUGCCUCAUCAUAGAGGCGUGGCCGAAGUGAUCACAACCCUGAAGGACCUGCCUCGGAAGGGCGAUUGCAGAAGCGGCAAUCACAGAGGCCCUGUGUCCGGCAUCUACAUCAAGCCCGGACCUGUGAUCUACCAGGACUACAAGCGGCCCGUGUACCACAGAGCACCCCUGGAACAGUUCACCAAGGUGCAGAUUUGCGAGGCCACCAAGCGCGUGGGAAGAGUGACAGGCUCUGACGGCAAGCUGUACCACCUGUACGUGUGCAUGGACGGCUGCAUCCUGCUGAAACUGGCCAGCAGAACCGUGAACGCCGUGCUGAAGUGGACCCACAACACCCUGGAUUGCCCUCUGUGGGUCACCAGCUGU [서열번호 314]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 314에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 소 RV NS1(Q8JZ13; 비-구조 단백질 1 소 로타바이러스 A), 또는 그의 동원체이다. 소 RV NS1의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 315로 나타낸다:
MATFKDACYHYKKLNKLNSLVLKLGANDEWRPAPVTKYKGWCLDCCQYTNLTYCRGCALYHVCQWCSQYNRCFLDEEPHLLRMRTFKDVVTKEDIEGLLTMYETLFPINEKLVNKFINSVKQRKCRNEYLLEWYNHLLMPITLQALTINLEDNVYYMFGYYDCMEHENQTPFQFVNLLEKYDKLLLDDRNFHRMSHLPVILQQEYALRYFSKSRFLSKGKKRLSRSDFSDNLMEDRHSPTSLMQVVRNCISIHIDDCEWNKACTLIVDARNYISIMNSSYTEHYSVSQRCKLFTKYKFGIVSKLVKPNYIFSSHESCALNVHNCKWCQINNHYKVWEDFRLRKIYNNVMDFIRALVKSNVNVGHCSSQESVYKYVPDLFLICKTEKWSEAVEMLFNYLEPVNVNGTEYVLLDYEVNWEVRGLVMQNMDGKVPRILNMNDTKKILSAMIFDWFDTRYMRETPMTTSTTNQLRTLNKRNELIDEYDLELSDVE [서열번호 315]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 315에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하느 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 소 RV NS1 폴리펩티드는 다음과 같은 서열번호 316의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGCGACTTTTAAGGACGCTTGTTATCATTATAAAAAGTTGAATAAATTAAATAGTTTAGTGCTCAAACTAGGAGCAAATGATGAATGGAGGCCAGCACCAGTGACAAAATATAAAGGATGGTGTTTAGATTGTTGTCAATATACAAATTTGACATATTGCAGAGGGTGCGCTCTATACCATGTATGTCAGTGGTGCAGTCAGTATAACAGGTGTTTCTTAGATGAAGAACCCCATTTGCTGAGAATGCGAACATTTAAAGATGTAGTAACAAAAGAAGATATAGAAGGACTGCTAACCATGTATGAAACGTTGTTTCCAATAAATGAAAAGTTAGTGAATAAATTCATAAACTCTGTGAAGCAGCGTAAGTGTAGGAATGAGTATTTGTTAGAATGGTATAACCACTTACTAATGCCAATAACATTGCAAGCATTGACTATAAATCTTGAGGATAATGTATATTATATGTTTGGATACTATGATTGCATGGAGCATGAAAACCAAACACCATTCCAATTTGTTAACCTACTAGAAAAATATGATAAATTGCTACTAGATGATAGAAATTTCCATAGAATGTCACACTTACCAGTAATATTGCAACAAGAGTATGCGTTGAGATATTTTTCAAAATCAAGATTTTTAAGTAAAGGGAAGAAAAGATTGAGTAGGAGTGATTTCTCAGATAATCTTATGGAAGATAGACATAGTCCAACATCATTAATGCAAGTGGTACGTAACTGCATCAGTATACACATAGATGATTGTGAATGGAATAAAGCGTGTACGCTTATAGTTGATGCTAGAAATTATATTAGTATTATGAATTCATCGTATACTGAGCATTACAGTGTGTCACAAAGATGTAAACTGTTCACTAAGTATAAATTTGGGATTGTATCAAAATTGGTGAAACCGAATTACATTTTTTCTAGCCATGAATCATGCGCATTAAACGTACACAATTGTAAATGGTGTCAGATCAATAACCATTACAAAGTGTGGGAAGATTTTAGACTTAGGAAAATATACAATAATGTAATGGATTTTATCAGGGCACTTGTGAAATCGAATGTAAACGTTGGACATTGTTCATCACAGGAATCAGTGTATAAGTATGTACCGGATTTATTTTTAATTTGTAAAACGGAAAAATGGAGCGAAGCTGTCGAAATGTTATTTAATTATCTAGAACCAGTGAACGTAAATGGAACGGAGTATGTATTATTAGACTATGAAGTGAACTGGGAAGTGAGGGGACTAGTCATGCAAAACATGGACGGGAAAGTACCAAGAATTTTGAATATGAATGATACAAAGAAGATACTGAGTGCAATGATATTTGACTGGTTTGACACAAGATATATGAGAGAAACACCAATGACGACGTCAACAACAAACCAACTTCGAACACTGAACAAAAGGAATGAGCTCATAGATGAGTACGATTTAGAACTTTCAGATGTTGAA [서열번호 316]
따라서, 바람직하게는 상기 소 RV NS1 폴리펩티드는 실질적으로 서열번호 316에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 소 RV NS1 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 317로 제공된다:
ATGGCCACCTTCAAGGACGCCTGCTACCACTACAAGAAGCTGAACAAGCTGAATAGCCTGGTGCTGAAGCTGGGCGCCAATGATGAATGGCGACCTGCTCCTGTGACCAAGTACAAAGGCTGGTGCCTGGACTGCTGCCAGTACACCAATCTGACCTACTGCAGAGGCTGCGCCCTGTACCACGTCTGTCAGTGGTGCAGCCAGTACAACCGGTGCTTCCTGGACGAGGAACCCCATCTGCTGCGGATGCGGACCTTTAAGGACGTGGTCACCAAAGAGGACATCGAGGGCCTGCTGACTATGTACGAGACACTGTTCCCCATCAACGAGAAGCTGGTCAACAAGTTCATCAACAGCGTGAAGCAGCGGAAGTGCCGGAACGAGTACCTGCTGGAATGGTACAATCATCTGCTGATGCCCATCACACTGCAGGCCCTGACCATCAACCTGGAAGATAACGTGTACTACATGTTCGGCTACTACGACTGCATGGAACACGAGAATCAGACCCCTTTCCAGTTCGTGAACCTGCTCGAGAAGTACGACAAGCTGCTGCTGGACGACCGGAACTTCCACCGGATGTCTCATCTGCCCGTGATCCTGCAGCAAGAGTACGCCCTGCGGTACTTCAGCAAGAGCCGGTTTCTGAGCAAGGGCAAGAAGCGGCTGAGCAGAAGCGACTTCAGCGACAACCTGATGGAAGATCGGCACAGCCCCACCAGCCTGATGCAGGTCGTCAGAAACTGCATCAGCATCCACATCGACGACTGTGAATGGAACAAGGCCTGCACACTGATCGTGGACGCCCGCAACTACATCTCCATCATGAACAGCAGCTACACCGAGCACTACAGCGTGTCCCAGCGGTGCAAGCTGTTCACAAAGTACAAGTTCGGCATCGTGTCCAAGCTCGTGAAGCCCAATTACATCTTCAGCAGCCACGAGAGCTGTGCCCTGAACGTGCACAACTGCAAGTGGTGCCAGATCAACAATCACTACAAAGTGTGGGAAGATTTCCGGCTGCGGAAGATCTACAACAACGTGATGGACTTCATCCGCGCTCTGGTCAAGAGCAACGTGAACGTGGGCCACTGCAGCAGCCAAGAGTCCGTGTACAAATACGTGCCCGACCTGTTCCTGATCTGCAAGACCGAGAAGTGGAGCGAGGCCGTGGAAATGCTGTTCAACTACCTGGAACCTGTGAACGTCAACGGCACCGAGTACGTCCTGCTGGACTACGAAGTGAACTGGGAAGTGCGGGGCCTCGTGATGCAGAACATGGATGGCAAGGTGCCCCGGATCCTGAACATGAACGACACCAAGAAAATCCTGAGCGCCATGATCTTCGATTGGTTCGACACCCGGTACATGCGCGAGACACCTATGACCACCAGCACCACCAACCAGCTGCGGACCCTGAACAAGAGAAACGAGCTGATCGACGAGTACGACCTGGAACTGAGCGACGTGGAA [서열번호 317]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 317에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 317의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 318로 제공된다:
AUGGCCACCUUCAAGGACGCCUGCUACCACUACAAGAAGCUGAACAAGCUGAAUAGCCUGGUGCUGAAGCUGGGCGCCAAUGAUGAAUGGCGACCUGCUCCUGUGACCAAGUACAAAGGCUGGUGCCUGGACUGCUGCCAGUACACCAAUCUGACCUACUGCAGAGGCUGCGCCCUGUACCACGUCUGUCAGUGGUGCAGCCAGUACAACCGGUGCUUCCUGGACGAGGAACCCCAUCUGCUGCGGAUGCGGACCUUUAAGGACGUGGUCACCAAAGAGGACAUCGAGGGCCUGCUGACUAUGUACGAGACACUGUUCCCCAUCAACGAGAAGCUGGUCAACAAGUUCAUCAACAGCGUGAAGCAGCGGAAGUGCCGGAACGAGUACCUGCUGGAAUGGUACAAUCAUCUGCUGAUGCCCAUCACACUGCAGGCCCUGACCAUCAACCUGGAAGAUAACGUGUACUACAUGUUCGGCUACUACGACUGCAUGGAACACGAGAAUCAGACCCCUUUCCAGUUCGUGAACCUGCUCGAGAAGUACGACAAGCUGCUGCUGGACGACCGGAACUUCCACCGGAUGUCUCAUCUGCCCGUGAUCCUGCAGCAAGAGUACGCCCUGCGGUACUUCAGCAAGAGCCGGUUUCUGAGCAAGGGCAAGAAGCGGCUGAGCAGAAGCGACUUCAGCGACAACCUGAUGGAAGAUCGGCACAGCCCCACCAGCCUGAUGCAGGUCGUCAGAAACUGCAUCAGCAUCCACAUCGACGACUGUGAAUGGAACAAGGCCUGCACACUGAUCGUGGACGCCCGCAACUACAUCUCCAUCAUGAACAGCAGCUACACCGAGCACUACAGCGUGUCCCAGCGGUGCAAGCUGUUCACAAAGUACAAGUUCGGCAUCGUGUCCAAGCUCGUGAAGCCCAAUUACAUCUUCAGCAGCCACGAGAGCUGUGCCCUGAACGUGCACAACUGCAAGUGGUGCCAGAUCAACAAUCACUACAAAGUGUGGGAAGAUUUCCGGCUGCGGAAGAUCUACAACAACGUGAUGGACUUCAUCCGCGCUCUGGUCAAGAGCAACGUGAACGUGGGCCACUGCAGCAGCCAAGAGUCCGUGUACAAAUACGUGCCCGACCUGUUCCUGAUCUGCAAGACCGAGAAGUGGAGCGAGGCCGUGGAAAUGCUGUUCAACUACCUGGAACCUGUGAACGUCAACGGCACCGAGUACGUCCUGCUGGACUACGAAGUGAACUGGGAAGUGCGGGGCCUCGUGAUGCAGAACAUGGAUGGCAAGGUGCCCCGGAUCCUGAACAUGAACGACACCAAGAAAAUCCUGAGCGCCAUGAUCUUCGAUUGGUUCGACACCCGGUACAUGCGCGAGACACCUAUGACCACCAGCACCACCAACCAGCUGCGGACCCUGAACAAGAGAAACGAGCUGAUCGACGAGUACGACCUGGAACUGAGCGACGUGGAA [서열번호 318]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 318에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 소 RV NS2(Q86505; 비-구조 단백질 2 소 로타바이러스 A), 또는 그의 동원체이다. 소 RV NS2의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 319로 나타낸다:
MAELACFCYPHLESDTYRFIPFNSLAIKCMLTAKVDKKDQDKFYNSIIYGIAPPPQFKKRYNTNDNSRGMNYETPMFNKVAVLICEALNSIKVTQSDVASVLSKVISVRHLENLVLRRENHQDVLFHSKELLLRSVLIAIGHSKEIETTATAEGGEVVFQNAAFTMWKLTYLEHRLMPILDQNFIEYKITVNEDKPISESHVRELIAELRWQYNKFAVITHGKGHYRVVKYSSVANHADRVYATFKSNNKNGNVIEFNLLDQRIIWQNWYAFTSSMKQGNTLEICKKLLFQKMKRESNPFKGLSTDRKMDEVSQIGI [서열번호 319]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 319에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 소 RV NS2 폴리펩티드는 다음과 같은 서열번호 320의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGCTGAGCTAGCTTGCTTTTGTTATCCCCATTTGGAGAGCGATACGTATAGATTCATTCCATTTAACAGTTTAGCTATAAAATGTATGTTGACAGCAAAAGTGGACAAAAAAGATCAGGATAAGTTTTACAATTCAATAATTTATGGCATTGCACCACCGCCACAGTTCAAAAAACGTTATAACACAAATGATAATTCGAGAGGAATGAATTATGAAACTCCAATGTTTAATAAAGTGGCGGTATTAATTTGTGAAGCGTTGAATTCAATTAAAGTTACTCAATCTGATGTTGCGAGTGTACTTTCAAAAGTAATTTCTGTAAGACATTTAGAGAATTTGGTACTGAGAAGAGAGAACCATCAGGACGTGCTTTTCCATTCAAAAGAGTTGTTGCTGAGATCAGTACTAATAGCTATTGGTCACTCAAAAGAAATTGAAACAACTGCCACTGCTGAAGGAGGGGAAGTAGTTTTTCAAAATGCAGCTTTTACAATGTGGAAACTGACATACCTGGAGCATAGACTAATGCCAATTTTGGATCAAAATTTTATCGAATATAAAATAACAGTGAATGAAGATAAACCAATTTCAGAATCACATGTAAGAGAACTCATTGCTGAATTGCGGTGGCAATACAACAAATTTGCAGTAATTACACATGGTAAAGGTCACTACAGAGTTGTAAAATATTCATCAGTTGCGAATCATGCAGATAGAGTTTACGCTACTTTCAAGAGCAATAATAAGAATGGGAATGTGATAGAGTTTAATCTACTTGATCAAAGAATAATATGGCAGAACTGGTATGCGTTTACATCCTCAATGAAACAAGGCAACACTCTTGAAATATGCAAGAAACTACTGTTCCAAAAGATGAAGCGAGAAAGTAATCCGTTTAAGGGACTGTCAACTGATAGAAAGATGGATGAGGTCTCTCAAATAGGAATT [서열번호 320]
따라서, 바람직하게는 상기 소 RV NS2 폴리펩티드는 실질적으로 서열번호 320에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 소 RV NS2 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 321로 제공된다:
ATGGCCGAGCTGGCCTGCTTTTGTTACCCTCACCTGGAAAGCGATACCTACCGGTTCATCCCCTTCAACAGCCTGGCCATCAAGTGCATGCTGACCGCCAAGGTGGACAAGAAGGACCAGGACAAGTTCTACAACAGCATCATCTACGGAATCGCCCCTCCACCTCAGTTCAAGAAGCGGTACAACACCAACGACAACAGCCGGGGCATGAACTACGAGACACCCATGTTCAACAAGGTGGCCGTGCTGATCTGCGAGGCCCTGAACTCCATCAAAGTGACCCAGTCCGATGTGGCCAGCGTGCTGAGCAAAGTGATCTCTGTGCGGCACCTCGAGAACCTGGTGCTGCGGAGAGAAAACCACCAGGACGTGCTGTTCCACAGCAAAGAGCTGCTGCTGAGATCTGTGCTGATCGCCATCGGCCACTCCAAAGAGATCGAGACAACCGCCACAGCCGAAGGCGGAGAGGTGGTGTTTCAGAATGCCGCCTTCACCATGTGGAAGCTGACCTACCTGGAACACCGGCTGATGCCCATCCTGGACCAGAACTTCATCGAGTACAAGATCACCGTGAACGAGGACAAGCCCATCAGCGAGTCTCACGTGCGGGAACTGATTGCCGAGCTGCGGTGGCAGTACAACAAGTTCGCCGTGATCACACACGGCAAGGGCCACTACAGAGTGGTCAAGTACAGCAGCGTGGCCAACCACGCCGATAGAGTGTACGCCACCTTCAAGAGCAACAACAAGAACGGCAACGTGATCGAGTTCAACCTGCTGGACCAGCGGATCATCTGGCAGAATTGGTACGCCTTTACCAGCAGCATGAAGCAGGGCAACACCCTGGAAATCTGCAAGAAGCTCCTGTTCCAGAAGATGAAGAGAGAGAGCAACCCCTTCAAGGGCCTGAGCACCGACCGGAAGATGGATGAGGTGTCCCAGATCGGCATC [서열번호 321]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 321에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 321의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 322로 제공된다:
AUGGCCGAGCUGGCCUGCUUUUGUUACCCUCACCUGGAAAGCGAUACCUACCGGUUCAUCCCCUUCAACAGCCUGGCCAUCAAGUGCAUGCUGACCGCCAAGGUGGACAAGAAGGACCAGGACAAGUUCUACAACAGCAUCAUCUACGGAAUCGCCCCUCCACCUCAGUUCAAGAAGCGGUACAACACCAACGACAACAGCCGGGGCAUGAACUACGAGACACCCAUGUUCAACAAGGUGGCCGUGCUGAUCUGCGAGGCCCUGAACUCCAUCAAAGUGACCCAGUCCGAUGUGGCCAGCGUGCUGAGCAAAGUGAUCUCUGUGCGGCACCUCGAGAACCUGGUGCUGCGGAGAGAAAACCACCAGGACGUGCUGUUCCACAGCAAAGAGCUGCUGCUGAGAUCUGUGCUGAUCGCCAUCGGCCACUCCAAAGAGAUCGAGACAACCGCCACAGCCGAAGGCGGAGAGGUGGUGUUUCAGAAUGCCGCCUUCACCAUGUGGAAGCUGACCUACCUGGAACACCGGCUGAUGCCCAUCCUGGACCAGAACUUCAUCGAGUACAAGAUCACCGUGAACGAGGACAAGCCCAUCAGCGAGUCUCACGUGCGGGAACUGAUUGCCGAGCUGCGGUGGCAGUACAACAAGUUCGCCGUGAUCACACACGGCAAGGGCCACUACAGAGUGGUCAAGUACAGCAGCGUGGCCAACCACGCCGAUAGAGUGUACGCCACCUUCAAGAGCAACAACAAGAACGGCAACGUGAUCGAGUUCAACCUGCUGGACCAGCGGAUCAUCUGGCAGAAUUGGUACGCCUUUACCAGCAGCAUGAAGCAGGGCAACACCCUGGAAAUCUGCAAGAAGCUCCUGUUCCAGAAGAUGAAGAGAGAGAGCAACCCCUUCAAGGGCCUGAGCACCGACCGGAAGAUGGAUGAGGUGUCCCAGAUCGGCAUC [서열번호 322]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 322에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 PBoV NP1(D7RF52; 비-구조 단백질 NP-1 돼지 보카바이러스(bocavirus) 1), 또는 그의 동원체이다. PBoV NP1의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 323으로 나타낸다:
MSSARSDTDTGRRGKRSRSRSRSRDRDQAPGLPPKKRDYRRRSGERGSESSPDRSTRGSPSCSTASRTSRVTSATWRRPNDSRDGGKIWGNKNKKNKTNPYEVFSQHMARFKPDKSYCGFYWHSCRMARKGTDYIFTEGMRDFQKRCKDNKCEWKDVREIMFGLKKVLDQGYRNMMYHFRHTQCEKCNYWDEVYKMHLANVSPSETEPQELTDEEILAAAMEVDGTHE [서열번호 323]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 323에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 PBoV NP1 폴리펩티드는 다음과 같은 서열번호 324의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGAGCTCAGCGAGATCCGACACAGACACAGGCAGGAGAGGGAAGCGGTCGAGGAGCCGGTCGAGGAGCCGCGACCGGGACCAAGCACCGGGGCTGCCTCCGAAAAAAAGGGACTATCGCCGTCGGAGTGGGGAGAGAGGCTCGGAGTCCTCACCAGATCGCTCGACGAGGGGGAGCCCATCGTGCTCCACTGCTTCGAGAACATCCCGAGTGACTTCAGCGACATGGAGGAGACCGAATGACTCTCGGGACGGGGGGAAAATATGGGGAAATAAAAATAAAAAGAATAAAACAAACCCTTACGAGGTATTCAGCCAGCACATGGCCAGGTTCAAGCCAGATAAAAGCTATTGTGGCTTCTACTGGCACAGCTGCCGGATGGCTCGTAAGGGCACAGATTATATCTTTACCGAGGGAATGAGGGATTTCCAAAAACGCTGTAAAGACAATAAATGTGAGTGGAAAGATGTCAGGGAGATCATGTTCGGCCTCAAAAAGGTCTTAGATCAGGGATATAGAAATATGATGTATCACTTTAGACATACCCAGTGTGAGAAATGTAACTACTGGGATGAAGTGTATAAAATGCACCTGGCTAACGTGTCTCCTTCTGAAACAGAACCGCAGGAACTGACAGACGAGGAGATATTAGCCGCGGCCATGGAGGTCGATGGCACCCACGAA [서열번호 324]
따라서, 바람직하게는 상기 PBoV NP1 폴리펩티드는 실질적으로 서열번호 324에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 PBoV NP1 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 325로 제공된다:
ATGAGCAGCGCCAGAAGCGATACCGACACAGGCAGACGGGGCAAGAGAAGCAGAAGCCGGTCCAGAAGCAGAGACAGAGATCAGGCTCCTGGCCTGCCTCCTAAGAAGCGGGACTACAGAAGAAGATCCGGCGAGAGAGGCAGCGAGAGCAGCCCTGATAGAAGCACAAGAGGCAGCCCTAGCTGTAGCACCGCCAGCAGAACAAGCAGAGTGACCTCTGCCACTTGGCGGAGGCCCAACGATTCTAGAGATGGCGGCAAGATCTGGGGCAACAAGAACAAGAAGAACAAAACGAACCCCTACGAGGTGTTCAGCCAGCACATGGCCAGATTCAAGCCCGACAAGAGCTACTGCGGCTTCTACTGGCACAGCTGCCGGATGGCCAGAAAGGGCACCGACTACATCTTCACCGAGGGCATGAGAGACTTCCAGAAGCGGTGCAAGGACAACAAGTGCGAGTGGAAGGACGTGCGCGAGATCATGTTCGGCCTGAAGAAGGTGCTGGACCAGGGCTACAGAAACATGATGTACCACTTCCGGCACACCCAGTGCGAGAAGTGCAACTACTGGGACGAAGTGTACAAGATGCACCTGGCCAACGTGTCCCCATCCGAGACAGAGCCTCAAGAGCTGACCGACGAGGAAATTCTGGCCGCTGCCATGGAAGTGGATGGCACACATGAA [서열번호 325]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 325에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 325의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 326으로 제공된다:
AUGAGCAGCGCCAGAAGCGAUACCGACACAGGCAGACGGGGCAAGAGAAGCAGAAGCCGGUCCAGAAGCAGAGACAGAGAUCAGGCUCCUGGCCUGCCUCCUAAGAAGCGGGACUACAGAAGAAGAUCCGGCGAGAGAGGCAGCGAGAGCAGCCCUGAUAGAAGCACAAGAGGCAGCCCUAGCUGUAGCACCGCCAGCAGAACAAGCAGAGUGACCUCUGCCACUUGGCGGAGGCCCAACGAUUCUAGAGAUGGCGGCAAGAUCUGGGGCAACAAGAACAAGAAGAACAAAACGAACCCCUACGAGGUGUUCAGCCAGCACAUGGCCAGAUUCAAGCCCGACAAGAGCUACUGCGGCUUCUACUGGCACAGCUGCCGGAUGGCCAGAAAGGGCACCGACUACAUCUUCACCGAGGGCAUGAGAGACUUCCAGAAGCGGUGCAAGGACAACAAGUGCGAGUGGAAGGACGUGCGCGAGAUCAUGUUCGGCCUGAAGAAGGUGCUGGACCAGGGCUACAGAAACAUGAUGUACCACUUCCGGCACACCCAGUGCGAGAAGUGCAACUACUGGGACGAAGUGUACAAGAUGCACCUGGCCAACGUGUCCCCAUCCGAGACAGAGCCUCAAGAGCUGACCGACGAGGAAAUUCUGGCCGCUGCCAUGGAAGUGGAUGGCACACAUGAA [서열번호 326]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 326에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 E형 간염 Orf3(P69616; 단백질 ORF3 E형 간염 바이러스 유전자형 1), 또는 그의 동원체이다. E형 간염 Orf3의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 327로 나타낸다:
MGSRPCALGLFCCCSSCFCLCCPRHRPVSRLAAVVGGAAAVPAVVSGVTGLILSPSQSPIFIQPTPSPPMSPLRPGLDLVFANPPDHSAPLGVTRPSAPPLPHVVDLPQLGPRR [서열번호 327]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 327에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 E형 간염 Orf3 폴리펩티드는 다음과 같은 서열번호 328의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGGTTCGCGACCATGCGCCCTCGGCCTATTTTGTTGCTGCTCCTCATGTTTTTGCCTATGCTGCCCGCGCCACCGCCCGGTCAGCCGTCTGGCCGCCGTCGTGGGCGGCGCAGCGGCGGTTCCGGCGGTGGTTTCTGGGGTGACCGGGTTGATTCTCAGCCCTTCGCAATCCCCTATATTCATCCAACCAACCCCTTCGCCCCCGATGTCACCGCTGCGGCCGGGGCTGGACCTCGTGTTCGCCAACCCGCCCGACCACTCGGCTCCGCTTGGCGTGACCAGGCCCAGCGCCCCGCCGTTGCCTCACGTCGTAGACCTACCACAGCTGGGGCCGCGCCGC [서열번호 328]
따라서, 바람직하게는 상기 E형 간염 Orf3 폴리펩티드는 실질적으로 서열번호 328에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 E형 간염 Orf3 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 329로 제공된다:
ATGGGCAGCAGACCTTGTGCTCTGGGCCTGTTCTGCTGCTGCAGCTCCTGCTTCTGCCTGTGCTGCCCTAGACACAGACCCGTGTCTAGACTGGCCGCTGTTGTTGGCGGAGCTGCTGCTGTTCCAGCTGTGGTGTCTGGCGTGACAGGCCTGATTCTGAGCCCTTCTCAGAGCCCCATCTTCATCCAGCCTACACCTAGTCCTCCAATGAGCCCTCTGAGGCCTGGACTGGATCTGGTGTTCGCCAATCCTCCTGATCACTCTGCCCCTCTGGGCGTGACAAGACCTTCTGCTCCTCCTCTGCCACACGTGGTGGATCTGCCTCAACTGGGCCCTAGAAGA [서열번호 329]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 329에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 329의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 330으로 제공된다:
AUGGGCAGCAGACCUUGUGCUCUGGGCCUGUUCUGCUGCUGCAGCUCCUGCUUCUGCCUGUGCUGCCCUAGACACAGACCCGUGUCUAGACUGGCCGCUGUUGUUGGCGGAGCUGCUGCUGUUCCAGCUGUGGUGUCUGGCGUGACAGGCCUGAUUCUGAGCCCUUCUCAGAGCCCCAUCUUCAUCCAGCCUACACCUAGUCCUCCAAUGAGCCCUCUGAGGCCUGGACUGGAUCUGGUGUUCGCCAAUCCUCCUGAUCACUCUGCCCCUCUGGGCGUGACAAGACCUUCUGCUCCUCCUCUGCCACACGUGGUGGAUCUGCCUCAACUGGGCCCUAGAAGA [서열번호 330]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 330에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 로타바이러스 NSP1(Q99FX5; 비-구조 단백질 1 로타바이러스 A(RVA/SA11-4F/G3P6[1]) 바이러스주), 또는 그의 동원체이다. [Barro M, Patton JT (2007) Rotavirus NSP1 inhibits expression of type 1 interferon by antagonising the function of interferon regulatory factors IRF3, IRF5 and IRF7. J Virol, 81, 9, 4473-4481]. 상기 IIP는 IRF7의 분해를 유도하는 것으로 여겨진다. 로타바이러스 NSP1의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 331로 나타낸다:
MATFKDACFHYRRLTALNRRLCNIGANSICMPVPDAKIKGWCLECCQIADLTHCYGCSLPHVCKWCVQNRRCFLDNEPHLLKLRTVKHPITKDKLQCIIDLYNIIFPINDKVIRKFERMIKQRKCRNQYKIEWYNHLLLPITLNAAAFKFDENNLYYVFGLYEKSVSDIYAPYRIVNFINEFDKLLLDDINFTRMSNLPIELRNHYAKKYFQLSRLPSSKLKQIYFSDFTKETVIFNTYTKTPGRSIYRNVTEFNWRDELELYSDLKNDKNKLIAAMMTSKYTRFYAHDNNFGRLKMTIFELGHHCQPNYVASNHPGNASDIQYCKWCNIKYFLSKIDWRIRDMYNLLMEFIKDCYKSNVNVGHCSSVENIYPLIKRLIWSLFTNHMDQTIEEVFNHMSPVSVEGTNVIMLILGLNISLYNEIKRTLNVDSIPMVLNLNEFSSIVKSISSKWYNVDELDKLPMSIKSTEELIEMKNSGTLTEEFELLISNSEDDNE [서열번호 331]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 331에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 로타바이러스 NSP1 폴리펩티드는 다음과 같은 서열번호 332의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGCTACTTTTAAAGATGCATGCTTTCATTATCGTAGATTAACTGCTTTAAATCGGAGATTATGCAACATTGGTGCAAATTCTATTTGCATGCCAGTTCCTGATGCGAAGATTAAGGGGTGGTGTTTAGAATGTTGTCAAATAGCTGATTTAACCCATTGTTATGGTTGCTCATTGCCGCATGTTTGCAAATGGTGTGTTCAGAACAGAAGATGCTTCCTTGACAATGAACCTCATTTGCTTAAGCTTAGAACTGTGAAACATCCAATTACCAAAGACAAATTACAGTGTATCATAGACTTGTACAATATAATATTTCCAATTAATGATAAAGTAATTAGAAAATTTGAAAGAATGATAAAGCAAAGAAAATGTAGGAATCAATATAAAATTGAATGGTATAATCATTTGCTGCTCCCAATTACATTAAATGCTGCTGCATTTAAGTTTGATGAAAATAATCTTTATTATGTTTTTGGGTTATATGAGAAATCAGTCAGTGATATATATGCTCCATATAGAATTGTTAACTTTATAAATGAATTTGATAAATTATTGCTTGATGATATTAACTTTACAAGAATGTCCAATCTACCAATAGAGTTGAGAAACCATTATGCAAAGAAATACTTCCAATTATCAAGACTGCCATCATCAAAACTAAAGCAAATTTACTTTTCAGATTTTACTAAAGAAACTGTGATTTTTAATACTTATACAAAAACGCCAGGAAGATCAATATACAGAAATGTAACTGAATTTAATTGGAGAGATGAATTGGAGCTTTATTCTGATTTAAAAAATGATAAGAATAAATTAATTGCTGCAATGATGACGAGTAAGTATACTCGGTTCTATGCTCATGATAATAATTTTGGAAGGTTGAAAATGACAATATTTGAGTTGGGACATCATTGTCAGCCTAACTACGTGGCATCTAATCACCCAGGCAATGCTTCCGATATCCAGTACTGTAAATGGTGTAATATAAAATATTTTCTTAGTAAAATTGATTGGCGGATTCGTGATATGTATAATTTATTGATGGAATTTATTAAGGATTGTTATAAAAGTAATGTTAACGTTGGACATTGTAGTTCTGTTGAAAACATATATCCTTTAATTAAAAGATTAATTTGGAGTTTGTTTACTAATCACATGGATCAAACAATTGAAGAAGTGTTTAATCACATGTCGCCAGTGTCAGTTGAAGGTACGAATGTCATCATGTTGATTCTTGGATTGAATATTAGTTTGTATAATGAAATTAAGCGCACTTTGAATGTAGATAGCATACCAATGGTACTTAATTTAAATGAATTCAGTAGTATAGTTAAATCAATTAGCAGTAAATGGTATAATGTTGATGAATTGGATAAATTGCCAATGTCAATAAAATCAACGGAGGAACTGATTGAAATGAAGAATTCTGGAACTTTAACTGAAGAATTTGAGCTACTGATCTCCAACTCAGAAGATGACAATGAG [서열번호 332]
따라서, 바람직하게는 상기 로타바이러스 NSP1 폴리펩티드는 실질적으로 서열번호 332에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 로타바이러스 NSP1 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 333으로 제공된다:
ATGGCCACCTTCAAGGACGCCTGCTTCCACTACAGACGGCTGACAGCCCTGAATCGGCGGCTGTGTAATATCGGCGCCAACAGCATCTGCATGCCCGTGCCTGACGCCAAGATCAAAGGCTGGTGCCTGGAATGCTGCCAGATCGCCGATCTCACCCACTGCTACGGCTGTTCTCTGCCCCATGTGTGCAAGTGGTGCGTGCAGAACAGACGGTGCTTCCTGGACAACGAGCCCCATCTGCTGAAGCTGAGAACCGTGAAGCACCCCATCACCAAGGACAAGCTGCAGTGCATCATCGACCTGTACAACATCATCTTCCCCATCAACGACAAAGTGATCCGGAAGTTCGAGCGGATGATCAAGCAGCGGAAGTGCCGGAACCAGTACAAGATCGAGTGGTACAATCATCTGCTGCTGCCCATCACACTGAACGCCGCTGCCTTCAAGTTCGACGAGAACAACCTGTACTACGTGTTCGGCCTGTACGAGAAGTCCGTGTCCGACATCTACGCCCCTTACCGGATCGTGAACTTCATCAACGAGTTCGATAAGCTGCTGCTGGACGACATCAACTTCACCCGGATGAGCAACCTGCCTATCGAGCTGAGAAACCACTACGCCAAGAAGTACTTTCAGCTGAGCAGACTGCCCAGCAGCAAGCTGAAGCAGATCTACTTCTCCGACTTCACCAAAGAAACCGTGATCTTCAACACCTACACCAAGACACCCGGCAGATCCATCTACCGGAACGTGACCGAGTTCAACTGGCGGGACGAGCTGGAACTGTACAGCGACCTGAAGAACGACAAGAACAAGCTGATCGCCGCCATGATGACCAGCAAGTACACCCGGTTCTACGCCCACGACAACAATTTCGGCCGGCTGAAGATGACCATCTTCGAGCTGGGCCACCACTGCCAGCCTAATTACGTGGCCTCTAATCACCCCGGCAACGCCAGCGATATCCAGTACTGCAAATGGTGCAATATCAAGTACTTCCTGAGCAAGATCGACTGGCGGATCCGGGACATGTACAACCTGCTGATGGAATTCATCAAGGACTGCTACAAGAGCAACGTGAACGTGGGCCACTGCAGCAGCGTCGAGAACATCTACCCTCTGATCAAGCGGCTGATCTGGTCCCTGTTCACCAACCACATGGACCAGACCATCGAAGAGGTGTTCAATCACATGAGCCCCGTGTCCGTGGAAGGCACCAACGTGATCATGCTGATCCTGGGCCTGAACATCAGCCTGTACAATGAGATCAAGCGCACCCTGAACGTGGACAGCATCCCCATGGTGCTGAACCTGAACGAGTTCAGCAGCATCGTGAAGTCCATCTCCAGCAAGTGGTATAACGTGGACGAACTGGACAAACTGCCCATGAGCATCAAGTCCACCGAGGAACTGATCGAGATGAAGAACAGCGGCACCCTGACCGAGGAATTCGAGCTGCTGATCTCCAACAGCGAGGACGACAACGAG [서열번호 333]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 333에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 333의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 334로 제공된다:
AUGGCCACCUUCAAGGACGCCUGCUUCCACUACAGACGGCUGACAGCCCUGAAUCGGCGGCUGUGUAAUAUCGGCGCCAACAGCAUCUGCAUGCCCGUGCCUGACGCCAAGAUCAAAGGCUGGUGCCUGGAAUGCUGCCAGAUCGCCGAUCUCACCCACUGCUACGGCUGUUCUCUGCCCCAUGUGUGCAAGUGGUGCGUGCAGAACAGACGGUGCUUCCUGGACAACGAGCCCCAUCUGCUGAAGCUGAGAACCGUGAAGCACCCCAUCACCAAGGACAAGCUGCAGUGCAUCAUCGACCUGUACAACAUCAUCUUCCCCAUCAACGACAAAGUGAUCCGGAAGUUCGAGCGGAUGAUCAAGCAGCGGAAGUGCCGGAACCAGUACAAGAUCGAGUGGUACAAUCAUCUGCUGCUGCCCAUCACACUGAACGCCGCUGCCUUCAAGUUCGACGAGAACAACCUGUACUACGUGUUCGGCCUGUACGAGAAGUCCGUGUCCGACAUCUACGCCCCUUACCGGAUCGUGAACUUCAUCAACGAGUUCGAUAAGCUGCUGCUGGACGACAUCAACUUCACCCGGAUGAGCAACCUGCCUAUCGAGCUGAGAAACCACUACGCCAAGAAGUACUUUCAGCUGAGCAGACUGCCCAGCAGCAAGCUGAAGCAGAUCUACUUCUCCGACUUCACCAAAGAAACCGUGAUCUUCAACACCUACACCAAGACACCCGGCAGAUCCAUCUACCGGAACGUGACCGAGUUCAACUGGCGGGACGAGCUGGAACUGUACAGCGACCUGAAGAACGACAAGAACAAGCUGAUCGCCGCCAUGAUGACCAGCAAGUACACCCGGUUCUACGCCCACGACAACAAUUUCGGCCGGCUGAAGAUGACCAUCUUCGAGCUGGGCCACCACUGCCAGCCUAAUUACGUGGCCUCUAAUCACCCCGGCAACGCCAGCGAUAUCCAGUACUGCAAAUGGUGCAAUAUCAAGUACUUCCUGAGCAAGAUCGACUGGCGGAUCCGGGACAUGUACAACCUGCUGAUGGAAUUCAUCAAGGACUGCUACAAGAGCAACGUGAACGUGGGCCACUGCAGCAGCGUCGAGAACAUCUACCCUCUGAUCAAGCGGCUGAUCUGGUCCCUGUUCACCAACCACAUGGACCAGACCAUCGAAGAGGUGUUCAAUCACAUGAGCCCCGUGUCCGUGGAAGGCACCAACGUGAUCAUGCUGAUCCUGGGCCUGAACAUCAGCCUGUACAAUGAGAUCAAGCGCACCCUGAACGUGGACAGCAUCCCCAUGGUGCUGAACCUGAACGAGUUCAGCAGCAUCGUGAAGUCCAUCUCCAGCAAGUGGUAUAACGUGGACGAACUGGACAAACUGCCCAUGAGCAUCAAGUCCACCGAGGAACUGAUCGAGAUGAAGAACAGCGGCACCCUGACCGAGGAAUUCGAGCUGCUGAUCUCCAACAGCGAGGACGACAACGAG [서열번호 334]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 334에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 KSHV ORF45(Q77UV9; HHV8 ORF 45 인간 헤르페스바이러스 8 OX), 또는 그의 동원체이다. KSHV ORF45의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 335로 나타낸다:
MAMFVRTSSSTHDEERMLPIEGAPRRRPPVKFIFPPPPLSSLPGFGRPRGYAGPTVIDMSAPDDVFAEDTPSPPATPLDLQISPDQSSGESEYDEDEEDEDEEENDDVQEEDEPEGYPADFFQPLSHLRPRPLARRAHTPKPVAVVAGRVRSSTDTAESEASMGWVSQDDGFSPAGLSPSDDEGVAILEPMAAYTGTGAYGLSPASRNSVPGTQSSPYSDPDEGPSWRPLRAAPTAIVDLTSDSDSDDSSNSPDVNNEAAFTDARHFSHQPPSSEEDGEDQGEVLSQRIGLMDVGQKRKRQSTASSGSEDVVRCQRQPNLSRKAVASVIIISSGSDTDEEPSSAVSVIVSPSSTKGHLPTQSPSTSAHSISSGSTTTAGSRCSDPTRILASTPPLCGNGAYNWPWLD [서열번호 335]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 335에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 KSHV ORF45 폴리펩티드는 다음과 같은 서열번호 336의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGCGATGTTTGTGAGGACCTCGTCTAGCACACACGATGAAGAGAGAATGCTTCCAATTGAAGGAGCGCCTCGCAGACGACCCCCCGTGAAGTTCATATTCCCACCTCCACCTCTTTCATCACTTCCAGGATTTGGCAGGCCGCGCGGCTATGCTGGACCCACGGTGATAGATATGTCTGCCCCAGACGACGTCTTCGCCGAGGACACGCCATCGCCGCCAGCAACCCCTCTGGATCTACAGATATCCCCGGATCAGTCGAGCGGCGAATCTGAATATGACGAGGATGAGGAAGATGAAGATGAAGAAGAAAATGACGATGTTCAGGAGGAAGACGAGCCAGAGGGGTACCCTGCAGACTTTTTTCAACCTTTATCTCACTTGCGCCCGAGGCCTCTGGCCAGACGGGCCCATACGCCCAAACCGGTAGCAGTGGTAGCGGGCCGCGTGCGCAGTTCAACGGACACGGCGGAGTCCGAGGCGTCCATGGGATGGGTTAGTCAGGATGACGGATTTTCCCCTGCTGGGCTCTCACCTTCAGACGACGAGGGGGTTGCTATCCTGGAACCGATGGCGGCATACACTGGGACCGGGGCATACGGACTTTCACCTGCTTCCAGAAATAGTGTACCTGGAACACAAAGTTCACCATACAGCGACCCTGATGAAGGGCCCTCGTGGCGCCCCCTGCGCGCCGCACCCACCGCGATCGTCGACCTGACATCGGACTCTGATAGCGATGACAGTTCCAACTCTCCGGACGTGAACAATGAGGCCGCGTTTACCGACGCGCGCCATTTTTCCCACCAGCCACCCTCGTCCGAGGAGGACGGAGAAGACCAAGGGGAAGTATTGAGTCAGAGAATCGGGCTCATGGACGTGGGCCAGAAGCGCAAAAGGCAGTCTACCGCCTCCTCTGGTAGCGAGGATGTGGTGCGCTGCCAGAGACAACCAAACTTAAGCCGCAAAGCAGTGGCGTCTGTGATAATTATATCCTCGGGGAGTGACACAGACGAGGAGCCCTCGTCCGCCGTGAGCGTGATCGTGTCTCCGTCGAGCACAAAGGGTCACCTCCCAACCCAATCTCCCAGTACTTCCGCCCACTCGATTTCATCAGGAAGCACAACTACCGCGGGGTCCAGGTGCAGCGACCCAACCCGCATCCTGGCCTCCACGCCACCCCTGTGTGGAAACGGTGCATATAACTGGCCGTGGCTGGAC [서열번호 336]
따라서, 바람직하게는 상기 KSHV ORF45 폴리펩티드는 실질적으로 서열번호 336에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 KSHV ORF45 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 337로 제공된다:
ATGGCCATGTTTGTGCGGACCAGCAGCAGCACCCACGACGAGGAAAGAATGCTGCCTATCGAGGGCGCTCCTCGGAGAAGGCCTCCTGTGAAGTTCATCTTCCCACCTCCACCACTGAGCAGCCTGCCTGGATTTGGCAGACCTAGAGGCTACGCCGGACCTACCGTGATCGATATGAGCGCCCCTGACGATGTGTTCGCCGAGGATACACCTTCTCCACCAGCCACACCTCTGGACCTGCAGATCAGCCCTGATCAGTCTAGCGGCGAGAGCGAGTACGATGAGGACGAAGAGGACGAGGATGAGGAAGAGAACGACGACGTCCAAGAGGAAGATGAGCCCGAGGGCTACCCCGCCGATTTCTTTCAGCCTCTGTCTCACCTGAGGCCTCGGCCTCTTGCTAGAAGGGCCCACACACCTAAACCTGTGGCTGTGGTGGCCGGAAGAGTGCGGTCTAGCACAGATACAGCCGAGTCCGAAGCCAGCATGGGATGGGTGTCACAGGACGATGGATTCAGCCCTGCCGGACTGAGCCCTTCCGATGATGAAGGCGTGGCCATCCTGGAACCTATGGCCGCCTATACTGGCACAGGCGCCTATGGACTGTCTCCCGCCAGCAGAAATAGCGTGCCAGGCACACAGAGCAGCCCCTACTCTGATCCTGATGAGGGCCCATCTTGGAGGCCCCTTAGAGCTGCTCCTACCGCCATCGTGGATCTGACCAGCGACAGCGATAGCGACGACAGCAGCAATAGCCCCGACGTGAACAATGAGGCCGCCTTCACAGACGCCCGGCACTTTTCTCATCAGCCTCCAAGCAGCGAAGAGGATGGCGAGGATCAGGGCGAAGTGCTGTCTCAGAGAATCGGCCTGATGGACGTGGGCCAGAAGCGGAAGAGACAGAGCACAGCCAGCAGCGGCTCTGAGGATGTCGTCAGATGCCAGAGACAGCCCAACCTGAGCAGAAAGGCCGTGGCCAGCGTGATCATCATCAGCTCTGGCAGCGACACCGATGAGGAACCTAGCTCTGCCGTGTCCGTGATCGTGTCTCCTAGCAGCACCAAGGGCCATCTGCCTACACAGAGCCCTAGCACAAGCGCCCACTCTATCTCTAGCGGCAGCACAACAACAGCCGGCAGCAGATGCAGCGACCCCACAAGAATTCTGGCCAGCACACCTCCTCTGTGCGGCAACGGCGCTTACAATTGGCCTTGGCTGGAT [서열번호 337]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 337에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 337의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 338로 제공된다:
AUGGCCAUGUUUGUGCGGACCAGCAGCAGCACCCACGACGAGGAAAGAAUGCUGCCUAUCGAGGGCGCUCCUCGGAGAAGGCCUCCUGUGAAGUUCAUCUUCCCACCUCCACCACUGAGCAGCCUGCCUGGAUUUGGCAGACCUAGAGGCUACGCCGGACCUACCGUGAUCGAUAUGAGCGCCCCUGACGAUGUGUUCGCCGAGGAUACACCUUCUCCACCAGCCACACCUCUGGACCUGCAGAUCAGCCCUGAUCAGUCUAGCGGCGAGAGCGAGUACGAUGAGGACGAAGAGGACGAGGAUGAGGAAGAGAACGACGACGUCCAAGAGGAAGAUGAGCCCGAGGGCUACCCCGCCGAUUUCUUUCAGCCUCUGUCUCACCUGAGGCCUCGGCCUCUUGCUAGAAGGGCCCACACACCUAAACCUGUGGCUGUGGUGGCCGGAAGAGUGCGGUCUAGCACAGAUACAGCCGAGUCCGAAGCCAGCAUGGGAUGGGUGUCACAGGACGAUGGAUUCAGCCCUGCCGGACUGAGCCCUUCCGAUGAUGAAGGCGUGGCCAUCCUGGAACCUAUGGCCGCCUAUACUGGCACAGGCGCCUAUGGACUGUCUCCCGCCAGCAGAAAUAGCGUGCCAGGCACACAGAGCAGCCCCUACUCUGAUCCUGAUGAGGGCCCAUCUUGGAGGCCCCUUAGAGCUGCUCCUACCGCCAUCGUGGAUCUGACCAGCGACAGCGAUAGCGACGACAGCAGCAAUAGCCCCGACGUGAACAAUGAGGCCGCCUUCACAGACGCCCGGCACUUUUCUCAUCAGCCUCCAAGCAGCGAAGAGGAUGGCGAGGAUCAGGGCGAAGUGCUGUCUCAGAGAAUCGGCCUGAUGGACGUGGGCCAGAAGCGGAAGAGACAGAGCACAGCCAGCAGCGGCUCUGAGGAUGUCGUCAGAUGCCAGAGACAGCCCAACCUGAGCAGAAAGGCCGUGGCCAGCGUGAUCAUCAUCAGCUCUGGCAGCGACACCGAUGAGGAACCUAGCUCUGCCGUGUCCGUGAUCGUGUCUCCUAGCAGCACCAAGGGCCAUCUGCCUACACAGAGCCCUAGCACAAGCGCCCACUCUAUCUCUAGCGGCAGCACAACAACAGCCGGCAGCAGAUGCAGCGACCCCACAAGAAUUCUGGCCAGCACACCUCCUCUGUGCGGCAACGGCGCUUACAAUUGGCCUUGGCUGGAU [서열번호 338]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 338에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 EBV BZLF-1(P03206; 트랜스-활성화제(Trans-activator) 단백질 BZLF1 엡스타인-바 바이러스(Epstein-Barr virus)(B95-8 바이러스주)), 또는 그의 동원체이다. [Hahn AM, Huye LE, Ning S, Webster-Cyriaque JM Pagano JS (2005) Interferon Regulatory Factor 7 Is Negatively Regulated by the Epstein-Barr Virus Immediate-Early Gene, J Virol, 79, 15, 10040-10052 doi:10.1128/JVI.79.15.10040-10052.2005]. EBV BZLF-1의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 339로 나타낸다:
MMDPNSTSEDVKFTPDPYQVPFVQAFDQATRVYQDLGGPSQAPLPCVLWPVLPEPLPQGQLTAYHVSTAPTGSWFSAPQPAPENAYQAYAAPQLFPVSDITQNQQTNQAGGEAPQPGDNSTVQTAAAVVFACPGANQGQQLADIGVPQPAPVAAPARRTRKPQQPESLEECDSELEIKRYKNRVASRKCRAKFKQLLQHYREVAAAKSSENDRLRLLLKQMCPSLDVDSIIPRTPDVLHEDLLNF [서열번호 339]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 339에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 EBV BZLF-1 폴리펩티드는 다음과 같은 서열번호 340의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGATGGACCCAAACTCGACTTCTGAAGATGTAAAATTTACACCTGACCCATACCAGGTGCCTTTTGTACAAGCTTTTGACCAAGCTACCAGAGTCTATCAGGACCTGGGAGGGCCATCGCAAGCTCCTTTGCCTTGTGTGCTGTGGCCGGTGCTGCCAGAGCCTCTGCCACAAGGCCAGCTAACTGCCTATCATGTTTCAACCGCTCCGACTGGGTCGTGGTTTTCTGCCCCTCAGCCTGCTCCTGAGAATGCTTATCAAGCTTATGCAGCACCTCAGCTGTTCCCAGTCTCCGACATAACCCAGAATCAACAGACTAACCAAGCCGGGGGAGAAGCACCTCAACCTGGAGACAATTCTACTGTTCAAACAGCAGCAGCAGTGGTGTTTGCTTGCCCCGGGGCTAACCAAGGACAACAGCTAGCAGACATTGGTGTTCCACAGCCTGCACCAGTGGCTGCCCCGGCACGACGCACACGGAAACCACAACAGCCAGAATCGCTGGAGGAATGCGATTCTGAACTAGAAATAAAGCGATACAAGAATCGGGTGGCTTCCAGAAAATGCCGGGCCAAGTTTAAGCAACTGCTGCAGCACTACCGTGAGGTCGCTGCTGCCAAATCATCTGAAAATGACAGGCTGCGCCTCCTGTTGAAGCAGATGTGCCCAAGCCTGGATGTTGACTCCATTATCCCCCGGACACCAGATGTTTTACACGAGGATCTCTTAAATTTC [서열번호 340]
따라서, 바람직하게는 상기 EBV BZLF-1 폴리펩티드는 실질적으로 서열번호 340에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 EBV BZLF-1 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 341로 제공된다:
ATGATGGACCCCAACAGCACCAGCGAGGACGTGAAGTTCACCCCTGATCCTTACCAGGTGCCATTCGTGCAGGCCTTCGATCAGGCCACCAGAGTGTACCAGGATCTCGGCGGACCTTCTCAGGCTCCTCTGCCTTGTGTTCTGTGGCCTGTGCTGCCTGAACCTCTGCCTCAGGGACAGCTGACAGCCTACCATGTGTCTACAGCCCCTACCGGCAGCTGGTTTTCTGCTCCTCAACCTGCTCCTGAGAACGCCTACCAGGCCTATGCTGCCCCTCAGCTGTTTCCCGTGTCCGACATCACCCAGAACCAGCAGACAAATCAGGCTGGCGGAGAAGCTCCTCAGCCTGGCGATAATAGCACCGTGCAGACAGCTGCCGCCGTGGTGTTTGCTTGTCCTGGCGCTAATCAGGGCCAGCAGCTGGCTGATATTGGCGTGCCACAACCAGCTCCAGTGGCCGCTCCTGCCAGAAGAACAAGAAAGCCTCAGCAGCCCGAGAGCCTGGAAGAGTGCGATAGCGAGCTGGAAATCAAGCGGTACAAGAACAGAGTGGCCAGCCGGAAGTGCCGGGCCAAGTTTAAACAGCTGCTCCAGCACTACAGAGAGGTGGCCGCTGCCAAGAGCAGCGAGAACGATAGACTGCGGCTGCTGCTGAAGCAGATGTGCCCTAGCCTGGACGTGGACAGCATCATCCCCAGAACACCCGATGTGCTGCACGAGGACCTGCTGAACTTT [서열번호 341]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 341에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 341의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 342로 제공된다:
AUGAUGGACCCCAACAGCACCAGCGAGGACGUGAAGUUCACCCCUGAUCCUUACCAGGUGCCAUUCGUGCAGGCCUUCGAUCAGGCCACCAGAGUGUACCAGGAUCUCGGCGGACCUUCUCAGGCUCCUCUGCCUUGUGUUCUGUGGCCUGUGCUGCCUGAACCUCUGCCUCAGGGACAGCUGACAGCCUACCAUGUGUCUACAGCCCCUACCGGCAGCUGGUUUUCUGCUCCUCAACCUGCUCCUGAGAACGCCUACCAGGCCUAUGCUGCCCCUCAGCUGUUUCCCGUGUCCGACAUCACCCAGAACCAGCAGACAAAUCAGGCUGGCGGAGAAGCUCCUCAGCCUGGCGAUAAUAGCACCGUGCAGACAGCUGCCGCCGUGGUGUUUGCUUGUCCUGGCGCUAAUCAGGGCCAGCAGCUGGCUGAUAUUGGCGUGCCACAACCAGCUCCAGUGGCCGCUCCUGCCAGAAGAACAAGAAAGCCUCAGCAGCCCGAGAGCCUGGAAGAGUGCGAUAGCGAGCUGGAAAUCAAGCGGUACAAGAACAGAGUGGCCAGCCGGAAGUGCCGGGCCAAGUUUAAACAGCUGCUCCAGCACUACAGAGAGGUGGCCGCUGCCAAGAGCAGCGAGAACGAUAGACUGCGGCUGCUGCUGAAGCAGAUGUGCCCUAGCCUGGACGUGGACAGCAUCAUCCCCAGAACACCCGAUGUGCUGCACGAGGACCUGCUGAACUUU [서열번호 342]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 342에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 MuHV Orf73(O41974; MHV68 ORF73 단백질 뮤린 헤르페스바이러스 4), 또는 그의 동원체이다. MuHV Orf73의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 343으로 나타낸다:
MPTSPPTTRNTTSGKTRSGCKRRCFNKPAAMPPKRRRAPKRPAPPPPPGCQGDEESSQGTQTPNPPSPPVPPSSPTLPSSPVPPSSPVHEPPSPSPPPAPPSPDVDVEGLDVGETDDPGPPPPKRYSRYQKPHNPSDPLPKKYQGMRRHLQVTAPRLFDPEGHPPTHFKSAVMFSSTHPYTLNKLHKCIQSKHVLSTPVSCLPLVPGTTQQCVTYYLLSFVEDKKQAKKLKRVVLAYCEKYHSSVEGTIVKAKPYFPLPEPPTEPPTDPEQPSTSTQASGTQHGPTASLDAGAEQGATGSPGSSPGQQGQGSQT [서열번호 343]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 343에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 MuHV Orf73 폴리펩티드는 다음과 같은 서열번호 344의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGCCCACATCCCCACCGACTACACGCAACACAACCTCAGGCAAAACCAGATCAGGGTGCAAACGTAGGTGCTTCAACAAACCAGCAGCCATGCCTCCTAAAAGACGCCGCGCTCCAAAAAGACCAGCCCCTCCTCCACCACCGGGATGCCAAGGTGATGAGGAGTCCAGCCAGGGAACTCAAACGCCAAACCCCCCATCACCACCAGTGCCCCCTTCATCACCAACACTTCCCTCATCCCCCGTCCCTCCTTCATCACCAGTACATGAGCCACCATCTCCTTCCCCCCCACCAGCCCCACCATCACCAGATGTTGATGTTGAAGGTTTAGATGTAGGAGAGACAGACGATCCCGGTCCCCCTCCACCAAAAAGATACTCCAGGTATCAAAAACCGCATAATCCATCTGATCCATTGCCTAAAAAATATCAGGGAATGCGAAGACACCTGCAGGTGACAGCACCCAGGTTATTTGATCCCGAGGGTCACCCCCCAACACATTTTAAGTCAGCTGTTATGTTTAGTAGCACACATCCCTACACTTTGAATAAACTTCACAAGTGTATCCAAAGCAAACATGTACTCTCAACACCAGTTAGCTGTTTACCCTTGGTACCAGGCACAACACAACAGTGTGTAACATACTATTTACTTTCATTTGTTGAAGACAAGAAACAGGCCAAAAAACTAAAAAGGGTTGTCTTGGCCTACTGTGAAAAATACCACAGCAGCGTAGAAGGTACTATAGTCAAGGCAAAGCCTTATTTTCCCTTACCAGAGCCCCCTACAGAGCCCCCTACAGACCCCGAGCAGCCATCCACAAGTACACAAGCTTCTGGCACACAACATGGTCCCACAGCATCTCTGGATGCCGGTGCAGAGCAAGGTGCCACAGGATCACCTGGATCTAGTCCAGGACAACAGGGACAAGGGTCTCAGACA [서열번호 344]
따라서, 바람직하게는 상기 MuHV Orf73 폴리펩티드는 실질적으로 서열번호 344에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 MuHV Orf73 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 345로 제공된다:
ATGCCTACAAGCCCTCCTACCACCAGAAACACCACCAGCGGCAAGACAAGAAGCGGCTGCAAGCGGCGGTGCTTCAACAAACCTGCTGCCATGCCTCCTAAGCGGCGGAGAGCACCTAAAAGACCTGCTCCTCCTCCACCTCCTGGTTGCCAAGGCGACGAGGAATCTTCTCAGGGCACCCAGACACCTAATCCTCCATCTCCACCTGTGCCTCCAAGCAGCCCTACACTGCCATCTTCTCCAGTGCCACCTAGCAGCCCAGTGCACGAACCACCTAGTCCAAGTCCTCCACCAGCTCCACCTTCTCCAGACGTGGACGTGGAAGGACTGGATGTGGGCGAGACAGACGATCCTGGACCTCCACCACCTAAGCGGTACAGCAGATACCAGAAGCCTCACAACCCCAGCGATCCTCTGCCTAAGAAATACCAGGGCATGCGCCGGCATCTGCAAGTGACAGCCCCTAGACTGTTCGACCCTGAGGGACACCCTCCTACACACTTCAAGAGCGCCGTGATGTTCAGCAGCACACACCCCTACACTCTGAACAAGCTGCACAAGTGCATCCAGAGCAAACACGTGCTGAGCACCCCTGTGTCCTGTCTGCCTCTGGTGCCTGGAACCACACAGCAGTGCGTGACCTACTACCTGCTGAGCTTCGTGGAAGATAAGAAGCAGGCCAAGAAACTGAAGAGAGTGGTGCTGGCCTACTGCGAGAAGTACCACAGCAGCGTGGAAGGCACCATCGTGAAGGCCAAGCCTTACTTCCCACTGCCTGAGCCTCCAACCGAGCCACCTACAGATCCTGAGCAGCCTAGCACAAGCACACAGGCCTCTGGAACACAGCACGGACCTACAGCTAGTCTGGATGCTGGTGCTGAACAGGGCGCCACAGGATCACCTGGAAGTAGCCCTGGACAGCAAGGCCAGGGATCTCAGACA [서열번호 345]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 345에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 345의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 346으로 제공된다:
AUGCCUACAAGCCCUCCUACCACCAGAAACACCACCAGCGGCAAGACAAGAAGCGGCUGCAAGCGGCGGUGCUUCAACAAACCUGCUGCCAUGCCUCCUAAGCGGCGGAGAGCACCUAAAAGACCUGCUCCUCCUCCACCUCCUGGUUGCCAAGGCGACGAGGAAUCUUCUCAGGGCACCCAGACACCUAAUCCUCCAUCUCCACCUGUGCCUCCAAGCAGCCCUACACUGCCAUCUUCUCCAGUGCCACCUAGCAGCCCAGUGCACGAACCACCUAGUCCAAGUCCUCCACCAGCUCCACCUUCUCCAGACGUGGACGUGGAAGGACUGGAUGUGGGCGAGACAGACGAUCCUGGACCUCCACCACCUAAGCGGUACAGCAGAUACCAGAAGCCUCACAACCCCAGCGAUCCUCUGCCUAAGAAAUACCAGGGCAUGCGCCGGCAUCUGCAAGUGACAGCCCCUAGACUGUUCGACCCUGAGGGACACCCUCCUACACACUUCAAGAGCGCCGUGAUGUUCAGCAGCACACACCCCUACACUCUGAACAAGCUGCACAAGUGCAUCCAGAGCAAACACGUGCUGAGCACCCCUGUGUCCUGUCUGCCUCUGGUGCCUGGAACCACACAGCAGUGCGUGACCUACUACCUGCUGAGCUUCGUGGAAGAUAAGAAGCAGGCCAAGAAACUGAAGAGAGUGGUGCUGGCCUACUGCGAGAAGUACCACAGCAGCGUGGAAGGCACCAUCGUGAAGGCCAAGCCUUACUUCCCACUGCCUGAGCCUCCAACCGAGCCACCUACAGAUCCUGAGCAGCCUAGCACAAGCACACAGGCCUCUGGAACACAGCACGGACCUACAGCUAGUCUGGAUGCUGGUGCUGAACAGGGCGCCACAGGAUCACCUGGAAGUAGCCCUGGACAGCAAGGCCAGGGAUCUCAGACA [서열번호 346]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 346에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 토크 테노 바이러스 Orf2(A7XCD9; ORF2 단백질 토크 테노 바이러스(인간/핀란드/Hel32/2002 단리물)), 또는 그의 동원체이다. [Zheng H, Ye L, Fang X, Li B, Wang Y, Xiang X, Kong L, Wang W et al. (2007) Torque teno virus (SANBAN isolate) ORF2 protein suppresses NF-kB pathways via interaction with IkappaB kinases. J Virol, 81, 21, 11917-11924]. 상기 IIP는 정규적 및 비-정규적 Nf-KB 경로를 저해하는 것으로 여겨진다. 토크 테노 바이러스 Orf2의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 347로 나타낸다:
MWQPPTQNGTQLERHWFESVWRSHAAFCSCGDCIGHLQHLATNLGRPPAPQPPRDQHPPHIRGLPALPAPPSNRNSWPGTGGDAAGGEAGGSRGAGDGGDGELADEDLLDAIALAAE [서열번호 347]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 347에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 토크 테노 바이러스 Orf2 폴리펩티드는 다음과 같은 서열번호 348의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGTGGCAGCCACCTACCCAGAATGGAACCCAACTCGAACGGCACTGGTTCGAGTCCGTTTGGCGTTCGCATGCTGCCTTTTGTAGCTGTGGCGACTGTATTGGCCATCTTCAGCATCTGGCTACTAACCTGGGTCGACCACCTGCTCCACAACCGCCGCGAGACCAACACCCACCGCACATAAGAGGGCTCCCGGCACTCCCGGCACCTCCCAGTAACAGAAACTCATGGCCTGGTACTGGTGGAGACGCCGCCGGAGGAGAGGCTGGTGGAAGCCGAGGCGCAGGAGATGGAGGAGACGGAGAGCTCGCAGACGAGGACCTGCTAGACGCCATCGCGCTCGCCGCAGAG [서열번호 348]
따라서, 바람직하게는 상기 토크 테노 바이러스 Orf2 폴리펩티드는 실질적으로 서열번호 348에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 토크 테노 바이러스 Orf2 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 349로 제공된다:
ATGTGGCAGCCTCCTACACAGAATGGCACCCAGCTGGAACGGCATTGGTTCGAGAGCGTTTGGAGAAGCCACGCCGCTTTCTGCAGCTGCGGAGATTGCATCGGACATCTGCAGCACCTGGCCACCAATCTGGGTAGACCTCCAGCTCCTCAGCCTCCTCGAGATCAGCACCCTCCTCACATCAGAGGACTGCCTGCACTTCCTGCTCCTCCAAGCAACAGAAACAGCTGGCCTGGCACAGGCGGAGATGCTGCTGGCGGAGAAGCTGGTGGATCTAGAGGTGCCGGCGACGGTGGCGACGGCGAACTTGCTGATGAAGATCTGCTGGACGCTATCGCCCTGGCCGCTGAA [서열번호 349]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 349에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 349의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 350으로 제공된다:
AUGUGGCAGCCUCCUACACAGAAUGGCACCCAGCUGGAACGGCAUUGGUUCGAGAGCGUUUGGAGAAGCCACGCCGCUUUCUGCAGCUGCGGAGAUUGCAUCGGACAUCUGCAGCACCUGGCCACCAAUCUGGGUAGACCUCCAGCUCCUCAGCCUCCUCGAGAUCAGCACCCUCCUCACAUCAGAGGACUGCCUGCACUUCCUGCUCCUCCAAGCAACAGAAACAGCUGGCCUGGCACAGGCGGAGAUGCUGCUGGCGGAGAAGCUGGUGGAUCUAGAGGUGCCGGCGACGGUGGCGACGGCGAACUUGCUGAUGAAGAUCUGCUGGACGCUAUCGCCCUGGCCGCUGAA [서열번호 350]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 350에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 EBV EBNA1(P03211; 엡스타인-바 핵 항원 1 엡스타인-바 바이러스(B95-8 바이러스주)), 또는 그의 동원체이다. EBV EBNA1의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 351로 나타낸다:
MSDEGPGTGPGNGLGEKGDTSGPEGSGGSGPQRRGGDNHGRGRGRGRGRGGGRPGAPGGSGSGPRHRDGVRRPQKRPSCIGCKGTHGGTGAGAGAGGAGAGGAGAGGGAGAGGGAGGAGGAGGAGAGGGAGAGGGAGGAGGAGAGGGAGAGGGAGGAGAGGGAGGAGGAGAGGGAGAGGGAGGAGAGGGAGGAGGAGAGGGAGAGGAGGAGGAGAGGAGAGGGAGGAGGAGAGGAGAGGAGAGGAGAGGAGGAGAGGAGGAGAGGAGGAGAGGGAGGAGAGGGAGGAGAGGAGGAGAGGAGGAGAGGAGGAGAGGGAGAGGAGAGGGGRGRGGSGGRGRGGSGGRGRGGSGGRRGRGRERARGGSRERARGRGRGRGEKRPRSPSSQSSSSGSPPRRPPPGRRPFFHPVGEADYFEYHQEGGPDGEPDVPPGAIEQGPADDPGEGPSTGPRGQGDGGRRKKGGWFGKHRGQGGSNPKFENIAEGLRALLARSHVERTTDEGTWVAGVFVYGGSKTSLYNLRRGTALAIPQCRLTPLSRLPFGMAPGPGPQPGPLRESIVCYFMVFLQTHIFAEVLKDAIKDLVMTKPAPTCNIRVTVCSFDDGVDLPPWFPPMVEGAAAEGDDGDDGDEGGDGDEGEEGQE [서열번호 351]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 351에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 EBV EBNA1 폴리펩티드는 다음과 같은 서열번호 352의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGTCTGACGAGGGGCCAGGTACAGGACCTGGAAATGGCCTAGGAGAGAAGGGAGACACATCTGGACCAGAAGGCTCCGGCGGCAGTGGACCTCAAAGAAGAGGGGGTGATAACCATGGACGAGGACGGGGAAGAGGACGAGGACGAGGAGGCGGAAGACCAGGAGCCCCGGGCGGCTCAGGATCAGGGCCAAGACATAGAGATGGTGTCCGGAGACCCCAAAAACGTCCAAGTTGCATTGGCTGCAAAGGGACCCACGGTGGAACAGGAGCAGGAGCAGGAGCGGGAGGGGCAGGAGCAGGAGGGGCAGGAGCAGGAGGAGGGGCAGGAGCAGGAGGAGGGGCAGGAGGGGCAGGAGGGGCAGGAGGGGCAGGAGCAGGAGGAGGGGCAGGAGCAGGAGGAGGGGCAGGAGGGGCAGGAGGGGCAGGAGCAGGAGGAGGGGCAGGAGCAGGAGGAGGGGCAGGAGGGGCAGGAGCAGGAGGAGGGGCAGGAGGGGCAGGAGGGGCAGGAGCAGGAGGAGGGGCAGGAGCAGGAGGAGGGGCAGGAGGGGCAGGAGCAGGAGGAGGGGCAGGAGGGGCAGGAGGGGCAGGAGCAGGAGGAGGGGCAGGAGCAGGAGGGGCAGGAGGGGCAGGAGGGGCAGGAGCAGGAGGGGCAGGAGCAGGAGGAGGGGCAGGAGGGGCAGGAGGGGCAGGAGCAGGAGGGGCAGGAGCAGGAGGGGCAGGAGCAGGAGGGGCAGGAGCAGGAGGGGCAGGAGGGGCAGGAGCAGGAGGGGCAGGAGGGGCAGGAGCAGGAGGGGCAGGAGGGGCAGGAGCAGGAGGAGGGGCAGGAGGGGCAGGAGCAGGAGGAGGGGCAGGAGGGGCAGGAGCAGGAGGGGCAGGAGGGGCAGGAGCAGGAGGGGCAGGAGGGGCAGGAGCAGGAGGGGCAGGAGGGGCAGGAGCAGGAGGAGGGGCAGGAGCAGGAGGGGCAGGAGCAGGAGGTGGAGGCCGGGGTCGAGGAGGCAGTGGAGGCCGGGGTCGAGGAGGTAGTGGAGGCCGGGGTCGAGGAGGTAGTGGAGGCCGCCGGGGTAGAGGACGTGAAAGAGCCAGGGGGGGAAGTCGTGAAAGAGCCAGGGGGAGAGGTCGTGGACGTGGAGAAAAGAGGCCCAGGAGTCCCAGTAGTCAGTCATCATCATCCGGGTCTCCACCGCGCAGGCCCCCTCCAGGTAGAAGGCCATTTTTCCACCCTGTAGGGGAAGCCGATTATTTTGAATACCACCAAGAAGGTGGCCCAGATGGTGAGCCTGACGTGCCCCCGGGAGCGATAGAGCAGGGCCCCGCAGATGACCCAGGAGAAGGCCCAAGCACTGGACCCCGGGGTCAGGGTGATGGAGGCAGGCGCAAAAAAGGAGGGTGGTTTGGAAAGCATCGTGGTCAAGGAGGTTCCAACCCGAAATTTGAGAACATTGCAGAAGGTTTAAGAGCTCTCCTGGCTAGGAGTCACGTAGAAAGGACTACCGACGAAGGAACTTGGGTCGCCGGTGTGTTCGTATATGGAGGTAGTAAGACCTCCCTTTACAACCTAAGGCGAGGAACTGCCCTTGCTATTCCACAATGTCGTCTTACACCATTGAGTCGTCTCCCCTTTGGAATGGCCCCTGGACCCGGCCCACAACCTGGCCCGCTAAGGGAGTCCATTGTCTGTTATTTCATGGTCTTTTTACAAACTCATATATTTGCTGAGGTTTTGAAGGATGCGATTAAGGACCTTGTTATGACAAAGCCCGCTCCTACCTGCAATATCAGGGTGACTGTGTGCAGCTTTGACGATGGAGTAGATTTGCCTCCCTGGTTTCCACCTATGGTGGAAGGGGCTGCCGCGGAGGGTGATGACGGAGATGACGGAGATGAAGGAGGTGATGGAGATGAGGGTGAGGAAGGGCAGGAGTGA [서열번호 352]
따라서, 바람직하게는 상기 EBV EBNA1 폴리펩티드는 실질적으로 서열번호 352에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 EBV EBNA1 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 353으로 제공된다:
ATGTCCGATGAAGGCCCTGGAACAGGCCCTGGCAATGGACTGGGAGAGAAGGGCGATACAAGCGGCCCTGAAGGTTCTGGCGGATCTGGCCCTCAAAGAAGAGGCGGCGATAATCACGGCAGAGGACGCGGAAGAGGTAGAGGCAGAGGCGGAGGTAGACCTGGTGCTCCTGGTGGTTCTGGCTCTGGCCCTAGACATAGAGATGGCGTCAGACGGCCTCAGAAGAGGCCTTCTTGTATCGGCTGCAAGGGCACACATGGCGGAACAGGTGCTGGTGCTGGCGCAGGCGGAGCAGGCGCTGGTGGTGCAGGCGCTGGCGGCGGTGCCGGTGCAGGCGGCGGAGCTGGTGGCGCTGGCGGTGCTGGCGGAGCTGGTGCAGGCGGAGGTGCCGGCGCTGGTGGCGGAGCAGGCGGAGCTGGCGGAGCCGGCGCTGGCGGTGGCGCTGGTGCCGGCGGAGGCGCAGGCGGCGCTGGTGCTGGTGGTGGTGCTGGCGGCGCAGGCGGTGCAGGCGCAGGCGGAGGCGCTGGCGCTGGCGGTGGTGCAGGCGGTGCTGGCGCTGGCGGCGGTGCTGGCGGAGCCGGTGGTGCTGGTGCTGGTGGCGGAGCTGGCGCTGGCGGAGCTGGCGGTGCAGGCGGCGCAGGCGCTGGTGGCGCTGGCGCAGGCGGTGGCGCTGGCGGAGCAGGCGGAGCTGGCGCTGGCGGCGCAGGCGCAGGCGGAGCCGGTGCTGGCGGAGCTGGTGCTGGTGGTGCAGGCGGAGCTGGTGCCGGTGGCGCTGGTGGTGCCGGTGCCGGTGGTGCCGGCGGAGCCGGCGCAGGCGGCGGTGCAGGCGGAGCAGGCGCAGGCGGCGGAGCTGGTGGTGCCGGCGCAGGCGGCGCTGGTGGTGCTGGTGCCGGCGGAGCTGGTGGCGCAGGCGCTGGCGGTGCAGGCGGTGCCGGTGCCGGTGGTGGTGCAGGCGCAGGCGGTGCTGGTGCCGGCGGTGGCGGAAGAGGAAGAGGTGGTAGCGGAGGCCGAGGACGAGGCGGAAGTGGTGGTCGTGGTAGAGGCGGCAGCGGAGGAAGAAGAGGACGGGGTAGAGAACGAGCTAGAGGCGGATCTAGAGAGAGAGCCCGAGGCAGAGGAAGAGGCCGCGGAGAGAAAAGACCTAGAAGCCCTAGCAGCCAGAGCAGCTCTAGCGGATCTCCACCTAGAAGGCCACCTCCAGGCAGACGGCCATTCTTTCACCCTGTGGGCGAAGCCGACTACTTCGAGTACCACCAAGAAGGCGGACCTGACGGCGAACCTGATGTTCCTCCTGGCGCCATTGAACAGGGCCCAGCTGATGATCCTGGCGAGGGACCTTCTACAGGCCCTAGAGGACAAGGCGACGGCGGCAGACGAAAGAAAGGCGGATGGTTCGGCAAGCACAGAGGCCAAGGTGGCAGCAACCCCAAGTTCGAGAATATCGCCGAGGGCCTGAGAGCCCTGCTGGCCAGATCTCACGTGGAAAGAACCACCGACGAAGGCACATGGGTGGCAGGCGTGTTCGTTTACGGCGGCTCTAAGACCAGCCTGTACAACCTGAGAAGAGGCACAGCCCTGGCCATTCCTCAGTGCAGACTGACCCCTCTGAGCAGACTGCCTTTTGGCATGGCTCCTGGACCTGGACCTCAACCTGGACCACTGAGAGAATCCATCGTGTGCTACTTCATGGTGTTTCTGCAGACCCACATCTTCGCCGAGGTGCTGAAGGACGCCATCAAGGACCTGGTCATGACAAAGCCCGCTCCTACCTGCAACATCAGAGTGACCGTGTGCAGCTTCGACGACGGCGTTGACCTGCCTCCTTGGTTTCCTCCAATGGTGGAAGGCGCTGCTGCCGAAGGCGACGATGGCGACGACGGCGACGAAGGTGGCGACGGCGACGAGGGCGAAGAAGGACAAGAGTAA [서열번호 353]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 353에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 353의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 354로 제공된다:
AUGUCCGAUGAAGGCCCUGGAACAGGCCCUGGCAAUGGACUGGGAGAGAAGGGCGAUACAAGCGGCCCUGAAGGUUCUGGCGGAUCUGGCCCUCAAAGAAGAGGCGGCGAUAAUCACGGCAGAGGACGCGGAAGAGGUAGAGGCAGAGGCGGAGGUAGACCUGGUGCUCCUGGUGGUUCUGGCUCUGGCCCUAGACAUAGAGAUGGCGUCAGACGGCCUCAGAAGAGGCCUUCUUGUAUCGGCUGCAAGGGCACACAUGGCGGAACAGGUGCUGGUGCUGGCGCAGGCGGAGCAGGCGCUGGUGGUGCAGGCGCUGGCGGCGGUGCCGGUGCAGGCGGCGGAGCUGGUGGCGCUGGCGGUGCUGGCGGAGCUGGUGCAGGCGGAGGUGCCGGCGCUGGUGGCGGAGCAGGCGGAGCUGGCGGAGCCGGCGCUGGCGGUGGCGCUGGUGCCGGCGGAGGCGCAGGCGGCGCUGGUGCUGGUGGUGGUGCUGGCGGCGCAGGCGGUGCAGGCGCAGGCGGAGGCGCUGGCGCUGGCGGUGGUGCAGGCGGUGCUGGCGCUGGCGGCGGUGCUGGCGGAGCCGGUGGUGCUGGUGCUGGUGGCGGAGCUGGCGCUGGCGGAGCUGGCGGUGCAGGCGGCGCAGGCGCUGGUGGCGCUGGCGCAGGCGGUGGCGCUGGCGGAGCAGGCGGAGCUGGCGCUGGCGGCGCAGGCGCAGGCGGAGCCGGUGCUGGCGGAGCUGGUGCUGGUGGUGCAGGCGGAGCUGGUGCCGGUGGCGCUGGUGGUGCCGGUGCCGGUGGUGCCGGCGGAGCCGGCGCAGGCGGCGGUGCAGGCGGAGCAGGCGCAGGCGGCGGAGCUGGUGGUGCCGGCGCAGGCGGCGCUGGUGGUGCUGGUGCCGGCGGAGCUGGUGGCGCAGGCGCUGGCGGUGCAGGCGGUGCCGGUGCCGGUGGUGGUGCAGGCGCAGGCGGUGCUGGUGCCGGCGGUGGCGGAAGAGGAAGAGGUGGUAGCGGAGGCCGAGGACGAGGCGGAAGUGGUGGUCGUGGUAGAGGCGGCAGCGGAGGAAGAAGAGGACGGGGUAGAGAACGAGCUAGAGGCGGAUCUAGAGAGAGAGCCCGAGGCAGAGGAAGAGGCCGCGGAGAGAAAAGACCUAGAAGCCCUAGCAGCCAGAGCAGCUCUAGCGGAUCUCCACCUAGAAGGCCACCUCCAGGCAGACGGCCAUUCUUUCACCCUGUGGGCGAAGCCGACUACUUCGAGUACCACCAAGAAGGCGGACCUGACGGCGAACCUGAUGUUCCUCCUGGCGCCAUUGAACAGGGCCCAGCUGAUGAUCCUGGCGAGGGACCUUCUACAGGCCCUAGAGGACAAGGCGACGGCGGCAGACGAAAGAAAGGCGGAUGGUUCGGCAAGCACAGAGGCCAAGGUGGCAGCAACCCCAAGUUCGAGAAUAUCGCCGAGGGCCUGAGAGCCCUGCUGGCCAGAUCUCACGUGGAAAGAACCACCGACGAAGGCACAUGGGUGGCAGGCGUGUUCGUUUACGGCGGCUCUAAGACCAGCCUGUACAACCUGAGAAGAGGCACAGCCCUGGCCAUUCCUCAGUGCAGACUGACCCCUCUGAGCAGACUGCCUUUUGGCAUGGCUCCUGGACCUGGACCUCAACCUGGACCACUGAGAGAAUCCAUCGUGUGCUACUUCAUGGUGUUUCUGCAGACCCACAUCUUCGCCGAGGUGCUGAAGGACGCCAUCAAGGACCUGGUCAUGACAAAGCCCGCUCCUACCUGCAACAUCAGAGUGACCGUGUGCAGCUUCGACGACGGCGUUGACCUGCCUCCUUGGUUUCCUCCAAUGGUGGAAGGCGCUGCUGCCGAAGGCGACGAUGGCGACGACGGCGACGAAGGUGGCGACGGCGACGAGGGCGAAGAAGGACAAGAGUAA [서열번호 354]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 354에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 BDV P 단백질(P0C799; 인단백질 보르나 질환 바이러스(Borna disease virus)(V 바이러스주)), 또는 그의 동원체이다. 상기 IIP는 TBK에 의한 인산화를 위한 유인 단백질로 작용하여서, IRF3 및 7의 TBK 활성 및 활성화를 감소시키는 효과를 갖는 것으로 여겨진다. BDV P 단백질의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 355로 나타낸다:
MATRPSSLVDSLEDEEDPQTLRRERPGSPRPRKVPRNALTQPVDQLLKDLRKNPSMISDPDQRTGREQLSNDELIKKLVTELAENSMIEAEEVRGTLGDISARIEAGFESLSALQVETIQTAQRCDHSDSIRILGENIKILDRSMKTMMETMKLMMEKVDLLYASTAVGTSAPMLPSHPAPPRIYPQLPSAPTTDEWDIIP [서열번호 355]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 355에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 BDV P 폴리펩티드는 다음과 같은 서열번호 356의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGCAACGCGACCATCGAGTCTGGTCGACTCCCTGGAGGACGAAGAAGATCCCCAGACACTACGACGGGAACGACCGGGGTCACCAAGACCACGGAAGGTCCCAAGGAATGCATTGACCCAACCAGTAGACCAGCTCCTGAAGGACCTCAGGAAGAACCCCTCCATGATCTCAGACCCAGACCAGCGAACCGGAAGGGAGCAGCTGTCGAATGATGAGCTAATCAAGAAGTTAGTGACGGAGCTGGCCGAGAATAGCATGATCGAGGCTGAGGAGGTGCGGGGCACTCTTGGAGACATCTCGGCTCGTATCGAGGCAGGGTTTGAGTCCCTGTCCGCCCTCCAAGTGGAAACCATCCAGACAGCTCAGCGGTGCGATCACTCCGACAGCATCAGGATCCTCGGCGAGAACATCAAGATACTAGATCGCTCCATGAAGACAATGATGGAGACAATGAAGCTCATGATGGAGAAGGTGGATCTCCTCTACGCATCAACCGCCGTTGGGACCTCTGCACCCATGTTGCCCTCCCATCCTGCACCTCCGCGCATTTATCCCCAGCTCCCAAGTGCCCCGACAACGGATGAATGGGACATCATACCA [서열번호 356]
따라서, 바람직하게는 상기 BDV P 폴리펩티드는 실질적으로 서열번호 356에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 BDV P 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 357로 제공된다:
ATGGCCACAAGACCTAGCAGCCTGGTGGACAGCCTGGAAGATGAGGAAGATCCCCAGACACTGCGGAGAGAGAGGCCTGGATCTCCCAGACCTAGAAAGGTGCCCAGAAACGCCCTGACACAGCCCGTTGATCAGCTGCTGAAGGACCTGAGAAAGAACCCCAGCATGATCAGCGACCCCGACCAGAGAACCGGAAGAGAGCAGCTGTCTAACGACGAGCTGATTAAGAAGCTGGTCACCGAGCTGGCCGAGAACTCCATGATTGAGGCCGAAGAAGTGCGGGGCACCCTGGGCGATATCTCTGCCAGAATCGAGGCCGGCTTTGAGTCTCTGAGCGCCCTGCAGGTTGAGACAATCCAGACAGCCCAGAGATGCGACCACAGCGACAGCATCAGAATCCTGGGCGAGAACATCAAGATCCTGGATCGGAGCATGAAGACCATGATGGAAACCATGAAGCTGATGATGGAAAAGGTGGACCTGCTGTACGCCAGCACAGCCGTGGGAACATCTGCTCCCATGCTGCCTTCTCACCCCGCTCCTCCAAGAATCTACCCTCAGCTGCCTAGCGCTCCCACCACCGATGAGTGGGATATCATCCCT [서열번호 357]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 357에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 357의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 358로 제공된다:
AUGGCCACAAGACCUAGCAGCCUGGUGGACAGCCUGGAAGAUGAGGAAGAUCCCCAGACACUGCGGAGAGAGAGGCCUGGAUCUCCCAGACCUAGAAAGGUGCCCAGAAACGCCCUGACACAGCCCGUUGAUCAGCUGCUGAAGGACCUGAGAAAGAACCCCAGCAUGAUCAGCGACCCCGACCAGAGAACCGGAAGAGAGCAGCUGUCUAACGACGAGCUGAUUAAGAAGCUGGUCACCGAGCUGGCCGAGAACUCCAUGAUUGAGGCCGAAGAAGUGCGGGGCACCCUGGGCGAUAUCUCUGCCAGAAUCGAGGCCGGCUUUGAGUCUCUGAGCGCCCUGCAGGUUGAGACAAUCCAGACAGCCCAGAGAUGCGACCACAGCGACAGCAUCAGAAUCCUGGGCGAGAACAUCAAGAUCCUGGAUCGGAGCAUGAAGACCAUGAUGGAAACCAUGAAGCUGAUGAUGGAAAAGGUGGACCUGCUGUACGCCAGCACAGCCGUGGGAACAUCUGCUCCCAUGCUGCCUUCUCACCCCGCUCCUCCAAGAAUCUACCCUCAGCUGCCUAGCGCUCCCACCACCGAUGAGUGGGAUAUCAUCCCU [서열번호 358]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 358에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 HPV E7(P03129; 단백질 E7 인간 파필로마바이러스 타입 16), 또는 그의 동원체이다. HPV E7의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 359로 나타낸다:
MHGDTPTLHEYMLDLQPETTDLYCYEQLNDSSEEEDEIDGPAGQAEPDRAHYNIVTFCCKCDSTLRLCVQSTHVDIRTLEDLLMGTLGIVCPICSQKP [서열번호 359]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 359에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 HPV E7 폴리펩티드는 다음과 같은 서열번호 360의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGCATGGAGATACACCTACATTGCATGAATATATGTTAGATTTGCAACCAGAGACAACTGATCTCTACTGTTATGAGCAATTAAATGACAGCTCAGAGGAGGAGGATGAAATAGATGGTCCAGCTGGACAAGCAGAACCGGACAGAGCCCATTACAATATTGTAACCTTTTGTTGCAAGTGTGACTCTACGCTTCGGTTGTGCGTACAAAGCACACACGTAGACATTCGTACTTTGGAAGACCTGTTAATGGGCACACTAGGAATTGTGTGCCCCATCTGTTCTCAGAAACCA [서열번호 360]
따라서, 바람직하게는 상기 HPV E7 폴리펩티드는 실질적으로 서열번호 360에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 HPV E7 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 361로 제공된다:
ATGCACGGCGATACCCCTACACTGCACGAGTACATGCTGGACCTGCAGCCTGAGACAACCGACCTGTACTGCTACGAGCAGCTGAACGACAGCAGCGAGGAAGAGGACGAGATTGACGGACCTGCCGGACAGGCCGAACCTGATAGAGCCCACTACAATATCGTGACCTTCTGCTGCAAGTGCGACAGCACCCTGAGACTGTGTGTGCAGAGCACCCACGTGGACATCAGAACCCTGGAAGATCTGCTGATGGGCACCCTGGGCATCGTGTGCCCTATCTGTTCTCAGAAGCCC [서열번호 361]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 361에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 361의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 362로 제공된다:
AUGCACGGCGAUACCCCUACACUGCACGAGUACAUGCUGGACCUGCAGCCUGAGACAACCGACCUGUACUGCUACGAGCAGCUGAACGACAGCAGCGAGGAAGAGGACGAGAUUGACGGACCUGCCGGACAGGCCGAACCUGAUAGAGCCCACUACAAUAUCGUGACCUUCUGCUGCAAGUGCGACAGCACCCUGAGACUGUGUGUGCAGAGCACCCACGUGGACAUCAGAACCCUGGAAGAUCUGCUGAUGGGCACCCUGGGCAUCGUGUGCCCUAUCUGUUCUCAGAAGCCC [서열번호 362]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 362에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 아레나바이러스 NP1 단백질(A0A2H4RDN2; 핵단백질 아레나바이러스 속(sp.)), 또는 그의 동원체이다. 아레나바이러스 NP1 단백질의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 363으로 나타낸다:
MSNSKEVKSFLWTQALRRELSPYCTSVKLQVIKDAQSLLHSLDFSEVSNVQRLMRKDKRDDGDLKRLRDLNQAVNNLVELKSQQQKNVLSVGQLSSDDLLVLAADIDRLKAKITRTERPQSNGVYMGNLTAQQLEQRKKLLELVGMTRPNLRAGSDGVVRVWDVKNPDLLNNQFGTMPSLTIACMTKQGQSDINDVVQALTDLGLIYTAKYPNSSDLDQLVKTHPVLGIIDTEKSAINVSGYNFSLSAAVKAGACMLDGGNMLETIKVTPQNIDPILKKTLAVKKSVGMFVSDTPGDRNPYENLLYKICLSGNGWPYIASRTSILGRAWDNTVVDLGSSNPITKPLNQQARDKVPGLQQTVGLTYSQIMCLKDIMTGMDPTSKTWIDIEGRAEDPVEIAIYQPAGGQYIHFYREPTDAKQFKQDSKYSHGIDIVDLFRVQPGLTSAVIESLPKGMVLTCQGSEDIRKLLDSQGRRDIKLIDVMMSKIDARKFENEVWDDLKTLCNMHTGVVHEKKKRGGKQEITPHCALLDCIMYEAATQGSYKTPKLTPLLPTDLVFRAGAPKVTL [서열번호 363]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 363에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 아레나바이러스 NP1 폴리펩티드는 다음과 같은 서열번호 364의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGAGCAACTCCAAGGAGGTGAAGTCCTTTCTTTGGACTCAAGCCCTTAGGAGGGAATTATCACCATACTGCACAAGTGTCAAACTTCAAGTTATCAAGGATGCTCAGAGTCTCCTTCACAGCTTGGATTTCTCAGAAGTGAGTAATGTACAACGCTTGATGAGGAAGGACAAAAGGGATGACGGTGACTTGAAGAGGCTGAGAGATTTAAATCAGGCAGTCAACAATCTTGTTGAACTAAAATCTCAACAGCAGAAAAATGTCTTAAGTGTGGGGCAGCTGTCATCTGATGACCTTTTAGTCCTCGCTGCTGACATTGACAGGCTGAAAGCAAAGATAACCAGGACAGAGAGGCCCCAATCTAATGGGGTCTACATGGGGAACCTCACAGCTCAGCAACTTGAACAACGAAAGAAGCTCCTAGAGTTGGTGGGGATGACCAGACCAAACTTAAGAGCTGGTTCTGATGGTGTTGTCAGGGTGTGGGACGTGAAGAATCCTGATCTCTTGAATAACCAATTTGGCACAATGCCCAGTCTAACGATTGCCTGCATGACAAAACAAGGACAATCAGACATAAATGATGTTGTTCAGGCATTAACTGACTTGGGGCTAATTTATACAGCTAAGTACCCAAATTCATCAGATCTTGATCAACTTGTCAAAACCCATCCAGTTTTGGGCATCATAGACACAGAAAAATCTGCCATCAATGTTTCAGGTTACAACTTCAGCCTGTCAGCTGCAGTTAAGGCAGGTGCATGTATGCTAGATGGGGGTAACATGCTCGAGACCATAAAGGTAACACCTCAGAATATTGATCCAATTCTGAAGAAGACTCTGGCAGTTAAAAAGTCTGTTGGCATGTTTGTCTCAGACACACCAGGTGACAGAAACCCATATGAAAACTTACTATACAAGATCTGCCTCTCAGGCAATGGATGGCCCTACATTGCTAGCAGAACTTCAATTCTCGGGAGGGCCTGGGACAACACAGTTGTGGACTTGGGCAGCAGTAACCCAATCACAAAGCCCCTCAATCAGCAAGCTAGAGACAAAGTTCCTGGTTTGCAGCAAACAGTTGGACTCACATACTCACAAATCATGTGTCTCAAAGACATAATGACCGGTATGGACCCGACAAGTAAGACTTGGATTGACATTGAGGGCAGGGCTGAGGACCCAGTGGAGATTGCCATCTACCAGCCAGCTGGTGGGCAATATATTCATTTCTACAGAGAACCAACAGATGCCAAGCAATTTAAGCAGGATTCTAAGTACTCACATGGCATTGACATTGTTGACCTGTTTAGGGTGCAACCAGGCCTTACAAGTGCTGTGATAGAGAGTCTACCGAAAGGGATGGTCTTAACTTGTCAGGGATCTGAGGACATAAGAAAGCTGTTAGATAGTCAGGGGCGCCGAGACATCAAGTTAATTGATGTGATGATGAGCAAGATTGATGCACGGAAGTTTGAAAATGAGGTCTGGGATGATCTTAAAACACTGTGCAACATGCACACTGGGGTGGTCCATGAGAAGAAGAAGAGAGGTGGTAAACAAGAAATAACACCTCACTGTGCACTTCTAGACTGCATTATGTATGAGGCAGCCACCCAGGGGTCATACAAGACCCCCAAATTAACACCTCTGCTACCAACTGACTTGGTGTTTAGAGCAGGAGCACCCAAAGTCACTCTG [서열번호 364]
따라서, 바람직하게는 상기 아레나바이러스 NP1 폴리펩티드는 실질적으로 서열번호 364에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 아레나바이러스 NP1 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 365로 제공된다:
ATGAGCAACAGCAAAGAAGTCAAGAGCTTCCTCTGGACACAGGCCCTGAGAAGAGAGCTGAGCCCTTACTGCACCAGCGTGAAGCTGCAAGTGATCAAGGACGCCCAGAGCCTGCTGCACAGCCTGGATTTTTCCGAGGTGTCCAACGTGCAGCGGCTGATGCGGAAGGACAAGAGAGATGACGGCGACCTGAAGCGGCTGAGGGATCTGAATCAGGCCGTGAACAACCTGGTGGAACTGAAGTCCCAGCAGCAGAAAAACGTGCTGAGCGTGGGCCAGCTGAGCAGCGACGATCTGCTTGTTCTGGCCGCCGACATCGACAGACTGAAGGCCAAGATCACCAGAACCGAGCGGCCTCAGAGCAACGGCGTGTACATGGGAAATCTGACAGCCCAGCAGCTGGAACAGCGGAAGAAACTGCTGGAACTCGTGGGCATGACCCGGCCTAATCTGAGAGCTGGCTCTGATGGCGTCGTCAGAGTGTGGGACGTGAAGAACCCCGACCTGCTGAACAACCAGTTCGGCACCATGCCTAGCCTGACAATCGCCTGCATGACCAAGCAGGGCCAGAGCGACATCAACGATGTGGTGCAGGCACTGACCGACCTGGGCCTGATCTACACCGCCAAGTATCCCAACAGCAGCGACCTGGATCAGCTGGTCAAGACACACCCTGTGCTGGGCATCATCGACACCGAGAAGTCCGCCATCAACGTGTCCGGCTACAACTTCTCTCTGTCTGCCGCCGTGAAAGCCGGCGCTTGTATGCTGGATGGCGGCAACATGCTGGAAACCATCAAAGTGACCCCTCAGAACATCGACCCCATCCTGAAGAAAACCCTGGCCGTGAAGAAAAGCGTGGGGATGTTCGTGTCTGACACCCCTGGCGACAGAAACCCCTACGAGAACCTGCTGTACAAGATCTGCCTGAGCGGCAACGGCTGGCCCTATATCGCCAGCAGAACCAGCATTCTGGGCAGAGCCTGGGACAACACCGTGGTGGATCTGGGCAGCAGCAACCCCATCACCAAGCCTCTGAACCAGCAGGCCAGAGATAAGGTGCCAGGCCTGCAGCAGACAGTGGGCCTGACATACAGCCAGATCATGTGCCTGAAGGACATCATGACCGGCATGGACCCCACCAGCAAGACATGGATCGACATCGAGGGCAGAGCTGAGGACCCTGTGGAAATCGCCATCTACCAACCTGCCGGCGGACAGTACATCCACTTCTACAGAGAGCCCACCGACGCCAAGCAGTTCAAGCAGGACAGCAAGTACAGCCACGGCATCGATATCGTGGACCTGTTCAGAGTGCAGCCCGGACTGACATCTGCCGTGATCGAGTCTCTGCCCAAAGGCATGGTCCTGACCTGTCAGGGCAGCGAGGACATCAGAAAGCTGCTCGACAGCCAGGGCAGAAGAGACATCAAGCTGATCGACGTGATGATGAGCAAGATCGACGCCCGGAAGTTCGAGAACGAAGTGTGGGATGACCTGAAAACCCTCTGCAACATGCACACCGGCGTGGTGCACGAGAAGAAGAAGAGAGGCGGCAAGCAAGAGATCACCCCTCACTGTGCTCTGCTGGACTGCATTATGTACGAGGCCGCCACACAGGGCAGCTACAAGACCCCTAAACTGACCCCTCTGCTGCCTACCGATCTGGTGTTTAGAGCCGGCGCACCCAAAGTGACACTG [서열번호 365]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 365에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 365의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 366으로 제공된다:
AUGAGCAACAGCAAAGAAGUCAAGAGCUUCCUCUGGACACAGGCCCUGAGAAGAGAGCUGAGCCCUUACUGCACCAGCGUGAAGCUGCAAGUGAUCAAGGACGCCCAGAGCCUGCUGCACAGCCUGGAUUUUUCCGAGGUGUCCAACGUGCAGCGGCUGAUGCGGAAGGACAAGAGAGAUGACGGCGACCUGAAGCGGCUGAGGGAUCUGAAUCAGGCCGUGAACAACCUGGUGGAACUGAAGUCCCAGCAGCAGAAAAACGUGCUGAGCGUGGGCCAGCUGAGCAGCGACGAUCUGCUUGUUCUGGCCGCCGACAUCGACAGACUGAAGGCCAAGAUCACCAGAACCGAGCGGCCUCAGAGCAACGGCGUGUACAUGGGAAAUCUGACAGCCCAGCAGCUGGAACAGCGGAAGAAACUGCUGGAACUCGUGGGCAUGACCCGGCCUAAUCUGAGAGCUGGCUCUGAUGGCGUCGUCAGAGUGUGGGACGUGAAGAACCCCGACCUGCUGAACAACCAGUUCGGCACCAUGCCUAGCCUGACAAUCGCCUGCAUGACCAAGCAGGGCCAGAGCGACAUCAACGAUGUGGUGCAGGCACUGACCGACCUGGGCCUGAUCUACACCGCCAAGUAUCCCAACAGCAGCGACCUGGAUCAGCUGGUCAAGACACACCCUGUGCUGGGCAUCAUCGACACCGAGAAGUCCGCCAUCAACGUGUCCGGCUACAACUUCUCUCUGUCUGCCGCCGUGAAAGCCGGCGCUUGUAUGCUGGAUGGCGGCAACAUGCUGGAAACCAUCAAAGUGACCCCUCAGAACAUCGACCCCAUCCUGAAGAAAACCCUGGCCGUGAAGAAAAGCGUGGGGAUGUUCGUGUCUGACACCCCUGGCGACAGAAACCCCUACGAGAACCUGCUGUACAAGAUCUGCCUGAGCGGCAACGGCUGGCCCUAUAUCGCCAGCAGAACCAGCAUUCUGGGCAGAGCCUGGGACAACACCGUGGUGGAUCUGGGCAGCAGCAACCCCAUCACCAAGCCUCUGAACCAGCAGGCCAGAGAUAAGGUGCCAGGCCUGCAGCAGACAGUGGGCCUGACAUACAGCCAGAUCAUGUGCCUGAAGGACAUCAUGACCGGCAUGGACCCCACCAGCAAGACAUGGAUCGACAUCGAGGGCAGAGCUGAGGACCCUGUGGAAAUCGCCAUCUACCAACCUGCCGGCGGACAGUACAUCCACUUCUACAGAGAGCCCACCGACGCCAAGCAGUUCAAGCAGGACAGCAAGUACAGCCACGGCAUCGAUAUCGUGGACCUGUUCAGAGUGCAGCCCGGACUGACAUCUGCCGUGAUCGAGUCUCUGCCCAAAGGCAUGGUCCUGACCUGUCAGGGCAGCGAGGACAUCAGAAAGCUGCUCGACAGCCAGGGCAGAAGAGACAUCAAGCUGAUCGACGUGAUGAUGAGCAAGAUCGACGCCCGGAAGUUCGAGAACGAAGUGUGGGAUGACCUGAAAACCCUCUGCAACAUGCACACCGGCGUGGUGCACGAGAAGAAGAAGAGAGGCGGCAAGCAAGAGAUCACCCCUCACUGUGCUCUGCUGGACUGCAUUAUGUACGAGGCCGCCACACAGGGCAGCUACAAGACCCCUAAACUGACCCCUCUGCUGCCUACCGAUCUGGUGUUUAGAGCCGGCGCACCCAAAGUGACACUG [서열번호 366]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 366에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 HCV NS3 단백질(P27958; 게놈 폴리단백질 C형 간염 바이러스 유전자형 1a(H77 단리물)), 또는 그의 동원체이다. HCV NS3 단백질의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 367로 나타낸다:
APITAYAQQTRGLLGCIITSLTGRDKNQVEGEVQIVSTATQTFLATCINGVCWTVYHGAGTRTIASPKGPVIQTYTNVDQDLVGWPAPQGSRSLTPCTCGSSDLYLVTRHADVIPVRRRGDSRGSLLSPRPISYLKGSSGGPLLCPTGHAVGLFRAAVCTRGVAKAVDFIPVENLETTMRSPVFTDNSSPPAVPQSFQVAHLHAPTGSGKSTKVPAAYAAKGYKVLVLNPSVAATLGFGAYMSKAHGVDPNIRTGVRTITTGSPITYSTYGKFLADAGCSGGAYDIIICDECHSTDATSISGIGTVLDQAETAGARLVVLATATPPGSVTVSHPNIEEVALSTTGEIPFYGKAIPLEVIKGGRHLIFCHSKKKCDELAAKLVALGINAVAYYRGLDVSVIPTSGDVVVVSTDALMTGFTGDFDSVIDCNTCVTQTVDFSLDPTFTIETTTLPQDAVSRTQRRGRTGRGKPGIYRFVAPGERPSGMFDSSVLCECYDAGCAWYELTPAETTVRLRAYMNTPGLPVCQDHLGFWEGVFTGLTHIDAHFLSQTKQSGENFPYLVAYQATVCARAQAPPPSWDQMRKCLIRLKPTLHGPTPLLYRLGAVQNEVTLTHPITKYIMTCMSADLEVVT [서열번호 367]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 367에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 HCV NS3 폴리펩티드는 다음과 같은 서열번호 368의 DNA 뉴클레오티드 서열에 의해 암호화된다:
GCGCCCATCACGGCGTACGCCCAGCAGACGAGAGGCCTCCTAGGGTGTATAATCACCAGCCTGACTGGCCGGGACAAAAACCAAGTGGAGGGTGAGGTCCAGATCGTGTCAACTGCTACCCAGACCTTCCTGGCAACGTGCATCAATGGGGTATGCTGGACTGTCTACCACGGGGCCGGAACGAGGACCATCGCATCACCCAAGGGTCCTGTCATCCAGACGTATACCAATGTGGATCAAGACCTCGTGGGCTGGCCCGCTCCTCAAGGTTCCCGCTCATTGACACCCTGCACCTGCGGCTCCTCGGACCTTTACCTGGTCACGAGGCACGCCGATGTCATTCCCGTGCGCCGGCGAGGTGATAGCAGGGGTAGCCTGCTTTCGCCCCGGCCCATTTCCTACTTGAAAGGCTCCTCGGGGGGTCCGCTGTTGTGCCCCACGGGACACGCCGTGGGCCTATTCAGGGCCGCGGTGTGCACCCGTGGAGTGGCTAAGGCGGTGGACTTTATCCCTGTGGAGAACCTAGAGACAACCATGAGATCCCCGGTGTTCACGGACAACTCCTCTCCACCAGCAGTGCCCCAGAGCTTCCAGGTGGCCCACCTGCATGCTCCCACCGGCAGCGGTAAGAGCACCAAGGTCCCGGCTGCGTACGCAGCCAAGGGCTACAAGGTGTTGGTGCTCAACCCCTCTGTTGCTGCAACACTGGGCTTTGGTGCTTACATGTCCAAGGCCCATGGGGTTGATCCTAATATCAGGACCGGGGTGAGAACAATTACCACTGGCAGCCCCATCACGTACTCCACCTACGGCAAGTTCCTTGCCGACGCCGGGTGCTCAGGAGGTGCTTATGACATAATAATTTGTGACGAGTGCCACTCCACGGATGCCACATCCATCTCGGGCATCGGCACTGTCCTTGACCAAGCAGAGACTGCGGGGGCGAGACTGGTTGTGCTCGCCACTGCTACCCCTCCGGGCTCCGTCACTGTGTCCCATCCTAACATCGAGGAGGTTGCTCTGTCCACCACCGGAGAGATCCCCTTTTACGGCAAGGCTATCCCCCTCGAGGTGATCAAGGGGGGAAGACATCTCATCTTCTGCCACTCAAAGAAGAAGTGCGACGAGCTCGCCGCGAAGCTGGTCGCATTGGGCATCAATGCCGTGGCCTACTACCGCGGTCTTGACGTGTCTGTCATCCCGACCAGCGGCGATGTTGTCGTCGTGTCGACCGATGCTCTCATGACTGGCTTTACCGGCGACTTCGACTCTGTGATAGACTGCAACACGTGTGTCACTCAGACAGTCGATTTTAGCCTTGACCCTACCTTTACCATTGAGACAACCACGCTCCCCCAGGATGCTGTCTCCAGGACTCAACGCCGGGGCAGGACTGGCAGGGGGAAGCCAGGCATCTATAGATTTGTGGCACCGGGGGAGCGCCCCTCCGGCATGTTCGACTCGTCCGTCCTCTGTGAGTGCTATGACGCGGGCTGTGCTTGGTATGAGCTCACGCCCGCCGAGACTACAGTTAGGCTACGAGCGTACATGAACACCCCGGGGCTTCCCGTGTGCCAGGACCATCTTGGATTTTGGGAGGGCGTCTTTACGGGCCTCACTCATATAGATGCCCACTTTCTATCCCAGACAAAGCAGAGTGGGGAGAACTTTCCTTACCTGGTAGCGTACCAAGCCACCGTGTGCGCTAGGGCTCAAGCCCCTCCCCCATCGTGGGACCAGATGCGGAAGTGTTTGATCCGCCTTAAACCCACCCTCCATGGGCCAACACCCCTGCTATACAGACTGGGCGCTGTTCAGAATGAAGTCACCCTGACGCACCCAATCACCAAATACATCATGACATGCATGTCGGCCGACCTGGAGGTCGTCACG [서열번호 368]
따라서, 바람직하게는 상기 HCV NS3 폴리펩티드는 실질적으로 서열번호 368에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 HCV NS3 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 369로 제공된다:
GCCCCTATCACAGCCTACGCTCAGCAGACAAGAGGCCTGCTGGGCTGCATCATCACAAGCCTGACCGGCAGAGACAAGAACCAGGTGGAAGGCGAGGTGCAGATCGTGTCTACAGCTACCCAGACCTTCCTGGCCACCTGTATCAATGGCGTGTGCTGGACCGTGTATCACGGCGCTGGCACCAGAACAATCGCCTCTCCAAAGGGCCCTGTGATCCAGACCTACACCAACGTGGACCAGGATCTCGTTGGCTGGCCTGCTCCTCAGGGCAGCAGATCTCTGACCCCTTGTACATGCGGCAGCAGCGACCTGTACCTGGTCACAAGACACGCCGACGTGATCCCCGTCAGAAGAAGAGGCGATAGCAGAGGCAGCCTGCTGAGCCCTAGACCTATCAGCTACCTGAAGGGCAGCTCTGGCGGACCTCTGCTGTGTCCAACAGGACATGCCGTGGGCCTGTTTAGAGCCGCCGTGTGTACAAGAGGCGTGGCCAAAGCCGTGGACTTCATCCCCGTGGAAAACCTGGAAACCACCATGCGGAGCCCCGTGTTCACCGACAATTCTAGCCCTCCAGCCGTGCCTCAGAGCTTCCAAGTGGCTCATCTGCATGCCCCTACAGGCAGCGGCAAGAGCACAAAAGTGCCTGCCGCCTATGCCGCCAAGGGCTATAAGGTGCTGGTGCTGAATCCCAGCGTGGCCGCCACACTTGGCTTTGGCGCCTATATGTCTAAAGCCCACGGCGTGGACCCCAACATCAGAACCGGCGTGCGGACAATCACAACAGGCAGCCCTATCACCTACTCTACCTACGGCAAGTTCCTGGCCGATGCCGGATGTTCTGGCGGAGCCTACGACATCATCATCTGCGACGAGTGCCACAGCACCGACGCCACATCTATCTCTGGCATCGGCACCGTGCTGGATCAGGCCGAAACAGCTGGTGCTAGACTGGTGGTGCTGGCCACAGCTACACCTCCAGGCTCTGTGACAGTGTCTCACCCCAATATCGAGGAAGTGGCCCTGTCTACAACCGGCGAGATCCCATTCTATGGCAAGGCCATTCCTCTGGAAGTGATCAAAGGCGGCAGACACCTGATCTTTTGCCACTCCAAGAAGAAGTGCGACGAGCTGGCCGCCAAACTGGTGGCCCTTGGAATCAATGCCGTGGCCTACTACAGAGGACTGGACGTGTCCGTGATTCCCACATCTGGCGACGTGGTGGTGGTGTCCACTGATGCCCTGATGACCGGCTTCACCGGCGACTTCGATAGCGTGATCGACTGCAATACCTGCGTGACCCAGACCGTGGATTTCTCTCTGGACCCCACCTTCACCATCGAGACAACCACACTGCCTCAGGACGCCGTGTCTCGGACACAGAGAAGAGGCAGAACCGGAAGAGGCAAGCCCGGCATCTACAGATTTGTGGCCCCTGGCGAAAGACCCAGCGGCATGTTTGATAGCAGCGTGCTGTGCGAGTGCTACGATGCTGGCTGTGCTTGGTACGAGCTGACCCCTGCCGAGACTACCGTTAGACTGCGGGCCTACATGAACACCCCTGGCCTGCCTGTGTGTCAGGACCACCTCGGATTTTGGGAGGGCGTGTTCACAGGACTGACCCACATCGACGCCCACTTTCTGAGCCAGACAAAGCAGAGCGGCGAGAACTTCCCTTACCTGGTGGCTTACCAGGCCACCGTGTGTGCTAGAGCACAAGCCCCTCCACCTAGCTGGGACCAGATGAGGAAGTGCCTGATCCGGCTGAAGCCTACACTGCACGGACCAACACCACTGCTGTATAGACTGGGCGCCGTGCAGAACGAAGTGACCCTGACACATCCCATCACCAAGTACATCATGACCTGCATGAGCGCCGACCTGGAAGTGGTCACA [서열번호 369]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 369에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 369의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 370으로 제공된다:
GCCCCUAUCACAGCCUACGCUCAGCAGACAAGAGGCCUGCUGGGCUGCAUCAUCACAAGCCUGACCGGCAGAGACAAGAACCAGGUGGAAGGCGAGGUGCAGAUCGUGUCUACAGCUACCCAGACCUUCCUGGCCACCUGUAUCAAUGGCGUGUGCUGGACCGUGUAUCACGGCGCUGGCACCAGAACAAUCGCCUCUCCAAAGGGCCCUGUGAUCCAGACCUACACCAACGUGGACCAGGAUCUCGUUGGCUGGCCUGCUCCUCAGGGCAGCAGAUCUCUGACCCCUUGUACAUGCGGCAGCAGCGACCUGUACCUGGUCACAAGACACGCCGACGUGAUCCCCGUCAGAAGAAGAGGCGAUAGCAGAGGCAGCCUGCUGAGCCCUAGACCUAUCAGCUACCUGAAGGGCAGCUCUGGCGGACCUCUGCUGUGUCCAACAGGACAUGCCGUGGGCCUGUUUAGAGCCGCCGUGUGUACAAGAGGCGUGGCCAAAGCCGUGGACUUCAUCCCCGUGGAAAACCUGGAAACCACCAUGCGGAGCCCCGUGUUCACCGACAAUUCUAGCCCUCCAGCCGUGCCUCAGAGCUUCCAAGUGGCUCAUCUGCAUGCCCCUACAGGCAGCGGCAAGAGCACAAAAGUGCCUGCCGCCUAUGCCGCCAAGGGCUAUAAGGUGCUGGUGCUGAAUCCCAGCGUGGCCGCCACACUUGGCUUUGGCGCCUAUAUGUCUAAAGCCCACGGCGUGGACCCCAACAUCAGAACCGGCGUGCGGACAAUCACAACAGGCAGCCCUAUCACCUACUCUACCUACGGCAAGUUCCUGGCCGAUGCCGGAUGUUCUGGCGGAGCCUACGACAUCAUCAUCUGCGACGAGUGCCACAGCACCGACGCCACAUCUAUCUCUGGCAUCGGCACCGUGCUGGAUCAGGCCGAAACAGCUGGUGCUAGACUGGUGGUGCUGGCCACAGCUACACCUCCAGGCUCUGUGACAGUGUCUCACCCCAAUAUCGAGGAAGUGGCCCUGUCUACAACCGGCGAGAUCCCAUUCUAUGGCAAGGCCAUUCCUCUGGAAGUGAUCAAAGGCGGCAGACACCUGAUCUUUUGCCACUCCAAGAAGAAGUGCGACGAGCUGGCCGCCAAACUGGUGGCCCUUGGAAUCAAUGCCGUGGCCUACUACAGAGGACUGGACGUGUCCGUGAUUCCCACAUCUGGCGACGUGGUGGUGGUGUCCACUGAUGCCCUGAUGACCGGCUUCACCGGCGACUUCGAUAGCGUGAUCGACUGCAAUACCUGCGUGACCCAGACCGUGGAUUUCUCUCUGGACCCCACCUUCACCAUCGAGACAACCACACUGCCUCAGGACGCCGUGUCUCGGACACAGAGAAGAGGCAGAACCGGAAGAGGCAAGCCCGGCAUCUACAGAUUUGUGGCCCCUGGCGAAAGACCCAGCGGCAUGUUUGAUAGCAGCGUGCUGUGCGAGUGCUACGAUGCUGGCUGUGCUUGGUACGAGCUGACCCCUGCCGAGACUACCGUUAGACUGCGGGCCUACAUGAACACCCCUGGCCUGCCUGUGUGUCAGGACCACCUCGGAUUUUGGGAGGGCGUGUUCACAGGACUGACCCACAUCGACGCCCACUUUCUGAGCCAGACAAAGCAGAGCGGCGAGAACUUCCCUUACCUGGUGGCUUACCAGGCCACCGUGUGUGCUAGAGCACAAGCCCCUCCACCUAGCUGGGACCAGAUGAGGAAGUGCCUGAUCCGGCUGAAGCCUACACUGCACGGACCAACACCACUGCUGUAUAGACUGGGCGCCGUGCAGAACGAAGUGACCCUGACACAUCCCAUCACCAAGUACAUCAUGACCUGCAUGAGCGCCGACCUGGAAGUGGUCACA [서열번호 370]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 370에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 DENV 1 NS4A 단백질(P17763; 게놈 폴리단백질 뎅기 바이러스 타입 1(나우루/West Pac/1974 바이러스주)), 또는 그의 동원체이다. DENV 1 NS4A 단백질의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 371로 나타낸다:
SVSGDLILEIGKLPQHLTQRAQNALDNLVMLHNSEQGGKAYRHAMEELPDTIETLMLLALIAVLTGGVTLFFLSGRGLGKTSIGLLCVIASSALLWMASVEPHWIAASIILEFFLMVLLIPEPDRQR [서열번호 371]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 371에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 DENV 1 NS4A 폴리펩티드는 다음과 같은 서열번호 372의 DNA 뉴클레오티드 서열에 의해 암호화된다:
AGCGTCTCAGGTGACCTAATATTAGAAATAGGGAAACTTCCACAACATTTAACGCAAAGGGCCCAGAACGCCTTGGACAATCTGGTTATGTTGCACAACTCTGAACAAGGAGGAAAAGCCTATAGACACGCCATGGAAGAACTACCAGACACCATAGAAACGTTAATGCTCCTAGCTTTGATAGCTGTGCTGACTGGTGGAGTGACGTTGTTCTTCCTATCAGGAAGGGGTCTAGGAAAAACATCCATTGGCCTACTCTGCGTGATTGCCTCAAGCGCACTGCTATGGATGGCCAGTGTGGAACCCCATTGGATAGCGGCCTCTATCATACTGGAGTTCTTTCTGATGGTGTTGCTTATTCCAGAGCCGGACAGACAGCGC [서열번호 372]
따라서, 바람직하게는 상기 DENV 1 NS4A 폴리펩티드는 실질적으로 서열번호 372에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 DENV 1 NS4A 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 373으로 제공된다:
TCCGTTAGCGGCGACCTGATCCTGGAAATCGGCAAGCTGCCTCAGCACCTGACACAGAGAGCACAGAACGCCCTGGACAACCTGGTCATGCTGCACAACTCTGAGCAAGGCGGCAAGGCCTACAGACACGCCATGGAAGAACTGCCCGACACCATCGAGACACTGATGCTGCTGGCCCTGATCGCTGTTCTGACAGGCGGAGTGACCCTGTTCTTCCTGTCTGGCAGAGGCCTGGGCAAGACCTCTATCGGACTGCTGTGTGTGATCGCCAGCTCTGCCCTGCTGTGGATGGCTTCTGTGGAACCTCATTGGATCGCCGCCTCTATTATCCTGGAATTCTTCCTGATGGTGCTGCTGATCCCCGAGCCTGACAGACAGAGA [서열번호 373]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 373에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 373의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 374로 제공된다:
UCCGUUAGCGGCGACCUGAUCCUGGAAAUCGGCAAGCUGCCUCAGCACCUGACACAGAGAGCACAGAACGCCCUGGACAACCUGGUCAUGCUGCACAACUCUGAGCAAGGCGGCAAGGCCUACAGACACGCCAUGGAAGAACUGCCCGACACCAUCGAGACACUGAUGCUGCUGGCCCUGAUCGCUGUUCUGACAGGCGGAGUGACCCUGUUCUUCCUGUCUGGCAGAGGCCUGGGCAAGACCUCUAUCGGACUGCUGUGUGUGAUCGCCAGCUCUGCCCUGCUGUGGAUGGCUUCUGUGGAACCUCAUUGGAUCGCCGCCUCUAUUAUCCUGGAAUUCUUCCUGAUGGUGCUGCUGAUCCCCGAGCCUGACAGACAGAGA [서열번호 374]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 374에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 DENV 1 NS2A(P17763; 게놈 폴리단백질 뎅기 바이러스 타입 1(나우루/West Pac/1974 바이러스주)), 또는 그의 동원체이다. DENV 1 NS2A의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 375로 나타낸다:
GSGEVDSFSLGLLCISIMIEEVMRSRWSRKMLMTGTLAVFLLLTMGQLTWNDLIRLCIMVGANASDKMGMGTTYLALMATFRMRPMFAVGLLFRRLTSREVLLLTVGLSLVASVELPNSLEELGDGLAMGIMMLKLLTDFQSHQLWATLLSLTFVKTTFSLHYAWKTMAMILSIVSLFPLCLSTTSQKTTWLPVLLGSLGCKPLTMFLITENKIWGRK [서열번호 375]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 375에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 DENV 1 NS2A 폴리펩티드는 다음과 같은 서열번호 376의 DNA 뉴클레오티드 서열에 의해 암호화된다:
GGGTCAGGAGAAGTGGACAGTTTTTCACTAGGACTGCTATGCATATCAATAATGATCGAAGAGGTAATGAGATCCAGATGGAGCAGAAAAATGCTGATGACTGGAACATTGGCTGTGTTCCTCCTTCTCACAATGGGACAATTGACATGGAATGATCTGATCAGGCTATGTATCATGGTTGGAGCCAACGCTTCAGACAAGATGGGGATGGGAACAACGTACCTAGCTTTGATGGCCACTTTCAGAATGAGACCAATGTTCGCAGTCGGGCTACTGTTTCGCAGATTAACATCTAGAGAAGTTCTTCTTCTTACAGTTGGATTGAGTCTGGTGGCATCTGTAGAACTACCAAATTCCTTAGAGGAGCTAGGGGATGGACTTGCAATGGGCATCATGATGTTGAAATTACTGACTGATTTTCAGTCACATCAGCTATGGGCTACCTTGCTGTCTTTAACATTTGTCAAAACAACTTTTTCATTGCACTATGCATGGAAGACAATGGCTATGATACTGTCAATTGTATCTCTCTTCCCTTTATGCCTGTCCACGACTTCTCAAAAAACAACATGGCTTCCGGTGTTGCTGGGATCTCTTGGATGCAAACCACTAACCATGTTTCTTATAACAGAAAACAAAATCTGGGGAAGGAAA [서열번호 376]
따라서, 바람직하게는 상기 DENV 1 NS2A 폴리펩티드는 실질적으로 서열번호 376에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 DENV 1 NS2A 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 377로 제공된다:
GGATCTGGCGAGGTGGACTCTTTTTCTCTGGGCCTGCTGTGCATCAGCATCATGATCGAGGAAGTGATGCGGAGCCGCTGGTCCCGGAAAATGCTGATGACTGGAACCCTGGCCGTGTTCCTGCTGCTGACAATGGGACAGCTGACCTGGAACGACCTGATCCGGCTGTGTATCATGGTCGGAGCCAACGCCAGCGACAAGATGGGCATGGGCACAACCTATCTGGCCCTGATGGCCACCTTCCGGATGAGGCCTATGTTTGCCGTGGGACTGCTGTTCAGAAGGCTGACCTCTAGAGAGGTGCTGCTGCTCACAGTGGGCCTGTCTCTGGTGGCTTCTGTGGAACTGCCCAACAGCCTGGAAGAACTCGGAGATGGACTGGCCATGGGCATTATGATGCTCAAGCTGCTGACCGACTTCCAGAGCCACCAGCTGTGGGCTACACTGCTGAGCCTGACCTTCGTGAAAACCACCTTCAGCCTGCACTACGCCTGGAAAACAATGGCCATGATCCTGAGCATCGTGTCTCTGTTCCCTCTGTGCCTGAGCACCACCAGCCAGAAAACCACATGGCTGCCTGTGCTGCTGGGCTCTCTGGGCTGTAAACCCCTGACCATGTTCCTGATCACCGAGAACAAGATCTGGGGCAGAAAG [서열번호 377]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 377에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 377의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 378로 제공된다:
GGAUCUGGCGAGGUGGACUCUUUUUCUCUGGGCCUGCUGUGCAUCAGCAUCAUGAUCGAGGAAGUGAUGCGGAGCCGCUGGUCCCGGAAAAUGCUGAUGACUGGAACCCUGGCCGUGUUCCUGCUGCUGACAAUGGGACAGCUGACCUGGAACGACCUGAUCCGGCUGUGUAUCAUGGUCGGAGCCAACGCCAGCGACAAGAUGGGCAUGGGCACAACCUAUCUGGCCCUGAUGGCCACCUUCCGGAUGAGGCCUAUGUUUGCCGUGGGACUGCUGUUCAGAAGGCUGACCUCUAGAGAGGUGCUGCUGCUCACAGUGGGCCUGUCUCUGGUGGCUUCUGUGGAACUGCCCAACAGCCUGGAAGAACUCGGAGAUGGACUGGCCAUGGGCAUUAUGAUGCUCAAGCUGCUGACCGACUUCCAGAGCCACCAGCUGUGGGCUACACUGCUGAGCCUGACCUUCGUGAAAACCACCUUCAGCCUGCACUACGCCUGGAAAACAAUGGCCAUGAUCCUGAGCAUCGUGUCUCUGUUCCCUCUGUGCCUGAGCACCACCAGCCAGAAAACCACAUGGCUGCCUGUGCUGCUGGGCUCUCUGGGCUGUAAACCCCUGACCAUGUUCCUGAUCACCGAGAACAAGAUCUGGGGCAGAAAG [서열번호 378]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 378에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 DENV 2 NS2A(P29990; 게놈 폴리단백질 뎅기 바이러스 타입 2(태국/16681/1984 바이러스주)), 또는 그의 동원체이다. DENV 2 NS2A의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 379로 나타낸다:
GHGQVDNFSLGVLGMALFLEEMLRTRVGTKHAILLVAVSFVTLIIGNMSFRDLGRVMVMVGATMTDDIGMGVTYLALLAAFKVRPTFAAGLLLRKLTSKALMMTTIGIVLSSQSTTPETILELTDALALGMMVLKMVRNMEKYQLAVTIMAILCVPNAVILQNAWKVSCTILAVVSVSPLFLTSSQQKTDWIPLALTIKGLNPTAIFLTTLSRTSKKR [서열번호 379]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 379에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 DENV 2 NS2A 폴리펩티드는 다음과 같은 서열번호 380의 DNA 뉴클레오티드 서열에 의해 암호화된다:
GGACATGGGCAGGTCGACAACTTTTCACTAGGAGTCTTGGGAATGGCATTGTTCCTGGAGGAAATGCTTAGGACCCGAGTAGGAACGAAACATGCAATACTACTAGTTGCAGTTTCTTTTGTGACATTGATCATAGGGAACATGTCCTTTAGAGACCTGGGAAGAGTAATGGTTATGGTAGGCGCCACTATGACGGATGACATAGGTATGGGCGTGACTTATCTTGCCCTACTAGCAGCCTTCAAAGTCAGACCAACTTTTGCAGCTGGACTACTCTTGAGAAAGCTGACCTCCAAGGCATTGATGATGACTACTATAGGAATTGTACTCTCCTCCCAGAGCACTACACCAGAGACCATTCTTGAGTTGACTGATGCGTTAGCCTTAGGCATGATGGTCCTCAAAATGGTGAGAAATATGGAAAAGTATCAATTGGCAGTGACTATCATGGCTATCTTGTGCGTCCCAAACGCAGTGATATTACAAAACGCATGGAAAGTGAGTTGCACGATATTGGCAGTGGTGTCCGTTTCCCCACTGTTCTTAACATCCTCACAGCAAAAAACGGATTGGATACCATTAGCGTTGACGATCAAAGGTCTCAATCCAACAGCTATTTTTCTAACAACCCTCTCAAGAACCAGCAAGAAAAGG [서열번호 380]
따라서, 바람직하게는 상기 DENV 2 NS2A 폴리펩티드는 실질적으로 서열번호 380에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 DENV 2 NS2A 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 381로 제공된다:
GGACACGGACAGGTGGACAATTTTTCCCTGGGCGTGCTCGGCATGGCCCTGTTTCTGGAAGAGATGCTGAGAACCAGAGTGGGCACCAAGCACGCCATTCTGCTGGTGGCCGTGTCCTTCGTGACACTGATCATCGGCAACATGAGCTTCCGCGACCTGGGCAGAGTGATGGTCATGGTCGGAGCCACCATGACCGACGATATCGGCATGGGCGTGACCTATCTGGCTCTGCTGGCCGCTTTTAAAGTGCGGCCTACATTTGCCGCCGGACTGCTGCTGAGAAAGCTGACATCTAAGGCCCTGATGATGACCACCATCGGCATCGTGCTGAGCAGCCAGAGCACCACACCTGAGACAATCCTGGAACTGACCGACGCTCTGGCCCTGGGAATGATGGTGCTGAAGATGGTCCGAAACATGGAAAAGTACCAGCTGGCCGTGACCATCATGGCCATCCTGTGTGTGCCCAACGCCGTGATCCTGCAGAACGCCTGGAAGGTGTCCTGTACCATCCTGGCCGTGGTGTCTGTGTCCCCTCTGTTTCTGACCAGCAGCCAGCAGAAAACCGACTGGATCCCACTGGCTCTGACCATCAAGGGCCTGAATCCTACCGCCATCTTCCTGACCACACTGAGCCGGACCAGCAAGAAGAGA [서열번호 381]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 381에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 381의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 382로 제공된다:
GGACACGGACAGGUGGACAAUUUUUCCCUGGGCGUGCUCGGCAUGGCCCUGUUUCUGGAAGAGAUGCUGAGAACCAGAGUGGGCACCAAGCACGCCAUUCUGCUGGUGGCCGUGUCCUUCGUGACACUGAUCAUCGGCAACAUGAGCUUCCGCGACCUGGGCAGAGUGAUGGUCAUGGUCGGAGCCACCAUGACCGACGAUAUCGGCAUGGGCGUGACCUAUCUGGCUCUGCUGGCCGCUUUUAAAGUGCGGCCUACAUUUGCCGCCGGACUGCUGCUGAGAAAGCUGACAUCUAAGGCCCUGAUGAUGACCACCAUCGGCAUCGUGCUGAGCAGCCAGAGCACCACACCUGAGACAAUCCUGGAACUGACCGACGCUCUGGCCCUGGGAAUGAUGGUGCUGAAGAUGGUCCGAAACAUGGAAAAGUACCAGCUGGCCGUGACCAUCAUGGCCAUCCUGUGUGUGCCCAACGCCGUGAUCCUGCAGAACGCCUGGAAGGUGUCCUGUACCAUCCUGGCCGUGGUGUCUGUGUCCCCUCUGUUUCUGACCAGCAGCCAGCAGAAAACCGACUGGAUCCCACUGGCUCUGACCAUCAAGGGCCUGAAUCCUACCGCCAUCUUCCUGACCACACUGAGCCGGACCAGCAAGAAGAGA [서열번호 382]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 382에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 DENV 4 NS2A(P09866; 게놈 폴리단백질 뎅기 바이러스 타입 4(도미니카/814669/1981 바이러스주)), 또는 그의 동원체이다. DENV 4 NS2A의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 383으로 나타낸다:
GQGTSETFSMGLLCLTLFVEECLRRRVTRKHMILVVVITLCAIILGGLTWMDLLRALIMLGDTMSGRIGGQIHLAIMAVFKMSPGYVLGVFLRKLTSRETALMVIGMAMTTVLSIPHDLMELIDGISLGLILLKIVTQFDNTQVGTLALSLTFIRSTMPLVMAWRTIMAVLFVVTLIPLCRTSCLQKQSHWVEITALILGAQALPVYLMTLMKGASRR [서열번호 383]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 383에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 DENV 4 NS2A 폴리펩티드는 다음과 같은 서열번호 384의 DNA 뉴클레오티드 서열에 의해 암호화된다:
GGACAGGGCACATCAGAAACTTTTTCTATGGGTCTGTTGTGCCTGACCTTGTTTGTGGAAGAATGCTTGAGGAGAAGAGTCACTAGGAAACACATGATATTAGTTGTGGTGATCACTCTTTGTGCTATCATCCTGGGAGGCCTCACATGGATGGACTTACTACGAGCCCTCATCATGTTGGGGGACACTATGTCTGGTAGAATAGGAGGACAGATCCACCTAGCCATCATGGCAGTGTTCAAGATGTCACCAGGATACGTGCTGGGTGTGTTTTTAAGGAAACTCACTTCAAGAGAGACAGCACTAATGGTAATAGGAATGGCCATGACAACGGTGCTTTCAATTCCACATGACCTTATGGAACTCATTGATGGAATATCACTGGGACTAATTTTGCTAAAAATAGTAACACAGTTTGACAACACCCAAGTGGGAACCTTAGCTCTTTCCTTGACTTTCATAAGATCAACAATGCCATTGGTCATGGCTTGGAGGACCATTATGGCTGTGTTGTTTGTGGTCACACTCATTCCTTTGTGCAGGACAAGCTGTCTTCAAAAACAGTCTCATTGGGTAGAAATAACAGCACTCATCCTAGGAGCCCAAGCTCTGCCAGTGTACCTAATGACTCTTATGAAAGGAGCCTCAAGAAGA [서열번호 384]
따라서, 바람직하게는 상기 DENV 4 NS2A 폴리펩티드는 실질적으로 서열번호 384에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 DENV 4 NS2A 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 385로 제공된다:
GGCCAGGGAACAAGCGAGACATTTTCCATGGGCCTGCTGTGTCTGACCCTGTTCGTGGAAGAGTGCCTGCGGAGAAGAGTGACCCGGAAGCACATGATCCTGGTGGTGGTCATCACCCTGTGCGCCATCATTCTCGGCGGCCTGACATGGATGGATCTGCTGAGAGCCCTGATCATGCTGGGCGATACCATGAGCGGCAGAATCGGCGGACAGATCCACCTGGCCATCATGGCCGTGTTCAAGATGAGCCCTGGCTACGTGCTGGGCGTGTTCCTGAGAAAGCTGACCAGCAGAGAAACAGCCCTGATGGTCATCGGAATGGCCATGACCACCGTGCTGAGCATCCCTCACGACCTGATGGAACTGATCGACGGCATCAGCCTGGGCCTGATCCTGCTGAAGATCGTGACCCAGTTCGACAACACCCAAGTGGGCACACTGGCCCTGAGCCTGACCTTCATCAGATCCACAATGCCCCTCGTGATGGCCTGGCGGACAATTATGGCCGTGCTGTTCGTCGTGACACTGATCCCTCTGTGCAGAACCAGCTGCCTGCAGAAACAGAGCCACTGGGTCGAGATCACCGCTCTGATTCTGGGAGCACAGGCCCTGCCTGTGTACCTGATGACACTTATGAAGGGCGCCAGCAGACGG [서열번호 385]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 385에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 385의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 386으로 제공된다:
GGCCAGGGAACAAGCGAGACAUUUUCCAUGGGCCUGCUGUGUCUGACCCUGUUCGUGGAAGAGUGCCUGCGGAGAAGAGUGACCCGGAAGCACAUGAUCCUGGUGGUGGUCAUCACCCUGUGCGCCAUCAUUCUCGGCGGCCUGACAUGGAUGGAUCUGCUGAGAGCCCUGAUCAUGCUGGGCGAUACCAUGAGCGGCAGAAUCGGCGGACAGAUCCACCUGGCCAUCAUGGCCGUGUUCAAGAUGAGCCCUGGCUACGUGCUGGGCGUGUUCCUGAGAAAGCUGACCAGCAGAGAAACAGCCCUGAUGGUCAUCGGAAUGGCCAUGACCACCGUGCUGAGCAUCCCUCACGACCUGAUGGAACUGAUCGACGGCAUCAGCCUGGGCCUGAUCCUGCUGAAGAUCGUGACCCAGUUCGACAACACCCAAGUGGGCACACUGGCCCUGAGCCUGACCUUCAUCAGAUCCACAAUGCCCCUCGUGAUGGCCUGGCGGACAAUUAUGGCCGUGCUGUUCGUCGUGACACUGAUCCCUCUGUGCAGAACCAGCUGCCUGCAGAAACAGAGCCACUGGGUCGAGAUCACCGCUCUGAUUCUGGGAGCACAGGCCCUGCCUGUGUACCUGAUGACACUUAUGAAGGGCGCCAGCAGACGG [서열번호 386]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 386에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 DENV 1 NS2B(P17763; 게놈 폴리단백질 뎅기 바이러스 타입 1(나우루/West Pac/1974 바이러스주)), 또는 그의 동원체이다. DENV 1 NS2B의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 387로 나타낸다:
SWPLNEGIMAVGIVSILLSSLLKNDVPLAGPLIAGGMLIACYVISGSSADLSLEKAAEVSWEEEAEHSGASHNILVEVQDDGTMKIKDEERDDTLTILLKATLLAISGVYPMSIPATLFVWYFWQKKKQR [서열번호 387]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 387에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 DENV 1 NS2B 폴리펩티드는 다음과 같은 서열번호 388의 DNA 뉴클레오티드 서열에 의해 암호화된다:
AGCTGGCCTCTCAATGAAGGAATTATGGCTGTTGGAATAGTTAGCATTCTTCTAAGTTCACTTCTCAAGAATGATGTGCCACTAGCTGGCCCACTAATAGCTGGAGGCATGCTAATAGCATGTTATGTCATATCTGGAAGCTCGGCCGATTTATCACTGGAGAAAGCGGCTGAGGTCTCCTGGGAAGAAGAAGCAGAACACTCTGGTGCCTCACACAACATACTAGTGGAGGTCCAAGATGATGGAACCATGAAGATAAAGGATGAAGAGAGAGATGACACACTCACCATTCTCCTCAAAGCAACTCTGCTAGCAATCTCAGGGGTATACCCAATGTCAATACCGGCGACCCTCTTTGTGTGGTATTTTTGGCAGAAAAAGAAACAGAGA [서열번호 388]
따라서, 바람직하게는 상기 DENV 1 NS2B 폴리펩티드는 실질적으로 서열번호 388에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 DENV 1 NS2B 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 389로 제공된다:
AGCTGGCCTCTGAACGAGGGAATTATGGCCGTGGGCATCGTGTCCATCCTGCTGTCTAGCCTGCTGAAGAACGACGTGCCACTGGCCGGACCTCTTATTGCTGGCGGAATGCTGATCGCCTGCTACGTGATCAGCGGCAGCTCTGCCGATCTGAGCCTGGAAAAAGCCGCCGAGGTGTCCTGGGAAGAAGAGGCCGAACATTCTGGCGCCTCTCACAACATCCTGGTGGAAGTGCAGGACGACGGCACCATGAAGATCAAGGACGAGGAACGGGACGACACCCTGACCATTCTGCTGAAGGCTACCCTGCTGGCCATCAGCGGAGTGTACCCTATGAGCATCCCCGCCACTCTGTTCGTGTGGTACTTCTGGCAGAAGAAGAAGCAGCGG [서열번호 389]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 389에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 389의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 390으로 제공된다:
AGCUGGCCUCUGAACGAGGGAAUUAUGGCCGUGGGCAUCGUGUCCAUCCUGCUGUCUAGCCUGCUGAAGAACGACGUGCCACUGGCCGGACCUCUUAUUGCUGGCGGAAUGCUGAUCGCCUGCUACGUGAUCAGCGGCAGCUCUGCCGAUCUGAGCCUGGAAAAAGCCGCCGAGGUGUCCUGGGAAGAAGAGGCCGAACAUUCUGGCGCCUCUCACAACAUCCUGGUGGAAGUGCAGGACGACGGCACCAUGAAGAUCAAGGACGAGGAACGGGACGACACCCUGACCAUUCUGCUGAAGGCUACCCUGCUGGCCAUCAGCGGAGUGUACCCUAUGAGCAUCCCCGCCACUCUGUUCGUGUGGUACUUCUGGCAGAAGAAGAAGCAGCGG [서열번호 390]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 390에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 DENV 2 NS2B(P29990; 게놈 폴리단백질 뎅기 바이러스 타입 2(태국/16681/1984 바이러스주)), 또는 그의 동원체이다. DENV 2 NS2B의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 391로 나타낸다:
SWPLNEAIMAVGMVSILASSLLKNDIPMTGPLVAGGPLTVCYVLTGRSADLELERAADVKWEDQAEISGSSPILSITISEDGSMSIKNEEEEQTLTILIRTGLLVISGLFPVSIPITAAAWYLWEVKKQR [서열번호 391]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 391에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 DENV 2 NS2B 폴리펩티드는 다음과 같은 서열번호 392의 DNA 뉴클레오티드 서열에 의해 암호화된다:
AGCTGGCCATTAAATGAGGCTATCATGGCAGTCGGGATGGTGAGCATTTTAGCCAGTTCTCTCCTAAAAAATGATATTCCCATGACAGGACCATTAGTGGCTGGAGGGCCCCTCACTGTGTGCTACGTGCTCACTGGACGATCGGCCGATTTGGAACTGGAGAGAGCAGCCGATGTCAAATGGGAAGACCAGGCAGAGATATCAGGAAGCAGCCCAATCCTGTCAATAACAATATCAGAAGATGGTAGCATGTCGATAAAAAATGAAGAGGAAGAACAAACACTGACCATACTCATTAGAACAGGATTGCTGGTGATCTCAGGACTTTTTCCTGTATCAATACCAATCACGGCAGCAGCATGGTACCTGTGGGAAGTGAAGAAACAACGG [서열번호 392]
따라서, 바람직하게는 상기 DENV 2 NS2B 폴리펩티드는 실질적으로 서열번호 392에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 DENV 2 NS2B 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 393으로 제공된다:
AGCTGGCCTCTGAACGAGGCCATTATGGCCGTCGGCATGGTGTCTATCCTGGCCAGCAGCCTGCTGAAGAACGACATCCCTATGACAGGCCCTCTGGTGGCTGGTGGACCTCTGACAGTGTGTTACGTGCTGACAGGCAGAAGCGCCGACCTGGAACTTGAAAGGGCCGCTGATGTGAAGTGGGAAGATCAGGCCGAGATCAGCGGCAGCAGCCCTATCCTGAGCATCACCATCAGCGAGGACGGCAGCATGAGCATCAAGAACGAGGAAGAGGAACAGACCCTGACCATCCTGATCAGAACCGGCCTGCTGGTCATCAGCGGACTGTTCCCTGTGTCAATCCCCATCACAGCCGCCGCTTGGTATCTGTGGGAAGTGAAGAAGCAGCGG [서열번호 393]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 393에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 393의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 394로 제공된다:
AGCUGGCCUCUGAACGAGGCCAUUAUGGCCGUCGGCAUGGUGUCUAUCCUGGCCAGCAGCCUGCUGAAGAACGACAUCCCUAUGACAGGCCCUCUGGUGGCUGGUGGACCUCUGACAGUGUGUUACGUGCUGACAGGCAGAAGCGCCGACCUGGAACUUGAAAGGGCCGCUGAUGUGAAGUGGGAAGAUCAGGCCGAGAUCAGCGGCAGCAGCCCUAUCCUGAGCAUCACCAUCAGCGAGGACGGCAGCAUGAGCAUCAAGAACGAGGAAGAGGAACAGACCCUGACCAUCCUGAUCAGAACCGGCCUGCUGGUCAUCAGCGGACUGUUCCCUGUGUCAAUCCCCAUCACAGCCGCCGCUUGGUAUCUGUGGGAAGUGAAGAAGCAGCGG [서열번호 394]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 394에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 DENV 4 NS2B(P09866; 게놈 폴리단백질 바이러스 타입 4(도미니카/814669/1981 바이러스주)), 또는 그의 동원체이다. DENV 4 NS2B의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 395로 나타낸다:
SWPLNEGIMAVGLVSLLGSALLKNDVPLAGPMVAGGLLLAAYVMSGSSADLSLEKAANVQWDEMADITGSSPIIEVKQDEDGSFSIRDVEETNMITLLVKLALITVSGLYPLAIPVTMTLWYMWQVKTQR [서열번호 395]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 395에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 DENV 4 NS2B 폴리펩티드는 다음과 같은 서열번호 396의 DNA 뉴클레오티드 서열에 의해 암호화된다:
TCTTGGCCTCTTAACGAGGGCATAATGGCTGTGGGTTTGGTTAGTCTCTTAGGAAGCGCTCTTTTAAAGAATGATGTCCCTTTAGCTGGCCCAATGGTGGCAGGAGGCTTACTTCTGGCGGCTTACGTGATGAGTGGTAGCTCAGCAGATCTGTCACTAGAGAAGGCCGCCAACGTGCAGTGGGATGAAATGGCAGACATAACAGGCTCAAGCCCAATCATAGAAGTGAAGCAGGATGAAGATGGCTCTTTCTCCATACGGGACGTCGAGGAAACCAATATGATAACCCTTTTGGTGAAACTGGCACTGATAACAGTGTCAGGTCTCTACCCCTTGGCAATTCCAGTCACAATGACCTTATGGTACATGTGGCAAGTGAAAACACAAAGA [서열번호 396]
따라서, 바람직하게는 상기 DENV 4 NS2B 폴리펩티드는 실질적으로 서열번호 396에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 DENV 4 NS2B 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 397로 제공된다:
AGCTGGCCTCTGAACGAGGGAATCATGGCCGTTGGCCTGGTGTCTCTGCTGGGATCTGCCCTGCTGAAGAACGATGTGCCTCTGGCCGGACCTATGGTTGCTGGTGGACTGCTGCTGGCCGCCTATGTGATGTCTGGAAGCAGCGCCGATCTGAGCCTGGAAAAGGCCGCTAACGTGCAGTGGGACGAGATGGCCGATATCACAGGCAGCAGCCCCATCATCGAAGTGAAGCAGGATGAGGACGGCAGCTTCAGCATCCGCGACGTGGAAGAGACAAACATGATCACCCTGCTGGTCAAGCTGGCCCTGATCACCGTGTCTGGCCTGTATCCTCTGGCTATCCCCGTGACCATGACACTGTGGTACATGTGGCAAGTGAAAACCCAGCGG [서열번호 397]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 397에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 397의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 398로 제공된다:
AGCUGGCCUCUGAACGAGGGAAUCAUGGCCGUUGGCCUGGUGUCUCUGCUGGGAUCUGCCCUGCUGAAGAACGAUGUGCCUCUGGCCGGACCUAUGGUUGCUGGUGGACUGCUGCUGGCCGCCUAUGUGAUGUCUGGAAGCAGCGCCGAUCUGAGCCUGGAAAAGGCCGCUAACGUGCAGUGGGACGAGAUGGCCGAUAUCACAGGCAGCAGCCCCAUCAUCGAAGUGAAGCAGGAUGAGGACGGCAGCUUCAGCAUCCGCGACGUGGAAGAGACAAACAUGAUCACCCUGCUGGUCAAGCUGGCCCUGAUCACCGUGUCUGGCCUGUAUCCUCUGGCUAUCCCCGUGACCAUGACACUGUGGUACAUGUGGCAAGUGAAAACCCAGCGG [서열번호 398]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 398에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 WNV NS4A(P06935; 게놈 폴리단백질 웨스트 나일 바이러스(West Nile virus) NS4A), 또는 그의 동원체이다. WNV NS4A의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 399로 나타낸다:
SQIGLVEVLGRMPEHFMVKTWEALDTMYVVATAEKGGRAHRMALEELPDALQTIVLIALLSVMSLGVFFLLMQRKGIGKIGLGGVILGAATFFCWMAEVPGTKIAGMLLLSLLLMIVLIPEPEKQR [서열번호 399]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 399에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 WNV NS4A 폴리펩티드는 다음과 같은 서열번호 400의 DNA 뉴클레오티드 서열에 의해 암호화된다:
TCACAAATCGGGCTCGTTGAGGTGCTCGGGAGAATGCCTGAACACTTCATGGTGAAAACTTGGGAGGCATTGGACACGATGTATGTGGTGGCGACCGCTGAAAAAGGAGGCCGAGCTCACAGGATGGCTCTTGAGGAGCTACCGGACGCCCTTCAGACAATAGTTTTGATTGCACTATTGAGTGTGATGTCCTTAGGTGTGTTTTTTCTACTCATGCAAAGGAAGGGCATTGGTAAGATTGGCTTGGGAGGAGTAATCTTAGGAGCTGCCACATTCTTCTGCTGGATGGCTGAAGTCCCAGGAACGAAAATAGCAGGCATGCTCCTGCTTTCCCTGCTGCTCATGATTGTTTTGATTCCGGAGCCGGAAAAGCAGCGC [서열번호 400]
따라서, 바람직하게는 상기 WNV NS4A 폴리펩티드는 실질적으로 서열번호 400에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 WNV NS4A 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 401로 제공된다:
TCTCAGATCGGCCTGGTGGAAGTGCTGGGCAGAATGCCTGAGCACTTCATGGTCAAGACCTGGGAAGCCCTGGACACTATGTACGTGGTGGCCACAGCCGAGAAAGGCGGCAGAGCACATAGAATGGCCCTGGAAGAACTGCCCGACGCTCTGCAGACAATCGTGCTGATTGCCCTGCTGAGCGTGATGAGCCTGGGCGTGTTCTTCCTGCTGATGCAGAGAAAAGGCATCGGCAAGATCGGACTCGGCGGCGTTATACTGGGAGCCGCCACCTTCTTTTGCTGGATGGCTGAAGTGCCCGGCACCAAGATTGCCGGAATGCTGCTGCTGTCCCTGCTGCTGATGATTGTGCTGATCCCCGAGCCTGAGAAGCAGAGA [서열번호 401]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 401에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 401의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 402로 제공된다:
UCUCAGAUCGGCCUGGUGGAAGUGCUGGGCAGAAUGCCUGAGCACUUCAUGGUCAAGACCUGGGAAGCCCUGGACACUAUGUACGUGGUGGCCACAGCCGAGAAAGGCGGCAGAGCACAUAGAAUGGCCCUGGAAGAACUGCCCGACGCUCUGCAGACAAUCGUGCUGAUUGCCCUGCUGAGCGUGAUGAGCCUGGGCGUGUUCUUCCUGCUGAUGCAGAGAAAAGGCAUCGGCAAGAUCGGACUCGGCGGCGUUAUACUGGGAGCCGCCACCUUCUUUUGCUGGAUGGCUGAAGUGCCCGGCACCAAGAUUGCCGGAAUGCUGCUGCUGUCCCUGCUGCUGAUGAUUGUGCUGAUCCCCGAGCCUGAGAAGCAGAGA [서열번호 402]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 402에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 WNV NS4B(P06935; 게놈 폴리단백질 웨스트 나일 바이러스 NS4A), 또는 그의 동원체이다. WNV NS4B의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 403으로 나타낸다:
NEMGWLDKTKNDIGSLLGHRPEARETTLGVESFLLDLRPATAWSLYAVTTAVLTPLLKHLITSDYINTSLTSINVQASALFTLARGFPFVDVGVSALLLAVGCWGQVTLTVTVTAAALLFCHYAYMVPGWQAEAMRSAQRRTAAGIMKNVVVDGIVATDVPELERTTPVMQKKVGQIILILVSMAAVVVNPSVRTVREAGILTTAAAVTLWENGASSVWNATTAIGLCHIMRGGWLSCLSIMWTLIKNMEKPGLKR [서열번호 403]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 403에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 WNV NS4B 폴리펩티드는 다음과 같은 서열번호 404의 DNA 뉴클레오티드 서열에 의해 암호화된다:
AATGAAATGGGCTGGCTGGACAAGACCAAGAATGACATTGGCAGCCTGTTGGGGCACAGGCCAGAAGCTAGAGAGACGACCCTGGGAGTTGAGAGCTTCTTACTTGATCTGCGGCCGGCCACGGCATGGTCGCTCTATGCCGTAACGACAGCCGTTCTCACCCCTTTGCTGAAGCATCTAATCACGTCAGACTACATCAACACTTCGTTGACCTCAATAAACGTCCAAGCCAGCGCGTTGTTCACTTTGGCCAGAGGCTTCCCTTTTGTGGACGTTGGTGTGTCAGCTCTCTTGCTGGCGGTCGGGTGCTGGGGTCAGGTGACTCTGACTGTGACTGTGACTGCAGCTGCTCTGCTCTTTTGCCACTATGCTTACATGGTGCCAGGCTGGCAAGCGGAAGCCATGCGATCTGCCCAGCGGCGGACAGCTGCTGGCATCATGAAAAATGTAGTGGTGGATGGGATCGTGGCCACTGATGTACCTGAACTTGAACGAACAACTCCAGTCATGCAGAAAAAAGTTGGACAGATCATATTGATCTTGGTATCAATGGCCGCGGTGGTCGTCAATCCATCAGTGAGAACCGTCAGAGAGGCCGGAATTCTGACTACAGCAGCAGCAGTCACCCTATGGGAGAATGGTGCTAGTTCAGTGTGGAATGCAACGACAGCTATTGGCCTTTGTCACATCATGCGAGGAGGATGGCTCTCGTGTCTCTCCATCATGTGGACTCTCATCAAAAACATGGAGAAACCAGGCCTCAAGAGG [서열번호 404]
따라서, 바람직하게는 상기 WNV NS4B 폴리펩티드는 실질적으로 서열번호 404에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 WNV NS4B 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 405로 제공된다:
AACGAGATGGGCTGGCTGGACAAGACCAAGAACGACATCGGAAGCCTGCTGGGCCACAGACCTGAGGCCAGAGAAACAACCCTGGGCGTCGAGAGCTTCCTGCTGGATCTTAGACCTGCCACCGCTTGGAGCCTGTACGCCGTTACAACAGCCGTGCTGACCCCTCTGCTGAAGCACCTGATCACCAGCGACTACATCAACACCAGCCTGACCAGCATCAACGTGCAGGCCAGCGCTCTGTTTACCCTGGCCAGAGGCTTCCCCTTTGTGGACGTGGGAGTTTCTGCTCTGCTGCTGGCCGTTGGCTGTTGGGGACAAGTGACCCTGACCGTGACAGTGACTGCTGCCGCTCTGCTGTTCTGCCACTACGCCTATATGGTGCCTGGATGGCAGGCCGAGGCCATGAGATCTGCCCAGAGAAGAACAGCCGCCGGAATCATGAAGAACGTGGTGGTGGATGGCATCGTGGCCACCGACGTTCCAGAGCTGGAAAGAACCACACCTGTGATGCAGAAGAAAGTCGGCCAGATCATCCTGATCCTGGTGTCCATGGCCGCCGTGGTGGTCAATCCTAGCGTGCGGACAGTTAGAGAGGCCGGCATCCTGACAACAGCTGCCGCTGTTACCCTGTGGGAGAATGGCGCTAGCAGCGTGTGGAATGCCACCACAGCCATCGGCCTGTGCCACATCATGAGAGGCGGCTGGCTGAGCTGCCTGAGCATCATGTGGACCCTGATCAAGAACATGGAAAAGCCCGGCCTGAAGCGG [서열번호 405]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 405에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 405의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 406으로 제공된다:
AACGAGAUGGGCUGGCUGGACAAGACCAAGAACGACAUCGGAAGCCUGCUGGGCCACAGACCUGAGGCCAGAGAAACAACCCUGGGCGUCGAGAGCUUCCUGCUGGAUCUUAGACCUGCCACCGCUUGGAGCCUGUACGCCGUUACAACAGCCGUGCUGACCCCUCUGCUGAAGCACCUGAUCACCAGCGACUACAUCAACACCAGCCUGACCAGCAUCAACGUGCAGGCCAGCGCUCUGUUUACCCUGGCCAGAGGCUUCCCCUUUGUGGACGUGGGAGUUUCUGCUCUGCUGCUGGCCGUUGGCUGUUGGGGACAAGUGACCCUGACCGUGACAGUGACUGCUGCCGCUCUGCUGUUCUGCCACUACGCCUAUAUGGUGCCUGGAUGGCAGGCCGAGGCCAUGAGAUCUGCCCAGAGAAGAACAGCCGCCGGAAUCAUGAAGAACGUGGUGGUGGAUGGCAUCGUGGCCACCGACGUUCCAGAGCUGGAAAGAACCACACCUGUGAUGCAGAAGAAAGUCGGCCAGAUCAUCCUGAUCCUGGUGUCCAUGGCCGCCGUGGUGGUCAAUCCUAGCGUGCGGACAGUUAGAGAGGCCGGCAUCCUGACAACAGCUGCCGCUGUUACCCUGUGGGAGAAUGGCGCUAGCAGCGUGUGGAAUGCCACCACAGCCAUCGGCCUGUGCCACAUCAUGAGAGGCGGCUGGCUGAGCUGCCUGAGCAUCAUGUGGACCCUGAUCAAGAACAUGGAAAAGCCCGGCCUGAAGCGG [서열번호 406]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 406에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 광견병 바이러스 PP(P69479; 인단백질 광견병 바이러스(ERA 바이러스주)), 또는 그의 동원체이다. 광견병 바이러스 PP의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 407로 나타낸다:
MSKIFVNPSAIRAGLADLEMAEETVDLINRNIEDNQAHLQGEPIEVDNLPEDMGRLHLDDGKSPNPGEMAKVGEGKYREDFQMDEGEDPSFLFQSYLENVGVQIVRQMRSGERFLKIWSQTVEEIISYVAVNFPNPPGKSSEDKSTQTTGRELKKETTPTPSQRESQSSKARMAAQTASGPPALEWSATNEKDDLSVEAEIAHQIAESFSKKYKFPSRSSGILLYNFEQLKMNLDDIVKEAKNVPGVTRLAHDGSKLPLRCVLGWVALANSKKFQLLVESDKLSKIMQDDLNRYTSC [서열번호 407]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 407에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 광견병 바이러스 PP 폴리펩티드는 다음과 같은 서열번호 408의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGAGCAAGATCTTTGTCAATCCTAGTGCTATTAGAGCCGGTCTGGCCGATCTTGAGATGGCTGAAGAAACTGTTGATCTGATCAATAGAAATATCGAAGACAATCAGGCTCATCTCCAAGGGGAACCCATAGAAGTGGACAATCTCCCTGAGGATATGGGGCGACTTCACCTGGATGATGGAAAATCGCCCAACCCTGGTGAGATGGCCAAGGTGGGAGAAGGCAAGTATCGAGAGGACTTTCAGATGGATGAAGGAGAGGATCCTAGCTTCCTGTTCCAGTCATACCTGGAAAATGTTGGAGTCCAAATAGTCAGACAAATGAGGTCAGGAGAGAGATTTCTCAAGATATGGTCACAGACCGTAGAAGAGATTATATCCTATGTCGCGGTCAACTTTCCCAACCCTCCAGGAAAGTCTTCAGAGGATAAATCAACCCAGACTACTGGCCGAGAGCTCAAGAAGGAGACAACACCCACTCCTTCTCAGAGAGAAAGCCAATCATCGAAAGCCAGGATGGCGGCTCAAACTGCTTCTGGCCCTCCAGCCCTTGAATGGTCGGCCACCAATGAAAAGGATGATCTATCAGTGGAGGCTGAGATCGCTCACCAGATTGCAGAAAGTTTCTCCAAAAAATATAAGTTTCCCTCTCGATCCTCAGGGATACTCTTGTATAATTTTGAGCAATTGAAAATGAACCTTGATGATATAGTTAAAGAGGCAAAAAATGTACCAGGTGTGACCCGTTTAGCCCATGACGGGTCCAAACTCCCCCTAAGATGTGTACTGGGATGGGTCGCTTTGGCCAACTCTAAGAAATTCCAGTTGTTAGTCGAATCCGACAAGCTGAGTAAAATCATGCAAGATGACTTGAATCGCTATACATCTTGC [서열번호 408]
따라서, 바람직하게는 상기 광견병 바이러스 PP 폴리펩티드는 실질적으로 서열번호 408에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 광견병 바이러스 PP 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 409로 제공된다:
ATGAGCAAGATCTTCGTGAACCCCAGCGCCATCAGAGCCGGACTGGCTGATCTGGAAATGGCCGAGGAAACCGTGGACCTGATCAACCGGAACATCGAGGACAATCAGGCCCATCTGCAGGGCGAGCCTATCGAGGTTGACAACCTGCCTGAGGACATGGGCAGACTGCACCTGGATGATGGCAAGAGCCCTAATCCTGGCGAGATGGCCAAAGTCGGCGAGGGCAAGTACCGCGAGGACTTCCAAATGGACGAGGGCGAAGATCCCAGCTTCCTGTTCCAGTCCTACCTGGAAAACGTGGGCGTGCAGATCGTGCGGCAGATGAGAAGCGGCGAGCGGTTCCTGAAGATCTGGTCCCAGACCGTGGAAGAGATCATCAGCTACGTGGCCGTGAACTTCCCCAATCCTCCAGGCAAGAGCAGCGAGGACAAGAGCACACAGACCACCGGCAGAGAGCTGAAGAAAGAGACAACCCCTACACCTAGCCAGAGAGAGAGCCAGAGCAGCAAGGCCAGAATGGCCGCTCAGACAGCTTCTGGACCTCCTGCACTTGAGTGGAGCGCCACCAACGAGAAGGACGACCTGTCTGTGGAAGCCGAGATCGCCCACCAGATCGCCGAGAGCTTCAGCAAGAAGTACAAGTTCCCCAGCAGAAGCAGCGGCATCCTGCTGTACAACTTCGAGCAGCTGAAGATGAACCTGGACGACATCGTGAAAGAGGCCAAGAACGTCCCCGGCGTGACAAGACTGGCCCACGATGGATCTAAGCTGCCCCTGAGATGTGTGCTCGGATGGGTTGCCCTGGCCAACAGCAAGAAATTCCAGCTGCTGGTGGAAAGCGACAAGCTGTCCAAGATCATGCAGGACGATCTGAACCGGTACACCAGCTGC [서열번호 409]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 409에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 409의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 410으로 제공된다:
AUGAGCAAGAUCUUCGUGAACCCCAGCGCCAUCAGAGCCGGACUGGCUGAUCUGGAAAUGGCCGAGGAAACCGUGGACCUGAUCAACCGGAACAUCGAGGACAAUCAGGCCCAUCUGCAGGGCGAGCCUAUCGAGGUUGACAACCUGCCUGAGGACAUGGGCAGACUGCACCUGGAUGAUGGCAAGAGCCCUAAUCCUGGCGAGAUGGCCAAAGUCGGCGAGGGCAAGUACCGCGAGGACUUCCAAAUGGACGAGGGCGAAGAUCCCAGCUUCCUGUUCCAGUCCUACCUGGAAAACGUGGGCGUGCAGAUCGUGCGGCAGAUGAGAAGCGGCGAGCGGUUCCUGAAGAUCUGGUCCCAGACCGUGGAAGAGAUCAUCAGCUACGUGGCCGUGAACUUCCCCAAUCCUCCAGGCAAGAGCAGCGAGGACAAGAGCACACAGACCACCGGCAGAGAGCUGAAGAAAGAGACAACCCCUACACCUAGCCAGAGAGAGAGCCAGAGCAGCAAGGCCAGAAUGGCCGCUCAGACAGCUUCUGGACCUCCUGCACUUGAGUGGAGCGCCACCAACGAGAAGGACGACCUGUCUGUGGAAGCCGAGAUCGCCCACCAGAUCGCCGAGAGCUUCAGCAAGAAGUACAAGUUCCCCAGCAGAAGCAGCGGCAUCCUGCUGUACAACUUCGAGCAGCUGAAGAUGAACCUGGACGACAUCGUGAAAGAGGCCAAGAACGUCCCCGGCGUGACAAGACUGGCCCACGAUGGAUCUAAGCUGCCCCUGAGAUGUGUGCUCGGAUGGGUUGCCCUGGCCAACAGCAAGAAAUUCCAGCUGCUGGUGGAAAGCGACAAGCUGUCCAAGAUCAUGCAGGACGAUCUGAACCGGUACACCAGCUGC [서열번호 410]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 410에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 PEDV N 단백질(Q07499; 핵단백질 돼지 유행성 설사 바이러스(CV777 바이러스주)), 또는 그의 동원체이다. PEDV N 단백질의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 411로 나타낸다:
MASVSFQDRGRKRVPLSLYAPLRVTNDKPLSKVLANNAVPTNKGNKDQQIGYWNEQIRWRMRRGERIEQPSNWHFYYLGTGPHGDLRYRTRTEGVFWVAKEGAKTEPTNLGVRKASEKPIIPKFSQQLPSVVEIVEPNTPPASRANSRSRSRGNGNNRSRSPSNNRGNNQSRGNSQNRGNNQGRGASQNRGGNNNNNNKSRNQSNNRNQSNDRGGVTSRDDLVAAVKDALKSLGIGENPDRHKQQQKPKQEKSDNSGKNTPKKNKSRATSKERDLKDIPEWRRIPKGENSVAACFGPRGGFKNFGDAEFVEKGVDASGYAQIASLAPNVAALLFGGNVAVRELADSYEITYNYKMTVPKSDPNVELLVSQVDAFKTGNAKLQRKKEKKNKRETTLQQHEEAIYDDVGAPSDVTHANLEWDTAVDGGDTAVEIINEIFDTGN [서열번호 411]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 411에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 PEDV N 폴리펩티드는 다음과 같은 서열번호 412의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGCTTCTGTCAGCTTTCAGGATCGTGGCCGCAAACGGGTGCCATTATCTCTCTATGCCCCTCTTAGGGTTACTAATGACAAGCCCCTTTCTAAGGTACTTGCAAACAACGCTGTACCCACTAACAAGGGGAATAAGGACCAGCAAATTGGGTACTGGAATGAGCAAATTCGCTGGCGCATGCGCCGTGGTGAGCGAATTGAACAACCTTCCAATTGGCATTTCTACTACCTCGGAACAGGACCTCACGGCGACCTCCGTTATAGGACTCGTACTGAGGGTGTTTTCTGGGTTGCTAAAGAAGGCGCAAAGACTGAACCCACTAATTTGGGTGTCAGAAAGGCGTCTGAAAAGCCAATCATTCCAAAATTCTCTCAACAGCTCCCCAGTGTAGTTGAGATTGTTGAACCTAACACACCTCCTGCTTCACGTGCAAATTCGCGTAGCAGGAGTCGTGGCAATGGCAACAATAGGTCTAGATCTCCAAGTAACAACAGAGGCAATAACCAGTCCCGTGGTAATTCACAGAATCGTGGAAATAACCAGGGTCGTGGAGCTTCTCAGAACAGAGGAGGCAATAATAATAACAATAACAAGTCTCGTAACCAGTCCAATAACAGGAACCAGTCAAATGACCGTGGTGGTGTAACATCACGCGATGATCTGGTGGCTGCTGTCAAGGATGCACTTAAATCTTTGGGTATTGGAGAAAATCCTGACAGGCATAAGCAACAGCAGAAGCCTAAGCAGGAAAAGTCTGACAACAGCGGCAAAAATACACCTAAGAAGAACAAATCCAGGGCCACTTCGAAGGAACGTGACCTCAAAGACATCCCAGAGTGGAGGAGAATTCCCAAGGGCGAAAATAGCGTAGCAGCTTGCTTCGGACCCAGAGGGGGCTTCAAAAACTTTGGAGATGCGGAATTTGTCGAAAAAGGTGTTGATGCGTCAGGCTATGCTCAGATCGCCAGTTTAGCACCAAATGTTGCAGCATTGCTCTTTGGTGGTAATGTGGCTGTTCGTGAGCTAGCGGACTCTTACGAGATTACATACAACTATAAAATGACTGTGCCAAAGTCAGATCCAAATGTTGAGCTTCTTGTTTCACAGGTGGATGCATTTAAAACTGGGAATGCAAAACTCCAGAGAAAGAAGGAAAAGAAGAACAAGCGTGAAACCACGCTGCAGCAGCATGAAGAGGCCATCTACGATGATGTGGGTGCGCCATCTGATGTGACCCATGCCAATCTGGAATGGGACACAGCTGTTGATGGTGGTGATACGGCCGTTGAAATTATCAACGAGATCTTCGATACAGGAAAT [서열번호 412]
따라서, 바람직하게는 상기 PEDV N 폴리펩티드는 실질적으로 서열번호 412에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 PEDV N 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 413으로 제공된다:
ATGGCCAGCGTCAGCTTTCAGGACCGGGGCAGAAAAAGAGTGCCCCTGTCTCTGTACGCCCCTCTGAGAGTGACCAACGACAAGCCCCTGAGCAAGGTGCTGGCCAACAATGCCGTGCCTACCAACAAGGGCAACAAGGACCAGCAGATCGGCTACTGGAACGAGCAGATCCGGTGGCGGATGAGAAGAGGCGAGAGAATCGAGCAGCCCAGCAACTGGCACTTCTACTACCTCGGCACAGGCCCTCACGGCGACCTGAGATACAGAACCAGAACCGAGGGCGTGTTCTGGGTCGCCAAAGAGGGCGCCAAGACCGAGCCTACAAATCTCGGCGTCAGAAAGGCCAGCGAGAAGCCTATCATCCCCAAGTTCAGCCAGCAGCTGCCCAGCGTGGTGGAAATCGTGGAACCCAATACTCCTCCTGCCAGCCGGGCCAACAGCAGAAGCAGATCTAGAGGCAACGGCAACAATCGGAGCAGAAGCCCCAGCAACAACCGGGGCAACAACCAGTCCAGAGGCAACAGCCAGAACCGCGGAAACAATCAAGGCAGAGGCGCTAGCCAGAACAGAGGCGGCAACAACAACAATAACAACAAGAGCCGGAACCAGTCTAACAACCGCAACCAGAGCAACGATAGAGGCGGCGTGACCAGCAGGGATGATCTGGTGGCTGCCGTGAAGGATGCCCTGAAGTCTCTCGGCATCGGCGAGAACCCCGACAGACACAAGCAGCAGCAGAAACCCAAGCAAGAGAAGTCCGACAACAGCGGCAAGAACACCCCTAAGAAGAACAAGAGCAGGGCCACCAGCAAAGAGCGGGACCTGAAGGATATTCCCGAGTGGCGGAGAATCCCCAAGGGCGAGAATTCTGTGGCCGCCTGCTTTGGACCAAGAGGCGGCTTCAAGAATTTCGGCGACGCCGAGTTCGTGGAAAAAGGCGTGGACGCCTCTGGCTATGCCCAGATTGCATCTCTGGCCCCTAATGTGGCTGCCCTGCTGTTTGGCGGAAACGTGGCCGTTAGAGAGCTGGCCGATAGCTACGAGATCACCTACAACTACAAGATGACCGTGCCTAAGAGCGACCCCAACGTGGAACTGCTGGTGTCTCAGGTGGACGCATTCAAGACCGGCAACGCCAAGCTGCAGCGCAAGAAAGAGAAGAAAAACAAGCGCGAGACAACCCTGCAGCAGCACGAGGAAGCTATCTACGACGACGTGGGAGCCCCTTCCGATGTGACACACGCCAACCTGGAATGGGACACAGCAGTGGATGGCGGCGATACCGCCGTGGAAATCATCAACGAGATCTTCGACACCGGCAAC [서열번호 413]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 413에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 413의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 414로 제공된다:
AUGGCCAGCGUCAGCUUUCAGGACCGGGGCAGAAAAAGAGUGCCCCUGUCUCUGUACGCCCCUCUGAGAGUGACCAACGACAAGCCCCUGAGCAAGGUGCUGGCCAACAAUGCCGUGCCUACCAACAAGGGCAACAAGGACCAGCAGAUCGGCUACUGGAACGAGCAGAUCCGGUGGCGGAUGAGAAGAGGCGAGAGAAUCGAGCAGCCCAGCAACUGGCACUUCUACUACCUCGGCACAGGCCCUCACGGCGACCUGAGAUACAGAACCAGAACCGAGGGCGUGUUCUGGGUCGCCAAAGAGGGCGCCAAGACCGAGCCUACAAAUCUCGGCGUCAGAAAGGCCAGCGAGAAGCCUAUCAUCCCCAAGUUCAGCCAGCAGCUGCCCAGCGUGGUGGAAAUCGUGGAACCCAAUACUCCUCCUGCCAGCCGGGCCAACAGCAGAAGCAGAUCUAGAGGCAACGGCAACAAUCGGAGCAGAAGCCCCAGCAACAACCGGGGCAACAACCAGUCCAGAGGCAACAGCCAGAACCGCGGAAACAAUCAAGGCAGAGGCGCUAGCCAGAACAGAGGCGGCAACAACAACAAUAACAACAAGAGCCGGAACCAGUCUAACAACCGCAACCAGAGCAACGAUAGAGGCGGCGUGACCAGCAGGGAUGAUCUGGUGGCUGCCGUGAAGGAUGCCCUGAAGUCUCUCGGCAUCGGCGAGAACCCCGACAGACACAAGCAGCAGCAGAAACCCAAGCAAGAGAAGUCCGACAACAGCGGCAAGAACACCCCUAAGAAGAACAAGAGCAGGGCCACCAGCAAAGAGCGGGACCUGAAGGAUAUUCCCGAGUGGCGGAGAAUCCCCAAGGGCGAGAAUUCUGUGGCCGCCUGCUUUGGACCAAGAGGCGGCUUCAAGAAUUUCGGCGACGCCGAGUUCGUGGAAAAAGGCGUGGACGCCUCUGGCUAUGCCCAGAUUGCAUCUCUGGCCCCUAAUGUGGCUGCCCUGCUGUUUGGCGGAAACGUGGCCGUUAGAGAGCUGGCCGAUAGCUACGAGAUCACCUACAACUACAAGAUGACCGUGCCUAAGAGCGACCCCAACGUGGAACUGCUGGUGUCUCAGGUGGACGCAUUCAAGACCGGCAACGCCAAGCUGCAGCGCAAGAAAGAGAAGAAAAACAAGCGCGAGACAACCCUGCAGCAGCACGAGGAAGCUAUCUACGACGACGUGGGAGCCCCUUCCGAUGUGACACACGCCAACCUGGAAUGGGACACAGCAGUGGAUGGCGGCGAUACCGCCGUGGAAAUCAUCAACGAGAUCUUCGACACCGGCAAC [서열번호 414]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 414에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 HSV1 ICP27(P10238; ICP27 mRNA 내보냄(export) 인자 인간 헤르페스바이러스 1(17 바이러스주)), 또는 그의 동원체이다. HSV1 ICP27의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 415로 나타낸다:
MATDIDMLIDLGLDLSDSDLDEDPPEPAESRRDDLESDSSGECSSSDEDMEDPHGEDGPEPILDAARPAVRPSRPEDPGVPSTQTPRPTERQGPNDPQPAPHSVWSRLGARRPSCSPEQHGGKVARLQPPPTKAQPARGGRRGRRRGRGRGGPGAADGLSDPRRRAPRTNRNPGGPRPGAGWTDGPGAPHGEAWRGSEQPDPPGGQRTRGVRQAPPPLMTLAIAPPPADPRAPAPERKAPAADTIDATTRLVLRSISERAAVDRISESFGRSAQVMHDPFGGQPFPAANSPWAPVLAGQGGPFDAETRRVSWETLVAHGPSLYRTFAGNPRAASTAKAMRDCVLRQENFIEALASADETLAWCKMCIHHNLPLRPQDPIIGTTAAVLDNLATRLRPFLQCYLKARGLCGLDELCSRRRLADIKDIASFVFVILARLANRVERGVAEIDYATLGVGVGEKMHFYLPGACMAGLIEILDTHRQECSSRVCELTASHIVAPPYVHGKYFYCNSLF [서열번호 415]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 415에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 HSV1 ICP27 폴리펩티드는 다음과 같은 서열번호 416의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGCGACTGACATTGATATGCTAATTGACCTCGGCCTGGACCTCTCCGACAGCGATCTGGACGAGGACCCCCCCGAGCCGGCGGAGAGCCGCCGCGACGACCTGGAATCGGACAGCAGCGGGGAGTGTTCCTCGTCGGACGAGGACATGGAAGACCCCCACGGAGAGGACGGACCGGAGCCGATACTCGACGCCGCTCGCCCGGCGGTCCGCCCGTCTCGTCCAGAAGACCCCGGCGTACCCAGCACCCAGACGCCTCGTCCGACGGAGCGGCAGGGCCCCAACGATCCTCAACCAGCGCCCCACAGTGTGTGGTCGCGCCTCGGGGCCCGGCGACCGTCTTGCTCCCCCGAGCAGCACGGGGGCAAGGTGGCCCGCCTCCAACCCCCACCGACCAAAGCCCAGCCTGCCCGCGGCGGACGCCGTGGGCGTCGCAGGGGTCGGGGTCGCGGTGGTCCCGGGGCTGCCGATGGTTTGTCGGACCCCCGCCGGCGTGCCCCCAGAACCAATCGCAACCCTGGGGGACCCCGCCCCGGGGCGGGGTGGACGGACGGCCCCGGCGCCCCCCATGGCGAGGCGTGGCGCGGCAGTGAGCAGCCCGACCCACCCGGAGGCCAGCGGACACGGGGCGTGCGCCAAGCACCCCCCCCGCTAATGACGCTGGCGATTGCCCCCCCGCCCGCGGACCCCCGCGCCCCGGCCCCGGAGCGAAAGGCGCCCGCCGCCGACACCATCGACGCCACCACGCGGTTGGTCCTGCGCTCCATCTCCGAGCGCGCGGCGGTCGACCGCATCAGCGAGAGCTTTGGCCGCAGCGCACAGGTCATGCACGACCCCTTTGGGGGGCAGCCGTTTCCCGCCGCGAATAGCCCCTGGGCCCCGGTGCTGGCGGGCCAAGGAGGGCCCTTTGACGCCGAGACCAGACGGGTCTCCTGGGAAACCTTGGTCGCCCACGGCCCGAGCCTCTATCGCACTTTTGCCGGCAATCCTCGGGCCGCATCGACCGCCAAGGCCATGCGCGACTGCGTGCTGCGCCAAGAAAATTTCATCGAGGCGCTGGCCTCCGCCGACGAGACGCTGGCGTGGTGCAAGATGTGCATCCACCACAACCTGCCGCTGCGCCCCCAGGACCCCATTATCGGGACGACCGCGGCTGTGCTGGATAACCTCGCCACGCGCCTGCGGCCCTTTCTCCAGTGCTACCTGAAGGCGCGAGGCCTGTGCGGCCTGGACGAACTGTGTTCGCGGCGGCGTCTGGCGGACATTAAGGACATTGCATCCTTCGTGTTTGTCATTCTGGCCAGGCTCGCCAACCGCGTCGAGCGTGGCGTCGCGGAGATCGACTACGCGACCCTTGGTGTCGGGGTCGGAGAGAAGATGCATTTCTACCTCCCCGGGGCCTGCATGGCGGGCCTGATCGAAATCCTAGACACGCACCGCCAGGAGTGTTCGAGTCGTGTCTGCGAGTTGACGGCCAGTCACATCGTCGCCCCCCCGTACGTGCACGGCAAATATTTTTATTGCAACTCCCTGTTT [서열번호 416]
따라서, 바람직하게는 상기 HSV1 ICP27 폴리펩티드는 실질적으로 서열번호 416에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 HSV1 ICP27 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 417로 제공된다:
ATGGCCACCGACATCGACATGCTGATCGACCTGGGCCTCGACCTGAGCGACTCTGACCTGGATGAAGATCCTCCTGAGCCTGCCGAGAGCAGAAGGGACGATCTGGAAAGCGATAGCAGCGGCGAGTGTAGCAGCAGCGACGAGGACATGGAAGATCCCCACGGCGAGGATGGACCTGAGCCTATTCTGGATGCCGCCAGACCTGCCGTCAGACCTTCTAGACCTGAAGATCCAGGCGTGCCCAGCACACAGACCCCTAGACCTACAGAGAGACAGGGCCCCAACGATCCTCAGCCTGCTCCTCATAGCGTGTGGTCTAGACTGGGAGCCAGAAGGCCTAGCTGTAGCCCTGAACAGCACGGCGGAAAAGTGGCCAGACTGCAGCCTCCTCCAACAAAGGCTCAACCTGCTAGAGGCGGCAGACGGGGCAGAAGAAGAGGTAGAGGAAGAGGTGGACCTGGCGCCGCTGATGGACTGTCTGATCCTAGAAGAAGGGCCCCTCGGACCAACAGAAATCCTGGCGGACCTAGACCAGGCGCCGGATGGACAGATGGACCAGGTGCTCCACATGGCGAGGCTTGGAGAGGATCTGAGCAGCCTGATCCTCCAGGCGGCCAAAGAACAAGAGGCGTTAGACAGGCTCCTCCTCCTCTGATGACCCTGGCTATTGCTCCTCCACCAGCCGATCCTAGAGCACCCGCTCCAGAAAGAAAAGCCCCTGCCGCCGATACCATCGACGCCACAACAAGACTGGTGCTGCGGAGCATCTCTGAGAGGGCCGCTGTGGATAGAATCAGCGAGAGCTTTGGGAGAAGCGCCCAAGTGATGCACGACCCTTTTGGCGGCCAGCCTTTTCCTGCCGCCAATTCTCCTTGGGCTCCTGTGCTTGCTGGACAAGGCGGCCCTTTTGACGCCGAGACAAGAAGAGTGTCCTGGGAGACACTGGTGGCCCACGGACCTAGCCTGTACAGAACATTCGCCGGCAATCCAAGAGCCGCCAGCACAGCCAAAGCCATGAGAGACTGCGTGCTGAGACAAGAGAACTTCATCGAGGCCCTGGCCAGCGCCGATGAGACACTTGCTTGGTGCAAGATGTGCATCCACCACAACCTGCCTCTGAGGCCACAGGACCCTATCATCGGAACAACAGCTGCCGTGCTGGATAACCTGGCTACCAGACTGAGGCCCTTCCTGCAGTGCTACCTGAAGGCCAGAGGACTGTGTGGCCTGGATGAGCTGTGCTCCAGAAGAAGGCTGGCTGACATCAAGGATATCGCCAGCTTCGTGTTCGTGATTCTGGCCCGGCTGGCCAACAGAGTGGAAAGAGGCGTGGCCGAGATCGACTATGCCACACTCGGAGTTGGCGTGGGCGAGAAGATGCACTTTTATCTGCCTGGCGCCTGCATGGCCGGCCTGATCGAAATTCTGGACACCCACAGACAAGAGTGCAGCTCCAGAGTGTGCGAGCTGACAGCCTCTCACATTGTGGCCCCTCCATACGTGCACGGCAAGTACTTCTACTGCAACAGCCTGTTC [서열번호 417]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 417에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 417의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 418로 제공된다:
AUGGCCACCGACAUCGACAUGCUGAUCGACCUGGGCCUCGACCUGAGCGACUCUGACCUGGAUGAAGAUCCUCCUGAGCCUGCCGAGAGCAGAAGGGACGAUCUGGAAAGCGAUAGCAGCGGCGAGUGUAGCAGCAGCGACGAGGACAUGGAAGAUCCCCACGGCGAGGAUGGACCUGAGCCUAUUCUGGAUGCCGCCAGACCUGCCGUCAGACCUUCUAGACCUGAAGAUCCAGGCGUGCCCAGCACACAGACCCCUAGACCUACAGAGAGACAGGGCCCCAACGAUCCUCAGCCUGCUCCUCAUAGCGUGUGGUCUAGACUGGGAGCCAGAAGGCCUAGCUGUAGCCCUGAACAGCACGGCGGAAAAGUGGCCAGACUGCAGCCUCCUCCAACAAAGGCUCAACCUGCUAGAGGCGGCAGACGGGGCAGAAGAAGAGGUAGAGGAAGAGGUGGACCUGGCGCCGCUGAUGGACUGUCUGAUCCUAGAAGAAGGGCCCCUCGGACCAACAGAAAUCCUGGCGGACCUAGACCAGGCGCCGGAUGGACAGAUGGACCAGGUGCUCCACAUGGCGAGGCUUGGAGAGGAUCUGAGCAGCCUGAUCCUCCAGGCGGCCAAAGAACAAGAGGCGUUAGACAGGCUCCUCCUCCUCUGAUGACCCUGGCUAUUGCUCCUCCACCAGCCGAUCCUAGAGCACCCGCUCCAGAAAGAAAAGCCCCUGCCGCCGAUACCAUCGACGCCACAACAAGACUGGUGCUGCGGAGCAUCUCUGAGAGGGCCGCUGUGGAUAGAAUCAGCGAGAGCUUUGGGAGAAGCGCCCAAGUGAUGCACGACCCUUUUGGCGGCCAGCCUUUUCCUGCCGCCAAUUCUCCUUGGGCUCCUGUGCUUGCUGGACAAGGCGGCCCUUUUGACGCCGAGACAAGAAGAGUGUCCUGGGAGACACUGGUGGCCCACGGACCUAGCCUGUACAGAACAUUCGCCGGCAAUCCAAGAGCCGCCAGCACAGCCAAAGCCAUGAGAGACUGCGUGCUGAGACAAGAGAACUUCAUCGAGGCCCUGGCCAGCGCCGAUGAGACACUUGCUUGGUGCAAGAUGUGCAUCCACCACAACCUGCCUCUGAGGCCACAGGACCCUAUCAUCGGAACAACAGCUGCCGUGCUGGAUAACCUGGCUACCAGACUGAGGCCCUUCCUGCAGUGCUACCUGAAGGCCAGAGGACUGUGUGGCCUGGAUGAGCUGUGCUCCAGAAGAAGGCUGGCUGACAUCAAGGAUAUCGCCAGCUUCGUGUUCGUGAUUCUGGCCCGGCUGGCCAACAGAGUGGAAAGAGGCGUGGCCGAGAUCGACUAUGCCACACUCGGAGUUGGCGUGGGCGAGAAGAUGCACUUUUAUCUGCCUGGCGCCUGCAUGGCCGGCCUGAUCGAAAUUCUGGACACCCACAGACAAGAGUGCAGCUCCAGAGUGUGCGAGCUGACAGCCUCUCACAUUGUGGCCCCUCCAUACGUGCACGGCAAGUACUUCUACUGCAACAGCCUGUUC [서열번호 418]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 418에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 HSV1 VP24(F8RDC3; UL26 인간 헤르페스바이러스 1의 캡시드 스캐폴딩(scaffolding) 단백질 VP24 절단 생성물), 또는 그의 동원체이다. HSV1 VP24의 폴리펩티드 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 419로 나타낸다:
MAADAPGDRMEEPLPDRAVPIYVAGFLALYDSGDSGELALDPDTVRAALPPDNPLPINVDHRAGCEVGRVLAVVDDPRGPFFVGLIACVQLERVLETAASAAIFERRGPPLSREERLLYLITNYLPSVSLATKRLGGEAHPDRTLFAHVALCAIGRRLGTIVTYDTGLDAAIAPFRHLSPASREGARRLAAEAELALSGRTWAPGVEALTHTLLSTAVNNMMLRDRWSLVAERRRQAGIAGHTYLQA [서열번호 419]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 419에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 HSV1 VP24 폴리펩티드는 다음과 같은 서열번호 420의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGCAGCCGATGCCCCGGGAGACAGGATGGAGGAGCCCCTGCCAGACAGGGCCGTGCCCATTTACGTGGCTGGGTTTTTGGCCCTGTATGACAGCGGGGACTCGGGCGAGTTGGCATTGGATCCGGATACGGTGCGGGCGGCCCTGCCTCCGGATAACCCACTCCCGATTAACGTGGACCACCGCGCTGGCTGCGAGGTGGGGCGGGTGCTGGCCGTGGTCGACGACCCCCGCGGGCCGTTTTTTGTGGGGCTGATCGCCTGCGTGCAGCTGGAGCGCGTCCTCGAGACGGCCGCCAGCGCTGCGATTTTCGAGCGCCGCGGGCCGCCGCTCTCCCGGGAGGAGCGCCTGTTGTACCTGATCACCAACTACCTGCCCTCGGTCTCCCTGGCCACAAAACGCCTGGGGGGCGAGGCGCACCCCGATCGCACGCTGTTCGCGCACGTCGCGCTGTGCGCGATCGGGAGGCGCCTCGGCACTATCGTCACCTACGACACCGGTCTCGACGCCGCCATCGCGCCCTTTCGCCACCTGTCGCCGGCGTCTCGCGAGGGGGCGCGGCGACTGGCCGCCGAGGCCGAGCTCGCGCTGTCCGGACGCACCTGGGCGCCCGGCGTGGAGGCGCTGACCCACACGCTGCTTTCCACCGCCGTTAACAACATGATGCTGCGGGACCGCTGGAGCCTGGTGGCCGAGCGGCGGCGGCAGGCCGGGATTGCCGGACACACCTACCTCCAGGCG [서열번호 420]
따라서, 바람직하게는 상기 HSV1 VP24 폴리펩티드는 실질적으로 서열번호 420에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 HSV1 VP24 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 421로 제공된다:
ATGGCTGCTGATGCCCCTGGCGACAGAATGGAAGAACCCCTGCCTGATAGAGCCGTGCCTATCTACGTGGCCGGATTTCTGGCCCTGTACGACTCTGGCGATTCTGGCGAACTGGCCCTGGATCCTGATACAGTCAGAGCCGCTCTGCCTCCTGACAACCCTCTGCCAATCAACGTGGACCACAGAGCCGGCTGTGAAGTGGGAAGAGTGCTGGCCGTGGTGGACGATCCTAGAGGCCCTTTCTTTGTGGGCCTGATCGCCTGCGTGCAGCTGGAAAGAGTTCTGGAAACAGCCGCCAGCGCCGCCATCTTCGAAAGAAGAGGACCTCCTCTGAGCCGGGAAGAGAGACTGCTGTACCTGATCACCAACTACCTGCCTAGCGTGTCCCTGGCCACAAAGAGACTTGGCGGAGAGGCCCATCCTGACAGAACCCTGTTTGCCCATGTGGCCCTGTGTGCCATTGGTAGAAGGCTGGGCACCATCGTGACCTACGATACAGGACTGGACGCCGCTATCGCCCCATTCAGACATCTGAGCCCTGCCAGCAGAGAAGGCGCCAGAAGGCTTGCTGCTGAAGCCGAACTGGCTCTGAGCGGCAGAACATGGGCTCCAGGTGTTGAAGCCCTGACACACACCCTGCTGAGCACCGCCGTGAACAACATGATGCTGCGGGACAGATGGTCCCTGGTGGCCGAGAGAAGAAGGCAGGCTGGAATTGCCGGCCACACATATCTGCAGGCT [서열번호 421]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 421에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 421의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 422로 제공된다:
AUGGCUGCUGAUGCCCCUGGCGACAGAAUGGAAGAACCCCUGCCUGAUAGAGCCGUGCCUAUCUACGUGGCCGGAUUUCUGGCCCUGUACGACUCUGGCGAUUCUGGCGAACUGGCCCUGGAUCCUGAUACAGUCAGAGCCGCUCUGCCUCCUGACAACCCUCUGCCAAUCAACGUGGACCACAGAGCCGGCUGUGAAGUGGGAAGAGUGCUGGCCGUGGUGGACGAUCCUAGAGGCCCUUUCUUUGUGGGCCUGAUCGCCUGCGUGCAGCUGGAAAGAGUUCUGGAAACAGCCGCCAGCGCCGCCAUCUUCGAAAGAAGAGGACCUCCUCUGAGCCGGGAAGAGAGACUGCUGUACCUGAUCACCAACUACCUGCCUAGCGUGUCCCUGGCCACAAAGAGACUUGGCGGAGAGGCCCAUCCUGACAGAACCCUGUUUGCCCAUGUGGCCCUGUGUGCCAUUGGUAGAAGGCUGGGCACCAUCGUGACCUACGAUACAGGACUGGACGCCGCUAUCGCCCCAUUCAGACAUCUGAGCCCUGCCAGCAGAGAAGGCGCCAGAAGGCUUGCUGCUGAAGCCGAACUGGCUCUGAGCGGCAGAACAUGGGCUCCAGGUGUUGAAGCCCUGACACACACCCUGCUGAGCACCGCCGUGAACAACAUGAUGCUGCGGGACAGAUGGUCCCUGGUGGCCGAGAGAAGAAGGCAGGCUGGAAUUGCCGGCCACACAUAUCUGCAGGCU [서열번호 422]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 422에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 구현예에서, 상기 적어도 하나의 IIP는 뮤린 CTMV M45(Q06A28; 리보뉴클레오시드-디포스페이트 리덕타아제(reductase) 큰 서브유닛-유사 단백질 뮤린 헤르페스바이러스 1(스미스 바이러스주) 뮤린 사이토메갈로바이러스(Cytomegalovirus) M45 단백질), 또는 그의 동원체이다. [Fliss P, Pechenick Jowers T et al (2012) Viral Mediated Redirection of NEMO/IKKγ to Autophagosomes Curtails the Inflammatory Cascade. PLoS Pathogens 8, 2]. M45는 NEMO의 프로테아좀(proteasome)-독립적 분해를 유도하는 것으로 여겨진다. 뮤린 CTMV M45의 폴리펩티드 서열의 한 구현예 본 명세서에서 다음과 같은 서열번호 423으로 나타낸다:
MDRQPKVYSDPDNGFFFLDVPMPDDGQGGQQTATTAAGGAFGVGGGHSVPYVRIMNGVSGIQIGNHNAMSIASCWSPSYTDRRRRSYPKTATNAAADRVAAAVSAANAAVNAAAAAAAAGGGGGANLLAAAVTCANQRGCCGGNGGHSLPPTRMPKTNATAAAAPAVAGASNAKSDNNHANATSGAGSAAATPAATTPAATAVENRRPSPSPSTASTAPCDEGSSPRHHRPSHVSVGTQATPSTPIPIPAPRCSTGQQQQQPQAKKLKPAKADPLLYAATMPPPASVTTAAAAAVAPESESSPAASAPPAAAAMATGGDDEDQSSFSFVSDDVLGEFEDLRIAGLPVRDEMRPPTPTMTVIPVSRPFRAGRDSGRDALFDDAVESVRCYCHGILGNSRFCALVNEKCSEPAKERMARIRRYAADVTRCGPLALYTAIVSSANRLIQTDPSCDLDLAECYVETASKRNAVPLSAFYRDCDRLRDAVAAFFKTYGMVVDAMAQRITERVGPALGRGLYSTVVMMDRCGNSFQGREETPISVFARVAAALAVECEVDGGVSYKILSSKPVDAAQAFDAFLSALCSFAIIPSPRVLAYAGFGGSNPIFDAVSYRAQFYSAESTINGTLHDICDMVTNGLSVSVSAADLGGDIVASLHILGQQCKALRPYARFKTVLRIYFDIWSVDALKIFSFILDVGREYEGLMAFAVNTPRIFWDRYLDSSGDKMWLMFARREAAALCGLDLKSFRNVYEKMERDGRSAITVSPWWAVCQLDACVARGNTAVVFPHNVKSMIPENIGRPAVCGPGVSVVSGGFVGCTPIHELCINLENCVLEGAAVESSVDVVLGLGCRFSFKALESLVRDAVVLGNLLIDMTVRTNAYGAGKLLTLYRDLHIGVVGFHAVMNRLGQKFADMESYDLNQRIAEFIYYTAVRASVDLCMAGADPFPKFPKSLYAAGRFYPDLFDDDERGPRRMTKEFLEKLREDVVKHGIRNASFITGCSADEAANLAGTTPGFWPRRDNVFLEQTPLMMTPTKDQMLDECVRSVKIEPHRLHEEDLSCLGENRPVELPVLNSRLRQISKESATVAVRRGRSAPFYDDSDDEDEVACSETGWTVSTDAVIKMCVDRQPFVDHAQSLPVAIGFGGSSVELARHLRRGNALGLSVGVYKCSMPPSVNYR [서열번호 423]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 423에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 뮤린 CTMV M45 폴리펩티드는 다음과 같은 서열번호 424의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGATCGCCAGCCCAAAGTCTACTCCGACCCGGACAACGGATTCTTCTTTTTGGATGTCCCCATGCCTGACGACGGGCAGGGAGGCCAGCAGACCGCCACCACCGCTGCCGGGGGAGCCTTCGGGGTGGGTGGGGGGCACAGCGTGCCCTACGTCAGGATCATGAATGGAGTCTCTGGAATACAGATCGGAAACCATAATGCTATGAGCATCGCCTCTTGCTGGAGTCCCTCCTACACTGACCGACGCCGCAGGAGCTACCCCAAGACCGCGACCAACGCGGCGGCAGACAGGGTCGCCGCTGCCGTCTCCGCCGCCAATGCTGCTGTCAATGCTGCTGCCGCGGCTGCTGCCGCCGGCGGGGGCGGCGGCGCTAACCTACTGGCTGCTGCTGTCACTTGTGCAAATCAGCGAGGTTGCTGCGGAGGAAATGGGGGGCATTCCCTCCCTCCCACCCGAATGCCGAAGACCAACGCTACCGCCGCGGCCGCTCCTGCCGTCGCCGGTGCTTCCAACGCCAAGAGTGACAACAATCACGCTAACGCCACCTCTGGTGCTGGATCCGCGGCCGCCACCCCCGCCGCCACCACCCCCGCCGCCACCGCCGTCGAAAACCGACGACCCAGCCCGAGCCCCTCTACAGCCTCGACTGCGCCCTGTGACGAGGGATCTTCTCCTCGCCACCATCGTCCTAGTCACGTTAGTGTCGGCACTCAGGCGACTCCGTCGACTCCTATCCCGATTCCCGCTCCCCGGTGCAGCACAGGCCAACAACAACAGCAACCTCAAGCCAAGAAGCTTAAGCCCGCTAAAGCTGATCCCCTCCTGTACGCGGCGACGATGCCGCCTCCCGCGAGCGTAACGACCGCCGCTGCCGCTGCCGTCGCCCCTGAATCCGAATCCTCACCTGCCGCTTCGGCACCACCAGCAGCAGCAGCGATGGCGACCGGGGGAGACGACGAAGATCAGTCGTCTTTCTCGTTCGTGAGCGACGACGTCCTCGGAGAATTCGAAGATCTGCGCATCGCCGGGCTCCCCGTCAGGGACGAGATGCGCCCCCCGACCCCGACGATGACGGTCATTCCCGTCAGCAGGCCCTTCCGCGCGGGGCGCGACAGCGGGCGCGACGCCTTGTTTGACGACGCCGTCGAGTCCGTGCGCTGCTACTGCCACGGCATCCTCGGCAACAGCCGATTCTGCGCCCTCGTCAACGAGAAGTGCTCCGAACCCGCCAAGGAGCGCATGGCTCGCATCCGCCGCTACGCCGCGGACGTGACGCGCTGCGGACCCCTCGCGCTCTACACCGCCATCGTCTCCAGCGCCAACCGTCTCATCCAGACCGACCCGTCGTGCGACCTGGATCTCGCCGAATGTTACGTCGAGACGGCGTCCAAGAGGAACGCCGTCCCCCTCTCGGCCTTCTACCGCGACTGCGATCGCCTGCGGGATGCTGTCGCCGCGTTCTTCAAGACCTACGGCATGGTGGTGGACGCCATGGCGCAGCGCATCACGGAGCGGGTCGGGCCGGCCCTGGGTAGGGGCCTCTACTCGACCGTCGTCATGATGGATCGCTGCGGAAACAGCTTCCAGGGACGCGAGGAGACCCCCATCTCCGTCTTCGCCCGGGTCGCCGCGGCTCTCGCCGTCGAGTGCGAGGTCGACGGGGGCGTCTCGTACAAGATCCTCAGCTCCAAGCCCGTCGACGCCGCGCAGGCCTTCGACGCCTTCCTCTCCGCCCTCTGCTCCTTCGCCATCATCCCCTCGCCGCGGGTCCTGGCCTACGCCGGGTTCGGCGGTTCCAACCCGATCTTCGACGCCGTTTCTTACCGCGCTCAGTTCTACTCGGCCGAGAGCACGATCAACGGCACCCTGCACGACATCTGCGACATGGTGACCAACGGCCTCTCGGTGTCCGTCAGCGCGGCGGACCTCGGAGGCGACATCGTGGCCTCTCTGCACATCCTCGGACAGCAGTGCAAGGCGCTGCGGCCGTACGCGCGATTCAAGACCGTCTTGAGGATCTACTTCGACATCTGGTCCGTCGACGCTCTCAAGATCTTCTCTTTCATCCTCGACGTCGGGCGGGAATACGAGGGCCTGATGGCCTTCGCGGTCAACACGCCGAGGATCTTCTGGGATCGCTACCTAGACAGCTCCGGCGACAAGATGTGGCTCATGTTCGCGAGGCGGGAGGCCGCGGCCCTGTGCGGCCTCGACCTCAAGTCCTTCCGTAACGTCTACGAGAAGATGGAGCGTGACGGGCGCAGCGCCATCACCGTCTCGCCCTGGTGGGCCGTCTGTCAGCTCGACGCGTGCGTGGCGCGGGGCAACACGGCCGTGGTCTTCCCTCACAACGTCAAGAGTATGATCCCCGAGAACATCGGGCGCCCCGCCGTGTGCGGACCCGGCGTCTCCGTCGTCTCCGGCGGCTTCGTCGGCTGTACCCCCATCCACGAGCTGTGCATCAACCTGGAGAACTGCGTCCTGGAGGGCGCGGCAGTCGAGAGCTCCGTCGACGTGGTCCTCGGTCTCGGTTGCCGCTTCAGCTTCAAGGCCCTGGAGTCCCTGGTCCGCGACGCGGTGGTGCTGGGTAACCTGCTCATCGACATGACCGTGCGCACCAACGCGTACGGCGCCGGCAAGCTCCTGACGCTCTATCGCGACCTGCACATCGGGGTCGTCGGCTTCCACGCTGTGATGAATCGCCTCGGGCAGAAGTTCGCCGACATGGAGTCTTACGACCTCAACCAGCGTATCGCGGAGTTTATCTACTACACCGCCGTGCGGGCCAGCGTCGACCTGTGCATGGCGGGCGCCGATCCGTTCCCCAAGTTCCCTAAGAGCCTGTACGCGGCCGGCCGCTTCTACCCCGACCTCTTCGACGACGACGAGCGCGGCCCGCGTCGCATGACCAAGGAGTTCCTCGAGAAACTACGTGAAGACGTGGTGAAACACGGCATCAGGAACGCCTCCTTCATCACCGGCTGCTCGGCCGACGAAGCCGCCAACCTGGCGGGCACCACTCCGGGCTTCTGGCCGCGCCGCGACAACGTCTTTCTCGAGCAGACGCCGCTCATGATGACCCCGACGAAGGATCAGATGCTCGATGAGTGCGTGCGCTCCGTCAAGATCGAGCCCCATCGCCTGCACGAGGAGGATCTCTCCTGTCTCGGCGAGAACCGGCCCGTCGAGCTGCCCGTGCTCAACAGCCGCCTCAGGCAGATCTCGAAAGAGTCCGCGACGGTCGCCGTGCGCCGCGGCCGCTCGGCGCCCTTCTACGACGACTCGGACGACGAGGACGAGGTGGCGTGCTCCGAGACCGGCTGGACCGTGTCGACCGACGCGGTCATCAAGATGTGCGTCGACAGACAGCCGTTCGTCGACCATGCGCAGTCGCTGCCCGTCGCCATCGGCTTCGGGGGGTCTTCGGTGGAATTGGCGCGTCATCTGAGACGAGGGAACGCTCTGGGACTGTCCGTCGGAGTATATAAATGTAGTATGCCCCCTTCCGTGAATTATCGC [서열번호 424]
따라서, 바람직하게는 상기 뮤린 CTMV M45 폴리펩티드는 실질적으로 서열번호 424에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
상기 뮤린 CTMV M45 폴리펩티드를 암호화하는 코돈 최적화된 핵산(DNA)의 한 구현예는 본 명세서에서 다음과 같은 서열번호 425로 제공된다:
ATGGACAGACAGCCCAAGGTGTACAGCGACCCCGACAACGGCTTCTTCTTCCTGGATGTGCCCATGCCTGACGATGGCCAAGGCGGACAGCAGACAGCTACAACAGCTGCCGGCGGAGCCTTTGGAGTTGGCGGAGGACATTCTGTGCCCTACGTGCGGATCATGAATGGCGTGTCCGGCATCCAGATCGGCAACCACAACGCCATGTCTATCGCCAGCTGTTGGAGCCCCAGCTACACCGATCGGCGGAGAAGAAGCTACCCTAAGACCGCCACAAACGCCGCTGCCGATAGAGTGGCTGCTGCTGTGTCTGCCGCTAACGCTGCTGTGAATGCTGCTGCCGCTGCTGCAGCCGCAGGCGGCGGAGGCGGAGCTAATCTTCTTGCAGCAGCCGTGACCTGCGCCAACCAGAGAGGATGTTGCGGAGGAAATGGCGGCCACAGCCTGCCTCCAACCAGAATGCCTAAGACCAATGCCACAGCCGCTGCAGCTCCAGCAGTTGCCGGTGCCTCTAATGCCAAGAGCGACAACAACCACGCCAACGCCACATCTGGCGCTGGATCTGCTGCTGCTACACCAGCCGCTACAACACCAGCTGCCACCGCCGTTGAGAACAGAAGGCCATCTCCAAGTCCTAGCACCGCCAGCACAGCCCCTTGTGATGAGGGAAGCAGCCCCAGACACCACAGACCTAGCCATGTGTCTGTGGGCACACAGGCCACACCTAGCACACCAATTCCTATTCCAGCTCCTCGGTGCTCCACAGGCCAGCAGCAACAACAGCCTCAGGCCAAGAAGCTGAAGCCCGCCAAAGCTGACCCTCTGCTGTATGCCGCAACCATGCCTCCTCCAGCCTCTGTGACTACTGCCGCAGCAGCTGCAGTGGCCCCTGAGTCTGAATCTTCTCCTGCCGCTTCTGCCCCTCCAGCAGCCGCCGCTATGGCTACAGGCGGAGATGATGAGGACCAGAGCAGCTTCTCCTTCGTGTCCGATGATGTGCTGGGCGAGTTCGAGGACCTGAGAATTGCTGGACTGCCCGTGCGGGATGAGATGAGGCCTCCTACACCTACCATGACAGTGATCCCCGTGTCTCGGCCTTTCAGAGCCGGCAGAGATTCTGGCAGAGATGCCCTGTTCGACGACGCCGTGGAAAGCGTGCGGTGTTACTGTCACGGCATCCTGGGCAACAGCAGATTCTGCGCCCTGGTCAACGAGAAGTGTAGCGAGCCTGCCAAAGAACGGATGGCCCGGATTAGAAGATACGCCGCCGACGTGACAAGATGCGGACCTCTGGCTCTGTACACCGCCATTGTGTCTAGCGCCAACCGGCTGATCCAGACAGACCCTAGCTGTGACCTGGATCTGGCCGAGTGCTACGTGGAAACCGCCTCCAAGAGAAACGCCGTGCCTCTGAGCGCCTTCTACAGAGACTGCGACAGACTGAGAGATGCCGTGGCCGCCTTCTTCAAGACCTACGGCATGGTGGTGGACGCCATGGCTCAGAGAATCACCGAGAGAGTGGGACCCGCTCTCGGCAGAGGACTGTATTCTACCGTGGTCATGATGGACAGATGCGGCAACAGCTTCCAGGGCAGAGAAGAGACACCCATCAGCGTGTTCGCCAGAGTGGCTGCTGCTCTGGCCGTGGAATGTGAAGTGGATGGCGGCGTGTCCTACAAGATCCTGAGCAGCAAGCCTGTGGATGCCGCTCAGGCCTTCGATGCCTTTCTGAGCGCCCTGTGCAGCTTCGCCATCATTCCATCTCCAAGAGTGCTGGCCTACGCCGGCTTTGGCGGCAGCAATCCTATCTTTGACGCCGTGTCTTACAGGGCCCAGTTCTACAGCGCCGAGAGCACCATCAATGGCACCCTGCACGACATCTGCGACATGGTCACAAACGGCCTGTCCGTGTCTGTGTCTGCCGCTGATCTCGGCGGAGATATCGTGGCCTCTCTGCACATTCTGGGCCAGCAGTGCAAAGCCCTGAGGCCTTACGCCAGATTCAAGACCGTGCTGCGGATCTACTTCGACATTTGGAGCGTGGACGCCCTGAAGATCTTTAGCTTCATCCTGGACGTGGGGCGCGAGTACGAAGGACTGATGGCCTTTGCCGTGAATACCCCTCGGATCTTCTGGGACAGATACCTGGACAGCAGCGGCGACAAGATGTGGCTGATGTTTGCCAGAAGAGAAGCCGCCGCTCTGTGCGGCCTGGATCTGAAGTCCTTCCGGAACGTGTACGAGAAGATGGAACGCGACGGCCGCTCTGCCATCACAGTTAGTCCTTGGTGGGCCGTGTGTCAGCTGGATGCCTGTGTGGCCAGAGGCAATACCGCCGTGGTGTTCCCTCACAACGTGAAGTCTATGATCCCCGAGAACATCGGCAGGCCAGCCGTGTGTGGACCTGGCGTTAGTGTTGTGTCTGGCGGCTTCGTGGGCTGCACACCTATTCACGAGCTGTGCATCAACCTGGAAAACTGCGTGCTGGAAGGCGCCGCTGTGGAATCCTCTGTGGATGTGGTGCTCGGCCTGGGCTGCAGATTCAGCTTTAAGGCCCTGGAAAGCCTCGTGCGGGATGCTGTGGTTCTGGGCAACCTGCTGATCGACATGACCGTGCGGACCAATGCCTATGGCGCTGGCAAACTGCTGACCCTGTACCGGGATCTGCACATCGGCGTTGTGGGATTCCACGCCGTGATGAACAGACTGGGCCAGAAATTCGCCGACATGGAAAGCTACGACCTGAACCAGCGGATCGCCGAGTTCATCTACTACACAGCCGTCAGAGCCAGCGTGGACCTGTGTATGGCTGGCGCCGATCCATTTCCTAAGTTCCCCAAGAGCCTGTACGCCGCTGGCAGATTCTACCCCGACCTGTTCGACGACGATGAGAGGGGCCCTAGACGGATGACCAAAGAGTTCCTGGAAAAGCTGAGGGAAGATGTGGTCAAGCACGGCATCCGGAACGCCAGCTTTATCACAGGCTGTAGCGCCGACGAGGCCGCCAATCTTGCTGGAACAACACCCGGCTTTTGGCCCAGACGGGACAATGTGTTTCTGGAACAGACCCCTCTGATGATGACCCCTACCAAGGACCAGATGCTGGACGAGTGCGTGCGGAGCGTGAAGATCGAACCTCACAGACTGCACGAAGAGGACCTGAGCTGCCTGGGCGAGAACAGACCTGTGGAACTGCCCGTGCTGAACAGCAGACTGCGGCAGATCAGCAAAGAAAGCGCCACCGTGGCCGTGCGGAGAGGAAGAAGTGCTCCATTCTACGACGACAGCGACGACGAGGATGAAGTGGCCTGTTCTGAGACAGGCTGGACCGTGTCTACCGATGCCGTGATCAAGATGTGCGTGGACAGACAGCCCTTCGTGGATCACGCTCAGTCTCTGCCTGTGGCCATCGGCTTTGGAGGCTCTAGCGTGGAACTGGCCAGACACCTGAGAAGAGGCAATGCCCTGGGACTGTCTGTGGGCGTGTACAAGTGTAGCATGCCTCCTAGCGTGAACTACCGG [서열번호 425]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 425에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 서열번호 425의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 426으로 제공된다:
AUGGACAGACAGCCCAAGGUGUACAGCGACCCCGACAACGGCUUCUUCUUCCUGGAUGUGCCCAUGCCUGACGAUGGCCAAGGCGGACAGCAGACAGCUACAACAGCUGCCGGCGGAGCCUUUGGAGUUGGCGGAGGACAUUCUGUGCCCUACGUGCGGAUCAUGAAUGGCGUGUCCGGCAUCCAGAUCGGCAACCACAACGCCAUGUCUAUCGCCAGCUGUUGGAGCCCCAGCUACACCGAUCGGCGGAGAAGAAGCUACCCUAAGACCGCCACAAACGCCGCUGCCGAUAGAGUGGCUGCUGCUGUGUCUGCCGCUAACGCUGCUGUGAAUGCUGCUGCCGCUGCUGCAGCCGCAGGCGGCGGAGGCGGAGCUAAUCUUCUUGCAGCAGCCGUGACCUGCGCCAACCAGAGAGGAUGUUGCGGAGGAAAUGGCGGCCACAGCCUGCCUCCAACCAGAAUGCCUAAGACCAAUGCCACAGCCGCUGCAGCUCCAGCAGUUGCCGGUGCCUCUAAUGCCAAGAGCGACAACAACCACGCCAACGCCACAUCUGGCGCUGGAUCUGCUGCUGCUACACCAGCCGCUACAACACCAGCUGCCACCGCCGUUGAGAACAGAAGGCCAUCUCCAAGUCCUAGCACCGCCAGCACAGCCCCUUGUGAUGAGGGAAGCAGCCCCAGACACCACAGACCUAGCCAUGUGUCUGUGGGCACACAGGCCACACCUAGCACACCAAUUCCUAUUCCAGCUCCUCGGUGCUCCACAGGCCAGCAGCAACAACAGCCUCAGGCCAAGAAGCUGAAGCCCGCCAAAGCUGACCCUCUGCUGUAUGCCGCAACCAUGCCUCCUCCAGCCUCUGUGACUACUGCCGCAGCAGCUGCAGUGGCCCCUGAGUCUGAAUCUUCUCCUGCCGCUUCUGCCCCUCCAGCAGCCGCCGCUAUGGCUACAGGCGGAGAUGAUGAGGACCAGAGCAGCUUCUCCUUCGUGUCCGAUGAUGUGCUGGGCGAGUUCGAGGACCUGAGAAUUGCUGGACUGCCCGUGCGGGAUGAGAUGAGGCCUCCUACACCUACCAUGACAGUGAUCCCCGUGUCUCGGCCUUUCAGAGCCGGCAGAGAUUCUGGCAGAGAUGCCCUGUUCGACGACGCCGUGGAAAGCGUGCGGUGUUACUGUCACGGCAUCCUGGGCAACAGCAGAUUCUGCGCCCUGGUCAACGAGAAGUGUAGCGAGCCUGCCAAAGAACGGAUGGCCCGGAUUAGAAGAUACGCCGCCGACGUGACAAGAUGCGGACCUCUGGCUCUGUACACCGCCAUUGUGUCUAGCGCCAACCGGCUGAUCCAGACAGACCCUAGCUGUGACCUGGAUCUGGCCGAGUGCUACGUGGAAACCGCCUCCAAGAGAAACGCCGUGCCUCUGAGCGCCUUCUACAGAGACUGCGACAGACUGAGAGAUGCCGUGGCCGCCUUCUUCAAGACCUACGGCAUGGUGGUGGACGCCAUGGCUCAGAGAAUCACCGAGAGAGUGGGACCCGCUCUCGGCAGAGGACUGUAUUCUACCGUGGUCAUGAUGGACAGAUGCGGCAACAGCUUCCAGGGCAGAGAAGAGACACCCAUCAGCGUGUUCGCCAGAGUGGCUGCUGCUCUGGCCGUGGAAUGUGAAGUGGAUGGCGGCGUGUCCUACAAGAUCCUGAGCAGCAAGCCUGUGGAUGCCGCUCAGGCCUUCGAUGCCUUUCUGAGCGCCCUGUGCAGCUUCGCCAUCAUUCCAUCUCCAAGAGUGCUGGCCUACGCCGGCUUUGGCGGCAGCAAUCCUAUCUUUGACGCCGUGUCUUACAGGGCCCAGUUCUACAGCGCCGAGAGCACCAUCAAUGGCACCCUGCACGACAUCUGCGACAUGGUCACAAACGGCCUGUCCGUGUCUGUGUCUGCCGCUGAUCUCGGCGGAGAUAUCGUGGCCUCUCUGCACAUUCUGGGCCAGCAGUGCAAAGCCCUGAGGCCUUACGCCAGAUUCAAGACCGUGCUGCGGAUCUACUUCGACAUUUGGAGCGUGGACGCCCUGAAGAUCUUUAGCUUCAUCCUGGACGUGGGGCGCGAGUACGAAGGACUGAUGGCCUUUGCCGUGAAUACCCCUCGGAUCUUCUGGGACAGAUACCUGGACAGCAGCGGCGACAAGAUGUGGCUGAUGUUUGCCAGAAGAGAAGCCGCCGCUCUGUGCGGCCUGGAUCUGAAGUCCUUCCGGAACGUGUACGAGAAGAUGGAACGCGACGGCCGCUCUGCCAUCACAGUUAGUCCUUGGUGGGCCGUGUGUCAGCUGGAUGCCUGUGUGGCCAGAGGCAAUACCGCCGUGGUGUUCCCUCACAACGUGAAGUCUAUGAUCCCCGAGAACAUCGGCAGGCCAGCCGUGUGUGGACCUGGCGUUAGUGUUGUGUCUGGCGGCUUCGUGGGCUGCACACCUAUUCACGAGCUGUGCAUCAACCUGGAAAACUGCGUGCUGGAAGGCGCCGCUGUGGAAUCCUCUGUGGAUGUGGUGCUCGGCCUGGGCUGCAGAUUCAGCUUUAAGGCCCUGGAAAGCCUCGUGCGGGAUGCUGUGGUUCUGGGCAACCUGCUGAUCGACAUGACCGUGCGGACCAAUGCCUAUGGCGCUGGCAAACUGCUGACCCUGUACCGGGAUCUGCACAUCGGCGUUGUGGGAUUCCACGCCGUGAUGAACAGACUGGGCCAGAAAUUCGCCGACAUGGAAAGCUACGACCUGAACCAGCGGAUCGCCGAGUUCAUCUACUACACAGCCGUCAGAGCCAGCGUGGACCUGUGUAUGGCUGGCGCCGAUCCAUUUCCUAAGUUCCCCAAGAGCCUGUACGCCGCUGGCAGAUUCUACCCCGACCUGUUCGACGACGAUGAGAGGGGCCCUAGACGGAUGACCAAAGAGUUCCUGGAAAAGCUGAGGGAAGAUGUGGUCAAGCACGGCAUCCGGAACGCCAGCUUUAUCACAGGCUGUAGCGCCGACGAGGCCGCCAAUCUUGCUGGAACAACACCCGGCUUUUGGCCCAGACGGGACAAUGUGUUUCUGGAACAGACCCCUCUGAUGAUGACCCCUACCAAGGACCAGAUGCUGGACGAGUGCGUGCGGAGCGUGAAGAUCGAACCUCACAGACUGCACGAAGAGGACCUGAGCUGCCUGGGCGAGAACAGACCUGUGGAACUGCCCGUGCUGAACAGCAGACUGCGGCAGAUCAGCAAAGAAAGCGCCACCGUGGCCGUGCGGAGAGGAAGAAGUGCUCCAUUCUACGACGACAGCGACGACGAGGAUGAAGUGGCCUGUUCUGAGACAGGCUGGACCGUGUCUACCGAUGCCGUGAUCAAGAUGUGCGUGGACAGACAGCCCUUCGUGGAUCACGCUCAGUCUCUGCCUGUGGCCAUCGGCUUUGGAGGCUCUAGCGUGGAACUGGCCAGACACCUGAGAAGAGGCAAUGCCCUGGGACUGUCUGUGGGCGUGUACAAGUGUAGCAUGCCUCCUAGCGUGAACUACCGG [서열번호 426]
다른 구현예에서, 선천적 신호전달 경로의 억제제는 천산갑(Pangolin) CoV-2 ORF3b*57 변이체 단백질(즉, 미성숙 종결 코돈이 AA 글루타민으로 변경된 천산갑 CoV-2 ORF3b 단백질의 돌연변이 형태(NCBI 참조 서열: QIG55946.1; UniProtKB - A0A6M3G7Q4(A0A6M3G7Q4_9BETC)), 또는 그의 동원체이다. [Konno Y, Kimura I, Uriu K, Fukushi M, Irie T, Koyanagi Y, Sauter D, Gifford R, USFQ-COVID19 Consortium, Nakagawa S and Sato K. 2020. SARS-CoV-2 ORF3b is a potent interferon antagonist whose activity is increased by a naturally occurring elongation variant. Cell Reports 32: Issue 12. doi.org/10.1016/j.celrep.2020.108185]. 상기 천산갑 CoV-2 ORF3b*57의 한 구현예는 본 명세서에서 다음과 같은 서열번호 427로 나타낸다:
MMLTTSCVGILIVTTIVFHTIVQLLQLSLPPVMAQQIPLQNMTTKLVVILRNGNLE [서열번호 427]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 427에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 천산갑 CoV-2 ORF3b*57 폴리펩티드는 다음과 같은 서열번호 428의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGATGCTAACTACTTCCTGTGTTGGCATACTAATTGTTACGACTATTGTATTCCATACAATAGTGCAACTTCTTCAATTGTCATTACCTCCGGTGATGGCACAACAAATCCCATTACAGAACATGACTACCAAATTGGTGGTTATTTTGAGAAATGGGAATCTGGAG [서열번호 428]
따라서, 바람직하게는 상기 천산갑 CoV-2 ORF3b*57 폴리펩티드는 실질적으로 서열번호 428에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 상기 RNA 구조체는 다음과 같은 서열번호 429의 RNA 뉴클레오티드 서열을 포함할 수 있다:
AUGAUGCUAACUACUUCCUGUGUUGGCAUACUAAUUGUUACGACUAUUGUAUUCCAUACAAUAGUGCAACUUCUUCAAUUGUCAUUACCUCCGGUGAUGGCACAACAAAUCCCAUUACAGAACAUGACUACCAAAUUGGUGGUUAUUUUGAGAAAUGGGAAUCUGGAG [서열번호 429]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 429에 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
따라서, 본 발명자들은 서열번호 442의 단백질 서열에 인간 발현을 위한 코돈 최적화를 하였고, 개시(ATG) 및 종결(TGA) 코돈을 포함하는 코돈 최적화된 핵산(DNA) 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 430으로 제공된다:
ATGATGCTGACCACCAGCTGTGTGGGCATCCTGATCGTGACCACCATCGTGTTCCACACAATCGTGCAGCTGCTGCAGCTCAGCCTGCCTCCTGTTATGGCCCAGCAGATCCCTCTGCAGAACATGACCACAAAGCTGGTCGTGATCCTGCGGAACGGCAACCTGGAATGA [서열번호 430]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 430에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 개시(AUG) 및 종결(UGA) 코돈을 포함하는 서열번호 430의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 431로 제공된다:
AUGAUGCUGACCACCAGCUGUGUGGGCAUCCUGAUCGUGACCACCAUCGUGUUCCACACAAUCGUGCAGCUGCUGCAGCUCAGCCUGCCUCCUGUUAUGGCCCAGCAGAUCCCUCUGCAGAACAUGACCACAAAGCUGGUCGUGAUCCUGCGGAACGGCAACCUGGAAUGA [서열번호 431]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 431에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
다른 구현예에서, 선천적 신호전달 경로의 억제제는 천산갑 CoV-2 ORF3b*79 변이체 단백질(즉, 미성숙 종결 코돈이 AA 글루타민으로 변경된 천산갑 CoV-2 ORF3b 단백질의 돌연변이 형태(NCBI 참조 서열: QIG55946.1; UniProtKB - A0A6M3G7Q4(A0A6M3G7Q4_9BETC)), 또는 그의 동원체이다. [Konno Y, Kimura I, Uriu K, Fukushi M, Irie T, Koyanagi Y, Sauter D, Gifford R, USFQ-COVID19 Consortium, Nakagawa S and Sato K. 2020. SARS-CoV-2 ORF3b is a potent interferon antagonist whose activity is increased by a naturally occurring elongation variant. Cell Reports 32: Issue 12. doi.org/10.1016/j.celrep.2020.108185]. 상기 천산갑 CoV-2 ORF3b*79의 한 구현예는 본 명세서에서 다음과 같은 서열번호 432로 나타낸다:
MMLTTSCVGILIVTTIVFHTIVQLLQLSLPPVMAQQIPLQNMTTKLVVILRNGNLELKTVLYYTATSLQITTSCTQLN [서열번호 432]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 432에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 천산갑 CoV-2 ORF3b*79 폴리펩티드는 다음과 같은 서열번호 433의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGATGCTAACTACTTCCTGTGTTGGCATACTAATTGTTACGACTATTGTATTCCATACAATAGTGCAACTTCTTCAATTGTCATTACCTCCGGTGATGGCACAACAAATCCCATTACAGAACATGACTACCAAATTGGTGGTTATTTTGAGAAATGGGAATCTGGAGCTGAAGACTGTGTTGTATTACACAGCTACTTCACTTCAGATTACTACCAGCTGTACTCAACTCAAT [서열번호 433]
따라서, 바람직하게는 상기 천산갑 CoV-2 ORF3b*79 폴리펩티드는 실질적으로 서열번호 433에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 상기 RNA 구조체는 다음과 같은 서열번호 434의 RNA 뉴클레오티드 서열을 포함할 수 있다:
AUGAUGCUAACUACUUCCUGUGUUGGCAUACUAAUUGUUACGACUAUUGUAUUCCAUACAAUAGUGCAACUUCUUCAAUUGUCAUUACCUCCGGUGAUGGCACAACAAAUCCCAUUACAGAACAUGACUACCAAAUUGGUGGUUAUUUUGAGAAAUGGGAAUCUGGAGCUGAAGACUGUGUUGUAUUACACAGCUACUUCACUUCAGAUUACUACCAGCUGUACUCAACUCAAU [서열번호 434]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 434에 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
따라서, 본 발명자들은 서열번호 432의 단백질 서열에 인간 발현을 위한 코돈 최적화를 하였고, 개시(ATG) 및 종결(TGA) 코돈을 포함하는 코돈 최적화된 핵산(DNA) 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 435로 제공된다:
ATGATGCTGACCACCAGCTGTGTGGGCATCCTGATCGTGACCACCATCGTGTTCCACACAATCGTGCAGCTGCTGCAGCTCAGCCTGCCTCCTGTTATGGCCCAGCAGATCCCTCTGCAGAACATGACCACAAAGCTGGTCGTGATCCTGCGGAACGGCAACCTGGAACTGAAAACCGTGCTGTACTACACCGCCACCAGCCTGCAGATCACCACAAGCTGCACCCAGCTGAACTGA [서열번호 435]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 435에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 개시(AUG) 및 종결(UGA) 코돈을 포함하는 서열번호 435의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 436으로 제공된다:
AUGAUGCUGACCACCAGCUGUGUGGGCAUCCUGAUCGUGACCACCAUCGUGUUCCACACAAUCGUGCAGCUGCUGCAGCUCAGCCUGCCUCCUGUUAUGGCCCAGCAGAUCCCUCUGCAGAACAUGACCACAAAGCUGGUCGUGAUCCUGCGGAACGGCAACCUGGAACUGAAAACCGUGCUGUACUACACCGCCACCAGCCUGCAGAUCACCACAAGCUGCACCCAGCUGAACUGA [서열번호 436]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 436에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
다른 구현예에서, 선천적 신호전달 경로의 억제제는 MERS-ORF4a 단백질(NCBI 참조 서열: AGV08457.1; UniProtKB - T2BBG6(T2BBG6_MERS)), 또는 그의 동원체이다. 상기 MERS-ORF4a의 한 구현예는 본 명세서에서 다음과 같은 서열번호 437로 나타낸다:
MDYVSLLNQIWQKYLNSPYTTCLYIPKPTAKYTPLVGTSLHPVLWNCQLSFAGYTESAVNSTKALAKQDAAQRIAWLLHKDGGIPDGCSLYLRHSSLFAQSEEEESFSN [서열번호 437]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 437에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 MERS-ORF4a 폴리펩티드는 다음과 같은 서열번호 438의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGACTACGTGTCCCTGCTGAACCAGATTTGGCAGAAGTACCTGAACAGCCCCTACACCACCTGTCTGTACATCCCCAAGCCTACCGCCAAGTACACACCTCTCGTGGGCACATCTCTGCACCCCGTGCTGTGGAATTGCCAGCTGAGCTTTGCCGGCTACACCGAGTCTGCCGTGAACAGCACAAAGGCCCTGGCCAAACAGGACGCCGCTCAGAGAATTGCCTGGCTGCTGCACAAGGATGGCGGCATCCCTGATGGCTGTAGCCTGTACCTGAGACACAGCAGCCTGTTCGCCCAGAGCGAGGAAGAGGAATCCTTCAGCAAC [서열번호 438]
따라서, 바람직하게는 상기 MERS-ORF4a 폴리펩티드는 실질적으로 서열번호 438에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 상기 RNA 구조체는 다음과 같은 서열번호 439의 RNA 뉴클레오티드 서열을 포함할 수 있다:
AUGGACUACGUGUCCCUGCUGAACCAGAUUUGGCAGAAGUACCUGAACAGCCCCUACACCACCUGUCUGUACAUCCCCAAGCCUACCGCCAAGUACACACCUCUCGUGGGCACAUCUCUGCACCCCGUGCUGUGGAAUUGCCAGCUGAGCUUUGCCGGCUACACCGAGUCUGCCGUGAACAGCACAAAGGCCCUGGCCAAACAGGACGCCGCUCAGAGAAUUGCCUGGCUGCUGCACAAGGAUGGCGGCAUCCCUGAUGGCUGUAGCCUGUACCUGAGACACAGCAGCCUGUUCGCCCAGAGCGAGGAAGAGGAAUCCUUCAGCAAC [서열번호 439]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 439에 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
따라서, 본 발명자들은 서열번호 437의 단백질 서열에 인간 발현을 위한 코돈 최적화를 하였고, 개시(ATG) 및 종결(TGA) 코돈을 포함하는 코돈 최적화된 핵산(DNA) 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 440으로 제공된다:
ATGGACTACGTGTCCCTGCTGAATCAGATCTGGCAGAAGTACCTGAACAGCCCCTACACCACCTGTCTGTACATCCCCAAGCCTACCGCCAAGTACACACCTCTCGTGGGCACATCTCTGCACCCCGTGCTGTGGAATTGCCAGCTGAGCTTTGCCGGCTACACCGAGAGCGCCGTGAATAGCACAAAGGCCCTGGCCAAACAGGACGCCGCTCAGAGAATTGCCTGGCTGCTGCACAAGGATGGCGGCATCCCTGATGGCTGTAGCCTGTACCTGAGACACAGCAGCCTGTTCGCCCAGAGCGAGGAAGAGGAATCCTTCAGCAACTGA [서열번호 440]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 440에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 개시(AUG) 및 종결(UGA) 코돈을 포함하는 서열번호 440의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 441로 제공된다:
AUGGACUACGUGUCCCUGCUGAAUCAGAUCUGGCAGAAGUACCUGAACAGCCCCUACACCACCUGUCUGUACAUCCCCAAGCCUACCGCCAAGUACACACCUCUCGUGGGCACAUCUCUGCACCCCGUGCUGUGGAAUUGCCAGCUGAGCUUUGCCGGCUACACCGAGAGCGCCGUGAAUAGCACAAAGGCCCUGGCCAAACAGGACGCCGCUCAGAGAAUUGCCUGGCUGCUGCACAAGGAUGGCGGCAUCCCUGAUGGCUGUAGCCUGUACCUGAGACACAGCAGCCUGUUCGCCCAGAGCGAGGAAGAGGAAUCCUUCAGCAACUGA [서열번호 441]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 441에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
다른 구현예에서, 선천적 신호전달 경로의 억제제는 BVDV nPro 단백질(NCBI 참조 서열: AAA42854.1; UniProtKB - P19711(POLG_BVDVN)), 또는 그의 동원체이다. 상기 BVDV nPro의 한 구현예는 본 명세서에서 다음과 같은 서열번호 442로 나타낸다:
MELITNELLYKTYKQKPVGVEEPVYDQAGDPLFGERGAVHPQSTLKLPHKRGERDVPTNLASLPKRGDCRTGNSRGPVSGIYLKPGPLFYQDYKGPVYHRAPLELFEEGSMCETTKRIGRVTGSDGKLYHIYVCIDGCIIIKSATRSYQRVFRWVHNRLDCPLWVTSC [서열번호 442]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 442에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 BVDV nPro 폴리펩티드는 다음과 같은 서열번호 443의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGAGTTGATCACAAATGAACTTTTATACAAAACATACAAACAAAAACCCGTCGGGGTGGAGGAACCTGTTTATGATCAGGCAGGTGATCCCTTATTTGGTGAAAGGGGAGCAGTCCACCCTCAATCGACGCTAAAGCTCCCACACAAGAGAGGGGAACGCGATGTTCCAACCAACTTGGCATCCTTACCAAAAAGAGGTGACTGCAGGACGGGTAATAGCAGAGGACCTGTGAGCGGGATCTACCTGAAGCCAGGGCCACTATTTTACCAGGACTATAAAGGTCCCGTCTATCACAGGGCCCCGCTGGAGCTCTTTGAGGAGGGATCCATGTGTGAAACGACTAAACGGATAGGGAGAGTAACTGGAAGTGACGGAAAGCTGTACCACATTTATGTGTGTATAGATGGATGTATAATAATAAAAAGTGCCACGAGAAGTTACCAAAGGGTGTTCAGGTGGGTCCATAATAGGCTTGACTGCCCTCTATGGGTCACAAGTTGC [서열번호 443]
따라서, 바람직하게는 상기 BVDV nPro 폴리펩티드는 실질적으로 서열번호 443에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 상기 RNA 구조체는 다음과 같은 서열번호 444의 RNA 뉴클레오티드 서열을 포함할 수 있다:
AUGGAGUUGAUCACAAAUGAACUUUUAUACAAAACAUACAAACAAAAACCCGUCGGGGUGGAGGAACCUGUUUAUGAUCAGGCAGGUGAUCCCUUAUUUGGUGAAAGGGGAGCAGUCCACCCUCAAUCGACGCUAAAGCUCCCACACAAGAGAGGGGAACGCGAUGUUCCAACCAACUUGGCAUCCUUACCAAAAAGAGGUGACUGCAGGACGGGUAAUAGCAGAGGACCUGUGAGCGGGAUCUACCUGAAGCCAGGGCCACUAUUUUACCAGGACUAUAAAGGUCCCGUCUAUCACAGGGCCCCGCUGGAGCUCUUUGAGGAGGGAUCCAUGUGUGAAACGACUAAACGGAUAGGGAGAGUAACUGGAAGUGACGGAAAGCUGUACCACAUUUAUGUGUGUAUAGAUGGAUGUAUAAUAAUAAAAAGUGCCACGAGAAGUUACCAAAGGGUGUUCAGGUGGGUCCAUAAUAGGCUUGACUGCCCUCUAUGGGUCACAAGUUGC [서열번호 444]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 444에 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
따라서, 본 발명자들은 서열번호 442의 단백질 서열에 인간 발현을 위한 코돈 최적화를 하였고, 개시(ATG) 및 종결(TGA) 코돈을 포함하는 코돈 최적화된 핵산(DNA) 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 445로 제공된다:
ATGGAACTGATCACCAACGAGCTGCTGTACAAGACCTACAAGCAGAAACCCGTGGGCGTCGAGGAACCCGTGTATGATCAAGCTGGCGACCCTCTGTTTGGCGAGAGAGGCGCTGTTCACCCTCAGAGCACACTGAAGCTGCCCCACAAGCGGGGCGAAAGAGATGTGCCTACCAACCTGGCCAGCCTGCCTAAGAGAGGCGATTGCAGAACCGGCAATAGCAGAGGCCCTGTGTCCGGCATCTACCTGAAACCTGGACCACTGTTCTACCAGGACTACAAGGGCCCCGTGTACCACAGAGCACCCCTGGAACTTTTCGAAGAGGGCAGCATGTGCGAAACCACCAAGCGGATCGGAAGAGTGACCGGCTCTGACGGCAAGCTGTACCACATCTACGTGTGCATCGACGGCTGCATCATCATCAAGAGCGCCACCAGATCCTACCAGCGGGTGTTCAGATGGGTGCACAACAGACTGGACTGCCCTCTGTGGGTCACCAGCTGCTGA [서열번호 445]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 445에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 개시(AUG) 및 종결(UGA) 코돈을 포함하는 서열번호 445의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 446으로 제공된다:
AUGGAACUGAUCACCAACGAGCUGCUGUACAAGACCUACAAGCAGAAACCCGUGGGCGUCGAGGAACCCGUGUAUGAUCAAGCUGGCGACCCUCUGUUUGGCGAGAGAGGCGCUGUUCACCCUCAGAGCACACUGAAGCUGCCCCACAAGCGGGGCGAAAGAGAUGUGCCUACCAACCUGGCCAGCCUGCCUAAGAGAGGCGAUUGCAGAACCGGCAAUAGCAGAGGCCCUGUGUCCGGCAUCUACCUGAAACCUGGACCACUGUUCUACCAGGACUACAAGGGCCCCGUGUACCACAGAGCACCCCUGGAACUUUUCGAAGAGGGCAGCAUGUGCGAAACCACCAAGCGGAUCGGAAGAGUGACCGGCUCUGACGGCAAGCUGUACCACAUCUACGUGUGCAUCGACGGCUGCAUCAUCAUCAAGAGCGCCACCAGAUCCUACCAGCGGGUGUUCAGAUGGGUGCACAACAGACUGGACUGCCCUCUGUGGGUCACCAGCUGCUGA [서열번호 446]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 446에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
다른 구현예에서, 선천적 신호전달 경로의 억제제는 HSV US1 단백질(NCBI 참조 서열: CAB06708.1; UniProtKB - P89474(ICP22_HHV2H)), 또는 그의 동원체이다. 상기 HSV US1의 한 구현예는 본 명세서에서 다음과 같은 서열번호 447로 나타낸다:
MVRDCYLMGYCRTRLGPRTWGRLLQISGGTWDVRLRNAIREVEAHFEPAAEPVCELPCLNARRYGPECDVGNLETNGGSTSDDEISDATDSDDTLASHSDTEGGPSPAGRENPESASGGAIAARLECEFGTFDWTSEEGSQPWLSAVVADTSSAERSGLPAPGACRATEAPEREDGCRKMRFPAACPYPCGHTFLRP [서열번호 447]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 447에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 HSV US1폴리펩티드는 다음과 같은 서열번호 448의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGGTGCGAGACTGCTACCTCATGGGCTACTGCCGGACCCGCCTGGGGCCGCGCACGTGGGGCCGCCTGCTGCAGATCTCGGGCGGAACCTGGGACGTGCGCCTGCGAAACGCAATCCGGGAGGTCGAGGCGCATTTTGAACCCGCCGCCGAGCCCGTGTGCGAGCTGCCCTGTCTGAACGCCAGGCGTTACGGCCCCGAGTGTGATGTTGGCAATCTCGAGACCAACGGCGGCTCGACGAGCGATGATGAGATATCGGATGCGACGGACTCGGACGATACCCTCGCGTCCCATTCCGACACGGAGGGGGGGCCCTCCCCGGCCGGCCGGGAGAACCCGGAATCCGCGTCCGGCGGGGCTATCGCGGCTCGGCTGGAGTGTGAGTTTGGGACGTTTGACTGGACGTCCGAGGAGGGCTCCCAGCCCTGGCTGTCCGCGGTGGTCGCCGATACCAGCTCCGCCGAACGCTCTGGCCTACCCGCCCCGGGCGCGTGTCGCGCAACGGAAGCCCCAGAACGCGAGGACGGGTGCCGAAAAATGCGCTTCCCCGCCGCCTGCCCCTATCCCTGCGGCCACACATTTCTCCGGCCA [서열번호 448]
따라서, 바람직하게는 상기 HSV US1 폴리펩티드는 실질적으로 서열번호 448에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 상기 RNA 구조체는 다음과 같은 서열번호 449의 RNA 뉴클레오티드 서열을 포함할 수 있다:
AUGGUGCGAGACUGCUACCUCAUGGGCUACUGCCGGACCCGCCUGGGGCCGCGCACGUGGGGCCGCCUGCUGCAGAUCUCGGGCGGAACCUGGGACGUGCGCCUGCGAAACGCAAUCCGGGAGGUCGAGGCGCAUUUUGAACCCGCCGCCGAGCCCGUGUGCGAGCUGCCCUGUCUGAACGCCAGGCGUUACGGCCCCGAGUGUGAUGUUGGCAAUCUCGAGACCAACGGCGGCUCGACGAGCGAUGAUGAGAUAUCGGAUGCGACGGACUCGGACGAUACCCUCGCGUCCCAUUCCGACACGGAGGGGGGGCCCUCCCCGGCCGGCCGGGAGAACCCGGAAUCCGCGUCCGGCGGGGCUAUCGCGGCUCGGCUGGAGUGUGAGUUUGGGACGUUUGACUGGACGUCCGAGGAGGGCUCCCAGCCCUGGCUGUCCGCGGUGGUCGCCGAUACCAGCUCCGCCGAACGCUCUGGCCUACCCGCCCCGGGCGCGUGUCGCGCAACGGAAGCCCCAGAACGCGAGGACGGGUGCCGAAAAAUGCGCUUCCCCGCCGCCUGCCCCUAUCCCUGCGGCCACACAUUUCUCCGGCCA [서열번호 449]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 449에 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
따라서, 본 발명자들은 서열번호 447의 단백질 서열에 인간 발현을 위한 코돈 최적화를 하였고, 개시(ATG) 및 종결(TGA) 코돈을 포함하는 코돈 최적화된 핵산(DNA) 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 450으로 제공된다:
ATGGTCCGAGACTGCTACCTGATGGGCTACTGCAGAACCAGACTGGGCCCTAGAACATGGGGCAGACTGCTGCAGATCTCTGGCGGCACATGGGATGTGCGGCTGAGAAACGCCATCAGAGAGGTGGAAGCCCACTTCGAGCCTGCCGCTGAACCTGTGTGTGAACTGCCCTGTCTGAACGCTAGAAGATACGGCCCTGAGTGCGACGTGGGCAACCTGGAAACAAATGGCGGCAGCACCAGCGACGACGAGATCTCTGATGCCACCGACAGCGACGATACACTGGCCAGCCACAGCGATACAGAAGGCGGACCATCTCCTGCCGGAAGAGAGAATCCTGAGTCTGCCTCTGGCGGAGCTATCGCCGCTAGACTGGAATGCGAGTTCGGCACCTTCGACTGGACAAGCGAGGAAGGCTCTCAGCCTTGGCTGTCTGCTGTGGTGGCCGATACAAGCAGCGCCGAAAGATCTGGACTTCCTGCTCCTGGCGCCTGCAGAGCTACAGAAGCTCCTGAAAGAGAGGACGGCTGCAGAAAGATGCGGTTCCCTGCCGCCTGTCCTTATCCTTGCGGCCACACATTTCTGCGGCCCTGA [서열번호 450]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 450에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 개시(AUG) 및 종결(UGA) 코돈을 포함하는 서열번호 450의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 451로 제공된다:
AUGGUCCGAGACUGCUACCUGAUGGGCUACUGCAGAACCAGACUGGGCCCUAGAACAUGGGGCAGACUGCUGCAGAUCUCUGGCGGCACAUGGGAUGUGCGGCUGAGAAACGCCAUCAGAGAGGUGGAAGCCCACUUCGAGCCUGCCGCUGAACCUGUGUGUGAACUGCCCUGUCUGAACGCUAGAAGAUACGGCCCUGAGUGCGACGUGGGCAACCUGGAAACAAAUGGCGGCAGCACCAGCGACGACGAGAUCUCUGAUGCCACCGACAGCGACGAUACACUGGCCAGCCACAGCGAUACAGAAGGCGGACCAUCUCCUGCCGGAAGAGAGAAUCCUGAGUCUGCCUCUGGCGGAGCUAUCGCCGCUAGACUGGAAUGCGAGUUCGGCACCUUCGACUGGACAAGCGAGGAAGGCUCUCAGCCUUGGCUGUCUGCUGUGGUGGCCGAUACAAGCAGCGCCGAAAGAUCUGGACUUCCUGCUCCUGGCGCCUGCAGAGCUACAGAAGCUCCUGAAAGAGAGGACGGCUGCAGAAAGAUGCGGUUCCCUGCCGCCUGUCCUUAUCCUUGCGGCCACACAUUUCUGCGGCCCUGA [서열번호 451]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 452에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
다른 구현예에서, 선천적 신호전달 경로의 억제제는 MERS CoV M 단백질(NCBI 참조 서열: AGV08396.1; UniProtKB - T2BB40(T2BB40_MERS)), 또는 그의 동원체이다. 상기 MERS CoV M의 한 구현예는 본 명세서에서 다음과 같은 서열번호 452로 나타낸다:
MSNMTQLTEAQIIAIIKDWNFAWSLIFLLITIVLQYGYPSRSMTVYVFKMFVLWLLWPSSMALSIFSAIYPIDLASQIISGIVAAVSAMMWISYFVQSIRLFMRTGSWWSFNPETNCLLNVPFGGTTVVRPLVEDSTSVTAVVTNGHLKMAGMHFGACDYDRLPNEVTVAKPNVLIALKMVKRQSYGTNSGVAIYHRYKAGNYRSPPITADIELALLR [서열번호 452]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 452에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 암호화하는 뉴클레오티드 서열을 포함한다.
한 구현예에서, 상기 MERS CoV M 폴리펩티드는 다음과 같은 서열번호 453의 DNA 뉴클레오티드 서열에 의해 암호화된다:
ATGTCTAATATGACGCAACTCACTGAGGCGCAGATTATTGCCATTATTAAAGACTGGAACTTTGCATGGTCCCTGATCTTTCTCTTAATTACTATCGTACTACAGTATGGATACCCATCCCGTAGTATGACTGTCTATGTCTTTAAAATGTTTGTTTTATGGCTCCTATGGCCATCTTCCATGGCGCTATCAATATTTAGCGCCATTTATCCAATTGATCTAGCTTCCCAGATAATCTCTGGCATTGTAGCAGCTGTTTCAGCTATGATGTGGATTTCCTACTTTGTGCAGAGTATCCGGCTGTTTATGAGAACTGGATCATGGTGGTCATTCAATCCTGAGACTAATTGCCTTTTGAACGTTCCATTTGGTGGTACAACTGTCGTACGTCCACTCGTAGAGGACTCCACCAGTGTAACTGCTGTTGTAACCAATGGCCACCTCAAAATGGCTGGCATGCATTTCGGTGCTTGTGACTACGACAGACTTCCTAATGAAGTCACCGTGGCCAAACCCAATGTGCTGATTGCTTTAAAAATGGTGAAGCGGCAAAGCTACGGAACTAATTCCGGCGTTGCCATTTACCATAGATATAAGGCAGGTAATTACAGGAGTCCGCCTATTACGGCGGATATTGAACTTGCATTGCTTCGA [서열번호 453]
따라서, 바람직하게는 상기 MERS CoV M 폴리펩티드는 실질적으로 서열번호 453에 나타낸 것과 같은 DNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 상기 RNA 구조체는 다음과 같은 서열번호 454의 RNA 뉴클레오티드 서열을 포함할 수 있다:
AUGUCUAAUAUGACGCAACUCACUGAGGCGCAGAUUAUUGCCAUUAUUAAAGACUGGAACUUUGCAUGGUCCCUGAUCUUUCUCUUAAUUACUAUCGUACUACAGUAUGGAUACCCAUCCCGUAGUAUGACUGUCUAUGUCUUUAAAAUGUUUGUUUUAUGGCUCCUAUGGCCAUCUUCCAUGGCGCUAUCAAUAUUUAGCGCCAUUUAUCCAAUUGAUCUAGCUUCCCAGAUAAUCUCUGGCAUUGUAGCAGCUGUUUCAGCUAUGAUGUGGAUUUCCUACUUUGUGCAGAGUAUCCGGCUGUUUAUGAGAACUGGAUCAUGGUGGUCAUUCAAUCCUGAGACUAAUUGCCUUUUGAACGUUCCAUUUGGUGGUACAACUGUCGUACGUCCACUCGUAGAGGACUCCACCAGUGUAACUGCUGUUGUAACCAAUGGCCACCUCAAAAUGGCUGGCAUGCAUUUCGGUGCUUGUGACUACGACAGACUUCCUAAUGAAGUCACCGUGGCCAAACCCAAUGUGCUGAUUGCUUUAAAAAUGGUGAAGCGGCAAAGCUACGGAACUAAUUCCGGCGUUGCCAUUUACCAUAGAUAUAAGGCAGGUAAUUACAGGAGUCCGCCUAUUACGGCGGAUAUUGAACUUGCAUUGCUUCGA [서열번호 454]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 454에 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
따라서, 본 발명자들은 서열번호 452의 단백질 서열에 인간 발현을 위한 코돈 최적화를 하였고, 개시(ATG) 및 종결(TGA) 코돈을 포함하는 코돈 최적화된 핵산(DNA) 서열의 한 구현예는 본 명세서에서 다음과 같은 서열번호 455로 제공된다:
ATGAGCAACATGACCCAGCTGACAGAGGCCCAGATCATTGCCATCATCAAGGACTGGAACTTCGCTTGGAGCCTGATCTTCCTGCTGATCACCATCGTGCTGCAGTACGGCTACCCCAGCAGATCCATGACCGTGTACGTGTTCAAGATGTTCGTCCTGTGGCTGCTGTGGCCCAGCTCTATGGCCCTGAGCATCTTCAGCGCCATCTATCCCATCGACCTGGCCAGCCAGATCATCTCTGGAATCGTGGCCGCCGTGTCCGCCATGATGTGGATCAGCTACTTCGTGCAGAGCATCCGGCTGTTCATGAGAACCGGCAGCTGGTGGTCCTTCAATCCCGAGACAAACTGCCTGCTGAACGTGCCCTTTGGCGGCACTACAGTCGTCAGACCCCTGGTGGAAGATAGCACCTCTGTGACCGCCGTGGTCACCAATGGCCACCTGAAAATGGCCGGCATGCACTTCGGCGCCTGCGACTATGACAGACTGCCCAACGAAGTGACCGTGGCCAAGCCTAATGTGCTGATCGCCCTGAAGATGGTCAAGCGGCAGAGCTACGGCACCAATTCTGGCGTGGCCATCTACCACAGATACAAGGCCGGCAACTACAGAAGCCCTCCTATCACCGCCGACATCGAGCTGGCTCTGCTGAGATGA [서열번호 455]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 455에 나타낸 것과 같은 DNA 서열, 또는 그의 단편 또는 변이체에 의해 암호화된다.
구현예에서, 개시(AUG) 및 종결(UGA) 코돈을 포함하는 서열번호 455의 코돈 최적화된 DNA 서열에 대응하는 RNA 서열은 본 명세서에서 다음과 같은 서열번호 456으로 제공된다:
AUGAGCAACAUGACCCAGCUGACAGAGGCCCAGAUCAUUGCCAUCAUCAAGGACUGGAACUUCGCUUGGAGCCUGAUCUUCCUGCUGAUCACCAUCGUGCUGCAGUACGGCUACCCCAGCAGAUCCAUGACCGUGUACGUGUUCAAGAUGUUCGUCCUGUGGCUGCUGUGGCCCAGCUCUAUGGCCCUGAGCAUCUUCAGCGCCAUCUAUCCCAUCGACCUGGCCAGCCAGAUCAUCUCUGGAAUCGUGGCCGCCGUGUCCGCCAUGAUGUGGAUCAGCUACUUCGUGCAGAGCAUCCGGCUGUUCAUGAGAACCGGCAGCUGGUGGUCCUUCAAUCCCGAGACAAACUGCCUGCUGAACGUGCCCUUUGGCGGCACUACAGUCGUCAGACCCCUGGUGGAAGAUAGCACCUCUGUGACCGCCGUGGUCACCAAUGGCCACCUGAAAAUGGCCGGCAUGCACUUCGGCGCCUGCGACUAUGACAGACUGCCCAACGAAGUGACCGUGGCCAAGCCUAAUGUGCUGAUCGCCCUGAAGAUGGUCAAGCGGCAGAGCUACGGCACCAAUUCUGGCGUGGCCAUCUACCACAGAUACAAGGCCGGCAACUACAGAAGCCCUCCUAUCACCGCCGACAUCGAGCUGGCUCUGCUGAGAUGA [서열번호 456]
그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 456에 나타낸 것과 같은 서열, 또는 그의 단편 또는 변이체를 포함한다.
상기 적어도 하나의 선천적 억제제 단백질(IIP)은 임의의 코로나바이러스의 ORF4a(NS4a), 임의의 코로나바이러스의 ORF3b, 또는 마우스 간염 바이러스 및 SARS(코로나바이러스)의 뉴클레오캡시드 단백질; 및 그의 동원체로 이루어진 IIP의 군으로부터 선택되지 않을 수 있다.
상기 적어도 하나의 선천적 억제제 단백질(IIP)은 HSV-2 Us1; HSV-1 Us1; HSV-1Us11; ORF V20.0L; BVDV Npro; Langat NS5; 인플루엔자 NS1; PIV-5 V; SARS-CoV-2 ORF3b; 및 MERS-CoV ORF4a;로 이루어진 IIP의 군으로부터 선택되지 않을 수 있다.
상기 RNA 구조체는 적어도 하나의 치료 생체분자를 암호화하는 뉴클레오티드 서열을 포함한다. 이것은 도 1에서 관심있는 유전자(GOI)로 나타낸다.
상기 적어도 하나의 치료 생체분자는 치료 단백질을 포함할 수 있다. 숙련된 기술자는 치료 단백질이 바람직하게는 인간에서 치료 적용분야를 갖는 임의의 단백질에 관한 것임을 이해할 것이다. 상기 RNA 분자에 의해 암호화될 수 있는 예시적인 치료 생체분자는 박테리아, 바이러스, 진균, 원생동물/또는 기생충과 같은 병원체로부터 유래되는 단백질 또는 펩티드를 포함한다. 상기 단백질 또는 펩티드는 항원, 즉 숙주에서 면역 반응을 자극 또는 촉발할 수 있는 항원일 수 있다. 그러므로, 상기 적어도 하나의 치료 생체분자가 항원인 구현예에서, 제1 측면의 RNA 구조체는 백신으로 간주될 수 있다.
바이러스로부터 유래되는 단백질 또는 펩티드는 바이러스 항원일 수 있다. 상기 바이러스 항원은 오르토믹소바이러스(Orthomyxovirus); 파라믹소비리대(Paramyxoviridae) 바이러스; 메타뉴모바이러스 및 모르빌리바이러스(Morbillivirus); 뉴모바이러스; 파라믹소바이러스(Paramyxovirus); 폭스비리대(Poxviridae); 메타뉴모바이러스; 모르빌리바이러스; 피코르나바이러스; 엔테로바이러스; 분야바이러스(Bunyavirus); 플레보바이러스(Phlebovirus); 나이로바이러스(Nairovirus); 헤파르나바이러스(Heparnavirus); 토가바이러스(Togavirus); 알파바이러스; 아르테리바이러스(Arterivirus); 플라비바이러스; 페스티바이러스; 헤파드나바이러스(Hepadnavirus); 라브도바이러스(Rhabdovirus); 칼리시비리대(Caliciviridae); 코로나바이러스; 레트로바이러스(Retroviruses); 레오바이러스(Reovirus); 파르보바이러스(Parvovirus); 델타 간염 바이러스(HDV); E형 간염 바이러스(HEV); 인간 헤르페스바이러스 및 파포바바이러스(Papovavirus);로 이루어진 군으로부터 선택되는 바이러스로부터 유래될 수 있다.
상기 오르토믹소바이러스는 인플루엔자(인플루엔자) A, B 및 C일 수 있다. 상기 파라믹소비리대 바이러스는 뉴모바이러스(RSV), 파라믹소바이러스(PIV)일 수 있다. 상기 메타뉴모바이러스는 모르빌리바이러스(예컨대, 홍역)일 수 있다. 상기 뉴모바이러스는 호흡기 세포융합 바이러스(RSV), 소 호흡기 세포융합 바이러스, 마우스의 폐렴 바이러스, 또는 터키 비기관염(rhinotracheitis) 바이러스일 수 있다. 상기 파라믹소바이러스는 파라인쿠엔자(Parainfluenza) 바이러스 타입 1 - 4(PIV), 볼거리, 센다이 바이러스, 원숭이 바이러스 5, 소 파라인플루엔자 바이러스, 니파바이러스, 헤니파바이러스(Henipavirus) 또는 뉴캐슬(Newcastle) 질환 바이러스일 수 있다. 상기 폭스비리대는 바리올라 베라(Variola vera), 예를 들면 바리올라 메이저(major) 및 바리올라 마이너(minor)일 수 있다. 상기 메타뉴모바이러스는 인간 메타뉴모바이러스(hMPV) 또는 조류 메타뉴모바이러스(aMPV)일 수 있다. 상기 모르빌리바이러스는 홍역일 수 있다. 상기 피코르나바이러스는 엔테로바이러스, 리노바이러스, 헤파르나바이러스, 파레코바이러스(Parechovirus), 카디오바이러스(Cardiovirus) 및 아프토바이러스(Aphthovirus)일 수 있다. 상기 엔테로바이러스는 폴리오바이러스 타입 1, 2 또는 3, 콕사키 A 바이러스 타입 1 내지 22 및 24, 콕사키 B 바이러스 타입 1 내지 6, 에코바이러스(Echovirus)(ECHO) 바이러스) 타입 1 내지 9, 11 내지 27 및 29 내지 34 또는 엔테로바이러스 68 내지 71일 수 있다. 상기 분야바이러스는 캘리포니아 뇌염 바이러스일 수 있다. 상기 플레보바이러스는 리프트 계곡열 바이러스일 수 있다. 상기 나이로바이러스는 크림-콩고(Crimean-Congo) 출혈열 바이러스일 수 있다. 상기 헤파르나바이러스는 A형 간염 바이러스(HAV)일 수 있다. 상기 토가바이러스는 루비바이러스일 수 있다. 상기 플라비바이러스는 진드기-매개 뇌염(TBE) 바이러스, 뎅기(타입 1, 2, 3 또는 4) 바이러스, 황열 바이러스, 일본 뇌염 바이러스, 키아사누 삼림 바이러스(Kyasanur Forest Virus), 웨스트 나일 뇌염 바이러스, 세인트 루이스 뇌염 바이러스, 러시아 봄-여름 뇌염 바이러스 또는 포와산(Powassan) 뇌염 바이러스일 수 있다. 상기 페스티바이러스는 소 바이러스 설사(BVDV), 고전적 돼지 열병(CSFV) 또는 보더 질환(BDV)일 수 있다. 상기 헤파드나바이러스는 B형 간염 바이러스 또는 C형 간염 바이러스일 수 있다. 상기 라브도바이러스는 리사바이러스(Lyssavirus)(광견병 바이러스) 또는 수포성바이러스(Vesiculovirus)(VSV)일 수 있다. 상기 칼리시비리대는 노워크(Norwalk) 바이러스, 또는 노워크-유사 바이러스, 예컨대 하와이 바이러스 및 스노우 마운틴 바이러스(Snow Mountain Virus)일 수 있다. 상기 코로나바이러스는 SARS CoV-1, SARS-CoV-2, MERS, 인간 호흡기 코로나바이러스, 조류 전염성 기관지염(IBV), 마우스 간염 바이러스(MHV), 또는 돼지 전염성 위장염 바이러스(TGEV)일 수 있다. 상기 레트로바이러스는 온코바이러스(Oncovirus), 렌티바이러스(Lentivirus) 또는 스푸마바이러스(Spumavirus)일 수 있다. 상기 레오바이러스는 오르토레오(Orthoreo) 바이러스, 로타바이러스, 오르비바이러스(Orbivirus), 또는 콜티바이러스(Coltivirus)일 수 있다. 상기 파르보바이러스는 파르보바이러스 B 19일 수 있다. 상기 인간 헤르페스바이러스는 헤르페스 심플렉스 바이러스(HSV), 바리셀라-조스터(Varicella-zoster) 바이러스(VZV), 엡스테인-바 바이러스(EBV), 사이토메갈로바이러스(CMV), 인간 헤르페스바이러스 6(HHV6), 인간 헤르페스바이러스 7(HHV7), 또는 인간 헤르페스바이러스 8(HHV8)일 수 있다. 상기 파포바바이러스는 유두종 바이러스, 폴리오마바이러스(Polyomavirus), 아데노바이러스(Adenovirus) 또는 아레나바이러스일 수 있다.
박테리아로부터 유래되는 단백질 또는 펩티드는 박테리아 항원일 수 있다.
상기 박테리아 항원은 나이세리아 메닝기티데스(Neisseria meningitides), 스트렙토코커스 뉴모니애(Streptococcus pneumoniae), 스트렙토코커스 피로게네스(Streptococcus pyogenes), 모락셀라 카타랄리스(Moraxella catarrhalis), 보르데텔라 페르투시스(Bordetella pertussis), 부르크홀데리아 속(Burkholderia sp.)(예컨대, 부르크홀데리아 말레이, 부르크홀데리아 슈도말레이 및 부르크홀데리아 세파시아), 스타필로코커스 아우레우스(Staphylococcus aureus), 해모필러스 인쿠엔자에(Haemophilus influenzae), 클로스트리디움 테타니(Clostridium tetani)(파상풍), 클로스트리디움 퍼프린젠스(Clostridium perfringens), 클로스트리디움 보툴리눔스(Clostridium botulinums), 코리네박테리움 디프테리애(Cornynebacterium diphtheriae)(디프테리아), 슈도모나스 애루기노사(Pseudomonas aeruginosa), 레지오넬라 뉴모필라(Legionella pneumophila), 콕시엘라 부르네티이(Coxiella burnetii), 브루셀라 속(Brucella sp.)(예컨대, B. 아보르투스, B. 카니스, B. 멜리텐시스, B. 네오토마에, B. 오비스, B. 수이스 및 B. 피니페디애), 프란시셀라 속(Francisella sp.)(예컨대, F. 노비시다, F. 필로미라지아 및 F. 툴라렌시스), 스트렙토코커스 아갈락티애(Streptococcus agalactiae), 나이세리아 고노레애(Neiserria gonorrhoeae), 클라미디아 트라코마티스(Chlamydia trachomatis), 트레포네마 팔리둠(Treponema pallidum)(매독), 해모필러스 두크레이이(Haemophilus ducreyi), 엔테로코커스 패칼리스(Enterococcus faecalis), 엔테로코커스 패시움(Enterococcus faecium), 헬리코박터 파일로리(Helicobacter pylori), 스타필로코커스 사프로피티쿠스(Staphylococcus saprophyticus), 예르시니아 엔테로콜리티카(Yersinia enterocolitica), 대장균(E. coli), 바실러스 안트라시스(Bacillus anthracis)(탄저병), 예르시니아 페스티스(Yersinia pestis)(페스트), 미코박테리움 투베르쿨로시스(Mycobacterium tuberculosis), 리케챠(Rickettsia), 리스테리아(Listeria), 클라미디아 뉴모니애(Chlamydia pneumoniae), 비브리오 콜레라에(Vibrio cholerae), 살모넬라 타이피(Salmonella typhi)(장티푸스), 보렐리아 부르그도르퍼(Borrelia burgdorfer), 포르필라모나스 속(Porphyromonas sp.) 및 클레브시엘라 속(Klebsiella sp.)으로 이루어진 군으로부터 선택되는 박테리아로부터 유래될 수 있다.
진균으로부터 유래되는 단백질 또는 펩티드는 진균 항원일 수 있다.
상기 진균 항원은 에피더모피톤 코쿠숨(Epidermophyton koccusum), 마이크로스포룸 아우도우이니(Microsporum audouini), 마이크로스로품 카니스(Microsporum canis), 마이크로스포룸 디스토르툼(Microsporum distortum), 마이크로스포룸 에퀴눔(Microsporum equinum), 마이크로스포룸 기프숨(Microsporum gypsum), 마이크로스포룸 나눔(Microsporum nanum), 트리코피톤 콘센트리쿰(Trichophyton concentricum), 트리코피톤 에퀴눔(Trichophyton equinum), 트리코피톤 갈리나에(Trichophyton gallinae), 트리코피톤 기프세움(Trichophyton gypseum), 트리코피톤 메그니니(Trichophyton megnini), 트리코피톤 멘타그로피테스(Trichophyton mentagrophytes), 트리코피톤 퀸케아눔(Trichophyton quinckeanum), 트리코피톤루브룸(Trichophyton rubrum), 트리코피톤 쇼엔레이니(Trichophyton schoenleini), 트리코피톤 톤수란스(Trichophyton tonsurans), 트리코피톤 베루코숨(Trichophyton verrucosum), T 베루코숨 var. album, var. 디스코이데스, var. 오크라세움, 트리코피톤 비올라세움(Trichophyton violaceum), 및/또는 트리코피톤 파비포르메(Trichophyton faviforme)을 포함하는 피부사상균(Dermatophytres); 또는 아스페르길루스 푸미가투스(Aspergillus fumigatus), 아스페르길루스 카부스(Aspergillus kavus), 아스페르길루스 나이거(Aspergillus niger), 아스페르길루스 니둘란스(Aspergillus nidulans), 아스페르길루스 테레우스(Aspergillus terreus), 아스페르길루스 시도위(Aspergillus sydowi), 아스페르길루스 카바투스(Aspergillus kavatus), 아스페르길루스 글라우쿠스(Aspergillus glaucus), 블라스토키조마이세스 카피타투스(Blastoschizomyces capitatus), 칸디다 알비칸스(Candida albicans), 칸디다 에놀라세(Candida enolase), 칸디다 트로피칼리스(Candida tropicalis), 칸디다 글라브라타(Candida glabrata), 칸디다 크루세이(Candida krusei), 칸디다 파라프실로시스(Candida parapsilosis), 칸디다 스텔라토이데아(Candida stellatoidea), 칸디다 쿠세이(Candida kusei), 칸디다 파라쿠세이(Candida parakwsei), 칸디다 루시타니애(Candida lusitaniae), 칸디다 슈도트로피칼리스(Candida pseudotropicalis), 칸디다 구일리에르몬디(Candida guilliermondi), 클라도스포리움 카리오니이(Cladosporium carrionii), 코시디오이데스 이미티스(Coccidioides immitis), 블라스토마이세스 더마티디스(Blastomyces dermatidis), 크립토코커스 네오포르만스(Cryptococcus neoformans), 게오트리쿰 클라바툼(Geotrichum clavatum), 히스토플라스마 카프술라툼(Histoplasma capsulatum), 클레브시엘라 뉴모니애(Klebsiella pneumoniae), 마이크로스포리디아(Microsporidia), 엔세팔리토준 속(Encephalitozoon spp.), 세프타타 인테스티날리스(Septata intestinalis) 및 엔테로시토준 비에네우시(Enterocytozoon bieneusi); 브라키올라 속(Brachiola spp.), 마이크로스포룸 속(Microsporidium spp.), 노세마 속(Nosema spp.), 플레이스토포라 속(Pleistophora spp.), 트라키플레이스토포라 속(Trachipleistophora spp.), 비타포르마 속(Vittaforma spp.), 파라코시디오이데스 브라실리엔시스(Paracoccidioides 브라질iensis), 뉴모시스티스 카리니이(Pneumocystis carinii), 피티움 인시디오숨(Pythiumn insidiosum), 피티로스포룸 오발레(Pityrosporum ovale), 사카로마이세스 세레비지애(Sacharomyces cerevisiae), 사카로마이세스 보울라르디이(Saccharomyces boulardii), 사카로마이세스 폼베(Saccharomyces pombe), 세도스포리움 아디오스페룸(Scedosporium apiosperum), 스포로트릭스 센키이(Sporothrix schenckii), 트리코스포론 베이겔리이(Trichosporon beigelii), 톡소플라스마 곤디이(Toxoplasma gondii), 페니실리움 마르네페이(Penicillium marneffei), 말라세지아 속(Malassezia spp.), 폰세카애 속(Fonsecaea spp.), 완지엘라 속(Wangiella spp.), 스포로트릭스 속(Sporothrix spp.), 바시디오볼루스 속(Basidiobolus spp.), 코니디오볼루스 속(Conidiobolus spp.), 리조푸스 속(Rhizopus spp.), 무코르 속(Mucor spp.), 아브시디아 속(Absidia spp.), 모르티에렐라 속(Mortierella spp.), 쿠닝가멜라 속(Cunninghamella spp.), 사크세나애 속(Saksenaea spp.), 알테르나리아 속(Alternaria spp.), 쿠르불라리아 속(Curvularia spp.), 헬민토스포리움 속(Helminthosporium spp.), 푸사리움 속(Fusarium spp.), 아스페르길루스 속(Aspergillus spp.), 페니실리움 속(Penicillium spp.), 모놀리니아 속(Monolinia spp.), 리조크토니아 속(Rhizoctonia spp.), 패실로마이세스 속(Paecilomyces spp.), 피토마이세스 속(Pithomyces spp.), 및 클라도스포리움 속(Cladosporium spp.)으로 이루어진 군으로부터 선택되는 진균으로부터 유래될 수 있다.
원생동물로부터 유래되는 단백질 또는 펩티드는 원생동물 항원일 수 있다.
상기 원생동물 항원은 엔타모에바 히스톨리티카(Entamoeba histolytica), 지아르디아 람블리(Giardia lambli), 크립토스포리디움 파르붐(Cryptosporidium parvum), 시클로스포라 카야타넨시스(Cyclospora cayatanensis) 및 톡소플라스마(Toxoplasma)로 이루어진 군으로부터 선택되는 원생동물로부터 유래될 수 있다.
상기 치료 생체분자는 식물로부터 유래되는 단백질 또는 펩티드일 수 있다. 바람직하게는, 상기 단백질 또는 펩티드는 식물 항원이다. 예를 들면, 상기 식물 항원은 리시누스 코무니스(Ricinus communis)로부터 유래될 수 있다.
다른 구현예에서, 상기 치료 생체분자는 면역원 또는 항원일 수 있다. 바람직하게는, 상기 면역원 또는 항원은 종양 면역원 또는 항원, 또는 암 면역원 또는 항원이다. 상기 종양 면역원 및 항원은 펩티드-함유 종양 항원, 예컨대 폴리펩티드 종양 항원 또는 당단백질 종양 항원일 수 있다.
상기 종양 항원은 (a) 암 세포와 연관된 전장(full length) 분자, (b) 결실, 부가 및/또는 치환된 부분을 갖는 분자를 포함하는 상동체(homolog) 및 그의 변형된 형태, 및 (c) 그의 단편일 수 있다.
적합한 종양 면역원은 CD8+ 림프구에 의해 인식되는 클래스(class) I-제한(restricted) 항원 또는 CD4+ 림프구에 의해 인식되는 클래스 II-제한 항원을 포함한다.
상기 종양 항원은 고환암, 흑색종, 폐암, 두경부암, NSCLC, 유방암, 위장암, 방광암, 결장직장암, 췌장암, 림프종, 백혈병, 신장암, 간암, 난소암, 위암 및 전립선암으로 이루어진 군으로부터 선택되는 암과 연관된 항원일 수 있다.
상기 종양 항원은 다음으로부터 선택될 수 있다:
(a) 암-고환 항원, 예컨대 NY-ESO-I, SSX2, SCP-1뿐만 아니라 RAGE, BAGE, GAGE 및 MAGE 패밀리 폴리펩티드, 예를 들면, (예를 들면, 흑색종, 폐, 두경부, NSCLC, 유방, 위장, 및 방광 종양을 다루기 위해 사용될 수 있는) GAGE-I, GAGE-2, MAGE-I, MAGE-2, MAGE-3, MAGE-4, MAGE-5, MAGE-6, 및 MAGE-12;
(b) 돌연변이된 항원, 예를 들면, (다양한 고형 종양, 예컨대, 결장직장암, 폐암, 두경부암과 연관되는) p53, (예컨대, 흑색종, 췌장암 및 결장직장암과 연관되는) p21/Ras, (예컨대, 흑색종과 연관되는) CDK4, (예컨대, 흑색종과 연관되는) MUM-1, (예컨대, 두경부암과 연관되는) 카스파아제(caspase)-8, (예컨대, 방광암과 연관되는) CIA 0205, HLA-A2-R1701, (예컨대, 흑색종과 연관되는) 베타 카테닌, (예컨대, T-세포 비-호지킨 림프종과 연관되는) TCR, (예컨대, 만성 골수성 백혈병과 연관되는) BCR-abl, 트리오스포스페이트 아이소머라아제(triosephosphate isomerase), KIA 0205, CDC-27, 및 LDLR-FUT;
(c) 과발현된 항원, 예를 들면, (예컨대, 결장직장암과 연관되는) 갈렉틴(Galectin) 4, (예컨대, 호지킨 질환과 연관되는) 갈렉틴 9, (예컨대, 만성 골수성 백혈병과 연관되는) 프로티나아제 3, (예컨대, 다양한 백혈병과 연관되는) WT 1, (예컨대, 신장암과 연관되는) 탄산 탈수효소(carbonic anhydrase), (예컨대, 폐암과 연관되는) 알돌라아제(aldolase) A, (예컨대, 흑색종과 연관되는) PRAME, (예컨대, 유방암, 결장암, 폐암 및 난소암과 연관되는) HER-2/neu, (예컨대, 간암과 연관되는) 알파-페토단백질, (예컨대, 결장직장암과 연관되는) KSA, (예컨대, 췌장암 및 위암과 연관되는) 가스트린(gastrin), 텔로머라아제 촉매화 단백질, (예컨대, 유방암 및 난소암과 연관되는) MUC-I, (예컨대, 신장 세포 암종과 연관되는) G-250, (예컨대, 유방암, 결장암과 연관되는) p53, 및 (예컨대, 유방암, 폐암, 및 결장직장암과 같은 위장관의 암과 연관되는) 암태아성 항원;
(d) 공유된 항원, 예를 들면, (예컨대, 흑색종과 연관되는) 흑색종-멜라닌세포 분화 항원, 예컨대 MART-1/멜란(Melan) A, gp100, MClR, 멜라닌세포-자극 호르몬 수용체, 티로시나아제, 티로시나아제 관련 단백질-1/TRPl 및 티로시나아제 관련 단백질-2/TRP2;
(e) 예컨대, 전립선 암과 연관되는 전립선-연관 항원, 예컨대 PAP, PSA, PSMA, PSH-Pl, PSM-Pl, PSM-P2; 및/또는
(f) (예를 들면, 골수종 및 B 세포 림프종과 연관되는) 면역글로불린 이디오타입(idiotype).
상기 치료 생체분자는 진핵생물 단백질 또는 펩티드일 수 있다. 한 구현예에서, 상기 진핵생물 단백질 또는 펩티드는 포유동물 단백질 또는 펩티드이다. 상기 포유동물 단백질 또는 펩티드는 효소; 효소 억제제; 호르몬; 면역 시스템 단백질; 수용체; 결합 단백질; 전사 인자; 번역 인자; 종양 성장 저해 단백질; 구조 단백질 및 혈액 단백질;로 이루어진 군으로부터 선택될 수 있다.
상기 면역 시스템 단백질은 항체 또는 그의 항원 결합 단편일 수 있다. 따라서, 상기 치료 생체분자는 항체 또는 그의 항원 결합 단편일 수 있다. 상기 항원 결합 단편은 개별 중쇄 또는 경쇄, 또는 그의 단편, 예컨대 VL, VH 및 Fd; 1가(monovalent) 단편, 예컨대 Fv, Fab, 및 Fab'; 2가(bivalent) 단편, 예컨대 F(ab')2; 단일쇄 Fv(scFv); 하나 이상의 상보성 결정 영역(CDR); 또는 Fc 단편;을 포함할 수 있다.
상기 효소는 키모신; 위 리파아제; 조직 플라스미노겐 활성화제; 스트렙토키나아제; 콜레스테롤 생합성 또는 분해성 스테로이드생성 효소; 키나아제; 포스포디에스테라아제; 메틸라아제; 탈-메틸라아제; 탈수소효소; 셀룰라아제; 프로테아제; 리파아제; 포스포리파아제; 아로마타아제; 시토크롬; 아데닐레이트 또는 구아닐레이트 시클라아제 및 뉴라미다아제;로 이루어진 군으로부터 선택될 수 있다.
상기 효소 억제제는 메탈로프로티나아제(TIMP)의 조직 억제제일 수 있다. 상기 호르몬 성장 호르몬일 수 있다.
상기 면역 시스템 단백질은 사이토카인; 케모카인; 림포카인; 에리트로포이에틴; 인테그린; 아드레신; 셀렉틴; 귀소(homing) 수용체; T 세포 수용체 및 면역글로불린;으로 이루어진 군으로부터 선택될 수 있다.
상기 사이토카인은 인터루킨, 예를 들면 IL-2, IL-4 및/또는 IL-6, 콜로니 자극 인자(CSF), 과립구 콜로니 자극 인자(G-CSF), 과립구-대식세포 콜로니 자극 인자(GM-CSF) 또는 종양 괴사 인자(TNF)일 수 있다.
상기 케모카인은 대식세포 염증성 단백질-2 및/또는 플라스미노겐 활성화제일 수 있다.
상기 림포카인은 인터페론일 수 있다.
상기 면역글로불린은 자연형, 변형된 또는 키메라 면역글로불린 또는 그의 단편일 수 있다. 바람직하게는, 상기 면역글로불린은 이중 활성을 갖는 키메라 면역글로불린, 예컨대 항체 효소 또는 항체-독소 키메라이다.
상기 호르몬은 인슐린, 갑상선 호르몬, 카테콜아민, 고나도트로핀, 자극 호르몬, 프로락틴, 옥시토신, 도파민, 소 소마토트로핀, 렙틴; 성장 호르몬(예컨대, 인간 성장 호르몬), 성장 인자(예컨대, 표피 성장 인자, 신경 성장 인자, 인슐린-유사 성장 인자 등);로 이루어진 군으로부터 선택될 수 있다.
상기 수용체는 스테로이드 호르몬 수용체 또는 펩티드 수용체일 수 있다. 바람직하게는, 상기 수용체는 성장 인자 수용체이다.
상기 결합 단백질은 성장 인자 결합 단백질일 수 있다.
상기 종양 성장 저해 단백질은 혈관형성을 억제하는 단백질일 수 있다.
상기 구조 단백질은 콜라겐; 피브로인; 피브리노겐; 엘라스틴; 튜불린; 액틴; 및 미오신;으로 이루어진 군으로부터 선택될 수 있다.
상기 혈액 단백질은 트롬빈; 혈청 알부민; 인자 VII; 인자 VIII; 인슐린; 인자 IX; 인자 X; 조직 플라스미노겐 활성화제; 단백질 C; 본 빌레브란트 인자; 항-트롬빈 III; 글루코세레브로시다아제; 에리트로포이에틴 과립구 콜로니 자극 인자(GCSF) 또는 변형된 인자 VIII; 및 항응고제;로 이루어진 군으로부터 선택될 수 있다.
한 바람직한 구현예에서, 상기 치료 생체분자는 림프 항상성을 조절할 수 있는 사이토카인, 바람직하게는 T 세포의 발생, 프라이밍, 확장, 분화 및/또는 생존에 수반되고, 바람직하게는 이를 유도 또는 향상시키는 사이토카인이다. 따라서, 바람직하게는 상기 사이토카인은 인터루킨이다. 가장 바람직하게는, IL-2, IL-7, IL-12, IL-15, 또는 IL-21이다.
상기 치료 생체분자는 줄기 세포 특징을 갖는 세포로 체세포의 재프로그래밍(reprogramming)을 향상시킬 수 있는 단백질일 수 있다. 줄기 세포 특징을 갖는 세포로 체세포의 재프로그래밍을 향상시킬 수 있는 단백질은 OCT4, SOX2, NANOG, LIN28, p53, ART-4, BAGE, ss-카테닌/m, Bcr-abL CAMEL, CAP-1, CASP-8, CDC27/m, CD 4/m, CEA, CLAUDIN-12, c-MYC, CT, Cyp-B, DAM, ELF2M, ETV6-AML1, G250, GAGE, GnT-V, Gap100, HAGE, HER-2/neu, HPV-E7, HPV-E6, HAST-2, hTERT(또는 hTRT), LAGE, LDLR/FUT, MAGE-A, MAGE-B, MAGE-C, MART-1/멜란-A, MC1R, 마이오신/m, MUC1, MUM-1, -2, -3, NA88-A, NF1, NY-ESO-1, NY-BR-1, pl90 마이너 BCR-abL, Plac-1, Pml/RARa, PRAME, 프로티나아제 3, PSA, PSM, RAGE, RU1 또는 RU2, SAGE, SART-1 또는 SART-3, SCGB3A2, SCP1, SCP2, SCP3, SSX, SURVIVIN, TEL/AML1, TPI/m, TRP-1, TRP-2, TRP-2/INT2, TPTE 및 WT로 이루어진 군으로부터 선택될 수 있고, 바람직하게는 WT-1이다.
바람직하게는, MAGE-A는 MAGE-A1, MAGE-A2, MAGE-A3, MAGE-A4, MAGE-A5, MAGE-A6, MAGE-A7, MAGE-A8, MAGE-A9, MAGE-A10, MAGE-A11, 또는 MAGE-A12로 이루어진 군으로부터 선택된다.
바람직하게는, 줄기 세포 특징을 갖는 세포로 체세포의 재프로그래밍을 향상시킬 수 있는 단백질은 OCT4, SOX2, LF4; c-MYC; NANOG; LIN28;이다.
상기 치료 생체분자는 세포-치료법 적응증을 위해 생체외(ex vivo)에서 세포를 변형하기 위해 이용될 수 있는 생체분자일 수 있다. 따라서, 바람직하게는 상기 치료 생체분자는 면역글로불린, T-세포 수용체 및 NK 수용체로 이루어진 군으로부터 선택될 수 있다.
상기 치료 생체분자는 내인성(endogenous) 숙주 유전자의 발현을 조절할 수 있는 RNA 분자, 예를 들면 간섭 RNA, 예컨대 작은 RNA, siRNA 또는 microRNA일 수 있다.
상기 적어도 하나의 바이러스 선천적 억제제 단백질(IIP)을 암호화하는 서열은 제1 측면의 RNA 구조체 내의 임의의 곳에 배치될 수 있으며, 예컨대 상기 치료 생체분자(즉, 도 1에서의 GOI)를 암호화하는 서열은 상기 적어도 하나의 IIP를 암호화하는 서열의 5' 또는 3'에 배치될 수 있다.
예를 들면, 한 구현예에서, 상기 치료 생체분자를 암호화하는 서열은 바람직하게는 상기 적어도 하나의 선천적 조절 단백질을 암호화하는 서열의 5'에 배치된다. 예를 들면, 도 1에 나타낸 saRNA 구현예 2a, 3a, 4a, 및 mRNA 구현예 6a 및 7a 참조.
그러나, 다른 구현예에서, 상기 치료 생체분자를 암호화하는 서열은 바람직하게는 상기 적어도 하나의 선천적 조절 단백질을 암호화하는 서열의 3'에 배치된다. 예를 들면, 도 1에 나타낸 saRNA 구현예 2b, 3b, 4b, 및 mRNA 구현예 6b 및 7b 참조.
바람직하게는, 제1 측면에 따른 RNA 구조체는 게놈성 또는 서브게놈성일 수 있는 적어도 하나의 프로모터(promoter)를 포함한다. 그러나, 바람직하게는 상기 프로모터는 도 1(구현예 1-4b)에 나타낸 것과 같이 서브게놈성 프로모터이다. 따라서, 바람직하게는 본 발명의 saRNA 구조체는 프로모터를 포함한다. 숙련된 기술자는 상기 서브게놈성 프로모터가 적어도 하나의 치료 생체분자 및 적어도 하나의 선천적 억제제 단백질을 암호화하는 서열에 작동가능하게 연결되어서, 상기 치료 생체분자 및 적어도 하나의 선천적 조절 단백질을 암호화하는 뉴클레오티드 서열을 전사할 수 있는 프로모터에 관한 것임을 이해할 것이다.
바람직하게는, 상기 서브게놈성 프로모터는 본 명세서에서 다음과 같은 서열번호 67로 제공되는 26S이다:
GGGCCCCTATAACTCTCTACGGCTAACCTGAATGGACTACGACAT [서열번호 67]
따라서, 바람직하게는 (바람직하게는, 서브게놈성 프로모터일 수 있는) 상기 프로모터는 실질적으로 서열번호 67에 나타낸 것, 또는 그의 변이체 또는 단편이다.
한 구현예에서, 동일한 프로모터가 관심있는 적어도 하나의 치료 생체분자를 암호화하는 서열 및 적어도 하나의 선천적 조절 단백질을 암호화하는 서열에 작동가능하게 연결된다.
상기 치료 생체분자(즉, GOI) 및 IIP가 모두 RNA의 단일 가닥에 의해 암호화되는 본 발명자들의 디자인은 유리하게는 훨씬 적은 용량의 RNA를 사용하는 것을 가능하게 하는데, 그 이유는 단백질이 상기 RNA에 의해 감지되는 동일한 세포에서 발현되고, 또한 복제될 수 있으며, 이에 따라 선천적 조절 성분이 발현 및 증폭되는 부가적인 측면을 갖기 때문이다.
따라서, 상기 RNA 구조체의 한 구현예에서, 상기 프로모터는 적어도 하나의 치료 생체분자를 암호화하는 서열 및 적어도 하나의 선천적 억제제 단백질을 암호화하는 서열의 5'에 배치되어서, 상기 프로모터는 양쪽 서열 모두에 작동가능하게 연결되고, 이로 인해 양쪽 모두의 발현을 구동한다.
그러나, 다른 구현예에서, 제1 프로모터는 관심있는 적어도 하나의 치료 생체분자를 암호화하는 서열에 작동가능하게 연결되고, 제2 프로모터는 적어도 하나의 선천적 억제제 단백질을 암호화하는 서열에 작동가능하게 연결된다. 이것은 2중 게놈 구조체로 나타낸다. 바람직하게는, 상기 제1 및/또는 제2 프로모터는 게놈성 또는 서브게놈성이다. 바람직하게는, 양쪽 프로모터는 모두 서브게놈성 프로모터, 예컨대 26S이다.
상기 RNA 구조체는 적어도 2개, 3개, 4개 또는 5개 IIP를 암호화할 수 있다. 선천적 조절 단백질을 암호화하는 서열이 1개 이상인 구현예에서, 단일 프로모터는 선천적 조절 단백질을 암호화하는 모든 서열에 작동가능하게 연결될 수 있다. 대안적으로, 프로모터는 선천적 조절 단백질을 암호화하는 각각의 서열에 연결되어서, 각각의 선천적 조절 단백질이 별도의 프로모터에 작동가능하게 연결될 수 있다. 상기 구현예에서, 별도의 프로모터는 동일한 프로모터 서열 또는 상이한 프로모터 서열을 포함할 수 있다. 다른 구현예에서, 상이한 프로모터는 선천적 조절 단백질을 암호화하는 각각의 서열에 작동가능하게 연결된다.
상기 RNA 구조체는 관심있는 적어도 하나의 치료 생체분자를 암호화하는 서열 및 적어도 하나의 선천적 조절 단백질을 암호화하는 서열 사이에 배치된 링커(linker) 서열을 추가로 포함할 수 있다. 상기 링커 서열은 단일 프로모터로부터 IIP의 생산 및 치료 분자의 생산을 가능하게 한다. 한 구현예에서, 상기 링커 서열은 번역 후에 소화되거나 절단됨으로써 숙주 세포에서 적어도 하나의 치료 생체분자 및 적어도 하나의 선천적 조절 단백질을 분리하도록 구성되는 펩티드 링커를 암호화한다. 이와 같이, 상기 링커 서열은 바람직하게는 절단 부위를 형성할 수 있는 절단가능한 펩티드, 예를 들면 2A 펩티드이다. [Furler S, Paterna J-C, Weibel M and Bueler H Recombinant AAV vectors containing the foot and mouth disease virus 2A sequence confer efficient bicistronic gene expression in cultured cells and rat substantia nigra neurons Gene Ther. 2001, vol. 8, PP: 864-873].
바람직하게는, 상기 2A 펩티드 서열을 암호화하는 링커 서열은 2개의 코딩 서열을 함께 연결한다. 이것은 상기 RNA 구조체가 다양한 벡터에서의 발현시에 일어날 수 있는 크기 제한을 극복할 수 있게 하고, 제1 측면의 RNA 구조체에 의해 암호화되는 모든 펩티드의 발현 및 번역이 단일 프로모터의 제어 하에 단일 단백질로서 일어날 수 있게 한다. 따라서, 상기 IIP, 2A 펩티드, 및 치료 생체분자의 서열을 포함하는 단일 단백질의 번역 이후에, 말단 글리신-프롤린 연결부에서 바이러스 2A 펩티드 서열의 절단이 일어나고, 이로 인해 2개의 폴리펩티드가 자유롭게 된다.
상기 2A 스페이서(spacer) 서열은 [Wang Y et al. Scientific Reports 2015, 5]에 개시된 것과 같이 E2A, F2A, P2A 및 T2A로 나타내는 서열을 포함하는 임의의 공지된 변이체일 수 있으며, 즉 적합한 2A 펩티드는 돼지 테스코바이러스(teschovirus)-1 2A(P2A) - ATNFSLLKQAGDVEENPGP(서열번호 68), 토세아 아시그나(thosea asigna) 바이러스 2A(T2A) - QCTNYALLKLAGDVESNPGP(서열번호 69), 말 비염 A 바이러스 2A(E2A), 및 구제역 바이러스 2A(F2A) - VKQTLNFDLLKLAGDVESNPGP(서열번호 70)를 포함한다. 바람직하게는, 상기 2A 펩티드는 토세아 아시그나 바이러스 2A(T2A)이다.
다른 구현예에서, 상기 절단가능한 펩티드는 자가-절단 펩티드이다. 구현예에서, 상기 링커는 바이러스 2A 펩티드 스페이서를 포함하고, 푸린(furin) 절단 부위를 추가로 포함한다. 바람직하게는, 상기 자가-절단 펩티드는 푸린/2A 펩티드이다. 상류에 푸린 절단 부위를 삽입하면, 그렇지 않을 경우 상류 단백질에 부착되어 남아있게 되는 2A 잔기의 제거를 가능하게 한다.
상기 푸린 서열은 상기 2A 서열의 3' 또는 5'에 배치될 수 있다. 그러나, 바람직하게는 상기 푸린 서열은 상기 2A 서열의 5'에 배치되고, 바람직하게는 GSG 스페이서가 상기 푸린 및 2A 서열 사이에 배치된다.
숙련된 기술자는 푸린이 특이적 인식 서열(정규적으로 R-X-R/K/X-R(서열번호 71))에서 전구체 단백질을 절단하고, 최종 R 후에 전구단백질을 절단하는 (주로 골지 및 트랜스-골지 네트워크 내의) 분비 경로에 위치하는 편재성(ubiquitous) 칼슘-의존형 전구단백질 컨버타아제(convertase)임을 인식할 것이다. 따라서, 한 구현예에서, 상기 푸린 서열은 R-X-R/K/X-R이다. 그러나, 바람직하게는 상기 푸린 서열은 최적화된 서열 RRRRRR(서열번호 72) GSG 서열이다. 바람직하게는, 상기 GSG 상기 푸린 서열의 3' 및 상기 2A 서열의 5'에 배치된다.
따라서, 바람직하게는 상기 스페이서 서열은 NCBI 참조 서열: 진뱅크: AAC97195.1에 의해 제공되고, 본 명세서에서 다음과 같은 서열번호 73으로 제공되는 푸린/T2A이다:
RRRRRRGSGEGRGSLLTCGDVEENPGP [서열번호 73]
그러므로, 바람직하게는 상기 스페이서 서열은 서열번호 73에 나타낸 것과 같은 아미노산 서열, 또는 그의 변이체 또는 단편을 포함한다.
도 1은 상기 GOI 및 IIP가 푸린-T2a 절단 부위를 암호화하는 뉴클레오티드 서열에 의해 연결되는 구현예 2a, 2b 및 6a, 6b를 보여준다. 한 구현예에서, 도 1에서 2a 또는 6a로 나타낸 것과 같이, 상기 F-T2a 절단 부위는 5' GOI 및 3' IIP를 분리시킨다. 한 구현예에서, 도 1에서 2b 또는 6b로 나타낸 것과 같이, 상기 F-T2a 절단 부위는 3' GOI 및 5' IIP를 분리시킨다.
RNA 구조체 또는 레플리콘이 선천적 조절 단백질을 암호화하는 하나 이상의 서열을 포함하는 구현예에서, 상기 구조체는 선천적 조절 단백질을 암호화하는 각각의 서열 사이, 또는 일부 IIP 사이에만 배치되는 링커 서열을 포함할 수 있다.
한 구현예에서, 상기 적어도 하나의 치료 생체분자를 암호화하는 서열 및 적어도 하나의 선천적 조절 단백질을 암호화하는 서열은, 그 서열이 무엇이든 간에(즉, 도 1에서 구현예 3a, 3b, 7a 또는 7b에 나타낸 것과 같은 GOI 또는 IIP), 종결 코돈에 의해 분리되고, 이어서 하류 서열의 번역을 시작할 수 있는 내부 리보솜 도입 부위(IRES) 서열이 뒤따를 수 있으며, 그 서열은 어느 것이나 될 수 있다. 따라서, 바람직하게는 상기 IRES 서열은 상기 적어도 하나의 치료 생체분자를 암호화하는 서열 및 상기 적어도 하나의 선천적 조절 단백질을 암호화하는 서열 사이에 배치된다. 적어도 하나의 선천적 조절 단백질을 암호화하는 서열이 다수 사용된다면, 링커 서열은 공지된 절단 서열 및/또는 IRES 서열의 조합을 포함할 수 있다. 한 구현예에서, 도 1에서 3a 또는 7a로 나타낸 것과 같이, 상기 IRES 분위는 5' GOI 및 3' IIP를 분리한다. 한 구현예에서, 도 1에서 3b 또는 7b로 나타낸 것과 같이, 상기 IRES 부위는 3' GOI 및 5' IIP를 분리한다.
구현예에서, 상기 IRES는 피코르나바이러스 IRES이다. 다른 전형적인 IRES 서열은 뇌심근염 바이러스(EMCV) 또는 혈관 내피 성장 인자 및 타입 1 콜라겐-유도성 단백질(VCIP)의 IRES 서열과 같은 것을 포함하며, 본 기술분야의 기술자에게 알려져 있다.
다른 구현예에서, 상기 IRES는 리노바이러스 IRES, A형 간염 바이러스 IRES, C형 간염 바이러스 IRES, 폴리오바이러스 IRES, 엔테로바이러스 IRES, 카디오바이러스(cardiovirus) IRES, 아프토바이러스(aphthovirus) IRES, 플라비바이러스 IRES, 페스티바이러스 IRES, 크리파바이러스(cripavirus) IRES, 로팔로시품 파디 바이러스(rhopalosiphum padi virus) IRES, 또는 임의의 적합한 IRES로부터 선택될 수 있다. 특히, 상기 IRES는 실험적으로 검증된 IRES 구조의 데이터베이스를 제공하는 "IRESite"(http://www.iresite.org/)에 의해 기술되거나, "New Messenger RNA Research Communications" (ISBN: 1-60021-488-6)에 개시된 것과 같은 임의의 IRES일 수 있다.
바람직한 구현예에서, 상기 IRES는 다음과 같은 서열번호 74에 나타낸 것과 같을 수 있는 구제역 바이러스(FMDV) IRES, 또는 그의 단편 또는 변이체이다:
AGCAGGTTTCCCCAACTGACACAAAACGTGCAACTTGAAACTCCGCCTGGTCTTTCCAGGTCTAGAGGGGTAACACTTTGTACTGCGTTTGGCTCCACGCTCGATCCACTGGCGAGTGTTAGTAACAGCACTGTTGCTTCGTAGCGGAGCATGACGGCCGTGGGAACTCCTCCTTGGTAACAAGGACCCACGGGGCCAAAAGCCACGCCCACACGGGCCCGTCATGTGTGCAACCCCAGCACGGCGACTTTACTGCGAAACCCACTTTAAAGTGACATTGAAACTGGTACCCACACACTGGTGACAGGCTAAGGATGCCCTTCAGGTACCCCGAGGTAACACGCGACACTCGGGATCTGAGAAGGGGACTGGGGCTTCTATAAAAGCGCTCGGTTTAAAAAGCTTCTATGCCTGAATAGGTGACCGGAGGTCGGCACCTTTCCTTTGCAATTACTGACCAC [서열번호 74]
다른 바람직한 구현예에서, 상기 IRES는 뇌심근염 바이러스(EMCV) IRES이다. 상기 EMCV IRES는 다음과 같은 서열번호 75에 나타낸 것, 또는 그의 단편 또는 변이체일 수 있다:
cgttactggccgaagccgcttggaataaggccggtgtgcgtttgtctatatgttattttccaccatattgccgtcttttggcaatgtgagggcccggaaacctggccctgtcttcttgacgagcattcctaggggtctttcccctctcgccaaaggaatgcaaggtctgttgaatgtcgtgaaggaagcagttcctctggaagcttcttgaagacaaacaacgtctgtagcgaccctttgcaggcagcggaaccccccacctggcgacaggtgcctctgcggccaaaagccacgtgtataagatacacctgcaaaggcggcacaaccccagtgccacgttgtgagttggatagttgtggaaagagtcaaatggctcccctcaagcgtattcaacaaggggctgaaggatgcccagaaggtaccccattgtatgggatctgatctggggcctcggtgcacatgcttttcatgtgtttagtcgaggttaaaaaacgtctaggccccccgaaccacggggacgtggttttcctttgaaaaacacgatgataata [서열번호 75]
따라서, 바람직하게는 상기 IRES는 실질적으로 서열번호 74 또는 75에 나타낸 것과 같은 뉴클레오티드 서열, 또는 그의 단편 또는 변이체를 포함한다.
대안적으로, IRES 또는 2A 링커 대신에, 상기 링커 서열은 상기 치료 생체분자 및 IIP 모두를 단일 폴리펩티드 사슬로서 발현하게 하는 유연성 링커를 암호화하는 서열을 포함할 수 있지만, 상기 치료 생체분자 및 IIP는 독립적인 단백질로서 작용한다. 그러므로, 상기 단백질들은 이들이 개별적으로 발현된 것과 동일한 방식으로 그 효과를 발휘한다.
상기 유연성 링커 서열은 WO 2013/061076 A1(Oxford Biomedica)에 개시된 것과 같을 수 있다. 상기 유연성 링커 서열은 본 명세서에서 다음과 같은 서열번호 76, 또는 그의 단편 또는 변이체로 나타낼 수 있다:
ggaggtggcgggtccgggggcgggggtagcggtggcgggggctcc [서열번호 76]
바람직하게는, 따라서, 상기 유연성 링커 서열은 실질적으로 서열번호 76에 나타낸 것과 같은 뉴클레오티드 서열, 또는 그의 단편 또는 변이체를 포함한다.
한 바람직한 구현예에서, 상기 유연성 링커 서열은 본 명세서에서 아래에 나타낸 것과 같은 서열번호 77로 나타낸 아미노산 서열, 또는 그의 단편 또는 변이체를 암호화하는 뉴클레오티드 서열을 포함한다:
GGGGSGGGGSGGGGS [서열번호 77]
따라서, 바람직하게는 상기 유연성 링커 서열은 실질적으로 서열번호 77에 나타낸 것과 같은 아미노산 서열, 또는 그의 단편 또는 변이체를 암호화한다.
또 다른 구현예에서, 상기 적어도 하나의 치료 생체분자 및 적어도 하나의 선천적 억제제 단백질을 암호화하는 서열은 종결 코돈에 의해 분리되고, 이어서 하류 서열의 전사를 시작할 수 있는 제2 서브게놈성 프로모터 서열이 뒤따를 수 있다. 상기 구현예의 예는 도 1, 구현예 4a 및 4b에서 실증된다.
(바람직하게는 saRNA 구조체일 때) 상기 RNA 구조체는 적어도 하나의 치료 생체분자 및 적어도 하나의 선천적 조절 단백질을 암호화하는 서열의 5' 또는 3'에 배치된 적어도 하나의 비-구조 단백질(NSP)을 암호화할 수 있다. 바람직하게는, 상기 적어도 하나의 NSP를 암호화하는 서열은 치료 생체분자 및 적어도 하나의 선천적 조절 단백질을 암호화하는 서열의 5'에 배치된다. 따라서, 바람직하게는 상기 적어도 하나의 NSP를 암호화하는 서열은 상기 RNA 구조체의 5' 말단에 배치된다.
상기 RNA 구조체에 의해 암호화되는 적어도 하나의 비-구조 단백질은 RNA 폴리머라아제 NSP4일 수 있다. 상기 하나 이상의 비-구조 단백질은 바람직하게는 레플리카아제르 암호화한다. 바람직하게는, 상기 구조체는 NSP1, NSP2, NSP3 및 NSP4를 암호화한다. 숙련된 기술자는 NSP1은 바이러스 캡핑 효소 및 복제 복합체(RC)의 막 앵커(anchor)이지만, NSP2는 ns 폴리단백질 처리를 담당하는 RNA 헬리카아제 및 프로테아제임을 이해할 것이다. NSP3은 몇 가지 숙주 단백질과 상호작용하고, 단백질 폴리- 및 모노-ADP-리보실화를 조정할 수 있으며, NSP4는 코어 바이러스 RNA-의존형 RNA 폴리머라아제이다.
한 구현예에서, NSP1은 본 명세서에서 다음과 같은 서열번호 78로 제공된다:
MEKVHVDIEEDSPFLRALQRSFPQFEVEAKQVTDNDHANARAFSHLASKLIETEVDPSDTILDIGSAPARRMYSKHKYHCICPMRCAEDPDRLYKYATKLKKNCKEITDKELDKKMKELAAVMSDPDLETETMCLHDDESCRYEGQVAVYQDVYAVDGPTSLYHQANKGVRVAYWIGFDTTPFMFKNLAGAYPSYSTNWADETVLTARNIGLCSSDVMERSRRGMSILRKKYLKPSNNVLFSVGSTIYHEKRDLLRSWHLPSVFHLRGKQNYTCRCETIVSCDGYVVKRIAISPGLYGKPSGYAATMHREGFLCCKVTDTLNGERVSFPVCTYVPATLCDQMTGILATDVSADDAQKLLVGLNQRIVVNGRTQRNTNTMKNYLLPVVAQAFARWAKEYKEDQEDERPLGLRDRQLVMGCCWAFRRHKITSIYKRPDTQTIIKVNSDFHSFVLPRIGSNTLEIGLRTRIRKMLEEHKEPSPLITAEDVQEAKCAADEAKEVREAEELRAALPPLAADVEEPTLEADVDLMLQEAGA [서열번호 78]
따라서, NSP1은 바람직하게는 실질적으로 서열번호 78에 나타낸 것과 같은 아미노산 서열, 또는 그의 생물학적 활성 변이체 또는 단편을 포함한다.
한 구현예에서, NSP1은 다음과 같은 서열번호 79에 정의된 것과 같은 뉴클레오티드 서열에 의해 암호화된다:
ATGGAGAAAGTTCACGTTGACATCGAGGAAGACAGCCCATTCCTCAGAGCTTTGCAGCGGAGCTTCCCGCAGTTTGAGGTAGAAGCCAAGCAGGTCACTGATAATGACCATGCTAATGCCAGAGCGTTTTCGCATCTGGCTTCAAAACTGATCGAAACGGAGGTGGACCCATCCGACACGATCCTTGACATTGGAAGTGCGCCCGCCCGCAGAATGTATTCTAAGCACAAGTATCATTGTATCTGTCCGATGAGATGTGCGGAAGATCCGGACAGATTGTATAAGTATGCAACTAAGCTGAAGAAAAACTGTAAGGAAATAACTGATAAGGAATTGGACAAGAAAATGAAGGAGCTGGCCGCCGTCATGAGCGACCCTGACCTGGAAACTGAGACTATGTGCCTCCACGACGACGAGTCGTGTCGCTACGAAGGGCAAGTCGCTGTTTACCAGGATGTATACGCGGTTGACGGACCGACAAGTCTCTATCACCAAGCCAATAAGGGAGTTAGAGTCGCCTACTGGATAGGCTTTGACACCACCCCTTTTATGTTTAAGAACTTGGCTGGAGCATATCCATCATACTCTACCAACTGGGCCGACGAAACCGTGTTAACGGCTCGTAACATAGGCCTATGCAGCTCTGACGTTATGGAGCGGTCACGTAGAGGGATGTCCATTCTTAGAAAGAAGTATTTGAAACCATCCAACAATGTTCTATTCTCTGTTGGCTCGACCATCTACCACGAGAAGAGGGACTTACTGAGGAGCTGGCACCTGCCGTCTGTATTTCACTTACGTGGCAAGCAAAATTACACATGTCGGTGTGAGACTATAGTTAGTTGCGACGGGTACGTCGTTAAAAGAATAGCTATCAGTCCAGGCCTGTATGGGAAGCCTTCAGGCTATGCTGCTACGATGCACCGCGAGGGATTCTTGTGCTGCAAAGTGACAGACACATTGAACGGGGAGAGGGTCTCTTTTCCCGTGTGCACGTATGTGCCAGCTACATTGTGTGACCAAATGACTGGCATACTGGCAACAGATGTCAGTGCGGACGACGCGCAAAAACTGCTGGTTGGGCTCAACCAGCGTATAGTCGTCAACGGTCGCACCCAGAGAAACACCAATACCATGAAAAATTACCTTTTGCCCGTAGTGGCCCAGGCATTTGCTAGGTGGGCAAAGGAATATAAGGAAGATCAAGAAGATGAAAGGCCACTAGGACTACGAGATAGACAGTTAGTCATGGGGTGTTGTTGGGCTTTTAGAAGGCACAAGATAACATCTATTTATAAGCGCCCGGATACCCAAACCATCATCAAAGTGAACAGCGATTTCCACTCATTCGTGCTGCCCAGGATAGGCAGTAACACATTGGAGATCGGGCTGAGAACAAGAATCAGGAAAATGTTAGAGGAGCACAAGGAGCCGTCACCTCTCATTACCGCCGAGGACGTACAAGAAGCTAAGTGCGCAGCCGATGAGGCTAAGGAGGTGCGTGAAGCCGAGGAGTTGCGCGCAGCTCTACCACCTTTGGCAGCTGATGTTGAGGAGCCCACTCTGGAAGCCGATGTCGACTTGATGTTACAAGAGGCTGGGGCC [서열번호 79]
따라서, NSP1은 바람직하게는 실질적으로 서열번호 79에 나타낸 것과 같은 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 80으로 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
AUGGAGAAAGUUCACGUUGACAUCGAGGAAGACAGCCCAUUCCUCAGAGCUUUGCAGCGGAGCUUCCCGCAGUUUGAGGUAGAAGCCAAGCAGGUCACUGAUAAUGACCAUGCUAAUGCCAGAGCGUUUUCGCAUCUGGCUUCAAAACUGAUCGAAACGGAGGUGGACCCAUCCGACACGAUCCUUGACAUUGGAAGUGCGCCCGCCCGCAGAAUGUAUUCUAAGCACAAGUAUCAUUGUAUCUGUCCGAUGAGAUGUGCGGAAGAUCCGGACAGAUUGUAUAAGUAUGCAACUAAGCUGAAGAAAAACUGUAAGGAAAUAACUGAUAAGGAAUUGGACAAGAAAAUGAAGGAGCUGGCCGCCGUCAUGAGCGACCCUGACCUGGAAACUGAGACUAUGUGCCUCCACGACGACGAGUCGUGUCGCUACGAAGGGCAAGUCGCUGUUUACCAGGAUGUAUACGCGGUUGACGGACCGACAAGUCUCUAUCACCAAGCCAAUAAGGGAGUUAGAGUCGCCUACUGGAUAGGCUUUGACACCACCCCUUUUAUGUUUAAGAACUUGGCUGGAGCAUAUCCAUCAUACUCUACCAACUGGGCCGACGAAACCGUGUUAACGGCUCGUAACAUAGGCCUAUGCAGCUCUGACGUUAUGGAGCGGUCACGUAGAGGGAUGUCCAUUCUUAGAAAGAAGUAUUUGAAACCAUCCAACAAUGUUCUAUUCUCUGUUGGCUCGACCAUCUACCACGAGAAGAGGGACUUACUGAGGAGCUGGCACCUGCCGUCUGUAUUUCACUUACGUGGCAAGCAAAAUUACACAUGUCGGUGUGAGACUAUAGUUAGUUGCGACGGGUACGUCGUUAAAAGAAUAGCUAUCAGUCCAGGCCUGUAUGGGAAGCCUUCAGGCUAUGCUGCUACGAUGCACCGCGAGGGAUUCUUGUGCUGCAAAGUGACAGACACAUUGAACGGGGAGAGGGUCUCUUUUCCCGUGUGCACGUAUGUGCCAGCUACAUUGUGUGACCAAAUGACUGGCAUACUGGCAACAGAUGUCAGUGCGGACGACGCGCAAAAACUGCUGGUUGGGCUCAACCAGCGUAUAGUCGUCAACGGUCGCACCCAGAGAAACACCAAUACCAUGAAAAAUUACCUUUUGCCCGUAGUGGCCCAGGCAUUUGCUAGGUGGGCAAAGGAAUAUAAGGAAGAUCAAGAAGAUGAAAGGCCACUAGGACUACGAGAUAGACAGUUAGUCAUGGGGUGUUGUUGGGCUUUUAGAAGGCACAAGAUAACAUCUAUUUAUAAGCGCCCGGAUACCCAAACCAUCAUCAAAGUGAACAGCGAUUUCCACUCAUUCGUGCUGCCCAGGAUAGGCAGUAACACAUUGGAGAUCGGGCUGAGAACAAGAAUCAGGAAAAUGUUAGAGGAGCACAAGGAGCCGUCACCUCUCAUUACCGCCGAGGACGUACAAGAAGCUAAGUGCGCAGCCGAUGAGGCUAAGGAGGUGCGUGAAGCCGAGGAGUUGCGCGCAGCUCUACCACCUUUGGCAGCUGAUGUUGAGGAGCCCACUCUGGAAGCCGAUGUCGACUUGAUGUUACAAGAGGCUGGGGCC [서열번호 80]
한 구현예에서, NSP2는 본 명세서에서 다음과 같은 서열번호 81로 제공된다:
GSVETPRGLIKVTSYDGEDKIGSYAVLSPQAVLKSEKLSCIHPLAEQVIVITHSGRKGRYAVEPYHGKVVVPEGHAIPVQDFQALSESATIVYNEREFVNRYLHHIATHGGALNTDEEYYKTVKPSEHDGEYLYDIDRKQCVKKELVTGLGLTGELVDPPFHEFAYESLRTRPAAPYQVPTIGVYGVPGSGKSGIIKSAVTKKDLVVSAKKENCAEIIRDVKKMKGLDVNARTVDSVLLNGCKHPVETLYIDEAFACHAGTLRALIAIIRPKKAVLCGDPKQCGFFNMMCLKVHFNHEICTQVFHKSISRRCTKSVTSVVSTLFYDKKMRTTNPKETKIVIDTTGSTKPKQDDLILTCFRGWVKQLQIDYKGNEIMTAAASQGLTRKGVYAVRYKVNENPLYAPTSEHVNVLLTRTEDRIVWKTLAGDPWIKTLTAKYPGNFTATIEEWQAEHDAIMRHILERPDPTDVFQNKANVCWAKALVPVLKTAGIDMTTEQWNTVDYFETDKAHSAEIVLNQLCVRFFGLDLDSGLFSAPTVPLSIRNNHWDNSPSPNMYGLNKEVVRQLSRRYPQLPRAVATGRVYDMNTGTLRNYDPRINLVPVNRRLPHALVLHHNEHPQSDFSSFVSKLKGRTVLVVGEKLSVPGKMVDWLSDRPEATFRARLDLGIPGDVPKYDIIFVNVRTPYKYHHYQQCEDHAIKLSMLTKKACLHLNPGGTCVSIGYGYADRASESIIGAIARQFKFSRVCKPKSSLEETEVLFVFIGYDRKARTHNSYKLSSTLTNIYTGSRLHEAGC [서열번호 81]
따라서, NSP2는 바람직하게는 실질적으로 서열번호 81에 나타낸 것과 같은 아미노산 서열, 또는 그의 생물학적 활성 변이체 또는 단편을 포함한다.
한 구현예에서, NSP2는 다음과 같은 서열번호 82에 정의된 것과 같은 뉴클레오티드 서열에 의해 암호화된다:
GGCTCAGTGGAGACACCTCGTGGCTTGATAAAGGTTACCAGCTACGATGGCGAGGACAAGATCGGCTCTTACGCTGTGCTTTCTCCGCAGGCTGTACTCAAGAGTGAAAAATTATCTTGCATCCACCCTCTCGCTGAACAAGTCATAGTGATAACACACTCTGGCCGAAAAGGGCGTTATGCCGTGGAACCATACCATGGTAAAGTAGTGGTGCCAGAGGGACATGCAATACCCGTCCAGGACTTTCAAGCTCTGAGTGAAAGTGCCACCATTGTGTACAACGAACGTGAGTTCGTAAACAGGTACCTGCACCATATTGCCACACATGGAGGAGCGCTGAACACTGATGAAGAATATTACAAAACTGTCAAGCCCAGCGAGCACGACGGCGAATACCTGTACGACATCGACAGGAAACAGTGCGTCAAGAAAGAACTAGTCACTGGGCTAGGGCTCACAGGCGAGCTGGTGGATCCTCCCTTCCATGAATTCGCCTACGAGAGTCTGAGAACACGACCAGCCGCTCCTTACCAAGTACCAACCATAGGGGTGTATGGCGTGCCAGGATCAGGCAAGTCTGGCATCATTAAAAGCGCAGTCACCAAAAAAGATCTAGTGGTGAGCGCCAAGAAAGAAAACTGTGCAGAAATTATAAGGGACGTCAAGAAAATGAAAGGGCTGGACGTCAATGCCAGAACTGTGGACTCAGTGCTCTTGAATGGATGCAAACACCCCGTAGAGACCCTGTATATTGACGAAGCTTTTGCTTGTCATGCAGGTACTCTCAGAGCGCTCATAGCCATTATAAGACCTAAAAAGGCAGTGCTCTGCGGGGATCCCAAACAGTGCGGTTTTTTTAACATGATGTGCCTGAAAGTGCATTTTAACCACGAGATTTGCACACAAGTCTTCCACAAAAGCATCTCTCGCCGTTGCACTAAATCTGTGACTTCGGTCGTCTCAACCTTGTTTTACGACAAAAAAATGAGAACGACGAATCCGAAAGAGACTAAGATTGTGATTGACACTACCGGCAGTACCAAACCTAAGCAGGACGATCTCATTCTCACTTGTTTCAGAGGGTGGGTGAAGCAGTTGCAAATAGATTACAAAGGCAACGAAATAATGACGGCAGCTGCCTCTCAAGGGCTGACCCGTAAAGGTGTGTATGCCGTTCGGTACAAGGTGAATGAAAATCCTCTGTACGCACCCACCTCAGAACATGTGAACGTCCTACTGACCCGCACGGAGGACCGCATCGTGTGGAAAACACTAGCCGGCGACCCATGGATAAAAACACTGACTGCCAAGTACCCTGGGAATTTCACTGCCACGATAGAGGAGTGGCAAGCAGAGCATGATGCCATCATGAGGCACATCTTGGAGAGACCGGACCCTACCGACGTCTTCCAGAATAAGGCAAACGTGTGTTGGGCCAAGGCTTTAGTGCCGGTGCTGAAGACCGCTGGCATAGACATGACCACTGAACAATGGAACACTGTGGATTATTTTGAAACGGACAAAGCTCACTCAGCAGAGATAGTATTGAACCAACTATGCGTGAGGTTCTTTGGACTCGATCTGGACTCCGGTCTATTTTCTGCACCCACTGTTCCGTTATCCATTAGGAATAATCACTGGGATAACTCCCCGTCGCCTAACATGTACGGGCTGAATAAAGAAGTGGTCCGTCAGCTCTCTCGCAGGTACCCACAACTGCCTCGGGCAGTTGCCACTGGAAGAGTCTATGACATGAACACTGGTACACTGCGCAATTATGATCCGCGCATAAACCTAGTACCTGTAAACAGAAGACTGCCTCATGCTTTAGTCCTCCACCATAATGAACACCCACAGAGTGACTTTTCTTCATTCGTCAGCAAATTGAAGGGCAGAACTGTCCTGGTGGTCGGGGAAAAGTTGTCCGTCCCAGGCAAAATGGTTGACTGGTTGTCAGACCGGCCTGAGGCTACCTTCAGAGCTCGGCTGGATTTAGGCATCCCAGGTGATGTGCCCAAATATGACATAATATTTGTTAATGTGAGGACCCCATATAAATACCATCACTATCAGCAGTGTGAAGACCATGCCATTAAGCTTAGCATGTTGACCAAGAAAGCTTGTCTGCATCTGAATCCCGGCGGAACCTGTGTCAGCATAGGTTATGGTTACGCTGACAGGGCCAGCGAAAGCATCATTGGTGCTATAGCGCGGCAGTTCAAGTTTTCCCGGGTATGCAAACCGAAATCCTCACTTGAAGAGACGGAAGTTCTGTTTGTATTCATTGGGTACGATCGCAAGGCCCGTACGCACAATTCTTACAAGCTTTCATCAACCTTGACCAACATTTATACAGGTTCCAGACTCCACGAAGCCGGATGT [서열번호 82]
따라서, 바람직하게는 NSP2는 실질적으로 서열번호 82에 나타낸 것과 같은 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 상기 RNA 구조체는 다음과 같은 서열번호 83을 포함할 수 있다:
GGCUCAGUGGAGACACCUCGUGGCUUGAUAAAGGUUACCAGCUACGAUGGCGAGGACAAGAUCGGCUCUUACGCUGUGCUUUCUCCGCAGGCUGUACUCAAGAGUGAAAAAUUAUCUUGCAUCCACCCUCUCGCUGAACAAGUCAUAGUGAUAACACACUCUGGCCGAAAAGGGCGUUAUGCCGUGGAACCAUACCAUGGUAAAGUAGUGGUGCCAGAGGGACAUGCAAUACCCGUCCAGGACUUUCAAGCUCUGAGUGAAAGUGCCACCAUUGUGUACAACGAACGUGAGUUCGUAAACAGGUACCUGCACCAUAUUGCCACACAUGGAGGAGCGCUGAACACUGAUGAAGAAUAUUACAAAACUGUCAAGCCCAGCGAGCACGACGGCGAAUACCUGUACGACAUCGACAGGAAACAGUGCGUCAAGAAAGAACUAGUCACUGGGCUAGGGCUCACAGGCGAGCUGGUGGAUCCUCCCUUCCAUGAAUUCGCCUACGAGAGUCUGAGAACACGACCAGCCGCUCCUUACCAAGUACCAACCAUAGGGGUGUAUGGCGUGCCAGGAUCAGGCAAGUCUGGCAUCAUUAAAAGCGCAGUCACCAAAAAAGAUCUAGUGGUGAGCGCCAAGAAAGAAAACUGUGCAGAAAUUAUAAGGGACGUCAAGAAAAUGAAAGGGCUGGACGUCAAUGCCAGAACUGUGGACUCAGUGCUCUUGAAUGGAUGCAAACACCCCGUAGAGACCCUGUAUAUUGACGAAGCUUUUGCUUGUCAUGCAGGUACUCUCAGAGCGCUCAUAGCCAUUAUAAGACCUAAAAAGGCAGUGCUCUGCGGGGAUCCCAAACAGUGCGGUUUUUUUAACAUGAUGUGCCUGAAAGUGCAUUUUAACCACGAGAUUUGCACACAAGUCUUCCACAAAAGCAUCUCUCGCCGUUGCACUAAAUCUGUGACUUCGGUCGUCUCAACCUUGUUUUACGACAAAAAAAUGAGAACGACGAAUCCGAAAGAGACUAAGAUUGUGAUUGACACUACCGGCAGUACCAAACCUAAGCAGGACGAUCUCAUUCUCACUUGUUUCAGAGGGUGGGUGAAGCAGUUGCAAAUAGAUUACAAAGGCAACGAAAUAAUGACGGCAGCUGCCUCUCAAGGGCUGACCCGUAAAGGUGUGUAUGCCGUUCGGUACAAGGUGAAUGAAAAUCCUCUGUACGCACCCACCUCAGAACAUGUGAACGUCCUACUGACCCGCACGGAGGACCGCAUCGUGUGGAAAACACUAGCCGGCGACCCAUGGAUAAAAACACUGACUGCCAAGUACCCUGGGAAUUUCACUGCCACGAUAGAGGAGUGGCAAGCAGAGCAUGAUGCCAUCAUGAGGCACAUCUUGGAGAGACCGGACCCUACCGACGUCUUCCAGAAUAAGGCAAACGUGUGUUGGGCCAAGGCUUUAGUGCCGGUGCUGAAGACCGCUGGCAUAGACAUGACCACUGAACAAUGGAACACUGUGGAUUAUUUUGAAACGGACAAAGCUCACUCAGCAGAGAUAGUAUUGAACCAACUAUGCGUGAGGUUCUUUGGACUCGAUCUGGACUCCGGUCUAUUUUCUGCACCCACUGUUCCGUUAUCCAUUAGGAAUAAUCACUGGGAUAACUCCCCGUCGCCUAACAUGUACGGGCUGAAUAAAGAAGUGGUCCGUCAGCUCUCUCGCAGGUACCCACAACUGCCUCGGGCAGUUGCCACUGGAAGAGUCUAUGACAUGAACACUGGUACACUGCGCAAUUAUGAUCCGCGCAUAAACCUAGUACCUGUAAACAGAAGACUGCCUCAUGCUUUAGUCCUCCACCAUAAUGAACACCCACAGAGUGACUUUUCUUCAUUCGUCAGCAAAUUGAAGGGCAGAACUGUCCUGGUGGUCGGGGAAAAGUUGUCCGUCCCAGGCAAAAUGGUUGACUGGUUGUCAGACCGGCCUGAGGCUACCUUCAGAGCUCGGCUGGAUUUAGGCAUCCCAGGUGAUGUGCCCAAAUAUGACAUAAUAUUUGUUAAUGUGAGGACCCCAUAUAAAUACCAUCACUAUCAGCAGUGUGAAGACCAUGCCAUUAAGCUUAGCAUGUUGACCAAGAAAGCUUGUCUGCAUCUGAAUCCCGGCGGAACCUGUGUCAGCAUAGGUUAUGGUUACGCUGACAGGGCCAGCGAAAGCAUCAUUGGUGCUAUAGCGCGGCAGUUCAAGUUUUCCCGGGUAUGCAAACCGAAAUCCUCACUUGAAGAGACGGAAGUUCUGUUUGUAUUCAUUGGGUACGAUCGCAAGGCCCGUACGCACAAUUCUUACAAGCUUUCAUCAACCUUGACCAACAUUUAUACAGGUUCCAGACUCCACGAAGCCGGAUGU [서열번호 83]
따라서, 그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 83으로 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
한 구현예에서, NSP3은 본 명세서에서 다음과 같은 서열번호 84로 제공된다:
APSYHVVRGDIATATEGVIINAANSKGQPGGGVCGALYKKFPESFDLQPIEVGKARLVKGAAKHIIHAVGPNFNKVSEVEGDKQLAEAYESIAKIVNDNNYKSVAIPLLSTGIFSGNKDRLTQSLNHLLTALDTTDADVAIYCRDKKWEMTLKEAVARREAVEEICISDDSSVTEPDAELVRVHPKSSLAGRKGYSTSDGKTFSYLEGTKFHQAAKDIAEINAMWPVATEANEQVCMYILGESMSSIRSKCPVEESEASTPPSTLPCLCIHAMTPERVQRLKASRPEQITVCSSFPLPKYRITGVQKIQCSQPILFSPKVPAYIHPRKYLVETPPVDETPEPSAENQSTEGTPEQPPLITEDETRTRTPEPIIIEEEEEDSISLLSDGPTHQVLQVEADIHGPPSVSSSSWSIPHASDFDVDSLSILDTLEGASVTSGATSAETNSYFAKSMEFLARPVPAPRTVFRNPPHPAPRTRTPSLAPSRACSRTSLVSTPPGVNRVITREELEALTPSRTPSRSVSRTSLVSNPPGVNRVITREEFEAFVAQQQRFDAGA [서열번호 84]
따라서, 바람직하게는 NSP3은 실질적으로 서열번호 84에 나타낸 것과 같은 아미노산 서열, 또는 그의 생물학적 활성 변이체 또는 단편을 포함한다.
한 구현예에서, NSP3은 다음과 같은 서열번호 85에 정의된 것과 같은 뉴클레오티드 서열에 의해 암호화된다:
GCACCCTCATATCATGTGGTGCGAGGGGATATTGCCACGGCCACCGAAGGAGTGATTATAAATGCTGCTAACAGCAAAGGACAACCTGGCGGAGGGGTGTGCGGAGCGCTGTATAAGAAATTCCCGGAAAGCTTCGATTTACAGCCGATCGAAGTAGGAAAAGCGCGACTGGTCAAAGGTGCAGCTAAACATATCATTCATGCCGTAGGACCAAACTTCAACAAAGTTTCGGAGGTTGAAGGTGACAAACAGTTGGCAGAGGCTTATGAGTCCATCGCTAAGATTGTCAACGATAACAATTACAAGTCAGTAGCGATTCCACTGTTGTCCACCGGCATCTTTTCCGGGAACAAAGATCGACTAACCCAATCATTGAACCATTTGCTGACAGCTTTAGACACCACTGATGCAGATGTAGCCATATACTGCAGGGACAAGAAATGGGAAATGACTCTCAAGGAAGCAGTGGCTAGGAGAGAAGCAGTGGAGGAGATATGCATATCCGACGACTCTTCAGTGACAGAACCTGATGCAGAGCTGGTGAGGGTGCATCCGAAGAGTTCTTTGGCTGGAAGGAAGGGCTACAGCACAAGCGATGGCAAAACTTTCTCATATTTGGAAGGGACCAAGTTTCACCAGGCGGCCAAGGATATAGCAGAAATTAATGCCATGTGGCCCGTTGCAACGGAGGCCAATGAGCAGGTATGCATGTATATCCTCGGAGAAAGCATGAGCAGTATTAGGTCGAAATGCCCCGTCGAAGAGTCGGAAGCCTCCACACCACCTAGCACGCTGCCTTGCTTGTGCATCCATGCCATGACTCCAGAAAGAGTACAGCGCCTAAAAGCCTCACGTCCAGAACAAATTACTGTGTGCTCATCCTTTCCATTGCCGAAGTATAGAATCACTGGTGTGCAGAAGATCCAATGCTCCCAGCCTATATTGTTCTCACCGAAAGTGCCTGCGTATATTCATCCAAGGAAGTATCTCGTGGAAACACCACCGGTAGACGAGACTCCGGAGCCATCGGCAGAGAACCAATCCACAGAGGGGACACCTGAACAACCACCACTTATAACCGAGGATGAGACCAGGACTAGAACGCCTGAGCCGATCATCATCGAAGAGGAAGAAGAGGATAGCATAAGTTTGCTGTCAGATGGCCCGACCCACCAGGTGCTGCAAGTCGAGGCAGACATTCACGGGCCGCCCTCTGTATCTAGCTCATCCTGGTCCATTCCTCATGCATCCGACTTTGATGTGGACAGTTTATCCATACTTGACACCCTGGAGGGAGCTAGCGTGACCAGCGGGGCAACGTCAGCCGAGACTAACTCTTACTTCGCAAAGAGTATGGAGTTTCTGGCGCGACCGGTGCCTGCGCCTCGAACAGTATTCAGGAACCCTCCACATCCCGCTCCGCGCACAAGAACACCGTCACTTGCACCCAGCAGGGCCTGCTCGAGAACCAGCCTAGTTTCCACCCCGCCAGGCGTGAATAGGGTGATCACTAGAGAGGAGCTCGAGGCGCTTACCCCGTCACGCACTCCTAGCAGGTCGGTCTCGAGAACCAGCCTGGTCTCCAACCCGCCAGGCGTAAATAGGGTGATTACAAGAGAGGAGTTTGAGGCGTTCGTAGCACAACAACAATGACGGTTTGATGCGGGTGCA [서열번호 85]
따라서, 바람직하게는 NSP3은 실질적으로 서열번호 85에 나타낸 것과 같은 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 상기 RNA 구조체는 다음과 같은 서열번호 86을 포함할 수 있다:
GCACCCUCAUAUCAUGUGGUGCGAGGGGAUAUUGCCACGGCCACCGAAGGAGUGAUUAUAAAUGCUGCUAACAGCAAAGGACAACCUGGCGGAGGGGUGUGCGGAGCGCUGUAUAAGAAAUUCCCGGAAAGCUUCGAUUUACAGCCGAUCGAAGUAGGAAAAGCGCGACUGGUCAAAGGUGCAGCUAAACAUAUCAUUCAUGCCGUAGGACCAAACUUCAACAAAGUUUCGGAGGUUGAAGGUGACAAACAGUUGGCAGAGGCUUAUGAGUCCAUCGCUAAGAUUGUCAACGAUAACAAUUACAAGUCAGUAGCGAUUCCACUGUUGUCCACCGGCAUCUUUUCCGGGAACAAAGAUCGACUAACCCAAUCAUUGAACCAUUUGCUGACAGCUUUAGACACCACUGAUGCAGAUGUAGCCAUAUACUGCAGGGACAAGAAAUGGGAAAUGACUCUCAAGGAAGCAGUGGCUAGGAGAGAAGCAGUGGAGGAGAUAUGCAUAUCCGACGACUCUUCAGUGACAGAACCUGAUGCAGAGCUGGUGAGGGUGCAUCCGAAGAGUUCUUUGGCUGGAAGGAAGGGCUACAGCACAAGCGAUGGCAAAACUUUCUCAUAUUUGGAAGGGACCAAGUUUCACCAGGCGGCCAAGGAUAUAGCAGAAAUUAAUGCCAUGUGGCCCGUUGCAACGGAGGCCAAUGAGCAGGUAUGCAUGUAUAUCCUCGGAGAAAGCAUGAGCAGUAUUAGGUCGAAAUGCCCCGUCGAAGAGUCGGAAGCCUCCACACCACCUAGCACGCUGCCUUGCUUGUGCAUCCAUGCCAUGACUCCAGAAAGAGUACAGCGCCUAAAAGCCUCACGUCCAGAACAAAUUACUGUGUGCUCAUCCUUUCCAUUGCCGAAGUAUAGAAUCACUGGUGUGCAGAAGAUCCAAUGCUCCCAGCCUAUAUUGUUCUCACCGAAAGUGCCUGCGUAUAUUCAUCCAAGGAAGUAUCUCGUGGAAACACCACCGGUAGACGAGACUCCGGAGCCAUCGGCAGAGAACCAAUCCACAGAGGGGACACCUGAACAACCACCACUUAUAACCGAGGAUGAGACCAGGACUAGAACGCCUGAGCCGAUCAUCAUCGAAGAGGAAGAAGAGGAUAGCAUAAGUUUGCUGUCAGAUGGCCCGACCCACCAGGUGCUGCAAGUCGAGGCAGACAUUCACGGGCCGCCCUCUGUAUCUAGCUCAUCCUGGUCCAUUCCUCAUGCAUCCGACUUUGAUGUGGACAGUUUAUCCAUACUUGACACCCUGGAGGGAGCUAGCGUGACCAGCGGGGCAACGUCAGCCGAGACUAACUCUUACUUCGCAAAGAGUAUGGAGUUUCUGGCGCGACCGGUGCCUGCGCCUCGAACAGUAUUCAGGAACCCUCCACAUCCCGCUCCGCGCACAAGAACACCGUCACUUGCACCCAGCAGGGCCUGCUCGAGAACCAGCCUAGUUUCCACCCCGCCAGGCGUGAAUAGGGUGAUCACUAGAGAGGAGCUCGAGGCGCUUACCCCGUCACGCACUCCUAGCAGGUCGGUCUCGAGAACCAGCCUGGUCUCCAACCCGCCAGGCGUAAAUAGGGUGAUUACAAGAGAGGAGUUUGAGGCGUUCGUAGCACAACAACAAUGACGGUUUGAUGCGGGUGCA [서열번호 86]
따라서, 그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 86으로 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
한 구현예에서, NSP4는 본 명세서에서 다음과 같은 서열번호 87로 제공된다:
YIFSSDTGQGHLQQKSVRQTVLSEVVLERTELEISYAPRLDQEKEELLRKKLQLNPTPANRSRYQSRKVENMKAITARRILQGLGHYLKAEGKVECYRTLHPVPLYSSSVNRAFSSPKVAVEACNAMLKENFPTVASYCIIPEYDAYLDMVDGASCCLDTASFCPAKLRSFPKKHSYLEPTIRSAVPSAIQNTLQNVLAAATKRNCNVTQMRELPVLDSAAFNVECFKKYACNNEYWETFKENPIRLTEENVVNYITKLKGPKAAALFAKTHNLNMLQDIPMDRFVMDLKRDVKVTPGTKHTEERPKVQVIQAADPLATAYLCGIHRELVRRLNAVLLPNIHTLFDMSAEDFDAIIAEHFQPGDCVLETDIASFDKSEDDAMALTALMILEDLGVDAELLTLIEAAFGEISSIHLPTKTKFKFGAMMKSGMFLTLFVNTVINIVIASRVLRERLTGSPCAAFIGDDNIVKGVKSDKLMADRCATWLNMEVKIIDAVVGEKAPYFCGGFILCDSVTGTACRVADPLKRLFKLGKPLAADDEHDDDRRRALHEESTRWNRVGILSELCKAVESRYETVGTSIIVMAMTTLASSVKSFSYLRGAPITLYG [서열번호 87]
따라서, 바람직하게는 NSP4는 실질적으로 서열번호 87에 나타낸 것과 같은 아미노산 서열, 또는 그의 생물학적 활성 변이체 또는 단편을 포함한다.
한 구현예에서, NSP4는 다음과 같은 서열번호 88에 정의된 것과 같은 뉴클레오티드 서열에 의해 암호화된다:
TACATCTTTTCCTCCGACACCGGTCAAGGGCATTTACAACAAAAATCAGTAAGGCAAACGGTGCTATCCGAAGTGGTGTTGGAGAGGACCGAATTGGAGATTTCGTATGCCCCGCGCCTCGACCAAGAAAAAGAAGAATTACTACGCAAGAAATTACAGTTAAATCCCACACCTGCTAACAGAAGCAGATACCAGTCCAGGAAGGTGGAGAACATGAAAGCCATAACAGCTAGACGTATTCTGCAAGGCCTAGGGCATTATTTGAAGGCAGAAGGAAAAGTGGAGTGCTACCGAACCCTGCATCCTGTTCCTTTGTATTCATCTAGTGTGAACCGTGCCTTTTCAAGCCCCAAGGTCGCAGTGGAAGCCTGTAACGCCATGTTGAAAGAGAACTTTCCGACTGTGGCTTCTTACTGTATTATTCCAGAGTACGATGCCTATTTGGACATGGTTGACGGAGCTTCATGCTGCTTAGACACTGCCAGTTTTTGCCCTGCAAAGCTGCGCAGCTTTCCAAAGAAACACTCCTATTTGGAACCCACAATACGATCGGCAGTGCCTTCAGCGATCCAGAACACGCTCCAGAACGTCCTGGCAGCTGCCACAAAAAGAAATTGCAATGTCACGCAAATGAGAGAATTGCCCGTATTGGATTCGGCGGCCTTTAATGTGGAATGCTTCAAGAAATATGCGTGTAATAATGAATATTGGGAAACGTTTAAAGAAAACCCCATCAGGCTTACTGAAGAAAACGTGGTAAATTACATTACCAAATTAAAAGGACCAAAAGCTGCTGCTCTTTTTGCGAAGACACATAATTTGAATATGTTGCAGGACATACCAATGGACAGGTTTGTAATGGACTTAAAGAGAGACGTGAAAGTGACTCCAGGAACAAAACATACTGAAGAACGGCCCAAGGTACAGGTGATCCAGGCTGCCGATCCGCTAGCAACAGCGTATCTGTGCGGAATCCACCGAGAGCTGGTTAGGAGATTAAATGCGGTCCTGCTTCCGAACATTCATACACTGTTTGATATGTCGGCTGAAGACTTTGACGCTATTATAGCCGAGCACTTCCAGCCTGGGGATTGTGTTCTGGAAACTGACATCGCGTCGTTTGATAAAAGTGAGGACGACGCCATGGCTCTGACCGCGTTAATGATTCTGGAAGACTTAGGTGTGGACGCAGAGCTGTTGACGCTGATTGAGGCGGCTTTCGGCGAAATTTCATCAATACATTTGCCCACTAAAACTAAATTTAAATTCGGAGCCATGATGAAATCTGGAATGTTCCTCACACTGTTTGTGAACACAGTCATTAACATTGTAATCGCAAGCAGAGTGTTGAGAGAACGGCTAACCGGATCACCATGTGCAGCATTCATTGGAGATGACAATATCGTGAAAGGAGTCAAATCGGACAAATTAATGGCAGACAGGTGCGCCACCTGGTTGAATATGGAAGTCAAGATTATAGATGCTGTGGTGGGCGAGAAAGCGCCTTATTTCTGTGGAGGGTTTATTTTGTGTGACTCCGTGACCGGCACAGCGTGCCGTGTGGCAGACCCCCTAAAAAGGCTGTTTAAGCTTGGCAAACCTCTGGCAGCAGACGATGAACATGATGATGACAGGAGAAGGGCATTGCATGAAGAGTCAACACGCTGGAACCGAGTGGGTATTCTTTCAGAGCTGTGCAAGGCAGTAGAATCAAGGTATGAAACCGTAGGAACTTCCATCATAGTTATGGCCATGACTACTCTAGCTAGCAGTGTTAAATCATTCAGCTACCTGAGAGGGGCCCCTATAACTCTCTACGGC [서열번호 88]
따라서, 바람직하게는 NSP4는 실질적으로 서열번호 88에 나타낸 것과 같은 뉴클레오티드 서열, 또는 그의 변이체 또는 단편에 의해 암호화된다.
따라서, 상기 RNA 구조체는 다음과 같은 서열번호 89를 포함할 수 있다:
UACAUCUUUUCCUCCGACACCGGUCAAGGGCAUUUACAACAAAAAUCAGUAAGGCAAACGGUGCUAUCCGAAGUGGUGUUGGAGAGGACCGAAUUGGAGAUUUCGUAUGCCCCGCGCCUCGACCAAGAAAAAGAAGAAUUACUACGCAAGAAAUUACAGUUAAAUCCCACACCUGCUAACAGAAGCAGAUACCAGUCCAGGAAGGUGGAGAACAUGAAAGCCAUAACAGCUAGACGUAUUCUGCAAGGCCUAGGGCAUUAUUUGAAGGCAGAAGGAAAAGUGGAGUGCUACCGAACCCUGCAUCCUGUUCCUUUGUAUUCAUCUAGUGUGAACCGUGCCUUUUCAAGCCCCAAGGUCGCAGUGGAAGCCUGUAACGCCAUGUUGAAAGAGAACUUUCCGACUGUGGCUUCUUACUGUAUUAUUCCAGAGUACGAUGCCUAUUUGGACAUGGUUGACGGAGCUUCAUGCUGCUUAGACACUGCCAGUUUUUGCCCUGCAAAGCUGCGCAGCUUUCCAAAGAAACACUCCUAUUUGGAACCCACAAUACGAUCGGCAGUGCCUUCAGCGAUCCAGAACACGCUCCAGAACGUCCUGGCAGCUGCCACAAAAAGAAAUUGCAAUGUCACGCAAAUGAGAGAAUUGCCCGUAUUGGAUUCGGCGGCCUUUAAUGUGGAAUGCUUCAAGAAAUAUGCGUGUAAUAAUGAAUAUUGGGAAACGUUUAAAGAAAACCCCAUCAGGCUUACUGAAGAAAACGUGGUAAAUUACAUUACCAAAUUAAAAGGACCAAAAGCUGCUGCUCUUUUUGCGAAGACACAUAAUUUGAAUAUGUUGCAGGACAUACCAAUGGACAGGUUUGUAAUGGACUUAAAGAGAGACGUGAAAGUGACUCCAGGAACAAAACAUACUGAAGAACGGCCCAAGGUACAGGUGAUCCAGGCUGCCGAUCCGCUAGCAACAGCGUAUCUGUGCGGAAUCCACCGAGAGCUGGUUAGGAGAUUAAAUGCGGUCCUGCUUCCGAACAUUCAUACACUGUUUGAUAUGUCGGCUGAAGACUUUGACGCUAUUAUAGCCGAGCACUUCCAGCCUGGGGAUUGUGUUCUGGAAACUGACAUCGCGUCGUUUGAUAAAAGUGAGGACGACGCCAUGGCUCUGACCGCGUUAAUGAUUCUGGAAGACUUAGGUGUGGACGCAGAGCUGUUGACGCUGAUUGAGGCGGCUUUCGGCGAAAUUUCAUCAAUACAUUUGCCCACUAAAACUAAAUUUAAAUUCGGAGCCAUGAUGAAAUCUGGAAUGUUCCUCACACUGUUUGUGAACACAGUCAUUAACAUUGUAAUCGCAAGCAGAGUGUUGAGAGAACGGCUAACCGGAUCACCAUGUGCAGCAUUCAUUGGAGAUGACAAUAUCGUGAAAGGAGUCAAAUCGGACAAAUUAAUGGCAGACAGGUGCGCCACCUGGUUGAAUAUGGAAGUCAAGAUUAUAGAUGCUGUGGUGGGCGAGAAAGCGCCUUAUUUCUGUGGAGGGUUUAUUUUGUGUGACUCCGUGACCGGCACAGCGUGCCGUGUGGCAGACCCCCUAAAAAGGCUGUUUAAGCUUGGCAAACCUCUGGCAGCAGACGAUGAACAUGAUGAUGACAGGAGAAGGGCAUUGCAUGAAGAGUCAACACGCUGGAACCGAGUGGGUAUUCUUUCAGAGCUGUGCAAGGCAGUAGAAUCAAGGUAUGAAACCGUAGGAACUUCCAUCAUAGUUAUGGCCAUGACUACUCUAGCUAGCAGUGUUAAAUCAUUCAGCUACCUGAGAGGGGCCCCUAUAACUCUCUACGGC [서열번호 89]
따라서, 그러므로, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 89로 나타낸 것과 같은 RNA 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
바람직하게는, 숙주 세포에 존재하는 단백질과 함께, 본 발명의 RNA 구조체에 의해 암호화되는 비-구조 단백질은 적어도 하나의 치료 생체분자 및 적어도 하나의 선천적 조절 단백질을 암호화하는 서열의 게놈 복제 및 전사를 위해 필요한 효소 복합체(즉, 레플리카아제)를 형성한다. 예를 들면, 상기 하나 이상의 비-구조 단백질은 상기 구조체가 관심있는 적어도 하나의 펩티드 또는 단백질(즉, 치료 생체분자) 및 적어도 하나의 선천적 조절 단백질을 암호화하는 뉴클레오티드 서열을 증폭하게 할 수 있는 폴리머라아제를 암호화할 수 있다.
상기 숙주 세포는 진핵생물 또는 원핵생물 숙주 세포일 수 있다. 바람직하게는, 상기 숙주 세포는 진핵생물 숙주 세포이다. 보다 바람직하게는, 상기 숙주 세포는 포유동물 숙주 세포이다.
상기 RNA 구조체는 적어도 하나의 비-구조 단백질의 5'에 배치된 프로모터를 추가로 포함할 수 있으며, 상기 프로모터는 적어도 하나의 비-구조 단백질을 암호화하는 서열에 작동가능하게 연결되고, 숙주 세포에서 적어도 하나의 비-구조 단백질을 발현할 수 있다.
바람직하게는, 상기 RNA 구조체는 본 명세서에서 다음과 같은 서열번호 90으로 나타낼 수 있는 5' UTR 보존된 서열 요소를 포함한다:
AUGGGCGGCGCAUGAGAGAAGCCCAGACCAAUUACCUACCCAAA [서열번호 90]
따라서, 바람직하게는 상기 UTR은 적어도 하나의 비-구조 단백질의 5'에 배치되고, 실질적으로 서열번호 90에 나타낸 것과 같은 뉴클레오티드 서열, 또는 그의 단편 또는 변이체를 포함한다.
바람직하게는, 상기 RNA 구조체는 본 명세서에서 다음과 같은 서열번호 91로 나타낼 수 있는 3' UTR 보존된 서열 요소를 포함한다:
AAUUGGCAAGCUGCUUACAUAGAACUCGCGGCGAUUGGCAUGCCGCCUUAAAAUUUUUAUUUUAUUUUUCUUUUCUUUUCCGAAUCGGAUUUUGUUUUUAAUAUUUCAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA [서열번호 91]
따라서, 바람직하게는 상기 3' UTR은 상기 적어도 하나의 비-구조 단백질의 3'에 배치되고, 실질적으로 서열번호 91에 나타낸 것과 같은 뉴클레오티드 서열, 또는 그의 단편 또는 변이체를 포함한다.
바람직하게는, 상기 RNA 구조체는 폴리A 꼬리(polyA tail)를 포함한다. 바람직하게는, 상기 폴리A 꼬리는 상기 구조체의 3' 말단에 배치된다. 상기 폴리A 꼬리는 적어도 35개 nt, 또는 적어도 40개 nt, 또는 적어도 45개 nt, 또는 적어도 50개 nt를 포함할 수 있으며, 여기서 각각의 nt는 아데닌이다. 다른 구현예에서, 상기 폴리A 꼬리는 적어도 55개 nt 또는 적어도 60개 nt를 포함할 수 있으며, 여기서 각각의 nt는 아데닌이다. 또 다른 구현예에서, 상기 폴리A 꼬리는 적어도 60개 아데닌과, 이어서 하나 이상의 비-아데닌 뉴클레오티드(즉, G, C 또는 T, 바람직하게는 구아닌), 이후 다른 적어도 35개 nt, 또는 적어도 40개 nt, 또는 적어도 45개 nt, 또는 적어도 50개 nt, 또는 적어도 55개 nt, 또는 적어도 60개 nt를 포함할 수 있으며, 여기서 각각의 nt는 아데닌이다.
상기 RNA 구조체는 5' 캡을 추가로 포함할 수 있다. 본 발명의 문맥에서, 용어 "5'-캡"은 RNA 캡 구조를 닮은 5'-캡 유사체를 포함하며, 바람직하게는 생체내 및/또는 세포에서 여기에 부착될 경우 RNA를 안정화하거나, 및/또는 RNA의 번역을 향상시키는 능력을 갖도록 변형된다.
5'-캡을 갖는 RNA는 상기 5'-캡의 존재시에 DNA 주형의 시험관내 전사에 의해 달성될 수 있으며, 여기서 상기 5'-캡은 생성된 RNA 가닥 내로 공동-전사적으로 통합되거나, 상기 RNA는, 예를 들면, 시험관내 전사에 의해 생성될 수 있고, 상기 5' -캡은 캡핑 효소, 예를 들면, 백시니아 바이러스의 캡핑 효소를 이용하여 사후-전사적으로 RNA에 부착될 수 있다. 캡핑된 RNA에서, (캡핑된) RNA 분자의 제1 염기의 3' 위치는 포스포디에스테르 결합을 통해 RNA 분자의 후속 염기("제2 염기")의 5' 위치에 연결된다.
한 구현예에서, 상기 RNA 구조체는, 바람직하게는 5'에서 3'으로, 프로모터, 적어도 하나의 치료 생체분자를 암호화하는 서열, 링커 서열, 및 IIP를 암호화하는 적어도 하나의 서열을 포함한다. 한 구현예에서, 상기 RNA 구조체는, 바람직하게는 5'에서 3'으로, 프로모터, 적어도 하나의 IIP를 암호화하는 서열, 링커 서열, 및 적어도 하나의 치료 생체분자를 암호화하는 서열을 포함한다. 양쪽 구현예에서, 상기 링커는 F-T2a 또는 IRES일 수 있다.
다른 구현예에서, 상기 RNA 구조체는, 바람직하게는 5'에서 3'으로, 프로모터, 적어도 하나의 비-구조 단백질을 암호화하는 서열, 서브게놈성 프로모터, 적어도 하나의 치료 생체분자를 암호화하는 서열, 링커 서열, 및 적어도 하나의 바이러스 IIP를 암호화하는 서열을 포함한다. 다른 구현예에서, 상기 RNA 구조체는, 바람직하게는 5'에서 3'으로, 프로모터, 적어도 하나의 비-구조 단백질을 암호화하는 서열, 서브게놈성 프로모터, 적어도 하나의 바이러스 IIP를 암호화하는 서열, 링커 서열, 및 적어도 하나의 치료 생체분자를 암호화하는 서열을 포함한다. 양쪽 구현예에서, 상기 링커는 F-T2a 또는 IRES일 수 있다.
또 다른 구현예에서, 상기 RNA 구조체는, 바람직하게는 5'에서 3'으로, 프로모터, 적어도 하나의 비-구조 단백질을 암호화하는 서열, 서브게놈성 프로모터, 적어도 하나의 치료 생체분자를 암호화하는 서열, 링커 서열, 및 적어도 하나의 바이러스 IIP를 암호화하는 서열, 및 폴리A 꼬리를 포함한다. 또 다른 구현예에서, 상기 RNA 구조체는, 바람직하게는 5'에서 3'으로, 프로모터, 적어도 하나의 비-구조 단백질을 암호화하는 서열, 서브게놈성 프로모터, 적어도 하나의 바이러스 IIP를 암호화하는 서열, 링커 서열, 적어도 하나의 치료 생체분자를 암호화하는 서열, 및 폴리A 꼬리를 포함한다. 양쪽 구현예에서, 상기 링커는 F-T2a 또는 IRES일 수 있다.
다른 구현예에서, 상기 RNA 구조체는, 바람직하게는 5'에서 3'으로, 프로모터, 적어도 하나의 비-구조 단백질을 암호화하는 서열, 제1 서브게놈성 프로모터, 적어도 하나의 치료 생체분자를 암호화하는 서열, 제2 서브게놈성 프로모터, 적어도 하나의 바이러스 IIP를 암호화하는 서열, 및 폴리A 꼬리를 포함한다. 다른 구현예에서, 상기 RNA 구조체는, 바람직하게는 5'에서 3'으로, 프로모터, 적어도 하나의 비-구조 단백질을 암호화하는 서열, 제1 서브게놈성 프로모터, 적어도 하나의 바이러스 IIP를 암호화하는 서열, 제2 서브게놈성 프로모터, 적어도 하나의 치료 생체분자를 암호화하는 서열, 및 폴리A 꼬리를 포함한다.
가장 바람직하게는, 상기 RNA 구조체는, 5'에서 3'으로, 5' 캡, 프로모터, nsP1, nsP2, nsP3, nsP4, 서브게놈성 프로모터 26S, 치료 생체분자를 암호화하는 서열, 링커 서열, 바이러스 IIP를 암호화하는 서열, 및 폴리A 꼬리를 포함한다. 가장 바람직하게는, 상기 RNA 구조체는, 5'에서 3'으로, 5' 캡, 프로모터, nsP1, nsP2, nsP3v, nsP4, 서브게놈성 프로모터 26S, 바이러스 IIP를 암호화하는 서열, 링커 서열, 치료 생체분자를 암호화하는 서열; 및 폴리A 꼬리를 포함한다.
따라서, 한 구현예에서, 상기 RNA 구조체는 GOI - 푸린 T2A - HCV E6을 암호화하거나 이를 포함할 수 있다(이것은 본 명세서에서 인용된 첫번째 바이러스 IIP이지만, 본 명세서에 개시된 임의의 IIP 또는 링커가 사용될 수 있음이 인식될 것이다). 그러므로, 상기 RNA 구조체는 단일 RNA 구조체 내에 서열번호 92를 포함하거나 이로 이루어지는 단일 RNA 구조체, GOI, 및 서열번호 457을 포함하거나 이로 이루어질 수 있다. 서열번호 92 및 서열번호 457는 다음과 같다:
AUGGGCGGCGCAUGAGAGAAGCCCAGACCAAUUACCUACCCAAAAUGGAGAAAGUUCACGUUGACAUCGAGGAAGACAGCCCAUUCCUCAGAGCUUUGCAGCGGAGCUUCCCGCAGUUUGAGGUAGAAGCCAAGCAGGUCACUGAUAAUGACCAUGCUAAUGCCAGAGCGUUUUCGCAUCUGGCUUCAAAACUGAUCGAAACGGAGGUGGACCCAUCCGACACGAUCCUUGACAUUGGAAGUGCGCCCGCCCGCAGAAUGUAUUCUAAGCACAAGUAUCAUUGUAUCUGUCCGAUGAGAUGUGCGGAAGAUCCGGACAGAUUGUAUAAGUAUGCAACUAAGCUGAAGAAAAACUGUAAGGAAAUAACUGAUAAGGAAUUGGACAAGAAAAUGAAGGAGCUGGCCGCCGUCAUGAGCGACCCUGACCUGGAAACUGAGACUAUGUGCCUCCACGACGACGAGUCGUGUCGCUACGAAGGGCAAGUCGCUGUUUACCAGGAUGUAUACGCGGUUGACGGACCGACAAGUCUCUAUCACCAAGCCAAUAAGGGAGUUAGAGUCGCCUACUGGAUAGGCUUUGACACCACCCCUUUUAUGUUUAAGAACUUGGCUGGAGCAUAUCCAUCAUACUCUACCAACUGGGCCGACGAAACCGUGUUAACGGCUCGUAACAUAGGCCUAUGCAGCUCUGACGUUAUGGAGCGGUCACGUAGAGGGAUGUCCAUUCUUAGAAAGAAGUAUUUGAAACCAUCCAACAAUGUUCUAUUCUCUGUUGGCUCGACCAUCUACCACGAGAAGAGGGACUUACUGAGGAGCUGGCACCUGCCGUCUGUAUUUCACUUACGUGGCAAGCAAAAUUACACAUGUCGGUGUGAGACUAUAGUUAGUUGCGACGGGUACGUCGUUAAAAGAAUAGCUAUCAGUCCAGGCCUGUAUGGGAAGCCUUCAGGCUAUGCUGCUACGAUGCACCGCGAGGGAUUCUUGUGCUGCAAAGUGACAGACACAUUGAACGGGGAGAGGGUCUCUUUUCCCGUGUGCACGUAUGUGCCAGCUACAUUGUGUGACCAAAUGACUGGCAUACUGGCAACAGAUGUCAGUGCGGACGACGCGCAAAAACUGCUGGUUGGGCUCAACCAGCGUAUAGUCGUCAACGGUCGCACCCAGAGAAACACCAAUACCAUGAAAAAUUACCUUUUGCCCGUAGUGGCCCAGGCAUUUGCUAGGUGGGCAAAGGAAUAUAAGGAAGAUCAAGAAGAUGAAAGGCCACUAGGACUACGAGAUAGACAGUUAGUCAUGGGGUGUUGUUGGGCUUUUAGAAGGCACAAGAUAACAUCUAUUUAUAAGCGCCCGGAUACCCAAACCAUCAUCAAAGUGAACAGCGAUUUCCACUCAUUCGUGCUGCCCAGGAUAGGCAGUAACACAUUGGAGAUCGGGCUGAGAACAAGAAUCAGGAAAAUGUUAGAGGAGCACAAGGAGCCGUCACCUCUCAUUACCGCCGAGGACGUACAAGAAGCUAAGUGCGCAGCCGAUGAGGCUAAGGAGGUGCGUGAAGCCGAGGAGUUGCGCGCAGCUCUACCACCUUUGGCAGCUGAUGUUGAGGAGCCCACUCUGGAAGCCGAUGUCGACUUGAUGUUACAAGAGGCUGGGGCCGGCUCAGUGGAGACACCUCGUGGCUUGAUAAAGGUUACCAGCUACGAUGGCGAGGACAAGAUCGGCUCUUACGCUGUGCUUUCUCCGCAGGCUGUACUCAAGAGUGAAAAAUUAUCUUGCAUCCACCCUCUCGCUGAACAAGUCAUAGUGAUAACACACUCUGGCCGAAAAGGGCGUUAUGCCGUGGAACCAUACCAUGGUAAAGUAGUGGUGCCAGAGGGACAUGCAAUACCCGUCCAGGACUUUCAAGCUCUGAGUGAAAGUGCCACCAUUGUGUACAACGAACGUGAGUUCGUAAACAGGUACCUGCACCAUAUUGCCACACAUGGAGGAGCGCUGAACACUGAUGAAGAAUAUUACAAAACUGUCAAGCCCAGCGAGCACGACGGCGAAUACCUGUACGACAUCGACAGGAAACAGUGCGUCAAGAAAGAACUAGUCACUGGGCUAGGGCUCACAGGCGAGCUGGUGGAUCCUCCCUUCCAUGAAUUCGCCUACGAGAGUCUGAGAACACGACCAGCCGCUCCUUACCAAGUACCAACCAUAGGGGUGUAUGGCGUGCCAGGAUCAGGCAAGUCUGGCAUCAUUAAAAGCGCAGUCACCAAAAAAGAUCUAGUGGUGAGCGCCAAGAAAGAAAACUGUGCAGAAAUUAUAAGGGACGUCAAGAAAAUGAAAGGGCUGGACGUCAAUGCCAGAACUGUGGACUCAGUGCUCUUGAAUGGAUGCAAACACCCCGUAGAGACCCUGUAUAUUGACGAAGCUUUUGCUUGUCAUGCAGGUACUCUCAGAGCGCUCAUAGCCAUUAUAAGACCUAAAAAGGCAGUGCUCUGCGGGGAUCCCAAACAGUGCGGUUUUUUUAACAUGAUGUGCCUGAAAGUGCAUUUUAACCACGAGAUUUGCACACAAGUCUUCCACAAAAGCAUCUCUCGCCGUUGCACUAAAUCUGUGACUUCGGUCGUCUCAACCUUGUUUUACGACAAAAAAAUGAGAACGACGAAUCCGAAAGAGACUAAGAUUGUGAUUGACACUACCGGCAGUACCAAACCUAAGCAGGACGAUCUCAUUCUCACUUGUUUCAGAGGGUGGGUGAAGCAGUUGCAAAUAGAUUACAAAGGCAACGAAAUAAUGACGGCAGCUGCCUCUCAAGGGCUGACCCGUAAAGGUGUGUAUGCCGUUCGGUACAAGGUGAAUGAAAAUCCUCUGUACGCACCCACCUCAGAACAUGUGAACGUCCUACUGACCCGCACGGAGGACCGCAUCGUGUGGAAAACACUAGCCGGCGACCCAUGGAUAAAAACACUGACUGCCAAGUACCCUGGGAAUUUCACUGCCACGAUAGAGGAGUGGCAAGCAGAGCAUGAUGCCAUCAUGAGGCACAUCUUGGAGAGACCGGACCCUACCGACGUCUUCCAGAAUAAGGCAAACGUGUGUUGGGCCAAGGCUUUAGUGCCGGUGCUGAAGACCGCUGGCAUAGACAUGACCACUGAACAAUGGAACACUGUGGAUUAUUUUGAAACGGACAAAGCUCACUCAGCAGAGAUAGUAUUGAACCAACUAUGCGUGAGGUUCUUUGGACUCGAUCUGGACUCCGGUCUAUUUUCUGCACCCACUGUUCCGUUAUCCAUUAGGAAUAAUCACUGGGAUAACUCCCCGUCGCCUAACAUGUACGGGCUGAAUAAAGAAGUGGUCCGUCAGCUCUCUCGCAGGUACCCACAACUGCCUCGGGCAGUUGCCACUGGAAGAGUCUAUGACAUGAACACUGGUACACUGCGCAAUUAUGAUCCGCGCAUAAACCUAGUACCUGUAAACAGAAGACUGCCUCAUGCUUUAGUCCUCCACCAUAAUGAACACCCACAGAGUGACUUUUCUUCAUUCGUCAGCAAAUUGAAGGGCAGAACUGUCCUGGUGGUCGGGGAAAAGUUGUCCGUCCCAGGCAAAAUGGUUGACUGGUUGUCAGACCGGCCUGAGGCUACCUUCAGAGCUCGGCUGGAUUUAGGCAUCCCAGGUGAUGUGCCCAAAUAUGACAUAAUAUUUGUUAAUGUGAGGACCCCAUAUAAAUACCAUCACUAUCAGCAGUGUGAAGACCAUGCCAUUAAGCUUAGCAUGUUGACCAAGAAAGCUUGUCUGCAUCUGAAUCCCGGCGGAACCUGUGUCAGCAUAGGUUAUGGUUACGCUGACAGGGCCAGCGAAAGCAUCAUUGGUGCUAUAGCGCGGCAGUUCAAGUUUUCCCGGGUAUGCAAACCGAAAUCCUCACUUGAAGAGACGGAAGUUCUGUUUGUAUUCAUUGGGUACGAUCGCAAGGCCCGUACGCACAAUUCUUACAAGCUUUCAUCAACCUUGACCAACAUUUAUACAGGUUCCAGACUCCACGAAGCCGGAUGUGCACCCUCAUAUCAUGUGGUGCGAGGGGAUAUUGCCACGGCCACCGAAGGAGUGAUUAUAAAUGCUGCUAACAGCAAAGGACAACCUGGCGGAGGGGUGUGCGGAGCGCUGUAUAAGAAAUUCCCGGAAAGCUUCGAUUUACAGCCGAUCGAAGUAGGAAAAGCGCGACUGGUCAAAGGUGCAGCUAAACAUAUCAUUCAUGCCGUAGGACCAAACUUCAACAAAGUUUCGGAGGUUGAAGGUGACAAACAGUUGGCAGAGGCUUAUGAGUCCAUCGCUAAGAUUGUCAACGAUAACAAUUACAAGUCAGUAGCGAUUCCACUGUUGUCCACCGGCAUCUUUUCCGGGAACAAAGAUCGACUAACCCAAUCAUUGAACCAUUUGCUGACAGCUUUAGACACCACUGAUGCAGAUGUAGCCAUAUACUGCAGGGACAAGAAAUGGGAAAUGACUCUCAAGGAAGCAGUGGCUAGGAGAGAAGCAGUGGAGGAGAUAUGCAUAUCCGACGACUCUUCAGUGACAGAACCUGAUGCAGAGCUGGUGAGGGUGCAUCCGAAGAGUUCUUUGGCUGGAAGGAAGGGCUACAGCACAAGCGAUGGCAAAACUUUCUCAUAUUUGGAAGGGACCAAGUUUCACCAGGCGGCCAAGGAUAUAGCAGAAAUUAAUGCCAUGUGGCCCGUUGCAACGGAGGCCAAUGAGCAGGUAUGCAUGUAUAUCCUCGGAGAAAGCAUGAGCAGUAUUAGGUCGAAAUGCCCCGUCGAAGAGUCGGAAGCCUCCACACCACCUAGCACGCUGCCUUGCUUGUGCAUCCAUGCCAUGACUCCAGAAAGAGUACAGCGCCUAAAAGCCUCACGUCCAGAACAAAUUACUGUGUGCUCAUCCUUUCCAUUGCCGAAGUAUAGAAUCACUGGUGUGCAGAAGAUCCAAUGCUCCCAGCCUAUAUUGUUCUCACCGAAAGUGCCUGCGUAUAUUCAUCCAAGGAAGUAUCUCGUGGAAACACCACCGGUAGACGAGACUCCGGAGCCAUCGGCAGAGAACCAAUCCACAGAGGGGACACCUGAACAACCACCACUUAUAACCGAGGAUGAGACCAGGACUAGAACGCCUGAGCCGAUCAUCAUCGAAGAGGAAGAAGAGGAUAGCAUAAGUUUGCUGUCAGAUGGCCCGACCCACCAGGUGCUGCAAGUCGAGGCAGACAUUCACGGGCCGCCCUCUGUAUCUAGCUCAUCCUGGUCCAUUCCUCAUGCAUCCGACUUUGAUGUGGACAGUUUAUCCAUACUUGACACCCUGGAGGGAGCUAGCGUGACCAGCGGGGCAACGUCAGCCGAGACUAACUCUUACUUCGCAAAGAGUAUGGAGUUUCUGGCGCGACCGGUGCCUGCGCCUCGAACAGUAUUCAGGAACCCUCCACAUCCCGCUCCGCGCACAAGAACACCGUCACUUGCACCCAGCAGGGCCUGCUCGAGAACCAGCCUAGUUUCCACCCCGCCAGGCGUGAAUAGGGUGAUCACUAGAGAGGAGCUCGAGGCGCUUACCCCGUCACGCACUCCUAGCAGGUCGGUCUCGAGAACCAGCCUGGUCUCCAACCCGCCAGGCGUAAAUAGGGUGAUUACAAGAGAGGAGUUUGAGGCGUUCGUAGCACAACAACAAUGACGGUUUGAUGCGGGUGCAUACAUCUUUUCCUCCGACACCGGUCAAGGGCAUUUACAACAAAAAUCAGUAAGGCAAACGGUGCUAUCCGAAGUGGUGUUGGAGAGGACCGAAUUGGAGAUUUCGUAUGCCCCGCGCCUCGACCAAGAAAAAGAAGAAUUACUACGCAAGAAAUUACAGUUAAAUCCCACACCUGCUAACAGAAGCAGAUACCAGUCCAGGAAGGUGGAGAACAUGAAAGCCAUAACAGCUAGACGUAUUCUGCAAGGCCUAGGGCAUUAUUUGAAGGCAGAAGGAAAAGUGGAGUGCUACCGAACCCUGCAUCCUGUUCCUUUGUAUUCAUCUAGUGUGAACCGUGCCUUUUCAAGCCCCAAGGUCGCAGUGGAAGCCUGUAACGCCAUGUUGAAAGAGAACUUUCCGACUGUGGCUUCUUACUGUAUUAUUCCAGAGUACGAUGCCUAUUUGGACAUGGUUGACGGAGCUUCAUGCUGCUUAGACACUGCCAGUUUUUGCCCUGCAAAGCUGCGCAGCUUUCCAAAGAAACACUCCUAUUUGGAACCCACAAUACGAUCGGCAGUGCCUUCAGCGAUCCAGAACACGCUCCAGAACGUCCUGGCAGCUGCCACAAAAAGAAAUUGCAAUGUCACGCAAAUGAGAGAAUUGCCCGUAUUGGAUUCGGCGGCCUUUAAUGUGGAAUGCUUCAAGAAAUAUGCGUGUAAUAAUGAAUAUUGGGAAACGUUUAAAGAAAACCCCAUCAGGCUUACUGAAGAAAACGUGGUAAAUUACAUUACCAAAUUAAAAGGACCAAAAGCUGCUGCUCUUUUUGCGAAGACACAUAAUUUGAAUAUGUUGCAGGACAUACCAAUGGACAGGUUUGUAAUGGACUUAAAGAGAGACGUGAAAGUGACUCCAGGAACAAAACAUACUGAAGAACGGCCCAAGGUACAGGUGAUCCAGGCUGCCGAUCCGCUAGCAACAGCGUAUCUGUGCGGAAUCCACCGAGAGCUGGUUAGGAGAUUAAAUGCGGUCCUGCUUCCGAACAUUCAUACACUGUUUGAUAUGUCGGCUGAAGACUUUGACGCUAUUAUAGCCGAGCACUUCCAGCCUGGGGAUUGUGUUCUGGAAACUGACAUCGCGUCGUUUGAUAAAAGUGAGGACGACGCCAUGGCUCUGACCGCGUUAAUGAUUCUGGAAGACUUAGGUGUGGACGCAGAGCUGUUGACGCUGAUUGAGGCGGCUUUCGGCGAAAUUUCAUCAAUACAUUUGCCCACUAAAACUAAAUUUAAAUUCGGAGCCAUGAUGAAAUCUGGAAUGUUCCUCACACUGUUUGUGAACACAGUCAUUAACAUUGUAAUCGCAAGCAGAGUGUUGAGAGAACGGCUAACCGGAUCACCAUGUGCAGCAUUCAUUGGAGAUGACAAUAUCGUGAAAGGAGUCAAAUCGGACAAAUUAAUGGCAGACAGGUGCGCCACCUGGUUGAAUAUGGAAGUCAAGAUUAUAGAUGCUGUGGUGGGCGAGAAAGCGCCUUAUUUCUGUGGAGGGUUUAUUUUGUGUGACUCCGUGACCGGCACAGCGUGCCGUGUGGCAGACCCCCUAAAAAGGCUGUUUAAGCUUGGCAAACCUCUGGCAGCAGACGAUGAACAUGAUGAUGACAGGAGAAGGGCAUUGCAUGAAGAGUCAACACGCUGGAACCGAGUGGGUAUUCUUUCAGAGCUGUGCAAGGCAGUAGAAUCAAGGUAUGAAACCGUAGGAACUUCCAUCAUAGUUAUGGCCAUGACUACUCUAGCUAGCAGUGUUAAAUCAUUCAGCUACCUGAGAGGGGCCCCUAUAACUCUCUACGGCUAACCUGAAUGGACUACGACAUAGUCUAGUCCGCCAAGUCUAGCAUAUGGCCACC [서열번호 92]----------------GOI---------------------CGGAGACGGCGCAGAAGAAGAGGAUCUGGCGAAGGCAGAGGCAGCCUGCUUACAUGUGGCGACGUGGAAGAGAACCCCGGACCUAUGCACCAGAAACGGACCGCCAUGUUCCAGGAUCCUCAAGAGAGGCCCAGAAAGCUGCCUCAGCUGUGUACCGAGCUGCAGACCACCAUCCACGACAUCAUCCUGGAAUGCGUGUACUGCAAGCAGCAGCUCCUGCGGAGAGAGGUGUACGAUUUCGCCUUCCGGGACCUGUGCAUCGUGUACAGAGAUGGCAACCCCUACGCCGUGUGCGACAAGUGCCUGAAGUUCUACAGCAAGAUCAGCGAGUACCGGCACUACUGCUACAGCCUGUACGGCACCACACUGGAACAGCAGUACAACAAGCCCCUGUGCGACCUGCUGAUCCGGUGCAUCAACUGCCAGAAACCUCUGUGCCCCGAGGAAAAGCAGCGGCACCUGGACAAGAAGCAGCGGUUCCACAACAUCAGAGGCCGGUGGACCGGCAGAUGCAUGAGCUGUUGUCGGAGCAGCAGAACCAGACGGGAAACCCAGCUGUGAGCGGCCGCGAAUUGGCAAGCUGCUUACAUAGAACUCGCGGCGAUUGGCAUGCCGCCUUAAAAUUUUUAUUUUAUUUUUCUUUUCUUUUCCGAAUCGGAUUUUGUUUUUAAUAUUUCAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA [서열번호 457]
따라서, 바람직하게는 상기 RNA 구조체는 실질적으로 서열번호 92, GOI, 및 서열번호 457, 또는 그의 단편 또는 변이체를 포함하거나 이로 이루어지는 상기에 나타낸 것과 같은 뉴클레오티드 서열을 포함한다.
본 발명의 제2 측면에서, 제1 측면의 RNA 구조체를 암호화하는 핵산 서열이 제공된다.
한 구현예에서, 상기 핵산 서열은 GOI - 푸린 T2A - HCV E6을 암호화할 수 있다(이것은 본 명세서에서 인용된 첫번째 바이러스 IIP이지만, 본 명세서에 개시된 임의의 IIP 또는 링커가 사용될 수 있음이 인식될 것이다). 따라서, 상기 핵산 서열은 서열번호 93, GOI, 및 서열번호 458을 포함하거나 이로 이루어질 수 있다. 서열번호 93 및 서열번호 458은 다음과 같다:
ATGGGCGGCGCATGAGAGAAGCCCAGACCAATTACCTACCCAAAATGGAGAAAGTTCACGTTGACATCGAGGAAGACAGCCCATTCCTCAGAGCTTTGCAGCGGAGCTTCCCGCAGTTTGAGGTAGAAGCCAAGCAGGTCACTGATAATGACCATGCTAATGCCAGAGCGTTTTCGCATCTGGCTTCAAAACTGATCGAAACGGAGGTGGACCCATCCGACACGATCCTTGACATTGGAAGTGCGCCCGCCCGCAGAATGTATTCTAAGCACAAGTATCATTGTATCTGTCCGATGAGATGTGCGGAAGATCCGGACAGATTGTATAAGTATGCAACTAAGCTGAAGAAAAACTGTAAGGAAATAACTGATAAGGAATTGGACAAGAAAATGAAGGAGCTGGCCGCCGTCATGAGCGACCCTGACCTGGAAACTGAGACTATGTGCCTCCACGACGACGAGTCGTGTCGCTACGAAGGGCAAGTCGCTGTTTACCAGGATGTATACGCGGTTGACGGACCGACAAGTCTCTATCACCAAGCCAATAAGGGAGTTAGAGTCGCCTACTGGATAGGCTTTGACACCACCCCTTTTATGTTTAAGAACTTGGCTGGAGCATATCCATCATACTCTACCAACTGGGCCGACGAAACCGTGTTAACGGCTCGTAACATAGGCCTATGCAGCTCTGACGTTATGGAGCGGTCACGTAGAGGGATGTCCATTCTTAGAAAGAAGTATTTGAAACCATCCAACAATGTTCTATTCTCTGTTGGCTCGACCATCTACCACGAGAAGAGGGACTTACTGAGGAGCTGGCACCTGCCGTCTGTATTTCACTTACGTGGCAAGCAAAATTACACATGTCGGTGTGAGACTATAGTTAGTTGCGACGGGTACGTCGTTAAAAGAATAGCTATCAGTCCAGGCCTGTATGGGAAGCCTTCAGGCTATGCTGCTACGATGCACCGCGAGGGATTCTTGTGCTGCAAAGTGACAGACACATTGAACGGGGAGAGGGTCTCTTTTCCCGTGTGCACGTATGTGCCAGCTACATTGTGTGACCAAATGACTGGCATACTGGCAACAGATGTCAGTGCGGACGACGCGCAAAAACTGCTGGTTGGGCTCAACCAGCGTATAGTCGTCAACGGTCGCACCCAGAGAAACACCAATACCATGAAAAATTACCTTTTGCCCGTAGTGGCCCAGGCATTTGCTAGGTGGGCAAAGGAATATAAGGAAGATCAAGAAGATGAAAGGCCACTAGGACTACGAGATAGACAGTTAGTCATGGGGTGTTGTTGGGCTTTTAGAAGGCACAAGATAACATCTATTTATAAGCGCCCGGATACCCAAACCATCATCAAAGTGAACAGCGATTTCCACTCATTCGTGCTGCCCAGGATAGGCAGTAACACATTGGAGATCGGGCTGAGAACAAGAATCAGGAAAATGTTAGAGGAGCACAAGGAGCCGTCACCTCTCATTACCGCCGAGGACGTACAAGAAGCTAAGTGCGCAGCCGATGAGGCTAAGGAGGTGCGTGAAGCCGAGGAGTTGCGCGCAGCTCTACCACCTTTGGCAGCTGATGTTGAGGAGCCCACTCTGGAAGCCGATGTCGACTTGATGTTACAAGAGGCTGGGGCCGGCTCAGTGGAGACACCTCGTGGCTTGATAAAGGTTACCAGCTACGATGGCGAGGACAAGATCGGCTCTTACGCTGTGCTTTCTCCGCAGGCTGTACTCAAGAGTGAAAAATTATCTTGCATCCACCCTCTCGCTGAACAAGTCATAGTGATAACACACTCTGGCCGAAAAGGGCGTTATGCCGTGGAACCATACCATGGTAAAGTAGTGGTGCCAGAGGGACATGCAATACCCGTCCAGGACTTTCAAGCTCTGAGTGAAAGTGCCACCATTGTGTACAACGAACGTGAGTTCGTAAACAGGTACCTGCACCATATTGCCACACATGGAGGAGCGCTGAACACTGATGAAGAATATTACAAAACTGTCAAGCCCAGCGAGCACGACGGCGAATACCTGTACGACATCGACAGGAAACAGTGCGTCAAGAAAGAACTAGTCACTGGGCTAGGGCTCACAGGCGAGCTGGTGGATCCTCCCTTCCATGAATTCGCCTACGAGAGTCTGAGAACACGACCAGCCGCTCCTTACCAAGTACCAACCATAGGGGTGTATGGCGTGCCAGGATCAGGCAAGTCTGGCATCATTAAAAGCGCAGTCACCAAAAAAGATCTAGTGGTGAGCGCCAAGAAAGAAAACTGTGCAGAAATTATAAGGGACGTCAAGAAAATGAAAGGGCTGGACGTCAATGCCAGAACTGTGGACTCAGTGCTCTTGAATGGATGCAAACACCCCGTAGAGACCCTGTATATTGACGAAGCTTTTGCTTGTCATGCAGGTACTCTCAGAGCGCTCATAGCCATTATAAGACCTAAAAAGGCAGTGCTCTGCGGGGATCCCAAACAGTGCGGTTTTTTTAACATGATGTGCCTGAAAGTGCATTTTAACCACGAGATTTGCACACAAGTCTTCCACAAAAGCATCTCTCGCCGTTGCACTAAATCTGTGACTTCGGTCGTCTCAACCTTGTTTTACGACAAAAAAATGAGAACGACGAATCCGAAAGAGACTAAGATTGTGATTGACACTACCGGCAGTACCAAACCTAAGCAGGACGATCTCATTCTCACTTGTTTCAGAGGGTGGGTGAAGCAGTTGCAAATAGATTACAAAGGCAACGAAATAATGACGGCAGCTGCCTCTCAAGGGCTGACCCGTAAAGGTGTGTATGCCGTTCGGTACAAGGTGAATGAAAATCCTCTGTACGCACCCACCTCAGAACATGTGAACGTCCTACTGACCCGCACGGAGGACCGCATCGTGTGGAAAACACTAGCCGGCGACCCATGGATAAAAACACTGACTGCCAAGTACCCTGGGAATTTCACTGCCACGATAGAGGAGTGGCAAGCAGAGCATGATGCCATCATGAGGCACATCTTGGAGAGACCGGACCCTACCGACGTCTTCCAGAATAAGGCAAACGTGTGTTGGGCCAAGGCTTTAGTGCCGGTGCTGAAGACCGCTGGCATAGACATGACCACTGAACAATGGAACACTGTGGATTATTTTGAAACGGACAAAGCTCACTCAGCAGAGATAGTATTGAACCAACTATGCGTGAGGTTCTTTGGACTCGATCTGGACTCCGGTCTATTTTCTGCACCCACTGTTCCGTTATCCATTAGGAATAATCACTGGGATAACTCCCCGTCGCCTAACATGTACGGGCTGAATAAAGAAGTGGTCCGTCAGCTCTCTCGCAGGTACCCACAACTGCCTCGGGCAGTTGCCACTGGAAGAGTCTATGACATGAACACTGGTACACTGCGCAATTATGATCCGCGCATAAACCTAGTACCTGTAAACAGAAGACTGCCTCATGCTTTAGTCCTCCACCATAATGAACACCCACAGAGTGACTTTTCTTCATTCGTCAGCAAATTGAAGGGCAGAACTGTCCTGGTGGTCGGGGAAAAGTTGTCCGTCCCAGGCAAAATGGTTGACTGGTTGTCAGACCGGCCTGAGGCTACCTTCAGAGCTCGGCTGGATTTAGGCATCCCAGGTGATGTGCCCAAATATGACATAATATTTGTTAATGTGAGGACCCCATATAAATACCATCACTATCAGCAGTGTGAAGACCATGCCATTAAGCTTAGCATGTTGACCAAGAAAGCTTGTCTGCATCTGAATCCCGGCGGAACCTGTGTCAGCATAGGTTATGGTTACGCTGACAGGGCCAGCGAAAGCATCATTGGTGCTATAGCGCGGCAGTTCAAGTTTTCCCGGGTATGCAAACCGAAATCCTCACTTGAAGAGACGGAAGTTCTGTTTGTATTCATTGGGTACGATCGCAAGGCCCGTACGCACAATTCTTACAAGCTTTCATCAACCTTGACCAACATTTATACAGGTTCCAGACTCCACGAAGCCGGATGTGCACCCTCATATCATGTGGTGCGAGGGGATATTGCCACGGCCACCGAAGGAGTGATTATAAATGCTGCTAACAGCAAAGGACAACCTGGCGGAGGGGTGTGCGGAGCGCTGTATAAGAAATTCCCGGAAAGCTTCGATTTACAGCCGATCGAAGTAGGAAAAGCGCGACTGGTCAAAGGTGCAGCTAAACATATCATTCATGCCGTAGGACCAAACTTCAACAAAGTTTCGGAGGTTGAAGGTGACAAACAGTTGGCAGAGGCTTATGAGTCCATCGCTAAGATTGTCAACGATAACAATTACAAGTCAGTAGCGATTCCACTGTTGTCCACCGGCATCTTTTCCGGGAACAAAGATCGACTAACCCAATCATTGAACCATTTGCTGACAGCTTTAGACACCACTGATGCAGATGTAGCCATATACTGCAGGGACAAGAAATGGGAAATGACTCTCAAGGAAGCAGTGGCTAGGAGAGAAGCAGTGGAGGAGATATGCATATCCGACGACTCTTCAGTGACAGAACCTGATGCAGAGCTGGTGAGGGTGCATCCGAAGAGTTCTTTGGCTGGAAGGAAGGGCTACAGCACAAGCGATGGCAAAACTTTCTCATATTTGGAAGGGACCAAGTTTCACCAGGCGGCCAAGGATATAGCAGAAATTAATGCCATGTGGCCCGTTGCAACGGAGGCCAATGAGCAGGTATGCATGTATATCCTCGGAGAAAGCATGAGCAGTATTAGGTCGAAATGCCCCGTCGAAGAGTCGGAAGCCTCCACACCACCTAGCACGCTGCCTTGCTTGTGCATCCATGCCATGACTCCAGAAAGAGTACAGCGCCTAAAAGCCTCACGTCCAGAACAAATTACTGTGTGCTCATCCTTTCCATTGCCGAAGTATAGAATCACTGGTGTGCAGAAGATCCAATGCTCCCAGCCTATATTGTTCTCACCGAAAGTGCCTGCGTATATTCATCCAAGGAAGTATCTCGTGGAAACACCACCGGTAGACGAGACTCCGGAGCCATCGGCAGAGAACCAATCCACAGAGGGGACACCTGAACAACCACCACTTATAACCGAGGATGAGACCAGGACTAGAACGCCTGAGCCGATCATCATCGAAGAGGAAGAAGAGGATAGCATAAGTTTGCTGTCAGATGGCCCGACCCACCAGGTGCTGCAAGTCGAGGCAGACATTCACGGGCCGCCCTCTGTATCTAGCTCATCCTGGTCCATTCCTCATGCATCCGACTTTGATGTGGACAGTTTATCCATACTTGACACCCTGGAGGGAGCTAGCGTGACCAGCGGGGCAACGTCAGCCGAGACTAACTCTTACTTCGCAAAGAGTATGGAGTTTCTGGCGCGACCGGTGCCTGCGCCTCGAACAGTATTCAGGAACCCTCCACATCCCGCTCCGCGCACAAGAACACCGTCACTTGCACCCAGCAGGGCCTGCTCGAGAACCAGCCTAGTTTCCACCCCGCCAGGCGTGAATAGGGTGATCACTAGAGAGGAGCTCGAGGCGCTTACCCCGTCACGCACTCCTAGCAGGTCGGTCTCGAGAACCAGCCTGGTCTCCAACCCGCCAGGCGTAAATAGGGTGATTACAAGAGAGGAGTTTGAGGCGTTCGTAGCACAACAACAATGACGGTTTGATGCGGGTGCATACATCTTTTCCTCCGACACCGGTCAAGGGCATTTACAACAAAAATCAGTAAGGCAAACGGTGCTATCCGAAGTGGTGTTGGAGAGGACCGAATTGGAGATTTCGTATGCCCCGCGCCTCGACCAAGAAAAAGAAGAATTACTACGCAAGAAATTACAGTTAAATCCCACACCTGCTAACAGAAGCAGATACCAGTCCAGGAAGGTGGAGAACATGAAAGCCATAACAGCTAGACGTATTCTGCAAGGCCTAGGGCATTATTTGAAGGCAGAAGGAAAAGTGGAGTGCTACCGAACCCTGCATCCTGTTCCTTTGTATTCATCTAGTGTGAACCGTGCCTTTTCAAGCCCCAAGGTCGCAGTGGAAGCCTGTAACGCCATGTTGAAAGAGAACTTTCCGACTGTGGCTTCTTACTGTATTATTCCAGAGTACGATGCCTATTTGGACATGGTTGACGGAGCTTCATGCTGCTTAGACACTGCCAGTTTTTGCCCTGCAAAGCTGCGCAGCTTTCCAAAGAAACACTCCTATTTGGAACCCACAATACGATCGGCAGTGCCTTCAGCGATCCAGAACACGCTCCAGAACGTCCTGGCAGCTGCCACAAAAAGAAATTGCAATGTCACGCAAATGAGAGAATTGCCCGTATTGGATTCGGCGGCCTTTAATGTGGAATGCTTCAAGAAATATGCGTGTAATAATGAATATTGGGAAACGTTTAAAGAAAACCCCATCAGGCTTACTGAAGAAAACGTGGTAAATTACATTACCAAATTAAAAGGACCAAAAGCTGCTGCTCTTTTTGCGAAGACACATAATTTGAATATGTTGCAGGACATACCAATGGACAGGTTTGTAATGGACTTAAAGAGAGACGTGAAAGTGACTCCAGGAACAAAACATACTGAAGAACGGCCCAAGGTACAGGTGATCCAGGCTGCCGATCCGCTAGCAACAGCGTATCTGTGCGGAATCCACCGAGAGCTGGTTAGGAGATTAAATGCGGTCCTGCTTCCGAACATTCATACACTGTTTGATATGTCGGCTGAAGACTTTGACGCTATTATAGCCGAGCACTTCCAGCCTGGGGATTGTGTTCTGGAAACTGACATCGCGTCGTTTGATAAAAGTGAGGACGACGCCATGGCTCTGACCGCGTTAATGATTCTGGAAGACTTAGGTGTGGACGCAGAGCTGTTGACGCTGATTGAGGCGGCTTTCGGCGAAATTTCATCAATACATTTGCCCACTAAAACTAAATTTAAATTCGGAGCCATGATGAAATCTGGAATGTTCCTCACACTGTTTGTGAACACAGTCATTAACATTGTAATCGCAAGCAGAGTGTTGAGAGAACGGCTAACCGGATCACCATGTGCAGCATTCATTGGAGATGACAATATCGTGAAAGGAGTCAAATCGGACAAATTAATGGCAGACAGGTGCGCCACCTGGTTGAATATGGAAGTCAAGATTATAGATGCTGTGGTGGGCGAGAAAGCGCCTTATTTCTGTGGAGGGTTTATTTTGTGTGACTCCGTGACCGGCACAGCGTGCCGTGTGGCAGACCCCCTAAAAAGGCTGTTTAAGCTTGGCAAACCTCTGGCAGCAGACGATGAACATGATGATGACAGGAGAAGGGCATTGCATGAAGAGTCAACACGCTGGAACCGAGTGGGTATTCTTTCAGAGCTGTGCAAGGCAGTAGAATCAAGGTATGAAACCGTAGGAACTTCCATCATAGTTATGGCCATGACTACTCTAGCTAGCAGTGTTAAATCATTCAGCTACCTGAGAGGGGCCCCTATAACTCTCTACGGCTAACCTGAATGGACTACGACATAGTCTAGTCCGCCAAGTCTAGCATATGGCCACC [서열번호 93]----------------GOI---------------------CGGAGACGGCGCAGAAGAAGAGGATCTGGCGAAGGCAGAGGCAGCCTGCTTACATGTGGCGACGTGGAAGAGAACCCCGGACCTATGCACCAGAAACGGACCGCCATGTTCCAGGATCCTCAAGAGAGGCCCAGAAAGCTGCCTCAGCTGTGTACCGAGCTGCAGACCACCATCCACGACATCATCCTGGAATGCGTGTACTGCAAGCAGCAGCTCCTGCGGAGAGAGGTGTACGATTTCGCCTTCCGGGACCTGTGCATCGTGTACAGAGATGGCAACCCCTACGCCGTGTGCGACAAGTGCCTGAAGTTCTACAGCAAGATCAGCGAGTACCGGCACTACTGCTACAGCCTGTACGGCACCACACTGGAACAGCAGTACAACAAGCCCCTGTGCGACCTGCTGATCCGGTGCATCAACTGCCAGAAACCTCTGTGCCCCGAGGAAAAGCAGCGGCACCTGGACAAGAAGCAGCGGTTCCACAACATCAGAGGCCGGTGGACCGGCAGATGCATGAGCTGTTGTCGGAGCAGCAGAACCAGACGGGAAACCCAGCTGTGAGCGGCCGCGAATTGGCAAGCTGCTTACATAGAACTCGCGGCGATTGGCATGCCGCCTTAAAATTTTTATTTTATTTTTCTTTTCTTTTCCGAATCGGATTTTGTTTTTAATATTTCAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA [서열번호 458]
따라서, 바람직하게는 상기 핵산 서열은 실질적으로 서열번호 93을 포함하거나 이로 이루어지는 상기 나타낸 것과 같은 뉴클레오티드 서열, GOI, 및 서열번호 458, 또는 그의 단편 또는 변이체를 포함한다.
제3 측면에서, 제2 측면에 따른 핵산 서열을 포함하는 발현 카세트(cassette)가 제공된다.
본 발명의 핵산 서열은 바람직하게는 재조합 벡터, 예를 들면 상기 RNA 구조체를 생산할 수 있도록 관심있는 숙주 세포 내로 운반하기 위한 재조합 벡터 내에 포함된다.
본 발명의 핵산 서열은 바람직하게는 재조합 벡터, 예를 들면 상기 RNA 구조체를 생산할 수 있도록 관심있는 숙주 세포 내로 운반하기 위한 재조합 벡터 내에 포함된다.
따라서, 제4 측면에서, 제3 측면에 따른 발현 카세트를 포함하는 재조합 벡터가 제공된다.
한 구현예에서, 상기 벡터는 GOI - 푸린 T2A - HCV E6를 갖고 있는 saRNA 플라스미드 구조체를 암호화하거나 이를 포함하는 DNA 서열을 포함할 수 있다(이것은 본 명세서에서 인용된 첫번째 바이러스 IIP이지만, 본 명세서에 개시된 임의의 IIP 또는 링커가 사용될 수 있음이 인식될 것이다). 따라서, 상기 벡터는 단일 벡터 내에 서열번호 94의 핵산 서열, GOI, 및 서열번호 459의 핵산 서열을 포함할 수 있다. 서열번호 94 및 서열번호 459는 다음과 같으며, 여기서 "GOI"는 치료 생체분자를 암호화하는 서열의 위치를 나타낸다:
TAATACGACTCACTATAGATGGGCGGCGCATGAGAGAAGCCCAGACCAATTACCTACCCAAAATGGAGAAAGTTCACGTTGACATCGAGGAAGACAGCCCATTCCTCAGAGCTTTGCAGCGGAGCTTCCCGCAGTTTGAGGTAGAAGCCAAGCAGGTCACTGATAATGACCATGCTAATGCCAGAGCGTTTTCGCATCTGGCTTCAAAACTGATCGAAACGGAGGTGGACCCATCCGACACGATCCTTGACATTGGAAGTGCGCCCGCCCGCAGAATGTATTCTAAGCACAAGTATCATTGTATCTGTCCGATGAGATGTGCGGAAGATCCGGACAGATTGTATAAGTATGCAACTAAGCTGAAGAAAAACTGTAAGGAAATAACTGATAAGGAATTGGACAAGAAAATGAAGGAGCTGGCCGCCGTCATGAGCGACCCTGACCTGGAAACTGAGACTATGTGCCTCCACGACGACGAGTCGTGTCGCTACGAAGGGCAAGTCGCTGTTTACCAGGATGTATACGCGGTTGACGGACCGACAAGTCTCTATCACCAAGCCAATAAGGGAGTTAGAGTCGCCTACTGGATAGGCTTTGACACCACCCCTTTTATGTTTAAGAACTTGGCTGGAGCATATCCATCATACTCTACCAACTGGGCCGACGAAACCGTGTTAACGGCTCGTAACATAGGCCTATGCAGCTCTGACGTTATGGAGCGGTCACGTAGAGGGATGTCCATTCTTAGAAAGAAGTATTTGAAACCATCCAACAATGTTCTATTCTCTGTTGGCTCGACCATCTACCACGAGAAGAGGGACTTACTGAGGAGCTGGCACCTGCCGTCTGTATTTCACTTACGTGGCAAGCAAAATTACACATGTCGGTGTGAGACTATAGTTAGTTGCGACGGGTACGTCGTTAAAAGAATAGCTATCAGTCCAGGCCTGTATGGGAAGCCTTCAGGCTATGCTGCTACGATGCACCGCGAGGGATTCTTGTGCTGCAAAGTGACAGACACATTGAACGGGGAGAGGGTCTCTTTTCCCGTGTGCACGTATGTGCCAGCTACATTGTGTGACCAAATGACTGGCATACTGGCAACAGATGTCAGTGCGGACGACGCGCAAAAACTGCTGGTTGGGCTCAACCAGCGTATAGTCGTCAACGGTCGCACCCAGAGAAACACCAATACCATGAAAAATTACCTTTTGCCCGTAGTGGCCCAGGCATTTGCTAGGTGGGCAAAGGAATATAAGGAAGATCAAGAAGATGAAAGGCCACTAGGACTACGAGATAGACAGTTAGTCATGGGGTGTTGTTGGGCTTTTAGAAGGCACAAGATAACATCTATTTATAAGCGCCCGGATACCCAAACCATCATCAAAGTGAACAGCGATTTCCACTCATTCGTGCTGCCCAGGATAGGCAGTAACACATTGGAGATCGGGCTGAGAACAAGAATCAGGAAAATGTTAGAGGAGCACAAGGAGCCGTCACCTCTCATTACCGCCGAGGACGTACAAGAAGCTAAGTGCGCAGCCGATGAGGCTAAGGAGGTGCGTGAAGCCGAGGAGTTGCGCGCAGCTCTACCACCTTTGGCAGCTGATGTTGAGGAGCCCACTCTGGAAGCCGATGTCGACTTGATGTTACAAGAGGCTGGGGCCGGCTCAGTGGAGACACCTCGTGGCTTGATAAAGGTTACCAGCTACGATGGCGAGGACAAGATCGGCTCTTACGCTGTGCTTTCTCCGCAGGCTGTACTCAAGAGTGAAAAATTATCTTGCATCCACCCTCTCGCTGAACAAGTCATAGTGATAACACACTCTGGCCGAAAAGGGCGTTATGCCGTGGAACCATACCATGGTAAAGTAGTGGTGCCAGAGGGACATGCAATACCCGTCCAGGACTTTCAAGCTCTGAGTGAAAGTGCCACCATTGTGTACAACGAACGTGAGTTCGTAAACAGGTACCTGCACCATATTGCCACACATGGAGGAGCGCTGAACACTGATGAAGAATATTACAAAACTGTCAAGCCCAGCGAGCACGACGGCGAATACCTGTACGACATCGACAGGAAACAGTGCGTCAAGAAAGAACTAGTCACTGGGCTAGGGCTCACAGGCGAGCTGGTGGATCCTCCCTTCCATGAATTCGCCTACGAGAGTCTGAGAACACGACCAGCCGCTCCTTACCAAGTACCAACCATAGGGGTGTATGGCGTGCCAGGATCAGGCAAGTCTGGCATCATTAAAAGCGCAGTCACCAAAAAAGATCTAGTGGTGAGCGCCAAGAAAGAAAACTGTGCAGAAATTATAAGGGACGTCAAGAAAATGAAAGGGCTGGACGTCAATGCCAGAACTGTGGACTCAGTGCTCTTGAATGGATGCAAACACCCCGTAGAGACCCTGTATATTGACGAAGCTTTTGCTTGTCATGCAGGTACTCTCAGAGCGCTCATAGCCATTATAAGACCTAAAAAGGCAGTGCTCTGCGGGGATCCCAAACAGTGCGGTTTTTTTAACATGATGTGCCTGAAAGTGCATTTTAACCACGAGATTTGCACACAAGTCTTCCACAAAAGCATCTCTCGCCGTTGCACTAAATCTGTGACTTCGGTCGTCTCAACCTTGTTTTACGACAAAAAAATGAGAACGACGAATCCGAAAGAGACTAAGATTGTGATTGACACTACCGGCAGTACCAAACCTAAGCAGGACGATCTCATTCTCACTTGTTTCAGAGGGTGGGTGAAGCAGTTGCAAATAGATTACAAAGGCAACGAAATAATGACGGCAGCTGCCTCTCAAGGGCTGACCCGTAAAGGTGTGTATGCCGTTCGGTACAAGGTGAATGAAAATCCTCTGTACGCACCCACCTCAGAACATGTGAACGTCCTACTGACCCGCACGGAGGACCGCATCGTGTGGAAAACACTAGCCGGCGACCCATGGATAAAAACACTGACTGCCAAGTACCCTGGGAATTTCACTGCCACGATAGAGGAGTGGCAAGCAGAGCATGATGCCATCATGAGGCACATCTTGGAGAGACCGGACCCTACCGACGTCTTCCAGAATAAGGCAAACGTGTGTTGGGCCAAGGCTTTAGTGCCGGTGCTGAAGACCGCTGGCATAGACATGACCACTGAACAATGGAACACTGTGGATTATTTTGAAACGGACAAAGCTCACTCAGCAGAGATAGTATTGAACCAACTATGCGTGAGGTTCTTTGGACTCGATCTGGACTCCGGTCTATTTTCTGCACCCACTGTTCCGTTATCCATTAGGAATAATCACTGGGATAACTCCCCGTCGCCTAACATGTACGGGCTGAATAAAGAAGTGGTCCGTCAGCTCTCTCGCAGGTACCCACAACTGCCTCGGGCAGTTGCCACTGGAAGAGTCTATGACATGAACACTGGTACACTGCGCAATTATGATCCGCGCATAAACCTAGTACCTGTAAACAGAAGACTGCCTCATGCTTTAGTCCTCCACCATAATGAACACCCACAGAGTGACTTTTCTTCATTCGTCAGCAAATTGAAGGGCAGAACTGTCCTGGTGGTCGGGGAAAAGTTGTCCGTCCCAGGCAAAATGGTTGACTGGTTGTCAGACCGGCCTGAGGCTACCTTCAGAGCTCGGCTGGATTTAGGCATCCCAGGTGATGTGCCCAAATATGACATAATATTTGTTAATGTGAGGACCCCATATAAATACCATCACTATCAGCAGTGTGAAGACCATGCCATTAAGCTTAGCATGTTGACCAAGAAAGCTTGTCTGCATCTGAATCCCGGCGGAACCTGTGTCAGCATAGGTTATGGTTACGCTGACAGGGCCAGCGAAAGCATCATTGGTGCTATAGCGCGGCAGTTCAAGTTTTCCCGGGTATGCAAACCGAAATCCTCACTTGAAGAGACGGAAGTTCTGTTTGTATTCATTGGGTACGATCGCAAGGCCCGTACGCACAATTCTTACAAGCTTTCATCAACCTTGACCAACATTTATACAGGTTCCAGACTCCACGAAGCCGGATGTGCACCCTCATATCATGTGGTGCGAGGGGATATTGCCACGGCCACCGAAGGAGTGATTATAAATGCTGCTAACAGCAAAGGACAACCTGGCGGAGGGGTGTGCGGAGCGCTGTATAAGAAATTCCCGGAAAGCTTCGATTTACAGCCGATCGAAGTAGGAAAAGCGCGACTGGTCAAAGGTGCAGCTAAACATATCATTCATGCCGTAGGACCAAACTTCAACAAAGTTTCGGAGGTTGAAGGTGACAAACAGTTGGCAGAGGCTTATGAGTCCATCGCTAAGATTGTCAACGATAACAATTACAAGTCAGTAGCGATTCCACTGTTGTCCACCGGCATCTTTTCCGGGAACAAAGATCGACTAACCCAATCATTGAACCATTTGCTGACAGCTTTAGACACCACTGATGCAGATGTAGCCATATACTGCAGGGACAAGAAATGGGAAATGACTCTCAAGGAAGCAGTGGCTAGGAGAGAAGCAGTGGAGGAGATATGCATATCCGACGACTCTTCAGTGACAGAACCTGATGCAGAGCTGGTGAGGGTGCATCCGAAGAGTTCTTTGGCTGGAAGGAAGGGCTACAGCACAAGCGATGGCAAAACTTTCTCATATTTGGAAGGGACCAAGTTTCACCAGGCGGCCAAGGATATAGCAGAAATTAATGCCATGTGGCCCGTTGCAACGGAGGCCAATGAGCAGGTATGCATGTATATCCTCGGAGAAAGCATGAGCAGTATTAGGTCGAAATGCCCCGTCGAAGAGTCGGAAGCCTCCACACCACCTAGCACGCTGCCTTGCTTGTGCATCCATGCCATGACTCCAGAAAGAGTACAGCGCCTAAAAGCCTCACGTCCAGAACAAATTACTGTGTGCTCATCCTTTCCATTGCCGAAGTATAGAATCACTGGTGTGCAGAAGATCCAATGCTCCCAGCCTATATTGTTCTCACCGAAAGTGCCTGCGTATATTCATCCAAGGAAGTATCTCGTGGAAACACCACCGGTAGACGAGACTCCGGAGCCATCGGCAGAGAACCAATCCACAGAGGGGACACCTGAACAACCACCACTTATAACCGAGGATGAGACCAGGACTAGAACGCCTGAGCCGATCATCATCGAAGAGGAAGAAGAGGATAGCATAAGTTTGCTGTCAGATGGCCCGACCCACCAGGTGCTGCAAGTCGAGGCAGACATTCACGGGCCGCCCTCTGTATCTAGCTCATCCTGGTCCATTCCTCATGCATCCGACTTTGATGTGGACAGTTTATCCATACTTGACACCCTGGAGGGAGCTAGCGTGACCAGCGGGGCAACGTCAGCCGAGACTAACTCTTACTTCGCAAAGAGTATGGAGTTTCTGGCGCGACCGGTGCCTGCGCCTCGAACAGTATTCAGGAACCCTCCACATCCCGCTCCGCGCACAAGAACACCGTCACTTGCACCCAGCAGGGCCTGCTCGAGAACCAGCCTAGTTTCCACCCCGCCAGGCGTGAATAGGGTGATCACTAGAGAGGAGCTCGAGGCGCTTACCCCGTCACGCACTCCTAGCAGGTCGGTCTCGAGAACCAGCCTGGTCTCCAACCCGCCAGGCGTAAATAGGGTGATTACAAGAGAGGAGTTTGAGGCGTTCGTAGCACAACAACAATGACGGTTTGATGCGGGTGCATACATCTTTTCCTCCGACACCGGTCAAGGGCATTTACAACAAAAATCAGTAAGGCAAACGGTGCTATCCGAAGTGGTGTTGGAGAGGACCGAATTGGAGATTTCGTATGCCCCGCGCCTCGACCAAGAAAAAGAAGAATTACTACGCAAGAAATTACAGTTAAATCCCACACCTGCTAACAGAAGCAGATACCAGTCCAGGAAGGTGGAGAACATGAAAGCCATAACAGCTAGACGTATTCTGCAAGGCCTAGGGCATTATTTGAAGGCAGAAGGAAAAGTGGAGTGCTACCGAACCCTGCATCCTGTTCCTTTGTATTCATCTAGTGTGAACCGTGCCTTTTCAAGCCCCAAGGTCGCAGTGGAAGCCTGTAACGCCATGTTGAAAGAGAACTTTCCGACTGTGGCTTCTTACTGTATTATTCCAGAGTACGATGCCTATTTGGACATGGTTGACGGAGCTTCATGCTGCTTAGACACTGCCAGTTTTTGCCCTGCAAAGCTGCGCAGCTTTCCAAAGAAACACTCCTATTTGGAACCCACAATACGATCGGCAGTGCCTTCAGCGATCCAGAACACGCTCCAGAACGTCCTGGCAGCTGCCACAAAAAGAAATTGCAATGTCACGCAAATGAGAGAATTGCCCGTATTGGATTCGGCGGCCTTTAATGTGGAATGCTTCAAGAAATATGCGTGTAATAATGAATATTGGGAAACGTTTAAAGAAAACCCCATCAGGCTTACTGAAGAAAACGTGGTAAATTACATTACCAAATTAAAAGGACCAAAAGCTGCTGCTCTTTTTGCGAAGACACATAATTTGAATATGTTGCAGGACATACCAATGGACAGGTTTGTAATGGACTTAAAGAGAGACGTGAAAGTGACTCCAGGAACAAAACATACTGAAGAACGGCCCAAGGTACAGGTGATCCAGGCTGCCGATCCGCTAGCAACAGCGTATCTGTGCGGAATCCACCGAGAGCTGGTTAGGAGATTAAATGCGGTCCTGCTTCCGAACATTCATACACTGTTTGATATGTCGGCTGAAGACTTTGACGCTATTATAGCCGAGCACTTCCAGCCTGGGGATTGTGTTCTGGAAACTGACATCGCGTCGTTTGATAAAAGTGAGGACGACGCCATGGCTCTGACCGCGTTAATGATTCTGGAAGACTTAGGTGTGGACGCAGAGCTGTTGACGCTGATTGAGGCGGCTTTCGGCGAAATTTCATCAATACATTTGCCCACTAAAACTAAATTTAAATTCGGAGCCATGATGAAATCTGGAATGTTCCTCACACTGTTTGTGAACACAGTCATTAACATTGTAATCGCAAGCAGAGTGTTGAGAGAACGGCTAACCGGATCACCATGTGCAGCATTCATTGGAGATGACAATATCGTGAAAGGAGTCAAATCGGACAAATTAATGGCAGACAGGTGCGCCACCTGGTTGAATATGGAAGTCAAGATTATAGATGCTGTGGTGGGCGAGAAAGCGCCTTATTTCTGTGGAGGGTTTATTTTGTGTGACTCCGTGACCGGCACAGCGTGCCGTGTGGCAGACCCCCTAAAAAGGCTGTTTAAGCTTGGCAAACCTCTGGCAGCAGACGATGAACATGATGATGACAGGAGAAGGGCATTGCATGAAGAGTCAACACGCTGGAACCGAGTGGGTATTCTTTCAGAGCTGTGCAAGGCAGTAGAATCAAGGTATGAAACCGTAGGAACTTCCATCATAGTTATGGCCATGACTACTCTAGCTAGCAGTGTTAAATCATTCAGCTACCTGAGAGGGGCCCCTATAACTCTCTACGGCTAACCTGAATGGACTACGACATAGTCTAGTCCGCCAAGTCTAGCATATGGCCACC [서열번호 94]----------GOI----------CGGAGACGGCGCAGAAGAAGAGGATCTGGCGAAGGCAGAGGCAGCCTGCTTACATGTGGCGACGTGGAAGAGAACCCCGGACCTATGCACCAGAAACGGACCGCCATGTTCCAGGATCCTCAAGAGAGGCCCAGAAAGCTGCCTCAGCTGTGTACCGAGCTGCAGACCACCATCCACGACATCATCCTGGAATGCGTGTACTGCAAGCAGCAGCTCCTGCGGAGAGAGGTGTACGATTTCGCCTTCCGGGACCTGTGCATCGTGTACAGAGATGGCAACCCCTACGCCGTGTGCGACAAGTGCCTGAAGTTCTACAGCAAGATCAGCGAGTACCGGCACTACTGCTACAGCCTGTACGGCACCACACTGGAACAGCAGTACAACAAGCCCCTGTGCGACCTGCTGATCCGGTGCATCAACTGCCAGAAACCTCTGTGCCCCGAGGAAAAGCAGCGGCACCTGGACAAGAAGCAGCGGTTCCACAACATCAGAGGCCGGTGGACCGGCAGATGCATGAGCTGTTGTCGGAGCAGCAGAACCAGACGGGAAACCCAGCTGTGAGCGGCCGCGAATTGGCAAGCTGCTTACATAGAACTCGCGGCGATTGGCATGCCGCCTTAAAATTTTTATTTTATTTTTCTTTTCTTTTCCGAATCGGATTTTGTTTTTAATATTTCAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAACGCGTCGAGGGGAATTAATTCTTGAAGACGAAAGGGCCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTATGAGTATTCAACATTTCCGTGTCGCCCTTATTCCCTTTTTTGCGGCATTTTGCCTTCCTGTTTTTGCTCACCCAGAAACGCTGGTGAAAGTAAAAGATGCTGAAGATCAGTTGGGTGCACGAGTGGGTTACATCGAACTGGATCTCAACAGCGGTAAGATCCTTGAGAGTTTTCGCCCCGAAGAACGTTTTCCAATGATGAGCACTTTTAAAGTTCTGCTATGTGGCGCGGTATTATCCCGTGTTGACGCCGGGCAAGAGCAACTCGGTCGCCGCATACACTATTCTCAGAATGACTTGGTTGAGTACTCACCAGTCACAGAAAAGCATCTTACGGATGGCATGACAGTAAGAGAATTATGCAGTGCTGCCATAACCATGAGTGATAACACTGCGGCCAACTTACTTCTGACAACGATCGGAGGACCGAAGGAGCTAACCGCTTTTTTGCACAACATGGGGGATCATGTAACTCGCCTTGATCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAACGACGAGCGTGACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCATTGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGAGCTC [서열번호 459]
따라서, 바람직하게는 상기 벡터는 실질적으로 서열번호 94, GOI, 및 서열번호 459를 포함하거나 이로 이루어지는 상기 나타낸 것과 같은 뉴클레오티드 서열, 또는 그의 변이체 또는 단편을 포함한다.
본 발명의 saRNA 구조체는 주형으로서 DNA 플라스미드를 이용해 만들어질 수 있다. 이후, RNA 사본(copy)은 폴리머라아제, 예컨대 T7 폴리머라아제를 이용한 시험관내 전사에 의해 만들어질 수 있고, 상기 T7 프로모터는 saRNA의 상류일 수 있다. 그러므로, 본 발명의 saRNA 구조체는 주형으로서 실질적으로 서열번호 94, GOI, 및 서열번호 459를 포함하거나 이로 이루어지는 상기 나타낸 것과 같은 핵산 서열, 또는 그의 변이체 또는 단편을 갖는 DNA 플라스미드를 이용해 만들어질 수 있다. 물론, 다른 RNA 폴리머라아제, 예를 들면 SP6 또는 T3 폴리머라아제가 T7 폴리머라아제 대신에 사용될 수 있음이 인식될 것이며, 이 경우 상기 saRNA 구조체는 대신에 SP6 또는 T3 프로모터를 포함할 수 있다.
제1 측면의 RNA 구조체를 암호화하는 제4 측면의 벡터는 예를 들면 플라스미드, 코스미드(cosmid) 또는 파지(phage)이거나, 및/또는 바이러스 벡터일 수 있다. 이러한 재조합 벡터는 세포를 뉴클레오티드 서열로 형질전환하기 위한 본 발명의 운반 시스템에서 매우 유용하다. 상기 뉴클레오티드 서열은 바람직하게는 DNA 서열일 수 있고, 상기 DNA 서열이 제1 측면의 RNA 구조체를 형성하는 RNA 서열을 암호화한다.
제1 측면의 RNA 구조체를 암호화하는 재조합 벡터는 또한 다른 기능적 요소를 포함할 수 있다. 예를 들면, 재조합 벡터는 숙주 세포에서 벡터의 도입시 전이유전자 발현을 시작하기 위한 적합한 프로모터를 포함하는 다양한 다른 기능적 요소를 추가로 포함할 수 있다. 예를 들어, 상기 벡터는 바람직하게는 숙주 세포, 예컨대 박테리아 세포의 핵에서 자발적으로 복제할 수 있다. 이 경우, DNA 복제를 유도 또는 조절하는 요소가 상기 재조합 벡터에 필요할 수 있다. 대안적으로, 상기 재조합 벡터는 숙주 세포의 게놈 내로 통합되도록 디자인될 수 있다. 이 경우, (예컨대 상동성 재조합에 의한) 표적화된 통합에 유리한 DNA 서열이 예측된다. 적합한 프로모터는 예로서 SV40 프로모터, CMV, EF1a, PGK, 바이러스 긴 말단 반복뿐만 아니라 유도가능한 프로모터, 예컨대 테트라사이클린 유도가능한 시스템을 포함할 수 있다. 상기 카세트 또는 벡터는 또한 종결자(terminator), 예컨대 베타 글로빈, SV40 폴리아데닐화 서열 또는 합성 폴리아데닐화 서열을 포함할 수 있다. 상기 재조합 벡터는 또한 필요시 핵산의 발현을 제어하기 위한 프로모터 또는 조절자 또는 인핸서(enhancer)를 포함할 수 있다.
상기 벡터는 또한 형질감염(transfection) 또는 형질전환(transformation)된 세포의 선택을 가능하게 하고, 이종성 DNA가 통합된 벡터를 갖고 있는 세포의 선택을 가능하게 하는 클로닝 공정에서 선택가능한 마커로서 사용될 수 있는 유전자를 코딩하는 DNA를 포함할 수 있다. 예를 들면, 암피실린, 네오마이신, 푸로마이신 또는 클로람페니콜 저항성이 예측된다. 대안적으로, 상기 선택가능한 마커 유전자는 전이유전자(들)를 함유하는 벡터와 동시에 사용될 수 있는 상이한 벡터에 있을 수 있다. 상기 카세트 또는 벡터는 또한 뉴클레오티드 서열의 발현을 조절하거나, 발현된 폴리펩티드를 숙주 세포의 소정 부분으로 표적화하는데 관여되는 DNA를 포함할 수 있다.
정제된 벡터는 적합한 수단, 예컨대 직접 식작용 섭취(endocytotic uptake)에 의해 숙주 세포 내로 직접적으로 삽입될 수 있다. 상기 벡터는 형질감염, 감염, 전기천공, 미세주사, 세포 융합, 원형질체 융합 또는 탄도적 충격(ballistic bombardment)에 의해 숙주 세포(예컨대, 진핵생물 또는 원핵생물 세포) 내로 직접 도입될 수 있다. 대안적으로, 본 발명의 벡터는 입자 총을 이용해 숙주 세포 내로 직접 도입될 수 있다.
상기 핵산 분자는 (필수적인 것은 아니지만) 숙주 세포의 DNA에 통합되게 되는 것일 수 있다. 미분화된 세포는 인정적으로 형질전환되어 유전적으로 변형된 딸세포의 생산을 유도할 수 있다(이 경우, 예컨대 특정 전사 인자 또는 유전자 활성화제를 이용한 대상체에서의 발현의 조절이 필요할 수 있다). 대안적으로, 상기 운반 시스템은 분화된 세포의 불안정하거나 일시적인 형질전환을 선호하도록 디자인될 수 있다. 이 경우일 때는 발현의 조절이 덜 중요할 수 있는데, 그 이유는 형질전환된 세포가 죽거나 단백질의 발현을 중단할 때 상기 DNA 분자의 발현이 중단될 것이기 때문이다.
대안적으로, 상기 운반 시스템은 벡터에 통합되지 않고 숙주 세포에 핵산 분자를 제공할 수 있다. 예를 들어, 상기 핵산 분자는 리포좀 또는 바이러스 입자 내에 통합될 수 있다. 대안적으로, "네이키드(naked)" 핵산 분자가 적합한 수단, 예컨대 직접 식작용 섭취에 의해 숙주 세포 내로 삽입될 수 있다.
제5 측면에서, 제1 측면의 RNA 구조체, 제2 측면의 핵산 서열, 제3 측면의 발현 카세트 또는 제4 측면의 벡터, 및 약학적으로 허용가능한 비히클(vehicle)을 포함하는 약학적 조성물이 제공된다.
제6 측면에서, 제5 측면에 따른 약학적 조성물을 제조하기 위한 공정이 제공되며, 상기 방법은 제1 측면의 RNA 구조체, 제2 측면의 핵산 서열, 제3 측면의 발현 카세트 또는 제4 측면의 벡터를 약학적으로 허용가능한 비히클과 접촉시키는 단계를 포함한다.
제7 측면에서, 제1 측면의 RNA 구조체의 제조 방법이 제공되며, 상기 방법은
a) ⅰ) 숙주 세포 내로 제4 측면의 벡터를 도입하는 단계; 및
ⅱ) 제1 측면의 RNA 구조체의 생산을 야기하기 위한 조건 하에 상기 숙주 세포를 배양하는 단계를 포함하거나; 또는
b) 제4 측면에 따른 벡터로부터 RNA 구조체를 전사하는 단계를 포함한다.
단계 a)의 숙주 세포는 진핵생물 또는 원핵생물 숙주 세포일 수 있다. 바람직하게는, 상기 숙주 세포는 진핵생물 숙주 세포이다. 보다 바람직하게는, 상기 숙주 세포는 포유동물 숙주 세포, 예컨대 인간 배아 신장 293 세포 또는 중국 햄스터 난소(CHO) 세포이다. 단계 (b)는 시험관내 또는 생체내에서, 바람직하게는 시험관내에서 수행될 수 있다.
시험관내 전사의 적합한 방법은 본 기술분야에 잘 알려져 있으며, 본 기술분야의 기술자에게 알려져 있을 것이다. 예를 들면, [Molecular Cloning, A Laboratory Manual, 2nd edition. (1989) editor C Nolan, Cold Spring Harbor Laboratory Press]에 기술되어 있다.
제1 측면의 RNA 레플리콘은 치료법용으로 특히 적합하다.
본 발명자들은 제1 측면의 RNA 구조체가 치료법에서 생체내에서 사용하기 위해 시험관내 전사에 의해 생성될 것으로 예측했지만, 본 기술분야의 숙련자는 상기 RNA 구조체는 제2 측면에 따른 핵산, 제3 측면에 따른 발현 카세트, 제4 측면에 따른 벡터를 대상체에게 생체내 운반함으로써 치료법을 위해 대상체에서 생체내에서 생성될 수 있음을 인식할 것이다.
그러므로, 제8 측면에 따르면, 약제로서 또는 치료법에서 사용하기 위한 제1 측면에 따른 RNA 구조체, 제2 측면에 따른 핵산, 제3 측면에 따른 발현 카세트, 제4 측면에 따른 벡터 또는 제5 측면에 따른 약학적 조성물이 제공된다.
본 발명의 제9 측면에서, 원생동물, 진균, 박테리아 또는 바이러스 감염의 예방, 개선 또는 치료에 사용하기 위한 제1 측면에 따른 RNA 구조체, 제2 측면에 따른 핵산, 제3 측면에 따른 발현 카세트, 제4 측면에 따른 벡터 또는 제5 측면에 따른 약학적 조성물이 제공된다.
상기 원생동물, 진균, 박테리아 또는 바이러스 감염은 제1 측면에서 정의된 것과 같은 원생동물, 진균, 박테리아 또는 바이러스의 감염일 수 있다.
본 발명의 제10 측면에서, 암의 예방, 개선 또는 치료에 사용하기 위한 제1 측면에 따른 RNA 구조체, 제2 측면에 따른 핵산, 제3 측면에 따른 발현 카세트, 제4 측면에 따른 벡터 또는 제5 측면에 따른 약학적 조성물이 제공된다.
상기 암은 제1 측면에서 정의된 것일 수 있다.
본 발명의 제11 측면에서, 원생동물, 진균, 박테리아 또는 바이러스 감염을 치료하기 위한 방법이 제공되며, 상기 방법은 이를 필요로 하는 대상체에게, 치료적 유효량의 제1 측면에 따른 RNA 구조체, 제2 측면에 따른 핵산, 제3 측면에 따른 발현 카세트, 제4 측면에 따른 벡터 또는 제5 측면에 따른 약학적 조성물을 투여하는 단계를 포함한다.
치료되어야 하는 원생동물, 진균, 박테리아 또는 바이러스 감염은 제1 측면에서 정의된 것과 같은 원생동물, 진균, 박테리아 또는 바이러스의 감염일 수 있다.
본 발명의 제12 측면에서, 암을 치료하기 위한 방법이 제공되며, 상기 방법은 이를 필요로 하는 대상체에게 치료적 유효량의 제1 측면에 따른 RNA 구조체, 제2 측면에 따른 핵산, 제3 측면에 따른 발현 카세트, 제4 측면에 따른 벡터 또는 제5 측면에 따른 약학적 조성물을 투여하는 단계를 포함한다.
치료되어야 하는 암은 제1 측면에서 정의된 것일 수 있다.
본 명세서에 기술된 RNA 구조체는 (예컨대, 바이러스, 박테리아 또는 진균 감염에 대해) 대상체 및 암을 백신화하는 효과적인 수단을 제공한다.
따라서, 본 발명의 제13 측면에서, 제1 측면에 따른 RNA 구조체, 제2 측면에 따른 핵산, 제3 측면에 따른 발현 카세트, 제4 측면에 따른 벡터 또는 제5 측면에 따른 약학적 조성물를 포함하는 백신이 제공된다.
운반 제형 내로 통합된 어주번트(adjuvant)는 박테리아 지질펩티드, 지질단백질 및 리포테이코산; 마이코박테리아 지질글리칸; 효모 자이모산, 포린, 지질폴리사카라이드, 지질 A, 모노포스포릴 지질 A(MPL), 플라젤린, CpG DNA, 헤모조인, 토마틴, ISCOM, ISCOMATRIXTM, 스쿠알렌계 에멀전, 폴리머, 예컨대 PEI, 카르보폴, 지질 나노입자 및 박테리아 독소(CT, LT)로 이루어진 군으로부터 선택될 수 있다. 운반 제형 내로 통합된 어주번트의 다른 예는 알루미늄 염, 합성 형태의 DNA, 탄수화물, 정제 결합제, 이온 교환 수지, 보존제, 폴리머, 에멀전 및/또는 지질을 포함할 수 있다. 어주번트의 예는 일나트륨 글루타메이트, 수크로오스, 덱스트로오스, 알루미늄 소, 인간 혈청 알부민, 시토신 포스포구아닌, 인산칼륨, 플라스돈 C, 무수 락토오스, 셀룰로오스, 폴라크릴린 칼륨, 글리세린, 아스파라긴, 시트르산, 인산칼륨 황산마그네슘, 철 암모늄 시트레이트, 2-페녹시에탄올, 알루미늄, 베타-프로피오락톤, 소 추출물, DOPC, EDTA, 포름알데히드, 티메로살, 페놀, 칼륨 알루미늄 설페이트, 글루탐산칼륨, 붕산나트륨, 나트륨 메타비설파이트, 우레아, PLGA, PVA, PLA, PVP, 시클로덱스트린계 안정화제, 수중유(oil in water) 에멀전 어주번트 및/또는 지질계 어주번트를 포함할 수 있다.
본 발명의 제14 측면에서, 대상체에서 면역 반응을 자극하는데 사용하기 위한 제1 측면에 따른 RNA 구조체, 제2 측면에 따른 핵산, 제3 측면에 따른 발현 카세트, 제4 측면에 따른 벡터 또는 제5 측면에 따른 약학적 조성물이 제공된다.
상기 면역 반응은 제1 측면에서 정의된 항원에 다른 원생동물, 박테리아, 바이러스, 진균 또는 암에 대해 자극될 수 있다.
다른 측면에서, 대상체를 백신화하는 방법이 제공되며, 상기 방법은 이를 필요로 하는 대상체에게 치료적 유효량의 제1 측면에 따른 RNA 구조체, 제2 측면에 따른 핵산, 제3 측면에 따른 발현 카세트, 제4 측면에 따른 벡터 또는 제5 측면에 따른 약학적 조성물을 투여하거나, 투여한 단계를 포함한다.
제15 측면에 따르면, 줄기 세포 치료법에서 사용하기 위한 제1 측면에 따른 RNA 구조체, 제2 측면에 따른 핵산, 제3 측면에 따른 발현 카세트, 제4 측면에 따른 벡터 또는 제5 측면에 따른 약학적 조성물이 제공된다.
줄기 세포 치료법은 체세포를 줄기 세포 특징을 갖는 세포로 재프로그래밍하는 것에 관한 것일 수 있다.
체세포는 제1 측면에서 정의된 것과 같은 줄기 세포 특징을 갖는 세포로 체세포를 재프로그래밍 하는 것을 향상시킬 수 있는 하나 이상의 단백질을 운반함으로써 재프로그래밍될 수 있다.
제16 측면에 따르면, 제1 측면에 따른 RNA 구조체, 제2 측면에 따른 핵산, 제3 측면에 따른 발현 카세트, 제4 측면에 따른 벡터 또는 제5 측면에 따른 약학적 조성물을 세포로 운반하는 단계를 포함하는 생체외 또는 시험관내에서 세포를 변형시키는 방법이 제공된다.
바람직하게는, 상기 방법은 생체외에서 수행된다.
상기 세포는 진핵생물 또는 원핵생물 세포일 수 있다. 바람직하게는, 상기 세포는 진핵생물 세포이다. 보다 바람직하게는, 상기 세포는 포유동물 숙주 세포이다. 가장 바람직하게는, 상기 세포는 인간 세포이다.
바람직하게는, 상기 변형된 세포는 세포-치료법 적응증을 위해 적합하다.
제17 측면에서, 제16 측면의 방법으로부터 수득되거나 이것에 의해 수득가능한 변형된 세포가 제공된다.
제18 측면에서, 치료법, 선택적으로 세포 치료법에서 사용하기 위한 제17 측면의 변형된 세포가 제공된다.
제1 측면에 따른 RNA 구조체, 제2 측면에 따른 핵산, 제3 측면에 따른 발현 카세트, 제4 측면에 따른 벡터 또는 제5 측면에 따른 약학적 조성물(본 명세서에서 활성제로 알려짐)이 질환을 치료, 개선, 또는 예방하거나 백신화하기 위한 단일치료법(즉, 상기 활성제의 사용)으로서 사용될 수 있는 약제에서 사용될 수 있음이 인식될 것이다. 대안적으로, 본 발명에 따른 활성제는 질환의 치료, 개선, 또는 예방을 위해 알려진 치료법에 부가하여, 또는 이와 조합하여 사용될 수 있다.
본 발명의 RNA 구조체, 핵산 서열, 발현 카세트, 벡터 또는 약학적 조성물은 특히 조성물이 사용되어야 하는 방식에 따라 다수의 상이한 형태를 갖는 조성물에 조합될 수 있다. 따라서, 예를 들면, 상기 조성물은 분말, 정제, 캡슐, 액체, 연고, 크림, 겔, 히드로겔, 에어로졸, 스프레이, 미셀 용액, 경피 패치, 리포좀 현탁액, 폴리플렉스, 에멀전, (표면에 RNA를 갖거나 캡슐화된) 지질 나노입자의 형태 또는 치료 또는 백신화를 필요로 하는 인간 또는 동물에게 투여될 수 있는 임의의 다른 적합한 형태일 수 있다. 본 발명에 따른 약제의 비히클은 이것이 제공되는 대상체에 의해 잘-용인되는 것이어야 함이 인식될 것이다.
본 발명의 RNA 구조체, 핵산 서열, 발현 카세트, 벡터 또는 약학적 조성물은 또한 느린-또는 지연된-방출 장치 내에 통합될 수 있다. 이러한 장치는, 예를 들면, 피부 위 또는 아래에 삽입될 수 있고, 상기 약제는 수 주 또는 심지어 수 개월에 걸쳐 방출될 수 있다. 상기 장치는 치료 부위와 적어도 인접하게 위치될 수 있다. 이러한 장치는 상기 RNA 구조체 또는 재조합 벡터를 이용한 장기간의 치료가 필요하고 정상적으로 빈번한 투여(예컨대, 적어도 매일 주사)가 필요할 때 특히 유리할 수 있다.
그러나, 바람직한 구현예에서, 본 발명에 따른 약제는 혈류, 근육, 피부 내로, 또는 치료를 필요로 하는 부위 내로 직접 주사함으로써 대상체에게 투여될 수 있다. 가장 바람직하게는, 상기 RNA 구조체를 포함하는 약제는 근육 내로 주사된다. 주사는 정맥내(볼루스 또는 수액) 또는 피하(볼루스 또는 수액), 또는 진피내(볼루스 또는 수액), 또는 근육내(볼루스 또는 수액)일 수 있다.
필요한 RNA 구조체, 핵산 서열, 발현 카세트, 벡터 또는 약학적 조성물의 양은 그 생물학적 활성 및 생체이용성에 의해 결정되고, 차례로 상기 RNA 구조체, 핵산 서열, 발현 카세트, 벡터 또는 약학적 조성물의 투여 방식, 물리화학적 특성 및 단일치료법 또는 조합 치료법으로 사용되는지 여부에 의존할 것임이 인식될 것이다. 투여의 빈도는 또한 치료되는 대상체 내에서 상기 활성제의 반감기에 의해 영향을 받을 것이다. 투여되어야 하는 최적의 복용량은 본 기술분야의 기술자에 의해 결정될 수 있고, 사용되는 특정 RNA 구조체, 핵산 서열, 발현 카세트, 벡터 또는 약학적 조성물, 약학적 조성물의 강도, 투여 방식, 및 바이러스 감염의 타입 및 진행에 따라 변할 것이다. 대상체의 연령, 중량, 성별, 식이, 및 투여 시간을 포함하는 치료되는 특정 대상체에 의존하는 부가적인 인자는 복용량을 조정할 필요성을 야기할 것이다.
일반적으로, 0.001 ㎍/㎏의 체중 내지 10 ㎎/㎏의 체중, 또는 0.01 ㎍/㎏의 체중 내지 1 ㎎/㎏의 체중의 본 발명의 RNA 구조체, 핵산 서열, 발현 카세트, 벡터 또는 약학적 조성물의 일일 용량이 사용되는 활성제에 따라 질환을 치료, 개선, 또는 예방하기 위해 사용될 수 있다.
일일 용량은 단일 투여(예컨대 단일 일일 주사 또는 코 스프레이의 흡입)로서 제공될 수 있다. 대안적으로, 상기 RNA 구조체, 핵산 서열, 발현 카세트, 벡터 또는 약학적 조성물은 하루 동안에 2회 이상의 투여가 필요할 수 있다. 예로서, 상기 RNA 구조체, 핵산 서열, 발현 카세트, 벡터 또는 약학적 조성물은 0.07 ㎍ 내지 700 ㎎(즉, 70 ㎏의 체중으로 추정함)의 2회(또는 치료되는 질환의 증세에 따라 그 이상)의 일일 용량으로 투여될 수 있다. 치료를 받는 환자는 기상시 제1 용량을, 이후 저녁(2회 용량 요법이라면)에 또는 이후에 3 또는 4시간 간격으로 제2 용량을 취할 수 있다. 대안적으로, 느린 방출 장치는 본 발명에 따른 RNA 구조체, 핵산 서열, 발현 카세트, 벡터 또는 약학적 조성물을 반복된 용량을 투여할 필요 없이 환자에게 최적의 용량을 제공하기 위해 사용될 수 있다.
그러나, 바람직하게는 본 발명에 따른 RNA 구조체, 핵산 서열, 발현 카세트, 벡터 또는 약학적 조성물은 매주 용량, 보다 바람직하게는 격주 용량으로 제공될 수 있다.
제약 산업에 의해 종래 도입되는 것들과 같은 공지된 절차(예컨대 생체내 실험, 임상 시험, 등)는 본 발명에 따른 RNA 구조체, 핵산 서열, 발현 카세트 또는 벡터의 구체적인 제형 및 정확한 치료 요법(예컨대, 제제의 일일 용량 및 투여 빈도)을 형성하기 위해 사용될 수 있다.
"대상체"는 척추동물, 포유동물, 또는 가축일 수 있다. 따라서, 본 발명에 따른 조성물 및 약제는 임의의 포유동물, 예를 들면 가축(예컨대, 말), 애완동물을 치료하기 dnlgo 사용될 수 있거나, 다른 수의과 적용분야에 사용될 수 있다. 그러나, 가장 바람직하게는, 상기 대상체는 인간이다.
상기 RNA 구조체, 핵산 서열, 발현 카세트, 벡터 또는 약학적 조성물의 "치료적 유효량"은 대상체에게 투여될 때 임의의 해당 질환을 개선, 예방 또는 치료하기 위해 필요한 전술한 양인 임의의 양이다.
예를 들면, 본 발명의 RNA 구조체, 핵산 서열, 발현 카세트, 벡터 또는 약학적 조성물은 약 0.0001 ㎎ 내지 약 800 ㎎, 바람직하게는 약 0.001 ㎎ 내지 약 500 ㎎으로 사용될 수 있다. 상기 레플리콘, 핵산 서열, 발현 카세트, 벡터 또는 약학적 조성물의 양은 약 0.01 ㎎ 내지 약 250 ㎎, 가장 바람직하게는 약 0.01 ㎎ 내지 약 1 ㎎의 양인 것이 바람직하다. 바람직하게는, 본 발명에 따른 RNA 구조체, 핵산 서열, 발현 카세트, 벡터 또는 약학적 조성물은 1-200 ㎍의 용량으로 투여된다.
본 명세서에서 나타낼 때, "약학적으로 허용가능한 비히클"은 약학적 조성물을 제형화하는데 유용하다고 본 기술분야의 기술자에게 알려진 임의의 공지된 화합물 또는 공지된 화합물들의 조합이다.
한 구현예에서, 상기 약학적으로 허용가능한 비히클은 고체일 수 있고, 상기 조성물은 분말 또는 정제의 형태일 수 있다. 고체인 약학적으로 허용가능한 비히클은 향미제, 윤활제, 가용화제, 현탁화제, 염료, 충진제, 활택제, 압착 보조제, 불활성 결합제, 감미제, 보존제, 염료, 코팅물, 또는 정제-붕괴제로서도 작용할 수 있는 하나 이상의 물질을 포함할 수 있다. 상기 비히클은 또한 캡슐화 물질일 수 있다. 분말에서, 상기 비히클은 본 발명에 따른 세분된 활성제와 혼합되는 세분된 고체이다. 정제에서, 상기 활성제(예컨대, 본 발명에 따른 RNA 구조체, 핵산 서열, 발현 카세트, 벡터 또는 약학적 조성물)는 필요한 압착 특성을 갖는 비히클과 적합한 비율로 혼합되고 원하는 형태 및 크기로 압착될 수 있다. 상기 분말 및 정제는 바람직하게는 상기 활성제를 최대 99%까지 함유한다. 적합한 고체 비히클은, 예를 들면 인산칼슘, 스테아르산마그네슘, 탈크, 당, 락토오스, 덱스트린, 전분, 젤라틴, 셀룰로오스, 폴리비닐피롤리돈, 저융점 왁스 및 이온 교환 수지를 포함한다. 다른 구현예에서, 상기 약학적 비히클은 겔일 수 있고, 상기 조성물은 크림 등의 형태일 수 있다.
그러나, 상기 약학적 비히클은 액체일 수 있고, 상기 약학적 조성물은 용액의 형태이다. 액체 비히클은 용액, 현탁액, 에멀전, 시럽, 엘릭시르 및 가압 조성물의 제조에 사용된다. 본 발명에 따른 RNA 구조체, 핵산 서열, 발현 카세트, 벡터 또는 약학적 조성물은 약학적으로 허용가능한 액체 비히클, 예컨대 물, 유기 용매, 이들의 혼합물 또는 약학적으로 허용가능한 오일 또는 지방에 용해 또는 현탁될 수 있다. 상기 액체 비히클은 다른 적합한 약학적 첨가제, 예컨대 가용화제, 에멀전화제, 버퍼, 보존제, 감미제, 향미제, 현탁화제, 증점제, 착색제, 점도 조절제, 안정화제 또는 삼투-조절제를 함유할 수 있다. 경구 및 비경구 투여를 위한 액체 비히클의 적합한 예는 (상기와 같은 첨가제, 예컨대 셀룰로오스 유도체, 바람직하게는 나트륨 카르복시메틸 셀룰로오스 용액을 부분적으로 함유하는) 물, (1가 알코올 및 다가 알코올, 예컨대 글리콜을 포함하는) 알코올 및 그의 유도체, 및 오일(예컨대 분획화된 코코넛 오일 및 아라키스 오일)을 포함한다. 비경구 투여의 경우, 상기 비히클은 또한 오일성 에스테르, 예컨대 에틸 올레에이트 및 이소프로필 미리스테이트일 수 있다. 멸균 액체 비히클은 비경구 투여용 멸균 액체 형태 조성물에서 유용하다. 가압 조성물을 위한 액체 비히클은 할로겐화 탄화수소 또는 다른 약학적으로 허용가능한 추진제(propellant)일 수 있다.
멸균 용액 또는 현탁액인 액체 약학적 조성물은, 예를 들면, 피하, 진피내, 척추강내, 경막외, 복강내, 정맥내, 특히 근육내 주사에 의해 이용될 수 있다. 본 발명의 핵산 서열, 또는 발현 카세트는 멸균수, 식염수, 또는 다른 적절한 멸균 주사가능한 매체를 이용하여 투여 시점에 용해 또는 현탁될 수 있는 멸균 고체 조성물로서 제조될 수 있다.
본 발명의 RNA 구조체, 핵산 서열, 발현 카세트, 벡터 또는 약학적 조성물은 다른 용질 또는 현탁화제(예를 들면, 용액이 등장이 되게 하기에 충분한 식염수 또는 글루코오스), 담즙 염, 아카시아, 젤라틴, 소르비탄 모노올레이이트, 폴리소르베이트 80(소르비톨의 올레에이트 에스테르 및 에틸렌 옥사이드로 공중합된 그의 무수물) 등을 함유하는 멸균 용액 또는 현탁액의 형태로 경구 투여될 수 있다. 본 발명에 따른 RNA 구조체, 핵산 서열, 발현 카세트, 벡터 또는 약학적 조성물은 또한 액체 또는 고체 조성물 형태로 경구 투여될 수 있다. 경구 투여용으로 적합한 조성물은 알약, 캡슐, 과립, 정제, 및 분말과 같은 고체 형태, 및 용액, 시럽, 엘릭시르, 및 현탁액과 같은 액체 형태를 포함한다. 비경구 투여를 위해 유용한 형태는 멸균 용액, 에멀전, 및 현탁액을 포함한다.
본 발명은 그의 변이체 또는 단편을 포함하여 실질적으로 본 명세서에 나타낸 임의의 서열의 아미노산 또는 핵산 서열을 포함하는 임의의 핵산 또는 펩티드 또는 그의 변이체, 유도체 또는 유사체로 확장됨이 인식될 것이다. 용어 "실질적으로 아미노산/뉴클레오티드/펩티드 서열", "변이체" 및 "단편"은 본 명세서에 나타낸 어느 한 서열의 아미노산/뉴클레오티드/펩티드 서열과 적어도 40% 서열 동일성(identity), 예를 들면 본명세서에서 확인된 임의의 서열과 40% 동일성을 갖는 서열일 수 있다.
나타낸 임의의 서열과 65% 이상, 보다 바람직하게는 70% 이상, 보다 더 바람직하게는 75% 이상의 서열 동일성, 보다 더 바람직하게는 80% 이상의 서열 동일성을 갖는 아미노산/폴리뉴클레오티드/폴리펩티드 서열이 또한 예측된다. 바람직하게는, 상기 아미노산/폴리뉴클레오티드/폴리펩티드 서열은 나타낸 임의의 서열과 적어도 85% 동일성, 보다 바람직하게는 적어도 90% 동일성, 보다 더 바람직하게는 적어도 92% 동일성, 보다 더 바람직하게는 적어도 95% 동일성, 보다 더 바람직하게는 적어도 97% 동일성, 보다 더 바람직하게는 적어도 98% 동일성, 가장 바람직하게는 본 명세서에 나타낸 임의의 서열과 적어도 99% 동일성을 갖는다.
숙련된 기술자는 2개의 아미노산/폴리뉴클레오티드/폴리펩티드 서열 사이에 동일성 백분율을 계산하는 방법을 인식할 것이다. 2개의 아미노산/폴리뉴클레오티드/폴리펩티드 서열 사이의 동일성 백분율을 계산하기 위하여, 상기 2개의 서열의 정렬이 먼저 준비되어야 하고, 이어서 서열 동일성 값을 계산한다. 2개의 서열에 대한 동일성 백분율은 다음에 따라 상이한 값을 취할 수 있다: (ⅰ) 서열을 정렬하기 위해 사용된 방법, 예를 들면, ClustalW, BLAST, FASTA, 스미스-워터맨(상이한 프로그램에서 실행됨), 또는 3D 비교로부터의 구조적 정렬; 및 (ⅱ) 정렬 방법에 의해 사용된 파라미터, 예를 들면, 국소 대 전체 정렬, 사용된 쌍별-점수 매트릭스(예컨대 BLOSUM62, PAM250, Gonnet 등), 및 갭-페널티, 예컨대 기능적 형태 및 상수.
정렬을 만든 후, 2개의 서열 사이에 동일성 백분율을 계산하는 많은 다양한 방식이 있다. 예를 들면, 동일성의 수를 다음에 의해 나눌 수 있다: (ⅰ) 가장 짧은 서열의 길이; (ⅱ) 정렬의 길이; (ⅲ) 서열의 평균 길이; (ⅳ) 비-갭 위치의 수; 또는 (ⅴ) 돌출부(overhang)를 배제한 등가물 위치의 수. 아울러, 동일성 백분율은 또한 매우 길이 의존성임이 인식될 것이다. 따라서, 서열의 쌍이 짧을수록 더 높은 서열 동일성이 우연히 일어날 것으로 예상할 수 있다.
그러므로, 단백질 또는 DNA 서열의 정확한 정렬은 복잡한 공정임이 인식될 것이다. 대중적인 다중 정렬 프로그램 ClustalW(Thompson et al., 1994, Nucleic Acids Research, 22, 4673-4680; Thompson et al., 1997, Nucleic Acids Research, 24, 4876-4882)는 본 발명에 따른 단백질 또는 DNA의 다중 정렬을 생성하기 위한 바람직한 방법이다. ClustalW에 대한 적합한 파라미터는 다음과 같을 수 있다: DNA 정렬의 경우: 갭 개방 페널티 = 15.0, 갭 연장 패널티 = 6.66, 및 매트릭스 = 동일성. 단백질 정렬의 경우: 갭 개방 페널티 = 10.0, 갭 연장 페널티 = 0.2, 및 매트릭스 = Gonnet. DNA 및 단백질 정렬의 경우: ENDGAP = -1, 및 GAPDIST = 4. 본 기술분야의 기술자는 최적의 서열 정렬을 위해서는 상기 및 다른 파라미터들을 변화시킬 필요가 있을 수 있음을 인식할 것이다.
바람직하게는, 2개의 아미노산/폴리뉴클레오티드/폴리펩티드 서열 사이의 동일성 백분율의 계산은 이후 이러한 정렬로부터 (N/T)×100으로서 계산될 수 있으며, 여기서 N은 서열이 동일한 잔기를 공유하는 위치의 수이고, T는 갭을 포함하고 돌출부를 포함하거나 배제한 비교된 위치의 총 수이다. 바람직하게는, 돌출부는 상기 계산에 포함된다. 따라서, 2개의 서열 사이의 동일성 백분율을 계산하기 위한 가장 바람직한 방법은 (ⅰ) 예를 들면, 상기에 나타낸 것과 같은 적합한 세트의 파라미터를 이용하여 ClustalW 프로그램을 이용하여 서열 정렬을 준비하는 단계; 및 (ⅱ) N 및 T의 값을 다음의 식: 서열 동일성 = (N/T)×100 내로 삽입하는 단계를 포함한다.
유사한 서열을 확인하기 위한 대안적인 방법은 본 기술분야의 기술자에게 알려질 것이다. 예를 들면, 실질적으로 유사한 뉴클레오티드 서열은 엄격한 조건 하에서 DNA 서열 또는 그의 상보체(complement)와 교잡하는 서열에 의해 암호화될 것이다. 엄격한 조건이란 것은, 본 발명자들은 뉴클레오티드가 대략 45℃에서 3× 염화나트륨/시트르산나트륨(SSC)과, 이어서 대략 20-65℃에서 0.2× SSC/0.1% SDS에서 적어도 1회의 세척 후 필터-결합된 DNA 또는 RNA에 혼성화하는 것을 의미한다. 대안적으로, 실질적으로 유사한 폴리펩티드는 본 명세서에 기술된 임의의 서열과 적어도 1개이지만, 5, 10, 20, 50 또는 100개 미만의 아미노산이 상이할 수 있다.
유전자 코드의 축퇴(degeneracy)로 인하여, 본 명세서에 기술된 임의의 핵산 서열은 이것에 의해 암호화된 단백질의 서열에 실질적으로 영향을 미치지 않으면서 다양해지거나 변화되어 그의 기능적 변이체를 제공할 수 있음이 명확하다. 적합한 뉴클레오티드 변이체는 서열 내에서 동일한 아미노산을 암호화하여 침묵적(동의적) 변화를 생산하는 상이한 코돈의 치환에 의해 변경된 서열을 갖는 것들이다. 다른 적합한 변이체는 상동성 뉴클레오티드 서열을 갖지만 치환되는 아미노산과 유사한 생물물리학적 특성의 측쇄를 갖는 아미노산을 암호화하는 상이한 코돈의 치환에 의해 변경되어 보존된 변화를 생산하는 서열의 전부 또는 일부를 포함하는 것들이다. 예를 들면, 작은 비극성의 소수성 아미노산은 글리신, 알라닌, 루이신, 이소루이신, 발린, 프롤린, 및 메티오닝을 포함한다. 큰 비극성의 소수성 아미노산은 페닐알라닌, 트립토판 및 티로신을 포함한다. 극성의 중성 아미노산은 세린, 트레오닌, 시스테인, 아스파라긴 및 글루타민을 포함한다. 양을 대전된(염기성) 아미노산은 리신, 아르기닌 및 히스티딘을 포함한다. 음으로 대전된(산성) 아미노산은 아스파르트산 및 글루탐산을 포함한다. 따라서, 어느 아미노산이 유사한 생물물리학적 특성을 갖는 아미노산으로 교체될 수 있음이 인식될 것이고, 숙련된 기술자는 상기 아미노산을 암호화하는 뉴클레오티드 서열을 알 것이다.
(임의의 부속 청구항, 요약 및 도면을 포함하는) 본 명세서에 기술된 모든 특성들 및/또는 여기에 개시된 임의의 방법 또는 공정의 모든 단계들은, 이러한 특성 및/또는 단계의 적어도 일부가 상호 배타적인 조합을 제외하고는, 임의의 조합으로 임의의 상기 측면들과 조합될 수 있다.
본 발명을 보다 잘 이해하고, 본 발명의 구현예가 효과를 내기 위해 수행될 수 있는 방식을 보이기 위하여, 이제 실시예로서 부속하는 도면에 대한 참조가 행해질 것이다:
도 1은 본 발명의 RNA 구조체의 다양한 구현예(1-7로 나타냄)의 개략도를 보여준다(예컨대, 왼쪽의 saRNA 레플리콘, 또는 mRNA 구조체). 상기 saRNA 레플리콘(1-4)은 알파 바이러스 백본에 기반하고 있다. 상기 소위 '스틸티콘' 벡터는 5' UTR과, 이어지는 알파바이러스, 예컨대 VEEV로부터의 비-구조 단백질(NSP1-4)을 암호화하는 핵산, 서브게놈성 프로모터(SGP), GOI(관심있는 유전자), 예컨대 바이러스, 박테리아, 진균 또는 포유동물 단백질 또는 항원, 바이러스 선천적 억제제 단백질(IIP), 3' UTR 및 폴리A 꼬리를 포함한다. 상기 mRNA 구조체(5-7)는 5' UTR, GOI(관심있는 유전자), 예컨대 바이러스, 박테리아, 진균 또는 포유동물 단백질 또는 항원, 바이러스 선천적 억제제 단백질(IIP), 3' UTR 및 3' 폴리A 꼬리를 포함한다. 상기 IIP 및 GOI의 순서는 상이한 실증적 구현예에 나타낸 것과 같이 saRNA 및 mRNA 모두에 대해 다양할 수 있다;
도 2는 메신저 RNA(mRNA) 백신으로 백신화된 대상체(최초 프라이머(primer) 예방접종(jab)과, 이어지는 후속 부스트(boost) 예방접종)에서의 면역 반응을 실증한다;
도 3은 표준 자가-증폭형 (saRNA) 백신으로 백신화된 대상체(최초 프라이머 예방접종과, 이어지는 부스트 예방접종)에서의 면역 반응을 실증한다;
도 4는 본 발명의 RNA 구조체의 한 구현예, 예를 들면 도 1에 나타낸 스틸티콘 벡터로 백신화된 대상체(최초 프라이머 예방접종과, 이어지는 부스트 예방접종)에서의 면역 반응을 실증한다;
도 5는 본 발명의 RNA 구조체의 한 구현예, 즉 도 1에 나타낸 스틸티콘 벡터로 백신화된 대상체(최초 프라이머 예방접종과, 이어지는 부스트 예방접종)에서의 항원 발현 레벨을 실증한다;
도 6은 F-T2A 형상(configuration)에서 선택된 IIP를 함유하는 VEEV 레플리콘으로 형질감염된 이후 HeLa 세포에서의 f-Luc 발현을 HEK293T/17 세포에서의 발현과 대비하여 보여준다. HEK293T/17 및 HeLa 세포는 리포터 단백질로서 루시퍼라아제를 함유하는 saRNA(100 ng)로 형질감염되었고, 24시간 후 단백질 발현에 대해 평가하였다;
도 7은 F-T2A 형상에서 선택된 IIP를 함유하는 VEEV 레플리콘으로 형질감염된 이후 HeLa 세포에서의 f-Luc 발현을 HEK293T/17 세포에서의 발현과 대비하여 보여준다. HEK293T/17 및 HeLa 세포는 리포터 단백질로서 루시퍼라아제를 함유하는 saRNA(100 ng)로 형질감염되었고, 24시간 후 단백질 발현에 대해 평가하였다;
도 8은 F-T2A 형상에서 IIP를 함유하는 선택된 VEEV 레플리콘으로 형질감염된 이후 HeLa 세포에서의 f-Luc 발현을 HEK293T/17 세포에서의 발현과 대비하여 보여준다. HEK293T/17 및 HeLa 세포는 리포터 단백질로서 루시퍼라아제를 함유하는 saRNA(100 ng)로 형질감염되었고, 24시간 후 단백질 발현에 대해 평가하였다;
도 9는 이중 서브게놈성 프로모터(DSGP) 형상에서 IIP를 함유하는 VEEV 레플리콘으로 형질감염된 이후 HeLa 세포에서의 f-Luc 발현을 HEK293T/17 세포에서의 발현과 대비하여 보여준다. HEK293T/17 및 HeLa 세포는 리포터 단백질로서 루시퍼라아제를 함유하는 saRNA(100 ng)로 형질감염되었고, 24시간 후 단백질 발현에 대해 평가하였다;
도 10은 F-T2A 형상에서 IIP가 없는 saRNA와 비교하여 IIP HSV ICP34.5를 함유하는 saRNA로 형질감염된 이후 HeLa 세포에서 VEGF-A 발현에서의 증가를 HEK293T/17 세포에서의 발현과 대비하여 보여준다. HEK293T/17 및 HeLa 세포는 분비된 리포터 단백질로서 VEGF-A를 함유하는 saRNA(100 ng)로 형질감염되었고, 48시간 후 ELISA에 의해 배양 배지에서 단백질 발현에 대해 평가하였다;
도 11은 도 1에 나타낸 F-T2A 형상(구조체 2a 및 2b), IRES 형상(구조체 3b) 및 DSGP 형상(구조체 4a 및 4b)에서 GOI(구조체 1)로서 f-Luc를 함유하는 saRNA 및 IIP MERS ORF4a로 형질감염된 이후 HeLa 세포에서의 f-Luc 발현을 비교한다. HeLa 세포는 리포터 단백질로서 루시퍼라아제를 함유하는 RNA(100 ng)로 형질감염되었고, 24시간 후 단백질 발현에 대해 평가하였다; 및
도 12는 F-T2A 형상에서 IIP를 함유하는 mRNA로 형질감염된 이후 HeLa 세포에서의 n-Luc 발현 및 f-Luc 발현을 HEK293T/17 세포에서의 발현과 대비하여 보여준다. HEK293T/17 및 HeLa 세포는 리포터 단백질로서 루시퍼라아제를 함유하는 RNA(100 ng)로 형질감염되었고, 24시간 후 단백질 발현에 대해 평가하였다.
실시예
본 발명자들은 saRNA 또는 mRNA의 선천적 인식을 억제하는 것으로 알려져 있는 비-바이러스 공급원, 예컨대 인간 및 다른 포유동물 유래의 시스 암호화 단백질이 숙주 세포에서 선천적 감지를 약화시키고 RNA 백신의 단백질 발현 및 면역원성 모두를 향상시킬 것임을 가정하였다. 따라서, 본 발명자들은 바이러스 선천적 면역 억제제 단백질(IIP) 및 관심있는 유전자(GOI)를 함유하는 다양한 RNA 구조체(saRNA 및 mRNA)를 디자인 및 테스트한 후, 상기 구조체가 (관심있는 유전자에 의해 암호화된) 세포내 및 분비된 단백질 발현 모두를 향상시키는지 여부를 특징분석하였다.
재료 및 방법
IIP를 함유하는 saRNA 레플리콘 플라스미드의 클로닝
반딧불이 루시퍼라아제(fLuc) 및 베네주엘라 말 뇌염 바이러스(VEEV)로부터 유래되는 레플리카아제를 암호화하는 saRNA를 종래 기술된 것과 같이 플라스미드 벡터 내로 클로닝하였다(1). IIP(반딧불이 루시퍼라아제 f-Luc; Uniprot: Q27758)에 이어서 리포터 유전자를 함유하는 레플리콘 플라스미드를 푸린-T2A 또는 이중 서브게놈성 프로모터를 이용해 생성하였다. 이중 서브게놈성(DSG) 구조체는 상기 fLuc 및 IIP를 암호화하는 별도의 RNA 분자의 전사를 시작하도록 디자인하였고, Gibson 조립체 및 뉴클레오티드 염기 중첩부를 이용해 기본 이중 서브게놈성 벡터 내로 클로닝함으로써 생산하였다. 간략하게, 플라스미드 DNA를 37℃에서 2시간 동안 제한 소화시켰고, 제조사의 프로토콜(New England BioLabs, UK)에 따라 GeneArt(Regensburg, Germany) 또는 Integrated DNA Technologies(IDT)(Iowa, USA)에 의해 합성된 유전자 단편 스트링(string)을 이용한 NEB Builder HiFi DNA 조립 반응물에 사용하였다. fLuc 번역을 위하여 종결 코돈 없이 VEEV 일차적(primary) 서브게놈성 프로모터로부터 단일 RNA 전사체를 생성하기 위해 디자인된 푸린-T2A(F-T2A) 구조체는 F-T2A 서열을 갖는 IIP를 대응하는 DSG 플라스미드 벡터의 제한 효소 부위 내로 클로닝함으로써 생산하였다. 50℃에서 30분 동안 인큐베이션한 후, 2 ㎕의 NEB Builder HiFi 조립 반응물을 사용하여 NEB 10-알파 박테리아를 형질전환시켰고, 상기 형질전환체를 LB 아가 플레이트에 플레이팅한 후, 밤새 인큐베이션하였다. 콜로니(colony)를 선택하였고, 밤새 확장시켰고, 퀴아젠 플라스미드 미니프렙 키트(Qiagen, UK)를 이용해 재조합 플라스미드를 정제하였다. 정제된 클론성 플라스미드를 진단적 제한 효소 소화를 이용해 분석하였고, 올바른 소화 패턴을 나타내는 것을 완전히 시퀀싱하여 뉴클레오티드 동일성을 확인하였다(Eurofins, Germany).
IIP에 이어서 F-T2A 또는 DSG 형태로 리포터 유전자를 가질 뿐만 아니라, ECMV IRES 내부 리보솜 도입 서열(메신저 RNA 전사체 내부 부위의 IRES 요소로부터 단백질 번역을 시작함; Bochkov and Palmenburg, Biotechniques 41(3):283-4, 2006)을 이용하는 구조체를 갖는 플라스미드를 표준 분자 기술을 이용하여 벡터빌더(VectorBuilder, Germany)에 의해 생성하였다.
통합된 인터페론 억제 단백질(IIP)은 다음의 데이터베이스 식별자/접근 번호를 이용해 발견될 수 있다:
EBOV VP35(에볼라 바이러스 VP35; NP_066244.1; 접근 번호 - NCBI 참조 서열: NC_002549.1; UniProtKB - Q05127(VP35_EBOZM); EV71- 2Apro(엔테로바이러스 71 2A pro; 접근 번호 - 진뱅크 KC875402.1 및 AGO28195.1; UniProtKB - Q66478(POLG_HE71B); HCV E2(C형 간염 바이러스 E2; 폴리단백질 AAA45534.1로부터의 NS1 단백질; 접근 번호 - 게놈 RNA 번역 AAA45534.1; UniProtKB - P27958(384-746)(POLG_HCV77)); HCV NS5a(C형 간염 바이러스 NS5a; 단리물 H - 게놈 RNA 번역: AAA45534.1; UniProtKB - P27958(POLG_HCV77)); HPV E6(인간 파필로마바이러스 E6; NP_041325.1; 접근 번호 - NCBI 참조 서열: NC_001526.4; UniProtKB - P03126(VE6_HPV16)); HSV ICP34.5(헤르페스 심플렉스 바이러스 ICP34.5; YP_009137073.1; 접근 번호 - NCBI 참조 서열: NC_001806.2; UniProtKB - P36313(ICP34_HHV11)); KSHV ORF52(카포시 육종-연관 헤르페스바이러스 ORF52; 접근 번호 - 게놈 DNA 번역: ACY00451.1; UniProtKB - F5HBL8(F5HBL8_HHV8)); MERS ORF8b(중동 호흡기 증후군 바이러스 ORF8b; 접근 번호 - 게놈 RNA 번역 ANF29170.1; UniProtKB - A0A1W5LGP6(A0A1W5LGP6_MERS)); VACV C6 백시니아 C6(백시니아 바이러스 C6; 접근 번호 - 게놈 DNA 번역: AAA69602.1; UniProtKB - P17362(C6_VACCW)); VACV K3L(백시니아 바이러스 K3L; 접근 번호 - 게놈 DNA 번역: AAA48009.1; UniProtKB - P20639(K3_VACCC)); PIV 5 V(파라인플루엔자 바이러스 5 V; ENA 단백질 ID: AAA47882.1; 진뱅크 접근 번호 J03142.1; UniProtKB - P11207; V_PIV5)); SARS ORF3b*57 변이체(중증 급성 호흡기 증후군 코로나바이러스 2(2019-nCoV)(SARS-CoV-2) ORF3b 단백질 - AA 23에서 돌연변이된 종결 코돈; 게놈 RNA 번역 QTT40181.1; UniProtKB - P0DTF1(ORF3B_SARS2)); SARS ORF3b*79 변이체(중증 급성 호흡기 증후군 코로나바이러스 2(2019-nCoV)(SARS-CoV-2) ORF3b 단백질 - AA 23 및 AA 57에서 돌연변이된 종결 코돈; 게놈 RNA 번역 QTT40181.1; UniProtKB - P0DTF1(ORF3B_SARS2)); SARS ORF3b*57 에콰도르 변이체(중증 급성 호흡기 증후군 코로나바이러스 2(2019-nCoV)(SARS-CoV-2) ORF3b 단백질 - AA 23에서 돌연변이된 종결 코돈; AA 24에서 에콰도르 돌연변이(L24M); 게놈 RNA 번역 QTT40181.1; UniProtKB - P0DTF1(ORF3B_SARS2)); 천산갑 ORF3b *57(천산갑 코로나바이러스 - 게놈 RNA 번역: QIG55946.1; ORF3b 단백질 - AA 23에서 돌연변이된 종결 코돈; UniProtKB - A0A6M3G7Q4(A0A6M3G7Q4_9BETC)); 천산갑 ORF3b *79(천산갑 코로나바이러스 - 게놈 RNA 번역: QIG55946.1; ORF3b 단백질 - AA 23 및 AA 57에서 돌연변이된 종결 코돈; UniProtKB - A0A6M3G7Q4(A0A6M3G7Q4_9BETC)); MERS ORF4a(중동 호흡기 증후군-연관 코로나바이러스(MERS-CoV) NS4A 단백질 - 게놈 RNA 번역: AGV08457.1; UniProtKB: T2BBG6(T2BBG6_MERS)); BVDV nPro(소 바이러스성 설사 바이러스(BVDV)(점막 질환 바이러스) N-말단 프로테아제(aa 1-168) - 게놈 RNA 번역: AAA42854.1; UniProtKB: P19711(POLG_BVDVN)); HSV US1(인간 헤르페스바이러스 2(HG52 바이러스주)(HHV-2)(인간 헤르페스 심플렉스 바이러스 2) E3 유비퀴틴 리가아제(ubiquitin ligase) ICP22 US1 - 게놈 DNA 번역: CAB06708.1; UniProtKB: P89474(ICP22_HHV2H)); MERS CoV M(중동 호흡기 증후군-연관 코로나바이러스(MERS-CoV) 막 단백질(M) - 게놈 RNA 번역: AGV08396.1; UniProtKB: T2BB40(T2BB40_MERS)).
(1) A. K. Blakney, P. F. McKay, R. J. Shattock, Structural Components for Amplification of Positive and Negative Strand VEEV Splitzicons. Frontiers in Molecular Biosciences 5, 71 (2018).
RNA 전사를 위한 IIP를 함유하는 플라스미드의 클로닝
제한 소화와, 이어서 뉴클레오티드 염기 중첩부 영역을 갖고 F-T2A 서열을 포함하는 Gibson 조립체를 이용함으로써 IIP를 n-Luc과, 이어서 IIP의 단일 전사체 발현을 가능하게 하는 기본 플라스미드 내로 삽입하였다. 상기 기본 플라스미드는 T7 프로모터, 알파-글로빈 5' UTR 및 베타-글로빈 3' UTR을 갖는 발광성 새우 나노루시퍼라아제(n-Luc) 발현 카세트를 암호화하는 mRNA로 이루어졌다. 간략하게, 상기 n-Luc 플라스미드 구조체를 제한 효소를 이용해 37℃에서 2시간 동안 선형화한 후, NEB Builder HiFi 조립체 프로토콜(New England BioLabs, UK)에 본질적으로 기술된 것과 같은 NEB Builder HiFi DNA 조립 반응물에서 사용하였다. 50℃에서 30분 동안 인큐베이션한 후, 2 ㎕의 조립 반응물을 사용하여 프로토콜에 따라 NEB 10-알파 박테리아를 형질전환시켰고, 상기 형질전환체를 LB 아가 플레이트에 플레이팅하였고, 콜로니 성장을 위해 밤새 인큐베이션하였다. 콜로니를 선택하였고, 밤새 확장하였고, 재조합 플라스미드를 퀴아젠 플라스미드 미니프렙 키트(Qiagen, UK)를 이용해 박테리아로부터 정제하였고, 정제된 클론성 플라스미드를 처음에 진단적 제한 효소 소화물을 이용해 분석하였고, 올바른 소화 패턴을 나타내는 것을 완전히 시퀀싱하여 뉴클레오티드 동일성을 확인하였다(Eurofins, Germany).
saRNA 레플리콘 및 mRNA 전사를 위해 사용된 플라스미드 모두에 대하여 IIP에 이어서 F-T2A 또는 DSG 형태로 n-Luc를 가질 뿐만 아니라, ECMV IRES 내부 리보솜 도입 서열(메신저 RNA 전사체 내부 부위의 IRES 요소로부터 단백질 번역을 시작함; Bochkov and Palmenburg, Biotechniques 41(3):283-4, 2006)을 이용하는 구조체를 갖는 플라스미드를 표준 분자 기술을 이용하여 벡터빌더(VectorBuilder, Germany)에 의해 생성하였다.
saRNA의 시험관내 전사
플라스미드 DNA(pDNA)를 대장균(E. coli)(New England BioLabs, UK) 내로 형질전환시켰고, 100 ㎍/㎖의 카르베니실린(Sigma Aldrich, UK)을 갖는 100 ㎖의 Luria Broth(LB)에서 배양하였다. pDNA를 플라스미드 플러스 맥시프렙 키트(QIAGEN, UK)를 이용해 단리하였고, 최종 농도를 NanoDrop One(ThermoFisher, UK)에서 측정하였다. CleanCap Reagent AG(Tebu-bio, France)를 이용해 pDNA 주형으로부터 saRNA를 전사하여 자연 발생형 Cap 1 구조를 갖는 RNA 전사체를 생산하였다. 간략하게, 상기 pDNA 주형을 37℃에서 3시간 동안 선형화시킨 후, 1 ㎍의 선형화된 pDNA 주형을 제조사의 프로토콜에 따라 표준 CleanCap 전사 프로토콜(Tebu-bio, France)에 사용하였다. -20℃에서 적어도 30분 동안 LiCl 침전함으로써 전사체를 정제하였고, 20,000 g로 4℃에서 20분 동안 원심분리하여 RNA를 펠렛화하였고, 70% EtOH로 1회 세정하였고, 다시 20,000 g로 4℃에서 5분 동안 원심분리하였고, UltraPure H2O(Ambion, UK)에 재부유시켰고, 이후 사용할 때까지 -80℃에 보관하였다.
RNA의 시험관내 전사
pDNA를 대장균(New England BioLabs, UK) 내로 형질전환시켰고, 100 ㎍/㎖의 카르베니실린(Sigma Aldrich, UK)을 갖는 100 ㎖의 Luria Broth(LB)에서 배양하였다. 플라스미드 플러스 맥시프렙 키트(QIAGEN, UK)를 이용해 플라스미드를 정제하였고, 농도 및 순도를 NanoDrop One(ThermoFisher, UK)으로 측정하였다. MEGAscript™ T7 전사 프로토콜(ThermoFisher, UK)을 이용하고, 이어서 ScriptCap™ m7G 캡핑 시스템 포스트 번역(Cambio, UK)에 의해 상기 플라스미드 DNA 주형으로부터 RNA를 전사하였다. 간략하게, pDNA를 37℃에서 3시간 동안 선형화하였고, 1 ㎍의 선형화된 pDNA 주형을 표준 반응 프로토콜에 사용하였다. MEGAscript™ T7 전사 후, 상기 전사체를 -20℃에서 적어도 30분 동안 LiCl 침전에 의해 정제한 후, 20,000 g로 4℃에서 20분 동안 원심분리하여 RNA를 펠렛화하였고, 70% EtOH로 1회 세정하였고, 다시 20,000 g로 4℃에서 5분 동안 원심분리하였고, UltraPure H2O(Ambion, UK)에 재부유시켰다. 이후, 상기 전사체를 ScriptCap™ m7G 캡핑 시스템 표준 프로토콜을 이용해 전사-후 캡핑시켰고, 마지막으로 상기 기술된 것과 같이 LiCl 침전시켰다. 이후, 정제되고 Cap 1 캡핑된 RNA를 UltraPure H2O(Ambion, UK)에 재부유시켰고, 이후 사용할 때까지 -80℃에 보관하였다.
IIP 활성의 측정
바이러스 IIP를 함유하는 saRNA가 IIP가 없는 saRNA에 대비하여 saRNA f-luc 발현을 증가시키는 능력; IIP를 함유하는 mRNA가 IIP가 없는 mRNA에 대비하여 mRNA n-luc 발현을 증가시키는 능력, 및 IIP를 함유하는 mRNA가 IIP가 없는 saRNA로부터 f-luc 발현을 증가시키는 능력을 확립하기 위하여, 구조체를 인터페론 적격(competent) HeLa 세포에서 테스트하였고, 기능적 항-바이러스 신호전달 경로를 갖지 않는 HEK293T/17 세포에서 얻어진 경우와 그 발현을 비교하였다. 양쪽 세포주 모두 10%(v/v) 소 태아 혈청(FBS), 5 ㎎/㎖ L-글루타민(Gibco, ThermoFisher, UK) 및 5 ㎎/㎖ 페니실린/스트렙토마이신(Sigma-Aldrich, Merck, UK)을 함유하는 높은 글루코오스의 둘베코 변형 이글 배지(cDMEM)(Sigma-Aldrich, Merck, UK)에서 배양하였다.
saRNA 반딧불이 루시퍼라아제(f-Luc) 발현에 대한 IIP의 평가
평평한 투명 바닥 96-웰 플레이트(Corning Costar) 내로 HEK293T/17 세포를 웰 당 25,000 세포의 밀도로, 그리고 HeLa 세포를 웰 당 10,000 세포의 밀도로 플레이팅한 후, 24시간 동안 인큐베이션하였다. 0.15 ㎕의 리포펙타민(lipofectamine) MessengerMAX(ThermoFisher, UK) 및 100 ng의 saRNA IIP 구조체 또는 saRNA 대조군(IIP 없음)을 함유하는 10 ㎕의 OptiMEM(ThermoFisher, UK)을 웰에 삼중으로 첨가하였고, 추가로 24시간 후, 플레이트를 630 g로 실온에서 5분 동안 원심분리하였고, 50 ㎕의 배지를 각각의 웰로부터 제거하였고, 50 ㎕의 ONE-Glo™ Ex Reagent D-루시페린 시약(Promega, UK)을 첨가하였고, 피펫팅(pipetting)에 의해 혼합하였다. 이후, 각각의 웰로부터의 총 부피를 평평 바닥 불투명 백색 96-웰 플레이트(Corning Costar)로 전달하였고, 10분 이내에 FLUOstar OMEGA 플레이트 판독기(BMG LABTECH, UK)에서 형광을 측정하였다. saRNA를 함유하지 않은 대조군 웰로부터의 배경 형광을 saRNA를 함유하는 각각의 웰에 대한 신호로부터 뺐다. 이후, HeLa 세포에서 IIP를 함유하는 saRNA에 대해 수득된 신호를 대조군 saRNA를 이용해 수득된 신호 및 HEK293T/17 세포에서 수득된 신호로부터의 배수 변화로 표현하였다.
saRNA VEGF-A 발현에 대한 IIP의 평가
HEK293T/17 또는 Hela 세포를 f-Luc를 발현하는 구조체의 테스트에 대해 기술된 것과 동일한 방법을 이용하여 VEGF-A 유전자를 함유하는 100 ng의 saRNA로 형질감염시켰다. 48시간 후, 세포 배양 배지 내의 VEGF-A를 인간 VEGF-A ELISA 키트(Invitrogen, UK)를 이용해 측정하였다. 간략하게, 분석 플레이트 웰을 400 ㎕의 세척 버퍼로 2회 세척한 후, 테스트 샘플 또는 VEGF-A 표준물(15.6 pg/㎖ 내지 1,000 pg/㎖)을 첨가하였다. 이후, 플레이트를 마이크로플레이트 교반기(300 rpm; Jencons Scientific Ltd, UK)에서 실온에서 2시간 동안 인큐베이션한 후, 400 ㎕의 세척 버퍼로 6회 세척하였고, 100 ㎕의 바이오틴-접합체 검출 항체(1:100 희석)를 각각의 웰에 첨가하였고, 플레이트를 마이크로플레이트 교반기(실온에서 1시간, 300 rpm)에서 인큐베이션하였다. 400 ㎕의 세척 버퍼로 6회 세척한 후, 스트렙트아비딘-HRP(1:100 희석) 제2 층 접합체(100 ㎕)를 첨가하였고, 이후 1시간 추가로 인큐베이션하였고, 6회 추가로 세척하였고, 100 ㎕의 TMB 기질을 각각의 웰에 첨가하였다. 암소에서 실온에서 30분 동안 인큐베이션한 후, 100 ㎕의 중단 용액을 첨가하였고, 각각의 웰의 흡광도를 VersaMax 마이크로플레이트 분광광도계(Molecular Devices, UK)로 450 nm에서 판독하였다. 표준 곡선에 내삽(interpolation)함으로써 샘플 내의 VEGF-A 레벨을 결정하였다.
RNA 나노-루시퍼라아제(n-luc) 발현에 대한 IIP의 평가
평평한 투명 바닥 96-웰 플레이트(Corning Costar) 내로 HEK293T/17 세포를 웰 당 25,000 세포의 밀도로, 그리고 HeLa 세포를 웰 당 10,000 세포의 밀도로 플레이팅한 후, 24시간 동안 인큐베이션하였다. 0.15 ㎕의 리포펙타민 MessengerMAX(ThermoFisher, UK) 및 100 ng의 saRNA IIP 구조체 또는 saRNA 대조군(IIP 없음)을 함유하는 10 ㎕의 OptiMEM(ThermoFisher, UK)을 웰에 삼중으로 첨가하였고, 추가로 24시간 후, 플레이트를 630 g로 실온에서 5분 동안 원심분리하였고, 50 ㎕의 배지를 각각의 웰로부터 제거하였고, 50 ㎕의 NanoDLR™ Stop & Glo® 시약(Promega, UK)을 첨가하였고, 피펫팅에 의해 혼합하였다. 이후, 각각의 웰로부터의 총 부피를 평평 바닥 불투명 백색 96-웰 플레이트(Corning Costar)로 전달하였고, 10분 이내에 FLUOstar OMEGA 플레이트 판독기(BMG LABTECH, UK)에서 형광을 측정하였다. RNA를 함유하지 않은 대조군 웰로부터의 배경 형광을 RNA를 함유하는 각각의 웰에 대한 신호로부터 뺐다. 이후, HeLa 세포에서 IIP를 함유하는 RNA에 대해 수득된 신호를 대조군 RNA를 이용해 수득된 신호 및 HEK293T/17 세포에서 수득된 신호로부터의 배수 변화로 표현하였다.
실시예 1 - 바이러스 선천적 억제제 단백질(IIP) 구조체의 구조 디자인
바이러스 선천적 억제제 단백질(IIP)은 자가-증폭형 RNA(saRNA) 또는 메신저 RNA(mRNA)일 수 있는 본 발명의 RNA 구조체 내로 통합되어서, 단백질 발현 및 번역, 즉 임의의 치료 생체분자일 수 있는 관심있는 유전자(GOI)에 의해 암호화되는 단백질을 변형 또는 감소시킬 수 있는 선천적 인식 및 반응을 감소 또는 제거할 수 있다.
본 발명의 RNA 구조체에 대한 디자인 형상의 다양한 구현예는 도 1에 나타나 있다. saRNA 발현 구조체는 알파바이러스 백본을 기반으로 하며, 여기서 비-구조 단백질은 유지되지만, 관심있는 유전자(GOI)는 서브게놈성 프로모터(SGP)의 하류에 삽입되어 바이러스의 구조 유전자를 교체한다(도 1에서 구현예 "1" 참조). 상기 GOI는 임의의 단백질일 수 있으며, 바이러스, 박테리아, 진균 또는 포유동물 단백질, 즉 생물치료제 단백질일 수 있다. 그러나, 본 발명자들은 본 발명의 RNA 구조체가 백신 공간에서 현저한 유용성을 실증할 것으로 예측하며, 따라서 상기 GOI는 백신 항원, 예컨대 바이러스, 박테리아 또는 진균 단백질, 예컨대 코트 단백질을 암호화할 것이다.
saRNA 구조체(도 1의 좌측)
임의의 IIP가 다음의 디자인 접근법을 이용하여 saRNA 내에 암호화될 수 있다:
- 도 1에서 구현예 "2a"는 펩티드 절단 모티프(motif)(예컨대, 푸린-T2A)를 포함하는 융합 단백질을 암호화하는 saRNA 구조체를 보여주며, GOI(예컨대, 관심있는 항원) 및 IIP에 의해 암호화되는 단백질은 숙주 세포에서 번역시 별개의 단백질로 절단된다;
- 도 1의 구현예 "2b"에서, GOI 및 IIP의 순서가 반대이며, IIP는 GOI의 5'에 있고, 다시 상기 IIP와 GOI 사이에 펩티드 절단 모티프가 있어서, saRNA 구조체가 번역된 후 숙주 세포에서 2개의 별개의 단백질이 생산된다;
- 구현예 "3a"에서, IIP는 GOI 종결 코돈의 하류에 삽입된다. 서브게놈성 프로모터는 GOI의 번역을 구동하고, IIP의 발현/번역은 내부 리보솜 도입 부위(IRES)를 포함시킴으로써 구동된다;
- 구현예 "3b"에서, GOI 및 IIP의 순서가 반대이며, IIP의 번역은 서브게놈성 프로모터에 의해, 그리고 GOI는 IRES에 의해 촉진된다;
- 구현예 "4a"에서, IIP는 GOI 종결 코돈의 하류에 삽입된다. GOI의 번역은 제1 서브게놈성 프로모터에 의해 촉진되고, IIP의 번역은 제2 서브게놈성 프로모터를 포함시킴으로써 구동된다;
- 구현예 "4b"에서, IIP 및 GOI의 위치가 바뀌었으며, 즉 IIP가 GOI의 앞에 있다.
mRNA 구조체(도 1의 오른쪽)
도 1을 참조하면, 임의의 IIP가 다음의 디자인 접근법을 이용하여 mRNA 내에 암호화될 수 있다(구현예 "5" 참조):
- 구현예 "6a"에서, mRNA 구조체는 펩티드 절단 모티프(예컨대, F-T2a)를 포함하는 융합 단백질을 암호화하며, GOI 및 IIP는 번역시 별개의 단백질로 절단된다;
- 구현예 "6b"에서, GOI 및 IIP의 순서가 반대이며, IIP는 GOI의 5'에 있다;
- 구현예 "7a"에서, IIP는 GOI 종결 코돈의 하류에 삽입되며, 여기서 번역은 내부 리보솜 도입 부위(IRES)를 포함시킴으로써 구동된다;
- 구현예 "7b"에서, GOI 및 IIP의 순서가 반대이며, 번역은 서브게놈성 프로모터에 의해, 그리고 GOI는 IRES에 의해 촉진된다.
본 발명자들은 도 1에 실증된 RNA 구조체의 다양한 구현예에서 많은 수의 바이러스 IIP를 테스트하였으며, 이들이 각각 saRNA 및 RNA에 대한 발현 및 반응을 변형할 잠재력을 갖는 것으로 여긴다.
실시예 2 - 바이러스 선천적 억제제 단백질(IIP)을 포함하는 saRNA 구조체의 구축 및 테스트
본 발명자들은 리포터 유전자, f-Luc 또는 VEGF-A의 발현시 상이한 레플리콘 형상에서 일련의 다양한 바이러스 IIP를 디자인하고, 구축하고, 이후 테스트하였으며, 발현 연구의 결과는 도 6 내지 도 11에 나타나 있다.
도 6을 참조하면, F-T2A 형상에서 HPV E6, HSV ICP34.5, HCV E2, VACV E3L, MERS ORF8b 또는 VACV K3L을 함유하는 VEEV 레플리콘으로 형질감염된 후 HeLa 세포에서 f-Luc 발현에서의 배수 증가를 보여준다. HEK293T/17 및 HeLa 세포는 리포터 단백질로서 루시퍼라아제를 함유하는 saRNA(100 ng)로 형질감염되었고, 24시간 후 단백질 발현에 대해 평가하였다. HeLa 세포는 HEK293T/17와 비교하여 보다 온전한 IFN 발현 경로를 갖는 것으로 알려져 있고, 따라서 대조군(리포터 단백질로서 루시퍼라아제를 함유하고 IIP는 없는 saRNA)과 대비하여 증가된 발현(배수 증가)은 상기 IIP가 saRNA 발현을 증가시키는 것을 시사한다. 상기 IIP 중에서, HSV ICP34.5는 f-Luc 발현에서 가장 큰 증가를 생성하였다. 나타낸 데이터는 HeLa 세포에서의 루시퍼라아제 발현이 HEK293T/17 세포에서의 발현과 대비하여 ∼2배 이상 증가를 제공하는 구조체이며, 3개의 별개의 saRNA의 배치를 이용하여 3번의 독립적 실험에서 수득된 데이터의 평균±SEM이다.
도 7을 참조하면, F-T2A 형상에서 KHSV ORF52, EBOV VP35, SARS ORF3b* 57 변이체, SARS ORF3b*79 변이체, SARS ORF3b*57 에콰도르 변이체 또는 천산갑 ORF3b* 57을 함유하는 VEEV 레플리콘으로 형질감염된 후 HeLa 세포에서의 f-Luc 발현을 HEK293T/17 세포에서의 발현과 대비하여 보여준다. 실험 방법의 상세 내용은 도 6에 제공된다. 이들 중에서, EBOV VP35 및 SARS ORF3b*79 변이체는 f-Luc 발현에서 가장 큰 증가를 생성하였다. 나타낸 데이터는 HeLa 세포에서의 루시퍼라아제 발현이 HEK293T/17 세포에서의 발현과 대비하여 ∼2배 이상 증가를 제공하는 구조체이며, 3개의 별개의 saRNA의 배치를 이용하여 3번의 독립적 실험에서 수득된 데이터의 평균±SEM이다.
도 8을 참조하면, F-T2A 형상에서 IIP를 함유하는 선택된 VEEV 레플리콘으로 형질감염된 후 HeLa 세포에서의 f-Luc 발현을 HEK293T/17 세포에서의 발현과 대비하여 보여준다. 실험 방법의 상세 내용은 도 6에 제공된다. PIV V5 및 MERS ORF4a는 f-Luc 발현에서 가장 큰 증가를 생성하였다. 나타낸 데이터는 HeLa 세포에서의 루시퍼라아제 발현이 HEK293T/17 세포에서의 발현과 대비하여 ∼2배 이상 증가를 제공하는 구조체이며, 3개의 별개의 saRNA의 배치를 이용하여 3번의 독립적 실험에서 수득된 데이터의 평균±SEM이다.
도 9를 참조하면, 이중 서브게놈성 프로모터(DSGP) 형상에서 IIP를 함유하는 VEEV 레플리콘으로 형질감염된 후 HeLa 세포에서의 f-Luc 발현을 HEK293T/17 세포에서의 발현과 대비하여 보여준다. 실험 방법의 상세 내용은 도 6에 제공된다. HCV E2, VACV E3L 및 PIV 5V는 f-Luc 발현에서 유사한 증가를 생성하였다. 나타낸 데이터는 HeLa 세포에서의 루시퍼라아제 발현이 HEK293T/17 세포에서의 발현과 대비하여 ∼2배 이상 증가를 제공하는 구조체이며, 3개의 별개의 saRNA의 배치를 이용하여 3번의 독립적 실험에서 수득된 데이터의 평균±SEM이다.
도 10을 참조하면, IIP가 없는 saRNA와 비교하고 HEK293T/17 세포에서의 발현과 대비하여 F-T2A 형상에서 IIP HSV ICP34.5를 함유하는 saRNA로 형질감염된 후 HeLa 세포로부터 VEGF-A 분비에서의 증가를 보여준다. HEK293T/17 및 HeLa 세포는 리포터 단백질로서 VEGF-A를 함유하는 RNA(100 ng)로 형질감염되었고, 48시간 후 배양 배지 내로 단백질 발현 및 분비를 ELISA에 의해 평가하였다. HeLa 세포는 HEK293T/17과 비교하여 보다 온전한 IFN 발현 경로를 갖는 것으로 알려져 있으며, 따라서 대조군(GOI로서 VEGF-A를 함유하고 IIP는 없는 RNA)과 대비하여 증가된 발현은 HSV ICP34.5가 saRNA GOI 발현을 증가시켰음을 시사한다. 데이터는 1회 실험으로부터 유래되며, 3번의 반복 측정의 평균±SEM을 나타낸다.
도 11을 참조하면, 도 1에 나타낸 F-T2A 형상(구조체 2a 및 2b), IRES 형상(구조체 3b) 및 DSGP 형상(구조체 4a 및 4b)에서 GOI로서 f-Luc(구조체 1) 및 IIP MERS ORF4a를 함유하는 saRNA로 형질감염된 후 HeLa 세포에서 f-Luc 발현을 보여준다. 실험 방법의 상세 내용은 도 6에 제공된다. 데이터는 3개의 별개의 saRNA의 배치를 이용하여 3번의 독립적 실험에서 수득된 데이터의 평균±SEM이다. P<0.05는 IIP가 없는 구조체와 비교하여 ANOVA 측정에서 유의함을 나타낸다.
실시예 3 - 바이러스 선천적 억제제 단백질(IIP)을 포함하는 RNA 구조체의 구축 및 테스트
본 발명자들은 일련의 다양한 바이러스 IIP를 디자인하고, 구축하고, 이후 테스트하였으며, 발현 연구의 결과는 도 12에 나타나 있다.
도 12를 참조하면, F-T2A 형상에서 IIP를 함유하는 RNA로 형질감염된 후 HeLa 세포에서의 n-Luc 발현을 HEK293T/17 세포에서의 발현과 대비하여 보여준다. 실험 방법의 상세 내용은 도 6에 제공된다. 나타낸 데이터는 루시퍼라아제 발현이 ∼2배 이상 증가를 제공하는 구조체이며, 3개의 별개의 RNA의 배치를 이용하여 3번의 독립적 실험에서 수득된 데이터의 평균±SEM이다.
결론
본 발명자들은 본 명세서에 기술된 구조체가 다음을 포함하여 종래 기술에 기술된 것들보다 많은 이점을 나타낸다고 여긴다:
ⅰ) RNA 구조체, 예컨대 mRNA 또는 saRNA 내로 직접 임의의 선천적 조절 단백질을 암호화하는 뉴클레오티드 서열을 삽입하고, IIP 단백질 및 관심있는 유전자에 의해 암호화되는 생물치료제 분자의 이중 단백질 발현을 가능하게 한다;
ⅱ) 하나는 관심있는 유전자(GOI), 즉 치료 생체분자를 암호화하고 하나는 IIP를 암호화하는 2개의 상이한 별개 가닥의 RNA를 운반하는 것과 대조적으로, 단일 가닥의 운반만이 필요하다;
ⅲ) IIP는 RNA의 선천적 감지를 억제하고, 이에 따라 더 높은 단백질 발현을 가능하게 한다;
ⅳ) RNA 구조체가 saRNA일 때, IIP 발현 자체는 서브게놈성 가닥에서 GOI와 공동 발현됨으로 인해 자가-증폭된다; 및/또는
ⅴ) 종래의 VEEV RNA 레플리콘 구조체와 비교하여 단백질 발현의 규모 및 기간 모두 증가된다.
번호가 매겨진 문단
다음의 문단은 청구항이 아니라 발명의 설명의 일부를 형성한다:
1. (ⅰ) 적어도 하나의 치료 생체분자; 및 (ⅱ) 적어도 하나의 바이러스 선천적 억제제 단백질(IIP);을 암호화하는 RNA 구조체.
2. 상기 구조체가 mRNA, saRNA 또는 트랜스-레플리콘 시스템이고, 가장 바람직하게는 saRNA인, 문단 1에 따른 RNA 구조체.
3. 상기 구조체가 알파바이러스; 피코르나바이러스; 플라비바이러스; 루비바이러스; 페스티바이러스; 헤파시바이러스; 칼리시바이러스 및 코로나바이러스;로 이루어진 속의 군으로부터 선택되양성 가닥 RNA 바이러스, 바람직하게는 알파바이러스, 임의적으로는 VEEV를 포함하거나 이로부터 유래되는, 문단 1 또는 문단 2에 따른 RNA 구조체.
4. 상기 적어도 하나의 선천적 억제제 단백질(IIP)이 HPV E6 또는 HSV ICP34.5, 또는 그의 동원체인, 문단 1 내지 문단 3 중 어느 하나에 따른 RNA 구조체.
5. 상기 적어도 하나의 선천적 억제제 단백질(IIP)이 HCV E2 또는 HCV NS5a, 또는 그의 동원체인, 문단 1 내지 문단 3 중 어느 하나에 따른 RNA 구조체.
6. 상기 적어도 하나의 선천적 억제제 단백질(IIP)이 VACV E3L 또는 VACV K3L, 또는 그의 동원체인, 문단 1 내지 문단 3 중 어느 하나에 따른 RNA 구조체.
7. 상기 적어도 하나의 선천적 억제제 단백질(IIP)이 MERS ORF8B, 또는 그의 동원체인, 문단 1 내지 문단 3 중 어느 하나에 따른 RNA 구조체.
8. 상기 적어도 하나의 선천적 억제제 단백질(IIP)이 KSHV ORF52, 또는 그의 동원체인, 문단 1 내지 문단 3 중 어느 하나에 따른 RNA 구조체.
9. 상기 적어도 하나의 선천적 억제제 단백질(IIP)이 에볼라 VP35, 또는 그의 동원체인, 문단 1 내지 문단 3 중 어느 하나에 따른 RNA 구조체.
10. 상기 적어도 하나의 선천적 억제제 단백질(IIP)이 백시니아 C6, 또는 그의 동원체인, 문단 1 내지 문단 3 중 어느 하나에 따른 RNA 구조체.
11. 상기 적어도 하나의 선천적 억제제 단백질(IIP)이 야생형 SARS-CoV-2 ORF3b의 ORF3b*57 변이체, 또는 그의 동원체인, 문단 1 내지 문단 3 중 어느 하나에 따른 RNA 구조체.
12. 상기 적어도 하나의 선천적 억제제 단백질(IIP)이 야생형 SARS-CoV-2 ORF3b의 ORF3b*79 변이체, 또는 그의 동원체인, 문단 1 내지 문단 3 중 어느 하나에 따른 RNA 구조체.
13. 상기 적어도 하나의 선천적 억제제 단백질(IIP)이 야생형 SARS-CoV-2 ORF3b의 ORF3b*57 에콰도르 변이체, 또는 그의 동원체인, 문단 1 내지 문단 3 중 어느 하나에 따른 RNA 구조체.
14. 상기 치료 생체분자가 치료 단백질을 포함하고, 바람직하게는 상기 단백질 또는 펩티드가 항원, 보다 바람직하게는 바이러스 항원인, 임의의 선행한 문단에 따른 RNA 구조체.
15. 임의의 선행한 문단에 따른 RNA 구조체를 암호화하는 핵산 서열.
16. 문단 15에 따른 핵산 서열을 포함하는 발현 카세트.
17. 문단 16에 따른 발현 카세트를 포함하는 재조합 벡터.
18. 문단 1 내지 문단 14 중 어느 하나에 따른 RNA 구조체, 문단 15에 따른 핵산 서열, 문단 16에 따른 발현 카세트 또는 문단 17에 따른 벡터, 및 약학적으로 허용가능한 비히클을 포함하는 약학적 조성물.
19. 문단 1 내지 문단 14 중 어느 하나에 따른 RNA 구조체의 제조 방법으로서, 상기 방법은
a) ⅰ) 숙주 세포 내로 문단 17에 따른 벡터를 도입하는 단계; 및
ⅱ) 상기 숙주 세포를 문단 1 내지 문단 14 중 어느 하나에 따른 RNA 구조체의 생산을 야기하는 조건 하에 배양하는 단계; 또는
b) 문단 17에 따른 벡터로부터 RNA 구조체를 전사하는 단계;를 포함하는 방법.
20. 약제로서 또는 치료법에 사용하기 위한 문단 1 내지 문단 14 중 어느 하나에 따른 RNA 구조체, 문단 15에 따른 핵산 서열, 문단 16에 따른 발현 카세트 또는 문단 17에 따른 벡터 또는 문단 18에 따른 약학적 조성물.
21. 원생동물, 진균, 박테리아 또는 바이러스 감염의 예방, 개선 또는 치료에 사용하기 위한 문단 1 내지 문단 14 중 어느 하나에 따른 RNA 구조체, 문단 15에 따른 핵산 서열, 문단 16에 따른 발현 카세트 또는 문단 17에 따른 벡터 또는 문단 18에 따른 약학적 조성물.
22. 암의 예방, 개선 또는 치료에 사용하기 위한 문단 1 내지 문단 14 중 어느 하나에 따른 RNA 구조체, 문단 15에 따른 핵산 서열, 문단 16에 따른 발현 카세트, 문단 17에 따른 벡터 또는 문단 18에 따른 약학적 조성물.
23. 문단 1 내지 문단 14 중 어느 하나에 따른 RNA 구조체, 문단 15에 따른 핵산 서열, 문단 16에 따른 발현 카세트, 문단 17에 따른 벡터 또는 문단 18에 따른 약학적 조성물을 포함하는 백신.
24. 대상체에서 면역 반응의 자극에 사용하기 위한 문단 1 내지 문단 14 중 어느 하나에 따른 RNA 구조체, 문단 15에 따른 핵산 서열, 문단 16에 따른 발현 카세트, 문단 17에 따른 벡터 또는 문단 18에 따른 약학적 조성물.
<110> IMPERIAL COLLEGE INNOVATIONS LIMITED VaxEquity LtdVaxEquity Ltd <120> RNA construct <130> 2023-FPA-2153 <150> 2020061.4 <151> 2020-12-17 <160> 459 <170> PatentIn version 3.5 <210> 1 <211> 158 <212> PRT <213> Human papillomavirus type 16 <400> 1 Met His Gln Lys Arg Thr Ala Met Phe Gln Asp Pro Gln Glu Arg Pro 1 5 10 15 Arg Lys Leu Pro Gln Leu Cys Thr Glu Leu Gln Thr Thr Ile His Asp 20 25 30 Ile Ile Leu Glu Cys Val Tyr Cys Lys Gln Gln Leu Leu Arg Arg Glu 35 40 45 Val Tyr Asp Phe Ala Phe Arg Asp Leu Cys Ile Val Tyr Arg Asp Gly 50 55 60 Asn Pro Tyr Ala Val Cys Asp Lys Cys Leu Lys Phe Tyr Ser Lys Ile 65 70 75 80 Ser Glu Tyr Arg His Tyr Cys Tyr Ser Leu Tyr Gly Thr Thr Leu Glu 85 90 95 Gln Gln Tyr Asn Lys Pro Leu Cys Asp Leu Leu Ile Arg Cys Ile Asn 100 105 110 Cys Gln Lys Pro Leu Cys Pro Glu Glu Lys Gln Arg His Leu Asp Lys 115 120 125 Lys Gln Arg Phe His Asn Ile Arg Gly Arg Trp Thr Gly Arg Cys Met 130 135 140 Ser Cys Cys Arg Ser Ser Arg Thr Arg Arg Glu Thr Gln Leu 145 150 155 <210> 2 <211> 474 <212> DNA <213> Human papillomavirus type 16 <400> 2 atgcaccaaa agagaactgc aatgtttcag gacccacagg agcgacccag aaagttacca 60 cagttatgca cagagctgca aacaactata catgatataa tattagaatg tgtgtactgc 120 aagcaacagt tactgcgacg tgaggtatat gactttgctt ttcgggattt atgcatagta 180 tatagagatg ggaatccata tgctgtatgt gataaatgtt taaagtttta ttctaaaatt 240 agtgagtata gacattattg ttatagtttg tatggaacaa cattagaaca gcaatacaac 300 aaaccgttgt gtgatttgtt aattaggtgt attaactgtc aaaagccact gtgtcctgaa 360 gaaaagcaaa gacatctgga caaaaagcaa agattccata atataagggg tcggtggacc 420 ggtcgatgta tgtcttgttg cagatcatca agaacacgta gagaaaccca gctg 474 <210> 3 <211> 474 <212> RNA <213> Human papillomavirus type 16 <400> 3 augcaccaaa agagaacugc aauguuucag gacccacagg agcgacccag aaaguuacca 60 caguuaugca cagagcugca aacaacuaua caugauauaa uauuagaaug uguguacugc 120 aagcaacagu uacugcgacg ugagguauau gacuuugcuu uucgggauuu augcauagua 180 uauagagaug ggaauccaua ugcuguaugu gauaaauguu uaaaguuuua uucuaaaauu 240 agugaguaua gacauuauug uuauaguuug uauggaacaa cauuagaaca gcaauacaac 300 aaaccguugu gugauuuguu aauuaggugu auuaacuguc aaaagccacu guguccugaa 360 gaaaagcaaa gacaucugga caaaaagcaa agauuccaua auauaagggg ucgguggacc 420 ggucgaugua ugucuuguug cagaucauca agaacacgua gagaaaccca gcug 474 <210> 4 <211> 477 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding HPV16 E6 protein <400> 4 atgcaccaga aacggaccgc catgttccag gatcctcaag agaggcccag aaagctgcct 60 cagctgtgta ccgagctgca gaccaccatc cacgacatca tcctggaatg cgtgtactgc 120 aagcagcagc tcctgcggag agaggtgtac gatttcgcct tccgggacct gtgcatcgtg 180 tacagagatg gcaaccccta cgccgtgtgc gacaagtgcc tgaagttcta cagcaagatc 240 agcgagtacc ggcactactg ctacagcctg tacggcacca cactggaaca gcagtacaac 300 aagcccctgt gcgacctgct gatccggtgc atcaactgcc agaaacctct gtgccccgag 360 gaaaagcagc ggcacctgga caagaagcag cggttccaca acatcagagg ccggtggacc 420 ggcagatgca tgagctgttg tcggagcagc agaaccagac gggaaaccca gctgtga 477 <210> 5 <211> 477 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding HPV16 E6 protein <400> 5 augcaccaga aacggaccgc cauguuccag gauccucaag agaggcccag aaagcugccu 60 cagcugugua ccgagcugca gaccaccauc cacgacauca uccuggaaug cguguacugc 120 aagcagcagc uccugcggag agagguguac gauuucgccu uccgggaccu gugcaucgug 180 uacagagaug gcaaccccua cgccgugugc gacaagugcc ugaaguucua cagcaagauc 240 agcgaguacc ggcacuacug cuacagccug uacggcacca cacuggaaca gcaguacaac 300 aagccccugu gcgaccugcu gauccggugc aucaacugcc agaaaccucu gugccccgag 360 gaaaagcagc ggcaccugga caagaagcag cgguuccaca acaucagagg ccgguggacc 420 ggcagaugca ugagcuguug ucggagcagc agaaccagac gggaaaccca gcuguga 477 <210> 6 <211> 248 <212> PRT <213> human herpesvirus 1 <400> 6 Met Ala Arg Arg Arg Arg His Arg Gly Pro Arg Arg Pro Arg Pro Pro 1 5 10 15 Gly Pro Thr Gly Ala Val Pro Thr Ala Gln Ser Gln Val Thr Ser Thr 20 25 30 Pro Asn Ser Glu Pro Ala Val Arg Ser Ala Pro Ala Ala Ala Pro Pro 35 40 45 Pro Pro Pro Ala Gly Gly Pro Pro Pro Ser Cys Ser Leu Leu Leu Arg 50 55 60 Gln Trp Leu His Val Pro Glu Ser Ala Ser Asp Asp Asp Asp Asp Asp 65 70 75 80 Asp Trp Pro Asp Ser Pro Pro Pro Glu Pro Ala Pro Glu Ala Arg Pro 85 90 95 Thr Ala Ala Ala Pro Arg Pro Arg Pro Pro Pro Pro Gly Val Gly Pro 100 105 110 Gly Gly Gly Ala Asp Pro Ser His Pro Pro Ser Arg Pro Phe Arg Leu 115 120 125 Pro Pro Arg Leu Ala Leu Arg Leu Arg Val Thr Ala Glu His Leu Ala 130 135 140 Arg Leu Arg Leu Arg Arg Ala Gly Gly Glu Gly Ala Pro Glu Pro Pro 145 150 155 160 Ala Thr Pro Ala Thr Pro Ala Thr Pro Ala Thr Pro Ala Thr Pro Ala 165 170 175 Arg Val Arg Phe Ser Pro His Val Arg Val Arg His Leu Val Val Trp 180 185 190 Ala Ser Ala Ala Arg Leu Ala Arg Arg Gly Ser Trp Ala Arg Glu Arg 195 200 205 Ala Asp Arg Ala Arg Phe Arg Arg Arg Val Ala Glu Ala Glu Ala Val 210 215 220 Ile Gly Pro Cys Leu Gly Pro Glu Ala Arg Ala Arg Ala Leu Ala Arg 225 230 235 240 Gly Ala Gly Pro Ala Asn Ser Val 245 <210> 7 <211> 744 <212> DNA <213> human herpesvirus 1 <400> 7 atggcccgcc gccgccgcca tcgcggcccc cgccgccccc ggccgcccgg gcccacgggc 60 gccgtcccaa ccgcacagtc ccaggtaacc tccacgccca actcggaacc cgcggtcagg 120 agcgcgcccg cggccgcccc gccgccgccc cccgccggtg ggcccccgcc ttcttgttcg 180 ctgctgctgc gccagtggct ccacgttccc gagtccgcgt ccgacgacga cgatgacgac 240 gactggccgg acagcccccc gcccgagccg gcgccagagg cccggcccac cgccgccgcc 300 ccccggcccc ggcccccacc gcccggcgtg ggcccggggg gcggggctga cccctcccac 360 cccccctcgc gccccttccg ccttccgccg cgcctcgccc tccgcctgcg cgtcaccgcg 420 gagcacctgg cgcgcctgcg cctgcgacgc gcgggcgggg agggggcgcc ggagcccccc 480 gcgacccccg cgacccccgc gacccccgcg acccccgcga cccccgcgcg ggtgcgcttc 540 tcgccccacg tccgggtgcg ccacctggtg gtctgggcct cggccgcccg cctggcgcgc 600 cgcggctcgt gggcccgcga gcgggccgac cgggctcggt tccggcgccg ggtggcggag 660 gccgaggcgg tcatcgggcc gtgcctgggg cccgaggccc gtgcccgggc cctggcccgc 720 ggagccggcc cggcgaactc ggtc 744 <210> 8 <211> 744 <212> RNA <213> human herpesvirus 1 <400> 8 auggcccgcc gccgccgcca ucgcggcccc cgccgccccc ggccgcccgg gcccacgggc 60 gccgucccaa ccgcacaguc ccagguaacc uccacgccca acucggaacc cgcggucagg 120 agcgcgcccg cggccgcccc gccgccgccc cccgccggug ggcccccgcc uucuuguucg 180 cugcugcugc gccaguggcu ccacguuccc gaguccgcgu ccgacgacga cgaugacgac 240 gacuggccgg acagcccccc gcccgagccg gcgccagagg cccggcccac cgccgccgcc 300 ccccggcccc ggcccccacc gcccggcgug ggcccggggg gcggggcuga ccccucccac 360 ccccccucgc gccccuuccg ccuuccgccg cgccucgccc uccgccugcg cgucaccgcg 420 gagcaccugg cgcgccugcg ccugcgacgc gcgggcgggg agggggcgcc ggagcccccc 480 gcgacccccg cgacccccgc gacccccgcg acccccgcga cccccgcgcg ggugcgcuuc 540 ucgccccacg uccgggugcg ccaccuggug gucugggccu cggccgcccg ccuggcgcgc 600 cgcggcucgu gggcccgcga gcgggccgac cgggcucggu uccggcgccg gguggcggag 660 gccgaggcgg ucaucgggcc gugccugggg cccgaggccc gugcccgggc ccuggcccgc 720 ggagccggcc cggcgaacuc gguc 744 <210> 9 <211> 747 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding HSV ICP34.5 protein <400> 9 atggccagaa gaaggcggca cagaggaccc agaaggccta gacctcctgg accaacaggt 60 gccgttccta ccgctcagag ccaagtgacc agcacaccca attctgaacc tgccgtcaga 120 agcgcccctg ctgctgctcc tccacctcca ccagctggcg gacctccacc ttcttgttct 180 ctgctgctga gacagtggct gcacgtgcca gagtccgcct ccgacgatga tgacgatgac 240 gactggcctg acagccctcc tccagaacct gctcctgaag ccagacctac agccgctgct 300 cctagaccta gaccaccacc tccaggtgtt ggacctggtg gcggagctga tccttctcac 360 cctcctagca gacccttccg gcttcctcct agactggccc tgagactgag agtgacagcc 420 gaacacctgg ccagactgag acttcgtaga gcaggcggag aaggcgctcc tgaacctcct 480 gctacaccag ccacaccagc tactcccgca actcctgcca ctcctgctag agtgcggttt 540 agccctcacg tccgcgtcag acatctggtc gtttgggcct ctgctgcccg gcttgctaga 600 agaggatctt gggccagaga gagagccgac cgggctagat ttcggagaag agtggccgaa 660 gccgaggccg tgattggacc ttgtcttggc cctgaagctc gggctagagc acttgctaga 720 ggtgccggac ctgccaacag cgtgtga 747 <210> 10 <211> 747 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding HSV ICP34.5 protein <400> 10 auggccagaa gaaggcggca cagaggaccc agaaggccua gaccuccugg accaacaggu 60 gccguuccua ccgcucagag ccaagugacc agcacaccca auucugaacc ugccgucaga 120 agcgccccug cugcugcucc uccaccucca ccagcuggcg gaccuccacc uucuuguucu 180 cugcugcuga gacaguggcu gcacgugcca gaguccgccu ccgacgauga ugacgaugac 240 gacuggccug acagcccucc uccagaaccu gcuccugaag ccagaccuac agccgcugcu 300 ccuagaccua gaccaccacc uccagguguu ggaccuggug gcggagcuga uccuucucac 360 ccuccuagca gacccuuccg gcuuccuccu agacuggccc ugagacugag agugacagcc 420 gaacaccugg ccagacugag acuucguaga gcaggcggag aaggcgcucc ugaaccuccu 480 gcuacaccag ccacaccagc uacucccgca acuccugcca cuccugcuag agugcgguuu 540 agcccucacg uccgcgucag acaucugguc guuugggccu cugcugcccg gcuugcuaga 600 agaggaucuu gggccagaga gagagccgac cgggcuagau uucggagaag aguggccgaa 660 gccgaggccg ugauuggacc uugucuuggc ccugaagcuc gggcuagagc acuugcuaga 720 ggugccggac cugccaacag cguguga 747 <210> 11 <211> 364 <212> PRT <213> Hepatitis C virus <400> 11 Met Glu Thr His Val Thr Gly Gly Ser Ala Gly His Thr Val Ser Gly 1 5 10 15 Phe Val Ser Leu Leu Ala Pro Gly Ala Lys Gln Asn Val Gln Leu Ile 20 25 30 Asn Thr Asn Gly Ser Trp His Leu Asn Ser Thr Ala Leu Asn Cys Asn 35 40 45 Asp Ser Leu Asn Thr Gly Trp Leu Ala Gly Leu Phe Tyr His His Lys 50 55 60 Phe Asn Ser Ser Gly Cys Pro Glu Arg Leu Ala Ser Cys Arg Pro Leu 65 70 75 80 Thr Asp Phe Asp Gln Gly Trp Gly Pro Ile Ser Tyr Ala Asn Gly Ser 85 90 95 Gly Pro Asp Gln Arg Pro Tyr Cys Trp His Tyr Pro Pro Lys Pro Cys 100 105 110 Gly Ile Val Pro Ala Lys Ser Val Cys Gly Pro Val Tyr Cys Phe Thr 115 120 125 Pro Ser Pro Val Val Val Gly Thr Thr Asp Arg Ser Gly Ala Pro Thr 130 135 140 Tyr Ser Trp Gly Glu Asn Asp Thr Asp Val Phe Val Leu Asn Asn Thr 145 150 155 160 Arg Pro Pro Leu Gly Asn Trp Phe Gly Cys Thr Trp Met Asn Ser Thr 165 170 175 Gly Phe Thr Lys Val Cys Gly Ala Pro Pro Cys Val Ile Gly Gly Ala 180 185 190 Gly Asn Asn Thr Leu His Cys Pro Thr Asp Cys Phe Arg Lys His Pro 195 200 205 Asp Ala Thr Tyr Ser Arg Cys Gly Ser Gly Pro Trp Ile Thr Pro Arg 210 215 220 Cys Leu Val Asp Tyr Pro Tyr Arg Leu Trp His Tyr Pro Cys Thr Ile 225 230 235 240 Asn Tyr Thr Ile Phe Lys Ile Arg Met Tyr Val Gly Gly Val Glu His 245 250 255 Arg Leu Glu Ala Ala Cys Asn Trp Thr Arg Gly Glu Arg Cys Asp Leu 260 265 270 Glu Asp Arg Asp Arg Ser Glu Leu Ser Pro Leu Leu Leu Thr Thr Thr 275 280 285 Gln Trp Gln Val Leu Pro Cys Ser Phe Thr Thr Leu Pro Ala Leu Ser 290 295 300 Thr Gly Leu Ile His Leu His Gln Asn Ile Val Asp Val Gln Tyr Leu 305 310 315 320 Tyr Gly Val Gly Ser Ser Ile Ala Ser Trp Ala Ile Lys Trp Glu Tyr 325 330 335 Val Val Leu Leu Phe Leu Leu Leu Ala Asp Ala Arg Val Cys Ser Cys 340 345 350 Leu Trp Met Met Leu Leu Ile Ser Gln Ala Glu Ala 355 360 <210> 12 <211> 1092 <212> DNA <213> Hepatitis C virus <400> 12 atggaaaccc acgtcaccgg gggaagtgcc ggccacactg tgtctggatt tgttagcctc 60 ctcgcaccag gcgccaagca gaacgtccag ctgatcaaca ccaacggcag ttggcacctc 120 aatagcacgg ccctgaactg caatgatagc cttaacaccg gctggttagc agggcttttc 180 tatcaccaca agttcaactc ttcaggctgt cctgagaggc tagccagctg ccgacccctt 240 accgattttg accagggctg gggccctatc agttatgcca acggaagcgg ccccgaccag 300 cgcccctact gctggcacta cccccctaaa ccttgcggtg ttgtgcccgc gaagagtgtg 360 tgtggtccgg tatattgctt cactcccagc cccgtggtgg tgggaacgac cgacaggtcg 420 ggcgcgccta cctacagctg gggtgaaaat gatacggacg tcttcgtcct taacaatacc 480 aggccaccgc tgggcaattg gttcggttgt acctggatga actcaactgg attcaccaaa 540 gtgtgcggag cgcctccctg tgtcatcgga ggggcgggca acaacaccct gcactgcccc 600 actgattgct tccgcaagca tccggacgcc acatactctc ggtgcggctc cggtccctgg 660 atcacaccca ggtgcctggt cgactacccg tataggcttt ggcattatcc ttgtaccatc 720 aactacacca tatttaaaat caggatgtac gtgggagggg tcgagcacag gctggaagct 780 gcttgcaact ggacgcgggg cgaacgttgc gatctggaag acagggacag gtccgagctc 840 agcccgttac tgctgaccac tacacagtgg caggtcctcc cgtgttcctt cacaaccctg 900 ccagccttgt ccaccggcct catccacctc caccagaaca ttgtggacgt gcagtacttg 960 tacggggtgg ggtcaagcat cgcgtcctgg gccattaagt gggagtacgt cgttctcctg 1020 ttccttctgc ttgcagacgc gcgcgtctgc tcctgcttgt ggatgatgct actcatatcc 1080 caagcggagg cg 1092 <210> 13 <211> 1092 <212> RNA <213> Hepatitis C virus <400> 13 auggaaaccc acgucaccgg gggaagugcc ggccacacug ugucuggauu uguuagccuc 60 cucgcaccag gcgccaagca gaacguccag cugaucaaca ccaacggcag uuggcaccuc 120 aauagcacgg cccugaacug caaugauagc cuuaacaccg gcugguuagc agggcuuuuc 180 uaucaccaca aguucaacuc uucaggcugu ccugagaggc uagccagcug ccgaccccuu 240 accgauuuug accagggcug gggcccuauc aguuaugcca acggaagcgg ccccgaccag 300 cgccccuacu gcuggcacua ccccccuaaa ccuugcggug uugugcccgc gaagagugug 360 ugugguccgg uauauugcuu cacucccagc cccguggugg ugggaacgac cgacaggucg 420 ggcgcgccua ccuacagcug gggugaaaau gauacggacg ucuucguccu uaacaauacc 480 aggccaccgc ugggcaauug guucgguugu accuggauga acucaacugg auucaccaaa 540 gugugcggag cgccucccug ugucaucgga ggggcgggca acaacacccu gcacugcccc 600 acugauugcu uccgcaagca uccggacgcc acauacucuc ggugcggcuc cggucccugg 660 aucacaccca ggugccuggu cgacuacccg uauaggcuuu ggcauuaucc uuguaccauc 720 aacuacacca uauuuaaaau caggauguac gugggagggg ucgagcacag gcuggaagcu 780 gcuugcaacu ggacgcgggg cgaacguugc gaucuggaag acagggacag guccgagcuc 840 agcccguuac ugcugaccac uacacagugg cagguccucc cguguuccuu cacaacccug 900 ccagccuugu ccaccggccu cauccaccuc caccagaaca uuguggacgu gcaguacuug 960 uacggggugg ggucaagcau cgcguccugg gccauuaagu gggaguacgu cguucuccug 1020 uuccuucugc uugcagacgc gcgcgucugc uccugcuugu ggaugaugcu acucauaucc 1080 caagcggagg cg 1092 <210> 14 <211> 1095 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding HCV E2 protein <400> 14 atggaaaccc acgtgacagg cggatctgcc ggccatacag tgtccggctt tgtgtctctt 60 ctggcccctg gcgccaagca gaatgtgcag ctgatcaaca ccaacggcag ctggcacctg 120 aacagcacag ccctgaactg caacgacagc ctgaataccg gatggctggc cggcctgttc 180 taccaccaca agttcaatag cagcggctgc cccgagagac tggcctcttg tagacctctg 240 accgacttcg atcaaggctg gggccctatc agctacgcca atggctctgg acctgaccag 300 aggccttact gctggcacta ccctccaaag ccttgcggaa tcgtgcctgc caagtctgtg 360 tgtggccccg tgtactgctt caccccatct ccagtggtcg tgggcaccac cgatagatct 420 ggcgccccaa catatagctg gggcgagaac gacaccgacg tgttcgtgct gaacaacacc 480 cggcctccac tcggaaattg gttcggctgc acctggatga actccaccgg cttcacaaaa 540 gtgtgcggag cccctccttg tgtgattggc ggagccggaa acaataccct gcactgccct 600 accgactgct tcagaaagca ccccgacgcc acctacagca gatgtggatc tggcccttgg 660 atcaccccta gatgcctggt ggactacccc taccggctgt ggcactatcc ctgcaccatc 720 aactacacca tcttcaagat ccgtatgtac gtcggcggcg tggaacacag actggaagcc 780 gcctgtaact ggaccagggg cgagagatgc gacctggaag atagagacag aagcgagctg 840 agccctctgc tgctgaccac cacacagtgg caggtcctgc cttgcagctt caccacactg 900 cctgctctga gcaccggcct gattcatctg caccagaaca tcgtggacgt gcagtacctg 960 tacggcgtgg gaagctctat tgccagctgg gccatcaagt gggagtacgt ggtgctgctg 1020 ttcctgctgc tggccgatgc cagagtgtgt agctgcctgt ggatgatgct gctgatctct 1080 caggccgagg cctga 1095 <210> 15 <211> 1095 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding HCV E2 protein <400> 15 auggaaaccc acgugacagg cggaucugcc ggccauacag uguccggcuu ugugucucuu 60 cuggccccug gcgccaagca gaaugugcag cugaucaaca ccaacggcag cuggcaccug 120 aacagcacag cccugaacug caacgacagc cugaauaccg gauggcuggc cggccuguuc 180 uaccaccaca aguucaauag cagcggcugc cccgagagac uggccucuug uagaccucug 240 accgacuucg aucaaggcug gggcccuauc agcuacgcca auggcucugg accugaccag 300 aggccuuacu gcuggcacua cccuccaaag ccuugcggaa ucgugccugc caagucugug 360 uguggccccg uguacugcuu caccccaucu ccaguggucg ugggcaccac cgauagaucu 420 ggcgccccaa cauauagcug gggcgagaac gacaccgacg uguucgugcu gaacaacacc 480 cggccuccac ucggaaauug guucggcugc accuggauga acuccaccgg cuucacaaaa 540 gugugcggag ccccuccuug ugugauuggc ggagccggaa acaauacccu gcacugcccu 600 accgacugcu ucagaaagca ccccgacgcc accuacagca gauguggauc uggcccuugg 660 aucaccccua gaugccuggu ggacuacccc uaccggcugu ggcacuaucc cugcaccauc 720 aacuacacca ucuucaagau ccguauguac gucggcggcg uggaacacag acuggaagcc 780 gccuguaacu ggaccagggg cgagagaugc gaccuggaag auagagacag aagcgagcug 840 agcccucugc ugcugaccac cacacagugg cagguccugc cuugcagcuu caccacacug 900 ccugcucuga gcaccggccu gauucaucug caccagaaca ucguggacgu gcaguaccug 960 uacggcgugg gaagcucuau ugccagcugg gccaucaagu gggaguacgu ggugcugcug 1020 uuccugcugc uggccgaugc cagagugugu agcugccugu ggaugaugcu gcugaucucu 1080 caggccgagg ccuga 1095 <210> 16 <211> 449 <212> PRT <213> Hepatitis C virus <400> 16 Met Ser Gly Ser Trp Leu Arg Asp Ile Trp Asp Trp Ile Cys Glu Val 1 5 10 15 Leu Ser Asp Phe Lys Thr Trp Leu Lys Ala Lys Leu Met Pro Gln Leu 20 25 30 Pro Gly Ile Pro Phe Val Ser Cys Gln Arg Gly Tyr Arg Gly Val Trp 35 40 45 Arg Gly Asp Gly Ile Met His Thr Arg Cys His Cys Gly Ala Glu Ile 50 55 60 Thr Gly His Val Lys Asn Gly Thr Met Arg Ile Val Gly Pro Arg Thr 65 70 75 80 Cys Lys Asn Met Trp Ser Gly Thr Phe Phe Ile Asn Ala Tyr Thr Thr 85 90 95 Gly Pro Cys Thr Pro Leu Pro Ala Pro Asn Tyr Lys Phe Ala Leu Trp 100 105 110 Arg Val Ser Ala Glu Glu Tyr Val Glu Ile Arg Arg Val Gly Asp Phe 115 120 125 His Tyr Val Ser Gly Met Thr Thr Asp Asn Leu Lys Cys Pro Cys Gln 130 135 140 Ile Pro Ser Pro Glu Phe Phe Thr Glu Leu Asp Gly Val Arg Leu His 145 150 155 160 Arg Phe Ala Pro Pro Cys Lys Pro Leu Leu Arg Glu Glu Val Ser Phe 165 170 175 Arg Val Gly Leu His Glu Tyr Pro Val Gly Ser Gln Leu Pro Cys Glu 180 185 190 Pro Glu Pro Asp Val Ala Val Leu Thr Ser Met Leu Thr Asp Pro Ser 195 200 205 His Ile Thr Ala Glu Ala Ala Gly Arg Arg Leu Ala Arg Gly Ser Pro 210 215 220 Pro Ser Met Ala Ser Ser Ser Ala Ser Gln Leu Ser Ala Pro Ser Leu 225 230 235 240 Lys Ala Thr Cys Thr Ala Asn His Asp Ser Pro Asp Ala Glu Leu Ile 245 250 255 Glu Ala Asn Leu Leu Trp Arg Gln Glu Met Gly Gly Asn Ile Thr Arg 260 265 270 Val Glu Ser Glu Asn Lys Val Val Ile Leu Asp Ser Phe Asp Pro Leu 275 280 285 Val Ala Glu Glu Asp Glu Arg Glu Val Ser Val Pro Ala Glu Ile Leu 290 295 300 Arg Lys Ser Arg Arg Phe Ala Pro Ala Leu Pro Val Trp Ala Arg Pro 305 310 315 320 Asp Tyr Asn Pro Leu Leu Val Glu Thr Trp Lys Lys Pro Asp Tyr Glu 325 330 335 Pro Pro Val Val His Gly Cys Pro Leu Pro Pro Pro Arg Ser Pro Pro 340 345 350 Val Pro Pro Pro Arg Lys Lys Arg Thr Val Val Leu Thr Glu Ser Thr 355 360 365 Leu Pro Thr Ala Leu Ala Glu Leu Ala Thr Lys Ser Phe Gly Ser Ser 370 375 380 Ser Thr Ser Gly Ile Thr Gly Asp Asn Thr Thr Thr Ser Ser Glu Pro 385 390 395 400 Ala Pro Ser Gly Cys Pro Pro Asp Ser Asp Val Glu Ser Tyr Ser Ser 405 410 415 Met Pro Pro Leu Glu Gly Glu Pro Gly Asp Pro Asp Leu Ser Asp Gly 420 425 430 Ser Trp Ser Thr Val Ser Ser Gly Ala Asp Thr Glu Asp Val Val Cys 435 440 445 Cys <210> 17 <211> 1347 <212> DNA <213> Hepatitis C virus <400> 17 atgtccggtt cctggctaag ggacatctgg gactggatat gcgaggtgct gagcgacttt 60 aagacctggc tgaaagccaa gctcatgcca caactgcctg ggattccctt tgtgtcctgc 120 cagcgcgggt ataggggggt ctggcgagga gacggcatta tgcacactcg ctgccactgt 180 ggagctgaga tcactggaca tgtcaaaaac gggacgatga ggatcgtcgg tcctaggacc 240 tgcaagaaca tgtggagtgg gacgttcttc attaatgcct acaccacggg cccctgtact 300 ccccttcctg cgccgaacta taagttcgcg ctgtggaggg tgtctgcaga ggaatacgtg 360 gagataaggc gggtggggga cttccactac gtatcgggca tgactactga caatctcaaa 420 tgcccgtgcc agatcccatc gcccgaattt ttcacagaat tggacggggt gcgcctacat 480 aggtttgcgc ccccttgcaa gcccttgctg cgggaggagg tatcattcag agtaggactc 540 cacgagtacc cggtggggtc gcaattacct tgcgagcccg aaccggacgt agccgtgttg 600 acgtccatgc tcactgatcc ctcccatata acagcagagg cggccgggag aaggttggcg 660 agagggtcac ccccttctat ggccagctcc tcggctagcc agctgtccgc tccatctctc 720 aaggcaactt gcaccgccaa ccatgactcc cctgacgccg agctcataga ggctaacctc 780 ctgtggaggc aggagatggg cggcaacatc accagggttg agtcagagaa caaagtggtg 840 attctggact ccttcgatcc gcttgtggca gaggaggatg agcgggaggt ctccgtaccc 900 gcagaaattc tgcggaagtc tcggagattc gccccagccc tgcccgtctg ggcgcggccg 960 gactacaacc ccctgctagt agagacgtgg aaaaagcctg actacgaacc acctgtggtc 1020 catggctgcc cgctaccacc tccacggtcc cctcctgtgc ctccgcctcg gaaaaagcgt 1080 acggtggtcc tcaccgaatc aaccctacct actgccttgg ccgagcttgc caccaaaagt 1140 tttggcagct cctcaacttc cggcattacg ggcgacaata cgacaacatc ctctgagccc 1200 gccccttctg gctgcccccc cgactccgac gttgagtcct attcttccat gccccccctg 1260 gagggggagc ctggggatcc ggatctcagc gacgggtcat ggtcgacggt cagtagtggg 1320 gccgacacgg aagatgtcgt gtgctgc 1347 <210> 18 <211> 1347 <212> RNA <213> Hepatitis C virus <400> 18 auguccgguu ccuggcuaag ggacaucugg gacuggauau gcgaggugcu gagcgacuuu 60 aagaccuggc ugaaagccaa gcucaugcca caacugccug ggauucccuu uguguccugc 120 cagcgcgggu auaggggggu cuggcgagga gacggcauua ugcacacucg cugccacugu 180 ggagcugaga ucacuggaca ugucaaaaac gggacgauga ggaucgucgg uccuaggacc 240 ugcaagaaca uguggagugg gacguucuuc auuaaugccu acaccacggg ccccuguacu 300 ccccuuccug cgccgaacua uaaguucgcg cuguggaggg ugucugcaga ggaauacgug 360 gagauaaggc ggguggggga cuuccacuac guaucgggca ugacuacuga caaucucaaa 420 ugcccgugcc agaucccauc gcccgaauuu uucacagaau uggacggggu gcgccuacau 480 agguuugcgc ccccuugcaa gcccuugcug cgggaggagg uaucauucag aguaggacuc 540 cacgaguacc cggugggguc gcaauuaccu ugcgagcccg aaccggacgu agccguguug 600 acguccaugc ucacugaucc cucccauaua acagcagagg cggccgggag aagguuggcg 660 agagggucac ccccuucuau ggccagcucc ucggcuagcc agcuguccgc uccaucucuc 720 aaggcaacuu gcaccgccaa ccaugacucc ccugacgccg agcucauaga ggcuaaccuc 780 cuguggaggc aggagauggg cggcaacauc accaggguug agucagagaa caaaguggug 840 auucuggacu ccuucgaucc gcuuguggca gaggaggaug agcgggaggu cuccguaccc 900 gcagaaauuc ugcggaaguc ucggagauuc gccccagccc ugcccgucug ggcgcggccg 960 gacuacaacc cccugcuagu agagacgugg aaaaagccug acuacgaacc accugugguc 1020 cauggcugcc cgcuaccacc uccacggucc ccuccugugc cuccgccucg gaaaaagcgu 1080 acgguggucc ucaccgaauc aacccuaccu acugccuugg ccgagcuugc caccaaaagu 1140 uuuggcagcu ccucaacuuc cggcauuacg ggcgacaaua cgacaacauc cucugagccc 1200 gccccuucug gcugcccccc cgacuccgac guugaguccu auucuuccau gcccccccug 1260 gagggggagc cuggggaucc ggaucucagc gacgggucau ggucgacggu caguaguggg 1320 gccgacacgg aagaugucgu gugcugc 1347 <210> 19 <211> 1350 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding HCV NS5a protein <400> 19 atgtctggca gctggctgag agacatctgg gactggattt gcgaggtgct gagcgacttc 60 aagacctggc tgaaggccaa gctgatgcct cagctgcctg gcatcccttt cgtgtcctgt 120 cagaggggct atagaggcgt ttggagaggc gacggcatca tgcacaccag atgtcactgt 180 ggcgccgaga tcacaggcca cgtgaagaac ggcaccatga gaatcgtggg ccccagaacc 240 tgcaagaata tgtggagcgg caccttcttc atcaacgcct acaccaccgg accttgcaca 300 cctctgcctg ctcctaacta caagttcgcc ctgtggcggg tgtccgccga ggaatacgtg 360 gaaatcagaa gagtgggcga cttccactac gtgtccggca tgaccaccga caacctgaag 420 tgcccctgtc agatcccatc tcctgagttc ttcaccgagc tggatggcgt gcggctgcac 480 agatttgccc ctccatgtaa acccctgctg agagaagagg tgtcctttag agtgggcctg 540 cacgagtacc ctgtgggttc tcagctccct tgcgagcctg aacctgatgt ggccgtgctg 600 acctccatgc tgacagaccc ttctcacatc acagccgagg ccgctggaag aaggctggct 660 agaggatctc ctcctagcat ggcctctagc agcgcctctc aactgtctgc cccaagcctg 720 aaagccacct gtaccgccaa tcacgacagc cctgatgccg agctgatcga ggctaacctg 780 ctgtggcggc aagagatggg cggcaacatc accagagtgg aaagcgagaa caaggtggtc 840 atcctggata gcttcgaccc tctggtggcc gaagaggacg agagggaagt gtctgtgcct 900 gccgagatcc tgagaaagag cagaagattc gcccctgctc tgcccgtgtg ggccagacct 960 gattacaatc ccctgctggt ggaaacatgg aagaagcccg actacgagcc tcctgtggtg 1020 cacggatgtc cactgcctcc acctagatct ccacctgtgc cacctccacg gaagaaaaga 1080 accgtggtgc tgaccgagag caccctgcct acagctctgg ctgagctggc cacaaagagc 1140 tttggcagca gcagcacctc tggcatcacc ggcgataata ccaccaccag ctctgagcct 1200 gctccaagcg gatgtcctcc tgactccgac gtggaaagct acagcagcat gcctcctctg 1260 gaaggcgaac ccggcgatcc tgatctgtct gatggctctt ggagcaccgt gtcctctggc 1320 gccgatacag aggatgtcgt gtgctgctga 1350 <210> 20 <211> 1350 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding HCV NS5a protein <400> 20 augucuggca gcuggcugag agacaucugg gacuggauuu gcgaggugcu gagcgacuuc 60 aagaccuggc ugaaggccaa gcugaugccu cagcugccug gcaucccuuu cguguccugu 120 cagaggggcu auagaggcgu uuggagaggc gacggcauca ugcacaccag augucacugu 180 ggcgccgaga ucacaggcca cgugaagaac ggcaccauga gaaucguggg ccccagaacc 240 ugcaagaaua uguggagcgg caccuucuuc aucaacgccu acaccaccgg accuugcaca 300 ccucugccug cuccuaacua caaguucgcc cuguggcggg uguccgccga ggaauacgug 360 gaaaucagaa gagugggcga cuuccacuac guguccggca ugaccaccga caaccugaag 420 ugccccuguc agaucccauc uccugaguuc uucaccgagc uggauggcgu gcggcugcac 480 agauuugccc cuccauguaa accccugcug agagaagagg uguccuuuag agugggccug 540 cacgaguacc cuguggguuc ucagcucccu ugcgagccug aaccugaugu ggccgugcug 600 accuccaugc ugacagaccc uucucacauc acagccgagg ccgcuggaag aaggcuggcu 660 agaggaucuc cuccuagcau ggccucuagc agcgccucuc aacugucugc cccaagccug 720 aaagccaccu guaccgccaa ucacgacagc ccugaugccg agcugaucga ggcuaaccug 780 cuguggcggc aagagauggg cggcaacauc accagagugg aaagcgagaa caaggugguc 840 auccuggaua gcuucgaccc ucugguggcc gaagaggacg agagggaagu gucugugccu 900 gccgagaucc ugagaaagag cagaagauuc gccccugcuc ugcccgugug ggccagaccu 960 gauuacaauc cccugcuggu ggaaacaugg aagaagcccg acuacgagcc uccuguggug 1020 cacggauguc cacugccucc accuagaucu ccaccugugc caccuccacg gaagaaaaga 1080 accguggugc ugaccgagag cacccugccu acagcucugg cugagcuggc cacaaagagc 1140 uuuggcagca gcagcaccuc uggcaucacc ggcgauaaua ccaccaccag cucugagccu 1200 gcuccaagcg gauguccucc ugacuccgac guggaaagcu acagcagcau gccuccucug 1260 gaaggcgaac ccggcgaucc ugaucugucu gauggcucuu ggagcaccgu guccucuggc 1320 gccgauacag aggaugucgu gugcugcuga 1350 <210> 21 <211> 190 <212> PRT <213> Vaccinia virus <400> 21 Met Ser Lys Ile Tyr Ile Asp Glu Arg Ser Asp Ala Glu Ile Val Cys 1 5 10 15 Ala Ala Ile Lys Asn Ile Gly Ile Glu Gly Ala Thr Ala Ala Gln Leu 20 25 30 Thr Arg Gln Leu Asn Met Glu Lys Arg Glu Val Asn Lys Ala Leu Tyr 35 40 45 Asp Leu Gln Arg Ser Ala Met Val Tyr Ser Ser Asp Asp Ile Pro Pro 50 55 60 Arg Trp Phe Met Thr Thr Glu Ala Asp Lys Pro Asp Ala Asp Ala Met 65 70 75 80 Ala Asp Val Ile Ile Asp Asp Val Ser Arg Glu Lys Ser Met Arg Glu 85 90 95 Asp His Lys Ser Phe Asp Asp Val Ile Pro Ala Lys Lys Ile Ile Asp 100 105 110 Trp Lys Asp Ala Asn Pro Val Thr Ile Ile Asn Glu Tyr Cys Gln Ile 115 120 125 Thr Lys Arg Asp Trp Ser Phe Arg Ile Glu Ser Val Gly Pro Ser Asn 130 135 140 Ser Pro Thr Phe Tyr Ala Cys Val Asp Ile Asp Gly Arg Val Phe Asp 145 150 155 160 Lys Ala Asp Gly Lys Ser Lys Arg Asp Ala Lys Asn Asn Ala Ala Lys 165 170 175 Leu Ala Val Asp Lys Leu Leu Gly Tyr Val Ile Ile Arg Phe 180 185 190 <210> 22 <211> 570 <212> DNA <213> Vaccinia virus <400> 22 atgtctaaga tctatatcga cgagcgttct gacgcagaga ttgtgtgtgc ggctattaaa 60 aacattggaa tcgaaggagc tactgctgca caactaacta gacaacttaa tatggagaag 120 cgagaagtta ataaagctct gtacgatctt caacgtagtg ctatggtgta cagctccgac 180 gatattcctc ctcgttggtt tatgacaacg gaggcggata agccggatgc tgatgctatg 240 gctgacgtca taatagatga tgtatcccgc gaaaaatcaa tgagagagga tcataagtct 300 tttgatgatg ttattccggc taaaaaaatt attgattgga aagatgctaa ccctgtcacc 360 attattaatg agtactgcca aataactaag agagattggt cttttcgtat tgaatcagtt 420 gggcctagta actctcctac attttatgcc tgtgtagata tcgacggaag agtattcgat 480 aaggccgatg gaaaatctaa acgagatgct aaaaataatg cagctaaatt ggctgtagat 540 aaacttcttg ggtacgtcat cattagattc 570 <210> 23 <211> 570 <212> RNA <213> Vaccinia virus <400> 23 augucuaaga ucuauaucga cgagcguucu gacgcagaga uugugugugc ggcuauuaaa 60 aacauuggaa ucgaaggagc uacugcugca caacuaacua gacaacuuaa uauggagaag 120 cgagaaguua auaaagcucu guacgaucuu caacguagug cuauggugua cagcuccgac 180 gauauuccuc cucguugguu uaugacaacg gaggcggaua agccggaugc ugaugcuaug 240 gcugacguca uaauagauga uguaucccgc gaaaaaucaa ugagagagga ucauaagucu 300 uuugaugaug uuauuccggc uaaaaaaauu auugauugga aagaugcuaa cccugucacc 360 auuauuaaug aguacugcca aauaacuaag agagauuggu cuuuucguau ugaaucaguu 420 gggccuagua acucuccuac auuuuaugcc uguguagaua ucgacggaag aguauucgau 480 aaggccgaug gaaaaucuaa acgagaugcu aaaaauaaug cagcuaaauu ggcuguagau 540 aaacuucuug gguacgucau cauuagauuc 570 <210> 24 <211> 573 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding VACV E3L protein <400> 24 atgagcaaga tctacatcga cgagcggagc gacgccgaga ttgtgtgtgc cgccatcaag 60 aacatcggca tcgaaggcgc tacagccgct cagctgacca gacagctgaa catggaaaag 120 cgggaagtga acaaggccct gtacgacctg cagagaagcg ccatggtgta cagcagcgac 180 gacatccctc ctcggtggtt tatgaccaca gaggccgaca agcccgacgc cgatgctatg 240 gccgatgtga tcatcgacga cgtgtcccgc gagaagtcca tgagagagga ccacaagagc 300 ttcgatgacg tgatccccgc caagaagatc atcgattgga aggacgccaa tcctgtgacc 360 atcatcaacg agtactgcca gatcaccaag cgcgactggt ccttcagaat cgagagcgtg 420 ggccccagca acagccctac cttttatgcc tgcgtggaca tcgacggccg ggtgttcgat 480 aaggccgatg gcaagagcaa gcgggacgcc aaaaacaacg ccgccaaact ggccgtggat 540 aagctgctgg gctacgtgat catccggttc tga 573 <210> 25 <211> 573 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding VACV E3L protein <400> 25 augagcaaga ucuacaucga cgagcggagc gacgccgaga uugugugugc cgccaucaag 60 aacaucggca ucgaaggcgc uacagccgcu cagcugacca gacagcugaa cauggaaaag 120 cgggaaguga acaaggcccu guacgaccug cagagaagcg ccauggugua cagcagcgac 180 gacaucccuc cucggugguu uaugaccaca gaggccgaca agcccgacgc cgaugcuaug 240 gccgauguga ucaucgacga cgugucccgc gagaagucca ugagagagga ccacaagagc 300 uucgaugacg ugauccccgc caagaagauc aucgauugga aggacgccaa uccugugacc 360 aucaucaacg aguacugcca gaucaccaag cgcgacuggu ccuucagaau cgagagcgug 420 ggccccagca acagcccuac cuuuuaugcc ugcguggaca ucgacggccg gguguucgau 480 aaggccgaug gcaagagcaa gcgggacgcc aaaaacaacg ccgccaaacu ggccguggau 540 aagcugcugg gcuacgugau cauccgguuc uga 573 <210> 26 <211> 88 <212> PRT <213> Vaccinia virus <400> 26 Met Leu Ala Phe Cys Tyr Ser Leu Pro Asn Ala Gly Asp Val Ile Lys 1 5 10 15 Gly Arg Val Tyr Glu Lys Asp Tyr Ala Leu Tyr Ile Tyr Leu Phe Asp 20 25 30 Tyr Pro His Ser Glu Ala Ile Leu Ala Glu Ser Val Lys Met His Met 35 40 45 Asp Arg Tyr Val Glu Tyr Arg Asp Lys Leu Val Gly Lys Thr Val Lys 50 55 60 Val Lys Val Ile Arg Val Asp Tyr Thr Lys Gly Tyr Ile Asp Val Asn 65 70 75 80 Tyr Lys Arg Met Cys Arg His Gln 85 <210> 27 <211> 264 <212> DNA <213> Vaccinia virus <400> 27 atgcttgcat tttgttattc gttgcccaat gcgggcgatg taataaaggg cagagtatac 60 gagaaggatt atgctctata catttatctt tttgactatc ctcactctga agctatcttg 120 gcagagagtg ttaagatgca tatggataga tatgttgaat atagggataa actggtaggg 180 aaaactgtaa aagttaaagt gattagagtt gattatacaa aaggatatat agatgtcaat 240 tacaaaagga tgtgtagaca tcaa 264 <210> 28 <211> 264 <212> RNA <213> Vaccinia virus <400> 28 augcuugcau uuuguuauuc guugcccaau gcgggcgaug uaauaaaggg cagaguauac 60 gagaaggauu augcucuaua cauuuaucuu uuugacuauc cucacucuga agcuaucuug 120 gcagagagug uuaagaugca uauggauaga uauguugaau auagggauaa acugguaggg 180 aaaacuguaa aaguuaaagu gauuagaguu gauuauacaa aaggauauau agaugucaau 240 uacaaaagga uguguagaca ucaa 264 <210> 29 <211> 267 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding VACV K3L protein <400> 29 atgctggcct tctgctacag cctgcctaat gccggcgacg tgatcaaggg cagagtgtac 60 gagaaggact acgccctgta catctacctg ttcgactacc ctcacagcga ggccatcctg 120 gccgagtctg tgaagatgca catggacaga tacgtggaat accgggacaa gctcgtgggc 180 aagaccgtga aagtgaaagt catcagagtg gactacacca agggctacat cgacgtgaac 240 tacaagcgga tgtgcaggca ccagtga 267 <210> 30 <211> 267 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding VACV K3L protein <400> 30 augcuggccu ucugcuacag ccugccuaau gccggcgacg ugaucaaggg cagaguguac 60 gagaaggacu acgcccugua caucuaccug uucgacuacc cucacagcga ggccauccug 120 gccgagucug ugaagaugca cauggacaga uacguggaau accgggacaa gcucgugggc 180 aagaccguga aagugaaagu caucagagug gacuacacca agggcuacau cgacgugaac 240 uacaagcgga ugugcaggca ccaguga 267 <210> 31 <211> 151 <212> PRT <213> Vaccinia virus <400> 31 Met Asn Ala Tyr Asn Lys Ala Asp Ser Phe Ser Leu Glu Ser Asp Ser 1 5 10 15 Ile Lys Asp Val Ile His Asp Tyr Ile Cys Trp Leu Ser Met Thr Asp 20 25 30 Glu Met Arg Pro Ser Ile Gly Asn Val Phe Lys Ala Met Glu Thr Phe 35 40 45 Lys Ile Asp Ala Val Arg Tyr Tyr Asp Gly Asn Ile Tyr Glu Leu Ala 50 55 60 Lys Asp Ile Asn Ala Met Ser Phe Asp Gly Phe Ile Arg Ser Leu Gln 65 70 75 80 Thr Ile Ala Ser Lys Lys Asp Lys Leu Thr Val Tyr Gly Thr Met Gly 85 90 95 Leu Leu Ser Ile Val Val Asp Ile Asn Lys Gly Cys Asp Ile Ser Asn 100 105 110 Ile Lys Phe Ala Ala Gly Ile Ile Ile Leu Met Glu Tyr Ile Phe Asp 115 120 125 Asp Thr Asp Met Ser His Leu Lys Val Ala Leu Tyr Arg Arg Ile Gln 130 135 140 Arg Arg Asp Asp Val Asp Arg 145 150 <210> 32 <211> 453 <212> DNA <213> Vaccinia virus <400> 32 atgaatgcgt ataataaagc cgattcgttt tctttagagt ctgattctat caaagatgtt 60 atacacgatt atatttgttg gctcagtatg actgatgaaa tgagaccatc tatcggaaac 120 gtctttaaag cgatggaaac gtttaagata gacgcggtta gatattacga tggtaacata 180 tatgaattag ctaaagatat aaatgcgatg tcgtttgacg gttttataag atctctacaa 240 actatcgctt caaagaaaga taaactcact gtttatggaa ccatgggact gctgtctatt 300 gtcgtagata ttaacaaagg ttgtgatata tccaatatca agttcgctgc cggaataatc 360 attttaatgg agtatatttt tgatgacacg gatatgtctc atcttaaagt agcactctat 420 cgtagaatac agagacgtga tgatgtagat aga 453 <210> 33 <211> 453 <212> RNA <213> Vaccinia virus <400> 33 augaaugcgu auaauaaagc cgauucguuu ucuuuagagu cugauucuau caaagauguu 60 auacacgauu auauuuguug gcucaguaug acugaugaaa ugagaccauc uaucggaaac 120 gucuuuaaag cgauggaaac guuuaagaua gacgcgguua gauauuacga ugguaacaua 180 uaugaauuag cuaaagauau aaaugcgaug ucguuugacg guuuuauaag aucucuacaa 240 acuaucgcuu caaagaaaga uaaacucacu guuuauggaa ccaugggacu gcugucuauu 300 gucguagaua uuaacaaagg uugugauaua uccaauauca aguucgcugc cggaauaauc 360 auuuuaaugg aguauauuuu ugaugacacg gauaugucuc aucuuaaagu agcacucuau 420 cguagaauac agagacguga ugauguagau aga 453 <210> 34 <211> 456 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding Vaccinia C6 protein <400> 34 atgaacgcct acaacaaggc cgacagcttc agcctggaaa gcgacagcat caaggacgtg 60 atccacgact acatctgctg gctgagcatg accgacgaga tgaggcccag catcggcaac 120 gtgttcaagg ccatggaaac cttcaagatc gacgccgtgc ggtactacga cggcaacatc 180 tatgagctgg ccaaggacat caacgccatg agcttcgacg gcttcatcag aagcctgcag 240 acaatcgcca gcaagaaaga caagctgacc gtgtacggca ccatgggcct gctgtctatc 300 gtggtggata tcaacaaggg ctgcgacatc agcaacatca agttcgccgc tggcatcatc 360 atcctgatgg agtacatctt cgacgacacc gacatgagcc acctgaaggt ggccctgtac 420 agaagaatcc agcggaggga cgacgtggac agatga 456 <210> 35 <211> 456 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding Vaccinia C6 protein <400> 35 augaacgccu acaacaaggc cgacagcuuc agccuggaaa gcgacagcau caaggacgug 60 auccacgacu acaucugcug gcugagcaug accgacgaga ugaggcccag caucggcaac 120 guguucaagg ccauggaaac cuucaagauc gacgccgugc gguacuacga cggcaacauc 180 uaugagcugg ccaaggacau caacgccaug agcuucgacg gcuucaucag aagccugcag 240 acaaucgcca gcaagaaaga caagcugacc guguacggca ccaugggccu gcugucuauc 300 gugguggaua ucaacaaggg cugcgacauc agcaacauca aguucgccgc uggcaucauc 360 auccugaugg aguacaucuu cgacgacacc gacaugagcc accugaaggu ggcccuguac 420 agaagaaucc agcggaggga cgacguggac agauga 456 <210> 36 <211> 143 <212> PRT <213> Middle East Respiratory Syndrome virus <400> 36 Met Pro Ile Pro Pro Leu Arg Lys Met Leu Gly Ile Gly Gly Asp Arg 1 5 10 15 Thr Glu Lys Leu Ile Pro Gly Met Glu Leu Ser Asn Trp Leu Pro Gly 20 25 30 Gly Thr Ser Thr Thr Leu Glu Leu Asp Pro Lys Gln His Ser His Ser 35 40 45 Gly Leu Leu Arg Met Ala Ser Phe Gly Ser Met Lys Met Ala Pro Leu 50 55 60 Met Leu Leu Gln Leu Leu Gly Arg Gly Thr Leu Thr Met Ile Gln Leu 65 70 75 80 Leu Leu His Asn Ser Arg Pro Val Leu Ser Phe Leu Lys Thr Ser Thr 85 90 95 Leu Arg Gly Leu Glu Ala Ile Val Asn His Leu Gln Glu Pro Leu Ala 100 105 110 Gln Ala Glu Thr Leu Pro Asp Leu Val His Lys Val Gln Asp Gln Glu 115 120 125 Thr Leu Pro Ala Ala Leu Leu Gln Val His Leu Glu Ser Glu Gln 130 135 140 <210> 37 <211> 429 <212> DNA <213> Middle East Respiratory Syndrome virus <400> 37 atgccaattc cacccctgcg caaaatgctg ggtattggcg gagacaggac agaaaaatta 60 ataccgggaa tggaattaag caactggctc ccaggtggta cttctactac actggaactg 120 gacccgaagc agcactccca ttccgggctg ttaaggatgg catcgtttgg gtccatgaag 180 atggcgccac tgatgctcct tcaacttttg ggacgcggaa ccctaacaat gattcagcta 240 ttgttacaca attcgcgccc ggtactaagc ttcctaaaaa cttccacatt gaggggactg 300 gaggcaatag tcaatcatct tcaagagcct ctagcgcaag cagaaactct tccagatcta 360 gttcacaagg ttcaagatca ggaaactcta cccgcggcac ttctccaggt ccatctggaa 420 tcggagcag 429 <210> 38 <211> 429 <212> RNA <213> Middle East Respiratory Syndrome virus <400> 38 augccaauuc caccccugcg caaaaugcug gguauuggcg gagacaggac agaaaaauua 60 auaccgggaa uggaauuaag caacuggcuc ccagguggua cuucuacuac acuggaacug 120 gacccgaagc agcacuccca uuccgggcug uuaaggaugg caucguuugg guccaugaag 180 auggcgccac ugaugcuccu ucaacuuuug ggacgcggaa cccuaacaau gauucagcua 240 uuguuacaca auucgcgccc gguacuaagc uuccuaaaaa cuuccacauu gaggggacug 300 gaggcaauag ucaaucaucu ucaagagccu cuagcgcaag cagaaacucu uccagaucua 360 guucacaagg uucaagauca ggaaacucua cccgcggcac uucuccaggu ccaucuggaa 420 ucggagcag 429 <210> 39 <211> 432 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding MERS ORF8b protein <400> 39 atgcccattc ctccactgag aaagatgctc ggcatcggcg gcgacagaac cgagaagctg 60 atccctggca tggaactgag caactggctg cctggcggca ccagcacaac actggaactg 120 gatcctaagc agcacagcca cagcggcctg ctgagaatgg ccagctttgg cagcatgaag 180 atggcccctc tgatgctgct gcagctgctc ggaagaggca ccctgacaat gatccagctg 240 ctgctccaca acagcagacc cgtgctgagc ttcctgaaaa ccagcacact gagaggcctg 300 gaagccatcg tgaaccatct gcaagagccc ctggctcagg ccgagacact gcctgatctg 360 gtgcacaagg tgcaggacca agaaaccctg cctgccgctc tgctgcaggt ccacctggaa 420 tctgagcagt ga 432 <210> 40 <211> 432 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding MERS ORF8b protein <400> 40 augcccauuc cuccacugag aaagaugcuc ggcaucggcg gcgacagaac cgagaagcug 60 aucccuggca uggaacugag caacuggcug ccuggcggca ccagcacaac acuggaacug 120 gauccuaagc agcacagcca cagcggccug cugagaaugg ccagcuuugg cagcaugaag 180 auggccccuc ugaugcugcu gcagcugcuc ggaagaggca cccugacaau gauccagcug 240 cugcuccaca acagcagacc cgugcugagc uuccugaaaa ccagcacacu gagaggccug 300 gaagccaucg ugaaccaucu gcaagagccc cuggcucagg ccgagacacu gccugaucug 360 gugcacaagg ugcaggacca agaaacccug ccugccgcuc ugcugcaggu ccaccuggaa 420 ucugagcagu ga 432 <210> 41 <211> 131 <212> PRT <213> Kaposi's sarcoma-associated herpesvirus <400> 41 Met Ala Ala Pro Arg Gly Arg Pro Lys Lys Asp Leu Thr Met Glu Asp 1 5 10 15 Leu Thr Ala Lys Ile Ser Gln Leu Thr Val Glu Asn Arg Glu Leu Arg 20 25 30 Lys Ala Leu Gly Ser Thr Ala Asp Pro Arg Asp Arg Pro Leu Thr Ala 35 40 45 Thr Glu Lys Glu Ala Gln Leu Thr Ala Thr Val Gly Ala Leu Ser Ala 50 55 60 Ala Ala Ala Lys Lys Ile Glu Ala Arg Val Arg Thr Ile Phe Ser Lys 65 70 75 80 Val Val Thr Gln Lys Gln Val Asp Asp Ala Leu Lys Gly Leu Ser Leu 85 90 95 Arg Ile Asp Val Cys Met Ser Asp Gly Gly Thr Ala Lys Pro Pro Pro 100 105 110 Gly Ala Asn Asn Arg Arg Arg Arg Gly Ala Ser Thr Thr Arg Ala Gly 115 120 125 Val Asp Asp 130 <210> 42 <211> 393 <212> DNA <213> Kaposi's sarcoma-associated herpesvirus <400> 42 atggccgcgc ccaggggcag acccaaaaag gaccttacga tggaagacct aaccgcaaag 60 ataagccaat tgactgtgga gaatcgggag cttcggaaag cactgggatc cactgccgat 120 ccgagagatc ggcctctgac ggccaccgag aaggaagcgc agcttaccgc tactgtgggt 180 gcactgagtg cggcggccgc taagaaaatc gaagccaggg tcaggacaat attcagcaag 240 gttgtaacac aaaagcaagt ggacgatgcc ctgaagggac tttcgcttag aatcgacgtc 300 tgcatgtcag acgggggcac cgctaaaccg cctcctggtg ccaataacag gcgacgaaga 360 ggagcctcga caacacgggc gggggttgat gac 393 <210> 43 <211> 393 <212> RNA <213> Kaposi's sarcoma-associated herpesvirus <400> 43 auggccgcgc ccaggggcag acccaaaaag gaccuuacga uggaagaccu aaccgcaaag 60 auaagccaau ugacugugga gaaucgggag cuucggaaag cacugggauc cacugccgau 120 ccgagagauc ggccucugac ggccaccgag aaggaagcgc agcuuaccgc uacugugggu 180 gcacugagug cggcggccgc uaagaaaauc gaagccaggg ucaggacaau auucagcaag 240 guuguaacac aaaagcaagu ggacgaugcc cugaagggac uuucgcuuag aaucgacguc 300 ugcaugucag acgggggcac cgcuaaaccg ccuccuggug ccaauaacag gcgacgaaga 360 ggagccucga caacacgggc ggggguugau gac 393 <210> 44 <211> 396 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding KSHV ORF52 protein <400> 44 atggctgctc ctagaggcag acccaagaaa gacctgacca tggaagatct gaccgccaag 60 atcagccagc tgaccgtgga aaacagagag ctgagaaagg ccctgggcag caccgccgat 120 cctagagata gacctctgac agccaccgag aaagaggccc agctgacagc tacagtggga 180 gccctttctg ccgccgctgc caagaaaatt gaagccagag tgcggaccat cttcagcaag 240 gtggtcaccc agaaacaggt ggacgatgcc ctgaagggcc tgagcctgag aatcgacgtg 300 tgtatgtctg acggcggcac cgccaaacct ccacctggcg ctaacaacag aagaagaaga 360 ggcgccagca ccaccagagc tggcgtggac gattga 396 <210> 45 <211> 396 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding KSHV ORF52 protein <400> 45 auggcugcuc cuagaggcag acccaagaaa gaccugacca uggaagaucu gaccgccaag 60 aucagccagc ugaccgugga aaacagagag cugagaaagg cccugggcag caccgccgau 120 ccuagagaua gaccucugac agccaccgag aaagaggccc agcugacagc uacaguggga 180 gcccuuucug ccgccgcugc caagaaaauu gaagccagag ugcggaccau cuucagcaag 240 guggucaccc agaaacaggu ggacgaugcc cugaagggcc ugagccugag aaucgacgug 300 uguaugucug acggcggcac cgccaaaccu ccaccuggcg cuaacaacag aagaagaaga 360 ggcgccagca ccaccagagc uggcguggac gauuga 396 <210> 46 <211> 340 <212> PRT <213> Ebola virus <400> 46 Met Thr Thr Arg Thr Lys Gly Arg Gly His Thr Ala Ala Thr Thr Gln 1 5 10 15 Asn Asp Arg Met Pro Gly Pro Glu Leu Ser Gly Trp Ile Ser Glu Gln 20 25 30 Leu Met Thr Gly Arg Ile Pro Val Ser Asp Ile Phe Cys Asp Ile Glu 35 40 45 Asn Asn Pro Gly Leu Cys Tyr Ala Ser Gln Met Gln Gln Thr Lys Pro 50 55 60 Asn Pro Lys Thr Arg Asn Ser Gln Thr Gln Thr Asp Pro Ile Cys Asn 65 70 75 80 His Ser Phe Glu Glu Val Val Gln Thr Leu Ala Ser Leu Ala Thr Val 85 90 95 Val Gln Gln Gln Thr Ile Ala Ser Glu Ser Leu Glu Gln Arg Ile Thr 100 105 110 Ser Leu Glu Asn Gly Leu Lys Pro Val Tyr Asp Met Ala Lys Thr Ile 115 120 125 Ser Ser Leu Asn Arg Val Cys Ala Glu Met Val Ala Lys Tyr Asp Leu 130 135 140 Leu Val Met Thr Thr Gly Arg Ala Thr Ala Thr Ala Ala Ala Thr Glu 145 150 155 160 Ala Tyr Trp Ala Glu His Gly Gln Pro Pro Pro Gly Pro Ser Leu Tyr 165 170 175 Glu Glu Ser Ala Ile Arg Gly Lys Ile Glu Ser Arg Asp Glu Thr Val 180 185 190 Pro Gln Ser Val Arg Glu Ala Phe Asn Asn Leu Asn Ser Thr Thr Ser 195 200 205 Leu Thr Glu Glu Asn Phe Gly Lys Pro Asp Ile Ser Ala Lys Asp Leu 210 215 220 Arg Asn Ile Met Tyr Asp His Leu Pro Gly Phe Gly Thr Ala Phe His 225 230 235 240 Gln Leu Val Gln Val Ile Cys Lys Leu Gly Lys Asp Ser Asn Ser Leu 245 250 255 Asp Ile Ile His Ala Glu Phe Gln Ala Ser Leu Ala Glu Gly Asp Ser 260 265 270 Pro Gln Cys Ala Leu Ile Gln Ile Thr Lys Arg Val Pro Ile Phe Gln 275 280 285 Asp Ala Ala Pro Pro Val Ile His Ile Arg Ser Arg Gly Asp Ile Pro 290 295 300 Arg Ala Cys Gln Lys Ser Leu Arg Pro Val Pro Pro Ser Pro Lys Ile 305 310 315 320 Asp Arg Gly Trp Val Cys Val Phe Gln Leu Gln Asp Gly Lys Thr Leu 325 330 335 Gly Leu Lys Ile 340 <210> 47 <211> 1020 <212> DNA <213> Ebola virus <400> 47 atgacaacta gaacaaaggg caggggccat actgcggcca cgactcaaaa cgacagaatg 60 ccaggccctg agctttcggg ctggatctct gagcagctaa tgaccggaag aattcctgta 120 agcgacatct tctgtgatat tgagaacaat ccaggattat gctacgcatc ccaaatgcaa 180 caaacgaagc caaacccgaa gacgcgcaac agtcaaaccc aaacggaccc aatttgcaat 240 catagttttg aggaggtagt acaaacattg gcttcattgg ctactgttgt gcaacaacaa 300 accatcgcat cagaatcatt agaacaacgc attacgagtc ttgagaatgg tctaaagcca 360 gtttatgata tggcaaaaac aatctcctca ttgaacaggg tttgtgctga gatggttgca 420 aaatatgatc ttctggtgat gacaaccggt cgggcaacag caaccgctgc ggcaactgag 480 gcttattggg ccgaacatgg tcaaccacca cctggaccat cactttatga agaaagtgcg 540 attcggggta agattgaatc tagagatgag accgtccctc aaagtgttag ggaggcattc 600 aacaatctaa acagtaccac ttcactaact gaggaaaatt ttgggaaacc tgacatttcg 660 gcaaaggatt tgagaaacat tatgtatgat cacttgcctg gttttggaac tgctttccac 720 caattagtac aagtgatttg taaattggga aaagatagca actcattgga catcattcat 780 gctgagttcc aggccagcct ggctgaagga gactctcctc aatgtgccct aattcaaatt 840 acaaaaagag ttccaatctt ccaagatgct gctccacctg tcatccacat ccgctctcga 900 ggtgacattc cccgagcttg ccagaaaagc ttgcgtccag tcccaccatc gcccaagatt 960 gatcgaggtt gggtatgtgt ttttcagctt caagatggta aaacacttgg actcaaaatt 1020 1020 <210> 48 <211> 1020 <212> RNA <213> Ebola virus <400> 48 augacaacua gaacaaaggg caggggccau acugcggcca cgacucaaaa cgacagaaug 60 ccaggcccug agcuuucggg cuggaucucu gagcagcuaa ugaccggaag aauuccugua 120 agcgacaucu ucugugauau ugagaacaau ccaggauuau gcuacgcauc ccaaaugcaa 180 caaacgaagc caaacccgaa gacgcgcaac agucaaaccc aaacggaccc aauuugcaau 240 cauaguuuug aggagguagu acaaacauug gcuucauugg cuacuguugu gcaacaacaa 300 accaucgcau cagaaucauu agaacaacgc auuacgaguc uugagaaugg ucuaaagcca 360 guuuaugaua uggcaaaaac aaucuccuca uugaacaggg uuugugcuga gaugguugca 420 aaauaugauc uucuggugau gacaaccggu cgggcaacag caaccgcugc ggcaacugag 480 gcuuauuggg ccgaacaugg ucaaccacca ccuggaccau cacuuuauga agaaagugcg 540 auucggggua agauugaauc uagagaugag accgucccuc aaaguguuag ggaggcauuc 600 aacaaucuaa acaguaccac uucacuaacu gaggaaaauu uugggaaacc ugacauuucg 660 gcaaaggauu ugagaaacau uauguaugau cacuugccug guuuuggaac ugcuuuccac 720 caauuaguac aagugauuug uaaauuggga aaagauagca acucauugga caucauucau 780 gcugaguucc aggccagccu ggcugaagga gacucuccuc aaugugcccu aauucaaauu 840 acaaaaagag uuccaaucuu ccaagaugcu gcuccaccug ucauccacau ccgcucucga 900 ggugacauuc cccgagcuug ccagaaaagc uugcguccag ucccaccauc gcccaagauu 960 gaucgagguu ggguaugugu uuuucagcuu caagauggua aaacacuugg acucaaaauu 1020 1020 <210> 49 <211> 1023 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding Ebola VP35 protein <400> 49 atgaccacca ggaccaaagg cagaggacac accgccgcca ccacacagaa cgacagaatg 60 cctggacctg agctgagcgg ctggatctct gagcagctga tgacaggcag aatccccgtg 120 tccgacatct tctgcgacat cgagaacaac cccggcctgt gttacgccag ccagatgcag 180 cagaccaagc ctaatcctaa gacacggaac agccagacac agacagaccc catctgcaac 240 cacagcttcg aggaagtggt gcagacactg gccagcctgg ctacagttgt gcagcagcag 300 acaatcgcca gcgagagcct ggaacagaga atcaccagcc tggaaaacgg cctgaagcct 360 gtgtacgaca tggccaagac catcagctcc ctgaacagag tgtgcgccga gatggtggcc 420 aaatacgacc tgctcgtgat gaccaccggc agagccacag ctacagccgc tgccacagaa 480 gcctattggg ccgaacatgg acagcctcca cctggaccta gcctgtacga ggaatctgcc 540 atccggggca agatcgagag cagggatgag acagtgcccc agtctgtgcg cgaggccttc 600 aacaacctga acagcaccac aagcctgacc gaggaaaact tcggcaagcc cgacatcagc 660 gccaaggacc tgcggaacat tatgtacgac catctgcctg gcttcggcac cgccttccat 720 cagctggtgc aagtgatctg caagctgggc aaagacagca acagcctgga catcatccac 780 gccgagtttc aggcctctct ggccgaaggc gattctcctc agtgtgccct gatccagatc 840 accaagcggg tgcccatctt ccaggatgct gcccctcctg tgatccacat cagaagcaga 900 ggcgacatcc ccagagcctg ccagaaatct ctcagacccg tgcctccatc tcctaagatc 960 gacagaggct gggtctgcgt gttccagctg caagatggca agaccctggg cctgaagatc 1020 tga 1023 <210> 50 <211> 1023 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding Ebola VP35 protein <400> 50 augaccacca ggaccaaagg cagaggacac accgccgcca ccacacagaa cgacagaaug 60 ccuggaccug agcugagcgg cuggaucucu gagcagcuga ugacaggcag aauccccgug 120 uccgacaucu ucugcgacau cgagaacaac cccggccugu guuacgccag ccagaugcag 180 cagaccaagc cuaauccuaa gacacggaac agccagacac agacagaccc caucugcaac 240 cacagcuucg aggaaguggu gcagacacug gccagccugg cuacaguugu gcagcagcag 300 acaaucgcca gcgagagccu ggaacagaga aucaccagcc uggaaaacgg ccugaagccu 360 guguacgaca uggccaagac caucagcucc cugaacagag ugugcgccga gaugguggcc 420 aaauacgacc ugcucgugau gaccaccggc agagccacag cuacagccgc ugccacagaa 480 gccuauuggg ccgaacaugg acagccucca ccuggaccua gccuguacga ggaaucugcc 540 auccggggca agaucgagag cagggaugag acagugcccc agucugugcg cgaggccuuc 600 aacaaccuga acagcaccac aagccugacc gaggaaaacu ucggcaagcc cgacaucagc 660 gccaaggacc ugcggaacau uauguacgac caucugccug gcuucggcac cgccuuccau 720 cagcuggugc aagugaucug caagcugggc aaagacagca acagccugga caucauccac 780 gccgaguuuc aggccucucu ggccgaaggc gauucuccuc agugugcccu gauccagauc 840 accaagcggg ugcccaucuu ccaggaugcu gccccuccug ugauccacau cagaagcaga 900 ggcgacaucc ccagagccug ccagaaaucu cucagacccg ugccuccauc uccuaagauc 960 gacagaggcu gggucugcgu guuccagcug caagauggca agacccuggg ccugaagauc 1020 uga 1023 <210> 51 <211> 156 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <220> <221> MISC_FEATURE <222> (23) <223> X is a stop codon <220> <221> MISC_FEATURE <222> (57) <223> X is a stop codon <220> <221> MISC_FEATURE <222> (79) <223> X is a stop codon <220> <221> MISC_FEATURE <222> (119) <223> X is a stop codon <220> <221> MISC_FEATURE <222> (156) <223> X is a stop codon <400> 51 Met Met Pro Thr Ile Phe Phe Ala Gly Ile Leu Ile Val Thr Thr Ile 1 5 10 15 Val Tyr Leu Thr Ile Val Xaa Leu Leu Gln Leu Ser Leu Leu Gln Val 20 25 30 Met Ala Gln Gln Val Leu Phe Leu Asn Met Thr Thr Arg Leu Val Val 35 40 45 Ile Leu Lys Asn Gly Asn Leu Glu Xaa Lys Thr Val Leu Tyr Tyr Thr 50 55 60 Val Thr Ser Leu Gln Thr Ile Thr Ser Cys Thr Gln Leu Asn Xaa Val 65 70 75 80 Gln Thr Leu Val Leu Asn Met Leu Pro Ser Ser Ser Thr Ile Lys Leu 85 90 95 Leu Met Ser Leu Lys Asn Met Ser Lys Phe Thr Gln Ser Thr Val His 100 105 110 Pro Glu Leu Leu Ile Gln Xaa Trp Asn Gln Phe Met Met Asn Arg Arg 115 120 125 Arg Leu Leu Ala Cys Leu Cys Lys His Lys Leu Met Ser Thr Asn Leu 130 135 140 Cys Thr His Ser Phe Arg Lys Arg Gln Val Arg Xaa 145 150 155 <210> 52 <211> 56 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 52 Met Met Pro Thr Ile Phe Phe Ala Gly Ile Leu Ile Val Thr Thr Ile 1 5 10 15 Val Tyr Leu Thr Ile Val Gln Leu Leu Gln Leu Ser Leu Leu Gln Val 20 25 30 Met Ala Gln Gln Val Leu Phe Leu Asn Met Thr Thr Arg Leu Val Val 35 40 45 Ile Leu Lys Asn Gly Asn Leu Glu 50 55 <210> 53 <211> 168 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 53 atgatgccaa ctattttctt tgctggcata ctaattgtta cgactattgt ataccttaca 60 atagtgcaac ttcttcaatt gtcattactt caggtgatgg cacaacaagt cctatttctg 120 aacatgacta ccagattggt ggttatactg aaaaatggga atctggag 168 <210> 54 <211> 168 <212> RNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 54 augaugccaa cuauuuucuu ugcuggcaua cuaauuguua cgacuauugu auaccuuaca 60 auagugcaac uucuucaauu gucauuacuu caggugaugg cacaacaagu ccuauuucug 120 aacaugacua ccagauuggu gguuauacug aaaaauggga aucuggag 168 <210> 55 <211> 171 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding SARS-CoV-2 ORF3b*57 protein <400> 55 atgatgccga ccatcttctt cgccggcatc ctgatcgtga ccaccatcgt gtacctgacc 60 atcgtgcagc tgctgcagct cagcctgctg caagtgatgg ctcagcaggt cctgttcctg 120 aatatgacca ccagactggt cgtgatcctg aagaacggca acctggaatg a 171 <210> 56 <211> 171 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding SARS-CoV-2 ORF3b*57 protein <400> 56 augaugccga ccaucuucuu cgccggcauc cugaucguga ccaccaucgu guaccugacc 60 aucgugcagc ugcugcagcu cagccugcug caagugaugg cucagcaggu ccuguuccug 120 aauaugacca ccagacuggu cgugauccug aagaacggca accuggaaug a 171 <210> 57 <211> 78 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 57 Met Met Pro Thr Ile Phe Phe Ala Gly Ile Leu Ile Val Thr Thr Ile 1 5 10 15 Val Tyr Leu Thr Ile Val Gln Leu Leu Gln Leu Ser Leu Leu Gln Val 20 25 30 Met Ala Gln Gln Val Leu Phe Leu Asn Met Thr Thr Arg Leu Val Val 35 40 45 Ile Leu Lys Asn Gly Asn Leu Glu Leu Lys Thr Val Leu Tyr Tyr Thr 50 55 60 Val Thr Ser Leu Gln Thr Ile Thr Ser Cys Thr Gln Leu Asn 65 70 75 <210> 58 <211> 234 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 58 atgatgccaa ctattttctt tgctggcata ctaattgtta cgactattgt ataccttaca 60 atagtgcaac ttcttcaatt gtcattactt caggtgatgg cacaacaagt cctatttctg 120 aacatgacta ccagattggt ggttatactg aaaaatggga atctggagtt aaagactgtg 180 ttgtattaca cagttacttc acttcagact attaccagct gtactcaact caat 234 <210> 59 <211> 234 <212> RNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 59 augaugccaa cuauuuucuu ugcuggcaua cuaauuguua cgacuauugu auaccuuaca 60 auagugcaac uucuucaauu gucauuacuu caggugaugg cacaacaagu ccuauuucug 120 aacaugacua ccagauuggu gguuauacug aaaaauggga aucuggaguu aaagacugug 180 uuguauuaca caguuacuuc acuucagacu auuaccagcu guacucaacu caau 234 <210> 60 <211> 237 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding SARS-Cov-2 ORF3b*79 protein <400> 60 atgatgccga ccatcttctt cgccggcatc ctgatcgtga ccaccatcgt gtacctgacc 60 atcgtgcagc tgctgcagct cagcctgctg caagtgatgg ctcagcaggt cctgttcctg 120 aatatgacca ccagactggt cgtgatcctg aagaacggca acctggaact gaaaaccgtg 180 ctgtactaca ccgtgaccag cctgcagacc atcaccagct gcacccagct gaactga 237 <210> 61 <211> 237 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding SARS-CoV-2 ORF3b*79 protein <400> 61 augaugccga ccaucuucuu cgccggcauc cugaucguga ccaccaucgu guaccugacc 60 aucgugcagc ugcugcagcu cagccugcug caagugaugg cucagcaggu ccuguuccug 120 aauaugacca ccagacuggu cgugauccug aagaacggca accuggaacu gaaaaccgug 180 cuguacuaca ccgugaccag ccugcagacc aucaccagcu gcacccagcu gaacuga 237 <210> 62 <211> 56 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 62 Met Met Pro Thr Ile Phe Phe Ala Gly Ile Leu Ile Val Thr Thr Ile 1 5 10 15 Val Tyr Leu Thr Ile Val Gln Met Leu Gln Leu Ser Leu Leu Gln Val 20 25 30 Met Ala Gln Gln Val Leu Phe Leu Asn Met Thr Thr Arg Leu Val Val 35 40 45 Ile Leu Lys Asn Gly Asn Leu Glu 50 55 <210> 63 <211> 171 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 63 atgatgccaa ctattttctt tgctggcata ctaattgtta cgactattgt ataccttaca 60 atagtgcaaa tgcttcaatt gtcattactt caggtgatgg cacaacaagt cctatttctg 120 aacatgacta ccagattggt ggttatactg aaaaatggga atctggagta a 171 <210> 64 <211> 171 <212> RNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 64 augaugccaa cuauuuucuu ugcuggcaua cuaauuguua cgacuauugu auaccuuaca 60 auagugcaaa ugcuucaauu gucauuacuu caggugaugg cacaacaagu ccuauuucug 120 aacaugacua ccagauuggu gguuauacug aaaaauggga aucuggagua a 171 <210> 65 <211> 171 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding SARS-CoV-2 ORF3b*57 protein <400> 65 atgatgccga ccatcttctt cgccggcatc ctgatcgtga ccaccatcgt gtacctgacc 60 atcgtgcaga tgctgcagct gagcctgctg caagtgatgg cccagcaggt cctgttcctg 120 aatatgacca ccagactggt cgtgatcctg aagaacggca acctggaatg a 171 <210> 66 <211> 171 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding SARS-CoV-2 ORF3b*57 protein <400> 66 augaugccga ccaucuucuu cgccggcauc cugaucguga ccaccaucgu guaccugacc 60 aucgugcaga ugcugcagcu gagccugcug caagugaugg cccagcaggu ccuguuccug 120 aauaugacca ccagacuggu cgugauccug aagaacggca accuggaaug a 171 <210> 67 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> 26S promoter <400> 67 gggcccctat aactctctac ggctaacctg aatggactac gacat 45 <210> 68 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> P2A spacer sequence <400> 68 Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn 1 5 10 15 Pro Gly Pro <210> 69 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> T2A spacer sequence <400> 69 Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp Val Glu Ser 1 5 10 15 Asn Pro Gly Pro 20 <210> 70 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> F2A spacer sequence <400> 70 Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val 1 5 10 15 Glu Ser Asn Pro Gly Pro 20 <210> 71 <211> 6 <212> PRT <213> Homo sapiens <220> <221> MISC_FEATURE <222> (2) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (5) <223> Xaa can be any naturally occurring amino acid <400> 71 Arg Xaa Arg Lys Xaa Arg 1 5 <210> 72 <211> 6 <212> PRT <213> Homo sapiens <400> 72 Arg Arg Arg Arg Arg Arg 1 5 <210> 73 <211> 27 <212> PRT <213> Artificial Sequence <220> <223> Furin/T2A spacer sequence <400> 73 Arg Arg Arg Arg Arg Arg Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu 1 5 10 15 Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro 20 25 <210> 74 <211> 461 <212> DNA <213> Foot-and-mouth disease virus <400> 74 agcaggtttc cccaactgac acaaaacgtg caacttgaaa ctccgcctgg tctttccagg 60 tctagagggg taacactttg tactgcgttt ggctccacgc tcgatccact ggcgagtgtt 120 agtaacagca ctgttgcttc gtagcggagc atgacggccg tgggaactcc tccttggtaa 180 caaggaccca cggggccaaa agccacgccc acacgggccc gtcatgtgtg caaccccagc 240 acggcgactt tactgcgaaa cccactttaa agtgacattg aaactggtac ccacacactg 300 gtgacaggct aaggatgccc ttcaggtacc ccgaggtaac acgcgacact cgggatctga 360 gaaggggact ggggcttcta taaaagcgct cggtttaaaa agcttctatg cctgaatagg 420 tgaccggagg tcggcacctt tcctttgcaa ttactgacca c 461 <210> 75 <211> 551 <212> DNA <213> Encephalomyocarditis virus <400> 75 cgttactggc cgaagccgct tggaataagg ccggtgtgcg tttgtctata tgttattttc 60 caccatattg ccgtcttttg gcaatgtgag ggcccggaaa cctggccctg tcttcttgac 120 gagcattcct aggggtcttt cccctctcgc caaaggaatg caaggtctgt tgaatgtcgt 180 gaaggaagca gttcctctgg aagcttcttg aagacaaaca acgtctgtag cgaccctttg 240 caggcagcgg aaccccccac ctggcgacag gtgcctctgc ggccaaaagc cacgtgtata 300 agatacacct gcaaaggcgg cacaacccca gtgccacgtt gtgagttgga tagttgtgga 360 aagagtcaaa tggctcccct caagcgtatt caacaagggg ctgaaggatg cccagaaggt 420 accccattgt atgggatctg atctggggcc tcggtgcaca tgcttttcat gtgtttagtc 480 gaggttaaaa aacgtctagg ccccccgaac cacggggacg tggttttcct ttgaaaaaca 540 cgatgataat a 551 <210> 76 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Flexible linker sequence <400> 76 ggaggtggcg ggtccggggg cgggggtagc ggtggcgggg gctcc 45 <210> 77 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Flexible linker sequence <400> 77 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 1 5 10 15 <210> 78 <211> 535 <212> PRT <213> Unknown <220> <223> Non-structural protein 1 <400> 78 Met Glu Lys Val His Val Asp Ile Glu Glu Asp Ser Pro Phe Leu Arg 1 5 10 15 Ala Leu Gln Arg Ser Phe Pro Gln Phe Glu Val Glu Ala Lys Gln Val 20 25 30 Thr Asp Asn Asp His Ala Asn Ala Arg Ala Phe Ser His Leu Ala Ser 35 40 45 Lys Leu Ile Glu Thr Glu Val Asp Pro Ser Asp Thr Ile Leu Asp Ile 50 55 60 Gly Ser Ala Pro Ala Arg Arg Met Tyr Ser Lys His Lys Tyr His Cys 65 70 75 80 Ile Cys Pro Met Arg Cys Ala Glu Asp Pro Asp Arg Leu Tyr Lys Tyr 85 90 95 Ala Thr Lys Leu Lys Lys Asn Cys Lys Glu Ile Thr Asp Lys Glu Leu 100 105 110 Asp Lys Lys Met Lys Glu Leu Ala Ala Val Met Ser Asp Pro Asp Leu 115 120 125 Glu Thr Glu Thr Met Cys Leu His Asp Asp Glu Ser Cys Arg Tyr Glu 130 135 140 Gly Gln Val Ala Val Tyr Gln Asp Val Tyr Ala Val Asp Gly Pro Thr 145 150 155 160 Ser Leu Tyr His Gln Ala Asn Lys Gly Val Arg Val Ala Tyr Trp Ile 165 170 175 Gly Phe Asp Thr Thr Pro Phe Met Phe Lys Asn Leu Ala Gly Ala Tyr 180 185 190 Pro Ser Tyr Ser Thr Asn Trp Ala Asp Glu Thr Val Leu Thr Ala Arg 195 200 205 Asn Ile Gly Leu Cys Ser Ser Asp Val Met Glu Arg Ser Arg Arg Gly 210 215 220 Met Ser Ile Leu Arg Lys Lys Tyr Leu Lys Pro Ser Asn Asn Val Leu 225 230 235 240 Phe Ser Val Gly Ser Thr Ile Tyr His Glu Lys Arg Asp Leu Leu Arg 245 250 255 Ser Trp His Leu Pro Ser Val Phe His Leu Arg Gly Lys Gln Asn Tyr 260 265 270 Thr Cys Arg Cys Glu Thr Ile Val Ser Cys Asp Gly Tyr Val Val Lys 275 280 285 Arg Ile Ala Ile Ser Pro Gly Leu Tyr Gly Lys Pro Ser Gly Tyr Ala 290 295 300 Ala Thr Met His Arg Glu Gly Phe Leu Cys Cys Lys Val Thr Asp Thr 305 310 315 320 Leu Asn Gly Glu Arg Val Ser Phe Pro Val Cys Thr Tyr Val Pro Ala 325 330 335 Thr Leu Cys Asp Gln Met Thr Gly Ile Leu Ala Thr Asp Val Ser Ala 340 345 350 Asp Asp Ala Gln Lys Leu Leu Val Gly Leu Asn Gln Arg Ile Val Val 355 360 365 Asn Gly Arg Thr Gln Arg Asn Thr Asn Thr Met Lys Asn Tyr Leu Leu 370 375 380 Pro Val Val Ala Gln Ala Phe Ala Arg Trp Ala Lys Glu Tyr Lys Glu 385 390 395 400 Asp Gln Glu Asp Glu Arg Pro Leu Gly Leu Arg Asp Arg Gln Leu Val 405 410 415 Met Gly Cys Cys Trp Ala Phe Arg Arg His Lys Ile Thr Ser Ile Tyr 420 425 430 Lys Arg Pro Asp Thr Gln Thr Ile Ile Lys Val Asn Ser Asp Phe His 435 440 445 Ser Phe Val Leu Pro Arg Ile Gly Ser Asn Thr Leu Glu Ile Gly Leu 450 455 460 Arg Thr Arg Ile Arg Lys Met Leu Glu Glu His Lys Glu Pro Ser Pro 465 470 475 480 Leu Ile Thr Ala Glu Asp Val Gln Glu Ala Lys Cys Ala Ala Asp Glu 485 490 495 Ala Lys Glu Val Arg Glu Ala Glu Glu Leu Arg Ala Ala Leu Pro Pro 500 505 510 Leu Ala Ala Asp Val Glu Glu Pro Thr Leu Glu Ala Asp Val Asp Leu 515 520 525 Met Leu Gln Glu Ala Gly Ala 530 535 <210> 79 <211> 1605 <212> DNA <213> Unknown <220> <223> Non-structural protein 1 <400> 79 atggagaaag ttcacgttga catcgaggaa gacagcccat tcctcagagc tttgcagcgg 60 agcttcccgc agtttgaggt agaagccaag caggtcactg ataatgacca tgctaatgcc 120 agagcgtttt cgcatctggc ttcaaaactg atcgaaacgg aggtggaccc atccgacacg 180 atccttgaca ttggaagtgc gcccgcccgc agaatgtatt ctaagcacaa gtatcattgt 240 atctgtccga tgagatgtgc ggaagatccg gacagattgt ataagtatgc aactaagctg 300 aagaaaaact gtaaggaaat aactgataag gaattggaca agaaaatgaa ggagctggcc 360 gccgtcatga gcgaccctga cctggaaact gagactatgt gcctccacga cgacgagtcg 420 tgtcgctacg aagggcaagt cgctgtttac caggatgtat acgcggttga cggaccgaca 480 agtctctatc accaagccaa taagggagtt agagtcgcct actggatagg ctttgacacc 540 acccctttta tgtttaagaa cttggctgga gcatatccat catactctac caactgggcc 600 gacgaaaccg tgttaacggc tcgtaacata ggcctatgca gctctgacgt tatggagcgg 660 tcacgtagag ggatgtccat tcttagaaag aagtatttga aaccatccaa caatgttcta 720 ttctctgttg gctcgaccat ctaccacgag aagagggact tactgaggag ctggcacctg 780 ccgtctgtat ttcacttacg tggcaagcaa aattacacat gtcggtgtga gactatagtt 840 agttgcgacg ggtacgtcgt taaaagaata gctatcagtc caggcctgta tgggaagcct 900 tcaggctatg ctgctacgat gcaccgcgag ggattcttgt gctgcaaagt gacagacaca 960 ttgaacgggg agagggtctc ttttcccgtg tgcacgtatg tgccagctac attgtgtgac 1020 caaatgactg gcatactggc aacagatgtc agtgcggacg acgcgcaaaa actgctggtt 1080 gggctcaacc agcgtatagt cgtcaacggt cgcacccaga gaaacaccaa taccatgaaa 1140 aattaccttt tgcccgtagt ggcccaggca tttgctaggt gggcaaagga atataaggaa 1200 gatcaagaag atgaaaggcc actaggacta cgagatagac agttagtcat ggggtgttgt 1260 tgggctttta gaaggcacaa gataacatct atttataagc gcccggatac ccaaaccatc 1320 atcaaagtga acagcgattt ccactcattc gtgctgccca ggataggcag taacacattg 1380 gagatcgggc tgagaacaag aatcaggaaa atgttagagg agcacaagga gccgtcacct 1440 ctcattaccg ccgaggacgt acaagaagct aagtgcgcag ccgatgaggc taaggaggtg 1500 cgtgaagccg aggagttgcg cgcagctcta ccacctttgg cagctgatgt tgaggagccc 1560 actctggaag ccgatgtcga cttgatgtta caagaggctg gggcc 1605 <210> 80 <211> 1605 <212> RNA <213> Unknown <220> <223> Non-structural protein 1 <400> 80 auggagaaag uucacguuga caucgaggaa gacagcccau uccucagagc uuugcagcgg 60 agcuucccgc aguuugaggu agaagccaag caggucacug auaaugacca ugcuaaugcc 120 agagcguuuu cgcaucuggc uucaaaacug aucgaaacgg agguggaccc auccgacacg 180 auccuugaca uuggaagugc gcccgcccgc agaauguauu cuaagcacaa guaucauugu 240 aucuguccga ugagaugugc ggaagauccg gacagauugu auaaguaugc aacuaagcug 300 aagaaaaacu guaaggaaau aacugauaag gaauuggaca agaaaaugaa ggagcuggcc 360 gccgucauga gcgacccuga ccuggaaacu gagacuaugu gccuccacga cgacgagucg 420 ugucgcuacg aagggcaagu cgcuguuuac caggauguau acgcgguuga cggaccgaca 480 agucucuauc accaagccaa uaagggaguu agagucgccu acuggauagg cuuugacacc 540 accccuuuua uguuuaagaa cuuggcugga gcauauccau cauacucuac caacugggcc 600 gacgaaaccg uguuaacggc ucguaacaua ggccuaugca gcucugacgu uauggagcgg 660 ucacguagag ggauguccau ucuuagaaag aaguauuuga aaccauccaa caauguucua 720 uucucuguug gcucgaccau cuaccacgag aagagggacu uacugaggag cuggcaccug 780 ccgucuguau uucacuuacg uggcaagcaa aauuacacau gucgguguga gacuauaguu 840 aguugcgacg gguacgucgu uaaaagaaua gcuaucaguc caggccugua ugggaagccu 900 ucaggcuaug cugcuacgau gcaccgcgag ggauucuugu gcugcaaagu gacagacaca 960 uugaacgggg agagggucuc uuuucccgug ugcacguaug ugccagcuac auugugugac 1020 caaaugacug gcauacuggc aacagauguc agugcggacg acgcgcaaaa acugcugguu 1080 gggcucaacc agcguauagu cgucaacggu cgcacccaga gaaacaccaa uaccaugaaa 1140 aauuaccuuu ugcccguagu ggcccaggca uuugcuaggu gggcaaagga auauaaggaa 1200 gaucaagaag augaaaggcc acuaggacua cgagauagac aguuagucau gggguguugu 1260 ugggcuuuua gaaggcacaa gauaacaucu auuuauaagc gcccggauac ccaaaccauc 1320 aucaaaguga acagcgauuu ccacucauuc gugcugccca ggauaggcag uaacacauug 1380 gagaucgggc ugagaacaag aaucaggaaa auguuagagg agcacaagga gccgucaccu 1440 cucauuaccg ccgaggacgu acaagaagcu aagugcgcag ccgaugaggc uaaggaggug 1500 cgugaagccg aggaguugcg cgcagcucua ccaccuuugg cagcugaugu ugaggagccc 1560 acucuggaag ccgaugucga cuugauguua caagaggcug gggcc 1605 <210> 81 <211> 794 <212> PRT <213> Unknown <220> <223> Non-structural protein 2 <400> 81 Gly Ser Val Glu Thr Pro Arg Gly Leu Ile Lys Val Thr Ser Tyr Asp 1 5 10 15 Gly Glu Asp Lys Ile Gly Ser Tyr Ala Val Leu Ser Pro Gln Ala Val 20 25 30 Leu Lys Ser Glu Lys Leu Ser Cys Ile His Pro Leu Ala Glu Gln Val 35 40 45 Ile Val Ile Thr His Ser Gly Arg Lys Gly Arg Tyr Ala Val Glu Pro 50 55 60 Tyr His Gly Lys Val Val Val Pro Glu Gly His Ala Ile Pro Val Gln 65 70 75 80 Asp Phe Gln Ala Leu Ser Glu Ser Ala Thr Ile Val Tyr Asn Glu Arg 85 90 95 Glu Phe Val Asn Arg Tyr Leu His His Ile Ala Thr His Gly Gly Ala 100 105 110 Leu Asn Thr Asp Glu Glu Tyr Tyr Lys Thr Val Lys Pro Ser Glu His 115 120 125 Asp Gly Glu Tyr Leu Tyr Asp Ile Asp Arg Lys Gln Cys Val Lys Lys 130 135 140 Glu Leu Val Thr Gly Leu Gly Leu Thr Gly Glu Leu Val Asp Pro Pro 145 150 155 160 Phe His Glu Phe Ala Tyr Glu Ser Leu Arg Thr Arg Pro Ala Ala Pro 165 170 175 Tyr Gln Val Pro Thr Ile Gly Val Tyr Gly Val Pro Gly Ser Gly Lys 180 185 190 Ser Gly Ile Ile Lys Ser Ala Val Thr Lys Lys Asp Leu Val Val Ser 195 200 205 Ala Lys Lys Glu Asn Cys Ala Glu Ile Ile Arg Asp Val Lys Lys Met 210 215 220 Lys Gly Leu Asp Val Asn Ala Arg Thr Val Asp Ser Val Leu Leu Asn 225 230 235 240 Gly Cys Lys His Pro Val Glu Thr Leu Tyr Ile Asp Glu Ala Phe Ala 245 250 255 Cys His Ala Gly Thr Leu Arg Ala Leu Ile Ala Ile Ile Arg Pro Lys 260 265 270 Lys Ala Val Leu Cys Gly Asp Pro Lys Gln Cys Gly Phe Phe Asn Met 275 280 285 Met Cys Leu Lys Val His Phe Asn His Glu Ile Cys Thr Gln Val Phe 290 295 300 His Lys Ser Ile Ser Arg Arg Cys Thr Lys Ser Val Thr Ser Val Val 305 310 315 320 Ser Thr Leu Phe Tyr Asp Lys Lys Met Arg Thr Thr Asn Pro Lys Glu 325 330 335 Thr Lys Ile Val Ile Asp Thr Thr Gly Ser Thr Lys Pro Lys Gln Asp 340 345 350 Asp Leu Ile Leu Thr Cys Phe Arg Gly Trp Val Lys Gln Leu Gln Ile 355 360 365 Asp Tyr Lys Gly Asn Glu Ile Met Thr Ala Ala Ala Ser Gln Gly Leu 370 375 380 Thr Arg Lys Gly Val Tyr Ala Val Arg Tyr Lys Val Asn Glu Asn Pro 385 390 395 400 Leu Tyr Ala Pro Thr Ser Glu His Val Asn Val Leu Leu Thr Arg Thr 405 410 415 Glu Asp Arg Ile Val Trp Lys Thr Leu Ala Gly Asp Pro Trp Ile Lys 420 425 430 Thr Leu Thr Ala Lys Tyr Pro Gly Asn Phe Thr Ala Thr Ile Glu Glu 435 440 445 Trp Gln Ala Glu His Asp Ala Ile Met Arg His Ile Leu Glu Arg Pro 450 455 460 Asp Pro Thr Asp Val Phe Gln Asn Lys Ala Asn Val Cys Trp Ala Lys 465 470 475 480 Ala Leu Val Pro Val Leu Lys Thr Ala Gly Ile Asp Met Thr Thr Glu 485 490 495 Gln Trp Asn Thr Val Asp Tyr Phe Glu Thr Asp Lys Ala His Ser Ala 500 505 510 Glu Ile Val Leu Asn Gln Leu Cys Val Arg Phe Phe Gly Leu Asp Leu 515 520 525 Asp Ser Gly Leu Phe Ser Ala Pro Thr Val Pro Leu Ser Ile Arg Asn 530 535 540 Asn His Trp Asp Asn Ser Pro Ser Pro Asn Met Tyr Gly Leu Asn Lys 545 550 555 560 Glu Val Val Arg Gln Leu Ser Arg Arg Tyr Pro Gln Leu Pro Arg Ala 565 570 575 Val Ala Thr Gly Arg Val Tyr Asp Met Asn Thr Gly Thr Leu Arg Asn 580 585 590 Tyr Asp Pro Arg Ile Asn Leu Val Pro Val Asn Arg Arg Leu Pro His 595 600 605 Ala Leu Val Leu His His Asn Glu His Pro Gln Ser Asp Phe Ser Ser 610 615 620 Phe Val Ser Lys Leu Lys Gly Arg Thr Val Leu Val Val Gly Glu Lys 625 630 635 640 Leu Ser Val Pro Gly Lys Met Val Asp Trp Leu Ser Asp Arg Pro Glu 645 650 655 Ala Thr Phe Arg Ala Arg Leu Asp Leu Gly Ile Pro Gly Asp Val Pro 660 665 670 Lys Tyr Asp Ile Ile Phe Val Asn Val Arg Thr Pro Tyr Lys Tyr His 675 680 685 His Tyr Gln Gln Cys Glu Asp His Ala Ile Lys Leu Ser Met Leu Thr 690 695 700 Lys Lys Ala Cys Leu His Leu Asn Pro Gly Gly Thr Cys Val Ser Ile 705 710 715 720 Gly Tyr Gly Tyr Ala Asp Arg Ala Ser Glu Ser Ile Ile Gly Ala Ile 725 730 735 Ala Arg Gln Phe Lys Phe Ser Arg Val Cys Lys Pro Lys Ser Ser Leu 740 745 750 Glu Glu Thr Glu Val Leu Phe Val Phe Ile Gly Tyr Asp Arg Lys Ala 755 760 765 Arg Thr His Asn Ser Tyr Lys Leu Ser Ser Thr Leu Thr Asn Ile Tyr 770 775 780 Thr Gly Ser Arg Leu His Glu Ala Gly Cys 785 790 <210> 82 <211> 2382 <212> DNA <213> Unknown <220> <223> Non-structural protein 2 <400> 82 ggctcagtgg agacacctcg tggcttgata aaggttacca gctacgatgg cgaggacaag 60 atcggctctt acgctgtgct ttctccgcag gctgtactca agagtgaaaa attatcttgc 120 atccaccctc tcgctgaaca agtcatagtg ataacacact ctggccgaaa agggcgttat 180 gccgtggaac cataccatgg taaagtagtg gtgccagagg gacatgcaat acccgtccag 240 gactttcaag ctctgagtga aagtgccacc attgtgtaca acgaacgtga gttcgtaaac 300 aggtacctgc accatattgc cacacatgga ggagcgctga acactgatga agaatattac 360 aaaactgtca agcccagcga gcacgacggc gaatacctgt acgacatcga caggaaacag 420 tgcgtcaaga aagaactagt cactgggcta gggctcacag gcgagctggt ggatcctccc 480 ttccatgaat tcgcctacga gagtctgaga acacgaccag ccgctcctta ccaagtacca 540 accatagggg tgtatggcgt gccaggatca ggcaagtctg gcatcattaa aagcgcagtc 600 accaaaaaag atctagtggt gagcgccaag aaagaaaact gtgcagaaat tataagggac 660 gtcaagaaaa tgaaagggct ggacgtcaat gccagaactg tggactcagt gctcttgaat 720 ggatgcaaac accccgtaga gaccctgtat attgacgaag cttttgcttg tcatgcaggt 780 actctcagag cgctcatagc cattataaga cctaaaaagg cagtgctctg cggggatccc 840 aaacagtgcg gtttttttaa catgatgtgc ctgaaagtgc attttaacca cgagatttgc 900 acacaagtct tccacaaaag catctctcgc cgttgcacta aatctgtgac ttcggtcgtc 960 tcaaccttgt tttacgacaa aaaaatgaga acgacgaatc cgaaagagac taagattgtg 1020 attgacacta ccggcagtac caaacctaag caggacgatc tcattctcac ttgtttcaga 1080 gggtgggtga agcagttgca aatagattac aaaggcaacg aaataatgac ggcagctgcc 1140 tctcaagggc tgacccgtaa aggtgtgtat gccgttcggt acaaggtgaa tgaaaatcct 1200 ctgtacgcac ccacctcaga acatgtgaac gtcctactga cccgcacgga ggaccgcatc 1260 gtgtggaaaa cactagccgg cgacccatgg ataaaaacac tgactgccaa gtaccctggg 1320 aatttcactg ccacgataga ggagtggcaa gcagagcatg atgccatcat gaggcacatc 1380 ttggagagac cggaccctac cgacgtcttc cagaataagg caaacgtgtg ttgggccaag 1440 gctttagtgc cggtgctgaa gaccgctggc atagacatga ccactgaaca atggaacact 1500 gtggattatt ttgaaacgga caaagctcac tcagcagaga tagtattgaa ccaactatgc 1560 gtgaggttct ttggactcga tctggactcc ggtctatttt ctgcacccac tgttccgtta 1620 tccattagga ataatcactg ggataactcc ccgtcgccta acatgtacgg gctgaataaa 1680 gaagtggtcc gtcagctctc tcgcaggtac ccacaactgc ctcgggcagt tgccactgga 1740 agagtctatg acatgaacac tggtacactg cgcaattatg atccgcgcat aaacctagta 1800 cctgtaaaca gaagactgcc tcatgcttta gtcctccacc ataatgaaca cccacagagt 1860 gacttttctt cattcgtcag caaattgaag ggcagaactg tcctggtggt cggggaaaag 1920 ttgtccgtcc caggcaaaat ggttgactgg ttgtcagacc ggcctgaggc taccttcaga 1980 gctcggctgg atttaggcat cccaggtgat gtgcccaaat atgacataat atttgttaat 2040 gtgaggaccc catataaata ccatcactat cagcagtgtg aagaccatgc cattaagctt 2100 agcatgttga ccaagaaagc ttgtctgcat ctgaatcccg gcggaacctg tgtcagcata 2160 ggttatggtt acgctgacag ggccagcgaa agcatcattg gtgctatagc gcggcagttc 2220 aagttttccc gggtatgcaa accgaaatcc tcacttgaag agacggaagt tctgtttgta 2280 ttcattgggt acgatcgcaa ggcccgtacg cacaattctt acaagctttc atcaaccttg 2340 accaacattt atacaggttc cagactccac gaagccggat gt 2382 <210> 83 <211> 2382 <212> RNA <213> Unknown <220> <223> Non-structural protein 2 <400> 83 ggcucagugg agacaccucg uggcuugaua aagguuacca gcuacgaugg cgaggacaag 60 aucggcucuu acgcugugcu uucuccgcag gcuguacuca agagugaaaa auuaucuugc 120 auccacccuc ucgcugaaca agucauagug auaacacacu cuggccgaaa agggcguuau 180 gccguggaac cauaccaugg uaaaguagug gugccagagg gacaugcaau acccguccag 240 gacuuucaag cucugaguga aagugccacc auuguguaca acgaacguga guucguaaac 300 agguaccugc accauauugc cacacaugga ggagcgcuga acacugauga agaauauuac 360 aaaacuguca agcccagcga gcacgacggc gaauaccugu acgacaucga caggaaacag 420 ugcgucaaga aagaacuagu cacugggcua gggcucacag gcgagcuggu ggauccuccc 480 uuccaugaau ucgccuacga gagucugaga acacgaccag ccgcuccuua ccaaguacca 540 accauagggg uguauggcgu gccaggauca ggcaagucug gcaucauuaa aagcgcaguc 600 accaaaaaag aucuaguggu gagcgccaag aaagaaaacu gugcagaaau uauaagggac 660 gucaagaaaa ugaaagggcu ggacgucaau gccagaacug uggacucagu gcucuugaau 720 ggaugcaaac accccguaga gacccuguau auugacgaag cuuuugcuug ucaugcaggu 780 acucucagag cgcucauagc cauuauaaga ccuaaaaagg cagugcucug cggggauccc 840 aaacagugcg guuuuuuuaa caugaugugc cugaaagugc auuuuaacca cgagauuugc 900 acacaagucu uccacaaaag caucucucgc cguugcacua aaucugugac uucggucguc 960 ucaaccuugu uuuacgacaa aaaaaugaga acgacgaauc cgaaagagac uaagauugug 1020 auugacacua ccggcaguac caaaccuaag caggacgauc ucauucucac uuguuucaga 1080 ggguggguga agcaguugca aauagauuac aaaggcaacg aaauaaugac ggcagcugcc 1140 ucucaagggc ugacccguaa agguguguau gccguucggu acaaggugaa ugaaaauccu 1200 cuguacgcac ccaccucaga acaugugaac guccuacuga cccgcacgga ggaccgcauc 1260 guguggaaaa cacuagccgg cgacccaugg auaaaaacac ugacugccaa guacccuggg 1320 aauuucacug ccacgauaga ggaguggcaa gcagagcaug augccaucau gaggcacauc 1380 uuggagagac cggacccuac cgacgucuuc cagaauaagg caaacgugug uugggccaag 1440 gcuuuagugc cggugcugaa gaccgcuggc auagacauga ccacugaaca auggaacacu 1500 guggauuauu uugaaacgga caaagcucac ucagcagaga uaguauugaa ccaacuaugc 1560 gugagguucu uuggacucga ucuggacucc ggucuauuuu cugcacccac uguuccguua 1620 uccauuagga auaaucacug ggauaacucc ccgucgccua acauguacgg gcugaauaaa 1680 gaaguggucc gucagcucuc ucgcagguac ccacaacugc cucgggcagu ugccacugga 1740 agagucuaug acaugaacac ugguacacug cgcaauuaug auccgcgcau aaaccuagua 1800 ccuguaaaca gaagacugcc ucaugcuuua guccuccacc auaaugaaca cccacagagu 1860 gacuuuucuu cauucgucag caaauugaag ggcagaacug uccugguggu cggggaaaag 1920 uuguccgucc caggcaaaau gguugacugg uugucagacc ggccugaggc uaccuucaga 1980 gcucggcugg auuuaggcau cccaggugau gugcccaaau augacauaau auuuguuaau 2040 gugaggaccc cauauaaaua ccaucacuau cagcagugug aagaccaugc cauuaagcuu 2100 agcauguuga ccaagaaagc uugucugcau cugaaucccg gcggaaccug ugucagcaua 2160 gguuaugguu acgcugacag ggccagcgaa agcaucauug gugcuauagc gcggcaguuc 2220 aaguuuuccc ggguaugcaa accgaaaucc ucacuugaag agacggaagu ucuguuugua 2280 uucauugggu acgaucgcaa ggcccguacg cacaauucuu acaagcuuuc aucaaccuug 2340 accaacauuu auacagguuc cagacuccac gaagccggau gu 2382 <210> 84 <211> 556 <212> PRT <213> Unknown <220> <223> Non-structural protein 3 <400> 84 Ala Pro Ser Tyr His Val Val Arg Gly Asp Ile Ala Thr Ala Thr Glu 1 5 10 15 Gly Val Ile Ile Asn Ala Ala Asn Ser Lys Gly Gln Pro Gly Gly Gly 20 25 30 Val Cys Gly Ala Leu Tyr Lys Lys Phe Pro Glu Ser Phe Asp Leu Gln 35 40 45 Pro Ile Glu Val Gly Lys Ala Arg Leu Val Lys Gly Ala Ala Lys His 50 55 60 Ile Ile His Ala Val Gly Pro Asn Phe Asn Lys Val Ser Glu Val Glu 65 70 75 80 Gly Asp Lys Gln Leu Ala Glu Ala Tyr Glu Ser Ile Ala Lys Ile Val 85 90 95 Asn Asp Asn Asn Tyr Lys Ser Val Ala Ile Pro Leu Leu Ser Thr Gly 100 105 110 Ile Phe Ser Gly Asn Lys Asp Arg Leu Thr Gln Ser Leu Asn His Leu 115 120 125 Leu Thr Ala Leu Asp Thr Thr Asp Ala Asp Val Ala Ile Tyr Cys Arg 130 135 140 Asp Lys Lys Trp Glu Met Thr Leu Lys Glu Ala Val Ala Arg Arg Glu 145 150 155 160 Ala Val Glu Glu Ile Cys Ile Ser Asp Asp Ser Ser Val Thr Glu Pro 165 170 175 Asp Ala Glu Leu Val Arg Val His Pro Lys Ser Ser Leu Ala Gly Arg 180 185 190 Lys Gly Tyr Ser Thr Ser Asp Gly Lys Thr Phe Ser Tyr Leu Glu Gly 195 200 205 Thr Lys Phe His Gln Ala Ala Lys Asp Ile Ala Glu Ile Asn Ala Met 210 215 220 Trp Pro Val Ala Thr Glu Ala Asn Glu Gln Val Cys Met Tyr Ile Leu 225 230 235 240 Gly Glu Ser Met Ser Ser Ile Arg Ser Lys Cys Pro Val Glu Glu Ser 245 250 255 Glu Ala Ser Thr Pro Pro Ser Thr Leu Pro Cys Leu Cys Ile His Ala 260 265 270 Met Thr Pro Glu Arg Val Gln Arg Leu Lys Ala Ser Arg Pro Glu Gln 275 280 285 Ile Thr Val Cys Ser Ser Phe Pro Leu Pro Lys Tyr Arg Ile Thr Gly 290 295 300 Val Gln Lys Ile Gln Cys Ser Gln Pro Ile Leu Phe Ser Pro Lys Val 305 310 315 320 Pro Ala Tyr Ile His Pro Arg Lys Tyr Leu Val Glu Thr Pro Pro Val 325 330 335 Asp Glu Thr Pro Glu Pro Ser Ala Glu Asn Gln Ser Thr Glu Gly Thr 340 345 350 Pro Glu Gln Pro Pro Leu Ile Thr Glu Asp Glu Thr Arg Thr Arg Thr 355 360 365 Pro Glu Pro Ile Ile Ile Glu Glu Glu Glu Glu Asp Ser Ile Ser Leu 370 375 380 Leu Ser Asp Gly Pro Thr His Gln Val Leu Gln Val Glu Ala Asp Ile 385 390 395 400 His Gly Pro Pro Ser Val Ser Ser Ser Ser Trp Ser Ile Pro His Ala 405 410 415 Ser Asp Phe Asp Val Asp Ser Leu Ser Ile Leu Asp Thr Leu Glu Gly 420 425 430 Ala Ser Val Thr Ser Gly Ala Thr Ser Ala Glu Thr Asn Ser Tyr Phe 435 440 445 Ala Lys Ser Met Glu Phe Leu Ala Arg Pro Val Pro Ala Pro Arg Thr 450 455 460 Val Phe Arg Asn Pro Pro His Pro Ala Pro Arg Thr Arg Thr Pro Ser 465 470 475 480 Leu Ala Pro Ser Arg Ala Cys Ser Arg Thr Ser Leu Val Ser Thr Pro 485 490 495 Pro Gly Val Asn Arg Val Ile Thr Arg Glu Glu Leu Glu Ala Leu Thr 500 505 510 Pro Ser Arg Thr Pro Ser Arg Ser Val Ser Arg Thr Ser Leu Val Ser 515 520 525 Asn Pro Pro Gly Val Asn Arg Val Ile Thr Arg Glu Glu Phe Glu Ala 530 535 540 Phe Val Ala Gln Gln Gln Arg Phe Asp Ala Gly Ala 545 550 555 <210> 85 <211> 1671 <212> DNA <213> Unknown <220> <223> Non-structural protein 3 <400> 85 gcaccctcat atcatgtggt gcgaggggat attgccacgg ccaccgaagg agtgattata 60 aatgctgcta acagcaaagg acaacctggc ggaggggtgt gcggagcgct gtataagaaa 120 ttcccggaaa gcttcgattt acagccgatc gaagtaggaa aagcgcgact ggtcaaaggt 180 gcagctaaac atatcattca tgccgtagga ccaaacttca acaaagtttc ggaggttgaa 240 ggtgacaaac agttggcaga ggcttatgag tccatcgcta agattgtcaa cgataacaat 300 tacaagtcag tagcgattcc actgttgtcc accggcatct tttccgggaa caaagatcga 360 ctaacccaat cattgaacca tttgctgaca gctttagaca ccactgatgc agatgtagcc 420 atatactgca gggacaagaa atgggaaatg actctcaagg aagcagtggc taggagagaa 480 gcagtggagg agatatgcat atccgacgac tcttcagtga cagaacctga tgcagagctg 540 gtgagggtgc atccgaagag ttctttggct ggaaggaagg gctacagcac aagcgatggc 600 aaaactttct catatttgga agggaccaag tttcaccagg cggccaagga tatagcagaa 660 attaatgcca tgtggcccgt tgcaacggag gccaatgagc aggtatgcat gtatatcctc 720 ggagaaagca tgagcagtat taggtcgaaa tgccccgtcg aagagtcgga agcctccaca 780 ccacctagca cgctgccttg cttgtgcatc catgccatga ctccagaaag agtacagcgc 840 ctaaaagcct cacgtccaga acaaattact gtgtgctcat cctttccatt gccgaagtat 900 agaatcactg gtgtgcagaa gatccaatgc tcccagccta tattgttctc accgaaagtg 960 cctgcgtata ttcatccaag gaagtatctc gtggaaacac caccggtaga cgagactccg 1020 gagccatcgg cagagaacca atccacagag gggacacctg aacaaccacc acttataacc 1080 gaggatgaga ccaggactag aacgcctgag ccgatcatca tcgaagagga agaagaggat 1140 agcataagtt tgctgtcaga tggcccgacc caccaggtgc tgcaagtcga ggcagacatt 1200 cacgggccgc cctctgtatc tagctcatcc tggtccattc ctcatgcatc cgactttgat 1260 gtggacagtt tatccatact tgacaccctg gagggagcta gcgtgaccag cggggcaacg 1320 tcagccgaga ctaactctta cttcgcaaag agtatggagt ttctggcgcg accggtgcct 1380 gcgcctcgaa cagtattcag gaaccctcca catcccgctc cgcgcacaag aacaccgtca 1440 cttgcaccca gcagggcctg ctcgagaacc agcctagttt ccaccccgcc aggcgtgaat 1500 agggtgatca ctagagagga gctcgaggcg cttaccccgt cacgcactcc tagcaggtcg 1560 gtctcgagaa ccagcctggt ctccaacccg ccaggcgtaa atagggtgat tacaagagag 1620 gagtttgagg cgttcgtagc acaacaacaa tgacggtttg atgcgggtgc a 1671 <210> 86 <211> 1671 <212> RNA <213> Unknown <220> <223> Non-structural protein 3 <400> 86 gcacccucau aucauguggu gcgaggggau auugccacgg ccaccgaagg agugauuaua 60 aaugcugcua acagcaaagg acaaccuggc ggaggggugu gcggagcgcu guauaagaaa 120 uucccggaaa gcuucgauuu acagccgauc gaaguaggaa aagcgcgacu ggucaaaggu 180 gcagcuaaac auaucauuca ugccguagga ccaaacuuca acaaaguuuc ggagguugaa 240 ggugacaaac aguuggcaga ggcuuaugag uccaucgcua agauugucaa cgauaacaau 300 uacaagucag uagcgauucc acuguugucc accggcaucu uuuccgggaa caaagaucga 360 cuaacccaau cauugaacca uuugcugaca gcuuuagaca ccacugaugc agauguagcc 420 auauacugca gggacaagaa augggaaaug acucucaagg aagcaguggc uaggagagaa 480 gcaguggagg agauaugcau auccgacgac ucuucaguga cagaaccuga ugcagagcug 540 gugagggugc auccgaagag uucuuuggcu ggaaggaagg gcuacagcac aagcgauggc 600 aaaacuuucu cauauuugga agggaccaag uuucaccagg cggccaagga uauagcagaa 660 auuaaugcca uguggcccgu ugcaacggag gccaaugagc agguaugcau guauauccuc 720 ggagaaagca ugagcaguau uaggucgaaa ugccccgucg aagagucgga agccuccaca 780 ccaccuagca cgcugccuug cuugugcauc caugccauga cuccagaaag aguacagcgc 840 cuaaaagccu cacguccaga acaaauuacu gugugcucau ccuuuccauu gccgaaguau 900 agaaucacug gugugcagaa gauccaaugc ucccagccua uauuguucuc accgaaagug 960 ccugcguaua uucauccaag gaaguaucuc guggaaacac caccgguaga cgagacuccg 1020 gagccaucgg cagagaacca auccacagag gggacaccug aacaaccacc acuuauaacc 1080 gaggaugaga ccaggacuag aacgccugag ccgaucauca ucgaagagga agaagaggau 1140 agcauaaguu ugcugucaga uggcccgacc caccaggugc ugcaagucga ggcagacauu 1200 cacgggccgc ccucuguauc uagcucaucc ugguccauuc cucaugcauc cgacuuugau 1260 guggacaguu uauccauacu ugacacccug gagggagcua gcgugaccag cggggcaacg 1320 ucagccgaga cuaacucuua cuucgcaaag aguauggagu uucuggcgcg accggugccu 1380 gcgccucgaa caguauucag gaacccucca caucccgcuc cgcgcacaag aacaccguca 1440 cuugcaccca gcagggccug cucgagaacc agccuaguuu ccaccccgcc aggcgugaau 1500 agggugauca cuagagagga gcucgaggcg cuuaccccgu cacgcacucc uagcaggucg 1560 gucucgagaa ccagccuggu cuccaacccg ccaggcguaa auagggugau uacaagagag 1620 gaguuugagg cguucguagc acaacaacaa ugacgguuug augcgggugc a 1671 <210> 87 <211> 607 <212> PRT <213> Unknown <220> <223> Non-structural protein 4 <400> 87 Tyr Ile Phe Ser Ser Asp Thr Gly Gln Gly His Leu Gln Gln Lys Ser 1 5 10 15 Val Arg Gln Thr Val Leu Ser Glu Val Val Leu Glu Arg Thr Glu Leu 20 25 30 Glu Ile Ser Tyr Ala Pro Arg Leu Asp Gln Glu Lys Glu Glu Leu Leu 35 40 45 Arg Lys Lys Leu Gln Leu Asn Pro Thr Pro Ala Asn Arg Ser Arg Tyr 50 55 60 Gln Ser Arg Lys Val Glu Asn Met Lys Ala Ile Thr Ala Arg Arg Ile 65 70 75 80 Leu Gln Gly Leu Gly His Tyr Leu Lys Ala Glu Gly Lys Val Glu Cys 85 90 95 Tyr Arg Thr Leu His Pro Val Pro Leu Tyr Ser Ser Ser Val Asn Arg 100 105 110 Ala Phe Ser Ser Pro Lys Val Ala Val Glu Ala Cys Asn Ala Met Leu 115 120 125 Lys Glu Asn Phe Pro Thr Val Ala Ser Tyr Cys Ile Ile Pro Glu Tyr 130 135 140 Asp Ala Tyr Leu Asp Met Val Asp Gly Ala Ser Cys Cys Leu Asp Thr 145 150 155 160 Ala Ser Phe Cys Pro Ala Lys Leu Arg Ser Phe Pro Lys Lys His Ser 165 170 175 Tyr Leu Glu Pro Thr Ile Arg Ser Ala Val Pro Ser Ala Ile Gln Asn 180 185 190 Thr Leu Gln Asn Val Leu Ala Ala Ala Thr Lys Arg Asn Cys Asn Val 195 200 205 Thr Gln Met Arg Glu Leu Pro Val Leu Asp Ser Ala Ala Phe Asn Val 210 215 220 Glu Cys Phe Lys Lys Tyr Ala Cys Asn Asn Glu Tyr Trp Glu Thr Phe 225 230 235 240 Lys Glu Asn Pro Ile Arg Leu Thr Glu Glu Asn Val Val Asn Tyr Ile 245 250 255 Thr Lys Leu Lys Gly Pro Lys Ala Ala Ala Leu Phe Ala Lys Thr His 260 265 270 Asn Leu Asn Met Leu Gln Asp Ile Pro Met Asp Arg Phe Val Met Asp 275 280 285 Leu Lys Arg Asp Val Lys Val Thr Pro Gly Thr Lys His Thr Glu Glu 290 295 300 Arg Pro Lys Val Gln Val Ile Gln Ala Ala Asp Pro Leu Ala Thr Ala 305 310 315 320 Tyr Leu Cys Gly Ile His Arg Glu Leu Val Arg Arg Leu Asn Ala Val 325 330 335 Leu Leu Pro Asn Ile His Thr Leu Phe Asp Met Ser Ala Glu Asp Phe 340 345 350 Asp Ala Ile Ile Ala Glu His Phe Gln Pro Gly Asp Cys Val Leu Glu 355 360 365 Thr Asp Ile Ala Ser Phe Asp Lys Ser Glu Asp Asp Ala Met Ala Leu 370 375 380 Thr Ala Leu Met Ile Leu Glu Asp Leu Gly Val Asp Ala Glu Leu Leu 385 390 395 400 Thr Leu Ile Glu Ala Ala Phe Gly Glu Ile Ser Ser Ile His Leu Pro 405 410 415 Thr Lys Thr Lys Phe Lys Phe Gly Ala Met Met Lys Ser Gly Met Phe 420 425 430 Leu Thr Leu Phe Val Asn Thr Val Ile Asn Ile Val Ile Ala Ser Arg 435 440 445 Val Leu Arg Glu Arg Leu Thr Gly Ser Pro Cys Ala Ala Phe Ile Gly 450 455 460 Asp Asp Asn Ile Val Lys Gly Val Lys Ser Asp Lys Leu Met Ala Asp 465 470 475 480 Arg Cys Ala Thr Trp Leu Asn Met Glu Val Lys Ile Ile Asp Ala Val 485 490 495 Val Gly Glu Lys Ala Pro Tyr Phe Cys Gly Gly Phe Ile Leu Cys Asp 500 505 510 Ser Val Thr Gly Thr Ala Cys Arg Val Ala Asp Pro Leu Lys Arg Leu 515 520 525 Phe Lys Leu Gly Lys Pro Leu Ala Ala Asp Asp Glu His Asp Asp Asp 530 535 540 Arg Arg Arg Ala Leu His Glu Glu Ser Thr Arg Trp Asn Arg Val Gly 545 550 555 560 Ile Leu Ser Glu Leu Cys Lys Ala Val Glu Ser Arg Tyr Glu Thr Val 565 570 575 Gly Thr Ser Ile Ile Val Met Ala Met Thr Thr Leu Ala Ser Ser Val 580 585 590 Lys Ser Phe Ser Tyr Leu Arg Gly Ala Pro Ile Thr Leu Tyr Gly 595 600 605 <210> 88 <211> 1821 <212> DNA <213> Unknown <220> <223> Non-structural protein 4 <400> 88 tacatctttt cctccgacac cggtcaaggg catttacaac aaaaatcagt aaggcaaacg 60 gtgctatccg aagtggtgtt ggagaggacc gaattggaga tttcgtatgc cccgcgcctc 120 gaccaagaaa aagaagaatt actacgcaag aaattacagt taaatcccac acctgctaac 180 agaagcagat accagtccag gaaggtggag aacatgaaag ccataacagc tagacgtatt 240 ctgcaaggcc tagggcatta tttgaaggca gaaggaaaag tggagtgcta ccgaaccctg 300 catcctgttc ctttgtattc atctagtgtg aaccgtgcct tttcaagccc caaggtcgca 360 gtggaagcct gtaacgccat gttgaaagag aactttccga ctgtggcttc ttactgtatt 420 attccagagt acgatgccta tttggacatg gttgacggag cttcatgctg cttagacact 480 gccagttttt gccctgcaaa gctgcgcagc tttccaaaga aacactccta tttggaaccc 540 acaatacgat cggcagtgcc ttcagcgatc cagaacacgc tccagaacgt cctggcagct 600 gccacaaaaa gaaattgcaa tgtcacgcaa atgagagaat tgcccgtatt ggattcggcg 660 gcctttaatg tggaatgctt caagaaatat gcgtgtaata atgaatattg ggaaacgttt 720 aaagaaaacc ccatcaggct tactgaagaa aacgtggtaa attacattac caaattaaaa 780 ggaccaaaag ctgctgctct ttttgcgaag acacataatt tgaatatgtt gcaggacata 840 ccaatggaca ggtttgtaat ggacttaaag agagacgtga aagtgactcc aggaacaaaa 900 catactgaag aacggcccaa ggtacaggtg atccaggctg ccgatccgct agcaacagcg 960 tatctgtgcg gaatccaccg agagctggtt aggagattaa atgcggtcct gcttccgaac 1020 attcatacac tgtttgatat gtcggctgaa gactttgacg ctattatagc cgagcacttc 1080 cagcctgggg attgtgttct ggaaactgac atcgcgtcgt ttgataaaag tgaggacgac 1140 gccatggctc tgaccgcgtt aatgattctg gaagacttag gtgtggacgc agagctgttg 1200 acgctgattg aggcggcttt cggcgaaatt tcatcaatac atttgcccac taaaactaaa 1260 tttaaattcg gagccatgat gaaatctgga atgttcctca cactgtttgt gaacacagtc 1320 attaacattg taatcgcaag cagagtgttg agagaacggc taaccggatc accatgtgca 1380 gcattcattg gagatgacaa tatcgtgaaa ggagtcaaat cggacaaatt aatggcagac 1440 aggtgcgcca cctggttgaa tatggaagtc aagattatag atgctgtggt gggcgagaaa 1500 gcgccttatt tctgtggagg gtttattttg tgtgactccg tgaccggcac agcgtgccgt 1560 gtggcagacc ccctaaaaag gctgtttaag cttggcaaac ctctggcagc agacgatgaa 1620 catgatgatg acaggagaag ggcattgcat gaagagtcaa cacgctggaa ccgagtgggt 1680 attctttcag agctgtgcaa ggcagtagaa tcaaggtatg aaaccgtagg aacttccatc 1740 atagttatgg ccatgactac tctagctagc agtgttaaat cattcagcta cctgagaggg 1800 gcccctataa ctctctacgg c 1821 <210> 89 <211> 1821 <212> RNA <213> Unknown <220> <223> Non-structural protein 4 <400> 89 uacaucuuuu ccuccgacac cggucaaggg cauuuacaac aaaaaucagu aaggcaaacg 60 gugcuauccg aagugguguu ggagaggacc gaauuggaga uuucguaugc cccgcgccuc 120 gaccaagaaa aagaagaauu acuacgcaag aaauuacagu uaaaucccac accugcuaac 180 agaagcagau accaguccag gaagguggag aacaugaaag ccauaacagc uagacguauu 240 cugcaaggcc uagggcauua uuugaaggca gaaggaaaag uggagugcua ccgaacccug 300 cauccuguuc cuuuguauuc aucuagugug aaccgugccu uuucaagccc caaggucgca 360 guggaagccu guaacgccau guugaaagag aacuuuccga cuguggcuuc uuacuguauu 420 auuccagagu acgaugccua uuuggacaug guugacggag cuucaugcug cuuagacacu 480 gccaguuuuu gcccugcaaa gcugcgcagc uuuccaaaga aacacuccua uuuggaaccc 540 acaauacgau cggcagugcc uucagcgauc cagaacacgc uccagaacgu ccuggcagcu 600 gccacaaaaa gaaauugcaa ugucacgcaa augagagaau ugcccguauu ggauucggcg 660 gccuuuaaug uggaaugcuu caagaaauau gcguguaaua augaauauug ggaaacguuu 720 aaagaaaacc ccaucaggcu uacugaagaa aacgugguaa auuacauuac caaauuaaaa 780 ggaccaaaag cugcugcucu uuuugcgaag acacauaauu ugaauauguu gcaggacaua 840 ccaauggaca gguuuguaau ggacuuaaag agagacguga aagugacucc aggaacaaaa 900 cauacugaag aacggcccaa gguacaggug auccaggcug ccgauccgcu agcaacagcg 960 uaucugugcg gaauccaccg agagcugguu aggagauuaa augcgguccu gcuuccgaac 1020 auucauacac uguuugauau gucggcugaa gacuuugacg cuauuauagc cgagcacuuc 1080 cagccugggg auuguguucu ggaaacugac aucgcgucgu uugauaaaag ugaggacgac 1140 gccauggcuc ugaccgcguu aaugauucug gaagacuuag guguggacgc agagcuguug 1200 acgcugauug aggcggcuuu cggcgaaauu ucaucaauac auuugcccac uaaaacuaaa 1260 uuuaaauucg gagccaugau gaaaucugga auguuccuca cacuguuugu gaacacaguc 1320 auuaacauug uaaucgcaag cagaguguug agagaacggc uaaccggauc accaugugca 1380 gcauucauug gagaugacaa uaucgugaaa ggagucaaau cggacaaauu aauggcagac 1440 aggugcgcca ccugguugaa uauggaaguc aagauuauag augcuguggu gggcgagaaa 1500 gcgccuuauu ucuguggagg guuuauuuug ugugacuccg ugaccggcac agcgugccgu 1560 guggcagacc cccuaaaaag gcuguuuaag cuuggcaaac cucuggcagc agacgaugaa 1620 caugaugaug acaggagaag ggcauugcau gaagagucaa cacgcuggaa ccgagugggu 1680 auucuuucag agcugugcaa ggcaguagaa ucaagguaug aaaccguagg aacuuccauc 1740 auaguuaugg ccaugacuac ucuagcuagc aguguuaaau cauucagcua ccugagaggg 1800 gccccuauaa cucucuacgg c 1821 <210> 90 <211> 44 <212> RNA <213> Artificial Sequence <220> <223> 5'UTR <400> 90 augggcggcg caugagagaa gcccagacca auuaccuacc caaa 44 <210> 91 <211> 142 <212> RNA <213> Artificial Sequence <220> <223> 3'UTR <400> 91 aauuggcaag cugcuuacau agaacucgcg gcgauuggca ugccgccuua aaauuuuuau 60 uuuauuuuuc uuuucuuuuc cgaaucggau uuuguuuuua auauuucaaa aaaaaaaaaa 120 aaaaaaaaaa aaaaaaaaaa aa 142 <210> 92 <211> 7578 <212> RNA <213> Artificial Sequence <220> <223> RNA construct <400> 92 augggcggcg caugagagaa gcccagacca auuaccuacc caaaauggag aaaguucacg 60 uugacaucga ggaagacagc ccauuccuca gagcuuugca gcggagcuuc ccgcaguuug 120 agguagaagc caagcagguc acugauaaug accaugcuaa ugccagagcg uuuucgcauc 180 uggcuucaaa acugaucgaa acggaggugg acccauccga cacgauccuu gacauuggaa 240 gugcgcccgc ccgcagaaug uauucuaagc acaaguauca uuguaucugu ccgaugagau 300 gugcggaaga uccggacaga uuguauaagu augcaacuaa gcugaagaaa aacuguaagg 360 aaauaacuga uaaggaauug gacaagaaaa ugaaggagcu ggccgccguc augagcgacc 420 cugaccugga aacugagacu augugccucc acgacgacga gucgugucgc uacgaagggc 480 aagucgcugu uuaccaggau guauacgcgg uugacggacc gacaagucuc uaucaccaag 540 ccaauaaggg aguuagaguc gccuacugga uaggcuuuga caccaccccu uuuauguuua 600 agaacuuggc uggagcauau ccaucauacu cuaccaacug ggccgacgaa accguguuaa 660 cggcucguaa cauaggccua ugcagcucug acguuaugga gcggucacgu agagggaugu 720 ccauucuuag aaagaaguau uugaaaccau ccaacaaugu ucuauucucu guuggcucga 780 ccaucuacca cgagaagagg gacuuacuga ggagcuggca ccugccgucu guauuucacu 840 uacguggcaa gcaaaauuac acaugucggu gugagacuau aguuaguugc gacggguacg 900 ucguuaaaag aauagcuauc aguccaggcc uguaugggaa gccuucaggc uaugcugcua 960 cgaugcaccg cgagggauuc uugugcugca aagugacaga cacauugaac ggggagaggg 1020 ucucuuuucc cgugugcacg uaugugccag cuacauugug ugaccaaaug acuggcauac 1080 uggcaacaga ugucagugcg gacgacgcgc aaaaacugcu gguugggcuc aaccagcgua 1140 uagucgucaa cggucgcacc cagagaaaca ccaauaccau gaaaaauuac cuuuugcccg 1200 uaguggccca ggcauuugcu aggugggcaa aggaauauaa ggaagaucaa gaagaugaaa 1260 ggccacuagg acuacgagau agacaguuag ucauggggug uuguugggcu uuuagaaggc 1320 acaagauaac aucuauuuau aagcgcccgg auacccaaac caucaucaaa gugaacagcg 1380 auuuccacuc auucgugcug cccaggauag gcaguaacac auuggagauc gggcugagaa 1440 caagaaucag gaaaauguua gaggagcaca aggagccguc accucucauu accgccgagg 1500 acguacaaga agcuaagugc gcagccgaug aggcuaagga ggugcgugaa gccgaggagu 1560 ugcgcgcagc ucuaccaccu uuggcagcug auguugagga gcccacucug gaagccgaug 1620 ucgacuugau guuacaagag gcuggggccg gcucagugga gacaccucgu ggcuugauaa 1680 agguuaccag cuacgauggc gaggacaaga ucggcucuua cgcugugcuu ucuccgcagg 1740 cuguacucaa gagugaaaaa uuaucuugca uccacccucu cgcugaacaa gucauaguga 1800 uaacacacuc uggccgaaaa gggcguuaug ccguggaacc auaccauggu aaaguagugg 1860 ugccagaggg acaugcaaua cccguccagg acuuucaagc ucugagugaa agugccacca 1920 uuguguacaa cgaacgugag uucguaaaca gguaccugca ccauauugcc acacauggag 1980 gagcgcugaa cacugaugaa gaauauuaca aaacugucaa gcccagcgag cacgacggcg 2040 aauaccugua cgacaucgac aggaaacagu gcgucaagaa agaacuaguc acugggcuag 2100 ggcucacagg cgagcuggug gauccucccu uccaugaauu cgccuacgag agucugagaa 2160 cacgaccagc cgcuccuuac caaguaccaa ccauaggggu guauggcgug ccaggaucag 2220 gcaagucugg caucauuaaa agcgcaguca ccaaaaaaga ucuaguggug agcgccaaga 2280 aagaaaacug ugcagaaauu auaagggacg ucaagaaaau gaaagggcug gacgucaaug 2340 ccagaacugu ggacucagug cucuugaaug gaugcaaaca ccccguagag acccuguaua 2400 uugacgaagc uuuugcuugu caugcaggua cucucagagc gcucauagcc auuauaagac 2460 cuaaaaaggc agugcucugc ggggauccca aacagugcgg uuuuuuuaac augaugugcc 2520 ugaaagugca uuuuaaccac gagauuugca cacaagucuu ccacaaaagc aucucucgcc 2580 guugcacuaa aucugugacu ucggucgucu caaccuuguu uuacgacaaa aaaaugagaa 2640 cgacgaaucc gaaagagacu aagauuguga uugacacuac cggcaguacc aaaccuaagc 2700 aggacgaucu cauucucacu uguuucagag ggugggugaa gcaguugcaa auagauuaca 2760 aaggcaacga aauaaugacg gcagcugccu cucaagggcu gacccguaaa gguguguaug 2820 ccguucggua caaggugaau gaaaauccuc uguacgcacc caccucagaa caugugaacg 2880 uccuacugac ccgcacggag gaccgcaucg uguggaaaac acuagccggc gacccaugga 2940 uaaaaacacu gacugccaag uacccuggga auuucacugc cacgauagag gaguggcaag 3000 cagagcauga ugccaucaug aggcacaucu uggagagacc ggacccuacc gacgucuucc 3060 agaauaaggc aaacgugugu ugggccaagg cuuuagugcc ggugcugaag accgcuggca 3120 uagacaugac cacugaacaa uggaacacug uggauuauuu ugaaacggac aaagcucacu 3180 cagcagagau aguauugaac caacuaugcg ugagguucuu uggacucgau cuggacuccg 3240 gucuauuuuc ugcacccacu guuccguuau ccauuaggaa uaaucacugg gauaacuccc 3300 cgucgccuaa cauguacggg cugaauaaag aagugguccg ucagcucucu cgcagguacc 3360 cacaacugcc ucgggcaguu gccacuggaa gagucuauga caugaacacu gguacacugc 3420 gcaauuauga uccgcgcaua aaccuaguac cuguaaacag aagacugccu caugcuuuag 3480 uccuccacca uaaugaacac ccacagagug acuuuucuuc auucgucagc aaauugaagg 3540 gcagaacugu ccuggugguc ggggaaaagu uguccguccc aggcaaaaug guugacuggu 3600 ugucagaccg gccugaggcu accuucagag cucggcugga uuuaggcauc ccaggugaug 3660 ugcccaaaua ugacauaaua uuuguuaaug ugaggacccc auauaaauac caucacuauc 3720 agcaguguga agaccaugcc auuaagcuua gcauguugac caagaaagcu ugucugcauc 3780 ugaaucccgg cggaaccugu gucagcauag guuaugguua cgcugacagg gccagcgaaa 3840 gcaucauugg ugcuauagcg cggcaguuca aguuuucccg gguaugcaaa ccgaaauccu 3900 cacuugaaga gacggaaguu cuguuuguau ucauugggua cgaucgcaag gcccguacgc 3960 acaauucuua caagcuuuca ucaaccuuga ccaacauuua uacagguucc agacuccacg 4020 aagccggaug ugcacccuca uaucaugugg ugcgagggga uauugccacg gccaccgaag 4080 gagugauuau aaaugcugcu aacagcaaag gacaaccugg cggaggggug ugcggagcgc 4140 uguauaagaa auucccggaa agcuucgauu uacagccgau cgaaguagga aaagcgcgac 4200 uggucaaagg ugcagcuaaa cauaucauuc augccguagg accaaacuuc aacaaaguuu 4260 cggagguuga aggugacaaa caguuggcag aggcuuauga guccaucgcu aagauuguca 4320 acgauaacaa uuacaaguca guagcgauuc cacuguuguc caccggcauc uuuuccggga 4380 acaaagaucg acuaacccaa ucauugaacc auuugcugac agcuuuagac accacugaug 4440 cagauguagc cauauacugc agggacaaga aaugggaaau gacucucaag gaagcagugg 4500 cuaggagaga agcaguggag gagauaugca uauccgacga cucuucagug acagaaccug 4560 augcagagcu ggugagggug cauccgaaga guucuuuggc uggaaggaag ggcuacagca 4620 caagcgaugg caaaacuuuc ucauauuugg aagggaccaa guuucaccag gcggccaagg 4680 auauagcaga aauuaaugcc auguggcccg uugcaacgga ggccaaugag cagguaugca 4740 uguauauccu cggagaaagc augagcagua uuaggucgaa augccccguc gaagagucgg 4800 aagccuccac accaccuagc acgcugccuu gcuugugcau ccaugccaug acuccagaaa 4860 gaguacagcg ccuaaaagcc ucacguccag aacaaauuac ugugugcuca uccuuuccau 4920 ugccgaagua uagaaucacu ggugugcaga agauccaaug cucccagccu auauuguucu 4980 caccgaaagu gccugcguau auucauccaa ggaaguaucu cguggaaaca ccaccgguag 5040 acgagacucc ggagccaucg gcagagaacc aauccacaga ggggacaccu gaacaaccac 5100 cacuuauaac cgaggaugag accaggacua gaacgccuga gccgaucauc aucgaagagg 5160 aagaagagga uagcauaagu uugcugucag auggcccgac ccaccaggug cugcaagucg 5220 aggcagacau ucacgggccg cccucuguau cuagcucauc cugguccauu ccucaugcau 5280 ccgacuuuga uguggacagu uuauccauac uugacacccu ggagggagcu agcgugacca 5340 gcggggcaac gucagccgag acuaacucuu acuucgcaaa gaguauggag uuucuggcgc 5400 gaccggugcc ugcgccucga acaguauuca ggaacccucc acaucccgcu ccgcgcacaa 5460 gaacaccguc acuugcaccc agcagggccu gcucgagaac cagccuaguu uccaccccgc 5520 caggcgugaa uagggugauc acuagagagg agcucgaggc gcuuaccccg ucacgcacuc 5580 cuagcagguc ggucucgaga accagccugg ucuccaaccc gccaggcgua aauaggguga 5640 uuacaagaga ggaguuugag gcguucguag cacaacaaca augacgguuu gaugcgggug 5700 cauacaucuu uuccuccgac accggucaag ggcauuuaca acaaaaauca guaaggcaaa 5760 cggugcuauc cgaaguggug uuggagagga ccgaauugga gauuucguau gccccgcgcc 5820 ucgaccaaga aaaagaagaa uuacuacgca agaaauuaca guuaaauccc acaccugcua 5880 acagaagcag auaccagucc aggaaggugg agaacaugaa agccauaaca gcuagacgua 5940 uucugcaagg ccuagggcau uauuugaagg cagaaggaaa aguggagugc uaccgaaccc 6000 ugcauccugu uccuuuguau ucaucuagug ugaaccgugc cuuuucaagc cccaaggucg 6060 caguggaagc cuguaacgcc auguugaaag agaacuuucc gacuguggcu ucuuacugua 6120 uuauuccaga guacgaugcc uauuuggaca ugguugacgg agcuucaugc ugcuuagaca 6180 cugccaguuu uugcccugca aagcugcgca gcuuuccaaa gaaacacucc uauuuggaac 6240 ccacaauacg aucggcagug ccuucagcga uccagaacac gcuccagaac guccuggcag 6300 cugccacaaa aagaaauugc aaugucacgc aaaugagaga auugcccgua uuggauucgg 6360 cggccuuuaa uguggaaugc uucaagaaau augcguguaa uaaugaauau ugggaaacgu 6420 uuaaagaaaa ccccaucagg cuuacugaag aaaacguggu aaauuacauu accaaauuaa 6480 aaggaccaaa agcugcugcu cuuuuugcga agacacauaa uuugaauaug uugcaggaca 6540 uaccaaugga cagguuugua auggacuuaa agagagacgu gaaagugacu ccaggaacaa 6600 aacauacuga agaacggccc aagguacagg ugauccaggc ugccgauccg cuagcaacag 6660 cguaucugug cggaauccac cgagagcugg uuaggagauu aaaugcgguc cugcuuccga 6720 acauucauac acuguuugau augucggcug aagacuuuga cgcuauuaua gccgagcacu 6780 uccagccugg ggauuguguu cuggaaacug acaucgcguc guuugauaaa agugaggacg 6840 acgccauggc ucugaccgcg uuaaugauuc uggaagacuu agguguggac gcagagcugu 6900 ugacgcugau ugaggcggcu uucggcgaaa uuucaucaau acauuugccc acuaaaacua 6960 aauuuaaauu cggagccaug augaaaucug gaauguuccu cacacuguuu gugaacacag 7020 ucauuaacau uguaaucgca agcagagugu ugagagaacg gcuaaccgga ucaccaugug 7080 cagcauucau uggagaugac aauaucguga aaggagucaa aucggacaaa uuaauggcag 7140 acaggugcgc caccugguug aauauggaag ucaagauuau agaugcugug gugggcgaga 7200 aagcgccuua uuucugugga ggguuuauuu ugugugacuc cgugaccggc acagcgugcc 7260 guguggcaga cccccuaaaa aggcuguuua agcuuggcaa accucuggca gcagacgaug 7320 aacaugauga ugacaggaga agggcauugc augaagaguc aacacgcugg aaccgagugg 7380 guauucuuuc agagcugugc aaggcaguag aaucaaggua ugaaaccgua ggaacuucca 7440 ucauaguuau ggccaugacu acucuagcua gcaguguuaa aucauucagc uaccugagag 7500 gggccccuau aacucucuac ggcuaaccug aauggacuac gacauagucu aguccgccaa 7560 gucuagcaua uggccacc 7578 <210> 93 <211> 7578 <212> DNA <213> Artificial Sequence <220> <223> Nucleic acid sequence encoding RNA construct <400> 93 atgggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60 ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120 aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180 tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240 gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300 gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360 aaataactga taaggaattg gacaagaaaa tgaaggagct ggccgccgtc atgagcgacc 420 ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480 aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540 ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600 agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660 cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720 ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780 ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840 tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900 tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960 cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020 tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080 tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140 tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200 tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260 ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320 acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380 atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440 caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500 acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560 tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620 tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680 aggttaccag ctacgatggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740 ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800 taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860 tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920 ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980 gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040 aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100 ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160 cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220 gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280 aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340 ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400 ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460 ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520 tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580 gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640 cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700 aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760 aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820 ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880 tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940 taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000 cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060 agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120 tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180 cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240 gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300 cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360 cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420 gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480 tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540 gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600 tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660 tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720 agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780 tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840 gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900 cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960 acaattctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020 aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080 gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140 tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200 tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260 cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320 acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380 acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440 cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500 ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560 atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620 caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680 atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740 tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800 aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860 gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920 tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980 caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040 acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100 cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160 aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220 aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280 ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340 gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400 gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460 gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520 caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580 ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640 ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700 catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760 cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820 tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880 acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940 ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000 tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060 cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120 ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180 ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240 ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300 ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360 cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420 ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480 aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540 taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600 aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660 cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720 acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780 tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840 acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900 tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960 aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020 tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080 cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140 acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200 aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260 gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320 aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380 gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440 tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500 gggcccctat aactctctac ggctaacctg aatggactac gacatagtct agtccgccaa 7560 gtctagcata tggccacc 7578 <210> 94 <211> 7596 <212> DNA <213> Artificial Sequence <220> <223> Recombinant vector <400> 94 taatacgact cactatagat gggcggcgca tgagagaagc ccagaccaat tacctaccca 60 aaatggagaa agttcacgtt gacatcgagg aagacagccc attcctcaga gctttgcagc 120 ggagcttccc gcagtttgag gtagaagcca agcaggtcac tgataatgac catgctaatg 180 ccagagcgtt ttcgcatctg gcttcaaaac tgatcgaaac ggaggtggac ccatccgaca 240 cgatccttga cattggaagt gcgcccgccc gcagaatgta ttctaagcac aagtatcatt 300 gtatctgtcc gatgagatgt gcggaagatc cggacagatt gtataagtat gcaactaagc 360 tgaagaaaaa ctgtaaggaa ataactgata aggaattgga caagaaaatg aaggagctgg 420 ccgccgtcat gagcgaccct gacctggaaa ctgagactat gtgcctccac gacgacgagt 480 cgtgtcgcta cgaagggcaa gtcgctgttt accaggatgt atacgcggtt gacggaccga 540 caagtctcta tcaccaagcc aataagggag ttagagtcgc ctactggata ggctttgaca 600 ccaccccttt tatgtttaag aacttggctg gagcatatcc atcatactct accaactggg 660 ccgacgaaac cgtgttaacg gctcgtaaca taggcctatg cagctctgac gttatggagc 720 ggtcacgtag agggatgtcc attcttagaa agaagtattt gaaaccatcc aacaatgttc 780 tattctctgt tggctcgacc atctaccacg agaagaggga cttactgagg agctggcacc 840 tgccgtctgt atttcactta cgtggcaagc aaaattacac atgtcggtgt gagactatag 900 ttagttgcga cgggtacgtc gttaaaagaa tagctatcag tccaggcctg tatgggaagc 960 cttcaggcta tgctgctacg atgcaccgcg agggattctt gtgctgcaaa gtgacagaca 1020 cattgaacgg ggagagggtc tcttttcccg tgtgcacgta tgtgccagct acattgtgtg 1080 accaaatgac tggcatactg gcaacagatg tcagtgcgga cgacgcgcaa aaactgctgg 1140 ttgggctcaa ccagcgtata gtcgtcaacg gtcgcaccca gagaaacacc aataccatga 1200 aaaattacct tttgcccgta gtggcccagg catttgctag gtgggcaaag gaatataagg 1260 aagatcaaga agatgaaagg ccactaggac tacgagatag acagttagtc atggggtgtt 1320 gttgggcttt tagaaggcac aagataacat ctatttataa gcgcccggat acccaaacca 1380 tcatcaaagt gaacagcgat ttccactcat tcgtgctgcc caggataggc agtaacacat 1440 tggagatcgg gctgagaaca agaatcagga aaatgttaga ggagcacaag gagccgtcac 1500 ctctcattac cgccgaggac gtacaagaag ctaagtgcgc agccgatgag gctaaggagg 1560 tgcgtgaagc cgaggagttg cgcgcagctc taccaccttt ggcagctgat gttgaggagc 1620 ccactctgga agccgatgtc gacttgatgt tacaagaggc tggggccggc tcagtggaga 1680 cacctcgtgg cttgataaag gttaccagct acgatggcga ggacaagatc ggctcttacg 1740 ctgtgctttc tccgcaggct gtactcaaga gtgaaaaatt atcttgcatc caccctctcg 1800 ctgaacaagt catagtgata acacactctg gccgaaaagg gcgttatgcc gtggaaccat 1860 accatggtaa agtagtggtg ccagagggac atgcaatacc cgtccaggac tttcaagctc 1920 tgagtgaaag tgccaccatt gtgtacaacg aacgtgagtt cgtaaacagg tacctgcacc 1980 atattgccac acatggagga gcgctgaaca ctgatgaaga atattacaaa actgtcaagc 2040 ccagcgagca cgacggcgaa tacctgtacg acatcgacag gaaacagtgc gtcaagaaag 2100 aactagtcac tgggctaggg ctcacaggcg agctggtgga tcctcccttc catgaattcg 2160 cctacgagag tctgagaaca cgaccagccg ctccttacca agtaccaacc ataggggtgt 2220 atggcgtgcc aggatcaggc aagtctggca tcattaaaag cgcagtcacc aaaaaagatc 2280 tagtggtgag cgccaagaaa gaaaactgtg cagaaattat aagggacgtc aagaaaatga 2340 aagggctgga cgtcaatgcc agaactgtgg actcagtgct cttgaatgga tgcaaacacc 2400 ccgtagagac cctgtatatt gacgaagctt ttgcttgtca tgcaggtact ctcagagcgc 2460 tcatagccat tataagacct aaaaaggcag tgctctgcgg ggatcccaaa cagtgcggtt 2520 tttttaacat gatgtgcctg aaagtgcatt ttaaccacga gatttgcaca caagtcttcc 2580 acaaaagcat ctctcgccgt tgcactaaat ctgtgacttc ggtcgtctca accttgtttt 2640 acgacaaaaa aatgagaacg acgaatccga aagagactaa gattgtgatt gacactaccg 2700 gcagtaccaa acctaagcag gacgatctca ttctcacttg tttcagaggg tgggtgaagc 2760 agttgcaaat agattacaaa ggcaacgaaa taatgacggc agctgcctct caagggctga 2820 cccgtaaagg tgtgtatgcc gttcggtaca aggtgaatga aaatcctctg tacgcaccca 2880 cctcagaaca tgtgaacgtc ctactgaccc gcacggagga ccgcatcgtg tggaaaacac 2940 tagccggcga cccatggata aaaacactga ctgccaagta ccctgggaat ttcactgcca 3000 cgatagagga gtggcaagca gagcatgatg ccatcatgag gcacatcttg gagagaccgg 3060 accctaccga cgtcttccag aataaggcaa acgtgtgttg ggccaaggct ttagtgccgg 3120 tgctgaagac cgctggcata gacatgacca ctgaacaatg gaacactgtg gattattttg 3180 aaacggacaa agctcactca gcagagatag tattgaacca actatgcgtg aggttctttg 3240 gactcgatct ggactccggt ctattttctg cacccactgt tccgttatcc attaggaata 3300 atcactggga taactccccg tcgcctaaca tgtacgggct gaataaagaa gtggtccgtc 3360 agctctctcg caggtaccca caactgcctc gggcagttgc cactggaaga gtctatgaca 3420 tgaacactgg tacactgcgc aattatgatc cgcgcataaa cctagtacct gtaaacagaa 3480 gactgcctca tgctttagtc ctccaccata atgaacaccc acagagtgac ttttcttcat 3540 tcgtcagcaa attgaagggc agaactgtcc tggtggtcgg ggaaaagttg tccgtcccag 3600 gcaaaatggt tgactggttg tcagaccggc ctgaggctac cttcagagct cggctggatt 3660 taggcatccc aggtgatgtg cccaaatatg acataatatt tgttaatgtg aggaccccat 3720 ataaatacca tcactatcag cagtgtgaag accatgccat taagcttagc atgttgacca 3780 agaaagcttg tctgcatctg aatcccggcg gaacctgtgt cagcataggt tatggttacg 3840 ctgacagggc cagcgaaagc atcattggtg ctatagcgcg gcagttcaag ttttcccggg 3900 tatgcaaacc gaaatcctca cttgaagaga cggaagttct gtttgtattc attgggtacg 3960 atcgcaaggc ccgtacgcac aattcttaca agctttcatc aaccttgacc aacatttata 4020 caggttccag actccacgaa gccggatgtg caccctcata tcatgtggtg cgaggggata 4080 ttgccacggc caccgaagga gtgattataa atgctgctaa cagcaaagga caacctggcg 4140 gaggggtgtg cggagcgctg tataagaaat tcccggaaag cttcgattta cagccgatcg 4200 aagtaggaaa agcgcgactg gtcaaaggtg cagctaaaca tatcattcat gccgtaggac 4260 caaacttcaa caaagtttcg gaggttgaag gtgacaaaca gttggcagag gcttatgagt 4320 ccatcgctaa gattgtcaac gataacaatt acaagtcagt agcgattcca ctgttgtcca 4380 ccggcatctt ttccgggaac aaagatcgac taacccaatc attgaaccat ttgctgacag 4440 ctttagacac cactgatgca gatgtagcca tatactgcag ggacaagaaa tgggaaatga 4500 ctctcaagga agcagtggct aggagagaag cagtggagga gatatgcata tccgacgact 4560 cttcagtgac agaacctgat gcagagctgg tgagggtgca tccgaagagt tctttggctg 4620 gaaggaaggg ctacagcaca agcgatggca aaactttctc atatttggaa gggaccaagt 4680 ttcaccaggc ggccaaggat atagcagaaa ttaatgccat gtggcccgtt gcaacggagg 4740 ccaatgagca ggtatgcatg tatatcctcg gagaaagcat gagcagtatt aggtcgaaat 4800 gccccgtcga agagtcggaa gcctccacac cacctagcac gctgccttgc ttgtgcatcc 4860 atgccatgac tccagaaaga gtacagcgcc taaaagcctc acgtccagaa caaattactg 4920 tgtgctcatc ctttccattg ccgaagtata gaatcactgg tgtgcagaag atccaatgct 4980 cccagcctat attgttctca ccgaaagtgc ctgcgtatat tcatccaagg aagtatctcg 5040 tggaaacacc accggtagac gagactccgg agccatcggc agagaaccaa tccacagagg 5100 ggacacctga acaaccacca cttataaccg aggatgagac caggactaga acgcctgagc 5160 cgatcatcat cgaagaggaa gaagaggata gcataagttt gctgtcagat ggcccgaccc 5220 accaggtgct gcaagtcgag gcagacattc acgggccgcc ctctgtatct agctcatcct 5280 ggtccattcc tcatgcatcc gactttgatg tggacagttt atccatactt gacaccctgg 5340 agggagctag cgtgaccagc ggggcaacgt cagccgagac taactcttac ttcgcaaaga 5400 gtatggagtt tctggcgcga ccggtgcctg cgcctcgaac agtattcagg aaccctccac 5460 atcccgctcc gcgcacaaga acaccgtcac ttgcacccag cagggcctgc tcgagaacca 5520 gcctagtttc caccccgcca ggcgtgaata gggtgatcac tagagaggag ctcgaggcgc 5580 ttaccccgtc acgcactcct agcaggtcgg tctcgagaac cagcctggtc tccaacccgc 5640 caggcgtaaa tagggtgatt acaagagagg agtttgaggc gttcgtagca caacaacaat 5700 gacggtttga tgcgggtgca tacatctttt cctccgacac cggtcaaggg catttacaac 5760 aaaaatcagt aaggcaaacg gtgctatccg aagtggtgtt ggagaggacc gaattggaga 5820 tttcgtatgc cccgcgcctc gaccaagaaa aagaagaatt actacgcaag aaattacagt 5880 taaatcccac acctgctaac agaagcagat accagtccag gaaggtggag aacatgaaag 5940 ccataacagc tagacgtatt ctgcaaggcc tagggcatta tttgaaggca gaaggaaaag 6000 tggagtgcta ccgaaccctg catcctgttc ctttgtattc atctagtgtg aaccgtgcct 6060 tttcaagccc caaggtcgca gtggaagcct gtaacgccat gttgaaagag aactttccga 6120 ctgtggcttc ttactgtatt attccagagt acgatgccta tttggacatg gttgacggag 6180 cttcatgctg cttagacact gccagttttt gccctgcaaa gctgcgcagc tttccaaaga 6240 aacactccta tttggaaccc acaatacgat cggcagtgcc ttcagcgatc cagaacacgc 6300 tccagaacgt cctggcagct gccacaaaaa gaaattgcaa tgtcacgcaa atgagagaat 6360 tgcccgtatt ggattcggcg gcctttaatg tggaatgctt caagaaatat gcgtgtaata 6420 atgaatattg ggaaacgttt aaagaaaacc ccatcaggct tactgaagaa aacgtggtaa 6480 attacattac caaattaaaa ggaccaaaag ctgctgctct ttttgcgaag acacataatt 6540 tgaatatgtt gcaggacata ccaatggaca ggtttgtaat ggacttaaag agagacgtga 6600 aagtgactcc aggaacaaaa catactgaag aacggcccaa ggtacaggtg atccaggctg 6660 ccgatccgct agcaacagcg tatctgtgcg gaatccaccg agagctggtt aggagattaa 6720 atgcggtcct gcttccgaac attcatacac tgtttgatat gtcggctgaa gactttgacg 6780 ctattatagc cgagcacttc cagcctgggg attgtgttct ggaaactgac atcgcgtcgt 6840 ttgataaaag tgaggacgac gccatggctc tgaccgcgtt aatgattctg gaagacttag 6900 gtgtggacgc agagctgttg acgctgattg aggcggcttt cggcgaaatt tcatcaatac 6960 atttgcccac taaaactaaa tttaaattcg gagccatgat gaaatctgga atgttcctca 7020 cactgtttgt gaacacagtc attaacattg taatcgcaag cagagtgttg agagaacggc 7080 taaccggatc accatgtgca gcattcattg gagatgacaa tatcgtgaaa ggagtcaaat 7140 cggacaaatt aatggcagac aggtgcgcca cctggttgaa tatggaagtc aagattatag 7200 atgctgtggt gggcgagaaa gcgccttatt tctgtggagg gtttattttg tgtgactccg 7260 tgaccggcac agcgtgccgt gtggcagacc ccctaaaaag gctgtttaag cttggcaaac 7320 ctctggcagc agacgatgaa catgatgatg acaggagaag ggcattgcat gaagagtcaa 7380 cacgctggaa ccgagtgggt attctttcag agctgtgcaa ggcagtagaa tcaaggtatg 7440 aaaccgtagg aacttccatc atagttatgg ccatgactac tctagctagc agtgttaaat 7500 cattcagcta cctgagaggg gcccctataa ctctctacgg ctaacctgaa tggactacga 7560 catagtctag tccgccaagt ctagcatatg gccacc 7596 <210> 95 <211> 222 <212> PRT <213> Simian Virus 5 <400> 95 Met Asp Pro Thr Asp Leu Ser Phe Ser Pro Asp Glu Ile Asn Lys Leu 1 5 10 15 Ile Glu Thr Gly Leu Asn Thr Val Glu Tyr Phe Thr Ser Gln Gln Val 20 25 30 Thr Gly Thr Ser Ser Leu Gly Lys Asn Thr Ile Pro Pro Gly Val Thr 35 40 45 Gly Leu Leu Thr Asn Ala Ala Glu Ala Lys Ile Gln Glu Ser Thr Asn 50 55 60 His Gln Lys Gly Ser Val Gly Gly Gly Ala Lys Pro Lys Lys Pro Arg 65 70 75 80 Pro Lys Ile Ala Ile Val Pro Ala Asp Asp Lys Thr Val Pro Gly Lys 85 90 95 Pro Ile Pro Asn Pro Leu Leu Gly Leu Asp Ser Thr Pro Ser Thr Gln 100 105 110 Thr Val Leu Asp Leu Ser Gly Lys Thr Leu Pro Ser Gly Ser Tyr Lys 115 120 125 Gly Val Lys Leu Ala Lys Phe Gly Lys Glu Asn Leu Met Thr Arg Phe 130 135 140 Ile Glu Glu Pro Arg Glu Asn Pro Ile Ala Thr Ser Ser Pro Ile Asp 145 150 155 160 Phe Lys Arg Gly Arg Asp Thr Gly Gly Phe His Arg Arg Glu Tyr Ser 165 170 175 Ile Gly Trp Val Gly Asp Glu Val Lys Val Thr Glu Trp Cys Asn Pro 180 185 190 Ser Cys Ser Pro Ile Thr Ala Ala Ala Arg Arg Phe Glu Cys Thr Cys 195 200 205 His Gln Cys Pro Val Thr Cys Ser Glu Cys Glu Arg Asp Thr 210 215 220 <210> 96 <211> 666 <212> DNA <213> Simian Virus 5 <400> 96 atggatccca ctgatctgag cttctcccca gatgagatca ataagctcat agagacaggc 60 ctgaatactg tagagtattt tacttcccaa caagtcacag gaacatcctc tcttggaaag 120 aatacaatac caccaggggt cacaggacta ctaaccaatg ctgcagaggc aaagatccaa 180 gagtcaacta accatcagaa gggctcagtt ggtgggggtg caaaaccaaa gaaaccgcga 240 ccaaaaattg ccattgtgcc agcagatgac aaaacagtgc ccggaaagcc gatcccaaac 300 cctctattag gtctggactc caccccgagc acccaaactg tgcttgatct aagtgggaaa 360 acattaccat caggatccta taagggggtt aagcttgcga aatttggaaa agaaaatctg 420 atgacacggt tcatcgagga acccagagag aatcctatcg caaccagttc ccccatcgat 480 tttaagaggg gcagggatac cggcgggttc catagaaggg agtactcaat cggatgggtg 540 ggagatgaag tcaaggtcac tgagtggtgc aatccatcct gttctccaat caccgctgca 600 gcaaggcgat ttgaatgcac ttgtcaccag tgtccagtca cttgctctga atgtgaacga 660 gatact 666 <210> 97 <211> 666 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding SV5B protein <400> 97 atggacccta ccgacctgag cttcagcccc gacgagatca acaagctgat cgagacaggc 60 ctgaacaccg tggaatactt caccagccag caagtgaccg gcacaagcag cctgggcaag 120 aacacaattc ctccaggcgt gaccggcctg ctgacaaatg ctgccgaggc caagatccaa 180 gagagcacca accaccagaa gggctctgtt ggaggcggag ccaagcctaa gaagcccaga 240 cctaagatcg ccatcgtgcc cgccgacgat aagacagtgc ctggcaagcc cattcctaat 300 cctctgctgg gcctcgacag cacccctagc acacagacag tgctggatct gagcggcaag 360 acactgccta gcggcagcta taagggcgtg aagctggcca agttcggcaa agaaaacctg 420 atgacccggt tcatcgagga acccagagag aaccctatcg ccaccagctc tcccatcgac 480 ttcaagagag gcagagacac cggcggcttc cacagaagag agtacagcat tggctgggtc 540 ggagatgaag tgaaagtgac cgagtggtgc aaccccagct gcagccctat tacagccgcc 600 gctagaagat tcgagtgcac ctgtcaccag tgtcctgtga cctgtagcga gtgcgagaga 660 gacaca 666 <210> 98 <211> 666 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding SV5B protein <400> 98 auggacccua ccgaccugag cuucagcccc gacgagauca acaagcugau cgagacaggc 60 cugaacaccg uggaauacuu caccagccag caagugaccg gcacaagcag ccugggcaag 120 aacacaauuc cuccaggcgu gaccggccug cugacaaaug cugccgaggc caagauccaa 180 gagagcacca accaccagaa gggcucuguu ggaggcggag ccaagccuaa gaagcccaga 240 ccuaagaucg ccaucgugcc cgccgacgau aagacagugc cuggcaagcc cauuccuaau 300 ccucugcugg gccucgacag caccccuagc acacagacag ugcuggaucu gagcggcaag 360 acacugccua gcggcagcua uaagggcgug aagcuggcca aguucggcaa agaaaaccug 420 augacccggu ucaucgagga acccagagag aacccuaucg ccaccagcuc ucccaucgac 480 uucaagagag gcagagacac cggcggcuuc cacagaagag aguacagcau uggcuggguc 540 ggagaugaag ugaaagugac cgaguggugc aaccccagcu gcagcccuau uacagccgcc 600 gcuagaagau ucgagugcac cugucaccag uguccuguga ccuguagcga gugcgagaga 660 gacaca 666 <210> 99 <211> 225 <212> PRT <213> Simian Virus 5 <400> 99 Met Ala Glu Glu Pro Thr Tyr Thr Thr Glu Gln Val Asp Glu Leu Ile 1 5 10 15 His Ala Gly Leu Gly Thr Val Asp Phe Phe Leu Ser Arg Pro Ile Asp 20 25 30 Ala Gln Ser Ser Leu Gly Lys Gly Ser Ile Pro Pro Gly Val Thr Ala 35 40 45 Val Leu Thr Ser Ala Ala Glu Ala Lys Ser Lys Pro Val Ala Ala Gly 50 55 60 Pro Val Lys Pro Arg Arg Lys Lys Val Ile Ser Asn Thr Thr Pro Tyr 65 70 75 80 Thr Ile Ala Asp Asn Ile Pro Pro Glu Lys Leu Pro Ile Asn Thr Pro 85 90 95 Ile Pro Asn Pro Leu Leu Pro Leu Ala Arg Pro His Gly Lys Met Thr 100 105 110 Asp Ile Asp Ile Val Thr Gly Asn Ile Thr Glu Gly Ser Tyr Lys Gly 115 120 125 Val Glu Leu Ala Lys Leu Gly Lys Gln Thr Leu Leu Thr Arg Phe Thr 130 135 140 Ser Asn Glu Pro Val Ser Ser Ala Gly Ser Ala Gln Asp Pro Asn Phe 145 150 155 160 Lys Arg Gly Gly Ala Asn Arg Glu Arg Ala Arg Gly Asn His Arg Arg 165 170 175 Glu Trp Ser Ile Ala Trp Val Gly Asp Gln Val Lys Val Phe Glu Trp 180 185 190 Cys Asn Pro Arg Cys Ala Pro Val Thr Ala Ser Ala Arg Lys Phe Thr 195 200 205 Cys Thr Cys Gly Ser Cys Pro Ser Ile Cys Gly Glu Cys Glu Gly Asp 210 215 220 His 225 <210> 100 <211> 675 <212> DNA <213> Simian Virus 5 <400> 100 atggccgagg aaccaacata caccactgag caagttgatg aattaatcca tgctggactg 60 ggaacagtag atttcttcct atctagaccc atagatgctc agtcttcttt aggcaaaggc 120 agcatcccac caggtgtcac agctgttcta actagtgcag cggaggcaaa atccaaacca 180 gttgctgctg gtccagttaa acccaggcgg aagaaagtga tcagcaatac tactccatac 240 actattgcag acaatattcc acctgagaag ctaccgatca acactccaat acccaatcca 300 ttacttccac tggcacgccc tcacggaaag atgacagaca ttgacattgt cactgggaac 360 attacagaag gatcgtacaa aggtgtggag cttgctaaat tagggaagca gacactactc 420 acaaggttca cctcgaatga gccagtctcc tcagctggat ccgcccaaga ccccaacttt 480 aagagggggg gagctaatag agaaagagca agaggcaacc ataggagaga atggagtatt 540 gcatgggtcg gagatcaggt caaagtcttc gagtggtgta atcccaggtg tgccccagtc 600 acggcctcag ctcgcaagtt cacctgcaca tgcggatcct gccccagcat ctgcggagaa 660 tgtgaaggag atcat 675 <210> 101 <211> 675 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding PIV2 Non-structural protein V <400> 101 atggccgagg aacctaccta caccaccgaa caggtggacg agctgattca cgccggactg 60 ggaaccgtgg acttctttct gtcccggcct atcgatgccc agagcagcct cggcaaggga 120 tctattcctc ctggcgtgac agccgtgctg acatctgccg ccgaggccaa gtctaaacct 180 gtggctgctg gacccgtgaa gcccagacgg aagaaagtga tcagcaacac cacaccttac 240 acgatcgccg acaacatccc tcctgagaag ctgcccatca acacccctat tcctaatcct 300 ctgctgcccc tggccagacc tcacggcaag atgaccgaca tcgatatcgt gaccggcaac 360 atcaccgagg gcagctacaa aggcgtggaa ctggccaagc tgggcaagca gacactgctg 420 accagattca ccagcaacga gcctgtgtct agcgccggct ctgcccagga tcctaacttc 480 aaaagaggcg gagccaacag agagagagcc agaggcaacc atcggagaga gtggtctatt 540 gcctgggtcg gagatcaagt gaaggtgttc gagtggtgca accccagatg tgcccctgtg 600 acagccagcg ccagaaagtt cacctgtacc tgcggcagct gtcccagcat ttgcggagag 660 tgtgaaggcg accat 675 <210> 102 <211> 675 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding PIV2 Non-structural protein V <400> 102 auggccgagg aaccuaccua caccaccgaa cagguggacg agcugauuca cgccggacug 60 ggaaccgugg acuucuuucu gucccggccu aucgaugccc agagcagccu cggcaaggga 120 ucuauuccuc cuggcgugac agccgugcug acaucugccg ccgaggccaa gucuaaaccu 180 guggcugcug gacccgugaa gcccagacgg aagaaaguga ucagcaacac cacaccuuac 240 acgaucgccg acaacauccc uccugagaag cugcccauca acaccccuau uccuaauccu 300 cugcugcccc uggccagacc ucacggcaag augaccgaca ucgauaucgu gaccggcaac 360 aucaccgagg gcagcuacaa aggcguggaa cuggccaagc ugggcaagca gacacugcug 420 accagauuca ccagcaacga gccugugucu agcgccggcu cugcccagga uccuaacuuc 480 aaaagaggcg gagccaacag agagagagcc agaggcaacc aucggagaga guggucuauu 540 gccugggucg gagaucaagu gaagguguuc gaguggugca accccagaug ugccccugug 600 acagccagcg ccagaaaguu caccuguacc ugcggcagcu gucccagcau uugcggagag 660 ugugaaggcg accau 675 <210> 103 <211> 224 <212> PRT <213> Mumps virus <400> 103 Met Asp Gln Phe Ile Lys Gln Asp Glu Thr Gly Asp Leu Ile Glu Thr 1 5 10 15 Gly Met Asn Val Ala Asn His Phe Leu Ser Ala Pro Ile Gln Gly Thr 20 25 30 Asn Ser Leu Ser Lys Ala Thr Ile Ile Pro Gly Val Ala Pro Val Leu 35 40 45 Ile Gly Asn Pro Glu Gln Lys Asn Ile Gln Tyr Pro Thr Thr Ser His 50 55 60 Gln Gly Ser Lys Ser Lys Gly Arg Gly Ser Gly Ala Arg Pro Ile Ile 65 70 75 80 Val Ser Ser Ser Glu Gly Gly Thr Gly Gly Thr Gln Val Pro Glu Pro 85 90 95 Leu Phe Ala Gln Thr Gly Gln Gly Gly Ile Val Thr Thr Val Tyr Gln 100 105 110 Asp Pro Thr Ile Gln Pro Thr Gly Ser Tyr Arg Ser Val Glu Leu Ala 115 120 125 Lys Ile Gly Lys Glu Arg Met Ile Asn Arg Phe Val Glu Lys Pro Arg 130 135 140 Thr Ser Thr Pro Val Thr Glu Phe Lys Arg Gly Ala Gly Ser Gly Cys 145 150 155 160 Ser Arg Pro Asp Asn Pro Arg Gly Gly His Arg Arg Glu Trp Ser Leu 165 170 175 Ser Trp Val Gln Gly Glu Val Arg Val Phe Glu Trp Cys Asn Pro Ile 180 185 190 Cys Ser Pro Ile Thr Ala Ala Ala Arg Phe His Ser Cys Lys Cys Gly 195 200 205 Asn Cys Pro Ala Lys Cys Asp Gln Cys Glu Arg Asp Tyr Gly Pro Pro 210 215 220 <210> 104 <211> 672 <212> DNA <213> Mumps virus <400> 104 atggaccaat ttataaaaca agatgagact ggtgatttaa ttgagacagg aatgaacgtt 60 gcaaatcatt tcctatccgc ccccattcag ggaaccaact cgttgagcaa ggccacaatc 120 atccctggcg ttgcaccagt actcattggc aatccagagc aaaagaacat tcagtacccc 180 accacatcac atcagggatc caagtcaaag ggcagaggct caggggccag gcccatcata 240 gtctcatcct ccgaaggagg cactggaggg actcaggttc ctgagcccct tttcgcacaa 300 acaggacaag gtggcattgt caccaccgtt tatcaggatc caactatcca accaacaggt 360 tcatatcgaa gtgtggaatt ggctaagata ggaaaagaga gaatgattaa tcgatttgtt 420 gaaaaaccaa gaacctcaac gccggtaaca gaatttaaga ggggggccgg gagcggctgc 480 tcaaggccag acaatccaag aggagggcat agacgggaat ggagcctcag ctgggtccaa 540 ggagaggtcc gggtctttga gtggtgcaac cccatatgct cacctatcac tgccgcagca 600 agattccact cctgcaaatg tgggaattgc cccgcaaagt gcgatcagtg cgaacgagat 660 tatggacctc ct 672 <210> 105 <211> 672 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding Mumps V protein <400> 105 atggaccagt tcatcaagca ggacgagaca ggcgacctga tcgaaaccgg catgaacgtg 60 gccaaccact tcctgtctgc ccctatccag ggcaccaaca gcctgagcaa ggccacaatt 120 atccctggcg tggcccctgt gctgatcggc aatcctgagc agaagaacat tcagtacccc 180 accaccagcc accagggcag caagtctaaa ggcagaggct ctggcgctcg gcccatcatc 240 gtttctagta gcgaaggcgg caccggcgga acacaggttc cagaacctct gtttgcccag 300 acaggccaag gcggcatcgt gaccacagtg taccaggatc ctaccatcca gcctaccggc 360 agctacagaa gcgtggaact ggccaagatc ggcaaagaac ggatgatcaa ccgcttcgtg 420 gaaaagccca gaaccagcac acccgtgacc gagttcaaaa gaggcgccgg aagcggctgc 480 agcagacccg ataatcctag aggcggccat cggagagagt ggtccctgtc ttgggttcag 540 ggcgaagtgc gggtgttcga gtggtgcaat cctatctgca gccccatcac agccgccgct 600 agattccaca gctgcaagtg cggaaactgc cccgccaagt gtgaccagtg cgagagagat 660 tacggccctc ct 672 <210> 106 <211> 672 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding Mumps V protein <400> 106 auggaccagu ucaucaagca ggacgagaca ggcgaccuga ucgaaaccgg caugaacgug 60 gccaaccacu uccugucugc cccuauccag ggcaccaaca gccugagcaa ggccacaauu 120 aucccuggcg uggccccugu gcugaucggc aauccugagc agaagaacau ucaguacccc 180 accaccagcc accagggcag caagucuaaa ggcagaggcu cuggcgcucg gcccaucauc 240 guuucuagua gcgaaggcgg caccggcgga acacagguuc cagaaccucu guuugcccag 300 acaggccaag gcggcaucgu gaccacagug uaccaggauc cuaccaucca gccuaccggc 360 agcuacagaa gcguggaacu ggccaagauc ggcaaagaac ggaugaucaa ccgcuucgug 420 gaaaagccca gaaccagcac acccgugacc gaguucaaaa gaggcgccgg aagcggcugc 480 agcagacccg auaauccuag aggcggccau cggagagagu ggucccuguc uuggguucag 540 ggcgaagugc ggguguucga guggugcaau ccuaucugca gccccaucac agccgccgcu 600 agauuccaca gcugcaagug cggaaacugc cccgccaagu gugaccagug cgagagagau 660 uacggcccuc cu 672 <210> 107 <211> 384 <212> PRT <213> Sendai virus <400> 107 Met Asp Gln Asp Ala Phe Ile Leu Lys Glu Asp Ser Glu Val Glu Arg 1 5 10 15 Glu Ala Pro Gly Gly Arg Glu Ser Leu Ser Asp Val Ile Gly Phe Leu 20 25 30 Asp Ala Val Leu Ser Ser Glu Pro Thr Asp Ile Gly Gly Asp Arg Ser 35 40 45 Trp Leu His Asn Thr Ile Asn Thr Pro Gln Gly Pro Gly Ser Ala His 50 55 60 Arg Ala Lys Ser Glu Gly Glu Gly Glu Val Ser Thr Pro Ser Thr Gln 65 70 75 80 Asp Asn Arg Ser Gly Glu Glu Ser Arg Val Ser Gly Arg Thr Ser Lys 85 90 95 Pro Glu Ala Glu Ala His Ala Gly Asn Leu Asp Lys Gln Asn Ile His 100 105 110 Arg Ala Phe Gly Gly Arg Thr Gly Thr Asn Ser Val Ser Gln Asp Leu 115 120 125 Gly Asp Gly Gly Asp Ser Gly Ile Leu Glu Asn Pro Pro Asn Glu Arg 130 135 140 Gly Tyr Pro Arg Ser Gly Ile Glu Asp Glu Asn Arg Glu Met Ala Ala 145 150 155 160 His Pro Asp Lys Arg Gly Glu Asp Gln Ala Glu Gly Leu Pro Glu Glu 165 170 175 Val Arg Gly Gly Thr Ser Leu Pro Asp Glu Gly Glu Gly Gly Ala Ser 180 185 190 Asn Asn Gly Arg Ser Met Glu Pro Gly Ser Ser His Ser Ala Arg Val 195 200 205 Thr Gly Val Leu Val Ile Pro Ser Pro Glu Leu Glu Glu Ala Val Leu 210 215 220 Arg Arg Asn Lys Arg Arg Pro Thr Asn Ser Gly Ser Lys Pro Leu Thr 225 230 235 240 Pro Ala Thr Val Pro Gly Thr Arg Ser Pro Pro Leu Asn Arg Tyr Asn 245 250 255 Ser Thr Gly Ser Pro Pro Gly Lys Pro Pro Ser Thr Gln Asp Glu His 260 265 270 Ile Asn Ser Gly Asp Thr Pro Ala Val Arg Val Lys Asp Arg Lys Pro 275 280 285 Pro Ile Gly Thr Arg Ser Val Ser Asp Cys Pro Ala Asn Gly Arg Pro 290 295 300 Ile His Pro Gly Leu Glu Thr Asp Ser Thr Lys Lys Gly His Arg Arg 305 310 315 320 Glu His Ile Ile Tyr Glu Arg Asp Gly Tyr Ile Val Asp Glu Ser Trp 325 330 335 Cys Asn Pro Val Cys Ser Arg Ile Arg Val Ile Pro Arg Arg Glu Leu 340 345 350 Cys Val Cys Lys Thr Cys Pro Lys Val Cys Lys Leu Cys Arg Asp Asp 355 360 365 Ile Gln Cys Met Arg Pro Asp Pro Phe Cys Arg Glu Ile Phe Arg Ser 370 375 380 <210> 108 <211> 1152 <212> DNA <213> Sendai virus <400> 108 atggatcaag atgccttcat tcttaaagaa gattctgaag ttgagaggga ggcgccagga 60 ggaagagagt cgctctcgga tgttatcgga ttcctcgatg ctgtcctgtc gagtgaacca 120 actgacatcg gaggggacag aagctggctc cacaacacca tcaacactcc ccaaggacca 180 ggctctgccc atagagccaa aagtgagggc gaaggagaag tctcaacacc gtcgacccaa 240 gataatcgat caggtgagga gagtagagtc tctgggagaa caagcaagcc agaggcagaa 300 gcacatgctg gaaaccttga taaacaaaat atacaccggg cctttggggg aagaactggt 360 acaaactctg tatctcagga tctgggcgat ggaggagact ccggaatcct tgaaaatccc 420 ccaaatgaga gaggatatcc gagatcaggt attgaagatg aaaacagaga gatggctgcg 480 caccctgata agaggggaga agaccaagct gaaggacttc cagaagaggt acgaggaggt 540 acatccctac ctgatgaagg agaaggtgga gcaagtaata atggaagaag catggagcct 600 ggcagctcac atagtgcaag agtaactggg gtcctggtga ttcctagccc cgaactcgaa 660 gaggctgtgc tacggaggaa caaaagaaga cctaccaaca gtgggtccaa acctcttact 720 ccagcaaccg tgcctggcac ccggtcccca ccgctgaatc gttacaacag cacagggtca 780 ccaccaggaa aacccccatc tacacaggat gagcacatca actctgggga cacccccgcc 840 gtcagggtca aagaccggaa accaccaata gggacccgct ctgtctcaga ttgtccagcc 900 aacggccgcc caatccaccc gggtctagag accgactcaa caaaaaaggg gcataggaga 960 gaacacatca tctatgaaag agatggctac attgttgacg agtcttggtg taatccagtc 1020 tgctcaagaa ttcgagtcat cccgagacgc gagttatgtg tttgcaagac gtgccctaaa 1080 gtctgcaaac tatgcagaga tgacattcaa tgtatgcggc ctgatccttt ctgccgagaa 1140 atcttccgct cg 1152 <210> 109 <211> 1152 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding SeV V protein <400> 109 atggaccagg acgccttcat cctgaaagag gacagcgagg tcgagagaga agcccctggc 60 ggaagagaaa gcctgtccga tgtgatcggc ttcctggatg ccgtgctgag cagcgagcct 120 acagatatcg gcggcgatag aagctggctg cacaacacca tcaacacccc tcaaggccct 180 ggctctgccc acagagctaa gtctgaaggc gagggcgaag tgtctacccc tagcacacag 240 gacaacagaa gcggcgagga atccagagtg tccggcagaa caagcaagcc tgaggccgaa 300 gctcacgccg gcaatctgga caagcagaac atccacagag ccttcggcgg cagaaccggc 360 acaaatagcg tgtcacagga cctcggagat ggcggcgatt ctggcatcct ggaaaaccct 420 ccaaacgagc ggggctaccc tagaagcgga atcgaggacg agaacagaga gatggccgct 480 catcccgaca agagaggcga agatcaggcc gagggactgc ctgaagaagt gcgcggagga 540 acaagcctgc ctgacgaagg cgaaggcgga gcctctaaca acggcagatc tatggaaccc 600 ggcagcagcc atagcgccag agttacaggc gtgctggtca tcccatctcc agagctggaa 660 gaggctgtgc tgaggcggaa caagagaagg cctaccaaca gcggcagcaa gcctctgaca 720 ccagctacag tgcctggcac aagaagccct ccactgaacc ggtacaacag cacaggctct 780 ccacctggca agcctccatc cacacaggat gagcacatca actccggcga tacccctgcc 840 gtcagagtga aggacagaaa gcctcctatc ggcaccagaa gcgtgtccga ctgtcctgcc 900 aatggcagac ctattcaccc cggcctggaa accgacagca ccaagaaggg acacagacgg 960 gaacacatca tctacgagcg cgacggctac atcgtggacg agagctggtg caaccctgtg 1020 tgcagccgga tcagagtgat ccctcggaga gaactgtgcg tgtgcaagac atgccccaaa 1080 gtgtgcaagc tgtgccggga cgacatccag tgtatgcggc ccgatccttt ctgcagagag 1140 atcttcagaa gc 1152 <210> 110 <211> 1152 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding SeV V protein <400> 110 auggaccagg acgccuucau ccugaaagag gacagcgagg ucgagagaga agccccuggc 60 ggaagagaaa gccuguccga ugugaucggc uuccuggaug ccgugcugag cagcgagccu 120 acagauaucg gcggcgauag aagcuggcug cacaacacca ucaacacccc ucaaggcccu 180 ggcucugccc acagagcuaa gucugaaggc gagggcgaag ugucuacccc uagcacacag 240 gacaacagaa gcggcgagga auccagagug uccggcagaa caagcaagcc ugaggccgaa 300 gcucacgccg gcaaucugga caagcagaac auccacagag ccuucggcgg cagaaccggc 360 acaaauagcg ugucacagga ccucggagau ggcggcgauu cuggcauccu ggaaaacccu 420 ccaaacgagc ggggcuaccc uagaagcgga aucgaggacg agaacagaga gauggccgcu 480 caucccgaca agagaggcga agaucaggcc gagggacugc cugaagaagu gcgcggagga 540 acaagccugc cugacgaagg cgaaggcgga gccucuaaca acggcagauc uauggaaccc 600 ggcagcagcc auagcgccag aguuacaggc gugcugguca ucccaucucc agagcuggaa 660 gaggcugugc ugaggcggaa caagagaagg ccuaccaaca gcggcagcaa gccucugaca 720 ccagcuacag ugccuggcac aagaagcccu ccacugaacc gguacaacag cacaggcucu 780 ccaccuggca agccuccauc cacacaggau gagcacauca acuccggcga uaccccugcc 840 gucagaguga aggacagaaa gccuccuauc ggcaccagaa gcguguccga cuguccugcc 900 aauggcagac cuauucaccc cggccuggaa accgacagca ccaagaaggg acacagacgg 960 gaacacauca ucuacgagcg cgacggcuac aucguggacg agagcuggug caacccugug 1020 ugcagccgga ucagagugau cccucggaga gaacugugcg ugugcaagac augccccaaa 1080 gugugcaagc ugugccggga cgacauccag uguaugcggc ccgauccuuu cugcagagag 1140 aucuucagaa gc 1152 <210> 111 <211> 299 <212> PRT <213> Measles virus <400> 111 Met Ala Glu Glu Gln Ala Arg His Val Lys Asn Gly Leu Glu Cys Ile 1 5 10 15 Arg Ala Leu Lys Ala Glu Pro Ile Gly Ser Leu Ala Val Glu Glu Ala 20 25 30 Met Ala Ala Trp Ser Glu Ile Ser Asp Asn Pro Gly Gln Asp Arg Ala 35 40 45 Thr Cys Lys Glu Glu Glu Ala Gly Ser Ser Gly Leu Ser Lys Pro Cys 50 55 60 Leu Ser Ala Ile Gly Ser Thr Glu Gly Gly Ala Pro Arg Ile Arg Gly 65 70 75 80 Gln Gly Ser Gly Glu Ser Asp Asp Asp Ala Glu Thr Leu Gly Ile Pro 85 90 95 Ser Arg Asn Leu Gln Ala Ser Ser Thr Gly Leu Gln Cys Tyr His Val 100 105 110 Tyr Asp His Ser Gly Glu Ala Val Lys Gly Ile Gln Asp Ala Asp Ser 115 120 125 Ile Met Val Gln Ser Gly Leu Asp Gly Asp Ser Thr Leu Ser Gly Gly 130 135 140 Asp Asp Glu Ser Glu Asn Ser Asp Val Asp Ile Gly Glu Pro Asp Thr 145 150 155 160 Glu Gly Tyr Ala Ile Thr Asp Arg Gly Ser Ala Pro Ile Ser Met Gly 165 170 175 Phe Arg Ala Ser Asp Val Glu Thr Ala Glu Gly Gly Glu Ile His Glu 180 185 190 Leu Leu Lys Leu Gln Ser Arg Gly Asn Asn Phe Pro Lys Leu Gly Lys 195 200 205 Thr Leu Asn Val Pro Pro Pro Pro Asn Pro Ser Arg Ala Ser Thr Ser 210 215 220 Glu Thr Pro Ile Lys Lys Gly His Arg Arg Glu Ile Gly Leu Ile Trp 225 230 235 240 Asn Gly Asp Arg Val Phe Ile Asp Arg Trp Cys Asn Pro Met Cys Ser 245 250 255 Lys Val Thr Leu Gly Thr Ile Arg Ala Arg Cys Thr Cys Gly Glu Cys 260 265 270 Pro Arg Val Cys Glu Gln Cys Arg Thr Asp Thr Gly Val Asp Thr Arg 275 280 285 Ile Trp Tyr His Asn Leu Pro Glu Ile Pro Glu 290 295 <210> 112 <211> 897 <212> DNA <213> Measles virus <400> 112 atggcagaag agcaggcacg ccatgtcaaa aacggactgg aatgcatccg ggctctcaag 60 gccgagccca tcggctcact ggccgtcgag gaagccatgg cagcatggtc agaaatatca 120 gacaacccag gacaggaccg agccacctgc aaggaagagg aggcaggcag ttcgggtctc 180 agcaaaccat gcctctcagc aattggatca actgaaggcg gtgcacctcg catccgcggt 240 cagggatctg gagaaagcga tgacgacgct gaaactttgg gaatcccctc aagaaatctc 300 caggcatcaa gcactgggtt acagtgttat catgtttatg atcacagcgg tgaagcggtt 360 aagggaatcc aagatgctga ctctatcatg gttcaatcag gccttgatgg tgatagcacc 420 ctctcaggag gagacgatga atctgaaaac agcgatgtgg atattggcga acctgatacc 480 gagggatatg ctatcactga ccggggatct gctcccatct ctatggggtt cagggcttct 540 gatgttgaaa ctgcagaagg aggggagatc cacgagctcc tgaaactcca atccagaggc 600 aacaactttc cgaagcttgg gaaaactctc aatgttcctc cgcccccgaa ccccagtagg 660 gccagcactt ccgagacacc cattaaaaag gggcacagac gcgagattgg cctcatttgg 720 aacggagatc gcgtctttat tgacaggtgg tgcaacccaa tgtgctcgaa agtcaccctc 780 ggaaccatca gggccaggtg cacctgcggg gaatgtcccc gagtgtgtga gcaatgccgc 840 actgatacag gagtggacac ccgaatctgg taccacaatc tccccgagat cccagaa 897 <210> 113 <211> 897 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding Measles V protein <400> 113 atggccgaag aacaggccag acacgtgaag aacggcctgg aatgcatcag agccctgaag 60 gccgagccta tcggatctct ggctgtggaa gaagccatgg ccgcttggag cgagatcagc 120 gataatcccg gccaggaccg ggccacctgt aaagaagaag aggccggatc tagcggcctg 180 agcaagcctt gtctgtctgc catcggctct acagaaggcg gcgctcctag aatcagaggc 240 caaggatctg gcgagagcga cgacgatgct gagacactgg gcatccccag cagaaatctg 300 caggccagct ctaccggcct gcagtgctat cacgtgtacg atcactctgg cgaggccgtg 360 aagggaatcc aggatgccga tagcatcatg gtgcagagcg gcctggatgg cgactctaca 420 cttagcggcg gagatgacga gagcgagaac tccgatgtgg acatcggcga gcctgataca 480 gagggctacg ccatcacaga cagaggcagc gcccctatca gcatgggctt tagagccagc 540 gacgtggaaa cagccgaagg cggagagatt cacgagctgc tgaagctgca gagccggggc 600 aacaactttc ccaagctggg caagaccctg aacgtgccac ctcctccaaa tcctagcaga 660 gccagcacca gcgagacacc catcaagaag ggccacagaa gagagatcgg cctgatctgg 720 aacggcgacc gggtgttcat cgacagatgg tgcaacccca tgtgcagcaa agtgaccctg 780 ggcaccatcc gggccagatg tacatgcgga gagtgcccta gagtgtgcga gcagtgcaga 840 accgataccg gcgtggacac ccggatctgg tatcacaacc tgcctgagat ccccgag 897 <210> 114 <211> 897 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding Measles V protein <400> 114 auggccgaag aacaggccag acacgugaag aacggccugg aaugcaucag agcccugaag 60 gccgagccua ucggaucucu ggcuguggaa gaagccaugg ccgcuuggag cgagaucagc 120 gauaaucccg gccaggaccg ggccaccugu aaagaagaag aggccggauc uagcggccug 180 agcaagccuu gucugucugc caucggcucu acagaaggcg gcgcuccuag aaucagaggc 240 caaggaucug gcgagagcga cgacgaugcu gagacacugg gcauccccag cagaaaucug 300 caggccagcu cuaccggccu gcagugcuau cacguguacg aucacucugg cgaggccgug 360 aagggaaucc aggaugccga uagcaucaug gugcagagcg gccuggaugg cgacucuaca 420 cuuagcggcg gagaugacga gagcgagaac uccgaugugg acaucggcga gccugauaca 480 gagggcuacg ccaucacaga cagaggcagc gccccuauca gcaugggcuu uagagccagc 540 gacguggaaa cagccgaagg cggagagauu cacgagcugc ugaagcugca gagccggggc 600 aacaacuuuc ccaagcuggg caagacccug aacgugccac cuccuccaaa uccuagcaga 660 gccagcacca gcgagacacc caucaagaag ggccacagaa gagagaucgg ccugaucugg 720 aacggcgacc ggguguucau cgacagaugg ugcaacccca ugugcagcaa agugacccug 780 ggcaccaucc gggccagaug uacaugcgga gagugcccua gagugugcga gcagugcaga 840 accgauaccg gcguggacac ccggaucugg uaucacaacc ugccugagau ccccgag 897 <210> 115 <211> 456 <212> PRT <213> Nipah Virus <400> 115 Met Asp Lys Leu Glu Leu Val Asn Asp Gly Leu Asn Ile Ile Asp Phe 1 5 10 15 Ile Gln Lys Asn Gln Lys Glu Ile Gln Lys Thr Tyr Gly Arg Ser Ser 20 25 30 Ile Gln Gln Pro Ser Ile Lys Asp Gln Thr Lys Ala Trp Glu Asp Phe 35 40 45 Leu Gln Cys Thr Ser Gly Glu Ser Glu Gln Val Glu Gly Gly Met Ser 50 55 60 Lys Asp Asp Gly Asp Val Glu Arg Arg Asn Leu Glu Asp Leu Ser Ser 65 70 75 80 Thr Ser Pro Thr Asp Gly Thr Ile Gly Lys Arg Val Ser Asn Thr Arg 85 90 95 Asp Trp Ala Glu Gly Ser Asp Asp Ile Gln Leu Asp Pro Val Val Thr 100 105 110 Asp Val Val Tyr His Asp His Gly Gly Glu Cys Thr Gly Tyr Gly Phe 115 120 125 Thr Ser Ser Pro Glu Arg Gly Trp Ser Asp Tyr Thr Ser Gly Ala Asn 130 135 140 Asn Gly Asn Val Cys Leu Val Ser Asp Ala Lys Met Leu Ser Tyr Ala 145 150 155 160 Pro Glu Ile Ala Val Ser Lys Glu Asp Arg Glu Thr Asp Leu Val His 165 170 175 Leu Glu Asn Lys Leu Ser Thr Thr Gly Leu Asn Pro Thr Ala Val Pro 180 185 190 Phe Thr Leu Arg Asn Leu Ser Asp Pro Ala Lys Asp Ser Pro Val Ile 195 200 205 Ala Glu His Tyr Tyr Gly Leu Gly Val Lys Glu Gln Asn Val Gly Pro 210 215 220 Gln Thr Ser Arg Asn Val Asn Leu Asp Ser Ile Lys Leu Tyr Thr Ser 225 230 235 240 Asp Asp Glu Glu Ala Asp Gln Leu Glu Phe Glu Asp Glu Phe Ala Gly 245 250 255 Ser Ser Ser Glu Val Ile Val Gly Ile Ser Pro Glu Asp Glu Glu Pro 260 265 270 Ser Ser Val Gly Gly Lys Pro Asn Glu Ser Ile Gly Arg Thr Ile Glu 275 280 285 Gly Gln Ser Ile Arg Asp Asn Leu Gln Ala Lys Asp Asn Lys Ser Thr 290 295 300 Asp Val Pro Gly Ala Gly Pro Lys Asp Ser Ala Val Lys Glu Glu Pro 305 310 315 320 Pro Gln Lys Arg Leu Pro Met Leu Ala Glu Glu Phe Glu Cys Ser Gly 325 330 335 Ser Glu Asp Pro Ile Ile Arg Glu Leu Leu Lys Glu Asn Ser Leu Ile 340 345 350 Asn Cys Gln Gln Gly Lys Asp Ala Gln Pro Pro Tyr His Trp Ser Ile 355 360 365 Glu Arg Ser Ile Ser Pro Asp Lys Thr Glu Ile Val Asn Gly Ala Val 370 375 380 Gln Thr Ala Asp Arg Gln Arg Pro Gly Thr Pro Met Pro Lys Ser Arg 385 390 395 400 Gly Ile Pro Ile Lys Lys Gly His Arg Arg Glu Ile Ser Ile Cys Trp 405 410 415 Asp Gly Lys Arg Ala Trp Val Glu Glu Trp Cys Asn Pro Ala Cys Ser 420 425 430 Arg Ile Thr Pro Leu Pro Arg Arg Gln Glu Cys Gln Cys Gly Glu Cys 435 440 445 Pro Thr Glu Cys Phe His Cys Gly 450 455 <210> 116 <211> 1368 <212> DNA <213> Nipah Virus <400> 116 atggataaat tggaactagt caatgatggc ctcaatatta ttgactttat tcagaagaac 60 caaaaagaaa tacagaagac atacggacga tcaagtattc aacaacccag catcaaagat 120 caaacaaaag cctgggaaga ttttctgcag tgcaccagtg gagaatctga acaagttgag 180 gggggaatgt ctaaggatga tggagatgtt gaaagaagaa acttggagga tctatccagt 240 acttctccca cagatggaac tattggaaag agagtgtcga acacccgtga ctgggcagaa 300 ggttcagatg acatacaact ggacccagtg gttacagacg ttgtatacca tgatcatgga 360 ggagaatgta ccggatatgg atttacttca agccctgaga gagggtggag tgattacaca 420 tcaggagcaa acaatgggaa tgtatgtctt gtatctgatg caaagatgct gtcctatgct 480 cccgaaattg cagtttctaa agaagatcgg gaaactgatc tagttcatct tgagaataaa 540 ctatctacta caggactgaa tcccacagca gtaccgttca ctctgagaaa cctgtctgat 600 cctgcaaaag actctcctgt gattgctgaa cactactacg gactaggagt taaagagcaa 660 aacgttggcc ctcagactag cagaaatgtc aatttggaca gcatcaaatt gtacacatca 720 gatgacgaag aggcagatca gcttgaattc gaagatgagt ttgcaggaag ctcaagtgaa 780 gtgatagtcg gcatttctcc tgaagatgaa gagccttcaa gtgttggcgg aaaacccaat 840 gaatccattg gacgtacaat cgaaggccaa tcaatccgag acaaccttca agccaaggac 900 aacaaatcaa cagatgtacc aggagcagga ccgaaagatt cagcagtgaa ggaagaacca 960 ccccagaaga ggctacctat gttagctgaa gaatttgagt gctctggatc ggaagaccca 1020 atcattcggg agctgctgaa ggagaactca ctcataaatt gtcagcaagg gaaagatgct 1080 cagcctccat atcattggag catcgagagg tcaataagcc cggataaaac tgagatcgtc 1140 aacggtgctg tgcaaactgc tgacaggcaa agaccaggaa ctccgatgcc aaagtcccga 1200 ggtattccca ttaaaaaggg gcacagacgc gaaatatcca tctgctggga cggaaaacgt 1260 gcctgggtcg aagagtggtg caacccggca tgttcgagga tcacccccct accaagaagg 1320 caagagtgtc aatgcggaga atgtccaact gaatgcttcc actgcggt 1368 <210> 117 <211> 1368 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding NiV V protein <400> 117 atggacaagc tggaactggt caacgacggc ctgaacatca tcgacttcat ccagaagaac 60 cagaaagaga tccagaaaac ctacggccgg tccagcatcc agcagcctag catcaaggat 120 cagaccaagg cctgggaaga tttcctgcag tgtaccagcg gcgagagcga acaggttgaa 180 ggcggcatga gcaaggacga cggcgacgtg gaaagacgga acctggaaga tctgagcagc 240 acaagcccta ccgatggcac catcggcaag cgggtgtcca acacaagaga ttgggccgag 300 ggcagcgacg acattcagct ggatcctgtg gtcaccgatg tggtgtacca cgatcacggc 360 ggcgagtgta caggctacgg ctttacaagc agccccgaga gaggctggag cgattataca 420 agcggcgcca acaacggcaa cgtgtgcctg gtgtctgacg ccaagatgct gagctacgcc 480 cctgagatcg ccgtgtccaa agaggacaga gaaaccgacc tggtgcacct ggaaaacaag 540 ctgagcacca ccggactgaa ccctaccgcc gtgcctttca cactgagaaa cctgagcgac 600 cccgccaagg actctcctgt gattgccgag cactactacg gcctgggcgt gaaagaacag 660 aacgtgggcc ctcagaccag ccggaacgtg aacctggatt ccatcaagct gtacacctcc 720 gacgacgagg aagccgacca gctggaattc gaggatgagt ttgccggcag cagcagcgaa 780 gtgattgtgg gcatcagccc tgaggacgag gaacctagct ctgttggcgg caagcccaat 840 gagagcatcg gcagaacaat cgagggccag agcatccggg ataacctgca ggccaaggac 900 aacaagagca ccgatgttcc aggcgctggc cctaaggata gcgccgtgaa agaggaacca 960 cctcagaaac ggctgcccat gctggccgag gaatttgagt gtagcggcag cgaggacccc 1020 atcatcagag agctgctgaa agagaacagc ctgatcaact gccagcaggg caaagacgcc 1080 cagcctcctt accactggtc catcgagaga tctatcagcc ccgacaagac cgagatcgtg 1140 aatggcgctg tgcagaccgc cgatagacag aggcctggaa ctcccatgcc taagagcaga 1200 ggcatcccca tcaagaaggg ccacagaaga gagatcagca tctgctggga cggcaagcgc 1260 gcctgggttg aagagtggtg taatcccgcc tgcagccgga tcacacctct gcctagaagg 1320 caagagtgcc agtgtggcga gtgtcccacc gagtgttttc actgtgga 1368 <210> 118 <211> 1368 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding NiV V protein <400> 118 auggacaagc uggaacuggu caacgacggc cugaacauca ucgacuucau ccagaagaac 60 cagaaagaga uccagaaaac cuacggccgg uccagcaucc agcagccuag caucaaggau 120 cagaccaagg ccugggaaga uuuccugcag uguaccagcg gcgagagcga acagguugaa 180 ggcggcauga gcaaggacga cggcgacgug gaaagacgga accuggaaga ucugagcagc 240 acaagcccua ccgauggcac caucggcaag cgggugucca acacaagaga uugggccgag 300 ggcagcgacg acauucagcu ggauccugug gucaccgaug ugguguacca cgaucacggc 360 ggcgagugua caggcuacgg cuuuacaagc agccccgaga gaggcuggag cgauuauaca 420 agcggcgcca acaacggcaa cgugugccug gugucugacg ccaagaugcu gagcuacgcc 480 ccugagaucg ccguguccaa agaggacaga gaaaccgacc uggugcaccu ggaaaacaag 540 cugagcacca ccggacugaa cccuaccgcc gugccuuuca cacugagaaa ccugagcgac 600 cccgccaagg acucuccugu gauugccgag cacuacuacg gccugggcgu gaaagaacag 660 aacgugggcc cucagaccag ccggaacgug aaccuggauu ccaucaagcu guacaccucc 720 gacgacgagg aagccgacca gcuggaauuc gaggaugagu uugccggcag cagcagcgaa 780 gugauugugg gcaucagccc ugaggacgag gaaccuagcu cuguuggcgg caagcccaau 840 gagagcaucg gcagaacaau cgagggccag agcauccggg auaaccugca ggccaaggac 900 aacaagagca ccgauguucc aggcgcuggc ccuaaggaua gcgccgugaa agaggaacca 960 ccucagaaac ggcugcccau gcuggccgag gaauuugagu guagcggcag cgaggacccc 1020 aucaucagag agcugcugaa agagaacagc cugaucaacu gccagcaggg caaagacgcc 1080 cagccuccuu accacugguc caucgagaga ucuaucagcc ccgacaagac cgagaucgug 1140 aauggcgcug ugcagaccgc cgauagacag aggccuggaa cucccaugcc uaagagcaga 1200 ggcaucccca ucaagaaggg ccacagaaga gagaucagca ucugcuggga cggcaagcgc 1260 gccuggguug aagaguggug uaaucccgcc ugcagccgga ucacaccucu gccuagaagg 1320 caagagugcc aguguggcga gugucccacc gaguguuuuc acugugga 1368 <210> 119 <211> 318 <212> PRT <213> Encephalomyocarditis virus <400> 119 Leu Lys Ala Arg Asp Ile Asn Asp Ile Phe Ala Ile Leu Lys Asn Gly 1 5 10 15 Glu Trp Leu Val Lys Leu Ile Leu Ala Ile Arg Asp Trp Ile Lys Ala 20 25 30 Trp Ile Ala Ser Glu Glu Lys Phe Val Thr Met Thr Asp Leu Val Pro 35 40 45 Gly Ile Leu Glu Lys Gln Arg Asp Leu Asn Asp Pro Ser Lys Tyr Lys 50 55 60 Glu Ala Lys Glu Trp Leu Asp Asn Ala Arg Gln Ala Cys Leu Lys Ser 65 70 75 80 Gly Asn Val His Ile Ala Asn Leu Cys Lys Val Val Ala Pro Ala Pro 85 90 95 Ser Lys Ser Arg Pro Glu Pro Val Val Val Cys Leu Arg Gly Lys Ser 100 105 110 Gly Gln Gly Lys Ser Phe Leu Ala Asn Val Leu Ala Gln Ala Ile Ser 115 120 125 Thr His Phe Thr Gly Arg Ile Asp Ser Val Trp Tyr Cys Pro Pro Asp 130 135 140 Pro Asp His Phe Asp Gly Tyr Asn Gln Gln Thr Val Val Val Met Asp 145 150 155 160 Asp Leu Gly Gln Asn Pro Asp Gly Lys Asp Phe Lys Tyr Phe Ala Gln 165 170 175 Met Val Ser Thr Thr Gly Phe Ile Pro Pro Met Ala Ser Leu Glu Asp 180 185 190 Lys Gly Lys Pro Phe Asn Ser Lys Val Ile Ile Ala Thr Thr Asn Leu 195 200 205 Tyr Ser Gly Phe Thr Pro Arg Thr Met Val Cys Pro Asp Ala Leu Asn 210 215 220 Arg Arg Phe His Phe Asp Ile Asp Val Ser Ala Lys Asp Gly Tyr Lys 225 230 235 240 Ile Asn Ser Lys Leu Asp Ile Ile Lys Ala Leu Glu Asp Thr His Ala 245 250 255 Asn Pro Val Ala Met Phe Gln Tyr Asp Cys Ala Leu Leu Asn Gly Met 260 265 270 Ala Val Glu Met Lys Arg Met Gln Gln Asp Met Phe Lys Pro Gln Pro 275 280 285 Pro Leu Gln Asn Val Tyr Gln Leu Val Gln Glu Val Ile Asp Arg Val 290 295 300 Glu Leu His Glu Lys Val Ser Ser His Pro Ile Phe Lys Gln 305 310 315 <210> 120 <211> 954 <212> DNA <213> Encephalomyocarditis virus <400> 120 ctcaaagcac gtgacatcaa cgacatcttc gccattctca agaacggcga gtggctggtc 60 aaactgatcc ttgccatccg cgactggatt aaggcttgga tcgcctcaga agagaagttt 120 gtcaccatga cagacttggt gcctggcatc cttgaaaagc agcgggacct gaacgacccg 180 agcaagtaca aggaagccaa ggagtggctc gacaacgcgc gccaagcgtg tttgaagagc 240 gggaacgtcc acattgccaa cctgtgcaaa gtggtcgcac cagcacccag caagtcgagg 300 cccgaacccg tggttgtttg cctccgcggc aaatctggcc agggcaagag cttccttgca 360 aacgtgcttg cacaggcaat ttccacccac ttcaccggca gaatcgactc agtgtggtac 420 tgcccacctg accctgacca cttcgacggt tacaaccagc aaaccgttgt tgtgatggat 480 gatttgggcc agaaccctga cggcaaggac ttcaaatact ttgcccaaat ggtctcgacc 540 acagggttta tcccgcccat ggcatcactc gaggacaaag gtaaaccttt caacagcaaa 600 gtcatcatcg cgaccaccaa cttgtactcg ggcttcaccc cgaggaccat ggtatgtccc 660 gacgcactga accggaggtt tcactttgac atcgatgtga gtgctaagga tgggtacaaa 720 attaacagca aattggacat tatcaaagca ctcgaagaca cccacgccaa cccagtggca 780 atgtttcaat acgactgtgc ccttctcaac ggcatggccg ttgaaatgaa gagaatgcaa 840 caagacatgt tcaagcctca accacccctc cagaatgtgt accagcttgt tcaggaggtg 900 atcgatcggg tcgagctcca cgagaaagtg tcgagtcacc cgatcttcaa gcag 954 <210> 121 <211> 954 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding EMCV protein <400> 121 ctgaaggcca gagacatcaa cgacatcttc gccatcctga agaacggcga gtggctggtc 60 aagctgatcc tggccatcag agactggatc aaggcctgga tcgccagcga agagaagttc 120 gtgaccatga ccgatctggt gcccggcatc ctggaaaagc agagggacct gaacgacccc 180 agcaagtaca aagaggccaa agaatggctg gacaacgcca gacaggcctg cctgaagtcc 240 ggcaatgtgc atatcgccaa cctgtgcaag gtggtggccc ctgctcctag caagtctaga 300 cctgagcctg tggtcgtgtg cctgagaggc aaatctggcc agggcaagag cttcctggcc 360 aatgttctgg cccaggccat cagcacccac ttcaccggaa gaatcgacag cgtgtggtac 420 tgccctcctg atcctgacca cttcgacggc tacaaccagc agaccgtggt ggtcatggac 480 gacctgggac agaaccccga cggcaaggac ttcaagtact tcgcccagat ggtgtccacc 540 accggcttca ttcctccaat ggccagcctg gaagataagg gcaagccctt caacagcaaa 600 gtgatcattg ccaccaccaa cctgtacagc ggcttcaccc ctagaaccat ggtctgcccc 660 gacgctctga acagacggtt ccactttgac atcgacgtgt ccgccaagga tggctacaag 720 atcaactcca agctggacat catcaaggcc ctcgaggaca cccacgccaa tcctgtggcc 780 atgttccagt acgattgcgc cctgctgaat ggcatggccg tggaaatgaa gcggatgcag 840 caggacatgt tcaagcccca gcctccactg cagaacgtgt accagctcgt gcaagaagtg 900 atcgaccggg tcgagctgca cgagaaggtg tcctctcatc ccatcttcaa gcag 954 <210> 122 <211> 954 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding EMCV protein <400> 122 cugaaggcca gagacaucaa cgacaucuuc gccauccuga agaacggcga guggcugguc 60 aagcugaucc uggccaucag agacuggauc aaggccugga ucgccagcga agagaaguuc 120 gugaccauga ccgaucuggu gcccggcauc cuggaaaagc agagggaccu gaacgacccc 180 agcaaguaca aagaggccaa agaauggcug gacaacgcca gacaggccug ccugaagucc 240 ggcaaugugc auaucgccaa ccugugcaag gugguggccc cugcuccuag caagucuaga 300 ccugagccug uggucgugug ccugagaggc aaaucuggcc agggcaagag cuuccuggcc 360 aauguucugg cccaggccau cagcacccac uucaccggaa gaaucgacag cgugugguac 420 ugcccuccug auccugacca cuucgacggc uacaaccagc agaccguggu ggucauggac 480 gaccugggac agaaccccga cggcaaggac uucaaguacu ucgcccagau gguguccacc 540 accggcuuca uuccuccaau ggccagccug gaagauaagg gcaagcccuu caacagcaaa 600 gugaucauug ccaccaccaa ccuguacagc ggcuucaccc cuagaaccau ggucugcccc 660 gacgcucuga acagacgguu ccacuuugac aucgacgugu ccgccaagga uggcuacaag 720 aucaacucca agcuggacau caucaaggcc cucgaggaca cccacgccaa uccuguggcc 780 auguuccagu acgauugcgc ccugcugaau ggcauggccg uggaaaugaa gcggaugcag 840 caggacaugu ucaagcccca gccuccacug cagaacgugu accagcucgu gcaagaagug 900 aucgaccggg ucgagcugca cgagaaggug uccucucauc ccaucuucaa gcag 954 <210> 123 <211> 257 <212> PRT <213> Avian infectious bursal disease virus <400> 123 Ala Ser Glu Phe Lys Glu Thr Pro Glu Leu Glu Ser Ala Val Arg Ala 1 5 10 15 Met Glu Ala Ala Ala Asn Val Asp Pro Leu Phe Gln Ser Ala Leu Ser 20 25 30 Val Phe Met Trp Leu Glu Glu Asn Gly Ile Val Thr Asp Met Ala Asn 35 40 45 Phe Ala Leu Ser Asp Pro Asn Ala His Arg Met Arg Asn Phe Leu Ala 50 55 60 Asn Ala Pro Gln Ala Gly Ser Lys Ser Gln Arg Ala Lys Tyr Gly Thr 65 70 75 80 Ala Gly Tyr Gly Val Glu Ala Arg Gly Pro Thr Pro Glu Glu Ala Gln 85 90 95 Arg Glu Lys Asp Thr Arg Ile Ser Lys Lys Met Glu Thr Met Gly Ile 100 105 110 Tyr Phe Ala Thr Pro Glu Trp Val Ala Leu Asn Gly His Arg Gly Pro 115 120 125 Ser Pro Gly Gln Leu Lys Tyr Trp Gln Asn Thr Arg Glu Ile Pro Asp 130 135 140 Pro Asn Glu Asp Tyr Leu Asp Tyr Val His Ala Glu Lys Ser Arg Leu 145 150 155 160 Ala Ser Glu Glu Gln Ile Leu Arg Ala Ala Thr Ser Ile Tyr Gly Ala 165 170 175 Pro Gly Gln Ala Glu Pro Pro Gln Ala Phe Ile Asp Glu Val Ala Lys 180 185 190 Val Tyr Glu Ile Asn His Gly Arg Gly Pro Asn Gln Glu Gln Met Lys 195 200 205 Asp Leu Leu Leu Thr Ala Met Glu Met Lys His Arg Asn Pro Arg Arg 210 215 220 Ala Leu Pro Lys Pro Lys Pro Lys Pro Asn Ala Pro Thr Gln Arg Pro 225 230 235 240 Pro Gly Arg Leu Gly Arg Trp Ile Arg Thr Val Ser Asp Glu Asp Leu 245 250 255 Glu <210> 124 <211> 771 <212> DNA <213> Avian infectious bursal disease virus <400> 124 gcatcagagt tcaaagagac ccccgaactc gagagtgccg tcagagcaat ggaagcagca 60 gccaacgtgg acccactatt ccaatctgca ctcagtgtgt tcatgtggct ggaagagaat 120 gggattgtga ctgacatggc caacttcgca ctcagcgacc cgaacgccca tcggatgcga 180 aattttcttg caaacgcacc acaagcaggc agcaagtcgc aaagggccaa gtacgggaca 240 gcaggctacg gagtggaggc tcggggcccc acaccagagg aagcacagag ggaaaaagac 300 acacggatct caaagaagat ggagaccatg ggcatctact ttgcaacacc agaatgggta 360 gcactcaatg ggcaccgagg gccaagcccc ggccagctaa agtactggca gaacacacga 420 gaaataccgg acccaaacga ggactatcta gactacgtgc atgcagagaa gagccggttg 480 gcatcagaag aacaaatcct aagggcagct acgtcgatct acggggctcc aggacaggca 540 gagccacccc aagctttcat agacgaagtt gccaaagtct atgaaatcaa ccatggacgt 600 ggcccaaacc aagaacagat gaaagatctg ctcttgactg cgatggagat gaagcatcgc 660 aatcccaggc gggctctacc aaagcccaag ccaaaaccca atgctccaac acagagaccc 720 cctggtcggc tgggccgctg gatcaggacc gtctctgatg aggaccttga g 771 <210> 125 <211> 771 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding Birnavirus VP3 protein <400> 125 gccagcgagt tcaaagagac acccgagctg gaaagcgccg tcagagctat ggaagccgcc 60 gctaatgtgg accctctgtt tcagtctgcc ctgagcgtgt tcatgtggct ggaagagaac 120 ggcatcgtga ccgacatggc caacttcgcc ctgtctgacc ccaacgctca ccggatgaga 180 aactttctgg ccaacgctcc tcaggccggc agcaagtctc agagagccaa atacggcaca 240 gccggctacg gcgtggaagc cagaggacct acacctgagg aagcccagag agagaaggac 300 acccggatca gcaagaaaat ggaaaccatg ggcatctact tcgccacacc tgagtgggtc 360 gccctgaatg gacacagagg accatctcca ggccagctga agtactggca gaacaccaga 420 gagatccccg atcctaacga ggactacctg gactacgtgc acgccgagaa aagcagactg 480 gccagcgagg aacagatcct gagagccgcc acatccatct atggcgctcc aggacaagcc 540 gaacctccac aggcctttat cgacgaggtg gccaaggtgt acgagatcaa ccacggcaga 600 ggccccaatc aagagcagat gaaggacctg ctgctgaccg ccatggaaat gaagcacaga 660 aaccccagac gggccctgcc taagccaaag cctaaaccta acgctcccac acagcggcct 720 ccaggcagac tcggaagatg gatcagaacc gtgtccgacg aggacctgga a 771 <210> 126 <211> 771 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding Birnavirus VP3 protein <400> 126 gccagcgagu ucaaagagac acccgagcug gaaagcgccg ucagagcuau ggaagccgcc 60 gcuaaugugg acccucuguu ucagucugcc cugagcgugu ucauguggcu ggaagagaac 120 ggcaucguga ccgacauggc caacuucgcc cugucugacc ccaacgcuca ccggaugaga 180 aacuuucugg ccaacgcucc ucaggccggc agcaagucuc agagagccaa auacggcaca 240 gccggcuacg gcguggaagc cagaggaccu acaccugagg aagcccagag agagaaggac 300 acccggauca gcaagaaaau ggaaaccaug ggcaucuacu ucgccacacc ugaguggguc 360 gcccugaaug gacacagagg accaucucca ggccagcuga aguacuggca gaacaccaga 420 gagauccccg auccuaacga ggacuaccug gacuacgugc acgccgagaa aagcagacug 480 gccagcgagg aacagauccu gagagccgcc acauccaucu auggcgcucc aggacaagcc 540 gaaccuccac aggccuuuau cgacgaggug gccaaggugu acgagaucaa ccacggcaga 600 ggccccaauc aagagcagau gaaggaccug cugcugaccg ccauggaaau gaagcacaga 660 aaccccagac gggcccugcc uaagccaaag ccuaaaccua acgcucccac acagcggccu 720 ccaggcagac ucggaagaug gaucagaacc guguccgacg aggaccugga a 771 <210> 127 <211> 94 <212> PRT <213> Porcine delta coronavirus <400> 127 Met Cys Asn Cys His Leu Gln Leu Arg Asp Leu Tyr Arg Leu Cys Asn 1 5 10 15 Lys Leu His Ile Arg Arg Asp Asp Val Pro Glu Leu Ile Asp Pro Leu 20 25 30 Val Lys Thr Arg Cys Phe Ala Tyr Ser Leu Val Val Leu Ala Asn Ala 35 40 45 Asn Pro Ile Ala Phe Ser Ile Leu Pro Arg Lys Ile Leu Ile Asn Gly 50 55 60 Glu Pro Leu Leu Leu Glu Tyr Gly Ser Ile Tyr Gly Lys Asp Phe Ile 65 70 75 80 Ile Arg Pro Ser Leu Gln Val Ile Leu Glu Asp Glu Leu Asn 85 90 <210> 128 <211> 282 <212> DNA <213> Porcine delta coronavirus <400> 128 atgtgcaact gccatctgca gctgcgagat ttatatagat tgtgcaataa gctgcacatc 60 agaagagacg atgttcctga gcttattgac cctctcgtta aaactcgctg ttttgcttac 120 agtctcgtgg ttcttgctaa tgctaatcca attgcattta gcatactacc tcggaaaatt 180 cttatcaatg gtgagccttt actgcttgaa tatggtagca tatatggtaa agactttatc 240 attagaccat cgctccaagt cattcttgaa gatgaattaa at 282 <210> 129 <211> 285 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding Porcine delta coronavirus NS6 protein <400> 129 atgtgcaact gccatctgca gctgcgggac ctgtaccggc tgtgtaacaa gctgcacatc 60 agacgggacg acgtgcccga gctgatcgat cctctggtca agaccagatg cttcgcctac 120 agcctggtgg tgctggccaa cgccaatcct atcgccttca gcatcctgcc tcggaagatc 180 ctgatcaacg gcgagcctct gctgctggaa tacggcagca tctacggcaa ggacttcatc 240 atcagaccca gcctgcaagt gatcctggaa gatgagctga actga 285 <210> 130 <211> 285 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA sequence encoding Porcine delta coronavirus NS6 protein <400> 130 augugcaacu gccaucugca gcugcgggac cuguaccggc uguguaacaa gcugcacauc 60 agacgggacg acgugcccga gcugaucgau ccucugguca agaccagaug cuucgccuac 120 agccuggugg ugcuggccaa cgccaauccu aucgccuuca gcauccugcc ucggaagauc 180 cugaucaacg gcgagccucu gcugcuggaa uacggcagca ucuacggcaa ggacuucauc 240 aucagaccca gccugcaagu gauccuggaa gaugagcuga acuga 285 <210> 131 <211> 99 <212> PRT <213> Lassa virus <400> 131 Met Gly Asn Lys Gln Ala Lys Ala Pro Glu Ser Lys Asp Ser Pro Arg 1 5 10 15 Ala Ser Leu Ile Pro Asp Ala Thr His Leu Gly Pro Gln Phe Cys Lys 20 25 30 Ser Cys Trp Phe Glu Asn Lys Gly Leu Val Glu Cys Asn Asn His Tyr 35 40 45 Leu Cys Leu Asn Cys Leu Thr Leu Leu Leu Ser Val Ser Asn Arg Cys 50 55 60 Pro Ile Cys Lys Met Pro Leu Pro Thr Lys Leu Arg Pro Ser Ala Ala 65 70 75 80 Pro Thr Ala Pro Pro Thr Gly Ala Ala Asp Ser Ile Arg Pro Pro Pro 85 90 95 Tyr Ser Pro <210> 132 <211> 297 <212> DNA <213> Lassa virus <400> 132 atgggaaaca agcaagccaa agccccagaa tcaaaagaca gtccgagagc cagcctgatc 60 ccagatgcca cacatctagg gccacagttc tgtaagagct gctggttcga aaacaagggc 120 ctggttgagt gcaacaacca ctatctgtgt ctcaactgcc tcaccttact tctaagtgtc 180 agcaacaggt gtcccatttg caagatgcct ctccccacaa aactgagacc atcagccgct 240 ccaacagcac ctccaaccgg agcagcggac agcatcagac ccccacccta cagtccc 297 <210> 133 <211> 297 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding LASV Z protein <400> 133 atgggcaaca agcaggccaa ggctcccgag agcaaggata gccctagagc ctctctgatc 60 cccgacgcca cacatctggg accccagttc tgcaagagct gttggttcga gaacaaaggc 120 ctggtggaat gcaacaacca ctacctgtgc ctgaactgtc tgaccctgct gctgagcgtg 180 tccaacagat gccccatctg caagatgccc ctgcctacca agctgaggcc ttctgctgct 240 cctacagctc ctccaacagg cgccgctgat agcatcagac ctccacctta tagcccc 297 <210> 134 <211> 297 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding LASV Z protein <400> 134 augggcaaca agcaggccaa ggcucccgag agcaaggaua gcccuagagc cucucugauc 60 cccgacgcca cacaucuggg accccaguuc ugcaagagcu guugguucga gaacaaaggc 120 cugguggaau gcaacaacca cuaccugugc cugaacuguc ugacccugcu gcugagcgug 180 uccaacagau gccccaucug caagaugccc cugccuacca agcugaggcc uucugcugcu 240 ccuacagcuc cuccaacagg cgccgcugau agcaucagac cuccaccuua uagcccc 297 <210> 135 <211> 90 <212> PRT <213> Dandenong virus <400> 135 Met Gly Gln Ala Lys Ser Lys Glu Thr Lys Leu Ser Lys Lys Glu Asp 1 5 10 15 Arg Ala Glu Val Leu Pro Asp Ala Thr Tyr Leu Gly Pro Leu Asn Cys 20 25 30 Lys Ser Cys Trp Gln Arg Phe Asp Ser Leu Val Arg Cys His Asp His 35 40 45 Tyr Leu Cys Arg Gln Cys Leu Asn Leu Leu Leu Thr Val Ser Asp Arg 50 55 60 Cys Pro Leu Cys Lys His Pro Leu Pro Thr Lys Leu Arg Val Ser Thr 65 70 75 80 Ala Pro Ser Ser Pro Pro Pro Tyr Glu Glu 85 90 <210> 136 <211> 270 <212> DNA <213> Dandenong virus <400> 136 atgggtcaag caaaatccaa agaaacaaag ctctccaaga aagaggacag agcagaggtt 60 ctacctgacg caacctatct tggtcctctg aactgcaaat catgctggca aaggttcgac 120 agtttggtta ggtgccatga ccactaccta tgcaggcaat gtctgaacct tttgttgaca 180 gtctcagaca gatgccctct ctgcaaacac cctctaccga ccaagctgag ggtgtcgaca 240 gcccccagct cacctccccc ctacgaggag 270 <210> 137 <211> 270 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding DANV Z protein <400> 137 atgggccaag ccaagagcaa agagacaaag ctgagcaaga aagaggaccg cgccgaggtt 60 ctgcccgatg ccacatatct gggccctctg aactgcaaga gctgctggca gagattcgac 120 agcctcgtgc ggtgccacga tcactacctg tgcagacagt gcctgaacct gctgctgacc 180 gtgtccgata gatgccctct gtgcaagcac cctctgccta ccaagctgag agtgtccacc 240 gctcctagca gccctccacc ttatgaggaa 270 <210> 138 <211> 270 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding DANV Z protein <400> 138 augggccaag ccaagagcaa agagacaaag cugagcaaga aagaggaccg cgccgagguu 60 cugcccgaug ccacauaucu gggcccucug aacugcaaga gcugcuggca gagauucgac 120 agccucgugc ggugccacga ucacuaccug ugcagacagu gccugaaccu gcugcugacc 180 guguccgaua gaugcccucu gugcaagcac ccucugccua ccaagcugag aguguccacc 240 gcuccuagca gcccuccacc uuaugaggaa 270 <210> 139 <211> 90 <212> PRT <213> Lymphocytic choriomeningitis virus <400> 139 Met Gly Gln Gly Lys Ser Arg Glu Glu Lys Gly Thr Asn Ser Thr Asn 1 5 10 15 Arg Ala Glu Ile Leu Pro Asp Thr Thr Tyr Leu Gly Pro Leu Ser Cys 20 25 30 Lys Ser Cys Trp Gln Lys Phe Asp Ser Leu Val Arg Cys His Asp His 35 40 45 Tyr Leu Cys Arg His Cys Leu Asn Leu Leu Leu Ser Val Ser Asp Arg 50 55 60 Cys Pro Leu Cys Lys Tyr Pro Leu Pro Thr Arg Leu Lys Ile Ser Thr 65 70 75 80 Ala Pro Ser Ser Pro Pro Pro Tyr Glu Glu 85 90 <210> 140 <211> 270 <212> DNA <213> Lymphocytic choriomeningitis virus <400> 140 atgggtcaag gcaagtccag agaggagaaa ggcaccaata gtacaaacag ggccgaaatc 60 ctaccagata ccacctatct tggcccttta agctgcaaat cttgctggca gaaatttgac 120 agcttggtaa gatgccatga ccactacctt tgcaggcact gtttaaacct tctgctgtca 180 gtatccgaca ggtgtcctct ttgtaaatat ccattaccaa ccagattgaa gatatcaaca 240 gccccaagct ctccacctcc ctacgaagag 270 <210> 141 <211> 270 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding LCMV Z protein <400> 141 atgggccagg gcaagtccag agaggaaaag ggcaccaact ccaccaaccg ggccgagatc 60 ctgcctgaca ccacatatct gggccctctg agctgcaaga gctgctggca gaaattcgac 120 agcctcgtgc ggtgccacga ccactacctg tgtagacact gcctgaacct gctgctgagc 180 gtgtccgata gatgccctct gtgcaagtac cctctgccta ccagactgaa gatcagcaca 240 gcccctagca gccctccacc ttacgaagaa 270 <210> 142 <211> 270 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding LCMV Z protein <400> 142 augggccagg gcaaguccag agaggaaaag ggcaccaacu ccaccaaccg ggccgagauc 60 cugccugaca ccacauaucu gggcccucug agcugcaaga gcugcuggca gaaauucgac 120 agccucgugc ggugccacga ccacuaccug uguagacacu gccugaaccu gcugcugagc 180 guguccgaua gaugcccucu gugcaaguac ccucugccua ccagacugaa gaucagcaca 240 gccccuagca gcccuccacc uuacgaagaa 270 <210> 143 <211> 95 <212> PRT <213> Lujo mammarenavirus <400> 143 Met Gly Gln Arg His Ser Ser Gly Ser Gly Gln Pro Asn Pro Lys Pro 1 5 10 15 Ser Asp Ser Asp His Glu Ala Arg Arg Ser Glu Leu His Ser Asp Ala 20 25 30 Ser His Leu Gly Pro Leu Asn Cys Lys Ser Cys Trp Lys Ser Lys Lys 35 40 45 Ala Leu Val Lys Cys Tyr Asp His Tyr Leu Cys Leu Asn Cys Leu Ser 50 55 60 Leu Leu Met Gly Ile Thr Pro Arg Cys Pro Phe Cys Tyr Arg Glu Leu 65 70 75 80 Pro Lys Asn Leu Asp Leu Ala Glu Ala Pro Ser Ala Pro Pro Leu 85 90 95 <210> 144 <211> 285 <212> DNA <213> Lujo mammarenavirus <400> 144 atgggtcaga gacattcctc tggctccggc caacccaacc ccaagccgag tgacagcgat 60 catgaagcga gaaggtcaga gcttcactcg gacgcctccc atctcggacc tctgaactgc 120 aaatcttgct ggaagtcaaa gaaggcactg gtgaagtgct atgatcacta cctctgtcta 180 aactgcttaa gccttctaat gggcatcacc ccaagatgtc ccttctgtta cagagagcta 240 cccaaaaatc tggaccttgc agaggcacca agcgcaccac ccctc 285 <210> 145 <211> 285 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding LUJV Z protein <400> 145 atgggccaga gacacagctc tggaagcggc cagcctaatc ctaagcctag cgacagcgat 60 cacgaggcca gaagaagcga gctgcactcc gatgcctctc acctgggacc tctgaactgc 120 aagagctgct ggaagtccaa gaaagccctg gtcaagtgct acgaccacta cctgtgcctg 180 aactgcctga gcctgctgat gggcattacc cctagatgcc ccttctgcta cagagagctg 240 cccaagaacc tggacctggc cgaagctcct tctgctcctc ctctg 285 <210> 146 <211> 285 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding LUJV Z protein <400> 146 augggccaga gacacagcuc uggaagcggc cagccuaauc cuaagccuag cgacagcgau 60 cacgaggcca gaagaagcga gcugcacucc gaugccucuc accugggacc ucugaacugc 120 aagagcugcu ggaaguccaa gaaagcccug gucaagugcu acgaccacua ccugugccug 180 aacugccuga gccugcugau gggcauuacc ccuagaugcc ccuucugcua cagagagcug 240 cccaagaacc uggaccuggc cgaagcuccu ucugcuccuc cucug 285 <210> 147 <211> 98 <212> PRT <213> Chapare mammarenavirus <400> 147 Met Gly Asn Thr Lys Thr Lys Asp Arg Gln Tyr Gln Ser Asn Ser Ser 1 5 10 15 Gln Pro Thr Asn Thr Ser Ala Pro Val Leu Leu Arg Arg Gln Ala Glu 20 25 30 Pro Ser Leu Tyr Gly Arg His Asn Cys Arg Cys Cys Trp Phe Ala Asp 35 40 45 Thr Asn Leu Val Asn Cys Ser Asn His Tyr Leu Cys Leu Lys Cys Leu 50 55 60 Asn Thr Met Leu Arg Arg Ser Asn Leu Cys Asp Ile Cys Gly Glu Glu 65 70 75 80 Leu Pro Thr Thr Ile Ile Val Pro Val Glu Pro Ser Ala Pro Leu Pro 85 90 95 Gly Gln <210> 148 <211> 294 <212> DNA <213> Chapare mammarenavirus <400> 148 atgggtaaca ccaaaacaaa ggacagacag tatcaatcga actcaagcca acccacaaac 60 acatctgcac cagttctgct gagaaggcag gcagaaccaa gtctgtatgg gagacacaac 120 tgcagatgct gttggtttgc agacacaaac ctagtcaatt gttccaacca ctacctttgc 180 cttaaatgtc tgaacacaat gttaagaaga tccaatctct gtgacatatg cggtgaagaa 240 cttcccacaa caatcattgt tccagtggaa ccatcagcac cactgcccgg acaa 294 <210> 149 <211> 294 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding CHPV Z protein <400> 149 atgggcaaca ccaagaccaa ggaccggcag taccagagca acagcagcca gcctaccaac 60 acatctgccc ctgtgctgct gagaaggcag gccgagcctt ctctgtacgg cagacacaac 120 tgccggtgct gttggttcgc cgacaccaac ctggtcaact gcagcaacca ctacctgtgc 180 ctgaagtgtc tgaacaccat gctgcggcgg agcaacctgt gcgatatctg tggcgaggaa 240 ctgcccacca ccatcatcgt gcctgtggaa ccttctgctc ctctgcctgg acag 294 <210> 150 <211> 294 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding CHPV Z protein <400> 150 augggcaaca ccaagaccaa ggaccggcag uaccagagca acagcagcca gccuaccaac 60 acaucugccc cugugcugcu gagaaggcag gccgagccuu cucuguacgg cagacacaac 120 ugccggugcu guugguucgc cgacaccaac cuggucaacu gcagcaacca cuaccugugc 180 cugaaguguc ugaacaccau gcugcggcgg agcaaccugu gcgauaucug uggcgaggaa 240 cugcccacca ccaucaucgu gccuguggaa ccuucugcuc cucugccugg acag 294 <210> 151 <211> 94 <212> PRT <213> Machupo virus <400> 151 Met Gly Asn Cys Asn Lys Pro Pro Lys Arg Pro Pro Asn Thr Gln Thr 1 5 10 15 Ser Ala Ala Gln Pro Ser Ala Glu Phe Arg Arg Thr Ala Leu Pro Ser 20 25 30 Leu Tyr Gly Arg Tyr Asn Cys Lys Cys Cys Trp Phe Ala Asp Thr Asn 35 40 45 Leu Ile Thr Cys Asn Asp His Tyr Leu Cys Leu Arg Cys His Gln Thr 50 55 60 Met Leu Arg Asn Ser Glu Leu Cys His Ile Cys Trp Lys Pro Leu Pro 65 70 75 80 Thr Ser Ile Thr Val Pro Val Glu Pro Ser Ala Pro Pro Pro 85 90 <210> 152 <211> 282 <212> DNA <213> Machupo virus <400> 152 atgggcaact gtaacaagcc tcccaagagg cctcccaaca cacaaacatc agccgcccag 60 ccctcagcag agttcaggag aacagcccta cccagtctct atggtcgcta caactgcaaa 120 tgttgttggt ttgccgacac aaacttgatt acatgtaacg accactactt gtgtctgaga 180 tgtcatcaaa caatgctcag gaattctgaa ctctgtcaca tatgctggaa accactaccg 240 acatccatca cagtccccgt ggagccaagc gcccccccac ca 282 <210> 153 <211> 282 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding MACV Z protein <400> 153 atgggcaact gcaacaagcc tcctaagcgg cctcctaaca cacagacatc tgccgctcag 60 cctagcgccg agttcagaag aacagccctg cctagcctgt acggccggta caactgcaag 120 tgctgttggt tcgccgacac caacctgatc acctgtaacg accactacct gtgcctgcgg 180 tgccaccaga ccatgctgag aaatagcgag ctgtgccaca tctgctggaa gcccctgcct 240 accagcatca ccgtgcctgt ggaaccttct gctcctcctc ct 282 <210> 154 <211> 282 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding MACV Z protein <400> 154 augggcaacu gcaacaagcc uccuaagcgg ccuccuaaca cacagacauc ugccgcucag 60 ccuagcgccg aguucagaag aacagcccug ccuagccugu acggccggua caacugcaag 120 ugcuguuggu ucgccgacac caaccugauc accuguaacg accacuaccu gugccugcgg 180 ugccaccaga ccaugcugag aaauagcgag cugugccaca ucugcuggaa gccccugccu 240 accagcauca ccgugccugu ggaaccuucu gcuccuccuc cu 282 <210> 155 <211> 95 <212> PRT <213> Guanarito virus <400> 155 Met Gly Asn Ser Lys Ser Lys Ser Asn Pro Ser Ser Ser Ser Glu Ser 1 5 10 15 Gln Lys Gly Ala Pro Thr Val Thr Glu Phe Arg Arg Thr Ala Ile His 20 25 30 Ser Leu Tyr Gly Arg Tyr Asn Cys Lys Cys Cys Trp Phe Ala Asp Lys 35 40 45 Asn Leu Ile Lys Cys Ser Asp His Tyr Leu Cys Leu Arg Cys Leu Asn 50 55 60 Val Met Leu Lys Asn Ser Asp Leu Cys Asn Ile Cys Trp Glu Gln Leu 65 70 75 80 Pro Thr Cys Ile Thr Val Pro Glu Glu Pro Ser Ala Pro Pro Glu 85 90 95 <210> 156 <211> 285 <212> DNA <213> Guanarito virus <400> 156 atgggcaatt caaaatctaa atccaaccca tccagttcct cagagtctca aaaaggggca 60 ccaacagtca cagaatttag gaggactgcc attcacagtc tctatgggag gtacaactgc 120 aagtgttgct ggtttgctga caagaatctg attaaatgct ctgatcatta cctctgcttg 180 aggtgtttaa atgtcatgct gaaaaactct gatctttgca acatttgttg ggagcagctg 240 cccacatgca tcacagttcc ggaggagcca agcgctccac cggaa 285 <210> 157 <211> 285 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding GTOV Z protein <400> 157 atgggcaaca gcaagtccaa gagcaacccc agcagcagct ccgagtctca gaaaggcgct 60 cctaccgtga ccgagttcag aagaacagcc atccacagcc tgtacggccg gtacaactgc 120 aagtgctgtt ggttcgccga caagaacctg atcaagtgca gcgaccacta cctgtgcctg 180 cggtgcctga acgtgatgct gaagaactcc gacctgtgca acatctgctg ggagcagctg 240 cctacctgca tcaccgtgcc tgaggaacct tctgctcctc ctgaa 285 <210> 158 <211> 285 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding GTOV Z protein <400> 158 augggcaaca gcaaguccaa gagcaacccc agcagcagcu ccgagucuca gaaaggcgcu 60 ccuaccguga ccgaguucag aagaacagcc auccacagcc uguacggccg guacaacugc 120 aagugcuguu gguucgccga caagaaccug aucaagugca gcgaccacua ccugugccug 180 cggugccuga acgugaugcu gaagaacucc gaccugugca acaucugcug ggagcagcug 240 ccuaccugca ucaccgugcc ugaggaaccu ucugcuccuc cugaa 285 <210> 159 <211> 94 <212> PRT <213> Junin virus <400> 159 Met Gly Asn Cys Asn Gly Ala Ser Lys Ser Asn Gln Pro Asp Ser Ser 1 5 10 15 Arg Val Thr Gln Pro Ala Ala Glu Phe Arg Arg Val Ala His Ser Ser 20 25 30 Leu Tyr Gly Arg Tyr Asn Cys Lys Cys Cys Trp Phe Ala Asp Thr Asn 35 40 45 Leu Ile Thr Cys Asn Asp His Tyr Leu Cys Leu Arg Cys His Gln Val 50 55 60 Met Leu Arg Asn Ser Asp Leu Cys Asn Ile Cys Trp Lys Pro Leu Pro 65 70 75 80 Thr Thr Ile Thr Val Pro Val Glu Pro Thr Ala Pro Pro Pro 85 90 <210> 160 <211> 282 <212> DNA <213> Junin virus <400> 160 atgggcaact gcaacggggc atccaagtca aaccagccag actcttcaag ggtcacacag 60 ccagccgcag aattcaggag ggtggctcac agcagtctat atggtagata caactgcaag 120 tgctgctggt ttgctgacac caatctgata acctgcaatg atcactacct ttgtttaagg 180 tgccatcagg ttatgttaag gaattcggac ctctgcaata tctgttggaa gcccctacct 240 accacaatca cagtgccggt ggagccaaca gcaccaccac ca 282 <210> 161 <211> 282 <212> DNA <213> Artificial Sequence <220> <223> Codon otpimised DNA encoding JUNV Z protein <400> 161 atgggcaatt gcaacggcgc cagcaagagc aaccagcctg atagcagcag agtgacacag 60 cctgccgccg agtttagaag agtggcccac agcagcctgt acggccggta caattgcaag 120 tgctgttggt tcgccgacac caacctgatc acctgtaacg accactacct gtgcctgcgg 180 tgccaccaag tgatgctgag aaacagcgac ctgtgcaaca tctgctggaa gcccctgcct 240 accaccatca ccgtgcctgt ggaacctaca gctcctcctc ct 282 <210> 162 <211> 282 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding JUNV Z protein <400> 162 augggcaauu gcaacggcgc cagcaagagc aaccagccug auagcagcag agugacacag 60 ccugccgccg aguuuagaag aguggcccac agcagccugu acggccggua caauugcaag 120 ugcuguuggu ucgccgacac caaccugauc accuguaacg accacuaccu gugccugcgg 180 ugccaccaag ugaugcugag aaacagcgac cugugcaaca ucugcuggaa gccccugccu 240 accaccauca ccgugccugu ggaaccuaca gcuccuccuc cu 282 <210> 163 <211> 100 <212> PRT <213> Sabia virus <400> 163 Met Gly Asn Ser Lys Ser Lys Ser Lys Leu Ser Ala Asn Gln Tyr Glu 1 5 10 15 Gln Gln Thr Val Asn Ser Thr Lys Gln Val Ala Ile Leu Lys Arg Gln 20 25 30 Ala Glu Pro Ser Leu Tyr Gly Arg His Asn Cys Arg Cys Cys Trp Phe 35 40 45 Ala Asn Thr Asn Leu Ile Lys Cys Ser Asp His Tyr Ile Cys Leu Lys 50 55 60 Cys Leu Asn Ile Met Leu Gly Lys Ser Ser Phe Cys Asp Ile Cys Gly 65 70 75 80 Glu Glu Leu Pro Thr Ser Ile Val Val Pro Ile Glu Pro Ser Ala Pro 85 90 95 Pro Pro Glu Asp 100 <210> 164 <211> 300 <212> DNA <213> Sabia virus <400> 164 atgggtaact ccaagtcaaa atcaaagctg tctgctaacc agtatgaaca gcaaacagtc 60 aatagcacca aacaggtagc cattttaaag agacaggctg aacctagtct gtatggaaga 120 cacaactgca ggtgctgctg gttcgccaat acaaatctaa taaaatgttc cgaccattat 180 atttgtctaa aatgtttgaa cataatgttg gggaagtctt ctttttgtga catttgtggt 240 gaagagctcc ccacatccat tgtggtgccc atcgaaccaa gtgctccacc tccagaagac 300 300 <210> 165 <211> 300 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding SABV Z protein <400> 165 atgggcaaca gcaagagcaa gtccaagctg agcgccaacc agtacgagca gcagaccgtg 60 aacagcacca aacaggtggc catcctgaag agacaggccg agcctagcct gtacggcaga 120 cacaactgcc ggtgttgttg gttcgccaac accaacctga tcaagtgcag cgaccactac 180 atctgcctga agtgcctgaa catcatgctg ggcaagagca gcttctgcga catctgcgga 240 gaggaactgc ccacctctat cgtggtgcct atcgagcctt ctgctcctcc acctgaggat 300 300 <210> 166 <211> 300 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding SABV Z protein <400> 166 augggcaaca gcaagagcaa guccaagcug agcgccaacc aguacgagca gcagaccgug 60 aacagcacca aacagguggc cauccugaag agacaggccg agccuagccu guacggcaga 120 cacaacugcc gguguuguug guucgccaac accaaccuga ucaagugcag cgaccacuac 180 aucugccuga agugccugaa caucaugcug ggcaagagca gcuucugcga caucugcgga 240 gaggaacugc ccaccucuau cguggugccu aucgagccuu cugcuccucc accugaggau 300 300 <210> 167 <211> 183 <212> PRT <213> Coxsackievirus <400> 167 Gly Pro Ser Leu Asp Phe Ala Leu Ser Leu Leu Arg Arg Asn Ile Arg 1 5 10 15 Gln Val Gln Thr Asp Gln Gly His Phe Thr Met Leu Gly Val Arg Asp 20 25 30 Arg Leu Ala Ile Leu Pro Arg His Ser Gln Pro Gly Lys Thr Ile Trp 35 40 45 Val Glu His Lys Leu Ile Asn Val Leu Asp Ala Val Glu Leu Val Asp 50 55 60 Glu Gln Gly Val Asn Leu Glu Leu Thr Leu Val Thr Leu Asp Thr Asn 65 70 75 80 Glu Lys Phe Arg Asp Val Thr Lys Phe Ile Pro Glu Thr Ile Thr Gly 85 90 95 Ala Ser Asp Ala Thr Leu Val Ile Asn Thr Glu His Met Pro Ser Met 100 105 110 Phe Val Pro Val Gly Asp Val Val Gln Tyr Gly Phe Leu Asn Leu Ser 115 120 125 Gly Lys Pro Thr His Arg Thr Met Met Tyr Asn Phe Pro Thr Lys Ala 130 135 140 Gly Gln Cys Gly Gly Val Val Thr Ser Val Gly Lys Ile Ile Gly Ile 145 150 155 160 His Ile Gly Gly Asn Gly Arg Gln Gly Phe Cys Ala Gly Leu Lys Arg 165 170 175 Gly Tyr Phe Ala Ser Glu Gln 180 <210> 168 <211> 549 <212> DNA <213> Coxsackievirus <400> 168 ggaccgagct tagactttgc cttatccctc ctaaggcgca acattagaca ggtgcaaacc 60 gaccaaggac acttcactat gttaggggtg cgagatcgcc tagccatttt gccacgccac 120 tcgcaaccag gaaaaactat ctgggtggag cacaagttaa ttaatgtgct ggatgctgtc 180 gaattagtgg atgagcaagg tgtaaacttg gaactcacac tagtaacctt agacaccaac 240 gaaaagttta gggatgttac caagtttatt ccagagacga tcaccggggc aagcgacgca 300 accttggtca tcaacactga gcacatgccc tcaatgttcg ttccagtggg tgatgttgta 360 caatatggat ttctgaatct cagcggtaag cccacacacc gaaccatgat gtacaatttc 420 cccacaaagg caggacagtg tggaggggtg gtcacctcag tcggtaagat cataggaatt 480 cacattggtg ggaatggacg ccagggtttc tgcgctggac tgaagagagg ctattttgcc 540 agtgaacag 549 <210> 169 <211> 549 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding CV-A16 3C protease <400> 169 ggcccttctc tggattttgc cctgagcctg ctgcggcgga acatcagaca ggtgcagaca 60 gatcagggcc acttcaccat gctgggcgtc agagacagac tggccatcct gcctagacac 120 agccagcctg gcaagaccat ctgggtcgag cacaagctga tcaacgtgct ggacgccgtg 180 gaactggtgg atgaacaggg cgtgaacctg gaactgaccc tggtcaccct ggacaccaac 240 gagaagttcc gggacgtgac caagttcatc cccgagacaa tcaccggcgc ctccgatgcc 300 acactggtca tcaataccga gcacatgccc tccatgttcg tgcctgtggg agatgtggtg 360 cagtacggct tcctgaacct gagcggcaag cccacacacc ggaccatgat gtacaacttc 420 cctaccaagg ccggccagtg cggcggagtg gttacatctg tgggcaagat catcggcatc 480 cacatcggcg gcaatggcag acagggattt tgtgccggcc tgaagagagg ctacttcgcc 540 tctgaacag 549 <210> 170 <211> 549 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding CV-A16 3C protease <400> 170 ggcccuucuc uggauuuugc ccugagccug cugcggcgga acaucagaca ggugcagaca 60 gaucagggcc acuucaccau gcugggcguc agagacagac uggccauccu gccuagacac 120 agccagccug gcaagaccau cugggucgag cacaagcuga ucaacgugcu ggacgccgug 180 gaacuggugg augaacaggg cgugaaccug gaacugaccc uggucacccu ggacaccaac 240 gagaaguucc gggacgugac caaguucauc cccgagacaa ucaccggcgc cuccgaugcc 300 acacugguca ucaauaccga gcacaugccc uccauguucg ugccuguggg agauguggug 360 caguacggcu uccugaaccu gagcggcaag cccacacacc ggaccaugau guacaacuuc 420 ccuaccaagg ccggccagug cggcggagug guuacaucug ugggcaagau caucggcauc 480 cacaucggcg gcaauggcag acagggauuu ugugccggcc ugaagagagg cuacuucgcc 540 ucugaacag 549 <210> 171 <211> 179 <212> PRT <213> Coxsackievirus <400> 171 Gly Pro Ser Leu Asp Phe Ala Leu Ser Leu Leu Arg Arg Asn Ile Arg 1 5 10 15 Gln Val Gln Thr Asp Gln Gly His Phe Thr Met Leu Gly Val Arg Asp 20 25 30 Arg Leu Ala Val Leu Pro Arg His Ser Gln Pro Gly Lys Thr Ile Trp 35 40 45 Val Glu His Lys Leu Val Asn Val Val Asp Ala Val Glu Leu Val Asp 50 55 60 Glu Gln Gly Val Asn Leu Glu Leu Thr Leu Ile Thr Leu Asp Thr Asn 65 70 75 80 Glu Lys Phe Arg Asp Ile Thr Lys Phe Ile Pro Glu Asn Ile Ser Ala 85 90 95 Ala Ser Asp Ala Thr Leu Val Ile Asn Thr Glu His Met Pro Ser Met 100 105 110 Phe Val Pro Val Gly Asp Val Val Gln Tyr Gly Phe Leu Asn Leu Ser 115 120 125 Gly Lys Pro Thr His Arg Thr Met Met Tyr Asn Phe Pro Thr Lys Ala 130 135 140 Gly Gln Cys Gly Gly Val Val Thr Ser Val Gly Lys Val Ile Gly Ile 145 150 155 160 His Ile Gly Gly Asn Gly Arg Gln Gly Phe Cys Ala Gly Leu Lys Arg 165 170 175 Ser Tyr Phe <210> 172 <211> 537 <212> DNA <213> Coxsackievirus <400> 172 ggacctagcc ttgattttgc cctatcccta ctgagaagga acatcagaca agttcaaacg 60 gaccaagggc acttcaccat gctaggagtc agagatcgct tggccgtcct cccacgacac 120 tcacaacccg gaaaaactat ctgggtagag cacaagctag tgaatgttgt ggatgctgtc 180 gaactagtgg atgagcaggg ggtcaactta gagctgactt taatcaccct cgacactaat 240 gagaagttta gagacatcac caaatttatt ccagagaata tcagcgctgc cagcgatgcc 300 actctagtga ttaatacaga gcacatgcct tctatgtttg tgccagtagg tgatgttgtt 360 cagtatggtt tcctgaatct tagtgggaaa ccaacccacc gcactatgat gtataacttc 420 cctaccaagg caggacagtg tggaggggta gtcacatcag ttggaaaggt cattggtatc 480 cacataggag gcaatggcag gcaaggtttc tgtgcagggc tcaagagaag ctacttt 537 <210> 173 <211> 537 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding CV-A6 3C protease <400> 173 ggcccttctc tggattttgc cctgagcctg ctgcggcgga acatcagaca ggtgcagaca 60 gatcagggcc acttcaccat gctgggcgtc agagatagac tggccgtgct gcctagacac 120 agccagcctg gaaagaccat ctgggtcgag cacaagctgg tcaacgtggt ggatgccgtg 180 gaactggtgg atgagcaggg cgtgaacctg gaactgaccc tgatcaccct ggacaccaac 240 gagaagttcc gggacatcac caagttcatc cccgagaaca tcagcgccgc ctccgatgcc 300 acactggtca tcaataccga gcacatgccc tccatgttcg tgcctgtggg agatgtggtg 360 cagtacggct tcctgaacct gagcggcaag cccacacacc ggaccatgat gtacaacttc 420 cctaccaagg ccggccagtg cggcggagtg gttacatctg tgggcaaagt gatcggaatc 480 cacatcggcg gcaatggcag acagggcttt tgtgccggcc tgaagagaag ctacttc 537 <210> 174 <211> 537 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding CV-A6 3C protease <400> 174 ggcccuucuc uggauuuugc ccugagccug cugcggcgga acaucagaca ggugcagaca 60 gaucagggcc acuucaccau gcugggcguc agagauagac uggccgugcu gccuagacac 120 agccagccug gaaagaccau cugggucgag cacaagcugg ucaacguggu ggaugccgug 180 gaacuggugg augagcaggg cgugaaccug gaacugaccc ugaucacccu ggacaccaac 240 gagaaguucc gggacaucac caaguucauc cccgagaaca ucagcgccgc cuccgaugcc 300 acacugguca ucaauaccga gcacaugccc uccauguucg ugccuguggg agauguggug 360 caguacggcu uccugaaccu gagcggcaag cccacacacc ggaccaugau guacaacuuc 420 ccuaccaagg ccggccagug cggcggagug guuacaucug ugggcaaagu gaucggaauc 480 cacaucggcg gcaauggcag acagggcuuu ugugccggcc ugaagagaag cuacuuc 537 <210> 175 <211> 183 <212> PRT <213> Enterovirus 68 <400> 175 Gly Pro Gly Phe Asp Phe Ala Gln Ala Ile Met Lys Lys Asn Thr Val 1 5 10 15 Ile Ala Arg Thr Glu Lys Gly Glu Phe Thr Met Leu Gly Val Tyr Asp 20 25 30 Arg Val Ala Val Ile Pro Thr His Ala Ser Val Gly Glu Ile Ile Tyr 35 40 45 Ile Asn Asp Val Glu Thr Arg Val Leu Asp Ala Cys Ala Leu Arg Asp 50 55 60 Leu Thr Asp Thr Asn Leu Glu Ile Thr Ile Val Lys Leu Asp Arg Asn 65 70 75 80 Gln Lys Phe Arg Asp Ile Arg His Phe Leu Pro Arg Cys Glu Asp Asp 85 90 95 Tyr Asn Asp Ala Val Leu Ser Val His Thr Ser Lys Phe Pro Asn Met 100 105 110 Tyr Ile Pro Val Gly Gln Val Thr Asn Tyr Gly Phe Leu Asn Leu Gly 115 120 125 Gly Thr Pro Thr His Arg Ile Leu Met Tyr Asn Phe Pro Thr Arg Ala 130 135 140 Gly Gln Cys Gly Gly Val Val Thr Thr Thr Gly Lys Val Ile Gly Ile 145 150 155 160 His Val Gly Gly Asn Gly Ala Gln Gly Phe Ala Ala Met Leu Leu His 165 170 175 Ser Tyr Phe Thr Asp Thr Gln 180 <210> 176 <211> 549 <212> DNA <213> Enterovirus 68 <400> 176 ggaccaggat ttgattttgc gcaagccata atgaagaaaa atactgttat tgctagaact 60 gaaaaaggcg agttcacaat gcttggtgtg tatgatagag tggcagtcat tccaacacat 120 gcatctgttg gagaaatcat ttacatcaac gatgtagaaa ccagagttct agatgcatgt 180 gcacttagag acttgacaga cacaaaccta gaaataacta tagtcaaatt ggatcgcaat 240 caaaaattta gagacatcag acacttttta cccagatgtg aggatgatta caatgatgct 300 gtgcttagtg tacatacatc aaaattccct aacatgtaca ttccagttgg acaagtcact 360 aactacggct tcttgaacct gggcggcaca ccaacacatc ggattttaat gtataatttt 420 ccaacaagag ctggtcagtg tggtggtgtg gtgacaacca caggtaaagt gataggaata 480 cacgtgggcg ggaatggagc tcagggattc gcagcaatgt tgctccactc ttactttact 540 gatacacaa 549 <210> 177 <211> 549 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding EV D-68 3C protease <400> 177 ggccctggct ttgattttgc ccaggccatc atgaagaaaa acaccgtgat cgcccggacc 60 gagaagggcg agtttacaat gctgggcgtg tacgacagag tggccgtgat tcctacacac 120 gcctctgtgg gcgagatcat ctacatcaac gacgtggaaa ccagagtgct ggacgcctgc 180 gctctgagag atctgaccga caccaacctg gaaatcacca tcgtgaagct ggaccggaac 240 cagaagttcc gggacatccg gcactttctg cccagatgcg aggacgacta caacgacgct 300 gtgctgagcg tgcacaccag caagttcccc aacatgtaca tccccgtggg ccaagtgacc 360 aactacggct tcctgaatct cggcggcacc cctacacacc ggatcctgat gtacaacttc 420 cccaccagag ccggccagtg tggcggagtg gttaccacaa caggcaaagt gatcggcatc 480 cacgtcggcg gaaatggcgc tcagggattt gctgccatgc tgctgcacag ctacttcacc 540 gacacacag 549 <210> 178 <211> 549 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding EV D-68 3C protease <400> 178 ggcccuggcu uugauuuugc ccaggccauc augaagaaaa acaccgugau cgcccggacc 60 gagaagggcg aguuuacaau gcugggcgug uacgacagag uggccgugau uccuacacac 120 gccucugugg gcgagaucau cuacaucaac gacguggaaa ccagagugcu ggacgccugc 180 gcucugagag aucugaccga caccaaccug gaaaucacca ucgugaagcu ggaccggaac 240 cagaaguucc gggacauccg gcacuuucug cccagaugcg aggacgacua caacgacgcu 300 gugcugagcg ugcacaccag caaguucccc aacauguaca uccccguggg ccaagugacc 360 aacuacggcu uccugaaucu cggcggcacc ccuacacacc ggauccugau guacaacuuc 420 cccaccagag ccggccagug uggcggagug guuaccacaa caggcaaagu gaucggcauc 480 cacgucggcg gaaauggcgc ucagggauuu gcugccaugc ugcugcacag cuacuucacc 540 gacacacag 549 <210> 179 <211> 179 <212> PRT <213> Enterovirus 71 <400> 179 Gly Pro Ser Leu Asp Phe Ala Leu Ser Leu Leu Arg Arg Asn Ile Arg 1 5 10 15 Gln Val Gln Thr Asp Gln Gly His Phe Thr Met Leu Gly Val Arg Asp 20 25 30 His Leu Ala Val Leu Pro Arg His Ser Gln Pro Gly Lys Thr Ile Trp 35 40 45 Val Glu His Lys Leu Val Lys Ile Val Asp Ala Val Glu Leu Val Asp 50 55 60 Glu Gln Gly Val Asn Leu Glu Leu Thr Leu Val Thr Leu Asp Thr Asn 65 70 75 80 Glu Lys Phe Arg Asp Ile Thr Arg Phe Ile Pro Glu Thr Ile Ser Pro 85 90 95 Ala Ser Asp Ala Thr Leu Val Ile Asn Thr Glu His Met Pro Ser Met 100 105 110 Phe Val Pro Val Gly Asp Val Val Gln Tyr Gly Phe Leu Asn Leu Ser 115 120 125 Gly Lys Pro Thr His Arg Thr Met Met Tyr Asn Phe Pro Thr Lys Ala 130 135 140 Gly Gln Cys Gly Gly Ala Val Thr Ala Val Gly Lys Val Ile Gly Ile 145 150 155 160 His Ile Gly Gly Asn Gly Arg Gln Gly Phe Cys Ala Ala Leu Lys Arg 165 170 175 Gly Tyr Phe <210> 180 <211> 537 <212> DNA <213> Enterovirus 71 <400> 180 gggccgagct tggacttcgc cctatctcta cttaggagga acattaggca ggtccaaacc 60 gaccagggcc actttacaat gttaggagtg cgagaccact tggctgtgct ccccagacac 120 tcccaaccag gaaagaccat ctgggttgaa cacaaattag tgaagatcgt agacgctgtg 180 gagctagtag atgaacaagg ggttaaccta gagctcacac tggtaacgct tgacaccaac 240 gaaaaattta gagacatcac aagattcata ccagaaacaa ttagtcctgc tagtgatgcc 300 actttagtta taaatactga acatatgccc agtatgtttg tgccagttgg agatgtggtc 360 cagtatggat ttttgaacct tagtggtaag cccactcaca ggactatgat gtacaatttc 420 ccaacaaaag caggacagtg tggtggtgct gtgactgccg taggtaaagt gattgggatt 480 cacattggtg gcaacggtag acaaggtttc tgcgctgccc tgaagagggg ttacttt 537 <210> 181 <211> 537 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding EVD-71 3C protease <400> 181 ggcccttctc tggattttgc cctgagcctg ctgcggcgga acatcagaca ggtgcagaca 60 gatcagggcc acttcaccat gctgggcgtc agagatcatc tggccgtgct gcctagacac 120 agccagcctg gaaagaccat ctgggtcgag cacaagctgg tcaagatcgt ggacgccgtg 180 gaactggtgg atgagcaggg cgttaacctg gaactgaccc tggtcaccct ggacaccaac 240 gagaagttcc gggacatcac ccggttcatc cccgagacaa ttagccctgc ctccgacgcc 300 acactggtca tcaataccga gcacatgccc tccatgttcg tgcctgtggg agatgtggtg 360 cagtacggct tcctgaacct gagcggcaag cccacacacc ggaccatgat gtacaacttc 420 cctaccaagg ccggccagtg cggcggagct gttacagctg tgggaaaagt gatcggcatc 480 cacatcggcg gcaatggcag acagggattc tgtgccgctc tgaagagagg ctacttc 537 <210> 182 <211> 537 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding EVD-71 3C protease <400> 182 ggcccuucuc uggauuuugc ccugagccug cugcggcgga acaucagaca ggugcagaca 60 gaucagggcc acuucaccau gcugggcguc agagaucauc uggccgugcu gccuagacac 120 agccagccug gaaagaccau cugggucgag cacaagcugg ucaagaucgu ggacgccgug 180 gaacuggugg augagcaggg cguuaaccug gaacugaccc uggucacccu ggacaccaac 240 gagaaguucc gggacaucac ccgguucauc cccgagacaa uuagcccugc cuccgacgcc 300 acacugguca ucaauaccga gcacaugccc uccauguucg ugccuguggg agauguggug 360 caguacggcu uccugaaccu gagcggcaag cccacacacc ggaccaugau guacaacuuc 420 ccuaccaagg ccggccagug cggcggagcu guuacagcug ugggaaaagu gaucggcauc 480 cacaucggcg gcaauggcag acagggauuc ugugccgcuc ugaagagagg cuacuuc 537 <210> 183 <211> 183 <212> PRT <213> Poliovirus <400> 183 Gly Pro Gly Phe Asp Tyr Ala Val Ala Met Ala Lys Arg Asn Ile Val 1 5 10 15 Thr Ala Thr Thr Ser Lys Gly Glu Phe Thr Met Leu Gly Val His Asp 20 25 30 Asn Val Ala Ile Leu Pro Thr His Ala Ser Pro Gly Glu Ser Ile Val 35 40 45 Ile Asp Gly Lys Glu Val Glu Ile Leu Asp Ala Lys Ala Leu Glu Asp 50 55 60 Gln Ala Gly Thr Asn Leu Glu Ile Thr Ile Ile Thr Leu Lys Arg Asn 65 70 75 80 Glu Lys Phe Arg Asp Ile Arg Pro His Ile Pro Thr Gln Ile Thr Glu 85 90 95 Thr Asn Asp Gly Val Leu Ile Val Asn Thr Ser Lys Tyr Pro Asn Met 100 105 110 Tyr Val Pro Val Gly Ala Val Thr Glu Gln Gly Tyr Leu Asn Leu Gly 115 120 125 Gly Arg Gln Thr Ala Arg Thr Leu Met Tyr Asn Phe Pro Thr Arg Ala 130 135 140 Gly Gln Cys Gly Gly Val Ile Thr Cys Thr Gly Lys Val Ile Gly Met 145 150 155 160 His Val Gly Gly Asn Gly Ser His Gly Phe Ala Ala Ala Leu Lys Arg 165 170 175 Ser Tyr Phe Thr Gln Ser Gln 180 <210> 184 <211> 549 <212> DNA <213> Poliovirus <400> 184 ggaccagggt tcgattacgc agtggctatg gctaaaagaa acattgttac agcaactact 60 agcaagggag agttcactat gttaggagtc cacgacaacg tggctatttt accaacccac 120 gcttcacctg gtgaaagcat tgtgatcgat ggcaaagaag tggagatctt ggatgccaaa 180 gcgctcgaag atcaagcagg aaccaatctt gaaatcacta taatcactct aaagagaaat 240 gaaaagttca gagacattag accacatata cctactcaaa tcactgagac aaatgatgga 300 gtcttgatcg tgaacactag caagtacccc aatatgtatg ttcctgtcgg tgctgtgact 360 gaacagggat atctaaatct cggtgggcgc caaactgctc gtactctaat gtacaacttt 420 ccaaccagag caggacagtg tggtggagtc atcacatgta ctgggaaagt catcgggatg 480 catgttggtg ggaacggttc acacgggttt gcagcggccc tgaagcgatc atacttcact 540 cagagtcaa 549 <210> 185 <211> 549 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding Poliovirus HEV-C 3C protease <400> 185 ggccctggct ttgattatgc cgtggccatg gctaagcgga acatcgtgac agccaccacc 60 agcaagggcg agtttacaat gctgggcgtg cacgacaacg tggccatcct gcctacacat 120 gctagccctg gcgagagcat cgtgatcgac ggcaaagagg tggaaatcct ggacgccaag 180 gctctggaag atcaggccgg caccaacctg gaaatcacca tcatcaccct gaagcggaac 240 gagaagttcc gggacatcag acctcacatc cccacacaga tcaccgagac aaacgacggc 300 gtgctgatcg tgaataccag caagtacccc aatatgtacg tgcccgtggg cgccgtgaca 360 gagcagggat atctgaatct cggcggcaga cagaccgcca gaacactgat gtacaacttc 420 cccaccagag ccggccagtg cggcggagtg attacatgta ccggcaaagt gatcggcatg 480 cacgtcggcg gcaatggctc tcacggattt gctgccgctc tgaagagaag ctacttcacc 540 cagagccag 549 <210> 186 <211> 549 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encpding Poliovirus HEV-C 3C protease <400> 186 ggcccuggcu uugauuaugc cguggccaug gcuaagcgga acaucgugac agccaccacc 60 agcaagggcg aguuuacaau gcugggcgug cacgacaacg uggccauccu gccuacacau 120 gcuagcccug gcgagagcau cgugaucgac ggcaaagagg uggaaauccu ggacgccaag 180 gcucuggaag aucaggccgg caccaaccug gaaaucacca ucaucacccu gaagcggaac 240 gagaaguucc gggacaucag accucacauc cccacacaga ucaccgagac aaacgacggc 300 gugcugaucg ugaauaccag caaguacccc aauauguacg ugcccguggg cgccgugaca 360 gagcagggau aucugaaucu cggcggcaga cagaccgcca gaacacugau guacaacuuc 420 cccaccagag ccggccagug cggcggagug auuacaugua ccggcaaagu gaucggcaug 480 cacgucggcg gcaauggcuc ucacggauuu gcugccgcuc ugaagagaag cuacuucacc 540 cagagccag 549 <210> 187 <211> 149 <212> PRT <213> Poliovirus <400> 187 Gly Phe Gly His Gln Asn Lys Ala Val Tyr Thr Ala Gly Tyr Lys Ile 1 5 10 15 Cys Asn Tyr His Leu Ala Thr Gln Asp Asp Leu Gln Asn Ala Val Asn 20 25 30 Val Met Trp Ser Arg Asp Leu Leu Val Thr Glu Ser Arg Ala Gln Gly 35 40 45 Thr Asp Ser Ile Ala Arg Cys Asn Cys Asn Ala Gly Val Tyr Tyr Cys 50 55 60 Glu Ser Arg Arg Lys Tyr Tyr Pro Val Ser Phe Val Gly Pro Thr Phe 65 70 75 80 Gln Tyr Met Glu Ala Asn Asn Tyr Tyr Pro Ala Arg Tyr Gln Ser His 85 90 95 Met Leu Ile Gly His Gly Phe Ala Ser Pro Gly Asp Cys Gly Gly Ile 100 105 110 Leu Arg Cys His His Gly Val Ile Gly Ile Ile Thr Ala Gly Gly Glu 115 120 125 Gly Leu Val Ala Phe Ser Asp Ile Arg Asp Leu Tyr Ala Tyr Glu Glu 130 135 140 Glu Ala Met Glu Gln 145 <210> 188 <211> 447 <212> DNA <213> Poliovirus <400> 188 ggattcggac accaaaacaa agcggtgtac actgcaggtt acaaaatttg caactaccac 60 ttggccactc aggatgattt gcaaaacgca gtgaacgtca tgtggagtag agacctctta 120 gtcacagaat caagagccca gggcaccgat tcaatcgcaa ggtgcaattg caacgcaggg 180 gtgtactact gcgagtctag aaggaaatac tacccagtat ccttcgttgg cccaacgttc 240 cagtacatgg aggctaataa ctattaccca gctaggtacc agtcccatat gctcattggc 300 catggattcg catctccagg ggattgtggt ggcatactca gatgtcacca cggggtgata 360 gggatcatta ctgctggtgg cgaagggttg gttgcatttt cagacattag agacttgtat 420 gcctacgaag aagaagccat ggaacaa 447 <210> 189 <211> 447 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding Poliovirus HEV-C 2A protease <400> 189 ggctttggcc accagaacaa ggccgtgtac acagccggct acaagatctg caactaccac 60 ctggccacac aggacgacct gcagaacgcc gtgaatgtga tgtggtccag ggacctgctg 120 gtcaccgaat ctagagccca gggcaccgac tctatcgcca gatgcaactg taatgccggc 180 gtgtactact gcgagagccg gcggaagtac taccccgtgt cttttgtggg ccccaccttc 240 cagtacatgg aagccaacaa ctactaccct gccagatacc agagccacat gctgatcggc 300 cacggctttg ctagccctgg cgattgtggc ggcatcctga gatgtcacca tggcgtgatc 360 ggcatcatca ccgctggcgg agaaggactg gtggccttca gcgacatcag agatctgtac 420 gcctacgaag aggaagccat ggaacag 447 <210> 190 <211> 447 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding Poliovirus HEV-C 2A protease <400> 190 ggcuuuggcc accagaacaa ggccguguac acagccggcu acaagaucug caacuaccac 60 cuggccacac aggacgaccu gcagaacgcc gugaauguga ugugguccag ggaccugcug 120 gucaccgaau cuagagccca gggcaccgac ucuaucgcca gaugcaacug uaaugccggc 180 guguacuacu gcgagagccg gcggaaguac uaccccgugu cuuuuguggg ccccaccuuc 240 caguacaugg aagccaacaa cuacuacccu gccagauacc agagccacau gcugaucggc 300 cacggcuuug cuagcccugg cgauuguggc ggcauccuga gaugucacca uggcgugauc 360 ggcaucauca ccgcuggcgg agaaggacug guggccuuca gcgacaucag agaucuguac 420 gccuacgaag aggaagccau ggaacag 447 <210> 191 <211> 150 <212> PRT <213> Coxsackievirus <400> 191 Gly Ala Phe Gly Gln Gln Ser Gly Ala Val Tyr Val Gly Asn Tyr Arg 1 5 10 15 Val Val Asn Arg His Leu Ala Thr Ser Ala Asp Trp Gln Asn Cys Val 20 25 30 Trp Glu Ser Tyr Asn Arg Asp Leu Leu Val Ser Thr Thr Thr Ala His 35 40 45 Gly Cys Asp Ile Ile Ala Arg Cys Gln Cys Thr Thr Gly Val Tyr Phe 50 55 60 Cys Ala Ser Lys Asn Lys His Tyr Pro Ile Ser Phe Glu Gly Pro Gly 65 70 75 80 Leu Val Glu Val Gln Glu Ser Glu Tyr Tyr Pro Arg Arg Tyr Gln Ser 85 90 95 His Val Leu Leu Ala Ala Gly Phe Ser Glu Pro Gly Asp Cys Gly Gly 100 105 110 Ile Leu Arg Cys Glu His Gly Val Ile Gly Ile Val Thr Met Gly Gly 115 120 125 Glu Gly Val Val Gly Phe Ala Asp Ile Arg Asp Leu Leu Trp Leu Glu 130 135 140 Asp Asp Ala Met Glu Gln 145 150 <210> 192 <211> 450 <212> DNA <213> Coxsackievirus <400> 192 ggcgcatttg gacaacaatc aggggcagtg tatgtgggga actacagggt ggtaaataga 60 catctagcta ccagtgctga ctggcaaaac tgtgtgtggg aaagttacaa cagagacctc 120 ttagtgagca cgaccacagc acatggatgt gatattatag ccagatgtca gtgcacaacg 180 ggagtgtact tttgtgcgtc caaaaacaag cactacccaa tttcgtttga aggaccaggt 240 ctagtagagg tccaagagag tgaatactac cccaggagat accaatccca tgtgctttta 300 gcagctggat tttccgaacc aggtgactgt ggcggtatcc taaggtgtga gcatggtgtc 360 attggcattg tgaccatggg gggtgaaggc gtggtcggct ttgcagacat ccgtgatctc 420 ctgtggctgg aagatgatgc aatggaacag 450 <210> 193 <211> 450 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding CVB3 2A protease <400> 193 ggagcttttg gacagcagtc tggcgccgtg tacgtgggca attaccgggt cgtgaataga 60 cacctggcca cctctgccga ctggcagaat tgtgtgtggg agagctacaa ccgggacctg 120 ctggtgtcta ccacaacagc ccacggctgc gacatcattg ccagatgcca gtgtacaacc 180 ggcgtgtact tctgcgccag caagaacaag cactacccca tcagcttcga aggccctggc 240 ctggtggaag tgcaagagag cgagtactac cctcggagat accagagcca cgtgctgctg 300 gccgctggct tttctgaacc tggcgattgt ggcggcatcc tgagatgtga acacggcgtg 360 atcggcatcg tgaccatggg cggagaaggc gttgtgggct tcgccgacat tagagatctg 420 ctgtggctgg aagatgacgc catggaacag 450 <210> 194 <211> 450 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding CVB3 2A protease <400> 194 ggagcuuuug gacagcaguc uggcgccgug uacgugggca auuaccgggu cgugaauaga 60 caccuggcca ccucugccga cuggcagaau uguguguggg agagcuacaa ccgggaccug 120 cuggugucua ccacaacagc ccacggcugc gacaucauug ccagaugcca guguacaacc 180 ggcguguacu ucugcgccag caagaacaag cacuacccca ucagcuucga aggcccuggc 240 cugguggaag ugcaagagag cgaguacuac ccucggagau accagagcca cgugcugcug 300 gccgcuggcu uuucugaacc uggcgauugu ggcggcaucc ugagauguga acacggcgug 360 aucggcaucg ugaccauggg cggagaaggc guugugggcu ucgccgacau uagagaucug 420 cuguggcugg aagaugacgc cauggaacag 450 <210> 195 <211> 150 <212> PRT <213> Enterovirus 71 <400> 195 Gly Lys Phe Gly Gln Gln Ser Gly Ala Ile Tyr Val Gly Asn Phe Arg 1 5 10 15 Val Val Asn Arg His Leu Ala Thr His Asn Asp Trp Ala Asn Leu Val 20 25 30 Trp Glu Asp Ser Ser Arg Asp Leu Leu Val Ser Ser Thr Thr Ala Gln 35 40 45 Gly Cys Asp Thr Ile Ala Arg Cys Asn Cys Gln Thr Gly Val Tyr Tyr 50 55 60 Cys Asn Ser Arg Arg Lys His Tyr Pro Val Ser Phe Ser Lys Pro Ser 65 70 75 80 Leu Ile Tyr Val Glu Ala Ser Glu Tyr Tyr Pro Ala Arg Tyr Gln Ser 85 90 95 His Leu Met Leu Ala Gln Gly His Ser Glu Pro Gly Asp Cys Gly Gly 100 105 110 Ile Leu Arg Cys Gln His Gly Val Val Gly Ile Val Ser Thr Gly Gly 115 120 125 Asn Gly Leu Val Gly Phe Ala Asp Val Arg Asp Leu Leu Trp Leu Asp 130 135 140 Glu Glu Ala Met Glu Gln 145 150 <210> 196 <211> 450 <212> DNA <213> Enterovirus 71 <400> 196 ggaaaatttg ggcaacagtc tggggccatt tatgtgggta actttagagt ggtcaaccgt 60 catcttgcca ctcacaatga ttgggcaaat cttgtttggg aagacagctc tcgcgactta 120 ctcgtgtcat ccaccaccgc ccaaggttgt gacacgattg cccgctgcaa ttgccagaca 180 ggggtgtact actgtaactc gaggagaaaa cactacccag tcagtttttc aaaacccagt 240 ctgatctatg tagaggctag cgagtattac ccagccaggt accagtcaca tcttatgctc 300 gcacagggcc actcagagcc tggtgattgc ggtggtatcc ttagatgcca acatggcgtc 360 gtcggtatag tgtcaactgg tggtaacggg ctcgttggct ttgcagacgt cagggacctc 420 ttgtggttag atgaagaagc tatggagcag 450 <210> 197 <211> 450 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding EV71 2A protease <400> 197 ggcaagtttg gacagcagag cggcgccatc tacgtgggca atttccgggt cgtgaaccgg 60 cacctggcca cacataacga ctgggccaat ctcgtgtggg aagatagcag cagggacctg 120 ctggtgtcca gcacaacagc ccagggctgc gatacaatcg ccagatgcaa ttgccagacc 180 ggcgtgtact actgcaacag cagacggaag cactaccccg tgtccttcag caagcccagc 240 ctgatctatg tggaagccag cgagtactac cccgccagat accagtctca cctgatgctg 300 gcccagggcc attctgagcc aggcgattgt ggcggaatcc tgagatgcca gcatggcgtc 360 gtgggcattg tgtctaccgg cggaaatggc ctcgtgggat ttgccgatgt tcgcgacctg 420 ctgtggctgg acgaagaggc tatggaacag 450 <210> 198 <211> 450 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding EV71 2A protease <400> 198 ggcaaguuug gacagcagag cggcgccauc uacgugggca auuuccgggu cgugaaccgg 60 caccuggcca cacauaacga cugggccaau cucguguggg aagauagcag cagggaccug 120 cuggugucca gcacaacagc ccagggcugc gauacaaucg ccagaugcaa uugccagacc 180 ggcguguacu acugcaacag cagacggaag cacuaccccg uguccuucag caagcccagc 240 cugaucuaug uggaagccag cgaguacuac cccgccagau accagucuca ccugaugcug 300 gcccagggcc auucugagcc aggcgauugu ggcggaaucc ugagaugcca gcauggcguc 360 gugggcauug ugucuaccgg cggaaauggc cucgugggau uugccgaugu ucgcgaccug 420 cuguggcugg acgaagaggc uauggaacag 450 <210> 199 <211> 219 <212> PRT <213> Human metapneumovirus <400> 199 Met Glu Val Lys Val Glu Asn Ile Arg Ala Ile Asp Met Leu Lys Ala 1 5 10 15 Arg Val Lys Asn Arg Val Ala Arg Ser Lys Cys Phe Lys Asn Ala Ser 20 25 30 Leu Ile Leu Ile Gly Ile Thr Thr Leu Ser Ile Ala Leu Asn Ile Tyr 35 40 45 Leu Ile Ile Asn Tyr Thr Ile Gln Lys Thr Ser Ser Glu Ser Glu His 50 55 60 His Thr Ser Ser Pro Pro Thr Glu Ser Asn Lys Glu Ala Ser Thr Ile 65 70 75 80 Ser Thr Asp Asn Pro Asp Ile Asn Pro Asn Ser Gln His Pro Thr Gln 85 90 95 Gln Ser Thr Glu Asn Pro Thr Leu Asn Pro Ala Ala Ser Val Ser Pro 100 105 110 Ser Glu Thr Glu Pro Ala Ser Thr Pro Asp Thr Thr Asn Arg Leu Ser 115 120 125 Ser Val Asp Arg Ser Thr Ala Gln Pro Ser Glu Ser Arg Thr Lys Thr 130 135 140 Lys Pro Thr Val His Thr Arg Asn Asn Pro Ser Thr Ala Ser Ser Thr 145 150 155 160 Gln Ser Pro Pro Arg Ala Thr Thr Lys Ala Ile Arg Arg Ala Thr Thr 165 170 175 Phe Arg Met Ser Ser Thr Gly Lys Arg Pro Thr Thr Thr Ser Val Gln 180 185 190 Ser Asp Ser Ser Thr Thr Thr Gln Asn His Glu Glu Thr Gly Ser Ala 195 200 205 Asn Pro Gln Ala Ser Val Ser Thr Met Gln Asn 210 215 <210> 200 <211> 657 <212> DNA <213> Human metapneumovirus <400> 200 atggaggtga aagtagagaa cattcgagca atagacatgc tcaaagcaag agtgaaaaat 60 cgtgtggcac gtagcaaatg ctttaaaaat gcttctttaa tcctcatagg aataactaca 120 ctgagtatag ctctcaatat ctatctgatc ataaactaca caatacaaaa aacctcatct 180 gaatcagaac accacaccag ctcaccaccc acagaatcca acaaggaagc ttcaacaatc 240 tccacagaca acccagacat caatccaaac tcacagcatc caactcaaca gtccacagaa 300 aaccccacac tcaaccccgc agcatcagtg agcccatcag aaacagaacc agcatcaaca 360 ccagacacaa caaaccgcct gtcctccgta gacaggtcca cagcacaacc aagtgaaagc 420 agaacaaaga caaaaccgac agtccacaca agaaacaacc caagcacagc ttccagtaca 480 caatccccac cacgggcaac aacgaaggca atccgcagag ccaccacttt ccgcatgagc 540 agcacaggaa aaagaccaac cacaacatca gtccagtccg acagcagcac cacaacccaa 600 aatcatgaag aaacaggttc agcgaaccca caggcatctg taagcacaat gcaaaac 657 <210> 201 <211> 657 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding hMPV G protein <400> 201 atggaagtga aggtcgagaa catccgggcc atcgacatgc tgaaggccag agtgaagaac 60 agagtggccc ggtccaagtg cttcaagaac gccagcctga tcctgatcgg catcaccaca 120 ctgtctatcg ccctgaacat ctacctgatc atcaactaca ccatccagaa aaccagcagc 180 gagagcgagc accacacaag ctctccacct accgagagca acaaagaggc cagcaccatc 240 agcaccgaca atcccgacat caaccccaac tctcagcacc ccacacagca gtccaccgag 300 aatcccacac tgaaccctgc cgcctctgtg tccccatctg agacagaacc tgccagcaca 360 cccgacacca ccaacagact gtctagcgtg gacagaagca cagcccagcc tagcgagagc 420 cggaccaaga caaaacctac cgtgcacacc cggaacaacc ctagcacagc cagctctaca 480 cagagccctc caagagccac caccaaggcc attagaaggg ccaccacctt ccggatgagc 540 agcaccggca aaagacctac caccaccagc gtgcagagcg acagcagcac aaccacacag 600 aaccacgagg aaaccggcag cgccaatcct caggctagcg tgtccaccat gcagaac 657 <210> 202 <211> 657 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding hMPV G protein <400> 202 auggaaguga aggucgagaa cauccgggcc aucgacaugc ugaaggccag agugaagaac 60 agaguggccc gguccaagug cuucaagaac gccagccuga uccugaucgg caucaccaca 120 cugucuaucg cccugaacau cuaccugauc aucaacuaca ccauccagaa aaccagcagc 180 gagagcgagc accacacaag cucuccaccu accgagagca acaaagaggc cagcaccauc 240 agcaccgaca aucccgacau caaccccaac ucucagcacc ccacacagca guccaccgag 300 aaucccacac ugaacccugc cgccucugug uccccaucug agacagaacc ugccagcaca 360 cccgacacca ccaacagacu gucuagcgug gacagaagca cagcccagcc uagcgagagc 420 cggaccaaga caaaaccuac cgugcacacc cggaacaacc cuagcacagc cagcucuaca 480 cagagcccuc caagagccac caccaaggcc auuagaaggg ccaccaccuu ccggaugagc 540 agcaccggca aaagaccuac caccaccagc gugcagagcg acagcagcac aaccacacag 600 aaccacgagg aaaccggcag cgccaauccu caggcuagcg uguccaccau gcagaac 657 <210> 203 <211> 183 <212> PRT <213> Coxsackievirus <400> 203 Gly Pro Ala Phe Glu Phe Ala Val Ala Met Met Lys Arg Asn Ser Ser 1 5 10 15 Thr Val Lys Thr Glu Tyr Gly Glu Phe Thr Met Leu Gly Ile Tyr Asp 20 25 30 Arg Trp Ala Val Leu Pro Arg His Ala Lys Pro Gly Pro Thr Ile Leu 35 40 45 Met Asn Asp Gln Glu Val Gly Val Leu Asp Ala Lys Glu Leu Val Asp 50 55 60 Lys Asp Gly Thr Asn Leu Glu Leu Thr Leu Leu Lys Leu Asn Arg Asn 65 70 75 80 Glu Lys Phe Arg Asp Ile Arg Gly Phe Leu Ala Lys Glu Glu Val Glu 85 90 95 Val Asn Glu Ala Val Leu Ala Ile Asn Thr Ser Lys Phe Pro Asn Met 100 105 110 Tyr Ile Pro Val Gly Gln Val Thr Glu Tyr Gly Phe Leu Asn Leu Gly 115 120 125 Gly Thr Pro Thr Lys Arg Met Leu Met Tyr Asn Phe Pro Thr Arg Ala 130 135 140 Gly Gln Cys Gly Gly Val Leu Met Ser Thr Gly Lys Val Leu Gly Ile 145 150 155 160 His Val Gly Gly Asn Gly His Gln Gly Phe Ser Ala Ala Leu Leu Lys 165 170 175 His Tyr Phe Asn Asp Glu Gln 180 <210> 204 <211> 549 <212> DNA <213> Coxsackievirus <400> 204 ggccctgcct ttgagttcgc cgtcgcaatg atgaaaagga actcaagcac ggtgaaaact 60 gaatatggcg agtttaccat gctgggcatc tatgacaggt gggccgtttt gccacgccac 120 gccaaacctg ggccaaccat cttgatgaat gatcaagagg ttggtgtgct agatgccaag 180 gagctagtag acaaggacgg caccaactta gaactgacac tactcaaatt gaaccggaat 240 gagaagttca gagacatcag aggcttctta gccaaggagg aagtggaggt taatgaggca 300 gtgctagcaa ttaacaccag caagtttccc aacatgtaca ttccagtagg acaggtcaca 360 gaatacggct tcctaaacct aggtggcaca cccaccaaga gaatgcttat gtacaacttc 420 cccacaagag caggccagtg tggtggagtg ctcatgtcca ccggcaaggt actgggtatc 480 catgttggtg gaaatggcca tcagggcttc tcagcagcac tcctcaaaca ctacttcaat 540 gatgagcaa 549 <210> 205 <211> 549 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding CVB3 3C protease <400> 205 ggacctgcct ttgaattcgc cgtggccatg atgaagcgga acagcagcac cgtgaaaacc 60 gagtacggcg agttcaccat gctgggcatc tacgacagat gggccgtgct gcctagacac 120 gccaaacctg gacctaccat cctgatgaac gaccaagaag tgggcgttct ggacgccaaa 180 gaactggtgg acaaggacgg caccaacctg gaactgaccc tgctgaagct gaaccggaac 240 gagaagttcc gggatatcag aggcttcctg gccaaagaag aggtggaagt caacgaagcc 300 gtgctggcca tcaacaccag caagttcccc aacatgtaca tccccgtggg ccaagtgaca 360 gagtacggct tcctgaatct cggcggcacc cctaccaagc ggatgctgat gtacaacttc 420 cccaccagag ccggccagtg tggcggagtt cttatgtcta ccggcaaggt gctgggaatc 480 cacgttggcg gaaatggcca ccagggcttt tctgccgctc tgctgaaaca ctacttcaac 540 gacgagcag 549 <210> 206 <211> 549 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding CVB3 3C protease <400> 206 ggaccugccu uugaauucgc cguggccaug augaagcgga acagcagcac cgugaaaacc 60 gaguacggcg aguucaccau gcugggcauc uacgacagau gggccgugcu gccuagacac 120 gccaaaccug gaccuaccau ccugaugaac gaccaagaag ugggcguucu ggacgccaaa 180 gaacuggugg acaaggacgg caccaaccug gaacugaccc ugcugaagcu gaaccggaac 240 gagaaguucc gggauaucag aggcuuccug gccaaagaag agguggaagu caacgaagcc 300 gugcuggcca ucaacaccag caaguucccc aacauguaca uccccguggg ccaagugaca 360 gaguacggcu uccugaaucu cggcggcacc ccuaccaagc ggaugcugau guacaacuuc 420 cccaccagag ccggccagug uggcggaguu cuuaugucua ccggcaaggu gcugggaauc 480 cacguuggcg gaaauggcca ccagggcuuu ucugccgcuc ugcugaaaca cuacuucaac 540 gacgagcag 549 <210> 207 <211> 631 <212> PRT <213> Hepatitis C virus <400> 207 Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Phe Ser Thr 1 5 10 15 Ile Val Thr Ser Leu Thr Gly Arg Asp Thr Asn Glu Asn Cys Gly Glu 20 25 30 Val Gln Val Leu Ser Thr Ala Thr Gln Ser Phe Leu Gly Thr Ala Val 35 40 45 Asn Gly Val Met Trp Thr Val Tyr His Gly Ala Gly Ala Lys Thr Ile 50 55 60 Ser Gly Pro Lys Gly Pro Val Asn Gln Met Tyr Thr Asn Val Asp Gln 65 70 75 80 Asp Leu Val Gly Trp Pro Ala Pro Pro Gly Val Arg Ser Leu Ala Pro 85 90 95 Cys Thr Cys Gly Ser Ala Asp Leu Tyr Leu Val Thr Arg His Ala Asp 100 105 110 Val Ile Pro Val Arg Arg Arg Gly Asp Thr Arg Gly Ala Leu Leu Ser 115 120 125 Pro Arg Pro Ile Ser Ile Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu 130 135 140 Cys Pro Met Gly His Arg Ala Gly Ile Phe Arg Ala Ala Val Cys Thr 145 150 155 160 Arg Gly Val Ala Lys Ala Val Asp Phe Val Pro Val Glu Ser Leu Glu 165 170 175 Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Thr Pro Pro Ala 180 185 190 Val Pro Gln Thr Tyr Gln Val Ala His Leu His Ala Pro Thr Gly Ser 195 200 205 Gly Lys Ser Thr Lys Val Pro Ala Ala His Ala Ala Gln Gly Tyr Lys 210 215 220 Val Leu Val Leu Asn Pro Ser Val Ala Ala Thr Leu Gly Phe Gly Val 225 230 235 240 Tyr Met Ser Lys Ala Tyr Gly Ile Asp Pro Asn Ile Arg Ser Gly Val 245 250 255 Arg Thr Ile Thr Thr Gly Ala Pro Ile Thr Tyr Ser Thr Tyr Gly Lys 260 265 270 Phe Leu Ala Asp Gly Gly Cys Ser Gly Gly Ala Tyr Asp Ile Ile Ile 275 280 285 Cys Asp Glu Cys Tyr Ser Thr Asp Ser Thr Thr Ile Leu Gly Ile Gly 290 295 300 Thr Val Leu Asp Gln Ala Glu Thr Ala Gly Val Arg Leu Thr Val Leu 305 310 315 320 Ala Thr Ala Thr Pro Pro Gly Ser Val Thr Thr Pro His Ser Asn Ile 325 330 335 Glu Glu Val Ala Leu Pro Thr Thr Gly Glu Ile Pro Phe Tyr Gly Lys 340 345 350 Ala Ile Pro Leu Glu Leu Ile Lys Gly Gly Arg His Leu Ile Phe Cys 355 360 365 His Ser Lys Lys Lys Cys Asp Glu Leu Ala Arg Gln Leu Thr Ser Leu 370 375 380 Gly Leu Asn Ala Val Ala Tyr Tyr Arg Gly Leu Asp Val Ser Val Ile 385 390 395 400 Pro Thr Ser Gly Asp Val Val Val Cys Ala Thr Asp Ala Leu Met Thr 405 410 415 Gly Phe Thr Gly Asp Phe Asp Ser Val Ile Asp Cys Asn Thr Ser Val 420 425 430 Ile Gln Thr Val Asp Phe Ser Leu Asp Pro Thr Phe Ser Ile Glu Ile 435 440 445 Thr Thr Val Pro Gln Asp Ala Val Ser Arg Ser Gln Arg Arg Gly Arg 450 455 460 Thr Gly Arg Gly Arg Leu Gly Thr Tyr Arg Tyr Val Thr Pro Gly Glu 465 470 475 480 Arg Pro Ser Gly Met Phe Asp Thr Ala Glu Leu Cys Glu Cys Tyr Asp 485 490 495 Ala Gly Cys Ala Trp Tyr Glu Leu Thr Pro Ala Glu Thr Thr Thr Arg 500 505 510 Leu Lys Ala Tyr Phe Asp Thr Pro Gly Leu Pro Val Cys Gln Asp His 515 520 525 Leu Glu Phe Trp Glu Ser Val Phe Thr Gly Leu Thr His Ile Asp Gly 530 535 540 His Phe Leu Ser Gln Thr Lys Gln Ser Gly Glu Asn Phe Pro Tyr Leu 545 550 555 560 Val Ala Tyr Gln Ala Thr Val Ser Ala Lys Val Trp Leu Ala Pro Pro 565 570 575 Ser Trp Asp Thr Met Trp Lys Cys Leu Ile Arg Leu Lys Pro Thr Leu 580 585 590 His Gly Pro Thr Pro Leu Leu Tyr Arg Leu Gly Ser Val Gln Asn Glu 595 600 605 Val Val Leu Thr His Pro Ile Thr Lys Tyr Ile Met Ala Cys Met Ser 610 615 620 Ala Asp Leu Glu Val Val Thr 625 630 <210> 208 <211> 1893 <212> DNA <213> Hepatitis C virus <400> 208 gcccccatca cagcatacgc acagcagacc cgcggcttgt tcagcaccat cgtaacgagc 60 ctcactggca gggacaccaa tgagaattgt ggcgaagtgc aggtcttatc caccgctacg 120 cagtccttcc tgggtactgc ggttaacggc gtgatgtgga ccgtctacca cggggcgggt 180 gccaagacca tcagcggccc gaagggacct gtcaatcaaa tgtacactaa tgttgaccaa 240 gacttggtgg ggtggccagc accccccgga gtcagatctc ttgctccgtg cacctgcggc 300 tcggcagact tgtatctagt caccaggcac gcggatgtaa tacccgtgcg caggagagga 360 gacaccagag gagctctctt gagccctaga ccaatatcca ttcttaaggg atcttccgga 420 ggtccgctgc tgtgccccat gggacaccgc gccggcatat tccgtgcggc ggtgtgtact 480 cggggggtag ccaaggcggt agacttcgtc ccggttgaat ctcttgagac taccatgaga 540 tcaccagtgt tcactgacaa ctcaacaccc ccagcagtgc cccagaccta ccaggtcgcg 600 cacctacacg caccaacagg aagtggcaag agcactaagg tcccggcggc gcatgctgcc 660 caaggctata aagtgctagt gctcaatcct tcggttgcgg ccacactggg ttttggggta 720 tacatgtcca aggcatatgg catcgacccg aacatccggt cgggagtcag gaccatcacc 780 acgggtgcgc caatcacgta ctcaacgtat ggtaagttcc tggctgatgg aggttgcagc 840 ggaggggcat acgacataat catctgtgac gagtgctatt ccactgactc cacaacgatc 900 cttggcatag gcacagtcct ggaccaagcg gagaccgctg gagtgcgcct caccgtgctc 960 gcgactgcta ctccgccagg gtcagtgact acacctcatt ccaacataga ggaggtcgcc 1020 ctgccaacaa cgggggaaat acccttttac ggcaaggcga tccctctgga gctgatcaag 1080 gggggcagac atctcatctt ctgccattca aagaaaaagt gcgatgaact ggccagacaa 1140 ctgacatctc ttggtctgaa tgccgtagcc tactacagag gcttagacgt ttcggtgatt 1200 cccacgtctg gggacgtcgt ggtatgcgcc acggacgccc tcatgacggg tttcaccggc 1260 gactttgact cagtgataga ctgcaataca tctgtgatac agactgttga cttcagcttg 1320 gaccccacct tctccataga gattacaacc gttccccagg acgcggtatc ccgcagccag 1380 cggagaggcc gcactggtag ggggaggttg ggcacatacc ggtatgtcac cccgggagag 1440 agaccatcag gcatgtttga cactgcagag ctttgcgagt gctacgatgc cgggtgcgcc 1500 tggtacgagc tgacacctgc tgaaaccaca acaaggctga aagcttactt cgacacacca 1560 ggccttcctg tgtgccaaga ccatctggaa ttctgggaga gcgtctttac agggttaacc 1620 cacatagacg gtcatttcct atcccagacc aagcaatcgg gtgagaattt cccgtatctt 1680 gttgcttacc aagcgacggt gtcggccaag gtctggctcg ctccaccaag ctgggacacc 1740 atgtggaagt gcctaattcg ccttaagccc accctgcacg ggcccacgcc cctcctctac 1800 agactggggt ctgtgcagaa tgaagtggtg ctcacccatc ccatcaccaa atacatcatg 1860 gcttgcatgt cagctgatct cgaggtagtg aca 1893 <210> 209 <211> 1893 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding Hepatitis C NS3/4A protein <400> 209 gcccctatca cagcctacgc tcagcagacc agaggcctgt tcagcaccat cgtgacaagc 60 ctgaccggca gagacaccaa cgagaattgt ggcgaggtgc aggtcctgtc tacagctacc 120 cagagctttc tgggcaccgc cgtgaatggc gtgatgtgga cagtgtatca tggcgctggc 180 gccaagacaa tctctggccc taagggcccc gtgaaccaga tgtacaccaa cgtggaccag 240 gacctcgttg gctggcctgc tcctcctggt gttagaagcc tggctccttg tacatgcggc 300 agcgccgatc tgtacctggt cacaagacac gccgacgtga tccccgtcag aagaagaggc 360 gatacaagag gcgccctgct gagccctaga cctatctcta tcctgaaggg cagctctggc 420 ggccctctgc tttgtcctat gggacacaga gccggcatct tcagagccgc cgtgtgtact 480 agaggcgtgg ccaaggctgt ggacttcgtg cctgtggaaa gcctggaaac caccatgaga 540 agccccgtgt tcaccgacaa cagcacccct ccagctgtgc ctcagacata ccaggtggcc 600 catctgcatg cccctacagg ctctggcaag agcacaaaag tgcctgccgc tcatgctgcc 660 cagggctata aggtgctggt gctcaatcct agcgtggccg ccacactcgg ctttggcgtg 720 tacatgtcta aggcctacgg catcgacccc aacatcagat ctggcgtgcg gaccatcaca 780 acaggcgccc caatcaccta ctctacctac ggcaagttcc tggccgatgg cggatgttct 840 ggcggagcct acgacatcat catctgcgac gagtgctaca gcaccgacag caccacaatc 900 ctcggcatcg gcacagtgct ggatcaggct gaaacagccg gcgtcagact gactgtgctg 960 gccacagcta cacctccagg cagcgtgaca acccctcaca gcaacatcga ggaagtggcc 1020 ctgcctacaa ccggcgagat cccattctat ggcaaggcca ttcctctcga gctgatcaaa 1080 ggcggcagac acctgatctt ttgccacagc aagaagaagt gcgacgagct ggccagacag 1140 ctgacatccc tgggactgaa tgccgtggcc tactacagag gactggacgt gtccgtgatt 1200 cccacatctg gcgacgtggt cgtgtgtgcc acagatgccc tgatgaccgg cttcaccggc 1260 gacttcgata gcgtgatcga ctgcaacacc agcgtgatcc agaccgtgga cttctctctg 1320 gaccccacct tcagcatcga gatcaccacc gttcctcagg acgccgtgtc tcggtcacag 1380 agaagaggca gaacaggcag aggccggctg ggcacataca gatatgtgac acccggcgaa 1440 agacccagcg gcatgtttga tacagccgag ctgtgcgagt gttacgacgc cggatgtgct 1500 tggtacgagc tgacaccagc cgagacaacc accagactga aggcctactt cgacacccct 1560 ggcctgcctg tgtgtcagga ccacctggaa ttttgggaga gcgtgttcac aggactgacc 1620 cacatcgacg gccactttct gagccagacc aagcagagcg gcgagaactt cccttacctg 1680 gtggcctatc aggctaccgt gtccgccaaa gtttggctgg ctcctcctag ctgggacacc 1740 atgtggaagt gcctgatccg gctgaagcct acactgcacg gacctacacc tctgctgtac 1800 agactgggca gcgtgcagaa tgaggtggtg ctgacccatc ctatcaccaa gtacatcatg 1860 gcctgcatga gcgccgacct ggaagtggtt aca 1893 <210> 210 <211> 1893 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding Hepatitis C NS3/4A protein <400> 210 gccccuauca cagccuacgc ucagcagacc agaggccugu ucagcaccau cgugacaagc 60 cugaccggca gagacaccaa cgagaauugu ggcgaggugc agguccuguc uacagcuacc 120 cagagcuuuc ugggcaccgc cgugaauggc gugaugugga caguguauca uggcgcuggc 180 gccaagacaa ucucuggccc uaagggcccc gugaaccaga uguacaccaa cguggaccag 240 gaccucguug gcuggccugc uccuccuggu guuagaagcc uggcuccuug uacaugcggc 300 agcgccgauc uguaccuggu cacaagacac gccgacguga uccccgucag aagaagaggc 360 gauacaagag gcgcccugcu gagcccuaga ccuaucucua uccugaaggg cagcucuggc 420 ggcccucugc uuuguccuau gggacacaga gccggcaucu ucagagccgc cguguguacu 480 agaggcgugg ccaaggcugu ggacuucgug ccuguggaaa gccuggaaac caccaugaga 540 agccccgugu ucaccgacaa cagcaccccu ccagcugugc cucagacaua ccagguggcc 600 caucugcaug ccccuacagg cucuggcaag agcacaaaag ugccugccgc ucaugcugcc 660 cagggcuaua aggugcuggu gcucaauccu agcguggccg ccacacucgg cuuuggcgug 720 uacaugucua aggccuacgg caucgacccc aacaucagau cuggcgugcg gaccaucaca 780 acaggcgccc caaucaccua cucuaccuac ggcaaguucc uggccgaugg cggauguucu 840 ggcggagccu acgacaucau caucugcgac gagugcuaca gcaccgacag caccacaauc 900 cucggcaucg gcacagugcu ggaucaggcu gaaacagccg gcgucagacu gacugugcug 960 gccacagcua caccuccagg cagcgugaca accccucaca gcaacaucga ggaaguggcc 1020 cugccuacaa ccggcgagau cccauucuau ggcaaggcca uuccucucga gcugaucaaa 1080 ggcggcagac accugaucuu uugccacagc aagaagaagu gcgacgagcu ggccagacag 1140 cugacauccc ugggacugaa ugccguggcc uacuacagag gacuggacgu guccgugauu 1200 cccacaucug gcgacguggu cgugugugcc acagaugccc ugaugaccgg cuucaccggc 1260 gacuucgaua gcgugaucga cugcaacacc agcgugaucc agaccgugga cuucucucug 1320 gaccccaccu ucagcaucga gaucaccacc guuccucagg acgccguguc ucggucacag 1380 agaagaggca gaacaggcag aggccggcug ggcacauaca gauaugugac acccggcgaa 1440 agacccagcg gcauguuuga uacagccgag cugugcgagu guuacgacgc cggaugugcu 1500 ugguacgagc ugacaccagc cgagacaacc accagacuga aggccuacuu cgacaccccu 1560 ggccugccug ugugucagga ccaccuggaa uuuugggaga gcguguucac aggacugacc 1620 cacaucgacg gccacuuucu gagccagacc aagcagagcg gcgagaacuu cccuuaccug 1680 guggccuauc aggcuaccgu guccgccaaa guuuggcugg cuccuccuag cugggacacc 1740 auguggaagu gccugauccg gcugaagccu acacugcacg gaccuacacc ucugcuguac 1800 agacugggca gcgugcagaa ugagguggug cugacccauc cuaucaccaa guacaucaug 1860 gccugcauga gcgccgaccu ggaagugguu aca 1893 <210> 211 <211> 619 <212> PRT <213> Dengue virus <400> 211 Ser Gly Val Leu Trp Asp Thr Pro Ser Pro Pro Glu Val Glu Arg Ala 1 5 10 15 Val Leu Asp Asp Gly Ile Tyr Arg Ile Leu Gln Arg Gly Leu Leu Gly 20 25 30 Arg Ser Gln Val Gly Val Gly Val Phe Gln Glu Gly Val Phe His Thr 35 40 45 Met Trp His Val Thr Arg Gly Ala Val Leu Met Tyr Gln Gly Lys Arg 50 55 60 Leu Glu Pro Ser Trp Ala Ser Val Lys Lys Asp Leu Ile Ser Tyr Gly 65 70 75 80 Gly Gly Trp Arg Phe Gln Gly Ser Trp Asn Ala Gly Glu Glu Val Gln 85 90 95 Val Ile Ala Val Glu Pro Gly Lys Asn Pro Lys Asn Val Gln Thr Ala 100 105 110 Pro Gly Thr Phe Lys Thr Pro Glu Gly Glu Val Gly Ala Ile Ala Leu 115 120 125 Asp Phe Lys Pro Gly Thr Ser Gly Ser Pro Ile Val Asn Arg Glu Gly 130 135 140 Lys Ile Val Gly Leu Tyr Gly Asn Gly Val Val Thr Thr Ser Gly Thr 145 150 155 160 Tyr Val Ser Ala Ile Ala Gln Ala Lys Ala Ser Gln Glu Gly Pro Leu 165 170 175 Pro Glu Ile Glu Asp Glu Val Phe Arg Lys Arg Asn Leu Thr Ile Met 180 185 190 Asp Leu His Pro Gly Ser Gly Lys Thr Arg Arg Tyr Leu Pro Ala Ile 195 200 205 Val Arg Glu Ala Ile Arg Arg Asn Val Arg Thr Leu Val Leu Ala Pro 210 215 220 Thr Arg Val Val Ala Ser Glu Met Ala Glu Ala Leu Lys Gly Met Pro 225 230 235 240 Ile Arg Tyr Gln Thr Thr Ala Val Lys Ser Glu His Thr Gly Lys Glu 245 250 255 Ile Val Asp Leu Met Cys His Ala Thr Phe Thr Met Arg Leu Leu Ser 260 265 270 Pro Val Arg Val Pro Asn Tyr Asn Met Ile Ile Met Asp Glu Ala His 275 280 285 Phe Thr Asp Pro Ala Ser Ile Ala Ala Arg Gly Tyr Ile Ser Thr Arg 290 295 300 Val Gly Met Gly Glu Ala Ala Ala Ile Phe Met Thr Ala Thr Pro Pro 305 310 315 320 Gly Ser Val Glu Ala Phe Pro Gln Ser Asn Ala Val Ile Gln Asp Glu 325 330 335 Glu Arg Asp Ile Pro Glu Arg Ser Trp Asn Ser Gly Tyr Asp Trp Ile 340 345 350 Thr Asp Phe Pro Gly Lys Thr Val Trp Phe Val Pro Ser Ile Lys Ser 355 360 365 Gly Asn Asp Ile Ala Asn Cys Leu Arg Lys Asn Gly Lys Arg Val Val 370 375 380 Gln Leu Ser Arg Lys Thr Phe Asp Thr Glu Tyr Gln Lys Thr Lys Asn 385 390 395 400 Asn Asp Trp Asp Tyr Val Val Thr Thr Asp Ile Ser Glu Met Gly Ala 405 410 415 Asn Phe Arg Ala Asp Arg Val Ile Asp Pro Arg Arg Cys Leu Lys Pro 420 425 430 Val Ile Leu Lys Asp Gly Pro Glu Arg Val Ile Leu Ala Gly Pro Met 435 440 445 Pro Val Thr Val Ala Ser Ala Ala Gln Arg Arg Gly Arg Ile Gly Arg 450 455 460 Asn Gln Asn Lys Glu Gly Asp Gln Tyr Ile Tyr Met Gly Gln Pro Leu 465 470 475 480 Asn Asn Asp Glu Asp His Ala His Trp Thr Glu Ala Lys Met Leu Leu 485 490 495 Asp Asn Ile Asn Thr Pro Glu Gly Ile Ile Pro Ala Leu Phe Glu Pro 500 505 510 Glu Arg Glu Lys Ser Ala Ala Ile Asp Gly Glu Tyr Arg Leu Arg Gly 515 520 525 Glu Ala Arg Lys Thr Phe Val Glu Leu Met Arg Arg Gly Asp Leu Pro 530 535 540 Val Trp Leu Ser Tyr Lys Val Ala Ser Glu Gly Phe Gln Tyr Ser Asp 545 550 555 560 Arg Arg Trp Cys Phe Asp Gly Glu Arg Asn Asn Gln Val Leu Glu Glu 565 570 575 Asn Met Asp Val Glu Ile Trp Thr Lys Glu Gly Glu Arg Lys Lys Leu 580 585 590 Arg Pro Arg Trp Leu Asp Ala Arg Thr Tyr Ser Asp Pro Leu Ala Leu 595 600 605 Arg Glu Phe Lys Glu Phe Ala Ala Gly Arg Arg 610 615 <210> 212 <211> 1857 <212> DNA <213> Dengue virus <400> 212 tcaggagtgc tatgggacac acccagccct ccagaagtgg aaagagcagt ccttgatgat 60 ggcatttata gaattctcca aagaggattg ttgggcaggt ctcaagtagg agtaggagtt 120 tttcaagaag gcgtgttcca cacaatgtgg cacgtcacca ggggagctgt cctcatgtac 180 caagggaaga gactggaacc aagttgggcc agtgtcaaaa aagacttgat ctcatatgga 240 ggaggttgga ggtttcaagg atcctggaac gcgggagaag aagtgcaggt gattgctgtt 300 gaaccgggga agaaccccaa aaatgtacag acagcgccgg gtaccttcaa gacccctgaa 360 ggcgaagttg gagccatagc tctagacttt aaacccggca catctggatc tcctatcgtg 420 aacagagagg gaaaaatagt aggtctttat ggaaatggag tggtgacaac aagtggtacc 480 tacgtcagcg ccatagctca agctaaagca tcacaagaag ggcctctacc agagattgag 540 gacgaggtgt ttaggaaaag aaacttaaca ataatggacc tacatccagg atcggggaaa 600 acaagaagat atcttccagc catagtccgt gaggccataa gaaggaacgt gcgcacgcta 660 gtcttagctc ccacaagagt tgtcgcttct gaaatggcag aggcgctcaa gggaatgcca 720 ataaggtatc agacaacagc agtgaagagt gaacacacag gaaaagagat agttgacctt 780 atgtgtcacg ccactttcac tatgcgtctc ctgtctcctg tgagagttcc caattataat 840 atgattatca tggatgaagc acattttacc gatccagcca gcatagcagc cagagggtat 900 atctcaaccc gagtgggtat gggtgaagca gctgcgattt tcatgacagc cactcccccc 960 ggatcggtgg aggcctttcc acagagcaat gcagttatcc aagatgagga aagagacatt 1020 cctgaaagat catggaactc aggctatgac tggatcactg atttcccagg taaaacagtc 1080 tggtttgttc caagcatcaa atcaggaaat gacattgcca actgtttaag aaagaatggg 1140 aaacgggtgg tccaattgag cagaaaaact tttgacactg agtaccagaa aacaaaaaat 1200 aacgactggg actatgttgt cacaacagac atatccgaaa tgggagcaaa cttccgagcc 1260 gacagggtaa tagacccgag gcggtgcctg aaaccggtaa tactaaaaga tggcccagag 1320 cgtgtcattc tagccggacc gatgccagtg actgtggcta gcgccgccca gaggagagga 1380 agaattggaa ggaaccaaaa taaggaaggc gatcagtata tttacatggg acagcctcta 1440 aacaatgatg aggaccacgc ccattggaca gaagcaaaaa tgctccttga caacataaac 1500 acaccagaag ggattatccc agccctcttt gagccggaga gagaaaagag tgcagcaata 1560 gacggggaat acagactacg gggtgaagcg aggaaaacgt tcgtggagct catgagaaga 1620 ggagatctac ctgtctggct atcctacaaa gttgcctcag aaggcttcca gtactccgac 1680 agaaggtggt gctttgatgg ggaaaggaac aaccaggtgt tggaggagaa catggacgtg 1740 gagatctgga caaaagaagg agaaagaaag aaactacgac cccgctggct ggatgccaga 1800 acatactctg acccactggc tctgcgcgaa ttcaaagagt tcgcagcagg aagaaga 1857 <210> 213 <211> 1857 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding DENV NS3 protein <400> 213 tctggcgtgc tgtgggatac accttctcca ccagaggtgg aaagagccgt gctggacgac 60 ggcatctacc ggattctgca gagaggactg ctgggcagat ctcaagttgg cgtgggcgtg 120 ttccaagaag gggtgttcca caccatgtgg cacgtgacaa gaggcgccgt gctgatgtac 180 cagggcaaga gactggaacc tagctgggcc agcgtgaaga aggacctgat ctcttacggc 240 ggaggctggc ggtttcaagg ctcttggaat gccggcgaag aggtgcaagt gatcgccgtg 300 gaacccggca agaaccccaa gaacgttcag acagcccctg gcaccttcaa gacccctgaa 360 ggcgaagtgg gagctatcgc cctggatttc aagcctggca caagcggcag ccccatcgtg 420 aacagagaag gcaagatcgt gggcctgtac ggcaatggcg tggtcaccac atctggcacc 480 tacgtgtcag ccattgctca ggccaaggcc tctcaagagg gacccctgcc tgagatcgag 540 gacgaggtgt tccggaagcg gaacctgacc atcatggatc tgcaccctgg cagcggcaag 600 accagaagat atctgcccgc cattgtgcgc gaggccatcc gaagaaatgt gcggacactg 660 gtgctggccc ctacaagagt ggtggcctct gaaatggccg aggctctgaa gggcatgcct 720 atcagatacc agaccaccgc cgtgaagtct gagcacaccg gcaaagaaat cgtggacctg 780 atgtgccacg ccaccttcac catgagactg ctgagccctg tgcgggtgcc caactacaac 840 atgatcatca tggacgaggc ccacttcaca gaccccgcct ctattgccgc cagaggctac 900 atctctacca gagtcggcat gggagaagcc gccgctatct tcatgacagc cacacctcca 960 ggcagcgtgg aagcctttcc tcagtccaat gccgtgatcc aggacgaaga gagagacatc 1020 cccgagcgga gctggaacag cggctacgac tggatcaccg actttccagg caagaccgtt 1080 tggttcgtgc ccagcatcaa gagcggcaac gatatcgcca actgcctgcg gaagaacggc 1140 aagagagtgg tgcagctgag cagaaagacc ttcgacaccg agtaccaaaa gaccaagaac 1200 aacgactggg actacgtcgt gaccaccgac atctctgaga tgggcgccaa cttcagggcc 1260 gacagagtga tcgaccctcg gagatgtctg aagcccgtga tcctgaagga cggccctgag 1320 agagtgattc tggccggacc tatgcctgtg acagtggctt ctgccgctca gagaagaggc 1380 cggatcggcc ggaatcagaa caaagagggc gaccagtaca tctacatggg ccagcctctg 1440 aacaacgatg aggatcacgc ccactggacc gaggccaaga tgctgctgga caacatcaac 1500 acccctgagg gcatcatccc cgctctgttc gagcccgaga gagagaagtc tgccgcaatc 1560 gacggcgagt acagactgag aggcgaggcc agaaagacat ttgtggaact gatgcggaga 1620 ggcgacctgc ctgtgtggct gagttacaag gtggccagcg agggcttcca gtacagcgat 1680 agaagatggt gcttcgatgg cgagcggaac aaccaggtgc tggaagagaa catggacgtg 1740 gaaatctgga ccaaagaagg cgagcgcaag aaactgcggc ccagatggct ggatgcccgg 1800 acatattctg accctctggc tctgcgcgag ttcaaagagt ttgccgccgg aagaaga 1857 <210> 214 <211> 1857 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding DENV NS3 protein <400> 214 ucuggcgugc ugugggauac accuucucca ccagaggugg aaagagccgu gcuggacgac 60 ggcaucuacc ggauucugca gagaggacug cugggcagau cucaaguugg cgugggcgug 120 uuccaagaag ggguguucca caccaugugg cacgugacaa gaggcgccgu gcugauguac 180 cagggcaaga gacuggaacc uagcugggcc agcgugaaga aggaccugau cucuuacggc 240 ggaggcuggc gguuucaagg cucuuggaau gccggcgaag aggugcaagu gaucgccgug 300 gaacccggca agaaccccaa gaacguucag acagccccug gcaccuucaa gaccccugaa 360 ggcgaagugg gagcuaucgc ccuggauuuc aagccuggca caagcggcag ccccaucgug 420 aacagagaag gcaagaucgu gggccuguac ggcaauggcg uggucaccac aucuggcacc 480 uacgugucag ccauugcuca ggccaaggcc ucucaagagg gaccccugcc ugagaucgag 540 gacgaggugu uccggaagcg gaaccugacc aucauggauc ugcacccugg cagcggcaag 600 accagaagau aucugcccgc cauugugcgc gaggccaucc gaagaaaugu gcggacacug 660 gugcuggccc cuacaagagu gguggccucu gaaauggccg aggcucugaa gggcaugccu 720 aucagauacc agaccaccgc cgugaagucu gagcacaccg gcaaagaaau cguggaccug 780 augugccacg ccaccuucac caugagacug cugagcccug ugcgggugcc caacuacaac 840 augaucauca uggacgaggc ccacuucaca gaccccgccu cuauugccgc cagaggcuac 900 aucucuacca gagucggcau gggagaagcc gccgcuaucu ucaugacagc cacaccucca 960 ggcagcgugg aagccuuucc ucaguccaau gccgugaucc aggacgaaga gagagacauc 1020 cccgagcgga gcuggaacag cggcuacgac uggaucaccg acuuuccagg caagaccguu 1080 ugguucgugc ccagcaucaa gagcggcaac gauaucgcca acugccugcg gaagaacggc 1140 aagagagugg ugcagcugag cagaaagacc uucgacaccg aguaccaaaa gaccaagaac 1200 aacgacuggg acuacgucgu gaccaccgac aucucugaga ugggcgccaa cuucagggcc 1260 gacagaguga ucgacccucg gagaugucug aagcccguga uccugaagga cggcccugag 1320 agagugauuc uggccggacc uaugccugug acaguggcuu cugccgcuca gagaagaggc 1380 cggaucggcc ggaaucagaa caaagagggc gaccaguaca ucuacauggg ccagccucug 1440 aacaacgaug aggaucacgc ccacuggacc gaggccaaga ugcugcugga caacaucaac 1500 accccugagg gcaucauccc cgcucuguuc gagcccgaga gagagaaguc ugccgcaauc 1560 gacggcgagu acagacugag aggcgaggcc agaaagacau uuguggaacu gaugcggaga 1620 ggcgaccugc cuguguggcu gaguuacaag guggccagcg agggcuucca guacagcgau 1680 agaagauggu gcuucgaugg cgagcggaac aaccaggugc uggaagagaa cauggacgug 1740 gaaaucugga ccaaagaagg cgagcgcaag aaacugcggc ccagauggcu ggaugcccgg 1800 acauauucug acccucuggc ucugcgcgag uucaaagagu uugccgccgg aagaaga 1857 <210> 215 <211> 183 <212> PRT <213> Enterovirus 71 <400> 215 Gly Pro Ser Leu Asp Phe Ala Leu Ser Leu Leu Arg Arg Asn Val Arg 1 5 10 15 Gln Val Gln Thr Asp Gln Gly His Phe Thr Met Leu Gly Val Arg Asp 20 25 30 Arg Leu Ala Val Leu Pro Arg His Ser Gln Pro Gly Lys Thr Ile Trp 35 40 45 Ile Glu His Lys Leu Val Asn Val Leu Asp Ala Val Glu Leu Val Asp 50 55 60 Glu Gln Gly Val Asn Leu Glu Leu Thr Leu Ile Thr Leu Asp Thr Asn 65 70 75 80 Glu Lys Phe Arg Asp Ile Thr Lys Phe Ile Pro Glu Asn Ile Ser Thr 85 90 95 Ala Ser Asp Ala Thr Leu Val Ile Asn Thr Glu His Met Pro Ser Met 100 105 110 Phe Val Pro Val Gly Asp Val Val Gln Tyr Gly Phe Leu Asn Leu Ser 115 120 125 Gly Lys Pro Thr His Arg Thr Met Met Tyr Asn Phe Pro Thr Lys Ala 130 135 140 Gly Gln Cys Gly Gly Val Val Thr Ser Val Gly Lys Val Ile Gly Ile 145 150 155 160 His Ile Gly Gly Asn Gly Arg Gln Gly Phe Cys Ala Gly Leu Lys Arg 165 170 175 Ser Tyr Phe Ala Ser Glu Gln 180 <210> 216 <211> 549 <212> DNA <213> Enterovirus 71 <400> 216 ggcccgagcc ttgattttgc tctctcccta ctgaggagga acgtcaggca agtccaaaca 60 gaccaggggc atttcaccat gttgggtgtt agggatcgct tagcagtcct cccacgccac 120 tcacaacccg gcaaaactat ttggattgag cacaaactcg tgaacgtcct tgatgcagtt 180 gaattggtgg atgagcaagg agtcaacctg gaattaaccc tcatcactct tgataccaac 240 gagaagttta gggatatcac caaattcatc ccggaaaata ttagcactgc tagtgatgcc 300 accctagtga tcaacacgga gcacatgccc tcgatgtttg tcccggtggg tgacgttgtg 360 cagtatggtt tcctgaatct cagtggtaag cctactcatc gcaccatgat gtacaacttt 420 cctactaagg cagggcaatg tggaggggtg gtgacatcag ttggaaaagt catcggtata 480 cacataggtg gcaacggtag acaaggattt tgtgcaggtc ttaagagaag ctactttgcc 540 agcgagcaa 549 <210> 217 <211> 549 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding EV71 3Cpro protein <400> 217 ggcccttctc tggattttgc cctgagcctg ctgcggagaa atgtgcgcca ggtgcagaca 60 gatcagggcc actttacaat gctgggcgtc agagacagac tggccgtgct gcctagacac 120 tctcagcctg gcaagaccat ctggatcgag cacaagctgg tcaacgtgct ggacgccgtg 180 gaactggttg atgagcaggg cgtgaacctg gaactgaccc tgatcaccct ggacaccaac 240 gagaagttcc gggacatcac caagttcatc cccgagaaca tcagcaccgc cagcgacgcc 300 acactggtca tcaataccga gcacatgccc agcatgttcg tgcctgtggg agatgtggtg 360 cagtacggct tcctgaacct gagcggcaag cccacacacc ggaccatgat gtacaacttc 420 cctaccaagg ccggccagtg cggcggagtg gttacatctg tgggcaaagt gatcggcatc 480 cacatcggcg gcaatggcag acagggattt tgtgccggcc tgaagagaag ctacttcgcc 540 tctgaacag 549 <210> 218 <211> 549 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding EV71 3Cpro protein <400> 218 ggcccuucuc uggauuuugc ccugagccug cugcggagaa augugcgcca ggugcagaca 60 gaucagggcc acuuuacaau gcugggcguc agagacagac uggccgugcu gccuagacac 120 ucucagccug gcaagaccau cuggaucgag cacaagcugg ucaacgugcu ggacgccgug 180 gaacugguug augagcaggg cgugaaccug gaacugaccc ugaucacccu ggacaccaac 240 gagaaguucc gggacaucac caaguucauc cccgagaaca ucagcaccgc cagcgacgcc 300 acacugguca ucaauaccga gcacaugccc agcauguucg ugccuguggg agauguggug 360 caguacggcu uccugaaccu gagcggcaag cccacacacc ggaccaugau guacaacuuc 420 ccuaccaagg ccggccagug cggcggagug guuacaucug ugggcaaagu gaucggcauc 480 cacaucggcg gcaauggcag acagggauuu ugugccggcc ugaagagaag cuacuucgcc 540 ucugaacag 549 <210> 219 <211> 201 <212> PRT <213> Foot-and-mouth disease virus <400> 219 Met His Thr Thr Asp Cys Phe Ile Ala Leu Val His Ala Ile Arg Glu 1 5 10 15 Ile Arg Ala Leu Phe Leu Pro Arg Thr Thr Gly Lys Met Glu Leu Thr 20 25 30 Leu His Asn Gly Glu Lys Lys Thr Phe Tyr Ser Arg Pro Asn Asn His 35 40 45 Asp Asn Cys Trp Leu Asn Thr Ile Leu Gln Leu Phe Arg Tyr Val Asp 50 55 60 Glu Pro Phe Phe Asp Trp Val Tyr Asn Ser Pro Glu Asn Leu Thr Leu 65 70 75 80 Glu Ala Ile Asn Gln Leu Glu Glu Leu Thr Gly Leu Glu Leu His Glu 85 90 95 Gly Gly Pro Pro Ala Leu Val Ile Trp Asn Ile Lys His Leu Leu His 100 105 110 Thr Gly Ile Gly Thr Ala Ser Arg Pro Ser Glu Val Cys Met Val Asp 115 120 125 Gly Thr Asp Met Cys Leu Ala Asp Phe His Ala Gly Ile Phe Leu Lys 130 135 140 Gly Gln Glu His Ala Val Phe Ala Cys Val Thr Ser Asn Gly Trp Tyr 145 150 155 160 Ala Ile Asp Asp Glu Glu Phe Tyr Pro Trp Thr Pro Asp Pro Ser Asp 165 170 175 Val Leu Val Phe Val Pro Tyr Asp Gln Glu Pro Leu Asn Gly Asp Trp 180 185 190 Lys Ala Met Val Gln Arg Lys Leu Lys 195 200 <210> 220 <211> 603 <212> DNA <213> Foot-and-mouth disease virus <400> 220 atgcatacaa ctgactgttt tatcgctttg gtgcacgcta tcagagagat cagagcactt 60 tttctaccac gaaccacagg aaagatggaa ctcaccctgc acaacggcga gaaaaagact 120 ttttactcta gacccaacaa ccacgacaac tgctggttga acaccatcct tcagttgttc 180 aggtatgtcg atgaaccctt cttcgactgg gtctacaact cgcccgagaa cctcacgctt 240 gaagccatca accaattgga ggaactcaca ggacttgagt tgcacgaggg cggaccgcct 300 gcccttgtga tctggaacat caaacacttg ctccacaccg gcatcggcac cgcctcacga 360 cccagtgagg tgtgtatggt ggacggcacg gacatgtgtc ttgctgactt ccacgcaggc 420 attttcctga agggacagga acacgcagtc tttgcgtgtg tcacctccaa cgggtggtac 480 gcgattgacg acgaggaatt ttacccctgg acgcctgacc cgtcagacgt cctggtgttt 540 gtcccgtacg atcaagaacc actcaacggg gactggaaag cgatggttca gaggaagctt 600 aag 603 <210> 221 <211> 603 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding FMDV Lpro protein <400> 221 atgcacacca ccgactgctt tatcgccctg gtgcacgcca tcagagagat cagagccctg 60 ttcctgcctc ggaccaccgg caagatggaa ctgacactgc acaacggcga gaagaaaacc 120 ttctacagca gacccaacaa ccacgacaac tgctggctga acaccatcct gcagctgttc 180 agatacgtgg acgagccctt cttcgactgg gtgtacaaca gccccgagaa tctgaccctg 240 gaagccatca accagctgga agaactgacc ggcctggaac tgcatgaagg cggacctcca 300 gctctggtca tctggaacat caaacatctg ctgcacaccg gcatcggcac cgcctctaga 360 ccatctgaag tgtgcatggt ggacggcacc gatatgtgcc tggccgattt tcacgccggc 420 atctttctga agggccaaga gcatgccgtg ttcgcctgcg tgacaagcaa tggatggtac 480 gccatcgacg acgaggaatt ctacccctgg acacccgatc ctagcgacgt gctggtgttc 540 gtgccctacg atcaagagcc cctgaacggc gattggaagg ccatggtgca gcggaagctg 600 aag 603 <210> 222 <211> 603 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding FMDV Lpro protein <400> 222 augcacacca ccgacugcuu uaucgcccug gugcacgcca ucagagagau cagagcccug 60 uuccugccuc ggaccaccgg caagauggaa cugacacugc acaacggcga gaagaaaacc 120 uucuacagca gacccaacaa ccacgacaac ugcuggcuga acaccauccu gcagcuguuc 180 agauacgugg acgagcccuu cuucgacugg guguacaaca gccccgagaa ucugacccug 240 gaagccauca accagcugga agaacugacc ggccuggaac ugcaugaagg cggaccucca 300 gcucugguca ucuggaacau caaacaucug cugcacaccg gcaucggcac cgccucuaga 360 ccaucugaag ugugcauggu ggacggcacc gauaugugcc uggccgauuu ucacgccggc 420 aucuuucuga agggccaaga gcaugccgug uucgccugcg ugacaagcaa uggaugguac 480 gccaucgacg acgaggaauu cuaccccugg acacccgauc cuagcgacgu gcugguguuc 540 gugcccuacg aucaagagcc ccugaacggc gauuggaagg ccauggugca gcggaagcug 600 aag 603 <210> 223 <211> 213 <212> PRT <213> Foot-and-mouth disease virus <400> 223 Ser Gly Ala Pro Pro Thr Asp Leu Gln Lys Met Val Met Gly Asn Thr 1 5 10 15 Lys Pro Val Glu Leu Ile Leu Asp Gly Lys Thr Val Ala Ile Cys Cys 20 25 30 Ala Thr Gly Val Phe Gly Thr Ala Tyr Leu Val Pro Arg His Leu Phe 35 40 45 Ala Glu Lys Tyr Asp Lys Ile Met Leu Asp Gly Arg Ala Met Thr Asp 50 55 60 Ser Asp Tyr Arg Val Phe Glu Phe Glu Ile Lys Val Lys Gly Gln Asp 65 70 75 80 Met Leu Ser Asp Ala Ala Leu Met Val Leu His Arg Gly Asn Arg Val 85 90 95 Arg Asp Ile Thr Lys His Phe Arg Asp Thr Ala Arg Met Lys Lys Gly 100 105 110 Thr Pro Val Val Gly Val Ile Asn Asn Ala Asp Val Gly Arg Leu Ile 115 120 125 Phe Ser Gly Glu Ala Leu Thr Tyr Lys Asp Ile Val Val Cys Met Asp 130 135 140 Gly Asp Thr Met Pro Gly Leu Phe Ala Tyr Arg Ala Ala Thr Lys Ala 145 150 155 160 Gly Tyr Cys Gly Gly Ala Val Leu Ala Lys Asp Gly Ala Asp Thr Phe 165 170 175 Ile Val Gly Thr His Ser Ala Gly Gly Asn Gly Val Gly Tyr Cys Ser 180 185 190 Cys Val Ser Arg Ser Met Leu Leu Lys Met Lys Ala His Ile Asp Pro 195 200 205 Glu Pro His His Glu 210 <210> 224 <211> 639 <212> DNA <213> Foot-and-mouth disease virus <400> 224 agtggtgccc ccccgaccga cttgcaaaag atggtcatgg gcaacacaaa gcctgttgag 60 ctcatcctcg acgggaagac agtagccatc tgctgtgcta ctggagtgtt tggcactgcc 120 tacctcgtgc ctcgtcatct tttcgctgag aagtatgaca agatcatgtt ggacggcaga 180 gccatgacag acagtgacta cagagtgttt gagttcgaga tcaaagtaaa aggacaggac 240 atgctctcag acgccgcact catggtgctc caccgtggga accgcgtgag agacatcacg 300 aagcactttc gtgacacagc aagaatgaag aaaggcaccc ccgttgtcgg cgtgatcaac 360 aatgccgatg tcgggagact gattttctct ggcgaagccc ttacctacaa agacattgta 420 gtgtgcatgg acggagacac catgcccggg ctttttgcct acagagccgc cactaaggca 480 ggctactgcg ggggagccgt tctcgctaag gacggggctg acactttcat cgttggcact 540 cactctgcag gaggtaatgg agttggatac tgctcatgcg tttccaggtc catgcttctc 600 aagatgaagg cacacattga ccctgagccg caccacgag 639 <210> 225 <211> 639 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding FMDV 3Cpro protein <400> 225 tctggtgccc ctcctaccga cctgcagaaa atggtcatgg gcaacaccaa gcctgtggaa 60 ctgatcctgg acggcaagac cgtggccatc tgttgtgcaa caggcgtgtt cggcaccgcc 120 tacctggttc ctagacacct gttcgccgag aagtacgaca agatcatgct ggatggcaga 180 gccatgaccg acagcgacta ccgggtgttc gagttcgaga tcaaagtgaa aggccaggac 240 atgctgagcg acgccgctct gatggttctg cacagaggca acagagtgcg ggacatcacc 300 aagcacttcc gggacaccgc cagaatgaag aaaggcacac ctgtcgtggg cgtgatcaac 360 aacgctgacg tgggcagact gatcttctct ggcgaggccc tgacctacaa ggacatcgtc 420 gtgtgcatgg acggcgacac aatgcctggc ctgtttgcct atagagccgc cacaaaggcc 480 ggctactgtg gcggagctgt gctggctaaa gatggcgccg ataccttcat cgtgggcaca 540 cattctgccg gcggaaatgg cgtgggctac tgctcttgtg tgtccagatc catgctgctg 600 aagatgaagg cccacatcga ccccgagcct caccatgaa 639 <210> 226 <211> 639 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding FMDV 3Cpro protein <400> 226 ucuggugccc cuccuaccga ccugcagaaa auggucaugg gcaacaccaa gccuguggaa 60 cugauccugg acggcaagac cguggccauc uguugugcaa caggcguguu cggcaccgcc 120 uaccugguuc cuagacaccu guucgccgag aaguacgaca agaucaugcu ggauggcaga 180 gccaugaccg acagcgacua ccggguguuc gaguucgaga ucaaagugaa aggccaggac 240 augcugagcg acgccgcucu gaugguucug cacagaggca acagagugcg ggacaucacc 300 aagcacuucc gggacaccgc cagaaugaag aaaggcacac cugucguggg cgugaucaac 360 aacgcugacg ugggcagacu gaucuucucu ggcgaggccc ugaccuacaa ggacaucguc 420 gugugcaugg acggcgacac aaugccuggc cuguuugccu auagagccgc cacaaaggcc 480 ggcuacugug gcggagcugu gcuggcuaaa gauggcgccg auaccuucau cgugggcaca 540 cauucugccg gcggaaaugg cgugggcuac ugcucuugug uguccagauc caugcugcug 600 aagaugaagg cccacaucga ccccgagccu caccaugaa 639 <210> 227 <211> 316 <212> PRT <213> Toscana virus <400> 227 Met Gln Ser Arg Ala Val Ile Leu Lys Tyr Arg Ser Gly Ser Gly His 1 5 10 15 Lys Arg Ser Leu Pro Arg Phe Tyr Ile Asp Cys Asp Leu Asp Thr Phe 20 25 30 Asp Phe Glu Lys Asp Cys Ser Leu Ile Glu Asn Glu Phe Pro Ile Tyr 35 40 45 Ile Asn Asn Tyr Lys Val Val Tyr Lys Ser Lys Pro Thr Leu Ser His 50 55 60 Phe Leu Ile Glu Lys Glu Phe Pro Ala Val Leu Gly Pro Gly Met Ile 65 70 75 80 Ser Ala Val Arg Thr Arg Leu Tyr Glu Pro Thr Met Arg Glu Leu Tyr 85 90 95 Gln Glu Ser Ile His Gln Leu Lys Arg Ser Asn Lys Lys Tyr Leu Leu 100 105 110 Ser Ala Leu Arg Trp Pro Thr Gly Ile Pro Thr Leu Glu Phe Ile Asp 115 120 125 Tyr Tyr Phe Glu Glu Leu Leu Phe Leu Ser Glu Phe Asp Pro Gly Ser 130 135 140 Ile Gln Arg Tyr Leu Lys Leu Leu Val Lys Ala Ser Gly Leu Tyr Asn 145 150 155 160 Ser Thr Asn Glu Glu Gln Ile Val Glu Ile His Arg Arg Val Leu Ile 165 170 175 Glu Gly Lys Lys His Gly Leu Thr Ala Phe Asp Leu Pro Gly Asn Asp 180 185 190 Ile Leu Gly Asp Ile Cys Val Val Gln Ala Ala Arg Val Thr Arg Leu 195 200 205 Val Ala Lys Thr Phe Ser Lys Met Thr Arg Asp Thr His Leu Met Ile 210 215 220 Tyr Phe Ser Ile Ser Pro Val Glu Leu Val Leu Ser Lys Leu Asp Lys 225 230 235 240 Lys Gly Asp Lys Arg Ala Lys Ala Lys Gly Leu Met Ser Met Ser Ala 245 250 255 Ala Arg Ser Tyr Asp Tyr Phe Met Arg Thr Asp Leu Gly Phe Arg Glu 260 265 270 Thr Ala Leu Ser Thr Phe Trp Ala Lys Asp Trp Pro Thr Pro Gln Glu 275 280 285 Thr Ile Leu Ser Asp Lys Arg Cys Leu Lys Glu Asp Met Arg Val Thr 290 295 300 Lys Trp Leu Pro Ser Pro Pro His Tyr Pro Pro Leu 305 310 315 <210> 228 <211> 948 <212> DNA <213> Toscana virus <400> 228 atgcaatcca gagctgtcat cttgaagtat agatctggtt caggccacaa gaggtctttg 60 cccaggttct acatagactg tgatttggac acctttgatt ttgagaagga ttgctctctg 120 attgagaatg agttccccat ttacataaac aattataagg tggtctataa gtcaaagcca 180 actctctcac atttcctcat tgagaaggag tttcctgctg tgctggggcc tggtatgatc 240 agtgcagttc gaaccagact ttacgagcca actatgagag agctctacca ggaatcgatt 300 caccaactaa agaggagcaa caagaaatac cttttgtctg ctctcaggtg gcccacaggg 360 attcctactc tagagtttat agactattac ttcgaggagc tcctgttctt gtcagagttt 420 gacccggggt ctatccagag atacctgaaa ttactggtta aggcctctgg gctttacaac 480 tccactaatg aggagcagat agtggagatt cacagacgag tgctcataga aggcaaaaag 540 cacggattga ctgcttttga tctcccagga aatgacatcc ttggagacat ctgtgtggtc 600 caagcagcac gggtgacaag actggttgct aagacattct ctaagatgac cagagacacc 660 catctgatga tatacttctc gataagccca gttgagttgg ttttgagtaa acttgataag 720 aaaggggaca agagggctaa agcaaaaggg ttgatgtcta tgagtgccgc taggtcttat 780 gactatttta tgagaactga cttgggattc agagagactg ctctttccac cttttgggct 840 aaggactggc ctaccccaca agagaccatt ctatctgaca aacgatgcct taaagaagac 900 atgagagtga caaagtggct gcctagtccc ccccactacc caccctta 948 <210> 229 <211> 948 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding Toscana virus NSS protein <400> 229 atgcagagca gagccgtgat cctgaagtac agaagcggca gcggccacaa gagaagcctg 60 cctagattct acatcgactg cgacctggac accttcgact tcgagaagga ctgcagcctg 120 atcgagaacg agttccccat ctacatcaac aactacaagg tggtgtacaa gagcaagcca 180 actctgagcc acttcctcat cgagaaagaa ttccctgccg tgctcggccc tggcatgatc 240 tctgccgtta gaaccagact gtacgagccc accatgagag agctgtacca agagagcatc 300 caccagctga agcggagcaa caagaagtac ctgctgagcg ccctgagatg gcccacaggc 360 attcccacac tggaattcat cgactactac ttcgaggaac tgctgttcct gagcgagttc 420 gaccctggca gcatccagag atacctgaag ctgctggtca aggccagcgg cctgtacaac 480 agcaccaacg aggaacagat cgtggaaatc caccggcggg tgctgatcga gggaaagaag 540 cacggactga ccgccttcga cctgcctggc aatgatatcc tgggcgacat ctgcgtggtg 600 caggccgcta gagtgacaag actggtggcc aagaccttca gcaagatgac cagagacacc 660 cacctgatga tctacttcag catcagcccc gtggaactgg tgctgagcaa gctggacaag 720 aagggcgaca agagagccaa ggccaagggc ctgatgagca tgtctgccgc cagatcctac 780 gactacttca tgagaaccga cctgggcttc agagagacag ccctgagcac cttctgggcc 840 aaagactggc ccacacctca agagacaatc ctgtccgaca agcggtgcct gaaagaagat 900 atgcgggtca ccaagtggct gccctctcca cctcattacc ctccactt 948 <210> 230 <211> 948 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding Toscana virus NSS protein <400> 230 augcagagca gagccgugau ccugaaguac agaagcggca gcggccacaa gagaagccug 60 ccuagauucu acaucgacug cgaccuggac accuucgacu ucgagaagga cugcagccug 120 aucgagaacg aguuccccau cuacaucaac aacuacaagg ugguguacaa gagcaagcca 180 acucugagcc acuuccucau cgagaaagaa uucccugccg ugcucggccc uggcaugauc 240 ucugccguua gaaccagacu guacgagccc accaugagag agcuguacca agagagcauc 300 caccagcuga agcggagcaa caagaaguac cugcugagcg cccugagaug gcccacaggc 360 auucccacac uggaauucau cgacuacuac uucgaggaac ugcuguuccu gagcgaguuc 420 gacccuggca gcauccagag auaccugaag cugcugguca aggccagcgg ccuguacaac 480 agcaccaacg aggaacagau cguggaaauc caccggcggg ugcugaucga gggaaagaag 540 cacggacuga ccgccuucga ccugccuggc aaugauaucc ugggcgacau cugcguggug 600 caggccgcua gagugacaag acugguggcc aagaccuuca gcaagaugac cagagacacc 660 caccugauga ucuacuucag caucagcccc guggaacugg ugcugagcaa gcuggacaag 720 aagggcgaca agagagccaa ggccaagggc cugaugagca ugucugccgc cagauccuac 780 gacuacuuca ugagaaccga ccugggcuuc agagagacag cccugagcac cuucugggcc 840 aaagacuggc ccacaccuca agagacaauc cuguccgaca agcggugccu gaaagaagau 900 augcggguca ccaaguggcu gcccucucca ccucauuacc cuccacuu 948 <210> 231 <211> 230 <212> PRT <213> Influenza A virus <400> 231 Met Asp Pro Asn Thr Val Ser Ser Phe Gln Val Asp Cys Phe Leu Trp 1 5 10 15 His Val Arg Lys Arg Val Ala Asp Gln Glu Leu Gly Asp Ala Pro Phe 20 25 30 Leu Asp Arg Leu Arg Arg Asp Gln Lys Ser Leu Arg Gly Arg Gly Ser 35 40 45 Thr Leu Gly Leu Asp Ile Glu Thr Ala Thr Arg Ala Gly Lys Gln Ile 50 55 60 Val Glu Arg Ile Leu Lys Glu Glu Ser Asp Glu Ala Leu Lys Met Thr 65 70 75 80 Met Ala Ser Val Pro Ala Ser Arg Tyr Leu Thr Asp Met Thr Leu Glu 85 90 95 Glu Met Ser Arg Glu Trp Ser Met Leu Ile Pro Lys Gln Lys Val Ala 100 105 110 Gly Pro Leu Cys Ile Arg Met Asp Gln Ala Ile Met Asp Lys Asn Ile 115 120 125 Ile Leu Lys Ala Asn Phe Ser Val Ile Phe Asp Arg Leu Glu Thr Leu 130 135 140 Ile Leu Leu Arg Ala Phe Thr Glu Glu Gly Ala Ile Val Gly Glu Ile 145 150 155 160 Ser Pro Leu Pro Ser Leu Pro Gly His Thr Ala Glu Asp Val Lys Asn 165 170 175 Ala Val Gly Val Leu Ile Gly Gly Leu Glu Trp Asn Asp Asn Thr Val 180 185 190 Arg Val Ser Glu Thr Leu Gln Arg Phe Ala Trp Arg Ser Ser Asn Glu 195 200 205 Asn Gly Arg Pro Pro Leu Thr Pro Lys Gln Lys Arg Glu Met Ala Gly 210 215 220 Thr Ile Arg Ser Glu Val 225 230 <210> 232 <211> 693 <212> DNA <213> Influenza A virus <400> 232 atggatccaa acactgtgtc aagctttcag gtagattgct ttctttggca tgtccgcaaa 60 cgagttgcag accaagaact aggtgatgcc ccattccttg atcggcttcg ccgagatcag 120 aaatccctaa gaggaagggg cagcactctt ggtctggaca tcgagacagc cacacgtgct 180 ggaaagcaga tagtggagcg gattctgaaa gaagaatccg atgaggcact taaaatgacc 240 atggcctctg tacctgcgtc gcgttaccta accgacatga ctcttgagga aatgtcaagg 300 gaatggtcca tgctcatacc caagcagaaa gtggcaggcc ctctttgtat cagaatggac 360 caggcgatca tggataaaaa catcatactg aaagcgaact tcagtgtgat ttttgaccgg 420 ctggagactc taatattgct aagggctttc accgaagagg gagcaattgt tggcgaaatt 480 tcaccattgc cttctcttcc aggacatact gctgaggatg tcaaaaatgc agttggagtc 540 ctcatcggag gacttgaatg gaatgataac acagttcgag tctctgaaac tctacagaga 600 ttcgcttgga gaagcagtaa tgagaatggg agacctccac tcactccaaa acagaaacga 660 gaaatggcgg gaacaattag gtcagaagtt tga 693 <210> 233 <211> 693 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding Influenza A Non-structural protein 1 <400> 233 atggacccca ataccgtcag cagcttccag gtggactgct tcctgtggca cgtgcggaaa 60 agagtggccg atcaagaact gggcgacgcc ccattcctgg acagactgag aagagatcag 120 aagtccctga gaggcagagg cagcacactg ggcctcgaca ttgagacagc cacaagagcc 180 ggcaagcaga tcgtggaacg gatcctgaaa gaggaaagcg acgaggccct gaagatgacc 240 atggcctctg tgcctgccag cagatacctg accgacatga ccctggaaga gatgagccgc 300 gagtggtcca tgctgatccc caagcagaaa gtggccggac ctctgtgcat cagaatggat 360 caggccatca tggacaagaa catcatcctg aaggccaact tcagcgtgat cttcgaccgg 420 ctggaaaccc tgatcctgct gagagccttt accgaagagg gcgccatcgt gggagagatc 480 agtcctctgc cttctctgcc tggacacacc gccgaggatg tgaagaatgc tgtgggcgtg 540 ctgatcggcg gcctggaatg gaacgataac accgtcagag tgtccgagac actgcagaga 600 tttgcctggc ggagcagcaa cgagaacggc agacctcctc tgacacctaa gcagaaaaga 660 gagatggccg gcaccatccg cagcgaagtg taa 693 <210> 234 <211> 693 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding Influenza A Non-structural protein 1 <400> 234 auggacccca auaccgucag cagcuuccag guggacugcu uccuguggca cgugcggaaa 60 agaguggccg aucaagaacu gggcgacgcc ccauuccugg acagacugag aagagaucag 120 aagucccuga gaggcagagg cagcacacug ggccucgaca uugagacagc cacaagagcc 180 ggcaagcaga ucguggaacg gauccugaaa gaggaaagcg acgaggcccu gaagaugacc 240 auggccucug ugccugccag cagauaccug accgacauga cccuggaaga gaugagccgc 300 gaguggucca ugcugauccc caagcagaaa guggccggac cucugugcau cagaauggau 360 caggccauca uggacaagaa caucauccug aaggccaacu ucagcgugau cuucgaccgg 420 cuggaaaccc ugauccugcu gagagccuuu accgaagagg gcgccaucgu gggagagauc 480 aguccucugc cuucucugcc uggacacacc gccgaggaug ugaagaaugc ugugggcgug 540 cugaucggcg gccuggaaug gaacgauaac accgucagag uguccgagac acugcagaga 600 uuugccuggc ggagcagcaa cgagaacggc agaccuccuc ugacaccuaa gcagaaaaga 660 gagauggccg gcaccauccg cagcgaagug uaa 693 <210> 235 <211> 422 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 235 Met Ser Asp Asn Gly Pro Gln Ser Asn Gln Arg Ser Ala Pro Arg Ile 1 5 10 15 Thr Phe Gly Gly Pro Thr Asp Ser Thr Asp Asn Asn Gln Asn Gly Gly 20 25 30 Arg Asn Gly Ala Arg Pro Lys Gln Arg Arg Pro Gln Gly Leu Pro Asn 35 40 45 Asn Thr Ala Ser Trp Phe Thr Ala Leu Thr Gln His Gly Lys Glu Glu 50 55 60 Leu Arg Phe Pro Arg Gly Gln Gly Val Pro Ile Asn Thr Asn Ser Gly 65 70 75 80 Pro Asp Asp Gln Ile Gly Tyr Tyr Arg Arg Ala Thr Arg Arg Val Arg 85 90 95 Gly Gly Asp Gly Lys Met Lys Glu Leu Ser Pro Arg Trp Tyr Phe Tyr 100 105 110 Tyr Leu Gly Thr Gly Pro Glu Ala Ser Leu Pro Tyr Gly Ala Asn Lys 115 120 125 Glu Gly Ile Val Trp Val Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys 130 135 140 Asp His Ile Gly Thr Arg Asn Pro Asn Asn Asn Ala Ala Thr Val Leu 145 150 155 160 Gln Leu Pro Gln Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala Glu Gly 165 170 175 Ser Arg Gly Gly Ser Gln Ala Ser Ser Arg Ser Ser Ser Arg Ser Arg 180 185 190 Gly Asn Ser Arg Asn Ser Thr Pro Gly Ser Ser Arg Gly Asn Ser Pro 195 200 205 Ala Arg Met Ala Ser Gly Gly Gly Glu Thr Ala Leu Ala Leu Leu Leu 210 215 220 Leu Asp Arg Leu Asn Gln Leu Glu Ser Lys Val Ser Gly Lys Gly Gln 225 230 235 240 Gln Gln Gln Gly Gln Thr Val Thr Lys Lys Ser Ala Ala Glu Ala Ser 245 250 255 Lys Lys Pro Arg Gln Lys Arg Thr Ala Thr Lys Gln Tyr Asn Val Thr 260 265 270 Gln Ala Phe Gly Arg Arg Gly Pro Glu Gln Thr Gln Gly Asn Phe Gly 275 280 285 Asp Gln Asp Leu Ile Arg Gln Gly Thr Asp Tyr Lys His Trp Pro Gln 290 295 300 Ile Ala Gln Phe Ala Pro Ser Ala Ser Ala Phe Phe Gly Met Ser Arg 305 310 315 320 Ile Gly Met Glu Val Thr Pro Ser Gly Thr Trp Leu Thr Tyr His Gly 325 330 335 Ala Ile Lys Leu Asp Asp Lys Asp Pro Gln Phe Lys Asp Asn Val Ile 340 345 350 Leu Leu Asn Lys His Ile Asp Ala Tyr Lys Thr Phe Pro Pro Thr Glu 355 360 365 Pro Lys Lys Asp Lys Lys Lys Lys Thr Asp Glu Ala Gln Pro Leu Pro 370 375 380 Gln Arg Gln Lys Lys Gln Pro Thr Val Thr Leu Leu Pro Ala Ala Asp 385 390 395 400 Met Asp Asp Phe Ser Arg Gln Leu Gln Asn Ser Met Ser Gly Ala Ser 405 410 415 Ala Asp Ser Thr Gln Ala 420 <210> 236 <211> 1266 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 236 atgtctgata atggacccca atcaaaccaa cgtagtgccc cccgcattac atttggtgga 60 cccacagatt caactgacaa taaccagaat ggaggacgca atggggcaag gccaaaacag 120 cgccgacccc aaggtttacc caataatact gcgtcttggt tcacagctct cactcagcat 180 ggcaaggagg aacttagatt ccctcgaggc cagggcgttc caatcaacac caatagtggt 240 ccagatgacc aaattggcta ctaccgaaga gctacccgac gagttcgtgg tggtgacggc 300 aaaatgaaag agctcagccc cagatggtac ttctattacc taggaactgg cccagaagct 360 tcacttccct acggcgctaa caaagaaggc atcgtatggg ttgcaactga gggagccttg 420 aatacaccca aagaccacat tggcacccgc aatcctaata acaatgctgc caccgtgcta 480 caacttcctc aaggaacaac attgccaaaa ggcttctacg cagagggaag cagaggcggc 540 agtcaagcct cttctcgctc ctcatcacgt agtcgcggta attcaagaaa ttcaactcct 600 ggcagcagta ggggaaattc tcctgctcga atggctagcg gaggtggtga aactgccctc 660 gcgctattgc tgctagacag attgaaccag cttgagagca aagtttctgg taaaggccaa 720 caacaacaag gccaaactgt cactaagaaa tctgctgctg aggcatctaa aaagcctcgc 780 caaaaacgta ctgccacaaa acagtacaac gtcactcaag catttgggag acgtggtcca 840 gaacaaaccc aaggaaattt cggggaccaa gacctaatca gacaaggaac tgattacaaa 900 cattggccgc aaattgcaca atttgctcca agtgcctctg cattctttgg aatgtcacgc 960 attggcatgg aagtcacacc ttcgggaaca tggctgactt atcatggagc cattaaattg 1020 gatgacaaag atccacaatt caaagacaac gtcatactgc tgaacaagca cattgacgca 1080 tacaaaacat tcccaccaac agagcctaaa aaggacaaaa agaaaaagac tgatgaagct 1140 cagcctttgc cgcagagaca aaagaagcag cccactgtga ctcttcttcc tgcggctgac 1200 atggatgatt tctccagaca acttcaaaat tccatgagtg gagcttctgc tgattcaact 1260 caggca 1266 <210> 237 <211> 1266 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding SARS CoV N protein <400> 237 atgagcgaca atggccctca gagcaaccag agaagcgccc ctagaatcac ctttggcggc 60 cctaccgaca gcaccgacaa caaccagaac ggcggcagaa atggcgccag acctaagcag 120 agaaggcctc agggcctgcc taacaatacc gccagctggt tcacagccct gacacagcac 180 ggcaaagagg aactgagatt ccccagagga cagggcgtgc ccatcaacac aaatagcggc 240 cctgacgacc agatcggcta ctacagacgg gccaccagaa gagttagagg cggcgacggc 300 aagatgaagg aactgtcccc tcggtggtac ttctactacc tcggcacagg acccgaagcc 360 agccttcctt atggcgccaa caaagagggc atcgtctggg ttgcaacaga aggcgccctg 420 aacaccccta aggaccacat cggcaccaga aatcccaaca acaacgccgc cacagtgctg 480 cagttgccac agggaacaac actgcccaag ggcttctacg ccgagggatc tagaggcgga 540 tctcaggcca gcagcagaag cagctctaga agcagaggca acagccggaa tagcacccct 600 ggcagctcca gaggcaattc ccctgccaga atggcttctg gcggcggaga aacagctctg 660 gcactgctgc tgctcgaccg gctgaatcag ctggaatcta aggtgtccgg caagggccag 720 caacagcagg gacagaccgt gaccaagaag tctgccgctg aggccagcaa gaagcccaga 780 cagaagagaa ccgccaccaa gcagtacaac gtgacccagg cctttggcag aagaggccca 840 gaacagaccc agggcaattt cggcgaccag gacctgatca gacagggcac cgattacaag 900 cactggcccc agatcgccca gtttgcccct tctgcctctg cctttttcgg catgagccgg 960 atcggcatgg aagtgacacc tagcggcacc tggctgacat atcacggcgc catcaagctg 1020 gacgacaagg accctcagtt caaggacaac gtgatcctgc tgaacaagca catcgacgcc 1080 tacaagacat tccctccaac cgagcctaag aaggacaaga agaagaaaac cgacgaggcc 1140 cagcctctgc cacagagaca gaaaaagcag cccaccgtga cactgctgcc tgccgccgat 1200 atggacgact tctctagaca gctgcagaac agcatgagcg gcgccagcgc tgattctaca 1260 caagct 1266 <210> 238 <211> 1266 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding SARS CoV N protein <400> 238 augagcgaca auggcccuca gagcaaccag agaagcgccc cuagaaucac cuuuggcggc 60 ccuaccgaca gcaccgacaa caaccagaac ggcggcagaa auggcgccag accuaagcag 120 agaaggccuc agggccugcc uaacaauacc gccagcuggu ucacagcccu gacacagcac 180 ggcaaagagg aacugagauu ccccagagga cagggcgugc ccaucaacac aaauagcggc 240 ccugacgacc agaucggcua cuacagacgg gccaccagaa gaguuagagg cggcgacggc 300 aagaugaagg aacugucccc ucggugguac uucuacuacc ucggcacagg acccgaagcc 360 agccuuccuu auggcgccaa caaagagggc aucgucuggg uugcaacaga aggcgcccug 420 aacaccccua aggaccacau cggcaccaga aaucccaaca acaacgccgc cacagugcug 480 caguugccac agggaacaac acugcccaag ggcuucuacg ccgagggauc uagaggcgga 540 ucucaggcca gcagcagaag cagcucuaga agcagaggca acagccggaa uagcaccccu 600 ggcagcucca gaggcaauuc cccugccaga auggcuucug gcggcggaga aacagcucug 660 gcacugcugc ugcucgaccg gcugaaucag cuggaaucua agguguccgg caagggccag 720 caacagcagg gacagaccgu gaccaagaag ucugccgcug aggccagcaa gaagcccaga 780 cagaagagaa ccgccaccaa gcaguacaac gugacccagg ccuuuggcag aagaggccca 840 gaacagaccc agggcaauuu cggcgaccag gaccugauca gacagggcac cgauuacaag 900 cacuggcccc agaucgccca guuugccccu ucugccucug ccuuuuucgg caugagccgg 960 aucggcaugg aagugacacc uagcggcacc uggcugacau aucacggcgc caucaagcug 1020 gacgacaagg acccucaguu caaggacaac gugauccugc ugaacaagca caucgacgcc 1080 uacaagacau ucccuccaac cgagccuaag aaggacaaga agaagaaaac cgacgaggcc 1140 cagccucugc cacagagaca gaaaaagcag cccaccguga cacugcugcc ugccgccgau 1200 auggacgacu ucucuagaca gcugcagaac agcaugagcg gcgccagcgc ugauucuaca 1260 caagcu 1266 <210> 239 <211> 454 <212> PRT <213> Murine coronavirus <400> 239 Met Ser Phe Val Pro Gly Gln Glu Asn Ala Gly Gly Arg Ser Ser Ser 1 5 10 15 Val Asn Arg Ala Gly Asn Gly Ile Leu Lys Lys Thr Thr Trp Ala Asp 20 25 30 Gln Thr Glu Arg Gly Pro Asn Asn Gln Asn Arg Gly Arg Arg Asn Gln 35 40 45 Pro Lys Gln Thr Ala Thr Thr Gln Pro Asn Ser Gly Ser Val Val Pro 50 55 60 His Tyr Ser Trp Phe Ser Gly Ile Thr Gln Phe Gln Lys Gly Lys Glu 65 70 75 80 Phe Gln Phe Ala Glu Gly Gln Gly Val Pro Ile Ala Asn Gly Ile Pro 85 90 95 Ala Ser Glu Gln Lys Gly Tyr Trp Tyr Arg His Asn Arg Arg Ser Phe 100 105 110 Lys Thr Pro Asp Gly Gln Gln Lys Gln Leu Leu Pro Arg Trp Tyr Phe 115 120 125 Tyr Tyr Leu Gly Thr Gly Pro His Ala Gly Ala Ser Tyr Gly Asp Ser 130 135 140 Ile Glu Gly Val Phe Trp Val Ala Asn Ser Gln Ala Asp Thr Asn Thr 145 150 155 160 Arg Ser Asp Ile Val Glu Arg Asp Pro Ser Ser His Glu Ala Ile Pro 165 170 175 Thr Arg Phe Ala Pro Gly Thr Val Leu Pro Gln Gly Phe Tyr Val Glu 180 185 190 Gly Ser Gly Arg Ser Ala Pro Ala Ser Arg Ser Gly Ser Arg Ser Gln 195 200 205 Ser Arg Gly Pro Asn Asn Arg Ala Arg Ser Ser Ser Asn Gln Arg Gln 210 215 220 Pro Ala Ser Thr Val Lys Pro Asp Met Ala Glu Glu Ile Ala Ala Leu 225 230 235 240 Val Leu Ala Lys Leu Gly Lys Asp Ala Gly Gln Pro Lys Gln Val Thr 245 250 255 Lys Gln Ser Ala Lys Glu Val Arg Gln Lys Ile Leu Asn Lys Pro Arg 260 265 270 Gln Lys Arg Thr Pro Asn Lys Gln Cys Pro Val Gln Gln Cys Phe Gly 275 280 285 Lys Arg Gly Pro Asn Gln Asn Phe Gly Gly Ser Glu Met Leu Lys Leu 290 295 300 Gly Thr Ser Asp Pro Gln Phe Pro Ile Leu Ala Glu Leu Ala Pro Thr 305 310 315 320 Val Gly Ala Phe Phe Phe Gly Ser Lys Leu Glu Leu Val Lys Lys Asn 325 330 335 Ser Gly Gly Ala Asp Glu Pro Thr Lys Asp Val Tyr Glu Leu Gln Tyr 340 345 350 Ser Gly Ala Val Arg Phe Asp Ser Thr Leu Pro Gly Phe Glu Thr Ile 355 360 365 Met Lys Val Leu Asn Glu Asn Leu Asn Ala Tyr Gln Lys Asp Gly Gly 370 375 380 Ala Asp Val Val Ser Pro Lys Pro Gln Arg Lys Gly Arg Arg Gln Ala 385 390 395 400 Gln Glu Lys Lys Asp Glu Val Asp Asn Val Ser Val Ala Lys Pro Lys 405 410 415 Ser Ser Val Gln Arg Asn Val Ser Arg Glu Leu Thr Pro Glu Asp Arg 420 425 430 Ser Leu Leu Ala Gln Ile Leu Asp Asp Gly Val Val Pro Asp Gly Leu 435 440 445 Glu Asp Asp Ser Asn Val 450 <210> 240 <211> 1362 <212> DNA <213> Murine coronavirus <400> 240 atgtcttttg ttcctgggca agaaaatgcc ggtggcagaa gctcctctgt aaaccgcgct 60 ggtaatggaa tcctcaagaa gaccacttgg gctgaccaaa ccgagcgtgg accaaataat 120 caaaatagag gcagaaggaa tcagccaaag cagactgcaa ctactcaacc caactccggg 180 agtgtggttc cccattactc ctggttttct ggcattaccc agttccaaaa gggaaaggag 240 tttcagtttg cagaaggaca aggagtgcct attgccaatg gaatccccgc ttcagagcaa 300 aagggatatt ggtatagaca caaccgccgt tcttttaaaa cacctgatgg gcagcagaag 360 caattactgc ccagatggta tttttactat cttggcacag ggccccatgc tggagccagt 420 tatggagaca gcattgaagg tgtcttctgg gttgcaaaca gccaagcgga caccaatacc 480 cgctctgata ttgtcgaaag ggacccaagc agtcatgagg ctattcctac taggtttgcg 540 cccggcacgg tattgcctca gggcttttat gttgaaggct ctggaaggtc tgcacctgct 600 agccgatctg gttcgcggtc acaatcccgt gggccaaata atcgcgctag aagcagttcc 660 aaccagcgcc agcctgcctc tactgtaaaa cctgatatgg ccgaagaaat tgctgctctt 720 gttttggcta agctcggtaa agatgccggc cagcccaagc aagtaacgaa gcaaagtgcc 780 aaagaagtca ggcagaaaat tttaaacaag cctcgccaaa agaggactcc aaacaagcag 840 tgcccagtgc agcagtgttt tggaaagaga ggccccaatc agaattttgg aggctctgaa 900 atgttaaaac ttggaactag tgatccacag ttccccattc ttgcagagtt ggctccaaca 960 gttggtgcct tcttctttgg atctaaatta gaattggtca aaaagaattc tggtggtgct 1020 gatgaaccca ccaaagatgt gtatgagctg caatattcag gtgcagttag atttgatagt 1080 actctacctg gttttgagac tatcatgaaa gtgttgaatg agaatttgaa tgcctaccag 1140 aaggatggtg gtgcagatgt ggtgagccca aagccccaaa gaaaagggcg tagacaggct 1200 caggaaaaga aagatgaagt agataatgta agcgttgcaa agcccaaaag ctctgtgcag 1260 cgaaatgtaa gtagagaatt aaccccagag gatagaagtc tgttggctca gatccttgat 1320 gatggcgtag tgccagatgg gttagaagat gactctaatg tg 1362 <210> 241 <211> 1362 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding MHV N protein <400> 241 atgagcttcg tgcccggcca agaaaatgcc ggcggaagat ctagcagcgt gaacagagcc 60 ggcaacggca tcctgaagaa aaccacctgg gccgaccaga ccgagagagg ccccaacaac 120 cagaaccggg gcagaagaaa ccagcctaag cagaccgcca ccacacagcc taatagcggc 180 tctgtggtgc cccactacag ctggtttagc ggcatcaccc agttccagaa gggcaaagag 240 ttccagttcg ccgaaggaca gggcgtgcca atcgccaatg gaatccctgc ctctgagcag 300 aaaggctact ggtacagaca caaccggcgg agcttcaaga cccctgatgg acagcagaaa 360 cagctgctgc ccagatggta cttctactac ctcggcacag gacctcacgc aggcgcctct 420 tatggcgatt ctatcgaggg cgtgttctgg gtcgccaaca gccaggccga taccaacacc 480 agatccgaca tcgtggaacg ggaccctagc agccacgagg ccattcctac aagatttgcc 540 cctggcaccg tgctgcctca gggcttttat gtggaaggca gcggaagaag cgcccctgcc 600 agtagatctg gcagcagatc tcagagcagg ggccctaaca acagagccag aagcagcagc 660 aaccagagac agcctgccag caccgtgaag cccgatatgg ccgaagaaat cgccgctctg 720 gtgctggcca agctgggaaa agatgccggc cagccaaagc aagtgaccaa gcagagcgcc 780 aaagaagtgc ggcagaagat cctgaacaag ccccggcaga agcggacccc taacaagcag 840 tgtcctgtgc agcagtgctt cggcaagagg ggccccaatc agaattttgg cggcagcgag 900 atgctgaagc tgggcacaag cgatcctcag ttccctatcc tggccgagct ggctcctaca 960 gtgggcgcat ttttctttgg ctccaaactc gagctggtca agaagaacag cggcggagcc 1020 gatgagccca ccaaggatgt gtacgagctg cagtactctg gcgccgtcag attcgatagc 1080 accctgcctg gcttcgagac aatcatgaag gtgctgaacg agaacctgaa cgcctaccag 1140 aaggatggcg gcgctgacgt ggtgtctcct aagcctcaga gaaaaggcag acggcaggcc 1200 caagagaaga aagacgaggt ggacaacgtg tccgtggcca agcctaagag cagcgtgcag 1260 agaaacgtgt ccagagagct gaccccagag gacagatctc tgctggctca gatcctggac 1320 gatggcgtgg tgccagatgg cctggaagat gacagcaacg tg 1362 <210> 242 <211> 1362 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding MHV N protein <400> 242 augagcuucg ugcccggcca agaaaaugcc ggcggaagau cuagcagcgu gaacagagcc 60 ggcaacggca uccugaagaa aaccaccugg gccgaccaga ccgagagagg ccccaacaac 120 cagaaccggg gcagaagaaa ccagccuaag cagaccgcca ccacacagcc uaauagcggc 180 ucuguggugc cccacuacag cugguuuagc ggcaucaccc aguuccagaa gggcaaagag 240 uuccaguucg ccgaaggaca gggcgugcca aucgccaaug gaaucccugc cucugagcag 300 aaaggcuacu gguacagaca caaccggcgg agcuucaaga ccccugaugg acagcagaaa 360 cagcugcugc ccagauggua cuucuacuac cucggcacag gaccucacgc aggcgccucu 420 uauggcgauu cuaucgaggg cguguucugg gucgccaaca gccaggccga uaccaacacc 480 agauccgaca ucguggaacg ggacccuagc agccacgagg ccauuccuac aagauuugcc 540 ccuggcaccg ugcugccuca gggcuuuuau guggaaggca gcggaagaag cgccccugcc 600 aguagaucug gcagcagauc ucagagcagg ggcccuaaca acagagccag aagcagcagc 660 aaccagagac agccugccag caccgugaag cccgauaugg ccgaagaaau cgccgcucug 720 gugcuggcca agcugggaaa agaugccggc cagccaaagc aagugaccaa gcagagcgcc 780 aaagaagugc ggcagaagau ccugaacaag ccccggcaga agcggacccc uaacaagcag 840 uguccugugc agcagugcuu cggcaagagg ggccccaauc agaauuuugg cggcagcgag 900 augcugaagc ugggcacaag cgauccucag uucccuaucc uggccgagcu ggcuccuaca 960 gugggcgcau uuuucuuugg cuccaaacuc gagcugguca agaagaacag cggcggagcc 1020 gaugagccca ccaaggaugu guacgagcug caguacucug gcgccgucag auucgauagc 1080 acccugccug gcuucgagac aaucaugaag gugcugaacg agaaccugaa cgccuaccag 1140 aaggauggcg gcgcugacgu ggugucuccu aagccucaga gaaaaggcag acggcaggcc 1200 caagagaaga aagacgaggu ggacaacgug uccguggcca agccuaagag cagcgugcag 1260 agaaacgugu ccagagagcu gaccccagag gacagaucuc ugcuggcuca gauccuggac 1320 gauggcgugg ugccagaugg ccuggaagau gacagcaacg ug 1362 <210> 243 <211> 154 <212> PRT <213> Foot-and-mouth disease virus <400> 243 Pro Phe Phe Phe Ser Asp Val Arg Ser Asn Phe Ser Lys Leu Val Glu 1 5 10 15 Thr Ile Asn Gln Met Gln Glu Asp Met Ser Thr Lys His Gly Pro Asp 20 25 30 Phe Asn Arg Leu Val Ser Ala Phe Glu Glu Leu Ala Ala Gly Val Lys 35 40 45 Ala Ile Arg Thr Gly Leu Asp Glu Ala Lys Pro Trp Tyr Lys Leu Ile 50 55 60 Lys Leu Leu Ser Arg Leu Ser Cys Met Ala Ala Val Ala Ala Arg Ser 65 70 75 80 Lys Asp Pro Val Leu Val Ala Ile Met Leu Ala Asp Thr Gly Leu Glu 85 90 95 Ile Leu Asp Ser Thr Phe Val Val Lys Lys Ile Ser Asp Ser Leu Ser 100 105 110 Ser Leu Phe His Val Pro Ala Pro Val Phe Ser Phe Gly Ala Pro Ile 115 120 125 Leu Leu Ala Gly Leu Val Lys Val Ala Ser Ser Phe Phe Arg Ser Thr 130 135 140 Pro Glu Asp Leu Glu Arg Ala Glu Lys Gln 145 150 <210> 244 <211> 462 <212> DNA <213> Foot-and-mouth disease virus <400> 244 cccttcttct tctctgacgt taggtcaaac ttttctaagc tggtggaaac catcaaccag 60 atgcaggaag acatgtcaac aaaacacggg cccgacttta accggttggt gtccgccttt 120 gaggaactgg ccgctggagt aaaagccatc aggaccggcc tcgacgaggc caaaccctgg 180 tacaagctta tcaaactcct aagccgcctg tcgtgcatgg ccgctgtggc agcacggtcc 240 aaggacccag tccttgtggc catcatgctg gccgacaccg gtctcgagat tctggacagc 300 actttcgtcg tgaagaagat ctccgactcg ctctccagtc tcttccacgt gccggccccc 360 gtcttcagtt tcggagcccc gattctgcta gccgggctgg tcaaggtcgc ctcgagtttc 420 ttccggtcca cgcccgaaga ccttgagaga gcagagaaac ag 462 <210> 245 <211> 462 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding FMDV 2B protein <400> 245 ccgttcttct ttagcgacgt gcggagcaac ttcagcaagc tggtggaaac catcaaccag 60 atgcaagagg acatgagcac caagcacggc cccgacttca acagactggt gtccgccttt 120 gaggaactgg ccgctggcgt gaaggccatc agaacaggac tggatgaggc caagccttgg 180 tacaagctga tcaagctgct gagccggctg agctgtatgg ctgctgtggc cgccagatcc 240 aaggatcctg tgctggtggc catcatgctg gccgatacag gcctggaaat cctggacagc 300 accttcgtgg tcaagaagat cagcgacagc ctgagcagcc tgttccacgt gccagctcca 360 gtgttctctt ttggcgcccc tattctgctg gccggcctgg tcaaagtggc cagcagcttc 420 tttagaagca cccctgagga cctggaacgg gccgaaaaac aa 462 <210> 246 <211> 462 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding FMDV 2B protein <400> 246 ccguucuucu uuagcgacgu gcggagcaac uucagcaagc ugguggaaac caucaaccag 60 augcaagagg acaugagcac caagcacggc cccgacuuca acagacuggu guccgccuuu 120 gaggaacugg ccgcuggcgu gaaggccauc agaacaggac uggaugaggc caagccuugg 180 uacaagcuga ucaagcugcu gagccggcug agcuguaugg cugcuguggc cgccagaucc 240 aaggauccug ugcugguggc caucaugcug gccgauacag gccuggaaau ccuggacagc 300 accuucgugg ucaagaagau cagcgacagc cugagcagcc uguuccacgu gccagcucca 360 guguucucuu uuggcgcccc uauucugcug gccggccugg ucaaaguggc cagcagcuuc 420 uuuagaagca ccccugagga ccuggaacgg gccgaaaaac aa 462 <210> 247 <211> 87 <212> PRT <213> Influenza A virus <400> 247 Met Gly Gln Glu Gln Asp Thr Pro Trp Ile Leu Ser Thr Gly His Ile 1 5 10 15 Ser Thr Gln Lys Arg Glu Asp Gly Gln Gln Thr Pro Lys Leu Glu His 20 25 30 Arg Asn Ser Thr Arg Leu Met Gly His Phe Gln Lys Thr Met Asn Gln 35 40 45 Val Val Met Pro Lys Gln Ile Val Tyr Trp Arg Arg Trp Leu Ser Leu 50 55 60 Arg Asn Pro Ile Leu Val Phe Leu Lys Thr Arg Val Leu Lys Arg Trp 65 70 75 80 Arg Leu Phe Ser Lys His Glu 85 <210> 248 <211> 261 <212> DNA <213> Influenza A virus <400> 248 atgggacagg aacaggatac accatggata ctgtcaacag gacacatcag tactcagaaa 60 agggaagatg gacaacaaac accgaaactg gagcaccgca actcaacccg attgatgggc 120 cacttccaga agacaatgaa ccaagtggtt atgcccaaac agattgtgta ttggaggcga 180 tggctttcct tgaggaatcc catcctggta tttttgaaaa ctcgtgtatt gaaacgatgg 240 aggttgttca gcaaacacga g 261 <210> 249 <211> 261 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding Influenza A virus PB1-F2 protein <400> 249 atgggccaag agcaggacac accttggatc ctgagcaccg gccacatcag cacccagaag 60 agagaggacg gacagcagac ccctaagctg gaacaccgga acagcaccag actgatgggc 120 cacttccaga aaaccatgaa ccaggtggtc atgcccaagc agatcgtgta ctggcggaga 180 tggctgagcc tgcggaatcc tatcctggtg ttcctgaaaa cccgggtgct gaagagatgg 240 cggctgttct ctaagcacga g 261 <210> 250 <211> 261 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding Influenza A virus PB1-F2 protein <400> 250 augggccaag agcaggacac accuuggauc cugagcaccg gccacaucag cacccagaag 60 agagaggacg gacagcagac cccuaagcug gaacaccgga acagcaccag acugaugggc 120 cacuuccaga aaaccaugaa ccaggugguc augcccaagc agaucgugua cuggcggaga 180 uggcugagcc ugcggaaucc uauccuggug uuccugaaaa cccgggugcu gaagagaugg 240 cggcuguucu cuaagcacga g 261 <210> 251 <211> 314 <212> PRT <213> Hepatitis A virus <400> 251 Gly Ile Ser Asp Asp Asp Ser Ala Val Ala Glu Phe Phe Gln Ser Phe 1 5 10 15 Pro Ser Gly Glu Pro Ser Asn Ser Lys Leu Ser Ser Phe Phe Gln Ser 20 25 30 Val Thr Asn His Lys Trp Val Ala Val Gly Ala Ala Val Gly Ile Leu 35 40 45 Gly Leu Leu Val Gly Gly Trp Phe Val Tyr Lys His Phe Ser Arg Lys 50 55 60 Glu Glu Glu Pro Ile Pro Ala Glu Gly Val Tyr His Gly Val Thr Lys 65 70 75 80 Pro Lys Gln Val Ile Lys Leu Asp Ala Asp Pro Val Glu Ser Gln Ser 85 90 95 Thr Leu Glu Ile Ala Gly Leu Val Arg Lys Asn Leu Val Gln Phe Gly 100 105 110 Val Gly Glu Lys Asn Gly Cys Val Arg Trp Val Met Asn Ala Leu Gly 115 120 125 Val Lys Asp Asp Trp Leu Leu Val Pro Ser His Ala Tyr Lys Phe Glu 130 135 140 Lys Asp Tyr Glu Met Met Glu Phe Tyr Phe Asn Arg Gly Gly Thr Tyr 145 150 155 160 Tyr Ser Ile Ser Ala Gly Asn Val Val Ile Gln Ser Leu Asp Val Gly 165 170 175 Phe Gln Asp Val Val Leu Met Lys Val Pro Thr Ile Pro Lys Phe Arg 180 185 190 Asp Ile Thr Gln His Phe Ile Lys Lys Gly Asp Val Pro Arg Ala Leu 195 200 205 Asn Arg Leu Ala Thr Leu Val Thr Thr Val Asn Gly Thr Pro Met Leu 210 215 220 Ile Ser Glu Gly Pro Leu Lys Met Glu Glu Lys Ala Thr Tyr Val His 225 230 235 240 Lys Lys Asn Asp Gly Thr Thr Val Asp Leu Thr Val Asp Gln Ala Trp 245 250 255 Arg Gly Lys Gly Glu Gly Leu Pro Gly Met Cys Gly Gly Ala Leu Val 260 265 270 Ser Ser Asn Gln Ser Ile Gln Asn Ala Ile Leu Gly Ile His Val Ala 275 280 285 Gly Gly Asn Ser Ile Leu Val Ala Lys Leu Ile Thr Gln Glu Met Phe 290 295 300 Gln Asn Ile Asp Lys Lys Ile Glu Ser Gln 305 310 <210> 252 <211> 942 <212> DNA <213> Hepatitis A virus <400> 252 ggaatttcag atgatgacag tgcagtagct gagtttttcc agtcttttcc atctggtgaa 60 ccatcaaatt ccaagttatc tagttttttc caatctgtca ctaatcacaa gtgggttgct 120 gtgggagctg cagttggtat tcttggattg ctagtgggag gatggtttgt gtataagcat 180 ttttcccgca aagaggaaga accaattcca gctgaagggg tttatcatgg agtgactaag 240 cccaaacaag tgattaaatt ggatgcagat ccagtagagt cccagtcaac tctagaaata 300 gcaggattag ttaggaaaaa tttggttcag tttggagttg gtgagaaaaa tggatgtgtg 360 agatgggtca tgaatgcctt aggagtgaag gatgattggt tgttagtacc ttctcatgct 420 tataaatttg aaaaggatta tgaaatgatg gagttttatt tcaatagagg tggaacttac 480 tattcaattt cagctggtaa tgttgttatt caatctttag atgtgggatt ccaagatgtt 540 gttctaatga aggttcctac aattcccaag tttagagata ttactcaaca ttttattaag 600 aaaggagatg tgcctagagc cttgaatcgc ttggcaacat tagtgacaac cgttaatgga 660 actcctatgt taatttctga gggaccttta aaaatggaag aaaaagccac ttatgttcat 720 aagaagaacg atggtactac ggttgatttg actgtagatc aggcatggag aggaaaaggt 780 gaaggtcttc ctggaatgtg tggtggggcc ctagtgtcat caaatcagtc catacaaaat 840 gcaattttgg gtattcatgt tgctggagga aattcaattc ttgtggcaaa gttgattact 900 caagaaatgt ttcaaaacat tgataagaaa attgaaagtc ag 942 <210> 253 <211> 942 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding Hepatitis A protein 3ABC <400> 253 ggcatcagcg acgatgattc tgccgtggcc gagttcttcc agagctttcc tagcggcgag 60 cccagcaaca gcaagctgag cagcttcttc cagtccgtga ccaaccacaa atgggtcgcc 120 gtgggagccg ctgtgggaat tctgggactt ctcgttggcg gatggttcgt gtacaagcac 180 ttcagccgga aagaggaaga acccattcct gccgagggcg tgtaccacgg cgtgaccaaa 240 cctaagcaag tgatcaagct ggacgccgat cctgtggaaa gccagagcac actggaaatc 300 gccggactcg tgcggaagaa cctggtgcag tttggcgtgg gcgagaagaa cggctgtgtc 360 agatgggtca tgaacgccct gggcgtgaag gacgattggc tgctggttcc tagccacgcc 420 tacaagttcg agaaggacta cgagatgatg gaattctact tcaacagagg cggcacctac 480 tacagcatca gcgccggcaa tgtggtcatc cagtctctgg atgtgggctt ccaggacgtg 540 gtgctgatga aggtgccaac aatccccaag ttccgggaca tcacccagca cttcatcaag 600 aaaggcgacg tgcccagggc tctgaacaga ctggctaccc tggtcaccac cgtgaacggc 660 acacccatgc tgatctctga gggcccactg aagatggaag agaaggccac ctacgtgcac 720 aagaagaacg acggcaccac agtggacctg accgtggatc aagcttggag aggcaaaggc 780 gagggcctgc ctggaatgtg tggcggagca ctggtgtcca gcaaccagag catccagaat 840 gccatcctgg gcatccatgt ggctggcggc aattctatcc tggtggccaa gctgatcacc 900 caagagatgt tccagaacat cgacaagaag atcgagagcc ag 942 <210> 254 <211> 942 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding Hepatitis A protein 3ABC <400> 254 ggcaucagcg acgaugauuc ugccguggcc gaguucuucc agagcuuucc uagcggcgag 60 cccagcaaca gcaagcugag cagcuucuuc caguccguga ccaaccacaa augggucgcc 120 gugggagccg cugugggaau ucugggacuu cucguuggcg gaugguucgu guacaagcac 180 uucagccgga aagaggaaga acccauuccu gccgagggcg uguaccacgg cgugaccaaa 240 ccuaagcaag ugaucaagcu ggacgccgau ccuguggaaa gccagagcac acuggaaauc 300 gccggacucg ugcggaagaa ccuggugcag uuuggcgugg gcgagaagaa cggcuguguc 360 agauggguca ugaacgcccu gggcgugaag gacgauuggc ugcugguucc uagccacgcc 420 uacaaguucg agaaggacua cgagaugaug gaauucuacu ucaacagagg cggcaccuac 480 uacagcauca gcgccggcaa uguggucauc cagucucugg augugggcuu ccaggacgug 540 gugcugauga aggugccaac aauccccaag uuccgggaca ucacccagca cuucaucaag 600 aaaggcgacg ugcccagggc ucugaacaga cuggcuaccc uggucaccac cgugaacggc 660 acacccaugc ugaucucuga gggcccacug aagauggaag agaaggccac cuacgugcac 720 aagaagaacg acggcaccac aguggaccug accguggauc aagcuuggag aggcaaaggc 780 gagggccugc cuggaaugug uggcggagca cuggugucca gcaaccagag cauccagaau 840 gccauccugg gcauccaugu ggcuggcggc aauucuaucc ugguggccaa gcugaucacc 900 caagagaugu uccagaacau cgacaagaag aucgagagcc ag 942 <210> 255 <211> 154 <212> PRT <213> Hepatitis B virus <400> 255 Met Ala Ala Arg Leu Cys Cys Gln Leu Asp Pro Ala Arg Asp Val Leu 1 5 10 15 Cys Leu Arg Pro Val Gly Ala Glu Ser Arg Gly Arg Pro Phe Ser Gly 20 25 30 Ser Leu Gly Thr Leu Ser Ser Pro Ser Pro Ser Ala Val Ser Thr Asp 35 40 45 His Gly Ala His Leu Ser Leu Arg Gly Leu Pro Val Cys Ala Phe Ser 50 55 60 Ser Ala Gly Pro Cys Ala Leu Arg Phe Thr Ser Ala Arg Arg Met Glu 65 70 75 80 Thr Thr Val Lys Ala Gln Pro Phe Leu Pro Lys Val Leu His Lys Arg 85 90 95 Thr Leu Gly Leu Ser Val Met Ser Thr Thr Asp Leu Glu Ala Tyr Phe 100 105 110 Lys Asp Cys Leu Phe Lys Asp Trp Glu Glu Leu Gly Glu Glu Ile Arg 115 120 125 Leu Lys Val Phe Val Leu Gly Gly Cys Arg His Lys Leu Val Cys Ala 130 135 140 Pro Ala Pro Cys Asn Phe Phe Thr Ser Ala 145 150 <210> 256 <211> 462 <212> DNA <213> Hepatitis B virus <400> 256 atggctgcta ggctgtgctg ccaactggat cctgcgcggg acgtcctttg tttacgtccc 60 gtcggcgctg aatcccgcgg acgacccttc tcggggtcgc ttgggactct ctcgtcccct 120 tctccgtctg ccgtttcgac cgaccacggg gcgcacctct ctttacgcgg actccccgtc 180 tgtgccttct catctgccgg accgtgtgca cttcgcttca cctctgcacg tcgcatggag 240 accaccgtga aagcccaacc attcttgccc aaggtcttac ataagaggac tcttggactc 300 tctgtaatgt caacgaccga ccttgaggca tacttcaaag actgtttgtt taaagactgg 360 gaggagttgg gggaggagat tagattaaag gtctttgtat taggaggctg taggcataaa 420 ttggtctgcg caccagcacc atgcaacttt ttcacctctg cc 462 <210> 257 <211> 462 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding Hepatitis B X protein <400> 257 atggccgcca gactgtgctg tcaactggac cctgctaggg acgtgctgtg tctcagacct 60 gtgggagccg agtctagagg cagacctttt tctggctctc tgggcaccct gagcagccca 120 tctccatctg ccgtgtctac agatcacggc gcccacctgt ctctgagagg actgcctgtg 180 tgtgccttta gcagcgccgg accttgcgct ctgagattca catctgccag acggatggaa 240 accaccgtga aggcccagcc tttcctgcct aaggtgctgc acaagagaac cctgggcctg 300 agcgtgatga gcaccacaga tctggaagcc tacttcaagg attgcctgtt caaggactgg 360 gaagaactgg gcgaagagat ccggctgaag gtgttcgtgc tcggcggatg cagacacaag 420 ctcgtgtgtg ctcccgctcc ttgcaacttc tttaccagcg ct 462 <210> 258 <211> 462 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding Hepatitis B X protein <400> 258 auggccgcca gacugugcug ucaacuggac ccugcuaggg acgugcugug ucucagaccu 60 gugggagccg agucuagagg cagaccuuuu ucuggcucuc ugggcacccu gagcagccca 120 ucuccaucug ccgugucuac agaucacggc gcccaccugu cucugagagg acugccugug 180 ugugccuuua gcagcgccgg accuugcgcu cugagauuca caucugccag acggauggaa 240 accaccguga aggcccagcc uuuccugccu aaggugcugc acaagagaac ccugggccug 300 agcgugauga gcaccacaga ucuggaagcc uacuucaagg auugccuguu caaggacugg 360 gaagaacugg gcgaagagau ccggcugaag guguucgugc ucggcggaug cagacacaag 420 cucgugugug cucccgcucc uugcaacuuc uuuaccagcg cu 462 <210> 259 <211> 346 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 259 Ser Leu Glu Asn Val Ala Tyr Asn Val Val Asn Lys Gly His Phe Asp 1 5 10 15 Gly His Ala Gly Glu Ala Pro Val Ser Ile Ile Asn Asn Ala Val Tyr 20 25 30 Thr Lys Val Asp Gly Ile Asp Val Glu Ile Phe Glu Asn Lys Thr Thr 35 40 45 Leu Pro Val Asn Val Ala Phe Glu Leu Trp Ala Lys Arg Asn Ile Lys 50 55 60 Pro Val Pro Glu Ile Lys Ile Leu Asn Asn Leu Gly Val Asp Ile Ala 65 70 75 80 Ala Asn Thr Val Ile Trp Asp Tyr Lys Arg Glu Ala Pro Ala His Val 85 90 95 Ser Thr Ile Gly Val Cys Thr Met Thr Asp Ile Ala Lys Lys Pro Thr 100 105 110 Glu Ser Ala Cys Ser Ser Leu Thr Val Leu Phe Asp Gly Arg Val Glu 115 120 125 Gly Gln Val Asp Leu Phe Arg Asn Ala Arg Asn Gly Val Leu Ile Thr 130 135 140 Glu Gly Ser Val Lys Gly Leu Thr Pro Ser Lys Gly Pro Ala Gln Ala 145 150 155 160 Ser Val Asn Gly Val Thr Leu Ile Gly Glu Ser Val Lys Thr Gln Phe 165 170 175 Asn Tyr Phe Lys Lys Val Asp Gly Ile Ile Gln Gln Leu Pro Glu Thr 180 185 190 Tyr Phe Thr Gln Ser Arg Asp Leu Glu Asp Phe Lys Pro Arg Ser Gln 195 200 205 Met Glu Thr Asp Phe Leu Glu Leu Ala Met Asp Glu Phe Ile Gln Arg 210 215 220 Tyr Lys Leu Glu Gly Tyr Ala Phe Glu His Ile Val Tyr Gly Asp Phe 225 230 235 240 Ser His Gly Gln Leu Gly Gly Leu His Leu Met Ile Gly Leu Ala Lys 245 250 255 Arg Ser Gln Asp Ser Pro Leu Lys Leu Glu Asp Phe Ile Pro Met Asp 260 265 270 Ser Thr Val Lys Asn Tyr Phe Ile Thr Asp Ala Gln Thr Gly Ser Ser 275 280 285 Lys Cys Val Cys Ser Val Ile Asp Leu Leu Leu Asp Asp Phe Val Glu 290 295 300 Ile Ile Lys Ser Gln Asp Leu Ser Val Ile Ser Lys Val Val Lys Val 305 310 315 320 Thr Ile Asp Tyr Ala Glu Ile Ser Phe Met Leu Trp Cys Lys Asp Gly 325 330 335 His Val Glu Thr Phe Tyr Pro Lys Leu Gln 340 345 <210> 260 <211> 1038 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 260 agtttagaaa atgtggctta taatgttgtt aataaaggac actttgatgg acacgccggc 60 gaagcacctg tttccatcat taataatgct gtttacacaa aggtagatgg tattgatgtg 120 gagatctttg aaaataagac aacacttcct gttaatgttg catttgagct ttgggctaag 180 cgtaacatta aaccagtgcc agagattaag atactcaata atttgggtgt tgatatcgct 240 gctaatactg taatctggga ctacaaaaga gaagccccag cacatgtatc tacaataggt 300 gtctgcacaa tgactgacat tgccaagaaa cctactgaga gtgcttgttc ttcacttact 360 gtcttgtttg atggtagagt ggaaggacag gtagaccttt ttagaaacgc ccgtaatggt 420 gttttaataa cagaaggttc agtcaaaggt ctaacacctt caaagggacc agcacaagct 480 agcgtcaatg gagtcacatt aattggagaa tcagtaaaaa cacagtttaa ctactttaag 540 aaagtagacg gcattattca acagttgcct gaaacctact ttactcagag cagagactta 600 gaggatttta agcccagatc acaaatggaa actgactttc tcgagctcgc tatggatgaa 660 ttcatacagc gatataagct cgagggctat gccttcgaac acatcgttta tggagatttc 720 agtcatggac aacttggcgg tcttcattta atgataggct tagccaagcg ctcacaagat 780 tcaccactta aattagagga ttttatccct atggacagca cagtgaaaaa ttacttcata 840 acagatgcgc aaacaggttc atcaaaatgt gtgtgttctg tgattgatct tttacttgat 900 gactttgtcg agataataaa gtcacaagat ttgtcagtga tttcaaaagt ggtcaaggtt 960 acaattgact atgctgaaat ttcattcatg ctttggtgta aggatggaca tgttgaaacc 1020 ttctacccaa aactacaa 1038 <210> 261 <211> 1038 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding SARS-CoV NSP15 protein <400> 261 agcctggaaa acgtggccta caacgtggtc aacaagggcc actttgatgg ccacgctggc 60 gaagcccctg tgtccatcat taacaacgcc gtgtacacca aggtggacgg catcgacgtg 120 gaaatcttcg agaacaagac cacactgccc gtgaatgtgg ccttcgagct gtgggccaag 180 cggaacatta agcccgtgcc tgagatcaag atcctgaaca acctgggcgt cgacattgcc 240 gccaacaccg tgatctggga ctacaagaga gaagccccag ctcacgtgtc caccatcggc 300 gtgtgtacca tgaccgatat cgccaagaag cccaccgaga gcgcctgtag ctctctgacc 360 gtgctgttcg acggcagagt ggaaggccag gtggacctgt tcagaaacgc cagaaacggc 420 gtgctgatca ccgagggctc tgtgaaggga ctgacccctt ctaagggacc tgctcaggcc 480 tctgtgaatg gcgtgacact gatcggcgag agcgtgaaaa cccagttcaa ctacttcaag 540 aaggtcgacg ggatcatcca gcagctgccc gagacatact tcacccagag ccgcgacctg 600 gaagatttca agcctcggag ccagatggaa accgacttcc tggaactggc catggacgag 660 ttcatccagc ggtacaagct ggaaggctac gcctttgagc acatcgtgta cggcgatttc 720 agccacggac agctcggagg actgcacctg atgattggcc tggccaagag aagccaggac 780 agccctctga agctcgagga cttcatcccc atggacagca ccgtgaagaa ttacttcatc 840 acagacgccc agaccggcag ctctaagtgc gtgtgtagcg tgatcgacct gctgctggac 900 gactttgtgg aaatcatcaa gagccaggac ctgagcgtga tctccaaggt ggtcaaagtg 960 accatcgact acgccgagat cagcttcatg ctgtggtgca aggacggcca cgtggaaaca 1020 ttctacccca agctgcag 1038 <210> 262 <211> 1038 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding SARS-CoV NSP15 protein <400> 262 agccuggaaa acguggccua caacgugguc aacaagggcc acuuugaugg ccacgcuggc 60 gaagccccug uguccaucau uaacaacgcc guguacacca agguggacgg caucgacgug 120 gaaaucuucg agaacaagac cacacugccc gugaaugugg ccuucgagcu gugggccaag 180 cggaacauua agcccgugcc ugagaucaag auccugaaca accugggcgu cgacauugcc 240 gccaacaccg ugaucuggga cuacaagaga gaagccccag cucacguguc caccaucggc 300 guguguacca ugaccgauau cgccaagaag cccaccgaga gcgccuguag cucucugacc 360 gugcuguucg acggcagagu ggaaggccag guggaccugu ucagaaacgc cagaaacggc 420 gugcugauca ccgagggcuc ugugaaggga cugaccccuu cuaagggacc ugcucaggcc 480 ucugugaaug gcgugacacu gaucggcgag agcgugaaaa cccaguucaa cuacuucaag 540 aaggucgacg ggaucaucca gcagcugccc gagacauacu ucacccagag ccgcgaccug 600 gaagauuuca agccucggag ccagauggaa accgacuucc uggaacuggc cauggacgag 660 uucauccagc gguacaagcu ggaaggcuac gccuuugagc acaucgugua cggcgauuuc 720 agccacggac agcucggagg acugcaccug augauuggcc uggccaagag aagccaggac 780 agcccucuga agcucgagga cuucaucccc auggacagca ccgugaagaa uuacuucauc 840 acagacgccc agaccggcag cucuaagugc guguguagcg ugaucgaccu gcugcuggac 900 gacuuugugg aaaucaucaa gagccaggac cugagcguga ucuccaaggu ggucaaagug 960 accaucgacu acgccgagau cagcuucaug cuguggugca aggacggcca cguggaaaca 1020 uucuacccca agcugcag 1038 <210> 263 <211> 98 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 263 Met Asp Pro Asn Gln Thr Asn Val Val Pro Pro Ala Leu His Leu Val 1 5 10 15 Asp Pro Gln Ile Gln Leu Thr Ile Thr Arg Met Glu Asp Ala Met Gly 20 25 30 Gln Gly Gln Asn Ser Ala Asp Pro Lys Val Tyr Pro Ile Ile Leu Arg 35 40 45 Leu Gly Ser Gln Leu Ser Leu Ser Met Ala Arg Arg Asn Leu Asp Ser 50 55 60 Leu Glu Ala Arg Ala Phe Gln Ser Thr Pro Ile Val Val Gln Met Thr 65 70 75 80 Lys Leu Ala Thr Thr Glu Glu Leu Pro Asp Glu Phe Val Val Val Thr 85 90 95 Ala Lys <210> 264 <211> 294 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 264 atggacccca atcaaaccaa cgtagtgccc cccgcattac atttggtgga cccacagatt 60 caactgacaa taaccagaat ggaggacgca atggggcaag gccaaaacag cgccgacccc 120 aaggtttacc caataatact gcgtcttggt tcacagctct cactcagcat ggcaaggagg 180 aacttagatt ccctcgaggc cagggcgttc caatcaacac caatagtggt ccagatgacc 240 aaattggcta ctaccgaaga gctacccgac gagttcgtgg tggtgacggc aaaa 294 <210> 265 <211> 294 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding SARS-CoV Orf9b protein <400> 265 atggacccca accagaccaa tgtggtgcct cctgctctgc acctggtgga ccctcagatc 60 cagctgacca tcaccagaat ggaagatgcc atgggccagg gccagaacag cgccgatcct 120 aaggtgtacc ccatcatcct gagactgggc agccagctga gcctgagcat ggccagaaga 180 aacctggaca gcctggaagc cagagccttc cagagcacac ctatcgtggt gcagatgacc 240 aagctggcca ccaccgagga actgcccgat gagtttgtgg tggtcaccgc caaa 294 <210> 266 <211> 294 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding SARS-CoV Orf9b protein <400> 266 auggacccca accagaccaa uguggugccu ccugcucugc accuggugga cccucagauc 60 cagcugacca ucaccagaau ggaagaugcc augggccagg gccagaacag cgccgauccu 120 aagguguacc ccaucauccu gagacugggc agccagcuga gccugagcau ggccagaaga 180 aaccuggaca gccuggaagc cagagccuuc cagagcacac cuaucguggu gcagaugacc 240 aagcuggcca ccaccgagga acugcccgau gaguuugugg uggucaccgc caaa 294 <210> 267 <211> 142 <212> PRT <213> Human rhinovirus <400> 267 Gly Pro Ser Asp Leu Tyr Val His Val Gly Asn Leu Ile Tyr Arg Asn 1 5 10 15 Leu His Leu Phe Asn Ser Glu Met His Asp Ser Ile Leu Ile Ser Tyr 20 25 30 Ser Ser Asp Leu Ile Ile Tyr Arg Thr Asn Thr Ile Gly Asp Asp Tyr 35 40 45 Ile Pro Asn Cys Asn Cys Thr Glu Ala Thr Tyr Tyr Cys Arg His Lys 50 55 60 Asn Arg Tyr Tyr Pro Ile Lys Val Thr Pro His Asp Trp Tyr Glu Ile 65 70 75 80 Gln Glu Ser Glu Tyr Tyr Pro Lys His Ile Gln Tyr Asn Leu Leu Ile 85 90 95 Gly Glu Gly Pro Cys Glu Pro Gly Asp Cys Gly Gly Lys Leu Leu Cys 100 105 110 Arg His Gly Val Ile Gly Ile Ile Thr Ala Gly Gly Glu Gly His Val 115 120 125 Ala Phe Ile Asp Leu Arg Gln Phe His Cys Ala Glu Glu Gln 130 135 140 <210> 268 <211> 426 <212> DNA <213> Human rhinovirus <400> 268 gggcccagtg atctatatgt gcatgtaggt aacttaatat atagaaactt acatctgttc 60 aattctgaaa tgcatgattc aattttgatt tcatactctt ctgatttaat catataccgc 120 acaaacacta taggtgatga ttatattccc aattgtaact gcactgaggc tacttattat 180 tgtagacaca aaaataggta ttacccaata aaagttactc cacatgattg gtatgaaata 240 caagagagtg aatattaccc caaacacatc caatacaacc tattaattgg tgaaggacca 300 tgtgaacctg gtgattgtgg tggaaaactt ctttgtagac atggtgtcat tggcataatc 360 acagcaggtg gtgaaggtca tgtagcattt atagatctta gacaatttca ctgtgctgag 420 gaacaa 426 <210> 269 <211> 426 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding Rhinovirus 2Apro protein <400> 269 ggccctagcg atctgtatgt gcacgtgggc aacctgatct accggaacct gcacctgttc 60 aacagcgaga tgcacgacag catcctgatc agctacagca gcgacctgat catctatcgg 120 accaacacca tcggcgacga ctacatcccc aactgcaact gtaccgaggc cacctactac 180 tgccggcaca agaaccggta ctaccccatc aaagtgaccc ctcacgattg gtacgagatc 240 caagagagcg agtactaccc taagcacatc cagtacaacc tgctgatcgg cgagggacct 300 tgcgagcctg gcgattgtgg tggaaagctg ctgtgtagac acggcgtgat cggcatcatt 360 acagccggcg gagaaggaca cgtggccttt atcgacctgc ggcagtttca ctgcgccgag 420 gaacag 426 <210> 270 <211> 426 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding Rhinovirus 2Apro protein <400> 270 ggcccuagcg aucuguaugu gcacgugggc aaccugaucu accggaaccu gcaccuguuc 60 aacagcgaga ugcacgacag cauccugauc agcuacagca gcgaccugau caucuaucgg 120 accaacacca ucggcgacga cuacaucccc aacugcaacu guaccgaggc caccuacuac 180 ugccggcaca agaaccggua cuaccccauc aaagugaccc cucacgauug guacgagauc 240 caagagagcg aguacuaccc uaagcacauc caguacaacc ugcugaucgg cgagggaccu 300 ugcgagccug gcgauugugg uggaaagcug cuguguagac acggcgugau cggcaucauu 360 acagccggcg gagaaggaca cguggccuuu aucgaccugc ggcaguuuca cugcgccgag 420 gaacag 426 <210> 271 <211> 183 <212> PRT <213> Human rhinovirus <400> 271 Gly Pro Glu Glu Glu Phe Gly Arg Ser Ile Leu Lys Asn Asn Thr Cys 1 5 10 15 Val Ile Thr Thr Gly Asn Gly Lys Phe Thr Gly Leu Gly Ile His Asp 20 25 30 Arg Ile Leu Ile Ile Pro Thr His Ala Asp Pro Gly Arg Glu Val Gln 35 40 45 Val Asn Gly Val His Thr Lys Val Leu Asp Ser Tyr Asp Leu Tyr Asn 50 55 60 Arg Asp Gly Val Lys Leu Glu Ile Thr Val Ile Gln Leu Asp Arg Asn 65 70 75 80 Glu Lys Phe Arg Asp Ile Arg Lys Tyr Ile Pro Glu Thr Glu Asp Asp 85 90 95 Tyr Pro Glu Cys Asn Leu Ala Leu Ser Ala Asn Gln Asp Glu Pro Thr 100 105 110 Ile Ile Lys Val Gly Asp Val Val Ser Tyr Gly Asn Ile Leu Leu Ser 115 120 125 Gly Asn Gln Thr Ala Arg Met Leu Lys Tyr Asn Tyr Pro Thr Lys Ser 130 135 140 Gly Tyr Cys Gly Gly Val Leu Tyr Lys Ile Gly Gln Ile Leu Gly Ile 145 150 155 160 His Val Gly Gly Asn Gly Arg Asp Gly Phe Ser Ala Met Leu Leu Arg 165 170 175 Ser Tyr Phe Thr Asp Thr Gln 180 <210> 272 <211> 549 <212> DNA <213> Human rhinovirus <400> 272 ggtccagaag aagaatttgg aaggtcaatt ctcaaaaaca atacttgtgt gattactaca 60 ggtaatggaa aatttacagg tcttggtata catgacagaa ttctaatcat cccaacacat 120 gctgatccag gtagagaggt ccaagttaat ggtgtccaca ctaaggttct agactcatat 180 gatctttata atagagatgg agttaaactt gaaataacgg tcatacaatt agatagaaat 240 gaaaaattta gggacattag aaagtatata cctgaaacag aagacgatta tccagaatgc 300 aatttggcac tttcagctaa tcaagatgaa ccaactataa ttaaagtagg agatgtagtg 360 tcctatggca atattttgct tagtggaaat caaacagcca gaatgcttaa atataattac 420 cccacaaaat cagggtattg tggaggggta ctatataaaa ttggtcaaat tctaggtatt 480 catgtgggtg gaaatggaag ggatggtttt tcagctatgt tacttagatc atactttaca 540 gatactcag 549 <210> 273 <211> 549 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding Rhinovirus 3Cpro protein <400> 273 ggacctgagg aagagttcgg cagatccatc ctgaagaaca atacctgcgt gatcaccacc 60 ggcaacggca agtttacagg cctgggcatc cacgaccgga tcctgatcat tcccacacac 120 gccgatcctg gccgggaagt gcaagtgaat ggcgtgcaca ccaaggtgct ggacagctac 180 gacctgtaca accgcgacgg cgtgaagctg gaaatcaccg tgattcagct ggaccggaac 240 gagaagttcc gggacatccg gaagtacatc cccgagacag aggacgacta ccccgagtgt 300 aatctggccc tgagcgccaa ccaggacgag cccacaatta tcaaagtggg cgacgtggtg 360 tcctacggca acatcctgct gtccggcaat cagaccgcca gaatgctgaa gtacaactac 420 cccaccaaga gcggctactg tggcggcgtg ctgtataaga tcggccagat cctgggaatt 480 cacgtcggcg gcaatggcag agatggcttc tctgctatgc tgctgcggag ctacttcacc 540 gacacacag 549 <210> 274 <211> 549 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding Rhinovirus 3Cpro protein <400> 274 ggaccugagg aagaguucgg cagauccauc cugaagaaca auaccugcgu gaucaccacc 60 ggcaacggca aguuuacagg ccugggcauc cacgaccgga uccugaucau ucccacacac 120 gccgauccug gccgggaagu gcaagugaau ggcgugcaca ccaaggugcu ggacagcuac 180 gaccuguaca accgcgacgg cgugaagcug gaaaucaccg ugauucagcu ggaccggaac 240 gagaaguucc gggacauccg gaaguacauc cccgagacag aggacgacua ccccgagugu 300 aaucuggccc ugagcgccaa ccaggacgag cccacaauua ucaaaguggg cgacguggug 360 uccuacggca acauccugcu guccggcaau cagaccgcca gaaugcugaa guacaacuac 420 cccaccaaga gcggcuacug uggcggcgug cuguauaaga ucggccagau ccugggaauu 480 cacgucggcg gcaauggcag agauggcuuc ucugcuaugc ugcugcggag cuacuucacc 540 gacacacag 549 <210> 275 <211> 835 <212> PRT <213> Rotavirus A <400> 275 Met Lys Val Leu Ala Leu Arg His Ser Val Ala Gln Val Tyr Ala Asp 1 5 10 15 Thr Gln Val Tyr Val His Asp Asp Thr Lys Asp Ser Tyr Glu Asn Ala 20 25 30 Phe Leu Ile Ser Asn Leu Thr Thr His Asn Ile Leu Tyr Leu Asn Tyr 35 40 45 Ser Ile Lys Thr Leu Glu Ile Leu Asn Lys Ser Gly Ile Ala Ala Ile 50 55 60 Ala Leu Gln Ser Leu Glu Glu Leu Phe Thr Leu Ile Arg Cys Asn Phe 65 70 75 80 Thr Tyr Asp Tyr Glu Leu Asp Ile Ile Tyr Leu His Asp Tyr Ser Tyr 85 90 95 Tyr Thr Asn Asn Glu Ile Arg Thr Asp Gln His Trp Ile Thr Lys Thr 100 105 110 Asn Ile Glu Glu Tyr Leu Leu Pro Gly Trp Lys Leu Thr Tyr Val Gly 115 120 125 Tyr Asn Gly Ser Glu Thr Arg Gly His Tyr Asn Phe Ser Phe Lys Cys 130 135 140 Gln Asn Ala Ala Thr Asp Asp Asp Leu Ile Ile Glu Tyr Ile Tyr Ser 145 150 155 160 Glu Ala Leu Asp Phe Gln Asn Phe Met Leu Lys Lys Ile Lys Glu Arg 165 170 175 Met Thr Thr Ser Leu Pro Ile Ala Arg Leu Ser Asn Arg Val Phe Arg 180 185 190 Asp Lys Leu Phe Pro Ser Leu Leu Lys Glu His Lys Asn Val Val Asn 195 200 205 Val Gly Pro Arg Asn Glu Ser Met Phe Thr Phe Leu Asn Tyr Pro Thr 210 215 220 Ile Lys Gln Phe Ser Asn Gly Ala Tyr Leu Val Lys Asp Thr Ile Lys 225 230 235 240 Leu Lys Gln Glu Arg Trp Leu Gly Lys Arg Ile Ser Gln Phe Asp Ile 245 250 255 Gly Gln Tyr Lys Asn Met Leu Asn Val Leu Thr Ala Ile Tyr Tyr Tyr 260 265 270 Tyr Asn Leu Tyr Lys Ser Lys Pro Ile Ile Tyr Met Ile Gly Ser Ala 275 280 285 Pro Ser Tyr Trp Ile Tyr Asp Val Arg His Tyr Ser Asp Phe Phe Phe 290 295 300 Glu Thr Trp Asp Pro Leu Asp Thr Pro Tyr Ser Ser Ile His His Lys 305 310 315 320 Glu Leu Phe Phe Ile Asn Asp Val Lys Lys Leu Lys Asp Asn Ser Ile 325 330 335 Leu Tyr Ile Asp Ile Arg Thr Asp Arg Gly Asn Ala Asp Trp Lys Lys 340 345 350 Trp Arg Lys Thr Val Glu Glu Gln Thr Ile Asn Asn Leu Asp Ile Ala 355 360 365 Tyr Glu Tyr Leu Arg Thr Gly Lys Ala Lys Val Cys Cys Val Lys Met 370 375 380 Thr Ala Met Asp Leu Glu Leu Pro Ile Ser Ala Lys Leu Leu His His 385 390 395 400 Pro Thr Thr Glu Ile Arg Ser Glu Phe Tyr Leu Leu Leu Asp Thr Trp 405 410 415 Asp Leu Thr Asn Ile Arg Arg Phe Ile Pro Lys Gly Val Leu Tyr Ser 420 425 430 Phe Ile Asn Asn Ile Ile Thr Glu Asn Val Phe Ile Gln Gln Pro Phe 435 440 445 Lys Val Lys Val Leu Asn Asp Ser Tyr Ile Val Ala Leu Tyr Ala Leu 450 455 460 Ser Asn Asp Phe Asn Asn Arg Ser Glu Val Ile Lys Leu Ile Asn Asn 465 470 475 480 Gln Lys Gln Ser Leu Ile Thr Val Arg Ile Asn Asn Thr Phe Lys Asp 485 490 495 Glu Pro Lys Val Gly Phe Lys Asn Ile Tyr Asp Trp Thr Phe Leu Pro 500 505 510 Thr Asp Phe Asp Thr Lys Glu Ala Ile Ile Thr Ser Tyr Asp Gly Cys 515 520 525 Leu Gly Leu Phe Gly Leu Ser Ile Ser Leu Ala Ser Lys Pro Thr Gly 530 535 540 Asn Asn His Leu Phe Ile Leu Ser Gly Thr Asp Lys Tyr Tyr Lys Leu 545 550 555 560 Asp Gln Phe Ala Asn His Thr Ser Ile Ser Arg Arg Ser His Gln Ile 565 570 575 Arg Phe Ser Glu Ser Ala Thr Ser Tyr Ser Gly Tyr Ile Phe Arg Asp 580 585 590 Leu Ser Asn Asn Asn Phe Asn Leu Ile Gly Thr Asn Ile Glu Asn Ser 595 600 605 Val Ser Gly His Val Tyr Asn Ala Leu Ile Tyr Tyr Arg Tyr Asn Tyr 610 615 620 Ser Phe Asp Leu Lys Arg Trp Ile Tyr Leu His Ser Ile Asp Lys Val 625 630 635 640 Asp Ile Glu Gly Gly Lys Tyr Tyr Glu Leu Ala Pro Ile Glu Leu Ile 645 650 655 Tyr Ala Cys Arg Ser Ala Lys Glu Phe Ala Thr Leu Gln Asp Asp Leu 660 665 670 Thr Val Leu Arg Tyr Ser Asn Glu Ile Glu Asn Tyr Ile Asn Thr Val 675 680 685 Tyr Ser Ile Thr Tyr Ala Asp Asp Pro Asn Tyr Phe Ile Gly Ile Gln 690 695 700 Phe Arg Asn Ile Pro Tyr Lys Tyr Asp Val Lys Ile Pro His Leu Thr 705 710 715 720 Phe Gly Val Leu His Ile Ser Asp Asn Met Val Pro Asp Val Ile Asp 725 730 735 Ile Leu Lys Ile Met Lys Asn Glu Leu Phe Lys Met Asp Ile Thr Thr 740 745 750 Ser Tyr Thr Tyr Met Leu Ser Asp Gly Ile Tyr Val Ala Asn Val Ser 755 760 765 Gly Val Leu Ser Thr Tyr Phe Lys Ile Tyr Asn Val Phe Tyr Lys Asn 770 775 780 Gln Ile Thr Phe Gly Gln Ser Arg Met Phe Ile Pro His Ile Thr Leu 785 790 795 800 Ser Phe Asn Asn Met Arg Thr Val Arg Ile Glu Thr Thr Lys Leu Gln 805 810 815 Ile Lys Ser Ile Tyr Leu Arg Lys Ile Lys Gly Asp Thr Val Phe Asp 820 825 830 Met Val Glu 835 <210> 276 <211> 2505 <212> DNA <213> Rotavirus A <400> 276 atgaaagtac tagctttaag acacagtgtg gctcaagtgt atgcagacac tcaagtctac 60 gttcatgatg atacaaaaga tagttatgaa aacgcttttt taatctctaa tcttacgacc 120 cataatattt tatacttaaa ttatagcatt aaaacattag aaatattaaa taagtcagga 180 atagctgcaa ttgctttaca atcacttgaa gaattattca cattaataag gtgtaatttc 240 acttatgatt atgaacttga tataatatat ttacatgatt attcatatta taccaataat 300 gaaattagaa cagaccaaca ttggataaca aaaacaaata ttgaagaata tttactacct 360 ggatggaaat taacatatgt tggttataat ggaagtgaaa ctagaggaca ttataacttt 420 tcatttaaat gtcaaaacgc tgcaacagat gatgatctaa taattgaata catttattca 480 gaagcgttgg acttccaaaa ttttatgtta aaaaagataa aggaaagaat gactacatcg 540 ttgcctatag ctagattatc taacagagta tttagggata agttattccc atcattattg 600 aaagaacata agaatgtagt gaacgttggt ccgcgtaatg aatctatgtt tacattttta 660 aattatccaa ctataaaaca attttcaaat ggtgcgtatt tagtaaaaga tactataaaa 720 ttaaaacaag aacgatggtt aggtaaaagg atatctcagt ttgatattgg tcagtataaa 780 aatatgctga atgttcttac agcaatttat tattactata atttatataa aagtaaacca 840 attatatata tgatcggatc tgctccatct tattggatat atgacgttag gcattattcc 900 gattttttct ttgaaacttg ggatccattg gacacaccat attcatcaat ccatcacaaa 960 gaattatttt ttataaatga tgtgaagaaa ctgaaggata actcaatatt gtatattgat 1020 ataagaaccg ataggggcaa tgctgattgg aaaaaatgga gaaagacagt agaagaacaa 1080 actattaata atttggacat agcttatgaa tatttacgaa cgggtaaagc gaaggtgtgt 1140 tgtgttaaga tgacagctat ggatttggaa ctgccaattt cagctaaatt actgcaccac 1200 ccaactacgg aaataagatc agaattttat ttattactag atacttggga tttaactaac 1260 attaggaggt tcattcctaa aggcgtgtta tattcattta taaacaatat aataactgaa 1320 aatgtgttta ttcaacaacc atttaaagta aaagtactga atgatagtta tattgtagcg 1380 ttatatgcat tatcaaatga ttttaataat agatcagaag taattaaatt aattaataat 1440 cagaaacaat ctctaataac tgttagaata aataatacgt ttaaggatga accaaaagtt 1500 gggttcaaaa atatctatga ttggaccttt cttccaaccg actttgatac caaagaagct 1560 ataattactt catacgacgg ttgtttagga ctctttggtt tgtctatatc gttagcatca 1620 aaaccaacag ggaataatca tttattcatt ttaagtggta cagataagta ttataaattg 1680 gatcaatttg ctaatcacac cagtatatcg agaagatcac accaaattag gttttcggaa 1740 tctgctactt catattcagg ttatatattt agagatttgt ccaataataa ttttaatcta 1800 attggtacta atatagagaa ttcagtatca ggtcatgtat ataatgcttt aatttattat 1860 agatataatt attcatttga tcttaaacgc tggatttatt tacattctat agataaagtt 1920 gatatagaag gaggaaagta ttatgaactc gcaccaatag aattaattta tgcatgtaga 1980 tcagcaaaag aatttgctac attgcaggat gacttaactg tattgagata ttcaaacgaa 2040 atagagaatt atattaatac agtatatagt ataacatacg ctgatgatcc gaattacttt 2100 atcggaatac aatttagaaa tataccatat aaatatgatg ttaaaatacc gcatttaacc 2160 ttcggagtat tacatatttc tgataacatg gtgccagacg tgattgacat actaaagata 2220 atgaagaatg aattatttaa aatggatatt acgaccagtt atacatatat gttatcagat 2280 ggaatctacg tagcaaatgt tagtggagta ttatctacat actttaaaat ctataacgta 2340 ttttataaaa atcaaataac ttttggccaa tccagaatgt ttattccgca cataacatta 2400 agcttcaata acatgagaac agtaaggata gagactacta aattacaaat taaatccatt 2460 tatttaagaa agattaaggg tgatacagtg tttgatatgg ttgag 2505 <210> 277 <211> 2505 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding Rotavirus VP3 protein <400> 277 atgaaggtgc tggccctgag acattctgtg gcccaggtgt acgccgacac acaggtctac 60 gtgcacgacg acaccaagga cagctacgag aacgccttcc tgatcagcaa cctgaccaca 120 cacaacatcc tgtacctgaa ctacagcatc aagaccctcg agatcctgaa caagagcgga 180 atcgccgcta tcgccctgca gagcctggaa gaactgttca ccctgatccg gtgcaacttc 240 acctacgact acgagctgga catcatctac ctgcacgatt acagctacta caccaacaac 300 gagatccgga ccgaccagca ctggatcacc aagaccaaca tcgaggaata cctgctgcct 360 ggctggaagc tgacctacgt gggctacaat ggcagcgaga cacggggcca ctacaacttc 420 agcttcaagt gccagaacgc cgccaccgac gacgacctga tcatcgagta catctacagc 480 gaggccctgg acttccagaa cttcatgctg aagaaaatca aagaacggat gaccaccagc 540 ctgcctatcg ccagactgag caaccgggtg ttccgggaca agctgtttcc cagcctgctg 600 aaagaacaca agaacgtggt caacgtgggc cccagaaacg agagcatgtt cacctttctg 660 aactacccca ccatcaagca gttcagcaac ggcgcctacc tggtcaagga cacaatcaag 720 ctgaagcaag agagatggct gggcaagaga atcagccagt tcgacatcgg ccagtacaag 780 aacatgctga acgtgctgac cgccatctac tactactata acctgtacaa gagcaagccg 840 atcatctaca tgattggcag cgcccctagc tactggatct acgacgtgcg gcactacagc 900 gactttttct tcgaaacctg ggatcccctg gacacccctt acagcagcat ccaccacaaa 960 gagctgttct tcatcaacga cgtgaagaag ctcaaggaca acagcatcct ctacatcgac 1020 atcagaaccg accggggcaa cgccgactgg aagaaatggc ggaaaaccgt ggaagaacag 1080 accatcaaca acctggatat cgcctacgag tacctgcgga ccggcaaggc caaagtgtgc 1140 tgcgtgaaga tgacagccat ggacctggaa ctgcccatca gcgccaaact gctgcaccat 1200 cctaccaccg agatcagaag cgagttctat ctgctgctgg acacctggga cctgaccaat 1260 atcagacggt tcatccccaa gggcgtgctg tactccttta tcaacaacat catcaccgag 1320 aacgtgttca tccagcagcc gttcaaagtg aaagtgctga acgacagcta catcgtggcc 1380 ctgtacgccc tgagcaacga cttcaacaat cggagcgaag tgatcaaact gatcaacaat 1440 cagaagcagt ccctgatcac cgtgcgcatc aacaatacct tcaaggacga gcccaaagtg 1500 ggcttcaaga atatctacga ctggaccttc ctgcctaccg acttcgacac caaagaggcc 1560 atcatcacaa gctacgacgg ctgcctgggc ctgtttggcc tgtctattag cctggccagc 1620 aagcccaccg gcaacaacca cctgtttatc ctgagcggca ccgacaagta ctacaagctg 1680 gatcagttcg ccaaccacac cagcatcagc agaagaagcc accagatccg gttcagcgag 1740 agcgccacaa gctatagcgg ctacatcttc cgggacctgt ccaacaacaa cttcaacctg 1800 atcggcacga acatcgagaa cagcgtgtcc ggccacgtgt acaacgccct gatctactac 1860 cggtacaact actccttcga cctgaagcgg tggatctatc tgcacagcat cgacaaggtg 1920 gacatcgaag gcggcaagta ctatgagctg gcccctatcg agctgatcta cgcctgcaga 1980 agcgccaaag agttcgccac actgcaggac gatctgaccg tgctgagata cagcaatgag 2040 atcgagaact acatcaacac cgtgtactcc atcacctacg ccgacgatcc caactacttc 2100 atcggaatcc agttccgcaa catcccctat aagtacgacg tcaagatccc tcacctgacc 2160 ttcggcgtgc tgcacatcag cgacaacatg gtgcccgacg tgatcgacat cctgaagatc 2220 atgaagaatg agctgttcaa gatggacatc accaccagct acacctacat gctgagcgac 2280 ggcatctacg tggccaatgt gtctggcgtg ctgagcacct acttcaagat ctacaacgtg 2340 ttctacaaga accagatcac cttcggccag agccggatgt tcatccctca catcaccctg 2400 agctttaaca acatgcggac cgtgcggatc gaaaccacca agctgcagat caagagcatc 2460 tacctccgga agatcaaggg cgacaccgtg ttcgacatgg tggaa 2505 <210> 278 <211> 2505 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding Rotavirus VP3 protein <400> 278 augaaggugc uggcccugag acauucugug gcccaggugu acgccgacac acaggucuac 60 gugcacgacg acaccaagga cagcuacgag aacgccuucc ugaucagcaa ccugaccaca 120 cacaacaucc uguaccugaa cuacagcauc aagacccucg agauccugaa caagagcgga 180 aucgccgcua ucgcccugca gagccuggaa gaacuguuca cccugauccg gugcaacuuc 240 accuacgacu acgagcugga caucaucuac cugcacgauu acagcuacua caccaacaac 300 gagauccgga ccgaccagca cuggaucacc aagaccaaca ucgaggaaua ccugcugccu 360 ggcuggaagc ugaccuacgu gggcuacaau ggcagcgaga cacggggcca cuacaacuuc 420 agcuucaagu gccagaacgc cgccaccgac gacgaccuga ucaucgagua caucuacagc 480 gaggcccugg acuuccagaa cuucaugcug aagaaaauca aagaacggau gaccaccagc 540 cugccuaucg ccagacugag caaccgggug uuccgggaca agcuguuucc cagccugcug 600 aaagaacaca agaacguggu caacgugggc cccagaaacg agagcauguu caccuuucug 660 aacuacccca ccaucaagca guucagcaac ggcgccuacc uggucaagga cacaaucaag 720 cugaagcaag agagauggcu gggcaagaga aucagccagu ucgacaucgg ccaguacaag 780 aacaugcuga acgugcugac cgccaucuac uacuacuaua accuguacaa gagcaagccg 840 aucaucuaca ugauuggcag cgccccuagc uacuggaucu acgacgugcg gcacuacagc 900 gacuuuuucu ucgaaaccug ggauccccug gacaccccuu acagcagcau ccaccacaaa 960 gagcuguucu ucaucaacga cgugaagaag cucaaggaca acagcauccu cuacaucgac 1020 aucagaaccg accggggcaa cgccgacugg aagaaauggc ggaaaaccgu ggaagaacag 1080 accaucaaca accuggauau cgccuacgag uaccugcgga ccggcaaggc caaagugugc 1140 ugcgugaaga ugacagccau ggaccuggaa cugcccauca gcgccaaacu gcugcaccau 1200 ccuaccaccg agaucagaag cgaguucuau cugcugcugg acaccuggga ccugaccaau 1260 aucagacggu ucauccccaa gggcgugcug uacuccuuua ucaacaacau caucaccgag 1320 aacguguuca uccagcagcc guucaaagug aaagugcuga acgacagcua caucguggcc 1380 cuguacgccc ugagcaacga cuucaacaau cggagcgaag ugaucaaacu gaucaacaau 1440 cagaagcagu cccugaucac cgugcgcauc aacaauaccu ucaaggacga gcccaaagug 1500 ggcuucaaga auaucuacga cuggaccuuc cugccuaccg acuucgacac caaagaggcc 1560 aucaucacaa gcuacgacgg cugccugggc cuguuuggcc ugucuauuag ccuggccagc 1620 aagcccaccg gcaacaacca ccuguuuauc cugagcggca ccgacaagua cuacaagcug 1680 gaucaguucg ccaaccacac cagcaucagc agaagaagcc accagauccg guucagcgag 1740 agcgccacaa gcuauagcgg cuacaucuuc cgggaccugu ccaacaacaa cuucaaccug 1800 aucggcacga acaucgagaa cagcgugucc ggccacgugu acaacgcccu gaucuacuac 1860 cgguacaacu acuccuucga ccugaagcgg uggaucuauc ugcacagcau cgacaaggug 1920 gacaucgaag gcggcaagua cuaugagcug gccccuaucg agcugaucua cgccugcaga 1980 agcgccaaag aguucgccac acugcaggac gaucugaccg ugcugagaua cagcaaugag 2040 aucgagaacu acaucaacac cguguacucc aucaccuacg ccgacgaucc caacuacuuc 2100 aucggaaucc aguuccgcaa cauccccuau aaguacgacg ucaagauccc ucaccugacc 2160 uucggcgugc ugcacaucag cgacaacaug gugcccgacg ugaucgacau ccugaagauc 2220 augaagaaug agcuguucaa gauggacauc accaccagcu acaccuacau gcugagcgac 2280 ggcaucuacg uggccaaugu gucuggcgug cugagcaccu acuucaagau cuacaacgug 2340 uucuacaaga accagaucac cuucggccag agccggaugu ucaucccuca caucacccug 2400 agcuuuaaca acaugcggac cgugcggauc gaaaccacca agcugcagau caagagcauc 2460 uaccuccgga agaucaaggg cgacaccgug uucgacaugg uggaa 2505 <210> 279 <211> 675 <212> PRT <213> Hepatitis GB virus B <400> 279 Ala Pro Phe Thr Leu Gln Cys Leu Ser Glu Arg Gly Thr Leu Ser Ala 1 5 10 15 Met Ala Val Val Met Thr Gly Ile Asp Pro Arg Thr Trp Thr Gly Thr 20 25 30 Ile Phe Arg Leu Gly Ser Leu Ala Thr Ser Tyr Met Gly Phe Val Cys 35 40 45 Asp Asn Val Leu Tyr Thr Ala His His Gly Ser Lys Gly Arg Arg Leu 50 55 60 Ala His Pro Thr Gly Ser Ile His Pro Ile Thr Val Asp Ala Ala Asn 65 70 75 80 Asp Gln Asp Ile Tyr Gln Pro Pro Cys Gly Ala Gly Ser Leu Thr Arg 85 90 95 Cys Ser Cys Gly Glu Thr Lys Gly Tyr Leu Val Thr Arg Leu Gly Ser 100 105 110 Leu Val Glu Val Asn Lys Ser Asp Asp Pro Tyr Trp Cys Val Cys Gly 115 120 125 Ala Leu Pro Met Ala Val Ala Lys Gly Ser Ser Gly Ala Pro Ile Leu 130 135 140 Cys Ser Ser Gly His Val Ile Gly Met Phe Thr Ala Ala Arg Asn Ser 145 150 155 160 Gly Gly Ser Val Ser Gln Ile Arg Val Arg Pro Leu Val Cys Ala Gly 165 170 175 Tyr His Pro Gln Tyr Thr Ala His Ala Thr Leu Asp Thr Lys Pro Thr 180 185 190 Val Pro Asn Glu Tyr Ser Val Gln Ile Leu Ile Ala Pro Thr Gly Ser 195 200 205 Gly Lys Ser Thr Lys Leu Pro Leu Ser Tyr Met Gln Glu Lys Tyr Glu 210 215 220 Val Leu Val Leu Asn Pro Ser Val Ala Thr Thr Ala Ser Met Pro Lys 225 230 235 240 Tyr Met His Ala Thr Tyr Gly Val Asn Pro Asn Cys Tyr Phe Asn Gly 245 250 255 Lys Cys Thr Asn Thr Gly Ala Ser Leu Thr Tyr Ser Thr Tyr Gly Met 260 265 270 Tyr Leu Thr Gly Ala Cys Ser Arg Asn Tyr Asp Val Ile Ile Cys Asp 275 280 285 Glu Cys His Ala Thr Asp Ala Thr Thr Val Leu Gly Ile Gly Lys Val 290 295 300 Leu Thr Glu Ala Pro Ser Lys Asn Val Arg Leu Val Val Leu Ala Thr 305 310 315 320 Ala Thr Pro Pro Gly Val Ile Pro Thr Pro His Ala Asn Ile Thr Glu 325 330 335 Ile Gln Leu Thr Asp Glu Gly Thr Ile Pro Phe His Gly Lys Lys Ile 340 345 350 Lys Glu Glu Asn Leu Lys Lys Gly Arg His Leu Ile Phe Glu Ala Thr 355 360 365 Lys Lys His Cys Asp Glu Leu Ala Asn Glu Leu Ala Arg Lys Gly Ile 370 375 380 Thr Ala Val Ser Tyr Tyr Arg Gly Cys Asp Ile Ser Lys Ile Pro Glu 385 390 395 400 Gly Asp Cys Val Val Val Ala Thr Asp Ala Leu Cys Thr Gly Tyr Thr 405 410 415 Gly Asp Phe Asp Ser Val Tyr Asp Cys Ser Leu Met Val Glu Gly Thr 420 425 430 Cys His Val Asp Leu Asp Pro Thr Phe Thr Met Gly Val Arg Val Cys 435 440 445 Gly Val Ser Ala Ile Val Lys Gly Gln Arg Arg Gly Arg Thr Gly Arg 450 455 460 Gly Arg Ala Gly Ile Tyr Tyr Tyr Val Asp Gly Ser Cys Thr Pro Ser 465 470 475 480 Gly Met Val Pro Glu Cys Asn Ile Val Glu Ala Phe Asp Ala Ala Lys 485 490 495 Ala Trp Tyr Gly Leu Ser Ser Thr Glu Ala Gln Thr Ile Leu Asp Thr 500 505 510 Tyr Arg Thr Gln Pro Gly Leu Pro Ala Ile Gly Ala Asn Leu Asp Glu 515 520 525 Trp Ala Asp Leu Phe Ser Met Val Asn Pro Glu Pro Ser Phe Val Asn 530 535 540 Thr Ala Lys Arg Thr Ala Asp Asn Tyr Val Leu Leu Thr Ala Ala Gln 545 550 555 560 Leu Gln Leu Cys His Gln Tyr Gly Tyr Ala Ala Pro Asn Asp Ala Pro 565 570 575 Arg Trp Gln Gly Ala Arg Leu Gly Lys Lys Pro Cys Gly Val Leu Trp 580 585 590 Arg Leu Asp Gly Ala Asp Ala Cys Pro Gly Pro Glu Pro Ser Glu Val 595 600 605 Thr Arg Tyr Gln Met Cys Phe Thr Glu Val Asn Thr Ser Gly Thr Ala 610 615 620 Ala Leu Ala Val Gly Val Gly Val Ala Met Ala Tyr Leu Ala Ile Asp 625 630 635 640 Thr Phe Gly Ala Thr Cys Val Arg Arg Cys Trp Ser Ile Thr Ser Val 645 650 655 Pro Thr Gly Ala Thr Val Ala Pro Val Val Asp Glu Glu Glu Ile Val 660 665 670 Glu Glu Cys 675 <210> 280 <211> 2025 <212> DNA <213> Hepatitis GB virus B <400> 280 gcacctttta cgctgcagtg tctctctgaa cgtggcacgc tgtcagcgat ggcagtggtc 60 atgactggta tagacccccg aacttggact ggaactatct tcagattagg atctctggcc 120 actagctaca tgggatttgt ttgtgacaac gtgttgtata ctgctcacca tggcagcaag 180 gggcgccggt tggctcatcc cacaggctcc atacacccaa taaccgttga cgcggctaat 240 gaccaggaca tctatcaacc accatgtgga gctgggtccc ttactcggtg ctcttgcggg 300 gagaccaagg ggtatctggt aacacgactg gggtcattgg ttgaggtcaa caaatccgat 360 gacccttatt ggtgtgtgtg cggggccctt cccatggctg ttgccaaggg ttcttcaggt 420 gccccgattc tgtgctcctc cgggcatgtt attgggatgt tcaccgctgc tagaaattct 480 ggcggttcag tcagccagat tagggttagg ccgttggtgt gtgctggata ccatccccag 540 tacacagcac atgccactct tgatacaaaa cctactgtgc ctaacgagta ttcagtgcaa 600 attttaattg cccccactgg cagcggcaag tcaaccaaat taccactttc ttacatgcag 660 gagaagtatg aggtcttggt cctaaatccc agtgtggcta caacagcatc aatgccaaag 720 tacatgcacg cgacgtacgg cgtgaatcca aattgctatt ttaatggcaa atgtaccaac 780 acaggggctt cacttacgta cagcacatat ggcatgtacc tgaccggagc atgttcccgg 840 aactatgacg tcatcatttg tgacgaatgc catgctaccg atgcaaccac cgtgttgggc 900 attggaaagg ttctaaccga agctccatcc aaaaatgtta ggctagtggt tcttgccacg 960 gctacccccc ctggagtaat ccctacacca catgccaaca taactgagat tcaattaacc 1020 gatgaaggca ctatcccctt tcatggaaaa aagattaagg aggaaaatct gaagaaaggg 1080 agacacctta tctttgaggc taccaaaaaa cactgtgatg agcttgctaa cgagttagct 1140 cgaaagggaa taacagctgt ctcttactat aggggatgtg acatctcaaa aatccctgag 1200 ggcgactgtg tagtagttgc cactgatgcc ttgtgtacag ggtacactgg tgactttgat 1260 tccgtgtatg actgcagcct catggtagaa ggcacatgcc atgttgacct tgaccctact 1320 ttcaccatgg gtgttcgtgt gtgcggggtc tcagcaatag ttaaaggcca gcgtaggggc 1380 cgcacaggcc gtgggagagc tggcatatac tactatgtag acgggagttg taccccttcg 1440 ggtatggttc ctgaatgcaa cattgttgaa gccttcgacg cagccaaggc atggtatggt 1500 ttgtcatcaa cagaagctca aactattctg gacacctatc gcacccaacc tgggttacct 1560 gcgataggag caaatttgga cgagtgggct gatctctttt ctatggtcaa ccccgaacct 1620 tcatttgtca atactgcaaa aagaactgct gacaattatg ttttgttgac tgcagcccaa 1680 ctacaactgt gtcatcagta tggctatgct gctcccaatg acgcaccacg gtggcaggga 1740 gcccggcttg ggaaaaaacc ttgtggggtt ctgtggcgct tggacggcgc tgacgcctgt 1800 cctggcccag agcccagcga ggtgaccaga taccaaatgt gcttcactga agtcaatact 1860 tctgggacag ccgcactcgc tgttggcgtt ggagtggcta tggcttatct agccattgac 1920 acttttggcg ccacttgtgt gcggcgttgc tggtctatta catcagtccc taccggtgct 1980 actgtcgccc cagtggttga cgaagaagaa atcgtggagg agtgt 2025 <210> 281 <211> 2025 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding GB virus B NS3/4A protein <400> 281 gcccctttca cactgcaatg cctgagcgag agaggcaccc tgtctgccat ggccgtggtt 60 atgacaggca tcgaccctag aacctggacc ggcaccatct tcagactggg aagcctggcc 120 acaagctaca tgggcttcgt gtgcgacaac gtgctgtaca cagcccacca cggcagcaaa 180 ggcagaaggc tggctcaccc tacaggcagc attcacccca tcacagtgga cgccgccaac 240 gaccaggata tctaccaacc tccttgcggc gctggcagcc tgaccagatg ttcttgtggc 300 gagacaaagg gctacctggt caccaggctg ggatccctgg tggaagtgaa caagagcgac 360 gacccctatt ggtgcgtgtg tggcgcactg cctatggctg tggccaaagg atcttctggc 420 gcccctatcc tgtgtagctc tggccacgtg atcggcatgt ttaccgccgc cagaaatagc 480 ggcggcagcg tgtcacagat tagagtgcgg cctcttgtgt gcgccggcta tcaccctcag 540 tatacagccc acgccacact ggacaccaag cctaccgtgc ctaacgagta cagcgtgcag 600 atcctgatcg ccccaacagg cagcggcaag agcacaaaac tgcccctgag ctacatgcaa 660 gagaagtacg aggtgctggt gctgaaccct agcgtggcca caacagccag catgcccaag 720 tacatgcacg ccacctatgg cgtgaacccc aactgctact tcaacggcaa gtgcaccaat 780 accggcgcca gcctgacata cagcacctac ggcatgtatc tgaccggcgc ctgcagcaga 840 aactacgacg tgatcatctg cgacgagtgc cacgccaccg atgccacaac tgtgctcgga 900 atcggcaagg tgctgacaga ggcccctagc aagaatgtgc gactggtggt gctggccact 960 gctacaccac ctggcgttat ccctacacct cacgccaaca tcaccgagat ccagctgacc 1020 gacgagggca caatcccatt ccacggcaag aagatcaaag aggaaaacct gaagaagggc 1080 cgccacctga tcttcgaggc caccaagaaa cactgtgacg agctggccaa cgaactggcc 1140 agaaagggca tcaccgccgt gtcctactac agaggctgcg acatcagcaa gatccccgag 1200 ggcgattgtg tggtggtggc tacagatgcc ctgtgtaccg gctacaccgg cgacttcgat 1260 agcgtgtacg actgcagcct gatggtggaa ggcacctgtc atgtggatct ggaccccacc 1320 tttaccatgg gcgtcagagt gtgcggagtg tccgccatcg tgaagggcca gagaagaggc 1380 agaactggca gaggcagagc cggcatctac tactatgtgg acggcagctg tacccctagc 1440 ggcatggtgc ctgagtgcaa catcgtggaa gccttcgatg ccgccaaggc ttggtacggc 1500 ctgtctagca cagaggctca gaccatcctg gacacctaca gaacccagcc aggactgcct 1560 gccatcggcg ccaatcttga tgaatgggcc gacctgttca gcatggtcaa ccccgagcct 1620 agcttcgtga acaccgccaa gagaaccgcc gacaactacg tgctgctgac agccgctcag 1680 ctccagctgt gtcaccagta cggatacgcc gctcctaacg acgcccctag atggcaaggc 1740 gctagactgg gcaagaaacc atgtggcgtt ctgtggcgac tggatggcgc tgatgcttgt 1800 cctggacctg agcctagcga agtgaccaga taccagatgt gcttcaccga agtgaatacc 1860 agcggcacag ctgccctggc cgttggtgtt ggagtggcca tggcttacct ggccatcgat 1920 acctttggcg ccacatgcgt gcggagatgc tggtctatca ccagcgttcc aacaggcgct 1980 acagtggccc ctgtggtgga tgaggaagag attgtggaag agtgc 2025 <210> 282 <211> 2025 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding GB Virus B NS3/4A protein <400> 282 gccccuuuca cacugcaaug ccugagcgag agaggcaccc ugucugccau ggccgugguu 60 augacaggca ucgacccuag aaccuggacc ggcaccaucu ucagacuggg aagccuggcc 120 acaagcuaca ugggcuucgu gugcgacaac gugcuguaca cagcccacca cggcagcaaa 180 ggcagaaggc uggcucaccc uacaggcagc auucacccca ucacagugga cgccgccaac 240 gaccaggaua ucuaccaacc uccuugcggc gcuggcagcc ugaccagaug uucuuguggc 300 gagacaaagg gcuaccuggu caccaggcug ggaucccugg uggaagugaa caagagcgac 360 gaccccuauu ggugcgugug uggcgcacug ccuauggcug uggccaaagg aucuucuggc 420 gccccuaucc uguguagcuc uggccacgug aucggcaugu uuaccgccgc cagaaauagc 480 ggcggcagcg ugucacagau uagagugcgg ccucuugugu gcgccggcua ucacccucag 540 uauacagccc acgccacacu ggacaccaag ccuaccgugc cuaacgagua cagcgugcag 600 auccugaucg ccccaacagg cagcggcaag agcacaaaac ugccccugag cuacaugcaa 660 gagaaguacg aggugcuggu gcugaacccu agcguggcca caacagccag caugcccaag 720 uacaugcacg ccaccuaugg cgugaacccc aacugcuacu ucaacggcaa gugcaccaau 780 accggcgcca gccugacaua cagcaccuac ggcauguauc ugaccggcgc cugcagcaga 840 aacuacgacg ugaucaucug cgacgagugc cacgccaccg augccacaac ugugcucgga 900 aucggcaagg ugcugacaga ggccccuagc aagaaugugc gacugguggu gcuggccacu 960 gcuacaccac cuggcguuau cccuacaccu cacgccaaca ucaccgagau ccagcugacc 1020 gacgagggca caaucccauu ccacggcaag aagaucaaag aggaaaaccu gaagaagggc 1080 cgccaccuga ucuucgaggc caccaagaaa cacugugacg agcuggccaa cgaacuggcc 1140 agaaagggca ucaccgccgu guccuacuac agaggcugcg acaucagcaa gauccccgag 1200 ggcgauugug uggugguggc uacagaugcc cuguguaccg gcuacaccgg cgacuucgau 1260 agcguguacg acugcagccu gaugguggaa ggcaccuguc auguggaucu ggaccccacc 1320 uuuaccaugg gcgucagagu gugcggagug uccgccaucg ugaagggcca gagaagaggc 1380 agaacuggca gaggcagagc cggcaucuac uacuaugugg acggcagcug uaccccuagc 1440 ggcauggugc cugagugcaa caucguggaa gccuucgaug ccgccaaggc uugguacggc 1500 cugucuagca cagaggcuca gaccauccug gacaccuaca gaacccagcc aggacugccu 1560 gccaucggcg ccaaucuuga ugaaugggcc gaccuguuca gcauggucaa ccccgagccu 1620 agcuucguga acaccgccaa gagaaccgcc gacaacuacg ugcugcugac agccgcucag 1680 cuccagcugu gucaccagua cggauacgcc gcuccuaacg acgccccuag auggcaaggc 1740 gcuagacugg gcaagaaacc auguggcguu cuguggcgac uggauggcgc ugaugcuugu 1800 ccuggaccug agccuagcga agugaccaga uaccagaugu gcuucaccga agugaauacc 1860 agcggcacag cugcccuggc cguugguguu ggaguggcca uggcuuaccu ggccaucgau 1920 accuuuggcg ccacaugcgu gcggagaugc uggucuauca ccagcguucc aacaggcgcu 1980 acaguggccc cuguggugga ugaggaagag auuguggaag agugc 2025 <210> 283 <211> 219 <212> PRT <213> Hepatitis A virus <400> 283 Ser Thr Leu Glu Ile Ala Gly Leu Val Arg Lys Asn Leu Val Gln Phe 1 5 10 15 Gly Val Gly Glu Lys Asn Gly Cys Val Arg Trp Val Met Asn Ala Leu 20 25 30 Gly Val Lys Asp Asp Trp Leu Leu Val Pro Ser His Ala Tyr Lys Phe 35 40 45 Glu Lys Asp Tyr Glu Met Met Glu Phe Tyr Phe Asn Arg Gly Gly Thr 50 55 60 Tyr Tyr Ser Ile Ser Ala Gly Asn Val Val Ile Gln Ser Leu Asp Val 65 70 75 80 Gly Phe Gln Asp Val Val Leu Met Lys Val Pro Thr Ile Pro Lys Phe 85 90 95 Arg Asp Ile Thr Gln His Phe Ile Lys Lys Gly Asp Val Pro Arg Ala 100 105 110 Leu Asn Arg Leu Ala Thr Leu Val Thr Thr Val Asn Gly Thr Pro Met 115 120 125 Leu Ile Ser Glu Gly Pro Leu Lys Met Glu Glu Lys Ala Thr Tyr Val 130 135 140 His Lys Lys Asn Asp Gly Thr Thr Val Asp Leu Thr Val Asp Gln Ala 145 150 155 160 Trp Arg Gly Lys Gly Glu Gly Leu Pro Gly Met Cys Gly Gly Ala Leu 165 170 175 Val Ser Ser Asn Gln Ser Ile Gln Asn Ala Ile Leu Gly Ile His Val 180 185 190 Ala Gly Gly Asn Ser Ile Leu Val Ala Lys Leu Val Thr Gln Glu Met 195 200 205 Phe Gln Asn Ile Asp Lys Lys Ile Glu Ser Gln 210 215 <210> 284 <211> 657 <212> DNA <213> Hepatitis A virus <400> 284 tcaactttgg aaatagcagg actggttagg aagaacttgg ttcagtttgg agttggagag 60 aagaatggat gtgtgagatg ggttatgaat gccttgggag tgaaagatga ttggctgctt 120 gtgccttccc atgcttataa atttgagaaa gattatgaaa tgatggagtt ttattttaat 180 agaggtggaa cttactattc aatttcagct ggtaatgttg ttattcaatc tttggatgtg 240 ggattccagg atgttgttct gatgaaggtt cctacaattc ctaagtttag agatattact 300 cagcatttta ttaagaaagg ggatgtgcct agagctttga atcgcctggc aacattagtg 360 acaactgtaa atggaacccc tatgttaatt tctgagggcc cactaaagat ggaagagaaa 420 gctacttatg ttcataagaa aaatgatggt acaacagttg atttaactgt ggatcaggca 480 tggagaggaa aaggcgaagg tcttcctgga atgtgtggtg gggccttggt ttcatcgaat 540 caatctatac agaatgcaat cttgggcatc catgttgctg gaggaaattc aattcttgtt 600 gcaaaattgg ttactcaaga aatgttccaa aatattgata agaaaattga aagtcag 657 <210> 285 <211> 657 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding HAV 3Cpro protein <400> 285 agcacactgg aaatcgccgg actcgtgcgg aagaacctgg tgcagtttgg cgtgggcgag 60 aagaacggct gtgtcagatg ggtcatgaac gccctgggcg tgaaggacga ttggctgctg 120 gttcctagcc acgcctacaa gttcgagaag gactacgaga tgatggaatt ctacttcaac 180 agaggcggca cctactacag catcagcgcc ggcaatgtgg tcatccagtc tctggatgtg 240 ggcttccagg acgtggtgct gatgaaggtg ccaacaatcc ccaagttccg ggacatcacc 300 cagcacttca tcaagaaagg cgacgtgccc agggctctga acagactggc taccctggtc 360 accaccgtga acggcacacc catgctgatc tctgagggcc cactgaagat ggaagagaag 420 gccacctacg tgcacaagaa gaacgacggc accacagtgg acctgaccgt ggatcaagct 480 tggagaggca aaggcgaggg cctgcctgga atgtgtggcg gagcactggt gtccagcaac 540 cagagcatcc agaatgccat cctgggcatc catgtggctg gcggcaattc tatcctggtg 600 gccaagctgg tcacccaaga gatgttccag aacatcgaca agaagatcga gagccag 657 <210> 286 <211> 657 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding HAV 3Cpro protein <400> 286 agcacacugg aaaucgccgg acucgugcgg aagaaccugg ugcaguuugg cgugggcgag 60 aagaacggcu gugucagaug ggucaugaac gcccugggcg ugaaggacga uuggcugcug 120 guuccuagcc acgccuacaa guucgagaag gacuacgaga ugauggaauu cuacuucaac 180 agaggcggca ccuacuacag caucagcgcc ggcaaugugg ucauccaguc ucuggaugug 240 ggcuuccagg acguggugcu gaugaaggug ccaacaaucc ccaaguuccg ggacaucacc 300 cagcacuuca ucaagaaagg cgacgugccc agggcucuga acagacuggc uacccugguc 360 accaccguga acggcacacc caugcugauc ucugagggcc cacugaagau ggaagagaag 420 gccaccuacg ugcacaagaa gaacgacggc accacagugg accugaccgu ggaucaagcu 480 uggagaggca aaggcgaggg ccugccugga auguguggcg gagcacuggu guccagcaac 540 cagagcaucc agaaugccau ccugggcauc cauguggcug gcggcaauuc uauccuggug 600 gccaagcugg ucacccaaga gauguuccag aacaucgaca agaagaucga gagccag 657 <210> 287 <211> 71 <212> PRT <213> Human metapneumovirus <400> 287 Met Thr Leu His Met Pro Cys Lys Thr Val Lys Ala Leu Ile Lys Cys 1 5 10 15 Ser Glu His Gly Pro Val Phe Ile Thr Ile Glu Val Asp Glu Met Ile 20 25 30 Trp Thr Gln Lys Glu Leu Lys Glu Ala Leu Ser Asp Gly Ile Val Lys 35 40 45 Ser His Thr Asn Ile Tyr Asn Cys Tyr Leu Glu Asn Ile Glu Ile Ile 50 55 60 Tyr Val Lys Ala Tyr Leu Ser 65 70 <210> 288 <211> 213 <212> DNA <213> Human metapneumovirus <400> 288 atgactcttc atatgccctg caagacagtg aaagcattaa tcaagtgcag tgagcatggt 60 cctgttttca ttactataga ggttgatgaa atgatatgga ctcaaaaaga attaaaagaa 120 gctttgtccg atgggatagt gaagtctcac accaacattt acaattgtta tttagaaaac 180 atagaaatta tatatgtcaa ggcttactta agt 213 <210> 289 <211> 213 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding Human metapneumovirus M2-2 protein <400> 289 atgaccctgc acatgccctg caagacagtg aaggccctga tcaagtgtag cgagcacggc 60 cccgtgttca tcaccattga ggtggacgag atgatctgga cccagaaaga gctgaaagag 120 gccctgagcg acggcatcgt gaagtcccac accaacatct acaactgcta cctcgagaac 180 atcgagatca tctacgtgaa ggcctacctg agc 213 <210> 290 <211> 213 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding Human metapneumovirus M2-2 protein <400> 290 augacccugc acaugcccug caagacagug aaggcccuga ucaaguguag cgagcacggc 60 cccguguuca ucaccauuga gguggacgag augaucugga cccagaaaga gcugaaagag 120 gcccugagcg acggcaucgu gaagucccac accaacaucu acaacugcua ccucgagaac 180 aucgagauca ucuacgugaa ggccuaccug agc 213 <210> 291 <211> 181 <212> PRT <213> Hepatitis E virus <400> 291 Glu Val Phe Trp Asn Gln Pro Ile Gln Arg Val Ile His Asn Glu Leu 1 5 10 15 Glu Leu Tyr Cys Arg Ala Arg Ser Gly Arg Cys Leu Glu Ile Gly Ala 20 25 30 His Pro Arg Ser Ile Asn Asp Asn Pro Asn Val Val His Arg Cys Phe 35 40 45 Leu Arg Pro Val Gly Arg Asp Val Gln Arg Trp Tyr Thr Ala Pro Thr 50 55 60 Arg Gly Pro Ala Ala Asn Cys Arg Arg Ser Ala Leu Arg Gly Leu Pro 65 70 75 80 Ala Ala Asp Arg Thr Tyr Cys Phe Asp Gly Phe Ser Gly Cys Ser Cys 85 90 95 Pro Ala Glu Thr Gly Ile Ala Leu Tyr Ser Leu His Asp Met Ser Pro 100 105 110 Ser Asp Val Ala Glu Ala Met Phe Arg His Gly Met Thr Arg Leu Tyr 115 120 125 Ala Ala Leu His Leu Pro Pro Glu Val Leu Leu Pro Pro Gly Thr Tyr 130 135 140 Arg Thr Ala Ser Tyr Leu Leu Ile His Asp Gly Arg Arg Val Val Val 145 150 155 160 Thr Tyr Glu Gly Asp Thr Ser Ala Gly Tyr Asn His Asp Val Ser Asn 165 170 175 Leu Arg Ser Trp Ile 180 <210> 292 <211> 543 <212> DNA <213> Hepatitis E virus <400> 292 gaggttttct ggaatcaacc catccagcgt gtcattcata acgagctgga gctttactgc 60 cgcgctcgct ccggccgctg tcttgaaatt ggcgcccatc cccgctcaat aaatgataat 120 cctaatgtgg tccaccgctg cttcctccgc cctgttgggc gtgatgttca gcgctggtat 180 actgctccca ctcgcgggcc ggctgctaat tgccgccgtt ccgcgttgcg tgggcttccc 240 gctgctgacc gcacatactg cttcgacggg ttttctggct gtagctgccc cgccgagacg 300 ggtatcgccc tttactccct ccatgatatg tcaccatctg atgttgccga ggccatgttc 360 cgccatggta tgacgcggct ttatgctgcc ctccatcttc cgcctgaggt cttgctgccc 420 cctggcacat atcgcaccgc atcgtatttg ctgattcatg acggcaggcg cgttgtggtg 480 acgtatgagg gtgatactag tgctggttac aaccacgatg tctccaactt gcgctcctgg 540 att 543 <210> 293 <211> 543 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding Hepatitis E methyltransferase protein <400> 293 gaggtgttct ggaaccagcc tatccagaga gtgatccaca acgagctgga actgtactgc 60 agagccagat ccggccggtg tctggaaatt ggagcccatc ctcggagcat caacgacaac 120 cccaacgtgg tgcacagatg ctttctgagg cccgtgggca gagatgtgca gcggtggtat 180 acagccccta caagaggacc tgccgccaac tgtagaagaa gcgccctgag aggactgcct 240 gccgccgata gaacctactg cttcgatggc ttcagcggct gcagctgtcc tgccgaaact 300 ggaatcgccc tgtacagcct gcacgacatg agcccatctg atgtggccga ggccatgttc 360 agacacggca tgaccagact gtacgccgct ctgcatctgc ctccagaagt tctgctgcct 420 cctggcacct acagaaccgc cagctatctg ctgatccacg atgggagaag agtggtggtc 480 acctacgagg gcgatacaag cgccggctac aaccacgacg tgtccaacct gagaagctgg 540 atc 543 <210> 294 <211> 543 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding Hepatitis E methyltransferase protein <400> 294 gagguguucu ggaaccagcc uauccagaga gugauccaca acgagcugga acuguacugc 60 agagccagau ccggccggug ucuggaaauu ggagcccauc cucggagcau caacgacaac 120 cccaacgugg ugcacagaug cuuucugagg cccgugggca gagaugugca gcggugguau 180 acagccccua caagaggacc ugccgccaac uguagaagaa gcgcccugag aggacugccu 240 gccgccgaua gaaccuacug cuucgauggc uucagcggcu gcagcugucc ugccgaaacu 300 ggaaucgccc uguacagccu gcacgacaug agcccaucug auguggccga ggccauguuc 360 agacacggca ugaccagacu guacgccgcu cugcaucugc cuccagaagu ucugcugccu 420 ccuggcaccu acagaaccgc cagcuaucug cugauccacg augggagaag aguggugguc 480 accuacgagg gcgauacaag cgccggcuac aaccacgacg uguccaaccu gagaagcugg 540 auc 543 <210> 295 <211> 390 <212> PRT <213> Suid herpesvirus 2 <400> 295 Met Leu Ala Met Trp Arg Trp Val Thr Lys Arg Ser Arg Leu Arg Arg 1 5 10 15 Gly His Ala His Leu Gly Gly Asn Lys Gly Val Arg Gly Ile Cys Ser 20 25 30 Leu Tyr Leu Ala Gly Leu Ser Arg Gly Leu Ser Arg Val His Ala Gln 35 40 45 Arg Ser His Ala Ala Thr Met Ala Asp Ala Gly Ile Pro Asp Glu Ile 50 55 60 Leu Tyr Ser Asp Ile Ser Asp Asp Glu Ile Ile Ile Asp Gly Asp Gly 65 70 75 80 Asp Gly Asp Ser Ser Gly Asp Glu Asp Asp Asp Asp Gly Gly Leu Thr 85 90 95 Arg Gln Ala Ala Ser Arg Ile Ala Thr Asp Leu Gly Phe Glu Val Leu 100 105 110 Gln Pro Leu Gln Ser Gly Ser Glu Gly Arg Val Phe Val Ala Arg Arg 115 120 125 Pro Gly Glu Ala Asp Thr Val Val Leu Lys Val Gly Gln Lys Pro Ser 130 135 140 Thr Leu Met Glu Gly Met Leu Leu Lys Arg Leu Ala His Asp Asn Val 145 150 155 160 Met Ser Leu Lys Gln Met Leu Ala Arg Gly Pro Val Thr Cys Leu Val 165 170 175 Leu Pro His Phe Arg Cys Asp Leu Tyr Ser Tyr Leu Thr Met Arg Asp 180 185 190 Gly Pro Leu Asp Met Arg Asp Ala Gly Arg Val Ile Arg Ser Val Leu 195 200 205 Arg Gly Leu Ala Tyr Leu His Gly Met Arg Ile Met His Arg Asp Val 210 215 220 Lys Ala Glu Asn Ile Phe Leu Glu Asp Val Asp Thr Val Cys Leu Gly 225 230 235 240 Asp Leu Gly Ala Ala Arg Cys Asn Val Ala Ala Pro Asn Phe Tyr Gly 245 250 255 Leu Ala Gly Thr Ile Glu Thr Asn Ala Pro Glu Val Leu Ala Arg Asp 260 265 270 Arg Tyr Asp Thr Lys Val Asp Val Trp Gly Ala Gly Val Val Leu Phe 275 280 285 Glu Thr Leu Ala Tyr Pro Lys Thr Ile Ala Gly Gly Asp Glu Pro Ala 290 295 300 Ile Asn Gly Glu Met His Leu Ile Asp Leu Ile Arg Ala Leu Gly Val 305 310 315 320 His Pro Glu Glu Phe Pro Pro Asp Thr Arg Leu Arg Ser Glu Phe Val 325 330 335 Arg Tyr Ala Gly Thr His Arg Gln Pro Tyr Thr Gln Tyr Ala Arg Val 340 345 350 Ala Arg Leu Gly Leu Pro Glu Thr Gly Ala Phe Leu Ile Tyr Lys Met 355 360 365 Leu Thr Phe Asp Pro Val Arg Arg Pro Ser Ala Asp Glu Ile Leu Asn 370 375 380 Phe Gly Met Trp Thr Val 385 390 <210> 296 <211> 1170 <212> DNA <213> Suid herpesvirus 2 <400> 296 atgctggcga tgtggagatg ggtcaccaag aggtcgcggc tccgccgagg ccacgcccat 60 cttgggggaa ataaaggagt ccggggaatt tgttccttat accttgccgg gctcagcagg 120 gggttgtcgc gcgtccacgc ccagcgctcg cacgcagcaa caatggccga cgccggaatc 180 cccgacgaga tcctgtactc ggacatcagc gacgacgaga tcatcatcga cggcgacggc 240 gacggcgaca gcagcgggga cgaggacgac gatgacgggg ggctgacgcg gcaggccgcg 300 tcgcgcatcg ccacggacct gggcttcgag gtgctgcagc ccctgcagtc gggctcggag 360 ggccgcgtct tcgtggcccg ccggcccggc gaggcggaca cggtggtgct gaaggtgggc 420 cagaagccct cgacgctgat ggagggcatg ctgctgaagc gcctggccca cgataacgtc 480 atgagcctga agcagatgct cgcccggggc ccggtgacgt gcctggtcct gccgcacttt 540 cggtgcgatc tgtacagcta cctgaccatg cgggacgggc cgctggacat gcgcgacgcc 600 gggcgcgtga tccggtccgt gctccgcggg ctcgcctacc tgcacgggat gcgcatcatg 660 caccgcgacg tcaaggcgga gaacatcttc ctcgaggacg tggacacggt gtgcctgggg 720 gacctcgggg ccgcgcgctg caacgtggcg gcgcccaact tttacgggct cgccgggacc 780 atcgagacca acgcccccga ggtgctcgcg cgcgaccgct acgacaccaa ggtcgacgtc 840 tggggcgcgg gggtggtgct cttcgagacg ctggcctacc ccaagacgat cgccggcggg 900 gacgagcccg cgatcaacgg ggagatgcac ctgatcgacc tcatccgcgc cctcggggtg 960 caccccgagg agttcccgcc cgacacgcgc ctccggagcg agttcgtccg gtacgccggg 1020 acccaccgcc agccgtacac gcagtacgcg cgcgtggctc gcctcgggct gcccgagacg 1080 ggggctttcc tgatttacaa gatgttgacg tttgatcccg tccgccgccc ttccgctgat 1140 gagatactca actttggaat gtggaccgta 1170 <210> 297 <211> 1170 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding PRRV Npro protein <400> 297 atgctggcca tgtggcgctg ggtcaccaag agaagcagac tgagaagagg acacgcccac 60 ctcggcggaa acaagggcgt tagaggcatc tgcagcctgt atctggccgg cctgtctaga 120 ggactgagca gagtgcatgc ccagagatct cacgccgcca caatggccga tgctggcatc 180 cctgatgaga tcctgtacag cgacatcagc gacgacgaga tcatcatcga tggcgacggc 240 gacggggata gcagcggaga tgaggatgac gatgatggcg gcctgacaag acaggctgcc 300 agcagaattg ccaccgacct gggatttgag gtgctgcagc ctctgcagtc tggctctgag 360 ggcagagtgt tcgtggctag aaggcctggc gaagccgata ccgtggtgct gaaagtgggc 420 cagaaaccta gcacactgat ggaaggcatg ctgctgaaga gactggccca cgacaacgtg 480 atgagcctga agcagatgct ggctagaggc cctgtgacct gtctggtgct gcctcacttc 540 agatgcgacc tgtactccta cctgaccatg agagatggcc ctctggatat gcgcgacgcc 600 ggcagagtga tcagatctgt gctgagaggc ctggcctacc tgcacggcat gagaatcatg 660 cacagggacg tgaaggccga gaacatcttt ctggaagatg tggacaccgt gtgcctgggc 720 gatctgggag ccgctagatg taatgtggcc gctcctaact tctacggcct ggccggaacc 780 atcgagacaa atgcccctga agtgctggcc cgggacagat acgataccaa ggtggacgtt 840 tggggagccg gcgtggtcct gtttgagaca ctggcttacc ccaagacaat cgctggcggc 900 gacgagcctg ctatcaatgg cgagatgcac ctgatcgacc tgatcagagc cctgggcgtg 960 caccctgagg aattccctcc agacacacgg ctgcggagcg agttcgttag atacgccgga 1020 acacacagac agccctacac acagtatgcc agagtggcca gactgggcct gcctgaaaca 1080 ggcgccttcc tgatctacaa gatgctgacc ttcgatcccg tgcggaggcc ttctgccgat 1140 gagattctga acttcggcat gtggaccgtg 1170 <210> 298 <211> 1170 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding PRRV Npro protein <400> 298 augcuggcca uguggcgcug ggucaccaag agaagcagac ugagaagagg acacgcccac 60 cucggcggaa acaagggcgu uagaggcauc ugcagccugu aucuggccgg ccugucuaga 120 ggacugagca gagugcaugc ccagagaucu cacgccgcca caauggccga ugcuggcauc 180 ccugaugaga uccuguacag cgacaucagc gacgacgaga ucaucaucga uggcgacggc 240 gacggggaua gcagcggaga ugaggaugac gaugauggcg gccugacaag acaggcugcc 300 agcagaauug ccaccgaccu gggauuugag gugcugcagc cucugcaguc uggcucugag 360 ggcagagugu ucguggcuag aaggccuggc gaagccgaua ccguggugcu gaaagugggc 420 cagaaaccua gcacacugau ggaaggcaug cugcugaaga gacuggccca cgacaacgug 480 augagccuga agcagaugcu ggcuagaggc ccugugaccu gucuggugcu gccucacuuc 540 agaugcgacc uguacuccua ccugaccaug agagauggcc cucuggauau gcgcgacgcc 600 ggcagaguga ucagaucugu gcugagaggc cuggccuacc ugcacggcau gagaaucaug 660 cacagggacg ugaaggccga gaacaucuuu cuggaagaug uggacaccgu gugccugggc 720 gaucugggag ccgcuagaug uaauguggcc gcuccuaacu ucuacggccu ggccggaacc 780 aucgagacaa augccccuga agugcuggcc cgggacagau acgauaccaa gguggacguu 840 uggggagccg gcgugguccu guuugagaca cuggcuuacc ccaagacaau cgcuggcggc 900 gacgagccug cuaucaaugg cgagaugcac cugaucgacc ugaucagagc ccugggcgug 960 cacccugagg aauucccucc agacacacgg cugcggagcg aguucguuag auacgccgga 1020 acacacagac agcccuacac acaguaugcc agaguggcca gacugggccu gccugaaaca 1080 ggcgccuucc ugaucuacaa gaugcugacc uucgaucccg ugcggaggcc uucugccgau 1140 gagauucuga acuucggcau guggaccgug 1170 <210> 299 <211> 481 <212> PRT <213> human herpesvirus 1 <400> 299 Met Ala Cys Arg Lys Phe Cys Arg Val Tyr Gly Gly Gln Gly Arg Arg 1 5 10 15 Lys Glu Glu Ala Val Pro Pro Glu Thr Lys Pro Ser Arg Val Phe Pro 20 25 30 His Gly Pro Phe Tyr Thr Pro Ala Glu Asp Ala Cys Leu Asp Ser Pro 35 40 45 Pro Pro Glu Thr Pro Lys Pro Ser His Thr Thr Pro Pro Ser Glu Ala 50 55 60 Glu Arg Leu Cys His Leu Gln Glu Ile Leu Ala Gln Met Tyr Gly Asn 65 70 75 80 Gln Asp Tyr Pro Ile Glu Asp Asp Pro Ser Ala Asp Ala Ala Asp Asp 85 90 95 Val Asp Glu Asp Ala Pro Asp Asp Val Ala Tyr Pro Glu Glu Tyr Ala 100 105 110 Glu Glu Leu Phe Leu Pro Gly Asp Ala Thr Gly Pro Leu Ile Gly Ala 115 120 125 Asn Asp His Ile Pro Pro Pro Cys Gly Ala Ser Pro Pro Gly Ile Arg 130 135 140 Arg Arg Ser Arg Asp Glu Ile Gly Ala Thr Gly Phe Thr Ala Glu Glu 145 150 155 160 Leu Asp Ala Met Asp Arg Glu Ala Ala Arg Ala Ile Ser Arg Gly Gly 165 170 175 Lys Pro Pro Ser Thr Met Ala Lys Leu Val Thr Gly Met Gly Phe Thr 180 185 190 Ile His Gly Ala Leu Thr Pro Gly Ser Glu Gly Cys Val Phe Asp Ser 195 200 205 Ser His Pro Asp Tyr Pro Gln Arg Val Ile Val Lys Ala Gly Trp Tyr 210 215 220 Thr Ser Thr Ser His Glu Ala Arg Leu Leu Arg Arg Leu Asp His Pro 225 230 235 240 Ala Ile Leu Pro Leu Leu Asp Leu His Val Val Ser Gly Val Thr Cys 245 250 255 Leu Val Leu Pro Lys Tyr Gln Ala Asp Leu Tyr Thr Tyr Leu Ser Arg 260 265 270 Arg Leu Asn Pro Leu Gly Arg Pro Gln Ile Ala Ala Val Ser Arg Gln 275 280 285 Leu Leu Ser Ala Val Asp Tyr Ile His Arg Gln Gly Ile Ile His Arg 290 295 300 Asp Ile Lys Thr Glu Asn Ile Phe Ile Asn Thr Pro Glu Asp Ile Cys 305 310 315 320 Leu Gly Asp Phe Gly Ala Ala Cys Phe Val Gln Gly Ser Arg Ser Ser 325 330 335 Pro Phe Pro Tyr Gly Ile Ala Gly Thr Ile Asp Thr Asn Ala Pro Glu 340 345 350 Val Leu Ala Gly Asp Pro Tyr Thr Thr Thr Val Asp Ile Trp Ser Ala 355 360 365 Gly Leu Val Ile Phe Glu Thr Ala Val His Asn Ala Ser Leu Phe Ser 370 375 380 Ala Pro Arg Gly Pro Lys Arg Gly Pro Cys Asp Ser Gln Ile Thr Arg 385 390 395 400 Ile Ile Arg Gln Ala Gln Val His Val Asp Glu Phe Ser Pro His Pro 405 410 415 Glu Ser Arg Leu Thr Ser Arg Tyr Arg Ser Arg Ala Ala Gly Asn Asn 420 425 430 Arg Pro Pro Tyr Thr Arg Pro Ala Trp Thr Arg Tyr Tyr Lys Met Asp 435 440 445 Ile Asp Val Glu Tyr Leu Val Cys Lys Ala Leu Thr Phe Asp Gly Ala 450 455 460 Leu Arg Pro Ser Ala Ala Glu Leu Leu Cys Leu Pro Leu Phe Gln Gln 465 470 475 480 Lys <210> 300 <211> 1443 <212> DNA <213> human herpesvirus 1 <400> 300 atggcctgtc gtaagttttg tcgcgtttac gggggacagg gcaggaggaa ggaggaggcc 60 gtcccgccgg agacaaagcc gtcccgggtg tttcctcatg gcccctttta taccccagcc 120 gaggacgcgt gcctggactc cccgcccccg gagaccccca aaccttccca caccacacca 180 cccagcgagg ccgagcgcct gtgtcatctg caggagatcc ttgcccagat gtacggaaac 240 caggactacc ccatagagga cgaccccagc gcggatgccg cggacgatgt cgacgaggac 300 gccccggacg acgtggccta tccggaggaa tacgcagagg agctttttct gcccggggac 360 gcgaccggtc cccttatcgg ggccaacgac cacatccctc ccccgtgtgg cgcatctccc 420 cccggtatac gacgacgcag ccgggatgag attggggcca cgggatttac cgcggaagag 480 ctggacgcca tggacaggga ggcggctcga gccatcagcc gcggcggcaa gcccccctcg 540 accatggcca agctggtgac tggcatgggc tttacgatcc acggagcgct caccccagga 600 tcggaggggt gtgtctttga cagcagccat ccagattacc cccaacgggt aatcgtgaag 660 gcggggtggt acacgagcac gagccacgag gcgcgactgc tgaggcgact ggaccacccg 720 gcgatcctgc ccctcctgga cctgcatgtc gtctccgggg tcacgtgtct ggtcctcccc 780 aagtaccagg ccgacctgta tacctatctg agtaggcgcc tgaacccact gggacgcccg 840 cagatcgcag cggtctcccg gcagctccta agcgccgttg actacattca ccgccagggc 900 attatccacc gcgacattaa gaccgaaaat atttttatta acacccccga ggacatttgc 960 ctgggggact ttggcgccgc gtgcttcgtg cagggttccc gatcaagccc cttcccctac 1020 ggaatcgccg gaaccatcga caccaacgcc cccgaggtcc tggccgggga tccgtatacc 1080 acgaccgtcg acatttggag cgccggtctg gtgatcttcg agactgccgt ccacaacgcg 1140 tccttgttct cggccccccg cggccccaaa aggggcccgt gcgacagtca gatcacccgc 1200 atcatccgac aggcccaggt ccacgttgac gagttttccc cgcatccaga atcgcgcctc 1260 acctcgcgct accgctcccg cgcggccggg aacaatcgcc cgccgtacac ccgaccggcc 1320 tggacccgct actacaagat ggacatagac gtcgaatatc tggtttgcaa agccctcacc 1380 ttcgacggcg cgcttcgccc cagcgccgca gagctgcttt gtttgccgct gtttcaacag 1440 aaa 1443 <210> 301 <211> 1443 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding HSV1 US3 protein <400> 301 atggcctgcc ggaagttctg tagagtgtac ggcggacagg ggcgcagaaa agaggaagcc 60 gttcctcctg agacaaagcc cagcagagtg ttccctcacg gcccctttta cacccctgcc 120 gaagatgcct gtctggacag ccctcctcca gaaacaccta agcctagcca caccacacct 180 ccaagcgagg ccgaaagact gtgccatctg caagagattc tggcccagat gtacggcaac 240 caggactacc ccatcgagga cgatccatct gccgatgccg ccgacgatgt ggatgaagat 300 gcccctgatg acgtggccta tcctgaggaa tacgccgagg aactgttcct gcctggcgac 360 gctacaggac ctctgatcgg agccaacgat cacatccctc caccttgtgg cgctagccct 420 cctggcatca gaagaagaag cagggacgag atcggcgcca ccggctttac agccgaagaa 480 ctggacgcca tggacagaga agccgccaga gccatttcta gaggcggcaa gcctcctagc 540 accatggcca aactggttac cggcatgggc ttcaccattc acggcgctct gacacctggc 600 tctgagggct gtgtgttcga cagctctcac cccgactatc cccagcgcgt gatcgtgaaa 660 gccggctggt acacaagcac aagccacgag gccagactgc tgcggagact ggatcatcct 720 gccatcctgc ctctgctgga tctgcatgtg gtgtccggcg tgacatgtct ggtgctgcct 780 aagtaccagg ccgacctgta cacctacctg agcagaaggc tgaaccctct gggcagacct 840 cagattgccg ctgtgtcaag acagctgctg agcgctgtgg actacatcca cagacagggc 900 atcatccacc gggacatcaa gaccgagaat atcttcatca acacgcccga ggacatctgc 960 ctgggcgatt ttggcgccgc ttgcttcgtg caaggcagca gaagcagccc ctttccttat 1020 ggaatcgccg gcaccatcga cacaaacgcc cctgaagttc tggccggcga tccttacacc 1080 accaccgtgg atatttggag cgccggactg gtcatcttcg agacagccgt gcataacgcc 1140 agcctgttct ctgcccctag aggccctaaa agaggcccct gcgatagcca gatcacccgg 1200 atcattagac aggcccaggt gcacgtggac gagttctctc cacatcctga gagccggctg 1260 accagccggt acagatctag agccgccgga aacaaccggc ctccatacac aagacctgcc 1320 tggacacggt actacaagat ggacatcgac gtggaatacc tcgtgtgcaa ggccctgacc 1380 ttcgatggcg cccttagacc ttctgccgcc gaactgcttt gcctgccact gttccagcag 1440 aag 1443 <210> 302 <211> 1443 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding HSV1 US3 protein <400> 302 auggccugcc ggaaguucug uagaguguac ggcggacagg ggcgcagaaa agaggaagcc 60 guuccuccug agacaaagcc cagcagagug uucccucacg gccccuuuua caccccugcc 120 gaagaugccu gucuggacag cccuccucca gaaacaccua agccuagcca caccacaccu 180 ccaagcgagg ccgaaagacu gugccaucug caagagauuc uggcccagau guacggcaac 240 caggacuacc ccaucgagga cgauccaucu gccgaugccg ccgacgaugu ggaugaagau 300 gccccugaug acguggccua uccugaggaa uacgccgagg aacuguuccu gccuggcgac 360 gcuacaggac cucugaucgg agccaacgau cacaucccuc caccuugugg cgcuagcccu 420 ccuggcauca gaagaagaag cagggacgag aucggcgcca ccggcuuuac agccgaagaa 480 cuggacgcca uggacagaga agccgccaga gccauuucua gaggcggcaa gccuccuagc 540 accauggcca aacugguuac cggcaugggc uucaccauuc acggcgcucu gacaccuggc 600 ucugagggcu guguguucga cagcucucac cccgacuauc cccagcgcgu gaucgugaaa 660 gccggcuggu acacaagcac aagccacgag gccagacugc ugcggagacu ggaucauccu 720 gccauccugc cucugcugga ucugcaugug guguccggcg ugacaugucu ggugcugccu 780 aaguaccagg ccgaccugua caccuaccug agcagaaggc ugaacccucu gggcagaccu 840 cagauugccg cugugucaag acagcugcug agcgcugugg acuacaucca cagacagggc 900 aucauccacc gggacaucaa gaccgagaau aucuucauca acacgcccga ggacaucugc 960 cugggcgauu uuggcgccgc uugcuucgug caaggcagca gaagcagccc cuuuccuuau 1020 ggaaucgccg gcaccaucga cacaaacgcc ccugaaguuc uggccggcga uccuuacacc 1080 accaccgugg auauuuggag cgccggacug gucaucuucg agacagccgu gcauaacgcc 1140 agccuguucu cugccccuag aggcccuaaa agaggccccu gcgauagcca gaucacccgg 1200 aucauuagac aggcccaggu gcacguggac gaguucucuc cacauccuga gagccggcug 1260 accagccggu acagaucuag agccgccgga aacaaccggc cuccauacac aagaccugcc 1320 uggacacggu acuacaagau ggacaucgac guggaauacc ucgugugcaa ggcccugacc 1380 uucgauggcg cccuuagacc uucugccgcc gaacugcuuu gccugccacu guuccagcag 1440 aag 1443 <210> 303 <211> 414 <212> PRT <213> human herpesvirus 2 <400> 303 Met Ala Asp Ile Pro Pro Asp Pro Pro Ala Leu Asn Thr Thr Pro Val 1 5 10 15 Asn His Ala Pro Pro Ser Pro Pro Pro Gly Ser Arg Lys Arg Arg Arg 20 25 30 Pro Val Leu Pro Ser Ser Ser Glu Ser Glu Gly Lys Pro Asp Thr Glu 35 40 45 Ser Glu Ser Ser Ser Thr Glu Ser Ser Glu Asp Glu Ala Gly Asp Leu 50 55 60 Arg Gly Gly Arg Arg Arg Ser Pro Arg Glu Leu Gly Gly Arg Tyr Phe 65 70 75 80 Leu Asp Leu Ser Ala Glu Ser Thr Thr Gly Thr Glu Ser Glu Gly Thr 85 90 95 Gly Pro Ser Asp Asp Asp Asp Asp Asp Ala Ser Asp Gly Trp Leu Val 100 105 110 Asp Thr Pro Pro Arg Lys Ser Lys Arg Pro Arg Ile Asn Leu Arg Leu 115 120 125 Thr Ser Ser Pro Asp Arg Arg Ala Gly Val Val Phe Pro Glu Val Trp 130 135 140 Arg Asn Asp Arg Pro Ile Arg Ala Ala Gln Pro Gln Ala Pro Ala Gln 145 150 155 160 Ser Ser Gly Asp Arg Ala Ala Ala Pro Arg Arg Ser Ala Arg Gln Ala 165 170 175 Gln Met Arg Ser Gly Ala Ala Trp Thr Leu Asp Leu His Tyr Ile Arg 180 185 190 Gln Cys Val Asn Gln Leu Phe Arg Ile Leu Arg Ala Ala Pro Asn Pro 195 200 205 Pro Gly Ser Ala Asn Arg Leu Arg His Leu Val Arg Asp Cys Tyr Leu 210 215 220 Met Gly Tyr Cys Arg Thr Arg Leu Gly Pro Arg Thr Trp Gly Arg Leu 225 230 235 240 Leu Gln Ile Ser Gly Gly Thr Trp Asp Val Arg Leu Arg Asn Ala Ile 245 250 255 Arg Glu Val Glu Ala Arg Phe Glu Pro Ala Ala Glu Pro Val Cys Glu 260 265 270 Leu Pro Cys Leu Asn Ala Arg Arg Tyr Gly Pro Glu Cys Asp Val Gly 275 280 285 Asn Leu Glu Thr Asn Gly Gly Ser Thr Ser Asp Asp Glu Ile Ser Asp 290 295 300 Ala Thr Asp Ser Asp Asp Thr Leu Ala Ser His Ser Asp Thr Glu Gly 305 310 315 320 Gly Pro Ser Pro Ala Gly Arg Glu Asn Pro Glu Ser Ala Ser Gly Gly 325 330 335 Ala Ile Ala Ala Arg Leu Glu Cys Glu Phe Gly Thr Phe Asp Trp Thr 340 345 350 Ser Glu Glu Gly Ser Gln Pro Trp Leu Ser Ala Val Val Ala Asp Thr 355 360 365 Ser Ser Ala Glu Arg Ser Gly Leu Pro Ala Pro Gly Ala Cys Arg Ala 370 375 380 Thr Glu Ala Pro Glu Arg Glu Asp Gly Cys Arg Lys Met Arg Phe Pro 385 390 395 400 Ala Ala Cys Pro Tyr Pro Cys Gly His Thr Phe Leu Arg Pro 405 410 <210> 304 <211> 1242 <212> DNA <213> human herpesvirus 2 <400> 304 atggcagaca tccccccgga cccgcccgcg ctcaacacga cgcctgtgaa tcatgctccc 60 ccatccccgc ccccgggttc acggaagcgc agacgccccg tcctccccag ctcgtcggaa 120 tctgagggta agcccgacac agaatcggaa tcctcctcga ccgagtcgtc cgaggatgag 180 gcgggagacc tacgcggcgg gcgccgtcgc tccccgcggg agctcggggg gaggtatttt 240 ttggatctgt cggcagaatc gaccacgggg acggaatcgg agggaacggg gccgtcggac 300 gacgatgatg atgatgcgtc agacggctgg ttggttgaca cccccccccg taaatccaag 360 cgaccccgaa tcaacctgcg attaacgagc tcccccgacc ggcgcgcggg tgtggttttc 420 cccgaggtgt ggagaaacga cagacctatc cgcgcggcgc aaccccaggc cccggcccag 480 tcttccgggg atcgcgcagc cgcaccgcgg cgctctgctc gccaggccca gatgcggagc 540 ggagccgcct ggacgcttga tctgcattac atacgccagt gcgtcaacca gctctttcgg 600 atcctgcgtg ccgccccgaa cccgcccggc agcgccaacc gcctgcgcca cctggtgcga 660 gactgctacc tcatgggcta ctgccggacc cgcctggggc cgcgcacgtg gggccgcctg 720 ctgcagatct cgggcggaac ctgggacgtg cgcctgcgaa acgcaatccg ggaggtcgag 780 gcgcgttttg aacccgccgc cgagcccgtg tgcgagctgc cctgtctgaa cgccaggcgt 840 tacggccccg agtgtgatgt tggcaatctc gagaccaacg gcggctcgac gagcgatgat 900 gagatatcgg atgcgacgga ctcggacgat accctcgcgt cccattccga cacggagggg 960 gggccctccc cggccggccg ggagaacccg gaatccgcgt ccggcggggc tatcgcggct 1020 cggctggagt gtgagtttgg gacgtttgac tggacgtccg aggagggctc ccagccctgg 1080 ctgtccgcgg tggtcgccga taccagctcc gccgaacgct ctggcctacc cgccccgggc 1140 gcgtgtcgcg caacggaagc cccagaacgc gaggacgggt gccgaaaaat gcgcttcccc 1200 gccgcctgcc cctatccctg cggccacaca tttctccggc ca 1242 <210> 305 <211> 1242 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding HSV2 US1 protein <400> 305 atggccgaca ttcctcctga tcctccagct ctgaacacca cacctgtgaa tcacgcccct 60 ccatctccac cacctggcag cagaaagaga agaaggcctg tcctgcctag cagcagcgag 120 tctgagggca agcctgatac agagagcgag agcagcagca cagagagcag cgaggacgaa 180 gctggcgatc ttagaggcgg cagaagaaga agccccagag aactcggcgg cagatacttc 240 ctggatctga gcgccgagag caccaccggc actgaatctg aaggcacagg ccccagcgac 300 gacgatgacg atgatgcctc tgatggctgg ctggtggaca cccctcctag aaagtccaag 360 cggcccagaa tcaacctgcg gctgacaagc tctcctgatc gcagagctgg cgtggtgttc 420 cccgaagtgt ggcggaacga cagacctatc agagccgctc agcctcaggc tcctgctcag 480 tctagcggag atagagctgc cgctcctaga agatctgcca gacaggccca gatgagaagc 540 ggagctgctt ggacactgga cctgcactac atccggcagt gcgtgaacca gctgttccgg 600 atccttcggg ctgcccctaa tccacctggc tccgccaata gactgagaca ccttgtgcgg 660 gactgctacc tgatgggcta ctgcagaaca agactgggcc ccagaacatg gggcagactg 720 ctgcaaatct ctggcggcac atgggacgtg cggctgagaa acgccattag agaggtggaa 780 gccagattcg agccagccgc tgagcctgtg tgtgaactgc cttgtctgaa cgctcggaga 840 tacggccccg agtgtgatgt gggcaacctg gaaacaaatg gcggcagcac ctccgacgac 900 gagatctctg atgccaccga cagcgacgat acactggcca gccacagcga tacagaaggc 960 ggaccatctc ctgccggaag agagaatcct gagtctgcct ctggcggagc tatcgccgca 1020 agactggaat gcgagttcgg caccttcgac tggacaagcg aggaaggctc tcagccttgg 1080 ctgtctgctg tggtggccga tacctctagc gccgaaagat ctggacttcc tgctcctggc 1140 gcctgcagag ctacagaagc tcctgaaaga gaggacggct gcagaaagat gcggttccct 1200 gccgcctgtc cttatccttg cggccacaca tttctgcggc ct 1242 <210> 306 <211> 1242 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding HSV2 US1 protein <400> 306 auggccgaca uuccuccuga uccuccagcu cugaacacca caccugugaa ucacgccccu 60 ccaucuccac caccuggcag cagaaagaga agaaggccug uccugccuag cagcagcgag 120 ucugagggca agccugauac agagagcgag agcagcagca cagagagcag cgaggacgaa 180 gcuggcgauc uuagaggcgg cagaagaaga agccccagag aacucggcgg cagauacuuc 240 cuggaucuga gcgccgagag caccaccggc acugaaucug aaggcacagg ccccagcgac 300 gacgaugacg augaugccuc ugauggcugg cugguggaca ccccuccuag aaaguccaag 360 cggcccagaa ucaaccugcg gcugacaagc ucuccugauc gcagagcugg cgugguguuc 420 cccgaagugu ggcggaacga cagaccuauc agagccgcuc agccucaggc uccugcucag 480 ucuagcggag auagagcugc cgcuccuaga agaucugcca gacaggccca gaugagaagc 540 ggagcugcuu ggacacugga ccugcacuac auccggcagu gcgugaacca gcuguuccgg 600 auccuucggg cugccccuaa uccaccuggc uccgccaaua gacugagaca ccuugugcgg 660 gacugcuacc ugaugggcua cugcagaaca agacugggcc ccagaacaug gggcagacug 720 cugcaaaucu cuggcggcac augggacgug cggcugagaa acgccauuag agagguggaa 780 gccagauucg agccagccgc ugagccugug ugugaacugc cuugucugaa cgcucggaga 840 uacggccccg agugugaugu gggcaaccug gaaacaaaug gcggcagcac cuccgacgac 900 gagaucucug augccaccga cagcgacgau acacuggcca gccacagcga uacagaaggc 960 ggaccaucuc cugccggaag agagaauccu gagucugccu cuggcggagc uaucgccgca 1020 agacuggaau gcgaguucgg caccuucgac uggacaagcg aggaaggcuc ucagccuugg 1080 cugucugcug ugguggccga uaccucuagc gccgaaagau cuggacuucc ugcuccuggc 1140 gccugcagag cuacagaagc uccugaaaga gaggacggcu gcagaaagau gcgguucccu 1200 gccgccuguc cuuauccuug cggccacaca uuucugcggc cu 1242 <210> 307 <211> 168 <212> PRT <213> Classical swine fever virus <400> 307 Met Glu Leu Asn His Phe Glu Leu Leu Tyr Lys Thr Ser Lys Gln Lys 1 5 10 15 Pro Val Gly Val Glu Glu Pro Val Tyr Asp Thr Ala Gly Arg Pro Leu 20 25 30 Phe Gly Asn Pro Ser Glu Val His Pro Gln Ser Thr Leu Lys Leu Pro 35 40 45 His Asp Arg Gly Arg Gly Asp Ile Arg Thr Thr Leu Arg Asp Leu Pro 50 55 60 Arg Lys Gly Asp Cys Arg Ser Gly Asn His Leu Gly Pro Val Ser Gly 65 70 75 80 Ile Tyr Ile Lys Pro Gly Pro Val Tyr Tyr Gln Asp Tyr Thr Gly Pro 85 90 95 Val Tyr His Arg Ala Pro Leu Glu Phe Phe Asp Glu Ala Gln Phe Cys 100 105 110 Glu Val Thr Lys Arg Ile Gly Arg Val Thr Gly Ser Asp Gly Lys Leu 115 120 125 Tyr His Ile Tyr Val Cys Val Asp Gly Cys Ile Leu Leu Lys Leu Ala 130 135 140 Lys Arg Gly Thr Pro Arg Thr Leu Lys Trp Ile Arg Asn Phe Thr Asn 145 150 155 160 Cys Pro Leu Trp Val Thr Ser Cys 165 <210> 308 <211> 504 <212> DNA <213> Classical swine fever virus <400> 308 atggagttga atcattttga attattatac aaaacaagca aacaaaaacc agtgggagtg 60 gaggaaccgg tgtatgacac cgcggggaga ccactatttg ggaacccaag tgaggtacac 120 ccacaatcaa cgctgaagct gccacacgac agggggagag gagatatcag aacaacactg 180 agggacctac ccaggaaagg tgactgtagg agtggcaacc atctaggccc ggttagtggg 240 atatacataa agcccggccc tgtctactat caggactaca cgggcccagt ctatcacaga 300 gctcctttag agttctttga tgaggcccag ttctgcgagg tgactaagag aataggcagg 360 gtcacgggta gtgatggtaa gctttaccac atatatgtgt gcgtcgatgg ttgcatactg 420 ctgaaattag ccaaaagggg cacacccaga accctaaagt ggattaggaa cttcaccaac 480 tgtccattat gggtaaccag ttgc 504 <210> 309 <211> 504 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding CSFV NPro protein <400> 309 atggaactga accacttcga gctgctgtac aagaccagca agcagaaacc cgtgggcgtc 60 gaggaacccg tgtatgatac agctggcaga cccctgttcg gcaacccctc tgaagtgcac 120 cctcagagca cactgaagct gccccacgat agaggcagag gcgacatcag aaccacactg 180 cgggacctgc ctagaaaggg cgattgcaga agcggcaatc atctgggccc tgtgtccggc 240 atctacatca agcctggacc agtgtactac caggactaca caggccccgt gtaccacaga 300 gcccctctgg aattcttcga cgaggcccag ttctgcgaag tgaccaagag aatcggcaga 360 gtgaccggct ccgacggcaa gctgtaccac atctacgtgt gcgtggacgg ctgcatcctg 420 ctgaagctgg ccaagagagg cacccctaga acactgaagt ggatccggaa cttcaccaac 480 tgtcctctgt gggtcaccag ctgc 504 <210> 310 <211> 504 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding CSFV NPro protein <400> 310 auggaacuga accacuucga gcugcuguac aagaccagca agcagaaacc cgugggcguc 60 gaggaacccg uguaugauac agcuggcaga ccccuguucg gcaaccccuc ugaagugcac 120 ccucagagca cacugaagcu gccccacgau agaggcagag gcgacaucag aaccacacug 180 cgggaccugc cuagaaaggg cgauugcaga agcggcaauc aucugggccc uguguccggc 240 aucuacauca agccuggacc aguguacuac caggacuaca caggccccgu guaccacaga 300 gccccucugg aauucuucga cgaggcccag uucugcgaag ugaccaagag aaucggcaga 360 gugaccggcu ccgacggcaa gcuguaccac aucuacgugu gcguggacgg cugcauccug 420 cugaagcugg ccaagagagg caccccuaga acacugaagu ggauccggaa cuucaccaac 480 uguccucugu gggucaccag cugc 504 <210> 311 <211> 168 <212> PRT <213> Border disease virus <400> 311 Met Glu Leu Asn Lys Phe Glu Leu Leu Tyr Lys Thr Ser Lys Gln Arg 1 5 10 15 Pro Val Gly Ala Val Glu Pro Val Tyr Asp Ser Ala Gly Asn Pro Leu 20 25 30 Tyr Gly Glu Arg Thr Thr Val His Pro Gln Ala Thr Leu Lys Leu Pro 35 40 45 His His Arg Gly Val Ala Glu Val Ile Thr Thr Leu Lys Asp Leu Pro 50 55 60 Arg Lys Gly Asp Cys Arg Ser Gly Asn His Arg Gly Pro Val Ser Gly 65 70 75 80 Ile Tyr Ile Lys Pro Gly Pro Val Ile Tyr Gln Asp Tyr Lys Arg Pro 85 90 95 Val Tyr His Arg Ala Pro Leu Glu Gln Phe Thr Lys Val Gln Ile Cys 100 105 110 Glu Ala Thr Lys Arg Val Gly Arg Val Thr Gly Ser Asp Gly Lys Leu 115 120 125 Tyr His Leu Tyr Val Cys Met Asp Gly Cys Ile Leu Leu Lys Leu Ala 130 135 140 Ser Arg Thr Val Asn Ala Val Leu Lys Trp Thr His Asn Thr Leu Asp 145 150 155 160 Cys Pro Leu Trp Val Thr Ser Cys 165 <210> 312 <211> 504 <212> DNA <213> Border disease virus <400> 312 atggagttga ataagtttga acttttatac aaaacaagta aacaaagacc agtaggggct 60 gttgaaccag tttatgactc agcgggtaac cccctatatg gtgaaagaac aacagtacac 120 ccgcaagcca ctctgaaact accacatcac aggggagtag ccgaggtgat aacaaccctg 180 aaggatttgc ccaggaaagg agactgcagg agtggaaacc atcgaggccc agtgagtggt 240 atatacatca agccaggtcc agtcatatac caggattaca agagaccggt gtaccacagg 300 gctcctctgg agcagttcac gaaggtacaa atctgtgagg ctacgaaaag ggtggggaga 360 gtcactggca gcgatggcaa attgtaccac ctatacgttt gcatggatgg ttgcatattg 420 ctgaaactgg caagcaggac cgtgaatgca gtgctaaaat ggacacataa cactctggac 480 tgtccacttt gggttacaag ctgc 504 <210> 313 <211> 504 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding BDV Npro protein <400> 313 atggaactga acaagttcga gctgctgtac aagaccagca agcagaggcc tgtgggagcc 60 gtggaacctg tgtatgatag cgccggcaat cccctgtacg gcgagagaac aacagtgcac 120 cctcaggcca cactgaagct gcctcatcat agaggcgtgg ccgaagtgat cacaaccctg 180 aaggacctgc ctcggaaggg cgattgcaga agcggcaatc acagaggccc tgtgtccggc 240 atctacatca agcccggacc tgtgatctac caggactaca agcggcccgt gtaccacaga 300 gcacccctgg aacagttcac caaggtgcag atttgcgagg ccaccaagcg cgtgggaaga 360 gtgacaggct ctgacggcaa gctgtaccac ctgtacgtgt gcatggacgg ctgcatcctg 420 ctgaaactgg ccagcagaac cgtgaacgcc gtgctgaagt ggacccacaa caccctggat 480 tgccctctgt gggtcaccag ctgt 504 <210> 314 <211> 504 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding BDV Npro protein <400> 314 auggaacuga acaaguucga gcugcuguac aagaccagca agcagaggcc ugugggagcc 60 guggaaccug uguaugauag cgccggcaau ccccuguacg gcgagagaac aacagugcac 120 ccucaggcca cacugaagcu gccucaucau agaggcgugg ccgaagugau cacaacccug 180 aaggaccugc cucggaaggg cgauugcaga agcggcaauc acagaggccc uguguccggc 240 aucuacauca agcccggacc ugugaucuac caggacuaca agcggcccgu guaccacaga 300 gcaccccugg aacaguucac caaggugcag auuugcgagg ccaccaagcg cgugggaaga 360 gugacaggcu cugacggcaa gcuguaccac cuguacgugu gcauggacgg cugcauccug 420 cugaaacugg ccagcagaac cgugaacgcc gugcugaagu ggacccacaa cacccuggau 480 ugcccucugu gggucaccag cugu 504 <210> 315 <211> 491 <212> PRT <213> Bovine rotavirus A <400> 315 Met Ala Thr Phe Lys Asp Ala Cys Tyr His Tyr Lys Lys Leu Asn Lys 1 5 10 15 Leu Asn Ser Leu Val Leu Lys Leu Gly Ala Asn Asp Glu Trp Arg Pro 20 25 30 Ala Pro Val Thr Lys Tyr Lys Gly Trp Cys Leu Asp Cys Cys Gln Tyr 35 40 45 Thr Asn Leu Thr Tyr Cys Arg Gly Cys Ala Leu Tyr His Val Cys Gln 50 55 60 Trp Cys Ser Gln Tyr Asn Arg Cys Phe Leu Asp Glu Glu Pro His Leu 65 70 75 80 Leu Arg Met Arg Thr Phe Lys Asp Val Val Thr Lys Glu Asp Ile Glu 85 90 95 Gly Leu Leu Thr Met Tyr Glu Thr Leu Phe Pro Ile Asn Glu Lys Leu 100 105 110 Val Asn Lys Phe Ile Asn Ser Val Lys Gln Arg Lys Cys Arg Asn Glu 115 120 125 Tyr Leu Leu Glu Trp Tyr Asn His Leu Leu Met Pro Ile Thr Leu Gln 130 135 140 Ala Leu Thr Ile Asn Leu Glu Asp Asn Val Tyr Tyr Met Phe Gly Tyr 145 150 155 160 Tyr Asp Cys Met Glu His Glu Asn Gln Thr Pro Phe Gln Phe Val Asn 165 170 175 Leu Leu Glu Lys Tyr Asp Lys Leu Leu Leu Asp Asp Arg Asn Phe His 180 185 190 Arg Met Ser His Leu Pro Val Ile Leu Gln Gln Glu Tyr Ala Leu Arg 195 200 205 Tyr Phe Ser Lys Ser Arg Phe Leu Ser Lys Gly Lys Lys Arg Leu Ser 210 215 220 Arg Ser Asp Phe Ser Asp Asn Leu Met Glu Asp Arg His Ser Pro Thr 225 230 235 240 Ser Leu Met Gln Val Val Arg Asn Cys Ile Ser Ile His Ile Asp Asp 245 250 255 Cys Glu Trp Asn Lys Ala Cys Thr Leu Ile Val Asp Ala Arg Asn Tyr 260 265 270 Ile Ser Ile Met Asn Ser Ser Tyr Thr Glu His Tyr Ser Val Ser Gln 275 280 285 Arg Cys Lys Leu Phe Thr Lys Tyr Lys Phe Gly Ile Val Ser Lys Leu 290 295 300 Val Lys Pro Asn Tyr Ile Phe Ser Ser His Glu Ser Cys Ala Leu Asn 305 310 315 320 Val His Asn Cys Lys Trp Cys Gln Ile Asn Asn His Tyr Lys Val Trp 325 330 335 Glu Asp Phe Arg Leu Arg Lys Ile Tyr Asn Asn Val Met Asp Phe Ile 340 345 350 Arg Ala Leu Val Lys Ser Asn Val Asn Val Gly His Cys Ser Ser Gln 355 360 365 Glu Ser Val Tyr Lys Tyr Val Pro Asp Leu Phe Leu Ile Cys Lys Thr 370 375 380 Glu Lys Trp Ser Glu Ala Val Glu Met Leu Phe Asn Tyr Leu Glu Pro 385 390 395 400 Val Asn Val Asn Gly Thr Glu Tyr Val Leu Leu Asp Tyr Glu Val Asn 405 410 415 Trp Glu Val Arg Gly Leu Val Met Gln Asn Met Asp Gly Lys Val Pro 420 425 430 Arg Ile Leu Asn Met Asn Asp Thr Lys Lys Ile Leu Ser Ala Met Ile 435 440 445 Phe Asp Trp Phe Asp Thr Arg Tyr Met Arg Glu Thr Pro Met Thr Thr 450 455 460 Ser Thr Thr Asn Gln Leu Arg Thr Leu Asn Lys Arg Asn Glu Leu Ile 465 470 475 480 Asp Glu Tyr Asp Leu Glu Leu Ser Asp Val Glu 485 490 <210> 316 <211> 1473 <212> DNA <213> Bovine rotavirus A <400> 316 atggcgactt ttaaggacgc ttgttatcat tataaaaagt tgaataaatt aaatagttta 60 gtgctcaaac taggagcaaa tgatgaatgg aggccagcac cagtgacaaa atataaagga 120 tggtgtttag attgttgtca atatacaaat ttgacatatt gcagagggtg cgctctatac 180 catgtatgtc agtggtgcag tcagtataac aggtgtttct tagatgaaga accccatttg 240 ctgagaatgc gaacatttaa agatgtagta acaaaagaag atatagaagg actgctaacc 300 atgtatgaaa cgttgtttcc aataaatgaa aagttagtga ataaattcat aaactctgtg 360 aagcagcgta agtgtaggaa tgagtatttg ttagaatggt ataaccactt actaatgcca 420 ataacattgc aagcattgac tataaatctt gaggataatg tatattatat gtttggatac 480 tatgattgca tggagcatga aaaccaaaca ccattccaat ttgttaacct actagaaaaa 540 tatgataaat tgctactaga tgatagaaat ttccatagaa tgtcacactt accagtaata 600 ttgcaacaag agtatgcgtt gagatatttt tcaaaatcaa gatttttaag taaagggaag 660 aaaagattga gtaggagtga tttctcagat aatcttatgg aagatagaca tagtccaaca 720 tcattaatgc aagtggtacg taactgcatc agtatacaca tagatgattg tgaatggaat 780 aaagcgtgta cgcttatagt tgatgctaga aattatatta gtattatgaa ttcatcgtat 840 actgagcatt acagtgtgtc acaaagatgt aaactgttca ctaagtataa atttgggatt 900 gtatcaaaat tggtgaaacc gaattacatt ttttctagcc atgaatcatg cgcattaaac 960 gtacacaatt gtaaatggtg tcagatcaat aaccattaca aagtgtggga agattttaga 1020 cttaggaaaa tatacaataa tgtaatggat tttatcaggg cacttgtgaa atcgaatgta 1080 aacgttggac attgttcatc acaggaatca gtgtataagt atgtaccgga tttattttta 1140 atttgtaaaa cggaaaaatg gagcgaagct gtcgaaatgt tatttaatta tctagaacca 1200 gtgaacgtaa atggaacgga gtatgtatta ttagactatg aagtgaactg ggaagtgagg 1260 ggactagtca tgcaaaacat ggacgggaaa gtaccaagaa ttttgaatat gaatgataca 1320 aagaagatac tgagtgcaat gatatttgac tggtttgaca caagatatat gagagaaaca 1380 ccaatgacga cgtcaacaac aaaccaactt cgaacactga acaaaaggaa tgagctcata 1440 gatgagtacg atttagaact ttcagatgtt gaa 1473 <210> 317 <211> 1473 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding Bovine RV NS1 protein <400> 317 atggccacct tcaaggacgc ctgctaccac tacaagaagc tgaacaagct gaatagcctg 60 gtgctgaagc tgggcgccaa tgatgaatgg cgacctgctc ctgtgaccaa gtacaaaggc 120 tggtgcctgg actgctgcca gtacaccaat ctgacctact gcagaggctg cgccctgtac 180 cacgtctgtc agtggtgcag ccagtacaac cggtgcttcc tggacgagga accccatctg 240 ctgcggatgc ggacctttaa ggacgtggtc accaaagagg acatcgaggg cctgctgact 300 atgtacgaga cactgttccc catcaacgag aagctggtca acaagttcat caacagcgtg 360 aagcagcgga agtgccggaa cgagtacctg ctggaatggt acaatcatct gctgatgccc 420 atcacactgc aggccctgac catcaacctg gaagataacg tgtactacat gttcggctac 480 tacgactgca tggaacacga gaatcagacc cctttccagt tcgtgaacct gctcgagaag 540 tacgacaagc tgctgctgga cgaccggaac ttccaccgga tgtctcatct gcccgtgatc 600 ctgcagcaag agtacgccct gcggtacttc agcaagagcc ggtttctgag caagggcaag 660 aagcggctga gcagaagcga cttcagcgac aacctgatgg aagatcggca cagccccacc 720 agcctgatgc aggtcgtcag aaactgcatc agcatccaca tcgacgactg tgaatggaac 780 aaggcctgca cactgatcgt ggacgcccgc aactacatct ccatcatgaa cagcagctac 840 accgagcact acagcgtgtc ccagcggtgc aagctgttca caaagtacaa gttcggcatc 900 gtgtccaagc tcgtgaagcc caattacatc ttcagcagcc acgagagctg tgccctgaac 960 gtgcacaact gcaagtggtg ccagatcaac aatcactaca aagtgtggga agatttccgg 1020 ctgcggaaga tctacaacaa cgtgatggac ttcatccgcg ctctggtcaa gagcaacgtg 1080 aacgtgggcc actgcagcag ccaagagtcc gtgtacaaat acgtgcccga cctgttcctg 1140 atctgcaaga ccgagaagtg gagcgaggcc gtggaaatgc tgttcaacta cctggaacct 1200 gtgaacgtca acggcaccga gtacgtcctg ctggactacg aagtgaactg ggaagtgcgg 1260 ggcctcgtga tgcagaacat ggatggcaag gtgccccgga tcctgaacat gaacgacacc 1320 aagaaaatcc tgagcgccat gatcttcgat tggttcgaca cccggtacat gcgcgagaca 1380 cctatgacca ccagcaccac caaccagctg cggaccctga acaagagaaa cgagctgatc 1440 gacgagtacg acctggaact gagcgacgtg gaa 1473 <210> 318 <211> 1473 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding Bovine RV NS1 protein <400> 318 auggccaccu ucaaggacgc cugcuaccac uacaagaagc ugaacaagcu gaauagccug 60 gugcugaagc ugggcgccaa ugaugaaugg cgaccugcuc cugugaccaa guacaaaggc 120 uggugccugg acugcugcca guacaccaau cugaccuacu gcagaggcug cgcccuguac 180 cacgucuguc aguggugcag ccaguacaac cggugcuucc uggacgagga accccaucug 240 cugcggaugc ggaccuuuaa ggacgugguc accaaagagg acaucgaggg ccugcugacu 300 auguacgaga cacuguuccc caucaacgag aagcugguca acaaguucau caacagcgug 360 aagcagcgga agugccggaa cgaguaccug cuggaauggu acaaucaucu gcugaugccc 420 aucacacugc aggcccugac caucaaccug gaagauaacg uguacuacau guucggcuac 480 uacgacugca uggaacacga gaaucagacc ccuuuccagu ucgugaaccu gcucgagaag 540 uacgacaagc ugcugcugga cgaccggaac uuccaccgga ugucucaucu gcccgugauc 600 cugcagcaag aguacgcccu gcgguacuuc agcaagagcc gguuucugag caagggcaag 660 aagcggcuga gcagaagcga cuucagcgac aaccugaugg aagaucggca cagccccacc 720 agccugaugc aggucgucag aaacugcauc agcauccaca ucgacgacug ugaauggaac 780 aaggccugca cacugaucgu ggacgcccgc aacuacaucu ccaucaugaa cagcagcuac 840 accgagcacu acagcguguc ccagcggugc aagcuguuca caaaguacaa guucggcauc 900 guguccaagc ucgugaagcc caauuacauc uucagcagcc acgagagcug ugcccugaac 960 gugcacaacu gcaaguggug ccagaucaac aaucacuaca aaguguggga agauuuccgg 1020 cugcggaaga ucuacaacaa cgugauggac uucauccgcg cucuggucaa gagcaacgug 1080 aacgugggcc acugcagcag ccaagagucc guguacaaau acgugcccga ccuguuccug 1140 aucugcaaga ccgagaagug gagcgaggcc guggaaaugc uguucaacua ccuggaaccu 1200 gugaacguca acggcaccga guacguccug cuggacuacg aagugaacug ggaagugcgg 1260 ggccucguga ugcagaacau ggauggcaag gugccccgga uccugaacau gaacgacacc 1320 aagaaaaucc ugagcgccau gaucuucgau ugguucgaca cccgguacau gcgcgagaca 1380 ccuaugacca ccagcaccac caaccagcug cggacccuga acaagagaaa cgagcugauc 1440 gacgaguacg accuggaacu gagcgacgug gaa 1473 <210> 319 <211> 317 <212> PRT <213> Bovine rotavirus A <400> 319 Met Ala Glu Leu Ala Cys Phe Cys Tyr Pro His Leu Glu Ser Asp Thr 1 5 10 15 Tyr Arg Phe Ile Pro Phe Asn Ser Leu Ala Ile Lys Cys Met Leu Thr 20 25 30 Ala Lys Val Asp Lys Lys Asp Gln Asp Lys Phe Tyr Asn Ser Ile Ile 35 40 45 Tyr Gly Ile Ala Pro Pro Pro Gln Phe Lys Lys Arg Tyr Asn Thr Asn 50 55 60 Asp Asn Ser Arg Gly Met Asn Tyr Glu Thr Pro Met Phe Asn Lys Val 65 70 75 80 Ala Val Leu Ile Cys Glu Ala Leu Asn Ser Ile Lys Val Thr Gln Ser 85 90 95 Asp Val Ala Ser Val Leu Ser Lys Val Ile Ser Val Arg His Leu Glu 100 105 110 Asn Leu Val Leu Arg Arg Glu Asn His Gln Asp Val Leu Phe His Ser 115 120 125 Lys Glu Leu Leu Leu Arg Ser Val Leu Ile Ala Ile Gly His Ser Lys 130 135 140 Glu Ile Glu Thr Thr Ala Thr Ala Glu Gly Gly Glu Val Val Phe Gln 145 150 155 160 Asn Ala Ala Phe Thr Met Trp Lys Leu Thr Tyr Leu Glu His Arg Leu 165 170 175 Met Pro Ile Leu Asp Gln Asn Phe Ile Glu Tyr Lys Ile Thr Val Asn 180 185 190 Glu Asp Lys Pro Ile Ser Glu Ser His Val Arg Glu Leu Ile Ala Glu 195 200 205 Leu Arg Trp Gln Tyr Asn Lys Phe Ala Val Ile Thr His Gly Lys Gly 210 215 220 His Tyr Arg Val Val Lys Tyr Ser Ser Val Ala Asn His Ala Asp Arg 225 230 235 240 Val Tyr Ala Thr Phe Lys Ser Asn Asn Lys Asn Gly Asn Val Ile Glu 245 250 255 Phe Asn Leu Leu Asp Gln Arg Ile Ile Trp Gln Asn Trp Tyr Ala Phe 260 265 270 Thr Ser Ser Met Lys Gln Gly Asn Thr Leu Glu Ile Cys Lys Lys Leu 275 280 285 Leu Phe Gln Lys Met Lys Arg Glu Ser Asn Pro Phe Lys Gly Leu Ser 290 295 300 Thr Asp Arg Lys Met Asp Glu Val Ser Gln Ile Gly Ile 305 310 315 <210> 320 <211> 951 <212> DNA <213> Bovine rotavirus A <400> 320 atggctgagc tagcttgctt ttgttatccc catttggaga gcgatacgta tagattcatt 60 ccatttaaca gtttagctat aaaatgtatg ttgacagcaa aagtggacaa aaaagatcag 120 gataagtttt acaattcaat aatttatggc attgcaccac cgccacagtt caaaaaacgt 180 tataacacaa atgataattc gagaggaatg aattatgaaa ctccaatgtt taataaagtg 240 gcggtattaa tttgtgaagc gttgaattca attaaagtta ctcaatctga tgttgcgagt 300 gtactttcaa aagtaatttc tgtaagacat ttagagaatt tggtactgag aagagagaac 360 catcaggacg tgcttttcca ttcaaaagag ttgttgctga gatcagtact aatagctatt 420 ggtcactcaa aagaaattga aacaactgcc actgctgaag gaggggaagt agtttttcaa 480 aatgcagctt ttacaatgtg gaaactgaca tacctggagc atagactaat gccaattttg 540 gatcaaaatt ttatcgaata taaaataaca gtgaatgaag ataaaccaat ttcagaatca 600 catgtaagag aactcattgc tgaattgcgg tggcaataca acaaatttgc agtaattaca 660 catggtaaag gtcactacag agttgtaaaa tattcatcag ttgcgaatca tgcagataga 720 gtttacgcta ctttcaagag caataataag aatgggaatg tgatagagtt taatctactt 780 gatcaaagaa taatatggca gaactggtat gcgtttacat cctcaatgaa acaaggcaac 840 actcttgaaa tatgcaagaa actactgttc caaaagatga agcgagaaag taatccgttt 900 aagggactgt caactgatag aaagatggat gaggtctctc aaataggaat t 951 <210> 321 <211> 951 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding Bovine RV NS2 protein <400> 321 atggccgagc tggcctgctt ttgttaccct cacctggaaa gcgataccta ccggttcatc 60 cccttcaaca gcctggccat caagtgcatg ctgaccgcca aggtggacaa gaaggaccag 120 gacaagttct acaacagcat catctacgga atcgcccctc cacctcagtt caagaagcgg 180 tacaacacca acgacaacag ccggggcatg aactacgaga cacccatgtt caacaaggtg 240 gccgtgctga tctgcgaggc cctgaactcc atcaaagtga cccagtccga tgtggccagc 300 gtgctgagca aagtgatctc tgtgcggcac ctcgagaacc tggtgctgcg gagagaaaac 360 caccaggacg tgctgttcca cagcaaagag ctgctgctga gatctgtgct gatcgccatc 420 ggccactcca aagagatcga gacaaccgcc acagccgaag gcggagaggt ggtgtttcag 480 aatgccgcct tcaccatgtg gaagctgacc tacctggaac accggctgat gcccatcctg 540 gaccagaact tcatcgagta caagatcacc gtgaacgagg acaagcccat cagcgagtct 600 cacgtgcggg aactgattgc cgagctgcgg tggcagtaca acaagttcgc cgtgatcaca 660 cacggcaagg gccactacag agtggtcaag tacagcagcg tggccaacca cgccgataga 720 gtgtacgcca ccttcaagag caacaacaag aacggcaacg tgatcgagtt caacctgctg 780 gaccagcgga tcatctggca gaattggtac gcctttacca gcagcatgaa gcagggcaac 840 accctggaaa tctgcaagaa gctcctgttc cagaagatga agagagagag caaccccttc 900 aagggcctga gcaccgaccg gaagatggat gaggtgtccc agatcggcat c 951 <210> 322 <211> 951 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding Bovine RV NS2 protein <400> 322 auggccgagc uggccugcuu uuguuacccu caccuggaaa gcgauaccua ccgguucauc 60 cccuucaaca gccuggccau caagugcaug cugaccgcca agguggacaa gaaggaccag 120 gacaaguucu acaacagcau caucuacgga aucgccccuc caccucaguu caagaagcgg 180 uacaacacca acgacaacag ccggggcaug aacuacgaga cacccauguu caacaaggug 240 gccgugcuga ucugcgaggc ccugaacucc aucaaaguga cccaguccga uguggccagc 300 gugcugagca aagugaucuc ugugcggcac cucgagaacc uggugcugcg gagagaaaac 360 caccaggacg ugcuguucca cagcaaagag cugcugcuga gaucugugcu gaucgccauc 420 ggccacucca aagagaucga gacaaccgcc acagccgaag gcggagaggu gguguuucag 480 aaugccgccu ucaccaugug gaagcugacc uaccuggaac accggcugau gcccauccug 540 gaccagaacu ucaucgagua caagaucacc gugaacgagg acaagcccau cagcgagucu 600 cacgugcggg aacugauugc cgagcugcgg uggcaguaca acaaguucgc cgugaucaca 660 cacggcaagg gccacuacag aguggucaag uacagcagcg uggccaacca cgccgauaga 720 guguacgcca ccuucaagag caacaacaag aacggcaacg ugaucgaguu caaccugcug 780 gaccagcgga ucaucuggca gaauugguac gccuuuacca gcagcaugaa gcagggcaac 840 acccuggaaa ucugcaagaa gcuccuguuc cagaagauga agagagagag caaccccuuc 900 aagggccuga gcaccgaccg gaagauggau gagguguccc agaucggcau c 951 <210> 323 <211> 228 <212> PRT <213> Porcine bocavirus 1 <400> 323 Met Ser Ser Ala Arg Ser Asp Thr Asp Thr Gly Arg Arg Gly Lys Arg 1 5 10 15 Ser Arg Ser Arg Ser Arg Ser Arg Asp Arg Asp Gln Ala Pro Gly Leu 20 25 30 Pro Pro Lys Lys Arg Asp Tyr Arg Arg Arg Ser Gly Glu Arg Gly Ser 35 40 45 Glu Ser Ser Pro Asp Arg Ser Thr Arg Gly Ser Pro Ser Cys Ser Thr 50 55 60 Ala Ser Arg Thr Ser Arg Val Thr Ser Ala Thr Trp Arg Arg Pro Asn 65 70 75 80 Asp Ser Arg Asp Gly Gly Lys Ile Trp Gly Asn Lys Asn Lys Lys Asn 85 90 95 Lys Thr Asn Pro Tyr Glu Val Phe Ser Gln His Met Ala Arg Phe Lys 100 105 110 Pro Asp Lys Ser Tyr Cys Gly Phe Tyr Trp His Ser Cys Arg Met Ala 115 120 125 Arg Lys Gly Thr Asp Tyr Ile Phe Thr Glu Gly Met Arg Asp Phe Gln 130 135 140 Lys Arg Cys Lys Asp Asn Lys Cys Glu Trp Lys Asp Val Arg Glu Ile 145 150 155 160 Met Phe Gly Leu Lys Lys Val Leu Asp Gln Gly Tyr Arg Asn Met Met 165 170 175 Tyr His Phe Arg His Thr Gln Cys Glu Lys Cys Asn Tyr Trp Asp Glu 180 185 190 Val Tyr Lys Met His Leu Ala Asn Val Ser Pro Ser Glu Thr Glu Pro 195 200 205 Gln Glu Leu Thr Asp Glu Glu Ile Leu Ala Ala Ala Met Glu Val Asp 210 215 220 Gly Thr His Glu 225 <210> 324 <211> 684 <212> DNA <213> Porcine bocavirus 1 <400> 324 atgagctcag cgagatccga cacagacaca ggcaggagag ggaagcggtc gaggagccgg 60 tcgaggagcc gcgaccggga ccaagcaccg gggctgcctc cgaaaaaaag ggactatcgc 120 cgtcggagtg gggagagagg ctcggagtcc tcaccagatc gctcgacgag ggggagccca 180 tcgtgctcca ctgcttcgag aacatcccga gtgacttcag cgacatggag gagaccgaat 240 gactctcggg acggggggaa aatatgggga aataaaaata aaaagaataa aacaaaccct 300 tacgaggtat tcagccagca catggccagg ttcaagccag ataaaagcta ttgtggcttc 360 tactggcaca gctgccggat ggctcgtaag ggcacagatt atatctttac cgagggaatg 420 agggatttcc aaaaacgctg taaagacaat aaatgtgagt ggaaagatgt cagggagatc 480 atgttcggcc tcaaaaaggt cttagatcag ggatatagaa atatgatgta tcactttaga 540 catacccagt gtgagaaatg taactactgg gatgaagtgt ataaaatgca cctggctaac 600 gtgtctcctt ctgaaacaga accgcaggaa ctgacagacg aggagatatt agccgcggcc 660 atggaggtcg atggcaccca cgaa 684 <210> 325 <211> 684 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding PBoV NP1 protein <400> 325 atgagcagcg ccagaagcga taccgacaca ggcagacggg gcaagagaag cagaagccgg 60 tccagaagca gagacagaga tcaggctcct ggcctgcctc ctaagaagcg ggactacaga 120 agaagatccg gcgagagagg cagcgagagc agccctgata gaagcacaag aggcagccct 180 agctgtagca ccgccagcag aacaagcaga gtgacctctg ccacttggcg gaggcccaac 240 gattctagag atggcggcaa gatctggggc aacaagaaca agaagaacaa aacgaacccc 300 tacgaggtgt tcagccagca catggccaga ttcaagcccg acaagagcta ctgcggcttc 360 tactggcaca gctgccggat ggccagaaag ggcaccgact acatcttcac cgagggcatg 420 agagacttcc agaagcggtg caaggacaac aagtgcgagt ggaaggacgt gcgcgagatc 480 atgttcggcc tgaagaaggt gctggaccag ggctacagaa acatgatgta ccacttccgg 540 cacacccagt gcgagaagtg caactactgg gacgaagtgt acaagatgca cctggccaac 600 gtgtccccat ccgagacaga gcctcaagag ctgaccgacg aggaaattct ggccgctgcc 660 atggaagtgg atggcacaca tgaa 684 <210> 326 <211> 684 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding PBoV NP1 <400> 326 augagcagcg ccagaagcga uaccgacaca ggcagacggg gcaagagaag cagaagccgg 60 uccagaagca gagacagaga ucaggcuccu ggccugccuc cuaagaagcg ggacuacaga 120 agaagauccg gcgagagagg cagcgagagc agcccugaua gaagcacaag aggcagcccu 180 agcuguagca ccgccagcag aacaagcaga gugaccucug ccacuuggcg gaggcccaac 240 gauucuagag auggcggcaa gaucuggggc aacaagaaca agaagaacaa aacgaacccc 300 uacgaggugu ucagccagca cauggccaga uucaagcccg acaagagcua cugcggcuuc 360 uacuggcaca gcugccggau ggccagaaag ggcaccgacu acaucuucac cgagggcaug 420 agagacuucc agaagcggug caaggacaac aagugcgagu ggaaggacgu gcgcgagauc 480 auguucggcc ugaagaaggu gcuggaccag ggcuacagaa acaugaugua ccacuuccgg 540 cacacccagu gcgagaagug caacuacugg gacgaagugu acaagaugca ccuggccaac 600 guguccccau ccgagacaga gccucaagag cugaccgacg aggaaauucu ggccgcugcc 660 auggaagugg auggcacaca ugaa 684 <210> 327 <211> 114 <212> PRT <213> Hepatitis E virus <400> 327 Met Gly Ser Arg Pro Cys Ala Leu Gly Leu Phe Cys Cys Cys Ser Ser 1 5 10 15 Cys Phe Cys Leu Cys Cys Pro Arg His Arg Pro Val Ser Arg Leu Ala 20 25 30 Ala Val Val Gly Gly Ala Ala Ala Val Pro Ala Val Val Ser Gly Val 35 40 45 Thr Gly Leu Ile Leu Ser Pro Ser Gln Ser Pro Ile Phe Ile Gln Pro 50 55 60 Thr Pro Ser Pro Pro Met Ser Pro Leu Arg Pro Gly Leu Asp Leu Val 65 70 75 80 Phe Ala Asn Pro Pro Asp His Ser Ala Pro Leu Gly Val Thr Arg Pro 85 90 95 Ser Ala Pro Pro Leu Pro His Val Val Asp Leu Pro Gln Leu Gly Pro 100 105 110 Arg Arg <210> 328 <211> 342 <212> DNA <213> Hepatitis E virus <400> 328 atgggttcgc gaccatgcgc cctcggccta ttttgttgct gctcctcatg tttttgccta 60 tgctgcccgc gccaccgccc ggtcagccgt ctggccgccg tcgtgggcgg cgcagcggcg 120 gttccggcgg tggtttctgg ggtgaccggg ttgattctca gcccttcgca atcccctata 180 ttcatccaac caaccccttc gcccccgatg tcaccgctgc ggccggggct ggacctcgtg 240 ttcgccaacc cgcccgacca ctcggctccg cttggcgtga ccaggcccag cgccccgccg 300 ttgcctcacg tcgtagacct accacagctg gggccgcgcc gc 342 <210> 329 <211> 342 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding Hepatitis E Orf3 protein <400> 329 atgggcagca gaccttgtgc tctgggcctg ttctgctgct gcagctcctg cttctgcctg 60 tgctgcccta gacacagacc cgtgtctaga ctggccgctg ttgttggcgg agctgctgct 120 gttccagctg tggtgtctgg cgtgacaggc ctgattctga gcccttctca gagccccatc 180 ttcatccagc ctacacctag tcctccaatg agccctctga ggcctggact ggatctggtg 240 ttcgccaatc ctcctgatca ctctgcccct ctgggcgtga caagaccttc tgctcctcct 300 ctgccacacg tggtggatct gcctcaactg ggccctagaa ga 342 <210> 330 <211> 342 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding Hepatitis E Orf3 polypeptide <400> 330 augggcagca gaccuugugc ucugggccug uucugcugcu gcagcuccug cuucugccug 60 ugcugcccua gacacagacc cgugucuaga cuggccgcug uuguuggcgg agcugcugcu 120 guuccagcug uggugucugg cgugacaggc cugauucuga gcccuucuca gagccccauc 180 uucauccagc cuacaccuag uccuccaaug agcccucuga ggccuggacu ggaucuggug 240 uucgccaauc cuccugauca cucugccccu cugggcguga caagaccuuc ugcuccuccu 300 cugccacacg ugguggaucu gccucaacug ggcccuagaa ga 342 <210> 331 <211> 496 <212> PRT <213> Rotavirus A <400> 331 Met Ala Thr Phe Lys Asp Ala Cys Phe His Tyr Arg Arg Leu Thr Ala 1 5 10 15 Leu Asn Arg Arg Leu Cys Asn Ile Gly Ala Asn Ser Ile Cys Met Pro 20 25 30 Val Pro Asp Ala Lys Ile Lys Gly Trp Cys Leu Glu Cys Cys Gln Ile 35 40 45 Ala Asp Leu Thr His Cys Tyr Gly Cys Ser Leu Pro His Val Cys Lys 50 55 60 Trp Cys Val Gln Asn Arg Arg Cys Phe Leu Asp Asn Glu Pro His Leu 65 70 75 80 Leu Lys Leu Arg Thr Val Lys His Pro Ile Thr Lys Asp Lys Leu Gln 85 90 95 Cys Ile Ile Asp Leu Tyr Asn Ile Ile Phe Pro Ile Asn Asp Lys Val 100 105 110 Ile Arg Lys Phe Glu Arg Met Ile Lys Gln Arg Lys Cys Arg Asn Gln 115 120 125 Tyr Lys Ile Glu Trp Tyr Asn His Leu Leu Leu Pro Ile Thr Leu Asn 130 135 140 Ala Ala Ala Phe Lys Phe Asp Glu Asn Asn Leu Tyr Tyr Val Phe Gly 145 150 155 160 Leu Tyr Glu Lys Ser Val Ser Asp Ile Tyr Ala Pro Tyr Arg Ile Val 165 170 175 Asn Phe Ile Asn Glu Phe Asp Lys Leu Leu Leu Asp Asp Ile Asn Phe 180 185 190 Thr Arg Met Ser Asn Leu Pro Ile Glu Leu Arg Asn His Tyr Ala Lys 195 200 205 Lys Tyr Phe Gln Leu Ser Arg Leu Pro Ser Ser Lys Leu Lys Gln Ile 210 215 220 Tyr Phe Ser Asp Phe Thr Lys Glu Thr Val Ile Phe Asn Thr Tyr Thr 225 230 235 240 Lys Thr Pro Gly Arg Ser Ile Tyr Arg Asn Val Thr Glu Phe Asn Trp 245 250 255 Arg Asp Glu Leu Glu Leu Tyr Ser Asp Leu Lys Asn Asp Lys Asn Lys 260 265 270 Leu Ile Ala Ala Met Met Thr Ser Lys Tyr Thr Arg Phe Tyr Ala His 275 280 285 Asp Asn Asn Phe Gly Arg Leu Lys Met Thr Ile Phe Glu Leu Gly His 290 295 300 His Cys Gln Pro Asn Tyr Val Ala Ser Asn His Pro Gly Asn Ala Ser 305 310 315 320 Asp Ile Gln Tyr Cys Lys Trp Cys Asn Ile Lys Tyr Phe Leu Ser Lys 325 330 335 Ile Asp Trp Arg Ile Arg Asp Met Tyr Asn Leu Leu Met Glu Phe Ile 340 345 350 Lys Asp Cys Tyr Lys Ser Asn Val Asn Val Gly His Cys Ser Ser Val 355 360 365 Glu Asn Ile Tyr Pro Leu Ile Lys Arg Leu Ile Trp Ser Leu Phe Thr 370 375 380 Asn His Met Asp Gln Thr Ile Glu Glu Val Phe Asn His Met Ser Pro 385 390 395 400 Val Ser Val Glu Gly Thr Asn Val Ile Met Leu Ile Leu Gly Leu Asn 405 410 415 Ile Ser Leu Tyr Asn Glu Ile Lys Arg Thr Leu Asn Val Asp Ser Ile 420 425 430 Pro Met Val Leu Asn Leu Asn Glu Phe Ser Ser Ile Val Lys Ser Ile 435 440 445 Ser Ser Lys Trp Tyr Asn Val Asp Glu Leu Asp Lys Leu Pro Met Ser 450 455 460 Ile Lys Ser Thr Glu Glu Leu Ile Glu Met Lys Asn Ser Gly Thr Leu 465 470 475 480 Thr Glu Glu Phe Glu Leu Leu Ile Ser Asn Ser Glu Asp Asp Asn Glu 485 490 495 <210> 332 <211> 1488 <212> DNA <213> Rotavirus A <400> 332 atggctactt ttaaagatgc atgctttcat tatcgtagat taactgcttt aaatcggaga 60 ttatgcaaca ttggtgcaaa ttctatttgc atgccagttc ctgatgcgaa gattaagggg 120 tggtgtttag aatgttgtca aatagctgat ttaacccatt gttatggttg ctcattgccg 180 catgtttgca aatggtgtgt tcagaacaga agatgcttcc ttgacaatga acctcatttg 240 cttaagctta gaactgtgaa acatccaatt accaaagaca aattacagtg tatcatagac 300 ttgtacaata taatatttcc aattaatgat aaagtaatta gaaaatttga aagaatgata 360 aagcaaagaa aatgtaggaa tcaatataaa attgaatggt ataatcattt gctgctccca 420 attacattaa atgctgctgc atttaagttt gatgaaaata atctttatta tgtttttggg 480 ttatatgaga aatcagtcag tgatatatat gctccatata gaattgttaa ctttataaat 540 gaatttgata aattattgct tgatgatatt aactttacaa gaatgtccaa tctaccaata 600 gagttgagaa accattatgc aaagaaatac ttccaattat caagactgcc atcatcaaaa 660 ctaaagcaaa tttacttttc agattttact aaagaaactg tgatttttaa tacttataca 720 aaaacgccag gaagatcaat atacagaaat gtaactgaat ttaattggag agatgaattg 780 gagctttatt ctgatttaaa aaatgataag aataaattaa ttgctgcaat gatgacgagt 840 aagtatactc ggttctatgc tcatgataat aattttggaa ggttgaaaat gacaatattt 900 gagttgggac atcattgtca gcctaactac gtggcatcta atcacccagg caatgcttcc 960 gatatccagt actgtaaatg gtgtaatata aaatattttc ttagtaaaat tgattggcgg 1020 attcgtgata tgtataattt attgatggaa tttattaagg attgttataa aagtaatgtt 1080 aacgttggac attgtagttc tgttgaaaac atatatcctt taattaaaag attaatttgg 1140 agtttgttta ctaatcacat ggatcaaaca attgaagaag tgtttaatca catgtcgcca 1200 gtgtcagttg aaggtacgaa tgtcatcatg ttgattcttg gattgaatat tagtttgtat 1260 aatgaaatta agcgcacttt gaatgtagat agcataccaa tggtacttaa tttaaatgaa 1320 ttcagtagta tagttaaatc aattagcagt aaatggtata atgttgatga attggataaa 1380 ttgccaatgt caataaaatc aacggaggaa ctgattgaaa tgaagaattc tggaacttta 1440 actgaagaat ttgagctact gatctccaac tcagaagatg acaatgag 1488 <210> 333 <211> 1488 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding Rotavirus NSP1 protein <400> 333 atggccacct tcaaggacgc ctgcttccac tacagacggc tgacagccct gaatcggcgg 60 ctgtgtaata tcggcgccaa cagcatctgc atgcccgtgc ctgacgccaa gatcaaaggc 120 tggtgcctgg aatgctgcca gatcgccgat ctcacccact gctacggctg ttctctgccc 180 catgtgtgca agtggtgcgt gcagaacaga cggtgcttcc tggacaacga gccccatctg 240 ctgaagctga gaaccgtgaa gcaccccatc accaaggaca agctgcagtg catcatcgac 300 ctgtacaaca tcatcttccc catcaacgac aaagtgatcc ggaagttcga gcggatgatc 360 aagcagcgga agtgccggaa ccagtacaag atcgagtggt acaatcatct gctgctgccc 420 atcacactga acgccgctgc cttcaagttc gacgagaaca acctgtacta cgtgttcggc 480 ctgtacgaga agtccgtgtc cgacatctac gccccttacc ggatcgtgaa cttcatcaac 540 gagttcgata agctgctgct ggacgacatc aacttcaccc ggatgagcaa cctgcctatc 600 gagctgagaa accactacgc caagaagtac tttcagctga gcagactgcc cagcagcaag 660 ctgaagcaga tctacttctc cgacttcacc aaagaaaccg tgatcttcaa cacctacacc 720 aagacacccg gcagatccat ctaccggaac gtgaccgagt tcaactggcg ggacgagctg 780 gaactgtaca gcgacctgaa gaacgacaag aacaagctga tcgccgccat gatgaccagc 840 aagtacaccc ggttctacgc ccacgacaac aatttcggcc ggctgaagat gaccatcttc 900 gagctgggcc accactgcca gcctaattac gtggcctcta atcaccccgg caacgccagc 960 gatatccagt actgcaaatg gtgcaatatc aagtacttcc tgagcaagat cgactggcgg 1020 atccgggaca tgtacaacct gctgatggaa ttcatcaagg actgctacaa gagcaacgtg 1080 aacgtgggcc actgcagcag cgtcgagaac atctaccctc tgatcaagcg gctgatctgg 1140 tccctgttca ccaaccacat ggaccagacc atcgaagagg tgttcaatca catgagcccc 1200 gtgtccgtgg aaggcaccaa cgtgatcatg ctgatcctgg gcctgaacat cagcctgtac 1260 aatgagatca agcgcaccct gaacgtggac agcatcccca tggtgctgaa cctgaacgag 1320 ttcagcagca tcgtgaagtc catctccagc aagtggtata acgtggacga actggacaaa 1380 ctgcccatga gcatcaagtc caccgaggaa ctgatcgaga tgaagaacag cggcaccctg 1440 accgaggaat tcgagctgct gatctccaac agcgaggacg acaacgag 1488 <210> 334 <211> 1488 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding Rotavirus NSP1 protein <400> 334 auggccaccu ucaaggacgc cugcuuccac uacagacggc ugacagcccu gaaucggcgg 60 cuguguaaua ucggcgccaa cagcaucugc augcccgugc cugacgccaa gaucaaaggc 120 uggugccugg aaugcugcca gaucgccgau cucacccacu gcuacggcug uucucugccc 180 caugugugca aguggugcgu gcagaacaga cggugcuucc uggacaacga gccccaucug 240 cugaagcuga gaaccgugaa gcaccccauc accaaggaca agcugcagug caucaucgac 300 cuguacaaca ucaucuuccc caucaacgac aaagugaucc ggaaguucga gcggaugauc 360 aagcagcgga agugccggaa ccaguacaag aucgaguggu acaaucaucu gcugcugccc 420 aucacacuga acgccgcugc cuucaaguuc gacgagaaca accuguacua cguguucggc 480 cuguacgaga aguccguguc cgacaucuac gccccuuacc ggaucgugaa cuucaucaac 540 gaguucgaua agcugcugcu ggacgacauc aacuucaccc ggaugagcaa ccugccuauc 600 gagcugagaa accacuacgc caagaaguac uuucagcuga gcagacugcc cagcagcaag 660 cugaagcaga ucuacuucuc cgacuucacc aaagaaaccg ugaucuucaa caccuacacc 720 aagacacccg gcagauccau cuaccggaac gugaccgagu ucaacuggcg ggacgagcug 780 gaacuguaca gcgaccugaa gaacgacaag aacaagcuga ucgccgccau gaugaccagc 840 aaguacaccc gguucuacgc ccacgacaac aauuucggcc ggcugaagau gaccaucuuc 900 gagcugggcc accacugcca gccuaauuac guggccucua aucaccccgg caacgccagc 960 gauauccagu acugcaaaug gugcaauauc aaguacuucc ugagcaagau cgacuggcgg 1020 auccgggaca uguacaaccu gcugauggaa uucaucaagg acugcuacaa gagcaacgug 1080 aacgugggcc acugcagcag cgucgagaac aucuacccuc ugaucaagcg gcugaucugg 1140 ucccuguuca ccaaccacau ggaccagacc aucgaagagg uguucaauca caugagcccc 1200 guguccgugg aaggcaccaa cgugaucaug cugauccugg gccugaacau cagccuguac 1260 aaugagauca agcgcacccu gaacguggac agcaucccca uggugcugaa ccugaacgag 1320 uucagcagca ucgugaaguc caucuccagc aagugguaua acguggacga acuggacaaa 1380 cugcccauga gcaucaaguc caccgaggaa cugaucgaga ugaagaacag cggcacccug 1440 accgaggaau ucgagcugcu gaucuccaac agcgaggacg acaacgag 1488 <210> 335 <211> 407 <212> PRT <213> Human herpesvirus 8 <400> 335 Met Ala Met Phe Val Arg Thr Ser Ser Ser Thr His Asp Glu Glu Arg 1 5 10 15 Met Leu Pro Ile Glu Gly Ala Pro Arg Arg Arg Pro Pro Val Lys Phe 20 25 30 Ile Phe Pro Pro Pro Pro Leu Ser Ser Leu Pro Gly Phe Gly Arg Pro 35 40 45 Arg Gly Tyr Ala Gly Pro Thr Val Ile Asp Met Ser Ala Pro Asp Asp 50 55 60 Val Phe Ala Glu Asp Thr Pro Ser Pro Pro Ala Thr Pro Leu Asp Leu 65 70 75 80 Gln Ile Ser Pro Asp Gln Ser Ser Gly Glu Ser Glu Tyr Asp Glu Asp 85 90 95 Glu Glu Asp Glu Asp Glu Glu Glu Asn Asp Asp Val Gln Glu Glu Asp 100 105 110 Glu Pro Glu Gly Tyr Pro Ala Asp Phe Phe Gln Pro Leu Ser His Leu 115 120 125 Arg Pro Arg Pro Leu Ala Arg Arg Ala His Thr Pro Lys Pro Val Ala 130 135 140 Val Val Ala Gly Arg Val Arg Ser Ser Thr Asp Thr Ala Glu Ser Glu 145 150 155 160 Ala Ser Met Gly Trp Val Ser Gln Asp Asp Gly Phe Ser Pro Ala Gly 165 170 175 Leu Ser Pro Ser Asp Asp Glu Gly Val Ala Ile Leu Glu Pro Met Ala 180 185 190 Ala Tyr Thr Gly Thr Gly Ala Tyr Gly Leu Ser Pro Ala Ser Arg Asn 195 200 205 Ser Val Pro Gly Thr Gln Ser Ser Pro Tyr Ser Asp Pro Asp Glu Gly 210 215 220 Pro Ser Trp Arg Pro Leu Arg Ala Ala Pro Thr Ala Ile Val Asp Leu 225 230 235 240 Thr Ser Asp Ser Asp Ser Asp Asp Ser Ser Asn Ser Pro Asp Val Asn 245 250 255 Asn Glu Ala Ala Phe Thr Asp Ala Arg His Phe Ser His Gln Pro Pro 260 265 270 Ser Ser Glu Glu Asp Gly Glu Asp Gln Gly Glu Val Leu Ser Gln Arg 275 280 285 Ile Gly Leu Met Asp Val Gly Gln Lys Arg Lys Arg Gln Ser Thr Ala 290 295 300 Ser Ser Gly Ser Glu Asp Val Val Arg Cys Gln Arg Gln Pro Asn Leu 305 310 315 320 Ser Arg Lys Ala Val Ala Ser Val Ile Ile Ile Ser Ser Gly Ser Asp 325 330 335 Thr Asp Glu Glu Pro Ser Ser Ala Val Ser Val Ile Val Ser Pro Ser 340 345 350 Ser Thr Lys Gly His Leu Pro Thr Gln Ser Pro Ser Thr Ser Ala His 355 360 365 Ser Ile Ser Ser Gly Ser Thr Thr Thr Ala Gly Ser Arg Cys Ser Asp 370 375 380 Pro Thr Arg Ile Leu Ala Ser Thr Pro Pro Leu Cys Gly Asn Gly Ala 385 390 395 400 Tyr Asn Trp Pro Trp Leu Asp 405 <210> 336 <211> 1221 <212> DNA <213> Human herpesvirus 8 <400> 336 atggcgatgt ttgtgaggac ctcgtctagc acacacgatg aagagagaat gcttccaatt 60 gaaggagcgc ctcgcagacg accccccgtg aagttcatat tcccacctcc acctctttca 120 tcacttccag gatttggcag gccgcgcggc tatgctggac ccacggtgat agatatgtct 180 gccccagacg acgtcttcgc cgaggacacg ccatcgccgc cagcaacccc tctggatcta 240 cagatatccc cggatcagtc gagcggcgaa tctgaatatg acgaggatga ggaagatgaa 300 gatgaagaag aaaatgacga tgttcaggag gaagacgagc cagaggggta ccctgcagac 360 ttttttcaac ctttatctca cttgcgcccg aggcctctgg ccagacgggc ccatacgccc 420 aaaccggtag cagtggtagc gggccgcgtg cgcagttcaa cggacacggc ggagtccgag 480 gcgtccatgg gatgggttag tcaggatgac ggattttccc ctgctgggct ctcaccttca 540 gacgacgagg gggttgctat cctggaaccg atggcggcat acactgggac cggggcatac 600 ggactttcac ctgcttccag aaatagtgta cctggaacac aaagttcacc atacagcgac 660 cctgatgaag ggccctcgtg gcgccccctg cgcgccgcac ccaccgcgat cgtcgacctg 720 acatcggact ctgatagcga tgacagttcc aactctccgg acgtgaacaa tgaggccgcg 780 tttaccgacg cgcgccattt ttcccaccag ccaccctcgt ccgaggagga cggagaagac 840 caaggggaag tattgagtca gagaatcggg ctcatggacg tgggccagaa gcgcaaaagg 900 cagtctaccg cctcctctgg tagcgaggat gtggtgcgct gccagagaca accaaactta 960 agccgcaaag cagtggcgtc tgtgataatt atatcctcgg ggagtgacac agacgaggag 1020 ccctcgtccg ccgtgagcgt gatcgtgtct ccgtcgagca caaagggtca cctcccaacc 1080 caatctccca gtacttccgc ccactcgatt tcatcaggaa gcacaactac cgcggggtcc 1140 aggtgcagcg acccaacccg catcctggcc tccacgccac ccctgtgtgg aaacggtgca 1200 tataactggc cgtggctgga c 1221 <210> 337 <211> 1221 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding KSHV ORF45 protein <400> 337 atggccatgt ttgtgcggac cagcagcagc acccacgacg aggaaagaat gctgcctatc 60 gagggcgctc ctcggagaag gcctcctgtg aagttcatct tcccacctcc accactgagc 120 agcctgcctg gatttggcag acctagaggc tacgccggac ctaccgtgat cgatatgagc 180 gcccctgacg atgtgttcgc cgaggataca ccttctccac cagccacacc tctggacctg 240 cagatcagcc ctgatcagtc tagcggcgag agcgagtacg atgaggacga agaggacgag 300 gatgaggaag agaacgacga cgtccaagag gaagatgagc ccgagggcta ccccgccgat 360 ttctttcagc ctctgtctca cctgaggcct cggcctcttg ctagaagggc ccacacacct 420 aaacctgtgg ctgtggtggc cggaagagtg cggtctagca cagatacagc cgagtccgaa 480 gccagcatgg gatgggtgtc acaggacgat ggattcagcc ctgccggact gagcccttcc 540 gatgatgaag gcgtggccat cctggaacct atggccgcct atactggcac aggcgcctat 600 ggactgtctc ccgccagcag aaatagcgtg ccaggcacac agagcagccc ctactctgat 660 cctgatgagg gcccatcttg gaggcccctt agagctgctc ctaccgccat cgtggatctg 720 accagcgaca gcgatagcga cgacagcagc aatagccccg acgtgaacaa tgaggccgcc 780 ttcacagacg cccggcactt ttctcatcag cctccaagca gcgaagagga tggcgaggat 840 cagggcgaag tgctgtctca gagaatcggc ctgatggacg tgggccagaa gcggaagaga 900 cagagcacag ccagcagcgg ctctgaggat gtcgtcagat gccagagaca gcccaacctg 960 agcagaaagg ccgtggccag cgtgatcatc atcagctctg gcagcgacac cgatgaggaa 1020 cctagctctg ccgtgtccgt gatcgtgtct cctagcagca ccaagggcca tctgcctaca 1080 cagagcccta gcacaagcgc ccactctatc tctagcggca gcacaacaac agccggcagc 1140 agatgcagcg accccacaag aattctggcc agcacacctc ctctgtgcgg caacggcgct 1200 tacaattggc cttggctgga t 1221 <210> 338 <211> 1221 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding KSHV ORF45 protein <400> 338 auggccaugu uugugcggac cagcagcagc acccacgacg aggaaagaau gcugccuauc 60 gagggcgcuc cucggagaag gccuccugug aaguucaucu ucccaccucc accacugagc 120 agccugccug gauuuggcag accuagaggc uacgccggac cuaccgugau cgauaugagc 180 gccccugacg auguguucgc cgaggauaca ccuucuccac cagccacacc ucuggaccug 240 cagaucagcc cugaucaguc uagcggcgag agcgaguacg augaggacga agaggacgag 300 gaugaggaag agaacgacga cguccaagag gaagaugagc ccgagggcua ccccgccgau 360 uucuuucagc cucugucuca ccugaggccu cggccucuug cuagaagggc ccacacaccu 420 aaaccugugg cugugguggc cggaagagug cggucuagca cagauacagc cgaguccgaa 480 gccagcaugg gauggguguc acaggacgau ggauucagcc cugccggacu gagcccuucc 540 gaugaugaag gcguggccau ccuggaaccu auggccgccu auacuggcac aggcgccuau 600 ggacugucuc ccgccagcag aaauagcgug ccaggcacac agagcagccc cuacucugau 660 ccugaugagg gcccaucuug gaggccccuu agagcugcuc cuaccgccau cguggaucug 720 accagcgaca gcgauagcga cgacagcagc aauagccccg acgugaacaa ugaggccgcc 780 uucacagacg cccggcacuu uucucaucag ccuccaagca gcgaagagga uggcgaggau 840 cagggcgaag ugcugucuca gagaaucggc cugauggacg ugggccagaa gcggaagaga 900 cagagcacag ccagcagcgg cucugaggau gucgucagau gccagagaca gcccaaccug 960 agcagaaagg ccguggccag cgugaucauc aucagcucug gcagcgacac cgaugaggaa 1020 ccuagcucug ccguguccgu gaucgugucu ccuagcagca ccaagggcca ucugccuaca 1080 cagagcccua gcacaagcgc ccacucuauc ucuagcggca gcacaacaac agccggcagc 1140 agaugcagcg accccacaag aauucuggcc agcacaccuc cucugugcgg caacggcgcu 1200 uacaauuggc cuuggcugga u 1221 <210> 339 <211> 245 <212> PRT <213> Epstein-Barr virus <400> 339 Met Met Asp Pro Asn Ser Thr Ser Glu Asp Val Lys Phe Thr Pro Asp 1 5 10 15 Pro Tyr Gln Val Pro Phe Val Gln Ala Phe Asp Gln Ala Thr Arg Val 20 25 30 Tyr Gln Asp Leu Gly Gly Pro Ser Gln Ala Pro Leu Pro Cys Val Leu 35 40 45 Trp Pro Val Leu Pro Glu Pro Leu Pro Gln Gly Gln Leu Thr Ala Tyr 50 55 60 His Val Ser Thr Ala Pro Thr Gly Ser Trp Phe Ser Ala Pro Gln Pro 65 70 75 80 Ala Pro Glu Asn Ala Tyr Gln Ala Tyr Ala Ala Pro Gln Leu Phe Pro 85 90 95 Val Ser Asp Ile Thr Gln Asn Gln Gln Thr Asn Gln Ala Gly Gly Glu 100 105 110 Ala Pro Gln Pro Gly Asp Asn Ser Thr Val Gln Thr Ala Ala Ala Val 115 120 125 Val Phe Ala Cys Pro Gly Ala Asn Gln Gly Gln Gln Leu Ala Asp Ile 130 135 140 Gly Val Pro Gln Pro Ala Pro Val Ala Ala Pro Ala Arg Arg Thr Arg 145 150 155 160 Lys Pro Gln Gln Pro Glu Ser Leu Glu Glu Cys Asp Ser Glu Leu Glu 165 170 175 Ile Lys Arg Tyr Lys Asn Arg Val Ala Ser Arg Lys Cys Arg Ala Lys 180 185 190 Phe Lys Gln Leu Leu Gln His Tyr Arg Glu Val Ala Ala Ala Lys Ser 195 200 205 Ser Glu Asn Asp Arg Leu Arg Leu Leu Leu Lys Gln Met Cys Pro Ser 210 215 220 Leu Asp Val Asp Ser Ile Ile Pro Arg Thr Pro Asp Val Leu His Glu 225 230 235 240 Asp Leu Leu Asn Phe 245 <210> 340 <211> 735 <212> DNA <213> Epstein-Barr virus <400> 340 atgatggacc caaactcgac ttctgaagat gtaaaattta cacctgaccc ataccaggtg 60 ccttttgtac aagcttttga ccaagctacc agagtctatc aggacctggg agggccatcg 120 caagctcctt tgccttgtgt gctgtggccg gtgctgccag agcctctgcc acaaggccag 180 ctaactgcct atcatgtttc aaccgctccg actgggtcgt ggttttctgc ccctcagcct 240 gctcctgaga atgcttatca agcttatgca gcacctcagc tgttcccagt ctccgacata 300 acccagaatc aacagactaa ccaagccggg ggagaagcac ctcaacctgg agacaattct 360 actgttcaaa cagcagcagc agtggtgttt gcttgccccg gggctaacca aggacaacag 420 ctagcagaca ttggtgttcc acagcctgca ccagtggctg ccccggcacg acgcacacgg 480 aaaccacaac agccagaatc gctggaggaa tgcgattctg aactagaaat aaagcgatac 540 aagaatcggg tggcttccag aaaatgccgg gccaagttta agcaactgct gcagcactac 600 cgtgaggtcg ctgctgccaa atcatctgaa aatgacaggc tgcgcctcct gttgaagcag 660 atgtgcccaa gcctggatgt tgactccatt atcccccgga caccagatgt tttacacgag 720 gatctcttaa atttc 735 <210> 341 <211> 735 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding EBV BZLF-1 protein <400> 341 atgatggacc ccaacagcac cagcgaggac gtgaagttca cccctgatcc ttaccaggtg 60 ccattcgtgc aggccttcga tcaggccacc agagtgtacc aggatctcgg cggaccttct 120 caggctcctc tgccttgtgt tctgtggcct gtgctgcctg aacctctgcc tcagggacag 180 ctgacagcct accatgtgtc tacagcccct accggcagct ggttttctgc tcctcaacct 240 gctcctgaga acgcctacca ggcctatgct gcccctcagc tgtttcccgt gtccgacatc 300 acccagaacc agcagacaaa tcaggctggc ggagaagctc ctcagcctgg cgataatagc 360 accgtgcaga cagctgccgc cgtggtgttt gcttgtcctg gcgctaatca gggccagcag 420 ctggctgata ttggcgtgcc acaaccagct ccagtggccg ctcctgccag aagaacaaga 480 aagcctcagc agcccgagag cctggaagag tgcgatagcg agctggaaat caagcggtac 540 aagaacagag tggccagccg gaagtgccgg gccaagttta aacagctgct ccagcactac 600 agagaggtgg ccgctgccaa gagcagcgag aacgatagac tgcggctgct gctgaagcag 660 atgtgcccta gcctggacgt ggacagcatc atccccagaa cacccgatgt gctgcacgag 720 gacctgctga acttt 735 <210> 342 <211> 735 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding EBV BZLF-1 <400> 342 augauggacc ccaacagcac cagcgaggac gugaaguuca ccccugaucc uuaccaggug 60 ccauucgugc aggccuucga ucaggccacc agaguguacc aggaucucgg cggaccuucu 120 caggcuccuc ugccuugugu ucuguggccu gugcugccug aaccucugcc ucagggacag 180 cugacagccu accauguguc uacagccccu accggcagcu gguuuucugc uccucaaccu 240 gcuccugaga acgccuacca ggccuaugcu gccccucagc uguuucccgu guccgacauc 300 acccagaacc agcagacaaa ucaggcuggc ggagaagcuc cucagccugg cgauaauagc 360 accgugcaga cagcugccgc cgugguguuu gcuuguccug gcgcuaauca gggccagcag 420 cuggcugaua uuggcgugcc acaaccagcu ccaguggccg cuccugccag aagaacaaga 480 aagccucagc agcccgagag ccuggaagag ugcgauagcg agcuggaaau caagcgguac 540 aagaacagag uggccagccg gaagugccgg gccaaguuua aacagcugcu ccagcacuac 600 agagaggugg ccgcugccaa gagcagcgag aacgauagac ugcggcugcu gcugaagcag 660 augugcccua gccuggacgu ggacagcauc auccccagaa cacccgaugu gcugcacgag 720 gaccugcuga acuuu 735 <210> 343 <211> 314 <212> PRT <213> Murine herpesvirus 4 <400> 343 Met Pro Thr Ser Pro Pro Thr Thr Arg Asn Thr Thr Ser Gly Lys Thr 1 5 10 15 Arg Ser Gly Cys Lys Arg Arg Cys Phe Asn Lys Pro Ala Ala Met Pro 20 25 30 Pro Lys Arg Arg Arg Ala Pro Lys Arg Pro Ala Pro Pro Pro Pro Pro 35 40 45 Gly Cys Gln Gly Asp Glu Glu Ser Ser Gln Gly Thr Gln Thr Pro Asn 50 55 60 Pro Pro Ser Pro Pro Val Pro Pro Ser Ser Pro Thr Leu Pro Ser Ser 65 70 75 80 Pro Val Pro Pro Ser Ser Pro Val His Glu Pro Pro Ser Pro Ser Pro 85 90 95 Pro Pro Ala Pro Pro Ser Pro Asp Val Asp Val Glu Gly Leu Asp Val 100 105 110 Gly Glu Thr Asp Asp Pro Gly Pro Pro Pro Pro Lys Arg Tyr Ser Arg 115 120 125 Tyr Gln Lys Pro His Asn Pro Ser Asp Pro Leu Pro Lys Lys Tyr Gln 130 135 140 Gly Met Arg Arg His Leu Gln Val Thr Ala Pro Arg Leu Phe Asp Pro 145 150 155 160 Glu Gly His Pro Pro Thr His Phe Lys Ser Ala Val Met Phe Ser Ser 165 170 175 Thr His Pro Tyr Thr Leu Asn Lys Leu His Lys Cys Ile Gln Ser Lys 180 185 190 His Val Leu Ser Thr Pro Val Ser Cys Leu Pro Leu Val Pro Gly Thr 195 200 205 Thr Gln Gln Cys Val Thr Tyr Tyr Leu Leu Ser Phe Val Glu Asp Lys 210 215 220 Lys Gln Ala Lys Lys Leu Lys Arg Val Val Leu Ala Tyr Cys Glu Lys 225 230 235 240 Tyr His Ser Ser Val Glu Gly Thr Ile Val Lys Ala Lys Pro Tyr Phe 245 250 255 Pro Leu Pro Glu Pro Pro Thr Glu Pro Pro Thr Asp Pro Glu Gln Pro 260 265 270 Ser Thr Ser Thr Gln Ala Ser Gly Thr Gln His Gly Pro Thr Ala Ser 275 280 285 Leu Asp Ala Gly Ala Glu Gln Gly Ala Thr Gly Ser Pro Gly Ser Ser 290 295 300 Pro Gly Gln Gln Gly Gln Gly Ser Gln Thr 305 310 <210> 344 <211> 942 <212> DNA <213> Murine herpesvirus 4 <400> 344 atgcccacat ccccaccgac tacacgcaac acaacctcag gcaaaaccag atcagggtgc 60 aaacgtaggt gcttcaacaa accagcagcc atgcctccta aaagacgccg cgctccaaaa 120 agaccagccc ctcctccacc accgggatgc caaggtgatg aggagtccag ccagggaact 180 caaacgccaa accccccatc accaccagtg cccccttcat caccaacact tccctcatcc 240 cccgtccctc cttcatcacc agtacatgag ccaccatctc cttccccccc accagcccca 300 ccatcaccag atgttgatgt tgaaggttta gatgtaggag agacagacga tcccggtccc 360 cctccaccaa aaagatactc caggtatcaa aaaccgcata atccatctga tccattgcct 420 aaaaaatatc agggaatgcg aagacacctg caggtgacag cacccaggtt atttgatccc 480 gagggtcacc ccccaacaca ttttaagtca gctgttatgt ttagtagcac acatccctac 540 actttgaata aacttcacaa gtgtatccaa agcaaacatg tactctcaac accagttagc 600 tgtttaccct tggtaccagg cacaacacaa cagtgtgtaa catactattt actttcattt 660 gttgaagaca agaaacaggc caaaaaacta aaaagggttg tcttggccta ctgtgaaaaa 720 taccacagca gcgtagaagg tactatagtc aaggcaaagc cttattttcc cttaccagag 780 ccccctacag agccccctac agaccccgag cagccatcca caagtacaca agcttctggc 840 acacaacatg gtcccacagc atctctggat gccggtgcag agcaaggtgc cacaggatca 900 cctggatcta gtccaggaca acagggacaa gggtctcaga ca 942 <210> 345 <211> 942 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding MuHV Orf73 protein <400> 345 atgcctacaa gccctcctac caccagaaac accaccagcg gcaagacaag aagcggctgc 60 aagcggcggt gcttcaacaa acctgctgcc atgcctccta agcggcggag agcacctaaa 120 agacctgctc ctcctccacc tcctggttgc caaggcgacg aggaatcttc tcagggcacc 180 cagacaccta atcctccatc tccacctgtg cctccaagca gccctacact gccatcttct 240 ccagtgccac ctagcagccc agtgcacgaa ccacctagtc caagtcctcc accagctcca 300 ccttctccag acgtggacgt ggaaggactg gatgtgggcg agacagacga tcctggacct 360 ccaccaccta agcggtacag cagataccag aagcctcaca accccagcga tcctctgcct 420 aagaaatacc agggcatgcg ccggcatctg caagtgacag cccctagact gttcgaccct 480 gagggacacc ctcctacaca cttcaagagc gccgtgatgt tcagcagcac acacccctac 540 actctgaaca agctgcacaa gtgcatccag agcaaacacg tgctgagcac ccctgtgtcc 600 tgtctgcctc tggtgcctgg aaccacacag cagtgcgtga cctactacct gctgagcttc 660 gtggaagata agaagcaggc caagaaactg aagagagtgg tgctggccta ctgcgagaag 720 taccacagca gcgtggaagg caccatcgtg aaggccaagc cttacttccc actgcctgag 780 cctccaaccg agccacctac agatcctgag cagcctagca caagcacaca ggcctctgga 840 acacagcacg gacctacagc tagtctggat gctggtgctg aacagggcgc cacaggatca 900 cctggaagta gccctggaca gcaaggccag ggatctcaga ca 942 <210> 346 <211> 942 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding MuHV Orf73 protein <400> 346 augccuacaa gcccuccuac caccagaaac accaccagcg gcaagacaag aagcggcugc 60 aagcggcggu gcuucaacaa accugcugcc augccuccua agcggcggag agcaccuaaa 120 agaccugcuc cuccuccacc uccugguugc caaggcgacg aggaaucuuc ucagggcacc 180 cagacaccua auccuccauc uccaccugug ccuccaagca gcccuacacu gccaucuucu 240 ccagugccac cuagcagccc agugcacgaa ccaccuaguc caaguccucc accagcucca 300 ccuucuccag acguggacgu ggaaggacug gaugugggcg agacagacga uccuggaccu 360 ccaccaccua agcgguacag cagauaccag aagccucaca accccagcga uccucugccu 420 aagaaauacc agggcaugcg ccggcaucug caagugacag ccccuagacu guucgacccu 480 gagggacacc cuccuacaca cuucaagagc gccgugaugu ucagcagcac acaccccuac 540 acucugaaca agcugcacaa gugcauccag agcaaacacg ugcugagcac cccugugucc 600 ugucugccuc uggugccugg aaccacacag cagugcguga ccuacuaccu gcugagcuuc 660 guggaagaua agaagcaggc caagaaacug aagagagugg ugcuggccua cugcgagaag 720 uaccacagca gcguggaagg caccaucgug aaggccaagc cuuacuuccc acugccugag 780 ccuccaaccg agccaccuac agauccugag cagccuagca caagcacaca ggccucugga 840 acacagcacg gaccuacagc uagucuggau gcuggugcug aacagggcgc cacaggauca 900 ccuggaagua gcccuggaca gcaaggccag ggaucucaga ca 942 <210> 347 <211> 117 <212> PRT <213> Torque Teno virus <400> 347 Met Trp Gln Pro Pro Thr Gln Asn Gly Thr Gln Leu Glu Arg His Trp 1 5 10 15 Phe Glu Ser Val Trp Arg Ser His Ala Ala Phe Cys Ser Cys Gly Asp 20 25 30 Cys Ile Gly His Leu Gln His Leu Ala Thr Asn Leu Gly Arg Pro Pro 35 40 45 Ala Pro Gln Pro Pro Arg Asp Gln His Pro Pro His Ile Arg Gly Leu 50 55 60 Pro Ala Leu Pro Ala Pro Pro Ser Asn Arg Asn Ser Trp Pro Gly Thr 65 70 75 80 Gly Gly Asp Ala Ala Gly Gly Glu Ala Gly Gly Ser Arg Gly Ala Gly 85 90 95 Asp Gly Gly Asp Gly Glu Leu Ala Asp Glu Asp Leu Leu Asp Ala Ile 100 105 110 Ala Leu Ala Ala Glu 115 <210> 348 <211> 351 <212> DNA <213> Torque Teno virus <400> 348 atgtggcagc cacctaccca gaatggaacc caactcgaac ggcactggtt cgagtccgtt 60 tggcgttcgc atgctgcctt ttgtagctgt ggcgactgta ttggccatct tcagcatctg 120 gctactaacc tgggtcgacc acctgctcca caaccgccgc gagaccaaca cccaccgcac 180 ataagagggc tcccggcact cccggcacct cccagtaaca gaaactcatg gcctggtact 240 ggtggagacg ccgccggagg agaggctggt ggaagccgag gcgcaggaga tggaggagac 300 ggagagctcg cagacgagga cctgctagac gccatcgcgc tcgccgcaga g 351 <210> 349 <211> 351 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding Torque Teno virus Orf2 protein <400> 349 atgtggcagc ctcctacaca gaatggcacc cagctggaac ggcattggtt cgagagcgtt 60 tggagaagcc acgccgcttt ctgcagctgc ggagattgca tcggacatct gcagcacctg 120 gccaccaatc tgggtagacc tccagctcct cagcctcctc gagatcagca ccctcctcac 180 atcagaggac tgcctgcact tcctgctcct ccaagcaaca gaaacagctg gcctggcaca 240 ggcggagatg ctgctggcgg agaagctggt ggatctagag gtgccggcga cggtggcgac 300 ggcgaacttg ctgatgaaga tctgctggac gctatcgccc tggccgctga a 351 <210> 350 <211> 351 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding Torque Teno virus Orf2 protein <400> 350 auguggcagc cuccuacaca gaauggcacc cagcuggaac ggcauugguu cgagagcguu 60 uggagaagcc acgccgcuuu cugcagcugc ggagauugca ucggacaucu gcagcaccug 120 gccaccaauc uggguagacc uccagcuccu cagccuccuc gagaucagca cccuccucac 180 aucagaggac ugccugcacu uccugcuccu ccaagcaaca gaaacagcug gccuggcaca 240 ggcggagaug cugcuggcgg agaagcuggu ggaucuagag gugccggcga cgguggcgac 300 ggcgaacuug cugaugaaga ucugcuggac gcuaucgccc uggccgcuga a 351 <210> 351 <211> 641 <212> PRT <213> Epstein-Barr virus <400> 351 Met Ser Asp Glu Gly Pro Gly Thr Gly Pro Gly Asn Gly Leu Gly Glu 1 5 10 15 Lys Gly Asp Thr Ser Gly Pro Glu Gly Ser Gly Gly Ser Gly Pro Gln 20 25 30 Arg Arg Gly Gly Asp Asn His Gly Arg Gly Arg Gly Arg Gly Arg Gly 35 40 45 Arg Gly Gly Gly Arg Pro Gly Ala Pro Gly Gly Ser Gly Ser Gly Pro 50 55 60 Arg His Arg Asp Gly Val Arg Arg Pro Gln Lys Arg Pro Ser Cys Ile 65 70 75 80 Gly Cys Lys Gly Thr His Gly Gly Thr Gly Ala Gly Ala Gly Ala Gly 85 90 95 Gly Ala Gly Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala Gly Ala Gly 100 105 110 Gly Gly Ala Gly Gly Ala Gly Gly Ala Gly Gly Ala Gly Ala Gly Gly 115 120 125 Gly Ala Gly Ala Gly Gly Gly Ala Gly Gly Ala Gly Gly Ala Gly Ala 130 135 140 Gly Gly Gly Ala Gly Ala Gly Gly Gly Ala Gly Gly Ala Gly Ala Gly 145 150 155 160 Gly Gly Ala Gly Gly Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala Gly 165 170 175 Ala Gly Gly Gly Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala Gly Gly 180 185 190 Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala Gly Ala Gly Gly Ala Gly 195 200 205 Gly Ala Gly Gly Ala Gly Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala 210 215 220 Gly Gly Ala Gly Gly Ala Gly Ala Gly Gly Ala Gly Ala Gly Gly Ala 225 230 235 240 Gly Ala Gly Gly Ala Gly Ala Gly Gly Ala Gly Gly Ala Gly Ala Gly 245 250 255 Gly Ala Gly Gly Ala Gly Ala Gly Gly Ala Gly Gly Ala Gly Ala Gly 260 265 270 Gly Gly Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala Gly Gly Ala Gly 275 280 285 Ala Gly Gly Ala Gly Gly Ala Gly Ala Gly Gly Ala Gly Gly Ala Gly 290 295 300 Ala Gly Gly Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala Gly Ala Gly 305 310 315 320 Gly Ala Gly Ala Gly Gly Gly Gly Arg Gly Arg Gly Gly Ser Gly Gly 325 330 335 Arg Gly Arg Gly Gly Ser Gly Gly Arg Gly Arg Gly Gly Ser Gly Gly 340 345 350 Arg Arg Gly Arg Gly Arg Glu Arg Ala Arg Gly Gly Ser Arg Glu Arg 355 360 365 Ala Arg Gly Arg Gly Arg Gly Arg Gly Glu Lys Arg Pro Arg Ser Pro 370 375 380 Ser Ser Gln Ser Ser Ser Ser Gly Ser Pro Pro Arg Arg Pro Pro Pro 385 390 395 400 Gly Arg Arg Pro Phe Phe His Pro Val Gly Glu Ala Asp Tyr Phe Glu 405 410 415 Tyr His Gln Glu Gly Gly Pro Asp Gly Glu Pro Asp Val Pro Pro Gly 420 425 430 Ala Ile Glu Gln Gly Pro Ala Asp Asp Pro Gly Glu Gly Pro Ser Thr 435 440 445 Gly Pro Arg Gly Gln Gly Asp Gly Gly Arg Arg Lys Lys Gly Gly Trp 450 455 460 Phe Gly Lys His Arg Gly Gln Gly Gly Ser Asn Pro Lys Phe Glu Asn 465 470 475 480 Ile Ala Glu Gly Leu Arg Ala Leu Leu Ala Arg Ser His Val Glu Arg 485 490 495 Thr Thr Asp Glu Gly Thr Trp Val Ala Gly Val Phe Val Tyr Gly Gly 500 505 510 Ser Lys Thr Ser Leu Tyr Asn Leu Arg Arg Gly Thr Ala Leu Ala Ile 515 520 525 Pro Gln Cys Arg Leu Thr Pro Leu Ser Arg Leu Pro Phe Gly Met Ala 530 535 540 Pro Gly Pro Gly Pro Gln Pro Gly Pro Leu Arg Glu Ser Ile Val Cys 545 550 555 560 Tyr Phe Met Val Phe Leu Gln Thr His Ile Phe Ala Glu Val Leu Lys 565 570 575 Asp Ala Ile Lys Asp Leu Val Met Thr Lys Pro Ala Pro Thr Cys Asn 580 585 590 Ile Arg Val Thr Val Cys Ser Phe Asp Asp Gly Val Asp Leu Pro Pro 595 600 605 Trp Phe Pro Pro Met Val Glu Gly Ala Ala Ala Glu Gly Asp Asp Gly 610 615 620 Asp Asp Gly Asp Glu Gly Gly Asp Gly Asp Glu Gly Glu Glu Gly Gln 625 630 635 640 Glu <210> 352 <211> 1926 <212> DNA <213> Epstein-Barr virus <400> 352 atgtctgacg aggggccagg tacaggacct ggaaatggcc taggagagaa gggagacaca 60 tctggaccag aaggctccgg cggcagtgga cctcaaagaa gagggggtga taaccatgga 120 cgaggacggg gaagaggacg aggacgagga ggcggaagac caggagcccc gggcggctca 180 ggatcagggc caagacatag agatggtgtc cggagacccc aaaaacgtcc aagttgcatt 240 ggctgcaaag ggacccacgg tggaacagga gcaggagcag gagcgggagg ggcaggagca 300 ggaggggcag gagcaggagg aggggcagga gcaggaggag gggcaggagg ggcaggaggg 360 gcaggagggg caggagcagg aggaggggca ggagcaggag gaggggcagg aggggcagga 420 ggggcaggag caggaggagg ggcaggagca ggaggagggg caggaggggc aggagcagga 480 ggaggggcag gaggggcagg aggggcagga gcaggaggag gggcaggagc aggaggaggg 540 gcaggagggg caggagcagg aggaggggca ggaggggcag gaggggcagg agcaggagga 600 ggggcaggag caggaggggc aggaggggca ggaggggcag gagcaggagg ggcaggagca 660 ggaggagggg caggaggggc aggaggggca ggagcaggag gggcaggagc aggaggggca 720 ggagcaggag gggcaggagc aggaggggca ggaggggcag gagcaggagg ggcaggaggg 780 gcaggagcag gaggggcagg aggggcagga gcaggaggag gggcaggagg ggcaggagca 840 ggaggagggg caggaggggc aggagcagga ggggcaggag gggcaggagc aggaggggca 900 ggaggggcag gagcaggagg ggcaggaggg gcaggagcag gaggaggggc aggagcagga 960 ggggcaggag caggaggtgg aggccggggt cgaggaggca gtggaggccg gggtcgagga 1020 ggtagtggag gccggggtcg aggaggtagt ggaggccgcc ggggtagagg acgtgaaaga 1080 gccagggggg gaagtcgtga aagagccagg gggagaggtc gtggacgtgg agaaaagagg 1140 cccaggagtc ccagtagtca gtcatcatca tccgggtctc caccgcgcag gccccctcca 1200 ggtagaaggc catttttcca ccctgtaggg gaagccgatt attttgaata ccaccaagaa 1260 ggtggcccag atggtgagcc tgacgtgccc ccgggagcga tagagcaggg ccccgcagat 1320 gacccaggag aaggcccaag cactggaccc cggggtcagg gtgatggagg caggcgcaaa 1380 aaaggagggt ggtttggaaa gcatcgtggt caaggaggtt ccaacccgaa atttgagaac 1440 attgcagaag gtttaagagc tctcctggct aggagtcacg tagaaaggac taccgacgaa 1500 ggaacttggg tcgccggtgt gttcgtatat ggaggtagta agacctccct ttacaaccta 1560 aggcgaggaa ctgcccttgc tattccacaa tgtcgtctta caccattgag tcgtctcccc 1620 tttggaatgg cccctggacc cggcccacaa cctggcccgc taagggagtc cattgtctgt 1680 tatttcatgg tctttttaca aactcatata tttgctgagg ttttgaagga tgcgattaag 1740 gaccttgtta tgacaaagcc cgctcctacc tgcaatatca gggtgactgt gtgcagcttt 1800 gacgatggag tagatttgcc tccctggttt ccacctatgg tggaaggggc tgccgcggag 1860 ggtgatgacg gagatgacgg agatgaagga ggtgatggag atgagggtga ggaagggcag 1920 gagtga 1926 <210> 353 <211> 1926 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding EBV EBNA1 protein <400> 353 atgtccgatg aaggccctgg aacaggccct ggcaatggac tgggagagaa gggcgataca 60 agcggccctg aaggttctgg cggatctggc cctcaaagaa gaggcggcga taatcacggc 120 agaggacgcg gaagaggtag aggcagaggc ggaggtagac ctggtgctcc tggtggttct 180 ggctctggcc ctagacatag agatggcgtc agacggcctc agaagaggcc ttcttgtatc 240 ggctgcaagg gcacacatgg cggaacaggt gctggtgctg gcgcaggcgg agcaggcgct 300 ggtggtgcag gcgctggcgg cggtgccggt gcaggcggcg gagctggtgg cgctggcggt 360 gctggcggag ctggtgcagg cggaggtgcc ggcgctggtg gcggagcagg cggagctggc 420 ggagccggcg ctggcggtgg cgctggtgcc ggcggaggcg caggcggcgc tggtgctggt 480 ggtggtgctg gcggcgcagg cggtgcaggc gcaggcggag gcgctggcgc tggcggtggt 540 gcaggcggtg ctggcgctgg cggcggtgct ggcggagccg gtggtgctgg tgctggtggc 600 ggagctggcg ctggcggagc tggcggtgca ggcggcgcag gcgctggtgg cgctggcgca 660 ggcggtggcg ctggcggagc aggcggagct ggcgctggcg gcgcaggcgc aggcggagcc 720 ggtgctggcg gagctggtgc tggtggtgca ggcggagctg gtgccggtgg cgctggtggt 780 gccggtgccg gtggtgccgg cggagccggc gcaggcggcg gtgcaggcgg agcaggcgca 840 ggcggcggag ctggtggtgc cggcgcaggc ggcgctggtg gtgctggtgc cggcggagct 900 ggtggcgcag gcgctggcgg tgcaggcggt gccggtgccg gtggtggtgc aggcgcaggc 960 ggtgctggtg ccggcggtgg cggaagagga agaggtggta gcggaggccg aggacgaggc 1020 ggaagtggtg gtcgtggtag aggcggcagc ggaggaagaa gaggacgggg tagagaacga 1080 gctagaggcg gatctagaga gagagcccga ggcagaggaa gaggccgcgg agagaaaaga 1140 cctagaagcc ctagcagcca gagcagctct agcggatctc cacctagaag gccacctcca 1200 ggcagacggc cattctttca ccctgtgggc gaagccgact acttcgagta ccaccaagaa 1260 ggcggacctg acggcgaacc tgatgttcct cctggcgcca ttgaacaggg cccagctgat 1320 gatcctggcg agggaccttc tacaggccct agaggacaag gcgacggcgg cagacgaaag 1380 aaaggcggat ggttcggcaa gcacagaggc caaggtggca gcaaccccaa gttcgagaat 1440 atcgccgagg gcctgagagc cctgctggcc agatctcacg tggaaagaac caccgacgaa 1500 ggcacatggg tggcaggcgt gttcgtttac ggcggctcta agaccagcct gtacaacctg 1560 agaagaggca cagccctggc cattcctcag tgcagactga cccctctgag cagactgcct 1620 tttggcatgg ctcctggacc tggacctcaa cctggaccac tgagagaatc catcgtgtgc 1680 tacttcatgg tgtttctgca gacccacatc ttcgccgagg tgctgaagga cgccatcaag 1740 gacctggtca tgacaaagcc cgctcctacc tgcaacatca gagtgaccgt gtgcagcttc 1800 gacgacggcg ttgacctgcc tccttggttt cctccaatgg tggaaggcgc tgctgccgaa 1860 ggcgacgatg gcgacgacgg cgacgaaggt ggcgacggcg acgagggcga agaaggacaa 1920 gagtaa 1926 <210> 354 <211> 1926 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding EBV EBNA1 protein <400> 354 auguccgaug aaggcccugg aacaggcccu ggcaauggac ugggagagaa gggcgauaca 60 agcggcccug aagguucugg cggaucuggc ccucaaagaa gaggcggcga uaaucacggc 120 agaggacgcg gaagagguag aggcagaggc ggagguagac cuggugcucc uggugguucu 180 ggcucuggcc cuagacauag agauggcguc agacggccuc agaagaggcc uucuuguauc 240 ggcugcaagg gcacacaugg cggaacaggu gcuggugcug gcgcaggcgg agcaggcgcu 300 gguggugcag gcgcuggcgg cggugccggu gcaggcggcg gagcuggugg cgcuggcggu 360 gcuggcggag cuggugcagg cggaggugcc ggcgcuggug gcggagcagg cggagcuggc 420 ggagccggcg cuggcggugg cgcuggugcc ggcggaggcg caggcggcgc uggugcuggu 480 gguggugcug gcggcgcagg cggugcaggc gcaggcggag gcgcuggcgc uggcgguggu 540 gcaggcggug cuggcgcugg cggcggugcu ggcggagccg guggugcugg ugcugguggc 600 ggagcuggcg cuggcggagc uggcggugca ggcggcgcag gcgcuggugg cgcuggcgca 660 ggcgguggcg cuggcggagc aggcggagcu ggcgcuggcg gcgcaggcgc aggcggagcc 720 ggugcuggcg gagcuggugc ugguggugca ggcggagcug gugccggugg cgcugguggu 780 gccggugccg guggugccgg cggagccggc gcaggcggcg gugcaggcgg agcaggcgca 840 ggcggcggag cugguggugc cggcgcaggc ggcgcuggug gugcuggugc cggcggagcu 900 gguggcgcag gcgcuggcgg ugcaggcggu gccggugccg gugguggugc aggcgcaggc 960 ggugcuggug ccggcggugg cggaagagga agagguggua gcggaggccg aggacgaggc 1020 ggaaguggug gucgugguag aggcggcagc ggaggaagaa gaggacgggg uagagaacga 1080 gcuagaggcg gaucuagaga gagagcccga ggcagaggaa gaggccgcgg agagaaaaga 1140 ccuagaagcc cuagcagcca gagcagcucu agcggaucuc caccuagaag gccaccucca 1200 ggcagacggc cauucuuuca cccugugggc gaagccgacu acuucgagua ccaccaagaa 1260 ggcggaccug acggcgaacc ugauguuccu ccuggcgcca uugaacaggg cccagcugau 1320 gauccuggcg agggaccuuc uacaggcccu agaggacaag gcgacggcgg cagacgaaag 1380 aaaggcggau gguucggcaa gcacagaggc caagguggca gcaaccccaa guucgagaau 1440 aucgccgagg gccugagagc ccugcuggcc agaucucacg uggaaagaac caccgacgaa 1500 ggcacauggg uggcaggcgu guucguuuac ggcggcucua agaccagccu guacaaccug 1560 agaagaggca cagcccuggc cauuccucag ugcagacuga ccccucugag cagacugccu 1620 uuuggcaugg cuccuggacc uggaccucaa ccuggaccac ugagagaauc caucgugugc 1680 uacuucaugg uguuucugca gacccacauc uucgccgagg ugcugaagga cgccaucaag 1740 gaccugguca ugacaaagcc cgcuccuacc ugcaacauca gagugaccgu gugcagcuuc 1800 gacgacggcg uugaccugcc uccuugguuu ccuccaaugg uggaaggcgc ugcugccgaa 1860 ggcgacgaug gcgacgacgg cgacgaaggu ggcgacggcg acgagggcga agaaggacaa 1920 gaguaa 1926 <210> 355 <211> 201 <212> PRT <213> Borna disease virus <400> 355 Met Ala Thr Arg Pro Ser Ser Leu Val Asp Ser Leu Glu Asp Glu Glu 1 5 10 15 Asp Pro Gln Thr Leu Arg Arg Glu Arg Pro Gly Ser Pro Arg Pro Arg 20 25 30 Lys Val Pro Arg Asn Ala Leu Thr Gln Pro Val Asp Gln Leu Leu Lys 35 40 45 Asp Leu Arg Lys Asn Pro Ser Met Ile Ser Asp Pro Asp Gln Arg Thr 50 55 60 Gly Arg Glu Gln Leu Ser Asn Asp Glu Leu Ile Lys Lys Leu Val Thr 65 70 75 80 Glu Leu Ala Glu Asn Ser Met Ile Glu Ala Glu Glu Val Arg Gly Thr 85 90 95 Leu Gly Asp Ile Ser Ala Arg Ile Glu Ala Gly Phe Glu Ser Leu Ser 100 105 110 Ala Leu Gln Val Glu Thr Ile Gln Thr Ala Gln Arg Cys Asp His Ser 115 120 125 Asp Ser Ile Arg Ile Leu Gly Glu Asn Ile Lys Ile Leu Asp Arg Ser 130 135 140 Met Lys Thr Met Met Glu Thr Met Lys Leu Met Met Glu Lys Val Asp 145 150 155 160 Leu Leu Tyr Ala Ser Thr Ala Val Gly Thr Ser Ala Pro Met Leu Pro 165 170 175 Ser His Pro Ala Pro Pro Arg Ile Tyr Pro Gln Leu Pro Ser Ala Pro 180 185 190 Thr Thr Asp Glu Trp Asp Ile Ile Pro 195 200 <210> 356 <211> 603 <212> DNA <213> Borna disease virus <400> 356 atggcaacgc gaccatcgag tctggtcgac tccctggagg acgaagaaga tccccagaca 60 ctacgacggg aacgaccggg gtcaccaaga ccacggaagg tcccaaggaa tgcattgacc 120 caaccagtag accagctcct gaaggacctc aggaagaacc cctccatgat ctcagaccca 180 gaccagcgaa ccggaaggga gcagctgtcg aatgatgagc taatcaagaa gttagtgacg 240 gagctggccg agaatagcat gatcgaggct gaggaggtgc ggggcactct tggagacatc 300 tcggctcgta tcgaggcagg gtttgagtcc ctgtccgccc tccaagtgga aaccatccag 360 acagctcagc ggtgcgatca ctccgacagc atcaggatcc tcggcgagaa catcaagata 420 ctagatcgct ccatgaagac aatgatggag acaatgaagc tcatgatgga gaaggtggat 480 ctcctctacg catcaaccgc cgttgggacc tctgcaccca tgttgccctc ccatcctgca 540 cctccgcgca tttatcccca gctcccaagt gccccgacaa cggatgaatg ggacatcata 600 cca 603 <210> 357 <211> 603 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding BDV P protein <400> 357 atggccacaa gacctagcag cctggtggac agcctggaag atgaggaaga tccccagaca 60 ctgcggagag agaggcctgg atctcccaga cctagaaagg tgcccagaaa cgccctgaca 120 cagcccgttg atcagctgct gaaggacctg agaaagaacc ccagcatgat cagcgacccc 180 gaccagagaa ccggaagaga gcagctgtct aacgacgagc tgattaagaa gctggtcacc 240 gagctggccg agaactccat gattgaggcc gaagaagtgc ggggcaccct gggcgatatc 300 tctgccagaa tcgaggccgg ctttgagtct ctgagcgccc tgcaggttga gacaatccag 360 acagcccaga gatgcgacca cagcgacagc atcagaatcc tgggcgagaa catcaagatc 420 ctggatcgga gcatgaagac catgatggaa accatgaagc tgatgatgga aaaggtggac 480 ctgctgtacg ccagcacagc cgtgggaaca tctgctccca tgctgccttc tcaccccgct 540 cctccaagaa tctaccctca gctgcctagc gctcccacca ccgatgagtg ggatatcatc 600 cct 603 <210> 358 <211> 603 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding BDV P protein <400> 358 auggccacaa gaccuagcag ccugguggac agccuggaag augaggaaga uccccagaca 60 cugcggagag agaggccugg aucucccaga ccuagaaagg ugcccagaaa cgcccugaca 120 cagcccguug aucagcugcu gaaggaccug agaaagaacc ccagcaugau cagcgacccc 180 gaccagagaa ccggaagaga gcagcugucu aacgacgagc ugauuaagaa gcuggucacc 240 gagcuggccg agaacuccau gauugaggcc gaagaagugc ggggcacccu gggcgauauc 300 ucugccagaa ucgaggccgg cuuugagucu cugagcgccc ugcagguuga gacaauccag 360 acagcccaga gaugcgacca cagcgacagc aucagaaucc ugggcgagaa caucaagauc 420 cuggaucgga gcaugaagac caugauggaa accaugaagc ugaugaugga aaagguggac 480 cugcuguacg ccagcacagc cgugggaaca ucugcuccca ugcugccuuc ucaccccgcu 540 ccuccaagaa ucuacccuca gcugccuagc gcucccacca ccgaugagug ggauaucauc 600 ccu 603 <210> 359 <211> 98 <212> PRT <213> Human papillomavirus type 16 <400> 359 Met His Gly Asp Thr Pro Thr Leu His Glu Tyr Met Leu Asp Leu Gln 1 5 10 15 Pro Glu Thr Thr Asp Leu Tyr Cys Tyr Glu Gln Leu Asn Asp Ser Ser 20 25 30 Glu Glu Glu Asp Glu Ile Asp Gly Pro Ala Gly Gln Ala Glu Pro Asp 35 40 45 Arg Ala His Tyr Asn Ile Val Thr Phe Cys Cys Lys Cys Asp Ser Thr 50 55 60 Leu Arg Leu Cys Val Gln Ser Thr His Val Asp Ile Arg Thr Leu Glu 65 70 75 80 Asp Leu Leu Met Gly Thr Leu Gly Ile Val Cys Pro Ile Cys Ser Gln 85 90 95 Lys Pro <210> 360 <211> 294 <212> DNA <213> Human papillomavirus type 16 <400> 360 atgcatggag atacacctac attgcatgaa tatatgttag atttgcaacc agagacaact 60 gatctctact gttatgagca attaaatgac agctcagagg aggaggatga aatagatggt 120 ccagctggac aagcagaacc ggacagagcc cattacaata ttgtaacctt ttgttgcaag 180 tgtgactcta cgcttcggtt gtgcgtacaa agcacacacg tagacattcg tactttggaa 240 gacctgttaa tgggcacact aggaattgtg tgccccatct gttctcagaa acca 294 <210> 361 <211> 294 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding HPV E7 protein <400> 361 atgcacggcg atacccctac actgcacgag tacatgctgg acctgcagcc tgagacaacc 60 gacctgtact gctacgagca gctgaacgac agcagcgagg aagaggacga gattgacgga 120 cctgccggac aggccgaacc tgatagagcc cactacaata tcgtgacctt ctgctgcaag 180 tgcgacagca ccctgagact gtgtgtgcag agcacccacg tggacatcag aaccctggaa 240 gatctgctga tgggcaccct gggcatcgtg tgccctatct gttctcagaa gccc 294 <210> 362 <211> 294 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding HPV E7 protein <400> 362 augcacggcg auaccccuac acugcacgag uacaugcugg accugcagcc ugagacaacc 60 gaccuguacu gcuacgagca gcugaacgac agcagcgagg aagaggacga gauugacgga 120 ccugccggac aggccgaacc ugauagagcc cacuacaaua ucgugaccuu cugcugcaag 180 ugcgacagca cccugagacu gugugugcag agcacccacg uggacaucag aacccuggaa 240 gaucugcuga ugggcacccu gggcaucgug ugcccuaucu guucucagaa gccc 294 <210> 363 <211> 567 <212> PRT <213> Arenavirus <400> 363 Met Ser Asn Ser Lys Glu Val Lys Ser Phe Leu Trp Thr Gln Ala Leu 1 5 10 15 Arg Arg Glu Leu Ser Pro Tyr Cys Thr Ser Val Lys Leu Gln Val Ile 20 25 30 Lys Asp Ala Gln Ser Leu Leu His Ser Leu Asp Phe Ser Glu Val Ser 35 40 45 Asn Val Gln Arg Leu Met Arg Lys Asp Lys Arg Asp Asp Gly Asp Leu 50 55 60 Lys Arg Leu Arg Asp Leu Asn Gln Ala Val Asn Asn Leu Val Glu Leu 65 70 75 80 Lys Ser Gln Gln Gln Lys Asn Val Leu Ser Val Gly Gln Leu Ser Ser 85 90 95 Asp Asp Leu Leu Val Leu Ala Ala Asp Ile Asp Arg Leu Lys Ala Lys 100 105 110 Ile Thr Arg Thr Glu Arg Pro Gln Ser Asn Gly Val Tyr Met Gly Asn 115 120 125 Leu Thr Ala Gln Gln Leu Glu Gln Arg Lys Lys Leu Leu Glu Leu Val 130 135 140 Gly Met Thr Arg Pro Asn Leu Arg Ala Gly Ser Asp Gly Val Val Arg 145 150 155 160 Val Trp Asp Val Lys Asn Pro Asp Leu Leu Asn Asn Gln Phe Gly Thr 165 170 175 Met Pro Ser Leu Thr Ile Ala Cys Met Thr Lys Gln Gly Gln Ser Asp 180 185 190 Ile Asn Asp Val Val Gln Ala Leu Thr Asp Leu Gly Leu Ile Tyr Thr 195 200 205 Ala Lys Tyr Pro Asn Ser Ser Asp Leu Asp Gln Leu Val Lys Thr His 210 215 220 Pro Val Leu Gly Ile Ile Asp Thr Glu Lys Ser Ala Ile Asn Val Ser 225 230 235 240 Gly Tyr Asn Phe Ser Leu Ser Ala Ala Val Lys Ala Gly Ala Cys Met 245 250 255 Leu Asp Gly Gly Asn Met Leu Glu Thr Ile Lys Val Thr Pro Gln Asn 260 265 270 Ile Asp Pro Ile Leu Lys Lys Thr Leu Ala Val Lys Lys Ser Val Gly 275 280 285 Met Phe Val Ser Asp Thr Pro Gly Asp Arg Asn Pro Tyr Glu Asn Leu 290 295 300 Leu Tyr Lys Ile Cys Leu Ser Gly Asn Gly Trp Pro Tyr Ile Ala Ser 305 310 315 320 Arg Thr Ser Ile Leu Gly Arg Ala Trp Asp Asn Thr Val Val Asp Leu 325 330 335 Gly Ser Ser Asn Pro Ile Thr Lys Pro Leu Asn Gln Gln Ala Arg Asp 340 345 350 Lys Val Pro Gly Leu Gln Gln Thr Val Gly Leu Thr Tyr Ser Gln Ile 355 360 365 Met Cys Leu Lys Asp Ile Met Thr Gly Met Asp Pro Thr Ser Lys Thr 370 375 380 Trp Ile Asp Ile Glu Gly Arg Ala Glu Asp Pro Val Glu Ile Ala Ile 385 390 395 400 Tyr Gln Pro Ala Gly Gly Gln Tyr Ile His Phe Tyr Arg Glu Pro Thr 405 410 415 Asp Ala Lys Gln Phe Lys Gln Asp Ser Lys Tyr Ser His Gly Ile Asp 420 425 430 Ile Val Asp Leu Phe Arg Val Gln Pro Gly Leu Thr Ser Ala Val Ile 435 440 445 Glu Ser Leu Pro Lys Gly Met Val Leu Thr Cys Gln Gly Ser Glu Asp 450 455 460 Ile Arg Lys Leu Leu Asp Ser Gln Gly Arg Arg Asp Ile Lys Leu Ile 465 470 475 480 Asp Val Met Met Ser Lys Ile Asp Ala Arg Lys Phe Glu Asn Glu Val 485 490 495 Trp Asp Asp Leu Lys Thr Leu Cys Asn Met His Thr Gly Val Val His 500 505 510 Glu Lys Lys Lys Arg Gly Gly Lys Gln Glu Ile Thr Pro His Cys Ala 515 520 525 Leu Leu Asp Cys Ile Met Tyr Glu Ala Ala Thr Gln Gly Ser Tyr Lys 530 535 540 Thr Pro Lys Leu Thr Pro Leu Leu Pro Thr Asp Leu Val Phe Arg Ala 545 550 555 560 Gly Ala Pro Lys Val Thr Leu 565 <210> 364 <211> 1701 <212> DNA <213> Arenavirus <400> 364 atgagcaact ccaaggaggt gaagtccttt ctttggactc aagcccttag gagggaatta 60 tcaccatact gcacaagtgt caaacttcaa gttatcaagg atgctcagag tctccttcac 120 agcttggatt tctcagaagt gagtaatgta caacgcttga tgaggaagga caaaagggat 180 gacggtgact tgaagaggct gagagattta aatcaggcag tcaacaatct tgttgaacta 240 aaatctcaac agcagaaaaa tgtcttaagt gtggggcagc tgtcatctga tgacctttta 300 gtcctcgctg ctgacattga caggctgaaa gcaaagataa ccaggacaga gaggccccaa 360 tctaatgggg tctacatggg gaacctcaca gctcagcaac ttgaacaacg aaagaagctc 420 ctagagttgg tggggatgac cagaccaaac ttaagagctg gttctgatgg tgttgtcagg 480 gtgtgggacg tgaagaatcc tgatctcttg aataaccaat ttggcacaat gcccagtcta 540 acgattgcct gcatgacaaa acaaggacaa tcagacataa atgatgttgt tcaggcatta 600 actgacttgg ggctaattta tacagctaag tacccaaatt catcagatct tgatcaactt 660 gtcaaaaccc atccagtttt gggcatcata gacacagaaa aatctgccat caatgtttca 720 ggttacaact tcagcctgtc agctgcagtt aaggcaggtg catgtatgct agatgggggt 780 aacatgctcg agaccataaa ggtaacacct cagaatattg atccaattct gaagaagact 840 ctggcagtta aaaagtctgt tggcatgttt gtctcagaca caccaggtga cagaaaccca 900 tatgaaaact tactatacaa gatctgcctc tcaggcaatg gatggcccta cattgctagc 960 agaacttcaa ttctcgggag ggcctgggac aacacagttg tggacttggg cagcagtaac 1020 ccaatcacaa agcccctcaa tcagcaagct agagacaaag ttcctggttt gcagcaaaca 1080 gttggactca catactcaca aatcatgtgt ctcaaagaca taatgaccgg tatggacccg 1140 acaagtaaga cttggattga cattgagggc agggctgagg acccagtgga gattgccatc 1200 taccagccag ctggtgggca atatattcat ttctacagag aaccaacaga tgccaagcaa 1260 tttaagcagg attctaagta ctcacatggc attgacattg ttgacctgtt tagggtgcaa 1320 ccaggcctta caagtgctgt gatagagagt ctaccgaaag ggatggtctt aacttgtcag 1380 ggatctgagg acataagaaa gctgttagat agtcaggggc gccgagacat caagttaatt 1440 gatgtgatga tgagcaagat tgatgcacgg aagtttgaaa atgaggtctg ggatgatctt 1500 aaaacactgt gcaacatgca cactggggtg gtccatgaga agaagaagag aggtggtaaa 1560 caagaaataa cacctcactg tgcacttcta gactgcatta tgtatgaggc agccacccag 1620 gggtcataca agacccccaa attaacacct ctgctaccaa ctgacttggt gtttagagca 1680 ggagcaccca aagtcactct g 1701 <210> 365 <211> 1701 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding Arenavirus NP1 protein <400> 365 atgagcaaca gcaaagaagt caagagcttc ctctggacac aggccctgag aagagagctg 60 agcccttact gcaccagcgt gaagctgcaa gtgatcaagg acgcccagag cctgctgcac 120 agcctggatt tttccgaggt gtccaacgtg cagcggctga tgcggaagga caagagagat 180 gacggcgacc tgaagcggct gagggatctg aatcaggccg tgaacaacct ggtggaactg 240 aagtcccagc agcagaaaaa cgtgctgagc gtgggccagc tgagcagcga cgatctgctt 300 gttctggccg ccgacatcga cagactgaag gccaagatca ccagaaccga gcggcctcag 360 agcaacggcg tgtacatggg aaatctgaca gcccagcagc tggaacagcg gaagaaactg 420 ctggaactcg tgggcatgac ccggcctaat ctgagagctg gctctgatgg cgtcgtcaga 480 gtgtgggacg tgaagaaccc cgacctgctg aacaaccagt tcggcaccat gcctagcctg 540 acaatcgcct gcatgaccaa gcagggccag agcgacatca acgatgtggt gcaggcactg 600 accgacctgg gcctgatcta caccgccaag tatcccaaca gcagcgacct ggatcagctg 660 gtcaagacac accctgtgct gggcatcatc gacaccgaga agtccgccat caacgtgtcc 720 ggctacaact tctctctgtc tgccgccgtg aaagccggcg cttgtatgct ggatggcggc 780 aacatgctgg aaaccatcaa agtgacccct cagaacatcg accccatcct gaagaaaacc 840 ctggccgtga agaaaagcgt ggggatgttc gtgtctgaca cccctggcga cagaaacccc 900 tacgagaacc tgctgtacaa gatctgcctg agcggcaacg gctggcccta tatcgccagc 960 agaaccagca ttctgggcag agcctgggac aacaccgtgg tggatctggg cagcagcaac 1020 cccatcacca agcctctgaa ccagcaggcc agagataagg tgccaggcct gcagcagaca 1080 gtgggcctga catacagcca gatcatgtgc ctgaaggaca tcatgaccgg catggacccc 1140 accagcaaga catggatcga catcgagggc agagctgagg accctgtgga aatcgccatc 1200 taccaacctg ccggcggaca gtacatccac ttctacagag agcccaccga cgccaagcag 1260 ttcaagcagg acagcaagta cagccacggc atcgatatcg tggacctgtt cagagtgcag 1320 cccggactga catctgccgt gatcgagtct ctgcccaaag gcatggtcct gacctgtcag 1380 ggcagcgagg acatcagaaa gctgctcgac agccagggca gaagagacat caagctgatc 1440 gacgtgatga tgagcaagat cgacgcccgg aagttcgaga acgaagtgtg ggatgacctg 1500 aaaaccctct gcaacatgca caccggcgtg gtgcacgaga agaagaagag aggcggcaag 1560 caagagatca cccctcactg tgctctgctg gactgcatta tgtacgaggc cgccacacag 1620 ggcagctaca agacccctaa actgacccct ctgctgccta ccgatctggt gtttagagcc 1680 ggcgcaccca aagtgacact g 1701 <210> 366 <211> 1701 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding Arenavirus NP1 protein <400> 366 augagcaaca gcaaagaagu caagagcuuc cucuggacac aggcccugag aagagagcug 60 agcccuuacu gcaccagcgu gaagcugcaa gugaucaagg acgcccagag ccugcugcac 120 agccuggauu uuuccgaggu guccaacgug cagcggcuga ugcggaagga caagagagau 180 gacggcgacc ugaagcggcu gagggaucug aaucaggccg ugaacaaccu gguggaacug 240 aagucccagc agcagaaaaa cgugcugagc gugggccagc ugagcagcga cgaucugcuu 300 guucuggccg ccgacaucga cagacugaag gccaagauca ccagaaccga gcggccucag 360 agcaacggcg uguacauggg aaaucugaca gcccagcagc uggaacagcg gaagaaacug 420 cuggaacucg ugggcaugac ccggccuaau cugagagcug gcucugaugg cgucgucaga 480 gugugggacg ugaagaaccc cgaccugcug aacaaccagu ucggcaccau gccuagccug 540 acaaucgccu gcaugaccaa gcagggccag agcgacauca acgauguggu gcaggcacug 600 accgaccugg gccugaucua caccgccaag uaucccaaca gcagcgaccu ggaucagcug 660 gucaagacac acccugugcu gggcaucauc gacaccgaga aguccgccau caacgugucc 720 ggcuacaacu ucucucuguc ugccgccgug aaagccggcg cuuguaugcu ggauggcggc 780 aacaugcugg aaaccaucaa agugaccccu cagaacaucg accccauccu gaagaaaacc 840 cuggccguga agaaaagcgu ggggauguuc gugucugaca ccccuggcga cagaaacccc 900 uacgagaacc ugcuguacaa gaucugccug agcggcaacg gcuggcccua uaucgccagc 960 agaaccagca uucugggcag agccugggac aacaccgugg uggaucuggg cagcagcaac 1020 cccaucacca agccucugaa ccagcaggcc agagauaagg ugccaggccu gcagcagaca 1080 gugggccuga cauacagcca gaucaugugc cugaaggaca ucaugaccgg cauggacccc 1140 accagcaaga cauggaucga caucgagggc agagcugagg acccugugga aaucgccauc 1200 uaccaaccug ccggcggaca guacauccac uucuacagag agcccaccga cgccaagcag 1260 uucaagcagg acagcaagua cagccacggc aucgauaucg uggaccuguu cagagugcag 1320 cccggacuga caucugccgu gaucgagucu cugcccaaag gcaugguccu gaccugucag 1380 ggcagcgagg acaucagaaa gcugcucgac agccagggca gaagagacau caagcugauc 1440 gacgugauga ugagcaagau cgacgcccgg aaguucgaga acgaagugug ggaugaccug 1500 aaaacccucu gcaacaugca caccggcgug gugcacgaga agaagaagag aggcggcaag 1560 caagagauca ccccucacug ugcucugcug gacugcauua uguacgaggc cgccacacag 1620 ggcagcuaca agaccccuaa acugaccccu cugcugccua ccgaucuggu guuuagagcc 1680 ggcgcaccca aagugacacu g 1701 <210> 367 <211> 631 <212> PRT <213> Hepatitis C virus <400> 367 Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly Cys 1 5 10 15 Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu 20 25 30 Val Gln Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr Cys Ile 35 40 45 Asn Gly Val Cys Trp Thr Val Tyr His Gly Ala Gly Thr Arg Thr Ile 50 55 60 Ala Ser Pro Lys Gly Pro Val Ile Gln Thr Tyr Thr Asn Val Asp Gln 65 70 75 80 Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu Thr Pro 85 90 95 Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp 100 105 110 Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser 115 120 125 Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu 130 135 140 Cys Pro Thr Gly His Ala Val Gly Leu Phe Arg Ala Ala Val Cys Thr 145 150 155 160 Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Asn Leu Glu 165 170 175 Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser Pro Pro Ala 180 185 190 Val Pro Gln Ser Phe Gln Val Ala His Leu His Ala Pro Thr Gly Ser 195 200 205 Gly Lys Ser Thr Lys Val Pro Ala Ala Tyr Ala Ala Lys Gly Tyr Lys 210 215 220 Val Leu Val Leu Asn Pro Ser Val Ala Ala Thr Leu Gly Phe Gly Ala 225 230 235 240 Tyr Met Ser Lys Ala His Gly Val Asp Pro Asn Ile Arg Thr Gly Val 245 250 255 Arg Thr Ile Thr Thr Gly Ser Pro Ile Thr Tyr Ser Thr Tyr Gly Lys 260 265 270 Phe Leu Ala Asp Ala Gly Cys Ser Gly Gly Ala Tyr Asp Ile Ile Ile 275 280 285 Cys Asp Glu Cys His Ser Thr Asp Ala Thr Ser Ile Ser Gly Ile Gly 290 295 300 Thr Val Leu Asp Gln Ala Glu Thr Ala Gly Ala Arg Leu Val Val Leu 305 310 315 320 Ala Thr Ala Thr Pro Pro Gly Ser Val Thr Val Ser His Pro Asn Ile 325 330 335 Glu Glu Val Ala Leu Ser Thr Thr Gly Glu Ile Pro Phe Tyr Gly Lys 340 345 350 Ala Ile Pro Leu Glu Val Ile Lys Gly Gly Arg His Leu Ile Phe Cys 355 360 365 His Ser Lys Lys Lys Cys Asp Glu Leu Ala Ala Lys Leu Val Ala Leu 370 375 380 Gly Ile Asn Ala Val Ala Tyr Tyr Arg Gly Leu Asp Val Ser Val Ile 385 390 395 400 Pro Thr Ser Gly Asp Val Val Val Val Ser Thr Asp Ala Leu Met Thr 405 410 415 Gly Phe Thr Gly Asp Phe Asp Ser Val Ile Asp Cys Asn Thr Cys Val 420 425 430 Thr Gln Thr Val Asp Phe Ser Leu Asp Pro Thr Phe Thr Ile Glu Thr 435 440 445 Thr Thr Leu Pro Gln Asp Ala Val Ser Arg Thr Gln Arg Arg Gly Arg 450 455 460 Thr Gly Arg Gly Lys Pro Gly Ile Tyr Arg Phe Val Ala Pro Gly Glu 465 470 475 480 Arg Pro Ser Gly Met Phe Asp Ser Ser Val Leu Cys Glu Cys Tyr Asp 485 490 495 Ala Gly Cys Ala Trp Tyr Glu Leu Thr Pro Ala Glu Thr Thr Val Arg 500 505 510 Leu Arg Ala Tyr Met Asn Thr Pro Gly Leu Pro Val Cys Gln Asp His 515 520 525 Leu Gly Phe Trp Glu Gly Val Phe Thr Gly Leu Thr His Ile Asp Ala 530 535 540 His Phe Leu Ser Gln Thr Lys Gln Ser Gly Glu Asn Phe Pro Tyr Leu 545 550 555 560 Val Ala Tyr Gln Ala Thr Val Cys Ala Arg Ala Gln Ala Pro Pro Pro 565 570 575 Ser Trp Asp Gln Met Arg Lys Cys Leu Ile Arg Leu Lys Pro Thr Leu 580 585 590 His Gly Pro Thr Pro Leu Leu Tyr Arg Leu Gly Ala Val Gln Asn Glu 595 600 605 Val Thr Leu Thr His Pro Ile Thr Lys Tyr Ile Met Thr Cys Met Ser 610 615 620 Ala Asp Leu Glu Val Val Thr 625 630 <210> 368 <211> 1893 <212> DNA <213> Hepatitis C virus <400> 368 gcgcccatca cggcgtacgc ccagcagacg agaggcctcc tagggtgtat aatcaccagc 60 ctgactggcc gggacaaaaa ccaagtggag ggtgaggtcc agatcgtgtc aactgctacc 120 cagaccttcc tggcaacgtg catcaatggg gtatgctgga ctgtctacca cggggccgga 180 acgaggacca tcgcatcacc caagggtcct gtcatccaga cgtataccaa tgtggatcaa 240 gacctcgtgg gctggcccgc tcctcaaggt tcccgctcat tgacaccctg cacctgcggc 300 tcctcggacc tttacctggt cacgaggcac gccgatgtca ttcccgtgcg ccggcgaggt 360 gatagcaggg gtagcctgct ttcgccccgg cccatttcct acttgaaagg ctcctcgggg 420 ggtccgctgt tgtgccccac gggacacgcc gtgggcctat tcagggccgc ggtgtgcacc 480 cgtggagtgg ctaaggcggt ggactttatc cctgtggaga acctagagac aaccatgaga 540 tccccggtgt tcacggacaa ctcctctcca ccagcagtgc cccagagctt ccaggtggcc 600 cacctgcatg ctcccaccgg cagcggtaag agcaccaagg tcccggctgc gtacgcagcc 660 aagggctaca aggtgttggt gctcaacccc tctgttgctg caacactggg ctttggtgct 720 tacatgtcca aggcccatgg ggttgatcct aatatcagga ccggggtgag aacaattacc 780 actggcagcc ccatcacgta ctccacctac ggcaagttcc ttgccgacgc cgggtgctca 840 ggaggtgctt atgacataat aatttgtgac gagtgccact ccacggatgc cacatccatc 900 tcgggcatcg gcactgtcct tgaccaagca gagactgcgg gggcgagact ggttgtgctc 960 gccactgcta cccctccggg ctccgtcact gtgtcccatc ctaacatcga ggaggttgct 1020 ctgtccacca ccggagagat ccccttttac ggcaaggcta tccccctcga ggtgatcaag 1080 gggggaagac atctcatctt ctgccactca aagaagaagt gcgacgagct cgccgcgaag 1140 ctggtcgcat tgggcatcaa tgccgtggcc tactaccgcg gtcttgacgt gtctgtcatc 1200 ccgaccagcg gcgatgttgt cgtcgtgtcg accgatgctc tcatgactgg ctttaccggc 1260 gacttcgact ctgtgataga ctgcaacacg tgtgtcactc agacagtcga ttttagcctt 1320 gaccctacct ttaccattga gacaaccacg ctcccccagg atgctgtctc caggactcaa 1380 cgccggggca ggactggcag ggggaagcca ggcatctata gatttgtggc accgggggag 1440 cgcccctccg gcatgttcga ctcgtccgtc ctctgtgagt gctatgacgc gggctgtgct 1500 tggtatgagc tcacgcccgc cgagactaca gttaggctac gagcgtacat gaacaccccg 1560 gggcttcccg tgtgccagga ccatcttgga ttttgggagg gcgtctttac gggcctcact 1620 catatagatg cccactttct atcccagaca aagcagagtg gggagaactt tccttacctg 1680 gtagcgtacc aagccaccgt gtgcgctagg gctcaagccc ctcccccatc gtgggaccag 1740 atgcggaagt gtttgatccg ccttaaaccc accctccatg ggccaacacc cctgctatac 1800 agactgggcg ctgttcagaa tgaagtcacc ctgacgcacc caatcaccaa atacatcatg 1860 acatgcatgt cggccgacct ggaggtcgtc acg 1893 <210> 369 <211> 1893 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding HCV NS3 protein <400> 369 gcccctatca cagcctacgc tcagcagaca agaggcctgc tgggctgcat catcacaagc 60 ctgaccggca gagacaagaa ccaggtggaa ggcgaggtgc agatcgtgtc tacagctacc 120 cagaccttcc tggccacctg tatcaatggc gtgtgctgga ccgtgtatca cggcgctggc 180 accagaacaa tcgcctctcc aaagggccct gtgatccaga cctacaccaa cgtggaccag 240 gatctcgttg gctggcctgc tcctcagggc agcagatctc tgaccccttg tacatgcggc 300 agcagcgacc tgtacctggt cacaagacac gccgacgtga tccccgtcag aagaagaggc 360 gatagcagag gcagcctgct gagccctaga cctatcagct acctgaaggg cagctctggc 420 ggacctctgc tgtgtccaac aggacatgcc gtgggcctgt ttagagccgc cgtgtgtaca 480 agaggcgtgg ccaaagccgt ggacttcatc cccgtggaaa acctggaaac caccatgcgg 540 agccccgtgt tcaccgacaa ttctagccct ccagccgtgc ctcagagctt ccaagtggct 600 catctgcatg cccctacagg cagcggcaag agcacaaaag tgcctgccgc ctatgccgcc 660 aagggctata aggtgctggt gctgaatccc agcgtggccg ccacacttgg ctttggcgcc 720 tatatgtcta aagcccacgg cgtggacccc aacatcagaa ccggcgtgcg gacaatcaca 780 acaggcagcc ctatcaccta ctctacctac ggcaagttcc tggccgatgc cggatgttct 840 ggcggagcct acgacatcat catctgcgac gagtgccaca gcaccgacgc cacatctatc 900 tctggcatcg gcaccgtgct ggatcaggcc gaaacagctg gtgctagact ggtggtgctg 960 gccacagcta cacctccagg ctctgtgaca gtgtctcacc ccaatatcga ggaagtggcc 1020 ctgtctacaa ccggcgagat cccattctat ggcaaggcca ttcctctgga agtgatcaaa 1080 ggcggcagac acctgatctt ttgccactcc aagaagaagt gcgacgagct ggccgccaaa 1140 ctggtggccc ttggaatcaa tgccgtggcc tactacagag gactggacgt gtccgtgatt 1200 cccacatctg gcgacgtggt ggtggtgtcc actgatgccc tgatgaccgg cttcaccggc 1260 gacttcgata gcgtgatcga ctgcaatacc tgcgtgaccc agaccgtgga tttctctctg 1320 gaccccacct tcaccatcga gacaaccaca ctgcctcagg acgccgtgtc tcggacacag 1380 agaagaggca gaaccggaag aggcaagccc ggcatctaca gatttgtggc ccctggcgaa 1440 agacccagcg gcatgtttga tagcagcgtg ctgtgcgagt gctacgatgc tggctgtgct 1500 tggtacgagc tgacccctgc cgagactacc gttagactgc gggcctacat gaacacccct 1560 ggcctgcctg tgtgtcagga ccacctcgga ttttgggagg gcgtgttcac aggactgacc 1620 cacatcgacg cccactttct gagccagaca aagcagagcg gcgagaactt cccttacctg 1680 gtggcttacc aggccaccgt gtgtgctaga gcacaagccc ctccacctag ctgggaccag 1740 atgaggaagt gcctgatccg gctgaagcct acactgcacg gaccaacacc actgctgtat 1800 agactgggcg ccgtgcagaa cgaagtgacc ctgacacatc ccatcaccaa gtacatcatg 1860 acctgcatga gcgccgacct ggaagtggtc aca 1893 <210> 370 <211> 1893 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding HCV NS3 protein <400> 370 gccccuauca cagccuacgc ucagcagaca agaggccugc ugggcugcau caucacaagc 60 cugaccggca gagacaagaa ccagguggaa ggcgaggugc agaucguguc uacagcuacc 120 cagaccuucc uggccaccug uaucaauggc gugugcugga ccguguauca cggcgcuggc 180 accagaacaa ucgccucucc aaagggcccu gugauccaga ccuacaccaa cguggaccag 240 gaucucguug gcuggccugc uccucagggc agcagaucuc ugaccccuug uacaugcggc 300 agcagcgacc uguaccuggu cacaagacac gccgacguga uccccgucag aagaagaggc 360 gauagcagag gcagccugcu gagcccuaga ccuaucagcu accugaaggg cagcucuggc 420 ggaccucugc uguguccaac aggacaugcc gugggccugu uuagagccgc cguguguaca 480 agaggcgugg ccaaagccgu ggacuucauc cccguggaaa accuggaaac caccaugcgg 540 agccccgugu ucaccgacaa uucuagcccu ccagccgugc cucagagcuu ccaaguggcu 600 caucugcaug ccccuacagg cagcggcaag agcacaaaag ugccugccgc cuaugccgcc 660 aagggcuaua aggugcuggu gcugaauccc agcguggccg ccacacuugg cuuuggcgcc 720 uauaugucua aagcccacgg cguggacccc aacaucagaa ccggcgugcg gacaaucaca 780 acaggcagcc cuaucaccua cucuaccuac ggcaaguucc uggccgaugc cggauguucu 840 ggcggagccu acgacaucau caucugcgac gagugccaca gcaccgacgc cacaucuauc 900 ucuggcaucg gcaccgugcu ggaucaggcc gaaacagcug gugcuagacu gguggugcug 960 gccacagcua caccuccagg cucugugaca gugucucacc ccaauaucga ggaaguggcc 1020 cugucuacaa ccggcgagau cccauucuau ggcaaggcca uuccucugga agugaucaaa 1080 ggcggcagac accugaucuu uugccacucc aagaagaagu gcgacgagcu ggccgccaaa 1140 cugguggccc uuggaaucaa ugccguggcc uacuacagag gacuggacgu guccgugauu 1200 cccacaucug gcgacguggu gguggugucc acugaugccc ugaugaccgg cuucaccggc 1260 gacuucgaua gcgugaucga cugcaauacc ugcgugaccc agaccgugga uuucucucug 1320 gaccccaccu ucaccaucga gacaaccaca cugccucagg acgccguguc ucggacacag 1380 agaagaggca gaaccggaag aggcaagccc ggcaucuaca gauuuguggc cccuggcgaa 1440 agacccagcg gcauguuuga uagcagcgug cugugcgagu gcuacgaugc uggcugugcu 1500 ugguacgagc ugaccccugc cgagacuacc guuagacugc gggccuacau gaacaccccu 1560 ggccugccug ugugucagga ccaccucgga uuuugggagg gcguguucac aggacugacc 1620 cacaucgacg cccacuuucu gagccagaca aagcagagcg gcgagaacuu cccuuaccug 1680 guggcuuacc aggccaccgu gugugcuaga gcacaagccc cuccaccuag cugggaccag 1740 augaggaagu gccugauccg gcugaagccu acacugcacg gaccaacacc acugcuguau 1800 agacugggcg ccgugcagaa cgaagugacc cugacacauc ccaucaccaa guacaucaug 1860 accugcauga gcgccgaccu ggaagugguc aca 1893 <210> 371 <211> 127 <212> PRT <213> Dengue virus type 1 <400> 371 Ser Val Ser Gly Asp Leu Ile Leu Glu Ile Gly Lys Leu Pro Gln His 1 5 10 15 Leu Thr Gln Arg Ala Gln Asn Ala Leu Asp Asn Leu Val Met Leu His 20 25 30 Asn Ser Glu Gln Gly Gly Lys Ala Tyr Arg His Ala Met Glu Glu Leu 35 40 45 Pro Asp Thr Ile Glu Thr Leu Met Leu Leu Ala Leu Ile Ala Val Leu 50 55 60 Thr Gly Gly Val Thr Leu Phe Phe Leu Ser Gly Arg Gly Leu Gly Lys 65 70 75 80 Thr Ser Ile Gly Leu Leu Cys Val Ile Ala Ser Ser Ala Leu Leu Trp 85 90 95 Met Ala Ser Val Glu Pro His Trp Ile Ala Ala Ser Ile Ile Leu Glu 100 105 110 Phe Phe Leu Met Val Leu Leu Ile Pro Glu Pro Asp Arg Gln Arg 115 120 125 <210> 372 <211> 381 <212> DNA <213> Dengue virus type 1 <400> 372 agcgtctcag gtgacctaat attagaaata gggaaacttc cacaacattt aacgcaaagg 60 gcccagaacg ccttggacaa tctggttatg ttgcacaact ctgaacaagg aggaaaagcc 120 tatagacacg ccatggaaga actaccagac accatagaaa cgttaatgct cctagctttg 180 atagctgtgc tgactggtgg agtgacgttg ttcttcctat caggaagggg tctaggaaaa 240 acatccattg gcctactctg cgtgattgcc tcaagcgcac tgctatggat ggccagtgtg 300 gaaccccatt ggatagcggc ctctatcata ctggagttct ttctgatggt gttgcttatt 360 ccagagccgg acagacagcg c 381 <210> 373 <211> 381 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding DENV 1 NS4A <400> 373 tccgttagcg gcgacctgat cctggaaatc ggcaagctgc ctcagcacct gacacagaga 60 gcacagaacg ccctggacaa cctggtcatg ctgcacaact ctgagcaagg cggcaaggcc 120 tacagacacg ccatggaaga actgcccgac accatcgaga cactgatgct gctggccctg 180 atcgctgttc tgacaggcgg agtgaccctg ttcttcctgt ctggcagagg cctgggcaag 240 acctctatcg gactgctgtg tgtgatcgcc agctctgccc tgctgtggat ggcttctgtg 300 gaacctcatt ggatcgccgc ctctattatc ctggaattct tcctgatggt gctgctgatc 360 cccgagcctg acagacagag a 381 <210> 374 <211> 381 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding DENV 1 NS4A <400> 374 uccguuagcg gcgaccugau ccuggaaauc ggcaagcugc cucagcaccu gacacagaga 60 gcacagaacg cccuggacaa ccuggucaug cugcacaacu cugagcaagg cggcaaggcc 120 uacagacacg ccauggaaga acugcccgac accaucgaga cacugaugcu gcuggcccug 180 aucgcuguuc ugacaggcgg agugacccug uucuuccugu cuggcagagg ccugggcaag 240 accucuaucg gacugcugug ugugaucgcc agcucugccc ugcuguggau ggcuucugug 300 gaaccucauu ggaucgccgc cucuauuauc cuggaauucu uccugauggu gcugcugauc 360 cccgagccug acagacagag a 381 <210> 375 <211> 218 <212> PRT <213> Dengue virus type 1 <400> 375 Gly Ser Gly Glu Val Asp Ser Phe Ser Leu Gly Leu Leu Cys Ile Ser 1 5 10 15 Ile Met Ile Glu Glu Val Met Arg Ser Arg Trp Ser Arg Lys Met Leu 20 25 30 Met Thr Gly Thr Leu Ala Val Phe Leu Leu Leu Thr Met Gly Gln Leu 35 40 45 Thr Trp Asn Asp Leu Ile Arg Leu Cys Ile Met Val Gly Ala Asn Ala 50 55 60 Ser Asp Lys Met Gly Met Gly Thr Thr Tyr Leu Ala Leu Met Ala Thr 65 70 75 80 Phe Arg Met Arg Pro Met Phe Ala Val Gly Leu Leu Phe Arg Arg Leu 85 90 95 Thr Ser Arg Glu Val Leu Leu Leu Thr Val Gly Leu Ser Leu Val Ala 100 105 110 Ser Val Glu Leu Pro Asn Ser Leu Glu Glu Leu Gly Asp Gly Leu Ala 115 120 125 Met Gly Ile Met Met Leu Lys Leu Leu Thr Asp Phe Gln Ser His Gln 130 135 140 Leu Trp Ala Thr Leu Leu Ser Leu Thr Phe Val Lys Thr Thr Phe Ser 145 150 155 160 Leu His Tyr Ala Trp Lys Thr Met Ala Met Ile Leu Ser Ile Val Ser 165 170 175 Leu Phe Pro Leu Cys Leu Ser Thr Thr Ser Gln Lys Thr Thr Trp Leu 180 185 190 Pro Val Leu Leu Gly Ser Leu Gly Cys Lys Pro Leu Thr Met Phe Leu 195 200 205 Ile Thr Glu Asn Lys Ile Trp Gly Arg Lys 210 215 <210> 376 <211> 654 <212> DNA <213> Dengue virus type 1 <400> 376 gggtcaggag aagtggacag tttttcacta ggactgctat gcatatcaat aatgatcgaa 60 gaggtaatga gatccagatg gagcagaaaa atgctgatga ctggaacatt ggctgtgttc 120 ctccttctca caatgggaca attgacatgg aatgatctga tcaggctatg tatcatggtt 180 ggagccaacg cttcagacaa gatggggatg ggaacaacgt acctagcttt gatggccact 240 ttcagaatga gaccaatgtt cgcagtcggg ctactgtttc gcagattaac atctagagaa 300 gttcttcttc ttacagttgg attgagtctg gtggcatctg tagaactacc aaattcctta 360 gaggagctag gggatggact tgcaatgggc atcatgatgt tgaaattact gactgatttt 420 cagtcacatc agctatgggc taccttgctg tctttaacat ttgtcaaaac aactttttca 480 ttgcactatg catggaagac aatggctatg atactgtcaa ttgtatctct cttcccttta 540 tgcctgtcca cgacttctca aaaaacaaca tggcttccgg tgttgctggg atctcttgga 600 tgcaaaccac taaccatgtt tcttataaca gaaaacaaaa tctggggaag gaaa 654 <210> 377 <211> 654 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding DENV 1 NS2A <400> 377 ggatctggcg aggtggactc tttttctctg ggcctgctgt gcatcagcat catgatcgag 60 gaagtgatgc ggagccgctg gtcccggaaa atgctgatga ctggaaccct ggccgtgttc 120 ctgctgctga caatgggaca gctgacctgg aacgacctga tccggctgtg tatcatggtc 180 ggagccaacg ccagcgacaa gatgggcatg ggcacaacct atctggccct gatggccacc 240 ttccggatga ggcctatgtt tgccgtggga ctgctgttca gaaggctgac ctctagagag 300 gtgctgctgc tcacagtggg cctgtctctg gtggcttctg tggaactgcc caacagcctg 360 gaagaactcg gagatggact ggccatgggc attatgatgc tcaagctgct gaccgacttc 420 cagagccacc agctgtgggc tacactgctg agcctgacct tcgtgaaaac caccttcagc 480 ctgcactacg cctggaaaac aatggccatg atcctgagca tcgtgtctct gttccctctg 540 tgcctgagca ccaccagcca gaaaaccaca tggctgcctg tgctgctggg ctctctgggc 600 tgtaaacccc tgaccatgtt cctgatcacc gagaacaaga tctggggcag aaag 654 <210> 378 <211> 654 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding DENV 1 NS2A <400> 378 ggaucuggcg agguggacuc uuuuucucug ggccugcugu gcaucagcau caugaucgag 60 gaagugaugc ggagccgcug gucccggaaa augcugauga cuggaacccu ggccguguuc 120 cugcugcuga caaugggaca gcugaccugg aacgaccuga uccggcugug uaucaugguc 180 ggagccaacg ccagcgacaa gaugggcaug ggcacaaccu aucuggcccu gauggccacc 240 uuccggauga ggccuauguu ugccguggga cugcuguuca gaaggcugac cucuagagag 300 gugcugcugc ucacaguggg ccugucucug guggcuucug uggaacugcc caacagccug 360 gaagaacucg gagauggacu ggccaugggc auuaugaugc ucaagcugcu gaccgacuuc 420 cagagccacc agcugugggc uacacugcug agccugaccu ucgugaaaac caccuucagc 480 cugcacuacg ccuggaaaac aauggccaug auccugagca ucgugucucu guucccucug 540 ugccugagca ccaccagcca gaaaaccaca uggcugccug ugcugcuggg cucucugggc 600 uguaaacccc ugaccauguu ccugaucacc gagaacaaga ucuggggcag aaag 654 <210> 379 <211> 218 <212> PRT <213> Dengue virus type 2 <400> 379 Gly His Gly Gln Val Asp Asn Phe Ser Leu Gly Val Leu Gly Met Ala 1 5 10 15 Leu Phe Leu Glu Glu Met Leu Arg Thr Arg Val Gly Thr Lys His Ala 20 25 30 Ile Leu Leu Val Ala Val Ser Phe Val Thr Leu Ile Ile Gly Asn Met 35 40 45 Ser Phe Arg Asp Leu Gly Arg Val Met Val Met Val Gly Ala Thr Met 50 55 60 Thr Asp Asp Ile Gly Met Gly Val Thr Tyr Leu Ala Leu Leu Ala Ala 65 70 75 80 Phe Lys Val Arg Pro Thr Phe Ala Ala Gly Leu Leu Leu Arg Lys Leu 85 90 95 Thr Ser Lys Ala Leu Met Met Thr Thr Ile Gly Ile Val Leu Ser Ser 100 105 110 Gln Ser Thr Thr Pro Glu Thr Ile Leu Glu Leu Thr Asp Ala Leu Ala 115 120 125 Leu Gly Met Met Val Leu Lys Met Val Arg Asn Met Glu Lys Tyr Gln 130 135 140 Leu Ala Val Thr Ile Met Ala Ile Leu Cys Val Pro Asn Ala Val Ile 145 150 155 160 Leu Gln Asn Ala Trp Lys Val Ser Cys Thr Ile Leu Ala Val Val Ser 165 170 175 Val Ser Pro Leu Phe Leu Thr Ser Ser Gln Gln Lys Thr Asp Trp Ile 180 185 190 Pro Leu Ala Leu Thr Ile Lys Gly Leu Asn Pro Thr Ala Ile Phe Leu 195 200 205 Thr Thr Leu Ser Arg Thr Ser Lys Lys Arg 210 215 <210> 380 <211> 654 <212> DNA <213> Dengue virus type 2 <400> 380 ggacatgggc aggtcgacaa cttttcacta ggagtcttgg gaatggcatt gttcctggag 60 gaaatgctta ggacccgagt aggaacgaaa catgcaatac tactagttgc agtttctttt 120 gtgacattga tcatagggaa catgtccttt agagacctgg gaagagtaat ggttatggta 180 ggcgccacta tgacggatga cataggtatg ggcgtgactt atcttgccct actagcagcc 240 ttcaaagtca gaccaacttt tgcagctgga ctactcttga gaaagctgac ctccaaggca 300 ttgatgatga ctactatagg aattgtactc tcctcccaga gcactacacc agagaccatt 360 cttgagttga ctgatgcgtt agccttaggc atgatggtcc tcaaaatggt gagaaatatg 420 gaaaagtatc aattggcagt gactatcatg gctatcttgt gcgtcccaaa cgcagtgata 480 ttacaaaacg catggaaagt gagttgcacg atattggcag tggtgtccgt ttccccactg 540 ttcttaacat cctcacagca aaaaacggat tggataccat tagcgttgac gatcaaaggt 600 ctcaatccaa cagctatttt tctaacaacc ctctcaagaa ccagcaagaa aagg 654 <210> 381 <211> 654 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding DENV 2 NS2A protein <400> 381 ggacacggac aggtggacaa tttttccctg ggcgtgctcg gcatggccct gtttctggaa 60 gagatgctga gaaccagagt gggcaccaag cacgccattc tgctggtggc cgtgtccttc 120 gtgacactga tcatcggcaa catgagcttc cgcgacctgg gcagagtgat ggtcatggtc 180 ggagccacca tgaccgacga tatcggcatg ggcgtgacct atctggctct gctggccgct 240 tttaaagtgc ggcctacatt tgccgccgga ctgctgctga gaaagctgac atctaaggcc 300 ctgatgatga ccaccatcgg catcgtgctg agcagccaga gcaccacacc tgagacaatc 360 ctggaactga ccgacgctct ggccctggga atgatggtgc tgaagatggt ccgaaacatg 420 gaaaagtacc agctggccgt gaccatcatg gccatcctgt gtgtgcccaa cgccgtgatc 480 ctgcagaacg cctggaaggt gtcctgtacc atcctggccg tggtgtctgt gtcccctctg 540 tttctgacca gcagccagca gaaaaccgac tggatcccac tggctctgac catcaagggc 600 ctgaatccta ccgccatctt cctgaccaca ctgagccgga ccagcaagaa gaga 654 <210> 382 <211> 654 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding DENV 2 NS2A <400> 382 ggacacggac agguggacaa uuuuucccug ggcgugcucg gcauggcccu guuucuggaa 60 gagaugcuga gaaccagagu gggcaccaag cacgccauuc ugcugguggc cguguccuuc 120 gugacacuga ucaucggcaa caugagcuuc cgcgaccugg gcagagugau ggucaugguc 180 ggagccacca ugaccgacga uaucggcaug ggcgugaccu aucuggcucu gcuggccgcu 240 uuuaaagugc ggccuacauu ugccgccgga cugcugcuga gaaagcugac aucuaaggcc 300 cugaugauga ccaccaucgg caucgugcug agcagccaga gcaccacacc ugagacaauc 360 cuggaacuga ccgacgcucu ggcccuggga augauggugc ugaagauggu ccgaaacaug 420 gaaaaguacc agcuggccgu gaccaucaug gccauccugu gugugcccaa cgccgugauc 480 cugcagaacg ccuggaaggu guccuguacc auccuggccg uggugucugu guccccucug 540 uuucugacca gcagccagca gaaaaccgac uggaucccac uggcucugac caucaagggc 600 cugaauccua ccgccaucuu ccugaccaca cugagccgga ccagcaagaa gaga 654 <210> 383 <211> 218 <212> PRT <213> Dengue virus type 4 <400> 383 Gly Gln Gly Thr Ser Glu Thr Phe Ser Met Gly Leu Leu Cys Leu Thr 1 5 10 15 Leu Phe Val Glu Glu Cys Leu Arg Arg Arg Val Thr Arg Lys His Met 20 25 30 Ile Leu Val Val Val Ile Thr Leu Cys Ala Ile Ile Leu Gly Gly Leu 35 40 45 Thr Trp Met Asp Leu Leu Arg Ala Leu Ile Met Leu Gly Asp Thr Met 50 55 60 Ser Gly Arg Ile Gly Gly Gln Ile His Leu Ala Ile Met Ala Val Phe 65 70 75 80 Lys Met Ser Pro Gly Tyr Val Leu Gly Val Phe Leu Arg Lys Leu Thr 85 90 95 Ser Arg Glu Thr Ala Leu Met Val Ile Gly Met Ala Met Thr Thr Val 100 105 110 Leu Ser Ile Pro His Asp Leu Met Glu Leu Ile Asp Gly Ile Ser Leu 115 120 125 Gly Leu Ile Leu Leu Lys Ile Val Thr Gln Phe Asp Asn Thr Gln Val 130 135 140 Gly Thr Leu Ala Leu Ser Leu Thr Phe Ile Arg Ser Thr Met Pro Leu 145 150 155 160 Val Met Ala Trp Arg Thr Ile Met Ala Val Leu Phe Val Val Thr Leu 165 170 175 Ile Pro Leu Cys Arg Thr Ser Cys Leu Gln Lys Gln Ser His Trp Val 180 185 190 Glu Ile Thr Ala Leu Ile Leu Gly Ala Gln Ala Leu Pro Val Tyr Leu 195 200 205 Met Thr Leu Met Lys Gly Ala Ser Arg Arg 210 215 <210> 384 <211> 654 <212> DNA <213> Dengue virus type 4 <400> 384 ggacagggca catcagaaac tttttctatg ggtctgttgt gcctgacctt gtttgtggaa 60 gaatgcttga ggagaagagt cactaggaaa cacatgatat tagttgtggt gatcactctt 120 tgtgctatca tcctgggagg cctcacatgg atggacttac tacgagccct catcatgttg 180 ggggacacta tgtctggtag aataggagga cagatccacc tagccatcat ggcagtgttc 240 aagatgtcac caggatacgt gctgggtgtg tttttaagga aactcacttc aagagagaca 300 gcactaatgg taataggaat ggccatgaca acggtgcttt caattccaca tgaccttatg 360 gaactcattg atggaatatc actgggacta attttgctaa aaatagtaac acagtttgac 420 aacacccaag tgggaacctt agctctttcc ttgactttca taagatcaac aatgccattg 480 gtcatggctt ggaggaccat tatggctgtg ttgtttgtgg tcacactcat tcctttgtgc 540 aggacaagct gtcttcaaaa acagtctcat tgggtagaaa taacagcact catcctagga 600 gcccaagctc tgccagtgta cctaatgact cttatgaaag gagcctcaag aaga 654 <210> 385 <211> 654 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding DENV 4 NS2A <400> 385 ggccagggaa caagcgagac attttccatg ggcctgctgt gtctgaccct gttcgtggaa 60 gagtgcctgc ggagaagagt gacccggaag cacatgatcc tggtggtggt catcaccctg 120 tgcgccatca ttctcggcgg cctgacatgg atggatctgc tgagagccct gatcatgctg 180 ggcgatacca tgagcggcag aatcggcgga cagatccacc tggccatcat ggccgtgttc 240 aagatgagcc ctggctacgt gctgggcgtg ttcctgagaa agctgaccag cagagaaaca 300 gccctgatgg tcatcggaat ggccatgacc accgtgctga gcatccctca cgacctgatg 360 gaactgatcg acggcatcag cctgggcctg atcctgctga agatcgtgac ccagttcgac 420 aacacccaag tgggcacact ggccctgagc ctgaccttca tcagatccac aatgcccctc 480 gtgatggcct ggcggacaat tatggccgtg ctgttcgtcg tgacactgat ccctctgtgc 540 agaaccagct gcctgcagaa acagagccac tgggtcgaga tcaccgctct gattctggga 600 gcacaggccc tgcctgtgta cctgatgaca cttatgaagg gcgccagcag acgg 654 <210> 386 <211> 654 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding DENV 4 NS2A protein <400> 386 ggccagggaa caagcgagac auuuuccaug ggccugcugu gucugacccu guucguggaa 60 gagugccugc ggagaagagu gacccggaag cacaugaucc uggugguggu caucacccug 120 ugcgccauca uucucggcgg ccugacaugg auggaucugc ugagagcccu gaucaugcug 180 ggcgauacca ugagcggcag aaucggcgga cagauccacc uggccaucau ggccguguuc 240 aagaugagcc cuggcuacgu gcugggcgug uuccugagaa agcugaccag cagagaaaca 300 gcccugaugg ucaucggaau ggccaugacc accgugcuga gcaucccuca cgaccugaug 360 gaacugaucg acggcaucag ccugggccug auccugcuga agaucgugac ccaguucgac 420 aacacccaag ugggcacacu ggcccugagc cugaccuuca ucagauccac aaugccccuc 480 gugauggccu ggcggacaau uauggccgug cuguucgucg ugacacugau cccucugugc 540 agaaccagcu gccugcagaa acagagccac ugggucgaga ucaccgcucu gauucuggga 600 gcacaggccc ugccugugua ccugaugaca cuuaugaagg gcgccagcag acgg 654 <210> 387 <211> 130 <212> PRT <213> Dengue virus type 1 <400> 387 Ser Trp Pro Leu Asn Glu Gly Ile Met Ala Val Gly Ile Val Ser Ile 1 5 10 15 Leu Leu Ser Ser Leu Leu Lys Asn Asp Val Pro Leu Ala Gly Pro Leu 20 25 30 Ile Ala Gly Gly Met Leu Ile Ala Cys Tyr Val Ile Ser Gly Ser Ser 35 40 45 Ala Asp Leu Ser Leu Glu Lys Ala Ala Glu Val Ser Trp Glu Glu Glu 50 55 60 Ala Glu His Ser Gly Ala Ser His Asn Ile Leu Val Glu Val Gln Asp 65 70 75 80 Asp Gly Thr Met Lys Ile Lys Asp Glu Glu Arg Asp Asp Thr Leu Thr 85 90 95 Ile Leu Leu Lys Ala Thr Leu Leu Ala Ile Ser Gly Val Tyr Pro Met 100 105 110 Ser Ile Pro Ala Thr Leu Phe Val Trp Tyr Phe Trp Gln Lys Lys Lys 115 120 125 Gln Arg 130 <210> 388 <211> 390 <212> DNA <213> Dengue virus type 1 <400> 388 agctggcctc tcaatgaagg aattatggct gttggaatag ttagcattct tctaagttca 60 cttctcaaga atgatgtgcc actagctggc ccactaatag ctggaggcat gctaatagca 120 tgttatgtca tatctggaag ctcggccgat ttatcactgg agaaagcggc tgaggtctcc 180 tgggaagaag aagcagaaca ctctggtgcc tcacacaaca tactagtgga ggtccaagat 240 gatggaacca tgaagataaa ggatgaagag agagatgaca cactcaccat tctcctcaaa 300 gcaactctgc tagcaatctc aggggtatac ccaatgtcaa taccggcgac cctctttgtg 360 tggtattttt ggcagaaaaa gaaacagaga 390 <210> 389 <211> 390 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding DENV 1 NS2B protein <400> 389 agctggcctc tgaacgaggg aattatggcc gtgggcatcg tgtccatcct gctgtctagc 60 ctgctgaaga acgacgtgcc actggccgga cctcttattg ctggcggaat gctgatcgcc 120 tgctacgtga tcagcggcag ctctgccgat ctgagcctgg aaaaagccgc cgaggtgtcc 180 tgggaagaag aggccgaaca ttctggcgcc tctcacaaca tcctggtgga agtgcaggac 240 gacggcacca tgaagatcaa ggacgaggaa cgggacgaca ccctgaccat tctgctgaag 300 gctaccctgc tggccatcag cggagtgtac cctatgagca tccccgccac tctgttcgtg 360 tggtacttct ggcagaagaa gaagcagcgg 390 <210> 390 <211> 390 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding DENV 1 NS2B protein <400> 390 agcuggccuc ugaacgaggg aauuauggcc gugggcaucg uguccauccu gcugucuagc 60 cugcugaaga acgacgugcc acuggccgga ccucuuauug cuggcggaau gcugaucgcc 120 ugcuacguga ucagcggcag cucugccgau cugagccugg aaaaagccgc cgaggugucc 180 ugggaagaag aggccgaaca uucuggcgcc ucucacaaca uccuggugga agugcaggac 240 gacggcacca ugaagaucaa ggacgaggaa cgggacgaca cccugaccau ucugcugaag 300 gcuacccugc uggccaucag cggaguguac ccuaugagca uccccgccac ucuguucgug 360 ugguacuucu ggcagaagaa gaagcagcgg 390 <210> 391 <211> 130 <212> PRT <213> Dengue virus type 2 <400> 391 Ser Trp Pro Leu Asn Glu Ala Ile Met Ala Val Gly Met Val Ser Ile 1 5 10 15 Leu Ala Ser Ser Leu Leu Lys Asn Asp Ile Pro Met Thr Gly Pro Leu 20 25 30 Val Ala Gly Gly Pro Leu Thr Val Cys Tyr Val Leu Thr Gly Arg Ser 35 40 45 Ala Asp Leu Glu Leu Glu Arg Ala Ala Asp Val Lys Trp Glu Asp Gln 50 55 60 Ala Glu Ile Ser Gly Ser Ser Pro Ile Leu Ser Ile Thr Ile Ser Glu 65 70 75 80 Asp Gly Ser Met Ser Ile Lys Asn Glu Glu Glu Glu Gln Thr Leu Thr 85 90 95 Ile Leu Ile Arg Thr Gly Leu Leu Val Ile Ser Gly Leu Phe Pro Val 100 105 110 Ser Ile Pro Ile Thr Ala Ala Ala Trp Tyr Leu Trp Glu Val Lys Lys 115 120 125 Gln Arg 130 <210> 392 <211> 390 <212> DNA <213> Dengue virus type 2 <400> 392 agctggccat taaatgaggc tatcatggca gtcgggatgg tgagcatttt agccagttct 60 ctcctaaaaa atgatattcc catgacagga ccattagtgg ctggagggcc cctcactgtg 120 tgctacgtgc tcactggacg atcggccgat ttggaactgg agagagcagc cgatgtcaaa 180 tgggaagacc aggcagagat atcaggaagc agcccaatcc tgtcaataac aatatcagaa 240 gatggtagca tgtcgataaa aaatgaagag gaagaacaaa cactgaccat actcattaga 300 acaggattgc tggtgatctc aggacttttt cctgtatcaa taccaatcac ggcagcagca 360 tggtacctgt gggaagtgaa gaaacaacgg 390 <210> 393 <211> 390 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding DENV 2 NS2B protein <400> 393 agctggcctc tgaacgaggc cattatggcc gtcggcatgg tgtctatcct ggccagcagc 60 ctgctgaaga acgacatccc tatgacaggc cctctggtgg ctggtggacc tctgacagtg 120 tgttacgtgc tgacaggcag aagcgccgac ctggaacttg aaagggccgc tgatgtgaag 180 tgggaagatc aggccgagat cagcggcagc agccctatcc tgagcatcac catcagcgag 240 gacggcagca tgagcatcaa gaacgaggaa gaggaacaga ccctgaccat cctgatcaga 300 accggcctgc tggtcatcag cggactgttc cctgtgtcaa tccccatcac agccgccgct 360 tggtatctgt gggaagtgaa gaagcagcgg 390 <210> 394 <211> 390 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding DENV 2 NS2B protein <400> 394 agcuggccuc ugaacgaggc cauuauggcc gucggcaugg ugucuauccu ggccagcagc 60 cugcugaaga acgacauccc uaugacaggc ccucuggugg cugguggacc ucugacagug 120 uguuacgugc ugacaggcag aagcgccgac cuggaacuug aaagggccgc ugaugugaag 180 ugggaagauc aggccgagau cagcggcagc agcccuaucc ugagcaucac caucagcgag 240 gacggcagca ugagcaucaa gaacgaggaa gaggaacaga cccugaccau ccugaucaga 300 accggccugc uggucaucag cggacuguuc ccugugucaa uccccaucac agccgccgcu 360 ugguaucugu gggaagugaa gaagcagcgg 390 <210> 395 <211> 130 <212> PRT <213> Dengue virus type 4 <400> 395 Ser Trp Pro Leu Asn Glu Gly Ile Met Ala Val Gly Leu Val Ser Leu 1 5 10 15 Leu Gly Ser Ala Leu Leu Lys Asn Asp Val Pro Leu Ala Gly Pro Met 20 25 30 Val Ala Gly Gly Leu Leu Leu Ala Ala Tyr Val Met Ser Gly Ser Ser 35 40 45 Ala Asp Leu Ser Leu Glu Lys Ala Ala Asn Val Gln Trp Asp Glu Met 50 55 60 Ala Asp Ile Thr Gly Ser Ser Pro Ile Ile Glu Val Lys Gln Asp Glu 65 70 75 80 Asp Gly Ser Phe Ser Ile Arg Asp Val Glu Glu Thr Asn Met Ile Thr 85 90 95 Leu Leu Val Lys Leu Ala Leu Ile Thr Val Ser Gly Leu Tyr Pro Leu 100 105 110 Ala Ile Pro Val Thr Met Thr Leu Trp Tyr Met Trp Gln Val Lys Thr 115 120 125 Gln Arg 130 <210> 396 <211> 390 <212> DNA <213> Dengue virus type 4 <400> 396 tcttggcctc ttaacgaggg cataatggct gtgggtttgg ttagtctctt aggaagcgct 60 cttttaaaga atgatgtccc tttagctggc ccaatggtgg caggaggctt acttctggcg 120 gcttacgtga tgagtggtag ctcagcagat ctgtcactag agaaggccgc caacgtgcag 180 tgggatgaaa tggcagacat aacaggctca agcccaatca tagaagtgaa gcaggatgaa 240 gatggctctt tctccatacg ggacgtcgag gaaaccaata tgataaccct tttggtgaaa 300 ctggcactga taacagtgtc aggtctctac cccttggcaa ttccagtcac aatgacctta 360 tggtacatgt ggcaagtgaa aacacaaaga 390 <210> 397 <211> 390 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding DENV 4 NS2B protein <400> 397 agctggcctc tgaacgaggg aatcatggcc gttggcctgg tgtctctgct gggatctgcc 60 ctgctgaaga acgatgtgcc tctggccgga cctatggttg ctggtggact gctgctggcc 120 gcctatgtga tgtctggaag cagcgccgat ctgagcctgg aaaaggccgc taacgtgcag 180 tgggacgaga tggccgatat cacaggcagc agccccatca tcgaagtgaa gcaggatgag 240 gacggcagct tcagcatccg cgacgtggaa gagacaaaca tgatcaccct gctggtcaag 300 ctggccctga tcaccgtgtc tggcctgtat cctctggcta tccccgtgac catgacactg 360 tggtacatgt ggcaagtgaa aacccagcgg 390 <210> 398 <211> 390 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding DENV 4 NS2B protein <400> 398 agcuggccuc ugaacgaggg aaucauggcc guuggccugg ugucucugcu gggaucugcc 60 cugcugaaga acgaugugcc ucuggccgga ccuaugguug cugguggacu gcugcuggcc 120 gccuauguga ugucuggaag cagcgccgau cugagccugg aaaaggccgc uaacgugcag 180 ugggacgaga uggccgauau cacaggcagc agccccauca ucgaagugaa gcaggaugag 240 gacggcagcu ucagcauccg cgacguggaa gagacaaaca ugaucacccu gcuggucaag 300 cuggcccuga ucaccguguc uggccuguau ccucuggcua uccccgugac caugacacug 360 ugguacaugu ggcaagugaa aacccagcgg 390 <210> 399 <211> 126 <212> PRT <213> West Nile virus <400> 399 Ser Gln Ile Gly Leu Val Glu Val Leu Gly Arg Met Pro Glu His Phe 1 5 10 15 Met Val Lys Thr Trp Glu Ala Leu Asp Thr Met Tyr Val Val Ala Thr 20 25 30 Ala Glu Lys Gly Gly Arg Ala His Arg Met Ala Leu Glu Glu Leu Pro 35 40 45 Asp Ala Leu Gln Thr Ile Val Leu Ile Ala Leu Leu Ser Val Met Ser 50 55 60 Leu Gly Val Phe Phe Leu Leu Met Gln Arg Lys Gly Ile Gly Lys Ile 65 70 75 80 Gly Leu Gly Gly Val Ile Leu Gly Ala Ala Thr Phe Phe Cys Trp Met 85 90 95 Ala Glu Val Pro Gly Thr Lys Ile Ala Gly Met Leu Leu Leu Ser Leu 100 105 110 Leu Leu Met Ile Val Leu Ile Pro Glu Pro Glu Lys Gln Arg 115 120 125 <210> 400 <211> 378 <212> DNA <213> West Nile virus <400> 400 tcacaaatcg ggctcgttga ggtgctcggg agaatgcctg aacacttcat ggtgaaaact 60 tgggaggcat tggacacgat gtatgtggtg gcgaccgctg aaaaaggagg ccgagctcac 120 aggatggctc ttgaggagct accggacgcc cttcagacaa tagttttgat tgcactattg 180 agtgtgatgt ccttaggtgt gttttttcta ctcatgcaaa ggaagggcat tggtaagatt 240 ggcttgggag gagtaatctt aggagctgcc acattcttct gctggatggc tgaagtccca 300 ggaacgaaaa tagcaggcat gctcctgctt tccctgctgc tcatgattgt tttgattccg 360 gagccggaaa agcagcgc 378 <210> 401 <211> 378 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding WNV NS4A protein <400> 401 tctcagatcg gcctggtgga agtgctgggc agaatgcctg agcacttcat ggtcaagacc 60 tgggaagccc tggacactat gtacgtggtg gccacagccg agaaaggcgg cagagcacat 120 agaatggccc tggaagaact gcccgacgct ctgcagacaa tcgtgctgat tgccctgctg 180 agcgtgatga gcctgggcgt gttcttcctg ctgatgcaga gaaaaggcat cggcaagatc 240 ggactcggcg gcgttatact gggagccgcc accttctttt gctggatggc tgaagtgccc 300 ggcaccaaga ttgccggaat gctgctgctg tccctgctgc tgatgattgt gctgatcccc 360 gagcctgaga agcagaga 378 <210> 402 <211> 378 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding WNV NS4A protein <400> 402 ucucagaucg gccuggugga agugcugggc agaaugccug agcacuucau ggucaagacc 60 ugggaagccc uggacacuau guacguggug gccacagccg agaaaggcgg cagagcacau 120 agaauggccc uggaagaacu gcccgacgcu cugcagacaa ucgugcugau ugcccugcug 180 agcgugauga gccugggcgu guucuuccug cugaugcaga gaaaaggcau cggcaagauc 240 ggacucggcg gcguuauacu gggagccgcc accuucuuuu gcuggauggc ugaagugccc 300 ggcaccaaga uugccggaau gcugcugcug ucccugcugc ugaugauugu gcugaucccc 360 gagccugaga agcagaga 378 <210> 403 <211> 256 <212> PRT <213> West Nile virus <400> 403 Asn Glu Met Gly Trp Leu Asp Lys Thr Lys Asn Asp Ile Gly Ser Leu 1 5 10 15 Leu Gly His Arg Pro Glu Ala Arg Glu Thr Thr Leu Gly Val Glu Ser 20 25 30 Phe Leu Leu Asp Leu Arg Pro Ala Thr Ala Trp Ser Leu Tyr Ala Val 35 40 45 Thr Thr Ala Val Leu Thr Pro Leu Leu Lys His Leu Ile Thr Ser Asp 50 55 60 Tyr Ile Asn Thr Ser Leu Thr Ser Ile Asn Val Gln Ala Ser Ala Leu 65 70 75 80 Phe Thr Leu Ala Arg Gly Phe Pro Phe Val Asp Val Gly Val Ser Ala 85 90 95 Leu Leu Leu Ala Val Gly Cys Trp Gly Gln Val Thr Leu Thr Val Thr 100 105 110 Val Thr Ala Ala Ala Leu Leu Phe Cys His Tyr Ala Tyr Met Val Pro 115 120 125 Gly Trp Gln Ala Glu Ala Met Arg Ser Ala Gln Arg Arg Thr Ala Ala 130 135 140 Gly Ile Met Lys Asn Val Val Val Asp Gly Ile Val Ala Thr Asp Val 145 150 155 160 Pro Glu Leu Glu Arg Thr Thr Pro Val Met Gln Lys Lys Val Gly Gln 165 170 175 Ile Ile Leu Ile Leu Val Ser Met Ala Ala Val Val Val Asn Pro Ser 180 185 190 Val Arg Thr Val Arg Glu Ala Gly Ile Leu Thr Thr Ala Ala Ala Val 195 200 205 Thr Leu Trp Glu Asn Gly Ala Ser Ser Val Trp Asn Ala Thr Thr Ala 210 215 220 Ile Gly Leu Cys His Ile Met Arg Gly Gly Trp Leu Ser Cys Leu Ser 225 230 235 240 Ile Met Trp Thr Leu Ile Lys Asn Met Glu Lys Pro Gly Leu Lys Arg 245 250 255 <210> 404 <211> 768 <212> DNA <213> West Nile virus <400> 404 aatgaaatgg gctggctgga caagaccaag aatgacattg gcagcctgtt ggggcacagg 60 ccagaagcta gagagacgac cctgggagtt gagagcttct tacttgatct gcggccggcc 120 acggcatggt cgctctatgc cgtaacgaca gccgttctca cccctttgct gaagcatcta 180 atcacgtcag actacatcaa cacttcgttg acctcaataa acgtccaagc cagcgcgttg 240 ttcactttgg ccagaggctt cccttttgtg gacgttggtg tgtcagctct cttgctggcg 300 gtcgggtgct ggggtcaggt gactctgact gtgactgtga ctgcagctgc tctgctcttt 360 tgccactatg cttacatggt gccaggctgg caagcggaag ccatgcgatc tgcccagcgg 420 cggacagctg ctggcatcat gaaaaatgta gtggtggatg ggatcgtggc cactgatgta 480 cctgaacttg aacgaacaac tccagtcatg cagaaaaaag ttggacagat catattgatc 540 ttggtatcaa tggccgcggt ggtcgtcaat ccatcagtga gaaccgtcag agaggccgga 600 attctgacta cagcagcagc agtcacccta tgggagaatg gtgctagttc agtgtggaat 660 gcaacgacag ctattggcct ttgtcacatc atgcgaggag gatggctctc gtgtctctcc 720 atcatgtgga ctctcatcaa aaacatggag aaaccaggcc tcaagagg 768 <210> 405 <211> 768 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding WNV NS4B protein <400> 405 aacgagatgg gctggctgga caagaccaag aacgacatcg gaagcctgct gggccacaga 60 cctgaggcca gagaaacaac cctgggcgtc gagagcttcc tgctggatct tagacctgcc 120 accgcttgga gcctgtacgc cgttacaaca gccgtgctga cccctctgct gaagcacctg 180 atcaccagcg actacatcaa caccagcctg accagcatca acgtgcaggc cagcgctctg 240 tttaccctgg ccagaggctt cccctttgtg gacgtgggag tttctgctct gctgctggcc 300 gttggctgtt ggggacaagt gaccctgacc gtgacagtga ctgctgccgc tctgctgttc 360 tgccactacg cctatatggt gcctggatgg caggccgagg ccatgagatc tgcccagaga 420 agaacagccg ccggaatcat gaagaacgtg gtggtggatg gcatcgtggc caccgacgtt 480 ccagagctgg aaagaaccac acctgtgatg cagaagaaag tcggccagat catcctgatc 540 ctggtgtcca tggccgccgt ggtggtcaat cctagcgtgc ggacagttag agaggccggc 600 atcctgacaa cagctgccgc tgttaccctg tgggagaatg gcgctagcag cgtgtggaat 660 gccaccacag ccatcggcct gtgccacatc atgagaggcg gctggctgag ctgcctgagc 720 atcatgtgga ccctgatcaa gaacatggaa aagcccggcc tgaagcgg 768 <210> 406 <211> 768 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding WNV NS4B protein <400> 406 aacgagaugg gcuggcugga caagaccaag aacgacaucg gaagccugcu gggccacaga 60 ccugaggcca gagaaacaac ccugggcguc gagagcuucc ugcuggaucu uagaccugcc 120 accgcuugga gccuguacgc cguuacaaca gccgugcuga ccccucugcu gaagcaccug 180 aucaccagcg acuacaucaa caccagccug accagcauca acgugcaggc cagcgcucug 240 uuuacccugg ccagaggcuu ccccuuugug gacgugggag uuucugcucu gcugcuggcc 300 guuggcuguu ggggacaagu gacccugacc gugacaguga cugcugccgc ucugcuguuc 360 ugccacuacg ccuauauggu gccuggaugg caggccgagg ccaugagauc ugcccagaga 420 agaacagccg ccggaaucau gaagaacgug gugguggaug gcaucguggc caccgacguu 480 ccagagcugg aaagaaccac accugugaug cagaagaaag ucggccagau cauccugauc 540 cuggugucca uggccgccgu gguggucaau ccuagcgugc ggacaguuag agaggccggc 600 auccugacaa cagcugccgc uguuacccug ugggagaaug gcgcuagcag cguguggaau 660 gccaccacag ccaucggccu gugccacauc augagaggcg gcuggcugag cugccugagc 720 aucaugugga cccugaucaa gaacauggaa aagcccggcc ugaagcgg 768 <210> 407 <211> 297 <212> PRT <213> Rabies virus <400> 407 Met Ser Lys Ile Phe Val Asn Pro Ser Ala Ile Arg Ala Gly Leu Ala 1 5 10 15 Asp Leu Glu Met Ala Glu Glu Thr Val Asp Leu Ile Asn Arg Asn Ile 20 25 30 Glu Asp Asn Gln Ala His Leu Gln Gly Glu Pro Ile Glu Val Asp Asn 35 40 45 Leu Pro Glu Asp Met Gly Arg Leu His Leu Asp Asp Gly Lys Ser Pro 50 55 60 Asn Pro Gly Glu Met Ala Lys Val Gly Glu Gly Lys Tyr Arg Glu Asp 65 70 75 80 Phe Gln Met Asp Glu Gly Glu Asp Pro Ser Phe Leu Phe Gln Ser Tyr 85 90 95 Leu Glu Asn Val Gly Val Gln Ile Val Arg Gln Met Arg Ser Gly Glu 100 105 110 Arg Phe Leu Lys Ile Trp Ser Gln Thr Val Glu Glu Ile Ile Ser Tyr 115 120 125 Val Ala Val Asn Phe Pro Asn Pro Pro Gly Lys Ser Ser Glu Asp Lys 130 135 140 Ser Thr Gln Thr Thr Gly Arg Glu Leu Lys Lys Glu Thr Thr Pro Thr 145 150 155 160 Pro Ser Gln Arg Glu Ser Gln Ser Ser Lys Ala Arg Met Ala Ala Gln 165 170 175 Thr Ala Ser Gly Pro Pro Ala Leu Glu Trp Ser Ala Thr Asn Glu Lys 180 185 190 Asp Asp Leu Ser Val Glu Ala Glu Ile Ala His Gln Ile Ala Glu Ser 195 200 205 Phe Ser Lys Lys Tyr Lys Phe Pro Ser Arg Ser Ser Gly Ile Leu Leu 210 215 220 Tyr Asn Phe Glu Gln Leu Lys Met Asn Leu Asp Asp Ile Val Lys Glu 225 230 235 240 Ala Lys Asn Val Pro Gly Val Thr Arg Leu Ala His Asp Gly Ser Lys 245 250 255 Leu Pro Leu Arg Cys Val Leu Gly Trp Val Ala Leu Ala Asn Ser Lys 260 265 270 Lys Phe Gln Leu Leu Val Glu Ser Asp Lys Leu Ser Lys Ile Met Gln 275 280 285 Asp Asp Leu Asn Arg Tyr Thr Ser Cys 290 295 <210> 408 <211> 891 <212> DNA <213> Rabies virus <400> 408 atgagcaaga tctttgtcaa tcctagtgct attagagccg gtctggccga tcttgagatg 60 gctgaagaaa ctgttgatct gatcaataga aatatcgaag acaatcaggc tcatctccaa 120 ggggaaccca tagaagtgga caatctccct gaggatatgg ggcgacttca cctggatgat 180 ggaaaatcgc ccaaccctgg tgagatggcc aaggtgggag aaggcaagta tcgagaggac 240 tttcagatgg atgaaggaga ggatcctagc ttcctgttcc agtcatacct ggaaaatgtt 300 ggagtccaaa tagtcagaca aatgaggtca ggagagagat ttctcaagat atggtcacag 360 accgtagaag agattatatc ctatgtcgcg gtcaactttc ccaaccctcc aggaaagtct 420 tcagaggata aatcaaccca gactactggc cgagagctca agaaggagac aacacccact 480 ccttctcaga gagaaagcca atcatcgaaa gccaggatgg cggctcaaac tgcttctggc 540 cctccagccc ttgaatggtc ggccaccaat gaaaaggatg atctatcagt ggaggctgag 600 atcgctcacc agattgcaga aagtttctcc aaaaaatata agtttccctc tcgatcctca 660 gggatactct tgtataattt tgagcaattg aaaatgaacc ttgatgatat agttaaagag 720 gcaaaaaatg taccaggtgt gacccgttta gcccatgacg ggtccaaact ccccctaaga 780 tgtgtactgg gatgggtcgc tttggccaac tctaagaaat tccagttgtt agtcgaatcc 840 gacaagctga gtaaaatcat gcaagatgac ttgaatcgct atacatcttg c 891 <210> 409 <211> 891 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding Rabies virus PP protein <400> 409 atgagcaaga tcttcgtgaa ccccagcgcc atcagagccg gactggctga tctggaaatg 60 gccgaggaaa ccgtggacct gatcaaccgg aacatcgagg acaatcaggc ccatctgcag 120 ggcgagccta tcgaggttga caacctgcct gaggacatgg gcagactgca cctggatgat 180 ggcaagagcc ctaatcctgg cgagatggcc aaagtcggcg agggcaagta ccgcgaggac 240 ttccaaatgg acgagggcga agatcccagc ttcctgttcc agtcctacct ggaaaacgtg 300 ggcgtgcaga tcgtgcggca gatgagaagc ggcgagcggt tcctgaagat ctggtcccag 360 accgtggaag agatcatcag ctacgtggcc gtgaacttcc ccaatcctcc aggcaagagc 420 agcgaggaca agagcacaca gaccaccggc agagagctga agaaagagac aacccctaca 480 cctagccaga gagagagcca gagcagcaag gccagaatgg ccgctcagac agcttctgga 540 cctcctgcac ttgagtggag cgccaccaac gagaaggacg acctgtctgt ggaagccgag 600 atcgcccacc agatcgccga gagcttcagc aagaagtaca agttccccag cagaagcagc 660 ggcatcctgc tgtacaactt cgagcagctg aagatgaacc tggacgacat cgtgaaagag 720 gccaagaacg tccccggcgt gacaagactg gcccacgatg gatctaagct gcccctgaga 780 tgtgtgctcg gatgggttgc cctggccaac agcaagaaat tccagctgct ggtggaaagc 840 gacaagctgt ccaagatcat gcaggacgat ctgaaccggt acaccagctg c 891 <210> 410 <211> 891 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding Rabies virus PP protein <400> 410 augagcaaga ucuucgugaa ccccagcgcc aucagagccg gacuggcuga ucuggaaaug 60 gccgaggaaa ccguggaccu gaucaaccgg aacaucgagg acaaucaggc ccaucugcag 120 ggcgagccua ucgagguuga caaccugccu gaggacaugg gcagacugca ccuggaugau 180 ggcaagagcc cuaauccugg cgagauggcc aaagucggcg agggcaagua ccgcgaggac 240 uuccaaaugg acgagggcga agaucccagc uuccuguucc aguccuaccu ggaaaacgug 300 ggcgugcaga ucgugcggca gaugagaagc ggcgagcggu uccugaagau cuggucccag 360 accguggaag agaucaucag cuacguggcc gugaacuucc ccaauccucc aggcaagagc 420 agcgaggaca agagcacaca gaccaccggc agagagcuga agaaagagac aaccccuaca 480 ccuagccaga gagagagcca gagcagcaag gccagaaugg ccgcucagac agcuucugga 540 ccuccugcac uugaguggag cgccaccaac gagaaggacg accugucugu ggaagccgag 600 aucgcccacc agaucgccga gagcuucagc aagaaguaca aguuccccag cagaagcagc 660 ggcauccugc uguacaacuu cgagcagcug aagaugaacc uggacgacau cgugaaagag 720 gccaagaacg uccccggcgu gacaagacug gcccacgaug gaucuaagcu gccccugaga 780 ugugugcucg gauggguugc ccuggccaac agcaagaaau uccagcugcu gguggaaagc 840 gacaagcugu ccaagaucau gcaggacgau cugaaccggu acaccagcug c 891 <210> 411 <211> 441 <212> PRT <213> porcine epidemic diarrhea virus <400> 411 Met Ala Ser Val Ser Phe Gln Asp Arg Gly Arg Lys Arg Val Pro Leu 1 5 10 15 Ser Leu Tyr Ala Pro Leu Arg Val Thr Asn Asp Lys Pro Leu Ser Lys 20 25 30 Val Leu Ala Asn Asn Ala Val Pro Thr Asn Lys Gly Asn Lys Asp Gln 35 40 45 Gln Ile Gly Tyr Trp Asn Glu Gln Ile Arg Trp Arg Met Arg Arg Gly 50 55 60 Glu Arg Ile Glu Gln Pro Ser Asn Trp His Phe Tyr Tyr Leu Gly Thr 65 70 75 80 Gly Pro His Gly Asp Leu Arg Tyr Arg Thr Arg Thr Glu Gly Val Phe 85 90 95 Trp Val Ala Lys Glu Gly Ala Lys Thr Glu Pro Thr Asn Leu Gly Val 100 105 110 Arg Lys Ala Ser Glu Lys Pro Ile Ile Pro Lys Phe Ser Gln Gln Leu 115 120 125 Pro Ser Val Val Glu Ile Val Glu Pro Asn Thr Pro Pro Ala Ser Arg 130 135 140 Ala Asn Ser Arg Ser Arg Ser Arg Gly Asn Gly Asn Asn Arg Ser Arg 145 150 155 160 Ser Pro Ser Asn Asn Arg Gly Asn Asn Gln Ser Arg Gly Asn Ser Gln 165 170 175 Asn Arg Gly Asn Asn Gln Gly Arg Gly Ala Ser Gln Asn Arg Gly Gly 180 185 190 Asn Asn Asn Asn Asn Asn Lys Ser Arg Asn Gln Ser Asn Asn Arg Asn 195 200 205 Gln Ser Asn Asp Arg Gly Gly Val Thr Ser Arg Asp Asp Leu Val Ala 210 215 220 Ala Val Lys Asp Ala Leu Lys Ser Leu Gly Ile Gly Glu Asn Pro Asp 225 230 235 240 Arg His Lys Gln Gln Gln Lys Pro Lys Gln Glu Lys Ser Asp Asn Ser 245 250 255 Gly Lys Asn Thr Pro Lys Lys Asn Lys Ser Arg Ala Thr Ser Lys Glu 260 265 270 Arg Asp Leu Lys Asp Ile Pro Glu Trp Arg Arg Ile Pro Lys Gly Glu 275 280 285 Asn Ser Val Ala Ala Cys Phe Gly Pro Arg Gly Gly Phe Lys Asn Phe 290 295 300 Gly Asp Ala Glu Phe Val Glu Lys Gly Val Asp Ala Ser Gly Tyr Ala 305 310 315 320 Gln Ile Ala Ser Leu Ala Pro Asn Val Ala Ala Leu Leu Phe Gly Gly 325 330 335 Asn Val Ala Val Arg Glu Leu Ala Asp Ser Tyr Glu Ile Thr Tyr Asn 340 345 350 Tyr Lys Met Thr Val Pro Lys Ser Asp Pro Asn Val Glu Leu Leu Val 355 360 365 Ser Gln Val Asp Ala Phe Lys Thr Gly Asn Ala Lys Leu Gln Arg Lys 370 375 380 Lys Glu Lys Lys Asn Lys Arg Glu Thr Thr Leu Gln Gln His Glu Glu 385 390 395 400 Ala Ile Tyr Asp Asp Val Gly Ala Pro Ser Asp Val Thr His Ala Asn 405 410 415 Leu Glu Trp Asp Thr Ala Val Asp Gly Gly Asp Thr Ala Val Glu Ile 420 425 430 Ile Asn Glu Ile Phe Asp Thr Gly Asn 435 440 <210> 412 <211> 1323 <212> DNA <213> porcine epidemic diarrhea virus <400> 412 atggcttctg tcagctttca ggatcgtggc cgcaaacggg tgccattatc tctctatgcc 60 cctcttaggg ttactaatga caagcccctt tctaaggtac ttgcaaacaa cgctgtaccc 120 actaacaagg ggaataagga ccagcaaatt gggtactgga atgagcaaat tcgctggcgc 180 atgcgccgtg gtgagcgaat tgaacaacct tccaattggc atttctacta cctcggaaca 240 ggacctcacg gcgacctccg ttataggact cgtactgagg gtgttttctg ggttgctaaa 300 gaaggcgcaa agactgaacc cactaatttg ggtgtcagaa aggcgtctga aaagccaatc 360 attccaaaat tctctcaaca gctccccagt gtagttgaga ttgttgaacc taacacacct 420 cctgcttcac gtgcaaattc gcgtagcagg agtcgtggca atggcaacaa taggtctaga 480 tctccaagta acaacagagg caataaccag tcccgtggta attcacagaa tcgtggaaat 540 aaccagggtc gtggagcttc tcagaacaga ggaggcaata ataataacaa taacaagtct 600 cgtaaccagt ccaataacag gaaccagtca aatgaccgtg gtggtgtaac atcacgcgat 660 gatctggtgg ctgctgtcaa ggatgcactt aaatctttgg gtattggaga aaatcctgac 720 aggcataagc aacagcagaa gcctaagcag gaaaagtctg acaacagcgg caaaaataca 780 cctaagaaga acaaatccag ggccacttcg aaggaacgtg acctcaaaga catcccagag 840 tggaggagaa ttcccaaggg cgaaaatagc gtagcagctt gcttcggacc cagagggggc 900 ttcaaaaact ttggagatgc ggaatttgtc gaaaaaggtg ttgatgcgtc aggctatgct 960 cagatcgcca gtttagcacc aaatgttgca gcattgctct ttggtggtaa tgtggctgtt 1020 cgtgagctag cggactctta cgagattaca tacaactata aaatgactgt gccaaagtca 1080 gatccaaatg ttgagcttct tgtttcacag gtggatgcat ttaaaactgg gaatgcaaaa 1140 ctccagagaa agaaggaaaa gaagaacaag cgtgaaacca cgctgcagca gcatgaagag 1200 gccatctacg atgatgtggg tgcgccatct gatgtgaccc atgccaatct ggaatgggac 1260 acagctgttg atggtggtga tacggccgtt gaaattatca acgagatctt cgatacagga 1320 aat 1323 <210> 413 <211> 1323 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding PEDV N protein <400> 413 atggccagcg tcagctttca ggaccggggc agaaaaagag tgcccctgtc tctgtacgcc 60 cctctgagag tgaccaacga caagcccctg agcaaggtgc tggccaacaa tgccgtgcct 120 accaacaagg gcaacaagga ccagcagatc ggctactgga acgagcagat ccggtggcgg 180 atgagaagag gcgagagaat cgagcagccc agcaactggc acttctacta cctcggcaca 240 ggccctcacg gcgacctgag atacagaacc agaaccgagg gcgtgttctg ggtcgccaaa 300 gagggcgcca agaccgagcc tacaaatctc ggcgtcagaa aggccagcga gaagcctatc 360 atccccaagt tcagccagca gctgcccagc gtggtggaaa tcgtggaacc caatactcct 420 cctgccagcc gggccaacag cagaagcaga tctagaggca acggcaacaa tcggagcaga 480 agccccagca acaaccgggg caacaaccag tccagaggca acagccagaa ccgcggaaac 540 aatcaaggca gaggcgctag ccagaacaga ggcggcaaca acaacaataa caacaagagc 600 cggaaccagt ctaacaaccg caaccagagc aacgatagag gcggcgtgac cagcagggat 660 gatctggtgg ctgccgtgaa ggatgccctg aagtctctcg gcatcggcga gaaccccgac 720 agacacaagc agcagcagaa acccaagcaa gagaagtccg acaacagcgg caagaacacc 780 cctaagaaga acaagagcag ggccaccagc aaagagcggg acctgaagga tattcccgag 840 tggcggagaa tccccaaggg cgagaattct gtggccgcct gctttggacc aagaggcggc 900 ttcaagaatt tcggcgacgc cgagttcgtg gaaaaaggcg tggacgcctc tggctatgcc 960 cagattgcat ctctggcccc taatgtggct gccctgctgt ttggcggaaa cgtggccgtt 1020 agagagctgg ccgatagcta cgagatcacc tacaactaca agatgaccgt gcctaagagc 1080 gaccccaacg tggaactgct ggtgtctcag gtggacgcat tcaagaccgg caacgccaag 1140 ctgcagcgca agaaagagaa gaaaaacaag cgcgagacaa ccctgcagca gcacgaggaa 1200 gctatctacg acgacgtggg agccccttcc gatgtgacac acgccaacct ggaatgggac 1260 acagcagtgg atggcggcga taccgccgtg gaaatcatca acgagatctt cgacaccggc 1320 aac 1323 <210> 414 <211> 1323 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding PEDV N protein <400> 414 auggccagcg ucagcuuuca ggaccggggc agaaaaagag ugccccuguc ucuguacgcc 60 ccucugagag ugaccaacga caagccccug agcaaggugc uggccaacaa ugccgugccu 120 accaacaagg gcaacaagga ccagcagauc ggcuacugga acgagcagau ccgguggcgg 180 augagaagag gcgagagaau cgagcagccc agcaacuggc acuucuacua ccucggcaca 240 ggcccucacg gcgaccugag auacagaacc agaaccgagg gcguguucug ggucgccaaa 300 gagggcgcca agaccgagcc uacaaaucuc ggcgucagaa aggccagcga gaagccuauc 360 auccccaagu ucagccagca gcugcccagc gugguggaaa ucguggaacc caauacuccu 420 ccugccagcc gggccaacag cagaagcaga ucuagaggca acggcaacaa ucggagcaga 480 agccccagca acaaccgggg caacaaccag uccagaggca acagccagaa ccgcggaaac 540 aaucaaggca gaggcgcuag ccagaacaga ggcggcaaca acaacaauaa caacaagagc 600 cggaaccagu cuaacaaccg caaccagagc aacgauagag gcggcgugac cagcagggau 660 gaucuggugg cugccgugaa ggaugcccug aagucucucg gcaucggcga gaaccccgac 720 agacacaagc agcagcagaa acccaagcaa gagaaguccg acaacagcgg caagaacacc 780 ccuaagaaga acaagagcag ggccaccagc aaagagcggg accugaagga uauucccgag 840 uggcggagaa uccccaaggg cgagaauucu guggccgccu gcuuuggacc aagaggcggc 900 uucaagaauu ucggcgacgc cgaguucgug gaaaaaggcg uggacgccuc uggcuaugcc 960 cagauugcau cucuggcccc uaauguggcu gcccugcugu uuggcggaaa cguggccguu 1020 agagagcugg ccgauagcua cgagaucacc uacaacuaca agaugaccgu gccuaagagc 1080 gaccccaacg uggaacugcu ggugucucag guggacgcau ucaagaccgg caacgccaag 1140 cugcagcgca agaaagagaa gaaaaacaag cgcgagacaa cccugcagca gcacgaggaa 1200 gcuaucuacg acgacguggg agccccuucc gaugugacac acgccaaccu ggaaugggac 1260 acagcagugg auggcggcga uaccgccgug gaaaucauca acgagaucuu cgacaccggc 1320 aac 1323 <210> 415 <211> 512 <212> PRT <213> human herpesvirus 1 <400> 415 Met Ala Thr Asp Ile Asp Met Leu Ile Asp Leu Gly Leu Asp Leu Ser 1 5 10 15 Asp Ser Asp Leu Asp Glu Asp Pro Pro Glu Pro Ala Glu Ser Arg Arg 20 25 30 Asp Asp Leu Glu Ser Asp Ser Ser Gly Glu Cys Ser Ser Ser Asp Glu 35 40 45 Asp Met Glu Asp Pro His Gly Glu Asp Gly Pro Glu Pro Ile Leu Asp 50 55 60 Ala Ala Arg Pro Ala Val Arg Pro Ser Arg Pro Glu Asp Pro Gly Val 65 70 75 80 Pro Ser Thr Gln Thr Pro Arg Pro Thr Glu Arg Gln Gly Pro Asn Asp 85 90 95 Pro Gln Pro Ala Pro His Ser Val Trp Ser Arg Leu Gly Ala Arg Arg 100 105 110 Pro Ser Cys Ser Pro Glu Gln His Gly Gly Lys Val Ala Arg Leu Gln 115 120 125 Pro Pro Pro Thr Lys Ala Gln Pro Ala Arg Gly Gly Arg Arg Gly Arg 130 135 140 Arg Arg Gly Arg Gly Arg Gly Gly Pro Gly Ala Ala Asp Gly Leu Ser 145 150 155 160 Asp Pro Arg Arg Arg Ala Pro Arg Thr Asn Arg Asn Pro Gly Gly Pro 165 170 175 Arg Pro Gly Ala Gly Trp Thr Asp Gly Pro Gly Ala Pro His Gly Glu 180 185 190 Ala Trp Arg Gly Ser Glu Gln Pro Asp Pro Pro Gly Gly Gln Arg Thr 195 200 205 Arg Gly Val Arg Gln Ala Pro Pro Pro Leu Met Thr Leu Ala Ile Ala 210 215 220 Pro Pro Pro Ala Asp Pro Arg Ala Pro Ala Pro Glu Arg Lys Ala Pro 225 230 235 240 Ala Ala Asp Thr Ile Asp Ala Thr Thr Arg Leu Val Leu Arg Ser Ile 245 250 255 Ser Glu Arg Ala Ala Val Asp Arg Ile Ser Glu Ser Phe Gly Arg Ser 260 265 270 Ala Gln Val Met His Asp Pro Phe Gly Gly Gln Pro Phe Pro Ala Ala 275 280 285 Asn Ser Pro Trp Ala Pro Val Leu Ala Gly Gln Gly Gly Pro Phe Asp 290 295 300 Ala Glu Thr Arg Arg Val Ser Trp Glu Thr Leu Val Ala His Gly Pro 305 310 315 320 Ser Leu Tyr Arg Thr Phe Ala Gly Asn Pro Arg Ala Ala Ser Thr Ala 325 330 335 Lys Ala Met Arg Asp Cys Val Leu Arg Gln Glu Asn Phe Ile Glu Ala 340 345 350 Leu Ala Ser Ala Asp Glu Thr Leu Ala Trp Cys Lys Met Cys Ile His 355 360 365 His Asn Leu Pro Leu Arg Pro Gln Asp Pro Ile Ile Gly Thr Thr Ala 370 375 380 Ala Val Leu Asp Asn Leu Ala Thr Arg Leu Arg Pro Phe Leu Gln Cys 385 390 395 400 Tyr Leu Lys Ala Arg Gly Leu Cys Gly Leu Asp Glu Leu Cys Ser Arg 405 410 415 Arg Arg Leu Ala Asp Ile Lys Asp Ile Ala Ser Phe Val Phe Val Ile 420 425 430 Leu Ala Arg Leu Ala Asn Arg Val Glu Arg Gly Val Ala Glu Ile Asp 435 440 445 Tyr Ala Thr Leu Gly Val Gly Val Gly Glu Lys Met His Phe Tyr Leu 450 455 460 Pro Gly Ala Cys Met Ala Gly Leu Ile Glu Ile Leu Asp Thr His Arg 465 470 475 480 Gln Glu Cys Ser Ser Arg Val Cys Glu Leu Thr Ala Ser His Ile Val 485 490 495 Ala Pro Pro Tyr Val His Gly Lys Tyr Phe Tyr Cys Asn Ser Leu Phe 500 505 510 <210> 416 <211> 1536 <212> DNA <213> human herpesvirus 1 <400> 416 atggcgactg acattgatat gctaattgac ctcggcctgg acctctccga cagcgatctg 60 gacgaggacc cccccgagcc ggcggagagc cgccgcgacg acctggaatc ggacagcagc 120 ggggagtgtt cctcgtcgga cgaggacatg gaagaccccc acggagagga cggaccggag 180 ccgatactcg acgccgctcg cccggcggtc cgcccgtctc gtccagaaga ccccggcgta 240 cccagcaccc agacgcctcg tccgacggag cggcagggcc ccaacgatcc tcaaccagcg 300 ccccacagtg tgtggtcgcg cctcggggcc cggcgaccgt cttgctcccc cgagcagcac 360 gggggcaagg tggcccgcct ccaaccccca ccgaccaaag cccagcctgc ccgcggcgga 420 cgccgtgggc gtcgcagggg tcggggtcgc ggtggtcccg gggctgccga tggtttgtcg 480 gacccccgcc ggcgtgcccc cagaaccaat cgcaaccctg ggggaccccg ccccggggcg 540 gggtggacgg acggccccgg cgccccccat ggcgaggcgt ggcgcggcag tgagcagccc 600 gacccacccg gaggccagcg gacacggggc gtgcgccaag cacccccccc gctaatgacg 660 ctggcgattg cccccccgcc cgcggacccc cgcgccccgg ccccggagcg aaaggcgccc 720 gccgccgaca ccatcgacgc caccacgcgg ttggtcctgc gctccatctc cgagcgcgcg 780 gcggtcgacc gcatcagcga gagctttggc cgcagcgcac aggtcatgca cgaccccttt 840 ggggggcagc cgtttcccgc cgcgaatagc ccctgggccc cggtgctggc gggccaagga 900 gggccctttg acgccgagac cagacgggtc tcctgggaaa ccttggtcgc ccacggcccg 960 agcctctatc gcacttttgc cggcaatcct cgggccgcat cgaccgccaa ggccatgcgc 1020 gactgcgtgc tgcgccaaga aaatttcatc gaggcgctgg cctccgccga cgagacgctg 1080 gcgtggtgca agatgtgcat ccaccacaac ctgccgctgc gcccccagga ccccattatc 1140 gggacgaccg cggctgtgct ggataacctc gccacgcgcc tgcggccctt tctccagtgc 1200 tacctgaagg cgcgaggcct gtgcggcctg gacgaactgt gttcgcggcg gcgtctggcg 1260 gacattaagg acattgcatc cttcgtgttt gtcattctgg ccaggctcgc caaccgcgtc 1320 gagcgtggcg tcgcggagat cgactacgcg acccttggtg tcggggtcgg agagaagatg 1380 catttctacc tccccggggc ctgcatggcg ggcctgatcg aaatcctaga cacgcaccgc 1440 caggagtgtt cgagtcgtgt ctgcgagttg acggccagtc acatcgtcgc ccccccgtac 1500 gtgcacggca aatattttta ttgcaactcc ctgttt 1536 <210> 417 <211> 1536 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding HSV1 ICP27 protein <400> 417 atggccaccg acatcgacat gctgatcgac ctgggcctcg acctgagcga ctctgacctg 60 gatgaagatc ctcctgagcc tgccgagagc agaagggacg atctggaaag cgatagcagc 120 ggcgagtgta gcagcagcga cgaggacatg gaagatcccc acggcgagga tggacctgag 180 cctattctgg atgccgccag acctgccgtc agaccttcta gacctgaaga tccaggcgtg 240 cccagcacac agacccctag acctacagag agacagggcc ccaacgatcc tcagcctgct 300 cctcatagcg tgtggtctag actgggagcc agaaggccta gctgtagccc tgaacagcac 360 ggcggaaaag tggccagact gcagcctcct ccaacaaagg ctcaacctgc tagaggcggc 420 agacggggca gaagaagagg tagaggaaga ggtggacctg gcgccgctga tggactgtct 480 gatcctagaa gaagggcccc tcggaccaac agaaatcctg gcggacctag accaggcgcc 540 ggatggacag atggaccagg tgctccacat ggcgaggctt ggagaggatc tgagcagcct 600 gatcctccag gcggccaaag aacaagaggc gttagacagg ctcctcctcc tctgatgacc 660 ctggctattg ctcctccacc agccgatcct agagcacccg ctccagaaag aaaagcccct 720 gccgccgata ccatcgacgc cacaacaaga ctggtgctgc ggagcatctc tgagagggcc 780 gctgtggata gaatcagcga gagctttggg agaagcgccc aagtgatgca cgaccctttt 840 ggcggccagc cttttcctgc cgccaattct ccttgggctc ctgtgcttgc tggacaaggc 900 ggcccttttg acgccgagac aagaagagtg tcctgggaga cactggtggc ccacggacct 960 agcctgtaca gaacattcgc cggcaatcca agagccgcca gcacagccaa agccatgaga 1020 gactgcgtgc tgagacaaga gaacttcatc gaggccctgg ccagcgccga tgagacactt 1080 gcttggtgca agatgtgcat ccaccacaac ctgcctctga ggccacagga ccctatcatc 1140 ggaacaacag ctgccgtgct ggataacctg gctaccagac tgaggccctt cctgcagtgc 1200 tacctgaagg ccagaggact gtgtggcctg gatgagctgt gctccagaag aaggctggct 1260 gacatcaagg atatcgccag cttcgtgttc gtgattctgg cccggctggc caacagagtg 1320 gaaagaggcg tggccgagat cgactatgcc acactcggag ttggcgtggg cgagaagatg 1380 cacttttatc tgcctggcgc ctgcatggcc ggcctgatcg aaattctgga cacccacaga 1440 caagagtgca gctccagagt gtgcgagctg acagcctctc acattgtggc ccctccatac 1500 gtgcacggca agtacttcta ctgcaacagc ctgttc 1536 <210> 418 <211> 1536 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding HSV1 ICP27 protein <400> 418 auggccaccg acaucgacau gcugaucgac cugggccucg accugagcga cucugaccug 60 gaugaagauc cuccugagcc ugccgagagc agaagggacg aucuggaaag cgauagcagc 120 ggcgagugua gcagcagcga cgaggacaug gaagaucccc acggcgagga uggaccugag 180 ccuauucugg augccgccag accugccguc agaccuucua gaccugaaga uccaggcgug 240 cccagcacac agaccccuag accuacagag agacagggcc ccaacgaucc ucagccugcu 300 ccucauagcg uguggucuag acugggagcc agaaggccua gcuguagccc ugaacagcac 360 ggcggaaaag uggccagacu gcagccuccu ccaacaaagg cucaaccugc uagaggcggc 420 agacggggca gaagaagagg uagaggaaga gguggaccug gcgccgcuga uggacugucu 480 gauccuagaa gaagggcccc ucggaccaac agaaauccug gcggaccuag accaggcgcc 540 ggauggacag auggaccagg ugcuccacau ggcgaggcuu ggagaggauc ugagcagccu 600 gauccuccag gcggccaaag aacaagaggc guuagacagg cuccuccucc ucugaugacc 660 cuggcuauug cuccuccacc agccgauccu agagcacccg cuccagaaag aaaagccccu 720 gccgccgaua ccaucgacgc cacaacaaga cuggugcugc ggagcaucuc ugagagggcc 780 gcuguggaua gaaucagcga gagcuuuggg agaagcgccc aagugaugca cgacccuuuu 840 ggcggccagc cuuuuccugc cgccaauucu ccuugggcuc cugugcuugc uggacaaggc 900 ggcccuuuug acgccgagac aagaagagug uccugggaga cacugguggc ccacggaccu 960 agccuguaca gaacauucgc cggcaaucca agagccgcca gcacagccaa agccaugaga 1020 gacugcgugc ugagacaaga gaacuucauc gaggcccugg ccagcgccga ugagacacuu 1080 gcuuggugca agaugugcau ccaccacaac cugccucuga ggccacagga cccuaucauc 1140 ggaacaacag cugccgugcu ggauaaccug gcuaccagac ugaggcccuu ccugcagugc 1200 uaccugaagg ccagaggacu guguggccug gaugagcugu gcuccagaag aaggcuggcu 1260 gacaucaagg auaucgccag cuucguguuc gugauucugg cccggcuggc caacagagug 1320 gaaagaggcg uggccgagau cgacuaugcc acacucggag uuggcguggg cgagaagaug 1380 cacuuuuauc ugccuggcgc cugcauggcc ggccugaucg aaauucugga cacccacaga 1440 caagagugca gcuccagagu gugcgagcug acagccucuc acauuguggc cccuccauac 1500 gugcacggca aguacuucua cugcaacagc cuguuc 1536 <210> 419 <211> 247 <212> PRT <213> human herpesvirus 1 <400> 419 Met Ala Ala Asp Ala Pro Gly Asp Arg Met Glu Glu Pro Leu Pro Asp 1 5 10 15 Arg Ala Val Pro Ile Tyr Val Ala Gly Phe Leu Ala Leu Tyr Asp Ser 20 25 30 Gly Asp Ser Gly Glu Leu Ala Leu Asp Pro Asp Thr Val Arg Ala Ala 35 40 45 Leu Pro Pro Asp Asn Pro Leu Pro Ile Asn Val Asp His Arg Ala Gly 50 55 60 Cys Glu Val Gly Arg Val Leu Ala Val Val Asp Asp Pro Arg Gly Pro 65 70 75 80 Phe Phe Val Gly Leu Ile Ala Cys Val Gln Leu Glu Arg Val Leu Glu 85 90 95 Thr Ala Ala Ser Ala Ala Ile Phe Glu Arg Arg Gly Pro Pro Leu Ser 100 105 110 Arg Glu Glu Arg Leu Leu Tyr Leu Ile Thr Asn Tyr Leu Pro Ser Val 115 120 125 Ser Leu Ala Thr Lys Arg Leu Gly Gly Glu Ala His Pro Asp Arg Thr 130 135 140 Leu Phe Ala His Val Ala Leu Cys Ala Ile Gly Arg Arg Leu Gly Thr 145 150 155 160 Ile Val Thr Tyr Asp Thr Gly Leu Asp Ala Ala Ile Ala Pro Phe Arg 165 170 175 His Leu Ser Pro Ala Ser Arg Glu Gly Ala Arg Arg Leu Ala Ala Glu 180 185 190 Ala Glu Leu Ala Leu Ser Gly Arg Thr Trp Ala Pro Gly Val Glu Ala 195 200 205 Leu Thr His Thr Leu Leu Ser Thr Ala Val Asn Asn Met Met Leu Arg 210 215 220 Asp Arg Trp Ser Leu Val Ala Glu Arg Arg Arg Gln Ala Gly Ile Ala 225 230 235 240 Gly His Thr Tyr Leu Gln Ala 245 <210> 420 <211> 741 <212> DNA <213> human herpesvirus 1 <400> 420 atggcagccg atgccccggg agacaggatg gaggagcccc tgccagacag ggccgtgccc 60 atttacgtgg ctgggttttt ggccctgtat gacagcgggg actcgggcga gttggcattg 120 gatccggata cggtgcgggc ggccctgcct ccggataacc cactcccgat taacgtggac 180 caccgcgctg gctgcgaggt ggggcgggtg ctggccgtgg tcgacgaccc ccgcgggccg 240 ttttttgtgg ggctgatcgc ctgcgtgcag ctggagcgcg tcctcgagac ggccgccagc 300 gctgcgattt tcgagcgccg cgggccgccg ctctcccggg aggagcgcct gttgtacctg 360 atcaccaact acctgccctc ggtctccctg gccacaaaac gcctgggggg cgaggcgcac 420 cccgatcgca cgctgttcgc gcacgtcgcg ctgtgcgcga tcgggaggcg cctcggcact 480 atcgtcacct acgacaccgg tctcgacgcc gccatcgcgc cctttcgcca cctgtcgccg 540 gcgtctcgcg agggggcgcg gcgactggcc gccgaggccg agctcgcgct gtccggacgc 600 acctgggcgc ccggcgtgga ggcgctgacc cacacgctgc tttccaccgc cgttaacaac 660 atgatgctgc gggaccgctg gagcctggtg gccgagcggc ggcggcaggc cgggattgcc 720 ggacacacct acctccaggc g 741 <210> 421 <211> 741 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding HSV1 VP24 protein <400> 421 atggctgctg atgcccctgg cgacagaatg gaagaacccc tgcctgatag agccgtgcct 60 atctacgtgg ccggatttct ggccctgtac gactctggcg attctggcga actggccctg 120 gatcctgata cagtcagagc cgctctgcct cctgacaacc ctctgccaat caacgtggac 180 cacagagccg gctgtgaagt gggaagagtg ctggccgtgg tggacgatcc tagaggccct 240 ttctttgtgg gcctgatcgc ctgcgtgcag ctggaaagag ttctggaaac agccgccagc 300 gccgccatct tcgaaagaag aggacctcct ctgagccggg aagagagact gctgtacctg 360 atcaccaact acctgcctag cgtgtccctg gccacaaaga gacttggcgg agaggcccat 420 cctgacagaa ccctgtttgc ccatgtggcc ctgtgtgcca ttggtagaag gctgggcacc 480 atcgtgacct acgatacagg actggacgcc gctatcgccc cattcagaca tctgagccct 540 gccagcagag aaggcgccag aaggcttgct gctgaagccg aactggctct gagcggcaga 600 acatgggctc caggtgttga agccctgaca cacaccctgc tgagcaccgc cgtgaacaac 660 atgatgctgc gggacagatg gtccctggtg gccgagagaa gaaggcaggc tggaattgcc 720 ggccacacat atctgcaggc t 741 <210> 422 <211> 663 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding HSV1 VP24 <400> 422 cuggcccugu acgacucugg cgauucuggc gaacuggccc uggauccuga uacagucaga 60 gccgcucugc cuccugacaa cccucugcca aucaacgugg accacagagc cggcugugaa 120 gugggaagag ugcuggccgu gguggacgau ccuagaggcc cuuucuuugu gggccugauc 180 gccugcgugc agcuggaaag aguucuggaa acagccgcca gcgccgccau cuucgaaaga 240 agaggaccuc cucugagccg ggaagagaga cugcuguacc ugaucaccaa cuaccugccu 300 agcguguccc uggccacaaa gagacuuggc ggagaggccc auccugacag aacccuguuu 360 gcccaugugg cccugugugc cauugguaga aggcugggca ccaucgugac cuacgauaca 420 ggacuggacg ccgcuaucgc cccauucaga caucugagcc cugccagcag agaaggcgcc 480 agaaggcuug cugcugaagc cgaacuggcu cugagcggca gaacaugggc uccagguguu 540 gaagcccuga cacacacccu gcugagcacc gccgugaaca acaugaugcu gcgggacaga 600 uggucccugg uggccgagag aagaaggcag gcuggaauug ccggccacac auaucugcag 660 gcu 663 <210> 423 <211> 1174 <212> PRT <213> Murine Cytomegalovirus <400> 423 Met Asp Arg Gln Pro Lys Val Tyr Ser Asp Pro Asp Asn Gly Phe Phe 1 5 10 15 Phe Leu Asp Val Pro Met Pro Asp Asp Gly Gln Gly Gly Gln Gln Thr 20 25 30 Ala Thr Thr Ala Ala Gly Gly Ala Phe Gly Val Gly Gly Gly His Ser 35 40 45 Val Pro Tyr Val Arg Ile Met Asn Gly Val Ser Gly Ile Gln Ile Gly 50 55 60 Asn His Asn Ala Met Ser Ile Ala Ser Cys Trp Ser Pro Ser Tyr Thr 65 70 75 80 Asp Arg Arg Arg Arg Ser Tyr Pro Lys Thr Ala Thr Asn Ala Ala Ala 85 90 95 Asp Arg Val Ala Ala Ala Val Ser Ala Ala Asn Ala Ala Val Asn Ala 100 105 110 Ala Ala Ala Ala Ala Ala Ala Gly Gly Gly Gly Gly Ala Asn Leu Leu 115 120 125 Ala Ala Ala Val Thr Cys Ala Asn Gln Arg Gly Cys Cys Gly Gly Asn 130 135 140 Gly Gly His Ser Leu Pro Pro Thr Arg Met Pro Lys Thr Asn Ala Thr 145 150 155 160 Ala Ala Ala Ala Pro Ala Val Ala Gly Ala Ser Asn Ala Lys Ser Asp 165 170 175 Asn Asn His Ala Asn Ala Thr Ser Gly Ala Gly Ser Ala Ala Ala Thr 180 185 190 Pro Ala Ala Thr Thr Pro Ala Ala Thr Ala Val Glu Asn Arg Arg Pro 195 200 205 Ser Pro Ser Pro Ser Thr Ala Ser Thr Ala Pro Cys Asp Glu Gly Ser 210 215 220 Ser Pro Arg His His Arg Pro Ser His Val Ser Val Gly Thr Gln Ala 225 230 235 240 Thr Pro Ser Thr Pro Ile Pro Ile Pro Ala Pro Arg Cys Ser Thr Gly 245 250 255 Gln Gln Gln Gln Gln Pro Gln Ala Lys Lys Leu Lys Pro Ala Lys Ala 260 265 270 Asp Pro Leu Leu Tyr Ala Ala Thr Met Pro Pro Pro Ala Ser Val Thr 275 280 285 Thr Ala Ala Ala Ala Ala Val Ala Pro Glu Ser Glu Ser Ser Pro Ala 290 295 300 Ala Ser Ala Pro Pro Ala Ala Ala Ala Met Ala Thr Gly Gly Asp Asp 305 310 315 320 Glu Asp Gln Ser Ser Phe Ser Phe Val Ser Asp Asp Val Leu Gly Glu 325 330 335 Phe Glu Asp Leu Arg Ile Ala Gly Leu Pro Val Arg Asp Glu Met Arg 340 345 350 Pro Pro Thr Pro Thr Met Thr Val Ile Pro Val Ser Arg Pro Phe Arg 355 360 365 Ala Gly Arg Asp Ser Gly Arg Asp Ala Leu Phe Asp Asp Ala Val Glu 370 375 380 Ser Val Arg Cys Tyr Cys His Gly Ile Leu Gly Asn Ser Arg Phe Cys 385 390 395 400 Ala Leu Val Asn Glu Lys Cys Ser Glu Pro Ala Lys Glu Arg Met Ala 405 410 415 Arg Ile Arg Arg Tyr Ala Ala Asp Val Thr Arg Cys Gly Pro Leu Ala 420 425 430 Leu Tyr Thr Ala Ile Val Ser Ser Ala Asn Arg Leu Ile Gln Thr Asp 435 440 445 Pro Ser Cys Asp Leu Asp Leu Ala Glu Cys Tyr Val Glu Thr Ala Ser 450 455 460 Lys Arg Asn Ala Val Pro Leu Ser Ala Phe Tyr Arg Asp Cys Asp Arg 465 470 475 480 Leu Arg Asp Ala Val Ala Ala Phe Phe Lys Thr Tyr Gly Met Val Val 485 490 495 Asp Ala Met Ala Gln Arg Ile Thr Glu Arg Val Gly Pro Ala Leu Gly 500 505 510 Arg Gly Leu Tyr Ser Thr Val Val Met Met Asp Arg Cys Gly Asn Ser 515 520 525 Phe Gln Gly Arg Glu Glu Thr Pro Ile Ser Val Phe Ala Arg Val Ala 530 535 540 Ala Ala Leu Ala Val Glu Cys Glu Val Asp Gly Gly Val Ser Tyr Lys 545 550 555 560 Ile Leu Ser Ser Lys Pro Val Asp Ala Ala Gln Ala Phe Asp Ala Phe 565 570 575 Leu Ser Ala Leu Cys Ser Phe Ala Ile Ile Pro Ser Pro Arg Val Leu 580 585 590 Ala Tyr Ala Gly Phe Gly Gly Ser Asn Pro Ile Phe Asp Ala Val Ser 595 600 605 Tyr Arg Ala Gln Phe Tyr Ser Ala Glu Ser Thr Ile Asn Gly Thr Leu 610 615 620 His Asp Ile Cys Asp Met Val Thr Asn Gly Leu Ser Val Ser Val Ser 625 630 635 640 Ala Ala Asp Leu Gly Gly Asp Ile Val Ala Ser Leu His Ile Leu Gly 645 650 655 Gln Gln Cys Lys Ala Leu Arg Pro Tyr Ala Arg Phe Lys Thr Val Leu 660 665 670 Arg Ile Tyr Phe Asp Ile Trp Ser Val Asp Ala Leu Lys Ile Phe Ser 675 680 685 Phe Ile Leu Asp Val Gly Arg Glu Tyr Glu Gly Leu Met Ala Phe Ala 690 695 700 Val Asn Thr Pro Arg Ile Phe Trp Asp Arg Tyr Leu Asp Ser Ser Gly 705 710 715 720 Asp Lys Met Trp Leu Met Phe Ala Arg Arg Glu Ala Ala Ala Leu Cys 725 730 735 Gly Leu Asp Leu Lys Ser Phe Arg Asn Val Tyr Glu Lys Met Glu Arg 740 745 750 Asp Gly Arg Ser Ala Ile Thr Val Ser Pro Trp Trp Ala Val Cys Gln 755 760 765 Leu Asp Ala Cys Val Ala Arg Gly Asn Thr Ala Val Val Phe Pro His 770 775 780 Asn Val Lys Ser Met Ile Pro Glu Asn Ile Gly Arg Pro Ala Val Cys 785 790 795 800 Gly Pro Gly Val Ser Val Val Ser Gly Gly Phe Val Gly Cys Thr Pro 805 810 815 Ile His Glu Leu Cys Ile Asn Leu Glu Asn Cys Val Leu Glu Gly Ala 820 825 830 Ala Val Glu Ser Ser Val Asp Val Val Leu Gly Leu Gly Cys Arg Phe 835 840 845 Ser Phe Lys Ala Leu Glu Ser Leu Val Arg Asp Ala Val Val Leu Gly 850 855 860 Asn Leu Leu Ile Asp Met Thr Val Arg Thr Asn Ala Tyr Gly Ala Gly 865 870 875 880 Lys Leu Leu Thr Leu Tyr Arg Asp Leu His Ile Gly Val Val Gly Phe 885 890 895 His Ala Val Met Asn Arg Leu Gly Gln Lys Phe Ala Asp Met Glu Ser 900 905 910 Tyr Asp Leu Asn Gln Arg Ile Ala Glu Phe Ile Tyr Tyr Thr Ala Val 915 920 925 Arg Ala Ser Val Asp Leu Cys Met Ala Gly Ala Asp Pro Phe Pro Lys 930 935 940 Phe Pro Lys Ser Leu Tyr Ala Ala Gly Arg Phe Tyr Pro Asp Leu Phe 945 950 955 960 Asp Asp Asp Glu Arg Gly Pro Arg Arg Met Thr Lys Glu Phe Leu Glu 965 970 975 Lys Leu Arg Glu Asp Val Val Lys His Gly Ile Arg Asn Ala Ser Phe 980 985 990 Ile Thr Gly Cys Ser Ala Asp Glu Ala Ala Asn Leu Ala Gly Thr Thr 995 1000 1005 Pro Gly Phe Trp Pro Arg Arg Asp Asn Val Phe Leu Glu Gln Thr Pro 1010 1015 1020 Leu Met Met Thr Pro Thr Lys Asp Gln Met Leu Asp Glu Cys Val Arg 1025 1030 1035 1040 Ser Val Lys Ile Glu Pro His Arg Leu His Glu Glu Asp Leu Ser Cys 1045 1050 1055 Leu Gly Glu Asn Arg Pro Val Glu Leu Pro Val Leu Asn Ser Arg Leu 1060 1065 1070 Arg Gln Ile Ser Lys Glu Ser Ala Thr Val Ala Val Arg Arg Gly Arg 1075 1080 1085 Ser Ala Pro Phe Tyr Asp Asp Ser Asp Asp Glu Asp Glu Val Ala Cys 1090 1095 1100 Ser Glu Thr Gly Trp Thr Val Ser Thr Asp Ala Val Ile Lys Met Cys 1105 1110 1115 1120 Val Asp Arg Gln Pro Phe Val Asp His Ala Gln Ser Leu Pro Val Ala 1125 1130 1135 Ile Gly Phe Gly Gly Ser Ser Val Glu Leu Ala Arg His Leu Arg Arg 1140 1145 1150 Gly Asn Ala Leu Gly Leu Ser Val Gly Val Tyr Lys Cys Ser Met Pro 1155 1160 1165 Pro Ser Val Asn Tyr Arg 1170 <210> 424 <211> 3522 <212> DNA <213> Murine Cytomegalovirus <400> 424 atggatcgcc agcccaaagt ctactccgac ccggacaacg gattcttctt tttggatgtc 60 cccatgcctg acgacgggca gggaggccag cagaccgcca ccaccgctgc cgggggagcc 120 ttcggggtgg gtggggggca cagcgtgccc tacgtcagga tcatgaatgg agtctctgga 180 atacagatcg gaaaccataa tgctatgagc atcgcctctt gctggagtcc ctcctacact 240 gaccgacgcc gcaggagcta ccccaagacc gcgaccaacg cggcggcaga cagggtcgcc 300 gctgccgtct ccgccgccaa tgctgctgtc aatgctgctg ccgcggctgc tgccgccggc 360 gggggcggcg gcgctaacct actggctgct gctgtcactt gtgcaaatca gcgaggttgc 420 tgcggaggaa atggggggca ttccctccct cccacccgaa tgccgaagac caacgctacc 480 gccgcggccg ctcctgccgt cgccggtgct tccaacgcca agagtgacaa caatcacgct 540 aacgccacct ctggtgctgg atccgcggcc gccacccccg ccgccaccac ccccgccgcc 600 accgccgtcg aaaaccgacg acccagcccg agcccctcta cagcctcgac tgcgccctgt 660 gacgagggat cttctcctcg ccaccatcgt cctagtcacg ttagtgtcgg cactcaggcg 720 actccgtcga ctcctatccc gattcccgct ccccggtgca gcacaggcca acaacaacag 780 caacctcaag ccaagaagct taagcccgct aaagctgatc ccctcctgta cgcggcgacg 840 atgccgcctc ccgcgagcgt aacgaccgcc gctgccgctg ccgtcgcccc tgaatccgaa 900 tcctcacctg ccgcttcggc accaccagca gcagcagcga tggcgaccgg gggagacgac 960 gaagatcagt cgtctttctc gttcgtgagc gacgacgtcc tcggagaatt cgaagatctg 1020 cgcatcgccg ggctccccgt cagggacgag atgcgccccc cgaccccgac gatgacggtc 1080 attcccgtca gcaggccctt ccgcgcgggg cgcgacagcg ggcgcgacgc cttgtttgac 1140 gacgccgtcg agtccgtgcg ctgctactgc cacggcatcc tcggcaacag ccgattctgc 1200 gccctcgtca acgagaagtg ctccgaaccc gccaaggagc gcatggctcg catccgccgc 1260 tacgccgcgg acgtgacgcg ctgcggaccc ctcgcgctct acaccgccat cgtctccagc 1320 gccaaccgtc tcatccagac cgacccgtcg tgcgacctgg atctcgccga atgttacgtc 1380 gagacggcgt ccaagaggaa cgccgtcccc ctctcggcct tctaccgcga ctgcgatcgc 1440 ctgcgggatg ctgtcgccgc gttcttcaag acctacggca tggtggtgga cgccatggcg 1500 cagcgcatca cggagcgggt cgggccggcc ctgggtaggg gcctctactc gaccgtcgtc 1560 atgatggatc gctgcggaaa cagcttccag ggacgcgagg agacccccat ctccgtcttc 1620 gcccgggtcg ccgcggctct cgccgtcgag tgcgaggtcg acgggggcgt ctcgtacaag 1680 atcctcagct ccaagcccgt cgacgccgcg caggccttcg acgccttcct ctccgccctc 1740 tgctccttcg ccatcatccc ctcgccgcgg gtcctggcct acgccgggtt cggcggttcc 1800 aacccgatct tcgacgccgt ttcttaccgc gctcagttct actcggccga gagcacgatc 1860 aacggcaccc tgcacgacat ctgcgacatg gtgaccaacg gcctctcggt gtccgtcagc 1920 gcggcggacc tcggaggcga catcgtggcc tctctgcaca tcctcggaca gcagtgcaag 1980 gcgctgcggc cgtacgcgcg attcaagacc gtcttgagga tctacttcga catctggtcc 2040 gtcgacgctc tcaagatctt ctctttcatc ctcgacgtcg ggcgggaata cgagggcctg 2100 atggccttcg cggtcaacac gccgaggatc ttctgggatc gctacctaga cagctccggc 2160 gacaagatgt ggctcatgtt cgcgaggcgg gaggccgcgg ccctgtgcgg cctcgacctc 2220 aagtccttcc gtaacgtcta cgagaagatg gagcgtgacg ggcgcagcgc catcaccgtc 2280 tcgccctggt gggccgtctg tcagctcgac gcgtgcgtgg cgcggggcaa cacggccgtg 2340 gtcttccctc acaacgtcaa gagtatgatc cccgagaaca tcgggcgccc cgccgtgtgc 2400 ggacccggcg tctccgtcgt ctccggcggc ttcgtcggct gtacccccat ccacgagctg 2460 tgcatcaacc tggagaactg cgtcctggag ggcgcggcag tcgagagctc cgtcgacgtg 2520 gtcctcggtc tcggttgccg cttcagcttc aaggccctgg agtccctggt ccgcgacgcg 2580 gtggtgctgg gtaacctgct catcgacatg accgtgcgca ccaacgcgta cggcgccggc 2640 aagctcctga cgctctatcg cgacctgcac atcggggtcg tcggcttcca cgctgtgatg 2700 aatcgcctcg ggcagaagtt cgccgacatg gagtcttacg acctcaacca gcgtatcgcg 2760 gagtttatct actacaccgc cgtgcgggcc agcgtcgacc tgtgcatggc gggcgccgat 2820 ccgttcccca agttccctaa gagcctgtac gcggccggcc gcttctaccc cgacctcttc 2880 gacgacgacg agcgcggccc gcgtcgcatg accaaggagt tcctcgagaa actacgtgaa 2940 gacgtggtga aacacggcat caggaacgcc tccttcatca ccggctgctc ggccgacgaa 3000 gccgccaacc tggcgggcac cactccgggc ttctggccgc gccgcgacaa cgtctttctc 3060 gagcagacgc cgctcatgat gaccccgacg aaggatcaga tgctcgatga gtgcgtgcgc 3120 tccgtcaaga tcgagcccca tcgcctgcac gaggaggatc tctcctgtct cggcgagaac 3180 cggcccgtcg agctgcccgt gctcaacagc cgcctcaggc agatctcgaa agagtccgcg 3240 acggtcgccg tgcgccgcgg ccgctcggcg cccttctacg acgactcgga cgacgaggac 3300 gaggtggcgt gctccgagac cggctggacc gtgtcgaccg acgcggtcat caagatgtgc 3360 gtcgacagac agccgttcgt cgaccatgcg cagtcgctgc ccgtcgccat cggcttcggg 3420 gggtcttcgg tggaattggc gcgtcatctg agacgaggga acgctctggg actgtccgtc 3480 ggagtatata aatgtagtat gcccccttcc gtgaattatc gc 3522 <210> 425 <211> 3522 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding Murine CTMV M45 protein <400> 425 atggacagac agcccaaggt gtacagcgac cccgacaacg gcttcttctt cctggatgtg 60 cccatgcctg acgatggcca aggcggacag cagacagcta caacagctgc cggcggagcc 120 tttggagttg gcggaggaca ttctgtgccc tacgtgcgga tcatgaatgg cgtgtccggc 180 atccagatcg gcaaccacaa cgccatgtct atcgccagct gttggagccc cagctacacc 240 gatcggcgga gaagaagcta ccctaagacc gccacaaacg ccgctgccga tagagtggct 300 gctgctgtgt ctgccgctaa cgctgctgtg aatgctgctg ccgctgctgc agccgcaggc 360 ggcggaggcg gagctaatct tcttgcagca gccgtgacct gcgccaacca gagaggatgt 420 tgcggaggaa atggcggcca cagcctgcct ccaaccagaa tgcctaagac caatgccaca 480 gccgctgcag ctccagcagt tgccggtgcc tctaatgcca agagcgacaa caaccacgcc 540 aacgccacat ctggcgctgg atctgctgct gctacaccag ccgctacaac accagctgcc 600 accgccgttg agaacagaag gccatctcca agtcctagca ccgccagcac agccccttgt 660 gatgagggaa gcagccccag acaccacaga cctagccatg tgtctgtggg cacacaggcc 720 acacctagca caccaattcc tattccagct cctcggtgct ccacaggcca gcagcaacaa 780 cagcctcagg ccaagaagct gaagcccgcc aaagctgacc ctctgctgta tgccgcaacc 840 atgcctcctc cagcctctgt gactactgcc gcagcagctg cagtggcccc tgagtctgaa 900 tcttctcctg ccgcttctgc ccctccagca gccgccgcta tggctacagg cggagatgat 960 gaggaccaga gcagcttctc cttcgtgtcc gatgatgtgc tgggcgagtt cgaggacctg 1020 agaattgctg gactgcccgt gcgggatgag atgaggcctc ctacacctac catgacagtg 1080 atccccgtgt ctcggccttt cagagccggc agagattctg gcagagatgc cctgttcgac 1140 gacgccgtgg aaagcgtgcg gtgttactgt cacggcatcc tgggcaacag cagattctgc 1200 gccctggtca acgagaagtg tagcgagcct gccaaagaac ggatggcccg gattagaaga 1260 tacgccgccg acgtgacaag atgcggacct ctggctctgt acaccgccat tgtgtctagc 1320 gccaaccggc tgatccagac agaccctagc tgtgacctgg atctggccga gtgctacgtg 1380 gaaaccgcct ccaagagaaa cgccgtgcct ctgagcgcct tctacagaga ctgcgacaga 1440 ctgagagatg ccgtggccgc cttcttcaag acctacggca tggtggtgga cgccatggct 1500 cagagaatca ccgagagagt gggacccgct ctcggcagag gactgtattc taccgtggtc 1560 atgatggaca gatgcggcaa cagcttccag ggcagagaag agacacccat cagcgtgttc 1620 gccagagtgg ctgctgctct ggccgtggaa tgtgaagtgg atggcggcgt gtcctacaag 1680 atcctgagca gcaagcctgt ggatgccgct caggccttcg atgcctttct gagcgccctg 1740 tgcagcttcg ccatcattcc atctccaaga gtgctggcct acgccggctt tggcggcagc 1800 aatcctatct ttgacgccgt gtcttacagg gcccagttct acagcgccga gagcaccatc 1860 aatggcaccc tgcacgacat ctgcgacatg gtcacaaacg gcctgtccgt gtctgtgtct 1920 gccgctgatc tcggcggaga tatcgtggcc tctctgcaca ttctgggcca gcagtgcaaa 1980 gccctgaggc cttacgccag attcaagacc gtgctgcgga tctacttcga catttggagc 2040 gtggacgccc tgaagatctt tagcttcatc ctggacgtgg ggcgcgagta cgaaggactg 2100 atggcctttg ccgtgaatac ccctcggatc ttctgggaca gatacctgga cagcagcggc 2160 gacaagatgt ggctgatgtt tgccagaaga gaagccgccg ctctgtgcgg cctggatctg 2220 aagtccttcc ggaacgtgta cgagaagatg gaacgcgacg gccgctctgc catcacagtt 2280 agtccttggt gggccgtgtg tcagctggat gcctgtgtgg ccagaggcaa taccgccgtg 2340 gtgttccctc acaacgtgaa gtctatgatc cccgagaaca tcggcaggcc agccgtgtgt 2400 ggacctggcg ttagtgttgt gtctggcggc ttcgtgggct gcacacctat tcacgagctg 2460 tgcatcaacc tggaaaactg cgtgctggaa ggcgccgctg tggaatcctc tgtggatgtg 2520 gtgctcggcc tgggctgcag attcagcttt aaggccctgg aaagcctcgt gcgggatgct 2580 gtggttctgg gcaacctgct gatcgacatg accgtgcgga ccaatgccta tggcgctggc 2640 aaactgctga ccctgtaccg ggatctgcac atcggcgttg tgggattcca cgccgtgatg 2700 aacagactgg gccagaaatt cgccgacatg gaaagctacg acctgaacca gcggatcgcc 2760 gagttcatct actacacagc cgtcagagcc agcgtggacc tgtgtatggc tggcgccgat 2820 ccatttccta agttccccaa gagcctgtac gccgctggca gattctaccc cgacctgttc 2880 gacgacgatg agaggggccc tagacggatg accaaagagt tcctggaaaa gctgagggaa 2940 gatgtggtca agcacggcat ccggaacgcc agctttatca caggctgtag cgccgacgag 3000 gccgccaatc ttgctggaac aacacccggc ttttggccca gacgggacaa tgtgtttctg 3060 gaacagaccc ctctgatgat gacccctacc aaggaccaga tgctggacga gtgcgtgcgg 3120 agcgtgaaga tcgaacctca cagactgcac gaagaggacc tgagctgcct gggcgagaac 3180 agacctgtgg aactgcccgt gctgaacagc agactgcggc agatcagcaa agaaagcgcc 3240 accgtggccg tgcggagagg aagaagtgct ccattctacg acgacagcga cgacgaggat 3300 gaagtggcct gttctgagac aggctggacc gtgtctaccg atgccgtgat caagatgtgc 3360 gtggacagac agcccttcgt ggatcacgct cagtctctgc ctgtggccat cggctttgga 3420 ggctctagcg tggaactggc cagacacctg agaagaggca atgccctggg actgtctgtg 3480 ggcgtgtaca agtgtagcat gcctcctagc gtgaactacc gg 3522 <210> 426 <211> 3522 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding Murine CTMV M45 protein <400> 426 auggacagac agcccaaggu guacagcgac cccgacaacg gcuucuucuu ccuggaugug 60 cccaugccug acgauggcca aggcggacag cagacagcua caacagcugc cggcggagcc 120 uuuggaguug gcggaggaca uucugugccc uacgugcgga ucaugaaugg cguguccggc 180 auccagaucg gcaaccacaa cgccaugucu aucgccagcu guuggagccc cagcuacacc 240 gaucggcgga gaagaagcua cccuaagacc gccacaaacg ccgcugccga uagaguggcu 300 gcugcugugu cugccgcuaa cgcugcugug aaugcugcug ccgcugcugc agccgcaggc 360 ggcggaggcg gagcuaaucu ucuugcagca gccgugaccu gcgccaacca gagaggaugu 420 ugcggaggaa auggcggcca cagccugccu ccaaccagaa ugccuaagac caaugccaca 480 gccgcugcag cuccagcagu ugccggugcc ucuaaugcca agagcgacaa caaccacgcc 540 aacgccacau cuggcgcugg aucugcugcu gcuacaccag ccgcuacaac accagcugcc 600 accgccguug agaacagaag gccaucucca aguccuagca ccgccagcac agccccuugu 660 gaugagggaa gcagccccag acaccacaga ccuagccaug ugucuguggg cacacaggcc 720 acaccuagca caccaauucc uauuccagcu ccucggugcu ccacaggcca gcagcaacaa 780 cagccucagg ccaagaagcu gaagcccgcc aaagcugacc cucugcugua ugccgcaacc 840 augccuccuc cagccucugu gacuacugcc gcagcagcug caguggcccc ugagucugaa 900 ucuucuccug ccgcuucugc cccuccagca gccgccgcua uggcuacagg cggagaugau 960 gaggaccaga gcagcuucuc cuucgugucc gaugaugugc ugggcgaguu cgaggaccug 1020 agaauugcug gacugcccgu gcgggaugag augaggccuc cuacaccuac caugacagug 1080 auccccgugu cucggccuuu cagagccggc agagauucug gcagagaugc ccuguucgac 1140 gacgccgugg aaagcgugcg guguuacugu cacggcaucc ugggcaacag cagauucugc 1200 gcccugguca acgagaagug uagcgagccu gccaaagaac ggauggcccg gauuagaaga 1260 uacgccgccg acgugacaag augcggaccu cuggcucugu acaccgccau ugugucuagc 1320 gccaaccggc ugauccagac agacccuagc ugugaccugg aucuggccga gugcuacgug 1380 gaaaccgccu ccaagagaaa cgccgugccu cugagcgccu ucuacagaga cugcgacaga 1440 cugagagaug ccguggccgc cuucuucaag accuacggca ugguggugga cgccauggcu 1500 cagagaauca ccgagagagu gggacccgcu cucggcagag gacuguauuc uaccgugguc 1560 augauggaca gaugcggcaa cagcuuccag ggcagagaag agacacccau cagcguguuc 1620 gccagagugg cugcugcucu ggccguggaa ugugaagugg auggcggcgu guccuacaag 1680 auccugagca gcaagccugu ggaugccgcu caggccuucg augccuuucu gagcgcccug 1740 ugcagcuucg ccaucauucc aucuccaaga gugcuggccu acgccggcuu uggcggcagc 1800 aauccuaucu uugacgccgu gucuuacagg gcccaguucu acagcgccga gagcaccauc 1860 aauggcaccc ugcacgacau cugcgacaug gucacaaacg gccuguccgu gucugugucu 1920 gccgcugauc ucggcggaga uaucguggcc ucucugcaca uucugggcca gcagugcaaa 1980 gcccugaggc cuuacgccag auucaagacc gugcugcgga ucuacuucga cauuuggagc 2040 guggacgccc ugaagaucuu uagcuucauc cuggacgugg ggcgcgagua cgaaggacug 2100 auggccuuug ccgugaauac cccucggauc uucugggaca gauaccugga cagcagcggc 2160 gacaagaugu ggcugauguu ugccagaaga gaagccgccg cucugugcgg ccuggaucug 2220 aaguccuucc ggaacgugua cgagaagaug gaacgcgacg gccgcucugc caucacaguu 2280 aguccuuggu gggccgugug ucagcuggau gccugugugg ccagaggcaa uaccgccgug 2340 guguucccuc acaacgugaa gucuaugauc cccgagaaca ucggcaggcc agccgugugu 2400 ggaccuggcg uuaguguugu gucuggcggc uucgugggcu gcacaccuau ucacgagcug 2460 ugcaucaacc uggaaaacug cgugcuggaa ggcgccgcug uggaauccuc uguggaugug 2520 gugcucggcc ugggcugcag auucagcuuu aaggcccugg aaagccucgu gcgggaugcu 2580 gugguucugg gcaaccugcu gaucgacaug accgugcgga ccaaugccua uggcgcuggc 2640 aaacugcuga cccuguaccg ggaucugcac aucggcguug ugggauucca cgccgugaug 2700 aacagacugg gccagaaauu cgccgacaug gaaagcuacg accugaacca gcggaucgcc 2760 gaguucaucu acuacacagc cgucagagcc agcguggacc uguguauggc uggcgccgau 2820 ccauuuccua aguuccccaa gagccuguac gccgcuggca gauucuaccc cgaccuguuc 2880 gacgacgaug agaggggccc uagacggaug accaaagagu uccuggaaaa gcugagggaa 2940 gaugugguca agcacggcau ccggaacgcc agcuuuauca caggcuguag cgccgacgag 3000 gccgccaauc uugcuggaac aacacccggc uuuuggccca gacgggacaa uguguuucug 3060 gaacagaccc cucugaugau gaccccuacc aaggaccaga ugcuggacga gugcgugcgg 3120 agcgugaaga ucgaaccuca cagacugcac gaagaggacc ugagcugccu gggcgagaac 3180 agaccugugg aacugcccgu gcugaacagc agacugcggc agaucagcaa agaaagcgcc 3240 accguggccg ugcggagagg aagaagugcu ccauucuacg acgacagcga cgacgaggau 3300 gaaguggccu guucugagac aggcuggacc gugucuaccg augccgugau caagaugugc 3360 guggacagac agcccuucgu ggaucacgcu cagucucugc cuguggccau cggcuuugga 3420 ggcucuagcg uggaacuggc cagacaccug agaagaggca augcccuggg acugucugug 3480 ggcguguaca aguguagcau gccuccuagc gugaacuacc gg 3522 <210> 427 <211> 56 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 427 Met Met Leu Thr Thr Ser Cys Val Gly Ile Leu Ile Val Thr Thr Ile 1 5 10 15 Val Phe His Thr Ile Val Gln Leu Leu Gln Leu Ser Leu Pro Pro Val 20 25 30 Met Ala Gln Gln Ile Pro Leu Gln Asn Met Thr Thr Lys Leu Val Val 35 40 45 Ile Leu Arg Asn Gly Asn Leu Glu 50 55 <210> 428 <211> 168 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 428 atgatgctaa ctacttcctg tgttggcata ctaattgtta cgactattgt attccataca 60 atagtgcaac ttcttcaatt gtcattacct ccggtgatgg cacaacaaat cccattacag 120 aacatgacta ccaaattggt ggttattttg agaaatggga atctggag 168 <210> 429 <211> 168 <212> RNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 429 augaugcuaa cuacuuccug uguuggcaua cuaauuguua cgacuauugu auuccauaca 60 auagugcaac uucuucaauu gucauuaccu ccggugaugg cacaacaaau cccauuacag 120 aacaugacua ccaaauuggu gguuauuuug agaaauggga aucuggag 168 <210> 430 <211> 171 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding Pangolin CoV-2 ORF3b*57 <400> 430 atgatgctga ccaccagctg tgtgggcatc ctgatcgtga ccaccatcgt gttccacaca 60 atcgtgcagc tgctgcagct cagcctgcct cctgttatgg cccagcagat ccctctgcag 120 aacatgacca caaagctggt cgtgatcctg cggaacggca acctggaatg a 171 <210> 431 <211> 171 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding Pangolin CoV-2 ORF3b*57 <400> 431 augaugcuga ccaccagcug ugugggcauc cugaucguga ccaccaucgu guuccacaca 60 aucgugcagc ugcugcagcu cagccugccu ccuguuaugg cccagcagau cccucugcag 120 aacaugacca caaagcuggu cgugauccug cggaacggca accuggaaug a 171 <210> 432 <211> 78 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 432 Met Met Leu Thr Thr Ser Cys Val Gly Ile Leu Ile Val Thr Thr Ile 1 5 10 15 Val Phe His Thr Ile Val Gln Leu Leu Gln Leu Ser Leu Pro Pro Val 20 25 30 Met Ala Gln Gln Ile Pro Leu Gln Asn Met Thr Thr Lys Leu Val Val 35 40 45 Ile Leu Arg Asn Gly Asn Leu Glu Leu Lys Thr Val Leu Tyr Tyr Thr 50 55 60 Ala Thr Ser Leu Gln Ile Thr Thr Ser Cys Thr Gln Leu Asn 65 70 75 <210> 433 <211> 234 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 433 atgatgctaa ctacttcctg tgttggcata ctaattgtta cgactattgt attccataca 60 atagtgcaac ttcttcaatt gtcattacct ccggtgatgg cacaacaaat cccattacag 120 aacatgacta ccaaattggt ggttattttg agaaatggga atctggagct gaagactgtg 180 ttgtattaca cagctacttc acttcagatt actaccagct gtactcaact caat 234 <210> 434 <211> 234 <212> RNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 434 augaugcuaa cuacuuccug uguuggcaua cuaauuguua cgacuauugu auuccauaca 60 auagugcaac uucuucaauu gucauuaccu ccggugaugg cacaacaaau cccauuacag 120 aacaugacua ccaaauuggu gguuauuuug agaaauggga aucuggagcu gaagacugug 180 uuguauuaca cagcuacuuc acuucagauu acuaccagcu guacucaacu caau 234 <210> 435 <211> 237 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding Pangolin CoV-2 ORF3b*79 <400> 435 atgatgctga ccaccagctg tgtgggcatc ctgatcgtga ccaccatcgt gttccacaca 60 atcgtgcagc tgctgcagct cagcctgcct cctgttatgg cccagcagat ccctctgcag 120 aacatgacca caaagctggt cgtgatcctg cggaacggca acctggaact gaaaaccgtg 180 ctgtactaca ccgccaccag cctgcagatc accacaagct gcacccagct gaactga 237 <210> 436 <211> 237 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding Pangolin CoV-2 ORF3b*79 <400> 436 augaugcuga ccaccagcug ugugggcauc cugaucguga ccaccaucgu guuccacaca 60 aucgugcagc ugcugcagcu cagccugccu ccuguuaugg cccagcagau cccucugcag 120 aacaugacca caaagcuggu cgugauccug cggaacggca accuggaacu gaaaaccgug 180 cuguacuaca ccgccaccag ccugcagauc accacaagcu gcacccagcu gaacuga 237 <210> 437 <211> 109 <212> PRT <213> Middle East Respiratory Syndrome virus <400> 437 Met Asp Tyr Val Ser Leu Leu Asn Gln Ile Trp Gln Lys Tyr Leu Asn 1 5 10 15 Ser Pro Tyr Thr Thr Cys Leu Tyr Ile Pro Lys Pro Thr Ala Lys Tyr 20 25 30 Thr Pro Leu Val Gly Thr Ser Leu His Pro Val Leu Trp Asn Cys Gln 35 40 45 Leu Ser Phe Ala Gly Tyr Thr Glu Ser Ala Val Asn Ser Thr Lys Ala 50 55 60 Leu Ala Lys Gln Asp Ala Ala Gln Arg Ile Ala Trp Leu Leu His Lys 65 70 75 80 Asp Gly Gly Ile Pro Asp Gly Cys Ser Leu Tyr Leu Arg His Ser Ser 85 90 95 Leu Phe Ala Gln Ser Glu Glu Glu Glu Ser Phe Ser Asn 100 105 <210> 438 <211> 327 <212> DNA <213> Middle East Respiratory Syndrome virus <400> 438 atggactacg tgtccctgct gaaccagatt tggcagaagt acctgaacag cccctacacc 60 acctgtctgt acatccccaa gcctaccgcc aagtacacac ctctcgtggg cacatctctg 120 caccccgtgc tgtggaattg ccagctgagc tttgccggct acaccgagtc tgccgtgaac 180 agcacaaagg ccctggccaa acaggacgcc gctcagagaa ttgcctggct gctgcacaag 240 gatggcggca tccctgatgg ctgtagcctg tacctgagac acagcagcct gttcgcccag 300 agcgaggaag aggaatcctt cagcaac 327 <210> 439 <211> 327 <212> RNA <213> Middle East Respiratory Syndrome virus <400> 439 auggacuacg ugucccugcu gaaccagauu uggcagaagu accugaacag ccccuacacc 60 accugucugu acauccccaa gccuaccgcc aaguacacac cucucguggg cacaucucug 120 caccccgugc uguggaauug ccagcugagc uuugccggcu acaccgaguc ugccgugaac 180 agcacaaagg cccuggccaa acaggacgcc gcucagagaa uugccuggcu gcugcacaag 240 gauggcggca ucccugaugg cuguagccug uaccugagac acagcagccu guucgcccag 300 agcgaggaag aggaauccuu cagcaac 327 <210> 440 <211> 330 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding MERS-ORF4a <400> 440 atggactacg tgtccctgct gaatcagatc tggcagaagt acctgaacag cccctacacc 60 acctgtctgt acatccccaa gcctaccgcc aagtacacac ctctcgtggg cacatctctg 120 caccccgtgc tgtggaattg ccagctgagc tttgccggct acaccgagag cgccgtgaat 180 agcacaaagg ccctggccaa acaggacgcc gctcagagaa ttgcctggct gctgcacaag 240 gatggcggca tccctgatgg ctgtagcctg tacctgagac acagcagcct gttcgcccag 300 agcgaggaag aggaatcctt cagcaactga 330 <210> 441 <211> 330 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding MERS-ORF4a <400> 441 auggacuacg ugucccugcu gaaucagauc uggcagaagu accugaacag ccccuacacc 60 accugucugu acauccccaa gccuaccgcc aaguacacac cucucguggg cacaucucug 120 caccccgugc uguggaauug ccagcugagc uuugccggcu acaccgagag cgccgugaau 180 agcacaaagg cccuggccaa acaggacgcc gcucagagaa uugccuggcu gcugcacaag 240 gauggcggca ucccugaugg cuguagccug uaccugagac acagcagccu guucgcccag 300 agcgaggaag aggaauccuu cagcaacuga 330 <210> 442 <211> 168 <212> PRT <213> Bovine viral diarrhea virus <400> 442 Met Glu Leu Ile Thr Asn Glu Leu Leu Tyr Lys Thr Tyr Lys Gln Lys 1 5 10 15 Pro Val Gly Val Glu Glu Pro Val Tyr Asp Gln Ala Gly Asp Pro Leu 20 25 30 Phe Gly Glu Arg Gly Ala Val His Pro Gln Ser Thr Leu Lys Leu Pro 35 40 45 His Lys Arg Gly Glu Arg Asp Val Pro Thr Asn Leu Ala Ser Leu Pro 50 55 60 Lys Arg Gly Asp Cys Arg Thr Gly Asn Ser Arg Gly Pro Val Ser Gly 65 70 75 80 Ile Tyr Leu Lys Pro Gly Pro Leu Phe Tyr Gln Asp Tyr Lys Gly Pro 85 90 95 Val Tyr His Arg Ala Pro Leu Glu Leu Phe Glu Glu Gly Ser Met Cys 100 105 110 Glu Thr Thr Lys Arg Ile Gly Arg Val Thr Gly Ser Asp Gly Lys Leu 115 120 125 Tyr His Ile Tyr Val Cys Ile Asp Gly Cys Ile Ile Ile Lys Ser Ala 130 135 140 Thr Arg Ser Tyr Gln Arg Val Phe Arg Trp Val His Asn Arg Leu Asp 145 150 155 160 Cys Pro Leu Trp Val Thr Ser Cys 165 <210> 443 <211> 504 <212> DNA <213> Bovine viral diarrhea virus <400> 443 atggagttga tcacaaatga acttttatac aaaacataca aacaaaaacc cgtcggggtg 60 gaggaacctg tttatgatca ggcaggtgat cccttatttg gtgaaagggg agcagtccac 120 cctcaatcga cgctaaagct cccacacaag agaggggaac gcgatgttcc aaccaacttg 180 gcatccttac caaaaagagg tgactgcagg acgggtaata gcagaggacc tgtgagcggg 240 atctacctga agccagggcc actattttac caggactata aaggtcccgt ctatcacagg 300 gccccgctgg agctctttga ggagggatcc atgtgtgaaa cgactaaacg gatagggaga 360 gtaactggaa gtgacggaaa gctgtaccac atttatgtgt gtatagatgg atgtataata 420 ataaaaagtg ccacgagaag ttaccaaagg gtgttcaggt gggtccataa taggcttgac 480 tgccctctat gggtcacaag ttgc 504 <210> 444 <211> 504 <212> RNA <213> Bovine viral diarrhea virus <400> 444 auggaguuga ucacaaauga acuuuuauac aaaacauaca aacaaaaacc cgucggggug 60 gaggaaccug uuuaugauca ggcaggugau cccuuauuug gugaaagggg agcaguccac 120 ccucaaucga cgcuaaagcu cccacacaag agaggggaac gcgauguucc aaccaacuug 180 gcauccuuac caaaaagagg ugacugcagg acggguaaua gcagaggacc ugugagcggg 240 aucuaccuga agccagggcc acuauuuuac caggacuaua aaggucccgu cuaucacagg 300 gccccgcugg agcucuuuga ggagggaucc augugugaaa cgacuaaacg gauagggaga 360 guaacuggaa gugacggaaa gcuguaccac auuuaugugu guauagaugg auguauaaua 420 auaaaaagug ccacgagaag uuaccaaagg guguucaggu ggguccauaa uaggcuugac 480 ugcccucuau gggucacaag uugc 504 <210> 445 <211> 507 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding BVDV nPro <400> 445 atggaactga tcaccaacga gctgctgtac aagacctaca agcagaaacc cgtgggcgtc 60 gaggaacccg tgtatgatca agctggcgac cctctgtttg gcgagagagg cgctgttcac 120 cctcagagca cactgaagct gccccacaag cggggcgaaa gagatgtgcc taccaacctg 180 gccagcctgc ctaagagagg cgattgcaga accggcaata gcagaggccc tgtgtccggc 240 atctacctga aacctggacc actgttctac caggactaca agggccccgt gtaccacaga 300 gcacccctgg aacttttcga agagggcagc atgtgcgaaa ccaccaagcg gatcggaaga 360 gtgaccggct ctgacggcaa gctgtaccac atctacgtgt gcatcgacgg ctgcatcatc 420 atcaagagcg ccaccagatc ctaccagcgg gtgttcagat gggtgcacaa cagactggac 480 tgccctctgt gggtcaccag ctgctga 507 <210> 446 <211> 507 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding BVDV nPro <400> 446 auggaacuga ucaccaacga gcugcuguac aagaccuaca agcagaaacc cgugggcguc 60 gaggaacccg uguaugauca agcuggcgac ccucuguuug gcgagagagg cgcuguucac 120 ccucagagca cacugaagcu gccccacaag cggggcgaaa gagaugugcc uaccaaccug 180 gccagccugc cuaagagagg cgauugcaga accggcaaua gcagaggccc uguguccggc 240 aucuaccuga aaccuggacc acuguucuac caggacuaca agggccccgu guaccacaga 300 gcaccccugg aacuuuucga agagggcagc augugcgaaa ccaccaagcg gaucggaaga 360 gugaccggcu cugacggcaa gcuguaccac aucuacgugu gcaucgacgg cugcaucauc 420 aucaagagcg ccaccagauc cuaccagcgg guguucagau gggugcacaa cagacuggac 480 ugcccucugu gggucaccag cugcuga 507 <210> 447 <211> 197 <212> PRT <213> human herpesvirus 2 <400> 447 Met Val Arg Asp Cys Tyr Leu Met Gly Tyr Cys Arg Thr Arg Leu Gly 1 5 10 15 Pro Arg Thr Trp Gly Arg Leu Leu Gln Ile Ser Gly Gly Thr Trp Asp 20 25 30 Val Arg Leu Arg Asn Ala Ile Arg Glu Val Glu Ala His Phe Glu Pro 35 40 45 Ala Ala Glu Pro Val Cys Glu Leu Pro Cys Leu Asn Ala Arg Arg Tyr 50 55 60 Gly Pro Glu Cys Asp Val Gly Asn Leu Glu Thr Asn Gly Gly Ser Thr 65 70 75 80 Ser Asp Asp Glu Ile Ser Asp Ala Thr Asp Ser Asp Asp Thr Leu Ala 85 90 95 Ser His Ser Asp Thr Glu Gly Gly Pro Ser Pro Ala Gly Arg Glu Asn 100 105 110 Pro Glu Ser Ala Ser Gly Gly Ala Ile Ala Ala Arg Leu Glu Cys Glu 115 120 125 Phe Gly Thr Phe Asp Trp Thr Ser Glu Glu Gly Ser Gln Pro Trp Leu 130 135 140 Ser Ala Val Val Ala Asp Thr Ser Ser Ala Glu Arg Ser Gly Leu Pro 145 150 155 160 Ala Pro Gly Ala Cys Arg Ala Thr Glu Ala Pro Glu Arg Glu Asp Gly 165 170 175 Cys Arg Lys Met Arg Phe Pro Ala Ala Cys Pro Tyr Pro Cys Gly His 180 185 190 Thr Phe Leu Arg Pro 195 <210> 448 <211> 591 <212> DNA <213> human herpesvirus 2 <400> 448 atggtgcgag actgctacct catgggctac tgccggaccc gcctggggcc gcgcacgtgg 60 ggccgcctgc tgcagatctc gggcggaacc tgggacgtgc gcctgcgaaa cgcaatccgg 120 gaggtcgagg cgcattttga acccgccgcc gagcccgtgt gcgagctgcc ctgtctgaac 180 gccaggcgtt acggccccga gtgtgatgtt ggcaatctcg agaccaacgg cggctcgacg 240 agcgatgatg agatatcgga tgcgacggac tcggacgata ccctcgcgtc ccattccgac 300 acggaggggg ggccctcccc ggccggccgg gagaacccgg aatccgcgtc cggcggggct 360 atcgcggctc ggctggagtg tgagtttggg acgtttgact ggacgtccga ggagggctcc 420 cagccctggc tgtccgcggt ggtcgccgat accagctccg ccgaacgctc tggcctaccc 480 gccccgggcg cgtgtcgcgc aacggaagcc ccagaacgcg aggacgggtg ccgaaaaatg 540 cgcttccccg ccgcctgccc ctatccctgc ggccacacat ttctccggcc a 591 <210> 449 <211> 591 <212> RNA <213> human herpesvirus 2 <400> 449 auggugcgag acugcuaccu caugggcuac ugccggaccc gccuggggcc gcgcacgugg 60 ggccgccugc ugcagaucuc gggcggaacc ugggacgugc gccugcgaaa cgcaauccgg 120 gaggucgagg cgcauuuuga acccgccgcc gagcccgugu gcgagcugcc cugucugaac 180 gccaggcguu acggccccga gugugauguu ggcaaucucg agaccaacgg cggcucgacg 240 agcgaugaug agauaucgga ugcgacggac ucggacgaua cccucgcguc ccauuccgac 300 acggaggggg ggcccucccc ggccggccgg gagaacccgg aauccgcguc cggcggggcu 360 aucgcggcuc ggcuggagug ugaguuuggg acguuugacu ggacguccga ggagggcucc 420 cagcccuggc uguccgcggu ggucgccgau accagcuccg ccgaacgcuc uggccuaccc 480 gccccgggcg cgugucgcgc aacggaagcc ccagaacgcg aggacgggug ccgaaaaaug 540 cgcuuccccg ccgccugccc cuaucccugc ggccacacau uucuccggcc a 591 <210> 450 <211> 594 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding HSV US1 <400> 450 atggtccgag actgctacct gatgggctac tgcagaacca gactgggccc tagaacatgg 60 ggcagactgc tgcagatctc tggcggcaca tgggatgtgc ggctgagaaa cgccatcaga 120 gaggtggaag cccacttcga gcctgccgct gaacctgtgt gtgaactgcc ctgtctgaac 180 gctagaagat acggccctga gtgcgacgtg ggcaacctgg aaacaaatgg cggcagcacc 240 agcgacgacg agatctctga tgccaccgac agcgacgata cactggccag ccacagcgat 300 acagaaggcg gaccatctcc tgccggaaga gagaatcctg agtctgcctc tggcggagct 360 atcgccgcta gactggaatg cgagttcggc accttcgact ggacaagcga ggaaggctct 420 cagccttggc tgtctgctgt ggtggccgat acaagcagcg ccgaaagatc tggacttcct 480 gctcctggcg cctgcagagc tacagaagct cctgaaagag aggacggctg cagaaagatg 540 cggttccctg ccgcctgtcc ttatccttgc ggccacacat ttctgcggcc ctga 594 <210> 451 <211> 594 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding HSV US1 <400> 451 augguccgag acugcuaccu gaugggcuac ugcagaacca gacugggccc uagaacaugg 60 ggcagacugc ugcagaucuc uggcggcaca ugggaugugc ggcugagaaa cgccaucaga 120 gagguggaag cccacuucga gccugccgcu gaaccugugu gugaacugcc cugucugaac 180 gcuagaagau acggcccuga gugcgacgug ggcaaccugg aaacaaaugg cggcagcacc 240 agcgacgacg agaucucuga ugccaccgac agcgacgaua cacuggccag ccacagcgau 300 acagaaggcg gaccaucucc ugccggaaga gagaauccug agucugccuc uggcggagcu 360 aucgccgcua gacuggaaug cgaguucggc accuucgacu ggacaagcga ggaaggcucu 420 cagccuuggc ugucugcugu gguggccgau acaagcagcg ccgaaagauc uggacuuccu 480 gcuccuggcg ccugcagagc uacagaagcu ccugaaagag aggacggcug cagaaagaug 540 cgguucccug ccgccugucc uuauccuugc ggccacacau uucugcggcc cuga 594 <210> 452 <211> 218 <212> PRT <213> Middle East Respiratory Syndrome virus <400> 452 Met Ser Asn Met Thr Gln Leu Thr Glu Ala Gln Ile Ile Ala Ile Ile 1 5 10 15 Lys Asp Trp Asn Phe Ala Trp Ser Leu Ile Phe Leu Leu Ile Thr Ile 20 25 30 Val Leu Gln Tyr Gly Tyr Pro Ser Arg Ser Met Thr Val Tyr Val Phe 35 40 45 Lys Met Phe Val Leu Trp Leu Leu Trp Pro Ser Ser Met Ala Leu Ser 50 55 60 Ile Phe Ser Ala Ile Tyr Pro Ile Asp Leu Ala Ser Gln Ile Ile Ser 65 70 75 80 Gly Ile Val Ala Ala Val Ser Ala Met Met Trp Ile Ser Tyr Phe Val 85 90 95 Gln Ser Ile Arg Leu Phe Met Arg Thr Gly Ser Trp Trp Ser Phe Asn 100 105 110 Pro Glu Thr Asn Cys Leu Leu Asn Val Pro Phe Gly Gly Thr Thr Val 115 120 125 Val Arg Pro Leu Val Glu Asp Ser Thr Ser Val Thr Ala Val Val Thr 130 135 140 Asn Gly His Leu Lys Met Ala Gly Met His Phe Gly Ala Cys Asp Tyr 145 150 155 160 Asp Arg Leu Pro Asn Glu Val Thr Val Ala Lys Pro Asn Val Leu Ile 165 170 175 Ala Leu Lys Met Val Lys Arg Gln Ser Tyr Gly Thr Asn Ser Gly Val 180 185 190 Ala Ile Tyr His Arg Tyr Lys Ala Gly Asn Tyr Arg Ser Pro Pro Ile 195 200 205 Thr Ala Asp Ile Glu Leu Ala Leu Leu Arg 210 215 <210> 453 <211> 654 <212> DNA <213> Middle East Respiratory Syndrome virus <400> 453 atgtctaata tgacgcaact cactgaggcg cagattattg ccattattaa agactggaac 60 tttgcatggt ccctgatctt tctcttaatt actatcgtac tacagtatgg atacccatcc 120 cgtagtatga ctgtctatgt ctttaaaatg tttgttttat ggctcctatg gccatcttcc 180 atggcgctat caatatttag cgccatttat ccaattgatc tagcttccca gataatctct 240 ggcattgtag cagctgtttc agctatgatg tggatttcct actttgtgca gagtatccgg 300 ctgtttatga gaactggatc atggtggtca ttcaatcctg agactaattg ccttttgaac 360 gttccatttg gtggtacaac tgtcgtacgt ccactcgtag aggactccac cagtgtaact 420 gctgttgtaa ccaatggcca cctcaaaatg gctggcatgc atttcggtgc ttgtgactac 480 gacagacttc ctaatgaagt caccgtggcc aaacccaatg tgctgattgc tttaaaaatg 540 gtgaagcggc aaagctacgg aactaattcc ggcgttgcca tttaccatag atataaggca 600 ggtaattaca ggagtccgcc tattacggcg gatattgaac ttgcattgct tcga 654 <210> 454 <211> 654 <212> RNA <213> Middle East Respiratory Syndrome virus <400> 454 augucuaaua ugacgcaacu cacugaggcg cagauuauug ccauuauuaa agacuggaac 60 uuugcauggu cccugaucuu ucucuuaauu acuaucguac uacaguaugg auacccaucc 120 cguaguauga cugucuaugu cuuuaaaaug uuuguuuuau ggcuccuaug gccaucuucc 180 auggcgcuau caauauuuag cgccauuuau ccaauugauc uagcuuccca gauaaucucu 240 ggcauuguag cagcuguuuc agcuaugaug uggauuuccu acuuugugca gaguauccgg 300 cuguuuauga gaacuggauc auggugguca uucaauccug agacuaauug ccuuuugaac 360 guuccauuug gugguacaac ugucguacgu ccacucguag aggacuccac caguguaacu 420 gcuguuguaa ccaauggcca ccucaaaaug gcuggcaugc auuucggugc uugugacuac 480 gacagacuuc cuaaugaagu caccguggcc aaacccaaug ugcugauugc uuuaaaaaug 540 gugaagcggc aaagcuacgg aacuaauucc ggcguugcca uuuaccauag auauaaggca 600 gguaauuaca ggaguccgcc uauuacggcg gauauugaac uugcauugcu ucga 654 <210> 455 <211> 657 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised DNA encoding MERS CoV M <400> 455 atgagcaaca tgacccagct gacagaggcc cagatcattg ccatcatcaa ggactggaac 60 ttcgcttgga gcctgatctt cctgctgatc accatcgtgc tgcagtacgg ctaccccagc 120 agatccatga ccgtgtacgt gttcaagatg ttcgtcctgt ggctgctgtg gcccagctct 180 atggccctga gcatcttcag cgccatctat cccatcgacc tggccagcca gatcatctct 240 ggaatcgtgg ccgccgtgtc cgccatgatg tggatcagct acttcgtgca gagcatccgg 300 ctgttcatga gaaccggcag ctggtggtcc ttcaatcccg agacaaactg cctgctgaac 360 gtgccctttg gcggcactac agtcgtcaga cccctggtgg aagatagcac ctctgtgacc 420 gccgtggtca ccaatggcca cctgaaaatg gccggcatgc acttcggcgc ctgcgactat 480 gacagactgc ccaacgaagt gaccgtggcc aagcctaatg tgctgatcgc cctgaagatg 540 gtcaagcggc agagctacgg caccaattct ggcgtggcca tctaccacag atacaaggcc 600 ggcaactaca gaagccctcc tatcaccgcc gacatcgagc tggctctgct gagatga 657 <210> 456 <211> 657 <212> RNA <213> Artificial Sequence <220> <223> Codon optimised RNA encoding MERS CoV M <400> 456 augagcaaca ugacccagcu gacagaggcc cagaucauug ccaucaucaa ggacuggaac 60 uucgcuugga gccugaucuu ccugcugauc accaucgugc ugcaguacgg cuaccccagc 120 agauccauga ccguguacgu guucaagaug uucguccugu ggcugcugug gcccagcucu 180 auggcccuga gcaucuucag cgccaucuau cccaucgacc uggccagcca gaucaucucu 240 ggaaucgugg ccgccguguc cgccaugaug uggaucagcu acuucgugca gagcauccgg 300 cuguucauga gaaccggcag cugguggucc uucaaucccg agacaaacug ccugcugaac 360 gugcccuuug gcggcacuac agucgucaga ccccuggugg aagauagcac cucugugacc 420 gccgugguca ccaauggcca ccugaaaaug gccggcaugc acuucggcgc cugcgacuau 480 gacagacugc ccaacgaagu gaccguggcc aagccuaaug ugcugaucgc ccugaagaug 540 gucaagcggc agagcuacgg caccaauucu ggcguggcca ucuaccacag auacaaggcc 600 ggcaacuaca gaagcccucc uaucaccgcc gacaucgagc uggcucugcu gagauga 657 <210> 457 <211> 712 <212> RNA <213> Artificial Sequence <220> <223> RNA construct <400> 457 cggagacggc gcagaagaag aggaucuggc gaaggcagag gcagccugcu uacauguggc 60 gacguggaag agaaccccgg accuaugcac cagaaacgga ccgccauguu ccaggauccu 120 caagagaggc ccagaaagcu gccucagcug uguaccgagc ugcagaccac cauccacgac 180 aucauccugg aaugcgugua cugcaagcag cagcuccugc ggagagaggu guacgauuuc 240 gccuuccggg accugugcau cguguacaga gauggcaacc ccuacgccgu gugcgacaag 300 ugccugaagu ucuacagcaa gaucagcgag uaccggcacu acugcuacag ccuguacggc 360 accacacugg aacagcagua caacaagccc cugugcgacc ugcugauccg gugcaucaac 420 ugccagaaac cucugugccc cgaggaaaag cagcggcacc uggacaagaa gcagcgguuc 480 cacaacauca gaggccggug gaccggcaga ugcaugagcu guugucggag cagcagaacc 540 agacgggaaa cccagcugug agcggccgcg aauuggcaag cugcuuacau agaacucgcg 600 gcgauuggca ugccgccuua aaauuuuuau uuuauuuuuc uuuucuuuuc cgaaucggau 660 uuuguuuuua auauuucaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aa 712 <210> 458 <211> 712 <212> DNA <213> Artificial Sequence <220> <223> Nucleic acid sequence encoding RNA construct <400> 458 cggagacggc gcagaagaag aggatctggc gaaggcagag gcagcctgct tacatgtggc 60 gacgtggaag agaaccccgg acctatgcac cagaaacgga ccgccatgtt ccaggatcct 120 caagagaggc ccagaaagct gcctcagctg tgtaccgagc tgcagaccac catccacgac 180 atcatcctgg aatgcgtgta ctgcaagcag cagctcctgc ggagagaggt gtacgatttc 240 gccttccggg acctgtgcat cgtgtacaga gatggcaacc cctacgccgt gtgcgacaag 300 tgcctgaagt tctacagcaa gatcagcgag taccggcact actgctacag cctgtacggc 360 accacactgg aacagcagta caacaagccc ctgtgcgacc tgctgatccg gtgcatcaac 420 tgccagaaac ctctgtgccc cgaggaaaag cagcggcacc tggacaagaa gcagcggttc 480 cacaacatca gaggccggtg gaccggcaga tgcatgagct gttgtcggag cagcagaacc 540 agacgggaaa cccagctgtg agcggccgcg aattggcaag ctgcttacat agaactcgcg 600 gcgattggca tgccgcctta aaatttttat tttatttttc ttttcttttc cgaatcggat 660 tttgttttta atatttcaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aa 712 <210> 459 <211> 2520 <212> DNA <213> Artificial Sequence <220> <223> Recombinant vector <400> 459 cggagacggc gcagaagaag aggatctggc gaaggcagag gcagcctgct tacatgtggc 60 gacgtggaag agaaccccgg acctatgcac cagaaacgga ccgccatgtt ccaggatcct 120 caagagaggc ccagaaagct gcctcagctg tgtaccgagc tgcagaccac catccacgac 180 atcatcctgg aatgcgtgta ctgcaagcag cagctcctgc ggagagaggt gtacgatttc 240 gccttccggg acctgtgcat cgtgtacaga gatggcaacc cctacgccgt gtgcgacaag 300 tgcctgaagt tctacagcaa gatcagcgag taccggcact actgctacag cctgtacggc 360 accacactgg aacagcagta caacaagccc ctgtgcgacc tgctgatccg gtgcatcaac 420 tgccagaaac ctctgtgccc cgaggaaaag cagcggcacc tggacaagaa gcagcggttc 480 cacaacatca gaggccggtg gaccggcaga tgcatgagct gttgtcggag cagcagaacc 540 agacgggaaa cccagctgtg agcggccgcg aattggcaag ctgcttacat agaactcgcg 600 gcgattggca tgccgcctta aaatttttat tttatttttc ttttcttttc cgaatcggat 660 tttgttttta atatttcaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aacgcgtcga 720 ggggaattaa ttcttgaaga cgaaagggcc aggtggcact tttcggggaa atgtgcgcgg 780 aacccctatt tgtttatttt tctaaataca ttcaaatatg tatccgctca tgagacaata 840 accctgataa atgcttcaat aatattgaaa aaggaagagt atgagtattc aacatttccg 900 tgtcgccctt attccctttt ttgcggcatt ttgccttcct gtttttgctc acccagaaac 960 gctggtgaaa gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt acatcgaact 1020 ggatctcaac agcggtaaga tccttgagag ttttcgcccc gaagaacgtt ttccaatgat 1080 gagcactttt aaagttctgc tatgtggcgc ggtattatcc cgtgttgacg ccgggcaaga 1140 gcaactcggt cgccgcatac actattctca gaatgacttg gttgagtact caccagtcac 1200 agaaaagcat cttacggatg gcatgacagt aagagaatta tgcagtgctg ccataaccat 1260 gagtgataac actgcggcca acttacttct gacaacgatc ggaggaccga aggagctaac 1320 cgcttttttg cacaacatgg gggatcatgt aactcgcctt gatcgttggg aaccggagct 1380 gaatgaagcc ataccaaacg acgagcgtga caccacgatg cctgtagcaa tggcaacaac 1440 gttgcgcaaa ctattaactg gcgaactact tactctagct tcccggcaac aattaataga 1500 ctggatggag gcggataaag ttgcaggacc acttctgcgc tcggcccttc cggctggctg 1560 gtttattgct gataaatctg gagccggtga gcgtgggtct cgcggtatca ttgcagcact 1620 ggggccagat ggtaagccct cccgtatcgt agttatctac acgacgggga gtcaggcaac 1680 tatggatgaa cgaaatagac agatcgctga gataggtgcc tcactgatta agcattggta 1740 actgtcagac caagtttact catatatact ttagattgat ttaaaacttc atttttaatt 1800 taaaaggatc taggtgaaga tcctttttga taatctcatg accaaaatcc cttaacgtga 1860 gttttcgttc cactgagcgt cagaccccgt agaaaagatc aaaggatctt cttgagatcc 1920 tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt 1980 ttgtttgccg gatcaagagc taccaactct ttttccgaag gtaactggct tcagcagagc 2040 gcagatacca aatactgtcc ttctagtgta gccgtagtta ggccaccact tcaagaactc 2100 tgtagcaccg cctacatacc tcgctctgct aatcctgtta ccagtggctg ctgccagtgg 2160 cgataagtcg tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg 2220 gtcgggctga acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga 2280 actgagatac ctacagcgtg agcattgaga aagcgccacg cttcccgaag ggagaaaggc 2340 ggacaggtat ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg 2400 gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg 2460 atttttgtga tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcgagctc 2520 2520

Claims (24)

  1. (ⅰ) 적어도 하나의 치료 생체분자; 및 (ⅱ) 적어도 하나의 바이러스 선천적 억제제 단백질(IIP);을 암호화하는 RNA 구조체.
  2. 청구항 1에 있어서,
    상기 구조체는 mRNA 분자인 RNA 구조체.
  3. 청구항 1에 있어서,
    상기 구조체는 saRNA 분자인 RNA 구조체.
  4. 청구항 1 내지 청구항 3 중 어느 한 항에 있어서,
    상기 구조체는 알파바이러스; 피코르나바이러스; 플라비바이러스; 루비바이러스; 페스티바이러스; 헤파시바이러스; 칼리시바이러스 및 코로나바이러스;로 이루어진 속의 군으로부터 선택되는 양성 가닥 RNA 바이러스, 바람직하게는 알파바이러스, 임의적으로는 VEEV를 포함하거나 이로부터 유래되는 RNA 구조체.
  5. 청구항 1 내지 청구항 4 중 어느 한 항에 있어서,
    상기 적어도 하나의 선천적 억제제 단백질(IIP)은
    (ⅰ) HPV16 E6, 또는 그의 동원체;
    (ⅱ) HSV ICP34.5, 또는 그의 동원체;
    (ⅲ) HCV E2, 또는 그의 동원체;
    (ⅳ) HCV NS5a, 또는 그의 동원체;
    (ⅴ) VACV E3L, 또는 그의 동원체;
    (ⅵ) VACV K3L, 또는 그의 동원체;
    (ⅶ) MERS ORF8B, 또는 그의 동원체;
    (ⅷ) KSHV ORF52, 또는 그의 동원체; 및/또는
    (ⅸ) 에볼라 VP35, 또는 그의 동원체;인 RNA 구조체.
  6. 청구항 1 내지 청구항 5 중 어느 한 항에 있어서,
    상기 적어도 하나의 선천적 억제제 단백질(IIP)은 백시니아 C6, 또는 그의 동원체인 RNA 구조체.
  7. 청구항 1 내지 청구항 6 중 어느 한 항에 있어서,
    상기 적어도 하나의 선천적 억제제 단백질(IIP)은 EV71-2Apro, 또는 그의 동원체인 RNA 구조체.
  8. 청구항 1 내지 청구항 7 중 어느 한 항에 있어서,
    상기 적어도 하나의 선천적 억제제 단백질(IIP)은 BVDV nPro, 또는 그의 동원체인 RNA 구조체.
  9. 청구항 1 내지 청구항 8 중 어느 한 항에 있어서,
    상기 적어도 하나의 선천적 억제제 단백질(IIP)은 HSV Us1, 또는 그의 동원체인 RNA 구조체.
  10. 청구항 1 내지 청구항 9 중 어느 한 항에 있어서,
    상기 적어도 하나의 선천적 억제제 단백질(IIP)은 원숭이 바이러스 5(PIV5 비-구조 단백질 V), 또는 그의 동원체인 RNA 구조체.
  11. 청구항 1 내지 청구항 10 중 어느 한 항에 있어서,
    상기 적어도 하나의 선천적 억제제 단백질(IIP)은 (i) 야생형 SARS-CoV-2 ORF3b의 ORF3b*57 변이체, 또는 그의 동원체, 또는 (ii) 야생형 SARS-CoV-2 ORF3b의 ORF3b*57 에콰도르 변이체, 또는 그의 동원체인 RNA 구조체.
  12. 청구항 1 내지 청구항 11 중 어느 한 항에 있어서,
    상기 적어도 하나의 선천적 억제제 단백질(IIP)은 (i) 야생형 SARS-CoV-2 ORF3b의 ORF3b*57 천산갑 변이체, 또는 그의 동원체, 또는 (ii) 야생형 SARS-CoV-2 ORF3b의 ORF3b*79 변이체, 또는 그의 동원체인 RNA 구조체.
  13. 청구항 1 내지 청구항 12 중 어느 한 항에 있어서,
    상기 적어도 하나의 선천적 억제제 단백질(IIP)은 야생형 SARS-CoV-2 ORF3b의 ORF3b*79 천산갑 변이체, 또는 그의 동원체인 RNA 구조체.
  14. 청구항 1 내지 청구항 13 중 어느 한 항에 있어서,
    상기 치료 생체분자는 치료 단백질을 포함하고, 바람직하게는 상기 단백질 또는 펩티드는 항원, 보다 바람직하게는 바이러스 항원인 RNA 구조체.
  15. 청구항 1 내지 청구항 14 중 어느 한 항에 따른 RNA 구조체를 암호화하는 핵산 서열.
  16. 청구항 15에 따른 핵산 서열을 포함하는 발현 카세트.
  17. 청구항 16에 따른 발현 카세트를 포함하는 재조합 벡터.
  18. 청구항 1 내지 청구항 14 중 어느 한 항에 따른 RNA 구조체, 청구항 15에 따른 핵산 서열, 청구항 16에 따른 발현 카세트 또는 청구항 17에 따른 벡터, 및 약학적으로 허용가능한 비히클을 포함하는 약학적 조성물.
  19. 청구항 1 내지 청구항 14 중 어느 한 항에 따른 RNA 구조체의 제조 방법으로서,
    상기 방법은
    a) ⅰ) 숙주 세포 내로 청구항 17에 따른 벡터를 도입하는 단계; 및
    ⅱ) 상기 숙주 세포를 청구항 1 내지 청구항 14 중 어느 한 항에 따른 RNA 구조체의 생산을 야기하는 조건 하에 배양하는 단계; 또는
    b) 청구항 17에 따른 벡터로부터 RNA 구조체를 전사하는 단계;를 포함하는 방법.
  20. 약제로서 또는 치료법에 사용하기 위한 청구항 1 내지 청구항 14 중 어느 한 항에 따른 RNA 구조체, 청구항 15에 따른 핵산 서열, 청구항 16에 따른 발현 카세트 또는 청구항 17에 따른 벡터 또는 청구항 18에 따른 약학적 조성물.
  21. 원생동물, 진균, 박테리아 또는 바이러스 감염의 예방, 개선 또는 치료에 사용하기 위한 청구항 1 내지 청구항 14 중 어느 한 항에 따른 RNA 구조체, 청구항 15에 따른 핵산 서열, 청구항 16에 따른 발현 카세트 또는 청구항 17에 따른 벡터 또는 청구항 18에 따른 약학적 조성물.
  22. 암의 예방, 개선 또는 치료에 사용하기 위한 청구항 1 내지 청구항 14 중 어느 한 항에 따른 RNA 구조체, 청구항 15에 따른 핵산 서열, 청구항 16에 따른 발현 카세트, 청구항 17에 따른 벡터 또는 청구항 18에 따른 약학적 조성물.
  23. 청구항 1 내지 청구항 14 중 어느 한 항에 따른 RNA 구조체, 청구항 15에 따른 핵산 서열, 청구항 16에 따른 발현 카세트, 청구항 17에 따른 벡터 또는 청구항 18에 따른 약학적 조성물을 포함하는 백신.
  24. 대상체에서 면역 반응의 자극에 사용하기 위한 것이고, 임의적으로 상기 면역 반응은 원생동물, 박테리아, 바이러스, 진균 또는 암에 대해 자극되는 것인 청구항 1 내지 청구항 14 중 어느 한 항에 따른 RNA 구조체, 청구항 15에 따른 핵산 서열, 청구항 16에 따른 발현 카세트, 청구항 17에 따른 벡터 또는 청구항 18에 따른 약학적 조성물.
KR1020237024302A 2020-12-17 2021-12-17 Rna 구조체 KR20230134487A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB2020061.4 2020-12-17
GBGB2020061.4A GB202020061D0 (en) 2020-12-17 2020-12-17 RNA construct
PCT/GB2021/053362 WO2022129945A1 (en) 2020-12-17 2021-12-17 Rna construct

Publications (1)

Publication Number Publication Date
KR20230134487A true KR20230134487A (ko) 2023-09-21

Family

ID=74221314

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237024302A KR20230134487A (ko) 2020-12-17 2021-12-17 Rna 구조체

Country Status (11)

Country Link
US (1) US20230364226A1 (ko)
EP (1) EP4262855A1 (ko)
JP (1) JP2024501085A (ko)
KR (1) KR20230134487A (ko)
CN (1) CN116847877A (ko)
BR (1) BR112023012205A2 (ko)
CA (1) CA3205247A1 (ko)
GB (1) GB202020061D0 (ko)
IL (1) IL303721A (ko)
MX (1) MX2023007228A (ko)
WO (1) WO2022129945A1 (ko)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110117124A1 (en) * 2007-08-31 2011-05-19 Sadoff Jerald C Enhancement of transgene expression from viral-based vaccine vectors by expression of suppressors of the type i interferon response
WO2017162265A1 (en) 2016-03-21 2017-09-28 Biontech Rna Pharmaceuticals Gmbh Trans-replicating rna
JP2020500536A (ja) * 2016-12-05 2020-01-16 シンセティック ジェノミクス インコーポレーテッド 遺伝子発現増強のための組成物および方法
GB201908729D0 (en) * 2019-06-18 2019-07-31 Imp College Innovations Ltd RNA construct
GB202004493D0 (en) * 2020-03-27 2020-05-13 Imp College Innovations Ltd Coronavirus vaccine

Also Published As

Publication number Publication date
CA3205247A1 (en) 2022-06-23
EP4262855A1 (en) 2023-10-25
WO2022129945A1 (en) 2022-06-23
BR112023012205A2 (pt) 2023-12-12
US20230364226A1 (en) 2023-11-16
GB202020061D0 (en) 2021-02-03
IL303721A (en) 2023-08-01
MX2023007228A (es) 2023-09-08
CN116847877A (zh) 2023-10-03
JP2024501085A (ja) 2024-01-10

Similar Documents

Publication Publication Date Title
AU2020202369B2 (en) Isolated polynucleotides and polypeptides, and methods of using same for increasing plant yield and/or agricultural characteristics
AU2020204196B2 (en) Optimal maize loci
AU2020203872B2 (en) Optimal maize loci
AU2021200054B2 (en) Isolated polynucleotides and polypeptides, and methods of using same for increasing yield of plants
AU2018203835B2 (en) Recombinant dna constructs and methods for modulating expression of a target gene
AU2020203837B2 (en) Isolated polynucleotides and polypeptides, and methods of using same for increasing plant yield and/or agricultural characteristics
AU2020267286B2 (en) Isolated polynucleotides and polypeptides, and methods of using same for increasing plant yield and/or agricultural characteristics
AU2020204520B2 (en) Isolated polynucleotides and polypeptides, and methods of using same for increasing plant yield and/or agricultural characteristics
AU2020202204B2 (en) Isolated polynucleotides and polypeptides, and methods of using same for increasing nitrogen use efficiency, yield, growth rate, vigor, biomass, oil content, and/or abiotic stress tolerance
AU2020267257C1 (en) Isolated polynucleotides and polypeptides, and methods of using same for increasing nitrogen use efficiency, yield, growth rate, vigor, biomass, oil content, and/or abiotic stress tolerance
AU2019204982B2 (en) Recombinant HCMV and RhCMV Vectors and Uses Thereof
AU2019253901B2 (en) Isolated polynucleotides and polypeptides, and methods of using same for increasing nitrogen use efficiency of plants
AU2023214237A1 (en) Modified polynucleotides for the production of biologics and proteins associated with human disease
AU2023251441A1 (en) RNA containing composition for treatment of tumor diseases
AU2021266196A9 (en) Isolated polynucleotides and polypeptides, construct and plants comprising same and methods of using same for increasing nitrogen use efficiency of plants
AU2021232838A1 (en) Isolated polynucleotides and polypeptides, and methods of using same for increasing nitrogen use efficiency, yield, growth rate, vigor, biomass, oil content, and/or abiotic stress tolerance
AU2021218140A1 (en) Isolated polynucleotides and polypeptides, and methods of using same for increasing plant yield and/or agricultural characteristics
KR20220113442A (ko) 입자 전달 시스템
RU2729065C2 (ru) Композиции и способы получения (R)-ретикулина и его предшественников
KR20220038669A (ko) Rna 구조체
KR20170005829A (ko) 모기 제어를 위한 조성물 및 그의 용도
KR20130117753A (ko) 포스포케톨라아제를 포함하는 재조합 숙주 세포
AU2017289886A1 (en) Engineered parasites for delivering protein to the central nervous system (CNS)
KR20230134487A (ko) Rna 구조체
KR101561591B1 (ko) 지질 분해효소 LipT를 생산하는 신규한 내냉성 슈도모나스 만델리 JR-1 균주 및 그 유전체의 염기서열