KR20230050328A - Hbv에 대한 rna 레플리콘 백신 - Google Patents

Hbv에 대한 rna 레플리콘 백신 Download PDF

Info

Publication number
KR20230050328A
KR20230050328A KR1020237004630A KR20237004630A KR20230050328A KR 20230050328 A KR20230050328 A KR 20230050328A KR 1020237004630 A KR1020237004630 A KR 1020237004630A KR 20237004630 A KR20237004630 A KR 20237004630A KR 20230050328 A KR20230050328 A KR 20230050328A
Authority
KR
South Korea
Prior art keywords
seq
hbv
amino acid
antigen
polynucleotide sequence
Prior art date
Application number
KR1020237004630A
Other languages
English (en)
Inventor
제이슨 엘. 데하트
나타니엘 스테펜 왕
파리나즈 알리아마드
크리스찬 마인
헤더 린 데이비스
크레이그 페이스
Original Assignee
얀센 사이언시즈 아일랜드 언리미티드 컴퍼니
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 얀센 사이언시즈 아일랜드 언리미티드 컴퍼니 filed Critical 얀센 사이언시즈 아일랜드 언리미티드 컴퍼니
Publication of KR20230050328A publication Critical patent/KR20230050328A/ko

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • A61K39/29Hepatitis virus
    • A61K39/292Serum hepatitis virus, hepatitis B virus, e.g. Australia antigen
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/20Antivirals for DNA viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • A61K2039/53DNA (RNA) vaccination
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/545Medicinal preparations containing antigens or antibodies characterised by the dose, timing or administration schedule
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/57Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2730/00Reverse transcribing DNA viruses
    • C12N2730/00011Details
    • C12N2730/10011Hepadnaviridae
    • C12N2730/10111Orthohepadnavirus, e.g. hepatitis B virus
    • C12N2730/10134Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2840/00Vectors comprising a special translation-regulating system
    • C12N2840/20Vectors comprising a special translation-regulating system translation of more than one cistron
    • C12N2840/203Vectors comprising a special translation-regulating system translation of more than one cistron having an IRES
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Virology (AREA)
  • Chemical & Material Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Microbiology (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Biotechnology (AREA)
  • Immunology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Communicable Diseases (AREA)
  • Molecular Biology (AREA)
  • Mycology (AREA)
  • Epidemiology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Oncology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

B형 간염 바이러스(HBV) 표면 항원, HBV 코어 항원, 및 HBV 폴리머라제 항원, 및 관련 조합을 인코딩하는 핵산 분자가 기재되어 있다. DNA 플라스미드 또는 바이러스 벡터와 같은 벡터, 및 HBV 항원을 발현하는 RNA 레플리콘, 및 발현 벡터를 함유하는 약제학적 조성물이 또한 기재되어 있다. 본 발명의 약제학적 조성물을 사용하여 특히 만성 HBV 감염을 가진 개체에서 HBV에 대한 면역 반응을 유도하거나 HBV-유발 질환을 치료하는 방법이 또한 기재되어 있다.

Description

HBV에 대한 RNA 레플리콘 백신
관련 출원에 대한 상호 참조
본 출원은 2020년 7월 8일에 출원된 미국 가특허 출원 번호 63/049,400 및 2021년 2월 1일에 출원된 미국 가특허 출원 번호 63/144,051에 대한 우선권을 주장하며, 그 개시내용은 그 전체가 본원에 참조로 포함된다.
전자적으로 제출된 서열 목록에 대한 참조
본 출원은 EFS-Web을 통해 전자 제출된 ASCII 형식의 서열 목록으로서 2021년 6월 24일에 작성되고 크기가 390 KB인 파일명 "TIP1088WOPCT1-Sequence_ Listing"인 서열 목록을 포함한다. 상기 EFS-Web을 통해 제출된 서열 목록은 본 명세서의 일부이며, 그 전체가 본원에 참조로 포함된다.
발명의 분야
본 개시내용은 일반적으로 유전자 발현을 조절하는 데 유용한 핵산 분자, 및 예를 들어, 세포 배양 시 적합한 숙주 세포 또는 대상체에서 원하는 생성물을 생성하고 숙주 세포 또는 대상체에 유익한 특성을 부여하기 위한 핵산 분자의 용도를 포함하는, 분자 생물학 및 유전자 조작 분야에 관한 것이다.
B형 간염 바이러스(HBV: hepatitis B virus)는 4개의 오픈 리딩 프레임과 7개의 단백질을 인코딩하는 3.2 kb의 작은 간친화성(hepatotropic) DNA 바이러스이다. 약 20억 명의 사람들이 HBV에 감염되었고, 약 2억 4천만 명의 사람들이 6개월 초과 동안 혈액에 바이러스 및 서브바이러스 입자가 지속되는 것을 특징으로 하는 만성 B형 간염 감염(만성 HBV)을 가지고 있다(Cohen et al. J. Viral Hepat. (2011) 18(6), 377-83). 지속적인 HBV 감염은 바이러스 펩타이드 및 순환 항원으로 HBV-특이적 T 세포 수용체의 만성 자극을 통해 순환 및 간내 HBV-특이적 CD4+ 및 CD8+ T 세포에서 T 세포 고갈을 유발한다. 그 결과, T-세포 다기능성이 감소한다(즉, IL-2, 종양 괴사 인자(TNF)-α, IFN-γ의 수준 감소 및 증식 결여).
HBV 감염에 대한 안전하고 효과적인 예방 백신은 1980년대 이래로 활용 가능했으며 B형 간염 예방의 주류이다(World Health Organization, Hepatitis B: Fact sheet No. 204; 2015 March). 세계보건기구는 모든 유아의 백신접종, 그리고 B형 간염 유형이 낮거나 중간 정도인 국가에서는 모든 어린이 및 청소년(18세 미만)과 특정 위험 집단 범주에 속하는 사람들에게 백신접종을 권장한다. 백신접종 덕분에, 전 세계적으로 감염률이 극적으로 감소해왔다. 그러나, 예방 백신은 확립된 HBV 감염을 치료하지 않는다.
만성 HBV는 현재 IFN-α 및 뉴클레오시드 또는 뉴클레오티드 유사체로 치료되지만, 바이러스 RNA의 주형 및 따라서 새로운 비리온으로서 기본적인 역할을 하는 감염된 간세포에서 세포내 바이러스 복제 중간체, 소위 공유결합 폐환형 DNA(cccDNA: covalently closed circular DNA)의 잔존으로 인해 궁극적인 치료는 없다. 유도된 바이러스-특이적 T-세포 및 B-세포 반응은 cccDNA-보유 간세포를 효과적으로 제거할 수 있을 것으로 생각된다. 현재의 HBV 폴리머라제를 표적화하는 용법들은 바이러스혈증을 억제하지만 핵에 존재하는 cccDNA 및 관련된 순환 항원의 생산에는 제한된 효과를 제공한다. 가장 철저한 치료 형태는 유기체로부터 HBV cccDNA를 제거하는 것일 수 있으며, 이는 천연 발생 결과로서 또는 임의의 치료적 개입의 결과로서 모두 관찰된 바 없다. 그러나, 질환 재발은 오로지 심각한 면역억제의 경우에만 발생하며 이는 이후 예방적 치료에 의해 예방될 수 있기 때문에, HBV 표면 항원(HBsAg)의 손실은 임상적으로 신뢰할 수 있는 치료법이다. 따라서, 적어도 임상적 관점에서, HBsAg의 손실은 HBV에 대한 가장 엄격한 형태의 면역 재구성과 관련된다.
예를 들어, 페길화 인터페론(pegIFN)-α를 사용한 면역 조절은 한정된 치료 과정으로 지속적 치료 중단 반응의 측면에서 뉴클레오시드 또는 뉴클레오티드 요법과 비교하여 더 나은 것으로 입증되어 왔다. 직접적인 항바이러스 효과 외에도, IFN-α는 세포 배양 및 인간화 마우스에서 cccDNA의 후성유전적 억제를 발휘하여 비리온 생산성 및 전사의 감소를 유발하는 것으로 보고되었다(Belloni et al. J. Clin. Invest. (2012) 122(2), 529-537). 그러나, 이 요법은 여전히 부작용을 안고 있으며 전반적 반응은 다소 낮은데, 그 이유는 어느 정도 IFN-α가 HBV-특이적 T-세포에 불량한 조절적 영향만을 미치기 때문이다. 특히, 치료율(cure rate)은 낮고(< 10%) 독성은 높다. 마찬가지로, 직접적으로 작용하는 HBV 항바이러스제, 즉 HBV 폴리머라제 억제제인 엔테카비르(entecavir) 및 테노포비르(tenofovir)는 약물 내성 돌연변이체의 출현에 대한 높은 유전적 장벽과 간 질환 진행에 대한 연속적인 예방을 갖는 바이러스 억제 유도에서 단일 요법으로서 효과적이다. 그러나, HBsAg 손실 또는 혈청전환에 의해 규정되는 만성 B형 간염의 치료는, 그러한 HBV 폴리머라제 억제제에 의해서는 거의 달성되지 않는다. 따라서, 인간 면역 결핍 바이러스(HIV)에 대한 항레트로바이러스 요법과 유사하게, 이론적으로 이둘 항바이러스제는 간 질환의 재발을 예방하기 위해서는 무한정으로 투여될 필요가 있다.
치료적 백신접종은 만성적 감염 환자로부터 HBV를 제거할 잠재력을 가지고 있다(Michel et al. J. Hepatol. (2011) 54(6), 1286-1296). 많은 전략들이 탐색되어 왔지만, 지금까지 치료적 백신접종은 성공적이라고 입증되지 않았다.
따라서, B형 간염 바이러스(HBV), 특히 만성 HBV의 치료에서 더 높은 치료율을 가진 유한형의 내약성이 우수한 치료를 위한 충족되지 않은 의학적 요구가 존재한다. 본 발명은 B형 간염 바이러스(HBV) 감염에 대한 면역 반응을 유도하기 위한 면역원성 조성물 및 방법을 제공함으로써 이러한 필요성을 충족한다. 본 발명의 면역원성 조성물 및 방법은 만성 HBV 감염을 가진 대상체와 같은 대상체에 치료적 면역을 제공하기 위해 사용될 수 있다.
일반적인 측면에서, 본 출원은 비-천연 발생 폴리뉴클레오티드 서열을 포함하는 핵산 분자 또는 조합에 관한 것이다. 일부 실시양태에서, 비-천연 발생 폴리뉴클레오티드 서열은 5'-말단에서 3'-말단의 순서로 하기를 포함하고:
(1) 제1 B형 간염 바이러스(HBV) 항원을 인코딩하는 폴리뉴클레오티드 서열,
(2) 제1 내부 리보솜 진입 서열(IRES: internal ribosome entry sequence) 요소 또는 제1 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열, 및
제2 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열,
여기서 제1 HBV 항원 및 제2 HBV 항원은 HBV 코어 항원, HBV 폴리머라제(pol) 항원, 및 HBV 표면 항원으로 이루어진 군으로부터 각각 독립적으로 선택되고, 제1 및 제2 HBV 항원 중 적어도 하나는 HBV 표면 항원, 바람직하게는 HBV Pre-S1 항원 또는 HBV PreS2.S 항원이다.
일 실시양태에서, 제1 또는 제2 HBV 항원 중 하나는 HBV 코어 또는 HBV pol 항원이다.
일 실시양태에서, 비-천연 발생 폴리뉴클레오티드 서열은 5'-말단에서 3'-말단의 순서로 하기를 추가로 포함한다:
(4) 제2 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열의 3' 말단에 작동적으로 연결된 제2 오토프로테아제 펩타이드를 인코딩하는 제2 IRES 요소 또는 폴리뉴클레오티드 서열, 및
(5) HBV 코어 항원, HBV pol 항원, 및 HBV 표면 항원으로 이루어진 군으로부터 독립적으로 선택된 제3 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열.
또 다른 실시양태에서, 비-천연 발생 폴리뉴클레오티드 서열은 5'-말단에서 3'-말단의 순서로 하기를 추가로 포함한다:
(6) 제3 IRES 요소 또는 제3 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열의 3' 말단에 작동적으로 연결된 제3 오토프로테아제를 인코딩하는 폴리뉴클레오티드 서열, 및
(7) HBV 코어 항원, HBV pol 항원, 및 HBV 표면 항원으로 이루어진 군으로부터 독립적으로 선택된 제4 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열.
또 다른 실시양태에서, 핵산 분자 또는 조합은 5'-말단에서 3'-말단의 순서로 하기를 포함하는 제1 비-천연 발생 폴리뉴클레오티드 서열:
(1) 제1 B형 간염 바이러스(HBV) 항원을 인코딩하는 폴리뉴클레오티드 서열,
(2) 제1 내부 리보솜 진입 서열(IRES) 요소 또는 제1 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열, 및
(3) 제2 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열, 및
5'-말단에서 3'-말단의 순서로 하기를 포함하는 제2 비-천연 발생 폴리뉴클레오티드 서열:
(1) 제3 B형 간염 바이러스(HBV) 항원을 인코딩하는 폴리뉴클레오티드 서열,
(2) 제2 내부 리보솜 진입 서열(IRES) 요소 또는 제2 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열, 및
(3) 제4 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열을 포함하고,
여기서 제1 및 제2 비-천연 발생 폴리뉴클레오티드 서열은 제3 내부 리보솜 진입 서열(IRES) 요소 또는 제3 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열에 의해 연결되거나, 별도의 핵산 분자에 존재하고,
여기서 제1, 제2, 제3 및 제4 HBV 항원은 HBV 코어 항원, HBV 폴리머라제(pol) 항원, 및 HBV 표면 항원으로 이루어진 군으로부터 각각 독립적으로 선택되고, 제1, 제2, 제3 및 제4 HBV 항원 중 적어도 하나는 서열번호 1 또는 서열번호 3의 아미노산 서열과 적어도 98% 동일한 아미노산 서열을 갖는 HBV Pre-S1 항원 및 서열번호 5의 아미노산 서열과 적어도 98% 동일한 아미노산 서열을 갖는 HBV PreS2.S 항원으로부터 선택된 HBV 표면 항원이고, 바람직하게는 제1, 제2, 제3 또는 제4 HBV 항원 중 하나는 HBV 코어 또는 HBV pol 항원이다.
또 다른 실시양태에서, 제1, 제2, 제3 및 제4 HBV 항원 각각은 서로 상이하다.
또 다른 실시양태에서, 제1, 제2, 제3 및 제4 HBV 항원 각각은 하기로 이루어진 군으로부터 독립적으로 선택되고:
(i) 서열번호 1의 아미노산 서열과 적어도 98% 동일한, 예컨대 서열번호 1의 아미노산 서열과 적어도 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하는, 바람직하게는 이로 이루어진 제1 HBV Pre-S1 항원;
(ii) 서열번호 3의 아미노산 서열과 적어도 98% 동일한, 예컨대 서열번호 3의 아미노산 서열과 적어도 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하는, 바람직하게는 이로 이루어진 제2 HBV Pre-S1 항원;
(iii) 서열번호 5의 아미노산 서열과 적어도 98% 동일한, 예컨대 서열번호 5의 아미노산 서열과 적어도 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하는, 바람직하게는 이로 이루어진 HBV PreS2.S 항원;
(iv) 서열번호 7과 적어도 90% 동일한, 예컨대 서열번호 7과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하는, 바람직하게는 이로 이루어진 HBV 코어 항원; 및
(v) 서열번호 9와 적어도 90% 동일한, 예컨대 서열번호 9와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원,
바람직하게는, 제1 및 제2 HBV Pre-S1 항원, HBV 코어 항원 및 HBV pol 항원 각각은 독립적으로 신호 펩타이드에 작동적으로 연결되고, HBV PreS2.S 항원은 내부 신호 펩타이드를 포함한다.
일부 실시양태에서, HBV 코어 항원은 서열번호 84, 85, 또는 86 중 적어도 하나와 적어도 98% 동일한, 예컨대 서열번호 84, 85, 또는 86과 적어도 98%, 적어도 99%, 또는 100% 동일한 아미노산 서열을 포함하고, 바람직하게는 이로 이루어진다. 일부 실시양태에서, HBV 코어 항원의 마지막 5개의 C-말단 아미노산은 VVR 아미노산 서열, 보다 특히 VVRR(서열번호 91) 아미노산 서열, 보다 특히 VVRRR(서열번호 92) 아미노산 서열을 포함한다.
일부 실시양태에서, HBV 표면 항원, HBV 코어 항원 및 HBV pol 항원 각각은 하기를 포함한다:
(i) HBV 유전자형 A, B, C 및 D에 대한 컨센서스 서열; 및/또는
(ii) HLA-A*11:01, HLA-A*24:02, HLA-A*02:01, HLA-A*A2402, HLA-A*A0101, 또는 HLA-B*40:01에 대한 하나 이상의 에피토프.
일부 실시양태에서, HBV 표면 항원, HBV 코어 항원 및 HBV pol 항원 각각은 HLA-A*11:01에 대한 하나 이상의 에피토프를 포함한다.
또 다른 실시양태에서, 제1, 제2, 제3 및 제4 HBV 항원 각각은 하기로 이루어진 군으로부터 독립적으로 선택된다:
(i) 서열번호 1의 아미노산 서열로 이루어진 제1 HBV Pre-S1 항원;
(ii) 서열번호 3의 아미노산 서열로 이루어진 제2 HBV Pre-S1 항원;
(iii) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원;
(iv) 서열번호 84, 서열번호 85, 또는 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원; 및
(v) 서열번호 9의 아미노산 서열로 이루어진 HBV pol 항원,
바람직하게는, 제1 및 제2 HBV Pre-S1 항원, HBV 코어 항원 및 HBV pol 항원 각각은 독립적으로 서열번호 77의 아미노산 서열을 포함하는 신호 펩타이드와 같은 신호 펩타이드에 작동적으로 연결된다.
또 다른 실시양태에서, 제1, 제2, 제3 및 제4 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열 각각은 하기로 이루어진 군으로부터 독립적으로 선택되고:
(i) 서열번호 2와 적어도 90% 동일한, 예컨대 서열번호 2와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 서열을 갖는 제1 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(ii) 서열번호 4와 적어도 90% 동일한, 예컨대 서열번호 4와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 서열을 갖는 제2 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(iii) 서열번호 6과 적어도 90% 동일한, 예컨대 서열번호 6과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
(iv) 서열번호 8과 적어도 90% 동일한, 예컨대 서열번호 8과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열; 및
(v) 서열번호 10과 적어도 90% 동일한, 예컨대 서열번호 10과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 서열을 갖는 HBV pol 항원을 인코딩하는 폴리뉴클레오티드 서열,
바람직하게는, 제1 및 제2 HBV Pre-S1 항원, HBV 코어 항원 및 HBV pol 항원 각각을 인코딩하는 폴리뉴클레오티드 서열은 독립적으로 신호 펩타이드를 인코딩하는 폴리뉴클레오티드 서열에 작동적으로 연결되고, HBV PreS2.S 항원은 내부 신호 펩타이드를 포함한다.
일부 실시양태에서, 제1, 제2, 제3 및 제4 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열 각각은 하기로 이루어진 군으로부터 독립적으로 선택되고:
(i) 서열번호 2의 서열로 이루어진 제1 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(ii) 서열번호 4의 서열로 이루어진 제2 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(iii) 서열번호 6의 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
(iv) 서열번호 87, 서열번호 88 또는 서열번호 89 중 어느 하나의 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열; 및
(v) 서열번호 10의 서열로 이루어진 HBV pol 항원을 인코딩하는 폴리뉴클레오티드 서열;
바람직하게는, 제1 및 제2 HBV Pre-S1 항원, HBV 코어 항원 및 HBV pol 항원 각각을 인코딩하는 폴리뉴클레오티드 서열은 독립적으로 서열번호 90의 서열을 포함하는 폴리뉴클레오티드와 같은 신호 펩타이드를 인코딩하는 폴리뉴클레오티드에 작동적으로 연결된다.
일 실시양태에서, 제1, 제2 및 제3 오토프로테아제 펩타이드 각각은 독립적으로 돼지 테스코바이러스-1 2A(P2A), 구제역 바이러스(FMDV) 2A(F2A), 말 비염 A 바이러스(ERAV) 2A(E2A), 테세아 아시그나 바이러스 2A(T2A), 세포질 다각체병 바이러스 2A(BmCPV2A), 무름병 바이러스 2 A(BmIFV2A), 및 이들의 조합으로 이루어진 군으로부터 선택된 펩타이드 서열을 포함한다. 바람직하게는, 제1, 제2 및 제3 오토프로테아제 펩타이드 각각은 서열번호 11의 P2A 서열과 같은 P2A의 펩타이드 서열을 포함한다.
또 다른 실시양태에서, 제1, 제2 및 제3 IRES 각각은 뇌심근염 바이러스(EMCV) 또는 엔테로바이러스 71(EV71)로부터 유래된다. 바람직하게는, 제1, 제2 및 제3 IRES 각각은 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 포함한다.
일부 실시양태에서, 핵산 분자 또는 조합은 5'-말단에서 3'-말단의 순서로 하기를 포한하는 비-천연 발생 폴리뉴클레오티드 서열을 포함한다:
(1) 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
(2) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(3) 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(4) 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(5) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(6) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(7) 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(8) 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(9) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(10) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(11) 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(12) 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(13) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(14) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(15) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(16) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(17) 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
(18) 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
(19) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(20) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(21) 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열; 또는
(22) 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열,
바람직하게는, 제1 및 제2 HBV Pre-S1 항원, HBV 코어 항원 및 HBV pol 항원 각각을 인코딩하는 폴리뉴클레오티드 서열은 독립적으로 서열번호 77의 아미노산 서열을 포함하는 신호 펩타이드와 같은 신호 펩타이드를 인코딩하는 폴리뉴클레오티드 서열에 작동적으로 연결된다.
일 실시양태에서, 핵산 분자 또는 조합은 서열번호 15 내지 54 중 어느 하나의 비-천연 발생 폴리뉴클레오티드 서열을 포함한다.
또 다른 일반적인 측면에서, 본 출원은 본 출원의 핵산 분자 또는 조합을 포함하는 벡터에 관한 것이다.
일 실시양태에서, 벡터는 DNA 플라스미드이다. 또 다른 실시양태에서, 벡터는 DNA 바이러스 벡터 또는 RNA 바이러스 벡터이다. 일 실시양태에서, 벡터는 변형된 백시니아 앙카라(MVA) 벡터 또는 아데노바이러스 벡터이다. 일 실시양태에서, 벡터는 Ad26, Ad35, 또는 MVA-BN 벡터이다.
또 다른 일반적인 측면에서, 본 출원은 5'-말단에서 3'-말단의 순서로 하기를 포함하는 RNA 레플리콘에 관한 것이다:
(1) RNA 바이러스의 비구조 단백질-매개 증폭에 필요한 5' 비번역 영역(5'-UTR);
(2) RNA 바이러스의 비구조 단백질 중 적어도 하나, 바람직하게는 모두를 인코딩하는 폴리뉴클레오티드 서열;
(3) RNA 바이러스의 서브게놈 프로모터;
(4) 본 출원의 핵산 분자 또는 조합; 및
(5) RNA 바이러스의 비구조 단백질-매개 증폭에 필요한 3' 비번역 영역(3'-UTR).
또 다른 일반적인 측면에서, 본 출원은 5'-말단에서 3'-말단의 순서로 하기를 포함하는 RNA 레플리콘에 관한 것이다:
(1) 알파바이러스 5' 비번역 영역(5'-UTR),
(2) 알파바이러스 비구조 유전자 nsp1의 5' 복제 서열,
(3) 바이러스 종의 다운스트림 루프(DLP: downstream loop) 모티프,
(4) 제4 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열,
(5) 알파바이러스 비구조 단백질 nsp1, nsp2, nsp3 및 nsp4를 인코딩하는 폴리뉴클레오티드 서열,
(6) 알파바이러스 서브게놈 프로모터,
(7) 본 출원의 핵산 분자 또는 조합,
(8) 알파바이러스 3' 비번역 영역(3' UTR), 및
(9) 선택적으로, 폴리 아데노신 서열.
일 실시양태에서, DLP 모티프는 동부 말 뇌염 바이러스(EEEV: Eastern equine encephalitis virus), 베네수엘라 말 뇌염 바이러스(VEEV: Venezuelan equine encephalitis virus), 에버글레이즈 바이러스(EVEV: Everglades virus), 무캄보 바이러스(MUCV: Mucambo virus), 셈리키 포레스트 바이러스(SFV: Semliki forest virus), 픽수나 바이러스(PIXV: Pixuna virus), 미들버그 바이러스(MTDV: Middleburg virus), 치쿤구니야 바이러스(CHIKV: Chikungunya virus), 오니옹-니옹 바이러스(ONNV: O'Nyong-Nyong virus), 로스 리버 바이러스(RRV: Ross River virus), 바마 포레스트 바이러스(BF: Barmah Forest virus), 게타 바이러스(GET: Getah virus), 사기야마 바이러스(SAGV: Sagiyama virus), 베바루 바이러스(BEBV: Bebaru virus), 마야로 바이러스(MAYV: Mayaro virus), Una 바이러스(UAV: Una virus), 신드비스 바이러스(SINV: Sindbis virus), 아우라 바이러스(AURAV: Aura virus), 와타로아 바이러스(WHAV: Whataroa virus), 바반키 바이러스(BABV: Babanki virus), 키질라가크 바이러스(KYZV: Kyzylagach virus), 서부 말 뇌염 바이러스(WEEV: Western equine encephalitis virus), 하이랜드 J 바이러스(HJV: Highland J virus), 포트 모건 바이러스(FMV: Fort Morgan virus), Ndumu(NDUV), 및 버기 크릭 바이러스(Buggy Creek virus)로 이루어진 군으로부터 선택된 바이러스 종으로부터 유래된다.
또 다른 실시양태에서, 제4 오토프로테아제 펩타이드는 돼지 테스코바이러스-1 2A(P2A), 구제역 바이러스(FMDV) 2A(F2A), 말 비염 A 바이러스(ERAV) 2A(E2A), 테세아 아시그나 바이러스 2A(T2A), 세포질 다각체병 바이러스 2A(BmCPV2A), 무름병 바이러스 2 A(BmIFV2A), 및 이들의 조합으로 이루어진 군으로부터 선택된다. 바람직하게는, 제4 오토프로테아제 펩타이드는 P2A의 펩타이드 서열을 포함한다.
또 다른 일반적인 측면에서, 본 출원은 5'-말단에서 3'-말단의 순서로 하기를 포함하는 RNA 레플리콘에 관한 것이다:
(1) 서열번호 55의 폴리뉴클레오티드 서열을 갖는 5'-UTR,
(2) 서열번호 56의 폴리뉴클레오티드 서열을 갖는 5' 복제 서열,
(3) 서열번호 57의 폴리뉴클레오티드 서열을 포함하는 DLP 모티프,
(4) 서열번호 11의 P2A 서열을 인코딩하는 폴리뉴클레오티드 서열,
(5) 각각 서열번호 58, 서열번호 59, 서열번호 60 및 서열번호 61의 핵산 서열을 갖는 알파바이러스 비구조 단백질 nsp1, nsp2, nsp3 및 nsp4를 인코딩하는 폴리뉴클레오티드 서열,
(6) 서열번호 62의 폴리뉴클레오티드 서열을 갖는 서브게놈 프로모터,
(7) 본 출원의 핵산 분자 또는 조합, 및
(8) 서열번호 63의 폴리뉴클레오티드 서열을 갖는 3' UTR.
일 실시양태에서, P2A 서열을 인코딩하는 폴리뉴클레오티드 서열은 서열번호 12를 포함하고, 핵산 분자 또는 조합은 서열번호 15 내지 54 중 어느 하나의 폴리뉴클레오티드 서열을 포함하고, RNA 레플리콘은 레플리콘의 3'-말단에 폴리 아데노신 서열을 포함한다. 바람직하게는, 폴리 아데노신 서열은 서열번호 64의 서열을 갖는다.
또 다른 일반적인 측면에서, 본 출원은 서열번호 65 내지 72 중 어느 하나의 폴리뉴클레오티드 서열을 포함하는 RNA 레플리콘에 관한 것이다.
또 다른 일반적인 측면에서, 본 출원은 본 출원의 RNA 레플리콘을 인코딩하는 폴리뉴클레오티드 서열을 포함하는 핵산 분자에 관한 것이다. 바람직하게는, 핵산은 DNA 서열의 5'-말단에 작동적으로 연결된 T7 프로모터를 추가로 포함한다. 보다 바람직하게는, T7 프로모터는 서열번호 73의 뉴클레오티드 서열을 포함한다.
또 다른 일반적인 측면에서, 본 출원은 본 출원의 핵산 분자 또는 조합, 벡터, 또는 RNA 레플리콘, 및 약제학적으로 허용되는 담체를 포함하는 약제학적 조성물에 관한 것이다.
일 실시양태에서, 약제학적으로 허용되는 담체는 지질 나노입자를 포함하고, 바람직하게는 지질 나노입자는 ALC-0315, DOTMA, DOTAP, DDAB, DOGS, DSDMA, DODMA, DLinDMA, DLenDMA, γ-DLenDMA, DLin-K-DMA, DLin-K-C2-DMA, DLin-K-C3-DMA, DLin-K-C4-DMA, DLen-C2K-DMA, y-DLen-C2K-DMA, DLin-M-C2-DMA, DLin-M-C3-DMA, DLin-MP-DMA, 또는 DCChol 중 하나 이상을 포함한다.
또 다른 실시양태에서, 약제학적 조성물은 하기를 추가로 포함한다: (1) 서열번호 84, 85 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열; 또는 (2) 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 84, 85 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열.
또 다른 일반적인 측면에서, 본 출원은 HBV에 대해 대상체를 백신접종하는 방법에 관한 것으로, 상기 방법은 본 출원의 약제학적 조성물을 대상체에게 투여하는 단계를 포함한다. 일 실시양태에서, 상기 방법은 프라임-부스트 용법(prime-boost regimen)으로서 적어도 하나의 동일한 HBV 항원을 인코딩하는 핵산 분자 또는 조합을 포함하는 제2 조성물을 대상체에게 투여하는 단계를 추가로 포함한다. 일부 실시양태에서, 프라임-부스트 용법은 본 출원의 RNA 레플리콘을 포함하는 프라이밍 조성물 및 RNA 레플리콘이 아니고 적어도 하나의 동일한 HBV 에피토프를 인코딩하는 벡터를 포함하는 부스팅 조성물, 바람직하게는, 프라이밍 조성물로서 적어도 하나의 동일한 HBV 항원을 포함한다. 일 실시양태에서, 부스팅 조성물은 변형된 백시니아 앙카라(MVA) 벡터, 아데노바이러스 벡터 또는 플라스미드 벡터를 포함한다. 일부 실시양태에서, 부스팅 조성물은 Ad26, Ad35, 또는 MVA-BN 벡터를 포함한다. 일부 실시양태에서, 프라임-부스트 용법은 본 출원의 RNA 레플리콘을 포함하는 부스팅 조성물 및 RNA 레플리콘이 아니고 적어도 하나의 동일한 HBV 에피토프, 예컨대 적어도 하나의 동일한 HLA 에피토프를 인코딩하는 벡터를 포함하는 프라이밍 조성물, 바람직하게는, 부스팅 조성물로서 적어도 하나의 동일한 HBV 항원을 포함한다. 일 실시양태에서, 프라이밍 조성물은 변형된 백시니아 앙카라(MVA) 벡터, 아데노바이러스 벡터 또는 플라스미드 벡터를 포함한다. 일부 실시양태에서, 프라이밍 조성물은 Ad26, Ad35, 또는 MVA-BN 벡터를 포함한다.
또 다른 일반적인 측면에서, 본 출원은 본 출원의 약제학적 조성물을 대상체에게 투여하거나 본 출원의 방법에 따라 대상체를 백신접종하는 단계를 포함하는, 대상체에서 HBV의 감염 및/또는 복제를 감소시키는 방법에 관한 것이다.
또 다른 일반적인 측면에서, 본 출원은 본 출원의 핵산 분자 또는 조합, 벡터, 또는 RNA 레플리콘을 포함하는 단리된 숙주 세포에 관한 것이다.
또 다른 일반적인 측면에서, 본 출원은 생체내 또는 시험관내에서 본 출원의 핵산을 전사하는 단계를 포함하는, RNA 레플리콘의 생성 방법에 관한 것이다.
또 다른 일반적인 측면에서, 본 출원은 이를 필요로 하는 대상체, 바람직하게는 만성 HBV 감염을 가진 대상체에서 선택적으로 또 다른 면역원성 제제 또는 또 다른 항-HBV 제제와 조합하여 B형 간염 바이러스(HBV)에 대한 면역 반응을 유도하는 데 사용하기 위한 본 출원의 약제학적 조성물에 관한 것이다.
또 다른 일반적인 측면에서, 본 출원은 B형 간염 바이러스(HBV)-유발 질환 치료를 필요로 하는 대상체, 바람직하게는 만성 HBV 감염을 가진 대상체에서 선택적으로 또 다른 치료제, 바람직하게는 또 다른 항-HBV 제제와 조합하여 진행성 섬유증, 간경변 및 간세포 암종(HCC)으로 이루어진 군으로부터 선택된 B형 간염 바이러스(HBV)-유발 질환을 치료하는 데 사용하기 위한 본 출원의 약제학적 조성물에 관한 것이다.
본 발명의 다른 측면, 특징 및 이점은 본 발명의 상세한 설명 및 이의 바람직한 실시양태 및 첨부된 청구범위를 포함하는 하기의 개시내용으로부터 명백해질 것이다.
본 발명의 하기의 상세한 설명뿐만 아니라 전술한 요약은 첨부된 도면과 함께 판독할 경우 보다 잘 이해될 것이다. 본 발명은 도면에 나타낸 정확한 실시양태에 제한되지 않는다는 것을 이해해야 한다.
도 1a는 불활성화 점 돌연변이를 갖는 Pol, C 말단 결실(서열번호 76)을 갖는 절두된 코어, PreS2.S, 및 시스타틴 S 신호 펩타이드(서열번호 77)를 나타내는 PreS1을 포함하는 항원 설계의 개략도를 나타낸다.
도 1b는 바이시스트론 및 테트라시스트론 백신 설계의 개략도를 나타낸다.
도 2는 상위 4개의 바이시스트론 백신 및 상위 4개의 테트라시스트론 백신 설계로부터의 HBV 항원의 상대적 발현을 나타내는 일련의 그래프이다. Vero 세포에서의 코어, PreS2.S 및 PreS1 발현을 유세포 분석에 의해 측정되었고, 단일유전자 대조군에 비해 MFI로서 보고되었다. Pol 발현은 웨스턴 블롯에 의해 측정되었고, 상대적 발현은 농도계를 사용하여 결정되었다.
도 3은 트리시스트론 백신 설계로부터 HBV 항원의 상대적 발현을 나타내는 일련의 그래프이다. Vero 세포에서의 코어 및 PreS2.S 발현은 유세포 분석에 의해 측정되었고, 단일유전자 대조군에 비해 MFI로서 보고되었다. Pol 발현은 웨스턴 블롯에 의해 측정되었고, 상대 발현은 농도계를 사용하여 결정되었다.
도 4a-도 4d는 HBV 항원을 인코딩하는 SMARRT 레플리콘을 사용한 생체내 면역화의 결과를 나타내는 그래프이다. C57BL/6 마우스에 단일유전자 HBV 항원을 인코딩하는 SMARRT 레플리콘을 i.m. 주사하거나 혼합하였다. 식염수를 대조군으로서 주사하였다. 프라이밍 후 14일에 비장을 적출하고, 비장세포를 코어(도 4a), Pol(도 4b), PreS2.S(도 4c) 및 PreS1(도 4d)에 대한 중첩 펩타이드 풀로 재자극하였다. IFNγ 생성 세포의 수는 ELISpot으로 측정하였다. 그래프는 95% CI(그룹당 n = 5마리의 마우스)로 평균을 나타내고, 통계적 비교를 위해 만-휘트니 검정(Mann-Whitney test)을 수행하였다. *p < 0.05; **p < 0.01
도 5a-도 5h는 HBV 항원을 인코딩하는 SMARRT 레플리콘을 사용한 생체내 면역화 및 2주차 재자극의 결과를 나타내는 그래프이다. C57BL/6 마우스에 단일유전자 HBV 항원을 인코딩하는 SMARRT 레플리콘을 i.m. 주사하거나 혼합하였다. 식염수를 대조군으로서 주사하였다. 프라이밍 후 14일에 비장을 적출하고, 비장세포를 브레펠딘 A의 존재 하에 6시간 동안 코어(도 5a 및 도 5e), Pol(도 5b 및 도 5f), PreS2.S(도 5c 및 도 5g) 및 PreS1(도 5d 및 도 5h)에 대한 중첩 펩타이드 풀로 재자극하였다. CD4 및 CD8 T 세포에 의한 IFNγ, TNFα 및 IL-2 생성을 세포내 사이토카인 염색으로 측정하였다. 다기능성은 세포당 1(IFNγ+), 2(IFNγ+ TNFα+) 또는 3(IFNγ+ TNFα+ IL-2+) 사이토카인의 생성에 의해 결정된 대로 플롯팅된다. 그래프는 SD로 평균을 나타낸다(그룹당 n = 5마리의 마우스).
도 6a-도 6d는 HBV 항원을 인코딩하는 SMARRT 레플리콘을 사용한 생체내 면역화의 결과를 나타내는 그래프이다. C57BL/6 마우스에 단일유전자 또는 혼합된 HBV 항원, 이중유전자 항원 또는 테트라시스트론 작제물을 인코딩하는 SMARRT 레플리콘을 i.m. 주사하였다. 식염수를 대조군으로서 주사하였다. 프라이밍 후 14일에 비장을 적출하고, 비장세포를 코어(도 6a), Pol(도 6b), PreS2.S(도 6c) 및 PreS1(도 6d)에 대한 중첩 펩타이드 풀로 재자극하였다. IFNγ 생성 세포의 수는 ELISpot으로 측정하였다. 그래프는 95% CI로 평균을 나타낸다(그룹당 n = 5마리의 마우스).
도 7a-도 7d는 HBV 항원을 인코딩하는 SMARRT 레플리콘을 사용한 생체내 면역화 및 2주차 재자극의 결과를 나타내는 그래프이다. C57BL/6 마우스에 단일유전자 또는 혼합된 HBV 항원, 이중유전자 항원 또는 테트라시스트론 작제물을 인코딩하는 SMARRT 레플리콘을 i.m. 주사하였다. 식염수를 대조군으로서 주사하였다. 프라이밍 후 14일에 비장을 적출하고, 비장세포를 브레펠딘 A의 존재하에 6시간 동안 코어(도 7a), Pol(도 7b), PreS2.S(도 7c) 및 PreS1(도 7d)에 대한 중첩 펩타이드 풀로 재자극하였다. CD4 및 CD8 T 세포에 의한 IFNγ, TNFα 및 IL-2 생성을 세포내 사이토카인 염색으로 측정하였다. 다기능성은 세포당 1(IFNγ+), 2(IFNγ+ TNFα+) 또는 3(IFNγ+ TNFα+ IL-2+) 사이토카인의 생성에 의해 결정된 대로 플롯팅된다. 그래프는 SD로 평균을 나타낸다(그룹당 n = 5마리의 마우스).
다양한 간행물, 논문 및 특허가 배경 및 명세서 전반에 걸쳐 인용되거나 기재되어 있으며; 이들 참조문헌 각각은 그 전체가 본원에 참조로 포함된다. 본 명세서에 포함된 문서, 논문, 재료, 장치, 물품 등에 대한 논의는 본 발명에 대한 맥락을 제공하기 위한 것이다. 그러한 논의는 이러한 대상 중 임의의 것이나 전부가 개시되거나 청구되는 임의의 발명에 대해 선행 기술의 일부를 형성한다는 것을 인정하는 것이 아니다.
달리 정의되지 않는 한, 본원에 사용된 모든 기술적 및 과학적 용어들은 본 발명이 속하는 당업자에게 일반적으로 이해되는 것과 동일한 의미를 갖는다. 그렇지 않으면, 본원에 사용된 특정 용어는 본 명세서에서 설정된 의미를 갖는다. 본원에 인용된 모든 특허, 특허 출원 공보, 및 간행물은 본원에 완전히 개시된 것처럼 참조로 포함된다.
본원 및 첨부된 청구범위에서 사용된 바와 같이, 단수 형태 "a", "an" 및 "the"는 문맥상 명백하게 달리 나타내지 않는 한 복수의 대상을 포함한다는 것을 주목해야 한다.
달리 언급되지 않는 한, 본원에 기재된 % 서열 동일성 또는 % 서열 동일성 범위와 같은 임의의 수치 값은 모든 경우에 용어 "약"에 의해 수식되는 것으로 이해되어야 한다. 따라서, 수치 값은 전형적으로 인용된 값의 ± 10%를 포함한다. 예를 들어, 10 mg의 투여량은 9 mg 내지 11 mg을 포함한다. 본원에 사용된 바와 같이, 수치 범위의 사용은 문맥상 명백하게 달리 나타내지 않는 한, 모든 가능한 하위범위, 그러한 범위 내의 정수를 포함한 그 범위 내의 모든 개별 수치 값 및 그 값들의 분수를 명백하게 포함한다.
본원에 사용된 바와 같이, 다수의 인용된 요소들 간의 연결 용어 "및/또는"은 개별 옵션과 조합된 옵션 둘 모두를 포함하는 것으로 이해된다. 예를 들어, 두 요소가 "및/또는"으로 결합된 경우, 제1 옵션은 제2 요소가 없는 제1 요소가 적용될 수 있음을 지칭한다. 제2 옵션은 첫 번째 요소 없이 제2 요소가 적용될 수 있음을 지칭한다. 제3 옵션은 제1 요소와 제2 요소가 함께 적용될 수 있음을 지칭한다. 이들 옵션 중 어느 하나는 의미 내에 속하는 것으로 이해되며, 따라서 본원에 사용된 용어 "및/또는"의 요건을 충족한다. 하나 초과의 옵션들을 동시에 적용할 수 있는 것도 의미 내에 속하므로 이해되며, 따라서 용어 "및/또는"의 요건을 충족하는 것으로 이해된다.
달리 나타내지 않는 한, 일련의 요소들 앞에 있는 용어 "적어도"는 일련의 모든 요소들을 지칭하는 것으로 이해되어야 한다. 당업자는 통상의 실험만을 사용하여 본원에 기재된 본 발명의 구체적인 실시양태에 대한 많은 등가물을 인식하거나 확인할 수 있을 것이다. 그러한 등가물은 본 발명에 포함되는 것으로 의도된다.
문맥상 달리 요구하지 않는 한, 본 명세서 및 이하의 청구범위 전체에 걸쳐, 단어 "포함하다(comprise)" 및 "포함하다(comprises)" 및 "포함하는(comprising)"과 같은 변현형은 명시된 정수 또는 단계 또는 정수 또는 단계의 그룹을 포함하지만 임의의 다른 정수 또는 단계 또는 정수 또는 단계의 그룹을 배제하지 않음을 의미하는 것으로 이해될 것이다. 본원에 사용될 때 용어 "포함하는"은 용어 "함유하는" 또는 "포함하는"으로 대체될 수 있거나, 때때로 용어 "갖는"과 함께 사용될 때 대체될 수 있다.
본원에 사용될 때 "~로 이루어진"은 청구범위 요소에서 명시되지 않은 임의의 요소, 단계 또는 성분을 배제한다. 본원에 사용될 때, "~로 본질적으로 이루어진"은 청구범위의 기본 및 신규한 특성에 실질적으로 영향을 미치지 않는 물질 또는 단계를 배제하지 않는다. 본 발명의 측면 또는 실시양태의 맥락에서 본원에 사용될 때마다 "포함하는(comprising)", "함유하는(containing)", "포함하는(including)" 및 "갖는"의 전술한 용어들 중 임의의 용어는 본 개시내용의 범위를 변경하기 위해 용어 "~로 이루어진" 또는 "~로 본질적으로 이루어진"으로 대체될 수 있다.
본원에 사용된 "에피토프"는 면역글로불린, T 세포 수용체 또는 인간 백혈구 항원(HLA) 분자에 의해 인식되는 부위를 형성하는 아미노산 잔기의 세트이다.
HLA 단백질은 이식 거부에서 MHC 유전자좌에 의해 인코딩된 단백질의 중요한 역할을 인식하여 주요 조직적합성 복합체(MHC: Major Histocompatibility Complex)로 알려진 6번 염색체에 위치한 영역을 형성하는 유전자 클러스터에 의해 인코딩된다. 따라서, HLA 단백질은 MHC 단백질로도 지칭된다. HLA 또는 MHC 단백질은 세포내 위치에서 펩타이드에 결합하여 조합된 리간드가 T 세포에 의해 인식되는 세포 표면으로 이들을 전달하는 세포 표면 당단백질이다. 부류 I MHC 단백질은 신체의 거의 모든 유핵 세포에서 발견된다. 부류 I MHC 단백질은 세포질에 존재하는 펩타이드와 결합하여 세포독성 CD8+ T 세포에 의해 인식되는 세포 표면에 제시되는 펩타이드-MHC 단백질 복합체를 형성한다. 부류 II MHC 단백질은 일반적으로 B 림프구, 대식세포 및 수지상 세포와 같은 항원-제시 세포에서만 발견된다. 각각의 MHC 부류 I 수용체는 가변 α 사슬 및 비교적 보존된 β2- 마이크로글로불린 사슬로 이루어진다. 3개의 상이한 고도로 다형성인 부류 I α 사슬 유전자가 확인되었다. 이들을 HLA-A, HLA-B 및 HLA-C라 칭한다. α 사슬의 변이는 집단에서 모든 상이한 부류 I MHC 유전자를 설명한다.
아미노산 서열과 관련하여 사용될 때 문구 "퍼센트(%) 서열 동일성" 또는 "% 동일성" 또는 "~와 % 동일한"은 아미노산 서열의 전체 길이를 구성하는 아미노산 잔기의 수와 비교하여 2개 이상의 정렬된 아미노산 서열의 동일한 아미노산의 매칭("히트")의 수를 기술한다. 달리 말하면, 2개 이상의 서열을 위해, 서열이 당해 기술 분야에 알려져 있는 서열 대비 알고리즘을 사용하여 측정된 최대 유사성을 위해 비교 및 정렬될 경우, 또는 수동으로 정렬되고 시각적으로 검사될 경우, 정렬을 이용하여, 동일한 아미노산 잔기의 백분율(예를 들어, 아미노산 서열 전장에 걸쳐 90%, 91%, 92%, 93%, 94%, 95%, 97%, 98%, 99%, 또는 100% 동일성)이 결정될 수 있다. 뉴클레오티드 서열에 대해서도 동일한 결정을 내릴 수 있다. 따라서, 서열 동일성을 결정하기 위해 비교되는 서열은 아미노산의 치환(들), 추가(들) 또는 결실(들)에 의해 상이할 수 있다. 단백질 서열을 정렬하기 위한 적합한 프로그램은 당업자에게 알려져 있다. 단백질 서열의 서열 동일성 백분율은 CLUSTALW, Clustal Omega, FASTA 또는 BLAST와 같은 프로그램으로, 예를 들어, NCBI BLAST 알고리즘을 사용하여 결정될 수 있다(Altschul SF, et al (1997), Nucleic Acids Res. 25:3389-3402).
본원에 사용된 바와 같이, 대상체에게 둘 이상의 요법제 또는 구성요소를 투여하는 맥락에서 용어 및 문구 "조합하여", "와 조합하여", "공동-전달" 및 "~와 함께 투여"는 둘 이상의 요법제 또는 구성요소, 예컨대 2개의 핵산 분자, 예를 들어, RNA 레플리콘, 또는 면역원성 조성물 및 애쥬번트의 동시 투여를 지칭한다. "동시 투여"는 적어도 당일 내에 두 구성요소의 투여일 수 있다. 2개의 구성요소가 "~와 함께 투여" 또는 "~와 조합하여 투여"되는 경우, 이들은 짧은 기간, 예컨대 24시간, 20시간, 16시간, 12시간, 8시간 또는 4시간 이내에, 또는 1시간 이내에 별도의 조성물로 순차적으로 투여될 수 있거나, 이들은 단일 조성물로 동시에 투여될 수 있다. "~와 조합하여"라는 용어의 사용은 요법제 또는 구성요소가 대상체에게 투여되는 순서를 제한하지 않는다. 예를 들어, 제1 요법제 또는 구성요소(예를 들어, 제1 핵산 분자)는 제2 요법제 또는 구성요소(예를 들어, 제2 핵산 분자)의 투여 전(예를 들어, 5분 내지 1시간 전), 이와 병용하여 또는 동시에, 또는 그 후에(예를 들어, 5분 내지 1시간 후에) 투여될 수 있다. 일부 실시양태에서, 제1 요법제 또는 구성요소(예를 들어, 제1 핵산 분자) 및 제2 요법제 또는 구성요소(예를 들어, 제2 핵산 분자)는 동일한 조성물로 투여된다. 다른 실시양태에서, 제1 요법제 또는 구성요소(예를 들어, 제1 핵산 분자) 및 제2 요법제 또는 구성요소(예를 들어, 제2 핵산 분자)는 별개의 조성물로 투여된다.
본원에 사용된 바와 같이, "비-천연 발생" 핵산 또는 폴리펩타이드는 자연에서 발생하지 않는 핵산 또는 폴리펩타이드를 지칭한다. "비-천연 발생" 핵산 또는 폴리펩타이드는 실험실 및/또는 제조 환경에서 합성, 처리, 제조 및/또는 달리 조작될 수 있다. 일부 경우에, 비-천연 발생 핵산 또는 폴리펩타이드는 처리 전에, 천연 발생 핵산 또는 폴리펩타이드에 존재하지 않았던 특성을 나타내도록 처리(treated), 프로세싱(processed) 또는 조작되는 천연 발생 핵산 또는 폴리펩타이드를 포함할 수 있다. 본원에 사용된 바와 같이, "비-천연 발생" 핵산 또는 폴리펩타이드는 그것이 발견된 자연 공급원으로부터 단리되거나 분리된 핵산 또는 폴리펩타이드일 수 있으며, 그것은 자연 공급원에 그것이 회합되었던 서열에 대한 공유 결합이 결여되어 있다. "비-천연 발생" 핵산 또는 폴리펩타이드는 재조합적으로 또는 다른 방법, 예컨대 화학적 합성을 통해 만들어질 수 있다.
본원에 사용된 바와 같이, 용어 "작동적으로 연결된"은 그렇게 설명된 구성요소가 의도된 방식으로 기능하도록 허용하는 관계에 있는 연결 또는 병치를 지칭한다. 예를 들어, 관심 있는 핵산 서열에 작동적으로 연결된 조절 서열은 관심 있는 핵산 서열의 전사를 지시할 수 있거나, 관심 있는 아미노산 서열에 작동적으로 연결된 신호 서열은 막 상에서 관심 있는 아미노산 서열을 분비하거나 전위시킬 수 있다.
본원에 사용된 바와 같이, 용어 "프라이밍 조성물", "프라이밍 면역화" 또는 "프라임 면역화"는 본 발명의 제1 조성물을 사용하여 1차 항원 자극을 지칭한다. 구체적으로, 본원에 사용된 면역 반응을 "프라이밍" 또는 "강화하는"이라는 용어는 원하는 항원에 대한 면역 반응을 유도하고 동일한 항원으로 후속 재면역화 시 원하는 항원에 대한 더 높은 수준의 면역 반응을 상기시키는 항원을 사용하는 1차 면역화를 지칭한다. 본원에 사용된 바와 같이, 용어 "부스팅 조성물", "부스팅 면역화" 또는 "부스트 면역화"는 1차 면역화 후에 포유동물에게 투여되거나 포유동물에게 효과적인 추가적인 면역화를 지칭한다. 구체적으로, 본원에 사용된 면역 반응을 "부스팅하는"이라는 용어는 프라이밍 면역화에서 인코딩된 것과 동일한 항원을 전달하는 조성물의 투여를 지칭한다.
본원에 사용된 바와 같이, "대상체"는 그에 대해 본 출원의 실시양태에 따른 방법에 의해 치료받을 또는 치료받은 임의의 동물, 바람직하게는 포유동물, 가장 바람직하게는 인간을 의미한다. 본원에 사용된 용어 "포유동물"은 임의의 포유동물을 포함한다. 포유동물의 예는 포유동물의 예는 소, 말, 양, 돼지, 고양이, 개, 마우스, 래트, 토끼, 기니아피그, 비인간 영장류(NHP: non-human primate), 예컨대 원숭이 또는 유인원, 인간 등, 보다 바람직하게는 인간을 포함하지만 이에 제한되지 않는다. 인간 대상체는 환자를 포함할 수 있다.
본 출원의 독자를 돕기 위한 시도에서, 본 설명은 다양한 단락 또는 섹션으로 분리되었거나, 본 출원의 다양한 실시양태에 관한 것이다. 이러한 분리는 단락 또는 섹션 또는 실시양태의 내용을 또 다른 단락 또는 섹션 또는 실시양태의 내용으로부터 분리시키는 것으로 간주되어서는 안 된다. 반대로, 당업자는 그 설명이 광범위하게 적용되고 고려될 수 있는 다양한 섹션, 단락 및 문장의 모든 조합을 포함한다는 것을 이해할 것이다. 임의의 실시양태에 대한 논의는 단지 예시적인 것으로 의도되며, 청구범위를 포함하는 본 개시내용의 범위가 이들 예로 제한된다는 것을 제안하려는 의도는 아니다. 예를 들어, 본원에 기재된 출원의 알파바이러스 레플리콘 RNA의 실시양태는 특정 순서로 배열된 특정 프로모터 서열, 인핸서 또는 조절 서열, 신호 펩타이드, HBV 항원의 코딩 서열, 폴리아데닐화 신호 서열 등을 포함하지만 이에 제한되지 않는 특정 구성요소를 포함할 수 있지만, 당업자는 본원에 개시된 개념이 본 출원의 알파바이러스 레플리콘 RNA에 사용될 수 있는 다른 순서로 배열된 다른 구성요소에 동일하게 적용될 수 있음을 이해할 것이다. 본 출원은 특정 조합이 명백하게 기재되어 있는지 여부에 관계없이, 본 출원의 알파바이러스 레플리콘에서 사용될 수 있는 임의의 서열을 갖는 임의의 조합으로 임의의 적용 가능한 구성요소의 사용을 고려한다.
B형 간염 바이러스(HBV)
본원에 사용된 바와 같이, "B형 간염 바이러스" 또는 "HBV"는 헤파드나비리대 과의 바이러스를 지칭한다. HBV는 4개의 오픈 리딩 프레임과 7개의 단백질을 인코딩하는 작은(예를 들어, 3.2 kb) 간친화성 DNA 바이러스이다. HBV에 의해 인코딩되는 7개 단백질에는 소형(S), 중형(M) 및 대형(L) 표면 항원(HBsAg) 또는 외피(Env) 단백질, 프리코어 단백질((pre-Core protein), 코어 단백질, 바이러스 폴리머라제(Pol) 및 HBx 단백질이 포함된다. HBV는 3개의 표면 항원 또는 외피 단백질인 L, M 및 S를 발현하며, S가 가장 작고 L이 가장 크다. M 및 L 단백질의 추가 도메인은 각각 Pre-S2 및 Pre-S1로 명명된다. 코어 단백질은 바이러스 뉴클레오캡시드의 서브유닛이다. Pol은 감염된 간세포의 세포질에 국한된 뉴클레오캡시드에서 발생하는 바이러스 DNA(역전사효소, RNaseH 및 프라이머)의 합성에 필요하다. 프리코어는 소위 B형 간염 e-항원(HBeAg)과 같이, N-말단 신호 펩타이드를 가지며 감염된 세포로부터 분비되기 전에 그 N 및 C 말단에서 단백질 분해 처리된 코어 단백질이다. HBx 단백질은 공유결합 폐환형 DNA(cccDNA)의 효율적인 전사에 필요하다. HBx는 바이러스 구조 단백질이 아니다. HBV의 모든 바이러스 단백질은 mRNA를 공유하는 코어와 폴리머라제를 이외에 그 자신의 mRNA를 갖는다. 단백질 프리코어를 제외하고, HBV 바이러스 단백질 중 어느 것도 번역 후 단백질 분해 과정을 거치지 않는다.
HBV 비리온은 바이러스 외피, 뉴클레오캡시드 및 부분적 이중 가닥 DNA 게놈의 단일 카피를 포함한다. 뉴클레오캡시드는 코어 단백질의 120개 이량체로 구성되며 S, M 및 L 바이러스 외피 또는 표면 항원 단백질이 내포된 캡시드 막에 의해 싸여 있다. 세포 내로 진입한 후, 바이러스는 코팅되지 않고 공유 결합된 바이러스 폴리머라제와 함께 캡시드-함유 이완된 환형 DNA(rcDNA)는 핵으로 이동한다. 이 과정 동안, 코어 단백질의 인산화는 구조적 변화를 유도하여 캡시드와 소위 임포틴(importin)의 상호작용을 가능하게 하는 핵 국소화 신호를 노출시킨다. 이들 임포틴은 코어 단백질이, 캡시드가 분해되는 핵공 복합체(nuclear pore complex)에 결합하는 것을 매개하며, 폴리머라제/rcDNA 복합체는 핵 내로 방출된다. 핵 내에서 rcDNA는 단백질제거(폴리머라제 제거)되고 숙주 DNA 복구 기구에 의해, 이로부터 중첩 전사체가 HBeAg, HBsAg, 코어 단백질, 바이러스 폴리머라제 및 HBx 단백질을 인코딩하는 공유결합 폐환형 DNA(cccDNA) 게놈으로 전환된다. 코어 단백질, 바이러스 폴리머라제, 및 프리게놈 RNA(pgRNA: pre-genomic RNA)는 세포질에 회합하고 미성숙 pgRNA-함유 캡시드 입자 내로 자가 조립되어, 성숙한 rcDNA-캡시드로 추가로 전환되고 감염 바이러스 입자로서 둘러싸이고 분비되거나 핵으로 다시 운반되어 안정적인 cccDNA 풀을 보충하고 유지하는 공통 중간체로서 기능한다.
현재까지, HBV는 외피 단백질에 존재하는 항원성 에피토프를 기초로 4개의 혈청형(adr, adw, ayr, ayw)으로 나뉘고 바이러스 게놈의 서열을 기초로 8개의 유전자형(A, B, C, D, E, F, G 및 H)으로 나뉜다. HBV 유전자형은 서로 다른 지리적 영역에 걸쳐 분포되어 있다. 예를 들어, 아시아에서 가장 보편적인 유전자형은 유전자형 B와 C이다. 유전자형 D는 아프리카, 중동 및 인도에서 우세한 반면, 유전자형 A는 북유럽, 사하라 이남 아프리카 및 서아프리카에서 널리 퍼져 있다.
HBV 항원
본원에 사용된 바와 같이, 용어 "HBV 항원", "HBV의 항원성 폴리펩타이드", "HBV 항원성 폴리펩타이드", "HBV 항원성 단백질", "HBV 면역원성 폴리펩타이드" 및 "HBV 면역원"은 모두 대상체에서 HBV에 대한 면역 반응을 유도할 수 있는 폴리펩타이드를 지칭한다. 유도된 반응은 체액성 및/또는 세포 매개 반응일 수 있다. HBV 항원은 HBV의 폴리펩타이드, 이의 단편 또는 에피토프, 또는 다수의 HBV 폴리펩타이드의 조합, 이의 일부 또는 유도체일 수 있다. HBV 항원은 숙주에서 보호 면역 반응을 일으킬 수 있는, 예를 들어, 바이러스 질환 또는 감염에 대한 면역 반응을 유도하고/하거나 바이러스 질환 또는 감염에 대해 대상체를 보호하는 바이러스 질환 또는 감염에 대해 대상체에 면역을 생성(즉, 백신접종)할 수 있다. 예를 들어, HBV 항원은 임의의 HBV 단백질로부터의 폴리펩타이드 또는 이의 면역원성 단편(들), 예컨대 임의의 HBV 유전자형, 예를 들어, 유전자형 A, B, C, D, E, F, G 및/또는 H, 또는 이들의 조합으로부터 유래된, HBeAg, 프리코어 단백질, HBsAg(S, M 또는 L 단백질), 코어 단백질, 바이러스 폴리머라제, 또는 HBx 단백질을 포함할 수 있다.
(1) HBV 코어 항원
본원에 사용된 바와 같이, 용어 "HBV 코어 항원", "HBcAg" 및 "코어 항원"은 대상체에서 HBV 코어 단백질에 대한 면역 반응을 유도할 수 있는 HBV 항원을 지칭한다. 유도된 면역 반응은 체액성 및/또는 세포 매개 반응일 수 있다. 용어 "코어", "코어 폴리펩타이드" 및 "코어 단백질" 각각은 HBV 바이러스 코어 단백질을 지칭한다. 전장 코어 항원은 전형적으로 183개 아미노산 길이이고, 조립 도메인(아미노산 1 내지 149) 및 핵산 결합 도메인(아미노산 150 내지 183)을 포함한다. 34-잔기 핵산 결합 도메인은 프리게놈 RNA 캡슐화에 필요하다. 이 도메인은 핵 유입 신호로도 기능한다. 그것은 17개의 아르기닌 잔기로 구성되며 매우 염기성이며 그 기능에 일관된다. HBV 코어 단백질은 용액에서 이량체성이며, 이량체는 20면체 캡시드로 자가 조립된다. 코어 단백질의 각각의 이량체에는 양쪽에 α-나선 도메인이 측면에 있는 4개의 α-나선 번들을 가지고 있다. 핵산 결합 도메인이 결여된 절두된 HBV 코어 단백질은 또한 캡시드를 형성할 수 있다.
본 출원의 실시양태에서, HBV 항원은 절두된 HBV 코어 항원이다. 본원에 사용된 바와 같이, "절두된 HBV 코어 항원"은 전체 길이의 HBV 코어 단백질을 함유하지는 않지만 대상체에서 HBV 코어 단백질에 대한 면역 반응을 유도할 수 있는 HBV 항원을 지칭한다. 예를 들어, HBV 코어 항원은 전형적으로 17개의 아르기닌(R) 잔기를 함유하는, 코어 항원의 고도로 양으로 하전된(아르기닌 풍부) C-말단 핵산 결합 도메인 중 하나 이상의 아미노산을 결실하도록 변형될 수 있다. 본 출원의 절두된 HBV 코어 항원은 바람직하게는 HBV 코어 핵 유입 신호를 포함하지 않는 C-말단 절두된 HBV 코어 단백질 및/또는 C-말단 HBV 코어 핵 유입 신호가 결실된 절두된 HBV 코어 단백질이다. 일 실시양태에서, 절두된 HBV 코어 항원은 C-말단 핵산 결합 도메인에 결실, 예컨대 C-말단 핵산 결합 도메인의 결실된 1 내지 34개의 아미노산 잔기, 예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 또는 34개의 아미노산 잔기의 결실, 바람직하게는 C-말단 핵산 결합 도메인의 31-34개의 C-말단 아미노산 잔기의 결실을 포함한다. 바람직한 실시양태에서, 절두된 HBV 코어 항원은 C-말단 핵산 결합 도메인에 결실, 바람직하게는 C-말단 핵산 결합 도메인의 31개의 C-말단 아미노산 잔기의 결실을 포함한다.
일부 실시양태에서, HBV 코어 항원 아미노산 서열은 분비를 위해 신호 펩타이드에 작동적으로 연결된다. 임의의 적합한 신호 펩타이드가 사용될 수 있다. 일 실시양태에서, HBV 코어 항원은 이의 N-말단에서 시스타틴 S 전구체 신호 펩타이드에 작동적으로 연결되어, 분비를 증진시킨다. 특정 실시양태에서, 시스타틴 S 전구체 신호 펩타이드는 서열번호 77의 아미노산 서열을 갖는다. 또 다른 특정 실시양태에서, HBV 코어 항원의 코딩 서열은 서열번호 90의 폴리뉴클레오티드 서열을 갖는 시스타틴 S 전구체 신호 펩타이드의 코딩 서열에 작동적으로 연결된다.
본 출원의 HBV 코어 항원은 다수의 HBV 유전자형(예를 들어, 유전자형 A, B, C, D, E, F, G, 및 H)으로부터 유래된 컨센서스 서열일 수 있다. 본원에 사용된 바와 같이, "컨센서스 서열"은 동종성 단백질의 아미노산 서열의 정렬에 의해 결정된 바와 같은 동종성 단백질의 아미노산 서열의 정렬에 기초한 아미노산의 인공 서열을 의미한다. 상기 정렬은 Clustal Omega를 사용하는 것과 같이 당업계에 알려진 방법 또는 알고리즘을 사용하여 수행될 수 있다. 이는 적어도 100개의 천연 HBV 단리물로부터의 HBV 항원(예를 들어, 코어, pol 등)의 서열을 기초로 서열 정렬의 각 위치에서 발견되는 가장 빈번한 아미노산 잔기의 계산된 순서일 수 있다. 컨센서스 서열은 비천연 발생일 수 있고 천연 바이러스 서열과 상이할 수 있다. 컨센서스 서열은 다중 서열 정렬 툴을 사용한 상이한 공급원으로부터의 다중 HBV 항원 서열을 정렬하고 다양한 정렬 위치에서 가장 빈번한 아미노산을 선택하여 설계될 수 있다. 바람직하게는, HBV 항원의 컨센서스 서열은 HBV 유전자형 A, B, C, 및 D로부터 유래된다. 용어 "컨센서스 항원"은 컨센서스 서열을 갖는 항원을 지칭하기 위해 사용된다.
본 출원에 따른 예시적인 절두된 HBV 코어 항원은 핵산 결합 기능이 결여되어 있고, 적어도 2개의 HBV 유전자형에 대해 포유동물에서 면역 반응을 유도할 수 있다. 바람직하게는, 절두된 HBV 코어 항원은 적어도 HBV 유전자형 A, B, C 및 D에 대해 포유동물에서 T 세포 반응을 유도할 수 있다. 보다 바람직하게는, 절두된 HBV 코어 항원은 적어도 HBV 유전자형 A, B, C 및 D에 대해 인간 대상체에서 CD8 T 세포 반응을 유도할 수 있다.
일부 실시양태에서, 본 출원의 HBV 코어 항원은 MHC 부류 I HLA 대립유전자에 대한 하나 이상의 T 세포 에피토프를 포함한다. 일부 실시양태에서, HBV 코어 항원은 HLA-A*11:01 에피토프, HLA-A*02:01 에피토프, HLA-A*A0101 에피토프, 및 HLA-B*40:01 에피토프로 이루어진 군으로부터 선택된 하나 이상의 에피토프를 포함한다. 바람직하게는, HBV 코어 항원은 HLA-A*11:01 에피토프, HLA-A*02:01 에피토프, HLA-A*A0101 에피토프, 및 HLA-B*40:01 에피토프로 이루어진 군으로부터 선택된 2개 이상, 예컨대 2, 3 또는 4개의 T 세포 에피토프를 포함한다. 보다 바람직하게는, HBV 코어 항원은 HLA-A*11:01, HLA-A*02:01, HLA-A*A0101, 및 HLA-B*40:01 T 세포 에피토프를 포함한다. 보다 바람직하게는, HBV 코어 항원은 하나 이상의 HLA-A*11:01 에피토프(들)를 포함한다.
일부 실시양태에서, 본 출원의 HBV 핵심 항원은 컨센서스 항원, 바람직하게는 HBV 유전자형 A, B, C, 및 D 중 적어도 2개, 바람직하게는 모두, 보다 바람직하게는 HBV 유전자형 A, B, C, 및 D로부터 유래된 절두된 컨센서스 항원이다. 본 출원에 따른 예시적인 절두된 HBV 코어 컨센서스 항원은 서열번호 86과 적어도 90% 동일한, 예컨대 서열번호 86과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9%, 또는 100% 동일한 아미노산 서열로 이루어진다. 일부 실시양태에서, HBV 코어 항원은 서열번호 84, 서열번호 85 또는 서열번호 86과 적어도 98% 동일한, 예컨대 서열번호 84, 서열번호 85 또는 서열번호 86과 적어도 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9%, 또는 100% 동일한 아미노산 서열을 포함하고, 바람직하게는 이로 이루어진다. 서열번호 86은 HBV 유전자형 A, B, C, 및 D로부터 유래된 코어 컨센서스 항원이다. 서열번호 7은 천연 코어 항원의 고도로 양으로 하전된(아르기닌 풍부) 핵산 결합 도메인의 34-아미노산 C-말단 결실을 포함한다. 일부 바람직한 실시양태에서, 본 출원의 HBV 코어 항원은 C-말단 아르기닌 잔기 중 하나 이상을 보유하고, 서열번호 84, 서열번호 85 또는 서열번호 86의 아미노산 서열을 가짐으로써 HBV 코어 항원에서 HLA-A*11:01 에피토프를 복원한다. 일부 실시양태에서, HBV 코어 항원의 마지막 5개의 C-말단 아미노산은 VVR 아미노산 서열, 보다 특히 VVRR (서열번호 91) 아미노산 서열, 보다 특히 VVRRR(서열번호 92) 아미노산 서열을 포함한다.
본 출원의 특정 실시양태에서, HBV 코어 항원은 서열번호 7, 서열번호 84, 서열번호 85 또는 서열번호 86의 아미노산 서열로 이루어진 절두된 HBV 항원이다. 또 다른 특정 실시양태에서, HBV 코어 항원은 각각 서열번호 8, 서열번호 87, 서열번호 88 또는 서열번호 89의 폴리뉴클레오티드 서열에 의해 인코딩된다. 바람직하게는, HBV 코어 항원은 서열번호 86의 아미노산 서열로 이루어지고, 서열번호 89의 폴리뉴클레오티드 서열에 의해 인코딩된다. 일부 실시양태에서, HBV 코어 항원은 아미노산 서열로 이루어지거나, 그 내용은 그 전체가 본원에 참조로 포함된 미국 특허 출원 공개 번호 US2019/0185828에 기재된 바와 같이 폴리뉴클레오티드 서열에 의해 인코딩된다.
(2) HBV 폴리머라제 항원
본원에 사용된 용어 "HBV 폴리머라제 항원", "HBV Pol 항원" 또는 "HBV pol 항원"은 대상체에서 HBV 폴리머라제에 대한 면역 반응을 유도할 수 있는 HBV 항원을 지칭한다. 면역 반응은 체액성 및/또는 세포 매개 반응일 수 있다. 용어 "폴리머라제", "폴리머라제 폴리펩타이드", "Pol" 및 "pol" 각각은 HBV 바이러스 DNA 폴리머라제를 지칭한다. HBV 바이러스 DNA 폴리머라제는 N 말단에서 C 말단으로 마이너스-가닥 DNA 합성을 위한 프라이머 역할을 하는 말단 단백질(TP) 도메인을 포함하는 4개의 도메인을 갖는다: 폴리머라제 기능에 필수적이지 않은 스페이서; 전사를 위한 역전사효소(RT) 도메인; 및 RNase H 도메인.
본 출원의 실시양태에서, HBV 항원은 HBV Pol 항원, 또는 이의 임의의 면역원성 단편 또는 조합을 포함한다. HBV Pol 항원은 예컨대 폴리머라제 및/또는 RNase 도메인의 활성 부위에 돌연변이를 도입하여 특정 효소 활성을 감소 또는 실질적으로 제거함으로써 항원의 면역원성을 향상시키기 위한 추가 변형을 포함할 수 있다.
바람직하게는, 본 발명의 HBV Pol 항원은 역전사효소 활성 및 RNase H 활성을 갖지 않으며, 적어도 2개의 HBV 유전자형에 대해 포유동물에서 면역 반응을 유도할 수 있다. 바람직하게는, HBV Pol 항원은 HBV 유전자형 A, B, C 및 D 중 적어도 2개, 바람직하게는 모두에 대해 포유동물에서 T 세포 반응을 유도할 수 있다. 보다 바람직하게는, HBV Pol 항원은 적어도 HBV 유전자형 A, B, C 및 D에 대해 인간 대상체에서 CD8 T 세포 반응을 유도할 수 있다.
따라서, 일부 실시양태에서, HBV Pol 항원은 불활성화 Pol 항원이다. 한 실시양태에서, 불활성화 HBV Pol 항원은 폴리머라제 도메인의 활성 부위에 하나 이상의 아미노산 돌연변이를 포함한다. 또 다른 실시양태에서, 불활성화 HBV Pol 항원은 RNaseH 도메인의 활성 부위에 하나 이상의 아미노산 돌연변이를 포함한다. 바람직한 실시양태에서, 불활성화 HBV pol 항원은 폴리머라제 도메인 및 RNaseH 도메인 둘 모두의 활성 부위에 하나 이상의 아미노산 돌연변이를 포함한다. 예를 들어, 뉴클레오티드/금속 이온 결합에 필요할 수 있는 HBV pol 항원의 폴리머라제 도메인의 "YXDD" 모티프(서열번호 74)는, 예를 들어, 하나 이상의 아스파르테이트 잔기(D)를 아스파라긴 잔기(N)로 대체하여 금속 배위 기능을 제거하거나 감소시킴으로써 돌연변이될 수 있으며, 이에 의해 역전사효소 기능을 감소시키거나 실질적으로 제거한다. 대안적으로, 또는 "YXDD" 모티프(서열번호 74)의 돌연변이 이외에, Mg2+ 배위에 필요한 HBV pol 항원의 RNaseH 도메인의 "DEDD" 모티프(서열번호 75)는, 예를 들어, 하나 이상의 아스파르테이트 잔기(D)를 아스파라긴 잔기(N)로 대체하고/하거나 글루타메이트 잔기(E)를 글루타민(Q)으로 대체하여 돌연변이될 수 있으며, 이에 의해 RNaseH 기능을 감소시키거나 실질적으로 제거할 수 있다. 특정 실시양태에서, HBV pol 항원은 (1) 폴리머라제 도메인의 "YXDD" 모티프(서열번호 74)에서 아스파르테이트 잔기(D)를 아스파라긴 잔기(N)로 돌연변이시키고; (2) RNaseH 도메인의 "DEDD" 모티프(서열번호 75)에서 제1 아스파르테이트 잔기(D)를 아스파라긴 잔기(N)로 돌연변이시키고, 제1 글루타메이트 잔기(E)를 글루타민 잔기(N)로 돌연변이시켜 변형되어, pol 항원의 역전사효소 및 RNaseH 기능 둘 모두를 감소시키거나 실질적으로 제거한다.
일부 실시양태에서, HBV pol 항원 아미노산 서열은 분비를 위한 신호 펩타이드에 작동적으로 연결된다. 임의의 적합한 신호 펩타이드가 사용될 수 있다. 일 실시양태에서, HBV pol 항원은 이의 N-말단에서 시스타틴 S 전구체 신호 펩타이드에 작동적으로 연결되어, 분비를 증진시킨다. 특정 실시양태에서, 시스타틴 S 전구체 신호 펩타이드는 서열번호 77의 아미노산 서열을 갖는다. 또 다른 특정 실시양태에서, HBV pol 항원의 코딩 서열은 서열 90의 폴리뉴클레오티드 서열을 갖는 시스타틴 S 전구체 신호 펩타이드의 코딩 서열에 작동적으로 연결된다.
일부 실시양태에서, 본 출원의 HBV pol 항원은 MHC 부류 I HLA 대립유전자에 대한 하나 이상의 T 세포 에피토프를 포함한다. 일부 실시양태에서, HBV pol 항원은 HLA-A*11:01 에피토프, HLA-A*24:02 에피토프, HLA-A*02:01 에피토프, 및 HLA-A*A0101 에피토프로 이루어진 군으로부터 선택된 하나 이상의 에피토프를 포함한다. 바람직하게는, HBV pol 항원은 HLA-A*11:01 에피토프, HLA-A*24:02 에피토프, HLA-A*02:01 에피토프, 및 HLA-A*A0101로 이루어진 군으로부터 선택된 2개 이상, 예컨대 2, 3 또는 4개의 T 세포 에피토프를 포함한다. 보다 바람직하게는, HBV pol 항원은 HLA-A*11:01, HLA-A*24:02, HLA-A*02:01, 및 HLA-A*A0101 T 세포 에피토프를 포함한다. 보다 바람직하게는, HBV pol 항원은 하나 이상의 HLA-A*11:01 에피토프(들)를 포함한다.
본 출원의 바람직한 실시양태에서, HBV pol 항원은 컨센서스 항원, 바람직하게는 HBV 유전자형 A, B, C, 및 D 중 적어도 2개, 바람직하게는 모두로부터 유래된 컨센서스 항원, 보다 바람직하게는 HBV 유전자형 A, B, C, 및 D로부터 유래된 불활성화 컨센서스 항원이다. 본 출원에 따른 예시적인 HBV pol 컨센서스 항원은 서열번호 9와 적어도 90% 동일한, 예컨대 서열번호 9와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한, 바람직하게는 서열번호 9와 적어도 98% 동일한, 예컨대 서열번호 9와 적어도 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함한다. 서열번호 9는 폴리머라제 및 RNaseH 도메인의 활성 부위에 위치한 4개의 돌연변이를 포함하는 HBV 유전자형 A, B, C 및 D로부터 유래된 pol 컨센서스 항원이다. 특히, 상기 4개의 돌연변이는 폴리머라제 도메인의 "YXDD" 모티프(서열번호 74)에서 아스파르트산 잔기(D)의 아스파라긴 잔기(N)로의 돌연변이; 및 RNaseH 도메인의 "DEDD"(서열번호 75) 모티프에서 제1 아스파르테이트 잔기(D)의 아스파라긴 잔기(N)로의 돌연변이 및 글루타메이트 잔기(E)의 글루타민 잔기(Q)로의 돌연변이를 포함한다.
본 출원의 특정 실시양태에서, HBV pol 항원은 서열번호 9의 아미노산 서열을 포함한다. 바람직하게는, HBV pol 항원은 서열번호 9의 아미노산 서열로 이루어진다. 또 다른 특정 실시양태에서, HBV pol 항원은 서열번호 10의 폴리뉴클레오티드 서열에 의해 인코딩된다. 일부 실시양태에서, HBV pol 항원은 아미노산 서열을 포함하거나 이로 이루어지거나, 그 내용은 그 전문이 본원에 참조로 포함된 미국 특허 출원 공개 번호 US2019/0185828에 기재된 바와 같은 폴리뉴클레오티드 서열에 의해 인코딩된다.
(3) HBV 표면 항원
본원에 사용된 바와 같이, 용어 "HBV 표면 항원", "표면 항원", "HBV 외피 항원", "외피 항원" 및 "env 항원" 각각은 대상체에서 하나 이상의 HBV 표면 항원 또는 외피 단백질에 대한 면역 반응을 유도(inducing)하거나 유도(eliciting)할 수 있는 HBV 항원을 지칭한다. 면역 반응은 체액성 및/또는 세포 매개 반응일 수 있다. 용어 "HBV 표면 단백질", "표면 단백질", "HBV 외피 단백질" 및 "외피 단백질"은 각각 HBV 바이러스 표면 또는 외피 단백질을 지칭한다. HBV는 3개의 표면 항원 또는 외피 단백질을 발현한다. 유전자 S는 표면 항원을 인코딩하는 HBV 게놈의 유전자이다. 표면 항원 유전자는 하나의 긴 오픈 리딩 프레임이지만 유전자를 pre-S1, pre-S2 및 S의 세 절편으로 나누는 프레임 내 "개시"(ATG) 코돈 3개를 포함한다. 다중 개시 코돈 때문에, 대형(L) 또는 L-표면 항원, 중형(M) 또는 M-표면 항원, 소형(S) 또는 S-표면 항원으로 불리는 3개의 상이한 크기의 폴리펩타이드가 생성되며, HBV L, M 및 S 외피 단백질이라고도 한다. 2개의 상이한 프로모터(PreS1 및 PreS2)는 L, M 및 S-표면 항원 코딩 서열의 전사를 유도하여 3개의 상이한 번역된 단백질인 L, M 및 S 외피 단백질을 생성한다. PreS2 프로모터는 M-표면 항원과 S-표면 항원 전사를 별도로 유도하기 때문에 PreS2/S 프로모터라고도 한다. L-표면 항원의 아미노산 서열은 M 및 S-표면 항원 서열과 함께 프레임 내에 있다. 따라서, L-표면 항원은 M- 및 S-표면 항원 도메인을 포함하고, M-표면 항원은 S-표면 항원 도메인을 포함한다. L-, M- 및 S- 표면 항원은 공동 C-말단이며 전체 S 도메인을 공유한다. S에 비해, M은 이의 N 말단에 추가 도메인인 pre-S2를 가지며, M에 비해, L은 pre-S1 도메인을 갖는다.
일부 실시양태에서, HBV 항원은 HBV PreS1 항원이며, 이는 pre-S1 유전자 절편에 의해 인코딩되고 L 항원의 Pre-S1 도메인만을 포함한다. PreS1 항원은 99 내지 109개의 아미노산을 갖는 것과 같이 다양한 길이를 가질 수 있다. 본 출원의 HBV PreS1 항원은 임의의 천연 발생 PreS1 도메인의 서열, 및 이의 변이체 또는 유도체를 포함할 수 있다.
다른 실시양태에서, HBV 항원은 HBV PreS2.S 항원이며, 이는 Pre-S2 및 S 유전자 절편에 의해 인코딩되고, PreS2 도메인 및 S 도메인을 포함한다. PreS2 도메인은 약 55개의 아미노산 길이일 수 있으며 S-도메인은 약 226개의 아미노산을 포함할 수 있다. 본 출원의 HBV PreS2.S 항원은 임의의 천연 발생 PreS2 및 S 도메인의 서열, 및 이의 변이체 또는 유도체를 포함할 수 있다. 일부 실시양태에서, PreS2.S의 내부 신호 펩타이드는 HBV M 및 HBV S 항원의 PreS2.S 단백질 산물의 분비를 촉진하기 위해 온전하게 남겨진다. 일 실시양태에서, HBV PreS2.S 항원은 HBV M 표면 항원이다. 또 다른 실시양태에서, HBV PreS2.S 항원은 HBV S 표면 항원이다. 또 다른 실시양태에서, HBV PreS2.S 항원은 HBV M 표면 항원 및 HBV S 표면 항원을 포함한다.
일부 실시양태에서, HBV 표면 항원 아미노산 서열은 분비를 위한 신호 펩타이드에 작동적으로 연결되거나 이를 포함한다. 임의의 적합한 신호 펩타이드가 사용될 수 있다. 일 실시양태에서, HBV Pre-S1 항원 아미노산 서열은 이의 N-말단에서 시스타틴 S 전구체 신호 펩타이드에 작동적으로 연결되어 분비를 증진시킨다. 특정 실시양태에서, 시스타틴 S 전구체 신호 펩타이드는 서열번호 77의 아미노산 서열을 갖는다. 또 다른 특정 실시양태에서, HBV Pre-S1 항원의 코딩 서열은 서열번호 90의 폴리뉴클레오티드 서열을 갖는 시스타틴 S 전구체 신호 펩타이드의 코딩 서열에 작동적으로 연결된다.
본 출원의 실시양태에서, HBV 항원은 HBV 표면 항원, 또는 이의 임의의 면역원성 단편 또는 조합을 포함한다. HBV 표면 항원은 L-표면 항원, M-표면 항원 및 S-표면 항원 단백질 중 적어도 하나에 대해 대상체에서 면역 반응을 유도할 수 있다. 바람직하게는, HBV 표면 항원, 예컨대 Pre-S1 또는 PreS2.S 항원은 컨센서스 항원, 바람직하게는 적어도 2개의 HBV 유전자형 A, B, C, 및 D로부터 유래된 컨센서스 항원이고, 보다 바람직하게는 HBV 유전자형 A, B, C, 및 D로부터 유래된 컨센서스 항원이다.
일부 실시양태에서, 본 출원의 HBV 표면 항원은 MHC 부류 I HLA 대립유전자에 대한 하나 이상의 T 세포 에피토프를 포함한다. 일부 실시양태에서, HBV 표면 항원은 HLA-A*11:01 에피토프, HLA-A*24:02 에피토프, 및 HLA-A*A2402 에피토프로 이루어진 군으로부터 선택된 하나 이상의 T 세포 에피토프를 포함한다. 바람직하게는, HBV Pre-S1 항원은 HLA-A*11:01 에피토프 및 HLA-A*24:02 에피토프로 이루어진 군으로부터 선택된 하나 이상의 T 세포 에피토프를 포함한다. 보다 바람직하게는, HBV Pre-S1 항원은 HLA-A*11:01 및 HLA-A*24:02 T 세포 에피토프를 포함한다. 보다 바람직하게는, HBV Pre-S1 항원은 하나 이상의 HLA-A*11:01 에피토프(들)를 포함한다. 바람직하게는, HBV PreS2.S 항원은 HLA-A*11:01 에피토프, HLA-A*24:02 에피토프, 및 HLA-A*A2402 에피토프로 이루어진 군으로부터 선택된 하나 이상의 T 세포 에피토프를 포함한다. 보다 바람직하게는, HBV PreS2.S 항원은 HLA-A*11:01, HLA-A*24:02, 및 HLA-A*A2402 T 세포 에피토프를 포함한다. 보다 바람직하게는, HBV PreS2.S 항원은 하나 이상의 HLA-A*11:01 에피토프(들)를 포함한다.
본 출원의 일부 실시양태에서, HBV 표면 항원은 Pre-S1 항원이다. 본 출원에 따른 예시적인 Pre-S1 항원은 서열번호 1 또는 서열번호 3과 적어도 90% 동일한, 예컨대 서열번호 1 또는 서열번호 3과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9%, 또는 100% 동일한 아미노산 서열을 포함한다. 본 출원의 일부 실시양태에서, HBV 표면 항원은 Pre-S2.S 항원이다. 본 출원에 따른 예시적인 Pre-S2.S 항원은 서열번호 5와 적어도 90% 동일한, 예컨대 서열번호 5와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9%, 또는 100% 동일한 아미노산 서열을 포함한다.
본 출원의 특정 실시양태에서, HBV 표면 항원은 서열번호 1 또는 서열번호 3의 아미노산 서열로 이루어진 Pre-S1 항원이다. 또 다른 특정 실시양태에서, HBV 표면 항원은 서열번호 2 또는 서열번호 4의 폴리뉴클레오티드 서열에 의해 인코딩된다. 또 다른 특정 실시양태에서, HBV 표면 항원은 서열번호 5의 아미노산 서열로 이루어진 Pre-S2.S 항원이다. 또 다른 특정 실시양태에서, HBV 표면 항원은 서열번호 6의 폴리뉴클레오티드 서열에 의해 인코딩된다.
본 출원의 일부 실시양태에서, HBV 표면 항원은 S-표면 항원이다. 본 출원에 따른 예시적인 S-표면 항원은 서열번호 79의 아미노산 서열과 적어도 98% 동일한, 예컨대 서열번호 79의 아미노산 서열과 적어도 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열로 이루어진다. 서열번호 81은 HBV 유전자형 A, B, C 및 D로부터 유래된 HBV 컨센서스 S-표면 항원이다. 본 출원의 특정 실시양태에서, S-표면 항원은 서열번호 79의 아미노산 서열로 이루어진다. 또 다른 특정 실시양태에서, HBV 표면 항원은 서열번호 78의 폴리뉴클레오티드 서열에 의해 인코딩된다.
일부 실시양태에서, HBV 표면 항원은 M-표면 항원, 또는 이의 임의의 면역원성 단편 또는 조합이다. 바람직하게는, M-표면 항원은 컨센서스 항원, 바람직하게는 HBV 유전자형 A, B, C, 및 D 중 적어도 2개, 바람직하게는 모두로부터 유래된 컨센서스 항원이고, 보다 바람직하게는 HBV 유전자형 A, B, C, 및 D로부터 유래된 컨센서스 항원이다. 바람직하게는, M-표면 항원은 대상체에서 M-표면 항원에 대한 면역 반응을 유도(inducing)하거나 유도(eliciting)할 수 있다.
본 출원에 따른 예시적인 M-표면 항원은 서열번호 82의 아미노산 서열과 적어도 98% 동일한, 예컨대 서열번호 82의 아미노산 서열과 적어도 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하거나 이로 이루어진다. 서열번호 82는 HBV 유전자형 A, B, C 및 D로부터 유래된 HBV 컨센서스 M-표면 항원이다. 본 출원의 특정 실시양태에서, M-표면 항원은 서열번호 82의 아미노산 서열로 이루어진다.
일부 실시양태에서, HBV 표면 항원은 L-표면 항원, 또는 이의 임의의 면역원성 단편 또는 조합이다. 바람직하게는, L-표면 항원은 컨센서스 항원, 바람직하게는 HBV 유전자형 A, B, C, 및 D 중 적어도 2개, 바람직하게는 모두로부터 유래된 컨센서스 항원이고, 보다 바람직하게는 HBV 유전자형 A, B, C, 및 D로부터 유래된 컨센서스 항원이다. 바람직하게는, L-표면 항원은 대상체에서 L-표면 항원에 대한 면역 반응을 유도(inducing)하거나 유도( eliciting)할 수 있다.
본 출원에 따른 예시적인 L-표면 항원은 서열번호 83의 아미노산 서열과 적어도 98% 동일한, 예컨대 서열번호 83의 아미노산 서열과 적어도 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하거나 이로 이루어진다. 서열번호 83은 HBV 유전자형 A, B, C 및 D로부터 유래된 HBV 컨센서스 L-표면 항원이다. 본 출원의 특정 실시양태에서, M-표면 항원은 서열번호 83의 아미노산 서열로 이루어진다.
일부 실시양태에서, HBV 표면 항원은 L-, M-, 및 S 표면 항원 중 어느 하나의 일부, 또는 이의 임의의 조합을 포함한다. 예를 들어, HBV 표면 항원은 N-말단 L-표면 항원 도메인을 포함하거나 이로 이루어질 수 있다. HBV 표면 항원은 또한 M-표면 항원 도메인을 포함하거나 이로 이루어질 수 있다. HBV 표면 항원은 또한 N-말단 L-표면 항원 도메인 및 M-표면 항원 도메인을 포함하거나 이로 이루어질 수 있다. HBV 표면 항원은 또한 N-말단 L-표면 항원 도메인, M-표면 항원 도메인 및 S-표면 항원 도메인의 일부를 포함하거나 이로 이루어질 수 있다.
본 출원에 따른 그러한 표면 항원의 예시적인 예는 서열번호 81의 아미노산 서열과 98% 이상 동일한, 예컨대 서열번호 81의 아미노산 서열과 적어도 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한, 바람직하게는 서열번호 81과 적어도 98% 동일한, 예컨대 서열번호 81과 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열로 이루어진다. 서열번호 81은 HBV 유전자형 A, B, C 및 D로부터 유래된 컨센서스 항원으로서, N-말단 L-표면 항원 도메인, 전체 M-표면 항원 도메인, 및 S-표면 항원 도메인으로부터의 15-아미노산 C-말단 테일을 포함한다. 본 출원의 특정 실시양태에서, HBV 표면 항원은 서열번호 81의 아미노산 서열로 이루어진다. 또 다른 특정 실시양태에서, HBV 표면 항원은 HBV 표면 항원을 인코딩하는 서열번호 80의 폴리뉴클레오티드 서열에 의해 인코딩된다. 일부 실시양태에서, HBV 표면 항원은 아미노산 서열로 이루어지거나, 그 내용은 그 전체가 본원에 참조로 포함된 유럽 특허 출원 번호 19180926호에 기재된 폴리뉴클레오티드 서열에 의해 인코딩된다.
폴리뉴클레오티드 및 벡터
또 다른 일반적인 측면에서, 본 출원은, 본 출원에 따른 HBV 항원을 인코딩하는 비-천연 폴리뉴클레오티드 서열을 포함하는 핵산 분자 또는 핵산 조합, 및 비-천연 발생 핵산을 포함하는 벡터를 제공한다. 핵산 분자는 본 출원의 HBV 항원을 인코딩하는 임의의 비-천연 발생 폴리뉴클레오티드 서열을 포함할 수 있으며, 이는 본 개시내용의 관점에서 당업계에 알려진 방법을 사용하여 제조될 수 있다. 바람직하게는, 비-천연 발생 폴리뉴클레오티드는 절두된 HBV 코어 항원, HBV 폴리머라제 항원, HBV Pre-S1 항원, 및 HBV Pre-S2.S 항원 중 적어도 하나를 인코딩한다. 폴리뉴클레오티드는 RNA 형태이거나 재조합 기술(예를 들어, 클로닝)에 의해 수득되거나 합성(예를 들어, 화학적 합성)으로 생성된 DNA 형태일 수 있다. DNA는 단일-가닥 또는 이중-가닥일 수 있거나, 이중-가닥 및 단일-가닥 서열 둘 모두의 부분을 함유할 수 있다. DNA는, 예를 들어, 게놈 DNA, cDNA, 또는 이들의 조합을 포함할 수 있다. 폴리뉴클레오티드는 또한 DNA/RNA 하이브리드일 수 있다. 본 출원의 폴리뉴클레오티드 및 벡터는 재조합 단백질 생성, 숙주 세포에서의 단백질의 발현, 또는 바이러스 입자의 생성에 사용될 수 있다. 바람직하게는, 폴리뉴클레오티드는 RNA이다.
본 출원의 일 실시양태에서, 핵산 분자 또는 조합은 서열번호 7, 서열번호 84, 서열번호 85 또는 서열번호 86과 적어도 90% 동일한, 예컨대 서열번호 7, 서열번호 84, 서열번호 85 또는 서열번호 86과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한, 바람직하게는 서열번호 7, 서열번호 84, 서열번호 85 또는 서열번호 86과 98%, 99% 또는 100% 동일한 아미노산 서열로 이루어진 절두된 HBV 코어 항원을 인코딩하는 비-천연 발생 폴리뉴클레오티드 서열을 포함한다. 본 출원의 특정 실시양태에서, 비-천연 발생 핵산 분자는 서열번호 7, 서열번호 84, 서열번호 85 또는 서열번호 86의 아미노산 서열로 이루어진 절두된 HBV 코어 항원을 인코딩한다. 바람직하게는, 절두된 HBV 코어 항원은 서열번호 86으로 이루어진다.
서열번호 7, 서열번호 84, 서열번호 85 또는 서열번호 86의 아미노산 서열로 이루어진 절두된 HBV 코어 항원을 인코딩하는 본 출원의 폴리뉴클레오티드 서열의 예는 서열번호 8, 서열번호 87, 서열번호 88 또는 서열번호 89와 각각 적어도 90% 동일한, 예컨대 서열번호 8, 서열번호 87, 서열번호 88 또는 서열번호 89와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한, 바람직하게는 서열번호 8, 서열번호 87, 서열번호 88 또는 서열번호 89와 98%, 99% 또는 100% 동일한 폴리뉴클레오티드 서열을 포함하지만 이에 제한되지 않는다. 절두된 HBV 코어 항원을 인코딩하는 예시적인 비-천연 발생 핵산 분자는 서열번호 8, 서열번호 87, 서열번호 88 또는 서열번호 89의 폴리뉴클레오티드 서열을 갖는다. 바람직하게는, 절두된 HBV 코어 항원을 인코딩하는 분자는 서열번호 89의 폴리뉴클레오티드 서열을 갖는다.
본 출원의 일 실시양태에서, 핵산 분자 또는 조합은 서열번호 9와 적어도 90% 동일한, 예컨대 서열번호 9와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하는 HBV 폴리머라제 항원을 인코딩하는 비-천연 발생 폴리뉴클레오티드 서열을 포함한다. 본 출원의 특정 실시양태에서, 비-천연 발생 핵산 분자는 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩한다.
서열번호 9의 아미노산 서열을 포함하는 HBV Pol 항원을 인코딩하는 본 출원의 폴리뉴클레오티드 서열의 예는 서열번호 10과 적어도 90% 동일한, 예컨대 서열번호 10과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한, 바람직하게는 서열번호 10과 98%, 99% 또는 100% 동일한 폴리뉴클레오티드 서열을 포함하지만 이에 제한되지 않는다. HBV pol 항원을 인코딩하는 예시적인 비-천연 발생 핵산 분자는 서열번호 10의 폴리뉴클레오티드 서열을 갖는다.
본 출원의 일 실시양태에서, 핵산 분자 또는 조합은 서열번호 1 또는 서열번호 3과 적어도 90% 동일한, 예컨대 서열번호 1 또는 서열번호 3과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한, 바람직하게는 서열번호 1 또는 서열번호 3과 98%, 99% 또는 100% 동일한 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 비-천연 발생 폴리뉴클레오티드 서열을 포함한다. 본 출원의 특정 실시양태에서, 비-천연 발생 핵산 분자는 서열번호 1 또는 서열번호 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩한다.
서열번호 1 또는 서열번호 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 본 출원의 폴리뉴클레오티드 서열의 예는 서열번호 2 또는 서열번호 4와 각각 적어도 90% 동일한, 예컨대 서열번호 2 또는 서열번호 4와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한, 바람직하게는 서열번호 2 또는 서열번호 4와 98%, 99% 또는 100% 동일한 폴리뉴클레오티드 서열을 포함하지만 이에 제한되지 않는다. HBV Pre-S1 항원을 인코딩하는 예시적인 비-천연 발생 핵산 분자는 서열번호 2 또는 4의 폴리뉴클레오티드 서열을 갖는다.
본 출원의 일 실시양태에서, 핵산 분자 또는 조합은 서열번호 5와 적어도 90% 동일한, 예컨대 서열번호 5와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한, 바람직하게는 서열번호 5와 98%, 99% 또는 100% 동일한 아미노산 서열로 이루어진 HBV Pre-S2.S 항원을 인코딩하는 비-천연 발생 폴리뉴클레오티드 서열을 포함한다. 본 출원의 특정 실시양태에서, 비-천연 발생 핵산 분자는 서열번호 5의 아미노산 서열로 이루어진 HBV Pre-S2.S 항원을 인코딩한다.
서열번호 5의 아미노산 서열로 이루어진 HBV Pre-S2.S 항원을 인코딩하는 본 출원의 폴리뉴클레오티드 서열의 예는 서열번호 6과 각각 적어도 90% 동일한, 예컨대 서열번호 6과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한, 바람직하게는 서열번호 6과 98%, 99% 또는 100% 동일한 폴리뉴클레오티드 서열을 포함하지만 이에 제한되지 않는다. HBV Pre-S2.S 항원을 인코딩하는 예시적인 비-천연 발생 핵산 분자는 서열번호 6의 폴리뉴클레오티드 서열을 갖는다.
본 출원의 일 실시양태에서, 핵산 분자 또는 조합은 5' 말단에서 3' 말단으로: 제1 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열, 제1 내부 리보솜 진입 서열(IRES) 요소 또는 제1 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열, 및 제2 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열을 포함하는 비-천연 발생 폴리뉴클레오티드 서열을 포함하고, 여기서 제1 및 제2 HBV 항원 중 적어도 하나는 HBV 표면 항원이다. 일부 실시양태에서, 비-천연 발생 폴리뉴클레오티드 서열은 5'-말단에서 3'-말단의 순서로: 제2 IRES 요소 또는 제2 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열의 3' 말단에 작동적으로 연결된 제2 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열 및 제3 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열을 추가로 포함한다. 일부 실시양태에서, 비-천연 발생 폴리뉴클레오티드 서열은 5'-말단에서 3'-말단의 순서로: 제3 IRES 요소 또는 제3 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열의 3' 말단에 작동적으로 연결된 제3 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열, 및 제4 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열을 추가로 포함한다.
일부 실시양태에서, 제1, 제2, 제3 및 제4 HBV 항원 각각은 하기로 이루어진 군으로부터 독립적으로 선택된다: (i) 서열번호 1의 아미노산 서열과 적어도 98% 동일한, 예컨대 서열번호 1의 아미노산 서열과 적어도 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하는, 바람직하게는 이로 이루어진 제1 HBV 표면 항원; (ii) 서열번호 3의 아미노산 서열과 적어도 98% 동일한, 예컨대 서열번호 3의 아미노산 서열과 적어도 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하는, 바람직하게는 이로 이루어진 제2 HBV 표면 항원; (iii) 서열번호 5의 아미노산 서열과 적어도 98% 동일한, 예컨대 서열번호 5의 아미노산 서열과 적어도 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하는, 바람직하게는 이로 이루어진 제3 HBV 표면 항원; (iv) 서열번호 7과 적어도 90% 동일한, 예컨대 서열번호 7과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하는, 바람직하게는 이로 이루어진 HBV 코어 항원; 및 (v) 서열번호 9와 적어도 90% 동일한, 예컨대 서열번호 9와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원. 일부 실시양태에서, HBV 코어 항원은 서열번호 84, 서열번호 85 또는 서열번호 86과 적어도 90% 동일한, 예컨대 서열번호 84, 서열번호 85 또는 서열번호 86과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하고, 바람직하게는 이로 이루어진다.
일부 실시양태에서, 제1, 제2, 제3 및 제4 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열 각각은 하기로 이루어진 군으로부터 독립적으로 선택된다: (i) 서열번호 2와 적어도 90% 동일한, 예컨대 서열번호 2와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 서열을 갖는 제1 HBV PreS1 항원을 인코딩하는 폴리뉴클레오티드 서열; (ii) 서열번호 4와 적어도 90% 동일한, 예컨대 서열번호 4와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 서열을 갖는 제2 HBV PreS1 항원을 인코딩하는 폴리뉴클레오티드 서열; (iii) 서열번호 6과 적어도 90% 동일한, 예컨대 서열번호 6과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열; (iv) 서열번호 8과 적어도 90% 동일한, 예컨대 서열번호 8과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열; 및 (v) 서열번호 10과 적어도 90% 동일한, 예컨대 서열번호 10과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열. 일부 실시양태에서, HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열은 서열번호 87, 서열번호 88 또는 서열번호 89와 적어도 90% 동일한, 예컨대 서열번호 87, 서열번호 88 또는 서열번호 89와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하고, 바람직하게는 이로 이루어진다.
일부 실시양태에서, 제1, 제2 및 제3 오토프로테아제 펩타이드 각각은 독립적으로 돼지 테스코바이러스-1 2A(P2A), 구제역 바이러스(FMDV) 2A(F2A), 말 비염 A 바이러스(ERAV) 2A(E2A), 테세아 아시그나 바이러스 2A(T2A), 세포질 다각체병 바이러스 2A(BmCPV2A), 무름병 바이러스 2 A(BmIFV2A), 및 이들의 조합으로 이루어진 군으로부터 선택된 펩타이드 서열을 포함한다, 바람직하게는, 제1, 제2 및 제3 오토프로테아제 펩타이드 각각은 서열번호 11의 P2A 서열과 같은 P2A의 펩타이드 서열을 포함한다. 바람직하게는, P2A 펩타이드 서열을 인코딩하는 폴리뉴클레오티드 서열은 서열번호 12이다.
일부 실시양태에서, 제1, 제2 및 제3 IRES 각각은 뇌심근염 바이러스(EMCV) 또는 엔테로바이러스 71(EV71)로부터 유래되고, 바람직하게는 제1, 제2 및 제3 IRES 각각은 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 포함한다.
본 출원의 일 실시양태에서, 핵산 분자 또는 조합은 5' 말에서 3' 말단으로 하기를 포함하는 비-천연 발생 폴리뉴클레오티드 서열을 포함한다: (1) 서열번호 7의 아미노산 서열을 갖는, 바람직하게는, 서열번호 84, 85 또는 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열; (2) 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 7의 아미노산 서열을 갖는, 바람직하게는, 서열번호 84, 85 또는 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열; (3) 서열번호 1 또는 3의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 5의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열; (4) 서열번호 5의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 1 또는 3의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열; (5) 서열번호 7의 아미노산 서열을 갖는, 바람직하게는, 서열번호 84, 85 또는 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 5의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열; (6) 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 7의 아미노산 서열을 갖는, 바람직하게는, 서열번호 84, 85 또는 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 5의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열; (7) 서열번호 5의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 7의 아미노산 서열을 갖는, 바람직하게는, 서열번호 84, 85 또는 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열; (8) 서열번호 5의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 7의 아미노산 서열을 갖는, 바람직하게는, 서열번호 84, 85 또는 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열; (9) 서열번호 7의 아미노산 서열을 갖는, 바람직하게는, 서열번호 84, 85 또는 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열; (10) 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 7의 아미노산 서열을 갖는, 바람직하게는, 서열번호 84, 85 또는 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열; (11) 서열번호 5의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 7의 아미노산을 갖는, 바람직하게는, 서열번호 84, 85 또는 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열; (12) 서열번호 5의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 7의 아미노산 서열을 갖는, 바람직하게는, 서열번호 84, 85 또는 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열; (13) 서열번호 7의 아미노산 서열을 갖는, 바람직하게는, 서열번호 84, 85 또는 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열; (14) 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 7의 아미노산 서열을 갖는, 바람직하게는, 서열번호 84, 85 또는 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열; (15) 서열번호 5의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 7의 아미노산 서열을 갖는, 바람직하게는, 서열번호 84, 85 또는 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열; (16) 서열번호 5의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 7의 아미노산 서열을 갖는, 바람직하게는, 서열번호 84, 85 또는 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열; (17) 서열번호 5의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 86의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열; (18) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 7의 아미노산 서열을 갖는, 바람직하게는, 서열번호 84, 85 또는 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열; (19) 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 7의 아미노산 서열을 갖는, 바람직하게는, 서열번호 84, 85 또는 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 5의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열; (20) 서열번호 7의 아미노산 서열을 갖는, 바람직하게는, 서열번호 84, 85 또는 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 5의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열; (21) 서열번호 5의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 7의 아미노산 서열을 갖는, 바람직하게는, 서열번호 84, 85 또는 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열; (22) 서열번호 5의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 7의 아미노산 서열을 갖는, 바람직하게는, 서열번호 84, 85 또는 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열; (23) 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 7의 아미노산 서열을 갖는, 바람직하게는, 서열번호 84, 85 또는 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 5의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열; 및 (24) 서열번호 7의 아미노산 서열을 갖는, 바람직하게는, 서열번호 84, 85 또는 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 5의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열. 일부 실시양태에서, HBV 항원 각각은 독립적으로 분비를 위한 신호 펩타이드 서열에 작동적으로 연결되거나 이를 포함한다. 임의의 적합한 신호 펩타이드 서열이 사용될 수 있다. 바람직하게는, HBV PreS1 항원, HBV 코어 항원 및 HBV pol 항원 각각에 대해, 신호 펩타이드는 항원 서열의 N 말단에 작동적으로 연결된다. 일부 실시양태에서, 신호 펩타이드는 서열번호 77의 아미노산 서열을 포함하고, 바람직하게는, 신호 펩타이드는 서열번호 90의 뉴클레오티드 서열에 의해 인코딩된다.
일부 실시양태에서, 핵산 분자 또는 핵산 조합은 서열번호 15 내지 54 중 어느 하나의 비-천연 발생 폴리뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 핵산 분자 또는 핵산 조합은 서열번호 15 내지 54 중 적어도 2개의 비-천연 발생 폴리뉴클레오티드 서열을 포함한다.
본 출원은 또한 HBV 항원을 인코딩하는 비-천연 발생 폴리뉴클레오티드를 포함하는 벡터에 관한 것이다. 본원에 사용된 바와 같이, "벡터"는 유전적 물질을 그것이 복제 및/또는 발현될 수 있는 또 다른 세포로 운반하는 데 사용되는 핵산 분자이다. 본 개시내용의 관점에서 당업자에게 알려진 임의의 벡터가 사용될 수 있다. 벡터의 예는 플라스미드, 바이러스 벡터(박테리오파지, 동물 바이러스 및 식물 바이러스), 코스미드, 및 인공 염색체(예를 들어, YACs)를 포함하지만 이에 제한되지 않는다. 바람직하게는, 벡터는 DNA 플라스미드이다. 벡터는 DNA 벡터 또는 RNA 벡터일 수 있다. 당업자는 본 개시내용의 관점에서 표준 재조합 기술을 통해 본 출원의 벡터를 작제할 수 있다.
본 출원의 벡터는 발현 벡터일 수 있다. 본원에 사용된 바와 같이, 용어 "발현 벡터"는 전사될 수 있는 RNA를 코딩하는 핵산을 포함하는 임의의 유형의 유전자 작제물을 지칭한다. 발현 벡터는 DNA 플라스미드 또는 바이러스 벡터와 같은 재조합 단백질 발현을 위한 벡터, 및 DNA 플라스미드 또는 바이러스 벡터와 같은 대상체의 조직에서 발현하기 위해 대상체에게 핵산을 전달하기 위한 벡터를 포함하지만 이에 제한되지 않는다. 발현 벡터의 설계는 형질전환될 숙주 세포의 선택, 원하는 단백질의 발현 수준 등과 같은 인자에 의존할 수 있다는 것이 당업자에 의해 이해될 것이다.
본 출원의 벡터는 다양한 조절 서열을 포함할 수 있다. 본원에 사용된 바와 같이, 용어 "조절 서열"은 복제(replication), 중복(duplication), 전사, 스플라이싱, 번역, 안정성 및/또는 핵산 또는 이의 유도체 중 하나(즉, mRNA)의 숙주 세포 또는 유기체로의 수송을 포함하는 핵산 분자의 기능적 조절을 허용, 기여 또는 조정하는 임의의 서열을 지칭한다. 본 개시내용의 맥락에서, 이 용어는 프로모터, 인핸서 및 다른 발현 조절 요소(예를 들어, 폴리아데닐화 신호 및 mRNA 안정성에 영향을 미치는 요소)를 포함한다.
본 출원의 일부 실시양태에서, 벡터는 비-바이러스 벡터이다. 비-바이러스 벡터의 예는 DNA 플라스미드, 박테리아 인공 염색체, 효모 인공 염색체, 박테리오파지 등을 포함하지만 이에 제한되지는 않는다. 바람직하게는, 비-바이러스 벡터는 DNA 플라스미드이다. "DNA 플라스미드 벡터", "플라스미드 DNA" 또는 "플라스미드 DNA 벡터"와 상호 교환적으로 사용되는 "DNA 플라스미드"는 적합한 숙주 세포에서 자율 복제가 가능한 이중-가닥 및 일반적으로 환형 DNA 서열을 지칭한다. 인코딩된 폴리뉴클레오티드의 발현에 사용되는 DNA 플라스미드는 전형적으로 복제 기점, 다중 클로닝 부위, 및 예를 들어, 항생제 내성 유전자일 수 있는 선택 가능한 마커를 포함한다. 사용될 수 있는 적합한 DNA 플라스미드의 예는 에스케리키아 콜리(Escherichia coli)에서 단백질의 생성 및/또는 발현에 사용될 수 있는 pSE420(Invitrogen, San Diego, CA); 효모의 사카로마이세스 세레비지애(Saccharomyces cerevisiae) 균주에서 생성 및/또는 발현에 사용될 수 있는 pYES2(Invitrogen, Thermo Fisher Scientific); 곤충 세포에서 생성 및/또는 발현에 사용될 수 있는 MAXBAC® 완전 배큘로바이러스 발현 시스템(Thermo Fisher Scientific); 포유동물 세포에서 고수준 구성 단백질 발현에 사용될 수 있는 pcDNATM 또는 pcDNA3TM(Life Technologies, Thermo Fisher Scientific); 및 대부분의 포유동물 세포에서 관심 있는 단백질의 고수준 일시적 발현에 사용될 수 있는 pVAX 또는 pVAX-1(Life Technologies, Thermo Fisher Scientific)과 같은 잘 알려져 있는 발현 시스템(원핵생물 및 진핵생물 시스템 둘 모두 포함)에 사용하기 위한 상업적으로 입수 가능한 발현 벡터를 포함하지만 이에 제한되지 않는다. 임의의 상업적으로 입수 가능한 DNA 플라스미드의 백본은 숙주 세포에서 단백질 발현을 최적화하도록, 예컨대 특정 요소(예를 들어, 복제 기점 및/또는 항생제 내성 카세트)의 배향 역전, 플라스미드에 내인성인 프로모터(예를 들어, 항생제 내성 카세트에서의 프로모터)의 교체, 및/또는 통상적인 기술 및 용이하게 입수 가능한 출발 물질을 사용하여 전사된 단백질을 인코딩하는 폴리뉴클레오티드 서열(예를 들어, 항생제 내성 유전자의 코딩 서열)의 교체를 위해 변형될 수 있다[예를 들어 문헌(Sambrook et al., Molecular Cloning a Laboratory Manual, Second Ed. Cold Spring Harbor Press (1989)) 참조].
바람직하게는, DNA 플라스미드는 포유동물 숙주 세포에서 단백질 발현에 적합한 발현 벡터이다. 포유동물 숙주 세포에서 단백질 발현에 적합한 발현 벡터는 pcDNATM, pcDNA3TM, pVAX, pVAX-1, ADVAX, NTC8454 등을 포함하지만 이에 제한되지 않는다. 바람직하게는, 발현 벡터는 pVAX-1에 기초하며, 이는 포유동물 세포에서 단백질 발현을 최적화하도록 추가로 변형될 수 있다. pVAX-1은 DNA 백신에서 통상적으로 사용되는 플라스미드이며 강력한 인간 급초기 거대세포바이러스(CMV-IE: human immediate early cytomegalovirus) 프로모터에 이어 소 성장 호르몬(bGH: bovine growth hormone)-유래 폴리아데닐화 서열(pA)을 포함한다. pVAX-1은 pUC 복제 기점 및 박테리아 플라스미드 증식을 가능하게 하는 소형 원핵 프로모터에 의해 구동되는 카나마이신 내성 유전자를 추가로 포함한다.
본 출원의 벡터는 또한 바이러스 벡터일 수 있다. 일반적으로, 바이러스 벡터는 비감염성으로 만들었으나 바이러스 프로모터 및 전이유전자를 여전히 함유하여 바이러스 프로모터를 통한 전이유전자의 번역을 가능하게 한, 변형된 바이러스 DNA 또는 RNA를 보유하는 유전공학적으로 조작된 바이러스이다. 바이러스 벡터는 종종 감염 서열이 결여되기 때문에 헬퍼 바이러스 또는 대규모 형질감염을 위한 패키징 라인을 필요로 한다. 특정 실시양태에서, 본원에 기재된 벡터는, 예를 들어, 재조합 아데노바이러스, 재조합 레트로바이러스, 재조합 폭스바이러스, 예컨대 백시니아 바이러스(예를 들어, 변형된 백시니아 앙카라(MVA: Modified Vaccinia Ankara)), 재조합 알파바이러스, 예컨대 셈리키 포레스트 바이러스, 재조합 파라믹소바이러스(paramyxovirus), 예컨대 재조합 홍역 바이러스, 또는 또 다른 재조합 바이러스이다. 사용될 수 있는 바이러스 벡터의 예는 아데노바이러스 벡터, 아데노-관련 바이러스 벡터, 폭스바이러스 벡터, 장용 바이러스 벡터, 베네수엘라 말 뇌염 바이러스 벡터, 셈리키 포레스트 바이러스 벡터, 담배 모자이크 바이러스 벡터, 렌티바이러스 벡터 등을 포함하지만 이에 제한되지 않는다. 특정 실시양태에서, 본원에 기재된 벡터는 MVA 벡터이다. 벡터는 또한 비-바이러스 벡터일 수 있다.
일부 실시양태에서, 바이러스 벡터는 아데노바이러스 벡터, 예를 들어, 재조합 아데노바이러스 벡터이다. 재조합 아데노바이러스 벡터는, 예를 들어, 인간 아데노바이러스(HAdV, 또는 AdHu), 또는 유인원 아데노바이러스, 예컨대 침팬지 또는 고릴라 아데노바이러스(ChAd, AdCh, 또는 SAdV) 또는 레서스 아데노바이러스(rhAd)로부터 유래될 수 있다. 바람직하게는, 아데노바이러스 벡터는 재조합 인간 아데노바이러스 벡터, 예를 들어, 재조합 인간 아데노바이러스 혈청형 26, 또는 재조합 인간 아데노바이러스 혈청형 5, 4, 35, 7, 48 등 중 어느 하나이다. 다른 실시양태에서, 아데노바이러스 벡터는 rhAd 벡터, 예를 들어, rhAd51, rhAd52 또는 rhAd53이다. 본 출원에 유용한 재조합 바이러스 벡터는 본 개시내용의 관점에서 당업계에 알려진 방법을 사용하여 제조될 수 있다. 예를 들어, 유전자 코드의 축퇴성의 관점에서, 동일한 폴리펩타이드를 인코딩하는 여러 핵산 서열이 설계될 수 있다. 본 출원의 HBV 항원을 인코딩하는 폴리뉴클레오티드는 숙주 세포(예를 들어, 박테리아 또는 포유동물 세포)에서 적절한 발현을 보장하도록 선택적으로 코돈-최적화될 수 있다. 코돈-최적화는 당업계에 널리 적용되는 기술이며, 코돈-최적화된 폴리뉴클레오티드를 얻기 위한 방법은 본 개시내용의 관점에서 당업자에게 잘 알려져 있을 것이다.
본 출원의 벡터, 예를 들어, DNA 플라스미드 또는 바이러스 벡터(특히 아데노바이러스 벡터)는 벡터의 폴리뉴클레오티드 서열에 의해 인코딩되는 HBV 항원(들)의 복제 및 발현을 포함하지만 이에 제한되지 않는 벡터의 기존의 기능(들)을 확립하기 위한 임의의 조절 요소를 포함할 수 있다. 조절 요소는 프로모터, 인핸서, 폴리아데닐화 신호, 번역 정지 코돈, 리보솜 결합 요소, 전사 종결자, 선택 마커, 복제 기점 등을 포함하지만 이에 제한되지 않는다. 벡터는 하나 이상의 발현 카세트를 포함할 수 있다. "발현 카세트"는 세포 기구가 RNA와 단백질을 만들도록 지시하는 벡터의 부분이다. 발현 카세트는 전형적으로 3개의 구성요소를 포함한다: 프로모터 서열, 오픈 리딩 프레임, 및 선택적으로 폴리아데닐화 신호를 포함하는 3'-비번역 영역(UTR). 오픈 리딩 프레임(ORF)은 관심 있는 단백질(예를 들어, HBV 항원)의 개시 코돈에서 정지 코돈까지 코딩 서열을 포함하는 리딩 프레임이다. 발현 카세트의 조절 요소는 관심 있는 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열에 작동적으로 연결될 수 있다. 본원에 사용된 바와 같이, 용어 "작동적으로 연결된"은 이의 가장 넓은 합리적인 맥락에서 해석되어야 하며, 기능적 관계에서 폴리뉴클레오티드 요소들의 연결을 지칭한다. 폴리뉴클레오티드가 다른 폴리뉴클레오티드와 기능적 관계에 놓일 때 "작동적으로 연결"된다. 예를 들어, 프로모터는 이것이 코딩 서열의 전사에 영향을 미치는 경우 코딩 서열에 작동적으로 연결된다. 본원에 기재된 발현 카세트에 사용하기에 적합한 임의의 구성요소는 본 출원의 벡터를 제조하기 위해 임의의 조합 및 임의의 순서로 사용될 수 있다.
벡터는 프로모터 서열을, 바람직하게는 발현 카세트 내에 포함할 수 있어 관심 있는 HBV 항원의 발현을 조절한다, 용어 "프로모터"는 그 기존의 의미로 사용되며, 작동적으로 연결된 뉴클레오티드 서열의 전사를 개시하는 뉴클레오티드 서열을 지칭한다. 프로모터는 이것이 전사하는 뉴클레오티드 서열 근처의 동일한 가닥 상에 위치한다. 프로모터는 구성적, 유도성 또는 억제성일 수 있다. 프로모터는 천연 발생 또는 합성일 수 있다. 프로모터는 바이러스, 박테리아, 진균, 식물, 곤충 및 동물을 포함하는 공급원으로부터 유래될 수 있다. 프로모터는 동종성 프로모터(즉, 벡터와 동일한 유전적 공급원으로부터 유래) 또는 이종 프로모터(즉, 상이한 벡터 또는 유전적 공급원으로부터 유래)일 수 있다. 예를 들어, 사용되는 벡터가 DNA 플라스미드인 경우, 프로모터는 플라스미드에 내인성(동종성)이거나 다른 공급원으로부터 유래(이종)일 수 있다. 바람직하게는, 프로모터는 발현 카세트 내에 HBV 항원을 인코딩하는 폴리뉴클레오티드의 업스트림에 위치한다.
사용될 수 있는 프로모터의 예는 유인원 바이러스 40(SV40) 유래의 프로모터, 마우스 유방 종양 바이러스(MMTV) 프로모터, 인간 면역결핍 바이러스(HIV) 프로모터, 예컨대 소 면역결핍 바이러스(BIV) 긴 말단 반복부(LTR) 프로모터, 몰로니 바이러스 프로모터, 조류 백혈병 바이러스(ALV) 프로모터, 거대세포바이러스(CMV) 프로모터, 예컨대 CMV 급초기 프로모터(CMV-IE), 엡스타인 바르 바이러스(EBV: Epstein Barr virus) 프로모터, 또는 라우스 육종 바이러스(RSV: Rous sarcoma virus) 프로모터를 포함하지만 이에 제한되지 않는다. 본 출원에 사용하기에 적합한 추가의 프로모터는 RSV 프로모터, 레트로바이러스 LTR, 아데노바이러스 주요 후기 프로모터, 및 하기 백시니아 바이러스 또는 MVA-유래 및 FPV-유래 프로모터를 포함하지만 이에 제한되지 않는 다양한 폭스바이러스 프로모터를 포함하지만 이에 제한되지 않는다: 30K 프로모터, I3 프로모터, PrS 프로모터, PrHyb, PrS5E 프로모터, Pr7.5K, Pr13.5 긴 프로모터, 40K 프로모터, MVA-40K 프로모터, FPV 40K 프로모터, 30k 프로모터, PrSynIIm 프로모터, PrLE1 프로모터, 및 PR1238 프로모터. 프로모터는 또한 인간 액틴, 인간 미오신, 인간 헤모글로빈, 인간 근육 크레아틴, 또는 인간 메탈로티오네인과 같은 인간 유전자로부터의 프로모터일 수 있다. 프로모터는 또한 천연 또는 합성의 근육 또는 피부 특이적 프로모터와 같은 조직 특이적 프로모터일 수 있다. 바람직하게는 프로모터는 26S 서브게놈 프로모터 또는 T7 프로모터이다. 예시적인 26S 서브게놈 프로모터의 뉴클레오티드 서열은 서열번호 62에 나타낸다. 예시적인 T7 프로모터의 뉴클레오티드 서열은 서열번호 73에 나타낸다.
벡터는 발현된 전사체를 안정화시키고, RNA 전사체의 핵 방출(nuclear export)을 증진시키고/시키거나 전사-번역 결합을 개선하는 추가의 폴리뉴클레오티드 서열을 포함할 수 있다. 그러한 서열의 예는 폴리아데닐화 신호 및 인핸서 서열을 포함한다. 폴리아데닐화 신호는 전형적으로 벡터의 발현 카세트 내의 관심 있는 단백질(예를 들어, HBV 항원)에 대한 코딩 서열의 다운스트림에 위치한다. 인핸서 서열은 전사 인자에 의해 결합될 때 관련 유전자의 전사를 증진시키는 조절 DNA 서열이다. 인핸서 서열은 바람직하게는 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열의 업스트림에 위치하지만, 벡터의 발현 카세트 내의 프로모터 서열의 다운스트림에 위치한다.
본 개시내용의 관점에서 당업자에게 알려진 임의의 폴리아데닐화 신호가 사용될 수 있다. 예를 들어, 폴리아데닐화 신호는 SV40 폴리아데닐화 신호(예를 들어, 서열번호 64), LTR 폴리아데닐화 신호, 소 성장 호르몬(bGH) 폴리아데닐화 신호, 인간 성장 호르몬(hGH) 폴리아데닐화 신호, 또는 인간 β-글로빈 폴리아데닐화 신호일 수 있다. 바람직하게는, 폴리아데닐화 신호는 SV40 폴리아데닐화 신호이다. 예시적인 SV40 폴리아데닐화 신호의 뉴클레오티드 서열은 서열번호 64에 나타낸다.
본 개시내용의 관점에서 당업자에게 알려진 임의의 인핸서 서열이 사용될 수 있다. 예를 들어, 인핸서 서열은 인간 액틴, 인간 미오신, 인간 헤모글로빈, 인간 근육 크레아틴, 또는 CMV, HA, RSV, 또는 EBV 중 하나와 같은 바이러스 인핸서일 수 있다. 특정 인핸서의 예는 Woodchuck HBV 전사후 조절 요소(WPRE: Woodchuck HBV Post-transcriptional regulatory element), 인간 아포지단백질 A1 전구체(ApoAI: apolipoprotein A1 precursor)로부터 유래된 인트론/엑손 서열, 인간 T-세포 백혈병 바이러스 유형 1(HTLV-1: human T-cell leukemia virus type 1)의 긴 말단 반복부(LTR: long terminal repeat)의 비번역 R-U5 도메인, 스플라이싱 인핸서, 합성 토끼 β-글로빈 인트론, 또는 이들의 임의의 조합을 포함하지만 이에 제한되지 않는다.
벡터는 신호 펩타이드 서열을 인코딩하는 폴리뉴클레오티드 서열을 포함할 수 있다. 바람직하게는, 신호 펩타이드 서열을 인코딩하는 폴리뉴클레오티드 서열은 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열의 업스트림에 위치한다. 신호 펩타이드는 전형적으로 단백질의 국소화를 지시하고, 단백질이 생성되는 세포로부터 단백질의 분비를 촉진하고/하거나 항원 발현 및 항원-제시 세포에 대한 교차-제시를 개선한다. 신호 펩타이드는 벡터로부터 발현될 때 HBV 항원의 N-말단에 존재할 수 있지만, 이는, 예를 들어, 상기 세포로부터 분비 시 신호 펩티다아제에 의해 절단된다. 신호 펩타이드가 절단된 발현된 단백질은 종종 "성숙 단백질"로 지칭된다. 본 개시내용의 관점에서 당업계에 알려진 임의의 신호 펩타이드가 사용될 수 있다. 예를 들어, 신호 펩타이드는 시스타틴 S 신호 펩타이드; 면역글로불린(Ig) 분비 신호, 예컨대 시스타틴 S 신호 펩타이드, Ig 중쇄 감마 신호 펩타이드 SPIgG, 또는 Ig 중쇄 엡실론 신호 펩타이드 SPIgE일 수 있다.
벡터, 예컨대 DNA 플라스미드는 또한 박테리아 복제 기점 및 박테리아 세포, 예를 들어 이. 콜리(E. coli)에서 플라스미드의 선택 및 유지를 위한 항생제 내성 발현 카세트를 포함할 수 있다. 박테리아 복제 기점 및 항생제 내성 카세트는 HBV 항원을 인코딩하는 발현 카세트와 동일한 방향으로, 또는 반대(역) 방향으로 벡터에 위치할 수 있다. 복제 기점(ORI)은 플라스미드가 세포 내에서 번식하고 생존할 수 있도록 하는 복제가 개시되는 서열이다. 본 출원에 사용하기에 적합한 ORI의 예는 ColE1, pMB1, pUC, pSC101, R6K, 및 15A, 바람직하게는 pUC를 포함하지만 이에 제한되지 않는다.
박테리아 세포의 선택 및 유지를 위한 발현 카세트는 전형적으로 항생제 내성 유전자에 작동적으로 연결된 프로모터 서열을 포함한다. 바람직하게는, 항생제 내성 유전자에 작동적으로 연결된 프로모터 서열은 관심 있는 단백질, 예를 들어, HBV 항원을 인코딩하는 폴리뉴클레오티드 서열에 작동적으로 연결된 프로모터 서열과 상이하다. 항생제 내성 유전자는 코돈 최적화될 수 있고, 항생제 내성 유전자의 서열 조성은 일반적으로 박테리아, 예를 들어, 이. 콜리, 코돈 사용에 맞게 조정된다. 본 개시내용의 관점에서 당업자에게 알려진 임의의 항생제 내성 유전자가 사용될 수 있으며, 카나마이신 내성 유전자(Kanr), 암피실린 내성 유전자(Ampr) 및 테트라사이클린 내성 유전자(Tetr)뿐만 아니라 클로람페니콜, 블레오마이신, 스펙티노마이신, 카르베니실린 등에 내성을 부여하는 유전자를 포함하지만 이에 제한되지 않는다.
본 출원의 HBV 항원을 인코딩하는 폴리뉴클레오티드 및 발현 벡터는 본 개시내용의 관점에서 당업계에 알려진 임의의 방법에 의해 제조될 수 있다. 예를 들어, HBV 항원을 인코딩하는 폴리뉴클레오티드는 당업자에게 잘 알려진 표준 분자 생물학 기술, 예를 들어, 폴리머라제 연쇄 반응(PCR) 등을 사용하여 발현 벡터 내로 도입되거나 "클로닝"될 수 있다.
아데노바이러스
일 측면에서, 본 출원은 항원성 HBV 항원을 인코딩하는 뉴클레오티드 서열을 포함하는 재조합 아데노바이러스를 제공한다. 일 측면에서, 본 출원은 항원성 HBV 코어 항원을 인코딩하는 뉴클레오티드 서열을 포함하는 재조합 MVA 벡터를 제공한다. 또 다른 측면에서, 본 출원은 항원성 HBV pol 항원을 인코딩하는 뉴클레오티드 서열을 포함하는 재조합 MVA 벡터를 제공한다. 또 다른 측면에서, 본 출원은 항원성 HBV 표면 항원을 인코딩하는 뉴클레오티드 서열을 포함하는 재조합 MVA 벡터를 제공한다. 일 측면에서, 본 출원은 HBV 코어 항원, HBV 폴리머라제(pol) 항원 및 HBV 표면 항원으로 이루어진 군으로부터 각각 독립적으로 선택된 항원성 HBV 항원을 인코딩하는 1개, 2개, 3개 또는 4개의 뉴클레오티드 서열을 포함하는, 재조합 MVA 벡터를 제공한다.
본 출원에 따른 아데노바이러스는 아데노비리대(Adenoviridae) 과에 속하며 바람직하게는 마스타데노바이러스(Mastadenovirus) 속에 속하는 아데노바이러스이다. 이는 인간 아데노바이러스일 수 있지만, 소 아데노바이러스(예를 들어, 소 아데노바이러스 3, BAdV3), 개 아데노바이러스(예를 들어 CAdV2), 돼지 아데노바이러스(예를 들어 PAdV3 또는 5), 또는 유인원 아데노바이러스(원숭이 아데노바이러스 및 원숭이 아데노바이러스, 예컨대 침팬지 아데노바이러스 또는 고릴라 아데노바이러스를 포함하지만 이에 제한되지 않음)를 포함하지만 이에 제한되지 않는 다른 종을 감염시키는 아데노바이러스일 수도 있다. 바람직하게는, 아데노바이러스는 인간 아데노바이러스(HAdV, 또는 AdHu; 본 출원에서 인간 아데노바이러스는 종의 표시 없이 Ad로 언급되는 경우를 의미하며, 예를 들어, 간략한 표기 "Ad5"는 인간 아데노바이러스 혈청형 5인 HAdV5와 동일함을 의미함), 또는 유인원 아데노바이러스, 예컨대 침팬지 또는 고릴라 아데노바이러스(ChAd, AdCh, 또는 SAdV)이다.
가장 진보된 연구는 인간 아데노바이러스를 사용하여 수행되었으며, 인간 아데노바이러스는 본 출원의 특정 측면에 따라 바람직하다. 특정 바람직한 실시양태에서, 본 출원에 따른 재조합 아데노바이러스는 인간 아데노바이러스에 기초한다. 바람직한 실시양태에서, 재조합 아데노바이러스는 인간 아데노바이러스 혈청형 5, 11, 26, 34, 35, 48, 49 또는 50에 기초한다. 본 출원의 특히 바람직한 실시양태에 따르면, 아데노바이러스는 혈청형 26 또는 35 중 하나의 인간 아데노바이러스이다.
이들 혈청형의 이점은 인간 집단에서 낮은 혈청유병률 및/또는 낮은 기존 중화 항체 역가이다. rAd26 벡터의 제조는, 예를 들어, WO 2007/104792 및 문헌[Abbink et al., (2007) Virol 81(9):4654-63]에 기재되어 있으며, 이들 둘 모두는 그 전체가 본원에 참조로 포함된다. Ad26의 예시적인 게놈 서열은 GenBank Accession EF 153474 및 WO2007/104792(예를 들어, 서열번호 1 참조)에서 발견된다. rAd35 벡터의 제조는, 예를 들어, 미국 특허 번호 7,270,811, WO00/70071, 및 문헌[Vogels et al., (2003) J Virol 77(15):8263-71]에 기재되어 있으며, 이들 모두는 그 전체가 본원에 참조로 포함된다. Ad35의 예시적인 게놈 서열은 GenBank Accession AC_000019 및 WO00/70071(예를 들어, 도 6 참조)에서 발견된다.
유인원 아데노바이러스는 또한 일반적으로 인간 집단에서 낮은 혈청유병률 및/또는 낮은 기존 중화 항체 역가를 가지며 침팬지 아데노바이러스 벡터를 사용하여 상당한 양의 작업이 보고되었다(예를 들어, US6083716; WO2005/071093; WO 2010/086189; WO 2010085984; Farina et al, 2001, J Virol 75: 11603-13; Cohen et al, 2002, J Gen Virol 83: 151-55; Kobinger et al, 2006, Virology 346: 394-401; Tatsis et al., 2007, Molecular Therapy 15: 608-17; 또한 문헌(Bangari and Mittal, 2006, Vaccine 24: 849- 62)에 의한 검토; 및 문헌(Lasaro and Ertl, 2009, Mol Ther 17: 1333-39)에 의한 검토 참조). 따라서, 다른 바람직한 실시양태에서, 본 출원에 따른 재조합 아데노바이러스는 유인원 아데노바이러스, 예를 들어, 침팬지 아데노바이러스에 기초한다. 본 출원의 일 실시양태에서, 재조합 아데노바이러스는 유인원 아데노바이러스 유형 1, 3, 7, 8, 21, 22, 23, 24, 25, 26, 27.1, 28.1, 29, 30, 31.1, 32, 33, 34, 35.1, 36, 37.2, 39, 40.1, 41.1, 42.1, 43, 44, 45, 46, 48, 49, 50 또는 SA7P에 기초한다.
아데노바이러스 벡터 rAd26 및 rAd35
본 출원의 바람직한 실시양태에서, 아데노바이러스 벡터는 2개의 희귀 혈청형으로부터의 캡시드 단백질을 포함한다: Ad26 및 Ad35. 전형적인 실시양태에서, 벡터는 rAd26 또는 rAd35 바이러스이다.
따라서, 본 출원에 사용될 수 있는 벡터는 Ad26 또는 Ad35 캡시드 단백질(예를 들어, 섬유, 펜톤 또는 헥손 단백질)을 포함한다. 당업자는 전체 Ad26 또는 Ad35 캡시드 단백질이 본 출원의 벡터에 사용될 필요는 없다는 것을 인식할 것이다. 따라서, Ad26 또는 Ad35 캡시드 단백질의 적어도 일부를 포함하는 키메라 캡시드 단백질이 본 출원의 벡터에 사용될 수 있다. 본 출원의 벡터는 또한 적어도 하나의 캡시드 단백질이 Ad26 또는 Ad35로부터 유래되는 한, 섬유, 펜톤 및 헥손 단백질이 각각 상이한 혈청형으로부터 유래되는 캡시드 단백질을 포함할 수 있다. 바람직한 실시양태에서, 섬유, 펜톤 및 헥손 단백질은 각각 Ad26으로부터 유래되거나 각각 Ad35로부터 유래된다.
당업자는 다수의 혈청형으로부터 유래된 요소가 단일 재조합 아데노바이러스 벡터에서 조합될 수 있음을 인식할 것이다. 따라서, 상이한 혈청형으로부터 바람직한 특성을 조합하는 키메라 아데노바이러스가 생성될 수 있다. 따라서, 일부 실시양태에서, 본 출원의 키메라 아데노바이러스는 Ad26 및 Ad35 혈청형의 기존하는 면역의 부재를 온도 안정성, 조립, 앵커링, 생산 수율, 방향전환되거나 개선된 감염, 표적 세포에서의 DNA의 안정성 등과 같은 특성과 조합할 수 있다.
본 출원의 실시양태에서, 본 출원에 유용한 재조합 아데노바이러스 벡터는 주로 또는 전적으로 Ad35 또는 Ad26으로부터 유래된다(즉, 벡터는 rAd35 또는 rAd26이다). 일부 실시양태에서, 아데노바이러스는 복제 결핍인데, 예를 들어, 게놈의 E1 영역 내의 결실을 포함하기 때문이다. Ad26 또는 Ad35로부터 유래된 본 출원의 아데노바이러스의 경우, 아데노바이러스의 E4-orf6 코딩 서열을 Ad5와 같은 인간 서브그룹 C의 아데노바이러스의 E4-orf6으로 교환하는 것이 전형적이다. 이는, 예를 들어, 293 세포, PER.C6 세포 등과 같은 Ad5의 E1 유전자를 발현하는 잘 알려진 보완 세포주에서 그러한 아데노바이러스의 증식을 허용한다(예를 들어, 문헌[ Havenga et al., 2006, J Gen Virol 87:2135-43; WO 03/104467] 참조). 본 출원의 실시양태에서, 아데노바이러스는 항원을 인코딩하는 핵산이 클로닝된 E1 영역에 결실된 혈청형 35의 인간 아데노바이러스이고, Ad5의 E4 orf6 영역을 갖는다. 본 출원의 실시양태에서, 아데노바이러스는 혈청형 35의 인간 아데노바이러스로, 항원을 인코딩하는 핵산이 클로닝된 E1 영역에 결실이 있고 Ad5의 E4 orf6 영역이 있다. Ad35 아데노바이러스의 경우, 아데노바이러스에서 E1B 55K 오픈 리딩 프레임의 3' 말단, 예를 들어 pIX 오픈 리딩 프레임의 바로 업스트림에 166 bp 또는 이를 포함하는 단편, 예컨대 Bsu36I 제한 부위에 의해 5' 말단에 표시된 pIX 개시 코돈의 바로 업스트림에 있는 243 bp 단편을 보유하는 것이 전형적인데, 이는 pIX 유전자의 프로모터가 부분적으로 이 영역에 존재하기 때문에 아데노바이러스의 안정성을 증가시키기 때문이다(예를 들어, 문헌[상기 문헌 Havenga et al., 2006; WO 2004/001032] 참조).
재조합 아데노바이러스 벡터의 제조는 당업계에 잘 알려져 있다. rAd26 벡터의 제조는, 예를 들어, WO 2007/104792 및 문헌(Abbink et al., (2007) Virol 81(9):4654-63)에 기재되어 있다. Ad26의 예시적인 게놈 서열은 GenBank Accession EF 153474 및 WO 2007/104792의 서열번호 1에서 발견된다. rAd35 벡터의 제조는, 예를 들어, 미국 특허 번호 7,270,811 및 문헌(Vogels et al., (2003) J Virol 77(15):8263-71)에 기재되어 있다. Ad35의 예시적인 게놈 서열은 GenBank Accession AC_000019에서 발견된다.
본 출원의 실시양태에서, 본 출원에 유용한 벡터는 WO2012/082918에 기재된 것들을 포함하며, 그 개시내용은 그 전체가 본원에 참조로 포함된다.
전형적으로, 본 출원에 유용한 벡터는 전체 재조합 아데노바이러스 게놈(예를 들어, 플라스미드, 코스미드, 또는 바쿨로바이러스 벡터)을 포함하는 핵산을 사용하여 생성된다. 따라서, 본 출원은 또한 본 출원의 아데노바이러스 벡터를 인코딩하는 단리된 핵산 분자를 제공한다. 본 출원의 핵산 분자는 RNA의 형태이거나 클로닝에 의해 수득되거나 합성적으로 생성된 DNA의 형태일 수 있다. DNA는 이중-가닥 또는 단일-가닥일 수 있다.
본 출원에 유용한 아데노바이러스 벡터는 전형적으로 복제 결함이 있다. 이들 실시양태에서, 바이러스는 E1 영역과 같은 바이러스의 복제에 중요한 영역의 결실 또는 불활성화에 의해 복제-결함이 있게 된다. 상기 영역은, 예를 들어, (일반적으로 프로모터에 연결된) 관심 있는 유전자를 삽입함으로써 실질적으로 결실되거나 불활성화될 수 있다. 일부 실시양태에서, 본 출원의 벡터는 다른 구역, 예컨대 E2, E3 또는 E4 구역에서의 결실 또는 프로모터에 연결된 이종 유전자의 삽입을 함유할 수 있다. E2- 및/또는 E4-돌연변이된 아데노바이러스의 경우, 일반적으로 E2- 및/또는 E4-보완 세포주가 재조합 아데노바이러스를 생성하는 데 사용된다. 아데노바이러스의 E3 영역에서의 돌연변이는 E3이 복제에 필요하지 않기 때문에 세포주에 의해 보완될 필요가 없다.
패키징 세포주는 전형적으로 본 출원의 충분한 양의 아데노바이러스 벡터를 생성하는 데 사용된다. 패키징 세포는 복제-결함 벡터에서 결실되거나 불활성화되어 바이러스가 세포에서 복제될 수 있도록 하는 이들 유전자를 포함하는 세포이다. 적합한 세포주는, 예를 들어, PER.C6, 911, 293 및 E1 A549를 포함한다.
상기 언급된 바와 같이, 매우 다양한 B형 간염 바이러스(HBV) 항원(예를 들어, HBV 코어, HBV 폴리머라제, HBV Pre-S1, HBV PreS2.S 항원)이 벡터에서 발현될 수 있다. 필요한 경우, HBV 항원을 인코딩하는 이종 유전자는 처리된 숙주(예를 들어, 인간)에서 적절한 발현을 보장하기 위해 코돈-최적화될 수 있다. 코돈-최적화는 당업계에 널리 적용되는 기술이다. 전형적으로, 이종 유전자는 아데노바이러스 게놈의 E1 및/또는 E3 영역으로 클로닝된다.
이종 B형 간염 바이러스 유전자는 아데노바이러스-유래 프로모터(예를 들어, 주요 후기 프로모터)의 제어 하에 있을 수 있거나(즉, 작동적으로 연결됨) 또는 이종 프로모터의 제어 하에 있을 수 있다. 적합한 이종 프로모터의 예는 CMV 프로모터 및 RSV 프로모터를 포함한다. 바람직하게는, 프로모터는 발현 카세트 내에서 관심 있는 이종 유전자의 상부스트림에 위치한다.
MVA 벡터
본 출원에 유용한 MVA 벡터는 변형된 백시니아 앙카라 바이러스로부터 유래된 약독화 바이러스를 이용한다. MVA 벡터는 매우 다양한 HBV 항원(예를 들어, HBV 코어, HBV 폴리머라제, HBV Pre-S1, HBV PreS2.S 항원)을 발현한다. 일 측면에서, 본 출원은 항원성 HBV 코어 항원을 인코딩하는 뉴클레오티드 서열을 포함하는 재조합 MVA 벡터를 제공한다. 또 다른 측면에서, 본 출원은 HBV pol 항원을 인코딩하는 뉴클레오티드 서열을 포함하는 재조합 MVA 벡터를 제공한다. 또 다른 측면에서, 본 출원은 항원성 HBV 표면 항원을 인코딩하는 뉴클레오티드 서열을 포함하는 재조합 MVA 벡터를 제공한다. 일 측면에서, 본 출원은 HBV 코어 항원, HBV 폴리머라제(pol) 항원 및 HBV 표면 항원으로 이루어진 군으로부터 각각 독립적으로 선택된 항원성 HBV 항원을 인코딩하는 1, 2, 3 또는 4개의 뉴클레오티드 서열을 포함하는 재조합 MVA 벡터를 제공한다.
인간이 만든 약독화 변형된 백시니아 바이러스 앙카라("MVA")는 백시니아 바이러스(CVA)의 앙카라 균주의 닭 배아 섬유아세포에서 516회 연속 계대에 의해 생성되었다(검토를 위해 문헌[Mayr, A., et al. Infection 3, 6-14 (1975)] 참조). 이러한 장기 계대의 결과로서, 생성된 MVA 바이러스의 게놈은 그의 게놈 서열의 약 31 킬로베이스가 결실되었고, 따라서, 조류 세포에 대한 복제가 고도로 제한된 숙주 세포로서 기술되었다(Meyer, H. et al., J. Gen. Virol. 72, 1031-1038 (1991)). 다양한 동물 모델에서 생성된 MVA가 완전히 복제 적격인 시작 물질과 비교하여 상당히 비독성인 것으로 나타났다(Mayr, A. & Danner, K., Dev. Biol. Stand. 41:225-34 (1978)).
본 출원의 실시에 유용한 MVA 바이러스는 MVA-572(1994년 1월 27일에 ECACC V94012707로서 기탁됨); MVA-575(2000년 12월 7일에 ECACC V00120707로서 기탁됨), MVA-I721(문헌[Suter et al., Vaccine 2009] 참조), 및 ACAM3000(2003년 3월 27일에 ATCC® PTA-5095로서 기탁됨)을 포함할 수 있지만 이에 제한되지 않는다.
보다 바람직하게는, 본 출원에 따라 사용된 MVA는 MVA-BN 및 MVA-BN의 유도체를 포함한다. MVA-BN은 국제 PCT 공보 WO 02/42480에 기재되어 있다. MVA-BN의 "유도체"는 본원에 기재된 바와 같이 본질적으로 MVA-BN과 동일한 복제 특성을 나타내지만 이들의 게놈의 하나 이상의 부분에서 차이를 나타내는 바이러스를 지칭한다.
MVA-BN뿐만 아니라 이의 유도체는 복제 불능이며, 이는 생체내 및 시험관내에서 생식적으로 복제하는 데 실패함을 의미한다. 보다 구체적으로 시험관 내에서, MVA-BN 또는 이의 유도체는 닭 배아 섬유아세포(CEF)에서 생식 복제가 가능지만 인간 각질세포 세포주 HaCat(Boukamp et al. (1988), J. Cell Biol. 106:761-771), 인간 골육종 세포주 143B(ECACC 기탁 번호 91112502), 인간 배아 신장 세포주 293(ECACC 기탁 번호 85120602), 및 인간 자궁경부 선암종 세포주 HeLa(ATCC 기탁 번호 CCL-2)에서는 생식 복제가 가능하지 않은 것으로 기재되었다. 추가적으로, MVA-BN 또는 이의 유도체는 Hela 세포 및 HaCaT 세포주에서 MVA-575보다 적어도 2배 적고, 보다 바람직하게는 3배 적은 바이러스 증폭률을 갖는다. MVA-BN 및 이의 유도체의 이러한 특성에 대한 시험 및 검정은 WO 02/42480(미국 특허 출원 번호 2003/0206926) 및 WO 03/048184(미국 특허 출원 번호 2006/0159699)에 기재되어 있다.
이전 단락에 기재된 바와 같은 시험관내 인간 세포주에서 "생식 복제 불가능한" 또는 "생식 복제 능력이 없는"이라는 용어는, 예를 들어, WO 02/42480에 기재되어 있으며, 이는 또한 상기 언급된 바와 같은 원하는 특성을 갖는 MVA를 수득하는 방법을 교시한다. 상기 용어는 WO 02/42480 또는 미국 특허 번호 6,761,893에 기재된 검정을 사용하여 감염 후 4일째에 시험관내 바이러스 증폭률이 1 미만인 바이러스에 적용된다.
용어 "생식적으로 복제하는 데 실패한"은 이전 단락에서 기재된 바와 같이 감염 후 4일째에 시험관내 인간 세포주에서 바이러스 증폭률이 1 미만인 바이러스를 지칭한다. WO 02/42480 또는 미국 특허 번호 6,761,893에 기재된 검정은 바이러스 증폭률의 결정에 적용 가능하다.
이전 단락에서 기재된 바와 같이 시험관내 인간 세포주에서 바이러스의 증폭 또는 복제는 일반적으로 "증폭률"로 지칭되는, 처음에 세포를 감염시키기 위해 원래 사용된 양(입력)에 대한 감염된 세포로부터 생성된 바이러스의 비율(출력)로 표현된다. 증폭률 "1"은 감염된 세포로부터 생성된 바이러스의 양이 초기에 세포를 감염시키는 데 사용된 양과 동일한 증폭 상태를 정의하며, 이는 감염된 세포가 바이러스 감염 및 번식을 허용한다는 것을 의미한다. 대조적으로, 1 미만의 증폭률, 즉 입력 수준에 비해 출력이 감소하면 생식 복제가 결여되어 바이러스가 약독화됨을 나타낸다.
MVA-기반 백신의 이점은 대규모 백신 생산에 대한 가용성뿐만 아니라 안전성 프로파일을 포함한다. 전임상 시험은 MVA-BN이 다른 MVA 균주에 비해 우수한 약독화 및 효능을 입증한다는 것을 밝혀냈다(WO 02/42480). MVA-BN 균주의 추가의 특성은 DNA-프라임/백시니아 바이러스 부스트 용법과 비교할 때 백시니아 바이러스 프라임/백시니아 바이러스 부스트 용법에서 실질적으로 동일한 수준의 면역을 유도하는 능력이다.
본원에서 가장 바람직한 실시양태인 재조합 MVA-BN 바이러스는 포유동물 세포에서의 이들의 뚜렷한 복제 결핍 및 이들의 잘 확립된 비독성 때문에 안전한 것으로 간주된다. 또한, 이의 효능 외에도, 산업 규모의 제조의 타당성이 유리할 수 있다. 또한, MVA-기반 백신은 여러 이종 항원을 전달할 수 있으며 체액성 및 세포성 면역을 동시에 유도할 수 있다.
본 출원에 유용한 MVA 벡터는 WO/2002/042480 및 WO/2002/24224에 기재된 것과 같은 당업계에 알려진 방법을 사용하여 제조될 수 있으며, 이들의 관련 개시내용은 본원에 참조로 포함된다.
본 출원의 바람직한 실시양태에서, MVA 벡터(들)는 HBV 코어 항원, HBV pol 항원, 및 HBV 표면 항원으로 이루어진 군으로부터 선택된 하나 이상의 항원성 단백질을 인코딩하는 핵산을 포함한다.
HBV 항원 단백질은 MVA의 하나 이상의 유전자간 영역(IGR)에 삽입될 수 있다. 본 출원의 실시양태에서, IGR은 IGR07/08, IGR 44/45, IGR 64/65, IGR 88/89, IGR 136/137, 및 IGR 148/149로부터 선택된다. 본 출원의 실시양태에서, 재조합 MVA의 5, 4, 3 또는 2개 미만의 IGR은 HBV 코어 항원 및/또는 HBV pol 항원의 항원 결정자를 인코딩하는 이종 뉴클레오티드 서열을 포함한다. 이종 뉴클레오티드 서열은, 추가적으로 또는 대안적으로, 하나 이상의 천연 발생 결실 부위, 특히 MVA 게놈의 주요 결실 부위 I, II, III, IV, V, 또는 VI 내로 삽입될 수 있다. 본 출원의 실시양태에서, 재조합 MVA의 천연 발생 결실 부위의 5, 4, 3, 또는 2개 미만은 HBV 코어 항원 및/또는 HBV pol 항원의 항원 결정자를 인코딩하는 이종 뉴클레오티드 서열을 포함한다.
HBV 단백질의 항원 결정자를 인코딩하는 이종 뉴클레오티드 서열을 포함하는 MVA의 삽입 부위의 수는 1, 2, 3, 4, 5, 6, 7개 또는 그 이상일 수 있다. 본 출원의 실시양태에서, 이종 뉴클레오티드 서열은 4, 3, 2개, 또는 그 이하의 삽입 부위에 삽입된다. 바람직하게는, 2개의 삽입 부위가 사용된다. 본 출원의 실시양태에서, 3개의 삽입 부위가 사용된다. 바람직하게는, 재조합 MVA는 2 또는 3개의 삽입 부위에 삽입된 적어도 2, 3, 4, 5, 6, 또는 7개의 유전자를 포함한다.
본원에 제공된 재조합 MVA 바이러스는 당업계에 알려진 통상적인 방법에 의해 생성될 수 있다. 재조합 폭스바이러스를 수득하거나 외인성 코딩 서열을 폭스바이러스 게놈에 삽입하는 방법은 당업자에게 잘 알려져 있다. 예를 들어, DNA 클로닝, DNA 및 RNA 단리, 웨스턴 블롯 분석, RT-PCR 및 PCR 증폭 기술과 같은 표준 분자 생물학 기술에 대한 방법은 문헌[Molecular Cloning, A laboratory Manual (2nd Ed.) (J. Sambrook et al., Cold Spring Harbor Laboratory Press (1989))]에 기재되어 있으며, 바이러스의 취급 및 조작을 위한 기술은 문헌[Virology Methods Manual (B.W.J. Mahy et al. (eds.), Academic Press (1996))]에 기재되어 있다. 유사하게, MVA의 취급, 조작 및 유전자 조작에 대한 기술 및 노하우는 문헌[Molecular Virology: A Practical Approach (A.J. Davison & R.M. Elliott (Eds.), The Practical Approach Series, IRL Press at Oxford University Press, Oxford, UK (1993) (예를 들어, 문헌[Chapter 9: Expression of genes by Vaccinia virus vectors]참조)) 및 Current Protocols in Molecular Biology (John Wiley & Son, Inc. (1998) (예를 들어, 문헌[Chapter 16, Section IV: Expression of proteins in mammalian cells using vaccinia viral vector] 참조))에 기재되어 있다.
본원에 개시된 다양한 재조합 MVA의 생성을 위해, 상이한 방법이 적용될 수 있다. 바이러스에 삽입될 DNA 서열은 MVA의 DNA 절편과 상동성인 DNA가 삽입된 이. 콜리 플라스미드 작제물에 배치될 수 있다. 별도로, 삽입될 DNA 서열은 프로모터에 결찰될 수 있다. 프로모터-유전자 연결은 프로모터-유전자 결합이 비필수 유전자좌를 포함하는 MVA DNA의 영역 측면에 있는 DNA 서열에 상동성인 DNA에 의해 양쪽 말단 측면에 위치하도록 플라스미드 작제물에 위치할 수 있다. 생성된 플라스미드 작제물은 이. 콜리 박테리아 내에서 번식하여 증폭되고 단리될 수 있다. 삽입될 DNA 유전자 서열을 포함하는 단리된 플라스미드는, 예를 들어, 닭 배아 섬유아세포(CEF)의 세포 배양물에 형질감염될 수 있으며, 동시에 배양물은 MVA로 감염된다. 플라스미드의 상동 MVA DNA와 바이러스 게놈 사이의 재조합은 각각 외래 DNA 서열의 존재에 의해 변형된 MVA를 생성할 수 있다.
바람직한 실시양태에 따르면, 예를 들어 CEF 세포와 같은 적합한 세포 배양물의 세포는 폭스바이러스로 감염될 수 있다. 이어서, 감염된 세포는 외래 또는 이종 유전자 또는 유전자들을 포함하는 제1 플라스미드 벡터로, 바람직하게는 폭스바이러스 발현 조절 요소의 전사 조절 하에 형질감염될 수 있다. 상기 설명된 바와 같이, 플라스미드 벡터는 또한 폭스바이러스 게놈의 선택된 부분으로 외인성 서열의 삽입을 지시할 수 있는 서열을 포함한다. 선택적으로, 플라스미드 벡터는 또한 폭스바이러스 프로모터에 작동적으로 연결된 마커 및/또는 선택 유전자를 포함하는 카세트를 포함한다.
적합한 마커 또는 선택 유전자는, 예를 들어, 녹색 형광 단백질, β-갈락토시다제, 네오마이신-포스포리보실트랜스퍼라제 또는 기타 마커를 인코딩하는 유전자이다. 선택 또는 마커 카세트의 사용은 생성된 재조합 폭스바이러스의 식별 및 단리를 단순화한다. 그러나, 재조합 폭스바이러스는 또한 PCR 기술에 의해 식별될 수 있다. 이어서, 추가의 세포를 상기 기재된 같이 수득된 재조합 폭스바이러스로 감염시키고, 제2 외래 또는 이종 유전자 또는 유전자들을 포함하는 제2 벡터로 형질감염시킬 수 있다. 이 유전자가 폭스바이러스 게놈의 상이한 삽입 부위에 도입되어야 하는 경우, 제2 벡터는 또한 폭스바이러스의 게놈으로 제2 외래 유전자 또는 유전자들의 통합을 지시하는 폭스바이러스-상동 서열도 상이하다. 상동 재조합이 발생한 후, 2개 이상의 외래 또는 이종 유전자를 포함하는 재조합 바이러스를 단리할 수 있다. 추가의 외래 유전자를 재조합 바이러스에 도입하기 위해, 감염 및 형질감염 단계는 감염을 위해 이전 단계에서 단리된 재조합 바이러스를 사용하고 형질감염을 위해 추가 외래 유전자 또는 유전자들을 포함하는 추가 벡터를 사용함으로써 반복될 수 있다.
대안적으로, 상기 기재된 바와 같은 감염 및 형질감염 단계는 상호교환 가능한, 즉 적합한 세포를 먼저 외래 유전자를 포함하는 플라스미드 벡터에 의해 형질감염시킨 다음, 폭스바이러스로 감염시킬 수 있다. 추가의 대안으로서, 각각의 외래 유전자를 상이한 바이러스에 도입하고, 수득된 모든 재조합 바이러스로 세포를 동시 감염시키고, 모든 외래 유전자를 포함하는 재조합을 스크리닝하는 것도 가능하다. 세 번째 대안은 시험관내에서 DNA 게놈 및 외래 서열의 결찰 및 헬퍼 바이러스를 사용한 재조합 백시니아 바이러스 DNA 게놈의 재구성이다. 네 번째 대안은 박테리아 인공 염색체(BAC)로 클로닝된 MVA와 같은 백시니아 바이러스 게놈과 백시니아 바이러스 게놈에서 원하는 통합 부위 측면에 있는 서열과 상동성인 DNA 서열 측면에 있는 선형 외래 서열 사이의 이. 콜리 또는 다른 박테리아 종에서의 상동 재조합이다.
이종 HBV 유전자(예를 들어, HBV 코어 항원, HBV pol 항원, 및/또는 HBV 표면 항원)는 하나 이상의 폭스바이러스 프로모터의 제어 하에 있을 수 있다(즉, 작동적으로 연결됨). 본 출원의 일 실시양태에서, 폭스바이러스 프로모터는 Pr7.5 프로모터, 하이브리드 초기/후기 프로모터, 또는 PrS 프로모터, PrS5E 프로모터, 합성 또는 천연 초기 또는 후기 프로모터, 또는 우두 바이러스 ATI 프로모터이다.
RNA 레플리콘
바람직하게는, 벡터는 자가-복제 RNA 레플리콘이다. 본원에 사용된 바와 같이, "자가-증폭 RNA 분자" 또는 "RNA 레플리콘" 또는 "레플리콘 RNA" 또는 "saRNA"와 상호교환적으로 사용되는 "자가-복제 RNA 분자"는 인간, 포유동물, 또는 동물 세포일 수 있는, 허용 세포 내에서 그 자신의 증폭 또는 자가-복제를 지시하는데 필요한 모든 유전 정보를 포함하는 RNA를 지칭한다. 자가-복제 RNA 분자는 mRNA와 유사하다. 단일-가닥, 5'-캡핑 및 3'-폴리-아데닐화이며 양성 방향이다. 자체 복제를 지시하기 위해, RNA 분자는 1) RNA 증폭 과정을 촉매하기 위해 바이러스 또는 숙주 세포 유래 단백질, 핵산 또는 리보핵단백질과 상호작용할 수 있는 폴리머라제, 레플리카제 또는 기타 단백질을 인코딩하고; 2) 서브게놈 레플리콘-인코딩된 RNA의 복제 및 전사에 필요한 시스-작용 RNA 서열을 포함한다. 따라서, 전달된 RNA는 여러 딸 RNA의 생성을 유발한다. 이러한 딸 RNA뿐만 아니라 동일선상의 서브게놈 전사체는 관심 있는 유전자의 동일 반응계내 발현을 제공하기 위해 스스로 번역될 수 있거나, 관심 있는 유전자의 동일 반응계내 발현을 제공하도록 번역되는 전달된 RNA와 동일한 의미로 추가 전사체를 제공하도록 전사될 수 있다. 이 전사 서열의 전반적인 결과는 도입된 레플리콘 RNA의 수가 크게 증폭되므로 관심 있는 인코딩된 유전자가 세포의 주요 폴리펩타이드 산물이 된다.
RNA 레플리콘은 1) RNA 증폭 과정을 촉매하기 위해 바이러스 또는 숙주 세포-유래 단백질, 핵산 또는 리보핵단백질과 상호작용할 수 있는 RNA-의존성 RNA 폴리머라제, 및 비구조 단백질 nsP1, nsP2, nsP3, nsP4를 인코딩하고; 2) 게놈 및 서브게놈 RNA의 복제 및 전사에 필요한 시스-작용 RNA 서열, 예컨대 3' 및 5' 비번역 영역(UTR; 비구조 단백질-매개 증폭을 위한 알파바이러스 뉴클레오티드 서열) 및/또는 서브게놈 프로모터를 포함한다. 이들 서열은 자기-인코딩된 단백질 또는 자가-인코딩되지 않은 세포-유래 단백질, 핵산 또는 리보핵단백질, 또는 임의의 이들 구성요소 간의 복합체에 복제 과정 동안 결합될 수 있다. 일부 실시양태에서, 변형된 RNA 레플리콘 분자는 전형적으로 하기 순서로 요소를 함유한다: 복제를 위해 시스에 필요한 5' 바이러스 RNA 서열(들) (예를 들어 5' UTR 및 5' CSE), 생물학적 활성 비구조 단백질을 코딩하는 서열(예를 들어, nsP1234), 서브게놈 RNA를 전사하기 위한 프로모터, 복제를 위해 시스에 필요한 3' 바이러스 서열(예를 들어 3' UTR), 및 폴리아데닐레이트 구역(tract), 및 선택적으로, 서브게놈 프로모터의 제어 후 또는 제어 하에 이종 단백질 또는 펩타이드를 인코딩하는 서열 (또는 2개 이상의 서열). 또한, 용어 RNA 레플리콘은 양성 센스 (또는 메시지 센스) 분자를 지칭할 수 있고, RNA 레플리콘은 임의의 공지된, 천연-발생 RNA 바이러스의 길이와 상이한 길이일 수 있다. 본 개시내용의 임의의 실시양태에서, RNA 레플리콘은 적어도 하나 (또는 모두)의 구조적 바이러스 단백질(예를 들어, 뉴클레오캡시드 단백질 C, 및 외피 단백질 P62, 6K, 및 E1)의 서열(들)이 결여될 수 있다(또는 포함하지 않을 수 있다). 이들 실시양태에서, 하나 이상의 구조 유전자를 인코딩하는 서열은, 예를 들어, 적어도 하나의 이종 단백질 또는 펩타이드 (또는 다른 관심 있는 유전자(GOI))에 대한 코딩 서열과 같은 하나 이상의 이종 서열로 치환될 수 있다.
특정 실시양태에서, 본 출원의 RNA 레플리콘은 5'-말단에서 3'-말단의 순서로 하기를 포함한다: (1) RNA 바이러스의 비구조 단백질-매개 증폭에 필요한 5' 비번역 영역(5'-UTR); (2) RNA 바이러스의 비구조 단백질 중 적어도 하나, 바람직하게는 모두를 인코딩하는 폴리뉴클레오티드 서열; (3) RNA 바이러스의 서브게놈 프로모터; (4) HBV 항원을 인코딩하는 폴리뉴클레오티드 서열; 및 (5) RNA 바이러스의 비구조 단백질-매개 증폭에 필요한 3' 비번역 영역(3'-UTR).
특정 실시양태에서, 자가-복제 RNA 분자는 RNA-의존성 RNA-폴리머라제 기능, 헬리카제, 캡핑, 및 폴리아데닐화 활성을 포함하는 자가-증폭을 위한 효소 복합체(레플리카제 다단백질)를 인코딩한다. 서브게놈 프로모터의 제어 하에 있는 레플리카제의 다운스트림에 있는 바이러스 구조 유전자는 HBV 항원으로 대체될 수 있다. 형질감염 시, 레플리카제는 즉시 번역되고, 게놈 RNA의 5' 및 3' 말단과 상호작용하고, 상보적인 게놈 RNA 카피를 합성한다. 이들은 새로운 양성 가닥, 캡핑 및 폴리-아데닐화 게놈 카피 및 하위게놈 전사체의 합성을 위한 주형 역할을 한다. 증폭은 결국 세포당 2 × 105개 이하의 카피의 매우 높은 RNA 카피 수를 유발한다. 따라서, 기존의 mRNA에 비해 훨씬 더 적은 양의 saRNA만으로도 효과적인 유전자 전달 및 보호 백신접종을 달성하기에 충분하다(Beissert et al., Hum Gene Ther. 2017, 28 (12): 1138-1146).
서브게놈 RNA는 이것이 유래된 게놈 RNA보다 작은 길이 또는 크기의 RNA 분자이다. 바이러스 서브게놈 RNA는 내부 프로모터로부터 전사될 수 있으며, 그의 서열은 게놈 RNA 또는 이의 보체 내에 존재한다. 서브게놈 RNA의 전사는 숙주 세포-인코딩된 단백질, 리보핵단백질(들) 또는 이들의 조합과 관련된 바이러스-인코딩된 폴리머라제(들)에 의해 매개될 수 있다. 수많은 RNA 바이러스는 이들의 3'-근위 유전자의 발현을 위해 서브게놈 mRNA(sgRNA)를 생성한다.
본 개시내용의 일부 실시양태에서, HBV 항원은 서브게놈 프로모터의 제어 하에 발현된다. 특정 실시양태에서, 천연 서브게놈 프로모터 대신에, 서브게놈 RNA는 뇌심근염 바이러스(EMCV), 소 바이러스성 설사 바이러스(BVDV), 폴리오바이러스, 구제역 바이러스(FMD), 엔테로바이러스 71(EV71), 또는 C형 간염 바이러스로부터 유래된 내부 리보솜 진입 부위(IRES)의 제어 하에 놓일 수 있다. 서브게놈 프로모터는 24개의 뉴클레오티드(신드비스 바이러스)에서 100개 초과의 뉴클레오티드(비트 괴사성 황정맥 바이러스) 범위이며 일반적으로 전사 개시의 상부스트림에서 발견된다.
일부 실시양태에서, RNA 레플리콘은 적어도 1개, 적어도 2개, 적어도 3개, 또는 적어도 4개의 비구조적 바이러스 단백질(예를 들어 nsP1, nsP2, nsP3, nsP4)에 대한 코딩 서열을 포함한다. 알파바이러스 게놈은 비구조 단백질 nsP1, nsP2, nsP3 및 nsP4를 인코딩하며, 이는 단일 다단백질 전구체로 생성되며 때때로 P1234 (또는 nsP1-4 또는 nsP1234)로 지정되며 단백질 분해 처리를 통해 성숙한 단백질로 절단된다. nsP1은 크기가 약 60 kDa일 수 있으며 메틸트랜스퍼라제 활성을 가질 수 있으며 바이러스 캡핑 반응에 관여할 수 있다. nsP2는 약 90 kDa의 크기를 가지며 헬리카제 및 프로테아제 활성을 가질 수 있는 반면, nsP3은 약 60 kDa이며 매크로도메인, 중심 (또는 알파바이러스 고유) 도메인 및 초가변 도메인(HVD)의 세 가지 도메인을 포함한다. nsP4는 크기가 약 70 kDa이고 코어 RNA-의존성 RNA 폴리머라제(RdRp) 촉매 도메인을 포함한다. 감염 후, 알파바이러스 게놈 RNA는 개별 단백질로 절단된 P1234 다단백질을 생성하도록 번역된다. 본원의 핵산 또는 폴리펩타이드 서열, 예를 들어 nsP1, nsP2, nsP3, nsP4의 서열을 개시함에 있어서, 본래의 서열에 기초하거나 이로부터 유래된 것으로 간주되는 서열 또한 개시된다.
일부 실시양태에서, RNA 레플리콘은 적어도 하나의 비구조적 바이러스 단백질의 일부에 대한 코딩 서열을 포함한다. 예를 들어, RNA 레플리콘은 적어도 하나의 비구조적 바이러스 단백질에 대한 인코딩 서열의 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 100%, 또는 이들 값 중 임의의 둘 사이의 범위를 포함할 수 있다. 일부 실시양태에서, RNA 레플리콘은 적어도 하나의 비구조적 바이러스 단백질의 실질적인 부분에 대한 코딩 서열을 포함할 수 있다. 본원에 사용된 바와 같이, 비구조적 바이러스 단백질을 인코딩하는 핵산 서열의 "실질적인 부분"은 당업자에 의한 서열의 수동 평가에 의해, 또는 BLAST와 같은 알고리즘을 사용한 컴퓨터 자동 서열 비교 및 식별에 의해, 해당 단백질의 추정적 식별을 제공하기에 충분한 비구조적 바이러스 단백질을 인코딩하는 핵산 서열을 포함한다(예를 들어, 문헌["Basic Local Alignment Search Tool"; Altschul S F et al., J. Mol. Biol. 215:403-410, 1993] 참조). 일부 실시양태에서, RNA 레플리콘은 적어도 하나의 비구조 단백질에 대한 전체 코딩 서열을 포함할 수 있다. 일부 실시양태에서, RNA 레플리콘은 천연 바이러스 비구조 단백질에 대한 실질적으로 모든 코딩 서열을 포함한다. 특정 실시양태에서, 하나 이상의 비구조적 바이러스 단백질은 동일한 바이러스로부터 유래된다. 다른 실시양태에서, 하나 이상의 비구조 단백질은 상이한 바이러스로부터 유래된다.
RNA 레플리콘은 알파바이러스 또는 플라비바이러스와 같은 임의의 적합한 플러스-가닥 RNA 바이러스로부터 유래될 수 있다. 바람직하게는, RNA 레플리콘은 알파바이러스로부터 유래된다. 용어 "알파바이러스"는 토가비리대(Togaviridae) 과의 외피가 있는 단일-가닥 양성 센스 RNA 바이러스를 기술한다. 알파 바이러스 속에는 대략 30종의 구성원이 포함되어 있어 인간과 다른 동물을 감염시킬 수 있다. 알파바이러스 입자는 전형적으로 직경이 70 nm이고, 구형 또는 약간 다형성인 경향이 있고, 40 nm 아이소메트릭 뉴클레오캡시드를 갖는다. 알파바이러스의 총 게놈 길이는 11,000개와 12,000개 뉴클레오티드 사이의 범위이며 5' 캡 및 3' 폴리-A 테일을 가지고 있다. 게놈에는 비구조적(ns)과 구조적인 2개의 오픈 리딩 프레임(ORF)이 있다. ns ORF는 바이러스 RNA의 전사 및 복제에 필요한 단백질(nsP1-nsP4)을 인코딩한다. 구조적 ORF는 3개의 구조 단백질을 인코딩한다: 코어 뉴클레오캡시드 단백질 C, 및 이종 이량체로서 회합하는 외피 단백질 P62 및 E1. 바이러스 막-고정 표면 당단백질은 수용체 인식 및 막 융합을 통한 표적 세포로의 진입을 담당한다. 4개의 ns 단백질 유전자는 게놈의 5' 2/3에 있는 유전자에 의해 인코딩되는 반면, 3개의 구조 단백질은 게놈의 3' 1/3과 동일 선상에 있는 서브게놈 mRNA에서 번역된다.
일부 실시양태에서, 본 발명에 유용한 자가-복제 RNA는 알파바이러스 종으로부터 유래된 RNA 레플리콘이다. 일부 실시양태에서, 알파바이러스 RNA 레플리콘은 VEEV/EEEV 그룹, 또는 SF 그룹, 또는 SIN 그룹에 속하는 알파바이러스이다. SF 그룹 알파바이러스의 비제한적인 예는 셈리키 포레스트 바이러스, 오니옹-니옹 바이러스, 로스 리버 바이러스, 미들버그 바이러스, 치쿤구니야 바이러스, 바마 포레스트 바이러스, 게타 바이러스, 마야로 바이러스, 사기야마 바이러스, 베바루 바이러스, 및 Una 바이러스를 포함한다. SIN 그룹 알파바이러스의 비제한적인 예는 신드비스 바이러스, 거드우드 S.A. 바이러스, 남아프리카 아르보바이러스 번호 86, 오켈보 바이러스, 아우라 바이러스, 바반키 바이러스, 와타로아 바이러스, 및 키질라가크 바이러스를 포함한다. VEEV/EEEV 그룹 알파바이러스의 비제한적인 예는 동부 말 뇌염 바이러스(EEEV), 베네수엘라 말 뇌염 바이러스(VEEV), 에버글레이즈 바이러스(EVEV), 무캄보 바이러스(MUCV), 픽수나 바이러스(PIXV), 미들버그 바이러스(MIDV), 치쿤구니야 바이러스(CHIKV), 오니옹-니옹 바이러스(ONNV), 로스 리버 바이러스(RRV), 바마 포레스트 바이러스(BF), 게타 바이러스(GET), 사기야마 바이러스(SAGV), 베바루 바이러스(BEBV), 마야로 바이러스(MAYV), 및 Una 바이러스(UNAV)를 포함한다.
알파바이러스 종의 비제한적인 예는 동부 말 뇌염 바이러스(EEEV), 베네수엘라 말 뇌염 바이러스(VEEV), 에버글레이즈 바이러스(EVEV), 무캄보 바이러스(MUCV), 셈리키 포레스트 바이러스(SFV), 픽수나 바이러스(PIXV), 미들버그 바이러스(MIDV), 치쿤구니야 바이러스(CHIKV), 오니옹-니옹 바이러스(ONNV), 로스 리버 바이러스(RRV), 바마 포레스트 바이러스(BF), 게타 바이러스(GET), 사기야마 바이러스(SAGV), 베바루 바이러스(BEBV), 마야로 바이러스(MAYV), Una 바이러스(UNAV), 신드비스 바이러스(SINV), 아우라 바이러스(AURAV), 와타로아 바이러스(WHAV), 바반키 바이러스(BABV), 키질라가크 바이러스(KYZV), 서부 말 뇌염 바이러스(WEEV), 하이랜드 J 바이러스(HJV), 포트 모건 바이러스(FMV), Ndumu(NDUV), 및 버기 크릭 바이러스를 포함한다. 독성 및 비독성 알파바이러스 균주가 둘 모두 적합하다. 일부 실시양태에서, 알파바이러스 RNA 레플리콘은 신드비스 바이러스(SIN), 셈리키 포레스트 바이러스(SFV), 로스 리버 바이러스(RRV), 베네수엘라 말 뇌염 바이러스(VEEV), 또는 동부 말 뇌염 바이러스(EEEV)이다. 일부 실시양태에서, 알파바이러스 RNA 레플리콘은 베네수엘라 말 뇌염 바이러스(VEEV)이다.
특정 실시양태에서, 자가-복제 RNA 분자는 하나 이상의 비구조 단백질 nsP1-4를 인코딩하는 폴리뉴클레오티드, 서브게놈 프로모터, 예컨대 26S 서브게놈 프로모터, 및 본원에 기재된 HBV 항원을 인코딩하는 관심 있는 유전자 또는 이의 단편을 포함한다.
자가-복제 RNA 분자는 5' 캡(예를 들어, 7-메틸구아노신)을 가질 수 있다. 이 캡은 RNA의 생체내 번역을 향상시킬 수 있다.
본 발명에 유용한 자가-복제 RNA 분자의 5' 뉴클레오티드는 5' 트리포스페이트 기를 가질 수 있다. 캡핑된 RNA에서 이것은 5'-대-5' 브릿지를 통해 7-메틸구아노신에 연결될 수 있다. 5' 트리포스페이트는 RIG-I 브릿징을 향상시킬 수 있다.
자가-복제 RNA 분자는 3' 폴리-A 테일을 가질 수 있다. 또한 이의 3' 말단 근처에 폴리-A 폴리머라제 인식 서열(예를 들어, AAUAAA)을 포함할 수 있다.
본 개시내용의 임의의 실시양태에서, RNA 레플리콘은 적어도 하나 (또는 모두)의 구조적 바이러스 단백질(예를 들어, 뉴클레오캡시드 단백질 C, 및 외피 단백질 P62, 6K, 및 E1)의 코딩 서열(들)이 결여될 수 있다 (또는 포함하지 않을 수 있다). 이들 실시양태에서, 하나 이상의 구조적 유전자를 인코딩하는 서열은, 예를 들어, 본원에 기재된 HBV 항원 또는 이의 단편에 대한 코딩 서열과 같은 하나 이상의 이종 서열로 치환될 수 있다.
특정 실시양태에서, 본 출원의 자가-복제 RNA 벡터는 선천적 면역계에 의한 번역 억제에 대한 내성을 부여하거나 그렇지 않으면 GOI(예를 들어, HBV 항원)의 발현을 증가시키는 하나 이상의 특징을 포함한다.
특정 실시양태에서, RNA 서열은 번역 효율을 개선하기 위해 코돈 최적화될 수 있다. RNA 분자는, 예를 들어, 적어도 30개의 아데노신 잔기의 폴리A 테일을 추가하고/하거나; 변형된 리보뉴클레오티드로 5-말단을 캡핑하는 것과 같이 안정성 및/또는 번역을 향상시키기 위해 본 개시내용의 관점에서 당업계에 알려진 임의의 방법에 의해 변형될 수 있으며, 이는 RNA 합성 동안 혼입되거나 RNA 전사 후에 효소적으로 조작될 수 있다.
특정 실시양태에서, 본 출원의 RNA 레플리콘은 5'-말단에서 3'-말단의 순서로 하기를 포함한다: (1) 알파바이러스 5' 비번역 영역(5'-UTR), (2) 알파바이러스 비구조적 유전자 nsp1의 5' 복제 서열, (3) 바이러스 종의 다운스트림 루프(DLP) 모티프, (4) 제4 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열, (5) 알파바이러스 비구조 단백질 nsp1, nsp2, nsp3 및 nsp4를 인코딩하는 폴리뉴클레오티드 서열, (6) 알파바이러스 서브게놈 프로모터, (7) 본 출원의 하나 이상의 HBV 항원을 인코딩하는 비-천연 발생 폴리뉴클레오티드 서열, (8) 알파바이러스 3' 비번역 영역(3' UTR), 및 (9) 선택적으로, 폴리아데노신 서열.
특정 실시양태에서, 본 출원의 자가-복제 RNA 벡터는 바이러스 종의 다운스트림 루프(DLP) 모티프를 포함한다. 본원에 사용된 바와 같이, "다운스트림 루프" 또는 "DLP 모티프"는 적어도 하나의 RNA 스템-루프를 포함하는 폴리뉴클레오티드 서열을 지칭하며, 이는 오픈 리딩 프레임(ORF)의 개시 코돈의 다운스트림에 배치될 때 DLP 모티프가 없는 달리 동일한 작제물에 비해 ORF의 증가된 번역을 제공한다. 예를 들어, 알파바이러스 속의 구성원은 바이러스 26S 전사체 내에 존재하는 탁월한 RNA 구조를 통해 항바이러스 RNA-활성화 단백질 키나아제(PKR)의 활성화에 저항할 수 있으며, 이는 이러한 mRNA의 eIF2-독립적인 번역 개시를 허용한다. 다운스트림 루프(DLP)로 불리는 이 구조는 SINV 26S mRNA의 AUG로부터 다운스트림에 위치한다. DLP는 셈리키 포레스트 바이러스(SFV)에서도 검출된다. 유사한 DLP 구조가 뉴 월드(New World) (예를 들어, MAYV, UNAV, EEEV(NA), EEEV(SA), AURAV) 및 올드 월드(Old World) (SV, SFV, BEBV, RRV, SAG, GETV, MIDV, CHIKV, 및 ONNV) 구성원을 포함하는 알파바이러스 속의 적어도 14개의 다른 구성원에 존재하는 것으로 보고되었다. 이들 알파바이러스 26S mRNA의 예측된 구조는 SHAPE(선택적 2'-하이드록실 아실화 및 프라이머 확장) 데이터(Toribio et al., Nucleic Acids Res. May 19; 44(9):4368-80, 2016)를 기초로 작제었으며, 그 내용은 본원에 참조로 포함된다. CHIKV 및 ONNV를 제외한 모든 경우에서 안정적인 스템-루프 구조가 검출된 반면, MAYV 및 EEEV는 안정성이 낮은 DLP를 나타냈다(Toribio et al., 2016 supra). 신드비스 바이러스의 경우, DLP 모티프는 신드비스 서브게놈 RNA의 처음 150 nt에서 발견된다. 헤어핀은 신드비스 캡시드 AUG 개시 코돈의 하부스트림에 위치한다(AUG는 신드비스 서브게놈 RNA의 nt 50에서 대조된다). 서열 비교 및 구조 RNA 분석에 대한 이전의 연구는 SINV에서 DLP의 진화적 보존을 밝혀냈고, 알파바이러스 속의 많은 구성원에서 등가의 DLP 구조의 존재를 예측하였다(예를 들어, 문헌[Ventoso, J. Virol. 9484-9494, Vol. 86, September 2012] 참조). DLP 모티프를 포함하는 자가-복제 RNA 벡터의 예는 미국 특허 출원 공개 US2018/0171340 및 국제 특허 출원 공개 WO2018106615에 기재되어 있으며, 그 내용은 그 전체가 본원에 참조로 포함된다. 일부 실시양태에서, 본 출원의 레플리콘 RNA는 서열번호 57에 제시된 서열과 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 나타내는 DLP 모티프를 포함한다.
일 실시양태에서, 자가-복제 RNA 분자는 또한 DLP 모티프의 다운스트림과 비구조 단백질(예를 들어, nsp1-4 중 하나 이상) 또는 관심 있는 유전자(예를 들어, 본원에 기재된 HBV 항원)의 코딩 서열의 다운스트림에 작동적으로 연결된 오토프로테아제 펩타이드에 대한 코딩 서열을 함유한다. 오토프로테아제 펩타이드의 예는 돼지 테스코바이러스-1 2A(P2A), 구제역 바이러스(FMDV) 2A(F2A), 말 비염 A 바이러스(ERAV) 2A(E2A), 테세아 아시그나 바이러스 2A(T2A), 세포질 다각체병 바이러스 2A(BmCPV2A), 무름병 바이러스 2A(BmIFV2A), 및 이들의 조합을 포함하지만 이에 제한되지 않는다. 일부 실시양태에서, 본 출원의 레플리콘 RNA는 서열번호 11의 아미노산 서열을 갖는 P2A에 대한 코딩 서열을 포함한다. 바람직하게는, 코딩 서열은 서열번호 12에 제시된 서열과 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 나타낸다.
본 발명의 임의의 레플리콘은 또한 5' 및 3' 비번역 영역(UTR)을 포함할 수 있다. UTR은 야생형 뉴 월드 또는 올드 월드 알파바이러스 UTR 서열, 또는 이들 중 임의의 것으로부터 유래된 서열일 수 있다. 다양한 실시양태에서, 5' UTR은 60 nt 또는 50-70 nt 또는 40-80 nt와 같은 임의의 적합한 길이일 수 있다. 일부 실시양태에서, 5' UTR은 또한 보존된 1차 또는 2차 구조(예를 들어, 하나 이상의 스템-루프(들))를 가질 수 있고, 알파바이러스 또는 레플리콘 RNA의 복제에 참여할 수 있다. 일부 실시양태에서 3' UTR은 수백 개 이하의 뉴클레오티드일 수 있으며, 예를 들어, 50-900 또는 100-900 또는 50-800 또는 100-700 또는 200-700 nt일 수 있다. '3 UTR은 또한 2차 구조, 예를 들어, 스텝 루프를 가질 수 있고, 폴리아데닐레이트 구역 또는 폴리-A 테일이 후속될 수 있다. 본 발명의 임의의 실시양태에서, 5' 및 3' 비번역 영역은 레플리콘에 의해 인코딩된 임의의 다른 서열에 작동적으로 연결될 수 있다. UTR은 다른 인코딩된 서열의 인식 및 전사에 필요한 서열 및 간격을 제공함으로써 프로모터 및/또는 이종 단백질 또는 펩타이드를 인코딩하는 서열에 작동적으로 연결될 수 있다. 본 개시내용의 관점에서 당업자에게 알려진 임의의 폴리아데닐화 신호가 사용될 수 있다. 예를 들어, 폴리아데닐화 신호는 SV40 폴리아데닐화 신호, LTR 폴리아데닐화 신호, 소 성장 호르몬(bGH) 폴리아데닐화 신호, 인간 성장 호르몬(hGH) 폴리아데닐화 신호, 또는 인간 β-글로빈 폴리아데닐화 신호일 수 있다.
또 다른 실시양태에서, 본 출원의 자가-복제 RNA 레플리콘은 변형된 5' 비번역 영역(5'-UTR)을 포함하고, 바람직하게는 RNA 레플리콘은 바이러스 구조 단백질을 인코딩하는 핵산 서열의 적어도 일부가 결여되어 있다. 예를 들어, 변형된 5'-UTR은 위치 1, 2, 4, 또는 이들의 조합에서 하나 이상의 뉴클레오티드 치환을 포함할 수 있다. 바람직하게는, 변형된 5'-UTR은 위치 2에서의 뉴클레오티드 치환을 포함하고, 보다 바람직하게는, 변형된 5'-UTR은 위치 2에서의 U->G 또는 U->A 치환을 갖는다. 이러한 자가-복제 RNA 분자의 예는 미국 특허 출원 공개 US2018/0104359 및 국제 특허 출원 공개 WO2018075235에 기재되어 있으며, 그 내용은 그 전체가 본원에 참조로 포함된다. 일부 실시양태에서, 본 출원의 레플리콘 RNA는 서열번호 55에 제시된 서열과 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 나타내는 5'-UTR을 포함한다.
일부 실시양태에서, 본 출원의 RNA 레플리콘은 5'-말단에서 3'-말단의 순서로 하기를 포함한다: (1) 서열번호 55의 폴리뉴클레오티드 서열을 갖는 5'-UTR, (2) 서열번호 56의 폴리뉴클레오티드 서열을 갖는 5' 복제 서열, (3) 서열번호 57의 폴리뉴클레오티드 서열을 포함하는 DLP 모티프, (4) 서열번호 11의 P2A 서열을 인코딩하는 폴리뉴클레오티드 서열, (5) 각각 서열번호 58, 서열번호 59, 서열번호 60 및 서열번호 61의 핵산 서열을 갖는 알파바이러스 비구조 단백질 NSP1, NSP2, NSP3 및 NSP4를 인코딩하는 폴리뉴클레오티드 서열, (6) 서열번호 62의 폴리뉴클레오티드 서열을 갖는 서브게놈 프로모터, (7) 본원에 기재된 비-천연 발생 폴리뉴클레오티드 서열, 및 (8) 서열번호 63의 폴리뉴클레오티드 서열을 갖는 3' UTR. 일부 실시양태에서, P2A 서열을 인코딩하는 폴리뉴클레오티드 서열은 서열번호 12를 포함하고, 비-천연 발생 폴리뉴클레오티드 서열은 서열번호 15 내지 54 중 어느 하나의 폴리뉴클레오티드 서열을 포함하고, RNA 레플리콘은 폴리아데노신 서열을 추가로 포함한다. 바람직하게는, 폴리아데노신 서열은 레플리콘의 3'-말단에 서열번호 64의 서열을 갖는다.
일부 바람직한 실시양태에서, 본 출원의 RNA 레플리콘은 서열번호 65 내지 72 중 어느 하나의 폴리뉴클레오티드 서열을 포함한다.
일부 실시양태에서, 본 출원의 RNA 레플리콘은 신호 펩타이드 서열을 인코딩하는 폴리뉴클레오티드 서열을 포함한다. 바람직하게는, 신호 펩타이드 서열을 인코딩하는 폴리뉴클레오티드 서열은 HBV 항원, 예컨대 HBV PreS1 항원, HBV 코어 항원 및 HBV pol 항원을 인코딩하는 폴리뉴클레오티드 서열의 업스트림 또는 5'-말단에 위치한다. 신호 펩타이드는 전형적으로 단백질의 국소화를 지시하고, 단백질이 생성되는 세포로부터 단백질의 분비를 촉진하고/하거나 항원 발현 및 항원-제시 세포에 대한 교차 제시를 개선한다. 신호 펩타이드는 벡터로부터 발현될 때 HBV 항원의 N-말단에 존재할 수 있지만, 예를 들어, 세포로부터 분비 시 신호 펩티다아제에 의해 절단된다. 신호 펩타이드가 절단된 발현된 단백질은 종종 "성숙 단백질"로 지칭된다. 본 개시내용의 관점에서 당업계에 알려진 임의의 신호 펩타이드가 사용될 수 있다. 예를 들어, 신호 펩타이드는 시스타틴 S 신호 펩타이드; 면역글로불린(Ig) 분비 신호, 예컨대 시스타틴 S 신호 펩타이드, Ig 중쇄 감마 신호 펩타이드 SPIgG, Ig 중쇄 엡실론 신호 펩타이드 SPIgE, 또는 짧은 리더 펩타이드 서열일 수 있다. 신호 펩타이드의 예시적인 아미노산 서열은 서열번호 77에 나타낸다.
다양한 실시양태에서, 본원에 개시된 RNA 레플리콘은 조작된, 합성, 또는 재조합 RNA 레플리콘일 수 있다. 본원에 사용된 바와 같이, 재조합체라는 용어는 폴리뉴클레오티드의 인간 조작이거나 아무리 간접적이더라도 이로부터 초래되는 임의의 분자(예를 들어 DNA, RNA 등)를 의미한다. 비제한적인 예로서, cDNA는 시험관내 폴리머라제 반응(들)에 의해 생성되었거나, 링커가 부착되었거나, 클로닝 벡터 또는 발현 벡터와 같은 벡터에 통합된 모든 핵산 분자와 마찬가지로 재조합 DNA 분자이다. 비제한적인 예로서, 재조합 RNA 레플리콘은 다음 중 하나 이상일 수 있다: 1) 예를 들어, 화학적 또는 효소적 기술(예를 들어, 화학적 핵산 합성을 사용하거나, 복제, 중합, 엑소뉴클레오틱 분해, 엔도뉴클레오틱 분해, 결찰, 역전사, 전사를 위한 효소를 사용하여) 핵산 분자의 염기 변형(예를 들어, 메틸화 포함), 또는 재조합(상동 및 부위-특이적 재조합 포함)을 사용하여 시험관내에서 합성 또는 변형됨; 2) 자연에서 접합되지 않은 접합된 뉴클레오티드 서열; 3) 천연 발생 뉴클레오티드 서열에 대하여 하나 이상의 뉴클레오티드가 결여되도록 분자 클로닝 기술을 사용하여 조작됨; 및 4) 천연 발생 뉴클레오티드 서열에 대해 하나 이상의 서열 변화 또는 재배열을 갖도록 분자 클로닝 기술을 사용하여 조작됨.
RNA 레플리콘의 임의의 구성요소 또는 서열은 임의의 다른 구성요소 또는 서열에 작동적으로 연결될 수 있다. RNA 레플리콘의 구성요소 또는 서열은 숙주 세포 또는 처리된 유기체에서 적어도 하나의 이종 단백질 또는 펩타이드 (또는 생물치료제)의 발현 및/또는 레플리콘의 자가-복제 능력에 대해 작동적으로 연결될 수 있다. 용어 "작동적으로 연결된"은 이들의 일반적일 기능을 수행하도록 구성된 둘 이상의 서열 간의 기능적 연결을 나타낸다. 따라서, 코딩 서열에 작동적으로 연결된 프로모터 또는 UTR은 적절한 효소가 존재할 때 코딩 서열의 전사 및 발현에 영향을 미칠 수 있다. 프로모터는 이의 발현을 지시하는 기능을 하는 한 코딩 서열과 인접할 필요는 없다. 따라서, 이종 단백질 또는 펩타이드를 인코딩하는 RNA 서열과 조절 서열(예를 들어, 프로모터 또는 UTR) 사이의 작동 가능한 연결은 관심 있는 폴리뉴클레오티드의 발현을 허용하는 기능적 연결이다. 작동적으로 연결된 것은 또한 nsP1-4를 인코딩하는 서열, UTR, 프로모터 및 RNA 레플리콘에서 인코딩하는 다른 서열과 같은 서열을 지칭할 수 있고, 이는 이들이 생물치료제 분자의 전사 및 번역 및/또는 레플리콘의 복제를 가능하게 하도록 연결된다. UTR은 다른 인코딩된 서열의 리보솜에 의한 인식 및 번역에 필요한 서열 및 간격을 제공함으로써 작동적으로 연결될 수 있다.
본 발명의 RNA 레플리콘은 알파바이러스 게놈으로부터 유래될 수 있으며, 이는 이들이 알파바이러스 게놈의 구조적 특성 중 일부를 갖거나 이들과 유사하다는 것을 의미한다. 본 발명의 RNA 레플리콘은 변형된 알파바이러스 게놈일 수 있다. 본원에 개시된 레플리콘의 일부 실시양태에서, 레플리콘의 하나 이상의 서열이 "인 트랜스로" 제공될 수 있는데, 즉 레플리콘의 서열이 하나 초과의 RNA 분자 상에 제공된다. 다른 실시양태에서, 레플리콘의 모든 서열은 단일 RNA 분자 상에 존재하며, 이는 또한 본원에 기재된 바와 같이 치료될 포유동물에게 투여될 수 있다.
본원에 사용된 바와 같이, 핵산 또는 폴리펩타이드 서열에 대한 용어 "퍼센트 동일성" 또는 "상동성" 또는 "공유 서열 동일성" 또는 "퍼센트(%) 서열 동일성 "는 최대 퍼센트 동일성을 위해 서열을 정렬하고 필요한 경우 갭을 도입하여 최대 상동성 퍼센트를 달성한 후, 알려진 폴리뉴클레오티드 또는 폴리펩타이드와 동일한 후보 서열 내의 뉴클레오티드 또는 아미노산 잔기의 백분율로서 정의된다. N-말단 또는 C-말단 삽입 또는 결실은 상동성에 영향을 미치는 것으로 해석되지 않아야 하며, 내부 결실 및/또는 약 30개 미만, 약 20개 미만, 또는 약 10개 미만 또는 5개 미만의 아미노산 잔기의 뉴클레오티드 또는 폴리펩타이드 서열로의 삽입은 상동성에 영향을 미치는 것으로 해석되지 않아야 한다. 뉴클레오티드 또는 아미노산 서열 수준에서의 상동성 또는 동일성은 서열 유사성 검색을 위해 맞춤화된 프로그램 blastp, blastn, blastx, tblastn 및 tblastx (Altschul (1997), Nucleic Acids Res. 25, 3389-3402, and Karlin (1990), Proc. Natl. Acad. Sci. USA 87, 2264-2268)에 의해 사용된 알고리즘을 사용하는 BLAST(Basic Local Alignment Search Tool) 분석에 의해 결정될 수 있다. BLAST 프로그램에 의해 사용된 접근법은 먼저 쿼리 서열과 데이터베이스 서열 사이에서 간격이 있거나 없는 유사한 세그먼트를 고려한 다음, 식별된 모든 매칭의 통계적 유의성을 평가하고, 마지막으로 미리 선택된 유의성 임계값을 충족하는 매칭만 요약하는 것이다. 서열 데이터베이스의 유사성 검색에서 기본적인 문제에 대한 논의는 문헌[Altschul (1994), Nature Genetics 6, 119-129]을 참조한다. 히스토그램, 설명, 정렬, 예상(즉, 데이터베이스 서열에 대한 일치를 보고하기 위한 통계적 유의성 임계값), 컷오프, 매트릭스 및 필터(낮은 복잡도)에 대한 검색 매개변수는 기본 설정일 수 있다. blastp, blastx, tblastn 및 tblastx에 의해 사용되는 기본 스코어링 매트릭스는 BLOSUM62 매트릭스(Henikoff (1992), Proc. Natl. Acad. Sci. USA 89, 10915-10919)이며, 길이가 85 초과인 쿼리 서열(뉴클레오티드 염기 또는 아미노산)에 권장된다.
뉴클레오티드 서열을 비교하기 위해 설계된 blastn의 경우, 스코어링 매트릭스는 M(즉, 한 쌍의 매칭 잔기에 대한 보상 스코어) 대 N(즉, 미스매칭 잔기에 대한 페널티 스코어)의 비율에 의해 설정되며, 여기서 M 및 N에 대한 기본 값은 각각 +5 및 -4일 수 있다. 4개의 blastn 매개변수는 다음과 같이 조정할 수 있다: Q = 10(갭 생성 페널티); R = 10(갭 확장 페널티); wink = 1(쿼리를 따라 모든 wink번째 위치에서 단어 히트 생성); 및 gapw = 16(갭 정렬이 생성되는 윈도우 너비를 설정함). 아미노산 서열의 비교를 위한 동등한 Blastp 매개변수 설정은 다음과 같을 수 있다: Q = 9; R = 2; wink = 1; 및 gapw = 32. GCG 패키지 버전 10.0에서 사용할 수 있는 서열 간의 BESTFIT® 비교는 DNA 매개변수 GAP=50(갭 생성 페널티) 및 LEN = 3(갭 확장 페널티)을 사용할 수 있으며 단백질 비교에서 동등한 설정은 GAP = 8 및 LEN = 2일 수 있다.
본원의 핵산 또는 폴리펩타이드 서열, 예를 들어 바이러스 캡시드 인핸서, 오토프로테아제 펩타이드, 서브게놈 프로모터, 비구조 단백질, HBV 항원의 서열을 개시함에 있어서, 본래의 서열에 기초하거나 이로부터 유래된 것으로 간주되는 서열 또한 개시된다. 따라서, 개시된 서열은 서열번호 1 내지 90과 같은 본원에 기재된 임의의 폴리뉴클레오티드 또는 폴리펩타이드 서열의 전장 폴리뉴클레오티드 또는 폴리펩타이드 서열과 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 또는 적어도 85%, 예를 들어, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 89%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 또는 85-99% 또는 85-95% 또는 90-99% 또는 95-99% 또는 97-99% 또는 98-99% 서열 동일성을 갖는 폴리뉴클레오티드 또는 폴리펩타이드 서열 및 이의 단편을 포함한다. 본원에 개시된 임의의 서열의 단편 또는 일부가 또한 개시된다. 서열의 단편 또는 일부는 전체 서열의 적어도 5 또는 적어도 7 또는 적어도 10, 또는 적어도 20, 또는 적어도 30, 적어도 50, 적어도 75, 적어도 100, 적어도 125, 150 또는 5-10 또는 10-12 또는 10-15 또는 15-20 또는 20-40 또는 20-50 또는 30-50 또는 30-75 또는 30-100개 아미노산 또는 핵산 잔기, 또는 적어도 100 또는 적어도 200 또는 적어도 300 또는 적어도 400 또는 적어도 500 또는 적어도 600 또는 적어도 700 또는 적어도 800 또는 적어도 900 또는 적어도 1000 또는 100-200 또는 100-500 또는 100-1000 또는 500-1000개 아미노산 또는 핵산 잔기, 또는 이들 양 중 임의의 것을 갖지만 500 미만 또는 700 미만 또는 1000 미만 또는 2000개 미만의 연속 아미노산 또는 임의의 서열번호 1-90 또는 본원에 개시된 임의의 단편의 핵산을 갖는 서열을 포함할 수 있다. 예를 들어, 적어도 1개 또는 2개 또는 3개 또는 4개 또는 5개의 아미노산 잔기는 삽입 및 치환을 포함하는 개시된 서열(들) 및 그러한 변이체를 인코딩하는 핵산 서열에 및/또는 그 내에 N- 및/또는 C-말단에 삽입된 그러한 서열의 변이체가 또한 개시되어 있다. 고려되는 변이체는 추가적으로 또는 대안적으로, 예를 들어, 상동성 재조합 또는 부위-지시 또는 PCR 돌연변이유발에 의해 소정의 돌연변이를 포함하는 것들, 및 본원에 기재된 것들, 삽입 및 치환을 포함하는 폴리펩타이드 또는 핵산의 패밀리의 대립유전자 또는 다른 천연 발생 변이체; 및/또는 유도체를 포함하지만 이에 제한되지 않는 다른 종의 상응하는 폴리펩타이드 또는 핵산을 포함할 수 있고, 여기서 폴리펩타이드는 삽입 및 치환을 포함하는 천연 발생 아미노산 이외의 모이어티(예를 들어, 효소와 같은 검출 가능한 모이어티)와의 치환, 화학적, 효소적 또는 다른 적절한 수단에 의해 공유적으로 변형되었다. 본원에 기재된 핵산 서열은 RNA 서열일 수 있다.
이종 단백질 및 펩타이드
본 발명의 RNA 레플리콘은 알파바이러스에 대해 이종성인 적어도 하나의 단백질 또는 펩타이드를 인코딩하는 RNA 서열을 포함할 수 있고, 또한 체내에서 RNA 서열을 발현하는 인간, 포유동물 또는 동물에 대해 이종성일 수 있다(반드시 그런 것은 아님). 임의의 실시양태에서, 레플리콘은 2개 또는 3개 또는 4개 이상의 이종 단백질 또는 펩타이드를 인코딩하는 RNA 서열(들)을 가질 수 있다. 일부 실시양태에서, 이종 단백질 또는 펩타이드는 본원에 기재된 바와 같이 HBV 항원이다. 임의의 실시양태에서, 이종 단백질 또는 펩타이드를 인코딩하는 서열은 레플리콘의 하나 이상의 다른 서열(예를 들어, 프로모터 또는 5' 또는 3' UTR 서열)에 작동적으로 연결될 수 있고, 이종 단백질 또는 펩타이드가 인간, 포유동물 또는 동물에서 발현되도록 서브게놈 프로모터의 제어 하에 있을 수 있다.
일 실시양태에서, 본 발명의 RNA 레플리콘은 이종 단백질 또는 펩타이드(예를 들어, 모노클로날 항체 또는 생물치료제 단백질 또는 펩타이드)를 인코딩하는 RNA 서열, 야생형 알파바이러스 nsP1, nsP2, nsP3, 및 nsP4 단백질 서열로부터 유래된 아미노산 서열을 인코딩하는 RNA 서열, 및 5' 및 3' UTR 서열(비구조 단백질-매개 증폭을 위한)을 가질 수 있다. RNA 레플리콘은 또한 5' 캡 및 폴리 아데닐레이트 (또는 폴리-A) 테일을 가질 수 있다.
이종 단백질 또는 펩타이드의 면역원성은 당업자에게 알려진 다수의 검정, 예를 들어, 에피토프-특이적 T-세포 집단에 의한 세포내 사이토카인 또는 분비된 사이토카인의 면역염색, 또는 에피토프-특이적 T 세포의 빈도 및 총 수를 정량화하고 이들의 분화 및 활성화 상태, 예를 들어, 수명이 짧은 이펙터 및 메모리 전구체 이펙터 CD8+ T 세포를 특성화함으로써 결정될 수 있다. 면역원성은 또한 항체-매개 면역 반응, 예를 들어, 혈청 IgA 또는 IgG 역가를 측정함으로써 항체의 생성을 측정함으로써 결정될 수 있다.
본 출원의 HBV 항원 이외에, 본 출원의 RNA 레플리콘은 선택적으로 사이토카인, 성장 인자, 면역글로불린, 모노클로날 항체(Fab 항원-결합 단편, Fc 융합 단백질 포함), 호르몬, 인터페론, 인터루킨, 조절 펩타이드 및 단백질을 포함하지만 이에 제한되지 않는 임의의 단백질 또는 펩타이드일 수 있는 하나 이상의 이종 단백질 또는 펩타이드를 추가로 인코딩할 수 있다.
일부 실시양태에서, 이종 단백질 또는 펩타이드는 5 kb 이하 또는 6 kb 이하 또는 7 kb 이하 또는 8 kb 이하, 또는 9 kb 이하 또는 10 kb 이하 또는 11 kb 이하 또는 12 kb 이하의 RNA 서열에 의해 인코딩될 수 있다. 이종 단백질은 또한 단일 사슬 항체 분자일 수 있다.
본 발명의 알파바이러스 레플리콘은 또한 이종 단백질 또는 펩타이드의 발현을 위한 서브게놈 프로모터를 가질 수 있다. 본원에 사용된 용어 "서브게놈 프로모터"는 바이러스 핵산의 서브게놈 mRNA의 프로모터를 지칭한다. 본원에 사용된 바와 같이, "알파바이러스 서브게놈 프로모터"는 알파바이러스 복제 과정의 일부로서 서브게놈 메신저 RNA의 전사를 지시하는 알파바이러스 게놈에서 본래 정의된 바와 같은 프로모터이다.
폴리뉴클레오티드, 유전자, 핵산, 폴리펩타이드, 단백질, 또는 효소와 관련하여 사용될 때 용어 "이종"은 숙주 종으로부터 유래되지 않은 폴리뉴클레오티드, 유전자, 핵산, 폴리펩타이드, 단백질, 또는 효소를 지칭한다. 예를 들어, 본원에 사용된 "이종 유전자" 또는 "이종 핵산 서열"은 그것이 도입되는 숙주 유기체의 종이 아닌 상이한 종으로부터의 유전자 또는 핵산 서열을 지칭한다. 이종 서열은 또한 합성일 수 있으며 유기체로부터 유래되지 않거나 자연에서 발견되지 않을 수 있다. 유전자 조절 서열 또는 유전자 서열의 발현을 조작하기 위해 사용되는 보조 핵산 서열(예를 들어, 5' 비번역 영역, 3' 비번역 영역, 폴리 A 부가 서열, 인트론 서열, 스플라이스 부위, 리보솜 결합 부위, 내부 리보솜 진입 서열, 게놈 상동성 영역, 재조합 부위 등) 또는 단백질 도메인 또는 단백질 국소화 서열을 인코딩하는 핵산 서열을 언급할 때, "이종"은 조절 또는 보조 서열 또는 단백질 도메인 또는 국소화 서열을 인코딩하는 서열이 조절 또는 보조 핵산 서열 또는 단백질 도메인 또는 국소화 서열을 인코딩하는 핵산 서열이 게놈, 염색체 또는 에피솜에서 병치되는 유전자와는 상이한 공급원으로부터 유래함을 의미한다. 따라서, 이의 자연 상태(예를 들어, 비유전적으로 조작된 유기체의 게놈에서)에서 작동적으로 연결되지 않은 유전자에 작동적으로 연결된 프로모터는 그것이 연결된 유전자와 동일한 종 (또는, 일부 경우에, 동일한 유기체)으로부터 유래될 수 있다 하더라도, 본원에서 "이종 프로모터"로서 지칭된다. 유사하게, 조작된 단백질의 단백질 국소화 서열 또는 단백질 도메인을 언급할 때, "이종"은 국소화 서열 또는 단백질 도메인이 유전자 조작에 의해 혼입되는 것과 상이한 단백질로부터 유래됨을 의미한다.
본원에 사용된 용어 "비-천연 발생" "재조합" 또는 "조작된" 핵산 분자 또는 폴리뉴클레오티드 서열은 인간 개입을 통해 변경된 핵산 분자 또는 비-천연 발생 폴리뉴클레오티드 서열을 지칭한다. 비제한적인 예로서, 재조합 핵산 분자는 1) 예를 들어, 화학적 또는 효소적 기술(예를 들어, 화학적 핵산 합성을 사용하거나, 복제, 중합, 엑소뉴클레오틱 분해, 엔도뉴클레오틱 분해, 결찰, 역전사, 전사를 위한 효소를 사용하여), 염기 변형(예를 들어, 메틸화 포함), 또는 핵산 분자의 재조합(상동성 및 부위-특이적 재조합 포함)을 사용하여 시험관내에서 합성 또는 변형되었고/되었거나; 2) 자연에서 접합되지 않은 접합된 뉴클레오티드 서열을 포함하고/하거나, 3) 천연 발생 핵산 분자 서열에 대하여 하나 이상의 뉴클레오티드가 결여되도록 분자 클로닝 기술을 사용하여 조작되었고/되었거나, 4) 천연 발생 핵산 서열에 대해 하나 이상의 서열 변경 또는 재배열을 갖도록 분자 클로닝 기술을 사용하여 조작되었다. 비제한적인 예로서, cDNA는 시험관내 폴리머라제 반응(들)에 의해 생성되었거나, 링커가 부착되었거나, 클로닝 벡터 또는 발현 벡터와 같은 벡터에 통합되거나 RNA 레플리콘에 통합된 모든 핵산 분자와 마찬가지로 재조합 DNA 분자이다.
일부 실시양태에서, 본 발명의 RNA 레플리콘은 5'-말단에서 3'-말단의 순서로 하기를 포함한다: RNA 바이러스의 비구조 단백질-매개 증폭에 필요한 5' 비번역 영역(5'-UTR); RNA 바이러스의 비구조 단백질의 적어도 하나, 바람직하게는 모두를 인코딩하는 폴리뉴클레오티드 서열; RNA 바이러스의 서브게놈 프로모터; 본원에 기재된 비-천연 발생 폴리뉴클레오티드 서열; 및 RNA 바이러스의 비구조 단백질-매개 증폭에 필요한 3' 비번역 영역(3'-UTR).
일부 실시양태에서, 본 발명의 RNA 레플리콘은 5'-말단에서 3'-말단의 순서로 하기를 포함한다: 알파바이러스 5' 비번역 영역(5'-UTR); 알파바이러스 비구조 유전자 NSP1의 5' 복제 서열; 바이러스 종의 다운스트림 루프(DLP) 모티프; 제4 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열; 알파바이러스 비구조 단백질 NSP1, NSP2, NSP3 및 NSP4를 인코딩하는 폴리뉴클레오티드 서열; 알파바이러스 서브게놈 프로모터; 본원에 기재된 비-천연 발생 폴리뉴클레오티드 서열; 알파바이러스 3' 비번역 영역(3' UTR); 및 선택적으로, 폴리 아데노신 서열.
일부 실시양태에서, DLP 모티프는 동부 말 뇌염 바이러스(EEEV), 베네수엘라 말 뇌염 바이러스(VEEV), 에버글레이즈 바이러스(EVEV), 무캄보 바이러스(MUCV), 셈리키 포레스트 바이러스(SFV), 픽수나 바이러스(PIXV), 미들버그 바이러스(MTDV), 치쿤구니야 바이러스(CHIKV), 오니옹-니옹 바이러스(ONNV), 로스 리버 바이러스(RRV), 바마 포레스트 바이러스(BF), 게타 바이러스(GET), 사기야마 바이러스(SAGV), 베바루 바이러스(BEBV), 마야로 바이러스(MAYV), Una 바이러스(U AV), 신드비스 바이러스(SINV), 아우라 바이러스(AURAV), 와타로아 바이러스(WHAV), 바반키 바이러스(BABV), 키질라가크 바이러스(KYZV), 서부 말 뇌염 바이러스(WEEV), 하이랜드 J 바이러스(HJV), 포트 모건 바이러스(FMV), Ndumu(NDUV), 및 버기 크릭 바이러스로 이루어진 군으로부터 선택된 바이러스 종으로부터 유래한다.
일부 실시양태에서, 제4 오토프로테아제 펩타이드는 돼지 테스코바이러스-1 2A(P2A), 구제역 바이러스(FMDV) 2A(F2A), 말 비염 A 바이러스(ERAV) 2A(E2A), 테세아 아시그나 바이러스 2A(T2A), 세포질 다각체병 바이러스 2A(BmCPV2A), 무름병 바이러스 2 A(BmIFV2A), 및 이들의 조합으로 이루어진 군으로부터 선택된다. 바람직하게는, 제4 오토프로테아제 펩타이드는 P2A의 펩타이드 서열을 포함한다. 일부 실시양태에서, 제4 오토프로테아제 펩타이드는 서열번호 11을 포함한다. 일부 실시양태에서, 제4 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열은 서열번호 12를 포함한다. 일부 실시양태에서, 제4 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열은 서열번호 12로 이루어진다.
일부 실시양태에서, 본 발명의 RNA 레플리콘은 5'-말단에서 3'-말단의 순서로 하기를 포함한다: 서열번호 55의 폴리뉴클레오티드 서열을 갖는 5'-UTR; 서열번호 56의 폴리뉴클레오티드 서열을 갖는 5' 복제 서열; 서열번호 57의 폴리뉴클레오티드 서열을 포함하는 DLP 모티프; 서열번호 11의 P2A 서열을 인코딩하는 폴리뉴클레오티드 서열; 각각 서열번호 58, 서열번호 59, 서열번호 60 및 서열번호 61의 핵산 서열에 의해 인코딩되는 것들과 같은 알파바이러스 비구조 단백질 NSP1, NSP2, NSP3 및 NSP4를 인코딩하는 폴리뉴클레오티드 서열; 서열번호 62의 폴리뉴클레오티드 서열을 갖는 서브게놈 프로모터; 본원에 개시된 비-천연 발생 폴리뉴클레오티드 서열; 및 서열번호 63의 폴리뉴클레오티드 서열을 갖는 3' UTR. 일부 실시양태에서, P2A 서열을 인코딩하는 폴리뉴클레오티드 서열은 서열번호 12를 포함하고, 비-천연 발생 폴리뉴클레오티드 서열은 서열번호 15 내지 54 중 어느 하나의 폴리뉴클레오티드 서열을 포함하고, RNA 레플리콘은 폴리아데노신 서열을 추가로 포함한다. 바람직하게는, 폴리 아데노신 서열은 레플리콘의 3'-말단에 서열번호 64의 서열을 갖는다.
일부 실시양태에서, 본 발명의 RNA 레플리콘은 서열번호 65 내지 72 중 어느 하나의 폴리뉴클레오티드 서열을 포함한다.
일부 실시양태에서, 본원에 개시된 RNA 레플리콘을 인코딩하는 폴리뉴클레오티드 서열을 포함하는 핵산 분자는 DNA 서열의 5'-말단에 작동적으로 연결된 T7 프로모터를 추가로 포함한다. 보다 바람직하게는, T7 프로모터는 서열번호 73의 뉴클레오티드 서열을 포함한다.
본원에 개시된 RNA 레플리콘을 인코딩하는 DNA 서열을 포함하는 핵산 분자를 전사하는 단계를 포함하는, 본 출원의 RNA 레플리콘을 생성하는 방법이 또한 제공된다. 일부 실시양태에서, 핵산 분자는 생체내에서 전사된다. 일부 실시양태에서, 핵산 분자는 시험관내에서 전사된다.
세포 및 폴리펩타이드
본 출원은 또한 본원에 기재된 임의의 폴리뉴클레오티드 및 벡터를 포함하는 세포, 바람직하게는 단리된 세포를 제공한다. 예를 들어, 세포는 재조합 단백질 생성 또는 바이러스 입자 생성을 위해 사용될 수 있다. 일부 실시양태에서, 세포는 RNA 레플리콘의 생성을 위해 사용될 수 있다.
RNA 레플리콘 또는 본 출원의 RNA 레플리콘을 인코딩하는 핵산을 포함하는 숙주 세포 또한 본 발명의 일부를 형성한다. HBV 항원은 숙주 세포, 예를 들어, 차이니즈 햄스터 난소(CHO) 세포, 종양 세포주, BHK 세포, 인간 세포주, 예컨대 HEK293 세포, PER.C6 세포, 또는 효모, 진균, 곤충 세포, 등 또는 형질전환 동물 또는 식물에서 분자의 발현을 포함하는 재조합 DNA 기술을 통해 생성될 수 있다. 특정 실시양태에서, 세포는 다세포 유기체로부터 유래하며, 특정 실시양태에서 이들은 척추동물 또는 무척추동물 기원이다. 특정 실시양태에서, 세포는 인간 세포, 또는 곤충 세포와 같은 포유동물 세포이다. 일반적으로, 숙주 세포에서 본 발명의 HBV 항원과 같은 재조합 단백질의 생성은 발현 가능한 형식으로 단백질을 인코딩하는 이종 핵산 분자를 숙주 세포에 도입하고, 핵산 분자의 발현에 도움이 되는 조건 하에 세포를 배양하고, 상기 세포에서 단백질의 발현을 허용하는 것을 포함한다. 발현 가능한 형식으로 단백질을 인코딩하는 핵산 분자는 발현 카세트의 형태일 수 있고, 일반적으로 인핸서(들), 프로모터, 폴리아데닐화 신호 등과 같은 핵산의 발현을 야기할 수 있는 서열을 필요로 한다. 당업자는 숙주 세포에서 유전자의 발현을 얻기 위해 다양한 프로모터가 사용될 수 있다는 것을 알고 있다. 프로모터는 구성적이거나 규제될 수 있고, 바이러스, 원핵생물 또는 진핵생물 공급원을 포함하는 다양한 공급원으로부터 얻어질 수 있거나, 인위적으로 설계될 수 있다. 추가의 조절 서열이 추가될 수 있다. 많은 프로모터가 전이유전자(들)의 발현을 위해 사용될 수 있고, 당업자에게 알려져 있으며, 예를 들어, 이들은 바이러스, 포유동물, 합성 프로모터 등을 포함할 수 있다. 진핵생물 세포에서 발현을 얻기 위한 적합한 프로모터의 비제한적인 예는 CMV-프로모터(US 5,385,839), 예를 들어, CMV 급초기 유전자 인핸서/프로모터로부터의 nt. -735 내지 +95를 포함하는 CMV 급초기 프로모터이다. 폴리아데닐화 신호, 예를 들어, 소 성장 호르몬 폴리A 신호(US 5,122,458)는 전이유전자(들) 뒤에 존재할 수 있다. 대안적으로, 몇몇 널리 사용되는 발현 벡터는 당업계에서 그리고 상업적 공급원, 예를 들어, 관심 있는 단백질을 재조합적으로 발현시키거나 적합한 프로모터 및/또는 전사 종결자 서열, 폴리A 서열 등을 얻기 위해 사용될 수 있는 Invitrogen의 pcDNA 및 pEF 벡터 시리즈, BD Sciences의 pMSCV 및 pTK-Hyg, Stratagene의 pCMV-Script 등으로부터 입수 가능하다.
세포 배양은 부착성 세포 배양, 예를 들어, 배양 용기의 표면 또는 마이크로캐리어에 부착된 세포뿐만 아니라 현탁 배양을 포함한 임의의 유형의 세포 배양일 수 있다. 대부분의 대규모 현탁액 배양은 이들이 운영 및 규모 확장이 가장 간단하기 때문에 배치 또는 유가 배치(fed-batch) 공정으로서 운영된다. 요즘에는, 관류 원리에 기초한 연속 공정이 점점 보편화되고 있으며 적합하기도 하다. 적합한 배양 배지는 또한 당업자에게 잘 알려져 있으며, 일반적으로 상업적 공급원으로부터 대량으로 입수할 수 있거나, 표준 프로토콜에 따라 맞춤 제작될 수 있다. 배양은, 예를 들어, 배치, 유가-배치, 연속 시스템 등을 사용하여 접시, 롤러 병 또는 생물반응기에서 수행될 수 있다. 세포 배양에 적합한 조건은 알려져 있다(예를 들어, 문헌[Tissue Culture, Academic Press, Kruse and Paterson, editors (1973), and R.I. Freshney, Culture of animal cells: A manual of basic technique, fourth edition (Wiley-Liss Inc., 2000, ISBN 0-471-34889-9)] 참조). 세포 배양 배지는 다양한 공급업체로부터 입수 가능하며, 숙주 세포가 관심 있는 단백질, 여기서는 HBV 항원을 발현하도록 적합한 배지를 일상적으로 선택할 수 있다. 적합한 배지는 혈청을 포함하거나 포함하지 않을 수 있다.
따라서, 본 출원의 실시양태는 또한 본 출원의 HBV 항원을 제조하는 방법에 관한 것이다. 상기 방법은 프로모터에 작동적으로 연결된 본 출원의 HBV 항원을 인코딩하는 폴리뉴클레오티드를 포함하는 발현 벡터로 숙주 세포를 형질감염시키는 단계, HBV 항원의 발현에 적합한 조건 하에 형질감염된 세포를 성장시키는 단계, 및 선택적으로 세포에서 발현된 HBV 항원을 정제 또는 단리하는 단계를 포함한다. HBV 항원은 친화성 크로마토그래피, 크기 배제 크로마토그래피 등을 포함하는 당업계에 알려진 임의의 방법에 의해 세포로부터 단리되거나 수집될 수 있다. 재조합 단백질 발현에 사용되는 기술은 본 개시내용의 관점에서 당업자에게 잘 알려져 있을 것이다. 발현된 HBV 항원은 또한, 예를 들어, HBV 항원을 인코딩하는 발현 벡터로 형질감염되고 HBV 항원의 발현에 적합한 조건 하에 성장된 세포의 상청액을 분석함으로써 발현된 단백질을 정제 또는 분리하지 않고 연구될 수 있다.
따라서, 서열번호 1, 서열번호 3, 서열번호 5, 서열번호 7, 84, 85 또는 86, 또는 서열번호 9의 아미노산 서열과 적어도 90% 동일한 아미노산 서열을 포함하는 비-천연 발생 또는 재조합 폴리펩타이드가 또한 제공된다. 상기 및 하기 기재된 바와 같이, 이들 서열을 인코딩하는 단리된 핵산 분자, 프로모터에 작동적으로 연결된 이들 서열을 포함하는 벡터, 및 폴리펩타이드, 폴리뉴클레오티드, 또는 벡터를 포함하는 조성물이 또한 본 출원에 의해 고려된다.
본 출원의 실시양태에서, 재조합 폴리펩타이드는 서열번호 1, 서열번호 3, 서열번호 5, 서열번호 7, 84, 85 또는 86, 또는 서열번호 9의 아미노산 서열과 적어도 90% 동일한, 예컨대 서열번호 1, 서열번호 3, 서열번호 5, 서열번호 7, 84, 85 또는 86, 또는 서열번호 9와 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함한다. 바람직하게는, 비-천연 발생 또는 재조합 폴리펩타이드는 서열번호 1, 서열번호 3, 서열번호 5, 서열번호 84, 85 또는 86, 또는 서열번호 9로 이루어진다.
조성물
본 출원은 또한 본 출원에 따른 하나 이상의 HBV 항원, 폴리뉴클레오티드 및/또는 하나 이상의 HBV 항원을 인코딩하는 벡터를 포함하는, 조성물, 약제학적 조성물, 면역원성 조합물, 및 보다 특히 백신에 관한 것이다. 본원에 기재된 본 출원의 임의의 HBV 항원, 폴리뉴클레오티드(RNA 및 DNA 포함), 및/또는 벡터는 본 출원의 조성물, 약제학적 조성물, 면역원성 조합물 및 백신에 사용될 수 있다.
본 출원은, 예를 들어, 약제학적으로 허용되는 담체와 함께 본원에 기재된 임의의 핵산 분자, 벡터, 또는 RNA 레플리콘을 포함하는 약제학적 조성물을 제공한다. 약제학적으로 허용되는 담체는 무독성이고, 활성 성분의 효능을 방해해서는 안된다. 약제학적으로 허용되는 담체는 하나 이상의 부형제, 예컨대 결합제, 붕해제, 팽윤제, 현탁화제, 유화제, 습윤제, 윤활제, 풍미제, 감미료, 방부제, 염료, 가용화제 및 코팅제를 포함할 수 있다. 담체 또는 기타 물질의 정확한 성질은 투여 경로, 예를 들어, 근육내, 피내, 피하, 경구, 정맥내, 피부, 점막내(예를 들어, 장내), 비강내 또는 복강내 경로에 따라 달라질 수 있다. 액체 주사 가능한 제제, 예를 들어, 현탁액 및 용액의 경우, 적합한 담체 및 첨가제는 물, 글리콜, 오일, 알코올, 방부제, 착색제 등을 포함한다. 고체 경구 제제의 경우, 예를 들어, 분말, 캡슐, 당의정, 겔캡 및 정제, 적합한 담체 및 첨가제는 전분, 당, 희석제, 과립화제, 윤활제, 결합제, 붕해제 등을 포함한다. 비강 스프레이/흡입제 혼합물의 경우, 수용액/현탁액은 물, 글리콜, 오일, 연화제, 안정제, 습윤제, 방부제, 방향제, 향료 등을 적절한 담체 및 첨가제로서 포함할 수 있다.
본 출원의 약제학적 조성물은 경구(장) 투여 및 비경구 주사를 포함하지만 이에 제한되지 않는 투여를 용이하게 하고 효능을 개선하기 위해 대상체에게 투여하기에 적합한 임의의 물질로 제형화될 수 있다. 비경구 주사는 정맥주사 또는 주입, 피하 주사, 피내 주사 및 근육 주사를 포함한다. 본 출원의 약제학적 조성물은 또한 경점막, 안구, 직장, 장기 작용 이식, 설하 투여, 혀 아래 투여, 문맥 순환을 우회하는 구강 점막으로부터 투여, 흡입, 또는 비강내를 포함하는 다른 투여 경로를 위해 제형화될 수 있다.
본 출원의 바람직한 실시양태에서, 본 출원의 약제학적 조성물은 비경구 주사, 바람직하게는 피하, 피내 주사, 또는 근육내 주사, 보다 바람직하게는 근육내 주사용으로 제형화된다.
본 출원의 실시양태에 따르면, 투여용 약제학적 조성물은 전형적으로 약제학적으로 허용되는 담체, 예를 들어, 완충 식염수 등과 같은 수성 담체, 예를 들어 인산염 완충 식염수(PBS) 중 완충 용액을 포함할 것이다. 조성물 및 면역원성 조합물은 또한 pH 조정제 및 완충제와 같은 대략적인 생리학적 조건에 필요한 약제학적으로 허용되는 물질을 함유할 수 있다. 예를 들어, 플라스미드 DNA를 포함하는 본 출원의 약제학적 조성물은 약제학적으로 허용되는 담체로서 인산염 완충 식염수(PBS)를 함유할 수 있다. 플라스미드 DNA는, 예를 들어, 0.5 mg/mL 내지 5 mg/mL, 예컨대 0.5 mg/mL, 1 mg/mL, 2 mg/mL, 3 mg/mL, 4 mg/mL, 또는 5 mg/mL, 바람직하게는 1 mg/mL의 농도로 존재할 수 있다.
일부 실시양태에서, RNA 레플리콘을 포함하는 본 출원의 약제학적 조성물은, 예를 들어, 약 20 μg/mL 내지 약 200 μg/mL, 예컨대 20 μg/mL, 30 μg/mL, 40 μg/mL, 50 μg/mL, 60 μg/mL, 70 μg/mL, 80 μg/mL, 90 μg/mL, 100 μg/mL, 110 μg/mL, 120 μg/mL, 130 μg/mL, 140 μg/mL, 150 μg/mL, 160 μg/mL, 170 μg/mL, 180 μg/mL, 190 μg/mL, 또는 200 μg/mL의 농도로 투여될 수 있다. 일부 실시양태에서, RNA 레플리콘을 포함하는 본 출원의 약제학적 조성물은 20 μg/mL 미만의 농도로 투여될 수 있다. 일부 실시양태에서, RNA 레플리콘을 포함하는 본 출원의 약제학적 조성물은 200 μg/mL 초과의 농도로 투여될 수 있다.
본 출원의 약제학적 조성물은 당업계에 잘 알려진 방법에 따라 백신 ("면역원성 조성물"로도 지칭됨)으로서 제형화될 수 있다. 그러한 조성물은 면역 반응을 증진시키는 보조제를 포함할 수 있다. 제형 중 각 성분의 최적 비율은 본 개시내용의 관점에서 당업자에게 잘 알려진 기술에 의해 결정될 수 있다.
본 출원의 특정 실시양태에서, 약제학적 조성물, 조성물, 또는 면역원성 조합물은 DNA 백신이다. DNA 백신은 전형적으로 강력한 진핵 프로모터의 조절하에 관심 있는 항원을 인코딩하는 폴리뉴클레오티드를 함유하는 박테리아 플라스미드를 포함한다. 플라스미드가 숙주의 세포질로 전달되면, 인코딩된 항원이 생성되고 내인성으로 처리된다. 생성된 항원은 전형적으로 체액성 및 세포-매개 면역 반응 둘 다를 유도한다. DNA 백신은 적어도 향상된 안전성을 제공하고, 온도에 안정적이고, 항원 변이체를 발현하도록 쉽게 적응할 수 있고, 생성이 간단하기 때문에 유리하다. 본 출원의 임의의 DNA 플라스미드를 사용하여 그러한 DNA 백신을 제조할 수 있다.
본 출원의 다른 특정 실시양태에서, 약제학적 조성물, 조성물, 또는 면역원성 조합물은 RNA 백신이다. RNA 백신은 전형적으로 관심 있는 항원, 예를 들어, HBV 항원을 인코딩하는 적어도 하나의 단일-가닥 RNA 분자를 포함한다. RNA가 숙주의 세포 세포질로 전달되면, 인코딩된 항원은 내인성으로 생성 및 처리되어 DNA 백신과 유사한 체액성 및 세포-매개 면역 반응 둘 모두를 유도한다. RNA 서열은 번역 효율을 향상시키기 위해 코돈 최적화될 수 있다. RNA 분자는, 예를 들어, 적어도 30개의 아데노신 잔기의 폴리 A 테일을 추가하고/하거나; 변형된 리보뉴클레오티드로 5-말단을 캡핑하는 것과 같이 안정성 및/또는 번역을 향상시키기 위해 본 개시내용의 관점에서 당업계에 알려진 임의의 방법에 의해 당업계에 알려진 방법에 의해 변형될 수 있으며, 이는 RNA 합성 동안 혼입되거나 RNA 전사 후에 효소적으로 조작될 수 있다. RNA 백신은 또한 알파바이러스 발현 벡터로부터 개발된 자가-복제 RNA 백신일 수 있다. 자가-복제 RNA 백신은 HBV 항원 RNA의 복제를 제어하는 서브게놈 프로모터에 이어 레플리카제의 다운스트림에 위치한 인공 폴리 A 테일과 함께 알파바이러스 패밀리에 속하는 바이러스로부터 유래한 레플리카제 RNA 분자를 포함한다.
특정 실시양태에서, 애쥬번트는 본 출원의 약제학적 조성물에 포함되거나, 본 출원의 약제학적 조성물과 공동-투여된다. 애쥬번트의 사용은 선택적이며, 조성물이 백신접종 목적으로 사용될 때 면역 반응을 더욱 향상시킬 수 있다. 본 출원에 따라 조성물과 공동 투여 또는 조성물에 포함시키기에 적합한 애쥬번트는 바람직하게는 잠재적으로 안전하고 내약성이 양호하고 인간에게 효과적인 것들이어야 한다. 애쥬번트는 면역 관문 억제제(예를 들어, 항-PD1, 항-TIM-3 등), 톨-유사 수용체 작용제(예를 들어, TLR7 작용제 및/또는 TLR8 작용제), RIG-1 작용제, IL-15 슈퍼작용제(Altor Bioscience), 돌연변이 IRF3 및 IRF7 유전자 애쥬번트, STRING 작용제(Aduro), FLT3L 유전자 애쥬번트, IL-12 유전자 애쥬번트, 및 IL-7-hyFc를 포함하지만 이에 제한되지 않는 소분자 또는 항체일 수 있다.
본 출원은 또한 본 출원의 약제학적 조성물 및 면역원성 조합물을 제조하는 방법을 제공한다. 약제학적 조성물 또는 면역원성 조합물을 제조하는 방법은 본 출원의 HBV 항원, 벡터 및/또는 폴리펩타이드를 인코딩하는 단리된 폴리뉴클레오티드를 하나 이상의 약학적으로 허용되는 담체와 혼합하는 단계를 포함한다. 당업자는 그러한 조성물을 제조하는 데 사용되는 기존의 기술에 익숙할 것이다.
면역 반응을 유도하는 방법
본 출원은 또한 면역원적 유효량의 본 출원의 약제학적 조성물을 대상체에게 투여하는 단계 포함하는, 이를 필요로 하는 대상체에서 B형 간염 바이러스(HBV)에 대한 면역 반응을 유도하는 방법을 제공한다. 본원에 기재된 본 출원의 임의의 약제학적 조성물은 본 출원 방법에 사용될 수 있다.
본원에 사용된 용어 "감염"은 질환을 야기하는 인자에 의한 숙주의 침입을 지칭한다. 질환을 야기하는 인자는 그것이 숙주에 침입하고 숙주 내에서 복제 또는 증식될 수 있을 때 "감염성"인 것으로 간주된다. 감염성 인자(infectious agent)의 예는 바이러스, 예를 들어, HBV 및 특정 종의 아데노바이러스, 프리온, 박테리아, 진균, 원생동물 등을 포함한다. "HBV 감염"은 구체적으로 숙주 유기체, 예컨대, 숙주 유기체의 세포 및 조직의 HBV에 의한 침입을 지칭한다.
본원에 기재된 방법과 관련하여 사용될 때 어구 "면역 반응을 유도하는"은 감염, 예를 들어, HBV 감염에 대해 이를 필요로 하는 대상체에서 원하는 면역 반응 또는 효과를 유발하는 것을 포함한다. "면역 반응을 유도하는"은 또한 병원체(pathogenic agent), 예를 들어 HBV에 대해 치료하기 위한 치료적 면역을 제공하는 것을 포함한다. 본원에 사용된 바와 같이, 용어 "치료적 면역" 또는 "치료적 면역 반응"은 백신접종 대상체가 백신접종이 수행된 병원체에 의한 감염, 예를 들어, HBV 백신으로의 백신접종에 의해 부여된 HBV 감염에 대한 면역을 제어할 수 있음을 의미한다. 일 실시양태에서, "면역 반응을 유도하는 것"은, 예를 들어, HBV 감염과 같은 질환에 대한 치료 효과를 제공하기 위해 이를 필요로 하는 대상체에서 면역을 생성하는 것을 지칭한다. 특정 실시양태에서, "면역 반응을 유도하는 것"은 HBV 감염에 대한 세포 면역, 예를 들어, T 세포 반응을 야기하거나 개선하는 것을 지칭한다. 특정 실시양태에서, "면역 반응을 유도하는 것"은 HBV 감염에 대한 체액성 면역 반응을 야기하거나 개선하는 것을 지칭한다. 특정 실시양태에서, "면역 반응을 유도하는 것"은 HBV 감염에 대한 세포성 및 체액성 면역 반응을 야기하거나 개선하는 것을 지칭한다.
본 출원은 또한 본 출원의 약제학적 조성물을 대상체에게 투여하는 단계를 포함하는, HBV에 대해 대상체를 백신접종하는 방법을 제공한다. 일부 실시양태에서, 대상체의 백신접종은 예방적 백신접종 또는 치료적 백신접종이며, 보다 특히 백신접종은 치료적 백신접종이다. 본 출원은 또한 본 출원의 약제학적 조성물 또는 본 출원의 백신을 대상체에게 투여하는 단계를 포함하는, 대상체에서 HBV의 감염 및/또는 복제를 감소시키는 방법을 제공한다. 본원에 기재된 본 출원의 임의의 약제학적 조성물 또는 백신이 본 출원의 방법에 사용될 수 있다.
본원에 사용된 바와 같이, 용어 "보호 면역" 또는 "보호 면역 반응"은 백신접종된 대상체가 백신접종이 수행된 병원체에 대항하여 감염을 제어할 수 있음을 의미한다. 일반적으로, "보호 면역 반응"이 발생한 대상체는 경증 내지 중등도 임상 증상만을 나타내거나 증상이 전혀 없다. 일반적으로, 특정 작용제에 대해 "보호 면역 반응" 또는 "보호 면역"을 갖는 대상체는 상기 작용제에 의한 감염의 결과로서 사망하지 않을 것이다.
전형적으로, 본 출원의 약제학적 조성물 및 면역원성 조합물의 투여는 HBV 감염 또는 HBV 감염의 특징적인 증상의 발생 후, 예를 들어, 치료적 백신접종을 위해 HBV에 대한 면역 반응을 발생시키는 치료 목적을 가질 것이다.
본원에 사용된 바와 같이, "면역원적 유효량" 또는 "면역학적 유효량"은 이를 필요로 하는 대상체에서 원하는 면역 효과 또는 면역 반응을 유도하기에 충분한 조성물, 폴리뉴클레오티드, 벡터 또는 항원의 양을 의미한다. 면역원적 유효량은 이를 필요로 하는 대상체에서 면역 반응을 유도하기에 충분한 양일 수 있다. 면역원적 유효량은, 예를 들어, HBV 감염과 같은 질환에 대한 치료 효과를 제공하는 것과 같이 이를 필요로 하는 대상체에서 면역을 생성하기에 충분한 양일 수 있다. 면역원적 유효량은 다양한 인자, 예컨대 대상체의 신체 상태, 연령, 체중, 건강 등; 예를 들어, 보호 면역 또는 치료 면역을 제공하는 특정 적용; 면역이 요구되는 특정 질환, 예를 들어, 바이러스 감염에 따라 달라질 수 있다. 면역원적 유효량은 본 개시내용의 관점에서 당업자에 의해 용이하게 결정될 수 있다.
본 출원의 특정 실시양태에서, 면역원적 유효량은 하기 효과 중 1, 2, 3, 4개 또는 그 이상을 달성하기에 충분한 조성물 또는 면역원성 조합물의 양을 지칭한다: (i) HBV 감염 또는 이와 관련된 증상의 중증도를 감소 또는 개선; (ii) HBV 감염 또는 이와 관련된 증상의 지속 기간을 감소; (iii) HBV 감염 또는 이와 관련된 증상의 진행을 예방; (iv) HBV 감염 또는 이와 관련된 증상의 퇴행을 야기; (v) HBV 감염 또는 이와 관련된 증상의 발병(development) 또는 발병(onset)을 예방; (vi) HBV 감염 또는 이와 관련된 증상의 재발을 예방; (vii) HBV 감염을 가진 대상체의 입원 감소; (viii) HBV 감염을 가진 대상체의 입원 기간 감소; (ix) HBV 감염을 가진 대상체의 생존을 증가; (x) 대상체에서 HBV 감염을 제거; (xi) 대상체에서 HBV 복제를 억제 또는 감소; 및/또는 (xii) 또 다른 요법의 예방적 또는 치료적 효과(들)를 증진 또는 향상.
면역원적 유효량은 또한 임상 혈청전환으로의 진전과 일치하는 HBsAg 수준을 감소; 대상체의 면역계에 의한 감염된 간세포의 감소와 관련된 지속적인 HBsAg 제거 달성; HBV-항원 특이적 활성화된 T-세포 집단의 유도; 및/또는 12개월 이내에 HBsAg의 지속적인 손실을 달성하기에 충분한 양일 수 있다. 표적 지수의 예는 HBsAg 국제 단위(IU)의 500개 카피의 임계값 미만의 더 낮은 HBsAg 및/또는 더 높은 CD8 카운트를 포함한다.
일반적인 지침으로서, 핵산 분자, 벡터 또는 RNA 레플리콘과 관련하여 사용될 때 면역원적 유효량은 약 1 μg의 핵산 분자, 벡터 또는 RNA 레플리콘 내지 약 1 mg의 핵산 분자, 벡터 또는 RNA 레플리콘, 예컨대 1 μg, 10 μg, 20 μg, 30 μg, 40 μg, 50 μg, 60 μg, 70 μg, 80 μg, 90 μg, 100 μg, 200 μg, 300 μg, 400 μg, 500 μg, 600 μg, 700 μg, 800 μg, 900 μg 또는 1 mg의 범위일 수 있다. 바람직하게는, 핵산 분자, 벡터, 또는 RNA 레플리콘의 면역원적 유효량은 약 10 μg 내지 약 100 μg이다. 약제학적 조성물에서 핵산 분자, 벡터 또는 RNA 레플리콘과 관련하여 사용될 때 면역원적 유효량은 약 0.01 mg/mL 내지 약 2 mg/mL의 핵산 분자, 벡터 또는 RNA 레플리콘 총합, 예컨대 0.01 mg/mL, 0.02 mg/mL, 0.03 mg/mL, 0.04 mg/mL, 0.05 mg/mL, 0.06 mg/mL, 0.07 mg/mL, 0.08 mg/mL, 0.09 mg/mL, 0.1 mg/mL, 0.25 mg/mL, 0.5 mg/mL, 0.75 mg/mL, 1 mg/mL, 1.5 mg/mL, 또는 2 mg/mL의 농도 범위일 수 있다. 바람직하게는, 핵산 분자, 벡터 또는 RNA 레플리콘의 면역원적 유효량은 1 mg/mL 미만, 보다 바람직하게는 0.05 mg/mL 미만이다. 면역원적 유효량은 하나의 핵산 분자, 벡터 또는 RNA 레플리콘으로부터, 또는 다수의 핵산 분자, 벡터, 또는 RNA 레플리콘으로부터 유래할 수 있다. 면역원적 유효량은 단일 조성물, 또는 다중 조성물, 예컨대 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 조성물(예를 들어, 정제, 캡슐 또는 주사제, 또는 피내 전달, 예를 들어, 피내 전달 패치를 사용한 피내 전달에 적합한 임의의 조성물)로 투여될 수 있으며, 여기서 다중 캡슐 또는 주사제의 투여는 대상체에게 면역원적 유효량을 집합적으로 제공된다. 예를 들어, 2개의 DNA 플라스미드가 사용되는 경우, 면역원적 유효량은 3-4 mg/mL일 수 있으며 각 플라스미드 당 1.5-2 mg/mL일 수 있다. 또한, 면역원적 유효량을 대상체에게 투여하고, 후속적으로 소위 프라임-부스트 용법으로서 동일한 대상체에게 면역원적 유효량의 또 다른 용량을 투여하는 것도 가능하다. 프라임-부스트 용법의 이러한 일반적인 개념은 백신 분야의 숙련된 사람에게 잘 알려져 있다. 추가 부스터 투여는 필요에 따라 용법에 선택적으로 추가될 수 있다.
2개의 벡터, 예를 들어, 제1 HBV 항원을 인코딩하는 제1 벡터 및 제2 HBV 항원을 인코딩하는 제2 벡터를 포함하는 면역원성 조합물은 두 벡터를 혼합하고 혼합물을 단일 해부학적 부위에 전달함으로써 대상체에게 투여될 수 있다. 대안적으로, 각각 단일 발현 벡터를 전달하는 2개의 개별 면역화가 수행될 수 있다. 그러한 실시양태에서, 두 벡터가 단일 면역화에서 2개의 개별 면역화의 혼합물로서 투여되는지 여부에 관계없이, 제1 벡터 및 제2 벡터는 중량 기준으로 10:1 내지 1:10, 예컨대 중량 기준으로 10:1, 9:1, 8:1, 7:1, 6:1, 5:1, 4:1, 3:1, 2:1, 1:1, 1:2, 1:3, 1:4, 1:5, 1:6, 1:7, 1:8, 1:9 또는 1:10의 비율로 투여될 수 있다. 바람직하게는, 제1 및 제2 벡터는 중량 기준으로 1:1의 비율로 투여된다.
바람직하게는, 본 출원의 방법에 따라 치료될 대상체는 HBV-감염 대상체, 특히 만성 HBV 감염을 가진 대상체이다. 급성 HBV 감염은 일반적으로 감염된 간세포의 복제 또는 제거의 성공적인 억제를 초래하는 후속적인 광범위한 적응 반응(예를 들어, HBV-특이적 T-세포, 중화 항체)으로 보완된 선천성 면역계의 효율적인 활성화를 특징으로 한다. 대조적으로, 그러한 반응은 높은 바이러스 및 항원 로딩으로 인해 손상되거나 감소되며, 예를 들어, HBV 외피 단백질은 풍부하게 생성되고, 감염성 바이러스보다 1,000배 초과로 서브바이러스 입자로 방출될 수 있다.
만성 HBV 감염은 바이러스 로딩, 간 효소 수준(괴사 염증 활성), HBeAg 또는 HBsAg 로딩 또는 이들 항원에 대한 항체의 존재를 특징으로 하는 단계로 설명된다. cccDNA 수준은 바이러스혈증이 상당히 다양할 수 있음에도 불구하고 세포 당 약 10 내지 50개의 카피로 비교적 일정하게 유지된다. cccDNA 종의 지속성은 만성으로 이어진다. 보다 구체적으로, 만성 HBV 감염의 단계는 하기를 포함한다: (i) 높은 바이러스 로딩 및 정상 또는 최소로 상승된 간 효소를 특징으로 하는 면역-내성 단계; (ii) 현저하게 상승된 간 효소와 함께 바이러스 복제 수준이 더 낮거나 감소하는 면역 활성화 HBeAg-양성 단계; (iii) HBeAg 혈청전환에 뒤따를 수 있는 혈청 내 낮은 바이러스 로딩 및 정상 간 효소 수준을 갖는 낮은 복제 상태인 비활성 HBsAg 담체 단계; 및 (iv) 바이러스 복제가 간 효소 수준의 수반되는 변동과 함께 주기적으로 (재활성화) 발생하고 프리코어 및/또는 기저 코어 프로모터의 돌연변이가 통상적이어서 HBeAg가 감염된 세포에 의해 생성되지 않는 HBeAg-음성 단계.
본원에 사용된 바와 같이, "만성 HBV 감염"은 6개월 초과 동안 HBV의 검출 가능한 존재를 갖는 대상체를 지칭한다. 만성 HBV 감염을 가진 대상체는 만성 HBV 감염의 임의의 단계에 있을 수 있다. 만성 HBV 감염은 해당 분야에서의 일반적인 의미에 따라 이해된다. 만성 HBV 감염은, 예를 들어, 급성 HBV 감염 후 6개월 초과 동안 HBsAg의 지속성을 특징으로 할 수 있다. 예를 들어, 본원에 언급된 만성 HBV 감염은 질병 통제 예방 센터(CDC)에 의해 발표된 정의를 따르며, 이에 따라 만성 HBV 감염은 다음과 같은 실험실 기준을 특징으로 할 수 있다: (i) B형 간염 핵심 항원에 대한 IgM 항체(IgM 항-HBc)에 대해 음성이고 B형 간염 표면 항원(HBsAg), B형 간염 e 항원(HBeAg) 또는 B형 간염 바이러스 DNA에 대한 핵산 시험에 대해 양성이거나, (ii) HBsAg 또는 HBV DNA에 대한 핵산 시험에 대해 양성이거나, HBeAg에 대해 적어도 6개월 간격으로 2회 양성. 바람직하게는, 면역원적 유효량은 만성 HBV 감염을 치료하기에 충분한 조성물 또는 적용의 면역원성 조합물의 양을 지칭한다.
일부 실시양태에서, 만성 HBV 감염을 가진 대상체는 뉴클레오시드 유사체(NUC) 치료를 받고 있고, NUC가 억제된다. 본원에 사용된 바와 같이, "NUC-억제된"은 적어도 6개월 동안 검출 불가능한 바이러스 수준의 HBV 및 안정한 알라닌 아미노트랜스퍼라제(ALT) 수준을 갖는 대상체를 지칭한다. 뉴클레오시드/뉴클레오티드 유사체 처리의 예는 HBV 폴리머라제 억제제, 예컨대 엔타카비르 및 테노포비르를 포함한다. 바람직하게는, 만성 HBV 감염을 가진 대상체는 진행성 간 섬유증 또는 간경변을 갖지 않는다. 그러한 대상체는 전형적으로 섬유증에 대해 3 미만의 METAVIR 스코어 및 9 kPa 미만의 섬유스캔 결과를 가질 것이다. METAVIR 스코어는 B형 간염 환자의 간 생검에서 조직병리학적 평가를 통해 염증 및 섬유증 정도를 평가하는 데 일반적으로 사용되는 스코어 시스템이다. 스코어링 시스템은 2개의 표준화된 숫자를 할당한다: 하나는 염증 정도를 반영하고 다른 하나는 섬유증 정도를 반영한다.
만성 HBV의 제거 또는 감소는 바이러스-유발 간경변 및 간세포 암종을 포함한 중증 간 질환의 조기 질환 차단을 허용할 수 있는 것으로 여겨진다. 따라서, 본 출원의 방법은 또한 HBV-유발 질환을 치료하기 위한 요법으로서 사용될 수 있다. HBV-유발 질환의 예는 간경변, 암(예를 들어, 간세포 암종), 및 섬유증, 특히 섬유증에 대해 3 이상의 METAVIR 스코어를 특징으로 하는 진행성 섬유증을 포함하지만 이에 제한되지 않는다. 그러한 실시양태에서, 면역원적 유효량은 12개월 이내에 HBsAg의 지속적인 손실 및 임상 질환(예를 들어, 간경변, 간세포 암종 등)의 유의한 감소를 달성하기에 충분한 양이다.
본 출원의 실시양태에 따른 방법은 또 다른 면역원성 제제(예컨대, 또 다른 HBV 항원 또는 기타 항원) 또는 또 다른 항-HBV 제제(예컨대, 뉴클레오시드 유사체 또는 기타 항-HBV 제제)를 본 출원의 약제학적 조성물과 조합하여 이를 필요로 하는 대상체에게 투여하는 단계를 추가로 포함한다. 예를 들어, 또 다른 항-HBV 제제 또는 면역원성 제제는 면역 관문 억제제(예를 들어, 항-PD1, 항-TIM-3 등), 톨-유사 수용체 작용제(예를 들어, TLR7 작용제 및/또는 TLR8 작용제), RIG-1 작용제, IL-15 슈퍼작용제(Altor Bioscience), 돌연변이 IRF3 및 IRF7 유전자 애쥬번트, STING 작용제(Aduro), FLT3L 유전자 애쥬번트, IL-12 유전자 애쥬번트, IL-7-hyFc; HBV env(S-CAR 세포)에 결합하는 CAR-T; 캡시드 조립 조절제; cccDNA 억제제, HBV 폴리머라제 억제제(예를 들어, 엔테카비르 및 테노포비르)를 포함하지만 이에 제한되지 않는 소분자 또는 항체일 수 있다. 하나 또는 다른 항-HBV 활성제는 예를 들어, 소분자, 항체 또는 이의 항원 결합 단편, 폴리펩타이드, 단백질, 또는 핵산일 수 있다.
전달 방법
본 출원의 약제학적 조성물 및 면역원성 조합물은 본 개시의 관점에서 기술분야에 알려져 있는, 비경구 투여(예를 들어, 근육내, 피하, 정맥내 또는 피내 주사), 경구 투여, 경피 투여, 및 비강 투여를 포함하지만 이에 제한되지 않는 임의의 방법에 의해 대상에게 투여될 수 있다. 바람직하게는, 약제학적 조성물 및 면역원성 조합물은 비경구(예를 들어, 근육내 주사 또는 피내 주사에 의해) 또는 경피로 투여된다.
약제학적 조성물 또는 면역원성 조합물이 하나 이상의 DNA 플라스미드를 포함하는 본 출원의 일부 실시양태에서, 투여는 피부를 통한 주사, 예를 들어, 근육내 또는 피내 주사, 바람직하게는 근육내 주사에 의한 것일 수 있다. 근육내 주사는 전기천공, 즉 DNA 플라스미드를 세포로의 전달을 용이하게 하기 위한 전기장의 적용과 조합될 수 있다. 본원에 사용된 바와 같이, 용어 "전기천공"은 생체막에서 미세한 경로(기공)를 유도하기 위해 막관통 전기장 펄스를 사용하는 것을 지칭한다. 생체내 전기천공 동안 적절한 세기와 지속 시간의 전기장을 세포에 적용하여 향상된 세포막 투과성의 일시적인 상태를 유도하여 그 자체로는 세포막을 통과할 수 없는 분자의 세포 흡수를 가능하게 한다. 전기천공에 의한 이러한 공극의 생성은 플라스미드, 올리고뉴클레오티드, siRNA, 약물 등과 같은 생체 분자가 세포막의 한쪽에서 다른 쪽으로 통과하는 것을 용이하게 한다. DNA 백신 전달을 위한 생체내 전기천공은 숙주 세포에 의한 플라스미드 흡수를 유의하게 증가시키는 동시에 주사 부위에서 경증에서 중등도의 염증을 유발하는 것으로 나타났다. 그 결과, 형질감염 효율 및 면역 반응은 기존의 주사와 비교하여 피내 또는 근육내 전기천공에 의해 유의하게 개선된다(예를 들어, 각각 1,000배 및 100배까지).
전형적인 실시양태에서, 전기천공은 근육내 주사와 조합된다. 그러나, 전기천공을 다른 형태의 비경구 투여, 예를 들어, 피내 주사, 피하 주사 등과 조합하는 것도 가능하다.
전기천공을 통한 본 출원의 약제학적 조성물, 면역원성 조합물 또는 백신의 투여는 포유동물의 원하는 조직에 세포막에 가역적 기공을 야기하기에 효과적인 에너지 펄스를 전달하도록 구성될 수 있는 전기천공 장치를 사용하여 달성될 수 있다. 전기천공 장치는 전기천공 구성요소 및 전극 조립체 또는 핸들 조립체를 포함할 수 있다. 전기천공 구성요소는 전기천공 장치의 하기 구성요소 중 하나 이상을 포함할 수 있다: 컨트롤러, 전류 파형 발생기, 임피던스 테스터, 파형 로거(waveform logger), 입력 요소, 상태 보고 요소, 통신 포트, 메모리 구성요소, 전원 및 전원 스위치. 전기천공은 생체내 전기천공 장치를 사용하여 달성될 수 있다. 본 출원의 조성물 및 면역원성 조합물, 특히 DNA 플라스미드를 포함하는 것들의 전달을 용이하게 할 수 있는 전기천공 장치 및 전기천공 방법의 예는 CELLECTRA®(Inovio Pharmaceuticals, Blue Bell, PA), Elgen 전기천공기(Inovio Pharmaceuticals, Inc.), Tri-GridTM 전달 시스템(Ichor Medical Systems, Inc., San Diego, CA 92121) 및 미국 특허 번호 7,664,545호, 미국 특허 번호 8,209,006호, 미국 특허 번호 9,452,285호, 미국 특허 번호 5,273,525호, 미국 특허 번호 6,110,161호, 미국 특허 번호 6,261,281호, 미국 특허 번호 6,958,060호, 및 미국 특허 번호 6,939,862호, 미국 특허 번호 7,328,064호, 미국 특허 번호 6,041,252호, 미국 특허 번호 5,873,849, 미국 특허 번호 6,278,895, 미국 특허 번호 6,319,901, 미국 특허 번호 6,912,417, 미국 특허 번호 8,187,249, 미국 특허 번호 9,364,664, 미국 특허 번호 9,802,035, 미국 특허 번호 6,117,660, 및 국제 특허 출원 공개 WO2017172838에 기재된 것들을 포함하며, 상기 특허 모두는 그 전체가 본원에 참조로 포함된다. 생체내 전기천공 장치의 다른 예는 그 내용은 그 전체가 본원에 참조로 포함된 대리인 문서 번호 688097-405WO로 본 출원과 동일자로 출원된 "B형 간염 바이러스(HBV) 백신의 전달을 위한 방법 및 장치"라는 제목의 국제 특허 출원에 기재되어 있다. 또한, 예를 들어, 본원에 그 전체가 참조로 포함된 미국 특허 번호 6,697,669호에 기재된 바와 같은 펄스 전기장의 사용이 본 출원의 조성물 및 면역원성 조합물의 전달을 위해 적용이 고려된다.
약제학적 조성물 또는 면역원성 조합물이 하나 이상의 DNA 플라스미드를 포함하는 본 출원의 다른 실시양태에서, 투여 방법은 경피이다. 경피 투여는 DNA 플라스미드를 세포로의 전달을 용이하게 하기 위해 표피 피부 마모와 조합될 수 있다. 예를 들어, 피부 패치(dermatological patch)가 표피 피부 마모에 사용될 수 있다. 피부 패치의 제거 시, 조성물 또는 면역원성 조합물이 박리된 피부에 침착될 수 있다.
전달 방법은 상기 기재된 실시양태에 제한되지 않으며, 세포내 전달을 위한 임의의 수단이 사용될 수 있다. 본 출원의 방법에 의해 고려되는 세포내 전달의 다른 방법은 리포좀 캡슐화, 리포플렉스, 나노입자 등을 포함하지만 이에 제한되지 않는다. 예를 들어, 본 출원의 RNA 레플리콘은 하나 이상의 지질 분자, 바람직하게는 양으로 하전된 지질 분자를 포함하는 면역원성 조성물로 제형화될 수 있다. 일부 실시양태에서, 본 개시내용의 RNA 레플리콘은 하나 이상의 리포좀, 리포플렉스, 및/또는 지질 나노입자를 사용하여 제형화될 수 있다. 일부 실시양태에서, 본원에 기재된 리포좀 또는 지질 나노입자 제형은 다가양이온성 조성물을 포함할 수 있다. 일부 실시양태에서, 다가양이온성 조성물을 포함하는 제형은 본원에 기재된 RNA 레플리콘의 생체내 및/또는 시험관내 전달을 위해 사용될 수 있다.
본 발명에 따르면, 용어 "지질"은 유방성(lyotropic) 지질 상, 또는 보다 우선적으로 층상 유방성 상(lamellar lyotropic phase)을 형성할 수 있는 임의의 지방산 유도체 또는 다른 양친매성 화합물을 지칭한다. 특히, 용어 "지질"은 지질 분자의 소수성 부분이 이중층을 향하고 친수성 부분이 수성상을 향하도록 이중층을 형성할 수 있는 임의의 지방산 유도체를 의미한다. 용어 "지질"은 중성, 음이온성 또는 양이온성 지질을 포함한다. 지질은 바람직하게는 적어도 1개, 바람직하게는 2개, 알킬 사슬 또는 콜레스테롤 모이어티 및 극성 헤드 기를 갖는 소수성 도메인을 포함한다. 지질의 소수성 도메인에 있는 지방산의 알킬 사슬은 이중 결합의 특정 길이 또는 수로 제한되지 않는다. 그럼에도 불구하고, 지방산은 10 내지 30개, 바람직하게는 14 내지 25개의 탄소 원자의 길이를 갖는 것이 바람직하다. 지질은 또한 2개의 상이한 지방산을 포함할 수 있다.
본 개시내용의 맥락에서, 지질-기반 전달 비히클은 전형적으로 원하는 RNA 레플리콘을 표적 세포 또는 조직으로 수송하는 역할을 한다. 일부 실시양태에서, 지질-기반 전달 비히클은 본 개시내용의 나노입자 또는 지질 분자의 이중층 및 RNA 레플리콘을 포함한다. 일부 실시양태에서, 지질 이중층은 바람직하게는 중성 지질 또는 중합체를 추가로 포함한다. 용어 "중성 지질"은 선택된 pH에서 하전되지 않은 또는 중성 양쪽이온성 형태로 존재하는 지질 종을 의미한다. 생리학적 pH에서, 그러한 지질은, 예를 들어, 디아실포스파티딜콜린, 디아실포스파티딜에탄올아민, 세라미드, 스핑고미엘린, 세팔린, 콜레스테롤, 세레브로시드 및 디아실글리세롤을 포함한다. 일부 실시양태에서, 지질 제형은 바람직하게는 액체 매질을 포함한다. 일부 실시양태에서, 제형은 바람직하게는 핵산을 추가로 캡슐화한다. 일부 실시양태에서, 지질 제형은 바람직하게는 핵산 및 중성 지질 또는 중합체를 추가로 포함한다. 일부 실시양태에서, 지질 제형은 바람직하게는 핵산을 캡슐화한다.
상기 설명은 지질 제형 내에 캡슐화된 하나 이상의 RNA 레플리콘을 포함하는 지질 제형을 제공한다. 일부 실시양태에서, 지질 제형은 리포좀을 포함한다. 일부 실시양태에서, 지질 제형은 양이온성 리포좀을 포함한다. 일부 실시양태에서, 지질 제형은 지질 나노입자를 포함한다.
일부 실시양태에서, RNA 레플리콘 또는 핵산 분자의 조합은 지질 제형의 RNA 레플리콘 또는 핵산 분자의 조합이 뉴클레아제 분해에 대해 수용액에서 내성이 있도록 지질 제형의 지질 부분 내에 완전히 캡슐화된다. 용어 "완전히 캡슐화된"은 핵산-지질 입자 내의 핵산(예를 들어, RNA 레플리콘)이 유리 RNA를 유의하게 분해하는 혈청 또는 뉴클레아제 분석에 노출된 후에 유의하게 분해되지 않는다는 것을 의미한다. 완전히 캡슐화될 때, 바람직하게는 입자 내 핵산의 25% 미만이 일반적으로 유리 핵산을 100% 분해하는 처리에서 분해되고, 보다 바람직하게는 입자 내 핵산의 10% 미만, 가장 바람직하게는 5% 미만이 분해된다. 본원에 사용된 "완전히 캡슐화된"은 또한 핵산-지질 입자가 생체내 투여시 이들의 구성요소로 빠르게 분해되지 않음을 의미한다. 다른 실시양태에서, 본원에 기재된 지질 제형은 인간과 같은 포유동물에게 실질적으로 무독성이다. 일부 실시양태에서, 핵산의 조합은 동일한 지질 나노입자 내에 캡슐화된다. 일부 실시양태에서, 핵산 분자의 조합에서 각각의 핵산 분자는 개별 지질 나노입자 내에 독립적으로 캡슐화된다.
본 개시내용의 지질 제형은 또한 전형적으로 약 1:1 내지 약 100:1, 약 1:1 내지 약 50:1, 약 2:1 내지 약 45:1, 약 3:1 내지 약 40:1, 약 5:1 내지 약 38:1, 또는 약 6:1 내지 약 40:1, 또는 약 7:1 내지 약 35:1, 또는 약 8:1 내지 약 30:1; 또는 약 10:1 내지 약 25:1; 또는 약 8:1 내지 약 12:1; 또는 약 13:1 내지 약 17:1; 또는 약 18:1 내지 약 24:1; 또는 약 20:1 내지 약 30:1의 총 지질:RNA 비율(질량/질량 비율)을 갖는다. 일부 바람직한 실시양태에서, 총 지질:RNA 비율(질량/질량 비율)은 약 10:1 내지 약 25:1이다. 상기 비율은 종말점을 포함하여 인용된 범위 내의 임의의 값 또는 하위값일 수 있다.
본 개시내용의 지질 제형은 전형적으로 평균 직경이 약 30 nm 내지 약 150 nm, 약 40 nm 내지 약 150 nm, 약 50 nm 내지 약 150 nm, 약 60 nm 내지 약 130 nm, 약 70 nm 내지 약 110 nm, 약 70 nm 내지 약 100 nm, 약 80 nm 내지 약 100 nm, 약 90 nm 내지 약 100 nm, 약 70 내지 약 90 nm, 약 80 nm 내지 약 90 nm, 약 70 nm 내지 약 80 nm, 또는 약 30 nm, 약 35 nm, 약 40 nm, 약 45 nm, 약 50 nm, 약 55 nm, 약 60 nm, 약 65 nm, 약 70 nm, 약 75 nm, 약 80 nm, 약 85 nm, 약 90 nm, 약 95 nm, 약 100 nm, 약 105 nm, 약 110 nm, 약 115 nm, 약 120 nm, 약 125 nm, 약 130 nm, 약 135 nm, 약 140 nm, 약 145 nm, 또는 약 150 nm이고, 실질적으로 무독성이다. 직경은 종말점을 포함하여 인용된 범위 내의 임의의 값 또는 하위값일 수 있다. 또한, 핵산은, 본 개시내용의 지질 나노입자에 존재할 때, 수용액에서 뉴클레아제에 의한 분해에 내성이 있다.
바람직한 실시양태에서, 지질 제형은 RNA 레플리콘 또는 핵산 분자의 조합, 양이온성 지질(예를 들어, 본원에 기재된 하나 이상의 양이온성 지질 또는 이의 염), 인지질, 및 입자의 응집을 억제하는 접합 지질(예를 들어, 하나 이상의 PEG-지질 접합체)을 포함한다. 지질 제형은 또한 콜레스테롤을 포함할 수 있다. 용어 "지질 접합체"는 지질 입자의 응집을 억제하는 접합 지질을 의미한다. 그러한 지질 접합체는, 예를 들어, 디알킬옥시프로필에 결합된 PEG(예를 들어, PEG-DAA 접합체), 디아실글리세롤에 결합된 PEG(예를 들어, PEG-DAG 접합체), 콜레스테롤에 결합된 PEG, 포스파티딜에탄올아민에 결합된 PEG, 및 세라미드에 결합된 PEG와 같은 PEG-지질 접합체, 양이온성 PEG 지질, 폴리옥사졸린(POZ)-지질 접합체, 폴리아미드 올리고머 및 이들의 혼합물을 포함하지만 이에 제한되지 않는다. PEG 또는 POZ는 지질에 직접 접합될 수 있거나 링커 모이어티를 통해 지질에 연결될 수 있다. PEG 또는 POZ를 지질에 결합시키기에 적합한 임의의 링커 모이어티는, 예를 들어, 비-에스테르-함유 링커 모이어티 및 에스테르-함유 링커 모이어티를 포함하여 사용될 수 있다. 특정한 바람직한 실시양태에서, 비-에스테르-함유 링커 모이어티, 예컨대 아미드 또는 카바메이트가 사용된다. 특정한 바람직한 실시양태에서, PEG-지질 접합체는 2-[(폴리에틸렌 글리콜)-2000]-N,N-디테트라데실아세트아미드(즉, ALC-0159)이다.
본원에 사용된 용어 "양이온성 지질"은 양성, 친수성 헤드 기를 갖는 양친매성 지질 및 이의 염; 1, 2, 3개 또는 그 이상의 소수성(즉, 무극성 기를 가짐) 지방산 또는 지방 알킬 사슬; 이들 두 도메인 사이의 커넥터를 지칭한다. 이온화 가능한 또는 양성자화 가능한 양이온성 지질은 전형적으로 이의 pKa 미만의 pH에서 양성자화되고(즉, 양으로 하전되고), pKa 초과의 pH에서 실질적으로 중성이다. 바람직한 이온화 가능한 양이온성 지질은 전형적으로 약 7.4인 생리학적 pH 미만의 pKa를 갖는 것들이다. 본 개시내용의 양이온성 지질은 또한 적정 가능한 양이온성 지질로 지칭될 수 있다. 양이온성 지질은 양성자화 가능한 3차 아민(예를 들어, pH-적정 가능) 헤드 기를 갖는 "아미노 지질"일 수 있다. 일부 아미노 예시적인 아미노 지질은 C18 알킬 사슬을 포함할 수 있으며, 여기서 각각의 알킬 사슬은 독립적으로 0 내지 3개(예를 들어, 0, 1, 2, 또는 3개)의 이중 결합; 및 헤드 기와 알킬 사슬 사이의 에테르, 에스테르 또는 케탈 결합을 갖는다. 그러한 양이온성 지질은 (4-하이드록시부틸)아잔디일)비스(헥산-6,1-디일)비스(2-헥실데카노에이트(ALC-0315로도 알려짐), DOTMA(N-D-(2,3-디올레일옥시) 프로필 N,N,N-트리메틸암모늄 클로라이드)로도 알려진 Lipofectin™, DOTAP(1,2-비스(올레일옥시)-3(트리메틸암모니오)프로판), DDAB(디메틸디옥타데실-암모늄 브로마이드), DOGS(디옥타데실라미돌로글리실 스페르민), DSDMA, DODMA, DLinDMA, DLenDMA, γ-DLenDMA, DLin-K-DMA, DLin-K-C2-DMA(DLin-C2K-DMA, XTC2 및 C2K로도 알려진), DLin-K-C3-DMA, DLin-K-C4-DMA, DLen-C2K-DMA, y-DLen-C2K-DMA, DLin-M-C2-DMA(MC2로도 알려짐), DLin-M-C3-DMA(MC3로도 알려짐), (DLin-MP-DMA) (1-Bl 1로도 알려짐) 및 콜레스테롤 유도체, 예컨대 DCChol(3 베타-(N-(N',N'-디메틸 아미노메탄)-카바모일)콜레스테롤)을 포함하지만 이에 제한되지 않는다. 특정한 바람직한 실시양태에서, 양이온성 지질은 ((4-하이드록시부틸)아잔디일)비스(헥산-6,1-디일)비스(2-헥실데카노에이트), 즉 ALC-0315이다.
본원에 사용된 용어 "음이온성 지질"은 생리학적 pH에서 음으로 하전된 지질을 지칭한다. 이러한 지질은 포스파티딜글리세롤, 카디오리핀, 디아실포스파티딜세린, 디아실포스파티드산, N-도데카노일 포스파티딜에탄올아민, N-석시닐 포스파티딜에탄올아민, N-글루타릴포스파티딜에탄올아민, 리실포스파티딜글리세롤, 팔미토일올레오일포스파티딜글리세롤(POPG) 및 중성 지질에 결합된 다른 음이온 변형기를 포함하지만 이에 제한되지 않는다.
핵산-지질 제형에서, RNA 레플리콘 또는 핵산 분자의 조합은 제형의 지질 부분 내에 완전히 캡슐화되어 뉴클레아제 분해로부터 핵산을 보호할 수 있다. 바람직한 실시양태에서, RNA 레플리콘 또는 핵산 분자의 조합을 포함하는 지질 제형은 지질 제형의 지질 부분 내에 완전히 캡슐화되어, 뉴클레아제 분해로부터 핵산을 보호한다. 특정 경우에, 지질 제형 내의 RNA 레플리콘 또는 핵산 분자의 조합은 입자를 적어도 20, 30, 45, 또는 60분 동안 37℃에서 뉴클레아제에 노출시킨 후에 실질적으로 분해되지 않는다. 특정한 다른 예에서, 지질 제형 내의 RNA 레플리콘 또는 핵산 분자의 조합은 적어도 30, 45, 또는 60분, 또는 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34 또는 36시간 동안 또는 37℃에서 혈청 내 제형의 인큐베이션 후에 실질적으로 분해되지 않는다. 다른 실시양태에서, RNA 레플리콘 또는 핵산 분자의 조합은 제형의 지질 부분과 복합체화된다.
핵산의 맥락에서, 전체 캡슐화는 핵산과 회합될 때 증진된 형광을 갖는 염료를 사용하는 막-불투과성 형광 염료 배제 검정을 수행함으로써 결정될 수 있다. 캡슐화는 염료를 지질 제형에 첨가하고, 생성된 형광을 측정하고, 이를 소량의 비이온성 세제 첨가 시 관찰된 형광과 비교하여 결정된다. 지질층의 세제-매개 파괴는 캡슐화된 핵산을 방출하여 막-불투과성 염료와 상호작용할 수 있게 한다. 핵산 캡슐화는 E = (I0 - I)/I0로서 계산될 수 있으며, 여기서 I 및 I0는 세제 첨가 전후의 형광 강도를 지칭한다.
다른 실시양태에서, 본 개시내용은 복수의 핵산-리포좀, 핵산-양이온성 리포좀, 또는 핵산-지질 나노입자를 포함하는 핵산-지질 조성물을 제공한다. 일부 실시양태에서, 핵산-지질 조성물은 복수의 RNA 레플리콘-리포좀을 포함한다. 일부 실시양태에서, 핵산-지질 조성물은 복수의 RNA 레플리콘-양이온성 리포좀을 포함한다. 일부 실시양태에서, 핵산-지질 조성물은 복수의 RNA 레플리콘-지질 나노입자를 포함한다.
일부 실시양태에서, 지질 제형은 제형의 지질 부분 내에 완전히 캡슐화된 RNA 레플리콘 또는 핵산 분자의 조합을 포함하여, 입자의 약 30% 내지 약 100%, 약 40% 내지 약 100%, 약 50% 내지 약 100%, 약 60% 내지 약 100%, 약 70% 내지 약 100%, 약 80% 내지 약 100%, 약 90% 내지 약 100%, 약 30% 내지 약 95%, 약 40% 내지 약 95%, 약 50% 내지 약 95%, 약 60% 내지 약 95%, 약 70% 내지 약 95%, 약 80% 내지 약 95%, 약 85% 내지 약 95%, 약 90% 내지 약 95%, 약 30% 내지 약 90%, 약 40% 내지 약 90%, 약 50% 내지 약 90%, 약 60% 내지 약 90%, 약 70% 내지 약 90%, 약 80% 내지 약 90%, 또는 적어도 약 30%, 약 35%, 약 40%, 약 45%, 약 50%, 약 55%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98%, 또는 약 99% (또는 이의 임의의 분율 또는 그 안의 범위)가 그 안에 캡슐화된 RNA 레플리콘 또는 핵산 분자의 조합을 갖는다. 양은 종말점을 포함하여 인용된 범위 내의 임의의 값 또는 하위값일 수 있다.
지질 제형의 의도된 용도에 따라, 성분의 비율은 변할 수 있고, 특정 제형의 전달 효율은 당업계에 알려진 검정을 사용하여 측정될 수 있다.
몇몇 실시양태들에 따르면, 본원에 기재된 발현 가능한 폴리뉴클레오티드 및 RNA 레플리콘은 지질로 제형화된다. 지질 제형은 바람직하게는 리포좀, 양이온성 리포좀, 및 지질 나노입자로부터 선택되지만 이에 재한되지 않는다. 하나의 바람직한 실시양태에서, 지질 제형은 하기를 포함하는 양이온성 리포좀 또는 지질 나노입자(LNP)이다:
(a) 본 개시내용의 RNA 레플리콘 또는 핵산 분자의 조합,
(b) 양이온성 지질,
(c) 응집 감소제(예컨대, 폴리에틸렌 글리콜(PEG) 지질 또는 PEG-변형된 지질),
(d) 선택적으로 비-양이온성 지질(예컨대, 중성 지질), 및
(e) 선택적으로 스테롤.
바람직하게는, RNA 레플리콘 또는 핵산 분자의 조합을 캡슐화하는 지질 나노입자는 양이온성 지질, 및 음이온성 지질, 양쪽이온성 지질, 중성 지질, 스테로이드, 중합체 접합 지질, 인지질, 당지질 및 이들의 조합으로 이루어진 군으로부터 선택된 적어도 하나의 다른 지질을 포함한다.
일부 실시양태에서, 양이온성 지질은 이온화 가능한 양이온성 지질이다. 일 실시양태에서, 지질 나노입자 제형은 (i) 적어도 하나의 양이온성 지질; (ii) 헬퍼 지질; (iii) 스테롤(예를 들어, 콜레스테롤); 및 (iv) 약 30% 내지 약 60% 이온화 가능한 양이온성 지질: 약 5% 내지 약 20% 헬퍼 지질: 약 35% 내지 약 50% 스테롤: 약 0.5-5% PEG-지질의 몰비의 PEG-지질로 이루어진다. 예시적인 양이온성 지질(이온화 가능한 양이온성 지질 포함), 헬퍼 지질(예를 들어, 중성 지질), 스테롤 및 리간드-함유 지질(예를 들어, PEG-지질)은 본원에서 하기에 기재되어 있다.
특정 지질 및 이들의 상대적 % 조성물의 선택은 원하는 치료 효과, 의도된 생체내 전달 표적, 및 계획된 투여 용법 및 빈도를 포함하는 몇몇 인자에 의존한다. 일반적으로, 높은 효능(즉, 녹다운 활성 또는 번역 효율과 같은 치료 효과) 및 신속한 조직 제거를 초래하는 생분해성 둘 모두에 상응하는 지질이 가장 바람직하다. 그러나, 생분해성은 대상체 내에서 단지 1회 또는 2회의 투여를 위해 의도된 제형에 대해서는 덜 중요할 수 있다. 또한, 지질 조성물은 지질 제형이 생체내 투여 및 의도된 표적으로의 이의 이동(journey) 동안 이의 모폴로지를 보존하지만, 이어서 표적 세포로의 흡수 시 활성제를 방출할 수 있도록 신중한 조작을 필요로 할 수 있다. 따라서, 활성 성분에 대한 총 지질의 비율뿐만 아니라 지질의 최상의 가능한 몰비에서 지질의 최상의 가능한 조합을 찾기 위해 여러 제형을 평가할 필요가 있다.
적합한 지질 성분 및 지질 나노입자를 제조하는 방법은 당업계에 잘 알려져 있으며, 예를 들어 PCT/US2020/023442, U.S. 8,058,069, U.S. 8,822,668, U.S. 9,738,593, U.S. 9,139,554, PCT/US2014/066242, PCT/US2015/030218, PCT/2017/015886, 및 PCT/US2017/067756에 기재되어 있으며, 이들의 내용은 참조로 포함된다.
양이온성 지질
지질 제형은 바람직하게는 양이온성 리포좀 또는 지질 나노입자를 형성하기에 적합한 양이온성 지질을 포함한다. 양이온성 지질은 음으로 하전된 막에 결합하여 흡수를 유도할 수 있기 때문에 핵산 전달을 위해 널리 연구되고 있다. 일반적으로, 양이온성 지질은 양성 친수성 헤드 기, 2개 (또는 그 이상)의 친유성 테일, 또는 스테로이드 부분과 이들 두 도메인 사이의 커넥터를 포함하는 양친매성 물질이다. 바람직하게는, 양이온성 지질은 약 생리학적 pH에서 순 양전하를 보유한다. 양이온성 리포좀은 전통적으로 플라스미드 DNA, 안티센스 올리고 및 siRNA/소형 헤어핀 RNA-shRNA를 포함한 올리고뉴클레오티드에 가장 일반적으로 사용되는 비-바이러스 전달 시스템이었다. DOTAP, (1,2-디올레오일-3-트리메틸암모늄-프로판) 및 DOTMA(N-[1-(2,3-디올레오일옥시)프로필]-N,N,N-트리메틸-암모늄 메틸 설페이트)와 같은 양이온성 지질은 정전기적 상호작용에 의해 음으로 하전된 핵산과 복합체 또는 리포플렉스를 형성하여 높은 시험관내 형질감염 효율을 제공할 수 있다.
현재 개시된 지질 제형에서, 양이온성 지질은, 예를 들어, ((4-하이드록시부틸)아잔디일)비스(헥산-6,1-디일)비스(2-헥실데카노에이트)(ALC-0315로도 알려짐), N,N-디올레일-N,N-디메틸암모늄 클로라이드(DODAC), N,N-디스테아릴-N,N-디메틸암모늄 브로마이드(DDAB), 1,2-디올레오일트리메틸암모늄프로판 클로라이드(DOTAP) (N-(2,3-디올레오일옥시)프로필로도 알려짐)-N,N,N-트리메틸암모늄 클로라이드 및 1,2-디올레일옥시-3-트리메틸아미노프로판 클로라이드 염), N-(1-(2,3-디올레일옥시)프로필)-N,N,N-트리메틸암모늄 클로라이드(DOTMA), N,N-디메틸-2,3-디올레일옥시)프로필아민(DODMA), 1,2-디리놀레일옥시-N,N-디메틸아미노프로판(DLinDMA), 1,2-디리놀레닐옥시-N,N-디메틸아미노프로판(DLenDMA), 1,2-디-y-리놀레닐옥시-N,N-디메틸아미노프로판(γ-DLenDMA), 1,2-디리놀레일카바모일옥시-3-디메틸아미노프로판(DLin-C-DAP), 1,2-디리놀레일옥시-3-(디메틸아미노)아세톡시프로판(DLin-DAC), 1,2-디리놀레오일-3-디메틸아미노프로판(DLinDAP), 1,2-디리놀레오일티오-3-디메틸아미노프로판(DLin-S-DMA), 1-리놀레오일-2-리놀레일옥시-3-디메틸아미노프로판(DLin-2-DMAP), 1,2-디리놀레일옥시-3-트리메틸아미노프로판 클로라이드 염(DLin-TMA.Cl), 1,2-디리놀레오일-3-트리메틸아미노프로판 클로라이드 염(DLin-TAP.Cl), 1,2-디리놀레일옥시-3-(N-메틸피페라지노)프로판(DLin-MPZ), 또는 3-(N,N-디리놀레일아미노)-1,2-프로판디올(DLinAP), 3-(N,N-디올레일아미노)-1,2-프로판디올(DOAP), 1,2-디리놀레일옥소-3-(2-N,N-디메틸아미노)에톡시프로판(DLin-EG-DMA), 2,2-디리놀레일-4-디메틸아미노메틸-[1,3]-디옥솔란(DLin-K-DMA) 또는 이의 유사체, (3aR,5s,6aS)-N,N-디메틸-2,2-디((9Z,12Z)-옥타데카-9,12-디에닐)테트라하이드로-3aH-사이클로펜타[d][1,3]디옥솔-5-아민, (6Z,9Z,28Z,31Z)-헵타트리아콘타-6,9,28,31-테트라엔-19-일4-(디메틸아미노)부타노에이트(MC3), 1,1'-(2-(4-(2-((2-(비스(2-하이드록시도데실)아미노)에틸)(2-하이드록시도데실)아미노)에틸)피페라진-1-일)에틸아잔디일)디도데칸-2-올(C12-200), 2,2-디리놀레일-4-(2-디메틸아미노에틸)-[1,3]-디옥솔란(DLin-K-C2-DMA), 2,2-디리놀레일-4-디메틸아미노메틸-[1,3]-디옥솔란(DLin-K-DMA), (6Z,9Z,28Z,31Z)-헵타트리아콘타-6,9,28,31-테트라엔-19-일 4-(디메틸아미노)부타노에이트(DLin-M-C3-DMA), 3-((6Z,9Z,28Z,31Z)-헵타트리아콘타-6,9,28,31-테트라엔-19-일옥시)-N,N-디메틸프로판-1-아민(MC3 에테르), 4-((6Z,9Z,28Z,31Z)-헵타트리아콘타-6,9,28,31-테트라엔-19-일옥시)-N,N-디메틸부탄-1-아민(MC4 Ether) 또는 이들의 조합일 수 있다. 다른 양이온성 지질은 N,N-디스테아릴-N,N-디메틸암모늄 브로마이드(DDAB), 3P-(N-(N',N'-디메틸아미노에탄)-카바모일)콜레스테롤(DC-Choi), N-(1-(2,3-디올레일옥시)프로필)-N-2-(스페르민카복스아미도)에틸)-N,N-디메틸암모늄 트리플루오르아세테이트(DOSPA), 디옥타데실아미도글리실 카복시스페민(DOGS), 1,2-딜레오일-sn-3-포스포에탄올아민(DOPE), 1,2-디올레오일-3-디메틸암모늄 프로판(DODAP), N-(1,2-디미리스틸옥시프로프-3-일)-N,N-디메틸-N-하이드록시에틸 암모늄 브로마이드(DMRIE), 및 2,2-디리놀레일-4-디메틸아미노에틸-[1,3]-디옥솔란(XTC)을 포함하지만 이에 제한되지 않는다. 추가적으로, 예를 들어 LIPOFECTIN(GIBCO/BRL에서 입수 가능한 DOTMA 및 DOPE 포함) 및 리포펙타민(GIBCO/BRL에서 입수 가능한 DOSPA 및 DOPE 포함)과 같은 양이온성 지질의 상업적 제제가 사용될 수 있다.
다른 적합한 양이온성 지질은 국제 공개 번호 WO 09/086558, WO 09/127060, WO 10/048536, WO 10/054406, WO 10/088537, WO 10/129709, 및 WO 2011/153493; 미국 특허 공개 번호 2011/0256175, 2012/0128760, 및 2012/0027803; 미국 특허 번호 8,158,601; 및 문헌(Love et al., PNAS, 107(5), 1864-69, 2010)에 개시되어 있으며, 이들의 내용은 본원에 참조로 포함된다.
다른 적합한 양이온성 지질은 알킬 치환기가 상이한 것들(예를 들어, N-에틸-N-메틸아미노-, 및 N-프로필-N-에틸아미노-)을 포함하는 대안적인 지방산 기 및 다른 디알킬아미노 기를 갖는 것들을 포함한다. 이러한 지질은 아미노 지질로 지칭되는 양이온성 지질의 하위범주의 일부이다. 본원에 기재된 지질 제형의 일부 실시양태에서, 양이온성 지질은 아미노 지질이다. 일반적으로, 덜 포화된 아실 사슬을 갖는 아미노 지질은 특히 복합체가 필터 살균 목적을 위해 약 0.3 미크론 미만으로 크기가 조정되어야 하는 경우에 보다 쉽게 크기가 조정된다. C14 내지 C22 범위의 탄소 사슬 길이를 갖는 불포화 지방산을 함유하는 아미노 지질이 사용될 수 있다. 다른 스캐폴드는 또한 아미노 기와 아미노 지질의 지방산 또는 지방 알킬 부분을 분리하는 데 사용될 수 있다.
일부 실시양태에서, 지질 제형은 특허 출원 PCT/EP2017/064066에 따른 화학식 I을 갖는 양이온성 지질을 포함한다. 이와 관련하여, PCT/EP2017/064066의 개시내용 또한 본원에 참조로 포함된다.
일부 실시양태에서, 본 개시내용의 아미노 또는 양이온성 지질은 이온화 가능하고, 적어도 하나의 양성자화 가능한 기 또는 탈양성자화 가능한 기를 가져서, 지질은 생리학적 pH 이하의 pH(예를 들어, pH 7.4)에서 양으로 하전되고, 제2 pH, 바람직하게는 생리학적 pH 이상에서는 중성이다. 물론, pH의 함수로서 양성자의 추가 또는 제거는 평형 과정이며, 하전을 띤 지질 또는 중성 지질에 대한 언급은 우세한 종의 성질을 지칭하며 모든 지질은 하전을 띤 형태 또는 중성 형태로 존재할 것을 필요로 하지 않는다는 것이 이해될 것이다. 하나 초과의 양성자화 가능한 기 또는 탈양성자화 가능한 기를 갖거나 양쪽이온성인 지질은 본 개시내용에서의 사용에서 배제되지 않는다. 특정 실시양태에서, 양성자화 가능한 지질은 약 4 내지 약 11의 범위의 양성자화 가능한 기의 pKa를 갖는다. 일부 실시양태에서, 이온화 가능한 양이온성 지질은 약 5 내지 약 7의 pKa를 갖는다. 일부 실시양태에서, 이온화 가능한 양이온성 지질의 pKa는 약 6 내지 약 7이다.
일부 실시양태에서, 지질 제형은 화학식 I의 이온화 가능한 양이온성 지질 또는 이의 약학적으로 허용되는 염 또는 용매화물을 포함한다:
[화학식 I]
Figure pct00001
상기 식에서, R5 및 R6은 각각 독립적으로 선형 또는 분지형 C1-C31 알킬, C2-C31 알케닐 또는 C2-C31 알키닐 및 콜레스테릴로 이루어진 군으로부터 선택되고; L5 및 L6은 각각 독립적으로 선형 C1-C20 알킬 및 C2-C20 알케닐로 이루어진 군으로부터 선택되고; X5는 -C(O)O-이며 이에 따라 -C(O)O-R6이 형성되거나, -OC(O)-이며 이에 따라 -OC(O)-R6이 형성되고; X6은 -C(O)O-이며 이에 따라 -C(O)O-R5가 형성되거나, -OC(O)-이며 이에 따라 -OC(O)-R5가 형성되고; X7은 S 또는 O이고; L7은 부재이거나 저급 알킬이고; R4는 선형 또는 분지형 C1-C6 알킬이고; R7 및 R8은 각각 독립적으로 수소 및 선형 또는 분지형 C1-C6 알킬로 이루어진 군으로부터 선택된다.
일부 실시양태에서, X7은 S이다.
일부 실시양태에서, X5는 -C(O)O-이며 이에 따라 -C(O)O-R6이 형성되고, X6은 -C(O)O-이며 이에 따라 -C(O)O-R5가 형성된다.
일부 실시양태에서, R7 및 R8은 각각 독립적으로 메틸, 에틸 및 이소프로필로 이루어진 군으로부터 선택된다.
일부 실시양태에서, L5 및 L6은 각각 독립적으로 C1-C10 알킬이다. 일부 실시양태에서, L5는 C1-C3 알킬이고, L6은 C1-C5 알킬이다. 일부 실시양태에서, L6은 C1-C2 알킬이다. 일부 실시양태에서, L5  및 L6은 각각 선형 C7 알킬이다. 일부 실시양태에서, L5 및 L6은 각각 선형 C9 알킬이다.
일부 실시양태에서, R5 및 R6은 각각 독립적으로 알케닐이다. 일부 실시양태에서, R6은 알케닐이다. 일부 실시양태에서, R6은 C2-C9 알케닐이다. 일부 실시양태에서, 알케닐은 단일 이중 결합을 포함한다. 일부 실시양태에서, R5 및 R6은 각각 알킬이다. 일부 실시양태에서, R5는 분지형 알킬이다. 일부 실시양태에서, R55 및 R6은 각각 독립적으로 C9 알킬, C9 알케닐 및 C9 알키닐로 이루어진 군으로부터 선택된다. 일부 실시양태에서, R5 및 R6은 각각 독립적으로 C11 알킬, C11 알케닐 및 C11 알키닐로 이루어진 군으로부터 선택된다. 일부 실시양태에서, R5  및 R6은 각각 독립적으로 C7 알킬, C7 알케닐 및 C7 알키닐로 이루어진 군으로부터 선택된다. 일부 실시양태에서, R5는 -CH((CH2)pCH3)2 또는 -CH((CH2)pCH3)((CH2)p-1CH3)이고, 여기서 p는 4-8이다. 일부 실시양태에서, p는 5이고, L5는 C1-C3 알킬이다. 일부 실시양태에서, p는 6이고, L5는 C3 알킬이다. 일부 실시양태에서, p는 7이다. 일부 실시양태에서, p는 8이고, L5는 C1-C3 알킬이다. 일부 실시양태에서, R5는 -CH((CH2)pCH3)((CH2)p-1CH3)로 이루어지고, 여기서 p는 7 또는 8이다.
일부 실시양태에서, R4는 에틸렌 또는 프로필렌이다. 일부 실시양태에서, R4는 n-프로필렌 또는 이소부틸렌이다.
일부 실시양태에서, L7은 부재이고, R4는 에틸렌이고, X7은 S이고, R7  및 R8은 각각 메틸이다. 일부 실시양태에서, L7은 부재이고, R4는 n-프로필렌이고, X7은 S이고, R7  및 R8은 각각 메틸이다. 일부 실시양태에서, L7은 부재이고, R4는 에틸렌이고, X7은 S이고, R7  및 R8은 각각 에틸이다.
일부 실시양태에서, X7은 S이고, X5는 -C(O)O-이며 이에 따라 -C(O)O-R6이 형성되고 X6은 -C(O)O-이며 이에 따라 -C(O)O-R5가 형성되고, L5 및 L6은 각각 독립적으로 선형 C3-C7 알킬이고, L7은 부재이고, R5는 -CH((CH2)pCH3)2이고, R6은 C7-C12 알케닐이다. 일부 추가의 실시양태에서, p는 6이고, R6은 C9 알케닐이다.
일부 실시양태에서, 지질 제형은 하기로 이루어진 군으로부터 선택된 이온화 가능한 양이온성 지질을 포함한다:
Figure pct00002
Figure pct00003
Figure pct00004
Figure pct00005
Figure pct00006
Figure pct00007
Figure pct00008
Figure pct00009
.
일부 실시양태에서, 본원에 인용된 임의의 하나 이상의 지질은 명시적으로 배제될 수 있다.
헬퍼 지질 및 스테롤
본 개시내용의 RNA 레플리콘-지질 제형은 중성 지질, 중성 헬퍼 지질, 비-양이온성 지질, 비-양이온성 헬퍼 지질, 음이온성 지질, 음이온성 헬퍼 지질, 또는 양쪽이온성 지질로서 지칭될 수 있는 헬퍼 지질을 포함할 수 있다. 지질 제형, 특히 양이온성 리포좀 및 지질 나노입자는 헬퍼 지질이 제형에 존재하는 경우 세포 흡수를 증가시키는 것으로 밝혀졌다(Curr. Drug Metab. 2014; 15(9):882-92). 예를 들어, 일부 연구에서는 양쪽이온성 지질보다 더 융합성(fusogenic)인(즉, 융합을 촉진함) 1,2-디올레오일-sn-글리세로-3-포스파티딜콜린(DOPC), 디-올레오일-포스파티딜-에탄올알라민(DOPE) 및 1,2-디스테아로일-sn-글리세로-3-포스포콜린(DSPC)과 같은 중성 및 양쪽이온성 지질이 지질-핵산 복합체의 다형성 특징에 영향을 미쳐 층상에서 육방상으로의 전이를 촉진하여 융합 및 세포막 분열을 유도할 수 있는 것을 나타내었다(Nanomedicine (Lond). 2014 Jan; 9(1):105-20). 또한, 헬퍼 지질의 사용은 독성 및 면역원성과 같은 널리 퍼진 많은 양이온성 지질을 사용함으로써 임의의 잠재적인 해로운 영향을 감소시키는 데 도움이 될 수 있다.
본 개시내용의 지질 제형에 적합한 비-양이온성 지질의 비제한적인 예는 인지질, 예컨대 레시틴, 포스파티딜에탄올아민, 리소레시틴, 리소포스파티딜에탄올아민, 포스파티딜세린, 포스파티딜이노시톨, 스핑고미엘린, 에그 스핑고미엘린(ESM), 세팔린, 카디오리핀, 포스파티드산, 세레브로사이드, 디세틸포스페이트, 디스테아로일포스파티딜콜린(DSPC), 디올레오일포스파티딜콜린(DOPC), 디팔미토일포스파티딜콜린(DPPC), 디올레오일포스파티딜글리세롤(DOPG), 디팔미토일포스파티딜글리세롤(DPPG), 디올레오일포스파티딜에탄올아민(DOPE), 팔미토일올레오일-포스파티딜콜린(POPC), 팔미토일올레오일-포스파티딜에탄올아민(POPE), 팔미토일올레오일-포스파티딜글리세롤(POPG), 디올레오일포스파티딜에탄올아민 4-(N-말레이미도메틸)-사이클로헥산-1-카복실레이트(DOPE-mal), 디팔미토일-포스파티딜에탄올아민(DPPE), 디미리스토일-포스파티딜에탄올아민(DMPE), 디스테아로일-포스파티딜에탄올아민(DSPE), 모노메틸-포스파티딜에탄올아민, 디메틸-포스파티딜에탄올아민, 디엘라이도일-포스파티딜에탄올아민(DEPE), 스테아로일올레오일-포스파티딜에탄올아민(SOPE), 리소포스파티딜콜린, 디리놀레오일포스파티딜콜린 및 이들의 혼합물을 포함한다. 기타 디아실포스파티딜콜린 및 디아실포스파티딜에탄올아민 인지질도 사용될 수 있다. 이들 지질 내의 아실 기는 바람직하게는 C10-C24 탄소 사슬을 갖는 지방산으로부터 유도된 아실 기, 예를 들어, 라우로일, 미리스토일, 팔미토일, 스테아로일, 또는 올레오일이다.
비-양이온성 지질의 추가의 예는 스테롤, 예컨대 콜레스테롤 및 이의 유도체를 포함한다. 한 연구에서는 헬퍼 지질로서 콜레스테롤이 핵산과 접촉하는 지질층의 전하 간격을 증가시켜 전하 분포가 핵산의 전하 분포와 더 밀접하도록 만든다고 결론지었다(J. R. Soc. Interface. 2012 Mar 7; 9(68): 548-561). 콜레스테롤 유도체의 비제한적인 예는 극성 유사체, 예컨대 5α-콜레스타놀, 5α-코프로스타놀, 콜레스테릴-(2'-하이드록시)-에틸 에테르, 콜레스테릴-(4'-하이드록시)-부틸 에테르, 및 6-케토콜레스타놀; 비극성 유사체, 예컨대 5α-콜레스탄, 콜레스테논, 5α-콜레스타논, 5α-콜레스타논, 및 콜레스테릴 데카노에이트; 및 이들의 혼합물을 포함한다. 바람직한 실시양태에서, 콜레스테롤 유도체는 극성 유사체, 예컨대 콜레스테릴-(4'-하이드록시)-부틸 에테르이다.
일부 실시양태에서, 지질 제형에 존재하는 헬퍼 지질은 하나 이상의 인지질과 콜레스테롤 또는 이의 유도체의 혼합물을 포함하거나 이로 이루어진다. 다른 실시양태에서, 지질 제형에 존재하는 헬퍼 지질은 하나 이상의 인지질, 예를 들어 콜레스테롤 비함유 지질 제형을 포함하거나 이로 이루어진다. 또 다른 실시양태에서, 지질 제형에 존재하는 헬퍼 지질은 콜레스테롤 또는 이의 유도체, 예를 들어, 인지질 비함유 지질 제형을 포함하거나 이로 이루어진다.
헬퍼 지질의 다른 예는 예를 들어, 스테아릴아민, 도데실아민, 헥사데실아민, 아세틸 팔미테이트, 글리세롤 리시놀레이트, 헥사데실 스테아레이트, 이소프로필 미리스테이트, 양쪽성 아크릴 중합체, 트리에탄올아민-라우릴 설페이트, 알킬-아릴 설페이트 폴리에틸옥실화 지방산 아미드, 디옥타데실디메틸암모늄 브로마이드, 세라마이드 및 스핑고미엘린과 같은 비-인 함유 지질을 포함한다.
일부 실시양태에서, 헬퍼 지질은 지질 제형에 존재하는 총 지질의 약 30 mol% 내지 약 60 mol%, 약 32 mol% 내지 약 58 mol%, 약 34 mol% 내지 약 56 mol%, 약 35 mol% 내지 약 54 mol%, 약 36 mol% 내지 약 52 mol%, 약 37 mol% 내지 약 51 mol%, 약 38 mol% 내지 약 50 mol%, 또는 약 39 mol%, 약 50 mol%, 약 41 mol%, 약 42 mol%, 약 43 mol%, 약 44 mol%, 약 45 mol%, 약 46 mol%, 약 47 mol%, 약 48 mol%, 또는 약 49 mol% (또는 이의 임의의 분율 또는 그 안의 범위)를 구성한다.
일부 실시양태에서, 제형 중 헬퍼 지질의 총량은 2개 초과의 헬퍼 지질을 포함하고 헬퍼 지질의 총량은 지질 제형에 존재하는 총 지질의 약 30 mol% 내지 약 60 mol%, 약 32 mol% 내지 약 58 mol%, 약 34 mol% 내지 약 56 mol%, 약 35 mol% 내지 약 54 mol%, 약 36 mol% 내지 약 52 mol%, 약 37 mol% 내지 약 51 mol%, 약 38 mol% 내지 약 50 mol%, 또는 약 39 mol%, 약 50 mol%, 약 41 mol%, 약 42 mol%, 약 43 mol%, 약 44 mol%, 약 45 mol%, 약 46 mol%, 약 47 mol%, 약 48 mol%, 또는 약 49 mol% (또는 이의 임의의 분율 또는 그 안의 범위)를 포함한다. 일부 실시양태에서, 헬퍼 지질은 DSPC와 DOTAP의 조합이다. 일부 실시양태에서, 헬퍼 지질은 DSPC와 DOTMA의 조합이다.
지질 제형 중 콜레스테롤 또는 콜레스테롤 유도체는 지질 제형에 존재하는 총 지질의 약 50 mol%, 약 35 mol%, 약 40 mol%, 약 45 mol% 또는 약 50 mol% 이하를 구성할 수 있다. 일부 실시양태에서, 콜레스테롤 또는 콜레스테롤 유도체는 지질 제형에 존재하는 총 지질의 약 15 mol% 내지 약 45 mol%, 약 20 mol% 내지 약 45 mol%, 약 30 mol% 내지 약 45 mol%, 또는 약 35 mol%, 약 36 mol%, 약 37 mol%, 약 38 mol%, 약 39 mol%, 약 40 mol%, 약 41 mol%, 약 42 mol%, 약 43 mol%, 약 44 mol%, 또는 약 45 mol%를 구성한다.
지질 제형에 존재하는 헬퍼 지질의 백분율은 목표량이며 제형에 존재하는 헬퍼 지질의 실제 양은 예를 들어 ± 5 mol%까지 변할 수 있다.
양이온성 지질 화합물 또는 이온화 가능한 양이온성 지질 화합물을 함유하는 지질 제형은 몰 기준으로 약 30-60%의 양이온성 지질 화합물, 약 35-50%의 콜레스테롤, 약 5-20%의 헬퍼 지질, 및 약 0.5-5%의 폴리에틸렌 글리콜(PEG) 지질일 수 있으며, 여기서 퍼센트는 제형에 존재하는 총 지질의 퍼센트이다. 일부 실시양태에서, 조성물은 약 40-50%의 양이온성 지질 화합물, 약 35-45%의 콜레스테롤, 약 5-15%의 헬퍼 지질, 및 약 0.5-3%의 PEG 지질이며, 여기서 퍼센트는 제형에 존재하는 총 지질의 퍼센트이다.
지질 접합체
본원에 기재된 지질 제형은 지질 접합체를 추가로 포함할 수 있다. 접합 지질은 입자의 응집을 방지하는데 유용하다. 적합한 접합 지질은 PEG-지질 접합체, 양이온성-중합체-지질 접합체, 및 이들의 혼합물을 포함하지만 이에 제한되지는 않는다. 또한, 지질 전달 비히클은 리간드(예를 들어, 항체, 펩타이드 및 탄수화물)를 이의 표면 또는 부착된 PEG 사슬의 말단에 부착시킴으로써 특이적 표적화에 사용될 수 있다(Front. Pharmacol. 2015 Dec 1; 6:286).
바람직한 실시양태에서, 지질 접합체는 PEG-지질이다. 폴리에틸렌 글리콜(PEG)을 코팅 또는 표면 리간드로서 지질 제형에 포함시키는 것은, 페길화로 지칭되는 기술로서, 면역계로부터 나노입자를 보호하고 RES 흡수로부터 벗어나는 데 도움이 된다(Nanomedicine (Lond). 2011 Jun; 6(4):715-28). 페길화는 물리적, 화학적 및 생물학적 메커니즘을 통해 지질 제형 및 이들의 페이로드를 안정화시키는 데 널리 사용되었다. 세제-유사 PEG 지질(예를 들어, PEG-DSPE)은 지질 제형에 들어가 표면 상에 수화된 층과 입체 장벽을 형성할 수 있다. 페길화의 정도에 따라, 표면층은 일반적으로 브러시-유사 층과 버섯-유사 층의 두 가지 유형으로 나눌 수 있다. PEG-DSPE-안정화된 제형의 경우, PEG는 낮은 페길화 정도(일반적으로 5 mol% 미만)에서 버섯 형태를 취할 것이고, PEG-DSPE의 함량이 일정 수준 이상으로 증가함에 따라 브러시 형태로 전환될 것이다(J. Nanomaterials. 2011;2011:12). 증가된 페길화는 지질 제형의 순환 반감기의 유의한 증가를 유발하는 것으로 나타났다(Annu. Rev. Biomed. Eng. 2011 Aug 15; 13:507-30; J. Control Release. 2010 Aug 3; 145(3):178-81).
PEG-지질의 적합한 예는 디알킬옥시프로필에 결합된 PEG(PEG-DAA), 디아실글리세롤에 결합된 PEG(PEG-DAG), 인지질에 결합된 PEG, 예컨대 포스파티딜에탄올아민(PEG-PE), 세라미드에 접합된 PEG, 콜레스테롤에 접합된 PEG 또는 이들의 유도체, 및 이들의 혼합물을 포함하지만 이에 제한되지 않는다.
PEG는 2개의 말단 하이드록실 기를 갖는 에틸렌 PEG 반복 단위의 선형 수용성 중합체이다. PEG는 이들의 분자량에 따라 분류되며 하기를 포함하다: 모노메톡시폴리에틸렌 글리콜(MePEG-OH), 모노메톡시폴리에틸렌 글리콜-석시네이트(MePEG-S), 모노메톡시폴리에틸렌 글리콜-석신이미딜 석시네이트(MePEG-S-NHS), 모노메톡시폴리에틸렌 글리콜-아민(MePEG-NH2), 모노메톡시폴리에틸렌 글리콜-트레실레이트(MePEG-TRES), 모노메톡시폴리에틸렌 글리콜-이미다졸릴-카보닐(MePEG-IM)뿐만 아니라 말단 메톡시 기 대신 말단 하이드록실 기를 포함하는 그러한 화합물(예를 들어, HO-PEG-S, HO-PEG-S-NHS, HO-PEG-NH2).
본원에 기재된 PEG-지질 접합체의 PEG 모이어티는 약 550 달톤 내지 약 10,000 달톤 범위의 평균 분자량을 포함할 수 있다. 특정 경우에, PEG 모이어티는 약 750 달톤 내지 약 5,000 달톤(예를 들어, 약 1,000 달톤 내지 약 5,000 달톤, 약 1,500 달톤 내지 약 3,000 달톤, 약 750 달톤 내지 약 3,000 달톤, 약 750 달톤 내지 약 2,000 달톤)의 평균 분자량을 갖는다. 바람직한 실시양태에서, PEG 모이어티는 약 2,000 달톤 또는 약 750 달톤의 평균 분자량을 갖는다. 평균 분자량은 종말점을 포함하여 인용된 범위 내의 임의의 값 또는 하위값일 수 있다.
특정 경우에, PEG 단량체는 알킬, 알콕시, 아실, 또는 아릴 기에 의해 선택적으로 치환될 수 있다. PEG는 지질에 직접 접합될 수 있거나, 링커 모이어티를 통해 지질에 연결될 수 있다. 예를 들어, 비-에스테르-함유 링커 모이어티 및 에스테르-함유 링커 모이어티를 포함하여 PEG를 지질에 결합시키기에 적합한 임의의 링커 모이어티가 사용될 수 있다. 바람직한 실시양태에서, 링커 모이어티는 비-에스테르-함유 링커 모이어티이다. 적합한 비-에스테르-함유 링커 모이어티는 아미도(-C(O)NH-), 아미노(-NR-), 카보닐(-C(O)-), 카바메이트(-NHC(O)O-), 우레아(-NHC(O)NH-), 디설파이드(-S-S-), 에테르(-O-), 석시닐(-(O)CCH2CH2C(O)-), 석신아미딜(-NHC(O)CH2CH2C(O)NH-), 에테르 및 이들의 조합(예컨대, 카바메이트 링커 모이어티와 아미도 링커 모이어티 둘 모두를 포함하는 링커)을 포함하지만 이에 제한되지 않는다. 바람직한 실시양태에서, 카바메이트 링커는 PEG를 지질에 결합시키는데 사용된다.
다른 실시양태에서, 에스테르-함유 링커 모이어티는 PEG를 지질에 결합시키는 데 사용된다. 적합한 에스테르-함유 링커 모이어티는, 예를 들어, 카보네이트(-OC(O)O-), 석시노일, 포스페이트 에스테르(-O-(O)POH-O-), 설포네이트 에스테르, 및 이들의 조합을 포함한다.
다양한 사슬 길이 및 포화도의 다양한 아실 사슬 기를 갖는 포스파티딜에탄올아민은 PEG에 접합되어 지질 접합체를 형성할 수 있다. 그러한 포스파티딜에탄올아민은 상업적으로 입수 가능하거나, 당업자에게 공지된 기존의 기술을 사용하여 단리 또는 합성될 수 있다. C10 내지 C20 범위의 탄소 사슬 길이를 갖는 포화 또는 불포화 지방산을 함유하는 포스파티딜에탄올아민이 바람직하다. 모노- 또는 디-불포화 지방산 및 포화 및 불포화 지방산의 혼합물을 갖는 포스파티딜에탄올아민이 또한 사용될 수 있다. 적합한 포스파티딜에탄올아민은 디미리스토일-포스파티딜에탄올아민(DMPE), 디팔미토일-포스파티딜에탄올아민(DPPE), 디올레오일-포스파티딜에탄올아민(DOPE), 및 디스테아로일-포스파티딜에탄올아민(DSPE)을 포함하지만 이에 제한되지 않는다.
일부 실시양태에서, PEG-DAA 접합체는 PEG-디데실옥시프로필(C10) 접합체, PEG-디라우릴옥시프로필(C12) 접합체, PEG-디미리스틸옥시프로필(C14) 접합체, PEG-디팔미틸옥시프로필(C16) 접합체, 또는 PEG-디스테아릴옥시프로필(C18) 접합체이다. 이들 실시양태에서, PEG는 바람직하게는 약 750 내지 약 2,000 달톤의 평균 분자량을 갖는다. 특정 실시양태에서, PEG의 말단 하이드록실 기는 메틸기로 치환된다.
전술한 것 이외에, PEG 대신에 다른 친수성 중합체가 사용될 수 있다. PEG 대신에 사용될 수 있는 적합한 중합체의 예는 폴리비닐피롤리돈, 폴리메틸옥사졸린, 폴리에틸옥사졸린, 폴리하이드록시프로필, 메타크릴아미드, 폴리메타크릴아미드, 및 폴리디메틸아크릴아미드, 폴리락트산, 폴리글리콜산, 및 유도체화된 셀룰로스, 예컨대 하이드록시메틸셀룰로스 또는 하이드록시에틸셀룰로스를 포함하지만 이에 제한되지 않는다.
일부 실시양태에서, 지질 접합체(예를 들어, PEG-지질)는 지질 제형에 존재하는 총 지질의 약 0.1 mol% 내지 약 2 mol%, 약 0.5 mol% 내지 약 2 mol%, 약 1 mol% 내지 약 2 mol%, 약 0.6 mol% 내지 약 1.9 mol%, 약 0.7 mol% 내지 약 1.8 mol%, 약 0.8 mol% 내지 약 1.7 mol%, 약 0.9 mol% 내지 약 1.6 mol%, 약 0.9 mol% 내지 약 1.8 mol%, 약 1 mol% 내지 약 1.8 mol%, 약 1 mol% 내지 약 1.7 mol%, 약 1.2 mol% 내지 약 1.8 mol%, 약 1.2 mol% 내지 약 1.7 mol%, 약 1.3 mol% 내지 약 1.6 mol%, 또는 약 1.4 mol% 내지 약 1.6 mol% (또는 이의 임의의 분율 또는 그 안의 범위)를 구성한다. 다른 실시양태에서, 지질 접합체(예를 들어, PEG-지질)는 지질 제형에 존재하는 총 지질의 약 0.5%, 0.6%, 0.7%, 0.8%, 0.9%, 1.0%, 1.2%, 1.3%, 1.4%, 1.5%, 1.6%, 1.7%, 1.8%, 1.9%, 2.0%, 2.5%, 3.0%, 3.5%, 4.0%, 4.5%, 또는 5%, (또는 이의 임의의 분율 또는 그 안의 범위)를 구성한다. 양은 종말점을 포함하여 인용된 범위 내의 임의의 값 또는 하위값일 수 있다.
일부 실시양태에서, PEG-지질은 PEG550-PE이다. 일부 실시양태에서, PEG-지질은 PEG750-PE이다. 일부 실시양태에서, PEG-지질은 PEG2000-DMG이다. 일부 바람직한 실시양태에서, PEG-지질은 2-[(폴리에틸렌 글리콜)-2000]-N,N-디테트라데실아세트아미드(ALC-0159로도 알려짐)이다.
본 개시내용의 지질 제형에 존재하는 지질 접합체(예를 들어, PEG-지질)의 백분율은 목표량이고, 제형에 존재하는 지질 접합체의 실제 양은, 예를 들어, ± 0.5 mol%까지 변할 수 있다. 당업자는 지질 접합체의 농도가 사용된 지질 접합체 및 지질 제형이 융합성이 되는 속도에 따라 변할 수 있다는 것을 이해할 것이다.
지질 제형의 세포 흡수에 대한 작용 메커니즘
핵산, 특히 리포좀, 양이온성 리포좀 및 지질 나노입자의 세포내 전달을 위한 지질 제형은 지질 전달 비히클의 내용물이 표적 세포의 세포질로 전달되는 표적 세포의 세포내이입(endocytic) 메커니즘의 이용을 통해 표적 세포에 침투함으로써 세포 흡수를 위해 설계된다(Nucleic Acid Therapeutics, 28(3):146-157, 2018). 구체적으로, 본원에 기재된 간세포를 표적으로 하는 RNA 레플리콘-지질 제형의 경우, mRNA-지질 제형은 수용체 매개 엔도사이토시스를 통해 간세포로 진입한다. 엔도사이토시스 전에, 지질 전달 비히클의 표면에서 PEG-지질과 같은 기능화된 리간드가 표면으로부터 떨어져 나와, 표적 세포로의 내재화를 촉발한다. 엔도사이토시스 동안, 세포의 원형질막의 일부는 벡터를 둘러싸고 그것을 소포에 집어넣은 다음, 세포막으로부터 떼어내 세포질로 들어가 궁극적으로 엔도리소좀 경로를 겪는다. 이온화 가능한 양이온성 지질-함유 전달 비히클의 경우, 엔도좀이 에이징함에 따라 증가된 산성도는 표면에 강한 양전하를 갖는 비히클을 초래한다. 이어서, 전달 비히클과 엔도좀 막 사이의 상호작용은 페이로드의 세포질 전달을 유발하는 막 융합 이벤트를 초래한다. RNA 페이로드의 경우, 세포 자체의 내부 번역 과정은 이어서 RNA 레플리콘 또는 핵산 분자의 조합을 인코딩된 단백질(예를 들어, HBV 항원)로 번역할 것이다. 인코딩된 단백질은 표적화된 세포기관 또는 세포 내 위치로의 수송을 포함하여 번역후 처리를 추가로 거칠 수 있다.
지질 접합체의 조성 및 농도를 제어함으로써, 지질 접합체가 지질 제형 밖으로 교환되는 속도 및 차례로 지질 제형이 융합성이 되는 속도를 조절할 수 있다. 또한, 예를 들어, pH, 온도, 또는 이온 강도를 포함하는 다른 변수를 사용하여 지질 제형이 융합성이 되는 속도를 변경 및/또는 조절할 수 있다. 지질 제형이 융합성이 되는 속도를 조절하기 위해 사용될 수 있는 다른 방법은 본 개시내용을 판독할 때 당업자에게 명백해질 것이다. 또한, 지질 접합체의 조성 및 농도를 제어함으로써, 리포좀 또는 지질 입자 크기를 조절할 수 있다.
지질 제형 제조
핵산, 예를 들어 RNA 레플리콘 또는 핵산 분자의 조합을 포함하는 지질 제형의 제조를 위한 많은 상이한 방법이 있다(Curr. Drug Metabol. 2014, 15, 882-892; Chem. Phys. Lipids 2014, 177, 8-18; Int. J. Pharm. Stud. Res. 2012, 3, 14-20). 박막 수화, 이중 에멀젼, 역상 증발, 미세유체 제조, 이중 비대칭 원심분리, 에탄올 주입, 세제 투석, 에탄올 희석에 의한 자발적 소포 형성, 및 미리 형성된 리포좀에서의 캡슐화 기술이 본원에 간략하게 설명되어 있다.
박막 수화
박막 수화(TFH: Thin Film Hydration) 또는 Bangham 방법에서 지질은 유기 용매에 용해시킨 다음, 회전 증발기를 사용하여 증발시켜 얇은 지질 층을 형성한다. 로딩될 화합물을 함유하는 수성 완충 용액에 의한 층 수화 후, 다중 층상 소포(MLV: Multilamellar Vesicle)가 형성되며, 이는 크기를 감소시켜 막을 통한 압출 또는 출발 MLV의 초음파 처리에 의해 소형 또는 대형 다중 층상 소포(LUV 및 SUV)를 생성할 수 있다.
이중 에멀젼
지질 제형은 물/유기 용매 혼합물에서 지질 용해를 수반하는 이중 에멀젼 기술을 통해서도 제조될 수 있다. 물방울을 함유하는 유기 용액은 과량의 수성 매질과 혼합되어 수중유중수(W/O/W: water-in-oil-in-water) 이중 에멀젼 형성을 유발한다. 기계적으로 격렬하게 진탕시킨 후, 물방울의 일부가 붕괴되어 대형 단일 층상 소포(LUV)가 생성된다.
역상 증발
역상 증발(REV: Reverse Phase Evaporation) 방법은 또한 핵산이 로딩된 LUV를 달성할 수 있게 한다. 이 기술에서는 인지질이 유기 용매 및 수성 완충액에 용해되어 2상 시스템이 형성된다. 이어서, 생성된 현탁액은 혼합물이 투명한 1 상 분산액이 될 때까지 간단히 초음파 처리된다. 지질 제형은 감압 하에 유기 용매 증발 후에 달성된다. 이 기술은 핵산을 포함한 다양한 크고 작은 친수성 분자를 캡슐화하는 데 사용되었다.
미세유체 제조
미세유체 방법은 다른 벌크 기술과 달리 지질 수화 과정을 제어할 수 있는 가능성을 제공한다. 상기 방법은 유동을 조작하는 방식에 따라 연속-유동 미세유체와 액적-기반 미세유체로 분류될 수 있다. 연속 유동 모드에서 작동하는 미세유체 유체역학 포커싱(MHF: microfluidic hydrodynamic focusing) 방법에서, 지질은 두 수성 완충액 스트림 사이의 미세채널 교차 접합(cross junction)에서 유체역학적으로 집속된 이소프로필 알코올에 용해된다. 소포 크기는 유속을 조절하여 지질 용액/완충액 희석 과정을 조절함으로써 조절될 수 있다. 상기 방법은 3개 입구 및 1개 출구 포트로 이루어진 미세유체 장치를 사용하여 올리고뉴클레오티드(ON) 지질 제형을 제조하는 데 사용될 수 있다.
이중 비대칭 원심분리
이중 비대칭 원심분리(DAC: Dual Asymmetric Centrifugation)는 자체 수직축을 중심으로 추가 회전을 사용하기 때문에 일반적인 원심분리와 다르다. 생성된 두 가지 중첩 움직임으로 인해 효율적인 균질화가 달성된다: 샘플은 일반 원심분리기에서와 같이 바깥쪽으로 밀려난 다음, 추가 회전으로 인해 바이알의 중앙으로 밀려난다. 지질과 NaCl-용액을 혼합함으로써 점성의 소포성 인지질 겔(VPC: vesicular phospholipid ge)이 달성되고, 이어서 희석되어 지질 제형 분산액을 수득한다. 지질 제형 크기는 DAC 속도, 지질 농도 및 균질화 시간을 최적화하여 조절할 수 있다.
에탄올 주사
에탄올 주입(EI) 방법은 핵산 캡슐화에 사용될 수 있다. 이 방법은 지질이 용해되는 에탄올 용액을 바늘을 사용하여 캡슐화할 핵산을 함유하는 수성 매질에 신속하게 주입하는 것을 제공한다. 소포는 인지질이 배지 전체에 분산될 때 자발적으로 형성된다.
세제 투석
세제 투석 방법은 핵산을 캡슐화하는 데 사용할 수 있다. 간단히 지질 및 플라스미드는 적절한 이온 강도의 세제 용액에 가용화되고, 투석에 의해 세제를 제거한 후, 안정화된 지질 제형이 형성된다. 캡슐화되지 않은 핵산은 이온-교환 크로마토그래피에 의해 제거되고, 빈 소포는 수크로스 밀도 구배 원심분리에 의해 제거된다. 이 기술은 양이온성 지질 함량과 투석 완충액의 염 농도에 매우 민감하며, 이 방법도 규모 조정이 어렵다.
에탄올 희석에 의한 자발적 소포 형성
안정한 지질 제형은 또한 단계적 또는 적하 에탄올 희석이 에탄올에 용해된 지질을 핵산을 함유하는 급속하게 혼합된 수성 완충액에 제어된 첨가에 의해 핵산이 로딩된 소포의 순간적 형성을 제공하는 에탄올 희석에 의한 자발적 소포 형성 방법을 통해 제조될 수 있다.
미리 형성된 리포좀의 캡슐화
핵산의 포획은 또한 두 가지 상이한 방법을 통해 미리 형성된 리포좀으로 시작하여 얻을 수 있다 : (1) "리포플렉스"라고 불리는 정전기적 복합체를 제공하는, 양이온성 리포좀과 핵산의 단순한 혼합으로, 여기서 이들은 세포 배양을 형질 감염시키는 데 성공적으로 사용될 수 있지만 낮은 캡슐화 효율과 생체내 불량한 성능을 특징으로 하며; (2) 리포좀 불안정화, 40% v/v 이하의 농도로 양이온성 소포의 현탁액에 무수 에탄올을 천천히 첨가한 후 핵산을 적가하여 로딩된 소포를 달성하지만, 캡슐화 공정을 특징짓는 두 가지 주요 단계는 너무 민감하여 입자의 크기를 줄여야 한다.
특정 실시양태에서, 지질 및 지질 나노입자의 예, 지질을 포함하는 약제학적 조성물, 지질을 제조하는 방법 또는 지질 및 핵산 분자를 포함하는 약제학적 조성물을 제형화하는 방법, 및 질환을 치료 또는 예방하기 위한 약제학적 조성물을 사용하는 방법은 미국 또는 국제 특허 출원 공보, 예컨대 US2017/0190661, US2017/0190661, US2006/0008910, US2015/0064242, US2005/0064595, WO2019/036030, US2019/0022247, WO2019/036028, WO2019/036008, WO2019/036000, US2016/0376224, US2017/0119904, WO2018/200943, WO2018/191657, WO2018/118102, US2018/0169268, WO2018/118102, WO2018/119163, US2014/0255472, 및 US2013/0195968에 기재되어 있으며 이들 각각의 관련 내용은 그 전문이 본원에 참조로 포함된다.
프라임/부스트 면역화 방법
본 출원의 실시양태는 또한 면역원적 유효량의 약제학적 조성물 또는 면역원성 조합물을 대상체에게 투여하는 단계 및 후속적으로 소위 프라임-부스트 용법으로서 면역원적 유효량의 약제학적 조성물 또는 면역원성 조합물의 또 다른 용량을 동일한 대상체에게 투여하는 단계를 고려한다. 따라서, 일 실시양태에서, 본 출원의 약제학적 조성물 또는 면역원성 조합물은 면역 반응을 프라이밍하기 위해 사용되는 프라이머 백신이다. 또 다른 실시양태에서, 본 출원의 약제학적 조성물 또는 면역원성 조합물은 면역 반응을 부스팅하기 위해 사용되는 부스터 백신이다. 본 출원의 프라이밍 및 부스팅 백신은 본원에 기재된 본 출원의 방법에 사용될 수 있다. 프라임-부스트 용법의 이러한 일반적인 개념은 백신 분야의 숙련가에게 잘 알려져 있다. 본원에 기재된 본 출원의 임의의 약제학적 조성물 및 면역원성 조합물은 HBV에 대한 면역 반응을 프라이밍 및/또는 부스팅하기 위한 프라이밍 및/또는 부스팅 백신으로서 사용될 수 있다. 바람직하게는, 대상체에게 백신접종을 위한 방법은 본 출원의 핵산 분자, 핵산 조합, 벡터, 또는 RNA 레플리콘을 포함하는 약제학적 조성물을 대상체에게 투여하는 단계 및 프라임-부스트 용법으로서 적어도 하나의 동일한 HBV 항원을 인코딩하는 핵산 분자를 포함하는 제2 조성물을 대상체에게 투여하는 단계를 포함한다.
본 출원의 일부 실시양태에서, 본 출원의 약제학적 조성물 또는 면역원성 조합물은 면역화를 프라이밍하기 위해 투여될 수 있다. 약제학적 조성물 또는 면역원성 조합물은 면역화 부스팅을 위해 재투여될 수 있다. 약제학적 조성물 또는 백신 조합물의 추가의 부스터 투여는 필요에 따라 용법에 선택적으로 추가될 수 있다. 애쥬번트는 면역화 부스팅을 위해 사용되는 본 출원의 약제학적 조성물에 존재하거나, 부스팅 면역화를 위한 본 출원의 약제학적 조성물 또는 면역원성 조합물과 함께 투여될 별도의 조성물로 존재하거나, 부스팅 면역화로서 그 자체로 투여될 수 있다. 애쥬번트가 용법에 포함되는 이러한 실시양태에서, 상기 애쥬번트는 바람직하게는 면역화 부스팅을 위해 사용된다.
프라임-부스트 용법의 예시적이고 비제한적인 예는 면역 반응을 프라이밍하기 위해 면역원적 유효량의 본 출원의 약제학적 조성물 또는 면역원성 조성물을 대상체에게 투여하는 단계; 및 후속적으로 면역 반응을 부스팅하기 위해 면역원적 유효량의 본 출원의 약제학적 조성물 또는 면역원성 조합물의 또 다른 용량을 투여하는 단계를 포함하고, 여기서 부스팅 면역화는 프라이밍 면역화가 처음 투여된 지 약 2 내지 6주, 바람직하게는 4주 후에 먼저 투여된다. 선택적으로, 프라이밍 면역화가 처음 투여된 지 약 10 내지 14주, 바람직하게는 12주 후, 약제학적 조성물 또는 면역원성 조합물, 또는 다른 애쥬번트의 추가 부스팅 면역화가 투여된다.
프라이밍 및 부스팅 조성물에서 항원은 동일할 필요는 없지만, 항원을 공유하거나 서로 실질적으로 유사해야 한다. 특정 실시양태에서, 부스팅 조성물의 벡터는 프라이밍 조성물, 예를 들어, 아데노바이러스 벡터, 변형된 백시니아 앙카라(MVA) 벡터, DNA, 또는 단백질과 상이하다. 본 발명의 프라이밍 및 부스팅 조성물은 각각 1, 2, 3 또는 다중 용량을 포함할 수 있다.
실시양태
실시양태 1은 핵산 분자 또는 조합으로서, 5'-말단에서 3'-말단의 순서로 하기를 포함하는 비-천연 발생 폴리뉴클레오티드 서열을 포함하는, 핵산 분자 또는 조합을 포함한다:
(1) 제1 B형 간염 바이러스(HBV) 항원을 인코딩하는 폴리뉴클레오티드 서열,
(2) 제1 내부 리보솜 진입 서열(IRES) 요소 또는 제1 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열, 및
제2 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열,
여기서 제1 및 제2 HBV 항원 중 적어도 하나는 HBV 표면 항원인, 핵산 분자 또는 조합을 포함한다.
실시양태 1a는 실시양태 1에 있어서, 제1 및 제2 HBV 항원은 HBV 코어 항원, HBV 폴리머라제(pol) 항원, 및 HBV 표면 항원으로 이루어진 군으로부터 독립적으로 선택되는, 핵산 분자 또는 조합을 포함한다.
실시양태 1b는 실시양태 1 또는 1a에 있어서, 제1 및 제2 HBV 항원 중 적어도 하나는 HBV Pre-S1 항원 또는 HBV PreS2.S 항원인, 핵산 분자 또는 조합을 포함한다.
실시양태 2는 실시양태 1 내지 1b 중 어느 한 실시양태에 있어서, 제1 또는 제2 HBV 항원 중 하나는 HBV 코어 항원 또는 HBV pol 항원인, 핵산 분자 또는 조합을 포함한다.
실시양태 3은 실시양태 1 내지 2 중 어느 한 실시양태에 있어서, 비-천연 발생 폴리뉴클레오티드 서열은 5'-말단에서 3'-말단의 순서로 하기를 추가로 포함하는, 핵산 분자 또는 조합을 포함한다:
(3) 제2 IRES 요소 또는 제2 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열의 3' 말단에 작동적으로 연결된 제2 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열, 및
(4) 제3 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열.
실시양태 3a는 실시양태 3에 있어서, 제3 HBV 항원은 HBV 코어 항원, HBV 폴리머라제(pol) 항원, 및 HBV 표면 항원으로 이루어진 군으로부터 독립적으로 선택되는, 핵산 분자 또는 조합을 포함한다.
실시양태 4는 실시양태 3 또는 3a에 있어서, 비-천연 발생 폴리뉴클레오티드 서열은 5'-말단에서 3'-말단의 순서로 하기를 추가로 포함하는, 핵산 분자 또는 조합을 포함한다:
(5) 제3 IRES 요소 또는 제3 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열의 3' 말단에 작동적으로 연결된 제3 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열, 및
(6) 제4 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열.
실시양태 4a는 실시양태 4에 있어서, 제3 HBV 항원은 HBV 코어 항원, HBV 폴리머라제(pol) 항원, 및 HBV 표면 항원으로 이루어진 군으로부터 독립적으로 선택되는, 핵산 분자 또는 조합을 포함한다.
실시양태 4b는 실시양태 1 내지 2에 있어서, 5'-말단에서 3'-말단의 순서로 하기를 포함하는 제1 비-천연 발생 폴리뉴클레오티드 서열:
(1) 제1 B형 간염 바이러스(HBV) 항원을 인코딩하는 폴리뉴클레오티드 서열,
(2) 제1 내부 리보솜 진입 서열(IRES) 요소 또는 제1 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열, 및
(3) 제2 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열, 및
5'-말단에서 3'-말단의 순서로 하기로 포함하는 제2 비-천연 발생 폴리뉴클레오티드 서열:
(1) 제3 B형 간염 바이러스(HBV) 항원을 인코딩하는 폴리뉴클레오티드 서열,
(2) 제2 내부 리보솜 진입 서열(IRES) 요소 또는 제2 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열, 및
(3) 제4 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열을 포함하고,
여기서 제1 및 제2 비-천연 발생 폴리뉴클레오티드 서열은 제3 내부 리보솜 진입 서열(IRES) 요소 또는 제3 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열에 의해 연결되거나, 별도의 핵산 분자에 존재하고,
여기서 제1, 제2, 제3 및 제4 HBV 항원은 HBV 코어 항원, HBV 폴리머라제(pol) 항원, 및 HBV 표면 항원으로 이루어진 군으로부터 각각 독립적으로 선택되고, 제1, 제2, 제3 및 제4 HBV 항원 중 적어도 하나는 서열번호 1 또는 서열번호 3의 아미노산 서열과 적어도 98% 동일한 아미노산 서열을 갖는 HBV Pre-S1 항원 및 서열번호 5의 아미노산 서열과 적어도 98% 동일한 아미노산 서열을 갖는 HBV PreS2.S 항원으로부터 선택된 HBV 표면 항원이고, 바람직하게는 제1, 제2, 제3 또는 제4 HBV 항원 중 하나는 HBV 코어 또는 HBV pol 항원인, 핵산 분자 또는 조합을 포함한다.
실시양태 5는 실시양태 1 내지 4b에 있어서, 제1, 제2, 제3 및 제4 HBV 항원 각각은 서로 상이한 것인, 핵산 조합을 포함한다.
실시양태 6은 실시양태 1 내지 5 중 어느 한 실시양태에 있어서, 제1, 제2, 제3 및 제4 HBV 항원 각각은 하기로 이루어진 군으로부터 독립적으로 선택되는, 핵산 분자 또는 조합을 포함한다:
(i) 서열번호 1의 아미노산 서열과 적어도 98% 동일한, 예컨대 서열번호 1의 아미노산 서열과 적어도 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하는, 바람직하게는 이로 이루어진 제1 HBV PreS1 항원;
(ii) 서열번호 3의 아미노산 서열과 적어도 98% 동일한, 예컨대 서열번호 3의 아미노산 서열과 적어도 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하는, 바람직하게는 이로 이루어진 제2 HBV PreS1 항원;
(iii) 서열번호 5의 아미노산 서열과 적어도 98% 동일한, 예컨대 서열번호 5의 아미노산 서열과 적어도 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하고, 바람직하게는 이로 이루어진 HBV PreS2 항원;
(iv) 서열번호 7과 적어도 90% 동일한, 예컨대 서열번호 7과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하고, 바람직하게는 이로 이루어진 HBV 코어 항원; 및
(v) 서열번호 9와 적어도 90% 동일한, 예컨대 서열번호 9와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하고, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원.
실시양태 6a는 실시양태 6에 있어서, HBV 코어 항원은 서열번호 86과 적어도 90% 동일한, 예컨대 서열번호 86과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하고, 바람직하게는 이로 이루어진, 핵산 분자 또는 조합을 포함한다.
실시양태 6b는 실시양태 6에 있어서, 제1, 제2, 제3 및 제4 HBV 항원 각각은 하기로 이루어진 군으로부터 독립적으로 선택되는, 핵산 분자 또는 조합을 포함한다:
(1) 서열번호 1의 아미노산 서열을 포함하는 제1 HBV Pre-S1 항원;
(2) 서열번호 3의 아미노산 서열을 포함하는 제2 HBV Pre-S1 항원;
(3) 서열번호 5의 아미노산 서열을 포함하는 HBV PreS2.S 항원;
(4) 서열번호 7의 아미노산을 포함하는 HBV 코어 항원; 및
(5) 서열번호 9의 아미노산 서열을 포함하는 HBV 폴리머라제 항원.
실시양태 6b1은 실시양태 6b에 있어서, 제1, 제2, 제3 및 제4 HBV 항원 각각은 하기로 이루어진 군으로부터 독립적으로 선택되는, 핵산 분자 또는 조합을 포함한다:
(1) 서열번호 1의 아미노산 서열로 이루어진 제1 HBV Pre-S1 항원;
(2) 서열번호 3의 아미노산 서열로 이루어진 제2 HBV Pre-S1 항원;
(3) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원;
(4) 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원; 및
(5) 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원.
실시양태 6b2는 실시양태 6b에 있어서, 제1, 제2, 제3 및 제4 HBV 항원 각각은 하기로 이루어진 군으로부터 독립적으로 선택되는, 핵산 분자 또는 조합을 포함한다:
(1) 서열번호 1의 아미노산 서열로 이루어진 제1 HBV Pre-S1 항원;
(2) 서열번호 3의 아미노산 서열로 이루어진 제2 HBV Pre-S1 항원;
(3) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원;
(4) 서열번호 84의 아미노산 서열로 이루어진 HBV 코어 항원; 및
(5) 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원.
실시양태 6b3은 실시양태 6b에 있어서, 제1, 제2, 제3 및 제4 HBV 항원 각각은 하기로 이루어진 군으로부터 독립적으로 선택되는, 핵산 분자 또는 조합을 포함한다:
(1) 서열번호 1의 아미노산 서열로 이루어진 제1 HBV Pre-S1 항원;
(2) 서열번호 3의 아미노산 서열로 이루어진 제2 HBV Pre-S1 항원;
(3) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원;
(4) 서열번호 85의 아미노산 서열로 이루어진 HBV 코어 항원; 및
(5) 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원.
실시양태 6b4는 실시양태 6b에 있어서, 제1, 제2, 제3 및 제4 HBV 항원 각각은 하기로 이루어진 군으로부터 독립적으로 선택되는, 핵산 분자 또는 조합을 포함한다:
(1) 서열번호 1의 아미노산 서열로 이루어진 제1 HBV Pre-S1 항원;
(2) 서열번호 3의 아미노산 서열로 이루어진 제2 HBV Pre-S1 항원;
(3) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원;
(4) 서열번호 7의 아미노산 서열로 이루어진 HBV 코어 항원; 및
(5) 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원.
실시양태 6c는 실시양태 1 내지 6b4 중 어느 한 실시양태에 있어서, 핵산 분자는 제1 HBV Pre-S1 항원, 제2 HBV Pre-S1 항원 및 HBV PreS2.S 항원 중 적어도 하나를 인코딩하는 폴리뉴클레오티드 서열, 및 HBV 코어 항원 및 HBV 폴리머라제 항원 중 적어도 하나를 인코딩하는 폴리뉴클레오티드 서열을 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 6c1은 실시양태 1 내지 6c 중 어느 한 실시양태에 있어서, 제1 및 제2 HBV Pre-S1 항원, HBV 코어 항원 및 HBV pol 항원 각각은 독립적으로 신호 펩타이드에 작동적으로 연결되고, HBV PreS2.S 항원은 내부 신호 펩타이드를 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 6c2는 실시양태 6c1에 있어서, 신호 펩타이드는 시스타틴 S 신호 펩타이드, Ig 중쇄 감마 신호 펩타이드 SPIgG, Ig 중쇄 입실론 신호 펩타이드 SPIgE, 또는 코로나바이러스의 짧은 리더 펩타이드 서열인, 핵산 분자 또는 조합을 포함한다.
실시양태 6c3은 실시양태 6c2에 있어서, 신호 펩타이드는 서열번호 77의 아미노산 서열을 포함하고 HBV Pre-S1 항원, HBV 코어 항원 및 HBV pol 항원의 N-말단에 작동적으로 연결된, 핵산 분자 또는 조합을 포함한다.
실시양태 6d는 실시양태 1 내지 6c3 중 어느 한 실시양태에 있어서, 핵산 분자는 적어도 하나의 IRES 요소를 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 6d1은 실시양태 6d에 있어서, IRES 요소는 서열번호 13의 폴리뉴클레오티드 서열을 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 6d2는 실시양태 6d1에 있어서, IRES 요소는 서열번호 13의 폴리뉴클레오티드 서열로 이루어진, 핵산 분자 또는 조합을 포함한다.
실시양태 6d3은 실시양태 6d에 있어서, IRES 요소는 서열번호 14의 폴리뉴클레오티드 서열을 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 6d4는 실시양태 6d3에 있어서, IRES 요소는 서열번호 14의 폴리뉴클레오티드 서열로 이루어진, 핵산 분자 또는 조합을 포함한다.
실시양태 6e는 실시양태 1 내지 6d4 중 어느 한 실시양태에 있어서, 핵산 분자는 오토프로테아제 펩타이드를 인코딩하는 적어도 하나의 폴리뉴클레오티드 서열을 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 6e1은 실시양태 6e에 있어서, 오토프로테아제 펩타이드는 서열번호 11의 아미노산 서열을 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 6e2는 실시양태 6e1에 있어서, 오토프로테아제 펩타이드는 서열번호 11의 아미노산 서열로 이루어진, 핵산 분자 또는 조합을 포함한다.
실시양태 6e3은 실시양태 6e에 있어서, 폴리뉴클레오티드 서열에 의해 인코딩된 오토프로테아제 펩타이드는 서열번호 12의 서열을 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 6e4는 실시양태 6e에 있어서, 폴리뉴클레오티드 서열에 의해 인코딩된 오토프로테아제 펩타이드는 서열번호 12의 서열로 이루어진, 핵산 분자 또는 조합을 포함한다.
실시양태 7은 실시양태 6c 내지 6e4 중 어느 한 실시양태에 있어서, HBV 코어 항원은 서열번호 84, 85 또는 86 중 적어도 하나와 적어도 98% 동일한, 예컨대 서열번호 84, 85 또는 86 중 적어도 하나와 적어도 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하고, 바람직하게는 이로 이루어진, 핵산 분자 또는 조합을 포함한다.
실시양태 7a는 실시양태 7에 있어서, HBV 코어 항원은 서열번호 84, 서열번호 85, 또는 서열번호 86으로 이루어진 군으로부터 선택된 아미노산 서열을 포함하고, 바람직하게는 이로 이루어진, 핵산 분자 또는 조합을 포함한다.
실시양태 7b는 실시양태 7a에 있어서, HBV 코어 항원은 서열번호 86의 아미노산 서열로 이루어진, 핵산 분자 또는 조합을 포함한다.
실시양태 8은 실시양태 1 내지 7b 중 어느 한 실시양태에 있어서, HBV 코어 항원의 마지막 5개의 C-말단 아미노산은 VVR 아미노산 서열, 보다 특히 VVRR(서열번호 91) 아미노산 서열, 보다 특히 VVRRR(서열번호 92) 아미노산 서열을 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 9는 실시양태 1 내지 8 중 어느 한 실시양태에 있어서, HBV 표면 항원, HBV 코어 항원 및 HBV 폴리머라제 항원 중 적어도 하나는 하기를 포함하는, 핵산 분자 또는 조합을 포함한다:
(i) HBV 유전자형 A, B, C 및 D 중 둘 이상, 바람직하게는 모두에 대한 컨센서스 서열; 및/또는
(ii) HLA-A*11:01, HLA-A*24:02, HLA-A*02:01, HLA-A*A2402, HLA-A*A0101, 또는 HLA-B*40:01에 대한 하나 이상의 에피토프.
실시양태 9a는 실시양태 9에 있어서, HBV 표면 항원, HBV 코어 항원 및 HBV 폴리머라제 항원 중 적어도 하나는 HLA-A*11:01 에피토프, HLA-A*24:02 에피토프, HLA-A*02:01 에피토프, 및 HLA-A*A2402 에피토프로 이루어진 군으로부터 선택된 하나 이상의 에피토프를 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 9a1은 실시양태 9 또는 9a에 있어서, HBV 표면 항원, HBV 코어 항원 및 HBV 폴리머라제 항원 중 적어도 하나는 HLA-A*11:01 에피토프, HLA-A*24:02 에피토프, 및 HLA-A*02:01 에피토프로 이루어진 군으로부터 선택된 하나 이상의 에피토프를 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 9a2는 실시양태 9 내지 9a1 중 어느 한 실시양태에서, HBV 표면 항원, HBV 코어 항원 및 HBV 폴리머라제 항원 중 적어도 하나는 HLA-A*11:01에 대한 하나 이상의 에피토프를 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 9a3은 실시양태 9 내지 9a2 중 어느 한 실시양태에서, HBV 표면 항원, HBV 코어 항원 및 HBV 폴리머라제 항원 각각은 HLA-A*11:01에 대한 하나 이상의 에피토프를 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 9a4는 실시양태 9 내지 9a3 중 어느 한 실시양태에 있어서, HBV preS1, HBV preS2.S, HBV 코어 항원 및 HBV 폴리머라제 항원 각각은 HLA-A*11:01에 대한 하나 이상의 에피토프를 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 9b는 실시양태 9 내지 9a4 중 어느 한 실시양태에 있어서, HBV 표면 항원, HBV 코어 항원 및 HBV 폴리머라제 항원 각각은 HBV 유전자형 A, B, C 및 D에 대한 컨센서스 서열을 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 9c는 실시양태 9에 있어서, HBV 폴리머라제 항원, HBV pre-S1 항원, 및 HBV preS2.S 항원 중 적어도 하나는 하나 이상의 HLA-A*24:02 에피토프를 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 9c1은 실시양태 9 또는 9c에 있어서, HBV 폴리머라제 항원, HBV pre-S1 항원, 및 HBV preS2.S 항원 각각은 하나 이상의 HLA-A*24:02 에피토프를 포함하는, 핵산 분자 또는 조합을 포함을 포함한다.
시양태 9c2는 실시양태 9 내지 9c1 중 어느 한 실시양태에 있어서, HBV preS2.S 항원은 하나 이상의 HLA-A*24:02 에피토프를 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 9d는 실시양태 9에 있어서, HBV 폴리머라제 항원 및 HBV 코어 항원 중 적어도 하나는 하나 이상의 HLA-A*02:01 에피토프를 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 9d1은 실시양태 9d에 있어서, HBV 폴리머라제 항원 및 HBV 코어 항원 각각은 하나 이상의 HLA-A*02:01 에피토프를 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 9e는 실시양태 9에 있어서, HBV preS2.S 항원은 하나 이상의 HLA-A*A2402 에피토프를 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 9f는 실시양태 9에 있어서, HBV 폴리머라제 항원 및 HBV 코어 항원 중 적어도 하나는 하나 이상의 HLA-A*A0101 에피토프를 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 9f1은 실시양태 9f에 있어서, HBV 폴리머라제 항원 및 HBV 코어 항원 각각은 하나 이상의 HLA-A*A0101 에피토프를 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 9g는 실시양태 9에 있어서, HBV 코어 항원은 하나 이상의 HLA-B*40:01 에피토프를 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 9h는 실시양태 9에 있어서, HBV 코어 항원은 HLA-A*11:01 에피토프, HLA-A*02:01 에피토프, HLA-A*A0101 에피토프, 및 HLA-B*40:01 에피토프로 이루어진 군으로부터 선택된 하나 이상의 에피토프를 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 9i는 실시양태 9에 있어서, HBV 폴리머라제 항원은 HLA-A*11:01 에피토프, HLA-A*24:02 에피토프, HLA-A*02:01 에피토프, 및 HLA-A*A0101 에피토프로 이루어진 군으로부터 선택된 하나 이상의 에피토프를 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 9j는 실시양태 9에 있어서, HBV pre-S1 항원은 HLA-A*11:01 에피토프 및 HLA-A*24:02 에피토프로 이루어진 군으로부터 선택된 하나 이상의 에피토프를 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 9k는 실시양태 9에 있어서, HBV preS2.S 항원은 HLA-A*11:01 에피토프, HLA-A*24:02 에피토프 및 HLA-A*A2402 에피토프로 이루어진 군으로부터 선택된 하나 이상의 에피토프를 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 9l은 실시양태 9에 있어서, HBV 표면 항원, HBV 코어 항원 및 HBV 폴리머라제 항원 각각은 하기를 포함하는, 핵산 분자 또는 조합을 포함한다:
(i) HBV 유전자형 A, B, C 및 D에 대한 컨센서스 서열; 및
(ii) HLA-A*11:01, HLA-A*24:02, HLA-A*02:01, HLA-A*A0201, HLA-A*A2402 및 HLA-A*A0101에 대한 하나 이상의 에피토프.
실시양태 10은 실시양태 1 내지 9l 중 어느 한 실시양태에 있어서, 제1, 제2, 제3 및 제4 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열 각각은 하기로 이루어진 군으로부터 독립적으로 선택되고:
(i) 서열번호 2와 적어도 90% 동일한, 예컨대 서열번호 2와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 서열을 갖는 제1 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(ii) 서열번호 4와 적어도 90% 동일한, 예컨대 서열번호 4와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 서열을 갖는 제2 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(iii) 서열번호 6과 적어도 90% 동일한, 예컨대 서열번호 6과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
(iv) 서열번호 8과 적어도 90% 동일한, 예컨대 서열번호 8과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열; 및
(v) 서열번호 10과 적어도 90% 동일한, 예컨대 서열번호 10과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열,
바람직하게는, 제1 및 제2 HBV Pre-S1 항원, HBV 코어 항원 및 HBV pol 항원 각각을 인코딩하는 폴리뉴클레오티드 서열은 독립적으로 신호 펩타이드를 인코딩하는 폴리뉴클레오티드 서열에 작동적으로 연결되고, HBV preS2.S 항원은 내부 신호 펩타이드를 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 10a는 실시양태 10에 있어서, 제1, 제2, 제3 및 제4 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열 각각은 하기로 이루어진 군으로부터 독립적으로 선택되는, 핵산 분자 또는 조합을 포함한다:
(i) 서열번호 2의 뉴클레오티드 서열을 갖는 제1 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(ii) 서열번호 4의 뉴클레오티드 서열을 갖는 제2 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(iii) 서열번호 6의 뉴클레오티드 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
(iv) 서열번호 89의 뉴클레오티드 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열; 및
(v) 서열번호 10의 뉴클레오티드 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열.
실시양태 10b는 실시양태 10에 있어서, 제1, 제2, 제3 및 제4 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열 각각은 하기로 이루어진 군으로부터 독립적으로 선택되는, 핵산 분자 또는 조합을 포함한다:
(i) 서열번호 2의 뉴클레오티드 서열로 이루어진 제1 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(ii) 서열번호 4의 뉴클레오티드 서열로 이루어진 제2 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(iii) 서열번호 6의 뉴클레오티드 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
(iv) 서열번호 87의 뉴클레오티드 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열; 및
(v) 서열번호 10의 뉴클레오티드 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열.
실시양태 10c는 실시양태 10에 있어서, 제1, 제2, 제3 및 제4 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열 각각은 하기로 이루어진 군으로부터 독립적으로 선택되는, 핵산 분자 또는 조합을 포함한다:
(i) 서열번호 2의 뉴클레오티드 서열로 이루어진 제1 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(ii) 서열번호 4의 뉴클레오티드 서열로 이루어진 제2 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(iii) 서열번호 6의 뉴클레오티드 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
(iv) 서열번호 88의 뉴클레오티드 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열; 및
(v) 서열번호 10의 뉴클레오티드 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열.
실시양태 10d는 실시양태 10에 있어서, 제1, 제2, 제3 및 제4 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열 각각은 하기로 이루어진 군으로부터 독립적으로 선택되는, 핵산 분자 또는 조합을 포함한다:
(i) 서열번호 2의 뉴클레오티드 서열로 이루어진 제1 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(ii) 서열번호 4의 뉴클레오티드 서열로 이루어진 제2 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(iii) 서열번호 6의 뉴클레오티드 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
(iv) 서열번호 89의 뉴클레오티드 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열; 및
(v) 서열번호 10의 뉴클레오티드 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열.
실시양태 11은 실시양태 10에 있어서, HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열은 서열번호 87, 서열번호 88 또는 서열번호 89과 적어도 90% 동일한, 예컨대 서열번호 87, 서열번호 88 또는 서열번호 89와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 폴리뉴클레오티드 서열을 포함하고, 바람직하게는 이로 이루어진, 핵산 분자 또는 조합을 포함한다.
실시양태 11a는 실시양태 11에 있어서, HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열은 서열번호 87, 서열번호 88 또는 서열번호 89 중 어느 하나를 포함하고, 바람직하게는 이로 이루어진, 핵산 분자 또는 조합을 포함한다.
실시양태 11b는 실시양태 11 또는 11a에 있어서, HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열은 서열번호 89로 이루어진, 핵산 분자 또는 조합을 포함한다.
실시양태 11c는 실시양태 10 내지 11b 중 어느 한 실시양태에 있어서, 제1 및 제2 HBV Pre-S1 항원, HBV 코어 항원 및 HBV pol 항원 각각을 인코딩하는 폴리뉴클레오티드 서열은 독립적으로 시스타틴 S 신호 펩타이드, Ig 중쇄 감마 신호 펩타이드 SPIgG, Ig 중쇄 입실론 신호 펩타이드 SPIgE, 또는 코로나바이러스의 짧은 리더 펩타이드 서열과 같은 신호 펩타이드를 인코딩하는 폴리뉴클레오티드에 작동적으로 연결되는, 핵산 분자 또는 조합을 포함한다.
실시양태 11d는 실시양태 11c에 있어서, 신호 펩타이드를 인코딩하는 폴리뉴클레오티드는 서열번호 90의 뉴클레오티드 서열을 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 12는 실시양태 1 내지 11d 중 어느 한 실시양태에 있어서, 제1, 제2 및 제3 오토프로테아제 펩타이드 각각은 독립적으로 돼지 테스코바이러스-1 2A(P2A), 구제역 바이러스(FMDV) 2A(F2A), 말 비염 A 바이러스(ERAV) 2A(E2A), 테세아 아시그나 바이러스 2A(T2A), 세포질 다각체병 바이러스 2A(BmCPV2A), 무름병 바이러스 2 A(BmIFV2A), 및 이들의 조합으로 이루어진 군으로부터 선택된 펩타이드 서열을 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 12a는 실시양태 12에 있어서, 제1, 제2 및 제3 오토프로테아제 펩타이드 각각은 서열번호 11의 P2A 서열과 같은 P2A의 펩타이드 서열을 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 13은 실시양태 1 내지 12a 중 어느 한 실시양태에 있어서, 제1, 제2 및 제3 IRES 각각은 뇌심근염 바이러스(EMCV) 또는 엔테로바이러스 71(EV71)로부터 유래된, 핵산 분자 또는 조합을 포함한다.
실시양태 13a는 실시양태 13에 있어서, 제1, 제2 및 제3 IRES 각각은 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 14는 실시양태 1 내지 3a 중 어느 한 실시양태에 있어서, 5'-말단에서 3'-말단의 순서로 하기를 갖는 비-천연 발생 폴리뉴클레오티드 서열을 포함하는, 핵산 분자 또는 조합을 포함한다:
(1) 서열번호 7의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(2) 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 7의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(3) 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
(4) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(5) 서열번호 7의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(6) 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 7의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(7) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 7의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(8) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 7의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(9) 서열번호 7의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(10) 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 7의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(11) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 7의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(12) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 7의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(13) 서열번호 7의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(14) 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 7의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(15) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 7의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(16) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 7의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(17) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 7의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(18) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 7의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(19) 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 7의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
(20) 서열번호 7의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
(21) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 7의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(22) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 7의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(23) 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 7의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열; 및
(24) 서열번호 7의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열.
실시양태 14a1은 실시양태 14에 있어서, 5'-말단에서 3'-말단의 순서로 하기를 갖는 비-천연 발생 폴리뉴클레오티드 서열을 포함하는, 핵산 분자 또는 조합을 포함한다:
(1) 서열번호 7, 84, 85, 또는 86 중 어느 하나의 아미노산 서열로 이루어진 HBV 코어를 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(2) 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 7, 84, 85, 또는 86 중 어느 하나의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(5) 서열번호 7, 84, 85, 또는 86 중 어느 하나의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(6) 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 7, 84, 85, 또는 86 중 어느 하나의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(7) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 7, 84, 85, 또는 86 중 어느 하나의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(8) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 7, 84, 85, 또는 86 중 어느 하나의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(9) 서열번호 7, 84, 85, 또는 86 중 어느 하나의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(10) 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 7, 84, 85, 또는 86 중 어느 하나의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(11) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 7, 84, 85, 또는 86 중 어느 하나의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(12) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 7, 84, 85, 또는 86 중 어느 하나의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(13) 서열번호 7, 84, 85, 또는 86 중 어느 하나의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(14) 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 7, 84, 85, 또는 86 중 어느 하나의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(15) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 7, 84, 85, 또는 86 중 어느 하나의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(16) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 7, 84, 85, 또는 86 중 어느 하나의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(17) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 7, 84, 85, 또는 86 중 어느 하나의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(18) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 7, 84, 85, 또는 86 중 어느 하나의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(19) 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 7, 84, 85, 또는 86 중 어느 하나의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
(20) 서열번호 7, 84, 85, 또는 86 중 어느 하나의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
(21) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 7, 84, 85, 또는 86 중 어느 하나의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(22) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 7, 84, 85, 또는 86 중 어느 하나의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(23) 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 7, 84, 85, 또는 86 중 어느 하나의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열; 및
(24) 서열번호 7, 84, 85, 또는 86 중 어느 하나의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열.
실시양태 14a2는 실시양태 14에 있어서, 5'-말단에서 3'-말단의 순서로 하기를 갖는 비-천연 발생 폴리뉴클레오티드 서열을 포함하는, 핵산 분자 또는 조합을 포함한다:
(1) 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(2) 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(3) 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
(4) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(5) 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(6) 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(7) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(8) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(9) 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(10) 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(11) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(12) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(13) 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(14) 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(15) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(16) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(17) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(18) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(19) 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
(20) 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
(21) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(22) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(23) 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열; 및
(24) 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열.
실시양태 14a3은 실시양태 14, 14a1 또는 14a2에 있어서, 제1 및 제2 HBV Pre-S1 항원, HBV 코어 항원 및 HBV pol 항원 각각을 인코딩하는 폴리뉴클레오티드 서열은 독립적으로 신호 펩타이드를 인코딩하는 폴리뉴클레오티드 서열에 작동적으로 연결되는, 핵산 분자 또는 조합을 포함된다.
실시양태 14a4는 실시양태 14a3에 있어서, 신호 펩타이드는 시스타틴 S 신호 펩타이드, Ig 중쇄 감마 신호 펩타이드 SPIgG, Ig 중쇄 입실론 신호 펩타이드 SPIgE, 또는 코로나바이러스의 짧은 리더 펩타이드 서열인, 핵산 분자 또는 조합을 포함한다.
실시양태 14a5는 실시양태 14a4에 있어서, 신호 펩타이드는 서열번호 77의 아미노산 서열을 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 14a6은 실시양태 14a5에 있어서, 신호 펩타이드를 인코딩하는 폴리뉴클레오티드 서열은 서열번호 90의 폴리뉴클레오티드 서열을 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 14b는 실시양태 14 내지 14a6 중 어느 한 실시양태에 있어서, 실시양태 14(3) 내지 14(24), 14a1(5) 내지 14a1(24) 또는 14a2(3) 내지 14a2(24) 중 어느 하나의 비-천연 발생 폴리뉴클레오티드 서열을 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 14c는 실시양태 14b에 있어서, 서열번호 21 내지 54 중 어느 하나의 비-천연 발생 폴리뉴클레오티드 서열을 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 14d는 실시양태 14b 또는 14c에 있어서, 실시양태 14(1), 14(2), 14a1(1), 14a1(2), 14a2(1), 및 14a2(2)로 이루어진 군으로부터 선택된 비-천연 발생 폴리뉴클레오티드 서열 중 어느 하나와 조합된, 핵산 분자 또는 조합을 포함한다.
실시양태 14e는 실시양태 14b 또는 14c에 있어서, 서열번호 15 내지 20으로 이루어진 군으로부터 선택된 비-천연 발생 폴리뉴클레오티드 서열 중 어느 하나와 조합된, 핵산 분자 또는 조합을 포함한다.
실시양태 15는 실시양태 14에 있어서, 서열번호 15 내지 54 중 어느 하나의 비-천연 발생 폴리뉴클레오티드 서열을 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 16은 벡터로서, 실시양태 1 내지 15 중 어느 한 실시양태의 핵산 분자 또는 조합을 포함하는, 벡터를 포함한다.
실시양태 17은 실시양태 16에 있어서, DNA 플라스미드인, 벡터를 포함한다.
실시양태 18은 실시양태 16에 있어서, DNA 바이러스 벡터인, 벡터를 포함한다.
실시양태 18a는 실시양태 16에 있어서, RNA 바이러스 벡터인, 벡터를 포함한다.
실시양태 18b는 실시양태 18a에 있어서, RNA 레플리콘인, 벡터를 포함한다.
실시양태 18c는 실시양태 16에 있어서, 변형된 백시니아 앙카라(MVA) 벡터 또는 아데노바이러스 벡터인, 벡터를 포함한다.
실시양태 18c1은 실시양태 18c에 있어서, MVA-BN 벡터인, 벡터를 포함한다.
실시양태 18c2는 실시양태 18c에 있어서, Ad26 또는 Ad35 벡터인, 벡터를 포함한다.
실시양태 19는 RNA 레플리콘으로서, 5'-말단에서 3'-말단의 순서로 하기를 포함하는, RNA 레플리콘을 포함한다:
(1) RNA 바이러스의 비구조 단백질-매개 증폭에 필요한 5' 비번역 영역(5'-UTR);
(2) RNA 바이러스의 비구조 단백질 중 적어도 하나, 바람직하게는 모두를 인코딩하는 폴리뉴클레오티드 서열;
(3) RNA 바이러스의 서브게놈 프로모터;
(4) 실시양태 1 내지 15 중 어느 하나의 핵산 분자 또는 조합; 및
(5) RNA 바이러스의 비구조 단백질-매개 증폭에 필요한 3' 비번역 영역(3'-UTR).
실시양태 20은 RNA 레플리콘으로서, 5'-말단에서 3'-말단의 순서로 하기를 포함하는, RNA 레플리콘을 포함한다:
(1) 알파바이러스 5' 비번역 영역(5'-UTR),
(2) 알파바이러스 비구조 유전자 nsp1의 5' 복제 서열,
(3) 바이러스 종의 다운스트림 루프(DLP) 모티프,
(4) 제4 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열,
(5) 알파바이러스 비구조 단백질 nsp1, nsp2, nsp3 및 nsp4를 인코딩하는 폴리뉴클레오티드 서열,
(6) 알파바이러스 서브게놈 프로모터,
(7) 실시양태 1 내지 15 중 어느 하나의 핵산 분자 또는 조합,
(8) 알파바이러스 3' 비번역 영역(3' UTR), 및
(9) 선택적으로, 폴리 아데노신 서열.
실시양태 21은 실시양태 20에 있어서, DLP 모티프는 동부 말 뇌염 바이러스(EEEV), 베네수엘라 말 뇌염 바이러스(VEEV), 에버글레이즈 바이러스(EVEV), 무캄보 바이러스(MUCV), 셈리키 포레스트 바이러스(SFV), 픽수나 바이러스(PIXV), 미들버그 바이러스(MTDV), 치쿤구니야 바이러스(CHIKV), 오니옹-니옹 바이러스(ONNV), 로스 리버 바이러스(RRV), 바마 포레스트 바이러스(BF), 게타 바이러스(GET), 사기야마 바이러스(SAGV), 베바루 바이러스(BEBV), 마야로 바이러스(MAYV), Una 바이러스(U AV), 신드비스 바이러스(SINV), 아우라 바이러스(AURAV), 와타로아 바이러스(WHAV), 바반키 바이러스(BABV), 키질라가크 바이러스(KYZV), 서부 말 뇌염 바이러스(WEEV), 하이랜드 J 바이러스(HJV), 포트 모건 바이러스(FMV), Ndumu(NDUV), 및 버기 크릭 바이러스로 이루어진 군으로부터 선택된 바이러스 종으로부터 유래되는, RNA 레플리콘을 포함한다.
실시양태 22는 실시양태 21에 있어서, 제4 오토프로테아제 펩타이드는 돼지 테세호바이러스-1 2A(P2A), 구제역 바이러스(FMDV) 2A(F2A), 말 비염 A 바이러스(ERAV) 2A(E2A), 테세아 아시그나 바이러스 2A(T2A), 세포질 다각체병 바이러스 2A(BmCPV2A), 무름병 바이러스 2 A(BmIFV2A), 및 이들의 조합으로 이루어진 군으로부터 선택되는, RNA 레플리콘을 포함한다.
실시양태 22a는 실시양태 22에 있어서, 제4 오토프로테아제 펩타이드는 P2A의 펩타이드 서열을 포함하는, RNA 레플리콘을 포함한다.
실시양태 22b는 실시양태 22 또는 22a에 있어서, 제4 오토프로테아제 펩타이드는 서열번호 11의 펩타이드 서열을 포함하는, RNA 레플리콘을 포함한다.
실시양태 23은 RNA 레플리콘으로서, 5'-말단에서 3'-말단의 순서로 하기를 포함하는, RNA 레플리콘을 포함한다:
(1) 서열번호 55의 폴리뉴클레오티드 서열을 갖는 5'-UTR,
(2) 서열번호 56의 폴리뉴클레오티드 서열을 갖는 5' 복제 서열,
(3) 서열번호 57의 폴리뉴클레오티드 서열을 포함하는 DLP 모티프,
(4) 서열번호 11의 P2A 서열을 인코딩하는 폴리뉴클레오티드 서열,
(5) 각각 서열번호 58, 서열번호 59, 서열번호 60 및 서열번호 61의 핵산 서열에 의해 인코딩된 알파바이러스 비구조 단백질 nsp1, nsp2, nsp3 및 nsp4를 인코딩하는 폴리뉴클레오티드 서열,
(6) 서열번호 62의 폴리뉴클레오티드 서열을 갖는 서브게놈 프로모터,
(7) 실시양태 1 내지 15 중 어느 하나의 핵산 분자 또는 조합, 및
(8) 서열번호 63의 폴리뉴클레오티드 서열을 갖는 3' UTR.
실시양태 24는 실시양태 23에 있어서,
(i) P2A 서열을 인코딩하는 폴리뉴클레오티드 서열은 서열번호 12를 포함하고,
(ii) 알파바이러스 비구조 단백질 nsp1, nsp2, nsp3 및 nsp4를 인코딩하는 폴리뉴클레오티드 서열은 각각 서열번호 58, 서열번호 59, 서열번호 60 및 서열번호 61의 핵산 서열을 갖고;
(iii) 핵산 분자 또는 조합은 서열번호 15 내지 54 중 어느 하나의 폴리뉴클레오티드 서열을 포함하고,
(iv) RNA 레플리콘은 폴리 아데노신 서열을 추가로 포함하고, 바람직하게는 폴리 아데노신 서열은 레플리콘의 3'-말단에서 서열번호 64의 서열을 갖는, RNA 레플리콘을 포함한다.
실시양태 25는 RNA 레플리콘으로서, 서열번호 65 내지 72 중 어느 하나의 폴리뉴클레오티드 서열을 포함하는, RNA 레플리콘을 포함한다.
실시양태 26은 실시양태 19 내지 25 중 어느 한 실시양태의 RNA 레플리콘을 인코딩하는 폴리뉴클레오티드 서열을 포함하는 핵산 분자로서, 바람직하게는, 핵산은 DNA 서열의 5'-말단에 작동적으로 연결된 T7 프로모터를 추가로 포함하고, 보다 바람직하게는, T7 프로모터는 서열번호 73의 뉴클레오티드 서열을 포함하는, 핵산 분자를 포함한다.
실시양태 27은 약제학적 조성물로서, 실시양태 1 내지 15 및 26 중 어느 한 실시양태의 핵산 분자 또는 조합, 실시양태 16 내지 18c2 중 어느 한 실시양태의 벡터, 또는 실시양태 19 내지 25 중 어느 한 실시양태의 RNA 레플리콘, 및 약제학적으로 허용되는 담체를 포함하는, 약제학적 조성물을 포함한다.
실시양태 28은 실시양태 27에 있어서, 약제학적으로 허용되는 담체는 하나 이상의 지질을 포함하는, 약제학적 조성물을 포함한다.
실시양태 28a는 실시양태 28에 있어서, 하나 이상의 지질은 양이온성 지질을 포함하는, 약제학적 조성물을 포함한다.
실시양태 28a1은 실시양태 28a에 있어서, 양이온성 지질은 이온화 가능한 양이온성 지질인, 약제학적 조성물을 포함한다.
실시양태 28a2는 실시양태 28a에 있어서, 양이온성 지질은 ALC-0315(((4-하이드록시부틸)아잔디일)비스(헥산-6,1-디일)비스(2-헥실데카노에이트)), DOTMA(N-D-(2,3-디올레일옥시) 프로필 N,N,N-트리메틸암모늄 클로라이드), DOTAP(1,2-비스 (올레일옥시)-3(트리메틸암모니오)프로판), DDAB(디메틸디옥타데실-암모늄 브로마이드), DOGS(디옥타데실아미도글리실 스페르민), DOPE(1,2-딜레오일-sn-3-포스포에탄올아민), DSDMA, DODMA, DLinDMA, DLenDMA, γ-DLenDMA, DLin-K-DMA, DLin-K-C2-DMA, DLin-K-C3-DMA, DLin-K-C4-DMA, DLen-C2K-DMA, y-DLen-C2K-DMA, DLin-M-C2-DMA, DLin-M-C3-DMA, DLin-MP-DMA, 및 DCChol(3 베타-(N―(N'.N'-디메틸 아미노메탄)카바모일) 콜레스테롤), 및 이들의 조합으로 이루어진 군으로부터 선택되는, 약제학적 조성물을 포함한다.
실시양태 28a3은 실시양태 28a 내지 28a2 중 어느 한 실시양태에 있어서, 양이온성 지질은 ALC-0315인, 약제학적 조성물을 포함한다.
실시양태 28b는 실시양태 28a 내지 28a3 중 어느 한 실시양태에 있어서, (a) 폴리에틸렌 글리콜(PEG) 지질 또는 PEG-변형된 지질, (b) 헬퍼 지질, 및 (c) 스테롤 중 하나 이상을 추가로 포함하는, 약제학적 조성물을 포함한다.
실시양태 28b1은 실시양태 28b에 있어서, PEG 지질 또는 PEG-변형된 지질은 2-[(폴리에틸렌 글리콜)-2000]-N,N-디테트라데실아세트아미드(ALC-0159), PEG550-PE, PEG750-PE, PEG2000-DMG, PEG-DSPE, PEG-DAA, PEG-DAG, PEG-PE, 모노메톡시폴리에틸렌 글리콜(MePEG-OH), 모노메톡시폴리에틸렌 글리콜-석시네이트(MePEG-S), 모노메톡시폴리에틸렌 글리콜-석신이미딜 석시네이트(MePEG-S-NHS), 모노메톡시폴리에틸렌 글리콜-아민(MePEG-NH2), 모노메톡시폴리에틸렌 글리콜-트레실레이트(MePEG-TRES), 모노메톡시폴리에틸렌 글리콜-이미다졸릴-카보닐(MePEG-IM), 및 이들의 조합으로 이루어진 군으로부터 선택되는, 약제학적 조성물을 포함한다.
실시양태 28b2는 실시양태 28b 또는 28b1에 있어서, PEG 지질은 ALC-0159인, 약제학적 조성물을 포함한다.
실시양태 28c는 실시양태 28b 내지 28b2 중 어느 한 실시양태에 있어서, 헬퍼 지질은 중성 지질, 중성 헬퍼 지질, 비-양이온성 지질, 비-양이온성 헬퍼 지질, 음이온성 지질, 음이온성 헬퍼 지질, 또는 양쪽이온성 지질, 또는 이들의 조합으로 이루어진 군으로부터 선택된다.
실시양태 28c1은 실시양태 28c에 있어서, 헬퍼 지질은 디스테아로일포스파티딜콜린(DSPC), 레시틴, 포스파티딜에탄올아민, 리소레시틴, 리소포스파티딜에탄올아민, 포스파티딜세린, 포스파티딜이노시톨, 스핑고미엘린, 에그 스핑고미엘린(ESM), 세팔린, 카디오리핀, 포스파티드산, 세레브로사이드, 디세틸포스페이트, 디올레오일포스파티딜콜린(DOPC), 디팔미토일포스파티딜콜린(DPPC), 디올레오일포스파티딜글리세롤(DOPG), 디팔미토일포스파티딜글리세롤(DPPG), 디올레오일포스파티딜에탄올아민(DOPE), 팔미토일올레오일-포스파티딜콜린(POPC), 팔미토일올레오일-포스파티딜에탄올아민(POPE), 팔미토일올레오일-포스파티딜글리세롤(POPG), 디올레오일포스파티딜에탄올아민 4-(N-말레이미도메틸)-사이클로헥산-1-카복실레이트(DOPE-mal), 디팔미토일-포스파티딜에탄올아민(DPPE), 디미리스토일-포스파티딜에탄올아민(DMPE), 디스테아로일-포스파티딜에탄올아민(DSPE), 모노메틸-포스파티딜에탄올아민, 디메틸-포스파티딜에탄올아민, 디엘라이도일-포스파티딜에탄올아민(DEPE), 스테아로일올레오일-포스파티딜에탄올아민(SOPE), 리소포스파티딜콜린, 디리놀레오일포스파티딜콜린, 및 이들의 혼합물로 이루어진 군으로부터 선택되는, 약제학적 조성물을 포함한다.
실시양태 28c2는 실시양태 28c 또는 28c1에 있어서, 헬퍼 지질은 디스테아로일포스파티딜콜린(DSPC)인, 약제학적 조성물을 포함한다.
실시양태 28d는 실시양태 28b 내지 28c2 중 어느 한 실시양태에 있어서, 스테롤은 콜레스테롤, 5α-콜레스타놀, 5α-코프로스타놀, 콜레스테릴-(2'-하이드록시)-에틸 에테르, 콜레스테릴-(4'-하이드록시)-부틸 에테르, 6-케토콜레스타놀, 5α-콜레스탄, 콜레스테논, 5α-콜레스타논, 5α-콜레스타논, 콜레스테릴 데카노에이트, 및 이들의 혼합물로 이루어진 군으로부터 선택되는, 약제학적 조성물을 포함한다.
실시양태 28d1은 실시양태 28d에 있어서, 스테롤은 콜레스테롤인, 약제학적 조성물을 포함한다.
실시양태 28e는 실시양태 28 내지 28d1 중 어느 한 실시양태에 있어서, 하나 이상의 지질은 ALC-0315, ALC-0159, DSPC, 및 콜레스테롤을 포함하는, 약제학적 조성물을 포함한다.
실시양태 28f는 실시양태 28 내지 28e 중 어느 한 실시양태에 있어서, 약제학적으로 허용되는 담체는 지질 나노입자를 포함하는, 약제학적 조성물을 포함한다.
실시양태 29는 실시양태 27 내지 28f 중 어느 한 실시양태에 있어서, 하기를 추가로 포함하는, 약제학적 조성물을 포함한다:
(1) 서열번호 84, 85 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열; 또는
(2) 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 84, 85 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열.
실시양태 30은 HBV에 대해 대상체를 백신접종하는 방법으로서, 상기 방법은 실시양태 27 내지 28f 중 어느 한 실시양태의 약제학적 조성물을 대상체, 바람직하게는 만성 HBV 감염을 가진 대상체에게 투여하는 단계를 포함하는, HBV에 대해 대상체를 백신접종하는 방법을 포함한다.
실시양태 30a는 실시양태 27 내지 28f 중 어느 한 실시양태에 있어서, HBV에 대한 대상체, 바람직하게는 만성 HBV 감염을 가진 대상체를 백신접종하는 데 사용하기 위한, 약제학적 조성물을 포함한다.
실시양태 30b는 실시양태 30a에 있어서, 프라임-부스트 용법으로서 사용하기 위한 적어도 하나의 동일한 HBV 에피토프, 예컨대 적어도 하나의 동일한 HLA 에피토프, 바람직하게는 적어도 하나의 동일한 항원을 인코딩하는 핵산 분자를 포함하는 제2 조성물을 추가로 포함하는, 약제학적 조성물을 포함한다.
실시양태 30c는 실시양태 27 내지 28f 중 어느 한 실시양태에 있어서, HBV 감염의 치료에 사용하기 위한, 약제학적 조성물을 포함한다.
실시양태 31은 실시양태 30에 있어서, 프라임-부스트 용법에서 적어도 하나의 동일한 HBV 에피토프, 예컨대 적어도 하나의 동일한 HLA 에피토프, 바람직하게는 적어도 하나의 동일한 항원을 인코딩하는 핵산 분자를 포함하는 제2 조성물을 대상체에게 투여하는 단계를 추가로 포함하는, 방법을 포함한다.
실시양태 32는 실시양태 31에 있어서, 프라임-부스트 용법은 실시양태 19 내지 제25항 중 어느 한 실시양태의 RNA 레플리콘을 포함하는 제1 조성물, 및 RNA 레플리콘이 아니고 적어도 하나의 동일한 HBV 에피토프, 예컨대 적어도 하나의 동일한 HLA 에피토프를 인코딩하는 벡터를 포함하는 제2 조성물, 바람직하게는 프라이밍 조성물로서 적어도 하나의 동일한 항원을 포함하는, 방법을 포함한다.
실시양태 32a는 실시양태 32에 있어서, 제1 조성물은 면역화 프라이밍에 사용되고 제2 조성물은 프라임-부스트 용법에서 면역화 부스팅에 사용되는, 방법을 포함한다.
실시양태 32b는 실시양태 32에 있어서, 제2 조성물은 면역화 프라이밍에 사용되고 제1 조성물은 프라임-부스트 용법에서 면역화 부스팅에 사용되는, 방법을 포함한다.
실시양태 33은 실시양태 32 내지 32b 중 어느 한 실시양태에 있어서, 제2 조성물은 변형된 백시니아 앙카라(MVA) 벡터, 아데노바이러스 벡터, 또는 플라스미드를 포함하는, 방법을 포함한다.
실시양태 33a는 실시양태 33에 있어서, 제2 조성물은 MVA-BN 벡터를 포함하는, 방법을 포함한다.
실시양태 33b는 실시양태 33에 있어서, 제2 조성물은 Ad26 또는 Ad35 벡터를 포함하는, 방법을 포함한다.
실시양태 34는 대상체에서 HBV의 감염 및/또는 복제를 감소시키는 방법으로서, 실시양태 27-28f 중 어느 한 실시양태에 따른 약제학적 조성물을 대상체에게 투여하거나 실시양태 30 또는 31 내지 33b 중 어느 한 실시양태에 따라 대상체를 백신접종하는 단계를 포함하는, 대상체에서 HBV의 감염 및/또는 복제를 감소시키는 방법을 포함한다.
실시양태 34a는 실시양태 30 또는 31 내지 34 중 어느 한 실시양태에 있어서, 대상체는 HLA-A*11:01 대상체, HLA-A*24:02 대상체, HLA-A*02:01 대상체, HLA-A*A2402 대상체, HLA-A*A0101 대상체 및 HLA-B*40:01 대상체로 이루어진 군으로부터 선택되는, 방법을 포함한다.
실시양태 34a1은 실시양태 34a에 있어서, 대상체는 HLA-A*11:01 대상체, HLA-A*24:02 대상체, HLA-A*02:01 대상체 및 HLA-A*A2402 대상체로 이루어진 군으로부터 선택되는, 방법을 포함한다.
실시양태 34a2는 실시양태 34a 또는 34a1에 있어서, 대상체는 HLA-A*11:01 대상체, HLA-A*24:02 대상체 및 HLA-A*02:01 대상체로 이루어진 군으로부터 선택되는, 방법을 포함한다.
실시양태 34a3은 실시양태 34a 내지 34a2 중 어느 한 실시양태에 있어서, 대상체는 HLA-A*11:01 대상체인, 방법을 포함한다.
실시양태 34a4는 실시양태 34a 내지 34a3 중 어느 한 실시양태에 있어서, 대상체는 인간 환자인, 방법을 포함한다.
실시양태 34b는 실시양태 30 또는 31 내지 34 중 어느 한 실시양태에 있어서, 대상체는 HLA-A*11:01 에피토프, HLA-A*24:02 에피토프, HLA-A*02:01 에피토프, HLA-A*A2402 에피토프, HLA-A*A0101 에피토프 및 HLA-B*40:01 에피토프로 이루어진 군으로부터 선택된 하나 이상의 에피토프를 함유하는 적어도 하나의 HBV 항원을 포함하는, 방법을 포함한다.
실시양태 34b1은 실시양태 34b에 있어서, 대상체는 HLA-A*11:01 에피토프, HLA-A*24:02 에피토프, HLA-A*02:01 에피토프 및 HLA-A*A2402 에피토프로 이루어진 군으로부터 선택된 하나 이상의 에피토프를 함유하는 적어도 하나의 HBV 항원을 포함하는, 방법을 포함한다.
실시양태 34b2는 실시양태 34b 또는 34b1에 있어서, 대상체는 HLA-A*11:01 에피토프, HLA-A*24:02 에피토프 및 HLA-A*02:01 에피토프로 이루어진 군으로부터 선택된 하나 이상의 에피토프를 함유하는 적어도 하나의 HBV 항원을 포함하는, 방법을 포함한다.
실시양태 34b3은 실시양태 34b 내지 34b2 중 어느 한 실시양태에 있어서, 대상체는 하나 이상의 HLA-A*11:01 에피토프를 함유하는 적어도 하나의 HBV 항원을 포함하는, 방법을 포함한다.
실시양태 34b4는 실시양태 34b 내지 34b3 중 어느 한 실시양태에서, 대상체는 인간 환자인, 방법을 포함한다.
실시양태 35는 단리된 숙주 세포로서, 실시양태 1 내지 15 및 26 중 어느 한 실시양태의 핵산 분자 또는 조합, 실시양태 16 내지 18c2 중 어느 한 실시 양태의 벡터, 또는 실시양태 19 내지 25 중 어느 한 실시양태의 RNA 레플리콘을 포함하는, 단리된 숙주 세포를 포함한다.
실시양태 36은 RNA 레플리콘을 생성하는 방법으로서, 실시양태 26에 따른 핵산을 생체내 또는 시험관내에서 전사하는 단계를 포함하는, RNA 레플리콘을 생성하는 방법을 포함한다.
실시양태 36a는 실시양태 36에 있어서, 핵산은 비인간 동물의 생체내에서 전사되는, 방법을 포함한다.
실시양태 36b는 실시양태 36에 있어서, 핵산은 인간의 생체내에서 전사되는, 방법을 포함한다.
실시양태 37은 실시양태 27 내지 28f 중 어느 한 실시양태에 있어서, 이를 필요로 하는 대상체, 바람직하게는 만성 HBV 감염을 가진 대상체에서 선택적으로 또 다른 면역원성 제제 또는 다른 항-HBV 제제와 조합하여 B형 간염 바이러스(HBV)에 대한 면역 반응을 유도하는 데 사용하기 위한, 약제학적 조성물을 포함한다,
실시양태 37a는 실시양태 37에 있어서, 다른 항-HBV 제제는 소분자, 항체 또는 이의 항원 결합 단편, 폴리펩타이드, 단백질, 또는 핵산인, 약제학적 조성물을 포함한다.
실시양태 37b는 실시양태 27 내지 28f 중 어느 한 실시양태의 약제학적 조성물을 대상체에게 투여하는 단계를 포함하는, 이를 필요로 하는 대상체에서 B형 간염 바이러스(HBV)에 대한 면역 반응을 유도하는 방법으로서, 선택적으로 상기 방법은 또 다른 면역원성 제제 및/또는 또 다른 항-HBV 제제를 대상체, 바람직하게는 만성 HBV 감염을 가진 대상체에게 투여하는 단계를 추가로 포함하는 방법을 포함한다.
실시양태 38은 실시양태 27 내지 28f 중 어느 한 실시양태에 있어서, 이를 필요로 하는 대상체, 바람직하게는 만성 HBV 감염을 가진 대상체에서 선택적으로 또 다른 치료제, 바람직하게는 또 다른 항-HBV 제제와 조합하여 진행성 섬유증, 간경변 및 간세포 암종(HCC)으로 이루어진 군으로부터 선택된 B형 간염 바이러스(HBV)-유발 질환을 치료하는 데 사용하기 위한, 약제학적 조성물을 포함한다.
실시양태 38a는 이를 필요로 하는 대상체에서 B형 간염 바이러스(HBV)-유발 질환을 치료하는 방법으로서, 실시양태 27 내지 28f 중 어느 한 실시양태의 약제학적 조성물을 대상체에게 투여하는 단계를 포함하고, 선택적으로 상기 방법은 또 다른 치료제, 바람직하게는 또 다른 항-HBV 제제를 대상체에게 투여하는 단계를 추가로 포함하고, 바람직하게는 상기 대상체는 만성 HBV 감염을 가지며 HBV-유발 질환은 진행성 섬유증, 간경변 및 간세포 암종(HCC)으로 이루어진 군으로부터 선택되는, 방법을 포함한다.
실시양태 39는 단리된 HBV 항원으로서, 서열번호 1, 3, 5, 9, 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 포함하는, 단리된 HBV 항원을 포함한다.
실시양태 39a는 실시양태 39에 있어서, HBV 항원은 HBV 유전자형 A, B, C 및 D에 대한 컨센서스 서열을 포함하는, 단리된 HBV 항원을 포함한다.
실시양태 39b는 실시양태 39 또는 39a에 있어서, HBV 항원은 HLA-A*11:01, HLA-A*24:02, HLA-A*02:01, HLA-A*A2402, HLA-A*A0101 및 HLA-B*40:01에 대한 에피토프 중 적어도 2개, 3개, 4개, 5개 또는 모두를 포함하는, 단리된 HBV 항원을 포함한다.
실시양태 39c는 실시양태 39 내지 39b 중 어느 한 실시양태에 있어서, 서열번호 1, 3, 5, 9, 84, 85, 또는 86 중 어느 한 실시양태의 아미노산 서열로 이루어진, 단리된 HBV 항원을 포함한다.
실시양태 40은 단리된 폴리뉴클레오티드 서열로서, 실시양태 39 내지 39c 중 어느 한 실시양태의 HBV 항원을 인코딩하는, 단리된 폴리뉴클레오티드 서열을 포함한다.
실시양태 40a는 실시양태 40에 있어서, 서열번호 2, 4, 6, 10, 87, 88, 또는 89 중 어느 한 실시양태의 뉴클레오티드 서열을 포함하는, 단리된 폴리뉴클레오티드 서열을 포함한다.
실시양태 40b는 실시양태 40에 있어서, 서열번호 2, 4, 6, 10, 87, 88, 또는 89 중 어느 한 실시양태의 뉴클레오티드 서열로 이루어진, 단리된 폴리뉴클레오티드 서열을 포함한다.
실시양태 41은 벡터로서, 실시양태 40 내지 40b 중 어느 한 실시양태의 폴리뉴클레오티드 서열을 포함하는, 벡터를 포함한다.
실시양태 41a는 실시양태 41에 있어서, 플라스미드인, 벡터를 포함한다.
실시양태 41b는 실시양태 41에 있어서, 바이러스 벡터인, 벡터를 포함한다.
실시양태 41b1은 실시양태 41b에 있어서, MVA 벡터, 바람직하게는 MVA-BN인, 벡터를 포함한다.
실시양태 41b2는 실시양태 41b에 있어서, 아데노바이러스 벡터, 바람직하게는 Ad26 또는 Ad35인, 벡터를 포함한다.
실시양태 41c는 실시양태 41에 있어서, RNA 레플리콘인, 벡터를 포함한다.
실시양태 42는 약제학적 조성물로서, 실시양태 39 내지 39c 중 어느 한 실시양태의 단리된 HBV 항원, 실시양태 40 내지 40b 중 어느 한 실시양태의 단리된 폴리뉴클레오티드 서열, 또는 실시양태 41 내지 41c 중 어느 한 실시양태의 벡터를 포함하는, 약제학적 조성물이다.
실시양태 43은 실시양태 42의 약제학적 조성물을 대상체에게 투여하는 단계를 포함하는, 이를 필요로 하는 대상체에서 면역 반응을 유도하는 방법이다.
실시양태 43a는 실시양태 42에 있어서, 이를 필요로 하는 대상체, 바람직하게는 만성 HBV 감염을 가진 대상체에서 선택적으로 또 다른 면역원성 제제, 바람직하게는 또 다른 항-HBV 제제와 조합하여 B형 간염 바이러스(HBV)에 대한 면역 반응을 유도하는 데 사용하기 위한, 약제학적 조성물을 포함한다.
실시양태 44는 단리된 숙주 세포로서, 실시양태 40 내지 40b 중 어느 한 실시양태의 핵산 분자, 실시양태 41 내지 41c 중 어느 한 실시양태의 벡터를 포함하는, 단리된 숙주 세포를 포함한다.
실시예
실시예 1: 레플리콘 백신 후보의 항원 선택, 설계 및 시험관내 평가
L 표면 항원으로부터의 고도의 면역원성 HBV 단백질 코어, Pol, PreS2.S 및 PreS1 도메인을 각각 레플리콘 HBV 치료 백신에 포함시키기 위해 선택하였다. 면역원성을 집중화하기 위해, 유전자형 A, B, C 및 D로부터의 각 항원에 대한 고유한 서열의 정렬에 기초하여 컨센서스 서열을 생성하였다. 전 세계 만성 B형 간염(CHB) 감염의 > 78%를 차지하는 이러한 4가지 유전자형을 포함함으로써, 치료 가능한 표적 집단의 규모가 최대화된다. 중국, 미국 및 유럽에서 상위 3개의 가장 흔한 MHC 부류 I HLA 대립유전자(HLA-A*11:01, HLA-A*24:02, HLA-A*02:01, HLA-A*A0201, HLA-A*A2402, HLA-A* A0101 및 HLA-B*40:01 포함)에 대한 알려진 인간 T 세포 에피토프를 각각의 컨센서스 서열에 맵핑하였다. 알려진 에피토프가 변경된 것으로 밝혀지면, 컨센서스 서열을 조정하여 에피토프를 복원하였다. 예를 들어, C 말단의 Arg149, 150 및 151은 HBV 치료용 백신에 인코딩된 HBV 코어에 포함되었다. Pol은 이의 역전사효소 및 RNase H 활성을 불활성화하도록 더욱 최적화되었다. 시스타틴 S 전구체 신호 펩타이드는 분비를 향상시키기 위해 Core, Pol 및 PreS1 도메인에 첨가되었으며, PreS2.S의 내부 신호 펩타이드는 PreS2.S 단백질 생성물 M 및 S 분비를 촉진하기 위해 그대로 유지하였다. 마지막으로, 각 항원에 대한 아미노산 서열을 역번역하고 인간에서 발현을 최대화하도록 코돈을 최적화하였다(도 1a).
이러한 항원은 레플리콘 내에서 각각의 항원의 상이한 위치를 갖는 레플리콘 단독 또는 멀티시스트론 구성으로 인코딩되었고, 각각은 P2A 리보솜 스킵 요소 또는 EMCV 또는 EV71로부터의 내부 리보솜 진입 부위(IRES)에 의해 연결되었다(도 1b). 플라스미드 주형을 사용하여, 각 레플리콘 설계에 대한 RNA를 시험관내 전사 반응으로 생성하고, Vero 세포에 전기천공하였다. 전기천공 24-48시간 후, 각 항원의 발현 및 분비를 유세포 분석, 웨스턴 블롯 분석 및 ELISA로 측정하였다. 이중 가닥 RNA(dsRNA) 및 항원-양성 세포의 빈도 또한 레플리콘 증폭 효율의 지표로서 검정되었다. 각 작제물에 대해, 모든 항원은 단일 항원을 발현하는 레플리콘에 비해 항원/dsRNA 양성 세포의 1) 발현, 2) 분비 및 3) 빈도의 상대적 수준을 기반으로 스코어를 부여받았다. 항원 스코어를 가중하고 합하여 총 레플리콘 작제물 스코어를 얻었다(하기 표 1). 각 작제물은 이러한 스코어에 기반하여 순위가 매겨졌으며 상위 4개의 바이시스트론 및 상위 4개의 테트라시스트론 작제물이 선택되어 생체내 평가로 진행되었다(도 2). 동점 작제물 스코어의 경우, 유전자 스코어는 이들 작제물의 순위를 매기기 위해 사용된 다음의 순서로 우선순위가 지정되었다: 코어 > Pol > PreS2.S > PreS1. 또한, 각 항원의 보다 유사한 상대적 발현 수준을 갖는 작제물이 단일 항원의 높은 발현 및 다른 항원의 낮은 발현을 갖는 작제물보다 우선순위가 지정되었다.
Figure pct00010
도 2는 단일유전자 대조군에 비해 상위 8개의 레플리콘으로부터의 각 항원의 발현을 나타낸다. 모든 작제물은 각각의 항원의 상대적으로 높은 수준의 발현을 유지할 수 있었다. 그러나, 코어 및 pol을 동일한 바이시스트로론 레플리콘 RNA로부터 발현시켰을 때, 코어 발현의 감소가 관찰되었다. 대조적으로, 동일한 레플리콘으로부터 Core, Pol, PreS2.S 및 PreS1을 발현하는 테트라시스트론 레플리콘은 단일유전자 대조군에 비해 코어 발현이 2-3배 증가함을 일관되게 나타내었다. 트리시스트론 레플리콘 RNA로부터 코어, Pol 및 PreS2.S의 발현은 또한 코어 발현 수준의 증가를 초래했지만(도 3), PreS1이 동일한 레플리콘 RNA로부터 발현되었을 때만큼 극적으로 증가하지는 않았다.
실시예 2: SMARRT 레플리콘 RNA 플랫폼은 마우스에서 HBV 표적에 대한 세포 반응을 유도한다
이들 연구의 목적은 HBV 항원을 인코딩하는 합성 변형 알파 RNA 레플리콘 기술(SMARRT: Synthetic Modified Alpha RNA replicon technology)이 C57BL/6 마우스에서 면역 반응을 유도할 수 있는지 결정하는 것이다. SMARRT 단일유전자 HBV 작제물은 15 μg으로 투여되었고 혼합된 그룹은 각 레플리콘 15 μg에서 4개의 SMARRT 단일유전자 레플리콘을 받았다(마우스당 총 60 μg RNA). 0주차에, 지시된 SMARRT 작제물(들)을 IM 주사에 의해 마우스를 면역화시켰고, 대조군에는 식염수를 주사하였다. 2주차에, 모든 동물을 희생시키고, 비장 세포를 삽입물에서 항원 서열을 포함하는 15량체 중첩 펩타이드 풀로 자극하였다(SMARRT. Pol의 경우, 중첩 라이브러리는 2개의 풀로 분할되었음). IFN γ-생성 세포의 유도를 IFN γ ELISpot에 의해 측정하였다. CD8 및 CD4 다기능성 T 세포 반응은 유세포 분석에 의해 IFN-γ, TNFα 및 IL-2의 생성을 측정함으로써 결정하였다. 아래 표 2는 다양한 실험군을 나타낸다.
Figure pct00011
HBV 항원을 인코딩하는 SMARRT 레플리콘으로 면역화된 모든 동물은 적절한 항원 서열을 포함하는 펩타이드로 자극 시 IFN γ-생성 세포를 발달시켰다(도 4). 또한, 4개의 SMARRT 레플리콘을 혼합하면 IFNγ 생성 세포가 4개의 항원 모두에 대해 유도되었다. 동일하지만 별개의 실험에서, 다기능성 T 세포 사이토카인 생성을 세포내 유세포 분석으로 측정하였다(도 5). 이 실험은 SMARRT.Core 또는 SMARRT.PreS1로 마우스를 면역화하면 C57BL/6 마우스에서 다기능성 CD4 T 세포를 유도함을 나타내었다. SMARRT.Pol 및 SMARRT.PreS2.S 면역화는 마우스에서 다기능성 CD4 및 CD8 T 세포 반응 둘 모두를 초래하였다.
실시예 3: 마우스에서 SMARRT HBV 치료 백신 후보의 하향 선택
시험관내 스크리닝 후, 마우스에서 생체내 면역원성 분석을 위해 8개의 작제물을 선택하였고, 여기에는 4개의 HBV 항원 모두를 전달하기 위해 4개의 조합으로 혼합된 4개의 테트라시스트론 작제물 및 4개의 이중유전자 작제물이 포함되었다. C57BL/6 마우스를 0주차에 면역화시킨 다음, 아래 표 3의 실험 개요에 따라 면역원성 분석을 위해 2주차에 비장을 적출하였다. 생체외 연구에는 IFNγ ELISpot 및 세포내 사이토카인 염색이 포함되었다.
Figure pct00012
IFNγ ELISpot에 의해 측정된 바와 같이, 모든 이중유전자 및 테트라시스트론 작제물은 HBV 코어(도 6a), Pol(도 6b), 및 PreS2.S(도 6c)에 대해 강한 T 세포 반응을 유도하였다. 모든 이중유전자 및 테트라시스트론 작제물은 PreS1에 대한 T 세포 반응을 유도했으며(도 6d), 작제물에 따라 약간의 가변성이 있다. 가장 강한 PreS1 반응은 이중유전자 2 및 3(그룹 9), 이중유전자 2 및 4(군 10) 및 테트라시스트론 작제물(그룹 11-14)의 혼합물에 의해 유도되었다.
모든 이중유전자 및 테트라시스트론 작제물은 다중 사이토카인을 생성하는 능력에 의해 측정된 바와 같이 코어(도 7a), Pol(도 7b), PreS2.S(도 7c) 및 PreS1(도 7d)에 대해 다기능성 CD4+ 및 CD8+ T 세포 반응을 유도하였다. PreS1에 대한 반응은 이중유전자 2 및 3(그룹 9), 이중유전자 2 및 4(그룹 10) 및 테트라시스트론 작제물(그룹 11-14)의 혼합물에 의해 유도된 가장 강한 반응으로 작제물에 따라 더 다양했다.
실시예 4: 비인간 영장류에서 SMARRT HBV 치료 백신 후보의 하향 선택
마우스에서 선택된, 선택된 작제물이 대형 동물에서 면역원성임을 확인하기 위해, 사이노몰구스 원숭이(M. fascicularis)에서 면역원성 연구를 수행할 것이다. NHP는 0주차에 2개의 상이한 SMARRT 백신 후보로 면역화한 다음, 4주마다 추가로 3회 부스팅하였다. SMARRT의 3가지 상이한 용량 수준은 아래 표 4에 나타낸 바와 같이 평가될 것이다. 생체외 검정은 주사 후 10일째에 기능적 T 세포 반응을 결정하기 위해 PBMC를 사용하여 IFNγ ELISpot 및 세포내 사이토카인 염색을 유도할 것이다. ELISA에 의해 항-HBsAg 항체 수준을 측정하기 위해 주사일에 혈청을 채취할 것이다. 혈청은 또한 주사 당일뿐만 아니라 주사 후 6시간 및 주사 후 24시간에 수집되어 사이토카인 및 C-반응성 단백질 수준을 측정할 것이다.
Figure pct00013
본 발명의 범위 및 정신으로부터 벗어나지 않으면서 본원에 개시된 본 발명에 다양한 치환 및 변형이 이루어질 수 있다는 것은 당업자에게 쉽게 명백할 것이다.
본 명세서에 언급된 모든 특허 및 간행물은 본 발명이 속하는 기술분야에서 숙련가의 수준을 나타낸다.
본원에 적합하게 예시적으로 기재된 본 발명은 본원에 구체적으로 개시되지 않은 임의의 요소 또는 요소들, 제한 또는 제한들이 없이 실시될 수 있다. 따라서, 예를 들어, 본원의 각 경우에서 용어 "포함하는", "~로 본질적으로 이루어진" 및 "~로 이루어진"은 다른 두 용어 중 어느 하나로 대체될 수 있다. 사용된 용어 및 표현은 설명의 용어로서 사용된 것이지 한정되는 것이 아니며, 그러한 용어 및 표현의 사용에 있어서 나타내고 설명된 특징들 또는 그 일부의 임의의 등가물을 배제하는 의도는 없으나, 청구된 본 발명의 범위 내에서 다양한 변형이 가능하다는 것을 인정한다. 또한, 본 발명의 특징 또는 측면이 마쿠쉬 그룹의 관점에서 설명되는 경우, 당업자는 본 발명이 또한 그에 의해 마쿠쉬 그룹의 임의의 개별 구성원 또는 구성원의 서브그룹의 관점에서 설명된다는 것을 인식할 것이다. 예를 들어, X가 브롬, 염소 및 요오드로 이루어진 군으로부터 선택되는 것으로 기재되는 경우, X가 브롬이라는 주장과 X가 브롬 및 염소라는 주장이 충분히 설명되어 있다. 다른 실시양태는 하기 청구범위 내에 있다.
SEQUENCE LISTING <110> Janssen Sciences Ireland Unlimited Company <120> RNA Replicon Vaccines Against HBV <130> TIP1088WOPCT1 <150> US 63/049,400 <151> 2020-07-08 <150> US 63/144,051 <151> 2021-02-01 <160> 92 <170> PatentIn version 3.5 <210> 1 <211> 118 <212> PRT <213> Artificial Sequence <220> <223> PreS1 HBV antigen <400> 1 Gly Gly Trp Ser Ser Lys Pro Arg Lys Gly Met Gly Thr Asn Leu Ser 1 5 10 15 Val Pro Asn Pro Leu Gly Phe Phe Pro Asp His Gln Leu Asp Pro Ala 20 25 30 Phe Gly Ala Asn Ser Asn Asn Pro Asp Trp Asp Phe Asn Pro Asn Lys 35 40 45 Asp His Trp Pro Asp Ala Asn Lys Val Gly Ala Gly Ala Phe Gly Pro 50 55 60 Gly Phe Thr Pro Pro His Gly Gly Leu Leu Gly Trp Ser Pro Gln Ala 65 70 75 80 Gln Gly Ile Leu Thr Thr Val Pro Ala Ala Pro Pro Pro Ala Ser Thr 85 90 95 Asn Arg Gln Ser Gly Arg Gln Pro Thr Pro Leu Ser Pro Pro Leu Arg 100 105 110 Asp Thr His Pro Gln Ala 115 <210> 2 <211> 357 <212> DNA <213> Artificial Sequence <220> <223> PreS1 HBV antigen coding sequence <400> 2 ggtggatgga gctcaaagcc gcggaaaggg atgggtacta acctgtccgt accaaatccc 60 ctgggatttt ttccagacca ccaactcgat cctgcttttg gcgcaaattc caacaatccc 120 gactgggact ttaaccctaa caaggaccac tggcctgatg ccaacaaggt gggggcagga 180 gcctttggtc ccggcttcac cccaccccat ggaggtcttt tgggatggtc accacaggcc 240 cagggcatcc tgaccactgt ccctgctgct ccaccgccag cttctactaa tcgacagagc 300 gggaggcagc cgacccccct gagtcccccc ctgcgggata cccaccctca ggcataa 357 <210> 3 <211> 100 <212> PRT <213> Artificial Sequence <220> <223> D1-19 PreS1 HBV antigen <400> 3 Asn Pro Leu Gly Phe Phe Pro Asp His Gln Leu Asp Pro Ala Phe Gly 1 5 10 15 Ala Asn Ser Asn Asn Pro Asp Trp Asp Phe Asn Pro Asn Lys Asp His 20 25 30 Trp Pro Asp Ala Asn Lys Val Gly Ala Gly Ala Phe Gly Pro Gly Phe 35 40 45 Thr Pro Pro His Gly Gly Leu Leu Gly Trp Ser Pro Gln Ala Gln Gly 50 55 60 Ile Leu Thr Thr Val Pro Ala Ala Pro Pro Pro Ala Ser Thr Asn Arg 65 70 75 80 Gln Ser Gly Arg Gln Pro Thr Pro Leu Ser Pro Pro Leu Arg Asp Thr 85 90 95 His Pro Gln Ala 100 <210> 4 <211> 303 <212> DNA <213> Artificial Sequence <220> <223> D1-19 PreS1 HBV antigen coding sequence <400> 4 aatcccctgg gattttttcc agaccaccaa ctcgatcctg cttttggcgc aaattccaac 60 aatcccgact gggactttaa ccctaacaag gaccactggc ctgatgccaa caaggtgggg 120 gcaggagcct ttggtcccgg cttcacccca ccccatggag gtcttttggg atggtcacca 180 caggcccagg gcatcctgac cactgtccct gctgctccac cgccagcttc tactaatcga 240 cagagcggga ggcagccgac ccccctgagt ccccccctgc gggataccca ccctcaggca 300 taa 303 <210> 5 <211> 281 <212> PRT <213> Artificial Sequence <220> <223> PreS2.S HBV antigen <400> 5 Met Gln Trp Asn Ser Thr Thr Phe His Gln Thr Leu Gln Asp Pro Arg 1 5 10 15 Val Arg Gly Leu Tyr Phe Pro Ala Gly Gly Ser Ser Ser Gly Thr Val 20 25 30 Asn Pro Val Pro Thr Thr Ala Ser Pro Ile Ser Ser Ile Phe Ser Arg 35 40 45 Thr Gly Asp Pro Ala Pro Asn Met Glu Asn Ile Thr Ser Gly Phe Leu 50 55 60 Gly Pro Leu Leu Val Leu Gln Ala Gly Phe Phe Leu Leu Thr Arg Ile 65 70 75 80 Leu Thr Ile Pro Gln Ser Leu Asp Ser Trp Trp Thr Ser Leu Asn Phe 85 90 95 Leu Gly Gly Thr Pro Val Cys Leu Gly Gln Asn Ser Gln Ser Pro Thr 100 105 110 Ser Asn His Ser Pro Thr Ser Cys Pro Pro Ile Cys Pro Gly Tyr Arg 115 120 125 Trp Met Cys Leu Arg Arg Phe Ile Ile Phe Leu Phe Ile Leu Leu Leu 130 135 140 Cys Leu Ile Phe Leu Leu Val Leu Leu Asp Tyr Gln Gly Met Leu Pro 145 150 155 160 Val Cys Pro Leu Ile Pro Gly Ser Ser Thr Thr Ser Thr Gly Pro Cys 165 170 175 Lys Thr Cys Thr Ile Pro Ala Gln Gly Thr Ser Met Phe Pro Ser Cys 180 185 190 Cys Cys Thr Lys Pro Ser Asp Gly Asn Cys Thr Cys Ile Pro Ile Pro 195 200 205 Ser Ser Trp Ala Phe Ala Lys Tyr Leu Trp Glu Trp Ala Ser Val Arg 210 215 220 Phe Ser Trp Leu Ser Leu Leu Val Pro Phe Val Gln Trp Phe Val Gly 225 230 235 240 Leu Ser Pro Thr Val Trp Leu Ser Val Ile Trp Met Met Trp Tyr Trp 245 250 255 Gly Pro Ser Leu Tyr Asn Ile Leu Ser Pro Phe Leu Pro Leu Leu Pro 260 265 270 Ile Phe Phe Cys Leu Trp Val Tyr Ile 275 280 <210> 6 <211> 846 <212> DNA <213> Artificial Sequence <220> <223> PreS2.S HBV antigen coding sequence <400> 6 atgcagtgga actcaactac tttccatcag acccttcagg accctagagt gcgcgggctg 60 tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac gaccgcctct 120 cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga gaatatcacc 180 tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct gactcgaatc 240 ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct gggaggaact 300 cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc gacaagttgt 360 cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat cttcctcttc 420 atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg catgctgcct 480 gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa gacctgtaca 540 attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc aagcgacggt 600 aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct ctgggaatgg 660 gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg gtttgtggga 720 ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg cccttccctt 780 tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct gtgggtctat 840 atttaa 846 <210> 7 <211> 148 <212> PRT <213> Artificial Sequence <220> <223> HBV core antigen <400> 7 Asp Ile Asp Pro Tyr Lys Glu Phe Gly Ala Ser Val Glu Leu Leu Ser 1 5 10 15 Phe Leu Pro Ser Asp Phe Phe Pro Ser Ile Arg Asp Leu Leu Asp Thr 20 25 30 Ala Ser Ala Leu Tyr Arg Glu Ala Leu Glu Ser Pro Glu His Cys Ser 35 40 45 Pro His His Thr Ala Leu Arg Gln Ala Ile Leu Cys Trp Gly Glu Leu 50 55 60 Met Asn Leu Ala Thr Trp Val Gly Ser Asn Leu Glu Asp Pro Ala Ser 65 70 75 80 Arg Glu Leu Val Val Ser Tyr Val Asn Val Asn Met Gly Leu Lys Ile 85 90 95 Arg Gln Leu Leu Trp Phe His Ile Ser Cys Leu Thr Phe Gly Arg Glu 100 105 110 Thr Val Leu Glu Tyr Leu Val Ser Phe Gly Val Trp Ile Arg Thr Pro 115 120 125 Pro Ala Tyr Arg Pro Pro Asn Ala Pro Ile Leu Ser Thr Leu Pro Glu 130 135 140 Thr Thr Val Val 145 <210> 8 <211> 444 <212> DNA <213> Artificial Sequence <220> <223> HBV core antigen coding sequence <400> 8 gacatcgacc cttacaagga gttcggcgcc agcgtggaac tgctgtcttt tctgcccagt 60 gatttctttc cttccattcg agacctgctg gataccgcct ctgctctgta tcgggaagcc 120 ctggagagcc cagaacactg ctccccacac cataccgctc tgcgacaggc aatcctgtgc 180 tggggggagc tgatgaacct ggccacatgg gtgggatcga atctggagga ccccgcttca 240 cgggaactgg tggtcagcta cgtgaacgtc aatatgggcc tgaaaatccg ccagctgctg 300 tggttccata ttagctgcct gacttttgga cgagagaccg tgctggaata cctggtgtcc 360 ttcggcgtct ggattcgcac tccccctgct tatcgaccac ccaacgcacc aattctgtcc 420 accctgcccg agaccacagt ggtc 444 <210> 9 <211> 843 <212> PRT <213> Artificial Sequence <220> <223> HBV polymerase antigen <400> 9 Met Pro Leu Ser Tyr Gln His Phe Arg Lys Leu Leu Leu Leu Asp Asp 1 5 10 15 Glu Ala Gly Pro Leu Glu Glu Glu Leu Pro Arg Leu Ala Asp Glu Gly 20 25 30 Leu Asn Arg Arg Val Ala Glu Asp Leu Asn Leu Gly Asn Leu Asn Val 35 40 45 Ser Ile Pro Trp Thr His Lys Val Gly Asn Phe Thr Gly Leu Tyr Ser 50 55 60 Ser Thr Val Pro Val Phe Asn Pro Glu Trp Gln Thr Pro Ser Phe Pro 65 70 75 80 Asn Ile His Leu Gln Glu Asp Ile Ile Asn Arg Cys Glu Gln Phe Val 85 90 95 Gly Pro Leu Thr Val Asn Glu Lys Arg Arg Leu Lys Leu Ile Met Pro 100 105 110 Ala Arg Phe Tyr Pro Asn Val Thr Lys Tyr Leu Pro Leu Asp Lys Gly 115 120 125 Ile Lys Pro Tyr Tyr Pro Glu His Leu Val Asn His Tyr Phe Gln Thr 130 135 140 Arg His Tyr Leu His Thr Leu Trp Lys Ala Gly Ile Leu Tyr Lys Arg 145 150 155 160 Glu Thr Thr Arg Ser Ala Ser Phe Cys Gly Ser Pro Tyr Ser Trp Glu 165 170 175 Gln Glu Leu Gln His Gly Arg Leu Val Phe Gln Thr Ser Lys Arg His 180 185 190 Gly Asp Glu Ser Phe Cys Ser Gln Ser Ser Gly Ile Leu Ser Arg Ser 195 200 205 Pro Val Gly Pro Cys Ile Gln Ser Gln Leu Arg Lys Ser Arg Leu Gly 210 215 220 Leu Gln Pro Gln Gln Gly His Leu Ala Arg Arg Gln Gln Gly Arg Ser 225 230 235 240 Gly Ser Ile Arg Ala Arg Val His Pro Thr Thr Arg Arg Thr Phe Gly 245 250 255 Val Glu Pro Ser Gly Ser Gly His Ile Asp Asn Ser Ala Ser Ser Ser 260 265 270 Ser Ser Cys Leu His Gln Ser Ala Val Arg Lys Ala Ala Tyr Ser His 275 280 285 Leu Ser Thr Ser Lys Arg His Ser Ser Ser Gly His Ala Val Glu Leu 290 295 300 His Asn Ile Pro Pro Asn Ser Ala Arg Ser Gln Ser Glu Gly Pro Val 305 310 315 320 Phe Ser Cys Trp Trp Leu Gln Phe Arg Asn Ser Lys Pro Cys Ser Asp 325 330 335 Tyr Cys Leu Ser His Ile Val Asn Leu Leu Glu Asp Trp Gly Pro Cys 340 345 350 Thr Glu His Gly Glu His His Ile Arg Ile Pro Arg Thr Pro Ala Arg 355 360 365 Val Thr Gly Gly Val Phe Leu Val Asp Lys Asn Pro His Asn Thr Thr 370 375 380 Glu Ser Arg Leu Val Val Asp Phe Ser Gln Phe Ser Arg Gly Asn Thr 385 390 395 400 Arg Val Ser Trp Pro Lys Phe Ala Val Pro Asn Leu Gln Ser Leu Thr 405 410 415 Asn Leu Leu Ser Ser Asn Leu Ser Trp Leu Ser Leu Asp Val Ser Ala 420 425 430 Ala Phe Tyr His Leu Pro Leu His Pro Ala Ala Met Pro His Leu Leu 435 440 445 Val Gly Ser Ser Gly Leu Ser Arg Tyr Val Ala Arg Leu Ser Ser Asn 450 455 460 Ser Arg Ile Ile Asn His Gln His Gly Thr Met Gln Asn Leu His Asp 465 470 475 480 Ser Cys Ser Arg Asn Leu Tyr Val Ser Leu Leu Leu Leu Tyr Lys Thr 485 490 495 Phe Gly Arg Lys Leu His Leu Tyr Ser His Pro Ile Ile Leu Gly Phe 500 505 510 Arg Lys Ile Pro Met Gly Val Gly Leu Ser Pro Phe Leu Leu Ala Gln 515 520 525 Phe Thr Ser Ala Ile Cys Ser Val Val Arg Arg Ala Phe Pro His Cys 530 535 540 Leu Ala Phe Ser Tyr Met Asn Asn Val Val Leu Gly Ala Lys Ser Val 545 550 555 560 Gln His Leu Glu Ser Leu Phe Thr Ala Val Thr Asn Phe Leu Leu Ser 565 570 575 Leu Gly Ile His Leu Asn Pro Asn Lys Thr Lys Arg Trp Gly Tyr Ser 580 585 590 Leu Asn Phe Met Gly Tyr Val Ile Gly Ser Trp Gly Thr Leu Pro Gln 595 600 605 Glu His Ile Val Gln Lys Ile Lys Glu Cys Phe Arg Lys Leu Pro Val 610 615 620 Asn Arg Pro Ile Asp Trp Lys Val Cys Gln Arg Ile Val Gly Leu Leu 625 630 635 640 Gly Phe Ala Ala Pro Phe Thr Gln Cys Gly Tyr Pro Ala Leu Met Pro 645 650 655 Leu Tyr Ala Cys Ile Gln Ser Lys Gln Ala Phe Thr Phe Ser Pro Thr 660 665 670 Tyr Lys Ala Phe Leu Cys Lys Gln Tyr Leu Asn Leu Tyr Pro Val Ala 675 680 685 Arg Gln Arg Pro Gly Leu Cys Gln Val Phe Ala Asn Ala Thr Pro Thr 690 695 700 Gly Trp Gly Leu Ala Ile Gly His Gln Arg Met Arg Gly Thr Phe Val 705 710 715 720 Ala Pro Leu Pro Ile His Thr Ala Gln Leu Leu Ala Ala Cys Phe Ala 725 730 735 Arg Ser Arg Ser Gly Ala Lys Leu Ile Gly Thr Asp Asn Ser Val Val 740 745 750 Leu Ser Arg Lys Tyr Thr Ser Phe Pro Trp Leu Leu Gly Cys Ala Ala 755 760 765 Asn Trp Ile Leu Arg Gly Thr Ser Phe Val Tyr Val Pro Ser Ala Leu 770 775 780 Asn Pro Ala Asp Asp Pro Ser Arg Gly Arg Leu Gly Leu Tyr Arg Pro 785 790 795 800 Leu Leu Arg Leu Pro Phe Arg Pro Thr Thr Gly Arg Thr Ser Leu Tyr 805 810 815 Ala Asp Ser Pro Ser Val Pro Ser His Leu Pro Asp Arg Val His Phe 820 825 830 Ala Ser Pro Leu His Val Ala Trp Arg Pro Pro 835 840 <210> 10 <211> 2529 <212> DNA <213> Artificial Sequence <220> <223> HBV polymerase antigen coding sequence <400> 10 atgcccctgt cttaccagca ctttagaaag cttctgctgc tggacgatga agccgggcct 60 ctggaggaag agctgccaag gctggcagac gaggggctga accggagagt ggccgaagat 120 ctgaatctgg gaaacctgaa cgtgagcatc ccttggactc ataaagtcgg caacttcacc 180 gggctgtaca gctccacagt gcctgtcttc aatccagagt ggcagacacc atcctttccc 240 aacattcacc tgcaggagga catcattaat agatgcgaac agttcgtggg acctctgaca 300 gtcaacgaaa agaggcgcct gaaactgatc atgcctgcca ggttttaccc aaatgtgact 360 aagtatctgc cactggataa gggcatcaag ccttactatc cagagcacct ggtgaaccat 420 tacttccaga ctagacacta tctgcatacc ctgtggaagg ccggaatcct gtacaaacga 480 gaaactaccc ggagtgcttc attttgtggc tccccatatt cttgggaaca ggagctgcag 540 catggcaggc tggtgttcca gaccagcaaa cgccacgggg atgagtcctt ttgcagccag 600 tctagtggca tcctgagcag atcccccgtg gggccttgta ttcagtctca gctgcggaag 660 agtagactgg gactgcagcc acagcaggga cacctggcac gacggcagca gggaaggtct 720 ggcagtatcc gggctagagt gcatcccaca actagaagga ccttcggcgt cgagccatca 780 ggaagcggcc acatcgacaa cagcgcatca agctcctcta gttgcctgca tcagtcagcc 840 gtgagaaagg ccgcttacag ccacctgtcc acatctaaaa ggcactcaag ctccgggcat 900 gctgtggagc tgcacaacat ccctccaaat tctgcacgca gtcagtcaga aggacccgtg 960 ttcagctgct ggtggctgca gtttcggaac tcaaagcctt gcagcgacta ttgtctgagc 1020 catattgtga atctgctgga ggattggggc ccttgtaccg agcacgggga acaccatatc 1080 aggattccac gaacaccagc acgagtgact ggaggggtgt tcctggtgga caagaacccc 1140 cacaatacta ccgagagccg gctggtggtc gatttcagtc agttttcaag aggcaacaca 1200 agggtgtcat ggcccaaatt cgccgtccct aatctgcaga gtctgactaa cctgctgtct 1260 agtaatctga gctggctgtc cctggacgtg tccgcagcct tttaccacct gcctctgcat 1320 ccagctgcaa tgccccatct gctggtgggg tcaagcggac tgagtcgcta cgtcgcccga 1380 ctgtcctcta actcacgcat cattaatcac cagcatggca ccatgcagaa cctgcacgat 1440 agctgttccc ggaatctgta cgtgtctctg ctgctgctgt ataagacatt cggcagaaaa 1500 ctgcacctgt acagccatcc tatcattctg gggtttagga agatcccaat gggagtggga 1560 ctgagcccct tcctgctggc acagtttacc tccgccattt gctctgtggt ccgccgagcc 1620 ttcccacact gtctggcttt ttcctatatg aacaatgtgg tcctgggcgc caaatccgtg 1680 cagcatctgg agtctctgtt cacagctgtc actaactttc tgctgagcct ggggatccac 1740 ctgaacccaa ataagactaa acgctggggg tacagcctga atttcatggg atatgtgatt 1800 ggatcctggg ggaccctgcc acaggagcac atcgtgcaga agatcaagga atgctttcgg 1860 aagctgcccg tcaacagacc tatcgactgg aaagtgtgcc agcggattgt cggactgctg 1920 ggcttcgccg ctccctttac ccagtgcggg tacccagcac tgatgcccct gtatgcctgt 1980 atccagtcta agcaggcttt cacctttagt cctacataca aggcattcct gtgcaaacag 2040 tacctgaacc tgtatccagt ggcaaggcag cgacctggac tgtgccaggt ctttgcaaat 2100 gccactccta ccggctgggg gctggctatc ggacatcagc gaatgcgggg cacattcgtg 2160 gcccccctgc ctattcacac tgctcagctg ctggcagcct gctttgctag atctaggagt 2220 ggagcaaagc tgatcggcac cgacaatagt gtggtcctgt caagaaaata cacatccttc 2280 ccatggctgc tgggatgtgc tgcaaactgg attctgaggg gcaccagctt cgtgtacgtc 2340 ccctcagccc tgaatcctgc tgacgatcca tcccgcgggc gactgggact gtaccgacct 2400 ctgctgagac tgcccttcag gcctacaact ggccggacat ctctgtatgc cgattcacca 2460 agcgtgccct cacacctgcc tgacagagtc cactttgctt cacccctgca cgtcgcttgg 2520 cggcctcca 2529 <210> 11 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> P2A autoprotease <400> 11 Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val 1 5 10 15 Glu Glu Asn Pro Gly Pro 20 <210> 12 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> P2A autoprotease coding sequence <400> 12 ggaagcggag ctactaactt cagcctgctg aagcaggctg gagacgtgga ggagaaccct 60 ggacct 66 <210> 13 <211> 587 <212> DNA <213> Artificial Sequence <220> <223> EMCV IRES <400> 13 gcccctctcc ctcccccccc cctaacgtta ctggccgaag ccgcttggaa taaggccggt 60 gtgcgtttgt ctatatgtta ttttccacca tattgccgtc ttttggcaat gtgagggccc 120 ggaaacctgg ccctgtcttc ttgacgagca ttcctagggg tctttcccct ctcgccaaag 180 gaatgcaagg tctgttgaat gtcgtgaagg aagcagttcc tctggaagct tcttgaagac 240 aaacaacgtc tgtagcgacc ctttgcaggc agcggaaccc cccacctggc gacaggtgcc 300 tctgcggcca aaagccacgt gtataagata cacctgcaaa ggcggcacaa ccccagtgcc 360 acgttgtgag ttggatagtt gtggaaagag tcaaatggct ctcctcaagc gtattcaaca 420 aggggctgaa ggatgcccag aaggtacccc attgtatggg atctgatctg gggcctcggt 480 gcacatgctt tacatgtgtt tagtcgaggt taaaaaacgt ctaggccccc cgaaccacgg 540 ggacgtggtt ttcctttgaa aaacacgatg ataatatggc cacaacc 587 <210> 14 <211> 747 <212> DNA <213> Artificial Sequence <220> <223> EV71 IRES <400> 14 ttaaaacagc tgtgggttgt tcccacccac agggcccact gggcgctagc actctgattt 60 tacgaaatcc ttgtgcgcct gttttatatc ccttccctaa ttcgaaacgt agaagcaatg 120 cgcaccactg atcaatagta ggcgtaacgc gccagttacg tcatgatcaa gcatatctgt 180 tcccccggac tgagtatcaa tagactgctt acgcggttga aggagaaaac gttcgttatc 240 cggctaacta cttcgagaag cccagtaaca ccatggaagc tgcagggtgt ttcgctcagc 300 acttcccccg tgtagatcag gtcgatgagc cactgcaatc cccacaggtg actgtggcag 360 tggctgcgtt ggcggcctgc ctatggggag acccatagga cgctctaatg tggacatggt 420 gcgaagagcc tattgagcta gttagtagtc ctccggcccc tgaatgcggc taatcctaac 480 tgcggagcac atgccttcaa cccagagggt agtgtgtcgt aacgggcaac tctgcagcgg 540 aaccgactac tttgggtgtc cgtgtttctt ttttattctt atattggctg cttatggtga 600 caattacaga attgttacca tatagctatt ggattggcca tccggtgtgt aatagagctg 660 ttatatacct atttgttggc tttgtaccac taactttaaa atctataact accctcaact 720 ttatattaac cctcaataca gttgacc 747 <210> 15 <211> 3174 <212> DNA <213> Artificial Sequence <220> <223> Core-2A-Pol coding sequence <400> 15 atggctcgac ctctgtgtac cctgctactc ctgatggcta ccctggctgg agctctggcc 60 agcgacatcg acccttacaa ggagttcggc gccagcgtgg aactgctgtc ttttctgccc 120 agtgatttct ttccttccat tcgagacctg ctggataccg cctctgctct gtatcgggaa 180 gccctggaga gcccagaaca ctgctcccca caccataccg ctctgcgaca ggcaatcctg 240 tgctgggggg agctgatgaa cctggccaca tgggtgggat cgaatctgga ggaccccgct 300 tcacgggaac tggtggtcag ctacgtgaac gtcaatatgg gcctgaaaat ccgccagctg 360 ctgtggttcc atattagctg cctgactttt ggacgagaga ccgtgctgga atacctggtg 420 tccttcggcg tctggattcg cactccccct gcttatcgac cacccaacgc accaattctg 480 tccaccctgc ccgagaccac agtggtccgt cgccgtggaa gcggagctac taacttcagc 540 ctgctgaagc aggctggaga cgtggaggag aaccctggac ctatggctcg acctctgtgt 600 accctgctac tcctgatggc taccctggct ggagctctgg ccagcatgcc cctgtcttac 660 cagcacttta gaaagcttct gctgctggac gatgaagccg ggcctctgga ggaagagctg 720 ccaaggctgg cagacgaggg gctgaaccgg agagtggccg aagatctgaa tctgggaaac 780 ctgaacgtga gcatcccttg gactcataaa gtcggcaact tcaccgggct gtacagctcc 840 acagtgcctg tcttcaatcc agagtggcag acaccatcct ttcccaacat tcacctgcag 900 gaggacatca ttaatagatg cgaacagttc gtgggacctc tgacagtcaa cgaaaagagg 960 cgcctgaaac tgatcatgcc tgccaggttt tacccaaatg tgactaagta tctgccactg 1020 gataagggca tcaagcctta ctatccagag cacctggtga accattactt ccagactaga 1080 cactatctgc ataccctgtg gaaggccgga atcctgtaca aacgagaaac tacccggagt 1140 gcttcatttt gtggctcccc atattcttgg gaacaggagc tgcagcatgg caggctggtg 1200 ttccagacca gcaaacgcca cggggatgag tccttttgca gccagtctag tggcatcctg 1260 agcagatccc ccgtggggcc ttgtattcag tctcagctgc ggaagagtag actgggactg 1320 cagccacagc agggacacct ggcacgacgg cagcagggaa ggtctggcag tatccgggct 1380 agagtgcatc ccacaactag aaggaccttc ggcgtcgagc catcaggaag cggccacatc 1440 gacaacagcg catcaagctc ctctagttgc ctgcatcagt cagccgtgag aaaggccgct 1500 tacagccacc tgtccacatc taaaaggcac tcaagctccg ggcatgctgt ggagctgcac 1560 aacatccctc caaattctgc acgcagtcag tcagaaggac ccgtgttcag ctgctggtgg 1620 ctgcagtttc ggaactcaaa gccttgcagc gactattgtc tgagccatat tgtgaatctg 1680 ctggaggatt ggggcccttg taccgagcac ggggaacacc atatcaggat tccacgaaca 1740 ccagcacgag tgactggagg ggtgttcctg gtggacaaga acccccacaa tactaccgag 1800 agccggctgg tggtcgattt cagtcagttt tcaagaggca acacaagggt gtcatggccc 1860 aaattcgccg tccctaatct gcagagtctg actaacctgc tgtctagtaa tctgagctgg 1920 ctgtccctgg acgtgtccgc agccttttac cacctgcctc tgcatccagc tgcaatgccc 1980 catctgctgg tggggtcaag cggactgagt cgctacgtcg cccgactgtc ctctaactca 2040 cgcatcatta atcaccagca tggcaccatg cagaacctgc acgatagctg ttcccggaat 2100 ctgtacgtgt ctctgctgct gctgtataag acattcggca gaaaactgca cctgtacagc 2160 catcctatca ttctggggtt taggaagatc ccaatgggag tgggactgag ccccttcctg 2220 ctggcacagt ttacctccgc catttgctct gtggtccgcc gagccttccc acactgtctg 2280 gctttttcct atatgaacaa tgtggtcctg ggcgccaaat ccgtgcagca tctggagtct 2340 ctgttcacag ctgtcactaa ctttctgctg agcctgggga tccacctgaa cccaaataag 2400 actaaacgct gggggtacag cctgaatttc atgggatatg tgattggatc ctgggggacc 2460 ctgccacagg agcacatcgt gcagaagatc aaggaatgct ttcggaagct gcccgtcaac 2520 agacctatcg actggaaagt gtgccagcgg attgtcggac tgctgggctt cgccgctccc 2580 tttacccagt gcgggtaccc agcactgatg cccctgtatg cctgtatcca gtctaagcag 2640 gctttcacct ttagtcctac atacaaggca ttcctgtgca aacagtacct gaacctgtat 2700 ccagtggcaa ggcagcgacc tggactgtgc caggtctttg caaatgccac tcctaccggc 2760 tgggggctgg ctatcggaca tcagcgaatg cggggcacat tcgtggcccc cctgcctatt 2820 cacactgctc agctgctggc agcctgcttt gctagatcta ggagtggagc aaagctgatc 2880 ggcaccgaca atagtgtggt cctgtcaaga aaatacacat ccttcccatg gctgctggga 2940 tgtgctgcaa actggattct gaggggcacc agcttcgtgt acgtcccctc agccctgaat 3000 cctgctgacg atccatcccg cgggcgactg ggactgtacc gacctctgct gagactgccc 3060 ttcaggccta caactggccg gacatctctg tatgccgatt caccaagcgt gccctcacac 3120 ctgcctgaca gagtccactt tgcttcaccc ctgcacgtcg cttggcggcc tcca 3174 <210> 16 <211> 3174 <212> DNA <213> Artificial Sequence <220> <223> Pol-2A-Core coding sequence <400> 16 atggctcgac ctctgtgtac cctgctactc ctgatggcta ccctggctgg agctctggcc 60 agcatgcccc tgtcttacca gcactttaga aagcttctgc tgctggacga tgaagccggg 120 cctctggagg aagagctgcc aaggctggca gacgaggggc tgaaccggag agtggccgaa 180 gatctgaatc tgggaaacct gaacgtgagc atcccttgga ctcataaagt cggcaacttc 240 accgggctgt acagctccac agtgcctgtc ttcaatccag agtggcagac accatccttt 300 cccaacattc acctgcagga ggacatcatt aatagatgcg aacagttcgt gggacctctg 360 acagtcaacg aaaagaggcg cctgaaactg atcatgcctg ccaggtttta cccaaatgtg 420 actaagtatc tgccactgga taagggcatc aagccttact atccagagca cctggtgaac 480 cattacttcc agactagaca ctatctgcat accctgtgga aggccggaat cctgtacaaa 540 cgagaaacta cccggagtgc ttcattttgt ggctccccat attcttggga acaggagctg 600 cagcatggca ggctggtgtt ccagaccagc aaacgccacg gggatgagtc cttttgcagc 660 cagtctagtg gcatcctgag cagatccccc gtggggcctt gtattcagtc tcagctgcgg 720 aagagtagac tgggactgca gccacagcag ggacacctgg cacgacggca gcagggaagg 780 tctggcagta tccgggctag agtgcatccc acaactagaa ggaccttcgg cgtcgagcca 840 tcaggaagcg gccacatcga caacagcgca tcaagctcct ctagttgcct gcatcagtca 900 gccgtgagaa aggccgctta cagccacctg tccacatcta aaaggcactc aagctccggg 960 catgctgtgg agctgcacaa catccctcca aattctgcac gcagtcagtc agaaggaccc 1020 gtgttcagct gctggtggct gcagtttcgg aactcaaagc cttgcagcga ctattgtctg 1080 agccatattg tgaatctgct ggaggattgg ggcccttgta ccgagcacgg ggaacaccat 1140 atcaggattc cacgaacacc agcacgagtg actggagggg tgttcctggt ggacaagaac 1200 ccccacaata ctaccgagag ccggctggtg gtcgatttca gtcagttttc aagaggcaac 1260 acaagggtgt catggcccaa attcgccgtc cctaatctgc agagtctgac taacctgctg 1320 tctagtaatc tgagctggct gtccctggac gtgtccgcag ccttttacca cctgcctctg 1380 catccagctg caatgcccca tctgctggtg gggtcaagcg gactgagtcg ctacgtcgcc 1440 cgactgtcct ctaactcacg catcattaat caccagcatg gcaccatgca gaacctgcac 1500 gatagctgtt cccggaatct gtacgtgtct ctgctgctgc tgtataagac attcggcaga 1560 aaactgcacc tgtacagcca tcctatcatt ctggggttta ggaagatccc aatgggagtg 1620 ggactgagcc ccttcctgct ggcacagttt acctccgcca tttgctctgt ggtccgccga 1680 gccttcccac actgtctggc tttttcctat atgaacaatg tggtcctggg cgccaaatcc 1740 gtgcagcatc tggagtctct gttcacagct gtcactaact ttctgctgag cctggggatc 1800 cacctgaacc caaataagac taaacgctgg gggtacagcc tgaatttcat gggatatgtg 1860 attggatcct gggggaccct gccacaggag cacatcgtgc agaagatcaa ggaatgcttt 1920 cggaagctgc ccgtcaacag acctatcgac tggaaagtgt gccagcggat tgtcggactg 1980 ctgggcttcg ccgctccctt tacccagtgc gggtacccag cactgatgcc cctgtatgcc 2040 tgtatccagt ctaagcaggc tttcaccttt agtcctacat acaaggcatt cctgtgcaaa 2100 cagtacctga acctgtatcc agtggcaagg cagcgacctg gactgtgcca ggtctttgca 2160 aatgccactc ctaccggctg ggggctggct atcggacatc agcgaatgcg gggcacattc 2220 gtggcccccc tgcctattca cactgctcag ctgctggcag cctgctttgc tagatctagg 2280 agtggagcaa agctgatcgg caccgacaat agtgtggtcc tgtcaagaaa atacacatcc 2340 ttcccatggc tgctgggatg tgctgcaaac tggattctga ggggcaccag cttcgtgtac 2400 gtcccctcag ccctgaatcc tgctgacgat ccatcccgcg ggcgactggg actgtaccga 2460 cctctgctga gactgccctt caggcctaca actggccgga catctctgta tgccgattca 2520 ccaagcgtgc cctcacacct gcctgacaga gtccactttg cttcacccct gcacgtcgct 2580 tggcggcctc caggaagcgg agctactaac ttcagcctgc tgaagcaggc tggagacgtg 2640 gaggagaacc ctggacctat ggctcgacct ctgtgtaccc tgctactcct gatggctacc 2700 ctggctggag ctctggccag cgacatcgac ccttacaagg agttcggcgc cagcgtggaa 2760 ctgctgtctt ttctgcccag tgatttcttt ccttccattc gagacctgct ggataccgcc 2820 tctgctctgt atcgggaagc cctggagagc ccagaacact gctccccaca ccataccgct 2880 ctgcgacagg caatcctgtg ctggggggag ctgatgaacc tggccacatg ggtgggatcg 2940 aatctggagg accccgcttc acgggaactg gtggtcagct acgtgaacgt caatatgggc 3000 ctgaaaatcc gccagctgct gtggttccat attagctgcc tgacttttgg acgagagacc 3060 gtgctggaat acctggtgtc cttcggcgtc tggattcgca ctccccctgc ttatcgacca 3120 cccaacgcac caattctgtc caccctgccc gagaccacag tggtccgtcg ccgt 3174 <210> 17 <211> 3698 <212> DNA <213> Artificial Sequence <220> <223> Core coding sequence-IRES(EMCV)-Pol coding sequence <400> 17 atggctcgac ctctgtgtac cctgctactc ctgatggcta ccctggctgg agctctggcc 60 agcgacatcg acccttacaa ggagttcggc gccagcgtgg aactgctgtc ttttctgccc 120 agtgatttct ttccttccat tcgagacctg ctggataccg cctctgctct gtatcgggaa 180 gccctggaga gcccagaaca ctgctcccca caccataccg ctctgcgaca ggcaatcctg 240 tgctgggggg agctgatgaa cctggccaca tgggtgggat cgaatctgga ggaccccgct 300 tcacgggaac tggtggtcag ctacgtgaac gtcaatatgg gcctgaaaat ccgccagctg 360 ctgtggttcc atattagctg cctgactttt ggacgagaga ccgtgctgga atacctggtg 420 tccttcggcg tctggattcg cactccccct gcttatcgac cacccaacgc accaattctg 480 tccaccctgc ccgagaccac agtggtccgt cgccgttaag cccctctccc tccccccccc 540 ctaacgttac tggccgaagc cgcttggaat aaggccggtg tgcgtttgtc tatatgttat 600 tttccaccat attgccgtct tttggcaatg tgagggcccg gaaacctggc cctgtcttct 660 tgacgagcat tcctaggggt ctttcccctc tcgccaaagg aatgcaaggt ctgttgaatg 720 tcgtgaagga agcagttcct ctggaagctt cttgaagaca aacaacgtct gtagcgaccc 780 tttgcaggca gcggaacccc ccacctggcg acaggtgcct ctgcggccaa aagccacgtg 840 tataagatac acctgcaaag gcggcacaac cccagtgcca cgttgtgagt tggatagttg 900 tggaaagagt caaatggctc tcctcaagcg tattcaacaa ggggctgaag gatgcccaga 960 aggtacccca ttgtatggga tctgatctgg ggcctcggtg cacatgcttt acatgtgttt 1020 agtcgaggtt aaaaaacgtc taggcccccc gaaccacggg gacgtggttt tcctttgaaa 1080 aacacgatga taatatggcc acaaccatgg ctcgacctct gtgtaccctg ctactcctga 1140 tggctaccct ggctggagct ctggccagca tgcccctgtc ttaccagcac tttagaaagc 1200 ttctgctgct ggacgatgaa gccgggcctc tggaggaaga gctgccaagg ctggcagacg 1260 aggggctgaa ccggagagtg gccgaagatc tgaatctggg aaacctgaac gtgagcatcc 1320 cttggactca taaagtcggc aacttcaccg ggctgtacag ctccacagtg cctgtcttca 1380 atccagagtg gcagacacca tcctttccca acattcacct gcaggaggac atcattaata 1440 gatgcgaaca gttcgtggga cctctgacag tcaacgaaaa gaggcgcctg aaactgatca 1500 tgcctgccag gttttaccca aatgtgacta agtatctgcc actggataag ggcatcaagc 1560 cttactatcc agagcacctg gtgaaccatt acttccagac tagacactat ctgcataccc 1620 tgtggaaggc cggaatcctg tacaaacgag aaactacccg gagtgcttca ttttgtggct 1680 ccccatattc ttgggaacag gagctgcagc atggcaggct ggtgttccag accagcaaac 1740 gccacgggga tgagtccttt tgcagccagt ctagtggcat cctgagcaga tcccccgtgg 1800 ggccttgtat tcagtctcag ctgcggaaga gtagactggg actgcagcca cagcagggac 1860 acctggcacg acggcagcag ggaaggtctg gcagtatccg ggctagagtg catcccacaa 1920 ctagaaggac cttcggcgtc gagccatcag gaagcggcca catcgacaac agcgcatcaa 1980 gctcctctag ttgcctgcat cagtcagccg tgagaaaggc cgcttacagc cacctgtcca 2040 catctaaaag gcactcaagc tccgggcatg ctgtggagct gcacaacatc cctccaaatt 2100 ctgcacgcag tcagtcagaa ggacccgtgt tcagctgctg gtggctgcag tttcggaact 2160 caaagccttg cagcgactat tgtctgagcc atattgtgaa tctgctggag gattggggcc 2220 cttgtaccga gcacggggaa caccatatca ggattccacg aacaccagca cgagtgactg 2280 gaggggtgtt cctggtggac aagaaccccc acaatactac cgagagccgg ctggtggtcg 2340 atttcagtca gttttcaaga ggcaacacaa gggtgtcatg gcccaaattc gccgtcccta 2400 atctgcagag tctgactaac ctgctgtcta gtaatctgag ctggctgtcc ctggacgtgt 2460 ccgcagcctt ttaccacctg cctctgcatc cagctgcaat gccccatctg ctggtggggt 2520 caagcggact gagtcgctac gtcgcccgac tgtcctctaa ctcacgcatc attaatcacc 2580 agcatggcac catgcagaac ctgcacgata gctgttcccg gaatctgtac gtgtctctgc 2640 tgctgctgta taagacattc ggcagaaaac tgcacctgta cagccatcct atcattctgg 2700 ggtttaggaa gatcccaatg ggagtgggac tgagcccctt cctgctggca cagtttacct 2760 ccgccatttg ctctgtggtc cgccgagcct tcccacactg tctggctttt tcctatatga 2820 acaatgtggt cctgggcgcc aaatccgtgc agcatctgga gtctctgttc acagctgtca 2880 ctaactttct gctgagcctg gggatccacc tgaacccaaa taagactaaa cgctgggggt 2940 acagcctgaa tttcatggga tatgtgattg gatcctgggg gaccctgcca caggagcaca 3000 tcgtgcagaa gatcaaggaa tgctttcgga agctgcccgt caacagacct atcgactgga 3060 aagtgtgcca gcggattgtc ggactgctgg gcttcgccgc tccctttacc cagtgcgggt 3120 acccagcact gatgcccctg tatgcctgta tccagtctaa gcaggctttc acctttagtc 3180 ctacatacaa ggcattcctg tgcaaacagt acctgaacct gtatccagtg gcaaggcagc 3240 gacctggact gtgccaggtc tttgcaaatg ccactcctac cggctggggg ctggctatcg 3300 gacatcagcg aatgcggggc acattcgtgg cccccctgcc tattcacact gctcagctgc 3360 tggcagcctg ctttgctaga tctaggagtg gagcaaagct gatcggcacc gacaatagtg 3420 tggtcctgtc aagaaaatac acatccttcc catggctgct gggatgtgct gcaaactgga 3480 ttctgagggg caccagcttc gtgtacgtcc cctcagccct gaatcctgct gacgatccat 3540 cccgcgggcg actgggactg taccgacctc tgctgagact gcccttcagg cctacaactg 3600 gccggacatc tctgtatgcc gattcaccaa gcgtgccctc acacctgcct gacagagtcc 3660 actttgcttc acccctgcac gtcgcttggc ggcctcca 3698 <210> 18 <211> 3698 <212> DNA <213> Artificial Sequence <220> <223> Pol coding sequence-IRES (EMCV)-Core coding sequence <400> 18 atggctcgac ctctgtgtac cctgctactc ctgatggcta ccctggctgg agctctggcc 60 agcatgcccc tgtcttacca gcactttaga aagcttctgc tgctggacga tgaagccggg 120 cctctggagg aagagctgcc aaggctggca gacgaggggc tgaaccggag agtggccgaa 180 gatctgaatc tgggaaacct gaacgtgagc atcccttgga ctcataaagt cggcaacttc 240 accgggctgt acagctccac agtgcctgtc ttcaatccag agtggcagac accatccttt 300 cccaacattc acctgcagga ggacatcatt aatagatgcg aacagttcgt gggacctctg 360 acagtcaacg aaaagaggcg cctgaaactg atcatgcctg ccaggtttta cccaaatgtg 420 actaagtatc tgccactgga taagggcatc aagccttact atccagagca cctggtgaac 480 cattacttcc agactagaca ctatctgcat accctgtgga aggccggaat cctgtacaaa 540 cgagaaacta cccggagtgc ttcattttgt ggctccccat attcttggga acaggagctg 600 cagcatggca ggctggtgtt ccagaccagc aaacgccacg gggatgagtc cttttgcagc 660 cagtctagtg gcatcctgag cagatccccc gtggggcctt gtattcagtc tcagctgcgg 720 aagagtagac tgggactgca gccacagcag ggacacctgg cacgacggca gcagggaagg 780 tctggcagta tccgggctag agtgcatccc acaactagaa ggaccttcgg cgtcgagcca 840 tcaggaagcg gccacatcga caacagcgca tcaagctcct ctagttgcct gcatcagtca 900 gccgtgagaa aggccgctta cagccacctg tccacatcta aaaggcactc aagctccggg 960 catgctgtgg agctgcacaa catccctcca aattctgcac gcagtcagtc agaaggaccc 1020 gtgttcagct gctggtggct gcagtttcgg aactcaaagc cttgcagcga ctattgtctg 1080 agccatattg tgaatctgct ggaggattgg ggcccttgta ccgagcacgg ggaacaccat 1140 atcaggattc cacgaacacc agcacgagtg actggagggg tgttcctggt ggacaagaac 1200 ccccacaata ctaccgagag ccggctggtg gtcgatttca gtcagttttc aagaggcaac 1260 acaagggtgt catggcccaa attcgccgtc cctaatctgc agagtctgac taacctgctg 1320 tctagtaatc tgagctggct gtccctggac gtgtccgcag ccttttacca cctgcctctg 1380 catccagctg caatgcccca tctgctggtg gggtcaagcg gactgagtcg ctacgtcgcc 1440 cgactgtcct ctaactcacg catcattaat caccagcatg gcaccatgca gaacctgcac 1500 gatagctgtt cccggaatct gtacgtgtct ctgctgctgc tgtataagac attcggcaga 1560 aaactgcacc tgtacagcca tcctatcatt ctggggttta ggaagatccc aatgggagtg 1620 ggactgagcc ccttcctgct ggcacagttt acctccgcca tttgctctgt ggtccgccga 1680 gccttcccac actgtctggc tttttcctat atgaacaatg tggtcctggg cgccaaatcc 1740 gtgcagcatc tggagtctct gttcacagct gtcactaact ttctgctgag cctggggatc 1800 cacctgaacc caaataagac taaacgctgg gggtacagcc tgaatttcat gggatatgtg 1860 attggatcct gggggaccct gccacaggag cacatcgtgc agaagatcaa ggaatgcttt 1920 cggaagctgc ccgtcaacag acctatcgac tggaaagtgt gccagcggat tgtcggactg 1980 ctgggcttcg ccgctccctt tacccagtgc gggtacccag cactgatgcc cctgtatgcc 2040 tgtatccagt ctaagcaggc tttcaccttt agtcctacat acaaggcatt cctgtgcaaa 2100 cagtacctga acctgtatcc agtggcaagg cagcgacctg gactgtgcca ggtctttgca 2160 aatgccactc ctaccggctg ggggctggct atcggacatc agcgaatgcg gggcacattc 2220 gtggcccccc tgcctattca cactgctcag ctgctggcag cctgctttgc tagatctagg 2280 agtggagcaa agctgatcgg caccgacaat agtgtggtcc tgtcaagaaa atacacatcc 2340 ttcccatggc tgctgggatg tgctgcaaac tggattctga ggggcaccag cttcgtgtac 2400 gtcccctcag ccctgaatcc tgctgacgat ccatcccgcg ggcgactggg actgtaccga 2460 cctctgctga gactgccctt caggcctaca actggccgga catctctgta tgccgattca 2520 ccaagcgtgc cctcacacct gcctgacaga gtccactttg cttcacccct gcacgtcgct 2580 tggcggcctc cataagcccc tctccctccc ccccccctaa cgttactggc cgaagccgct 2640 tggaataagg ccggtgtgcg tttgtctata tgttattttc caccatattg ccgtcttttg 2700 gcaatgtgag ggcccggaaa cctggccctg tcttcttgac gagcattcct aggggtcttt 2760 cccctctcgc caaaggaatg caaggtctgt tgaatgtcgt gaaggaagca gttcctctgg 2820 aagcttcttg aagacaaaca acgtctgtag cgaccctttg caggcagcgg aaccccccac 2880 ctggcgacag gtgcctctgc ggccaaaagc cacgtgtata agatacacct gcaaaggcgg 2940 cacaacccca gtgccacgtt gtgagttgga tagttgtgga aagagtcaaa tggctctcct 3000 caagcgtatt caacaagggg ctgaaggatg cccagaaggt accccattgt atgggatctg 3060 atctggggcc tcggtgcaca tgctttacat gtgtttagtc gaggttaaaa aacgtctagg 3120 ccccccgaac cacggggacg tggttttcct ttgaaaaaca cgatgataat atggccacaa 3180 ccatggctcg acctctgtgt accctgctac tcctgatggc taccctggct ggagctctgg 3240 ccagcgacat cgacccttac aaggagttcg gcgccagcgt ggaactgctg tcttttctgc 3300 ccagtgattt ctttccttcc attcgagacc tgctggatac cgcctctgct ctgtatcggg 3360 aagccctgga gagcccagaa cactgctccc cacaccatac cgctctgcga caggcaatcc 3420 tgtgctgggg ggagctgatg aacctggcca catgggtggg atcgaatctg gaggaccccg 3480 cttcacggga actggtggtc agctacgtga acgtcaatat gggcctgaaa atccgccagc 3540 tgctgtggtt ccatattagc tgcctgactt ttggacgaga gaccgtgctg gaatacctgg 3600 tgtccttcgg cgtctggatt cgcactcccc ctgcttatcg accacccaac gcaccaattc 3660 tgtccaccct gcccgagacc acagtggtcc gtcgccgt 3698 <210> 19 <211> 3858 <212> DNA <213> Artificial Sequence <220> <223> Core coding sequence-IRES (EV71)-Pol coding sequence <400> 19 atggctcgac ctctgtgtac cctgctactc ctgatggcta ccctggctgg agctctggcc 60 agcgacatcg acccttacaa ggagttcggc gccagcgtgg aactgctgtc ttttctgccc 120 agtgatttct ttccttccat tcgagacctg ctggataccg cctctgctct gtatcgggaa 180 gccctggaga gcccagaaca ctgctcccca caccataccg ctctgcgaca ggcaatcctg 240 tgctgggggg agctgatgaa cctggccaca tgggtgggat cgaatctgga ggaccccgct 300 tcacgggaac tggtggtcag ctacgtgaac gtcaatatgg gcctgaaaat ccgccagctg 360 ctgtggttcc atattagctg cctgactttt ggacgagaga ccgtgctgga atacctggtg 420 tccttcggcg tctggattcg cactccccct gcttatcgac cacccaacgc accaattctg 480 tccaccctgc ccgagaccac agtggtccgt cgccgttaat taaaacagct gtgggttgtt 540 cccacccaca gggcccactg ggcgctagca ctctgatttt acgaaatcct tgtgcgcctg 600 ttttatatcc cttccctaat tcgaaacgta gaagcaatgc gcaccactga tcaatagtag 660 gcgtaacgcg ccagttacgt catgatcaag catatctgtt cccccggact gagtatcaat 720 agactgctta cgcggttgaa ggagaaaacg ttcgttatcc ggctaactac ttcgagaagc 780 ccagtaacac catggaagct gcagggtgtt tcgctcagca cttcccccgt gtagatcagg 840 tcgatgagcc actgcaatcc ccacaggtga ctgtggcagt ggctgcgttg gcggcctgcc 900 tatggggaga cccataggac gctctaatgt ggacatggtg cgaagagcct attgagctag 960 ttagtagtcc tccggcccct gaatgcggct aatcctaact gcggagcaca tgccttcaac 1020 ccagagggta gtgtgtcgta acgggcaact ctgcagcgga accgactact ttgggtgtcc 1080 gtgtttcttt tttattctta tattggctgc ttatggtgac aattacagaa ttgttaccat 1140 atagctattg gattggccat ccggtgtgta atagagctgt tatataccta tttgttggct 1200 ttgtaccact aactttaaaa tctataacta ccctcaactt tatattaacc ctcaatacag 1260 ttgaccatgg ctcgacctct gtgtaccctg ctactcctga tggctaccct ggctggagct 1320 ctggccagca tgcccctgtc ttaccagcac tttagaaagc ttctgctgct ggacgatgaa 1380 gccgggcctc tggaggaaga gctgccaagg ctggcagacg aggggctgaa ccggagagtg 1440 gccgaagatc tgaatctggg aaacctgaac gtgagcatcc cttggactca taaagtcggc 1500 aacttcaccg ggctgtacag ctccacagtg cctgtcttca atccagagtg gcagacacca 1560 tcctttccca acattcacct gcaggaggac atcattaata gatgcgaaca gttcgtggga 1620 cctctgacag tcaacgaaaa gaggcgcctg aaactgatca tgcctgccag gttttaccca 1680 aatgtgacta agtatctgcc actggataag ggcatcaagc cttactatcc agagcacctg 1740 gtgaaccatt acttccagac tagacactat ctgcataccc tgtggaaggc cggaatcctg 1800 tacaaacgag aaactacccg gagtgcttca ttttgtggct ccccatattc ttgggaacag 1860 gagctgcagc atggcaggct ggtgttccag accagcaaac gccacgggga tgagtccttt 1920 tgcagccagt ctagtggcat cctgagcaga tcccccgtgg ggccttgtat tcagtctcag 1980 ctgcggaaga gtagactggg actgcagcca cagcagggac acctggcacg acggcagcag 2040 ggaaggtctg gcagtatccg ggctagagtg catcccacaa ctagaaggac cttcggcgtc 2100 gagccatcag gaagcggcca catcgacaac agcgcatcaa gctcctctag ttgcctgcat 2160 cagtcagccg tgagaaaggc cgcttacagc cacctgtcca catctaaaag gcactcaagc 2220 tccgggcatg ctgtggagct gcacaacatc cctccaaatt ctgcacgcag tcagtcagaa 2280 ggacccgtgt tcagctgctg gtggctgcag tttcggaact caaagccttg cagcgactat 2340 tgtctgagcc atattgtgaa tctgctggag gattggggcc cttgtaccga gcacggggaa 2400 caccatatca ggattccacg aacaccagca cgagtgactg gaggggtgtt cctggtggac 2460 aagaaccccc acaatactac cgagagccgg ctggtggtcg atttcagtca gttttcaaga 2520 ggcaacacaa gggtgtcatg gcccaaattc gccgtcccta atctgcagag tctgactaac 2580 ctgctgtcta gtaatctgag ctggctgtcc ctggacgtgt ccgcagcctt ttaccacctg 2640 cctctgcatc cagctgcaat gccccatctg ctggtggggt caagcggact gagtcgctac 2700 gtcgcccgac tgtcctctaa ctcacgcatc attaatcacc agcatggcac catgcagaac 2760 ctgcacgata gctgttcccg gaatctgtac gtgtctctgc tgctgctgta taagacattc 2820 ggcagaaaac tgcacctgta cagccatcct atcattctgg ggtttaggaa gatcccaatg 2880 ggagtgggac tgagcccctt cctgctggca cagtttacct ccgccatttg ctctgtggtc 2940 cgccgagcct tcccacactg tctggctttt tcctatatga acaatgtggt cctgggcgcc 3000 aaatccgtgc agcatctgga gtctctgttc acagctgtca ctaactttct gctgagcctg 3060 gggatccacc tgaacccaaa taagactaaa cgctgggggt acagcctgaa tttcatggga 3120 tatgtgattg gatcctgggg gaccctgcca caggagcaca tcgtgcagaa gatcaaggaa 3180 tgctttcgga agctgcccgt caacagacct atcgactgga aagtgtgcca gcggattgtc 3240 ggactgctgg gcttcgccgc tccctttacc cagtgcgggt acccagcact gatgcccctg 3300 tatgcctgta tccagtctaa gcaggctttc acctttagtc ctacatacaa ggcattcctg 3360 tgcaaacagt acctgaacct gtatccagtg gcaaggcagc gacctggact gtgccaggtc 3420 tttgcaaatg ccactcctac cggctggggg ctggctatcg gacatcagcg aatgcggggc 3480 acattcgtgg cccccctgcc tattcacact gctcagctgc tggcagcctg ctttgctaga 3540 tctaggagtg gagcaaagct gatcggcacc gacaatagtg tggtcctgtc aagaaaatac 3600 acatccttcc catggctgct gggatgtgct gcaaactgga ttctgagggg caccagcttc 3660 gtgtacgtcc cctcagccct gaatcctgct gacgatccat cccgcgggcg actgggactg 3720 taccgacctc tgctgagact gcccttcagg cctacaactg gccggacatc tctgtatgcc 3780 gattcaccaa gcgtgccctc acacctgcct gacagagtcc actttgcttc acccctgcac 3840 gtcgcttggc ggcctcca 3858 <210> 20 <211> 3858 <212> DNA <213> Artificial Sequence <220> <223> Pol coding sequence -IRES (EV71)-Core coding sequence <400> 20 atggctcgac ctctgtgtac cctgctactc ctgatggcta ccctggctgg agctctggcc 60 agcatgcccc tgtcttacca gcactttaga aagcttctgc tgctggacga tgaagccggg 120 cctctggagg aagagctgcc aaggctggca gacgaggggc tgaaccggag agtggccgaa 180 gatctgaatc tgggaaacct gaacgtgagc atcccttgga ctcataaagt cggcaacttc 240 accgggctgt acagctccac agtgcctgtc ttcaatccag agtggcagac accatccttt 300 cccaacattc acctgcagga ggacatcatt aatagatgcg aacagttcgt gggacctctg 360 acagtcaacg aaaagaggcg cctgaaactg atcatgcctg ccaggtttta cccaaatgtg 420 actaagtatc tgccactgga taagggcatc aagccttact atccagagca cctggtgaac 480 cattacttcc agactagaca ctatctgcat accctgtgga aggccggaat cctgtacaaa 540 cgagaaacta cccggagtgc ttcattttgt ggctccccat attcttggga acaggagctg 600 cagcatggca ggctggtgtt ccagaccagc aaacgccacg gggatgagtc cttttgcagc 660 cagtctagtg gcatcctgag cagatccccc gtggggcctt gtattcagtc tcagctgcgg 720 aagagtagac tgggactgca gccacagcag ggacacctgg cacgacggca gcagggaagg 780 tctggcagta tccgggctag agtgcatccc acaactagaa ggaccttcgg cgtcgagcca 840 tcaggaagcg gccacatcga caacagcgca tcaagctcct ctagttgcct gcatcagtca 900 gccgtgagaa aggccgctta cagccacctg tccacatcta aaaggcactc aagctccggg 960 catgctgtgg agctgcacaa catccctcca aattctgcac gcagtcagtc agaaggaccc 1020 gtgttcagct gctggtggct gcagtttcgg aactcaaagc cttgcagcga ctattgtctg 1080 agccatattg tgaatctgct ggaggattgg ggcccttgta ccgagcacgg ggaacaccat 1140 atcaggattc cacgaacacc agcacgagtg actggagggg tgttcctggt ggacaagaac 1200 ccccacaata ctaccgagag ccggctggtg gtcgatttca gtcagttttc aagaggcaac 1260 acaagggtgt catggcccaa attcgccgtc cctaatctgc agagtctgac taacctgctg 1320 tctagtaatc tgagctggct gtccctggac gtgtccgcag ccttttacca cctgcctctg 1380 catccagctg caatgcccca tctgctggtg gggtcaagcg gactgagtcg ctacgtcgcc 1440 cgactgtcct ctaactcacg catcattaat caccagcatg gcaccatgca gaacctgcac 1500 gatagctgtt cccggaatct gtacgtgtct ctgctgctgc tgtataagac attcggcaga 1560 aaactgcacc tgtacagcca tcctatcatt ctggggttta ggaagatccc aatgggagtg 1620 ggactgagcc ccttcctgct ggcacagttt acctccgcca tttgctctgt ggtccgccga 1680 gccttcccac actgtctggc tttttcctat atgaacaatg tggtcctggg cgccaaatcc 1740 gtgcagcatc tggagtctct gttcacagct gtcactaact ttctgctgag cctggggatc 1800 cacctgaacc caaataagac taaacgctgg gggtacagcc tgaatttcat gggatatgtg 1860 attggatcct gggggaccct gccacaggag cacatcgtgc agaagatcaa ggaatgcttt 1920 cggaagctgc ccgtcaacag acctatcgac tggaaagtgt gccagcggat tgtcggactg 1980 ctgggcttcg ccgctccctt tacccagtgc gggtacccag cactgatgcc cctgtatgcc 2040 tgtatccagt ctaagcaggc tttcaccttt agtcctacat acaaggcatt cctgtgcaaa 2100 cagtacctga acctgtatcc agtggcaagg cagcgacctg gactgtgcca ggtctttgca 2160 aatgccactc ctaccggctg ggggctggct atcggacatc agcgaatgcg gggcacattc 2220 gtggcccccc tgcctattca cactgctcag ctgctggcag cctgctttgc tagatctagg 2280 agtggagcaa agctgatcgg caccgacaat agtgtggtcc tgtcaagaaa atacacatcc 2340 ttcccatggc tgctgggatg tgctgcaaac tggattctga ggggcaccag cttcgtgtac 2400 gtcccctcag ccctgaatcc tgctgacgat ccatcccgcg ggcgactggg actgtaccga 2460 cctctgctga gactgccctt caggcctaca actggccgga catctctgta tgccgattca 2520 ccaagcgtgc cctcacacct gcctgacaga gtccactttg cttcacccct gcacgtcgct 2580 tggcggcctc cataattaaa acagctgtgg gttgttccca cccacagggc ccactgggcg 2640 ctagcactct gattttacga aatccttgtg cgcctgtttt atatcccttc cctaattcga 2700 aacgtagaag caatgcgcac cactgatcaa tagtaggcgt aacgcgccag ttacgtcatg 2760 atcaagcata tctgttcccc cggactgagt atcaatagac tgcttacgcg gttgaaggag 2820 aaaacgttcg ttatccggct aactacttcg agaagcccag taacaccatg gaagctgcag 2880 ggtgtttcgc tcagcacttc ccccgtgtag atcaggtcga tgagccactg caatccccac 2940 aggtgactgt ggcagtggct gcgttggcgg cctgcctatg gggagaccca taggacgctc 3000 taatgtggac atggtgcgaa gagcctattg agctagttag tagtcctccg gcccctgaat 3060 gcggctaatc ctaactgcgg agcacatgcc ttcaacccag agggtagtgt gtcgtaacgg 3120 gcaactctgc agcggaaccg actactttgg gtgtccgtgt ttctttttta ttcttatatt 3180 ggctgcttat ggtgacaatt acagaattgt taccatatag ctattggatt ggccatccgg 3240 tgtgtaatag agctgttata tacctatttg ttggctttgt accactaact ttaaaatcta 3300 taactaccct caactttata ttaaccctca atacagttga ccatggctcg acctctgtgt 3360 accctgctac tcctgatggc taccctggct ggagctctgg ccagcgacat cgacccttac 3420 aaggagttcg gcgccagcgt ggaactgctg tcttttctgc ccagtgattt ctttccttcc 3480 attcgagacc tgctggatac cgcctctgct ctgtatcggg aagccctgga gagcccagaa 3540 cactgctccc cacaccatac cgctctgcga caggcaatcc tgtgctgggg ggagctgatg 3600 aacctggcca catgggtggg atcgaatctg gaggaccccg cttcacggga actggtggtc 3660 agctacgtga acgtcaatat gggcctgaaa atccgccagc tgctgtggtt ccatattagc 3720 tgcctgactt ttggacgaga gaccgtgctg gaatacctgg tgtccttcgg cgtctggatt 3780 cgcactcccc ctgcttatcg accacccaac gcaccaattc tgtccaccct gcccgagacc 3840 acagtggtcc gtcgccgt 3858 <210> 21 <211> 1326 <212> DNA <213> Artificial Sequence <220> <223> PreS2.S-2A-preS1 coding sequence <400> 21 atgcagtgga actcaactac tttccatcag acccttcagg accctagagt gcgcgggctg 60 tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac gaccgcctct 120 cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga gaatatcacc 180 tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct gactcgaatc 240 ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct gggaggaact 300 cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc gacaagttgt 360 cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat cttcctcttc 420 atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg catgctgcct 480 gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa gacctgtaca 540 attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc aagcgacggt 600 aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct ctgggaatgg 660 gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg gtttgtggga 720 ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg cccttccctt 780 tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct gtgggtctat 840 attggaagcg gagctactaa cttcagcctg ctgaagcagg ctggagacgt ggaggagaac 900 cctggaccta tggctaggcc cctgtgtaca cttttgctcc tgatggccac cctcgctgga 960 gctctggcaa gcggtggatg gagctcaaag ccgcggaaag ggatgggtac taacctgtcc 1020 gtaccaaatc ccctgggatt ttttccagac caccaactcg atcctgcttt tggcgcaaat 1080 tccaacaatc ccgactggga ctttaaccct aacaaggacc actggcctga tgccaacaag 1140 gtgggggcag gagcctttgg tcccggcttc accccacccc atggaggtct tttgggatgg 1200 tcaccacagg cccagggcat cctgaccact gtccctgctg ctccaccgcc agcttctact 1260 aatcgacaga gcgggaggca gccgaccccc ctgagtcccc ccctgcggga tacccaccct 1320 caggca 1326 <210> 22 <211> 1326 <212> DNA <213> Artificial Sequence <220> <223> preS1-2A-PreS2.S coding sequence <400> 22 atggctaggc ccctgtgtac acttttgctc ctgatggcca ccctcgctgg agctctggca 60 agcggtggat ggagctcaaa gccgcggaaa gggatgggta ctaacctgtc cgtaccaaat 120 cccctgggat tttttccaga ccaccaactc gatcctgctt ttggcgcaaa ttccaacaat 180 cccgactggg actttaaccc taacaaggac cactggcctg atgccaacaa ggtgggggca 240 ggagcctttg gtcccggctt caccccaccc catggaggtc ttttgggatg gtcaccacag 300 gcccagggca tcctgaccac tgtccctgct gctccaccgc cagcttctac taatcgacag 360 agcgggaggc agccgacccc cctgagtccc cccctgcggg atacccaccc tcaggcagga 420 agcggagcta ctaacttcag cctgctgaag caggctggag acgtggagga gaaccctgga 480 cctatgcagt ggaactcaac tactttccat cagacccttc aggaccctag agtgcgcggg 540 ctgtactttc ctgctggggg aagcagtagc gggaccgtta atccagtacc tacgaccgcc 600 tctcccatat cttctatctt tagtaggact ggtgaccctg ctcccaacat ggagaatatc 660 acctccgggt ttctgggccc actcctggtc cttcaggccg gattcttcct gctgactcga 720 atcctcacca taccccagag cctggacagc tggtggacaa gcctgaattt tctgggagga 780 actcctgtat gcctgggaca aaattcacag tcccctacaa gtaaccattc accgacaagt 840 tgtcctccca tctgtcccgg atacaggtgg atgtgcctgc gaaggttcat catcttcctc 900 ttcatcctct tgctttgcct tattttcctc ctggttcttc tggactatca gggcatgctg 960 cctgtgtgcc cactgatacc aggatctagt actaccagca caggcccgtg taagacctgt 1020 acaattccag cacaagggac tagtatgttc ccctcctgct gttgtactaa gccaagcgac 1080 ggtaattgca cgtgtatccc aatcccgtcc tcctgggcgt ttgccaagta cctctgggaa 1140 tgggcctcag tcagattttc atggcttagt cttttggtgc cgttcgtgca gtggtttgtg 1200 ggactctctc cgactgtgtg gctcagcgtg atctggatga tgtggtactg gggcccttcc 1260 ctttacaaca tactgtctcc attccttccc ctgctgccaa tcttcttttg cctgtgggtc 1320 tatatt 1326 <210> 23 <211> 1850 <212> DNA <213> Artificial Sequence <220> <223> PreS2.S coding sequence -IRES (EMCV)-preS1 coding sequence <400> 23 atgcagtgga actcaactac tttccatcag acccttcagg accctagagt gcgcgggctg 60 tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac gaccgcctct 120 cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga gaatatcacc 180 tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct gactcgaatc 240 ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct gggaggaact 300 cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc gacaagttgt 360 cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat cttcctcttc 420 atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg catgctgcct 480 gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa gacctgtaca 540 attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc aagcgacggt 600 aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct ctgggaatgg 660 gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg gtttgtggga 720 ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg cccttccctt 780 tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct gtgggtctat 840 atttaagccc ctctccctcc ccccccccta acgttactgg ccgaagccgc ttggaataag 900 gccggtgtgc gtttgtctat atgttatttt ccaccatatt gccgtctttt ggcaatgtga 960 gggcccggaa acctggccct gtcttcttga cgagcattcc taggggtctt tcccctctcg 1020 ccaaaggaat gcaaggtctg ttgaatgtcg tgaaggaagc agttcctctg gaagcttctt 1080 gaagacaaac aacgtctgta gcgacccttt gcaggcagcg gaacccccca cctggcgaca 1140 ggtgcctctg cggccaaaag ccacgtgtat aagatacacc tgcaaaggcg gcacaacccc 1200 agtgccacgt tgtgagttgg atagttgtgg aaagagtcaa atggctctcc tcaagcgtat 1260 tcaacaaggg gctgaaggat gcccagaagg taccccattg tatgggatct gatctggggc 1320 ctcggtgcac atgctttaca tgtgtttagt cgaggttaaa aaacgtctag gccccccgaa 1380 ccacggggac gtggttttcc tttgaaaaac acgatgataa tatggccaca accatggcta 1440 ggcccctgtg tacacttttg ctcctgatgg ccaccctcgc tggagctctg gcaagcggtg 1500 gatggagctc aaagccgcgg aaagggatgg gtactaacct gtccgtacca aatcccctgg 1560 gattttttcc agaccaccaa ctcgatcctg cttttggcgc aaattccaac aatcccgact 1620 gggactttaa ccctaacaag gaccactggc ctgatgccaa caaggtgggg gcaggagcct 1680 ttggtcccgg cttcacccca ccccatggag gtcttttggg atggtcacca caggcccagg 1740 gcatcctgac cactgtccct gctgctccac cgccagcttc tactaatcga cagagcggga 1800 ggcagccgac ccccctgagt ccccccctgc gggataccca ccctcaggca 1850 <210> 24 <211> 1850 <212> DNA <213> Artificial Sequence <220> <223> preS1 coding sequence -IRES (EMCV)-PreS2.S coding sequence <400> 24 atggctaggc ccctgtgtac acttttgctc ctgatggcca ccctcgctgg agctctggca 60 agcggtggat ggagctcaaa gccgcggaaa gggatgggta ctaacctgtc cgtaccaaat 120 cccctgggat tttttccaga ccaccaactc gatcctgctt ttggcgcaaa ttccaacaat 180 cccgactggg actttaaccc taacaaggac cactggcctg atgccaacaa ggtgggggca 240 ggagcctttg gtcccggctt caccccaccc catggaggtc ttttgggatg gtcaccacag 300 gcccagggca tcctgaccac tgtccctgct gctccaccgc cagcttctac taatcgacag 360 agcgggaggc agccgacccc cctgagtccc cccctgcggg atacccaccc tcaggcataa 420 gcccctctcc ctcccccccc cctaacgtta ctggccgaag ccgcttggaa taaggccggt 480 gtgcgtttgt ctatatgtta ttttccacca tattgccgtc ttttggcaat gtgagggccc 540 ggaaacctgg ccctgtcttc ttgacgagca ttcctagggg tctttcccct ctcgccaaag 600 gaatgcaagg tctgttgaat gtcgtgaagg aagcagttcc tctggaagct tcttgaagac 660 aaacaacgtc tgtagcgacc ctttgcaggc agcggaaccc cccacctggc gacaggtgcc 720 tctgcggcca aaagccacgt gtataagata cacctgcaaa ggcggcacaa ccccagtgcc 780 acgttgtgag ttggatagtt gtggaaagag tcaaatggct ctcctcaagc gtattcaaca 840 aggggctgaa ggatgcccag aaggtacccc attgtatggg atctgatctg gggcctcggt 900 gcacatgctt tacatgtgtt tagtcgaggt taaaaaacgt ctaggccccc cgaaccacgg 960 ggacgtggtt ttcctttgaa aaacacgatg ataatatggc cacaaccatg cagtggaact 1020 caactacttt ccatcagacc cttcaggacc ctagagtgcg cgggctgtac tttcctgctg 1080 ggggaagcag tagcgggacc gttaatccag tacctacgac cgcctctccc atatcttcta 1140 tctttagtag gactggtgac cctgctccca acatggagaa tatcacctcc gggtttctgg 1200 gcccactcct ggtccttcag gccggattct tcctgctgac tcgaatcctc accatacccc 1260 agagcctgga cagctggtgg acaagcctga attttctggg aggaactcct gtatgcctgg 1320 gacaaaattc acagtcccct acaagtaacc attcaccgac aagttgtcct cccatctgtc 1380 ccggatacag gtggatgtgc ctgcgaaggt tcatcatctt cctcttcatc ctcttgcttt 1440 gccttatttt cctcctggtt cttctggact atcagggcat gctgcctgtg tgcccactga 1500 taccaggatc tagtactacc agcacaggcc cgtgtaagac ctgtacaatt ccagcacaag 1560 ggactagtat gttcccctcc tgctgttgta ctaagccaag cgacggtaat tgcacgtgta 1620 tcccaatccc gtcctcctgg gcgtttgcca agtacctctg ggaatgggcc tcagtcagat 1680 tttcatggct tagtcttttg gtgccgttcg tgcagtggtt tgtgggactc tctccgactg 1740 tgtggctcag cgtgatctgg atgatgtggt actggggccc ttccctttac aacatactgt 1800 ctccattcct tcccctgctg ccaatcttct tttgcctgtg ggtctatatt 1850 <210> 25 <211> 2010 <212> DNA <213> Artificial Sequence <220> <223> PreS2.S coding sequence -IRES (EV71)-preS1 coding sequence <400> 25 atgcagtgga actcaactac tttccatcag acccttcagg accctagagt gcgcgggctg 60 tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac gaccgcctct 120 cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga gaatatcacc 180 tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct gactcgaatc 240 ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct gggaggaact 300 cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc gacaagttgt 360 cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat cttcctcttc 420 atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg catgctgcct 480 gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa gacctgtaca 540 attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc aagcgacggt 600 aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct ctgggaatgg 660 gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg gtttgtggga 720 ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg cccttccctt 780 tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct gtgggtctat 840 atttaattaa aacagctgtg ggttgttccc acccacaggg cccactgggc gctagcactc 900 tgattttacg aaatccttgt gcgcctgttt tatatccctt ccctaattcg aaacgtagaa 960 gcaatgcgca ccactgatca atagtaggcg taacgcgcca gttacgtcat gatcaagcat 1020 atctgttccc ccggactgag tatcaataga ctgcttacgc ggttgaagga gaaaacgttc 1080 gttatccggc taactacttc gagaagccca gtaacaccat ggaagctgca gggtgtttcg 1140 ctcagcactt cccccgtgta gatcaggtcg atgagccact gcaatcccca caggtgactg 1200 tggcagtggc tgcgttggcg gcctgcctat ggggagaccc ataggacgct ctaatgtgga 1260 catggtgcga agagcctatt gagctagtta gtagtcctcc ggcccctgaa tgcggctaat 1320 cctaactgcg gagcacatgc cttcaaccca gagggtagtg tgtcgtaacg ggcaactctg 1380 cagcggaacc gactactttg ggtgtccgtg tttctttttt attcttatat tggctgctta 1440 tggtgacaat tacagaattg ttaccatata gctattggat tggccatccg gtgtgtaata 1500 gagctgttat atacctattt gttggctttg taccactaac tttaaaatct ataactaccc 1560 tcaactttat attaaccctc aatacagttg accatggcta ggcccctgtg tacacttttg 1620 ctcctgatgg ccaccctcgc tggagctctg gcaagcggtg gatggagctc aaagccgcgg 1680 aaagggatgg gtactaacct gtccgtacca aatcccctgg gattttttcc agaccaccaa 1740 ctcgatcctg cttttggcgc aaattccaac aatcccgact gggactttaa ccctaacaag 1800 gaccactggc ctgatgccaa caaggtgggg gcaggagcct ttggtcccgg cttcacccca 1860 ccccatggag gtcttttggg atggtcacca caggcccagg gcatcctgac cactgtccct 1920 gctgctccac cgccagcttc tactaatcga cagagcggga ggcagccgac ccccctgagt 1980 ccccccctgc gggataccca ccctcaggca 2010 <210> 26 <211> 2010 <212> DNA <213> Artificial Sequence <220> <223> preS1 coding sequence -IRES (EV71)-PreS2.S coding sequence <400> 26 atggctaggc ccctgtgtac acttttgctc ctgatggcca ccctcgctgg agctctggca 60 agcggtggat ggagctcaaa gccgcggaaa gggatgggta ctaacctgtc cgtaccaaat 120 cccctgggat tttttccaga ccaccaactc gatcctgctt ttggcgcaaa ttccaacaat 180 cccgactggg actttaaccc taacaaggac cactggcctg atgccaacaa ggtgggggca 240 ggagcctttg gtcccggctt caccccaccc catggaggtc ttttgggatg gtcaccacag 300 gcccagggca tcctgaccac tgtccctgct gctccaccgc cagcttctac taatcgacag 360 agcgggaggc agccgacccc cctgagtccc cccctgcggg atacccaccc tcaggcataa 420 ttaaaacagc tgtgggttgt tcccacccac agggcccact gggcgctagc actctgattt 480 tacgaaatcc ttgtgcgcct gttttatatc ccttccctaa ttcgaaacgt agaagcaatg 540 cgcaccactg atcaatagta ggcgtaacgc gccagttacg tcatgatcaa gcatatctgt 600 tcccccggac tgagtatcaa tagactgctt acgcggttga aggagaaaac gttcgttatc 660 cggctaacta cttcgagaag cccagtaaca ccatggaagc tgcagggtgt ttcgctcagc 720 acttcccccg tgtagatcag gtcgatgagc cactgcaatc cccacaggtg actgtggcag 780 tggctgcgtt ggcggcctgc ctatggggag acccatagga cgctctaatg tggacatggt 840 gcgaagagcc tattgagcta gttagtagtc ctccggcccc tgaatgcggc taatcctaac 900 tgcggagcac atgccttcaa cccagagggt agtgtgtcgt aacgggcaac tctgcagcgg 960 aaccgactac tttgggtgtc cgtgtttctt ttttattctt atattggctg cttatggtga 1020 caattacaga attgttacca tatagctatt ggattggcca tccggtgtgt aatagagctg 1080 ttatatacct atttgttggc tttgtaccac taactttaaa atctataact accctcaact 1140 ttatattaac cctcaataca gttgaccatg cagtggaact caactacttt ccatcagacc 1200 cttcaggacc ctagagtgcg cgggctgtac tttcctgctg ggggaagcag tagcgggacc 1260 gttaatccag tacctacgac cgcctctccc atatcttcta tctttagtag gactggtgac 1320 cctgctccca acatggagaa tatcacctcc gggtttctgg gcccactcct ggtccttcag 1380 gccggattct tcctgctgac tcgaatcctc accatacccc agagcctgga cagctggtgg 1440 acaagcctga attttctggg aggaactcct gtatgcctgg gacaaaattc acagtcccct 1500 acaagtaacc attcaccgac aagttgtcct cccatctgtc ccggatacag gtggatgtgc 1560 ctgcgaaggt tcatcatctt cctcttcatc ctcttgcttt gccttatttt cctcctggtt 1620 cttctggact atcagggcat gctgcctgtg tgcccactga taccaggatc tagtactacc 1680 agcacaggcc cgtgtaagac ctgtacaatt ccagcacaag ggactagtat gttcccctcc 1740 tgctgttgta ctaagccaag cgacggtaat tgcacgtgta tcccaatccc gtcctcctgg 1800 gcgtttgcca agtacctctg ggaatgggcc tcagtcagat tttcatggct tagtcttttg 1860 gtgccgttcg tgcagtggtt tgtgggactc tctccgactg tgtggctcag cgtgatctgg 1920 atgatgtggt actggggccc ttccctttac aacatactgt ctccattcct tcccctgctg 1980 ccaatcttct tttgcctgtg ggtctatatt 2010 <210> 27 <211> 4566 <212> DNA <213> Artificial Sequence <220> <223> Core-2A-Pol-2A-PreS.S-2A-preS1 coding sequence <400> 27 atggctcgac ctctgtgtac cctgctactc ctgatggcta ccctggctgg agctctggcc 60 agcgacatcg acccttacaa ggagttcggc gccagcgtgg aactgctgtc ttttctgccc 120 agtgatttct ttccttccat tcgagacctg ctggataccg cctctgctct gtatcgggaa 180 gccctggaga gcccagaaca ctgctcccca caccataccg ctctgcgaca ggcaatcctg 240 tgctgggggg agctgatgaa cctggccaca tgggtgggat cgaatctgga ggaccccgct 300 tcacgggaac tggtggtcag ctacgtgaac gtcaatatgg gcctgaaaat ccgccagctg 360 ctgtggttcc atattagctg cctgactttt ggacgagaga ccgtgctgga atacctggtg 420 tccttcggcg tctggattcg cactccccct gcttatcgac cacccaacgc accaattctg 480 tccaccctgc ccgagaccac agtggtccgt cgccgtggaa gcggagctac taacttcagc 540 ctgctgaagc aggctggaga cgtggaggag aaccctggac ctatggctcg acctctgtgt 600 accctgctac tcctgatggc taccctggct ggagctctgg ccagcatgcc cctgtcttac 660 cagcacttta gaaagcttct gctgctggac gatgaagccg ggcctctgga ggaagagctg 720 ccaaggctgg cagacgaggg gctgaaccgg agagtggccg aagatctgaa tctgggaaac 780 ctgaacgtga gcatcccttg gactcataaa gtcggcaact tcaccgggct gtacagctcc 840 acagtgcctg tcttcaatcc agagtggcag acaccatcct ttcccaacat tcacctgcag 900 gaggacatca ttaatagatg cgaacagttc gtgggacctc tgacagtcaa cgaaaagagg 960 cgcctgaaac tgatcatgcc tgccaggttt tacccaaatg tgactaagta tctgccactg 1020 gataagggca tcaagcctta ctatccagag cacctggtga accattactt ccagactaga 1080 cactatctgc ataccctgtg gaaggccgga atcctgtaca aacgagaaac tacccggagt 1140 gcttcatttt gtggctcccc atattcttgg gaacaggagc tgcagcatgg caggctggtg 1200 ttccagacca gcaaacgcca cggggatgag tccttttgca gccagtctag tggcatcctg 1260 agcagatccc ccgtggggcc ttgtattcag tctcagctgc ggaagagtag actgggactg 1320 cagccacagc agggacacct ggcacgacgg cagcagggaa ggtctggcag tatccgggct 1380 agagtgcatc ccacaactag aaggaccttc ggcgtcgagc catcaggaag cggccacatc 1440 gacaacagcg catcaagctc ctctagttgc ctgcatcagt cagccgtgag aaaggccgct 1500 tacagccacc tgtccacatc taaaaggcac tcaagctccg ggcatgctgt ggagctgcac 1560 aacatccctc caaattctgc acgcagtcag tcagaaggac ccgtgttcag ctgctggtgg 1620 ctgcagtttc ggaactcaaa gccttgcagc gactattgtc tgagccatat tgtgaatctg 1680 ctggaggatt ggggcccttg taccgagcac ggggaacacc atatcaggat tccacgaaca 1740 ccagcacgag tgactggagg ggtgttcctg gtggacaaga acccccacaa tactaccgag 1800 agccggctgg tggtcgattt cagtcagttt tcaagaggca acacaagggt gtcatggccc 1860 aaattcgccg tccctaatct gcagagtctg actaacctgc tgtctagtaa tctgagctgg 1920 ctgtccctgg acgtgtccgc agccttttac cacctgcctc tgcatccagc tgcaatgccc 1980 catctgctgg tggggtcaag cggactgagt cgctacgtcg cccgactgtc ctctaactca 2040 cgcatcatta atcaccagca tggcaccatg cagaacctgc acgatagctg ttcccggaat 2100 ctgtacgtgt ctctgctgct gctgtataag acattcggca gaaaactgca cctgtacagc 2160 catcctatca ttctggggtt taggaagatc ccaatgggag tgggactgag ccccttcctg 2220 ctggcacagt ttacctccgc catttgctct gtggtccgcc gagccttccc acactgtctg 2280 gctttttcct atatgaacaa tgtggtcctg ggcgccaaat ccgtgcagca tctggagtct 2340 ctgttcacag ctgtcactaa ctttctgctg agcctgggga tccacctgaa cccaaataag 2400 actaaacgct gggggtacag cctgaatttc atgggatatg tgattggatc ctgggggacc 2460 ctgccacagg agcacatcgt gcagaagatc aaggaatgct ttcggaagct gcccgtcaac 2520 agacctatcg actggaaagt gtgccagcgg attgtcggac tgctgggctt cgccgctccc 2580 tttacccagt gcgggtaccc agcactgatg cccctgtatg cctgtatcca gtctaagcag 2640 gctttcacct ttagtcctac atacaaggca ttcctgtgca aacagtacct gaacctgtat 2700 ccagtggcaa ggcagcgacc tggactgtgc caggtctttg caaatgccac tcctaccggc 2760 tgggggctgg ctatcggaca tcagcgaatg cggggcacat tcgtggcccc cctgcctatt 2820 cacactgctc agctgctggc agcctgcttt gctagatcta ggagtggagc aaagctgatc 2880 ggcaccgaca atagtgtggt cctgtcaaga aaatacacat ccttcccatg gctgctggga 2940 tgtgctgcaa actggattct gaggggcacc agcttcgtgt acgtcccctc agccctgaat 3000 cctgctgacg atccatcccg cgggcgactg ggactgtacc gacctctgct gagactgccc 3060 ttcaggccta caactggccg gacatctctg tatgccgatt caccaagcgt gccctcacac 3120 ctgcctgaca gagtccactt tgcttcaccc ctgcacgtcg cttggcggcc tccaggatca 3180 ggcgctacga attttagcct tctgaagcaa gcgggagacg ttgaagaaaa cccagggcct 3240 atgcagtgga actcaactac tttccatcag acccttcagg accctagagt gcgcgggctg 3300 tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac gaccgcctct 3360 cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga gaatatcacc 3420 tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct gactcgaatc 3480 ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct gggaggaact 3540 cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc gacaagttgt 3600 cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat cttcctcttc 3660 atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg catgctgcct 3720 gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa gacctgtaca 3780 attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc aagcgacggt 3840 aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct ctgggaatgg 3900 gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg gtttgtggga 3960 ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg cccttccctt 4020 tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct gtgggtctat 4080 attgggtccg gagcgactaa cttttccctg ctgaaacaag cgggtgacgt cgaagagaat 4140 ccgggaccta tggctaggcc cctgtgtaca cttttgctcc tgatggccac cctcgctgga 4200 gctctggcaa gcggtggatg gagctcaaag ccgcggaaag ggatgggtac taacctgtcc 4260 gtaccaaatc ccctgggatt ttttccagac caccaactcg atcctgcttt tggcgcaaat 4320 tccaacaatc ccgactggga ctttaaccct aacaaggacc actggcctga tgccaacaag 4380 gtgggggcag gagcctttgg tcccggcttc accccacccc atggaggtct tttgggatgg 4440 tcaccacagg cccagggcat cctgaccact gtccctgctg ctccaccgcc agcttctact 4500 aatcgacaga gcgggaggca gccgaccccc ctgagtcccc ccctgcggga tacccaccct 4560 caggca 4566 <210> 28 <211> 4566 <212> DNA <213> Artificial Sequence <220> <223> Pol-2A-Core-2A-PreS2.S-2A-preS1 coding sequence <400> 28 atggctcgac ctctgtgtac cctgctactc ctgatggcta ccctggctgg agctctggcc 60 agcatgcccc tgtcttacca gcactttaga aagcttctgc tgctggacga tgaagccggg 120 cctctggagg aagagctgcc aaggctggca gacgaggggc tgaaccggag agtggccgaa 180 gatctgaatc tgggaaacct gaacgtgagc atcccttgga ctcataaagt cggcaacttc 240 accgggctgt acagctccac agtgcctgtc ttcaatccag agtggcagac accatccttt 300 cccaacattc acctgcagga ggacatcatt aatagatgcg aacagttcgt gggacctctg 360 acagtcaacg aaaagaggcg cctgaaactg atcatgcctg ccaggtttta cccaaatgtg 420 actaagtatc tgccactgga taagggcatc aagccttact atccagagca cctggtgaac 480 cattacttcc agactagaca ctatctgcat accctgtgga aggccggaat cctgtacaaa 540 cgagaaacta cccggagtgc ttcattttgt ggctccccat attcttggga acaggagctg 600 cagcatggca ggctggtgtt ccagaccagc aaacgccacg gggatgagtc cttttgcagc 660 cagtctagtg gcatcctgag cagatccccc gtggggcctt gtattcagtc tcagctgcgg 720 aagagtagac tgggactgca gccacagcag ggacacctgg cacgacggca gcagggaagg 780 tctggcagta tccgggctag agtgcatccc acaactagaa ggaccttcgg cgtcgagcca 840 tcaggaagcg gccacatcga caacagcgca tcaagctcct ctagttgcct gcatcagtca 900 gccgtgagaa aggccgctta cagccacctg tccacatcta aaaggcactc aagctccggg 960 catgctgtgg agctgcacaa catccctcca aattctgcac gcagtcagtc agaaggaccc 1020 gtgttcagct gctggtggct gcagtttcgg aactcaaagc cttgcagcga ctattgtctg 1080 agccatattg tgaatctgct ggaggattgg ggcccttgta ccgagcacgg ggaacaccat 1140 atcaggattc cacgaacacc agcacgagtg actggagggg tgttcctggt ggacaagaac 1200 ccccacaata ctaccgagag ccggctggtg gtcgatttca gtcagttttc aagaggcaac 1260 acaagggtgt catggcccaa attcgccgtc cctaatctgc agagtctgac taacctgctg 1320 tctagtaatc tgagctggct gtccctggac gtgtccgcag ccttttacca cctgcctctg 1380 catccagctg caatgcccca tctgctggtg gggtcaagcg gactgagtcg ctacgtcgcc 1440 cgactgtcct ctaactcacg catcattaat caccagcatg gcaccatgca gaacctgcac 1500 gatagctgtt cccggaatct gtacgtgtct ctgctgctgc tgtataagac attcggcaga 1560 aaactgcacc tgtacagcca tcctatcatt ctggggttta ggaagatccc aatgggagtg 1620 ggactgagcc ccttcctgct ggcacagttt acctccgcca tttgctctgt ggtccgccga 1680 gccttcccac actgtctggc tttttcctat atgaacaatg tggtcctggg cgccaaatcc 1740 gtgcagcatc tggagtctct gttcacagct gtcactaact ttctgctgag cctggggatc 1800 cacctgaacc caaataagac taaacgctgg gggtacagcc tgaatttcat gggatatgtg 1860 attggatcct gggggaccct gccacaggag cacatcgtgc agaagatcaa ggaatgcttt 1920 cggaagctgc ccgtcaacag acctatcgac tggaaagtgt gccagcggat tgtcggactg 1980 ctgggcttcg ccgctccctt tacccagtgc gggtacccag cactgatgcc cctgtatgcc 2040 tgtatccagt ctaagcaggc tttcaccttt agtcctacat acaaggcatt cctgtgcaaa 2100 cagtacctga acctgtatcc agtggcaagg cagcgacctg gactgtgcca ggtctttgca 2160 aatgccactc ctaccggctg ggggctggct atcggacatc agcgaatgcg gggcacattc 2220 gtggcccccc tgcctattca cactgctcag ctgctggcag cctgctttgc tagatctagg 2280 agtggagcaa agctgatcgg caccgacaat agtgtggtcc tgtcaagaaa atacacatcc 2340 ttcccatggc tgctgggatg tgctgcaaac tggattctga ggggcaccag cttcgtgtac 2400 gtcccctcag ccctgaatcc tgctgacgat ccatcccgcg ggcgactggg actgtaccga 2460 cctctgctga gactgccctt caggcctaca actggccgga catctctgta tgccgattca 2520 ccaagcgtgc cctcacacct gcctgacaga gtccactttg cttcacccct gcacgtcgct 2580 tggcggcctc caggaagcgg agctactaac ttcagcctgc tgaagcaggc tggagacgtg 2640 gaggagaacc ctggacctat ggctcgacct ctgtgtaccc tgctactcct gatggctacc 2700 ctggctggag ctctggccag cgacatcgac ccttacaagg agttcggcgc cagcgtggaa 2760 ctgctgtctt ttctgcccag tgatttcttt ccttccattc gagacctgct ggataccgcc 2820 tctgctctgt atcgggaagc cctggagagc ccagaacact gctccccaca ccataccgct 2880 ctgcgacagg caatcctgtg ctggggggag ctgatgaacc tggccacatg ggtgggatcg 2940 aatctggagg accccgcttc acgggaactg gtggtcagct acgtgaacgt caatatgggc 3000 ctgaaaatcc gccagctgct gtggttccat attagctgcc tgacttttgg acgagagacc 3060 gtgctggaat acctggtgtc cttcggcgtc tggattcgca ctccccctgc ttatcgacca 3120 cccaacgcac caattctgtc caccctgccc gagaccacag tggtccgtcg ccgtggatca 3180 ggcgctacga attttagcct tctgaagcaa gcgggagacg ttgaagaaaa cccagggcct 3240 atgcagtgga actcaactac tttccatcag acccttcagg accctagagt gcgcgggctg 3300 tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac gaccgcctct 3360 cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga gaatatcacc 3420 tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct gactcgaatc 3480 ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct gggaggaact 3540 cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc gacaagttgt 3600 cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat cttcctcttc 3660 atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg catgctgcct 3720 gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa gacctgtaca 3780 attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc aagcgacggt 3840 aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct ctgggaatgg 3900 gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg gtttgtggga 3960 ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg cccttccctt 4020 tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct gtgggtctat 4080 attgggtccg gagcgactaa cttttccctg ctgaaacaag cgggtgacgt cgaagagaat 4140 ccgggaccta tggctaggcc cctgtgtaca cttttgctcc tgatggccac cctcgctgga 4200 gctctggcaa gcggtggatg gagctcaaag ccgcggaaag ggatgggtac taacctgtcc 4260 gtaccaaatc ccctgggatt ttttccagac caccaactcg atcctgcttt tggcgcaaat 4320 tccaacaatc ccgactggga ctttaaccct aacaaggacc actggcctga tgccaacaag 4380 gtgggggcag gagcctttgg tcccggcttc accccacccc atggaggtct tttgggatgg 4440 tcaccacagg cccagggcat cctgaccact gtccctgctg ctccaccgcc agcttctact 4500 aatcgacaga gcgggaggca gccgaccccc ctgagtcccc ccctgcggga tacccaccct 4560 caggca 4566 <210> 29 <211> 4566 <212> DNA <213> Artificial Sequence <220> <223> PreS2.S-2A-preS1-2A-Core-2A-Pol coding sequence <400> 29 atgcagtgga actcaactac tttccatcag acccttcagg accctagagt gcgcgggctg 60 tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac gaccgcctct 120 cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga gaatatcacc 180 tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct gactcgaatc 240 ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct gggaggaact 300 cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc gacaagttgt 360 cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat cttcctcttc 420 atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg catgctgcct 480 gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa gacctgtaca 540 attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc aagcgacggt 600 aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct ctgggaatgg 660 gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg gtttgtggga 720 ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg cccttccctt 780 tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct gtgggtctat 840 attggaagcg gagctactaa cttcagcctg ctgaagcagg ctggagacgt ggaggagaac 900 cctggaccta tggctaggcc cctgtgtaca cttttgctcc tgatggccac cctcgctgga 960 gctctggcaa gcggtggatg gagctcaaag ccgcggaaag ggatgggtac taacctgtcc 1020 gtaccaaatc ccctgggatt ttttccagac caccaactcg atcctgcttt tggcgcaaat 1080 tccaacaatc ccgactggga ctttaaccct aacaaggacc actggcctga tgccaacaag 1140 gtgggggcag gagcctttgg tcccggcttc accccacccc atggaggtct tttgggatgg 1200 tcaccacagg cccagggcat cctgaccact gtccctgctg ctccaccgcc agcttctact 1260 aatcgacaga gcgggaggca gccgaccccc ctgagtcccc ccctgcggga tacccaccct 1320 caggcaggat caggcgctac gaattttagc cttctgaagc aagcgggaga cgttgaagaa 1380 aacccagggc ctatggctcg acctctgtgt accctgctac tcctgatggc taccctggct 1440 ggagctctgg ccagcgacat cgacccttac aaggagttcg gcgccagcgt ggaactgctg 1500 tcttttctgc ccagtgattt ctttccttcc attcgagacc tgctggatac cgcctctgct 1560 ctgtatcggg aagccctgga gagcccagaa cactgctccc cacaccatac cgctctgcga 1620 caggcaatcc tgtgctgggg ggagctgatg aacctggcca catgggtggg atcgaatctg 1680 gaggaccccg cttcacggga actggtggtc agctacgtga acgtcaatat gggcctgaaa 1740 atccgccagc tgctgtggtt ccatattagc tgcctgactt ttggacgaga gaccgtgctg 1800 gaatacctgg tgtccttcgg cgtctggatt cgcactcccc ctgcttatcg accacccaac 1860 gcaccaattc tgtccaccct gcccgagacc acagtggtcc gtcgccgtgg gtccggagcg 1920 actaactttt ccctgctgaa acaagcgggt gacgtcgaag agaatccggg acctatggct 1980 cgacctctgt gtaccctgct actcctgatg gctaccctgg ctggagctct ggccagcatg 2040 cccctgtctt accagcactt tagaaagctt ctgctgctgg acgatgaagc cgggcctctg 2100 gaggaagagc tgccaaggct ggcagacgag gggctgaacc ggagagtggc cgaagatctg 2160 aatctgggaa acctgaacgt gagcatccct tggactcata aagtcggcaa cttcaccggg 2220 ctgtacagct ccacagtgcc tgtcttcaat ccagagtggc agacaccatc ctttcccaac 2280 attcacctgc aggaggacat cattaataga tgcgaacagt tcgtgggacc tctgacagtc 2340 aacgaaaaga ggcgcctgaa actgatcatg cctgccaggt tttacccaaa tgtgactaag 2400 tatctgccac tggataaggg catcaagcct tactatccag agcacctggt gaaccattac 2460 ttccagacta gacactatct gcataccctg tggaaggccg gaatcctgta caaacgagaa 2520 actacccgga gtgcttcatt ttgtggctcc ccatattctt gggaacagga gctgcagcat 2580 ggcaggctgg tgttccagac cagcaaacgc cacggggatg agtccttttg cagccagtct 2640 agtggcatcc tgagcagatc ccccgtgggg ccttgtattc agtctcagct gcggaagagt 2700 agactgggac tgcagccaca gcagggacac ctggcacgac ggcagcaggg aaggtctggc 2760 agtatccggg ctagagtgca tcccacaact agaaggacct tcggcgtcga gccatcagga 2820 agcggccaca tcgacaacag cgcatcaagc tcctctagtt gcctgcatca gtcagccgtg 2880 agaaaggccg cttacagcca cctgtccaca tctaaaaggc actcaagctc cgggcatgct 2940 gtggagctgc acaacatccc tccaaattct gcacgcagtc agtcagaagg acccgtgttc 3000 agctgctggt ggctgcagtt tcggaactca aagccttgca gcgactattg tctgagccat 3060 attgtgaatc tgctggagga ttggggccct tgtaccgagc acggggaaca ccatatcagg 3120 attccacgaa caccagcacg agtgactgga ggggtgttcc tggtggacaa gaacccccac 3180 aatactaccg agagccggct ggtggtcgat ttcagtcagt tttcaagagg caacacaagg 3240 gtgtcatggc ccaaattcgc cgtccctaat ctgcagagtc tgactaacct gctgtctagt 3300 aatctgagct ggctgtccct ggacgtgtcc gcagcctttt accacctgcc tctgcatcca 3360 gctgcaatgc cccatctgct ggtggggtca agcggactga gtcgctacgt cgcccgactg 3420 tcctctaact cacgcatcat taatcaccag catggcacca tgcagaacct gcacgatagc 3480 tgttcccgga atctgtacgt gtctctgctg ctgctgtata agacattcgg cagaaaactg 3540 cacctgtaca gccatcctat cattctgggg tttaggaaga tcccaatggg agtgggactg 3600 agccccttcc tgctggcaca gtttacctcc gccatttgct ctgtggtccg ccgagccttc 3660 ccacactgtc tggctttttc ctatatgaac aatgtggtcc tgggcgccaa atccgtgcag 3720 catctggagt ctctgttcac agctgtcact aactttctgc tgagcctggg gatccacctg 3780 aacccaaata agactaaacg ctgggggtac agcctgaatt tcatgggata tgtgattgga 3840 tcctggggga ccctgccaca ggagcacatc gtgcagaaga tcaaggaatg ctttcggaag 3900 ctgcccgtca acagacctat cgactggaaa gtgtgccagc ggattgtcgg actgctgggc 3960 ttcgccgctc cctttaccca gtgcgggtac ccagcactga tgcccctgta tgcctgtatc 4020 cagtctaagc aggctttcac ctttagtcct acatacaagg cattcctgtg caaacagtac 4080 ctgaacctgt atccagtggc aaggcagcga cctggactgt gccaggtctt tgcaaatgcc 4140 actcctaccg gctgggggct ggctatcgga catcagcgaa tgcggggcac attcgtggcc 4200 cccctgccta ttcacactgc tcagctgctg gcagcctgct ttgctagatc taggagtgga 4260 gcaaagctga tcggcaccga caatagtgtg gtcctgtcaa gaaaatacac atccttccca 4320 tggctgctgg gatgtgctgc aaactggatt ctgaggggca ccagcttcgt gtacgtcccc 4380 tcagccctga atcctgctga cgatccatcc cgcgggcgac tgggactgta ccgacctctg 4440 ctgagactgc ccttcaggcc tacaactggc cggacatctc tgtatgccga ttcaccaagc 4500 gtgccctcac acctgcctga cagagtccac tttgcttcac ccctgcacgt cgcttggcgg 4560 cctcca 4566 <210> 30 <211> 4566 <212> DNA <213> Artificial Sequence <220> <223> PreS2.S-2A-preS1-2A-Pol-2A-Core coding sequence <400> 30 atgcagtgga actcaactac tttccatcag acccttcagg accctagagt gcgcgggctg 60 tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac gaccgcctct 120 cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga gaatatcacc 180 tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct gactcgaatc 240 ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct gggaggaact 300 cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc gacaagttgt 360 cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat cttcctcttc 420 atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg catgctgcct 480 gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa gacctgtaca 540 attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc aagcgacggt 600 aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct ctgggaatgg 660 gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg gtttgtggga 720 ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg cccttccctt 780 tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct gtgggtctat 840 attggaagcg gagctactaa cttcagcctg ctgaagcagg ctggagacgt ggaggagaac 900 cctggaccta tggctaggcc cctgtgtaca cttttgctcc tgatggccac cctcgctgga 960 gctctggcaa gcggtggatg gagctcaaag ccgcggaaag ggatgggtac taacctgtcc 1020 gtaccaaatc ccctgggatt ttttccagac caccaactcg atcctgcttt tggcgcaaat 1080 tccaacaatc ccgactggga ctttaaccct aacaaggacc actggcctga tgccaacaag 1140 gtgggggcag gagcctttgg tcccggcttc accccacccc atggaggtct tttgggatgg 1200 tcaccacagg cccagggcat cctgaccact gtccctgctg ctccaccgcc agcttctact 1260 aatcgacaga gcgggaggca gccgaccccc ctgagtcccc ccctgcggga tacccaccct 1320 caggcaggat caggcgctac gaattttagc cttctgaagc aagcgggaga cgttgaagaa 1380 aacccagggc ctatggctcg acctctgtgt accctgctac tcctgatggc taccctggct 1440 ggagctctgg ccagcatgcc cctgtcttac cagcacttta gaaagcttct gctgctggac 1500 gatgaagccg ggcctctgga ggaagagctg ccaaggctgg cagacgaggg gctgaaccgg 1560 agagtggccg aagatctgaa tctgggaaac ctgaacgtga gcatcccttg gactcataaa 1620 gtcggcaact tcaccgggct gtacagctcc acagtgcctg tcttcaatcc agagtggcag 1680 acaccatcct ttcccaacat tcacctgcag gaggacatca ttaatagatg cgaacagttc 1740 gtgggacctc tgacagtcaa cgaaaagagg cgcctgaaac tgatcatgcc tgccaggttt 1800 tacccaaatg tgactaagta tctgccactg gataagggca tcaagcctta ctatccagag 1860 cacctggtga accattactt ccagactaga cactatctgc ataccctgtg gaaggccgga 1920 atcctgtaca aacgagaaac tacccggagt gcttcatttt gtggctcccc atattcttgg 1980 gaacaggagc tgcagcatgg caggctggtg ttccagacca gcaaacgcca cggggatgag 2040 tccttttgca gccagtctag tggcatcctg agcagatccc ccgtggggcc ttgtattcag 2100 tctcagctgc ggaagagtag actgggactg cagccacagc agggacacct ggcacgacgg 2160 cagcagggaa ggtctggcag tatccgggct agagtgcatc ccacaactag aaggaccttc 2220 ggcgtcgagc catcaggaag cggccacatc gacaacagcg catcaagctc ctctagttgc 2280 ctgcatcagt cagccgtgag aaaggccgct tacagccacc tgtccacatc taaaaggcac 2340 tcaagctccg ggcatgctgt ggagctgcac aacatccctc caaattctgc acgcagtcag 2400 tcagaaggac ccgtgttcag ctgctggtgg ctgcagtttc ggaactcaaa gccttgcagc 2460 gactattgtc tgagccatat tgtgaatctg ctggaggatt ggggcccttg taccgagcac 2520 ggggaacacc atatcaggat tccacgaaca ccagcacgag tgactggagg ggtgttcctg 2580 gtggacaaga acccccacaa tactaccgag agccggctgg tggtcgattt cagtcagttt 2640 tcaagaggca acacaagggt gtcatggccc aaattcgccg tccctaatct gcagagtctg 2700 actaacctgc tgtctagtaa tctgagctgg ctgtccctgg acgtgtccgc agccttttac 2760 cacctgcctc tgcatccagc tgcaatgccc catctgctgg tggggtcaag cggactgagt 2820 cgctacgtcg cccgactgtc ctctaactca cgcatcatta atcaccagca tggcaccatg 2880 cagaacctgc acgatagctg ttcccggaat ctgtacgtgt ctctgctgct gctgtataag 2940 acattcggca gaaaactgca cctgtacagc catcctatca ttctggggtt taggaagatc 3000 ccaatgggag tgggactgag ccccttcctg ctggcacagt ttacctccgc catttgctct 3060 gtggtccgcc gagccttccc acactgtctg gctttttcct atatgaacaa tgtggtcctg 3120 ggcgccaaat ccgtgcagca tctggagtct ctgttcacag ctgtcactaa ctttctgctg 3180 agcctgggga tccacctgaa cccaaataag actaaacgct gggggtacag cctgaatttc 3240 atgggatatg tgattggatc ctgggggacc ctgccacagg agcacatcgt gcagaagatc 3300 aaggaatgct ttcggaagct gcccgtcaac agacctatcg actggaaagt gtgccagcgg 3360 attgtcggac tgctgggctt cgccgctccc tttacccagt gcgggtaccc agcactgatg 3420 cccctgtatg cctgtatcca gtctaagcag gctttcacct ttagtcctac atacaaggca 3480 ttcctgtgca aacagtacct gaacctgtat ccagtggcaa ggcagcgacc tggactgtgc 3540 caggtctttg caaatgccac tcctaccggc tgggggctgg ctatcggaca tcagcgaatg 3600 cggggcacat tcgtggcccc cctgcctatt cacactgctc agctgctggc agcctgcttt 3660 gctagatcta ggagtggagc aaagctgatc ggcaccgaca atagtgtggt cctgtcaaga 3720 aaatacacat ccttcccatg gctgctggga tgtgctgcaa actggattct gaggggcacc 3780 agcttcgtgt acgtcccctc agccctgaat cctgctgacg atccatcccg cgggcgactg 3840 ggactgtacc gacctctgct gagactgccc ttcaggccta caactggccg gacatctctg 3900 tatgccgatt caccaagcgt gccctcacac ctgcctgaca gagtccactt tgcttcaccc 3960 ctgcacgtcg cttggcggcc tccagggtcc ggagcgacta acttttccct gctgaaacaa 4020 gcgggtgacg tcgaagagaa tccgggacct atggctcgac ctctgtgtac cctgctactc 4080 ctgatggcta ccctggctgg agctctggcc agcgacatcg acccttacaa ggagttcggc 4140 gccagcgtgg aactgctgtc ttttctgccc agtgatttct ttccttccat tcgagacctg 4200 ctggataccg cctctgctct gtatcgggaa gccctggaga gcccagaaca ctgctcccca 4260 caccataccg ctctgcgaca ggcaatcctg tgctgggggg agctgatgaa cctggccaca 4320 tgggtgggat cgaatctgga ggaccccgct tcacgggaac tggtggtcag ctacgtgaac 4380 gtcaatatgg gcctgaaaat ccgccagctg ctgtggttcc atattagctg cctgactttt 4440 ggacgagaga ccgtgctgga atacctggtg tccttcggcg tctggattcg cactccccct 4500 gcttatcgac cacccaacgc accaattctg tccaccctgc ccgagaccac agtggtccgt 4560 cgccgt 4566 <210> 31 <211> 5090 <212> DNA <213> Artificial Sequence <220> <223> Core-2A-Pol coding sequence -IRES (EMCV)-PreS2.S-2A-preS1 coding sequence <400> 31 atggctcgac ctctgtgtac cctgctactc ctgatggcta ccctggctgg agctctggcc 60 agcgacatcg acccttacaa ggagttcggc gccagcgtgg aactgctgtc ttttctgccc 120 agtgatttct ttccttccat tcgagacctg ctggataccg cctctgctct gtatcgggaa 180 gccctggaga gcccagaaca ctgctcccca caccataccg ctctgcgaca ggcaatcctg 240 tgctgggggg agctgatgaa cctggccaca tgggtgggat cgaatctgga ggaccccgct 300 tcacgggaac tggtggtcag ctacgtgaac gtcaatatgg gcctgaaaat ccgccagctg 360 ctgtggttcc atattagctg cctgactttt ggacgagaga ccgtgctgga atacctggtg 420 tccttcggcg tctggattcg cactccccct gcttatcgac cacccaacgc accaattctg 480 tccaccctgc ccgagaccac agtggtccgt cgccgtggaa gcggagctac taacttcagc 540 ctgctgaagc aggctggaga cgtggaggag aaccctggac ctatggctcg acctctgtgt 600 accctgctac tcctgatggc taccctggct ggagctctgg ccagcatgcc cctgtcttac 660 cagcacttta gaaagcttct gctgctggac gatgaagccg ggcctctgga ggaagagctg 720 ccaaggctgg cagacgaggg gctgaaccgg agagtggccg aagatctgaa tctgggaaac 780 ctgaacgtga gcatcccttg gactcataaa gtcggcaact tcaccgggct gtacagctcc 840 acagtgcctg tcttcaatcc agagtggcag acaccatcct ttcccaacat tcacctgcag 900 gaggacatca ttaatagatg cgaacagttc gtgggacctc tgacagtcaa cgaaaagagg 960 cgcctgaaac tgatcatgcc tgccaggttt tacccaaatg tgactaagta tctgccactg 1020 gataagggca tcaagcctta ctatccagag cacctggtga accattactt ccagactaga 1080 cactatctgc ataccctgtg gaaggccgga atcctgtaca aacgagaaac tacccggagt 1140 gcttcatttt gtggctcccc atattcttgg gaacaggagc tgcagcatgg caggctggtg 1200 ttccagacca gcaaacgcca cggggatgag tccttttgca gccagtctag tggcatcctg 1260 agcagatccc ccgtggggcc ttgtattcag tctcagctgc ggaagagtag actgggactg 1320 cagccacagc agggacacct ggcacgacgg cagcagggaa ggtctggcag tatccgggct 1380 agagtgcatc ccacaactag aaggaccttc ggcgtcgagc catcaggaag cggccacatc 1440 gacaacagcg catcaagctc ctctagttgc ctgcatcagt cagccgtgag aaaggccgct 1500 tacagccacc tgtccacatc taaaaggcac tcaagctccg ggcatgctgt ggagctgcac 1560 aacatccctc caaattctgc acgcagtcag tcagaaggac ccgtgttcag ctgctggtgg 1620 ctgcagtttc ggaactcaaa gccttgcagc gactattgtc tgagccatat tgtgaatctg 1680 ctggaggatt ggggcccttg taccgagcac ggggaacacc atatcaggat tccacgaaca 1740 ccagcacgag tgactggagg ggtgttcctg gtggacaaga acccccacaa tactaccgag 1800 agccggctgg tggtcgattt cagtcagttt tcaagaggca acacaagggt gtcatggccc 1860 aaattcgccg tccctaatct gcagagtctg actaacctgc tgtctagtaa tctgagctgg 1920 ctgtccctgg acgtgtccgc agccttttac cacctgcctc tgcatccagc tgcaatgccc 1980 catctgctgg tggggtcaag cggactgagt cgctacgtcg cccgactgtc ctctaactca 2040 cgcatcatta atcaccagca tggcaccatg cagaacctgc acgatagctg ttcccggaat 2100 ctgtacgtgt ctctgctgct gctgtataag acattcggca gaaaactgca cctgtacagc 2160 catcctatca ttctggggtt taggaagatc ccaatgggag tgggactgag ccccttcctg 2220 ctggcacagt ttacctccgc catttgctct gtggtccgcc gagccttccc acactgtctg 2280 gctttttcct atatgaacaa tgtggtcctg ggcgccaaat ccgtgcagca tctggagtct 2340 ctgttcacag ctgtcactaa ctttctgctg agcctgggga tccacctgaa cccaaataag 2400 actaaacgct gggggtacag cctgaatttc atgggatatg tgattggatc ctgggggacc 2460 ctgccacagg agcacatcgt gcagaagatc aaggaatgct ttcggaagct gcccgtcaac 2520 agacctatcg actggaaagt gtgccagcgg attgtcggac tgctgggctt cgccgctccc 2580 tttacccagt gcgggtaccc agcactgatg cccctgtatg cctgtatcca gtctaagcag 2640 gctttcacct ttagtcctac atacaaggca ttcctgtgca aacagtacct gaacctgtat 2700 ccagtggcaa ggcagcgacc tggactgtgc caggtctttg caaatgccac tcctaccggc 2760 tgggggctgg ctatcggaca tcagcgaatg cggggcacat tcgtggcccc cctgcctatt 2820 cacactgctc agctgctggc agcctgcttt gctagatcta ggagtggagc aaagctgatc 2880 ggcaccgaca atagtgtggt cctgtcaaga aaatacacat ccttcccatg gctgctggga 2940 tgtgctgcaa actggattct gaggggcacc agcttcgtgt acgtcccctc agccctgaat 3000 cctgctgacg atccatcccg cgggcgactg ggactgtacc gacctctgct gagactgccc 3060 ttcaggccta caactggccg gacatctctg tatgccgatt caccaagcgt gccctcacac 3120 ctgcctgaca gagtccactt tgcttcaccc ctgcacgtcg cttggcggcc tccataagcc 3180 cctctccctc ccccccccct aacgttactg gccgaagccg cttggaataa ggccggtgtg 3240 cgtttgtcta tatgttattt tccaccatat tgccgtcttt tggcaatgtg agggcccgga 3300 aacctggccc tgtcttcttg acgagcattc ctaggggtct ttcccctctc gccaaaggaa 3360 tgcaaggtct gttgaatgtc gtgaaggaag cagttcctct ggaagcttct tgaagacaaa 3420 caacgtctgt agcgaccctt tgcaggcagc ggaacccccc acctggcgac aggtgcctct 3480 gcggccaaaa gccacgtgta taagatacac ctgcaaaggc ggcacaaccc cagtgccacg 3540 ttgtgagttg gatagttgtg gaaagagtca aatggctctc ctcaagcgta ttcaacaagg 3600 ggctgaagga tgcccagaag gtaccccatt gtatgggatc tgatctgggg cctcggtgca 3660 catgctttac atgtgtttag tcgaggttaa aaaacgtcta ggccccccga accacgggga 3720 cgtggttttc ctttgaaaaa cacgatgata atatggccac aaccatgcag tggaactcaa 3780 ctactttcca tcagaccctt caggacccta gagtgcgcgg gctgtacttt cctgctgggg 3840 gaagcagtag cgggaccgtt aatccagtac ctacgaccgc ctctcccata tcttctatct 3900 ttagtaggac tggtgaccct gctcccaaca tggagaatat cacctccggg tttctgggcc 3960 cactcctggt ccttcaggcc ggattcttcc tgctgactcg aatcctcacc ataccccaga 4020 gcctggacag ctggtggaca agcctgaatt ttctgggagg aactcctgta tgcctgggac 4080 aaaattcaca gtcccctaca agtaaccatt caccgacaag ttgtcctccc atctgtcccg 4140 gatacaggtg gatgtgcctg cgaaggttca tcatcttcct cttcatcctc ttgctttgcc 4200 ttattttcct cctggttctt ctggactatc agggcatgct gcctgtgtgc ccactgatac 4260 caggatctag tactaccagc acaggcccgt gtaagacctg tacaattcca gcacaaggga 4320 ctagtatgtt cccctcctgc tgttgtacta agccaagcga cggtaattgc acgtgtatcc 4380 caatcccgtc ctcctgggcg tttgccaagt acctctggga atgggcctca gtcagatttt 4440 catggcttag tcttttggtg ccgttcgtgc agtggtttgt gggactctct ccgactgtgt 4500 ggctcagcgt gatctggatg atgtggtact ggggcccttc cctttacaac atactgtctc 4560 cattccttcc cctgctgcca atcttctttt gcctgtgggt ctatattggg tccggagcga 4620 ctaacttttc cctgctgaaa caagcgggtg acgtcgaaga gaatccggga cctatggcta 4680 ggcccctgtg tacacttttg ctcctgatgg ccaccctcgc tggagctctg gcaagcggtg 4740 gatggagctc aaagccgcgg aaagggatgg gtactaacct gtccgtacca aatcccctgg 4800 gattttttcc agaccaccaa ctcgatcctg cttttggcgc aaattccaac aatcccgact 4860 gggactttaa ccctaacaag gaccactggc ctgatgccaa caaggtgggg gcaggagcct 4920 ttggtcccgg cttcacccca ccccatggag gtcttttggg atggtcacca caggcccagg 4980 gcatcctgac cactgtccct gctgctccac cgccagcttc tactaatcga cagagcggga 5040 ggcagccgac ccccctgagt ccccccctgc gggataccca ccctcaggca 5090 <210> 32 <211> 5090 <212> DNA <213> Artificial Sequence <220> <223> PreS2.S-2A-preS1 coding sequence -IRES (EMCV)-Core-2A-Pol coding sequence <400> 32 atgcagtgga actcaactac tttccatcag acccttcagg accctagagt gcgcgggctg 60 tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac gaccgcctct 120 cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga gaatatcacc 180 tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct gactcgaatc 240 ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct gggaggaact 300 cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc gacaagttgt 360 cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat cttcctcttc 420 atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg catgctgcct 480 gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa gacctgtaca 540 attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc aagcgacggt 600 aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct ctgggaatgg 660 gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg gtttgtggga 720 ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg cccttccctt 780 tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct gtgggtctat 840 attggaagcg gagctactaa cttcagcctg ctgaagcagg ctggagacgt ggaggagaac 900 cctggaccta tggctaggcc cctgtgtaca cttttgctcc tgatggccac cctcgctgga 960 gctctggcaa gcggtggatg gagctcaaag ccgcggaaag ggatgggtac taacctgtcc 1020 gtaccaaatc ccctgggatt ttttccagac caccaactcg atcctgcttt tggcgcaaat 1080 tccaacaatc ccgactggga ctttaaccct aacaaggacc actggcctga tgccaacaag 1140 gtgggggcag gagcctttgg tcccggcttc accccacccc atggaggtct tttgggatgg 1200 tcaccacagg cccagggcat cctgaccact gtccctgctg ctccaccgcc agcttctact 1260 aatcgacaga gcgggaggca gccgaccccc ctgagtcccc ccctgcggga tacccaccct 1320 caggcataag cccctctccc tccccccccc ctaacgttac tggccgaagc cgcttggaat 1380 aaggccggtg tgcgtttgtc tatatgttat tttccaccat attgccgtct tttggcaatg 1440 tgagggcccg gaaacctggc cctgtcttct tgacgagcat tcctaggggt ctttcccctc 1500 tcgccaaagg aatgcaaggt ctgttgaatg tcgtgaagga agcagttcct ctggaagctt 1560 cttgaagaca aacaacgtct gtagcgaccc tttgcaggca gcggaacccc ccacctggcg 1620 acaggtgcct ctgcggccaa aagccacgtg tataagatac acctgcaaag gcggcacaac 1680 cccagtgcca cgttgtgagt tggatagttg tggaaagagt caaatggctc tcctcaagcg 1740 tattcaacaa ggggctgaag gatgcccaga aggtacccca ttgtatggga tctgatctgg 1800 ggcctcggtg cacatgcttt acatgtgttt agtcgaggtt aaaaaacgtc taggcccccc 1860 gaaccacggg gacgtggttt tcctttgaaa aacacgatga taatatggcc acaaccatgg 1920 ctcgacctct gtgtaccctg ctactcctga tggctaccct ggctggagct ctggccagcg 1980 acatcgaccc ttacaaggag ttcggcgcca gcgtggaact gctgtctttt ctgcccagtg 2040 atttctttcc ttccattcga gacctgctgg ataccgcctc tgctctgtat cgggaagccc 2100 tggagagccc agaacactgc tccccacacc ataccgctct gcgacaggca atcctgtgct 2160 ggggggagct gatgaacctg gccacatggg tgggatcgaa tctggaggac cccgcttcac 2220 gggaactggt ggtcagctac gtgaacgtca atatgggcct gaaaatccgc cagctgctgt 2280 ggttccatat tagctgcctg acttttggac gagagaccgt gctggaatac ctggtgtcct 2340 tcggcgtctg gattcgcact ccccctgctt atcgaccacc caacgcacca attctgtcca 2400 ccctgcccga gaccacagtg gtccgtcgcc gtgggtccgg agcgactaac ttttccctgc 2460 tgaaacaagc gggtgacgtc gaagagaatc cgggacctat ggctcgacct ctgtgtaccc 2520 tgctactcct gatggctacc ctggctggag ctctggccag catgcccctg tcttaccagc 2580 actttagaaa gcttctgctg ctggacgatg aagccgggcc tctggaggaa gagctgccaa 2640 ggctggcaga cgaggggctg aaccggagag tggccgaaga tctgaatctg ggaaacctga 2700 acgtgagcat cccttggact cataaagtcg gcaacttcac cgggctgtac agctccacag 2760 tgcctgtctt caatccagag tggcagacac catcctttcc caacattcac ctgcaggagg 2820 acatcattaa tagatgcgaa cagttcgtgg gacctctgac agtcaacgaa aagaggcgcc 2880 tgaaactgat catgcctgcc aggttttacc caaatgtgac taagtatctg ccactggata 2940 agggcatcaa gccttactat ccagagcacc tggtgaacca ttacttccag actagacact 3000 atctgcatac cctgtggaag gccggaatcc tgtacaaacg agaaactacc cggagtgctt 3060 cattttgtgg ctccccatat tcttgggaac aggagctgca gcatggcagg ctggtgttcc 3120 agaccagcaa acgccacggg gatgagtcct tttgcagcca gtctagtggc atcctgagca 3180 gatcccccgt ggggccttgt attcagtctc agctgcggaa gagtagactg ggactgcagc 3240 cacagcaggg acacctggca cgacggcagc agggaaggtc tggcagtatc cgggctagag 3300 tgcatcccac aactagaagg accttcggcg tcgagccatc aggaagcggc cacatcgaca 3360 acagcgcatc aagctcctct agttgcctgc atcagtcagc cgtgagaaag gccgcttaca 3420 gccacctgtc cacatctaaa aggcactcaa gctccgggca tgctgtggag ctgcacaaca 3480 tccctccaaa ttctgcacgc agtcagtcag aaggacccgt gttcagctgc tggtggctgc 3540 agtttcggaa ctcaaagcct tgcagcgact attgtctgag ccatattgtg aatctgctgg 3600 aggattgggg cccttgtacc gagcacgggg aacaccatat caggattcca cgaacaccag 3660 cacgagtgac tggaggggtg ttcctggtgg acaagaaccc ccacaatact accgagagcc 3720 ggctggtggt cgatttcagt cagttttcaa gaggcaacac aagggtgtca tggcccaaat 3780 tcgccgtccc taatctgcag agtctgacta acctgctgtc tagtaatctg agctggctgt 3840 ccctggacgt gtccgcagcc ttttaccacc tgcctctgca tccagctgca atgccccatc 3900 tgctggtggg gtcaagcgga ctgagtcgct acgtcgcccg actgtcctct aactcacgca 3960 tcattaatca ccagcatggc accatgcaga acctgcacga tagctgttcc cggaatctgt 4020 acgtgtctct gctgctgctg tataagacat tcggcagaaa actgcacctg tacagccatc 4080 ctatcattct ggggtttagg aagatcccaa tgggagtggg actgagcccc ttcctgctgg 4140 cacagtttac ctccgccatt tgctctgtgg tccgccgagc cttcccacac tgtctggctt 4200 tttcctatat gaacaatgtg gtcctgggcg ccaaatccgt gcagcatctg gagtctctgt 4260 tcacagctgt cactaacttt ctgctgagcc tggggatcca cctgaaccca aataagacta 4320 aacgctgggg gtacagcctg aatttcatgg gatatgtgat tggatcctgg gggaccctgc 4380 cacaggagca catcgtgcag aagatcaagg aatgctttcg gaagctgccc gtcaacagac 4440 ctatcgactg gaaagtgtgc cagcggattg tcggactgct gggcttcgcc gctcccttta 4500 cccagtgcgg gtacccagca ctgatgcccc tgtatgcctg tatccagtct aagcaggctt 4560 tcacctttag tcctacatac aaggcattcc tgtgcaaaca gtacctgaac ctgtatccag 4620 tggcaaggca gcgacctgga ctgtgccagg tctttgcaaa tgccactcct accggctggg 4680 ggctggctat cggacatcag cgaatgcggg gcacattcgt ggcccccctg cctattcaca 4740 ctgctcagct gctggcagcc tgctttgcta gatctaggag tggagcaaag ctgatcggca 4800 ccgacaatag tgtggtcctg tcaagaaaat acacatcctt cccatggctg ctgggatgtg 4860 ctgcaaactg gattctgagg ggcaccagct tcgtgtacgt cccctcagcc ctgaatcctg 4920 ctgacgatcc atcccgcggg cgactgggac tgtaccgacc tctgctgaga ctgcccttca 4980 ggcctacaac tggccggaca tctctgtatg ccgattcacc aagcgtgccc tcacacctgc 5040 ctgacagagt ccactttgct tcacccctgc acgtcgcttg gcggcctcca 5090 <210> 33 <211> 5250 <212> DNA <213> Artificial Sequence <220> <223> Core-2A-Pol coding sequence -IRES (EV71)-PreS2.S-2A-preS1 coding sequence <400> 33 atggctcgac ctctgtgtac cctgctactc ctgatggcta ccctggctgg agctctggcc 60 agcgacatcg acccttacaa ggagttcggc gccagcgtgg aactgctgtc ttttctgccc 120 agtgatttct ttccttccat tcgagacctg ctggataccg cctctgctct gtatcgggaa 180 gccctggaga gcccagaaca ctgctcccca caccataccg ctctgcgaca ggcaatcctg 240 tgctgggggg agctgatgaa cctggccaca tgggtgggat cgaatctgga ggaccccgct 300 tcacgggaac tggtggtcag ctacgtgaac gtcaatatgg gcctgaaaat ccgccagctg 360 ctgtggttcc atattagctg cctgactttt ggacgagaga ccgtgctgga atacctggtg 420 tccttcggcg tctggattcg cactccccct gcttatcgac cacccaacgc accaattctg 480 tccaccctgc ccgagaccac agtggtccgt cgccgtggaa gcggagctac taacttcagc 540 ctgctgaagc aggctggaga cgtggaggag aaccctggac ctatggctcg acctctgtgt 600 accctgctac tcctgatggc taccctggct ggagctctgg ccagcatgcc cctgtcttac 660 cagcacttta gaaagcttct gctgctggac gatgaagccg ggcctctgga ggaagagctg 720 ccaaggctgg cagacgaggg gctgaaccgg agagtggccg aagatctgaa tctgggaaac 780 ctgaacgtga gcatcccttg gactcataaa gtcggcaact tcaccgggct gtacagctcc 840 acagtgcctg tcttcaatcc agagtggcag acaccatcct ttcccaacat tcacctgcag 900 gaggacatca ttaatagatg cgaacagttc gtgggacctc tgacagtcaa cgaaaagagg 960 cgcctgaaac tgatcatgcc tgccaggttt tacccaaatg tgactaagta tctgccactg 1020 gataagggca tcaagcctta ctatccagag cacctggtga accattactt ccagactaga 1080 cactatctgc ataccctgtg gaaggccgga atcctgtaca aacgagaaac tacccggagt 1140 gcttcatttt gtggctcccc atattcttgg gaacaggagc tgcagcatgg caggctggtg 1200 ttccagacca gcaaacgcca cggggatgag tccttttgca gccagtctag tggcatcctg 1260 agcagatccc ccgtggggcc ttgtattcag tctcagctgc ggaagagtag actgggactg 1320 cagccacagc agggacacct ggcacgacgg cagcagggaa ggtctggcag tatccgggct 1380 agagtgcatc ccacaactag aaggaccttc ggcgtcgagc catcaggaag cggccacatc 1440 gacaacagcg catcaagctc ctctagttgc ctgcatcagt cagccgtgag aaaggccgct 1500 tacagccacc tgtccacatc taaaaggcac tcaagctccg ggcatgctgt ggagctgcac 1560 aacatccctc caaattctgc acgcagtcag tcagaaggac ccgtgttcag ctgctggtgg 1620 ctgcagtttc ggaactcaaa gccttgcagc gactattgtc tgagccatat tgtgaatctg 1680 ctggaggatt ggggcccttg taccgagcac ggggaacacc atatcaggat tccacgaaca 1740 ccagcacgag tgactggagg ggtgttcctg gtggacaaga acccccacaa tactaccgag 1800 agccggctgg tggtcgattt cagtcagttt tcaagaggca acacaagggt gtcatggccc 1860 aaattcgccg tccctaatct gcagagtctg actaacctgc tgtctagtaa tctgagctgg 1920 ctgtccctgg acgtgtccgc agccttttac cacctgcctc tgcatccagc tgcaatgccc 1980 catctgctgg tggggtcaag cggactgagt cgctacgtcg cccgactgtc ctctaactca 2040 cgcatcatta atcaccagca tggcaccatg cagaacctgc acgatagctg ttcccggaat 2100 ctgtacgtgt ctctgctgct gctgtataag acattcggca gaaaactgca cctgtacagc 2160 catcctatca ttctggggtt taggaagatc ccaatgggag tgggactgag ccccttcctg 2220 ctggcacagt ttacctccgc catttgctct gtggtccgcc gagccttccc acactgtctg 2280 gctttttcct atatgaacaa tgtggtcctg ggcgccaaat ccgtgcagca tctggagtct 2340 ctgttcacag ctgtcactaa ctttctgctg agcctgggga tccacctgaa cccaaataag 2400 actaaacgct gggggtacag cctgaatttc atgggatatg tgattggatc ctgggggacc 2460 ctgccacagg agcacatcgt gcagaagatc aaggaatgct ttcggaagct gcccgtcaac 2520 agacctatcg actggaaagt gtgccagcgg attgtcggac tgctgggctt cgccgctccc 2580 tttacccagt gcgggtaccc agcactgatg cccctgtatg cctgtatcca gtctaagcag 2640 gctttcacct ttagtcctac atacaaggca ttcctgtgca aacagtacct gaacctgtat 2700 ccagtggcaa ggcagcgacc tggactgtgc caggtctttg caaatgccac tcctaccggc 2760 tgggggctgg ctatcggaca tcagcgaatg cggggcacat tcgtggcccc cctgcctatt 2820 cacactgctc agctgctggc agcctgcttt gctagatcta ggagtggagc aaagctgatc 2880 ggcaccgaca atagtgtggt cctgtcaaga aaatacacat ccttcccatg gctgctggga 2940 tgtgctgcaa actggattct gaggggcacc agcttcgtgt acgtcccctc agccctgaat 3000 cctgctgacg atccatcccg cgggcgactg ggactgtacc gacctctgct gagactgccc 3060 ttcaggccta caactggccg gacatctctg tatgccgatt caccaagcgt gccctcacac 3120 ctgcctgaca gagtccactt tgcttcaccc ctgcacgtcg cttggcggcc tccataatta 3180 aaacagctgt gggttgttcc cacccacagg gcccactggg cgctagcact ctgattttac 3240 gaaatccttg tgcgcctgtt ttatatccct tccctaattc gaaacgtaga agcaatgcgc 3300 accactgatc aatagtaggc gtaacgcgcc agttacgtca tgatcaagca tatctgttcc 3360 cccggactga gtatcaatag actgcttacg cggttgaagg agaaaacgtt cgttatccgg 3420 ctaactactt cgagaagccc agtaacacca tggaagctgc agggtgtttc gctcagcact 3480 tcccccgtgt agatcaggtc gatgagccac tgcaatcccc acaggtgact gtggcagtgg 3540 ctgcgttggc ggcctgccta tggggagacc cataggacgc tctaatgtgg acatggtgcg 3600 aagagcctat tgagctagtt agtagtcctc cggcccctga atgcggctaa tcctaactgc 3660 ggagcacatg ccttcaaccc agagggtagt gtgtcgtaac gggcaactct gcagcggaac 3720 cgactacttt gggtgtccgt gtttcttttt tattcttata ttggctgctt atggtgacaa 3780 ttacagaatt gttaccatat agctattgga ttggccatcc ggtgtgtaat agagctgtta 3840 tatacctatt tgttggcttt gtaccactaa ctttaaaatc tataactacc ctcaacttta 3900 tattaaccct caatacagtt gaccatgcag tggaactcaa ctactttcca tcagaccctt 3960 caggacccta gagtgcgcgg gctgtacttt cctgctgggg gaagcagtag cgggaccgtt 4020 aatccagtac ctacgaccgc ctctcccata tcttctatct ttagtaggac tggtgaccct 4080 gctcccaaca tggagaatat cacctccggg tttctgggcc cactcctggt ccttcaggcc 4140 ggattcttcc tgctgactcg aatcctcacc ataccccaga gcctggacag ctggtggaca 4200 agcctgaatt ttctgggagg aactcctgta tgcctgggac aaaattcaca gtcccctaca 4260 agtaaccatt caccgacaag ttgtcctccc atctgtcccg gatacaggtg gatgtgcctg 4320 cgaaggttca tcatcttcct cttcatcctc ttgctttgcc ttattttcct cctggttctt 4380 ctggactatc agggcatgct gcctgtgtgc ccactgatac caggatctag tactaccagc 4440 acaggcccgt gtaagacctg tacaattcca gcacaaggga ctagtatgtt cccctcctgc 4500 tgttgtacta agccaagcga cggtaattgc acgtgtatcc caatcccgtc ctcctgggcg 4560 tttgccaagt acctctggga atgggcctca gtcagatttt catggcttag tcttttggtg 4620 ccgttcgtgc agtggtttgt gggactctct ccgactgtgt ggctcagcgt gatctggatg 4680 atgtggtact ggggcccttc cctttacaac atactgtctc cattccttcc cctgctgcca 4740 atcttctttt gcctgtgggt ctatattggg tccggagcga ctaacttttc cctgctgaaa 4800 caagcgggtg acgtcgaaga gaatccggga cctatggcta ggcccctgtg tacacttttg 4860 ctcctgatgg ccaccctcgc tggagctctg gcaagcggtg gatggagctc aaagccgcgg 4920 aaagggatgg gtactaacct gtccgtacca aatcccctgg gattttttcc agaccaccaa 4980 ctcgatcctg cttttggcgc aaattccaac aatcccgact gggactttaa ccctaacaag 5040 gaccactggc ctgatgccaa caaggtgggg gcaggagcct ttggtcccgg cttcacccca 5100 ccccatggag gtcttttggg atggtcacca caggcccagg gcatcctgac cactgtccct 5160 gctgctccac cgccagcttc tactaatcga cagagcggga ggcagccgac ccccctgagt 5220 ccccccctgc gggataccca ccctcaggca 5250 <210> 34 <211> 5250 <212> DNA <213> Artificial Sequence <220> <223> PreS2.S-2A-preS1 coding sequence -IRES (EV71)-Core-2A-Pol coding sequence <400> 34 atgcagtgga actcaactac tttccatcag acccttcagg accctagagt gcgcgggctg 60 tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac gaccgcctct 120 cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga gaatatcacc 180 tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct gactcgaatc 240 ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct gggaggaact 300 cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc gacaagttgt 360 cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat cttcctcttc 420 atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg catgctgcct 480 gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa gacctgtaca 540 attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc aagcgacggt 600 aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct ctgggaatgg 660 gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg gtttgtggga 720 ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg cccttccctt 780 tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct gtgggtctat 840 attggaagcg gagctactaa cttcagcctg ctgaagcagg ctggagacgt ggaggagaac 900 cctggaccta tggctaggcc cctgtgtaca cttttgctcc tgatggccac cctcgctgga 960 gctctggcaa gcggtggatg gagctcaaag ccgcggaaag ggatgggtac taacctgtcc 1020 gtaccaaatc ccctgggatt ttttccagac caccaactcg atcctgcttt tggcgcaaat 1080 tccaacaatc ccgactggga ctttaaccct aacaaggacc actggcctga tgccaacaag 1140 gtgggggcag gagcctttgg tcccggcttc accccacccc atggaggtct tttgggatgg 1200 tcaccacagg cccagggcat cctgaccact gtccctgctg ctccaccgcc agcttctact 1260 aatcgacaga gcgggaggca gccgaccccc ctgagtcccc ccctgcggga tacccaccct 1320 caggcataat taaaacagct gtgggttgtt cccacccaca gggcccactg ggcgctagca 1380 ctctgatttt acgaaatcct tgtgcgcctg ttttatatcc cttccctaat tcgaaacgta 1440 gaagcaatgc gcaccactga tcaatagtag gcgtaacgcg ccagttacgt catgatcaag 1500 catatctgtt cccccggact gagtatcaat agactgctta cgcggttgaa ggagaaaacg 1560 ttcgttatcc ggctaactac ttcgagaagc ccagtaacac catggaagct gcagggtgtt 1620 tcgctcagca cttcccccgt gtagatcagg tcgatgagcc actgcaatcc ccacaggtga 1680 ctgtggcagt ggctgcgttg gcggcctgcc tatggggaga cccataggac gctctaatgt 1740 ggacatggtg cgaagagcct attgagctag ttagtagtcc tccggcccct gaatgcggct 1800 aatcctaact gcggagcaca tgccttcaac ccagagggta gtgtgtcgta acgggcaact 1860 ctgcagcgga accgactact ttgggtgtcc gtgtttcttt tttattctta tattggctgc 1920 ttatggtgac aattacagaa ttgttaccat atagctattg gattggccat ccggtgtgta 1980 atagagctgt tatataccta tttgttggct ttgtaccact aactttaaaa tctataacta 2040 ccctcaactt tatattaacc ctcaatacag ttgaccatgg ctcgacctct gtgtaccctg 2100 ctactcctga tggctaccct ggctggagct ctggccagcg acatcgaccc ttacaaggag 2160 ttcggcgcca gcgtggaact gctgtctttt ctgcccagtg atttctttcc ttccattcga 2220 gacctgctgg ataccgcctc tgctctgtat cgggaagccc tggagagccc agaacactgc 2280 tccccacacc ataccgctct gcgacaggca atcctgtgct ggggggagct gatgaacctg 2340 gccacatggg tgggatcgaa tctggaggac cccgcttcac gggaactggt ggtcagctac 2400 gtgaacgtca atatgggcct gaaaatccgc cagctgctgt ggttccatat tagctgcctg 2460 acttttggac gagagaccgt gctggaatac ctggtgtcct tcggcgtctg gattcgcact 2520 ccccctgctt atcgaccacc caacgcacca attctgtcca ccctgcccga gaccacagtg 2580 gtccgtcgcc gtgggtccgg agcgactaac ttttccctgc tgaaacaagc gggtgacgtc 2640 gaagagaatc cgggacctat ggctcgacct ctgtgtaccc tgctactcct gatggctacc 2700 ctggctggag ctctggccag catgcccctg tcttaccagc actttagaaa gcttctgctg 2760 ctggacgatg aagccgggcc tctggaggaa gagctgccaa ggctggcaga cgaggggctg 2820 aaccggagag tggccgaaga tctgaatctg ggaaacctga acgtgagcat cccttggact 2880 cataaagtcg gcaacttcac cgggctgtac agctccacag tgcctgtctt caatccagag 2940 tggcagacac catcctttcc caacattcac ctgcaggagg acatcattaa tagatgcgaa 3000 cagttcgtgg gacctctgac agtcaacgaa aagaggcgcc tgaaactgat catgcctgcc 3060 aggttttacc caaatgtgac taagtatctg ccactggata agggcatcaa gccttactat 3120 ccagagcacc tggtgaacca ttacttccag actagacact atctgcatac cctgtggaag 3180 gccggaatcc tgtacaaacg agaaactacc cggagtgctt cattttgtgg ctccccatat 3240 tcttgggaac aggagctgca gcatggcagg ctggtgttcc agaccagcaa acgccacggg 3300 gatgagtcct tttgcagcca gtctagtggc atcctgagca gatcccccgt ggggccttgt 3360 attcagtctc agctgcggaa gagtagactg ggactgcagc cacagcaggg acacctggca 3420 cgacggcagc agggaaggtc tggcagtatc cgggctagag tgcatcccac aactagaagg 3480 accttcggcg tcgagccatc aggaagcggc cacatcgaca acagcgcatc aagctcctct 3540 agttgcctgc atcagtcagc cgtgagaaag gccgcttaca gccacctgtc cacatctaaa 3600 aggcactcaa gctccgggca tgctgtggag ctgcacaaca tccctccaaa ttctgcacgc 3660 agtcagtcag aaggacccgt gttcagctgc tggtggctgc agtttcggaa ctcaaagcct 3720 tgcagcgact attgtctgag ccatattgtg aatctgctgg aggattgggg cccttgtacc 3780 gagcacgggg aacaccatat caggattcca cgaacaccag cacgagtgac tggaggggtg 3840 ttcctggtgg acaagaaccc ccacaatact accgagagcc ggctggtggt cgatttcagt 3900 cagttttcaa gaggcaacac aagggtgtca tggcccaaat tcgccgtccc taatctgcag 3960 agtctgacta acctgctgtc tagtaatctg agctggctgt ccctggacgt gtccgcagcc 4020 ttttaccacc tgcctctgca tccagctgca atgccccatc tgctggtggg gtcaagcgga 4080 ctgagtcgct acgtcgcccg actgtcctct aactcacgca tcattaatca ccagcatggc 4140 accatgcaga acctgcacga tagctgttcc cggaatctgt acgtgtctct gctgctgctg 4200 tataagacat tcggcagaaa actgcacctg tacagccatc ctatcattct ggggtttagg 4260 aagatcccaa tgggagtggg actgagcccc ttcctgctgg cacagtttac ctccgccatt 4320 tgctctgtgg tccgccgagc cttcccacac tgtctggctt tttcctatat gaacaatgtg 4380 gtcctgggcg ccaaatccgt gcagcatctg gagtctctgt tcacagctgt cactaacttt 4440 ctgctgagcc tggggatcca cctgaaccca aataagacta aacgctgggg gtacagcctg 4500 aatttcatgg gatatgtgat tggatcctgg gggaccctgc cacaggagca catcgtgcag 4560 aagatcaagg aatgctttcg gaagctgccc gtcaacagac ctatcgactg gaaagtgtgc 4620 cagcggattg tcggactgct gggcttcgcc gctcccttta cccagtgcgg gtacccagca 4680 ctgatgcccc tgtatgcctg tatccagtct aagcaggctt tcacctttag tcctacatac 4740 aaggcattcc tgtgcaaaca gtacctgaac ctgtatccag tggcaaggca gcgacctgga 4800 ctgtgccagg tctttgcaaa tgccactcct accggctggg ggctggctat cggacatcag 4860 cgaatgcggg gcacattcgt ggcccccctg cctattcaca ctgctcagct gctggcagcc 4920 tgctttgcta gatctaggag tggagcaaag ctgatcggca ccgacaatag tgtggtcctg 4980 tcaagaaaat acacatcctt cccatggctg ctgggatgtg ctgcaaactg gattctgagg 5040 ggcaccagct tcgtgtacgt cccctcagcc ctgaatcctg ctgacgatcc atcccgcggg 5100 cgactgggac tgtaccgacc tctgctgaga ctgcccttca ggcctacaac tggccggaca 5160 tctctgtatg ccgattcacc aagcgtgccc tcacacctgc ctgacagagt ccactttgct 5220 tcacccctgc acgtcgcttg gcggcctcca 5250 <210> 35 <211> 5090 <212> DNA <213> Artificial Sequence <220> <223> Pol-2A-Core coding sequence -IRES (EMCV)-PreS2.S-2A-preS1 coding sequence <400> 35 atggctcgac ctctgtgtac cctgctactc ctgatggcta ccctggctgg agctctggcc 60 agcatgcccc tgtcttacca gcactttaga aagcttctgc tgctggacga tgaagccggg 120 cctctggagg aagagctgcc aaggctggca gacgaggggc tgaaccggag agtggccgaa 180 gatctgaatc tgggaaacct gaacgtgagc atcccttgga ctcataaagt cggcaacttc 240 accgggctgt acagctccac agtgcctgtc ttcaatccag agtggcagac accatccttt 300 cccaacattc acctgcagga ggacatcatt aatagatgcg aacagttcgt gggacctctg 360 acagtcaacg aaaagaggcg cctgaaactg atcatgcctg ccaggtttta cccaaatgtg 420 actaagtatc tgccactgga taagggcatc aagccttact atccagagca cctggtgaac 480 cattacttcc agactagaca ctatctgcat accctgtgga aggccggaat cctgtacaaa 540 cgagaaacta cccggagtgc ttcattttgt ggctccccat attcttggga acaggagctg 600 cagcatggca ggctggtgtt ccagaccagc aaacgccacg gggatgagtc cttttgcagc 660 cagtctagtg gcatcctgag cagatccccc gtggggcctt gtattcagtc tcagctgcgg 720 aagagtagac tgggactgca gccacagcag ggacacctgg cacgacggca gcagggaagg 780 tctggcagta tccgggctag agtgcatccc acaactagaa ggaccttcgg cgtcgagcca 840 tcaggaagcg gccacatcga caacagcgca tcaagctcct ctagttgcct gcatcagtca 900 gccgtgagaa aggccgctta cagccacctg tccacatcta aaaggcactc aagctccggg 960 catgctgtgg agctgcacaa catccctcca aattctgcac gcagtcagtc agaaggaccc 1020 gtgttcagct gctggtggct gcagtttcgg aactcaaagc cttgcagcga ctattgtctg 1080 agccatattg tgaatctgct ggaggattgg ggcccttgta ccgagcacgg ggaacaccat 1140 atcaggattc cacgaacacc agcacgagtg actggagggg tgttcctggt ggacaagaac 1200 ccccacaata ctaccgagag ccggctggtg gtcgatttca gtcagttttc aagaggcaac 1260 acaagggtgt catggcccaa attcgccgtc cctaatctgc agagtctgac taacctgctg 1320 tctagtaatc tgagctggct gtccctggac gtgtccgcag ccttttacca cctgcctctg 1380 catccagctg caatgcccca tctgctggtg gggtcaagcg gactgagtcg ctacgtcgcc 1440 cgactgtcct ctaactcacg catcattaat caccagcatg gcaccatgca gaacctgcac 1500 gatagctgtt cccggaatct gtacgtgtct ctgctgctgc tgtataagac attcggcaga 1560 aaactgcacc tgtacagcca tcctatcatt ctggggttta ggaagatccc aatgggagtg 1620 ggactgagcc ccttcctgct ggcacagttt acctccgcca tttgctctgt ggtccgccga 1680 gccttcccac actgtctggc tttttcctat atgaacaatg tggtcctggg cgccaaatcc 1740 gtgcagcatc tggagtctct gttcacagct gtcactaact ttctgctgag cctggggatc 1800 cacctgaacc caaataagac taaacgctgg gggtacagcc tgaatttcat gggatatgtg 1860 attggatcct gggggaccct gccacaggag cacatcgtgc agaagatcaa ggaatgcttt 1920 cggaagctgc ccgtcaacag acctatcgac tggaaagtgt gccagcggat tgtcggactg 1980 ctgggcttcg ccgctccctt tacccagtgc gggtacccag cactgatgcc cctgtatgcc 2040 tgtatccagt ctaagcaggc tttcaccttt agtcctacat acaaggcatt cctgtgcaaa 2100 cagtacctga acctgtatcc agtggcaagg cagcgacctg gactgtgcca ggtctttgca 2160 aatgccactc ctaccggctg ggggctggct atcggacatc agcgaatgcg gggcacattc 2220 gtggcccccc tgcctattca cactgctcag ctgctggcag cctgctttgc tagatctagg 2280 agtggagcaa agctgatcgg caccgacaat agtgtggtcc tgtcaagaaa atacacatcc 2340 ttcccatggc tgctgggatg tgctgcaaac tggattctga ggggcaccag cttcgtgtac 2400 gtcccctcag ccctgaatcc tgctgacgat ccatcccgcg ggcgactggg actgtaccga 2460 cctctgctga gactgccctt caggcctaca actggccgga catctctgta tgccgattca 2520 ccaagcgtgc cctcacacct gcctgacaga gtccactttg cttcacccct gcacgtcgct 2580 tggcggcctc caggaagcgg agctactaac ttcagcctgc tgaagcaggc tggagacgtg 2640 gaggagaacc ctggacctat ggctcgacct ctgtgtaccc tgctactcct gatggctacc 2700 ctggctggag ctctggccag cgacatcgac ccttacaagg agttcggcgc cagcgtggaa 2760 ctgctgtctt ttctgcccag tgatttcttt ccttccattc gagacctgct ggataccgcc 2820 tctgctctgt atcgggaagc cctggagagc ccagaacact gctccccaca ccataccgct 2880 ctgcgacagg caatcctgtg ctggggggag ctgatgaacc tggccacatg ggtgggatcg 2940 aatctggagg accccgcttc acgggaactg gtggtcagct acgtgaacgt caatatgggc 3000 ctgaaaatcc gccagctgct gtggttccat attagctgcc tgacttttgg acgagagacc 3060 gtgctggaat acctggtgtc cttcggcgtc tggattcgca ctccccctgc ttatcgacca 3120 cccaacgcac caattctgtc caccctgccc gagaccacag tggtccgtcg ccgttaagcc 3180 cctctccctc ccccccccct aacgttactg gccgaagccg cttggaataa ggccggtgtg 3240 cgtttgtcta tatgttattt tccaccatat tgccgtcttt tggcaatgtg agggcccgga 3300 aacctggccc tgtcttcttg acgagcattc ctaggggtct ttcccctctc gccaaaggaa 3360 tgcaaggtct gttgaatgtc gtgaaggaag cagttcctct ggaagcttct tgaagacaaa 3420 caacgtctgt agcgaccctt tgcaggcagc ggaacccccc acctggcgac aggtgcctct 3480 gcggccaaaa gccacgtgta taagatacac ctgcaaaggc ggcacaaccc cagtgccacg 3540 ttgtgagttg gatagttgtg gaaagagtca aatggctctc ctcaagcgta ttcaacaagg 3600 ggctgaagga tgcccagaag gtaccccatt gtatgggatc tgatctgggg cctcggtgca 3660 catgctttac atgtgtttag tcgaggttaa aaaacgtcta ggccccccga accacgggga 3720 cgtggttttc ctttgaaaaa cacgatgata atatggccac aaccatgcag tggaactcaa 3780 ctactttcca tcagaccctt caggacccta gagtgcgcgg gctgtacttt cctgctgggg 3840 gaagcagtag cgggaccgtt aatccagtac ctacgaccgc ctctcccata tcttctatct 3900 ttagtaggac tggtgaccct gctcccaaca tggagaatat cacctccggg tttctgggcc 3960 cactcctggt ccttcaggcc ggattcttcc tgctgactcg aatcctcacc ataccccaga 4020 gcctggacag ctggtggaca agcctgaatt ttctgggagg aactcctgta tgcctgggac 4080 aaaattcaca gtcccctaca agtaaccatt caccgacaag ttgtcctccc atctgtcccg 4140 gatacaggtg gatgtgcctg cgaaggttca tcatcttcct cttcatcctc ttgctttgcc 4200 ttattttcct cctggttctt ctggactatc agggcatgct gcctgtgtgc ccactgatac 4260 caggatctag tactaccagc acaggcccgt gtaagacctg tacaattcca gcacaaggga 4320 ctagtatgtt cccctcctgc tgttgtacta agccaagcga cggtaattgc acgtgtatcc 4380 caatcccgtc ctcctgggcg tttgccaagt acctctggga atgggcctca gtcagatttt 4440 catggcttag tcttttggtg ccgttcgtgc agtggtttgt gggactctct ccgactgtgt 4500 ggctcagcgt gatctggatg atgtggtact ggggcccttc cctttacaac atactgtctc 4560 cattccttcc cctgctgcca atcttctttt gcctgtgggt ctatattggg tccggagcga 4620 ctaacttttc cctgctgaaa caagcgggtg acgtcgaaga gaatccggga cctatggcta 4680 ggcccctgtg tacacttttg ctcctgatgg ccaccctcgc tggagctctg gcaagcggtg 4740 gatggagctc aaagccgcgg aaagggatgg gtactaacct gtccgtacca aatcccctgg 4800 gattttttcc agaccaccaa ctcgatcctg cttttggcgc aaattccaac aatcccgact 4860 gggactttaa ccctaacaag gaccactggc ctgatgccaa caaggtgggg gcaggagcct 4920 ttggtcccgg cttcacccca ccccatggag gtcttttggg atggtcacca caggcccagg 4980 gcatcctgac cactgtccct gctgctccac cgccagcttc tactaatcga cagagcggga 5040 ggcagccgac ccccctgagt ccccccctgc gggataccca ccctcaggca 5090 <210> 36 <211> 5250 <212> DNA <213> Artificial Sequence <220> <223> Pol-2A-Core coding sequence -IRES (EV71)-PreS2.S-2A-preS1 coding sequence <400> 36 atggctcgac ctctgtgtac cctgctactc ctgatggcta ccctggctgg agctctggcc 60 agcatgcccc tgtcttacca gcactttaga aagcttctgc tgctggacga tgaagccggg 120 cctctggagg aagagctgcc aaggctggca gacgaggggc tgaaccggag agtggccgaa 180 gatctgaatc tgggaaacct gaacgtgagc atcccttgga ctcataaagt cggcaacttc 240 accgggctgt acagctccac agtgcctgtc ttcaatccag agtggcagac accatccttt 300 cccaacattc acctgcagga ggacatcatt aatagatgcg aacagttcgt gggacctctg 360 acagtcaacg aaaagaggcg cctgaaactg atcatgcctg ccaggtttta cccaaatgtg 420 actaagtatc tgccactgga taagggcatc aagccttact atccagagca cctggtgaac 480 cattacttcc agactagaca ctatctgcat accctgtgga aggccggaat cctgtacaaa 540 cgagaaacta cccggagtgc ttcattttgt ggctccccat attcttggga acaggagctg 600 cagcatggca ggctggtgtt ccagaccagc aaacgccacg gggatgagtc cttttgcagc 660 cagtctagtg gcatcctgag cagatccccc gtggggcctt gtattcagtc tcagctgcgg 720 aagagtagac tgggactgca gccacagcag ggacacctgg cacgacggca gcagggaagg 780 tctggcagta tccgggctag agtgcatccc acaactagaa ggaccttcgg cgtcgagcca 840 tcaggaagcg gccacatcga caacagcgca tcaagctcct ctagttgcct gcatcagtca 900 gccgtgagaa aggccgctta cagccacctg tccacatcta aaaggcactc aagctccggg 960 catgctgtgg agctgcacaa catccctcca aattctgcac gcagtcagtc agaaggaccc 1020 gtgttcagct gctggtggct gcagtttcgg aactcaaagc cttgcagcga ctattgtctg 1080 agccatattg tgaatctgct ggaggattgg ggcccttgta ccgagcacgg ggaacaccat 1140 atcaggattc cacgaacacc agcacgagtg actggagggg tgttcctggt ggacaagaac 1200 ccccacaata ctaccgagag ccggctggtg gtcgatttca gtcagttttc aagaggcaac 1260 acaagggtgt catggcccaa attcgccgtc cctaatctgc agagtctgac taacctgctg 1320 tctagtaatc tgagctggct gtccctggac gtgtccgcag ccttttacca cctgcctctg 1380 catccagctg caatgcccca tctgctggtg gggtcaagcg gactgagtcg ctacgtcgcc 1440 cgactgtcct ctaactcacg catcattaat caccagcatg gcaccatgca gaacctgcac 1500 gatagctgtt cccggaatct gtacgtgtct ctgctgctgc tgtataagac attcggcaga 1560 aaactgcacc tgtacagcca tcctatcatt ctggggttta ggaagatccc aatgggagtg 1620 ggactgagcc ccttcctgct ggcacagttt acctccgcca tttgctctgt ggtccgccga 1680 gccttcccac actgtctggc tttttcctat atgaacaatg tggtcctggg cgccaaatcc 1740 gtgcagcatc tggagtctct gttcacagct gtcactaact ttctgctgag cctggggatc 1800 cacctgaacc caaataagac taaacgctgg gggtacagcc tgaatttcat gggatatgtg 1860 attggatcct gggggaccct gccacaggag cacatcgtgc agaagatcaa ggaatgcttt 1920 cggaagctgc ccgtcaacag acctatcgac tggaaagtgt gccagcggat tgtcggactg 1980 ctgggcttcg ccgctccctt tacccagtgc gggtacccag cactgatgcc cctgtatgcc 2040 tgtatccagt ctaagcaggc tttcaccttt agtcctacat acaaggcatt cctgtgcaaa 2100 cagtacctga acctgtatcc agtggcaagg cagcgacctg gactgtgcca ggtctttgca 2160 aatgccactc ctaccggctg ggggctggct atcggacatc agcgaatgcg gggcacattc 2220 gtggcccccc tgcctattca cactgctcag ctgctggcag cctgctttgc tagatctagg 2280 agtggagcaa agctgatcgg caccgacaat agtgtggtcc tgtcaagaaa atacacatcc 2340 ttcccatggc tgctgggatg tgctgcaaac tggattctga ggggcaccag cttcgtgtac 2400 gtcccctcag ccctgaatcc tgctgacgat ccatcccgcg ggcgactggg actgtaccga 2460 cctctgctga gactgccctt caggcctaca actggccgga catctctgta tgccgattca 2520 ccaagcgtgc cctcacacct gcctgacaga gtccactttg cttcacccct gcacgtcgct 2580 tggcggcctc caggaagcgg agctactaac ttcagcctgc tgaagcaggc tggagacgtg 2640 gaggagaacc ctggacctat ggctcgacct ctgtgtaccc tgctactcct gatggctacc 2700 ctggctggag ctctggccag cgacatcgac ccttacaagg agttcggcgc cagcgtggaa 2760 ctgctgtctt ttctgcccag tgatttcttt ccttccattc gagacctgct ggataccgcc 2820 tctgctctgt atcgggaagc cctggagagc ccagaacact gctccccaca ccataccgct 2880 ctgcgacagg caatcctgtg ctggggggag ctgatgaacc tggccacatg ggtgggatcg 2940 aatctggagg accccgcttc acgggaactg gtggtcagct acgtgaacgt caatatgggc 3000 ctgaaaatcc gccagctgct gtggttccat attagctgcc tgacttttgg acgagagacc 3060 gtgctggaat acctggtgtc cttcggcgtc tggattcgca ctccccctgc ttatcgacca 3120 cccaacgcac caattctgtc caccctgccc gagaccacag tggtccgtcg ccgttaatta 3180 aaacagctgt gggttgttcc cacccacagg gcccactggg cgctagcact ctgattttac 3240 gaaatccttg tgcgcctgtt ttatatccct tccctaattc gaaacgtaga agcaatgcgc 3300 accactgatc aatagtaggc gtaacgcgcc agttacgtca tgatcaagca tatctgttcc 3360 cccggactga gtatcaatag actgcttacg cggttgaagg agaaaacgtt cgttatccgg 3420 ctaactactt cgagaagccc agtaacacca tggaagctgc agggtgtttc gctcagcact 3480 tcccccgtgt agatcaggtc gatgagccac tgcaatcccc acaggtgact gtggcagtgg 3540 ctgcgttggc ggcctgccta tggggagacc cataggacgc tctaatgtgg acatggtgcg 3600 aagagcctat tgagctagtt agtagtcctc cggcccctga atgcggctaa tcctaactgc 3660 ggagcacatg ccttcaaccc agagggtagt gtgtcgtaac gggcaactct gcagcggaac 3720 cgactacttt gggtgtccgt gtttcttttt tattcttata ttggctgctt atggtgacaa 3780 ttacagaatt gttaccatat agctattgga ttggccatcc ggtgtgtaat agagctgtta 3840 tatacctatt tgttggcttt gtaccactaa ctttaaaatc tataactacc ctcaacttta 3900 tattaaccct caatacagtt gaccatgcag tggaactcaa ctactttcca tcagaccctt 3960 caggacccta gagtgcgcgg gctgtacttt cctgctgggg gaagcagtag cgggaccgtt 4020 aatccagtac ctacgaccgc ctctcccata tcttctatct ttagtaggac tggtgaccct 4080 gctcccaaca tggagaatat cacctccggg tttctgggcc cactcctggt ccttcaggcc 4140 ggattcttcc tgctgactcg aatcctcacc ataccccaga gcctggacag ctggtggaca 4200 agcctgaatt ttctgggagg aactcctgta tgcctgggac aaaattcaca gtcccctaca 4260 agtaaccatt caccgacaag ttgtcctccc atctgtcccg gatacaggtg gatgtgcctg 4320 cgaaggttca tcatcttcct cttcatcctc ttgctttgcc ttattttcct cctggttctt 4380 ctggactatc agggcatgct gcctgtgtgc ccactgatac caggatctag tactaccagc 4440 acaggcccgt gtaagacctg tacaattcca gcacaaggga ctagtatgtt cccctcctgc 4500 tgttgtacta agccaagcga cggtaattgc acgtgtatcc caatcccgtc ctcctgggcg 4560 tttgccaagt acctctggga atgggcctca gtcagatttt catggcttag tcttttggtg 4620 ccgttcgtgc agtggtttgt gggactctct ccgactgtgt ggctcagcgt gatctggatg 4680 atgtggtact ggggcccttc cctttacaac atactgtctc cattccttcc cctgctgcca 4740 atcttctttt gcctgtgggt ctatattggg tccggagcga ctaacttttc cctgctgaaa 4800 caagcgggtg acgtcgaaga gaatccggga cctatggcta ggcccctgtg tacacttttg 4860 ctcctgatgg ccaccctcgc tggagctctg gcaagcggtg gatggagctc aaagccgcgg 4920 aaagggatgg gtactaacct gtccgtacca aatcccctgg gattttttcc agaccaccaa 4980 ctcgatcctg cttttggcgc aaattccaac aatcccgact gggactttaa ccctaacaag 5040 gaccactggc ctgatgccaa caaggtgggg gcaggagcct ttggtcccgg cttcacccca 5100 ccccatggag gtcttttggg atggtcacca caggcccagg gcatcctgac cactgtccct 5160 gctgctccac cgccagcttc tactaatcga cagagcggga ggcagccgac ccccctgagt 5220 ccccccctgc gggataccca ccctcaggca 5250 <210> 37 <211> 5090 <212> DNA <213> Artificial Sequence <220> <223> PreS2.S-2A-preS1 coding sequence -IRES (EMCV)-Pol-2A-Core coding sequence <400> 37 atgcagtgga actcaactac tttccatcag acccttcagg accctagagt gcgcgggctg 60 tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac gaccgcctct 120 cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga gaatatcacc 180 tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct gactcgaatc 240 ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct gggaggaact 300 cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc gacaagttgt 360 cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat cttcctcttc 420 atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg catgctgcct 480 gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa gacctgtaca 540 attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc aagcgacggt 600 aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct ctgggaatgg 660 gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg gtttgtggga 720 ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg cccttccctt 780 tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct gtgggtctat 840 attggaagcg gagctactaa cttcagcctg ctgaagcagg ctggagacgt ggaggagaac 900 cctggaccta tggctaggcc cctgtgtaca cttttgctcc tgatggccac cctcgctgga 960 gctctggcaa gcggtggatg gagctcaaag ccgcggaaag ggatgggtac taacctgtcc 1020 gtaccaaatc ccctgggatt ttttccagac caccaactcg atcctgcttt tggcgcaaat 1080 tccaacaatc ccgactggga ctttaaccct aacaaggacc actggcctga tgccaacaag 1140 gtgggggcag gagcctttgg tcccggcttc accccacccc atggaggtct tttgggatgg 1200 tcaccacagg cccagggcat cctgaccact gtccctgctg ctccaccgcc agcttctact 1260 aatcgacaga gcgggaggca gccgaccccc ctgagtcccc ccctgcggga tacccaccct 1320 caggcataag cccctctccc tccccccccc ctaacgttac tggccgaagc cgcttggaat 1380 aaggccggtg tgcgtttgtc tatatgttat tttccaccat attgccgtct tttggcaatg 1440 tgagggcccg gaaacctggc cctgtcttct tgacgagcat tcctaggggt ctttcccctc 1500 tcgccaaagg aatgcaaggt ctgttgaatg tcgtgaagga agcagttcct ctggaagctt 1560 cttgaagaca aacaacgtct gtagcgaccc tttgcaggca gcggaacccc ccacctggcg 1620 acaggtgcct ctgcggccaa aagccacgtg tataagatac acctgcaaag gcggcacaac 1680 cccagtgcca cgttgtgagt tggatagttg tggaaagagt caaatggctc tcctcaagcg 1740 tattcaacaa ggggctgaag gatgcccaga aggtacccca ttgtatggga tctgatctgg 1800 ggcctcggtg cacatgcttt acatgtgttt agtcgaggtt aaaaaacgtc taggcccccc 1860 gaaccacggg gacgtggttt tcctttgaaa aacacgatga taatatggcc acaaccatgg 1920 ctcgacctct gtgtaccctg ctactcctga tggctaccct ggctggagct ctggccagca 1980 tgcccctgtc ttaccagcac tttagaaagc ttctgctgct ggacgatgaa gccgggcctc 2040 tggaggaaga gctgccaagg ctggcagacg aggggctgaa ccggagagtg gccgaagatc 2100 tgaatctggg aaacctgaac gtgagcatcc cttggactca taaagtcggc aacttcaccg 2160 ggctgtacag ctccacagtg cctgtcttca atccagagtg gcagacacca tcctttccca 2220 acattcacct gcaggaggac atcattaata gatgcgaaca gttcgtggga cctctgacag 2280 tcaacgaaaa gaggcgcctg aaactgatca tgcctgccag gttttaccca aatgtgacta 2340 agtatctgcc actggataag ggcatcaagc cttactatcc agagcacctg gtgaaccatt 2400 acttccagac tagacactat ctgcataccc tgtggaaggc cggaatcctg tacaaacgag 2460 aaactacccg gagtgcttca ttttgtggct ccccatattc ttgggaacag gagctgcagc 2520 atggcaggct ggtgttccag accagcaaac gccacgggga tgagtccttt tgcagccagt 2580 ctagtggcat cctgagcaga tcccccgtgg ggccttgtat tcagtctcag ctgcggaaga 2640 gtagactggg actgcagcca cagcagggac acctggcacg acggcagcag ggaaggtctg 2700 gcagtatccg ggctagagtg catcccacaa ctagaaggac cttcggcgtc gagccatcag 2760 gaagcggcca catcgacaac agcgcatcaa gctcctctag ttgcctgcat cagtcagccg 2820 tgagaaaggc cgcttacagc cacctgtcca catctaaaag gcactcaagc tccgggcatg 2880 ctgtggagct gcacaacatc cctccaaatt ctgcacgcag tcagtcagaa ggacccgtgt 2940 tcagctgctg gtggctgcag tttcggaact caaagccttg cagcgactat tgtctgagcc 3000 atattgtgaa tctgctggag gattggggcc cttgtaccga gcacggggaa caccatatca 3060 ggattccacg aacaccagca cgagtgactg gaggggtgtt cctggtggac aagaaccccc 3120 acaatactac cgagagccgg ctggtggtcg atttcagtca gttttcaaga ggcaacacaa 3180 gggtgtcatg gcccaaattc gccgtcccta atctgcagag tctgactaac ctgctgtcta 3240 gtaatctgag ctggctgtcc ctggacgtgt ccgcagcctt ttaccacctg cctctgcatc 3300 cagctgcaat gccccatctg ctggtggggt caagcggact gagtcgctac gtcgcccgac 3360 tgtcctctaa ctcacgcatc attaatcacc agcatggcac catgcagaac ctgcacgata 3420 gctgttcccg gaatctgtac gtgtctctgc tgctgctgta taagacattc ggcagaaaac 3480 tgcacctgta cagccatcct atcattctgg ggtttaggaa gatcccaatg ggagtgggac 3540 tgagcccctt cctgctggca cagtttacct ccgccatttg ctctgtggtc cgccgagcct 3600 tcccacactg tctggctttt tcctatatga acaatgtggt cctgggcgcc aaatccgtgc 3660 agcatctgga gtctctgttc acagctgtca ctaactttct gctgagcctg gggatccacc 3720 tgaacccaaa taagactaaa cgctgggggt acagcctgaa tttcatggga tatgtgattg 3780 gatcctgggg gaccctgcca caggagcaca tcgtgcagaa gatcaaggaa tgctttcgga 3840 agctgcccgt caacagacct atcgactgga aagtgtgcca gcggattgtc ggactgctgg 3900 gcttcgccgc tccctttacc cagtgcgggt acccagcact gatgcccctg tatgcctgta 3960 tccagtctaa gcaggctttc acctttagtc ctacatacaa ggcattcctg tgcaaacagt 4020 acctgaacct gtatccagtg gcaaggcagc gacctggact gtgccaggtc tttgcaaatg 4080 ccactcctac cggctggggg ctggctatcg gacatcagcg aatgcggggc acattcgtgg 4140 cccccctgcc tattcacact gctcagctgc tggcagcctg ctttgctaga tctaggagtg 4200 gagcaaagct gatcggcacc gacaatagtg tggtcctgtc aagaaaatac acatccttcc 4260 catggctgct gggatgtgct gcaaactgga ttctgagggg caccagcttc gtgtacgtcc 4320 cctcagccct gaatcctgct gacgatccat cccgcgggcg actgggactg taccgacctc 4380 tgctgagact gcccttcagg cctacaactg gccggacatc tctgtatgcc gattcaccaa 4440 gcgtgccctc acacctgcct gacagagtcc actttgcttc acccctgcac gtcgcttggc 4500 ggcctccagg gtccggagcg actaactttt ccctgctgaa acaagcgggt gacgtcgaag 4560 agaatccggg acctatggct cgacctctgt gtaccctgct actcctgatg gctaccctgg 4620 ctggagctct ggccagcgac atcgaccctt acaaggagtt cggcgccagc gtggaactgc 4680 tgtcttttct gcccagtgat ttctttcctt ccattcgaga cctgctggat accgcctctg 4740 ctctgtatcg ggaagccctg gagagcccag aacactgctc cccacaccat accgctctgc 4800 gacaggcaat cctgtgctgg ggggagctga tgaacctggc cacatgggtg ggatcgaatc 4860 tggaggaccc cgcttcacgg gaactggtgg tcagctacgt gaacgtcaat atgggcctga 4920 aaatccgcca gctgctgtgg ttccatatta gctgcctgac ttttggacga gagaccgtgc 4980 tggaatacct ggtgtccttc ggcgtctgga ttcgcactcc ccctgcttat cgaccaccca 5040 acgcaccaat tctgtccacc ctgcccgaga ccacagtggt ccgtcgccgt 5090 <210> 38 <211> 5250 <212> DNA <213> Artificial Sequence <220> <223> PreS2.S-2A-preS1 coding sequence -IRES (EV71)-Pol-2A-Core coding sequence <400> 38 atgcagtgga actcaactac tttccatcag acccttcagg accctagagt gcgcgggctg 60 tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac gaccgcctct 120 cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga gaatatcacc 180 tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct gactcgaatc 240 ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct gggaggaact 300 cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc gacaagttgt 360 cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat cttcctcttc 420 atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg catgctgcct 480 gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa gacctgtaca 540 attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc aagcgacggt 600 aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct ctgggaatgg 660 gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg gtttgtggga 720 ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg cccttccctt 780 tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct gtgggtctat 840 attggaagcg gagctactaa cttcagcctg ctgaagcagg ctggagacgt ggaggagaac 900 cctggaccta tggctaggcc cctgtgtaca cttttgctcc tgatggccac cctcgctgga 960 gctctggcaa gcggtggatg gagctcaaag ccgcggaaag ggatgggtac taacctgtcc 1020 gtaccaaatc ccctgggatt ttttccagac caccaactcg atcctgcttt tggcgcaaat 1080 tccaacaatc ccgactggga ctttaaccct aacaaggacc actggcctga tgccaacaag 1140 gtgggggcag gagcctttgg tcccggcttc accccacccc atggaggtct tttgggatgg 1200 tcaccacagg cccagggcat cctgaccact gtccctgctg ctccaccgcc agcttctact 1260 aatcgacaga gcgggaggca gccgaccccc ctgagtcccc ccctgcggga tacccaccct 1320 caggcataat taaaacagct gtgggttgtt cccacccaca gggcccactg ggcgctagca 1380 ctctgatttt acgaaatcct tgtgcgcctg ttttatatcc cttccctaat tcgaaacgta 1440 gaagcaatgc gcaccactga tcaatagtag gcgtaacgcg ccagttacgt catgatcaag 1500 catatctgtt cccccggact gagtatcaat agactgctta cgcggttgaa ggagaaaacg 1560 ttcgttatcc ggctaactac ttcgagaagc ccagtaacac catggaagct gcagggtgtt 1620 tcgctcagca cttcccccgt gtagatcagg tcgatgagcc actgcaatcc ccacaggtga 1680 ctgtggcagt ggctgcgttg gcggcctgcc tatggggaga cccataggac gctctaatgt 1740 ggacatggtg cgaagagcct attgagctag ttagtagtcc tccggcccct gaatgcggct 1800 aatcctaact gcggagcaca tgccttcaac ccagagggta gtgtgtcgta acgggcaact 1860 ctgcagcgga accgactact ttgggtgtcc gtgtttcttt tttattctta tattggctgc 1920 ttatggtgac aattacagaa ttgttaccat atagctattg gattggccat ccggtgtgta 1980 atagagctgt tatataccta tttgttggct ttgtaccact aactttaaaa tctataacta 2040 ccctcaactt tatattaacc ctcaatacag ttgaccatgg ctcgacctct gtgtaccctg 2100 ctactcctga tggctaccct ggctggagct ctggccagca tgcccctgtc ttaccagcac 2160 tttagaaagc ttctgctgct ggacgatgaa gccgggcctc tggaggaaga gctgccaagg 2220 ctggcagacg aggggctgaa ccggagagtg gccgaagatc tgaatctggg aaacctgaac 2280 gtgagcatcc cttggactca taaagtcggc aacttcaccg ggctgtacag ctccacagtg 2340 cctgtcttca atccagagtg gcagacacca tcctttccca acattcacct gcaggaggac 2400 atcattaata gatgcgaaca gttcgtggga cctctgacag tcaacgaaaa gaggcgcctg 2460 aaactgatca tgcctgccag gttttaccca aatgtgacta agtatctgcc actggataag 2520 ggcatcaagc cttactatcc agagcacctg gtgaaccatt acttccagac tagacactat 2580 ctgcataccc tgtggaaggc cggaatcctg tacaaacgag aaactacccg gagtgcttca 2640 ttttgtggct ccccatattc ttgggaacag gagctgcagc atggcaggct ggtgttccag 2700 accagcaaac gccacgggga tgagtccttt tgcagccagt ctagtggcat cctgagcaga 2760 tcccccgtgg ggccttgtat tcagtctcag ctgcggaaga gtagactggg actgcagcca 2820 cagcagggac acctggcacg acggcagcag ggaaggtctg gcagtatccg ggctagagtg 2880 catcccacaa ctagaaggac cttcggcgtc gagccatcag gaagcggcca catcgacaac 2940 agcgcatcaa gctcctctag ttgcctgcat cagtcagccg tgagaaaggc cgcttacagc 3000 cacctgtcca catctaaaag gcactcaagc tccgggcatg ctgtggagct gcacaacatc 3060 cctccaaatt ctgcacgcag tcagtcagaa ggacccgtgt tcagctgctg gtggctgcag 3120 tttcggaact caaagccttg cagcgactat tgtctgagcc atattgtgaa tctgctggag 3180 gattggggcc cttgtaccga gcacggggaa caccatatca ggattccacg aacaccagca 3240 cgagtgactg gaggggtgtt cctggtggac aagaaccccc acaatactac cgagagccgg 3300 ctggtggtcg atttcagtca gttttcaaga ggcaacacaa gggtgtcatg gcccaaattc 3360 gccgtcccta atctgcagag tctgactaac ctgctgtcta gtaatctgag ctggctgtcc 3420 ctggacgtgt ccgcagcctt ttaccacctg cctctgcatc cagctgcaat gccccatctg 3480 ctggtggggt caagcggact gagtcgctac gtcgcccgac tgtcctctaa ctcacgcatc 3540 attaatcacc agcatggcac catgcagaac ctgcacgata gctgttcccg gaatctgtac 3600 gtgtctctgc tgctgctgta taagacattc ggcagaaaac tgcacctgta cagccatcct 3660 atcattctgg ggtttaggaa gatcccaatg ggagtgggac tgagcccctt cctgctggca 3720 cagtttacct ccgccatttg ctctgtggtc cgccgagcct tcccacactg tctggctttt 3780 tcctatatga acaatgtggt cctgggcgcc aaatccgtgc agcatctgga gtctctgttc 3840 acagctgtca ctaactttct gctgagcctg gggatccacc tgaacccaaa taagactaaa 3900 cgctgggggt acagcctgaa tttcatggga tatgtgattg gatcctgggg gaccctgcca 3960 caggagcaca tcgtgcagaa gatcaaggaa tgctttcgga agctgcccgt caacagacct 4020 atcgactgga aagtgtgcca gcggattgtc ggactgctgg gcttcgccgc tccctttacc 4080 cagtgcgggt acccagcact gatgcccctg tatgcctgta tccagtctaa gcaggctttc 4140 acctttagtc ctacatacaa ggcattcctg tgcaaacagt acctgaacct gtatccagtg 4200 gcaaggcagc gacctggact gtgccaggtc tttgcaaatg ccactcctac cggctggggg 4260 ctggctatcg gacatcagcg aatgcggggc acattcgtgg cccccctgcc tattcacact 4320 gctcagctgc tggcagcctg ctttgctaga tctaggagtg gagcaaagct gatcggcacc 4380 gacaatagtg tggtcctgtc aagaaaatac acatccttcc catggctgct gggatgtgct 4440 gcaaactgga ttctgagggg caccagcttc gtgtacgtcc cctcagccct gaatcctgct 4500 gacgatccat cccgcgggcg actgggactg taccgacctc tgctgagact gcccttcagg 4560 cctacaactg gccggacatc tctgtatgcc gattcaccaa gcgtgccctc acacctgcct 4620 gacagagtcc actttgcttc acccctgcac gtcgcttggc ggcctccagg gtccggagcg 4680 actaactttt ccctgctgaa acaagcgggt gacgtcgaag agaatccggg acctatggct 4740 cgacctctgt gtaccctgct actcctgatg gctaccctgg ctggagctct ggccagcgac 4800 atcgaccctt acaaggagtt cggcgccagc gtggaactgc tgtcttttct gcccagtgat 4860 ttctttcctt ccattcgaga cctgctggat accgcctctg ctctgtatcg ggaagccctg 4920 gagagcccag aacactgctc cccacaccat accgctctgc gacaggcaat cctgtgctgg 4980 ggggagctga tgaacctggc cacatgggtg ggatcgaatc tggaggaccc cgcttcacgg 5040 gaactggtgg tcagctacgt gaacgtcaat atgggcctga aaatccgcca gctgctgtgg 5100 ttccatatta gctgcctgac ttttggacga gagaccgtgc tggaatacct ggtgtccttc 5160 ggcgtctgga ttcgcactcc ccctgcttat cgaccaccca acgcaccaat tctgtccacc 5220 ctgcccgaga ccacagtggt ccgtcgccgt 5250 <210> 39 <211> 4083 <212> DNA <213> Artificial Sequence <220> <223> Core-2A-Pol-2A-PreS2.S coding sequence <400> 39 atggctcgac ctctgtgtac cctgctactc ctgatggcta ccctggctgg agctctggcc 60 agcgacatcg acccttacaa ggagttcggc gccagcgtgg aactgctgtc ttttctgccc 120 agtgatttct ttccttccat tcgagacctg ctggataccg cctctgctct gtatcgggaa 180 gccctggaga gcccagaaca ctgctcccca caccataccg ctctgcgaca ggcaatcctg 240 tgctgggggg agctgatgaa cctggccaca tgggtgggat cgaatctgga ggaccccgct 300 tcacgggaac tggtggtcag ctacgtgaac gtcaatatgg gcctgaaaat ccgccagctg 360 ctgtggttcc atattagctg cctgactttt ggacgagaga ccgtgctgga atacctggtg 420 tccttcggcg tctggattcg cactccccct gcttatcgac cacccaacgc accaattctg 480 tccaccctgc ccgagaccac agtggtccgt cgccgtggaa gcggagctac taacttcagc 540 ctgctgaagc aggctggaga cgtggaggag aaccctggac ctatggctcg acctctgtgt 600 accctgctac tcctgatggc taccctggct ggagctctgg ccagcatgcc cctgtcttac 660 cagcacttta gaaagcttct gctgctggac gatgaagccg ggcctctgga ggaagagctg 720 ccaaggctgg cagacgaggg gctgaaccgg agagtggccg aagatctgaa tctgggaaac 780 ctgaacgtga gcatcccttg gactcataaa gtcggcaact tcaccgggct gtacagctcc 840 acagtgcctg tcttcaatcc agagtggcag acaccatcct ttcccaacat tcacctgcag 900 gaggacatca ttaatagatg cgaacagttc gtgggacctc tgacagtcaa cgaaaagagg 960 cgcctgaaac tgatcatgcc tgccaggttt tacccaaatg tgactaagta tctgccactg 1020 gataagggca tcaagcctta ctatccagag cacctggtga accattactt ccagactaga 1080 cactatctgc ataccctgtg gaaggccgga atcctgtaca aacgagaaac tacccggagt 1140 gcttcatttt gtggctcccc atattcttgg gaacaggagc tgcagcatgg caggctggtg 1200 ttccagacca gcaaacgcca cggggatgag tccttttgca gccagtctag tggcatcctg 1260 agcagatccc ccgtggggcc ttgtattcag tctcagctgc ggaagagtag actgggactg 1320 cagccacagc agggacacct ggcacgacgg cagcagggaa ggtctggcag tatccgggct 1380 agagtgcatc ccacaactag aaggaccttc ggcgtcgagc catcaggaag cggccacatc 1440 gacaacagcg catcaagctc ctctagttgc ctgcatcagt cagccgtgag aaaggccgct 1500 tacagccacc tgtccacatc taaaaggcac tcaagctccg ggcatgctgt ggagctgcac 1560 aacatccctc caaattctgc acgcagtcag tcagaaggac ccgtgttcag ctgctggtgg 1620 ctgcagtttc ggaactcaaa gccttgcagc gactattgtc tgagccatat tgtgaatctg 1680 ctggaggatt ggggcccttg taccgagcac ggggaacacc atatcaggat tccacgaaca 1740 ccagcacgag tgactggagg ggtgttcctg gtggacaaga acccccacaa tactaccgag 1800 agccggctgg tggtcgattt cagtcagttt tcaagaggca acacaagggt gtcatggccc 1860 aaattcgccg tccctaatct gcagagtctg actaacctgc tgtctagtaa tctgagctgg 1920 ctgtccctgg acgtgtccgc agccttttac cacctgcctc tgcatccagc tgcaatgccc 1980 catctgctgg tggggtcaag cggactgagt cgctacgtcg cccgactgtc ctctaactca 2040 cgcatcatta atcaccagca tggcaccatg cagaacctgc acgatagctg ttcccggaat 2100 ctgtacgtgt ctctgctgct gctgtataag acattcggca gaaaactgca cctgtacagc 2160 catcctatca ttctggggtt taggaagatc ccaatgggag tgggactgag ccccttcctg 2220 ctggcacagt ttacctccgc catttgctct gtggtccgcc gagccttccc acactgtctg 2280 gctttttcct atatgaacaa tgtggtcctg ggcgccaaat ccgtgcagca tctggagtct 2340 ctgttcacag ctgtcactaa ctttctgctg agcctgggga tccacctgaa cccaaataag 2400 actaaacgct gggggtacag cctgaatttc atgggatatg tgattggatc ctgggggacc 2460 ctgccacagg agcacatcgt gcagaagatc aaggaatgct ttcggaagct gcccgtcaac 2520 agacctatcg actggaaagt gtgccagcgg attgtcggac tgctgggctt cgccgctccc 2580 tttacccagt gcgggtaccc agcactgatg cccctgtatg cctgtatcca gtctaagcag 2640 gctttcacct ttagtcctac atacaaggca ttcctgtgca aacagtacct gaacctgtat 2700 ccagtggcaa ggcagcgacc tggactgtgc caggtctttg caaatgccac tcctaccggc 2760 tgggggctgg ctatcggaca tcagcgaatg cggggcacat tcgtggcccc cctgcctatt 2820 cacactgctc agctgctggc agcctgcttt gctagatcta ggagtggagc aaagctgatc 2880 ggcaccgaca atagtgtggt cctgtcaaga aaatacacat ccttcccatg gctgctggga 2940 tgtgctgcaa actggattct gaggggcacc agcttcgtgt acgtcccctc agccctgaat 3000 cctgctgacg atccatcccg cgggcgactg ggactgtacc gacctctgct gagactgccc 3060 ttcaggccta caactggccg gacatctctg tatgccgatt caccaagcgt gccctcacac 3120 ctgcctgaca gagtccactt tgcttcaccc ctgcacgtcg cttggcggcc tccaggatca 3180 ggcgctacga attttagcct tctgaagcaa gcgggagacg ttgaagaaaa cccagggcct 3240 atgcagtgga actcaactac tttccatcag acccttcagg accctagagt gcgcgggctg 3300 tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac gaccgcctct 3360 cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga gaatatcacc 3420 tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct gactcgaatc 3480 ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct gggaggaact 3540 cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc gacaagttgt 3600 cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat cttcctcttc 3660 atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg catgctgcct 3720 gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa gacctgtaca 3780 attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc aagcgacggt 3840 aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct ctgggaatgg 3900 gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg gtttgtggga 3960 ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg cccttccctt 4020 tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct gtgggtctat 4080 att 4083 <210> 40 <211> 4083 <212> DNA <213> Artificial Sequence <220> <223> Pol-2A-Core-2A-PreS2.S coding sequence <400> 40 atggctcgac ctctgtgtac cctgctactc ctgatggcta ccctggctgg agctctggcc 60 agcatgcccc tgtcttacca gcactttaga aagcttctgc tgctggacga tgaagccggg 120 cctctggagg aagagctgcc aaggctggca gacgaggggc tgaaccggag agtggccgaa 180 gatctgaatc tgggaaacct gaacgtgagc atcccttgga ctcataaagt cggcaacttc 240 accgggctgt acagctccac agtgcctgtc ttcaatccag agtggcagac accatccttt 300 cccaacattc acctgcagga ggacatcatt aatagatgcg aacagttcgt gggacctctg 360 acagtcaacg aaaagaggcg cctgaaactg atcatgcctg ccaggtttta cccaaatgtg 420 actaagtatc tgccactgga taagggcatc aagccttact atccagagca cctggtgaac 480 cattacttcc agactagaca ctatctgcat accctgtgga aggccggaat cctgtacaaa 540 cgagaaacta cccggagtgc ttcattttgt ggctccccat attcttggga acaggagctg 600 cagcatggca ggctggtgtt ccagaccagc aaacgccacg gggatgagtc cttttgcagc 660 cagtctagtg gcatcctgag cagatccccc gtggggcctt gtattcagtc tcagctgcgg 720 aagagtagac tgggactgca gccacagcag ggacacctgg cacgacggca gcagggaagg 780 tctggcagta tccgggctag agtgcatccc acaactagaa ggaccttcgg cgtcgagcca 840 tcaggaagcg gccacatcga caacagcgca tcaagctcct ctagttgcct gcatcagtca 900 gccgtgagaa aggccgctta cagccacctg tccacatcta aaaggcactc aagctccggg 960 catgctgtgg agctgcacaa catccctcca aattctgcac gcagtcagtc agaaggaccc 1020 gtgttcagct gctggtggct gcagtttcgg aactcaaagc cttgcagcga ctattgtctg 1080 agccatattg tgaatctgct ggaggattgg ggcccttgta ccgagcacgg ggaacaccat 1140 atcaggattc cacgaacacc agcacgagtg actggagggg tgttcctggt ggacaagaac 1200 ccccacaata ctaccgagag ccggctggtg gtcgatttca gtcagttttc aagaggcaac 1260 acaagggtgt catggcccaa attcgccgtc cctaatctgc agagtctgac taacctgctg 1320 tctagtaatc tgagctggct gtccctggac gtgtccgcag ccttttacca cctgcctctg 1380 catccagctg caatgcccca tctgctggtg gggtcaagcg gactgagtcg ctacgtcgcc 1440 cgactgtcct ctaactcacg catcattaat caccagcatg gcaccatgca gaacctgcac 1500 gatagctgtt cccggaatct gtacgtgtct ctgctgctgc tgtataagac attcggcaga 1560 aaactgcacc tgtacagcca tcctatcatt ctggggttta ggaagatccc aatgggagtg 1620 ggactgagcc ccttcctgct ggcacagttt acctccgcca tttgctctgt ggtccgccga 1680 gccttcccac actgtctggc tttttcctat atgaacaatg tggtcctggg cgccaaatcc 1740 gtgcagcatc tggagtctct gttcacagct gtcactaact ttctgctgag cctggggatc 1800 cacctgaacc caaataagac taaacgctgg gggtacagcc tgaatttcat gggatatgtg 1860 attggatcct gggggaccct gccacaggag cacatcgtgc agaagatcaa ggaatgcttt 1920 cggaagctgc ccgtcaacag acctatcgac tggaaagtgt gccagcggat tgtcggactg 1980 ctgggcttcg ccgctccctt tacccagtgc gggtacccag cactgatgcc cctgtatgcc 2040 tgtatccagt ctaagcaggc tttcaccttt agtcctacat acaaggcatt cctgtgcaaa 2100 cagtacctga acctgtatcc agtggcaagg cagcgacctg gactgtgcca ggtctttgca 2160 aatgccactc ctaccggctg ggggctggct atcggacatc agcgaatgcg gggcacattc 2220 gtggcccccc tgcctattca cactgctcag ctgctggcag cctgctttgc tagatctagg 2280 agtggagcaa agctgatcgg caccgacaat agtgtggtcc tgtcaagaaa atacacatcc 2340 ttcccatggc tgctgggatg tgctgcaaac tggattctga ggggcaccag cttcgtgtac 2400 gtcccctcag ccctgaatcc tgctgacgat ccatcccgcg ggcgactggg actgtaccga 2460 cctctgctga gactgccctt caggcctaca actggccgga catctctgta tgccgattca 2520 ccaagcgtgc cctcacacct gcctgacaga gtccactttg cttcacccct gcacgtcgct 2580 tggcggcctc caggaagcgg agctactaac ttcagcctgc tgaagcaggc tggagacgtg 2640 gaggagaacc ctggacctat ggctcgacct ctgtgtaccc tgctactcct gatggctacc 2700 ctggctggag ctctggccag cgacatcgac ccttacaagg agttcggcgc cagcgtggaa 2760 ctgctgtctt ttctgcccag tgatttcttt ccttccattc gagacctgct ggataccgcc 2820 tctgctctgt atcgggaagc cctggagagc ccagaacact gctccccaca ccataccgct 2880 ctgcgacagg caatcctgtg ctggggggag ctgatgaacc tggccacatg ggtgggatcg 2940 aatctggagg accccgcttc acgggaactg gtggtcagct acgtgaacgt caatatgggc 3000 ctgaaaatcc gccagctgct gtggttccat attagctgcc tgacttttgg acgagagacc 3060 gtgctggaat acctggtgtc cttcggcgtc tggattcgca ctccccctgc ttatcgacca 3120 cccaacgcac caattctgtc caccctgccc gagaccacag tggtccgtcg ccgtggatca 3180 ggcgctacga attttagcct tctgaagcaa gcgggagacg ttgaagaaaa cccagggcct 3240 atgcagtgga actcaactac tttccatcag acccttcagg accctagagt gcgcgggctg 3300 tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac gaccgcctct 3360 cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga gaatatcacc 3420 tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct gactcgaatc 3480 ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct gggaggaact 3540 cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc gacaagttgt 3600 cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat cttcctcttc 3660 atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg catgctgcct 3720 gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa gacctgtaca 3780 attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc aagcgacggt 3840 aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct ctgggaatgg 3900 gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg gtttgtggga 3960 ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg cccttccctt 4020 tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct gtgggtctat 4080 att 4083 <210> 41 <211> 4083 <212> DNA <213> Artificial Sequence <220> <223> PreS2.S-2A-Core-2A-Pol coding sequence <400> 41 atgcagtgga actcaactac tttccatcag acccttcagg accctagagt gcgcgggctg 60 tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac gaccgcctct 120 cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga gaatatcacc 180 tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct gactcgaatc 240 ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct gggaggaact 300 cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc gacaagttgt 360 cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat cttcctcttc 420 atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg catgctgcct 480 gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa gacctgtaca 540 attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc aagcgacggt 600 aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct ctgggaatgg 660 gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg gtttgtggga 720 ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg cccttccctt 780 tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct gtgggtctat 840 attggaagcg gagctactaa cttcagcctg ctgaagcagg ctggagacgt ggaggagaac 900 cctggaccta tggctcgacc tctgtgtacc ctgctactcc tgatggctac cctggctgga 960 gctctggcca gcgacatcga cccttacaag gagttcggcg ccagcgtgga actgctgtct 1020 tttctgccca gtgatttctt tccttccatt cgagacctgc tggataccgc ctctgctctg 1080 tatcgggaag ccctggagag cccagaacac tgctccccac accataccgc tctgcgacag 1140 gcaatcctgt gctgggggga gctgatgaac ctggccacat gggtgggatc gaatctggag 1200 gaccccgctt cacgggaact ggtggtcagc tacgtgaacg tcaatatggg cctgaaaatc 1260 cgccagctgc tgtggttcca tattagctgc ctgacttttg gacgagagac cgtgctggaa 1320 tacctggtgt ccttcggcgt ctggattcgc actccccctg cttatcgacc acccaacgca 1380 ccaattctgt ccaccctgcc cgagaccaca gtggtccgtc gccgtggatc aggcgctacg 1440 aattttagcc ttctgaagca agcgggagac gttgaagaaa acccagggcc tatggctcga 1500 cctctgtgta ccctgctact cctgatggct accctggctg gagctctggc cagcatgccc 1560 ctgtcttacc agcactttag aaagcttctg ctgctggacg atgaagccgg gcctctggag 1620 gaagagctgc caaggctggc agacgagggg ctgaaccgga gagtggccga agatctgaat 1680 ctgggaaacc tgaacgtgag catcccttgg actcataaag tcggcaactt caccgggctg 1740 tacagctcca cagtgcctgt cttcaatcca gagtggcaga caccatcctt tcccaacatt 1800 cacctgcagg aggacatcat taatagatgc gaacagttcg tgggacctct gacagtcaac 1860 gaaaagaggc gcctgaaact gatcatgcct gccaggtttt acccaaatgt gactaagtat 1920 ctgccactgg ataagggcat caagccttac tatccagagc acctggtgaa ccattacttc 1980 cagactagac actatctgca taccctgtgg aaggccggaa tcctgtacaa acgagaaact 2040 acccggagtg cttcattttg tggctcccca tattcttggg aacaggagct gcagcatggc 2100 aggctggtgt tccagaccag caaacgccac ggggatgagt ccttttgcag ccagtctagt 2160 ggcatcctga gcagatcccc cgtggggcct tgtattcagt ctcagctgcg gaagagtaga 2220 ctgggactgc agccacagca gggacacctg gcacgacggc agcagggaag gtctggcagt 2280 atccgggcta gagtgcatcc cacaactaga aggaccttcg gcgtcgagcc atcaggaagc 2340 ggccacatcg acaacagcgc atcaagctcc tctagttgcc tgcatcagtc agccgtgaga 2400 aaggccgctt acagccacct gtccacatct aaaaggcact caagctccgg gcatgctgtg 2460 gagctgcaca acatccctcc aaattctgca cgcagtcagt cagaaggacc cgtgttcagc 2520 tgctggtggc tgcagtttcg gaactcaaag ccttgcagcg actattgtct gagccatatt 2580 gtgaatctgc tggaggattg gggcccttgt accgagcacg gggaacacca tatcaggatt 2640 ccacgaacac cagcacgagt gactggaggg gtgttcctgg tggacaagaa cccccacaat 2700 actaccgaga gccggctggt ggtcgatttc agtcagtttt caagaggcaa cacaagggtg 2760 tcatggccca aattcgccgt ccctaatctg cagagtctga ctaacctgct gtctagtaat 2820 ctgagctggc tgtccctgga cgtgtccgca gccttttacc acctgcctct gcatccagct 2880 gcaatgcccc atctgctggt ggggtcaagc ggactgagtc gctacgtcgc ccgactgtcc 2940 tctaactcac gcatcattaa tcaccagcat ggcaccatgc agaacctgca cgatagctgt 3000 tcccggaatc tgtacgtgtc tctgctgctg ctgtataaga cattcggcag aaaactgcac 3060 ctgtacagcc atcctatcat tctggggttt aggaagatcc caatgggagt gggactgagc 3120 cccttcctgc tggcacagtt tacctccgcc atttgctctg tggtccgccg agccttccca 3180 cactgtctgg ctttttccta tatgaacaat gtggtcctgg gcgccaaatc cgtgcagcat 3240 ctggagtctc tgttcacagc tgtcactaac tttctgctga gcctggggat ccacctgaac 3300 ccaaataaga ctaaacgctg ggggtacagc ctgaatttca tgggatatgt gattggatcc 3360 tgggggaccc tgccacagga gcacatcgtg cagaagatca aggaatgctt tcggaagctg 3420 cccgtcaaca gacctatcga ctggaaagtg tgccagcgga ttgtcggact gctgggcttc 3480 gccgctccct ttacccagtg cgggtaccca gcactgatgc ccctgtatgc ctgtatccag 3540 tctaagcagg ctttcacctt tagtcctaca tacaaggcat tcctgtgcaa acagtacctg 3600 aacctgtatc cagtggcaag gcagcgacct ggactgtgcc aggtctttgc aaatgccact 3660 cctaccggct gggggctggc tatcggacat cagcgaatgc ggggcacatt cgtggccccc 3720 ctgcctattc acactgctca gctgctggca gcctgctttg ctagatctag gagtggagca 3780 aagctgatcg gcaccgacaa tagtgtggtc ctgtcaagaa aatacacatc cttcccatgg 3840 ctgctgggat gtgctgcaaa ctggattctg aggggcacca gcttcgtgta cgtcccctca 3900 gccctgaatc ctgctgacga tccatcccgc gggcgactgg gactgtaccg acctctgctg 3960 agactgccct tcaggcctac aactggccgg acatctctgt atgccgattc accaagcgtg 4020 ccctcacacc tgcctgacag agtccacttt gcttcacccc tgcacgtcgc ttggcggcct 4080 cca 4083 <210> 42 <211> 4083 <212> DNA <213> Artificial Sequence <220> <223> PreS2.S-2A-Pol-2A-Core coding sequence <400> 42 atgcagtgga actcaactac tttccatcag acccttcagg accctagagt gcgcgggctg 60 tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac gaccgcctct 120 cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga gaatatcacc 180 tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct gactcgaatc 240 ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct gggaggaact 300 cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc gacaagttgt 360 cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat cttcctcttc 420 atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg catgctgcct 480 gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa gacctgtaca 540 attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc aagcgacggt 600 aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct ctgggaatgg 660 gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg gtttgtggga 720 ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg cccttccctt 780 tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct gtgggtctat 840 attggaagcg gagctactaa cttcagcctg ctgaagcagg ctggagacgt ggaggagaac 900 cctggaccta tggctcgacc tctgtgtacc ctgctactcc tgatggctac cctggctgga 960 gctctggcca gcatgcccct gtcttaccag cactttagaa agcttctgct gctggacgat 1020 gaagccgggc ctctggagga agagctgcca aggctggcag acgaggggct gaaccggaga 1080 gtggccgaag atctgaatct gggaaacctg aacgtgagca tcccttggac tcataaagtc 1140 ggcaacttca ccgggctgta cagctccaca gtgcctgtct tcaatccaga gtggcagaca 1200 ccatcctttc ccaacattca cctgcaggag gacatcatta atagatgcga acagttcgtg 1260 ggacctctga cagtcaacga aaagaggcgc ctgaaactga tcatgcctgc caggttttac 1320 ccaaatgtga ctaagtatct gccactggat aagggcatca agccttacta tccagagcac 1380 ctggtgaacc attacttcca gactagacac tatctgcata ccctgtggaa ggccggaatc 1440 ctgtacaaac gagaaactac ccggagtgct tcattttgtg gctccccata ttcttgggaa 1500 caggagctgc agcatggcag gctggtgttc cagaccagca aacgccacgg ggatgagtcc 1560 ttttgcagcc agtctagtgg catcctgagc agatcccccg tggggccttg tattcagtct 1620 cagctgcgga agagtagact gggactgcag ccacagcagg gacacctggc acgacggcag 1680 cagggaaggt ctggcagtat ccgggctaga gtgcatccca caactagaag gaccttcggc 1740 gtcgagccat caggaagcgg ccacatcgac aacagcgcat caagctcctc tagttgcctg 1800 catcagtcag ccgtgagaaa ggccgcttac agccacctgt ccacatctaa aaggcactca 1860 agctccgggc atgctgtgga gctgcacaac atccctccaa attctgcacg cagtcagtca 1920 gaaggacccg tgttcagctg ctggtggctg cagtttcgga actcaaagcc ttgcagcgac 1980 tattgtctga gccatattgt gaatctgctg gaggattggg gcccttgtac cgagcacggg 2040 gaacaccata tcaggattcc acgaacacca gcacgagtga ctggaggggt gttcctggtg 2100 gacaagaacc cccacaatac taccgagagc cggctggtgg tcgatttcag tcagttttca 2160 agaggcaaca caagggtgtc atggcccaaa ttcgccgtcc ctaatctgca gagtctgact 2220 aacctgctgt ctagtaatct gagctggctg tccctggacg tgtccgcagc cttttaccac 2280 ctgcctctgc atccagctgc aatgccccat ctgctggtgg ggtcaagcgg actgagtcgc 2340 tacgtcgccc gactgtcctc taactcacgc atcattaatc accagcatgg caccatgcag 2400 aacctgcacg atagctgttc ccggaatctg tacgtgtctc tgctgctgct gtataagaca 2460 ttcggcagaa aactgcacct gtacagccat cctatcattc tggggtttag gaagatccca 2520 atgggagtgg gactgagccc cttcctgctg gcacagttta cctccgccat ttgctctgtg 2580 gtccgccgag ccttcccaca ctgtctggct ttttcctata tgaacaatgt ggtcctgggc 2640 gccaaatccg tgcagcatct ggagtctctg ttcacagctg tcactaactt tctgctgagc 2700 ctggggatcc acctgaaccc aaataagact aaacgctggg ggtacagcct gaatttcatg 2760 ggatatgtga ttggatcctg ggggaccctg ccacaggagc acatcgtgca gaagatcaag 2820 gaatgctttc ggaagctgcc cgtcaacaga cctatcgact ggaaagtgtg ccagcggatt 2880 gtcggactgc tgggcttcgc cgctcccttt acccagtgcg ggtacccagc actgatgccc 2940 ctgtatgcct gtatccagtc taagcaggct ttcaccttta gtcctacata caaggcattc 3000 ctgtgcaaac agtacctgaa cctgtatcca gtggcaaggc agcgacctgg actgtgccag 3060 gtctttgcaa atgccactcc taccggctgg gggctggcta tcggacatca gcgaatgcgg 3120 ggcacattcg tggcccccct gcctattcac actgctcagc tgctggcagc ctgctttgct 3180 agatctagga gtggagcaaa gctgatcggc accgacaata gtgtggtcct gtcaagaaaa 3240 tacacatcct tcccatggct gctgggatgt gctgcaaact ggattctgag gggcaccagc 3300 ttcgtgtacg tcccctcagc cctgaatcct gctgacgatc catcccgcgg gcgactggga 3360 ctgtaccgac ctctgctgag actgcccttc aggcctacaa ctggccggac atctctgtat 3420 gccgattcac caagcgtgcc ctcacacctg cctgacagag tccactttgc ttcacccctg 3480 cacgtcgctt ggcggcctcc aggatcaggc gctacgaatt ttagccttct gaagcaagcg 3540 ggagacgttg aagaaaaccc agggcctatg gctcgacctc tgtgtaccct gctactcctg 3600 atggctaccc tggctggagc tctggccagc gacatcgacc cttacaagga gttcggcgcc 3660 agcgtggaac tgctgtcttt tctgcccagt gatttctttc cttccattcg agacctgctg 3720 gataccgcct ctgctctgta tcgggaagcc ctggagagcc cagaacactg ctccccacac 3780 cataccgctc tgcgacaggc aatcctgtgc tggggggagc tgatgaacct ggccacatgg 3840 gtgggatcga atctggagga ccccgcttca cgggaactgg tggtcagcta cgtgaacgtc 3900 aatatgggcc tgaaaatccg ccagctgctg tggttccata ttagctgcct gacttttgga 3960 cgagagaccg tgctggaata cctggtgtcc ttcggcgtct ggattcgcac tccccctgct 4020 tatcgaccac ccaacgcacc aattctgtcc accctgcccg agaccacagt ggtccgtcgc 4080 cgt 4083 <210> 43 <211> 4607 <212> DNA <213> Artificial Sequence <220> <223> Core-2A-Pol coding sequence -IRES (EMCV)-PreS2.S coding sequence <400> 43 atggctcgac ctctgtgtac cctgctactc ctgatggcta ccctggctgg agctctggcc 60 agcgacatcg acccttacaa ggagttcggc gccagcgtgg aactgctgtc ttttctgccc 120 agtgatttct ttccttccat tcgagacctg ctggataccg cctctgctct gtatcgggaa 180 gccctggaga gcccagaaca ctgctcccca caccataccg ctctgcgaca ggcaatcctg 240 tgctgggggg agctgatgaa cctggccaca tgggtgggat cgaatctgga ggaccccgct 300 tcacgggaac tggtggtcag ctacgtgaac gtcaatatgg gcctgaaaat ccgccagctg 360 ctgtggttcc atattagctg cctgactttt ggacgagaga ccgtgctgga atacctggtg 420 tccttcggcg tctggattcg cactccccct gcttatcgac cacccaacgc accaattctg 480 tccaccctgc ccgagaccac agtggtccgt cgccgtggaa gcggagctac taacttcagc 540 ctgctgaagc aggctggaga cgtggaggag aaccctggac ctatggctcg acctctgtgt 600 accctgctac tcctgatggc taccctggct ggagctctgg ccagcatgcc cctgtcttac 660 cagcacttta gaaagcttct gctgctggac gatgaagccg ggcctctgga ggaagagctg 720 ccaaggctgg cagacgaggg gctgaaccgg agagtggccg aagatctgaa tctgggaaac 780 ctgaacgtga gcatcccttg gactcataaa gtcggcaact tcaccgggct gtacagctcc 840 acagtgcctg tcttcaatcc agagtggcag acaccatcct ttcccaacat tcacctgcag 900 gaggacatca ttaatagatg cgaacagttc gtgggacctc tgacagtcaa cgaaaagagg 960 cgcctgaaac tgatcatgcc tgccaggttt tacccaaatg tgactaagta tctgccactg 1020 gataagggca tcaagcctta ctatccagag cacctggtga accattactt ccagactaga 1080 cactatctgc ataccctgtg gaaggccgga atcctgtaca aacgagaaac tacccggagt 1140 gcttcatttt gtggctcccc atattcttgg gaacaggagc tgcagcatgg caggctggtg 1200 ttccagacca gcaaacgcca cggggatgag tccttttgca gccagtctag tggcatcctg 1260 agcagatccc ccgtggggcc ttgtattcag tctcagctgc ggaagagtag actgggactg 1320 cagccacagc agggacacct ggcacgacgg cagcagggaa ggtctggcag tatccgggct 1380 agagtgcatc ccacaactag aaggaccttc ggcgtcgagc catcaggaag cggccacatc 1440 gacaacagcg catcaagctc ctctagttgc ctgcatcagt cagccgtgag aaaggccgct 1500 tacagccacc tgtccacatc taaaaggcac tcaagctccg ggcatgctgt ggagctgcac 1560 aacatccctc caaattctgc acgcagtcag tcagaaggac ccgtgttcag ctgctggtgg 1620 ctgcagtttc ggaactcaaa gccttgcagc gactattgtc tgagccatat tgtgaatctg 1680 ctggaggatt ggggcccttg taccgagcac ggggaacacc atatcaggat tccacgaaca 1740 ccagcacgag tgactggagg ggtgttcctg gtggacaaga acccccacaa tactaccgag 1800 agccggctgg tggtcgattt cagtcagttt tcaagaggca acacaagggt gtcatggccc 1860 aaattcgccg tccctaatct gcagagtctg actaacctgc tgtctagtaa tctgagctgg 1920 ctgtccctgg acgtgtccgc agccttttac cacctgcctc tgcatccagc tgcaatgccc 1980 catctgctgg tggggtcaag cggactgagt cgctacgtcg cccgactgtc ctctaactca 2040 cgcatcatta atcaccagca tggcaccatg cagaacctgc acgatagctg ttcccggaat 2100 ctgtacgtgt ctctgctgct gctgtataag acattcggca gaaaactgca cctgtacagc 2160 catcctatca ttctggggtt taggaagatc ccaatgggag tgggactgag ccccttcctg 2220 ctggcacagt ttacctccgc catttgctct gtggtccgcc gagccttccc acactgtctg 2280 gctttttcct atatgaacaa tgtggtcctg ggcgccaaat ccgtgcagca tctggagtct 2340 ctgttcacag ctgtcactaa ctttctgctg agcctgggga tccacctgaa cccaaataag 2400 actaaacgct gggggtacag cctgaatttc atgggatatg tgattggatc ctgggggacc 2460 ctgccacagg agcacatcgt gcagaagatc aaggaatgct ttcggaagct gcccgtcaac 2520 agacctatcg actggaaagt gtgccagcgg attgtcggac tgctgggctt cgccgctccc 2580 tttacccagt gcgggtaccc agcactgatg cccctgtatg cctgtatcca gtctaagcag 2640 gctttcacct ttagtcctac atacaaggca ttcctgtgca aacagtacct gaacctgtat 2700 ccagtggcaa ggcagcgacc tggactgtgc caggtctttg caaatgccac tcctaccggc 2760 tgggggctgg ctatcggaca tcagcgaatg cggggcacat tcgtggcccc cctgcctatt 2820 cacactgctc agctgctggc agcctgcttt gctagatcta ggagtggagc aaagctgatc 2880 ggcaccgaca atagtgtggt cctgtcaaga aaatacacat ccttcccatg gctgctggga 2940 tgtgctgcaa actggattct gaggggcacc agcttcgtgt acgtcccctc agccctgaat 3000 cctgctgacg atccatcccg cgggcgactg ggactgtacc gacctctgct gagactgccc 3060 ttcaggccta caactggccg gacatctctg tatgccgatt caccaagcgt gccctcacac 3120 ctgcctgaca gagtccactt tgcttcaccc ctgcacgtcg cttggcggcc tccataagcc 3180 cctctccctc ccccccccct aacgttactg gccgaagccg cttggaataa ggccggtgtg 3240 cgtttgtcta tatgttattt tccaccatat tgccgtcttt tggcaatgtg agggcccgga 3300 aacctggccc tgtcttcttg acgagcattc ctaggggtct ttcccctctc gccaaaggaa 3360 tgcaaggtct gttgaatgtc gtgaaggaag cagttcctct ggaagcttct tgaagacaaa 3420 caacgtctgt agcgaccctt tgcaggcagc ggaacccccc acctggcgac aggtgcctct 3480 gcggccaaaa gccacgtgta taagatacac ctgcaaaggc ggcacaaccc cagtgccacg 3540 ttgtgagttg gatagttgtg gaaagagtca aatggctctc ctcaagcgta ttcaacaagg 3600 ggctgaagga tgcccagaag gtaccccatt gtatgggatc tgatctgggg cctcggtgca 3660 catgctttac atgtgtttag tcgaggttaa aaaacgtcta ggccccccga accacgggga 3720 cgtggttttc ctttgaaaaa cacgatgata atatggccac aaccatgcag tggaactcaa 3780 ctactttcca tcagaccctt caggacccta gagtgcgcgg gctgtacttt cctgctgggg 3840 gaagcagtag cgggaccgtt aatccagtac ctacgaccgc ctctcccata tcttctatct 3900 ttagtaggac tggtgaccct gctcccaaca tggagaatat cacctccggg tttctgggcc 3960 cactcctggt ccttcaggcc ggattcttcc tgctgactcg aatcctcacc ataccccaga 4020 gcctggacag ctggtggaca agcctgaatt ttctgggagg aactcctgta tgcctgggac 4080 aaaattcaca gtcccctaca agtaaccatt caccgacaag ttgtcctccc atctgtcccg 4140 gatacaggtg gatgtgcctg cgaaggttca tcatcttcct cttcatcctc ttgctttgcc 4200 ttattttcct cctggttctt ctggactatc agggcatgct gcctgtgtgc ccactgatac 4260 caggatctag tactaccagc acaggcccgt gtaagacctg tacaattcca gcacaaggga 4320 ctagtatgtt cccctcctgc tgttgtacta agccaagcga cggtaattgc acgtgtatcc 4380 caatcccgtc ctcctgggcg tttgccaagt acctctggga atgggcctca gtcagatttt 4440 catggcttag tcttttggtg ccgttcgtgc agtggtttgt gggactctct ccgactgtgt 4500 ggctcagcgt gatctggatg atgtggtact ggggcccttc cctttacaac atactgtctc 4560 cattccttcc cctgctgcca atcttctttt gcctgtgggt ctatatt 4607 <210> 44 <211> 4607 <212> DNA <213> Artificial Sequence <220> <223> PreS2.S coding sequence -IRES (EMCV)-Core-2A-Pol coding sequence <400> 44 atgcagtgga actcaactac tttccatcag acccttcagg accctagagt gcgcgggctg 60 tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac gaccgcctct 120 cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga gaatatcacc 180 tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct gactcgaatc 240 ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct gggaggaact 300 cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc gacaagttgt 360 cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat cttcctcttc 420 atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg catgctgcct 480 gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa gacctgtaca 540 attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc aagcgacggt 600 aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct ctgggaatgg 660 gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg gtttgtggga 720 ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg cccttccctt 780 tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct gtgggtctat 840 atttaagccc ctctccctcc ccccccccta acgttactgg ccgaagccgc ttggaataag 900 gccggtgtgc gtttgtctat atgttatttt ccaccatatt gccgtctttt ggcaatgtga 960 gggcccggaa acctggccct gtcttcttga cgagcattcc taggggtctt tcccctctcg 1020 ccaaaggaat gcaaggtctg ttgaatgtcg tgaaggaagc agttcctctg gaagcttctt 1080 gaagacaaac aacgtctgta gcgacccttt gcaggcagcg gaacccccca cctggcgaca 1140 ggtgcctctg cggccaaaag ccacgtgtat aagatacacc tgcaaaggcg gcacaacccc 1200 agtgccacgt tgtgagttgg atagttgtgg aaagagtcaa atggctctcc tcaagcgtat 1260 tcaacaaggg gctgaaggat gcccagaagg taccccattg tatgggatct gatctggggc 1320 ctcggtgcac atgctttaca tgtgtttagt cgaggttaaa aaacgtctag gccccccgaa 1380 ccacggggac gtggttttcc tttgaaaaac acgatgataa tatggccaca accatggctc 1440 gacctctgtg taccctgcta ctcctgatgg ctaccctggc tggagctctg gccagcgaca 1500 tcgaccctta caaggagttc ggcgccagcg tggaactgct gtcttttctg cccagtgatt 1560 tctttccttc cattcgagac ctgctggata ccgcctctgc tctgtatcgg gaagccctgg 1620 agagcccaga acactgctcc ccacaccata ccgctctgcg acaggcaatc ctgtgctggg 1680 gggagctgat gaacctggcc acatgggtgg gatcgaatct ggaggacccc gcttcacggg 1740 aactggtggt cagctacgtg aacgtcaata tgggcctgaa aatccgccag ctgctgtggt 1800 tccatattag ctgcctgact tttggacgag agaccgtgct ggaatacctg gtgtccttcg 1860 gcgtctggat tcgcactccc cctgcttatc gaccacccaa cgcaccaatt ctgtccaccc 1920 tgcccgagac cacagtggtc cgtcgccgtg gatcaggcgc tacgaatttt agccttctga 1980 agcaagcggg agacgttgaa gaaaacccag ggcctatggc tcgacctctg tgtaccctgc 2040 tactcctgat ggctaccctg gctggagctc tggccagcat gcccctgtct taccagcact 2100 ttagaaagct tctgctgctg gacgatgaag ccgggcctct ggaggaagag ctgccaaggc 2160 tggcagacga ggggctgaac cggagagtgg ccgaagatct gaatctggga aacctgaacg 2220 tgagcatccc ttggactcat aaagtcggca acttcaccgg gctgtacagc tccacagtgc 2280 ctgtcttcaa tccagagtgg cagacaccat cctttcccaa cattcacctg caggaggaca 2340 tcattaatag atgcgaacag ttcgtgggac ctctgacagt caacgaaaag aggcgcctga 2400 aactgatcat gcctgccagg ttttacccaa atgtgactaa gtatctgcca ctggataagg 2460 gcatcaagcc ttactatcca gagcacctgg tgaaccatta cttccagact agacactatc 2520 tgcataccct gtggaaggcc ggaatcctgt acaaacgaga aactacccgg agtgcttcat 2580 tttgtggctc cccatattct tgggaacagg agctgcagca tggcaggctg gtgttccaga 2640 ccagcaaacg ccacggggat gagtcctttt gcagccagtc tagtggcatc ctgagcagat 2700 cccccgtggg gccttgtatt cagtctcagc tgcggaagag tagactggga ctgcagccac 2760 agcagggaca cctggcacga cggcagcagg gaaggtctgg cagtatccgg gctagagtgc 2820 atcccacaac tagaaggacc ttcggcgtcg agccatcagg aagcggccac atcgacaaca 2880 gcgcatcaag ctcctctagt tgcctgcatc agtcagccgt gagaaaggcc gcttacagcc 2940 acctgtccac atctaaaagg cactcaagct ccgggcatgc tgtggagctg cacaacatcc 3000 ctccaaattc tgcacgcagt cagtcagaag gacccgtgtt cagctgctgg tggctgcagt 3060 ttcggaactc aaagccttgc agcgactatt gtctgagcca tattgtgaat ctgctggagg 3120 attggggccc ttgtaccgag cacggggaac accatatcag gattccacga acaccagcac 3180 gagtgactgg aggggtgttc ctggtggaca agaaccccca caatactacc gagagccggc 3240 tggtggtcga tttcagtcag ttttcaagag gcaacacaag ggtgtcatgg cccaaattcg 3300 ccgtccctaa tctgcagagt ctgactaacc tgctgtctag taatctgagc tggctgtccc 3360 tggacgtgtc cgcagccttt taccacctgc ctctgcatcc agctgcaatg ccccatctgc 3420 tggtggggtc aagcggactg agtcgctacg tcgcccgact gtcctctaac tcacgcatca 3480 ttaatcacca gcatggcacc atgcagaacc tgcacgatag ctgttcccgg aatctgtacg 3540 tgtctctgct gctgctgtat aagacattcg gcagaaaact gcacctgtac agccatccta 3600 tcattctggg gtttaggaag atcccaatgg gagtgggact gagccccttc ctgctggcac 3660 agtttacctc cgccatttgc tctgtggtcc gccgagcctt cccacactgt ctggcttttt 3720 cctatatgaa caatgtggtc ctgggcgcca aatccgtgca gcatctggag tctctgttca 3780 cagctgtcac taactttctg ctgagcctgg ggatccacct gaacccaaat aagactaaac 3840 gctgggggta cagcctgaat ttcatgggat atgtgattgg atcctggggg accctgccac 3900 aggagcacat cgtgcagaag atcaaggaat gctttcggaa gctgcccgtc aacagaccta 3960 tcgactggaa agtgtgccag cggattgtcg gactgctggg cttcgccgct ccctttaccc 4020 agtgcgggta cccagcactg atgcccctgt atgcctgtat ccagtctaag caggctttca 4080 cctttagtcc tacatacaag gcattcctgt gcaaacagta cctgaacctg tatccagtgg 4140 caaggcagcg acctggactg tgccaggtct ttgcaaatgc cactcctacc ggctgggggc 4200 tggctatcgg acatcagcga atgcggggca cattcgtggc ccccctgcct attcacactg 4260 ctcagctgct ggcagcctgc tttgctagat ctaggagtgg agcaaagctg atcggcaccg 4320 acaatagtgt ggtcctgtca agaaaataca catccttccc atggctgctg ggatgtgctg 4380 caaactggat tctgaggggc accagcttcg tgtacgtccc ctcagccctg aatcctgctg 4440 acgatccatc ccgcgggcga ctgggactgt accgacctct gctgagactg cccttcaggc 4500 ctacaactgg ccggacatct ctgtatgccg attcaccaag cgtgccctca cacctgcctg 4560 acagagtcca ctttgcttca cccctgcacg tcgcttggcg gcctcca 4607 <210> 45 <211> 4767 <212> DNA <213> Artificial Sequence <220> <223> Core-2A-Pol coding sequence -IRES (EV71)-PreS2.S coding sequence <400> 45 atggctcgac ctctgtgtac cctgctactc ctgatggcta ccctggctgg agctctggcc 60 agcgacatcg acccttacaa ggagttcggc gccagcgtgg aactgctgtc ttttctgccc 120 agtgatttct ttccttccat tcgagacctg ctggataccg cctctgctct gtatcgggaa 180 gccctggaga gcccagaaca ctgctcccca caccataccg ctctgcgaca ggcaatcctg 240 tgctgggggg agctgatgaa cctggccaca tgggtgggat cgaatctgga ggaccccgct 300 tcacgggaac tggtggtcag ctacgtgaac gtcaatatgg gcctgaaaat ccgccagctg 360 ctgtggttcc atattagctg cctgactttt ggacgagaga ccgtgctgga atacctggtg 420 tccttcggcg tctggattcg cactccccct gcttatcgac cacccaacgc accaattctg 480 tccaccctgc ccgagaccac agtggtccgt cgccgtggaa gcggagctac taacttcagc 540 ctgctgaagc aggctggaga cgtggaggag aaccctggac ctatggctcg acctctgtgt 600 accctgctac tcctgatggc taccctggct ggagctctgg ccagcatgcc cctgtcttac 660 cagcacttta gaaagcttct gctgctggac gatgaagccg ggcctctgga ggaagagctg 720 ccaaggctgg cagacgaggg gctgaaccgg agagtggccg aagatctgaa tctgggaaac 780 ctgaacgtga gcatcccttg gactcataaa gtcggcaact tcaccgggct gtacagctcc 840 acagtgcctg tcttcaatcc agagtggcag acaccatcct ttcccaacat tcacctgcag 900 gaggacatca ttaatagatg cgaacagttc gtgggacctc tgacagtcaa cgaaaagagg 960 cgcctgaaac tgatcatgcc tgccaggttt tacccaaatg tgactaagta tctgccactg 1020 gataagggca tcaagcctta ctatccagag cacctggtga accattactt ccagactaga 1080 cactatctgc ataccctgtg gaaggccgga atcctgtaca aacgagaaac tacccggagt 1140 gcttcatttt gtggctcccc atattcttgg gaacaggagc tgcagcatgg caggctggtg 1200 ttccagacca gcaaacgcca cggggatgag tccttttgca gccagtctag tggcatcctg 1260 agcagatccc ccgtggggcc ttgtattcag tctcagctgc ggaagagtag actgggactg 1320 cagccacagc agggacacct ggcacgacgg cagcagggaa ggtctggcag tatccgggct 1380 agagtgcatc ccacaactag aaggaccttc ggcgtcgagc catcaggaag cggccacatc 1440 gacaacagcg catcaagctc ctctagttgc ctgcatcagt cagccgtgag aaaggccgct 1500 tacagccacc tgtccacatc taaaaggcac tcaagctccg ggcatgctgt ggagctgcac 1560 aacatccctc caaattctgc acgcagtcag tcagaaggac ccgtgttcag ctgctggtgg 1620 ctgcagtttc ggaactcaaa gccttgcagc gactattgtc tgagccatat tgtgaatctg 1680 ctggaggatt ggggcccttg taccgagcac ggggaacacc atatcaggat tccacgaaca 1740 ccagcacgag tgactggagg ggtgttcctg gtggacaaga acccccacaa tactaccgag 1800 agccggctgg tggtcgattt cagtcagttt tcaagaggca acacaagggt gtcatggccc 1860 aaattcgccg tccctaatct gcagagtctg actaacctgc tgtctagtaa tctgagctgg 1920 ctgtccctgg acgtgtccgc agccttttac cacctgcctc tgcatccagc tgcaatgccc 1980 catctgctgg tggggtcaag cggactgagt cgctacgtcg cccgactgtc ctctaactca 2040 cgcatcatta atcaccagca tggcaccatg cagaacctgc acgatagctg ttcccggaat 2100 ctgtacgtgt ctctgctgct gctgtataag acattcggca gaaaactgca cctgtacagc 2160 catcctatca ttctggggtt taggaagatc ccaatgggag tgggactgag ccccttcctg 2220 ctggcacagt ttacctccgc catttgctct gtggtccgcc gagccttccc acactgtctg 2280 gctttttcct atatgaacaa tgtggtcctg ggcgccaaat ccgtgcagca tctggagtct 2340 ctgttcacag ctgtcactaa ctttctgctg agcctgggga tccacctgaa cccaaataag 2400 actaaacgct gggggtacag cctgaatttc atgggatatg tgattggatc ctgggggacc 2460 ctgccacagg agcacatcgt gcagaagatc aaggaatgct ttcggaagct gcccgtcaac 2520 agacctatcg actggaaagt gtgccagcgg attgtcggac tgctgggctt cgccgctccc 2580 tttacccagt gcgggtaccc agcactgatg cccctgtatg cctgtatcca gtctaagcag 2640 gctttcacct ttagtcctac atacaaggca ttcctgtgca aacagtacct gaacctgtat 2700 ccagtggcaa ggcagcgacc tggactgtgc caggtctttg caaatgccac tcctaccggc 2760 tgggggctgg ctatcggaca tcagcgaatg cggggcacat tcgtggcccc cctgcctatt 2820 cacactgctc agctgctggc agcctgcttt gctagatcta ggagtggagc aaagctgatc 2880 ggcaccgaca atagtgtggt cctgtcaaga aaatacacat ccttcccatg gctgctggga 2940 tgtgctgcaa actggattct gaggggcacc agcttcgtgt acgtcccctc agccctgaat 3000 cctgctgacg atccatcccg cgggcgactg ggactgtacc gacctctgct gagactgccc 3060 ttcaggccta caactggccg gacatctctg tatgccgatt caccaagcgt gccctcacac 3120 ctgcctgaca gagtccactt tgcttcaccc ctgcacgtcg cttggcggcc tccataatta 3180 aaacagctgt gggttgttcc cacccacagg gcccactggg cgctagcact ctgattttac 3240 gaaatccttg tgcgcctgtt ttatatccct tccctaattc gaaacgtaga agcaatgcgc 3300 accactgatc aatagtaggc gtaacgcgcc agttacgtca tgatcaagca tatctgttcc 3360 cccggactga gtatcaatag actgcttacg cggttgaagg agaaaacgtt cgttatccgg 3420 ctaactactt cgagaagccc agtaacacca tggaagctgc agggtgtttc gctcagcact 3480 tcccccgtgt agatcaggtc gatgagccac tgcaatcccc acaggtgact gtggcagtgg 3540 ctgcgttggc ggcctgccta tggggagacc cataggacgc tctaatgtgg acatggtgcg 3600 aagagcctat tgagctagtt agtagtcctc cggcccctga atgcggctaa tcctaactgc 3660 ggagcacatg ccttcaaccc agagggtagt gtgtcgtaac gggcaactct gcagcggaac 3720 cgactacttt gggtgtccgt gtttcttttt tattcttata ttggctgctt atggtgacaa 3780 ttacagaatt gttaccatat agctattgga ttggccatcc ggtgtgtaat agagctgtta 3840 tatacctatt tgttggcttt gtaccactaa ctttaaaatc tataactacc ctcaacttta 3900 tattaaccct caatacagtt gaccatgcag tggaactcaa ctactttcca tcagaccctt 3960 caggacccta gagtgcgcgg gctgtacttt cctgctgggg gaagcagtag cgggaccgtt 4020 aatccagtac ctacgaccgc ctctcccata tcttctatct ttagtaggac tggtgaccct 4080 gctcccaaca tggagaatat cacctccggg tttctgggcc cactcctggt ccttcaggcc 4140 ggattcttcc tgctgactcg aatcctcacc ataccccaga gcctggacag ctggtggaca 4200 agcctgaatt ttctgggagg aactcctgta tgcctgggac aaaattcaca gtcccctaca 4260 agtaaccatt caccgacaag ttgtcctccc atctgtcccg gatacaggtg gatgtgcctg 4320 cgaaggttca tcatcttcct cttcatcctc ttgctttgcc ttattttcct cctggttctt 4380 ctggactatc agggcatgct gcctgtgtgc ccactgatac caggatctag tactaccagc 4440 acaggcccgt gtaagacctg tacaattcca gcacaaggga ctagtatgtt cccctcctgc 4500 tgttgtacta agccaagcga cggtaattgc acgtgtatcc caatcccgtc ctcctgggcg 4560 tttgccaagt acctctggga atgggcctca gtcagatttt catggcttag tcttttggtg 4620 ccgttcgtgc agtggtttgt gggactctct ccgactgtgt ggctcagcgt gatctggatg 4680 atgtggtact ggggcccttc cctttacaac atactgtctc cattccttcc cctgctgcca 4740 atcttctttt gcctgtgggt ctatatt 4767 <210> 46 <211> 4767 <212> DNA <213> Artificial Sequence <220> <223> PreS2.S coding sequence -IRES (EV71)-Core-2A-Pol coding sequence <400> 46 atgcagtgga actcaactac tttccatcag acccttcagg accctagagt gcgcgggctg 60 tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac gaccgcctct 120 cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga gaatatcacc 180 tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct gactcgaatc 240 ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct gggaggaact 300 cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc gacaagttgt 360 cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat cttcctcttc 420 atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg catgctgcct 480 gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa gacctgtaca 540 attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc aagcgacggt 600 aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct ctgggaatgg 660 gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg gtttgtggga 720 ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg cccttccctt 780 tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct gtgggtctat 840 atttaattaa aacagctgtg ggttgttccc acccacaggg cccactgggc gctagcactc 900 tgattttacg aaatccttgt gcgcctgttt tatatccctt ccctaattcg aaacgtagaa 960 gcaatgcgca ccactgatca atagtaggcg taacgcgcca gttacgtcat gatcaagcat 1020 atctgttccc ccggactgag tatcaataga ctgcttacgc ggttgaagga gaaaacgttc 1080 gttatccggc taactacttc gagaagccca gtaacaccat ggaagctgca gggtgtttcg 1140 ctcagcactt cccccgtgta gatcaggtcg atgagccact gcaatcccca caggtgactg 1200 tggcagtggc tgcgttggcg gcctgcctat ggggagaccc ataggacgct ctaatgtgga 1260 catggtgcga agagcctatt gagctagtta gtagtcctcc ggcccctgaa tgcggctaat 1320 cctaactgcg gagcacatgc cttcaaccca gagggtagtg tgtcgtaacg ggcaactctg 1380 cagcggaacc gactactttg ggtgtccgtg tttctttttt attcttatat tggctgctta 1440 tggtgacaat tacagaattg ttaccatata gctattggat tggccatccg gtgtgtaata 1500 gagctgttat atacctattt gttggctttg taccactaac tttaaaatct ataactaccc 1560 tcaactttat attaaccctc aatacagttg accatggctc gacctctgtg taccctgcta 1620 ctcctgatgg ctaccctggc tggagctctg gccagcgaca tcgaccctta caaggagttc 1680 ggcgccagcg tggaactgct gtcttttctg cccagtgatt tctttccttc cattcgagac 1740 ctgctggata ccgcctctgc tctgtatcgg gaagccctgg agagcccaga acactgctcc 1800 ccacaccata ccgctctgcg acaggcaatc ctgtgctggg gggagctgat gaacctggcc 1860 acatgggtgg gatcgaatct ggaggacccc gcttcacggg aactggtggt cagctacgtg 1920 aacgtcaata tgggcctgaa aatccgccag ctgctgtggt tccatattag ctgcctgact 1980 tttggacgag agaccgtgct ggaatacctg gtgtccttcg gcgtctggat tcgcactccc 2040 cctgcttatc gaccacccaa cgcaccaatt ctgtccaccc tgcccgagac cacagtggtc 2100 cgtcgccgtg gatcaggcgc tacgaatttt agccttctga agcaagcggg agacgttgaa 2160 gaaaacccag ggcctatggc tcgacctctg tgtaccctgc tactcctgat ggctaccctg 2220 gctggagctc tggccagcat gcccctgtct taccagcact ttagaaagct tctgctgctg 2280 gacgatgaag ccgggcctct ggaggaagag ctgccaaggc tggcagacga ggggctgaac 2340 cggagagtgg ccgaagatct gaatctggga aacctgaacg tgagcatccc ttggactcat 2400 aaagtcggca acttcaccgg gctgtacagc tccacagtgc ctgtcttcaa tccagagtgg 2460 cagacaccat cctttcccaa cattcacctg caggaggaca tcattaatag atgcgaacag 2520 ttcgtgggac ctctgacagt caacgaaaag aggcgcctga aactgatcat gcctgccagg 2580 ttttacccaa atgtgactaa gtatctgcca ctggataagg gcatcaagcc ttactatcca 2640 gagcacctgg tgaaccatta cttccagact agacactatc tgcataccct gtggaaggcc 2700 ggaatcctgt acaaacgaga aactacccgg agtgcttcat tttgtggctc cccatattct 2760 tgggaacagg agctgcagca tggcaggctg gtgttccaga ccagcaaacg ccacggggat 2820 gagtcctttt gcagccagtc tagtggcatc ctgagcagat cccccgtggg gccttgtatt 2880 cagtctcagc tgcggaagag tagactggga ctgcagccac agcagggaca cctggcacga 2940 cggcagcagg gaaggtctgg cagtatccgg gctagagtgc atcccacaac tagaaggacc 3000 ttcggcgtcg agccatcagg aagcggccac atcgacaaca gcgcatcaag ctcctctagt 3060 tgcctgcatc agtcagccgt gagaaaggcc gcttacagcc acctgtccac atctaaaagg 3120 cactcaagct ccgggcatgc tgtggagctg cacaacatcc ctccaaattc tgcacgcagt 3180 cagtcagaag gacccgtgtt cagctgctgg tggctgcagt ttcggaactc aaagccttgc 3240 agcgactatt gtctgagcca tattgtgaat ctgctggagg attggggccc ttgtaccgag 3300 cacggggaac accatatcag gattccacga acaccagcac gagtgactgg aggggtgttc 3360 ctggtggaca agaaccccca caatactacc gagagccggc tggtggtcga tttcagtcag 3420 ttttcaagag gcaacacaag ggtgtcatgg cccaaattcg ccgtccctaa tctgcagagt 3480 ctgactaacc tgctgtctag taatctgagc tggctgtccc tggacgtgtc cgcagccttt 3540 taccacctgc ctctgcatcc agctgcaatg ccccatctgc tggtggggtc aagcggactg 3600 agtcgctacg tcgcccgact gtcctctaac tcacgcatca ttaatcacca gcatggcacc 3660 atgcagaacc tgcacgatag ctgttcccgg aatctgtacg tgtctctgct gctgctgtat 3720 aagacattcg gcagaaaact gcacctgtac agccatccta tcattctggg gtttaggaag 3780 atcccaatgg gagtgggact gagccccttc ctgctggcac agtttacctc cgccatttgc 3840 tctgtggtcc gccgagcctt cccacactgt ctggcttttt cctatatgaa caatgtggtc 3900 ctgggcgcca aatccgtgca gcatctggag tctctgttca cagctgtcac taactttctg 3960 ctgagcctgg ggatccacct gaacccaaat aagactaaac gctgggggta cagcctgaat 4020 ttcatgggat atgtgattgg atcctggggg accctgccac aggagcacat cgtgcagaag 4080 atcaaggaat gctttcggaa gctgcccgtc aacagaccta tcgactggaa agtgtgccag 4140 cggattgtcg gactgctggg cttcgccgct ccctttaccc agtgcgggta cccagcactg 4200 atgcccctgt atgcctgtat ccagtctaag caggctttca cctttagtcc tacatacaag 4260 gcattcctgt gcaaacagta cctgaacctg tatccagtgg caaggcagcg acctggactg 4320 tgccaggtct ttgcaaatgc cactcctacc ggctgggggc tggctatcgg acatcagcga 4380 atgcggggca cattcgtggc ccccctgcct attcacactg ctcagctgct ggcagcctgc 4440 tttgctagat ctaggagtgg agcaaagctg atcggcaccg acaatagtgt ggtcctgtca 4500 agaaaataca catccttccc atggctgctg ggatgtgctg caaactggat tctgaggggc 4560 accagcttcg tgtacgtccc ctcagccctg aatcctgctg acgatccatc ccgcgggcga 4620 ctgggactgt accgacctct gctgagactg cccttcaggc ctacaactgg ccggacatct 4680 ctgtatgccg attcaccaag cgtgccctca cacctgcctg acagagtcca ctttgcttca 4740 cccctgcacg tcgcttggcg gcctcca 4767 <210> 47 <211> 4607 <212> DNA <213> Artificial Sequence <220> <223> Pol-2A-Core coding sequence -IRES (EMCV)-PreS2.S coding sequence <400> 47 atggctcgac ctctgtgtac cctgctactc ctgatggcta ccctggctgg agctctggcc 60 agcatgcccc tgtcttacca gcactttaga aagcttctgc tgctggacga tgaagccggg 120 cctctggagg aagagctgcc aaggctggca gacgaggggc tgaaccggag agtggccgaa 180 gatctgaatc tgggaaacct gaacgtgagc atcccttgga ctcataaagt cggcaacttc 240 accgggctgt acagctccac agtgcctgtc ttcaatccag agtggcagac accatccttt 300 cccaacattc acctgcagga ggacatcatt aatagatgcg aacagttcgt gggacctctg 360 acagtcaacg aaaagaggcg cctgaaactg atcatgcctg ccaggtttta cccaaatgtg 420 actaagtatc tgccactgga taagggcatc aagccttact atccagagca cctggtgaac 480 cattacttcc agactagaca ctatctgcat accctgtgga aggccggaat cctgtacaaa 540 cgagaaacta cccggagtgc ttcattttgt ggctccccat attcttggga acaggagctg 600 cagcatggca ggctggtgtt ccagaccagc aaacgccacg gggatgagtc cttttgcagc 660 cagtctagtg gcatcctgag cagatccccc gtggggcctt gtattcagtc tcagctgcgg 720 aagagtagac tgggactgca gccacagcag ggacacctgg cacgacggca gcagggaagg 780 tctggcagta tccgggctag agtgcatccc acaactagaa ggaccttcgg cgtcgagcca 840 tcaggaagcg gccacatcga caacagcgca tcaagctcct ctagttgcct gcatcagtca 900 gccgtgagaa aggccgctta cagccacctg tccacatcta aaaggcactc aagctccggg 960 catgctgtgg agctgcacaa catccctcca aattctgcac gcagtcagtc agaaggaccc 1020 gtgttcagct gctggtggct gcagtttcgg aactcaaagc cttgcagcga ctattgtctg 1080 agccatattg tgaatctgct ggaggattgg ggcccttgta ccgagcacgg ggaacaccat 1140 atcaggattc cacgaacacc agcacgagtg actggagggg tgttcctggt ggacaagaac 1200 ccccacaata ctaccgagag ccggctggtg gtcgatttca gtcagttttc aagaggcaac 1260 acaagggtgt catggcccaa attcgccgtc cctaatctgc agagtctgac taacctgctg 1320 tctagtaatc tgagctggct gtccctggac gtgtccgcag ccttttacca cctgcctctg 1380 catccagctg caatgcccca tctgctggtg gggtcaagcg gactgagtcg ctacgtcgcc 1440 cgactgtcct ctaactcacg catcattaat caccagcatg gcaccatgca gaacctgcac 1500 gatagctgtt cccggaatct gtacgtgtct ctgctgctgc tgtataagac attcggcaga 1560 aaactgcacc tgtacagcca tcctatcatt ctggggttta ggaagatccc aatgggagtg 1620 ggactgagcc ccttcctgct ggcacagttt acctccgcca tttgctctgt ggtccgccga 1680 gccttcccac actgtctggc tttttcctat atgaacaatg tggtcctggg cgccaaatcc 1740 gtgcagcatc tggagtctct gttcacagct gtcactaact ttctgctgag cctggggatc 1800 cacctgaacc caaataagac taaacgctgg gggtacagcc tgaatttcat gggatatgtg 1860 attggatcct gggggaccct gccacaggag cacatcgtgc agaagatcaa ggaatgcttt 1920 cggaagctgc ccgtcaacag acctatcgac tggaaagtgt gccagcggat tgtcggactg 1980 ctgggcttcg ccgctccctt tacccagtgc gggtacccag cactgatgcc cctgtatgcc 2040 tgtatccagt ctaagcaggc tttcaccttt agtcctacat acaaggcatt cctgtgcaaa 2100 cagtacctga acctgtatcc agtggcaagg cagcgacctg gactgtgcca ggtctttgca 2160 aatgccactc ctaccggctg ggggctggct atcggacatc agcgaatgcg gggcacattc 2220 gtggcccccc tgcctattca cactgctcag ctgctggcag cctgctttgc tagatctagg 2280 agtggagcaa agctgatcgg caccgacaat agtgtggtcc tgtcaagaaa atacacatcc 2340 ttcccatggc tgctgggatg tgctgcaaac tggattctga ggggcaccag cttcgtgtac 2400 gtcccctcag ccctgaatcc tgctgacgat ccatcccgcg ggcgactggg actgtaccga 2460 cctctgctga gactgccctt caggcctaca actggccgga catctctgta tgccgattca 2520 ccaagcgtgc cctcacacct gcctgacaga gtccactttg cttcacccct gcacgtcgct 2580 tggcggcctc caggaagcgg agctactaac ttcagcctgc tgaagcaggc tggagacgtg 2640 gaggagaacc ctggacctat ggctcgacct ctgtgtaccc tgctactcct gatggctacc 2700 ctggctggag ctctggccag cgacatcgac ccttacaagg agttcggcgc cagcgtggaa 2760 ctgctgtctt ttctgcccag tgatttcttt ccttccattc gagacctgct ggataccgcc 2820 tctgctctgt atcgggaagc cctggagagc ccagaacact gctccccaca ccataccgct 2880 ctgcgacagg caatcctgtg ctggggggag ctgatgaacc tggccacatg ggtgggatcg 2940 aatctggagg accccgcttc acgggaactg gtggtcagct acgtgaacgt caatatgggc 3000 ctgaaaatcc gccagctgct gtggttccat attagctgcc tgacttttgg acgagagacc 3060 gtgctggaat acctggtgtc cttcggcgtc tggattcgca ctccccctgc ttatcgacca 3120 cccaacgcac caattctgtc caccctgccc gagaccacag tggtccgtcg ccgttaagcc 3180 cctctccctc ccccccccct aacgttactg gccgaagccg cttggaataa ggccggtgtg 3240 cgtttgtcta tatgttattt tccaccatat tgccgtcttt tggcaatgtg agggcccgga 3300 aacctggccc tgtcttcttg acgagcattc ctaggggtct ttcccctctc gccaaaggaa 3360 tgcaaggtct gttgaatgtc gtgaaggaag cagttcctct ggaagcttct tgaagacaaa 3420 caacgtctgt agcgaccctt tgcaggcagc ggaacccccc acctggcgac aggtgcctct 3480 gcggccaaaa gccacgtgta taagatacac ctgcaaaggc ggcacaaccc cagtgccacg 3540 ttgtgagttg gatagttgtg gaaagagtca aatggctctc ctcaagcgta ttcaacaagg 3600 ggctgaagga tgcccagaag gtaccccatt gtatgggatc tgatctgggg cctcggtgca 3660 catgctttac atgtgtttag tcgaggttaa aaaacgtcta ggccccccga accacgggga 3720 cgtggttttc ctttgaaaaa cacgatgata atatggccac aaccatgcag tggaactcaa 3780 ctactttcca tcagaccctt caggacccta gagtgcgcgg gctgtacttt cctgctgggg 3840 gaagcagtag cgggaccgtt aatccagtac ctacgaccgc ctctcccata tcttctatct 3900 ttagtaggac tggtgaccct gctcccaaca tggagaatat cacctccggg tttctgggcc 3960 cactcctggt ccttcaggcc ggattcttcc tgctgactcg aatcctcacc ataccccaga 4020 gcctggacag ctggtggaca agcctgaatt ttctgggagg aactcctgta tgcctgggac 4080 aaaattcaca gtcccctaca agtaaccatt caccgacaag ttgtcctccc atctgtcccg 4140 gatacaggtg gatgtgcctg cgaaggttca tcatcttcct cttcatcctc ttgctttgcc 4200 ttattttcct cctggttctt ctggactatc agggcatgct gcctgtgtgc ccactgatac 4260 caggatctag tactaccagc acaggcccgt gtaagacctg tacaattcca gcacaaggga 4320 ctagtatgtt cccctcctgc tgttgtacta agccaagcga cggtaattgc acgtgtatcc 4380 caatcccgtc ctcctgggcg tttgccaagt acctctggga atgggcctca gtcagatttt 4440 catggcttag tcttttggtg ccgttcgtgc agtggtttgt gggactctct ccgactgtgt 4500 ggctcagcgt gatctggatg atgtggtact ggggcccttc cctttacaac atactgtctc 4560 cattccttcc cctgctgcca atcttctttt gcctgtgggt ctatatt 4607 <210> 48 <211> 4767 <212> DNA <213> Artificial Sequence <220> <223> Pol-2A-Core coding sequence -IRES (EV71)-PreS2.S coding sequence <400> 48 atggctcgac ctctgtgtac cctgctactc ctgatggcta ccctggctgg agctctggcc 60 agcatgcccc tgtcttacca gcactttaga aagcttctgc tgctggacga tgaagccggg 120 cctctggagg aagagctgcc aaggctggca gacgaggggc tgaaccggag agtggccgaa 180 gatctgaatc tgggaaacct gaacgtgagc atcccttgga ctcataaagt cggcaacttc 240 accgggctgt acagctccac agtgcctgtc ttcaatccag agtggcagac accatccttt 300 cccaacattc acctgcagga ggacatcatt aatagatgcg aacagttcgt gggacctctg 360 acagtcaacg aaaagaggcg cctgaaactg atcatgcctg ccaggtttta cccaaatgtg 420 actaagtatc tgccactgga taagggcatc aagccttact atccagagca cctggtgaac 480 cattacttcc agactagaca ctatctgcat accctgtgga aggccggaat cctgtacaaa 540 cgagaaacta cccggagtgc ttcattttgt ggctccccat attcttggga acaggagctg 600 cagcatggca ggctggtgtt ccagaccagc aaacgccacg gggatgagtc cttttgcagc 660 cagtctagtg gcatcctgag cagatccccc gtggggcctt gtattcagtc tcagctgcgg 720 aagagtagac tgggactgca gccacagcag ggacacctgg cacgacggca gcagggaagg 780 tctggcagta tccgggctag agtgcatccc acaactagaa ggaccttcgg cgtcgagcca 840 tcaggaagcg gccacatcga caacagcgca tcaagctcct ctagttgcct gcatcagtca 900 gccgtgagaa aggccgctta cagccacctg tccacatcta aaaggcactc aagctccggg 960 catgctgtgg agctgcacaa catccctcca aattctgcac gcagtcagtc agaaggaccc 1020 gtgttcagct gctggtggct gcagtttcgg aactcaaagc cttgcagcga ctattgtctg 1080 agccatattg tgaatctgct ggaggattgg ggcccttgta ccgagcacgg ggaacaccat 1140 atcaggattc cacgaacacc agcacgagtg actggagggg tgttcctggt ggacaagaac 1200 ccccacaata ctaccgagag ccggctggtg gtcgatttca gtcagttttc aagaggcaac 1260 acaagggtgt catggcccaa attcgccgtc cctaatctgc agagtctgac taacctgctg 1320 tctagtaatc tgagctggct gtccctggac gtgtccgcag ccttttacca cctgcctctg 1380 catccagctg caatgcccca tctgctggtg gggtcaagcg gactgagtcg ctacgtcgcc 1440 cgactgtcct ctaactcacg catcattaat caccagcatg gcaccatgca gaacctgcac 1500 gatagctgtt cccggaatct gtacgtgtct ctgctgctgc tgtataagac attcggcaga 1560 aaactgcacc tgtacagcca tcctatcatt ctggggttta ggaagatccc aatgggagtg 1620 ggactgagcc ccttcctgct ggcacagttt acctccgcca tttgctctgt ggtccgccga 1680 gccttcccac actgtctggc tttttcctat atgaacaatg tggtcctggg cgccaaatcc 1740 gtgcagcatc tggagtctct gttcacagct gtcactaact ttctgctgag cctggggatc 1800 cacctgaacc caaataagac taaacgctgg gggtacagcc tgaatttcat gggatatgtg 1860 attggatcct gggggaccct gccacaggag cacatcgtgc agaagatcaa ggaatgcttt 1920 cggaagctgc ccgtcaacag acctatcgac tggaaagtgt gccagcggat tgtcggactg 1980 ctgggcttcg ccgctccctt tacccagtgc gggtacccag cactgatgcc cctgtatgcc 2040 tgtatccagt ctaagcaggc tttcaccttt agtcctacat acaaggcatt cctgtgcaaa 2100 cagtacctga acctgtatcc agtggcaagg cagcgacctg gactgtgcca ggtctttgca 2160 aatgccactc ctaccggctg ggggctggct atcggacatc agcgaatgcg gggcacattc 2220 gtggcccccc tgcctattca cactgctcag ctgctggcag cctgctttgc tagatctagg 2280 agtggagcaa agctgatcgg caccgacaat agtgtggtcc tgtcaagaaa atacacatcc 2340 ttcccatggc tgctgggatg tgctgcaaac tggattctga ggggcaccag cttcgtgtac 2400 gtcccctcag ccctgaatcc tgctgacgat ccatcccgcg ggcgactggg actgtaccga 2460 cctctgctga gactgccctt caggcctaca actggccgga catctctgta tgccgattca 2520 ccaagcgtgc cctcacacct gcctgacaga gtccactttg cttcacccct gcacgtcgct 2580 tggcggcctc caggaagcgg agctactaac ttcagcctgc tgaagcaggc tggagacgtg 2640 gaggagaacc ctggacctat ggctcgacct ctgtgtaccc tgctactcct gatggctacc 2700 ctggctggag ctctggccag cgacatcgac ccttacaagg agttcggcgc cagcgtggaa 2760 ctgctgtctt ttctgcccag tgatttcttt ccttccattc gagacctgct ggataccgcc 2820 tctgctctgt atcgggaagc cctggagagc ccagaacact gctccccaca ccataccgct 2880 ctgcgacagg caatcctgtg ctggggggag ctgatgaacc tggccacatg ggtgggatcg 2940 aatctggagg accccgcttc acgggaactg gtggtcagct acgtgaacgt caatatgggc 3000 ctgaaaatcc gccagctgct gtggttccat attagctgcc tgacttttgg acgagagacc 3060 gtgctggaat acctggtgtc cttcggcgtc tggattcgca ctccccctgc ttatcgacca 3120 cccaacgcac caattctgtc caccctgccc gagaccacag tggtccgtcg ccgttaatta 3180 aaacagctgt gggttgttcc cacccacagg gcccactggg cgctagcact ctgattttac 3240 gaaatccttg tgcgcctgtt ttatatccct tccctaattc gaaacgtaga agcaatgcgc 3300 accactgatc aatagtaggc gtaacgcgcc agttacgtca tgatcaagca tatctgttcc 3360 cccggactga gtatcaatag actgcttacg cggttgaagg agaaaacgtt cgttatccgg 3420 ctaactactt cgagaagccc agtaacacca tggaagctgc agggtgtttc gctcagcact 3480 tcccccgtgt agatcaggtc gatgagccac tgcaatcccc acaggtgact gtggcagtgg 3540 ctgcgttggc ggcctgccta tggggagacc cataggacgc tctaatgtgg acatggtgcg 3600 aagagcctat tgagctagtt agtagtcctc cggcccctga atgcggctaa tcctaactgc 3660 ggagcacatg ccttcaaccc agagggtagt gtgtcgtaac gggcaactct gcagcggaac 3720 cgactacttt gggtgtccgt gtttcttttt tattcttata ttggctgctt atggtgacaa 3780 ttacagaatt gttaccatat agctattgga ttggccatcc ggtgtgtaat agagctgtta 3840 tatacctatt tgttggcttt gtaccactaa ctttaaaatc tataactacc ctcaacttta 3900 tattaaccct caatacagtt gaccatgcag tggaactcaa ctactttcca tcagaccctt 3960 caggacccta gagtgcgcgg gctgtacttt cctgctgggg gaagcagtag cgggaccgtt 4020 aatccagtac ctacgaccgc ctctcccata tcttctatct ttagtaggac tggtgaccct 4080 gctcccaaca tggagaatat cacctccggg tttctgggcc cactcctggt ccttcaggcc 4140 ggattcttcc tgctgactcg aatcctcacc ataccccaga gcctggacag ctggtggaca 4200 agcctgaatt ttctgggagg aactcctgta tgcctgggac aaaattcaca gtcccctaca 4260 agtaaccatt caccgacaag ttgtcctccc atctgtcccg gatacaggtg gatgtgcctg 4320 cgaaggttca tcatcttcct cttcatcctc ttgctttgcc ttattttcct cctggttctt 4380 ctggactatc agggcatgct gcctgtgtgc ccactgatac caggatctag tactaccagc 4440 acaggcccgt gtaagacctg tacaattcca gcacaaggga ctagtatgtt cccctcctgc 4500 tgttgtacta agccaagcga cggtaattgc acgtgtatcc caatcccgtc ctcctgggcg 4560 tttgccaagt acctctggga atgggcctca gtcagatttt catggcttag tcttttggtg 4620 ccgttcgtgc agtggtttgt gggactctct ccgactgtgt ggctcagcgt gatctggatg 4680 atgtggtact ggggcccttc cctttacaac atactgtctc cattccttcc cctgctgcca 4740 atcttctttt gcctgtgggt ctatatt 4767 <210> 49 <211> 4607 <212> DNA <213> Artificial Sequence <220> <223> PreS2.S-IRES (EMCV)-Pol-2A-Core <400> 49 atgcagtgga actcaactac tttccatcag acccttcagg accctagagt gcgcgggctg 60 tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac gaccgcctct 120 cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga gaatatcacc 180 tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct gactcgaatc 240 ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct gggaggaact 300 cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc gacaagttgt 360 cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat cttcctcttc 420 atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg catgctgcct 480 gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa gacctgtaca 540 attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc aagcgacggt 600 aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct ctgggaatgg 660 gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg gtttgtggga 720 ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg cccttccctt 780 tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct gtgggtctat 840 atttaagccc ctctccctcc ccccccccta acgttactgg ccgaagccgc ttggaataag 900 gccggtgtgc gtttgtctat atgttatttt ccaccatatt gccgtctttt ggcaatgtga 960 gggcccggaa acctggccct gtcttcttga cgagcattcc taggggtctt tcccctctcg 1020 ccaaaggaat gcaaggtctg ttgaatgtcg tgaaggaagc agttcctctg gaagcttctt 1080 gaagacaaac aacgtctgta gcgacccttt gcaggcagcg gaacccccca cctggcgaca 1140 ggtgcctctg cggccaaaag ccacgtgtat aagatacacc tgcaaaggcg gcacaacccc 1200 agtgccacgt tgtgagttgg atagttgtgg aaagagtcaa atggctctcc tcaagcgtat 1260 tcaacaaggg gctgaaggat gcccagaagg taccccattg tatgggatct gatctggggc 1320 ctcggtgcac atgctttaca tgtgtttagt cgaggttaaa aaacgtctag gccccccgaa 1380 ccacggggac gtggttttcc tttgaaaaac acgatgataa tatggccaca accatggctc 1440 gacctctgtg taccctgcta ctcctgatgg ctaccctggc tggagctctg gccagcatgc 1500 ccctgtctta ccagcacttt agaaagcttc tgctgctgga cgatgaagcc gggcctctgg 1560 aggaagagct gccaaggctg gcagacgagg ggctgaaccg gagagtggcc gaagatctga 1620 atctgggaaa cctgaacgtg agcatccctt ggactcataa agtcggcaac ttcaccgggc 1680 tgtacagctc cacagtgcct gtcttcaatc cagagtggca gacaccatcc tttcccaaca 1740 ttcacctgca ggaggacatc attaatagat gcgaacagtt cgtgggacct ctgacagtca 1800 acgaaaagag gcgcctgaaa ctgatcatgc ctgccaggtt ttacccaaat gtgactaagt 1860 atctgccact ggataagggc atcaagcctt actatccaga gcacctggtg aaccattact 1920 tccagactag acactatctg cataccctgt ggaaggccgg aatcctgtac aaacgagaaa 1980 ctacccggag tgcttcattt tgtggctccc catattcttg ggaacaggag ctgcagcatg 2040 gcaggctggt gttccagacc agcaaacgcc acggggatga gtccttttgc agccagtcta 2100 gtggcatcct gagcagatcc cccgtggggc cttgtattca gtctcagctg cggaagagta 2160 gactgggact gcagccacag cagggacacc tggcacgacg gcagcaggga aggtctggca 2220 gtatccgggc tagagtgcat cccacaacta gaaggacctt cggcgtcgag ccatcaggaa 2280 gcggccacat cgacaacagc gcatcaagct cctctagttg cctgcatcag tcagccgtga 2340 gaaaggccgc ttacagccac ctgtccacat ctaaaaggca ctcaagctcc gggcatgctg 2400 tggagctgca caacatccct ccaaattctg cacgcagtca gtcagaagga cccgtgttca 2460 gctgctggtg gctgcagttt cggaactcaa agccttgcag cgactattgt ctgagccata 2520 ttgtgaatct gctggaggat tggggccctt gtaccgagca cggggaacac catatcagga 2580 ttccacgaac accagcacga gtgactggag gggtgttcct ggtggacaag aacccccaca 2640 atactaccga gagccggctg gtggtcgatt tcagtcagtt ttcaagaggc aacacaaggg 2700 tgtcatggcc caaattcgcc gtccctaatc tgcagagtct gactaacctg ctgtctagta 2760 atctgagctg gctgtccctg gacgtgtccg cagcctttta ccacctgcct ctgcatccag 2820 ctgcaatgcc ccatctgctg gtggggtcaa gcggactgag tcgctacgtc gcccgactgt 2880 cctctaactc acgcatcatt aatcaccagc atggcaccat gcagaacctg cacgatagct 2940 gttcccggaa tctgtacgtg tctctgctgc tgctgtataa gacattcggc agaaaactgc 3000 acctgtacag ccatcctatc attctggggt ttaggaagat cccaatggga gtgggactga 3060 gccccttcct gctggcacag tttacctccg ccatttgctc tgtggtccgc cgagccttcc 3120 cacactgtct ggctttttcc tatatgaaca atgtggtcct gggcgccaaa tccgtgcagc 3180 atctggagtc tctgttcaca gctgtcacta actttctgct gagcctgggg atccacctga 3240 acccaaataa gactaaacgc tgggggtaca gcctgaattt catgggatat gtgattggat 3300 cctgggggac cctgccacag gagcacatcg tgcagaagat caaggaatgc tttcggaagc 3360 tgcccgtcaa cagacctatc gactggaaag tgtgccagcg gattgtcgga ctgctgggct 3420 tcgccgctcc ctttacccag tgcgggtacc cagcactgat gcccctgtat gcctgtatcc 3480 agtctaagca ggctttcacc tttagtccta catacaaggc attcctgtgc aaacagtacc 3540 tgaacctgta tccagtggca aggcagcgac ctggactgtg ccaggtcttt gcaaatgcca 3600 ctcctaccgg ctgggggctg gctatcggac atcagcgaat gcggggcaca ttcgtggccc 3660 ccctgcctat tcacactgct cagctgctgg cagcctgctt tgctagatct aggagtggag 3720 caaagctgat cggcaccgac aatagtgtgg tcctgtcaag aaaatacaca tccttcccat 3780 ggctgctggg atgtgctgca aactggattc tgaggggcac cagcttcgtg tacgtcccct 3840 cagccctgaa tcctgctgac gatccatccc gcgggcgact gggactgtac cgacctctgc 3900 tgagactgcc cttcaggcct acaactggcc ggacatctct gtatgccgat tcaccaagcg 3960 tgccctcaca cctgcctgac agagtccact ttgcttcacc cctgcacgtc gcttggcggc 4020 ctccaggatc aggcgctacg aattttagcc ttctgaagca agcgggagac gttgaagaaa 4080 acccagggcc tatggctcga cctctgtgta ccctgctact cctgatggct accctggctg 4140 gagctctggc cagcgacatc gacccttaca aggagttcgg cgccagcgtg gaactgctgt 4200 cttttctgcc cagtgatttc tttccttcca ttcgagacct gctggatacc gcctctgctc 4260 tgtatcggga agccctggag agcccagaac actgctcccc acaccatacc gctctgcgac 4320 aggcaatcct gtgctggggg gagctgatga acctggccac atgggtggga tcgaatctgg 4380 aggaccccgc ttcacgggaa ctggtggtca gctacgtgaa cgtcaatatg ggcctgaaaa 4440 tccgccagct gctgtggttc catattagct gcctgacttt tggacgagag accgtgctgg 4500 aatacctggt gtccttcggc gtctggattc gcactccccc tgcttatcga ccacccaacg 4560 caccaattct gtccaccctg cccgagacca cagtggtccg tcgccgt 4607 <210> 50 <211> 4767 <212> DNA <213> Artificial Sequence <220> <223> PreS2.S coding sequence -IRES (EV71)-Pol-2A-Core coding sequence <400> 50 atgcagtgga actcaactac tttccatcag acccttcagg accctagagt gcgcgggctg 60 tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac gaccgcctct 120 cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga gaatatcacc 180 tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct gactcgaatc 240 ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct gggaggaact 300 cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc gacaagttgt 360 cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat cttcctcttc 420 atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg catgctgcct 480 gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa gacctgtaca 540 attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc aagcgacggt 600 aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct ctgggaatgg 660 gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg gtttgtggga 720 ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg cccttccctt 780 tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct gtgggtctat 840 atttaattaa aacagctgtg ggttgttccc acccacaggg cccactgggc gctagcactc 900 tgattttacg aaatccttgt gcgcctgttt tatatccctt ccctaattcg aaacgtagaa 960 gcaatgcgca ccactgatca atagtaggcg taacgcgcca gttacgtcat gatcaagcat 1020 atctgttccc ccggactgag tatcaataga ctgcttacgc ggttgaagga gaaaacgttc 1080 gttatccggc taactacttc gagaagccca gtaacaccat ggaagctgca gggtgtttcg 1140 ctcagcactt cccccgtgta gatcaggtcg atgagccact gcaatcccca caggtgactg 1200 tggcagtggc tgcgttggcg gcctgcctat ggggagaccc ataggacgct ctaatgtgga 1260 catggtgcga agagcctatt gagctagtta gtagtcctcc ggcccctgaa tgcggctaat 1320 cctaactgcg gagcacatgc cttcaaccca gagggtagtg tgtcgtaacg ggcaactctg 1380 cagcggaacc gactactttg ggtgtccgtg tttctttttt attcttatat tggctgctta 1440 tggtgacaat tacagaattg ttaccatata gctattggat tggccatccg gtgtgtaata 1500 gagctgttat atacctattt gttggctttg taccactaac tttaaaatct ataactaccc 1560 tcaactttat attaaccctc aatacagttg accatggctc gacctctgtg taccctgcta 1620 ctcctgatgg ctaccctggc tggagctctg gccagcatgc ccctgtctta ccagcacttt 1680 agaaagcttc tgctgctgga cgatgaagcc gggcctctgg aggaagagct gccaaggctg 1740 gcagacgagg ggctgaaccg gagagtggcc gaagatctga atctgggaaa cctgaacgtg 1800 agcatccctt ggactcataa agtcggcaac ttcaccgggc tgtacagctc cacagtgcct 1860 gtcttcaatc cagagtggca gacaccatcc tttcccaaca ttcacctgca ggaggacatc 1920 attaatagat gcgaacagtt cgtgggacct ctgacagtca acgaaaagag gcgcctgaaa 1980 ctgatcatgc ctgccaggtt ttacccaaat gtgactaagt atctgccact ggataagggc 2040 atcaagcctt actatccaga gcacctggtg aaccattact tccagactag acactatctg 2100 cataccctgt ggaaggccgg aatcctgtac aaacgagaaa ctacccggag tgcttcattt 2160 tgtggctccc catattcttg ggaacaggag ctgcagcatg gcaggctggt gttccagacc 2220 agcaaacgcc acggggatga gtccttttgc agccagtcta gtggcatcct gagcagatcc 2280 cccgtggggc cttgtattca gtctcagctg cggaagagta gactgggact gcagccacag 2340 cagggacacc tggcacgacg gcagcaggga aggtctggca gtatccgggc tagagtgcat 2400 cccacaacta gaaggacctt cggcgtcgag ccatcaggaa gcggccacat cgacaacagc 2460 gcatcaagct cctctagttg cctgcatcag tcagccgtga gaaaggccgc ttacagccac 2520 ctgtccacat ctaaaaggca ctcaagctcc gggcatgctg tggagctgca caacatccct 2580 ccaaattctg cacgcagtca gtcagaagga cccgtgttca gctgctggtg gctgcagttt 2640 cggaactcaa agccttgcag cgactattgt ctgagccata ttgtgaatct gctggaggat 2700 tggggccctt gtaccgagca cggggaacac catatcagga ttccacgaac accagcacga 2760 gtgactggag gggtgttcct ggtggacaag aacccccaca atactaccga gagccggctg 2820 gtggtcgatt tcagtcagtt ttcaagaggc aacacaaggg tgtcatggcc caaattcgcc 2880 gtccctaatc tgcagagtct gactaacctg ctgtctagta atctgagctg gctgtccctg 2940 gacgtgtccg cagcctttta ccacctgcct ctgcatccag ctgcaatgcc ccatctgctg 3000 gtggggtcaa gcggactgag tcgctacgtc gcccgactgt cctctaactc acgcatcatt 3060 aatcaccagc atggcaccat gcagaacctg cacgatagct gttcccggaa tctgtacgtg 3120 tctctgctgc tgctgtataa gacattcggc agaaaactgc acctgtacag ccatcctatc 3180 attctggggt ttaggaagat cccaatggga gtgggactga gccccttcct gctggcacag 3240 tttacctccg ccatttgctc tgtggtccgc cgagccttcc cacactgtct ggctttttcc 3300 tatatgaaca atgtggtcct gggcgccaaa tccgtgcagc atctggagtc tctgttcaca 3360 gctgtcacta actttctgct gagcctgggg atccacctga acccaaataa gactaaacgc 3420 tgggggtaca gcctgaattt catgggatat gtgattggat cctgggggac cctgccacag 3480 gagcacatcg tgcagaagat caaggaatgc tttcggaagc tgcccgtcaa cagacctatc 3540 gactggaaag tgtgccagcg gattgtcgga ctgctgggct tcgccgctcc ctttacccag 3600 tgcgggtacc cagcactgat gcccctgtat gcctgtatcc agtctaagca ggctttcacc 3660 tttagtccta catacaaggc attcctgtgc aaacagtacc tgaacctgta tccagtggca 3720 aggcagcgac ctggactgtg ccaggtcttt gcaaatgcca ctcctaccgg ctgggggctg 3780 gctatcggac atcagcgaat gcggggcaca ttcgtggccc ccctgcctat tcacactgct 3840 cagctgctgg cagcctgctt tgctagatct aggagtggag caaagctgat cggcaccgac 3900 aatagtgtgg tcctgtcaag aaaatacaca tccttcccat ggctgctggg atgtgctgca 3960 aactggattc tgaggggcac cagcttcgtg tacgtcccct cagccctgaa tcctgctgac 4020 gatccatccc gcgggcgact gggactgtac cgacctctgc tgagactgcc cttcaggcct 4080 acaactggcc ggacatctct gtatgccgat tcaccaagcg tgccctcaca cctgcctgac 4140 agagtccact ttgcttcacc cctgcacgtc gcttggcggc ctccaggatc aggcgctacg 4200 aattttagcc ttctgaagca agcgggagac gttgaagaaa acccagggcc tatggctcga 4260 cctctgtgta ccctgctact cctgatggct accctggctg gagctctggc cagcgacatc 4320 gacccttaca aggagttcgg cgccagcgtg gaactgctgt cttttctgcc cagtgatttc 4380 tttccttcca ttcgagacct gctggatacc gcctctgctc tgtatcggga agccctggag 4440 agcccagaac actgctcccc acaccatacc gctctgcgac aggcaatcct gtgctggggg 4500 gagctgatga acctggccac atgggtggga tcgaatctgg aggaccccgc ttcacgggaa 4560 ctggtggtca gctacgtgaa cgtcaatatg ggcctgaaaa tccgccagct gctgtggttc 4620 catattagct gcctgacttt tggacgagag accgtgctgg aatacctggt gtccttcggc 4680 gtctggattc gcactccccc tgcttatcga ccacccaacg caccaattct gtccaccctg 4740 cccgagacca cagtggtccg tcgccgt 4767 <210> 51 <211> 3987 <212> DNA <213> Artificial Sequence <220> <223> Pol-2A-PreS2.S-2A-preS1 coding sequence <400> 51 atggctcgac ctctgtgtac cctgctactc ctgatggcta ccctggctgg agctctggcc 60 agcatgcccc tgtcttacca gcactttaga aagcttctgc tgctggacga tgaagccggg 120 cctctggagg aagagctgcc aaggctggca gacgaggggc tgaaccggag agtggccgaa 180 gatctgaatc tgggaaacct gaacgtgagc atcccttgga ctcataaagt cggcaacttc 240 accgggctgt acagctccac agtgcctgtc ttcaatccag agtggcagac accatccttt 300 cccaacattc acctgcagga ggacatcatt aatagatgcg aacagttcgt gggacctctg 360 acagtcaacg aaaagaggcg cctgaaactg atcatgcctg ccaggtttta cccaaatgtg 420 actaagtatc tgccactgga taagggcatc aagccttact atccagagca cctggtgaac 480 cattacttcc agactagaca ctatctgcat accctgtgga aggccggaat cctgtacaaa 540 cgagaaacta cccggagtgc ttcattttgt ggctccccat attcttggga acaggagctg 600 cagcatggca ggctggtgtt ccagaccagc aaacgccacg gggatgagtc cttttgcagc 660 cagtctagtg gcatcctgag cagatccccc gtggggcctt gtattcagtc tcagctgcgg 720 aagagtagac tgggactgca gccacagcag ggacacctgg cacgacggca gcagggaagg 780 tctggcagta tccgggctag agtgcatccc acaactagaa ggaccttcgg cgtcgagcca 840 tcaggaagcg gccacatcga caacagcgca tcaagctcct ctagttgcct gcatcagtca 900 gccgtgagaa aggccgctta cagccacctg tccacatcta aaaggcactc aagctccggg 960 catgctgtgg agctgcacaa catccctcca aattctgcac gcagtcagtc agaaggaccc 1020 gtgttcagct gctggtggct gcagtttcgg aactcaaagc cttgcagcga ctattgtctg 1080 agccatattg tgaatctgct ggaggattgg ggcccttgta ccgagcacgg ggaacaccat 1140 atcaggattc cacgaacacc agcacgagtg actggagggg tgttcctggt ggacaagaac 1200 ccccacaata ctaccgagag ccggctggtg gtcgatttca gtcagttttc aagaggcaac 1260 acaagggtgt catggcccaa attcgccgtc cctaatctgc agagtctgac taacctgctg 1320 tctagtaatc tgagctggct gtccctggac gtgtccgcag ccttttacca cctgcctctg 1380 catccagctg caatgcccca tctgctggtg gggtcaagcg gactgagtcg ctacgtcgcc 1440 cgactgtcct ctaactcacg catcattaat caccagcatg gcaccatgca gaacctgcac 1500 gatagctgtt cccggaatct gtacgtgtct ctgctgctgc tgtataagac attcggcaga 1560 aaactgcacc tgtacagcca tcctatcatt ctggggttta ggaagatccc aatgggagtg 1620 ggactgagcc ccttcctgct ggcacagttt acctccgcca tttgctctgt ggtccgccga 1680 gccttcccac actgtctggc tttttcctat atgaacaatg tggtcctggg cgccaaatcc 1740 gtgcagcatc tggagtctct gttcacagct gtcactaact ttctgctgag cctggggatc 1800 cacctgaacc caaataagac taaacgctgg gggtacagcc tgaatttcat gggatatgtg 1860 attggatcct gggggaccct gccacaggag cacatcgtgc agaagatcaa ggaatgcttt 1920 cggaagctgc ccgtcaacag acctatcgac tggaaagtgt gccagcggat tgtcggactg 1980 ctgggcttcg ccgctccctt tacccagtgc gggtacccag cactgatgcc cctgtatgcc 2040 tgtatccagt ctaagcaggc tttcaccttt agtcctacat acaaggcatt cctgtgcaaa 2100 cagtacctga acctgtatcc agtggcaagg cagcgacctg gactgtgcca ggtctttgca 2160 aatgccactc ctaccggctg ggggctggct atcggacatc agcgaatgcg gggcacattc 2220 gtggcccccc tgcctattca cactgctcag ctgctggcag cctgctttgc tagatctagg 2280 agtggagcaa agctgatcgg caccgacaat agtgtggtcc tgtcaagaaa atacacatcc 2340 ttcccatggc tgctgggatg tgctgcaaac tggattctga ggggcaccag cttcgtgtac 2400 gtcccctcag ccctgaatcc tgctgacgat ccatcccgcg ggcgactggg actgtaccga 2460 cctctgctga gactgccctt caggcctaca actggccgga catctctgta tgccgattca 2520 ccaagcgtgc cctcacacct gcctgacaga gtccactttg cttcacccct gcacgtcgct 2580 tggcggcctc caggatcagg cgctacgaat tttagccttc tgaagcaagc gggagacgtt 2640 gaagaaaacc cagggcctat gcagtggaac tcaactactt tccatcagac ccttcaggac 2700 cctagagtgc gcgggctgta ctttcctgct gggggaagca gtagcgggac cgttaatcca 2760 gtacctacga ccgcctctcc catatcttct atctttagta ggactggtga ccctgctccc 2820 aacatggaga atatcacctc cgggtttctg ggcccactcc tggtccttca ggccggattc 2880 ttcctgctga ctcgaatcct caccataccc cagagcctgg acagctggtg gacaagcctg 2940 aattttctgg gaggaactcc tgtatgcctg ggacaaaatt cacagtcccc tacaagtaac 3000 cattcaccga caagttgtcc tcccatctgt cccggataca ggtggatgtg cctgcgaagg 3060 ttcatcatct tcctcttcat cctcttgctt tgccttattt tcctcctggt tcttctggac 3120 tatcagggca tgctgcctgt gtgcccactg ataccaggat ctagtactac cagcacaggc 3180 ccgtgtaaga cctgtacaat tccagcacaa gggactagta tgttcccctc ctgctgttgt 3240 actaagccaa gcgacggtaa ttgcacgtgt atcccaatcc cgtcctcctg ggcgtttgcc 3300 aagtacctct gggaatgggc ctcagtcaga ttttcatggc ttagtctttt ggtgccgttc 3360 gtgcagtggt ttgtgggact ctctccgact gtgtggctca gcgtgatctg gatgatgtgg 3420 tactggggcc cttcccttta caacatactg tctccattcc ttcccctgct gccaatcttc 3480 ttttgcctgt gggtctatat tgggtccgga gcgactaact tttccctgct gaaacaagcg 3540 ggtgacgtcg aagagaatcc gggacctatg gctaggcccc tgtgtacact tttgctcctg 3600 atggccaccc tcgctggagc tctggcaagc ggtggatgga gctcaaagcc gcggaaaggg 3660 atgggtacta acctgtccgt accaaatccc ctgggatttt ttccagacca ccaactcgat 3720 cctgcttttg gcgcaaattc caacaatccc gactgggact ttaaccctaa caaggaccac 3780 tggcctgatg ccaacaaggt gggggcagga gcctttggtc ccggcttcac cccaccccat 3840 ggaggtcttt tgggatggtc accacaggcc cagggcatcc tgaccactgt ccctgctgct 3900 ccaccgccag cttctactaa tcgacagagc gggaggcagc cgacccccct gagtcccccc 3960 ctgcgggata cccaccctca ggcataa 3987 <210> 52 <211> 3987 <212> DNA <213> Artificial Sequence <220> <223> PreS2.S-2A-preS1-2A-Pol coding sequence <400> 52 atgcagtgga actcaactac tttccatcag acccttcagg accctagagt gcgcgggctg 60 tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac gaccgcctct 120 cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga gaatatcacc 180 tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct gactcgaatc 240 ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct gggaggaact 300 cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc gacaagttgt 360 cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat cttcctcttc 420 atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg catgctgcct 480 gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa gacctgtaca 540 attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc aagcgacggt 600 aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct ctgggaatgg 660 gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg gtttgtggga 720 ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg cccttccctt 780 tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct gtgggtctat 840 attggaagcg gagctactaa cttcagcctg ctgaagcagg ctggagacgt ggaggagaac 900 cctggaccta tggctaggcc cctgtgtaca cttttgctcc tgatggccac cctcgctgga 960 gctctggcaa gcggtggatg gagctcaaag ccgcggaaag ggatgggtac taacctgtcc 1020 gtaccaaatc ccctgggatt ttttccagac caccaactcg atcctgcttt tggcgcaaat 1080 tccaacaatc ccgactggga ctttaaccct aacaaggacc actggcctga tgccaacaag 1140 gtgggggcag gagcctttgg tcccggcttc accccacccc atggaggtct tttgggatgg 1200 tcaccacagg cccagggcat cctgaccact gtccctgctg ctccaccgcc agcttctact 1260 aatcgacaga gcgggaggca gccgaccccc ctgagtcccc ccctgcggga tacccaccct 1320 caggcaggat caggcgctac gaattttagc cttctgaagc aagcgggaga cgttgaagaa 1380 aacccagggc ctatggctcg acctctgtgt accctgctac tcctgatggc taccctggct 1440 ggagctctgg ccagcatgcc cctgtcttac cagcacttta gaaagcttct gctgctggac 1500 gatgaagccg ggcctctgga ggaagagctg ccaaggctgg cagacgaggg gctgaaccgg 1560 agagtggccg aagatctgaa tctgggaaac ctgaacgtga gcatcccttg gactcataaa 1620 gtcggcaact tcaccgggct gtacagctcc acagtgcctg tcttcaatcc agagtggcag 1680 acaccatcct ttcccaacat tcacctgcag gaggacatca ttaatagatg cgaacagttc 1740 gtgggacctc tgacagtcaa cgaaaagagg cgcctgaaac tgatcatgcc tgccaggttt 1800 tacccaaatg tgactaagta tctgccactg gataagggca tcaagcctta ctatccagag 1860 cacctggtga accattactt ccagactaga cactatctgc ataccctgtg gaaggccgga 1920 atcctgtaca aacgagaaac tacccggagt gcttcatttt gtggctcccc atattcttgg 1980 gaacaggagc tgcagcatgg caggctggtg ttccagacca gcaaacgcca cggggatgag 2040 tccttttgca gccagtctag tggcatcctg agcagatccc ccgtggggcc ttgtattcag 2100 tctcagctgc ggaagagtag actgggactg cagccacagc agggacacct ggcacgacgg 2160 cagcagggaa ggtctggcag tatccgggct agagtgcatc ccacaactag aaggaccttc 2220 ggcgtcgagc catcaggaag cggccacatc gacaacagcg catcaagctc ctctagttgc 2280 ctgcatcagt cagccgtgag aaaggccgct tacagccacc tgtccacatc taaaaggcac 2340 tcaagctccg ggcatgctgt ggagctgcac aacatccctc caaattctgc acgcagtcag 2400 tcagaaggac ccgtgttcag ctgctggtgg ctgcagtttc ggaactcaaa gccttgcagc 2460 gactattgtc tgagccatat tgtgaatctg ctggaggatt ggggcccttg taccgagcac 2520 ggggaacacc atatcaggat tccacgaaca ccagcacgag tgactggagg ggtgttcctg 2580 gtggacaaga acccccacaa tactaccgag agccggctgg tggtcgattt cagtcagttt 2640 tcaagaggca acacaagggt gtcatggccc aaattcgccg tccctaatct gcagagtctg 2700 actaacctgc tgtctagtaa tctgagctgg ctgtccctgg acgtgtccgc agccttttac 2760 cacctgcctc tgcatccagc tgcaatgccc catctgctgg tggggtcaag cggactgagt 2820 cgctacgtcg cccgactgtc ctctaactca cgcatcatta atcaccagca tggcaccatg 2880 cagaacctgc acgatagctg ttcccggaat ctgtacgtgt ctctgctgct gctgtataag 2940 acattcggca gaaaactgca cctgtacagc catcctatca ttctggggtt taggaagatc 3000 ccaatgggag tgggactgag ccccttcctg ctggcacagt ttacctccgc catttgctct 3060 gtggtccgcc gagccttccc acactgtctg gctttttcct atatgaacaa tgtggtcctg 3120 ggcgccaaat ccgtgcagca tctggagtct ctgttcacag ctgtcactaa ctttctgctg 3180 agcctgggga tccacctgaa cccaaataag actaaacgct gggggtacag cctgaatttc 3240 atgggatatg tgattggatc ctgggggacc ctgccacagg agcacatcgt gcagaagatc 3300 aaggaatgct ttcggaagct gcccgtcaac agacctatcg actggaaagt gtgccagcgg 3360 attgtcggac tgctgggctt cgccgctccc tttacccagt gcgggtaccc agcactgatg 3420 cccctgtatg cctgtatcca gtctaagcag gctttcacct ttagtcctac atacaaggca 3480 ttcctgtgca aacagtacct gaacctgtat ccagtggcaa ggcagcgacc tggactgtgc 3540 caggtctttg caaatgccac tcctaccggc tgggggctgg ctatcggaca tcagcgaatg 3600 cggggcacat tcgtggcccc cctgcctatt cacactgctc agctgctggc agcctgcttt 3660 gctagatcta ggagtggagc aaagctgatc ggcaccgaca atagtgtggt cctgtcaaga 3720 aaatacacat ccttcccatg gctgctggga tgtgctgcaa actggattct gaggggcacc 3780 agcttcgtgt acgtcccctc agccctgaat cctgctgacg atccatcccg cgggcgactg 3840 ggactgtacc gacctctgct gagactgccc ttcaggccta caactggccg gacatctctg 3900 tatgccgatt caccaagcgt gccctcacac ctgcctgaca gagtccactt tgcttcaccc 3960 ctgcacgtcg cttggcggcc tccataa 3987 <210> 53 <211> 4508 <212> DNA <213> Artificial Sequence <220> <223> PreS2.S-2A-preS1 coding sequence -IRES (EMCV)-Pol coding sequence <400> 53 atgcagtgga actcaactac tttccatcag acccttcagg accctagagt gcgcgggctg 60 tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac gaccgcctct 120 cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga gaatatcacc 180 tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct gactcgaatc 240 ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct gggaggaact 300 cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc gacaagttgt 360 cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat cttcctcttc 420 atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg catgctgcct 480 gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa gacctgtaca 540 attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc aagcgacggt 600 aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct ctgggaatgg 660 gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg gtttgtggga 720 ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg cccttccctt 780 tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct gtgggtctat 840 attggaagcg gagctactaa cttcagcctg ctgaagcagg ctggagacgt ggaggagaac 900 cctggaccta tggctaggcc cctgtgtaca cttttgctcc tgatggccac cctcgctgga 960 gctctggcaa gcggtggatg gagctcaaag ccgcggaaag ggatgggtac taacctgtcc 1020 gtaccaaatc ccctgggatt ttttccagac caccaactcg atcctgcttt tggcgcaaat 1080 tccaacaatc ccgactggga ctttaaccct aacaaggacc actggcctga tgccaacaag 1140 gtgggggcag gagcctttgg tcccggcttc accccacccc atggaggtct tttgggatgg 1200 tcaccacagg cccagggcat cctgaccact gtccctgctg ctccaccgcc agcttctact 1260 aatcgacaga gcgggaggca gccgaccccc ctgagtcccc ccctgcggga tacccaccct 1320 caggcataag cccctctccc tccccccccc ctaacgttac tggccgaagc cgcttggaat 1380 aaggccggtg tgcgtttgtc tatatgttat tttccaccat attgccgtct tttggcaatg 1440 tgagggcccg gaaacctggc cctgtcttct tgacgagcat tcctaggggt ctttcccctc 1500 tcgccaaagg aatgcaaggt ctgttgaatg tcgtgaagga agcagttcct ctggaagctt 1560 cttgaagaca aacaacgtct gtagcgaccc tttgcaggca gcggaacccc ccacctggcg 1620 acaggtgcct ctgcggccaa aagccacgtg tataagatac acctgcaaag gcggcacaac 1680 cccagtgcca cgttgtgagt tggatagttg tggaaagagt caaatggctc tcctcaagcg 1740 tattcaacaa ggggctgaag gatgcccaga aggtacccca ttgtatggga tctgatctgg 1800 ggcctcggtg cacatgcttt acatgtgttt agtcgaggtt aaaaaacgtc taggcccccc 1860 gaaccacggg gacgtggttt tcctttgaaa aacacgatga taatatggcc acaaccatgg 1920 ctcgacctct gtgtaccctg ctactcctga tggctaccct ggctggagct ctggccagca 1980 tgcccctgtc ttaccagcac tttagaaagc ttctgctgct ggacgatgaa gccgggcctc 2040 tggaggaaga gctgccaagg ctggcagacg aggggctgaa ccggagagtg gccgaagatc 2100 tgaatctggg aaacctgaac gtgagcatcc cttggactca taaagtcggc aacttcaccg 2160 ggctgtacag ctccacagtg cctgtcttca atccagagtg gcagacacca tcctttccca 2220 acattcacct gcaggaggac atcattaata gatgcgaaca gttcgtggga cctctgacag 2280 tcaacgaaaa gaggcgcctg aaactgatca tgcctgccag gttttaccca aatgtgacta 2340 agtatctgcc actggataag ggcatcaagc cttactatcc agagcacctg gtgaaccatt 2400 acttccagac tagacactat ctgcataccc tgtggaaggc cggaatcctg tacaaacgag 2460 aaactacccg gagtgcttca ttttgtggct ccccatattc ttgggaacag gagctgcagc 2520 atggcaggct ggtgttccag accagcaaac gccacgggga tgagtccttt tgcagccagt 2580 ctagtggcat cctgagcaga tcccccgtgg ggccttgtat tcagtctcag ctgcggaaga 2640 gtagactggg actgcagcca cagcagggac acctggcacg acggcagcag ggaaggtctg 2700 gcagtatccg ggctagagtg catcccacaa ctagaaggac cttcggcgtc gagccatcag 2760 gaagcggcca catcgacaac agcgcatcaa gctcctctag ttgcctgcat cagtcagccg 2820 tgagaaaggc cgcttacagc cacctgtcca catctaaaag gcactcaagc tccgggcatg 2880 ctgtggagct gcacaacatc cctccaaatt ctgcacgcag tcagtcagaa ggacccgtgt 2940 tcagctgctg gtggctgcag tttcggaact caaagccttg cagcgactat tgtctgagcc 3000 atattgtgaa tctgctggag gattggggcc cttgtaccga gcacggggaa caccatatca 3060 ggattccacg aacaccagca cgagtgactg gaggggtgtt cctggtggac aagaaccccc 3120 acaatactac cgagagccgg ctggtggtcg atttcagtca gttttcaaga ggcaacacaa 3180 gggtgtcatg gcccaaattc gccgtcccta atctgcagag tctgactaac ctgctgtcta 3240 gtaatctgag ctggctgtcc ctggacgtgt ccgcagcctt ttaccacctg cctctgcatc 3300 cagctgcaat gccccatctg ctggtggggt caagcggact gagtcgctac gtcgcccgac 3360 tgtcctctaa ctcacgcatc attaatcacc agcatggcac catgcagaac ctgcacgata 3420 gctgttcccg gaatctgtac gtgtctctgc tgctgctgta taagacattc ggcagaaaac 3480 tgcacctgta cagccatcct atcattctgg ggtttaggaa gatcccaatg ggagtgggac 3540 tgagcccctt cctgctggca cagtttacct ccgccatttg ctctgtggtc cgccgagcct 3600 tcccacactg tctggctttt tcctatatga acaatgtggt cctgggcgcc aaatccgtgc 3660 agcatctgga gtctctgttc acagctgtca ctaactttct gctgagcctg gggatccacc 3720 tgaacccaaa taagactaaa cgctgggggt acagcctgaa tttcatggga tatgtgattg 3780 gatcctgggg gaccctgcca caggagcaca tcgtgcagaa gatcaaggaa tgctttcgga 3840 agctgcccgt caacagacct atcgactgga aagtgtgcca gcggattgtc ggactgctgg 3900 gcttcgccgc tccctttacc cagtgcgggt acccagcact gatgcccctg tatgcctgta 3960 tccagtctaa gcaggctttc acctttagtc ctacatacaa ggcattcctg tgcaaacagt 4020 acctgaacct gtatccagtg gcaaggcagc gacctggact gtgccaggtc tttgcaaatg 4080 ccactcctac cggctggggg ctggctatcg gacatcagcg aatgcggggc acattcgtgg 4140 cccccctgcc tattcacact gctcagctgc tggcagcctg ctttgctaga tctaggagtg 4200 gagcaaagct gatcggcacc gacaatagtg tggtcctgtc aagaaaatac acatccttcc 4260 catggctgct gggatgtgct gcaaactgga ttctgagggg caccagcttc gtgtacgtcc 4320 cctcagccct gaatcctgct gacgatccat cccgcgggcg actgggactg taccgacctc 4380 tgctgagact gcccttcagg cctacaactg gccggacatc tctgtatgcc gattcaccaa 4440 gcgtgccctc acacctgcct gacagagtcc actttgcttc acccctgcac gtcgcttggc 4500 ggcctcca 4508 <210> 54 <211> 4508 <212> DNA <213> Artificial Sequence <220> <223> Pol coding sequence -IRES (EMCV)-PreS2.S-2A-preS1 coding sequence <400> 54 atggctcgac ctctgtgtac cctgctactc ctgatggcta ccctggctgg agctctggcc 60 agcatgcccc tgtcttacca gcactttaga aagcttctgc tgctggacga tgaagccggg 120 cctctggagg aagagctgcc aaggctggca gacgaggggc tgaaccggag agtggccgaa 180 gatctgaatc tgggaaacct gaacgtgagc atcccttgga ctcataaagt cggcaacttc 240 accgggctgt acagctccac agtgcctgtc ttcaatccag agtggcagac accatccttt 300 cccaacattc acctgcagga ggacatcatt aatagatgcg aacagttcgt gggacctctg 360 acagtcaacg aaaagaggcg cctgaaactg atcatgcctg ccaggtttta cccaaatgtg 420 actaagtatc tgccactgga taagggcatc aagccttact atccagagca cctggtgaac 480 cattacttcc agactagaca ctatctgcat accctgtgga aggccggaat cctgtacaaa 540 cgagaaacta cccggagtgc ttcattttgt ggctccccat attcttggga acaggagctg 600 cagcatggca ggctggtgtt ccagaccagc aaacgccacg gggatgagtc cttttgcagc 660 cagtctagtg gcatcctgag cagatccccc gtggggcctt gtattcagtc tcagctgcgg 720 aagagtagac tgggactgca gccacagcag ggacacctgg cacgacggca gcagggaagg 780 tctggcagta tccgggctag agtgcatccc acaactagaa ggaccttcgg cgtcgagcca 840 tcaggaagcg gccacatcga caacagcgca tcaagctcct ctagttgcct gcatcagtca 900 gccgtgagaa aggccgctta cagccacctg tccacatcta aaaggcactc aagctccggg 960 catgctgtgg agctgcacaa catccctcca aattctgcac gcagtcagtc agaaggaccc 1020 gtgttcagct gctggtggct gcagtttcgg aactcaaagc cttgcagcga ctattgtctg 1080 agccatattg tgaatctgct ggaggattgg ggcccttgta ccgagcacgg ggaacaccat 1140 atcaggattc cacgaacacc agcacgagtg actggagggg tgttcctggt ggacaagaac 1200 ccccacaata ctaccgagag ccggctggtg gtcgatttca gtcagttttc aagaggcaac 1260 acaagggtgt catggcccaa attcgccgtc cctaatctgc agagtctgac taacctgctg 1320 tctagtaatc tgagctggct gtccctggac gtgtccgcag ccttttacca cctgcctctg 1380 catccagctg caatgcccca tctgctggtg gggtcaagcg gactgagtcg ctacgtcgcc 1440 cgactgtcct ctaactcacg catcattaat caccagcatg gcaccatgca gaacctgcac 1500 gatagctgtt cccggaatct gtacgtgtct ctgctgctgc tgtataagac attcggcaga 1560 aaactgcacc tgtacagcca tcctatcatt ctggggttta ggaagatccc aatgggagtg 1620 ggactgagcc ccttcctgct ggcacagttt acctccgcca tttgctctgt ggtccgccga 1680 gccttcccac actgtctggc tttttcctat atgaacaatg tggtcctggg cgccaaatcc 1740 gtgcagcatc tggagtctct gttcacagct gtcactaact ttctgctgag cctggggatc 1800 cacctgaacc caaataagac taaacgctgg gggtacagcc tgaatttcat gggatatgtg 1860 attggatcct gggggaccct gccacaggag cacatcgtgc agaagatcaa ggaatgcttt 1920 cggaagctgc ccgtcaacag acctatcgac tggaaagtgt gccagcggat tgtcggactg 1980 ctgggcttcg ccgctccctt tacccagtgc gggtacccag cactgatgcc cctgtatgcc 2040 tgtatccagt ctaagcaggc tttcaccttt agtcctacat acaaggcatt cctgtgcaaa 2100 cagtacctga acctgtatcc agtggcaagg cagcgacctg gactgtgcca ggtctttgca 2160 aatgccactc ctaccggctg ggggctggct atcggacatc agcgaatgcg gggcacattc 2220 gtggcccccc tgcctattca cactgctcag ctgctggcag cctgctttgc tagatctagg 2280 agtggagcaa agctgatcgg caccgacaat agtgtggtcc tgtcaagaaa atacacatcc 2340 ttcccatggc tgctgggatg tgctgcaaac tggattctga ggggcaccag cttcgtgtac 2400 gtcccctcag ccctgaatcc tgctgacgat ccatcccgcg ggcgactggg actgtaccga 2460 cctctgctga gactgccctt caggcctaca actggccgga catctctgta tgccgattca 2520 ccaagcgtgc cctcacacct gcctgacaga gtccactttg cttcacccct gcacgtcgct 2580 tggcggcctc cataagcccc tctccctccc ccccccctaa cgttactggc cgaagccgct 2640 tggaataagg ccggtgtgcg tttgtctata tgttattttc caccatattg ccgtcttttg 2700 gcaatgtgag ggcccggaaa cctggccctg tcttcttgac gagcattcct aggggtcttt 2760 cccctctcgc caaaggaatg caaggtctgt tgaatgtcgt gaaggaagca gttcctctgg 2820 aagcttcttg aagacaaaca acgtctgtag cgaccctttg caggcagcgg aaccccccac 2880 ctggcgacag gtgcctctgc ggccaaaagc cacgtgtata agatacacct gcaaaggcgg 2940 cacaacccca gtgccacgtt gtgagttgga tagttgtgga aagagtcaaa tggctctcct 3000 caagcgtatt caacaagggg ctgaaggatg cccagaaggt accccattgt atgggatctg 3060 atctggggcc tcggtgcaca tgctttacat gtgtttagtc gaggttaaaa aacgtctagg 3120 ccccccgaac cacggggacg tggttttcct ttgaaaaaca cgatgataat atggccacaa 3180 ccatgcagtg gaactcaact actttccatc agacccttca ggaccctaga gtgcgcgggc 3240 tgtactttcc tgctggggga agcagtagcg ggaccgttaa tccagtacct acgaccgcct 3300 ctcccatatc ttctatcttt agtaggactg gtgaccctgc tcccaacatg gagaatatca 3360 cctccgggtt tctgggccca ctcctggtcc ttcaggccgg attcttcctg ctgactcgaa 3420 tcctcaccat accccagagc ctggacagct ggtggacaag cctgaatttt ctgggaggaa 3480 ctcctgtatg cctgggacaa aattcacagt cccctacaag taaccattca ccgacaagtt 3540 gtcctcccat ctgtcccgga tacaggtgga tgtgcctgcg aaggttcatc atcttcctct 3600 tcatcctctt gctttgcctt attttcctcc tggttcttct ggactatcag ggcatgctgc 3660 ctgtgtgccc actgatacca ggatctagta ctaccagcac aggcccgtgt aagacctgta 3720 caattccagc acaagggact agtatgttcc cctcctgctg ttgtactaag ccaagcgacg 3780 gtaattgcac gtgtatccca atcccgtcct cctgggcgtt tgccaagtac ctctgggaat 3840 gggcctcagt cagattttca tggcttagtc ttttggtgcc gttcgtgcag tggtttgtgg 3900 gactctctcc gactgtgtgg ctcagcgtga tctggatgat gtggtactgg ggcccttccc 3960 tttacaacat actgtctcca ttccttcccc tgctgccaat cttcttttgc ctgtgggtct 4020 atattgggtc cggagcgact aacttttccc tgctgaaaca agcgggtgac gtcgaagaga 4080 atccgggacc tatggctagg cccctgtgta cacttttgct cctgatggcc accctcgctg 4140 gagctctggc aagcggtgga tggagctcaa agccgcggaa agggatgggt actaacctgt 4200 ccgtaccaaa tcccctggga ttttttccag accaccaact cgatcctgct tttggcgcaa 4260 attccaacaa tcccgactgg gactttaacc ctaacaagga ccactggcct gatgccaaca 4320 aggtgggggc aggagccttt ggtcccggct tcaccccacc ccatggaggt cttttgggat 4380 ggtcaccaca ggcccagggc atcctgacca ctgtccctgc tgctccaccg ccagcttcta 4440 ctaatcgaca gagcgggagg cagccgaccc ccctgagtcc ccccctgcgg gatacccacc 4500 ctcaggca 4508 <210> 55 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> 5' UTR <400> 55 ataggcggcg catgagagaa gcccagacca attacctacc caaa 44 <210> 56 <211> 195 <212> DNA <213> Artificial Sequence <220> <223> 5' replication sequence <400> 56 taggagaaag ttcacgttga catcgaggaa gacagcccat tcctcagagc tttgcagcgg 60 agcttcccgc agtttgaggt agaagccaag caggtcactg ataatgacca tgctaatgcc 120 agagcgtttt cgcatctggc ttcaaaactg atcgaaacgg aggtggaccc atccgacacg 180 atccttgaca ttgga 195 <210> 57 <211> 142 <212> DNA <213> Artificial Sequence <220> <223> DLP capsid enhancer <400> 57 atagtcagca tagtacattt catctgacta atactacaac accaccacca tgaatagagg 60 attctttaac atgctcggcc gccgcccctt cccggccccc actgccatgt ggaggccgcg 120 gagaaggagg caggcggccc cg 142 <210> 58 <211> 1602 <212> DNA <213> Artificial Sequence <220> <223> nsp1 coding sequence <400> 58 gagaaagttc acgttgacat cgaggaagac agcccattcc tcagagcttt gcagcggagc 60 ttcccgcagt ttgaggtaga agccaagcag gtcactgata atgaccatgc taatgccaga 120 gcgttttcgc atctggcttc aaaactgatc gaaacggagg tggacccatc cgacacgatc 180 cttgacattg gaagtgcgcc cgcccgcaga atgtattcta agcacaagta tcattgtatc 240 tgtccgatga gatgtgcgga agatccggac agattgtata agtatgcaac taagctgaag 300 aaaaactgta aggaaataac tgataaggaa ttggacaaga aaatgaagga gctcgccgcc 360 gtcatgagcg accctgacct ggaaactgag actatgtgcc tccacgacga cgagtcgtgt 420 cgctacgaag ggcaagtcgc tgtttaccag gatgtatacg cggttgacgg accgacaagt 480 ctctatcacc aagccaataa gggagttaga gtcgcctact ggataggctt tgacaccacc 540 ccttttatgt ttaagaactt ggctggagca tatccatcat actctaccaa ctgggccgac 600 gaaaccgtgt taacggctcg taacataggc ctatgcagct ctgacgttat ggagcggtca 660 cgtagaggga tgtccattct tagaaagaag tatttgaaac catccaacaa tgttctattc 720 tctgttggct cgaccatcta ccacgagaag agggacttac tgaggagctg gcacctgccg 780 tctgtatttc acttacgtgg caagcaaaat tacacatgtc ggtgtgagac tatagttagt 840 tgcgacgggt acgtcgttaa aagaatagct atcagtccag gcctgtatgg gaagccttca 900 ggctatgctg ctacgatgca ccgcgaggga ttcttgtgct gcaaagtgac agacacattg 960 aacggggaga gggtctcttt tcccgtgtgc acgtatgtgc cagctacatt gtgtgaccaa 1020 atgactggca tactggcaac agatgtcagt gcggacgacg cgcaaaaact gctggttggg 1080 ctcaaccagc gtatagtcgt caacggtcgc acccagagaa acaccaatac catgaaaaat 1140 taccttttgc ccgtagtggc ccaggcattt gctaggtggg caaaggaata taaggaagat 1200 caagaagatg aaaggccact aggactacga gatagacagt tagtcatggg gtgttgttgg 1260 gcttttagaa ggcacaagat aacatctatt tataagcgcc cggataccca aaccatcatc 1320 aaagtgaaca gcgatttcca ctcattcgtg ctgcccagga taggcagtaa cacattggag 1380 atcgggctga gaacaagaat caggaaaatg ttagaggagc acaaggagcc gtcacctctc 1440 attaccgccg aggacgtaca agaagctaag tgcgcagccg atgaggctaa ggaggtgcgt 1500 gaagccgagg agttgcgcgc agctctacca cctttggcag ctgatgttga ggagcccact 1560 ctggaagccg atgtcgactt gatgttacaa gaggctgggg cc 1602 <210> 59 <211> 2382 <212> DNA <213> Artificial Sequence <220> <223> nsp2 coding sequence <400> 59 ggctcagtgg agacacctcg tggcttgata aaggttacca gctacgatgg cgaggacaag 60 atcggctctt acgctgtgct ttctccgcag gctgtactca agagtgaaaa attatcttgc 120 atccaccctc tcgctgaaca agtcatagtg ataacacact ctggccgaaa agggcgttat 180 gccgtggaac cataccatgg taaagtagtg gtgccagagg gacatgcaat acccgtccag 240 gactttcaag ctctgagtga aagtgccacc attgtgtaca acgaacgtga gttcgtaaac 300 aggtacctgc accatattgc cacacatgga ggagcgctga acactgatga agaatattac 360 aaaactgtca agcccagcga gcacgacggc gaatacctgt acgacatcga caggaaacag 420 tgcgtcaaga aagaactagt cactgggcta gggctcacag gcgagctggt ggatcctccc 480 ttccatgaat tcgcctacga gagtctgaga acacgaccag ccgctcctta ccaagtacca 540 accatagggg tgtatggcgt gccaggatca ggcaagtctg gcatcattaa aagcgcagtc 600 accaaaaaag atctagtggt gagcgccaag aaagaaaact gtgcagaaat tataagggac 660 gtcaagaaaa tgaaagggct ggacgtcaat gccagaactg tggactcagt gctcttgaat 720 ggatgcaaac accccgtaga gaccctgtat attgacgaag cttttgcttg tcatgcaggt 780 actctcagag cgctcatagc cattataaga cctaaaaagg cagtgctctg cggggatccc 840 aaacagtgcg gtttttttaa catgatgtgc ctgaaagtgc attttaacca cgagatttgc 900 acacaagtct tccacaaaag catctctcgc cgttgcacta aatctgtgac ttcggtcgtc 960 tcaaccttgt tttacgacaa aaaaatgaga acgacgaatc cgaaagagac taagattgtg 1020 attgacacta ccggcagtac caaacctaag caggacgatc tcattctcac ttgtttcaga 1080 gggtgggtga agcagttgca aatagattac aaaggcaacg aaataatgac ggcagctgcc 1140 tctcaagggc tgacccgtaa aggtgtgtat gccgttcggt acaaggtgaa tgaaaatcct 1200 ctgtacgcac ccacctctga acatgtgaac gtcctactga cccgcacgga ggaccgcatc 1260 gtgtggaaaa cactagccgg cgacccatgg ataaaaacac tgactgccaa gtaccctggg 1320 aatttcactg ccacgataga ggagtggcaa gcagagcatg atgccatcat gaggcacatc 1380 ttggagagac cggaccctac cgacgtcttc cagaataagg caaacgtgtg ttgggccaag 1440 gctttagtgc cggtgctgaa gaccgctggc atagacatga ccactgaaca atggaacact 1500 gtggattatt ttgaaacgga caaagctcac tcagcagaga tagtattgaa ccaactatgc 1560 gtgaggttct ttggactcga tctggactcc ggtctatttt ctgcacccac tgttccgtta 1620 tccattagga ataatcactg ggataactcc ccgtcgccta acatgtacgg gctgaataaa 1680 gaagtggtcc gtcagctctc tcgcaggtac ccacaactgc ctcgggcagt tgccactgga 1740 agagtctatg acatgaacac tggtacactg cgcaattatg atccgcgcat aaacctagta 1800 cctgtaaaca gaagactgcc tcatgcttta gtcctccacc ataatgaaca cccacagagt 1860 gacttttctt cattcgtcag caaattgaag ggcagaactg tcctggtggt cggggaaaag 1920 ttgtccgtcc caggcaaaat ggttgactgg ttgtcagacc ggcctgaggc taccttcaga 1980 gctcggctgg atttaggcat cccaggtgat gtgcccaaat atgacataat atttgttaat 2040 gtgaggaccc catataaata ccatcactat cagcagtgtg aagaccatgc cattaagctt 2100 agcatgttga ccaagaaagc ttgtctgcat ctgaatcccg gcggaacctg tgtcagcata 2160 ggttatggtt acgctgacag ggccagcgaa agcatcattg gtgctatagc gcggcagttc 2220 aagttttccc gggtatgcaa accgaaatcc tcacttgaag agacggaagt tctgtttgta 2280 ttcattgggt acgatcgcaa ggcccgtacg cacaatcctt acaagctttc atcaaccttg 2340 accaacattt atacaggttc cagactccac gaagccggat gt 2382 <210> 60 <211> 1671 <212> DNA <213> Artificial Sequence <220> <223> nsp3 coding sequence <400> 60 gcaccctcat atcatgtggt gcgaggggat attgccacgg ccaccgaagg agtgattata 60 aatgctgcta acagcaaagg acaacctggc ggaggggtgt gcggagcgct gtataagaaa 120 ttcccggaaa gcttcgattt acagccgatc gaagtaggaa aagcgcgact ggtcaaaggt 180 gcagctaaac atatcattca tgccgtagga ccaaacttca acaaagtttc ggaggttgaa 240 ggtgacaaac agttggcaga ggcttatgag tccatcgcta agattgtcaa cgataacaat 300 tacaagtcag tagcgattcc actgttgtcc accggcatct tttccgggaa caaagatcga 360 ctaacccaat cattgaacca tttgctgaca gctttagaca ccactgatgc agatgtagcc 420 atatactgca gggacaagaa atgggaaatg actctcaagg aagcagtggc taggagagaa 480 gcagtggagg agatatgcat atccgacgac tcttcagtga cagaacctga tgcagagctg 540 gtgagggtgc atccgaagag ttctttggct ggaaggaagg gctacagcac aagcgatggc 600 aaaactttct catatttgga agggaccaag tttcaccagg cggccaagga tatagcagaa 660 attaatgcca tgtggcccgt tgcaacggag gccaatgagc aggtatgcat gtatatcctc 720 ggagaaagca tgagcagtat taggtcgaaa tgccccgtcg aagagtcgga agcctccaca 780 ccacctagca cgctgccttg cttgtgcatc catgccatga ctccagaaag agtacagcgc 840 ctaaaagcct cacgtccaga acaaattact gtgtgctcat cctttccatt gccgaagtat 900 agaatcactg gtgtgcagaa gatccaatgc tcccagccta tattgttctc accgaaagtg 960 cctgcgtata ttcatccaag gaagtatctc gtggaaacac caccggtaga cgagactccg 1020 gagccatcgg cagagaacca atccacagag gggacacctg aacaaccacc acttataacc 1080 gaggatgaga ccaggactag aacgcctgag ccgatcatca tcgaagagga agaagaggat 1140 agcataagtt tgctgtcaga tggcccgacc caccaggtgc tgcaagtcga ggcagacatt 1200 cacgggccgc cctctgtatc tagctcatcc tggtccattc ctcatgcatc cgactttgat 1260 gtggacagtt tatccatact tgacaccctg gagggagcta gcgtgaccag cggggcaacg 1320 tcagccgaga ctaactctta cttcgcaaag agtatggagt ttctggcgcg accggtgcct 1380 gcgcctcgaa cagtattcag gaaccctcca catcccgctc cgcgcacaag aacaccgtca 1440 cttgcaccca gcagggcctg ctcgagaacc agcctagttt ccaccccgcc aggcgtgaat 1500 agggtgatca ctagagagga gctcgaggcg cttaccccgt cacgcactcc tagcaggtcg 1560 gtctcgagaa ccagcctggt ctccaacccg ccaggcgtaa atagggtgat tacaagagag 1620 gagtttgagg cgttcgtagc acaacaacaa tgacggtttg atgcgggtgc a 1671 <210> 61 <211> 1821 <212> DNA <213> Artificial Sequence <220> <223> nsp4 coding sequence <400> 61 tacatctttt cctccgacac cggtcaaggg catttacaac aaaaatcagt aaggcaaacg 60 gtgctatccg aagtggtgtt ggagaggacc gaattggaga tttcgtatgc cccgcgcctc 120 gaccaagaaa aagaagaatt actacgcaag aaattacagt taaatcccac acctgctaac 180 agaagcagat accagtccag gaaggtggag aacatgaaag ccataacagc tagacgtatt 240 ctgcaaggcc tagggcatta tttgaaggca gaaggaaaag tggagtgcta ccgaaccctg 300 catcctgttc ctttgtattc atctagtgtg aaccgtgcct tttcaagccc caaggtcgca 360 gtggaagcct gtaacgccat gttgaaagag aactttccga ctgtggcttc ttactgtatt 420 attccagagt acgatgccta tttggacatg gttgacggag cttcatgctg cttagacact 480 gccagttttt gccctgcaaa gctgcgcagc tttccaaaga aacactccta tttggaaccc 540 acaatacgat cggcagtgcc ttcagcgatc cagaacacgc tccagaacgt cctggcagct 600 gccacaaaaa gaaattgcaa tgtcacgcaa atgagagaat tgcccgtatt ggattcggcg 660 gcctttaatg tggaatgctt caagaaatat gcgtgtaata atgaatattg ggaaacgttt 720 aaagaaaacc ccatcaggct tactgaagaa aacgtggtaa attacattac caaattaaaa 780 ggaccaaaag ctgctgctct ttttgcgaag acacataatt tgaatatgtt gcaggacata 840 ccaatggaca ggtttgtaat ggacttaaag agagacgtga aagtgactcc aggaacaaaa 900 catactgaag aacggcccaa ggtacaggtg atccaggctg ccgatccgct agcaacagcg 960 tatctgtgcg gaatccaccg agagctggtt aggagattaa atgcggtcct gcttccgaac 1020 attcatacac tgtttgatat gtcggctgaa gactttgacg ctattatagc cgagcacttc 1080 cagcctgggg attgtgttct ggaaactgac atcgcgtcgt ttgataaaag tgaggacgac 1140 gccatggctc tgaccgcgtt aatgattctg gaagacttag gtgtggacgc agagctgttg 1200 acgctgattg aggcggcttt cggcgaaatt tcatcaatac atttgcccac taaaactaaa 1260 tttaaattcg gagccatgat gaaatctgga atgttcctca cactgtttgt gaacacagtc 1320 attaacattg taatcgcaag cagagtgttg agagaacggc taaccggatc accatgtgca 1380 gcattcattg gagatgacaa tatcgtgaaa ggagtcaaat cggacaaatt aatggcagac 1440 aggtgcgcca cctggttgaa tatggaagtc aagattatag atgctgtggt gggcgagaaa 1500 gcgccttatt tctgtggagg gtttattttg tgtgactccg tgaccggcac agcgtgccgt 1560 gtggcagacc ccctaaaaag gctgtttaag cttggcaaac ctctggcagc agacgatgaa 1620 catgatgatg acaggagaag ggcattgcat gaagagtcaa cacgctggaa ccgagtgggt 1680 attctttcag agctgtgcaa ggcagtagaa tcaaggtatg aaaccgtagg aacttccatc 1740 atagttatgg ccatgactac tctagctagc agtgttaaat cattcagcta cctgagaggg 1800 gcccctataa ctctctacgg c 1821 <210> 62 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> 26S subgenomic promoter <400> 62 ctctctacgg ctaacctgaa tgga 24 <210> 63 <211> 117 <212> DNA <213> Artificial Sequence <220> <223> 3' UTR <400> 63 atacagcagc aattggcaag ctgcttacat agaactcgcg gcgattggca tgccgcttta 60 aaatttttat tttatttttc ttttcttttc cgaatcggat tttgttttta atatttc 117 <210> 64 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Poly Adenosine <400> 64 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 40 <210> 65 <211> 11338 <212> DNA <213> Artificial Sequence <220> <223> Core-2A-Pol Replicon <400> 65 ataggcggcg catgagagaa gcccagacca attacctacc caaataggag aaagttcacg 60 ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120 aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180 tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240 tagtcagcat agtacatttc atctgactaa tactacaaca ccaccaccat gaatagagga 300 ttctttaaca tgctcggccg ccgccccttc ccggccccca ctgccatgtg gaggccgcgg 360 agaaggaggc aggcggcccc gggaagcgga gctactaact tcagcctgct gaagcaggct 420 ggagacgtgg aggagaaccc tggacctgag aaagttcacg ttgacatcga ggaagacagc 480 ccattcctca gagctttgca gcggagcttc ccgcagtttg aggtagaagc caagcaggtc 540 actgataatg accatgctaa tgccagagcg ttttcgcatc tggcttcaaa actgatcgaa 600 acggaggtgg acccatccga cacgatcctt gacattggaa gtgcgcccgc ccgcagaatg 660 tattctaagc acaagtatca ttgtatctgt ccgatgagat gtgcggaaga tccggacaga 720 ttgtataagt atgcaactaa gctgaagaaa aactgtaagg aaataactga taaggaattg 780 gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc ctgacctgga aactgagact 840 atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc aagtcgctgt ttaccaggat 900 gtatacgcgg ttgacggacc gacaagtctc tatcaccaag ccaataaggg agttagagtc 960 gcctactgga taggctttga caccacccct tttatgttta agaacttggc tggagcatat 1020 ccatcatact ctaccaactg ggccgacgaa accgtgttaa cggctcgtaa cataggccta 1080 tgcagctctg acgttatgga gcggtcacgt agagggatgt ccattcttag aaagaagtat 1140 ttgaaaccat ccaacaatgt tctattctct gttggctcga ccatctacca cgagaagagg 1200 gacttactga ggagctggca cctgccgtct gtatttcact tacgtggcaa gcaaaattac 1260 acatgtcggt gtgagactat agttagttgc gacgggtacg tcgttaaaag aatagctatc 1320 agtccaggcc tgtatgggaa gccttcaggc tatgctgcta cgatgcaccg cgagggattc 1380 ttgtgctgca aagtgacaga cacattgaac ggggagaggg tctcttttcc cgtgtgcacg 1440 tatgtgccag ctacattgtg tgaccaaatg actggcatac tggcaacaga tgtcagtgcg 1500 gacgacgcgc aaaaactgct ggttgggctc aaccagcgta tagtcgtcaa cggtcgcacc 1560 cagagaaaca ccaataccat gaaaaattac cttttgcccg tagtggccca ggcatttgct 1620 aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa ggccactagg actacgagat 1680 agacagttag tcatggggtg ttgttgggct tttagaaggc acaagataac atctatttat 1740 aagcgcccgg atacccaaac catcatcaaa gtgaacagcg atttccactc attcgtgctg 1800 cccaggatag gcagtaacac attggagatc gggctgagaa caagaatcag gaaaatgtta 1860 gaggagcaca aggagccgtc acctctcatt accgccgagg acgtacaaga agctaagtgc 1920 gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt tgcgcgcagc tctaccacct 1980 ttggcagctg atgttgagga gcccactctg gaagccgatg tcgacttgat gttacaagag 2040 gctggggccg gctcagtgga gacacctcgt ggcttgataa aggttaccag ctacgatggc 2100 gaggacaaga tcggctctta cgctgtgctt tctccgcagg ctgtactcaa gagtgaaaaa 2160 ttatcttgca tccaccctct cgctgaacaa gtcatagtga taacacactc tggccgaaaa 2220 gggcgttatg ccgtggaacc ataccatggt aaagtagtgg tgccagaggg acatgcaata 2280 cccgtccagg actttcaagc tctgagtgaa agtgccacca ttgtgtacaa cgaacgtgag 2340 ttcgtaaaca ggtacctgca ccatattgcc acacatggag gagcgctgaa cactgatgaa 2400 gaatattaca aaactgtcaa gcccagcgag cacgacggcg aatacctgta cgacatcgac 2460 aggaaacagt gcgtcaagaa agaactagtc actgggctag ggctcacagg cgagctggtg 2520 gatcctccct tccatgaatt cgcctacgag agtctgagaa cacgaccagc cgctccttac 2580 caagtaccaa ccataggggt gtatggcgtg ccaggatcag gcaagtctgg catcattaaa 2640 agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga aagaaaactg tgcagaaatt 2700 ataagggacg tcaagaaaat gaaagggctg gacgtcaatg ccagaactgt ggactcagtg 2760 ctcttgaatg gatgcaaaca ccccgtagag accctgtata ttgacgaagc ttttgcttgt 2820 catgcaggta ctctcagagc gctcatagcc attataagac ctaaaaaggc agtgctctgc 2880 ggggatccca aacagtgcgg tttttttaac atgatgtgcc tgaaagtgca ttttaaccac 2940 gagatttgca cacaagtctt ccacaaaagc atctctcgcc gttgcactaa atctgtgact 3000 tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa cgacgaatcc gaaagagact 3060 aagattgtga ttgacactac cggcagtacc aaacctaagc aggacgatct cattctcact 3120 tgtttcagag ggtgggtgaa gcagttgcaa atagattaca aaggcaacga aataatgacg 3180 gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg ccgttcggta caaggtgaat 3240 gaaaatcctc tgtacgcacc cacctctgaa catgtgaacg tcctactgac ccgcacggag 3300 gaccgcatcg tgtggaaaac actagccggc gacccatgga taaaaacact gactgccaag 3360 taccctggga atttcactgc cacgatagag gagtggcaag cagagcatga tgccatcatg 3420 aggcacatct tggagagacc ggaccctacc gacgtcttcc agaataaggc aaacgtgtgt 3480 tgggccaagg ctttagtgcc ggtgctgaag accgctggca tagacatgac cactgaacaa 3540 tggaacactg tggattattt tgaaacggac aaagctcact cagcagagat agtattgaac 3600 caactatgcg tgaggttctt tggactcgat ctggactccg gtctattttc tgcacccact 3660 gttccgttat ccattaggaa taatcactgg gataactccc cgtcgcctaa catgtacggg 3720 ctgaataaag aagtggtccg tcagctctct cgcaggtacc cacaactgcc tcgggcagtt 3780 gccactggaa gagtctatga catgaacact ggtacactgc gcaattatga tccgcgcata 3840 aacctagtac ctgtaaacag aagactgcct catgctttag tcctccacca taatgaacac 3900 ccacagagtg acttttcttc attcgtcagc aaattgaagg gcagaactgt cctggtggtc 3960 ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt tgtcagaccg gcctgaggct 4020 accttcagag ctcggctgga tttaggcatc ccaggtgatg tgcccaaata tgacataata 4080 tttgttaatg tgaggacccc atataaatac catcactatc agcagtgtga agaccatgcc 4140 attaagctta gcatgttgac caagaaagct tgtctgcatc tgaatcccgg cggaacctgt 4200 gtcagcatag gttatggtta cgctgacagg gccagcgaaa gcatcattgg tgctatagcg 4260 cggcagttca agttttcccg ggtatgcaaa ccgaaatcct cacttgaaga gacggaagtt 4320 ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc acaatcctta caagctttca 4380 tcaaccttga ccaacattta tacaggttcc agactccacg aagccggatg tgcaccctca 4440 tatcatgtgg tgcgagggga tattgccacg gccaccgaag gagtgattat aaatgctgct 4500 aacagcaaag gacaacctgg cggaggggtg tgcggagcgc tgtataagaa attcccggaa 4560 agcttcgatt tacagccgat cgaagtagga aaagcgcgac tggtcaaagg tgcagctaaa 4620 catatcattc atgccgtagg accaaacttc aacaaagttt cggaggttga aggtgacaaa 4680 cagttggcag aggcttatga gtccatcgct aagattgtca acgataacaa ttacaagtca 4740 gtagcgattc cactgttgtc caccggcatc ttttccggga acaaagatcg actaacccaa 4800 tcattgaacc atttgctgac agctttagac accactgatg cagatgtagc catatactgc 4860 agggacaaga aatgggaaat gactctcaag gaagcagtgg ctaggagaga agcagtggag 4920 gagatatgca tatccgacga ctcttcagtg acagaacctg atgcagagct ggtgagggtg 4980 catccgaaga gttctttggc tggaaggaag ggctacagca caagcgatgg caaaactttc 5040 tcatatttgg aagggaccaa gtttcaccag gcggccaagg atatagcaga aattaatgcc 5100 atgtggcccg ttgcaacgga ggccaatgag caggtatgca tgtatatcct cggagaaagc 5160 atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg aagcctccac accacctagc 5220 acgctgcctt gcttgtgcat ccatgccatg actccagaaa gagtacagcg cctaaaagcc 5280 tcacgtccag aacaaattac tgtgtgctca tcctttccat tgccgaagta tagaatcact 5340 ggtgtgcaga agatccaatg ctcccagcct atattgttct caccgaaagt gcctgcgtat 5400 attcatccaa ggaagtatct cgtggaaaca ccaccggtag acgagactcc ggagccatcg 5460 gcagagaacc aatccacaga ggggacacct gaacaaccac cacttataac cgaggatgag 5520 accaggacta gaacgcctga gccgatcatc atcgaagagg aagaagagga tagcataagt 5580 ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg aggcagacat tcacgggccg 5640 ccctctgtat ctagctcatc ctggtccatt cctcatgcat ccgactttga tgtggacagt 5700 ttatccatac ttgacaccct ggagggagct agcgtgacca gcggggcaac gtcagccgag 5760 actaactctt acttcgcaaa gagtatggag tttctggcgc gaccggtgcc tgcgcctcga 5820 acagtattca ggaaccctcc acatcccgct ccgcgcacaa gaacaccgtc acttgcaccc 5880 agcagggcct gctcgagaac cagcctagtt tccaccccgc caggcgtgaa tagggtgatc 5940 actagagagg agctcgaggc gcttaccccg tcacgcactc ctagcaggtc ggtctcgaga 6000 accagcctgg tctccaaccc gccaggcgta aatagggtga ttacaagaga ggagtttgag 6060 gcgttcgtag cacaacaaca atgacggttt gatgcgggtg catacatctt ttcctccgac 6120 accggtcaag ggcatttaca acaaaaatca gtaaggcaaa cggtgctatc cgaagtggtg 6180 ttggagagga ccgaattgga gatttcgtat gccccgcgcc tcgaccaaga aaaagaagaa 6240 ttactacgca agaaattaca gttaaatccc acacctgcta acagaagcag ataccagtcc 6300 aggaaggtgg agaacatgaa agccataaca gctagacgta ttctgcaagg cctagggcat 6360 tatttgaagg cagaaggaaa agtggagtgc taccgaaccc tgcatcctgt tcctttgtat 6420 tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg cagtggaagc ctgtaacgcc 6480 atgttgaaag agaactttcc gactgtggct tcttactgta ttattccaga gtacgatgcc 6540 tatttggaca tggttgacgg agcttcatgc tgcttagaca ctgccagttt ttgccctgca 6600 aagctgcgca gctttccaaa gaaacactcc tatttggaac ccacaatacg atcggcagtg 6660 ccttcagcga tccagaacac gctccagaac gtcctggcag ctgccacaaa aagaaattgc 6720 aatgtcacgc aaatgagaga attgcccgta ttggattcgg cggcctttaa tgtggaatgc 6780 ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt ttaaagaaaa ccccatcagg 6840 cttactgaag aaaacgtggt aaattacatt accaaattaa aaggaccaaa agctgctgct 6900 ctttttgcga agacacataa tttgaatatg ttgcaggaca taccaatgga caggtttgta 6960 atggacttaa agagagacgt gaaagtgact ccaggaacaa aacatactga agaacggccc 7020 aaggtacagg tgatccaggc tgccgatccg ctagcaacag cgtatctgtg cggaatccac 7080 cgagagctgg ttaggagatt aaatgcggtc ctgcttccga acattcatac actgtttgat 7140 atgtcggctg aagactttga cgctattata gccgagcact tccagcctgg ggattgtgtt 7200 ctggaaactg acatcgcgtc gtttgataaa agtgaggacg acgccatggc tctgaccgcg 7260 ttaatgattc tggaagactt aggtgtggac gcagagctgt tgacgctgat tgaggcggct 7320 ttcggcgaaa tttcatcaat acatttgccc actaaaacta aatttaaatt cggagccatg 7380 atgaaatctg gaatgttcct cacactgttt gtgaacacag tcattaacat tgtaatcgca 7440 agcagagtgt tgagagaacg gctaaccgga tcaccatgtg cagcattcat tggagatgac 7500 aatatcgtga aaggagtcaa atcggacaaa ttaatggcag acaggtgcgc cacctggttg 7560 aatatggaag tcaagattat agatgctgtg gtgggcgaga aagcgcctta tttctgtgga 7620 gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc gtgtggcaga ccccctaaaa 7680 aggctgttta agcttggcaa acctctggca gcagacgatg aacatgatga tgacaggaga 7740 agggcattgc atgaagagtc aacacgctgg aaccgagtgg gtattctttc agagctgtgc 7800 aaggcagtag aatcaaggta tgaaaccgta ggaacttcca tcatagttat ggccatgact 7860 actctagcta gcagtgttaa atcattcagc tacctgagag gggcccctat aactctctac 7920 ggctaacctg aatggactac gacatagtct agtccgccaa gatatcatgg ctcgacctct 7980 gtgtaccctg ctactcctga tggctaccct ggctggagct ctggccagcg acatcgaccc 8040 ttacaaggag ttcggcgcca gcgtggaact gctgtctttt ctgcccagtg atttctttcc 8100 ttccattcga gacctgctgg ataccgcctc tgctctgtat cgggaagccc tggagagccc 8160 agaacactgc tccccacacc ataccgctct gcgacaggca atcctgtgct ggggggagct 8220 gatgaacctg gccacatggg tgggatcgaa tctggaggac cccgcttcac gggaactggt 8280 ggtcagctac gtgaacgtca atatgggcct gaaaatccgc cagctgctgt ggttccatat 8340 tagctgcctg acttttggac gagagaccgt gctggaatac ctggtgtcct tcggcgtctg 8400 gattcgcact ccccctgctt atcgaccacc caacgcacca attctgtcca ccctgcccga 8460 gaccacagtg gtccgtcgcc gtggaagcgg agctactaac ttcagcctgc tgaagcaggc 8520 tggagacgtg gaggagaacc ctggacctat ggctcgacct ctgtgtaccc tgctactcct 8580 gatggctacc ctggctggag ctctggccag catgcccctg tcttaccagc actttagaaa 8640 gcttctgctg ctggacgatg aagccgggcc tctggaggaa gagctgccaa ggctggcaga 8700 cgaggggctg aaccggagag tggccgaaga tctgaatctg ggaaacctga acgtgagcat 8760 cccttggact cataaagtcg gcaacttcac cgggctgtac agctccacag tgcctgtctt 8820 caatccagag tggcagacac catcctttcc caacattcac ctgcaggagg acatcattaa 8880 tagatgcgaa cagttcgtgg gacctctgac agtcaacgaa aagaggcgcc tgaaactgat 8940 catgcctgcc aggttttacc caaatgtgac taagtatctg ccactggata agggcatcaa 9000 gccttactat ccagagcacc tggtgaacca ttacttccag actagacact atctgcatac 9060 cctgtggaag gccggaatcc tgtacaaacg agaaactacc cggagtgctt cattttgtgg 9120 ctccccatat tcttgggaac aggagctgca gcatggcagg ctggtgttcc agaccagcaa 9180 acgccacggg gatgagtcct tttgcagcca gtctagtggc atcctgagca gatcccccgt 9240 ggggccttgt attcagtctc agctgcggaa gagtagactg ggactgcagc cacagcaggg 9300 acacctggca cgacggcagc agggaaggtc tggcagtatc cgggctagag tgcatcccac 9360 aactagaagg accttcggcg tcgagccatc aggaagcggc cacatcgaca acagcgcatc 9420 aagctcctct agttgcctgc atcagtcagc cgtgagaaag gccgcttaca gccacctgtc 9480 cacatctaaa aggcactcaa gctccgggca tgctgtggag ctgcacaaca tccctccaaa 9540 ttctgcacgc agtcagtcag aaggacccgt gttcagctgc tggtggctgc agtttcggaa 9600 ctcaaagcct tgcagcgact attgtctgag ccatattgtg aatctgctgg aggattgggg 9660 cccttgtacc gagcacgggg aacaccatat caggattcca cgaacaccag cacgagtgac 9720 tggaggggtg ttcctggtgg acaagaaccc ccacaatact accgagagcc ggctggtggt 9780 cgatttcagt cagttttcaa gaggcaacac aagggtgtca tggcccaaat tcgccgtccc 9840 taatctgcag agtctgacta acctgctgtc tagtaatctg agctggctgt ccctggacgt 9900 gtccgcagcc ttttaccacc tgcctctgca tccagctgca atgccccatc tgctggtggg 9960 gtcaagcgga ctgagtcgct acgtcgcccg actgtcctct aactcacgca tcattaatca 10020 ccagcatggc accatgcaga acctgcacga tagctgttcc cggaatctgt acgtgtctct 10080 gctgctgctg tataagacat tcggcagaaa actgcacctg tacagccatc ctatcattct 10140 ggggtttagg aagatcccaa tgggagtggg actgagcccc ttcctgctgg cacagtttac 10200 ctccgccatt tgctctgtgg tccgccgagc cttcccacac tgtctggctt tttcctatat 10260 gaacaatgtg gtcctgggcg ccaaatccgt gcagcatctg gagtctctgt tcacagctgt 10320 cactaacttt ctgctgagcc tggggatcca cctgaaccca aataagacta aacgctgggg 10380 gtacagcctg aatttcatgg gatatgtgat tggatcctgg gggaccctgc cacaggagca 10440 catcgtgcag aagatcaagg aatgctttcg gaagctgccc gtcaacagac ctatcgactg 10500 gaaagtgtgc cagcggattg tcggactgct gggcttcgcc gctcccttta cccagtgcgg 10560 gtacccagca ctgatgcccc tgtatgcctg tatccagtct aagcaggctt tcacctttag 10620 tcctacatac aaggcattcc tgtgcaaaca gtacctgaac ctgtatccag tggcaaggca 10680 gcgacctgga ctgtgccagg tctttgcaaa tgccactcct accggctggg ggctggctat 10740 cggacatcag cgaatgcggg gcacattcgt ggcccccctg cctattcaca ctgctcagct 10800 gctggcagcc tgctttgcta gatctaggag tggagcaaag ctgatcggca ccgacaatag 10860 tgtggtcctg tcaagaaaat acacatcctt cccatggctg ctgggatgtg ctgcaaactg 10920 gattctgagg ggcaccagct tcgtgtacgt cccctcagcc ctgaatcctg ctgacgatcc 10980 atcccgcggg cgactgggac tgtaccgacc tctgctgaga ctgcccttca ggcctacaac 11040 tggccggaca tctctgtatg ccgattcacc aagcgtgccc tcacacctgc ctgacagagt 11100 ccactttgct tcacccctgc acgtcgcttg gcggcctcca taaggcgcgc cgtttaaacg 11160 gccggcctta attaagtaac gatacagcag caattggcaa gctgcttaca tagaactcgc 11220 ggcgattggc atgccgcttt aaaattttta ttttattttt cttttctttt ccgaatcgga 11280 ttttgttttt aatatttcaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaa 11338 <210> 66 <211> 11862 <212> DNA <213> Artificial Sequence <220> <223> Pol-IRES (EMCV)-Core Replicon <400> 66 ataggcggcg catgagagaa gcccagacca attacctacc caaataggag aaagttcacg 60 ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120 aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180 tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240 tagtcagcat agtacatttc atctgactaa tactacaaca ccaccaccat gaatagagga 300 ttctttaaca tgctcggccg ccgccccttc ccggccccca ctgccatgtg gaggccgcgg 360 agaaggaggc aggcggcccc gggaagcgga gctactaact tcagcctgct gaagcaggct 420 ggagacgtgg aggagaaccc tggacctgag aaagttcacg ttgacatcga ggaagacagc 480 ccattcctca gagctttgca gcggagcttc ccgcagtttg aggtagaagc caagcaggtc 540 actgataatg accatgctaa tgccagagcg ttttcgcatc tggcttcaaa actgatcgaa 600 acggaggtgg acccatccga cacgatcctt gacattggaa gtgcgcccgc ccgcagaatg 660 tattctaagc acaagtatca ttgtatctgt ccgatgagat gtgcggaaga tccggacaga 720 ttgtataagt atgcaactaa gctgaagaaa aactgtaagg aaataactga taaggaattg 780 gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc ctgacctgga aactgagact 840 atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc aagtcgctgt ttaccaggat 900 gtatacgcgg ttgacggacc gacaagtctc tatcaccaag ccaataaggg agttagagtc 960 gcctactgga taggctttga caccacccct tttatgttta agaacttggc tggagcatat 1020 ccatcatact ctaccaactg ggccgacgaa accgtgttaa cggctcgtaa cataggccta 1080 tgcagctctg acgttatgga gcggtcacgt agagggatgt ccattcttag aaagaagtat 1140 ttgaaaccat ccaacaatgt tctattctct gttggctcga ccatctacca cgagaagagg 1200 gacttactga ggagctggca cctgccgtct gtatttcact tacgtggcaa gcaaaattac 1260 acatgtcggt gtgagactat agttagttgc gacgggtacg tcgttaaaag aatagctatc 1320 agtccaggcc tgtatgggaa gccttcaggc tatgctgcta cgatgcaccg cgagggattc 1380 ttgtgctgca aagtgacaga cacattgaac ggggagaggg tctcttttcc cgtgtgcacg 1440 tatgtgccag ctacattgtg tgaccaaatg actggcatac tggcaacaga tgtcagtgcg 1500 gacgacgcgc aaaaactgct ggttgggctc aaccagcgta tagtcgtcaa cggtcgcacc 1560 cagagaaaca ccaataccat gaaaaattac cttttgcccg tagtggccca ggcatttgct 1620 aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa ggccactagg actacgagat 1680 agacagttag tcatggggtg ttgttgggct tttagaaggc acaagataac atctatttat 1740 aagcgcccgg atacccaaac catcatcaaa gtgaacagcg atttccactc attcgtgctg 1800 cccaggatag gcagtaacac attggagatc gggctgagaa caagaatcag gaaaatgtta 1860 gaggagcaca aggagccgtc acctctcatt accgccgagg acgtacaaga agctaagtgc 1920 gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt tgcgcgcagc tctaccacct 1980 ttggcagctg atgttgagga gcccactctg gaagccgatg tcgacttgat gttacaagag 2040 gctggggccg gctcagtgga gacacctcgt ggcttgataa aggttaccag ctacgatggc 2100 gaggacaaga tcggctctta cgctgtgctt tctccgcagg ctgtactcaa gagtgaaaaa 2160 ttatcttgca tccaccctct cgctgaacaa gtcatagtga taacacactc tggccgaaaa 2220 gggcgttatg ccgtggaacc ataccatggt aaagtagtgg tgccagaggg acatgcaata 2280 cccgtccagg actttcaagc tctgagtgaa agtgccacca ttgtgtacaa cgaacgtgag 2340 ttcgtaaaca ggtacctgca ccatattgcc acacatggag gagcgctgaa cactgatgaa 2400 gaatattaca aaactgtcaa gcccagcgag cacgacggcg aatacctgta cgacatcgac 2460 aggaaacagt gcgtcaagaa agaactagtc actgggctag ggctcacagg cgagctggtg 2520 gatcctccct tccatgaatt cgcctacgag agtctgagaa cacgaccagc cgctccttac 2580 caagtaccaa ccataggggt gtatggcgtg ccaggatcag gcaagtctgg catcattaaa 2640 agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga aagaaaactg tgcagaaatt 2700 ataagggacg tcaagaaaat gaaagggctg gacgtcaatg ccagaactgt ggactcagtg 2760 ctcttgaatg gatgcaaaca ccccgtagag accctgtata ttgacgaagc ttttgcttgt 2820 catgcaggta ctctcagagc gctcatagcc attataagac ctaaaaaggc agtgctctgc 2880 ggggatccca aacagtgcgg tttttttaac atgatgtgcc tgaaagtgca ttttaaccac 2940 gagatttgca cacaagtctt ccacaaaagc atctctcgcc gttgcactaa atctgtgact 3000 tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa cgacgaatcc gaaagagact 3060 aagattgtga ttgacactac cggcagtacc aaacctaagc aggacgatct cattctcact 3120 tgtttcagag ggtgggtgaa gcagttgcaa atagattaca aaggcaacga aataatgacg 3180 gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg ccgttcggta caaggtgaat 3240 gaaaatcctc tgtacgcacc cacctctgaa catgtgaacg tcctactgac ccgcacggag 3300 gaccgcatcg tgtggaaaac actagccggc gacccatgga taaaaacact gactgccaag 3360 taccctggga atttcactgc cacgatagag gagtggcaag cagagcatga tgccatcatg 3420 aggcacatct tggagagacc ggaccctacc gacgtcttcc agaataaggc aaacgtgtgt 3480 tgggccaagg ctttagtgcc ggtgctgaag accgctggca tagacatgac cactgaacaa 3540 tggaacactg tggattattt tgaaacggac aaagctcact cagcagagat agtattgaac 3600 caactatgcg tgaggttctt tggactcgat ctggactccg gtctattttc tgcacccact 3660 gttccgttat ccattaggaa taatcactgg gataactccc cgtcgcctaa catgtacggg 3720 ctgaataaag aagtggtccg tcagctctct cgcaggtacc cacaactgcc tcgggcagtt 3780 gccactggaa gagtctatga catgaacact ggtacactgc gcaattatga tccgcgcata 3840 aacctagtac ctgtaaacag aagactgcct catgctttag tcctccacca taatgaacac 3900 ccacagagtg acttttcttc attcgtcagc aaattgaagg gcagaactgt cctggtggtc 3960 ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt tgtcagaccg gcctgaggct 4020 accttcagag ctcggctgga tttaggcatc ccaggtgatg tgcccaaata tgacataata 4080 tttgttaatg tgaggacccc atataaatac catcactatc agcagtgtga agaccatgcc 4140 attaagctta gcatgttgac caagaaagct tgtctgcatc tgaatcccgg cggaacctgt 4200 gtcagcatag gttatggtta cgctgacagg gccagcgaaa gcatcattgg tgctatagcg 4260 cggcagttca agttttcccg ggtatgcaaa ccgaaatcct cacttgaaga gacggaagtt 4320 ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc acaatcctta caagctttca 4380 tcaaccttga ccaacattta tacaggttcc agactccacg aagccggatg tgcaccctca 4440 tatcatgtgg tgcgagggga tattgccacg gccaccgaag gagtgattat aaatgctgct 4500 aacagcaaag gacaacctgg cggaggggtg tgcggagcgc tgtataagaa attcccggaa 4560 agcttcgatt tacagccgat cgaagtagga aaagcgcgac tggtcaaagg tgcagctaaa 4620 catatcattc atgccgtagg accaaacttc aacaaagttt cggaggttga aggtgacaaa 4680 cagttggcag aggcttatga gtccatcgct aagattgtca acgataacaa ttacaagtca 4740 gtagcgattc cactgttgtc caccggcatc ttttccggga acaaagatcg actaacccaa 4800 tcattgaacc atttgctgac agctttagac accactgatg cagatgtagc catatactgc 4860 agggacaaga aatgggaaat gactctcaag gaagcagtgg ctaggagaga agcagtggag 4920 gagatatgca tatccgacga ctcttcagtg acagaacctg atgcagagct ggtgagggtg 4980 catccgaaga gttctttggc tggaaggaag ggctacagca caagcgatgg caaaactttc 5040 tcatatttgg aagggaccaa gtttcaccag gcggccaagg atatagcaga aattaatgcc 5100 atgtggcccg ttgcaacgga ggccaatgag caggtatgca tgtatatcct cggagaaagc 5160 atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg aagcctccac accacctagc 5220 acgctgcctt gcttgtgcat ccatgccatg actccagaaa gagtacagcg cctaaaagcc 5280 tcacgtccag aacaaattac tgtgtgctca tcctttccat tgccgaagta tagaatcact 5340 ggtgtgcaga agatccaatg ctcccagcct atattgttct caccgaaagt gcctgcgtat 5400 attcatccaa ggaagtatct cgtggaaaca ccaccggtag acgagactcc ggagccatcg 5460 gcagagaacc aatccacaga ggggacacct gaacaaccac cacttataac cgaggatgag 5520 accaggacta gaacgcctga gccgatcatc atcgaagagg aagaagagga tagcataagt 5580 ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg aggcagacat tcacgggccg 5640 ccctctgtat ctagctcatc ctggtccatt cctcatgcat ccgactttga tgtggacagt 5700 ttatccatac ttgacaccct ggagggagct agcgtgacca gcggggcaac gtcagccgag 5760 actaactctt acttcgcaaa gagtatggag tttctggcgc gaccggtgcc tgcgcctcga 5820 acagtattca ggaaccctcc acatcccgct ccgcgcacaa gaacaccgtc acttgcaccc 5880 agcagggcct gctcgagaac cagcctagtt tccaccccgc caggcgtgaa tagggtgatc 5940 actagagagg agctcgaggc gcttaccccg tcacgcactc ctagcaggtc ggtctcgaga 6000 accagcctgg tctccaaccc gccaggcgta aatagggtga ttacaagaga ggagtttgag 6060 gcgttcgtag cacaacaaca atgacggttt gatgcgggtg catacatctt ttcctccgac 6120 accggtcaag ggcatttaca acaaaaatca gtaaggcaaa cggtgctatc cgaagtggtg 6180 ttggagagga ccgaattgga gatttcgtat gccccgcgcc tcgaccaaga aaaagaagaa 6240 ttactacgca agaaattaca gttaaatccc acacctgcta acagaagcag ataccagtcc 6300 aggaaggtgg agaacatgaa agccataaca gctagacgta ttctgcaagg cctagggcat 6360 tatttgaagg cagaaggaaa agtggagtgc taccgaaccc tgcatcctgt tcctttgtat 6420 tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg cagtggaagc ctgtaacgcc 6480 atgttgaaag agaactttcc gactgtggct tcttactgta ttattccaga gtacgatgcc 6540 tatttggaca tggttgacgg agcttcatgc tgcttagaca ctgccagttt ttgccctgca 6600 aagctgcgca gctttccaaa gaaacactcc tatttggaac ccacaatacg atcggcagtg 6660 ccttcagcga tccagaacac gctccagaac gtcctggcag ctgccacaaa aagaaattgc 6720 aatgtcacgc aaatgagaga attgcccgta ttggattcgg cggcctttaa tgtggaatgc 6780 ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt ttaaagaaaa ccccatcagg 6840 cttactgaag aaaacgtggt aaattacatt accaaattaa aaggaccaaa agctgctgct 6900 ctttttgcga agacacataa tttgaatatg ttgcaggaca taccaatgga caggtttgta 6960 atggacttaa agagagacgt gaaagtgact ccaggaacaa aacatactga agaacggccc 7020 aaggtacagg tgatccaggc tgccgatccg ctagcaacag cgtatctgtg cggaatccac 7080 cgagagctgg ttaggagatt aaatgcggtc ctgcttccga acattcatac actgtttgat 7140 atgtcggctg aagactttga cgctattata gccgagcact tccagcctgg ggattgtgtt 7200 ctggaaactg acatcgcgtc gtttgataaa agtgaggacg acgccatggc tctgaccgcg 7260 ttaatgattc tggaagactt aggtgtggac gcagagctgt tgacgctgat tgaggcggct 7320 ttcggcgaaa tttcatcaat acatttgccc actaaaacta aatttaaatt cggagccatg 7380 atgaaatctg gaatgttcct cacactgttt gtgaacacag tcattaacat tgtaatcgca 7440 agcagagtgt tgagagaacg gctaaccgga tcaccatgtg cagcattcat tggagatgac 7500 aatatcgtga aaggagtcaa atcggacaaa ttaatggcag acaggtgcgc cacctggttg 7560 aatatggaag tcaagattat agatgctgtg gtgggcgaga aagcgcctta tttctgtgga 7620 gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc gtgtggcaga ccccctaaaa 7680 aggctgttta agcttggcaa acctctggca gcagacgatg aacatgatga tgacaggaga 7740 agggcattgc atgaagagtc aacacgctgg aaccgagtgg gtattctttc agagctgtgc 7800 aaggcagtag aatcaaggta tgaaaccgta ggaacttcca tcatagttat ggccatgact 7860 actctagcta gcagtgttaa atcattcagc tacctgagag gggcccctat aactctctac 7920 ggctaacctg aatggactac gacatagtct agtccgccaa gatatcatgg ctcgacctct 7980 gtgtaccctg ctactcctga tggctaccct ggctggagct ctggccagca tgcccctgtc 8040 ttaccagcac tttagaaagc ttctgctgct ggacgatgaa gccgggcctc tggaggaaga 8100 gctgccaagg ctggcagacg aggggctgaa ccggagagtg gccgaagatc tgaatctggg 8160 aaacctgaac gtgagcatcc cttggactca taaagtcggc aacttcaccg ggctgtacag 8220 ctccacagtg cctgtcttca atccagagtg gcagacacca tcctttccca acattcacct 8280 gcaggaggac atcattaata gatgcgaaca gttcgtggga cctctgacag tcaacgaaaa 8340 gaggcgcctg aaactgatca tgcctgccag gttttaccca aatgtgacta agtatctgcc 8400 actggataag ggcatcaagc cttactatcc agagcacctg gtgaaccatt acttccagac 8460 tagacactat ctgcataccc tgtggaaggc cggaatcctg tacaaacgag aaactacccg 8520 gagtgcttca ttttgtggct ccccatattc ttgggaacag gagctgcagc atggcaggct 8580 ggtgttccag accagcaaac gccacgggga tgagtccttt tgcagccagt ctagtggcat 8640 cctgagcaga tcccccgtgg ggccttgtat tcagtctcag ctgcggaaga gtagactggg 8700 actgcagcca cagcagggac acctggcacg acggcagcag ggaaggtctg gcagtatccg 8760 ggctagagtg catcccacaa ctagaaggac cttcggcgtc gagccatcag gaagcggcca 8820 catcgacaac agcgcatcaa gctcctctag ttgcctgcat cagtcagccg tgagaaaggc 8880 cgcttacagc cacctgtcca catctaaaag gcactcaagc tccgggcatg ctgtggagct 8940 gcacaacatc cctccaaatt ctgcacgcag tcagtcagaa ggacccgtgt tcagctgctg 9000 gtggctgcag tttcggaact caaagccttg cagcgactat tgtctgagcc atattgtgaa 9060 tctgctggag gattggggcc cttgtaccga gcacggggaa caccatatca ggattccacg 9120 aacaccagca cgagtgactg gaggggtgtt cctggtggac aagaaccccc acaatactac 9180 cgagagccgg ctggtggtcg atttcagtca gttttcaaga ggcaacacaa gggtgtcatg 9240 gcccaaattc gccgtcccta atctgcagag tctgactaac ctgctgtcta gtaatctgag 9300 ctggctgtcc ctggacgtgt ccgcagcctt ttaccacctg cctctgcatc cagctgcaat 9360 gccccatctg ctggtggggt caagcggact gagtcgctac gtcgcccgac tgtcctctaa 9420 ctcacgcatc attaatcacc agcatggcac catgcagaac ctgcacgata gctgttcccg 9480 gaatctgtac gtgtctctgc tgctgctgta taagacattc ggcagaaaac tgcacctgta 9540 cagccatcct atcattctgg ggtttaggaa gatcccaatg ggagtgggac tgagcccctt 9600 cctgctggca cagtttacct ccgccatttg ctctgtggtc cgccgagcct tcccacactg 9660 tctggctttt tcctatatga acaatgtggt cctgggcgcc aaatccgtgc agcatctgga 9720 gtctctgttc acagctgtca ctaactttct gctgagcctg gggatccacc tgaacccaaa 9780 taagactaaa cgctgggggt acagcctgaa tttcatggga tatgtgattg gatcctgggg 9840 gaccctgcca caggagcaca tcgtgcagaa gatcaaggaa tgctttcgga agctgcccgt 9900 caacagacct atcgactgga aagtgtgcca gcggattgtc ggactgctgg gcttcgccgc 9960 tccctttacc cagtgcgggt acccagcact gatgcccctg tatgcctgta tccagtctaa 10020 gcaggctttc acctttagtc ctacatacaa ggcattcctg tgcaaacagt acctgaacct 10080 gtatccagtg gcaaggcagc gacctggact gtgccaggtc tttgcaaatg ccactcctac 10140 cggctggggg ctggctatcg gacatcagcg aatgcggggc acattcgtgg cccccctgcc 10200 tattcacact gctcagctgc tggcagcctg ctttgctaga tctaggagtg gagcaaagct 10260 gatcggcacc gacaatagtg tggtcctgtc aagaaaatac acatccttcc catggctgct 10320 gggatgtgct gcaaactgga ttctgagggg caccagcttc gtgtacgtcc cctcagccct 10380 gaatcctgct gacgatccat cccgcgggcg actgggactg taccgacctc tgctgagact 10440 gcccttcagg cctacaactg gccggacatc tctgtatgcc gattcaccaa gcgtgccctc 10500 acacctgcct gacagagtcc actttgcttc acccctgcac gtcgcttggc ggcctccata 10560 agcccctctc cctccccccc ccctaacgtt actggccgaa gccgcttgga ataaggccgg 10620 tgtgcgtttg tctatatgtt attttccacc atattgccgt cttttggcaa tgtgagggcc 10680 cggaaacctg gccctgtctt cttgacgagc attcctaggg gtctttcccc tctcgccaaa 10740 ggaatgcaag gtctgttgaa tgtcgtgaag gaagcagttc ctctggaagc ttcttgaaga 10800 caaacaacgt ctgtagcgac cctttgcagg cagcggaacc ccccacctgg cgacaggtgc 10860 ctctgcggcc aaaagccacg tgtataagat acacctgcaa aggcggcaca accccagtgc 10920 cacgttgtga gttggatagt tgtggaaaga gtcaaatggc tctcctcaag cgtattcaac 10980 aaggggctga aggatgccca gaaggtaccc cattgtatgg gatctgatct ggggcctcgg 11040 tgcacatgct ttacatgtgt ttagtcgagg ttaaaaaacg tctaggcccc ccgaaccacg 11100 gggacgtggt tttcctttga aaaacacgat gataatatgg ccacaaccat ggctcgacct 11160 ctgtgtaccc tgctactcct gatggctacc ctggctggag ctctggccag cgacatcgac 11220 ccttacaagg agttcggcgc cagcgtggaa ctgctgtctt ttctgcccag tgatttcttt 11280 ccttccattc gagacctgct ggataccgcc tctgctctgt atcgggaagc cctggagagc 11340 ccagaacact gctccccaca ccataccgct ctgcgacagg caatcctgtg ctggggggag 11400 ctgatgaacc tggccacatg ggtgggatcg aatctggagg accccgcttc acgggaactg 11460 gtggtcagct acgtgaacgt caatatgggc ctgaaaatcc gccagctgct gtggttccat 11520 attagctgcc tgacttttgg acgagagacc gtgctggaat acctggtgtc cttcggcgtc 11580 tggattcgca ctccccctgc ttatcgacca cccaacgcac caattctgtc caccctgccc 11640 gagaccacag tggtccgtcg ccgttaaggc gcgccgttta aacggccggc cttaattaag 11700 taacgataca gcagcaattg gcaagctgct tacatagaac tcgcggcgat tggcatgccg 11760 ctttaaaatt tttattttat ttttcttttc ttttccgaat cggattttgt ttttaatatt 11820 tcaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aa 11862 <210> 67 <211> 9490 <212> DNA <213> Artificial Sequence <220> <223> preS1-2A-PreS2.S Replicon <400> 67 ataggcggcg catgagagaa gcccagacca attacctacc caaataggag aaagttcacg 60 ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120 aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180 tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240 tagtcagcat agtacatttc atctgactaa tactacaaca ccaccaccat gaatagagga 300 ttctttaaca tgctcggccg ccgccccttc ccggccccca ctgccatgtg gaggccgcgg 360 agaaggaggc aggcggcccc gggaagcgga gctactaact tcagcctgct gaagcaggct 420 ggagacgtgg aggagaaccc tggacctgag aaagttcacg ttgacatcga ggaagacagc 480 ccattcctca gagctttgca gcggagcttc ccgcagtttg aggtagaagc caagcaggtc 540 actgataatg accatgctaa tgccagagcg ttttcgcatc tggcttcaaa actgatcgaa 600 acggaggtgg acccatccga cacgatcctt gacattggaa gtgcgcccgc ccgcagaatg 660 tattctaagc acaagtatca ttgtatctgt ccgatgagat gtgcggaaga tccggacaga 720 ttgtataagt atgcaactaa gctgaagaaa aactgtaagg aaataactga taaggaattg 780 gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc ctgacctgga aactgagact 840 atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc aagtcgctgt ttaccaggat 900 gtatacgcgg ttgacggacc gacaagtctc tatcaccaag ccaataaggg agttagagtc 960 gcctactgga taggctttga caccacccct tttatgttta agaacttggc tggagcatat 1020 ccatcatact ctaccaactg ggccgacgaa accgtgttaa cggctcgtaa cataggccta 1080 tgcagctctg acgttatgga gcggtcacgt agagggatgt ccattcttag aaagaagtat 1140 ttgaaaccat ccaacaatgt tctattctct gttggctcga ccatctacca cgagaagagg 1200 gacttactga ggagctggca cctgccgtct gtatttcact tacgtggcaa gcaaaattac 1260 acatgtcggt gtgagactat agttagttgc gacgggtacg tcgttaaaag aatagctatc 1320 agtccaggcc tgtatgggaa gccttcaggc tatgctgcta cgatgcaccg cgagggattc 1380 ttgtgctgca aagtgacaga cacattgaac ggggagaggg tctcttttcc cgtgtgcacg 1440 tatgtgccag ctacattgtg tgaccaaatg actggcatac tggcaacaga tgtcagtgcg 1500 gacgacgcgc aaaaactgct ggttgggctc aaccagcgta tagtcgtcaa cggtcgcacc 1560 cagagaaaca ccaataccat gaaaaattac cttttgcccg tagtggccca ggcatttgct 1620 aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa ggccactagg actacgagat 1680 agacagttag tcatggggtg ttgttgggct tttagaaggc acaagataac atctatttat 1740 aagcgcccgg atacccaaac catcatcaaa gtgaacagcg atttccactc attcgtgctg 1800 cccaggatag gcagtaacac attggagatc gggctgagaa caagaatcag gaaaatgtta 1860 gaggagcaca aggagccgtc acctctcatt accgccgagg acgtacaaga agctaagtgc 1920 gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt tgcgcgcagc tctaccacct 1980 ttggcagctg atgttgagga gcccactctg gaagccgatg tcgacttgat gttacaagag 2040 gctggggccg gctcagtgga gacacctcgt ggcttgataa aggttaccag ctacgatggc 2100 gaggacaaga tcggctctta cgctgtgctt tctccgcagg ctgtactcaa gagtgaaaaa 2160 ttatcttgca tccaccctct cgctgaacaa gtcatagtga taacacactc tggccgaaaa 2220 gggcgttatg ccgtggaacc ataccatggt aaagtagtgg tgccagaggg acatgcaata 2280 cccgtccagg actttcaagc tctgagtgaa agtgccacca ttgtgtacaa cgaacgtgag 2340 ttcgtaaaca ggtacctgca ccatattgcc acacatggag gagcgctgaa cactgatgaa 2400 gaatattaca aaactgtcaa gcccagcgag cacgacggcg aatacctgta cgacatcgac 2460 aggaaacagt gcgtcaagaa agaactagtc actgggctag ggctcacagg cgagctggtg 2520 gatcctccct tccatgaatt cgcctacgag agtctgagaa cacgaccagc cgctccttac 2580 caagtaccaa ccataggggt gtatggcgtg ccaggatcag gcaagtctgg catcattaaa 2640 agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga aagaaaactg tgcagaaatt 2700 ataagggacg tcaagaaaat gaaagggctg gacgtcaatg ccagaactgt ggactcagtg 2760 ctcttgaatg gatgcaaaca ccccgtagag accctgtata ttgacgaagc ttttgcttgt 2820 catgcaggta ctctcagagc gctcatagcc attataagac ctaaaaaggc agtgctctgc 2880 ggggatccca aacagtgcgg tttttttaac atgatgtgcc tgaaagtgca ttttaaccac 2940 gagatttgca cacaagtctt ccacaaaagc atctctcgcc gttgcactaa atctgtgact 3000 tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa cgacgaatcc gaaagagact 3060 aagattgtga ttgacactac cggcagtacc aaacctaagc aggacgatct cattctcact 3120 tgtttcagag ggtgggtgaa gcagttgcaa atagattaca aaggcaacga aataatgacg 3180 gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg ccgttcggta caaggtgaat 3240 gaaaatcctc tgtacgcacc cacctctgaa catgtgaacg tcctactgac ccgcacggag 3300 gaccgcatcg tgtggaaaac actagccggc gacccatgga taaaaacact gactgccaag 3360 taccctggga atttcactgc cacgatagag gagtggcaag cagagcatga tgccatcatg 3420 aggcacatct tggagagacc ggaccctacc gacgtcttcc agaataaggc aaacgtgtgt 3480 tgggccaagg ctttagtgcc ggtgctgaag accgctggca tagacatgac cactgaacaa 3540 tggaacactg tggattattt tgaaacggac aaagctcact cagcagagat agtattgaac 3600 caactatgcg tgaggttctt tggactcgat ctggactccg gtctattttc tgcacccact 3660 gttccgttat ccattaggaa taatcactgg gataactccc cgtcgcctaa catgtacggg 3720 ctgaataaag aagtggtccg tcagctctct cgcaggtacc cacaactgcc tcgggcagtt 3780 gccactggaa gagtctatga catgaacact ggtacactgc gcaattatga tccgcgcata 3840 aacctagtac ctgtaaacag aagactgcct catgctttag tcctccacca taatgaacac 3900 ccacagagtg acttttcttc attcgtcagc aaattgaagg gcagaactgt cctggtggtc 3960 ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt tgtcagaccg gcctgaggct 4020 accttcagag ctcggctgga tttaggcatc ccaggtgatg tgcccaaata tgacataata 4080 tttgttaatg tgaggacccc atataaatac catcactatc agcagtgtga agaccatgcc 4140 attaagctta gcatgttgac caagaaagct tgtctgcatc tgaatcccgg cggaacctgt 4200 gtcagcatag gttatggtta cgctgacagg gccagcgaaa gcatcattgg tgctatagcg 4260 cggcagttca agttttcccg ggtatgcaaa ccgaaatcct cacttgaaga gacggaagtt 4320 ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc acaatcctta caagctttca 4380 tcaaccttga ccaacattta tacaggttcc agactccacg aagccggatg tgcaccctca 4440 tatcatgtgg tgcgagggga tattgccacg gccaccgaag gagtgattat aaatgctgct 4500 aacagcaaag gacaacctgg cggaggggtg tgcggagcgc tgtataagaa attcccggaa 4560 agcttcgatt tacagccgat cgaagtagga aaagcgcgac tggtcaaagg tgcagctaaa 4620 catatcattc atgccgtagg accaaacttc aacaaagttt cggaggttga aggtgacaaa 4680 cagttggcag aggcttatga gtccatcgct aagattgtca acgataacaa ttacaagtca 4740 gtagcgattc cactgttgtc caccggcatc ttttccggga acaaagatcg actaacccaa 4800 tcattgaacc atttgctgac agctttagac accactgatg cagatgtagc catatactgc 4860 agggacaaga aatgggaaat gactctcaag gaagcagtgg ctaggagaga agcagtggag 4920 gagatatgca tatccgacga ctcttcagtg acagaacctg atgcagagct ggtgagggtg 4980 catccgaaga gttctttggc tggaaggaag ggctacagca caagcgatgg caaaactttc 5040 tcatatttgg aagggaccaa gtttcaccag gcggccaagg atatagcaga aattaatgcc 5100 atgtggcccg ttgcaacgga ggccaatgag caggtatgca tgtatatcct cggagaaagc 5160 atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg aagcctccac accacctagc 5220 acgctgcctt gcttgtgcat ccatgccatg actccagaaa gagtacagcg cctaaaagcc 5280 tcacgtccag aacaaattac tgtgtgctca tcctttccat tgccgaagta tagaatcact 5340 ggtgtgcaga agatccaatg ctcccagcct atattgttct caccgaaagt gcctgcgtat 5400 attcatccaa ggaagtatct cgtggaaaca ccaccggtag acgagactcc ggagccatcg 5460 gcagagaacc aatccacaga ggggacacct gaacaaccac cacttataac cgaggatgag 5520 accaggacta gaacgcctga gccgatcatc atcgaagagg aagaagagga tagcataagt 5580 ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg aggcagacat tcacgggccg 5640 ccctctgtat ctagctcatc ctggtccatt cctcatgcat ccgactttga tgtggacagt 5700 ttatccatac ttgacaccct ggagggagct agcgtgacca gcggggcaac gtcagccgag 5760 actaactctt acttcgcaaa gagtatggag tttctggcgc gaccggtgcc tgcgcctcga 5820 acagtattca ggaaccctcc acatcccgct ccgcgcacaa gaacaccgtc acttgcaccc 5880 agcagggcct gctcgagaac cagcctagtt tccaccccgc caggcgtgaa tagggtgatc 5940 actagagagg agctcgaggc gcttaccccg tcacgcactc ctagcaggtc ggtctcgaga 6000 accagcctgg tctccaaccc gccaggcgta aatagggtga ttacaagaga ggagtttgag 6060 gcgttcgtag cacaacaaca atgacggttt gatgcgggtg catacatctt ttcctccgac 6120 accggtcaag ggcatttaca acaaaaatca gtaaggcaaa cggtgctatc cgaagtggtg 6180 ttggagagga ccgaattgga gatttcgtat gccccgcgcc tcgaccaaga aaaagaagaa 6240 ttactacgca agaaattaca gttaaatccc acacctgcta acagaagcag ataccagtcc 6300 aggaaggtgg agaacatgaa agccataaca gctagacgta ttctgcaagg cctagggcat 6360 tatttgaagg cagaaggaaa agtggagtgc taccgaaccc tgcatcctgt tcctttgtat 6420 tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg cagtggaagc ctgtaacgcc 6480 atgttgaaag agaactttcc gactgtggct tcttactgta ttattccaga gtacgatgcc 6540 tatttggaca tggttgacgg agcttcatgc tgcttagaca ctgccagttt ttgccctgca 6600 aagctgcgca gctttccaaa gaaacactcc tatttggaac ccacaatacg atcggcagtg 6660 ccttcagcga tccagaacac gctccagaac gtcctggcag ctgccacaaa aagaaattgc 6720 aatgtcacgc aaatgagaga attgcccgta ttggattcgg cggcctttaa tgtggaatgc 6780 ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt ttaaagaaaa ccccatcagg 6840 cttactgaag aaaacgtggt aaattacatt accaaattaa aaggaccaaa agctgctgct 6900 ctttttgcga agacacataa tttgaatatg ttgcaggaca taccaatgga caggtttgta 6960 atggacttaa agagagacgt gaaagtgact ccaggaacaa aacatactga agaacggccc 7020 aaggtacagg tgatccaggc tgccgatccg ctagcaacag cgtatctgtg cggaatccac 7080 cgagagctgg ttaggagatt aaatgcggtc ctgcttccga acattcatac actgtttgat 7140 atgtcggctg aagactttga cgctattata gccgagcact tccagcctgg ggattgtgtt 7200 ctggaaactg acatcgcgtc gtttgataaa agtgaggacg acgccatggc tctgaccgcg 7260 ttaatgattc tggaagactt aggtgtggac gcagagctgt tgacgctgat tgaggcggct 7320 ttcggcgaaa tttcatcaat acatttgccc actaaaacta aatttaaatt cggagccatg 7380 atgaaatctg gaatgttcct cacactgttt gtgaacacag tcattaacat tgtaatcgca 7440 agcagagtgt tgagagaacg gctaaccgga tcaccatgtg cagcattcat tggagatgac 7500 aatatcgtga aaggagtcaa atcggacaaa ttaatggcag acaggtgcgc cacctggttg 7560 aatatggaag tcaagattat agatgctgtg gtgggcgaga aagcgcctta tttctgtgga 7620 gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc gtgtggcaga ccccctaaaa 7680 aggctgttta agcttggcaa acctctggca gcagacgatg aacatgatga tgacaggaga 7740 agggcattgc atgaagagtc aacacgctgg aaccgagtgg gtattctttc agagctgtgc 7800 aaggcagtag aatcaaggta tgaaaccgta ggaacttcca tcatagttat ggccatgact 7860 actctagcta gcagtgttaa atcattcagc tacctgagag gggcccctat aactctctac 7920 ggctaacctg aatggactac gacatagtct agtccgccaa gatatcatgg ctaggcccct 7980 gtgtacactt ttgctcctga tggccaccct cgctggagct ctggcaagcg gtggatggag 8040 ctcaaagccg cggaaaggga tgggtactaa cctgtccgta ccaaatcccc tgggattttt 8100 tccagaccac caactcgatc ctgcttttgg cgcaaattcc aacaatcccg actgggactt 8160 taaccctaac aaggaccact ggcctgatgc caacaaggtg ggggcaggag cctttggtcc 8220 cggcttcacc ccaccccatg gaggtctttt gggatggtca ccacaggccc agggcatcct 8280 gaccactgtc cctgctgctc caccgccagc ttctactaat cgacagagcg ggaggcagcc 8340 gacccccctg agtccccccc tgcgggatac ccaccctcag gcaggaagcg gagctactaa 8400 cttcagcctg ctgaagcagg ctggagacgt ggaggagaac cctggaccta tgcagtggaa 8460 ctcaactact ttccatcaga cccttcagga ccctagagtg cgcgggctgt actttcctgc 8520 tgggggaagc agtagcggga ccgttaatcc agtacctacg accgcctctc ccatatcttc 8580 tatctttagt aggactggtg accctgctcc caacatggag aatatcacct ccgggtttct 8640 gggcccactc ctggtccttc aggccggatt cttcctgctg actcgaatcc tcaccatacc 8700 ccagagcctg gacagctggt ggacaagcct gaattttctg ggaggaactc ctgtatgcct 8760 gggacaaaat tcacagtccc ctacaagtaa ccattcaccg acaagttgtc ctcccatctg 8820 tcccggatac aggtggatgt gcctgcgaag gttcatcatc ttcctcttca tcctcttgct 8880 ttgccttatt ttcctcctgg ttcttctgga ctatcagggc atgctgcctg tgtgcccact 8940 gataccagga tctagtacta ccagcacagg cccgtgtaag acctgtacaa ttccagcaca 9000 agggactagt atgttcccct cctgctgttg tactaagcca agcgacggta attgcacgtg 9060 tatcccaatc ccgtcctcct gggcgtttgc caagtacctc tgggaatggg cctcagtcag 9120 attttcatgg cttagtcttt tggtgccgtt cgtgcagtgg tttgtgggac tctctccgac 9180 tgtgtggctc agcgtgatct ggatgatgtg gtactggggc ccttcccttt acaacatact 9240 gtctccattc cttcccctgc tgccaatctt cttttgcctg tgggtctata tttaaggcgc 9300 gccgtttaaa cggccggcct taattaagta acgatacagc agcaattggc aagctgctta 9360 catagaactc gcggcgattg gcatgccgct ttaaaatttt tattttattt ttcttttctt 9420 ttccgaatcg gattttgttt ttaatatttc aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 9480 aaaaaaaaaa 9490 <210> 68 <211> 10174 <212> DNA <213> Artificial Sequence <220> <223> PreS2.S-IRES (EV71)-preS1 Replicon <400> 68 ataggcggcg catgagagaa gcccagacca attacctacc caaataggag aaagttcacg 60 ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120 aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180 tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240 tagtcagcat agtacatttc atctgactaa tactacaaca ccaccaccat gaatagagga 300 ttctttaaca tgctcggccg ccgccccttc ccggccccca ctgccatgtg gaggccgcgg 360 agaaggaggc aggcggcccc gggaagcgga gctactaact tcagcctgct gaagcaggct 420 ggagacgtgg aggagaaccc tggacctgag aaagttcacg ttgacatcga ggaagacagc 480 ccattcctca gagctttgca gcggagcttc ccgcagtttg aggtagaagc caagcaggtc 540 actgataatg accatgctaa tgccagagcg ttttcgcatc tggcttcaaa actgatcgaa 600 acggaggtgg acccatccga cacgatcctt gacattggaa gtgcgcccgc ccgcagaatg 660 tattctaagc acaagtatca ttgtatctgt ccgatgagat gtgcggaaga tccggacaga 720 ttgtataagt atgcaactaa gctgaagaaa aactgtaagg aaataactga taaggaattg 780 gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc ctgacctgga aactgagact 840 atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc aagtcgctgt ttaccaggat 900 gtatacgcgg ttgacggacc gacaagtctc tatcaccaag ccaataaggg agttagagtc 960 gcctactgga taggctttga caccacccct tttatgttta agaacttggc tggagcatat 1020 ccatcatact ctaccaactg ggccgacgaa accgtgttaa cggctcgtaa cataggccta 1080 tgcagctctg acgttatgga gcggtcacgt agagggatgt ccattcttag aaagaagtat 1140 ttgaaaccat ccaacaatgt tctattctct gttggctcga ccatctacca cgagaagagg 1200 gacttactga ggagctggca cctgccgtct gtatttcact tacgtggcaa gcaaaattac 1260 acatgtcggt gtgagactat agttagttgc gacgggtacg tcgttaaaag aatagctatc 1320 agtccaggcc tgtatgggaa gccttcaggc tatgctgcta cgatgcaccg cgagggattc 1380 ttgtgctgca aagtgacaga cacattgaac ggggagaggg tctcttttcc cgtgtgcacg 1440 tatgtgccag ctacattgtg tgaccaaatg actggcatac tggcaacaga tgtcagtgcg 1500 gacgacgcgc aaaaactgct ggttgggctc aaccagcgta tagtcgtcaa cggtcgcacc 1560 cagagaaaca ccaataccat gaaaaattac cttttgcccg tagtggccca ggcatttgct 1620 aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa ggccactagg actacgagat 1680 agacagttag tcatggggtg ttgttgggct tttagaaggc acaagataac atctatttat 1740 aagcgcccgg atacccaaac catcatcaaa gtgaacagcg atttccactc attcgtgctg 1800 cccaggatag gcagtaacac attggagatc gggctgagaa caagaatcag gaaaatgtta 1860 gaggagcaca aggagccgtc acctctcatt accgccgagg acgtacaaga agctaagtgc 1920 gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt tgcgcgcagc tctaccacct 1980 ttggcagctg atgttgagga gcccactctg gaagccgatg tcgacttgat gttacaagag 2040 gctggggccg gctcagtgga gacacctcgt ggcttgataa aggttaccag ctacgatggc 2100 gaggacaaga tcggctctta cgctgtgctt tctccgcagg ctgtactcaa gagtgaaaaa 2160 ttatcttgca tccaccctct cgctgaacaa gtcatagtga taacacactc tggccgaaaa 2220 gggcgttatg ccgtggaacc ataccatggt aaagtagtgg tgccagaggg acatgcaata 2280 cccgtccagg actttcaagc tctgagtgaa agtgccacca ttgtgtacaa cgaacgtgag 2340 ttcgtaaaca ggtacctgca ccatattgcc acacatggag gagcgctgaa cactgatgaa 2400 gaatattaca aaactgtcaa gcccagcgag cacgacggcg aatacctgta cgacatcgac 2460 aggaaacagt gcgtcaagaa agaactagtc actgggctag ggctcacagg cgagctggtg 2520 gatcctccct tccatgaatt cgcctacgag agtctgagaa cacgaccagc cgctccttac 2580 caagtaccaa ccataggggt gtatggcgtg ccaggatcag gcaagtctgg catcattaaa 2640 agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga aagaaaactg tgcagaaatt 2700 ataagggacg tcaagaaaat gaaagggctg gacgtcaatg ccagaactgt ggactcagtg 2760 ctcttgaatg gatgcaaaca ccccgtagag accctgtata ttgacgaagc ttttgcttgt 2820 catgcaggta ctctcagagc gctcatagcc attataagac ctaaaaaggc agtgctctgc 2880 ggggatccca aacagtgcgg tttttttaac atgatgtgcc tgaaagtgca ttttaaccac 2940 gagatttgca cacaagtctt ccacaaaagc atctctcgcc gttgcactaa atctgtgact 3000 tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa cgacgaatcc gaaagagact 3060 aagattgtga ttgacactac cggcagtacc aaacctaagc aggacgatct cattctcact 3120 tgtttcagag ggtgggtgaa gcagttgcaa atagattaca aaggcaacga aataatgacg 3180 gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg ccgttcggta caaggtgaat 3240 gaaaatcctc tgtacgcacc cacctctgaa catgtgaacg tcctactgac ccgcacggag 3300 gaccgcatcg tgtggaaaac actagccggc gacccatgga taaaaacact gactgccaag 3360 taccctggga atttcactgc cacgatagag gagtggcaag cagagcatga tgccatcatg 3420 aggcacatct tggagagacc ggaccctacc gacgtcttcc agaataaggc aaacgtgtgt 3480 tgggccaagg ctttagtgcc ggtgctgaag accgctggca tagacatgac cactgaacaa 3540 tggaacactg tggattattt tgaaacggac aaagctcact cagcagagat agtattgaac 3600 caactatgcg tgaggttctt tggactcgat ctggactccg gtctattttc tgcacccact 3660 gttccgttat ccattaggaa taatcactgg gataactccc cgtcgcctaa catgtacggg 3720 ctgaataaag aagtggtccg tcagctctct cgcaggtacc cacaactgcc tcgggcagtt 3780 gccactggaa gagtctatga catgaacact ggtacactgc gcaattatga tccgcgcata 3840 aacctagtac ctgtaaacag aagactgcct catgctttag tcctccacca taatgaacac 3900 ccacagagtg acttttcttc attcgtcagc aaattgaagg gcagaactgt cctggtggtc 3960 ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt tgtcagaccg gcctgaggct 4020 accttcagag ctcggctgga tttaggcatc ccaggtgatg tgcccaaata tgacataata 4080 tttgttaatg tgaggacccc atataaatac catcactatc agcagtgtga agaccatgcc 4140 attaagctta gcatgttgac caagaaagct tgtctgcatc tgaatcccgg cggaacctgt 4200 gtcagcatag gttatggtta cgctgacagg gccagcgaaa gcatcattgg tgctatagcg 4260 cggcagttca agttttcccg ggtatgcaaa ccgaaatcct cacttgaaga gacggaagtt 4320 ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc acaatcctta caagctttca 4380 tcaaccttga ccaacattta tacaggttcc agactccacg aagccggatg tgcaccctca 4440 tatcatgtgg tgcgagggga tattgccacg gccaccgaag gagtgattat aaatgctgct 4500 aacagcaaag gacaacctgg cggaggggtg tgcggagcgc tgtataagaa attcccggaa 4560 agcttcgatt tacagccgat cgaagtagga aaagcgcgac tggtcaaagg tgcagctaaa 4620 catatcattc atgccgtagg accaaacttc aacaaagttt cggaggttga aggtgacaaa 4680 cagttggcag aggcttatga gtccatcgct aagattgtca acgataacaa ttacaagtca 4740 gtagcgattc cactgttgtc caccggcatc ttttccggga acaaagatcg actaacccaa 4800 tcattgaacc atttgctgac agctttagac accactgatg cagatgtagc catatactgc 4860 agggacaaga aatgggaaat gactctcaag gaagcagtgg ctaggagaga agcagtggag 4920 gagatatgca tatccgacga ctcttcagtg acagaacctg atgcagagct ggtgagggtg 4980 catccgaaga gttctttggc tggaaggaag ggctacagca caagcgatgg caaaactttc 5040 tcatatttgg aagggaccaa gtttcaccag gcggccaagg atatagcaga aattaatgcc 5100 atgtggcccg ttgcaacgga ggccaatgag caggtatgca tgtatatcct cggagaaagc 5160 atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg aagcctccac accacctagc 5220 acgctgcctt gcttgtgcat ccatgccatg actccagaaa gagtacagcg cctaaaagcc 5280 tcacgtccag aacaaattac tgtgtgctca tcctttccat tgccgaagta tagaatcact 5340 ggtgtgcaga agatccaatg ctcccagcct atattgttct caccgaaagt gcctgcgtat 5400 attcatccaa ggaagtatct cgtggaaaca ccaccggtag acgagactcc ggagccatcg 5460 gcagagaacc aatccacaga ggggacacct gaacaaccac cacttataac cgaggatgag 5520 accaggacta gaacgcctga gccgatcatc atcgaagagg aagaagagga tagcataagt 5580 ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg aggcagacat tcacgggccg 5640 ccctctgtat ctagctcatc ctggtccatt cctcatgcat ccgactttga tgtggacagt 5700 ttatccatac ttgacaccct ggagggagct agcgtgacca gcggggcaac gtcagccgag 5760 actaactctt acttcgcaaa gagtatggag tttctggcgc gaccggtgcc tgcgcctcga 5820 acagtattca ggaaccctcc acatcccgct ccgcgcacaa gaacaccgtc acttgcaccc 5880 agcagggcct gctcgagaac cagcctagtt tccaccccgc caggcgtgaa tagggtgatc 5940 actagagagg agctcgaggc gcttaccccg tcacgcactc ctagcaggtc ggtctcgaga 6000 accagcctgg tctccaaccc gccaggcgta aatagggtga ttacaagaga ggagtttgag 6060 gcgttcgtag cacaacaaca atgacggttt gatgcgggtg catacatctt ttcctccgac 6120 accggtcaag ggcatttaca acaaaaatca gtaaggcaaa cggtgctatc cgaagtggtg 6180 ttggagagga ccgaattgga gatttcgtat gccccgcgcc tcgaccaaga aaaagaagaa 6240 ttactacgca agaaattaca gttaaatccc acacctgcta acagaagcag ataccagtcc 6300 aggaaggtgg agaacatgaa agccataaca gctagacgta ttctgcaagg cctagggcat 6360 tatttgaagg cagaaggaaa agtggagtgc taccgaaccc tgcatcctgt tcctttgtat 6420 tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg cagtggaagc ctgtaacgcc 6480 atgttgaaag agaactttcc gactgtggct tcttactgta ttattccaga gtacgatgcc 6540 tatttggaca tggttgacgg agcttcatgc tgcttagaca ctgccagttt ttgccctgca 6600 aagctgcgca gctttccaaa gaaacactcc tatttggaac ccacaatacg atcggcagtg 6660 ccttcagcga tccagaacac gctccagaac gtcctggcag ctgccacaaa aagaaattgc 6720 aatgtcacgc aaatgagaga attgcccgta ttggattcgg cggcctttaa tgtggaatgc 6780 ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt ttaaagaaaa ccccatcagg 6840 cttactgaag aaaacgtggt aaattacatt accaaattaa aaggaccaaa agctgctgct 6900 ctttttgcga agacacataa tttgaatatg ttgcaggaca taccaatgga caggtttgta 6960 atggacttaa agagagacgt gaaagtgact ccaggaacaa aacatactga agaacggccc 7020 aaggtacagg tgatccaggc tgccgatccg ctagcaacag cgtatctgtg cggaatccac 7080 cgagagctgg ttaggagatt aaatgcggtc ctgcttccga acattcatac actgtttgat 7140 atgtcggctg aagactttga cgctattata gccgagcact tccagcctgg ggattgtgtt 7200 ctggaaactg acatcgcgtc gtttgataaa agtgaggacg acgccatggc tctgaccgcg 7260 ttaatgattc tggaagactt aggtgtggac gcagagctgt tgacgctgat tgaggcggct 7320 ttcggcgaaa tttcatcaat acatttgccc actaaaacta aatttaaatt cggagccatg 7380 atgaaatctg gaatgttcct cacactgttt gtgaacacag tcattaacat tgtaatcgca 7440 agcagagtgt tgagagaacg gctaaccgga tcaccatgtg cagcattcat tggagatgac 7500 aatatcgtga aaggagtcaa atcggacaaa ttaatggcag acaggtgcgc cacctggttg 7560 aatatggaag tcaagattat agatgctgtg gtgggcgaga aagcgcctta tttctgtgga 7620 gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc gtgtggcaga ccccctaaaa 7680 aggctgttta agcttggcaa acctctggca gcagacgatg aacatgatga tgacaggaga 7740 agggcattgc atgaagagtc aacacgctgg aaccgagtgg gtattctttc agagctgtgc 7800 aaggcagtag aatcaaggta tgaaaccgta ggaacttcca tcatagttat ggccatgact 7860 actctagcta gcagtgttaa atcattcagc tacctgagag gggcccctat aactctctac 7920 ggctaacctg aatggactac gacatagtct agtccgccaa gatatcatgc agtggaactc 7980 aactactttc catcagaccc ttcaggaccc tagagtgcgc gggctgtact ttcctgctgg 8040 gggaagcagt agcgggaccg ttaatccagt acctacgacc gcctctccca tatcttctat 8100 ctttagtagg actggtgacc ctgctcccaa catggagaat atcacctccg ggtttctggg 8160 cccactcctg gtccttcagg ccggattctt cctgctgact cgaatcctca ccatacccca 8220 gagcctggac agctggtgga caagcctgaa ttttctggga ggaactcctg tatgcctggg 8280 acaaaattca cagtccccta caagtaacca ttcaccgaca agttgtcctc ccatctgtcc 8340 cggatacagg tggatgtgcc tgcgaaggtt catcatcttc ctcttcatcc tcttgctttg 8400 ccttattttc ctcctggttc ttctggacta tcagggcatg ctgcctgtgt gcccactgat 8460 accaggatct agtactacca gcacaggccc gtgtaagacc tgtacaattc cagcacaagg 8520 gactagtatg ttcccctcct gctgttgtac taagccaagc gacggtaatt gcacgtgtat 8580 cccaatcccg tcctcctggg cgtttgccaa gtacctctgg gaatgggcct cagtcagatt 8640 ttcatggctt agtcttttgg tgccgttcgt gcagtggttt gtgggactct ctccgactgt 8700 gtggctcagc gtgatctgga tgatgtggta ctggggccct tccctttaca acatactgtc 8760 tccattcctt cccctgctgc caatcttctt ttgcctgtgg gtctatattt aattaaaaca 8820 gctgtgggtt gttcccaccc acagggccca ctgggcgcta gcactctgat tttacgaaat 8880 ccttgtgcgc ctgttttata tcccttccct aattcgaaac gtagaagcaa tgcgcaccac 8940 tgatcaatag taggcgtaac gcgccagtta cgtcatgatc aagcatatct gttcccccgg 9000 actgagtatc aatagactgc ttacgcggtt gaaggagaaa acgttcgtta tccggctaac 9060 tacttcgaga agcccagtaa caccatggaa gctgcagggt gtttcgctca gcacttcccc 9120 cgtgtagatc aggtcgatga gccactgcaa tccccacagg tgactgtggc agtggctgcg 9180 ttggcggcct gcctatgggg agacccatag gacgctctaa tgtggacatg gtgcgaagag 9240 cctattgagc tagttagtag tcctccggcc cctgaatgcg gctaatccta actgcggagc 9300 acatgccttc aacccagagg gtagtgtgtc gtaacgggca actctgcagc ggaaccgact 9360 actttgggtg tccgtgtttc ttttttattc ttatattggc tgcttatggt gacaattaca 9420 gaattgttac catatagcta ttggattggc catccggtgt gtaatagagc tgttatatac 9480 ctatttgttg gctttgtacc actaacttta aaatctataa ctaccctcaa ctttatatta 9540 accctcaata cagttgacca tggctaggcc cctgtgtaca cttttgctcc tgatggccac 9600 cctcgctgga gctctggcaa gcggtggatg gagctcaaag ccgcggaaag ggatgggtac 9660 taacctgtcc gtaccaaatc ccctgggatt ttttccagac caccaactcg atcctgcttt 9720 tggcgcaaat tccaacaatc ccgactggga ctttaaccct aacaaggacc actggcctga 9780 tgccaacaag gtgggggcag gagcctttgg tcccggcttc accccacccc atggaggtct 9840 tttgggatgg tcaccacagg cccagggcat cctgaccact gtccctgctg ctccaccgcc 9900 agcttctact aatcgacaga gcgggaggca gccgaccccc ctgagtcccc ccctgcggga 9960 tacccaccct caggcataag gcgcgccgtt taaacggccg gccttaatta agtaacgata 10020 cagcagcaat tggcaagctg cttacataga actcgcggcg attggcatgc cgctttaaaa 10080 tttttatttt atttttcttt tcttttccga atcggatttt gtttttaata tttcaaaaaa 10140 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaa 10174 <210> 69 <211> 12730 <212> DNA <213> Artificial Sequence <220> <223> PreS2.S-2A-preS1-2A-Core-2A-Pol Replicon <400> 69 ataggcggcg catgagagaa gcccagacca attacctacc caaataggag aaagttcacg 60 ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120 aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180 tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240 tagtcagcat agtacatttc atctgactaa tactacaaca ccaccaccat gaatagagga 300 ttctttaaca tgctcggccg ccgccccttc ccggccccca ctgccatgtg gaggccgcgg 360 agaaggaggc aggcggcccc gggaagcgga gctactaact tcagcctgct gaagcaggct 420 ggagacgtgg aggagaaccc tggacctgag aaagttcacg ttgacatcga ggaagacagc 480 ccattcctca gagctttgca gcggagcttc ccgcagtttg aggtagaagc caagcaggtc 540 actgataatg accatgctaa tgccagagcg ttttcgcatc tggcttcaaa actgatcgaa 600 acggaggtgg acccatccga cacgatcctt gacattggaa gtgcgcccgc ccgcagaatg 660 tattctaagc acaagtatca ttgtatctgt ccgatgagat gtgcggaaga tccggacaga 720 ttgtataagt atgcaactaa gctgaagaaa aactgtaagg aaataactga taaggaattg 780 gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc ctgacctgga aactgagact 840 atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc aagtcgctgt ttaccaggat 900 gtatacgcgg ttgacggacc gacaagtctc tatcaccaag ccaataaggg agttagagtc 960 gcctactgga taggctttga caccacccct tttatgttta agaacttggc tggagcatat 1020 ccatcatact ctaccaactg ggccgacgaa accgtgttaa cggctcgtaa cataggccta 1080 tgcagctctg acgttatgga gcggtcacgt agagggatgt ccattcttag aaagaagtat 1140 ttgaaaccat ccaacaatgt tctattctct gttggctcga ccatctacca cgagaagagg 1200 gacttactga ggagctggca cctgccgtct gtatttcact tacgtggcaa gcaaaattac 1260 acatgtcggt gtgagactat agttagttgc gacgggtacg tcgttaaaag aatagctatc 1320 agtccaggcc tgtatgggaa gccttcaggc tatgctgcta cgatgcaccg cgagggattc 1380 ttgtgctgca aagtgacaga cacattgaac ggggagaggg tctcttttcc cgtgtgcacg 1440 tatgtgccag ctacattgtg tgaccaaatg actggcatac tggcaacaga tgtcagtgcg 1500 gacgacgcgc aaaaactgct ggttgggctc aaccagcgta tagtcgtcaa cggtcgcacc 1560 cagagaaaca ccaataccat gaaaaattac cttttgcccg tagtggccca ggcatttgct 1620 aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa ggccactagg actacgagat 1680 agacagttag tcatggggtg ttgttgggct tttagaaggc acaagataac atctatttat 1740 aagcgcccgg atacccaaac catcatcaaa gtgaacagcg atttccactc attcgtgctg 1800 cccaggatag gcagtaacac attggagatc gggctgagaa caagaatcag gaaaatgtta 1860 gaggagcaca aggagccgtc acctctcatt accgccgagg acgtacaaga agctaagtgc 1920 gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt tgcgcgcagc tctaccacct 1980 ttggcagctg atgttgagga gcccactctg gaagccgatg tcgacttgat gttacaagag 2040 gctggggccg gctcagtgga gacacctcgt ggcttgataa aggttaccag ctacgatggc 2100 gaggacaaga tcggctctta cgctgtgctt tctccgcagg ctgtactcaa gagtgaaaaa 2160 ttatcttgca tccaccctct cgctgaacaa gtcatagtga taacacactc tggccgaaaa 2220 gggcgttatg ccgtggaacc ataccatggt aaagtagtgg tgccagaggg acatgcaata 2280 cccgtccagg actttcaagc tctgagtgaa agtgccacca ttgtgtacaa cgaacgtgag 2340 ttcgtaaaca ggtacctgca ccatattgcc acacatggag gagcgctgaa cactgatgaa 2400 gaatattaca aaactgtcaa gcccagcgag cacgacggcg aatacctgta cgacatcgac 2460 aggaaacagt gcgtcaagaa agaactagtc actgggctag ggctcacagg cgagctggtg 2520 gatcctccct tccatgaatt cgcctacgag agtctgagaa cacgaccagc cgctccttac 2580 caagtaccaa ccataggggt gtatggcgtg ccaggatcag gcaagtctgg catcattaaa 2640 agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga aagaaaactg tgcagaaatt 2700 ataagggacg tcaagaaaat gaaagggctg gacgtcaatg ccagaactgt ggactcagtg 2760 ctcttgaatg gatgcaaaca ccccgtagag accctgtata ttgacgaagc ttttgcttgt 2820 catgcaggta ctctcagagc gctcatagcc attataagac ctaaaaaggc agtgctctgc 2880 ggggatccca aacagtgcgg tttttttaac atgatgtgcc tgaaagtgca ttttaaccac 2940 gagatttgca cacaagtctt ccacaaaagc atctctcgcc gttgcactaa atctgtgact 3000 tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa cgacgaatcc gaaagagact 3060 aagattgtga ttgacactac cggcagtacc aaacctaagc aggacgatct cattctcact 3120 tgtttcagag ggtgggtgaa gcagttgcaa atagattaca aaggcaacga aataatgacg 3180 gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg ccgttcggta caaggtgaat 3240 gaaaatcctc tgtacgcacc cacctctgaa catgtgaacg tcctactgac ccgcacggag 3300 gaccgcatcg tgtggaaaac actagccggc gacccatgga taaaaacact gactgccaag 3360 taccctggga atttcactgc cacgatagag gagtggcaag cagagcatga tgccatcatg 3420 aggcacatct tggagagacc ggaccctacc gacgtcttcc agaataaggc aaacgtgtgt 3480 tgggccaagg ctttagtgcc ggtgctgaag accgctggca tagacatgac cactgaacaa 3540 tggaacactg tggattattt tgaaacggac aaagctcact cagcagagat agtattgaac 3600 caactatgcg tgaggttctt tggactcgat ctggactccg gtctattttc tgcacccact 3660 gttccgttat ccattaggaa taatcactgg gataactccc cgtcgcctaa catgtacggg 3720 ctgaataaag aagtggtccg tcagctctct cgcaggtacc cacaactgcc tcgggcagtt 3780 gccactggaa gagtctatga catgaacact ggtacactgc gcaattatga tccgcgcata 3840 aacctagtac ctgtaaacag aagactgcct catgctttag tcctccacca taatgaacac 3900 ccacagagtg acttttcttc attcgtcagc aaattgaagg gcagaactgt cctggtggtc 3960 ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt tgtcagaccg gcctgaggct 4020 accttcagag ctcggctgga tttaggcatc ccaggtgatg tgcccaaata tgacataata 4080 tttgttaatg tgaggacccc atataaatac catcactatc agcagtgtga agaccatgcc 4140 attaagctta gcatgttgac caagaaagct tgtctgcatc tgaatcccgg cggaacctgt 4200 gtcagcatag gttatggtta cgctgacagg gccagcgaaa gcatcattgg tgctatagcg 4260 cggcagttca agttttcccg ggtatgcaaa ccgaaatcct cacttgaaga gacggaagtt 4320 ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc acaatcctta caagctttca 4380 tcaaccttga ccaacattta tacaggttcc agactccacg aagccggatg tgcaccctca 4440 tatcatgtgg tgcgagggga tattgccacg gccaccgaag gagtgattat aaatgctgct 4500 aacagcaaag gacaacctgg cggaggggtg tgcggagcgc tgtataagaa attcccggaa 4560 agcttcgatt tacagccgat cgaagtagga aaagcgcgac tggtcaaagg tgcagctaaa 4620 catatcattc atgccgtagg accaaacttc aacaaagttt cggaggttga aggtgacaaa 4680 cagttggcag aggcttatga gtccatcgct aagattgtca acgataacaa ttacaagtca 4740 gtagcgattc cactgttgtc caccggcatc ttttccggga acaaagatcg actaacccaa 4800 tcattgaacc atttgctgac agctttagac accactgatg cagatgtagc catatactgc 4860 agggacaaga aatgggaaat gactctcaag gaagcagtgg ctaggagaga agcagtggag 4920 gagatatgca tatccgacga ctcttcagtg acagaacctg atgcagagct ggtgagggtg 4980 catccgaaga gttctttggc tggaaggaag ggctacagca caagcgatgg caaaactttc 5040 tcatatttgg aagggaccaa gtttcaccag gcggccaagg atatagcaga aattaatgcc 5100 atgtggcccg ttgcaacgga ggccaatgag caggtatgca tgtatatcct cggagaaagc 5160 atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg aagcctccac accacctagc 5220 acgctgcctt gcttgtgcat ccatgccatg actccagaaa gagtacagcg cctaaaagcc 5280 tcacgtccag aacaaattac tgtgtgctca tcctttccat tgccgaagta tagaatcact 5340 ggtgtgcaga agatccaatg ctcccagcct atattgttct caccgaaagt gcctgcgtat 5400 attcatccaa ggaagtatct cgtggaaaca ccaccggtag acgagactcc ggagccatcg 5460 gcagagaacc aatccacaga ggggacacct gaacaaccac cacttataac cgaggatgag 5520 accaggacta gaacgcctga gccgatcatc atcgaagagg aagaagagga tagcataagt 5580 ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg aggcagacat tcacgggccg 5640 ccctctgtat ctagctcatc ctggtccatt cctcatgcat ccgactttga tgtggacagt 5700 ttatccatac ttgacaccct ggagggagct agcgtgacca gcggggcaac gtcagccgag 5760 actaactctt acttcgcaaa gagtatggag tttctggcgc gaccggtgcc tgcgcctcga 5820 acagtattca ggaaccctcc acatcccgct ccgcgcacaa gaacaccgtc acttgcaccc 5880 agcagggcct gctcgagaac cagcctagtt tccaccccgc caggcgtgaa tagggtgatc 5940 actagagagg agctcgaggc gcttaccccg tcacgcactc ctagcaggtc ggtctcgaga 6000 accagcctgg tctccaaccc gccaggcgta aatagggtga ttacaagaga ggagtttgag 6060 gcgttcgtag cacaacaaca atgacggttt gatgcgggtg catacatctt ttcctccgac 6120 accggtcaag ggcatttaca acaaaaatca gtaaggcaaa cggtgctatc cgaagtggtg 6180 ttggagagga ccgaattgga gatttcgtat gccccgcgcc tcgaccaaga aaaagaagaa 6240 ttactacgca agaaattaca gttaaatccc acacctgcta acagaagcag ataccagtcc 6300 aggaaggtgg agaacatgaa agccataaca gctagacgta ttctgcaagg cctagggcat 6360 tatttgaagg cagaaggaaa agtggagtgc taccgaaccc tgcatcctgt tcctttgtat 6420 tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg cagtggaagc ctgtaacgcc 6480 atgttgaaag agaactttcc gactgtggct tcttactgta ttattccaga gtacgatgcc 6540 tatttggaca tggttgacgg agcttcatgc tgcttagaca ctgccagttt ttgccctgca 6600 aagctgcgca gctttccaaa gaaacactcc tatttggaac ccacaatacg atcggcagtg 6660 ccttcagcga tccagaacac gctccagaac gtcctggcag ctgccacaaa aagaaattgc 6720 aatgtcacgc aaatgagaga attgcccgta ttggattcgg cggcctttaa tgtggaatgc 6780 ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt ttaaagaaaa ccccatcagg 6840 cttactgaag aaaacgtggt aaattacatt accaaattaa aaggaccaaa agctgctgct 6900 ctttttgcga agacacataa tttgaatatg ttgcaggaca taccaatgga caggtttgta 6960 atggacttaa agagagacgt gaaagtgact ccaggaacaa aacatactga agaacggccc 7020 aaggtacagg tgatccaggc tgccgatccg ctagcaacag cgtatctgtg cggaatccac 7080 cgagagctgg ttaggagatt aaatgcggtc ctgcttccga acattcatac actgtttgat 7140 atgtcggctg aagactttga cgctattata gccgagcact tccagcctgg ggattgtgtt 7200 ctggaaactg acatcgcgtc gtttgataaa agtgaggacg acgccatggc tctgaccgcg 7260 ttaatgattc tggaagactt aggtgtggac gcagagctgt tgacgctgat tgaggcggct 7320 ttcggcgaaa tttcatcaat acatttgccc actaaaacta aatttaaatt cggagccatg 7380 atgaaatctg gaatgttcct cacactgttt gtgaacacag tcattaacat tgtaatcgca 7440 agcagagtgt tgagagaacg gctaaccgga tcaccatgtg cagcattcat tggagatgac 7500 aatatcgtga aaggagtcaa atcggacaaa ttaatggcag acaggtgcgc cacctggttg 7560 aatatggaag tcaagattat agatgctgtg gtgggcgaga aagcgcctta tttctgtgga 7620 gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc gtgtggcaga ccccctaaaa 7680 aggctgttta agcttggcaa acctctggca gcagacgatg aacatgatga tgacaggaga 7740 agggcattgc atgaagagtc aacacgctgg aaccgagtgg gtattctttc agagctgtgc 7800 aaggcagtag aatcaaggta tgaaaccgta ggaacttcca tcatagttat ggccatgact 7860 actctagcta gcagtgttaa atcattcagc tacctgagag gggcccctat aactctctac 7920 ggctaacctg aatggactac gacatagtct agtccgccaa gatatcatgc agtggaactc 7980 aactactttc catcagaccc ttcaggaccc tagagtgcgc gggctgtact ttcctgctgg 8040 gggaagcagt agcgggaccg ttaatccagt acctacgacc gcctctccca tatcttctat 8100 ctttagtagg actggtgacc ctgctcccaa catggagaat atcacctccg ggtttctggg 8160 cccactcctg gtccttcagg ccggattctt cctgctgact cgaatcctca ccatacccca 8220 gagcctggac agctggtgga caagcctgaa ttttctggga ggaactcctg tatgcctggg 8280 acaaaattca cagtccccta caagtaacca ttcaccgaca agttgtcctc ccatctgtcc 8340 cggatacagg tggatgtgcc tgcgaaggtt catcatcttc ctcttcatcc tcttgctttg 8400 ccttattttc ctcctggttc ttctggacta tcagggcatg ctgcctgtgt gcccactgat 8460 accaggatct agtactacca gcacaggccc gtgtaagacc tgtacaattc cagcacaagg 8520 gactagtatg ttcccctcct gctgttgtac taagccaagc gacggtaatt gcacgtgtat 8580 cccaatcccg tcctcctggg cgtttgccaa gtacctctgg gaatgggcct cagtcagatt 8640 ttcatggctt agtcttttgg tgccgttcgt gcagtggttt gtgggactct ctccgactgt 8700 gtggctcagc gtgatctgga tgatgtggta ctggggccct tccctttaca acatactgtc 8760 tccattcctt cccctgctgc caatcttctt ttgcctgtgg gtctatattg gaagcggagc 8820 tactaacttc agcctgctga agcaggctgg agacgtggag gagaaccctg gacctatggc 8880 taggcccctg tgtacacttt tgctcctgat ggccaccctc gctggagctc tggcaagcgg 8940 tggatggagc tcaaagccgc ggaaagggat gggtactaac ctgtccgtac caaatcccct 9000 gggatttttt ccagaccacc aactcgatcc tgcttttggc gcaaattcca acaatcccga 9060 ctgggacttt aaccctaaca aggaccactg gcctgatgcc aacaaggtgg gggcaggagc 9120 ctttggtccc ggcttcaccc caccccatgg aggtcttttg ggatggtcac cacaggccca 9180 gggcatcctg accactgtcc ctgctgctcc accgccagct tctactaatc gacagagcgg 9240 gaggcagccg acccccctga gtccccccct gcgggatacc caccctcagg caggatcagg 9300 cgctacgaat tttagccttc tgaagcaagc gggagacgtt gaagaaaacc cagggcctat 9360 ggctcgacct ctgtgtaccc tgctactcct gatggctacc ctggctggag ctctggccag 9420 cgacatcgac ccttacaagg agttcggcgc cagcgtggaa ctgctgtctt ttctgcccag 9480 tgatttcttt ccttccattc gagacctgct ggataccgcc tctgctctgt atcgggaagc 9540 cctggagagc ccagaacact gctccccaca ccataccgct ctgcgacagg caatcctgtg 9600 ctggggggag ctgatgaacc tggccacatg ggtgggatcg aatctggagg accccgcttc 9660 acgggaactg gtggtcagct acgtgaacgt caatatgggc ctgaaaatcc gccagctgct 9720 gtggttccat attagctgcc tgacttttgg acgagagacc gtgctggaat acctggtgtc 9780 cttcggcgtc tggattcgca ctccccctgc ttatcgacca cccaacgcac caattctgtc 9840 caccctgccc gagaccacag tggtccgtcg ccgtgggtcc ggagcgacta acttttccct 9900 gctgaaacaa gcgggtgacg tcgaagagaa tccgggacct atggctcgac ctctgtgtac 9960 cctgctactc ctgatggcta ccctggctgg agctctggcc agcatgcccc tgtcttacca 10020 gcactttaga aagcttctgc tgctggacga tgaagccggg cctctggagg aagagctgcc 10080 aaggctggca gacgaggggc tgaaccggag agtggccgaa gatctgaatc tgggaaacct 10140 gaacgtgagc atcccttgga ctcataaagt cggcaacttc accgggctgt acagctccac 10200 agtgcctgtc ttcaatccag agtggcagac accatccttt cccaacattc acctgcagga 10260 ggacatcatt aatagatgcg aacagttcgt gggacctctg acagtcaacg aaaagaggcg 10320 cctgaaactg atcatgcctg ccaggtttta cccaaatgtg actaagtatc tgccactgga 10380 taagggcatc aagccttact atccagagca cctggtgaac cattacttcc agactagaca 10440 ctatctgcat accctgtgga aggccggaat cctgtacaaa cgagaaacta cccggagtgc 10500 ttcattttgt ggctccccat attcttggga acaggagctg cagcatggca ggctggtgtt 10560 ccagaccagc aaacgccacg gggatgagtc cttttgcagc cagtctagtg gcatcctgag 10620 cagatccccc gtggggcctt gtattcagtc tcagctgcgg aagagtagac tgggactgca 10680 gccacagcag ggacacctgg cacgacggca gcagggaagg tctggcagta tccgggctag 10740 agtgcatccc acaactagaa ggaccttcgg cgtcgagcca tcaggaagcg gccacatcga 10800 caacagcgca tcaagctcct ctagttgcct gcatcagtca gccgtgagaa aggccgctta 10860 cagccacctg tccacatcta aaaggcactc aagctccggg catgctgtgg agctgcacaa 10920 catccctcca aattctgcac gcagtcagtc agaaggaccc gtgttcagct gctggtggct 10980 gcagtttcgg aactcaaagc cttgcagcga ctattgtctg agccatattg tgaatctgct 11040 ggaggattgg ggcccttgta ccgagcacgg ggaacaccat atcaggattc cacgaacacc 11100 agcacgagtg actggagggg tgttcctggt ggacaagaac ccccacaata ctaccgagag 11160 ccggctggtg gtcgatttca gtcagttttc aagaggcaac acaagggtgt catggcccaa 11220 attcgccgtc cctaatctgc agagtctgac taacctgctg tctagtaatc tgagctggct 11280 gtccctggac gtgtccgcag ccttttacca cctgcctctg catccagctg caatgcccca 11340 tctgctggtg gggtcaagcg gactgagtcg ctacgtcgcc cgactgtcct ctaactcacg 11400 catcattaat caccagcatg gcaccatgca gaacctgcac gatagctgtt cccggaatct 11460 gtacgtgtct ctgctgctgc tgtataagac attcggcaga aaactgcacc tgtacagcca 11520 tcctatcatt ctggggttta ggaagatccc aatgggagtg ggactgagcc ccttcctgct 11580 ggcacagttt acctccgcca tttgctctgt ggtccgccga gccttcccac actgtctggc 11640 tttttcctat atgaacaatg tggtcctggg cgccaaatcc gtgcagcatc tggagtctct 11700 gttcacagct gtcactaact ttctgctgag cctggggatc cacctgaacc caaataagac 11760 taaacgctgg gggtacagcc tgaatttcat gggatatgtg attggatcct gggggaccct 11820 gccacaggag cacatcgtgc agaagatcaa ggaatgcttt cggaagctgc ccgtcaacag 11880 acctatcgac tggaaagtgt gccagcggat tgtcggactg ctgggcttcg ccgctccctt 11940 tacccagtgc gggtacccag cactgatgcc cctgtatgcc tgtatccagt ctaagcaggc 12000 tttcaccttt agtcctacat acaaggcatt cctgtgcaaa cagtacctga acctgtatcc 12060 agtggcaagg cagcgacctg gactgtgcca ggtctttgca aatgccactc ctaccggctg 12120 ggggctggct atcggacatc agcgaatgcg gggcacattc gtggcccccc tgcctattca 12180 cactgctcag ctgctggcag cctgctttgc tagatctagg agtggagcaa agctgatcgg 12240 caccgacaat agtgtggtcc tgtcaagaaa atacacatcc ttcccatggc tgctgggatg 12300 tgctgcaaac tggattctga ggggcaccag cttcgtgtac gtcccctcag ccctgaatcc 12360 tgctgacgat ccatcccgcg ggcgactggg actgtaccga cctctgctga gactgccctt 12420 caggcctaca actggccgga catctctgta tgccgattca ccaagcgtgc cctcacacct 12480 gcctgacaga gtccactttg cttcacccct gcacgtcgct tggcggcctc cataaggcgc 12540 gccgtttaaa cggccggcct taattaagta acgatacagc agcaattggc aagctgctta 12600 catagaactc gcggcgattg gcatgccgct ttaaaatttt tattttattt ttcttttctt 12660 ttccgaatcg gattttgttt ttaatatttc aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 12720 aaaaaaaaaa 12730 <210> 70 <211> 12730 <212> DNA <213> Artificial Sequence <220> <223> PreS2.S-2A-preS1-2A-Pol-2A-Core Replicon <400> 70 ataggcggcg catgagagaa gcccagacca attacctacc caaataggag aaagttcacg 60 ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120 aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180 tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240 tagtcagcat agtacatttc atctgactaa tactacaaca ccaccaccat gaatagagga 300 ttctttaaca tgctcggccg ccgccccttc ccggccccca ctgccatgtg gaggccgcgg 360 agaaggaggc aggcggcccc gggaagcgga gctactaact tcagcctgct gaagcaggct 420 ggagacgtgg aggagaaccc tggacctgag aaagttcacg ttgacatcga ggaagacagc 480 ccattcctca gagctttgca gcggagcttc ccgcagtttg aggtagaagc caagcaggtc 540 actgataatg accatgctaa tgccagagcg ttttcgcatc tggcttcaaa actgatcgaa 600 acggaggtgg acccatccga cacgatcctt gacattggaa gtgcgcccgc ccgcagaatg 660 tattctaagc acaagtatca ttgtatctgt ccgatgagat gtgcggaaga tccggacaga 720 ttgtataagt atgcaactaa gctgaagaaa aactgtaagg aaataactga taaggaattg 780 gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc ctgacctgga aactgagact 840 atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc aagtcgctgt ttaccaggat 900 gtatacgcgg ttgacggacc gacaagtctc tatcaccaag ccaataaggg agttagagtc 960 gcctactgga taggctttga caccacccct tttatgttta agaacttggc tggagcatat 1020 ccatcatact ctaccaactg ggccgacgaa accgtgttaa cggctcgtaa cataggccta 1080 tgcagctctg acgttatgga gcggtcacgt agagggatgt ccattcttag aaagaagtat 1140 ttgaaaccat ccaacaatgt tctattctct gttggctcga ccatctacca cgagaagagg 1200 gacttactga ggagctggca cctgccgtct gtatttcact tacgtggcaa gcaaaattac 1260 acatgtcggt gtgagactat agttagttgc gacgggtacg tcgttaaaag aatagctatc 1320 agtccaggcc tgtatgggaa gccttcaggc tatgctgcta cgatgcaccg cgagggattc 1380 ttgtgctgca aagtgacaga cacattgaac ggggagaggg tctcttttcc cgtgtgcacg 1440 tatgtgccag ctacattgtg tgaccaaatg actggcatac tggcaacaga tgtcagtgcg 1500 gacgacgcgc aaaaactgct ggttgggctc aaccagcgta tagtcgtcaa cggtcgcacc 1560 cagagaaaca ccaataccat gaaaaattac cttttgcccg tagtggccca ggcatttgct 1620 aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa ggccactagg actacgagat 1680 agacagttag tcatggggtg ttgttgggct tttagaaggc acaagataac atctatttat 1740 aagcgcccgg atacccaaac catcatcaaa gtgaacagcg atttccactc attcgtgctg 1800 cccaggatag gcagtaacac attggagatc gggctgagaa caagaatcag gaaaatgtta 1860 gaggagcaca aggagccgtc acctctcatt accgccgagg acgtacaaga agctaagtgc 1920 gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt tgcgcgcagc tctaccacct 1980 ttggcagctg atgttgagga gcccactctg gaagccgatg tcgacttgat gttacaagag 2040 gctggggccg gctcagtgga gacacctcgt ggcttgataa aggttaccag ctacgatggc 2100 gaggacaaga tcggctctta cgctgtgctt tctccgcagg ctgtactcaa gagtgaaaaa 2160 ttatcttgca tccaccctct cgctgaacaa gtcatagtga taacacactc tggccgaaaa 2220 gggcgttatg ccgtggaacc ataccatggt aaagtagtgg tgccagaggg acatgcaata 2280 cccgtccagg actttcaagc tctgagtgaa agtgccacca ttgtgtacaa cgaacgtgag 2340 ttcgtaaaca ggtacctgca ccatattgcc acacatggag gagcgctgaa cactgatgaa 2400 gaatattaca aaactgtcaa gcccagcgag cacgacggcg aatacctgta cgacatcgac 2460 aggaaacagt gcgtcaagaa agaactagtc actgggctag ggctcacagg cgagctggtg 2520 gatcctccct tccatgaatt cgcctacgag agtctgagaa cacgaccagc cgctccttac 2580 caagtaccaa ccataggggt gtatggcgtg ccaggatcag gcaagtctgg catcattaaa 2640 agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga aagaaaactg tgcagaaatt 2700 ataagggacg tcaagaaaat gaaagggctg gacgtcaatg ccagaactgt ggactcagtg 2760 ctcttgaatg gatgcaaaca ccccgtagag accctgtata ttgacgaagc ttttgcttgt 2820 catgcaggta ctctcagagc gctcatagcc attataagac ctaaaaaggc agtgctctgc 2880 ggggatccca aacagtgcgg tttttttaac atgatgtgcc tgaaagtgca ttttaaccac 2940 gagatttgca cacaagtctt ccacaaaagc atctctcgcc gttgcactaa atctgtgact 3000 tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa cgacgaatcc gaaagagact 3060 aagattgtga ttgacactac cggcagtacc aaacctaagc aggacgatct cattctcact 3120 tgtttcagag ggtgggtgaa gcagttgcaa atagattaca aaggcaacga aataatgacg 3180 gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg ccgttcggta caaggtgaat 3240 gaaaatcctc tgtacgcacc cacctctgaa catgtgaacg tcctactgac ccgcacggag 3300 gaccgcatcg tgtggaaaac actagccggc gacccatgga taaaaacact gactgccaag 3360 taccctggga atttcactgc cacgatagag gagtggcaag cagagcatga tgccatcatg 3420 aggcacatct tggagagacc ggaccctacc gacgtcttcc agaataaggc aaacgtgtgt 3480 tgggccaagg ctttagtgcc ggtgctgaag accgctggca tagacatgac cactgaacaa 3540 tggaacactg tggattattt tgaaacggac aaagctcact cagcagagat agtattgaac 3600 caactatgcg tgaggttctt tggactcgat ctggactccg gtctattttc tgcacccact 3660 gttccgttat ccattaggaa taatcactgg gataactccc cgtcgcctaa catgtacggg 3720 ctgaataaag aagtggtccg tcagctctct cgcaggtacc cacaactgcc tcgggcagtt 3780 gccactggaa gagtctatga catgaacact ggtacactgc gcaattatga tccgcgcata 3840 aacctagtac ctgtaaacag aagactgcct catgctttag tcctccacca taatgaacac 3900 ccacagagtg acttttcttc attcgtcagc aaattgaagg gcagaactgt cctggtggtc 3960 ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt tgtcagaccg gcctgaggct 4020 accttcagag ctcggctgga tttaggcatc ccaggtgatg tgcccaaata tgacataata 4080 tttgttaatg tgaggacccc atataaatac catcactatc agcagtgtga agaccatgcc 4140 attaagctta gcatgttgac caagaaagct tgtctgcatc tgaatcccgg cggaacctgt 4200 gtcagcatag gttatggtta cgctgacagg gccagcgaaa gcatcattgg tgctatagcg 4260 cggcagttca agttttcccg ggtatgcaaa ccgaaatcct cacttgaaga gacggaagtt 4320 ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc acaatcctta caagctttca 4380 tcaaccttga ccaacattta tacaggttcc agactccacg aagccggatg tgcaccctca 4440 tatcatgtgg tgcgagggga tattgccacg gccaccgaag gagtgattat aaatgctgct 4500 aacagcaaag gacaacctgg cggaggggtg tgcggagcgc tgtataagaa attcccggaa 4560 agcttcgatt tacagccgat cgaagtagga aaagcgcgac tggtcaaagg tgcagctaaa 4620 catatcattc atgccgtagg accaaacttc aacaaagttt cggaggttga aggtgacaaa 4680 cagttggcag aggcttatga gtccatcgct aagattgtca acgataacaa ttacaagtca 4740 gtagcgattc cactgttgtc caccggcatc ttttccggga acaaagatcg actaacccaa 4800 tcattgaacc atttgctgac agctttagac accactgatg cagatgtagc catatactgc 4860 agggacaaga aatgggaaat gactctcaag gaagcagtgg ctaggagaga agcagtggag 4920 gagatatgca tatccgacga ctcttcagtg acagaacctg atgcagagct ggtgagggtg 4980 catccgaaga gttctttggc tggaaggaag ggctacagca caagcgatgg caaaactttc 5040 tcatatttgg aagggaccaa gtttcaccag gcggccaagg atatagcaga aattaatgcc 5100 atgtggcccg ttgcaacgga ggccaatgag caggtatgca tgtatatcct cggagaaagc 5160 atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg aagcctccac accacctagc 5220 acgctgcctt gcttgtgcat ccatgccatg actccagaaa gagtacagcg cctaaaagcc 5280 tcacgtccag aacaaattac tgtgtgctca tcctttccat tgccgaagta tagaatcact 5340 ggtgtgcaga agatccaatg ctcccagcct atattgttct caccgaaagt gcctgcgtat 5400 attcatccaa ggaagtatct cgtggaaaca ccaccggtag acgagactcc ggagccatcg 5460 gcagagaacc aatccacaga ggggacacct gaacaaccac cacttataac cgaggatgag 5520 accaggacta gaacgcctga gccgatcatc atcgaagagg aagaagagga tagcataagt 5580 ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg aggcagacat tcacgggccg 5640 ccctctgtat ctagctcatc ctggtccatt cctcatgcat ccgactttga tgtggacagt 5700 ttatccatac ttgacaccct ggagggagct agcgtgacca gcggggcaac gtcagccgag 5760 actaactctt acttcgcaaa gagtatggag tttctggcgc gaccggtgcc tgcgcctcga 5820 acagtattca ggaaccctcc acatcccgct ccgcgcacaa gaacaccgtc acttgcaccc 5880 agcagggcct gctcgagaac cagcctagtt tccaccccgc caggcgtgaa tagggtgatc 5940 actagagagg agctcgaggc gcttaccccg tcacgcactc ctagcaggtc ggtctcgaga 6000 accagcctgg tctccaaccc gccaggcgta aatagggtga ttacaagaga ggagtttgag 6060 gcgttcgtag cacaacaaca atgacggttt gatgcgggtg catacatctt ttcctccgac 6120 accggtcaag ggcatttaca acaaaaatca gtaaggcaaa cggtgctatc cgaagtggtg 6180 ttggagagga ccgaattgga gatttcgtat gccccgcgcc tcgaccaaga aaaagaagaa 6240 ttactacgca agaaattaca gttaaatccc acacctgcta acagaagcag ataccagtcc 6300 aggaaggtgg agaacatgaa agccataaca gctagacgta ttctgcaagg cctagggcat 6360 tatttgaagg cagaaggaaa agtggagtgc taccgaaccc tgcatcctgt tcctttgtat 6420 tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg cagtggaagc ctgtaacgcc 6480 atgttgaaag agaactttcc gactgtggct tcttactgta ttattccaga gtacgatgcc 6540 tatttggaca tggttgacgg agcttcatgc tgcttagaca ctgccagttt ttgccctgca 6600 aagctgcgca gctttccaaa gaaacactcc tatttggaac ccacaatacg atcggcagtg 6660 ccttcagcga tccagaacac gctccagaac gtcctggcag ctgccacaaa aagaaattgc 6720 aatgtcacgc aaatgagaga attgcccgta ttggattcgg cggcctttaa tgtggaatgc 6780 ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt ttaaagaaaa ccccatcagg 6840 cttactgaag aaaacgtggt aaattacatt accaaattaa aaggaccaaa agctgctgct 6900 ctttttgcga agacacataa tttgaatatg ttgcaggaca taccaatgga caggtttgta 6960 atggacttaa agagagacgt gaaagtgact ccaggaacaa aacatactga agaacggccc 7020 aaggtacagg tgatccaggc tgccgatccg ctagcaacag cgtatctgtg cggaatccac 7080 cgagagctgg ttaggagatt aaatgcggtc ctgcttccga acattcatac actgtttgat 7140 atgtcggctg aagactttga cgctattata gccgagcact tccagcctgg ggattgtgtt 7200 ctggaaactg acatcgcgtc gtttgataaa agtgaggacg acgccatggc tctgaccgcg 7260 ttaatgattc tggaagactt aggtgtggac gcagagctgt tgacgctgat tgaggcggct 7320 ttcggcgaaa tttcatcaat acatttgccc actaaaacta aatttaaatt cggagccatg 7380 atgaaatctg gaatgttcct cacactgttt gtgaacacag tcattaacat tgtaatcgca 7440 agcagagtgt tgagagaacg gctaaccgga tcaccatgtg cagcattcat tggagatgac 7500 aatatcgtga aaggagtcaa atcggacaaa ttaatggcag acaggtgcgc cacctggttg 7560 aatatggaag tcaagattat agatgctgtg gtgggcgaga aagcgcctta tttctgtgga 7620 gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc gtgtggcaga ccccctaaaa 7680 aggctgttta agcttggcaa acctctggca gcagacgatg aacatgatga tgacaggaga 7740 agggcattgc atgaagagtc aacacgctgg aaccgagtgg gtattctttc agagctgtgc 7800 aaggcagtag aatcaaggta tgaaaccgta ggaacttcca tcatagttat ggccatgact 7860 actctagcta gcagtgttaa atcattcagc tacctgagag gggcccctat aactctctac 7920 ggctaacctg aatggactac gacatagtct agtccgccaa gatatcatgc agtggaactc 7980 aactactttc catcagaccc ttcaggaccc tagagtgcgc gggctgtact ttcctgctgg 8040 gggaagcagt agcgggaccg ttaatccagt acctacgacc gcctctccca tatcttctat 8100 ctttagtagg actggtgacc ctgctcccaa catggagaat atcacctccg ggtttctggg 8160 cccactcctg gtccttcagg ccggattctt cctgctgact cgaatcctca ccatacccca 8220 gagcctggac agctggtgga caagcctgaa ttttctggga ggaactcctg tatgcctggg 8280 acaaaattca cagtccccta caagtaacca ttcaccgaca agttgtcctc ccatctgtcc 8340 cggatacagg tggatgtgcc tgcgaaggtt catcatcttc ctcttcatcc tcttgctttg 8400 ccttattttc ctcctggttc ttctggacta tcagggcatg ctgcctgtgt gcccactgat 8460 accaggatct agtactacca gcacaggccc gtgtaagacc tgtacaattc cagcacaagg 8520 gactagtatg ttcccctcct gctgttgtac taagccaagc gacggtaatt gcacgtgtat 8580 cccaatcccg tcctcctggg cgtttgccaa gtacctctgg gaatgggcct cagtcagatt 8640 ttcatggctt agtcttttgg tgccgttcgt gcagtggttt gtgggactct ctccgactgt 8700 gtggctcagc gtgatctgga tgatgtggta ctggggccct tccctttaca acatactgtc 8760 tccattcctt cccctgctgc caatcttctt ttgcctgtgg gtctatattg ggtccggagc 8820 gactaacttt tccctgctga aacaagcggg tgacgtcgaa gagaatccgg gacctatggc 8880 taggcccctg tgtacacttt tgctcctgat ggccaccctc gctggagctc tggcaagcgg 8940 tggatggagc tcaaagccgc ggaaagggat gggtactaac ctgtccgtac caaatcccct 9000 gggatttttt ccagaccacc aactcgatcc tgcttttggc gcaaattcca acaatcccga 9060 ctgggacttt aaccctaaca aggaccactg gcctgatgcc aacaaggtgg gggcaggagc 9120 ctttggtccc ggcttcaccc caccccatgg aggtcttttg ggatggtcac cacaggccca 9180 gggcatcctg accactgtcc ctgctgctcc accgccagct tctactaatc gacagagcgg 9240 gaggcagccg acccccctga gtccccccct gcgggatacc caccctcagg caggatcagg 9300 cgctacgaat tttagccttc tgaagcaagc gggagacgtt gaagaaaacc cagggcctat 9360 ggctcgacct ctgtgtaccc tgctactcct gatggctacc ctggctggag ctctggccag 9420 catgcccctg tcttaccagc actttagaaa gcttctgctg ctggacgatg aagccgggcc 9480 tctggaggaa gagctgccaa ggctggcaga cgaggggctg aaccggagag tggccgaaga 9540 tctgaatctg ggaaacctga acgtgagcat cccttggact cataaagtcg gcaacttcac 9600 cgggctgtac agctccacag tgcctgtctt caatccagag tggcagacac catcctttcc 9660 caacattcac ctgcaggagg acatcattaa tagatgcgaa cagttcgtgg gacctctgac 9720 agtcaacgaa aagaggcgcc tgaaactgat catgcctgcc aggttttacc caaatgtgac 9780 taagtatctg ccactggata agggcatcaa gccttactat ccagagcacc tggtgaacca 9840 ttacttccag actagacact atctgcatac cctgtggaag gccggaatcc tgtacaaacg 9900 agaaactacc cggagtgctt cattttgtgg ctccccatat tcttgggaac aggagctgca 9960 gcatggcagg ctggtgttcc agaccagcaa acgccacggg gatgagtcct tttgcagcca 10020 gtctagtggc atcctgagca gatcccccgt ggggccttgt attcagtctc agctgcggaa 10080 gagtagactg ggactgcagc cacagcaggg acacctggca cgacggcagc agggaaggtc 10140 tggcagtatc cgggctagag tgcatcccac aactagaagg accttcggcg tcgagccatc 10200 aggaagcggc cacatcgaca acagcgcatc aagctcctct agttgcctgc atcagtcagc 10260 cgtgagaaag gccgcttaca gccacctgtc cacatctaaa aggcactcaa gctccgggca 10320 tgctgtggag ctgcacaaca tccctccaaa ttctgcacgc agtcagtcag aaggacccgt 10380 gttcagctgc tggtggctgc agtttcggaa ctcaaagcct tgcagcgact attgtctgag 10440 ccatattgtg aatctgctgg aggattgggg cccttgtacc gagcacgggg aacaccatat 10500 caggattcca cgaacaccag cacgagtgac tggaggggtg ttcctggtgg acaagaaccc 10560 ccacaatact accgagagcc ggctggtggt cgatttcagt cagttttcaa gaggcaacac 10620 aagggtgtca tggcccaaat tcgccgtccc taatctgcag agtctgacta acctgctgtc 10680 tagtaatctg agctggctgt ccctggacgt gtccgcagcc ttttaccacc tgcctctgca 10740 tccagctgca atgccccatc tgctggtggg gtcaagcgga ctgagtcgct acgtcgcccg 10800 actgtcctct aactcacgca tcattaatca ccagcatggc accatgcaga acctgcacga 10860 tagctgttcc cggaatctgt acgtgtctct gctgctgctg tataagacat tcggcagaaa 10920 actgcacctg tacagccatc ctatcattct ggggtttagg aagatcccaa tgggagtggg 10980 actgagcccc ttcctgctgg cacagtttac ctccgccatt tgctctgtgg tccgccgagc 11040 cttcccacac tgtctggctt tttcctatat gaacaatgtg gtcctgggcg ccaaatccgt 11100 gcagcatctg gagtctctgt tcacagctgt cactaacttt ctgctgagcc tggggatcca 11160 cctgaaccca aataagacta aacgctgggg gtacagcctg aatttcatgg gatatgtgat 11220 tggatcctgg gggaccctgc cacaggagca catcgtgcag aagatcaagg aatgctttcg 11280 gaagctgccc gtcaacagac ctatcgactg gaaagtgtgc cagcggattg tcggactgct 11340 gggcttcgcc gctcccttta cccagtgcgg gtacccagca ctgatgcccc tgtatgcctg 11400 tatccagtct aagcaggctt tcacctttag tcctacatac aaggcattcc tgtgcaaaca 11460 gtacctgaac ctgtatccag tggcaaggca gcgacctgga ctgtgccagg tctttgcaaa 11520 tgccactcct accggctggg ggctggctat cggacatcag cgaatgcggg gcacattcgt 11580 ggcccccctg cctattcaca ctgctcagct gctggcagcc tgctttgcta gatctaggag 11640 tggagcaaag ctgatcggca ccgacaatag tgtggtcctg tcaagaaaat acacatcctt 11700 cccatggctg ctgggatgtg ctgcaaactg gattctgagg ggcaccagct tcgtgtacgt 11760 cccctcagcc ctgaatcctg ctgacgatcc atcccgcggg cgactgggac tgtaccgacc 11820 tctgctgaga ctgcccttca ggcctacaac tggccggaca tctctgtatg ccgattcacc 11880 aagcgtgccc tcacacctgc ctgacagagt ccactttgct tcacccctgc acgtcgcttg 11940 gcggcctcca ggaagcggag ctactaactt cagcctgctg aagcaggctg gagacgtgga 12000 ggagaaccct ggacctatgg ctcgacctct gtgtaccctg ctactcctga tggctaccct 12060 ggctggagct ctggccagcg acatcgaccc ttacaaggag ttcggcgcca gcgtggaact 12120 gctgtctttt ctgcccagtg atttctttcc ttccattcga gacctgctgg ataccgcctc 12180 tgctctgtat cgggaagccc tggagagccc agaacactgc tccccacacc ataccgctct 12240 gcgacaggca atcctgtgct ggggggagct gatgaacctg gccacatggg tgggatcgaa 12300 tctggaggac cccgcttcac gggaactggt ggtcagctac gtgaacgtca atatgggcct 12360 gaaaatccgc cagctgctgt ggttccatat tagctgcctg acttttggac gagagaccgt 12420 gctggaatac ctggtgtcct tcggcgtctg gattcgcact ccccctgctt atcgaccacc 12480 caacgcacca attctgtcca ccctgcccga gaccacagtg gtccgtcgcc gttaaggcgc 12540 gccgtttaaa cggccggcct taattaagta acgatacagc agcaattggc aagctgctta 12600 catagaactc gcggcgattg gcatgccgct ttaaaatttt tattttattt ttcttttctt 12660 ttccgaatcg gattttgttt ttaatatttc aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 12720 aaaaaaaaaa 12730 <210> 71 <211> 13254 <212> DNA <213> Artificial Sequence <220> <223> Pol-2A-Core-IRES (EMCV)-PreS2.S-2A-preS1 Replicon <400> 71 ataggcggcg catgagagaa gcccagacca attacctacc caaataggag aaagttcacg 60 ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120 aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180 tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240 tagtcagcat agtacatttc atctgactaa tactacaaca ccaccaccat gaatagagga 300 ttctttaaca tgctcggccg ccgccccttc ccggccccca ctgccatgtg gaggccgcgg 360 agaaggaggc aggcggcccc gggaagcgga gctactaact tcagcctgct gaagcaggct 420 ggagacgtgg aggagaaccc tggacctgag aaagttcacg ttgacatcga ggaagacagc 480 ccattcctca gagctttgca gcggagcttc ccgcagtttg aggtagaagc caagcaggtc 540 actgataatg accatgctaa tgccagagcg ttttcgcatc tggcttcaaa actgatcgaa 600 acggaggtgg acccatccga cacgatcctt gacattggaa gtgcgcccgc ccgcagaatg 660 tattctaagc acaagtatca ttgtatctgt ccgatgagat gtgcggaaga tccggacaga 720 ttgtataagt atgcaactaa gctgaagaaa aactgtaagg aaataactga taaggaattg 780 gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc ctgacctgga aactgagact 840 atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc aagtcgctgt ttaccaggat 900 gtatacgcgg ttgacggacc gacaagtctc tatcaccaag ccaataaggg agttagagtc 960 gcctactgga taggctttga caccacccct tttatgttta agaacttggc tggagcatat 1020 ccatcatact ctaccaactg ggccgacgaa accgtgttaa cggctcgtaa cataggccta 1080 tgcagctctg acgttatgga gcggtcacgt agagggatgt ccattcttag aaagaagtat 1140 ttgaaaccat ccaacaatgt tctattctct gttggctcga ccatctacca cgagaagagg 1200 gacttactga ggagctggca cctgccgtct gtatttcact tacgtggcaa gcaaaattac 1260 acatgtcggt gtgagactat agttagttgc gacgggtacg tcgttaaaag aatagctatc 1320 agtccaggcc tgtatgggaa gccttcaggc tatgctgcta cgatgcaccg cgagggattc 1380 ttgtgctgca aagtgacaga cacattgaac ggggagaggg tctcttttcc cgtgtgcacg 1440 tatgtgccag ctacattgtg tgaccaaatg actggcatac tggcaacaga tgtcagtgcg 1500 gacgacgcgc aaaaactgct ggttgggctc aaccagcgta tagtcgtcaa cggtcgcacc 1560 cagagaaaca ccaataccat gaaaaattac cttttgcccg tagtggccca ggcatttgct 1620 aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa ggccactagg actacgagat 1680 agacagttag tcatggggtg ttgttgggct tttagaaggc acaagataac atctatttat 1740 aagcgcccgg atacccaaac catcatcaaa gtgaacagcg atttccactc attcgtgctg 1800 cccaggatag gcagtaacac attggagatc gggctgagaa caagaatcag gaaaatgtta 1860 gaggagcaca aggagccgtc acctctcatt accgccgagg acgtacaaga agctaagtgc 1920 gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt tgcgcgcagc tctaccacct 1980 ttggcagctg atgttgagga gcccactctg gaagccgatg tcgacttgat gttacaagag 2040 gctggggccg gctcagtgga gacacctcgt ggcttgataa aggttaccag ctacgatggc 2100 gaggacaaga tcggctctta cgctgtgctt tctccgcagg ctgtactcaa gagtgaaaaa 2160 ttatcttgca tccaccctct cgctgaacaa gtcatagtga taacacactc tggccgaaaa 2220 gggcgttatg ccgtggaacc ataccatggt aaagtagtgg tgccagaggg acatgcaata 2280 cccgtccagg actttcaagc tctgagtgaa agtgccacca ttgtgtacaa cgaacgtgag 2340 ttcgtaaaca ggtacctgca ccatattgcc acacatggag gagcgctgaa cactgatgaa 2400 gaatattaca aaactgtcaa gcccagcgag cacgacggcg aatacctgta cgacatcgac 2460 aggaaacagt gcgtcaagaa agaactagtc actgggctag ggctcacagg cgagctggtg 2520 gatcctccct tccatgaatt cgcctacgag agtctgagaa cacgaccagc cgctccttac 2580 caagtaccaa ccataggggt gtatggcgtg ccaggatcag gcaagtctgg catcattaaa 2640 agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga aagaaaactg tgcagaaatt 2700 ataagggacg tcaagaaaat gaaagggctg gacgtcaatg ccagaactgt ggactcagtg 2760 ctcttgaatg gatgcaaaca ccccgtagag accctgtata ttgacgaagc ttttgcttgt 2820 catgcaggta ctctcagagc gctcatagcc attataagac ctaaaaaggc agtgctctgc 2880 ggggatccca aacagtgcgg tttttttaac atgatgtgcc tgaaagtgca ttttaaccac 2940 gagatttgca cacaagtctt ccacaaaagc atctctcgcc gttgcactaa atctgtgact 3000 tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa cgacgaatcc gaaagagact 3060 aagattgtga ttgacactac cggcagtacc aaacctaagc aggacgatct cattctcact 3120 tgtttcagag ggtgggtgaa gcagttgcaa atagattaca aaggcaacga aataatgacg 3180 gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg ccgttcggta caaggtgaat 3240 gaaaatcctc tgtacgcacc cacctctgaa catgtgaacg tcctactgac ccgcacggag 3300 gaccgcatcg tgtggaaaac actagccggc gacccatgga taaaaacact gactgccaag 3360 taccctggga atttcactgc cacgatagag gagtggcaag cagagcatga tgccatcatg 3420 aggcacatct tggagagacc ggaccctacc gacgtcttcc agaataaggc aaacgtgtgt 3480 tgggccaagg ctttagtgcc ggtgctgaag accgctggca tagacatgac cactgaacaa 3540 tggaacactg tggattattt tgaaacggac aaagctcact cagcagagat agtattgaac 3600 caactatgcg tgaggttctt tggactcgat ctggactccg gtctattttc tgcacccact 3660 gttccgttat ccattaggaa taatcactgg gataactccc cgtcgcctaa catgtacggg 3720 ctgaataaag aagtggtccg tcagctctct cgcaggtacc cacaactgcc tcgggcagtt 3780 gccactggaa gagtctatga catgaacact ggtacactgc gcaattatga tccgcgcata 3840 aacctagtac ctgtaaacag aagactgcct catgctttag tcctccacca taatgaacac 3900 ccacagagtg acttttcttc attcgtcagc aaattgaagg gcagaactgt cctggtggtc 3960 ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt tgtcagaccg gcctgaggct 4020 accttcagag ctcggctgga tttaggcatc ccaggtgatg tgcccaaata tgacataata 4080 tttgttaatg tgaggacccc atataaatac catcactatc agcagtgtga agaccatgcc 4140 attaagctta gcatgttgac caagaaagct tgtctgcatc tgaatcccgg cggaacctgt 4200 gtcagcatag gttatggtta cgctgacagg gccagcgaaa gcatcattgg tgctatagcg 4260 cggcagttca agttttcccg ggtatgcaaa ccgaaatcct cacttgaaga gacggaagtt 4320 ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc acaatcctta caagctttca 4380 tcaaccttga ccaacattta tacaggttcc agactccacg aagccggatg tgcaccctca 4440 tatcatgtgg tgcgagggga tattgccacg gccaccgaag gagtgattat aaatgctgct 4500 aacagcaaag gacaacctgg cggaggggtg tgcggagcgc tgtataagaa attcccggaa 4560 agcttcgatt tacagccgat cgaagtagga aaagcgcgac tggtcaaagg tgcagctaaa 4620 catatcattc atgccgtagg accaaacttc aacaaagttt cggaggttga aggtgacaaa 4680 cagttggcag aggcttatga gtccatcgct aagattgtca acgataacaa ttacaagtca 4740 gtagcgattc cactgttgtc caccggcatc ttttccggga acaaagatcg actaacccaa 4800 tcattgaacc atttgctgac agctttagac accactgatg cagatgtagc catatactgc 4860 agggacaaga aatgggaaat gactctcaag gaagcagtgg ctaggagaga agcagtggag 4920 gagatatgca tatccgacga ctcttcagtg acagaacctg atgcagagct ggtgagggtg 4980 catccgaaga gttctttggc tggaaggaag ggctacagca caagcgatgg caaaactttc 5040 tcatatttgg aagggaccaa gtttcaccag gcggccaagg atatagcaga aattaatgcc 5100 atgtggcccg ttgcaacgga ggccaatgag caggtatgca tgtatatcct cggagaaagc 5160 atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg aagcctccac accacctagc 5220 acgctgcctt gcttgtgcat ccatgccatg actccagaaa gagtacagcg cctaaaagcc 5280 tcacgtccag aacaaattac tgtgtgctca tcctttccat tgccgaagta tagaatcact 5340 ggtgtgcaga agatccaatg ctcccagcct atattgttct caccgaaagt gcctgcgtat 5400 attcatccaa ggaagtatct cgtggaaaca ccaccggtag acgagactcc ggagccatcg 5460 gcagagaacc aatccacaga ggggacacct gaacaaccac cacttataac cgaggatgag 5520 accaggacta gaacgcctga gccgatcatc atcgaagagg aagaagagga tagcataagt 5580 ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg aggcagacat tcacgggccg 5640 ccctctgtat ctagctcatc ctggtccatt cctcatgcat ccgactttga tgtggacagt 5700 ttatccatac ttgacaccct ggagggagct agcgtgacca gcggggcaac gtcagccgag 5760 actaactctt acttcgcaaa gagtatggag tttctggcgc gaccggtgcc tgcgcctcga 5820 acagtattca ggaaccctcc acatcccgct ccgcgcacaa gaacaccgtc acttgcaccc 5880 agcagggcct gctcgagaac cagcctagtt tccaccccgc caggcgtgaa tagggtgatc 5940 actagagagg agctcgaggc gcttaccccg tcacgcactc ctagcaggtc ggtctcgaga 6000 accagcctgg tctccaaccc gccaggcgta aatagggtga ttacaagaga ggagtttgag 6060 gcgttcgtag cacaacaaca atgacggttt gatgcgggtg catacatctt ttcctccgac 6120 accggtcaag ggcatttaca acaaaaatca gtaaggcaaa cggtgctatc cgaagtggtg 6180 ttggagagga ccgaattgga gatttcgtat gccccgcgcc tcgaccaaga aaaagaagaa 6240 ttactacgca agaaattaca gttaaatccc acacctgcta acagaagcag ataccagtcc 6300 aggaaggtgg agaacatgaa agccataaca gctagacgta ttctgcaagg cctagggcat 6360 tatttgaagg cagaaggaaa agtggagtgc taccgaaccc tgcatcctgt tcctttgtat 6420 tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg cagtggaagc ctgtaacgcc 6480 atgttgaaag agaactttcc gactgtggct tcttactgta ttattccaga gtacgatgcc 6540 tatttggaca tggttgacgg agcttcatgc tgcttagaca ctgccagttt ttgccctgca 6600 aagctgcgca gctttccaaa gaaacactcc tatttggaac ccacaatacg atcggcagtg 6660 ccttcagcga tccagaacac gctccagaac gtcctggcag ctgccacaaa aagaaattgc 6720 aatgtcacgc aaatgagaga attgcccgta ttggattcgg cggcctttaa tgtggaatgc 6780 ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt ttaaagaaaa ccccatcagg 6840 cttactgaag aaaacgtggt aaattacatt accaaattaa aaggaccaaa agctgctgct 6900 ctttttgcga agacacataa tttgaatatg ttgcaggaca taccaatgga caggtttgta 6960 atggacttaa agagagacgt gaaagtgact ccaggaacaa aacatactga agaacggccc 7020 aaggtacagg tgatccaggc tgccgatccg ctagcaacag cgtatctgtg cggaatccac 7080 cgagagctgg ttaggagatt aaatgcggtc ctgcttccga acattcatac actgtttgat 7140 atgtcggctg aagactttga cgctattata gccgagcact tccagcctgg ggattgtgtt 7200 ctggaaactg acatcgcgtc gtttgataaa agtgaggacg acgccatggc tctgaccgcg 7260 ttaatgattc tggaagactt aggtgtggac gcagagctgt tgacgctgat tgaggcggct 7320 ttcggcgaaa tttcatcaat acatttgccc actaaaacta aatttaaatt cggagccatg 7380 atgaaatctg gaatgttcct cacactgttt gtgaacacag tcattaacat tgtaatcgca 7440 agcagagtgt tgagagaacg gctaaccgga tcaccatgtg cagcattcat tggagatgac 7500 aatatcgtga aaggagtcaa atcggacaaa ttaatggcag acaggtgcgc cacctggttg 7560 aatatggaag tcaagattat agatgctgtg gtgggcgaga aagcgcctta tttctgtgga 7620 gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc gtgtggcaga ccccctaaaa 7680 aggctgttta agcttggcaa acctctggca gcagacgatg aacatgatga tgacaggaga 7740 agggcattgc atgaagagtc aacacgctgg aaccgagtgg gtattctttc agagctgtgc 7800 aaggcagtag aatcaaggta tgaaaccgta ggaacttcca tcatagttat ggccatgact 7860 actctagcta gcagtgttaa atcattcagc tacctgagag gggcccctat aactctctac 7920 ggctaacctg aatggactac gacatagtct agtccgccaa gatatcatgg ctcgacctct 7980 gtgtaccctg ctactcctga tggctaccct ggctggagct ctggccagca tgcccctgtc 8040 ttaccagcac tttagaaagc ttctgctgct ggacgatgaa gccgggcctc tggaggaaga 8100 gctgccaagg ctggcagacg aggggctgaa ccggagagtg gccgaagatc tgaatctggg 8160 aaacctgaac gtgagcatcc cttggactca taaagtcggc aacttcaccg ggctgtacag 8220 ctccacagtg cctgtcttca atccagagtg gcagacacca tcctttccca acattcacct 8280 gcaggaggac atcattaata gatgcgaaca gttcgtggga cctctgacag tcaacgaaaa 8340 gaggcgcctg aaactgatca tgcctgccag gttttaccca aatgtgacta agtatctgcc 8400 actggataag ggcatcaagc cttactatcc agagcacctg gtgaaccatt acttccagac 8460 tagacactat ctgcataccc tgtggaaggc cggaatcctg tacaaacgag aaactacccg 8520 gagtgcttca ttttgtggct ccccatattc ttgggaacag gagctgcagc atggcaggct 8580 ggtgttccag accagcaaac gccacgggga tgagtccttt tgcagccagt ctagtggcat 8640 cctgagcaga tcccccgtgg ggccttgtat tcagtctcag ctgcggaaga gtagactggg 8700 actgcagcca cagcagggac acctggcacg acggcagcag ggaaggtctg gcagtatccg 8760 ggctagagtg catcccacaa ctagaaggac cttcggcgtc gagccatcag gaagcggcca 8820 catcgacaac agcgcatcaa gctcctctag ttgcctgcat cagtcagccg tgagaaaggc 8880 cgcttacagc cacctgtcca catctaaaag gcactcaagc tccgggcatg ctgtggagct 8940 gcacaacatc cctccaaatt ctgcacgcag tcagtcagaa ggacccgtgt tcagctgctg 9000 gtggctgcag tttcggaact caaagccttg cagcgactat tgtctgagcc atattgtgaa 9060 tctgctggag gattggggcc cttgtaccga gcacggggaa caccatatca ggattccacg 9120 aacaccagca cgagtgactg gaggggtgtt cctggtggac aagaaccccc acaatactac 9180 cgagagccgg ctggtggtcg atttcagtca gttttcaaga ggcaacacaa gggtgtcatg 9240 gcccaaattc gccgtcccta atctgcagag tctgactaac ctgctgtcta gtaatctgag 9300 ctggctgtcc ctggacgtgt ccgcagcctt ttaccacctg cctctgcatc cagctgcaat 9360 gccccatctg ctggtggggt caagcggact gagtcgctac gtcgcccgac tgtcctctaa 9420 ctcacgcatc attaatcacc agcatggcac catgcagaac ctgcacgata gctgttcccg 9480 gaatctgtac gtgtctctgc tgctgctgta taagacattc ggcagaaaac tgcacctgta 9540 cagccatcct atcattctgg ggtttaggaa gatcccaatg ggagtgggac tgagcccctt 9600 cctgctggca cagtttacct ccgccatttg ctctgtggtc cgccgagcct tcccacactg 9660 tctggctttt tcctatatga acaatgtggt cctgggcgcc aaatccgtgc agcatctgga 9720 gtctctgttc acagctgtca ctaactttct gctgagcctg gggatccacc tgaacccaaa 9780 taagactaaa cgctgggggt acagcctgaa tttcatggga tatgtgattg gatcctgggg 9840 gaccctgcca caggagcaca tcgtgcagaa gatcaaggaa tgctttcgga agctgcccgt 9900 caacagacct atcgactgga aagtgtgcca gcggattgtc ggactgctgg gcttcgccgc 9960 tccctttacc cagtgcgggt acccagcact gatgcccctg tatgcctgta tccagtctaa 10020 gcaggctttc acctttagtc ctacatacaa ggcattcctg tgcaaacagt acctgaacct 10080 gtatccagtg gcaaggcagc gacctggact gtgccaggtc tttgcaaatg ccactcctac 10140 cggctggggg ctggctatcg gacatcagcg aatgcggggc acattcgtgg cccccctgcc 10200 tattcacact gctcagctgc tggcagcctg ctttgctaga tctaggagtg gagcaaagct 10260 gatcggcacc gacaatagtg tggtcctgtc aagaaaatac acatccttcc catggctgct 10320 gggatgtgct gcaaactgga ttctgagggg caccagcttc gtgtacgtcc cctcagccct 10380 gaatcctgct gacgatccat cccgcgggcg actgggactg taccgacctc tgctgagact 10440 gcccttcagg cctacaactg gccggacatc tctgtatgcc gattcaccaa gcgtgccctc 10500 acacctgcct gacagagtcc actttgcttc acccctgcac gtcgcttggc ggcctccagg 10560 aagcggagct actaacttca gcctgctgaa gcaggctgga gacgtggagg agaaccctgg 10620 acctatggct cgacctctgt gtaccctgct actcctgatg gctaccctgg ctggagctct 10680 ggccagcgac atcgaccctt acaaggagtt cggcgccagc gtggaactgc tgtcttttct 10740 gcccagtgat ttctttcctt ccattcgaga cctgctggat accgcctctg ctctgtatcg 10800 ggaagccctg gagagcccag aacactgctc cccacaccat accgctctgc gacaggcaat 10860 cctgtgctgg ggggagctga tgaacctggc cacatgggtg ggatcgaatc tggaggaccc 10920 cgcttcacgg gaactggtgg tcagctacgt gaacgtcaat atgggcctga aaatccgcca 10980 gctgctgtgg ttccatatta gctgcctgac ttttggacga gagaccgtgc tggaatacct 11040 ggtgtccttc ggcgtctgga ttcgcactcc ccctgcttat cgaccaccca acgcaccaat 11100 tctgtccacc ctgcccgaga ccacagtggt ccgtcgccgt taagcccctc tccctccccc 11160 ccccctaacg ttactggccg aagccgcttg gaataaggcc ggtgtgcgtt tgtctatatg 11220 ttattttcca ccatattgcc gtcttttggc aatgtgaggg cccggaaacc tggccctgtc 11280 ttcttgacga gcattcctag gggtctttcc cctctcgcca aaggaatgca aggtctgttg 11340 aatgtcgtga aggaagcagt tcctctggaa gcttcttgaa gacaaacaac gtctgtagcg 11400 accctttgca ggcagcggaa ccccccacct ggcgacaggt gcctctgcgg ccaaaagcca 11460 cgtgtataag atacacctgc aaaggcggca caaccccagt gccacgttgt gagttggata 11520 gttgtggaaa gagtcaaatg gctctcctca agcgtattca acaaggggct gaaggatgcc 11580 cagaaggtac cccattgtat gggatctgat ctggggcctc ggtgcacatg ctttacatgt 11640 gtttagtcga ggttaaaaaa cgtctaggcc ccccgaacca cggggacgtg gttttccttt 11700 gaaaaacacg atgataatat ggccacaacc atgcagtgga actcaactac tttccatcag 11760 acccttcagg accctagagt gcgcgggctg tactttcctg ctgggggaag cagtagcggg 11820 accgttaatc cagtacctac gaccgcctct cccatatctt ctatctttag taggactggt 11880 gaccctgctc ccaacatgga gaatatcacc tccgggtttc tgggcccact cctggtcctt 11940 caggccggat tcttcctgct gactcgaatc ctcaccatac cccagagcct ggacagctgg 12000 tggacaagcc tgaattttct gggaggaact cctgtatgcc tgggacaaaa ttcacagtcc 12060 cctacaagta accattcacc gacaagttgt cctcccatct gtcccggata caggtggatg 12120 tgcctgcgaa ggttcatcat cttcctcttc atcctcttgc tttgccttat tttcctcctg 12180 gttcttctgg actatcaggg catgctgcct gtgtgcccac tgataccagg atctagtact 12240 accagcacag gcccgtgtaa gacctgtaca attccagcac aagggactag tatgttcccc 12300 tcctgctgtt gtactaagcc aagcgacggt aattgcacgt gtatcccaat cccgtcctcc 12360 tgggcgtttg ccaagtacct ctgggaatgg gcctcagtca gattttcatg gcttagtctt 12420 ttggtgccgt tcgtgcagtg gtttgtggga ctctctccga ctgtgtggct cagcgtgatc 12480 tggatgatgt ggtactgggg cccttccctt tacaacatac tgtctccatt ccttcccctg 12540 ctgccaatct tcttttgcct gtgggtctat attgggtccg gagcgactaa cttttccctg 12600 ctgaaacaag cgggtgacgt cgaagagaat ccgggaccta tggctaggcc cctgtgtaca 12660 cttttgctcc tgatggccac cctcgctgga gctctggcaa gcggtggatg gagctcaaag 12720 ccgcggaaag ggatgggtac taacctgtcc gtaccaaatc ccctgggatt ttttccagac 12780 caccaactcg atcctgcttt tggcgcaaat tccaacaatc ccgactggga ctttaaccct 12840 aacaaggacc actggcctga tgccaacaag gtgggggcag gagcctttgg tcccggcttc 12900 accccacccc atggaggtct tttgggatgg tcaccacagg cccagggcat cctgaccact 12960 gtccctgctg ctccaccgcc agcttctact aatcgacaga gcgggaggca gccgaccccc 13020 ctgagtcccc ccctgcggga tacccaccct caggcataag gcgcgccgtt taaacggccg 13080 gccttaatta agtaacgata cagcagcaat tggcaagctg cttacataga actcgcggcg 13140 attggcatgc cgctttaaaa tttttatttt atttttcttt tcttttccga atcggatttt 13200 gtttttaata tttcaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaa 13254 <210> 72 <211> 13414 <212> DNA <213> Artificial Sequence <220> <223> Pol-2A-Core-IRES (EV71)-PreS2.S-2A-preS1 Replicon <400> 72 ataggcggcg catgagagaa gcccagacca attacctacc caaataggag aaagttcacg 60 ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120 aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180 tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240 tagtcagcat agtacatttc atctgactaa tactacaaca ccaccaccat gaatagagga 300 ttctttaaca tgctcggccg ccgccccttc ccggccccca ctgccatgtg gaggccgcgg 360 agaaggaggc aggcggcccc gggaagcgga gctactaact tcagcctgct gaagcaggct 420 ggagacgtgg aggagaaccc tggacctgag aaagttcacg ttgacatcga ggaagacagc 480 ccattcctca gagctttgca gcggagcttc ccgcagtttg aggtagaagc caagcaggtc 540 actgataatg accatgctaa tgccagagcg ttttcgcatc tggcttcaaa actgatcgaa 600 acggaggtgg acccatccga cacgatcctt gacattggaa gtgcgcccgc ccgcagaatg 660 tattctaagc acaagtatca ttgtatctgt ccgatgagat gtgcggaaga tccggacaga 720 ttgtataagt atgcaactaa gctgaagaaa aactgtaagg aaataactga taaggaattg 780 gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc ctgacctgga aactgagact 840 atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc aagtcgctgt ttaccaggat 900 gtatacgcgg ttgacggacc gacaagtctc tatcaccaag ccaataaggg agttagagtc 960 gcctactgga taggctttga caccacccct tttatgttta agaacttggc tggagcatat 1020 ccatcatact ctaccaactg ggccgacgaa accgtgttaa cggctcgtaa cataggccta 1080 tgcagctctg acgttatgga gcggtcacgt agagggatgt ccattcttag aaagaagtat 1140 ttgaaaccat ccaacaatgt tctattctct gttggctcga ccatctacca cgagaagagg 1200 gacttactga ggagctggca cctgccgtct gtatttcact tacgtggcaa gcaaaattac 1260 acatgtcggt gtgagactat agttagttgc gacgggtacg tcgttaaaag aatagctatc 1320 agtccaggcc tgtatgggaa gccttcaggc tatgctgcta cgatgcaccg cgagggattc 1380 ttgtgctgca aagtgacaga cacattgaac ggggagaggg tctcttttcc cgtgtgcacg 1440 tatgtgccag ctacattgtg tgaccaaatg actggcatac tggcaacaga tgtcagtgcg 1500 gacgacgcgc aaaaactgct ggttgggctc aaccagcgta tagtcgtcaa cggtcgcacc 1560 cagagaaaca ccaataccat gaaaaattac cttttgcccg tagtggccca ggcatttgct 1620 aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa ggccactagg actacgagat 1680 agacagttag tcatggggtg ttgttgggct tttagaaggc acaagataac atctatttat 1740 aagcgcccgg atacccaaac catcatcaaa gtgaacagcg atttccactc attcgtgctg 1800 cccaggatag gcagtaacac attggagatc gggctgagaa caagaatcag gaaaatgtta 1860 gaggagcaca aggagccgtc acctctcatt accgccgagg acgtacaaga agctaagtgc 1920 gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt tgcgcgcagc tctaccacct 1980 ttggcagctg atgttgagga gcccactctg gaagccgatg tcgacttgat gttacaagag 2040 gctggggccg gctcagtgga gacacctcgt ggcttgataa aggttaccag ctacgatggc 2100 gaggacaaga tcggctctta cgctgtgctt tctccgcagg ctgtactcaa gagtgaaaaa 2160 ttatcttgca tccaccctct cgctgaacaa gtcatagtga taacacactc tggccgaaaa 2220 gggcgttatg ccgtggaacc ataccatggt aaagtagtgg tgccagaggg acatgcaata 2280 cccgtccagg actttcaagc tctgagtgaa agtgccacca ttgtgtacaa cgaacgtgag 2340 ttcgtaaaca ggtacctgca ccatattgcc acacatggag gagcgctgaa cactgatgaa 2400 gaatattaca aaactgtcaa gcccagcgag cacgacggcg aatacctgta cgacatcgac 2460 aggaaacagt gcgtcaagaa agaactagtc actgggctag ggctcacagg cgagctggtg 2520 gatcctccct tccatgaatt cgcctacgag agtctgagaa cacgaccagc cgctccttac 2580 caagtaccaa ccataggggt gtatggcgtg ccaggatcag gcaagtctgg catcattaaa 2640 agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga aagaaaactg tgcagaaatt 2700 ataagggacg tcaagaaaat gaaagggctg gacgtcaatg ccagaactgt ggactcagtg 2760 ctcttgaatg gatgcaaaca ccccgtagag accctgtata ttgacgaagc ttttgcttgt 2820 catgcaggta ctctcagagc gctcatagcc attataagac ctaaaaaggc agtgctctgc 2880 ggggatccca aacagtgcgg tttttttaac atgatgtgcc tgaaagtgca ttttaaccac 2940 gagatttgca cacaagtctt ccacaaaagc atctctcgcc gttgcactaa atctgtgact 3000 tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa cgacgaatcc gaaagagact 3060 aagattgtga ttgacactac cggcagtacc aaacctaagc aggacgatct cattctcact 3120 tgtttcagag ggtgggtgaa gcagttgcaa atagattaca aaggcaacga aataatgacg 3180 gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg ccgttcggta caaggtgaat 3240 gaaaatcctc tgtacgcacc cacctctgaa catgtgaacg tcctactgac ccgcacggag 3300 gaccgcatcg tgtggaaaac actagccggc gacccatgga taaaaacact gactgccaag 3360 taccctggga atttcactgc cacgatagag gagtggcaag cagagcatga tgccatcatg 3420 aggcacatct tggagagacc ggaccctacc gacgtcttcc agaataaggc aaacgtgtgt 3480 tgggccaagg ctttagtgcc ggtgctgaag accgctggca tagacatgac cactgaacaa 3540 tggaacactg tggattattt tgaaacggac aaagctcact cagcagagat agtattgaac 3600 caactatgcg tgaggttctt tggactcgat ctggactccg gtctattttc tgcacccact 3660 gttccgttat ccattaggaa taatcactgg gataactccc cgtcgcctaa catgtacggg 3720 ctgaataaag aagtggtccg tcagctctct cgcaggtacc cacaactgcc tcgggcagtt 3780 gccactggaa gagtctatga catgaacact ggtacactgc gcaattatga tccgcgcata 3840 aacctagtac ctgtaaacag aagactgcct catgctttag tcctccacca taatgaacac 3900 ccacagagtg acttttcttc attcgtcagc aaattgaagg gcagaactgt cctggtggtc 3960 ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt tgtcagaccg gcctgaggct 4020 accttcagag ctcggctgga tttaggcatc ccaggtgatg tgcccaaata tgacataata 4080 tttgttaatg tgaggacccc atataaatac catcactatc agcagtgtga agaccatgcc 4140 attaagctta gcatgttgac caagaaagct tgtctgcatc tgaatcccgg cggaacctgt 4200 gtcagcatag gttatggtta cgctgacagg gccagcgaaa gcatcattgg tgctatagcg 4260 cggcagttca agttttcccg ggtatgcaaa ccgaaatcct cacttgaaga gacggaagtt 4320 ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc acaatcctta caagctttca 4380 tcaaccttga ccaacattta tacaggttcc agactccacg aagccggatg tgcaccctca 4440 tatcatgtgg tgcgagggga tattgccacg gccaccgaag gagtgattat aaatgctgct 4500 aacagcaaag gacaacctgg cggaggggtg tgcggagcgc tgtataagaa attcccggaa 4560 agcttcgatt tacagccgat cgaagtagga aaagcgcgac tggtcaaagg tgcagctaaa 4620 catatcattc atgccgtagg accaaacttc aacaaagttt cggaggttga aggtgacaaa 4680 cagttggcag aggcttatga gtccatcgct aagattgtca acgataacaa ttacaagtca 4740 gtagcgattc cactgttgtc caccggcatc ttttccggga acaaagatcg actaacccaa 4800 tcattgaacc atttgctgac agctttagac accactgatg cagatgtagc catatactgc 4860 agggacaaga aatgggaaat gactctcaag gaagcagtgg ctaggagaga agcagtggag 4920 gagatatgca tatccgacga ctcttcagtg acagaacctg atgcagagct ggtgagggtg 4980 catccgaaga gttctttggc tggaaggaag ggctacagca caagcgatgg caaaactttc 5040 tcatatttgg aagggaccaa gtttcaccag gcggccaagg atatagcaga aattaatgcc 5100 atgtggcccg ttgcaacgga ggccaatgag caggtatgca tgtatatcct cggagaaagc 5160 atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg aagcctccac accacctagc 5220 acgctgcctt gcttgtgcat ccatgccatg actccagaaa gagtacagcg cctaaaagcc 5280 tcacgtccag aacaaattac tgtgtgctca tcctttccat tgccgaagta tagaatcact 5340 ggtgtgcaga agatccaatg ctcccagcct atattgttct caccgaaagt gcctgcgtat 5400 attcatccaa ggaagtatct cgtggaaaca ccaccggtag acgagactcc ggagccatcg 5460 gcagagaacc aatccacaga ggggacacct gaacaaccac cacttataac cgaggatgag 5520 accaggacta gaacgcctga gccgatcatc atcgaagagg aagaagagga tagcataagt 5580 ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg aggcagacat tcacgggccg 5640 ccctctgtat ctagctcatc ctggtccatt cctcatgcat ccgactttga tgtggacagt 5700 ttatccatac ttgacaccct ggagggagct agcgtgacca gcggggcaac gtcagccgag 5760 actaactctt acttcgcaaa gagtatggag tttctggcgc gaccggtgcc tgcgcctcga 5820 acagtattca ggaaccctcc acatcccgct ccgcgcacaa gaacaccgtc acttgcaccc 5880 agcagggcct gctcgagaac cagcctagtt tccaccccgc caggcgtgaa tagggtgatc 5940 actagagagg agctcgaggc gcttaccccg tcacgcactc ctagcaggtc ggtctcgaga 6000 accagcctgg tctccaaccc gccaggcgta aatagggtga ttacaagaga ggagtttgag 6060 gcgttcgtag cacaacaaca atgacggttt gatgcgggtg catacatctt ttcctccgac 6120 accggtcaag ggcatttaca acaaaaatca gtaaggcaaa cggtgctatc cgaagtggtg 6180 ttggagagga ccgaattgga gatttcgtat gccccgcgcc tcgaccaaga aaaagaagaa 6240 ttactacgca agaaattaca gttaaatccc acacctgcta acagaagcag ataccagtcc 6300 aggaaggtgg agaacatgaa agccataaca gctagacgta ttctgcaagg cctagggcat 6360 tatttgaagg cagaaggaaa agtggagtgc taccgaaccc tgcatcctgt tcctttgtat 6420 tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg cagtggaagc ctgtaacgcc 6480 atgttgaaag agaactttcc gactgtggct tcttactgta ttattccaga gtacgatgcc 6540 tatttggaca tggttgacgg agcttcatgc tgcttagaca ctgccagttt ttgccctgca 6600 aagctgcgca gctttccaaa gaaacactcc tatttggaac ccacaatacg atcggcagtg 6660 ccttcagcga tccagaacac gctccagaac gtcctggcag ctgccacaaa aagaaattgc 6720 aatgtcacgc aaatgagaga attgcccgta ttggattcgg cggcctttaa tgtggaatgc 6780 ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt ttaaagaaaa ccccatcagg 6840 cttactgaag aaaacgtggt aaattacatt accaaattaa aaggaccaaa agctgctgct 6900 ctttttgcga agacacataa tttgaatatg ttgcaggaca taccaatgga caggtttgta 6960 atggacttaa agagagacgt gaaagtgact ccaggaacaa aacatactga agaacggccc 7020 aaggtacagg tgatccaggc tgccgatccg ctagcaacag cgtatctgtg cggaatccac 7080 cgagagctgg ttaggagatt aaatgcggtc ctgcttccga acattcatac actgtttgat 7140 atgtcggctg aagactttga cgctattata gccgagcact tccagcctgg ggattgtgtt 7200 ctggaaactg acatcgcgtc gtttgataaa agtgaggacg acgccatggc tctgaccgcg 7260 ttaatgattc tggaagactt aggtgtggac gcagagctgt tgacgctgat tgaggcggct 7320 ttcggcgaaa tttcatcaat acatttgccc actaaaacta aatttaaatt cggagccatg 7380 atgaaatctg gaatgttcct cacactgttt gtgaacacag tcattaacat tgtaatcgca 7440 agcagagtgt tgagagaacg gctaaccgga tcaccatgtg cagcattcat tggagatgac 7500 aatatcgtga aaggagtcaa atcggacaaa ttaatggcag acaggtgcgc cacctggttg 7560 aatatggaag tcaagattat agatgctgtg gtgggcgaga aagcgcctta tttctgtgga 7620 gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc gtgtggcaga ccccctaaaa 7680 aggctgttta agcttggcaa acctctggca gcagacgatg aacatgatga tgacaggaga 7740 agggcattgc atgaagagtc aacacgctgg aaccgagtgg gtattctttc agagctgtgc 7800 aaggcagtag aatcaaggta tgaaaccgta ggaacttcca tcatagttat ggccatgact 7860 actctagcta gcagtgttaa atcattcagc tacctgagag gggcccctat aactctctac 7920 ggctaacctg aatggactac gacatagtct agtccgccaa gatatcatgg ctcgacctct 7980 gtgtaccctg ctactcctga tggctaccct ggctggagct ctggccagca tgcccctgtc 8040 ttaccagcac tttagaaagc ttctgctgct ggacgatgaa gccgggcctc tggaggaaga 8100 gctgccaagg ctggcagacg aggggctgaa ccggagagtg gccgaagatc tgaatctggg 8160 aaacctgaac gtgagcatcc cttggactca taaagtcggc aacttcaccg ggctgtacag 8220 ctccacagtg cctgtcttca atccagagtg gcagacacca tcctttccca acattcacct 8280 gcaggaggac atcattaata gatgcgaaca gttcgtggga cctctgacag tcaacgaaaa 8340 gaggcgcctg aaactgatca tgcctgccag gttttaccca aatgtgacta agtatctgcc 8400 actggataag ggcatcaagc cttactatcc agagcacctg gtgaaccatt acttccagac 8460 tagacactat ctgcataccc tgtggaaggc cggaatcctg tacaaacgag aaactacccg 8520 gagtgcttca ttttgtggct ccccatattc ttgggaacag gagctgcagc atggcaggct 8580 ggtgttccag accagcaaac gccacgggga tgagtccttt tgcagccagt ctagtggcat 8640 cctgagcaga tcccccgtgg ggccttgtat tcagtctcag ctgcggaaga gtagactggg 8700 actgcagcca cagcagggac acctggcacg acggcagcag ggaaggtctg gcagtatccg 8760 ggctagagtg catcccacaa ctagaaggac cttcggcgtc gagccatcag gaagcggcca 8820 catcgacaac agcgcatcaa gctcctctag ttgcctgcat cagtcagccg tgagaaaggc 8880 cgcttacagc cacctgtcca catctaaaag gcactcaagc tccgggcatg ctgtggagct 8940 gcacaacatc cctccaaatt ctgcacgcag tcagtcagaa ggacccgtgt tcagctgctg 9000 gtggctgcag tttcggaact caaagccttg cagcgactat tgtctgagcc atattgtgaa 9060 tctgctggag gattggggcc cttgtaccga gcacggggaa caccatatca ggattccacg 9120 aacaccagca cgagtgactg gaggggtgtt cctggtggac aagaaccccc acaatactac 9180 cgagagccgg ctggtggtcg atttcagtca gttttcaaga ggcaacacaa gggtgtcatg 9240 gcccaaattc gccgtcccta atctgcagag tctgactaac ctgctgtcta gtaatctgag 9300 ctggctgtcc ctggacgtgt ccgcagcctt ttaccacctg cctctgcatc cagctgcaat 9360 gccccatctg ctggtggggt caagcggact gagtcgctac gtcgcccgac tgtcctctaa 9420 ctcacgcatc attaatcacc agcatggcac catgcagaac ctgcacgata gctgttcccg 9480 gaatctgtac gtgtctctgc tgctgctgta taagacattc ggcagaaaac tgcacctgta 9540 cagccatcct atcattctgg ggtttaggaa gatcccaatg ggagtgggac tgagcccctt 9600 cctgctggca cagtttacct ccgccatttg ctctgtggtc cgccgagcct tcccacactg 9660 tctggctttt tcctatatga acaatgtggt cctgggcgcc aaatccgtgc agcatctgga 9720 gtctctgttc acagctgtca ctaactttct gctgagcctg gggatccacc tgaacccaaa 9780 taagactaaa cgctgggggt acagcctgaa tttcatggga tatgtgattg gatcctgggg 9840 gaccctgcca caggagcaca tcgtgcagaa gatcaaggaa tgctttcgga agctgcccgt 9900 caacagacct atcgactgga aagtgtgcca gcggattgtc ggactgctgg gcttcgccgc 9960 tccctttacc cagtgcgggt acccagcact gatgcccctg tatgcctgta tccagtctaa 10020 gcaggctttc acctttagtc ctacatacaa ggcattcctg tgcaaacagt acctgaacct 10080 gtatccagtg gcaaggcagc gacctggact gtgccaggtc tttgcaaatg ccactcctac 10140 cggctggggg ctggctatcg gacatcagcg aatgcggggc acattcgtgg cccccctgcc 10200 tattcacact gctcagctgc tggcagcctg ctttgctaga tctaggagtg gagcaaagct 10260 gatcggcacc gacaatagtg tggtcctgtc aagaaaatac acatccttcc catggctgct 10320 gggatgtgct gcaaactgga ttctgagggg caccagcttc gtgtacgtcc cctcagccct 10380 gaatcctgct gacgatccat cccgcgggcg actgggactg taccgacctc tgctgagact 10440 gcccttcagg cctacaactg gccggacatc tctgtatgcc gattcaccaa gcgtgccctc 10500 acacctgcct gacagagtcc actttgcttc acccctgcac gtcgcttggc ggcctccagg 10560 aagcggagct actaacttca gcctgctgaa gcaggctgga gacgtggagg agaaccctgg 10620 acctatggct cgacctctgt gtaccctgct actcctgatg gctaccctgg ctggagctct 10680 ggccagcgac atcgaccctt acaaggagtt cggcgccagc gtggaactgc tgtcttttct 10740 gcccagtgat ttctttcctt ccattcgaga cctgctggat accgcctctg ctctgtatcg 10800 ggaagccctg gagagcccag aacactgctc cccacaccat accgctctgc gacaggcaat 10860 cctgtgctgg ggggagctga tgaacctggc cacatgggtg ggatcgaatc tggaggaccc 10920 cgcttcacgg gaactggtgg tcagctacgt gaacgtcaat atgggcctga aaatccgcca 10980 gctgctgtgg ttccatatta gctgcctgac ttttggacga gagaccgtgc tggaatacct 11040 ggtgtccttc ggcgtctgga ttcgcactcc ccctgcttat cgaccaccca acgcaccaat 11100 tctgtccacc ctgcccgaga ccacagtggt ccgtcgccgt taattaaaac agctgtgggt 11160 tgttcccacc cacagggccc actgggcgct agcactctga ttttacgaaa tccttgtgcg 11220 cctgttttat atcccttccc taattcgaaa cgtagaagca atgcgcacca ctgatcaata 11280 gtaggcgtaa cgcgccagtt acgtcatgat caagcatatc tgttcccccg gactgagtat 11340 caatagactg cttacgcggt tgaaggagaa aacgttcgtt atccggctaa ctacttcgag 11400 aagcccagta acaccatgga agctgcaggg tgtttcgctc agcacttccc ccgtgtagat 11460 caggtcgatg agccactgca atccccacag gtgactgtgg cagtggctgc gttggcggcc 11520 tgcctatggg gagacccata ggacgctcta atgtggacat ggtgcgaaga gcctattgag 11580 ctagttagta gtcctccggc ccctgaatgc ggctaatcct aactgcggag cacatgcctt 11640 caacccagag ggtagtgtgt cgtaacgggc aactctgcag cggaaccgac tactttgggt 11700 gtccgtgttt cttttttatt cttatattgg ctgcttatgg tgacaattac agaattgtta 11760 ccatatagct attggattgg ccatccggtg tgtaatagag ctgttatata cctatttgtt 11820 ggctttgtac cactaacttt aaaatctata actaccctca actttatatt aaccctcaat 11880 acagttgacc atgcagtgga actcaactac tttccatcag acccttcagg accctagagt 11940 gcgcgggctg tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac 12000 gaccgcctct cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga 12060 gaatatcacc tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct 12120 gactcgaatc ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct 12180 gggaggaact cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc 12240 gacaagttgt cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat 12300 cttcctcttc atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg 12360 catgctgcct gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa 12420 gacctgtaca attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc 12480 aagcgacggt aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct 12540 ctgggaatgg gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg 12600 gtttgtggga ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg 12660 cccttccctt tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct 12720 gtgggtctat attgggtccg gagcgactaa cttttccctg ctgaaacaag cgggtgacgt 12780 cgaagagaat ccgggaccta tggctaggcc cctgtgtaca cttttgctcc tgatggccac 12840 cctcgctgga gctctggcaa gcggtggatg gagctcaaag ccgcggaaag ggatgggtac 12900 taacctgtcc gtaccaaatc ccctgggatt ttttccagac caccaactcg atcctgcttt 12960 tggcgcaaat tccaacaatc ccgactggga ctttaaccct aacaaggacc actggcctga 13020 tgccaacaag gtgggggcag gagcctttgg tcccggcttc accccacccc atggaggtct 13080 tttgggatgg tcaccacagg cccagggcat cctgaccact gtccctgctg ctccaccgcc 13140 agcttctact aatcgacaga gcgggaggca gccgaccccc ctgagtcccc ccctgcggga 13200 tacccaccct caggcataag gcgcgccgtt taaacggccg gccttaatta agtaacgata 13260 cagcagcaat tggcaagctg cttacataga actcgcggcg attggcatgc cgctttaaaa 13320 tttttatttt atttttcttt tcttttccga atcggatttt gtttttaata tttcaaaaaa 13380 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaa 13414 <210> 73 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> T7 promoter <400> 73 taatacgact cactatag 18 <210> 74 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> YXDD motif <220> <221> misc_feature <222> (2)..(2) <223> Xaa can be any naturally occurring amino acid <400> 74 Tyr Xaa Asp Asp 1 <210> 75 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> DEDD motif <400> 75 Asp Glu Asp Asp 1 <210> 76 <211> 32 <212> PRT <213> Artificial Sequence <220> <223> Core antigen C terminal deletion <400> 76 Arg Gly Arg Ser Pro Arg Arg Arg Thr Pro Ser Pro Arg Arg Arg Arg 1 5 10 15 Ser Gln Ser Pro Arg Arg Arg Arg Ser Gln Ser Arg Glu Ser Gln Cys 20 25 30 <210> 77 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> Cystatin S signal peptide <400> 77 Met Ala Arg Pro Leu Cys Thr Leu Leu Leu Leu Met Ala Thr Leu Ala 1 5 10 15 Gly Ala Leu Ala Ser 20 <210> 78 <211> 681 <212> DNA <213> Artificial Sequence <220> <223> S-surface antigen coding sequence <400> 78 atggagaata tcacctccgg gtttctgggc ccactcctgg tccttcaggc cggattcttc 60 ctgctgactc gaatcctcac cataccccag agcctggaca gctggtggac aagcctgaat 120 tttctgggag gaactcctgt atgcctggga caaaattcac agtcccctac aagtaaccat 180 tcaccgacaa gttgtcctcc catctgtccc ggatacaggt ggatgtgcct gcgaaggttc 240 atcatcttcc tcttcatcct cttgctttgc cttattttcc tcctggttct tctggactat 300 cagggcatgc tgcctgtgtg cccactgata ccaggatcta gtactaccag cacaggcccg 360 tgtaagacct gtacaactcc agcacaaggg actagtatgt tcccctcctg ctgttgtact 420 aagccatcag acggtaattg cacgtgtatc ccaatcccgt cctcctgggc gtttgccaag 480 tttctctggg aatgggcctc agtcagattt tcatggctta gtcttttggt gccgttcgtg 540 cagtggtttg tgggactctc tccgactgtg tggctcagcg tgatctggat gatgtggtac 600 tggggccctt ccctttacaa catactgtct ccattccttc ccctgctgcc aatcttcttt 660 tgcctgtggg tctatattta a 681 <210> 79 <211> 226 <212> PRT <213> Artificial Sequence <220> <223> S-surface antigen <400> 79 Met Glu Asn Ile Thr Ser Gly Phe Leu Gly Pro Leu Leu Val Leu Gln 1 5 10 15 Ala Gly Phe Phe Leu Leu Thr Arg Ile Leu Thr Ile Pro Gln Ser Leu 20 25 30 Asp Ser Trp Trp Thr Ser Leu Asn Phe Leu Gly Gly Thr Pro Val Cys 35 40 45 Leu Gly Gln Asn Ser Gln Ser Pro Thr Ser Asn His Ser Pro Thr Ser 50 55 60 Cys Pro Pro Ile Cys Pro Gly Tyr Arg Trp Met Cys Leu Arg Arg Phe 65 70 75 80 Ile Ile Phe Leu Phe Ile Leu Leu Leu Cys Leu Ile Phe Leu Leu Val 85 90 95 Leu Leu Asp Tyr Gln Gly Met Leu Pro Val Cys Pro Leu Ile Pro Gly 100 105 110 Ser Ser Thr Thr Ser Thr Gly Pro Cys Lys Thr Cys Thr Thr Pro Ala 115 120 125 Gln Gly Thr Ser Met Phe Pro Ser Cys Cys Cys Thr Lys Pro Ser Asp 130 135 140 Gly Asn Cys Thr Cys Ile Pro Ile Pro Ser Ser Trp Ala Phe Ala Lys 145 150 155 160 Phe Leu Trp Glu Trp Ala Ser Val Arg Phe Ser Trp Leu Ser Leu Leu 165 170 175 Val Pro Phe Val Gln Trp Phe Val Gly Leu Ser Pro Thr Val Trp Leu 180 185 190 Ser Val Ile Trp Met Met Trp Tyr Trp Gly Pro Ser Leu Tyr Asn Ile 195 200 205 Leu Ser Pro Phe Leu Pro Leu Leu Pro Ile Phe Phe Cys Leu Trp Val 210 215 220 Tyr Ile 225 <210> 80 <211> 567 <212> DNA <213> Artificial Sequence <220> <223> LM surface antigen coding sequence <400> 80 ggtggatgga gctcaaagcc gcggaaaggg atgggtacta acctgtccgt accaaatccc 60 ctgggatttt ttccagacca ccaactcgat cctgcttttg gcgcaaattc caacaatccc 120 gactgggact ttaaccctaa caaggacacc tggcctgatg ccaacaaggt gggggcagga 180 gcctttggtc ccggcttcac cccaccccat ggaggtcttt tgggatggtc accacaggcc 240 cagggcatcc tgaccactgt ccctgctgct ccaccgccag cttctactaa tcgacagagc 300 gggaggcagc cgacccccct gagtcccccc ctgcgggata cccaccctca ggcaatgcag 360 tggaactcaa ctactttcca tcagaccctt caggacccta gagtgcgcgg gctgtacttt 420 cctgctgggg gaagcagtag cgggaccgtt aatccagtac ctacgaccgc ctctcccata 480 tcttctatct ttagtaggac tggtgaccct gctcccaaca tggaaaatat aactagcggc 540 ttcctgggcc cccttctcgt cctgtaa 567 <210> 81 <211> 188 <212> PRT <213> Artificial Sequence <220> <223> LM surface antigen <400> 81 Gly Gly Trp Ser Ser Lys Pro Arg Lys Gly Met Gly Thr Asn Leu Ser 1 5 10 15 Val Pro Asn Pro Leu Gly Phe Phe Pro Asp His Gln Leu Asp Pro Ala 20 25 30 Phe Gly Ala Asn Ser Asn Asn Pro Asp Trp Asp Phe Asn Pro Asn Lys 35 40 45 Asp Thr Trp Pro Asp Ala Asn Lys Val Gly Ala Gly Ala Phe Gly Pro 50 55 60 Gly Phe Thr Pro Pro His Gly Gly Leu Leu Gly Trp Ser Pro Gln Ala 65 70 75 80 Gln Gly Ile Leu Thr Thr Val Pro Ala Ala Pro Pro Pro Ala Ser Thr 85 90 95 Asn Arg Gln Ser Gly Arg Gln Pro Thr Pro Leu Ser Pro Pro Leu Arg 100 105 110 Asp Thr His Pro Gln Ala Met Gln Trp Asn Ser Thr Thr Phe His Gln 115 120 125 Thr Leu Gln Asp Pro Arg Val Arg Gly Leu Tyr Phe Pro Ala Gly Gly 130 135 140 Ser Ser Ser Gly Thr Val Asn Pro Val Pro Thr Thr Ala Ser Pro Ile 145 150 155 160 Ser Ser Ile Phe Ser Arg Thr Gly Asp Pro Ala Pro Asn Met Glu Asn 165 170 175 Ile Thr Ser Gly Phe Leu Gly Pro Leu Leu Val Leu 180 185 <210> 82 <211> 280 <212> PRT <213> Artificial Sequence <220> <223> M surface antigen <400> 82 Gln Trp Asn Ser Thr Thr Phe His Gln Thr Leu Gln Asp Pro Arg Val 1 5 10 15 Arg Gly Leu Tyr Phe Pro Ala Gly Gly Ser Ser Ser Gly Thr Val Asn 20 25 30 Pro Val Pro Thr Thr Ala Ser Pro Ile Ser Ser Ile Phe Ser Arg Thr 35 40 45 Gly Asp Pro Ala Pro Asn Met Glu Asn Ile Thr Ser Gly Phe Leu Gly 50 55 60 Pro Leu Leu Val Leu Gln Ala Gly Phe Phe Leu Leu Thr Arg Ile Leu 65 70 75 80 Thr Ile Pro Gln Ser Leu Asp Ser Trp Trp Thr Ser Leu Asn Phe Leu 85 90 95 Gly Gly Thr Pro Val Cys Leu Gly Gln Asn Ser Gln Ser Pro Thr Ser 100 105 110 Asn His Ser Pro Thr Ser Cys Pro Pro Ile Cys Pro Gly Tyr Arg Trp 115 120 125 Met Cys Leu Arg Arg Phe Ile Ile Phe Leu Phe Ile Leu Leu Leu Cys 130 135 140 Leu Ile Phe Leu Leu Val Leu Leu Asp Tyr Gln Gly Met Leu Pro Val 145 150 155 160 Cys Pro Leu Ile Pro Gly Ser Ser Thr Thr Ser Thr Gly Pro Cys Lys 165 170 175 Thr Cys Thr Thr Pro Ala Gln Gly Thr Ser Met Phe Pro Ser Cys Cys 180 185 190 Cys Thr Lys Pro Ser Asp Gly Asn Cys Thr Cys Ile Pro Ile Pro Ser 195 200 205 Ser Trp Ala Phe Ala Lys Phe Leu Trp Glu Trp Ala Ser Val Arg Phe 210 215 220 Ser Trp Leu Ser Leu Leu Val Pro Phe Val Gln Trp Phe Val Gly Leu 225 230 235 240 Ser Pro Thr Val Trp Leu Ser Val Ile Trp Met Met Trp Tyr Trp Gly 245 250 255 Pro Ser Leu Tyr Asn Ile Leu Ser Pro Phe Leu Pro Leu Leu Pro Ile 260 265 270 Phe Phe Cys Leu Trp Val Tyr Ile 275 280 <210> 83 <211> 399 <212> PRT <213> Artificial Sequence <220> <223> L surface antigen <400> 83 Gly Gly Trp Ser Ser Lys Pro Arg Lys Gly Met Gly Thr Asn Leu Ser 1 5 10 15 Val Pro Asn Pro Leu Gly Phe Phe Pro Asp His Gln Leu Asp Pro Ala 20 25 30 Phe Gly Ala Asn Ser Asn Asn Pro Asp Trp Asp Phe Asn Pro Asn Lys 35 40 45 Asp Thr Trp Pro Asp Ala Asn Lys Val Gly Ala Gly Ala Phe Gly Pro 50 55 60 Gly Phe Thr Pro Pro His Gly Gly Leu Leu Gly Trp Ser Pro Gln Ala 65 70 75 80 Gln Gly Ile Leu Thr Thr Val Pro Ala Ala Pro Pro Pro Ala Ser Thr 85 90 95 Asn Arg Gln Ser Gly Arg Gln Pro Thr Pro Leu Ser Pro Pro Leu Arg 100 105 110 Asp Thr His Pro Gln Ala Met Gln Trp Asn Ser Thr Thr Phe His Gln 115 120 125 Thr Leu Gln Asp Pro Arg Val Arg Gly Leu Tyr Phe Pro Ala Gly Gly 130 135 140 Ser Ser Ser Gly Thr Val Asn Pro Val Pro Thr Thr Ala Ser Pro Ile 145 150 155 160 Ser Ser Ile Phe Ser Arg Thr Gly Asp Pro Ala Pro Asn Met Glu Asn 165 170 175 Ile Thr Ser Gly Phe Leu Gly Pro Leu Leu Val Leu Gln Ala Gly Phe 180 185 190 Phe Leu Leu Thr Arg Ile Leu Thr Ile Pro Gln Ser Leu Asp Ser Trp 195 200 205 Trp Thr Ser Leu Asn Phe Leu Gly Gly Thr Pro Val Cys Leu Gly Gln 210 215 220 Asn Ser Gln Ser Pro Thr Ser Asn His Ser Pro Thr Ser Cys Pro Pro 225 230 235 240 Ile Cys Pro Gly Tyr Arg Trp Met Cys Leu Arg Arg Phe Ile Ile Phe 245 250 255 Leu Phe Ile Leu Leu Leu Cys Leu Ile Phe Leu Leu Val Leu Leu Asp 260 265 270 Tyr Gln Gly Met Leu Pro Val Cys Pro Leu Ile Pro Gly Ser Ser Thr 275 280 285 Thr Ser Thr Gly Pro Cys Lys Thr Cys Thr Thr Pro Ala Gln Gly Thr 290 295 300 Ser Met Phe Pro Ser Cys Cys Cys Thr Lys Pro Ser Asp Gly Asn Cys 305 310 315 320 Thr Cys Ile Pro Ile Pro Ser Ser Trp Ala Phe Ala Lys Phe Leu Trp 325 330 335 Glu Trp Ala Ser Val Arg Phe Ser Trp Leu Ser Leu Leu Val Pro Phe 340 345 350 Val Gln Trp Phe Val Gly Leu Ser Pro Thr Val Trp Leu Ser Val Ile 355 360 365 Trp Met Met Trp Tyr Trp Gly Pro Ser Leu Tyr Asn Ile Leu Ser Pro 370 375 380 Phe Leu Pro Leu Leu Pro Ile Phe Phe Cys Leu Trp Val Tyr Ile 385 390 395 <210> 84 <211> 149 <212> PRT <213> Artificial Sequence <220> <223> Core antigen <400> 84 Asp Ile Asp Pro Tyr Lys Glu Phe Gly Ala Ser Val Glu Leu Leu Ser 1 5 10 15 Phe Leu Pro Ser Asp Phe Phe Pro Ser Ile Arg Asp Leu Leu Asp Thr 20 25 30 Ala Ser Ala Leu Tyr Arg Glu Ala Leu Glu Ser Pro Glu His Cys Ser 35 40 45 Pro His His Thr Ala Leu Arg Gln Ala Ile Leu Cys Trp Gly Glu Leu 50 55 60 Met Asn Leu Ala Thr Trp Val Gly Ser Asn Leu Glu Asp Pro Ala Ser 65 70 75 80 Arg Glu Leu Val Val Ser Tyr Val Asn Val Asn Met Gly Leu Lys Ile 85 90 95 Arg Gln Leu Leu Trp Phe His Ile Ser Cys Leu Thr Phe Gly Arg Glu 100 105 110 Thr Val Leu Glu Tyr Leu Val Ser Phe Gly Val Trp Ile Arg Thr Pro 115 120 125 Pro Ala Tyr Arg Pro Pro Asn Ala Pro Ile Leu Ser Thr Leu Pro Glu 130 135 140 Thr Thr Val Val Arg 145 <210> 85 <211> 150 <212> PRT <213> Artificial Sequence <220> <223> Core antigen <400> 85 Asp Ile Asp Pro Tyr Lys Glu Phe Gly Ala Ser Val Glu Leu Leu Ser 1 5 10 15 Phe Leu Pro Ser Asp Phe Phe Pro Ser Ile Arg Asp Leu Leu Asp Thr 20 25 30 Ala Ser Ala Leu Tyr Arg Glu Ala Leu Glu Ser Pro Glu His Cys Ser 35 40 45 Pro His His Thr Ala Leu Arg Gln Ala Ile Leu Cys Trp Gly Glu Leu 50 55 60 Met Asn Leu Ala Thr Trp Val Gly Ser Asn Leu Glu Asp Pro Ala Ser 65 70 75 80 Arg Glu Leu Val Val Ser Tyr Val Asn Val Asn Met Gly Leu Lys Ile 85 90 95 Arg Gln Leu Leu Trp Phe His Ile Ser Cys Leu Thr Phe Gly Arg Glu 100 105 110 Thr Val Leu Glu Tyr Leu Val Ser Phe Gly Val Trp Ile Arg Thr Pro 115 120 125 Pro Ala Tyr Arg Pro Pro Asn Ala Pro Ile Leu Ser Thr Leu Pro Glu 130 135 140 Thr Thr Val Val Arg Arg 145 150 <210> 86 <211> 151 <212> PRT <213> Artificial Sequence <220> <223> Core antigen <400> 86 Asp Ile Asp Pro Tyr Lys Glu Phe Gly Ala Ser Val Glu Leu Leu Ser 1 5 10 15 Phe Leu Pro Ser Asp Phe Phe Pro Ser Ile Arg Asp Leu Leu Asp Thr 20 25 30 Ala Ser Ala Leu Tyr Arg Glu Ala Leu Glu Ser Pro Glu His Cys Ser 35 40 45 Pro His His Thr Ala Leu Arg Gln Ala Ile Leu Cys Trp Gly Glu Leu 50 55 60 Met Asn Leu Ala Thr Trp Val Gly Ser Asn Leu Glu Asp Pro Ala Ser 65 70 75 80 Arg Glu Leu Val Val Ser Tyr Val Asn Val Asn Met Gly Leu Lys Ile 85 90 95 Arg Gln Leu Leu Trp Phe His Ile Ser Cys Leu Thr Phe Gly Arg Glu 100 105 110 Thr Val Leu Glu Tyr Leu Val Ser Phe Gly Val Trp Ile Arg Thr Pro 115 120 125 Pro Ala Tyr Arg Pro Pro Asn Ala Pro Ile Leu Ser Thr Leu Pro Glu 130 135 140 Thr Thr Val Val Arg Arg Arg 145 150 <210> 87 <211> 447 <212> DNA <213> Artificial Sequence <220> <223> Core antigen coding sequence <400> 87 gacatcgacc cttacaagga gttcggcgcc agcgtggaac tgctgtcttt tctgcccagt 60 gatttctttc cttccattcg agacctgctg gataccgcct ctgctctgta tcgggaagcc 120 ctggagagcc cagaacactg ctccccacac cataccgctc tgcgacaggc aatcctgtgc 180 tggggggagc tgatgaacct ggccacatgg gtgggatcga atctggagga ccccgcttca 240 cgggaactgg tggtcagcta cgtgaacgtc aatatgggcc tgaaaatccg ccagctgctg 300 tggttccata ttagctgcct gacttttgga cgagagaccg tgctggaata cctggtgtcc 360 ttcggcgtct ggattcgcac tccccctgct tatcgaccac ccaacgcacc aattctgtcc 420 accctgcccg agaccacagt ggtccgt 447 <210> 88 <211> 450 <212> DNA <213> Artificial Sequence <220> <223> Core antigen coding sequence <400> 88 gacatcgacc cttacaagga gttcggcgcc agcgtggaac tgctgtcttt tctgcccagt 60 gatttctttc cttccattcg agacctgctg gataccgcct ctgctctgta tcgggaagcc 120 ctggagagcc cagaacactg ctccccacac cataccgctc tgcgacaggc aatcctgtgc 180 tggggggagc tgatgaacct ggccacatgg gtgggatcga atctggagga ccccgcttca 240 cgggaactgg tggtcagcta cgtgaacgtc aatatgggcc tgaaaatccg ccagctgctg 300 tggttccata ttagctgcct gacttttgga cgagagaccg tgctggaata cctggtgtcc 360 ttcggcgtct ggattcgcac tccccctgct tatcgaccac ccaacgcacc aattctgtcc 420 accctgcccg agaccacagt ggtccgtcgc 450 <210> 89 <211> 456 <212> DNA <213> Artificial Sequence <220> <223> Core antigen coding sequence <400> 89 gacatcgacc cttacaagga gttcggcgcc agcgtggaac tgctgtcttt tctgcccagt 60 gatttctttc cttccattcg agacctgctg gataccgcct ctgctctgta tcgggaagcc 120 ctggagagcc cagaacactg ctccccacac cataccgctc tgcgacaggc aatcctgtgc 180 tggggggagc tgatgaacct ggccacatgg gtgggatcga atctggagga ccccgcttca 240 cgggaactgg tggtcagcta cgtgaacgtc aatatgggcc tgaaaatccg ccagctgctg 300 tggttccata ttagctgcct gacttttgga cgagagaccg tgctggaata cctggtgtcc 360 ttcggcgtct ggattcgcac tccccctgct tatcgaccac ccaacgcacc aattctgtcc 420 accctgcccg agaccacagt ggtccgtcgc cgttaa 456 <210> 90 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Cystatin S signal peptide coding sequence <400> 90 atggctcgac ctctgtgtac cctgctactc ctgatggcta ccctggctgg agctctggcc 60 agc 63 <210> 91 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> HBV Core antigen C-terminal <400> 91 Val Val Arg Arg 1 <210> 92 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> HBV Core antigen C-terminal <400> 92 Val Val Arg Arg Arg 1 5

Claims (42)

  1. 핵산 조합으로서, 5'-말단에서 3'-말단의 순서로 하기를 포함하는 제1 비-천연 발생 폴리뉴클레오티드 서열:
    (1) 제1 B형 간염 바이러스(HBV: hepatitis B virus) 항원을 인코딩하는 폴리뉴클레오티드 서열,
    (2) 제1 내부 리보솜 진입 서열(IRES: internal ribosome entry sequence) 요소 또는 제1 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열, 및
    (3) 제2 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열, 및
    5'-말단에서 3'-말단의 순서로 하기를 포함하는 제2 비-천연 발생 폴리뉴클레오티드 서열:
    (1) 제3 B형 간염 바이러스(HBV) 항원을 인코딩하는 폴리뉴클레오티드 서열,
    (2) 제2 내부 리보솜 진입 서열(IRES) 요소 또는 제2 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열, 및
    (3) 제4 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열을 포함하고,
    여기서 상기 제1 및 제2 비-천연 발생 폴리뉴클레오티드 서열은 제3 내부 리보솜 진입 서열(IRES) 요소 또는 제3 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열에 의해 연결되거나, 별도의 핵산 분자에 존재하고,
    여기서 상기 제1, 제2, 제3 및 제4 HBV 항원은 HBV 코어 항원, HBV 폴리머라제(pol) 항원, 및 HBV 표면 항원으로 이루어진 군으로부터 각각 독립적으로 선택되고, 상기 제1, 제2, 제3 및 제4 HBV 항원 중 적어도 하나는 서열번호 1 또는 서열번호 3의 아미노산 서열과 적어도 98% 동일한 아미노산 서열을 갖는 HBV Pre-S1 항원 및 서열번호 5의 아미노산 서열과 적어도 98% 동일한 아미노산 서열을 갖는 HBV PreS2.S 항원으로부터 선택된 HBV 표면 항원이고, 바람직하게는 상기 제1, 제2, 제3 또는 제4 HBV 항원 중 하나는 HBV 코어 또는 HBV pol 항원인, 핵산 조합.
  2. 제1항에 있어서, 상기 제1, 제2, 제3 또는 제4 HBV 항원 중 하나는 HBV 코어 항원이고, 하나는 HBV pol 항원인, 핵산 조합.
  3. 제1항 또는 제2항에 있어서, 상기 제1, 제2, 제3 및 제4 HBV 항원 각각은 서로 상이한 것인, 핵산 조합.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 제1, 제2, 제3 및 제4 HBV 항원 각각은 하기로 이루어진 군으로부터 독립적으로 선택되고:
    (i) 서열번호 1의 아미노산 서열과 적어도 98% 동일한, 예컨대 서열번호 1의 아미노산 서열과 적어도 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하는, 바람직하게는 이로 이루어진 제1 HBV Pre-S1 항원;
    (ii) 서열번호 3의 아미노산 서열과 적어도 98% 동일한, 예컨대 서열번호 3의 아미노산 서열과 적어도 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하는, 바람직하게는 이로 이루어진 제2 HBV Pre-S1 항원;
    (iii) 서열번호 5의 아미노산 서열과 적어도 98% 동일한, 예컨대 서열번호 5의 아미노산 서열과 적어도 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하고, 바람직하게는 이로 이루어진 HBV PreS2.S 항원;
    (iv) 서열번호 7과 적어도 90% 동일한, 예컨대 서열번호 7과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하고, 바람직하게는 이로 이루어진 HBV 코어 항원; 및
    (v) 서열번호 9와 적어도 90% 동일한, 예컨대 서열번호 9와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하고, 바람직하게는 이로 이루어진 HBV pol 항원,
    바람직하게는, 상기 제1 및 제2 HBV Pre-S1 항원, 상기 HBV 코어 항원 및 상기 HBV pol 항원 각각은 독립적으로 신호 펩타이드에 작동적으로 연결되고, 상기 HBV PreS2.S 항원은 내부 신호 펩타이드를 포함하는, 핵산 조합.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 HBV 코어 항원은 서열번호 84, 85, 또는 86 중 적어도 하나와 적어도 98% 동일한, 예컨대 서열번호 84, 85, 또는 86과 적어도 98%, 적어도 99%, 또는 100% 동일한 아미노산 서열을 포함하고, 바람직하게는 이로 이루어진 것인, 핵산 조합.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 HBV 코어 항원의 마지막 5개의 C-말단 아미노산은 VVR 아미노산 서열, 보다 특히 VVRR(서열번호 91) 아미노산 서열, 보다 특히 VVRRR(서열번호 92) 아미노산 서열을 포함하는, 핵산 조합.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 HBV 표면 항원, 상기 HBV 코어 항원 및 상기 HBV pol 항원 각각은 하기를 포함하는, 핵산 조합:
    (i) HBV 유전자형 A, B, C 및 D에 대한 컨센서스 서열; 및/또는
    (ii) HLA-A*11:01, HLA-A*24:02, HLA-A*02:01, HLA-A*A2402, HLA-A*A0101, 또는 HLA-B*40:01에 대한 하나 이상의 에피토프.
  8. 제7항에 있어서, 상기 HBV 표면 항원, 상기 HBV 코어 항원 및 상기 HBV pol 항원 각각은 HLA-A*11:01에 대한 하나 이상의 에피토프를 포함하는, 핵산 조합.
  9. 제4항에 있어서, 상기 제1, 제2, 제3 및 제4 HBV 항원 각각은 하기로 이루어진 군으로부터 독립적으로 선택되고:
    (i) 서열번호 1의 아미노산 서열로 이루어진 제1 HBV Pre-S1 항원;
    (ii) 서열번호 3의 아미노산 서열로 이루어진 제2 HBV Pre-S1 항원;
    (iii) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원;
    (iv) 서열번호 84, 서열번호 85, 또는 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원; 및
    (v) 서열번호 9의 아미노산 서열로 이루어진 HBV pol 항원;
    바람직하게는, 상기 제1 및 제2 HBV Pre-S1 항원, 상기 HBV 코어 항원 및 상기 HBV pol 항원 각각은 독립적으로 서열번호 77의 아미노산 서열을 포함하는 신호 펩타이드와 같은 신호 펩타이드에 작동적으로 연결된 것인, 핵산 조합.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 제1, 제2, 제3 및 제4 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열 각각은 하기로 이루어진 군으로부터 독립적으로 선택되고:
    (i) 서열번호 2와 적어도 90% 동일한, 예컨대 서열번호 2와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 서열을 갖는 제1 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
    (ii) 서열번호 4와 적어도 90% 동일한, 예컨대 서열번호 4와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 서열을 갖는 제2 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
    (iii) 서열번호 6과 적어도 90% 동일한, 예컨대 서열번호 6과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
    (iv) 서열번호 8과 적어도 90% 동일한, 예컨대 서열번호 8과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열; 및
    (v) 서열번호 10과 적어도 90% 동일한, 예컨대 서열번호 10과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 서열을 갖는 HBV pol 항원을 인코딩하는 폴리뉴클레오티드 서열;
    바람직하게는, 상기 제1 및 제2 HBV Pre-S1 항원, 상기 HBV 코어 항원 및 상기 HBV pol 항원 각각을 인코딩하는 폴리뉴클레오티드 서열은 독립적으로 신호 펩타이드를 인코딩하는 폴리뉴클레오티드 서열에 작동적으로 연결되고, 상기 HBV PreS2.S 항원은 내부 신호 펩타이드를 포함하는, 핵산 조합.
  11. 제10항에 있어서, 상기 제1, 제2, 제3 및 제4 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열 각각은 하기로 이루어진 군으로부터 독립적으로 선택되고:
    (i) 서열번호 2의 서열로 이루어진 제1 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
    (ii) 서열번호 4의 서열로 이루어진 제2 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
    (iii) 서열번호 6의 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
    (iv) 서열번호 87, 서열번호 88 또는 서열번호 89 중 어느 하나의 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열; 및
    (v) 서열번호 10의 서열로 이루어진 HBV pol 항원을 인코딩하는 폴리뉴클레오티드 서열;
    바람직하게는, 상기 제1 및 제2 HBV Pre-S1 항원, 상기 HBV 코어 항원 및 상기 HBV pol 항원 각각을 인코딩하는 폴리뉴클레오티드 서열은 독립적으로 서열번호 90의 서열을 포함하는 폴리뉴클레오티드와 같은 신호 펩타이드를 인코딩하는 폴리뉴클레오티드에 작동적으로 연결된 것인, 핵산 조합.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서, 상기 제1, 제2 및 제3 오토프로테아제 펩타이드 각각은 독립적으로 돼지 테스코바이러스-1 2A(P2A), 구제역 바이러스(FMDV) 2A(F2A), 말 비염 A 바이러스(ERAV) 2A(E2A), 테세아 아시그나 바이러스 2A(T2A), 세포질 다각체병 바이러스 2A(BmCPV2A), 무름병 바이러스 2 A(BmIFV2A), 및 이들의 조합으로 이루어진 군으로부터 선택된 펩타이드 서열을 포함하고, 바람직하게는, 상기 제1, 제2 및 제3 오토프로테아제 펩타이드 각각은 서열번호 11의 P2A 서열과 같은 P2A의 펩타이드 서열을 포함하는, 핵산 조합.
  13. 제1항 내지 제12항 중 어느 한 항에 있어서, 상기 제1, 제2 및 제3 IRES 각각은 뇌심근염 바이러스(EMCV) 또는 엔테로바이러스 71(EV71)로부터 유래되고, 바람직하게는 상기 제1, 제2 및 제3 IRES 각각은 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 포함하는, 핵산 조합.
  14. 제1항에 있어서, 5'-말단에서 3'-말단의 순서로 하기를 포함하고:
    (1) 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
    (2) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
    (3) 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
    (4) 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
    (5) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
    (6) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
    (7) 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열은 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
    (8) 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
    (9) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
    (10) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
    (11) 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
    (12) 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
    (13) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
    (14) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
    (15) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
    (16) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
    (17) 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
    (18) 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
    (19) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
    (20) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
    (21) 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열; 또는
    (22) 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열,
    바람직하게는, 상기 제1 및 제2 HBV Pre-S1 항원, 상기 HBV 코어 항원 및 상기 HBV pol 항원 각각을 인코딩하는 폴리뉴클레오티드 서열은 독립적으로 서열번호 77의 아미노산 서열을 포함하는 신호 펩타이드와 같은 신호 펩타이드를 인코딩하는 폴리뉴클레오티드 서열에 작동적으로 연결된 것인, 핵산 조합.
  15. 제14항에 있어서, 서열번호 15 내지 54 중 어느 하나의 비-천연 발생 폴리뉴클레오티드 서열을 포함하는, 핵산 조합.
  16. 제1항 내지 제15항 중 어느 한 항의 핵산 조합을 포함하는 벡터.
  17. 제16항에 있어서, DNA 플라스미드인, 벡터.
  18. 제16항에 있어서, DNA 바이러스 벡터 또는 RNA 바이러스 벡터인, 벡터.
  19. 제18항에 있어서, 변형된 백시니아 앙카라(MVA) 벡터 또는 아데노바이러스 벡터인, 벡터.
  20. 제19항에 있어서, Ad26, Ad35, 또는 MVA-BN 벡터인, 벡터.
  21. 5'-말단에서 3'-말단의 순서로 하기를 포함하는 RNA 레플리콘:
    (1) RNA 바이러스의 비구조 단백질-매개 증폭에 필요한 5' 비번역 영역(5'-UTR);
    (2) RNA 바이러스의 비구조 단백질 중 적어도 하나, 바람직하게는 모두를 인코딩하는 폴리뉴클레오티드 서열;
    (3) RNA 바이러스의 서브게놈 프로모터;
    (4) 제1항 내지 제15항 중 어느 한 항의 핵산 조합; 및
    (5) RNA 바이러스의 비구조 단백질-매개 증폭에 필요한 3' 비번역 영역(3'-UTR).
  22. 제21항에 있어서, 5'-말단에서 3'-말단의 순서로 하기를 포함하는, RNA 레플리콘:
    (1) 알파바이러스 5' 비번역 영역(5'-UTR);
    (2) 알파바이러스 비구조 유전자 nsp1의 5' 복제 서열;
    (3) 바이러스 종의 다운스트림 루프(DLP: downstream loop) 모티프;
    (4) 제4 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열;
    (5) 알파바이러스 비구조 단백질 nsp1, nsp2, nsp3 및 nsp4를 인코딩하는 폴리뉴클레오티드 서열;
    (6) 알파바이러스 서브게놈 프로모터;
    (7) 제1항 내지 제15항 중 어느 한 항의 핵산 조합;
    (8) 알파바이러스 3' 비번역 영역(3' UTR); 및
    (9) 선택적으로, 폴리 아데노신 서열.
  23. 제22항에 있어서, 상기 DLP 모티프는 동부 말 뇌염 바이러스(EEEV: Eastern equine encephalitis virus), 베네수엘라 말 뇌염 바이러스(VEEV: Venezuelan equine encephalitis virus), 에버글레이즈 바이러스(EVEV: Everglades virus), 무캄보 바이러스(MUCV: Mucambo virus), 셈리키 포레스트 바이러스(SFV: Semliki forest virus), 픽수나 바이러스(PIXV: Pixuna virus), 미들버그 바이러스(MTDV: Middleburg virus), 치쿤구니야 바이러스(CHIKV: Chikungunya virus), 오니옹-니옹 바이러스(ONNV: O'Nyong-Nyong virus), 로스 리버 바이러스(RRV: Ross River virus), 바마 포레스트 바이러스(BF: Barmah Forest virus), 게타 바이러스(GET: Getah virus), 사기야마 바이러스(SAGV: Sagiyama virus), 베바루 바이러스(BEBV: Bebaru virus), 마야로 바이러스(MAYV: Mayaro virus), Una 바이러스(UAV: Una virus), 신드비스 바이러스(SINV: Sindbis virus), 아우라 바이러스(AURAV: Aura virus), 와타로아 바이러스(WHAV: Whataroa virus), 바반키 바이러스(BABV: Babanki virus), 키질라가크 바이러스(KYZV: Kyzylagach virus), 서부 말 뇌염 바이러스(WEEV: Western equine encephalitis virus), 하이랜드 J 바이러스(HJV: Highland J virus), 포트 모건 바이러스(FMV: Fort Morgan virus), Ndumu(NDUV), 및 버기 크릭 바이러스(Buggy Creek virus)로 이루어진 군으로부터 선택된 바이러스 종으로부터 유래된 것인, RNA 레플리콘.
  24. 제23항에 있어서, 상기 제4 오토프로테아제 펩타이드는 돼지 테세호바이러스-1 2A(P2A), 구제역 바이러스(FMDV) 2A(F2A), 말 비염 A 바이러스(ERAV) 2A(E2A), 테세아 아시그나 바이러스 2A(T2A), 세포질 다각체병 바이러스 2A(BmCPV2A), 무름병 바이러스 2 A(BmIFV2A), 및 이들의 조합으로 이루어진 군으로부터 선택되고, 바람직하게는, 상기 제4 오토프로테아제 펩타이드는 P2A의 펩타이드 서열을 포함하는, RNA 레플리콘.
  25. 제21항에 있어서, 5'-말단에서 3'-말단의 순서로 하기를 포함하는, RNA 레플리콘:
    (1) 서열번호 55의 폴리뉴클레오티드 서열을 갖는 5'-UTR,
    (2) 서열번호 56의 폴리뉴클레오티드 서열을 갖는 5' 복제 서열,
    (3) 서열번호 57의 폴리뉴클레오티드 서열을 포함하는 DLP 모티프,
    (4) 서열번호 11의 P2A 서열을 인코딩하는 폴리뉴클레오티드 서열,
    (5) 각각 서열번호 58, 서열번호 59, 서열번호 60 및 서열번호 61의 핵산 서열을 갖는, 알파바이러스 비구조 단백질 nsp1, nsp2, nsp3 및 nsp4를 인코딩하는 폴리뉴클레오티드 서열,
    (6) 서열번호 62의 폴리뉴클레오티드 서열을 갖는 서브게놈 프로모터,
    (7) 제1항 내지 제15항 중 어느 한 항의 핵산 조합, 및
    (8) 서열번호 63의 폴리뉴클레오티드 서열을 갖는 3' UTR.
  26. 제25항에 있어서,
    (i) 상기 P2A 서열을 인코딩하는 폴리뉴클레오티드 서열은 서열번호 12를 포함하고,
    (ii) 상기 핵산 조합은 서열번호 15 내지 54 중 어느 하나의 폴리뉴클레오티드 서열을 포함하고,
    (iii) 상기 RNA 레플리콘은 폴리 아데노신 서열을 추가로 포함하고, 바람직하게는 상기 폴리 아데노신 서열은 레플리콘의 3'-말단에서 서열번호 64의 서열을 갖는 것인, RNA 레플리콘.
  27. 서열번호 65 내지 72 중 어느 하나의 폴리뉴클레오티드 서열을 포함하는 RNA 레플리콘.
  28. 제21항 내지 제27항 중 어느 한 항의 RNA 레플리콘을 인코딩하는 폴리뉴클레오티드 서열을 포함하는 핵산 분자로서, 바람직하게는, 상기 핵산은 DNA 서열의 5'-말단에 작동적으로 연결된 T7 프로모터를 추가로 포함하고, 보다 바람직하게는, 상기 T7 프로모터는 서열번호 73의 뉴클레오티드 서열을 포함하는, 핵산 분자.
  29. 제1항 내지 제15항 중 어느 한 항의 핵산 조합, 제16항 내지 제20항 중 어느 한 항의 벡터, 제21항 내지 제27항 중 어느 한 항의 RNA 레플리콘, 또는 제28항의 핵산 분자 및 약제학적으로 허용되는 담체를 포함하는 약제학적 조성물.
  30. 제29항에 있어서, 상기 약제학적으로 허용되는 담체는 지질 나노입자를 포함하고, 바람직하게는 상기 지질 나노입자는 ALC-0315, DOTMA, DOTAP, DDAB, DOGS, DSDMA, DODMA, DLinDMA, DLenDMA, γ-DLenDMA, DLin-K-DMA, DLin-K-C2-DMA, DLin-K-C3-DMA, DLin-K-C4-DMA, DLen-C2K-DMA, y-DLen-C2K-DMA, DLin-M-C2-DMA, DLin-M-C3-DMA, DLin-MP-DMA, 또는 DCChol 중 하나 이상을 포함하는, 약제학적 조성물.
  31. 제29항 또는 제30항에 있어서, 하기를 추가로 포함하는, 약제학적 조성물:
    (1) 서열번호 84, 85 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열; 또는
    (2) 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 84, 85 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열.
  32. 제29항 내지 제31항 중 어느 한 항에 있어서, HBV 감염의 치료에 사용하기 위한 약제학적 조성물.
  33. 제32항에 있어서, 상기 약제학적 조성물은 HBV에 대한 치료용 백신인, 약제학적 조성물.
  34. 제32항 또는 제33항에 있어서, 프라임-부스트 용법으로서 사용하기 위한 적어도 하나의 동일한 HBV 항원을 인코딩하는 핵산 분자를 포함하는 제2 조성물을 추가로 포함하는, 약제학적 조성물.
  35. 제34항에 있어서, 상기 프라임-부스트 용법은 제21항 내지 제27항 중 어느 한 항의 RNA 레플리콘을 포함하는 제1 조성물, 및 RNA 레플리콘이 아니고 적어도 하나의 동일한 HBV 에피토프를 인코딩하는 벡터를 포함하는 제2 조성물, 바람직하게는 제1 조성물로서 적어도 하나의 동일한 HBV 항원을 포함하고, 상기 제1 및 제2 조성물 중 하나는 백신접종 프라이밍에 사용되고 나머지는 백신접종 부스팅에 사용되는 것인, 약제학적 조성물.
  36. 제35항에 있어서, 상기 제2 조성물은 변형된 백시니아 앙카라(MVA) 벡터, 아데노바이러스 벡터 또는 플라스미드 벡터를 포함하는, 약제학적 조성물.
  37. 제36항에 있어서, 상기 제2 조성물은 Ad26, Ad35, 또는 MVA-BN 벡터를 포함하는, 약제학적 조성물.
  38. 제28항 내지 제31항 중 어느 한 항에 있어서, 이를 필요로 하는 대상체, 바람직하게는 만성 HBV 감염을 가진 대상체에서 선택적으로 또 다른 면역원성 제제 또는 다른 항-HBV 제제와 조합하여 B형 간염 바이러스(HBV)에 대한 면역 반응을 유도하는 데 사용하기 위한, 약제학적 조성물,
  39. 제38항에 있어서, 상기 다른 항-HBV 제제는 소분자, 항체 또는 이의 항원 결합 단편, 폴리펩타이드, 단백질, 또는 핵산인, 약제학적 조성물.
  40. 제29항 내지 제31항 중 어느 한 항에 있어서, HBV의 감염 및/또는 복제 감소를 필요로 하는 대상체에서 HBV의 감염 및/또는 복제를 감소시키는 데 사용하기 위한, 약제학적 조성물.
  41. 제1항 내지 제15항 중 어느 한 항의 핵산 조합, 제16항 내지 제20항 중 어느 한 항의 벡터, 제21항 내지 제27항 중 어느 한 항의 RNA 레플리콘, 또는 제28항의 핵산 분자를 포함하는 단리된 숙주 세포.
  42. 제28항에 따른 핵산을 생체내 또는 시험관내에서 전사하는 단계 포함하는 RNA 레플리콘의 생성 방법.
KR1020237004630A 2020-07-08 2021-07-07 Hbv에 대한 rna 레플리콘 백신 KR20230050328A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202063049400P 2020-07-08 2020-07-08
US63/049,400 2020-07-08
US202163144051P 2021-02-01 2021-02-01
US63/144,051 2021-02-01
PCT/EP2021/068879 WO2022008613A1 (en) 2020-07-08 2021-07-07 Rna replicon vaccines against hbv

Publications (1)

Publication Number Publication Date
KR20230050328A true KR20230050328A (ko) 2023-04-14

Family

ID=77104021

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237004630A KR20230050328A (ko) 2020-07-08 2021-07-07 Hbv에 대한 rna 레플리콘 백신

Country Status (11)

Country Link
US (1) US20220016237A1 (ko)
EP (1) EP4178613A1 (ko)
JP (1) JP2023533528A (ko)
KR (1) KR20230050328A (ko)
CN (1) CN116367854A (ko)
AU (1) AU2021303478A1 (ko)
BR (1) BR112022027038A2 (ko)
CA (1) CA3188801A1 (ko)
IL (1) IL299571A (ko)
TW (1) TW202216190A (ko)
WO (1) WO2022008613A1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2016306275A1 (en) 2015-08-07 2018-02-08 Arrowhead Pharmaceuticals, Inc. RNAi therapy for Hepatitis B virus infection
JOP20170161A1 (ar) 2016-08-04 2019-01-30 Arrowhead Pharmaceuticals Inc عوامل RNAi للعدوى بفيروس التهاب الكبد ب
EA202091513A1 (ru) 2017-12-19 2020-09-09 Янссен Сайенсиз Айрлэнд Анлимитед Компани Вакцины против вируса гепатита b (hbv) и их применение
TW202245809A (zh) * 2020-12-18 2022-12-01 美商詹森藥物公司 用於治療b型肝炎病毒感染之組合療法
WO2024124232A1 (en) * 2022-12-09 2024-06-13 Advanced Rna Vaccine (Arv) Technologies, Inc. Nucleic acid based cancer vaccine and methods thereof
WO2024133160A1 (en) * 2022-12-19 2024-06-27 Glaxosmithkline Biologicals Sa Hepatitis b compositions

Family Cites Families (63)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0173552B1 (en) 1984-08-24 1991-10-09 The Upjohn Company Recombinant dna compounds and the expression of polypeptides such as tpa
US5168062A (en) 1985-01-30 1992-12-01 University Of Iowa Research Foundation Transfer vectors and microorganisms containing human cytomegalovirus immediate-early promoter-regulatory DNA sequence
US5273525A (en) 1992-08-13 1993-12-28 Btx Inc. Injection and electroporation apparatus for drug and gene delivery
US6041252A (en) 1995-06-07 2000-03-21 Ichor Medical Systems Inc. Drug delivery system and method
AU4255397A (en) 1996-09-06 1998-03-26 Trustees Of The University Of Pennsylvania, The Chimpanzee adenovirus vectors
EA002087B1 (ru) 1997-04-03 2001-12-24 Электрофект Ас Способ введения фармацевтических препаратов и нуклеиновых кислот в скелетную мышцу
US6261281B1 (en) 1997-04-03 2001-07-17 Electrofect As Method for genetic immunization and introduction of molecules into skeletal muscle and immune cells
US5873849A (en) 1997-04-24 1999-02-23 Ichor Medical Systems, Inc. Electrodes and electrode arrays for generating electroporation inducing electrical fields
GB0023203D0 (en) 2000-09-21 2000-11-01 Isis Innovation Vaccination method
US6117660A (en) 1997-06-10 2000-09-12 Cytopulse Sciences, Inc. Method and apparatus for treating materials with electrical fields having varying orientations
DE69826124T3 (de) 1997-06-30 2007-10-11 Institut Gustave Roussy Verabreichung der nukleinsäure in den quergestreiften muskel
JP2003505114A (ja) 1998-07-13 2003-02-12 ジェネトロニクス、インコーポレーテッド パルス電場による皮膚および筋肉を標的とした遺伝子治療
US6319901B1 (en) 1998-10-15 2001-11-20 Ichor Medical Systems, Inc. Methods for prolonging cell membrane permeability
PT1816204E (pt) 1999-05-17 2011-01-24 Crucell Holland Bv Adenovírus recombinante do serótipo ad26
US6913922B1 (en) 1999-05-18 2005-07-05 Crucell Holland B.V. Serotype of adenovirus and uses thereof
WO2002042480A2 (en) 2000-11-23 2002-05-30 Bavarian Nordic A/S Modified vaccinia ankara virus variant
WO2003048184A2 (en) 2001-12-04 2003-06-12 Bavarian Nordic A/S Flavivirus ns1 subunit vaccine
US7245963B2 (en) 2002-03-07 2007-07-17 Advisys, Inc. Electrode assembly for constant-current electroporation and use
US8209006B2 (en) 2002-03-07 2012-06-26 Vgx Pharmaceuticals, Inc. Constant current electroporation device and methods of use
US6912417B1 (en) 2002-04-05 2005-06-28 Ichor Medical Systmes, Inc. Method and apparatus for delivery of therapeutic agents
AU2003271738C1 (en) 2002-04-25 2008-04-17 Crucell Holland B.V. Stable adenoviral vectors and methods for propagation thereof
ES2335657T3 (es) 2002-04-25 2010-03-31 Crucell Holland B.V. Medios y metodos para la produccion de vectores de adenovirus.
US7328064B2 (en) 2002-07-04 2008-02-05 Inovio As Electroporation device and injection apparatus
EP2567693B1 (en) 2003-07-16 2015-10-21 Protiva Biotherapeutics Inc. Lipid encapsulated interfering RNA
PT1711518E (pt) 2004-01-23 2010-02-26 Isti Di Ric Di Bio Moleco P An Transportadores de vacinas de adenovírus de chimpanzé
HUE025052T2 (en) 2004-03-08 2016-01-28 Ichor Medical Systems Inc A sharpened device for electrically mediated delivery of medical substances
AU2005252273B2 (en) 2004-06-07 2011-04-28 Arbutus Biopharma Corporation Lipid encapsulated interfering RNA
US20100143302A1 (en) 2006-03-16 2010-06-10 Crucell Holland B.V. Recombinant Adenoviruses Based on Serotype 26 and 48, and Use Thereof
WO2008048632A1 (en) 2006-10-17 2008-04-24 Vgx Pharmaceuticals, Inc. Electroporation devices and methods of using same for electroporation of cells in mammals
WO2009086558A1 (en) 2008-01-02 2009-07-09 Tekmira Pharmaceuticals Corporation Improved compositions and methods for the delivery of nucleic acids
HUE034483T2 (en) 2008-04-15 2018-02-28 Protiva Biotherapeutics Inc New lipid preparations for introducing a nucleic acid
EP2350043B9 (en) 2008-10-09 2014-08-20 TEKMIRA Pharmaceuticals Corporation Improved amino lipids and methods for the delivery of nucleic acids
WO2010048536A2 (en) 2008-10-23 2010-04-29 Alnylam Pharmaceuticals, Inc. Processes for preparing lipids
SG10201901089TA (en) 2008-11-10 2019-03-28 Arbutus Biopharma Corp Novel lipids and compositions for the delivery of therapeutics
EP3243504A1 (en) 2009-01-29 2017-11-15 Arbutus Biopharma Corporation Improved lipid formulation
ES2898235T3 (es) 2009-02-02 2022-03-04 Glaxosmithkline Biologicals Sa Secuencias de aminoácidos y de ácidos nucleicos de adenovirus de simio, vectores que las contienen, y sus usos
WO2010085984A1 (en) 2009-02-02 2010-08-05 Okairos Ag Simian adenovirus nucleic acid- and amino acid-sequences, vectors containing same, and uses thereof
SG10201402054UA (en) 2009-05-05 2014-09-26 Muthiah Manoharan Lipid compositions
HUE056773T2 (hu) 2009-06-10 2022-03-28 Arbutus Biopharma Corp Továbbfejlesztett lipid készítmény
IL300109A (en) 2010-06-03 2023-03-01 Alnylam Pharmaceuticals Inc Biodegradable lipids for the transfer of active substances
SI4005592T1 (sl) 2010-07-06 2023-03-31 Glaxosmithkline Biologicals S.A. Virionom podobni dostavni delci za samopodvojene molekule RNA
PL2655604T3 (pl) 2010-12-14 2019-02-28 The Government Of The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services Szczepionki adenowirusowe serotyp 26 i serotyp 35 przeciwko filowirusom
SI2750707T1 (sl) 2011-08-31 2019-02-28 Glaxosmithkline Biologicals Sa Pegilirani liposomi za dostavo imunogen-kodirajoče RNA
JP6275655B2 (ja) 2012-02-24 2018-02-07 プロティバ バイオセラピューティクス インコーポレイテッド トリアルキルカチオン性脂質およびその使用方法
HRP20221536T1 (hr) 2014-06-25 2023-02-17 Acuitas Therapeutics Inc. Novi lipidi i formulacije lipidnih nanočestica za isporuku nukleinskih kiselina
SI3313829T1 (sl) 2015-06-29 2024-09-30 Acuitas Therapeutics Inc. Lipidi in formulacije lipidnih nanodelcev za dostavo nukleinskih kislin
CN113636947A (zh) 2015-10-28 2021-11-12 爱康泰生治疗公司 用于递送核酸的新型脂质和脂质纳米颗粒制剂
EP3397613A1 (en) 2015-12-30 2018-11-07 Acuitas Therapeutics Inc. Lipids and lipid nanoparticle formulations for delivery of nucleic acids
US9834510B2 (en) 2015-12-30 2017-12-05 Arcturus Therapeutics, Inc. Aromatic ionizable cationic lipid
WO2017121791A1 (en) * 2016-01-12 2017-07-20 Helmholtz Zentrum München - Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH) Means and methods for treating hbv
EA202191975A2 (ru) 2016-03-28 2022-03-31 Айкор Медикэл Системс, Инк. Устройство для доставки терапевтических средств
AU2017347725B2 (en) 2016-10-17 2024-01-04 Janssen Pharmaceuticals, Inc. Recombinant virus replicon systems and uses thereof
AU2017372731B2 (en) 2016-12-05 2024-05-23 Janssen Pharmaceuticals, Inc. Compositions and methods for enhancing gene expression
WO2018119163A1 (en) 2016-12-21 2018-06-28 Payne Joseph E Ionizable cationic lipid for rna delivery
US10383952B2 (en) 2016-12-21 2019-08-20 Arcturus Therapeutics, Inc. Ionizable cationic lipid for RNA delivery
GB201705765D0 (en) * 2017-04-10 2017-05-24 Univ Oxford Innovation Ltd HBV vaccine
WO2018191657A1 (en) 2017-04-13 2018-10-18 Acuitas Therapeutics, Inc. Lipids for delivery of active agents
AU2018256877B2 (en) 2017-04-28 2022-06-02 Acuitas Therapeutics, Inc. Novel carbonyl lipids and lipid nanoparticle formulations for delivery of nucleic acids
WO2019036008A1 (en) 2017-08-16 2019-02-21 Acuitas Therapeutics, Inc. LIPIDS FOR USE IN LIPID NANOPARTICULAR FORMULATIONS
WO2019036028A1 (en) 2017-08-17 2019-02-21 Acuitas Therapeutics, Inc. LIPIDS FOR USE IN LIPID NANOPARTICULAR FORMULATIONS
WO2019036000A1 (en) 2017-08-17 2019-02-21 Acuitas Therapeutics, Inc. LIPIDS FOR USE IN LIPID NANOPARTICLE FORMULATIONS
US11524932B2 (en) 2017-08-17 2022-12-13 Acuitas Therapeutics, Inc. Lipids for use in lipid nanoparticle formulations
EA202091513A1 (ru) 2017-12-19 2020-09-09 Янссен Сайенсиз Айрлэнд Анлимитед Компани Вакцины против вируса гепатита b (hbv) и их применение

Also Published As

Publication number Publication date
EP4178613A1 (en) 2023-05-17
TW202216190A (zh) 2022-05-01
JP2023533528A (ja) 2023-08-03
IL299571A (en) 2023-02-01
BR112022027038A2 (pt) 2023-01-24
CN116367854A (zh) 2023-06-30
US20220016237A1 (en) 2022-01-20
WO2022008613A1 (en) 2022-01-13
AU2021303478A1 (en) 2023-02-16
CA3188801A1 (en) 2022-01-13

Similar Documents

Publication Publication Date Title
KR20230050328A (ko) Hbv에 대한 rna 레플리콘 백신
US20210260178A1 (en) Novel lassa virus rna molecules and compositions for vaccination
US20220062409A1 (en) Heterologous prime boost vaccine compositions and methods
US20220305118A1 (en) Carbohydrate nanocarrier delivery of hepatitis b virus (hbv) vaccines
WO2020255013A1 (en) Combination of hepatitis b virus (hbv) vaccines and capsid assembly modulators being amide derivatives
US20220305117A1 (en) Combination of hepatitis b virus (hbv) vaccines and hbv-targeting rnai
TW202245809A (zh) 用於治療b型肝炎病毒感染之組合療法
US20240181037A1 (en) Immunogenic compositions
US20220226467A1 (en) Arenavirus vectors for hepatitis b virus (hbv) vaccines and uses thereof
US20220305107A1 (en) COMBINATION OF HEPATITIS B VIRUS (HBV) VACCINES AND HBV-TARGETING RNAi
WO2022009052A2 (en) Prostate neoantigens and their uses
US20220305108A1 (en) Lipid nanoparticle or liposome delivery of hepatitis b virus (hbv) vaccines
US12018289B2 (en) Vaccines based on mutant CALR and JAK2 and their uses
WO2020254876A1 (en) Virus-like particle delivery of hepatitis b virus (hbv) vaccines
WO2020255015A1 (en) Combination of hepatitis b virus (hbv) vaccines and dihydropyrimidine derivatives as capsid assembly modulators
WO2020255010A1 (en) Combination of recombinant interleukin 12 construct and hepatitis b virus (hbv) vaccines
WO2020255042A1 (en) Combination of hepatitis b virus (hbv) vaccines and a pyrimidine derivative