KR20230050328A - Hbv에 대한 rna 레플리콘 백신 - Google Patents
Hbv에 대한 rna 레플리콘 백신 Download PDFInfo
- Publication number
- KR20230050328A KR20230050328A KR1020237004630A KR20237004630A KR20230050328A KR 20230050328 A KR20230050328 A KR 20230050328A KR 1020237004630 A KR1020237004630 A KR 1020237004630A KR 20237004630 A KR20237004630 A KR 20237004630A KR 20230050328 A KR20230050328 A KR 20230050328A
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- hbv
- amino acid
- antigen
- polynucleotide sequence
- Prior art date
Links
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
- A61K39/29—Hepatitis virus
- A61K39/292—Serum hepatitis virus, hepatitis B virus, e.g. Australia antigen
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/20—Antivirals for DNA viruses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N7/00—Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/51—Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
- A61K2039/53—DNA (RNA) vaccination
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/545—Medicinal preparations containing antigens or antibodies characterised by the dose, timing or administration schedule
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/57—Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2730/00—Reverse transcribing DNA viruses
- C12N2730/00011—Details
- C12N2730/10011—Hepadnaviridae
- C12N2730/10111—Orthohepadnavirus, e.g. hepatitis B virus
- C12N2730/10134—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2840/00—Vectors comprising a special translation-regulating system
- C12N2840/20—Vectors comprising a special translation-regulating system translation of more than one cistron
- C12N2840/203—Vectors comprising a special translation-regulating system translation of more than one cistron having an IRES
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/30—Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Virology (AREA)
- Chemical & Material Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Medicinal Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Microbiology (AREA)
- Veterinary Medicine (AREA)
- Public Health (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- Biotechnology (AREA)
- Immunology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Communicable Diseases (AREA)
- Molecular Biology (AREA)
- Mycology (AREA)
- Epidemiology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- General Chemical & Material Sciences (AREA)
- Oncology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
Abstract
B형 간염 바이러스(HBV) 표면 항원, HBV 코어 항원, 및 HBV 폴리머라제 항원, 및 관련 조합을 인코딩하는 핵산 분자가 기재되어 있다. DNA 플라스미드 또는 바이러스 벡터와 같은 벡터, 및 HBV 항원을 발현하는 RNA 레플리콘, 및 발현 벡터를 함유하는 약제학적 조성물이 또한 기재되어 있다. 본 발명의 약제학적 조성물을 사용하여 특히 만성 HBV 감염을 가진 개체에서 HBV에 대한 면역 반응을 유도하거나 HBV-유발 질환을 치료하는 방법이 또한 기재되어 있다.
Description
관련 출원에 대한 상호 참조
본 출원은 2020년 7월 8일에 출원된 미국 가특허 출원 번호 63/049,400 및 2021년 2월 1일에 출원된 미국 가특허 출원 번호 63/144,051에 대한 우선권을 주장하며, 그 개시내용은 그 전체가 본원에 참조로 포함된다.
전자적으로 제출된 서열 목록에 대한 참조
본 출원은 EFS-Web을 통해 전자 제출된 ASCII 형식의 서열 목록으로서 2021년 6월 24일에 작성되고 크기가 390 KB인 파일명 "TIP1088WOPCT1-Sequence_ Listing"인 서열 목록을 포함한다. 상기 EFS-Web을 통해 제출된 서열 목록은 본 명세서의 일부이며, 그 전체가 본원에 참조로 포함된다.
발명의 분야
본 개시내용은 일반적으로 유전자 발현을 조절하는 데 유용한 핵산 분자, 및 예를 들어, 세포 배양 시 적합한 숙주 세포 또는 대상체에서 원하는 생성물을 생성하고 숙주 세포 또는 대상체에 유익한 특성을 부여하기 위한 핵산 분자의 용도를 포함하는, 분자 생물학 및 유전자 조작 분야에 관한 것이다.
B형 간염 바이러스(HBV: hepatitis B virus)는 4개의 오픈 리딩 프레임과 7개의 단백질을 인코딩하는 3.2 kb의 작은 간친화성(hepatotropic) DNA 바이러스이다. 약 20억 명의 사람들이 HBV에 감염되었고, 약 2억 4천만 명의 사람들이 6개월 초과 동안 혈액에 바이러스 및 서브바이러스 입자가 지속되는 것을 특징으로 하는 만성 B형 간염 감염(만성 HBV)을 가지고 있다(Cohen et al. J. Viral Hepat. (2011) 18(6), 377-83). 지속적인 HBV 감염은 바이러스 펩타이드 및 순환 항원으로 HBV-특이적 T 세포 수용체의 만성 자극을 통해 순환 및 간내 HBV-특이적 CD4+ 및 CD8+ T 세포에서 T 세포 고갈을 유발한다. 그 결과, T-세포 다기능성이 감소한다(즉, IL-2, 종양 괴사 인자(TNF)-α, IFN-γ의 수준 감소 및 증식 결여).
HBV 감염에 대한 안전하고 효과적인 예방 백신은 1980년대 이래로 활용 가능했으며 B형 간염 예방의 주류이다(World Health Organization, Hepatitis B: Fact sheet No. 204; 2015 March). 세계보건기구는 모든 유아의 백신접종, 그리고 B형 간염 유형이 낮거나 중간 정도인 국가에서는 모든 어린이 및 청소년(18세 미만)과 특정 위험 집단 범주에 속하는 사람들에게 백신접종을 권장한다. 백신접종 덕분에, 전 세계적으로 감염률이 극적으로 감소해왔다. 그러나, 예방 백신은 확립된 HBV 감염을 치료하지 않는다.
만성 HBV는 현재 IFN-α 및 뉴클레오시드 또는 뉴클레오티드 유사체로 치료되지만, 바이러스 RNA의 주형 및 따라서 새로운 비리온으로서 기본적인 역할을 하는 감염된 간세포에서 세포내 바이러스 복제 중간체, 소위 공유결합 폐환형 DNA(cccDNA: covalently closed circular DNA)의 잔존으로 인해 궁극적인 치료는 없다. 유도된 바이러스-특이적 T-세포 및 B-세포 반응은 cccDNA-보유 간세포를 효과적으로 제거할 수 있을 것으로 생각된다. 현재의 HBV 폴리머라제를 표적화하는 용법들은 바이러스혈증을 억제하지만 핵에 존재하는 cccDNA 및 관련된 순환 항원의 생산에는 제한된 효과를 제공한다. 가장 철저한 치료 형태는 유기체로부터 HBV cccDNA를 제거하는 것일 수 있으며, 이는 천연 발생 결과로서 또는 임의의 치료적 개입의 결과로서 모두 관찰된 바 없다. 그러나, 질환 재발은 오로지 심각한 면역억제의 경우에만 발생하며 이는 이후 예방적 치료에 의해 예방될 수 있기 때문에, HBV 표면 항원(HBsAg)의 손실은 임상적으로 신뢰할 수 있는 치료법이다. 따라서, 적어도 임상적 관점에서, HBsAg의 손실은 HBV에 대한 가장 엄격한 형태의 면역 재구성과 관련된다.
예를 들어, 페길화 인터페론(pegIFN)-α를 사용한 면역 조절은 한정된 치료 과정으로 지속적 치료 중단 반응의 측면에서 뉴클레오시드 또는 뉴클레오티드 요법과 비교하여 더 나은 것으로 입증되어 왔다. 직접적인 항바이러스 효과 외에도, IFN-α는 세포 배양 및 인간화 마우스에서 cccDNA의 후성유전적 억제를 발휘하여 비리온 생산성 및 전사의 감소를 유발하는 것으로 보고되었다(Belloni et al. J. Clin. Invest. (2012) 122(2), 529-537). 그러나, 이 요법은 여전히 부작용을 안고 있으며 전반적 반응은 다소 낮은데, 그 이유는 어느 정도 IFN-α가 HBV-특이적 T-세포에 불량한 조절적 영향만을 미치기 때문이다. 특히, 치료율(cure rate)은 낮고(< 10%) 독성은 높다. 마찬가지로, 직접적으로 작용하는 HBV 항바이러스제, 즉 HBV 폴리머라제 억제제인 엔테카비르(entecavir) 및 테노포비르(tenofovir)는 약물 내성 돌연변이체의 출현에 대한 높은 유전적 장벽과 간 질환 진행에 대한 연속적인 예방을 갖는 바이러스 억제 유도에서 단일 요법으로서 효과적이다. 그러나, HBsAg 손실 또는 혈청전환에 의해 규정되는 만성 B형 간염의 치료는, 그러한 HBV 폴리머라제 억제제에 의해서는 거의 달성되지 않는다. 따라서, 인간 면역 결핍 바이러스(HIV)에 대한 항레트로바이러스 요법과 유사하게, 이론적으로 이둘 항바이러스제는 간 질환의 재발을 예방하기 위해서는 무한정으로 투여될 필요가 있다.
치료적 백신접종은 만성적 감염 환자로부터 HBV를 제거할 잠재력을 가지고 있다(Michel et al. J. Hepatol. (2011) 54(6), 1286-1296). 많은 전략들이 탐색되어 왔지만, 지금까지 치료적 백신접종은 성공적이라고 입증되지 않았다.
따라서, B형 간염 바이러스(HBV), 특히 만성 HBV의 치료에서 더 높은 치료율을 가진 유한형의 내약성이 우수한 치료를 위한 충족되지 않은 의학적 요구가 존재한다. 본 발명은 B형 간염 바이러스(HBV) 감염에 대한 면역 반응을 유도하기 위한 면역원성 조성물 및 방법을 제공함으로써 이러한 필요성을 충족한다. 본 발명의 면역원성 조성물 및 방법은 만성 HBV 감염을 가진 대상체와 같은 대상체에 치료적 면역을 제공하기 위해 사용될 수 있다.
일반적인 측면에서, 본 출원은 비-천연 발생 폴리뉴클레오티드 서열을 포함하는 핵산 분자 또는 조합에 관한 것이다. 일부 실시양태에서, 비-천연 발생 폴리뉴클레오티드 서열은 5'-말단에서 3'-말단의 순서로 하기를 포함하고:
(1) 제1 B형 간염 바이러스(HBV) 항원을 인코딩하는 폴리뉴클레오티드 서열,
(2) 제1 내부 리보솜 진입 서열(IRES: internal ribosome entry sequence) 요소 또는 제1 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열, 및
제2 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열,
여기서 제1 HBV 항원 및 제2 HBV 항원은 HBV 코어 항원, HBV 폴리머라제(pol) 항원, 및 HBV 표면 항원으로 이루어진 군으로부터 각각 독립적으로 선택되고, 제1 및 제2 HBV 항원 중 적어도 하나는 HBV 표면 항원, 바람직하게는 HBV Pre-S1 항원 또는 HBV PreS2.S 항원이다.
일 실시양태에서, 제1 또는 제2 HBV 항원 중 하나는 HBV 코어 또는 HBV pol 항원이다.
일 실시양태에서, 비-천연 발생 폴리뉴클레오티드 서열은 5'-말단에서 3'-말단의 순서로 하기를 추가로 포함한다:
(4) 제2 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열의 3' 말단에 작동적으로 연결된 제2 오토프로테아제 펩타이드를 인코딩하는 제2 IRES 요소 또는 폴리뉴클레오티드 서열, 및
(5) HBV 코어 항원, HBV pol 항원, 및 HBV 표면 항원으로 이루어진 군으로부터 독립적으로 선택된 제3 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열.
또 다른 실시양태에서, 비-천연 발생 폴리뉴클레오티드 서열은 5'-말단에서 3'-말단의 순서로 하기를 추가로 포함한다:
(6) 제3 IRES 요소 또는 제3 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열의 3' 말단에 작동적으로 연결된 제3 오토프로테아제를 인코딩하는 폴리뉴클레오티드 서열, 및
(7) HBV 코어 항원, HBV pol 항원, 및 HBV 표면 항원으로 이루어진 군으로부터 독립적으로 선택된 제4 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열.
또 다른 실시양태에서, 핵산 분자 또는 조합은 5'-말단에서 3'-말단의 순서로 하기를 포함하는 제1 비-천연 발생 폴리뉴클레오티드 서열:
(1) 제1 B형 간염 바이러스(HBV) 항원을 인코딩하는 폴리뉴클레오티드 서열,
(2) 제1 내부 리보솜 진입 서열(IRES) 요소 또는 제1 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열, 및
(3) 제2 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열, 및
5'-말단에서 3'-말단의 순서로 하기를 포함하는 제2 비-천연 발생 폴리뉴클레오티드 서열:
(1) 제3 B형 간염 바이러스(HBV) 항원을 인코딩하는 폴리뉴클레오티드 서열,
(2) 제2 내부 리보솜 진입 서열(IRES) 요소 또는 제2 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열, 및
(3) 제4 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열을 포함하고,
여기서 제1 및 제2 비-천연 발생 폴리뉴클레오티드 서열은 제3 내부 리보솜 진입 서열(IRES) 요소 또는 제3 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열에 의해 연결되거나, 별도의 핵산 분자에 존재하고,
여기서 제1, 제2, 제3 및 제4 HBV 항원은 HBV 코어 항원, HBV 폴리머라제(pol) 항원, 및 HBV 표면 항원으로 이루어진 군으로부터 각각 독립적으로 선택되고, 제1, 제2, 제3 및 제4 HBV 항원 중 적어도 하나는 서열번호 1 또는 서열번호 3의 아미노산 서열과 적어도 98% 동일한 아미노산 서열을 갖는 HBV Pre-S1 항원 및 서열번호 5의 아미노산 서열과 적어도 98% 동일한 아미노산 서열을 갖는 HBV PreS2.S 항원으로부터 선택된 HBV 표면 항원이고, 바람직하게는 제1, 제2, 제3 또는 제4 HBV 항원 중 하나는 HBV 코어 또는 HBV pol 항원이다.
또 다른 실시양태에서, 제1, 제2, 제3 및 제4 HBV 항원 각각은 서로 상이하다.
또 다른 실시양태에서, 제1, 제2, 제3 및 제4 HBV 항원 각각은 하기로 이루어진 군으로부터 독립적으로 선택되고:
(i) 서열번호 1의 아미노산 서열과 적어도 98% 동일한, 예컨대 서열번호 1의 아미노산 서열과 적어도 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하는, 바람직하게는 이로 이루어진 제1 HBV Pre-S1 항원;
(ii) 서열번호 3의 아미노산 서열과 적어도 98% 동일한, 예컨대 서열번호 3의 아미노산 서열과 적어도 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하는, 바람직하게는 이로 이루어진 제2 HBV Pre-S1 항원;
(iii) 서열번호 5의 아미노산 서열과 적어도 98% 동일한, 예컨대 서열번호 5의 아미노산 서열과 적어도 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하는, 바람직하게는 이로 이루어진 HBV PreS2.S 항원;
(iv) 서열번호 7과 적어도 90% 동일한, 예컨대 서열번호 7과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하는, 바람직하게는 이로 이루어진 HBV 코어 항원; 및
(v) 서열번호 9와 적어도 90% 동일한, 예컨대 서열번호 9와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원,
바람직하게는, 제1 및 제2 HBV Pre-S1 항원, HBV 코어 항원 및 HBV pol 항원 각각은 독립적으로 신호 펩타이드에 작동적으로 연결되고, HBV PreS2.S 항원은 내부 신호 펩타이드를 포함한다.
일부 실시양태에서, HBV 코어 항원은 서열번호 84, 85, 또는 86 중 적어도 하나와 적어도 98% 동일한, 예컨대 서열번호 84, 85, 또는 86과 적어도 98%, 적어도 99%, 또는 100% 동일한 아미노산 서열을 포함하고, 바람직하게는 이로 이루어진다. 일부 실시양태에서, HBV 코어 항원의 마지막 5개의 C-말단 아미노산은 VVR 아미노산 서열, 보다 특히 VVRR(서열번호 91) 아미노산 서열, 보다 특히 VVRRR(서열번호 92) 아미노산 서열을 포함한다.
일부 실시양태에서, HBV 표면 항원, HBV 코어 항원 및 HBV pol 항원 각각은 하기를 포함한다:
(i) HBV 유전자형 A, B, C 및 D에 대한 컨센서스 서열; 및/또는
(ii) HLA-A*11:01, HLA-A*24:02, HLA-A*02:01, HLA-A*A2402, HLA-A*A0101, 또는 HLA-B*40:01에 대한 하나 이상의 에피토프.
일부 실시양태에서, HBV 표면 항원, HBV 코어 항원 및 HBV pol 항원 각각은 HLA-A*11:01에 대한 하나 이상의 에피토프를 포함한다.
또 다른 실시양태에서, 제1, 제2, 제3 및 제4 HBV 항원 각각은 하기로 이루어진 군으로부터 독립적으로 선택된다:
(i) 서열번호 1의 아미노산 서열로 이루어진 제1 HBV Pre-S1 항원;
(ii) 서열번호 3의 아미노산 서열로 이루어진 제2 HBV Pre-S1 항원;
(iii) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원;
(iv) 서열번호 84, 서열번호 85, 또는 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원; 및
(v) 서열번호 9의 아미노산 서열로 이루어진 HBV pol 항원,
바람직하게는, 제1 및 제2 HBV Pre-S1 항원, HBV 코어 항원 및 HBV pol 항원 각각은 독립적으로 서열번호 77의 아미노산 서열을 포함하는 신호 펩타이드와 같은 신호 펩타이드에 작동적으로 연결된다.
또 다른 실시양태에서, 제1, 제2, 제3 및 제4 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열 각각은 하기로 이루어진 군으로부터 독립적으로 선택되고:
(i) 서열번호 2와 적어도 90% 동일한, 예컨대 서열번호 2와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 서열을 갖는 제1 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(ii) 서열번호 4와 적어도 90% 동일한, 예컨대 서열번호 4와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 서열을 갖는 제2 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(iii) 서열번호 6과 적어도 90% 동일한, 예컨대 서열번호 6과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
(iv) 서열번호 8과 적어도 90% 동일한, 예컨대 서열번호 8과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열; 및
(v) 서열번호 10과 적어도 90% 동일한, 예컨대 서열번호 10과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 서열을 갖는 HBV pol 항원을 인코딩하는 폴리뉴클레오티드 서열,
바람직하게는, 제1 및 제2 HBV Pre-S1 항원, HBV 코어 항원 및 HBV pol 항원 각각을 인코딩하는 폴리뉴클레오티드 서열은 독립적으로 신호 펩타이드를 인코딩하는 폴리뉴클레오티드 서열에 작동적으로 연결되고, HBV PreS2.S 항원은 내부 신호 펩타이드를 포함한다.
일부 실시양태에서, 제1, 제2, 제3 및 제4 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열 각각은 하기로 이루어진 군으로부터 독립적으로 선택되고:
(i) 서열번호 2의 서열로 이루어진 제1 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(ii) 서열번호 4의 서열로 이루어진 제2 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(iii) 서열번호 6의 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
(iv) 서열번호 87, 서열번호 88 또는 서열번호 89 중 어느 하나의 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열; 및
(v) 서열번호 10의 서열로 이루어진 HBV pol 항원을 인코딩하는 폴리뉴클레오티드 서열;
바람직하게는, 제1 및 제2 HBV Pre-S1 항원, HBV 코어 항원 및 HBV pol 항원 각각을 인코딩하는 폴리뉴클레오티드 서열은 독립적으로 서열번호 90의 서열을 포함하는 폴리뉴클레오티드와 같은 신호 펩타이드를 인코딩하는 폴리뉴클레오티드에 작동적으로 연결된다.
일 실시양태에서, 제1, 제2 및 제3 오토프로테아제 펩타이드 각각은 독립적으로 돼지 테스코바이러스-1 2A(P2A), 구제역 바이러스(FMDV) 2A(F2A), 말 비염 A 바이러스(ERAV) 2A(E2A), 테세아 아시그나 바이러스 2A(T2A), 세포질 다각체병 바이러스 2A(BmCPV2A), 무름병 바이러스 2 A(BmIFV2A), 및 이들의 조합으로 이루어진 군으로부터 선택된 펩타이드 서열을 포함한다. 바람직하게는, 제1, 제2 및 제3 오토프로테아제 펩타이드 각각은 서열번호 11의 P2A 서열과 같은 P2A의 펩타이드 서열을 포함한다.
또 다른 실시양태에서, 제1, 제2 및 제3 IRES 각각은 뇌심근염 바이러스(EMCV) 또는 엔테로바이러스 71(EV71)로부터 유래된다. 바람직하게는, 제1, 제2 및 제3 IRES 각각은 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 포함한다.
일부 실시양태에서, 핵산 분자 또는 조합은 5'-말단에서 3'-말단의 순서로 하기를 포한하는 비-천연 발생 폴리뉴클레오티드 서열을 포함한다:
(1) 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
(2) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(3) 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(4) 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(5) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(6) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(7) 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(8) 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(9) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(10) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(11) 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(12) 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(13) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(14) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(15) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(16) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(17) 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
(18) 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
(19) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(20) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(21) 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열; 또는
(22) 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열,
바람직하게는, 제1 및 제2 HBV Pre-S1 항원, HBV 코어 항원 및 HBV pol 항원 각각을 인코딩하는 폴리뉴클레오티드 서열은 독립적으로 서열번호 77의 아미노산 서열을 포함하는 신호 펩타이드와 같은 신호 펩타이드를 인코딩하는 폴리뉴클레오티드 서열에 작동적으로 연결된다.
일 실시양태에서, 핵산 분자 또는 조합은 서열번호 15 내지 54 중 어느 하나의 비-천연 발생 폴리뉴클레오티드 서열을 포함한다.
또 다른 일반적인 측면에서, 본 출원은 본 출원의 핵산 분자 또는 조합을 포함하는 벡터에 관한 것이다.
일 실시양태에서, 벡터는 DNA 플라스미드이다. 또 다른 실시양태에서, 벡터는 DNA 바이러스 벡터 또는 RNA 바이러스 벡터이다. 일 실시양태에서, 벡터는 변형된 백시니아 앙카라(MVA) 벡터 또는 아데노바이러스 벡터이다. 일 실시양태에서, 벡터는 Ad26, Ad35, 또는 MVA-BN 벡터이다.
또 다른 일반적인 측면에서, 본 출원은 5'-말단에서 3'-말단의 순서로 하기를 포함하는 RNA 레플리콘에 관한 것이다:
(1) RNA 바이러스의 비구조 단백질-매개 증폭에 필요한 5' 비번역 영역(5'-UTR);
(2) RNA 바이러스의 비구조 단백질 중 적어도 하나, 바람직하게는 모두를 인코딩하는 폴리뉴클레오티드 서열;
(3) RNA 바이러스의 서브게놈 프로모터;
(4) 본 출원의 핵산 분자 또는 조합; 및
(5) RNA 바이러스의 비구조 단백질-매개 증폭에 필요한 3' 비번역 영역(3'-UTR).
또 다른 일반적인 측면에서, 본 출원은 5'-말단에서 3'-말단의 순서로 하기를 포함하는 RNA 레플리콘에 관한 것이다:
(1) 알파바이러스 5' 비번역 영역(5'-UTR),
(2) 알파바이러스 비구조 유전자 nsp1의 5' 복제 서열,
(3) 바이러스 종의 다운스트림 루프(DLP: downstream loop) 모티프,
(4) 제4 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열,
(5) 알파바이러스 비구조 단백질 nsp1, nsp2, nsp3 및 nsp4를 인코딩하는 폴리뉴클레오티드 서열,
(6) 알파바이러스 서브게놈 프로모터,
(7) 본 출원의 핵산 분자 또는 조합,
(8) 알파바이러스 3' 비번역 영역(3' UTR), 및
(9) 선택적으로, 폴리 아데노신 서열.
일 실시양태에서, DLP 모티프는 동부 말 뇌염 바이러스(EEEV: Eastern equine encephalitis virus), 베네수엘라 말 뇌염 바이러스(VEEV: Venezuelan equine encephalitis virus), 에버글레이즈 바이러스(EVEV: Everglades virus), 무캄보 바이러스(MUCV: Mucambo virus), 셈리키 포레스트 바이러스(SFV: Semliki forest virus), 픽수나 바이러스(PIXV: Pixuna virus), 미들버그 바이러스(MTDV: Middleburg virus), 치쿤구니야 바이러스(CHIKV: Chikungunya virus), 오니옹-니옹 바이러스(ONNV: O'Nyong-Nyong virus), 로스 리버 바이러스(RRV: Ross River virus), 바마 포레스트 바이러스(BF: Barmah Forest virus), 게타 바이러스(GET: Getah virus), 사기야마 바이러스(SAGV: Sagiyama virus), 베바루 바이러스(BEBV: Bebaru virus), 마야로 바이러스(MAYV: Mayaro virus), Una 바이러스(UAV: Una virus), 신드비스 바이러스(SINV: Sindbis virus), 아우라 바이러스(AURAV: Aura virus), 와타로아 바이러스(WHAV: Whataroa virus), 바반키 바이러스(BABV: Babanki virus), 키질라가크 바이러스(KYZV: Kyzylagach virus), 서부 말 뇌염 바이러스(WEEV: Western equine encephalitis virus), 하이랜드 J 바이러스(HJV: Highland J virus), 포트 모건 바이러스(FMV: Fort Morgan virus), Ndumu(NDUV), 및 버기 크릭 바이러스(Buggy Creek virus)로 이루어진 군으로부터 선택된 바이러스 종으로부터 유래된다.
또 다른 실시양태에서, 제4 오토프로테아제 펩타이드는 돼지 테스코바이러스-1 2A(P2A), 구제역 바이러스(FMDV) 2A(F2A), 말 비염 A 바이러스(ERAV) 2A(E2A), 테세아 아시그나 바이러스 2A(T2A), 세포질 다각체병 바이러스 2A(BmCPV2A), 무름병 바이러스 2 A(BmIFV2A), 및 이들의 조합으로 이루어진 군으로부터 선택된다. 바람직하게는, 제4 오토프로테아제 펩타이드는 P2A의 펩타이드 서열을 포함한다.
또 다른 일반적인 측면에서, 본 출원은 5'-말단에서 3'-말단의 순서로 하기를 포함하는 RNA 레플리콘에 관한 것이다:
(1) 서열번호 55의 폴리뉴클레오티드 서열을 갖는 5'-UTR,
(2) 서열번호 56의 폴리뉴클레오티드 서열을 갖는 5' 복제 서열,
(3) 서열번호 57의 폴리뉴클레오티드 서열을 포함하는 DLP 모티프,
(4) 서열번호 11의 P2A 서열을 인코딩하는 폴리뉴클레오티드 서열,
(5) 각각 서열번호 58, 서열번호 59, 서열번호 60 및 서열번호 61의 핵산 서열을 갖는 알파바이러스 비구조 단백질 nsp1, nsp2, nsp3 및 nsp4를 인코딩하는 폴리뉴클레오티드 서열,
(6) 서열번호 62의 폴리뉴클레오티드 서열을 갖는 서브게놈 프로모터,
(7) 본 출원의 핵산 분자 또는 조합, 및
(8) 서열번호 63의 폴리뉴클레오티드 서열을 갖는 3' UTR.
일 실시양태에서, P2A 서열을 인코딩하는 폴리뉴클레오티드 서열은 서열번호 12를 포함하고, 핵산 분자 또는 조합은 서열번호 15 내지 54 중 어느 하나의 폴리뉴클레오티드 서열을 포함하고, RNA 레플리콘은 레플리콘의 3'-말단에 폴리 아데노신 서열을 포함한다. 바람직하게는, 폴리 아데노신 서열은 서열번호 64의 서열을 갖는다.
또 다른 일반적인 측면에서, 본 출원은 서열번호 65 내지 72 중 어느 하나의 폴리뉴클레오티드 서열을 포함하는 RNA 레플리콘에 관한 것이다.
또 다른 일반적인 측면에서, 본 출원은 본 출원의 RNA 레플리콘을 인코딩하는 폴리뉴클레오티드 서열을 포함하는 핵산 분자에 관한 것이다. 바람직하게는, 핵산은 DNA 서열의 5'-말단에 작동적으로 연결된 T7 프로모터를 추가로 포함한다. 보다 바람직하게는, T7 프로모터는 서열번호 73의 뉴클레오티드 서열을 포함한다.
또 다른 일반적인 측면에서, 본 출원은 본 출원의 핵산 분자 또는 조합, 벡터, 또는 RNA 레플리콘, 및 약제학적으로 허용되는 담체를 포함하는 약제학적 조성물에 관한 것이다.
일 실시양태에서, 약제학적으로 허용되는 담체는 지질 나노입자를 포함하고, 바람직하게는 지질 나노입자는 ALC-0315, DOTMA, DOTAP, DDAB, DOGS, DSDMA, DODMA, DLinDMA, DLenDMA, γ-DLenDMA, DLin-K-DMA, DLin-K-C2-DMA, DLin-K-C3-DMA, DLin-K-C4-DMA, DLen-C2K-DMA, y-DLen-C2K-DMA, DLin-M-C2-DMA, DLin-M-C3-DMA, DLin-MP-DMA, 또는 DCChol 중 하나 이상을 포함한다.
또 다른 실시양태에서, 약제학적 조성물은 하기를 추가로 포함한다: (1) 서열번호 84, 85 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열; 또는 (2) 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 84, 85 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열.
또 다른 일반적인 측면에서, 본 출원은 HBV에 대해 대상체를 백신접종하는 방법에 관한 것으로, 상기 방법은 본 출원의 약제학적 조성물을 대상체에게 투여하는 단계를 포함한다. 일 실시양태에서, 상기 방법은 프라임-부스트 용법(prime-boost regimen)으로서 적어도 하나의 동일한 HBV 항원을 인코딩하는 핵산 분자 또는 조합을 포함하는 제2 조성물을 대상체에게 투여하는 단계를 추가로 포함한다. 일부 실시양태에서, 프라임-부스트 용법은 본 출원의 RNA 레플리콘을 포함하는 프라이밍 조성물 및 RNA 레플리콘이 아니고 적어도 하나의 동일한 HBV 에피토프를 인코딩하는 벡터를 포함하는 부스팅 조성물, 바람직하게는, 프라이밍 조성물로서 적어도 하나의 동일한 HBV 항원을 포함한다. 일 실시양태에서, 부스팅 조성물은 변형된 백시니아 앙카라(MVA) 벡터, 아데노바이러스 벡터 또는 플라스미드 벡터를 포함한다. 일부 실시양태에서, 부스팅 조성물은 Ad26, Ad35, 또는 MVA-BN 벡터를 포함한다. 일부 실시양태에서, 프라임-부스트 용법은 본 출원의 RNA 레플리콘을 포함하는 부스팅 조성물 및 RNA 레플리콘이 아니고 적어도 하나의 동일한 HBV 에피토프, 예컨대 적어도 하나의 동일한 HLA 에피토프를 인코딩하는 벡터를 포함하는 프라이밍 조성물, 바람직하게는, 부스팅 조성물로서 적어도 하나의 동일한 HBV 항원을 포함한다. 일 실시양태에서, 프라이밍 조성물은 변형된 백시니아 앙카라(MVA) 벡터, 아데노바이러스 벡터 또는 플라스미드 벡터를 포함한다. 일부 실시양태에서, 프라이밍 조성물은 Ad26, Ad35, 또는 MVA-BN 벡터를 포함한다.
또 다른 일반적인 측면에서, 본 출원은 본 출원의 약제학적 조성물을 대상체에게 투여하거나 본 출원의 방법에 따라 대상체를 백신접종하는 단계를 포함하는, 대상체에서 HBV의 감염 및/또는 복제를 감소시키는 방법에 관한 것이다.
또 다른 일반적인 측면에서, 본 출원은 본 출원의 핵산 분자 또는 조합, 벡터, 또는 RNA 레플리콘을 포함하는 단리된 숙주 세포에 관한 것이다.
또 다른 일반적인 측면에서, 본 출원은 생체내 또는 시험관내에서 본 출원의 핵산을 전사하는 단계를 포함하는, RNA 레플리콘의 생성 방법에 관한 것이다.
또 다른 일반적인 측면에서, 본 출원은 이를 필요로 하는 대상체, 바람직하게는 만성 HBV 감염을 가진 대상체에서 선택적으로 또 다른 면역원성 제제 또는 또 다른 항-HBV 제제와 조합하여 B형 간염 바이러스(HBV)에 대한 면역 반응을 유도하는 데 사용하기 위한 본 출원의 약제학적 조성물에 관한 것이다.
또 다른 일반적인 측면에서, 본 출원은 B형 간염 바이러스(HBV)-유발 질환 치료를 필요로 하는 대상체, 바람직하게는 만성 HBV 감염을 가진 대상체에서 선택적으로 또 다른 치료제, 바람직하게는 또 다른 항-HBV 제제와 조합하여 진행성 섬유증, 간경변 및 간세포 암종(HCC)으로 이루어진 군으로부터 선택된 B형 간염 바이러스(HBV)-유발 질환을 치료하는 데 사용하기 위한 본 출원의 약제학적 조성물에 관한 것이다.
본 발명의 다른 측면, 특징 및 이점은 본 발명의 상세한 설명 및 이의 바람직한 실시양태 및 첨부된 청구범위를 포함하는 하기의 개시내용으로부터 명백해질 것이다.
본 발명의 하기의 상세한 설명뿐만 아니라 전술한 요약은 첨부된 도면과 함께 판독할 경우 보다 잘 이해될 것이다. 본 발명은 도면에 나타낸 정확한 실시양태에 제한되지 않는다는 것을 이해해야 한다.
도 1a는 불활성화 점 돌연변이를 갖는 Pol, C 말단 결실(서열번호 76)을 갖는 절두된 코어, PreS2.S, 및 시스타틴 S 신호 펩타이드(서열번호 77)를 나타내는 PreS1을 포함하는 항원 설계의 개략도를 나타낸다.
도 1b는 바이시스트론 및 테트라시스트론 백신 설계의 개략도를 나타낸다.
도 2는 상위 4개의 바이시스트론 백신 및 상위 4개의 테트라시스트론 백신 설계로부터의 HBV 항원의 상대적 발현을 나타내는 일련의 그래프이다. Vero 세포에서의 코어, PreS2.S 및 PreS1 발현을 유세포 분석에 의해 측정되었고, 단일유전자 대조군에 비해 MFI로서 보고되었다. Pol 발현은 웨스턴 블롯에 의해 측정되었고, 상대적 발현은 농도계를 사용하여 결정되었다.
도 3은 트리시스트론 백신 설계로부터 HBV 항원의 상대적 발현을 나타내는 일련의 그래프이다. Vero 세포에서의 코어 및 PreS2.S 발현은 유세포 분석에 의해 측정되었고, 단일유전자 대조군에 비해 MFI로서 보고되었다. Pol 발현은 웨스턴 블롯에 의해 측정되었고, 상대 발현은 농도계를 사용하여 결정되었다.
도 4a-도 4d는 HBV 항원을 인코딩하는 SMARRT 레플리콘을 사용한 생체내 면역화의 결과를 나타내는 그래프이다. C57BL/6 마우스에 단일유전자 HBV 항원을 인코딩하는 SMARRT 레플리콘을 i.m. 주사하거나 혼합하였다. 식염수를 대조군으로서 주사하였다. 프라이밍 후 14일에 비장을 적출하고, 비장세포를 코어(도 4a), Pol(도 4b), PreS2.S(도 4c) 및 PreS1(도 4d)에 대한 중첩 펩타이드 풀로 재자극하였다. IFNγ 생성 세포의 수는 ELISpot으로 측정하였다. 그래프는 95% CI(그룹당 n = 5마리의 마우스)로 평균을 나타내고, 통계적 비교를 위해 만-휘트니 검정(Mann-Whitney test)을 수행하였다. *p < 0.05; **p < 0.01
도 5a-도 5h는 HBV 항원을 인코딩하는 SMARRT 레플리콘을 사용한 생체내 면역화 및 2주차 재자극의 결과를 나타내는 그래프이다. C57BL/6 마우스에 단일유전자 HBV 항원을 인코딩하는 SMARRT 레플리콘을 i.m. 주사하거나 혼합하였다. 식염수를 대조군으로서 주사하였다. 프라이밍 후 14일에 비장을 적출하고, 비장세포를 브레펠딘 A의 존재 하에 6시간 동안 코어(도 5a 및 도 5e), Pol(도 5b 및 도 5f), PreS2.S(도 5c 및 도 5g) 및 PreS1(도 5d 및 도 5h)에 대한 중첩 펩타이드 풀로 재자극하였다. CD4 및 CD8 T 세포에 의한 IFNγ, TNFα 및 IL-2 생성을 세포내 사이토카인 염색으로 측정하였다. 다기능성은 세포당 1(IFNγ+), 2(IFNγ+ TNFα+) 또는 3(IFNγ+ TNFα+ IL-2+) 사이토카인의 생성에 의해 결정된 대로 플롯팅된다. 그래프는 SD로 평균을 나타낸다(그룹당 n = 5마리의 마우스).
도 6a-도 6d는 HBV 항원을 인코딩하는 SMARRT 레플리콘을 사용한 생체내 면역화의 결과를 나타내는 그래프이다. C57BL/6 마우스에 단일유전자 또는 혼합된 HBV 항원, 이중유전자 항원 또는 테트라시스트론 작제물을 인코딩하는 SMARRT 레플리콘을 i.m. 주사하였다. 식염수를 대조군으로서 주사하였다. 프라이밍 후 14일에 비장을 적출하고, 비장세포를 코어(도 6a), Pol(도 6b), PreS2.S(도 6c) 및 PreS1(도 6d)에 대한 중첩 펩타이드 풀로 재자극하였다. IFNγ 생성 세포의 수는 ELISpot으로 측정하였다. 그래프는 95% CI로 평균을 나타낸다(그룹당 n = 5마리의 마우스).
도 7a-도 7d는 HBV 항원을 인코딩하는 SMARRT 레플리콘을 사용한 생체내 면역화 및 2주차 재자극의 결과를 나타내는 그래프이다. C57BL/6 마우스에 단일유전자 또는 혼합된 HBV 항원, 이중유전자 항원 또는 테트라시스트론 작제물을 인코딩하는 SMARRT 레플리콘을 i.m. 주사하였다. 식염수를 대조군으로서 주사하였다. 프라이밍 후 14일에 비장을 적출하고, 비장세포를 브레펠딘 A의 존재하에 6시간 동안 코어(도 7a), Pol(도 7b), PreS2.S(도 7c) 및 PreS1(도 7d)에 대한 중첩 펩타이드 풀로 재자극하였다. CD4 및 CD8 T 세포에 의한 IFNγ, TNFα 및 IL-2 생성을 세포내 사이토카인 염색으로 측정하였다. 다기능성은 세포당 1(IFNγ+), 2(IFNγ+ TNFα+) 또는 3(IFNγ+ TNFα+ IL-2+) 사이토카인의 생성에 의해 결정된 대로 플롯팅된다. 그래프는 SD로 평균을 나타낸다(그룹당 n = 5마리의 마우스).
도 1a는 불활성화 점 돌연변이를 갖는 Pol, C 말단 결실(서열번호 76)을 갖는 절두된 코어, PreS2.S, 및 시스타틴 S 신호 펩타이드(서열번호 77)를 나타내는 PreS1을 포함하는 항원 설계의 개략도를 나타낸다.
도 1b는 바이시스트론 및 테트라시스트론 백신 설계의 개략도를 나타낸다.
도 2는 상위 4개의 바이시스트론 백신 및 상위 4개의 테트라시스트론 백신 설계로부터의 HBV 항원의 상대적 발현을 나타내는 일련의 그래프이다. Vero 세포에서의 코어, PreS2.S 및 PreS1 발현을 유세포 분석에 의해 측정되었고, 단일유전자 대조군에 비해 MFI로서 보고되었다. Pol 발현은 웨스턴 블롯에 의해 측정되었고, 상대적 발현은 농도계를 사용하여 결정되었다.
도 3은 트리시스트론 백신 설계로부터 HBV 항원의 상대적 발현을 나타내는 일련의 그래프이다. Vero 세포에서의 코어 및 PreS2.S 발현은 유세포 분석에 의해 측정되었고, 단일유전자 대조군에 비해 MFI로서 보고되었다. Pol 발현은 웨스턴 블롯에 의해 측정되었고, 상대 발현은 농도계를 사용하여 결정되었다.
도 4a-도 4d는 HBV 항원을 인코딩하는 SMARRT 레플리콘을 사용한 생체내 면역화의 결과를 나타내는 그래프이다. C57BL/6 마우스에 단일유전자 HBV 항원을 인코딩하는 SMARRT 레플리콘을 i.m. 주사하거나 혼합하였다. 식염수를 대조군으로서 주사하였다. 프라이밍 후 14일에 비장을 적출하고, 비장세포를 코어(도 4a), Pol(도 4b), PreS2.S(도 4c) 및 PreS1(도 4d)에 대한 중첩 펩타이드 풀로 재자극하였다. IFNγ 생성 세포의 수는 ELISpot으로 측정하였다. 그래프는 95% CI(그룹당 n = 5마리의 마우스)로 평균을 나타내고, 통계적 비교를 위해 만-휘트니 검정(Mann-Whitney test)을 수행하였다. *p < 0.05; **p < 0.01
도 5a-도 5h는 HBV 항원을 인코딩하는 SMARRT 레플리콘을 사용한 생체내 면역화 및 2주차 재자극의 결과를 나타내는 그래프이다. C57BL/6 마우스에 단일유전자 HBV 항원을 인코딩하는 SMARRT 레플리콘을 i.m. 주사하거나 혼합하였다. 식염수를 대조군으로서 주사하였다. 프라이밍 후 14일에 비장을 적출하고, 비장세포를 브레펠딘 A의 존재 하에 6시간 동안 코어(도 5a 및 도 5e), Pol(도 5b 및 도 5f), PreS2.S(도 5c 및 도 5g) 및 PreS1(도 5d 및 도 5h)에 대한 중첩 펩타이드 풀로 재자극하였다. CD4 및 CD8 T 세포에 의한 IFNγ, TNFα 및 IL-2 생성을 세포내 사이토카인 염색으로 측정하였다. 다기능성은 세포당 1(IFNγ+), 2(IFNγ+ TNFα+) 또는 3(IFNγ+ TNFα+ IL-2+) 사이토카인의 생성에 의해 결정된 대로 플롯팅된다. 그래프는 SD로 평균을 나타낸다(그룹당 n = 5마리의 마우스).
도 6a-도 6d는 HBV 항원을 인코딩하는 SMARRT 레플리콘을 사용한 생체내 면역화의 결과를 나타내는 그래프이다. C57BL/6 마우스에 단일유전자 또는 혼합된 HBV 항원, 이중유전자 항원 또는 테트라시스트론 작제물을 인코딩하는 SMARRT 레플리콘을 i.m. 주사하였다. 식염수를 대조군으로서 주사하였다. 프라이밍 후 14일에 비장을 적출하고, 비장세포를 코어(도 6a), Pol(도 6b), PreS2.S(도 6c) 및 PreS1(도 6d)에 대한 중첩 펩타이드 풀로 재자극하였다. IFNγ 생성 세포의 수는 ELISpot으로 측정하였다. 그래프는 95% CI로 평균을 나타낸다(그룹당 n = 5마리의 마우스).
도 7a-도 7d는 HBV 항원을 인코딩하는 SMARRT 레플리콘을 사용한 생체내 면역화 및 2주차 재자극의 결과를 나타내는 그래프이다. C57BL/6 마우스에 단일유전자 또는 혼합된 HBV 항원, 이중유전자 항원 또는 테트라시스트론 작제물을 인코딩하는 SMARRT 레플리콘을 i.m. 주사하였다. 식염수를 대조군으로서 주사하였다. 프라이밍 후 14일에 비장을 적출하고, 비장세포를 브레펠딘 A의 존재하에 6시간 동안 코어(도 7a), Pol(도 7b), PreS2.S(도 7c) 및 PreS1(도 7d)에 대한 중첩 펩타이드 풀로 재자극하였다. CD4 및 CD8 T 세포에 의한 IFNγ, TNFα 및 IL-2 생성을 세포내 사이토카인 염색으로 측정하였다. 다기능성은 세포당 1(IFNγ+), 2(IFNγ+ TNFα+) 또는 3(IFNγ+ TNFα+ IL-2+) 사이토카인의 생성에 의해 결정된 대로 플롯팅된다. 그래프는 SD로 평균을 나타낸다(그룹당 n = 5마리의 마우스).
다양한 간행물, 논문 및 특허가 배경 및 명세서 전반에 걸쳐 인용되거나 기재되어 있으며; 이들 참조문헌 각각은 그 전체가 본원에 참조로 포함된다. 본 명세서에 포함된 문서, 논문, 재료, 장치, 물품 등에 대한 논의는 본 발명에 대한 맥락을 제공하기 위한 것이다. 그러한 논의는 이러한 대상 중 임의의 것이나 전부가 개시되거나 청구되는 임의의 발명에 대해 선행 기술의 일부를 형성한다는 것을 인정하는 것이 아니다.
달리 정의되지 않는 한, 본원에 사용된 모든 기술적 및 과학적 용어들은 본 발명이 속하는 당업자에게 일반적으로 이해되는 것과 동일한 의미를 갖는다. 그렇지 않으면, 본원에 사용된 특정 용어는 본 명세서에서 설정된 의미를 갖는다. 본원에 인용된 모든 특허, 특허 출원 공보, 및 간행물은 본원에 완전히 개시된 것처럼 참조로 포함된다.
본원 및 첨부된 청구범위에서 사용된 바와 같이, 단수 형태 "a", "an" 및 "the"는 문맥상 명백하게 달리 나타내지 않는 한 복수의 대상을 포함한다는 것을 주목해야 한다.
달리 언급되지 않는 한, 본원에 기재된 % 서열 동일성 또는 % 서열 동일성 범위와 같은 임의의 수치 값은 모든 경우에 용어 "약"에 의해 수식되는 것으로 이해되어야 한다. 따라서, 수치 값은 전형적으로 인용된 값의 ± 10%를 포함한다. 예를 들어, 10 mg의 투여량은 9 mg 내지 11 mg을 포함한다. 본원에 사용된 바와 같이, 수치 범위의 사용은 문맥상 명백하게 달리 나타내지 않는 한, 모든 가능한 하위범위, 그러한 범위 내의 정수를 포함한 그 범위 내의 모든 개별 수치 값 및 그 값들의 분수를 명백하게 포함한다.
본원에 사용된 바와 같이, 다수의 인용된 요소들 간의 연결 용어 "및/또는"은 개별 옵션과 조합된 옵션 둘 모두를 포함하는 것으로 이해된다. 예를 들어, 두 요소가 "및/또는"으로 결합된 경우, 제1 옵션은 제2 요소가 없는 제1 요소가 적용될 수 있음을 지칭한다. 제2 옵션은 첫 번째 요소 없이 제2 요소가 적용될 수 있음을 지칭한다. 제3 옵션은 제1 요소와 제2 요소가 함께 적용될 수 있음을 지칭한다. 이들 옵션 중 어느 하나는 의미 내에 속하는 것으로 이해되며, 따라서 본원에 사용된 용어 "및/또는"의 요건을 충족한다. 하나 초과의 옵션들을 동시에 적용할 수 있는 것도 의미 내에 속하므로 이해되며, 따라서 용어 "및/또는"의 요건을 충족하는 것으로 이해된다.
달리 나타내지 않는 한, 일련의 요소들 앞에 있는 용어 "적어도"는 일련의 모든 요소들을 지칭하는 것으로 이해되어야 한다. 당업자는 통상의 실험만을 사용하여 본원에 기재된 본 발명의 구체적인 실시양태에 대한 많은 등가물을 인식하거나 확인할 수 있을 것이다. 그러한 등가물은 본 발명에 포함되는 것으로 의도된다.
문맥상 달리 요구하지 않는 한, 본 명세서 및 이하의 청구범위 전체에 걸쳐, 단어 "포함하다(comprise)" 및 "포함하다(comprises)" 및 "포함하는(comprising)"과 같은 변현형은 명시된 정수 또는 단계 또는 정수 또는 단계의 그룹을 포함하지만 임의의 다른 정수 또는 단계 또는 정수 또는 단계의 그룹을 배제하지 않음을 의미하는 것으로 이해될 것이다. 본원에 사용될 때 용어 "포함하는"은 용어 "함유하는" 또는 "포함하는"으로 대체될 수 있거나, 때때로 용어 "갖는"과 함께 사용될 때 대체될 수 있다.
본원에 사용될 때 "~로 이루어진"은 청구범위 요소에서 명시되지 않은 임의의 요소, 단계 또는 성분을 배제한다. 본원에 사용될 때, "~로 본질적으로 이루어진"은 청구범위의 기본 및 신규한 특성에 실질적으로 영향을 미치지 않는 물질 또는 단계를 배제하지 않는다. 본 발명의 측면 또는 실시양태의 맥락에서 본원에 사용될 때마다 "포함하는(comprising)", "함유하는(containing)", "포함하는(including)" 및 "갖는"의 전술한 용어들 중 임의의 용어는 본 개시내용의 범위를 변경하기 위해 용어 "~로 이루어진" 또는 "~로 본질적으로 이루어진"으로 대체될 수 있다.
본원에 사용된 "에피토프"는 면역글로불린, T 세포 수용체 또는 인간 백혈구 항원(HLA) 분자에 의해 인식되는 부위를 형성하는 아미노산 잔기의 세트이다.
HLA 단백질은 이식 거부에서 MHC 유전자좌에 의해 인코딩된 단백질의 중요한 역할을 인식하여 주요 조직적합성 복합체(MHC: Major Histocompatibility Complex)로 알려진 6번 염색체에 위치한 영역을 형성하는 유전자 클러스터에 의해 인코딩된다. 따라서, HLA 단백질은 MHC 단백질로도 지칭된다. HLA 또는 MHC 단백질은 세포내 위치에서 펩타이드에 결합하여 조합된 리간드가 T 세포에 의해 인식되는 세포 표면으로 이들을 전달하는 세포 표면 당단백질이다. 부류 I MHC 단백질은 신체의 거의 모든 유핵 세포에서 발견된다. 부류 I MHC 단백질은 세포질에 존재하는 펩타이드와 결합하여 세포독성 CD8+ T 세포에 의해 인식되는 세포 표면에 제시되는 펩타이드-MHC 단백질 복합체를 형성한다. 부류 II MHC 단백질은 일반적으로 B 림프구, 대식세포 및 수지상 세포와 같은 항원-제시 세포에서만 발견된다. 각각의 MHC 부류 I 수용체는 가변 α 사슬 및 비교적 보존된 β2- 마이크로글로불린 사슬로 이루어진다. 3개의 상이한 고도로 다형성인 부류 I α 사슬 유전자가 확인되었다. 이들을 HLA-A, HLA-B 및 HLA-C라 칭한다. α 사슬의 변이는 집단에서 모든 상이한 부류 I MHC 유전자를 설명한다.
아미노산 서열과 관련하여 사용될 때 문구 "퍼센트(%) 서열 동일성" 또는 "% 동일성" 또는 "~와 % 동일한"은 아미노산 서열의 전체 길이를 구성하는 아미노산 잔기의 수와 비교하여 2개 이상의 정렬된 아미노산 서열의 동일한 아미노산의 매칭("히트")의 수를 기술한다. 달리 말하면, 2개 이상의 서열을 위해, 서열이 당해 기술 분야에 알려져 있는 서열 대비 알고리즘을 사용하여 측정된 최대 유사성을 위해 비교 및 정렬될 경우, 또는 수동으로 정렬되고 시각적으로 검사될 경우, 정렬을 이용하여, 동일한 아미노산 잔기의 백분율(예를 들어, 아미노산 서열 전장에 걸쳐 90%, 91%, 92%, 93%, 94%, 95%, 97%, 98%, 99%, 또는 100% 동일성)이 결정될 수 있다. 뉴클레오티드 서열에 대해서도 동일한 결정을 내릴 수 있다. 따라서, 서열 동일성을 결정하기 위해 비교되는 서열은 아미노산의 치환(들), 추가(들) 또는 결실(들)에 의해 상이할 수 있다. 단백질 서열을 정렬하기 위한 적합한 프로그램은 당업자에게 알려져 있다. 단백질 서열의 서열 동일성 백분율은 CLUSTALW, Clustal Omega, FASTA 또는 BLAST와 같은 프로그램으로, 예를 들어, NCBI BLAST 알고리즘을 사용하여 결정될 수 있다(Altschul SF, et al (1997), Nucleic Acids Res. 25:3389-3402).
본원에 사용된 바와 같이, 대상체에게 둘 이상의 요법제 또는 구성요소를 투여하는 맥락에서 용어 및 문구 "조합하여", "와 조합하여", "공동-전달" 및 "~와 함께 투여"는 둘 이상의 요법제 또는 구성요소, 예컨대 2개의 핵산 분자, 예를 들어, RNA 레플리콘, 또는 면역원성 조성물 및 애쥬번트의 동시 투여를 지칭한다. "동시 투여"는 적어도 당일 내에 두 구성요소의 투여일 수 있다. 2개의 구성요소가 "~와 함께 투여" 또는 "~와 조합하여 투여"되는 경우, 이들은 짧은 기간, 예컨대 24시간, 20시간, 16시간, 12시간, 8시간 또는 4시간 이내에, 또는 1시간 이내에 별도의 조성물로 순차적으로 투여될 수 있거나, 이들은 단일 조성물로 동시에 투여될 수 있다. "~와 조합하여"라는 용어의 사용은 요법제 또는 구성요소가 대상체에게 투여되는 순서를 제한하지 않는다. 예를 들어, 제1 요법제 또는 구성요소(예를 들어, 제1 핵산 분자)는 제2 요법제 또는 구성요소(예를 들어, 제2 핵산 분자)의 투여 전(예를 들어, 5분 내지 1시간 전), 이와 병용하여 또는 동시에, 또는 그 후에(예를 들어, 5분 내지 1시간 후에) 투여될 수 있다. 일부 실시양태에서, 제1 요법제 또는 구성요소(예를 들어, 제1 핵산 분자) 및 제2 요법제 또는 구성요소(예를 들어, 제2 핵산 분자)는 동일한 조성물로 투여된다. 다른 실시양태에서, 제1 요법제 또는 구성요소(예를 들어, 제1 핵산 분자) 및 제2 요법제 또는 구성요소(예를 들어, 제2 핵산 분자)는 별개의 조성물로 투여된다.
본원에 사용된 바와 같이, "비-천연 발생" 핵산 또는 폴리펩타이드는 자연에서 발생하지 않는 핵산 또는 폴리펩타이드를 지칭한다. "비-천연 발생" 핵산 또는 폴리펩타이드는 실험실 및/또는 제조 환경에서 합성, 처리, 제조 및/또는 달리 조작될 수 있다. 일부 경우에, 비-천연 발생 핵산 또는 폴리펩타이드는 처리 전에, 천연 발생 핵산 또는 폴리펩타이드에 존재하지 않았던 특성을 나타내도록 처리(treated), 프로세싱(processed) 또는 조작되는 천연 발생 핵산 또는 폴리펩타이드를 포함할 수 있다. 본원에 사용된 바와 같이, "비-천연 발생" 핵산 또는 폴리펩타이드는 그것이 발견된 자연 공급원으로부터 단리되거나 분리된 핵산 또는 폴리펩타이드일 수 있으며, 그것은 자연 공급원에 그것이 회합되었던 서열에 대한 공유 결합이 결여되어 있다. "비-천연 발생" 핵산 또는 폴리펩타이드는 재조합적으로 또는 다른 방법, 예컨대 화학적 합성을 통해 만들어질 수 있다.
본원에 사용된 바와 같이, 용어 "작동적으로 연결된"은 그렇게 설명된 구성요소가 의도된 방식으로 기능하도록 허용하는 관계에 있는 연결 또는 병치를 지칭한다. 예를 들어, 관심 있는 핵산 서열에 작동적으로 연결된 조절 서열은 관심 있는 핵산 서열의 전사를 지시할 수 있거나, 관심 있는 아미노산 서열에 작동적으로 연결된 신호 서열은 막 상에서 관심 있는 아미노산 서열을 분비하거나 전위시킬 수 있다.
본원에 사용된 바와 같이, 용어 "프라이밍 조성물", "프라이밍 면역화" 또는 "프라임 면역화"는 본 발명의 제1 조성물을 사용하여 1차 항원 자극을 지칭한다. 구체적으로, 본원에 사용된 면역 반응을 "프라이밍" 또는 "강화하는"이라는 용어는 원하는 항원에 대한 면역 반응을 유도하고 동일한 항원으로 후속 재면역화 시 원하는 항원에 대한 더 높은 수준의 면역 반응을 상기시키는 항원을 사용하는 1차 면역화를 지칭한다. 본원에 사용된 바와 같이, 용어 "부스팅 조성물", "부스팅 면역화" 또는 "부스트 면역화"는 1차 면역화 후에 포유동물에게 투여되거나 포유동물에게 효과적인 추가적인 면역화를 지칭한다. 구체적으로, 본원에 사용된 면역 반응을 "부스팅하는"이라는 용어는 프라이밍 면역화에서 인코딩된 것과 동일한 항원을 전달하는 조성물의 투여를 지칭한다.
본원에 사용된 바와 같이, "대상체"는 그에 대해 본 출원의 실시양태에 따른 방법에 의해 치료받을 또는 치료받은 임의의 동물, 바람직하게는 포유동물, 가장 바람직하게는 인간을 의미한다. 본원에 사용된 용어 "포유동물"은 임의의 포유동물을 포함한다. 포유동물의 예는 포유동물의 예는 소, 말, 양, 돼지, 고양이, 개, 마우스, 래트, 토끼, 기니아피그, 비인간 영장류(NHP: non-human primate), 예컨대 원숭이 또는 유인원, 인간 등, 보다 바람직하게는 인간을 포함하지만 이에 제한되지 않는다. 인간 대상체는 환자를 포함할 수 있다.
본 출원의 독자를 돕기 위한 시도에서, 본 설명은 다양한 단락 또는 섹션으로 분리되었거나, 본 출원의 다양한 실시양태에 관한 것이다. 이러한 분리는 단락 또는 섹션 또는 실시양태의 내용을 또 다른 단락 또는 섹션 또는 실시양태의 내용으로부터 분리시키는 것으로 간주되어서는 안 된다. 반대로, 당업자는 그 설명이 광범위하게 적용되고 고려될 수 있는 다양한 섹션, 단락 및 문장의 모든 조합을 포함한다는 것을 이해할 것이다. 임의의 실시양태에 대한 논의는 단지 예시적인 것으로 의도되며, 청구범위를 포함하는 본 개시내용의 범위가 이들 예로 제한된다는 것을 제안하려는 의도는 아니다. 예를 들어, 본원에 기재된 출원의 알파바이러스 레플리콘 RNA의 실시양태는 특정 순서로 배열된 특정 프로모터 서열, 인핸서 또는 조절 서열, 신호 펩타이드, HBV 항원의 코딩 서열, 폴리아데닐화 신호 서열 등을 포함하지만 이에 제한되지 않는 특정 구성요소를 포함할 수 있지만, 당업자는 본원에 개시된 개념이 본 출원의 알파바이러스 레플리콘 RNA에 사용될 수 있는 다른 순서로 배열된 다른 구성요소에 동일하게 적용될 수 있음을 이해할 것이다. 본 출원은 특정 조합이 명백하게 기재되어 있는지 여부에 관계없이, 본 출원의 알파바이러스 레플리콘에서 사용될 수 있는 임의의 서열을 갖는 임의의 조합으로 임의의 적용 가능한 구성요소의 사용을 고려한다.
B형 간염 바이러스(HBV)
본원에 사용된 바와 같이, "B형 간염 바이러스" 또는 "HBV"는 헤파드나비리대 과의 바이러스를 지칭한다. HBV는 4개의 오픈 리딩 프레임과 7개의 단백질을 인코딩하는 작은(예를 들어, 3.2 kb) 간친화성 DNA 바이러스이다. HBV에 의해 인코딩되는 7개 단백질에는 소형(S), 중형(M) 및 대형(L) 표면 항원(HBsAg) 또는 외피(Env) 단백질, 프리코어 단백질((pre-Core protein), 코어 단백질, 바이러스 폴리머라제(Pol) 및 HBx 단백질이 포함된다. HBV는 3개의 표면 항원 또는 외피 단백질인 L, M 및 S를 발현하며, S가 가장 작고 L이 가장 크다. M 및 L 단백질의 추가 도메인은 각각 Pre-S2 및 Pre-S1로 명명된다. 코어 단백질은 바이러스 뉴클레오캡시드의 서브유닛이다. Pol은 감염된 간세포의 세포질에 국한된 뉴클레오캡시드에서 발생하는 바이러스 DNA(역전사효소, RNaseH 및 프라이머)의 합성에 필요하다. 프리코어는 소위 B형 간염 e-항원(HBeAg)과 같이, N-말단 신호 펩타이드를 가지며 감염된 세포로부터 분비되기 전에 그 N 및 C 말단에서 단백질 분해 처리된 코어 단백질이다. HBx 단백질은 공유결합 폐환형 DNA(cccDNA)의 효율적인 전사에 필요하다. HBx는 바이러스 구조 단백질이 아니다. HBV의 모든 바이러스 단백질은 mRNA를 공유하는 코어와 폴리머라제를 이외에 그 자신의 mRNA를 갖는다. 단백질 프리코어를 제외하고, HBV 바이러스 단백질 중 어느 것도 번역 후 단백질 분해 과정을 거치지 않는다.
HBV 비리온은 바이러스 외피, 뉴클레오캡시드 및 부분적 이중 가닥 DNA 게놈의 단일 카피를 포함한다. 뉴클레오캡시드는 코어 단백질의 120개 이량체로 구성되며 S, M 및 L 바이러스 외피 또는 표면 항원 단백질이 내포된 캡시드 막에 의해 싸여 있다. 세포 내로 진입한 후, 바이러스는 코팅되지 않고 공유 결합된 바이러스 폴리머라제와 함께 캡시드-함유 이완된 환형 DNA(rcDNA)는 핵으로 이동한다. 이 과정 동안, 코어 단백질의 인산화는 구조적 변화를 유도하여 캡시드와 소위 임포틴(importin)의 상호작용을 가능하게 하는 핵 국소화 신호를 노출시킨다. 이들 임포틴은 코어 단백질이, 캡시드가 분해되는 핵공 복합체(nuclear pore complex)에 결합하는 것을 매개하며, 폴리머라제/rcDNA 복합체는 핵 내로 방출된다. 핵 내에서 rcDNA는 단백질제거(폴리머라제 제거)되고 숙주 DNA 복구 기구에 의해, 이로부터 중첩 전사체가 HBeAg, HBsAg, 코어 단백질, 바이러스 폴리머라제 및 HBx 단백질을 인코딩하는 공유결합 폐환형 DNA(cccDNA) 게놈으로 전환된다. 코어 단백질, 바이러스 폴리머라제, 및 프리게놈 RNA(pgRNA: pre-genomic RNA)는 세포질에 회합하고 미성숙 pgRNA-함유 캡시드 입자 내로 자가 조립되어, 성숙한 rcDNA-캡시드로 추가로 전환되고 감염 바이러스 입자로서 둘러싸이고 분비되거나 핵으로 다시 운반되어 안정적인 cccDNA 풀을 보충하고 유지하는 공통 중간체로서 기능한다.
현재까지, HBV는 외피 단백질에 존재하는 항원성 에피토프를 기초로 4개의 혈청형(adr, adw, ayr, ayw)으로 나뉘고 바이러스 게놈의 서열을 기초로 8개의 유전자형(A, B, C, D, E, F, G 및 H)으로 나뉜다. HBV 유전자형은 서로 다른 지리적 영역에 걸쳐 분포되어 있다. 예를 들어, 아시아에서 가장 보편적인 유전자형은 유전자형 B와 C이다. 유전자형 D는 아프리카, 중동 및 인도에서 우세한 반면, 유전자형 A는 북유럽, 사하라 이남 아프리카 및 서아프리카에서 널리 퍼져 있다.
HBV 항원
본원에 사용된 바와 같이, 용어 "HBV 항원", "HBV의 항원성 폴리펩타이드", "HBV 항원성 폴리펩타이드", "HBV 항원성 단백질", "HBV 면역원성 폴리펩타이드" 및 "HBV 면역원"은 모두 대상체에서 HBV에 대한 면역 반응을 유도할 수 있는 폴리펩타이드를 지칭한다. 유도된 반응은 체액성 및/또는 세포 매개 반응일 수 있다. HBV 항원은 HBV의 폴리펩타이드, 이의 단편 또는 에피토프, 또는 다수의 HBV 폴리펩타이드의 조합, 이의 일부 또는 유도체일 수 있다. HBV 항원은 숙주에서 보호 면역 반응을 일으킬 수 있는, 예를 들어, 바이러스 질환 또는 감염에 대한 면역 반응을 유도하고/하거나 바이러스 질환 또는 감염에 대해 대상체를 보호하는 바이러스 질환 또는 감염에 대해 대상체에 면역을 생성(즉, 백신접종)할 수 있다. 예를 들어, HBV 항원은 임의의 HBV 단백질로부터의 폴리펩타이드 또는 이의 면역원성 단편(들), 예컨대 임의의 HBV 유전자형, 예를 들어, 유전자형 A, B, C, D, E, F, G 및/또는 H, 또는 이들의 조합으로부터 유래된, HBeAg, 프리코어 단백질, HBsAg(S, M 또는 L 단백질), 코어 단백질, 바이러스 폴리머라제, 또는 HBx 단백질을 포함할 수 있다.
(1) HBV 코어 항원
본원에 사용된 바와 같이, 용어 "HBV 코어 항원", "HBcAg" 및 "코어 항원"은 대상체에서 HBV 코어 단백질에 대한 면역 반응을 유도할 수 있는 HBV 항원을 지칭한다. 유도된 면역 반응은 체액성 및/또는 세포 매개 반응일 수 있다. 용어 "코어", "코어 폴리펩타이드" 및 "코어 단백질" 각각은 HBV 바이러스 코어 단백질을 지칭한다. 전장 코어 항원은 전형적으로 183개 아미노산 길이이고, 조립 도메인(아미노산 1 내지 149) 및 핵산 결합 도메인(아미노산 150 내지 183)을 포함한다. 34-잔기 핵산 결합 도메인은 프리게놈 RNA 캡슐화에 필요하다. 이 도메인은 핵 유입 신호로도 기능한다. 그것은 17개의 아르기닌 잔기로 구성되며 매우 염기성이며 그 기능에 일관된다. HBV 코어 단백질은 용액에서 이량체성이며, 이량체는 20면체 캡시드로 자가 조립된다. 코어 단백질의 각각의 이량체에는 양쪽에 α-나선 도메인이 측면에 있는 4개의 α-나선 번들을 가지고 있다. 핵산 결합 도메인이 결여된 절두된 HBV 코어 단백질은 또한 캡시드를 형성할 수 있다.
본 출원의 실시양태에서, HBV 항원은 절두된 HBV 코어 항원이다. 본원에 사용된 바와 같이, "절두된 HBV 코어 항원"은 전체 길이의 HBV 코어 단백질을 함유하지는 않지만 대상체에서 HBV 코어 단백질에 대한 면역 반응을 유도할 수 있는 HBV 항원을 지칭한다. 예를 들어, HBV 코어 항원은 전형적으로 17개의 아르기닌(R) 잔기를 함유하는, 코어 항원의 고도로 양으로 하전된(아르기닌 풍부) C-말단 핵산 결합 도메인 중 하나 이상의 아미노산을 결실하도록 변형될 수 있다. 본 출원의 절두된 HBV 코어 항원은 바람직하게는 HBV 코어 핵 유입 신호를 포함하지 않는 C-말단 절두된 HBV 코어 단백질 및/또는 C-말단 HBV 코어 핵 유입 신호가 결실된 절두된 HBV 코어 단백질이다. 일 실시양태에서, 절두된 HBV 코어 항원은 C-말단 핵산 결합 도메인에 결실, 예컨대 C-말단 핵산 결합 도메인의 결실된 1 내지 34개의 아미노산 잔기, 예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 또는 34개의 아미노산 잔기의 결실, 바람직하게는 C-말단 핵산 결합 도메인의 31-34개의 C-말단 아미노산 잔기의 결실을 포함한다. 바람직한 실시양태에서, 절두된 HBV 코어 항원은 C-말단 핵산 결합 도메인에 결실, 바람직하게는 C-말단 핵산 결합 도메인의 31개의 C-말단 아미노산 잔기의 결실을 포함한다.
일부 실시양태에서, HBV 코어 항원 아미노산 서열은 분비를 위해 신호 펩타이드에 작동적으로 연결된다. 임의의 적합한 신호 펩타이드가 사용될 수 있다. 일 실시양태에서, HBV 코어 항원은 이의 N-말단에서 시스타틴 S 전구체 신호 펩타이드에 작동적으로 연결되어, 분비를 증진시킨다. 특정 실시양태에서, 시스타틴 S 전구체 신호 펩타이드는 서열번호 77의 아미노산 서열을 갖는다. 또 다른 특정 실시양태에서, HBV 코어 항원의 코딩 서열은 서열번호 90의 폴리뉴클레오티드 서열을 갖는 시스타틴 S 전구체 신호 펩타이드의 코딩 서열에 작동적으로 연결된다.
본 출원의 HBV 코어 항원은 다수의 HBV 유전자형(예를 들어, 유전자형 A, B, C, D, E, F, G, 및 H)으로부터 유래된 컨센서스 서열일 수 있다. 본원에 사용된 바와 같이, "컨센서스 서열"은 동종성 단백질의 아미노산 서열의 정렬에 의해 결정된 바와 같은 동종성 단백질의 아미노산 서열의 정렬에 기초한 아미노산의 인공 서열을 의미한다. 상기 정렬은 Clustal Omega를 사용하는 것과 같이 당업계에 알려진 방법 또는 알고리즘을 사용하여 수행될 수 있다. 이는 적어도 100개의 천연 HBV 단리물로부터의 HBV 항원(예를 들어, 코어, pol 등)의 서열을 기초로 서열 정렬의 각 위치에서 발견되는 가장 빈번한 아미노산 잔기의 계산된 순서일 수 있다. 컨센서스 서열은 비천연 발생일 수 있고 천연 바이러스 서열과 상이할 수 있다. 컨센서스 서열은 다중 서열 정렬 툴을 사용한 상이한 공급원으로부터의 다중 HBV 항원 서열을 정렬하고 다양한 정렬 위치에서 가장 빈번한 아미노산을 선택하여 설계될 수 있다. 바람직하게는, HBV 항원의 컨센서스 서열은 HBV 유전자형 A, B, C, 및 D로부터 유래된다. 용어 "컨센서스 항원"은 컨센서스 서열을 갖는 항원을 지칭하기 위해 사용된다.
본 출원에 따른 예시적인 절두된 HBV 코어 항원은 핵산 결합 기능이 결여되어 있고, 적어도 2개의 HBV 유전자형에 대해 포유동물에서 면역 반응을 유도할 수 있다. 바람직하게는, 절두된 HBV 코어 항원은 적어도 HBV 유전자형 A, B, C 및 D에 대해 포유동물에서 T 세포 반응을 유도할 수 있다. 보다 바람직하게는, 절두된 HBV 코어 항원은 적어도 HBV 유전자형 A, B, C 및 D에 대해 인간 대상체에서 CD8 T 세포 반응을 유도할 수 있다.
일부 실시양태에서, 본 출원의 HBV 코어 항원은 MHC 부류 I HLA 대립유전자에 대한 하나 이상의 T 세포 에피토프를 포함한다. 일부 실시양태에서, HBV 코어 항원은 HLA-A*11:01 에피토프, HLA-A*02:01 에피토프, HLA-A*A0101 에피토프, 및 HLA-B*40:01 에피토프로 이루어진 군으로부터 선택된 하나 이상의 에피토프를 포함한다. 바람직하게는, HBV 코어 항원은 HLA-A*11:01 에피토프, HLA-A*02:01 에피토프, HLA-A*A0101 에피토프, 및 HLA-B*40:01 에피토프로 이루어진 군으로부터 선택된 2개 이상, 예컨대 2, 3 또는 4개의 T 세포 에피토프를 포함한다. 보다 바람직하게는, HBV 코어 항원은 HLA-A*11:01, HLA-A*02:01, HLA-A*A0101, 및 HLA-B*40:01 T 세포 에피토프를 포함한다. 보다 바람직하게는, HBV 코어 항원은 하나 이상의 HLA-A*11:01 에피토프(들)를 포함한다.
일부 실시양태에서, 본 출원의 HBV 핵심 항원은 컨센서스 항원, 바람직하게는 HBV 유전자형 A, B, C, 및 D 중 적어도 2개, 바람직하게는 모두, 보다 바람직하게는 HBV 유전자형 A, B, C, 및 D로부터 유래된 절두된 컨센서스 항원이다. 본 출원에 따른 예시적인 절두된 HBV 코어 컨센서스 항원은 서열번호 86과 적어도 90% 동일한, 예컨대 서열번호 86과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9%, 또는 100% 동일한 아미노산 서열로 이루어진다. 일부 실시양태에서, HBV 코어 항원은 서열번호 84, 서열번호 85 또는 서열번호 86과 적어도 98% 동일한, 예컨대 서열번호 84, 서열번호 85 또는 서열번호 86과 적어도 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9%, 또는 100% 동일한 아미노산 서열을 포함하고, 바람직하게는 이로 이루어진다. 서열번호 86은 HBV 유전자형 A, B, C, 및 D로부터 유래된 코어 컨센서스 항원이다. 서열번호 7은 천연 코어 항원의 고도로 양으로 하전된(아르기닌 풍부) 핵산 결합 도메인의 34-아미노산 C-말단 결실을 포함한다. 일부 바람직한 실시양태에서, 본 출원의 HBV 코어 항원은 C-말단 아르기닌 잔기 중 하나 이상을 보유하고, 서열번호 84, 서열번호 85 또는 서열번호 86의 아미노산 서열을 가짐으로써 HBV 코어 항원에서 HLA-A*11:01 에피토프를 복원한다. 일부 실시양태에서, HBV 코어 항원의 마지막 5개의 C-말단 아미노산은 VVR 아미노산 서열, 보다 특히 VVRR (서열번호 91) 아미노산 서열, 보다 특히 VVRRR(서열번호 92) 아미노산 서열을 포함한다.
본 출원의 특정 실시양태에서, HBV 코어 항원은 서열번호 7, 서열번호 84, 서열번호 85 또는 서열번호 86의 아미노산 서열로 이루어진 절두된 HBV 항원이다. 또 다른 특정 실시양태에서, HBV 코어 항원은 각각 서열번호 8, 서열번호 87, 서열번호 88 또는 서열번호 89의 폴리뉴클레오티드 서열에 의해 인코딩된다. 바람직하게는, HBV 코어 항원은 서열번호 86의 아미노산 서열로 이루어지고, 서열번호 89의 폴리뉴클레오티드 서열에 의해 인코딩된다. 일부 실시양태에서, HBV 코어 항원은 아미노산 서열로 이루어지거나, 그 내용은 그 전체가 본원에 참조로 포함된 미국 특허 출원 공개 번호 US2019/0185828에 기재된 바와 같이 폴리뉴클레오티드 서열에 의해 인코딩된다.
(2) HBV 폴리머라제 항원
본원에 사용된 용어 "HBV 폴리머라제 항원", "HBV Pol 항원" 또는 "HBV pol 항원"은 대상체에서 HBV 폴리머라제에 대한 면역 반응을 유도할 수 있는 HBV 항원을 지칭한다. 면역 반응은 체액성 및/또는 세포 매개 반응일 수 있다. 용어 "폴리머라제", "폴리머라제 폴리펩타이드", "Pol" 및 "pol" 각각은 HBV 바이러스 DNA 폴리머라제를 지칭한다. HBV 바이러스 DNA 폴리머라제는 N 말단에서 C 말단으로 마이너스-가닥 DNA 합성을 위한 프라이머 역할을 하는 말단 단백질(TP) 도메인을 포함하는 4개의 도메인을 갖는다: 폴리머라제 기능에 필수적이지 않은 스페이서; 전사를 위한 역전사효소(RT) 도메인; 및 RNase H 도메인.
본 출원의 실시양태에서, HBV 항원은 HBV Pol 항원, 또는 이의 임의의 면역원성 단편 또는 조합을 포함한다. HBV Pol 항원은 예컨대 폴리머라제 및/또는 RNase 도메인의 활성 부위에 돌연변이를 도입하여 특정 효소 활성을 감소 또는 실질적으로 제거함으로써 항원의 면역원성을 향상시키기 위한 추가 변형을 포함할 수 있다.
바람직하게는, 본 발명의 HBV Pol 항원은 역전사효소 활성 및 RNase H 활성을 갖지 않으며, 적어도 2개의 HBV 유전자형에 대해 포유동물에서 면역 반응을 유도할 수 있다. 바람직하게는, HBV Pol 항원은 HBV 유전자형 A, B, C 및 D 중 적어도 2개, 바람직하게는 모두에 대해 포유동물에서 T 세포 반응을 유도할 수 있다. 보다 바람직하게는, HBV Pol 항원은 적어도 HBV 유전자형 A, B, C 및 D에 대해 인간 대상체에서 CD8 T 세포 반응을 유도할 수 있다.
따라서, 일부 실시양태에서, HBV Pol 항원은 불활성화 Pol 항원이다. 한 실시양태에서, 불활성화 HBV Pol 항원은 폴리머라제 도메인의 활성 부위에 하나 이상의 아미노산 돌연변이를 포함한다. 또 다른 실시양태에서, 불활성화 HBV Pol 항원은 RNaseH 도메인의 활성 부위에 하나 이상의 아미노산 돌연변이를 포함한다. 바람직한 실시양태에서, 불활성화 HBV pol 항원은 폴리머라제 도메인 및 RNaseH 도메인 둘 모두의 활성 부위에 하나 이상의 아미노산 돌연변이를 포함한다. 예를 들어, 뉴클레오티드/금속 이온 결합에 필요할 수 있는 HBV pol 항원의 폴리머라제 도메인의 "YXDD" 모티프(서열번호 74)는, 예를 들어, 하나 이상의 아스파르테이트 잔기(D)를 아스파라긴 잔기(N)로 대체하여 금속 배위 기능을 제거하거나 감소시킴으로써 돌연변이될 수 있으며, 이에 의해 역전사효소 기능을 감소시키거나 실질적으로 제거한다. 대안적으로, 또는 "YXDD" 모티프(서열번호 74)의 돌연변이 이외에, Mg2+ 배위에 필요한 HBV pol 항원의 RNaseH 도메인의 "DEDD" 모티프(서열번호 75)는, 예를 들어, 하나 이상의 아스파르테이트 잔기(D)를 아스파라긴 잔기(N)로 대체하고/하거나 글루타메이트 잔기(E)를 글루타민(Q)으로 대체하여 돌연변이될 수 있으며, 이에 의해 RNaseH 기능을 감소시키거나 실질적으로 제거할 수 있다. 특정 실시양태에서, HBV pol 항원은 (1) 폴리머라제 도메인의 "YXDD" 모티프(서열번호 74)에서 아스파르테이트 잔기(D)를 아스파라긴 잔기(N)로 돌연변이시키고; (2) RNaseH 도메인의 "DEDD" 모티프(서열번호 75)에서 제1 아스파르테이트 잔기(D)를 아스파라긴 잔기(N)로 돌연변이시키고, 제1 글루타메이트 잔기(E)를 글루타민 잔기(N)로 돌연변이시켜 변형되어, pol 항원의 역전사효소 및 RNaseH 기능 둘 모두를 감소시키거나 실질적으로 제거한다.
일부 실시양태에서, HBV pol 항원 아미노산 서열은 분비를 위한 신호 펩타이드에 작동적으로 연결된다. 임의의 적합한 신호 펩타이드가 사용될 수 있다. 일 실시양태에서, HBV pol 항원은 이의 N-말단에서 시스타틴 S 전구체 신호 펩타이드에 작동적으로 연결되어, 분비를 증진시킨다. 특정 실시양태에서, 시스타틴 S 전구체 신호 펩타이드는 서열번호 77의 아미노산 서열을 갖는다. 또 다른 특정 실시양태에서, HBV pol 항원의 코딩 서열은 서열 90의 폴리뉴클레오티드 서열을 갖는 시스타틴 S 전구체 신호 펩타이드의 코딩 서열에 작동적으로 연결된다.
일부 실시양태에서, 본 출원의 HBV pol 항원은 MHC 부류 I HLA 대립유전자에 대한 하나 이상의 T 세포 에피토프를 포함한다. 일부 실시양태에서, HBV pol 항원은 HLA-A*11:01 에피토프, HLA-A*24:02 에피토프, HLA-A*02:01 에피토프, 및 HLA-A*A0101 에피토프로 이루어진 군으로부터 선택된 하나 이상의 에피토프를 포함한다. 바람직하게는, HBV pol 항원은 HLA-A*11:01 에피토프, HLA-A*24:02 에피토프, HLA-A*02:01 에피토프, 및 HLA-A*A0101로 이루어진 군으로부터 선택된 2개 이상, 예컨대 2, 3 또는 4개의 T 세포 에피토프를 포함한다. 보다 바람직하게는, HBV pol 항원은 HLA-A*11:01, HLA-A*24:02, HLA-A*02:01, 및 HLA-A*A0101 T 세포 에피토프를 포함한다. 보다 바람직하게는, HBV pol 항원은 하나 이상의 HLA-A*11:01 에피토프(들)를 포함한다.
본 출원의 바람직한 실시양태에서, HBV pol 항원은 컨센서스 항원, 바람직하게는 HBV 유전자형 A, B, C, 및 D 중 적어도 2개, 바람직하게는 모두로부터 유래된 컨센서스 항원, 보다 바람직하게는 HBV 유전자형 A, B, C, 및 D로부터 유래된 불활성화 컨센서스 항원이다. 본 출원에 따른 예시적인 HBV pol 컨센서스 항원은 서열번호 9와 적어도 90% 동일한, 예컨대 서열번호 9와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한, 바람직하게는 서열번호 9와 적어도 98% 동일한, 예컨대 서열번호 9와 적어도 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함한다. 서열번호 9는 폴리머라제 및 RNaseH 도메인의 활성 부위에 위치한 4개의 돌연변이를 포함하는 HBV 유전자형 A, B, C 및 D로부터 유래된 pol 컨센서스 항원이다. 특히, 상기 4개의 돌연변이는 폴리머라제 도메인의 "YXDD" 모티프(서열번호 74)에서 아스파르트산 잔기(D)의 아스파라긴 잔기(N)로의 돌연변이; 및 RNaseH 도메인의 "DEDD"(서열번호 75) 모티프에서 제1 아스파르테이트 잔기(D)의 아스파라긴 잔기(N)로의 돌연변이 및 글루타메이트 잔기(E)의 글루타민 잔기(Q)로의 돌연변이를 포함한다.
본 출원의 특정 실시양태에서, HBV pol 항원은 서열번호 9의 아미노산 서열을 포함한다. 바람직하게는, HBV pol 항원은 서열번호 9의 아미노산 서열로 이루어진다. 또 다른 특정 실시양태에서, HBV pol 항원은 서열번호 10의 폴리뉴클레오티드 서열에 의해 인코딩된다. 일부 실시양태에서, HBV pol 항원은 아미노산 서열을 포함하거나 이로 이루어지거나, 그 내용은 그 전문이 본원에 참조로 포함된 미국 특허 출원 공개 번호 US2019/0185828에 기재된 바와 같은 폴리뉴클레오티드 서열에 의해 인코딩된다.
(3) HBV 표면 항원
본원에 사용된 바와 같이, 용어 "HBV 표면 항원", "표면 항원", "HBV 외피 항원", "외피 항원" 및 "env 항원" 각각은 대상체에서 하나 이상의 HBV 표면 항원 또는 외피 단백질에 대한 면역 반응을 유도(inducing)하거나 유도(eliciting)할 수 있는 HBV 항원을 지칭한다. 면역 반응은 체액성 및/또는 세포 매개 반응일 수 있다. 용어 "HBV 표면 단백질", "표면 단백질", "HBV 외피 단백질" 및 "외피 단백질"은 각각 HBV 바이러스 표면 또는 외피 단백질을 지칭한다. HBV는 3개의 표면 항원 또는 외피 단백질을 발현한다. 유전자 S는 표면 항원을 인코딩하는 HBV 게놈의 유전자이다. 표면 항원 유전자는 하나의 긴 오픈 리딩 프레임이지만 유전자를 pre-S1, pre-S2 및 S의 세 절편으로 나누는 프레임 내 "개시"(ATG) 코돈 3개를 포함한다. 다중 개시 코돈 때문에, 대형(L) 또는 L-표면 항원, 중형(M) 또는 M-표면 항원, 소형(S) 또는 S-표면 항원으로 불리는 3개의 상이한 크기의 폴리펩타이드가 생성되며, HBV L, M 및 S 외피 단백질이라고도 한다. 2개의 상이한 프로모터(PreS1 및 PreS2)는 L, M 및 S-표면 항원 코딩 서열의 전사를 유도하여 3개의 상이한 번역된 단백질인 L, M 및 S 외피 단백질을 생성한다. PreS2 프로모터는 M-표면 항원과 S-표면 항원 전사를 별도로 유도하기 때문에 PreS2/S 프로모터라고도 한다. L-표면 항원의 아미노산 서열은 M 및 S-표면 항원 서열과 함께 프레임 내에 있다. 따라서, L-표면 항원은 M- 및 S-표면 항원 도메인을 포함하고, M-표면 항원은 S-표면 항원 도메인을 포함한다. L-, M- 및 S- 표면 항원은 공동 C-말단이며 전체 S 도메인을 공유한다. S에 비해, M은 이의 N 말단에 추가 도메인인 pre-S2를 가지며, M에 비해, L은 pre-S1 도메인을 갖는다.
일부 실시양태에서, HBV 항원은 HBV PreS1 항원이며, 이는 pre-S1 유전자 절편에 의해 인코딩되고 L 항원의 Pre-S1 도메인만을 포함한다. PreS1 항원은 99 내지 109개의 아미노산을 갖는 것과 같이 다양한 길이를 가질 수 있다. 본 출원의 HBV PreS1 항원은 임의의 천연 발생 PreS1 도메인의 서열, 및 이의 변이체 또는 유도체를 포함할 수 있다.
다른 실시양태에서, HBV 항원은 HBV PreS2.S 항원이며, 이는 Pre-S2 및 S 유전자 절편에 의해 인코딩되고, PreS2 도메인 및 S 도메인을 포함한다. PreS2 도메인은 약 55개의 아미노산 길이일 수 있으며 S-도메인은 약 226개의 아미노산을 포함할 수 있다. 본 출원의 HBV PreS2.S 항원은 임의의 천연 발생 PreS2 및 S 도메인의 서열, 및 이의 변이체 또는 유도체를 포함할 수 있다. 일부 실시양태에서, PreS2.S의 내부 신호 펩타이드는 HBV M 및 HBV S 항원의 PreS2.S 단백질 산물의 분비를 촉진하기 위해 온전하게 남겨진다. 일 실시양태에서, HBV PreS2.S 항원은 HBV M 표면 항원이다. 또 다른 실시양태에서, HBV PreS2.S 항원은 HBV S 표면 항원이다. 또 다른 실시양태에서, HBV PreS2.S 항원은 HBV M 표면 항원 및 HBV S 표면 항원을 포함한다.
일부 실시양태에서, HBV 표면 항원 아미노산 서열은 분비를 위한 신호 펩타이드에 작동적으로 연결되거나 이를 포함한다. 임의의 적합한 신호 펩타이드가 사용될 수 있다. 일 실시양태에서, HBV Pre-S1 항원 아미노산 서열은 이의 N-말단에서 시스타틴 S 전구체 신호 펩타이드에 작동적으로 연결되어 분비를 증진시킨다. 특정 실시양태에서, 시스타틴 S 전구체 신호 펩타이드는 서열번호 77의 아미노산 서열을 갖는다. 또 다른 특정 실시양태에서, HBV Pre-S1 항원의 코딩 서열은 서열번호 90의 폴리뉴클레오티드 서열을 갖는 시스타틴 S 전구체 신호 펩타이드의 코딩 서열에 작동적으로 연결된다.
본 출원의 실시양태에서, HBV 항원은 HBV 표면 항원, 또는 이의 임의의 면역원성 단편 또는 조합을 포함한다. HBV 표면 항원은 L-표면 항원, M-표면 항원 및 S-표면 항원 단백질 중 적어도 하나에 대해 대상체에서 면역 반응을 유도할 수 있다. 바람직하게는, HBV 표면 항원, 예컨대 Pre-S1 또는 PreS2.S 항원은 컨센서스 항원, 바람직하게는 적어도 2개의 HBV 유전자형 A, B, C, 및 D로부터 유래된 컨센서스 항원이고, 보다 바람직하게는 HBV 유전자형 A, B, C, 및 D로부터 유래된 컨센서스 항원이다.
일부 실시양태에서, 본 출원의 HBV 표면 항원은 MHC 부류 I HLA 대립유전자에 대한 하나 이상의 T 세포 에피토프를 포함한다. 일부 실시양태에서, HBV 표면 항원은 HLA-A*11:01 에피토프, HLA-A*24:02 에피토프, 및 HLA-A*A2402 에피토프로 이루어진 군으로부터 선택된 하나 이상의 T 세포 에피토프를 포함한다. 바람직하게는, HBV Pre-S1 항원은 HLA-A*11:01 에피토프 및 HLA-A*24:02 에피토프로 이루어진 군으로부터 선택된 하나 이상의 T 세포 에피토프를 포함한다. 보다 바람직하게는, HBV Pre-S1 항원은 HLA-A*11:01 및 HLA-A*24:02 T 세포 에피토프를 포함한다. 보다 바람직하게는, HBV Pre-S1 항원은 하나 이상의 HLA-A*11:01 에피토프(들)를 포함한다. 바람직하게는, HBV PreS2.S 항원은 HLA-A*11:01 에피토프, HLA-A*24:02 에피토프, 및 HLA-A*A2402 에피토프로 이루어진 군으로부터 선택된 하나 이상의 T 세포 에피토프를 포함한다. 보다 바람직하게는, HBV PreS2.S 항원은 HLA-A*11:01, HLA-A*24:02, 및 HLA-A*A2402 T 세포 에피토프를 포함한다. 보다 바람직하게는, HBV PreS2.S 항원은 하나 이상의 HLA-A*11:01 에피토프(들)를 포함한다.
본 출원의 일부 실시양태에서, HBV 표면 항원은 Pre-S1 항원이다. 본 출원에 따른 예시적인 Pre-S1 항원은 서열번호 1 또는 서열번호 3과 적어도 90% 동일한, 예컨대 서열번호 1 또는 서열번호 3과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9%, 또는 100% 동일한 아미노산 서열을 포함한다. 본 출원의 일부 실시양태에서, HBV 표면 항원은 Pre-S2.S 항원이다. 본 출원에 따른 예시적인 Pre-S2.S 항원은 서열번호 5와 적어도 90% 동일한, 예컨대 서열번호 5와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9%, 또는 100% 동일한 아미노산 서열을 포함한다.
본 출원의 특정 실시양태에서, HBV 표면 항원은 서열번호 1 또는 서열번호 3의 아미노산 서열로 이루어진 Pre-S1 항원이다. 또 다른 특정 실시양태에서, HBV 표면 항원은 서열번호 2 또는 서열번호 4의 폴리뉴클레오티드 서열에 의해 인코딩된다. 또 다른 특정 실시양태에서, HBV 표면 항원은 서열번호 5의 아미노산 서열로 이루어진 Pre-S2.S 항원이다. 또 다른 특정 실시양태에서, HBV 표면 항원은 서열번호 6의 폴리뉴클레오티드 서열에 의해 인코딩된다.
본 출원의 일부 실시양태에서, HBV 표면 항원은 S-표면 항원이다. 본 출원에 따른 예시적인 S-표면 항원은 서열번호 79의 아미노산 서열과 적어도 98% 동일한, 예컨대 서열번호 79의 아미노산 서열과 적어도 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열로 이루어진다. 서열번호 81은 HBV 유전자형 A, B, C 및 D로부터 유래된 HBV 컨센서스 S-표면 항원이다. 본 출원의 특정 실시양태에서, S-표면 항원은 서열번호 79의 아미노산 서열로 이루어진다. 또 다른 특정 실시양태에서, HBV 표면 항원은 서열번호 78의 폴리뉴클레오티드 서열에 의해 인코딩된다.
일부 실시양태에서, HBV 표면 항원은 M-표면 항원, 또는 이의 임의의 면역원성 단편 또는 조합이다. 바람직하게는, M-표면 항원은 컨센서스 항원, 바람직하게는 HBV 유전자형 A, B, C, 및 D 중 적어도 2개, 바람직하게는 모두로부터 유래된 컨센서스 항원이고, 보다 바람직하게는 HBV 유전자형 A, B, C, 및 D로부터 유래된 컨센서스 항원이다. 바람직하게는, M-표면 항원은 대상체에서 M-표면 항원에 대한 면역 반응을 유도(inducing)하거나 유도(eliciting)할 수 있다.
본 출원에 따른 예시적인 M-표면 항원은 서열번호 82의 아미노산 서열과 적어도 98% 동일한, 예컨대 서열번호 82의 아미노산 서열과 적어도 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하거나 이로 이루어진다. 서열번호 82는 HBV 유전자형 A, B, C 및 D로부터 유래된 HBV 컨센서스 M-표면 항원이다. 본 출원의 특정 실시양태에서, M-표면 항원은 서열번호 82의 아미노산 서열로 이루어진다.
일부 실시양태에서, HBV 표면 항원은 L-표면 항원, 또는 이의 임의의 면역원성 단편 또는 조합이다. 바람직하게는, L-표면 항원은 컨센서스 항원, 바람직하게는 HBV 유전자형 A, B, C, 및 D 중 적어도 2개, 바람직하게는 모두로부터 유래된 컨센서스 항원이고, 보다 바람직하게는 HBV 유전자형 A, B, C, 및 D로부터 유래된 컨센서스 항원이다. 바람직하게는, L-표면 항원은 대상체에서 L-표면 항원에 대한 면역 반응을 유도(inducing)하거나 유도( eliciting)할 수 있다.
본 출원에 따른 예시적인 L-표면 항원은 서열번호 83의 아미노산 서열과 적어도 98% 동일한, 예컨대 서열번호 83의 아미노산 서열과 적어도 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하거나 이로 이루어진다. 서열번호 83은 HBV 유전자형 A, B, C 및 D로부터 유래된 HBV 컨센서스 L-표면 항원이다. 본 출원의 특정 실시양태에서, M-표면 항원은 서열번호 83의 아미노산 서열로 이루어진다.
일부 실시양태에서, HBV 표면 항원은 L-, M-, 및 S 표면 항원 중 어느 하나의 일부, 또는 이의 임의의 조합을 포함한다. 예를 들어, HBV 표면 항원은 N-말단 L-표면 항원 도메인을 포함하거나 이로 이루어질 수 있다. HBV 표면 항원은 또한 M-표면 항원 도메인을 포함하거나 이로 이루어질 수 있다. HBV 표면 항원은 또한 N-말단 L-표면 항원 도메인 및 M-표면 항원 도메인을 포함하거나 이로 이루어질 수 있다. HBV 표면 항원은 또한 N-말단 L-표면 항원 도메인, M-표면 항원 도메인 및 S-표면 항원 도메인의 일부를 포함하거나 이로 이루어질 수 있다.
본 출원에 따른 그러한 표면 항원의 예시적인 예는 서열번호 81의 아미노산 서열과 98% 이상 동일한, 예컨대 서열번호 81의 아미노산 서열과 적어도 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한, 바람직하게는 서열번호 81과 적어도 98% 동일한, 예컨대 서열번호 81과 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열로 이루어진다. 서열번호 81은 HBV 유전자형 A, B, C 및 D로부터 유래된 컨센서스 항원으로서, N-말단 L-표면 항원 도메인, 전체 M-표면 항원 도메인, 및 S-표면 항원 도메인으로부터의 15-아미노산 C-말단 테일을 포함한다. 본 출원의 특정 실시양태에서, HBV 표면 항원은 서열번호 81의 아미노산 서열로 이루어진다. 또 다른 특정 실시양태에서, HBV 표면 항원은 HBV 표면 항원을 인코딩하는 서열번호 80의 폴리뉴클레오티드 서열에 의해 인코딩된다. 일부 실시양태에서, HBV 표면 항원은 아미노산 서열로 이루어지거나, 그 내용은 그 전체가 본원에 참조로 포함된 유럽 특허 출원 번호 19180926호에 기재된 폴리뉴클레오티드 서열에 의해 인코딩된다.
폴리뉴클레오티드 및 벡터
또 다른 일반적인 측면에서, 본 출원은, 본 출원에 따른 HBV 항원을 인코딩하는 비-천연 폴리뉴클레오티드 서열을 포함하는 핵산 분자 또는 핵산 조합, 및 비-천연 발생 핵산을 포함하는 벡터를 제공한다. 핵산 분자는 본 출원의 HBV 항원을 인코딩하는 임의의 비-천연 발생 폴리뉴클레오티드 서열을 포함할 수 있으며, 이는 본 개시내용의 관점에서 당업계에 알려진 방법을 사용하여 제조될 수 있다. 바람직하게는, 비-천연 발생 폴리뉴클레오티드는 절두된 HBV 코어 항원, HBV 폴리머라제 항원, HBV Pre-S1 항원, 및 HBV Pre-S2.S 항원 중 적어도 하나를 인코딩한다. 폴리뉴클레오티드는 RNA 형태이거나 재조합 기술(예를 들어, 클로닝)에 의해 수득되거나 합성(예를 들어, 화학적 합성)으로 생성된 DNA 형태일 수 있다. DNA는 단일-가닥 또는 이중-가닥일 수 있거나, 이중-가닥 및 단일-가닥 서열 둘 모두의 부분을 함유할 수 있다. DNA는, 예를 들어, 게놈 DNA, cDNA, 또는 이들의 조합을 포함할 수 있다. 폴리뉴클레오티드는 또한 DNA/RNA 하이브리드일 수 있다. 본 출원의 폴리뉴클레오티드 및 벡터는 재조합 단백질 생성, 숙주 세포에서의 단백질의 발현, 또는 바이러스 입자의 생성에 사용될 수 있다. 바람직하게는, 폴리뉴클레오티드는 RNA이다.
본 출원의 일 실시양태에서, 핵산 분자 또는 조합은 서열번호 7, 서열번호 84, 서열번호 85 또는 서열번호 86과 적어도 90% 동일한, 예컨대 서열번호 7, 서열번호 84, 서열번호 85 또는 서열번호 86과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한, 바람직하게는 서열번호 7, 서열번호 84, 서열번호 85 또는 서열번호 86과 98%, 99% 또는 100% 동일한 아미노산 서열로 이루어진 절두된 HBV 코어 항원을 인코딩하는 비-천연 발생 폴리뉴클레오티드 서열을 포함한다. 본 출원의 특정 실시양태에서, 비-천연 발생 핵산 분자는 서열번호 7, 서열번호 84, 서열번호 85 또는 서열번호 86의 아미노산 서열로 이루어진 절두된 HBV 코어 항원을 인코딩한다. 바람직하게는, 절두된 HBV 코어 항원은 서열번호 86으로 이루어진다.
서열번호 7, 서열번호 84, 서열번호 85 또는 서열번호 86의 아미노산 서열로 이루어진 절두된 HBV 코어 항원을 인코딩하는 본 출원의 폴리뉴클레오티드 서열의 예는 서열번호 8, 서열번호 87, 서열번호 88 또는 서열번호 89와 각각 적어도 90% 동일한, 예컨대 서열번호 8, 서열번호 87, 서열번호 88 또는 서열번호 89와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한, 바람직하게는 서열번호 8, 서열번호 87, 서열번호 88 또는 서열번호 89와 98%, 99% 또는 100% 동일한 폴리뉴클레오티드 서열을 포함하지만 이에 제한되지 않는다. 절두된 HBV 코어 항원을 인코딩하는 예시적인 비-천연 발생 핵산 분자는 서열번호 8, 서열번호 87, 서열번호 88 또는 서열번호 89의 폴리뉴클레오티드 서열을 갖는다. 바람직하게는, 절두된 HBV 코어 항원을 인코딩하는 분자는 서열번호 89의 폴리뉴클레오티드 서열을 갖는다.
본 출원의 일 실시양태에서, 핵산 분자 또는 조합은 서열번호 9와 적어도 90% 동일한, 예컨대 서열번호 9와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하는 HBV 폴리머라제 항원을 인코딩하는 비-천연 발생 폴리뉴클레오티드 서열을 포함한다. 본 출원의 특정 실시양태에서, 비-천연 발생 핵산 분자는 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩한다.
서열번호 9의 아미노산 서열을 포함하는 HBV Pol 항원을 인코딩하는 본 출원의 폴리뉴클레오티드 서열의 예는 서열번호 10과 적어도 90% 동일한, 예컨대 서열번호 10과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한, 바람직하게는 서열번호 10과 98%, 99% 또는 100% 동일한 폴리뉴클레오티드 서열을 포함하지만 이에 제한되지 않는다. HBV pol 항원을 인코딩하는 예시적인 비-천연 발생 핵산 분자는 서열번호 10의 폴리뉴클레오티드 서열을 갖는다.
본 출원의 일 실시양태에서, 핵산 분자 또는 조합은 서열번호 1 또는 서열번호 3과 적어도 90% 동일한, 예컨대 서열번호 1 또는 서열번호 3과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한, 바람직하게는 서열번호 1 또는 서열번호 3과 98%, 99% 또는 100% 동일한 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 비-천연 발생 폴리뉴클레오티드 서열을 포함한다. 본 출원의 특정 실시양태에서, 비-천연 발생 핵산 분자는 서열번호 1 또는 서열번호 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩한다.
서열번호 1 또는 서열번호 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 본 출원의 폴리뉴클레오티드 서열의 예는 서열번호 2 또는 서열번호 4와 각각 적어도 90% 동일한, 예컨대 서열번호 2 또는 서열번호 4와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한, 바람직하게는 서열번호 2 또는 서열번호 4와 98%, 99% 또는 100% 동일한 폴리뉴클레오티드 서열을 포함하지만 이에 제한되지 않는다. HBV Pre-S1 항원을 인코딩하는 예시적인 비-천연 발생 핵산 분자는 서열번호 2 또는 4의 폴리뉴클레오티드 서열을 갖는다.
본 출원의 일 실시양태에서, 핵산 분자 또는 조합은 서열번호 5와 적어도 90% 동일한, 예컨대 서열번호 5와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한, 바람직하게는 서열번호 5와 98%, 99% 또는 100% 동일한 아미노산 서열로 이루어진 HBV Pre-S2.S 항원을 인코딩하는 비-천연 발생 폴리뉴클레오티드 서열을 포함한다. 본 출원의 특정 실시양태에서, 비-천연 발생 핵산 분자는 서열번호 5의 아미노산 서열로 이루어진 HBV Pre-S2.S 항원을 인코딩한다.
서열번호 5의 아미노산 서열로 이루어진 HBV Pre-S2.S 항원을 인코딩하는 본 출원의 폴리뉴클레오티드 서열의 예는 서열번호 6과 각각 적어도 90% 동일한, 예컨대 서열번호 6과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한, 바람직하게는 서열번호 6과 98%, 99% 또는 100% 동일한 폴리뉴클레오티드 서열을 포함하지만 이에 제한되지 않는다. HBV Pre-S2.S 항원을 인코딩하는 예시적인 비-천연 발생 핵산 분자는 서열번호 6의 폴리뉴클레오티드 서열을 갖는다.
본 출원의 일 실시양태에서, 핵산 분자 또는 조합은 5' 말단에서 3' 말단으로: 제1 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열, 제1 내부 리보솜 진입 서열(IRES) 요소 또는 제1 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열, 및 제2 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열을 포함하는 비-천연 발생 폴리뉴클레오티드 서열을 포함하고, 여기서 제1 및 제2 HBV 항원 중 적어도 하나는 HBV 표면 항원이다. 일부 실시양태에서, 비-천연 발생 폴리뉴클레오티드 서열은 5'-말단에서 3'-말단의 순서로: 제2 IRES 요소 또는 제2 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열의 3' 말단에 작동적으로 연결된 제2 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열 및 제3 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열을 추가로 포함한다. 일부 실시양태에서, 비-천연 발생 폴리뉴클레오티드 서열은 5'-말단에서 3'-말단의 순서로: 제3 IRES 요소 또는 제3 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열의 3' 말단에 작동적으로 연결된 제3 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열, 및 제4 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열을 추가로 포함한다.
일부 실시양태에서, 제1, 제2, 제3 및 제4 HBV 항원 각각은 하기로 이루어진 군으로부터 독립적으로 선택된다: (i) 서열번호 1의 아미노산 서열과 적어도 98% 동일한, 예컨대 서열번호 1의 아미노산 서열과 적어도 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하는, 바람직하게는 이로 이루어진 제1 HBV 표면 항원; (ii) 서열번호 3의 아미노산 서열과 적어도 98% 동일한, 예컨대 서열번호 3의 아미노산 서열과 적어도 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하는, 바람직하게는 이로 이루어진 제2 HBV 표면 항원; (iii) 서열번호 5의 아미노산 서열과 적어도 98% 동일한, 예컨대 서열번호 5의 아미노산 서열과 적어도 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하는, 바람직하게는 이로 이루어진 제3 HBV 표면 항원; (iv) 서열번호 7과 적어도 90% 동일한, 예컨대 서열번호 7과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하는, 바람직하게는 이로 이루어진 HBV 코어 항원; 및 (v) 서열번호 9와 적어도 90% 동일한, 예컨대 서열번호 9와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원. 일부 실시양태에서, HBV 코어 항원은 서열번호 84, 서열번호 85 또는 서열번호 86과 적어도 90% 동일한, 예컨대 서열번호 84, 서열번호 85 또는 서열번호 86과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하고, 바람직하게는 이로 이루어진다.
일부 실시양태에서, 제1, 제2, 제3 및 제4 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열 각각은 하기로 이루어진 군으로부터 독립적으로 선택된다: (i) 서열번호 2와 적어도 90% 동일한, 예컨대 서열번호 2와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 서열을 갖는 제1 HBV PreS1 항원을 인코딩하는 폴리뉴클레오티드 서열; (ii) 서열번호 4와 적어도 90% 동일한, 예컨대 서열번호 4와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 서열을 갖는 제2 HBV PreS1 항원을 인코딩하는 폴리뉴클레오티드 서열; (iii) 서열번호 6과 적어도 90% 동일한, 예컨대 서열번호 6과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열; (iv) 서열번호 8과 적어도 90% 동일한, 예컨대 서열번호 8과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열; 및 (v) 서열번호 10과 적어도 90% 동일한, 예컨대 서열번호 10과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열. 일부 실시양태에서, HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열은 서열번호 87, 서열번호 88 또는 서열번호 89와 적어도 90% 동일한, 예컨대 서열번호 87, 서열번호 88 또는 서열번호 89와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하고, 바람직하게는 이로 이루어진다.
일부 실시양태에서, 제1, 제2 및 제3 오토프로테아제 펩타이드 각각은 독립적으로 돼지 테스코바이러스-1 2A(P2A), 구제역 바이러스(FMDV) 2A(F2A), 말 비염 A 바이러스(ERAV) 2A(E2A), 테세아 아시그나 바이러스 2A(T2A), 세포질 다각체병 바이러스 2A(BmCPV2A), 무름병 바이러스 2 A(BmIFV2A), 및 이들의 조합으로 이루어진 군으로부터 선택된 펩타이드 서열을 포함한다, 바람직하게는, 제1, 제2 및 제3 오토프로테아제 펩타이드 각각은 서열번호 11의 P2A 서열과 같은 P2A의 펩타이드 서열을 포함한다. 바람직하게는, P2A 펩타이드 서열을 인코딩하는 폴리뉴클레오티드 서열은 서열번호 12이다.
일부 실시양태에서, 제1, 제2 및 제3 IRES 각각은 뇌심근염 바이러스(EMCV) 또는 엔테로바이러스 71(EV71)로부터 유래되고, 바람직하게는 제1, 제2 및 제3 IRES 각각은 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 포함한다.
본 출원의 일 실시양태에서, 핵산 분자 또는 조합은 5' 말에서 3' 말단으로 하기를 포함하는 비-천연 발생 폴리뉴클레오티드 서열을 포함한다: (1) 서열번호 7의 아미노산 서열을 갖는, 바람직하게는, 서열번호 84, 85 또는 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열; (2) 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 7의 아미노산 서열을 갖는, 바람직하게는, 서열번호 84, 85 또는 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열; (3) 서열번호 1 또는 3의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 5의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열; (4) 서열번호 5의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 1 또는 3의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열; (5) 서열번호 7의 아미노산 서열을 갖는, 바람직하게는, 서열번호 84, 85 또는 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 5의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열; (6) 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 7의 아미노산 서열을 갖는, 바람직하게는, 서열번호 84, 85 또는 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 5의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열; (7) 서열번호 5의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 7의 아미노산 서열을 갖는, 바람직하게는, 서열번호 84, 85 또는 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열; (8) 서열번호 5의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 7의 아미노산 서열을 갖는, 바람직하게는, 서열번호 84, 85 또는 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열; (9) 서열번호 7의 아미노산 서열을 갖는, 바람직하게는, 서열번호 84, 85 또는 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열; (10) 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 7의 아미노산 서열을 갖는, 바람직하게는, 서열번호 84, 85 또는 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열; (11) 서열번호 5의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 7의 아미노산을 갖는, 바람직하게는, 서열번호 84, 85 또는 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열; (12) 서열번호 5의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 7의 아미노산 서열을 갖는, 바람직하게는, 서열번호 84, 85 또는 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열; (13) 서열번호 7의 아미노산 서열을 갖는, 바람직하게는, 서열번호 84, 85 또는 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열; (14) 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 7의 아미노산 서열을 갖는, 바람직하게는, 서열번호 84, 85 또는 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열; (15) 서열번호 5의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 7의 아미노산 서열을 갖는, 바람직하게는, 서열번호 84, 85 또는 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열; (16) 서열번호 5의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 7의 아미노산 서열을 갖는, 바람직하게는, 서열번호 84, 85 또는 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열; (17) 서열번호 5의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 86의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열; (18) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 7의 아미노산 서열을 갖는, 바람직하게는, 서열번호 84, 85 또는 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열; (19) 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 7의 아미노산 서열을 갖는, 바람직하게는, 서열번호 84, 85 또는 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 5의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열; (20) 서열번호 7의 아미노산 서열을 갖는, 바람직하게는, 서열번호 84, 85 또는 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 5의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열; (21) 서열번호 5의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 7의 아미노산 서열을 갖는, 바람직하게는, 서열번호 84, 85 또는 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열; (22) 서열번호 5의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 7의 아미노산 서열을 갖는, 바람직하게는, 서열번호 84, 85 또는 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열; (23) 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 7의 아미노산 서열을 갖는, 바람직하게는, 서열번호 84, 85 또는 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 5의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열; 및 (24) 서열번호 7의 아미노산 서열을 갖는, 바람직하게는, 서열번호 84, 85 또는 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 5의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열. 일부 실시양태에서, HBV 항원 각각은 독립적으로 분비를 위한 신호 펩타이드 서열에 작동적으로 연결되거나 이를 포함한다. 임의의 적합한 신호 펩타이드 서열이 사용될 수 있다. 바람직하게는, HBV PreS1 항원, HBV 코어 항원 및 HBV pol 항원 각각에 대해, 신호 펩타이드는 항원 서열의 N 말단에 작동적으로 연결된다. 일부 실시양태에서, 신호 펩타이드는 서열번호 77의 아미노산 서열을 포함하고, 바람직하게는, 신호 펩타이드는 서열번호 90의 뉴클레오티드 서열에 의해 인코딩된다.
일부 실시양태에서, 핵산 분자 또는 핵산 조합은 서열번호 15 내지 54 중 어느 하나의 비-천연 발생 폴리뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 핵산 분자 또는 핵산 조합은 서열번호 15 내지 54 중 적어도 2개의 비-천연 발생 폴리뉴클레오티드 서열을 포함한다.
본 출원은 또한 HBV 항원을 인코딩하는 비-천연 발생 폴리뉴클레오티드를 포함하는 벡터에 관한 것이다. 본원에 사용된 바와 같이, "벡터"는 유전적 물질을 그것이 복제 및/또는 발현될 수 있는 또 다른 세포로 운반하는 데 사용되는 핵산 분자이다. 본 개시내용의 관점에서 당업자에게 알려진 임의의 벡터가 사용될 수 있다. 벡터의 예는 플라스미드, 바이러스 벡터(박테리오파지, 동물 바이러스 및 식물 바이러스), 코스미드, 및 인공 염색체(예를 들어, YACs)를 포함하지만 이에 제한되지 않는다. 바람직하게는, 벡터는 DNA 플라스미드이다. 벡터는 DNA 벡터 또는 RNA 벡터일 수 있다. 당업자는 본 개시내용의 관점에서 표준 재조합 기술을 통해 본 출원의 벡터를 작제할 수 있다.
본 출원의 벡터는 발현 벡터일 수 있다. 본원에 사용된 바와 같이, 용어 "발현 벡터"는 전사될 수 있는 RNA를 코딩하는 핵산을 포함하는 임의의 유형의 유전자 작제물을 지칭한다. 발현 벡터는 DNA 플라스미드 또는 바이러스 벡터와 같은 재조합 단백질 발현을 위한 벡터, 및 DNA 플라스미드 또는 바이러스 벡터와 같은 대상체의 조직에서 발현하기 위해 대상체에게 핵산을 전달하기 위한 벡터를 포함하지만 이에 제한되지 않는다. 발현 벡터의 설계는 형질전환될 숙주 세포의 선택, 원하는 단백질의 발현 수준 등과 같은 인자에 의존할 수 있다는 것이 당업자에 의해 이해될 것이다.
본 출원의 벡터는 다양한 조절 서열을 포함할 수 있다. 본원에 사용된 바와 같이, 용어 "조절 서열"은 복제(replication), 중복(duplication), 전사, 스플라이싱, 번역, 안정성 및/또는 핵산 또는 이의 유도체 중 하나(즉, mRNA)의 숙주 세포 또는 유기체로의 수송을 포함하는 핵산 분자의 기능적 조절을 허용, 기여 또는 조정하는 임의의 서열을 지칭한다. 본 개시내용의 맥락에서, 이 용어는 프로모터, 인핸서 및 다른 발현 조절 요소(예를 들어, 폴리아데닐화 신호 및 mRNA 안정성에 영향을 미치는 요소)를 포함한다.
본 출원의 일부 실시양태에서, 벡터는 비-바이러스 벡터이다. 비-바이러스 벡터의 예는 DNA 플라스미드, 박테리아 인공 염색체, 효모 인공 염색체, 박테리오파지 등을 포함하지만 이에 제한되지는 않는다. 바람직하게는, 비-바이러스 벡터는 DNA 플라스미드이다. "DNA 플라스미드 벡터", "플라스미드 DNA" 또는 "플라스미드 DNA 벡터"와 상호 교환적으로 사용되는 "DNA 플라스미드"는 적합한 숙주 세포에서 자율 복제가 가능한 이중-가닥 및 일반적으로 환형 DNA 서열을 지칭한다. 인코딩된 폴리뉴클레오티드의 발현에 사용되는 DNA 플라스미드는 전형적으로 복제 기점, 다중 클로닝 부위, 및 예를 들어, 항생제 내성 유전자일 수 있는 선택 가능한 마커를 포함한다. 사용될 수 있는 적합한 DNA 플라스미드의 예는 에스케리키아 콜리(Escherichia coli)에서 단백질의 생성 및/또는 발현에 사용될 수 있는 pSE420(Invitrogen, San Diego, CA); 효모의 사카로마이세스 세레비지애(Saccharomyces cerevisiae) 균주에서 생성 및/또는 발현에 사용될 수 있는 pYES2(Invitrogen, Thermo Fisher Scientific); 곤충 세포에서 생성 및/또는 발현에 사용될 수 있는 MAXBAC® 완전 배큘로바이러스 발현 시스템(Thermo Fisher Scientific); 포유동물 세포에서 고수준 구성 단백질 발현에 사용될 수 있는 pcDNATM 또는 pcDNA3TM(Life Technologies, Thermo Fisher Scientific); 및 대부분의 포유동물 세포에서 관심 있는 단백질의 고수준 일시적 발현에 사용될 수 있는 pVAX 또는 pVAX-1(Life Technologies, Thermo Fisher Scientific)과 같은 잘 알려져 있는 발현 시스템(원핵생물 및 진핵생물 시스템 둘 모두 포함)에 사용하기 위한 상업적으로 입수 가능한 발현 벡터를 포함하지만 이에 제한되지 않는다. 임의의 상업적으로 입수 가능한 DNA 플라스미드의 백본은 숙주 세포에서 단백질 발현을 최적화하도록, 예컨대 특정 요소(예를 들어, 복제 기점 및/또는 항생제 내성 카세트)의 배향 역전, 플라스미드에 내인성인 프로모터(예를 들어, 항생제 내성 카세트에서의 프로모터)의 교체, 및/또는 통상적인 기술 및 용이하게 입수 가능한 출발 물질을 사용하여 전사된 단백질을 인코딩하는 폴리뉴클레오티드 서열(예를 들어, 항생제 내성 유전자의 코딩 서열)의 교체를 위해 변형될 수 있다[예를 들어 문헌(Sambrook et al., Molecular Cloning a Laboratory Manual, Second Ed. Cold Spring Harbor Press (1989)) 참조].
바람직하게는, DNA 플라스미드는 포유동물 숙주 세포에서 단백질 발현에 적합한 발현 벡터이다. 포유동물 숙주 세포에서 단백질 발현에 적합한 발현 벡터는 pcDNATM, pcDNA3TM, pVAX, pVAX-1, ADVAX, NTC8454 등을 포함하지만 이에 제한되지 않는다. 바람직하게는, 발현 벡터는 pVAX-1에 기초하며, 이는 포유동물 세포에서 단백질 발현을 최적화하도록 추가로 변형될 수 있다. pVAX-1은 DNA 백신에서 통상적으로 사용되는 플라스미드이며 강력한 인간 급초기 거대세포바이러스(CMV-IE: human immediate early cytomegalovirus) 프로모터에 이어 소 성장 호르몬(bGH: bovine growth hormone)-유래 폴리아데닐화 서열(pA)을 포함한다. pVAX-1은 pUC 복제 기점 및 박테리아 플라스미드 증식을 가능하게 하는 소형 원핵 프로모터에 의해 구동되는 카나마이신 내성 유전자를 추가로 포함한다.
본 출원의 벡터는 또한 바이러스 벡터일 수 있다. 일반적으로, 바이러스 벡터는 비감염성으로 만들었으나 바이러스 프로모터 및 전이유전자를 여전히 함유하여 바이러스 프로모터를 통한 전이유전자의 번역을 가능하게 한, 변형된 바이러스 DNA 또는 RNA를 보유하는 유전공학적으로 조작된 바이러스이다. 바이러스 벡터는 종종 감염 서열이 결여되기 때문에 헬퍼 바이러스 또는 대규모 형질감염을 위한 패키징 라인을 필요로 한다. 특정 실시양태에서, 본원에 기재된 벡터는, 예를 들어, 재조합 아데노바이러스, 재조합 레트로바이러스, 재조합 폭스바이러스, 예컨대 백시니아 바이러스(예를 들어, 변형된 백시니아 앙카라(MVA: Modified Vaccinia Ankara)), 재조합 알파바이러스, 예컨대 셈리키 포레스트 바이러스, 재조합 파라믹소바이러스(paramyxovirus), 예컨대 재조합 홍역 바이러스, 또는 또 다른 재조합 바이러스이다. 사용될 수 있는 바이러스 벡터의 예는 아데노바이러스 벡터, 아데노-관련 바이러스 벡터, 폭스바이러스 벡터, 장용 바이러스 벡터, 베네수엘라 말 뇌염 바이러스 벡터, 셈리키 포레스트 바이러스 벡터, 담배 모자이크 바이러스 벡터, 렌티바이러스 벡터 등을 포함하지만 이에 제한되지 않는다. 특정 실시양태에서, 본원에 기재된 벡터는 MVA 벡터이다. 벡터는 또한 비-바이러스 벡터일 수 있다.
일부 실시양태에서, 바이러스 벡터는 아데노바이러스 벡터, 예를 들어, 재조합 아데노바이러스 벡터이다. 재조합 아데노바이러스 벡터는, 예를 들어, 인간 아데노바이러스(HAdV, 또는 AdHu), 또는 유인원 아데노바이러스, 예컨대 침팬지 또는 고릴라 아데노바이러스(ChAd, AdCh, 또는 SAdV) 또는 레서스 아데노바이러스(rhAd)로부터 유래될 수 있다. 바람직하게는, 아데노바이러스 벡터는 재조합 인간 아데노바이러스 벡터, 예를 들어, 재조합 인간 아데노바이러스 혈청형 26, 또는 재조합 인간 아데노바이러스 혈청형 5, 4, 35, 7, 48 등 중 어느 하나이다. 다른 실시양태에서, 아데노바이러스 벡터는 rhAd 벡터, 예를 들어, rhAd51, rhAd52 또는 rhAd53이다. 본 출원에 유용한 재조합 바이러스 벡터는 본 개시내용의 관점에서 당업계에 알려진 방법을 사용하여 제조될 수 있다. 예를 들어, 유전자 코드의 축퇴성의 관점에서, 동일한 폴리펩타이드를 인코딩하는 여러 핵산 서열이 설계될 수 있다. 본 출원의 HBV 항원을 인코딩하는 폴리뉴클레오티드는 숙주 세포(예를 들어, 박테리아 또는 포유동물 세포)에서 적절한 발현을 보장하도록 선택적으로 코돈-최적화될 수 있다. 코돈-최적화는 당업계에 널리 적용되는 기술이며, 코돈-최적화된 폴리뉴클레오티드를 얻기 위한 방법은 본 개시내용의 관점에서 당업자에게 잘 알려져 있을 것이다.
본 출원의 벡터, 예를 들어, DNA 플라스미드 또는 바이러스 벡터(특히 아데노바이러스 벡터)는 벡터의 폴리뉴클레오티드 서열에 의해 인코딩되는 HBV 항원(들)의 복제 및 발현을 포함하지만 이에 제한되지 않는 벡터의 기존의 기능(들)을 확립하기 위한 임의의 조절 요소를 포함할 수 있다. 조절 요소는 프로모터, 인핸서, 폴리아데닐화 신호, 번역 정지 코돈, 리보솜 결합 요소, 전사 종결자, 선택 마커, 복제 기점 등을 포함하지만 이에 제한되지 않는다. 벡터는 하나 이상의 발현 카세트를 포함할 수 있다. "발현 카세트"는 세포 기구가 RNA와 단백질을 만들도록 지시하는 벡터의 부분이다. 발현 카세트는 전형적으로 3개의 구성요소를 포함한다: 프로모터 서열, 오픈 리딩 프레임, 및 선택적으로 폴리아데닐화 신호를 포함하는 3'-비번역 영역(UTR). 오픈 리딩 프레임(ORF)은 관심 있는 단백질(예를 들어, HBV 항원)의 개시 코돈에서 정지 코돈까지 코딩 서열을 포함하는 리딩 프레임이다. 발현 카세트의 조절 요소는 관심 있는 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열에 작동적으로 연결될 수 있다. 본원에 사용된 바와 같이, 용어 "작동적으로 연결된"은 이의 가장 넓은 합리적인 맥락에서 해석되어야 하며, 기능적 관계에서 폴리뉴클레오티드 요소들의 연결을 지칭한다. 폴리뉴클레오티드가 다른 폴리뉴클레오티드와 기능적 관계에 놓일 때 "작동적으로 연결"된다. 예를 들어, 프로모터는 이것이 코딩 서열의 전사에 영향을 미치는 경우 코딩 서열에 작동적으로 연결된다. 본원에 기재된 발현 카세트에 사용하기에 적합한 임의의 구성요소는 본 출원의 벡터를 제조하기 위해 임의의 조합 및 임의의 순서로 사용될 수 있다.
벡터는 프로모터 서열을, 바람직하게는 발현 카세트 내에 포함할 수 있어 관심 있는 HBV 항원의 발현을 조절한다, 용어 "프로모터"는 그 기존의 의미로 사용되며, 작동적으로 연결된 뉴클레오티드 서열의 전사를 개시하는 뉴클레오티드 서열을 지칭한다. 프로모터는 이것이 전사하는 뉴클레오티드 서열 근처의 동일한 가닥 상에 위치한다. 프로모터는 구성적, 유도성 또는 억제성일 수 있다. 프로모터는 천연 발생 또는 합성일 수 있다. 프로모터는 바이러스, 박테리아, 진균, 식물, 곤충 및 동물을 포함하는 공급원으로부터 유래될 수 있다. 프로모터는 동종성 프로모터(즉, 벡터와 동일한 유전적 공급원으로부터 유래) 또는 이종 프로모터(즉, 상이한 벡터 또는 유전적 공급원으로부터 유래)일 수 있다. 예를 들어, 사용되는 벡터가 DNA 플라스미드인 경우, 프로모터는 플라스미드에 내인성(동종성)이거나 다른 공급원으로부터 유래(이종)일 수 있다. 바람직하게는, 프로모터는 발현 카세트 내에 HBV 항원을 인코딩하는 폴리뉴클레오티드의 업스트림에 위치한다.
사용될 수 있는 프로모터의 예는 유인원 바이러스 40(SV40) 유래의 프로모터, 마우스 유방 종양 바이러스(MMTV) 프로모터, 인간 면역결핍 바이러스(HIV) 프로모터, 예컨대 소 면역결핍 바이러스(BIV) 긴 말단 반복부(LTR) 프로모터, 몰로니 바이러스 프로모터, 조류 백혈병 바이러스(ALV) 프로모터, 거대세포바이러스(CMV) 프로모터, 예컨대 CMV 급초기 프로모터(CMV-IE), 엡스타인 바르 바이러스(EBV: Epstein Barr virus) 프로모터, 또는 라우스 육종 바이러스(RSV: Rous sarcoma virus) 프로모터를 포함하지만 이에 제한되지 않는다. 본 출원에 사용하기에 적합한 추가의 프로모터는 RSV 프로모터, 레트로바이러스 LTR, 아데노바이러스 주요 후기 프로모터, 및 하기 백시니아 바이러스 또는 MVA-유래 및 FPV-유래 프로모터를 포함하지만 이에 제한되지 않는 다양한 폭스바이러스 프로모터를 포함하지만 이에 제한되지 않는다: 30K 프로모터, I3 프로모터, PrS 프로모터, PrHyb, PrS5E 프로모터, Pr7.5K, Pr13.5 긴 프로모터, 40K 프로모터, MVA-40K 프로모터, FPV 40K 프로모터, 30k 프로모터, PrSynIIm 프로모터, PrLE1 프로모터, 및 PR1238 프로모터. 프로모터는 또한 인간 액틴, 인간 미오신, 인간 헤모글로빈, 인간 근육 크레아틴, 또는 인간 메탈로티오네인과 같은 인간 유전자로부터의 프로모터일 수 있다. 프로모터는 또한 천연 또는 합성의 근육 또는 피부 특이적 프로모터와 같은 조직 특이적 프로모터일 수 있다. 바람직하게는 프로모터는 26S 서브게놈 프로모터 또는 T7 프로모터이다. 예시적인 26S 서브게놈 프로모터의 뉴클레오티드 서열은 서열번호 62에 나타낸다. 예시적인 T7 프로모터의 뉴클레오티드 서열은 서열번호 73에 나타낸다.
벡터는 발현된 전사체를 안정화시키고, RNA 전사체의 핵 방출(nuclear export)을 증진시키고/시키거나 전사-번역 결합을 개선하는 추가의 폴리뉴클레오티드 서열을 포함할 수 있다. 그러한 서열의 예는 폴리아데닐화 신호 및 인핸서 서열을 포함한다. 폴리아데닐화 신호는 전형적으로 벡터의 발현 카세트 내의 관심 있는 단백질(예를 들어, HBV 항원)에 대한 코딩 서열의 다운스트림에 위치한다. 인핸서 서열은 전사 인자에 의해 결합될 때 관련 유전자의 전사를 증진시키는 조절 DNA 서열이다. 인핸서 서열은 바람직하게는 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열의 업스트림에 위치하지만, 벡터의 발현 카세트 내의 프로모터 서열의 다운스트림에 위치한다.
본 개시내용의 관점에서 당업자에게 알려진 임의의 폴리아데닐화 신호가 사용될 수 있다. 예를 들어, 폴리아데닐화 신호는 SV40 폴리아데닐화 신호(예를 들어, 서열번호 64), LTR 폴리아데닐화 신호, 소 성장 호르몬(bGH) 폴리아데닐화 신호, 인간 성장 호르몬(hGH) 폴리아데닐화 신호, 또는 인간 β-글로빈 폴리아데닐화 신호일 수 있다. 바람직하게는, 폴리아데닐화 신호는 SV40 폴리아데닐화 신호이다. 예시적인 SV40 폴리아데닐화 신호의 뉴클레오티드 서열은 서열번호 64에 나타낸다.
본 개시내용의 관점에서 당업자에게 알려진 임의의 인핸서 서열이 사용될 수 있다. 예를 들어, 인핸서 서열은 인간 액틴, 인간 미오신, 인간 헤모글로빈, 인간 근육 크레아틴, 또는 CMV, HA, RSV, 또는 EBV 중 하나와 같은 바이러스 인핸서일 수 있다. 특정 인핸서의 예는 Woodchuck HBV 전사후 조절 요소(WPRE: Woodchuck HBV Post-transcriptional regulatory element), 인간 아포지단백질 A1 전구체(ApoAI: apolipoprotein A1 precursor)로부터 유래된 인트론/엑손 서열, 인간 T-세포 백혈병 바이러스 유형 1(HTLV-1: human T-cell leukemia virus type 1)의 긴 말단 반복부(LTR: long terminal repeat)의 비번역 R-U5 도메인, 스플라이싱 인핸서, 합성 토끼 β-글로빈 인트론, 또는 이들의 임의의 조합을 포함하지만 이에 제한되지 않는다.
벡터는 신호 펩타이드 서열을 인코딩하는 폴리뉴클레오티드 서열을 포함할 수 있다. 바람직하게는, 신호 펩타이드 서열을 인코딩하는 폴리뉴클레오티드 서열은 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열의 업스트림에 위치한다. 신호 펩타이드는 전형적으로 단백질의 국소화를 지시하고, 단백질이 생성되는 세포로부터 단백질의 분비를 촉진하고/하거나 항원 발현 및 항원-제시 세포에 대한 교차-제시를 개선한다. 신호 펩타이드는 벡터로부터 발현될 때 HBV 항원의 N-말단에 존재할 수 있지만, 이는, 예를 들어, 상기 세포로부터 분비 시 신호 펩티다아제에 의해 절단된다. 신호 펩타이드가 절단된 발현된 단백질은 종종 "성숙 단백질"로 지칭된다. 본 개시내용의 관점에서 당업계에 알려진 임의의 신호 펩타이드가 사용될 수 있다. 예를 들어, 신호 펩타이드는 시스타틴 S 신호 펩타이드; 면역글로불린(Ig) 분비 신호, 예컨대 시스타틴 S 신호 펩타이드, Ig 중쇄 감마 신호 펩타이드 SPIgG, 또는 Ig 중쇄 엡실론 신호 펩타이드 SPIgE일 수 있다.
벡터, 예컨대 DNA 플라스미드는 또한 박테리아 복제 기점 및 박테리아 세포, 예를 들어 이. 콜리(E. coli)에서 플라스미드의 선택 및 유지를 위한 항생제 내성 발현 카세트를 포함할 수 있다. 박테리아 복제 기점 및 항생제 내성 카세트는 HBV 항원을 인코딩하는 발현 카세트와 동일한 방향으로, 또는 반대(역) 방향으로 벡터에 위치할 수 있다. 복제 기점(ORI)은 플라스미드가 세포 내에서 번식하고 생존할 수 있도록 하는 복제가 개시되는 서열이다. 본 출원에 사용하기에 적합한 ORI의 예는 ColE1, pMB1, pUC, pSC101, R6K, 및 15A, 바람직하게는 pUC를 포함하지만 이에 제한되지 않는다.
박테리아 세포의 선택 및 유지를 위한 발현 카세트는 전형적으로 항생제 내성 유전자에 작동적으로 연결된 프로모터 서열을 포함한다. 바람직하게는, 항생제 내성 유전자에 작동적으로 연결된 프로모터 서열은 관심 있는 단백질, 예를 들어, HBV 항원을 인코딩하는 폴리뉴클레오티드 서열에 작동적으로 연결된 프로모터 서열과 상이하다. 항생제 내성 유전자는 코돈 최적화될 수 있고, 항생제 내성 유전자의 서열 조성은 일반적으로 박테리아, 예를 들어, 이. 콜리, 코돈 사용에 맞게 조정된다. 본 개시내용의 관점에서 당업자에게 알려진 임의의 항생제 내성 유전자가 사용될 수 있으며, 카나마이신 내성 유전자(Kanr), 암피실린 내성 유전자(Ampr) 및 테트라사이클린 내성 유전자(Tetr)뿐만 아니라 클로람페니콜, 블레오마이신, 스펙티노마이신, 카르베니실린 등에 내성을 부여하는 유전자를 포함하지만 이에 제한되지 않는다.
본 출원의 HBV 항원을 인코딩하는 폴리뉴클레오티드 및 발현 벡터는 본 개시내용의 관점에서 당업계에 알려진 임의의 방법에 의해 제조될 수 있다. 예를 들어, HBV 항원을 인코딩하는 폴리뉴클레오티드는 당업자에게 잘 알려진 표준 분자 생물학 기술, 예를 들어, 폴리머라제 연쇄 반응(PCR) 등을 사용하여 발현 벡터 내로 도입되거나 "클로닝"될 수 있다.
아데노바이러스
일 측면에서, 본 출원은 항원성 HBV 항원을 인코딩하는 뉴클레오티드 서열을 포함하는 재조합 아데노바이러스를 제공한다. 일 측면에서, 본 출원은 항원성 HBV 코어 항원을 인코딩하는 뉴클레오티드 서열을 포함하는 재조합 MVA 벡터를 제공한다. 또 다른 측면에서, 본 출원은 항원성 HBV pol 항원을 인코딩하는 뉴클레오티드 서열을 포함하는 재조합 MVA 벡터를 제공한다. 또 다른 측면에서, 본 출원은 항원성 HBV 표면 항원을 인코딩하는 뉴클레오티드 서열을 포함하는 재조합 MVA 벡터를 제공한다. 일 측면에서, 본 출원은 HBV 코어 항원, HBV 폴리머라제(pol) 항원 및 HBV 표면 항원으로 이루어진 군으로부터 각각 독립적으로 선택된 항원성 HBV 항원을 인코딩하는 1개, 2개, 3개 또는 4개의 뉴클레오티드 서열을 포함하는, 재조합 MVA 벡터를 제공한다.
본 출원에 따른 아데노바이러스는 아데노비리대(Adenoviridae) 과에 속하며 바람직하게는 마스타데노바이러스(Mastadenovirus) 속에 속하는 아데노바이러스이다. 이는 인간 아데노바이러스일 수 있지만, 소 아데노바이러스(예를 들어, 소 아데노바이러스 3, BAdV3), 개 아데노바이러스(예를 들어 CAdV2), 돼지 아데노바이러스(예를 들어 PAdV3 또는 5), 또는 유인원 아데노바이러스(원숭이 아데노바이러스 및 원숭이 아데노바이러스, 예컨대 침팬지 아데노바이러스 또는 고릴라 아데노바이러스를 포함하지만 이에 제한되지 않음)를 포함하지만 이에 제한되지 않는 다른 종을 감염시키는 아데노바이러스일 수도 있다. 바람직하게는, 아데노바이러스는 인간 아데노바이러스(HAdV, 또는 AdHu; 본 출원에서 인간 아데노바이러스는 종의 표시 없이 Ad로 언급되는 경우를 의미하며, 예를 들어, 간략한 표기 "Ad5"는 인간 아데노바이러스 혈청형 5인 HAdV5와 동일함을 의미함), 또는 유인원 아데노바이러스, 예컨대 침팬지 또는 고릴라 아데노바이러스(ChAd, AdCh, 또는 SAdV)이다.
가장 진보된 연구는 인간 아데노바이러스를 사용하여 수행되었으며, 인간 아데노바이러스는 본 출원의 특정 측면에 따라 바람직하다. 특정 바람직한 실시양태에서, 본 출원에 따른 재조합 아데노바이러스는 인간 아데노바이러스에 기초한다. 바람직한 실시양태에서, 재조합 아데노바이러스는 인간 아데노바이러스 혈청형 5, 11, 26, 34, 35, 48, 49 또는 50에 기초한다. 본 출원의 특히 바람직한 실시양태에 따르면, 아데노바이러스는 혈청형 26 또는 35 중 하나의 인간 아데노바이러스이다.
이들 혈청형의 이점은 인간 집단에서 낮은 혈청유병률 및/또는 낮은 기존 중화 항체 역가이다. rAd26 벡터의 제조는, 예를 들어, WO 2007/104792 및 문헌[Abbink et al., (2007) Virol 81(9):4654-63]에 기재되어 있으며, 이들 둘 모두는 그 전체가 본원에 참조로 포함된다. Ad26의 예시적인 게놈 서열은 GenBank Accession EF 153474 및 WO2007/104792(예를 들어, 서열번호 1 참조)에서 발견된다. rAd35 벡터의 제조는, 예를 들어, 미국 특허 번호 7,270,811, WO00/70071, 및 문헌[Vogels et al., (2003) J Virol 77(15):8263-71]에 기재되어 있으며, 이들 모두는 그 전체가 본원에 참조로 포함된다. Ad35의 예시적인 게놈 서열은 GenBank Accession AC_000019 및 WO00/70071(예를 들어, 도 6 참조)에서 발견된다.
유인원 아데노바이러스는 또한 일반적으로 인간 집단에서 낮은 혈청유병률 및/또는 낮은 기존 중화 항체 역가를 가지며 침팬지 아데노바이러스 벡터를 사용하여 상당한 양의 작업이 보고되었다(예를 들어, US6083716; WO2005/071093; WO 2010/086189; WO 2010085984; Farina et al, 2001, J Virol 75: 11603-13; Cohen et al, 2002, J Gen Virol 83: 151-55; Kobinger et al, 2006, Virology 346: 394-401; Tatsis et al., 2007, Molecular Therapy 15: 608-17; 또한 문헌(Bangari and Mittal, 2006, Vaccine 24: 849- 62)에 의한 검토; 및 문헌(Lasaro and Ertl, 2009, Mol Ther 17: 1333-39)에 의한 검토 참조). 따라서, 다른 바람직한 실시양태에서, 본 출원에 따른 재조합 아데노바이러스는 유인원 아데노바이러스, 예를 들어, 침팬지 아데노바이러스에 기초한다. 본 출원의 일 실시양태에서, 재조합 아데노바이러스는 유인원 아데노바이러스 유형 1, 3, 7, 8, 21, 22, 23, 24, 25, 26, 27.1, 28.1, 29, 30, 31.1, 32, 33, 34, 35.1, 36, 37.2, 39, 40.1, 41.1, 42.1, 43, 44, 45, 46, 48, 49, 50 또는 SA7P에 기초한다.
아데노바이러스 벡터 rAd26 및 rAd35
본 출원의 바람직한 실시양태에서, 아데노바이러스 벡터는 2개의 희귀 혈청형으로부터의 캡시드 단백질을 포함한다: Ad26 및 Ad35. 전형적인 실시양태에서, 벡터는 rAd26 또는 rAd35 바이러스이다.
따라서, 본 출원에 사용될 수 있는 벡터는 Ad26 또는 Ad35 캡시드 단백질(예를 들어, 섬유, 펜톤 또는 헥손 단백질)을 포함한다. 당업자는 전체 Ad26 또는 Ad35 캡시드 단백질이 본 출원의 벡터에 사용될 필요는 없다는 것을 인식할 것이다. 따라서, Ad26 또는 Ad35 캡시드 단백질의 적어도 일부를 포함하는 키메라 캡시드 단백질이 본 출원의 벡터에 사용될 수 있다. 본 출원의 벡터는 또한 적어도 하나의 캡시드 단백질이 Ad26 또는 Ad35로부터 유래되는 한, 섬유, 펜톤 및 헥손 단백질이 각각 상이한 혈청형으로부터 유래되는 캡시드 단백질을 포함할 수 있다. 바람직한 실시양태에서, 섬유, 펜톤 및 헥손 단백질은 각각 Ad26으로부터 유래되거나 각각 Ad35로부터 유래된다.
당업자는 다수의 혈청형으로부터 유래된 요소가 단일 재조합 아데노바이러스 벡터에서 조합될 수 있음을 인식할 것이다. 따라서, 상이한 혈청형으로부터 바람직한 특성을 조합하는 키메라 아데노바이러스가 생성될 수 있다. 따라서, 일부 실시양태에서, 본 출원의 키메라 아데노바이러스는 Ad26 및 Ad35 혈청형의 기존하는 면역의 부재를 온도 안정성, 조립, 앵커링, 생산 수율, 방향전환되거나 개선된 감염, 표적 세포에서의 DNA의 안정성 등과 같은 특성과 조합할 수 있다.
본 출원의 실시양태에서, 본 출원에 유용한 재조합 아데노바이러스 벡터는 주로 또는 전적으로 Ad35 또는 Ad26으로부터 유래된다(즉, 벡터는 rAd35 또는 rAd26이다). 일부 실시양태에서, 아데노바이러스는 복제 결핍인데, 예를 들어, 게놈의 E1 영역 내의 결실을 포함하기 때문이다. Ad26 또는 Ad35로부터 유래된 본 출원의 아데노바이러스의 경우, 아데노바이러스의 E4-orf6 코딩 서열을 Ad5와 같은 인간 서브그룹 C의 아데노바이러스의 E4-orf6으로 교환하는 것이 전형적이다. 이는, 예를 들어, 293 세포, PER.C6 세포 등과 같은 Ad5의 E1 유전자를 발현하는 잘 알려진 보완 세포주에서 그러한 아데노바이러스의 증식을 허용한다(예를 들어, 문헌[ Havenga et al., 2006, J Gen Virol 87:2135-43; WO 03/104467] 참조). 본 출원의 실시양태에서, 아데노바이러스는 항원을 인코딩하는 핵산이 클로닝된 E1 영역에 결실된 혈청형 35의 인간 아데노바이러스이고, Ad5의 E4 orf6 영역을 갖는다. 본 출원의 실시양태에서, 아데노바이러스는 혈청형 35의 인간 아데노바이러스로, 항원을 인코딩하는 핵산이 클로닝된 E1 영역에 결실이 있고 Ad5의 E4 orf6 영역이 있다. Ad35 아데노바이러스의 경우, 아데노바이러스에서 E1B 55K 오픈 리딩 프레임의 3' 말단, 예를 들어 pIX 오픈 리딩 프레임의 바로 업스트림에 166 bp 또는 이를 포함하는 단편, 예컨대 Bsu36I 제한 부위에 의해 5' 말단에 표시된 pIX 개시 코돈의 바로 업스트림에 있는 243 bp 단편을 보유하는 것이 전형적인데, 이는 pIX 유전자의 프로모터가 부분적으로 이 영역에 존재하기 때문에 아데노바이러스의 안정성을 증가시키기 때문이다(예를 들어, 문헌[상기 문헌 Havenga et al., 2006; WO 2004/001032] 참조).
재조합 아데노바이러스 벡터의 제조는 당업계에 잘 알려져 있다. rAd26 벡터의 제조는, 예를 들어, WO 2007/104792 및 문헌(Abbink et al., (2007) Virol 81(9):4654-63)에 기재되어 있다. Ad26의 예시적인 게놈 서열은 GenBank Accession EF 153474 및 WO 2007/104792의 서열번호 1에서 발견된다. rAd35 벡터의 제조는, 예를 들어, 미국 특허 번호 7,270,811 및 문헌(Vogels et al., (2003) J Virol 77(15):8263-71)에 기재되어 있다. Ad35의 예시적인 게놈 서열은 GenBank Accession AC_000019에서 발견된다.
본 출원의 실시양태에서, 본 출원에 유용한 벡터는 WO2012/082918에 기재된 것들을 포함하며, 그 개시내용은 그 전체가 본원에 참조로 포함된다.
전형적으로, 본 출원에 유용한 벡터는 전체 재조합 아데노바이러스 게놈(예를 들어, 플라스미드, 코스미드, 또는 바쿨로바이러스 벡터)을 포함하는 핵산을 사용하여 생성된다. 따라서, 본 출원은 또한 본 출원의 아데노바이러스 벡터를 인코딩하는 단리된 핵산 분자를 제공한다. 본 출원의 핵산 분자는 RNA의 형태이거나 클로닝에 의해 수득되거나 합성적으로 생성된 DNA의 형태일 수 있다. DNA는 이중-가닥 또는 단일-가닥일 수 있다.
본 출원에 유용한 아데노바이러스 벡터는 전형적으로 복제 결함이 있다. 이들 실시양태에서, 바이러스는 E1 영역과 같은 바이러스의 복제에 중요한 영역의 결실 또는 불활성화에 의해 복제-결함이 있게 된다. 상기 영역은, 예를 들어, (일반적으로 프로모터에 연결된) 관심 있는 유전자를 삽입함으로써 실질적으로 결실되거나 불활성화될 수 있다. 일부 실시양태에서, 본 출원의 벡터는 다른 구역, 예컨대 E2, E3 또는 E4 구역에서의 결실 또는 프로모터에 연결된 이종 유전자의 삽입을 함유할 수 있다. E2- 및/또는 E4-돌연변이된 아데노바이러스의 경우, 일반적으로 E2- 및/또는 E4-보완 세포주가 재조합 아데노바이러스를 생성하는 데 사용된다. 아데노바이러스의 E3 영역에서의 돌연변이는 E3이 복제에 필요하지 않기 때문에 세포주에 의해 보완될 필요가 없다.
패키징 세포주는 전형적으로 본 출원의 충분한 양의 아데노바이러스 벡터를 생성하는 데 사용된다. 패키징 세포는 복제-결함 벡터에서 결실되거나 불활성화되어 바이러스가 세포에서 복제될 수 있도록 하는 이들 유전자를 포함하는 세포이다. 적합한 세포주는, 예를 들어, PER.C6, 911, 293 및 E1 A549를 포함한다.
상기 언급된 바와 같이, 매우 다양한 B형 간염 바이러스(HBV) 항원(예를 들어, HBV 코어, HBV 폴리머라제, HBV Pre-S1, HBV PreS2.S 항원)이 벡터에서 발현될 수 있다. 필요한 경우, HBV 항원을 인코딩하는 이종 유전자는 처리된 숙주(예를 들어, 인간)에서 적절한 발현을 보장하기 위해 코돈-최적화될 수 있다. 코돈-최적화는 당업계에 널리 적용되는 기술이다. 전형적으로, 이종 유전자는 아데노바이러스 게놈의 E1 및/또는 E3 영역으로 클로닝된다.
이종 B형 간염 바이러스 유전자는 아데노바이러스-유래 프로모터(예를 들어, 주요 후기 프로모터)의 제어 하에 있을 수 있거나(즉, 작동적으로 연결됨) 또는 이종 프로모터의 제어 하에 있을 수 있다. 적합한 이종 프로모터의 예는 CMV 프로모터 및 RSV 프로모터를 포함한다. 바람직하게는, 프로모터는 발현 카세트 내에서 관심 있는 이종 유전자의 상부스트림에 위치한다.
MVA 벡터
본 출원에 유용한 MVA 벡터는 변형된 백시니아 앙카라 바이러스로부터 유래된 약독화 바이러스를 이용한다. MVA 벡터는 매우 다양한 HBV 항원(예를 들어, HBV 코어, HBV 폴리머라제, HBV Pre-S1, HBV PreS2.S 항원)을 발현한다. 일 측면에서, 본 출원은 항원성 HBV 코어 항원을 인코딩하는 뉴클레오티드 서열을 포함하는 재조합 MVA 벡터를 제공한다. 또 다른 측면에서, 본 출원은 HBV pol 항원을 인코딩하는 뉴클레오티드 서열을 포함하는 재조합 MVA 벡터를 제공한다. 또 다른 측면에서, 본 출원은 항원성 HBV 표면 항원을 인코딩하는 뉴클레오티드 서열을 포함하는 재조합 MVA 벡터를 제공한다. 일 측면에서, 본 출원은 HBV 코어 항원, HBV 폴리머라제(pol) 항원 및 HBV 표면 항원으로 이루어진 군으로부터 각각 독립적으로 선택된 항원성 HBV 항원을 인코딩하는 1, 2, 3 또는 4개의 뉴클레오티드 서열을 포함하는 재조합 MVA 벡터를 제공한다.
인간이 만든 약독화 변형된 백시니아 바이러스 앙카라("MVA")는 백시니아 바이러스(CVA)의 앙카라 균주의 닭 배아 섬유아세포에서 516회 연속 계대에 의해 생성되었다(검토를 위해 문헌[Mayr, A., et al. Infection 3, 6-14 (1975)] 참조). 이러한 장기 계대의 결과로서, 생성된 MVA 바이러스의 게놈은 그의 게놈 서열의 약 31 킬로베이스가 결실되었고, 따라서, 조류 세포에 대한 복제가 고도로 제한된 숙주 세포로서 기술되었다(Meyer, H. et al., J. Gen. Virol. 72, 1031-1038 (1991)). 다양한 동물 모델에서 생성된 MVA가 완전히 복제 적격인 시작 물질과 비교하여 상당히 비독성인 것으로 나타났다(Mayr, A. & Danner, K., Dev. Biol. Stand. 41:225-34 (1978)).
본 출원의 실시에 유용한 MVA 바이러스는 MVA-572(1994년 1월 27일에 ECACC V94012707로서 기탁됨); MVA-575(2000년 12월 7일에 ECACC V00120707로서 기탁됨), MVA-I721(문헌[Suter et al., Vaccine 2009] 참조), 및 ACAM3000(2003년 3월 27일에 ATCC® PTA-5095로서 기탁됨)을 포함할 수 있지만 이에 제한되지 않는다.
보다 바람직하게는, 본 출원에 따라 사용된 MVA는 MVA-BN 및 MVA-BN의 유도체를 포함한다. MVA-BN은 국제 PCT 공보 WO 02/42480에 기재되어 있다. MVA-BN의 "유도체"는 본원에 기재된 바와 같이 본질적으로 MVA-BN과 동일한 복제 특성을 나타내지만 이들의 게놈의 하나 이상의 부분에서 차이를 나타내는 바이러스를 지칭한다.
MVA-BN뿐만 아니라 이의 유도체는 복제 불능이며, 이는 생체내 및 시험관내에서 생식적으로 복제하는 데 실패함을 의미한다. 보다 구체적으로 시험관 내에서, MVA-BN 또는 이의 유도체는 닭 배아 섬유아세포(CEF)에서 생식 복제가 가능지만 인간 각질세포 세포주 HaCat(Boukamp et al. (1988), J. Cell Biol. 106:761-771), 인간 골육종 세포주 143B(ECACC 기탁 번호 91112502), 인간 배아 신장 세포주 293(ECACC 기탁 번호 85120602), 및 인간 자궁경부 선암종 세포주 HeLa(ATCC 기탁 번호 CCL-2)에서는 생식 복제가 가능하지 않은 것으로 기재되었다. 추가적으로, MVA-BN 또는 이의 유도체는 Hela 세포 및 HaCaT 세포주에서 MVA-575보다 적어도 2배 적고, 보다 바람직하게는 3배 적은 바이러스 증폭률을 갖는다. MVA-BN 및 이의 유도체의 이러한 특성에 대한 시험 및 검정은 WO 02/42480(미국 특허 출원 번호 2003/0206926) 및 WO 03/048184(미국 특허 출원 번호 2006/0159699)에 기재되어 있다.
이전 단락에 기재된 바와 같은 시험관내 인간 세포주에서 "생식 복제 불가능한" 또는 "생식 복제 능력이 없는"이라는 용어는, 예를 들어, WO 02/42480에 기재되어 있으며, 이는 또한 상기 언급된 바와 같은 원하는 특성을 갖는 MVA를 수득하는 방법을 교시한다. 상기 용어는 WO 02/42480 또는 미국 특허 번호 6,761,893에 기재된 검정을 사용하여 감염 후 4일째에 시험관내 바이러스 증폭률이 1 미만인 바이러스에 적용된다.
용어 "생식적으로 복제하는 데 실패한"은 이전 단락에서 기재된 바와 같이 감염 후 4일째에 시험관내 인간 세포주에서 바이러스 증폭률이 1 미만인 바이러스를 지칭한다. WO 02/42480 또는 미국 특허 번호 6,761,893에 기재된 검정은 바이러스 증폭률의 결정에 적용 가능하다.
이전 단락에서 기재된 바와 같이 시험관내 인간 세포주에서 바이러스의 증폭 또는 복제는 일반적으로 "증폭률"로 지칭되는, 처음에 세포를 감염시키기 위해 원래 사용된 양(입력)에 대한 감염된 세포로부터 생성된 바이러스의 비율(출력)로 표현된다. 증폭률 "1"은 감염된 세포로부터 생성된 바이러스의 양이 초기에 세포를 감염시키는 데 사용된 양과 동일한 증폭 상태를 정의하며, 이는 감염된 세포가 바이러스 감염 및 번식을 허용한다는 것을 의미한다. 대조적으로, 1 미만의 증폭률, 즉 입력 수준에 비해 출력이 감소하면 생식 복제가 결여되어 바이러스가 약독화됨을 나타낸다.
MVA-기반 백신의 이점은 대규모 백신 생산에 대한 가용성뿐만 아니라 안전성 프로파일을 포함한다. 전임상 시험은 MVA-BN이 다른 MVA 균주에 비해 우수한 약독화 및 효능을 입증한다는 것을 밝혀냈다(WO 02/42480). MVA-BN 균주의 추가의 특성은 DNA-프라임/백시니아 바이러스 부스트 용법과 비교할 때 백시니아 바이러스 프라임/백시니아 바이러스 부스트 용법에서 실질적으로 동일한 수준의 면역을 유도하는 능력이다.
본원에서 가장 바람직한 실시양태인 재조합 MVA-BN 바이러스는 포유동물 세포에서의 이들의 뚜렷한 복제 결핍 및 이들의 잘 확립된 비독성 때문에 안전한 것으로 간주된다. 또한, 이의 효능 외에도, 산업 규모의 제조의 타당성이 유리할 수 있다. 또한, MVA-기반 백신은 여러 이종 항원을 전달할 수 있으며 체액성 및 세포성 면역을 동시에 유도할 수 있다.
본 출원에 유용한 MVA 벡터는 WO/2002/042480 및 WO/2002/24224에 기재된 것과 같은 당업계에 알려진 방법을 사용하여 제조될 수 있으며, 이들의 관련 개시내용은 본원에 참조로 포함된다.
본 출원의 바람직한 실시양태에서, MVA 벡터(들)는 HBV 코어 항원, HBV pol 항원, 및 HBV 표면 항원으로 이루어진 군으로부터 선택된 하나 이상의 항원성 단백질을 인코딩하는 핵산을 포함한다.
HBV 항원 단백질은 MVA의 하나 이상의 유전자간 영역(IGR)에 삽입될 수 있다. 본 출원의 실시양태에서, IGR은 IGR07/08, IGR 44/45, IGR 64/65, IGR 88/89, IGR 136/137, 및 IGR 148/149로부터 선택된다. 본 출원의 실시양태에서, 재조합 MVA의 5, 4, 3 또는 2개 미만의 IGR은 HBV 코어 항원 및/또는 HBV pol 항원의 항원 결정자를 인코딩하는 이종 뉴클레오티드 서열을 포함한다. 이종 뉴클레오티드 서열은, 추가적으로 또는 대안적으로, 하나 이상의 천연 발생 결실 부위, 특히 MVA 게놈의 주요 결실 부위 I, II, III, IV, V, 또는 VI 내로 삽입될 수 있다. 본 출원의 실시양태에서, 재조합 MVA의 천연 발생 결실 부위의 5, 4, 3, 또는 2개 미만은 HBV 코어 항원 및/또는 HBV pol 항원의 항원 결정자를 인코딩하는 이종 뉴클레오티드 서열을 포함한다.
HBV 단백질의 항원 결정자를 인코딩하는 이종 뉴클레오티드 서열을 포함하는 MVA의 삽입 부위의 수는 1, 2, 3, 4, 5, 6, 7개 또는 그 이상일 수 있다. 본 출원의 실시양태에서, 이종 뉴클레오티드 서열은 4, 3, 2개, 또는 그 이하의 삽입 부위에 삽입된다. 바람직하게는, 2개의 삽입 부위가 사용된다. 본 출원의 실시양태에서, 3개의 삽입 부위가 사용된다. 바람직하게는, 재조합 MVA는 2 또는 3개의 삽입 부위에 삽입된 적어도 2, 3, 4, 5, 6, 또는 7개의 유전자를 포함한다.
본원에 제공된 재조합 MVA 바이러스는 당업계에 알려진 통상적인 방법에 의해 생성될 수 있다. 재조합 폭스바이러스를 수득하거나 외인성 코딩 서열을 폭스바이러스 게놈에 삽입하는 방법은 당업자에게 잘 알려져 있다. 예를 들어, DNA 클로닝, DNA 및 RNA 단리, 웨스턴 블롯 분석, RT-PCR 및 PCR 증폭 기술과 같은 표준 분자 생물학 기술에 대한 방법은 문헌[Molecular Cloning, A laboratory Manual (2nd Ed.) (J. Sambrook et al., Cold Spring Harbor Laboratory Press (1989))]에 기재되어 있으며, 바이러스의 취급 및 조작을 위한 기술은 문헌[Virology Methods Manual (B.W.J. Mahy et al. (eds.), Academic Press (1996))]에 기재되어 있다. 유사하게, MVA의 취급, 조작 및 유전자 조작에 대한 기술 및 노하우는 문헌[Molecular Virology: A Practical Approach (A.J. Davison & R.M. Elliott (Eds.), The Practical Approach Series, IRL Press at Oxford University Press, Oxford, UK (1993) (예를 들어, 문헌[Chapter 9: Expression of genes by Vaccinia virus vectors]참조)) 및 Current Protocols in Molecular Biology (John Wiley & Son, Inc. (1998) (예를 들어, 문헌[Chapter 16, Section IV: Expression of proteins in mammalian cells using vaccinia viral vector] 참조))에 기재되어 있다.
본원에 개시된 다양한 재조합 MVA의 생성을 위해, 상이한 방법이 적용될 수 있다. 바이러스에 삽입될 DNA 서열은 MVA의 DNA 절편과 상동성인 DNA가 삽입된 이. 콜리 플라스미드 작제물에 배치될 수 있다. 별도로, 삽입될 DNA 서열은 프로모터에 결찰될 수 있다. 프로모터-유전자 연결은 프로모터-유전자 결합이 비필수 유전자좌를 포함하는 MVA DNA의 영역 측면에 있는 DNA 서열에 상동성인 DNA에 의해 양쪽 말단 측면에 위치하도록 플라스미드 작제물에 위치할 수 있다. 생성된 플라스미드 작제물은 이. 콜리 박테리아 내에서 번식하여 증폭되고 단리될 수 있다. 삽입될 DNA 유전자 서열을 포함하는 단리된 플라스미드는, 예를 들어, 닭 배아 섬유아세포(CEF)의 세포 배양물에 형질감염될 수 있으며, 동시에 배양물은 MVA로 감염된다. 플라스미드의 상동 MVA DNA와 바이러스 게놈 사이의 재조합은 각각 외래 DNA 서열의 존재에 의해 변형된 MVA를 생성할 수 있다.
바람직한 실시양태에 따르면, 예를 들어 CEF 세포와 같은 적합한 세포 배양물의 세포는 폭스바이러스로 감염될 수 있다. 이어서, 감염된 세포는 외래 또는 이종 유전자 또는 유전자들을 포함하는 제1 플라스미드 벡터로, 바람직하게는 폭스바이러스 발현 조절 요소의 전사 조절 하에 형질감염될 수 있다. 상기 설명된 바와 같이, 플라스미드 벡터는 또한 폭스바이러스 게놈의 선택된 부분으로 외인성 서열의 삽입을 지시할 수 있는 서열을 포함한다. 선택적으로, 플라스미드 벡터는 또한 폭스바이러스 프로모터에 작동적으로 연결된 마커 및/또는 선택 유전자를 포함하는 카세트를 포함한다.
적합한 마커 또는 선택 유전자는, 예를 들어, 녹색 형광 단백질, β-갈락토시다제, 네오마이신-포스포리보실트랜스퍼라제 또는 기타 마커를 인코딩하는 유전자이다. 선택 또는 마커 카세트의 사용은 생성된 재조합 폭스바이러스의 식별 및 단리를 단순화한다. 그러나, 재조합 폭스바이러스는 또한 PCR 기술에 의해 식별될 수 있다. 이어서, 추가의 세포를 상기 기재된 같이 수득된 재조합 폭스바이러스로 감염시키고, 제2 외래 또는 이종 유전자 또는 유전자들을 포함하는 제2 벡터로 형질감염시킬 수 있다. 이 유전자가 폭스바이러스 게놈의 상이한 삽입 부위에 도입되어야 하는 경우, 제2 벡터는 또한 폭스바이러스의 게놈으로 제2 외래 유전자 또는 유전자들의 통합을 지시하는 폭스바이러스-상동 서열도 상이하다. 상동 재조합이 발생한 후, 2개 이상의 외래 또는 이종 유전자를 포함하는 재조합 바이러스를 단리할 수 있다. 추가의 외래 유전자를 재조합 바이러스에 도입하기 위해, 감염 및 형질감염 단계는 감염을 위해 이전 단계에서 단리된 재조합 바이러스를 사용하고 형질감염을 위해 추가 외래 유전자 또는 유전자들을 포함하는 추가 벡터를 사용함으로써 반복될 수 있다.
대안적으로, 상기 기재된 바와 같은 감염 및 형질감염 단계는 상호교환 가능한, 즉 적합한 세포를 먼저 외래 유전자를 포함하는 플라스미드 벡터에 의해 형질감염시킨 다음, 폭스바이러스로 감염시킬 수 있다. 추가의 대안으로서, 각각의 외래 유전자를 상이한 바이러스에 도입하고, 수득된 모든 재조합 바이러스로 세포를 동시 감염시키고, 모든 외래 유전자를 포함하는 재조합을 스크리닝하는 것도 가능하다. 세 번째 대안은 시험관내에서 DNA 게놈 및 외래 서열의 결찰 및 헬퍼 바이러스를 사용한 재조합 백시니아 바이러스 DNA 게놈의 재구성이다. 네 번째 대안은 박테리아 인공 염색체(BAC)로 클로닝된 MVA와 같은 백시니아 바이러스 게놈과 백시니아 바이러스 게놈에서 원하는 통합 부위 측면에 있는 서열과 상동성인 DNA 서열 측면에 있는 선형 외래 서열 사이의 이. 콜리 또는 다른 박테리아 종에서의 상동 재조합이다.
이종 HBV 유전자(예를 들어, HBV 코어 항원, HBV pol 항원, 및/또는 HBV 표면 항원)는 하나 이상의 폭스바이러스 프로모터의 제어 하에 있을 수 있다(즉, 작동적으로 연결됨). 본 출원의 일 실시양태에서, 폭스바이러스 프로모터는 Pr7.5 프로모터, 하이브리드 초기/후기 프로모터, 또는 PrS 프로모터, PrS5E 프로모터, 합성 또는 천연 초기 또는 후기 프로모터, 또는 우두 바이러스 ATI 프로모터이다.
RNA 레플리콘
바람직하게는, 벡터는 자가-복제 RNA 레플리콘이다. 본원에 사용된 바와 같이, "자가-증폭 RNA 분자" 또는 "RNA 레플리콘" 또는 "레플리콘 RNA" 또는 "saRNA"와 상호교환적으로 사용되는 "자가-복제 RNA 분자"는 인간, 포유동물, 또는 동물 세포일 수 있는, 허용 세포 내에서 그 자신의 증폭 또는 자가-복제를 지시하는데 필요한 모든 유전 정보를 포함하는 RNA를 지칭한다. 자가-복제 RNA 분자는 mRNA와 유사하다. 단일-가닥, 5'-캡핑 및 3'-폴리-아데닐화이며 양성 방향이다. 자체 복제를 지시하기 위해, RNA 분자는 1) RNA 증폭 과정을 촉매하기 위해 바이러스 또는 숙주 세포 유래 단백질, 핵산 또는 리보핵단백질과 상호작용할 수 있는 폴리머라제, 레플리카제 또는 기타 단백질을 인코딩하고; 2) 서브게놈 레플리콘-인코딩된 RNA의 복제 및 전사에 필요한 시스-작용 RNA 서열을 포함한다. 따라서, 전달된 RNA는 여러 딸 RNA의 생성을 유발한다. 이러한 딸 RNA뿐만 아니라 동일선상의 서브게놈 전사체는 관심 있는 유전자의 동일 반응계내 발현을 제공하기 위해 스스로 번역될 수 있거나, 관심 있는 유전자의 동일 반응계내 발현을 제공하도록 번역되는 전달된 RNA와 동일한 의미로 추가 전사체를 제공하도록 전사될 수 있다. 이 전사 서열의 전반적인 결과는 도입된 레플리콘 RNA의 수가 크게 증폭되므로 관심 있는 인코딩된 유전자가 세포의 주요 폴리펩타이드 산물이 된다.
RNA 레플리콘은 1) RNA 증폭 과정을 촉매하기 위해 바이러스 또는 숙주 세포-유래 단백질, 핵산 또는 리보핵단백질과 상호작용할 수 있는 RNA-의존성 RNA 폴리머라제, 및 비구조 단백질 nsP1, nsP2, nsP3, nsP4를 인코딩하고; 2) 게놈 및 서브게놈 RNA의 복제 및 전사에 필요한 시스-작용 RNA 서열, 예컨대 3' 및 5' 비번역 영역(UTR; 비구조 단백질-매개 증폭을 위한 알파바이러스 뉴클레오티드 서열) 및/또는 서브게놈 프로모터를 포함한다. 이들 서열은 자기-인코딩된 단백질 또는 자가-인코딩되지 않은 세포-유래 단백질, 핵산 또는 리보핵단백질, 또는 임의의 이들 구성요소 간의 복합체에 복제 과정 동안 결합될 수 있다. 일부 실시양태에서, 변형된 RNA 레플리콘 분자는 전형적으로 하기 순서로 요소를 함유한다: 복제를 위해 시스에 필요한 5' 바이러스 RNA 서열(들) (예를 들어 5' UTR 및 5' CSE), 생물학적 활성 비구조 단백질을 코딩하는 서열(예를 들어, nsP1234), 서브게놈 RNA를 전사하기 위한 프로모터, 복제를 위해 시스에 필요한 3' 바이러스 서열(예를 들어 3' UTR), 및 폴리아데닐레이트 구역(tract), 및 선택적으로, 서브게놈 프로모터의 제어 후 또는 제어 하에 이종 단백질 또는 펩타이드를 인코딩하는 서열 (또는 2개 이상의 서열). 또한, 용어 RNA 레플리콘은 양성 센스 (또는 메시지 센스) 분자를 지칭할 수 있고, RNA 레플리콘은 임의의 공지된, 천연-발생 RNA 바이러스의 길이와 상이한 길이일 수 있다. 본 개시내용의 임의의 실시양태에서, RNA 레플리콘은 적어도 하나 (또는 모두)의 구조적 바이러스 단백질(예를 들어, 뉴클레오캡시드 단백질 C, 및 외피 단백질 P62, 6K, 및 E1)의 서열(들)이 결여될 수 있다(또는 포함하지 않을 수 있다). 이들 실시양태에서, 하나 이상의 구조 유전자를 인코딩하는 서열은, 예를 들어, 적어도 하나의 이종 단백질 또는 펩타이드 (또는 다른 관심 있는 유전자(GOI))에 대한 코딩 서열과 같은 하나 이상의 이종 서열로 치환될 수 있다.
특정 실시양태에서, 본 출원의 RNA 레플리콘은 5'-말단에서 3'-말단의 순서로 하기를 포함한다: (1) RNA 바이러스의 비구조 단백질-매개 증폭에 필요한 5' 비번역 영역(5'-UTR); (2) RNA 바이러스의 비구조 단백질 중 적어도 하나, 바람직하게는 모두를 인코딩하는 폴리뉴클레오티드 서열; (3) RNA 바이러스의 서브게놈 프로모터; (4) HBV 항원을 인코딩하는 폴리뉴클레오티드 서열; 및 (5) RNA 바이러스의 비구조 단백질-매개 증폭에 필요한 3' 비번역 영역(3'-UTR).
특정 실시양태에서, 자가-복제 RNA 분자는 RNA-의존성 RNA-폴리머라제 기능, 헬리카제, 캡핑, 및 폴리아데닐화 활성을 포함하는 자가-증폭을 위한 효소 복합체(레플리카제 다단백질)를 인코딩한다. 서브게놈 프로모터의 제어 하에 있는 레플리카제의 다운스트림에 있는 바이러스 구조 유전자는 HBV 항원으로 대체될 수 있다. 형질감염 시, 레플리카제는 즉시 번역되고, 게놈 RNA의 5' 및 3' 말단과 상호작용하고, 상보적인 게놈 RNA 카피를 합성한다. 이들은 새로운 양성 가닥, 캡핑 및 폴리-아데닐화 게놈 카피 및 하위게놈 전사체의 합성을 위한 주형 역할을 한다. 증폭은 결국 세포당 2 × 105개 이하의 카피의 매우 높은 RNA 카피 수를 유발한다. 따라서, 기존의 mRNA에 비해 훨씬 더 적은 양의 saRNA만으로도 효과적인 유전자 전달 및 보호 백신접종을 달성하기에 충분하다(Beissert et al., Hum Gene Ther. 2017, 28 (12): 1138-1146).
서브게놈 RNA는 이것이 유래된 게놈 RNA보다 작은 길이 또는 크기의 RNA 분자이다. 바이러스 서브게놈 RNA는 내부 프로모터로부터 전사될 수 있으며, 그의 서열은 게놈 RNA 또는 이의 보체 내에 존재한다. 서브게놈 RNA의 전사는 숙주 세포-인코딩된 단백질, 리보핵단백질(들) 또는 이들의 조합과 관련된 바이러스-인코딩된 폴리머라제(들)에 의해 매개될 수 있다. 수많은 RNA 바이러스는 이들의 3'-근위 유전자의 발현을 위해 서브게놈 mRNA(sgRNA)를 생성한다.
본 개시내용의 일부 실시양태에서, HBV 항원은 서브게놈 프로모터의 제어 하에 발현된다. 특정 실시양태에서, 천연 서브게놈 프로모터 대신에, 서브게놈 RNA는 뇌심근염 바이러스(EMCV), 소 바이러스성 설사 바이러스(BVDV), 폴리오바이러스, 구제역 바이러스(FMD), 엔테로바이러스 71(EV71), 또는 C형 간염 바이러스로부터 유래된 내부 리보솜 진입 부위(IRES)의 제어 하에 놓일 수 있다. 서브게놈 프로모터는 24개의 뉴클레오티드(신드비스 바이러스)에서 100개 초과의 뉴클레오티드(비트 괴사성 황정맥 바이러스) 범위이며 일반적으로 전사 개시의 상부스트림에서 발견된다.
일부 실시양태에서, RNA 레플리콘은 적어도 1개, 적어도 2개, 적어도 3개, 또는 적어도 4개의 비구조적 바이러스 단백질(예를 들어 nsP1, nsP2, nsP3, nsP4)에 대한 코딩 서열을 포함한다. 알파바이러스 게놈은 비구조 단백질 nsP1, nsP2, nsP3 및 nsP4를 인코딩하며, 이는 단일 다단백질 전구체로 생성되며 때때로 P1234 (또는 nsP1-4 또는 nsP1234)로 지정되며 단백질 분해 처리를 통해 성숙한 단백질로 절단된다. nsP1은 크기가 약 60 kDa일 수 있으며 메틸트랜스퍼라제 활성을 가질 수 있으며 바이러스 캡핑 반응에 관여할 수 있다. nsP2는 약 90 kDa의 크기를 가지며 헬리카제 및 프로테아제 활성을 가질 수 있는 반면, nsP3은 약 60 kDa이며 매크로도메인, 중심 (또는 알파바이러스 고유) 도메인 및 초가변 도메인(HVD)의 세 가지 도메인을 포함한다. nsP4는 크기가 약 70 kDa이고 코어 RNA-의존성 RNA 폴리머라제(RdRp) 촉매 도메인을 포함한다. 감염 후, 알파바이러스 게놈 RNA는 개별 단백질로 절단된 P1234 다단백질을 생성하도록 번역된다. 본원의 핵산 또는 폴리펩타이드 서열, 예를 들어 nsP1, nsP2, nsP3, nsP4의 서열을 개시함에 있어서, 본래의 서열에 기초하거나 이로부터 유래된 것으로 간주되는 서열 또한 개시된다.
일부 실시양태에서, RNA 레플리콘은 적어도 하나의 비구조적 바이러스 단백질의 일부에 대한 코딩 서열을 포함한다. 예를 들어, RNA 레플리콘은 적어도 하나의 비구조적 바이러스 단백질에 대한 인코딩 서열의 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 100%, 또는 이들 값 중 임의의 둘 사이의 범위를 포함할 수 있다. 일부 실시양태에서, RNA 레플리콘은 적어도 하나의 비구조적 바이러스 단백질의 실질적인 부분에 대한 코딩 서열을 포함할 수 있다. 본원에 사용된 바와 같이, 비구조적 바이러스 단백질을 인코딩하는 핵산 서열의 "실질적인 부분"은 당업자에 의한 서열의 수동 평가에 의해, 또는 BLAST와 같은 알고리즘을 사용한 컴퓨터 자동 서열 비교 및 식별에 의해, 해당 단백질의 추정적 식별을 제공하기에 충분한 비구조적 바이러스 단백질을 인코딩하는 핵산 서열을 포함한다(예를 들어, 문헌["Basic Local Alignment Search Tool"; Altschul S F et al., J. Mol. Biol. 215:403-410, 1993] 참조). 일부 실시양태에서, RNA 레플리콘은 적어도 하나의 비구조 단백질에 대한 전체 코딩 서열을 포함할 수 있다. 일부 실시양태에서, RNA 레플리콘은 천연 바이러스 비구조 단백질에 대한 실질적으로 모든 코딩 서열을 포함한다. 특정 실시양태에서, 하나 이상의 비구조적 바이러스 단백질은 동일한 바이러스로부터 유래된다. 다른 실시양태에서, 하나 이상의 비구조 단백질은 상이한 바이러스로부터 유래된다.
RNA 레플리콘은 알파바이러스 또는 플라비바이러스와 같은 임의의 적합한 플러스-가닥 RNA 바이러스로부터 유래될 수 있다. 바람직하게는, RNA 레플리콘은 알파바이러스로부터 유래된다. 용어 "알파바이러스"는 토가비리대(Togaviridae) 과의 외피가 있는 단일-가닥 양성 센스 RNA 바이러스를 기술한다. 알파 바이러스 속에는 대략 30종의 구성원이 포함되어 있어 인간과 다른 동물을 감염시킬 수 있다. 알파바이러스 입자는 전형적으로 직경이 70 nm이고, 구형 또는 약간 다형성인 경향이 있고, 40 nm 아이소메트릭 뉴클레오캡시드를 갖는다. 알파바이러스의 총 게놈 길이는 11,000개와 12,000개 뉴클레오티드 사이의 범위이며 5' 캡 및 3' 폴리-A 테일을 가지고 있다. 게놈에는 비구조적(ns)과 구조적인 2개의 오픈 리딩 프레임(ORF)이 있다. ns ORF는 바이러스 RNA의 전사 및 복제에 필요한 단백질(nsP1-nsP4)을 인코딩한다. 구조적 ORF는 3개의 구조 단백질을 인코딩한다: 코어 뉴클레오캡시드 단백질 C, 및 이종 이량체로서 회합하는 외피 단백질 P62 및 E1. 바이러스 막-고정 표면 당단백질은 수용체 인식 및 막 융합을 통한 표적 세포로의 진입을 담당한다. 4개의 ns 단백질 유전자는 게놈의 5' 2/3에 있는 유전자에 의해 인코딩되는 반면, 3개의 구조 단백질은 게놈의 3' 1/3과 동일 선상에 있는 서브게놈 mRNA에서 번역된다.
일부 실시양태에서, 본 발명에 유용한 자가-복제 RNA는 알파바이러스 종으로부터 유래된 RNA 레플리콘이다. 일부 실시양태에서, 알파바이러스 RNA 레플리콘은 VEEV/EEEV 그룹, 또는 SF 그룹, 또는 SIN 그룹에 속하는 알파바이러스이다. SF 그룹 알파바이러스의 비제한적인 예는 셈리키 포레스트 바이러스, 오니옹-니옹 바이러스, 로스 리버 바이러스, 미들버그 바이러스, 치쿤구니야 바이러스, 바마 포레스트 바이러스, 게타 바이러스, 마야로 바이러스, 사기야마 바이러스, 베바루 바이러스, 및 Una 바이러스를 포함한다. SIN 그룹 알파바이러스의 비제한적인 예는 신드비스 바이러스, 거드우드 S.A. 바이러스, 남아프리카 아르보바이러스 번호 86, 오켈보 바이러스, 아우라 바이러스, 바반키 바이러스, 와타로아 바이러스, 및 키질라가크 바이러스를 포함한다. VEEV/EEEV 그룹 알파바이러스의 비제한적인 예는 동부 말 뇌염 바이러스(EEEV), 베네수엘라 말 뇌염 바이러스(VEEV), 에버글레이즈 바이러스(EVEV), 무캄보 바이러스(MUCV), 픽수나 바이러스(PIXV), 미들버그 바이러스(MIDV), 치쿤구니야 바이러스(CHIKV), 오니옹-니옹 바이러스(ONNV), 로스 리버 바이러스(RRV), 바마 포레스트 바이러스(BF), 게타 바이러스(GET), 사기야마 바이러스(SAGV), 베바루 바이러스(BEBV), 마야로 바이러스(MAYV), 및 Una 바이러스(UNAV)를 포함한다.
알파바이러스 종의 비제한적인 예는 동부 말 뇌염 바이러스(EEEV), 베네수엘라 말 뇌염 바이러스(VEEV), 에버글레이즈 바이러스(EVEV), 무캄보 바이러스(MUCV), 셈리키 포레스트 바이러스(SFV), 픽수나 바이러스(PIXV), 미들버그 바이러스(MIDV), 치쿤구니야 바이러스(CHIKV), 오니옹-니옹 바이러스(ONNV), 로스 리버 바이러스(RRV), 바마 포레스트 바이러스(BF), 게타 바이러스(GET), 사기야마 바이러스(SAGV), 베바루 바이러스(BEBV), 마야로 바이러스(MAYV), Una 바이러스(UNAV), 신드비스 바이러스(SINV), 아우라 바이러스(AURAV), 와타로아 바이러스(WHAV), 바반키 바이러스(BABV), 키질라가크 바이러스(KYZV), 서부 말 뇌염 바이러스(WEEV), 하이랜드 J 바이러스(HJV), 포트 모건 바이러스(FMV), Ndumu(NDUV), 및 버기 크릭 바이러스를 포함한다. 독성 및 비독성 알파바이러스 균주가 둘 모두 적합하다. 일부 실시양태에서, 알파바이러스 RNA 레플리콘은 신드비스 바이러스(SIN), 셈리키 포레스트 바이러스(SFV), 로스 리버 바이러스(RRV), 베네수엘라 말 뇌염 바이러스(VEEV), 또는 동부 말 뇌염 바이러스(EEEV)이다. 일부 실시양태에서, 알파바이러스 RNA 레플리콘은 베네수엘라 말 뇌염 바이러스(VEEV)이다.
특정 실시양태에서, 자가-복제 RNA 분자는 하나 이상의 비구조 단백질 nsP1-4를 인코딩하는 폴리뉴클레오티드, 서브게놈 프로모터, 예컨대 26S 서브게놈 프로모터, 및 본원에 기재된 HBV 항원을 인코딩하는 관심 있는 유전자 또는 이의 단편을 포함한다.
자가-복제 RNA 분자는 5' 캡(예를 들어, 7-메틸구아노신)을 가질 수 있다. 이 캡은 RNA의 생체내 번역을 향상시킬 수 있다.
본 발명에 유용한 자가-복제 RNA 분자의 5' 뉴클레오티드는 5' 트리포스페이트 기를 가질 수 있다. 캡핑된 RNA에서 이것은 5'-대-5' 브릿지를 통해 7-메틸구아노신에 연결될 수 있다. 5' 트리포스페이트는 RIG-I 브릿징을 향상시킬 수 있다.
자가-복제 RNA 분자는 3' 폴리-A 테일을 가질 수 있다. 또한 이의 3' 말단 근처에 폴리-A 폴리머라제 인식 서열(예를 들어, AAUAAA)을 포함할 수 있다.
본 개시내용의 임의의 실시양태에서, RNA 레플리콘은 적어도 하나 (또는 모두)의 구조적 바이러스 단백질(예를 들어, 뉴클레오캡시드 단백질 C, 및 외피 단백질 P62, 6K, 및 E1)의 코딩 서열(들)이 결여될 수 있다 (또는 포함하지 않을 수 있다). 이들 실시양태에서, 하나 이상의 구조적 유전자를 인코딩하는 서열은, 예를 들어, 본원에 기재된 HBV 항원 또는 이의 단편에 대한 코딩 서열과 같은 하나 이상의 이종 서열로 치환될 수 있다.
특정 실시양태에서, 본 출원의 자가-복제 RNA 벡터는 선천적 면역계에 의한 번역 억제에 대한 내성을 부여하거나 그렇지 않으면 GOI(예를 들어, HBV 항원)의 발현을 증가시키는 하나 이상의 특징을 포함한다.
특정 실시양태에서, RNA 서열은 번역 효율을 개선하기 위해 코돈 최적화될 수 있다. RNA 분자는, 예를 들어, 적어도 30개의 아데노신 잔기의 폴리A 테일을 추가하고/하거나; 변형된 리보뉴클레오티드로 5-말단을 캡핑하는 것과 같이 안정성 및/또는 번역을 향상시키기 위해 본 개시내용의 관점에서 당업계에 알려진 임의의 방법에 의해 변형될 수 있으며, 이는 RNA 합성 동안 혼입되거나 RNA 전사 후에 효소적으로 조작될 수 있다.
특정 실시양태에서, 본 출원의 RNA 레플리콘은 5'-말단에서 3'-말단의 순서로 하기를 포함한다: (1) 알파바이러스 5' 비번역 영역(5'-UTR), (2) 알파바이러스 비구조적 유전자 nsp1의 5' 복제 서열, (3) 바이러스 종의 다운스트림 루프(DLP) 모티프, (4) 제4 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열, (5) 알파바이러스 비구조 단백질 nsp1, nsp2, nsp3 및 nsp4를 인코딩하는 폴리뉴클레오티드 서열, (6) 알파바이러스 서브게놈 프로모터, (7) 본 출원의 하나 이상의 HBV 항원을 인코딩하는 비-천연 발생 폴리뉴클레오티드 서열, (8) 알파바이러스 3' 비번역 영역(3' UTR), 및 (9) 선택적으로, 폴리아데노신 서열.
특정 실시양태에서, 본 출원의 자가-복제 RNA 벡터는 바이러스 종의 다운스트림 루프(DLP) 모티프를 포함한다. 본원에 사용된 바와 같이, "다운스트림 루프" 또는 "DLP 모티프"는 적어도 하나의 RNA 스템-루프를 포함하는 폴리뉴클레오티드 서열을 지칭하며, 이는 오픈 리딩 프레임(ORF)의 개시 코돈의 다운스트림에 배치될 때 DLP 모티프가 없는 달리 동일한 작제물에 비해 ORF의 증가된 번역을 제공한다. 예를 들어, 알파바이러스 속의 구성원은 바이러스 26S 전사체 내에 존재하는 탁월한 RNA 구조를 통해 항바이러스 RNA-활성화 단백질 키나아제(PKR)의 활성화에 저항할 수 있으며, 이는 이러한 mRNA의 eIF2-독립적인 번역 개시를 허용한다. 다운스트림 루프(DLP)로 불리는 이 구조는 SINV 26S mRNA의 AUG로부터 다운스트림에 위치한다. DLP는 셈리키 포레스트 바이러스(SFV)에서도 검출된다. 유사한 DLP 구조가 뉴 월드(New World) (예를 들어, MAYV, UNAV, EEEV(NA), EEEV(SA), AURAV) 및 올드 월드(Old World) (SV, SFV, BEBV, RRV, SAG, GETV, MIDV, CHIKV, 및 ONNV) 구성원을 포함하는 알파바이러스 속의 적어도 14개의 다른 구성원에 존재하는 것으로 보고되었다. 이들 알파바이러스 26S mRNA의 예측된 구조는 SHAPE(선택적 2'-하이드록실 아실화 및 프라이머 확장) 데이터(Toribio et al., Nucleic Acids Res. May 19; 44(9):4368-80, 2016)를 기초로 작제었으며, 그 내용은 본원에 참조로 포함된다. CHIKV 및 ONNV를 제외한 모든 경우에서 안정적인 스템-루프 구조가 검출된 반면, MAYV 및 EEEV는 안정성이 낮은 DLP를 나타냈다(Toribio et al., 2016 supra). 신드비스 바이러스의 경우, DLP 모티프는 신드비스 서브게놈 RNA의 처음 150 nt에서 발견된다. 헤어핀은 신드비스 캡시드 AUG 개시 코돈의 하부스트림에 위치한다(AUG는 신드비스 서브게놈 RNA의 nt 50에서 대조된다). 서열 비교 및 구조 RNA 분석에 대한 이전의 연구는 SINV에서 DLP의 진화적 보존을 밝혀냈고, 알파바이러스 속의 많은 구성원에서 등가의 DLP 구조의 존재를 예측하였다(예를 들어, 문헌[Ventoso, J. Virol. 9484-9494, Vol. 86, September 2012] 참조). DLP 모티프를 포함하는 자가-복제 RNA 벡터의 예는 미국 특허 출원 공개 US2018/0171340 및 국제 특허 출원 공개 WO2018106615에 기재되어 있으며, 그 내용은 그 전체가 본원에 참조로 포함된다. 일부 실시양태에서, 본 출원의 레플리콘 RNA는 서열번호 57에 제시된 서열과 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 나타내는 DLP 모티프를 포함한다.
일 실시양태에서, 자가-복제 RNA 분자는 또한 DLP 모티프의 다운스트림과 비구조 단백질(예를 들어, nsp1-4 중 하나 이상) 또는 관심 있는 유전자(예를 들어, 본원에 기재된 HBV 항원)의 코딩 서열의 다운스트림에 작동적으로 연결된 오토프로테아제 펩타이드에 대한 코딩 서열을 함유한다. 오토프로테아제 펩타이드의 예는 돼지 테스코바이러스-1 2A(P2A), 구제역 바이러스(FMDV) 2A(F2A), 말 비염 A 바이러스(ERAV) 2A(E2A), 테세아 아시그나 바이러스 2A(T2A), 세포질 다각체병 바이러스 2A(BmCPV2A), 무름병 바이러스 2A(BmIFV2A), 및 이들의 조합을 포함하지만 이에 제한되지 않는다. 일부 실시양태에서, 본 출원의 레플리콘 RNA는 서열번호 11의 아미노산 서열을 갖는 P2A에 대한 코딩 서열을 포함한다. 바람직하게는, 코딩 서열은 서열번호 12에 제시된 서열과 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 나타낸다.
본 발명의 임의의 레플리콘은 또한 5' 및 3' 비번역 영역(UTR)을 포함할 수 있다. UTR은 야생형 뉴 월드 또는 올드 월드 알파바이러스 UTR 서열, 또는 이들 중 임의의 것으로부터 유래된 서열일 수 있다. 다양한 실시양태에서, 5' UTR은 60 nt 또는 50-70 nt 또는 40-80 nt와 같은 임의의 적합한 길이일 수 있다. 일부 실시양태에서, 5' UTR은 또한 보존된 1차 또는 2차 구조(예를 들어, 하나 이상의 스템-루프(들))를 가질 수 있고, 알파바이러스 또는 레플리콘 RNA의 복제에 참여할 수 있다. 일부 실시양태에서 3' UTR은 수백 개 이하의 뉴클레오티드일 수 있으며, 예를 들어, 50-900 또는 100-900 또는 50-800 또는 100-700 또는 200-700 nt일 수 있다. '3 UTR은 또한 2차 구조, 예를 들어, 스텝 루프를 가질 수 있고, 폴리아데닐레이트 구역 또는 폴리-A 테일이 후속될 수 있다. 본 발명의 임의의 실시양태에서, 5' 및 3' 비번역 영역은 레플리콘에 의해 인코딩된 임의의 다른 서열에 작동적으로 연결될 수 있다. UTR은 다른 인코딩된 서열의 인식 및 전사에 필요한 서열 및 간격을 제공함으로써 프로모터 및/또는 이종 단백질 또는 펩타이드를 인코딩하는 서열에 작동적으로 연결될 수 있다. 본 개시내용의 관점에서 당업자에게 알려진 임의의 폴리아데닐화 신호가 사용될 수 있다. 예를 들어, 폴리아데닐화 신호는 SV40 폴리아데닐화 신호, LTR 폴리아데닐화 신호, 소 성장 호르몬(bGH) 폴리아데닐화 신호, 인간 성장 호르몬(hGH) 폴리아데닐화 신호, 또는 인간 β-글로빈 폴리아데닐화 신호일 수 있다.
또 다른 실시양태에서, 본 출원의 자가-복제 RNA 레플리콘은 변형된 5' 비번역 영역(5'-UTR)을 포함하고, 바람직하게는 RNA 레플리콘은 바이러스 구조 단백질을 인코딩하는 핵산 서열의 적어도 일부가 결여되어 있다. 예를 들어, 변형된 5'-UTR은 위치 1, 2, 4, 또는 이들의 조합에서 하나 이상의 뉴클레오티드 치환을 포함할 수 있다. 바람직하게는, 변형된 5'-UTR은 위치 2에서의 뉴클레오티드 치환을 포함하고, 보다 바람직하게는, 변형된 5'-UTR은 위치 2에서의 U->G 또는 U->A 치환을 갖는다. 이러한 자가-복제 RNA 분자의 예는 미국 특허 출원 공개 US2018/0104359 및 국제 특허 출원 공개 WO2018075235에 기재되어 있으며, 그 내용은 그 전체가 본원에 참조로 포함된다. 일부 실시양태에서, 본 출원의 레플리콘 RNA는 서열번호 55에 제시된 서열과 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 나타내는 5'-UTR을 포함한다.
일부 실시양태에서, 본 출원의 RNA 레플리콘은 5'-말단에서 3'-말단의 순서로 하기를 포함한다: (1) 서열번호 55의 폴리뉴클레오티드 서열을 갖는 5'-UTR, (2) 서열번호 56의 폴리뉴클레오티드 서열을 갖는 5' 복제 서열, (3) 서열번호 57의 폴리뉴클레오티드 서열을 포함하는 DLP 모티프, (4) 서열번호 11의 P2A 서열을 인코딩하는 폴리뉴클레오티드 서열, (5) 각각 서열번호 58, 서열번호 59, 서열번호 60 및 서열번호 61의 핵산 서열을 갖는 알파바이러스 비구조 단백질 NSP1, NSP2, NSP3 및 NSP4를 인코딩하는 폴리뉴클레오티드 서열, (6) 서열번호 62의 폴리뉴클레오티드 서열을 갖는 서브게놈 프로모터, (7) 본원에 기재된 비-천연 발생 폴리뉴클레오티드 서열, 및 (8) 서열번호 63의 폴리뉴클레오티드 서열을 갖는 3' UTR. 일부 실시양태에서, P2A 서열을 인코딩하는 폴리뉴클레오티드 서열은 서열번호 12를 포함하고, 비-천연 발생 폴리뉴클레오티드 서열은 서열번호 15 내지 54 중 어느 하나의 폴리뉴클레오티드 서열을 포함하고, RNA 레플리콘은 폴리아데노신 서열을 추가로 포함한다. 바람직하게는, 폴리아데노신 서열은 레플리콘의 3'-말단에 서열번호 64의 서열을 갖는다.
일부 바람직한 실시양태에서, 본 출원의 RNA 레플리콘은 서열번호 65 내지 72 중 어느 하나의 폴리뉴클레오티드 서열을 포함한다.
일부 실시양태에서, 본 출원의 RNA 레플리콘은 신호 펩타이드 서열을 인코딩하는 폴리뉴클레오티드 서열을 포함한다. 바람직하게는, 신호 펩타이드 서열을 인코딩하는 폴리뉴클레오티드 서열은 HBV 항원, 예컨대 HBV PreS1 항원, HBV 코어 항원 및 HBV pol 항원을 인코딩하는 폴리뉴클레오티드 서열의 업스트림 또는 5'-말단에 위치한다. 신호 펩타이드는 전형적으로 단백질의 국소화를 지시하고, 단백질이 생성되는 세포로부터 단백질의 분비를 촉진하고/하거나 항원 발현 및 항원-제시 세포에 대한 교차 제시를 개선한다. 신호 펩타이드는 벡터로부터 발현될 때 HBV 항원의 N-말단에 존재할 수 있지만, 예를 들어, 세포로부터 분비 시 신호 펩티다아제에 의해 절단된다. 신호 펩타이드가 절단된 발현된 단백질은 종종 "성숙 단백질"로 지칭된다. 본 개시내용의 관점에서 당업계에 알려진 임의의 신호 펩타이드가 사용될 수 있다. 예를 들어, 신호 펩타이드는 시스타틴 S 신호 펩타이드; 면역글로불린(Ig) 분비 신호, 예컨대 시스타틴 S 신호 펩타이드, Ig 중쇄 감마 신호 펩타이드 SPIgG, Ig 중쇄 엡실론 신호 펩타이드 SPIgE, 또는 짧은 리더 펩타이드 서열일 수 있다. 신호 펩타이드의 예시적인 아미노산 서열은 서열번호 77에 나타낸다.
다양한 실시양태에서, 본원에 개시된 RNA 레플리콘은 조작된, 합성, 또는 재조합 RNA 레플리콘일 수 있다. 본원에 사용된 바와 같이, 재조합체라는 용어는 폴리뉴클레오티드의 인간 조작이거나 아무리 간접적이더라도 이로부터 초래되는 임의의 분자(예를 들어 DNA, RNA 등)를 의미한다. 비제한적인 예로서, cDNA는 시험관내 폴리머라제 반응(들)에 의해 생성되었거나, 링커가 부착되었거나, 클로닝 벡터 또는 발현 벡터와 같은 벡터에 통합된 모든 핵산 분자와 마찬가지로 재조합 DNA 분자이다. 비제한적인 예로서, 재조합 RNA 레플리콘은 다음 중 하나 이상일 수 있다: 1) 예를 들어, 화학적 또는 효소적 기술(예를 들어, 화학적 핵산 합성을 사용하거나, 복제, 중합, 엑소뉴클레오틱 분해, 엔도뉴클레오틱 분해, 결찰, 역전사, 전사를 위한 효소를 사용하여) 핵산 분자의 염기 변형(예를 들어, 메틸화 포함), 또는 재조합(상동 및 부위-특이적 재조합 포함)을 사용하여 시험관내에서 합성 또는 변형됨; 2) 자연에서 접합되지 않은 접합된 뉴클레오티드 서열; 3) 천연 발생 뉴클레오티드 서열에 대하여 하나 이상의 뉴클레오티드가 결여되도록 분자 클로닝 기술을 사용하여 조작됨; 및 4) 천연 발생 뉴클레오티드 서열에 대해 하나 이상의 서열 변화 또는 재배열을 갖도록 분자 클로닝 기술을 사용하여 조작됨.
RNA 레플리콘의 임의의 구성요소 또는 서열은 임의의 다른 구성요소 또는 서열에 작동적으로 연결될 수 있다. RNA 레플리콘의 구성요소 또는 서열은 숙주 세포 또는 처리된 유기체에서 적어도 하나의 이종 단백질 또는 펩타이드 (또는 생물치료제)의 발현 및/또는 레플리콘의 자가-복제 능력에 대해 작동적으로 연결될 수 있다. 용어 "작동적으로 연결된"은 이들의 일반적일 기능을 수행하도록 구성된 둘 이상의 서열 간의 기능적 연결을 나타낸다. 따라서, 코딩 서열에 작동적으로 연결된 프로모터 또는 UTR은 적절한 효소가 존재할 때 코딩 서열의 전사 및 발현에 영향을 미칠 수 있다. 프로모터는 이의 발현을 지시하는 기능을 하는 한 코딩 서열과 인접할 필요는 없다. 따라서, 이종 단백질 또는 펩타이드를 인코딩하는 RNA 서열과 조절 서열(예를 들어, 프로모터 또는 UTR) 사이의 작동 가능한 연결은 관심 있는 폴리뉴클레오티드의 발현을 허용하는 기능적 연결이다. 작동적으로 연결된 것은 또한 nsP1-4를 인코딩하는 서열, UTR, 프로모터 및 RNA 레플리콘에서 인코딩하는 다른 서열과 같은 서열을 지칭할 수 있고, 이는 이들이 생물치료제 분자의 전사 및 번역 및/또는 레플리콘의 복제를 가능하게 하도록 연결된다. UTR은 다른 인코딩된 서열의 리보솜에 의한 인식 및 번역에 필요한 서열 및 간격을 제공함으로써 작동적으로 연결될 수 있다.
본 발명의 RNA 레플리콘은 알파바이러스 게놈으로부터 유래될 수 있으며, 이는 이들이 알파바이러스 게놈의 구조적 특성 중 일부를 갖거나 이들과 유사하다는 것을 의미한다. 본 발명의 RNA 레플리콘은 변형된 알파바이러스 게놈일 수 있다. 본원에 개시된 레플리콘의 일부 실시양태에서, 레플리콘의 하나 이상의 서열이 "인 트랜스로" 제공될 수 있는데, 즉 레플리콘의 서열이 하나 초과의 RNA 분자 상에 제공된다. 다른 실시양태에서, 레플리콘의 모든 서열은 단일 RNA 분자 상에 존재하며, 이는 또한 본원에 기재된 바와 같이 치료될 포유동물에게 투여될 수 있다.
본원에 사용된 바와 같이, 핵산 또는 폴리펩타이드 서열에 대한 용어 "퍼센트 동일성" 또는 "상동성" 또는 "공유 서열 동일성" 또는 "퍼센트(%) 서열 동일성 "는 최대 퍼센트 동일성을 위해 서열을 정렬하고 필요한 경우 갭을 도입하여 최대 상동성 퍼센트를 달성한 후, 알려진 폴리뉴클레오티드 또는 폴리펩타이드와 동일한 후보 서열 내의 뉴클레오티드 또는 아미노산 잔기의 백분율로서 정의된다. N-말단 또는 C-말단 삽입 또는 결실은 상동성에 영향을 미치는 것으로 해석되지 않아야 하며, 내부 결실 및/또는 약 30개 미만, 약 20개 미만, 또는 약 10개 미만 또는 5개 미만의 아미노산 잔기의 뉴클레오티드 또는 폴리펩타이드 서열로의 삽입은 상동성에 영향을 미치는 것으로 해석되지 않아야 한다. 뉴클레오티드 또는 아미노산 서열 수준에서의 상동성 또는 동일성은 서열 유사성 검색을 위해 맞춤화된 프로그램 blastp, blastn, blastx, tblastn 및 tblastx (Altschul (1997), Nucleic Acids Res. 25, 3389-3402, and Karlin (1990), Proc. Natl. Acad. Sci. USA 87, 2264-2268)에 의해 사용된 알고리즘을 사용하는 BLAST(Basic Local Alignment Search Tool) 분석에 의해 결정될 수 있다. BLAST 프로그램에 의해 사용된 접근법은 먼저 쿼리 서열과 데이터베이스 서열 사이에서 간격이 있거나 없는 유사한 세그먼트를 고려한 다음, 식별된 모든 매칭의 통계적 유의성을 평가하고, 마지막으로 미리 선택된 유의성 임계값을 충족하는 매칭만 요약하는 것이다. 서열 데이터베이스의 유사성 검색에서 기본적인 문제에 대한 논의는 문헌[Altschul (1994), Nature Genetics 6, 119-129]을 참조한다. 히스토그램, 설명, 정렬, 예상(즉, 데이터베이스 서열에 대한 일치를 보고하기 위한 통계적 유의성 임계값), 컷오프, 매트릭스 및 필터(낮은 복잡도)에 대한 검색 매개변수는 기본 설정일 수 있다. blastp, blastx, tblastn 및 tblastx에 의해 사용되는 기본 스코어링 매트릭스는 BLOSUM62 매트릭스(Henikoff (1992), Proc. Natl. Acad. Sci. USA 89, 10915-10919)이며, 길이가 85 초과인 쿼리 서열(뉴클레오티드 염기 또는 아미노산)에 권장된다.
뉴클레오티드 서열을 비교하기 위해 설계된 blastn의 경우, 스코어링 매트릭스는 M(즉, 한 쌍의 매칭 잔기에 대한 보상 스코어) 대 N(즉, 미스매칭 잔기에 대한 페널티 스코어)의 비율에 의해 설정되며, 여기서 M 및 N에 대한 기본 값은 각각 +5 및 -4일 수 있다. 4개의 blastn 매개변수는 다음과 같이 조정할 수 있다: Q = 10(갭 생성 페널티); R = 10(갭 확장 페널티); wink = 1(쿼리를 따라 모든 wink번째 위치에서 단어 히트 생성); 및 gapw = 16(갭 정렬이 생성되는 윈도우 너비를 설정함). 아미노산 서열의 비교를 위한 동등한 Blastp 매개변수 설정은 다음과 같을 수 있다: Q = 9; R = 2; wink = 1; 및 gapw = 32. GCG 패키지 버전 10.0에서 사용할 수 있는 서열 간의 BESTFIT® 비교는 DNA 매개변수 GAP=50(갭 생성 페널티) 및 LEN = 3(갭 확장 페널티)을 사용할 수 있으며 단백질 비교에서 동등한 설정은 GAP = 8 및 LEN = 2일 수 있다.
본원의 핵산 또는 폴리펩타이드 서열, 예를 들어 바이러스 캡시드 인핸서, 오토프로테아제 펩타이드, 서브게놈 프로모터, 비구조 단백질, HBV 항원의 서열을 개시함에 있어서, 본래의 서열에 기초하거나 이로부터 유래된 것으로 간주되는 서열 또한 개시된다. 따라서, 개시된 서열은 서열번호 1 내지 90과 같은 본원에 기재된 임의의 폴리뉴클레오티드 또는 폴리펩타이드 서열의 전장 폴리뉴클레오티드 또는 폴리펩타이드 서열과 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 또는 적어도 85%, 예를 들어, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 89%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 또는 85-99% 또는 85-95% 또는 90-99% 또는 95-99% 또는 97-99% 또는 98-99% 서열 동일성을 갖는 폴리뉴클레오티드 또는 폴리펩타이드 서열 및 이의 단편을 포함한다. 본원에 개시된 임의의 서열의 단편 또는 일부가 또한 개시된다. 서열의 단편 또는 일부는 전체 서열의 적어도 5 또는 적어도 7 또는 적어도 10, 또는 적어도 20, 또는 적어도 30, 적어도 50, 적어도 75, 적어도 100, 적어도 125, 150 또는 5-10 또는 10-12 또는 10-15 또는 15-20 또는 20-40 또는 20-50 또는 30-50 또는 30-75 또는 30-100개 아미노산 또는 핵산 잔기, 또는 적어도 100 또는 적어도 200 또는 적어도 300 또는 적어도 400 또는 적어도 500 또는 적어도 600 또는 적어도 700 또는 적어도 800 또는 적어도 900 또는 적어도 1000 또는 100-200 또는 100-500 또는 100-1000 또는 500-1000개 아미노산 또는 핵산 잔기, 또는 이들 양 중 임의의 것을 갖지만 500 미만 또는 700 미만 또는 1000 미만 또는 2000개 미만의 연속 아미노산 또는 임의의 서열번호 1-90 또는 본원에 개시된 임의의 단편의 핵산을 갖는 서열을 포함할 수 있다. 예를 들어, 적어도 1개 또는 2개 또는 3개 또는 4개 또는 5개의 아미노산 잔기는 삽입 및 치환을 포함하는 개시된 서열(들) 및 그러한 변이체를 인코딩하는 핵산 서열에 및/또는 그 내에 N- 및/또는 C-말단에 삽입된 그러한 서열의 변이체가 또한 개시되어 있다. 고려되는 변이체는 추가적으로 또는 대안적으로, 예를 들어, 상동성 재조합 또는 부위-지시 또는 PCR 돌연변이유발에 의해 소정의 돌연변이를 포함하는 것들, 및 본원에 기재된 것들, 삽입 및 치환을 포함하는 폴리펩타이드 또는 핵산의 패밀리의 대립유전자 또는 다른 천연 발생 변이체; 및/또는 유도체를 포함하지만 이에 제한되지 않는 다른 종의 상응하는 폴리펩타이드 또는 핵산을 포함할 수 있고, 여기서 폴리펩타이드는 삽입 및 치환을 포함하는 천연 발생 아미노산 이외의 모이어티(예를 들어, 효소와 같은 검출 가능한 모이어티)와의 치환, 화학적, 효소적 또는 다른 적절한 수단에 의해 공유적으로 변형되었다. 본원에 기재된 핵산 서열은 RNA 서열일 수 있다.
이종 단백질 및 펩타이드
본 발명의 RNA 레플리콘은 알파바이러스에 대해 이종성인 적어도 하나의 단백질 또는 펩타이드를 인코딩하는 RNA 서열을 포함할 수 있고, 또한 체내에서 RNA 서열을 발현하는 인간, 포유동물 또는 동물에 대해 이종성일 수 있다(반드시 그런 것은 아님). 임의의 실시양태에서, 레플리콘은 2개 또는 3개 또는 4개 이상의 이종 단백질 또는 펩타이드를 인코딩하는 RNA 서열(들)을 가질 수 있다. 일부 실시양태에서, 이종 단백질 또는 펩타이드는 본원에 기재된 바와 같이 HBV 항원이다. 임의의 실시양태에서, 이종 단백질 또는 펩타이드를 인코딩하는 서열은 레플리콘의 하나 이상의 다른 서열(예를 들어, 프로모터 또는 5' 또는 3' UTR 서열)에 작동적으로 연결될 수 있고, 이종 단백질 또는 펩타이드가 인간, 포유동물 또는 동물에서 발현되도록 서브게놈 프로모터의 제어 하에 있을 수 있다.
일 실시양태에서, 본 발명의 RNA 레플리콘은 이종 단백질 또는 펩타이드(예를 들어, 모노클로날 항체 또는 생물치료제 단백질 또는 펩타이드)를 인코딩하는 RNA 서열, 야생형 알파바이러스 nsP1, nsP2, nsP3, 및 nsP4 단백질 서열로부터 유래된 아미노산 서열을 인코딩하는 RNA 서열, 및 5' 및 3' UTR 서열(비구조 단백질-매개 증폭을 위한)을 가질 수 있다. RNA 레플리콘은 또한 5' 캡 및 폴리 아데닐레이트 (또는 폴리-A) 테일을 가질 수 있다.
이종 단백질 또는 펩타이드의 면역원성은 당업자에게 알려진 다수의 검정, 예를 들어, 에피토프-특이적 T-세포 집단에 의한 세포내 사이토카인 또는 분비된 사이토카인의 면역염색, 또는 에피토프-특이적 T 세포의 빈도 및 총 수를 정량화하고 이들의 분화 및 활성화 상태, 예를 들어, 수명이 짧은 이펙터 및 메모리 전구체 이펙터 CD8+ T 세포를 특성화함으로써 결정될 수 있다. 면역원성은 또한 항체-매개 면역 반응, 예를 들어, 혈청 IgA 또는 IgG 역가를 측정함으로써 항체의 생성을 측정함으로써 결정될 수 있다.
본 출원의 HBV 항원 이외에, 본 출원의 RNA 레플리콘은 선택적으로 사이토카인, 성장 인자, 면역글로불린, 모노클로날 항체(Fab 항원-결합 단편, Fc 융합 단백질 포함), 호르몬, 인터페론, 인터루킨, 조절 펩타이드 및 단백질을 포함하지만 이에 제한되지 않는 임의의 단백질 또는 펩타이드일 수 있는 하나 이상의 이종 단백질 또는 펩타이드를 추가로 인코딩할 수 있다.
일부 실시양태에서, 이종 단백질 또는 펩타이드는 5 kb 이하 또는 6 kb 이하 또는 7 kb 이하 또는 8 kb 이하, 또는 9 kb 이하 또는 10 kb 이하 또는 11 kb 이하 또는 12 kb 이하의 RNA 서열에 의해 인코딩될 수 있다. 이종 단백질은 또한 단일 사슬 항체 분자일 수 있다.
본 발명의 알파바이러스 레플리콘은 또한 이종 단백질 또는 펩타이드의 발현을 위한 서브게놈 프로모터를 가질 수 있다. 본원에 사용된 용어 "서브게놈 프로모터"는 바이러스 핵산의 서브게놈 mRNA의 프로모터를 지칭한다. 본원에 사용된 바와 같이, "알파바이러스 서브게놈 프로모터"는 알파바이러스 복제 과정의 일부로서 서브게놈 메신저 RNA의 전사를 지시하는 알파바이러스 게놈에서 본래 정의된 바와 같은 프로모터이다.
폴리뉴클레오티드, 유전자, 핵산, 폴리펩타이드, 단백질, 또는 효소와 관련하여 사용될 때 용어 "이종"은 숙주 종으로부터 유래되지 않은 폴리뉴클레오티드, 유전자, 핵산, 폴리펩타이드, 단백질, 또는 효소를 지칭한다. 예를 들어, 본원에 사용된 "이종 유전자" 또는 "이종 핵산 서열"은 그것이 도입되는 숙주 유기체의 종이 아닌 상이한 종으로부터의 유전자 또는 핵산 서열을 지칭한다. 이종 서열은 또한 합성일 수 있으며 유기체로부터 유래되지 않거나 자연에서 발견되지 않을 수 있다. 유전자 조절 서열 또는 유전자 서열의 발현을 조작하기 위해 사용되는 보조 핵산 서열(예를 들어, 5' 비번역 영역, 3' 비번역 영역, 폴리 A 부가 서열, 인트론 서열, 스플라이스 부위, 리보솜 결합 부위, 내부 리보솜 진입 서열, 게놈 상동성 영역, 재조합 부위 등) 또는 단백질 도메인 또는 단백질 국소화 서열을 인코딩하는 핵산 서열을 언급할 때, "이종"은 조절 또는 보조 서열 또는 단백질 도메인 또는 국소화 서열을 인코딩하는 서열이 조절 또는 보조 핵산 서열 또는 단백질 도메인 또는 국소화 서열을 인코딩하는 핵산 서열이 게놈, 염색체 또는 에피솜에서 병치되는 유전자와는 상이한 공급원으로부터 유래함을 의미한다. 따라서, 이의 자연 상태(예를 들어, 비유전적으로 조작된 유기체의 게놈에서)에서 작동적으로 연결되지 않은 유전자에 작동적으로 연결된 프로모터는 그것이 연결된 유전자와 동일한 종 (또는, 일부 경우에, 동일한 유기체)으로부터 유래될 수 있다 하더라도, 본원에서 "이종 프로모터"로서 지칭된다. 유사하게, 조작된 단백질의 단백질 국소화 서열 또는 단백질 도메인을 언급할 때, "이종"은 국소화 서열 또는 단백질 도메인이 유전자 조작에 의해 혼입되는 것과 상이한 단백질로부터 유래됨을 의미한다.
본원에 사용된 용어 "비-천연 발생" "재조합" 또는 "조작된" 핵산 분자 또는 폴리뉴클레오티드 서열은 인간 개입을 통해 변경된 핵산 분자 또는 비-천연 발생 폴리뉴클레오티드 서열을 지칭한다. 비제한적인 예로서, 재조합 핵산 분자는 1) 예를 들어, 화학적 또는 효소적 기술(예를 들어, 화학적 핵산 합성을 사용하거나, 복제, 중합, 엑소뉴클레오틱 분해, 엔도뉴클레오틱 분해, 결찰, 역전사, 전사를 위한 효소를 사용하여), 염기 변형(예를 들어, 메틸화 포함), 또는 핵산 분자의 재조합(상동성 및 부위-특이적 재조합 포함)을 사용하여 시험관내에서 합성 또는 변형되었고/되었거나; 2) 자연에서 접합되지 않은 접합된 뉴클레오티드 서열을 포함하고/하거나, 3) 천연 발생 핵산 분자 서열에 대하여 하나 이상의 뉴클레오티드가 결여되도록 분자 클로닝 기술을 사용하여 조작되었고/되었거나, 4) 천연 발생 핵산 서열에 대해 하나 이상의 서열 변경 또는 재배열을 갖도록 분자 클로닝 기술을 사용하여 조작되었다. 비제한적인 예로서, cDNA는 시험관내 폴리머라제 반응(들)에 의해 생성되었거나, 링커가 부착되었거나, 클로닝 벡터 또는 발현 벡터와 같은 벡터에 통합되거나 RNA 레플리콘에 통합된 모든 핵산 분자와 마찬가지로 재조합 DNA 분자이다.
일부 실시양태에서, 본 발명의 RNA 레플리콘은 5'-말단에서 3'-말단의 순서로 하기를 포함한다: RNA 바이러스의 비구조 단백질-매개 증폭에 필요한 5' 비번역 영역(5'-UTR); RNA 바이러스의 비구조 단백질의 적어도 하나, 바람직하게는 모두를 인코딩하는 폴리뉴클레오티드 서열; RNA 바이러스의 서브게놈 프로모터; 본원에 기재된 비-천연 발생 폴리뉴클레오티드 서열; 및 RNA 바이러스의 비구조 단백질-매개 증폭에 필요한 3' 비번역 영역(3'-UTR).
일부 실시양태에서, 본 발명의 RNA 레플리콘은 5'-말단에서 3'-말단의 순서로 하기를 포함한다: 알파바이러스 5' 비번역 영역(5'-UTR); 알파바이러스 비구조 유전자 NSP1의 5' 복제 서열; 바이러스 종의 다운스트림 루프(DLP) 모티프; 제4 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열; 알파바이러스 비구조 단백질 NSP1, NSP2, NSP3 및 NSP4를 인코딩하는 폴리뉴클레오티드 서열; 알파바이러스 서브게놈 프로모터; 본원에 기재된 비-천연 발생 폴리뉴클레오티드 서열; 알파바이러스 3' 비번역 영역(3' UTR); 및 선택적으로, 폴리 아데노신 서열.
일부 실시양태에서, DLP 모티프는 동부 말 뇌염 바이러스(EEEV), 베네수엘라 말 뇌염 바이러스(VEEV), 에버글레이즈 바이러스(EVEV), 무캄보 바이러스(MUCV), 셈리키 포레스트 바이러스(SFV), 픽수나 바이러스(PIXV), 미들버그 바이러스(MTDV), 치쿤구니야 바이러스(CHIKV), 오니옹-니옹 바이러스(ONNV), 로스 리버 바이러스(RRV), 바마 포레스트 바이러스(BF), 게타 바이러스(GET), 사기야마 바이러스(SAGV), 베바루 바이러스(BEBV), 마야로 바이러스(MAYV), Una 바이러스(U AV), 신드비스 바이러스(SINV), 아우라 바이러스(AURAV), 와타로아 바이러스(WHAV), 바반키 바이러스(BABV), 키질라가크 바이러스(KYZV), 서부 말 뇌염 바이러스(WEEV), 하이랜드 J 바이러스(HJV), 포트 모건 바이러스(FMV), Ndumu(NDUV), 및 버기 크릭 바이러스로 이루어진 군으로부터 선택된 바이러스 종으로부터 유래한다.
일부 실시양태에서, 제4 오토프로테아제 펩타이드는 돼지 테스코바이러스-1 2A(P2A), 구제역 바이러스(FMDV) 2A(F2A), 말 비염 A 바이러스(ERAV) 2A(E2A), 테세아 아시그나 바이러스 2A(T2A), 세포질 다각체병 바이러스 2A(BmCPV2A), 무름병 바이러스 2 A(BmIFV2A), 및 이들의 조합으로 이루어진 군으로부터 선택된다. 바람직하게는, 제4 오토프로테아제 펩타이드는 P2A의 펩타이드 서열을 포함한다. 일부 실시양태에서, 제4 오토프로테아제 펩타이드는 서열번호 11을 포함한다. 일부 실시양태에서, 제4 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열은 서열번호 12를 포함한다. 일부 실시양태에서, 제4 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열은 서열번호 12로 이루어진다.
일부 실시양태에서, 본 발명의 RNA 레플리콘은 5'-말단에서 3'-말단의 순서로 하기를 포함한다: 서열번호 55의 폴리뉴클레오티드 서열을 갖는 5'-UTR; 서열번호 56의 폴리뉴클레오티드 서열을 갖는 5' 복제 서열; 서열번호 57의 폴리뉴클레오티드 서열을 포함하는 DLP 모티프; 서열번호 11의 P2A 서열을 인코딩하는 폴리뉴클레오티드 서열; 각각 서열번호 58, 서열번호 59, 서열번호 60 및 서열번호 61의 핵산 서열에 의해 인코딩되는 것들과 같은 알파바이러스 비구조 단백질 NSP1, NSP2, NSP3 및 NSP4를 인코딩하는 폴리뉴클레오티드 서열; 서열번호 62의 폴리뉴클레오티드 서열을 갖는 서브게놈 프로모터; 본원에 개시된 비-천연 발생 폴리뉴클레오티드 서열; 및 서열번호 63의 폴리뉴클레오티드 서열을 갖는 3' UTR. 일부 실시양태에서, P2A 서열을 인코딩하는 폴리뉴클레오티드 서열은 서열번호 12를 포함하고, 비-천연 발생 폴리뉴클레오티드 서열은 서열번호 15 내지 54 중 어느 하나의 폴리뉴클레오티드 서열을 포함하고, RNA 레플리콘은 폴리아데노신 서열을 추가로 포함한다. 바람직하게는, 폴리 아데노신 서열은 레플리콘의 3'-말단에 서열번호 64의 서열을 갖는다.
일부 실시양태에서, 본 발명의 RNA 레플리콘은 서열번호 65 내지 72 중 어느 하나의 폴리뉴클레오티드 서열을 포함한다.
일부 실시양태에서, 본원에 개시된 RNA 레플리콘을 인코딩하는 폴리뉴클레오티드 서열을 포함하는 핵산 분자는 DNA 서열의 5'-말단에 작동적으로 연결된 T7 프로모터를 추가로 포함한다. 보다 바람직하게는, T7 프로모터는 서열번호 73의 뉴클레오티드 서열을 포함한다.
본원에 개시된 RNA 레플리콘을 인코딩하는 DNA 서열을 포함하는 핵산 분자를 전사하는 단계를 포함하는, 본 출원의 RNA 레플리콘을 생성하는 방법이 또한 제공된다. 일부 실시양태에서, 핵산 분자는 생체내에서 전사된다. 일부 실시양태에서, 핵산 분자는 시험관내에서 전사된다.
세포 및 폴리펩타이드
본 출원은 또한 본원에 기재된 임의의 폴리뉴클레오티드 및 벡터를 포함하는 세포, 바람직하게는 단리된 세포를 제공한다. 예를 들어, 세포는 재조합 단백질 생성 또는 바이러스 입자 생성을 위해 사용될 수 있다. 일부 실시양태에서, 세포는 RNA 레플리콘의 생성을 위해 사용될 수 있다.
RNA 레플리콘 또는 본 출원의 RNA 레플리콘을 인코딩하는 핵산을 포함하는 숙주 세포 또한 본 발명의 일부를 형성한다. HBV 항원은 숙주 세포, 예를 들어, 차이니즈 햄스터 난소(CHO) 세포, 종양 세포주, BHK 세포, 인간 세포주, 예컨대 HEK293 세포, PER.C6 세포, 또는 효모, 진균, 곤충 세포, 등 또는 형질전환 동물 또는 식물에서 분자의 발현을 포함하는 재조합 DNA 기술을 통해 생성될 수 있다. 특정 실시양태에서, 세포는 다세포 유기체로부터 유래하며, 특정 실시양태에서 이들은 척추동물 또는 무척추동물 기원이다. 특정 실시양태에서, 세포는 인간 세포, 또는 곤충 세포와 같은 포유동물 세포이다. 일반적으로, 숙주 세포에서 본 발명의 HBV 항원과 같은 재조합 단백질의 생성은 발현 가능한 형식으로 단백질을 인코딩하는 이종 핵산 분자를 숙주 세포에 도입하고, 핵산 분자의 발현에 도움이 되는 조건 하에 세포를 배양하고, 상기 세포에서 단백질의 발현을 허용하는 것을 포함한다. 발현 가능한 형식으로 단백질을 인코딩하는 핵산 분자는 발현 카세트의 형태일 수 있고, 일반적으로 인핸서(들), 프로모터, 폴리아데닐화 신호 등과 같은 핵산의 발현을 야기할 수 있는 서열을 필요로 한다. 당업자는 숙주 세포에서 유전자의 발현을 얻기 위해 다양한 프로모터가 사용될 수 있다는 것을 알고 있다. 프로모터는 구성적이거나 규제될 수 있고, 바이러스, 원핵생물 또는 진핵생물 공급원을 포함하는 다양한 공급원으로부터 얻어질 수 있거나, 인위적으로 설계될 수 있다. 추가의 조절 서열이 추가될 수 있다. 많은 프로모터가 전이유전자(들)의 발현을 위해 사용될 수 있고, 당업자에게 알려져 있으며, 예를 들어, 이들은 바이러스, 포유동물, 합성 프로모터 등을 포함할 수 있다. 진핵생물 세포에서 발현을 얻기 위한 적합한 프로모터의 비제한적인 예는 CMV-프로모터(US 5,385,839), 예를 들어, CMV 급초기 유전자 인핸서/프로모터로부터의 nt. -735 내지 +95를 포함하는 CMV 급초기 프로모터이다. 폴리아데닐화 신호, 예를 들어, 소 성장 호르몬 폴리A 신호(US 5,122,458)는 전이유전자(들) 뒤에 존재할 수 있다. 대안적으로, 몇몇 널리 사용되는 발현 벡터는 당업계에서 그리고 상업적 공급원, 예를 들어, 관심 있는 단백질을 재조합적으로 발현시키거나 적합한 프로모터 및/또는 전사 종결자 서열, 폴리A 서열 등을 얻기 위해 사용될 수 있는 Invitrogen의 pcDNA 및 pEF 벡터 시리즈, BD Sciences의 pMSCV 및 pTK-Hyg, Stratagene의 pCMV-Script 등으로부터 입수 가능하다.
세포 배양은 부착성 세포 배양, 예를 들어, 배양 용기의 표면 또는 마이크로캐리어에 부착된 세포뿐만 아니라 현탁 배양을 포함한 임의의 유형의 세포 배양일 수 있다. 대부분의 대규모 현탁액 배양은 이들이 운영 및 규모 확장이 가장 간단하기 때문에 배치 또는 유가 배치(fed-batch) 공정으로서 운영된다. 요즘에는, 관류 원리에 기초한 연속 공정이 점점 보편화되고 있으며 적합하기도 하다. 적합한 배양 배지는 또한 당업자에게 잘 알려져 있으며, 일반적으로 상업적 공급원으로부터 대량으로 입수할 수 있거나, 표준 프로토콜에 따라 맞춤 제작될 수 있다. 배양은, 예를 들어, 배치, 유가-배치, 연속 시스템 등을 사용하여 접시, 롤러 병 또는 생물반응기에서 수행될 수 있다. 세포 배양에 적합한 조건은 알려져 있다(예를 들어, 문헌[Tissue Culture, Academic Press, Kruse and Paterson, editors (1973), and R.I. Freshney, Culture of animal cells: A manual of basic technique, fourth edition (Wiley-Liss Inc., 2000, ISBN 0-471-34889-9)] 참조). 세포 배양 배지는 다양한 공급업체로부터 입수 가능하며, 숙주 세포가 관심 있는 단백질, 여기서는 HBV 항원을 발현하도록 적합한 배지를 일상적으로 선택할 수 있다. 적합한 배지는 혈청을 포함하거나 포함하지 않을 수 있다.
따라서, 본 출원의 실시양태는 또한 본 출원의 HBV 항원을 제조하는 방법에 관한 것이다. 상기 방법은 프로모터에 작동적으로 연결된 본 출원의 HBV 항원을 인코딩하는 폴리뉴클레오티드를 포함하는 발현 벡터로 숙주 세포를 형질감염시키는 단계, HBV 항원의 발현에 적합한 조건 하에 형질감염된 세포를 성장시키는 단계, 및 선택적으로 세포에서 발현된 HBV 항원을 정제 또는 단리하는 단계를 포함한다. HBV 항원은 친화성 크로마토그래피, 크기 배제 크로마토그래피 등을 포함하는 당업계에 알려진 임의의 방법에 의해 세포로부터 단리되거나 수집될 수 있다. 재조합 단백질 발현에 사용되는 기술은 본 개시내용의 관점에서 당업자에게 잘 알려져 있을 것이다. 발현된 HBV 항원은 또한, 예를 들어, HBV 항원을 인코딩하는 발현 벡터로 형질감염되고 HBV 항원의 발현에 적합한 조건 하에 성장된 세포의 상청액을 분석함으로써 발현된 단백질을 정제 또는 분리하지 않고 연구될 수 있다.
따라서, 서열번호 1, 서열번호 3, 서열번호 5, 서열번호 7, 84, 85 또는 86, 또는 서열번호 9의 아미노산 서열과 적어도 90% 동일한 아미노산 서열을 포함하는 비-천연 발생 또는 재조합 폴리펩타이드가 또한 제공된다. 상기 및 하기 기재된 바와 같이, 이들 서열을 인코딩하는 단리된 핵산 분자, 프로모터에 작동적으로 연결된 이들 서열을 포함하는 벡터, 및 폴리펩타이드, 폴리뉴클레오티드, 또는 벡터를 포함하는 조성물이 또한 본 출원에 의해 고려된다.
본 출원의 실시양태에서, 재조합 폴리펩타이드는 서열번호 1, 서열번호 3, 서열번호 5, 서열번호 7, 84, 85 또는 86, 또는 서열번호 9의 아미노산 서열과 적어도 90% 동일한, 예컨대 서열번호 1, 서열번호 3, 서열번호 5, 서열번호 7, 84, 85 또는 86, 또는 서열번호 9와 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함한다. 바람직하게는, 비-천연 발생 또는 재조합 폴리펩타이드는 서열번호 1, 서열번호 3, 서열번호 5, 서열번호 84, 85 또는 86, 또는 서열번호 9로 이루어진다.
조성물
본 출원은 또한 본 출원에 따른 하나 이상의 HBV 항원, 폴리뉴클레오티드 및/또는 하나 이상의 HBV 항원을 인코딩하는 벡터를 포함하는, 조성물, 약제학적 조성물, 면역원성 조합물, 및 보다 특히 백신에 관한 것이다. 본원에 기재된 본 출원의 임의의 HBV 항원, 폴리뉴클레오티드(RNA 및 DNA 포함), 및/또는 벡터는 본 출원의 조성물, 약제학적 조성물, 면역원성 조합물 및 백신에 사용될 수 있다.
본 출원은, 예를 들어, 약제학적으로 허용되는 담체와 함께 본원에 기재된 임의의 핵산 분자, 벡터, 또는 RNA 레플리콘을 포함하는 약제학적 조성물을 제공한다. 약제학적으로 허용되는 담체는 무독성이고, 활성 성분의 효능을 방해해서는 안된다. 약제학적으로 허용되는 담체는 하나 이상의 부형제, 예컨대 결합제, 붕해제, 팽윤제, 현탁화제, 유화제, 습윤제, 윤활제, 풍미제, 감미료, 방부제, 염료, 가용화제 및 코팅제를 포함할 수 있다. 담체 또는 기타 물질의 정확한 성질은 투여 경로, 예를 들어, 근육내, 피내, 피하, 경구, 정맥내, 피부, 점막내(예를 들어, 장내), 비강내 또는 복강내 경로에 따라 달라질 수 있다. 액체 주사 가능한 제제, 예를 들어, 현탁액 및 용액의 경우, 적합한 담체 및 첨가제는 물, 글리콜, 오일, 알코올, 방부제, 착색제 등을 포함한다. 고체 경구 제제의 경우, 예를 들어, 분말, 캡슐, 당의정, 겔캡 및 정제, 적합한 담체 및 첨가제는 전분, 당, 희석제, 과립화제, 윤활제, 결합제, 붕해제 등을 포함한다. 비강 스프레이/흡입제 혼합물의 경우, 수용액/현탁액은 물, 글리콜, 오일, 연화제, 안정제, 습윤제, 방부제, 방향제, 향료 등을 적절한 담체 및 첨가제로서 포함할 수 있다.
본 출원의 약제학적 조성물은 경구(장) 투여 및 비경구 주사를 포함하지만 이에 제한되지 않는 투여를 용이하게 하고 효능을 개선하기 위해 대상체에게 투여하기에 적합한 임의의 물질로 제형화될 수 있다. 비경구 주사는 정맥주사 또는 주입, 피하 주사, 피내 주사 및 근육 주사를 포함한다. 본 출원의 약제학적 조성물은 또한 경점막, 안구, 직장, 장기 작용 이식, 설하 투여, 혀 아래 투여, 문맥 순환을 우회하는 구강 점막으로부터 투여, 흡입, 또는 비강내를 포함하는 다른 투여 경로를 위해 제형화될 수 있다.
본 출원의 바람직한 실시양태에서, 본 출원의 약제학적 조성물은 비경구 주사, 바람직하게는 피하, 피내 주사, 또는 근육내 주사, 보다 바람직하게는 근육내 주사용으로 제형화된다.
본 출원의 실시양태에 따르면, 투여용 약제학적 조성물은 전형적으로 약제학적으로 허용되는 담체, 예를 들어, 완충 식염수 등과 같은 수성 담체, 예를 들어 인산염 완충 식염수(PBS) 중 완충 용액을 포함할 것이다. 조성물 및 면역원성 조합물은 또한 pH 조정제 및 완충제와 같은 대략적인 생리학적 조건에 필요한 약제학적으로 허용되는 물질을 함유할 수 있다. 예를 들어, 플라스미드 DNA를 포함하는 본 출원의 약제학적 조성물은 약제학적으로 허용되는 담체로서 인산염 완충 식염수(PBS)를 함유할 수 있다. 플라스미드 DNA는, 예를 들어, 0.5 mg/mL 내지 5 mg/mL, 예컨대 0.5 mg/mL, 1 mg/mL, 2 mg/mL, 3 mg/mL, 4 mg/mL, 또는 5 mg/mL, 바람직하게는 1 mg/mL의 농도로 존재할 수 있다.
일부 실시양태에서, RNA 레플리콘을 포함하는 본 출원의 약제학적 조성물은, 예를 들어, 약 20 μg/mL 내지 약 200 μg/mL, 예컨대 20 μg/mL, 30 μg/mL, 40 μg/mL, 50 μg/mL, 60 μg/mL, 70 μg/mL, 80 μg/mL, 90 μg/mL, 100 μg/mL, 110 μg/mL, 120 μg/mL, 130 μg/mL, 140 μg/mL, 150 μg/mL, 160 μg/mL, 170 μg/mL, 180 μg/mL, 190 μg/mL, 또는 200 μg/mL의 농도로 투여될 수 있다. 일부 실시양태에서, RNA 레플리콘을 포함하는 본 출원의 약제학적 조성물은 20 μg/mL 미만의 농도로 투여될 수 있다. 일부 실시양태에서, RNA 레플리콘을 포함하는 본 출원의 약제학적 조성물은 200 μg/mL 초과의 농도로 투여될 수 있다.
본 출원의 약제학적 조성물은 당업계에 잘 알려진 방법에 따라 백신 ("면역원성 조성물"로도 지칭됨)으로서 제형화될 수 있다. 그러한 조성물은 면역 반응을 증진시키는 보조제를 포함할 수 있다. 제형 중 각 성분의 최적 비율은 본 개시내용의 관점에서 당업자에게 잘 알려진 기술에 의해 결정될 수 있다.
본 출원의 특정 실시양태에서, 약제학적 조성물, 조성물, 또는 면역원성 조합물은 DNA 백신이다. DNA 백신은 전형적으로 강력한 진핵 프로모터의 조절하에 관심 있는 항원을 인코딩하는 폴리뉴클레오티드를 함유하는 박테리아 플라스미드를 포함한다. 플라스미드가 숙주의 세포질로 전달되면, 인코딩된 항원이 생성되고 내인성으로 처리된다. 생성된 항원은 전형적으로 체액성 및 세포-매개 면역 반응 둘 다를 유도한다. DNA 백신은 적어도 향상된 안전성을 제공하고, 온도에 안정적이고, 항원 변이체를 발현하도록 쉽게 적응할 수 있고, 생성이 간단하기 때문에 유리하다. 본 출원의 임의의 DNA 플라스미드를 사용하여 그러한 DNA 백신을 제조할 수 있다.
본 출원의 다른 특정 실시양태에서, 약제학적 조성물, 조성물, 또는 면역원성 조합물은 RNA 백신이다. RNA 백신은 전형적으로 관심 있는 항원, 예를 들어, HBV 항원을 인코딩하는 적어도 하나의 단일-가닥 RNA 분자를 포함한다. RNA가 숙주의 세포 세포질로 전달되면, 인코딩된 항원은 내인성으로 생성 및 처리되어 DNA 백신과 유사한 체액성 및 세포-매개 면역 반응 둘 모두를 유도한다. RNA 서열은 번역 효율을 향상시키기 위해 코돈 최적화될 수 있다. RNA 분자는, 예를 들어, 적어도 30개의 아데노신 잔기의 폴리 A 테일을 추가하고/하거나; 변형된 리보뉴클레오티드로 5-말단을 캡핑하는 것과 같이 안정성 및/또는 번역을 향상시키기 위해 본 개시내용의 관점에서 당업계에 알려진 임의의 방법에 의해 당업계에 알려진 방법에 의해 변형될 수 있으며, 이는 RNA 합성 동안 혼입되거나 RNA 전사 후에 효소적으로 조작될 수 있다. RNA 백신은 또한 알파바이러스 발현 벡터로부터 개발된 자가-복제 RNA 백신일 수 있다. 자가-복제 RNA 백신은 HBV 항원 RNA의 복제를 제어하는 서브게놈 프로모터에 이어 레플리카제의 다운스트림에 위치한 인공 폴리 A 테일과 함께 알파바이러스 패밀리에 속하는 바이러스로부터 유래한 레플리카제 RNA 분자를 포함한다.
특정 실시양태에서, 애쥬번트는 본 출원의 약제학적 조성물에 포함되거나, 본 출원의 약제학적 조성물과 공동-투여된다. 애쥬번트의 사용은 선택적이며, 조성물이 백신접종 목적으로 사용될 때 면역 반응을 더욱 향상시킬 수 있다. 본 출원에 따라 조성물과 공동 투여 또는 조성물에 포함시키기에 적합한 애쥬번트는 바람직하게는 잠재적으로 안전하고 내약성이 양호하고 인간에게 효과적인 것들이어야 한다. 애쥬번트는 면역 관문 억제제(예를 들어, 항-PD1, 항-TIM-3 등), 톨-유사 수용체 작용제(예를 들어, TLR7 작용제 및/또는 TLR8 작용제), RIG-1 작용제, IL-15 슈퍼작용제(Altor Bioscience), 돌연변이 IRF3 및 IRF7 유전자 애쥬번트, STRING 작용제(Aduro), FLT3L 유전자 애쥬번트, IL-12 유전자 애쥬번트, 및 IL-7-hyFc를 포함하지만 이에 제한되지 않는 소분자 또는 항체일 수 있다.
본 출원은 또한 본 출원의 약제학적 조성물 및 면역원성 조합물을 제조하는 방법을 제공한다. 약제학적 조성물 또는 면역원성 조합물을 제조하는 방법은 본 출원의 HBV 항원, 벡터 및/또는 폴리펩타이드를 인코딩하는 단리된 폴리뉴클레오티드를 하나 이상의 약학적으로 허용되는 담체와 혼합하는 단계를 포함한다. 당업자는 그러한 조성물을 제조하는 데 사용되는 기존의 기술에 익숙할 것이다.
면역 반응을 유도하는 방법
본 출원은 또한 면역원적 유효량의 본 출원의 약제학적 조성물을 대상체에게 투여하는 단계 포함하는, 이를 필요로 하는 대상체에서 B형 간염 바이러스(HBV)에 대한 면역 반응을 유도하는 방법을 제공한다. 본원에 기재된 본 출원의 임의의 약제학적 조성물은 본 출원 방법에 사용될 수 있다.
본원에 사용된 용어 "감염"은 질환을 야기하는 인자에 의한 숙주의 침입을 지칭한다. 질환을 야기하는 인자는 그것이 숙주에 침입하고 숙주 내에서 복제 또는 증식될 수 있을 때 "감염성"인 것으로 간주된다. 감염성 인자(infectious agent)의 예는 바이러스, 예를 들어, HBV 및 특정 종의 아데노바이러스, 프리온, 박테리아, 진균, 원생동물 등을 포함한다. "HBV 감염"은 구체적으로 숙주 유기체, 예컨대, 숙주 유기체의 세포 및 조직의 HBV에 의한 침입을 지칭한다.
본원에 기재된 방법과 관련하여 사용될 때 어구 "면역 반응을 유도하는"은 감염, 예를 들어, HBV 감염에 대해 이를 필요로 하는 대상체에서 원하는 면역 반응 또는 효과를 유발하는 것을 포함한다. "면역 반응을 유도하는"은 또한 병원체(pathogenic agent), 예를 들어 HBV에 대해 치료하기 위한 치료적 면역을 제공하는 것을 포함한다. 본원에 사용된 바와 같이, 용어 "치료적 면역" 또는 "치료적 면역 반응"은 백신접종 대상체가 백신접종이 수행된 병원체에 의한 감염, 예를 들어, HBV 백신으로의 백신접종에 의해 부여된 HBV 감염에 대한 면역을 제어할 수 있음을 의미한다. 일 실시양태에서, "면역 반응을 유도하는 것"은, 예를 들어, HBV 감염과 같은 질환에 대한 치료 효과를 제공하기 위해 이를 필요로 하는 대상체에서 면역을 생성하는 것을 지칭한다. 특정 실시양태에서, "면역 반응을 유도하는 것"은 HBV 감염에 대한 세포 면역, 예를 들어, T 세포 반응을 야기하거나 개선하는 것을 지칭한다. 특정 실시양태에서, "면역 반응을 유도하는 것"은 HBV 감염에 대한 체액성 면역 반응을 야기하거나 개선하는 것을 지칭한다. 특정 실시양태에서, "면역 반응을 유도하는 것"은 HBV 감염에 대한 세포성 및 체액성 면역 반응을 야기하거나 개선하는 것을 지칭한다.
본 출원은 또한 본 출원의 약제학적 조성물을 대상체에게 투여하는 단계를 포함하는, HBV에 대해 대상체를 백신접종하는 방법을 제공한다. 일부 실시양태에서, 대상체의 백신접종은 예방적 백신접종 또는 치료적 백신접종이며, 보다 특히 백신접종은 치료적 백신접종이다. 본 출원은 또한 본 출원의 약제학적 조성물 또는 본 출원의 백신을 대상체에게 투여하는 단계를 포함하는, 대상체에서 HBV의 감염 및/또는 복제를 감소시키는 방법을 제공한다. 본원에 기재된 본 출원의 임의의 약제학적 조성물 또는 백신이 본 출원의 방법에 사용될 수 있다.
본원에 사용된 바와 같이, 용어 "보호 면역" 또는 "보호 면역 반응"은 백신접종된 대상체가 백신접종이 수행된 병원체에 대항하여 감염을 제어할 수 있음을 의미한다. 일반적으로, "보호 면역 반응"이 발생한 대상체는 경증 내지 중등도 임상 증상만을 나타내거나 증상이 전혀 없다. 일반적으로, 특정 작용제에 대해 "보호 면역 반응" 또는 "보호 면역"을 갖는 대상체는 상기 작용제에 의한 감염의 결과로서 사망하지 않을 것이다.
전형적으로, 본 출원의 약제학적 조성물 및 면역원성 조합물의 투여는 HBV 감염 또는 HBV 감염의 특징적인 증상의 발생 후, 예를 들어, 치료적 백신접종을 위해 HBV에 대한 면역 반응을 발생시키는 치료 목적을 가질 것이다.
본원에 사용된 바와 같이, "면역원적 유효량" 또는 "면역학적 유효량"은 이를 필요로 하는 대상체에서 원하는 면역 효과 또는 면역 반응을 유도하기에 충분한 조성물, 폴리뉴클레오티드, 벡터 또는 항원의 양을 의미한다. 면역원적 유효량은 이를 필요로 하는 대상체에서 면역 반응을 유도하기에 충분한 양일 수 있다. 면역원적 유효량은, 예를 들어, HBV 감염과 같은 질환에 대한 치료 효과를 제공하는 것과 같이 이를 필요로 하는 대상체에서 면역을 생성하기에 충분한 양일 수 있다. 면역원적 유효량은 다양한 인자, 예컨대 대상체의 신체 상태, 연령, 체중, 건강 등; 예를 들어, 보호 면역 또는 치료 면역을 제공하는 특정 적용; 면역이 요구되는 특정 질환, 예를 들어, 바이러스 감염에 따라 달라질 수 있다. 면역원적 유효량은 본 개시내용의 관점에서 당업자에 의해 용이하게 결정될 수 있다.
본 출원의 특정 실시양태에서, 면역원적 유효량은 하기 효과 중 1, 2, 3, 4개 또는 그 이상을 달성하기에 충분한 조성물 또는 면역원성 조합물의 양을 지칭한다: (i) HBV 감염 또는 이와 관련된 증상의 중증도를 감소 또는 개선; (ii) HBV 감염 또는 이와 관련된 증상의 지속 기간을 감소; (iii) HBV 감염 또는 이와 관련된 증상의 진행을 예방; (iv) HBV 감염 또는 이와 관련된 증상의 퇴행을 야기; (v) HBV 감염 또는 이와 관련된 증상의 발병(development) 또는 발병(onset)을 예방; (vi) HBV 감염 또는 이와 관련된 증상의 재발을 예방; (vii) HBV 감염을 가진 대상체의 입원 감소; (viii) HBV 감염을 가진 대상체의 입원 기간 감소; (ix) HBV 감염을 가진 대상체의 생존을 증가; (x) 대상체에서 HBV 감염을 제거; (xi) 대상체에서 HBV 복제를 억제 또는 감소; 및/또는 (xii) 또 다른 요법의 예방적 또는 치료적 효과(들)를 증진 또는 향상.
면역원적 유효량은 또한 임상 혈청전환으로의 진전과 일치하는 HBsAg 수준을 감소; 대상체의 면역계에 의한 감염된 간세포의 감소와 관련된 지속적인 HBsAg 제거 달성; HBV-항원 특이적 활성화된 T-세포 집단의 유도; 및/또는 12개월 이내에 HBsAg의 지속적인 손실을 달성하기에 충분한 양일 수 있다. 표적 지수의 예는 HBsAg 국제 단위(IU)의 500개 카피의 임계값 미만의 더 낮은 HBsAg 및/또는 더 높은 CD8 카운트를 포함한다.
일반적인 지침으로서, 핵산 분자, 벡터 또는 RNA 레플리콘과 관련하여 사용될 때 면역원적 유효량은 약 1 μg의 핵산 분자, 벡터 또는 RNA 레플리콘 내지 약 1 mg의 핵산 분자, 벡터 또는 RNA 레플리콘, 예컨대 1 μg, 10 μg, 20 μg, 30 μg, 40 μg, 50 μg, 60 μg, 70 μg, 80 μg, 90 μg, 100 μg, 200 μg, 300 μg, 400 μg, 500 μg, 600 μg, 700 μg, 800 μg, 900 μg 또는 1 mg의 범위일 수 있다. 바람직하게는, 핵산 분자, 벡터, 또는 RNA 레플리콘의 면역원적 유효량은 약 10 μg 내지 약 100 μg이다. 약제학적 조성물에서 핵산 분자, 벡터 또는 RNA 레플리콘과 관련하여 사용될 때 면역원적 유효량은 약 0.01 mg/mL 내지 약 2 mg/mL의 핵산 분자, 벡터 또는 RNA 레플리콘 총합, 예컨대 0.01 mg/mL, 0.02 mg/mL, 0.03 mg/mL, 0.04 mg/mL, 0.05 mg/mL, 0.06 mg/mL, 0.07 mg/mL, 0.08 mg/mL, 0.09 mg/mL, 0.1 mg/mL, 0.25 mg/mL, 0.5 mg/mL, 0.75 mg/mL, 1 mg/mL, 1.5 mg/mL, 또는 2 mg/mL의 농도 범위일 수 있다. 바람직하게는, 핵산 분자, 벡터 또는 RNA 레플리콘의 면역원적 유효량은 1 mg/mL 미만, 보다 바람직하게는 0.05 mg/mL 미만이다. 면역원적 유효량은 하나의 핵산 분자, 벡터 또는 RNA 레플리콘으로부터, 또는 다수의 핵산 분자, 벡터, 또는 RNA 레플리콘으로부터 유래할 수 있다. 면역원적 유효량은 단일 조성물, 또는 다중 조성물, 예컨대 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 조성물(예를 들어, 정제, 캡슐 또는 주사제, 또는 피내 전달, 예를 들어, 피내 전달 패치를 사용한 피내 전달에 적합한 임의의 조성물)로 투여될 수 있으며, 여기서 다중 캡슐 또는 주사제의 투여는 대상체에게 면역원적 유효량을 집합적으로 제공된다. 예를 들어, 2개의 DNA 플라스미드가 사용되는 경우, 면역원적 유효량은 3-4 mg/mL일 수 있으며 각 플라스미드 당 1.5-2 mg/mL일 수 있다. 또한, 면역원적 유효량을 대상체에게 투여하고, 후속적으로 소위 프라임-부스트 용법으로서 동일한 대상체에게 면역원적 유효량의 또 다른 용량을 투여하는 것도 가능하다. 프라임-부스트 용법의 이러한 일반적인 개념은 백신 분야의 숙련된 사람에게 잘 알려져 있다. 추가 부스터 투여는 필요에 따라 용법에 선택적으로 추가될 수 있다.
2개의 벡터, 예를 들어, 제1 HBV 항원을 인코딩하는 제1 벡터 및 제2 HBV 항원을 인코딩하는 제2 벡터를 포함하는 면역원성 조합물은 두 벡터를 혼합하고 혼합물을 단일 해부학적 부위에 전달함으로써 대상체에게 투여될 수 있다. 대안적으로, 각각 단일 발현 벡터를 전달하는 2개의 개별 면역화가 수행될 수 있다. 그러한 실시양태에서, 두 벡터가 단일 면역화에서 2개의 개별 면역화의 혼합물로서 투여되는지 여부에 관계없이, 제1 벡터 및 제2 벡터는 중량 기준으로 10:1 내지 1:10, 예컨대 중량 기준으로 10:1, 9:1, 8:1, 7:1, 6:1, 5:1, 4:1, 3:1, 2:1, 1:1, 1:2, 1:3, 1:4, 1:5, 1:6, 1:7, 1:8, 1:9 또는 1:10의 비율로 투여될 수 있다. 바람직하게는, 제1 및 제2 벡터는 중량 기준으로 1:1의 비율로 투여된다.
바람직하게는, 본 출원의 방법에 따라 치료될 대상체는 HBV-감염 대상체, 특히 만성 HBV 감염을 가진 대상체이다. 급성 HBV 감염은 일반적으로 감염된 간세포의 복제 또는 제거의 성공적인 억제를 초래하는 후속적인 광범위한 적응 반응(예를 들어, HBV-특이적 T-세포, 중화 항체)으로 보완된 선천성 면역계의 효율적인 활성화를 특징으로 한다. 대조적으로, 그러한 반응은 높은 바이러스 및 항원 로딩으로 인해 손상되거나 감소되며, 예를 들어, HBV 외피 단백질은 풍부하게 생성되고, 감염성 바이러스보다 1,000배 초과로 서브바이러스 입자로 방출될 수 있다.
만성 HBV 감염은 바이러스 로딩, 간 효소 수준(괴사 염증 활성), HBeAg 또는 HBsAg 로딩 또는 이들 항원에 대한 항체의 존재를 특징으로 하는 단계로 설명된다. cccDNA 수준은 바이러스혈증이 상당히 다양할 수 있음에도 불구하고 세포 당 약 10 내지 50개의 카피로 비교적 일정하게 유지된다. cccDNA 종의 지속성은 만성으로 이어진다. 보다 구체적으로, 만성 HBV 감염의 단계는 하기를 포함한다: (i) 높은 바이러스 로딩 및 정상 또는 최소로 상승된 간 효소를 특징으로 하는 면역-내성 단계; (ii) 현저하게 상승된 간 효소와 함께 바이러스 복제 수준이 더 낮거나 감소하는 면역 활성화 HBeAg-양성 단계; (iii) HBeAg 혈청전환에 뒤따를 수 있는 혈청 내 낮은 바이러스 로딩 및 정상 간 효소 수준을 갖는 낮은 복제 상태인 비활성 HBsAg 담체 단계; 및 (iv) 바이러스 복제가 간 효소 수준의 수반되는 변동과 함께 주기적으로 (재활성화) 발생하고 프리코어 및/또는 기저 코어 프로모터의 돌연변이가 통상적이어서 HBeAg가 감염된 세포에 의해 생성되지 않는 HBeAg-음성 단계.
본원에 사용된 바와 같이, "만성 HBV 감염"은 6개월 초과 동안 HBV의 검출 가능한 존재를 갖는 대상체를 지칭한다. 만성 HBV 감염을 가진 대상체는 만성 HBV 감염의 임의의 단계에 있을 수 있다. 만성 HBV 감염은 해당 분야에서의 일반적인 의미에 따라 이해된다. 만성 HBV 감염은, 예를 들어, 급성 HBV 감염 후 6개월 초과 동안 HBsAg의 지속성을 특징으로 할 수 있다. 예를 들어, 본원에 언급된 만성 HBV 감염은 질병 통제 예방 센터(CDC)에 의해 발표된 정의를 따르며, 이에 따라 만성 HBV 감염은 다음과 같은 실험실 기준을 특징으로 할 수 있다: (i) B형 간염 핵심 항원에 대한 IgM 항체(IgM 항-HBc)에 대해 음성이고 B형 간염 표면 항원(HBsAg), B형 간염 e 항원(HBeAg) 또는 B형 간염 바이러스 DNA에 대한 핵산 시험에 대해 양성이거나, (ii) HBsAg 또는 HBV DNA에 대한 핵산 시험에 대해 양성이거나, HBeAg에 대해 적어도 6개월 간격으로 2회 양성. 바람직하게는, 면역원적 유효량은 만성 HBV 감염을 치료하기에 충분한 조성물 또는 적용의 면역원성 조합물의 양을 지칭한다.
일부 실시양태에서, 만성 HBV 감염을 가진 대상체는 뉴클레오시드 유사체(NUC) 치료를 받고 있고, NUC가 억제된다. 본원에 사용된 바와 같이, "NUC-억제된"은 적어도 6개월 동안 검출 불가능한 바이러스 수준의 HBV 및 안정한 알라닌 아미노트랜스퍼라제(ALT) 수준을 갖는 대상체를 지칭한다. 뉴클레오시드/뉴클레오티드 유사체 처리의 예는 HBV 폴리머라제 억제제, 예컨대 엔타카비르 및 테노포비르를 포함한다. 바람직하게는, 만성 HBV 감염을 가진 대상체는 진행성 간 섬유증 또는 간경변을 갖지 않는다. 그러한 대상체는 전형적으로 섬유증에 대해 3 미만의 METAVIR 스코어 및 9 kPa 미만의 섬유스캔 결과를 가질 것이다. METAVIR 스코어는 B형 간염 환자의 간 생검에서 조직병리학적 평가를 통해 염증 및 섬유증 정도를 평가하는 데 일반적으로 사용되는 스코어 시스템이다. 스코어링 시스템은 2개의 표준화된 숫자를 할당한다: 하나는 염증 정도를 반영하고 다른 하나는 섬유증 정도를 반영한다.
만성 HBV의 제거 또는 감소는 바이러스-유발 간경변 및 간세포 암종을 포함한 중증 간 질환의 조기 질환 차단을 허용할 수 있는 것으로 여겨진다. 따라서, 본 출원의 방법은 또한 HBV-유발 질환을 치료하기 위한 요법으로서 사용될 수 있다. HBV-유발 질환의 예는 간경변, 암(예를 들어, 간세포 암종), 및 섬유증, 특히 섬유증에 대해 3 이상의 METAVIR 스코어를 특징으로 하는 진행성 섬유증을 포함하지만 이에 제한되지 않는다. 그러한 실시양태에서, 면역원적 유효량은 12개월 이내에 HBsAg의 지속적인 손실 및 임상 질환(예를 들어, 간경변, 간세포 암종 등)의 유의한 감소를 달성하기에 충분한 양이다.
본 출원의 실시양태에 따른 방법은 또 다른 면역원성 제제(예컨대, 또 다른 HBV 항원 또는 기타 항원) 또는 또 다른 항-HBV 제제(예컨대, 뉴클레오시드 유사체 또는 기타 항-HBV 제제)를 본 출원의 약제학적 조성물과 조합하여 이를 필요로 하는 대상체에게 투여하는 단계를 추가로 포함한다. 예를 들어, 또 다른 항-HBV 제제 또는 면역원성 제제는 면역 관문 억제제(예를 들어, 항-PD1, 항-TIM-3 등), 톨-유사 수용체 작용제(예를 들어, TLR7 작용제 및/또는 TLR8 작용제), RIG-1 작용제, IL-15 슈퍼작용제(Altor Bioscience), 돌연변이 IRF3 및 IRF7 유전자 애쥬번트, STING 작용제(Aduro), FLT3L 유전자 애쥬번트, IL-12 유전자 애쥬번트, IL-7-hyFc; HBV env(S-CAR 세포)에 결합하는 CAR-T; 캡시드 조립 조절제; cccDNA 억제제, HBV 폴리머라제 억제제(예를 들어, 엔테카비르 및 테노포비르)를 포함하지만 이에 제한되지 않는 소분자 또는 항체일 수 있다. 하나 또는 다른 항-HBV 활성제는 예를 들어, 소분자, 항체 또는 이의 항원 결합 단편, 폴리펩타이드, 단백질, 또는 핵산일 수 있다.
전달 방법
본 출원의 약제학적 조성물 및 면역원성 조합물은 본 개시의 관점에서 기술분야에 알려져 있는, 비경구 투여(예를 들어, 근육내, 피하, 정맥내 또는 피내 주사), 경구 투여, 경피 투여, 및 비강 투여를 포함하지만 이에 제한되지 않는 임의의 방법에 의해 대상에게 투여될 수 있다. 바람직하게는, 약제학적 조성물 및 면역원성 조합물은 비경구(예를 들어, 근육내 주사 또는 피내 주사에 의해) 또는 경피로 투여된다.
약제학적 조성물 또는 면역원성 조합물이 하나 이상의 DNA 플라스미드를 포함하는 본 출원의 일부 실시양태에서, 투여는 피부를 통한 주사, 예를 들어, 근육내 또는 피내 주사, 바람직하게는 근육내 주사에 의한 것일 수 있다. 근육내 주사는 전기천공, 즉 DNA 플라스미드를 세포로의 전달을 용이하게 하기 위한 전기장의 적용과 조합될 수 있다. 본원에 사용된 바와 같이, 용어 "전기천공"은 생체막에서 미세한 경로(기공)를 유도하기 위해 막관통 전기장 펄스를 사용하는 것을 지칭한다. 생체내 전기천공 동안 적절한 세기와 지속 시간의 전기장을 세포에 적용하여 향상된 세포막 투과성의 일시적인 상태를 유도하여 그 자체로는 세포막을 통과할 수 없는 분자의 세포 흡수를 가능하게 한다. 전기천공에 의한 이러한 공극의 생성은 플라스미드, 올리고뉴클레오티드, siRNA, 약물 등과 같은 생체 분자가 세포막의 한쪽에서 다른 쪽으로 통과하는 것을 용이하게 한다. DNA 백신 전달을 위한 생체내 전기천공은 숙주 세포에 의한 플라스미드 흡수를 유의하게 증가시키는 동시에 주사 부위에서 경증에서 중등도의 염증을 유발하는 것으로 나타났다. 그 결과, 형질감염 효율 및 면역 반응은 기존의 주사와 비교하여 피내 또는 근육내 전기천공에 의해 유의하게 개선된다(예를 들어, 각각 1,000배 및 100배까지).
전형적인 실시양태에서, 전기천공은 근육내 주사와 조합된다. 그러나, 전기천공을 다른 형태의 비경구 투여, 예를 들어, 피내 주사, 피하 주사 등과 조합하는 것도 가능하다.
전기천공을 통한 본 출원의 약제학적 조성물, 면역원성 조합물 또는 백신의 투여는 포유동물의 원하는 조직에 세포막에 가역적 기공을 야기하기에 효과적인 에너지 펄스를 전달하도록 구성될 수 있는 전기천공 장치를 사용하여 달성될 수 있다. 전기천공 장치는 전기천공 구성요소 및 전극 조립체 또는 핸들 조립체를 포함할 수 있다. 전기천공 구성요소는 전기천공 장치의 하기 구성요소 중 하나 이상을 포함할 수 있다: 컨트롤러, 전류 파형 발생기, 임피던스 테스터, 파형 로거(waveform logger), 입력 요소, 상태 보고 요소, 통신 포트, 메모리 구성요소, 전원 및 전원 스위치. 전기천공은 생체내 전기천공 장치를 사용하여 달성될 수 있다. 본 출원의 조성물 및 면역원성 조합물, 특히 DNA 플라스미드를 포함하는 것들의 전달을 용이하게 할 수 있는 전기천공 장치 및 전기천공 방법의 예는 CELLECTRA®(Inovio Pharmaceuticals, Blue Bell, PA), Elgen 전기천공기(Inovio Pharmaceuticals, Inc.), Tri-GridTM 전달 시스템(Ichor Medical Systems, Inc., San Diego, CA 92121) 및 미국 특허 번호 7,664,545호, 미국 특허 번호 8,209,006호, 미국 특허 번호 9,452,285호, 미국 특허 번호 5,273,525호, 미국 특허 번호 6,110,161호, 미국 특허 번호 6,261,281호, 미국 특허 번호 6,958,060호, 및 미국 특허 번호 6,939,862호, 미국 특허 번호 7,328,064호, 미국 특허 번호 6,041,252호, 미국 특허 번호 5,873,849, 미국 특허 번호 6,278,895, 미국 특허 번호 6,319,901, 미국 특허 번호 6,912,417, 미국 특허 번호 8,187,249, 미국 특허 번호 9,364,664, 미국 특허 번호 9,802,035, 미국 특허 번호 6,117,660, 및 국제 특허 출원 공개 WO2017172838에 기재된 것들을 포함하며, 상기 특허 모두는 그 전체가 본원에 참조로 포함된다. 생체내 전기천공 장치의 다른 예는 그 내용은 그 전체가 본원에 참조로 포함된 대리인 문서 번호 688097-405WO로 본 출원과 동일자로 출원된 "B형 간염 바이러스(HBV) 백신의 전달을 위한 방법 및 장치"라는 제목의 국제 특허 출원에 기재되어 있다. 또한, 예를 들어, 본원에 그 전체가 참조로 포함된 미국 특허 번호 6,697,669호에 기재된 바와 같은 펄스 전기장의 사용이 본 출원의 조성물 및 면역원성 조합물의 전달을 위해 적용이 고려된다.
약제학적 조성물 또는 면역원성 조합물이 하나 이상의 DNA 플라스미드를 포함하는 본 출원의 다른 실시양태에서, 투여 방법은 경피이다. 경피 투여는 DNA 플라스미드를 세포로의 전달을 용이하게 하기 위해 표피 피부 마모와 조합될 수 있다. 예를 들어, 피부 패치(dermatological patch)가 표피 피부 마모에 사용될 수 있다. 피부 패치의 제거 시, 조성물 또는 면역원성 조합물이 박리된 피부에 침착될 수 있다.
전달 방법은 상기 기재된 실시양태에 제한되지 않으며, 세포내 전달을 위한 임의의 수단이 사용될 수 있다. 본 출원의 방법에 의해 고려되는 세포내 전달의 다른 방법은 리포좀 캡슐화, 리포플렉스, 나노입자 등을 포함하지만 이에 제한되지 않는다. 예를 들어, 본 출원의 RNA 레플리콘은 하나 이상의 지질 분자, 바람직하게는 양으로 하전된 지질 분자를 포함하는 면역원성 조성물로 제형화될 수 있다. 일부 실시양태에서, 본 개시내용의 RNA 레플리콘은 하나 이상의 리포좀, 리포플렉스, 및/또는 지질 나노입자를 사용하여 제형화될 수 있다. 일부 실시양태에서, 본원에 기재된 리포좀 또는 지질 나노입자 제형은 다가양이온성 조성물을 포함할 수 있다. 일부 실시양태에서, 다가양이온성 조성물을 포함하는 제형은 본원에 기재된 RNA 레플리콘의 생체내 및/또는 시험관내 전달을 위해 사용될 수 있다.
본 발명에 따르면, 용어 "지질"은 유방성(lyotropic) 지질 상, 또는 보다 우선적으로 층상 유방성 상(lamellar lyotropic phase)을 형성할 수 있는 임의의 지방산 유도체 또는 다른 양친매성 화합물을 지칭한다. 특히, 용어 "지질"은 지질 분자의 소수성 부분이 이중층을 향하고 친수성 부분이 수성상을 향하도록 이중층을 형성할 수 있는 임의의 지방산 유도체를 의미한다. 용어 "지질"은 중성, 음이온성 또는 양이온성 지질을 포함한다. 지질은 바람직하게는 적어도 1개, 바람직하게는 2개, 알킬 사슬 또는 콜레스테롤 모이어티 및 극성 헤드 기를 갖는 소수성 도메인을 포함한다. 지질의 소수성 도메인에 있는 지방산의 알킬 사슬은 이중 결합의 특정 길이 또는 수로 제한되지 않는다. 그럼에도 불구하고, 지방산은 10 내지 30개, 바람직하게는 14 내지 25개의 탄소 원자의 길이를 갖는 것이 바람직하다. 지질은 또한 2개의 상이한 지방산을 포함할 수 있다.
본 개시내용의 맥락에서, 지질-기반 전달 비히클은 전형적으로 원하는 RNA 레플리콘을 표적 세포 또는 조직으로 수송하는 역할을 한다. 일부 실시양태에서, 지질-기반 전달 비히클은 본 개시내용의 나노입자 또는 지질 분자의 이중층 및 RNA 레플리콘을 포함한다. 일부 실시양태에서, 지질 이중층은 바람직하게는 중성 지질 또는 중합체를 추가로 포함한다. 용어 "중성 지질"은 선택된 pH에서 하전되지 않은 또는 중성 양쪽이온성 형태로 존재하는 지질 종을 의미한다. 생리학적 pH에서, 그러한 지질은, 예를 들어, 디아실포스파티딜콜린, 디아실포스파티딜에탄올아민, 세라미드, 스핑고미엘린, 세팔린, 콜레스테롤, 세레브로시드 및 디아실글리세롤을 포함한다. 일부 실시양태에서, 지질 제형은 바람직하게는 액체 매질을 포함한다. 일부 실시양태에서, 제형은 바람직하게는 핵산을 추가로 캡슐화한다. 일부 실시양태에서, 지질 제형은 바람직하게는 핵산 및 중성 지질 또는 중합체를 추가로 포함한다. 일부 실시양태에서, 지질 제형은 바람직하게는 핵산을 캡슐화한다.
상기 설명은 지질 제형 내에 캡슐화된 하나 이상의 RNA 레플리콘을 포함하는 지질 제형을 제공한다. 일부 실시양태에서, 지질 제형은 리포좀을 포함한다. 일부 실시양태에서, 지질 제형은 양이온성 리포좀을 포함한다. 일부 실시양태에서, 지질 제형은 지질 나노입자를 포함한다.
일부 실시양태에서, RNA 레플리콘 또는 핵산 분자의 조합은 지질 제형의 RNA 레플리콘 또는 핵산 분자의 조합이 뉴클레아제 분해에 대해 수용액에서 내성이 있도록 지질 제형의 지질 부분 내에 완전히 캡슐화된다. 용어 "완전히 캡슐화된"은 핵산-지질 입자 내의 핵산(예를 들어, RNA 레플리콘)이 유리 RNA를 유의하게 분해하는 혈청 또는 뉴클레아제 분석에 노출된 후에 유의하게 분해되지 않는다는 것을 의미한다. 완전히 캡슐화될 때, 바람직하게는 입자 내 핵산의 25% 미만이 일반적으로 유리 핵산을 100% 분해하는 처리에서 분해되고, 보다 바람직하게는 입자 내 핵산의 10% 미만, 가장 바람직하게는 5% 미만이 분해된다. 본원에 사용된 "완전히 캡슐화된"은 또한 핵산-지질 입자가 생체내 투여시 이들의 구성요소로 빠르게 분해되지 않음을 의미한다. 다른 실시양태에서, 본원에 기재된 지질 제형은 인간과 같은 포유동물에게 실질적으로 무독성이다. 일부 실시양태에서, 핵산의 조합은 동일한 지질 나노입자 내에 캡슐화된다. 일부 실시양태에서, 핵산 분자의 조합에서 각각의 핵산 분자는 개별 지질 나노입자 내에 독립적으로 캡슐화된다.
본 개시내용의 지질 제형은 또한 전형적으로 약 1:1 내지 약 100:1, 약 1:1 내지 약 50:1, 약 2:1 내지 약 45:1, 약 3:1 내지 약 40:1, 약 5:1 내지 약 38:1, 또는 약 6:1 내지 약 40:1, 또는 약 7:1 내지 약 35:1, 또는 약 8:1 내지 약 30:1; 또는 약 10:1 내지 약 25:1; 또는 약 8:1 내지 약 12:1; 또는 약 13:1 내지 약 17:1; 또는 약 18:1 내지 약 24:1; 또는 약 20:1 내지 약 30:1의 총 지질:RNA 비율(질량/질량 비율)을 갖는다. 일부 바람직한 실시양태에서, 총 지질:RNA 비율(질량/질량 비율)은 약 10:1 내지 약 25:1이다. 상기 비율은 종말점을 포함하여 인용된 범위 내의 임의의 값 또는 하위값일 수 있다.
본 개시내용의 지질 제형은 전형적으로 평균 직경이 약 30 nm 내지 약 150 nm, 약 40 nm 내지 약 150 nm, 약 50 nm 내지 약 150 nm, 약 60 nm 내지 약 130 nm, 약 70 nm 내지 약 110 nm, 약 70 nm 내지 약 100 nm, 약 80 nm 내지 약 100 nm, 약 90 nm 내지 약 100 nm, 약 70 내지 약 90 nm, 약 80 nm 내지 약 90 nm, 약 70 nm 내지 약 80 nm, 또는 약 30 nm, 약 35 nm, 약 40 nm, 약 45 nm, 약 50 nm, 약 55 nm, 약 60 nm, 약 65 nm, 약 70 nm, 약 75 nm, 약 80 nm, 약 85 nm, 약 90 nm, 약 95 nm, 약 100 nm, 약 105 nm, 약 110 nm, 약 115 nm, 약 120 nm, 약 125 nm, 약 130 nm, 약 135 nm, 약 140 nm, 약 145 nm, 또는 약 150 nm이고, 실질적으로 무독성이다. 직경은 종말점을 포함하여 인용된 범위 내의 임의의 값 또는 하위값일 수 있다. 또한, 핵산은, 본 개시내용의 지질 나노입자에 존재할 때, 수용액에서 뉴클레아제에 의한 분해에 내성이 있다.
바람직한 실시양태에서, 지질 제형은 RNA 레플리콘 또는 핵산 분자의 조합, 양이온성 지질(예를 들어, 본원에 기재된 하나 이상의 양이온성 지질 또는 이의 염), 인지질, 및 입자의 응집을 억제하는 접합 지질(예를 들어, 하나 이상의 PEG-지질 접합체)을 포함한다. 지질 제형은 또한 콜레스테롤을 포함할 수 있다. 용어 "지질 접합체"는 지질 입자의 응집을 억제하는 접합 지질을 의미한다. 그러한 지질 접합체는, 예를 들어, 디알킬옥시프로필에 결합된 PEG(예를 들어, PEG-DAA 접합체), 디아실글리세롤에 결합된 PEG(예를 들어, PEG-DAG 접합체), 콜레스테롤에 결합된 PEG, 포스파티딜에탄올아민에 결합된 PEG, 및 세라미드에 결합된 PEG와 같은 PEG-지질 접합체, 양이온성 PEG 지질, 폴리옥사졸린(POZ)-지질 접합체, 폴리아미드 올리고머 및 이들의 혼합물을 포함하지만 이에 제한되지 않는다. PEG 또는 POZ는 지질에 직접 접합될 수 있거나 링커 모이어티를 통해 지질에 연결될 수 있다. PEG 또는 POZ를 지질에 결합시키기에 적합한 임의의 링커 모이어티는, 예를 들어, 비-에스테르-함유 링커 모이어티 및 에스테르-함유 링커 모이어티를 포함하여 사용될 수 있다. 특정한 바람직한 실시양태에서, 비-에스테르-함유 링커 모이어티, 예컨대 아미드 또는 카바메이트가 사용된다. 특정한 바람직한 실시양태에서, PEG-지질 접합체는 2-[(폴리에틸렌 글리콜)-2000]-N,N-디테트라데실아세트아미드(즉, ALC-0159)이다.
본원에 사용된 용어 "양이온성 지질"은 양성, 친수성 헤드 기를 갖는 양친매성 지질 및 이의 염; 1, 2, 3개 또는 그 이상의 소수성(즉, 무극성 기를 가짐) 지방산 또는 지방 알킬 사슬; 이들 두 도메인 사이의 커넥터를 지칭한다. 이온화 가능한 또는 양성자화 가능한 양이온성 지질은 전형적으로 이의 pKa 미만의 pH에서 양성자화되고(즉, 양으로 하전되고), pKa 초과의 pH에서 실질적으로 중성이다. 바람직한 이온화 가능한 양이온성 지질은 전형적으로 약 7.4인 생리학적 pH 미만의 pKa를 갖는 것들이다. 본 개시내용의 양이온성 지질은 또한 적정 가능한 양이온성 지질로 지칭될 수 있다. 양이온성 지질은 양성자화 가능한 3차 아민(예를 들어, pH-적정 가능) 헤드 기를 갖는 "아미노 지질"일 수 있다. 일부 아미노 예시적인 아미노 지질은 C18 알킬 사슬을 포함할 수 있으며, 여기서 각각의 알킬 사슬은 독립적으로 0 내지 3개(예를 들어, 0, 1, 2, 또는 3개)의 이중 결합; 및 헤드 기와 알킬 사슬 사이의 에테르, 에스테르 또는 케탈 결합을 갖는다. 그러한 양이온성 지질은 (4-하이드록시부틸)아잔디일)비스(헥산-6,1-디일)비스(2-헥실데카노에이트(ALC-0315로도 알려짐), DOTMA(N-D-(2,3-디올레일옥시) 프로필 N,N,N-트리메틸암모늄 클로라이드)로도 알려진 Lipofectin™, DOTAP(1,2-비스(올레일옥시)-3(트리메틸암모니오)프로판), DDAB(디메틸디옥타데실-암모늄 브로마이드), DOGS(디옥타데실라미돌로글리실 스페르민), DSDMA, DODMA, DLinDMA, DLenDMA, γ-DLenDMA, DLin-K-DMA, DLin-K-C2-DMA(DLin-C2K-DMA, XTC2 및 C2K로도 알려진), DLin-K-C3-DMA, DLin-K-C4-DMA, DLen-C2K-DMA, y-DLen-C2K-DMA, DLin-M-C2-DMA(MC2로도 알려짐), DLin-M-C3-DMA(MC3로도 알려짐), (DLin-MP-DMA) (1-Bl 1로도 알려짐) 및 콜레스테롤 유도체, 예컨대 DCChol(3 베타-(N-(N',N'-디메틸 아미노메탄)-카바모일)콜레스테롤)을 포함하지만 이에 제한되지 않는다. 특정한 바람직한 실시양태에서, 양이온성 지질은 ((4-하이드록시부틸)아잔디일)비스(헥산-6,1-디일)비스(2-헥실데카노에이트), 즉 ALC-0315이다.
본원에 사용된 용어 "음이온성 지질"은 생리학적 pH에서 음으로 하전된 지질을 지칭한다. 이러한 지질은 포스파티딜글리세롤, 카디오리핀, 디아실포스파티딜세린, 디아실포스파티드산, N-도데카노일 포스파티딜에탄올아민, N-석시닐 포스파티딜에탄올아민, N-글루타릴포스파티딜에탄올아민, 리실포스파티딜글리세롤, 팔미토일올레오일포스파티딜글리세롤(POPG) 및 중성 지질에 결합된 다른 음이온 변형기를 포함하지만 이에 제한되지 않는다.
핵산-지질 제형에서, RNA 레플리콘 또는 핵산 분자의 조합은 제형의 지질 부분 내에 완전히 캡슐화되어 뉴클레아제 분해로부터 핵산을 보호할 수 있다. 바람직한 실시양태에서, RNA 레플리콘 또는 핵산 분자의 조합을 포함하는 지질 제형은 지질 제형의 지질 부분 내에 완전히 캡슐화되어, 뉴클레아제 분해로부터 핵산을 보호한다. 특정 경우에, 지질 제형 내의 RNA 레플리콘 또는 핵산 분자의 조합은 입자를 적어도 20, 30, 45, 또는 60분 동안 37℃에서 뉴클레아제에 노출시킨 후에 실질적으로 분해되지 않는다. 특정한 다른 예에서, 지질 제형 내의 RNA 레플리콘 또는 핵산 분자의 조합은 적어도 30, 45, 또는 60분, 또는 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34 또는 36시간 동안 또는 37℃에서 혈청 내 제형의 인큐베이션 후에 실질적으로 분해되지 않는다. 다른 실시양태에서, RNA 레플리콘 또는 핵산 분자의 조합은 제형의 지질 부분과 복합체화된다.
핵산의 맥락에서, 전체 캡슐화는 핵산과 회합될 때 증진된 형광을 갖는 염료를 사용하는 막-불투과성 형광 염료 배제 검정을 수행함으로써 결정될 수 있다. 캡슐화는 염료를 지질 제형에 첨가하고, 생성된 형광을 측정하고, 이를 소량의 비이온성 세제 첨가 시 관찰된 형광과 비교하여 결정된다. 지질층의 세제-매개 파괴는 캡슐화된 핵산을 방출하여 막-불투과성 염료와 상호작용할 수 있게 한다. 핵산 캡슐화는 E = (I0 - I)/I0로서 계산될 수 있으며, 여기서 I 및 I0는 세제 첨가 전후의 형광 강도를 지칭한다.
다른 실시양태에서, 본 개시내용은 복수의 핵산-리포좀, 핵산-양이온성 리포좀, 또는 핵산-지질 나노입자를 포함하는 핵산-지질 조성물을 제공한다. 일부 실시양태에서, 핵산-지질 조성물은 복수의 RNA 레플리콘-리포좀을 포함한다. 일부 실시양태에서, 핵산-지질 조성물은 복수의 RNA 레플리콘-양이온성 리포좀을 포함한다. 일부 실시양태에서, 핵산-지질 조성물은 복수의 RNA 레플리콘-지질 나노입자를 포함한다.
일부 실시양태에서, 지질 제형은 제형의 지질 부분 내에 완전히 캡슐화된 RNA 레플리콘 또는 핵산 분자의 조합을 포함하여, 입자의 약 30% 내지 약 100%, 약 40% 내지 약 100%, 약 50% 내지 약 100%, 약 60% 내지 약 100%, 약 70% 내지 약 100%, 약 80% 내지 약 100%, 약 90% 내지 약 100%, 약 30% 내지 약 95%, 약 40% 내지 약 95%, 약 50% 내지 약 95%, 약 60% 내지 약 95%, 약 70% 내지 약 95%, 약 80% 내지 약 95%, 약 85% 내지 약 95%, 약 90% 내지 약 95%, 약 30% 내지 약 90%, 약 40% 내지 약 90%, 약 50% 내지 약 90%, 약 60% 내지 약 90%, 약 70% 내지 약 90%, 약 80% 내지 약 90%, 또는 적어도 약 30%, 약 35%, 약 40%, 약 45%, 약 50%, 약 55%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98%, 또는 약 99% (또는 이의 임의의 분율 또는 그 안의 범위)가 그 안에 캡슐화된 RNA 레플리콘 또는 핵산 분자의 조합을 갖는다. 양은 종말점을 포함하여 인용된 범위 내의 임의의 값 또는 하위값일 수 있다.
지질 제형의 의도된 용도에 따라, 성분의 비율은 변할 수 있고, 특정 제형의 전달 효율은 당업계에 알려진 검정을 사용하여 측정될 수 있다.
몇몇 실시양태들에 따르면, 본원에 기재된 발현 가능한 폴리뉴클레오티드 및 RNA 레플리콘은 지질로 제형화된다. 지질 제형은 바람직하게는 리포좀, 양이온성 리포좀, 및 지질 나노입자로부터 선택되지만 이에 재한되지 않는다. 하나의 바람직한 실시양태에서, 지질 제형은 하기를 포함하는 양이온성 리포좀 또는 지질 나노입자(LNP)이다:
(a) 본 개시내용의 RNA 레플리콘 또는 핵산 분자의 조합,
(b) 양이온성 지질,
(c) 응집 감소제(예컨대, 폴리에틸렌 글리콜(PEG) 지질 또는 PEG-변형된 지질),
(d) 선택적으로 비-양이온성 지질(예컨대, 중성 지질), 및
(e) 선택적으로 스테롤.
바람직하게는, RNA 레플리콘 또는 핵산 분자의 조합을 캡슐화하는 지질 나노입자는 양이온성 지질, 및 음이온성 지질, 양쪽이온성 지질, 중성 지질, 스테로이드, 중합체 접합 지질, 인지질, 당지질 및 이들의 조합으로 이루어진 군으로부터 선택된 적어도 하나의 다른 지질을 포함한다.
일부 실시양태에서, 양이온성 지질은 이온화 가능한 양이온성 지질이다. 일 실시양태에서, 지질 나노입자 제형은 (i) 적어도 하나의 양이온성 지질; (ii) 헬퍼 지질; (iii) 스테롤(예를 들어, 콜레스테롤); 및 (iv) 약 30% 내지 약 60% 이온화 가능한 양이온성 지질: 약 5% 내지 약 20% 헬퍼 지질: 약 35% 내지 약 50% 스테롤: 약 0.5-5% PEG-지질의 몰비의 PEG-지질로 이루어진다. 예시적인 양이온성 지질(이온화 가능한 양이온성 지질 포함), 헬퍼 지질(예를 들어, 중성 지질), 스테롤 및 리간드-함유 지질(예를 들어, PEG-지질)은 본원에서 하기에 기재되어 있다.
특정 지질 및 이들의 상대적 % 조성물의 선택은 원하는 치료 효과, 의도된 생체내 전달 표적, 및 계획된 투여 용법 및 빈도를 포함하는 몇몇 인자에 의존한다. 일반적으로, 높은 효능(즉, 녹다운 활성 또는 번역 효율과 같은 치료 효과) 및 신속한 조직 제거를 초래하는 생분해성 둘 모두에 상응하는 지질이 가장 바람직하다. 그러나, 생분해성은 대상체 내에서 단지 1회 또는 2회의 투여를 위해 의도된 제형에 대해서는 덜 중요할 수 있다. 또한, 지질 조성물은 지질 제형이 생체내 투여 및 의도된 표적으로의 이의 이동(journey) 동안 이의 모폴로지를 보존하지만, 이어서 표적 세포로의 흡수 시 활성제를 방출할 수 있도록 신중한 조작을 필요로 할 수 있다. 따라서, 활성 성분에 대한 총 지질의 비율뿐만 아니라 지질의 최상의 가능한 몰비에서 지질의 최상의 가능한 조합을 찾기 위해 여러 제형을 평가할 필요가 있다.
적합한 지질 성분 및 지질 나노입자를 제조하는 방법은 당업계에 잘 알려져 있으며, 예를 들어 PCT/US2020/023442, U.S. 8,058,069, U.S. 8,822,668, U.S. 9,738,593, U.S. 9,139,554, PCT/US2014/066242, PCT/US2015/030218, PCT/2017/015886, 및 PCT/US2017/067756에 기재되어 있으며, 이들의 내용은 참조로 포함된다.
양이온성 지질
지질 제형은 바람직하게는 양이온성 리포좀 또는 지질 나노입자를 형성하기에 적합한 양이온성 지질을 포함한다. 양이온성 지질은 음으로 하전된 막에 결합하여 흡수를 유도할 수 있기 때문에 핵산 전달을 위해 널리 연구되고 있다. 일반적으로, 양이온성 지질은 양성 친수성 헤드 기, 2개 (또는 그 이상)의 친유성 테일, 또는 스테로이드 부분과 이들 두 도메인 사이의 커넥터를 포함하는 양친매성 물질이다. 바람직하게는, 양이온성 지질은 약 생리학적 pH에서 순 양전하를 보유한다. 양이온성 리포좀은 전통적으로 플라스미드 DNA, 안티센스 올리고 및 siRNA/소형 헤어핀 RNA-shRNA를 포함한 올리고뉴클레오티드에 가장 일반적으로 사용되는 비-바이러스 전달 시스템이었다. DOTAP, (1,2-디올레오일-3-트리메틸암모늄-프로판) 및 DOTMA(N-[1-(2,3-디올레오일옥시)프로필]-N,N,N-트리메틸-암모늄 메틸 설페이트)와 같은 양이온성 지질은 정전기적 상호작용에 의해 음으로 하전된 핵산과 복합체 또는 리포플렉스를 형성하여 높은 시험관내 형질감염 효율을 제공할 수 있다.
현재 개시된 지질 제형에서, 양이온성 지질은, 예를 들어, ((4-하이드록시부틸)아잔디일)비스(헥산-6,1-디일)비스(2-헥실데카노에이트)(ALC-0315로도 알려짐), N,N-디올레일-N,N-디메틸암모늄 클로라이드(DODAC), N,N-디스테아릴-N,N-디메틸암모늄 브로마이드(DDAB), 1,2-디올레오일트리메틸암모늄프로판 클로라이드(DOTAP) (N-(2,3-디올레오일옥시)프로필로도 알려짐)-N,N,N-트리메틸암모늄 클로라이드 및 1,2-디올레일옥시-3-트리메틸아미노프로판 클로라이드 염), N-(1-(2,3-디올레일옥시)프로필)-N,N,N-트리메틸암모늄 클로라이드(DOTMA), N,N-디메틸-2,3-디올레일옥시)프로필아민(DODMA), 1,2-디리놀레일옥시-N,N-디메틸아미노프로판(DLinDMA), 1,2-디리놀레닐옥시-N,N-디메틸아미노프로판(DLenDMA), 1,2-디-y-리놀레닐옥시-N,N-디메틸아미노프로판(γ-DLenDMA), 1,2-디리놀레일카바모일옥시-3-디메틸아미노프로판(DLin-C-DAP), 1,2-디리놀레일옥시-3-(디메틸아미노)아세톡시프로판(DLin-DAC), 1,2-디리놀레오일-3-디메틸아미노프로판(DLinDAP), 1,2-디리놀레오일티오-3-디메틸아미노프로판(DLin-S-DMA), 1-리놀레오일-2-리놀레일옥시-3-디메틸아미노프로판(DLin-2-DMAP), 1,2-디리놀레일옥시-3-트리메틸아미노프로판 클로라이드 염(DLin-TMA.Cl), 1,2-디리놀레오일-3-트리메틸아미노프로판 클로라이드 염(DLin-TAP.Cl), 1,2-디리놀레일옥시-3-(N-메틸피페라지노)프로판(DLin-MPZ), 또는 3-(N,N-디리놀레일아미노)-1,2-프로판디올(DLinAP), 3-(N,N-디올레일아미노)-1,2-프로판디올(DOAP), 1,2-디리놀레일옥소-3-(2-N,N-디메틸아미노)에톡시프로판(DLin-EG-DMA), 2,2-디리놀레일-4-디메틸아미노메틸-[1,3]-디옥솔란(DLin-K-DMA) 또는 이의 유사체, (3aR,5s,6aS)-N,N-디메틸-2,2-디((9Z,12Z)-옥타데카-9,12-디에닐)테트라하이드로-3aH-사이클로펜타[d][1,3]디옥솔-5-아민, (6Z,9Z,28Z,31Z)-헵타트리아콘타-6,9,28,31-테트라엔-19-일4-(디메틸아미노)부타노에이트(MC3), 1,1'-(2-(4-(2-((2-(비스(2-하이드록시도데실)아미노)에틸)(2-하이드록시도데실)아미노)에틸)피페라진-1-일)에틸아잔디일)디도데칸-2-올(C12-200), 2,2-디리놀레일-4-(2-디메틸아미노에틸)-[1,3]-디옥솔란(DLin-K-C2-DMA), 2,2-디리놀레일-4-디메틸아미노메틸-[1,3]-디옥솔란(DLin-K-DMA), (6Z,9Z,28Z,31Z)-헵타트리아콘타-6,9,28,31-테트라엔-19-일 4-(디메틸아미노)부타노에이트(DLin-M-C3-DMA), 3-((6Z,9Z,28Z,31Z)-헵타트리아콘타-6,9,28,31-테트라엔-19-일옥시)-N,N-디메틸프로판-1-아민(MC3 에테르), 4-((6Z,9Z,28Z,31Z)-헵타트리아콘타-6,9,28,31-테트라엔-19-일옥시)-N,N-디메틸부탄-1-아민(MC4 Ether) 또는 이들의 조합일 수 있다. 다른 양이온성 지질은 N,N-디스테아릴-N,N-디메틸암모늄 브로마이드(DDAB), 3P-(N-(N',N'-디메틸아미노에탄)-카바모일)콜레스테롤(DC-Choi), N-(1-(2,3-디올레일옥시)프로필)-N-2-(스페르민카복스아미도)에틸)-N,N-디메틸암모늄 트리플루오르아세테이트(DOSPA), 디옥타데실아미도글리실 카복시스페민(DOGS), 1,2-딜레오일-sn-3-포스포에탄올아민(DOPE), 1,2-디올레오일-3-디메틸암모늄 프로판(DODAP), N-(1,2-디미리스틸옥시프로프-3-일)-N,N-디메틸-N-하이드록시에틸 암모늄 브로마이드(DMRIE), 및 2,2-디리놀레일-4-디메틸아미노에틸-[1,3]-디옥솔란(XTC)을 포함하지만 이에 제한되지 않는다. 추가적으로, 예를 들어 LIPOFECTIN(GIBCO/BRL에서 입수 가능한 DOTMA 및 DOPE 포함) 및 리포펙타민(GIBCO/BRL에서 입수 가능한 DOSPA 및 DOPE 포함)과 같은 양이온성 지질의 상업적 제제가 사용될 수 있다.
다른 적합한 양이온성 지질은 국제 공개 번호 WO 09/086558, WO 09/127060, WO 10/048536, WO 10/054406, WO 10/088537, WO 10/129709, 및 WO 2011/153493; 미국 특허 공개 번호 2011/0256175, 2012/0128760, 및 2012/0027803; 미국 특허 번호 8,158,601; 및 문헌(Love et al., PNAS, 107(5), 1864-69, 2010)에 개시되어 있으며, 이들의 내용은 본원에 참조로 포함된다.
다른 적합한 양이온성 지질은 알킬 치환기가 상이한 것들(예를 들어, N-에틸-N-메틸아미노-, 및 N-프로필-N-에틸아미노-)을 포함하는 대안적인 지방산 기 및 다른 디알킬아미노 기를 갖는 것들을 포함한다. 이러한 지질은 아미노 지질로 지칭되는 양이온성 지질의 하위범주의 일부이다. 본원에 기재된 지질 제형의 일부 실시양태에서, 양이온성 지질은 아미노 지질이다. 일반적으로, 덜 포화된 아실 사슬을 갖는 아미노 지질은 특히 복합체가 필터 살균 목적을 위해 약 0.3 미크론 미만으로 크기가 조정되어야 하는 경우에 보다 쉽게 크기가 조정된다. C14 내지 C22 범위의 탄소 사슬 길이를 갖는 불포화 지방산을 함유하는 아미노 지질이 사용될 수 있다. 다른 스캐폴드는 또한 아미노 기와 아미노 지질의 지방산 또는 지방 알킬 부분을 분리하는 데 사용될 수 있다.
일부 실시양태에서, 지질 제형은 특허 출원 PCT/EP2017/064066에 따른 화학식 I을 갖는 양이온성 지질을 포함한다. 이와 관련하여, PCT/EP2017/064066의 개시내용 또한 본원에 참조로 포함된다.
일부 실시양태에서, 본 개시내용의 아미노 또는 양이온성 지질은 이온화 가능하고, 적어도 하나의 양성자화 가능한 기 또는 탈양성자화 가능한 기를 가져서, 지질은 생리학적 pH 이하의 pH(예를 들어, pH 7.4)에서 양으로 하전되고, 제2 pH, 바람직하게는 생리학적 pH 이상에서는 중성이다. 물론, pH의 함수로서 양성자의 추가 또는 제거는 평형 과정이며, 하전을 띤 지질 또는 중성 지질에 대한 언급은 우세한 종의 성질을 지칭하며 모든 지질은 하전을 띤 형태 또는 중성 형태로 존재할 것을 필요로 하지 않는다는 것이 이해될 것이다. 하나 초과의 양성자화 가능한 기 또는 탈양성자화 가능한 기를 갖거나 양쪽이온성인 지질은 본 개시내용에서의 사용에서 배제되지 않는다. 특정 실시양태에서, 양성자화 가능한 지질은 약 4 내지 약 11의 범위의 양성자화 가능한 기의 pKa를 갖는다. 일부 실시양태에서, 이온화 가능한 양이온성 지질은 약 5 내지 약 7의 pKa를 갖는다. 일부 실시양태에서, 이온화 가능한 양이온성 지질의 pKa는 약 6 내지 약 7이다.
일부 실시양태에서, 지질 제형은 화학식 I의 이온화 가능한 양이온성 지질 또는 이의 약학적으로 허용되는 염 또는 용매화물을 포함한다:
[화학식 I]
상기 식에서, R5 및 R6은 각각 독립적으로 선형 또는 분지형 C1-C31 알킬, C2-C31 알케닐 또는 C2-C31 알키닐 및 콜레스테릴로 이루어진 군으로부터 선택되고; L5 및 L6은 각각 독립적으로 선형 C1-C20 알킬 및 C2-C20 알케닐로 이루어진 군으로부터 선택되고; X5는 -C(O)O-이며 이에 따라 -C(O)O-R6이 형성되거나, -OC(O)-이며 이에 따라 -OC(O)-R6이 형성되고; X6은 -C(O)O-이며 이에 따라 -C(O)O-R5가 형성되거나, -OC(O)-이며 이에 따라 -OC(O)-R5가 형성되고; X7은 S 또는 O이고; L7은 부재이거나 저급 알킬이고; R4는 선형 또는 분지형 C1-C6 알킬이고; R7 및 R8은 각각 독립적으로 수소 및 선형 또는 분지형 C1-C6 알킬로 이루어진 군으로부터 선택된다.
일부 실시양태에서, X7은 S이다.
일부 실시양태에서, X5는 -C(O)O-이며 이에 따라 -C(O)O-R6이 형성되고, X6은 -C(O)O-이며 이에 따라 -C(O)O-R5가 형성된다.
일부 실시양태에서, R7 및 R8은 각각 독립적으로 메틸, 에틸 및 이소프로필로 이루어진 군으로부터 선택된다.
일부 실시양태에서, L5 및 L6은 각각 독립적으로 C1-C10 알킬이다. 일부 실시양태에서, L5는 C1-C3 알킬이고, L6은 C1-C5 알킬이다. 일부 실시양태에서, L6은 C1-C2 알킬이다. 일부 실시양태에서, L5 및 L6은 각각 선형 C7 알킬이다. 일부 실시양태에서, L5 및 L6은 각각 선형 C9 알킬이다.
일부 실시양태에서, R5 및 R6은 각각 독립적으로 알케닐이다. 일부 실시양태에서, R6은 알케닐이다. 일부 실시양태에서, R6은 C2-C9 알케닐이다. 일부 실시양태에서, 알케닐은 단일 이중 결합을 포함한다. 일부 실시양태에서, R5 및 R6은 각각 알킬이다. 일부 실시양태에서, R5는 분지형 알킬이다. 일부 실시양태에서, R55 및 R6은 각각 독립적으로 C9 알킬, C9 알케닐 및 C9 알키닐로 이루어진 군으로부터 선택된다. 일부 실시양태에서, R5 및 R6은 각각 독립적으로 C11 알킬, C11 알케닐 및 C11 알키닐로 이루어진 군으로부터 선택된다. 일부 실시양태에서, R5 및 R6은 각각 독립적으로 C7 알킬, C7 알케닐 및 C7 알키닐로 이루어진 군으로부터 선택된다. 일부 실시양태에서, R5는 -CH((CH2)pCH3)2 또는 -CH((CH2)pCH3)((CH2)p-1CH3)이고, 여기서 p는 4-8이다. 일부 실시양태에서, p는 5이고, L5는 C1-C3 알킬이다. 일부 실시양태에서, p는 6이고, L5는 C3 알킬이다. 일부 실시양태에서, p는 7이다. 일부 실시양태에서, p는 8이고, L5는 C1-C3 알킬이다. 일부 실시양태에서, R5는 -CH((CH2)pCH3)((CH2)p-1CH3)로 이루어지고, 여기서 p는 7 또는 8이다.
일부 실시양태에서, R4는 에틸렌 또는 프로필렌이다. 일부 실시양태에서, R4는 n-프로필렌 또는 이소부틸렌이다.
일부 실시양태에서, L7은 부재이고, R4는 에틸렌이고, X7은 S이고, R7 및 R8은 각각 메틸이다. 일부 실시양태에서, L7은 부재이고, R4는 n-프로필렌이고, X7은 S이고, R7 및 R8은 각각 메틸이다. 일부 실시양태에서, L7은 부재이고, R4는 에틸렌이고, X7은 S이고, R7 및 R8은 각각 에틸이다.
일부 실시양태에서, X7은 S이고, X5는 -C(O)O-이며 이에 따라 -C(O)O-R6이 형성되고 X6은 -C(O)O-이며 이에 따라 -C(O)O-R5가 형성되고, L5 및 L6은 각각 독립적으로 선형 C3-C7 알킬이고, L7은 부재이고, R5는 -CH((CH2)pCH3)2이고, R6은 C7-C12 알케닐이다. 일부 추가의 실시양태에서, p는 6이고, R6은 C9 알케닐이다.
일부 실시양태에서, 지질 제형은 하기로 이루어진 군으로부터 선택된 이온화 가능한 양이온성 지질을 포함한다:
일부 실시양태에서, 본원에 인용된 임의의 하나 이상의 지질은 명시적으로 배제될 수 있다.
헬퍼 지질 및 스테롤
본 개시내용의 RNA 레플리콘-지질 제형은 중성 지질, 중성 헬퍼 지질, 비-양이온성 지질, 비-양이온성 헬퍼 지질, 음이온성 지질, 음이온성 헬퍼 지질, 또는 양쪽이온성 지질로서 지칭될 수 있는 헬퍼 지질을 포함할 수 있다. 지질 제형, 특히 양이온성 리포좀 및 지질 나노입자는 헬퍼 지질이 제형에 존재하는 경우 세포 흡수를 증가시키는 것으로 밝혀졌다(Curr. Drug Metab. 2014; 15(9):882-92). 예를 들어, 일부 연구에서는 양쪽이온성 지질보다 더 융합성(fusogenic)인(즉, 융합을 촉진함) 1,2-디올레오일-sn-글리세로-3-포스파티딜콜린(DOPC), 디-올레오일-포스파티딜-에탄올알라민(DOPE) 및 1,2-디스테아로일-sn-글리세로-3-포스포콜린(DSPC)과 같은 중성 및 양쪽이온성 지질이 지질-핵산 복합체의 다형성 특징에 영향을 미쳐 층상에서 육방상으로의 전이를 촉진하여 융합 및 세포막 분열을 유도할 수 있는 것을 나타내었다(Nanomedicine (Lond). 2014 Jan; 9(1):105-20). 또한, 헬퍼 지질의 사용은 독성 및 면역원성과 같은 널리 퍼진 많은 양이온성 지질을 사용함으로써 임의의 잠재적인 해로운 영향을 감소시키는 데 도움이 될 수 있다.
본 개시내용의 지질 제형에 적합한 비-양이온성 지질의 비제한적인 예는 인지질, 예컨대 레시틴, 포스파티딜에탄올아민, 리소레시틴, 리소포스파티딜에탄올아민, 포스파티딜세린, 포스파티딜이노시톨, 스핑고미엘린, 에그 스핑고미엘린(ESM), 세팔린, 카디오리핀, 포스파티드산, 세레브로사이드, 디세틸포스페이트, 디스테아로일포스파티딜콜린(DSPC), 디올레오일포스파티딜콜린(DOPC), 디팔미토일포스파티딜콜린(DPPC), 디올레오일포스파티딜글리세롤(DOPG), 디팔미토일포스파티딜글리세롤(DPPG), 디올레오일포스파티딜에탄올아민(DOPE), 팔미토일올레오일-포스파티딜콜린(POPC), 팔미토일올레오일-포스파티딜에탄올아민(POPE), 팔미토일올레오일-포스파티딜글리세롤(POPG), 디올레오일포스파티딜에탄올아민 4-(N-말레이미도메틸)-사이클로헥산-1-카복실레이트(DOPE-mal), 디팔미토일-포스파티딜에탄올아민(DPPE), 디미리스토일-포스파티딜에탄올아민(DMPE), 디스테아로일-포스파티딜에탄올아민(DSPE), 모노메틸-포스파티딜에탄올아민, 디메틸-포스파티딜에탄올아민, 디엘라이도일-포스파티딜에탄올아민(DEPE), 스테아로일올레오일-포스파티딜에탄올아민(SOPE), 리소포스파티딜콜린, 디리놀레오일포스파티딜콜린 및 이들의 혼합물을 포함한다. 기타 디아실포스파티딜콜린 및 디아실포스파티딜에탄올아민 인지질도 사용될 수 있다. 이들 지질 내의 아실 기는 바람직하게는 C10-C24 탄소 사슬을 갖는 지방산으로부터 유도된 아실 기, 예를 들어, 라우로일, 미리스토일, 팔미토일, 스테아로일, 또는 올레오일이다.
비-양이온성 지질의 추가의 예는 스테롤, 예컨대 콜레스테롤 및 이의 유도체를 포함한다. 한 연구에서는 헬퍼 지질로서 콜레스테롤이 핵산과 접촉하는 지질층의 전하 간격을 증가시켜 전하 분포가 핵산의 전하 분포와 더 밀접하도록 만든다고 결론지었다(J. R. Soc. Interface. 2012 Mar 7; 9(68): 548-561). 콜레스테롤 유도체의 비제한적인 예는 극성 유사체, 예컨대 5α-콜레스타놀, 5α-코프로스타놀, 콜레스테릴-(2'-하이드록시)-에틸 에테르, 콜레스테릴-(4'-하이드록시)-부틸 에테르, 및 6-케토콜레스타놀; 비극성 유사체, 예컨대 5α-콜레스탄, 콜레스테논, 5α-콜레스타논, 5α-콜레스타논, 및 콜레스테릴 데카노에이트; 및 이들의 혼합물을 포함한다. 바람직한 실시양태에서, 콜레스테롤 유도체는 극성 유사체, 예컨대 콜레스테릴-(4'-하이드록시)-부틸 에테르이다.
일부 실시양태에서, 지질 제형에 존재하는 헬퍼 지질은 하나 이상의 인지질과 콜레스테롤 또는 이의 유도체의 혼합물을 포함하거나 이로 이루어진다. 다른 실시양태에서, 지질 제형에 존재하는 헬퍼 지질은 하나 이상의 인지질, 예를 들어 콜레스테롤 비함유 지질 제형을 포함하거나 이로 이루어진다. 또 다른 실시양태에서, 지질 제형에 존재하는 헬퍼 지질은 콜레스테롤 또는 이의 유도체, 예를 들어, 인지질 비함유 지질 제형을 포함하거나 이로 이루어진다.
헬퍼 지질의 다른 예는 예를 들어, 스테아릴아민, 도데실아민, 헥사데실아민, 아세틸 팔미테이트, 글리세롤 리시놀레이트, 헥사데실 스테아레이트, 이소프로필 미리스테이트, 양쪽성 아크릴 중합체, 트리에탄올아민-라우릴 설페이트, 알킬-아릴 설페이트 폴리에틸옥실화 지방산 아미드, 디옥타데실디메틸암모늄 브로마이드, 세라마이드 및 스핑고미엘린과 같은 비-인 함유 지질을 포함한다.
일부 실시양태에서, 헬퍼 지질은 지질 제형에 존재하는 총 지질의 약 30 mol% 내지 약 60 mol%, 약 32 mol% 내지 약 58 mol%, 약 34 mol% 내지 약 56 mol%, 약 35 mol% 내지 약 54 mol%, 약 36 mol% 내지 약 52 mol%, 약 37 mol% 내지 약 51 mol%, 약 38 mol% 내지 약 50 mol%, 또는 약 39 mol%, 약 50 mol%, 약 41 mol%, 약 42 mol%, 약 43 mol%, 약 44 mol%, 약 45 mol%, 약 46 mol%, 약 47 mol%, 약 48 mol%, 또는 약 49 mol% (또는 이의 임의의 분율 또는 그 안의 범위)를 구성한다.
일부 실시양태에서, 제형 중 헬퍼 지질의 총량은 2개 초과의 헬퍼 지질을 포함하고 헬퍼 지질의 총량은 지질 제형에 존재하는 총 지질의 약 30 mol% 내지 약 60 mol%, 약 32 mol% 내지 약 58 mol%, 약 34 mol% 내지 약 56 mol%, 약 35 mol% 내지 약 54 mol%, 약 36 mol% 내지 약 52 mol%, 약 37 mol% 내지 약 51 mol%, 약 38 mol% 내지 약 50 mol%, 또는 약 39 mol%, 약 50 mol%, 약 41 mol%, 약 42 mol%, 약 43 mol%, 약 44 mol%, 약 45 mol%, 약 46 mol%, 약 47 mol%, 약 48 mol%, 또는 약 49 mol% (또는 이의 임의의 분율 또는 그 안의 범위)를 포함한다. 일부 실시양태에서, 헬퍼 지질은 DSPC와 DOTAP의 조합이다. 일부 실시양태에서, 헬퍼 지질은 DSPC와 DOTMA의 조합이다.
지질 제형 중 콜레스테롤 또는 콜레스테롤 유도체는 지질 제형에 존재하는 총 지질의 약 50 mol%, 약 35 mol%, 약 40 mol%, 약 45 mol% 또는 약 50 mol% 이하를 구성할 수 있다. 일부 실시양태에서, 콜레스테롤 또는 콜레스테롤 유도체는 지질 제형에 존재하는 총 지질의 약 15 mol% 내지 약 45 mol%, 약 20 mol% 내지 약 45 mol%, 약 30 mol% 내지 약 45 mol%, 또는 약 35 mol%, 약 36 mol%, 약 37 mol%, 약 38 mol%, 약 39 mol%, 약 40 mol%, 약 41 mol%, 약 42 mol%, 약 43 mol%, 약 44 mol%, 또는 약 45 mol%를 구성한다.
지질 제형에 존재하는 헬퍼 지질의 백분율은 목표량이며 제형에 존재하는 헬퍼 지질의 실제 양은 예를 들어 ± 5 mol%까지 변할 수 있다.
양이온성 지질 화합물 또는 이온화 가능한 양이온성 지질 화합물을 함유하는 지질 제형은 몰 기준으로 약 30-60%의 양이온성 지질 화합물, 약 35-50%의 콜레스테롤, 약 5-20%의 헬퍼 지질, 및 약 0.5-5%의 폴리에틸렌 글리콜(PEG) 지질일 수 있으며, 여기서 퍼센트는 제형에 존재하는 총 지질의 퍼센트이다. 일부 실시양태에서, 조성물은 약 40-50%의 양이온성 지질 화합물, 약 35-45%의 콜레스테롤, 약 5-15%의 헬퍼 지질, 및 약 0.5-3%의 PEG 지질이며, 여기서 퍼센트는 제형에 존재하는 총 지질의 퍼센트이다.
지질 접합체
본원에 기재된 지질 제형은 지질 접합체를 추가로 포함할 수 있다. 접합 지질은 입자의 응집을 방지하는데 유용하다. 적합한 접합 지질은 PEG-지질 접합체, 양이온성-중합체-지질 접합체, 및 이들의 혼합물을 포함하지만 이에 제한되지는 않는다. 또한, 지질 전달 비히클은 리간드(예를 들어, 항체, 펩타이드 및 탄수화물)를 이의 표면 또는 부착된 PEG 사슬의 말단에 부착시킴으로써 특이적 표적화에 사용될 수 있다(Front. Pharmacol. 2015 Dec 1; 6:286).
바람직한 실시양태에서, 지질 접합체는 PEG-지질이다. 폴리에틸렌 글리콜(PEG)을 코팅 또는 표면 리간드로서 지질 제형에 포함시키는 것은, 페길화로 지칭되는 기술로서, 면역계로부터 나노입자를 보호하고 RES 흡수로부터 벗어나는 데 도움이 된다(Nanomedicine (Lond). 2011 Jun; 6(4):715-28). 페길화는 물리적, 화학적 및 생물학적 메커니즘을 통해 지질 제형 및 이들의 페이로드를 안정화시키는 데 널리 사용되었다. 세제-유사 PEG 지질(예를 들어, PEG-DSPE)은 지질 제형에 들어가 표면 상에 수화된 층과 입체 장벽을 형성할 수 있다. 페길화의 정도에 따라, 표면층은 일반적으로 브러시-유사 층과 버섯-유사 층의 두 가지 유형으로 나눌 수 있다. PEG-DSPE-안정화된 제형의 경우, PEG는 낮은 페길화 정도(일반적으로 5 mol% 미만)에서 버섯 형태를 취할 것이고, PEG-DSPE의 함량이 일정 수준 이상으로 증가함에 따라 브러시 형태로 전환될 것이다(J. Nanomaterials. 2011;2011:12). 증가된 페길화는 지질 제형의 순환 반감기의 유의한 증가를 유발하는 것으로 나타났다(Annu. Rev. Biomed. Eng. 2011 Aug 15; 13:507-30; J. Control Release. 2010 Aug 3; 145(3):178-81).
PEG-지질의 적합한 예는 디알킬옥시프로필에 결합된 PEG(PEG-DAA), 디아실글리세롤에 결합된 PEG(PEG-DAG), 인지질에 결합된 PEG, 예컨대 포스파티딜에탄올아민(PEG-PE), 세라미드에 접합된 PEG, 콜레스테롤에 접합된 PEG 또는 이들의 유도체, 및 이들의 혼합물을 포함하지만 이에 제한되지 않는다.
PEG는 2개의 말단 하이드록실 기를 갖는 에틸렌 PEG 반복 단위의 선형 수용성 중합체이다. PEG는 이들의 분자량에 따라 분류되며 하기를 포함하다: 모노메톡시폴리에틸렌 글리콜(MePEG-OH), 모노메톡시폴리에틸렌 글리콜-석시네이트(MePEG-S), 모노메톡시폴리에틸렌 글리콜-석신이미딜 석시네이트(MePEG-S-NHS), 모노메톡시폴리에틸렌 글리콜-아민(MePEG-NH2), 모노메톡시폴리에틸렌 글리콜-트레실레이트(MePEG-TRES), 모노메톡시폴리에틸렌 글리콜-이미다졸릴-카보닐(MePEG-IM)뿐만 아니라 말단 메톡시 기 대신 말단 하이드록실 기를 포함하는 그러한 화합물(예를 들어, HO-PEG-S, HO-PEG-S-NHS, HO-PEG-NH2).
본원에 기재된 PEG-지질 접합체의 PEG 모이어티는 약 550 달톤 내지 약 10,000 달톤 범위의 평균 분자량을 포함할 수 있다. 특정 경우에, PEG 모이어티는 약 750 달톤 내지 약 5,000 달톤(예를 들어, 약 1,000 달톤 내지 약 5,000 달톤, 약 1,500 달톤 내지 약 3,000 달톤, 약 750 달톤 내지 약 3,000 달톤, 약 750 달톤 내지 약 2,000 달톤)의 평균 분자량을 갖는다. 바람직한 실시양태에서, PEG 모이어티는 약 2,000 달톤 또는 약 750 달톤의 평균 분자량을 갖는다. 평균 분자량은 종말점을 포함하여 인용된 범위 내의 임의의 값 또는 하위값일 수 있다.
특정 경우에, PEG 단량체는 알킬, 알콕시, 아실, 또는 아릴 기에 의해 선택적으로 치환될 수 있다. PEG는 지질에 직접 접합될 수 있거나, 링커 모이어티를 통해 지질에 연결될 수 있다. 예를 들어, 비-에스테르-함유 링커 모이어티 및 에스테르-함유 링커 모이어티를 포함하여 PEG를 지질에 결합시키기에 적합한 임의의 링커 모이어티가 사용될 수 있다. 바람직한 실시양태에서, 링커 모이어티는 비-에스테르-함유 링커 모이어티이다. 적합한 비-에스테르-함유 링커 모이어티는 아미도(-C(O)NH-), 아미노(-NR-), 카보닐(-C(O)-), 카바메이트(-NHC(O)O-), 우레아(-NHC(O)NH-), 디설파이드(-S-S-), 에테르(-O-), 석시닐(-(O)CCH2CH2C(O)-), 석신아미딜(-NHC(O)CH2CH2C(O)NH-), 에테르 및 이들의 조합(예컨대, 카바메이트 링커 모이어티와 아미도 링커 모이어티 둘 모두를 포함하는 링커)을 포함하지만 이에 제한되지 않는다. 바람직한 실시양태에서, 카바메이트 링커는 PEG를 지질에 결합시키는데 사용된다.
다른 실시양태에서, 에스테르-함유 링커 모이어티는 PEG를 지질에 결합시키는 데 사용된다. 적합한 에스테르-함유 링커 모이어티는, 예를 들어, 카보네이트(-OC(O)O-), 석시노일, 포스페이트 에스테르(-O-(O)POH-O-), 설포네이트 에스테르, 및 이들의 조합을 포함한다.
다양한 사슬 길이 및 포화도의 다양한 아실 사슬 기를 갖는 포스파티딜에탄올아민은 PEG에 접합되어 지질 접합체를 형성할 수 있다. 그러한 포스파티딜에탄올아민은 상업적으로 입수 가능하거나, 당업자에게 공지된 기존의 기술을 사용하여 단리 또는 합성될 수 있다. C10 내지 C20 범위의 탄소 사슬 길이를 갖는 포화 또는 불포화 지방산을 함유하는 포스파티딜에탄올아민이 바람직하다. 모노- 또는 디-불포화 지방산 및 포화 및 불포화 지방산의 혼합물을 갖는 포스파티딜에탄올아민이 또한 사용될 수 있다. 적합한 포스파티딜에탄올아민은 디미리스토일-포스파티딜에탄올아민(DMPE), 디팔미토일-포스파티딜에탄올아민(DPPE), 디올레오일-포스파티딜에탄올아민(DOPE), 및 디스테아로일-포스파티딜에탄올아민(DSPE)을 포함하지만 이에 제한되지 않는다.
일부 실시양태에서, PEG-DAA 접합체는 PEG-디데실옥시프로필(C10) 접합체, PEG-디라우릴옥시프로필(C12) 접합체, PEG-디미리스틸옥시프로필(C14) 접합체, PEG-디팔미틸옥시프로필(C16) 접합체, 또는 PEG-디스테아릴옥시프로필(C18) 접합체이다. 이들 실시양태에서, PEG는 바람직하게는 약 750 내지 약 2,000 달톤의 평균 분자량을 갖는다. 특정 실시양태에서, PEG의 말단 하이드록실 기는 메틸기로 치환된다.
전술한 것 이외에, PEG 대신에 다른 친수성 중합체가 사용될 수 있다. PEG 대신에 사용될 수 있는 적합한 중합체의 예는 폴리비닐피롤리돈, 폴리메틸옥사졸린, 폴리에틸옥사졸린, 폴리하이드록시프로필, 메타크릴아미드, 폴리메타크릴아미드, 및 폴리디메틸아크릴아미드, 폴리락트산, 폴리글리콜산, 및 유도체화된 셀룰로스, 예컨대 하이드록시메틸셀룰로스 또는 하이드록시에틸셀룰로스를 포함하지만 이에 제한되지 않는다.
일부 실시양태에서, 지질 접합체(예를 들어, PEG-지질)는 지질 제형에 존재하는 총 지질의 약 0.1 mol% 내지 약 2 mol%, 약 0.5 mol% 내지 약 2 mol%, 약 1 mol% 내지 약 2 mol%, 약 0.6 mol% 내지 약 1.9 mol%, 약 0.7 mol% 내지 약 1.8 mol%, 약 0.8 mol% 내지 약 1.7 mol%, 약 0.9 mol% 내지 약 1.6 mol%, 약 0.9 mol% 내지 약 1.8 mol%, 약 1 mol% 내지 약 1.8 mol%, 약 1 mol% 내지 약 1.7 mol%, 약 1.2 mol% 내지 약 1.8 mol%, 약 1.2 mol% 내지 약 1.7 mol%, 약 1.3 mol% 내지 약 1.6 mol%, 또는 약 1.4 mol% 내지 약 1.6 mol% (또는 이의 임의의 분율 또는 그 안의 범위)를 구성한다. 다른 실시양태에서, 지질 접합체(예를 들어, PEG-지질)는 지질 제형에 존재하는 총 지질의 약 0.5%, 0.6%, 0.7%, 0.8%, 0.9%, 1.0%, 1.2%, 1.3%, 1.4%, 1.5%, 1.6%, 1.7%, 1.8%, 1.9%, 2.0%, 2.5%, 3.0%, 3.5%, 4.0%, 4.5%, 또는 5%, (또는 이의 임의의 분율 또는 그 안의 범위)를 구성한다. 양은 종말점을 포함하여 인용된 범위 내의 임의의 값 또는 하위값일 수 있다.
일부 실시양태에서, PEG-지질은 PEG550-PE이다. 일부 실시양태에서, PEG-지질은 PEG750-PE이다. 일부 실시양태에서, PEG-지질은 PEG2000-DMG이다. 일부 바람직한 실시양태에서, PEG-지질은 2-[(폴리에틸렌 글리콜)-2000]-N,N-디테트라데실아세트아미드(ALC-0159로도 알려짐)이다.
본 개시내용의 지질 제형에 존재하는 지질 접합체(예를 들어, PEG-지질)의 백분율은 목표량이고, 제형에 존재하는 지질 접합체의 실제 양은, 예를 들어, ± 0.5 mol%까지 변할 수 있다. 당업자는 지질 접합체의 농도가 사용된 지질 접합체 및 지질 제형이 융합성이 되는 속도에 따라 변할 수 있다는 것을 이해할 것이다.
지질 제형의 세포 흡수에 대한 작용 메커니즘
핵산, 특히 리포좀, 양이온성 리포좀 및 지질 나노입자의 세포내 전달을 위한 지질 제형은 지질 전달 비히클의 내용물이 표적 세포의 세포질로 전달되는 표적 세포의 세포내이입(endocytic) 메커니즘의 이용을 통해 표적 세포에 침투함으로써 세포 흡수를 위해 설계된다(Nucleic Acid Therapeutics, 28(3):146-157, 2018). 구체적으로, 본원에 기재된 간세포를 표적으로 하는 RNA 레플리콘-지질 제형의 경우, mRNA-지질 제형은 수용체 매개 엔도사이토시스를 통해 간세포로 진입한다. 엔도사이토시스 전에, 지질 전달 비히클의 표면에서 PEG-지질과 같은 기능화된 리간드가 표면으로부터 떨어져 나와, 표적 세포로의 내재화를 촉발한다. 엔도사이토시스 동안, 세포의 원형질막의 일부는 벡터를 둘러싸고 그것을 소포에 집어넣은 다음, 세포막으로부터 떼어내 세포질로 들어가 궁극적으로 엔도리소좀 경로를 겪는다. 이온화 가능한 양이온성 지질-함유 전달 비히클의 경우, 엔도좀이 에이징함에 따라 증가된 산성도는 표면에 강한 양전하를 갖는 비히클을 초래한다. 이어서, 전달 비히클과 엔도좀 막 사이의 상호작용은 페이로드의 세포질 전달을 유발하는 막 융합 이벤트를 초래한다. RNA 페이로드의 경우, 세포 자체의 내부 번역 과정은 이어서 RNA 레플리콘 또는 핵산 분자의 조합을 인코딩된 단백질(예를 들어, HBV 항원)로 번역할 것이다. 인코딩된 단백질은 표적화된 세포기관 또는 세포 내 위치로의 수송을 포함하여 번역후 처리를 추가로 거칠 수 있다.
지질 접합체의 조성 및 농도를 제어함으로써, 지질 접합체가 지질 제형 밖으로 교환되는 속도 및 차례로 지질 제형이 융합성이 되는 속도를 조절할 수 있다. 또한, 예를 들어, pH, 온도, 또는 이온 강도를 포함하는 다른 변수를 사용하여 지질 제형이 융합성이 되는 속도를 변경 및/또는 조절할 수 있다. 지질 제형이 융합성이 되는 속도를 조절하기 위해 사용될 수 있는 다른 방법은 본 개시내용을 판독할 때 당업자에게 명백해질 것이다. 또한, 지질 접합체의 조성 및 농도를 제어함으로써, 리포좀 또는 지질 입자 크기를 조절할 수 있다.
지질 제형 제조
핵산, 예를 들어 RNA 레플리콘 또는 핵산 분자의 조합을 포함하는 지질 제형의 제조를 위한 많은 상이한 방법이 있다(Curr. Drug Metabol. 2014, 15, 882-892; Chem. Phys. Lipids 2014, 177, 8-18; Int. J. Pharm. Stud. Res. 2012, 3, 14-20). 박막 수화, 이중 에멀젼, 역상 증발, 미세유체 제조, 이중 비대칭 원심분리, 에탄올 주입, 세제 투석, 에탄올 희석에 의한 자발적 소포 형성, 및 미리 형성된 리포좀에서의 캡슐화 기술이 본원에 간략하게 설명되어 있다.
박막 수화
박막 수화(TFH: Thin Film Hydration) 또는 Bangham 방법에서 지질은 유기 용매에 용해시킨 다음, 회전 증발기를 사용하여 증발시켜 얇은 지질 층을 형성한다. 로딩될 화합물을 함유하는 수성 완충 용액에 의한 층 수화 후, 다중 층상 소포(MLV: Multilamellar Vesicle)가 형성되며, 이는 크기를 감소시켜 막을 통한 압출 또는 출발 MLV의 초음파 처리에 의해 소형 또는 대형 다중 층상 소포(LUV 및 SUV)를 생성할 수 있다.
이중 에멀젼
지질 제형은 물/유기 용매 혼합물에서 지질 용해를 수반하는 이중 에멀젼 기술을 통해서도 제조될 수 있다. 물방울을 함유하는 유기 용액은 과량의 수성 매질과 혼합되어 수중유중수(W/O/W: water-in-oil-in-water) 이중 에멀젼 형성을 유발한다. 기계적으로 격렬하게 진탕시킨 후, 물방울의 일부가 붕괴되어 대형 단일 층상 소포(LUV)가 생성된다.
역상 증발
역상 증발(REV: Reverse Phase Evaporation) 방법은 또한 핵산이 로딩된 LUV를 달성할 수 있게 한다. 이 기술에서는 인지질이 유기 용매 및 수성 완충액에 용해되어 2상 시스템이 형성된다. 이어서, 생성된 현탁액은 혼합물이 투명한 1 상 분산액이 될 때까지 간단히 초음파 처리된다. 지질 제형은 감압 하에 유기 용매 증발 후에 달성된다. 이 기술은 핵산을 포함한 다양한 크고 작은 친수성 분자를 캡슐화하는 데 사용되었다.
미세유체 제조
미세유체 방법은 다른 벌크 기술과 달리 지질 수화 과정을 제어할 수 있는 가능성을 제공한다. 상기 방법은 유동을 조작하는 방식에 따라 연속-유동 미세유체와 액적-기반 미세유체로 분류될 수 있다. 연속 유동 모드에서 작동하는 미세유체 유체역학 포커싱(MHF: microfluidic hydrodynamic focusing) 방법에서, 지질은 두 수성 완충액 스트림 사이의 미세채널 교차 접합(cross junction)에서 유체역학적으로 집속된 이소프로필 알코올에 용해된다. 소포 크기는 유속을 조절하여 지질 용액/완충액 희석 과정을 조절함으로써 조절될 수 있다. 상기 방법은 3개 입구 및 1개 출구 포트로 이루어진 미세유체 장치를 사용하여 올리고뉴클레오티드(ON) 지질 제형을 제조하는 데 사용될 수 있다.
이중 비대칭 원심분리
이중 비대칭 원심분리(DAC: Dual Asymmetric Centrifugation)는 자체 수직축을 중심으로 추가 회전을 사용하기 때문에 일반적인 원심분리와 다르다. 생성된 두 가지 중첩 움직임으로 인해 효율적인 균질화가 달성된다: 샘플은 일반 원심분리기에서와 같이 바깥쪽으로 밀려난 다음, 추가 회전으로 인해 바이알의 중앙으로 밀려난다. 지질과 NaCl-용액을 혼합함으로써 점성의 소포성 인지질 겔(VPC: vesicular phospholipid ge)이 달성되고, 이어서 희석되어 지질 제형 분산액을 수득한다. 지질 제형 크기는 DAC 속도, 지질 농도 및 균질화 시간을 최적화하여 조절할 수 있다.
에탄올 주사
에탄올 주입(EI) 방법은 핵산 캡슐화에 사용될 수 있다. 이 방법은 지질이 용해되는 에탄올 용액을 바늘을 사용하여 캡슐화할 핵산을 함유하는 수성 매질에 신속하게 주입하는 것을 제공한다. 소포는 인지질이 배지 전체에 분산될 때 자발적으로 형성된다.
세제 투석
세제 투석 방법은 핵산을 캡슐화하는 데 사용할 수 있다. 간단히 지질 및 플라스미드는 적절한 이온 강도의 세제 용액에 가용화되고, 투석에 의해 세제를 제거한 후, 안정화된 지질 제형이 형성된다. 캡슐화되지 않은 핵산은 이온-교환 크로마토그래피에 의해 제거되고, 빈 소포는 수크로스 밀도 구배 원심분리에 의해 제거된다. 이 기술은 양이온성 지질 함량과 투석 완충액의 염 농도에 매우 민감하며, 이 방법도 규모 조정이 어렵다.
에탄올 희석에 의한 자발적 소포 형성
안정한 지질 제형은 또한 단계적 또는 적하 에탄올 희석이 에탄올에 용해된 지질을 핵산을 함유하는 급속하게 혼합된 수성 완충액에 제어된 첨가에 의해 핵산이 로딩된 소포의 순간적 형성을 제공하는 에탄올 희석에 의한 자발적 소포 형성 방법을 통해 제조될 수 있다.
미리 형성된 리포좀의 캡슐화
핵산의 포획은 또한 두 가지 상이한 방법을 통해 미리 형성된 리포좀으로 시작하여 얻을 수 있다 : (1) "리포플렉스"라고 불리는 정전기적 복합체를 제공하는, 양이온성 리포좀과 핵산의 단순한 혼합으로, 여기서 이들은 세포 배양을 형질 감염시키는 데 성공적으로 사용될 수 있지만 낮은 캡슐화 효율과 생체내 불량한 성능을 특징으로 하며; (2) 리포좀 불안정화, 40% v/v 이하의 농도로 양이온성 소포의 현탁액에 무수 에탄올을 천천히 첨가한 후 핵산을 적가하여 로딩된 소포를 달성하지만, 캡슐화 공정을 특징짓는 두 가지 주요 단계는 너무 민감하여 입자의 크기를 줄여야 한다.
특정 실시양태에서, 지질 및 지질 나노입자의 예, 지질을 포함하는 약제학적 조성물, 지질을 제조하는 방법 또는 지질 및 핵산 분자를 포함하는 약제학적 조성물을 제형화하는 방법, 및 질환을 치료 또는 예방하기 위한 약제학적 조성물을 사용하는 방법은 미국 또는 국제 특허 출원 공보, 예컨대 US2017/0190661, US2017/0190661, US2006/0008910, US2015/0064242, US2005/0064595, WO2019/036030, US2019/0022247, WO2019/036028, WO2019/036008, WO2019/036000, US2016/0376224, US2017/0119904, WO2018/200943, WO2018/191657, WO2018/118102, US2018/0169268, WO2018/118102, WO2018/119163, US2014/0255472, 및 US2013/0195968에 기재되어 있으며 이들 각각의 관련 내용은 그 전문이 본원에 참조로 포함된다.
프라임/부스트 면역화 방법
본 출원의 실시양태는 또한 면역원적 유효량의 약제학적 조성물 또는 면역원성 조합물을 대상체에게 투여하는 단계 및 후속적으로 소위 프라임-부스트 용법으로서 면역원적 유효량의 약제학적 조성물 또는 면역원성 조합물의 또 다른 용량을 동일한 대상체에게 투여하는 단계를 고려한다. 따라서, 일 실시양태에서, 본 출원의 약제학적 조성물 또는 면역원성 조합물은 면역 반응을 프라이밍하기 위해 사용되는 프라이머 백신이다. 또 다른 실시양태에서, 본 출원의 약제학적 조성물 또는 면역원성 조합물은 면역 반응을 부스팅하기 위해 사용되는 부스터 백신이다. 본 출원의 프라이밍 및 부스팅 백신은 본원에 기재된 본 출원의 방법에 사용될 수 있다. 프라임-부스트 용법의 이러한 일반적인 개념은 백신 분야의 숙련가에게 잘 알려져 있다. 본원에 기재된 본 출원의 임의의 약제학적 조성물 및 면역원성 조합물은 HBV에 대한 면역 반응을 프라이밍 및/또는 부스팅하기 위한 프라이밍 및/또는 부스팅 백신으로서 사용될 수 있다. 바람직하게는, 대상체에게 백신접종을 위한 방법은 본 출원의 핵산 분자, 핵산 조합, 벡터, 또는 RNA 레플리콘을 포함하는 약제학적 조성물을 대상체에게 투여하는 단계 및 프라임-부스트 용법으로서 적어도 하나의 동일한 HBV 항원을 인코딩하는 핵산 분자를 포함하는 제2 조성물을 대상체에게 투여하는 단계를 포함한다.
본 출원의 일부 실시양태에서, 본 출원의 약제학적 조성물 또는 면역원성 조합물은 면역화를 프라이밍하기 위해 투여될 수 있다. 약제학적 조성물 또는 면역원성 조합물은 면역화 부스팅을 위해 재투여될 수 있다. 약제학적 조성물 또는 백신 조합물의 추가의 부스터 투여는 필요에 따라 용법에 선택적으로 추가될 수 있다. 애쥬번트는 면역화 부스팅을 위해 사용되는 본 출원의 약제학적 조성물에 존재하거나, 부스팅 면역화를 위한 본 출원의 약제학적 조성물 또는 면역원성 조합물과 함께 투여될 별도의 조성물로 존재하거나, 부스팅 면역화로서 그 자체로 투여될 수 있다. 애쥬번트가 용법에 포함되는 이러한 실시양태에서, 상기 애쥬번트는 바람직하게는 면역화 부스팅을 위해 사용된다.
프라임-부스트 용법의 예시적이고 비제한적인 예는 면역 반응을 프라이밍하기 위해 면역원적 유효량의 본 출원의 약제학적 조성물 또는 면역원성 조성물을 대상체에게 투여하는 단계; 및 후속적으로 면역 반응을 부스팅하기 위해 면역원적 유효량의 본 출원의 약제학적 조성물 또는 면역원성 조합물의 또 다른 용량을 투여하는 단계를 포함하고, 여기서 부스팅 면역화는 프라이밍 면역화가 처음 투여된 지 약 2 내지 6주, 바람직하게는 4주 후에 먼저 투여된다. 선택적으로, 프라이밍 면역화가 처음 투여된 지 약 10 내지 14주, 바람직하게는 12주 후, 약제학적 조성물 또는 면역원성 조합물, 또는 다른 애쥬번트의 추가 부스팅 면역화가 투여된다.
프라이밍 및 부스팅 조성물에서 항원은 동일할 필요는 없지만, 항원을 공유하거나 서로 실질적으로 유사해야 한다. 특정 실시양태에서, 부스팅 조성물의 벡터는 프라이밍 조성물, 예를 들어, 아데노바이러스 벡터, 변형된 백시니아 앙카라(MVA) 벡터, DNA, 또는 단백질과 상이하다. 본 발명의 프라이밍 및 부스팅 조성물은 각각 1, 2, 3 또는 다중 용량을 포함할 수 있다.
실시양태
실시양태 1은 핵산 분자 또는 조합으로서, 5'-말단에서 3'-말단의 순서로 하기를 포함하는 비-천연 발생 폴리뉴클레오티드 서열을 포함하는, 핵산 분자 또는 조합을 포함한다:
(1) 제1 B형 간염 바이러스(HBV) 항원을 인코딩하는 폴리뉴클레오티드 서열,
(2) 제1 내부 리보솜 진입 서열(IRES) 요소 또는 제1 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열, 및
제2 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열,
여기서 제1 및 제2 HBV 항원 중 적어도 하나는 HBV 표면 항원인, 핵산 분자 또는 조합을 포함한다.
실시양태 1a는 실시양태 1에 있어서, 제1 및 제2 HBV 항원은 HBV 코어 항원, HBV 폴리머라제(pol) 항원, 및 HBV 표면 항원으로 이루어진 군으로부터 독립적으로 선택되는, 핵산 분자 또는 조합을 포함한다.
실시양태 1b는 실시양태 1 또는 1a에 있어서, 제1 및 제2 HBV 항원 중 적어도 하나는 HBV Pre-S1 항원 또는 HBV PreS2.S 항원인, 핵산 분자 또는 조합을 포함한다.
실시양태 2는 실시양태 1 내지 1b 중 어느 한 실시양태에 있어서, 제1 또는 제2 HBV 항원 중 하나는 HBV 코어 항원 또는 HBV pol 항원인, 핵산 분자 또는 조합을 포함한다.
실시양태 3은 실시양태 1 내지 2 중 어느 한 실시양태에 있어서, 비-천연 발생 폴리뉴클레오티드 서열은 5'-말단에서 3'-말단의 순서로 하기를 추가로 포함하는, 핵산 분자 또는 조합을 포함한다:
(3) 제2 IRES 요소 또는 제2 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열의 3' 말단에 작동적으로 연결된 제2 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열, 및
(4) 제3 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열.
실시양태 3a는 실시양태 3에 있어서, 제3 HBV 항원은 HBV 코어 항원, HBV 폴리머라제(pol) 항원, 및 HBV 표면 항원으로 이루어진 군으로부터 독립적으로 선택되는, 핵산 분자 또는 조합을 포함한다.
실시양태 4는 실시양태 3 또는 3a에 있어서, 비-천연 발생 폴리뉴클레오티드 서열은 5'-말단에서 3'-말단의 순서로 하기를 추가로 포함하는, 핵산 분자 또는 조합을 포함한다:
(5) 제3 IRES 요소 또는 제3 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열의 3' 말단에 작동적으로 연결된 제3 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열, 및
(6) 제4 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열.
실시양태 4a는 실시양태 4에 있어서, 제3 HBV 항원은 HBV 코어 항원, HBV 폴리머라제(pol) 항원, 및 HBV 표면 항원으로 이루어진 군으로부터 독립적으로 선택되는, 핵산 분자 또는 조합을 포함한다.
실시양태 4b는 실시양태 1 내지 2에 있어서, 5'-말단에서 3'-말단의 순서로 하기를 포함하는 제1 비-천연 발생 폴리뉴클레오티드 서열:
(1) 제1 B형 간염 바이러스(HBV) 항원을 인코딩하는 폴리뉴클레오티드 서열,
(2) 제1 내부 리보솜 진입 서열(IRES) 요소 또는 제1 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열, 및
(3) 제2 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열, 및
5'-말단에서 3'-말단의 순서로 하기로 포함하는 제2 비-천연 발생 폴리뉴클레오티드 서열:
(1) 제3 B형 간염 바이러스(HBV) 항원을 인코딩하는 폴리뉴클레오티드 서열,
(2) 제2 내부 리보솜 진입 서열(IRES) 요소 또는 제2 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열, 및
(3) 제4 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열을 포함하고,
여기서 제1 및 제2 비-천연 발생 폴리뉴클레오티드 서열은 제3 내부 리보솜 진입 서열(IRES) 요소 또는 제3 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열에 의해 연결되거나, 별도의 핵산 분자에 존재하고,
여기서 제1, 제2, 제3 및 제4 HBV 항원은 HBV 코어 항원, HBV 폴리머라제(pol) 항원, 및 HBV 표면 항원으로 이루어진 군으로부터 각각 독립적으로 선택되고, 제1, 제2, 제3 및 제4 HBV 항원 중 적어도 하나는 서열번호 1 또는 서열번호 3의 아미노산 서열과 적어도 98% 동일한 아미노산 서열을 갖는 HBV Pre-S1 항원 및 서열번호 5의 아미노산 서열과 적어도 98% 동일한 아미노산 서열을 갖는 HBV PreS2.S 항원으로부터 선택된 HBV 표면 항원이고, 바람직하게는 제1, 제2, 제3 또는 제4 HBV 항원 중 하나는 HBV 코어 또는 HBV pol 항원인, 핵산 분자 또는 조합을 포함한다.
실시양태 5는 실시양태 1 내지 4b에 있어서, 제1, 제2, 제3 및 제4 HBV 항원 각각은 서로 상이한 것인, 핵산 조합을 포함한다.
실시양태 6은 실시양태 1 내지 5 중 어느 한 실시양태에 있어서, 제1, 제2, 제3 및 제4 HBV 항원 각각은 하기로 이루어진 군으로부터 독립적으로 선택되는, 핵산 분자 또는 조합을 포함한다:
(i) 서열번호 1의 아미노산 서열과 적어도 98% 동일한, 예컨대 서열번호 1의 아미노산 서열과 적어도 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하는, 바람직하게는 이로 이루어진 제1 HBV PreS1 항원;
(ii) 서열번호 3의 아미노산 서열과 적어도 98% 동일한, 예컨대 서열번호 3의 아미노산 서열과 적어도 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하는, 바람직하게는 이로 이루어진 제2 HBV PreS1 항원;
(iii) 서열번호 5의 아미노산 서열과 적어도 98% 동일한, 예컨대 서열번호 5의 아미노산 서열과 적어도 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하고, 바람직하게는 이로 이루어진 HBV PreS2 항원;
(iv) 서열번호 7과 적어도 90% 동일한, 예컨대 서열번호 7과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하고, 바람직하게는 이로 이루어진 HBV 코어 항원; 및
(v) 서열번호 9와 적어도 90% 동일한, 예컨대 서열번호 9와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하고, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원.
실시양태 6a는 실시양태 6에 있어서, HBV 코어 항원은 서열번호 86과 적어도 90% 동일한, 예컨대 서열번호 86과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하고, 바람직하게는 이로 이루어진, 핵산 분자 또는 조합을 포함한다.
실시양태 6b는 실시양태 6에 있어서, 제1, 제2, 제3 및 제4 HBV 항원 각각은 하기로 이루어진 군으로부터 독립적으로 선택되는, 핵산 분자 또는 조합을 포함한다:
(1) 서열번호 1의 아미노산 서열을 포함하는 제1 HBV Pre-S1 항원;
(2) 서열번호 3의 아미노산 서열을 포함하는 제2 HBV Pre-S1 항원;
(3) 서열번호 5의 아미노산 서열을 포함하는 HBV PreS2.S 항원;
(4) 서열번호 7의 아미노산을 포함하는 HBV 코어 항원; 및
(5) 서열번호 9의 아미노산 서열을 포함하는 HBV 폴리머라제 항원.
실시양태 6b1은 실시양태 6b에 있어서, 제1, 제2, 제3 및 제4 HBV 항원 각각은 하기로 이루어진 군으로부터 독립적으로 선택되는, 핵산 분자 또는 조합을 포함한다:
(1) 서열번호 1의 아미노산 서열로 이루어진 제1 HBV Pre-S1 항원;
(2) 서열번호 3의 아미노산 서열로 이루어진 제2 HBV Pre-S1 항원;
(3) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원;
(4) 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원; 및
(5) 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원.
실시양태 6b2는 실시양태 6b에 있어서, 제1, 제2, 제3 및 제4 HBV 항원 각각은 하기로 이루어진 군으로부터 독립적으로 선택되는, 핵산 분자 또는 조합을 포함한다:
(1) 서열번호 1의 아미노산 서열로 이루어진 제1 HBV Pre-S1 항원;
(2) 서열번호 3의 아미노산 서열로 이루어진 제2 HBV Pre-S1 항원;
(3) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원;
(4) 서열번호 84의 아미노산 서열로 이루어진 HBV 코어 항원; 및
(5) 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원.
실시양태 6b3은 실시양태 6b에 있어서, 제1, 제2, 제3 및 제4 HBV 항원 각각은 하기로 이루어진 군으로부터 독립적으로 선택되는, 핵산 분자 또는 조합을 포함한다:
(1) 서열번호 1의 아미노산 서열로 이루어진 제1 HBV Pre-S1 항원;
(2) 서열번호 3의 아미노산 서열로 이루어진 제2 HBV Pre-S1 항원;
(3) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원;
(4) 서열번호 85의 아미노산 서열로 이루어진 HBV 코어 항원; 및
(5) 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원.
실시양태 6b4는 실시양태 6b에 있어서, 제1, 제2, 제3 및 제4 HBV 항원 각각은 하기로 이루어진 군으로부터 독립적으로 선택되는, 핵산 분자 또는 조합을 포함한다:
(1) 서열번호 1의 아미노산 서열로 이루어진 제1 HBV Pre-S1 항원;
(2) 서열번호 3의 아미노산 서열로 이루어진 제2 HBV Pre-S1 항원;
(3) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원;
(4) 서열번호 7의 아미노산 서열로 이루어진 HBV 코어 항원; 및
(5) 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원.
실시양태 6c는 실시양태 1 내지 6b4 중 어느 한 실시양태에 있어서, 핵산 분자는 제1 HBV Pre-S1 항원, 제2 HBV Pre-S1 항원 및 HBV PreS2.S 항원 중 적어도 하나를 인코딩하는 폴리뉴클레오티드 서열, 및 HBV 코어 항원 및 HBV 폴리머라제 항원 중 적어도 하나를 인코딩하는 폴리뉴클레오티드 서열을 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 6c1은 실시양태 1 내지 6c 중 어느 한 실시양태에 있어서, 제1 및 제2 HBV Pre-S1 항원, HBV 코어 항원 및 HBV pol 항원 각각은 독립적으로 신호 펩타이드에 작동적으로 연결되고, HBV PreS2.S 항원은 내부 신호 펩타이드를 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 6c2는 실시양태 6c1에 있어서, 신호 펩타이드는 시스타틴 S 신호 펩타이드, Ig 중쇄 감마 신호 펩타이드 SPIgG, Ig 중쇄 입실론 신호 펩타이드 SPIgE, 또는 코로나바이러스의 짧은 리더 펩타이드 서열인, 핵산 분자 또는 조합을 포함한다.
실시양태 6c3은 실시양태 6c2에 있어서, 신호 펩타이드는 서열번호 77의 아미노산 서열을 포함하고 HBV Pre-S1 항원, HBV 코어 항원 및 HBV pol 항원의 N-말단에 작동적으로 연결된, 핵산 분자 또는 조합을 포함한다.
실시양태 6d는 실시양태 1 내지 6c3 중 어느 한 실시양태에 있어서, 핵산 분자는 적어도 하나의 IRES 요소를 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 6d1은 실시양태 6d에 있어서, IRES 요소는 서열번호 13의 폴리뉴클레오티드 서열을 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 6d2는 실시양태 6d1에 있어서, IRES 요소는 서열번호 13의 폴리뉴클레오티드 서열로 이루어진, 핵산 분자 또는 조합을 포함한다.
실시양태 6d3은 실시양태 6d에 있어서, IRES 요소는 서열번호 14의 폴리뉴클레오티드 서열을 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 6d4는 실시양태 6d3에 있어서, IRES 요소는 서열번호 14의 폴리뉴클레오티드 서열로 이루어진, 핵산 분자 또는 조합을 포함한다.
실시양태 6e는 실시양태 1 내지 6d4 중 어느 한 실시양태에 있어서, 핵산 분자는 오토프로테아제 펩타이드를 인코딩하는 적어도 하나의 폴리뉴클레오티드 서열을 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 6e1은 실시양태 6e에 있어서, 오토프로테아제 펩타이드는 서열번호 11의 아미노산 서열을 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 6e2는 실시양태 6e1에 있어서, 오토프로테아제 펩타이드는 서열번호 11의 아미노산 서열로 이루어진, 핵산 분자 또는 조합을 포함한다.
실시양태 6e3은 실시양태 6e에 있어서, 폴리뉴클레오티드 서열에 의해 인코딩된 오토프로테아제 펩타이드는 서열번호 12의 서열을 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 6e4는 실시양태 6e에 있어서, 폴리뉴클레오티드 서열에 의해 인코딩된 오토프로테아제 펩타이드는 서열번호 12의 서열로 이루어진, 핵산 분자 또는 조합을 포함한다.
실시양태 7은 실시양태 6c 내지 6e4 중 어느 한 실시양태에 있어서, HBV 코어 항원은 서열번호 84, 85 또는 86 중 적어도 하나와 적어도 98% 동일한, 예컨대 서열번호 84, 85 또는 86 중 적어도 하나와 적어도 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하고, 바람직하게는 이로 이루어진, 핵산 분자 또는 조합을 포함한다.
실시양태 7a는 실시양태 7에 있어서, HBV 코어 항원은 서열번호 84, 서열번호 85, 또는 서열번호 86으로 이루어진 군으로부터 선택된 아미노산 서열을 포함하고, 바람직하게는 이로 이루어진, 핵산 분자 또는 조합을 포함한다.
실시양태 7b는 실시양태 7a에 있어서, HBV 코어 항원은 서열번호 86의 아미노산 서열로 이루어진, 핵산 분자 또는 조합을 포함한다.
실시양태 8은 실시양태 1 내지 7b 중 어느 한 실시양태에 있어서, HBV 코어 항원의 마지막 5개의 C-말단 아미노산은 VVR 아미노산 서열, 보다 특히 VVRR(서열번호 91) 아미노산 서열, 보다 특히 VVRRR(서열번호 92) 아미노산 서열을 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 9는 실시양태 1 내지 8 중 어느 한 실시양태에 있어서, HBV 표면 항원, HBV 코어 항원 및 HBV 폴리머라제 항원 중 적어도 하나는 하기를 포함하는, 핵산 분자 또는 조합을 포함한다:
(i) HBV 유전자형 A, B, C 및 D 중 둘 이상, 바람직하게는 모두에 대한 컨센서스 서열; 및/또는
(ii) HLA-A*11:01, HLA-A*24:02, HLA-A*02:01, HLA-A*A2402, HLA-A*A0101, 또는 HLA-B*40:01에 대한 하나 이상의 에피토프.
실시양태 9a는 실시양태 9에 있어서, HBV 표면 항원, HBV 코어 항원 및 HBV 폴리머라제 항원 중 적어도 하나는 HLA-A*11:01 에피토프, HLA-A*24:02 에피토프, HLA-A*02:01 에피토프, 및 HLA-A*A2402 에피토프로 이루어진 군으로부터 선택된 하나 이상의 에피토프를 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 9a1은 실시양태 9 또는 9a에 있어서, HBV 표면 항원, HBV 코어 항원 및 HBV 폴리머라제 항원 중 적어도 하나는 HLA-A*11:01 에피토프, HLA-A*24:02 에피토프, 및 HLA-A*02:01 에피토프로 이루어진 군으로부터 선택된 하나 이상의 에피토프를 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 9a2는 실시양태 9 내지 9a1 중 어느 한 실시양태에서, HBV 표면 항원, HBV 코어 항원 및 HBV 폴리머라제 항원 중 적어도 하나는 HLA-A*11:01에 대한 하나 이상의 에피토프를 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 9a3은 실시양태 9 내지 9a2 중 어느 한 실시양태에서, HBV 표면 항원, HBV 코어 항원 및 HBV 폴리머라제 항원 각각은 HLA-A*11:01에 대한 하나 이상의 에피토프를 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 9a4는 실시양태 9 내지 9a3 중 어느 한 실시양태에 있어서, HBV preS1, HBV preS2.S, HBV 코어 항원 및 HBV 폴리머라제 항원 각각은 HLA-A*11:01에 대한 하나 이상의 에피토프를 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 9b는 실시양태 9 내지 9a4 중 어느 한 실시양태에 있어서, HBV 표면 항원, HBV 코어 항원 및 HBV 폴리머라제 항원 각각은 HBV 유전자형 A, B, C 및 D에 대한 컨센서스 서열을 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 9c는 실시양태 9에 있어서, HBV 폴리머라제 항원, HBV pre-S1 항원, 및 HBV preS2.S 항원 중 적어도 하나는 하나 이상의 HLA-A*24:02 에피토프를 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 9c1은 실시양태 9 또는 9c에 있어서, HBV 폴리머라제 항원, HBV pre-S1 항원, 및 HBV preS2.S 항원 각각은 하나 이상의 HLA-A*24:02 에피토프를 포함하는, 핵산 분자 또는 조합을 포함을 포함한다.
시양태 9c2는 실시양태 9 내지 9c1 중 어느 한 실시양태에 있어서, HBV preS2.S 항원은 하나 이상의 HLA-A*24:02 에피토프를 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 9d는 실시양태 9에 있어서, HBV 폴리머라제 항원 및 HBV 코어 항원 중 적어도 하나는 하나 이상의 HLA-A*02:01 에피토프를 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 9d1은 실시양태 9d에 있어서, HBV 폴리머라제 항원 및 HBV 코어 항원 각각은 하나 이상의 HLA-A*02:01 에피토프를 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 9e는 실시양태 9에 있어서, HBV preS2.S 항원은 하나 이상의 HLA-A*A2402 에피토프를 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 9f는 실시양태 9에 있어서, HBV 폴리머라제 항원 및 HBV 코어 항원 중 적어도 하나는 하나 이상의 HLA-A*A0101 에피토프를 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 9f1은 실시양태 9f에 있어서, HBV 폴리머라제 항원 및 HBV 코어 항원 각각은 하나 이상의 HLA-A*A0101 에피토프를 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 9g는 실시양태 9에 있어서, HBV 코어 항원은 하나 이상의 HLA-B*40:01 에피토프를 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 9h는 실시양태 9에 있어서, HBV 코어 항원은 HLA-A*11:01 에피토프, HLA-A*02:01 에피토프, HLA-A*A0101 에피토프, 및 HLA-B*40:01 에피토프로 이루어진 군으로부터 선택된 하나 이상의 에피토프를 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 9i는 실시양태 9에 있어서, HBV 폴리머라제 항원은 HLA-A*11:01 에피토프, HLA-A*24:02 에피토프, HLA-A*02:01 에피토프, 및 HLA-A*A0101 에피토프로 이루어진 군으로부터 선택된 하나 이상의 에피토프를 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 9j는 실시양태 9에 있어서, HBV pre-S1 항원은 HLA-A*11:01 에피토프 및 HLA-A*24:02 에피토프로 이루어진 군으로부터 선택된 하나 이상의 에피토프를 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 9k는 실시양태 9에 있어서, HBV preS2.S 항원은 HLA-A*11:01 에피토프, HLA-A*24:02 에피토프 및 HLA-A*A2402 에피토프로 이루어진 군으로부터 선택된 하나 이상의 에피토프를 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 9l은 실시양태 9에 있어서, HBV 표면 항원, HBV 코어 항원 및 HBV 폴리머라제 항원 각각은 하기를 포함하는, 핵산 분자 또는 조합을 포함한다:
(i) HBV 유전자형 A, B, C 및 D에 대한 컨센서스 서열; 및
(ii) HLA-A*11:01, HLA-A*24:02, HLA-A*02:01, HLA-A*A0201, HLA-A*A2402 및 HLA-A*A0101에 대한 하나 이상의 에피토프.
실시양태 10은 실시양태 1 내지 9l 중 어느 한 실시양태에 있어서, 제1, 제2, 제3 및 제4 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열 각각은 하기로 이루어진 군으로부터 독립적으로 선택되고:
(i) 서열번호 2와 적어도 90% 동일한, 예컨대 서열번호 2와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 서열을 갖는 제1 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(ii) 서열번호 4와 적어도 90% 동일한, 예컨대 서열번호 4와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 서열을 갖는 제2 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(iii) 서열번호 6과 적어도 90% 동일한, 예컨대 서열번호 6과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
(iv) 서열번호 8과 적어도 90% 동일한, 예컨대 서열번호 8과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열; 및
(v) 서열번호 10과 적어도 90% 동일한, 예컨대 서열번호 10과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열,
바람직하게는, 제1 및 제2 HBV Pre-S1 항원, HBV 코어 항원 및 HBV pol 항원 각각을 인코딩하는 폴리뉴클레오티드 서열은 독립적으로 신호 펩타이드를 인코딩하는 폴리뉴클레오티드 서열에 작동적으로 연결되고, HBV preS2.S 항원은 내부 신호 펩타이드를 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 10a는 실시양태 10에 있어서, 제1, 제2, 제3 및 제4 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열 각각은 하기로 이루어진 군으로부터 독립적으로 선택되는, 핵산 분자 또는 조합을 포함한다:
(i) 서열번호 2의 뉴클레오티드 서열을 갖는 제1 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(ii) 서열번호 4의 뉴클레오티드 서열을 갖는 제2 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(iii) 서열번호 6의 뉴클레오티드 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
(iv) 서열번호 89의 뉴클레오티드 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열; 및
(v) 서열번호 10의 뉴클레오티드 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열.
실시양태 10b는 실시양태 10에 있어서, 제1, 제2, 제3 및 제4 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열 각각은 하기로 이루어진 군으로부터 독립적으로 선택되는, 핵산 분자 또는 조합을 포함한다:
(i) 서열번호 2의 뉴클레오티드 서열로 이루어진 제1 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(ii) 서열번호 4의 뉴클레오티드 서열로 이루어진 제2 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(iii) 서열번호 6의 뉴클레오티드 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
(iv) 서열번호 87의 뉴클레오티드 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열; 및
(v) 서열번호 10의 뉴클레오티드 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열.
실시양태 10c는 실시양태 10에 있어서, 제1, 제2, 제3 및 제4 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열 각각은 하기로 이루어진 군으로부터 독립적으로 선택되는, 핵산 분자 또는 조합을 포함한다:
(i) 서열번호 2의 뉴클레오티드 서열로 이루어진 제1 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(ii) 서열번호 4의 뉴클레오티드 서열로 이루어진 제2 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(iii) 서열번호 6의 뉴클레오티드 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
(iv) 서열번호 88의 뉴클레오티드 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열; 및
(v) 서열번호 10의 뉴클레오티드 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열.
실시양태 10d는 실시양태 10에 있어서, 제1, 제2, 제3 및 제4 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열 각각은 하기로 이루어진 군으로부터 독립적으로 선택되는, 핵산 분자 또는 조합을 포함한다:
(i) 서열번호 2의 뉴클레오티드 서열로 이루어진 제1 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(ii) 서열번호 4의 뉴클레오티드 서열로 이루어진 제2 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(iii) 서열번호 6의 뉴클레오티드 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
(iv) 서열번호 89의 뉴클레오티드 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열; 및
(v) 서열번호 10의 뉴클레오티드 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열.
실시양태 11은 실시양태 10에 있어서, HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열은 서열번호 87, 서열번호 88 또는 서열번호 89과 적어도 90% 동일한, 예컨대 서열번호 87, 서열번호 88 또는 서열번호 89와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 폴리뉴클레오티드 서열을 포함하고, 바람직하게는 이로 이루어진, 핵산 분자 또는 조합을 포함한다.
실시양태 11a는 실시양태 11에 있어서, HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열은 서열번호 87, 서열번호 88 또는 서열번호 89 중 어느 하나를 포함하고, 바람직하게는 이로 이루어진, 핵산 분자 또는 조합을 포함한다.
실시양태 11b는 실시양태 11 또는 11a에 있어서, HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열은 서열번호 89로 이루어진, 핵산 분자 또는 조합을 포함한다.
실시양태 11c는 실시양태 10 내지 11b 중 어느 한 실시양태에 있어서, 제1 및 제2 HBV Pre-S1 항원, HBV 코어 항원 및 HBV pol 항원 각각을 인코딩하는 폴리뉴클레오티드 서열은 독립적으로 시스타틴 S 신호 펩타이드, Ig 중쇄 감마 신호 펩타이드 SPIgG, Ig 중쇄 입실론 신호 펩타이드 SPIgE, 또는 코로나바이러스의 짧은 리더 펩타이드 서열과 같은 신호 펩타이드를 인코딩하는 폴리뉴클레오티드에 작동적으로 연결되는, 핵산 분자 또는 조합을 포함한다.
실시양태 11d는 실시양태 11c에 있어서, 신호 펩타이드를 인코딩하는 폴리뉴클레오티드는 서열번호 90의 뉴클레오티드 서열을 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 12는 실시양태 1 내지 11d 중 어느 한 실시양태에 있어서, 제1, 제2 및 제3 오토프로테아제 펩타이드 각각은 독립적으로 돼지 테스코바이러스-1 2A(P2A), 구제역 바이러스(FMDV) 2A(F2A), 말 비염 A 바이러스(ERAV) 2A(E2A), 테세아 아시그나 바이러스 2A(T2A), 세포질 다각체병 바이러스 2A(BmCPV2A), 무름병 바이러스 2 A(BmIFV2A), 및 이들의 조합으로 이루어진 군으로부터 선택된 펩타이드 서열을 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 12a는 실시양태 12에 있어서, 제1, 제2 및 제3 오토프로테아제 펩타이드 각각은 서열번호 11의 P2A 서열과 같은 P2A의 펩타이드 서열을 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 13은 실시양태 1 내지 12a 중 어느 한 실시양태에 있어서, 제1, 제2 및 제3 IRES 각각은 뇌심근염 바이러스(EMCV) 또는 엔테로바이러스 71(EV71)로부터 유래된, 핵산 분자 또는 조합을 포함한다.
실시양태 13a는 실시양태 13에 있어서, 제1, 제2 및 제3 IRES 각각은 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 14는 실시양태 1 내지 3a 중 어느 한 실시양태에 있어서, 5'-말단에서 3'-말단의 순서로 하기를 갖는 비-천연 발생 폴리뉴클레오티드 서열을 포함하는, 핵산 분자 또는 조합을 포함한다:
(1) 서열번호 7의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(2) 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 7의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(3) 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
(4) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(5) 서열번호 7의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(6) 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 7의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(7) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 7의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(8) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 7의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(9) 서열번호 7의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(10) 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 7의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(11) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 7의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(12) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 7의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(13) 서열번호 7의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(14) 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 7의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(15) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 7의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(16) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 7의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(17) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 7의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(18) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 7의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(19) 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 7의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
(20) 서열번호 7의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
(21) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 7의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(22) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 7의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(23) 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 7의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열; 및
(24) 서열번호 7의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열.
실시양태 14a1은 실시양태 14에 있어서, 5'-말단에서 3'-말단의 순서로 하기를 갖는 비-천연 발생 폴리뉴클레오티드 서열을 포함하는, 핵산 분자 또는 조합을 포함한다:
(1) 서열번호 7, 84, 85, 또는 86 중 어느 하나의 아미노산 서열로 이루어진 HBV 코어를 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(2) 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 7, 84, 85, 또는 86 중 어느 하나의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(5) 서열번호 7, 84, 85, 또는 86 중 어느 하나의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(6) 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 7, 84, 85, 또는 86 중 어느 하나의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(7) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 7, 84, 85, 또는 86 중 어느 하나의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(8) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 7, 84, 85, 또는 86 중 어느 하나의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(9) 서열번호 7, 84, 85, 또는 86 중 어느 하나의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(10) 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 7, 84, 85, 또는 86 중 어느 하나의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(11) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 7, 84, 85, 또는 86 중 어느 하나의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(12) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 7, 84, 85, 또는 86 중 어느 하나의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(13) 서열번호 7, 84, 85, 또는 86 중 어느 하나의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(14) 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 7, 84, 85, 또는 86 중 어느 하나의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(15) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 7, 84, 85, 또는 86 중 어느 하나의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(16) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 7, 84, 85, 또는 86 중 어느 하나의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(17) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 7, 84, 85, 또는 86 중 어느 하나의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(18) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 7, 84, 85, 또는 86 중 어느 하나의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(19) 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 7, 84, 85, 또는 86 중 어느 하나의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
(20) 서열번호 7, 84, 85, 또는 86 중 어느 하나의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
(21) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 7, 84, 85, 또는 86 중 어느 하나의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(22) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 7, 84, 85, 또는 86 중 어느 하나의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(23) 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 7, 84, 85, 또는 86 중 어느 하나의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열; 및
(24) 서열번호 7, 84, 85, 또는 86 중 어느 하나의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열.
실시양태 14a2는 실시양태 14에 있어서, 5'-말단에서 3'-말단의 순서로 하기를 갖는 비-천연 발생 폴리뉴클레오티드 서열을 포함하는, 핵산 분자 또는 조합을 포함한다:
(1) 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(2) 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(3) 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
(4) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(5) 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(6) 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(7) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(8) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(9) 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(10) 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(11) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(12) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(13) 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(14) 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(15) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(16) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열로 이루어진 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(17) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(18) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(19) 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
(20) 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
(21) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(22) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(23) 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열; 및
(24) 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열.
실시양태 14a3은 실시양태 14, 14a1 또는 14a2에 있어서, 제1 및 제2 HBV Pre-S1 항원, HBV 코어 항원 및 HBV pol 항원 각각을 인코딩하는 폴리뉴클레오티드 서열은 독립적으로 신호 펩타이드를 인코딩하는 폴리뉴클레오티드 서열에 작동적으로 연결되는, 핵산 분자 또는 조합을 포함된다.
실시양태 14a4는 실시양태 14a3에 있어서, 신호 펩타이드는 시스타틴 S 신호 펩타이드, Ig 중쇄 감마 신호 펩타이드 SPIgG, Ig 중쇄 입실론 신호 펩타이드 SPIgE, 또는 코로나바이러스의 짧은 리더 펩타이드 서열인, 핵산 분자 또는 조합을 포함한다.
실시양태 14a5는 실시양태 14a4에 있어서, 신호 펩타이드는 서열번호 77의 아미노산 서열을 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 14a6은 실시양태 14a5에 있어서, 신호 펩타이드를 인코딩하는 폴리뉴클레오티드 서열은 서열번호 90의 폴리뉴클레오티드 서열을 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 14b는 실시양태 14 내지 14a6 중 어느 한 실시양태에 있어서, 실시양태 14(3) 내지 14(24), 14a1(5) 내지 14a1(24) 또는 14a2(3) 내지 14a2(24) 중 어느 하나의 비-천연 발생 폴리뉴클레오티드 서열을 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 14c는 실시양태 14b에 있어서, 서열번호 21 내지 54 중 어느 하나의 비-천연 발생 폴리뉴클레오티드 서열을 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 14d는 실시양태 14b 또는 14c에 있어서, 실시양태 14(1), 14(2), 14a1(1), 14a1(2), 14a2(1), 및 14a2(2)로 이루어진 군으로부터 선택된 비-천연 발생 폴리뉴클레오티드 서열 중 어느 하나와 조합된, 핵산 분자 또는 조합을 포함한다.
실시양태 14e는 실시양태 14b 또는 14c에 있어서, 서열번호 15 내지 20으로 이루어진 군으로부터 선택된 비-천연 발생 폴리뉴클레오티드 서열 중 어느 하나와 조합된, 핵산 분자 또는 조합을 포함한다.
실시양태 15는 실시양태 14에 있어서, 서열번호 15 내지 54 중 어느 하나의 비-천연 발생 폴리뉴클레오티드 서열을 포함하는, 핵산 분자 또는 조합을 포함한다.
실시양태 16은 벡터로서, 실시양태 1 내지 15 중 어느 한 실시양태의 핵산 분자 또는 조합을 포함하는, 벡터를 포함한다.
실시양태 17은 실시양태 16에 있어서, DNA 플라스미드인, 벡터를 포함한다.
실시양태 18은 실시양태 16에 있어서, DNA 바이러스 벡터인, 벡터를 포함한다.
실시양태 18a는 실시양태 16에 있어서, RNA 바이러스 벡터인, 벡터를 포함한다.
실시양태 18b는 실시양태 18a에 있어서, RNA 레플리콘인, 벡터를 포함한다.
실시양태 18c는 실시양태 16에 있어서, 변형된 백시니아 앙카라(MVA) 벡터 또는 아데노바이러스 벡터인, 벡터를 포함한다.
실시양태 18c1은 실시양태 18c에 있어서, MVA-BN 벡터인, 벡터를 포함한다.
실시양태 18c2는 실시양태 18c에 있어서, Ad26 또는 Ad35 벡터인, 벡터를 포함한다.
실시양태 19는 RNA 레플리콘으로서, 5'-말단에서 3'-말단의 순서로 하기를 포함하는, RNA 레플리콘을 포함한다:
(1) RNA 바이러스의 비구조 단백질-매개 증폭에 필요한 5' 비번역 영역(5'-UTR);
(2) RNA 바이러스의 비구조 단백질 중 적어도 하나, 바람직하게는 모두를 인코딩하는 폴리뉴클레오티드 서열;
(3) RNA 바이러스의 서브게놈 프로모터;
(4) 실시양태 1 내지 15 중 어느 하나의 핵산 분자 또는 조합; 및
(5) RNA 바이러스의 비구조 단백질-매개 증폭에 필요한 3' 비번역 영역(3'-UTR).
실시양태 20은 RNA 레플리콘으로서, 5'-말단에서 3'-말단의 순서로 하기를 포함하는, RNA 레플리콘을 포함한다:
(1) 알파바이러스 5' 비번역 영역(5'-UTR),
(2) 알파바이러스 비구조 유전자 nsp1의 5' 복제 서열,
(3) 바이러스 종의 다운스트림 루프(DLP) 모티프,
(4) 제4 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열,
(5) 알파바이러스 비구조 단백질 nsp1, nsp2, nsp3 및 nsp4를 인코딩하는 폴리뉴클레오티드 서열,
(6) 알파바이러스 서브게놈 프로모터,
(7) 실시양태 1 내지 15 중 어느 하나의 핵산 분자 또는 조합,
(8) 알파바이러스 3' 비번역 영역(3' UTR), 및
(9) 선택적으로, 폴리 아데노신 서열.
실시양태 21은 실시양태 20에 있어서, DLP 모티프는 동부 말 뇌염 바이러스(EEEV), 베네수엘라 말 뇌염 바이러스(VEEV), 에버글레이즈 바이러스(EVEV), 무캄보 바이러스(MUCV), 셈리키 포레스트 바이러스(SFV), 픽수나 바이러스(PIXV), 미들버그 바이러스(MTDV), 치쿤구니야 바이러스(CHIKV), 오니옹-니옹 바이러스(ONNV), 로스 리버 바이러스(RRV), 바마 포레스트 바이러스(BF), 게타 바이러스(GET), 사기야마 바이러스(SAGV), 베바루 바이러스(BEBV), 마야로 바이러스(MAYV), Una 바이러스(U AV), 신드비스 바이러스(SINV), 아우라 바이러스(AURAV), 와타로아 바이러스(WHAV), 바반키 바이러스(BABV), 키질라가크 바이러스(KYZV), 서부 말 뇌염 바이러스(WEEV), 하이랜드 J 바이러스(HJV), 포트 모건 바이러스(FMV), Ndumu(NDUV), 및 버기 크릭 바이러스로 이루어진 군으로부터 선택된 바이러스 종으로부터 유래되는, RNA 레플리콘을 포함한다.
실시양태 22는 실시양태 21에 있어서, 제4 오토프로테아제 펩타이드는 돼지 테세호바이러스-1 2A(P2A), 구제역 바이러스(FMDV) 2A(F2A), 말 비염 A 바이러스(ERAV) 2A(E2A), 테세아 아시그나 바이러스 2A(T2A), 세포질 다각체병 바이러스 2A(BmCPV2A), 무름병 바이러스 2 A(BmIFV2A), 및 이들의 조합으로 이루어진 군으로부터 선택되는, RNA 레플리콘을 포함한다.
실시양태 22a는 실시양태 22에 있어서, 제4 오토프로테아제 펩타이드는 P2A의 펩타이드 서열을 포함하는, RNA 레플리콘을 포함한다.
실시양태 22b는 실시양태 22 또는 22a에 있어서, 제4 오토프로테아제 펩타이드는 서열번호 11의 펩타이드 서열을 포함하는, RNA 레플리콘을 포함한다.
실시양태 23은 RNA 레플리콘으로서, 5'-말단에서 3'-말단의 순서로 하기를 포함하는, RNA 레플리콘을 포함한다:
(1) 서열번호 55의 폴리뉴클레오티드 서열을 갖는 5'-UTR,
(2) 서열번호 56의 폴리뉴클레오티드 서열을 갖는 5' 복제 서열,
(3) 서열번호 57의 폴리뉴클레오티드 서열을 포함하는 DLP 모티프,
(4) 서열번호 11의 P2A 서열을 인코딩하는 폴리뉴클레오티드 서열,
(5) 각각 서열번호 58, 서열번호 59, 서열번호 60 및 서열번호 61의 핵산 서열에 의해 인코딩된 알파바이러스 비구조 단백질 nsp1, nsp2, nsp3 및 nsp4를 인코딩하는 폴리뉴클레오티드 서열,
(6) 서열번호 62의 폴리뉴클레오티드 서열을 갖는 서브게놈 프로모터,
(7) 실시양태 1 내지 15 중 어느 하나의 핵산 분자 또는 조합, 및
(8) 서열번호 63의 폴리뉴클레오티드 서열을 갖는 3' UTR.
실시양태 24는 실시양태 23에 있어서,
(i) P2A 서열을 인코딩하는 폴리뉴클레오티드 서열은 서열번호 12를 포함하고,
(ii) 알파바이러스 비구조 단백질 nsp1, nsp2, nsp3 및 nsp4를 인코딩하는 폴리뉴클레오티드 서열은 각각 서열번호 58, 서열번호 59, 서열번호 60 및 서열번호 61의 핵산 서열을 갖고;
(iii) 핵산 분자 또는 조합은 서열번호 15 내지 54 중 어느 하나의 폴리뉴클레오티드 서열을 포함하고,
(iv) RNA 레플리콘은 폴리 아데노신 서열을 추가로 포함하고, 바람직하게는 폴리 아데노신 서열은 레플리콘의 3'-말단에서 서열번호 64의 서열을 갖는, RNA 레플리콘을 포함한다.
실시양태 25는 RNA 레플리콘으로서, 서열번호 65 내지 72 중 어느 하나의 폴리뉴클레오티드 서열을 포함하는, RNA 레플리콘을 포함한다.
실시양태 26은 실시양태 19 내지 25 중 어느 한 실시양태의 RNA 레플리콘을 인코딩하는 폴리뉴클레오티드 서열을 포함하는 핵산 분자로서, 바람직하게는, 핵산은 DNA 서열의 5'-말단에 작동적으로 연결된 T7 프로모터를 추가로 포함하고, 보다 바람직하게는, T7 프로모터는 서열번호 73의 뉴클레오티드 서열을 포함하는, 핵산 분자를 포함한다.
실시양태 27은 약제학적 조성물로서, 실시양태 1 내지 15 및 26 중 어느 한 실시양태의 핵산 분자 또는 조합, 실시양태 16 내지 18c2 중 어느 한 실시양태의 벡터, 또는 실시양태 19 내지 25 중 어느 한 실시양태의 RNA 레플리콘, 및 약제학적으로 허용되는 담체를 포함하는, 약제학적 조성물을 포함한다.
실시양태 28은 실시양태 27에 있어서, 약제학적으로 허용되는 담체는 하나 이상의 지질을 포함하는, 약제학적 조성물을 포함한다.
실시양태 28a는 실시양태 28에 있어서, 하나 이상의 지질은 양이온성 지질을 포함하는, 약제학적 조성물을 포함한다.
실시양태 28a1은 실시양태 28a에 있어서, 양이온성 지질은 이온화 가능한 양이온성 지질인, 약제학적 조성물을 포함한다.
실시양태 28a2는 실시양태 28a에 있어서, 양이온성 지질은 ALC-0315(((4-하이드록시부틸)아잔디일)비스(헥산-6,1-디일)비스(2-헥실데카노에이트)), DOTMA(N-D-(2,3-디올레일옥시) 프로필 N,N,N-트리메틸암모늄 클로라이드), DOTAP(1,2-비스 (올레일옥시)-3(트리메틸암모니오)프로판), DDAB(디메틸디옥타데실-암모늄 브로마이드), DOGS(디옥타데실아미도글리실 스페르민), DOPE(1,2-딜레오일-sn-3-포스포에탄올아민), DSDMA, DODMA, DLinDMA, DLenDMA, γ-DLenDMA, DLin-K-DMA, DLin-K-C2-DMA, DLin-K-C3-DMA, DLin-K-C4-DMA, DLen-C2K-DMA, y-DLen-C2K-DMA, DLin-M-C2-DMA, DLin-M-C3-DMA, DLin-MP-DMA, 및 DCChol(3 베타-(N―(N'.N'-디메틸 아미노메탄)카바모일) 콜레스테롤), 및 이들의 조합으로 이루어진 군으로부터 선택되는, 약제학적 조성물을 포함한다.
실시양태 28a3은 실시양태 28a 내지 28a2 중 어느 한 실시양태에 있어서, 양이온성 지질은 ALC-0315인, 약제학적 조성물을 포함한다.
실시양태 28b는 실시양태 28a 내지 28a3 중 어느 한 실시양태에 있어서, (a) 폴리에틸렌 글리콜(PEG) 지질 또는 PEG-변형된 지질, (b) 헬퍼 지질, 및 (c) 스테롤 중 하나 이상을 추가로 포함하는, 약제학적 조성물을 포함한다.
실시양태 28b1은 실시양태 28b에 있어서, PEG 지질 또는 PEG-변형된 지질은 2-[(폴리에틸렌 글리콜)-2000]-N,N-디테트라데실아세트아미드(ALC-0159), PEG550-PE, PEG750-PE, PEG2000-DMG, PEG-DSPE, PEG-DAA, PEG-DAG, PEG-PE, 모노메톡시폴리에틸렌 글리콜(MePEG-OH), 모노메톡시폴리에틸렌 글리콜-석시네이트(MePEG-S), 모노메톡시폴리에틸렌 글리콜-석신이미딜 석시네이트(MePEG-S-NHS), 모노메톡시폴리에틸렌 글리콜-아민(MePEG-NH2), 모노메톡시폴리에틸렌 글리콜-트레실레이트(MePEG-TRES), 모노메톡시폴리에틸렌 글리콜-이미다졸릴-카보닐(MePEG-IM), 및 이들의 조합으로 이루어진 군으로부터 선택되는, 약제학적 조성물을 포함한다.
실시양태 28b2는 실시양태 28b 또는 28b1에 있어서, PEG 지질은 ALC-0159인, 약제학적 조성물을 포함한다.
실시양태 28c는 실시양태 28b 내지 28b2 중 어느 한 실시양태에 있어서, 헬퍼 지질은 중성 지질, 중성 헬퍼 지질, 비-양이온성 지질, 비-양이온성 헬퍼 지질, 음이온성 지질, 음이온성 헬퍼 지질, 또는 양쪽이온성 지질, 또는 이들의 조합으로 이루어진 군으로부터 선택된다.
실시양태 28c1은 실시양태 28c에 있어서, 헬퍼 지질은 디스테아로일포스파티딜콜린(DSPC), 레시틴, 포스파티딜에탄올아민, 리소레시틴, 리소포스파티딜에탄올아민, 포스파티딜세린, 포스파티딜이노시톨, 스핑고미엘린, 에그 스핑고미엘린(ESM), 세팔린, 카디오리핀, 포스파티드산, 세레브로사이드, 디세틸포스페이트, 디올레오일포스파티딜콜린(DOPC), 디팔미토일포스파티딜콜린(DPPC), 디올레오일포스파티딜글리세롤(DOPG), 디팔미토일포스파티딜글리세롤(DPPG), 디올레오일포스파티딜에탄올아민(DOPE), 팔미토일올레오일-포스파티딜콜린(POPC), 팔미토일올레오일-포스파티딜에탄올아민(POPE), 팔미토일올레오일-포스파티딜글리세롤(POPG), 디올레오일포스파티딜에탄올아민 4-(N-말레이미도메틸)-사이클로헥산-1-카복실레이트(DOPE-mal), 디팔미토일-포스파티딜에탄올아민(DPPE), 디미리스토일-포스파티딜에탄올아민(DMPE), 디스테아로일-포스파티딜에탄올아민(DSPE), 모노메틸-포스파티딜에탄올아민, 디메틸-포스파티딜에탄올아민, 디엘라이도일-포스파티딜에탄올아민(DEPE), 스테아로일올레오일-포스파티딜에탄올아민(SOPE), 리소포스파티딜콜린, 디리놀레오일포스파티딜콜린, 및 이들의 혼합물로 이루어진 군으로부터 선택되는, 약제학적 조성물을 포함한다.
실시양태 28c2는 실시양태 28c 또는 28c1에 있어서, 헬퍼 지질은 디스테아로일포스파티딜콜린(DSPC)인, 약제학적 조성물을 포함한다.
실시양태 28d는 실시양태 28b 내지 28c2 중 어느 한 실시양태에 있어서, 스테롤은 콜레스테롤, 5α-콜레스타놀, 5α-코프로스타놀, 콜레스테릴-(2'-하이드록시)-에틸 에테르, 콜레스테릴-(4'-하이드록시)-부틸 에테르, 6-케토콜레스타놀, 5α-콜레스탄, 콜레스테논, 5α-콜레스타논, 5α-콜레스타논, 콜레스테릴 데카노에이트, 및 이들의 혼합물로 이루어진 군으로부터 선택되는, 약제학적 조성물을 포함한다.
실시양태 28d1은 실시양태 28d에 있어서, 스테롤은 콜레스테롤인, 약제학적 조성물을 포함한다.
실시양태 28e는 실시양태 28 내지 28d1 중 어느 한 실시양태에 있어서, 하나 이상의 지질은 ALC-0315, ALC-0159, DSPC, 및 콜레스테롤을 포함하는, 약제학적 조성물을 포함한다.
실시양태 28f는 실시양태 28 내지 28e 중 어느 한 실시양태에 있어서, 약제학적으로 허용되는 담체는 지질 나노입자를 포함하는, 약제학적 조성물을 포함한다.
실시양태 29는 실시양태 27 내지 28f 중 어느 한 실시양태에 있어서, 하기를 추가로 포함하는, 약제학적 조성물을 포함한다:
(1) 서열번호 84, 85 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열; 또는
(2) 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 84, 85 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열.
실시양태 30은 HBV에 대해 대상체를 백신접종하는 방법으로서, 상기 방법은 실시양태 27 내지 28f 중 어느 한 실시양태의 약제학적 조성물을 대상체, 바람직하게는 만성 HBV 감염을 가진 대상체에게 투여하는 단계를 포함하는, HBV에 대해 대상체를 백신접종하는 방법을 포함한다.
실시양태 30a는 실시양태 27 내지 28f 중 어느 한 실시양태에 있어서, HBV에 대한 대상체, 바람직하게는 만성 HBV 감염을 가진 대상체를 백신접종하는 데 사용하기 위한, 약제학적 조성물을 포함한다.
실시양태 30b는 실시양태 30a에 있어서, 프라임-부스트 용법으로서 사용하기 위한 적어도 하나의 동일한 HBV 에피토프, 예컨대 적어도 하나의 동일한 HLA 에피토프, 바람직하게는 적어도 하나의 동일한 항원을 인코딩하는 핵산 분자를 포함하는 제2 조성물을 추가로 포함하는, 약제학적 조성물을 포함한다.
실시양태 30c는 실시양태 27 내지 28f 중 어느 한 실시양태에 있어서, HBV 감염의 치료에 사용하기 위한, 약제학적 조성물을 포함한다.
실시양태 31은 실시양태 30에 있어서, 프라임-부스트 용법에서 적어도 하나의 동일한 HBV 에피토프, 예컨대 적어도 하나의 동일한 HLA 에피토프, 바람직하게는 적어도 하나의 동일한 항원을 인코딩하는 핵산 분자를 포함하는 제2 조성물을 대상체에게 투여하는 단계를 추가로 포함하는, 방법을 포함한다.
실시양태 32는 실시양태 31에 있어서, 프라임-부스트 용법은 실시양태 19 내지 제25항 중 어느 한 실시양태의 RNA 레플리콘을 포함하는 제1 조성물, 및 RNA 레플리콘이 아니고 적어도 하나의 동일한 HBV 에피토프, 예컨대 적어도 하나의 동일한 HLA 에피토프를 인코딩하는 벡터를 포함하는 제2 조성물, 바람직하게는 프라이밍 조성물로서 적어도 하나의 동일한 항원을 포함하는, 방법을 포함한다.
실시양태 32a는 실시양태 32에 있어서, 제1 조성물은 면역화 프라이밍에 사용되고 제2 조성물은 프라임-부스트 용법에서 면역화 부스팅에 사용되는, 방법을 포함한다.
실시양태 32b는 실시양태 32에 있어서, 제2 조성물은 면역화 프라이밍에 사용되고 제1 조성물은 프라임-부스트 용법에서 면역화 부스팅에 사용되는, 방법을 포함한다.
실시양태 33은 실시양태 32 내지 32b 중 어느 한 실시양태에 있어서, 제2 조성물은 변형된 백시니아 앙카라(MVA) 벡터, 아데노바이러스 벡터, 또는 플라스미드를 포함하는, 방법을 포함한다.
실시양태 33a는 실시양태 33에 있어서, 제2 조성물은 MVA-BN 벡터를 포함하는, 방법을 포함한다.
실시양태 33b는 실시양태 33에 있어서, 제2 조성물은 Ad26 또는 Ad35 벡터를 포함하는, 방법을 포함한다.
실시양태 34는 대상체에서 HBV의 감염 및/또는 복제를 감소시키는 방법으로서, 실시양태 27-28f 중 어느 한 실시양태에 따른 약제학적 조성물을 대상체에게 투여하거나 실시양태 30 또는 31 내지 33b 중 어느 한 실시양태에 따라 대상체를 백신접종하는 단계를 포함하는, 대상체에서 HBV의 감염 및/또는 복제를 감소시키는 방법을 포함한다.
실시양태 34a는 실시양태 30 또는 31 내지 34 중 어느 한 실시양태에 있어서, 대상체는 HLA-A*11:01 대상체, HLA-A*24:02 대상체, HLA-A*02:01 대상체, HLA-A*A2402 대상체, HLA-A*A0101 대상체 및 HLA-B*40:01 대상체로 이루어진 군으로부터 선택되는, 방법을 포함한다.
실시양태 34a1은 실시양태 34a에 있어서, 대상체는 HLA-A*11:01 대상체, HLA-A*24:02 대상체, HLA-A*02:01 대상체 및 HLA-A*A2402 대상체로 이루어진 군으로부터 선택되는, 방법을 포함한다.
실시양태 34a2는 실시양태 34a 또는 34a1에 있어서, 대상체는 HLA-A*11:01 대상체, HLA-A*24:02 대상체 및 HLA-A*02:01 대상체로 이루어진 군으로부터 선택되는, 방법을 포함한다.
실시양태 34a3은 실시양태 34a 내지 34a2 중 어느 한 실시양태에 있어서, 대상체는 HLA-A*11:01 대상체인, 방법을 포함한다.
실시양태 34a4는 실시양태 34a 내지 34a3 중 어느 한 실시양태에 있어서, 대상체는 인간 환자인, 방법을 포함한다.
실시양태 34b는 실시양태 30 또는 31 내지 34 중 어느 한 실시양태에 있어서, 대상체는 HLA-A*11:01 에피토프, HLA-A*24:02 에피토프, HLA-A*02:01 에피토프, HLA-A*A2402 에피토프, HLA-A*A0101 에피토프 및 HLA-B*40:01 에피토프로 이루어진 군으로부터 선택된 하나 이상의 에피토프를 함유하는 적어도 하나의 HBV 항원을 포함하는, 방법을 포함한다.
실시양태 34b1은 실시양태 34b에 있어서, 대상체는 HLA-A*11:01 에피토프, HLA-A*24:02 에피토프, HLA-A*02:01 에피토프 및 HLA-A*A2402 에피토프로 이루어진 군으로부터 선택된 하나 이상의 에피토프를 함유하는 적어도 하나의 HBV 항원을 포함하는, 방법을 포함한다.
실시양태 34b2는 실시양태 34b 또는 34b1에 있어서, 대상체는 HLA-A*11:01 에피토프, HLA-A*24:02 에피토프 및 HLA-A*02:01 에피토프로 이루어진 군으로부터 선택된 하나 이상의 에피토프를 함유하는 적어도 하나의 HBV 항원을 포함하는, 방법을 포함한다.
실시양태 34b3은 실시양태 34b 내지 34b2 중 어느 한 실시양태에 있어서, 대상체는 하나 이상의 HLA-A*11:01 에피토프를 함유하는 적어도 하나의 HBV 항원을 포함하는, 방법을 포함한다.
실시양태 34b4는 실시양태 34b 내지 34b3 중 어느 한 실시양태에서, 대상체는 인간 환자인, 방법을 포함한다.
실시양태 35는 단리된 숙주 세포로서, 실시양태 1 내지 15 및 26 중 어느 한 실시양태의 핵산 분자 또는 조합, 실시양태 16 내지 18c2 중 어느 한 실시 양태의 벡터, 또는 실시양태 19 내지 25 중 어느 한 실시양태의 RNA 레플리콘을 포함하는, 단리된 숙주 세포를 포함한다.
실시양태 36은 RNA 레플리콘을 생성하는 방법으로서, 실시양태 26에 따른 핵산을 생체내 또는 시험관내에서 전사하는 단계를 포함하는, RNA 레플리콘을 생성하는 방법을 포함한다.
실시양태 36a는 실시양태 36에 있어서, 핵산은 비인간 동물의 생체내에서 전사되는, 방법을 포함한다.
실시양태 36b는 실시양태 36에 있어서, 핵산은 인간의 생체내에서 전사되는, 방법을 포함한다.
실시양태 37은 실시양태 27 내지 28f 중 어느 한 실시양태에 있어서, 이를 필요로 하는 대상체, 바람직하게는 만성 HBV 감염을 가진 대상체에서 선택적으로 또 다른 면역원성 제제 또는 다른 항-HBV 제제와 조합하여 B형 간염 바이러스(HBV)에 대한 면역 반응을 유도하는 데 사용하기 위한, 약제학적 조성물을 포함한다,
실시양태 37a는 실시양태 37에 있어서, 다른 항-HBV 제제는 소분자, 항체 또는 이의 항원 결합 단편, 폴리펩타이드, 단백질, 또는 핵산인, 약제학적 조성물을 포함한다.
실시양태 37b는 실시양태 27 내지 28f 중 어느 한 실시양태의 약제학적 조성물을 대상체에게 투여하는 단계를 포함하는, 이를 필요로 하는 대상체에서 B형 간염 바이러스(HBV)에 대한 면역 반응을 유도하는 방법으로서, 선택적으로 상기 방법은 또 다른 면역원성 제제 및/또는 또 다른 항-HBV 제제를 대상체, 바람직하게는 만성 HBV 감염을 가진 대상체에게 투여하는 단계를 추가로 포함하는 방법을 포함한다.
실시양태 38은 실시양태 27 내지 28f 중 어느 한 실시양태에 있어서, 이를 필요로 하는 대상체, 바람직하게는 만성 HBV 감염을 가진 대상체에서 선택적으로 또 다른 치료제, 바람직하게는 또 다른 항-HBV 제제와 조합하여 진행성 섬유증, 간경변 및 간세포 암종(HCC)으로 이루어진 군으로부터 선택된 B형 간염 바이러스(HBV)-유발 질환을 치료하는 데 사용하기 위한, 약제학적 조성물을 포함한다.
실시양태 38a는 이를 필요로 하는 대상체에서 B형 간염 바이러스(HBV)-유발 질환을 치료하는 방법으로서, 실시양태 27 내지 28f 중 어느 한 실시양태의 약제학적 조성물을 대상체에게 투여하는 단계를 포함하고, 선택적으로 상기 방법은 또 다른 치료제, 바람직하게는 또 다른 항-HBV 제제를 대상체에게 투여하는 단계를 추가로 포함하고, 바람직하게는 상기 대상체는 만성 HBV 감염을 가지며 HBV-유발 질환은 진행성 섬유증, 간경변 및 간세포 암종(HCC)으로 이루어진 군으로부터 선택되는, 방법을 포함한다.
실시양태 39는 단리된 HBV 항원으로서, 서열번호 1, 3, 5, 9, 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 포함하는, 단리된 HBV 항원을 포함한다.
실시양태 39a는 실시양태 39에 있어서, HBV 항원은 HBV 유전자형 A, B, C 및 D에 대한 컨센서스 서열을 포함하는, 단리된 HBV 항원을 포함한다.
실시양태 39b는 실시양태 39 또는 39a에 있어서, HBV 항원은 HLA-A*11:01, HLA-A*24:02, HLA-A*02:01, HLA-A*A2402, HLA-A*A0101 및 HLA-B*40:01에 대한 에피토프 중 적어도 2개, 3개, 4개, 5개 또는 모두를 포함하는, 단리된 HBV 항원을 포함한다.
실시양태 39c는 실시양태 39 내지 39b 중 어느 한 실시양태에 있어서, 서열번호 1, 3, 5, 9, 84, 85, 또는 86 중 어느 한 실시양태의 아미노산 서열로 이루어진, 단리된 HBV 항원을 포함한다.
실시양태 40은 단리된 폴리뉴클레오티드 서열로서, 실시양태 39 내지 39c 중 어느 한 실시양태의 HBV 항원을 인코딩하는, 단리된 폴리뉴클레오티드 서열을 포함한다.
실시양태 40a는 실시양태 40에 있어서, 서열번호 2, 4, 6, 10, 87, 88, 또는 89 중 어느 한 실시양태의 뉴클레오티드 서열을 포함하는, 단리된 폴리뉴클레오티드 서열을 포함한다.
실시양태 40b는 실시양태 40에 있어서, 서열번호 2, 4, 6, 10, 87, 88, 또는 89 중 어느 한 실시양태의 뉴클레오티드 서열로 이루어진, 단리된 폴리뉴클레오티드 서열을 포함한다.
실시양태 41은 벡터로서, 실시양태 40 내지 40b 중 어느 한 실시양태의 폴리뉴클레오티드 서열을 포함하는, 벡터를 포함한다.
실시양태 41a는 실시양태 41에 있어서, 플라스미드인, 벡터를 포함한다.
실시양태 41b는 실시양태 41에 있어서, 바이러스 벡터인, 벡터를 포함한다.
실시양태 41b1은 실시양태 41b에 있어서, MVA 벡터, 바람직하게는 MVA-BN인, 벡터를 포함한다.
실시양태 41b2는 실시양태 41b에 있어서, 아데노바이러스 벡터, 바람직하게는 Ad26 또는 Ad35인, 벡터를 포함한다.
실시양태 41c는 실시양태 41에 있어서, RNA 레플리콘인, 벡터를 포함한다.
실시양태 42는 약제학적 조성물로서, 실시양태 39 내지 39c 중 어느 한 실시양태의 단리된 HBV 항원, 실시양태 40 내지 40b 중 어느 한 실시양태의 단리된 폴리뉴클레오티드 서열, 또는 실시양태 41 내지 41c 중 어느 한 실시양태의 벡터를 포함하는, 약제학적 조성물이다.
실시양태 43은 실시양태 42의 약제학적 조성물을 대상체에게 투여하는 단계를 포함하는, 이를 필요로 하는 대상체에서 면역 반응을 유도하는 방법이다.
실시양태 43a는 실시양태 42에 있어서, 이를 필요로 하는 대상체, 바람직하게는 만성 HBV 감염을 가진 대상체에서 선택적으로 또 다른 면역원성 제제, 바람직하게는 또 다른 항-HBV 제제와 조합하여 B형 간염 바이러스(HBV)에 대한 면역 반응을 유도하는 데 사용하기 위한, 약제학적 조성물을 포함한다.
실시양태 44는 단리된 숙주 세포로서, 실시양태 40 내지 40b 중 어느 한 실시양태의 핵산 분자, 실시양태 41 내지 41c 중 어느 한 실시양태의 벡터를 포함하는, 단리된 숙주 세포를 포함한다.
실시예
실시예 1: 레플리콘 백신 후보의 항원 선택, 설계 및 시험관내 평가
L 표면 항원으로부터의 고도의 면역원성 HBV 단백질 코어, Pol, PreS2.S 및 PreS1 도메인을 각각 레플리콘 HBV 치료 백신에 포함시키기 위해 선택하였다. 면역원성을 집중화하기 위해, 유전자형 A, B, C 및 D로부터의 각 항원에 대한 고유한 서열의 정렬에 기초하여 컨센서스 서열을 생성하였다. 전 세계 만성 B형 간염(CHB) 감염의 > 78%를 차지하는 이러한 4가지 유전자형을 포함함으로써, 치료 가능한 표적 집단의 규모가 최대화된다. 중국, 미국 및 유럽에서 상위 3개의 가장 흔한 MHC 부류 I HLA 대립유전자(HLA-A*11:01, HLA-A*24:02, HLA-A*02:01, HLA-A*A0201, HLA-A*A2402, HLA-A* A0101 및 HLA-B*40:01 포함)에 대한 알려진 인간 T 세포 에피토프를 각각의 컨센서스 서열에 맵핑하였다. 알려진 에피토프가 변경된 것으로 밝혀지면, 컨센서스 서열을 조정하여 에피토프를 복원하였다. 예를 들어, C 말단의 Arg149, 150 및 151은 HBV 치료용 백신에 인코딩된 HBV 코어에 포함되었다. Pol은 이의 역전사효소 및 RNase H 활성을 불활성화하도록 더욱 최적화되었다. 시스타틴 S 전구체 신호 펩타이드는 분비를 향상시키기 위해 Core, Pol 및 PreS1 도메인에 첨가되었으며, PreS2.S의 내부 신호 펩타이드는 PreS2.S 단백질 생성물 M 및 S 분비를 촉진하기 위해 그대로 유지하였다. 마지막으로, 각 항원에 대한 아미노산 서열을 역번역하고 인간에서 발현을 최대화하도록 코돈을 최적화하였다(도 1a).
이러한 항원은 레플리콘 내에서 각각의 항원의 상이한 위치를 갖는 레플리콘 단독 또는 멀티시스트론 구성으로 인코딩되었고, 각각은 P2A 리보솜 스킵 요소 또는 EMCV 또는 EV71로부터의 내부 리보솜 진입 부위(IRES)에 의해 연결되었다(도 1b). 플라스미드 주형을 사용하여, 각 레플리콘 설계에 대한 RNA를 시험관내 전사 반응으로 생성하고, Vero 세포에 전기천공하였다. 전기천공 24-48시간 후, 각 항원의 발현 및 분비를 유세포 분석, 웨스턴 블롯 분석 및 ELISA로 측정하였다. 이중 가닥 RNA(dsRNA) 및 항원-양성 세포의 빈도 또한 레플리콘 증폭 효율의 지표로서 검정되었다. 각 작제물에 대해, 모든 항원은 단일 항원을 발현하는 레플리콘에 비해 항원/dsRNA 양성 세포의 1) 발현, 2) 분비 및 3) 빈도의 상대적 수준을 기반으로 스코어를 부여받았다. 항원 스코어를 가중하고 합하여 총 레플리콘 작제물 스코어를 얻었다(하기 표 1). 각 작제물은 이러한 스코어에 기반하여 순위가 매겨졌으며 상위 4개의 바이시스트론 및 상위 4개의 테트라시스트론 작제물이 선택되어 생체내 평가로 진행되었다(도 2). 동점 작제물 스코어의 경우, 유전자 스코어는 이들 작제물의 순위를 매기기 위해 사용된 다음의 순서로 우선순위가 지정되었다: 코어 > Pol > PreS2.S > PreS1. 또한, 각 항원의 보다 유사한 상대적 발현 수준을 갖는 작제물이 단일 항원의 높은 발현 및 다른 항원의 낮은 발현을 갖는 작제물보다 우선순위가 지정되었다.
도 2는 단일유전자 대조군에 비해 상위 8개의 레플리콘으로부터의 각 항원의 발현을 나타낸다. 모든 작제물은 각각의 항원의 상대적으로 높은 수준의 발현을 유지할 수 있었다. 그러나, 코어 및 pol을 동일한 바이시스트로론 레플리콘 RNA로부터 발현시켰을 때, 코어 발현의 감소가 관찰되었다. 대조적으로, 동일한 레플리콘으로부터 Core, Pol, PreS2.S 및 PreS1을 발현하는 테트라시스트론 레플리콘은 단일유전자 대조군에 비해 코어 발현이 2-3배 증가함을 일관되게 나타내었다. 트리시스트론 레플리콘 RNA로부터 코어, Pol 및 PreS2.S의 발현은 또한 코어 발현 수준의 증가를 초래했지만(도 3), PreS1이 동일한 레플리콘 RNA로부터 발현되었을 때만큼 극적으로 증가하지는 않았다.
실시예 2: SMARRT 레플리콘 RNA 플랫폼은 마우스에서 HBV 표적에 대한 세포 반응을 유도한다
이들 연구의 목적은 HBV 항원을 인코딩하는 합성 변형 알파 RNA 레플리콘 기술(SMARRT: Synthetic Modified Alpha RNA replicon technology)이 C57BL/6 마우스에서 면역 반응을 유도할 수 있는지 결정하는 것이다. SMARRT 단일유전자 HBV 작제물은 15 μg으로 투여되었고 혼합된 그룹은 각 레플리콘 15 μg에서 4개의 SMARRT 단일유전자 레플리콘을 받았다(마우스당 총 60 μg RNA). 0주차에, 지시된 SMARRT 작제물(들)을 IM 주사에 의해 마우스를 면역화시켰고, 대조군에는 식염수를 주사하였다. 2주차에, 모든 동물을 희생시키고, 비장 세포를 삽입물에서 항원 서열을 포함하는 15량체 중첩 펩타이드 풀로 자극하였다(SMARRT. Pol의 경우, 중첩 라이브러리는 2개의 풀로 분할되었음). IFN γ-생성 세포의 유도를 IFN γ ELISpot에 의해 측정하였다. CD8 및 CD4 다기능성 T 세포 반응은 유세포 분석에 의해 IFN-γ, TNFα 및 IL-2의 생성을 측정함으로써 결정하였다. 아래 표 2는 다양한 실험군을 나타낸다.
HBV 항원을 인코딩하는 SMARRT 레플리콘으로 면역화된 모든 동물은 적절한 항원 서열을 포함하는 펩타이드로 자극 시 IFN γ-생성 세포를 발달시켰다(도 4). 또한, 4개의 SMARRT 레플리콘을 혼합하면 IFNγ 생성 세포가 4개의 항원 모두에 대해 유도되었다. 동일하지만 별개의 실험에서, 다기능성 T 세포 사이토카인 생성을 세포내 유세포 분석으로 측정하였다(도 5). 이 실험은 SMARRT.Core 또는 SMARRT.PreS1로 마우스를 면역화하면 C57BL/6 마우스에서 다기능성 CD4 T 세포를 유도함을 나타내었다. SMARRT.Pol 및 SMARRT.PreS2.S 면역화는 마우스에서 다기능성 CD4 및 CD8 T 세포 반응 둘 모두를 초래하였다.
실시예 3: 마우스에서 SMARRT HBV 치료 백신 후보의 하향 선택
시험관내 스크리닝 후, 마우스에서 생체내 면역원성 분석을 위해 8개의 작제물을 선택하였고, 여기에는 4개의 HBV 항원 모두를 전달하기 위해 4개의 조합으로 혼합된 4개의 테트라시스트론 작제물 및 4개의 이중유전자 작제물이 포함되었다. C57BL/6 마우스를 0주차에 면역화시킨 다음, 아래 표 3의 실험 개요에 따라 면역원성 분석을 위해 2주차에 비장을 적출하였다. 생체외 연구에는 IFNγ ELISpot 및 세포내 사이토카인 염색이 포함되었다.
IFNγ ELISpot에 의해 측정된 바와 같이, 모든 이중유전자 및 테트라시스트론 작제물은 HBV 코어(도 6a), Pol(도 6b), 및 PreS2.S(도 6c)에 대해 강한 T 세포 반응을 유도하였다. 모든 이중유전자 및 테트라시스트론 작제물은 PreS1에 대한 T 세포 반응을 유도했으며(도 6d), 작제물에 따라 약간의 가변성이 있다. 가장 강한 PreS1 반응은 이중유전자 2 및 3(그룹 9), 이중유전자 2 및 4(군 10) 및 테트라시스트론 작제물(그룹 11-14)의 혼합물에 의해 유도되었다.
모든 이중유전자 및 테트라시스트론 작제물은 다중 사이토카인을 생성하는 능력에 의해 측정된 바와 같이 코어(도 7a), Pol(도 7b), PreS2.S(도 7c) 및 PreS1(도 7d)에 대해 다기능성 CD4+ 및 CD8+ T 세포 반응을 유도하였다. PreS1에 대한 반응은 이중유전자 2 및 3(그룹 9), 이중유전자 2 및 4(그룹 10) 및 테트라시스트론 작제물(그룹 11-14)의 혼합물에 의해 유도된 가장 강한 반응으로 작제물에 따라 더 다양했다.
실시예 4: 비인간 영장류에서 SMARRT HBV 치료 백신 후보의 하향 선택
마우스에서 선택된, 선택된 작제물이 대형 동물에서 면역원성임을 확인하기 위해, 사이노몰구스 원숭이(M. fascicularis)에서 면역원성 연구를 수행할 것이다. NHP는 0주차에 2개의 상이한 SMARRT 백신 후보로 면역화한 다음, 4주마다 추가로 3회 부스팅하였다. SMARRT의 3가지 상이한 용량 수준은 아래 표 4에 나타낸 바와 같이 평가될 것이다. 생체외 검정은 주사 후 10일째에 기능적 T 세포 반응을 결정하기 위해 PBMC를 사용하여 IFNγ ELISpot 및 세포내 사이토카인 염색을 유도할 것이다. ELISA에 의해 항-HBsAg 항체 수준을 측정하기 위해 주사일에 혈청을 채취할 것이다. 혈청은 또한 주사 당일뿐만 아니라 주사 후 6시간 및 주사 후 24시간에 수집되어 사이토카인 및 C-반응성 단백질 수준을 측정할 것이다.
본 발명의 범위 및 정신으로부터 벗어나지 않으면서 본원에 개시된 본 발명에 다양한 치환 및 변형이 이루어질 수 있다는 것은 당업자에게 쉽게 명백할 것이다.
본 명세서에 언급된 모든 특허 및 간행물은 본 발명이 속하는 기술분야에서 숙련가의 수준을 나타낸다.
본원에 적합하게 예시적으로 기재된 본 발명은 본원에 구체적으로 개시되지 않은 임의의 요소 또는 요소들, 제한 또는 제한들이 없이 실시될 수 있다. 따라서, 예를 들어, 본원의 각 경우에서 용어 "포함하는", "~로 본질적으로 이루어진" 및 "~로 이루어진"은 다른 두 용어 중 어느 하나로 대체될 수 있다. 사용된 용어 및 표현은 설명의 용어로서 사용된 것이지 한정되는 것이 아니며, 그러한 용어 및 표현의 사용에 있어서 나타내고 설명된 특징들 또는 그 일부의 임의의 등가물을 배제하는 의도는 없으나, 청구된 본 발명의 범위 내에서 다양한 변형이 가능하다는 것을 인정한다. 또한, 본 발명의 특징 또는 측면이 마쿠쉬 그룹의 관점에서 설명되는 경우, 당업자는 본 발명이 또한 그에 의해 마쿠쉬 그룹의 임의의 개별 구성원 또는 구성원의 서브그룹의 관점에서 설명된다는 것을 인식할 것이다. 예를 들어, X가 브롬, 염소 및 요오드로 이루어진 군으로부터 선택되는 것으로 기재되는 경우, X가 브롬이라는 주장과 X가 브롬 및 염소라는 주장이 충분히 설명되어 있다. 다른 실시양태는 하기 청구범위 내에 있다.
SEQUENCE LISTING
<110> Janssen Sciences Ireland Unlimited Company
<120> RNA Replicon Vaccines Against HBV
<130> TIP1088WOPCT1
<150> US 63/049,400
<151> 2020-07-08
<150> US 63/144,051
<151> 2021-02-01
<160> 92
<170> PatentIn version 3.5
<210> 1
<211> 118
<212> PRT
<213> Artificial Sequence
<220>
<223> PreS1 HBV antigen
<400> 1
Gly Gly Trp Ser Ser Lys Pro Arg Lys Gly Met Gly Thr Asn Leu Ser
1 5 10 15
Val Pro Asn Pro Leu Gly Phe Phe Pro Asp His Gln Leu Asp Pro Ala
20 25 30
Phe Gly Ala Asn Ser Asn Asn Pro Asp Trp Asp Phe Asn Pro Asn Lys
35 40 45
Asp His Trp Pro Asp Ala Asn Lys Val Gly Ala Gly Ala Phe Gly Pro
50 55 60
Gly Phe Thr Pro Pro His Gly Gly Leu Leu Gly Trp Ser Pro Gln Ala
65 70 75 80
Gln Gly Ile Leu Thr Thr Val Pro Ala Ala Pro Pro Pro Ala Ser Thr
85 90 95
Asn Arg Gln Ser Gly Arg Gln Pro Thr Pro Leu Ser Pro Pro Leu Arg
100 105 110
Asp Thr His Pro Gln Ala
115
<210> 2
<211> 357
<212> DNA
<213> Artificial Sequence
<220>
<223> PreS1 HBV antigen coding sequence
<400> 2
ggtggatgga gctcaaagcc gcggaaaggg atgggtacta acctgtccgt accaaatccc 60
ctgggatttt ttccagacca ccaactcgat cctgcttttg gcgcaaattc caacaatccc 120
gactgggact ttaaccctaa caaggaccac tggcctgatg ccaacaaggt gggggcagga 180
gcctttggtc ccggcttcac cccaccccat ggaggtcttt tgggatggtc accacaggcc 240
cagggcatcc tgaccactgt ccctgctgct ccaccgccag cttctactaa tcgacagagc 300
gggaggcagc cgacccccct gagtcccccc ctgcgggata cccaccctca ggcataa 357
<210> 3
<211> 100
<212> PRT
<213> Artificial Sequence
<220>
<223> D1-19 PreS1 HBV antigen
<400> 3
Asn Pro Leu Gly Phe Phe Pro Asp His Gln Leu Asp Pro Ala Phe Gly
1 5 10 15
Ala Asn Ser Asn Asn Pro Asp Trp Asp Phe Asn Pro Asn Lys Asp His
20 25 30
Trp Pro Asp Ala Asn Lys Val Gly Ala Gly Ala Phe Gly Pro Gly Phe
35 40 45
Thr Pro Pro His Gly Gly Leu Leu Gly Trp Ser Pro Gln Ala Gln Gly
50 55 60
Ile Leu Thr Thr Val Pro Ala Ala Pro Pro Pro Ala Ser Thr Asn Arg
65 70 75 80
Gln Ser Gly Arg Gln Pro Thr Pro Leu Ser Pro Pro Leu Arg Asp Thr
85 90 95
His Pro Gln Ala
100
<210> 4
<211> 303
<212> DNA
<213> Artificial Sequence
<220>
<223> D1-19 PreS1 HBV antigen coding sequence
<400> 4
aatcccctgg gattttttcc agaccaccaa ctcgatcctg cttttggcgc aaattccaac 60
aatcccgact gggactttaa ccctaacaag gaccactggc ctgatgccaa caaggtgggg 120
gcaggagcct ttggtcccgg cttcacccca ccccatggag gtcttttggg atggtcacca 180
caggcccagg gcatcctgac cactgtccct gctgctccac cgccagcttc tactaatcga 240
cagagcggga ggcagccgac ccccctgagt ccccccctgc gggataccca ccctcaggca 300
taa 303
<210> 5
<211> 281
<212> PRT
<213> Artificial Sequence
<220>
<223> PreS2.S HBV antigen
<400> 5
Met Gln Trp Asn Ser Thr Thr Phe His Gln Thr Leu Gln Asp Pro Arg
1 5 10 15
Val Arg Gly Leu Tyr Phe Pro Ala Gly Gly Ser Ser Ser Gly Thr Val
20 25 30
Asn Pro Val Pro Thr Thr Ala Ser Pro Ile Ser Ser Ile Phe Ser Arg
35 40 45
Thr Gly Asp Pro Ala Pro Asn Met Glu Asn Ile Thr Ser Gly Phe Leu
50 55 60
Gly Pro Leu Leu Val Leu Gln Ala Gly Phe Phe Leu Leu Thr Arg Ile
65 70 75 80
Leu Thr Ile Pro Gln Ser Leu Asp Ser Trp Trp Thr Ser Leu Asn Phe
85 90 95
Leu Gly Gly Thr Pro Val Cys Leu Gly Gln Asn Ser Gln Ser Pro Thr
100 105 110
Ser Asn His Ser Pro Thr Ser Cys Pro Pro Ile Cys Pro Gly Tyr Arg
115 120 125
Trp Met Cys Leu Arg Arg Phe Ile Ile Phe Leu Phe Ile Leu Leu Leu
130 135 140
Cys Leu Ile Phe Leu Leu Val Leu Leu Asp Tyr Gln Gly Met Leu Pro
145 150 155 160
Val Cys Pro Leu Ile Pro Gly Ser Ser Thr Thr Ser Thr Gly Pro Cys
165 170 175
Lys Thr Cys Thr Ile Pro Ala Gln Gly Thr Ser Met Phe Pro Ser Cys
180 185 190
Cys Cys Thr Lys Pro Ser Asp Gly Asn Cys Thr Cys Ile Pro Ile Pro
195 200 205
Ser Ser Trp Ala Phe Ala Lys Tyr Leu Trp Glu Trp Ala Ser Val Arg
210 215 220
Phe Ser Trp Leu Ser Leu Leu Val Pro Phe Val Gln Trp Phe Val Gly
225 230 235 240
Leu Ser Pro Thr Val Trp Leu Ser Val Ile Trp Met Met Trp Tyr Trp
245 250 255
Gly Pro Ser Leu Tyr Asn Ile Leu Ser Pro Phe Leu Pro Leu Leu Pro
260 265 270
Ile Phe Phe Cys Leu Trp Val Tyr Ile
275 280
<210> 6
<211> 846
<212> DNA
<213> Artificial Sequence
<220>
<223> PreS2.S HBV antigen coding sequence
<400> 6
atgcagtgga actcaactac tttccatcag acccttcagg accctagagt gcgcgggctg 60
tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac gaccgcctct 120
cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga gaatatcacc 180
tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct gactcgaatc 240
ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct gggaggaact 300
cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc gacaagttgt 360
cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat cttcctcttc 420
atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg catgctgcct 480
gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa gacctgtaca 540
attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc aagcgacggt 600
aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct ctgggaatgg 660
gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg gtttgtggga 720
ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg cccttccctt 780
tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct gtgggtctat 840
atttaa 846
<210> 7
<211> 148
<212> PRT
<213> Artificial Sequence
<220>
<223> HBV core antigen
<400> 7
Asp Ile Asp Pro Tyr Lys Glu Phe Gly Ala Ser Val Glu Leu Leu Ser
1 5 10 15
Phe Leu Pro Ser Asp Phe Phe Pro Ser Ile Arg Asp Leu Leu Asp Thr
20 25 30
Ala Ser Ala Leu Tyr Arg Glu Ala Leu Glu Ser Pro Glu His Cys Ser
35 40 45
Pro His His Thr Ala Leu Arg Gln Ala Ile Leu Cys Trp Gly Glu Leu
50 55 60
Met Asn Leu Ala Thr Trp Val Gly Ser Asn Leu Glu Asp Pro Ala Ser
65 70 75 80
Arg Glu Leu Val Val Ser Tyr Val Asn Val Asn Met Gly Leu Lys Ile
85 90 95
Arg Gln Leu Leu Trp Phe His Ile Ser Cys Leu Thr Phe Gly Arg Glu
100 105 110
Thr Val Leu Glu Tyr Leu Val Ser Phe Gly Val Trp Ile Arg Thr Pro
115 120 125
Pro Ala Tyr Arg Pro Pro Asn Ala Pro Ile Leu Ser Thr Leu Pro Glu
130 135 140
Thr Thr Val Val
145
<210> 8
<211> 444
<212> DNA
<213> Artificial Sequence
<220>
<223> HBV core antigen coding sequence
<400> 8
gacatcgacc cttacaagga gttcggcgcc agcgtggaac tgctgtcttt tctgcccagt 60
gatttctttc cttccattcg agacctgctg gataccgcct ctgctctgta tcgggaagcc 120
ctggagagcc cagaacactg ctccccacac cataccgctc tgcgacaggc aatcctgtgc 180
tggggggagc tgatgaacct ggccacatgg gtgggatcga atctggagga ccccgcttca 240
cgggaactgg tggtcagcta cgtgaacgtc aatatgggcc tgaaaatccg ccagctgctg 300
tggttccata ttagctgcct gacttttgga cgagagaccg tgctggaata cctggtgtcc 360
ttcggcgtct ggattcgcac tccccctgct tatcgaccac ccaacgcacc aattctgtcc 420
accctgcccg agaccacagt ggtc 444
<210> 9
<211> 843
<212> PRT
<213> Artificial Sequence
<220>
<223> HBV polymerase antigen
<400> 9
Met Pro Leu Ser Tyr Gln His Phe Arg Lys Leu Leu Leu Leu Asp Asp
1 5 10 15
Glu Ala Gly Pro Leu Glu Glu Glu Leu Pro Arg Leu Ala Asp Glu Gly
20 25 30
Leu Asn Arg Arg Val Ala Glu Asp Leu Asn Leu Gly Asn Leu Asn Val
35 40 45
Ser Ile Pro Trp Thr His Lys Val Gly Asn Phe Thr Gly Leu Tyr Ser
50 55 60
Ser Thr Val Pro Val Phe Asn Pro Glu Trp Gln Thr Pro Ser Phe Pro
65 70 75 80
Asn Ile His Leu Gln Glu Asp Ile Ile Asn Arg Cys Glu Gln Phe Val
85 90 95
Gly Pro Leu Thr Val Asn Glu Lys Arg Arg Leu Lys Leu Ile Met Pro
100 105 110
Ala Arg Phe Tyr Pro Asn Val Thr Lys Tyr Leu Pro Leu Asp Lys Gly
115 120 125
Ile Lys Pro Tyr Tyr Pro Glu His Leu Val Asn His Tyr Phe Gln Thr
130 135 140
Arg His Tyr Leu His Thr Leu Trp Lys Ala Gly Ile Leu Tyr Lys Arg
145 150 155 160
Glu Thr Thr Arg Ser Ala Ser Phe Cys Gly Ser Pro Tyr Ser Trp Glu
165 170 175
Gln Glu Leu Gln His Gly Arg Leu Val Phe Gln Thr Ser Lys Arg His
180 185 190
Gly Asp Glu Ser Phe Cys Ser Gln Ser Ser Gly Ile Leu Ser Arg Ser
195 200 205
Pro Val Gly Pro Cys Ile Gln Ser Gln Leu Arg Lys Ser Arg Leu Gly
210 215 220
Leu Gln Pro Gln Gln Gly His Leu Ala Arg Arg Gln Gln Gly Arg Ser
225 230 235 240
Gly Ser Ile Arg Ala Arg Val His Pro Thr Thr Arg Arg Thr Phe Gly
245 250 255
Val Glu Pro Ser Gly Ser Gly His Ile Asp Asn Ser Ala Ser Ser Ser
260 265 270
Ser Ser Cys Leu His Gln Ser Ala Val Arg Lys Ala Ala Tyr Ser His
275 280 285
Leu Ser Thr Ser Lys Arg His Ser Ser Ser Gly His Ala Val Glu Leu
290 295 300
His Asn Ile Pro Pro Asn Ser Ala Arg Ser Gln Ser Glu Gly Pro Val
305 310 315 320
Phe Ser Cys Trp Trp Leu Gln Phe Arg Asn Ser Lys Pro Cys Ser Asp
325 330 335
Tyr Cys Leu Ser His Ile Val Asn Leu Leu Glu Asp Trp Gly Pro Cys
340 345 350
Thr Glu His Gly Glu His His Ile Arg Ile Pro Arg Thr Pro Ala Arg
355 360 365
Val Thr Gly Gly Val Phe Leu Val Asp Lys Asn Pro His Asn Thr Thr
370 375 380
Glu Ser Arg Leu Val Val Asp Phe Ser Gln Phe Ser Arg Gly Asn Thr
385 390 395 400
Arg Val Ser Trp Pro Lys Phe Ala Val Pro Asn Leu Gln Ser Leu Thr
405 410 415
Asn Leu Leu Ser Ser Asn Leu Ser Trp Leu Ser Leu Asp Val Ser Ala
420 425 430
Ala Phe Tyr His Leu Pro Leu His Pro Ala Ala Met Pro His Leu Leu
435 440 445
Val Gly Ser Ser Gly Leu Ser Arg Tyr Val Ala Arg Leu Ser Ser Asn
450 455 460
Ser Arg Ile Ile Asn His Gln His Gly Thr Met Gln Asn Leu His Asp
465 470 475 480
Ser Cys Ser Arg Asn Leu Tyr Val Ser Leu Leu Leu Leu Tyr Lys Thr
485 490 495
Phe Gly Arg Lys Leu His Leu Tyr Ser His Pro Ile Ile Leu Gly Phe
500 505 510
Arg Lys Ile Pro Met Gly Val Gly Leu Ser Pro Phe Leu Leu Ala Gln
515 520 525
Phe Thr Ser Ala Ile Cys Ser Val Val Arg Arg Ala Phe Pro His Cys
530 535 540
Leu Ala Phe Ser Tyr Met Asn Asn Val Val Leu Gly Ala Lys Ser Val
545 550 555 560
Gln His Leu Glu Ser Leu Phe Thr Ala Val Thr Asn Phe Leu Leu Ser
565 570 575
Leu Gly Ile His Leu Asn Pro Asn Lys Thr Lys Arg Trp Gly Tyr Ser
580 585 590
Leu Asn Phe Met Gly Tyr Val Ile Gly Ser Trp Gly Thr Leu Pro Gln
595 600 605
Glu His Ile Val Gln Lys Ile Lys Glu Cys Phe Arg Lys Leu Pro Val
610 615 620
Asn Arg Pro Ile Asp Trp Lys Val Cys Gln Arg Ile Val Gly Leu Leu
625 630 635 640
Gly Phe Ala Ala Pro Phe Thr Gln Cys Gly Tyr Pro Ala Leu Met Pro
645 650 655
Leu Tyr Ala Cys Ile Gln Ser Lys Gln Ala Phe Thr Phe Ser Pro Thr
660 665 670
Tyr Lys Ala Phe Leu Cys Lys Gln Tyr Leu Asn Leu Tyr Pro Val Ala
675 680 685
Arg Gln Arg Pro Gly Leu Cys Gln Val Phe Ala Asn Ala Thr Pro Thr
690 695 700
Gly Trp Gly Leu Ala Ile Gly His Gln Arg Met Arg Gly Thr Phe Val
705 710 715 720
Ala Pro Leu Pro Ile His Thr Ala Gln Leu Leu Ala Ala Cys Phe Ala
725 730 735
Arg Ser Arg Ser Gly Ala Lys Leu Ile Gly Thr Asp Asn Ser Val Val
740 745 750
Leu Ser Arg Lys Tyr Thr Ser Phe Pro Trp Leu Leu Gly Cys Ala Ala
755 760 765
Asn Trp Ile Leu Arg Gly Thr Ser Phe Val Tyr Val Pro Ser Ala Leu
770 775 780
Asn Pro Ala Asp Asp Pro Ser Arg Gly Arg Leu Gly Leu Tyr Arg Pro
785 790 795 800
Leu Leu Arg Leu Pro Phe Arg Pro Thr Thr Gly Arg Thr Ser Leu Tyr
805 810 815
Ala Asp Ser Pro Ser Val Pro Ser His Leu Pro Asp Arg Val His Phe
820 825 830
Ala Ser Pro Leu His Val Ala Trp Arg Pro Pro
835 840
<210> 10
<211> 2529
<212> DNA
<213> Artificial Sequence
<220>
<223> HBV polymerase antigen coding sequence
<400> 10
atgcccctgt cttaccagca ctttagaaag cttctgctgc tggacgatga agccgggcct 60
ctggaggaag agctgccaag gctggcagac gaggggctga accggagagt ggccgaagat 120
ctgaatctgg gaaacctgaa cgtgagcatc ccttggactc ataaagtcgg caacttcacc 180
gggctgtaca gctccacagt gcctgtcttc aatccagagt ggcagacacc atcctttccc 240
aacattcacc tgcaggagga catcattaat agatgcgaac agttcgtggg acctctgaca 300
gtcaacgaaa agaggcgcct gaaactgatc atgcctgcca ggttttaccc aaatgtgact 360
aagtatctgc cactggataa gggcatcaag ccttactatc cagagcacct ggtgaaccat 420
tacttccaga ctagacacta tctgcatacc ctgtggaagg ccggaatcct gtacaaacga 480
gaaactaccc ggagtgcttc attttgtggc tccccatatt cttgggaaca ggagctgcag 540
catggcaggc tggtgttcca gaccagcaaa cgccacgggg atgagtcctt ttgcagccag 600
tctagtggca tcctgagcag atcccccgtg gggccttgta ttcagtctca gctgcggaag 660
agtagactgg gactgcagcc acagcaggga cacctggcac gacggcagca gggaaggtct 720
ggcagtatcc gggctagagt gcatcccaca actagaagga ccttcggcgt cgagccatca 780
ggaagcggcc acatcgacaa cagcgcatca agctcctcta gttgcctgca tcagtcagcc 840
gtgagaaagg ccgcttacag ccacctgtcc acatctaaaa ggcactcaag ctccgggcat 900
gctgtggagc tgcacaacat ccctccaaat tctgcacgca gtcagtcaga aggacccgtg 960
ttcagctgct ggtggctgca gtttcggaac tcaaagcctt gcagcgacta ttgtctgagc 1020
catattgtga atctgctgga ggattggggc ccttgtaccg agcacgggga acaccatatc 1080
aggattccac gaacaccagc acgagtgact ggaggggtgt tcctggtgga caagaacccc 1140
cacaatacta ccgagagccg gctggtggtc gatttcagtc agttttcaag aggcaacaca 1200
agggtgtcat ggcccaaatt cgccgtccct aatctgcaga gtctgactaa cctgctgtct 1260
agtaatctga gctggctgtc cctggacgtg tccgcagcct tttaccacct gcctctgcat 1320
ccagctgcaa tgccccatct gctggtgggg tcaagcggac tgagtcgcta cgtcgcccga 1380
ctgtcctcta actcacgcat cattaatcac cagcatggca ccatgcagaa cctgcacgat 1440
agctgttccc ggaatctgta cgtgtctctg ctgctgctgt ataagacatt cggcagaaaa 1500
ctgcacctgt acagccatcc tatcattctg gggtttagga agatcccaat gggagtggga 1560
ctgagcccct tcctgctggc acagtttacc tccgccattt gctctgtggt ccgccgagcc 1620
ttcccacact gtctggcttt ttcctatatg aacaatgtgg tcctgggcgc caaatccgtg 1680
cagcatctgg agtctctgtt cacagctgtc actaactttc tgctgagcct ggggatccac 1740
ctgaacccaa ataagactaa acgctggggg tacagcctga atttcatggg atatgtgatt 1800
ggatcctggg ggaccctgcc acaggagcac atcgtgcaga agatcaagga atgctttcgg 1860
aagctgcccg tcaacagacc tatcgactgg aaagtgtgcc agcggattgt cggactgctg 1920
ggcttcgccg ctccctttac ccagtgcggg tacccagcac tgatgcccct gtatgcctgt 1980
atccagtcta agcaggcttt cacctttagt cctacataca aggcattcct gtgcaaacag 2040
tacctgaacc tgtatccagt ggcaaggcag cgacctggac tgtgccaggt ctttgcaaat 2100
gccactccta ccggctgggg gctggctatc ggacatcagc gaatgcgggg cacattcgtg 2160
gcccccctgc ctattcacac tgctcagctg ctggcagcct gctttgctag atctaggagt 2220
ggagcaaagc tgatcggcac cgacaatagt gtggtcctgt caagaaaata cacatccttc 2280
ccatggctgc tgggatgtgc tgcaaactgg attctgaggg gcaccagctt cgtgtacgtc 2340
ccctcagccc tgaatcctgc tgacgatcca tcccgcgggc gactgggact gtaccgacct 2400
ctgctgagac tgcccttcag gcctacaact ggccggacat ctctgtatgc cgattcacca 2460
agcgtgccct cacacctgcc tgacagagtc cactttgctt cacccctgca cgtcgcttgg 2520
cggcctcca 2529
<210> 11
<211> 22
<212> PRT
<213> Artificial Sequence
<220>
<223> P2A autoprotease
<400> 11
Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val
1 5 10 15
Glu Glu Asn Pro Gly Pro
20
<210> 12
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> P2A autoprotease coding sequence
<400> 12
ggaagcggag ctactaactt cagcctgctg aagcaggctg gagacgtgga ggagaaccct 60
ggacct 66
<210> 13
<211> 587
<212> DNA
<213> Artificial Sequence
<220>
<223> EMCV IRES
<400> 13
gcccctctcc ctcccccccc cctaacgtta ctggccgaag ccgcttggaa taaggccggt 60
gtgcgtttgt ctatatgtta ttttccacca tattgccgtc ttttggcaat gtgagggccc 120
ggaaacctgg ccctgtcttc ttgacgagca ttcctagggg tctttcccct ctcgccaaag 180
gaatgcaagg tctgttgaat gtcgtgaagg aagcagttcc tctggaagct tcttgaagac 240
aaacaacgtc tgtagcgacc ctttgcaggc agcggaaccc cccacctggc gacaggtgcc 300
tctgcggcca aaagccacgt gtataagata cacctgcaaa ggcggcacaa ccccagtgcc 360
acgttgtgag ttggatagtt gtggaaagag tcaaatggct ctcctcaagc gtattcaaca 420
aggggctgaa ggatgcccag aaggtacccc attgtatggg atctgatctg gggcctcggt 480
gcacatgctt tacatgtgtt tagtcgaggt taaaaaacgt ctaggccccc cgaaccacgg 540
ggacgtggtt ttcctttgaa aaacacgatg ataatatggc cacaacc 587
<210> 14
<211> 747
<212> DNA
<213> Artificial Sequence
<220>
<223> EV71 IRES
<400> 14
ttaaaacagc tgtgggttgt tcccacccac agggcccact gggcgctagc actctgattt 60
tacgaaatcc ttgtgcgcct gttttatatc ccttccctaa ttcgaaacgt agaagcaatg 120
cgcaccactg atcaatagta ggcgtaacgc gccagttacg tcatgatcaa gcatatctgt 180
tcccccggac tgagtatcaa tagactgctt acgcggttga aggagaaaac gttcgttatc 240
cggctaacta cttcgagaag cccagtaaca ccatggaagc tgcagggtgt ttcgctcagc 300
acttcccccg tgtagatcag gtcgatgagc cactgcaatc cccacaggtg actgtggcag 360
tggctgcgtt ggcggcctgc ctatggggag acccatagga cgctctaatg tggacatggt 420
gcgaagagcc tattgagcta gttagtagtc ctccggcccc tgaatgcggc taatcctaac 480
tgcggagcac atgccttcaa cccagagggt agtgtgtcgt aacgggcaac tctgcagcgg 540
aaccgactac tttgggtgtc cgtgtttctt ttttattctt atattggctg cttatggtga 600
caattacaga attgttacca tatagctatt ggattggcca tccggtgtgt aatagagctg 660
ttatatacct atttgttggc tttgtaccac taactttaaa atctataact accctcaact 720
ttatattaac cctcaataca gttgacc 747
<210> 15
<211> 3174
<212> DNA
<213> Artificial Sequence
<220>
<223> Core-2A-Pol coding sequence
<400> 15
atggctcgac ctctgtgtac cctgctactc ctgatggcta ccctggctgg agctctggcc 60
agcgacatcg acccttacaa ggagttcggc gccagcgtgg aactgctgtc ttttctgccc 120
agtgatttct ttccttccat tcgagacctg ctggataccg cctctgctct gtatcgggaa 180
gccctggaga gcccagaaca ctgctcccca caccataccg ctctgcgaca ggcaatcctg 240
tgctgggggg agctgatgaa cctggccaca tgggtgggat cgaatctgga ggaccccgct 300
tcacgggaac tggtggtcag ctacgtgaac gtcaatatgg gcctgaaaat ccgccagctg 360
ctgtggttcc atattagctg cctgactttt ggacgagaga ccgtgctgga atacctggtg 420
tccttcggcg tctggattcg cactccccct gcttatcgac cacccaacgc accaattctg 480
tccaccctgc ccgagaccac agtggtccgt cgccgtggaa gcggagctac taacttcagc 540
ctgctgaagc aggctggaga cgtggaggag aaccctggac ctatggctcg acctctgtgt 600
accctgctac tcctgatggc taccctggct ggagctctgg ccagcatgcc cctgtcttac 660
cagcacttta gaaagcttct gctgctggac gatgaagccg ggcctctgga ggaagagctg 720
ccaaggctgg cagacgaggg gctgaaccgg agagtggccg aagatctgaa tctgggaaac 780
ctgaacgtga gcatcccttg gactcataaa gtcggcaact tcaccgggct gtacagctcc 840
acagtgcctg tcttcaatcc agagtggcag acaccatcct ttcccaacat tcacctgcag 900
gaggacatca ttaatagatg cgaacagttc gtgggacctc tgacagtcaa cgaaaagagg 960
cgcctgaaac tgatcatgcc tgccaggttt tacccaaatg tgactaagta tctgccactg 1020
gataagggca tcaagcctta ctatccagag cacctggtga accattactt ccagactaga 1080
cactatctgc ataccctgtg gaaggccgga atcctgtaca aacgagaaac tacccggagt 1140
gcttcatttt gtggctcccc atattcttgg gaacaggagc tgcagcatgg caggctggtg 1200
ttccagacca gcaaacgcca cggggatgag tccttttgca gccagtctag tggcatcctg 1260
agcagatccc ccgtggggcc ttgtattcag tctcagctgc ggaagagtag actgggactg 1320
cagccacagc agggacacct ggcacgacgg cagcagggaa ggtctggcag tatccgggct 1380
agagtgcatc ccacaactag aaggaccttc ggcgtcgagc catcaggaag cggccacatc 1440
gacaacagcg catcaagctc ctctagttgc ctgcatcagt cagccgtgag aaaggccgct 1500
tacagccacc tgtccacatc taaaaggcac tcaagctccg ggcatgctgt ggagctgcac 1560
aacatccctc caaattctgc acgcagtcag tcagaaggac ccgtgttcag ctgctggtgg 1620
ctgcagtttc ggaactcaaa gccttgcagc gactattgtc tgagccatat tgtgaatctg 1680
ctggaggatt ggggcccttg taccgagcac ggggaacacc atatcaggat tccacgaaca 1740
ccagcacgag tgactggagg ggtgttcctg gtggacaaga acccccacaa tactaccgag 1800
agccggctgg tggtcgattt cagtcagttt tcaagaggca acacaagggt gtcatggccc 1860
aaattcgccg tccctaatct gcagagtctg actaacctgc tgtctagtaa tctgagctgg 1920
ctgtccctgg acgtgtccgc agccttttac cacctgcctc tgcatccagc tgcaatgccc 1980
catctgctgg tggggtcaag cggactgagt cgctacgtcg cccgactgtc ctctaactca 2040
cgcatcatta atcaccagca tggcaccatg cagaacctgc acgatagctg ttcccggaat 2100
ctgtacgtgt ctctgctgct gctgtataag acattcggca gaaaactgca cctgtacagc 2160
catcctatca ttctggggtt taggaagatc ccaatgggag tgggactgag ccccttcctg 2220
ctggcacagt ttacctccgc catttgctct gtggtccgcc gagccttccc acactgtctg 2280
gctttttcct atatgaacaa tgtggtcctg ggcgccaaat ccgtgcagca tctggagtct 2340
ctgttcacag ctgtcactaa ctttctgctg agcctgggga tccacctgaa cccaaataag 2400
actaaacgct gggggtacag cctgaatttc atgggatatg tgattggatc ctgggggacc 2460
ctgccacagg agcacatcgt gcagaagatc aaggaatgct ttcggaagct gcccgtcaac 2520
agacctatcg actggaaagt gtgccagcgg attgtcggac tgctgggctt cgccgctccc 2580
tttacccagt gcgggtaccc agcactgatg cccctgtatg cctgtatcca gtctaagcag 2640
gctttcacct ttagtcctac atacaaggca ttcctgtgca aacagtacct gaacctgtat 2700
ccagtggcaa ggcagcgacc tggactgtgc caggtctttg caaatgccac tcctaccggc 2760
tgggggctgg ctatcggaca tcagcgaatg cggggcacat tcgtggcccc cctgcctatt 2820
cacactgctc agctgctggc agcctgcttt gctagatcta ggagtggagc aaagctgatc 2880
ggcaccgaca atagtgtggt cctgtcaaga aaatacacat ccttcccatg gctgctggga 2940
tgtgctgcaa actggattct gaggggcacc agcttcgtgt acgtcccctc agccctgaat 3000
cctgctgacg atccatcccg cgggcgactg ggactgtacc gacctctgct gagactgccc 3060
ttcaggccta caactggccg gacatctctg tatgccgatt caccaagcgt gccctcacac 3120
ctgcctgaca gagtccactt tgcttcaccc ctgcacgtcg cttggcggcc tcca 3174
<210> 16
<211> 3174
<212> DNA
<213> Artificial Sequence
<220>
<223> Pol-2A-Core coding sequence
<400> 16
atggctcgac ctctgtgtac cctgctactc ctgatggcta ccctggctgg agctctggcc 60
agcatgcccc tgtcttacca gcactttaga aagcttctgc tgctggacga tgaagccggg 120
cctctggagg aagagctgcc aaggctggca gacgaggggc tgaaccggag agtggccgaa 180
gatctgaatc tgggaaacct gaacgtgagc atcccttgga ctcataaagt cggcaacttc 240
accgggctgt acagctccac agtgcctgtc ttcaatccag agtggcagac accatccttt 300
cccaacattc acctgcagga ggacatcatt aatagatgcg aacagttcgt gggacctctg 360
acagtcaacg aaaagaggcg cctgaaactg atcatgcctg ccaggtttta cccaaatgtg 420
actaagtatc tgccactgga taagggcatc aagccttact atccagagca cctggtgaac 480
cattacttcc agactagaca ctatctgcat accctgtgga aggccggaat cctgtacaaa 540
cgagaaacta cccggagtgc ttcattttgt ggctccccat attcttggga acaggagctg 600
cagcatggca ggctggtgtt ccagaccagc aaacgccacg gggatgagtc cttttgcagc 660
cagtctagtg gcatcctgag cagatccccc gtggggcctt gtattcagtc tcagctgcgg 720
aagagtagac tgggactgca gccacagcag ggacacctgg cacgacggca gcagggaagg 780
tctggcagta tccgggctag agtgcatccc acaactagaa ggaccttcgg cgtcgagcca 840
tcaggaagcg gccacatcga caacagcgca tcaagctcct ctagttgcct gcatcagtca 900
gccgtgagaa aggccgctta cagccacctg tccacatcta aaaggcactc aagctccggg 960
catgctgtgg agctgcacaa catccctcca aattctgcac gcagtcagtc agaaggaccc 1020
gtgttcagct gctggtggct gcagtttcgg aactcaaagc cttgcagcga ctattgtctg 1080
agccatattg tgaatctgct ggaggattgg ggcccttgta ccgagcacgg ggaacaccat 1140
atcaggattc cacgaacacc agcacgagtg actggagggg tgttcctggt ggacaagaac 1200
ccccacaata ctaccgagag ccggctggtg gtcgatttca gtcagttttc aagaggcaac 1260
acaagggtgt catggcccaa attcgccgtc cctaatctgc agagtctgac taacctgctg 1320
tctagtaatc tgagctggct gtccctggac gtgtccgcag ccttttacca cctgcctctg 1380
catccagctg caatgcccca tctgctggtg gggtcaagcg gactgagtcg ctacgtcgcc 1440
cgactgtcct ctaactcacg catcattaat caccagcatg gcaccatgca gaacctgcac 1500
gatagctgtt cccggaatct gtacgtgtct ctgctgctgc tgtataagac attcggcaga 1560
aaactgcacc tgtacagcca tcctatcatt ctggggttta ggaagatccc aatgggagtg 1620
ggactgagcc ccttcctgct ggcacagttt acctccgcca tttgctctgt ggtccgccga 1680
gccttcccac actgtctggc tttttcctat atgaacaatg tggtcctggg cgccaaatcc 1740
gtgcagcatc tggagtctct gttcacagct gtcactaact ttctgctgag cctggggatc 1800
cacctgaacc caaataagac taaacgctgg gggtacagcc tgaatttcat gggatatgtg 1860
attggatcct gggggaccct gccacaggag cacatcgtgc agaagatcaa ggaatgcttt 1920
cggaagctgc ccgtcaacag acctatcgac tggaaagtgt gccagcggat tgtcggactg 1980
ctgggcttcg ccgctccctt tacccagtgc gggtacccag cactgatgcc cctgtatgcc 2040
tgtatccagt ctaagcaggc tttcaccttt agtcctacat acaaggcatt cctgtgcaaa 2100
cagtacctga acctgtatcc agtggcaagg cagcgacctg gactgtgcca ggtctttgca 2160
aatgccactc ctaccggctg ggggctggct atcggacatc agcgaatgcg gggcacattc 2220
gtggcccccc tgcctattca cactgctcag ctgctggcag cctgctttgc tagatctagg 2280
agtggagcaa agctgatcgg caccgacaat agtgtggtcc tgtcaagaaa atacacatcc 2340
ttcccatggc tgctgggatg tgctgcaaac tggattctga ggggcaccag cttcgtgtac 2400
gtcccctcag ccctgaatcc tgctgacgat ccatcccgcg ggcgactggg actgtaccga 2460
cctctgctga gactgccctt caggcctaca actggccgga catctctgta tgccgattca 2520
ccaagcgtgc cctcacacct gcctgacaga gtccactttg cttcacccct gcacgtcgct 2580
tggcggcctc caggaagcgg agctactaac ttcagcctgc tgaagcaggc tggagacgtg 2640
gaggagaacc ctggacctat ggctcgacct ctgtgtaccc tgctactcct gatggctacc 2700
ctggctggag ctctggccag cgacatcgac ccttacaagg agttcggcgc cagcgtggaa 2760
ctgctgtctt ttctgcccag tgatttcttt ccttccattc gagacctgct ggataccgcc 2820
tctgctctgt atcgggaagc cctggagagc ccagaacact gctccccaca ccataccgct 2880
ctgcgacagg caatcctgtg ctggggggag ctgatgaacc tggccacatg ggtgggatcg 2940
aatctggagg accccgcttc acgggaactg gtggtcagct acgtgaacgt caatatgggc 3000
ctgaaaatcc gccagctgct gtggttccat attagctgcc tgacttttgg acgagagacc 3060
gtgctggaat acctggtgtc cttcggcgtc tggattcgca ctccccctgc ttatcgacca 3120
cccaacgcac caattctgtc caccctgccc gagaccacag tggtccgtcg ccgt 3174
<210> 17
<211> 3698
<212> DNA
<213> Artificial Sequence
<220>
<223> Core coding sequence-IRES(EMCV)-Pol coding sequence
<400> 17
atggctcgac ctctgtgtac cctgctactc ctgatggcta ccctggctgg agctctggcc 60
agcgacatcg acccttacaa ggagttcggc gccagcgtgg aactgctgtc ttttctgccc 120
agtgatttct ttccttccat tcgagacctg ctggataccg cctctgctct gtatcgggaa 180
gccctggaga gcccagaaca ctgctcccca caccataccg ctctgcgaca ggcaatcctg 240
tgctgggggg agctgatgaa cctggccaca tgggtgggat cgaatctgga ggaccccgct 300
tcacgggaac tggtggtcag ctacgtgaac gtcaatatgg gcctgaaaat ccgccagctg 360
ctgtggttcc atattagctg cctgactttt ggacgagaga ccgtgctgga atacctggtg 420
tccttcggcg tctggattcg cactccccct gcttatcgac cacccaacgc accaattctg 480
tccaccctgc ccgagaccac agtggtccgt cgccgttaag cccctctccc tccccccccc 540
ctaacgttac tggccgaagc cgcttggaat aaggccggtg tgcgtttgtc tatatgttat 600
tttccaccat attgccgtct tttggcaatg tgagggcccg gaaacctggc cctgtcttct 660
tgacgagcat tcctaggggt ctttcccctc tcgccaaagg aatgcaaggt ctgttgaatg 720
tcgtgaagga agcagttcct ctggaagctt cttgaagaca aacaacgtct gtagcgaccc 780
tttgcaggca gcggaacccc ccacctggcg acaggtgcct ctgcggccaa aagccacgtg 840
tataagatac acctgcaaag gcggcacaac cccagtgcca cgttgtgagt tggatagttg 900
tggaaagagt caaatggctc tcctcaagcg tattcaacaa ggggctgaag gatgcccaga 960
aggtacccca ttgtatggga tctgatctgg ggcctcggtg cacatgcttt acatgtgttt 1020
agtcgaggtt aaaaaacgtc taggcccccc gaaccacggg gacgtggttt tcctttgaaa 1080
aacacgatga taatatggcc acaaccatgg ctcgacctct gtgtaccctg ctactcctga 1140
tggctaccct ggctggagct ctggccagca tgcccctgtc ttaccagcac tttagaaagc 1200
ttctgctgct ggacgatgaa gccgggcctc tggaggaaga gctgccaagg ctggcagacg 1260
aggggctgaa ccggagagtg gccgaagatc tgaatctggg aaacctgaac gtgagcatcc 1320
cttggactca taaagtcggc aacttcaccg ggctgtacag ctccacagtg cctgtcttca 1380
atccagagtg gcagacacca tcctttccca acattcacct gcaggaggac atcattaata 1440
gatgcgaaca gttcgtggga cctctgacag tcaacgaaaa gaggcgcctg aaactgatca 1500
tgcctgccag gttttaccca aatgtgacta agtatctgcc actggataag ggcatcaagc 1560
cttactatcc agagcacctg gtgaaccatt acttccagac tagacactat ctgcataccc 1620
tgtggaaggc cggaatcctg tacaaacgag aaactacccg gagtgcttca ttttgtggct 1680
ccccatattc ttgggaacag gagctgcagc atggcaggct ggtgttccag accagcaaac 1740
gccacgggga tgagtccttt tgcagccagt ctagtggcat cctgagcaga tcccccgtgg 1800
ggccttgtat tcagtctcag ctgcggaaga gtagactggg actgcagcca cagcagggac 1860
acctggcacg acggcagcag ggaaggtctg gcagtatccg ggctagagtg catcccacaa 1920
ctagaaggac cttcggcgtc gagccatcag gaagcggcca catcgacaac agcgcatcaa 1980
gctcctctag ttgcctgcat cagtcagccg tgagaaaggc cgcttacagc cacctgtcca 2040
catctaaaag gcactcaagc tccgggcatg ctgtggagct gcacaacatc cctccaaatt 2100
ctgcacgcag tcagtcagaa ggacccgtgt tcagctgctg gtggctgcag tttcggaact 2160
caaagccttg cagcgactat tgtctgagcc atattgtgaa tctgctggag gattggggcc 2220
cttgtaccga gcacggggaa caccatatca ggattccacg aacaccagca cgagtgactg 2280
gaggggtgtt cctggtggac aagaaccccc acaatactac cgagagccgg ctggtggtcg 2340
atttcagtca gttttcaaga ggcaacacaa gggtgtcatg gcccaaattc gccgtcccta 2400
atctgcagag tctgactaac ctgctgtcta gtaatctgag ctggctgtcc ctggacgtgt 2460
ccgcagcctt ttaccacctg cctctgcatc cagctgcaat gccccatctg ctggtggggt 2520
caagcggact gagtcgctac gtcgcccgac tgtcctctaa ctcacgcatc attaatcacc 2580
agcatggcac catgcagaac ctgcacgata gctgttcccg gaatctgtac gtgtctctgc 2640
tgctgctgta taagacattc ggcagaaaac tgcacctgta cagccatcct atcattctgg 2700
ggtttaggaa gatcccaatg ggagtgggac tgagcccctt cctgctggca cagtttacct 2760
ccgccatttg ctctgtggtc cgccgagcct tcccacactg tctggctttt tcctatatga 2820
acaatgtggt cctgggcgcc aaatccgtgc agcatctgga gtctctgttc acagctgtca 2880
ctaactttct gctgagcctg gggatccacc tgaacccaaa taagactaaa cgctgggggt 2940
acagcctgaa tttcatggga tatgtgattg gatcctgggg gaccctgcca caggagcaca 3000
tcgtgcagaa gatcaaggaa tgctttcgga agctgcccgt caacagacct atcgactgga 3060
aagtgtgcca gcggattgtc ggactgctgg gcttcgccgc tccctttacc cagtgcgggt 3120
acccagcact gatgcccctg tatgcctgta tccagtctaa gcaggctttc acctttagtc 3180
ctacatacaa ggcattcctg tgcaaacagt acctgaacct gtatccagtg gcaaggcagc 3240
gacctggact gtgccaggtc tttgcaaatg ccactcctac cggctggggg ctggctatcg 3300
gacatcagcg aatgcggggc acattcgtgg cccccctgcc tattcacact gctcagctgc 3360
tggcagcctg ctttgctaga tctaggagtg gagcaaagct gatcggcacc gacaatagtg 3420
tggtcctgtc aagaaaatac acatccttcc catggctgct gggatgtgct gcaaactgga 3480
ttctgagggg caccagcttc gtgtacgtcc cctcagccct gaatcctgct gacgatccat 3540
cccgcgggcg actgggactg taccgacctc tgctgagact gcccttcagg cctacaactg 3600
gccggacatc tctgtatgcc gattcaccaa gcgtgccctc acacctgcct gacagagtcc 3660
actttgcttc acccctgcac gtcgcttggc ggcctcca 3698
<210> 18
<211> 3698
<212> DNA
<213> Artificial Sequence
<220>
<223> Pol coding sequence-IRES (EMCV)-Core coding sequence
<400> 18
atggctcgac ctctgtgtac cctgctactc ctgatggcta ccctggctgg agctctggcc 60
agcatgcccc tgtcttacca gcactttaga aagcttctgc tgctggacga tgaagccggg 120
cctctggagg aagagctgcc aaggctggca gacgaggggc tgaaccggag agtggccgaa 180
gatctgaatc tgggaaacct gaacgtgagc atcccttgga ctcataaagt cggcaacttc 240
accgggctgt acagctccac agtgcctgtc ttcaatccag agtggcagac accatccttt 300
cccaacattc acctgcagga ggacatcatt aatagatgcg aacagttcgt gggacctctg 360
acagtcaacg aaaagaggcg cctgaaactg atcatgcctg ccaggtttta cccaaatgtg 420
actaagtatc tgccactgga taagggcatc aagccttact atccagagca cctggtgaac 480
cattacttcc agactagaca ctatctgcat accctgtgga aggccggaat cctgtacaaa 540
cgagaaacta cccggagtgc ttcattttgt ggctccccat attcttggga acaggagctg 600
cagcatggca ggctggtgtt ccagaccagc aaacgccacg gggatgagtc cttttgcagc 660
cagtctagtg gcatcctgag cagatccccc gtggggcctt gtattcagtc tcagctgcgg 720
aagagtagac tgggactgca gccacagcag ggacacctgg cacgacggca gcagggaagg 780
tctggcagta tccgggctag agtgcatccc acaactagaa ggaccttcgg cgtcgagcca 840
tcaggaagcg gccacatcga caacagcgca tcaagctcct ctagttgcct gcatcagtca 900
gccgtgagaa aggccgctta cagccacctg tccacatcta aaaggcactc aagctccggg 960
catgctgtgg agctgcacaa catccctcca aattctgcac gcagtcagtc agaaggaccc 1020
gtgttcagct gctggtggct gcagtttcgg aactcaaagc cttgcagcga ctattgtctg 1080
agccatattg tgaatctgct ggaggattgg ggcccttgta ccgagcacgg ggaacaccat 1140
atcaggattc cacgaacacc agcacgagtg actggagggg tgttcctggt ggacaagaac 1200
ccccacaata ctaccgagag ccggctggtg gtcgatttca gtcagttttc aagaggcaac 1260
acaagggtgt catggcccaa attcgccgtc cctaatctgc agagtctgac taacctgctg 1320
tctagtaatc tgagctggct gtccctggac gtgtccgcag ccttttacca cctgcctctg 1380
catccagctg caatgcccca tctgctggtg gggtcaagcg gactgagtcg ctacgtcgcc 1440
cgactgtcct ctaactcacg catcattaat caccagcatg gcaccatgca gaacctgcac 1500
gatagctgtt cccggaatct gtacgtgtct ctgctgctgc tgtataagac attcggcaga 1560
aaactgcacc tgtacagcca tcctatcatt ctggggttta ggaagatccc aatgggagtg 1620
ggactgagcc ccttcctgct ggcacagttt acctccgcca tttgctctgt ggtccgccga 1680
gccttcccac actgtctggc tttttcctat atgaacaatg tggtcctggg cgccaaatcc 1740
gtgcagcatc tggagtctct gttcacagct gtcactaact ttctgctgag cctggggatc 1800
cacctgaacc caaataagac taaacgctgg gggtacagcc tgaatttcat gggatatgtg 1860
attggatcct gggggaccct gccacaggag cacatcgtgc agaagatcaa ggaatgcttt 1920
cggaagctgc ccgtcaacag acctatcgac tggaaagtgt gccagcggat tgtcggactg 1980
ctgggcttcg ccgctccctt tacccagtgc gggtacccag cactgatgcc cctgtatgcc 2040
tgtatccagt ctaagcaggc tttcaccttt agtcctacat acaaggcatt cctgtgcaaa 2100
cagtacctga acctgtatcc agtggcaagg cagcgacctg gactgtgcca ggtctttgca 2160
aatgccactc ctaccggctg ggggctggct atcggacatc agcgaatgcg gggcacattc 2220
gtggcccccc tgcctattca cactgctcag ctgctggcag cctgctttgc tagatctagg 2280
agtggagcaa agctgatcgg caccgacaat agtgtggtcc tgtcaagaaa atacacatcc 2340
ttcccatggc tgctgggatg tgctgcaaac tggattctga ggggcaccag cttcgtgtac 2400
gtcccctcag ccctgaatcc tgctgacgat ccatcccgcg ggcgactggg actgtaccga 2460
cctctgctga gactgccctt caggcctaca actggccgga catctctgta tgccgattca 2520
ccaagcgtgc cctcacacct gcctgacaga gtccactttg cttcacccct gcacgtcgct 2580
tggcggcctc cataagcccc tctccctccc ccccccctaa cgttactggc cgaagccgct 2640
tggaataagg ccggtgtgcg tttgtctata tgttattttc caccatattg ccgtcttttg 2700
gcaatgtgag ggcccggaaa cctggccctg tcttcttgac gagcattcct aggggtcttt 2760
cccctctcgc caaaggaatg caaggtctgt tgaatgtcgt gaaggaagca gttcctctgg 2820
aagcttcttg aagacaaaca acgtctgtag cgaccctttg caggcagcgg aaccccccac 2880
ctggcgacag gtgcctctgc ggccaaaagc cacgtgtata agatacacct gcaaaggcgg 2940
cacaacccca gtgccacgtt gtgagttgga tagttgtgga aagagtcaaa tggctctcct 3000
caagcgtatt caacaagggg ctgaaggatg cccagaaggt accccattgt atgggatctg 3060
atctggggcc tcggtgcaca tgctttacat gtgtttagtc gaggttaaaa aacgtctagg 3120
ccccccgaac cacggggacg tggttttcct ttgaaaaaca cgatgataat atggccacaa 3180
ccatggctcg acctctgtgt accctgctac tcctgatggc taccctggct ggagctctgg 3240
ccagcgacat cgacccttac aaggagttcg gcgccagcgt ggaactgctg tcttttctgc 3300
ccagtgattt ctttccttcc attcgagacc tgctggatac cgcctctgct ctgtatcggg 3360
aagccctgga gagcccagaa cactgctccc cacaccatac cgctctgcga caggcaatcc 3420
tgtgctgggg ggagctgatg aacctggcca catgggtggg atcgaatctg gaggaccccg 3480
cttcacggga actggtggtc agctacgtga acgtcaatat gggcctgaaa atccgccagc 3540
tgctgtggtt ccatattagc tgcctgactt ttggacgaga gaccgtgctg gaatacctgg 3600
tgtccttcgg cgtctggatt cgcactcccc ctgcttatcg accacccaac gcaccaattc 3660
tgtccaccct gcccgagacc acagtggtcc gtcgccgt 3698
<210> 19
<211> 3858
<212> DNA
<213> Artificial Sequence
<220>
<223> Core coding sequence-IRES (EV71)-Pol coding sequence
<400> 19
atggctcgac ctctgtgtac cctgctactc ctgatggcta ccctggctgg agctctggcc 60
agcgacatcg acccttacaa ggagttcggc gccagcgtgg aactgctgtc ttttctgccc 120
agtgatttct ttccttccat tcgagacctg ctggataccg cctctgctct gtatcgggaa 180
gccctggaga gcccagaaca ctgctcccca caccataccg ctctgcgaca ggcaatcctg 240
tgctgggggg agctgatgaa cctggccaca tgggtgggat cgaatctgga ggaccccgct 300
tcacgggaac tggtggtcag ctacgtgaac gtcaatatgg gcctgaaaat ccgccagctg 360
ctgtggttcc atattagctg cctgactttt ggacgagaga ccgtgctgga atacctggtg 420
tccttcggcg tctggattcg cactccccct gcttatcgac cacccaacgc accaattctg 480
tccaccctgc ccgagaccac agtggtccgt cgccgttaat taaaacagct gtgggttgtt 540
cccacccaca gggcccactg ggcgctagca ctctgatttt acgaaatcct tgtgcgcctg 600
ttttatatcc cttccctaat tcgaaacgta gaagcaatgc gcaccactga tcaatagtag 660
gcgtaacgcg ccagttacgt catgatcaag catatctgtt cccccggact gagtatcaat 720
agactgctta cgcggttgaa ggagaaaacg ttcgttatcc ggctaactac ttcgagaagc 780
ccagtaacac catggaagct gcagggtgtt tcgctcagca cttcccccgt gtagatcagg 840
tcgatgagcc actgcaatcc ccacaggtga ctgtggcagt ggctgcgttg gcggcctgcc 900
tatggggaga cccataggac gctctaatgt ggacatggtg cgaagagcct attgagctag 960
ttagtagtcc tccggcccct gaatgcggct aatcctaact gcggagcaca tgccttcaac 1020
ccagagggta gtgtgtcgta acgggcaact ctgcagcgga accgactact ttgggtgtcc 1080
gtgtttcttt tttattctta tattggctgc ttatggtgac aattacagaa ttgttaccat 1140
atagctattg gattggccat ccggtgtgta atagagctgt tatataccta tttgttggct 1200
ttgtaccact aactttaaaa tctataacta ccctcaactt tatattaacc ctcaatacag 1260
ttgaccatgg ctcgacctct gtgtaccctg ctactcctga tggctaccct ggctggagct 1320
ctggccagca tgcccctgtc ttaccagcac tttagaaagc ttctgctgct ggacgatgaa 1380
gccgggcctc tggaggaaga gctgccaagg ctggcagacg aggggctgaa ccggagagtg 1440
gccgaagatc tgaatctggg aaacctgaac gtgagcatcc cttggactca taaagtcggc 1500
aacttcaccg ggctgtacag ctccacagtg cctgtcttca atccagagtg gcagacacca 1560
tcctttccca acattcacct gcaggaggac atcattaata gatgcgaaca gttcgtggga 1620
cctctgacag tcaacgaaaa gaggcgcctg aaactgatca tgcctgccag gttttaccca 1680
aatgtgacta agtatctgcc actggataag ggcatcaagc cttactatcc agagcacctg 1740
gtgaaccatt acttccagac tagacactat ctgcataccc tgtggaaggc cggaatcctg 1800
tacaaacgag aaactacccg gagtgcttca ttttgtggct ccccatattc ttgggaacag 1860
gagctgcagc atggcaggct ggtgttccag accagcaaac gccacgggga tgagtccttt 1920
tgcagccagt ctagtggcat cctgagcaga tcccccgtgg ggccttgtat tcagtctcag 1980
ctgcggaaga gtagactggg actgcagcca cagcagggac acctggcacg acggcagcag 2040
ggaaggtctg gcagtatccg ggctagagtg catcccacaa ctagaaggac cttcggcgtc 2100
gagccatcag gaagcggcca catcgacaac agcgcatcaa gctcctctag ttgcctgcat 2160
cagtcagccg tgagaaaggc cgcttacagc cacctgtcca catctaaaag gcactcaagc 2220
tccgggcatg ctgtggagct gcacaacatc cctccaaatt ctgcacgcag tcagtcagaa 2280
ggacccgtgt tcagctgctg gtggctgcag tttcggaact caaagccttg cagcgactat 2340
tgtctgagcc atattgtgaa tctgctggag gattggggcc cttgtaccga gcacggggaa 2400
caccatatca ggattccacg aacaccagca cgagtgactg gaggggtgtt cctggtggac 2460
aagaaccccc acaatactac cgagagccgg ctggtggtcg atttcagtca gttttcaaga 2520
ggcaacacaa gggtgtcatg gcccaaattc gccgtcccta atctgcagag tctgactaac 2580
ctgctgtcta gtaatctgag ctggctgtcc ctggacgtgt ccgcagcctt ttaccacctg 2640
cctctgcatc cagctgcaat gccccatctg ctggtggggt caagcggact gagtcgctac 2700
gtcgcccgac tgtcctctaa ctcacgcatc attaatcacc agcatggcac catgcagaac 2760
ctgcacgata gctgttcccg gaatctgtac gtgtctctgc tgctgctgta taagacattc 2820
ggcagaaaac tgcacctgta cagccatcct atcattctgg ggtttaggaa gatcccaatg 2880
ggagtgggac tgagcccctt cctgctggca cagtttacct ccgccatttg ctctgtggtc 2940
cgccgagcct tcccacactg tctggctttt tcctatatga acaatgtggt cctgggcgcc 3000
aaatccgtgc agcatctgga gtctctgttc acagctgtca ctaactttct gctgagcctg 3060
gggatccacc tgaacccaaa taagactaaa cgctgggggt acagcctgaa tttcatggga 3120
tatgtgattg gatcctgggg gaccctgcca caggagcaca tcgtgcagaa gatcaaggaa 3180
tgctttcgga agctgcccgt caacagacct atcgactgga aagtgtgcca gcggattgtc 3240
ggactgctgg gcttcgccgc tccctttacc cagtgcgggt acccagcact gatgcccctg 3300
tatgcctgta tccagtctaa gcaggctttc acctttagtc ctacatacaa ggcattcctg 3360
tgcaaacagt acctgaacct gtatccagtg gcaaggcagc gacctggact gtgccaggtc 3420
tttgcaaatg ccactcctac cggctggggg ctggctatcg gacatcagcg aatgcggggc 3480
acattcgtgg cccccctgcc tattcacact gctcagctgc tggcagcctg ctttgctaga 3540
tctaggagtg gagcaaagct gatcggcacc gacaatagtg tggtcctgtc aagaaaatac 3600
acatccttcc catggctgct gggatgtgct gcaaactgga ttctgagggg caccagcttc 3660
gtgtacgtcc cctcagccct gaatcctgct gacgatccat cccgcgggcg actgggactg 3720
taccgacctc tgctgagact gcccttcagg cctacaactg gccggacatc tctgtatgcc 3780
gattcaccaa gcgtgccctc acacctgcct gacagagtcc actttgcttc acccctgcac 3840
gtcgcttggc ggcctcca 3858
<210> 20
<211> 3858
<212> DNA
<213> Artificial Sequence
<220>
<223> Pol coding sequence -IRES (EV71)-Core coding sequence
<400> 20
atggctcgac ctctgtgtac cctgctactc ctgatggcta ccctggctgg agctctggcc 60
agcatgcccc tgtcttacca gcactttaga aagcttctgc tgctggacga tgaagccggg 120
cctctggagg aagagctgcc aaggctggca gacgaggggc tgaaccggag agtggccgaa 180
gatctgaatc tgggaaacct gaacgtgagc atcccttgga ctcataaagt cggcaacttc 240
accgggctgt acagctccac agtgcctgtc ttcaatccag agtggcagac accatccttt 300
cccaacattc acctgcagga ggacatcatt aatagatgcg aacagttcgt gggacctctg 360
acagtcaacg aaaagaggcg cctgaaactg atcatgcctg ccaggtttta cccaaatgtg 420
actaagtatc tgccactgga taagggcatc aagccttact atccagagca cctggtgaac 480
cattacttcc agactagaca ctatctgcat accctgtgga aggccggaat cctgtacaaa 540
cgagaaacta cccggagtgc ttcattttgt ggctccccat attcttggga acaggagctg 600
cagcatggca ggctggtgtt ccagaccagc aaacgccacg gggatgagtc cttttgcagc 660
cagtctagtg gcatcctgag cagatccccc gtggggcctt gtattcagtc tcagctgcgg 720
aagagtagac tgggactgca gccacagcag ggacacctgg cacgacggca gcagggaagg 780
tctggcagta tccgggctag agtgcatccc acaactagaa ggaccttcgg cgtcgagcca 840
tcaggaagcg gccacatcga caacagcgca tcaagctcct ctagttgcct gcatcagtca 900
gccgtgagaa aggccgctta cagccacctg tccacatcta aaaggcactc aagctccggg 960
catgctgtgg agctgcacaa catccctcca aattctgcac gcagtcagtc agaaggaccc 1020
gtgttcagct gctggtggct gcagtttcgg aactcaaagc cttgcagcga ctattgtctg 1080
agccatattg tgaatctgct ggaggattgg ggcccttgta ccgagcacgg ggaacaccat 1140
atcaggattc cacgaacacc agcacgagtg actggagggg tgttcctggt ggacaagaac 1200
ccccacaata ctaccgagag ccggctggtg gtcgatttca gtcagttttc aagaggcaac 1260
acaagggtgt catggcccaa attcgccgtc cctaatctgc agagtctgac taacctgctg 1320
tctagtaatc tgagctggct gtccctggac gtgtccgcag ccttttacca cctgcctctg 1380
catccagctg caatgcccca tctgctggtg gggtcaagcg gactgagtcg ctacgtcgcc 1440
cgactgtcct ctaactcacg catcattaat caccagcatg gcaccatgca gaacctgcac 1500
gatagctgtt cccggaatct gtacgtgtct ctgctgctgc tgtataagac attcggcaga 1560
aaactgcacc tgtacagcca tcctatcatt ctggggttta ggaagatccc aatgggagtg 1620
ggactgagcc ccttcctgct ggcacagttt acctccgcca tttgctctgt ggtccgccga 1680
gccttcccac actgtctggc tttttcctat atgaacaatg tggtcctggg cgccaaatcc 1740
gtgcagcatc tggagtctct gttcacagct gtcactaact ttctgctgag cctggggatc 1800
cacctgaacc caaataagac taaacgctgg gggtacagcc tgaatttcat gggatatgtg 1860
attggatcct gggggaccct gccacaggag cacatcgtgc agaagatcaa ggaatgcttt 1920
cggaagctgc ccgtcaacag acctatcgac tggaaagtgt gccagcggat tgtcggactg 1980
ctgggcttcg ccgctccctt tacccagtgc gggtacccag cactgatgcc cctgtatgcc 2040
tgtatccagt ctaagcaggc tttcaccttt agtcctacat acaaggcatt cctgtgcaaa 2100
cagtacctga acctgtatcc agtggcaagg cagcgacctg gactgtgcca ggtctttgca 2160
aatgccactc ctaccggctg ggggctggct atcggacatc agcgaatgcg gggcacattc 2220
gtggcccccc tgcctattca cactgctcag ctgctggcag cctgctttgc tagatctagg 2280
agtggagcaa agctgatcgg caccgacaat agtgtggtcc tgtcaagaaa atacacatcc 2340
ttcccatggc tgctgggatg tgctgcaaac tggattctga ggggcaccag cttcgtgtac 2400
gtcccctcag ccctgaatcc tgctgacgat ccatcccgcg ggcgactggg actgtaccga 2460
cctctgctga gactgccctt caggcctaca actggccgga catctctgta tgccgattca 2520
ccaagcgtgc cctcacacct gcctgacaga gtccactttg cttcacccct gcacgtcgct 2580
tggcggcctc cataattaaa acagctgtgg gttgttccca cccacagggc ccactgggcg 2640
ctagcactct gattttacga aatccttgtg cgcctgtttt atatcccttc cctaattcga 2700
aacgtagaag caatgcgcac cactgatcaa tagtaggcgt aacgcgccag ttacgtcatg 2760
atcaagcata tctgttcccc cggactgagt atcaatagac tgcttacgcg gttgaaggag 2820
aaaacgttcg ttatccggct aactacttcg agaagcccag taacaccatg gaagctgcag 2880
ggtgtttcgc tcagcacttc ccccgtgtag atcaggtcga tgagccactg caatccccac 2940
aggtgactgt ggcagtggct gcgttggcgg cctgcctatg gggagaccca taggacgctc 3000
taatgtggac atggtgcgaa gagcctattg agctagttag tagtcctccg gcccctgaat 3060
gcggctaatc ctaactgcgg agcacatgcc ttcaacccag agggtagtgt gtcgtaacgg 3120
gcaactctgc agcggaaccg actactttgg gtgtccgtgt ttctttttta ttcttatatt 3180
ggctgcttat ggtgacaatt acagaattgt taccatatag ctattggatt ggccatccgg 3240
tgtgtaatag agctgttata tacctatttg ttggctttgt accactaact ttaaaatcta 3300
taactaccct caactttata ttaaccctca atacagttga ccatggctcg acctctgtgt 3360
accctgctac tcctgatggc taccctggct ggagctctgg ccagcgacat cgacccttac 3420
aaggagttcg gcgccagcgt ggaactgctg tcttttctgc ccagtgattt ctttccttcc 3480
attcgagacc tgctggatac cgcctctgct ctgtatcggg aagccctgga gagcccagaa 3540
cactgctccc cacaccatac cgctctgcga caggcaatcc tgtgctgggg ggagctgatg 3600
aacctggcca catgggtggg atcgaatctg gaggaccccg cttcacggga actggtggtc 3660
agctacgtga acgtcaatat gggcctgaaa atccgccagc tgctgtggtt ccatattagc 3720
tgcctgactt ttggacgaga gaccgtgctg gaatacctgg tgtccttcgg cgtctggatt 3780
cgcactcccc ctgcttatcg accacccaac gcaccaattc tgtccaccct gcccgagacc 3840
acagtggtcc gtcgccgt 3858
<210> 21
<211> 1326
<212> DNA
<213> Artificial Sequence
<220>
<223> PreS2.S-2A-preS1 coding sequence
<400> 21
atgcagtgga actcaactac tttccatcag acccttcagg accctagagt gcgcgggctg 60
tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac gaccgcctct 120
cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga gaatatcacc 180
tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct gactcgaatc 240
ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct gggaggaact 300
cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc gacaagttgt 360
cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat cttcctcttc 420
atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg catgctgcct 480
gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa gacctgtaca 540
attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc aagcgacggt 600
aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct ctgggaatgg 660
gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg gtttgtggga 720
ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg cccttccctt 780
tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct gtgggtctat 840
attggaagcg gagctactaa cttcagcctg ctgaagcagg ctggagacgt ggaggagaac 900
cctggaccta tggctaggcc cctgtgtaca cttttgctcc tgatggccac cctcgctgga 960
gctctggcaa gcggtggatg gagctcaaag ccgcggaaag ggatgggtac taacctgtcc 1020
gtaccaaatc ccctgggatt ttttccagac caccaactcg atcctgcttt tggcgcaaat 1080
tccaacaatc ccgactggga ctttaaccct aacaaggacc actggcctga tgccaacaag 1140
gtgggggcag gagcctttgg tcccggcttc accccacccc atggaggtct tttgggatgg 1200
tcaccacagg cccagggcat cctgaccact gtccctgctg ctccaccgcc agcttctact 1260
aatcgacaga gcgggaggca gccgaccccc ctgagtcccc ccctgcggga tacccaccct 1320
caggca 1326
<210> 22
<211> 1326
<212> DNA
<213> Artificial Sequence
<220>
<223> preS1-2A-PreS2.S coding sequence
<400> 22
atggctaggc ccctgtgtac acttttgctc ctgatggcca ccctcgctgg agctctggca 60
agcggtggat ggagctcaaa gccgcggaaa gggatgggta ctaacctgtc cgtaccaaat 120
cccctgggat tttttccaga ccaccaactc gatcctgctt ttggcgcaaa ttccaacaat 180
cccgactggg actttaaccc taacaaggac cactggcctg atgccaacaa ggtgggggca 240
ggagcctttg gtcccggctt caccccaccc catggaggtc ttttgggatg gtcaccacag 300
gcccagggca tcctgaccac tgtccctgct gctccaccgc cagcttctac taatcgacag 360
agcgggaggc agccgacccc cctgagtccc cccctgcggg atacccaccc tcaggcagga 420
agcggagcta ctaacttcag cctgctgaag caggctggag acgtggagga gaaccctgga 480
cctatgcagt ggaactcaac tactttccat cagacccttc aggaccctag agtgcgcggg 540
ctgtactttc ctgctggggg aagcagtagc gggaccgtta atccagtacc tacgaccgcc 600
tctcccatat cttctatctt tagtaggact ggtgaccctg ctcccaacat ggagaatatc 660
acctccgggt ttctgggccc actcctggtc cttcaggccg gattcttcct gctgactcga 720
atcctcacca taccccagag cctggacagc tggtggacaa gcctgaattt tctgggagga 780
actcctgtat gcctgggaca aaattcacag tcccctacaa gtaaccattc accgacaagt 840
tgtcctccca tctgtcccgg atacaggtgg atgtgcctgc gaaggttcat catcttcctc 900
ttcatcctct tgctttgcct tattttcctc ctggttcttc tggactatca gggcatgctg 960
cctgtgtgcc cactgatacc aggatctagt actaccagca caggcccgtg taagacctgt 1020
acaattccag cacaagggac tagtatgttc ccctcctgct gttgtactaa gccaagcgac 1080
ggtaattgca cgtgtatccc aatcccgtcc tcctgggcgt ttgccaagta cctctgggaa 1140
tgggcctcag tcagattttc atggcttagt cttttggtgc cgttcgtgca gtggtttgtg 1200
ggactctctc cgactgtgtg gctcagcgtg atctggatga tgtggtactg gggcccttcc 1260
ctttacaaca tactgtctcc attccttccc ctgctgccaa tcttcttttg cctgtgggtc 1320
tatatt 1326
<210> 23
<211> 1850
<212> DNA
<213> Artificial Sequence
<220>
<223> PreS2.S coding sequence -IRES (EMCV)-preS1 coding sequence
<400> 23
atgcagtgga actcaactac tttccatcag acccttcagg accctagagt gcgcgggctg 60
tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac gaccgcctct 120
cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga gaatatcacc 180
tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct gactcgaatc 240
ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct gggaggaact 300
cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc gacaagttgt 360
cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat cttcctcttc 420
atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg catgctgcct 480
gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa gacctgtaca 540
attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc aagcgacggt 600
aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct ctgggaatgg 660
gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg gtttgtggga 720
ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg cccttccctt 780
tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct gtgggtctat 840
atttaagccc ctctccctcc ccccccccta acgttactgg ccgaagccgc ttggaataag 900
gccggtgtgc gtttgtctat atgttatttt ccaccatatt gccgtctttt ggcaatgtga 960
gggcccggaa acctggccct gtcttcttga cgagcattcc taggggtctt tcccctctcg 1020
ccaaaggaat gcaaggtctg ttgaatgtcg tgaaggaagc agttcctctg gaagcttctt 1080
gaagacaaac aacgtctgta gcgacccttt gcaggcagcg gaacccccca cctggcgaca 1140
ggtgcctctg cggccaaaag ccacgtgtat aagatacacc tgcaaaggcg gcacaacccc 1200
agtgccacgt tgtgagttgg atagttgtgg aaagagtcaa atggctctcc tcaagcgtat 1260
tcaacaaggg gctgaaggat gcccagaagg taccccattg tatgggatct gatctggggc 1320
ctcggtgcac atgctttaca tgtgtttagt cgaggttaaa aaacgtctag gccccccgaa 1380
ccacggggac gtggttttcc tttgaaaaac acgatgataa tatggccaca accatggcta 1440
ggcccctgtg tacacttttg ctcctgatgg ccaccctcgc tggagctctg gcaagcggtg 1500
gatggagctc aaagccgcgg aaagggatgg gtactaacct gtccgtacca aatcccctgg 1560
gattttttcc agaccaccaa ctcgatcctg cttttggcgc aaattccaac aatcccgact 1620
gggactttaa ccctaacaag gaccactggc ctgatgccaa caaggtgggg gcaggagcct 1680
ttggtcccgg cttcacccca ccccatggag gtcttttggg atggtcacca caggcccagg 1740
gcatcctgac cactgtccct gctgctccac cgccagcttc tactaatcga cagagcggga 1800
ggcagccgac ccccctgagt ccccccctgc gggataccca ccctcaggca 1850
<210> 24
<211> 1850
<212> DNA
<213> Artificial Sequence
<220>
<223> preS1 coding sequence -IRES (EMCV)-PreS2.S coding sequence
<400> 24
atggctaggc ccctgtgtac acttttgctc ctgatggcca ccctcgctgg agctctggca 60
agcggtggat ggagctcaaa gccgcggaaa gggatgggta ctaacctgtc cgtaccaaat 120
cccctgggat tttttccaga ccaccaactc gatcctgctt ttggcgcaaa ttccaacaat 180
cccgactggg actttaaccc taacaaggac cactggcctg atgccaacaa ggtgggggca 240
ggagcctttg gtcccggctt caccccaccc catggaggtc ttttgggatg gtcaccacag 300
gcccagggca tcctgaccac tgtccctgct gctccaccgc cagcttctac taatcgacag 360
agcgggaggc agccgacccc cctgagtccc cccctgcggg atacccaccc tcaggcataa 420
gcccctctcc ctcccccccc cctaacgtta ctggccgaag ccgcttggaa taaggccggt 480
gtgcgtttgt ctatatgtta ttttccacca tattgccgtc ttttggcaat gtgagggccc 540
ggaaacctgg ccctgtcttc ttgacgagca ttcctagggg tctttcccct ctcgccaaag 600
gaatgcaagg tctgttgaat gtcgtgaagg aagcagttcc tctggaagct tcttgaagac 660
aaacaacgtc tgtagcgacc ctttgcaggc agcggaaccc cccacctggc gacaggtgcc 720
tctgcggcca aaagccacgt gtataagata cacctgcaaa ggcggcacaa ccccagtgcc 780
acgttgtgag ttggatagtt gtggaaagag tcaaatggct ctcctcaagc gtattcaaca 840
aggggctgaa ggatgcccag aaggtacccc attgtatggg atctgatctg gggcctcggt 900
gcacatgctt tacatgtgtt tagtcgaggt taaaaaacgt ctaggccccc cgaaccacgg 960
ggacgtggtt ttcctttgaa aaacacgatg ataatatggc cacaaccatg cagtggaact 1020
caactacttt ccatcagacc cttcaggacc ctagagtgcg cgggctgtac tttcctgctg 1080
ggggaagcag tagcgggacc gttaatccag tacctacgac cgcctctccc atatcttcta 1140
tctttagtag gactggtgac cctgctccca acatggagaa tatcacctcc gggtttctgg 1200
gcccactcct ggtccttcag gccggattct tcctgctgac tcgaatcctc accatacccc 1260
agagcctgga cagctggtgg acaagcctga attttctggg aggaactcct gtatgcctgg 1320
gacaaaattc acagtcccct acaagtaacc attcaccgac aagttgtcct cccatctgtc 1380
ccggatacag gtggatgtgc ctgcgaaggt tcatcatctt cctcttcatc ctcttgcttt 1440
gccttatttt cctcctggtt cttctggact atcagggcat gctgcctgtg tgcccactga 1500
taccaggatc tagtactacc agcacaggcc cgtgtaagac ctgtacaatt ccagcacaag 1560
ggactagtat gttcccctcc tgctgttgta ctaagccaag cgacggtaat tgcacgtgta 1620
tcccaatccc gtcctcctgg gcgtttgcca agtacctctg ggaatgggcc tcagtcagat 1680
tttcatggct tagtcttttg gtgccgttcg tgcagtggtt tgtgggactc tctccgactg 1740
tgtggctcag cgtgatctgg atgatgtggt actggggccc ttccctttac aacatactgt 1800
ctccattcct tcccctgctg ccaatcttct tttgcctgtg ggtctatatt 1850
<210> 25
<211> 2010
<212> DNA
<213> Artificial Sequence
<220>
<223> PreS2.S coding sequence -IRES (EV71)-preS1 coding sequence
<400> 25
atgcagtgga actcaactac tttccatcag acccttcagg accctagagt gcgcgggctg 60
tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac gaccgcctct 120
cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga gaatatcacc 180
tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct gactcgaatc 240
ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct gggaggaact 300
cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc gacaagttgt 360
cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat cttcctcttc 420
atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg catgctgcct 480
gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa gacctgtaca 540
attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc aagcgacggt 600
aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct ctgggaatgg 660
gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg gtttgtggga 720
ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg cccttccctt 780
tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct gtgggtctat 840
atttaattaa aacagctgtg ggttgttccc acccacaggg cccactgggc gctagcactc 900
tgattttacg aaatccttgt gcgcctgttt tatatccctt ccctaattcg aaacgtagaa 960
gcaatgcgca ccactgatca atagtaggcg taacgcgcca gttacgtcat gatcaagcat 1020
atctgttccc ccggactgag tatcaataga ctgcttacgc ggttgaagga gaaaacgttc 1080
gttatccggc taactacttc gagaagccca gtaacaccat ggaagctgca gggtgtttcg 1140
ctcagcactt cccccgtgta gatcaggtcg atgagccact gcaatcccca caggtgactg 1200
tggcagtggc tgcgttggcg gcctgcctat ggggagaccc ataggacgct ctaatgtgga 1260
catggtgcga agagcctatt gagctagtta gtagtcctcc ggcccctgaa tgcggctaat 1320
cctaactgcg gagcacatgc cttcaaccca gagggtagtg tgtcgtaacg ggcaactctg 1380
cagcggaacc gactactttg ggtgtccgtg tttctttttt attcttatat tggctgctta 1440
tggtgacaat tacagaattg ttaccatata gctattggat tggccatccg gtgtgtaata 1500
gagctgttat atacctattt gttggctttg taccactaac tttaaaatct ataactaccc 1560
tcaactttat attaaccctc aatacagttg accatggcta ggcccctgtg tacacttttg 1620
ctcctgatgg ccaccctcgc tggagctctg gcaagcggtg gatggagctc aaagccgcgg 1680
aaagggatgg gtactaacct gtccgtacca aatcccctgg gattttttcc agaccaccaa 1740
ctcgatcctg cttttggcgc aaattccaac aatcccgact gggactttaa ccctaacaag 1800
gaccactggc ctgatgccaa caaggtgggg gcaggagcct ttggtcccgg cttcacccca 1860
ccccatggag gtcttttggg atggtcacca caggcccagg gcatcctgac cactgtccct 1920
gctgctccac cgccagcttc tactaatcga cagagcggga ggcagccgac ccccctgagt 1980
ccccccctgc gggataccca ccctcaggca 2010
<210> 26
<211> 2010
<212> DNA
<213> Artificial Sequence
<220>
<223> preS1 coding sequence -IRES (EV71)-PreS2.S coding sequence
<400> 26
atggctaggc ccctgtgtac acttttgctc ctgatggcca ccctcgctgg agctctggca 60
agcggtggat ggagctcaaa gccgcggaaa gggatgggta ctaacctgtc cgtaccaaat 120
cccctgggat tttttccaga ccaccaactc gatcctgctt ttggcgcaaa ttccaacaat 180
cccgactggg actttaaccc taacaaggac cactggcctg atgccaacaa ggtgggggca 240
ggagcctttg gtcccggctt caccccaccc catggaggtc ttttgggatg gtcaccacag 300
gcccagggca tcctgaccac tgtccctgct gctccaccgc cagcttctac taatcgacag 360
agcgggaggc agccgacccc cctgagtccc cccctgcggg atacccaccc tcaggcataa 420
ttaaaacagc tgtgggttgt tcccacccac agggcccact gggcgctagc actctgattt 480
tacgaaatcc ttgtgcgcct gttttatatc ccttccctaa ttcgaaacgt agaagcaatg 540
cgcaccactg atcaatagta ggcgtaacgc gccagttacg tcatgatcaa gcatatctgt 600
tcccccggac tgagtatcaa tagactgctt acgcggttga aggagaaaac gttcgttatc 660
cggctaacta cttcgagaag cccagtaaca ccatggaagc tgcagggtgt ttcgctcagc 720
acttcccccg tgtagatcag gtcgatgagc cactgcaatc cccacaggtg actgtggcag 780
tggctgcgtt ggcggcctgc ctatggggag acccatagga cgctctaatg tggacatggt 840
gcgaagagcc tattgagcta gttagtagtc ctccggcccc tgaatgcggc taatcctaac 900
tgcggagcac atgccttcaa cccagagggt agtgtgtcgt aacgggcaac tctgcagcgg 960
aaccgactac tttgggtgtc cgtgtttctt ttttattctt atattggctg cttatggtga 1020
caattacaga attgttacca tatagctatt ggattggcca tccggtgtgt aatagagctg 1080
ttatatacct atttgttggc tttgtaccac taactttaaa atctataact accctcaact 1140
ttatattaac cctcaataca gttgaccatg cagtggaact caactacttt ccatcagacc 1200
cttcaggacc ctagagtgcg cgggctgtac tttcctgctg ggggaagcag tagcgggacc 1260
gttaatccag tacctacgac cgcctctccc atatcttcta tctttagtag gactggtgac 1320
cctgctccca acatggagaa tatcacctcc gggtttctgg gcccactcct ggtccttcag 1380
gccggattct tcctgctgac tcgaatcctc accatacccc agagcctgga cagctggtgg 1440
acaagcctga attttctggg aggaactcct gtatgcctgg gacaaaattc acagtcccct 1500
acaagtaacc attcaccgac aagttgtcct cccatctgtc ccggatacag gtggatgtgc 1560
ctgcgaaggt tcatcatctt cctcttcatc ctcttgcttt gccttatttt cctcctggtt 1620
cttctggact atcagggcat gctgcctgtg tgcccactga taccaggatc tagtactacc 1680
agcacaggcc cgtgtaagac ctgtacaatt ccagcacaag ggactagtat gttcccctcc 1740
tgctgttgta ctaagccaag cgacggtaat tgcacgtgta tcccaatccc gtcctcctgg 1800
gcgtttgcca agtacctctg ggaatgggcc tcagtcagat tttcatggct tagtcttttg 1860
gtgccgttcg tgcagtggtt tgtgggactc tctccgactg tgtggctcag cgtgatctgg 1920
atgatgtggt actggggccc ttccctttac aacatactgt ctccattcct tcccctgctg 1980
ccaatcttct tttgcctgtg ggtctatatt 2010
<210> 27
<211> 4566
<212> DNA
<213> Artificial Sequence
<220>
<223> Core-2A-Pol-2A-PreS.S-2A-preS1 coding sequence
<400> 27
atggctcgac ctctgtgtac cctgctactc ctgatggcta ccctggctgg agctctggcc 60
agcgacatcg acccttacaa ggagttcggc gccagcgtgg aactgctgtc ttttctgccc 120
agtgatttct ttccttccat tcgagacctg ctggataccg cctctgctct gtatcgggaa 180
gccctggaga gcccagaaca ctgctcccca caccataccg ctctgcgaca ggcaatcctg 240
tgctgggggg agctgatgaa cctggccaca tgggtgggat cgaatctgga ggaccccgct 300
tcacgggaac tggtggtcag ctacgtgaac gtcaatatgg gcctgaaaat ccgccagctg 360
ctgtggttcc atattagctg cctgactttt ggacgagaga ccgtgctgga atacctggtg 420
tccttcggcg tctggattcg cactccccct gcttatcgac cacccaacgc accaattctg 480
tccaccctgc ccgagaccac agtggtccgt cgccgtggaa gcggagctac taacttcagc 540
ctgctgaagc aggctggaga cgtggaggag aaccctggac ctatggctcg acctctgtgt 600
accctgctac tcctgatggc taccctggct ggagctctgg ccagcatgcc cctgtcttac 660
cagcacttta gaaagcttct gctgctggac gatgaagccg ggcctctgga ggaagagctg 720
ccaaggctgg cagacgaggg gctgaaccgg agagtggccg aagatctgaa tctgggaaac 780
ctgaacgtga gcatcccttg gactcataaa gtcggcaact tcaccgggct gtacagctcc 840
acagtgcctg tcttcaatcc agagtggcag acaccatcct ttcccaacat tcacctgcag 900
gaggacatca ttaatagatg cgaacagttc gtgggacctc tgacagtcaa cgaaaagagg 960
cgcctgaaac tgatcatgcc tgccaggttt tacccaaatg tgactaagta tctgccactg 1020
gataagggca tcaagcctta ctatccagag cacctggtga accattactt ccagactaga 1080
cactatctgc ataccctgtg gaaggccgga atcctgtaca aacgagaaac tacccggagt 1140
gcttcatttt gtggctcccc atattcttgg gaacaggagc tgcagcatgg caggctggtg 1200
ttccagacca gcaaacgcca cggggatgag tccttttgca gccagtctag tggcatcctg 1260
agcagatccc ccgtggggcc ttgtattcag tctcagctgc ggaagagtag actgggactg 1320
cagccacagc agggacacct ggcacgacgg cagcagggaa ggtctggcag tatccgggct 1380
agagtgcatc ccacaactag aaggaccttc ggcgtcgagc catcaggaag cggccacatc 1440
gacaacagcg catcaagctc ctctagttgc ctgcatcagt cagccgtgag aaaggccgct 1500
tacagccacc tgtccacatc taaaaggcac tcaagctccg ggcatgctgt ggagctgcac 1560
aacatccctc caaattctgc acgcagtcag tcagaaggac ccgtgttcag ctgctggtgg 1620
ctgcagtttc ggaactcaaa gccttgcagc gactattgtc tgagccatat tgtgaatctg 1680
ctggaggatt ggggcccttg taccgagcac ggggaacacc atatcaggat tccacgaaca 1740
ccagcacgag tgactggagg ggtgttcctg gtggacaaga acccccacaa tactaccgag 1800
agccggctgg tggtcgattt cagtcagttt tcaagaggca acacaagggt gtcatggccc 1860
aaattcgccg tccctaatct gcagagtctg actaacctgc tgtctagtaa tctgagctgg 1920
ctgtccctgg acgtgtccgc agccttttac cacctgcctc tgcatccagc tgcaatgccc 1980
catctgctgg tggggtcaag cggactgagt cgctacgtcg cccgactgtc ctctaactca 2040
cgcatcatta atcaccagca tggcaccatg cagaacctgc acgatagctg ttcccggaat 2100
ctgtacgtgt ctctgctgct gctgtataag acattcggca gaaaactgca cctgtacagc 2160
catcctatca ttctggggtt taggaagatc ccaatgggag tgggactgag ccccttcctg 2220
ctggcacagt ttacctccgc catttgctct gtggtccgcc gagccttccc acactgtctg 2280
gctttttcct atatgaacaa tgtggtcctg ggcgccaaat ccgtgcagca tctggagtct 2340
ctgttcacag ctgtcactaa ctttctgctg agcctgggga tccacctgaa cccaaataag 2400
actaaacgct gggggtacag cctgaatttc atgggatatg tgattggatc ctgggggacc 2460
ctgccacagg agcacatcgt gcagaagatc aaggaatgct ttcggaagct gcccgtcaac 2520
agacctatcg actggaaagt gtgccagcgg attgtcggac tgctgggctt cgccgctccc 2580
tttacccagt gcgggtaccc agcactgatg cccctgtatg cctgtatcca gtctaagcag 2640
gctttcacct ttagtcctac atacaaggca ttcctgtgca aacagtacct gaacctgtat 2700
ccagtggcaa ggcagcgacc tggactgtgc caggtctttg caaatgccac tcctaccggc 2760
tgggggctgg ctatcggaca tcagcgaatg cggggcacat tcgtggcccc cctgcctatt 2820
cacactgctc agctgctggc agcctgcttt gctagatcta ggagtggagc aaagctgatc 2880
ggcaccgaca atagtgtggt cctgtcaaga aaatacacat ccttcccatg gctgctggga 2940
tgtgctgcaa actggattct gaggggcacc agcttcgtgt acgtcccctc agccctgaat 3000
cctgctgacg atccatcccg cgggcgactg ggactgtacc gacctctgct gagactgccc 3060
ttcaggccta caactggccg gacatctctg tatgccgatt caccaagcgt gccctcacac 3120
ctgcctgaca gagtccactt tgcttcaccc ctgcacgtcg cttggcggcc tccaggatca 3180
ggcgctacga attttagcct tctgaagcaa gcgggagacg ttgaagaaaa cccagggcct 3240
atgcagtgga actcaactac tttccatcag acccttcagg accctagagt gcgcgggctg 3300
tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac gaccgcctct 3360
cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga gaatatcacc 3420
tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct gactcgaatc 3480
ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct gggaggaact 3540
cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc gacaagttgt 3600
cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat cttcctcttc 3660
atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg catgctgcct 3720
gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa gacctgtaca 3780
attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc aagcgacggt 3840
aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct ctgggaatgg 3900
gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg gtttgtggga 3960
ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg cccttccctt 4020
tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct gtgggtctat 4080
attgggtccg gagcgactaa cttttccctg ctgaaacaag cgggtgacgt cgaagagaat 4140
ccgggaccta tggctaggcc cctgtgtaca cttttgctcc tgatggccac cctcgctgga 4200
gctctggcaa gcggtggatg gagctcaaag ccgcggaaag ggatgggtac taacctgtcc 4260
gtaccaaatc ccctgggatt ttttccagac caccaactcg atcctgcttt tggcgcaaat 4320
tccaacaatc ccgactggga ctttaaccct aacaaggacc actggcctga tgccaacaag 4380
gtgggggcag gagcctttgg tcccggcttc accccacccc atggaggtct tttgggatgg 4440
tcaccacagg cccagggcat cctgaccact gtccctgctg ctccaccgcc agcttctact 4500
aatcgacaga gcgggaggca gccgaccccc ctgagtcccc ccctgcggga tacccaccct 4560
caggca 4566
<210> 28
<211> 4566
<212> DNA
<213> Artificial Sequence
<220>
<223> Pol-2A-Core-2A-PreS2.S-2A-preS1 coding sequence
<400> 28
atggctcgac ctctgtgtac cctgctactc ctgatggcta ccctggctgg agctctggcc 60
agcatgcccc tgtcttacca gcactttaga aagcttctgc tgctggacga tgaagccggg 120
cctctggagg aagagctgcc aaggctggca gacgaggggc tgaaccggag agtggccgaa 180
gatctgaatc tgggaaacct gaacgtgagc atcccttgga ctcataaagt cggcaacttc 240
accgggctgt acagctccac agtgcctgtc ttcaatccag agtggcagac accatccttt 300
cccaacattc acctgcagga ggacatcatt aatagatgcg aacagttcgt gggacctctg 360
acagtcaacg aaaagaggcg cctgaaactg atcatgcctg ccaggtttta cccaaatgtg 420
actaagtatc tgccactgga taagggcatc aagccttact atccagagca cctggtgaac 480
cattacttcc agactagaca ctatctgcat accctgtgga aggccggaat cctgtacaaa 540
cgagaaacta cccggagtgc ttcattttgt ggctccccat attcttggga acaggagctg 600
cagcatggca ggctggtgtt ccagaccagc aaacgccacg gggatgagtc cttttgcagc 660
cagtctagtg gcatcctgag cagatccccc gtggggcctt gtattcagtc tcagctgcgg 720
aagagtagac tgggactgca gccacagcag ggacacctgg cacgacggca gcagggaagg 780
tctggcagta tccgggctag agtgcatccc acaactagaa ggaccttcgg cgtcgagcca 840
tcaggaagcg gccacatcga caacagcgca tcaagctcct ctagttgcct gcatcagtca 900
gccgtgagaa aggccgctta cagccacctg tccacatcta aaaggcactc aagctccggg 960
catgctgtgg agctgcacaa catccctcca aattctgcac gcagtcagtc agaaggaccc 1020
gtgttcagct gctggtggct gcagtttcgg aactcaaagc cttgcagcga ctattgtctg 1080
agccatattg tgaatctgct ggaggattgg ggcccttgta ccgagcacgg ggaacaccat 1140
atcaggattc cacgaacacc agcacgagtg actggagggg tgttcctggt ggacaagaac 1200
ccccacaata ctaccgagag ccggctggtg gtcgatttca gtcagttttc aagaggcaac 1260
acaagggtgt catggcccaa attcgccgtc cctaatctgc agagtctgac taacctgctg 1320
tctagtaatc tgagctggct gtccctggac gtgtccgcag ccttttacca cctgcctctg 1380
catccagctg caatgcccca tctgctggtg gggtcaagcg gactgagtcg ctacgtcgcc 1440
cgactgtcct ctaactcacg catcattaat caccagcatg gcaccatgca gaacctgcac 1500
gatagctgtt cccggaatct gtacgtgtct ctgctgctgc tgtataagac attcggcaga 1560
aaactgcacc tgtacagcca tcctatcatt ctggggttta ggaagatccc aatgggagtg 1620
ggactgagcc ccttcctgct ggcacagttt acctccgcca tttgctctgt ggtccgccga 1680
gccttcccac actgtctggc tttttcctat atgaacaatg tggtcctggg cgccaaatcc 1740
gtgcagcatc tggagtctct gttcacagct gtcactaact ttctgctgag cctggggatc 1800
cacctgaacc caaataagac taaacgctgg gggtacagcc tgaatttcat gggatatgtg 1860
attggatcct gggggaccct gccacaggag cacatcgtgc agaagatcaa ggaatgcttt 1920
cggaagctgc ccgtcaacag acctatcgac tggaaagtgt gccagcggat tgtcggactg 1980
ctgggcttcg ccgctccctt tacccagtgc gggtacccag cactgatgcc cctgtatgcc 2040
tgtatccagt ctaagcaggc tttcaccttt agtcctacat acaaggcatt cctgtgcaaa 2100
cagtacctga acctgtatcc agtggcaagg cagcgacctg gactgtgcca ggtctttgca 2160
aatgccactc ctaccggctg ggggctggct atcggacatc agcgaatgcg gggcacattc 2220
gtggcccccc tgcctattca cactgctcag ctgctggcag cctgctttgc tagatctagg 2280
agtggagcaa agctgatcgg caccgacaat agtgtggtcc tgtcaagaaa atacacatcc 2340
ttcccatggc tgctgggatg tgctgcaaac tggattctga ggggcaccag cttcgtgtac 2400
gtcccctcag ccctgaatcc tgctgacgat ccatcccgcg ggcgactggg actgtaccga 2460
cctctgctga gactgccctt caggcctaca actggccgga catctctgta tgccgattca 2520
ccaagcgtgc cctcacacct gcctgacaga gtccactttg cttcacccct gcacgtcgct 2580
tggcggcctc caggaagcgg agctactaac ttcagcctgc tgaagcaggc tggagacgtg 2640
gaggagaacc ctggacctat ggctcgacct ctgtgtaccc tgctactcct gatggctacc 2700
ctggctggag ctctggccag cgacatcgac ccttacaagg agttcggcgc cagcgtggaa 2760
ctgctgtctt ttctgcccag tgatttcttt ccttccattc gagacctgct ggataccgcc 2820
tctgctctgt atcgggaagc cctggagagc ccagaacact gctccccaca ccataccgct 2880
ctgcgacagg caatcctgtg ctggggggag ctgatgaacc tggccacatg ggtgggatcg 2940
aatctggagg accccgcttc acgggaactg gtggtcagct acgtgaacgt caatatgggc 3000
ctgaaaatcc gccagctgct gtggttccat attagctgcc tgacttttgg acgagagacc 3060
gtgctggaat acctggtgtc cttcggcgtc tggattcgca ctccccctgc ttatcgacca 3120
cccaacgcac caattctgtc caccctgccc gagaccacag tggtccgtcg ccgtggatca 3180
ggcgctacga attttagcct tctgaagcaa gcgggagacg ttgaagaaaa cccagggcct 3240
atgcagtgga actcaactac tttccatcag acccttcagg accctagagt gcgcgggctg 3300
tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac gaccgcctct 3360
cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga gaatatcacc 3420
tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct gactcgaatc 3480
ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct gggaggaact 3540
cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc gacaagttgt 3600
cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat cttcctcttc 3660
atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg catgctgcct 3720
gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa gacctgtaca 3780
attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc aagcgacggt 3840
aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct ctgggaatgg 3900
gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg gtttgtggga 3960
ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg cccttccctt 4020
tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct gtgggtctat 4080
attgggtccg gagcgactaa cttttccctg ctgaaacaag cgggtgacgt cgaagagaat 4140
ccgggaccta tggctaggcc cctgtgtaca cttttgctcc tgatggccac cctcgctgga 4200
gctctggcaa gcggtggatg gagctcaaag ccgcggaaag ggatgggtac taacctgtcc 4260
gtaccaaatc ccctgggatt ttttccagac caccaactcg atcctgcttt tggcgcaaat 4320
tccaacaatc ccgactggga ctttaaccct aacaaggacc actggcctga tgccaacaag 4380
gtgggggcag gagcctttgg tcccggcttc accccacccc atggaggtct tttgggatgg 4440
tcaccacagg cccagggcat cctgaccact gtccctgctg ctccaccgcc agcttctact 4500
aatcgacaga gcgggaggca gccgaccccc ctgagtcccc ccctgcggga tacccaccct 4560
caggca 4566
<210> 29
<211> 4566
<212> DNA
<213> Artificial Sequence
<220>
<223> PreS2.S-2A-preS1-2A-Core-2A-Pol coding sequence
<400> 29
atgcagtgga actcaactac tttccatcag acccttcagg accctagagt gcgcgggctg 60
tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac gaccgcctct 120
cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga gaatatcacc 180
tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct gactcgaatc 240
ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct gggaggaact 300
cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc gacaagttgt 360
cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat cttcctcttc 420
atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg catgctgcct 480
gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa gacctgtaca 540
attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc aagcgacggt 600
aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct ctgggaatgg 660
gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg gtttgtggga 720
ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg cccttccctt 780
tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct gtgggtctat 840
attggaagcg gagctactaa cttcagcctg ctgaagcagg ctggagacgt ggaggagaac 900
cctggaccta tggctaggcc cctgtgtaca cttttgctcc tgatggccac cctcgctgga 960
gctctggcaa gcggtggatg gagctcaaag ccgcggaaag ggatgggtac taacctgtcc 1020
gtaccaaatc ccctgggatt ttttccagac caccaactcg atcctgcttt tggcgcaaat 1080
tccaacaatc ccgactggga ctttaaccct aacaaggacc actggcctga tgccaacaag 1140
gtgggggcag gagcctttgg tcccggcttc accccacccc atggaggtct tttgggatgg 1200
tcaccacagg cccagggcat cctgaccact gtccctgctg ctccaccgcc agcttctact 1260
aatcgacaga gcgggaggca gccgaccccc ctgagtcccc ccctgcggga tacccaccct 1320
caggcaggat caggcgctac gaattttagc cttctgaagc aagcgggaga cgttgaagaa 1380
aacccagggc ctatggctcg acctctgtgt accctgctac tcctgatggc taccctggct 1440
ggagctctgg ccagcgacat cgacccttac aaggagttcg gcgccagcgt ggaactgctg 1500
tcttttctgc ccagtgattt ctttccttcc attcgagacc tgctggatac cgcctctgct 1560
ctgtatcggg aagccctgga gagcccagaa cactgctccc cacaccatac cgctctgcga 1620
caggcaatcc tgtgctgggg ggagctgatg aacctggcca catgggtggg atcgaatctg 1680
gaggaccccg cttcacggga actggtggtc agctacgtga acgtcaatat gggcctgaaa 1740
atccgccagc tgctgtggtt ccatattagc tgcctgactt ttggacgaga gaccgtgctg 1800
gaatacctgg tgtccttcgg cgtctggatt cgcactcccc ctgcttatcg accacccaac 1860
gcaccaattc tgtccaccct gcccgagacc acagtggtcc gtcgccgtgg gtccggagcg 1920
actaactttt ccctgctgaa acaagcgggt gacgtcgaag agaatccggg acctatggct 1980
cgacctctgt gtaccctgct actcctgatg gctaccctgg ctggagctct ggccagcatg 2040
cccctgtctt accagcactt tagaaagctt ctgctgctgg acgatgaagc cgggcctctg 2100
gaggaagagc tgccaaggct ggcagacgag gggctgaacc ggagagtggc cgaagatctg 2160
aatctgggaa acctgaacgt gagcatccct tggactcata aagtcggcaa cttcaccggg 2220
ctgtacagct ccacagtgcc tgtcttcaat ccagagtggc agacaccatc ctttcccaac 2280
attcacctgc aggaggacat cattaataga tgcgaacagt tcgtgggacc tctgacagtc 2340
aacgaaaaga ggcgcctgaa actgatcatg cctgccaggt tttacccaaa tgtgactaag 2400
tatctgccac tggataaggg catcaagcct tactatccag agcacctggt gaaccattac 2460
ttccagacta gacactatct gcataccctg tggaaggccg gaatcctgta caaacgagaa 2520
actacccgga gtgcttcatt ttgtggctcc ccatattctt gggaacagga gctgcagcat 2580
ggcaggctgg tgttccagac cagcaaacgc cacggggatg agtccttttg cagccagtct 2640
agtggcatcc tgagcagatc ccccgtgggg ccttgtattc agtctcagct gcggaagagt 2700
agactgggac tgcagccaca gcagggacac ctggcacgac ggcagcaggg aaggtctggc 2760
agtatccggg ctagagtgca tcccacaact agaaggacct tcggcgtcga gccatcagga 2820
agcggccaca tcgacaacag cgcatcaagc tcctctagtt gcctgcatca gtcagccgtg 2880
agaaaggccg cttacagcca cctgtccaca tctaaaaggc actcaagctc cgggcatgct 2940
gtggagctgc acaacatccc tccaaattct gcacgcagtc agtcagaagg acccgtgttc 3000
agctgctggt ggctgcagtt tcggaactca aagccttgca gcgactattg tctgagccat 3060
attgtgaatc tgctggagga ttggggccct tgtaccgagc acggggaaca ccatatcagg 3120
attccacgaa caccagcacg agtgactgga ggggtgttcc tggtggacaa gaacccccac 3180
aatactaccg agagccggct ggtggtcgat ttcagtcagt tttcaagagg caacacaagg 3240
gtgtcatggc ccaaattcgc cgtccctaat ctgcagagtc tgactaacct gctgtctagt 3300
aatctgagct ggctgtccct ggacgtgtcc gcagcctttt accacctgcc tctgcatcca 3360
gctgcaatgc cccatctgct ggtggggtca agcggactga gtcgctacgt cgcccgactg 3420
tcctctaact cacgcatcat taatcaccag catggcacca tgcagaacct gcacgatagc 3480
tgttcccgga atctgtacgt gtctctgctg ctgctgtata agacattcgg cagaaaactg 3540
cacctgtaca gccatcctat cattctgggg tttaggaaga tcccaatggg agtgggactg 3600
agccccttcc tgctggcaca gtttacctcc gccatttgct ctgtggtccg ccgagccttc 3660
ccacactgtc tggctttttc ctatatgaac aatgtggtcc tgggcgccaa atccgtgcag 3720
catctggagt ctctgttcac agctgtcact aactttctgc tgagcctggg gatccacctg 3780
aacccaaata agactaaacg ctgggggtac agcctgaatt tcatgggata tgtgattgga 3840
tcctggggga ccctgccaca ggagcacatc gtgcagaaga tcaaggaatg ctttcggaag 3900
ctgcccgtca acagacctat cgactggaaa gtgtgccagc ggattgtcgg actgctgggc 3960
ttcgccgctc cctttaccca gtgcgggtac ccagcactga tgcccctgta tgcctgtatc 4020
cagtctaagc aggctttcac ctttagtcct acatacaagg cattcctgtg caaacagtac 4080
ctgaacctgt atccagtggc aaggcagcga cctggactgt gccaggtctt tgcaaatgcc 4140
actcctaccg gctgggggct ggctatcgga catcagcgaa tgcggggcac attcgtggcc 4200
cccctgccta ttcacactgc tcagctgctg gcagcctgct ttgctagatc taggagtgga 4260
gcaaagctga tcggcaccga caatagtgtg gtcctgtcaa gaaaatacac atccttccca 4320
tggctgctgg gatgtgctgc aaactggatt ctgaggggca ccagcttcgt gtacgtcccc 4380
tcagccctga atcctgctga cgatccatcc cgcgggcgac tgggactgta ccgacctctg 4440
ctgagactgc ccttcaggcc tacaactggc cggacatctc tgtatgccga ttcaccaagc 4500
gtgccctcac acctgcctga cagagtccac tttgcttcac ccctgcacgt cgcttggcgg 4560
cctcca 4566
<210> 30
<211> 4566
<212> DNA
<213> Artificial Sequence
<220>
<223> PreS2.S-2A-preS1-2A-Pol-2A-Core coding sequence
<400> 30
atgcagtgga actcaactac tttccatcag acccttcagg accctagagt gcgcgggctg 60
tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac gaccgcctct 120
cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga gaatatcacc 180
tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct gactcgaatc 240
ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct gggaggaact 300
cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc gacaagttgt 360
cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat cttcctcttc 420
atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg catgctgcct 480
gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa gacctgtaca 540
attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc aagcgacggt 600
aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct ctgggaatgg 660
gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg gtttgtggga 720
ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg cccttccctt 780
tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct gtgggtctat 840
attggaagcg gagctactaa cttcagcctg ctgaagcagg ctggagacgt ggaggagaac 900
cctggaccta tggctaggcc cctgtgtaca cttttgctcc tgatggccac cctcgctgga 960
gctctggcaa gcggtggatg gagctcaaag ccgcggaaag ggatgggtac taacctgtcc 1020
gtaccaaatc ccctgggatt ttttccagac caccaactcg atcctgcttt tggcgcaaat 1080
tccaacaatc ccgactggga ctttaaccct aacaaggacc actggcctga tgccaacaag 1140
gtgggggcag gagcctttgg tcccggcttc accccacccc atggaggtct tttgggatgg 1200
tcaccacagg cccagggcat cctgaccact gtccctgctg ctccaccgcc agcttctact 1260
aatcgacaga gcgggaggca gccgaccccc ctgagtcccc ccctgcggga tacccaccct 1320
caggcaggat caggcgctac gaattttagc cttctgaagc aagcgggaga cgttgaagaa 1380
aacccagggc ctatggctcg acctctgtgt accctgctac tcctgatggc taccctggct 1440
ggagctctgg ccagcatgcc cctgtcttac cagcacttta gaaagcttct gctgctggac 1500
gatgaagccg ggcctctgga ggaagagctg ccaaggctgg cagacgaggg gctgaaccgg 1560
agagtggccg aagatctgaa tctgggaaac ctgaacgtga gcatcccttg gactcataaa 1620
gtcggcaact tcaccgggct gtacagctcc acagtgcctg tcttcaatcc agagtggcag 1680
acaccatcct ttcccaacat tcacctgcag gaggacatca ttaatagatg cgaacagttc 1740
gtgggacctc tgacagtcaa cgaaaagagg cgcctgaaac tgatcatgcc tgccaggttt 1800
tacccaaatg tgactaagta tctgccactg gataagggca tcaagcctta ctatccagag 1860
cacctggtga accattactt ccagactaga cactatctgc ataccctgtg gaaggccgga 1920
atcctgtaca aacgagaaac tacccggagt gcttcatttt gtggctcccc atattcttgg 1980
gaacaggagc tgcagcatgg caggctggtg ttccagacca gcaaacgcca cggggatgag 2040
tccttttgca gccagtctag tggcatcctg agcagatccc ccgtggggcc ttgtattcag 2100
tctcagctgc ggaagagtag actgggactg cagccacagc agggacacct ggcacgacgg 2160
cagcagggaa ggtctggcag tatccgggct agagtgcatc ccacaactag aaggaccttc 2220
ggcgtcgagc catcaggaag cggccacatc gacaacagcg catcaagctc ctctagttgc 2280
ctgcatcagt cagccgtgag aaaggccgct tacagccacc tgtccacatc taaaaggcac 2340
tcaagctccg ggcatgctgt ggagctgcac aacatccctc caaattctgc acgcagtcag 2400
tcagaaggac ccgtgttcag ctgctggtgg ctgcagtttc ggaactcaaa gccttgcagc 2460
gactattgtc tgagccatat tgtgaatctg ctggaggatt ggggcccttg taccgagcac 2520
ggggaacacc atatcaggat tccacgaaca ccagcacgag tgactggagg ggtgttcctg 2580
gtggacaaga acccccacaa tactaccgag agccggctgg tggtcgattt cagtcagttt 2640
tcaagaggca acacaagggt gtcatggccc aaattcgccg tccctaatct gcagagtctg 2700
actaacctgc tgtctagtaa tctgagctgg ctgtccctgg acgtgtccgc agccttttac 2760
cacctgcctc tgcatccagc tgcaatgccc catctgctgg tggggtcaag cggactgagt 2820
cgctacgtcg cccgactgtc ctctaactca cgcatcatta atcaccagca tggcaccatg 2880
cagaacctgc acgatagctg ttcccggaat ctgtacgtgt ctctgctgct gctgtataag 2940
acattcggca gaaaactgca cctgtacagc catcctatca ttctggggtt taggaagatc 3000
ccaatgggag tgggactgag ccccttcctg ctggcacagt ttacctccgc catttgctct 3060
gtggtccgcc gagccttccc acactgtctg gctttttcct atatgaacaa tgtggtcctg 3120
ggcgccaaat ccgtgcagca tctggagtct ctgttcacag ctgtcactaa ctttctgctg 3180
agcctgggga tccacctgaa cccaaataag actaaacgct gggggtacag cctgaatttc 3240
atgggatatg tgattggatc ctgggggacc ctgccacagg agcacatcgt gcagaagatc 3300
aaggaatgct ttcggaagct gcccgtcaac agacctatcg actggaaagt gtgccagcgg 3360
attgtcggac tgctgggctt cgccgctccc tttacccagt gcgggtaccc agcactgatg 3420
cccctgtatg cctgtatcca gtctaagcag gctttcacct ttagtcctac atacaaggca 3480
ttcctgtgca aacagtacct gaacctgtat ccagtggcaa ggcagcgacc tggactgtgc 3540
caggtctttg caaatgccac tcctaccggc tgggggctgg ctatcggaca tcagcgaatg 3600
cggggcacat tcgtggcccc cctgcctatt cacactgctc agctgctggc agcctgcttt 3660
gctagatcta ggagtggagc aaagctgatc ggcaccgaca atagtgtggt cctgtcaaga 3720
aaatacacat ccttcccatg gctgctggga tgtgctgcaa actggattct gaggggcacc 3780
agcttcgtgt acgtcccctc agccctgaat cctgctgacg atccatcccg cgggcgactg 3840
ggactgtacc gacctctgct gagactgccc ttcaggccta caactggccg gacatctctg 3900
tatgccgatt caccaagcgt gccctcacac ctgcctgaca gagtccactt tgcttcaccc 3960
ctgcacgtcg cttggcggcc tccagggtcc ggagcgacta acttttccct gctgaaacaa 4020
gcgggtgacg tcgaagagaa tccgggacct atggctcgac ctctgtgtac cctgctactc 4080
ctgatggcta ccctggctgg agctctggcc agcgacatcg acccttacaa ggagttcggc 4140
gccagcgtgg aactgctgtc ttttctgccc agtgatttct ttccttccat tcgagacctg 4200
ctggataccg cctctgctct gtatcgggaa gccctggaga gcccagaaca ctgctcccca 4260
caccataccg ctctgcgaca ggcaatcctg tgctgggggg agctgatgaa cctggccaca 4320
tgggtgggat cgaatctgga ggaccccgct tcacgggaac tggtggtcag ctacgtgaac 4380
gtcaatatgg gcctgaaaat ccgccagctg ctgtggttcc atattagctg cctgactttt 4440
ggacgagaga ccgtgctgga atacctggtg tccttcggcg tctggattcg cactccccct 4500
gcttatcgac cacccaacgc accaattctg tccaccctgc ccgagaccac agtggtccgt 4560
cgccgt 4566
<210> 31
<211> 5090
<212> DNA
<213> Artificial Sequence
<220>
<223> Core-2A-Pol coding sequence -IRES (EMCV)-PreS2.S-2A-preS1 coding
sequence
<400> 31
atggctcgac ctctgtgtac cctgctactc ctgatggcta ccctggctgg agctctggcc 60
agcgacatcg acccttacaa ggagttcggc gccagcgtgg aactgctgtc ttttctgccc 120
agtgatttct ttccttccat tcgagacctg ctggataccg cctctgctct gtatcgggaa 180
gccctggaga gcccagaaca ctgctcccca caccataccg ctctgcgaca ggcaatcctg 240
tgctgggggg agctgatgaa cctggccaca tgggtgggat cgaatctgga ggaccccgct 300
tcacgggaac tggtggtcag ctacgtgaac gtcaatatgg gcctgaaaat ccgccagctg 360
ctgtggttcc atattagctg cctgactttt ggacgagaga ccgtgctgga atacctggtg 420
tccttcggcg tctggattcg cactccccct gcttatcgac cacccaacgc accaattctg 480
tccaccctgc ccgagaccac agtggtccgt cgccgtggaa gcggagctac taacttcagc 540
ctgctgaagc aggctggaga cgtggaggag aaccctggac ctatggctcg acctctgtgt 600
accctgctac tcctgatggc taccctggct ggagctctgg ccagcatgcc cctgtcttac 660
cagcacttta gaaagcttct gctgctggac gatgaagccg ggcctctgga ggaagagctg 720
ccaaggctgg cagacgaggg gctgaaccgg agagtggccg aagatctgaa tctgggaaac 780
ctgaacgtga gcatcccttg gactcataaa gtcggcaact tcaccgggct gtacagctcc 840
acagtgcctg tcttcaatcc agagtggcag acaccatcct ttcccaacat tcacctgcag 900
gaggacatca ttaatagatg cgaacagttc gtgggacctc tgacagtcaa cgaaaagagg 960
cgcctgaaac tgatcatgcc tgccaggttt tacccaaatg tgactaagta tctgccactg 1020
gataagggca tcaagcctta ctatccagag cacctggtga accattactt ccagactaga 1080
cactatctgc ataccctgtg gaaggccgga atcctgtaca aacgagaaac tacccggagt 1140
gcttcatttt gtggctcccc atattcttgg gaacaggagc tgcagcatgg caggctggtg 1200
ttccagacca gcaaacgcca cggggatgag tccttttgca gccagtctag tggcatcctg 1260
agcagatccc ccgtggggcc ttgtattcag tctcagctgc ggaagagtag actgggactg 1320
cagccacagc agggacacct ggcacgacgg cagcagggaa ggtctggcag tatccgggct 1380
agagtgcatc ccacaactag aaggaccttc ggcgtcgagc catcaggaag cggccacatc 1440
gacaacagcg catcaagctc ctctagttgc ctgcatcagt cagccgtgag aaaggccgct 1500
tacagccacc tgtccacatc taaaaggcac tcaagctccg ggcatgctgt ggagctgcac 1560
aacatccctc caaattctgc acgcagtcag tcagaaggac ccgtgttcag ctgctggtgg 1620
ctgcagtttc ggaactcaaa gccttgcagc gactattgtc tgagccatat tgtgaatctg 1680
ctggaggatt ggggcccttg taccgagcac ggggaacacc atatcaggat tccacgaaca 1740
ccagcacgag tgactggagg ggtgttcctg gtggacaaga acccccacaa tactaccgag 1800
agccggctgg tggtcgattt cagtcagttt tcaagaggca acacaagggt gtcatggccc 1860
aaattcgccg tccctaatct gcagagtctg actaacctgc tgtctagtaa tctgagctgg 1920
ctgtccctgg acgtgtccgc agccttttac cacctgcctc tgcatccagc tgcaatgccc 1980
catctgctgg tggggtcaag cggactgagt cgctacgtcg cccgactgtc ctctaactca 2040
cgcatcatta atcaccagca tggcaccatg cagaacctgc acgatagctg ttcccggaat 2100
ctgtacgtgt ctctgctgct gctgtataag acattcggca gaaaactgca cctgtacagc 2160
catcctatca ttctggggtt taggaagatc ccaatgggag tgggactgag ccccttcctg 2220
ctggcacagt ttacctccgc catttgctct gtggtccgcc gagccttccc acactgtctg 2280
gctttttcct atatgaacaa tgtggtcctg ggcgccaaat ccgtgcagca tctggagtct 2340
ctgttcacag ctgtcactaa ctttctgctg agcctgggga tccacctgaa cccaaataag 2400
actaaacgct gggggtacag cctgaatttc atgggatatg tgattggatc ctgggggacc 2460
ctgccacagg agcacatcgt gcagaagatc aaggaatgct ttcggaagct gcccgtcaac 2520
agacctatcg actggaaagt gtgccagcgg attgtcggac tgctgggctt cgccgctccc 2580
tttacccagt gcgggtaccc agcactgatg cccctgtatg cctgtatcca gtctaagcag 2640
gctttcacct ttagtcctac atacaaggca ttcctgtgca aacagtacct gaacctgtat 2700
ccagtggcaa ggcagcgacc tggactgtgc caggtctttg caaatgccac tcctaccggc 2760
tgggggctgg ctatcggaca tcagcgaatg cggggcacat tcgtggcccc cctgcctatt 2820
cacactgctc agctgctggc agcctgcttt gctagatcta ggagtggagc aaagctgatc 2880
ggcaccgaca atagtgtggt cctgtcaaga aaatacacat ccttcccatg gctgctggga 2940
tgtgctgcaa actggattct gaggggcacc agcttcgtgt acgtcccctc agccctgaat 3000
cctgctgacg atccatcccg cgggcgactg ggactgtacc gacctctgct gagactgccc 3060
ttcaggccta caactggccg gacatctctg tatgccgatt caccaagcgt gccctcacac 3120
ctgcctgaca gagtccactt tgcttcaccc ctgcacgtcg cttggcggcc tccataagcc 3180
cctctccctc ccccccccct aacgttactg gccgaagccg cttggaataa ggccggtgtg 3240
cgtttgtcta tatgttattt tccaccatat tgccgtcttt tggcaatgtg agggcccgga 3300
aacctggccc tgtcttcttg acgagcattc ctaggggtct ttcccctctc gccaaaggaa 3360
tgcaaggtct gttgaatgtc gtgaaggaag cagttcctct ggaagcttct tgaagacaaa 3420
caacgtctgt agcgaccctt tgcaggcagc ggaacccccc acctggcgac aggtgcctct 3480
gcggccaaaa gccacgtgta taagatacac ctgcaaaggc ggcacaaccc cagtgccacg 3540
ttgtgagttg gatagttgtg gaaagagtca aatggctctc ctcaagcgta ttcaacaagg 3600
ggctgaagga tgcccagaag gtaccccatt gtatgggatc tgatctgggg cctcggtgca 3660
catgctttac atgtgtttag tcgaggttaa aaaacgtcta ggccccccga accacgggga 3720
cgtggttttc ctttgaaaaa cacgatgata atatggccac aaccatgcag tggaactcaa 3780
ctactttcca tcagaccctt caggacccta gagtgcgcgg gctgtacttt cctgctgggg 3840
gaagcagtag cgggaccgtt aatccagtac ctacgaccgc ctctcccata tcttctatct 3900
ttagtaggac tggtgaccct gctcccaaca tggagaatat cacctccggg tttctgggcc 3960
cactcctggt ccttcaggcc ggattcttcc tgctgactcg aatcctcacc ataccccaga 4020
gcctggacag ctggtggaca agcctgaatt ttctgggagg aactcctgta tgcctgggac 4080
aaaattcaca gtcccctaca agtaaccatt caccgacaag ttgtcctccc atctgtcccg 4140
gatacaggtg gatgtgcctg cgaaggttca tcatcttcct cttcatcctc ttgctttgcc 4200
ttattttcct cctggttctt ctggactatc agggcatgct gcctgtgtgc ccactgatac 4260
caggatctag tactaccagc acaggcccgt gtaagacctg tacaattcca gcacaaggga 4320
ctagtatgtt cccctcctgc tgttgtacta agccaagcga cggtaattgc acgtgtatcc 4380
caatcccgtc ctcctgggcg tttgccaagt acctctggga atgggcctca gtcagatttt 4440
catggcttag tcttttggtg ccgttcgtgc agtggtttgt gggactctct ccgactgtgt 4500
ggctcagcgt gatctggatg atgtggtact ggggcccttc cctttacaac atactgtctc 4560
cattccttcc cctgctgcca atcttctttt gcctgtgggt ctatattggg tccggagcga 4620
ctaacttttc cctgctgaaa caagcgggtg acgtcgaaga gaatccggga cctatggcta 4680
ggcccctgtg tacacttttg ctcctgatgg ccaccctcgc tggagctctg gcaagcggtg 4740
gatggagctc aaagccgcgg aaagggatgg gtactaacct gtccgtacca aatcccctgg 4800
gattttttcc agaccaccaa ctcgatcctg cttttggcgc aaattccaac aatcccgact 4860
gggactttaa ccctaacaag gaccactggc ctgatgccaa caaggtgggg gcaggagcct 4920
ttggtcccgg cttcacccca ccccatggag gtcttttggg atggtcacca caggcccagg 4980
gcatcctgac cactgtccct gctgctccac cgccagcttc tactaatcga cagagcggga 5040
ggcagccgac ccccctgagt ccccccctgc gggataccca ccctcaggca 5090
<210> 32
<211> 5090
<212> DNA
<213> Artificial Sequence
<220>
<223> PreS2.S-2A-preS1 coding sequence -IRES (EMCV)-Core-2A-Pol coding
sequence
<400> 32
atgcagtgga actcaactac tttccatcag acccttcagg accctagagt gcgcgggctg 60
tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac gaccgcctct 120
cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga gaatatcacc 180
tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct gactcgaatc 240
ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct gggaggaact 300
cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc gacaagttgt 360
cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat cttcctcttc 420
atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg catgctgcct 480
gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa gacctgtaca 540
attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc aagcgacggt 600
aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct ctgggaatgg 660
gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg gtttgtggga 720
ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg cccttccctt 780
tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct gtgggtctat 840
attggaagcg gagctactaa cttcagcctg ctgaagcagg ctggagacgt ggaggagaac 900
cctggaccta tggctaggcc cctgtgtaca cttttgctcc tgatggccac cctcgctgga 960
gctctggcaa gcggtggatg gagctcaaag ccgcggaaag ggatgggtac taacctgtcc 1020
gtaccaaatc ccctgggatt ttttccagac caccaactcg atcctgcttt tggcgcaaat 1080
tccaacaatc ccgactggga ctttaaccct aacaaggacc actggcctga tgccaacaag 1140
gtgggggcag gagcctttgg tcccggcttc accccacccc atggaggtct tttgggatgg 1200
tcaccacagg cccagggcat cctgaccact gtccctgctg ctccaccgcc agcttctact 1260
aatcgacaga gcgggaggca gccgaccccc ctgagtcccc ccctgcggga tacccaccct 1320
caggcataag cccctctccc tccccccccc ctaacgttac tggccgaagc cgcttggaat 1380
aaggccggtg tgcgtttgtc tatatgttat tttccaccat attgccgtct tttggcaatg 1440
tgagggcccg gaaacctggc cctgtcttct tgacgagcat tcctaggggt ctttcccctc 1500
tcgccaaagg aatgcaaggt ctgttgaatg tcgtgaagga agcagttcct ctggaagctt 1560
cttgaagaca aacaacgtct gtagcgaccc tttgcaggca gcggaacccc ccacctggcg 1620
acaggtgcct ctgcggccaa aagccacgtg tataagatac acctgcaaag gcggcacaac 1680
cccagtgcca cgttgtgagt tggatagttg tggaaagagt caaatggctc tcctcaagcg 1740
tattcaacaa ggggctgaag gatgcccaga aggtacccca ttgtatggga tctgatctgg 1800
ggcctcggtg cacatgcttt acatgtgttt agtcgaggtt aaaaaacgtc taggcccccc 1860
gaaccacggg gacgtggttt tcctttgaaa aacacgatga taatatggcc acaaccatgg 1920
ctcgacctct gtgtaccctg ctactcctga tggctaccct ggctggagct ctggccagcg 1980
acatcgaccc ttacaaggag ttcggcgcca gcgtggaact gctgtctttt ctgcccagtg 2040
atttctttcc ttccattcga gacctgctgg ataccgcctc tgctctgtat cgggaagccc 2100
tggagagccc agaacactgc tccccacacc ataccgctct gcgacaggca atcctgtgct 2160
ggggggagct gatgaacctg gccacatggg tgggatcgaa tctggaggac cccgcttcac 2220
gggaactggt ggtcagctac gtgaacgtca atatgggcct gaaaatccgc cagctgctgt 2280
ggttccatat tagctgcctg acttttggac gagagaccgt gctggaatac ctggtgtcct 2340
tcggcgtctg gattcgcact ccccctgctt atcgaccacc caacgcacca attctgtcca 2400
ccctgcccga gaccacagtg gtccgtcgcc gtgggtccgg agcgactaac ttttccctgc 2460
tgaaacaagc gggtgacgtc gaagagaatc cgggacctat ggctcgacct ctgtgtaccc 2520
tgctactcct gatggctacc ctggctggag ctctggccag catgcccctg tcttaccagc 2580
actttagaaa gcttctgctg ctggacgatg aagccgggcc tctggaggaa gagctgccaa 2640
ggctggcaga cgaggggctg aaccggagag tggccgaaga tctgaatctg ggaaacctga 2700
acgtgagcat cccttggact cataaagtcg gcaacttcac cgggctgtac agctccacag 2760
tgcctgtctt caatccagag tggcagacac catcctttcc caacattcac ctgcaggagg 2820
acatcattaa tagatgcgaa cagttcgtgg gacctctgac agtcaacgaa aagaggcgcc 2880
tgaaactgat catgcctgcc aggttttacc caaatgtgac taagtatctg ccactggata 2940
agggcatcaa gccttactat ccagagcacc tggtgaacca ttacttccag actagacact 3000
atctgcatac cctgtggaag gccggaatcc tgtacaaacg agaaactacc cggagtgctt 3060
cattttgtgg ctccccatat tcttgggaac aggagctgca gcatggcagg ctggtgttcc 3120
agaccagcaa acgccacggg gatgagtcct tttgcagcca gtctagtggc atcctgagca 3180
gatcccccgt ggggccttgt attcagtctc agctgcggaa gagtagactg ggactgcagc 3240
cacagcaggg acacctggca cgacggcagc agggaaggtc tggcagtatc cgggctagag 3300
tgcatcccac aactagaagg accttcggcg tcgagccatc aggaagcggc cacatcgaca 3360
acagcgcatc aagctcctct agttgcctgc atcagtcagc cgtgagaaag gccgcttaca 3420
gccacctgtc cacatctaaa aggcactcaa gctccgggca tgctgtggag ctgcacaaca 3480
tccctccaaa ttctgcacgc agtcagtcag aaggacccgt gttcagctgc tggtggctgc 3540
agtttcggaa ctcaaagcct tgcagcgact attgtctgag ccatattgtg aatctgctgg 3600
aggattgggg cccttgtacc gagcacgggg aacaccatat caggattcca cgaacaccag 3660
cacgagtgac tggaggggtg ttcctggtgg acaagaaccc ccacaatact accgagagcc 3720
ggctggtggt cgatttcagt cagttttcaa gaggcaacac aagggtgtca tggcccaaat 3780
tcgccgtccc taatctgcag agtctgacta acctgctgtc tagtaatctg agctggctgt 3840
ccctggacgt gtccgcagcc ttttaccacc tgcctctgca tccagctgca atgccccatc 3900
tgctggtggg gtcaagcgga ctgagtcgct acgtcgcccg actgtcctct aactcacgca 3960
tcattaatca ccagcatggc accatgcaga acctgcacga tagctgttcc cggaatctgt 4020
acgtgtctct gctgctgctg tataagacat tcggcagaaa actgcacctg tacagccatc 4080
ctatcattct ggggtttagg aagatcccaa tgggagtggg actgagcccc ttcctgctgg 4140
cacagtttac ctccgccatt tgctctgtgg tccgccgagc cttcccacac tgtctggctt 4200
tttcctatat gaacaatgtg gtcctgggcg ccaaatccgt gcagcatctg gagtctctgt 4260
tcacagctgt cactaacttt ctgctgagcc tggggatcca cctgaaccca aataagacta 4320
aacgctgggg gtacagcctg aatttcatgg gatatgtgat tggatcctgg gggaccctgc 4380
cacaggagca catcgtgcag aagatcaagg aatgctttcg gaagctgccc gtcaacagac 4440
ctatcgactg gaaagtgtgc cagcggattg tcggactgct gggcttcgcc gctcccttta 4500
cccagtgcgg gtacccagca ctgatgcccc tgtatgcctg tatccagtct aagcaggctt 4560
tcacctttag tcctacatac aaggcattcc tgtgcaaaca gtacctgaac ctgtatccag 4620
tggcaaggca gcgacctgga ctgtgccagg tctttgcaaa tgccactcct accggctggg 4680
ggctggctat cggacatcag cgaatgcggg gcacattcgt ggcccccctg cctattcaca 4740
ctgctcagct gctggcagcc tgctttgcta gatctaggag tggagcaaag ctgatcggca 4800
ccgacaatag tgtggtcctg tcaagaaaat acacatcctt cccatggctg ctgggatgtg 4860
ctgcaaactg gattctgagg ggcaccagct tcgtgtacgt cccctcagcc ctgaatcctg 4920
ctgacgatcc atcccgcggg cgactgggac tgtaccgacc tctgctgaga ctgcccttca 4980
ggcctacaac tggccggaca tctctgtatg ccgattcacc aagcgtgccc tcacacctgc 5040
ctgacagagt ccactttgct tcacccctgc acgtcgcttg gcggcctcca 5090
<210> 33
<211> 5250
<212> DNA
<213> Artificial Sequence
<220>
<223> Core-2A-Pol coding sequence -IRES (EV71)-PreS2.S-2A-preS1 coding
sequence
<400> 33
atggctcgac ctctgtgtac cctgctactc ctgatggcta ccctggctgg agctctggcc 60
agcgacatcg acccttacaa ggagttcggc gccagcgtgg aactgctgtc ttttctgccc 120
agtgatttct ttccttccat tcgagacctg ctggataccg cctctgctct gtatcgggaa 180
gccctggaga gcccagaaca ctgctcccca caccataccg ctctgcgaca ggcaatcctg 240
tgctgggggg agctgatgaa cctggccaca tgggtgggat cgaatctgga ggaccccgct 300
tcacgggaac tggtggtcag ctacgtgaac gtcaatatgg gcctgaaaat ccgccagctg 360
ctgtggttcc atattagctg cctgactttt ggacgagaga ccgtgctgga atacctggtg 420
tccttcggcg tctggattcg cactccccct gcttatcgac cacccaacgc accaattctg 480
tccaccctgc ccgagaccac agtggtccgt cgccgtggaa gcggagctac taacttcagc 540
ctgctgaagc aggctggaga cgtggaggag aaccctggac ctatggctcg acctctgtgt 600
accctgctac tcctgatggc taccctggct ggagctctgg ccagcatgcc cctgtcttac 660
cagcacttta gaaagcttct gctgctggac gatgaagccg ggcctctgga ggaagagctg 720
ccaaggctgg cagacgaggg gctgaaccgg agagtggccg aagatctgaa tctgggaaac 780
ctgaacgtga gcatcccttg gactcataaa gtcggcaact tcaccgggct gtacagctcc 840
acagtgcctg tcttcaatcc agagtggcag acaccatcct ttcccaacat tcacctgcag 900
gaggacatca ttaatagatg cgaacagttc gtgggacctc tgacagtcaa cgaaaagagg 960
cgcctgaaac tgatcatgcc tgccaggttt tacccaaatg tgactaagta tctgccactg 1020
gataagggca tcaagcctta ctatccagag cacctggtga accattactt ccagactaga 1080
cactatctgc ataccctgtg gaaggccgga atcctgtaca aacgagaaac tacccggagt 1140
gcttcatttt gtggctcccc atattcttgg gaacaggagc tgcagcatgg caggctggtg 1200
ttccagacca gcaaacgcca cggggatgag tccttttgca gccagtctag tggcatcctg 1260
agcagatccc ccgtggggcc ttgtattcag tctcagctgc ggaagagtag actgggactg 1320
cagccacagc agggacacct ggcacgacgg cagcagggaa ggtctggcag tatccgggct 1380
agagtgcatc ccacaactag aaggaccttc ggcgtcgagc catcaggaag cggccacatc 1440
gacaacagcg catcaagctc ctctagttgc ctgcatcagt cagccgtgag aaaggccgct 1500
tacagccacc tgtccacatc taaaaggcac tcaagctccg ggcatgctgt ggagctgcac 1560
aacatccctc caaattctgc acgcagtcag tcagaaggac ccgtgttcag ctgctggtgg 1620
ctgcagtttc ggaactcaaa gccttgcagc gactattgtc tgagccatat tgtgaatctg 1680
ctggaggatt ggggcccttg taccgagcac ggggaacacc atatcaggat tccacgaaca 1740
ccagcacgag tgactggagg ggtgttcctg gtggacaaga acccccacaa tactaccgag 1800
agccggctgg tggtcgattt cagtcagttt tcaagaggca acacaagggt gtcatggccc 1860
aaattcgccg tccctaatct gcagagtctg actaacctgc tgtctagtaa tctgagctgg 1920
ctgtccctgg acgtgtccgc agccttttac cacctgcctc tgcatccagc tgcaatgccc 1980
catctgctgg tggggtcaag cggactgagt cgctacgtcg cccgactgtc ctctaactca 2040
cgcatcatta atcaccagca tggcaccatg cagaacctgc acgatagctg ttcccggaat 2100
ctgtacgtgt ctctgctgct gctgtataag acattcggca gaaaactgca cctgtacagc 2160
catcctatca ttctggggtt taggaagatc ccaatgggag tgggactgag ccccttcctg 2220
ctggcacagt ttacctccgc catttgctct gtggtccgcc gagccttccc acactgtctg 2280
gctttttcct atatgaacaa tgtggtcctg ggcgccaaat ccgtgcagca tctggagtct 2340
ctgttcacag ctgtcactaa ctttctgctg agcctgggga tccacctgaa cccaaataag 2400
actaaacgct gggggtacag cctgaatttc atgggatatg tgattggatc ctgggggacc 2460
ctgccacagg agcacatcgt gcagaagatc aaggaatgct ttcggaagct gcccgtcaac 2520
agacctatcg actggaaagt gtgccagcgg attgtcggac tgctgggctt cgccgctccc 2580
tttacccagt gcgggtaccc agcactgatg cccctgtatg cctgtatcca gtctaagcag 2640
gctttcacct ttagtcctac atacaaggca ttcctgtgca aacagtacct gaacctgtat 2700
ccagtggcaa ggcagcgacc tggactgtgc caggtctttg caaatgccac tcctaccggc 2760
tgggggctgg ctatcggaca tcagcgaatg cggggcacat tcgtggcccc cctgcctatt 2820
cacactgctc agctgctggc agcctgcttt gctagatcta ggagtggagc aaagctgatc 2880
ggcaccgaca atagtgtggt cctgtcaaga aaatacacat ccttcccatg gctgctggga 2940
tgtgctgcaa actggattct gaggggcacc agcttcgtgt acgtcccctc agccctgaat 3000
cctgctgacg atccatcccg cgggcgactg ggactgtacc gacctctgct gagactgccc 3060
ttcaggccta caactggccg gacatctctg tatgccgatt caccaagcgt gccctcacac 3120
ctgcctgaca gagtccactt tgcttcaccc ctgcacgtcg cttggcggcc tccataatta 3180
aaacagctgt gggttgttcc cacccacagg gcccactggg cgctagcact ctgattttac 3240
gaaatccttg tgcgcctgtt ttatatccct tccctaattc gaaacgtaga agcaatgcgc 3300
accactgatc aatagtaggc gtaacgcgcc agttacgtca tgatcaagca tatctgttcc 3360
cccggactga gtatcaatag actgcttacg cggttgaagg agaaaacgtt cgttatccgg 3420
ctaactactt cgagaagccc agtaacacca tggaagctgc agggtgtttc gctcagcact 3480
tcccccgtgt agatcaggtc gatgagccac tgcaatcccc acaggtgact gtggcagtgg 3540
ctgcgttggc ggcctgccta tggggagacc cataggacgc tctaatgtgg acatggtgcg 3600
aagagcctat tgagctagtt agtagtcctc cggcccctga atgcggctaa tcctaactgc 3660
ggagcacatg ccttcaaccc agagggtagt gtgtcgtaac gggcaactct gcagcggaac 3720
cgactacttt gggtgtccgt gtttcttttt tattcttata ttggctgctt atggtgacaa 3780
ttacagaatt gttaccatat agctattgga ttggccatcc ggtgtgtaat agagctgtta 3840
tatacctatt tgttggcttt gtaccactaa ctttaaaatc tataactacc ctcaacttta 3900
tattaaccct caatacagtt gaccatgcag tggaactcaa ctactttcca tcagaccctt 3960
caggacccta gagtgcgcgg gctgtacttt cctgctgggg gaagcagtag cgggaccgtt 4020
aatccagtac ctacgaccgc ctctcccata tcttctatct ttagtaggac tggtgaccct 4080
gctcccaaca tggagaatat cacctccggg tttctgggcc cactcctggt ccttcaggcc 4140
ggattcttcc tgctgactcg aatcctcacc ataccccaga gcctggacag ctggtggaca 4200
agcctgaatt ttctgggagg aactcctgta tgcctgggac aaaattcaca gtcccctaca 4260
agtaaccatt caccgacaag ttgtcctccc atctgtcccg gatacaggtg gatgtgcctg 4320
cgaaggttca tcatcttcct cttcatcctc ttgctttgcc ttattttcct cctggttctt 4380
ctggactatc agggcatgct gcctgtgtgc ccactgatac caggatctag tactaccagc 4440
acaggcccgt gtaagacctg tacaattcca gcacaaggga ctagtatgtt cccctcctgc 4500
tgttgtacta agccaagcga cggtaattgc acgtgtatcc caatcccgtc ctcctgggcg 4560
tttgccaagt acctctggga atgggcctca gtcagatttt catggcttag tcttttggtg 4620
ccgttcgtgc agtggtttgt gggactctct ccgactgtgt ggctcagcgt gatctggatg 4680
atgtggtact ggggcccttc cctttacaac atactgtctc cattccttcc cctgctgcca 4740
atcttctttt gcctgtgggt ctatattggg tccggagcga ctaacttttc cctgctgaaa 4800
caagcgggtg acgtcgaaga gaatccggga cctatggcta ggcccctgtg tacacttttg 4860
ctcctgatgg ccaccctcgc tggagctctg gcaagcggtg gatggagctc aaagccgcgg 4920
aaagggatgg gtactaacct gtccgtacca aatcccctgg gattttttcc agaccaccaa 4980
ctcgatcctg cttttggcgc aaattccaac aatcccgact gggactttaa ccctaacaag 5040
gaccactggc ctgatgccaa caaggtgggg gcaggagcct ttggtcccgg cttcacccca 5100
ccccatggag gtcttttggg atggtcacca caggcccagg gcatcctgac cactgtccct 5160
gctgctccac cgccagcttc tactaatcga cagagcggga ggcagccgac ccccctgagt 5220
ccccccctgc gggataccca ccctcaggca 5250
<210> 34
<211> 5250
<212> DNA
<213> Artificial Sequence
<220>
<223> PreS2.S-2A-preS1 coding sequence -IRES (EV71)-Core-2A-Pol coding
sequence
<400> 34
atgcagtgga actcaactac tttccatcag acccttcagg accctagagt gcgcgggctg 60
tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac gaccgcctct 120
cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga gaatatcacc 180
tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct gactcgaatc 240
ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct gggaggaact 300
cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc gacaagttgt 360
cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat cttcctcttc 420
atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg catgctgcct 480
gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa gacctgtaca 540
attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc aagcgacggt 600
aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct ctgggaatgg 660
gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg gtttgtggga 720
ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg cccttccctt 780
tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct gtgggtctat 840
attggaagcg gagctactaa cttcagcctg ctgaagcagg ctggagacgt ggaggagaac 900
cctggaccta tggctaggcc cctgtgtaca cttttgctcc tgatggccac cctcgctgga 960
gctctggcaa gcggtggatg gagctcaaag ccgcggaaag ggatgggtac taacctgtcc 1020
gtaccaaatc ccctgggatt ttttccagac caccaactcg atcctgcttt tggcgcaaat 1080
tccaacaatc ccgactggga ctttaaccct aacaaggacc actggcctga tgccaacaag 1140
gtgggggcag gagcctttgg tcccggcttc accccacccc atggaggtct tttgggatgg 1200
tcaccacagg cccagggcat cctgaccact gtccctgctg ctccaccgcc agcttctact 1260
aatcgacaga gcgggaggca gccgaccccc ctgagtcccc ccctgcggga tacccaccct 1320
caggcataat taaaacagct gtgggttgtt cccacccaca gggcccactg ggcgctagca 1380
ctctgatttt acgaaatcct tgtgcgcctg ttttatatcc cttccctaat tcgaaacgta 1440
gaagcaatgc gcaccactga tcaatagtag gcgtaacgcg ccagttacgt catgatcaag 1500
catatctgtt cccccggact gagtatcaat agactgctta cgcggttgaa ggagaaaacg 1560
ttcgttatcc ggctaactac ttcgagaagc ccagtaacac catggaagct gcagggtgtt 1620
tcgctcagca cttcccccgt gtagatcagg tcgatgagcc actgcaatcc ccacaggtga 1680
ctgtggcagt ggctgcgttg gcggcctgcc tatggggaga cccataggac gctctaatgt 1740
ggacatggtg cgaagagcct attgagctag ttagtagtcc tccggcccct gaatgcggct 1800
aatcctaact gcggagcaca tgccttcaac ccagagggta gtgtgtcgta acgggcaact 1860
ctgcagcgga accgactact ttgggtgtcc gtgtttcttt tttattctta tattggctgc 1920
ttatggtgac aattacagaa ttgttaccat atagctattg gattggccat ccggtgtgta 1980
atagagctgt tatataccta tttgttggct ttgtaccact aactttaaaa tctataacta 2040
ccctcaactt tatattaacc ctcaatacag ttgaccatgg ctcgacctct gtgtaccctg 2100
ctactcctga tggctaccct ggctggagct ctggccagcg acatcgaccc ttacaaggag 2160
ttcggcgcca gcgtggaact gctgtctttt ctgcccagtg atttctttcc ttccattcga 2220
gacctgctgg ataccgcctc tgctctgtat cgggaagccc tggagagccc agaacactgc 2280
tccccacacc ataccgctct gcgacaggca atcctgtgct ggggggagct gatgaacctg 2340
gccacatggg tgggatcgaa tctggaggac cccgcttcac gggaactggt ggtcagctac 2400
gtgaacgtca atatgggcct gaaaatccgc cagctgctgt ggttccatat tagctgcctg 2460
acttttggac gagagaccgt gctggaatac ctggtgtcct tcggcgtctg gattcgcact 2520
ccccctgctt atcgaccacc caacgcacca attctgtcca ccctgcccga gaccacagtg 2580
gtccgtcgcc gtgggtccgg agcgactaac ttttccctgc tgaaacaagc gggtgacgtc 2640
gaagagaatc cgggacctat ggctcgacct ctgtgtaccc tgctactcct gatggctacc 2700
ctggctggag ctctggccag catgcccctg tcttaccagc actttagaaa gcttctgctg 2760
ctggacgatg aagccgggcc tctggaggaa gagctgccaa ggctggcaga cgaggggctg 2820
aaccggagag tggccgaaga tctgaatctg ggaaacctga acgtgagcat cccttggact 2880
cataaagtcg gcaacttcac cgggctgtac agctccacag tgcctgtctt caatccagag 2940
tggcagacac catcctttcc caacattcac ctgcaggagg acatcattaa tagatgcgaa 3000
cagttcgtgg gacctctgac agtcaacgaa aagaggcgcc tgaaactgat catgcctgcc 3060
aggttttacc caaatgtgac taagtatctg ccactggata agggcatcaa gccttactat 3120
ccagagcacc tggtgaacca ttacttccag actagacact atctgcatac cctgtggaag 3180
gccggaatcc tgtacaaacg agaaactacc cggagtgctt cattttgtgg ctccccatat 3240
tcttgggaac aggagctgca gcatggcagg ctggtgttcc agaccagcaa acgccacggg 3300
gatgagtcct tttgcagcca gtctagtggc atcctgagca gatcccccgt ggggccttgt 3360
attcagtctc agctgcggaa gagtagactg ggactgcagc cacagcaggg acacctggca 3420
cgacggcagc agggaaggtc tggcagtatc cgggctagag tgcatcccac aactagaagg 3480
accttcggcg tcgagccatc aggaagcggc cacatcgaca acagcgcatc aagctcctct 3540
agttgcctgc atcagtcagc cgtgagaaag gccgcttaca gccacctgtc cacatctaaa 3600
aggcactcaa gctccgggca tgctgtggag ctgcacaaca tccctccaaa ttctgcacgc 3660
agtcagtcag aaggacccgt gttcagctgc tggtggctgc agtttcggaa ctcaaagcct 3720
tgcagcgact attgtctgag ccatattgtg aatctgctgg aggattgggg cccttgtacc 3780
gagcacgggg aacaccatat caggattcca cgaacaccag cacgagtgac tggaggggtg 3840
ttcctggtgg acaagaaccc ccacaatact accgagagcc ggctggtggt cgatttcagt 3900
cagttttcaa gaggcaacac aagggtgtca tggcccaaat tcgccgtccc taatctgcag 3960
agtctgacta acctgctgtc tagtaatctg agctggctgt ccctggacgt gtccgcagcc 4020
ttttaccacc tgcctctgca tccagctgca atgccccatc tgctggtggg gtcaagcgga 4080
ctgagtcgct acgtcgcccg actgtcctct aactcacgca tcattaatca ccagcatggc 4140
accatgcaga acctgcacga tagctgttcc cggaatctgt acgtgtctct gctgctgctg 4200
tataagacat tcggcagaaa actgcacctg tacagccatc ctatcattct ggggtttagg 4260
aagatcccaa tgggagtggg actgagcccc ttcctgctgg cacagtttac ctccgccatt 4320
tgctctgtgg tccgccgagc cttcccacac tgtctggctt tttcctatat gaacaatgtg 4380
gtcctgggcg ccaaatccgt gcagcatctg gagtctctgt tcacagctgt cactaacttt 4440
ctgctgagcc tggggatcca cctgaaccca aataagacta aacgctgggg gtacagcctg 4500
aatttcatgg gatatgtgat tggatcctgg gggaccctgc cacaggagca catcgtgcag 4560
aagatcaagg aatgctttcg gaagctgccc gtcaacagac ctatcgactg gaaagtgtgc 4620
cagcggattg tcggactgct gggcttcgcc gctcccttta cccagtgcgg gtacccagca 4680
ctgatgcccc tgtatgcctg tatccagtct aagcaggctt tcacctttag tcctacatac 4740
aaggcattcc tgtgcaaaca gtacctgaac ctgtatccag tggcaaggca gcgacctgga 4800
ctgtgccagg tctttgcaaa tgccactcct accggctggg ggctggctat cggacatcag 4860
cgaatgcggg gcacattcgt ggcccccctg cctattcaca ctgctcagct gctggcagcc 4920
tgctttgcta gatctaggag tggagcaaag ctgatcggca ccgacaatag tgtggtcctg 4980
tcaagaaaat acacatcctt cccatggctg ctgggatgtg ctgcaaactg gattctgagg 5040
ggcaccagct tcgtgtacgt cccctcagcc ctgaatcctg ctgacgatcc atcccgcggg 5100
cgactgggac tgtaccgacc tctgctgaga ctgcccttca ggcctacaac tggccggaca 5160
tctctgtatg ccgattcacc aagcgtgccc tcacacctgc ctgacagagt ccactttgct 5220
tcacccctgc acgtcgcttg gcggcctcca 5250
<210> 35
<211> 5090
<212> DNA
<213> Artificial Sequence
<220>
<223> Pol-2A-Core coding sequence -IRES (EMCV)-PreS2.S-2A-preS1 coding
sequence
<400> 35
atggctcgac ctctgtgtac cctgctactc ctgatggcta ccctggctgg agctctggcc 60
agcatgcccc tgtcttacca gcactttaga aagcttctgc tgctggacga tgaagccggg 120
cctctggagg aagagctgcc aaggctggca gacgaggggc tgaaccggag agtggccgaa 180
gatctgaatc tgggaaacct gaacgtgagc atcccttgga ctcataaagt cggcaacttc 240
accgggctgt acagctccac agtgcctgtc ttcaatccag agtggcagac accatccttt 300
cccaacattc acctgcagga ggacatcatt aatagatgcg aacagttcgt gggacctctg 360
acagtcaacg aaaagaggcg cctgaaactg atcatgcctg ccaggtttta cccaaatgtg 420
actaagtatc tgccactgga taagggcatc aagccttact atccagagca cctggtgaac 480
cattacttcc agactagaca ctatctgcat accctgtgga aggccggaat cctgtacaaa 540
cgagaaacta cccggagtgc ttcattttgt ggctccccat attcttggga acaggagctg 600
cagcatggca ggctggtgtt ccagaccagc aaacgccacg gggatgagtc cttttgcagc 660
cagtctagtg gcatcctgag cagatccccc gtggggcctt gtattcagtc tcagctgcgg 720
aagagtagac tgggactgca gccacagcag ggacacctgg cacgacggca gcagggaagg 780
tctggcagta tccgggctag agtgcatccc acaactagaa ggaccttcgg cgtcgagcca 840
tcaggaagcg gccacatcga caacagcgca tcaagctcct ctagttgcct gcatcagtca 900
gccgtgagaa aggccgctta cagccacctg tccacatcta aaaggcactc aagctccggg 960
catgctgtgg agctgcacaa catccctcca aattctgcac gcagtcagtc agaaggaccc 1020
gtgttcagct gctggtggct gcagtttcgg aactcaaagc cttgcagcga ctattgtctg 1080
agccatattg tgaatctgct ggaggattgg ggcccttgta ccgagcacgg ggaacaccat 1140
atcaggattc cacgaacacc agcacgagtg actggagggg tgttcctggt ggacaagaac 1200
ccccacaata ctaccgagag ccggctggtg gtcgatttca gtcagttttc aagaggcaac 1260
acaagggtgt catggcccaa attcgccgtc cctaatctgc agagtctgac taacctgctg 1320
tctagtaatc tgagctggct gtccctggac gtgtccgcag ccttttacca cctgcctctg 1380
catccagctg caatgcccca tctgctggtg gggtcaagcg gactgagtcg ctacgtcgcc 1440
cgactgtcct ctaactcacg catcattaat caccagcatg gcaccatgca gaacctgcac 1500
gatagctgtt cccggaatct gtacgtgtct ctgctgctgc tgtataagac attcggcaga 1560
aaactgcacc tgtacagcca tcctatcatt ctggggttta ggaagatccc aatgggagtg 1620
ggactgagcc ccttcctgct ggcacagttt acctccgcca tttgctctgt ggtccgccga 1680
gccttcccac actgtctggc tttttcctat atgaacaatg tggtcctggg cgccaaatcc 1740
gtgcagcatc tggagtctct gttcacagct gtcactaact ttctgctgag cctggggatc 1800
cacctgaacc caaataagac taaacgctgg gggtacagcc tgaatttcat gggatatgtg 1860
attggatcct gggggaccct gccacaggag cacatcgtgc agaagatcaa ggaatgcttt 1920
cggaagctgc ccgtcaacag acctatcgac tggaaagtgt gccagcggat tgtcggactg 1980
ctgggcttcg ccgctccctt tacccagtgc gggtacccag cactgatgcc cctgtatgcc 2040
tgtatccagt ctaagcaggc tttcaccttt agtcctacat acaaggcatt cctgtgcaaa 2100
cagtacctga acctgtatcc agtggcaagg cagcgacctg gactgtgcca ggtctttgca 2160
aatgccactc ctaccggctg ggggctggct atcggacatc agcgaatgcg gggcacattc 2220
gtggcccccc tgcctattca cactgctcag ctgctggcag cctgctttgc tagatctagg 2280
agtggagcaa agctgatcgg caccgacaat agtgtggtcc tgtcaagaaa atacacatcc 2340
ttcccatggc tgctgggatg tgctgcaaac tggattctga ggggcaccag cttcgtgtac 2400
gtcccctcag ccctgaatcc tgctgacgat ccatcccgcg ggcgactggg actgtaccga 2460
cctctgctga gactgccctt caggcctaca actggccgga catctctgta tgccgattca 2520
ccaagcgtgc cctcacacct gcctgacaga gtccactttg cttcacccct gcacgtcgct 2580
tggcggcctc caggaagcgg agctactaac ttcagcctgc tgaagcaggc tggagacgtg 2640
gaggagaacc ctggacctat ggctcgacct ctgtgtaccc tgctactcct gatggctacc 2700
ctggctggag ctctggccag cgacatcgac ccttacaagg agttcggcgc cagcgtggaa 2760
ctgctgtctt ttctgcccag tgatttcttt ccttccattc gagacctgct ggataccgcc 2820
tctgctctgt atcgggaagc cctggagagc ccagaacact gctccccaca ccataccgct 2880
ctgcgacagg caatcctgtg ctggggggag ctgatgaacc tggccacatg ggtgggatcg 2940
aatctggagg accccgcttc acgggaactg gtggtcagct acgtgaacgt caatatgggc 3000
ctgaaaatcc gccagctgct gtggttccat attagctgcc tgacttttgg acgagagacc 3060
gtgctggaat acctggtgtc cttcggcgtc tggattcgca ctccccctgc ttatcgacca 3120
cccaacgcac caattctgtc caccctgccc gagaccacag tggtccgtcg ccgttaagcc 3180
cctctccctc ccccccccct aacgttactg gccgaagccg cttggaataa ggccggtgtg 3240
cgtttgtcta tatgttattt tccaccatat tgccgtcttt tggcaatgtg agggcccgga 3300
aacctggccc tgtcttcttg acgagcattc ctaggggtct ttcccctctc gccaaaggaa 3360
tgcaaggtct gttgaatgtc gtgaaggaag cagttcctct ggaagcttct tgaagacaaa 3420
caacgtctgt agcgaccctt tgcaggcagc ggaacccccc acctggcgac aggtgcctct 3480
gcggccaaaa gccacgtgta taagatacac ctgcaaaggc ggcacaaccc cagtgccacg 3540
ttgtgagttg gatagttgtg gaaagagtca aatggctctc ctcaagcgta ttcaacaagg 3600
ggctgaagga tgcccagaag gtaccccatt gtatgggatc tgatctgggg cctcggtgca 3660
catgctttac atgtgtttag tcgaggttaa aaaacgtcta ggccccccga accacgggga 3720
cgtggttttc ctttgaaaaa cacgatgata atatggccac aaccatgcag tggaactcaa 3780
ctactttcca tcagaccctt caggacccta gagtgcgcgg gctgtacttt cctgctgggg 3840
gaagcagtag cgggaccgtt aatccagtac ctacgaccgc ctctcccata tcttctatct 3900
ttagtaggac tggtgaccct gctcccaaca tggagaatat cacctccggg tttctgggcc 3960
cactcctggt ccttcaggcc ggattcttcc tgctgactcg aatcctcacc ataccccaga 4020
gcctggacag ctggtggaca agcctgaatt ttctgggagg aactcctgta tgcctgggac 4080
aaaattcaca gtcccctaca agtaaccatt caccgacaag ttgtcctccc atctgtcccg 4140
gatacaggtg gatgtgcctg cgaaggttca tcatcttcct cttcatcctc ttgctttgcc 4200
ttattttcct cctggttctt ctggactatc agggcatgct gcctgtgtgc ccactgatac 4260
caggatctag tactaccagc acaggcccgt gtaagacctg tacaattcca gcacaaggga 4320
ctagtatgtt cccctcctgc tgttgtacta agccaagcga cggtaattgc acgtgtatcc 4380
caatcccgtc ctcctgggcg tttgccaagt acctctggga atgggcctca gtcagatttt 4440
catggcttag tcttttggtg ccgttcgtgc agtggtttgt gggactctct ccgactgtgt 4500
ggctcagcgt gatctggatg atgtggtact ggggcccttc cctttacaac atactgtctc 4560
cattccttcc cctgctgcca atcttctttt gcctgtgggt ctatattggg tccggagcga 4620
ctaacttttc cctgctgaaa caagcgggtg acgtcgaaga gaatccggga cctatggcta 4680
ggcccctgtg tacacttttg ctcctgatgg ccaccctcgc tggagctctg gcaagcggtg 4740
gatggagctc aaagccgcgg aaagggatgg gtactaacct gtccgtacca aatcccctgg 4800
gattttttcc agaccaccaa ctcgatcctg cttttggcgc aaattccaac aatcccgact 4860
gggactttaa ccctaacaag gaccactggc ctgatgccaa caaggtgggg gcaggagcct 4920
ttggtcccgg cttcacccca ccccatggag gtcttttggg atggtcacca caggcccagg 4980
gcatcctgac cactgtccct gctgctccac cgccagcttc tactaatcga cagagcggga 5040
ggcagccgac ccccctgagt ccccccctgc gggataccca ccctcaggca 5090
<210> 36
<211> 5250
<212> DNA
<213> Artificial Sequence
<220>
<223> Pol-2A-Core coding sequence -IRES (EV71)-PreS2.S-2A-preS1 coding
sequence
<400> 36
atggctcgac ctctgtgtac cctgctactc ctgatggcta ccctggctgg agctctggcc 60
agcatgcccc tgtcttacca gcactttaga aagcttctgc tgctggacga tgaagccggg 120
cctctggagg aagagctgcc aaggctggca gacgaggggc tgaaccggag agtggccgaa 180
gatctgaatc tgggaaacct gaacgtgagc atcccttgga ctcataaagt cggcaacttc 240
accgggctgt acagctccac agtgcctgtc ttcaatccag agtggcagac accatccttt 300
cccaacattc acctgcagga ggacatcatt aatagatgcg aacagttcgt gggacctctg 360
acagtcaacg aaaagaggcg cctgaaactg atcatgcctg ccaggtttta cccaaatgtg 420
actaagtatc tgccactgga taagggcatc aagccttact atccagagca cctggtgaac 480
cattacttcc agactagaca ctatctgcat accctgtgga aggccggaat cctgtacaaa 540
cgagaaacta cccggagtgc ttcattttgt ggctccccat attcttggga acaggagctg 600
cagcatggca ggctggtgtt ccagaccagc aaacgccacg gggatgagtc cttttgcagc 660
cagtctagtg gcatcctgag cagatccccc gtggggcctt gtattcagtc tcagctgcgg 720
aagagtagac tgggactgca gccacagcag ggacacctgg cacgacggca gcagggaagg 780
tctggcagta tccgggctag agtgcatccc acaactagaa ggaccttcgg cgtcgagcca 840
tcaggaagcg gccacatcga caacagcgca tcaagctcct ctagttgcct gcatcagtca 900
gccgtgagaa aggccgctta cagccacctg tccacatcta aaaggcactc aagctccggg 960
catgctgtgg agctgcacaa catccctcca aattctgcac gcagtcagtc agaaggaccc 1020
gtgttcagct gctggtggct gcagtttcgg aactcaaagc cttgcagcga ctattgtctg 1080
agccatattg tgaatctgct ggaggattgg ggcccttgta ccgagcacgg ggaacaccat 1140
atcaggattc cacgaacacc agcacgagtg actggagggg tgttcctggt ggacaagaac 1200
ccccacaata ctaccgagag ccggctggtg gtcgatttca gtcagttttc aagaggcaac 1260
acaagggtgt catggcccaa attcgccgtc cctaatctgc agagtctgac taacctgctg 1320
tctagtaatc tgagctggct gtccctggac gtgtccgcag ccttttacca cctgcctctg 1380
catccagctg caatgcccca tctgctggtg gggtcaagcg gactgagtcg ctacgtcgcc 1440
cgactgtcct ctaactcacg catcattaat caccagcatg gcaccatgca gaacctgcac 1500
gatagctgtt cccggaatct gtacgtgtct ctgctgctgc tgtataagac attcggcaga 1560
aaactgcacc tgtacagcca tcctatcatt ctggggttta ggaagatccc aatgggagtg 1620
ggactgagcc ccttcctgct ggcacagttt acctccgcca tttgctctgt ggtccgccga 1680
gccttcccac actgtctggc tttttcctat atgaacaatg tggtcctggg cgccaaatcc 1740
gtgcagcatc tggagtctct gttcacagct gtcactaact ttctgctgag cctggggatc 1800
cacctgaacc caaataagac taaacgctgg gggtacagcc tgaatttcat gggatatgtg 1860
attggatcct gggggaccct gccacaggag cacatcgtgc agaagatcaa ggaatgcttt 1920
cggaagctgc ccgtcaacag acctatcgac tggaaagtgt gccagcggat tgtcggactg 1980
ctgggcttcg ccgctccctt tacccagtgc gggtacccag cactgatgcc cctgtatgcc 2040
tgtatccagt ctaagcaggc tttcaccttt agtcctacat acaaggcatt cctgtgcaaa 2100
cagtacctga acctgtatcc agtggcaagg cagcgacctg gactgtgcca ggtctttgca 2160
aatgccactc ctaccggctg ggggctggct atcggacatc agcgaatgcg gggcacattc 2220
gtggcccccc tgcctattca cactgctcag ctgctggcag cctgctttgc tagatctagg 2280
agtggagcaa agctgatcgg caccgacaat agtgtggtcc tgtcaagaaa atacacatcc 2340
ttcccatggc tgctgggatg tgctgcaaac tggattctga ggggcaccag cttcgtgtac 2400
gtcccctcag ccctgaatcc tgctgacgat ccatcccgcg ggcgactggg actgtaccga 2460
cctctgctga gactgccctt caggcctaca actggccgga catctctgta tgccgattca 2520
ccaagcgtgc cctcacacct gcctgacaga gtccactttg cttcacccct gcacgtcgct 2580
tggcggcctc caggaagcgg agctactaac ttcagcctgc tgaagcaggc tggagacgtg 2640
gaggagaacc ctggacctat ggctcgacct ctgtgtaccc tgctactcct gatggctacc 2700
ctggctggag ctctggccag cgacatcgac ccttacaagg agttcggcgc cagcgtggaa 2760
ctgctgtctt ttctgcccag tgatttcttt ccttccattc gagacctgct ggataccgcc 2820
tctgctctgt atcgggaagc cctggagagc ccagaacact gctccccaca ccataccgct 2880
ctgcgacagg caatcctgtg ctggggggag ctgatgaacc tggccacatg ggtgggatcg 2940
aatctggagg accccgcttc acgggaactg gtggtcagct acgtgaacgt caatatgggc 3000
ctgaaaatcc gccagctgct gtggttccat attagctgcc tgacttttgg acgagagacc 3060
gtgctggaat acctggtgtc cttcggcgtc tggattcgca ctccccctgc ttatcgacca 3120
cccaacgcac caattctgtc caccctgccc gagaccacag tggtccgtcg ccgttaatta 3180
aaacagctgt gggttgttcc cacccacagg gcccactggg cgctagcact ctgattttac 3240
gaaatccttg tgcgcctgtt ttatatccct tccctaattc gaaacgtaga agcaatgcgc 3300
accactgatc aatagtaggc gtaacgcgcc agttacgtca tgatcaagca tatctgttcc 3360
cccggactga gtatcaatag actgcttacg cggttgaagg agaaaacgtt cgttatccgg 3420
ctaactactt cgagaagccc agtaacacca tggaagctgc agggtgtttc gctcagcact 3480
tcccccgtgt agatcaggtc gatgagccac tgcaatcccc acaggtgact gtggcagtgg 3540
ctgcgttggc ggcctgccta tggggagacc cataggacgc tctaatgtgg acatggtgcg 3600
aagagcctat tgagctagtt agtagtcctc cggcccctga atgcggctaa tcctaactgc 3660
ggagcacatg ccttcaaccc agagggtagt gtgtcgtaac gggcaactct gcagcggaac 3720
cgactacttt gggtgtccgt gtttcttttt tattcttata ttggctgctt atggtgacaa 3780
ttacagaatt gttaccatat agctattgga ttggccatcc ggtgtgtaat agagctgtta 3840
tatacctatt tgttggcttt gtaccactaa ctttaaaatc tataactacc ctcaacttta 3900
tattaaccct caatacagtt gaccatgcag tggaactcaa ctactttcca tcagaccctt 3960
caggacccta gagtgcgcgg gctgtacttt cctgctgggg gaagcagtag cgggaccgtt 4020
aatccagtac ctacgaccgc ctctcccata tcttctatct ttagtaggac tggtgaccct 4080
gctcccaaca tggagaatat cacctccggg tttctgggcc cactcctggt ccttcaggcc 4140
ggattcttcc tgctgactcg aatcctcacc ataccccaga gcctggacag ctggtggaca 4200
agcctgaatt ttctgggagg aactcctgta tgcctgggac aaaattcaca gtcccctaca 4260
agtaaccatt caccgacaag ttgtcctccc atctgtcccg gatacaggtg gatgtgcctg 4320
cgaaggttca tcatcttcct cttcatcctc ttgctttgcc ttattttcct cctggttctt 4380
ctggactatc agggcatgct gcctgtgtgc ccactgatac caggatctag tactaccagc 4440
acaggcccgt gtaagacctg tacaattcca gcacaaggga ctagtatgtt cccctcctgc 4500
tgttgtacta agccaagcga cggtaattgc acgtgtatcc caatcccgtc ctcctgggcg 4560
tttgccaagt acctctggga atgggcctca gtcagatttt catggcttag tcttttggtg 4620
ccgttcgtgc agtggtttgt gggactctct ccgactgtgt ggctcagcgt gatctggatg 4680
atgtggtact ggggcccttc cctttacaac atactgtctc cattccttcc cctgctgcca 4740
atcttctttt gcctgtgggt ctatattggg tccggagcga ctaacttttc cctgctgaaa 4800
caagcgggtg acgtcgaaga gaatccggga cctatggcta ggcccctgtg tacacttttg 4860
ctcctgatgg ccaccctcgc tggagctctg gcaagcggtg gatggagctc aaagccgcgg 4920
aaagggatgg gtactaacct gtccgtacca aatcccctgg gattttttcc agaccaccaa 4980
ctcgatcctg cttttggcgc aaattccaac aatcccgact gggactttaa ccctaacaag 5040
gaccactggc ctgatgccaa caaggtgggg gcaggagcct ttggtcccgg cttcacccca 5100
ccccatggag gtcttttggg atggtcacca caggcccagg gcatcctgac cactgtccct 5160
gctgctccac cgccagcttc tactaatcga cagagcggga ggcagccgac ccccctgagt 5220
ccccccctgc gggataccca ccctcaggca 5250
<210> 37
<211> 5090
<212> DNA
<213> Artificial Sequence
<220>
<223> PreS2.S-2A-preS1 coding sequence -IRES (EMCV)-Pol-2A-Core coding
sequence
<400> 37
atgcagtgga actcaactac tttccatcag acccttcagg accctagagt gcgcgggctg 60
tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac gaccgcctct 120
cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga gaatatcacc 180
tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct gactcgaatc 240
ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct gggaggaact 300
cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc gacaagttgt 360
cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat cttcctcttc 420
atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg catgctgcct 480
gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa gacctgtaca 540
attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc aagcgacggt 600
aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct ctgggaatgg 660
gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg gtttgtggga 720
ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg cccttccctt 780
tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct gtgggtctat 840
attggaagcg gagctactaa cttcagcctg ctgaagcagg ctggagacgt ggaggagaac 900
cctggaccta tggctaggcc cctgtgtaca cttttgctcc tgatggccac cctcgctgga 960
gctctggcaa gcggtggatg gagctcaaag ccgcggaaag ggatgggtac taacctgtcc 1020
gtaccaaatc ccctgggatt ttttccagac caccaactcg atcctgcttt tggcgcaaat 1080
tccaacaatc ccgactggga ctttaaccct aacaaggacc actggcctga tgccaacaag 1140
gtgggggcag gagcctttgg tcccggcttc accccacccc atggaggtct tttgggatgg 1200
tcaccacagg cccagggcat cctgaccact gtccctgctg ctccaccgcc agcttctact 1260
aatcgacaga gcgggaggca gccgaccccc ctgagtcccc ccctgcggga tacccaccct 1320
caggcataag cccctctccc tccccccccc ctaacgttac tggccgaagc cgcttggaat 1380
aaggccggtg tgcgtttgtc tatatgttat tttccaccat attgccgtct tttggcaatg 1440
tgagggcccg gaaacctggc cctgtcttct tgacgagcat tcctaggggt ctttcccctc 1500
tcgccaaagg aatgcaaggt ctgttgaatg tcgtgaagga agcagttcct ctggaagctt 1560
cttgaagaca aacaacgtct gtagcgaccc tttgcaggca gcggaacccc ccacctggcg 1620
acaggtgcct ctgcggccaa aagccacgtg tataagatac acctgcaaag gcggcacaac 1680
cccagtgcca cgttgtgagt tggatagttg tggaaagagt caaatggctc tcctcaagcg 1740
tattcaacaa ggggctgaag gatgcccaga aggtacccca ttgtatggga tctgatctgg 1800
ggcctcggtg cacatgcttt acatgtgttt agtcgaggtt aaaaaacgtc taggcccccc 1860
gaaccacggg gacgtggttt tcctttgaaa aacacgatga taatatggcc acaaccatgg 1920
ctcgacctct gtgtaccctg ctactcctga tggctaccct ggctggagct ctggccagca 1980
tgcccctgtc ttaccagcac tttagaaagc ttctgctgct ggacgatgaa gccgggcctc 2040
tggaggaaga gctgccaagg ctggcagacg aggggctgaa ccggagagtg gccgaagatc 2100
tgaatctggg aaacctgaac gtgagcatcc cttggactca taaagtcggc aacttcaccg 2160
ggctgtacag ctccacagtg cctgtcttca atccagagtg gcagacacca tcctttccca 2220
acattcacct gcaggaggac atcattaata gatgcgaaca gttcgtggga cctctgacag 2280
tcaacgaaaa gaggcgcctg aaactgatca tgcctgccag gttttaccca aatgtgacta 2340
agtatctgcc actggataag ggcatcaagc cttactatcc agagcacctg gtgaaccatt 2400
acttccagac tagacactat ctgcataccc tgtggaaggc cggaatcctg tacaaacgag 2460
aaactacccg gagtgcttca ttttgtggct ccccatattc ttgggaacag gagctgcagc 2520
atggcaggct ggtgttccag accagcaaac gccacgggga tgagtccttt tgcagccagt 2580
ctagtggcat cctgagcaga tcccccgtgg ggccttgtat tcagtctcag ctgcggaaga 2640
gtagactggg actgcagcca cagcagggac acctggcacg acggcagcag ggaaggtctg 2700
gcagtatccg ggctagagtg catcccacaa ctagaaggac cttcggcgtc gagccatcag 2760
gaagcggcca catcgacaac agcgcatcaa gctcctctag ttgcctgcat cagtcagccg 2820
tgagaaaggc cgcttacagc cacctgtcca catctaaaag gcactcaagc tccgggcatg 2880
ctgtggagct gcacaacatc cctccaaatt ctgcacgcag tcagtcagaa ggacccgtgt 2940
tcagctgctg gtggctgcag tttcggaact caaagccttg cagcgactat tgtctgagcc 3000
atattgtgaa tctgctggag gattggggcc cttgtaccga gcacggggaa caccatatca 3060
ggattccacg aacaccagca cgagtgactg gaggggtgtt cctggtggac aagaaccccc 3120
acaatactac cgagagccgg ctggtggtcg atttcagtca gttttcaaga ggcaacacaa 3180
gggtgtcatg gcccaaattc gccgtcccta atctgcagag tctgactaac ctgctgtcta 3240
gtaatctgag ctggctgtcc ctggacgtgt ccgcagcctt ttaccacctg cctctgcatc 3300
cagctgcaat gccccatctg ctggtggggt caagcggact gagtcgctac gtcgcccgac 3360
tgtcctctaa ctcacgcatc attaatcacc agcatggcac catgcagaac ctgcacgata 3420
gctgttcccg gaatctgtac gtgtctctgc tgctgctgta taagacattc ggcagaaaac 3480
tgcacctgta cagccatcct atcattctgg ggtttaggaa gatcccaatg ggagtgggac 3540
tgagcccctt cctgctggca cagtttacct ccgccatttg ctctgtggtc cgccgagcct 3600
tcccacactg tctggctttt tcctatatga acaatgtggt cctgggcgcc aaatccgtgc 3660
agcatctgga gtctctgttc acagctgtca ctaactttct gctgagcctg gggatccacc 3720
tgaacccaaa taagactaaa cgctgggggt acagcctgaa tttcatggga tatgtgattg 3780
gatcctgggg gaccctgcca caggagcaca tcgtgcagaa gatcaaggaa tgctttcgga 3840
agctgcccgt caacagacct atcgactgga aagtgtgcca gcggattgtc ggactgctgg 3900
gcttcgccgc tccctttacc cagtgcgggt acccagcact gatgcccctg tatgcctgta 3960
tccagtctaa gcaggctttc acctttagtc ctacatacaa ggcattcctg tgcaaacagt 4020
acctgaacct gtatccagtg gcaaggcagc gacctggact gtgccaggtc tttgcaaatg 4080
ccactcctac cggctggggg ctggctatcg gacatcagcg aatgcggggc acattcgtgg 4140
cccccctgcc tattcacact gctcagctgc tggcagcctg ctttgctaga tctaggagtg 4200
gagcaaagct gatcggcacc gacaatagtg tggtcctgtc aagaaaatac acatccttcc 4260
catggctgct gggatgtgct gcaaactgga ttctgagggg caccagcttc gtgtacgtcc 4320
cctcagccct gaatcctgct gacgatccat cccgcgggcg actgggactg taccgacctc 4380
tgctgagact gcccttcagg cctacaactg gccggacatc tctgtatgcc gattcaccaa 4440
gcgtgccctc acacctgcct gacagagtcc actttgcttc acccctgcac gtcgcttggc 4500
ggcctccagg gtccggagcg actaactttt ccctgctgaa acaagcgggt gacgtcgaag 4560
agaatccggg acctatggct cgacctctgt gtaccctgct actcctgatg gctaccctgg 4620
ctggagctct ggccagcgac atcgaccctt acaaggagtt cggcgccagc gtggaactgc 4680
tgtcttttct gcccagtgat ttctttcctt ccattcgaga cctgctggat accgcctctg 4740
ctctgtatcg ggaagccctg gagagcccag aacactgctc cccacaccat accgctctgc 4800
gacaggcaat cctgtgctgg ggggagctga tgaacctggc cacatgggtg ggatcgaatc 4860
tggaggaccc cgcttcacgg gaactggtgg tcagctacgt gaacgtcaat atgggcctga 4920
aaatccgcca gctgctgtgg ttccatatta gctgcctgac ttttggacga gagaccgtgc 4980
tggaatacct ggtgtccttc ggcgtctgga ttcgcactcc ccctgcttat cgaccaccca 5040
acgcaccaat tctgtccacc ctgcccgaga ccacagtggt ccgtcgccgt 5090
<210> 38
<211> 5250
<212> DNA
<213> Artificial Sequence
<220>
<223> PreS2.S-2A-preS1 coding sequence -IRES (EV71)-Pol-2A-Core coding
sequence
<400> 38
atgcagtgga actcaactac tttccatcag acccttcagg accctagagt gcgcgggctg 60
tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac gaccgcctct 120
cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga gaatatcacc 180
tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct gactcgaatc 240
ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct gggaggaact 300
cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc gacaagttgt 360
cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat cttcctcttc 420
atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg catgctgcct 480
gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa gacctgtaca 540
attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc aagcgacggt 600
aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct ctgggaatgg 660
gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg gtttgtggga 720
ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg cccttccctt 780
tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct gtgggtctat 840
attggaagcg gagctactaa cttcagcctg ctgaagcagg ctggagacgt ggaggagaac 900
cctggaccta tggctaggcc cctgtgtaca cttttgctcc tgatggccac cctcgctgga 960
gctctggcaa gcggtggatg gagctcaaag ccgcggaaag ggatgggtac taacctgtcc 1020
gtaccaaatc ccctgggatt ttttccagac caccaactcg atcctgcttt tggcgcaaat 1080
tccaacaatc ccgactggga ctttaaccct aacaaggacc actggcctga tgccaacaag 1140
gtgggggcag gagcctttgg tcccggcttc accccacccc atggaggtct tttgggatgg 1200
tcaccacagg cccagggcat cctgaccact gtccctgctg ctccaccgcc agcttctact 1260
aatcgacaga gcgggaggca gccgaccccc ctgagtcccc ccctgcggga tacccaccct 1320
caggcataat taaaacagct gtgggttgtt cccacccaca gggcccactg ggcgctagca 1380
ctctgatttt acgaaatcct tgtgcgcctg ttttatatcc cttccctaat tcgaaacgta 1440
gaagcaatgc gcaccactga tcaatagtag gcgtaacgcg ccagttacgt catgatcaag 1500
catatctgtt cccccggact gagtatcaat agactgctta cgcggttgaa ggagaaaacg 1560
ttcgttatcc ggctaactac ttcgagaagc ccagtaacac catggaagct gcagggtgtt 1620
tcgctcagca cttcccccgt gtagatcagg tcgatgagcc actgcaatcc ccacaggtga 1680
ctgtggcagt ggctgcgttg gcggcctgcc tatggggaga cccataggac gctctaatgt 1740
ggacatggtg cgaagagcct attgagctag ttagtagtcc tccggcccct gaatgcggct 1800
aatcctaact gcggagcaca tgccttcaac ccagagggta gtgtgtcgta acgggcaact 1860
ctgcagcgga accgactact ttgggtgtcc gtgtttcttt tttattctta tattggctgc 1920
ttatggtgac aattacagaa ttgttaccat atagctattg gattggccat ccggtgtgta 1980
atagagctgt tatataccta tttgttggct ttgtaccact aactttaaaa tctataacta 2040
ccctcaactt tatattaacc ctcaatacag ttgaccatgg ctcgacctct gtgtaccctg 2100
ctactcctga tggctaccct ggctggagct ctggccagca tgcccctgtc ttaccagcac 2160
tttagaaagc ttctgctgct ggacgatgaa gccgggcctc tggaggaaga gctgccaagg 2220
ctggcagacg aggggctgaa ccggagagtg gccgaagatc tgaatctggg aaacctgaac 2280
gtgagcatcc cttggactca taaagtcggc aacttcaccg ggctgtacag ctccacagtg 2340
cctgtcttca atccagagtg gcagacacca tcctttccca acattcacct gcaggaggac 2400
atcattaata gatgcgaaca gttcgtggga cctctgacag tcaacgaaaa gaggcgcctg 2460
aaactgatca tgcctgccag gttttaccca aatgtgacta agtatctgcc actggataag 2520
ggcatcaagc cttactatcc agagcacctg gtgaaccatt acttccagac tagacactat 2580
ctgcataccc tgtggaaggc cggaatcctg tacaaacgag aaactacccg gagtgcttca 2640
ttttgtggct ccccatattc ttgggaacag gagctgcagc atggcaggct ggtgttccag 2700
accagcaaac gccacgggga tgagtccttt tgcagccagt ctagtggcat cctgagcaga 2760
tcccccgtgg ggccttgtat tcagtctcag ctgcggaaga gtagactggg actgcagcca 2820
cagcagggac acctggcacg acggcagcag ggaaggtctg gcagtatccg ggctagagtg 2880
catcccacaa ctagaaggac cttcggcgtc gagccatcag gaagcggcca catcgacaac 2940
agcgcatcaa gctcctctag ttgcctgcat cagtcagccg tgagaaaggc cgcttacagc 3000
cacctgtcca catctaaaag gcactcaagc tccgggcatg ctgtggagct gcacaacatc 3060
cctccaaatt ctgcacgcag tcagtcagaa ggacccgtgt tcagctgctg gtggctgcag 3120
tttcggaact caaagccttg cagcgactat tgtctgagcc atattgtgaa tctgctggag 3180
gattggggcc cttgtaccga gcacggggaa caccatatca ggattccacg aacaccagca 3240
cgagtgactg gaggggtgtt cctggtggac aagaaccccc acaatactac cgagagccgg 3300
ctggtggtcg atttcagtca gttttcaaga ggcaacacaa gggtgtcatg gcccaaattc 3360
gccgtcccta atctgcagag tctgactaac ctgctgtcta gtaatctgag ctggctgtcc 3420
ctggacgtgt ccgcagcctt ttaccacctg cctctgcatc cagctgcaat gccccatctg 3480
ctggtggggt caagcggact gagtcgctac gtcgcccgac tgtcctctaa ctcacgcatc 3540
attaatcacc agcatggcac catgcagaac ctgcacgata gctgttcccg gaatctgtac 3600
gtgtctctgc tgctgctgta taagacattc ggcagaaaac tgcacctgta cagccatcct 3660
atcattctgg ggtttaggaa gatcccaatg ggagtgggac tgagcccctt cctgctggca 3720
cagtttacct ccgccatttg ctctgtggtc cgccgagcct tcccacactg tctggctttt 3780
tcctatatga acaatgtggt cctgggcgcc aaatccgtgc agcatctgga gtctctgttc 3840
acagctgtca ctaactttct gctgagcctg gggatccacc tgaacccaaa taagactaaa 3900
cgctgggggt acagcctgaa tttcatggga tatgtgattg gatcctgggg gaccctgcca 3960
caggagcaca tcgtgcagaa gatcaaggaa tgctttcgga agctgcccgt caacagacct 4020
atcgactgga aagtgtgcca gcggattgtc ggactgctgg gcttcgccgc tccctttacc 4080
cagtgcgggt acccagcact gatgcccctg tatgcctgta tccagtctaa gcaggctttc 4140
acctttagtc ctacatacaa ggcattcctg tgcaaacagt acctgaacct gtatccagtg 4200
gcaaggcagc gacctggact gtgccaggtc tttgcaaatg ccactcctac cggctggggg 4260
ctggctatcg gacatcagcg aatgcggggc acattcgtgg cccccctgcc tattcacact 4320
gctcagctgc tggcagcctg ctttgctaga tctaggagtg gagcaaagct gatcggcacc 4380
gacaatagtg tggtcctgtc aagaaaatac acatccttcc catggctgct gggatgtgct 4440
gcaaactgga ttctgagggg caccagcttc gtgtacgtcc cctcagccct gaatcctgct 4500
gacgatccat cccgcgggcg actgggactg taccgacctc tgctgagact gcccttcagg 4560
cctacaactg gccggacatc tctgtatgcc gattcaccaa gcgtgccctc acacctgcct 4620
gacagagtcc actttgcttc acccctgcac gtcgcttggc ggcctccagg gtccggagcg 4680
actaactttt ccctgctgaa acaagcgggt gacgtcgaag agaatccggg acctatggct 4740
cgacctctgt gtaccctgct actcctgatg gctaccctgg ctggagctct ggccagcgac 4800
atcgaccctt acaaggagtt cggcgccagc gtggaactgc tgtcttttct gcccagtgat 4860
ttctttcctt ccattcgaga cctgctggat accgcctctg ctctgtatcg ggaagccctg 4920
gagagcccag aacactgctc cccacaccat accgctctgc gacaggcaat cctgtgctgg 4980
ggggagctga tgaacctggc cacatgggtg ggatcgaatc tggaggaccc cgcttcacgg 5040
gaactggtgg tcagctacgt gaacgtcaat atgggcctga aaatccgcca gctgctgtgg 5100
ttccatatta gctgcctgac ttttggacga gagaccgtgc tggaatacct ggtgtccttc 5160
ggcgtctgga ttcgcactcc ccctgcttat cgaccaccca acgcaccaat tctgtccacc 5220
ctgcccgaga ccacagtggt ccgtcgccgt 5250
<210> 39
<211> 4083
<212> DNA
<213> Artificial Sequence
<220>
<223> Core-2A-Pol-2A-PreS2.S coding sequence
<400> 39
atggctcgac ctctgtgtac cctgctactc ctgatggcta ccctggctgg agctctggcc 60
agcgacatcg acccttacaa ggagttcggc gccagcgtgg aactgctgtc ttttctgccc 120
agtgatttct ttccttccat tcgagacctg ctggataccg cctctgctct gtatcgggaa 180
gccctggaga gcccagaaca ctgctcccca caccataccg ctctgcgaca ggcaatcctg 240
tgctgggggg agctgatgaa cctggccaca tgggtgggat cgaatctgga ggaccccgct 300
tcacgggaac tggtggtcag ctacgtgaac gtcaatatgg gcctgaaaat ccgccagctg 360
ctgtggttcc atattagctg cctgactttt ggacgagaga ccgtgctgga atacctggtg 420
tccttcggcg tctggattcg cactccccct gcttatcgac cacccaacgc accaattctg 480
tccaccctgc ccgagaccac agtggtccgt cgccgtggaa gcggagctac taacttcagc 540
ctgctgaagc aggctggaga cgtggaggag aaccctggac ctatggctcg acctctgtgt 600
accctgctac tcctgatggc taccctggct ggagctctgg ccagcatgcc cctgtcttac 660
cagcacttta gaaagcttct gctgctggac gatgaagccg ggcctctgga ggaagagctg 720
ccaaggctgg cagacgaggg gctgaaccgg agagtggccg aagatctgaa tctgggaaac 780
ctgaacgtga gcatcccttg gactcataaa gtcggcaact tcaccgggct gtacagctcc 840
acagtgcctg tcttcaatcc agagtggcag acaccatcct ttcccaacat tcacctgcag 900
gaggacatca ttaatagatg cgaacagttc gtgggacctc tgacagtcaa cgaaaagagg 960
cgcctgaaac tgatcatgcc tgccaggttt tacccaaatg tgactaagta tctgccactg 1020
gataagggca tcaagcctta ctatccagag cacctggtga accattactt ccagactaga 1080
cactatctgc ataccctgtg gaaggccgga atcctgtaca aacgagaaac tacccggagt 1140
gcttcatttt gtggctcccc atattcttgg gaacaggagc tgcagcatgg caggctggtg 1200
ttccagacca gcaaacgcca cggggatgag tccttttgca gccagtctag tggcatcctg 1260
agcagatccc ccgtggggcc ttgtattcag tctcagctgc ggaagagtag actgggactg 1320
cagccacagc agggacacct ggcacgacgg cagcagggaa ggtctggcag tatccgggct 1380
agagtgcatc ccacaactag aaggaccttc ggcgtcgagc catcaggaag cggccacatc 1440
gacaacagcg catcaagctc ctctagttgc ctgcatcagt cagccgtgag aaaggccgct 1500
tacagccacc tgtccacatc taaaaggcac tcaagctccg ggcatgctgt ggagctgcac 1560
aacatccctc caaattctgc acgcagtcag tcagaaggac ccgtgttcag ctgctggtgg 1620
ctgcagtttc ggaactcaaa gccttgcagc gactattgtc tgagccatat tgtgaatctg 1680
ctggaggatt ggggcccttg taccgagcac ggggaacacc atatcaggat tccacgaaca 1740
ccagcacgag tgactggagg ggtgttcctg gtggacaaga acccccacaa tactaccgag 1800
agccggctgg tggtcgattt cagtcagttt tcaagaggca acacaagggt gtcatggccc 1860
aaattcgccg tccctaatct gcagagtctg actaacctgc tgtctagtaa tctgagctgg 1920
ctgtccctgg acgtgtccgc agccttttac cacctgcctc tgcatccagc tgcaatgccc 1980
catctgctgg tggggtcaag cggactgagt cgctacgtcg cccgactgtc ctctaactca 2040
cgcatcatta atcaccagca tggcaccatg cagaacctgc acgatagctg ttcccggaat 2100
ctgtacgtgt ctctgctgct gctgtataag acattcggca gaaaactgca cctgtacagc 2160
catcctatca ttctggggtt taggaagatc ccaatgggag tgggactgag ccccttcctg 2220
ctggcacagt ttacctccgc catttgctct gtggtccgcc gagccttccc acactgtctg 2280
gctttttcct atatgaacaa tgtggtcctg ggcgccaaat ccgtgcagca tctggagtct 2340
ctgttcacag ctgtcactaa ctttctgctg agcctgggga tccacctgaa cccaaataag 2400
actaaacgct gggggtacag cctgaatttc atgggatatg tgattggatc ctgggggacc 2460
ctgccacagg agcacatcgt gcagaagatc aaggaatgct ttcggaagct gcccgtcaac 2520
agacctatcg actggaaagt gtgccagcgg attgtcggac tgctgggctt cgccgctccc 2580
tttacccagt gcgggtaccc agcactgatg cccctgtatg cctgtatcca gtctaagcag 2640
gctttcacct ttagtcctac atacaaggca ttcctgtgca aacagtacct gaacctgtat 2700
ccagtggcaa ggcagcgacc tggactgtgc caggtctttg caaatgccac tcctaccggc 2760
tgggggctgg ctatcggaca tcagcgaatg cggggcacat tcgtggcccc cctgcctatt 2820
cacactgctc agctgctggc agcctgcttt gctagatcta ggagtggagc aaagctgatc 2880
ggcaccgaca atagtgtggt cctgtcaaga aaatacacat ccttcccatg gctgctggga 2940
tgtgctgcaa actggattct gaggggcacc agcttcgtgt acgtcccctc agccctgaat 3000
cctgctgacg atccatcccg cgggcgactg ggactgtacc gacctctgct gagactgccc 3060
ttcaggccta caactggccg gacatctctg tatgccgatt caccaagcgt gccctcacac 3120
ctgcctgaca gagtccactt tgcttcaccc ctgcacgtcg cttggcggcc tccaggatca 3180
ggcgctacga attttagcct tctgaagcaa gcgggagacg ttgaagaaaa cccagggcct 3240
atgcagtgga actcaactac tttccatcag acccttcagg accctagagt gcgcgggctg 3300
tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac gaccgcctct 3360
cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga gaatatcacc 3420
tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct gactcgaatc 3480
ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct gggaggaact 3540
cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc gacaagttgt 3600
cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat cttcctcttc 3660
atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg catgctgcct 3720
gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa gacctgtaca 3780
attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc aagcgacggt 3840
aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct ctgggaatgg 3900
gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg gtttgtggga 3960
ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg cccttccctt 4020
tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct gtgggtctat 4080
att 4083
<210> 40
<211> 4083
<212> DNA
<213> Artificial Sequence
<220>
<223> Pol-2A-Core-2A-PreS2.S coding sequence
<400> 40
atggctcgac ctctgtgtac cctgctactc ctgatggcta ccctggctgg agctctggcc 60
agcatgcccc tgtcttacca gcactttaga aagcttctgc tgctggacga tgaagccggg 120
cctctggagg aagagctgcc aaggctggca gacgaggggc tgaaccggag agtggccgaa 180
gatctgaatc tgggaaacct gaacgtgagc atcccttgga ctcataaagt cggcaacttc 240
accgggctgt acagctccac agtgcctgtc ttcaatccag agtggcagac accatccttt 300
cccaacattc acctgcagga ggacatcatt aatagatgcg aacagttcgt gggacctctg 360
acagtcaacg aaaagaggcg cctgaaactg atcatgcctg ccaggtttta cccaaatgtg 420
actaagtatc tgccactgga taagggcatc aagccttact atccagagca cctggtgaac 480
cattacttcc agactagaca ctatctgcat accctgtgga aggccggaat cctgtacaaa 540
cgagaaacta cccggagtgc ttcattttgt ggctccccat attcttggga acaggagctg 600
cagcatggca ggctggtgtt ccagaccagc aaacgccacg gggatgagtc cttttgcagc 660
cagtctagtg gcatcctgag cagatccccc gtggggcctt gtattcagtc tcagctgcgg 720
aagagtagac tgggactgca gccacagcag ggacacctgg cacgacggca gcagggaagg 780
tctggcagta tccgggctag agtgcatccc acaactagaa ggaccttcgg cgtcgagcca 840
tcaggaagcg gccacatcga caacagcgca tcaagctcct ctagttgcct gcatcagtca 900
gccgtgagaa aggccgctta cagccacctg tccacatcta aaaggcactc aagctccggg 960
catgctgtgg agctgcacaa catccctcca aattctgcac gcagtcagtc agaaggaccc 1020
gtgttcagct gctggtggct gcagtttcgg aactcaaagc cttgcagcga ctattgtctg 1080
agccatattg tgaatctgct ggaggattgg ggcccttgta ccgagcacgg ggaacaccat 1140
atcaggattc cacgaacacc agcacgagtg actggagggg tgttcctggt ggacaagaac 1200
ccccacaata ctaccgagag ccggctggtg gtcgatttca gtcagttttc aagaggcaac 1260
acaagggtgt catggcccaa attcgccgtc cctaatctgc agagtctgac taacctgctg 1320
tctagtaatc tgagctggct gtccctggac gtgtccgcag ccttttacca cctgcctctg 1380
catccagctg caatgcccca tctgctggtg gggtcaagcg gactgagtcg ctacgtcgcc 1440
cgactgtcct ctaactcacg catcattaat caccagcatg gcaccatgca gaacctgcac 1500
gatagctgtt cccggaatct gtacgtgtct ctgctgctgc tgtataagac attcggcaga 1560
aaactgcacc tgtacagcca tcctatcatt ctggggttta ggaagatccc aatgggagtg 1620
ggactgagcc ccttcctgct ggcacagttt acctccgcca tttgctctgt ggtccgccga 1680
gccttcccac actgtctggc tttttcctat atgaacaatg tggtcctggg cgccaaatcc 1740
gtgcagcatc tggagtctct gttcacagct gtcactaact ttctgctgag cctggggatc 1800
cacctgaacc caaataagac taaacgctgg gggtacagcc tgaatttcat gggatatgtg 1860
attggatcct gggggaccct gccacaggag cacatcgtgc agaagatcaa ggaatgcttt 1920
cggaagctgc ccgtcaacag acctatcgac tggaaagtgt gccagcggat tgtcggactg 1980
ctgggcttcg ccgctccctt tacccagtgc gggtacccag cactgatgcc cctgtatgcc 2040
tgtatccagt ctaagcaggc tttcaccttt agtcctacat acaaggcatt cctgtgcaaa 2100
cagtacctga acctgtatcc agtggcaagg cagcgacctg gactgtgcca ggtctttgca 2160
aatgccactc ctaccggctg ggggctggct atcggacatc agcgaatgcg gggcacattc 2220
gtggcccccc tgcctattca cactgctcag ctgctggcag cctgctttgc tagatctagg 2280
agtggagcaa agctgatcgg caccgacaat agtgtggtcc tgtcaagaaa atacacatcc 2340
ttcccatggc tgctgggatg tgctgcaaac tggattctga ggggcaccag cttcgtgtac 2400
gtcccctcag ccctgaatcc tgctgacgat ccatcccgcg ggcgactggg actgtaccga 2460
cctctgctga gactgccctt caggcctaca actggccgga catctctgta tgccgattca 2520
ccaagcgtgc cctcacacct gcctgacaga gtccactttg cttcacccct gcacgtcgct 2580
tggcggcctc caggaagcgg agctactaac ttcagcctgc tgaagcaggc tggagacgtg 2640
gaggagaacc ctggacctat ggctcgacct ctgtgtaccc tgctactcct gatggctacc 2700
ctggctggag ctctggccag cgacatcgac ccttacaagg agttcggcgc cagcgtggaa 2760
ctgctgtctt ttctgcccag tgatttcttt ccttccattc gagacctgct ggataccgcc 2820
tctgctctgt atcgggaagc cctggagagc ccagaacact gctccccaca ccataccgct 2880
ctgcgacagg caatcctgtg ctggggggag ctgatgaacc tggccacatg ggtgggatcg 2940
aatctggagg accccgcttc acgggaactg gtggtcagct acgtgaacgt caatatgggc 3000
ctgaaaatcc gccagctgct gtggttccat attagctgcc tgacttttgg acgagagacc 3060
gtgctggaat acctggtgtc cttcggcgtc tggattcgca ctccccctgc ttatcgacca 3120
cccaacgcac caattctgtc caccctgccc gagaccacag tggtccgtcg ccgtggatca 3180
ggcgctacga attttagcct tctgaagcaa gcgggagacg ttgaagaaaa cccagggcct 3240
atgcagtgga actcaactac tttccatcag acccttcagg accctagagt gcgcgggctg 3300
tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac gaccgcctct 3360
cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga gaatatcacc 3420
tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct gactcgaatc 3480
ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct gggaggaact 3540
cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc gacaagttgt 3600
cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat cttcctcttc 3660
atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg catgctgcct 3720
gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa gacctgtaca 3780
attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc aagcgacggt 3840
aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct ctgggaatgg 3900
gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg gtttgtggga 3960
ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg cccttccctt 4020
tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct gtgggtctat 4080
att 4083
<210> 41
<211> 4083
<212> DNA
<213> Artificial Sequence
<220>
<223> PreS2.S-2A-Core-2A-Pol coding sequence
<400> 41
atgcagtgga actcaactac tttccatcag acccttcagg accctagagt gcgcgggctg 60
tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac gaccgcctct 120
cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga gaatatcacc 180
tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct gactcgaatc 240
ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct gggaggaact 300
cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc gacaagttgt 360
cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat cttcctcttc 420
atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg catgctgcct 480
gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa gacctgtaca 540
attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc aagcgacggt 600
aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct ctgggaatgg 660
gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg gtttgtggga 720
ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg cccttccctt 780
tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct gtgggtctat 840
attggaagcg gagctactaa cttcagcctg ctgaagcagg ctggagacgt ggaggagaac 900
cctggaccta tggctcgacc tctgtgtacc ctgctactcc tgatggctac cctggctgga 960
gctctggcca gcgacatcga cccttacaag gagttcggcg ccagcgtgga actgctgtct 1020
tttctgccca gtgatttctt tccttccatt cgagacctgc tggataccgc ctctgctctg 1080
tatcgggaag ccctggagag cccagaacac tgctccccac accataccgc tctgcgacag 1140
gcaatcctgt gctgggggga gctgatgaac ctggccacat gggtgggatc gaatctggag 1200
gaccccgctt cacgggaact ggtggtcagc tacgtgaacg tcaatatggg cctgaaaatc 1260
cgccagctgc tgtggttcca tattagctgc ctgacttttg gacgagagac cgtgctggaa 1320
tacctggtgt ccttcggcgt ctggattcgc actccccctg cttatcgacc acccaacgca 1380
ccaattctgt ccaccctgcc cgagaccaca gtggtccgtc gccgtggatc aggcgctacg 1440
aattttagcc ttctgaagca agcgggagac gttgaagaaa acccagggcc tatggctcga 1500
cctctgtgta ccctgctact cctgatggct accctggctg gagctctggc cagcatgccc 1560
ctgtcttacc agcactttag aaagcttctg ctgctggacg atgaagccgg gcctctggag 1620
gaagagctgc caaggctggc agacgagggg ctgaaccgga gagtggccga agatctgaat 1680
ctgggaaacc tgaacgtgag catcccttgg actcataaag tcggcaactt caccgggctg 1740
tacagctcca cagtgcctgt cttcaatcca gagtggcaga caccatcctt tcccaacatt 1800
cacctgcagg aggacatcat taatagatgc gaacagttcg tgggacctct gacagtcaac 1860
gaaaagaggc gcctgaaact gatcatgcct gccaggtttt acccaaatgt gactaagtat 1920
ctgccactgg ataagggcat caagccttac tatccagagc acctggtgaa ccattacttc 1980
cagactagac actatctgca taccctgtgg aaggccggaa tcctgtacaa acgagaaact 2040
acccggagtg cttcattttg tggctcccca tattcttggg aacaggagct gcagcatggc 2100
aggctggtgt tccagaccag caaacgccac ggggatgagt ccttttgcag ccagtctagt 2160
ggcatcctga gcagatcccc cgtggggcct tgtattcagt ctcagctgcg gaagagtaga 2220
ctgggactgc agccacagca gggacacctg gcacgacggc agcagggaag gtctggcagt 2280
atccgggcta gagtgcatcc cacaactaga aggaccttcg gcgtcgagcc atcaggaagc 2340
ggccacatcg acaacagcgc atcaagctcc tctagttgcc tgcatcagtc agccgtgaga 2400
aaggccgctt acagccacct gtccacatct aaaaggcact caagctccgg gcatgctgtg 2460
gagctgcaca acatccctcc aaattctgca cgcagtcagt cagaaggacc cgtgttcagc 2520
tgctggtggc tgcagtttcg gaactcaaag ccttgcagcg actattgtct gagccatatt 2580
gtgaatctgc tggaggattg gggcccttgt accgagcacg gggaacacca tatcaggatt 2640
ccacgaacac cagcacgagt gactggaggg gtgttcctgg tggacaagaa cccccacaat 2700
actaccgaga gccggctggt ggtcgatttc agtcagtttt caagaggcaa cacaagggtg 2760
tcatggccca aattcgccgt ccctaatctg cagagtctga ctaacctgct gtctagtaat 2820
ctgagctggc tgtccctgga cgtgtccgca gccttttacc acctgcctct gcatccagct 2880
gcaatgcccc atctgctggt ggggtcaagc ggactgagtc gctacgtcgc ccgactgtcc 2940
tctaactcac gcatcattaa tcaccagcat ggcaccatgc agaacctgca cgatagctgt 3000
tcccggaatc tgtacgtgtc tctgctgctg ctgtataaga cattcggcag aaaactgcac 3060
ctgtacagcc atcctatcat tctggggttt aggaagatcc caatgggagt gggactgagc 3120
cccttcctgc tggcacagtt tacctccgcc atttgctctg tggtccgccg agccttccca 3180
cactgtctgg ctttttccta tatgaacaat gtggtcctgg gcgccaaatc cgtgcagcat 3240
ctggagtctc tgttcacagc tgtcactaac tttctgctga gcctggggat ccacctgaac 3300
ccaaataaga ctaaacgctg ggggtacagc ctgaatttca tgggatatgt gattggatcc 3360
tgggggaccc tgccacagga gcacatcgtg cagaagatca aggaatgctt tcggaagctg 3420
cccgtcaaca gacctatcga ctggaaagtg tgccagcgga ttgtcggact gctgggcttc 3480
gccgctccct ttacccagtg cgggtaccca gcactgatgc ccctgtatgc ctgtatccag 3540
tctaagcagg ctttcacctt tagtcctaca tacaaggcat tcctgtgcaa acagtacctg 3600
aacctgtatc cagtggcaag gcagcgacct ggactgtgcc aggtctttgc aaatgccact 3660
cctaccggct gggggctggc tatcggacat cagcgaatgc ggggcacatt cgtggccccc 3720
ctgcctattc acactgctca gctgctggca gcctgctttg ctagatctag gagtggagca 3780
aagctgatcg gcaccgacaa tagtgtggtc ctgtcaagaa aatacacatc cttcccatgg 3840
ctgctgggat gtgctgcaaa ctggattctg aggggcacca gcttcgtgta cgtcccctca 3900
gccctgaatc ctgctgacga tccatcccgc gggcgactgg gactgtaccg acctctgctg 3960
agactgccct tcaggcctac aactggccgg acatctctgt atgccgattc accaagcgtg 4020
ccctcacacc tgcctgacag agtccacttt gcttcacccc tgcacgtcgc ttggcggcct 4080
cca 4083
<210> 42
<211> 4083
<212> DNA
<213> Artificial Sequence
<220>
<223> PreS2.S-2A-Pol-2A-Core coding sequence
<400> 42
atgcagtgga actcaactac tttccatcag acccttcagg accctagagt gcgcgggctg 60
tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac gaccgcctct 120
cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga gaatatcacc 180
tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct gactcgaatc 240
ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct gggaggaact 300
cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc gacaagttgt 360
cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat cttcctcttc 420
atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg catgctgcct 480
gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa gacctgtaca 540
attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc aagcgacggt 600
aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct ctgggaatgg 660
gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg gtttgtggga 720
ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg cccttccctt 780
tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct gtgggtctat 840
attggaagcg gagctactaa cttcagcctg ctgaagcagg ctggagacgt ggaggagaac 900
cctggaccta tggctcgacc tctgtgtacc ctgctactcc tgatggctac cctggctgga 960
gctctggcca gcatgcccct gtcttaccag cactttagaa agcttctgct gctggacgat 1020
gaagccgggc ctctggagga agagctgcca aggctggcag acgaggggct gaaccggaga 1080
gtggccgaag atctgaatct gggaaacctg aacgtgagca tcccttggac tcataaagtc 1140
ggcaacttca ccgggctgta cagctccaca gtgcctgtct tcaatccaga gtggcagaca 1200
ccatcctttc ccaacattca cctgcaggag gacatcatta atagatgcga acagttcgtg 1260
ggacctctga cagtcaacga aaagaggcgc ctgaaactga tcatgcctgc caggttttac 1320
ccaaatgtga ctaagtatct gccactggat aagggcatca agccttacta tccagagcac 1380
ctggtgaacc attacttcca gactagacac tatctgcata ccctgtggaa ggccggaatc 1440
ctgtacaaac gagaaactac ccggagtgct tcattttgtg gctccccata ttcttgggaa 1500
caggagctgc agcatggcag gctggtgttc cagaccagca aacgccacgg ggatgagtcc 1560
ttttgcagcc agtctagtgg catcctgagc agatcccccg tggggccttg tattcagtct 1620
cagctgcgga agagtagact gggactgcag ccacagcagg gacacctggc acgacggcag 1680
cagggaaggt ctggcagtat ccgggctaga gtgcatccca caactagaag gaccttcggc 1740
gtcgagccat caggaagcgg ccacatcgac aacagcgcat caagctcctc tagttgcctg 1800
catcagtcag ccgtgagaaa ggccgcttac agccacctgt ccacatctaa aaggcactca 1860
agctccgggc atgctgtgga gctgcacaac atccctccaa attctgcacg cagtcagtca 1920
gaaggacccg tgttcagctg ctggtggctg cagtttcgga actcaaagcc ttgcagcgac 1980
tattgtctga gccatattgt gaatctgctg gaggattggg gcccttgtac cgagcacggg 2040
gaacaccata tcaggattcc acgaacacca gcacgagtga ctggaggggt gttcctggtg 2100
gacaagaacc cccacaatac taccgagagc cggctggtgg tcgatttcag tcagttttca 2160
agaggcaaca caagggtgtc atggcccaaa ttcgccgtcc ctaatctgca gagtctgact 2220
aacctgctgt ctagtaatct gagctggctg tccctggacg tgtccgcagc cttttaccac 2280
ctgcctctgc atccagctgc aatgccccat ctgctggtgg ggtcaagcgg actgagtcgc 2340
tacgtcgccc gactgtcctc taactcacgc atcattaatc accagcatgg caccatgcag 2400
aacctgcacg atagctgttc ccggaatctg tacgtgtctc tgctgctgct gtataagaca 2460
ttcggcagaa aactgcacct gtacagccat cctatcattc tggggtttag gaagatccca 2520
atgggagtgg gactgagccc cttcctgctg gcacagttta cctccgccat ttgctctgtg 2580
gtccgccgag ccttcccaca ctgtctggct ttttcctata tgaacaatgt ggtcctgggc 2640
gccaaatccg tgcagcatct ggagtctctg ttcacagctg tcactaactt tctgctgagc 2700
ctggggatcc acctgaaccc aaataagact aaacgctggg ggtacagcct gaatttcatg 2760
ggatatgtga ttggatcctg ggggaccctg ccacaggagc acatcgtgca gaagatcaag 2820
gaatgctttc ggaagctgcc cgtcaacaga cctatcgact ggaaagtgtg ccagcggatt 2880
gtcggactgc tgggcttcgc cgctcccttt acccagtgcg ggtacccagc actgatgccc 2940
ctgtatgcct gtatccagtc taagcaggct ttcaccttta gtcctacata caaggcattc 3000
ctgtgcaaac agtacctgaa cctgtatcca gtggcaaggc agcgacctgg actgtgccag 3060
gtctttgcaa atgccactcc taccggctgg gggctggcta tcggacatca gcgaatgcgg 3120
ggcacattcg tggcccccct gcctattcac actgctcagc tgctggcagc ctgctttgct 3180
agatctagga gtggagcaaa gctgatcggc accgacaata gtgtggtcct gtcaagaaaa 3240
tacacatcct tcccatggct gctgggatgt gctgcaaact ggattctgag gggcaccagc 3300
ttcgtgtacg tcccctcagc cctgaatcct gctgacgatc catcccgcgg gcgactggga 3360
ctgtaccgac ctctgctgag actgcccttc aggcctacaa ctggccggac atctctgtat 3420
gccgattcac caagcgtgcc ctcacacctg cctgacagag tccactttgc ttcacccctg 3480
cacgtcgctt ggcggcctcc aggatcaggc gctacgaatt ttagccttct gaagcaagcg 3540
ggagacgttg aagaaaaccc agggcctatg gctcgacctc tgtgtaccct gctactcctg 3600
atggctaccc tggctggagc tctggccagc gacatcgacc cttacaagga gttcggcgcc 3660
agcgtggaac tgctgtcttt tctgcccagt gatttctttc cttccattcg agacctgctg 3720
gataccgcct ctgctctgta tcgggaagcc ctggagagcc cagaacactg ctccccacac 3780
cataccgctc tgcgacaggc aatcctgtgc tggggggagc tgatgaacct ggccacatgg 3840
gtgggatcga atctggagga ccccgcttca cgggaactgg tggtcagcta cgtgaacgtc 3900
aatatgggcc tgaaaatccg ccagctgctg tggttccata ttagctgcct gacttttgga 3960
cgagagaccg tgctggaata cctggtgtcc ttcggcgtct ggattcgcac tccccctgct 4020
tatcgaccac ccaacgcacc aattctgtcc accctgcccg agaccacagt ggtccgtcgc 4080
cgt 4083
<210> 43
<211> 4607
<212> DNA
<213> Artificial Sequence
<220>
<223> Core-2A-Pol coding sequence -IRES (EMCV)-PreS2.S coding sequence
<400> 43
atggctcgac ctctgtgtac cctgctactc ctgatggcta ccctggctgg agctctggcc 60
agcgacatcg acccttacaa ggagttcggc gccagcgtgg aactgctgtc ttttctgccc 120
agtgatttct ttccttccat tcgagacctg ctggataccg cctctgctct gtatcgggaa 180
gccctggaga gcccagaaca ctgctcccca caccataccg ctctgcgaca ggcaatcctg 240
tgctgggggg agctgatgaa cctggccaca tgggtgggat cgaatctgga ggaccccgct 300
tcacgggaac tggtggtcag ctacgtgaac gtcaatatgg gcctgaaaat ccgccagctg 360
ctgtggttcc atattagctg cctgactttt ggacgagaga ccgtgctgga atacctggtg 420
tccttcggcg tctggattcg cactccccct gcttatcgac cacccaacgc accaattctg 480
tccaccctgc ccgagaccac agtggtccgt cgccgtggaa gcggagctac taacttcagc 540
ctgctgaagc aggctggaga cgtggaggag aaccctggac ctatggctcg acctctgtgt 600
accctgctac tcctgatggc taccctggct ggagctctgg ccagcatgcc cctgtcttac 660
cagcacttta gaaagcttct gctgctggac gatgaagccg ggcctctgga ggaagagctg 720
ccaaggctgg cagacgaggg gctgaaccgg agagtggccg aagatctgaa tctgggaaac 780
ctgaacgtga gcatcccttg gactcataaa gtcggcaact tcaccgggct gtacagctcc 840
acagtgcctg tcttcaatcc agagtggcag acaccatcct ttcccaacat tcacctgcag 900
gaggacatca ttaatagatg cgaacagttc gtgggacctc tgacagtcaa cgaaaagagg 960
cgcctgaaac tgatcatgcc tgccaggttt tacccaaatg tgactaagta tctgccactg 1020
gataagggca tcaagcctta ctatccagag cacctggtga accattactt ccagactaga 1080
cactatctgc ataccctgtg gaaggccgga atcctgtaca aacgagaaac tacccggagt 1140
gcttcatttt gtggctcccc atattcttgg gaacaggagc tgcagcatgg caggctggtg 1200
ttccagacca gcaaacgcca cggggatgag tccttttgca gccagtctag tggcatcctg 1260
agcagatccc ccgtggggcc ttgtattcag tctcagctgc ggaagagtag actgggactg 1320
cagccacagc agggacacct ggcacgacgg cagcagggaa ggtctggcag tatccgggct 1380
agagtgcatc ccacaactag aaggaccttc ggcgtcgagc catcaggaag cggccacatc 1440
gacaacagcg catcaagctc ctctagttgc ctgcatcagt cagccgtgag aaaggccgct 1500
tacagccacc tgtccacatc taaaaggcac tcaagctccg ggcatgctgt ggagctgcac 1560
aacatccctc caaattctgc acgcagtcag tcagaaggac ccgtgttcag ctgctggtgg 1620
ctgcagtttc ggaactcaaa gccttgcagc gactattgtc tgagccatat tgtgaatctg 1680
ctggaggatt ggggcccttg taccgagcac ggggaacacc atatcaggat tccacgaaca 1740
ccagcacgag tgactggagg ggtgttcctg gtggacaaga acccccacaa tactaccgag 1800
agccggctgg tggtcgattt cagtcagttt tcaagaggca acacaagggt gtcatggccc 1860
aaattcgccg tccctaatct gcagagtctg actaacctgc tgtctagtaa tctgagctgg 1920
ctgtccctgg acgtgtccgc agccttttac cacctgcctc tgcatccagc tgcaatgccc 1980
catctgctgg tggggtcaag cggactgagt cgctacgtcg cccgactgtc ctctaactca 2040
cgcatcatta atcaccagca tggcaccatg cagaacctgc acgatagctg ttcccggaat 2100
ctgtacgtgt ctctgctgct gctgtataag acattcggca gaaaactgca cctgtacagc 2160
catcctatca ttctggggtt taggaagatc ccaatgggag tgggactgag ccccttcctg 2220
ctggcacagt ttacctccgc catttgctct gtggtccgcc gagccttccc acactgtctg 2280
gctttttcct atatgaacaa tgtggtcctg ggcgccaaat ccgtgcagca tctggagtct 2340
ctgttcacag ctgtcactaa ctttctgctg agcctgggga tccacctgaa cccaaataag 2400
actaaacgct gggggtacag cctgaatttc atgggatatg tgattggatc ctgggggacc 2460
ctgccacagg agcacatcgt gcagaagatc aaggaatgct ttcggaagct gcccgtcaac 2520
agacctatcg actggaaagt gtgccagcgg attgtcggac tgctgggctt cgccgctccc 2580
tttacccagt gcgggtaccc agcactgatg cccctgtatg cctgtatcca gtctaagcag 2640
gctttcacct ttagtcctac atacaaggca ttcctgtgca aacagtacct gaacctgtat 2700
ccagtggcaa ggcagcgacc tggactgtgc caggtctttg caaatgccac tcctaccggc 2760
tgggggctgg ctatcggaca tcagcgaatg cggggcacat tcgtggcccc cctgcctatt 2820
cacactgctc agctgctggc agcctgcttt gctagatcta ggagtggagc aaagctgatc 2880
ggcaccgaca atagtgtggt cctgtcaaga aaatacacat ccttcccatg gctgctggga 2940
tgtgctgcaa actggattct gaggggcacc agcttcgtgt acgtcccctc agccctgaat 3000
cctgctgacg atccatcccg cgggcgactg ggactgtacc gacctctgct gagactgccc 3060
ttcaggccta caactggccg gacatctctg tatgccgatt caccaagcgt gccctcacac 3120
ctgcctgaca gagtccactt tgcttcaccc ctgcacgtcg cttggcggcc tccataagcc 3180
cctctccctc ccccccccct aacgttactg gccgaagccg cttggaataa ggccggtgtg 3240
cgtttgtcta tatgttattt tccaccatat tgccgtcttt tggcaatgtg agggcccgga 3300
aacctggccc tgtcttcttg acgagcattc ctaggggtct ttcccctctc gccaaaggaa 3360
tgcaaggtct gttgaatgtc gtgaaggaag cagttcctct ggaagcttct tgaagacaaa 3420
caacgtctgt agcgaccctt tgcaggcagc ggaacccccc acctggcgac aggtgcctct 3480
gcggccaaaa gccacgtgta taagatacac ctgcaaaggc ggcacaaccc cagtgccacg 3540
ttgtgagttg gatagttgtg gaaagagtca aatggctctc ctcaagcgta ttcaacaagg 3600
ggctgaagga tgcccagaag gtaccccatt gtatgggatc tgatctgggg cctcggtgca 3660
catgctttac atgtgtttag tcgaggttaa aaaacgtcta ggccccccga accacgggga 3720
cgtggttttc ctttgaaaaa cacgatgata atatggccac aaccatgcag tggaactcaa 3780
ctactttcca tcagaccctt caggacccta gagtgcgcgg gctgtacttt cctgctgggg 3840
gaagcagtag cgggaccgtt aatccagtac ctacgaccgc ctctcccata tcttctatct 3900
ttagtaggac tggtgaccct gctcccaaca tggagaatat cacctccggg tttctgggcc 3960
cactcctggt ccttcaggcc ggattcttcc tgctgactcg aatcctcacc ataccccaga 4020
gcctggacag ctggtggaca agcctgaatt ttctgggagg aactcctgta tgcctgggac 4080
aaaattcaca gtcccctaca agtaaccatt caccgacaag ttgtcctccc atctgtcccg 4140
gatacaggtg gatgtgcctg cgaaggttca tcatcttcct cttcatcctc ttgctttgcc 4200
ttattttcct cctggttctt ctggactatc agggcatgct gcctgtgtgc ccactgatac 4260
caggatctag tactaccagc acaggcccgt gtaagacctg tacaattcca gcacaaggga 4320
ctagtatgtt cccctcctgc tgttgtacta agccaagcga cggtaattgc acgtgtatcc 4380
caatcccgtc ctcctgggcg tttgccaagt acctctggga atgggcctca gtcagatttt 4440
catggcttag tcttttggtg ccgttcgtgc agtggtttgt gggactctct ccgactgtgt 4500
ggctcagcgt gatctggatg atgtggtact ggggcccttc cctttacaac atactgtctc 4560
cattccttcc cctgctgcca atcttctttt gcctgtgggt ctatatt 4607
<210> 44
<211> 4607
<212> DNA
<213> Artificial Sequence
<220>
<223> PreS2.S coding sequence -IRES (EMCV)-Core-2A-Pol coding sequence
<400> 44
atgcagtgga actcaactac tttccatcag acccttcagg accctagagt gcgcgggctg 60
tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac gaccgcctct 120
cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga gaatatcacc 180
tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct gactcgaatc 240
ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct gggaggaact 300
cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc gacaagttgt 360
cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat cttcctcttc 420
atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg catgctgcct 480
gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa gacctgtaca 540
attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc aagcgacggt 600
aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct ctgggaatgg 660
gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg gtttgtggga 720
ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg cccttccctt 780
tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct gtgggtctat 840
atttaagccc ctctccctcc ccccccccta acgttactgg ccgaagccgc ttggaataag 900
gccggtgtgc gtttgtctat atgttatttt ccaccatatt gccgtctttt ggcaatgtga 960
gggcccggaa acctggccct gtcttcttga cgagcattcc taggggtctt tcccctctcg 1020
ccaaaggaat gcaaggtctg ttgaatgtcg tgaaggaagc agttcctctg gaagcttctt 1080
gaagacaaac aacgtctgta gcgacccttt gcaggcagcg gaacccccca cctggcgaca 1140
ggtgcctctg cggccaaaag ccacgtgtat aagatacacc tgcaaaggcg gcacaacccc 1200
agtgccacgt tgtgagttgg atagttgtgg aaagagtcaa atggctctcc tcaagcgtat 1260
tcaacaaggg gctgaaggat gcccagaagg taccccattg tatgggatct gatctggggc 1320
ctcggtgcac atgctttaca tgtgtttagt cgaggttaaa aaacgtctag gccccccgaa 1380
ccacggggac gtggttttcc tttgaaaaac acgatgataa tatggccaca accatggctc 1440
gacctctgtg taccctgcta ctcctgatgg ctaccctggc tggagctctg gccagcgaca 1500
tcgaccctta caaggagttc ggcgccagcg tggaactgct gtcttttctg cccagtgatt 1560
tctttccttc cattcgagac ctgctggata ccgcctctgc tctgtatcgg gaagccctgg 1620
agagcccaga acactgctcc ccacaccata ccgctctgcg acaggcaatc ctgtgctggg 1680
gggagctgat gaacctggcc acatgggtgg gatcgaatct ggaggacccc gcttcacggg 1740
aactggtggt cagctacgtg aacgtcaata tgggcctgaa aatccgccag ctgctgtggt 1800
tccatattag ctgcctgact tttggacgag agaccgtgct ggaatacctg gtgtccttcg 1860
gcgtctggat tcgcactccc cctgcttatc gaccacccaa cgcaccaatt ctgtccaccc 1920
tgcccgagac cacagtggtc cgtcgccgtg gatcaggcgc tacgaatttt agccttctga 1980
agcaagcggg agacgttgaa gaaaacccag ggcctatggc tcgacctctg tgtaccctgc 2040
tactcctgat ggctaccctg gctggagctc tggccagcat gcccctgtct taccagcact 2100
ttagaaagct tctgctgctg gacgatgaag ccgggcctct ggaggaagag ctgccaaggc 2160
tggcagacga ggggctgaac cggagagtgg ccgaagatct gaatctggga aacctgaacg 2220
tgagcatccc ttggactcat aaagtcggca acttcaccgg gctgtacagc tccacagtgc 2280
ctgtcttcaa tccagagtgg cagacaccat cctttcccaa cattcacctg caggaggaca 2340
tcattaatag atgcgaacag ttcgtgggac ctctgacagt caacgaaaag aggcgcctga 2400
aactgatcat gcctgccagg ttttacccaa atgtgactaa gtatctgcca ctggataagg 2460
gcatcaagcc ttactatcca gagcacctgg tgaaccatta cttccagact agacactatc 2520
tgcataccct gtggaaggcc ggaatcctgt acaaacgaga aactacccgg agtgcttcat 2580
tttgtggctc cccatattct tgggaacagg agctgcagca tggcaggctg gtgttccaga 2640
ccagcaaacg ccacggggat gagtcctttt gcagccagtc tagtggcatc ctgagcagat 2700
cccccgtggg gccttgtatt cagtctcagc tgcggaagag tagactggga ctgcagccac 2760
agcagggaca cctggcacga cggcagcagg gaaggtctgg cagtatccgg gctagagtgc 2820
atcccacaac tagaaggacc ttcggcgtcg agccatcagg aagcggccac atcgacaaca 2880
gcgcatcaag ctcctctagt tgcctgcatc agtcagccgt gagaaaggcc gcttacagcc 2940
acctgtccac atctaaaagg cactcaagct ccgggcatgc tgtggagctg cacaacatcc 3000
ctccaaattc tgcacgcagt cagtcagaag gacccgtgtt cagctgctgg tggctgcagt 3060
ttcggaactc aaagccttgc agcgactatt gtctgagcca tattgtgaat ctgctggagg 3120
attggggccc ttgtaccgag cacggggaac accatatcag gattccacga acaccagcac 3180
gagtgactgg aggggtgttc ctggtggaca agaaccccca caatactacc gagagccggc 3240
tggtggtcga tttcagtcag ttttcaagag gcaacacaag ggtgtcatgg cccaaattcg 3300
ccgtccctaa tctgcagagt ctgactaacc tgctgtctag taatctgagc tggctgtccc 3360
tggacgtgtc cgcagccttt taccacctgc ctctgcatcc agctgcaatg ccccatctgc 3420
tggtggggtc aagcggactg agtcgctacg tcgcccgact gtcctctaac tcacgcatca 3480
ttaatcacca gcatggcacc atgcagaacc tgcacgatag ctgttcccgg aatctgtacg 3540
tgtctctgct gctgctgtat aagacattcg gcagaaaact gcacctgtac agccatccta 3600
tcattctggg gtttaggaag atcccaatgg gagtgggact gagccccttc ctgctggcac 3660
agtttacctc cgccatttgc tctgtggtcc gccgagcctt cccacactgt ctggcttttt 3720
cctatatgaa caatgtggtc ctgggcgcca aatccgtgca gcatctggag tctctgttca 3780
cagctgtcac taactttctg ctgagcctgg ggatccacct gaacccaaat aagactaaac 3840
gctgggggta cagcctgaat ttcatgggat atgtgattgg atcctggggg accctgccac 3900
aggagcacat cgtgcagaag atcaaggaat gctttcggaa gctgcccgtc aacagaccta 3960
tcgactggaa agtgtgccag cggattgtcg gactgctggg cttcgccgct ccctttaccc 4020
agtgcgggta cccagcactg atgcccctgt atgcctgtat ccagtctaag caggctttca 4080
cctttagtcc tacatacaag gcattcctgt gcaaacagta cctgaacctg tatccagtgg 4140
caaggcagcg acctggactg tgccaggtct ttgcaaatgc cactcctacc ggctgggggc 4200
tggctatcgg acatcagcga atgcggggca cattcgtggc ccccctgcct attcacactg 4260
ctcagctgct ggcagcctgc tttgctagat ctaggagtgg agcaaagctg atcggcaccg 4320
acaatagtgt ggtcctgtca agaaaataca catccttccc atggctgctg ggatgtgctg 4380
caaactggat tctgaggggc accagcttcg tgtacgtccc ctcagccctg aatcctgctg 4440
acgatccatc ccgcgggcga ctgggactgt accgacctct gctgagactg cccttcaggc 4500
ctacaactgg ccggacatct ctgtatgccg attcaccaag cgtgccctca cacctgcctg 4560
acagagtcca ctttgcttca cccctgcacg tcgcttggcg gcctcca 4607
<210> 45
<211> 4767
<212> DNA
<213> Artificial Sequence
<220>
<223> Core-2A-Pol coding sequence -IRES (EV71)-PreS2.S coding sequence
<400> 45
atggctcgac ctctgtgtac cctgctactc ctgatggcta ccctggctgg agctctggcc 60
agcgacatcg acccttacaa ggagttcggc gccagcgtgg aactgctgtc ttttctgccc 120
agtgatttct ttccttccat tcgagacctg ctggataccg cctctgctct gtatcgggaa 180
gccctggaga gcccagaaca ctgctcccca caccataccg ctctgcgaca ggcaatcctg 240
tgctgggggg agctgatgaa cctggccaca tgggtgggat cgaatctgga ggaccccgct 300
tcacgggaac tggtggtcag ctacgtgaac gtcaatatgg gcctgaaaat ccgccagctg 360
ctgtggttcc atattagctg cctgactttt ggacgagaga ccgtgctgga atacctggtg 420
tccttcggcg tctggattcg cactccccct gcttatcgac cacccaacgc accaattctg 480
tccaccctgc ccgagaccac agtggtccgt cgccgtggaa gcggagctac taacttcagc 540
ctgctgaagc aggctggaga cgtggaggag aaccctggac ctatggctcg acctctgtgt 600
accctgctac tcctgatggc taccctggct ggagctctgg ccagcatgcc cctgtcttac 660
cagcacttta gaaagcttct gctgctggac gatgaagccg ggcctctgga ggaagagctg 720
ccaaggctgg cagacgaggg gctgaaccgg agagtggccg aagatctgaa tctgggaaac 780
ctgaacgtga gcatcccttg gactcataaa gtcggcaact tcaccgggct gtacagctcc 840
acagtgcctg tcttcaatcc agagtggcag acaccatcct ttcccaacat tcacctgcag 900
gaggacatca ttaatagatg cgaacagttc gtgggacctc tgacagtcaa cgaaaagagg 960
cgcctgaaac tgatcatgcc tgccaggttt tacccaaatg tgactaagta tctgccactg 1020
gataagggca tcaagcctta ctatccagag cacctggtga accattactt ccagactaga 1080
cactatctgc ataccctgtg gaaggccgga atcctgtaca aacgagaaac tacccggagt 1140
gcttcatttt gtggctcccc atattcttgg gaacaggagc tgcagcatgg caggctggtg 1200
ttccagacca gcaaacgcca cggggatgag tccttttgca gccagtctag tggcatcctg 1260
agcagatccc ccgtggggcc ttgtattcag tctcagctgc ggaagagtag actgggactg 1320
cagccacagc agggacacct ggcacgacgg cagcagggaa ggtctggcag tatccgggct 1380
agagtgcatc ccacaactag aaggaccttc ggcgtcgagc catcaggaag cggccacatc 1440
gacaacagcg catcaagctc ctctagttgc ctgcatcagt cagccgtgag aaaggccgct 1500
tacagccacc tgtccacatc taaaaggcac tcaagctccg ggcatgctgt ggagctgcac 1560
aacatccctc caaattctgc acgcagtcag tcagaaggac ccgtgttcag ctgctggtgg 1620
ctgcagtttc ggaactcaaa gccttgcagc gactattgtc tgagccatat tgtgaatctg 1680
ctggaggatt ggggcccttg taccgagcac ggggaacacc atatcaggat tccacgaaca 1740
ccagcacgag tgactggagg ggtgttcctg gtggacaaga acccccacaa tactaccgag 1800
agccggctgg tggtcgattt cagtcagttt tcaagaggca acacaagggt gtcatggccc 1860
aaattcgccg tccctaatct gcagagtctg actaacctgc tgtctagtaa tctgagctgg 1920
ctgtccctgg acgtgtccgc agccttttac cacctgcctc tgcatccagc tgcaatgccc 1980
catctgctgg tggggtcaag cggactgagt cgctacgtcg cccgactgtc ctctaactca 2040
cgcatcatta atcaccagca tggcaccatg cagaacctgc acgatagctg ttcccggaat 2100
ctgtacgtgt ctctgctgct gctgtataag acattcggca gaaaactgca cctgtacagc 2160
catcctatca ttctggggtt taggaagatc ccaatgggag tgggactgag ccccttcctg 2220
ctggcacagt ttacctccgc catttgctct gtggtccgcc gagccttccc acactgtctg 2280
gctttttcct atatgaacaa tgtggtcctg ggcgccaaat ccgtgcagca tctggagtct 2340
ctgttcacag ctgtcactaa ctttctgctg agcctgggga tccacctgaa cccaaataag 2400
actaaacgct gggggtacag cctgaatttc atgggatatg tgattggatc ctgggggacc 2460
ctgccacagg agcacatcgt gcagaagatc aaggaatgct ttcggaagct gcccgtcaac 2520
agacctatcg actggaaagt gtgccagcgg attgtcggac tgctgggctt cgccgctccc 2580
tttacccagt gcgggtaccc agcactgatg cccctgtatg cctgtatcca gtctaagcag 2640
gctttcacct ttagtcctac atacaaggca ttcctgtgca aacagtacct gaacctgtat 2700
ccagtggcaa ggcagcgacc tggactgtgc caggtctttg caaatgccac tcctaccggc 2760
tgggggctgg ctatcggaca tcagcgaatg cggggcacat tcgtggcccc cctgcctatt 2820
cacactgctc agctgctggc agcctgcttt gctagatcta ggagtggagc aaagctgatc 2880
ggcaccgaca atagtgtggt cctgtcaaga aaatacacat ccttcccatg gctgctggga 2940
tgtgctgcaa actggattct gaggggcacc agcttcgtgt acgtcccctc agccctgaat 3000
cctgctgacg atccatcccg cgggcgactg ggactgtacc gacctctgct gagactgccc 3060
ttcaggccta caactggccg gacatctctg tatgccgatt caccaagcgt gccctcacac 3120
ctgcctgaca gagtccactt tgcttcaccc ctgcacgtcg cttggcggcc tccataatta 3180
aaacagctgt gggttgttcc cacccacagg gcccactggg cgctagcact ctgattttac 3240
gaaatccttg tgcgcctgtt ttatatccct tccctaattc gaaacgtaga agcaatgcgc 3300
accactgatc aatagtaggc gtaacgcgcc agttacgtca tgatcaagca tatctgttcc 3360
cccggactga gtatcaatag actgcttacg cggttgaagg agaaaacgtt cgttatccgg 3420
ctaactactt cgagaagccc agtaacacca tggaagctgc agggtgtttc gctcagcact 3480
tcccccgtgt agatcaggtc gatgagccac tgcaatcccc acaggtgact gtggcagtgg 3540
ctgcgttggc ggcctgccta tggggagacc cataggacgc tctaatgtgg acatggtgcg 3600
aagagcctat tgagctagtt agtagtcctc cggcccctga atgcggctaa tcctaactgc 3660
ggagcacatg ccttcaaccc agagggtagt gtgtcgtaac gggcaactct gcagcggaac 3720
cgactacttt gggtgtccgt gtttcttttt tattcttata ttggctgctt atggtgacaa 3780
ttacagaatt gttaccatat agctattgga ttggccatcc ggtgtgtaat agagctgtta 3840
tatacctatt tgttggcttt gtaccactaa ctttaaaatc tataactacc ctcaacttta 3900
tattaaccct caatacagtt gaccatgcag tggaactcaa ctactttcca tcagaccctt 3960
caggacccta gagtgcgcgg gctgtacttt cctgctgggg gaagcagtag cgggaccgtt 4020
aatccagtac ctacgaccgc ctctcccata tcttctatct ttagtaggac tggtgaccct 4080
gctcccaaca tggagaatat cacctccggg tttctgggcc cactcctggt ccttcaggcc 4140
ggattcttcc tgctgactcg aatcctcacc ataccccaga gcctggacag ctggtggaca 4200
agcctgaatt ttctgggagg aactcctgta tgcctgggac aaaattcaca gtcccctaca 4260
agtaaccatt caccgacaag ttgtcctccc atctgtcccg gatacaggtg gatgtgcctg 4320
cgaaggttca tcatcttcct cttcatcctc ttgctttgcc ttattttcct cctggttctt 4380
ctggactatc agggcatgct gcctgtgtgc ccactgatac caggatctag tactaccagc 4440
acaggcccgt gtaagacctg tacaattcca gcacaaggga ctagtatgtt cccctcctgc 4500
tgttgtacta agccaagcga cggtaattgc acgtgtatcc caatcccgtc ctcctgggcg 4560
tttgccaagt acctctggga atgggcctca gtcagatttt catggcttag tcttttggtg 4620
ccgttcgtgc agtggtttgt gggactctct ccgactgtgt ggctcagcgt gatctggatg 4680
atgtggtact ggggcccttc cctttacaac atactgtctc cattccttcc cctgctgcca 4740
atcttctttt gcctgtgggt ctatatt 4767
<210> 46
<211> 4767
<212> DNA
<213> Artificial Sequence
<220>
<223> PreS2.S coding sequence -IRES (EV71)-Core-2A-Pol coding sequence
<400> 46
atgcagtgga actcaactac tttccatcag acccttcagg accctagagt gcgcgggctg 60
tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac gaccgcctct 120
cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga gaatatcacc 180
tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct gactcgaatc 240
ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct gggaggaact 300
cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc gacaagttgt 360
cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat cttcctcttc 420
atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg catgctgcct 480
gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa gacctgtaca 540
attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc aagcgacggt 600
aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct ctgggaatgg 660
gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg gtttgtggga 720
ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg cccttccctt 780
tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct gtgggtctat 840
atttaattaa aacagctgtg ggttgttccc acccacaggg cccactgggc gctagcactc 900
tgattttacg aaatccttgt gcgcctgttt tatatccctt ccctaattcg aaacgtagaa 960
gcaatgcgca ccactgatca atagtaggcg taacgcgcca gttacgtcat gatcaagcat 1020
atctgttccc ccggactgag tatcaataga ctgcttacgc ggttgaagga gaaaacgttc 1080
gttatccggc taactacttc gagaagccca gtaacaccat ggaagctgca gggtgtttcg 1140
ctcagcactt cccccgtgta gatcaggtcg atgagccact gcaatcccca caggtgactg 1200
tggcagtggc tgcgttggcg gcctgcctat ggggagaccc ataggacgct ctaatgtgga 1260
catggtgcga agagcctatt gagctagtta gtagtcctcc ggcccctgaa tgcggctaat 1320
cctaactgcg gagcacatgc cttcaaccca gagggtagtg tgtcgtaacg ggcaactctg 1380
cagcggaacc gactactttg ggtgtccgtg tttctttttt attcttatat tggctgctta 1440
tggtgacaat tacagaattg ttaccatata gctattggat tggccatccg gtgtgtaata 1500
gagctgttat atacctattt gttggctttg taccactaac tttaaaatct ataactaccc 1560
tcaactttat attaaccctc aatacagttg accatggctc gacctctgtg taccctgcta 1620
ctcctgatgg ctaccctggc tggagctctg gccagcgaca tcgaccctta caaggagttc 1680
ggcgccagcg tggaactgct gtcttttctg cccagtgatt tctttccttc cattcgagac 1740
ctgctggata ccgcctctgc tctgtatcgg gaagccctgg agagcccaga acactgctcc 1800
ccacaccata ccgctctgcg acaggcaatc ctgtgctggg gggagctgat gaacctggcc 1860
acatgggtgg gatcgaatct ggaggacccc gcttcacggg aactggtggt cagctacgtg 1920
aacgtcaata tgggcctgaa aatccgccag ctgctgtggt tccatattag ctgcctgact 1980
tttggacgag agaccgtgct ggaatacctg gtgtccttcg gcgtctggat tcgcactccc 2040
cctgcttatc gaccacccaa cgcaccaatt ctgtccaccc tgcccgagac cacagtggtc 2100
cgtcgccgtg gatcaggcgc tacgaatttt agccttctga agcaagcggg agacgttgaa 2160
gaaaacccag ggcctatggc tcgacctctg tgtaccctgc tactcctgat ggctaccctg 2220
gctggagctc tggccagcat gcccctgtct taccagcact ttagaaagct tctgctgctg 2280
gacgatgaag ccgggcctct ggaggaagag ctgccaaggc tggcagacga ggggctgaac 2340
cggagagtgg ccgaagatct gaatctggga aacctgaacg tgagcatccc ttggactcat 2400
aaagtcggca acttcaccgg gctgtacagc tccacagtgc ctgtcttcaa tccagagtgg 2460
cagacaccat cctttcccaa cattcacctg caggaggaca tcattaatag atgcgaacag 2520
ttcgtgggac ctctgacagt caacgaaaag aggcgcctga aactgatcat gcctgccagg 2580
ttttacccaa atgtgactaa gtatctgcca ctggataagg gcatcaagcc ttactatcca 2640
gagcacctgg tgaaccatta cttccagact agacactatc tgcataccct gtggaaggcc 2700
ggaatcctgt acaaacgaga aactacccgg agtgcttcat tttgtggctc cccatattct 2760
tgggaacagg agctgcagca tggcaggctg gtgttccaga ccagcaaacg ccacggggat 2820
gagtcctttt gcagccagtc tagtggcatc ctgagcagat cccccgtggg gccttgtatt 2880
cagtctcagc tgcggaagag tagactggga ctgcagccac agcagggaca cctggcacga 2940
cggcagcagg gaaggtctgg cagtatccgg gctagagtgc atcccacaac tagaaggacc 3000
ttcggcgtcg agccatcagg aagcggccac atcgacaaca gcgcatcaag ctcctctagt 3060
tgcctgcatc agtcagccgt gagaaaggcc gcttacagcc acctgtccac atctaaaagg 3120
cactcaagct ccgggcatgc tgtggagctg cacaacatcc ctccaaattc tgcacgcagt 3180
cagtcagaag gacccgtgtt cagctgctgg tggctgcagt ttcggaactc aaagccttgc 3240
agcgactatt gtctgagcca tattgtgaat ctgctggagg attggggccc ttgtaccgag 3300
cacggggaac accatatcag gattccacga acaccagcac gagtgactgg aggggtgttc 3360
ctggtggaca agaaccccca caatactacc gagagccggc tggtggtcga tttcagtcag 3420
ttttcaagag gcaacacaag ggtgtcatgg cccaaattcg ccgtccctaa tctgcagagt 3480
ctgactaacc tgctgtctag taatctgagc tggctgtccc tggacgtgtc cgcagccttt 3540
taccacctgc ctctgcatcc agctgcaatg ccccatctgc tggtggggtc aagcggactg 3600
agtcgctacg tcgcccgact gtcctctaac tcacgcatca ttaatcacca gcatggcacc 3660
atgcagaacc tgcacgatag ctgttcccgg aatctgtacg tgtctctgct gctgctgtat 3720
aagacattcg gcagaaaact gcacctgtac agccatccta tcattctggg gtttaggaag 3780
atcccaatgg gagtgggact gagccccttc ctgctggcac agtttacctc cgccatttgc 3840
tctgtggtcc gccgagcctt cccacactgt ctggcttttt cctatatgaa caatgtggtc 3900
ctgggcgcca aatccgtgca gcatctggag tctctgttca cagctgtcac taactttctg 3960
ctgagcctgg ggatccacct gaacccaaat aagactaaac gctgggggta cagcctgaat 4020
ttcatgggat atgtgattgg atcctggggg accctgccac aggagcacat cgtgcagaag 4080
atcaaggaat gctttcggaa gctgcccgtc aacagaccta tcgactggaa agtgtgccag 4140
cggattgtcg gactgctggg cttcgccgct ccctttaccc agtgcgggta cccagcactg 4200
atgcccctgt atgcctgtat ccagtctaag caggctttca cctttagtcc tacatacaag 4260
gcattcctgt gcaaacagta cctgaacctg tatccagtgg caaggcagcg acctggactg 4320
tgccaggtct ttgcaaatgc cactcctacc ggctgggggc tggctatcgg acatcagcga 4380
atgcggggca cattcgtggc ccccctgcct attcacactg ctcagctgct ggcagcctgc 4440
tttgctagat ctaggagtgg agcaaagctg atcggcaccg acaatagtgt ggtcctgtca 4500
agaaaataca catccttccc atggctgctg ggatgtgctg caaactggat tctgaggggc 4560
accagcttcg tgtacgtccc ctcagccctg aatcctgctg acgatccatc ccgcgggcga 4620
ctgggactgt accgacctct gctgagactg cccttcaggc ctacaactgg ccggacatct 4680
ctgtatgccg attcaccaag cgtgccctca cacctgcctg acagagtcca ctttgcttca 4740
cccctgcacg tcgcttggcg gcctcca 4767
<210> 47
<211> 4607
<212> DNA
<213> Artificial Sequence
<220>
<223> Pol-2A-Core coding sequence -IRES (EMCV)-PreS2.S coding sequence
<400> 47
atggctcgac ctctgtgtac cctgctactc ctgatggcta ccctggctgg agctctggcc 60
agcatgcccc tgtcttacca gcactttaga aagcttctgc tgctggacga tgaagccggg 120
cctctggagg aagagctgcc aaggctggca gacgaggggc tgaaccggag agtggccgaa 180
gatctgaatc tgggaaacct gaacgtgagc atcccttgga ctcataaagt cggcaacttc 240
accgggctgt acagctccac agtgcctgtc ttcaatccag agtggcagac accatccttt 300
cccaacattc acctgcagga ggacatcatt aatagatgcg aacagttcgt gggacctctg 360
acagtcaacg aaaagaggcg cctgaaactg atcatgcctg ccaggtttta cccaaatgtg 420
actaagtatc tgccactgga taagggcatc aagccttact atccagagca cctggtgaac 480
cattacttcc agactagaca ctatctgcat accctgtgga aggccggaat cctgtacaaa 540
cgagaaacta cccggagtgc ttcattttgt ggctccccat attcttggga acaggagctg 600
cagcatggca ggctggtgtt ccagaccagc aaacgccacg gggatgagtc cttttgcagc 660
cagtctagtg gcatcctgag cagatccccc gtggggcctt gtattcagtc tcagctgcgg 720
aagagtagac tgggactgca gccacagcag ggacacctgg cacgacggca gcagggaagg 780
tctggcagta tccgggctag agtgcatccc acaactagaa ggaccttcgg cgtcgagcca 840
tcaggaagcg gccacatcga caacagcgca tcaagctcct ctagttgcct gcatcagtca 900
gccgtgagaa aggccgctta cagccacctg tccacatcta aaaggcactc aagctccggg 960
catgctgtgg agctgcacaa catccctcca aattctgcac gcagtcagtc agaaggaccc 1020
gtgttcagct gctggtggct gcagtttcgg aactcaaagc cttgcagcga ctattgtctg 1080
agccatattg tgaatctgct ggaggattgg ggcccttgta ccgagcacgg ggaacaccat 1140
atcaggattc cacgaacacc agcacgagtg actggagggg tgttcctggt ggacaagaac 1200
ccccacaata ctaccgagag ccggctggtg gtcgatttca gtcagttttc aagaggcaac 1260
acaagggtgt catggcccaa attcgccgtc cctaatctgc agagtctgac taacctgctg 1320
tctagtaatc tgagctggct gtccctggac gtgtccgcag ccttttacca cctgcctctg 1380
catccagctg caatgcccca tctgctggtg gggtcaagcg gactgagtcg ctacgtcgcc 1440
cgactgtcct ctaactcacg catcattaat caccagcatg gcaccatgca gaacctgcac 1500
gatagctgtt cccggaatct gtacgtgtct ctgctgctgc tgtataagac attcggcaga 1560
aaactgcacc tgtacagcca tcctatcatt ctggggttta ggaagatccc aatgggagtg 1620
ggactgagcc ccttcctgct ggcacagttt acctccgcca tttgctctgt ggtccgccga 1680
gccttcccac actgtctggc tttttcctat atgaacaatg tggtcctggg cgccaaatcc 1740
gtgcagcatc tggagtctct gttcacagct gtcactaact ttctgctgag cctggggatc 1800
cacctgaacc caaataagac taaacgctgg gggtacagcc tgaatttcat gggatatgtg 1860
attggatcct gggggaccct gccacaggag cacatcgtgc agaagatcaa ggaatgcttt 1920
cggaagctgc ccgtcaacag acctatcgac tggaaagtgt gccagcggat tgtcggactg 1980
ctgggcttcg ccgctccctt tacccagtgc gggtacccag cactgatgcc cctgtatgcc 2040
tgtatccagt ctaagcaggc tttcaccttt agtcctacat acaaggcatt cctgtgcaaa 2100
cagtacctga acctgtatcc agtggcaagg cagcgacctg gactgtgcca ggtctttgca 2160
aatgccactc ctaccggctg ggggctggct atcggacatc agcgaatgcg gggcacattc 2220
gtggcccccc tgcctattca cactgctcag ctgctggcag cctgctttgc tagatctagg 2280
agtggagcaa agctgatcgg caccgacaat agtgtggtcc tgtcaagaaa atacacatcc 2340
ttcccatggc tgctgggatg tgctgcaaac tggattctga ggggcaccag cttcgtgtac 2400
gtcccctcag ccctgaatcc tgctgacgat ccatcccgcg ggcgactggg actgtaccga 2460
cctctgctga gactgccctt caggcctaca actggccgga catctctgta tgccgattca 2520
ccaagcgtgc cctcacacct gcctgacaga gtccactttg cttcacccct gcacgtcgct 2580
tggcggcctc caggaagcgg agctactaac ttcagcctgc tgaagcaggc tggagacgtg 2640
gaggagaacc ctggacctat ggctcgacct ctgtgtaccc tgctactcct gatggctacc 2700
ctggctggag ctctggccag cgacatcgac ccttacaagg agttcggcgc cagcgtggaa 2760
ctgctgtctt ttctgcccag tgatttcttt ccttccattc gagacctgct ggataccgcc 2820
tctgctctgt atcgggaagc cctggagagc ccagaacact gctccccaca ccataccgct 2880
ctgcgacagg caatcctgtg ctggggggag ctgatgaacc tggccacatg ggtgggatcg 2940
aatctggagg accccgcttc acgggaactg gtggtcagct acgtgaacgt caatatgggc 3000
ctgaaaatcc gccagctgct gtggttccat attagctgcc tgacttttgg acgagagacc 3060
gtgctggaat acctggtgtc cttcggcgtc tggattcgca ctccccctgc ttatcgacca 3120
cccaacgcac caattctgtc caccctgccc gagaccacag tggtccgtcg ccgttaagcc 3180
cctctccctc ccccccccct aacgttactg gccgaagccg cttggaataa ggccggtgtg 3240
cgtttgtcta tatgttattt tccaccatat tgccgtcttt tggcaatgtg agggcccgga 3300
aacctggccc tgtcttcttg acgagcattc ctaggggtct ttcccctctc gccaaaggaa 3360
tgcaaggtct gttgaatgtc gtgaaggaag cagttcctct ggaagcttct tgaagacaaa 3420
caacgtctgt agcgaccctt tgcaggcagc ggaacccccc acctggcgac aggtgcctct 3480
gcggccaaaa gccacgtgta taagatacac ctgcaaaggc ggcacaaccc cagtgccacg 3540
ttgtgagttg gatagttgtg gaaagagtca aatggctctc ctcaagcgta ttcaacaagg 3600
ggctgaagga tgcccagaag gtaccccatt gtatgggatc tgatctgggg cctcggtgca 3660
catgctttac atgtgtttag tcgaggttaa aaaacgtcta ggccccccga accacgggga 3720
cgtggttttc ctttgaaaaa cacgatgata atatggccac aaccatgcag tggaactcaa 3780
ctactttcca tcagaccctt caggacccta gagtgcgcgg gctgtacttt cctgctgggg 3840
gaagcagtag cgggaccgtt aatccagtac ctacgaccgc ctctcccata tcttctatct 3900
ttagtaggac tggtgaccct gctcccaaca tggagaatat cacctccggg tttctgggcc 3960
cactcctggt ccttcaggcc ggattcttcc tgctgactcg aatcctcacc ataccccaga 4020
gcctggacag ctggtggaca agcctgaatt ttctgggagg aactcctgta tgcctgggac 4080
aaaattcaca gtcccctaca agtaaccatt caccgacaag ttgtcctccc atctgtcccg 4140
gatacaggtg gatgtgcctg cgaaggttca tcatcttcct cttcatcctc ttgctttgcc 4200
ttattttcct cctggttctt ctggactatc agggcatgct gcctgtgtgc ccactgatac 4260
caggatctag tactaccagc acaggcccgt gtaagacctg tacaattcca gcacaaggga 4320
ctagtatgtt cccctcctgc tgttgtacta agccaagcga cggtaattgc acgtgtatcc 4380
caatcccgtc ctcctgggcg tttgccaagt acctctggga atgggcctca gtcagatttt 4440
catggcttag tcttttggtg ccgttcgtgc agtggtttgt gggactctct ccgactgtgt 4500
ggctcagcgt gatctggatg atgtggtact ggggcccttc cctttacaac atactgtctc 4560
cattccttcc cctgctgcca atcttctttt gcctgtgggt ctatatt 4607
<210> 48
<211> 4767
<212> DNA
<213> Artificial Sequence
<220>
<223> Pol-2A-Core coding sequence -IRES (EV71)-PreS2.S coding sequence
<400> 48
atggctcgac ctctgtgtac cctgctactc ctgatggcta ccctggctgg agctctggcc 60
agcatgcccc tgtcttacca gcactttaga aagcttctgc tgctggacga tgaagccggg 120
cctctggagg aagagctgcc aaggctggca gacgaggggc tgaaccggag agtggccgaa 180
gatctgaatc tgggaaacct gaacgtgagc atcccttgga ctcataaagt cggcaacttc 240
accgggctgt acagctccac agtgcctgtc ttcaatccag agtggcagac accatccttt 300
cccaacattc acctgcagga ggacatcatt aatagatgcg aacagttcgt gggacctctg 360
acagtcaacg aaaagaggcg cctgaaactg atcatgcctg ccaggtttta cccaaatgtg 420
actaagtatc tgccactgga taagggcatc aagccttact atccagagca cctggtgaac 480
cattacttcc agactagaca ctatctgcat accctgtgga aggccggaat cctgtacaaa 540
cgagaaacta cccggagtgc ttcattttgt ggctccccat attcttggga acaggagctg 600
cagcatggca ggctggtgtt ccagaccagc aaacgccacg gggatgagtc cttttgcagc 660
cagtctagtg gcatcctgag cagatccccc gtggggcctt gtattcagtc tcagctgcgg 720
aagagtagac tgggactgca gccacagcag ggacacctgg cacgacggca gcagggaagg 780
tctggcagta tccgggctag agtgcatccc acaactagaa ggaccttcgg cgtcgagcca 840
tcaggaagcg gccacatcga caacagcgca tcaagctcct ctagttgcct gcatcagtca 900
gccgtgagaa aggccgctta cagccacctg tccacatcta aaaggcactc aagctccggg 960
catgctgtgg agctgcacaa catccctcca aattctgcac gcagtcagtc agaaggaccc 1020
gtgttcagct gctggtggct gcagtttcgg aactcaaagc cttgcagcga ctattgtctg 1080
agccatattg tgaatctgct ggaggattgg ggcccttgta ccgagcacgg ggaacaccat 1140
atcaggattc cacgaacacc agcacgagtg actggagggg tgttcctggt ggacaagaac 1200
ccccacaata ctaccgagag ccggctggtg gtcgatttca gtcagttttc aagaggcaac 1260
acaagggtgt catggcccaa attcgccgtc cctaatctgc agagtctgac taacctgctg 1320
tctagtaatc tgagctggct gtccctggac gtgtccgcag ccttttacca cctgcctctg 1380
catccagctg caatgcccca tctgctggtg gggtcaagcg gactgagtcg ctacgtcgcc 1440
cgactgtcct ctaactcacg catcattaat caccagcatg gcaccatgca gaacctgcac 1500
gatagctgtt cccggaatct gtacgtgtct ctgctgctgc tgtataagac attcggcaga 1560
aaactgcacc tgtacagcca tcctatcatt ctggggttta ggaagatccc aatgggagtg 1620
ggactgagcc ccttcctgct ggcacagttt acctccgcca tttgctctgt ggtccgccga 1680
gccttcccac actgtctggc tttttcctat atgaacaatg tggtcctggg cgccaaatcc 1740
gtgcagcatc tggagtctct gttcacagct gtcactaact ttctgctgag cctggggatc 1800
cacctgaacc caaataagac taaacgctgg gggtacagcc tgaatttcat gggatatgtg 1860
attggatcct gggggaccct gccacaggag cacatcgtgc agaagatcaa ggaatgcttt 1920
cggaagctgc ccgtcaacag acctatcgac tggaaagtgt gccagcggat tgtcggactg 1980
ctgggcttcg ccgctccctt tacccagtgc gggtacccag cactgatgcc cctgtatgcc 2040
tgtatccagt ctaagcaggc tttcaccttt agtcctacat acaaggcatt cctgtgcaaa 2100
cagtacctga acctgtatcc agtggcaagg cagcgacctg gactgtgcca ggtctttgca 2160
aatgccactc ctaccggctg ggggctggct atcggacatc agcgaatgcg gggcacattc 2220
gtggcccccc tgcctattca cactgctcag ctgctggcag cctgctttgc tagatctagg 2280
agtggagcaa agctgatcgg caccgacaat agtgtggtcc tgtcaagaaa atacacatcc 2340
ttcccatggc tgctgggatg tgctgcaaac tggattctga ggggcaccag cttcgtgtac 2400
gtcccctcag ccctgaatcc tgctgacgat ccatcccgcg ggcgactggg actgtaccga 2460
cctctgctga gactgccctt caggcctaca actggccgga catctctgta tgccgattca 2520
ccaagcgtgc cctcacacct gcctgacaga gtccactttg cttcacccct gcacgtcgct 2580
tggcggcctc caggaagcgg agctactaac ttcagcctgc tgaagcaggc tggagacgtg 2640
gaggagaacc ctggacctat ggctcgacct ctgtgtaccc tgctactcct gatggctacc 2700
ctggctggag ctctggccag cgacatcgac ccttacaagg agttcggcgc cagcgtggaa 2760
ctgctgtctt ttctgcccag tgatttcttt ccttccattc gagacctgct ggataccgcc 2820
tctgctctgt atcgggaagc cctggagagc ccagaacact gctccccaca ccataccgct 2880
ctgcgacagg caatcctgtg ctggggggag ctgatgaacc tggccacatg ggtgggatcg 2940
aatctggagg accccgcttc acgggaactg gtggtcagct acgtgaacgt caatatgggc 3000
ctgaaaatcc gccagctgct gtggttccat attagctgcc tgacttttgg acgagagacc 3060
gtgctggaat acctggtgtc cttcggcgtc tggattcgca ctccccctgc ttatcgacca 3120
cccaacgcac caattctgtc caccctgccc gagaccacag tggtccgtcg ccgttaatta 3180
aaacagctgt gggttgttcc cacccacagg gcccactggg cgctagcact ctgattttac 3240
gaaatccttg tgcgcctgtt ttatatccct tccctaattc gaaacgtaga agcaatgcgc 3300
accactgatc aatagtaggc gtaacgcgcc agttacgtca tgatcaagca tatctgttcc 3360
cccggactga gtatcaatag actgcttacg cggttgaagg agaaaacgtt cgttatccgg 3420
ctaactactt cgagaagccc agtaacacca tggaagctgc agggtgtttc gctcagcact 3480
tcccccgtgt agatcaggtc gatgagccac tgcaatcccc acaggtgact gtggcagtgg 3540
ctgcgttggc ggcctgccta tggggagacc cataggacgc tctaatgtgg acatggtgcg 3600
aagagcctat tgagctagtt agtagtcctc cggcccctga atgcggctaa tcctaactgc 3660
ggagcacatg ccttcaaccc agagggtagt gtgtcgtaac gggcaactct gcagcggaac 3720
cgactacttt gggtgtccgt gtttcttttt tattcttata ttggctgctt atggtgacaa 3780
ttacagaatt gttaccatat agctattgga ttggccatcc ggtgtgtaat agagctgtta 3840
tatacctatt tgttggcttt gtaccactaa ctttaaaatc tataactacc ctcaacttta 3900
tattaaccct caatacagtt gaccatgcag tggaactcaa ctactttcca tcagaccctt 3960
caggacccta gagtgcgcgg gctgtacttt cctgctgggg gaagcagtag cgggaccgtt 4020
aatccagtac ctacgaccgc ctctcccata tcttctatct ttagtaggac tggtgaccct 4080
gctcccaaca tggagaatat cacctccggg tttctgggcc cactcctggt ccttcaggcc 4140
ggattcttcc tgctgactcg aatcctcacc ataccccaga gcctggacag ctggtggaca 4200
agcctgaatt ttctgggagg aactcctgta tgcctgggac aaaattcaca gtcccctaca 4260
agtaaccatt caccgacaag ttgtcctccc atctgtcccg gatacaggtg gatgtgcctg 4320
cgaaggttca tcatcttcct cttcatcctc ttgctttgcc ttattttcct cctggttctt 4380
ctggactatc agggcatgct gcctgtgtgc ccactgatac caggatctag tactaccagc 4440
acaggcccgt gtaagacctg tacaattcca gcacaaggga ctagtatgtt cccctcctgc 4500
tgttgtacta agccaagcga cggtaattgc acgtgtatcc caatcccgtc ctcctgggcg 4560
tttgccaagt acctctggga atgggcctca gtcagatttt catggcttag tcttttggtg 4620
ccgttcgtgc agtggtttgt gggactctct ccgactgtgt ggctcagcgt gatctggatg 4680
atgtggtact ggggcccttc cctttacaac atactgtctc cattccttcc cctgctgcca 4740
atcttctttt gcctgtgggt ctatatt 4767
<210> 49
<211> 4607
<212> DNA
<213> Artificial Sequence
<220>
<223> PreS2.S-IRES (EMCV)-Pol-2A-Core
<400> 49
atgcagtgga actcaactac tttccatcag acccttcagg accctagagt gcgcgggctg 60
tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac gaccgcctct 120
cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga gaatatcacc 180
tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct gactcgaatc 240
ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct gggaggaact 300
cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc gacaagttgt 360
cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat cttcctcttc 420
atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg catgctgcct 480
gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa gacctgtaca 540
attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc aagcgacggt 600
aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct ctgggaatgg 660
gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg gtttgtggga 720
ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg cccttccctt 780
tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct gtgggtctat 840
atttaagccc ctctccctcc ccccccccta acgttactgg ccgaagccgc ttggaataag 900
gccggtgtgc gtttgtctat atgttatttt ccaccatatt gccgtctttt ggcaatgtga 960
gggcccggaa acctggccct gtcttcttga cgagcattcc taggggtctt tcccctctcg 1020
ccaaaggaat gcaaggtctg ttgaatgtcg tgaaggaagc agttcctctg gaagcttctt 1080
gaagacaaac aacgtctgta gcgacccttt gcaggcagcg gaacccccca cctggcgaca 1140
ggtgcctctg cggccaaaag ccacgtgtat aagatacacc tgcaaaggcg gcacaacccc 1200
agtgccacgt tgtgagttgg atagttgtgg aaagagtcaa atggctctcc tcaagcgtat 1260
tcaacaaggg gctgaaggat gcccagaagg taccccattg tatgggatct gatctggggc 1320
ctcggtgcac atgctttaca tgtgtttagt cgaggttaaa aaacgtctag gccccccgaa 1380
ccacggggac gtggttttcc tttgaaaaac acgatgataa tatggccaca accatggctc 1440
gacctctgtg taccctgcta ctcctgatgg ctaccctggc tggagctctg gccagcatgc 1500
ccctgtctta ccagcacttt agaaagcttc tgctgctgga cgatgaagcc gggcctctgg 1560
aggaagagct gccaaggctg gcagacgagg ggctgaaccg gagagtggcc gaagatctga 1620
atctgggaaa cctgaacgtg agcatccctt ggactcataa agtcggcaac ttcaccgggc 1680
tgtacagctc cacagtgcct gtcttcaatc cagagtggca gacaccatcc tttcccaaca 1740
ttcacctgca ggaggacatc attaatagat gcgaacagtt cgtgggacct ctgacagtca 1800
acgaaaagag gcgcctgaaa ctgatcatgc ctgccaggtt ttacccaaat gtgactaagt 1860
atctgccact ggataagggc atcaagcctt actatccaga gcacctggtg aaccattact 1920
tccagactag acactatctg cataccctgt ggaaggccgg aatcctgtac aaacgagaaa 1980
ctacccggag tgcttcattt tgtggctccc catattcttg ggaacaggag ctgcagcatg 2040
gcaggctggt gttccagacc agcaaacgcc acggggatga gtccttttgc agccagtcta 2100
gtggcatcct gagcagatcc cccgtggggc cttgtattca gtctcagctg cggaagagta 2160
gactgggact gcagccacag cagggacacc tggcacgacg gcagcaggga aggtctggca 2220
gtatccgggc tagagtgcat cccacaacta gaaggacctt cggcgtcgag ccatcaggaa 2280
gcggccacat cgacaacagc gcatcaagct cctctagttg cctgcatcag tcagccgtga 2340
gaaaggccgc ttacagccac ctgtccacat ctaaaaggca ctcaagctcc gggcatgctg 2400
tggagctgca caacatccct ccaaattctg cacgcagtca gtcagaagga cccgtgttca 2460
gctgctggtg gctgcagttt cggaactcaa agccttgcag cgactattgt ctgagccata 2520
ttgtgaatct gctggaggat tggggccctt gtaccgagca cggggaacac catatcagga 2580
ttccacgaac accagcacga gtgactggag gggtgttcct ggtggacaag aacccccaca 2640
atactaccga gagccggctg gtggtcgatt tcagtcagtt ttcaagaggc aacacaaggg 2700
tgtcatggcc caaattcgcc gtccctaatc tgcagagtct gactaacctg ctgtctagta 2760
atctgagctg gctgtccctg gacgtgtccg cagcctttta ccacctgcct ctgcatccag 2820
ctgcaatgcc ccatctgctg gtggggtcaa gcggactgag tcgctacgtc gcccgactgt 2880
cctctaactc acgcatcatt aatcaccagc atggcaccat gcagaacctg cacgatagct 2940
gttcccggaa tctgtacgtg tctctgctgc tgctgtataa gacattcggc agaaaactgc 3000
acctgtacag ccatcctatc attctggggt ttaggaagat cccaatggga gtgggactga 3060
gccccttcct gctggcacag tttacctccg ccatttgctc tgtggtccgc cgagccttcc 3120
cacactgtct ggctttttcc tatatgaaca atgtggtcct gggcgccaaa tccgtgcagc 3180
atctggagtc tctgttcaca gctgtcacta actttctgct gagcctgggg atccacctga 3240
acccaaataa gactaaacgc tgggggtaca gcctgaattt catgggatat gtgattggat 3300
cctgggggac cctgccacag gagcacatcg tgcagaagat caaggaatgc tttcggaagc 3360
tgcccgtcaa cagacctatc gactggaaag tgtgccagcg gattgtcgga ctgctgggct 3420
tcgccgctcc ctttacccag tgcgggtacc cagcactgat gcccctgtat gcctgtatcc 3480
agtctaagca ggctttcacc tttagtccta catacaaggc attcctgtgc aaacagtacc 3540
tgaacctgta tccagtggca aggcagcgac ctggactgtg ccaggtcttt gcaaatgcca 3600
ctcctaccgg ctgggggctg gctatcggac atcagcgaat gcggggcaca ttcgtggccc 3660
ccctgcctat tcacactgct cagctgctgg cagcctgctt tgctagatct aggagtggag 3720
caaagctgat cggcaccgac aatagtgtgg tcctgtcaag aaaatacaca tccttcccat 3780
ggctgctggg atgtgctgca aactggattc tgaggggcac cagcttcgtg tacgtcccct 3840
cagccctgaa tcctgctgac gatccatccc gcgggcgact gggactgtac cgacctctgc 3900
tgagactgcc cttcaggcct acaactggcc ggacatctct gtatgccgat tcaccaagcg 3960
tgccctcaca cctgcctgac agagtccact ttgcttcacc cctgcacgtc gcttggcggc 4020
ctccaggatc aggcgctacg aattttagcc ttctgaagca agcgggagac gttgaagaaa 4080
acccagggcc tatggctcga cctctgtgta ccctgctact cctgatggct accctggctg 4140
gagctctggc cagcgacatc gacccttaca aggagttcgg cgccagcgtg gaactgctgt 4200
cttttctgcc cagtgatttc tttccttcca ttcgagacct gctggatacc gcctctgctc 4260
tgtatcggga agccctggag agcccagaac actgctcccc acaccatacc gctctgcgac 4320
aggcaatcct gtgctggggg gagctgatga acctggccac atgggtggga tcgaatctgg 4380
aggaccccgc ttcacgggaa ctggtggtca gctacgtgaa cgtcaatatg ggcctgaaaa 4440
tccgccagct gctgtggttc catattagct gcctgacttt tggacgagag accgtgctgg 4500
aatacctggt gtccttcggc gtctggattc gcactccccc tgcttatcga ccacccaacg 4560
caccaattct gtccaccctg cccgagacca cagtggtccg tcgccgt 4607
<210> 50
<211> 4767
<212> DNA
<213> Artificial Sequence
<220>
<223> PreS2.S coding sequence -IRES (EV71)-Pol-2A-Core coding sequence
<400> 50
atgcagtgga actcaactac tttccatcag acccttcagg accctagagt gcgcgggctg 60
tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac gaccgcctct 120
cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga gaatatcacc 180
tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct gactcgaatc 240
ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct gggaggaact 300
cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc gacaagttgt 360
cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat cttcctcttc 420
atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg catgctgcct 480
gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa gacctgtaca 540
attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc aagcgacggt 600
aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct ctgggaatgg 660
gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg gtttgtggga 720
ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg cccttccctt 780
tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct gtgggtctat 840
atttaattaa aacagctgtg ggttgttccc acccacaggg cccactgggc gctagcactc 900
tgattttacg aaatccttgt gcgcctgttt tatatccctt ccctaattcg aaacgtagaa 960
gcaatgcgca ccactgatca atagtaggcg taacgcgcca gttacgtcat gatcaagcat 1020
atctgttccc ccggactgag tatcaataga ctgcttacgc ggttgaagga gaaaacgttc 1080
gttatccggc taactacttc gagaagccca gtaacaccat ggaagctgca gggtgtttcg 1140
ctcagcactt cccccgtgta gatcaggtcg atgagccact gcaatcccca caggtgactg 1200
tggcagtggc tgcgttggcg gcctgcctat ggggagaccc ataggacgct ctaatgtgga 1260
catggtgcga agagcctatt gagctagtta gtagtcctcc ggcccctgaa tgcggctaat 1320
cctaactgcg gagcacatgc cttcaaccca gagggtagtg tgtcgtaacg ggcaactctg 1380
cagcggaacc gactactttg ggtgtccgtg tttctttttt attcttatat tggctgctta 1440
tggtgacaat tacagaattg ttaccatata gctattggat tggccatccg gtgtgtaata 1500
gagctgttat atacctattt gttggctttg taccactaac tttaaaatct ataactaccc 1560
tcaactttat attaaccctc aatacagttg accatggctc gacctctgtg taccctgcta 1620
ctcctgatgg ctaccctggc tggagctctg gccagcatgc ccctgtctta ccagcacttt 1680
agaaagcttc tgctgctgga cgatgaagcc gggcctctgg aggaagagct gccaaggctg 1740
gcagacgagg ggctgaaccg gagagtggcc gaagatctga atctgggaaa cctgaacgtg 1800
agcatccctt ggactcataa agtcggcaac ttcaccgggc tgtacagctc cacagtgcct 1860
gtcttcaatc cagagtggca gacaccatcc tttcccaaca ttcacctgca ggaggacatc 1920
attaatagat gcgaacagtt cgtgggacct ctgacagtca acgaaaagag gcgcctgaaa 1980
ctgatcatgc ctgccaggtt ttacccaaat gtgactaagt atctgccact ggataagggc 2040
atcaagcctt actatccaga gcacctggtg aaccattact tccagactag acactatctg 2100
cataccctgt ggaaggccgg aatcctgtac aaacgagaaa ctacccggag tgcttcattt 2160
tgtggctccc catattcttg ggaacaggag ctgcagcatg gcaggctggt gttccagacc 2220
agcaaacgcc acggggatga gtccttttgc agccagtcta gtggcatcct gagcagatcc 2280
cccgtggggc cttgtattca gtctcagctg cggaagagta gactgggact gcagccacag 2340
cagggacacc tggcacgacg gcagcaggga aggtctggca gtatccgggc tagagtgcat 2400
cccacaacta gaaggacctt cggcgtcgag ccatcaggaa gcggccacat cgacaacagc 2460
gcatcaagct cctctagttg cctgcatcag tcagccgtga gaaaggccgc ttacagccac 2520
ctgtccacat ctaaaaggca ctcaagctcc gggcatgctg tggagctgca caacatccct 2580
ccaaattctg cacgcagtca gtcagaagga cccgtgttca gctgctggtg gctgcagttt 2640
cggaactcaa agccttgcag cgactattgt ctgagccata ttgtgaatct gctggaggat 2700
tggggccctt gtaccgagca cggggaacac catatcagga ttccacgaac accagcacga 2760
gtgactggag gggtgttcct ggtggacaag aacccccaca atactaccga gagccggctg 2820
gtggtcgatt tcagtcagtt ttcaagaggc aacacaaggg tgtcatggcc caaattcgcc 2880
gtccctaatc tgcagagtct gactaacctg ctgtctagta atctgagctg gctgtccctg 2940
gacgtgtccg cagcctttta ccacctgcct ctgcatccag ctgcaatgcc ccatctgctg 3000
gtggggtcaa gcggactgag tcgctacgtc gcccgactgt cctctaactc acgcatcatt 3060
aatcaccagc atggcaccat gcagaacctg cacgatagct gttcccggaa tctgtacgtg 3120
tctctgctgc tgctgtataa gacattcggc agaaaactgc acctgtacag ccatcctatc 3180
attctggggt ttaggaagat cccaatggga gtgggactga gccccttcct gctggcacag 3240
tttacctccg ccatttgctc tgtggtccgc cgagccttcc cacactgtct ggctttttcc 3300
tatatgaaca atgtggtcct gggcgccaaa tccgtgcagc atctggagtc tctgttcaca 3360
gctgtcacta actttctgct gagcctgggg atccacctga acccaaataa gactaaacgc 3420
tgggggtaca gcctgaattt catgggatat gtgattggat cctgggggac cctgccacag 3480
gagcacatcg tgcagaagat caaggaatgc tttcggaagc tgcccgtcaa cagacctatc 3540
gactggaaag tgtgccagcg gattgtcgga ctgctgggct tcgccgctcc ctttacccag 3600
tgcgggtacc cagcactgat gcccctgtat gcctgtatcc agtctaagca ggctttcacc 3660
tttagtccta catacaaggc attcctgtgc aaacagtacc tgaacctgta tccagtggca 3720
aggcagcgac ctggactgtg ccaggtcttt gcaaatgcca ctcctaccgg ctgggggctg 3780
gctatcggac atcagcgaat gcggggcaca ttcgtggccc ccctgcctat tcacactgct 3840
cagctgctgg cagcctgctt tgctagatct aggagtggag caaagctgat cggcaccgac 3900
aatagtgtgg tcctgtcaag aaaatacaca tccttcccat ggctgctggg atgtgctgca 3960
aactggattc tgaggggcac cagcttcgtg tacgtcccct cagccctgaa tcctgctgac 4020
gatccatccc gcgggcgact gggactgtac cgacctctgc tgagactgcc cttcaggcct 4080
acaactggcc ggacatctct gtatgccgat tcaccaagcg tgccctcaca cctgcctgac 4140
agagtccact ttgcttcacc cctgcacgtc gcttggcggc ctccaggatc aggcgctacg 4200
aattttagcc ttctgaagca agcgggagac gttgaagaaa acccagggcc tatggctcga 4260
cctctgtgta ccctgctact cctgatggct accctggctg gagctctggc cagcgacatc 4320
gacccttaca aggagttcgg cgccagcgtg gaactgctgt cttttctgcc cagtgatttc 4380
tttccttcca ttcgagacct gctggatacc gcctctgctc tgtatcggga agccctggag 4440
agcccagaac actgctcccc acaccatacc gctctgcgac aggcaatcct gtgctggggg 4500
gagctgatga acctggccac atgggtggga tcgaatctgg aggaccccgc ttcacgggaa 4560
ctggtggtca gctacgtgaa cgtcaatatg ggcctgaaaa tccgccagct gctgtggttc 4620
catattagct gcctgacttt tggacgagag accgtgctgg aatacctggt gtccttcggc 4680
gtctggattc gcactccccc tgcttatcga ccacccaacg caccaattct gtccaccctg 4740
cccgagacca cagtggtccg tcgccgt 4767
<210> 51
<211> 3987
<212> DNA
<213> Artificial Sequence
<220>
<223> Pol-2A-PreS2.S-2A-preS1 coding sequence
<400> 51
atggctcgac ctctgtgtac cctgctactc ctgatggcta ccctggctgg agctctggcc 60
agcatgcccc tgtcttacca gcactttaga aagcttctgc tgctggacga tgaagccggg 120
cctctggagg aagagctgcc aaggctggca gacgaggggc tgaaccggag agtggccgaa 180
gatctgaatc tgggaaacct gaacgtgagc atcccttgga ctcataaagt cggcaacttc 240
accgggctgt acagctccac agtgcctgtc ttcaatccag agtggcagac accatccttt 300
cccaacattc acctgcagga ggacatcatt aatagatgcg aacagttcgt gggacctctg 360
acagtcaacg aaaagaggcg cctgaaactg atcatgcctg ccaggtttta cccaaatgtg 420
actaagtatc tgccactgga taagggcatc aagccttact atccagagca cctggtgaac 480
cattacttcc agactagaca ctatctgcat accctgtgga aggccggaat cctgtacaaa 540
cgagaaacta cccggagtgc ttcattttgt ggctccccat attcttggga acaggagctg 600
cagcatggca ggctggtgtt ccagaccagc aaacgccacg gggatgagtc cttttgcagc 660
cagtctagtg gcatcctgag cagatccccc gtggggcctt gtattcagtc tcagctgcgg 720
aagagtagac tgggactgca gccacagcag ggacacctgg cacgacggca gcagggaagg 780
tctggcagta tccgggctag agtgcatccc acaactagaa ggaccttcgg cgtcgagcca 840
tcaggaagcg gccacatcga caacagcgca tcaagctcct ctagttgcct gcatcagtca 900
gccgtgagaa aggccgctta cagccacctg tccacatcta aaaggcactc aagctccggg 960
catgctgtgg agctgcacaa catccctcca aattctgcac gcagtcagtc agaaggaccc 1020
gtgttcagct gctggtggct gcagtttcgg aactcaaagc cttgcagcga ctattgtctg 1080
agccatattg tgaatctgct ggaggattgg ggcccttgta ccgagcacgg ggaacaccat 1140
atcaggattc cacgaacacc agcacgagtg actggagggg tgttcctggt ggacaagaac 1200
ccccacaata ctaccgagag ccggctggtg gtcgatttca gtcagttttc aagaggcaac 1260
acaagggtgt catggcccaa attcgccgtc cctaatctgc agagtctgac taacctgctg 1320
tctagtaatc tgagctggct gtccctggac gtgtccgcag ccttttacca cctgcctctg 1380
catccagctg caatgcccca tctgctggtg gggtcaagcg gactgagtcg ctacgtcgcc 1440
cgactgtcct ctaactcacg catcattaat caccagcatg gcaccatgca gaacctgcac 1500
gatagctgtt cccggaatct gtacgtgtct ctgctgctgc tgtataagac attcggcaga 1560
aaactgcacc tgtacagcca tcctatcatt ctggggttta ggaagatccc aatgggagtg 1620
ggactgagcc ccttcctgct ggcacagttt acctccgcca tttgctctgt ggtccgccga 1680
gccttcccac actgtctggc tttttcctat atgaacaatg tggtcctggg cgccaaatcc 1740
gtgcagcatc tggagtctct gttcacagct gtcactaact ttctgctgag cctggggatc 1800
cacctgaacc caaataagac taaacgctgg gggtacagcc tgaatttcat gggatatgtg 1860
attggatcct gggggaccct gccacaggag cacatcgtgc agaagatcaa ggaatgcttt 1920
cggaagctgc ccgtcaacag acctatcgac tggaaagtgt gccagcggat tgtcggactg 1980
ctgggcttcg ccgctccctt tacccagtgc gggtacccag cactgatgcc cctgtatgcc 2040
tgtatccagt ctaagcaggc tttcaccttt agtcctacat acaaggcatt cctgtgcaaa 2100
cagtacctga acctgtatcc agtggcaagg cagcgacctg gactgtgcca ggtctttgca 2160
aatgccactc ctaccggctg ggggctggct atcggacatc agcgaatgcg gggcacattc 2220
gtggcccccc tgcctattca cactgctcag ctgctggcag cctgctttgc tagatctagg 2280
agtggagcaa agctgatcgg caccgacaat agtgtggtcc tgtcaagaaa atacacatcc 2340
ttcccatggc tgctgggatg tgctgcaaac tggattctga ggggcaccag cttcgtgtac 2400
gtcccctcag ccctgaatcc tgctgacgat ccatcccgcg ggcgactggg actgtaccga 2460
cctctgctga gactgccctt caggcctaca actggccgga catctctgta tgccgattca 2520
ccaagcgtgc cctcacacct gcctgacaga gtccactttg cttcacccct gcacgtcgct 2580
tggcggcctc caggatcagg cgctacgaat tttagccttc tgaagcaagc gggagacgtt 2640
gaagaaaacc cagggcctat gcagtggaac tcaactactt tccatcagac ccttcaggac 2700
cctagagtgc gcgggctgta ctttcctgct gggggaagca gtagcgggac cgttaatcca 2760
gtacctacga ccgcctctcc catatcttct atctttagta ggactggtga ccctgctccc 2820
aacatggaga atatcacctc cgggtttctg ggcccactcc tggtccttca ggccggattc 2880
ttcctgctga ctcgaatcct caccataccc cagagcctgg acagctggtg gacaagcctg 2940
aattttctgg gaggaactcc tgtatgcctg ggacaaaatt cacagtcccc tacaagtaac 3000
cattcaccga caagttgtcc tcccatctgt cccggataca ggtggatgtg cctgcgaagg 3060
ttcatcatct tcctcttcat cctcttgctt tgccttattt tcctcctggt tcttctggac 3120
tatcagggca tgctgcctgt gtgcccactg ataccaggat ctagtactac cagcacaggc 3180
ccgtgtaaga cctgtacaat tccagcacaa gggactagta tgttcccctc ctgctgttgt 3240
actaagccaa gcgacggtaa ttgcacgtgt atcccaatcc cgtcctcctg ggcgtttgcc 3300
aagtacctct gggaatgggc ctcagtcaga ttttcatggc ttagtctttt ggtgccgttc 3360
gtgcagtggt ttgtgggact ctctccgact gtgtggctca gcgtgatctg gatgatgtgg 3420
tactggggcc cttcccttta caacatactg tctccattcc ttcccctgct gccaatcttc 3480
ttttgcctgt gggtctatat tgggtccgga gcgactaact tttccctgct gaaacaagcg 3540
ggtgacgtcg aagagaatcc gggacctatg gctaggcccc tgtgtacact tttgctcctg 3600
atggccaccc tcgctggagc tctggcaagc ggtggatgga gctcaaagcc gcggaaaggg 3660
atgggtacta acctgtccgt accaaatccc ctgggatttt ttccagacca ccaactcgat 3720
cctgcttttg gcgcaaattc caacaatccc gactgggact ttaaccctaa caaggaccac 3780
tggcctgatg ccaacaaggt gggggcagga gcctttggtc ccggcttcac cccaccccat 3840
ggaggtcttt tgggatggtc accacaggcc cagggcatcc tgaccactgt ccctgctgct 3900
ccaccgccag cttctactaa tcgacagagc gggaggcagc cgacccccct gagtcccccc 3960
ctgcgggata cccaccctca ggcataa 3987
<210> 52
<211> 3987
<212> DNA
<213> Artificial Sequence
<220>
<223> PreS2.S-2A-preS1-2A-Pol coding sequence
<400> 52
atgcagtgga actcaactac tttccatcag acccttcagg accctagagt gcgcgggctg 60
tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac gaccgcctct 120
cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga gaatatcacc 180
tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct gactcgaatc 240
ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct gggaggaact 300
cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc gacaagttgt 360
cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat cttcctcttc 420
atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg catgctgcct 480
gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa gacctgtaca 540
attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc aagcgacggt 600
aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct ctgggaatgg 660
gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg gtttgtggga 720
ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg cccttccctt 780
tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct gtgggtctat 840
attggaagcg gagctactaa cttcagcctg ctgaagcagg ctggagacgt ggaggagaac 900
cctggaccta tggctaggcc cctgtgtaca cttttgctcc tgatggccac cctcgctgga 960
gctctggcaa gcggtggatg gagctcaaag ccgcggaaag ggatgggtac taacctgtcc 1020
gtaccaaatc ccctgggatt ttttccagac caccaactcg atcctgcttt tggcgcaaat 1080
tccaacaatc ccgactggga ctttaaccct aacaaggacc actggcctga tgccaacaag 1140
gtgggggcag gagcctttgg tcccggcttc accccacccc atggaggtct tttgggatgg 1200
tcaccacagg cccagggcat cctgaccact gtccctgctg ctccaccgcc agcttctact 1260
aatcgacaga gcgggaggca gccgaccccc ctgagtcccc ccctgcggga tacccaccct 1320
caggcaggat caggcgctac gaattttagc cttctgaagc aagcgggaga cgttgaagaa 1380
aacccagggc ctatggctcg acctctgtgt accctgctac tcctgatggc taccctggct 1440
ggagctctgg ccagcatgcc cctgtcttac cagcacttta gaaagcttct gctgctggac 1500
gatgaagccg ggcctctgga ggaagagctg ccaaggctgg cagacgaggg gctgaaccgg 1560
agagtggccg aagatctgaa tctgggaaac ctgaacgtga gcatcccttg gactcataaa 1620
gtcggcaact tcaccgggct gtacagctcc acagtgcctg tcttcaatcc agagtggcag 1680
acaccatcct ttcccaacat tcacctgcag gaggacatca ttaatagatg cgaacagttc 1740
gtgggacctc tgacagtcaa cgaaaagagg cgcctgaaac tgatcatgcc tgccaggttt 1800
tacccaaatg tgactaagta tctgccactg gataagggca tcaagcctta ctatccagag 1860
cacctggtga accattactt ccagactaga cactatctgc ataccctgtg gaaggccgga 1920
atcctgtaca aacgagaaac tacccggagt gcttcatttt gtggctcccc atattcttgg 1980
gaacaggagc tgcagcatgg caggctggtg ttccagacca gcaaacgcca cggggatgag 2040
tccttttgca gccagtctag tggcatcctg agcagatccc ccgtggggcc ttgtattcag 2100
tctcagctgc ggaagagtag actgggactg cagccacagc agggacacct ggcacgacgg 2160
cagcagggaa ggtctggcag tatccgggct agagtgcatc ccacaactag aaggaccttc 2220
ggcgtcgagc catcaggaag cggccacatc gacaacagcg catcaagctc ctctagttgc 2280
ctgcatcagt cagccgtgag aaaggccgct tacagccacc tgtccacatc taaaaggcac 2340
tcaagctccg ggcatgctgt ggagctgcac aacatccctc caaattctgc acgcagtcag 2400
tcagaaggac ccgtgttcag ctgctggtgg ctgcagtttc ggaactcaaa gccttgcagc 2460
gactattgtc tgagccatat tgtgaatctg ctggaggatt ggggcccttg taccgagcac 2520
ggggaacacc atatcaggat tccacgaaca ccagcacgag tgactggagg ggtgttcctg 2580
gtggacaaga acccccacaa tactaccgag agccggctgg tggtcgattt cagtcagttt 2640
tcaagaggca acacaagggt gtcatggccc aaattcgccg tccctaatct gcagagtctg 2700
actaacctgc tgtctagtaa tctgagctgg ctgtccctgg acgtgtccgc agccttttac 2760
cacctgcctc tgcatccagc tgcaatgccc catctgctgg tggggtcaag cggactgagt 2820
cgctacgtcg cccgactgtc ctctaactca cgcatcatta atcaccagca tggcaccatg 2880
cagaacctgc acgatagctg ttcccggaat ctgtacgtgt ctctgctgct gctgtataag 2940
acattcggca gaaaactgca cctgtacagc catcctatca ttctggggtt taggaagatc 3000
ccaatgggag tgggactgag ccccttcctg ctggcacagt ttacctccgc catttgctct 3060
gtggtccgcc gagccttccc acactgtctg gctttttcct atatgaacaa tgtggtcctg 3120
ggcgccaaat ccgtgcagca tctggagtct ctgttcacag ctgtcactaa ctttctgctg 3180
agcctgggga tccacctgaa cccaaataag actaaacgct gggggtacag cctgaatttc 3240
atgggatatg tgattggatc ctgggggacc ctgccacagg agcacatcgt gcagaagatc 3300
aaggaatgct ttcggaagct gcccgtcaac agacctatcg actggaaagt gtgccagcgg 3360
attgtcggac tgctgggctt cgccgctccc tttacccagt gcgggtaccc agcactgatg 3420
cccctgtatg cctgtatcca gtctaagcag gctttcacct ttagtcctac atacaaggca 3480
ttcctgtgca aacagtacct gaacctgtat ccagtggcaa ggcagcgacc tggactgtgc 3540
caggtctttg caaatgccac tcctaccggc tgggggctgg ctatcggaca tcagcgaatg 3600
cggggcacat tcgtggcccc cctgcctatt cacactgctc agctgctggc agcctgcttt 3660
gctagatcta ggagtggagc aaagctgatc ggcaccgaca atagtgtggt cctgtcaaga 3720
aaatacacat ccttcccatg gctgctggga tgtgctgcaa actggattct gaggggcacc 3780
agcttcgtgt acgtcccctc agccctgaat cctgctgacg atccatcccg cgggcgactg 3840
ggactgtacc gacctctgct gagactgccc ttcaggccta caactggccg gacatctctg 3900
tatgccgatt caccaagcgt gccctcacac ctgcctgaca gagtccactt tgcttcaccc 3960
ctgcacgtcg cttggcggcc tccataa 3987
<210> 53
<211> 4508
<212> DNA
<213> Artificial Sequence
<220>
<223> PreS2.S-2A-preS1 coding sequence -IRES (EMCV)-Pol coding sequence
<400> 53
atgcagtgga actcaactac tttccatcag acccttcagg accctagagt gcgcgggctg 60
tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac gaccgcctct 120
cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga gaatatcacc 180
tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct gactcgaatc 240
ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct gggaggaact 300
cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc gacaagttgt 360
cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat cttcctcttc 420
atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg catgctgcct 480
gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa gacctgtaca 540
attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc aagcgacggt 600
aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct ctgggaatgg 660
gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg gtttgtggga 720
ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg cccttccctt 780
tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct gtgggtctat 840
attggaagcg gagctactaa cttcagcctg ctgaagcagg ctggagacgt ggaggagaac 900
cctggaccta tggctaggcc cctgtgtaca cttttgctcc tgatggccac cctcgctgga 960
gctctggcaa gcggtggatg gagctcaaag ccgcggaaag ggatgggtac taacctgtcc 1020
gtaccaaatc ccctgggatt ttttccagac caccaactcg atcctgcttt tggcgcaaat 1080
tccaacaatc ccgactggga ctttaaccct aacaaggacc actggcctga tgccaacaag 1140
gtgggggcag gagcctttgg tcccggcttc accccacccc atggaggtct tttgggatgg 1200
tcaccacagg cccagggcat cctgaccact gtccctgctg ctccaccgcc agcttctact 1260
aatcgacaga gcgggaggca gccgaccccc ctgagtcccc ccctgcggga tacccaccct 1320
caggcataag cccctctccc tccccccccc ctaacgttac tggccgaagc cgcttggaat 1380
aaggccggtg tgcgtttgtc tatatgttat tttccaccat attgccgtct tttggcaatg 1440
tgagggcccg gaaacctggc cctgtcttct tgacgagcat tcctaggggt ctttcccctc 1500
tcgccaaagg aatgcaaggt ctgttgaatg tcgtgaagga agcagttcct ctggaagctt 1560
cttgaagaca aacaacgtct gtagcgaccc tttgcaggca gcggaacccc ccacctggcg 1620
acaggtgcct ctgcggccaa aagccacgtg tataagatac acctgcaaag gcggcacaac 1680
cccagtgcca cgttgtgagt tggatagttg tggaaagagt caaatggctc tcctcaagcg 1740
tattcaacaa ggggctgaag gatgcccaga aggtacccca ttgtatggga tctgatctgg 1800
ggcctcggtg cacatgcttt acatgtgttt agtcgaggtt aaaaaacgtc taggcccccc 1860
gaaccacggg gacgtggttt tcctttgaaa aacacgatga taatatggcc acaaccatgg 1920
ctcgacctct gtgtaccctg ctactcctga tggctaccct ggctggagct ctggccagca 1980
tgcccctgtc ttaccagcac tttagaaagc ttctgctgct ggacgatgaa gccgggcctc 2040
tggaggaaga gctgccaagg ctggcagacg aggggctgaa ccggagagtg gccgaagatc 2100
tgaatctggg aaacctgaac gtgagcatcc cttggactca taaagtcggc aacttcaccg 2160
ggctgtacag ctccacagtg cctgtcttca atccagagtg gcagacacca tcctttccca 2220
acattcacct gcaggaggac atcattaata gatgcgaaca gttcgtggga cctctgacag 2280
tcaacgaaaa gaggcgcctg aaactgatca tgcctgccag gttttaccca aatgtgacta 2340
agtatctgcc actggataag ggcatcaagc cttactatcc agagcacctg gtgaaccatt 2400
acttccagac tagacactat ctgcataccc tgtggaaggc cggaatcctg tacaaacgag 2460
aaactacccg gagtgcttca ttttgtggct ccccatattc ttgggaacag gagctgcagc 2520
atggcaggct ggtgttccag accagcaaac gccacgggga tgagtccttt tgcagccagt 2580
ctagtggcat cctgagcaga tcccccgtgg ggccttgtat tcagtctcag ctgcggaaga 2640
gtagactggg actgcagcca cagcagggac acctggcacg acggcagcag ggaaggtctg 2700
gcagtatccg ggctagagtg catcccacaa ctagaaggac cttcggcgtc gagccatcag 2760
gaagcggcca catcgacaac agcgcatcaa gctcctctag ttgcctgcat cagtcagccg 2820
tgagaaaggc cgcttacagc cacctgtcca catctaaaag gcactcaagc tccgggcatg 2880
ctgtggagct gcacaacatc cctccaaatt ctgcacgcag tcagtcagaa ggacccgtgt 2940
tcagctgctg gtggctgcag tttcggaact caaagccttg cagcgactat tgtctgagcc 3000
atattgtgaa tctgctggag gattggggcc cttgtaccga gcacggggaa caccatatca 3060
ggattccacg aacaccagca cgagtgactg gaggggtgtt cctggtggac aagaaccccc 3120
acaatactac cgagagccgg ctggtggtcg atttcagtca gttttcaaga ggcaacacaa 3180
gggtgtcatg gcccaaattc gccgtcccta atctgcagag tctgactaac ctgctgtcta 3240
gtaatctgag ctggctgtcc ctggacgtgt ccgcagcctt ttaccacctg cctctgcatc 3300
cagctgcaat gccccatctg ctggtggggt caagcggact gagtcgctac gtcgcccgac 3360
tgtcctctaa ctcacgcatc attaatcacc agcatggcac catgcagaac ctgcacgata 3420
gctgttcccg gaatctgtac gtgtctctgc tgctgctgta taagacattc ggcagaaaac 3480
tgcacctgta cagccatcct atcattctgg ggtttaggaa gatcccaatg ggagtgggac 3540
tgagcccctt cctgctggca cagtttacct ccgccatttg ctctgtggtc cgccgagcct 3600
tcccacactg tctggctttt tcctatatga acaatgtggt cctgggcgcc aaatccgtgc 3660
agcatctgga gtctctgttc acagctgtca ctaactttct gctgagcctg gggatccacc 3720
tgaacccaaa taagactaaa cgctgggggt acagcctgaa tttcatggga tatgtgattg 3780
gatcctgggg gaccctgcca caggagcaca tcgtgcagaa gatcaaggaa tgctttcgga 3840
agctgcccgt caacagacct atcgactgga aagtgtgcca gcggattgtc ggactgctgg 3900
gcttcgccgc tccctttacc cagtgcgggt acccagcact gatgcccctg tatgcctgta 3960
tccagtctaa gcaggctttc acctttagtc ctacatacaa ggcattcctg tgcaaacagt 4020
acctgaacct gtatccagtg gcaaggcagc gacctggact gtgccaggtc tttgcaaatg 4080
ccactcctac cggctggggg ctggctatcg gacatcagcg aatgcggggc acattcgtgg 4140
cccccctgcc tattcacact gctcagctgc tggcagcctg ctttgctaga tctaggagtg 4200
gagcaaagct gatcggcacc gacaatagtg tggtcctgtc aagaaaatac acatccttcc 4260
catggctgct gggatgtgct gcaaactgga ttctgagggg caccagcttc gtgtacgtcc 4320
cctcagccct gaatcctgct gacgatccat cccgcgggcg actgggactg taccgacctc 4380
tgctgagact gcccttcagg cctacaactg gccggacatc tctgtatgcc gattcaccaa 4440
gcgtgccctc acacctgcct gacagagtcc actttgcttc acccctgcac gtcgcttggc 4500
ggcctcca 4508
<210> 54
<211> 4508
<212> DNA
<213> Artificial Sequence
<220>
<223> Pol coding sequence -IRES (EMCV)-PreS2.S-2A-preS1 coding sequence
<400> 54
atggctcgac ctctgtgtac cctgctactc ctgatggcta ccctggctgg agctctggcc 60
agcatgcccc tgtcttacca gcactttaga aagcttctgc tgctggacga tgaagccggg 120
cctctggagg aagagctgcc aaggctggca gacgaggggc tgaaccggag agtggccgaa 180
gatctgaatc tgggaaacct gaacgtgagc atcccttgga ctcataaagt cggcaacttc 240
accgggctgt acagctccac agtgcctgtc ttcaatccag agtggcagac accatccttt 300
cccaacattc acctgcagga ggacatcatt aatagatgcg aacagttcgt gggacctctg 360
acagtcaacg aaaagaggcg cctgaaactg atcatgcctg ccaggtttta cccaaatgtg 420
actaagtatc tgccactgga taagggcatc aagccttact atccagagca cctggtgaac 480
cattacttcc agactagaca ctatctgcat accctgtgga aggccggaat cctgtacaaa 540
cgagaaacta cccggagtgc ttcattttgt ggctccccat attcttggga acaggagctg 600
cagcatggca ggctggtgtt ccagaccagc aaacgccacg gggatgagtc cttttgcagc 660
cagtctagtg gcatcctgag cagatccccc gtggggcctt gtattcagtc tcagctgcgg 720
aagagtagac tgggactgca gccacagcag ggacacctgg cacgacggca gcagggaagg 780
tctggcagta tccgggctag agtgcatccc acaactagaa ggaccttcgg cgtcgagcca 840
tcaggaagcg gccacatcga caacagcgca tcaagctcct ctagttgcct gcatcagtca 900
gccgtgagaa aggccgctta cagccacctg tccacatcta aaaggcactc aagctccggg 960
catgctgtgg agctgcacaa catccctcca aattctgcac gcagtcagtc agaaggaccc 1020
gtgttcagct gctggtggct gcagtttcgg aactcaaagc cttgcagcga ctattgtctg 1080
agccatattg tgaatctgct ggaggattgg ggcccttgta ccgagcacgg ggaacaccat 1140
atcaggattc cacgaacacc agcacgagtg actggagggg tgttcctggt ggacaagaac 1200
ccccacaata ctaccgagag ccggctggtg gtcgatttca gtcagttttc aagaggcaac 1260
acaagggtgt catggcccaa attcgccgtc cctaatctgc agagtctgac taacctgctg 1320
tctagtaatc tgagctggct gtccctggac gtgtccgcag ccttttacca cctgcctctg 1380
catccagctg caatgcccca tctgctggtg gggtcaagcg gactgagtcg ctacgtcgcc 1440
cgactgtcct ctaactcacg catcattaat caccagcatg gcaccatgca gaacctgcac 1500
gatagctgtt cccggaatct gtacgtgtct ctgctgctgc tgtataagac attcggcaga 1560
aaactgcacc tgtacagcca tcctatcatt ctggggttta ggaagatccc aatgggagtg 1620
ggactgagcc ccttcctgct ggcacagttt acctccgcca tttgctctgt ggtccgccga 1680
gccttcccac actgtctggc tttttcctat atgaacaatg tggtcctggg cgccaaatcc 1740
gtgcagcatc tggagtctct gttcacagct gtcactaact ttctgctgag cctggggatc 1800
cacctgaacc caaataagac taaacgctgg gggtacagcc tgaatttcat gggatatgtg 1860
attggatcct gggggaccct gccacaggag cacatcgtgc agaagatcaa ggaatgcttt 1920
cggaagctgc ccgtcaacag acctatcgac tggaaagtgt gccagcggat tgtcggactg 1980
ctgggcttcg ccgctccctt tacccagtgc gggtacccag cactgatgcc cctgtatgcc 2040
tgtatccagt ctaagcaggc tttcaccttt agtcctacat acaaggcatt cctgtgcaaa 2100
cagtacctga acctgtatcc agtggcaagg cagcgacctg gactgtgcca ggtctttgca 2160
aatgccactc ctaccggctg ggggctggct atcggacatc agcgaatgcg gggcacattc 2220
gtggcccccc tgcctattca cactgctcag ctgctggcag cctgctttgc tagatctagg 2280
agtggagcaa agctgatcgg caccgacaat agtgtggtcc tgtcaagaaa atacacatcc 2340
ttcccatggc tgctgggatg tgctgcaaac tggattctga ggggcaccag cttcgtgtac 2400
gtcccctcag ccctgaatcc tgctgacgat ccatcccgcg ggcgactggg actgtaccga 2460
cctctgctga gactgccctt caggcctaca actggccgga catctctgta tgccgattca 2520
ccaagcgtgc cctcacacct gcctgacaga gtccactttg cttcacccct gcacgtcgct 2580
tggcggcctc cataagcccc tctccctccc ccccccctaa cgttactggc cgaagccgct 2640
tggaataagg ccggtgtgcg tttgtctata tgttattttc caccatattg ccgtcttttg 2700
gcaatgtgag ggcccggaaa cctggccctg tcttcttgac gagcattcct aggggtcttt 2760
cccctctcgc caaaggaatg caaggtctgt tgaatgtcgt gaaggaagca gttcctctgg 2820
aagcttcttg aagacaaaca acgtctgtag cgaccctttg caggcagcgg aaccccccac 2880
ctggcgacag gtgcctctgc ggccaaaagc cacgtgtata agatacacct gcaaaggcgg 2940
cacaacccca gtgccacgtt gtgagttgga tagttgtgga aagagtcaaa tggctctcct 3000
caagcgtatt caacaagggg ctgaaggatg cccagaaggt accccattgt atgggatctg 3060
atctggggcc tcggtgcaca tgctttacat gtgtttagtc gaggttaaaa aacgtctagg 3120
ccccccgaac cacggggacg tggttttcct ttgaaaaaca cgatgataat atggccacaa 3180
ccatgcagtg gaactcaact actttccatc agacccttca ggaccctaga gtgcgcgggc 3240
tgtactttcc tgctggggga agcagtagcg ggaccgttaa tccagtacct acgaccgcct 3300
ctcccatatc ttctatcttt agtaggactg gtgaccctgc tcccaacatg gagaatatca 3360
cctccgggtt tctgggccca ctcctggtcc ttcaggccgg attcttcctg ctgactcgaa 3420
tcctcaccat accccagagc ctggacagct ggtggacaag cctgaatttt ctgggaggaa 3480
ctcctgtatg cctgggacaa aattcacagt cccctacaag taaccattca ccgacaagtt 3540
gtcctcccat ctgtcccgga tacaggtgga tgtgcctgcg aaggttcatc atcttcctct 3600
tcatcctctt gctttgcctt attttcctcc tggttcttct ggactatcag ggcatgctgc 3660
ctgtgtgccc actgatacca ggatctagta ctaccagcac aggcccgtgt aagacctgta 3720
caattccagc acaagggact agtatgttcc cctcctgctg ttgtactaag ccaagcgacg 3780
gtaattgcac gtgtatccca atcccgtcct cctgggcgtt tgccaagtac ctctgggaat 3840
gggcctcagt cagattttca tggcttagtc ttttggtgcc gttcgtgcag tggtttgtgg 3900
gactctctcc gactgtgtgg ctcagcgtga tctggatgat gtggtactgg ggcccttccc 3960
tttacaacat actgtctcca ttccttcccc tgctgccaat cttcttttgc ctgtgggtct 4020
atattgggtc cggagcgact aacttttccc tgctgaaaca agcgggtgac gtcgaagaga 4080
atccgggacc tatggctagg cccctgtgta cacttttgct cctgatggcc accctcgctg 4140
gagctctggc aagcggtgga tggagctcaa agccgcggaa agggatgggt actaacctgt 4200
ccgtaccaaa tcccctggga ttttttccag accaccaact cgatcctgct tttggcgcaa 4260
attccaacaa tcccgactgg gactttaacc ctaacaagga ccactggcct gatgccaaca 4320
aggtgggggc aggagccttt ggtcccggct tcaccccacc ccatggaggt cttttgggat 4380
ggtcaccaca ggcccagggc atcctgacca ctgtccctgc tgctccaccg ccagcttcta 4440
ctaatcgaca gagcgggagg cagccgaccc ccctgagtcc ccccctgcgg gatacccacc 4500
ctcaggca 4508
<210> 55
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> 5' UTR
<400> 55
ataggcggcg catgagagaa gcccagacca attacctacc caaa 44
<210> 56
<211> 195
<212> DNA
<213> Artificial Sequence
<220>
<223> 5' replication sequence
<400> 56
taggagaaag ttcacgttga catcgaggaa gacagcccat tcctcagagc tttgcagcgg 60
agcttcccgc agtttgaggt agaagccaag caggtcactg ataatgacca tgctaatgcc 120
agagcgtttt cgcatctggc ttcaaaactg atcgaaacgg aggtggaccc atccgacacg 180
atccttgaca ttgga 195
<210> 57
<211> 142
<212> DNA
<213> Artificial Sequence
<220>
<223> DLP capsid enhancer
<400> 57
atagtcagca tagtacattt catctgacta atactacaac accaccacca tgaatagagg 60
attctttaac atgctcggcc gccgcccctt cccggccccc actgccatgt ggaggccgcg 120
gagaaggagg caggcggccc cg 142
<210> 58
<211> 1602
<212> DNA
<213> Artificial Sequence
<220>
<223> nsp1 coding sequence
<400> 58
gagaaagttc acgttgacat cgaggaagac agcccattcc tcagagcttt gcagcggagc 60
ttcccgcagt ttgaggtaga agccaagcag gtcactgata atgaccatgc taatgccaga 120
gcgttttcgc atctggcttc aaaactgatc gaaacggagg tggacccatc cgacacgatc 180
cttgacattg gaagtgcgcc cgcccgcaga atgtattcta agcacaagta tcattgtatc 240
tgtccgatga gatgtgcgga agatccggac agattgtata agtatgcaac taagctgaag 300
aaaaactgta aggaaataac tgataaggaa ttggacaaga aaatgaagga gctcgccgcc 360
gtcatgagcg accctgacct ggaaactgag actatgtgcc tccacgacga cgagtcgtgt 420
cgctacgaag ggcaagtcgc tgtttaccag gatgtatacg cggttgacgg accgacaagt 480
ctctatcacc aagccaataa gggagttaga gtcgcctact ggataggctt tgacaccacc 540
ccttttatgt ttaagaactt ggctggagca tatccatcat actctaccaa ctgggccgac 600
gaaaccgtgt taacggctcg taacataggc ctatgcagct ctgacgttat ggagcggtca 660
cgtagaggga tgtccattct tagaaagaag tatttgaaac catccaacaa tgttctattc 720
tctgttggct cgaccatcta ccacgagaag agggacttac tgaggagctg gcacctgccg 780
tctgtatttc acttacgtgg caagcaaaat tacacatgtc ggtgtgagac tatagttagt 840
tgcgacgggt acgtcgttaa aagaatagct atcagtccag gcctgtatgg gaagccttca 900
ggctatgctg ctacgatgca ccgcgaggga ttcttgtgct gcaaagtgac agacacattg 960
aacggggaga gggtctcttt tcccgtgtgc acgtatgtgc cagctacatt gtgtgaccaa 1020
atgactggca tactggcaac agatgtcagt gcggacgacg cgcaaaaact gctggttggg 1080
ctcaaccagc gtatagtcgt caacggtcgc acccagagaa acaccaatac catgaaaaat 1140
taccttttgc ccgtagtggc ccaggcattt gctaggtggg caaaggaata taaggaagat 1200
caagaagatg aaaggccact aggactacga gatagacagt tagtcatggg gtgttgttgg 1260
gcttttagaa ggcacaagat aacatctatt tataagcgcc cggataccca aaccatcatc 1320
aaagtgaaca gcgatttcca ctcattcgtg ctgcccagga taggcagtaa cacattggag 1380
atcgggctga gaacaagaat caggaaaatg ttagaggagc acaaggagcc gtcacctctc 1440
attaccgccg aggacgtaca agaagctaag tgcgcagccg atgaggctaa ggaggtgcgt 1500
gaagccgagg agttgcgcgc agctctacca cctttggcag ctgatgttga ggagcccact 1560
ctggaagccg atgtcgactt gatgttacaa gaggctgggg cc 1602
<210> 59
<211> 2382
<212> DNA
<213> Artificial Sequence
<220>
<223> nsp2 coding sequence
<400> 59
ggctcagtgg agacacctcg tggcttgata aaggttacca gctacgatgg cgaggacaag 60
atcggctctt acgctgtgct ttctccgcag gctgtactca agagtgaaaa attatcttgc 120
atccaccctc tcgctgaaca agtcatagtg ataacacact ctggccgaaa agggcgttat 180
gccgtggaac cataccatgg taaagtagtg gtgccagagg gacatgcaat acccgtccag 240
gactttcaag ctctgagtga aagtgccacc attgtgtaca acgaacgtga gttcgtaaac 300
aggtacctgc accatattgc cacacatgga ggagcgctga acactgatga agaatattac 360
aaaactgtca agcccagcga gcacgacggc gaatacctgt acgacatcga caggaaacag 420
tgcgtcaaga aagaactagt cactgggcta gggctcacag gcgagctggt ggatcctccc 480
ttccatgaat tcgcctacga gagtctgaga acacgaccag ccgctcctta ccaagtacca 540
accatagggg tgtatggcgt gccaggatca ggcaagtctg gcatcattaa aagcgcagtc 600
accaaaaaag atctagtggt gagcgccaag aaagaaaact gtgcagaaat tataagggac 660
gtcaagaaaa tgaaagggct ggacgtcaat gccagaactg tggactcagt gctcttgaat 720
ggatgcaaac accccgtaga gaccctgtat attgacgaag cttttgcttg tcatgcaggt 780
actctcagag cgctcatagc cattataaga cctaaaaagg cagtgctctg cggggatccc 840
aaacagtgcg gtttttttaa catgatgtgc ctgaaagtgc attttaacca cgagatttgc 900
acacaagtct tccacaaaag catctctcgc cgttgcacta aatctgtgac ttcggtcgtc 960
tcaaccttgt tttacgacaa aaaaatgaga acgacgaatc cgaaagagac taagattgtg 1020
attgacacta ccggcagtac caaacctaag caggacgatc tcattctcac ttgtttcaga 1080
gggtgggtga agcagttgca aatagattac aaaggcaacg aaataatgac ggcagctgcc 1140
tctcaagggc tgacccgtaa aggtgtgtat gccgttcggt acaaggtgaa tgaaaatcct 1200
ctgtacgcac ccacctctga acatgtgaac gtcctactga cccgcacgga ggaccgcatc 1260
gtgtggaaaa cactagccgg cgacccatgg ataaaaacac tgactgccaa gtaccctggg 1320
aatttcactg ccacgataga ggagtggcaa gcagagcatg atgccatcat gaggcacatc 1380
ttggagagac cggaccctac cgacgtcttc cagaataagg caaacgtgtg ttgggccaag 1440
gctttagtgc cggtgctgaa gaccgctggc atagacatga ccactgaaca atggaacact 1500
gtggattatt ttgaaacgga caaagctcac tcagcagaga tagtattgaa ccaactatgc 1560
gtgaggttct ttggactcga tctggactcc ggtctatttt ctgcacccac tgttccgtta 1620
tccattagga ataatcactg ggataactcc ccgtcgccta acatgtacgg gctgaataaa 1680
gaagtggtcc gtcagctctc tcgcaggtac ccacaactgc ctcgggcagt tgccactgga 1740
agagtctatg acatgaacac tggtacactg cgcaattatg atccgcgcat aaacctagta 1800
cctgtaaaca gaagactgcc tcatgcttta gtcctccacc ataatgaaca cccacagagt 1860
gacttttctt cattcgtcag caaattgaag ggcagaactg tcctggtggt cggggaaaag 1920
ttgtccgtcc caggcaaaat ggttgactgg ttgtcagacc ggcctgaggc taccttcaga 1980
gctcggctgg atttaggcat cccaggtgat gtgcccaaat atgacataat atttgttaat 2040
gtgaggaccc catataaata ccatcactat cagcagtgtg aagaccatgc cattaagctt 2100
agcatgttga ccaagaaagc ttgtctgcat ctgaatcccg gcggaacctg tgtcagcata 2160
ggttatggtt acgctgacag ggccagcgaa agcatcattg gtgctatagc gcggcagttc 2220
aagttttccc gggtatgcaa accgaaatcc tcacttgaag agacggaagt tctgtttgta 2280
ttcattgggt acgatcgcaa ggcccgtacg cacaatcctt acaagctttc atcaaccttg 2340
accaacattt atacaggttc cagactccac gaagccggat gt 2382
<210> 60
<211> 1671
<212> DNA
<213> Artificial Sequence
<220>
<223> nsp3 coding sequence
<400> 60
gcaccctcat atcatgtggt gcgaggggat attgccacgg ccaccgaagg agtgattata 60
aatgctgcta acagcaaagg acaacctggc ggaggggtgt gcggagcgct gtataagaaa 120
ttcccggaaa gcttcgattt acagccgatc gaagtaggaa aagcgcgact ggtcaaaggt 180
gcagctaaac atatcattca tgccgtagga ccaaacttca acaaagtttc ggaggttgaa 240
ggtgacaaac agttggcaga ggcttatgag tccatcgcta agattgtcaa cgataacaat 300
tacaagtcag tagcgattcc actgttgtcc accggcatct tttccgggaa caaagatcga 360
ctaacccaat cattgaacca tttgctgaca gctttagaca ccactgatgc agatgtagcc 420
atatactgca gggacaagaa atgggaaatg actctcaagg aagcagtggc taggagagaa 480
gcagtggagg agatatgcat atccgacgac tcttcagtga cagaacctga tgcagagctg 540
gtgagggtgc atccgaagag ttctttggct ggaaggaagg gctacagcac aagcgatggc 600
aaaactttct catatttgga agggaccaag tttcaccagg cggccaagga tatagcagaa 660
attaatgcca tgtggcccgt tgcaacggag gccaatgagc aggtatgcat gtatatcctc 720
ggagaaagca tgagcagtat taggtcgaaa tgccccgtcg aagagtcgga agcctccaca 780
ccacctagca cgctgccttg cttgtgcatc catgccatga ctccagaaag agtacagcgc 840
ctaaaagcct cacgtccaga acaaattact gtgtgctcat cctttccatt gccgaagtat 900
agaatcactg gtgtgcagaa gatccaatgc tcccagccta tattgttctc accgaaagtg 960
cctgcgtata ttcatccaag gaagtatctc gtggaaacac caccggtaga cgagactccg 1020
gagccatcgg cagagaacca atccacagag gggacacctg aacaaccacc acttataacc 1080
gaggatgaga ccaggactag aacgcctgag ccgatcatca tcgaagagga agaagaggat 1140
agcataagtt tgctgtcaga tggcccgacc caccaggtgc tgcaagtcga ggcagacatt 1200
cacgggccgc cctctgtatc tagctcatcc tggtccattc ctcatgcatc cgactttgat 1260
gtggacagtt tatccatact tgacaccctg gagggagcta gcgtgaccag cggggcaacg 1320
tcagccgaga ctaactctta cttcgcaaag agtatggagt ttctggcgcg accggtgcct 1380
gcgcctcgaa cagtattcag gaaccctcca catcccgctc cgcgcacaag aacaccgtca 1440
cttgcaccca gcagggcctg ctcgagaacc agcctagttt ccaccccgcc aggcgtgaat 1500
agggtgatca ctagagagga gctcgaggcg cttaccccgt cacgcactcc tagcaggtcg 1560
gtctcgagaa ccagcctggt ctccaacccg ccaggcgtaa atagggtgat tacaagagag 1620
gagtttgagg cgttcgtagc acaacaacaa tgacggtttg atgcgggtgc a 1671
<210> 61
<211> 1821
<212> DNA
<213> Artificial Sequence
<220>
<223> nsp4 coding sequence
<400> 61
tacatctttt cctccgacac cggtcaaggg catttacaac aaaaatcagt aaggcaaacg 60
gtgctatccg aagtggtgtt ggagaggacc gaattggaga tttcgtatgc cccgcgcctc 120
gaccaagaaa aagaagaatt actacgcaag aaattacagt taaatcccac acctgctaac 180
agaagcagat accagtccag gaaggtggag aacatgaaag ccataacagc tagacgtatt 240
ctgcaaggcc tagggcatta tttgaaggca gaaggaaaag tggagtgcta ccgaaccctg 300
catcctgttc ctttgtattc atctagtgtg aaccgtgcct tttcaagccc caaggtcgca 360
gtggaagcct gtaacgccat gttgaaagag aactttccga ctgtggcttc ttactgtatt 420
attccagagt acgatgccta tttggacatg gttgacggag cttcatgctg cttagacact 480
gccagttttt gccctgcaaa gctgcgcagc tttccaaaga aacactccta tttggaaccc 540
acaatacgat cggcagtgcc ttcagcgatc cagaacacgc tccagaacgt cctggcagct 600
gccacaaaaa gaaattgcaa tgtcacgcaa atgagagaat tgcccgtatt ggattcggcg 660
gcctttaatg tggaatgctt caagaaatat gcgtgtaata atgaatattg ggaaacgttt 720
aaagaaaacc ccatcaggct tactgaagaa aacgtggtaa attacattac caaattaaaa 780
ggaccaaaag ctgctgctct ttttgcgaag acacataatt tgaatatgtt gcaggacata 840
ccaatggaca ggtttgtaat ggacttaaag agagacgtga aagtgactcc aggaacaaaa 900
catactgaag aacggcccaa ggtacaggtg atccaggctg ccgatccgct agcaacagcg 960
tatctgtgcg gaatccaccg agagctggtt aggagattaa atgcggtcct gcttccgaac 1020
attcatacac tgtttgatat gtcggctgaa gactttgacg ctattatagc cgagcacttc 1080
cagcctgggg attgtgttct ggaaactgac atcgcgtcgt ttgataaaag tgaggacgac 1140
gccatggctc tgaccgcgtt aatgattctg gaagacttag gtgtggacgc agagctgttg 1200
acgctgattg aggcggcttt cggcgaaatt tcatcaatac atttgcccac taaaactaaa 1260
tttaaattcg gagccatgat gaaatctgga atgttcctca cactgtttgt gaacacagtc 1320
attaacattg taatcgcaag cagagtgttg agagaacggc taaccggatc accatgtgca 1380
gcattcattg gagatgacaa tatcgtgaaa ggagtcaaat cggacaaatt aatggcagac 1440
aggtgcgcca cctggttgaa tatggaagtc aagattatag atgctgtggt gggcgagaaa 1500
gcgccttatt tctgtggagg gtttattttg tgtgactccg tgaccggcac agcgtgccgt 1560
gtggcagacc ccctaaaaag gctgtttaag cttggcaaac ctctggcagc agacgatgaa 1620
catgatgatg acaggagaag ggcattgcat gaagagtcaa cacgctggaa ccgagtgggt 1680
attctttcag agctgtgcaa ggcagtagaa tcaaggtatg aaaccgtagg aacttccatc 1740
atagttatgg ccatgactac tctagctagc agtgttaaat cattcagcta cctgagaggg 1800
gcccctataa ctctctacgg c 1821
<210> 62
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> 26S subgenomic promoter
<400> 62
ctctctacgg ctaacctgaa tgga 24
<210> 63
<211> 117
<212> DNA
<213> Artificial Sequence
<220>
<223> 3' UTR
<400> 63
atacagcagc aattggcaag ctgcttacat agaactcgcg gcgattggca tgccgcttta 60
aaatttttat tttatttttc ttttcttttc cgaatcggat tttgttttta atatttc 117
<210> 64
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Poly Adenosine
<400> 64
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 40
<210> 65
<211> 11338
<212> DNA
<213> Artificial Sequence
<220>
<223> Core-2A-Pol Replicon
<400> 65
ataggcggcg catgagagaa gcccagacca attacctacc caaataggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
tagtcagcat agtacatttc atctgactaa tactacaaca ccaccaccat gaatagagga 300
ttctttaaca tgctcggccg ccgccccttc ccggccccca ctgccatgtg gaggccgcgg 360
agaaggaggc aggcggcccc gggaagcgga gctactaact tcagcctgct gaagcaggct 420
ggagacgtgg aggagaaccc tggacctgag aaagttcacg ttgacatcga ggaagacagc 480
ccattcctca gagctttgca gcggagcttc ccgcagtttg aggtagaagc caagcaggtc 540
actgataatg accatgctaa tgccagagcg ttttcgcatc tggcttcaaa actgatcgaa 600
acggaggtgg acccatccga cacgatcctt gacattggaa gtgcgcccgc ccgcagaatg 660
tattctaagc acaagtatca ttgtatctgt ccgatgagat gtgcggaaga tccggacaga 720
ttgtataagt atgcaactaa gctgaagaaa aactgtaagg aaataactga taaggaattg 780
gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc ctgacctgga aactgagact 840
atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc aagtcgctgt ttaccaggat 900
gtatacgcgg ttgacggacc gacaagtctc tatcaccaag ccaataaggg agttagagtc 960
gcctactgga taggctttga caccacccct tttatgttta agaacttggc tggagcatat 1020
ccatcatact ctaccaactg ggccgacgaa accgtgttaa cggctcgtaa cataggccta 1080
tgcagctctg acgttatgga gcggtcacgt agagggatgt ccattcttag aaagaagtat 1140
ttgaaaccat ccaacaatgt tctattctct gttggctcga ccatctacca cgagaagagg 1200
gacttactga ggagctggca cctgccgtct gtatttcact tacgtggcaa gcaaaattac 1260
acatgtcggt gtgagactat agttagttgc gacgggtacg tcgttaaaag aatagctatc 1320
agtccaggcc tgtatgggaa gccttcaggc tatgctgcta cgatgcaccg cgagggattc 1380
ttgtgctgca aagtgacaga cacattgaac ggggagaggg tctcttttcc cgtgtgcacg 1440
tatgtgccag ctacattgtg tgaccaaatg actggcatac tggcaacaga tgtcagtgcg 1500
gacgacgcgc aaaaactgct ggttgggctc aaccagcgta tagtcgtcaa cggtcgcacc 1560
cagagaaaca ccaataccat gaaaaattac cttttgcccg tagtggccca ggcatttgct 1620
aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa ggccactagg actacgagat 1680
agacagttag tcatggggtg ttgttgggct tttagaaggc acaagataac atctatttat 1740
aagcgcccgg atacccaaac catcatcaaa gtgaacagcg atttccactc attcgtgctg 1800
cccaggatag gcagtaacac attggagatc gggctgagaa caagaatcag gaaaatgtta 1860
gaggagcaca aggagccgtc acctctcatt accgccgagg acgtacaaga agctaagtgc 1920
gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt tgcgcgcagc tctaccacct 1980
ttggcagctg atgttgagga gcccactctg gaagccgatg tcgacttgat gttacaagag 2040
gctggggccg gctcagtgga gacacctcgt ggcttgataa aggttaccag ctacgatggc 2100
gaggacaaga tcggctctta cgctgtgctt tctccgcagg ctgtactcaa gagtgaaaaa 2160
ttatcttgca tccaccctct cgctgaacaa gtcatagtga taacacactc tggccgaaaa 2220
gggcgttatg ccgtggaacc ataccatggt aaagtagtgg tgccagaggg acatgcaata 2280
cccgtccagg actttcaagc tctgagtgaa agtgccacca ttgtgtacaa cgaacgtgag 2340
ttcgtaaaca ggtacctgca ccatattgcc acacatggag gagcgctgaa cactgatgaa 2400
gaatattaca aaactgtcaa gcccagcgag cacgacggcg aatacctgta cgacatcgac 2460
aggaaacagt gcgtcaagaa agaactagtc actgggctag ggctcacagg cgagctggtg 2520
gatcctccct tccatgaatt cgcctacgag agtctgagaa cacgaccagc cgctccttac 2580
caagtaccaa ccataggggt gtatggcgtg ccaggatcag gcaagtctgg catcattaaa 2640
agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga aagaaaactg tgcagaaatt 2700
ataagggacg tcaagaaaat gaaagggctg gacgtcaatg ccagaactgt ggactcagtg 2760
ctcttgaatg gatgcaaaca ccccgtagag accctgtata ttgacgaagc ttttgcttgt 2820
catgcaggta ctctcagagc gctcatagcc attataagac ctaaaaaggc agtgctctgc 2880
ggggatccca aacagtgcgg tttttttaac atgatgtgcc tgaaagtgca ttttaaccac 2940
gagatttgca cacaagtctt ccacaaaagc atctctcgcc gttgcactaa atctgtgact 3000
tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa cgacgaatcc gaaagagact 3060
aagattgtga ttgacactac cggcagtacc aaacctaagc aggacgatct cattctcact 3120
tgtttcagag ggtgggtgaa gcagttgcaa atagattaca aaggcaacga aataatgacg 3180
gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg ccgttcggta caaggtgaat 3240
gaaaatcctc tgtacgcacc cacctctgaa catgtgaacg tcctactgac ccgcacggag 3300
gaccgcatcg tgtggaaaac actagccggc gacccatgga taaaaacact gactgccaag 3360
taccctggga atttcactgc cacgatagag gagtggcaag cagagcatga tgccatcatg 3420
aggcacatct tggagagacc ggaccctacc gacgtcttcc agaataaggc aaacgtgtgt 3480
tgggccaagg ctttagtgcc ggtgctgaag accgctggca tagacatgac cactgaacaa 3540
tggaacactg tggattattt tgaaacggac aaagctcact cagcagagat agtattgaac 3600
caactatgcg tgaggttctt tggactcgat ctggactccg gtctattttc tgcacccact 3660
gttccgttat ccattaggaa taatcactgg gataactccc cgtcgcctaa catgtacggg 3720
ctgaataaag aagtggtccg tcagctctct cgcaggtacc cacaactgcc tcgggcagtt 3780
gccactggaa gagtctatga catgaacact ggtacactgc gcaattatga tccgcgcata 3840
aacctagtac ctgtaaacag aagactgcct catgctttag tcctccacca taatgaacac 3900
ccacagagtg acttttcttc attcgtcagc aaattgaagg gcagaactgt cctggtggtc 3960
ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt tgtcagaccg gcctgaggct 4020
accttcagag ctcggctgga tttaggcatc ccaggtgatg tgcccaaata tgacataata 4080
tttgttaatg tgaggacccc atataaatac catcactatc agcagtgtga agaccatgcc 4140
attaagctta gcatgttgac caagaaagct tgtctgcatc tgaatcccgg cggaacctgt 4200
gtcagcatag gttatggtta cgctgacagg gccagcgaaa gcatcattgg tgctatagcg 4260
cggcagttca agttttcccg ggtatgcaaa ccgaaatcct cacttgaaga gacggaagtt 4320
ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc acaatcctta caagctttca 4380
tcaaccttga ccaacattta tacaggttcc agactccacg aagccggatg tgcaccctca 4440
tatcatgtgg tgcgagggga tattgccacg gccaccgaag gagtgattat aaatgctgct 4500
aacagcaaag gacaacctgg cggaggggtg tgcggagcgc tgtataagaa attcccggaa 4560
agcttcgatt tacagccgat cgaagtagga aaagcgcgac tggtcaaagg tgcagctaaa 4620
catatcattc atgccgtagg accaaacttc aacaaagttt cggaggttga aggtgacaaa 4680
cagttggcag aggcttatga gtccatcgct aagattgtca acgataacaa ttacaagtca 4740
gtagcgattc cactgttgtc caccggcatc ttttccggga acaaagatcg actaacccaa 4800
tcattgaacc atttgctgac agctttagac accactgatg cagatgtagc catatactgc 4860
agggacaaga aatgggaaat gactctcaag gaagcagtgg ctaggagaga agcagtggag 4920
gagatatgca tatccgacga ctcttcagtg acagaacctg atgcagagct ggtgagggtg 4980
catccgaaga gttctttggc tggaaggaag ggctacagca caagcgatgg caaaactttc 5040
tcatatttgg aagggaccaa gtttcaccag gcggccaagg atatagcaga aattaatgcc 5100
atgtggcccg ttgcaacgga ggccaatgag caggtatgca tgtatatcct cggagaaagc 5160
atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg aagcctccac accacctagc 5220
acgctgcctt gcttgtgcat ccatgccatg actccagaaa gagtacagcg cctaaaagcc 5280
tcacgtccag aacaaattac tgtgtgctca tcctttccat tgccgaagta tagaatcact 5340
ggtgtgcaga agatccaatg ctcccagcct atattgttct caccgaaagt gcctgcgtat 5400
attcatccaa ggaagtatct cgtggaaaca ccaccggtag acgagactcc ggagccatcg 5460
gcagagaacc aatccacaga ggggacacct gaacaaccac cacttataac cgaggatgag 5520
accaggacta gaacgcctga gccgatcatc atcgaagagg aagaagagga tagcataagt 5580
ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg aggcagacat tcacgggccg 5640
ccctctgtat ctagctcatc ctggtccatt cctcatgcat ccgactttga tgtggacagt 5700
ttatccatac ttgacaccct ggagggagct agcgtgacca gcggggcaac gtcagccgag 5760
actaactctt acttcgcaaa gagtatggag tttctggcgc gaccggtgcc tgcgcctcga 5820
acagtattca ggaaccctcc acatcccgct ccgcgcacaa gaacaccgtc acttgcaccc 5880
agcagggcct gctcgagaac cagcctagtt tccaccccgc caggcgtgaa tagggtgatc 5940
actagagagg agctcgaggc gcttaccccg tcacgcactc ctagcaggtc ggtctcgaga 6000
accagcctgg tctccaaccc gccaggcgta aatagggtga ttacaagaga ggagtttgag 6060
gcgttcgtag cacaacaaca atgacggttt gatgcgggtg catacatctt ttcctccgac 6120
accggtcaag ggcatttaca acaaaaatca gtaaggcaaa cggtgctatc cgaagtggtg 6180
ttggagagga ccgaattgga gatttcgtat gccccgcgcc tcgaccaaga aaaagaagaa 6240
ttactacgca agaaattaca gttaaatccc acacctgcta acagaagcag ataccagtcc 6300
aggaaggtgg agaacatgaa agccataaca gctagacgta ttctgcaagg cctagggcat 6360
tatttgaagg cagaaggaaa agtggagtgc taccgaaccc tgcatcctgt tcctttgtat 6420
tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg cagtggaagc ctgtaacgcc 6480
atgttgaaag agaactttcc gactgtggct tcttactgta ttattccaga gtacgatgcc 6540
tatttggaca tggttgacgg agcttcatgc tgcttagaca ctgccagttt ttgccctgca 6600
aagctgcgca gctttccaaa gaaacactcc tatttggaac ccacaatacg atcggcagtg 6660
ccttcagcga tccagaacac gctccagaac gtcctggcag ctgccacaaa aagaaattgc 6720
aatgtcacgc aaatgagaga attgcccgta ttggattcgg cggcctttaa tgtggaatgc 6780
ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt ttaaagaaaa ccccatcagg 6840
cttactgaag aaaacgtggt aaattacatt accaaattaa aaggaccaaa agctgctgct 6900
ctttttgcga agacacataa tttgaatatg ttgcaggaca taccaatgga caggtttgta 6960
atggacttaa agagagacgt gaaagtgact ccaggaacaa aacatactga agaacggccc 7020
aaggtacagg tgatccaggc tgccgatccg ctagcaacag cgtatctgtg cggaatccac 7080
cgagagctgg ttaggagatt aaatgcggtc ctgcttccga acattcatac actgtttgat 7140
atgtcggctg aagactttga cgctattata gccgagcact tccagcctgg ggattgtgtt 7200
ctggaaactg acatcgcgtc gtttgataaa agtgaggacg acgccatggc tctgaccgcg 7260
ttaatgattc tggaagactt aggtgtggac gcagagctgt tgacgctgat tgaggcggct 7320
ttcggcgaaa tttcatcaat acatttgccc actaaaacta aatttaaatt cggagccatg 7380
atgaaatctg gaatgttcct cacactgttt gtgaacacag tcattaacat tgtaatcgca 7440
agcagagtgt tgagagaacg gctaaccgga tcaccatgtg cagcattcat tggagatgac 7500
aatatcgtga aaggagtcaa atcggacaaa ttaatggcag acaggtgcgc cacctggttg 7560
aatatggaag tcaagattat agatgctgtg gtgggcgaga aagcgcctta tttctgtgga 7620
gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc gtgtggcaga ccccctaaaa 7680
aggctgttta agcttggcaa acctctggca gcagacgatg aacatgatga tgacaggaga 7740
agggcattgc atgaagagtc aacacgctgg aaccgagtgg gtattctttc agagctgtgc 7800
aaggcagtag aatcaaggta tgaaaccgta ggaacttcca tcatagttat ggccatgact 7860
actctagcta gcagtgttaa atcattcagc tacctgagag gggcccctat aactctctac 7920
ggctaacctg aatggactac gacatagtct agtccgccaa gatatcatgg ctcgacctct 7980
gtgtaccctg ctactcctga tggctaccct ggctggagct ctggccagcg acatcgaccc 8040
ttacaaggag ttcggcgcca gcgtggaact gctgtctttt ctgcccagtg atttctttcc 8100
ttccattcga gacctgctgg ataccgcctc tgctctgtat cgggaagccc tggagagccc 8160
agaacactgc tccccacacc ataccgctct gcgacaggca atcctgtgct ggggggagct 8220
gatgaacctg gccacatggg tgggatcgaa tctggaggac cccgcttcac gggaactggt 8280
ggtcagctac gtgaacgtca atatgggcct gaaaatccgc cagctgctgt ggttccatat 8340
tagctgcctg acttttggac gagagaccgt gctggaatac ctggtgtcct tcggcgtctg 8400
gattcgcact ccccctgctt atcgaccacc caacgcacca attctgtcca ccctgcccga 8460
gaccacagtg gtccgtcgcc gtggaagcgg agctactaac ttcagcctgc tgaagcaggc 8520
tggagacgtg gaggagaacc ctggacctat ggctcgacct ctgtgtaccc tgctactcct 8580
gatggctacc ctggctggag ctctggccag catgcccctg tcttaccagc actttagaaa 8640
gcttctgctg ctggacgatg aagccgggcc tctggaggaa gagctgccaa ggctggcaga 8700
cgaggggctg aaccggagag tggccgaaga tctgaatctg ggaaacctga acgtgagcat 8760
cccttggact cataaagtcg gcaacttcac cgggctgtac agctccacag tgcctgtctt 8820
caatccagag tggcagacac catcctttcc caacattcac ctgcaggagg acatcattaa 8880
tagatgcgaa cagttcgtgg gacctctgac agtcaacgaa aagaggcgcc tgaaactgat 8940
catgcctgcc aggttttacc caaatgtgac taagtatctg ccactggata agggcatcaa 9000
gccttactat ccagagcacc tggtgaacca ttacttccag actagacact atctgcatac 9060
cctgtggaag gccggaatcc tgtacaaacg agaaactacc cggagtgctt cattttgtgg 9120
ctccccatat tcttgggaac aggagctgca gcatggcagg ctggtgttcc agaccagcaa 9180
acgccacggg gatgagtcct tttgcagcca gtctagtggc atcctgagca gatcccccgt 9240
ggggccttgt attcagtctc agctgcggaa gagtagactg ggactgcagc cacagcaggg 9300
acacctggca cgacggcagc agggaaggtc tggcagtatc cgggctagag tgcatcccac 9360
aactagaagg accttcggcg tcgagccatc aggaagcggc cacatcgaca acagcgcatc 9420
aagctcctct agttgcctgc atcagtcagc cgtgagaaag gccgcttaca gccacctgtc 9480
cacatctaaa aggcactcaa gctccgggca tgctgtggag ctgcacaaca tccctccaaa 9540
ttctgcacgc agtcagtcag aaggacccgt gttcagctgc tggtggctgc agtttcggaa 9600
ctcaaagcct tgcagcgact attgtctgag ccatattgtg aatctgctgg aggattgggg 9660
cccttgtacc gagcacgggg aacaccatat caggattcca cgaacaccag cacgagtgac 9720
tggaggggtg ttcctggtgg acaagaaccc ccacaatact accgagagcc ggctggtggt 9780
cgatttcagt cagttttcaa gaggcaacac aagggtgtca tggcccaaat tcgccgtccc 9840
taatctgcag agtctgacta acctgctgtc tagtaatctg agctggctgt ccctggacgt 9900
gtccgcagcc ttttaccacc tgcctctgca tccagctgca atgccccatc tgctggtggg 9960
gtcaagcgga ctgagtcgct acgtcgcccg actgtcctct aactcacgca tcattaatca 10020
ccagcatggc accatgcaga acctgcacga tagctgttcc cggaatctgt acgtgtctct 10080
gctgctgctg tataagacat tcggcagaaa actgcacctg tacagccatc ctatcattct 10140
ggggtttagg aagatcccaa tgggagtggg actgagcccc ttcctgctgg cacagtttac 10200
ctccgccatt tgctctgtgg tccgccgagc cttcccacac tgtctggctt tttcctatat 10260
gaacaatgtg gtcctgggcg ccaaatccgt gcagcatctg gagtctctgt tcacagctgt 10320
cactaacttt ctgctgagcc tggggatcca cctgaaccca aataagacta aacgctgggg 10380
gtacagcctg aatttcatgg gatatgtgat tggatcctgg gggaccctgc cacaggagca 10440
catcgtgcag aagatcaagg aatgctttcg gaagctgccc gtcaacagac ctatcgactg 10500
gaaagtgtgc cagcggattg tcggactgct gggcttcgcc gctcccttta cccagtgcgg 10560
gtacccagca ctgatgcccc tgtatgcctg tatccagtct aagcaggctt tcacctttag 10620
tcctacatac aaggcattcc tgtgcaaaca gtacctgaac ctgtatccag tggcaaggca 10680
gcgacctgga ctgtgccagg tctttgcaaa tgccactcct accggctggg ggctggctat 10740
cggacatcag cgaatgcggg gcacattcgt ggcccccctg cctattcaca ctgctcagct 10800
gctggcagcc tgctttgcta gatctaggag tggagcaaag ctgatcggca ccgacaatag 10860
tgtggtcctg tcaagaaaat acacatcctt cccatggctg ctgggatgtg ctgcaaactg 10920
gattctgagg ggcaccagct tcgtgtacgt cccctcagcc ctgaatcctg ctgacgatcc 10980
atcccgcggg cgactgggac tgtaccgacc tctgctgaga ctgcccttca ggcctacaac 11040
tggccggaca tctctgtatg ccgattcacc aagcgtgccc tcacacctgc ctgacagagt 11100
ccactttgct tcacccctgc acgtcgcttg gcggcctcca taaggcgcgc cgtttaaacg 11160
gccggcctta attaagtaac gatacagcag caattggcaa gctgcttaca tagaactcgc 11220
ggcgattggc atgccgcttt aaaattttta ttttattttt cttttctttt ccgaatcgga 11280
ttttgttttt aatatttcaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaa 11338
<210> 66
<211> 11862
<212> DNA
<213> Artificial Sequence
<220>
<223> Pol-IRES (EMCV)-Core Replicon
<400> 66
ataggcggcg catgagagaa gcccagacca attacctacc caaataggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
tagtcagcat agtacatttc atctgactaa tactacaaca ccaccaccat gaatagagga 300
ttctttaaca tgctcggccg ccgccccttc ccggccccca ctgccatgtg gaggccgcgg 360
agaaggaggc aggcggcccc gggaagcgga gctactaact tcagcctgct gaagcaggct 420
ggagacgtgg aggagaaccc tggacctgag aaagttcacg ttgacatcga ggaagacagc 480
ccattcctca gagctttgca gcggagcttc ccgcagtttg aggtagaagc caagcaggtc 540
actgataatg accatgctaa tgccagagcg ttttcgcatc tggcttcaaa actgatcgaa 600
acggaggtgg acccatccga cacgatcctt gacattggaa gtgcgcccgc ccgcagaatg 660
tattctaagc acaagtatca ttgtatctgt ccgatgagat gtgcggaaga tccggacaga 720
ttgtataagt atgcaactaa gctgaagaaa aactgtaagg aaataactga taaggaattg 780
gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc ctgacctgga aactgagact 840
atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc aagtcgctgt ttaccaggat 900
gtatacgcgg ttgacggacc gacaagtctc tatcaccaag ccaataaggg agttagagtc 960
gcctactgga taggctttga caccacccct tttatgttta agaacttggc tggagcatat 1020
ccatcatact ctaccaactg ggccgacgaa accgtgttaa cggctcgtaa cataggccta 1080
tgcagctctg acgttatgga gcggtcacgt agagggatgt ccattcttag aaagaagtat 1140
ttgaaaccat ccaacaatgt tctattctct gttggctcga ccatctacca cgagaagagg 1200
gacttactga ggagctggca cctgccgtct gtatttcact tacgtggcaa gcaaaattac 1260
acatgtcggt gtgagactat agttagttgc gacgggtacg tcgttaaaag aatagctatc 1320
agtccaggcc tgtatgggaa gccttcaggc tatgctgcta cgatgcaccg cgagggattc 1380
ttgtgctgca aagtgacaga cacattgaac ggggagaggg tctcttttcc cgtgtgcacg 1440
tatgtgccag ctacattgtg tgaccaaatg actggcatac tggcaacaga tgtcagtgcg 1500
gacgacgcgc aaaaactgct ggttgggctc aaccagcgta tagtcgtcaa cggtcgcacc 1560
cagagaaaca ccaataccat gaaaaattac cttttgcccg tagtggccca ggcatttgct 1620
aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa ggccactagg actacgagat 1680
agacagttag tcatggggtg ttgttgggct tttagaaggc acaagataac atctatttat 1740
aagcgcccgg atacccaaac catcatcaaa gtgaacagcg atttccactc attcgtgctg 1800
cccaggatag gcagtaacac attggagatc gggctgagaa caagaatcag gaaaatgtta 1860
gaggagcaca aggagccgtc acctctcatt accgccgagg acgtacaaga agctaagtgc 1920
gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt tgcgcgcagc tctaccacct 1980
ttggcagctg atgttgagga gcccactctg gaagccgatg tcgacttgat gttacaagag 2040
gctggggccg gctcagtgga gacacctcgt ggcttgataa aggttaccag ctacgatggc 2100
gaggacaaga tcggctctta cgctgtgctt tctccgcagg ctgtactcaa gagtgaaaaa 2160
ttatcttgca tccaccctct cgctgaacaa gtcatagtga taacacactc tggccgaaaa 2220
gggcgttatg ccgtggaacc ataccatggt aaagtagtgg tgccagaggg acatgcaata 2280
cccgtccagg actttcaagc tctgagtgaa agtgccacca ttgtgtacaa cgaacgtgag 2340
ttcgtaaaca ggtacctgca ccatattgcc acacatggag gagcgctgaa cactgatgaa 2400
gaatattaca aaactgtcaa gcccagcgag cacgacggcg aatacctgta cgacatcgac 2460
aggaaacagt gcgtcaagaa agaactagtc actgggctag ggctcacagg cgagctggtg 2520
gatcctccct tccatgaatt cgcctacgag agtctgagaa cacgaccagc cgctccttac 2580
caagtaccaa ccataggggt gtatggcgtg ccaggatcag gcaagtctgg catcattaaa 2640
agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga aagaaaactg tgcagaaatt 2700
ataagggacg tcaagaaaat gaaagggctg gacgtcaatg ccagaactgt ggactcagtg 2760
ctcttgaatg gatgcaaaca ccccgtagag accctgtata ttgacgaagc ttttgcttgt 2820
catgcaggta ctctcagagc gctcatagcc attataagac ctaaaaaggc agtgctctgc 2880
ggggatccca aacagtgcgg tttttttaac atgatgtgcc tgaaagtgca ttttaaccac 2940
gagatttgca cacaagtctt ccacaaaagc atctctcgcc gttgcactaa atctgtgact 3000
tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa cgacgaatcc gaaagagact 3060
aagattgtga ttgacactac cggcagtacc aaacctaagc aggacgatct cattctcact 3120
tgtttcagag ggtgggtgaa gcagttgcaa atagattaca aaggcaacga aataatgacg 3180
gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg ccgttcggta caaggtgaat 3240
gaaaatcctc tgtacgcacc cacctctgaa catgtgaacg tcctactgac ccgcacggag 3300
gaccgcatcg tgtggaaaac actagccggc gacccatgga taaaaacact gactgccaag 3360
taccctggga atttcactgc cacgatagag gagtggcaag cagagcatga tgccatcatg 3420
aggcacatct tggagagacc ggaccctacc gacgtcttcc agaataaggc aaacgtgtgt 3480
tgggccaagg ctttagtgcc ggtgctgaag accgctggca tagacatgac cactgaacaa 3540
tggaacactg tggattattt tgaaacggac aaagctcact cagcagagat agtattgaac 3600
caactatgcg tgaggttctt tggactcgat ctggactccg gtctattttc tgcacccact 3660
gttccgttat ccattaggaa taatcactgg gataactccc cgtcgcctaa catgtacggg 3720
ctgaataaag aagtggtccg tcagctctct cgcaggtacc cacaactgcc tcgggcagtt 3780
gccactggaa gagtctatga catgaacact ggtacactgc gcaattatga tccgcgcata 3840
aacctagtac ctgtaaacag aagactgcct catgctttag tcctccacca taatgaacac 3900
ccacagagtg acttttcttc attcgtcagc aaattgaagg gcagaactgt cctggtggtc 3960
ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt tgtcagaccg gcctgaggct 4020
accttcagag ctcggctgga tttaggcatc ccaggtgatg tgcccaaata tgacataata 4080
tttgttaatg tgaggacccc atataaatac catcactatc agcagtgtga agaccatgcc 4140
attaagctta gcatgttgac caagaaagct tgtctgcatc tgaatcccgg cggaacctgt 4200
gtcagcatag gttatggtta cgctgacagg gccagcgaaa gcatcattgg tgctatagcg 4260
cggcagttca agttttcccg ggtatgcaaa ccgaaatcct cacttgaaga gacggaagtt 4320
ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc acaatcctta caagctttca 4380
tcaaccttga ccaacattta tacaggttcc agactccacg aagccggatg tgcaccctca 4440
tatcatgtgg tgcgagggga tattgccacg gccaccgaag gagtgattat aaatgctgct 4500
aacagcaaag gacaacctgg cggaggggtg tgcggagcgc tgtataagaa attcccggaa 4560
agcttcgatt tacagccgat cgaagtagga aaagcgcgac tggtcaaagg tgcagctaaa 4620
catatcattc atgccgtagg accaaacttc aacaaagttt cggaggttga aggtgacaaa 4680
cagttggcag aggcttatga gtccatcgct aagattgtca acgataacaa ttacaagtca 4740
gtagcgattc cactgttgtc caccggcatc ttttccggga acaaagatcg actaacccaa 4800
tcattgaacc atttgctgac agctttagac accactgatg cagatgtagc catatactgc 4860
agggacaaga aatgggaaat gactctcaag gaagcagtgg ctaggagaga agcagtggag 4920
gagatatgca tatccgacga ctcttcagtg acagaacctg atgcagagct ggtgagggtg 4980
catccgaaga gttctttggc tggaaggaag ggctacagca caagcgatgg caaaactttc 5040
tcatatttgg aagggaccaa gtttcaccag gcggccaagg atatagcaga aattaatgcc 5100
atgtggcccg ttgcaacgga ggccaatgag caggtatgca tgtatatcct cggagaaagc 5160
atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg aagcctccac accacctagc 5220
acgctgcctt gcttgtgcat ccatgccatg actccagaaa gagtacagcg cctaaaagcc 5280
tcacgtccag aacaaattac tgtgtgctca tcctttccat tgccgaagta tagaatcact 5340
ggtgtgcaga agatccaatg ctcccagcct atattgttct caccgaaagt gcctgcgtat 5400
attcatccaa ggaagtatct cgtggaaaca ccaccggtag acgagactcc ggagccatcg 5460
gcagagaacc aatccacaga ggggacacct gaacaaccac cacttataac cgaggatgag 5520
accaggacta gaacgcctga gccgatcatc atcgaagagg aagaagagga tagcataagt 5580
ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg aggcagacat tcacgggccg 5640
ccctctgtat ctagctcatc ctggtccatt cctcatgcat ccgactttga tgtggacagt 5700
ttatccatac ttgacaccct ggagggagct agcgtgacca gcggggcaac gtcagccgag 5760
actaactctt acttcgcaaa gagtatggag tttctggcgc gaccggtgcc tgcgcctcga 5820
acagtattca ggaaccctcc acatcccgct ccgcgcacaa gaacaccgtc acttgcaccc 5880
agcagggcct gctcgagaac cagcctagtt tccaccccgc caggcgtgaa tagggtgatc 5940
actagagagg agctcgaggc gcttaccccg tcacgcactc ctagcaggtc ggtctcgaga 6000
accagcctgg tctccaaccc gccaggcgta aatagggtga ttacaagaga ggagtttgag 6060
gcgttcgtag cacaacaaca atgacggttt gatgcgggtg catacatctt ttcctccgac 6120
accggtcaag ggcatttaca acaaaaatca gtaaggcaaa cggtgctatc cgaagtggtg 6180
ttggagagga ccgaattgga gatttcgtat gccccgcgcc tcgaccaaga aaaagaagaa 6240
ttactacgca agaaattaca gttaaatccc acacctgcta acagaagcag ataccagtcc 6300
aggaaggtgg agaacatgaa agccataaca gctagacgta ttctgcaagg cctagggcat 6360
tatttgaagg cagaaggaaa agtggagtgc taccgaaccc tgcatcctgt tcctttgtat 6420
tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg cagtggaagc ctgtaacgcc 6480
atgttgaaag agaactttcc gactgtggct tcttactgta ttattccaga gtacgatgcc 6540
tatttggaca tggttgacgg agcttcatgc tgcttagaca ctgccagttt ttgccctgca 6600
aagctgcgca gctttccaaa gaaacactcc tatttggaac ccacaatacg atcggcagtg 6660
ccttcagcga tccagaacac gctccagaac gtcctggcag ctgccacaaa aagaaattgc 6720
aatgtcacgc aaatgagaga attgcccgta ttggattcgg cggcctttaa tgtggaatgc 6780
ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt ttaaagaaaa ccccatcagg 6840
cttactgaag aaaacgtggt aaattacatt accaaattaa aaggaccaaa agctgctgct 6900
ctttttgcga agacacataa tttgaatatg ttgcaggaca taccaatgga caggtttgta 6960
atggacttaa agagagacgt gaaagtgact ccaggaacaa aacatactga agaacggccc 7020
aaggtacagg tgatccaggc tgccgatccg ctagcaacag cgtatctgtg cggaatccac 7080
cgagagctgg ttaggagatt aaatgcggtc ctgcttccga acattcatac actgtttgat 7140
atgtcggctg aagactttga cgctattata gccgagcact tccagcctgg ggattgtgtt 7200
ctggaaactg acatcgcgtc gtttgataaa agtgaggacg acgccatggc tctgaccgcg 7260
ttaatgattc tggaagactt aggtgtggac gcagagctgt tgacgctgat tgaggcggct 7320
ttcggcgaaa tttcatcaat acatttgccc actaaaacta aatttaaatt cggagccatg 7380
atgaaatctg gaatgttcct cacactgttt gtgaacacag tcattaacat tgtaatcgca 7440
agcagagtgt tgagagaacg gctaaccgga tcaccatgtg cagcattcat tggagatgac 7500
aatatcgtga aaggagtcaa atcggacaaa ttaatggcag acaggtgcgc cacctggttg 7560
aatatggaag tcaagattat agatgctgtg gtgggcgaga aagcgcctta tttctgtgga 7620
gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc gtgtggcaga ccccctaaaa 7680
aggctgttta agcttggcaa acctctggca gcagacgatg aacatgatga tgacaggaga 7740
agggcattgc atgaagagtc aacacgctgg aaccgagtgg gtattctttc agagctgtgc 7800
aaggcagtag aatcaaggta tgaaaccgta ggaacttcca tcatagttat ggccatgact 7860
actctagcta gcagtgttaa atcattcagc tacctgagag gggcccctat aactctctac 7920
ggctaacctg aatggactac gacatagtct agtccgccaa gatatcatgg ctcgacctct 7980
gtgtaccctg ctactcctga tggctaccct ggctggagct ctggccagca tgcccctgtc 8040
ttaccagcac tttagaaagc ttctgctgct ggacgatgaa gccgggcctc tggaggaaga 8100
gctgccaagg ctggcagacg aggggctgaa ccggagagtg gccgaagatc tgaatctggg 8160
aaacctgaac gtgagcatcc cttggactca taaagtcggc aacttcaccg ggctgtacag 8220
ctccacagtg cctgtcttca atccagagtg gcagacacca tcctttccca acattcacct 8280
gcaggaggac atcattaata gatgcgaaca gttcgtggga cctctgacag tcaacgaaaa 8340
gaggcgcctg aaactgatca tgcctgccag gttttaccca aatgtgacta agtatctgcc 8400
actggataag ggcatcaagc cttactatcc agagcacctg gtgaaccatt acttccagac 8460
tagacactat ctgcataccc tgtggaaggc cggaatcctg tacaaacgag aaactacccg 8520
gagtgcttca ttttgtggct ccccatattc ttgggaacag gagctgcagc atggcaggct 8580
ggtgttccag accagcaaac gccacgggga tgagtccttt tgcagccagt ctagtggcat 8640
cctgagcaga tcccccgtgg ggccttgtat tcagtctcag ctgcggaaga gtagactggg 8700
actgcagcca cagcagggac acctggcacg acggcagcag ggaaggtctg gcagtatccg 8760
ggctagagtg catcccacaa ctagaaggac cttcggcgtc gagccatcag gaagcggcca 8820
catcgacaac agcgcatcaa gctcctctag ttgcctgcat cagtcagccg tgagaaaggc 8880
cgcttacagc cacctgtcca catctaaaag gcactcaagc tccgggcatg ctgtggagct 8940
gcacaacatc cctccaaatt ctgcacgcag tcagtcagaa ggacccgtgt tcagctgctg 9000
gtggctgcag tttcggaact caaagccttg cagcgactat tgtctgagcc atattgtgaa 9060
tctgctggag gattggggcc cttgtaccga gcacggggaa caccatatca ggattccacg 9120
aacaccagca cgagtgactg gaggggtgtt cctggtggac aagaaccccc acaatactac 9180
cgagagccgg ctggtggtcg atttcagtca gttttcaaga ggcaacacaa gggtgtcatg 9240
gcccaaattc gccgtcccta atctgcagag tctgactaac ctgctgtcta gtaatctgag 9300
ctggctgtcc ctggacgtgt ccgcagcctt ttaccacctg cctctgcatc cagctgcaat 9360
gccccatctg ctggtggggt caagcggact gagtcgctac gtcgcccgac tgtcctctaa 9420
ctcacgcatc attaatcacc agcatggcac catgcagaac ctgcacgata gctgttcccg 9480
gaatctgtac gtgtctctgc tgctgctgta taagacattc ggcagaaaac tgcacctgta 9540
cagccatcct atcattctgg ggtttaggaa gatcccaatg ggagtgggac tgagcccctt 9600
cctgctggca cagtttacct ccgccatttg ctctgtggtc cgccgagcct tcccacactg 9660
tctggctttt tcctatatga acaatgtggt cctgggcgcc aaatccgtgc agcatctgga 9720
gtctctgttc acagctgtca ctaactttct gctgagcctg gggatccacc tgaacccaaa 9780
taagactaaa cgctgggggt acagcctgaa tttcatggga tatgtgattg gatcctgggg 9840
gaccctgcca caggagcaca tcgtgcagaa gatcaaggaa tgctttcgga agctgcccgt 9900
caacagacct atcgactgga aagtgtgcca gcggattgtc ggactgctgg gcttcgccgc 9960
tccctttacc cagtgcgggt acccagcact gatgcccctg tatgcctgta tccagtctaa 10020
gcaggctttc acctttagtc ctacatacaa ggcattcctg tgcaaacagt acctgaacct 10080
gtatccagtg gcaaggcagc gacctggact gtgccaggtc tttgcaaatg ccactcctac 10140
cggctggggg ctggctatcg gacatcagcg aatgcggggc acattcgtgg cccccctgcc 10200
tattcacact gctcagctgc tggcagcctg ctttgctaga tctaggagtg gagcaaagct 10260
gatcggcacc gacaatagtg tggtcctgtc aagaaaatac acatccttcc catggctgct 10320
gggatgtgct gcaaactgga ttctgagggg caccagcttc gtgtacgtcc cctcagccct 10380
gaatcctgct gacgatccat cccgcgggcg actgggactg taccgacctc tgctgagact 10440
gcccttcagg cctacaactg gccggacatc tctgtatgcc gattcaccaa gcgtgccctc 10500
acacctgcct gacagagtcc actttgcttc acccctgcac gtcgcttggc ggcctccata 10560
agcccctctc cctccccccc ccctaacgtt actggccgaa gccgcttgga ataaggccgg 10620
tgtgcgtttg tctatatgtt attttccacc atattgccgt cttttggcaa tgtgagggcc 10680
cggaaacctg gccctgtctt cttgacgagc attcctaggg gtctttcccc tctcgccaaa 10740
ggaatgcaag gtctgttgaa tgtcgtgaag gaagcagttc ctctggaagc ttcttgaaga 10800
caaacaacgt ctgtagcgac cctttgcagg cagcggaacc ccccacctgg cgacaggtgc 10860
ctctgcggcc aaaagccacg tgtataagat acacctgcaa aggcggcaca accccagtgc 10920
cacgttgtga gttggatagt tgtggaaaga gtcaaatggc tctcctcaag cgtattcaac 10980
aaggggctga aggatgccca gaaggtaccc cattgtatgg gatctgatct ggggcctcgg 11040
tgcacatgct ttacatgtgt ttagtcgagg ttaaaaaacg tctaggcccc ccgaaccacg 11100
gggacgtggt tttcctttga aaaacacgat gataatatgg ccacaaccat ggctcgacct 11160
ctgtgtaccc tgctactcct gatggctacc ctggctggag ctctggccag cgacatcgac 11220
ccttacaagg agttcggcgc cagcgtggaa ctgctgtctt ttctgcccag tgatttcttt 11280
ccttccattc gagacctgct ggataccgcc tctgctctgt atcgggaagc cctggagagc 11340
ccagaacact gctccccaca ccataccgct ctgcgacagg caatcctgtg ctggggggag 11400
ctgatgaacc tggccacatg ggtgggatcg aatctggagg accccgcttc acgggaactg 11460
gtggtcagct acgtgaacgt caatatgggc ctgaaaatcc gccagctgct gtggttccat 11520
attagctgcc tgacttttgg acgagagacc gtgctggaat acctggtgtc cttcggcgtc 11580
tggattcgca ctccccctgc ttatcgacca cccaacgcac caattctgtc caccctgccc 11640
gagaccacag tggtccgtcg ccgttaaggc gcgccgttta aacggccggc cttaattaag 11700
taacgataca gcagcaattg gcaagctgct tacatagaac tcgcggcgat tggcatgccg 11760
ctttaaaatt tttattttat ttttcttttc ttttccgaat cggattttgt ttttaatatt 11820
tcaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aa 11862
<210> 67
<211> 9490
<212> DNA
<213> Artificial Sequence
<220>
<223> preS1-2A-PreS2.S Replicon
<400> 67
ataggcggcg catgagagaa gcccagacca attacctacc caaataggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
tagtcagcat agtacatttc atctgactaa tactacaaca ccaccaccat gaatagagga 300
ttctttaaca tgctcggccg ccgccccttc ccggccccca ctgccatgtg gaggccgcgg 360
agaaggaggc aggcggcccc gggaagcgga gctactaact tcagcctgct gaagcaggct 420
ggagacgtgg aggagaaccc tggacctgag aaagttcacg ttgacatcga ggaagacagc 480
ccattcctca gagctttgca gcggagcttc ccgcagtttg aggtagaagc caagcaggtc 540
actgataatg accatgctaa tgccagagcg ttttcgcatc tggcttcaaa actgatcgaa 600
acggaggtgg acccatccga cacgatcctt gacattggaa gtgcgcccgc ccgcagaatg 660
tattctaagc acaagtatca ttgtatctgt ccgatgagat gtgcggaaga tccggacaga 720
ttgtataagt atgcaactaa gctgaagaaa aactgtaagg aaataactga taaggaattg 780
gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc ctgacctgga aactgagact 840
atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc aagtcgctgt ttaccaggat 900
gtatacgcgg ttgacggacc gacaagtctc tatcaccaag ccaataaggg agttagagtc 960
gcctactgga taggctttga caccacccct tttatgttta agaacttggc tggagcatat 1020
ccatcatact ctaccaactg ggccgacgaa accgtgttaa cggctcgtaa cataggccta 1080
tgcagctctg acgttatgga gcggtcacgt agagggatgt ccattcttag aaagaagtat 1140
ttgaaaccat ccaacaatgt tctattctct gttggctcga ccatctacca cgagaagagg 1200
gacttactga ggagctggca cctgccgtct gtatttcact tacgtggcaa gcaaaattac 1260
acatgtcggt gtgagactat agttagttgc gacgggtacg tcgttaaaag aatagctatc 1320
agtccaggcc tgtatgggaa gccttcaggc tatgctgcta cgatgcaccg cgagggattc 1380
ttgtgctgca aagtgacaga cacattgaac ggggagaggg tctcttttcc cgtgtgcacg 1440
tatgtgccag ctacattgtg tgaccaaatg actggcatac tggcaacaga tgtcagtgcg 1500
gacgacgcgc aaaaactgct ggttgggctc aaccagcgta tagtcgtcaa cggtcgcacc 1560
cagagaaaca ccaataccat gaaaaattac cttttgcccg tagtggccca ggcatttgct 1620
aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa ggccactagg actacgagat 1680
agacagttag tcatggggtg ttgttgggct tttagaaggc acaagataac atctatttat 1740
aagcgcccgg atacccaaac catcatcaaa gtgaacagcg atttccactc attcgtgctg 1800
cccaggatag gcagtaacac attggagatc gggctgagaa caagaatcag gaaaatgtta 1860
gaggagcaca aggagccgtc acctctcatt accgccgagg acgtacaaga agctaagtgc 1920
gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt tgcgcgcagc tctaccacct 1980
ttggcagctg atgttgagga gcccactctg gaagccgatg tcgacttgat gttacaagag 2040
gctggggccg gctcagtgga gacacctcgt ggcttgataa aggttaccag ctacgatggc 2100
gaggacaaga tcggctctta cgctgtgctt tctccgcagg ctgtactcaa gagtgaaaaa 2160
ttatcttgca tccaccctct cgctgaacaa gtcatagtga taacacactc tggccgaaaa 2220
gggcgttatg ccgtggaacc ataccatggt aaagtagtgg tgccagaggg acatgcaata 2280
cccgtccagg actttcaagc tctgagtgaa agtgccacca ttgtgtacaa cgaacgtgag 2340
ttcgtaaaca ggtacctgca ccatattgcc acacatggag gagcgctgaa cactgatgaa 2400
gaatattaca aaactgtcaa gcccagcgag cacgacggcg aatacctgta cgacatcgac 2460
aggaaacagt gcgtcaagaa agaactagtc actgggctag ggctcacagg cgagctggtg 2520
gatcctccct tccatgaatt cgcctacgag agtctgagaa cacgaccagc cgctccttac 2580
caagtaccaa ccataggggt gtatggcgtg ccaggatcag gcaagtctgg catcattaaa 2640
agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga aagaaaactg tgcagaaatt 2700
ataagggacg tcaagaaaat gaaagggctg gacgtcaatg ccagaactgt ggactcagtg 2760
ctcttgaatg gatgcaaaca ccccgtagag accctgtata ttgacgaagc ttttgcttgt 2820
catgcaggta ctctcagagc gctcatagcc attataagac ctaaaaaggc agtgctctgc 2880
ggggatccca aacagtgcgg tttttttaac atgatgtgcc tgaaagtgca ttttaaccac 2940
gagatttgca cacaagtctt ccacaaaagc atctctcgcc gttgcactaa atctgtgact 3000
tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa cgacgaatcc gaaagagact 3060
aagattgtga ttgacactac cggcagtacc aaacctaagc aggacgatct cattctcact 3120
tgtttcagag ggtgggtgaa gcagttgcaa atagattaca aaggcaacga aataatgacg 3180
gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg ccgttcggta caaggtgaat 3240
gaaaatcctc tgtacgcacc cacctctgaa catgtgaacg tcctactgac ccgcacggag 3300
gaccgcatcg tgtggaaaac actagccggc gacccatgga taaaaacact gactgccaag 3360
taccctggga atttcactgc cacgatagag gagtggcaag cagagcatga tgccatcatg 3420
aggcacatct tggagagacc ggaccctacc gacgtcttcc agaataaggc aaacgtgtgt 3480
tgggccaagg ctttagtgcc ggtgctgaag accgctggca tagacatgac cactgaacaa 3540
tggaacactg tggattattt tgaaacggac aaagctcact cagcagagat agtattgaac 3600
caactatgcg tgaggttctt tggactcgat ctggactccg gtctattttc tgcacccact 3660
gttccgttat ccattaggaa taatcactgg gataactccc cgtcgcctaa catgtacggg 3720
ctgaataaag aagtggtccg tcagctctct cgcaggtacc cacaactgcc tcgggcagtt 3780
gccactggaa gagtctatga catgaacact ggtacactgc gcaattatga tccgcgcata 3840
aacctagtac ctgtaaacag aagactgcct catgctttag tcctccacca taatgaacac 3900
ccacagagtg acttttcttc attcgtcagc aaattgaagg gcagaactgt cctggtggtc 3960
ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt tgtcagaccg gcctgaggct 4020
accttcagag ctcggctgga tttaggcatc ccaggtgatg tgcccaaata tgacataata 4080
tttgttaatg tgaggacccc atataaatac catcactatc agcagtgtga agaccatgcc 4140
attaagctta gcatgttgac caagaaagct tgtctgcatc tgaatcccgg cggaacctgt 4200
gtcagcatag gttatggtta cgctgacagg gccagcgaaa gcatcattgg tgctatagcg 4260
cggcagttca agttttcccg ggtatgcaaa ccgaaatcct cacttgaaga gacggaagtt 4320
ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc acaatcctta caagctttca 4380
tcaaccttga ccaacattta tacaggttcc agactccacg aagccggatg tgcaccctca 4440
tatcatgtgg tgcgagggga tattgccacg gccaccgaag gagtgattat aaatgctgct 4500
aacagcaaag gacaacctgg cggaggggtg tgcggagcgc tgtataagaa attcccggaa 4560
agcttcgatt tacagccgat cgaagtagga aaagcgcgac tggtcaaagg tgcagctaaa 4620
catatcattc atgccgtagg accaaacttc aacaaagttt cggaggttga aggtgacaaa 4680
cagttggcag aggcttatga gtccatcgct aagattgtca acgataacaa ttacaagtca 4740
gtagcgattc cactgttgtc caccggcatc ttttccggga acaaagatcg actaacccaa 4800
tcattgaacc atttgctgac agctttagac accactgatg cagatgtagc catatactgc 4860
agggacaaga aatgggaaat gactctcaag gaagcagtgg ctaggagaga agcagtggag 4920
gagatatgca tatccgacga ctcttcagtg acagaacctg atgcagagct ggtgagggtg 4980
catccgaaga gttctttggc tggaaggaag ggctacagca caagcgatgg caaaactttc 5040
tcatatttgg aagggaccaa gtttcaccag gcggccaagg atatagcaga aattaatgcc 5100
atgtggcccg ttgcaacgga ggccaatgag caggtatgca tgtatatcct cggagaaagc 5160
atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg aagcctccac accacctagc 5220
acgctgcctt gcttgtgcat ccatgccatg actccagaaa gagtacagcg cctaaaagcc 5280
tcacgtccag aacaaattac tgtgtgctca tcctttccat tgccgaagta tagaatcact 5340
ggtgtgcaga agatccaatg ctcccagcct atattgttct caccgaaagt gcctgcgtat 5400
attcatccaa ggaagtatct cgtggaaaca ccaccggtag acgagactcc ggagccatcg 5460
gcagagaacc aatccacaga ggggacacct gaacaaccac cacttataac cgaggatgag 5520
accaggacta gaacgcctga gccgatcatc atcgaagagg aagaagagga tagcataagt 5580
ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg aggcagacat tcacgggccg 5640
ccctctgtat ctagctcatc ctggtccatt cctcatgcat ccgactttga tgtggacagt 5700
ttatccatac ttgacaccct ggagggagct agcgtgacca gcggggcaac gtcagccgag 5760
actaactctt acttcgcaaa gagtatggag tttctggcgc gaccggtgcc tgcgcctcga 5820
acagtattca ggaaccctcc acatcccgct ccgcgcacaa gaacaccgtc acttgcaccc 5880
agcagggcct gctcgagaac cagcctagtt tccaccccgc caggcgtgaa tagggtgatc 5940
actagagagg agctcgaggc gcttaccccg tcacgcactc ctagcaggtc ggtctcgaga 6000
accagcctgg tctccaaccc gccaggcgta aatagggtga ttacaagaga ggagtttgag 6060
gcgttcgtag cacaacaaca atgacggttt gatgcgggtg catacatctt ttcctccgac 6120
accggtcaag ggcatttaca acaaaaatca gtaaggcaaa cggtgctatc cgaagtggtg 6180
ttggagagga ccgaattgga gatttcgtat gccccgcgcc tcgaccaaga aaaagaagaa 6240
ttactacgca agaaattaca gttaaatccc acacctgcta acagaagcag ataccagtcc 6300
aggaaggtgg agaacatgaa agccataaca gctagacgta ttctgcaagg cctagggcat 6360
tatttgaagg cagaaggaaa agtggagtgc taccgaaccc tgcatcctgt tcctttgtat 6420
tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg cagtggaagc ctgtaacgcc 6480
atgttgaaag agaactttcc gactgtggct tcttactgta ttattccaga gtacgatgcc 6540
tatttggaca tggttgacgg agcttcatgc tgcttagaca ctgccagttt ttgccctgca 6600
aagctgcgca gctttccaaa gaaacactcc tatttggaac ccacaatacg atcggcagtg 6660
ccttcagcga tccagaacac gctccagaac gtcctggcag ctgccacaaa aagaaattgc 6720
aatgtcacgc aaatgagaga attgcccgta ttggattcgg cggcctttaa tgtggaatgc 6780
ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt ttaaagaaaa ccccatcagg 6840
cttactgaag aaaacgtggt aaattacatt accaaattaa aaggaccaaa agctgctgct 6900
ctttttgcga agacacataa tttgaatatg ttgcaggaca taccaatgga caggtttgta 6960
atggacttaa agagagacgt gaaagtgact ccaggaacaa aacatactga agaacggccc 7020
aaggtacagg tgatccaggc tgccgatccg ctagcaacag cgtatctgtg cggaatccac 7080
cgagagctgg ttaggagatt aaatgcggtc ctgcttccga acattcatac actgtttgat 7140
atgtcggctg aagactttga cgctattata gccgagcact tccagcctgg ggattgtgtt 7200
ctggaaactg acatcgcgtc gtttgataaa agtgaggacg acgccatggc tctgaccgcg 7260
ttaatgattc tggaagactt aggtgtggac gcagagctgt tgacgctgat tgaggcggct 7320
ttcggcgaaa tttcatcaat acatttgccc actaaaacta aatttaaatt cggagccatg 7380
atgaaatctg gaatgttcct cacactgttt gtgaacacag tcattaacat tgtaatcgca 7440
agcagagtgt tgagagaacg gctaaccgga tcaccatgtg cagcattcat tggagatgac 7500
aatatcgtga aaggagtcaa atcggacaaa ttaatggcag acaggtgcgc cacctggttg 7560
aatatggaag tcaagattat agatgctgtg gtgggcgaga aagcgcctta tttctgtgga 7620
gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc gtgtggcaga ccccctaaaa 7680
aggctgttta agcttggcaa acctctggca gcagacgatg aacatgatga tgacaggaga 7740
agggcattgc atgaagagtc aacacgctgg aaccgagtgg gtattctttc agagctgtgc 7800
aaggcagtag aatcaaggta tgaaaccgta ggaacttcca tcatagttat ggccatgact 7860
actctagcta gcagtgttaa atcattcagc tacctgagag gggcccctat aactctctac 7920
ggctaacctg aatggactac gacatagtct agtccgccaa gatatcatgg ctaggcccct 7980
gtgtacactt ttgctcctga tggccaccct cgctggagct ctggcaagcg gtggatggag 8040
ctcaaagccg cggaaaggga tgggtactaa cctgtccgta ccaaatcccc tgggattttt 8100
tccagaccac caactcgatc ctgcttttgg cgcaaattcc aacaatcccg actgggactt 8160
taaccctaac aaggaccact ggcctgatgc caacaaggtg ggggcaggag cctttggtcc 8220
cggcttcacc ccaccccatg gaggtctttt gggatggtca ccacaggccc agggcatcct 8280
gaccactgtc cctgctgctc caccgccagc ttctactaat cgacagagcg ggaggcagcc 8340
gacccccctg agtccccccc tgcgggatac ccaccctcag gcaggaagcg gagctactaa 8400
cttcagcctg ctgaagcagg ctggagacgt ggaggagaac cctggaccta tgcagtggaa 8460
ctcaactact ttccatcaga cccttcagga ccctagagtg cgcgggctgt actttcctgc 8520
tgggggaagc agtagcggga ccgttaatcc agtacctacg accgcctctc ccatatcttc 8580
tatctttagt aggactggtg accctgctcc caacatggag aatatcacct ccgggtttct 8640
gggcccactc ctggtccttc aggccggatt cttcctgctg actcgaatcc tcaccatacc 8700
ccagagcctg gacagctggt ggacaagcct gaattttctg ggaggaactc ctgtatgcct 8760
gggacaaaat tcacagtccc ctacaagtaa ccattcaccg acaagttgtc ctcccatctg 8820
tcccggatac aggtggatgt gcctgcgaag gttcatcatc ttcctcttca tcctcttgct 8880
ttgccttatt ttcctcctgg ttcttctgga ctatcagggc atgctgcctg tgtgcccact 8940
gataccagga tctagtacta ccagcacagg cccgtgtaag acctgtacaa ttccagcaca 9000
agggactagt atgttcccct cctgctgttg tactaagcca agcgacggta attgcacgtg 9060
tatcccaatc ccgtcctcct gggcgtttgc caagtacctc tgggaatggg cctcagtcag 9120
attttcatgg cttagtcttt tggtgccgtt cgtgcagtgg tttgtgggac tctctccgac 9180
tgtgtggctc agcgtgatct ggatgatgtg gtactggggc ccttcccttt acaacatact 9240
gtctccattc cttcccctgc tgccaatctt cttttgcctg tgggtctata tttaaggcgc 9300
gccgtttaaa cggccggcct taattaagta acgatacagc agcaattggc aagctgctta 9360
catagaactc gcggcgattg gcatgccgct ttaaaatttt tattttattt ttcttttctt 9420
ttccgaatcg gattttgttt ttaatatttc aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 9480
aaaaaaaaaa 9490
<210> 68
<211> 10174
<212> DNA
<213> Artificial Sequence
<220>
<223> PreS2.S-IRES (EV71)-preS1 Replicon
<400> 68
ataggcggcg catgagagaa gcccagacca attacctacc caaataggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
tagtcagcat agtacatttc atctgactaa tactacaaca ccaccaccat gaatagagga 300
ttctttaaca tgctcggccg ccgccccttc ccggccccca ctgccatgtg gaggccgcgg 360
agaaggaggc aggcggcccc gggaagcgga gctactaact tcagcctgct gaagcaggct 420
ggagacgtgg aggagaaccc tggacctgag aaagttcacg ttgacatcga ggaagacagc 480
ccattcctca gagctttgca gcggagcttc ccgcagtttg aggtagaagc caagcaggtc 540
actgataatg accatgctaa tgccagagcg ttttcgcatc tggcttcaaa actgatcgaa 600
acggaggtgg acccatccga cacgatcctt gacattggaa gtgcgcccgc ccgcagaatg 660
tattctaagc acaagtatca ttgtatctgt ccgatgagat gtgcggaaga tccggacaga 720
ttgtataagt atgcaactaa gctgaagaaa aactgtaagg aaataactga taaggaattg 780
gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc ctgacctgga aactgagact 840
atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc aagtcgctgt ttaccaggat 900
gtatacgcgg ttgacggacc gacaagtctc tatcaccaag ccaataaggg agttagagtc 960
gcctactgga taggctttga caccacccct tttatgttta agaacttggc tggagcatat 1020
ccatcatact ctaccaactg ggccgacgaa accgtgttaa cggctcgtaa cataggccta 1080
tgcagctctg acgttatgga gcggtcacgt agagggatgt ccattcttag aaagaagtat 1140
ttgaaaccat ccaacaatgt tctattctct gttggctcga ccatctacca cgagaagagg 1200
gacttactga ggagctggca cctgccgtct gtatttcact tacgtggcaa gcaaaattac 1260
acatgtcggt gtgagactat agttagttgc gacgggtacg tcgttaaaag aatagctatc 1320
agtccaggcc tgtatgggaa gccttcaggc tatgctgcta cgatgcaccg cgagggattc 1380
ttgtgctgca aagtgacaga cacattgaac ggggagaggg tctcttttcc cgtgtgcacg 1440
tatgtgccag ctacattgtg tgaccaaatg actggcatac tggcaacaga tgtcagtgcg 1500
gacgacgcgc aaaaactgct ggttgggctc aaccagcgta tagtcgtcaa cggtcgcacc 1560
cagagaaaca ccaataccat gaaaaattac cttttgcccg tagtggccca ggcatttgct 1620
aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa ggccactagg actacgagat 1680
agacagttag tcatggggtg ttgttgggct tttagaaggc acaagataac atctatttat 1740
aagcgcccgg atacccaaac catcatcaaa gtgaacagcg atttccactc attcgtgctg 1800
cccaggatag gcagtaacac attggagatc gggctgagaa caagaatcag gaaaatgtta 1860
gaggagcaca aggagccgtc acctctcatt accgccgagg acgtacaaga agctaagtgc 1920
gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt tgcgcgcagc tctaccacct 1980
ttggcagctg atgttgagga gcccactctg gaagccgatg tcgacttgat gttacaagag 2040
gctggggccg gctcagtgga gacacctcgt ggcttgataa aggttaccag ctacgatggc 2100
gaggacaaga tcggctctta cgctgtgctt tctccgcagg ctgtactcaa gagtgaaaaa 2160
ttatcttgca tccaccctct cgctgaacaa gtcatagtga taacacactc tggccgaaaa 2220
gggcgttatg ccgtggaacc ataccatggt aaagtagtgg tgccagaggg acatgcaata 2280
cccgtccagg actttcaagc tctgagtgaa agtgccacca ttgtgtacaa cgaacgtgag 2340
ttcgtaaaca ggtacctgca ccatattgcc acacatggag gagcgctgaa cactgatgaa 2400
gaatattaca aaactgtcaa gcccagcgag cacgacggcg aatacctgta cgacatcgac 2460
aggaaacagt gcgtcaagaa agaactagtc actgggctag ggctcacagg cgagctggtg 2520
gatcctccct tccatgaatt cgcctacgag agtctgagaa cacgaccagc cgctccttac 2580
caagtaccaa ccataggggt gtatggcgtg ccaggatcag gcaagtctgg catcattaaa 2640
agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga aagaaaactg tgcagaaatt 2700
ataagggacg tcaagaaaat gaaagggctg gacgtcaatg ccagaactgt ggactcagtg 2760
ctcttgaatg gatgcaaaca ccccgtagag accctgtata ttgacgaagc ttttgcttgt 2820
catgcaggta ctctcagagc gctcatagcc attataagac ctaaaaaggc agtgctctgc 2880
ggggatccca aacagtgcgg tttttttaac atgatgtgcc tgaaagtgca ttttaaccac 2940
gagatttgca cacaagtctt ccacaaaagc atctctcgcc gttgcactaa atctgtgact 3000
tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa cgacgaatcc gaaagagact 3060
aagattgtga ttgacactac cggcagtacc aaacctaagc aggacgatct cattctcact 3120
tgtttcagag ggtgggtgaa gcagttgcaa atagattaca aaggcaacga aataatgacg 3180
gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg ccgttcggta caaggtgaat 3240
gaaaatcctc tgtacgcacc cacctctgaa catgtgaacg tcctactgac ccgcacggag 3300
gaccgcatcg tgtggaaaac actagccggc gacccatgga taaaaacact gactgccaag 3360
taccctggga atttcactgc cacgatagag gagtggcaag cagagcatga tgccatcatg 3420
aggcacatct tggagagacc ggaccctacc gacgtcttcc agaataaggc aaacgtgtgt 3480
tgggccaagg ctttagtgcc ggtgctgaag accgctggca tagacatgac cactgaacaa 3540
tggaacactg tggattattt tgaaacggac aaagctcact cagcagagat agtattgaac 3600
caactatgcg tgaggttctt tggactcgat ctggactccg gtctattttc tgcacccact 3660
gttccgttat ccattaggaa taatcactgg gataactccc cgtcgcctaa catgtacggg 3720
ctgaataaag aagtggtccg tcagctctct cgcaggtacc cacaactgcc tcgggcagtt 3780
gccactggaa gagtctatga catgaacact ggtacactgc gcaattatga tccgcgcata 3840
aacctagtac ctgtaaacag aagactgcct catgctttag tcctccacca taatgaacac 3900
ccacagagtg acttttcttc attcgtcagc aaattgaagg gcagaactgt cctggtggtc 3960
ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt tgtcagaccg gcctgaggct 4020
accttcagag ctcggctgga tttaggcatc ccaggtgatg tgcccaaata tgacataata 4080
tttgttaatg tgaggacccc atataaatac catcactatc agcagtgtga agaccatgcc 4140
attaagctta gcatgttgac caagaaagct tgtctgcatc tgaatcccgg cggaacctgt 4200
gtcagcatag gttatggtta cgctgacagg gccagcgaaa gcatcattgg tgctatagcg 4260
cggcagttca agttttcccg ggtatgcaaa ccgaaatcct cacttgaaga gacggaagtt 4320
ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc acaatcctta caagctttca 4380
tcaaccttga ccaacattta tacaggttcc agactccacg aagccggatg tgcaccctca 4440
tatcatgtgg tgcgagggga tattgccacg gccaccgaag gagtgattat aaatgctgct 4500
aacagcaaag gacaacctgg cggaggggtg tgcggagcgc tgtataagaa attcccggaa 4560
agcttcgatt tacagccgat cgaagtagga aaagcgcgac tggtcaaagg tgcagctaaa 4620
catatcattc atgccgtagg accaaacttc aacaaagttt cggaggttga aggtgacaaa 4680
cagttggcag aggcttatga gtccatcgct aagattgtca acgataacaa ttacaagtca 4740
gtagcgattc cactgttgtc caccggcatc ttttccggga acaaagatcg actaacccaa 4800
tcattgaacc atttgctgac agctttagac accactgatg cagatgtagc catatactgc 4860
agggacaaga aatgggaaat gactctcaag gaagcagtgg ctaggagaga agcagtggag 4920
gagatatgca tatccgacga ctcttcagtg acagaacctg atgcagagct ggtgagggtg 4980
catccgaaga gttctttggc tggaaggaag ggctacagca caagcgatgg caaaactttc 5040
tcatatttgg aagggaccaa gtttcaccag gcggccaagg atatagcaga aattaatgcc 5100
atgtggcccg ttgcaacgga ggccaatgag caggtatgca tgtatatcct cggagaaagc 5160
atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg aagcctccac accacctagc 5220
acgctgcctt gcttgtgcat ccatgccatg actccagaaa gagtacagcg cctaaaagcc 5280
tcacgtccag aacaaattac tgtgtgctca tcctttccat tgccgaagta tagaatcact 5340
ggtgtgcaga agatccaatg ctcccagcct atattgttct caccgaaagt gcctgcgtat 5400
attcatccaa ggaagtatct cgtggaaaca ccaccggtag acgagactcc ggagccatcg 5460
gcagagaacc aatccacaga ggggacacct gaacaaccac cacttataac cgaggatgag 5520
accaggacta gaacgcctga gccgatcatc atcgaagagg aagaagagga tagcataagt 5580
ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg aggcagacat tcacgggccg 5640
ccctctgtat ctagctcatc ctggtccatt cctcatgcat ccgactttga tgtggacagt 5700
ttatccatac ttgacaccct ggagggagct agcgtgacca gcggggcaac gtcagccgag 5760
actaactctt acttcgcaaa gagtatggag tttctggcgc gaccggtgcc tgcgcctcga 5820
acagtattca ggaaccctcc acatcccgct ccgcgcacaa gaacaccgtc acttgcaccc 5880
agcagggcct gctcgagaac cagcctagtt tccaccccgc caggcgtgaa tagggtgatc 5940
actagagagg agctcgaggc gcttaccccg tcacgcactc ctagcaggtc ggtctcgaga 6000
accagcctgg tctccaaccc gccaggcgta aatagggtga ttacaagaga ggagtttgag 6060
gcgttcgtag cacaacaaca atgacggttt gatgcgggtg catacatctt ttcctccgac 6120
accggtcaag ggcatttaca acaaaaatca gtaaggcaaa cggtgctatc cgaagtggtg 6180
ttggagagga ccgaattgga gatttcgtat gccccgcgcc tcgaccaaga aaaagaagaa 6240
ttactacgca agaaattaca gttaaatccc acacctgcta acagaagcag ataccagtcc 6300
aggaaggtgg agaacatgaa agccataaca gctagacgta ttctgcaagg cctagggcat 6360
tatttgaagg cagaaggaaa agtggagtgc taccgaaccc tgcatcctgt tcctttgtat 6420
tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg cagtggaagc ctgtaacgcc 6480
atgttgaaag agaactttcc gactgtggct tcttactgta ttattccaga gtacgatgcc 6540
tatttggaca tggttgacgg agcttcatgc tgcttagaca ctgccagttt ttgccctgca 6600
aagctgcgca gctttccaaa gaaacactcc tatttggaac ccacaatacg atcggcagtg 6660
ccttcagcga tccagaacac gctccagaac gtcctggcag ctgccacaaa aagaaattgc 6720
aatgtcacgc aaatgagaga attgcccgta ttggattcgg cggcctttaa tgtggaatgc 6780
ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt ttaaagaaaa ccccatcagg 6840
cttactgaag aaaacgtggt aaattacatt accaaattaa aaggaccaaa agctgctgct 6900
ctttttgcga agacacataa tttgaatatg ttgcaggaca taccaatgga caggtttgta 6960
atggacttaa agagagacgt gaaagtgact ccaggaacaa aacatactga agaacggccc 7020
aaggtacagg tgatccaggc tgccgatccg ctagcaacag cgtatctgtg cggaatccac 7080
cgagagctgg ttaggagatt aaatgcggtc ctgcttccga acattcatac actgtttgat 7140
atgtcggctg aagactttga cgctattata gccgagcact tccagcctgg ggattgtgtt 7200
ctggaaactg acatcgcgtc gtttgataaa agtgaggacg acgccatggc tctgaccgcg 7260
ttaatgattc tggaagactt aggtgtggac gcagagctgt tgacgctgat tgaggcggct 7320
ttcggcgaaa tttcatcaat acatttgccc actaaaacta aatttaaatt cggagccatg 7380
atgaaatctg gaatgttcct cacactgttt gtgaacacag tcattaacat tgtaatcgca 7440
agcagagtgt tgagagaacg gctaaccgga tcaccatgtg cagcattcat tggagatgac 7500
aatatcgtga aaggagtcaa atcggacaaa ttaatggcag acaggtgcgc cacctggttg 7560
aatatggaag tcaagattat agatgctgtg gtgggcgaga aagcgcctta tttctgtgga 7620
gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc gtgtggcaga ccccctaaaa 7680
aggctgttta agcttggcaa acctctggca gcagacgatg aacatgatga tgacaggaga 7740
agggcattgc atgaagagtc aacacgctgg aaccgagtgg gtattctttc agagctgtgc 7800
aaggcagtag aatcaaggta tgaaaccgta ggaacttcca tcatagttat ggccatgact 7860
actctagcta gcagtgttaa atcattcagc tacctgagag gggcccctat aactctctac 7920
ggctaacctg aatggactac gacatagtct agtccgccaa gatatcatgc agtggaactc 7980
aactactttc catcagaccc ttcaggaccc tagagtgcgc gggctgtact ttcctgctgg 8040
gggaagcagt agcgggaccg ttaatccagt acctacgacc gcctctccca tatcttctat 8100
ctttagtagg actggtgacc ctgctcccaa catggagaat atcacctccg ggtttctggg 8160
cccactcctg gtccttcagg ccggattctt cctgctgact cgaatcctca ccatacccca 8220
gagcctggac agctggtgga caagcctgaa ttttctggga ggaactcctg tatgcctggg 8280
acaaaattca cagtccccta caagtaacca ttcaccgaca agttgtcctc ccatctgtcc 8340
cggatacagg tggatgtgcc tgcgaaggtt catcatcttc ctcttcatcc tcttgctttg 8400
ccttattttc ctcctggttc ttctggacta tcagggcatg ctgcctgtgt gcccactgat 8460
accaggatct agtactacca gcacaggccc gtgtaagacc tgtacaattc cagcacaagg 8520
gactagtatg ttcccctcct gctgttgtac taagccaagc gacggtaatt gcacgtgtat 8580
cccaatcccg tcctcctggg cgtttgccaa gtacctctgg gaatgggcct cagtcagatt 8640
ttcatggctt agtcttttgg tgccgttcgt gcagtggttt gtgggactct ctccgactgt 8700
gtggctcagc gtgatctgga tgatgtggta ctggggccct tccctttaca acatactgtc 8760
tccattcctt cccctgctgc caatcttctt ttgcctgtgg gtctatattt aattaaaaca 8820
gctgtgggtt gttcccaccc acagggccca ctgggcgcta gcactctgat tttacgaaat 8880
ccttgtgcgc ctgttttata tcccttccct aattcgaaac gtagaagcaa tgcgcaccac 8940
tgatcaatag taggcgtaac gcgccagtta cgtcatgatc aagcatatct gttcccccgg 9000
actgagtatc aatagactgc ttacgcggtt gaaggagaaa acgttcgtta tccggctaac 9060
tacttcgaga agcccagtaa caccatggaa gctgcagggt gtttcgctca gcacttcccc 9120
cgtgtagatc aggtcgatga gccactgcaa tccccacagg tgactgtggc agtggctgcg 9180
ttggcggcct gcctatgggg agacccatag gacgctctaa tgtggacatg gtgcgaagag 9240
cctattgagc tagttagtag tcctccggcc cctgaatgcg gctaatccta actgcggagc 9300
acatgccttc aacccagagg gtagtgtgtc gtaacgggca actctgcagc ggaaccgact 9360
actttgggtg tccgtgtttc ttttttattc ttatattggc tgcttatggt gacaattaca 9420
gaattgttac catatagcta ttggattggc catccggtgt gtaatagagc tgttatatac 9480
ctatttgttg gctttgtacc actaacttta aaatctataa ctaccctcaa ctttatatta 9540
accctcaata cagttgacca tggctaggcc cctgtgtaca cttttgctcc tgatggccac 9600
cctcgctgga gctctggcaa gcggtggatg gagctcaaag ccgcggaaag ggatgggtac 9660
taacctgtcc gtaccaaatc ccctgggatt ttttccagac caccaactcg atcctgcttt 9720
tggcgcaaat tccaacaatc ccgactggga ctttaaccct aacaaggacc actggcctga 9780
tgccaacaag gtgggggcag gagcctttgg tcccggcttc accccacccc atggaggtct 9840
tttgggatgg tcaccacagg cccagggcat cctgaccact gtccctgctg ctccaccgcc 9900
agcttctact aatcgacaga gcgggaggca gccgaccccc ctgagtcccc ccctgcggga 9960
tacccaccct caggcataag gcgcgccgtt taaacggccg gccttaatta agtaacgata 10020
cagcagcaat tggcaagctg cttacataga actcgcggcg attggcatgc cgctttaaaa 10080
tttttatttt atttttcttt tcttttccga atcggatttt gtttttaata tttcaaaaaa 10140
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaa 10174
<210> 69
<211> 12730
<212> DNA
<213> Artificial Sequence
<220>
<223> PreS2.S-2A-preS1-2A-Core-2A-Pol Replicon
<400> 69
ataggcggcg catgagagaa gcccagacca attacctacc caaataggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
tagtcagcat agtacatttc atctgactaa tactacaaca ccaccaccat gaatagagga 300
ttctttaaca tgctcggccg ccgccccttc ccggccccca ctgccatgtg gaggccgcgg 360
agaaggaggc aggcggcccc gggaagcgga gctactaact tcagcctgct gaagcaggct 420
ggagacgtgg aggagaaccc tggacctgag aaagttcacg ttgacatcga ggaagacagc 480
ccattcctca gagctttgca gcggagcttc ccgcagtttg aggtagaagc caagcaggtc 540
actgataatg accatgctaa tgccagagcg ttttcgcatc tggcttcaaa actgatcgaa 600
acggaggtgg acccatccga cacgatcctt gacattggaa gtgcgcccgc ccgcagaatg 660
tattctaagc acaagtatca ttgtatctgt ccgatgagat gtgcggaaga tccggacaga 720
ttgtataagt atgcaactaa gctgaagaaa aactgtaagg aaataactga taaggaattg 780
gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc ctgacctgga aactgagact 840
atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc aagtcgctgt ttaccaggat 900
gtatacgcgg ttgacggacc gacaagtctc tatcaccaag ccaataaggg agttagagtc 960
gcctactgga taggctttga caccacccct tttatgttta agaacttggc tggagcatat 1020
ccatcatact ctaccaactg ggccgacgaa accgtgttaa cggctcgtaa cataggccta 1080
tgcagctctg acgttatgga gcggtcacgt agagggatgt ccattcttag aaagaagtat 1140
ttgaaaccat ccaacaatgt tctattctct gttggctcga ccatctacca cgagaagagg 1200
gacttactga ggagctggca cctgccgtct gtatttcact tacgtggcaa gcaaaattac 1260
acatgtcggt gtgagactat agttagttgc gacgggtacg tcgttaaaag aatagctatc 1320
agtccaggcc tgtatgggaa gccttcaggc tatgctgcta cgatgcaccg cgagggattc 1380
ttgtgctgca aagtgacaga cacattgaac ggggagaggg tctcttttcc cgtgtgcacg 1440
tatgtgccag ctacattgtg tgaccaaatg actggcatac tggcaacaga tgtcagtgcg 1500
gacgacgcgc aaaaactgct ggttgggctc aaccagcgta tagtcgtcaa cggtcgcacc 1560
cagagaaaca ccaataccat gaaaaattac cttttgcccg tagtggccca ggcatttgct 1620
aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa ggccactagg actacgagat 1680
agacagttag tcatggggtg ttgttgggct tttagaaggc acaagataac atctatttat 1740
aagcgcccgg atacccaaac catcatcaaa gtgaacagcg atttccactc attcgtgctg 1800
cccaggatag gcagtaacac attggagatc gggctgagaa caagaatcag gaaaatgtta 1860
gaggagcaca aggagccgtc acctctcatt accgccgagg acgtacaaga agctaagtgc 1920
gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt tgcgcgcagc tctaccacct 1980
ttggcagctg atgttgagga gcccactctg gaagccgatg tcgacttgat gttacaagag 2040
gctggggccg gctcagtgga gacacctcgt ggcttgataa aggttaccag ctacgatggc 2100
gaggacaaga tcggctctta cgctgtgctt tctccgcagg ctgtactcaa gagtgaaaaa 2160
ttatcttgca tccaccctct cgctgaacaa gtcatagtga taacacactc tggccgaaaa 2220
gggcgttatg ccgtggaacc ataccatggt aaagtagtgg tgccagaggg acatgcaata 2280
cccgtccagg actttcaagc tctgagtgaa agtgccacca ttgtgtacaa cgaacgtgag 2340
ttcgtaaaca ggtacctgca ccatattgcc acacatggag gagcgctgaa cactgatgaa 2400
gaatattaca aaactgtcaa gcccagcgag cacgacggcg aatacctgta cgacatcgac 2460
aggaaacagt gcgtcaagaa agaactagtc actgggctag ggctcacagg cgagctggtg 2520
gatcctccct tccatgaatt cgcctacgag agtctgagaa cacgaccagc cgctccttac 2580
caagtaccaa ccataggggt gtatggcgtg ccaggatcag gcaagtctgg catcattaaa 2640
agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga aagaaaactg tgcagaaatt 2700
ataagggacg tcaagaaaat gaaagggctg gacgtcaatg ccagaactgt ggactcagtg 2760
ctcttgaatg gatgcaaaca ccccgtagag accctgtata ttgacgaagc ttttgcttgt 2820
catgcaggta ctctcagagc gctcatagcc attataagac ctaaaaaggc agtgctctgc 2880
ggggatccca aacagtgcgg tttttttaac atgatgtgcc tgaaagtgca ttttaaccac 2940
gagatttgca cacaagtctt ccacaaaagc atctctcgcc gttgcactaa atctgtgact 3000
tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa cgacgaatcc gaaagagact 3060
aagattgtga ttgacactac cggcagtacc aaacctaagc aggacgatct cattctcact 3120
tgtttcagag ggtgggtgaa gcagttgcaa atagattaca aaggcaacga aataatgacg 3180
gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg ccgttcggta caaggtgaat 3240
gaaaatcctc tgtacgcacc cacctctgaa catgtgaacg tcctactgac ccgcacggag 3300
gaccgcatcg tgtggaaaac actagccggc gacccatgga taaaaacact gactgccaag 3360
taccctggga atttcactgc cacgatagag gagtggcaag cagagcatga tgccatcatg 3420
aggcacatct tggagagacc ggaccctacc gacgtcttcc agaataaggc aaacgtgtgt 3480
tgggccaagg ctttagtgcc ggtgctgaag accgctggca tagacatgac cactgaacaa 3540
tggaacactg tggattattt tgaaacggac aaagctcact cagcagagat agtattgaac 3600
caactatgcg tgaggttctt tggactcgat ctggactccg gtctattttc tgcacccact 3660
gttccgttat ccattaggaa taatcactgg gataactccc cgtcgcctaa catgtacggg 3720
ctgaataaag aagtggtccg tcagctctct cgcaggtacc cacaactgcc tcgggcagtt 3780
gccactggaa gagtctatga catgaacact ggtacactgc gcaattatga tccgcgcata 3840
aacctagtac ctgtaaacag aagactgcct catgctttag tcctccacca taatgaacac 3900
ccacagagtg acttttcttc attcgtcagc aaattgaagg gcagaactgt cctggtggtc 3960
ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt tgtcagaccg gcctgaggct 4020
accttcagag ctcggctgga tttaggcatc ccaggtgatg tgcccaaata tgacataata 4080
tttgttaatg tgaggacccc atataaatac catcactatc agcagtgtga agaccatgcc 4140
attaagctta gcatgttgac caagaaagct tgtctgcatc tgaatcccgg cggaacctgt 4200
gtcagcatag gttatggtta cgctgacagg gccagcgaaa gcatcattgg tgctatagcg 4260
cggcagttca agttttcccg ggtatgcaaa ccgaaatcct cacttgaaga gacggaagtt 4320
ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc acaatcctta caagctttca 4380
tcaaccttga ccaacattta tacaggttcc agactccacg aagccggatg tgcaccctca 4440
tatcatgtgg tgcgagggga tattgccacg gccaccgaag gagtgattat aaatgctgct 4500
aacagcaaag gacaacctgg cggaggggtg tgcggagcgc tgtataagaa attcccggaa 4560
agcttcgatt tacagccgat cgaagtagga aaagcgcgac tggtcaaagg tgcagctaaa 4620
catatcattc atgccgtagg accaaacttc aacaaagttt cggaggttga aggtgacaaa 4680
cagttggcag aggcttatga gtccatcgct aagattgtca acgataacaa ttacaagtca 4740
gtagcgattc cactgttgtc caccggcatc ttttccggga acaaagatcg actaacccaa 4800
tcattgaacc atttgctgac agctttagac accactgatg cagatgtagc catatactgc 4860
agggacaaga aatgggaaat gactctcaag gaagcagtgg ctaggagaga agcagtggag 4920
gagatatgca tatccgacga ctcttcagtg acagaacctg atgcagagct ggtgagggtg 4980
catccgaaga gttctttggc tggaaggaag ggctacagca caagcgatgg caaaactttc 5040
tcatatttgg aagggaccaa gtttcaccag gcggccaagg atatagcaga aattaatgcc 5100
atgtggcccg ttgcaacgga ggccaatgag caggtatgca tgtatatcct cggagaaagc 5160
atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg aagcctccac accacctagc 5220
acgctgcctt gcttgtgcat ccatgccatg actccagaaa gagtacagcg cctaaaagcc 5280
tcacgtccag aacaaattac tgtgtgctca tcctttccat tgccgaagta tagaatcact 5340
ggtgtgcaga agatccaatg ctcccagcct atattgttct caccgaaagt gcctgcgtat 5400
attcatccaa ggaagtatct cgtggaaaca ccaccggtag acgagactcc ggagccatcg 5460
gcagagaacc aatccacaga ggggacacct gaacaaccac cacttataac cgaggatgag 5520
accaggacta gaacgcctga gccgatcatc atcgaagagg aagaagagga tagcataagt 5580
ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg aggcagacat tcacgggccg 5640
ccctctgtat ctagctcatc ctggtccatt cctcatgcat ccgactttga tgtggacagt 5700
ttatccatac ttgacaccct ggagggagct agcgtgacca gcggggcaac gtcagccgag 5760
actaactctt acttcgcaaa gagtatggag tttctggcgc gaccggtgcc tgcgcctcga 5820
acagtattca ggaaccctcc acatcccgct ccgcgcacaa gaacaccgtc acttgcaccc 5880
agcagggcct gctcgagaac cagcctagtt tccaccccgc caggcgtgaa tagggtgatc 5940
actagagagg agctcgaggc gcttaccccg tcacgcactc ctagcaggtc ggtctcgaga 6000
accagcctgg tctccaaccc gccaggcgta aatagggtga ttacaagaga ggagtttgag 6060
gcgttcgtag cacaacaaca atgacggttt gatgcgggtg catacatctt ttcctccgac 6120
accggtcaag ggcatttaca acaaaaatca gtaaggcaaa cggtgctatc cgaagtggtg 6180
ttggagagga ccgaattgga gatttcgtat gccccgcgcc tcgaccaaga aaaagaagaa 6240
ttactacgca agaaattaca gttaaatccc acacctgcta acagaagcag ataccagtcc 6300
aggaaggtgg agaacatgaa agccataaca gctagacgta ttctgcaagg cctagggcat 6360
tatttgaagg cagaaggaaa agtggagtgc taccgaaccc tgcatcctgt tcctttgtat 6420
tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg cagtggaagc ctgtaacgcc 6480
atgttgaaag agaactttcc gactgtggct tcttactgta ttattccaga gtacgatgcc 6540
tatttggaca tggttgacgg agcttcatgc tgcttagaca ctgccagttt ttgccctgca 6600
aagctgcgca gctttccaaa gaaacactcc tatttggaac ccacaatacg atcggcagtg 6660
ccttcagcga tccagaacac gctccagaac gtcctggcag ctgccacaaa aagaaattgc 6720
aatgtcacgc aaatgagaga attgcccgta ttggattcgg cggcctttaa tgtggaatgc 6780
ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt ttaaagaaaa ccccatcagg 6840
cttactgaag aaaacgtggt aaattacatt accaaattaa aaggaccaaa agctgctgct 6900
ctttttgcga agacacataa tttgaatatg ttgcaggaca taccaatgga caggtttgta 6960
atggacttaa agagagacgt gaaagtgact ccaggaacaa aacatactga agaacggccc 7020
aaggtacagg tgatccaggc tgccgatccg ctagcaacag cgtatctgtg cggaatccac 7080
cgagagctgg ttaggagatt aaatgcggtc ctgcttccga acattcatac actgtttgat 7140
atgtcggctg aagactttga cgctattata gccgagcact tccagcctgg ggattgtgtt 7200
ctggaaactg acatcgcgtc gtttgataaa agtgaggacg acgccatggc tctgaccgcg 7260
ttaatgattc tggaagactt aggtgtggac gcagagctgt tgacgctgat tgaggcggct 7320
ttcggcgaaa tttcatcaat acatttgccc actaaaacta aatttaaatt cggagccatg 7380
atgaaatctg gaatgttcct cacactgttt gtgaacacag tcattaacat tgtaatcgca 7440
agcagagtgt tgagagaacg gctaaccgga tcaccatgtg cagcattcat tggagatgac 7500
aatatcgtga aaggagtcaa atcggacaaa ttaatggcag acaggtgcgc cacctggttg 7560
aatatggaag tcaagattat agatgctgtg gtgggcgaga aagcgcctta tttctgtgga 7620
gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc gtgtggcaga ccccctaaaa 7680
aggctgttta agcttggcaa acctctggca gcagacgatg aacatgatga tgacaggaga 7740
agggcattgc atgaagagtc aacacgctgg aaccgagtgg gtattctttc agagctgtgc 7800
aaggcagtag aatcaaggta tgaaaccgta ggaacttcca tcatagttat ggccatgact 7860
actctagcta gcagtgttaa atcattcagc tacctgagag gggcccctat aactctctac 7920
ggctaacctg aatggactac gacatagtct agtccgccaa gatatcatgc agtggaactc 7980
aactactttc catcagaccc ttcaggaccc tagagtgcgc gggctgtact ttcctgctgg 8040
gggaagcagt agcgggaccg ttaatccagt acctacgacc gcctctccca tatcttctat 8100
ctttagtagg actggtgacc ctgctcccaa catggagaat atcacctccg ggtttctggg 8160
cccactcctg gtccttcagg ccggattctt cctgctgact cgaatcctca ccatacccca 8220
gagcctggac agctggtgga caagcctgaa ttttctggga ggaactcctg tatgcctggg 8280
acaaaattca cagtccccta caagtaacca ttcaccgaca agttgtcctc ccatctgtcc 8340
cggatacagg tggatgtgcc tgcgaaggtt catcatcttc ctcttcatcc tcttgctttg 8400
ccttattttc ctcctggttc ttctggacta tcagggcatg ctgcctgtgt gcccactgat 8460
accaggatct agtactacca gcacaggccc gtgtaagacc tgtacaattc cagcacaagg 8520
gactagtatg ttcccctcct gctgttgtac taagccaagc gacggtaatt gcacgtgtat 8580
cccaatcccg tcctcctggg cgtttgccaa gtacctctgg gaatgggcct cagtcagatt 8640
ttcatggctt agtcttttgg tgccgttcgt gcagtggttt gtgggactct ctccgactgt 8700
gtggctcagc gtgatctgga tgatgtggta ctggggccct tccctttaca acatactgtc 8760
tccattcctt cccctgctgc caatcttctt ttgcctgtgg gtctatattg gaagcggagc 8820
tactaacttc agcctgctga agcaggctgg agacgtggag gagaaccctg gacctatggc 8880
taggcccctg tgtacacttt tgctcctgat ggccaccctc gctggagctc tggcaagcgg 8940
tggatggagc tcaaagccgc ggaaagggat gggtactaac ctgtccgtac caaatcccct 9000
gggatttttt ccagaccacc aactcgatcc tgcttttggc gcaaattcca acaatcccga 9060
ctgggacttt aaccctaaca aggaccactg gcctgatgcc aacaaggtgg gggcaggagc 9120
ctttggtccc ggcttcaccc caccccatgg aggtcttttg ggatggtcac cacaggccca 9180
gggcatcctg accactgtcc ctgctgctcc accgccagct tctactaatc gacagagcgg 9240
gaggcagccg acccccctga gtccccccct gcgggatacc caccctcagg caggatcagg 9300
cgctacgaat tttagccttc tgaagcaagc gggagacgtt gaagaaaacc cagggcctat 9360
ggctcgacct ctgtgtaccc tgctactcct gatggctacc ctggctggag ctctggccag 9420
cgacatcgac ccttacaagg agttcggcgc cagcgtggaa ctgctgtctt ttctgcccag 9480
tgatttcttt ccttccattc gagacctgct ggataccgcc tctgctctgt atcgggaagc 9540
cctggagagc ccagaacact gctccccaca ccataccgct ctgcgacagg caatcctgtg 9600
ctggggggag ctgatgaacc tggccacatg ggtgggatcg aatctggagg accccgcttc 9660
acgggaactg gtggtcagct acgtgaacgt caatatgggc ctgaaaatcc gccagctgct 9720
gtggttccat attagctgcc tgacttttgg acgagagacc gtgctggaat acctggtgtc 9780
cttcggcgtc tggattcgca ctccccctgc ttatcgacca cccaacgcac caattctgtc 9840
caccctgccc gagaccacag tggtccgtcg ccgtgggtcc ggagcgacta acttttccct 9900
gctgaaacaa gcgggtgacg tcgaagagaa tccgggacct atggctcgac ctctgtgtac 9960
cctgctactc ctgatggcta ccctggctgg agctctggcc agcatgcccc tgtcttacca 10020
gcactttaga aagcttctgc tgctggacga tgaagccggg cctctggagg aagagctgcc 10080
aaggctggca gacgaggggc tgaaccggag agtggccgaa gatctgaatc tgggaaacct 10140
gaacgtgagc atcccttgga ctcataaagt cggcaacttc accgggctgt acagctccac 10200
agtgcctgtc ttcaatccag agtggcagac accatccttt cccaacattc acctgcagga 10260
ggacatcatt aatagatgcg aacagttcgt gggacctctg acagtcaacg aaaagaggcg 10320
cctgaaactg atcatgcctg ccaggtttta cccaaatgtg actaagtatc tgccactgga 10380
taagggcatc aagccttact atccagagca cctggtgaac cattacttcc agactagaca 10440
ctatctgcat accctgtgga aggccggaat cctgtacaaa cgagaaacta cccggagtgc 10500
ttcattttgt ggctccccat attcttggga acaggagctg cagcatggca ggctggtgtt 10560
ccagaccagc aaacgccacg gggatgagtc cttttgcagc cagtctagtg gcatcctgag 10620
cagatccccc gtggggcctt gtattcagtc tcagctgcgg aagagtagac tgggactgca 10680
gccacagcag ggacacctgg cacgacggca gcagggaagg tctggcagta tccgggctag 10740
agtgcatccc acaactagaa ggaccttcgg cgtcgagcca tcaggaagcg gccacatcga 10800
caacagcgca tcaagctcct ctagttgcct gcatcagtca gccgtgagaa aggccgctta 10860
cagccacctg tccacatcta aaaggcactc aagctccggg catgctgtgg agctgcacaa 10920
catccctcca aattctgcac gcagtcagtc agaaggaccc gtgttcagct gctggtggct 10980
gcagtttcgg aactcaaagc cttgcagcga ctattgtctg agccatattg tgaatctgct 11040
ggaggattgg ggcccttgta ccgagcacgg ggaacaccat atcaggattc cacgaacacc 11100
agcacgagtg actggagggg tgttcctggt ggacaagaac ccccacaata ctaccgagag 11160
ccggctggtg gtcgatttca gtcagttttc aagaggcaac acaagggtgt catggcccaa 11220
attcgccgtc cctaatctgc agagtctgac taacctgctg tctagtaatc tgagctggct 11280
gtccctggac gtgtccgcag ccttttacca cctgcctctg catccagctg caatgcccca 11340
tctgctggtg gggtcaagcg gactgagtcg ctacgtcgcc cgactgtcct ctaactcacg 11400
catcattaat caccagcatg gcaccatgca gaacctgcac gatagctgtt cccggaatct 11460
gtacgtgtct ctgctgctgc tgtataagac attcggcaga aaactgcacc tgtacagcca 11520
tcctatcatt ctggggttta ggaagatccc aatgggagtg ggactgagcc ccttcctgct 11580
ggcacagttt acctccgcca tttgctctgt ggtccgccga gccttcccac actgtctggc 11640
tttttcctat atgaacaatg tggtcctggg cgccaaatcc gtgcagcatc tggagtctct 11700
gttcacagct gtcactaact ttctgctgag cctggggatc cacctgaacc caaataagac 11760
taaacgctgg gggtacagcc tgaatttcat gggatatgtg attggatcct gggggaccct 11820
gccacaggag cacatcgtgc agaagatcaa ggaatgcttt cggaagctgc ccgtcaacag 11880
acctatcgac tggaaagtgt gccagcggat tgtcggactg ctgggcttcg ccgctccctt 11940
tacccagtgc gggtacccag cactgatgcc cctgtatgcc tgtatccagt ctaagcaggc 12000
tttcaccttt agtcctacat acaaggcatt cctgtgcaaa cagtacctga acctgtatcc 12060
agtggcaagg cagcgacctg gactgtgcca ggtctttgca aatgccactc ctaccggctg 12120
ggggctggct atcggacatc agcgaatgcg gggcacattc gtggcccccc tgcctattca 12180
cactgctcag ctgctggcag cctgctttgc tagatctagg agtggagcaa agctgatcgg 12240
caccgacaat agtgtggtcc tgtcaagaaa atacacatcc ttcccatggc tgctgggatg 12300
tgctgcaaac tggattctga ggggcaccag cttcgtgtac gtcccctcag ccctgaatcc 12360
tgctgacgat ccatcccgcg ggcgactggg actgtaccga cctctgctga gactgccctt 12420
caggcctaca actggccgga catctctgta tgccgattca ccaagcgtgc cctcacacct 12480
gcctgacaga gtccactttg cttcacccct gcacgtcgct tggcggcctc cataaggcgc 12540
gccgtttaaa cggccggcct taattaagta acgatacagc agcaattggc aagctgctta 12600
catagaactc gcggcgattg gcatgccgct ttaaaatttt tattttattt ttcttttctt 12660
ttccgaatcg gattttgttt ttaatatttc aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 12720
aaaaaaaaaa 12730
<210> 70
<211> 12730
<212> DNA
<213> Artificial Sequence
<220>
<223> PreS2.S-2A-preS1-2A-Pol-2A-Core Replicon
<400> 70
ataggcggcg catgagagaa gcccagacca attacctacc caaataggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
tagtcagcat agtacatttc atctgactaa tactacaaca ccaccaccat gaatagagga 300
ttctttaaca tgctcggccg ccgccccttc ccggccccca ctgccatgtg gaggccgcgg 360
agaaggaggc aggcggcccc gggaagcgga gctactaact tcagcctgct gaagcaggct 420
ggagacgtgg aggagaaccc tggacctgag aaagttcacg ttgacatcga ggaagacagc 480
ccattcctca gagctttgca gcggagcttc ccgcagtttg aggtagaagc caagcaggtc 540
actgataatg accatgctaa tgccagagcg ttttcgcatc tggcttcaaa actgatcgaa 600
acggaggtgg acccatccga cacgatcctt gacattggaa gtgcgcccgc ccgcagaatg 660
tattctaagc acaagtatca ttgtatctgt ccgatgagat gtgcggaaga tccggacaga 720
ttgtataagt atgcaactaa gctgaagaaa aactgtaagg aaataactga taaggaattg 780
gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc ctgacctgga aactgagact 840
atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc aagtcgctgt ttaccaggat 900
gtatacgcgg ttgacggacc gacaagtctc tatcaccaag ccaataaggg agttagagtc 960
gcctactgga taggctttga caccacccct tttatgttta agaacttggc tggagcatat 1020
ccatcatact ctaccaactg ggccgacgaa accgtgttaa cggctcgtaa cataggccta 1080
tgcagctctg acgttatgga gcggtcacgt agagggatgt ccattcttag aaagaagtat 1140
ttgaaaccat ccaacaatgt tctattctct gttggctcga ccatctacca cgagaagagg 1200
gacttactga ggagctggca cctgccgtct gtatttcact tacgtggcaa gcaaaattac 1260
acatgtcggt gtgagactat agttagttgc gacgggtacg tcgttaaaag aatagctatc 1320
agtccaggcc tgtatgggaa gccttcaggc tatgctgcta cgatgcaccg cgagggattc 1380
ttgtgctgca aagtgacaga cacattgaac ggggagaggg tctcttttcc cgtgtgcacg 1440
tatgtgccag ctacattgtg tgaccaaatg actggcatac tggcaacaga tgtcagtgcg 1500
gacgacgcgc aaaaactgct ggttgggctc aaccagcgta tagtcgtcaa cggtcgcacc 1560
cagagaaaca ccaataccat gaaaaattac cttttgcccg tagtggccca ggcatttgct 1620
aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa ggccactagg actacgagat 1680
agacagttag tcatggggtg ttgttgggct tttagaaggc acaagataac atctatttat 1740
aagcgcccgg atacccaaac catcatcaaa gtgaacagcg atttccactc attcgtgctg 1800
cccaggatag gcagtaacac attggagatc gggctgagaa caagaatcag gaaaatgtta 1860
gaggagcaca aggagccgtc acctctcatt accgccgagg acgtacaaga agctaagtgc 1920
gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt tgcgcgcagc tctaccacct 1980
ttggcagctg atgttgagga gcccactctg gaagccgatg tcgacttgat gttacaagag 2040
gctggggccg gctcagtgga gacacctcgt ggcttgataa aggttaccag ctacgatggc 2100
gaggacaaga tcggctctta cgctgtgctt tctccgcagg ctgtactcaa gagtgaaaaa 2160
ttatcttgca tccaccctct cgctgaacaa gtcatagtga taacacactc tggccgaaaa 2220
gggcgttatg ccgtggaacc ataccatggt aaagtagtgg tgccagaggg acatgcaata 2280
cccgtccagg actttcaagc tctgagtgaa agtgccacca ttgtgtacaa cgaacgtgag 2340
ttcgtaaaca ggtacctgca ccatattgcc acacatggag gagcgctgaa cactgatgaa 2400
gaatattaca aaactgtcaa gcccagcgag cacgacggcg aatacctgta cgacatcgac 2460
aggaaacagt gcgtcaagaa agaactagtc actgggctag ggctcacagg cgagctggtg 2520
gatcctccct tccatgaatt cgcctacgag agtctgagaa cacgaccagc cgctccttac 2580
caagtaccaa ccataggggt gtatggcgtg ccaggatcag gcaagtctgg catcattaaa 2640
agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga aagaaaactg tgcagaaatt 2700
ataagggacg tcaagaaaat gaaagggctg gacgtcaatg ccagaactgt ggactcagtg 2760
ctcttgaatg gatgcaaaca ccccgtagag accctgtata ttgacgaagc ttttgcttgt 2820
catgcaggta ctctcagagc gctcatagcc attataagac ctaaaaaggc agtgctctgc 2880
ggggatccca aacagtgcgg tttttttaac atgatgtgcc tgaaagtgca ttttaaccac 2940
gagatttgca cacaagtctt ccacaaaagc atctctcgcc gttgcactaa atctgtgact 3000
tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa cgacgaatcc gaaagagact 3060
aagattgtga ttgacactac cggcagtacc aaacctaagc aggacgatct cattctcact 3120
tgtttcagag ggtgggtgaa gcagttgcaa atagattaca aaggcaacga aataatgacg 3180
gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg ccgttcggta caaggtgaat 3240
gaaaatcctc tgtacgcacc cacctctgaa catgtgaacg tcctactgac ccgcacggag 3300
gaccgcatcg tgtggaaaac actagccggc gacccatgga taaaaacact gactgccaag 3360
taccctggga atttcactgc cacgatagag gagtggcaag cagagcatga tgccatcatg 3420
aggcacatct tggagagacc ggaccctacc gacgtcttcc agaataaggc aaacgtgtgt 3480
tgggccaagg ctttagtgcc ggtgctgaag accgctggca tagacatgac cactgaacaa 3540
tggaacactg tggattattt tgaaacggac aaagctcact cagcagagat agtattgaac 3600
caactatgcg tgaggttctt tggactcgat ctggactccg gtctattttc tgcacccact 3660
gttccgttat ccattaggaa taatcactgg gataactccc cgtcgcctaa catgtacggg 3720
ctgaataaag aagtggtccg tcagctctct cgcaggtacc cacaactgcc tcgggcagtt 3780
gccactggaa gagtctatga catgaacact ggtacactgc gcaattatga tccgcgcata 3840
aacctagtac ctgtaaacag aagactgcct catgctttag tcctccacca taatgaacac 3900
ccacagagtg acttttcttc attcgtcagc aaattgaagg gcagaactgt cctggtggtc 3960
ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt tgtcagaccg gcctgaggct 4020
accttcagag ctcggctgga tttaggcatc ccaggtgatg tgcccaaata tgacataata 4080
tttgttaatg tgaggacccc atataaatac catcactatc agcagtgtga agaccatgcc 4140
attaagctta gcatgttgac caagaaagct tgtctgcatc tgaatcccgg cggaacctgt 4200
gtcagcatag gttatggtta cgctgacagg gccagcgaaa gcatcattgg tgctatagcg 4260
cggcagttca agttttcccg ggtatgcaaa ccgaaatcct cacttgaaga gacggaagtt 4320
ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc acaatcctta caagctttca 4380
tcaaccttga ccaacattta tacaggttcc agactccacg aagccggatg tgcaccctca 4440
tatcatgtgg tgcgagggga tattgccacg gccaccgaag gagtgattat aaatgctgct 4500
aacagcaaag gacaacctgg cggaggggtg tgcggagcgc tgtataagaa attcccggaa 4560
agcttcgatt tacagccgat cgaagtagga aaagcgcgac tggtcaaagg tgcagctaaa 4620
catatcattc atgccgtagg accaaacttc aacaaagttt cggaggttga aggtgacaaa 4680
cagttggcag aggcttatga gtccatcgct aagattgtca acgataacaa ttacaagtca 4740
gtagcgattc cactgttgtc caccggcatc ttttccggga acaaagatcg actaacccaa 4800
tcattgaacc atttgctgac agctttagac accactgatg cagatgtagc catatactgc 4860
agggacaaga aatgggaaat gactctcaag gaagcagtgg ctaggagaga agcagtggag 4920
gagatatgca tatccgacga ctcttcagtg acagaacctg atgcagagct ggtgagggtg 4980
catccgaaga gttctttggc tggaaggaag ggctacagca caagcgatgg caaaactttc 5040
tcatatttgg aagggaccaa gtttcaccag gcggccaagg atatagcaga aattaatgcc 5100
atgtggcccg ttgcaacgga ggccaatgag caggtatgca tgtatatcct cggagaaagc 5160
atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg aagcctccac accacctagc 5220
acgctgcctt gcttgtgcat ccatgccatg actccagaaa gagtacagcg cctaaaagcc 5280
tcacgtccag aacaaattac tgtgtgctca tcctttccat tgccgaagta tagaatcact 5340
ggtgtgcaga agatccaatg ctcccagcct atattgttct caccgaaagt gcctgcgtat 5400
attcatccaa ggaagtatct cgtggaaaca ccaccggtag acgagactcc ggagccatcg 5460
gcagagaacc aatccacaga ggggacacct gaacaaccac cacttataac cgaggatgag 5520
accaggacta gaacgcctga gccgatcatc atcgaagagg aagaagagga tagcataagt 5580
ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg aggcagacat tcacgggccg 5640
ccctctgtat ctagctcatc ctggtccatt cctcatgcat ccgactttga tgtggacagt 5700
ttatccatac ttgacaccct ggagggagct agcgtgacca gcggggcaac gtcagccgag 5760
actaactctt acttcgcaaa gagtatggag tttctggcgc gaccggtgcc tgcgcctcga 5820
acagtattca ggaaccctcc acatcccgct ccgcgcacaa gaacaccgtc acttgcaccc 5880
agcagggcct gctcgagaac cagcctagtt tccaccccgc caggcgtgaa tagggtgatc 5940
actagagagg agctcgaggc gcttaccccg tcacgcactc ctagcaggtc ggtctcgaga 6000
accagcctgg tctccaaccc gccaggcgta aatagggtga ttacaagaga ggagtttgag 6060
gcgttcgtag cacaacaaca atgacggttt gatgcgggtg catacatctt ttcctccgac 6120
accggtcaag ggcatttaca acaaaaatca gtaaggcaaa cggtgctatc cgaagtggtg 6180
ttggagagga ccgaattgga gatttcgtat gccccgcgcc tcgaccaaga aaaagaagaa 6240
ttactacgca agaaattaca gttaaatccc acacctgcta acagaagcag ataccagtcc 6300
aggaaggtgg agaacatgaa agccataaca gctagacgta ttctgcaagg cctagggcat 6360
tatttgaagg cagaaggaaa agtggagtgc taccgaaccc tgcatcctgt tcctttgtat 6420
tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg cagtggaagc ctgtaacgcc 6480
atgttgaaag agaactttcc gactgtggct tcttactgta ttattccaga gtacgatgcc 6540
tatttggaca tggttgacgg agcttcatgc tgcttagaca ctgccagttt ttgccctgca 6600
aagctgcgca gctttccaaa gaaacactcc tatttggaac ccacaatacg atcggcagtg 6660
ccttcagcga tccagaacac gctccagaac gtcctggcag ctgccacaaa aagaaattgc 6720
aatgtcacgc aaatgagaga attgcccgta ttggattcgg cggcctttaa tgtggaatgc 6780
ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt ttaaagaaaa ccccatcagg 6840
cttactgaag aaaacgtggt aaattacatt accaaattaa aaggaccaaa agctgctgct 6900
ctttttgcga agacacataa tttgaatatg ttgcaggaca taccaatgga caggtttgta 6960
atggacttaa agagagacgt gaaagtgact ccaggaacaa aacatactga agaacggccc 7020
aaggtacagg tgatccaggc tgccgatccg ctagcaacag cgtatctgtg cggaatccac 7080
cgagagctgg ttaggagatt aaatgcggtc ctgcttccga acattcatac actgtttgat 7140
atgtcggctg aagactttga cgctattata gccgagcact tccagcctgg ggattgtgtt 7200
ctggaaactg acatcgcgtc gtttgataaa agtgaggacg acgccatggc tctgaccgcg 7260
ttaatgattc tggaagactt aggtgtggac gcagagctgt tgacgctgat tgaggcggct 7320
ttcggcgaaa tttcatcaat acatttgccc actaaaacta aatttaaatt cggagccatg 7380
atgaaatctg gaatgttcct cacactgttt gtgaacacag tcattaacat tgtaatcgca 7440
agcagagtgt tgagagaacg gctaaccgga tcaccatgtg cagcattcat tggagatgac 7500
aatatcgtga aaggagtcaa atcggacaaa ttaatggcag acaggtgcgc cacctggttg 7560
aatatggaag tcaagattat agatgctgtg gtgggcgaga aagcgcctta tttctgtgga 7620
gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc gtgtggcaga ccccctaaaa 7680
aggctgttta agcttggcaa acctctggca gcagacgatg aacatgatga tgacaggaga 7740
agggcattgc atgaagagtc aacacgctgg aaccgagtgg gtattctttc agagctgtgc 7800
aaggcagtag aatcaaggta tgaaaccgta ggaacttcca tcatagttat ggccatgact 7860
actctagcta gcagtgttaa atcattcagc tacctgagag gggcccctat aactctctac 7920
ggctaacctg aatggactac gacatagtct agtccgccaa gatatcatgc agtggaactc 7980
aactactttc catcagaccc ttcaggaccc tagagtgcgc gggctgtact ttcctgctgg 8040
gggaagcagt agcgggaccg ttaatccagt acctacgacc gcctctccca tatcttctat 8100
ctttagtagg actggtgacc ctgctcccaa catggagaat atcacctccg ggtttctggg 8160
cccactcctg gtccttcagg ccggattctt cctgctgact cgaatcctca ccatacccca 8220
gagcctggac agctggtgga caagcctgaa ttttctggga ggaactcctg tatgcctggg 8280
acaaaattca cagtccccta caagtaacca ttcaccgaca agttgtcctc ccatctgtcc 8340
cggatacagg tggatgtgcc tgcgaaggtt catcatcttc ctcttcatcc tcttgctttg 8400
ccttattttc ctcctggttc ttctggacta tcagggcatg ctgcctgtgt gcccactgat 8460
accaggatct agtactacca gcacaggccc gtgtaagacc tgtacaattc cagcacaagg 8520
gactagtatg ttcccctcct gctgttgtac taagccaagc gacggtaatt gcacgtgtat 8580
cccaatcccg tcctcctggg cgtttgccaa gtacctctgg gaatgggcct cagtcagatt 8640
ttcatggctt agtcttttgg tgccgttcgt gcagtggttt gtgggactct ctccgactgt 8700
gtggctcagc gtgatctgga tgatgtggta ctggggccct tccctttaca acatactgtc 8760
tccattcctt cccctgctgc caatcttctt ttgcctgtgg gtctatattg ggtccggagc 8820
gactaacttt tccctgctga aacaagcggg tgacgtcgaa gagaatccgg gacctatggc 8880
taggcccctg tgtacacttt tgctcctgat ggccaccctc gctggagctc tggcaagcgg 8940
tggatggagc tcaaagccgc ggaaagggat gggtactaac ctgtccgtac caaatcccct 9000
gggatttttt ccagaccacc aactcgatcc tgcttttggc gcaaattcca acaatcccga 9060
ctgggacttt aaccctaaca aggaccactg gcctgatgcc aacaaggtgg gggcaggagc 9120
ctttggtccc ggcttcaccc caccccatgg aggtcttttg ggatggtcac cacaggccca 9180
gggcatcctg accactgtcc ctgctgctcc accgccagct tctactaatc gacagagcgg 9240
gaggcagccg acccccctga gtccccccct gcgggatacc caccctcagg caggatcagg 9300
cgctacgaat tttagccttc tgaagcaagc gggagacgtt gaagaaaacc cagggcctat 9360
ggctcgacct ctgtgtaccc tgctactcct gatggctacc ctggctggag ctctggccag 9420
catgcccctg tcttaccagc actttagaaa gcttctgctg ctggacgatg aagccgggcc 9480
tctggaggaa gagctgccaa ggctggcaga cgaggggctg aaccggagag tggccgaaga 9540
tctgaatctg ggaaacctga acgtgagcat cccttggact cataaagtcg gcaacttcac 9600
cgggctgtac agctccacag tgcctgtctt caatccagag tggcagacac catcctttcc 9660
caacattcac ctgcaggagg acatcattaa tagatgcgaa cagttcgtgg gacctctgac 9720
agtcaacgaa aagaggcgcc tgaaactgat catgcctgcc aggttttacc caaatgtgac 9780
taagtatctg ccactggata agggcatcaa gccttactat ccagagcacc tggtgaacca 9840
ttacttccag actagacact atctgcatac cctgtggaag gccggaatcc tgtacaaacg 9900
agaaactacc cggagtgctt cattttgtgg ctccccatat tcttgggaac aggagctgca 9960
gcatggcagg ctggtgttcc agaccagcaa acgccacggg gatgagtcct tttgcagcca 10020
gtctagtggc atcctgagca gatcccccgt ggggccttgt attcagtctc agctgcggaa 10080
gagtagactg ggactgcagc cacagcaggg acacctggca cgacggcagc agggaaggtc 10140
tggcagtatc cgggctagag tgcatcccac aactagaagg accttcggcg tcgagccatc 10200
aggaagcggc cacatcgaca acagcgcatc aagctcctct agttgcctgc atcagtcagc 10260
cgtgagaaag gccgcttaca gccacctgtc cacatctaaa aggcactcaa gctccgggca 10320
tgctgtggag ctgcacaaca tccctccaaa ttctgcacgc agtcagtcag aaggacccgt 10380
gttcagctgc tggtggctgc agtttcggaa ctcaaagcct tgcagcgact attgtctgag 10440
ccatattgtg aatctgctgg aggattgggg cccttgtacc gagcacgggg aacaccatat 10500
caggattcca cgaacaccag cacgagtgac tggaggggtg ttcctggtgg acaagaaccc 10560
ccacaatact accgagagcc ggctggtggt cgatttcagt cagttttcaa gaggcaacac 10620
aagggtgtca tggcccaaat tcgccgtccc taatctgcag agtctgacta acctgctgtc 10680
tagtaatctg agctggctgt ccctggacgt gtccgcagcc ttttaccacc tgcctctgca 10740
tccagctgca atgccccatc tgctggtggg gtcaagcgga ctgagtcgct acgtcgcccg 10800
actgtcctct aactcacgca tcattaatca ccagcatggc accatgcaga acctgcacga 10860
tagctgttcc cggaatctgt acgtgtctct gctgctgctg tataagacat tcggcagaaa 10920
actgcacctg tacagccatc ctatcattct ggggtttagg aagatcccaa tgggagtggg 10980
actgagcccc ttcctgctgg cacagtttac ctccgccatt tgctctgtgg tccgccgagc 11040
cttcccacac tgtctggctt tttcctatat gaacaatgtg gtcctgggcg ccaaatccgt 11100
gcagcatctg gagtctctgt tcacagctgt cactaacttt ctgctgagcc tggggatcca 11160
cctgaaccca aataagacta aacgctgggg gtacagcctg aatttcatgg gatatgtgat 11220
tggatcctgg gggaccctgc cacaggagca catcgtgcag aagatcaagg aatgctttcg 11280
gaagctgccc gtcaacagac ctatcgactg gaaagtgtgc cagcggattg tcggactgct 11340
gggcttcgcc gctcccttta cccagtgcgg gtacccagca ctgatgcccc tgtatgcctg 11400
tatccagtct aagcaggctt tcacctttag tcctacatac aaggcattcc tgtgcaaaca 11460
gtacctgaac ctgtatccag tggcaaggca gcgacctgga ctgtgccagg tctttgcaaa 11520
tgccactcct accggctggg ggctggctat cggacatcag cgaatgcggg gcacattcgt 11580
ggcccccctg cctattcaca ctgctcagct gctggcagcc tgctttgcta gatctaggag 11640
tggagcaaag ctgatcggca ccgacaatag tgtggtcctg tcaagaaaat acacatcctt 11700
cccatggctg ctgggatgtg ctgcaaactg gattctgagg ggcaccagct tcgtgtacgt 11760
cccctcagcc ctgaatcctg ctgacgatcc atcccgcggg cgactgggac tgtaccgacc 11820
tctgctgaga ctgcccttca ggcctacaac tggccggaca tctctgtatg ccgattcacc 11880
aagcgtgccc tcacacctgc ctgacagagt ccactttgct tcacccctgc acgtcgcttg 11940
gcggcctcca ggaagcggag ctactaactt cagcctgctg aagcaggctg gagacgtgga 12000
ggagaaccct ggacctatgg ctcgacctct gtgtaccctg ctactcctga tggctaccct 12060
ggctggagct ctggccagcg acatcgaccc ttacaaggag ttcggcgcca gcgtggaact 12120
gctgtctttt ctgcccagtg atttctttcc ttccattcga gacctgctgg ataccgcctc 12180
tgctctgtat cgggaagccc tggagagccc agaacactgc tccccacacc ataccgctct 12240
gcgacaggca atcctgtgct ggggggagct gatgaacctg gccacatggg tgggatcgaa 12300
tctggaggac cccgcttcac gggaactggt ggtcagctac gtgaacgtca atatgggcct 12360
gaaaatccgc cagctgctgt ggttccatat tagctgcctg acttttggac gagagaccgt 12420
gctggaatac ctggtgtcct tcggcgtctg gattcgcact ccccctgctt atcgaccacc 12480
caacgcacca attctgtcca ccctgcccga gaccacagtg gtccgtcgcc gttaaggcgc 12540
gccgtttaaa cggccggcct taattaagta acgatacagc agcaattggc aagctgctta 12600
catagaactc gcggcgattg gcatgccgct ttaaaatttt tattttattt ttcttttctt 12660
ttccgaatcg gattttgttt ttaatatttc aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 12720
aaaaaaaaaa 12730
<210> 71
<211> 13254
<212> DNA
<213> Artificial Sequence
<220>
<223> Pol-2A-Core-IRES (EMCV)-PreS2.S-2A-preS1 Replicon
<400> 71
ataggcggcg catgagagaa gcccagacca attacctacc caaataggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
tagtcagcat agtacatttc atctgactaa tactacaaca ccaccaccat gaatagagga 300
ttctttaaca tgctcggccg ccgccccttc ccggccccca ctgccatgtg gaggccgcgg 360
agaaggaggc aggcggcccc gggaagcgga gctactaact tcagcctgct gaagcaggct 420
ggagacgtgg aggagaaccc tggacctgag aaagttcacg ttgacatcga ggaagacagc 480
ccattcctca gagctttgca gcggagcttc ccgcagtttg aggtagaagc caagcaggtc 540
actgataatg accatgctaa tgccagagcg ttttcgcatc tggcttcaaa actgatcgaa 600
acggaggtgg acccatccga cacgatcctt gacattggaa gtgcgcccgc ccgcagaatg 660
tattctaagc acaagtatca ttgtatctgt ccgatgagat gtgcggaaga tccggacaga 720
ttgtataagt atgcaactaa gctgaagaaa aactgtaagg aaataactga taaggaattg 780
gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc ctgacctgga aactgagact 840
atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc aagtcgctgt ttaccaggat 900
gtatacgcgg ttgacggacc gacaagtctc tatcaccaag ccaataaggg agttagagtc 960
gcctactgga taggctttga caccacccct tttatgttta agaacttggc tggagcatat 1020
ccatcatact ctaccaactg ggccgacgaa accgtgttaa cggctcgtaa cataggccta 1080
tgcagctctg acgttatgga gcggtcacgt agagggatgt ccattcttag aaagaagtat 1140
ttgaaaccat ccaacaatgt tctattctct gttggctcga ccatctacca cgagaagagg 1200
gacttactga ggagctggca cctgccgtct gtatttcact tacgtggcaa gcaaaattac 1260
acatgtcggt gtgagactat agttagttgc gacgggtacg tcgttaaaag aatagctatc 1320
agtccaggcc tgtatgggaa gccttcaggc tatgctgcta cgatgcaccg cgagggattc 1380
ttgtgctgca aagtgacaga cacattgaac ggggagaggg tctcttttcc cgtgtgcacg 1440
tatgtgccag ctacattgtg tgaccaaatg actggcatac tggcaacaga tgtcagtgcg 1500
gacgacgcgc aaaaactgct ggttgggctc aaccagcgta tagtcgtcaa cggtcgcacc 1560
cagagaaaca ccaataccat gaaaaattac cttttgcccg tagtggccca ggcatttgct 1620
aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa ggccactagg actacgagat 1680
agacagttag tcatggggtg ttgttgggct tttagaaggc acaagataac atctatttat 1740
aagcgcccgg atacccaaac catcatcaaa gtgaacagcg atttccactc attcgtgctg 1800
cccaggatag gcagtaacac attggagatc gggctgagaa caagaatcag gaaaatgtta 1860
gaggagcaca aggagccgtc acctctcatt accgccgagg acgtacaaga agctaagtgc 1920
gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt tgcgcgcagc tctaccacct 1980
ttggcagctg atgttgagga gcccactctg gaagccgatg tcgacttgat gttacaagag 2040
gctggggccg gctcagtgga gacacctcgt ggcttgataa aggttaccag ctacgatggc 2100
gaggacaaga tcggctctta cgctgtgctt tctccgcagg ctgtactcaa gagtgaaaaa 2160
ttatcttgca tccaccctct cgctgaacaa gtcatagtga taacacactc tggccgaaaa 2220
gggcgttatg ccgtggaacc ataccatggt aaagtagtgg tgccagaggg acatgcaata 2280
cccgtccagg actttcaagc tctgagtgaa agtgccacca ttgtgtacaa cgaacgtgag 2340
ttcgtaaaca ggtacctgca ccatattgcc acacatggag gagcgctgaa cactgatgaa 2400
gaatattaca aaactgtcaa gcccagcgag cacgacggcg aatacctgta cgacatcgac 2460
aggaaacagt gcgtcaagaa agaactagtc actgggctag ggctcacagg cgagctggtg 2520
gatcctccct tccatgaatt cgcctacgag agtctgagaa cacgaccagc cgctccttac 2580
caagtaccaa ccataggggt gtatggcgtg ccaggatcag gcaagtctgg catcattaaa 2640
agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga aagaaaactg tgcagaaatt 2700
ataagggacg tcaagaaaat gaaagggctg gacgtcaatg ccagaactgt ggactcagtg 2760
ctcttgaatg gatgcaaaca ccccgtagag accctgtata ttgacgaagc ttttgcttgt 2820
catgcaggta ctctcagagc gctcatagcc attataagac ctaaaaaggc agtgctctgc 2880
ggggatccca aacagtgcgg tttttttaac atgatgtgcc tgaaagtgca ttttaaccac 2940
gagatttgca cacaagtctt ccacaaaagc atctctcgcc gttgcactaa atctgtgact 3000
tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa cgacgaatcc gaaagagact 3060
aagattgtga ttgacactac cggcagtacc aaacctaagc aggacgatct cattctcact 3120
tgtttcagag ggtgggtgaa gcagttgcaa atagattaca aaggcaacga aataatgacg 3180
gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg ccgttcggta caaggtgaat 3240
gaaaatcctc tgtacgcacc cacctctgaa catgtgaacg tcctactgac ccgcacggag 3300
gaccgcatcg tgtggaaaac actagccggc gacccatgga taaaaacact gactgccaag 3360
taccctggga atttcactgc cacgatagag gagtggcaag cagagcatga tgccatcatg 3420
aggcacatct tggagagacc ggaccctacc gacgtcttcc agaataaggc aaacgtgtgt 3480
tgggccaagg ctttagtgcc ggtgctgaag accgctggca tagacatgac cactgaacaa 3540
tggaacactg tggattattt tgaaacggac aaagctcact cagcagagat agtattgaac 3600
caactatgcg tgaggttctt tggactcgat ctggactccg gtctattttc tgcacccact 3660
gttccgttat ccattaggaa taatcactgg gataactccc cgtcgcctaa catgtacggg 3720
ctgaataaag aagtggtccg tcagctctct cgcaggtacc cacaactgcc tcgggcagtt 3780
gccactggaa gagtctatga catgaacact ggtacactgc gcaattatga tccgcgcata 3840
aacctagtac ctgtaaacag aagactgcct catgctttag tcctccacca taatgaacac 3900
ccacagagtg acttttcttc attcgtcagc aaattgaagg gcagaactgt cctggtggtc 3960
ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt tgtcagaccg gcctgaggct 4020
accttcagag ctcggctgga tttaggcatc ccaggtgatg tgcccaaata tgacataata 4080
tttgttaatg tgaggacccc atataaatac catcactatc agcagtgtga agaccatgcc 4140
attaagctta gcatgttgac caagaaagct tgtctgcatc tgaatcccgg cggaacctgt 4200
gtcagcatag gttatggtta cgctgacagg gccagcgaaa gcatcattgg tgctatagcg 4260
cggcagttca agttttcccg ggtatgcaaa ccgaaatcct cacttgaaga gacggaagtt 4320
ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc acaatcctta caagctttca 4380
tcaaccttga ccaacattta tacaggttcc agactccacg aagccggatg tgcaccctca 4440
tatcatgtgg tgcgagggga tattgccacg gccaccgaag gagtgattat aaatgctgct 4500
aacagcaaag gacaacctgg cggaggggtg tgcggagcgc tgtataagaa attcccggaa 4560
agcttcgatt tacagccgat cgaagtagga aaagcgcgac tggtcaaagg tgcagctaaa 4620
catatcattc atgccgtagg accaaacttc aacaaagttt cggaggttga aggtgacaaa 4680
cagttggcag aggcttatga gtccatcgct aagattgtca acgataacaa ttacaagtca 4740
gtagcgattc cactgttgtc caccggcatc ttttccggga acaaagatcg actaacccaa 4800
tcattgaacc atttgctgac agctttagac accactgatg cagatgtagc catatactgc 4860
agggacaaga aatgggaaat gactctcaag gaagcagtgg ctaggagaga agcagtggag 4920
gagatatgca tatccgacga ctcttcagtg acagaacctg atgcagagct ggtgagggtg 4980
catccgaaga gttctttggc tggaaggaag ggctacagca caagcgatgg caaaactttc 5040
tcatatttgg aagggaccaa gtttcaccag gcggccaagg atatagcaga aattaatgcc 5100
atgtggcccg ttgcaacgga ggccaatgag caggtatgca tgtatatcct cggagaaagc 5160
atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg aagcctccac accacctagc 5220
acgctgcctt gcttgtgcat ccatgccatg actccagaaa gagtacagcg cctaaaagcc 5280
tcacgtccag aacaaattac tgtgtgctca tcctttccat tgccgaagta tagaatcact 5340
ggtgtgcaga agatccaatg ctcccagcct atattgttct caccgaaagt gcctgcgtat 5400
attcatccaa ggaagtatct cgtggaaaca ccaccggtag acgagactcc ggagccatcg 5460
gcagagaacc aatccacaga ggggacacct gaacaaccac cacttataac cgaggatgag 5520
accaggacta gaacgcctga gccgatcatc atcgaagagg aagaagagga tagcataagt 5580
ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg aggcagacat tcacgggccg 5640
ccctctgtat ctagctcatc ctggtccatt cctcatgcat ccgactttga tgtggacagt 5700
ttatccatac ttgacaccct ggagggagct agcgtgacca gcggggcaac gtcagccgag 5760
actaactctt acttcgcaaa gagtatggag tttctggcgc gaccggtgcc tgcgcctcga 5820
acagtattca ggaaccctcc acatcccgct ccgcgcacaa gaacaccgtc acttgcaccc 5880
agcagggcct gctcgagaac cagcctagtt tccaccccgc caggcgtgaa tagggtgatc 5940
actagagagg agctcgaggc gcttaccccg tcacgcactc ctagcaggtc ggtctcgaga 6000
accagcctgg tctccaaccc gccaggcgta aatagggtga ttacaagaga ggagtttgag 6060
gcgttcgtag cacaacaaca atgacggttt gatgcgggtg catacatctt ttcctccgac 6120
accggtcaag ggcatttaca acaaaaatca gtaaggcaaa cggtgctatc cgaagtggtg 6180
ttggagagga ccgaattgga gatttcgtat gccccgcgcc tcgaccaaga aaaagaagaa 6240
ttactacgca agaaattaca gttaaatccc acacctgcta acagaagcag ataccagtcc 6300
aggaaggtgg agaacatgaa agccataaca gctagacgta ttctgcaagg cctagggcat 6360
tatttgaagg cagaaggaaa agtggagtgc taccgaaccc tgcatcctgt tcctttgtat 6420
tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg cagtggaagc ctgtaacgcc 6480
atgttgaaag agaactttcc gactgtggct tcttactgta ttattccaga gtacgatgcc 6540
tatttggaca tggttgacgg agcttcatgc tgcttagaca ctgccagttt ttgccctgca 6600
aagctgcgca gctttccaaa gaaacactcc tatttggaac ccacaatacg atcggcagtg 6660
ccttcagcga tccagaacac gctccagaac gtcctggcag ctgccacaaa aagaaattgc 6720
aatgtcacgc aaatgagaga attgcccgta ttggattcgg cggcctttaa tgtggaatgc 6780
ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt ttaaagaaaa ccccatcagg 6840
cttactgaag aaaacgtggt aaattacatt accaaattaa aaggaccaaa agctgctgct 6900
ctttttgcga agacacataa tttgaatatg ttgcaggaca taccaatgga caggtttgta 6960
atggacttaa agagagacgt gaaagtgact ccaggaacaa aacatactga agaacggccc 7020
aaggtacagg tgatccaggc tgccgatccg ctagcaacag cgtatctgtg cggaatccac 7080
cgagagctgg ttaggagatt aaatgcggtc ctgcttccga acattcatac actgtttgat 7140
atgtcggctg aagactttga cgctattata gccgagcact tccagcctgg ggattgtgtt 7200
ctggaaactg acatcgcgtc gtttgataaa agtgaggacg acgccatggc tctgaccgcg 7260
ttaatgattc tggaagactt aggtgtggac gcagagctgt tgacgctgat tgaggcggct 7320
ttcggcgaaa tttcatcaat acatttgccc actaaaacta aatttaaatt cggagccatg 7380
atgaaatctg gaatgttcct cacactgttt gtgaacacag tcattaacat tgtaatcgca 7440
agcagagtgt tgagagaacg gctaaccgga tcaccatgtg cagcattcat tggagatgac 7500
aatatcgtga aaggagtcaa atcggacaaa ttaatggcag acaggtgcgc cacctggttg 7560
aatatggaag tcaagattat agatgctgtg gtgggcgaga aagcgcctta tttctgtgga 7620
gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc gtgtggcaga ccccctaaaa 7680
aggctgttta agcttggcaa acctctggca gcagacgatg aacatgatga tgacaggaga 7740
agggcattgc atgaagagtc aacacgctgg aaccgagtgg gtattctttc agagctgtgc 7800
aaggcagtag aatcaaggta tgaaaccgta ggaacttcca tcatagttat ggccatgact 7860
actctagcta gcagtgttaa atcattcagc tacctgagag gggcccctat aactctctac 7920
ggctaacctg aatggactac gacatagtct agtccgccaa gatatcatgg ctcgacctct 7980
gtgtaccctg ctactcctga tggctaccct ggctggagct ctggccagca tgcccctgtc 8040
ttaccagcac tttagaaagc ttctgctgct ggacgatgaa gccgggcctc tggaggaaga 8100
gctgccaagg ctggcagacg aggggctgaa ccggagagtg gccgaagatc tgaatctggg 8160
aaacctgaac gtgagcatcc cttggactca taaagtcggc aacttcaccg ggctgtacag 8220
ctccacagtg cctgtcttca atccagagtg gcagacacca tcctttccca acattcacct 8280
gcaggaggac atcattaata gatgcgaaca gttcgtggga cctctgacag tcaacgaaaa 8340
gaggcgcctg aaactgatca tgcctgccag gttttaccca aatgtgacta agtatctgcc 8400
actggataag ggcatcaagc cttactatcc agagcacctg gtgaaccatt acttccagac 8460
tagacactat ctgcataccc tgtggaaggc cggaatcctg tacaaacgag aaactacccg 8520
gagtgcttca ttttgtggct ccccatattc ttgggaacag gagctgcagc atggcaggct 8580
ggtgttccag accagcaaac gccacgggga tgagtccttt tgcagccagt ctagtggcat 8640
cctgagcaga tcccccgtgg ggccttgtat tcagtctcag ctgcggaaga gtagactggg 8700
actgcagcca cagcagggac acctggcacg acggcagcag ggaaggtctg gcagtatccg 8760
ggctagagtg catcccacaa ctagaaggac cttcggcgtc gagccatcag gaagcggcca 8820
catcgacaac agcgcatcaa gctcctctag ttgcctgcat cagtcagccg tgagaaaggc 8880
cgcttacagc cacctgtcca catctaaaag gcactcaagc tccgggcatg ctgtggagct 8940
gcacaacatc cctccaaatt ctgcacgcag tcagtcagaa ggacccgtgt tcagctgctg 9000
gtggctgcag tttcggaact caaagccttg cagcgactat tgtctgagcc atattgtgaa 9060
tctgctggag gattggggcc cttgtaccga gcacggggaa caccatatca ggattccacg 9120
aacaccagca cgagtgactg gaggggtgtt cctggtggac aagaaccccc acaatactac 9180
cgagagccgg ctggtggtcg atttcagtca gttttcaaga ggcaacacaa gggtgtcatg 9240
gcccaaattc gccgtcccta atctgcagag tctgactaac ctgctgtcta gtaatctgag 9300
ctggctgtcc ctggacgtgt ccgcagcctt ttaccacctg cctctgcatc cagctgcaat 9360
gccccatctg ctggtggggt caagcggact gagtcgctac gtcgcccgac tgtcctctaa 9420
ctcacgcatc attaatcacc agcatggcac catgcagaac ctgcacgata gctgttcccg 9480
gaatctgtac gtgtctctgc tgctgctgta taagacattc ggcagaaaac tgcacctgta 9540
cagccatcct atcattctgg ggtttaggaa gatcccaatg ggagtgggac tgagcccctt 9600
cctgctggca cagtttacct ccgccatttg ctctgtggtc cgccgagcct tcccacactg 9660
tctggctttt tcctatatga acaatgtggt cctgggcgcc aaatccgtgc agcatctgga 9720
gtctctgttc acagctgtca ctaactttct gctgagcctg gggatccacc tgaacccaaa 9780
taagactaaa cgctgggggt acagcctgaa tttcatggga tatgtgattg gatcctgggg 9840
gaccctgcca caggagcaca tcgtgcagaa gatcaaggaa tgctttcgga agctgcccgt 9900
caacagacct atcgactgga aagtgtgcca gcggattgtc ggactgctgg gcttcgccgc 9960
tccctttacc cagtgcgggt acccagcact gatgcccctg tatgcctgta tccagtctaa 10020
gcaggctttc acctttagtc ctacatacaa ggcattcctg tgcaaacagt acctgaacct 10080
gtatccagtg gcaaggcagc gacctggact gtgccaggtc tttgcaaatg ccactcctac 10140
cggctggggg ctggctatcg gacatcagcg aatgcggggc acattcgtgg cccccctgcc 10200
tattcacact gctcagctgc tggcagcctg ctttgctaga tctaggagtg gagcaaagct 10260
gatcggcacc gacaatagtg tggtcctgtc aagaaaatac acatccttcc catggctgct 10320
gggatgtgct gcaaactgga ttctgagggg caccagcttc gtgtacgtcc cctcagccct 10380
gaatcctgct gacgatccat cccgcgggcg actgggactg taccgacctc tgctgagact 10440
gcccttcagg cctacaactg gccggacatc tctgtatgcc gattcaccaa gcgtgccctc 10500
acacctgcct gacagagtcc actttgcttc acccctgcac gtcgcttggc ggcctccagg 10560
aagcggagct actaacttca gcctgctgaa gcaggctgga gacgtggagg agaaccctgg 10620
acctatggct cgacctctgt gtaccctgct actcctgatg gctaccctgg ctggagctct 10680
ggccagcgac atcgaccctt acaaggagtt cggcgccagc gtggaactgc tgtcttttct 10740
gcccagtgat ttctttcctt ccattcgaga cctgctggat accgcctctg ctctgtatcg 10800
ggaagccctg gagagcccag aacactgctc cccacaccat accgctctgc gacaggcaat 10860
cctgtgctgg ggggagctga tgaacctggc cacatgggtg ggatcgaatc tggaggaccc 10920
cgcttcacgg gaactggtgg tcagctacgt gaacgtcaat atgggcctga aaatccgcca 10980
gctgctgtgg ttccatatta gctgcctgac ttttggacga gagaccgtgc tggaatacct 11040
ggtgtccttc ggcgtctgga ttcgcactcc ccctgcttat cgaccaccca acgcaccaat 11100
tctgtccacc ctgcccgaga ccacagtggt ccgtcgccgt taagcccctc tccctccccc 11160
ccccctaacg ttactggccg aagccgcttg gaataaggcc ggtgtgcgtt tgtctatatg 11220
ttattttcca ccatattgcc gtcttttggc aatgtgaggg cccggaaacc tggccctgtc 11280
ttcttgacga gcattcctag gggtctttcc cctctcgcca aaggaatgca aggtctgttg 11340
aatgtcgtga aggaagcagt tcctctggaa gcttcttgaa gacaaacaac gtctgtagcg 11400
accctttgca ggcagcggaa ccccccacct ggcgacaggt gcctctgcgg ccaaaagcca 11460
cgtgtataag atacacctgc aaaggcggca caaccccagt gccacgttgt gagttggata 11520
gttgtggaaa gagtcaaatg gctctcctca agcgtattca acaaggggct gaaggatgcc 11580
cagaaggtac cccattgtat gggatctgat ctggggcctc ggtgcacatg ctttacatgt 11640
gtttagtcga ggttaaaaaa cgtctaggcc ccccgaacca cggggacgtg gttttccttt 11700
gaaaaacacg atgataatat ggccacaacc atgcagtgga actcaactac tttccatcag 11760
acccttcagg accctagagt gcgcgggctg tactttcctg ctgggggaag cagtagcggg 11820
accgttaatc cagtacctac gaccgcctct cccatatctt ctatctttag taggactggt 11880
gaccctgctc ccaacatgga gaatatcacc tccgggtttc tgggcccact cctggtcctt 11940
caggccggat tcttcctgct gactcgaatc ctcaccatac cccagagcct ggacagctgg 12000
tggacaagcc tgaattttct gggaggaact cctgtatgcc tgggacaaaa ttcacagtcc 12060
cctacaagta accattcacc gacaagttgt cctcccatct gtcccggata caggtggatg 12120
tgcctgcgaa ggttcatcat cttcctcttc atcctcttgc tttgccttat tttcctcctg 12180
gttcttctgg actatcaggg catgctgcct gtgtgcccac tgataccagg atctagtact 12240
accagcacag gcccgtgtaa gacctgtaca attccagcac aagggactag tatgttcccc 12300
tcctgctgtt gtactaagcc aagcgacggt aattgcacgt gtatcccaat cccgtcctcc 12360
tgggcgtttg ccaagtacct ctgggaatgg gcctcagtca gattttcatg gcttagtctt 12420
ttggtgccgt tcgtgcagtg gtttgtggga ctctctccga ctgtgtggct cagcgtgatc 12480
tggatgatgt ggtactgggg cccttccctt tacaacatac tgtctccatt ccttcccctg 12540
ctgccaatct tcttttgcct gtgggtctat attgggtccg gagcgactaa cttttccctg 12600
ctgaaacaag cgggtgacgt cgaagagaat ccgggaccta tggctaggcc cctgtgtaca 12660
cttttgctcc tgatggccac cctcgctgga gctctggcaa gcggtggatg gagctcaaag 12720
ccgcggaaag ggatgggtac taacctgtcc gtaccaaatc ccctgggatt ttttccagac 12780
caccaactcg atcctgcttt tggcgcaaat tccaacaatc ccgactggga ctttaaccct 12840
aacaaggacc actggcctga tgccaacaag gtgggggcag gagcctttgg tcccggcttc 12900
accccacccc atggaggtct tttgggatgg tcaccacagg cccagggcat cctgaccact 12960
gtccctgctg ctccaccgcc agcttctact aatcgacaga gcgggaggca gccgaccccc 13020
ctgagtcccc ccctgcggga tacccaccct caggcataag gcgcgccgtt taaacggccg 13080
gccttaatta agtaacgata cagcagcaat tggcaagctg cttacataga actcgcggcg 13140
attggcatgc cgctttaaaa tttttatttt atttttcttt tcttttccga atcggatttt 13200
gtttttaata tttcaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaa 13254
<210> 72
<211> 13414
<212> DNA
<213> Artificial Sequence
<220>
<223> Pol-2A-Core-IRES (EV71)-PreS2.S-2A-preS1 Replicon
<400> 72
ataggcggcg catgagagaa gcccagacca attacctacc caaataggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
tagtcagcat agtacatttc atctgactaa tactacaaca ccaccaccat gaatagagga 300
ttctttaaca tgctcggccg ccgccccttc ccggccccca ctgccatgtg gaggccgcgg 360
agaaggaggc aggcggcccc gggaagcgga gctactaact tcagcctgct gaagcaggct 420
ggagacgtgg aggagaaccc tggacctgag aaagttcacg ttgacatcga ggaagacagc 480
ccattcctca gagctttgca gcggagcttc ccgcagtttg aggtagaagc caagcaggtc 540
actgataatg accatgctaa tgccagagcg ttttcgcatc tggcttcaaa actgatcgaa 600
acggaggtgg acccatccga cacgatcctt gacattggaa gtgcgcccgc ccgcagaatg 660
tattctaagc acaagtatca ttgtatctgt ccgatgagat gtgcggaaga tccggacaga 720
ttgtataagt atgcaactaa gctgaagaaa aactgtaagg aaataactga taaggaattg 780
gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc ctgacctgga aactgagact 840
atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc aagtcgctgt ttaccaggat 900
gtatacgcgg ttgacggacc gacaagtctc tatcaccaag ccaataaggg agttagagtc 960
gcctactgga taggctttga caccacccct tttatgttta agaacttggc tggagcatat 1020
ccatcatact ctaccaactg ggccgacgaa accgtgttaa cggctcgtaa cataggccta 1080
tgcagctctg acgttatgga gcggtcacgt agagggatgt ccattcttag aaagaagtat 1140
ttgaaaccat ccaacaatgt tctattctct gttggctcga ccatctacca cgagaagagg 1200
gacttactga ggagctggca cctgccgtct gtatttcact tacgtggcaa gcaaaattac 1260
acatgtcggt gtgagactat agttagttgc gacgggtacg tcgttaaaag aatagctatc 1320
agtccaggcc tgtatgggaa gccttcaggc tatgctgcta cgatgcaccg cgagggattc 1380
ttgtgctgca aagtgacaga cacattgaac ggggagaggg tctcttttcc cgtgtgcacg 1440
tatgtgccag ctacattgtg tgaccaaatg actggcatac tggcaacaga tgtcagtgcg 1500
gacgacgcgc aaaaactgct ggttgggctc aaccagcgta tagtcgtcaa cggtcgcacc 1560
cagagaaaca ccaataccat gaaaaattac cttttgcccg tagtggccca ggcatttgct 1620
aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa ggccactagg actacgagat 1680
agacagttag tcatggggtg ttgttgggct tttagaaggc acaagataac atctatttat 1740
aagcgcccgg atacccaaac catcatcaaa gtgaacagcg atttccactc attcgtgctg 1800
cccaggatag gcagtaacac attggagatc gggctgagaa caagaatcag gaaaatgtta 1860
gaggagcaca aggagccgtc acctctcatt accgccgagg acgtacaaga agctaagtgc 1920
gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt tgcgcgcagc tctaccacct 1980
ttggcagctg atgttgagga gcccactctg gaagccgatg tcgacttgat gttacaagag 2040
gctggggccg gctcagtgga gacacctcgt ggcttgataa aggttaccag ctacgatggc 2100
gaggacaaga tcggctctta cgctgtgctt tctccgcagg ctgtactcaa gagtgaaaaa 2160
ttatcttgca tccaccctct cgctgaacaa gtcatagtga taacacactc tggccgaaaa 2220
gggcgttatg ccgtggaacc ataccatggt aaagtagtgg tgccagaggg acatgcaata 2280
cccgtccagg actttcaagc tctgagtgaa agtgccacca ttgtgtacaa cgaacgtgag 2340
ttcgtaaaca ggtacctgca ccatattgcc acacatggag gagcgctgaa cactgatgaa 2400
gaatattaca aaactgtcaa gcccagcgag cacgacggcg aatacctgta cgacatcgac 2460
aggaaacagt gcgtcaagaa agaactagtc actgggctag ggctcacagg cgagctggtg 2520
gatcctccct tccatgaatt cgcctacgag agtctgagaa cacgaccagc cgctccttac 2580
caagtaccaa ccataggggt gtatggcgtg ccaggatcag gcaagtctgg catcattaaa 2640
agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga aagaaaactg tgcagaaatt 2700
ataagggacg tcaagaaaat gaaagggctg gacgtcaatg ccagaactgt ggactcagtg 2760
ctcttgaatg gatgcaaaca ccccgtagag accctgtata ttgacgaagc ttttgcttgt 2820
catgcaggta ctctcagagc gctcatagcc attataagac ctaaaaaggc agtgctctgc 2880
ggggatccca aacagtgcgg tttttttaac atgatgtgcc tgaaagtgca ttttaaccac 2940
gagatttgca cacaagtctt ccacaaaagc atctctcgcc gttgcactaa atctgtgact 3000
tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa cgacgaatcc gaaagagact 3060
aagattgtga ttgacactac cggcagtacc aaacctaagc aggacgatct cattctcact 3120
tgtttcagag ggtgggtgaa gcagttgcaa atagattaca aaggcaacga aataatgacg 3180
gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg ccgttcggta caaggtgaat 3240
gaaaatcctc tgtacgcacc cacctctgaa catgtgaacg tcctactgac ccgcacggag 3300
gaccgcatcg tgtggaaaac actagccggc gacccatgga taaaaacact gactgccaag 3360
taccctggga atttcactgc cacgatagag gagtggcaag cagagcatga tgccatcatg 3420
aggcacatct tggagagacc ggaccctacc gacgtcttcc agaataaggc aaacgtgtgt 3480
tgggccaagg ctttagtgcc ggtgctgaag accgctggca tagacatgac cactgaacaa 3540
tggaacactg tggattattt tgaaacggac aaagctcact cagcagagat agtattgaac 3600
caactatgcg tgaggttctt tggactcgat ctggactccg gtctattttc tgcacccact 3660
gttccgttat ccattaggaa taatcactgg gataactccc cgtcgcctaa catgtacggg 3720
ctgaataaag aagtggtccg tcagctctct cgcaggtacc cacaactgcc tcgggcagtt 3780
gccactggaa gagtctatga catgaacact ggtacactgc gcaattatga tccgcgcata 3840
aacctagtac ctgtaaacag aagactgcct catgctttag tcctccacca taatgaacac 3900
ccacagagtg acttttcttc attcgtcagc aaattgaagg gcagaactgt cctggtggtc 3960
ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt tgtcagaccg gcctgaggct 4020
accttcagag ctcggctgga tttaggcatc ccaggtgatg tgcccaaata tgacataata 4080
tttgttaatg tgaggacccc atataaatac catcactatc agcagtgtga agaccatgcc 4140
attaagctta gcatgttgac caagaaagct tgtctgcatc tgaatcccgg cggaacctgt 4200
gtcagcatag gttatggtta cgctgacagg gccagcgaaa gcatcattgg tgctatagcg 4260
cggcagttca agttttcccg ggtatgcaaa ccgaaatcct cacttgaaga gacggaagtt 4320
ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc acaatcctta caagctttca 4380
tcaaccttga ccaacattta tacaggttcc agactccacg aagccggatg tgcaccctca 4440
tatcatgtgg tgcgagggga tattgccacg gccaccgaag gagtgattat aaatgctgct 4500
aacagcaaag gacaacctgg cggaggggtg tgcggagcgc tgtataagaa attcccggaa 4560
agcttcgatt tacagccgat cgaagtagga aaagcgcgac tggtcaaagg tgcagctaaa 4620
catatcattc atgccgtagg accaaacttc aacaaagttt cggaggttga aggtgacaaa 4680
cagttggcag aggcttatga gtccatcgct aagattgtca acgataacaa ttacaagtca 4740
gtagcgattc cactgttgtc caccggcatc ttttccggga acaaagatcg actaacccaa 4800
tcattgaacc atttgctgac agctttagac accactgatg cagatgtagc catatactgc 4860
agggacaaga aatgggaaat gactctcaag gaagcagtgg ctaggagaga agcagtggag 4920
gagatatgca tatccgacga ctcttcagtg acagaacctg atgcagagct ggtgagggtg 4980
catccgaaga gttctttggc tggaaggaag ggctacagca caagcgatgg caaaactttc 5040
tcatatttgg aagggaccaa gtttcaccag gcggccaagg atatagcaga aattaatgcc 5100
atgtggcccg ttgcaacgga ggccaatgag caggtatgca tgtatatcct cggagaaagc 5160
atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg aagcctccac accacctagc 5220
acgctgcctt gcttgtgcat ccatgccatg actccagaaa gagtacagcg cctaaaagcc 5280
tcacgtccag aacaaattac tgtgtgctca tcctttccat tgccgaagta tagaatcact 5340
ggtgtgcaga agatccaatg ctcccagcct atattgttct caccgaaagt gcctgcgtat 5400
attcatccaa ggaagtatct cgtggaaaca ccaccggtag acgagactcc ggagccatcg 5460
gcagagaacc aatccacaga ggggacacct gaacaaccac cacttataac cgaggatgag 5520
accaggacta gaacgcctga gccgatcatc atcgaagagg aagaagagga tagcataagt 5580
ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg aggcagacat tcacgggccg 5640
ccctctgtat ctagctcatc ctggtccatt cctcatgcat ccgactttga tgtggacagt 5700
ttatccatac ttgacaccct ggagggagct agcgtgacca gcggggcaac gtcagccgag 5760
actaactctt acttcgcaaa gagtatggag tttctggcgc gaccggtgcc tgcgcctcga 5820
acagtattca ggaaccctcc acatcccgct ccgcgcacaa gaacaccgtc acttgcaccc 5880
agcagggcct gctcgagaac cagcctagtt tccaccccgc caggcgtgaa tagggtgatc 5940
actagagagg agctcgaggc gcttaccccg tcacgcactc ctagcaggtc ggtctcgaga 6000
accagcctgg tctccaaccc gccaggcgta aatagggtga ttacaagaga ggagtttgag 6060
gcgttcgtag cacaacaaca atgacggttt gatgcgggtg catacatctt ttcctccgac 6120
accggtcaag ggcatttaca acaaaaatca gtaaggcaaa cggtgctatc cgaagtggtg 6180
ttggagagga ccgaattgga gatttcgtat gccccgcgcc tcgaccaaga aaaagaagaa 6240
ttactacgca agaaattaca gttaaatccc acacctgcta acagaagcag ataccagtcc 6300
aggaaggtgg agaacatgaa agccataaca gctagacgta ttctgcaagg cctagggcat 6360
tatttgaagg cagaaggaaa agtggagtgc taccgaaccc tgcatcctgt tcctttgtat 6420
tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg cagtggaagc ctgtaacgcc 6480
atgttgaaag agaactttcc gactgtggct tcttactgta ttattccaga gtacgatgcc 6540
tatttggaca tggttgacgg agcttcatgc tgcttagaca ctgccagttt ttgccctgca 6600
aagctgcgca gctttccaaa gaaacactcc tatttggaac ccacaatacg atcggcagtg 6660
ccttcagcga tccagaacac gctccagaac gtcctggcag ctgccacaaa aagaaattgc 6720
aatgtcacgc aaatgagaga attgcccgta ttggattcgg cggcctttaa tgtggaatgc 6780
ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt ttaaagaaaa ccccatcagg 6840
cttactgaag aaaacgtggt aaattacatt accaaattaa aaggaccaaa agctgctgct 6900
ctttttgcga agacacataa tttgaatatg ttgcaggaca taccaatgga caggtttgta 6960
atggacttaa agagagacgt gaaagtgact ccaggaacaa aacatactga agaacggccc 7020
aaggtacagg tgatccaggc tgccgatccg ctagcaacag cgtatctgtg cggaatccac 7080
cgagagctgg ttaggagatt aaatgcggtc ctgcttccga acattcatac actgtttgat 7140
atgtcggctg aagactttga cgctattata gccgagcact tccagcctgg ggattgtgtt 7200
ctggaaactg acatcgcgtc gtttgataaa agtgaggacg acgccatggc tctgaccgcg 7260
ttaatgattc tggaagactt aggtgtggac gcagagctgt tgacgctgat tgaggcggct 7320
ttcggcgaaa tttcatcaat acatttgccc actaaaacta aatttaaatt cggagccatg 7380
atgaaatctg gaatgttcct cacactgttt gtgaacacag tcattaacat tgtaatcgca 7440
agcagagtgt tgagagaacg gctaaccgga tcaccatgtg cagcattcat tggagatgac 7500
aatatcgtga aaggagtcaa atcggacaaa ttaatggcag acaggtgcgc cacctggttg 7560
aatatggaag tcaagattat agatgctgtg gtgggcgaga aagcgcctta tttctgtgga 7620
gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc gtgtggcaga ccccctaaaa 7680
aggctgttta agcttggcaa acctctggca gcagacgatg aacatgatga tgacaggaga 7740
agggcattgc atgaagagtc aacacgctgg aaccgagtgg gtattctttc agagctgtgc 7800
aaggcagtag aatcaaggta tgaaaccgta ggaacttcca tcatagttat ggccatgact 7860
actctagcta gcagtgttaa atcattcagc tacctgagag gggcccctat aactctctac 7920
ggctaacctg aatggactac gacatagtct agtccgccaa gatatcatgg ctcgacctct 7980
gtgtaccctg ctactcctga tggctaccct ggctggagct ctggccagca tgcccctgtc 8040
ttaccagcac tttagaaagc ttctgctgct ggacgatgaa gccgggcctc tggaggaaga 8100
gctgccaagg ctggcagacg aggggctgaa ccggagagtg gccgaagatc tgaatctggg 8160
aaacctgaac gtgagcatcc cttggactca taaagtcggc aacttcaccg ggctgtacag 8220
ctccacagtg cctgtcttca atccagagtg gcagacacca tcctttccca acattcacct 8280
gcaggaggac atcattaata gatgcgaaca gttcgtggga cctctgacag tcaacgaaaa 8340
gaggcgcctg aaactgatca tgcctgccag gttttaccca aatgtgacta agtatctgcc 8400
actggataag ggcatcaagc cttactatcc agagcacctg gtgaaccatt acttccagac 8460
tagacactat ctgcataccc tgtggaaggc cggaatcctg tacaaacgag aaactacccg 8520
gagtgcttca ttttgtggct ccccatattc ttgggaacag gagctgcagc atggcaggct 8580
ggtgttccag accagcaaac gccacgggga tgagtccttt tgcagccagt ctagtggcat 8640
cctgagcaga tcccccgtgg ggccttgtat tcagtctcag ctgcggaaga gtagactggg 8700
actgcagcca cagcagggac acctggcacg acggcagcag ggaaggtctg gcagtatccg 8760
ggctagagtg catcccacaa ctagaaggac cttcggcgtc gagccatcag gaagcggcca 8820
catcgacaac agcgcatcaa gctcctctag ttgcctgcat cagtcagccg tgagaaaggc 8880
cgcttacagc cacctgtcca catctaaaag gcactcaagc tccgggcatg ctgtggagct 8940
gcacaacatc cctccaaatt ctgcacgcag tcagtcagaa ggacccgtgt tcagctgctg 9000
gtggctgcag tttcggaact caaagccttg cagcgactat tgtctgagcc atattgtgaa 9060
tctgctggag gattggggcc cttgtaccga gcacggggaa caccatatca ggattccacg 9120
aacaccagca cgagtgactg gaggggtgtt cctggtggac aagaaccccc acaatactac 9180
cgagagccgg ctggtggtcg atttcagtca gttttcaaga ggcaacacaa gggtgtcatg 9240
gcccaaattc gccgtcccta atctgcagag tctgactaac ctgctgtcta gtaatctgag 9300
ctggctgtcc ctggacgtgt ccgcagcctt ttaccacctg cctctgcatc cagctgcaat 9360
gccccatctg ctggtggggt caagcggact gagtcgctac gtcgcccgac tgtcctctaa 9420
ctcacgcatc attaatcacc agcatggcac catgcagaac ctgcacgata gctgttcccg 9480
gaatctgtac gtgtctctgc tgctgctgta taagacattc ggcagaaaac tgcacctgta 9540
cagccatcct atcattctgg ggtttaggaa gatcccaatg ggagtgggac tgagcccctt 9600
cctgctggca cagtttacct ccgccatttg ctctgtggtc cgccgagcct tcccacactg 9660
tctggctttt tcctatatga acaatgtggt cctgggcgcc aaatccgtgc agcatctgga 9720
gtctctgttc acagctgtca ctaactttct gctgagcctg gggatccacc tgaacccaaa 9780
taagactaaa cgctgggggt acagcctgaa tttcatggga tatgtgattg gatcctgggg 9840
gaccctgcca caggagcaca tcgtgcagaa gatcaaggaa tgctttcgga agctgcccgt 9900
caacagacct atcgactgga aagtgtgcca gcggattgtc ggactgctgg gcttcgccgc 9960
tccctttacc cagtgcgggt acccagcact gatgcccctg tatgcctgta tccagtctaa 10020
gcaggctttc acctttagtc ctacatacaa ggcattcctg tgcaaacagt acctgaacct 10080
gtatccagtg gcaaggcagc gacctggact gtgccaggtc tttgcaaatg ccactcctac 10140
cggctggggg ctggctatcg gacatcagcg aatgcggggc acattcgtgg cccccctgcc 10200
tattcacact gctcagctgc tggcagcctg ctttgctaga tctaggagtg gagcaaagct 10260
gatcggcacc gacaatagtg tggtcctgtc aagaaaatac acatccttcc catggctgct 10320
gggatgtgct gcaaactgga ttctgagggg caccagcttc gtgtacgtcc cctcagccct 10380
gaatcctgct gacgatccat cccgcgggcg actgggactg taccgacctc tgctgagact 10440
gcccttcagg cctacaactg gccggacatc tctgtatgcc gattcaccaa gcgtgccctc 10500
acacctgcct gacagagtcc actttgcttc acccctgcac gtcgcttggc ggcctccagg 10560
aagcggagct actaacttca gcctgctgaa gcaggctgga gacgtggagg agaaccctgg 10620
acctatggct cgacctctgt gtaccctgct actcctgatg gctaccctgg ctggagctct 10680
ggccagcgac atcgaccctt acaaggagtt cggcgccagc gtggaactgc tgtcttttct 10740
gcccagtgat ttctttcctt ccattcgaga cctgctggat accgcctctg ctctgtatcg 10800
ggaagccctg gagagcccag aacactgctc cccacaccat accgctctgc gacaggcaat 10860
cctgtgctgg ggggagctga tgaacctggc cacatgggtg ggatcgaatc tggaggaccc 10920
cgcttcacgg gaactggtgg tcagctacgt gaacgtcaat atgggcctga aaatccgcca 10980
gctgctgtgg ttccatatta gctgcctgac ttttggacga gagaccgtgc tggaatacct 11040
ggtgtccttc ggcgtctgga ttcgcactcc ccctgcttat cgaccaccca acgcaccaat 11100
tctgtccacc ctgcccgaga ccacagtggt ccgtcgccgt taattaaaac agctgtgggt 11160
tgttcccacc cacagggccc actgggcgct agcactctga ttttacgaaa tccttgtgcg 11220
cctgttttat atcccttccc taattcgaaa cgtagaagca atgcgcacca ctgatcaata 11280
gtaggcgtaa cgcgccagtt acgtcatgat caagcatatc tgttcccccg gactgagtat 11340
caatagactg cttacgcggt tgaaggagaa aacgttcgtt atccggctaa ctacttcgag 11400
aagcccagta acaccatgga agctgcaggg tgtttcgctc agcacttccc ccgtgtagat 11460
caggtcgatg agccactgca atccccacag gtgactgtgg cagtggctgc gttggcggcc 11520
tgcctatggg gagacccata ggacgctcta atgtggacat ggtgcgaaga gcctattgag 11580
ctagttagta gtcctccggc ccctgaatgc ggctaatcct aactgcggag cacatgcctt 11640
caacccagag ggtagtgtgt cgtaacgggc aactctgcag cggaaccgac tactttgggt 11700
gtccgtgttt cttttttatt cttatattgg ctgcttatgg tgacaattac agaattgtta 11760
ccatatagct attggattgg ccatccggtg tgtaatagag ctgttatata cctatttgtt 11820
ggctttgtac cactaacttt aaaatctata actaccctca actttatatt aaccctcaat 11880
acagttgacc atgcagtgga actcaactac tttccatcag acccttcagg accctagagt 11940
gcgcgggctg tactttcctg ctgggggaag cagtagcggg accgttaatc cagtacctac 12000
gaccgcctct cccatatctt ctatctttag taggactggt gaccctgctc ccaacatgga 12060
gaatatcacc tccgggtttc tgggcccact cctggtcctt caggccggat tcttcctgct 12120
gactcgaatc ctcaccatac cccagagcct ggacagctgg tggacaagcc tgaattttct 12180
gggaggaact cctgtatgcc tgggacaaaa ttcacagtcc cctacaagta accattcacc 12240
gacaagttgt cctcccatct gtcccggata caggtggatg tgcctgcgaa ggttcatcat 12300
cttcctcttc atcctcttgc tttgccttat tttcctcctg gttcttctgg actatcaggg 12360
catgctgcct gtgtgcccac tgataccagg atctagtact accagcacag gcccgtgtaa 12420
gacctgtaca attccagcac aagggactag tatgttcccc tcctgctgtt gtactaagcc 12480
aagcgacggt aattgcacgt gtatcccaat cccgtcctcc tgggcgtttg ccaagtacct 12540
ctgggaatgg gcctcagtca gattttcatg gcttagtctt ttggtgccgt tcgtgcagtg 12600
gtttgtggga ctctctccga ctgtgtggct cagcgtgatc tggatgatgt ggtactgggg 12660
cccttccctt tacaacatac tgtctccatt ccttcccctg ctgccaatct tcttttgcct 12720
gtgggtctat attgggtccg gagcgactaa cttttccctg ctgaaacaag cgggtgacgt 12780
cgaagagaat ccgggaccta tggctaggcc cctgtgtaca cttttgctcc tgatggccac 12840
cctcgctgga gctctggcaa gcggtggatg gagctcaaag ccgcggaaag ggatgggtac 12900
taacctgtcc gtaccaaatc ccctgggatt ttttccagac caccaactcg atcctgcttt 12960
tggcgcaaat tccaacaatc ccgactggga ctttaaccct aacaaggacc actggcctga 13020
tgccaacaag gtgggggcag gagcctttgg tcccggcttc accccacccc atggaggtct 13080
tttgggatgg tcaccacagg cccagggcat cctgaccact gtccctgctg ctccaccgcc 13140
agcttctact aatcgacaga gcgggaggca gccgaccccc ctgagtcccc ccctgcggga 13200
tacccaccct caggcataag gcgcgccgtt taaacggccg gccttaatta agtaacgata 13260
cagcagcaat tggcaagctg cttacataga actcgcggcg attggcatgc cgctttaaaa 13320
tttttatttt atttttcttt tcttttccga atcggatttt gtttttaata tttcaaaaaa 13380
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaa 13414
<210> 73
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> T7 promoter
<400> 73
taatacgact cactatag 18
<210> 74
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> YXDD motif
<220>
<221> misc_feature
<222> (2)..(2)
<223> Xaa can be any naturally occurring amino acid
<400> 74
Tyr Xaa Asp Asp
1
<210> 75
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> DEDD motif
<400> 75
Asp Glu Asp Asp
1
<210> 76
<211> 32
<212> PRT
<213> Artificial Sequence
<220>
<223> Core antigen C terminal deletion
<400> 76
Arg Gly Arg Ser Pro Arg Arg Arg Thr Pro Ser Pro Arg Arg Arg Arg
1 5 10 15
Ser Gln Ser Pro Arg Arg Arg Arg Ser Gln Ser Arg Glu Ser Gln Cys
20 25 30
<210> 77
<211> 21
<212> PRT
<213> Artificial Sequence
<220>
<223> Cystatin S signal peptide
<400> 77
Met Ala Arg Pro Leu Cys Thr Leu Leu Leu Leu Met Ala Thr Leu Ala
1 5 10 15
Gly Ala Leu Ala Ser
20
<210> 78
<211> 681
<212> DNA
<213> Artificial Sequence
<220>
<223> S-surface antigen coding sequence
<400> 78
atggagaata tcacctccgg gtttctgggc ccactcctgg tccttcaggc cggattcttc 60
ctgctgactc gaatcctcac cataccccag agcctggaca gctggtggac aagcctgaat 120
tttctgggag gaactcctgt atgcctggga caaaattcac agtcccctac aagtaaccat 180
tcaccgacaa gttgtcctcc catctgtccc ggatacaggt ggatgtgcct gcgaaggttc 240
atcatcttcc tcttcatcct cttgctttgc cttattttcc tcctggttct tctggactat 300
cagggcatgc tgcctgtgtg cccactgata ccaggatcta gtactaccag cacaggcccg 360
tgtaagacct gtacaactcc agcacaaggg actagtatgt tcccctcctg ctgttgtact 420
aagccatcag acggtaattg cacgtgtatc ccaatcccgt cctcctgggc gtttgccaag 480
tttctctggg aatgggcctc agtcagattt tcatggctta gtcttttggt gccgttcgtg 540
cagtggtttg tgggactctc tccgactgtg tggctcagcg tgatctggat gatgtggtac 600
tggggccctt ccctttacaa catactgtct ccattccttc ccctgctgcc aatcttcttt 660
tgcctgtggg tctatattta a 681
<210> 79
<211> 226
<212> PRT
<213> Artificial Sequence
<220>
<223> S-surface antigen
<400> 79
Met Glu Asn Ile Thr Ser Gly Phe Leu Gly Pro Leu Leu Val Leu Gln
1 5 10 15
Ala Gly Phe Phe Leu Leu Thr Arg Ile Leu Thr Ile Pro Gln Ser Leu
20 25 30
Asp Ser Trp Trp Thr Ser Leu Asn Phe Leu Gly Gly Thr Pro Val Cys
35 40 45
Leu Gly Gln Asn Ser Gln Ser Pro Thr Ser Asn His Ser Pro Thr Ser
50 55 60
Cys Pro Pro Ile Cys Pro Gly Tyr Arg Trp Met Cys Leu Arg Arg Phe
65 70 75 80
Ile Ile Phe Leu Phe Ile Leu Leu Leu Cys Leu Ile Phe Leu Leu Val
85 90 95
Leu Leu Asp Tyr Gln Gly Met Leu Pro Val Cys Pro Leu Ile Pro Gly
100 105 110
Ser Ser Thr Thr Ser Thr Gly Pro Cys Lys Thr Cys Thr Thr Pro Ala
115 120 125
Gln Gly Thr Ser Met Phe Pro Ser Cys Cys Cys Thr Lys Pro Ser Asp
130 135 140
Gly Asn Cys Thr Cys Ile Pro Ile Pro Ser Ser Trp Ala Phe Ala Lys
145 150 155 160
Phe Leu Trp Glu Trp Ala Ser Val Arg Phe Ser Trp Leu Ser Leu Leu
165 170 175
Val Pro Phe Val Gln Trp Phe Val Gly Leu Ser Pro Thr Val Trp Leu
180 185 190
Ser Val Ile Trp Met Met Trp Tyr Trp Gly Pro Ser Leu Tyr Asn Ile
195 200 205
Leu Ser Pro Phe Leu Pro Leu Leu Pro Ile Phe Phe Cys Leu Trp Val
210 215 220
Tyr Ile
225
<210> 80
<211> 567
<212> DNA
<213> Artificial Sequence
<220>
<223> LM surface antigen coding sequence
<400> 80
ggtggatgga gctcaaagcc gcggaaaggg atgggtacta acctgtccgt accaaatccc 60
ctgggatttt ttccagacca ccaactcgat cctgcttttg gcgcaaattc caacaatccc 120
gactgggact ttaaccctaa caaggacacc tggcctgatg ccaacaaggt gggggcagga 180
gcctttggtc ccggcttcac cccaccccat ggaggtcttt tgggatggtc accacaggcc 240
cagggcatcc tgaccactgt ccctgctgct ccaccgccag cttctactaa tcgacagagc 300
gggaggcagc cgacccccct gagtcccccc ctgcgggata cccaccctca ggcaatgcag 360
tggaactcaa ctactttcca tcagaccctt caggacccta gagtgcgcgg gctgtacttt 420
cctgctgggg gaagcagtag cgggaccgtt aatccagtac ctacgaccgc ctctcccata 480
tcttctatct ttagtaggac tggtgaccct gctcccaaca tggaaaatat aactagcggc 540
ttcctgggcc cccttctcgt cctgtaa 567
<210> 81
<211> 188
<212> PRT
<213> Artificial Sequence
<220>
<223> LM surface antigen
<400> 81
Gly Gly Trp Ser Ser Lys Pro Arg Lys Gly Met Gly Thr Asn Leu Ser
1 5 10 15
Val Pro Asn Pro Leu Gly Phe Phe Pro Asp His Gln Leu Asp Pro Ala
20 25 30
Phe Gly Ala Asn Ser Asn Asn Pro Asp Trp Asp Phe Asn Pro Asn Lys
35 40 45
Asp Thr Trp Pro Asp Ala Asn Lys Val Gly Ala Gly Ala Phe Gly Pro
50 55 60
Gly Phe Thr Pro Pro His Gly Gly Leu Leu Gly Trp Ser Pro Gln Ala
65 70 75 80
Gln Gly Ile Leu Thr Thr Val Pro Ala Ala Pro Pro Pro Ala Ser Thr
85 90 95
Asn Arg Gln Ser Gly Arg Gln Pro Thr Pro Leu Ser Pro Pro Leu Arg
100 105 110
Asp Thr His Pro Gln Ala Met Gln Trp Asn Ser Thr Thr Phe His Gln
115 120 125
Thr Leu Gln Asp Pro Arg Val Arg Gly Leu Tyr Phe Pro Ala Gly Gly
130 135 140
Ser Ser Ser Gly Thr Val Asn Pro Val Pro Thr Thr Ala Ser Pro Ile
145 150 155 160
Ser Ser Ile Phe Ser Arg Thr Gly Asp Pro Ala Pro Asn Met Glu Asn
165 170 175
Ile Thr Ser Gly Phe Leu Gly Pro Leu Leu Val Leu
180 185
<210> 82
<211> 280
<212> PRT
<213> Artificial Sequence
<220>
<223> M surface antigen
<400> 82
Gln Trp Asn Ser Thr Thr Phe His Gln Thr Leu Gln Asp Pro Arg Val
1 5 10 15
Arg Gly Leu Tyr Phe Pro Ala Gly Gly Ser Ser Ser Gly Thr Val Asn
20 25 30
Pro Val Pro Thr Thr Ala Ser Pro Ile Ser Ser Ile Phe Ser Arg Thr
35 40 45
Gly Asp Pro Ala Pro Asn Met Glu Asn Ile Thr Ser Gly Phe Leu Gly
50 55 60
Pro Leu Leu Val Leu Gln Ala Gly Phe Phe Leu Leu Thr Arg Ile Leu
65 70 75 80
Thr Ile Pro Gln Ser Leu Asp Ser Trp Trp Thr Ser Leu Asn Phe Leu
85 90 95
Gly Gly Thr Pro Val Cys Leu Gly Gln Asn Ser Gln Ser Pro Thr Ser
100 105 110
Asn His Ser Pro Thr Ser Cys Pro Pro Ile Cys Pro Gly Tyr Arg Trp
115 120 125
Met Cys Leu Arg Arg Phe Ile Ile Phe Leu Phe Ile Leu Leu Leu Cys
130 135 140
Leu Ile Phe Leu Leu Val Leu Leu Asp Tyr Gln Gly Met Leu Pro Val
145 150 155 160
Cys Pro Leu Ile Pro Gly Ser Ser Thr Thr Ser Thr Gly Pro Cys Lys
165 170 175
Thr Cys Thr Thr Pro Ala Gln Gly Thr Ser Met Phe Pro Ser Cys Cys
180 185 190
Cys Thr Lys Pro Ser Asp Gly Asn Cys Thr Cys Ile Pro Ile Pro Ser
195 200 205
Ser Trp Ala Phe Ala Lys Phe Leu Trp Glu Trp Ala Ser Val Arg Phe
210 215 220
Ser Trp Leu Ser Leu Leu Val Pro Phe Val Gln Trp Phe Val Gly Leu
225 230 235 240
Ser Pro Thr Val Trp Leu Ser Val Ile Trp Met Met Trp Tyr Trp Gly
245 250 255
Pro Ser Leu Tyr Asn Ile Leu Ser Pro Phe Leu Pro Leu Leu Pro Ile
260 265 270
Phe Phe Cys Leu Trp Val Tyr Ile
275 280
<210> 83
<211> 399
<212> PRT
<213> Artificial Sequence
<220>
<223> L surface antigen
<400> 83
Gly Gly Trp Ser Ser Lys Pro Arg Lys Gly Met Gly Thr Asn Leu Ser
1 5 10 15
Val Pro Asn Pro Leu Gly Phe Phe Pro Asp His Gln Leu Asp Pro Ala
20 25 30
Phe Gly Ala Asn Ser Asn Asn Pro Asp Trp Asp Phe Asn Pro Asn Lys
35 40 45
Asp Thr Trp Pro Asp Ala Asn Lys Val Gly Ala Gly Ala Phe Gly Pro
50 55 60
Gly Phe Thr Pro Pro His Gly Gly Leu Leu Gly Trp Ser Pro Gln Ala
65 70 75 80
Gln Gly Ile Leu Thr Thr Val Pro Ala Ala Pro Pro Pro Ala Ser Thr
85 90 95
Asn Arg Gln Ser Gly Arg Gln Pro Thr Pro Leu Ser Pro Pro Leu Arg
100 105 110
Asp Thr His Pro Gln Ala Met Gln Trp Asn Ser Thr Thr Phe His Gln
115 120 125
Thr Leu Gln Asp Pro Arg Val Arg Gly Leu Tyr Phe Pro Ala Gly Gly
130 135 140
Ser Ser Ser Gly Thr Val Asn Pro Val Pro Thr Thr Ala Ser Pro Ile
145 150 155 160
Ser Ser Ile Phe Ser Arg Thr Gly Asp Pro Ala Pro Asn Met Glu Asn
165 170 175
Ile Thr Ser Gly Phe Leu Gly Pro Leu Leu Val Leu Gln Ala Gly Phe
180 185 190
Phe Leu Leu Thr Arg Ile Leu Thr Ile Pro Gln Ser Leu Asp Ser Trp
195 200 205
Trp Thr Ser Leu Asn Phe Leu Gly Gly Thr Pro Val Cys Leu Gly Gln
210 215 220
Asn Ser Gln Ser Pro Thr Ser Asn His Ser Pro Thr Ser Cys Pro Pro
225 230 235 240
Ile Cys Pro Gly Tyr Arg Trp Met Cys Leu Arg Arg Phe Ile Ile Phe
245 250 255
Leu Phe Ile Leu Leu Leu Cys Leu Ile Phe Leu Leu Val Leu Leu Asp
260 265 270
Tyr Gln Gly Met Leu Pro Val Cys Pro Leu Ile Pro Gly Ser Ser Thr
275 280 285
Thr Ser Thr Gly Pro Cys Lys Thr Cys Thr Thr Pro Ala Gln Gly Thr
290 295 300
Ser Met Phe Pro Ser Cys Cys Cys Thr Lys Pro Ser Asp Gly Asn Cys
305 310 315 320
Thr Cys Ile Pro Ile Pro Ser Ser Trp Ala Phe Ala Lys Phe Leu Trp
325 330 335
Glu Trp Ala Ser Val Arg Phe Ser Trp Leu Ser Leu Leu Val Pro Phe
340 345 350
Val Gln Trp Phe Val Gly Leu Ser Pro Thr Val Trp Leu Ser Val Ile
355 360 365
Trp Met Met Trp Tyr Trp Gly Pro Ser Leu Tyr Asn Ile Leu Ser Pro
370 375 380
Phe Leu Pro Leu Leu Pro Ile Phe Phe Cys Leu Trp Val Tyr Ile
385 390 395
<210> 84
<211> 149
<212> PRT
<213> Artificial Sequence
<220>
<223> Core antigen
<400> 84
Asp Ile Asp Pro Tyr Lys Glu Phe Gly Ala Ser Val Glu Leu Leu Ser
1 5 10 15
Phe Leu Pro Ser Asp Phe Phe Pro Ser Ile Arg Asp Leu Leu Asp Thr
20 25 30
Ala Ser Ala Leu Tyr Arg Glu Ala Leu Glu Ser Pro Glu His Cys Ser
35 40 45
Pro His His Thr Ala Leu Arg Gln Ala Ile Leu Cys Trp Gly Glu Leu
50 55 60
Met Asn Leu Ala Thr Trp Val Gly Ser Asn Leu Glu Asp Pro Ala Ser
65 70 75 80
Arg Glu Leu Val Val Ser Tyr Val Asn Val Asn Met Gly Leu Lys Ile
85 90 95
Arg Gln Leu Leu Trp Phe His Ile Ser Cys Leu Thr Phe Gly Arg Glu
100 105 110
Thr Val Leu Glu Tyr Leu Val Ser Phe Gly Val Trp Ile Arg Thr Pro
115 120 125
Pro Ala Tyr Arg Pro Pro Asn Ala Pro Ile Leu Ser Thr Leu Pro Glu
130 135 140
Thr Thr Val Val Arg
145
<210> 85
<211> 150
<212> PRT
<213> Artificial Sequence
<220>
<223> Core antigen
<400> 85
Asp Ile Asp Pro Tyr Lys Glu Phe Gly Ala Ser Val Glu Leu Leu Ser
1 5 10 15
Phe Leu Pro Ser Asp Phe Phe Pro Ser Ile Arg Asp Leu Leu Asp Thr
20 25 30
Ala Ser Ala Leu Tyr Arg Glu Ala Leu Glu Ser Pro Glu His Cys Ser
35 40 45
Pro His His Thr Ala Leu Arg Gln Ala Ile Leu Cys Trp Gly Glu Leu
50 55 60
Met Asn Leu Ala Thr Trp Val Gly Ser Asn Leu Glu Asp Pro Ala Ser
65 70 75 80
Arg Glu Leu Val Val Ser Tyr Val Asn Val Asn Met Gly Leu Lys Ile
85 90 95
Arg Gln Leu Leu Trp Phe His Ile Ser Cys Leu Thr Phe Gly Arg Glu
100 105 110
Thr Val Leu Glu Tyr Leu Val Ser Phe Gly Val Trp Ile Arg Thr Pro
115 120 125
Pro Ala Tyr Arg Pro Pro Asn Ala Pro Ile Leu Ser Thr Leu Pro Glu
130 135 140
Thr Thr Val Val Arg Arg
145 150
<210> 86
<211> 151
<212> PRT
<213> Artificial Sequence
<220>
<223> Core antigen
<400> 86
Asp Ile Asp Pro Tyr Lys Glu Phe Gly Ala Ser Val Glu Leu Leu Ser
1 5 10 15
Phe Leu Pro Ser Asp Phe Phe Pro Ser Ile Arg Asp Leu Leu Asp Thr
20 25 30
Ala Ser Ala Leu Tyr Arg Glu Ala Leu Glu Ser Pro Glu His Cys Ser
35 40 45
Pro His His Thr Ala Leu Arg Gln Ala Ile Leu Cys Trp Gly Glu Leu
50 55 60
Met Asn Leu Ala Thr Trp Val Gly Ser Asn Leu Glu Asp Pro Ala Ser
65 70 75 80
Arg Glu Leu Val Val Ser Tyr Val Asn Val Asn Met Gly Leu Lys Ile
85 90 95
Arg Gln Leu Leu Trp Phe His Ile Ser Cys Leu Thr Phe Gly Arg Glu
100 105 110
Thr Val Leu Glu Tyr Leu Val Ser Phe Gly Val Trp Ile Arg Thr Pro
115 120 125
Pro Ala Tyr Arg Pro Pro Asn Ala Pro Ile Leu Ser Thr Leu Pro Glu
130 135 140
Thr Thr Val Val Arg Arg Arg
145 150
<210> 87
<211> 447
<212> DNA
<213> Artificial Sequence
<220>
<223> Core antigen coding sequence
<400> 87
gacatcgacc cttacaagga gttcggcgcc agcgtggaac tgctgtcttt tctgcccagt 60
gatttctttc cttccattcg agacctgctg gataccgcct ctgctctgta tcgggaagcc 120
ctggagagcc cagaacactg ctccccacac cataccgctc tgcgacaggc aatcctgtgc 180
tggggggagc tgatgaacct ggccacatgg gtgggatcga atctggagga ccccgcttca 240
cgggaactgg tggtcagcta cgtgaacgtc aatatgggcc tgaaaatccg ccagctgctg 300
tggttccata ttagctgcct gacttttgga cgagagaccg tgctggaata cctggtgtcc 360
ttcggcgtct ggattcgcac tccccctgct tatcgaccac ccaacgcacc aattctgtcc 420
accctgcccg agaccacagt ggtccgt 447
<210> 88
<211> 450
<212> DNA
<213> Artificial Sequence
<220>
<223> Core antigen coding sequence
<400> 88
gacatcgacc cttacaagga gttcggcgcc agcgtggaac tgctgtcttt tctgcccagt 60
gatttctttc cttccattcg agacctgctg gataccgcct ctgctctgta tcgggaagcc 120
ctggagagcc cagaacactg ctccccacac cataccgctc tgcgacaggc aatcctgtgc 180
tggggggagc tgatgaacct ggccacatgg gtgggatcga atctggagga ccccgcttca 240
cgggaactgg tggtcagcta cgtgaacgtc aatatgggcc tgaaaatccg ccagctgctg 300
tggttccata ttagctgcct gacttttgga cgagagaccg tgctggaata cctggtgtcc 360
ttcggcgtct ggattcgcac tccccctgct tatcgaccac ccaacgcacc aattctgtcc 420
accctgcccg agaccacagt ggtccgtcgc 450
<210> 89
<211> 456
<212> DNA
<213> Artificial Sequence
<220>
<223> Core antigen coding sequence
<400> 89
gacatcgacc cttacaagga gttcggcgcc agcgtggaac tgctgtcttt tctgcccagt 60
gatttctttc cttccattcg agacctgctg gataccgcct ctgctctgta tcgggaagcc 120
ctggagagcc cagaacactg ctccccacac cataccgctc tgcgacaggc aatcctgtgc 180
tggggggagc tgatgaacct ggccacatgg gtgggatcga atctggagga ccccgcttca 240
cgggaactgg tggtcagcta cgtgaacgtc aatatgggcc tgaaaatccg ccagctgctg 300
tggttccata ttagctgcct gacttttgga cgagagaccg tgctggaata cctggtgtcc 360
ttcggcgtct ggattcgcac tccccctgct tatcgaccac ccaacgcacc aattctgtcc 420
accctgcccg agaccacagt ggtccgtcgc cgttaa 456
<210> 90
<211> 63
<212> DNA
<213> Artificial Sequence
<220>
<223> Cystatin S signal peptide coding sequence
<400> 90
atggctcgac ctctgtgtac cctgctactc ctgatggcta ccctggctgg agctctggcc 60
agc 63
<210> 91
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> HBV Core antigen C-terminal
<400> 91
Val Val Arg Arg
1
<210> 92
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> HBV Core antigen C-terminal
<400> 92
Val Val Arg Arg Arg
1 5
Claims (42)
- 핵산 조합으로서, 5'-말단에서 3'-말단의 순서로 하기를 포함하는 제1 비-천연 발생 폴리뉴클레오티드 서열:
(1) 제1 B형 간염 바이러스(HBV: hepatitis B virus) 항원을 인코딩하는 폴리뉴클레오티드 서열,
(2) 제1 내부 리보솜 진입 서열(IRES: internal ribosome entry sequence) 요소 또는 제1 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열, 및
(3) 제2 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열, 및
5'-말단에서 3'-말단의 순서로 하기를 포함하는 제2 비-천연 발생 폴리뉴클레오티드 서열:
(1) 제3 B형 간염 바이러스(HBV) 항원을 인코딩하는 폴리뉴클레오티드 서열,
(2) 제2 내부 리보솜 진입 서열(IRES) 요소 또는 제2 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열, 및
(3) 제4 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열을 포함하고,
여기서 상기 제1 및 제2 비-천연 발생 폴리뉴클레오티드 서열은 제3 내부 리보솜 진입 서열(IRES) 요소 또는 제3 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열에 의해 연결되거나, 별도의 핵산 분자에 존재하고,
여기서 상기 제1, 제2, 제3 및 제4 HBV 항원은 HBV 코어 항원, HBV 폴리머라제(pol) 항원, 및 HBV 표면 항원으로 이루어진 군으로부터 각각 독립적으로 선택되고, 상기 제1, 제2, 제3 및 제4 HBV 항원 중 적어도 하나는 서열번호 1 또는 서열번호 3의 아미노산 서열과 적어도 98% 동일한 아미노산 서열을 갖는 HBV Pre-S1 항원 및 서열번호 5의 아미노산 서열과 적어도 98% 동일한 아미노산 서열을 갖는 HBV PreS2.S 항원으로부터 선택된 HBV 표면 항원이고, 바람직하게는 상기 제1, 제2, 제3 또는 제4 HBV 항원 중 하나는 HBV 코어 또는 HBV pol 항원인, 핵산 조합. - 제1항에 있어서, 상기 제1, 제2, 제3 또는 제4 HBV 항원 중 하나는 HBV 코어 항원이고, 하나는 HBV pol 항원인, 핵산 조합.
- 제1항 또는 제2항에 있어서, 상기 제1, 제2, 제3 및 제4 HBV 항원 각각은 서로 상이한 것인, 핵산 조합.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 제1, 제2, 제3 및 제4 HBV 항원 각각은 하기로 이루어진 군으로부터 독립적으로 선택되고:
(i) 서열번호 1의 아미노산 서열과 적어도 98% 동일한, 예컨대 서열번호 1의 아미노산 서열과 적어도 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하는, 바람직하게는 이로 이루어진 제1 HBV Pre-S1 항원;
(ii) 서열번호 3의 아미노산 서열과 적어도 98% 동일한, 예컨대 서열번호 3의 아미노산 서열과 적어도 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하는, 바람직하게는 이로 이루어진 제2 HBV Pre-S1 항원;
(iii) 서열번호 5의 아미노산 서열과 적어도 98% 동일한, 예컨대 서열번호 5의 아미노산 서열과 적어도 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하고, 바람직하게는 이로 이루어진 HBV PreS2.S 항원;
(iv) 서열번호 7과 적어도 90% 동일한, 예컨대 서열번호 7과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하고, 바람직하게는 이로 이루어진 HBV 코어 항원; 및
(v) 서열번호 9와 적어도 90% 동일한, 예컨대 서열번호 9와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열을 포함하고, 바람직하게는 이로 이루어진 HBV pol 항원,
바람직하게는, 상기 제1 및 제2 HBV Pre-S1 항원, 상기 HBV 코어 항원 및 상기 HBV pol 항원 각각은 독립적으로 신호 펩타이드에 작동적으로 연결되고, 상기 HBV PreS2.S 항원은 내부 신호 펩타이드를 포함하는, 핵산 조합. - 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 HBV 코어 항원은 서열번호 84, 85, 또는 86 중 적어도 하나와 적어도 98% 동일한, 예컨대 서열번호 84, 85, 또는 86과 적어도 98%, 적어도 99%, 또는 100% 동일한 아미노산 서열을 포함하고, 바람직하게는 이로 이루어진 것인, 핵산 조합.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 HBV 코어 항원의 마지막 5개의 C-말단 아미노산은 VVR 아미노산 서열, 보다 특히 VVRR(서열번호 91) 아미노산 서열, 보다 특히 VVRRR(서열번호 92) 아미노산 서열을 포함하는, 핵산 조합.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 HBV 표면 항원, 상기 HBV 코어 항원 및 상기 HBV pol 항원 각각은 하기를 포함하는, 핵산 조합:
(i) HBV 유전자형 A, B, C 및 D에 대한 컨센서스 서열; 및/또는
(ii) HLA-A*11:01, HLA-A*24:02, HLA-A*02:01, HLA-A*A2402, HLA-A*A0101, 또는 HLA-B*40:01에 대한 하나 이상의 에피토프. - 제7항에 있어서, 상기 HBV 표면 항원, 상기 HBV 코어 항원 및 상기 HBV pol 항원 각각은 HLA-A*11:01에 대한 하나 이상의 에피토프를 포함하는, 핵산 조합.
- 제4항에 있어서, 상기 제1, 제2, 제3 및 제4 HBV 항원 각각은 하기로 이루어진 군으로부터 독립적으로 선택되고:
(i) 서열번호 1의 아미노산 서열로 이루어진 제1 HBV Pre-S1 항원;
(ii) 서열번호 3의 아미노산 서열로 이루어진 제2 HBV Pre-S1 항원;
(iii) 서열번호 5의 아미노산 서열로 이루어진 HBV PreS2.S 항원;
(iv) 서열번호 84, 서열번호 85, 또는 서열번호 86의 아미노산 서열로 이루어진 HBV 코어 항원; 및
(v) 서열번호 9의 아미노산 서열로 이루어진 HBV pol 항원;
바람직하게는, 상기 제1 및 제2 HBV Pre-S1 항원, 상기 HBV 코어 항원 및 상기 HBV pol 항원 각각은 독립적으로 서열번호 77의 아미노산 서열을 포함하는 신호 펩타이드와 같은 신호 펩타이드에 작동적으로 연결된 것인, 핵산 조합. - 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 제1, 제2, 제3 및 제4 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열 각각은 하기로 이루어진 군으로부터 독립적으로 선택되고:
(i) 서열번호 2와 적어도 90% 동일한, 예컨대 서열번호 2와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 서열을 갖는 제1 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(ii) 서열번호 4와 적어도 90% 동일한, 예컨대 서열번호 4와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 서열을 갖는 제2 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(iii) 서열번호 6과 적어도 90% 동일한, 예컨대 서열번호 6과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
(iv) 서열번호 8과 적어도 90% 동일한, 예컨대 서열번호 8과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열; 및
(v) 서열번호 10과 적어도 90% 동일한, 예컨대 서열번호 10과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 서열을 갖는 HBV pol 항원을 인코딩하는 폴리뉴클레오티드 서열;
바람직하게는, 상기 제1 및 제2 HBV Pre-S1 항원, 상기 HBV 코어 항원 및 상기 HBV pol 항원 각각을 인코딩하는 폴리뉴클레오티드 서열은 독립적으로 신호 펩타이드를 인코딩하는 폴리뉴클레오티드 서열에 작동적으로 연결되고, 상기 HBV PreS2.S 항원은 내부 신호 펩타이드를 포함하는, 핵산 조합. - 제10항에 있어서, 상기 제1, 제2, 제3 및 제4 HBV 항원을 인코딩하는 폴리뉴클레오티드 서열 각각은 하기로 이루어진 군으로부터 독립적으로 선택되고:
(i) 서열번호 2의 서열로 이루어진 제1 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(ii) 서열번호 4의 서열로 이루어진 제2 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(iii) 서열번호 6의 서열로 이루어진 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
(iv) 서열번호 87, 서열번호 88 또는 서열번호 89 중 어느 하나의 서열로 이루어진 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열; 및
(v) 서열번호 10의 서열로 이루어진 HBV pol 항원을 인코딩하는 폴리뉴클레오티드 서열;
바람직하게는, 상기 제1 및 제2 HBV Pre-S1 항원, 상기 HBV 코어 항원 및 상기 HBV pol 항원 각각을 인코딩하는 폴리뉴클레오티드 서열은 독립적으로 서열번호 90의 서열을 포함하는 폴리뉴클레오티드와 같은 신호 펩타이드를 인코딩하는 폴리뉴클레오티드에 작동적으로 연결된 것인, 핵산 조합. - 제1항 내지 제11항 중 어느 한 항에 있어서, 상기 제1, 제2 및 제3 오토프로테아제 펩타이드 각각은 독립적으로 돼지 테스코바이러스-1 2A(P2A), 구제역 바이러스(FMDV) 2A(F2A), 말 비염 A 바이러스(ERAV) 2A(E2A), 테세아 아시그나 바이러스 2A(T2A), 세포질 다각체병 바이러스 2A(BmCPV2A), 무름병 바이러스 2 A(BmIFV2A), 및 이들의 조합으로 이루어진 군으로부터 선택된 펩타이드 서열을 포함하고, 바람직하게는, 상기 제1, 제2 및 제3 오토프로테아제 펩타이드 각각은 서열번호 11의 P2A 서열과 같은 P2A의 펩타이드 서열을 포함하는, 핵산 조합.
- 제1항 내지 제12항 중 어느 한 항에 있어서, 상기 제1, 제2 및 제3 IRES 각각은 뇌심근염 바이러스(EMCV) 또는 엔테로바이러스 71(EV71)로부터 유래되고, 바람직하게는 상기 제1, 제2 및 제3 IRES 각각은 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 포함하는, 핵산 조합.
- 제1항에 있어서, 5'-말단에서 3'-말단의 순서로 하기를 포함하고:
(1) 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
(2) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(3) 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(4) 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(5) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(6) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(7) 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열은 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(8) 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(9) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(10) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(11) 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(12) 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열;
(13) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(14) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 1 또는 3의 아미노산 서열을 갖는 HBV Pre-S1 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(15) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(16) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 14의 폴리뉴클레오티드 서열을 갖는 IRES, 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(17) 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
(18) 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열;
(19) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열;
(20) 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열;
(21) 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열; 또는
(22) 서열번호 84, 85, 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 9의 아미노산 서열을 갖는 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열, 및 서열번호 5의 아미노산 서열을 갖는 HBV PreS2.S 항원을 인코딩하는 폴리뉴클레오티드 서열,
바람직하게는, 상기 제1 및 제2 HBV Pre-S1 항원, 상기 HBV 코어 항원 및 상기 HBV pol 항원 각각을 인코딩하는 폴리뉴클레오티드 서열은 독립적으로 서열번호 77의 아미노산 서열을 포함하는 신호 펩타이드와 같은 신호 펩타이드를 인코딩하는 폴리뉴클레오티드 서열에 작동적으로 연결된 것인, 핵산 조합. - 제14항에 있어서, 서열번호 15 내지 54 중 어느 하나의 비-천연 발생 폴리뉴클레오티드 서열을 포함하는, 핵산 조합.
- 제1항 내지 제15항 중 어느 한 항의 핵산 조합을 포함하는 벡터.
- 제16항에 있어서, DNA 플라스미드인, 벡터.
- 제16항에 있어서, DNA 바이러스 벡터 또는 RNA 바이러스 벡터인, 벡터.
- 제18항에 있어서, 변형된 백시니아 앙카라(MVA) 벡터 또는 아데노바이러스 벡터인, 벡터.
- 제19항에 있어서, Ad26, Ad35, 또는 MVA-BN 벡터인, 벡터.
- 5'-말단에서 3'-말단의 순서로 하기를 포함하는 RNA 레플리콘:
(1) RNA 바이러스의 비구조 단백질-매개 증폭에 필요한 5' 비번역 영역(5'-UTR);
(2) RNA 바이러스의 비구조 단백질 중 적어도 하나, 바람직하게는 모두를 인코딩하는 폴리뉴클레오티드 서열;
(3) RNA 바이러스의 서브게놈 프로모터;
(4) 제1항 내지 제15항 중 어느 한 항의 핵산 조합; 및
(5) RNA 바이러스의 비구조 단백질-매개 증폭에 필요한 3' 비번역 영역(3'-UTR). - 제21항에 있어서, 5'-말단에서 3'-말단의 순서로 하기를 포함하는, RNA 레플리콘:
(1) 알파바이러스 5' 비번역 영역(5'-UTR);
(2) 알파바이러스 비구조 유전자 nsp1의 5' 복제 서열;
(3) 바이러스 종의 다운스트림 루프(DLP: downstream loop) 모티프;
(4) 제4 오토프로테아제 펩타이드를 인코딩하는 폴리뉴클레오티드 서열;
(5) 알파바이러스 비구조 단백질 nsp1, nsp2, nsp3 및 nsp4를 인코딩하는 폴리뉴클레오티드 서열;
(6) 알파바이러스 서브게놈 프로모터;
(7) 제1항 내지 제15항 중 어느 한 항의 핵산 조합;
(8) 알파바이러스 3' 비번역 영역(3' UTR); 및
(9) 선택적으로, 폴리 아데노신 서열. - 제22항에 있어서, 상기 DLP 모티프는 동부 말 뇌염 바이러스(EEEV: Eastern equine encephalitis virus), 베네수엘라 말 뇌염 바이러스(VEEV: Venezuelan equine encephalitis virus), 에버글레이즈 바이러스(EVEV: Everglades virus), 무캄보 바이러스(MUCV: Mucambo virus), 셈리키 포레스트 바이러스(SFV: Semliki forest virus), 픽수나 바이러스(PIXV: Pixuna virus), 미들버그 바이러스(MTDV: Middleburg virus), 치쿤구니야 바이러스(CHIKV: Chikungunya virus), 오니옹-니옹 바이러스(ONNV: O'Nyong-Nyong virus), 로스 리버 바이러스(RRV: Ross River virus), 바마 포레스트 바이러스(BF: Barmah Forest virus), 게타 바이러스(GET: Getah virus), 사기야마 바이러스(SAGV: Sagiyama virus), 베바루 바이러스(BEBV: Bebaru virus), 마야로 바이러스(MAYV: Mayaro virus), Una 바이러스(UAV: Una virus), 신드비스 바이러스(SINV: Sindbis virus), 아우라 바이러스(AURAV: Aura virus), 와타로아 바이러스(WHAV: Whataroa virus), 바반키 바이러스(BABV: Babanki virus), 키질라가크 바이러스(KYZV: Kyzylagach virus), 서부 말 뇌염 바이러스(WEEV: Western equine encephalitis virus), 하이랜드 J 바이러스(HJV: Highland J virus), 포트 모건 바이러스(FMV: Fort Morgan virus), Ndumu(NDUV), 및 버기 크릭 바이러스(Buggy Creek virus)로 이루어진 군으로부터 선택된 바이러스 종으로부터 유래된 것인, RNA 레플리콘.
- 제23항에 있어서, 상기 제4 오토프로테아제 펩타이드는 돼지 테세호바이러스-1 2A(P2A), 구제역 바이러스(FMDV) 2A(F2A), 말 비염 A 바이러스(ERAV) 2A(E2A), 테세아 아시그나 바이러스 2A(T2A), 세포질 다각체병 바이러스 2A(BmCPV2A), 무름병 바이러스 2 A(BmIFV2A), 및 이들의 조합으로 이루어진 군으로부터 선택되고, 바람직하게는, 상기 제4 오토프로테아제 펩타이드는 P2A의 펩타이드 서열을 포함하는, RNA 레플리콘.
- 제21항에 있어서, 5'-말단에서 3'-말단의 순서로 하기를 포함하는, RNA 레플리콘:
(1) 서열번호 55의 폴리뉴클레오티드 서열을 갖는 5'-UTR,
(2) 서열번호 56의 폴리뉴클레오티드 서열을 갖는 5' 복제 서열,
(3) 서열번호 57의 폴리뉴클레오티드 서열을 포함하는 DLP 모티프,
(4) 서열번호 11의 P2A 서열을 인코딩하는 폴리뉴클레오티드 서열,
(5) 각각 서열번호 58, 서열번호 59, 서열번호 60 및 서열번호 61의 핵산 서열을 갖는, 알파바이러스 비구조 단백질 nsp1, nsp2, nsp3 및 nsp4를 인코딩하는 폴리뉴클레오티드 서열,
(6) 서열번호 62의 폴리뉴클레오티드 서열을 갖는 서브게놈 프로모터,
(7) 제1항 내지 제15항 중 어느 한 항의 핵산 조합, 및
(8) 서열번호 63의 폴리뉴클레오티드 서열을 갖는 3' UTR. - 제25항에 있어서,
(i) 상기 P2A 서열을 인코딩하는 폴리뉴클레오티드 서열은 서열번호 12를 포함하고,
(ii) 상기 핵산 조합은 서열번호 15 내지 54 중 어느 하나의 폴리뉴클레오티드 서열을 포함하고,
(iii) 상기 RNA 레플리콘은 폴리 아데노신 서열을 추가로 포함하고, 바람직하게는 상기 폴리 아데노신 서열은 레플리콘의 3'-말단에서 서열번호 64의 서열을 갖는 것인, RNA 레플리콘. - 서열번호 65 내지 72 중 어느 하나의 폴리뉴클레오티드 서열을 포함하는 RNA 레플리콘.
- 제21항 내지 제27항 중 어느 한 항의 RNA 레플리콘을 인코딩하는 폴리뉴클레오티드 서열을 포함하는 핵산 분자로서, 바람직하게는, 상기 핵산은 DNA 서열의 5'-말단에 작동적으로 연결된 T7 프로모터를 추가로 포함하고, 보다 바람직하게는, 상기 T7 프로모터는 서열번호 73의 뉴클레오티드 서열을 포함하는, 핵산 분자.
- 제1항 내지 제15항 중 어느 한 항의 핵산 조합, 제16항 내지 제20항 중 어느 한 항의 벡터, 제21항 내지 제27항 중 어느 한 항의 RNA 레플리콘, 또는 제28항의 핵산 분자 및 약제학적으로 허용되는 담체를 포함하는 약제학적 조성물.
- 제29항에 있어서, 상기 약제학적으로 허용되는 담체는 지질 나노입자를 포함하고, 바람직하게는 상기 지질 나노입자는 ALC-0315, DOTMA, DOTAP, DDAB, DOGS, DSDMA, DODMA, DLinDMA, DLenDMA, γ-DLenDMA, DLin-K-DMA, DLin-K-C2-DMA, DLin-K-C3-DMA, DLin-K-C4-DMA, DLen-C2K-DMA, y-DLen-C2K-DMA, DLin-M-C2-DMA, DLin-M-C3-DMA, DLin-MP-DMA, 또는 DCChol 중 하나 이상을 포함하는, 약제학적 조성물.
- 제29항 또는 제30항에 있어서, 하기를 추가로 포함하는, 약제학적 조성물:
(1) 서열번호 84, 85 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열; 또는
(2) 서열번호 9의 아미노산 서열을 갖는, 바람직하게는 이로 이루어진 HBV 폴리머라제 항원을 인코딩하는 폴리뉴클레오티드 서열, 서열번호 11의 P2A 아미노산 서열을 인코딩하는 폴리뉴클레오티드 서열 또는 서열번호 13 또는 14의 폴리뉴클레오티드 서열을 갖는 IRES, 및 서열번호 84, 85 또는 86 중 어느 하나의 아미노산 서열을 갖는 HBV 코어 항원을 인코딩하는 폴리뉴클레오티드 서열. - 제29항 내지 제31항 중 어느 한 항에 있어서, HBV 감염의 치료에 사용하기 위한 약제학적 조성물.
- 제32항에 있어서, 상기 약제학적 조성물은 HBV에 대한 치료용 백신인, 약제학적 조성물.
- 제32항 또는 제33항에 있어서, 프라임-부스트 용법으로서 사용하기 위한 적어도 하나의 동일한 HBV 항원을 인코딩하는 핵산 분자를 포함하는 제2 조성물을 추가로 포함하는, 약제학적 조성물.
- 제34항에 있어서, 상기 프라임-부스트 용법은 제21항 내지 제27항 중 어느 한 항의 RNA 레플리콘을 포함하는 제1 조성물, 및 RNA 레플리콘이 아니고 적어도 하나의 동일한 HBV 에피토프를 인코딩하는 벡터를 포함하는 제2 조성물, 바람직하게는 제1 조성물로서 적어도 하나의 동일한 HBV 항원을 포함하고, 상기 제1 및 제2 조성물 중 하나는 백신접종 프라이밍에 사용되고 나머지는 백신접종 부스팅에 사용되는 것인, 약제학적 조성물.
- 제35항에 있어서, 상기 제2 조성물은 변형된 백시니아 앙카라(MVA) 벡터, 아데노바이러스 벡터 또는 플라스미드 벡터를 포함하는, 약제학적 조성물.
- 제36항에 있어서, 상기 제2 조성물은 Ad26, Ad35, 또는 MVA-BN 벡터를 포함하는, 약제학적 조성물.
- 제28항 내지 제31항 중 어느 한 항에 있어서, 이를 필요로 하는 대상체, 바람직하게는 만성 HBV 감염을 가진 대상체에서 선택적으로 또 다른 면역원성 제제 또는 다른 항-HBV 제제와 조합하여 B형 간염 바이러스(HBV)에 대한 면역 반응을 유도하는 데 사용하기 위한, 약제학적 조성물,
- 제38항에 있어서, 상기 다른 항-HBV 제제는 소분자, 항체 또는 이의 항원 결합 단편, 폴리펩타이드, 단백질, 또는 핵산인, 약제학적 조성물.
- 제29항 내지 제31항 중 어느 한 항에 있어서, HBV의 감염 및/또는 복제 감소를 필요로 하는 대상체에서 HBV의 감염 및/또는 복제를 감소시키는 데 사용하기 위한, 약제학적 조성물.
- 제1항 내지 제15항 중 어느 한 항의 핵산 조합, 제16항 내지 제20항 중 어느 한 항의 벡터, 제21항 내지 제27항 중 어느 한 항의 RNA 레플리콘, 또는 제28항의 핵산 분자를 포함하는 단리된 숙주 세포.
- 제28항에 따른 핵산을 생체내 또는 시험관내에서 전사하는 단계 포함하는 RNA 레플리콘의 생성 방법.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063049400P | 2020-07-08 | 2020-07-08 | |
US63/049,400 | 2020-07-08 | ||
US202163144051P | 2021-02-01 | 2021-02-01 | |
US63/144,051 | 2021-02-01 | ||
PCT/EP2021/068879 WO2022008613A1 (en) | 2020-07-08 | 2021-07-07 | Rna replicon vaccines against hbv |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230050328A true KR20230050328A (ko) | 2023-04-14 |
Family
ID=77104021
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237004630A KR20230050328A (ko) | 2020-07-08 | 2021-07-07 | Hbv에 대한 rna 레플리콘 백신 |
Country Status (11)
Country | Link |
---|---|
US (1) | US20220016237A1 (ko) |
EP (1) | EP4178613A1 (ko) |
JP (1) | JP2023533528A (ko) |
KR (1) | KR20230050328A (ko) |
CN (1) | CN116367854A (ko) |
AU (1) | AU2021303478A1 (ko) |
BR (1) | BR112022027038A2 (ko) |
CA (1) | CA3188801A1 (ko) |
IL (1) | IL299571A (ko) |
TW (1) | TW202216190A (ko) |
WO (1) | WO2022008613A1 (ko) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2016306275A1 (en) | 2015-08-07 | 2018-02-08 | Arrowhead Pharmaceuticals, Inc. | RNAi therapy for Hepatitis B virus infection |
JOP20170161A1 (ar) | 2016-08-04 | 2019-01-30 | Arrowhead Pharmaceuticals Inc | عوامل RNAi للعدوى بفيروس التهاب الكبد ب |
EA202091513A1 (ru) | 2017-12-19 | 2020-09-09 | Янссен Сайенсиз Айрлэнд Анлимитед Компани | Вакцины против вируса гепатита b (hbv) и их применение |
TW202245809A (zh) * | 2020-12-18 | 2022-12-01 | 美商詹森藥物公司 | 用於治療b型肝炎病毒感染之組合療法 |
WO2024124232A1 (en) * | 2022-12-09 | 2024-06-13 | Advanced Rna Vaccine (Arv) Technologies, Inc. | Nucleic acid based cancer vaccine and methods thereof |
WO2024133160A1 (en) * | 2022-12-19 | 2024-06-27 | Glaxosmithkline Biologicals Sa | Hepatitis b compositions |
Family Cites Families (63)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0173552B1 (en) | 1984-08-24 | 1991-10-09 | The Upjohn Company | Recombinant dna compounds and the expression of polypeptides such as tpa |
US5168062A (en) | 1985-01-30 | 1992-12-01 | University Of Iowa Research Foundation | Transfer vectors and microorganisms containing human cytomegalovirus immediate-early promoter-regulatory DNA sequence |
US5273525A (en) | 1992-08-13 | 1993-12-28 | Btx Inc. | Injection and electroporation apparatus for drug and gene delivery |
US6041252A (en) | 1995-06-07 | 2000-03-21 | Ichor Medical Systems Inc. | Drug delivery system and method |
AU4255397A (en) | 1996-09-06 | 1998-03-26 | Trustees Of The University Of Pennsylvania, The | Chimpanzee adenovirus vectors |
EA002087B1 (ru) | 1997-04-03 | 2001-12-24 | Электрофект Ас | Способ введения фармацевтических препаратов и нуклеиновых кислот в скелетную мышцу |
US6261281B1 (en) | 1997-04-03 | 2001-07-17 | Electrofect As | Method for genetic immunization and introduction of molecules into skeletal muscle and immune cells |
US5873849A (en) | 1997-04-24 | 1999-02-23 | Ichor Medical Systems, Inc. | Electrodes and electrode arrays for generating electroporation inducing electrical fields |
GB0023203D0 (en) | 2000-09-21 | 2000-11-01 | Isis Innovation | Vaccination method |
US6117660A (en) | 1997-06-10 | 2000-09-12 | Cytopulse Sciences, Inc. | Method and apparatus for treating materials with electrical fields having varying orientations |
DE69826124T3 (de) | 1997-06-30 | 2007-10-11 | Institut Gustave Roussy | Verabreichung der nukleinsäure in den quergestreiften muskel |
JP2003505114A (ja) | 1998-07-13 | 2003-02-12 | ジェネトロニクス、インコーポレーテッド | パルス電場による皮膚および筋肉を標的とした遺伝子治療 |
US6319901B1 (en) | 1998-10-15 | 2001-11-20 | Ichor Medical Systems, Inc. | Methods for prolonging cell membrane permeability |
PT1816204E (pt) | 1999-05-17 | 2011-01-24 | Crucell Holland Bv | Adenovírus recombinante do serótipo ad26 |
US6913922B1 (en) | 1999-05-18 | 2005-07-05 | Crucell Holland B.V. | Serotype of adenovirus and uses thereof |
WO2002042480A2 (en) | 2000-11-23 | 2002-05-30 | Bavarian Nordic A/S | Modified vaccinia ankara virus variant |
WO2003048184A2 (en) | 2001-12-04 | 2003-06-12 | Bavarian Nordic A/S | Flavivirus ns1 subunit vaccine |
US7245963B2 (en) | 2002-03-07 | 2007-07-17 | Advisys, Inc. | Electrode assembly for constant-current electroporation and use |
US8209006B2 (en) | 2002-03-07 | 2012-06-26 | Vgx Pharmaceuticals, Inc. | Constant current electroporation device and methods of use |
US6912417B1 (en) | 2002-04-05 | 2005-06-28 | Ichor Medical Systmes, Inc. | Method and apparatus for delivery of therapeutic agents |
AU2003271738C1 (en) | 2002-04-25 | 2008-04-17 | Crucell Holland B.V. | Stable adenoviral vectors and methods for propagation thereof |
ES2335657T3 (es) | 2002-04-25 | 2010-03-31 | Crucell Holland B.V. | Medios y metodos para la produccion de vectores de adenovirus. |
US7328064B2 (en) | 2002-07-04 | 2008-02-05 | Inovio As | Electroporation device and injection apparatus |
EP2567693B1 (en) | 2003-07-16 | 2015-10-21 | Protiva Biotherapeutics Inc. | Lipid encapsulated interfering RNA |
PT1711518E (pt) | 2004-01-23 | 2010-02-26 | Isti Di Ric Di Bio Moleco P An | Transportadores de vacinas de adenovírus de chimpanzé |
HUE025052T2 (en) | 2004-03-08 | 2016-01-28 | Ichor Medical Systems Inc | A sharpened device for electrically mediated delivery of medical substances |
AU2005252273B2 (en) | 2004-06-07 | 2011-04-28 | Arbutus Biopharma Corporation | Lipid encapsulated interfering RNA |
US20100143302A1 (en) | 2006-03-16 | 2010-06-10 | Crucell Holland B.V. | Recombinant Adenoviruses Based on Serotype 26 and 48, and Use Thereof |
WO2008048632A1 (en) | 2006-10-17 | 2008-04-24 | Vgx Pharmaceuticals, Inc. | Electroporation devices and methods of using same for electroporation of cells in mammals |
WO2009086558A1 (en) | 2008-01-02 | 2009-07-09 | Tekmira Pharmaceuticals Corporation | Improved compositions and methods for the delivery of nucleic acids |
HUE034483T2 (en) | 2008-04-15 | 2018-02-28 | Protiva Biotherapeutics Inc | New lipid preparations for introducing a nucleic acid |
EP2350043B9 (en) | 2008-10-09 | 2014-08-20 | TEKMIRA Pharmaceuticals Corporation | Improved amino lipids and methods for the delivery of nucleic acids |
WO2010048536A2 (en) | 2008-10-23 | 2010-04-29 | Alnylam Pharmaceuticals, Inc. | Processes for preparing lipids |
SG10201901089TA (en) | 2008-11-10 | 2019-03-28 | Arbutus Biopharma Corp | Novel lipids and compositions for the delivery of therapeutics |
EP3243504A1 (en) | 2009-01-29 | 2017-11-15 | Arbutus Biopharma Corporation | Improved lipid formulation |
ES2898235T3 (es) | 2009-02-02 | 2022-03-04 | Glaxosmithkline Biologicals Sa | Secuencias de aminoácidos y de ácidos nucleicos de adenovirus de simio, vectores que las contienen, y sus usos |
WO2010085984A1 (en) | 2009-02-02 | 2010-08-05 | Okairos Ag | Simian adenovirus nucleic acid- and amino acid-sequences, vectors containing same, and uses thereof |
SG10201402054UA (en) | 2009-05-05 | 2014-09-26 | Muthiah Manoharan | Lipid compositions |
HUE056773T2 (hu) | 2009-06-10 | 2022-03-28 | Arbutus Biopharma Corp | Továbbfejlesztett lipid készítmény |
IL300109A (en) | 2010-06-03 | 2023-03-01 | Alnylam Pharmaceuticals Inc | Biodegradable lipids for the transfer of active substances |
SI4005592T1 (sl) | 2010-07-06 | 2023-03-31 | Glaxosmithkline Biologicals S.A. | Virionom podobni dostavni delci za samopodvojene molekule RNA |
PL2655604T3 (pl) | 2010-12-14 | 2019-02-28 | The Government Of The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services | Szczepionki adenowirusowe serotyp 26 i serotyp 35 przeciwko filowirusom |
SI2750707T1 (sl) | 2011-08-31 | 2019-02-28 | Glaxosmithkline Biologicals Sa | Pegilirani liposomi za dostavo imunogen-kodirajoče RNA |
JP6275655B2 (ja) | 2012-02-24 | 2018-02-07 | プロティバ バイオセラピューティクス インコーポレイテッド | トリアルキルカチオン性脂質およびその使用方法 |
HRP20221536T1 (hr) | 2014-06-25 | 2023-02-17 | Acuitas Therapeutics Inc. | Novi lipidi i formulacije lipidnih nanočestica za isporuku nukleinskih kiselina |
SI3313829T1 (sl) | 2015-06-29 | 2024-09-30 | Acuitas Therapeutics Inc. | Lipidi in formulacije lipidnih nanodelcev za dostavo nukleinskih kislin |
CN113636947A (zh) | 2015-10-28 | 2021-11-12 | 爱康泰生治疗公司 | 用于递送核酸的新型脂质和脂质纳米颗粒制剂 |
EP3397613A1 (en) | 2015-12-30 | 2018-11-07 | Acuitas Therapeutics Inc. | Lipids and lipid nanoparticle formulations for delivery of nucleic acids |
US9834510B2 (en) | 2015-12-30 | 2017-12-05 | Arcturus Therapeutics, Inc. | Aromatic ionizable cationic lipid |
WO2017121791A1 (en) * | 2016-01-12 | 2017-07-20 | Helmholtz Zentrum München - Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH) | Means and methods for treating hbv |
EA202191975A2 (ru) | 2016-03-28 | 2022-03-31 | Айкор Медикэл Системс, Инк. | Устройство для доставки терапевтических средств |
AU2017347725B2 (en) | 2016-10-17 | 2024-01-04 | Janssen Pharmaceuticals, Inc. | Recombinant virus replicon systems and uses thereof |
AU2017372731B2 (en) | 2016-12-05 | 2024-05-23 | Janssen Pharmaceuticals, Inc. | Compositions and methods for enhancing gene expression |
WO2018119163A1 (en) | 2016-12-21 | 2018-06-28 | Payne Joseph E | Ionizable cationic lipid for rna delivery |
US10383952B2 (en) | 2016-12-21 | 2019-08-20 | Arcturus Therapeutics, Inc. | Ionizable cationic lipid for RNA delivery |
GB201705765D0 (en) * | 2017-04-10 | 2017-05-24 | Univ Oxford Innovation Ltd | HBV vaccine |
WO2018191657A1 (en) | 2017-04-13 | 2018-10-18 | Acuitas Therapeutics, Inc. | Lipids for delivery of active agents |
AU2018256877B2 (en) | 2017-04-28 | 2022-06-02 | Acuitas Therapeutics, Inc. | Novel carbonyl lipids and lipid nanoparticle formulations for delivery of nucleic acids |
WO2019036008A1 (en) | 2017-08-16 | 2019-02-21 | Acuitas Therapeutics, Inc. | LIPIDS FOR USE IN LIPID NANOPARTICULAR FORMULATIONS |
WO2019036028A1 (en) | 2017-08-17 | 2019-02-21 | Acuitas Therapeutics, Inc. | LIPIDS FOR USE IN LIPID NANOPARTICULAR FORMULATIONS |
WO2019036000A1 (en) | 2017-08-17 | 2019-02-21 | Acuitas Therapeutics, Inc. | LIPIDS FOR USE IN LIPID NANOPARTICLE FORMULATIONS |
US11524932B2 (en) | 2017-08-17 | 2022-12-13 | Acuitas Therapeutics, Inc. | Lipids for use in lipid nanoparticle formulations |
EA202091513A1 (ru) | 2017-12-19 | 2020-09-09 | Янссен Сайенсиз Айрлэнд Анлимитед Компани | Вакцины против вируса гепатита b (hbv) и их применение |
-
2021
- 2021-07-07 BR BR112022027038A patent/BR112022027038A2/pt not_active Application Discontinuation
- 2021-07-07 IL IL299571A patent/IL299571A/en unknown
- 2021-07-07 EP EP21746660.6A patent/EP4178613A1/en active Pending
- 2021-07-07 CA CA3188801A patent/CA3188801A1/en active Pending
- 2021-07-07 JP JP2023501042A patent/JP2023533528A/ja active Pending
- 2021-07-07 KR KR1020237004630A patent/KR20230050328A/ko unknown
- 2021-07-07 WO PCT/EP2021/068879 patent/WO2022008613A1/en active Application Filing
- 2021-07-07 CN CN202180055052.7A patent/CN116367854A/zh active Pending
- 2021-07-07 AU AU2021303478A patent/AU2021303478A1/en active Pending
- 2021-07-07 TW TW110124915A patent/TW202216190A/zh unknown
- 2021-07-08 US US17/370,337 patent/US20220016237A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
EP4178613A1 (en) | 2023-05-17 |
TW202216190A (zh) | 2022-05-01 |
JP2023533528A (ja) | 2023-08-03 |
IL299571A (en) | 2023-02-01 |
BR112022027038A2 (pt) | 2023-01-24 |
CN116367854A (zh) | 2023-06-30 |
US20220016237A1 (en) | 2022-01-20 |
WO2022008613A1 (en) | 2022-01-13 |
AU2021303478A1 (en) | 2023-02-16 |
CA3188801A1 (en) | 2022-01-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20230050328A (ko) | Hbv에 대한 rna 레플리콘 백신 | |
US20210260178A1 (en) | Novel lassa virus rna molecules and compositions for vaccination | |
US20220062409A1 (en) | Heterologous prime boost vaccine compositions and methods | |
US20220305118A1 (en) | Carbohydrate nanocarrier delivery of hepatitis b virus (hbv) vaccines | |
WO2020255013A1 (en) | Combination of hepatitis b virus (hbv) vaccines and capsid assembly modulators being amide derivatives | |
US20220305117A1 (en) | Combination of hepatitis b virus (hbv) vaccines and hbv-targeting rnai | |
TW202245809A (zh) | 用於治療b型肝炎病毒感染之組合療法 | |
US20240181037A1 (en) | Immunogenic compositions | |
US20220226467A1 (en) | Arenavirus vectors for hepatitis b virus (hbv) vaccines and uses thereof | |
US20220305107A1 (en) | COMBINATION OF HEPATITIS B VIRUS (HBV) VACCINES AND HBV-TARGETING RNAi | |
WO2022009052A2 (en) | Prostate neoantigens and their uses | |
US20220305108A1 (en) | Lipid nanoparticle or liposome delivery of hepatitis b virus (hbv) vaccines | |
US12018289B2 (en) | Vaccines based on mutant CALR and JAK2 and their uses | |
WO2020254876A1 (en) | Virus-like particle delivery of hepatitis b virus (hbv) vaccines | |
WO2020255015A1 (en) | Combination of hepatitis b virus (hbv) vaccines and dihydropyrimidine derivatives as capsid assembly modulators | |
WO2020255010A1 (en) | Combination of recombinant interleukin 12 construct and hepatitis b virus (hbv) vaccines | |
WO2020255042A1 (en) | Combination of hepatitis b virus (hbv) vaccines and a pyrimidine derivative |