KR20220160042A - 코로나바이러스의 치료 및 예방을 위한 조성물 및 방법 - Google Patents

코로나바이러스의 치료 및 예방을 위한 조성물 및 방법 Download PDF

Info

Publication number
KR20220160042A
KR20220160042A KR1020227036898A KR20227036898A KR20220160042A KR 20220160042 A KR20220160042 A KR 20220160042A KR 1020227036898 A KR1020227036898 A KR 1020227036898A KR 20227036898 A KR20227036898 A KR 20227036898A KR 20220160042 A KR20220160042 A KR 20220160042A
Authority
KR
South Korea
Prior art keywords
polypeptide
nucleic acid
sars
cov
rbd
Prior art date
Application number
KR1020227036898A
Other languages
English (en)
Inventor
맛티 셀베리
라르스 프렐린
Original Assignee
스벤스카 박신파브리셴 프로둑숀 아베
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 스벤스카 박신파브리셴 프로둑숀 아베 filed Critical 스벤스카 박신파브리셴 프로둑숀 아베
Publication of KR20220160042A publication Critical patent/KR20220160042A/ko

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • A61K39/215Coronaviridae, e.g. avian infectious bronchitis virus
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P11/00Drugs for disorders of the respiratory system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/14Antivirals for RNA viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/02Immunomodulators
    • A61P37/04Immunostimulants
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • A61K2039/53DNA (RNA) vaccination
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/70Multivalent vaccine
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/50Fusion polypeptide containing protease site
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20021Viruses as such, e.g. new isolates, mutants or their genomic sequences
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20022New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20034Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Virology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Organic Chemistry (AREA)
  • Immunology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Pulmonology (AREA)
  • Communicable Diseases (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Mycology (AREA)
  • Epidemiology (AREA)
  • Oncology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Medicinal Preparation (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Treatments Of Macromolecular Shaped Articles (AREA)
  • Chemical Or Physical Treatment Of Fibers (AREA)

Abstract

본원에서는 SARS-CoV 감염 또는 또 다른 코로나바이러스 (SARS-CoV-2 및 그의 변이체 포함)에 의한 감염에 대한 면역 반응을 유도하는 데 사용될 수 있는 조작된 SARS-CoV 핵산, 유전자, 펩티드, 또는 단백질로 이루어진 면역원성 조성물 또는 생성물 조합물을 개시한다. 또한, 핵산 프라임 및 폴리펩티드 부스트 접근법을 사용하여 면역원성 조성물 또는 생성물 조합물을 투여함으로써 대상체에서 상기 조성물 또는 조합물을 사용하여 SARS-CoV 또는 또 다른 코로나바이러스에 대한 면역 반응 및 중화 항체를 생성하는 방법도 개시한다.

Description

코로나바이러스의 치료 및 예방을 위한 조성물 및 방법
관련 출원에 대한 상호 참조
본 출원은 2020년 3월 27일 출원된 미국 특허 가출원 번호 63/000,978, 2020년 10월 6일 출원된 미국 특허 가출원 번호 63/088,228, 2021년 1월 26일 출원된 미국 특허 가출원 번호 63/141,875, 및 2021년 3월 4일 출원된 미국 특허 가출원 번호 63/156,660의 우선권의 이익을 주장하고, 상기 특허는 각각 그와 함께 제출된 모든 부록을 포함하여 그 전문이 본원에서 명시적으로 참조로 포함된다.
서열 목록에 대한 언급
본 출원은 전자 포맷의 서열 목록과 함께 출원 중이다. 서열 목록은 2021년 3월 24일 작성되고, 크기가 368,069 바이트인 파일명 SeqListingSVF006WO.TXT로서 제공된다. 전자 서열 목록 중의 정보는 그 전문이 본원에서 명시적으로 참조로 포함된다.
기술분야
본 개시내용의 측면은 일반적으로 SARS-CoV-2 감염 또는 또 다른 코로나바이러스에 대한 면역 반응을 유도하는 데 사용될 수 있는 조작된 SARS-CoV-2 핵산, 유전자, 펩티드, 또는 단백질의 면역원성 조성물 또는 생성물 조합물에 관한 것이다. 상기 면역 반응은 SARS-CoV-2 또는 또 다른 코로나바이러스 (그의 변이체 포함)에 대한 세포독성 면역 세포 및 그에 대한 중화 항체를 생성하는 면역 세포 활성화를 포함한다. 본 개시내용은 또한 일반적으로 예를 들어, 동종성 또는 이종성 핵산 및/또는 폴리펩티드 프라임 및 핵산 및/또는 폴리펩티드 부스트 접근법과 함께 면역원성 조성물 또는 생성물 조합물을 투여함으로써 대상체에게 본원에 기술된 면역원성 조성물 또는 생성물 조합물을 사용 또는 투여하여 SARS-CoV-2 또는 또 다른 코로나바이러스에 대한 중화 항체 생산을 포함하나, 이에 제한되지 않는 면역 반응을 생성하는 방법에 관한 것이다.
SARS-CoV-2 (2019-nCoV) 바이러스에 의해 유발된 2019 코로나바이러스 대유행은 엄청난 인명 손실, 세계 경제에 미치는 영향 및 전 세계 공중 보건 기반 시설에 대한 압박을 초래하였다. SARS-CoV-2 바이러스에 대한 인간 코로나바이러스 면역요법 또는 백신이 승인받기 시작했지만, 장기적인 효능 및 안전성 프로파일은 수행되지 않았다. 추가로, SARS-CoV-2 바이러스의 추가 변이체 또는 돌연변이체가 나타나고 있으며, 그 중 일부는 원래 확인된 균주보다 전염성이 높거나 독성이 강한 것으로 나타났다. 따라서, SARS-CoV-2 및 다른 코로나바이러스에 대한 새로운 치료법과 예방책이 크게 요구되고 있다.
SARS-CoV-2 및 다른 잠재적인 새로운 코로나바이러스 균주 또는 돌연변이체에 대한 치료 및 백신 개발 속도가 가장 중요하다. 바이러스의 유전자 분석 결과, 일반적으로 SARS-CoV-2 및 코로나바이러스의 가장 가변적인 성분은 수용체 결합 도메인 (RBD)을 포함하는 스파이크 (S) 단백질인 것으로 나타났다. SARS-CoV-2의 RBD는 2003년 SARS 바이러스 (SARS-CoV-1) 및 다른 코로나바이러스와 대략 75%의 상동성을 갖는다 (Wu A et al. "Genome Compositions and Divergence of the Novel Coronavirus (2019-nCoV) Originating in China" Cell Host Microbe. (2020); 27(3):325-328). 이는 예컨대, SARS-CoV-1과 같은 다른 코로나바이러스에 대한 기존 면역요법 및 백신 후보가 SARS-CoV-2에 대해 방어하는 데 유용하지 않을 것이라는 것을 시사하는 것이다.
본원에서는 신속한 검증 및 대규모 생산을 허용하는 SARS-CoV-2에 대한 면역원성 조성물로 사용하기 위한 고유한 후보물질을 개시한다. 본원에서는 핵산 (DNA 또는 RNA) 프라임 및 폴리펩티드 부스트 투여 스케줄을 사용하는 이종성 프라임-부스트 면역화 접근법의 사용을 기술한다. 핵산 프라임은 단일 투여로부터 1 또는 2주 이내에 대한 중화 항체를 검출 할 수 있게 한다. 이는 단백질/애주번트 믹스와 비교하여 더 우수한 T 세포 프라이밍에 기인하는 것이다.
일부 실시양태에서, 본원에 기술된 면역원성 조성물 또는 생성물 조성물은 핵산 및/또는 폴리펩티드이다. 일부 실시양태에서, 핵산은 DNA 또는 RNA이다. 일부 실시양태에서, 면역원성 조성물 또는 생성물 조성물은 포유동물, 마우스, 토끼, 고양이, 개, 영장류, 원숭이 또는 인간에게 투여되어 SARS-CoV-2 바이러스 또는 다른 코로나바이러스에 대한 면역원성 반응을 유도하는 것으로 의도된다. 일부 실시양태에서, 면역원성 반응은 SARS-CoV-2 바이러스, 다른 코로나바이러스, 또는 바이러스의 임의의 항원, 폴리펩티드, 단백질, 핵산, 또는 게놈 성분에 대한 활성 면역 세포, 예컨대 세포독성 T 세포, 또는 SARS-CoV-2 바이러스, 다른 코로나바이러스, 또는 바이러스의 임의의 항원, 폴리펩티드, 단백질, 핵산, 또는 게놈 성분에 대한 불활성화 항체를 생산하는 면역 세포의 형성을 포함하거나, 본질적으로 그로 이루어지거나, 또는 그로 이루어진다. 일부 실시양태에서, 면역원성 조성물 또는 생성물 조성물은 동물, 예컨대 포유동물, 마우스, 토끼, 고양이, 개, 영장류, 원숭이 또는 인간에게 투여되어 동물에서 SARS-CoV-2 바이러스 또는 다른 코로나바이러스에 대한 중화 항체를 생성하는 것으로 의도된다. 일부 실시양태에서, 면역원성 조성물 또는 생성물 조성물은 SARS-CoV-2에 걸릴 위험이 있거나, 또는 현재 SARS-CoV-2로 감염되지 않은 개체에게 투여된다. 일부 실시양태에서, 면역원성 조성물 또는 생성물 조합물은 SARS-CoV-2 감염에 대한 지속적인 면역원성 방어를 제공한다.
본원에 기술된 일부 대안은 바람직하게는, IgE 리더 서열을 코딩하는 핵산 (예컨대, 아미노산 서열 MDWTWILFLVAAATRVHS (서열식별번호( SEQ ID NO:) 44)를 코딩하는 핵산), 또는 서열식별번호 43과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 갖는 IgE 리더 핵산 서열과 연결된, 적어도 하나의 SARS-CoV-2 핵산 성분을 포함하거나, 본질적으로 그로 이루어지거나, 또는 그로 이루어진 핵산 뿐만 아니라, SARS-CoV-2 감염을 치료 또는 억제하는 의약을 포함한, 의약으로서의 상기 핵산 및/또는 그에 의해 코딩된 단백질의 용도에 관한 것이다.
일부 대안에서, 적어도 하나의 SARS-CoV-2 핵산 성분은 S 단백질 서열, RBD 서열, M 단백질 서열, NP 단백질 서열, E 단백질 서열, 또는 HE 단백질 서열을 포함하거나, 본질적으로 그로 이루어지거나, 또는 그로 이루어진다. 일부 대안에서, 적어도 하나의 SARS-CoV-2 핵산 성분은 야생형 서열로서 발견된다. 일부 대안은 핵산이 서열식별번호 1-12 중 임의의 하나 이상과 적어도 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성, 또는 서열식별번호 1-12 중 임의의 하나 이상과 상기 언급된 백분율 중 임의의 두 백분율로 정의된 범위 이내인 양의 서열 동일성을 공유하거나 또는 포함하는 것인 핵산 및 그의 용도에 관한 것이다. 일부 대안에서, 본원에 기술된 조성물 및 용도에 포함되는 것으로 고려되는 적어도 하나의 SARS-CoV-2 핵산 성분은 상기 언급된 야생형 서열의 인간 코돈 최적화된 서열이다. 일부 대안에서, 예를 들어, 핵산은 서열식별번호 13-24, 39-40, 57-63, 71, 73, 또는 75 중 임의의 하나 이상과 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성, 또는 서열식별번호 13-24, 39-40, 57-63, 71, 73, 또는 75 중 임의의 하나 이상과 상기 언급된 백분율 중 임의의 두 백분율로 정의된 범위 이내인 양의 서열 동일성을 공유하거나 또는 포함한다. 일부 대안에서, 상기 언급된 핵산은 대상체, 예컨대 포유동물, 바람직하게는 인간에서 SARS-CoV-2 감염의 예방, 치료 또는 억제를 위해 사용된다. 따라서, 일부 대안은 임의적으로 SARS-CoV-2 감염의 예방, 치료, 호전, 또는 억제용 의약을 받도록 선택되거나, 또는 확인될 수 있는 대상체, 예컨대 포유동물, 바람직하게는 인간에서의 예컨대, SARS-CoV-2 감염의 예방, 치료, 호전, 또는 억제용 의약으로서의, 서열식별번호 1-24, 39-40, 57-63, 71, 73, 또는 75 중 임의의 하나 이상과 적어도 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성, 또는 서열식별번호 1-24, 39-40, 57-63, 71, 73, 또는 75 중 임의의 하나 이상과 상기 언급된 백분율 중 임의의 두 백분율로 정의된 범위 이내인 양의 서열 동일성을 갖는 핵산의 용도를 포함한다. 상기 대상체는 임상 평가 또는 진단 평가, 또는 그 둘 모두에 의해 선택 또는 확인될 수 있다.
본원에 제공된 일부 대안은 적어도 하나의 SARS-CoV-2 폴리펩티드 성분을 포함하거나, 본질적으로 그로 이루어지거나, 또는 그로 이루어진 폴리펩티드에 관한 것이다. 일부 대안에서, 적어도 하나의 SARS-CoV-2 폴리펩티드 성분은 S 단백질 서열, RBD 서열, M 단백질 서열, NP 단백질 서열, E 단백질 서열, 또는 HE 단백질 서열을 포함하거나, 본질적으로 그로 이루어지거나, 또는 그로 이루어진다. 일부 실시양태에서, 본원에 기술된 조성물 또는 방법에 제공될 수 있는 폴리펩티드는 서열식별번호 25-36, 41-42, 64-70, 72, 74, 또는 76 중 임의의 하나 이상과 적어도 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성, 또는 서열식별번호 25-36, 41-42, 64-70, 72, 74, 또는 76 중 임의의 하나 이상과 상기 언급된 백분율 중 임의의 두 백분율로 정의된 범위 이내인 양의 서열 동일성을 공유하거나 또는 포함한다. 일부 대안에서, 폴리펩티드는 임의적으로 SARS-CoV-2 감염의 예방, 치료, 호전, 또는 억제용 의약을 받도록 선택되거나, 또는 확인될 수 있는 대상체, 예컨대 포유동물, 바람직하게는 인간에서 예컨대, SARS-CoV-2의 예방, 치료 또는 억제용 의약으로서 사용된다. 상기 대상체는 임상 평가 또는 진단 평가, 또는 그 둘 모두에 의해 선택 또는 확인될 수 있다. 일부 실시양태에서, 폴리펩티드는 상기 언급된 야생형 또는 코돈 최적화된 서열로부터 번역된다. 일부 실시양태에서, 폴리펩티드는 재조합적으로 발현된다. 일부 실시양태에서, 폴리펩티드는 포유동물, 박테리아, 효모, 곤충, 또는 무세포 시스템에서 재조합적으로 발현된다. 따라서, 일부 대안은 임의적으로 SARS-CoV-2 감염의 예방, 치료, 호전, 또는 억제용 의약을 받도록 선택되거나, 또는 확인될 수 있는 대상체, 예컨대 포유동물, 바람직하게는 인간에서의 예컨대, SARS-CoV-2 감염의 예방, 치료, 호전, 또는 억제용 의약으로서의, 서열식별번호 25-36, 41-42, 64-70, 72, 74, 또는 76 중 임의의 하나 이상과 적어도 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성, 또는 서열식별번호 25-36, 41-42, 64-70, 72, 74, 또는 76 중 임의의 하나 이상과 상기 언급된 백분율 중 임의의 두 백분율로 정의된 범위 이내인 양의 서열 동일성을 갖는 폴리펩티드의 용도를 제공한다.
일부 대안에서, 핵산 또는 폴리펩티드는 또한 적어도 하나의 자가촉매 펩티드 절단 부위를 포함한다. 일부 대안에서, 적어도 하나의 자가촉매 펩티드 절단 부위는 P2A 자가촉매 펩티드 절단 부위이다. 일부 대안에서, 적어도 하나의 SARS-CoV-2 핵산 성분 또는 적어도 하나의 SARS-CoV-2 폴리펩티드 성분은 적어도 하나의 자가촉매 펩티드 절단 부위에 의해 분리된다.
일부 대안에서, 예컨대 HDAg 유전자형 1A, HDAg 유전자형 1B, HDAg 유전자형 2A, 또는 HDAg 유전자형 2B 또는 그의 임의의 조합으로부터 선택되는 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 HDAg 균주 서열과 같은, 적어도 하나의 HDAg 균주 서열은 상기 언급된 핵산 또는 폴리펩티드에 제공된다. 일부 대안에서, 4개의 HDAg 균주 서열이 그의 언급된 핵산 또는 폴리펩티드에 제공된다. 일부 대안에서, 4개의 HDAg 균주 서열은 HDAg 유전자형 1A, HDAg 유전자형 1B, HDAg 유전자형 2A, 및 HDAg 유전자형 2B 각각의 한 카피를 포함한다. 일부 대안에서, 핵산 또는 폴리펩티드는 4개 미만의 HDAg 균주 서열이 존재한다. 일부 대안에서, HDAg 균주 서열은 핵산 또는 폴리펩티드에서 탠덤으로 발견된다. 일부 대안에서, HDAg 균주 서열은 자가촉매 펩티드 절단 부위에 의해 분리된다. 다른 대안에서, HDAg 균주 서열은 링커 없이, 적어도 1개의 뉴클레오티드 또는 아미노산으로 이루어진 링커와 함께, 또는 그 사이의 자가촉매 펩티드 절단 부위 없이 탠덤으로 발견된다. 일부 대안에서, SARS-CoV-2 또는 다른 코로나바이러스 서열은 HDAg 균주 서열의 상류 또는 하류에서 발견된다. 일부 대안에서, SARS-CoV-2 또는 다른 코로나바이러스 서열은 자가촉매 펩티드 절단 부위에 의해 HDAg 균주 서열로부터 분리되어 있다. 일부 대안에서, 자가촉매 펩티드 절단 부위는 P2A 자가촉매 펩티드 절단 부위이다. 일부 대안에서, 구축물 SVF-8 (OC-8) 및 SVF-9 (OC-9)는 HDAg 균주 서열을 포함하거나, 본질적으로 그로 이루어지거나, 또는 그로 이루어진다.
일부 대안에서, 면역원성 조성물 또는 생성물 조성물은 상기 기술된 핵산 (예컨대, 서열식별번호 1-24, 39-40, 57-63, 71, 73, 또는 75 중 임의의 하나 이상), 및 상기 기술된 폴리펩티드 (예컨대, 서열식별번호 25-36, 41-42, 64-70, 72, 74, 또는 76 중 임의의 하나 이상)을 포함하거나, 본질적으로 그로 이루어지거나, 또는 그로 이루어진다. 일부 대안에서, 면역원성 조성물 또는 생성물 조성물은 이종성 프라임-부스트 접근법으로 대상체에게 투여된다. 일부 대안에서, 프라임 용량은 핵산을 포함하고, 부스트 용량은 폴리펩티드를 포함한다. 일부 대안에서, 프라임 용량은 상기 언급된 폴리펩티드 중 임의의 하나 이상을 포함하고, 부스트 용량은 상기 언급된 핵산 중 임의의 하나 이상을 포함한다. 일부 대안에서, 면역원성 조성물 또는 생성물 조성물은 동종성 프라임-부스트 접근법으로서 대상체에게 투여된다. 일부 대안에서, 프라임 용량은 상기 언급된 핵산 중 임의의 하나 이상을 포함하고, 부스트 용량은 동일한 핵산 또는 상이한 핵산을 포함한다. 일부 대안에서, 프라임 용량은 상기 언급된 폴리펩티드 중 임의의 하나 이상을 포함하고, 부스트 용량은 동일한 폴리펩티드 또는 상이한 폴리펩티드를 포함한다. 일부 대안에서, 면역원성 조성물 또는 생성물 조성물은 애주번트를 추가로 포함한다. 일부 실시양태에서, 애주번트는 알룸 및/또는 QS21이다. 일부 대안에서, 핵산은 재조합 벡터에 제공된다. 일부 대안에서, 재조합 벡터는 pVAX1이다. 일부 대안에서, 면역원성 조성물 또는 생성물 조성물은 임의적으로 SARS-CoV-2 감염의 예방, 치료, 호전, 또는 억제용 의약을 받도록 선택되거나, 또는 확인될 수 있는 대상체, 예컨대 포유동물, 바람직하게는 인간에서의 SARS-CoV-2 의 예방, 치료 또는 억제를 위해 사용된다. 상기 대상체는 임상 평가 또는 진단 평가, 또는 그 둘 모두에 의해 선택 또는 확인될 수 있다.
본원에 기술된 일부 대안은 상기 기술된 면역원성 조성물, 생성물 조성물, 핵산, 또는 폴리펩티드 (예컨대, 서열식별번호 1-36, 39-42, 또는 57-70 중 임의의 하나 이상)를 사용하여 대상체, 바람직하게는 인간에서 면역 반응을 생성하는 방법에 관한 것이다. 일부 대안에서, 본 방법은 이종성 프라임-부스트 접근법을 포함한다. 일부 대안에서, 적어도 하나의 프라임 용량이 대상체에게 투여되고, 적어도 하나의 부스트 용량이 대상체에게 투여된다. 일부 대안에서, 적어도 하나의 프라임 용량은 핵산이다. 일부 대안에서, 적어도 하나의 부스트 용량은 폴리펩티드이다. 일부 대안에서, 적어도 하나의 부스트 용량은 애주번트, 예컨대 알룸 및/또는 QS21을 포함한다. 일부 대안에서, 적어도 하나의 부스트 용량은 적어도 하나의 프라임 용량 투여 후 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 24, 36, 또는 48일 또는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 24, 36, 또는 48주, 또는 상기 언급된 시점 중 임의의 두 시점으로 정의된 시간 범위 이내에 투여된다. 일부 대안에서, 본 방법은 동종성 프라임-부스트 접근법을 포함한다. 일부 대안에서, 본 방법은 항바이러스 요법, 예컨대 덱사메타손, 파비피라비르, 파필라비르, 렘데시비르, 토실리주맙, 갈리데시비르, 사릴루맙, 로피나비르, 리토나비르, 다루나비르, 리바비린, 인터페론-α, PEG화된 인터페론-α, 인터페론 알파-2b, 회복기 혈청, AT-100, 또는 TJM2, 또는 줄기 세포 요법, 또는 그의 임의의 조합의 투여를 추가로 포함한다.
추가의 대안은 본원에 기술된 조성물 중 임의의 하나 이상, 예컨대 서열식별번호 1-36, 39-42, 또는 57-70 중 임의의 하나 이상에 기재된 핵산 또는 폴리펩티드 중 임의의 하나 이상을 포함하는 주사 장치에 관한 것이다. 상기 주사 장치는 단일 용량의 상기 핵산 또는 폴리펩티드를 포함할 수 있고, 상기 주사 장치는 핵산 또는 폴리펩티드, 또는 그 둘 모두의 전달을 향상시키도록 구성된 변형된 니들 디자인을 가질 수 있다. 상기 주사 장치는 전기천공하에, 또는 그의 부재하에 사용될 수 있다. 서열식별번호 1-36, 39-42, 또는 57-70의 핵산 또는 폴리펩티드 중 임의의 하나 이상을 포함할 수 있는 고려되는 주사 장치는 미국 특허 출원 공개 번호 2016/0235928; PCT 출원 공개 번호 WO2014064534; 미국 특허 번호 6,610,044; 6,132,419; 6,379,966; 6,897,068; 7,015,040; 7,214,369; 7,473,419; 및 7,589,059 (상기 특허들은 모두 그 전문이 본원에서 명시적으로 참조로 포함된다)에 기술되어 있다.
본 발명의 일부 측면은 하기 넘버링된 대안에 관한 것이다:
1. SARS-CoV-2 폴리펩티드를 코딩하는 적어도 하나의 핵산 서열 및 P2A 자가촉매 폴리펩티드 절단 부위를 코딩하는 적어도 하나의 핵산 서열을 포함하는 핵산.
2. 대안 1에 있어서, SARS-CoV-2 폴리펩티드를 코딩하는 적어도 하나의 핵산 서열이 RBD 폴리펩티드를 코딩하는 핵산 서열 및 NP 폴리펩티드를 코딩하는 핵산 서열을 포함하는 것인 핵산.
3. 대안 1 또는 2에 있어서, 핵산이 서열식별번호 1 또는 13과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 핵산.
4. 대안 1에 있어서, SARS-CoV-2 폴리펩티드를 코딩하는 적어도 하나의 핵산 서열이 RBD 폴리펩티드를 코딩하는 핵산 서열, M 폴리펩티드를 코딩하는 핵산 서열, 및 NP 폴리펩티드를 코딩하는 핵산 서열을 포함하는 것인 핵산.
5. 대안 1-2 또는 4 중 어느 한 대안에 있어서, 핵산이 서열식별번호 2-3, 14, 또는 15 중 어느 하나 이상과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 핵산.
6. 대안 4에 있어서, RBD 폴리펩티드가 RBD 탠덤 반복 단일 쇄 이량체 폴리펩티드인 핵산.
7. 대안 6에 있어서, RBD 탠덤 반복 단일 쇄 이량체 폴리펩티드가 전체 S 단백질 (예컨대, NCBI 수탁 번호 YP_009724390에 제시된 바와 같음) 기준으로 K417N, N439K, E484K, 또는 N501Y 돌연변이, 또는 그의 임의의 조합을 포함하는 것인 핵산.
8. 대안 6 또는 7에 있어서, RBD 탠덤 반복 단일 쇄 이량체 폴리펩티드를 코딩하는 핵산 서열이 서열식별번호 45, 또는 47-50 중 어느 하나 이상과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 핵산.
9. 대안 6-8 중 어느 한 대안에 있어서, 핵산이 서열식별번호 39와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 핵산.
10. 대안 1-2 또는 4 중 어느 한 대안에 있어서, 5' IgE 리더 핵산 서열을 추가로 포함하는 핵산.
11. 대안 10에 있어서, 5' IgE 리더 핵산 서열이 서열식별번호 43과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 핵산.
12. 대안 10 또는 11에 있어서, RBD 폴리펩티드가 RBD 탠덤 반복 단일 쇄 이량체 폴리펩티드인 핵산.
13. 대안 12에 있어서, RBD 탠덤 반복 단일 쇄 이량체 폴리펩티드가 전체 S 단백질 (예컨대, NCBI 수탁 번호 YP_009724390에 제시된 바와 같음) 기준으로 K417N, N439K, E484K, 또는 N501Y 돌연변이, 또는 그의 임의의 조합을 포함하는 것인 핵산.
14. 대안 12 또는 13에 있어서, RBD 탠덤 반복 단일 쇄 이량체 폴리펩티드를 코딩하는 핵산 서열이 서열식별번호 45, 또는 47-50 중 어느 하나 이상과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 핵산.
15. 대안 10-14 중 어느 한 대안에 있어서, 핵산이 서열식별번호 40, 57-60, 또는 62 중 어느 하나 이상과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 핵산.
16. 대안 10 또는 11에 있어서, RBD 폴리펩티드가 RBD의 3개의 탠덤 카피를 포함하는 것인 핵산.
17. 대안 16에 있어서, RBD의 3개의 탠덤 카피가 각각 전체 S 단백질 (예컨대, NCBI 수탁 번호 YP_009724390에 제시된 바와 같음) 기준으로 K417N, N439K, E484K, 또는 N501Y 돌연변이, 또는 그의 임의의 조합을 포함하거나, 또는 상기 돌연변이 중 어느 것도 포함하지 않는 것인 핵산.
18. 대안 16 또는 17에 있어서, 핵산이 서열식별번호 61과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 핵산.
19. 대안 1에 있어서, SARS-CoV-2 폴리펩티드를 코딩하는 적어도 하나의 핵산 서열이 RBD 폴리펩티드를 코딩하는 핵산 서열 및 M 폴리펩티드를 코딩하는 핵산 서열을 포함하는 것인 핵산.
20. 대안 1 또는 9에 있어서, 핵산이 서열식별번호 4 또는 16과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 핵산.
21. 대안 1에 있어서, SARS-CoV-2 폴리펩티드를 코딩하는 적어도 하나의 핵산 서열이 스파이크 (S) 폴리펩티드를 코딩하는 핵산 서열, 막 (M) 폴리펩티드를 코딩하는 핵산 서열, 또는 NP 폴리펩티드를 코딩하는 핵산 서열, 또는 그의 임의의 조합을 포함하는 것인 핵산.
22. 대안 21에 있어서, S 폴리펩티드가 발현, 가용성, 및/또는 면역원성을 개선시키는 하나 이상의 돌연변이를 포함하는 것인 핵산.
23. 대안 21 또는 22에 있어서, S 폴리펩티드가 전체 S 단백질 (예컨대, NCBI 수탁 번호 YP_009724390에 제시된 바와 같음) 기준으로 K968P 또는 V987P 돌연변이, 또는 그 둘 모두를 포함하는 것인 핵산.
24. 대안 21-23 중 어느 한 대안에 있어서, S 폴리펩티드를 코딩하는 핵산 서열이 서열식별번호 51과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 핵산.
25. 대안 21-24 중 어느 한 대안에 있어서, 5' IgE 리더 핵산 서열을 추가로 포함하는 핵산.
26. 대안 25에 있어서, 5' IgE 리더 핵산 서열이 서열식별번호 43과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 핵산.
27. 대안 21-26 중 어느 한 대안에 있어서, 핵산이 서열식별번호 63과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 핵산.
28. 서열식별번호 5-7, 17-19, 22-24, 73, 또는 75 중 어느 하나 이상과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 SARS-CoV-2 폴리펩티드를 코딩하는 적어도 하나의 핵산 서열을 포함하는 핵산.
29. SARS-CoV-2 폴리펩티드를 코딩하는 적어도 하나의 핵산 서열 및 D형 간염 항원 (HDAg)을 코딩하는 적어도 하나의 핵산 서열을 포함하는 핵산.
30. 대안 29에 있어서, 핵산이 서열식별번호 8 또는 20과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 핵산.
31. 대안 29에 있어서, P2A 자가촉매 폴리펩티드 절단 부위를 코딩하는 적어도 하나의 핵산 서열을 추가로 포함하는 핵산.
32. 대안 29 또는 31에 있어서, 핵산이 서열식별번호 9 또는 21과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 핵산.
33. 적어도 하나의 SARS-CoV-2 폴리펩티드 서열 및 적어도 하나의 P2A 자가촉매 폴리펩티드 절단 부위를 포함하는 폴리펩티드.
34. 대안 33에 있어서, 적어도 하나의 SARS-CoV-2 폴리펩티드 서열이 RBD 폴리펩티드 서열 및 NP 폴리펩티드 서열을 포함하는 것인 폴리펩티드.
35. 대안 33 또는 34에 있어서, 폴리펩티드가 서열식별번호 25와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 폴리펩티드.
36. 대안 33에 있어서, 적어도 하나의 SARS-CoV-2 폴리펩티드 서열이 RBD 폴리펩티드 서열, M 폴리펩티드 서열, 및 NP 폴리펩티드 서열을 포함하는 것인 폴리펩티드.
37. 대안 33, 34, 또는 36에 있어서, 폴리펩티드가 서열식별번호 26 내지 27 중 어느 하나 이상과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 폴리펩티드.
38. 대안 36에 있어서, RBD 폴리펩티드가 RBD 탠덤 반복 단일 쇄 이량체 폴리펩티드인 폴리펩티드.
39. 대안 38에 있어서, RBD 탠덤 반복 단일 쇄 이량체 폴리펩티드가 전체 S 단백질 (예컨대, NCBI 수탁 번호 YP_009724390에 제시된 바와 같음) 기준으로 K417N, N439K, E484K, 또는 N501Y 돌연변이, 또는 그의 임의의 조합을 포함하는 것인 폴리펩티드.
40. 대안 38 또는 39에 있어서, RBD 탠덤 반복 단일 쇄 이량체 폴리펩티드가 서열식별번호 46, 또는 52-55 중 어느 하나 이상과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 폴리펩티드.
41. 대안 38-40 중 어느 한 대안에 있어서, 폴리펩티드가 서열식별번호 41과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 폴리펩티드.
42. 대안 33, 34, 또는 36 중 어느 한 대안에 있어서, N-말단 IgE 리더 폴리펩티드 서열을 추가로 포함하는 폴리펩티드.
43. 대안 42에 있어서, N-말단 IgE 리더 폴리펩티드 서열이 서열식별번호 44와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 폴리펩티드.
44. 대안 42 또는 43에 있어서, RBD 폴리펩티드가 RBD 탠덤 반복 단일 쇄 이량체 폴리펩티드인 폴리펩티드.
45. 대안 44에 있어서, RBD 탠덤 반복 단일 쇄 이량체 폴리펩티드가 전체 S 단백질 (예컨대, NCBI 수탁 번호 YP_009724390에 제시된 바와 같음) 기준으로 K417N, N439K, E484K, 또는 N501Y 돌연변이, 또는 그의 임의의 조합을 포함하는 것인 폴리펩티드.
46. 대안 44 또는 45에 있어서, RBD 탠덤 반복 단일 쇄 이량체 폴리펩티드가 서열식별번호 46, 또는 52-55 중 어느 하나 이상과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 폴리펩티드.
47. 대안 42-46 중 어느 한 대안에 있어서, 폴리펩티드가 서열식별번호 42, 64-67, 또는 69 중 어느 하나 이상과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 폴리펩티드.
48. 대안 42-43에 있어서, RBD 폴리펩티드가 RBD의 3개의 탠덤 카피를 포함하는 것인 폴리펩티드.
49. 대안 48에 있어서, RBD의 3개의 탠덤 카피가 각각 전체 S 단백질 (예컨대, NCBI 수탁 번호 YP_009724390에 제시된 바와 같음) 기준으로 K417N, N439K, E484K, 또는 N501Y 돌연변이, 또는 그의 임의의 조합을 포함하거나, 또는 상기 돌연변이 중 어느 것도 포함하지 않는 것인 폴리펩티드.
50. 대안 48 또는 49에 있어서, 폴리펩티드가 서열식별번호 68과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 폴리펩티드.
51. 대안 33에 있어서, 적어도 하나의 SARS-CoV-2 폴리펩티드 서열이 RBD 폴리펩티드 서열 및 M 폴리펩티드 서열을 포함하는 것인 폴리펩티드.
52. 대안 33 또는 51에 있어서, 폴리펩티드가 서열식별번호 28과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 폴리펩티드.
53. 대안 33에 있어서, 적어도 하나의 SARS-CoV-2 폴리펩티드 서열이 스파이크 (S) 폴리펩티드 및 NP 폴리펩티드를 포함하는 것인 폴리펩티드.
54. 대안 52에 있어서, S 폴리펩티드가 발현, 가용성, 및/또는 면역원성을 개선시키는 하나 이상의 돌연변이를 포함하는 것인 폴리펩티드.
55. 대안 53 또는 54에 있어서, S 폴리펩티드가 전체 S 단백질 (예컨대, NCBI 수탁 번호 YP_009724390에 제시된 바와 같음) 기준으로 K968P 또는 V987P 돌연변이, 또는 그 둘 모두를 포함하는 것인 폴리펩티드.
56. 대안 53-55 중 어느 한 대안에 있어서, S 폴리펩티드가 서열식별번호 56과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 폴리펩티드.
57. 대안 53-56 중 어느 한 대안에 있어서, N-말단 IgE 리더 폴리펩티드 서열을 추가로 포함하는 폴리펩티드.
58. 대안 57에 있어서, N-말단 IgE 리더 폴리펩티드 서열이 서열식별번호 44와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 폴리펩티드.
59. 대안 53-58 중 어느 한 대안에 있어서, 폴리펩티드가 서열식별번호 70과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 폴리펩티드.
60. 서열식별번호 29-31, 34-36, 74, 또는 76 중 어느 하나 이상과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 적어도 하나의 SARS-CoV-2 폴리펩티드를 포함하는 폴리펩티드.
61. 적어도 하나의 SARS-CoV-2 폴리펩티드 및 적어도 하나의 HDAg 폴리펩티드를 포함하는 폴리펩티드.
62. 대안 61에 있어서, 폴리펩티드가 서열식별번호 32와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 폴리펩티드.
63. 대안 62에 있어서, 적어도 하나의 P2A 자가촉매 폴리펩티드 절단 부위를 추가로 포함하는 폴리펩티드.
64. 대안 61 또는 63에 있어서, 폴리펩티드가 서열식별번호 33과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 폴리펩티드.
65. 대안 1-32 중 어느 한 대안에 있어서, 대상체, 바람직하게는 인간에서의 SARS-CoV-2 예방, 치료, 또는 억제를 위한 것과 같은 의약에서 사용하기 위한 핵산.
66. 대안 33-64 중 어느 한 대안에 있어서, 대상체, 바람직하게는 인간에서의 SARS-CoV-2 예방, 치료, 또는 억제를 위한 것과 같은 의약에서 사용하기 위한 폴리펩티드.
67. 대안 33-64 또는 66 중 어느 한 대안에 있어서, 폴리펩티드가 재조합적으로 발현되는 것인 폴리펩티드.
68. 대안 67에 있어서, 폴리펩티드가 포유동물, 박테리아, 효모, 곤충, 또는 무세포 시스템에서 재조합적으로 발현되는 것인 폴리펩티드.
69. (a) SARS-CoV-2 폴리펩티드를 코딩하는 적어도 하나의 핵산 서열을 포함하는 핵산; 또는
(b) 적어도 하나의 SARS-CoV-2 폴리펩티드를 포함하는 폴리펩티드, 또는 그 둘 모두를 포함하는, 면역원성 조성물 또는 생성물 조합물.
70. 대안 69에 있어서, SARS-CoV-2 폴리펩티드를 코딩하는 적어도 하나의 핵산 서열이
i) RBD 폴리펩티드를 코딩하는 핵산 서열;
ii) NP 폴리펩티드를 코딩하는 핵산 서열;
iii) M 폴리펩티드를 코딩하는 핵산 서열;
iv) HDAg 폴리펩티드를 코딩하는 핵산 서열;
v) P2A 자가촉매 폴리펩티드 절단 부위를 코딩하는 핵산 서열;
vi) IgE 리더 폴리펩티드를 코딩하는 핵산 서열; 또는
vii) S 폴리펩티드를 코딩하는 핵산 서열;
또는 그의 임의의 조합을 포함하는 것인 면역원성 조성물 또는 생성물 조합물.
71. 대안 69 또는 70에 있어서, 핵산이 대안 1-32 중 어느 한 대안의 핵산인 것인 면역원성 조성물 또는 생성물 조합물.
72. 대안 69-71 중 어느 한 대안에 있어서, 핵산이 서열식별번호 1-12 중 어느 하나 이상과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하며, 임의적으로 대상체, 예컨대 포유동물, 바람직하게는 인간에서의 SARS-CoV-2 예방, 치료, 또는 억제를 위한 것과 같은 의약에서 사용되는 면역원성 조성물 또는 생성물 조합물.
73. 대안 69-71 중 어느 한 대안에 있어서, 핵산이 인간에서의 발현을 위해 코돈 최적화된 것인 면역원성 조성물 또는 생성물 조합물.
74. 대안 73에 있어서, 핵산이 서열식별번호 13-24, 39-40, 57-63, 71, 73, 또는 75 중 어느 하나 이상과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하며, 임의적으로 대상체, 예컨대 포유동물, 바람직하게는 인간에서의 SARS-CoV-2 예방, 치료, 또는 억제를 위한 것과 같은 의약에서 사용되는 면역원성 조성물 또는 생성물 조합물.
75. 대안 69-74 중 어느 한 대안에 있어서, 적어도 하나의 SARS-CoV-2 폴리펩티드가
i) RBD 폴리펩티드 서열;
ii) NP 폴리펩티드 서열;
iii) M 폴리펩티드 서열;
iv) HDAg 폴리펩티드 서열;
v) P2A 자가촉매 폴리펩티드 절단 부위 서열;
vi) IgE 리더 폴리펩티드 서열; 또는
vii) S 폴리펩티드 서열;
또는 그의 임의의 조합을 포함하는 것인 면역원성 조성물 또는 생성물 조합물.
76. 대안 69-75 중 어느 한 대안에 있어서, 폴리펩티드가 대안 33-64 중 어느 한 대안의 폴리펩티드인 것인 면역원성 조성물 또는 생성물 조합물.
77. 대안 69-76 중 어느 한 대안에 있어서, 폴리펩티드가 서열식별번호 25-36, 41-42, 64-70, 72, 74, 또는 76 중 어느 하나 이상과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하며, 임의적으로 대상체, 예컨대 포유동물, 바람직하게는 인간에서의 SARS-CoV-2 예방, 치료, 또는 억제를 위한 것과 같은 의약에서 사용되는 면역원성 조성물 또는 생성물 조합물.
78. 대안 69-77 중 어느 한 대안에 있어서, 폴리펩티드가 재조합적으로 발현되는 것인 면역원성 조성물 또는 생성물 조합물.
79. 대안 78에 있어서, 폴리펩티드가 포유동물, 박테리아, 효모, 곤충, 또는 무세포 시스템에서 재조합적으로 발현되는 것인 면역원성 조성물 또는 생성물 조합물.
80. 대안 69-79 중 어느 한 대안에 있어서, 애주번트를 추가로 포함하는 면역원성 조성물 또는 생성물 조합물.
81. 대안 80에 있어서, 애주번트가 알룸 및/또는 QS21인 것인 면역원성 조성물 또는 생성물 조합물.
82. 대안 69-81 중 어느 한 대안에 있어서, 핵산이 재조합 벡터에 제공되는 것인 면역원성 조성물 또는 생성물 조합물.
83. a) 대상체에게 핵산을 포함하는 적어도 하나의 프라임 용량을 투여하는 단계;
b) 대상체에게 폴리펩티드를 포함하는 적어도 하나의 부스트 용량을 투여하는 단계를 포함하는,
대안 69-82 중 어느 한 대안에 기재된 면역원성 조성물 또는 생성물 조합물을 사용하여 대상체에서 면역 반응을 생성하고/거나, 중화 항체를 생성하는 방법.
84. 대안 83에 있어서, 적어도 하나의 부스트 용량이 애주번트를 추가로 포함하는 것인 방법.
85. 대안 84에 있어서, 애주번트가 알룸 및/또는 QS21인 것인 방법.
86. 대안 83-85 중 어느 한 대안에 있어서, 적어도 하나의 부스트 용량이 적어도 하나의 프라임 용량 투여 후 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 24, 36, 또는 48일 또는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 24, 36, 또는 48주, 또는 상기 언급된 시점 중 임의의 두 시점으로 정의된 시간 범위 이내에, 예컨대 1-48일 또는 1-48주 이내에 투여되는 것인 방법.
87. 대안 83-86 중 어느 한 대안에 있어서, 투여가 장내로, 경구로, 비내로, 비경구로, 피하로, 근육내로, 진피내로, 또는 정맥내로 또는 그의 임의의 조합으로, 및 임의적으로 생체내 전기천공과 함께 제공되는 것인 방법.
88. 대안 83-87 중 어느 한 대안에 있어서, 투여가 항바이러스 요법과 함께 수행되는 것인 방법.
89. 대안 88에 있어서, 항바이러스 요법이 덱사메타손, 파비피라비르, 파필라비르, 렘데시비르, 토실리주맙, 갈리데시비르, 사릴루맙, 로피나비르, 리토나비르, 다루나비르, 리바비린, 인터페론-α, PEG화된 인터페론-α, 인터페론 알파-2b, 회복기 혈청, 또는 그의 임의의 조합의 투여를 포함하는 것인 방법.
90. (a) SARS-CoV-2 폴리펩티드를 코딩하는 적어도 하나의 핵산 서열을 포함하는 핵산; 또는
(b) 적어도 하나의 SARS-CoV-2 폴리펩티드를 포함하는 폴리펩티드, 또는 그 둘 모두를 포함하는, SARS-CoV-2의 치료 또는 억제에서 사용하기 위한 면역원성 조성물 또는 생성물 조합물.
91. 대안 90에 있어서, SARS-CoV-2 폴리펩티드를 코딩하는 적어도 하나의 핵산 서열이
i) RBD 폴리펩티드를 코딩하는 핵산 서열;
ii) NP 폴리펩티드를 코딩하는 핵산 서열;
iii) M 폴리펩티드를 코딩하는 핵산 서열;
iv) HDAg 폴리펩티드를 코딩하는 핵산 서열;
v) P2A 자가촉매 폴리펩티드 절단 부위를 코딩하는 핵산 서열;
vi) IgE 리더 폴리펩티드를 코딩하는 핵산 서열; 또는
vii) S 폴리펩티드를 코딩하는 핵산 서열;
또는 그의 임의의 조합을 포함하는 것인, SARS-CoV-2의 치료 또는 억제에서 사용하기 위한 면역원성 조성물 또는 생성물 조합물.
92. 대안 91에 있어서, 핵산이 대안 1-32 중 어느 한 대안의 핵산인 것인, SARS-CoV-2의 치료 또는 억제에서 사용하기 위한 면역원성 조성물 또는 생성물 조합물.
93. 대안 90-92 중 어느 한 대안에 있어서, 핵산이 서열식별번호 1-12 중 어느 하나 이상과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인, SARS-CoV-2의 치료 또는 억제에서 사용하기 위한 면역원성 조성물 또는 생성물 조합물.
94. 대안 90-92 중 어느 한 대안에 있어서, 핵산이 인간에서의 발현을 위해 코돈 최적화된 것인, SARS-CoV-2의 치료 또는 억제에서 사용하기 위한 면역원성 조성물 또는 생성물 조합물.
95. 대안 94에 있어서, 핵산이 서열식별번호 13-24, 39-40, 57-63, 71, 73, 또는 75 중 어느 하나 이상과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인, SARS-CoV-2의 치료 또는 억제에서 사용하기 위한 면역원성 조성물 또는 생성물 조합물.
96. 대안 90-95 중 어느 한 대안에 있어서, 적어도 하나의 SARS-CoV-2 폴리펩티드가
i) RBD 폴리펩티드 서열;
ii) NP 폴리펩티드 서열;
iii) M 폴리펩티드 서열;
iv) HDAg 폴리펩티드 서열;
v) P2A 자가촉매 폴리펩티드 절단 부위 서열;
vi) IgE 리더 폴리펩티드 서열; 또는
vii) S 폴리펩티드 서열;
또는 그의 임의의 조합을 포함하는 것인, SARS-CoV-2의 치료 또는 억제에서 사용하기 위한 면역원성 조성물 또는 생성물 조합물.
97. 대안 90-96 중 어느 한 대안에 있어서, 폴리펩티드가 대안 33-64 중 어느 한 대안의 폴리펩티드인 것인, SARS-CoV-2의 치료 또는 억제에서 사용하기 위한 면역원성 조성물 또는 생성물 조합물.
98. 대안 90-97 중 어느 한 대안에 있어서, 폴리펩티드가 서열식별번호 25-36, 41-42, 64-70, 72, 74, 또는 76 중 어느 하나 이상과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인, SARS-CoV-2의 치료 또는 억제에서 사용하기 위한 면역원성 조성물 또는 생성물 조합물.
99. 대안 90-98 중 어느 한 대안에 있어서, 폴리펩티드가 재조합적으로 발현된 것인, SARS-CoV-2의 치료 또는 억제에서 사용하기 위한 면역원성 조성물 또는 생성물 조합물.
100. 대안 99에 있어서, 폴리펩티드가 포유동물, 박테리아, 효모, 곤충, 또는 무세포 시스템에서 재조합적으로 발현된 것인, SARS-CoV-2의 치료 또는 억제에서 사용하기 위한 면역원성 조성물 또는 생성물 조합물.
101. 대안 90-100 중 어느 한 대안에 있어서, 애주번트를 추가로 포함하는, SARS-CoV-2의 치료 또는 억제에서 사용하기 위한 면역원성 조성물 또는 생성물 조합물.
102. 대안 101에 있어서, 애주번트가 알룸 및/또는 QS21인 것인, SARS-CoV-2의 치료 또는 억제에서 사용하기 위한 면역원성 조성물 또는 생성물 조합물.
103. 대안 90-102 중 어느 한 대안에 있어서, 핵산이 재조합 벡터에 제공되는 것인, SARS-CoV-2의 치료 또는 억제에서 사용하기 위한 면역원성 조성물 또는 생성물 조합물.
104. IgE 리더 서열을 코딩하는 핵산, 바람직하게는 아미노산 서열 MDWTWILFLVAAATRVHS (서열식별번호 44)를 코딩하는 핵산, 또는 서열식별번호 43과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 IgE 리더 핵산 서열에 연결된 적어도 하나의 SARS-CoV-2 핵산 성분을 포함하거나, 본질적으로 그로 이루어지거나, 또는 그로 이루어진 핵산.
105. SARS-CoV-2 감염을 치료 또는 억제하는 의약을 포함한 의약으로서의, 대안 104의 핵산, 또는 그에 의해 코딩된 단백질의 용도.
상기 기술된 특징 이외에도, 추가적인 특징 및 변형은 하기의 도면 및 예시적인 실시양태의 설명으로부터 쉽게 명백해질 것이다. 이들 도면은 전형적인 실시양태를 도시한 것이며, 범주를 제한하는 것으로 의도되지 않는다는 것을 이해하여야 한다.
도 1은 예를 들어, 이종성 프라임-부스트 접근법을 사용하여 예컨대, 대상체에서 SARS-CoV-2의 예방, 치료, 또는 억제를 위한 의약으로서 사용될 수 있는 예시적인 재조합 면역원성 조성물을 도시한 것이다. 본원에 제시된 예시적인 조성물 중 임의의 것이 본원에 개시된 방법 또는 용도 중 임의의 것을 위해 사용될 수 있다.
도 2는 예를 들어, 이종성 프라임-부스트 접근법을 사용하여 예컨대, 대상체에서 SARS-CoV-2 (상이한 변이체 포함)의 예방, 치료, 또는 억제를 위한 의약으로서 사용될 수 있는 추가의 예시적인 재조합 면역원성 조성물을 도시한 것이다. 본원에 제시된 예시적인 조성물 중 임의의 것이 본원에 개시된 방법 또는 용도 중 임의의 것을 위해 사용될 수 있다.
도 3a-b는 본원에 개시된 예시적인 SARS-CoV-2 구축물을 이용한 BALB/c 및 C57BL/6 마우스의 면역화를 도시한 것이다. 도 3a는 RBD 및 S 단백질에 대한 마우스 혈청의 종점 ELISA를 보여주는 것이다. 도 3b는 면역화된 마우스로부터의 혈청을 이용한 시험관내 SARS-CoV-2 바이러스 중화를 보여주는 것이다.
도 4는 ELISpot에 의해 검출된, SARS-CoV-2 RBD, M, 및 NP 단백질을 커버하는 펩티드 풀에 대한 면역화된 마우스의 T 세포 반응을 도시한 것이다.
도 5a는 OC-2.3 DNA 및 QS21 애주번트와 함께 재조합 S 단백질 (rS/QS21)을 이용하여 프라임/부스트 접근법으로 면역화된 마우스에서의 항-S 단백질 항체 역가를 도시한 것이다. 시험된 조합은 1) OC-2.3 DNA 프라임 및 rS/QS21 단백질 부스트; 2) OC-2.3 DNA 프라임 및 OC-2.3 DNA 부스트, 3) rS/QS21 단백질 프라임 및 rS/QS21 단백질 부스트; 및 4) rS/QS21 단백질 프라임 및 OC-2.3 DNA 부스트였다.
도 5b는 SARS-CoV-2 RBD, M, 또는 NP 단백질, 또는 전장의 RBD, M, 또는 NP 단백질을 커버하는 펩티드 풀에 대한, 도 5a의 프라임/부스트 접근법으로 면역화된 마우스로부터의 T 세포 반응을 도시한 것이다.
도 6a는 OC-2.3 DNA로 면역화된 토끼에서 500, 1000, 또는 1500 ㎍의 DNA를 투여받았을 때의 제1 용량 (2주째) 또는 제2 용량 (5주째) 후 2주째에 시험된 항-S 단백질 항체 역가를 도시한 것이다.
도 6b는 2회의 1000 ㎍ 용량 후 0주 또는 5주째에 시험된 OC-2.3 DNA로 면역화된 사이노몰구스 마카크(cynomolgus macaque)에서의 항-S 또는 항-NP (N) 단백질 항체 역가를 도시한 것이다.
도 6c는 OC-2.3 DNA 또는 대조군 DNA로 면역화된 사이노몰구스 마카크에서의 SARS-CoV-2 챌린지 후 4 또는 20일째 SARS-CoV-2 RNA의 정량화를 도시한 것이다.
하기 상세한 설명에서, 그 일부를 형성하는 첨부 도면을 참조한다. 도면에서 유사한 기호는 문맥상 달리 명시되지 않는 한, 전형적으로 유사한 구성요소를 식별한다. 상세한 설명, 도면 및 청구범위에 기술된 예시적인 실시양태는 제한을 의미하지 않는다. 본원에 제시된 대상의 정신 또는 범주를 벗어남 없이, 다른 실시양태가 이용될 수 있고, 다르게 변경될 수 있다. 본원에 일반적으로 기술되고, 도면에서 예시된 바와 같이, 본 개시내용의 측면은 매우 다양한 상이한 구성으로 배열, 치환, 조합, 분리 및 디자인될 수 있으며, 이들 모두 본원에서 명시적으로 고려된다는 것을 쉽게 이해할 것이다.
정의
달리 정의되지 않는 한, 본원에서 사용된 모든 기술 및 과학 용어는 관련 기술분야의 통상의 기술자가 일반적으로 이해하는 것과 동일한 의미를 갖는다. 본원에서 언급된 모든 특허, 출원, 공개된 출원 및 다른 공개문헌은 달리 언급되지 않는 한, 그 전문이 본원에서 명시적으로 참조로 포함된다. 본원의 용어에 대한 정의가 복수로 존재하는 경우, 달리 언급되지 않는 한, 본 섹션의 정의가 우선한다.
본원에서 "하나"라는 단수형태는 단수형태의 하나, 또는 하나 초과의 (예를 들어, 적어도 하나의) 문법상 대상을 지칭하는 것으로 사용된다. 예로서, "요소"는 하나의 요소 또는 하나 초과의 요소를 의미한다.
"약" 또는 "대략"이라는 용어는 기준 양, 수준, 값, 수치, 빈도, 백분율, 치수, 크기, 양, 중량 또는 길이에 대해 30, 25, 20, 15, 10, 9, 8, 7, 6, 5, 4, 3, 2 또는 1%만큼 다른 양, 수준, 값, 수치, 빈도, 백분율, 치수, 크기, 양, 중량 또는 길이를 지칭한다.
본 명세서 전역에 걸쳐, 문맥상 달리 요구되지 않는 한, " 포함하다(comprise)", "포함하다(comprises)" 및 "포함하는"이라는 단어는 언급된 단계 또는 요소 또는 단계 또는 요소의 군을 포함하고, 임의의 다른 단계 또는 요소 또는 단계 또는 요소의 군은 배제시키는 것으로 이해될 것이다.
"~으로 이루어진"은 "~으로 이루어진"이라는 어구 뒤에 오는 모든 것을 포함하고, 이에 제한되는 것을 의미한다. 따라서, "~으로 이루어진"이라는 어구는 열거된 요소가 요구되거나, 또는 필수적이고, 다른 요소는 존재하지 않을 수 있다는 것을 나타낸다. "본질적으로 ~으로 이루어진"은 상기 어구 뒤에 열거된 임의의 요소를 포함하고, 본 개시내용에서 열거된 요소에 대해 명시된 활성 또는 작용을 방해하거나, 또는 그에 기여하지 않는 다른 요소로 제한되는 것을 의미한다. 따라서, "본질적으로 ~으로 이루어진"이라는 어구는 열거된 요소가 요구되거나, 또는 필수적이지만, 다른 요소는 임의적이고, 열거된 요소의 활성 또는 작용에 실질적으로 영향을 미치는지 여부에 따라 존재할 수 있거나, 또는 존재하지 않을 수 있다는 것을 나타낸다.
달리 정의되지 않는 한, 본원에서 사용된 모든 기술 및 과학 용어는 본 개시내용이 속하는 관련 기술분야의 통상의 기술자가 일반적으로 이해하는 것과 동일한 의미를 갖는다. 본원에서 용어에 대한 정의가 여러 개 있는 경우, 달리 명시되지 않는 한, 이 섹션의 정의가 우선한다. 본 개시내용의 실시는 구체적으로 달리 명시되지 않는 한, 관련 기술분야의 기술 범위 내에서 분자 생물학 및 재조합 DNA 기술의 통상적인 방법을 사용할 것이며, 이들 중 다수는 예시 목적으로 하기에 기재되어 있다.
본원에서 사용되는 바, 용어 "개체", "대상체" 또는 "환자"는 인간 또는 비인간 포유동물, 예컨대 개, 고양이, 마우스, 래트, 소, 양, 돼지, 염소, 비인간 영장류, 또는 조류, 예컨대 닭 뿐만 아니라, 다른 척추동물 또는 무척추동물을 의미한다.
"포유동물"이라는 용어는 그의 일반적인 생물학적 의미로 사용된다. 따라서, 이는 구체적으로 유인원 (침팬지, 유인원, 원숭이) 및 인간을 포함한 영장류, 소, 말, 양, 염소, 돼지, 토끼, 개, 고양이, 설치류, 래트, 마우스, 기니아 피그 등을 포함하나, 이에 제한되지 않는다.
본원에 기술된 일부 실시양태는 유효량의 본원에 기술된 올리고뉴클레오티드, 단백질, 또는 그 둘 모두 및 제약상 허용되는 담체, 부형제, 또는 그의 조합을 포함하거나, 본질적으로 그로 이루어지거나, 또는 그로 이루어진 제약 조성물에 관한 것이다. 본원에 기술된 제약 조성물은 인간 및/또는 수의학적 적용에 적합하다.
본원에서 사용된 바, "기능" 및 "기능성"이라는 용어는 생물학적, 효소적 또는 치료적 기능을 지칭한다.
본원에서 사용된 바, "단리된"이라는 용어는 보통 그의 천연 상태에서 그를 수반하는 구성요소가 실질적으로 또는 본질적으로 없는 물질을 지칭한다. 예를 들어, 본원에서 사용된 바, "단리된 세포"는 그의 자연적으로 발생된 상태의 환경 또는 유기체로부터 정제된 세포, 대상체로부터 또는 배양물로부터 제거된 세포를 포함하며, 예를 들어, 이는 생체내 또는 시험관내 물질과 유의적으로 회합되어 있지 않다.
"유효량" 또는 "유효 용량"이라는 용어는 명시된 생물학적 또는 의학적 반응을 유발하는 활성 화합물 또는 제약 제제의 양을 나타내는 데 사용된다. 예를 들어, 화합물의 유효량은 질환의 증상을 완화 또는 호전시키거나, 또는 치료받는 대상체의 생존을 연장시키는 데 필요한 양일 수 있다. 이 반응은 조직, 시스템, 동물 또는 인간에서 발생할 수 있으며, 치료되는 질환의 징후 또는 증상의 완화를 포함한다. 유효량의 결정은 본원에 제공된 개시내용을 고려하여 관련 기술분야의 통상의 기술자의 능력 범위 내에 있다. 용량으로서 요구되는 본원에 개시된 화합물의 유효량은 투여 경로, 치료받는 동물의 유형 (인간 포함), 및 고려 중인 특정 동물의 신체적 특징에 따라 달라질 것이다. 용량은 원하는 효과를 달성하도록 맞춤화될 수 있지만, 체중, 식이, 동시 약물 및 의료 분야의 숙련가가 인식할 다른 인자와 같은 인자에 따라 달라질 것이다.
용어 "제약상 허용되는 염"은 제한 없이, 진통제, 치료제, 다른 물질 등을 포함한, 조성물의 비교적 비독성, 무기 및 유기산, 또는 염기 부가 염을 포함한다. 제약상 허용되는 염의 예로는 예컨대, 염산, 황산과 같은 무기산으로부터 유도된 것과 예컨대, 에탄술폰산, 벤젠술폰산, p-톨루엔술폰산 등과 같은 유기산으로부터 유도된 것을 포함한다. 염 형성에 적합한 무기 염기의 예는 암모니아, 나트륨, 리튬, 칼륨, 칼슘, 마그네슘, 알루미늄, 아연 등의 인산염, 수산화물, 탄산염 및 중탄산염을 포함한다. 염은 또한 그러한 염을 형성하기에 충분히 강하고 비독성인 것을 포함하는 적합한 유기 염기로 형성될 수 있다. 예를 들어, 이러한 유기 염기의 부류로는 메틸아민, 디메틸아민 및 트리에틸아민을 포함하는 모노-, 디- 및 트리알킬아민; 모노-, 디- 및 트리에탄올아민을 포함하는 모노-, 디- 또는 트리히드록시알킬아민; 글리신, 아르기닌 및 리신을 포함하는 아미노산; 구아니딘; N-메틸글루코사민; N-메틸글루카민; L-글루타민; N-메틸피페라진; 모르폴린; 에틸렌디아민; N-벤질펜에틸아민; 또는 트리히드록시메틸 아미노에탄을 포함할 수 있지만, 이에 제한되지 않는다.
본원에서 상호교환적으로 사용되는 바, "제제", "제약 조성물", 및 "조성물"은 대상체에 투여하기 위한 물질의 조성물을 지칭하는 등가 용어이다.
"제약상 허용되는"이라는 용어는 대상체, 및 특히, 인간에 대한 요법과 화합성을 나타낸다는 것을 의미한다.
"작용제"라는 용어는 생물학적 활성을 갖고, 요법에 사용될 수 있는 활성제를 지칭한다. 또한, "작용제"는 "적어도 하나의 작용제", "화합물" 또는 "적어도 하나의 화합물"과 동의어일 수 있으며, 작용제의 임의의 형태, 예컨대 그의 유도체, 유사체, 염 또는 프로드럭을 지칭할 수 있다. 작용제는 다양한 형태, 분자 복합체의 성분, 및 제약상 허용되는 염 (예컨대, 히드로클로라이드, 히드로브로마이드, 술페이트, 포스페이트, 니트레이트, 보레이트, 아세테이트, 말레에이트, 타르트레이트, 및 살리실레이트)으로 존재할 수 있다. 용어 "작용제"는 또한 임의의 제약 분자 또는 화합물, 치료 분자 또는 화합물, 매트릭스 형성 분자 또는 화합물, 중합체, 합성 분자 및 화합물, 천연 분자 및 화합물, 및 그의 임의의 조합을 지칭할 수 있다.
적절한 제제는 선택된 투여 경로에 의존한다. 본원에 기술된 화합물의 제제화 및 투여 기술은 관련 기술분야의 통상의 기술자에게 공지되어 있다. 장내, 경구, 직장, 국소, 설하, 협측, 귀내, 경막외, 피부외, 에어로졸, 비경구, 근육내, 피하, 동맥내, 정맥내, 문맥내, 관절내, 진피내, 복강, 골수내 주사, 척추강내, 직접 뇌실내, 복강내, 비내 또는 안구내 주사를 포함하나, 이에 제한되지 않는, 화합물을 투여하는 다양한 기술이 관련 기술분야에 존재한다. 제약 조성물은 일반적으로 특정 의도된 투여 경로에 맞게 맞춤화될 것이다. 본원에 기술된 제약 조성물은 또한 예컨대, T 세포, 자연 살해 세포, B 세포, 대식세포, 림프구, 줄기 세포, 골수 세포 또는 조혈 줄기 세포와 같은 다른 요법과 함께 대상체에게 투여될 수 있다
제약 화합물은 또한 예를 들어, 종종 데포 또는 서방성 제제로 기관, 조직 또는 감염 부위에 화합물을 직접 주사함으로써 전신 방식보다는 국부적으로 투여될 수 있다. 추가로, 표적화된 약물 전달 시스템, 예를 들어, 조직 특이적 항체로 코팅된 리포솜으로 화합물을 투여할 수 있다. 리포솜은 기관, 조직, 암, 종양 또는 감염 부위로 표적화되고, 그에 의해 선택적으로 흡수될 수 있다.
본원에 개시된 제약 조성물은 예컨대, 통상적인 혼합, 용해, 과립화, 당의정 제조, 분쇄, 유화, 캡슐화, 포획 또는 정제화 프로세스에 의해 자체 공지된 방식으로 제조될 수 있다. 본원에 기술된 바와 같이, 제약 조성물에 사용되는 화합물은 제약상 양립가능한 반대이온과의 염으로서 제공될 수 있다
본원에서 사용되는 바, "담체"는 세포, 조직 및/또는 신체 기관으로의 화합물의 통과, 전달 및/또는 혼입을 촉진하는 화합물, 입자, 고체, 반고체, 액체 또는 희석제를 지칭한다. 예를 들어, 제한 없이, 지질 나노입자 (LNP)는 올리고뉴클레오티드를 캡슐화하여 혈류를 통과하는 동안 분해로부터 올리고뉴클레오티드를 보호하고/거나, 원하는 기관, 예컨대 간으로의 전달을 촉진할 수 있는 담체 유형이다.
본원에서 사용되는 바, "희석제"는 약리학적 활성은 없지만, 제약상 필요하거나, 또는 바람직할 수 있는 제약 조성물 중의 성분을 지칭한다. 예를 들어, 희석제는 제조 및/또는 투여를 위해 질량이 너무 작은 강력한 약물의 벌크를 증가시키는 데 사용될 수 있다. 또한 주사, 섭취 또는 흡입에 의해 투여되는 약물의 용해를 위한 액체일 수 있다. 관련 기술분야 에서 일반적인 형태의 희석제는 예컨대, 제한 없이, 인간 혈액의 오스몰농도 및/또는 조성을 모방하는 포스페이트 완충처리된 염수와 같은 완충처리된 수용액이다.
용어 "부형제"는 본 명세서에 비추어 이해되는 바와 같은 그의 일반적인 의미를 가지며, 이는 제한 없이, 벌크, 일관성, 안정성, 결합 능력, 활택성, 붕해 능력 등을 조성물에 제공하기 위해 제약 조성물에 첨가되는 불활성 물질(substance), 화합물, 또는 물질(material)을 지칭한다. 본원에 기술된 제제 중 임의의 하나 이상에 포함될 수 있는, 바람직한 특성을 갖는 부형제는 보존제, 애주번트, 안정화제, 용매, 완충제, 희석제, 가용화제, 계면활성제(detergent), 계면활성제(surfactant), 킬레이트제, 항산화제, 알콜, 케톤, 알데히드, 에틸렌디아민테트라아세트산 (EDTA), 시트르산, 염, 염화나트륨, 중탄산나트륨, 인산나트륨, 붕산나트륨, 시트르산나트륨, 염화칼륨, 인산칼륨, 황산마그네슘 당, 덱스트로스, 덱스트란, 프럭토스, 만노스, 락토스, 갈락토스, 수크로스, 소르비톨, 셀룰로스, 메틸 셀룰로스, 히드록시프로필 메틸 셀룰로스 (히프로멜로스), 글리세린, 폴리비닐 알콜, 포비돈, 프로필렌 글리콜, 혈청, 아미노산, 폴리에틸렌글리콜, 폴리소르베이트 20, 폴리소르베이트 80, 소듐 데옥시콜레이트, 소듐 타우로데옥시콜레이트, 스테아르산마그네슘, 옥틸페놀 에톡실레이트, 벤제토늄 클로라이드, 티메로살, 젤라틴, 에스테르, 에테르, 2-페녹시에탄올, 우레아 또는 비타민, 또는 그의 임의의 조합을 포함하나, 이에 제한되지 않는다. 부형제 양은 제약 조성물 중에서 0% w/w, 0.1% w/w, 0.2% w/w, 0.3% w/w, 0.4% w/w, 0.5% w/w, 0.6% w/w, 0.7% w/w, 0.8% w/w, 0.9% w/w, 1% w/w, 2% w/w, 3% w/w, 4% w/w, 5% w/w, 6% w/w, 7% w/w, 8% w/w, 9% w/w, 10% w/w, 20% w/w, 30% w/w, 40% w/w, 50% w/w, 60% w/w, 70% w/w, 80% w/w, 90% w/w, 95% w/w, 100% w/w 또는 상기 언급된 수치 중 임의의 두 수치로 정의된 범위 내의 임의의 중량%로 발견될 수 있다.
본원에서 사용되는 바, 용어 "애주번트"는 면역 반응을 자극시키고, 방어 면역의 효능을 증가시키고, 면역원성 항원, 에피토프, 또는 조성물과 함께 투여되는 물질(substance), 화합물, 또는 물질(material)을 지칭한다. 애주번트는 항원의 지속적인 방출, 시토카인 및 케모카인의 상향조절, 투여 부위에서의 세포 동원, 항원 제시 세포에서의 항원 흡수 및 제시 증가, 또는 항원 제시 세포 및 인플라마솜의 활성화를 가능하게 함으로써 면역 반응을 개선시키는 역할을 한다. 본원에 기술된 제제 중 임의의 하나 이상에 포함될 수 있는, 일반적으로 사용되는 애주번트로는 알룸, 알루미늄 염, 황산알루미늄, 수산화알루미늄, 인산알루미늄, 수산화인산칼슘, 황산알루미늄칼륨, 오일, 광유, 파라핀 오일, 수중유 에멀젼, 계면활성제, MF59®, 스쿠알렌, AS03, α-토코페롤, 폴리소르베이트 80, AS04, 모노포스포릴 지질 A, 바이로솜, 핵산, 폴리이노신:폴리시티딜산, 사포닌, QS-21, 단백질, 플라겔린, 시토카인, 케모카인, IL-1, IL-2, IL-12, IL-15, IL-21, 이미다조퀴놀린, CpG 올리고뉴클레오티드, 지질, 인지질, 디올레오일 포스파티딜콜린 (DOPC), 트레할로스 디마이콜레이트, 펩티도글리칸, 박테리아 추출물, 지질다당류, 또는 프로인트(Freund) 애주번트, 또는 그의 임의의 조합을 포함하나, 이에 제한되지 않는다.
본원에서 사용된 바, 임의의 주어진 물질, 화합물 또는 물질의 "순도"라는 용어는 예상 존재비 대비 상기 물질, 화합물 또는 물질의 실제 존재비를 지칭한다. 예를 들어, 물질, 화합물 또는 물질은 적어도 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 또는 100% (그 사이의 소수 포함) 순수할 수 있다. 순도는 부산물, 이성질체, 거울상 이성질체, 분해 생성물, 용매, 담체, 비히클, 오염물질 또는 그의 임의의 조합을 포함하나, 이에 제한되지 않는 원치않는 불순물에 의해 영향을 받을 수 있다. 순도는 크로마토그래피, 액체 크로마토그래피, 기체 크로마토그래피, 분광법, UV-가시광선 분광분석법, 적외선 분광분석법, 질량 분광분석법, 핵 자기 공명, 중량 측정법, 또는 적정, 또는 그의 임의의 조합을 포함하나, 이에 제한되지 않는 기술에 의해 측정될 수 있다.
본원에 개시된 일부 실시양태는 그를 필요로 하는 대상체 또는 환자를 선택하는 것에 관한 것이다. 일부 실시양태에서, 바이러스 감염, 예컨대 SARS-CoV-2에 대한 면역원성을 필요로 하는 환자가 선택된다. 일부 실시양태에서, SARS-CoV-2 감염을 앓는 것으로, 또는 바이러스 감염, 예컨대 SARS-CoV-2 치료를 필요로 하는 것으로 확인된 환자가 선택된다. 일부 실시양태에서, 이전에 바이러스 감염, 예컨대 SARS-CoV-2에 대한 치료를 받았던 환자가 선택된다. 일부 실시양태에서, 이전에 바이러스 감염, 예컨대 SARS-CoV-2 위험에 대한 치료를 받았던 환자가 선택된다. 일부 실시양태에서, 바이러스 감염, 예컨대 SARS-CoV-2가 재발된 환자가 선택된다. 일부 실시양태에서, 바이러스 감염, 예컨대 SARS-CoV-2에 대한 요법에 대한 내성이 발생한 환자가 선택된다. 일부 실시양태에서, 상기 언급된 선택 기준의 임의의 조합을 가질 수 있는 환자가 선택된다. 상기와 같은 선택은 대상체의 임상 및 진단 평가, 또는 그 둘 모두의 조합에 의해 이루어질 수 있다.
본원에서 사용되는 바, "치료하다", "치료하는", "치료", "치료적" 또는 "요법"이라는 용어는 본 명세서에 비추어 이해되는 바와 같은 그의 일반적인 의미를 가지며, 반드시 질환 또는 병태의 완전한 치유 또는 폐지를 의미하는 것은 아니다. 본원에서 사용되는 바 (및 관련 기술분야에서 널리 이해되고 있는 바와 같이), "치료하는" 또는 "치료"라는 용어는 또한 임상 결과를 포함하여 대상체의 병태에서 유익하거나, 또는 원하는 결과를 얻기 위한 접근법을 의미한다. 유익하거나, 또는 원하는 임상 결과는 하나 이상의 증상 또는 병태의 완화 또는 호전, 질환의 정도 감소, 질환 상태의 안정화 (즉, 악화되지 않음), 질환 전파 또는 확산 방지, 질환 진행의 확산, 지연 또는 저속화, 질환 상태의 호전 또는 경감, 질환 재발의 감소, 및 (부분적이든 전체적이든, 검출가능하든 검출불가능하든) 관해를 포함할 수 있지만, 이에 제한되지 않는다. 본원에서 사용되는 바, "치료하는" 또는 "치료"는 모두는 아니지만, 일부 맥락에서, 예방적 치료를 포함할 수 있다. 치료 방법은 대상체에게 치료 유효량의 활성제를 투여하는 단계를 포함한다. 투여 단계는 단일 투여로 이루어질 수 있거나, 또는 연속 투여를 포함할 수 있다. 조성물은 환자를 치료하기에 충분한 양으로 및 그러한 기간 동안 대상체에게 투여된다. 치료 기간의 길이는 다양한 인자, 예컨대 병태의 중증도, 환자의 연령 및 유전적 프로파일, 활성제 농도, 치료에 사용되는 조성물의 활성, 또는 그의 조합에 의존한다. 또한, 치료 또는 예방에 사용되는 작용제의 유효 투여량은 특정 치료 또는 예방 요법의 과정에 걸쳐 증가 또는 감소될 수 있다는 것을 이해할 것이다. 투여량의 변경은 관련 기술분야에 공지된 표준 진단 검정법에 의해 야기될 수 있고, 명백해질 수 있다. 일부 경우에, 만성 투여가 필요할 수 있다. "예방적 치료"라는 용어는 아직 질환 또는 병태의 증상을 나타내지 않지만, 특정 질환 또는 병태에 민감하거나, 그의 위험이 있는 대상체를 치료하여 환자에서 질환 또는 병태가 발생할 가능성을 감소시키는 것을 지칭한다. "치료적 치료"라는 용어는 질환 또는 병태를 이미 앓고 있거나, 발병 중인 대상체에게 치료를 투여하는 것을 지칭한다.
본원에서 사용되는 바, "억제하다"라는 용어는 본 명세서에 비추어 이해되는 바와 같은 그의 일반적인 의미를 가지며, 예컨대 SARS-CoV-2와 같은 바이러스 감염의 감소를 지칭할 수 있다. 감소는 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 100%, 또는 상기 언급된 값 중 임의의 두 값으로 정의된 범위 이내의 양만큼 이루어질 수 있다. 본원에서 사용되는 바, "지연시키다"라는 용어는 본 명세서에 비추어 이해되는 바와 같은 그의 일반적인 의미를 가지며, 예컨대 바이러스 감염과 같은 이벤트를 그렇지 않았다면 예상되는 시간보다 후속 시점으로 저속화, 연기, 또는 유예시키는 것을 지칭한다. 지연은 0%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 또는 상기 언급된 값 중 임의의 두 값으로 정의된 범위 이내의 양만큼의 지연일 수 있다. 억제하다 및 지연시키다라는 용어는 반드시 100% 억제 또는 지연을 나타내는 것은 아닐 수 있다. 부분 억제 또는 지연이 실현될 수 있다.
본원에서 사용되는 바, 용어 "면역원성 조성물"은 숙주에 투여되었을 때, 면역 반응을 유도하도록 의도된, 항원, 에피토프, 핵산, 펩티드, 폴리펩티드, 단백질, 다당류, 지질, 합텐, 톡소이드, 불활성화된 유기체, 또는 약독화된 유기체, 또는 그의 임의의 조합을 포함하나, 이에 제한되지 않는, 물질 또는 물질들의 혼합물을 지칭한다. 면역 반응은 선천성 면역 반응 및 후천성 면역 반응, 둘 모두를 포함하며, 후자는 예컨대, 기억 T 세포 및 기억 B 세포와 같은 세포를 통해 지속적인 면역학적 기억을 확립한다. 면역원성 조성물에 대한 초기 면역 반응 동안 생성된 항체는 동일한 항원, 에피토프, 핵산, 펩티드, 폴리펩티드, 단백질, 다당류, 지질, 합텐, 톡소이드, 불활성화된 유기체 또는 약독화된 유기체, 또는 항원, 에피토프, 핵산, 펩티드, 폴리펩티드, 단백질, 다당류, 지질, 합텐, 또는 톡소이드, 또는 그의 임의의 조합을 나타내는 살아있는 유기체 또는 병원체의 후속 챌린지에서 생성될 수 있다. 이러한 방식으로, 면역원성 조성물은 특정 병원체에 대한 백신 역할을 할 수 있다. 면역원성 조성물은 또한 면역 반응을 자극시키고, 방어호 면역의 효능을 증가시키기 위해 하나 이상의 애주번트도 포함할 수 있다.
본원에서 사용되는 바, 용어 "생성물 조합물"은 통합 기능을 위해 함께 사용할 수 있는 2개 이상의 개별 화합물, 물질(substance), 물질(material), 또는 조성물 세트를 지칭한다. 일부 실시양태에서, 생성물 조합물은 숙주에 투여되었을 때, 임의적으로, 오직 단 하나의 조성물 타입만이 투여된 경우에 유도되는 것보다 더 큰 정도로 면역 반응을 유도하기 위해 함께 사용되는 적어도 하나의 핵산 조성물 및 적어도 하나의 폴리펩티드 조성물을 포함한다.
본원에서 사용되는 바, 용어 "핵산" 또는 "핵산 분자"는 폴리뉴클레오티드, 예컨대 데옥시리보핵산 (DNA) 또는 리보핵산 (RNA), 올리고뉴클레오티드, 중합효소 연쇄 반응 (PCR)에 의해 생성된 단편, 및 라이게이션, 절단, 엔도뉴클레아제 작용 및 엑소뉴클레아제 작용 중 임의의 것에 의해 생성된 단편을 지칭한다. 핵산 분자는 자연적으로 발생된 뉴클레오티드인 단량체 (예컨대, DNA 및 RNA), 또는 자연적으로 발생된 뉴클레오티드의 유사체 (예컨대, 자연적으로 발생된 뉴클레오티드의 거울상 이성질체 형태), 또는 그 둘 모두의 조합으로 구성될 수 있다. 변형된 뉴클레오티드는 당 모이어티 및/또는 피리미딘 또는 퓨린 염기 모이어티에서 변경을 가질 수 있다. 당 변형은 예를 들어, 하나 이상의 히드록실 기의 할로겐, 알킬 기, 아민 및 아지도 기로의 대체를 포함하거나, 또는 당은 에테르 또는 에스테르로서 관능화될 수 있다. 더욱이, 전체 당 모이어티는 입체 및 전자적으로 유사한 구조, 예컨대 아자-당 및 카르보시클릭 당 유사체로 대체될 수 있다. 염기 모이어티에서의 변형의 예는 알킬화된 퓨린 및 피리미딘, 아실화된 퓨린 또는 피리미딘, 또는 널리 공지된 다른 헤테로시클릭 치환체를 포함한다. 핵산 단량체는 포스포디에스테르 결합 또는 이러한 결합의 유사체에 의해 연결될 수 있다. 포스포디에스테르 결합의 유사체는 포스포로티오에이트, 포스포로디티오에이트, 포스포로셀레노에이트, 포스포로디셀레노에이트, 포스포로아닐로티오에이트, 포스포라닐리데이트 또는 포스포라미데이트를 포함한다. 용어 "핵산 분자"는 또한 폴리아미드 백본에 부착된 자연적으로 발생된 또는 변형된 핵산 염기를 포함하는 소위 "펩티드 핵산"을 포함한다. 핵산은 단일 가닥 또는 이중 가닥일 수 있다. "올리고뉴클레오티드"는 핵산과 상호교환적으로 사용될 수 있으며, 이중 가닥 또는 단일 가닥 DNA 또는 RNA를 지칭할 수 있다. 핵산 또는 핵산들은 다양한 생물학적 시스템에서의 핵산 또는 핵산들의 증폭 및/또는 발현을 위해 사용될 수 있는 핵산 벡터 또는 핵산 구축물 (예컨대, 플라스미드, 바이러스, 박테리오파지, 코스미드, 포스미드, 파지미드, 박테리아 인공 염색체 (BAC), 효모 인공 염색체 (YAC), 또는 인간 인공 염색체 (HAC))에 함유될 수 있다. 전형적으로, 벡터 또는 구축물은 또한 프로모터, 인핸서, 종결인자, 유도인자, 리보솜 결합 부위, 번역 개시 부위, 시작 코돈, 정지 코돈, 폴리아데닐화 신호, 복제 기점, 클로닝 부위, 다중 클로닝 부위, 제한 효소 부위, 에피토프, 리포터 유전자, 선별 마커, 항생제 선별 마커, 표적화 서열, 펩티드 정제 태그, 또는 부속 유전자, 또는 그의 임의의 조합을 포함하나, 이에 제한되지 않는 요소를 함유할 것이다.
핵산 또는 핵산 분자는 상이한 펩티드, 폴리펩티드, 또는 단백질을 코딩하는 하나 이상의 서열을 포함할 수 있다. 이들 하나 이상의 서열은 동일한 핵산 또는 핵산 분자에서 인접하게, 또는 그 사이에 추가 핵산, 예컨대 링커, 반복부 또는 제한 효소 부위, 또는 길이가 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 150, 200, 또는 300개의 염기 길이, 또는 상기 언급된 길이 중 임의의 두 길이로 정의된 범위 내의 임의의 길이인 임의의 다른 서열과 함께 연결될 수 있다. 본원에서 사용되는 바, 핵산 상의 "하류"라는 용어는 핵산이 이중 가닥이라면, 코딩 서열을 함유하는 가닥 (센스 가닥) 상에서 이전 서열의 3'-말단 뒤에 있는 서열을 지칭한다. 본원에서 사용되는 바, 핵산 상의 "상류"라는 용어는 핵산이 이중 가닥이라면, 코딩 서열을 함유하는 가닥 (센스 가닥) 상에서 후속 서열의 5'-말단 앞에 있는 서열을 지칭한다. 본원에서 사용되는 바, 핵산 상에서 "그룹화된"이라는 용어는 2개 이상의 서열이 인접하게 직접적으로 또는 그 사이에 추가 핵산, 예컨대 링커, 반복부 또는 제한 효소 부위, 또는 길이가 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 150, 200, 또는 300개의 염기 길이, 또는 상기 언급된 길이 중 임의의 두 길이로 정의된 범위 내의 임의의 길이인 임의의 다른 서열과 함께, 그러나, 일반적으로는 그 사이에 기능성 또는 촉매성 폴리펩티드, 단백질, 또는 단백질 도메인을 코딩하는 서열은 없이 존재하는 것을 지칭한다.
본원에서 사용되는 바, 핵산과 관련하여 "코돈 최적화된"이라는 용어는 표적 세포 세포질에서의 종 특이적 코돈 사용 편향 및 각 아미노아실-tRNA의 상대적인 이용가능성에 기초하여 폴리펩티드 서열을 변경하지 않고 특정 종의 숙주에서 번역을 증진시키거나, 또는 최대화하기 위해 핵산의 코돈을 치환하는 것을 지칭한다. 코돈 최적화 및 이러한 최적화를 수행하는 기술은 관련 기술분야에 공지되어 있다. 코돈 최적화를 위한 알고리즘을 포함하는 프로그램은 관련 기술분야의 통상의 기술자에게 공지되어 있다. 프로그램은 예를 들어, 옵티멈진(OptimumGene), 진GPS(GeneGPS)® 알고리즘 등을 포함할 수 있다. 추가로, 합성 코돈 최적화된 서열은 예를 들어, 인터그레이티드 DNA 테크놀러지즈(Integrated DNA Technologies) 및 다른 상업적으로 이용가능한 DNA 시퀀싱 서비스로부터 상업적으로 수득할 수 있다. 관련 기술분야의 통상의 기술자는 유전자 발현 수준은 예컨대, 프로모터 서열 및 조절 요소와 같은 많은 인자에 의존한다는 것을 이해할 것이다. 대부분의 박테리아에 대해 언급된 바와 같이, 코돈의 작은 서브세트는 tRNA 종에 의해 인식되어 번역 선택으로 이어지며, 이는 단백질 발현에 중요한 제한이 될 수 있다. 이러한 측면에서, 많은 합성 유전자가 그들의 단백질 발현 수준을 증가시키도록 디자인될 수 있다.
본원에 기술된 핵산은 핵염기를 포함한다. 1차, 정규, 천연 또는 비변형된 염기는 아데닌, 시토신, 구아닌, 티민 및 우라실이다. 다른 핵염기로는 퓨린, 피리미딘, 변형된 핵염기, 5-메틸시토신, 슈도우리딘, 디히드로우리딘, 이노신, 7-메틸구아노신, 히포크산틴, 크산틴, 5,6-디히드로우라실, 5-히드록시메틸시토신, 5-브로모우라실, 이소구아닌, 이소시토신, 아미노알릴 염기, 염료 표지 염기, 형광성 염기, 또는 비오틴 표지된 염기를 포함하나, 이에 제한되지 않는다.
본원에서 사용되는 바, 용어 "펩티드", "폴리펩티드", 및 "단백질"은 펩티드 결합에 의해 연결된 아미노산으로 구성된 거대분자를 지칭한다. 펩티드, 폴리펩티드, 및 단백질의 수많은 기능이 관련 기술분야에 공지되어 있으며, 효소, 구조, 수송, 방어, 호르몬 또는 신호전달을 포함하나, 이에 제한되지 않는다. 펩티드, 폴리펩티드 및 단백질은 화학적 합성 또한 이용가능하지만, 항상 그러한 것은 아니지만, 대개는 핵산 주형을 사용하여 리보솜 복합체에 의해 생물학적으로 생산된다. 핵산 주형을 조작함으로써, 펩티드, 폴리펩티드, 및 단백질 돌연변이, 예컨대 하나 초과의 펩티드, 폴리펩티드, 또는 단백질의 치환, 결실, 말단절단, 부가, 중복, 또는 융합을 수행할 수 있다. 이러한 하나 초과의 펩티드, 폴리펩티드, 또는 단백질의 융합은 동일한 분자에서 인접하게, 또는 그 사이에 추가 아미노산, 예컨대 링커, 반복부, 에피토프, 또는 태그, 또는 길이가 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 150, 200, 또는 300개의 염기 길이, 또는 상기 언급된 길이 중 임의의 두 길이로 정의된 범위 내의 임의의 길이인 임의의 다른 서열과 함께 연결될 수 있다. 본원에서 사용되는 바, 폴리펩티드 상의 "하류"라는 용어는 이전 서열의 C-말단 뒤에 있는 서열을 지칭한다. 본원에서 사용되는 바, 폴리펩티드 상의 "상류"라는 용어는 후속 서열의 N-말단 앞에 있는 서열을 지칭한다.
일부 실시양태에서, 본원에서 제공되고, 본 실시예에서 사용되는 핵산 또는 펩티드 서열은 인간, 마우스, 토끼, E. 콜라이, 효모, 및 포유동물 세포를 포함하나, 이에 제한되지 않는 다양한 생물학적 시스템에서 기능적이다. 다른 실시양태에서, 본원에서 제공되고, 본 실시예에서 사용되는 핵산 또는 펩티드 서열과 적어도 0%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%, 또는 0%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 미만의 유사성, 또는 상기 언급된 유사성(%) 중 임의의 두 유사성(%)으로 정의된 범위 이내의 임의의 유사성(%)을 공유하는 핵산 또는 펩티드 서열 또한 생물학적 시스템에서 서열의 기능에 영향을 미치지 않으면서 사용될 수도 있다. 본원에서 사용되는 바, 용어 "유사성"은 서열 내에 예컨대, 치환, 결실, 반복 삽입과 같은 특정 변이를 포함하는 주형 핵산 또는 펩티드 서열과 각각 뉴클레오티드 또는 아미노산 순서가 전반적으로 동일한 핵산 또는 펩티드 서열을 지칭한다. 일부 실시양태에서, 0%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 정도로 낮은 유사성을 공유하는 두 핵산 서열은 번역 동안 동일한 아미노산을 코딩하는 상이한 코돈을 포함함으로써 동일한 폴리펩티드를 코딩할 수 있다.
본원에서 사용되는 바, "재조합적으로 발현"이라는 용어는 최적화되거나, 또는 적합화된 생물학적 시스템에서의 단백질 생산을 지칭한다. 이러한 시스템은 천연 숙주에서의 단백질 발현에 비해 높은 발현 (과다발현), 정제 용이, 형질전환 용이, 유도성, 저렴한 비용, 또는 단백질의 안정성을 포함하나, 이에 제한되지 않는 이점을 제공한다. 일부 실시양태에서, 단백질은 포유동물, 박테리아, 효모, 곤충, 또는 무세포 재조합 발현 시스템에서 발현된다. 각 시스템은 그의 고유한 이점 또는 단점이 있다. 예를 들어, 박테리아 발현 시스템은 과다발현을 위해 고도로 최적화되지만, 생산된 단백질의 미스폴딩 또는 응집을 유발할 수 있으며, 효모 시스템은 번역 후 변형이 필요할 때 유용하고, 곤충 및 포유동물 시스템은 고등 유기체에 존재하는 적절한 RNA 스플라이싱에 유용하다. 일부 실시양태에서, 재조합 폴리펩티드는 포유동물, 인간, 1차, 무한증식, 암, 줄기, 섬유모세포, 인간 배아 신장 (HEK) 293, 차이니즈 햄스터 난소 (CHO), 박테리아, 에스케리키아 콜라이, 효모, 사카로마이세스 세레비시애, 피치아 파스토리스, 곤충, 스포돕테라 프루기페르다 Sf9, 또는 S. 프루기페르다 Sf21 세포에서, 또는 무세포 시스템에서 생산되고, 그로부터 정제된다. 일부 실시양태에서, 발현 유전자, 벡터, 또는 구축물은 플라스미드, 박테리오파지, 바이러스, 아데노 연관 바이러스 (AAV), 바큘로바이러스, 코스미드, 포스미드, 파지미드, BAC, YAC, 또는 HAC의 형태로 재조합 발현 시스템으로 전달된다. 재조합 발현 시스템에 관한 추가 논의를 위해, 문헌 [Gomes et al. "An Overview of Heterologous Expression Host Systems for the Production of Recombinant Proteins" ((2016) Adv. Anim. Vet. Sci. 4(7):346-356)] (상기 문헌은 그 전문이 본원에서 명시적으로 참조로 포함된다)을 참조한다.
본원에서 사용되는 바, "코로나바이러스"라는 용어는 포유동물 및 조류를 감염시키는 외피보유, 양성-센스, 단일 가닥 RNA 바이러스 패밀리를 지칭한다. 인간에서, 코로나바이러스 감염은 일반적인 감기와 같은 가벼운 증상, 또는 예컨대, 중증 급성 호흡기 증후군 (SARS), 급성 호흡 곤란 증후군 (ARDS), 기침, 울혈, 인후통, 숨가쁨, 폐렴, 기관지염 및 저산소증과 같은 좀 더 중증인 호흡기 병태를 유발할 수 있다. 다른 증상으로는 발열, 피로, 근육통, 및 위장 증상, 예컨대 구토, 설사, 복통을 포함하나, 이에 제한되지 않는다. 바이러스 외피는 스파이크 ("S"), 외피 ("E"), 막 ("M"), 및 헤마글루티닌 에스터라제 ("HE") 막횡단 구조 단백질을 포함한다. S 단백질은 바이러스 균주의 숙주 수용체 특이성을 결정하는 고도의 면역원성 영역인 수용체 결합 도메인 ("RBD")을 포함한다. 바이러스 뉴클레오캡시드는 RNA 게놈을 코팅하는 다중 뉴클레오캡시드("N" 또는 "NP") 단백질을 포함한다. 감염 동안 S 단백질은 숙주 세포 수용체에 부착되고, 외피 막의 엔도사이토시스 또는 융합을 통해 숙주 세포로의 진입을 개시한다. RNA 게놈은 숙주 리보솜에 의해 번역되어 바이러스 게놈을 복제하는 새로운 구조 단백질과 RNA 의존성 RNA 폴리머라제를 생성한다. 바이러스 입자는 숙주 소포체에서 어셈블리되고, 골지 매개 엑소사이토시스에 의해 배출된다. 코로나바이러스의 구조 및 감염 주기에 대한 추가 정보는 문헌 [Fehr AR & Perlman S. "Coronaviruses: An Overview of Their Replication and Pathogenesis" Methods Mol . Biol . (2015); 1282:1-23] (상기 문헌은 그 전문이 본원에서 명시적으로 참조로 포함된다)에 살펴볼 수 있다.
본원에서 사용되는 바, "SARS-CoV-2" 및 "2019-nCoV"라는 용어는 인간 코로나바이러스 질환 2019 (COVID-19) 대유행의 원인이 되는 코로나바이러스 균주 또는 균주들을 지칭한다. 전염성, 긴 잠복기 및 현대 세계화로 인해 바이러스가 전 세계적으로 확산되었다. 감염된 개체에서의 SARS 및 다른 호흡기 문제의 발생은 의료 기반 시설에 막대한 스트레스를 초래하였다. 인간에서의 SARS-CoV-2 및 다른 코로나바이러스에 대한 치료법과 백신이 승인받기 시작했지만, 추가 시험이 필요하다. 참조 서열은 NCBI 진뱅크 수탁 번호: MN908947.3 (예컨대, 완전한 게놈), YP_009724390 (예컨대, 표면 당단백질), YP_009724393.1 (예컨대, 막 당단백질), 및 YP_009724397.2 (예컨대, 뉴클레오캡시드 인단백질)에 의해 이용가능하다. 원래의 SARS 바이러스 (SARS-CoV-1)와 같이, SARS-CoV-2는 S 단백질의 RBD를 통해 안지오텐신 전환 효소 2 (ACE2)에 결합하여 인간 세포를 감염시킨다. RBD, M 단백질 및 NP 단백질은 SARS-CoV-2 및 다른 코로나바이러스에 대한 치료, 예방, 중재, 백신 또는 면역원성 조성물의 개발을 위한 좋은 후보이다. 본원에 개시된 실시양태는 HCoV-229E, HCoV-OC43, SARS-CoV-1, HCoV NL63, HCoV-HKU1, 및 MERS-CoV를 포함하나, 이에 제한되지 않는, 다른 코로나바이러스에도 적용될 수 있다.
COVID-19 대유행 동안, 새로운 유전자 변이체가 발견되었다. 이러한 변이체는 상이한 숙주 특이성 또는 증가된 전염성, 감염성 및/또는 병독성을 나타낼 수 있다. 추가로, 이러한 변이체 또는 새로운 변이체는 현재 승인받은 백신의 효능을 감소시킬 수 있다는 우려가 있다. 우려되는 1차 유전자 돌연변이는 바이러스가 숙주 수용체 결합에 사용하는 S 단백질 (및 상응하는 RBD)을 포함하며; 현재 백신은 이러한 S 단백질에 대한 면역원성을 나타내기 때문에, 이러한 돌연변이체 균주에 대한 효능이 감소할 수 있다. 3가지 두드러진 변이체는 영국에서 처음 확인된 균주 (20B/501Y.V1, VOC 20212/01, B.1.1.7), 남아프리카에서 처음 확인된 균주 (20C/501Y.V2, B.1.351), 및 일본에서 처음 확인된 브라질 변이체 (20J/501Y.V3, P.1)이다. 이러한 변이체는 전 세계적으로 빠르고, 광범위한 전파를 나타내는 것으로 밝혀졌다. 상기 세 균주들 간의 공통된 돌연변이는 N501Y이며, 이는 인간 ACE2와 경계로 연결되어 있는 RBD의 6개 접촉 잔기 중 하나에 있으며, ACE2에 대한 친화도를 증가시키는 것으로 나타났다 (문헌 [Starr et al. "Deep Mutational Scanning of SARS-CoV-2 Receptor Binding Domain Reveals Constraints on Folding and ACE2 Binding" Cell; (2020) 182(5);1295-1310], 상기 문헌은 그 전문이 본원에서 명시적으로 참조로 포함된다). 남아프리카 변이체는 또한 돌연변이 K417N 및 E484K도 포함한다. 브라질 변이체는 스파이크 단백질 수용체 결합 도메인에 K417T, E484K 및 N501Y 돌연변이를 포함하여 17개의 고유한 아미노산 변이 및 3개의 결실을 포함한다. 다른 변이체는 N439K 돌연변이를 포함한다. 이러한 돌연변이가 항체 인식을 방해하는 것으로 의심받고 있다. 본원에 개시된 바와 같이, 일부 실시양태에서, 면역원성 조성물로서 사용하기 위한 핵산 및 폴리펩티드는 상기 돌연변이, 또는 S 단백질 또는 상응하는 RBD 내의 다른 돌연변이를 코딩하거나 포함할 수 있다. 이들 면역원을 본원에 기술된 제제 및 방법에 도입함으로써 접종받은 환자에서 항체 및 T 세포 반응을 다양하게 증가시킬 수 있고, 이를 통해 SARS-CoV-2 및 SARS-CoV-2 변이체에 대해 강건하게 방어할 수 있을 것이다.
일부 실시양태에서, 본원에 사용된 RBD 서열은 탠덤 반복 단일 쇄 이량체 변이체이다. RBD 이량체는 면역원성을 개선시키고, 중화 항체 역가를 증가시키는 것으로 나타났다. 이황화-연결 이량체 및 단일 쇄 (공유적으로 연결된) 이량체, 둘 모두 본 측면에서 효과적이다. 일부 실시양태에서, RBD 탠덤 반복 단일 쇄 이량체는 추가의 링커 또는 다른 아미노산을 이용하여, 또는 그의 부재하에서 2개의 코로나바이러스 RBD 서열을 융합시킴으로써 구축된다. RBD 탠덤 반복 단일 쇄 이량체 폴리펩티드의 한 예는 서열식별번호 46에 구현되어 있다. RBD 탠덤 반복 단일 쇄 이량체 폴리펩티드를 코딩하는 핵산 서열의 한 예는 서열식별번호 45에 구현되어 있다. 일부 실시양태에서, RBD 탠덤 반복 단일 쇄 이량체는 본원에 개시된 돌연변이 및/또는 하나 이상의 SARS-CoV-2 변이체와 연관된 추가의 돌연변이 중 임의의 하나 이상을 포함할 수 있다. 예를 들어, RBD 탠덤 반복 단일 쇄 이량체는 SARS-CoV-2 변이체와 연관된, K417N, N439K, E484K, 또는 N501Y 돌연변이, 또는 그의 임의의 조합을 포함할 수 있거나, 또는 상기 돌연변이 중 어느 것도 포함하지 않을 수 있다 (여기서, 상기 돌연변이는 전체 S 단백질 (예컨대, NCBI 수탁 번호 YP_009724390에 제시된 바와 같음) 기준으로 기재된다). 본 개시내용 전역에 걸쳐, RBD 탠덤 반복 단일 쇄 이량체는 또한 RBD 버전 2 (RBDv2)로도 지칭될 수 있다. RBD 탠덤 반복 단일 쇄 이량체에 대한 추가 식견은 문헌 [Dai et al. "A Universal Design of Betacoronavirus Vaccines against COVID-19, MERS, and SARS" Cell. (2020);182(3):722-733] (상기 문헌은 그 전문이 본원에서 명시적으로 참조로 포함된다)에서 살펴볼 수 있다.
일부 실시양태에서, RBD 서열은 다량체 변이체, 예컨대 하나 이상의 RBD 서열의 3, 4, 5, 6, 7, 8, 9, 또는 10개의 카피로 이루어진 변이체로 어셈블리된다. 일부 실시양태에서, RBD 서열은 삼량체 변이체로 어셈블리된다. 삼량체 RBD 변이체를 포함하는 구축물의 예는 OC-2.4이다. 일부 실시양태에서, 다량체 변이체 중의 각 RBD 서열은 본원에 개시된 돌연변이 및/또는 하나 이상의 SARS-CoV-2 변이체와 연관된 추가의 돌연변이 중 임의의 하나 이상을 포함할 수 있다. 예를 들어, 다량체 변이체 중의 하나 이상의 RBD 서열은 SARS-CoV-2 변이체와 연관된, K417N, N439K, E484K, 또는 N501Y 돌연변이, 또는 그의 임의의 조합을 포함할 수 있거나, 또는 상기 돌연변이 중 어느 것도 포함하지 않을 수 있다 (여기서, 상기 돌연변이는 전체 S 단백질 (예컨대, NCBI 수탁 번호 YP_009724390에 제시된 바와 같음) 기준으로 기재된다).
본원에서 사용되는 바, 용어 "자가촉매 펩티드 절단 부위" 또는 "2A 펩티드"는 두 구성 아미노산 사이의 펩티드 결합이 절단되어 서열에 플랭킹된 두 단백질이 분리되는 펩티드 서열을 지칭한다. 절단은 2A 펩티드 서열에서 C-말단 프롤린과 글리신 사이의 펩티드 결합 형성의 리보솜 "스키핑"의 결과인 것으로 여겨진다. 현재까지 확인된 4개의 자가촉매 펩티드 절단 부위 서열은 생체의학 연구에서 실질적으로 유용하다: 구제역 바이러스 2A (F2A); 말 비염 A 바이러스 (ERAV) 2A (E2A); 돼지 테스코바이러스-1 2A (P2A), 및 토세아 아시그나(Thosea asigna) 바이러스 2A (T2A). 일부 실시양태에서, P2A 자가촉매 펩티드 절단 부위 핵산 (서열식별번호 37) 및 폴리펩티드 (서열식별번호 38) 서열이 사용된다. 일부 실시양태에서, 사용되는 P2A 핵산 또는 폴리펩티드는 F2A, E2A, 또는 T2A 핵산 또는 폴리펩티드로 치환될 수 있다.
일부 실시양태에서, 본원에서 사용되는 핵산 또는 펩티드는 D형 간염 항원 (HDAg) 변이체를 나타내는 서열을 포함한다. D형 간염은 복제를 위해 B형 간염 동시 감염 또는 중복 감염에 의존하는 바이루소이드(virusoid)이다. D형 간염의 고리형 단일 가닥 RNA는 숙주 RNA 폴리머라제를 사용하여 증폭될 뿐만 아니라, 단일 D형 간염 항원 (HDAg) 유전자도 함유한다. B형 간염 및 D형 간염 동시 감염 또는 중복 감염 동안, 무손상 D형 간염 바이러스는 HDAg 단백질로 코팅된 RNA 게놈을 둘러싼 B형 간염 표면 항원을 함유하는 외피로 패키징된다. D형 간염은 그 자신의 수용체 결합 단백질을 코딩하지 않기 때문에, B형 간염 표면 항원을 포함하는 것이 D형 간염 감염성에 필수적이다. D형 간염과의 동시 감염 또는 중복 감염은 더 중증의 합병증을 유발하고, 간부전, 간경변 및 암의 위험을 증가시킨다. HDAg에 대해 작은 이소폼 (24 kDa) 및 큰 이소폼 (27 kDa, 시작 메티오닌을 제외하고 213개의 아미노산)이 존재하고, 이는 HDV 게놈의 동일한 오픈 리딩 프레임에서 번역된다. 코딩 서열의 코돈 196에 있는 UAG 정지 코돈에서 아데노신의 탈아미노화를 통해 번역이 계속 진행되어 큰 이소폼이 생성될 수 있다. 달리 명시적으로 언급되지 않는 한, 본원에 기술된 실시양태는 HDAg의 큰 이소폼을 포함한다. 일부 실시양태에서, HDAg 서열은 4개의 상이한 HDAg 균주 서열: "HDAg 유전자형 1A", "HDAg 유전자형 1B", "HDAg 유전자형 2A", 또는 "HDAg 유전자형 2B" 중 적어도 하나를 포함한다. HDAg 서열 및 그의 용도에 대한 추가 정보는 PCT 공개 WO 2017/132332 (이는 그 전문이 본원에서 명시적으로 참조로 포함된다)에서 살펴볼 수 있다.
본원에서 사용되는 바, "IgE 리더 서열"이라는 용어는 아미노산 서열 MDWTWILFLVAAATRVHS (서열식별번호 44)를 지칭하며, 번역 증진 및 면역원성 증가, 이 둘 모두를 위해 단백질의 N-말단에 부가될 수 있다. IgE 리더 서열이 기능성 코작 서열과 조합하여 사용될 때 번역은 특히 상향조절된다. 아미노산 IgE 리더 서열을 코딩하는 핵산 서열의 예시적인 실시양태는 서열식별번호 43으로서 제시된다. 그러나, 번역시 동일한 아미노산 서열을 생성할 수 있는 대안적 핵산 서열을 개발하는 것도 관련 기술분야의 통상의 기술자에게는 매우 자명할 것이다. IgE 리더 서열의 용도에 관한 추가 식견은 문헌 [Vijayachari et al. "Immunogenicity of a novel enhanced consensus DNA vaccine encoding the leptospiral protein LipL45" Hum. Vaccin . Immunother. (2015);11(8):1945-53] (상기 문헌은 그 전문이 본원에서 명시적으로 참조로 포함된다)에서 살펴볼 수 있다.
본원에서 사용되는 바, 용어 "생체내 전기천공", "전기천공", 및 "EP"는 관련 기술분야에 공지된 기술을 사용하여 전류를 사용하여 살아있는 조직 또는 유기체의 세포로 유전자, 핵산, DNA, RNA, 단백질, 또는 벡터를 전달하는 것을 지칭한다. 전기천공은 예컨대, 바이러스 (형질도입), 리포펙션, 유전자총 (바이오리스틱스), 미세주사, 소포 융합 또는 화학적 형질전환과 같은 다른 유전자 전달 방법의 대안으로 사용될 수 있다. 전기천공은 세포 게놈의 면역원성 및 유해한 통합 또는 돌연변이유발의 위험을 제한한다. 예컨대, 플라스미드와 같은 DNA 벡터는 세포 핵에 접근할 수 있고, 이로써, 구성 유전자의 전사 및 번역을 가능하게 한다. 일부 실시양태에서, 유전자, 핵산, DNA, RNA, 단백질, 또는 벡터는 피하, 근육내 또는 진피내 주사에 의해 표적 조직 또는 유기체에 첨가된다. 이어서, 전기천공기는 주입된 샘플 내부 또는 근처에 배치된 전극을 통해 짧은 전기 펄스를 전달한다. 본원에서 사용되는 바, 용어 "im/EP"는 근육내로 ("im") 전달된 샘플의 생체내 전기천공을 지칭한다.
본원에서 사용되는 바, 용어 "K18-hACE2" 또는 "B6.Cg-Tg(K18-ACE2)2Prlmn/J"는 인간 세포를 감염시키는 데 사용되는 코로나바이러스, 예컨대 SARS-CoV-1 및 SARS-CoV-2 수용체인 인간 ACE2를 발현하는 트랜스제닉 마우스 모델을 지칭한다. 인간 ACE2의 발현은 인간 시토케라틴 18 프로모터에 의해 구동된다. 이들 마우스는 SARS-CoV-2 바이러스 감염을 위한 실험 모델로서 사용될 수 있다. 다른 유사 마우스 모델이 대안으로서 사용될 수 있다.
값의 범위로 제공되는 경우, 상한 및 하한, 및 범위의 상한과 하한 사이의 각각의 중간 값이 실시양태 내에 포함되는 것으로 이해된다.
본원에서 사용되는 바, 용어 "% w/w" 또는 "% wt/wt"는 본 명세서에 비추어 이해되는 바와 같은 그의 일반적인 의미를 가지며, 조성물의 전체 중량 대비 성분 또는 작용제의 중량에 100을 곱한 값으로 표시되는 비율(%)을 지칭한다. 본원에서 사용되는 바, 용어 "% v/v" 또는 "% vol/vol"은 본 명세서에 비추어 이해되는 바와 같은 그의 일반적인 의미를 가지며, 조성물의 전체 액체 부피 대비 화합물, 물질, 성분, 또는 작용제의 액체 부피에 100을 곱한 값으로 표시되는 비율(%)을 지칭한다.
예시적인 면역원성 조성물 실시양태
본원에서는 예를 들어, 대상체에서 SARS-CoV-2 또는 다른 코로나바이러스에 대한 면역 반응을 생성하고/거나, SARS-CoV-2 또는 다른 코로나바이러스에 대한 중화 항체를 생성하기 위한 면역원성 조성물 또는 면역원성 생성물 조합물의 일부로서 사용될 수 있는 핵산을 개시한다.
일부 실시양태에서, 핵산은 SARS-CoV-2 폴리펩티드를 코딩하는 적어도 하나의 핵산 서열 및 P2A 자가촉매 폴리펩티드 절단 부위를 코딩하는 적어도 하나의 핵산 서열을 포함한다. 일부 실시양태에서, SARS-CoV-2 폴리펩티드를 코딩하는 적어도 하나의 핵산 서열은 수용체 결합 도메인 (RBD) 폴리펩티드를 코딩하는 핵산 서열 및 핵단백질 (NP) 폴리펩티드를 코딩하는 핵산을 포함한다. 일부 실시양태에서, 핵산은 서열식별번호 1 또는 13과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함한다. 일부 실시양태에서, SARS-CoV-2 폴리펩티드를 코딩하는 적어도 하나의 핵산 서열은 RBD 폴리펩티드를 코딩하는 핵산 서열, M 폴리펩티드를 코딩하는 핵산 서열, 및 NP 폴리펩티드를 코딩하는 핵산 서열을 포함한다. 일부 실시양태에서, 핵산은 서열식별번호 2-3, 또는 14-15 중 어느 하나와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함한다. 일부 실시양태에서, RBD 폴리펩티드는 RBD 탠덤 반복 단일 쇄 이량체 폴리펩티드이다. 일부 실시양태에서, RBD 탠덤 반복 단일 쇄 이량체 폴리펩티드는 전체 S 단백질 (예컨대, NCBI 수탁 번호 YP_009724390에 제시된 바와 같음) 기준으로 K417N, N439K, E484K, 또는 N501Y 돌연변이, 또는 그의 임의의 조합을 포함하거나, 또는 상기 돌연변이 중 어느 것도 포함하지 않는다. 일부 실시양태에서, RBD 탠덤 반복 단일 쇄 이량체 폴리펩티드를 코딩하는 핵산 서열은 서열식별번호 45, 또는 47-50 중 임의의 하나 이상과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함한다. 일부 실시양태에서, 핵산은 서열식별번호 39와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함한다. 일부 실시양태에서, RBD 폴리펩티드는 RBD (또는 RBDv2)의 3개의 탠덤 카피를 포함한다. 일부 실시양태에서, RBD의 3개의 탠덤 카피는 각각 전체 S 단백질 (예컨대, NCBI 수탁 번호 YP_009724390에 제시된 바와 같음) 기준으로 K417N, N439K, E484K, 또는 N501Y 돌연변이, 또는 그의 임의의 조합을 포함하거나, 또는 상기 돌연변이 중 어느 것도 포함하지 않는다.
본원에 개시된 핵산 중 임의의 것에 적용되는 바와 같이, 일부 실시양태에서, 핵산은 5' IgE 리더 핵산 서열을 추가로 포함한다. 일부 실시양태에서, 5' IgE 리더 핵산 서열은 서열식별번호 43과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함한다. 일부 실시양태에서, RBD 폴리펩티드는 RBD 탠덤 반복 단일 쇄 이량체 폴리펩티드이다. 일부 실시양태에서, RBD 탠덤 반복 단일 쇄 이량체 폴리펩티드는 전체 S 단백질 (예컨대, NCBI 수탁 번호 YP_009724390에 제시된 바와 같음) 기준으로 K417N, N439K, E484K, 또는 N501Y 돌연변이, 또는 그의 임의의 조합을 포함하거나, 또는 상기 돌연변이 중 어느 것도 포함하지 않는다. 일부 실시양태에서, RBD 탠덤 반복 단일 쇄 이량체 폴리펩티드를 코딩하는 핵산 서열은 서열식별번호 45, 또는 47-50 중 임의의 하나 이상과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함한다. 일부 실시양태에서, 핵산은 서열식별번호 45, 또는 47-50 중 임의의 하나 이상과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함한다. 일부 실시양태에서, 핵산은 서열식별번호 40, 57-60, 또는 62 중 임의의 하나 이상과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함한다. 일부 실시양태에서, RBD 폴리펩티드는 RBD (또는 RBDv2)의 3개의 탠덤 카피를 포함한다. 일부 실시양태에서, RBD의 3개의 탠덤 카피는 각각 전체 S 단백질 (예컨대, NCBI 수탁 번호 YP_009724390에 제시된 바와 같음) 기준으로 K417N, N439K, E484K, 또는 N501Y 돌연변이, 또는 그의 임의의 조합을 포함하거나, 또는 상기 돌연변이 중 어느 것도 포함하지 않는다. 일부 실시양태에서, 핵산은 서열식별번호 61과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함한다.
일부 실시양태에서, SARS-CoV-2 폴리펩티드를 코딩하는 적어도 하나의 핵산 서열은 RBD 폴리펩티드를 코딩하는 핵산 서열 및 M 폴리펩티드를 코딩하는 핵산 서열을 포함한다. 일부 실시양태에서, 핵산은 서열식별번호 4 또는 16과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함한다.
일부 실시양태에서, SARS-CoV-2 폴리펩티드를 코딩하는 적어도 하나의 핵산 서열은 스파이크 (S) 폴리펩티드를 코딩하는 핵산 서열을 포함한다. 일부 실시양태에서, SARS-CoV-2 폴리펩티드를 코딩하는 적어도 하나의 핵산 서열은 막 (M) 폴리펩티드를 코딩하는 핵산 서열을 포함한다. 일부 실시양태에서, SARS-CoV-2 폴리펩티드를 코딩하는 적어도 하나의 핵산 서열은 핵단백질 (NP) 폴리펩티드를 코딩하는 핵산 서열을 추가로 포함한다. 일부 실시양태에서, SARS-CoV-2 폴리펩티드를 코딩하는 적어도 하나의 핵산 서열은 S 폴리펩티드를 코딩하는 핵산 서열, M 폴리펩티드를 코딩하는 핵산 서열, 또는 NP 폴리펩티드를 코딩하는 핵산 서열, 또는 그의 임의의 조합을 포함한다. 일부 실시양태에서, S 폴리펩티드는 발현, 가용성, 및/또는 면역원성 개선을 촉진시키는 돌연변이를 포함한다. 일부 실시양태에서, S 폴리펩티드는 전체 S 단백질 (예컨대, NCBI 수탁 번호 YP_009724390에 제시된 바와 같음) 기준으로 K968P 또는 V987P 돌연변이, 또는 그 둘 모두를 포함한다. 일부 실시양태에서, S 폴리펩티드를 코딩하는 핵산 서열은 서열식별번호 51과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함한다. 일부 실시양태에서, 핵산은 5' IgE 리더 핵산 서열은 추가로 포함한다. 일부 실시양태에서, 5' IgE 리더 핵산 서열은 서열식별번호 43과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함한다. 일부 실시양태에서, 핵산은 서열식별번호 63과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함한다.
일부 실시양태에서, 핵산은 SARS-CoV-2 폴리펩티드를 코딩하는 적어도 하나의 핵산 서열을 포함한다. 일부 실시양태에서, 핵산은 서열식별번호 5-7, 17-19, 22-24, 73, 또는 75 중 임의의 하나 이상과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함한다.
일부 실시양태에서, 핵산은 SARS-CoV-2 폴리펩티드를 코딩하는 적어도 하나의 핵산 서열 및 D형 간염 항원 (HDAg)을 코딩하는 적어도 하나의 핵산 서열을 포함한다. 일부 실시양태에서, 핵산은 서열식별번호 8 또는 20과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함한다. 일부 실시양태에서, 핵산은 P2A 자가촉매 폴리펩티드 절단 부위를 코딩하는 적어도 하나의 핵산 서열을 추가로 포함한다. 일부 실시양태에서, 핵산은 서열식별번호 9 또는 21과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함한다.
본원에 개시된 핵산 중 어느 하나의 일부 실시양태에서, 핵산은 5' IgE 리더 핵산 서열을 추가로 포함한다. 일부 실시양태에서, 5' IgE 리더 핵산 서열은 서열식별번호 43과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함한다.
본원에 개시된 핵산 중 임의의 것에서, 핵산은 본원에 개시된 또는 다르게는 관련 기술분야에 통상적으로 공지된 SARS-CoV-2 폴리펩티드 중 임의의 하나 이상을 코딩할 수 있다. 일부 실시양태에서, 하나 이상의 SARS-CoV-2 폴리펩티드는 RBD 폴리펩티드를 포함한다. 일부 실시양태에서, RBD 폴리펩티드는 SARS-CoV-2 바이러스 또는 그의 변이체로부터의 것이다. 일부 실시양태에서, RBD 폴리펩티드는 전체 S 단백질 (예컨대, NCBI 수탁 번호 YP_009724390에 제시된 바와 같음) 기준으로 K417N, N439K, E484K, 또는 N501Y 돌연변이, 또는 그의 임의의 조합을 포함하거나, 또는 상기 돌연변이 중 어느 것도 포함하지 않는다. 일부 실시양태에서, RBD 폴리펩티드를 코딩하는 핵산은 서열식별번호 10 또는 22에 의해 제시된다. 일부 실시양태에서, RBD 폴리펩티드는 서열식별번호 34에 의해 제시된다. 일부 실시양태에서, RBD 폴리펩티드는 RBD 탠덤 반복 단일 쇄 이량체 폴리펩티드이다. 일부 실시양태에서, RBD 탠덤 반복 단일 쇄 이량체 폴리펩티드는 전체 S 단백질 (예컨대, NCBI 수탁 번호 YP_009724390에 제시된 바와 같음) 기준으로 K417N, N439K, E484K, 또는 N501Y 돌연변이, 또는 그의 임의의 조합을 포함하거나, 또는 상기 돌연변이 중 어느 것도 포함하지 않는다. 일부 실시양태에서, RBD 폴리펩티드를 코딩하는 핵산은 서열식별번호 45, 또는 47-50 중 어느 하나에 의해 제시된다. 일부 실시양태에서, RBD 폴리펩티드는 서열식별번호 46, 또는 52-55 중 어느 하나에 의해 제시된다. 일부 실시양태에서, M 폴리펩티드를 코딩하는 핵산은 서열식별번호 11 또는 23에 의해 제시된다. 일부 실시양태에서, M 폴리펩티드는 서열식별번호 35에 의해 제시된다. 일부 실시양태에서, NP 폴리펩티드를 코딩하는 핵산은 서열식별번호 12 또는 24에 의해 제시된다. 일부 실시양태에서, NP 폴리펩티드는 서열식별번호 36에 의해 제시된다.
본원에 개시된 핵산 중 어느 하나는 의약에서 또는 의약 제조를 위해 사용될 수 있다. 일부 실시양태에서, 의약은 대상체에서 SARS-CoV-2 또는 다른 코로나바이러스의 예방, 치료 또는 억제를 위해 사용된다. 일부 실시양태에서, 대상체는 인간이다.
또한, 본원에서는 예를 들어, 대상체에서 SARS-CoV-2 또는 다른 코로나바이러스에 대한 면역 반응을 생성하고/거나, SARS-CoV-2 또는 다른 코로나바이러스에 대한 중화 항체를 생성하기 위한 면역원성 조성물 또는 면역원성 생성물 조합물의 일부로서 사용될 수 있는 폴리펩티드를 개시한다.
일부 실시양태에서, 폴리펩티드는 적어도 하나의 SARS-CoV-2 폴리펩티드 서열 및 적어도 하나의 P2A 자가촉매 폴리펩티드 절단 부위를 포함한다. 일부 실시양태에서, 적어도 하나의 SARS-CoV-2 폴리펩티드 서열은 RBD 폴리펩티드 서열 및 NP 폴리펩티드 서열을 포함한다. 일부 실시양태에서, 폴리펩티드는 서열식별번호 25와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함한다. 일부 실시양태에서, 적어도 하나의 SARS-CoV-2 폴리펩티드 서열은 RBD 폴리펩티드 서열, M 폴리펩티드 서열, 및 NP 폴리펩티드 서열을 포함한다. 일부 실시양태에서, 폴리펩티드는 서열식별번호 26 또는 27과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함한다. 일부 실시양태에서, RBD 폴리펩티드는 RBD 탠덤 반복 단일 쇄 이량체 폴리펩티드이다. 일부 실시양태에서, RBD 탠덤 반복 단일 쇄 이량체 폴리펩티드는 전체 S 단백질 (예컨대, NCBI 수탁 번호 YP_009724390에 제시된 바와 같음) 기준으로 K417N, N439K, E484K, 또는 N501Y 돌연변이, 또는 그의 임의의 조합을 포함하거나, 또는 상기 돌연변이 중 어느 것도 포함하지 않는다. 일부 실시양태에서, RBD 탠덤 반복 단일 쇄 이량체 폴리펩티드는 서열식별번호 46, 또는 52-55 중 어느 하나와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함한다. 일부 실시양태에서, 폴리펩티드는 서열식별번호 41과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함한다. 일부 실시양태에서, RBD 폴리펩티드는 RBD (또는 RBDv2)의 3개의 탠덤 카피를 포함한다. 일부 실시양태에서, RBD의 3개의 탠덤 카피는 각각 전체 S 단백질 (예컨대, NCBI 수탁 번호 YP_009724390에 제시된 바와 같음) 기준으로 K417N, N439K, E484K, 또는 N501Y 돌연변이, 또는 그의 임의의 조합을 포함하거나, 또는 상기 돌연변이 중 어느 것도 포함하지 않는다.
본원에 개시된 폴리펩티드 중 임의의 것에 적용되는 바와 같이, 일부 실시양태에서, 폴리펩티드는 N-말단 IgE 리더 폴리펩티드 서열을 추가로 포함한다. 일부 실시양태에서, N-말단 IgE 리더 폴리펩티드 서열은 서열식별번호 44와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함한다. 일부 실시양태에서, RBD 폴리펩티드는 RBD 탠덤 반복 단일 쇄 이량체 폴리펩티드이다. 일부 실시양태에서, RBD 탠덤 반복 단일 쇄 이량체 폴리펩티드는 전체 S 단백질 (예컨대, NCBI 수탁 번호 YP_009724390에 제시된 바와 같음) 기준으로 K417N, N439K, E484K, 또는 N501Y 돌연변이, 또는 그의 임의의 조합을 포함하거나, 또는 상기 돌연변이 중 어느 것도 포함하지 않는다. 일부 실시양태에서, RBD 탠덤 반복 단일 쇄 이량체 폴리펩티드는 서열식별번호 46, 또는 52-55 중 어느 하나와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함한다. 일부 실시양태에서, 폴리펩티드는 서열식별번호 42, 64-67, 또는 69 중 어느 하나와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함한다. 일부 실시양태에서, RBD 폴리펩티드는 RBD (또는 RBDv2)의 3개의 탠덤 카피를 포함한다. 일부 실시양태에서, RBD의 3개의 탠덤 카피는 각각 전체 S 단백질 (예컨대, NCBI 수탁 번호 YP_009724390에 제시된 바와 같음) 기준으로 K417N, N439K, E484K, 또는 N501Y 돌연변이, 또는 그의 임의의 조합을 포함하거나, 또는 상기 돌연변이 중 어느 것도 포함하지 않는다. 일부 실시양태에서, 폴리펩티드는 서열식별번호 68과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함한다.
일부 실시양태에서, 적어도 하나의 SARS-CoV-2 폴리펩티드 서열은 RBD 폴리펩티드 서열 및 M 폴리펩티드 서열을 포함한다. 일부 실시양태에서, 폴리펩티드는 서열식별번호 28과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함한다.
일부 실시양태에서, 적어도 하나의 SARS-CoV-2 폴리펩티드는 스파이크 (S) 폴리펩티드를 포함한다. 일부 실시양태에서, 적어도 하나의 SARS-CoV-2 폴리펩티드는 NP 폴리펩티드를 추가로 포함한다. 일부 실시양태에서, S 폴리펩티드는 발현, 가용성, 및/또는 면역원성 개선을 촉진시키는 돌연변이를 포함한다. 일부 실시양태에서, S 폴리펩티드는 전체 S 단백질 (예컨대, NCBI 수탁 번호 YP_009724390에 제시된 바와 같음) 기준으로 K968P 또는 V987P 돌연변이, 또는 그 둘 모두를 포함한다. 일부 실시양태에서, S 폴리펩티드는 서열식별번호 56과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함한다. 일부 실시양태에서, 폴리펩티드는 N-말단 IgE 리더 폴리펩티드 서열을 추가로 포함한다. 일부 실시양태에서, N-말단 IgE 리더 폴리펩티드 서열은 서열식별번호 44와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함한다. 일부 실시양태에서, 폴리펩티드는 서열식별번호 70과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함한다.
일부 실시양태에서, 폴리펩티드는 서열식별번호 29-31, 34-36, 74, 또는 76 중 임의의 하나 이상과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 적어도 하나의 SARS-CoV-2 폴리펩티드를 포함한다.
일부 실시양태에서, 폴리펩티드는 적어도 하나의 SARS-CoV-2 폴리펩티드 및 적어도 하나의 HDAg 폴리펩티드를 포함한다. 일부 실시양태에서, 폴리펩티드는 서열식별번호 32와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함한다. 일부 실시양태에서, 폴리펩티드는 적어도 하나의 P2A 자가촉매 폴리펩티드 절단 부위를 추가로 포함한다. 일부 실시양태에서, 폴리펩티드는 서열식별번호 33과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함한다.
본원에 개시된 폴리펩티드 중 어느 하나의 일부 실시양태에서, 폴리펩티드는 N-말단 IgE 리더 폴리펩티드 서열을 추가로 포함한다. 일부 실시양태에서, N-말단 IgE 리더 폴리펩티드 서열은 서열식별번호 44와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함한다. 일부 실시양태에서, 폴리펩티드는 서열식별번호 42와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함한다.
본원에 개시된 폴리펩티드 중 임의의 것에서, 폴리펩티드는 본원에 개시된 또는 다르게는 관련 기술분야에 통상적으로 공지된 SARS-CoV-2 폴리펩티드 중 임의의 하나 이상을 포함할 수 있다. 일부 실시양태에서, 하나 이상의 SARS-CoV-2 폴리펩티드는 RBD 폴리펩티드를 포함한다. 일부 실시양태에서, RBD 폴리펩티드는 SARS-CoV-2 바이러스 또는 그의 변이체로부터의 것이다. 일부 실시양태에서, RBD 폴리펩티드는 전체 S 단백질 (예컨대, NCBI 수탁 번호 YP_009724390에 제시된 바와 같음) 기준으로 K417N, N439K, E484K, 또는 N501Y 돌연변이, 또는 그의 임의의 조합을 포함하거나, 또는 상기 돌연변이 중 어느 것도 포함하지 않는다. 일부 실시양태에서, RBD 폴리펩티드를 코딩하는 핵산은 서열식별번호 10 또는 22에 의해 제시된다. 일부 실시양태에서, RBD 폴리펩티드는 서열식별번호 34에 의해 제시된다. 일부 실시양태에서, RBD 폴리펩티드는 RBD 탠덤 반복 단일 쇄 이량체 폴리펩티드이다. 일부 실시양태에서, RBD 탠덤 반복 단일 쇄 이량체 폴리펩티드는 전체 S 단백질 (예컨대, NCBI 수탁 번호 YP_009724390에 제시된 바와 같음) 기준으로 K417N, N439K, E484K, 또는 N501Y 돌연변이, 또는 그의 임의의 조합을 포함하거나, 또는 상기 돌연변이 중 어느 것도 포함하지 않는다. 일부 실시양태에서, RBD 폴리펩티드를 코딩하는 핵산은 서열식별번호 45, 또는 47-50 중 임의의 하나 이상에 의해 제시된다. 일부 실시양태에서, RBD 폴리펩티드는 서열식별번호 46, 또는 52-55 중 임의의 하나 이상에 의해 제시된다. 일부 실시양태에서, M 폴리펩티드를 코딩하는 핵산은 서열식별번호 11 또는 23에 의해 제시된다. 일부 실시양태에서, M 폴리펩티드는 서열식별번호 35에 의해 제시된다. 일부 실시양태에서, NP 폴리펩티드를 코딩하는 핵산는 서열식별번호 12 또는 24에 의해 제시된다. 일부 실시양태에서, NP 폴리펩티드는 서열식별번호 36에 의해 제시된다.
본원에 개시된 폴리펩티드 중 어느 하나는 의약에서 또는 의약 제조를 위해 사용될 수 있다. 일부 실시양태에서, 의약은 대상체에서 SARS-CoV-2 또는 다른 코로나바이러스의 예방, 치료 또는 억제를 위해 사용된다. 일부 실시양태에서, 대상체는 인간이다.
본원에 개시된 폴리펩티드 중 어느 하나는 재조합적으로 발현될 수 있다. 일부 실시양태에서, 폴리펩티드는 포유동물, 박테리아, 효모, 곤충, 또는 무세포 시스템에서 재조합적으로 발현된다.
치료 방법 또는 용도
본원에서 사용되는 바, 용어 "프라임" 및 "부스트"는 이종성 프라임-부스트 면역화 접근법에서 사용되는 별개의 면역원성 조성물과 관련된 것이다. 면역화 또는 백신은 일반적으로 숙주에서 표적 병원체에 대한 성공적인 면역을 유도하기 위해 면역원성 조성물의 1회 초과의 투여를 필요로 한다. 모든 투여에 대해 동일한 조성물이 제공되는 상기 동종성 접근법과 비교하여, 이종성 프라임-부스트 투여는 예컨대, 바이러스, 코로나바이러스, SARS-CoV-2, 박테리아, 기생충, 원생동물, 연충와 같은 일부 병원체에 대해 더 큰 항체 수준 및 개선된 제거 또는 내성으로 강건한 면역을 확립하는 데 더 효과적일 수 있다. 이종성 프라임-부스트 투여에서, 한 타입의 면역원성 조성물을 포함하는 적어도 하나의 프라임 용량이 먼저 제공된다. 적어도 하나의 프라임 용량 제공 후, 이어서, 또 다른 타입의 면역원성 조성물을 포함하는 적어도 하나의 부스트 용량이 제공된다. 적어도 하나의 부스트 용량 투여는 적어도 하나의 프라임 용량 투여 후 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 24, 36, 또는 48일 또는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 24, 36, 또는 48주, 또는 상기 언급된 시점 중 임의의 두 시점으로 정의된 시간 범위 이내에, 예컨대 1-48일 또는 1-48주 이내에 수행된다. 일부 실시양태에서, 프라임 용량은 하나 이상의 항원 또는 에피토프를 코딩하는 핵산 (예컨대, DNA 또는 RNA)을 포함하고, 부스트 용량은 하나 이상의 항원 또는 에피토프를 포함하는 폴리펩티드를 포함한다. 숙주에서, 핵산 프라임은 생체내에서 번역되어 면역 반응을 유도하고, 후속 폴리펩티드 부스트에 대해 더 큰 반응을 유발한다.
일부 실시양태에서, 핵산 프라임은 SARS-CoV-2 또는 다른 코로나바이러스 (그의 변이체 포함)로부터의 서열을 포함하거나, 본질적으로 그로 이루어지거나, 또는 그로 이루어진다. 일부 실시양태에서, SARS-CoV-2 또는 다른 코로나바이러스로부터의 서열은 S, RBD, M, E, 또는 NP 폴리펩티드 (그의 돌연변이된 폴리펩티드 또는 변이체 폴리펩티드 포함)를 코딩한다. 일부 실시양태에서, 핵산 프라임은 또한 적어도 하나의 HDAg 서열을 포함한다. 일부 실시양태에서, 핵산 서열은 인간에서의 발현을 위해 코돈 최적화된다. 일부 실시양태에서, 폴리펩티드 부스트는 SARS-CoV-2 또는 다른 코로나바이러스로부터의 폴리펩티드를 포함하거나, 본질적으로 그로 이루어지거나, 또는 그로 이루어진다. 일부 실시양태에서, SARS-CoV-2 또는 다른 코로나바이러스로부터의 폴리펩티드는 S, RBD, M, E, 또는 NP 폴리펩티드이다. 일부 실시양태에서, 프라임 용량은 폴리펩티드이고, 부스트 용량은 핵산이다. 이종성 프라임-부스트 접근법에 대한 일반 정보는 PCT 공개 WO 2006/013106, WO 2006/040334, WO 2008/094188에서 살펴볼 수 있으며, 이들은 각각 프라임-부스트 방법을 기술하기 위한 목적으로 본원에서 명시적으로 참조로 포함된다.
본원에서는 면역원성 조성물 또는 생성물 조합물을 개시한다. 일부 실시양태에서, 상기 면역원성 조성물 또는 생성물 조합물은 프라임-부스트 접근법에서 사용될 수 있다. 일부 실시양태에서, 면역원성 조성물 또는 생성물 조합물은 (a) SARS-CoV-2 폴리펩티드를 코딩하는 적어도 하나의 핵산 서열을 포함하는 핵산, 또는 (b) 적어도 하나의 SARS-CoV-2 폴리펩티드를 포함하는 폴리펩티드, 또는 그 둘 모두를 포함한다.
본원에 개시된 면역원성 조성물 또는 생성물 조합물 중 어느 하나의 일부 실시양태에서, SARS-CoV-2 폴리펩티드를 코딩하는 적어도 하나의 핵산 서열은 i) RBD 폴리펩티드를 코딩하는 핵산 서열; ii) NP 폴리펩티드를 코딩하는 핵산 서열; iii) M 폴리펩티드를 코딩하는 핵산 서열; iv) HDAg 폴리펩티드를 코딩하는 핵산 서열; v) P2A 자가촉매 폴리펩티드 절단 부위를 코딩하는 핵산 서열; vi) IgE 리더 폴리펩티드를 코딩하는 핵산 서열; 또는 vii) S 폴리펩티드를 코딩하는 핵산 서열; 또는 그의 임의의 조합을 포함한다. 일부 실시양태에서, 핵산은 본원에 개시된 핵산 중 어느 하나이다. 일부 실시양태에서, 핵산은 서열식별번호 1-12 중 임의의 하나 이상과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하며, 임의적으로 대상체, 예컨대 포유동물, 바람직하게는 인간에서의 SARS-CoV-2 예방, 치료, 또는 억제를 위한 것과 같은 의약에서 사용된다. 다른 실시양태에서, 핵산은 인간에서의 발현을 위해 코돈 최적화된다. 일부 실시양태에서, 핵산은 서열식별번호 13-24, 39-40, 57-63, 71, 73, 또는 75 중 임의의 하나 이상과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하며, 임의적으로 대상체, 예컨대 포유동물, 바람직하게는 인간에서의 SARS-CoV-2 예방, 치료, 또는 억제를 위한 것과 같은 의약에서 사용된다. 일부 실시양태에서, RBD 폴리펩티드는 RBD 탠덤 반복 단일 쇄 이량체이다. 일부 실시양태에서, RBD 폴리펩티드는 SARS-CoV-2 바이러스 또는 그의 변이체로부터의 것이다. 일부 실시양태에서, RBD 폴리펩티드는 전체 S 단백질 (예컨대, NCBI 수탁 번호 YP_009724390에 제시된 바와 같음) 기준으로 K417N, N439K, E484K, 또는 N501Y 돌연변이, 또는 그의 임의의 조합을 포함하거나, 또는 상기 돌연변이 중 어느 것도 포함하지 않는다. 일부 실시양태에서, RBD 폴리펩티드는 서열식별번호 46, 또는 52-55 중 임의의 하나 이상과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함한다. 일부 실시양태에서, 핵산은 재조합 벡터에 제공된다. 일부 실시양태에서, 재조합 벡터는 pVAX1이다.
본원에 개시된 면역원성 조성물 또는 생성물 조합물 중 어느 하나의 일부 실시양태에서, 적어도 하나의 SARS-CoV-2 폴리펩티드는 i) RBD 폴리펩티드 서열; ii) NP 폴리펩티드 서열; iii) M 폴리펩티드 서열; iv) HDAg 폴리펩티드 서열; v) P2A 자가촉매 폴리펩티드 절단 부위 서열; vi) IgE 리더 폴리펩티드 서열; 또는 vii) S 폴리펩티드 서열; 또는 그의 임의의 조합을 포함한다. 일부 실시양태에서, 폴리펩티드는 본원에 개시된 폴리펩티드 중 어느 하나이다. 일부 실시양태에서, 폴리펩티드는 서열식별번호 25-36, 41-42, 64-70, 72, 74, 또는 76 중 임의의 하나 이상과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하며, 임의적으로 대상체, 예컨대 포유동물, 바람직하게는 인간에서의 SARS-CoV-2 예방, 치료, 또는 억제를 위한 것과 같은 의약에서 사용된다. 일부 실시양태에서, RBD 폴리펩티드는 RBD 탠덤 반복 단일 쇄 이량체이다. 일부 실시양태에서, RBD 폴리펩티드는 SARS-CoV-2 바이러스 또는 그의 변이체로부터의 것이다. 일부 실시양태에서, RBD 폴리펩티드는 전체 S 단백질 (예컨대, NCBI 수탁 번호 YP_009724390에 제시된 바와 같음) 기준으로 K417N, N439K, E484K, 또는 N501Y 돌연변이, 또는 그의 임의의 조합을 포함하거나, 또는 상기 돌연변이 중 어느 것도 포함하지 않는다. 일부 실시양태에서, RBD 폴리펩티드는 서열식별번호 46, 또는 52- 55 중 어느 하나와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함한다. 일부 실시양태에서, 폴리펩티드는 재조합적으로 발현된다. 일부 실시양태에서, 폴리펩티드는 포유동물, 박테리아, 효모, 곤충, 또는 무세포 시스템에서 재조합적으로 발현된다.
일부 실시양태에서, 본원에 개시된 면역원성 조성물 또는 생성물 조합물 중 어느 하나는 애주번트를 추가로 포함한다. 일부 실시양태에서, 애주번트는 관련 기술분야에 통상적으로 공지된 임의의 애주번트이다. 일부 실시양태에서, 애주번트는 알룸 및/또는 QS21이다.
또한, 본원에서는 본원에 개시된 면역원성 조성물 또는 생성물 조합물 중 어느 하나를 사용하여 대상체에서 면역 반응을 생성하고/거나, 중화 항체를 생성하는 방법을 개시한다. 일부 실시양태에서, 본 방법은 대상체에게 면역원성 조성물 또는 생성물 조합물 중 어느 하나의 핵산을 포함하는 적어도 하나의 프라임 용량을 투여하는 단계; 및 대상체에게 면역원성 조성물 또는 생성물 조합물 중 어느 하나의 폴리펩티드를 포함하는 적어도 하나의 부스트 용량을 투여하는 단계를 포함한다. 일부 실시양태에서, 면역 반응 및/또는 중화 항체는 SARS-CoV-2 또는 다른 코로나바이러스에 대한 것이다. 일부 실시양태에서, 대상체는 포유동물, 예컨대 마우스, 래트, 원숭이, 고양이, 개, 또는 인간이다. 일부 실시양태에서, 적어도 하나의 부스트 용량은 애주번트를 추가로 포함한다. 일부 실시양태에서, 애주번트는 관련 기술분야에 통상적으로 공지된 임의의 애주번트이다. 일부 실시양태에서, 애주번트는 알룸 및/또는 QS21이다. 일부 실시양태에서, 적어도 하나의 부스트 용량은 적어도 하나의 프라임 용량 투여 후 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 24, 36, 또는 48일 또는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 24, 36, 또는 48주, 또는 상기 언급된 시점 중 임의의 두 시점으로 정의된 시간 범위 이내에, 예컨대 1-48일 또는 1-48주 이내에 투여된다. 일부 실시양태에서, 투여는 장내로, 경구로, 비내로, 비경구로, 피하로, 근육내로, 진피내로, 또는 정맥내로 또는 그의 임의의 조합, 및 임의적으로, 생체내 전기천공으로 제공된다. 일부 실시양태에서, 투여는 항바이러스 요법과 함께 수행된다. 일부 실시양태에서, 항바이러스 요법은 덱사메타손, 파비피라비르, 파필라비르, 렘데시비르, 토실리주맙, 갈리데시비르, 사릴루맙, 로피나비르, 리토나비르, 다루나비르, 리바비린, 인터페론-α, PEG화된 인터페론-α, 인터페론 알파-2b, 회복기 혈청, 또는 그의 임의의 조합의 투여를 포함한다.
일부 실시양태에서, 본원에 개시된 면역원성 조성물 또는 생성물 조합물 중 어느 하나의 대상체 (예컨대, 마우스, 토끼, 원숭이, 인간)에서의 SARS-CoV-2 또는 다른 코로나바이러스의 성분을 포함하는 핵산 프라임 및 폴리펩티드 부스트 투여는 관련 기술분야에 공지된 예컨대, ELISA에 의해 정량화된 바, 핵산 단독 또는 폴리펩티드만으로 면역화되거나, 또는 비면역화된 대조군 유기체와 비교하여 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 50, 100, 150, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 5000, 10000, 100000, 또는 1000000의 비, 또는 상기 언급된 비 중 임의의 두 비로 정의된 범위 이내의 임의의 비로 더 큰 항-S, 항-RBD, 항-M, 항-E, 항-NP, 항-SARS-CoV-2, 또는 항-코로나바이러스 항체 역가를 초래한다. 일부 실시양태에서, 대상체에서 SARS-CoV2 또는 다른 코로나바이러스의 성분을 포함하는 핵산 프라임 및 폴리펩티드 부스트 투여는 핵산 단독 또는 폴리펩티드만으로 면역화되거나, 또는 비면역화된 대조군 유기체로부터의 혈청과 비교하여 혈청은 더욱 효과적으로 SARS-CoV2 또는 다른 코로나바이러스의 시험관내 또는 생체내 감염성을 중화시키고, 0.00001, 0.00005, 0.0001, 0.0005, 0.001, 0.005, 0.01, 0.02, 0.03, 0.04, 0.05, 0.06, 0.07, 0.08, 0.09, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 또는 1.0의 비, 또는 상기 언급된 비 중 임의의 두 비로 정의된 범위 이내의 임의의 비로 감염 발생률 또는 감염 다중도 (MOI)를 감소시킨다. 일부 실시양태에서, 대상체에서 SARS-CoV2 또는 다른 코로나바이러스의 성분을 포함하는 핵산 프라임 및 폴리펩티드 부스트 투여는 핵산 단독 또는 폴리펩티드만으로 면역화되거나, 또는 비면역화된 대조군 유기체로부터의 혈청과 비교하여 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 5000, 또는 10000의 비, 또는 상기 언급된 비 중 임의의 두 비로 정의된 범위 이내의 임의의 비로 더 많은 개수의 인터페론 감마 (IFNγ) 양성 세포 (예컨대, T 세포, 대식세포, 자연 살해 (NK) 세포)를 생성한다.
또한, 본원에서는 SARS-CoV-2 또는 다른 코로나바이러스의 치료 또는 억제에서 사용하기 위한 면역원성 조성물 또는 생성물 조합물을 개시한다. 일부 실시양태에서, 면역원성 조성물 또는 생성물 조합물은 (a) SARS-CoV-2 폴리펩티드를 코딩하는 적어도 하나의 핵산 서열을 포함하는 핵산, 또는 (b) 적어도 하나의 SARS-CoV-2 폴리펩티드를 포함하는 폴리펩티드, 또는 그 둘 모두를 포함한다. 일부 실시양태에서, SARS-CoV-2 폴리펩티드를 코딩하는 적어도 하나의 핵산 서열은 i) RBD 폴리펩티드를 코딩하는 핵산 서열; ii) NP 폴리펩티드를 코딩하는 핵산 서열; iii) M 폴리펩티드를 코딩하는 핵산 서열; iv) HDAg 폴리펩티드를 코딩하는 핵산 서열; v) P2A 자가촉매 폴리펩티드 절단 부위를 코딩하는 핵산 서열; vi) IgE 리더 폴리펩티드를 코딩하는 핵산 서열; 또는 vii) S 폴리펩티드를 코딩하는 핵산 서열; 또는 그의 임의의 조합을 포함한다. 일부 실시양태에서, 핵산은 본원에 개시된 핵산 중 어느 하나이다. 일부 실시양태에서, 핵산은 서열식별번호 1-12 중 임의의 하나 이상과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함한다. 일부 실시양태에서, 핵산은 인간에서의 발현을 위해 코돈 최적화된다. 일부 실시양태에서, 핵산은 서열식별번호 13-24, 또는 39-40 중 임의의 하나 이상과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함한다. 일부 실시양태에서, 적어도 하나의 SARS-CoV-2 폴리펩티드는 i) RBD 폴리펩티드 서열; ii) NP 폴리펩티드 서열; iii) M 폴리펩티드 서열; iv) HDAg 폴리펩티드 서열; v) P2A 자가촉매 폴리펩티드 절단 부위 서열; vi) IgE 리더 폴리펩티드 서열; 또는 vii) S 폴리펩티드 서열; 또는 그의 임의의 조합을 포함한다. 일부 실시양태에서, 폴리펩티드는 본원에 개시된 폴리펩티드 중 어느 하나이다. 일부 실시양태에서, 폴리펩티드는 서열식별번호 25-36, 또는 41-42 중 임의의 하나 이상과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함한다. 일부 실시양태에서, RBD 폴리펩티드는 RBD 탠덤 반복 단일 쇄 이량체이다. 일부 실시양태에서, RBD 폴리펩티드는 서열식별번호 46과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함한다. 일부 실시양태에서, 폴리펩티드는 재조합적으로 발현된다. 일부 실시양태에서, 폴리펩티드는 포유동물, 박테리아, 효모, 곤충, 또는 무세포 시스템에서 재조합적으로 발현된다. 일부 실시양태에서, 면역원성 조성물 또는 생성물 조합물은 애주번트를 추가로 포함한다. 일부 실시양태에서, 애주번트는 관련 기술분야에 통상적으로 공지된 임의의 애주번트이다. 일부 실시양태에서, 애주번트는 알룸 및/또는 QS21이다. 일부 실시양태에서, 핵산은 재조합 벡터에 제공된다. 일부 실시양태에서, 재조합 벡터는 pVAX1이다.
본 발명은 일반적으로 다수의 실시양태를 설명하기 위해 긍정적인 표현을 사용하여 개시된다. 본 발명은 또한 예컨대, 물질(substance) 또는 물질(material), 방법 단계 및 조건, 프로토콜 또는 절차와 같은 대상이 전체 또는 부분적으로 제외되는 실시양태를 포함한다.
실시예
상기에서 논의된 실시양태의 일부 측면은 하기 실시예에서 추가로 상세하게 개시되며, 이는 어느 방식으로든 본 개시내용의 범주를 제한하는 것으로 의도되지 않는다. 관련 기술분야의 통상의 기술자는 본원 상기에 및 청구범위에 기술된 바와 같이 다수의 다른 실시양태 또한 본 발명의 범주 내에 포함된다는 것을 이해할 것이다.
실시예 1: SARS- CoV -2 면역원성 조성물 구축물 디자인
SARS-CoV-2 바이러스의 성분을 함유하는 수개의 재조합 구축물을 제조하고, 이는 표 1 및 도 1-2에 도시되어 있다. S 단백질의 RBD는 면역원성이 높은 것으로 알려져 있는 바, 대부분의 구축물은 RBD 서열을 포함한다. 일부 경우에서, RBD 서열은 RBD 탠덤 반복 단일 쇄 이량체 서열이다. 그러나, 구축물은 SARS-CoV-2 바이러스 또는 임의의 다른 코로나바이러스로부터 임의의 순서로 코딩 서열의 임의의 조합을 가질 수 있다고 구상된다. 이는 RBD 서열이 없는 구축물을 포함한다. 이는 또한 코로나바이러스 복제 단백질 또는 헤마글루티닌 에스테라제에 대한 서열도 포함한다.
RBD 서열은 SVF-1 (OC-1), SVF-2 (OC-2), SVF-3 (OC-3), SVF-4 (OC-4), SVF-5 (OC-4), SVF-6 (OC-6), SVF-7 (OC-7), SVF-8 (OC-8), SVF-9 (OC-9), SVF-10 (OC-10), SVF-14 (OC-14), SVF-2.2 (OC-2.2), SVF-2.3 (OC-2.3), 및 SVF-2.4 (OC-2.4) (그의 임의의 유도체 및/또는 돌연변이체 포함)에서 관찰될 수 있다.
RBD 탠덤 반복 단일 쇄 이량체는 SVF-2.2 및 SVF-2.3, 및 SVF-14 (OC-14) (그의 임의의 유도체 및/또는 돌연변이체 포함)에서 관찰된다.
삼량체 RBD 구축물은 SVF-2.4 (그의 임의의 유도체 및/또는 돌연변이체 포함)에서 관찰된다.
S 단백질 서열은 SVF-13 (OC-13) 및 SVF-15 (OC-15) (그의 임의의 유도체 및/또는 돌연변이체 포함)에서 관찰된다.
NP 단백질 서열은 SVF-1, SVF-2, SVF-3, SVF-5, SVF-6, SVF-12 (OC-12), SVF-14, SVF-15, SVF-2.2, SVF-2.3, 및 SVF-2.4 (그의 임의의 유도체 및/또는 돌연변이체 포함)에서 관찰된다.
M 단백질 서열은 SVF-2, SVF-3, SVF-4, SVF-6, SVF-7, SVF-11 (OC-11), SVF-2.2, SVF-2.3, 및 SVF-2.4 (그의 임의의 유도체 및/또는 돌연변이체 포함)에서 관찰된다.
적어도 하나의 P2A 자가촉매 펩티드 절단 부위는 SVF-1, SVF-2, SVF-3, SVF-4, SVF-9, SVF-14, SVF-15, SVF-2.2, SVF-2.3, 및 SVF-2.4 (그의 임의의 유도체 및/또는 돌연변이체 포함)에서 관찰된다. (또 다른 자가촉매 펩티드 절단 부위로 사소하게 치환될 수 있는) P2A 자가촉매 펩티드 절단 부위가 존재함에 따라 하나 이상의 인접 핵산 유전자 또는 카세트로부터 별개의 단백질의 번역을 표적 세포에서 허용할 수 있다. 자가촉매 펩티드 절단 부위의 존재는 또한 재조합 단백질 발현 및 상기 구축물의 정제를 통해 정제하기 어려울 수 있는 별개의 폴리펩티드 성분을 수득할 수 있을 것이라는 것도 시사한다. (예컨대, 동일하거나 또는 상이한 에피토프 태그를 사용하는 것과 같이) 여전히 가능하지만, 면역원성 투여를 위한 단백질을 제조하기 위해 다른 구축물을 사용하는 것이 더 실현가능하다.
일부 실시양태에서, 재조합 구축물은 B형 간염 바이러스 또는 D형 간염 바이러스에 대한 성분을 추가로 함유한다. 이는 4개의 상이한 컨센서스 서열 (유전자형 1A, 1B, 2A, 및 2B)의 HDAg 카피가 제공되는 SVF-8 및 SVF-9의 경우에 관찰된다. HDAg는 또한 면역원성이 높은 폴리펩티드인 바, HDAg 서열을 포함하는 것이 RBD 또는 다른 코로나바이러스 서열에 대한 면역원성 반응을 개선시키는 것으로 구상된다. 또한 이들 구축물이 SARS-CoV-2 (또는 다른 코로나바이러스) 및 B형 간염 또는 D형 간염에 대해 이중 면역원성 반응을 제공할 것으로 구상된다.
구축물 SVF-10 (RBD), SVR-11 (M), SVF-12 (NP), 및 SVF-13 (S)은 상이한 성분의 상대적인 면역원성을 평가하기 위한 단일 SARS-CoV-2 서열 조성물로서 제공된다.
표 1: SARS- CoV -2 면역원성 조성물 후보
Figure pct00001
실시예 2: 방법
동물
BALB/c, C57BL/6 및 K18-hACE2 (B6.Cg-Tg(K18-ACE2)2Prlmn/J) 마우스를 잭슨 라보라토리(Jackson Laboratory)로부터 입수할 수 있다. 모든 마우스는 실험 시작시 8-10주령이고, 표준 조건하에서 유지시킨다. 뉴질랜드 화이트 토끼는 상업적 판매처에서 구입한 것이다.
재조합 벡터
SARS-CoV-2에 대한 서열은 NCBI 진뱅크 수탁 번호: MN908947.3 (예컨대, 완전한 게놈), YP_009724390 (예컨대, 표면 당단백질), YP_009724393.1 (예컨대, 막 당단백질), 및 YP_009724397.2 (예컨대, 뉴클레오캡시드 인단백질)로부터 입수한다. 유전자형 1 및 2의 HDAg 서열은 4개의 상이한 임상 분리주; US-2 및 CB, 및 7/18/83 및 TW2476으로부터 각각 입수하고, 인간에서의 발현을 위해 코돈 최적화한다.
DNA 면역원성 조성물을 위해, 제한 부위 BamHI 및 XbaI를 사용하여 유전자를 pVAX1 백본 (써모피셔(ThermoFisher))으로 클로닝한다. 플라스미드를 TOP10 E. 콜라이 세포 (써모피셔)에서 성장시키고, 생체내 주사를 위해 제조업체의 설명서에 따라 퀴아젠 엔도프리(Qiagen Endofree) DNA 정제 키트 (퀴아젠 게엠베하(Qiagen GmbH))를 사용하여 정제한다. 제한 효소 분해에 의해 정확한 유전자 크기를 확인한다. 추가로, 클로닝된 유전자 서열 모두 시퀀싱하여 정확한 뉴클레오티드 서열을 확인하였다.
단백질 발현 구축물을 위해, 유전자를 pET100 E. 콜라이 T7 발현 벡터 (써모피셔)로 클로닝한다. 다른 상업적으로 이용가능한 발현 벡터를 사용할 수 있다. 발현 벡터를 BL21(DE3) E. 콜라이 (또는 다른 T7 발현 E. 콜라이 균주)로 형질전환하고, 관련 기술분야에 공지된 프로토콜에 따라 정제를 위해 유도한다.
웨스턴 블롯
관련 기술분야에 공지된 바와 같이 웨스턴 블롯을 수행한다. HeLa 세포를 리포펙타민(Lipofectamine) 3000 형질감염 시약 (써모피셔)을 사용하여 각 pVAX1 구축물로 형질감염시킨다. 대조군으로서 GFP 리포터 유전자를 포함하는 pVAX1 플라스미드를 사용한다. 단백질 검출을 위해, SARS-CoV-2 pVAX1 조성물 또는 상업적으로 이용가능한 항-SARS-CoV-2 항체 중 하나 및 적절한 HRP 2차 항체로 면역화된 토끼로부터의 혈청을 사용한다. 피어스 TM ECL 플러스 웨스턴 블롯팅 기질(Pierce TM ECL Plus Western Blotting Substrate)을 사용하여 화학발광을 유도하고, 겔 Doc XR+ 시스템(Gel Doc XR+ System) (바이오래드(Biorad))를 이용하여 이미지를 수집한다.
면역화 프로토콜
생체내 구축물의 면역원성을 평가하기 위해, 마우스 및 토끼를 매월 간격으로 면역화시키고, 비장 및 혈액 수집을 위해 2주 후에 희생시킨다. 간략하면, 마우스 (군당 5-10마리)를 정규 니들 (27G) 주사에 의해 멸균 PBS 중 30-50 ㎕ 부피의 1-50 ㎍ 플라스미드 DNA로 전방 경골근 (TA) 근육에 근육내로 (i.m.) 면역화한 후, 이어서, 클리니포레이터2(Cliniporator2) 장치 (IGEA: 이탈리아 카르피)를 사용하여 생체내 전기천공 (EP)을 수행한다. 생체내 전기천공 동안, 1 ms 600 V/cm 펄스에 이어 400 ms 60 V/cm 펄스 패턴을 사용하여 DNA 흡수가 더욱 잘 이루어질 수 있도록 촉진시킨다. 백신 주사 전, 마우스에 진통제를 제공하고, 백신접종 동안 이소플루란 마취하에 유지시킨다. 토끼에서의 연구를 위해, 군당 2-4마리씩 뉴질랜드 화이트 토끼를 100 ㎍ 내지 900 ㎍ 플라스미드 DNA로 면역화시킨다. 백신을 300 ㎕ 멸균 PBS 중에서 우측 TA 근육으로 i.m. 주사에 의해 투여한 후, 생체내 EP를 수행한다.
효소 결합 면역스폿 검정법 ( ELISpot )에 의한 IFNγ 세포의 검출
마지막 면역화 2주 후, 각 면역화된 마우스 군으로부터의 비장세포를 풀링하고, 상업적으로 이용가능한 ELISpot 검정법 (맙테크(Mabtech: 스웨덴 나카 스트랜드))으로 SARS-CoV-2 유래 펩티드 및/또는 단백질을 이용하여 관련 기술분야에 공지된 바와 같이 48 h 동안 IFN-γ 분비에 기초하여 SARS-CoV-2 특이적 T 세포를 유도할 수 있는 그의 능력에 대해 시험하였다.
ELISA에 의한 항체 검출
관련 기술분야에 공지된 프로토콜을 사용하여 다양한 SARS-CoV-2 펩티드 및/또는 단백질에 대한 마우스 및 토끼 IgG 검출을 수행한다. 항체 역가는 (예컨대, 405 nm 또는 492 nm에서의) OD 값이 동일한 희석률에서의 음성 대조군 (비면역화된 또는 대조군 동물 혈청)의 OD의 적어도 2배인 종점 혈청 희석률로서 결정된다.
시험관내 SARS- CoV -2 중화 검정법
동물로부터의 면역화 혈청의 중화 능력을 시험관내에서 평가한다. Vero E6 세포를 배양 플레이트에서 전면생장시까지 성장시킨다. SARS-CoV-2 조성물로 면역화된 동물의 혈청 또는 대조군 동물의 혈청을 함유하는 배지를 세포에 첨가한다. 이어서, 세포를 SARS-CoV-2 바이러스 입자로 감염시킨다. 바이러스 게놈/유전자(들)의 검출에 의한 바이러스 플라크 또는 바이러스 역가를 계수함으로써 바이러스 감염성 및 혈청 중화를 평가한다.
hACE2 마우스 모델에서의 생체내 SARS- CoV -2 중화 검정법
야생형 또는 K18-hACE2 마우스를 SARS-CoV-2 면역원성 조성물 또는 대조군으로 면역화시킨다. DNA 단독 조성물, 단백질 단독 조성물, DNA 프라임/단백질 부스트 조성물, 또는 단백질-프라임/DNA-부스트 조성물을 포함하나, 이에 제한되지 않는 상이한 조합을 사용한다. 이어서, K18-hACE2 마우스를 SARS-CoV-2 바이러스 입자로 감염시킨다. 야생형 마우스의 경우, SARS-CoV-2로 감염시키기 1-5일 전에 유체역학적 주사, 또는 다른 관련 기술에 의해 야생형 마우스를 일시적으로 hACE2에 대해 트랜스제닉으로 만들었다. 마우스 체중, 증상, 이환율 및 사망률, 바이러스 부하를 포함한 바이러스 감염의 영향을 평가한다.
통계 분석
데이터를 그래프패드 프리즘(GraphPad Prism) V.5 및 V.8 소프트웨어 및 마이크로소프트 엑셀(Microsoft Excel) V.16.13.1을 사용하여 분석하였다.
실시예 3: SARS- CoV2 DNA 및 단백질 조성물이 동물에서 면역원성을 나타낸다
면역원성 조성물 및 백신은 전통적으로 전체 유기체 또는 항원성 단백질이었지만, 살아있는 조직에의 DNA 생체내 투여 및 후속된 항원성 단백질의 전사 및 번역 또한 면역 반응을 유발하는 데 매우 효과적이라는 것이 최근 밝혀졌다. 이러한 DNA 프라임/단백질 부스트 면역원성 조성물은 다양한 질환에 대한 잠재적인 백신 후보로서 탐색되고 있다.
마우스를 (1) 본원에 개시된 조성물 중 하나를 포함하는 DNA 조성물 (50 ㎍ DNA 3회 연속 용량), (2) 본원에 개시된 조성물 중 하나를 포함하는 폴리펩티드 조성물 (알룸 애주번트와 함께 20 ㎍ 단백질 3회 연속 용량), 또는 (3) 본원에 개시된 조성물 중 하나를 포함하는 DNA 조성물, 이어서, 본원에 개시된 조성물 중 하나를 포함하는 폴리펩티드 조성물 (50 ㎍ DNA 2회 용량, 이어서, 알룸과 함께 20 ㎍ 단백질 2회 용량)로 면역화시킨다.
1, 2, 3, 4, 5, 6, 또는 7일, 또는 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10주, 또는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12개월, 또는 상기 언급된 시간 중 임의의 두 시간으로 정의된 범위 이내의 어느 시간이든 DNA 프라임/단백질 부스트 조성물 투여 지속 기간으로서 그러한 시간이 경과한 후, SARS-CoV-2 항원에 대한 마우스의 면역을 평가한다. 백혈구를 마우스 전혈 샘플로부터 정제하고, S 단백질, RBD, M 단백질, 및 NP 단백질을 포함한, 정제된 폴리펩티드 항원과 함께 인큐베이션시킨다. 세포를 또한 양성 대조군으로서 콘카나발린 A ("ConA")와 함께, 및 음성 대조군으로서 두 오브알부민 펩티드 ("OVA Th" 및 "OVA CTL")와 함께 인큐베이션시킨다. 항원 노출에 대한 반응으로 나타나는 인터페론 감마 (IFNγ) 생산 세포의 집단 빈도를 효소 결합 면역스폿 검정법 (ELISpot)에 의해 평가한다. 간략하면, 백혈구를 IFNγ 항체로 코팅된 웰에서 항원과 함께 인큐베이션시킨다. 이어서, 세포를 제거하고, 비오티닐화된 IFNγ 항체, 알칼리성 포스파타제-가교결합된 스트렙타비딘 및 알칼리성 포스파타제 기질 비색 시약을 중간에 철저히 세척하면서 웰에 연속하여 첨가한다. 이어서, 플레이트를 건조시키고, IFNγ-분비 세포에 상응하는 잔여 착색 스폿을 현미경법으로 계수한다.
처리된 마우스는 전반적으로 비교적 더 강력한 면역 세포 반응을 나타낸다. 이는 상기 DNA 프라임/단백질 부스트 접근법이 특정 병원체에 대하여 전통적인 단백질 또는 유기체 기반 조성물보다 더 큰 강건한 면역원성 반응을 유도하는 데 효과적일 수 있다는 것을 입증하는 것이다.
상응하는 실험 또한 토끼 (오릭토라구스 쿠니쿠러스(Oryctolagus cuniculus))에서 수행한다. 뉴질랜드 화이트 토끼를 (1) 본원에 개시된 조성물 중 하나를 포함하는 DNA 조성물, (2) 본원에 개시된 조성물 중 하나 이상을 포함하는 단백질 단독 조성물, 또는 (3) 본원에 개시된 조성물 중 하나를 포함하는 DNA 프라임/단백질 부스트 조성물로 면역화시킨다. 조성물을 0, 4, 8, 및 12주째에 4회에 걸쳐 투여하고, 여기서, 각 용량당 900 ㎍ DNA im/EP 또는 알룸과 함께 300 ㎍ 단백질을 투여한다. DNA-단백질 조성물 (3)의 경우, 제1 용량을 위해 0주째 900 ㎍ DNA im/EP 투여하고, 제2, 제3, 및 제4 용량을 위해 4, 8, 및 12주째에 알룸과 함께 300 ㎍ 단백질을 투여한다. 혈청 중 항-RBD 역가는 0, 2, 10, 및 14주째 (즉, 각 투여 후 2주째) 평가한다. DNA 프라임/단백질 부스트 조성물 (3)은 DNA 단독 (1) 및 단백질 단독 (2) 조성물에 비해 더 큰 전체 역가를 초래할 뿐만 아니라, 2주째까지 단백질 단독 조성물에 비해 더 신속하게 강건한 항체 생산을 유도한다.
본원에 기술된 면역원성 조성물을 사용한 능동 면역화는 SARS-CoV-2 또는 코로나바이러스 항원에 대한 기능성 T 세포를 유도할 수 있다.
실시예 4: 면역원성 DNA 조성물은 동물에서 SARS- CoV -2 중화 항체의 생산을 유도한다
조성물 SVF-2, SVF-2.2, SVF-2.3, 또는 오직 스파이크 단백질만 (대조군으로서)을 포함하는 DNA 발현 카세트를 50 ㎍의 단일 용량으로 BALC/c 및 C57BL/6 마우스에 투여하였다. 투여 2주 후 시험 마우스로부터 혈청 샘플을 수득하고, ELISA (종점 역가) 및 시험관내 중화 검정법에 의해 SARS-CoV-2 단백질 성분에 특이적인 중화 항체의 존재를 평가하였다. 결과는 하기 표 2 (BALB/c) 및 3 (C57BL/6)에 제시되어 있다. 조성물 SVF-2.3은 스파이크 단백질로만 이루어진 조성물과 유사하게 항-SARS-CoV-2 스파이크 단백질 항체를 생산하였지만, BALB/c 마우스에서 SARS-CoV-2 핵단백질에 대한 면역원성도 부여하였다. 조성물 SVF-2.3으로 처리된 BALB/c 마우스로부터의 혈청도 시험관내 검정법에서 SARS-CoV-2 감염을 성공적으로 중화시켰다. (S=스파이크 단백질; RBD=수용체 결합 도메인; NP=핵단백질). 1차 면역화 후 3주째에 투여된 2차 면역화 후 2주째에 동일한 반응이 나타난다 (표 4 및 5).
표 2: DNA 조성물 투여 후 BALB /c 마우스 혈청의 정량화
Figure pct00002
표 3: DNA 조성물 투여 후 C57BL /6 마우스 혈청의 정량화
Figure pct00003
4: 2 라운드의 DNA 조성물 투여 후 BALB /c 마우스 혈청의 정량화
Figure pct00004
5: 2 라운드의 DNA 조성물 투여 후 C57BL /6 마우스 혈청의 정량화
Figure pct00005
실시예 5: 추가의 예시적인 구축물은 마우스에서 면역원성을 나타낸다.
BALB/c 및 C57BL/6 마우스를 0 및 3주째에 생체내 EP를 사용하여 50 ㎍의 플라스미드 구축물 DNA로 면역화시켰다. 사용된 구축물은 OC-2, OC-2.2, OC-2.3, OC-10, OC-10.2, OC-10.3, OC-12 및 OC-13이었으며, QS21 애주번트를 사용한 재조합 S 단백질을 대조군으로 사용하였다. 제2 용량 투여 2주 후에 시험 마우스로부터 혈청 샘플을 수득하고, ELISA에 의해 SARS-CoV-2 RBD 및 S 단백질에 특이적인 중화 항체의 존재를 평가하였다 (도 3a). 수준은 동일한 희석률에서 음성 대조군의 2배인 450 nm에서의 광학 밀도를 제공하는 최고 희석률로 정의되는 종점 역가로서 제시된다. 구축물 OC-2.3, OC-10.3, 및 OC-13은 BALB/c 및 C57BL/6 마우스, 둘 모두에서 강건한 면역원성 특성을 보였다.
SARS-CoV-2에 대한 면역화된 마우스 혈청의 시험관내 중화를 평가하였다. 각 마우스 군으로부터 얻은 풀링된 혈청 샘플을 SARS-CoV-2와 함께 인큐베이션시킨 후, 이어서, Vero-E6 세포에 첨가하였다. 바이러스 세포변성 효과 (CPE)의 수준을 현미경 검사에 의해 결정하고, 바이러스 신경화 역가 ID50은 CPE의 50% 억제를 제공하는 혈청의 희석률로서 결정하였다 (도 3b). 구축물 OC-2.3, OC-10.3, 및 OC-13으로 면역화된 마우스에서는 혈청이 SARS-CoV-2 감염성을 강건하게 중화시켰다.
실시예 6: 면역원성 조성물은 마우스에서 T 세포 반응을 유도한다
QS21 애주번트를 사용한 재조합 S 단백질을 대조군으로 사용하여, BALB/c 및 C57BL/6 마우스를 0 및 3주째에 생체내 EP를 사용하여 50 ㎍의 OC-2.3 및 OC-10.3 구축물 DNA로 면역화시켰다. RBD, M, 및 NP 단백질에 이르는 펩티드 풀에 대한 마우스 T 세포 반응을 인터페론 감마 ELISpot에 의해 검출하였다 (도 4). "S-KTH"는 왕립 공과대학교(Royal Technical University (KTH))로부터 제공받은 재조합 S 단백질을 나타낸다. "S-GS"는 진스크립트(Genscript)로부터 입수한 재조합 S 단백질 (#Z03501)을 나타낸다. "RBD-GS"는 진스크립트로부터 입수한 S 단백질 (#Z03479)의 재조합 RBD를 나타낸다. 상기 펩티드 풀은 10개 아미노산이 중첩되는 20개 아미노산 길이의 펩티드로 생성되었다. 오브알부민 펩티드를 음성 대조군으로 사용하고, 콘카나발린 A를 양성 대조군으로 사용하였다. RBD, M, 및 NP 단백질에 대한 서열을 함유하는 OC-2.3으로 면역화된 마우스에서는 RBD 및 N 펩티드 및 단백질에 대해 강력한 T 세포 활성화가 일어났지만, M 펩티드는 반응성이 더 작았다. 오직 RBD만을 포함하는 OC-10.3로 면역화된 마우스에서는 오직 RBD 펩티드 및 단백질에 대해서만 강건한 T 세포 활성화가 일어났다.
실시예 7: 면역화된 동물로부터의 혈청은 SARS- CoV -2 감염을 중화시키는 데 효과적이다.
생체내에서 SARS-CoV-2 감염을 중화시킬 수 있는 유도된 항체의 능력을 K18-hACE2 마우스 모델 또는 일시적 hACE2-트랜스제닉 야생형 마우스를 사용하여 추가로 결정한다. 면역화된 토끼 및 비면역화된 토끼로부터 전체 IgG를 정제하고, 마우스에 주사한다. DNA 프라임/단백질 부스트 유도 항체는 모든 챌린지된 마우스에서 DNA 단독 또는 단백질 단독 조성물보다 더욱 잘 바이러스혈증을 방어하거나, 또는 피크 바이러스혈증을 유의적으로 지연시킨다.
실시예 8: SARS- CoV -2 에피토프에 대한 T 세포 반응은 프라임 / 부스트 접근법으로 증진될 수 있다
BALB/c 마우스에서 OC-2.3 DNA 구축물 및 QS21 애주번트 (rS/QS21)와 함께 재조합 S 단백질을 사용하여 동종성 (DNA 단독 프라임 및 부스트; 또는 단백질 단독 프라임 및 부스트) 및 이종성 프라이밍 (DNA 프라임, 단백질 부스트; 또는 단백질 프라임, DNA 부스트)의 효과를 시험하였다. 마우스를 0 및 3주째에 생체내 EP를 사용하여 50 ㎍의 플라스미드 구축물 DNA, 또는 QS21 애주번트와 함께 재조합 S 단백질로 면역화시켰다. 도 5a는 면역화된 마우스 (시험된 5마리의 마우스, "0", "1", "3", "10", 및 "30"으로 표지)로부터의 혈청 중 항-S 단백질 역가를 보여주는 것이다. 4가지 조건 각각 (즉, 프라임 또는 부스트, 또는 그 둘 모두로서 S/QS21 펩티드 및 OC-2.3 DNA의 상이한 조합). 도 5b는 ELISpot에 의해 검출된, SARS-CoV-2 RBD, M, 및 NP 단백질에 이르는 펩티드 풀에 대한 면역화된 마우스로부터의 T 세포 반응을 보여주는 것이다. 상기 펩티드 풀은 10개 아미노산이 중첩되는 20개 아미노산 길이의 펩티드로 생성되었다. 오브알부민 펩티드를 음성 대조군으로 사용하고, 콘카나발린 A를 양성 대조군으로 사용하였다. OC-2.3 DNA 프라임 및 rS/QS21 부스트 접근법 및 rS/QS21 프라임 및 OC-2.3 DNA 프라임 접근법, 둘 모두에 대하여 알 수 있는 바와 같이, 이종성 조합은 NP 펩티드 및 단백질에 대한 반응성도 생성함과 동시에, RBD 단백질 및 펩티드에 대한 강건한 면역원성도 생성한다. SARS-CoV-2 바이러스 성분의 이러한 개선된 커버리지가 바이러스 뿐만 아니라, 특정 성분이 보존되는 다양한 균주 또는 돌연변이체에 대한 방어를 개선시킬 것이다.
실시예 9: 면역원성 조성물은 토끼 및 비인간 영장류에서 면역원성을 나타낸다.
토끼 및 사이노몰구스 마카크에서 OC-2.3 DNA 구축물의 면역원성 능력을 평가하였다. 0 및 3주째에 생체내 EP를 사용하여 500, 1000, 또는 1500 ㎍의 OC-2.3 DNA를 토끼에 투여하였다. 0 및 3주째에 생체내 EP를 사용하여 1000 ㎍의 OC-2.3 DNA를 마카크에 투여하였다. 맞춤형 주사 장치를 사용하여 단일 단계 절차를 사용함으로써 주사를 수행하였다. 동물에서의 항-S 항체 수준은 2차 투여 후 평가하였다 (도 6a-b). 수준은 동일한 희석률에서 음성 대조군의 2배인 450 nm에서의 광학 밀도를 제공하는 최고 희석률로 정의되는 종점 역가로서 제시된다.
0 및 3주째에 사이노몰구스 마카크 (3마리로 이루어진 군)를 2개 용량으로 1000 ㎍ OC-2.3 또는 대조군 DNA (HBV DNA)로 면역화시킨 후, 이어서, SARS-CoV-2로 챌린지하였다 (106 pfu/mL하에, 0.5 mL는 비내로 및 4.5 mL는 기관내로). 챌린지 후 4 및 20일째 기관지폐포 세척 (BAL) 샘플을 채취하고, qPCR에 의해 SARS-CoV-2 RNA를 정량화하였다 (도 6c). Ct 값이 40 초과라면, 이는 RNA 수준이 검출 한계 미만이라는 것을 나타내는 것이다. OC-2.3으로 면역화된 원숭이는 4 및 20일째 둘 모두에서 본질적으로 검출불가능한 수준의 SARS-CoV-2 RNA를 보인 반면, 대조군 DNA로 면역화된 원숭이는 4일째 검출가능한 SARS-CoV-2 감염을 보이고, 20일째까지 감염 제거를 보였다. BAL에서 항체 역가의 정량화 및 SARS-CoV-2 RNA의 존재는 표 6에 제공되어 있다. 대상체 4 및 5에서 면역화시 누출이 관찰되었다.
표 6. 시험된 사이노몰구스 마카크의 정량화
Figure pct00006
실시예 10: 예시적인 면역원성 조성물 후보를 이용한 인간 임상 시험
하기 실시예는 코로나바이러스, 예컨대 SARS-CoV-2에 의해 유발되는 바이러스 감염을 치료 또는 예방하는 데 사용되는, 임의적으로, 핵산 성분 및 폴리펩티드 성분으로 구성된, 면역원성 조성물 또는 생성물 조합물을 이용하는 실시양태를 기술한다.
DNA 프라임/단백질 부스트 조성물을 인간 환자에게 장내로, 경구로, 비내로, 비경구로, 피하로, 근육내로, 진피내로, 또는 정맥내로 투여한다. 상기 인간 환자는 현재 SARS-CoV-2로 감염된 상태이거나, SARS-CoV-2로 이전에 감염된 적이 있거나, SARS-CoV-2로 감염될 위험이 있거나, 또는 SARS-CoV-2로 감염되지 않은 것일 수 있다.
DNA 프라임 용량은 먼저 1, 10, 100, 1000 ng, 또는 1, 10, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000 ㎍, 또는 1, 10, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000 mg, 또는 상기 언급된 양 중 임의의 두 양으로 정의된 범위 이내의 어느 양이든 그러한 양으로, 또는 인간에서 최적의 효능을 발휘하는 데 적절한 임의의 다른 양으로 투여된다. 제1 DNA 프라임 용량 후, 1, 2, 3, 4, 또는 5회의 추가 DNA 프라임 용량은 이전 DNA 프라임 용량 투여 후 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 24, 36, 또는 48일 또는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 24, 36, 또는 48주 또는 상기 언급된 시간 중 임의의 두 시간으로 정의된 범위 이내에 언제든지, 예컨대 1-48일 또는 1-48주 이내에 투여될 수 있다. 단백질 부스트 용량은 DNA 프라임 용량 후, 1, 10, 100, 1000 ng, 또는 1, 10, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000 ㎍, 또는 1, 10, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000 mg, 또는 상기 언급된 양 중 임의의 두 양으로 정의된 범위 이내의 어느 양이든 그러한 양으로, 또는 인간에서 최적의 효능을 발휘하는 데 적절한 임의의 다른 양으로 투여된다. 제1 단백질 부스트 용량은 최종 DNA 프라임 용량 투여 후 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 24, 36, 또는 48일 또는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 24, 36, 또는 48주 또는 상기 언급된 시간 중 임의의 두 시간으로 정의된 범위 이내에 언제든지 투여된다. 제1 단백질 부스트 용량 후, 1, 2, 3, 4, 또는 5회의 추가 단백질 부스트 용량은 이전 단백질 부스트 용량 투여 후 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 24, 36, 또는 48일 또는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 24, 36, 또는 48주 또는 상기 언급된 시간 중 임의의 두 시간으로 정의된 범위 이내에 언제든지 투여될 수 있다.
환자는 SARS-CoV-2에 대한 성공적인 반응, 예를 들어, 항-S 단백질, 항-RBD, 항-M 단백질, 항-NP 단백질, 항-SARS-CoV2 또는 항-코로나바이러스 항체 생성에 대해 모니터링될 것이다. HDAg 서열이 포함된 조건하에서는 혈청 중 항-HDAg 항체도 시험한다. SARS-CoV-2 또는 코로나바이러스 항원에의 노출시 T 세포 및 다른 면역 세포의 신속한 활성화, 및 SARS-CoV-2 또는 코로나바이러스에 의한 추후 감염으로부터의 방어 또한 예상된다.
SARS-CoV-2 또는 코로나바이러스로 현재 감염된 상태이거나, 이전에 감염된 적이 있거나, 또는 감염 위험이 있는 환자에서, DNA 프라임/단백질 부스트 조성물 투여는 항바이러스 요법과 함께 수행될 수 있다. 잠재적인 항바이러스 요법 치료제로는 덱사메타손, 파비피라비르, 파필라비르, 렘데시비르, 토실리주맙, 갈리데시비르, 사릴루맙, 로피나비르, 리토나비르, 다루나비르, 리바비린, 인터페론-α, PEG화된 인터페론-α, 인터페론 알파-2b, 회복기 혈청, 또는 그의 임의의 조합을 포함하나, 이에 제한되지 않는다. 환자는 부작용, 예컨대 현기증, 메스꺼움, 설사, 우울증, 불면증, 두통, 가려움증, 발진, 발열 또는 제공된 항바이러스 치료제의 공지된 다른 부작용에 대해 모니터링될 것이다.
앞서 기술된 실시양태들 중 적어도 일부에서, 한 실시양태에서 사용된 하나 이상의 요소는 교체가 기술상 실현불가능하지 않는 한, 또 다른 실시양태에서 상호교환적으로 사용될 수 있다. 청구된 대상의 범주로부터 벗어남 없이, 상기 기술된 방법 및 구조에 대해 다양한 다른 생략, 추가 및 수정이 이루어질 수 있다는 것이 관련 기술분야의 통상의 기술자에 의해 이해될 것이다. 이러한 모든 수정 및 변경은 첨부된 청구범위에 의해 정의된 바와 같이 대상의 범주 내에 속하는 것으로 의도된다.
실질적으로 임의의 복수 및/또는 단수 용어의 사용과 관련하여, 관련 기술분야의 통상의 기술자는 맥락 및/또는 적용에 맞게 적절히 복수에서 단수로 및/또는 단수에서 복수로 번역할 수 있다. 명료함을 위해 다양한 단수/복수 순열이 본원에서 명시적으로 기술될 수 있다.
일반적으로, 본원에서 및 특히 첨부된 청구범위 (예컨대, 첨부된 청구범위의 본문)에서 사용되는 용어는 일반적으로 "개방형" 용어로서 의도된다는 것 (예를 들어, "포함하는"이라는 용어는 "~을 포함하나, 이에 제한되지 않는"으로 해석되어야 하고, "가지는"이라는 용어는 "적어도 ~을 갖는"으로 해석되어야 하고, "포함하다"라는 용어는 "~을 포함하나, 이에 제한되지 않는다"로 해석되어야 한다는 것 등)이 관련 기술분야의 통상의 기술자에 의해 이해될 것이다. 특정 번호의 도입된 청구범위 인용이 의도된 경우, 그러한 의도는 청구범위에 명시적으로 인용될 것이며, 그러한 인용이 없을 경우, 그러한 의도가 존재하지 않는다는 것도 추가로 관련 기술분야의 통상의 기술자에 의해 이해될 것이다. 예를 들어, 이해를 돕기 위해 하기 첨부된 청구범위는 청구범위 인용을 도입하기 위해 "적어도 하나의" 및 "하나 이상의"라는 도입 어구의 사용을 포함할 수 있다. 그러나, 그러한 어구의 사용이 단수형태 "하나"에 의한 청구범위 인용의 도입이 그러한 도입된 청구범위 인용을 포함하는 임의의 특정 청구범위를 오직 단 하나의 상기 인용만 포함하는 실시양태로 제한한다는 것을 의미하는 것으로 해석되어서는 안되며, 심지어 동일한 청구범위가 "하나 이상의" 또는 "적어도 하나의"라는 도입 어구 및 "예컨대, "하나"라는 단수형태를 포함하는 경우에도 그러하며 (예컨대, "하나" (예컨대, "하나" 및/또는 "하나")는 "적어도 하나의" 또는 "하나 이상의"를 의미하는 것으로 해석되어야 하며); 청구범위 인용을 도입하기 위해 사용되는 정관사를 사용하는 경우에도 마찬가지이다. 추가로, 특정 번호의 도입된 청구범위 인용이 명시적으로 언급되는 경우에도, 관련 기술분야의 통상의 기술자는 그러한 인용은 적어도 인용된 번호를 의미하는 것 (예를 들어, 다른 수식어 없이, "2개 인용"이라는 기본적 인용은 적어도 2개 인용, 또는 2개 이상 인용을 의미한다는 것)으로 해석되어야 한다는 것을 인식할 것이다. 추가로, "A, B, 및 C 등 중 적어도 하나"와 유사한 관례가 사용되는 경우, 일반적으로 그러한 구성은 관련 기술분야의 통상의 기술자가 관례를 이해하는 의미 (예컨대, "A, B 및 C 중 적어도 하나의 것을 갖는 시스템"은 A 단독, B 단독, C 단독, A 및 B를 함께, A 및 C를 함께, B 및 C를 함께, 및/또는 A, B, 및 C를 함께 갖는 시스템 등을 포함하나, 이에 제한되지 않는다는 것)로 의도된다. "A, B, 또는 C 등 중 적어도 하나"와 유사한 관례가 사용되는 경우, 일반적으로 그러한 구성은 관련 기술분야의 통상의 기술자가 관례를 이해하는 의미 (예컨대, "A, B, 또는 C 중 적어도 하나의 것을 갖는 시스템"은 A 단독, B 단독, C 단독, A 및 B를 함께, A 및 C를 함께, B 및 C를 함께, 및/또는 A, B, 및 C를 함께 갖는 시스템 등을 포함하나, 이에 제한되지 않는다는 것)로 의도된다. 설명 또는 청구범위에서든지 간에 둘 이상의 대안적 용어를 나타내는 이접적 단어 및/또는 어구는 사실상 용어 중 하나, 용어 중 어느 것이든 하나, 또는 그 둘 모두의 용어를 포함할 가능성을 고려하는 것으로 이해되어야 한다는 것이 관련 기술분야의 통상의 기술자에 의해 추가로 이해될 것이다. 예를 들어, "A 또는 B"라는 어구는 "A" 또는 "B" 또는 "A 및 B"의 가능성을 포함하는 것으로 이해될 것이다.
또한, 본 개시내용의 특징 또는 측면이 마쿠쉬(Markush) 그룹으로 기술되는 경우, 관련 기술분야의 통상의 기술자는 본 개시내용이 이에 의해 마쿠쉬 그룹의 임의의 개별 구성원 또는 구성원의 서브군으로 기술되는 것을 인식할 것이다.
관련 기술분야의 통상의 기술자에 의해 이해되는 바와 같이, 예컨대 서면 설명을 제공하는 것과 같은 임의의 모든 목적을 위해, 본원에 개시된 모든 범위는 그의 임의의 및 모든 가능한 하위 범위 및 하위 범위의 조합을 포함한다. 임의의 열거된 범위는 동일한 범위를 적어도 동일한 절반, 3분의 1, 4분의 1, 5분의 1, 10분의 1 등으로 나눌 수 있도록 충분히 설명하고 가능하게 하는 것으로 쉽게 인식될 수 있다. 비제한적인 예로서, 본원에서 논의된 각 범위는 하위 1/3, 중간 1/3 및 상위 1/3 등으로 쉽게 분류될 수 있다. 또한 관련 기술분야의 통상의 기술자에 의해 이해되는 바와 같이, 예컨대 "최대", "적어도", "초과", "미만" 등과 같은 모든 표현은 언급된 수치를 포함하고, 후속하여 상기 논의된 서브 범위로 나뉠 수 있는 범위를 지칭한다. 마지막으로, 관련 기술분야의 통상의 기술자에 의해 이해되는 바와 같이, 범위는 각각의 개별 구성원을 포함한다. 따라서, 예를 들어, 1-3개의 항목을 갖는 군은 1, 2 또는 3개의 항목을 갖는 군을 의미한다. 유사하게, 1-5개의 항목을 갖는 군은 1, 2, 3, 4 또는 5개의 항목을 갖는 군 등을 지칭한다.
공개 및 비공개 출원, 특허, 및 문헌 참고문헌을 포함하나, 이에 제한되지 않는, 본원에서 인용된 모든 참고 문헌은 그 전문이 본원에서 참조로 포함되며, 본원에서 본 명세서의 일부를 구성한다. 참조로 포함된 공개문헌 및 특허 또는 특허 출원이 본 명세서에 포함된 개시내용과 모순되는 정도로 본 명세서는 그러한 모순되는 자료를 대체 및/또는 우선하도록 의도된다.
본원에서 다양한 측면 및 실시양태가 개시되었지만, 다른 측면 및 실시양태가 관련 기술분야의 통상의 기술자에게 자명할 것이다. 본원의 다양한 측면 및 실시양태는 예시 목적으로 개시된 것이며, 제한하는 것으로 의도되지 않고, 진실된 범주 및 정신은 하기 청구범위에 의해 명시된다.
SEQUENCE LISTING <110> Svenska Vaccinfabriken Produktion Ab <120> COMPOSITIONS AND METHODS FOR TREATING AND PREVENTING CORONAVIRUSES <130> SVF.006PR4 <160> 76 <170> PatentIn version 3.5 <210> 1 <211> 2117 <212> DNA <213> Artificial Sequence <220> <223> SVF-1 wild-type DNA sequence <220> <221> BamHI_restriction_site <222> (1)..(6) <220> <221> Kozak <222> (7)..(15) <220> <221> RBD <222> (12)..(776) <220> <221> P2A <222> (777)..(842) <220> <221> NP <222> (843)..(2108) <220> <221> XbaI_restriction_site <222> (2112)..(2117) <400> 1 ggatccgcac catggcctta aaatataatg aaaatggaac cattacagat gctgtagact 60 gtgcacttga ccctctctca gaaacaaagt gtacgttgaa atccttcact gtagaaaaag 120 gaatctatca aacttctaac tttagagtcc aaccaacaga atctattgtt agatttccta 180 atattacaaa cttgtgccct tttggtgaag tttttaacgc caccagattt gcatctgttt 240 atgcttggaa caggaagaga atcagcaact gtgttgctga ttattctgtc ctatataatt 300 ccgcatcatt ttccactttt aagtgttatg gagtgtctcc tactaaatta aatgatctct 360 gctttactaa tgtctatgca gattcatttg taattagagg tgatgaagtc agacaaatcg 420 ctccagggca aactggaaag attgctgatt ataattataa attaccagat gattttacag 480 gctgcgttat agcttggaat tctaacaatc ttgattctaa ggttggtggt aattataatt 540 acctgtatag attgtttagg aagtctaatc tcaaaccttt tgagagagat atttcaactg 600 aaatctatca ggccggtagc acaccttgta atggtgttga aggttttaat tgttactttc 660 ctttacaatc atatggtttc caacccacta atggtgttgg ttaccaacca tacagagtag 720 tagtactttc ttttgaactt ctacatgcac cagcaactgt ttgtggacct aaaaagggaa 780 gcggagctac taacttcagc ctgctgaagc aggctggaga cgtggaggag aaccctggac 840 ctatggcaag cgacaatgga ccacagaatc agaggaacgc accaagaatc actttcggcg 900 gcccaagcga ctcaaccggc agcaatcaga acggagagcg gagcggagca agatccaagc 960 agagacggcc ccagggcctg ccaaacaata ccgcatcctg gttcaccgcc ctgacacagc 1020 acggcaagga ggacctgaag tttccaaggg gacagggagt gcctatcaac accaatagct 1080 cccctgacga tcagatcggc tactatagga gggcaacaag gagaatcagg ggaggcgacg 1140 gcaagatgaa ggatctgagc ccacgctggt acttctacta tctgggaacc ggacctgagg 1200 caggcctgcc atatggcgcc aataaggacg gaatcatctg ggtggcaacc gagggcgccc 1260 tgaacacacc aaaggatcac atcggcacaa gaaatcccgc caacaatgca gcaatcgtgc 1320 tgcagctgcc acagggaacc acactgccca agggctttta cgcagagggc tctcggggag 1380 gcagccaggc atctagcaga tcctctagcc ggagcagaaa ctcctctagg aattccaccc 1440 caggcagctc caggggcaca tcccctgccc gcatggcagg aaacggaggc gacgccgccc 1500 tggccctgct gctgctggat cgcctgaatc agctggagtc caagatgtct ggcaagggac 1560 agcagcagca gggacagacc gtgacaaaga agtccgccgc cgaggcctct aagaagccaa 1620 ggcagaagcg caccgccaca aaggcctaca acgtgaccca ggccttcggc aggcgcggac 1680 cagagcagac acagggcaat tttggcgacc aggagctgat caggcaggga accgattata 1740 agcactggcc tcagatcgcc cagttcgccc catctgccag cgccttcttt ggcatgagcc 1800 ggatcggaat ggaggtgacc ccaagcggca catggctgac ctacacaggc gccatcaagc 1860 tggacgataa ggaccctaac ttcaaggatc aggtcatcct gctgaacaag cacatcgacg 1920 cctataagac ctttccccct acagagccca agaaggacaa gaagaagaag gccgatgaga 1980 cacaggccct gcctcagagg cagaagaagc agcagaccgt gacactgctg ccagccgccg 2040 atctggacga tttctcaaaa cagctgcagc agtcaatgtc aagcgccgat tcaactcagg 2100 cataatgatg atctaga 2117 <210> 2 <211> 2780 <212> DNA <213> Artificial Sequence <220> <223> SVF-2 wild-type DNA sequence <220> <221> BamHI_restriction_site <222> (1)..(6) <220> <221> Kozak <222> (7)..(15) <220> <221> RBD <222> (12)..(776) <220> <221> P2A <222> (777)..(842) <220> <221> M <222> (843)..(1508) <220> <221> NP <222> (1509)..(2771) <220> <221> XbaI_restriction_site <222> (2775)..(2780) <400> 2 ggatccgcac catggcctta aaatataatg aaaatggaac cattacagat gctgtagact 60 gtgcacttga ccctctctca gaaacaaagt gtacgttgaa atccttcact gtagaaaaag 120 gaatctatca aacttctaac tttagagtcc aaccaacaga atctattgtt agatttccta 180 atattacaaa cttgtgccct tttggtgaag tttttaacgc caccagattt gcatctgttt 240 atgcttggaa caggaagaga atcagcaact gtgttgctga ttattctgtc ctatataatt 300 ccgcatcatt ttccactttt aagtgttatg gagtgtctcc tactaaatta aatgatctct 360 gctttactaa tgtctatgca gattcatttg taattagagg tgatgaagtc agacaaatcg 420 ctccagggca aactggaaag attgctgatt ataattataa attaccagat gattttacag 480 gctgcgttat agcttggaat tctaacaatc ttgattctaa ggttggtggt aattataatt 540 acctgtatag attgtttagg aagtctaatc tcaaaccttt tgagagagat atttcaactg 600 aaatctatca ggccggtagc acaccttgta atggtgttga aggttttaat tgttactttc 660 ctttacaatc atatggtttc caacccacta atggtgttgg ttaccaacca tacagagtag 720 tagtactttc ttttgaactt ctacatgcac cagcaactgt ttgtggacct aaaaagggaa 780 gcggagctac taacttcagc ctgctgaagc aggctggaga cgtggaggag aaccctggac 840 ctatggcaga ttccaacggt actattaccg ttgaagagct taaaaagctc cttgaacaat 900 ggaacctagt aataggtttc ctattcctta catggatttg tcttctacaa tttgcctatg 960 ccaacaggaa taggtttttg tatataatta agttaatttt cctctggctg ttatggccag 1020 taactttagc ttgttttgtg cttgctgctg tttacagaat aaattggatc accggtggaa 1080 ttgctatcgc aatggcttgt cttgtaggct tgatgtggct cagctacttc attgcttctt 1140 tcagactgtt tgcgcgtacg cgttccatgt ggtcattcaa tccagaaact aacattcttc 1200 tcaacgtgcc actccatggc actattctga ccagaccgct tctagaaagt gaactcgtaa 1260 tcggagctgt gatccttcgt ggacatcttc gtattgctgg acaccatcta ggacgctgtg 1320 acatcaagga cctgcctaaa gaaatcactg ttgctacatc acgaacgctt tcttattaca 1380 aattgggagc ttcgcagcgt gtagcaggtg actcaggttt tgctgcatac agtcgctaca 1440 ggattggcaa ctataaatta aacacagacc attccagtag cagtgacaat attgctttgc 1500 ttgtacaggc aagcgacaat ggaccacaga atcagaggaa cgcaccaaga atcactttcg 1560 gcggcccaag cgactcaacc ggcagcaatc agaacggaga gcggagcgga gcaagatcca 1620 agcagagacg gccccagggc ctgccaaaca ataccgcatc ctggttcacc gccctgacac 1680 agcacggcaa ggaggacctg aagtttccaa ggggacaggg agtgcctatc aacaccaata 1740 gctcccctga cgatcagatc ggctactata ggagggcaac aaggagaatc aggggaggcg 1800 acggcaagat gaaggatctg agcccacgct ggtacttcta ctatctggga accggacctg 1860 aggcaggcct gccatatggc gccaataagg acggaatcat ctgggtggca accgagggcg 1920 ccctgaacac accaaaggat cacatcggca caagaaatcc cgccaacaat gcagcaatcg 1980 tgctgcagct gccacaggga accacactgc ccaagggctt ttacgcagag ggctctcggg 2040 gaggcagcca ggcatctagc agatcctcta gccggagcag aaactcctct aggaattcca 2100 ccccaggcag ctccaggggc acatcccctg cccgcatggc aggaaacgga ggcgacgccg 2160 ccctggccct gctgctgctg gatcgcctga atcagctgga gtccaagatg tctggcaagg 2220 gacagcagca gcagggacag accgtgacaa agaagtccgc cgccgaggcc tctaagaagc 2280 caaggcagaa gcgcaccgcc acaaaggcct acaacgtgac ccaggccttc ggcaggcgcg 2340 gaccagagca gacacagggc aattttggcg accaggagct gatcaggcag ggaaccgatt 2400 ataagcactg gcctcagatc gcccagttcg ccccatctgc cagcgccttc tttggcatga 2460 gccggatcgg aatggaggtg accccaagcg gcacatggct gacctacaca ggcgccatca 2520 agctggacga taaggaccct aacttcaagg atcaggtcat cctgctgaac aagcacatcg 2580 acgcctataa gacctttccc cctacagagc ccaagaagga caagaagaag aaggccgatg 2640 agacacaggc cctgcctcag aggcagaaga agcagcagac cgtgacactg ctgccagccg 2700 ccgatctgga cgatttctca aaacagctgc agcagtcaat gtcaagcgcc gattcaactc 2760 aggcataatg atgatctaga 2780 <210> 3 <211> 2849 <212> DNA <213> Artificial Sequence <220> <223> SVF-3 wild-type DNA sequence <220> <221> BamHI_restriction_site <222> (1)..(6) <220> <221> Kozak <222> (7)..(15) <220> <221> RBD <222> (12)..(776) <220> <221> P2A <222> (777)..(842) <220> <221> M <222> (843)..(1508) <220> <221> P2A <222> (1509)..(1574) <220> <221> NP <222> (1575)..(2840) <220> <221> XbaI_restriction_site <222> (2844)..(2849) <400> 3 ggatccgcac catggcctta aaatataatg aaaatggaac cattacagat gctgtagact 60 gtgcacttga ccctctctca gaaacaaagt gtacgttgaa atccttcact gtagaaaaag 120 gaatctatca aacttctaac tttagagtcc aaccaacaga atctattgtt agatttccta 180 atattacaaa cttgtgccct tttggtgaag tttttaacgc caccagattt gcatctgttt 240 atgcttggaa caggaagaga atcagcaact gtgttgctga ttattctgtc ctatataatt 300 ccgcatcatt ttccactttt aagtgttatg gagtgtctcc tactaaatta aatgatctct 360 gctttactaa tgtctatgca gattcatttg taattagagg tgatgaagtc agacaaatcg 420 ctccagggca aactggaaag attgctgatt ataattataa attaccagat gattttacag 480 gctgcgttat agcttggaat tctaacaatc ttgattctaa ggttggtggt aattataatt 540 acctgtatag attgtttagg aagtctaatc tcaaaccttt tgagagagat atttcaactg 600 aaatctatca ggccggtagc acaccttgta atggtgttga aggttttaat tgttactttc 660 ctttacaatc atatggtttc caacccacta atggtgttgg ttaccaacca tacagagtag 720 tagtactttc ttttgaactt ctacatgcac cagcaactgt ttgtggacct aaaaagggaa 780 gcggagctac taacttcagc ctgctgaagc aggctggaga cgtggaggag aaccctggac 840 ctatggcaga ttccaacggt actattaccg ttgaagagct taaaaagctc cttgaacaat 900 ggaacctagt aataggtttc ctattcctta catggatttg tcttctacaa tttgcctatg 960 ccaacaggaa taggtttttg tatataatta agttaatttt cctctggctg ttatggccag 1020 taactttagc ttgttttgtg cttgctgctg tttacagaat aaattggatc accggtggaa 1080 ttgctatcgc aatggcttgt cttgtaggct tgatgtggct cagctacttc attgcttctt 1140 tcagactgtt tgcgcgtacg cgttccatgt ggtcattcaa tccagaaact aacattcttc 1200 tcaacgtgcc actccatggc actattctga ccagaccgct tctagaaagt gaactcgtaa 1260 tcggagctgt gatccttcgt ggacatcttc gtattgctgg acaccatcta ggacgctgtg 1320 acatcaagga cctgcctaaa gaaatcactg ttgctacatc acgaacgctt tcttattaca 1380 aattgggagc ttcgcagcgt gtagcaggtg actcaggttt tgctgcatac agtcgctaca 1440 ggattggcaa ctataaatta aacacagacc attccagtag cagtgacaat attgctttgc 1500 ttgtacaggg aagcggagct actaacttca gcctgctgaa gcaggctgga gacgtggagg 1560 agaaccctgg acctatggca agcgacaatg gaccacagaa tcagaggaac gcaccaagaa 1620 tcactttcgg cggcccaagc gactcaaccg gcagcaatca gaacggagag cggagcggag 1680 caagatccaa gcagagacgg ccccagggcc tgccaaacaa taccgcatcc tggttcaccg 1740 ccctgacaca gcacggcaag gaggacctga agtttccaag gggacaggga gtgcctatca 1800 acaccaatag ctcccctgac gatcagatcg gctactatag gagggcaaca aggagaatca 1860 ggggaggcga cggcaagatg aaggatctga gcccacgctg gtacttctac tatctgggaa 1920 ccggacctga ggcaggcctg ccatatggcg ccaataagga cggaatcatc tgggtggcaa 1980 ccgagggcgc cctgaacaca ccaaaggatc acatcggcac aagaaatccc gccaacaatg 2040 cagcaatcgt gctgcagctg ccacagggaa ccacactgcc caagggcttt tacgcagagg 2100 gctctcgggg aggcagccag gcatctagca gatcctctag ccggagcaga aactcctcta 2160 ggaattccac cccaggcagc tccaggggca catcccctgc ccgcatggca ggaaacggag 2220 gcgacgccgc cctggccctg ctgctgctgg atcgcctgaa tcagctggag tccaagatgt 2280 ctggcaaggg acagcagcag cagggacaga ccgtgacaaa gaagtccgcc gccgaggcct 2340 ctaagaagcc aaggcagaag cgcaccgcca caaaggccta caacgtgacc caggccttcg 2400 gcaggcgcgg accagagcag acacagggca attttggcga ccaggagctg atcaggcagg 2460 gaaccgatta taagcactgg cctcagatcg cccagttcgc cccatctgcc agcgccttct 2520 ttggcatgag ccggatcgga atggaggtga ccccaagcgg cacatggctg acctacacag 2580 gcgccatcaa gctggacgat aaggacccta acttcaagga tcaggtcatc ctgctgaaca 2640 agcacatcga cgcctataag acctttcccc ctacagagcc caagaaggac aagaagaaga 2700 aggccgatga gacacaggcc ctgcctcaga ggcagaagaa gcagcagacc gtgacactgc 2760 tgccagccgc cgatctggac gatttctcaa aacagctgca gcagtcaatg tcaagcgccg 2820 attcaactca ggcataatga tgatctaga 2849 <210> 4 <211> 1520 <212> DNA <213> Artificial Sequence <220> <223> SVF-4 wild-type DNA sequence <220> <221> BamHI_restriction_site <222> (1)..(6) <220> <221> Kozak <222> (7)..(15) <220> <221> RBD <222> (12)..(776) <220> <221> P2A <222> (777)..(842) <220> <221> M <222> (843)..(1508) <220> <221> XbaI_restriction_site <222> (1515)..(1520) <400> 4 ggatccgcac catggcctta aaatataatg aaaatggaac cattacagat gctgtagact 60 gtgcacttga ccctctctca gaaacaaagt gtacgttgaa atccttcact gtagaaaaag 120 gaatctatca aacttctaac tttagagtcc aaccaacaga atctattgtt agatttccta 180 atattacaaa cttgtgccct tttggtgaag tttttaacgc caccagattt gcatctgttt 240 atgcttggaa caggaagaga atcagcaact gtgttgctga ttattctgtc ctatataatt 300 ccgcatcatt ttccactttt aagtgttatg gagtgtctcc tactaaatta aatgatctct 360 gctttactaa tgtctatgca gattcatttg taattagagg tgatgaagtc agacaaatcg 420 ctccagggca aactggaaag attgctgatt ataattataa attaccagat gattttacag 480 gctgcgttat agcttggaat tctaacaatc ttgattctaa ggttggtggt aattataatt 540 acctgtatag attgtttagg aagtctaatc tcaaaccttt tgagagagat atttcaactg 600 aaatctatca ggccggtagc acaccttgta atggtgttga aggttttaat tgttactttc 660 ctttacaatc atatggtttc caacccacta atggtgttgg ttaccaacca tacagagtag 720 tagtactttc ttttgaactt ctacatgcac cagcaactgt ttgtggacct aaaaagggaa 780 gcggagctac taacttcagc ctgctgaagc aggctggaga cgtggaggag aaccctggac 840 ctatggcaga ttccaacggt actattaccg ttgaagagct taaaaagctc cttgaacaat 900 ggaacctagt aataggtttc ctattcctta catggatttg tcttctacaa tttgcctatg 960 ccaacaggaa taggtttttg tatataatta agttaatttt cctctggctg ttatggccag 1020 taactttagc ttgttttgtg cttgctgctg tttacagaat aaattggatc accggtggaa 1080 ttgctatcgc aatggcttgt cttgtaggct tgatgtggct cagctacttc attgcttctt 1140 tcagactgtt tgcgcgtacg cgttccatgt ggtcattcaa tccagaaact aacattcttc 1200 tcaacgtgcc actccatggc actattctga ccagaccgct tctagaaagt gaactcgtaa 1260 tcggagctgt gatccttcgt ggacatcttc gtattgctgg acaccatcta ggacgctgtg 1320 acatcaagga cctgcctaaa gaaatcactg ttgctacatc acgaacgctt tcttattaca 1380 aattgggagc ttcgcagcgt gtagcaggtg actcaggttt tgctgcatac agtcgctaca 1440 ggattggcaa ctataaatta aacacagacc attccagtag cagtgacaat attgctttgc 1500 ttgtacagtg atgatctaga 1520 <210> 5 <211> 2048 <212> DNA <213> Artificial Sequence <220> <223> SVF-5 wild-type DNA sequence <220> <221> BamHI_restriction_site <222> (1)..(6) <220> <221> Kozak <222> (7)..(15) <220> <221> RBD <222> (12)..(776) <220> <221> NP <222> (777)..(2033) <220> <221> XbaI_restriction_site <222> (2043)..(2048) <400> 5 ggatccgcac catggcctta aaatataatg aaaatggaac cattacagat gctgtagact 60 gtgcacttga ccctctctca gaaacaaagt gtacgttgaa atccttcact gtagaaaaag 120 gaatctatca aacttctaac tttagagtcc aaccaacaga atctattgtt agatttccta 180 atattacaaa cttgtgccct tttggtgaag tttttaacgc caccagattt gcatctgttt 240 atgcttggaa caggaagaga atcagcaact gtgttgctga ttattctgtc ctatataatt 300 ccgcatcatt ttccactttt aagtgttatg gagtgtctcc tactaaatta aatgatctct 360 gctttactaa tgtctatgca gattcatttg taattagagg tgatgaagtc agacaaatcg 420 ctccagggca aactggaaag attgctgatt ataattataa attaccagat gattttacag 480 gctgcgttat agcttggaat tctaacaatc ttgattctaa ggttggtggt aattataatt 540 acctgtatag attgtttagg aagtctaatc tcaaaccttt tgagagagat atttcaactg 600 aaatctatca ggccggtagc acaccttgta atggtgttga aggttttaat tgttactttc 660 ctttacaatc atatggtttc caacccacta atggtgttgg ttaccaacca tacagagtag 720 tagtactttc ttttgaactt ctacatgcac cagcaactgt ttgtggacct aaaaaggcaa 780 gcgacaatgg accacagaat cagaggaacg caccaagaat cactttcggc ggcccaagcg 840 actcaaccgg cagcaatcag aacggagagc ggagcggagc aagatccaag cagagacggc 900 cccagggcct gccaaacaat accgcatcct ggttcaccgc cctgacacag cacggcaagg 960 aggacctgaa gtttccaagg ggacagggag tgcctatcaa caccaatagc tcccctgacg 1020 atcagatcgg ctactatagg agggcaacaa ggagaatcag gggaggcgac ggcaagatga 1080 aggatctgag cccacgctgg tacttctact atctgggaac cggacctgag gcaggcctgc 1140 catatggcgc caataaggac ggaatcatct gggtggcaac cgagggcgcc ctgaacacac 1200 caaaggatca catcggcaca agaaatcccg ccaacaatgc agcaatcgtg ctgcagctgc 1260 cacagggaac cacactgccc aagggctttt acgcagaggg ctctcgggga ggcagccagg 1320 catctagcag atcctctagc cggagcagaa actcctctag gaattccacc ccaggcagct 1380 ccaggggcac atcccctgcc cgcatggcag gaaacggagg cgacgccgcc ctggccctgc 1440 tgctgctgga tcgcctgaat cagctggagt ccaagatgtc tggcaaggga cagcagcagc 1500 agggacagac cgtgacaaag aagtccgccg ccgaggcctc taagaagcca aggcagaagc 1560 gcaccgccac aaaggcctac aacgtgaccc aggccttcgg caggcgcgga ccagagcaga 1620 cacagggcaa ttttggcgac caggagctga tcaggcaggg aaccgattat aagcactggc 1680 ctcagatcgc ccagttcgcc ccatctgcca gcgccttctt tggcatgagc cggatcggaa 1740 tggaggtgac cccaagcggc acatggctga cctacacagg cgccatcaag ctggacgata 1800 aggaccctaa cttcaaggat caggtcatcc tgctgaacaa gcacatcgac gcctataaga 1860 cctttccccc tacagagccc aagaaggaca agaagaagaa ggccgatgag acacaggccc 1920 tgcctcagag gcagaagaag cagcagaccg tgacactgct gccagccgcc gatctggacg 1980 atttctcaaa acagctgcag cagtcaatgt caagcgccga ttcaactcag gcataatgat 2040 gatctaga 2048 <210> 6 <211> 2711 <212> DNA <213> Artificial Sequence <220> <223> SVF-6 wild-type DNA sequence <220> <221> BamHI_restriction_site <222> (1)..(6) <220> <221> Kozak <222> (7)..(15) <220> <221> RBD <222> (12)..(776) <220> <221> M <222> (777)..(1439) <220> <221> NP <222> (1440)..(2702) <220> <221> XbaI_restriction_site <222> (2706)..(2711) <400> 6 ggatccgcac catggcctta aaatataatg aaaatggaac cattacagat gctgtagact 60 gtgcacttga ccctctctca gaaacaaagt gtacgttgaa atccttcact gtagaaaaag 120 gaatctatca aacttctaac tttagagtcc aaccaacaga atctattgtt agatttccta 180 atattacaaa cttgtgccct tttggtgaag tttttaacgc caccagattt gcatctgttt 240 atgcttggaa caggaagaga atcagcaact gtgttgctga ttattctgtc ctatataatt 300 ccgcatcatt ttccactttt aagtgttatg gagtgtctcc tactaaatta aatgatctct 360 gctttactaa tgtctatgca gattcatttg taattagagg tgatgaagtc agacaaatcg 420 ctccagggca aactggaaag attgctgatt ataattataa attaccagat gattttacag 480 gctgcgttat agcttggaat tctaacaatc ttgattctaa ggttggtggt aattataatt 540 acctgtatag attgtttagg aagtctaatc tcaaaccttt tgagagagat atttcaactg 600 aaatctatca ggccggtagc acaccttgta atggtgttga aggttttaat tgttactttc 660 ctttacaatc atatggtttc caacccacta atggtgttgg ttaccaacca tacagagtag 720 tagtactttc ttttgaactt ctacatgcac cagcaactgt ttgtggacct aaaaaggcag 780 attccaacgg tactattacc gttgaagagc ttaaaaagct ccttgaacaa tggaacctag 840 taataggttt cctattcctt acatggattt gtcttctaca atttgcctat gccaacagga 900 ataggttttt gtatataatt aagttaattt tcctctggct gttatggcca gtaactttag 960 cttgttttgt gcttgctgct gtttacagaa taaattggat caccggtgga attgctatcg 1020 caatggcttg tcttgtaggc ttgatgtggc tcagctactt cattgcttct ttcagactgt 1080 ttgcgcgtac gcgttccatg tggtcattca atccagaaac taacattctt ctcaacgtgc 1140 cactccatgg cactattctg accagaccgc ttctagaaag tgaactcgta atcggagctg 1200 tgatccttcg tggacatctt cgtattgctg gacaccatct aggacgctgt gacatcaagg 1260 acctgcctaa agaaatcact gttgctacat cacgaacgct ttcttattac aaattgggag 1320 cttcgcagcg tgtagcaggt gactcaggtt ttgctgcata cagtcgctac aggattggca 1380 actataaatt aaacacagac cattccagta gcagtgacaa tattgctttg cttgtacagg 1440 caagcgacaa tggaccacag aatcagagga acgcaccaag aatcactttc ggcggcccaa 1500 gcgactcaac cggcagcaat cagaacggag agcggagcgg agcaagatcc aagcagagac 1560 ggccccaggg cctgccaaac aataccgcat cctggttcac cgccctgaca cagcacggca 1620 aggaggacct gaagtttcca aggggacagg gagtgcctat caacaccaat agctcccctg 1680 acgatcagat cggctactat aggagggcaa caaggagaat caggggaggc gacggcaaga 1740 tgaaggatct gagcccacgc tggtacttct actatctggg aaccggacct gaggcaggcc 1800 tgccatatgg cgccaataag gacggaatca tctgggtggc aaccgagggc gccctgaaca 1860 caccaaagga tcacatcggc acaagaaatc ccgccaacaa tgcagcaatc gtgctgcagc 1920 tgccacaggg aaccacactg cccaagggct tttacgcaga gggctctcgg ggaggcagcc 1980 aggcatctag cagatcctct agccggagca gaaactcctc taggaattcc accccaggca 2040 gctccagggg cacatcccct gcccgcatgg caggaaacgg aggcgacgcc gccctggccc 2100 tgctgctgct ggatcgcctg aatcagctgg agtccaagat gtctggcaag ggacagcagc 2160 agcagggaca gaccgtgaca aagaagtccg ccgccgaggc ctctaagaag ccaaggcaga 2220 agcgcaccgc cacaaaggcc tacaacgtga cccaggcctt cggcaggcgc ggaccagagc 2280 agacacaggg caattttggc gaccaggagc tgatcaggca gggaaccgat tataagcact 2340 ggcctcagat cgcccagttc gccccatctg ccagcgcctt ctttggcatg agccggatcg 2400 gaatggaggt gaccccaagc ggcacatggc tgacctacac aggcgccatc aagctggacg 2460 ataaggaccc taacttcaag gatcaggtca tcctgctgaa caagcacatc gacgcctata 2520 agacctttcc ccctacagag cccaagaagg acaagaagaa gaaggccgat gagacacagg 2580 ccctgcctca gaggcagaag aagcagcaga ccgtgacact gctgccagcc gccgatctgg 2640 acgatttctc aaaacagctg cagcagtcaa tgtcaagcgc cgattcaact caggcataat 2700 gatgatctag a 2711 <210> 7 <211> 1451 <212> DNA <213> Artificial Sequence <220> <223> SVF-7 wild-type DNA sequence <220> <221> BamHI_restriction_site <222> (1)..(6) <220> <221> Kozak <222> (7)..(15) <220> <221> RBD <222> (12)..(776) <220> <221> M <222> (777)..(1439) <220> <221> XbaI_restriction_site <222> (1446)..(1451) <400> 7 ggatccgcac catggcctta aaatataatg aaaatggaac cattacagat gctgtagact 60 gtgcacttga ccctctctca gaaacaaagt gtacgttgaa atccttcact gtagaaaaag 120 gaatctatca aacttctaac tttagagtcc aaccaacaga atctattgtt agatttccta 180 atattacaaa cttgtgccct tttggtgaag tttttaacgc caccagattt gcatctgttt 240 atgcttggaa caggaagaga atcagcaact gtgttgctga ttattctgtc ctatataatt 300 ccgcatcatt ttccactttt aagtgttatg gagtgtctcc tactaaatta aatgatctct 360 gctttactaa tgtctatgca gattcatttg taattagagg tgatgaagtc agacaaatcg 420 ctccagggca aactggaaag attgctgatt ataattataa attaccagat gattttacag 480 gctgcgttat agcttggaat tctaacaatc ttgattctaa ggttggtggt aattataatt 540 acctgtatag attgtttagg aagtctaatc tcaaaccttt tgagagagat atttcaactg 600 aaatctatca ggccggtagc acaccttgta atggtgttga aggttttaat tgttactttc 660 ctttacaatc atatggtttc caacccacta atggtgttgg ttaccaacca tacagagtag 720 tagtactttc ttttgaactt ctacatgcac cagcaactgt ttgtggacct aaaaaggcag 780 attccaacgg tactattacc gttgaagagc ttaaaaagct ccttgaacaa tggaacctag 840 taataggttt cctattcctt acatggattt gtcttctaca atttgcctat gccaacagga 900 ataggttttt gtatataatt aagttaattt tcctctggct gttatggcca gtaactttag 960 cttgttttgt gcttgctgct gtttacagaa taaattggat caccggtgga attgctatcg 1020 caatggcttg tcttgtaggc ttgatgtggc tcagctactt cattgcttct ttcagactgt 1080 ttgcgcgtac gcgttccatg tggtcattca atccagaaac taacattctt ctcaacgtgc 1140 cactccatgg cactattctg accagaccgc ttctagaaag tgaactcgta atcggagctg 1200 tgatccttcg tggacatctt cgtattgctg gacaccatct aggacgctgt gacatcaagg 1260 acctgcctaa agaaatcact gttgctacat cacgaacgct ttcttattac aaattgggag 1320 cttcgcagcg tgtagcaggt gactcaggtt ttgctgcata cagtcgctac aggattggca 1380 actataaatt aaacacagac cattccagta gcagtgacaa tattgctttg cttgtacagt 1440 gatgatctag a 1451 <210> 8 <211> 3344 <212> DNA <213> Artificial Sequence <220> <223> SVF-8 wild-type DNA sequence <220> <221> BamHI_restriction_site <222> (1)..(6) <220> <221> Kozak <222> (7)..(15) <220> <221> RBD <222> (12)..(776) <220> <221> HDAg_genotype_1A <222> (777)..(1415) <220> <221> HDAg_genotype_1B <222> (1416)..(2054) <220> <221> HDAg_genotype_2A <222> (2055)..(2693) <220> <221> HDAg_genotype_2B <222> (2694)..(3332) <220> <221> XbaI_restriction_site <222> (3339)..(3344) <400> 8 ggatccgcac catggcctta aaatataatg aaaatggaac cattacagat gctgtagact 60 gtgcacttga ccctctctca gaaacaaagt gtacgttgaa atccttcact gtagaaaaag 120 gaatctatca aacttctaac tttagagtcc aaccaacaga atctattgtt agatttccta 180 atattacaaa cttgtgccct tttggtgaag tttttaacgc caccagattt gcatctgttt 240 atgcttggaa caggaagaga atcagcaact gtgttgctga ttattctgtc ctatataatt 300 ccgcatcatt ttccactttt aagtgttatg gagtgtctcc tactaaatta aatgatctct 360 gctttactaa tgtctatgca gattcatttg taattagagg tgatgaagtc agacaaatcg 420 ctccagggca aactggaaag attgctgatt ataattataa attaccagat gattttacag 480 gctgcgttat agcttggaat tctaacaatc ttgattctaa ggttggtggt aattataatt 540 acctgtatag attgtttagg aagtctaatc tcaaaccttt tgagagagat atttcaactg 600 aaatctatca ggccggtagc acaccttgta atggtgttga aggttttaat tgttactttc 660 ctttacaatc atatggtttc caacccacta atggtgttgg ttaccaacca tacagagtag 720 tagtactttc ttttgaactt ctacatgcac cagcaactgt ttgtggacct aaaaagagcc 780 gcagcgaaag caaaaaaaac cgcggcggcc gcgaagaaat tctggaacag tgggtgggcg 840 cgcgcaaaaa actggaagaa ctggaacgcg atctgcgcaa aattaaaaaa aaaattaaaa 900 aactggaaga agaaaacccg tggctgggca acattaaagg cattctgggc aaaaaagatc 960 gcgaaggcga aggcgcgccg ccggcgaaac gcgcgcgcgc ggatcagatg gaagtggata 1020 gcggcccgcg caaacgcccg tttcgcggcg aatttaccga taaagaacgc cgcgatcatc 1080 gccgccgcaa agcgctggaa aacaaacgca aacagctgag cagcggcggc aaaagcctga 1140 gcaaagaaga agaagaagaa ctgcgcaaac tgaccgaaga agatgaacgc cgcgaacgcc 1200 gcgtggcggg cccgcgcgtg ggcggcgtga acccgctgga aggcggcacc cgcggcgcgc 1260 cgggcggcgg ctttgtgccg agcatgcagg gcgtgccgga aagcccgttt gcgcgcaccg 1320 gcgaaggcct ggatgtgcgc ggcaaccagg gctttccgtg ggatattctg tttccggcgg 1380 atccgccgtt tagcccgcag agctgccgcc cgcagagccg cagcgaaagc aaaaaaaacc 1440 gcggcggccg cgaagaagtg ctggaacagt gggtgaacgg ccgcaaaaaa ctggaagaac 1500 tggaacgcga actgcgccgc gcgcgcaaaa aaattaaaaa actggaagat gataacccgt 1560 ggctgggcaa cgtgaaaggc attctgggca aaaaagataa agatggcgaa ggcgcgccgc 1620 cggcgaaacg cgcgcgcacc gatcagatgg aaattgatag cggcccgcgc aaacgcccgc 1680 tgcgcggcgg ctttaccgat cgcgaacgcc aggatcatcg ccgccgcaaa gcgctgaaaa 1740 acaaaaaaaa acagctgagc gcgggcggca aaagcctgag caaagaagaa gaagaagaac 1800 tgaaacgcct gacccgcgaa gatgaagaac gcaaaaaaga agaacatggc ccgagccgcc 1860 tgggcgtgaa cccgagcgaa ggcggcccgc gcggcgcgcc gggcggcggc tttgtgccga 1920 gcatgcaggg cattccggaa agccgcttta cccgcaccgg cgaaggcctg gatgtgcgcg 1980 gcagccgcgg ctttccgcag gatattctgt ttccgagcga tccgccgttt agcccgcaga 2040 gctgccgccc gcagagccag agcgaaaccc gccgcggccg ccgcggcacc cgcgaagaaa 2100 ccctggaaaa atggattacc gcgcgcaaaa aagcggaaga actggaaaaa gatctgcgca 2160 aaacccgcaa aaccattaaa aaactggaag aagaaaaccc gtggctgggc aacattgtgg 2220 gcattattcg caaaggcaaa gatggcgaag gcgcgccgcc ggcgaaacgc ccgcgcaccg 2280 atcagatgga agtggatagc ggcccgggca aacgcccgca taaaagcggc tttaccgata 2340 aagaacgcga agatcatcgc cgccgcaaag cgctggaaaa caaaaaaaaa cagctgagcg 2400 cgggcggcaa aattctgagc aaagaagaag aagaagaact gcgccgcctg accgatgaag 2460 atgaagaacg caaacgccgc gtggcgggcc cgcgcgtggg cgatgtgaac ccgagccgcg 2520 gcggcccgcg cggcgcgccg ggcggcggct ttgtgccgca gatggcgggc gtgccggaaa 2580 gcccgtttag ccgcaccggc gaaggcctgg atattcgcgg cacccagggc tttccgtggg 2640 tgagcccgag cccgccgcag cagcgcctgc cgctgctgga atgcaccccg cagagccaga 2700 gcgaaagcaa aaaaaaccgc cgcggcggcc gcgaagatat tctggaaaaa tggattacca 2760 cccgccgcaa agcggaagaa ctggaaaaag atctgcgcaa agcgcgcaaa accattaaaa 2820 aactggaaga tgaaaacccg tggctgggca acattattgg cattattcgc aaaggcaaag 2880 atggcgaagg cgcgccgccg gcgaaacgcc cgcgcaccga tcagatggaa attgatagcg 2940 gcaccggcaa acgcccgcat aaaagcggct ttaccgataa agaacgcgaa gatcatcgcc 3000 gccgcaaagc gctggaaaac aaaaaaaaac agctgagcag cggcggcaaa aacctgagcc 3060 gcgaagaaga agaagaactg ggccgcctga ccgtggaaga tgaagaacgc cgccgccgcg 3120 tggcgggccc gcgcaccggc gatgtgaacc tgagcggcgg cggcccgcgc ggcgcgccgg 3180 gcggcggctt tgtgccgcgc atggaaggcg tgccggaaag cccgtttacc cgcaccggcg 3240 aaggcctgga tattcgcggc aaccagggct ttccgtgggt gcgcccgagc ccgccgcagc 3300 agcgcctgcc gctgctggaa tgcaccccgc agtgatgatc taga 3344 <210> 9 <211> 3620 <212> DNA <213> Artificial Sequence <220> <223> SVF-9 wild-type DNA sequence <220> <221> BamHI_restriction_site <222> (1)..(6) <220> <221> Kozak <222> (7)..(15) <220> <221> RBD <222> (12)..(776) <220> <221> P2A <222> (777)..(842) <220> <221> HDAg_genotype_1A <222> (843)..(1484) <220> <221> P2A <222> (1485)..(1550) <220> <221> HDAg_genotype_1B <222> (1551)..(2192) <220> <221> P2A <222> (2193)..(2258) <220> <221> HDAg_genotype_2A <222> (2259)..(2900) <220> <221> P2A <222> (2901)..(2966) <220> <221> HDAg_genotype_2B <222> (2967)..(3608) <220> <221> XbaI_restriction_site <222> (3615)..(3620) <400> 9 ggatccgcac catggcctta aaatataatg aaaatggaac cattacagat gctgtagact 60 gtgcacttga ccctctctca gaaacaaagt gtacgttgaa atccttcact gtagaaaaag 120 gaatctatca aacttctaac tttagagtcc aaccaacaga atctattgtt agatttccta 180 atattacaaa cttgtgccct tttggtgaag tttttaacgc caccagattt gcatctgttt 240 atgcttggaa caggaagaga atcagcaact gtgttgctga ttattctgtc ctatataatt 300 ccgcatcatt ttccactttt aagtgttatg gagtgtctcc tactaaatta aatgatctct 360 gctttactaa tgtctatgca gattcatttg taattagagg tgatgaagtc agacaaatcg 420 ctccagggca aactggaaag attgctgatt ataattataa attaccagat gattttacag 480 gctgcgttat agcttggaat tctaacaatc ttgattctaa ggttggtggt aattataatt 540 acctgtatag attgtttagg aagtctaatc tcaaaccttt tgagagagat atttcaactg 600 aaatctatca ggccggtagc acaccttgta atggtgttga aggttttaat tgttactttc 660 ctttacaatc atatggtttc caacccacta atggtgttgg ttaccaacca tacagagtag 720 tagtactttc ttttgaactt ctacatgcac cagcaactgt ttgtggacct aaaaagggaa 780 gcggagctac taacttcagc ctgctgaagc aggctggaga cgtggaggag aaccctggac 840 ctatgagccg cagcgaaagc aaaaaaaacc gcggcggccg cgaagaaatt ctggaacagt 900 gggtgggcgc gcgcaaaaaa ctggaagaac tggaacgcga tctgcgcaaa attaaaaaaa 960 aaattaaaaa actggaagaa gaaaacccgt ggctgggcaa cattaaaggc attctgggca 1020 aaaaagatcg cgaaggcgaa ggcgcgccgc cggcgaaacg cgcgcgcgcg gatcagatgg 1080 aagtggatag cggcccgcgc aaacgcccgt ttcgcggcga atttaccgat aaagaacgcc 1140 gcgatcatcg ccgccgcaaa gcgctggaaa acaaacgcaa acagctgagc agcggcggca 1200 aaagcctgag caaagaagaa gaagaagaac tgcgcaaact gaccgaagaa gatgaacgcc 1260 gcgaacgccg cgtggcgggc ccgcgcgtgg gcggcgtgaa cccgctggaa ggcggcaccc 1320 gcggcgcgcc gggcggcggc tttgtgccga gcatgcaggg cgtgccggaa agcccgtttg 1380 cgcgcaccgg cgaaggcctg gatgtgcgcg gcaaccaggg ctttccgtgg gatattctgt 1440 ttccggcgga tccgccgttt agcccgcaga gctgccgccc gcagggaagc ggagctacta 1500 acttcagcct gctgaagcag gctggagacg tggaggagaa ccctggacct atgagccgca 1560 gcgaaagcaa aaaaaaccgc ggcggccgcg aagaagtgct ggaacagtgg gtgaacggcc 1620 gcaaaaaact ggaagaactg gaacgcgaac tgcgccgcgc gcgcaaaaaa attaaaaaac 1680 tggaagatga taacccgtgg ctgggcaacg tgaaaggcat tctgggcaaa aaagataaag 1740 atggcgaagg cgcgccgccg gcgaaacgcg cgcgcaccga tcagatggaa attgatagcg 1800 gcccgcgcaa acgcccgctg cgcggcggct ttaccgatcg cgaacgccag gatcatcgcc 1860 gccgcaaagc gctgaaaaac aaaaaaaaac agctgagcgc gggcggcaaa agcctgagca 1920 aagaagaaga agaagaactg aaacgcctga cccgcgaaga tgaagaacgc aaaaaagaag 1980 aacatggccc gagccgcctg ggcgtgaacc cgagcgaagg cggcccgcgc ggcgcgccgg 2040 gcggcggctt tgtgccgagc atgcagggca ttccggaaag ccgctttacc cgcaccggcg 2100 aaggcctgga tgtgcgcggc agccgcggct ttccgcagga tattctgttt ccgagcgatc 2160 cgccgtttag cccgcagagc tgccgcccgc agggaagcgg agctactaac ttcagcctgc 2220 tgaagcaggc tggagacgtg gaggagaacc ctggacctat gagccagagc gaaacccgcc 2280 gcggccgccg cggcacccgc gaagaaaccc tggaaaaatg gattaccgcg cgcaaaaaag 2340 cggaagaact ggaaaaagat ctgcgcaaaa cccgcaaaac cattaaaaaa ctggaagaag 2400 aaaacccgtg gctgggcaac attgtgggca ttattcgcaa aggcaaagat ggcgaaggcg 2460 cgccgccggc gaaacgcccg cgcaccgatc agatggaagt ggatagcggc ccgggcaaac 2520 gcccgcataa aagcggcttt accgataaag aacgcgaaga tcatcgccgc cgcaaagcgc 2580 tggaaaacaa aaaaaaacag ctgagcgcgg gcggcaaaat tctgagcaaa gaagaagaag 2640 aagaactgcg ccgcctgacc gatgaagatg aagaacgcaa acgccgcgtg gcgggcccgc 2700 gcgtgggcga tgtgaacccg agccgcggcg gcccgcgcgg cgcgccgggc ggcggctttg 2760 tgccgcagat ggcgggcgtg ccggaaagcc cgtttagccg caccggcgaa ggcctggata 2820 ttcgcggcac ccagggcttt ccgtgggtga gcccgagccc gccgcagcag cgcctgccgc 2880 tgctggaatg caccccgcag ggaagcggag ctactaactt cagcctgctg aagcaggctg 2940 gagacgtgga ggagaaccct ggacctatga gccagagcga aagcaaaaaa aaccgccgcg 3000 gcggccgcga agatattctg gaaaaatgga ttaccacccg ccgcaaagcg gaagaactgg 3060 aaaaagatct gcgcaaagcg cgcaaaacca ttaaaaaact ggaagatgaa aacccgtggc 3120 tgggcaacat tattggcatt attcgcaaag gcaaagatgg cgaaggcgcg ccgccggcga 3180 aacgcccgcg caccgatcag atggaaattg atagcggcac cggcaaacgc ccgcataaaa 3240 gcggctttac cgataaagaa cgcgaagatc atcgccgccg caaagcgctg gaaaacaaaa 3300 aaaaacagct gagcagcggc ggcaaaaacc tgagccgcga agaagaagaa gaactgggcc 3360 gcctgaccgt ggaagatgaa gaacgccgcc gccgcgtggc gggcccgcgc accggcgatg 3420 tgaacctgag cggcggcggc ccgcgcggcg cgccgggcgg cggctttgtg ccgcgcatgg 3480 aaggcgtgcc ggaaagcccg tttacccgca ccggcgaagg cctggatatt cgcggcaacc 3540 agggctttcc gtgggtgcgc ccgagcccgc cgcagcagcg cctgccgctg ctggaatgca 3600 ccccgcagtg atgatctaga 3620 <210> 10 <211> 788 <212> DNA <213> Artificial Sequence <220> <223> SVF-10 wild-type DNA sequence <220> <221> BamHI_restriction_site <222> (1)..(6) <220> <221> Kozak <222> (7)..(15) <220> <221> RBD <222> (12)..(776) <220> <221> XbaI_restriction_site <222> (783)..(788) <400> 10 ggatccgcac catggcctta aaatataatg aaaatggaac cattacagat gctgtagact 60 gtgcacttga ccctctctca gaaacaaagt gtacgttgaa atccttcact gtagaaaaag 120 gaatctatca aacttctaac tttagagtcc aaccaacaga atctattgtt agatttccta 180 atattacaaa cttgtgccct tttggtgaag tttttaacgc caccagattt gcatctgttt 240 atgcttggaa caggaagaga atcagcaact gtgttgctga ttattctgtc ctatataatt 300 ccgcatcatt ttccactttt aagtgttatg gagtgtctcc tactaaatta aatgatctct 360 gctttactaa tgtctatgca gattcatttg taattagagg tgatgaagtc agacaaatcg 420 ctccagggca aactggaaag attgctgatt ataattataa attaccagat gattttacag 480 gctgcgttat agcttggaat tctaacaatc ttgattctaa ggttggtggt aattataatt 540 acctgtatag attgtttagg aagtctaatc tcaaaccttt tgagagagat atttcaactg 600 aaatctatca ggccggtagc acaccttgta atggtgttga aggttttaat tgttactttc 660 ctttacaatc atatggtttc caacccacta atggtgttgg ttaccaacca tacagagtag 720 tagtactttc ttttgaactt ctacatgcac cagcaactgt ttgtggacct aaaaagtgat 780 gatctaga 788 <210> 11 <211> 689 <212> DNA <213> Artificial Sequence <220> <223> SVF-11 wild-type DNA sequence <220> <221> BamHI_restriction_site <222> (1)..(6) <220> <221> Kozak <222> (7)..(15) <220> <221> M <222> (12)..(677) <220> <221> XbaI_restriction_site <222> (684)..(689) <400> 11 ggatccgcac catggcagat tccaacggta ctattaccgt tgaagagctt aaaaagctcc 60 ttgaacaatg gaacctagta ataggtttcc tattccttac atggatttgt cttctacaat 120 ttgcctatgc caacaggaat aggtttttgt atataattaa gttaattttc ctctggctgt 180 tatggccagt aactttagct tgttttgtgc ttgctgctgt ttacagaata aattggatca 240 ccggtggaat tgctatcgca atggcttgtc ttgtaggctt gatgtggctc agctacttca 300 ttgcttcttt cagactgttt gcgcgtacgc gttccatgtg gtcattcaat ccagaaacta 360 acattcttct caacgtgcca ctccatggca ctattctgac cagaccgctt ctagaaagtg 420 aactcgtaat cggagctgtg atccttcgtg gacatcttcg tattgctgga caccatctag 480 gacgctgtga catcaaggac ctgcctaaag aaatcactgt tgctacatca cgaacgcttt 540 cttattacaa attgggagct tcgcagcgtg tagcaggtga ctcaggtttt gctgcataca 600 gtcgctacag gattggcaac tataaattaa acacagacca ttccagtagc agtgacaata 660 ttgctttgct tgtacagtga tgatctaga 689 <210> 12 <211> 1286 <212> DNA <213> Artificial Sequence <220> <223> SVF-12 wild-type DNA sequence <220> <221> BamHI_restriction_site <222> (1)..(6) <220> <221> Kozak <222> (7)..(15) <220> <221> NP <222> (12)..(1274) <220> <221> XbaI_restriction_site <222> (1281)..(1286) <400> 12 ggatccgcac catggcctct gataatggac cccaaaatca gcgaaatgca ccccgcatta 60 cgtttggtgg accctcagat tcaactggca gtaaccagaa tggagaacgc agtggggcgc 120 gatcaaaaca acgtcggccc caaggtttac ccaataatac tgcgtcttgg ttcaccgctc 180 tcactcaaca tggcaaggaa gaccttaaat tccctcgagg acaaggcgtt ccaattaaca 240 ccaatagcag tccagatgac caaattggct actaccgaag agctaccaga cgaattcgtg 300 gtggtgacgg taaaatgaaa gatctcagtc caagatggta tttctactac ctaggaactg 360 ggccagaagc tggacttccc tatggtgcta acaaagacgg catcatatgg gttgcaactg 420 agggagcctt gaatacacca aaagatcaca ttggcacccg caatcctgct aacaatgctg 480 caatcgtgct acaacttcct caaggaacaa cattgccaaa aggcttctac gcagaaggga 540 gcagaggcgg cagtcaagcc tcttctcgtt cctcatcacg tagtcgcaac agttcaagaa 600 attcaactcc aggcagcagt aggggaactt ctcctgctag aatggctggc aatggcggtg 660 atgctgctct tgctttgctg ctgcttgaca gattgaacca gcttgagagc aaaatgtctg 720 gtaaaggcca acaacaacaa ggccaaactg tcactaagaa atctgctgct gaggcttcta 780 agaagcctcg gcaaaaacgt actgccacta aagcatacaa tgtaacacaa gctttcggca 840 gacgtggtcc agaacaaacc caaggaaatt ttggggacca ggaactaatc agacaaggaa 900 ctgattacaa acattggccg caaattgcac aatttgcccc cagcgcttca gcgttcttcg 960 gaatgtcgcg cattggcatg gaagtcacac cttcgggaac gtggttgacc tacacaggtg 1020 ccatcaaatt ggatgacaaa gatccaaatt tcaaagatca agtcattttg ctgaataagc 1080 atattgacgc atacaaaaca ttcccaccaa cagagcctaa aaaggacaaa aagaagaagg 1140 ctgatgaaac tcaagcctta ccgcagagac agaagaaaca gcaaactgtg actcttcttc 1200 ctgctgcaga tttggatgat ttctccaaac aattgcaaca atccatgagc agtgctgact 1260 caactcaggc ctaatgatga tctaga 1286 <210> 13 <211> 2118 <212> DNA <213> Artificial Sequence <220> <223> SVF-1 codon optimized DNA sequence <220> <221> BamHI_restriction_site <222> (1)..(6) <220> <221> Kozak <222> (7)..(16) <220> <221> RBD <222> (13)..(777) <220> <221> P2A <222> (778)..(843) <220> <221> NP <222> (844)..(2103) <220> <221> XbaI_restriction_site <222> (2113)..(2118) <400> 13 ggatccgcca ccatggctct gaagtataac gagaatggga ctattaccga tgctgtggac 60 tgtgctctgg accctctgag tgagactaaa tgtaccctga agtcctttac agtggagaag 120 ggcatctatc agacctctaa cttccgggtg cagcctacag agagcatcgt gcgcttccct 180 aacatcacca atctgtgccc attcggcgag gtgtttaacg ccacacggtt cgccagcgtg 240 tacgcctgga atcggaagag aatctccaac tgcgtggccg actattctgt gctgtacaat 300 tccgcctctt tcagcacctt taagtgctat ggcgtgtccc caaccaagct gaatgacctg 360 tgcttcacaa acgtgtacgc cgactctttt gtgatccggg gcgatgaggt gagacagatc 420 gcaccaggac agaccggcaa gatcgcagac tacaattata agctgcctga cgacttcacc 480 ggctgcgtga tcgcctggaa ctctaacaat ctggatagca aagtgggcgg caactacaat 540 tatctgtacc ggctgttcag aaagtccaac ctgaagccat ttgagaggga catcagcacc 600 gagatctacc aggccggctc cacaccctgc aatggcgtgg agggcttcaa ctgttatttt 660 cccctgcaga gctacggctt tcagcctacc aatggcgtgg gctatcagcc ataccgcgtg 720 gtggtgctgt ccttcgagct gctgcacgca ccagcaaccg tgtgcggacc caagaagggc 780 agcggagcca caaacttttc cctgctgaag caggcaggcg acgtggagga gaatccagga 840 cccatggcaa gcgacaatgg accacagaat cagaggaacg caccaagaat cactttcggc 900 ggcccaagcg actcaaccgg cagcaatcag aacggagagc ggagcggagc aagatccaag 960 cagagacggc cccagggcct gccaaacaat accgcatcct ggttcaccgc cctgacacag 1020 cacggcaagg aggacctgaa gtttccaagg ggacagggag tgcctatcaa caccaatagc 1080 tcccctgacg atcagatcgg ctactatagg agggcaacaa ggagaatcag gggaggcgac 1140 ggcaagatga aggatctgag cccacgctgg tacttctact atctgggaac cggacctgag 1200 gcaggcctgc catatggcgc caataaggac ggaatcatct gggtggcaac cgagggcgcc 1260 ctgaacacac caaaggatca catcggcaca agaaatcccg ccaacaatgc agcaatcgtg 1320 ctgcagctgc cacagggaac cacactgccc aagggctttt acgcagaggg ctctcgggga 1380 ggcagccagg catctagcag atcctctagc cggagcagaa actcctctag gaattccacc 1440 ccaggcagct ccaggggcac atcccctgcc cgcatggcag gaaacggagg cgacgccgcc 1500 ctggccctgc tgctgctgga tcgcctgaat cagctggagt ccaagatgtc tggcaaggga 1560 cagcagcagc agggacagac cgtgacaaag aagtccgccg ccgaggcctc taagaagcca 1620 aggcagaagc gcaccgccac aaaggcctac aacgtgaccc aggccttcgg caggcgcgga 1680 ccagagcaga cacagggcaa ttttggcgac caggagctga tcaggcaggg aaccgattat 1740 aagcactggc ctcagatcgc ccagttcgcc ccatctgcca gcgccttctt tggcatgagc 1800 cggatcggaa tggaggtgac cccaagcggc acatggctga cctacacagg cgccatcaag 1860 ctggacgata aggaccctaa cttcaaggat caggtcatcc tgctgaacaa gcacatcgac 1920 gcctataaga cctttccccc tacagagccc aagaaggaca agaagaagaa ggccgatgag 1980 acacaggccc tgcctcagag gcagaagaag cagcagaccg tgacactgct gccagccgcc 2040 gatctggacg atttctcaaa acagctgcag cagtcaatgt caagcgccga ttcaactcag 2100 gcataataat agtctaga 2118 <210> 14 <211> 2781 <212> DNA <213> Artificial Sequence <220> <223> SVF-2 codon optimized DNA sequence <220> <221> BamHI_restriction_site <222> (1)..(6) <220> <221> Kozak <222> (7)..(16) <220> <221> RBD <222> (13)..(777) <220> <221> P2A <222> (778)..(843) <220> <221> M <222> (844)..(1509) <220> <221> NP <222> (1510)..(2769) <220> <221> XbaI_restriction_site <222> (2776)..(2781) <400> 14 ggatccgcca ccatggctct gaagtataac gagaatggga ctattaccga tgctgtggac 60 tgtgctctgg accctctgag tgagactaaa tgtaccctga agtcctttac agtggagaag 120 ggcatctatc agacctctaa cttccgggtg cagcctacag agagcatcgt gcgcttccct 180 aacatcacca atctgtgccc attcggcgag gtgtttaacg ccacacggtt cgccagcgtg 240 tacgcctgga atcggaagag aatctccaac tgcgtggccg actattctgt gctgtacaat 300 tccgcctctt tcagcacctt taagtgctat ggcgtgtccc caaccaagct gaatgacctg 360 tgcttcacaa acgtgtacgc cgactctttt gtgatccggg gcgatgaggt gagacagatc 420 gcaccaggac agaccggcaa gatcgcagac tacaattata agctgcctga cgacttcacc 480 ggctgcgtga tcgcctggaa ctctaacaat ctggatagca aagtgggcgg caactacaat 540 tatctgtacc ggctgttcag aaagtccaac ctgaagccat ttgagaggga catcagcacc 600 gagatctacc aggccggctc cacaccctgc aatggcgtgg agggcttcaa ctgttatttt 660 cccctgcaga gctacggctt tcagcctacc aatggcgtgg gctatcagcc ataccgcgtg 720 gtggtgctgt ccttcgagct gctgcacgca ccagcaaccg tgtgcggacc caagaagggc 780 agcggagcca caaacttttc cctgctgaag caggcaggcg acgtggagga gaatccagga 840 cctatggccg atagcaacgg caccatcaca gtggaggagc tgaagaagct gctggagcag 900 tggaacctgg tcatcggctt cctgtttctg acatggatct gtctgctgca gttcgcctat 960 gccaacagga atcgctttct gtacatcatc aagctgatct tcctgtggct gctgtggcca 1020 gtgaccctgg catgcttcgt gctggccgcc gtgtatcgga tcaactggat cacaggcggc 1080 atcgccatcg ccatggcctg tctggtgggc ctgatgtggc tgtcctactt tatcgcctct 1140 ttcagactgt ttgcccggac cagatccatg tggtctttca accccgagac aaatatcctg 1200 ctgaacgtgc ctctgcacgg caccatcctg acaaggccac tgctggagtc cgagctggtc 1260 atcggagccg tgatcctgag gggacacctg aggatcgcag gacaccacct gggccgctgt 1320 gacatcaagg atctgcctaa ggagatcacc gtggccacaa gccggaccct gtcctactat 1380 aagctgggag catctcagag agtggcaggc gattctggct tcgccgccta tagcaggtac 1440 cgcatcggca attacaagct gaacaccgac cacagctcct ctagcgataa catcgccctg 1500 ctggtgcagg caagcgacaa tggaccacag aatcagagga acgcaccaag aatcactttc 1560 ggcggcccaa gcgactcaac cggcagcaat cagaacggag agcggagcgg agcaagatcc 1620 aagcagagac ggccccaggg cctgccaaac aataccgcat cctggttcac cgccctgaca 1680 cagcacggca aggaggacct gaagtttcca aggggacagg gagtgcctat caacaccaat 1740 agctcccctg acgatcagat cggctactat aggagggcaa caaggagaat caggggaggc 1800 gacggcaaga tgaaggatct gagcccacgc tggtacttct actatctggg aaccggacct 1860 gaggcaggcc tgccatatgg cgccaataag gacggaatca tctgggtggc aaccgagggc 1920 gccctgaaca caccaaagga tcacatcggc acaagaaatc ccgccaacaa tgcagcaatc 1980 gtgctgcagc tgccacaggg aaccacactg cccaagggct tttacgcaga gggctctcgg 2040 ggaggcagcc aggcatctag cagatcctct agccggagca gaaactcctc taggaattcc 2100 accccaggca gctccagggg cacatcccct gcccgcatgg caggaaacgg aggcgacgcc 2160 gccctggccc tgctgctgct ggatcgcctg aatcagctgg agtccaagat gtctggcaag 2220 ggacagcagc agcagggaca gaccgtgaca aagaagtccg ccgccgaggc ctctaagaag 2280 ccaaggcaga agcgcaccgc cacaaaggcc tacaacgtga cccaggcctt cggcaggcgc 2340 ggaccagagc agacacaggg caattttggc gaccaggagc tgatcaggca gggaaccgat 2400 tataagcact ggcctcagat cgcccagttc gccccatctg ccagcgcctt ctttggcatg 2460 agccggatcg gaatggaggt gaccccaagc ggcacatggc tgacctacac aggcgccatc 2520 aagctggacg ataaggaccc taacttcaag gatcaggtca tcctgctgaa caagcacatc 2580 gacgcctata agacctttcc ccctacagag cccaagaagg acaagaagaa gaaggccgat 2640 gagacacagg ccctgcctca gaggcagaag aagcagcaga ccgtgacact gctgccagcc 2700 gccgatctgg acgatttctc aaaacagctg cagcagtcaa tgtcaagcgc cgattcaact 2760 caggcataat aatagtctag a 2781 <210> 15 <211> 2850 <212> DNA <213> Artificial Sequence <220> <223> SVF-3 codon optimized DNA sequence <220> <221> BamHI_restriction_site <222> (1)..(6) <220> <221> Kozak <222> (7)..(16) <220> <221> RBD <222> (13)..(777) <220> <221> P2A <222> (778)..(843) <220> <221> M <222> (844)..(1509) <220> <221> P2A <222> (1510)..(1575) <220> <221> NP <222> (1576)..(2838) <220> <221> XbaI_restriction_site <222> (2845)..(2850) <400> 15 ggatccgcca ccatggctct gaagtataac gagaatggga ctattaccga tgctgtggac 60 tgtgctctgg accctctgag tgagactaaa tgtaccctga agtcctttac agtggagaag 120 ggcatctatc agacctctaa cttccgggtg cagcctacag agagcatcgt gcgcttccct 180 aacatcacca atctgtgccc attcggcgag gtgtttaacg ccacacggtt cgccagcgtg 240 tacgcctgga atcggaagag aatctccaac tgcgtggccg actattctgt gctgtacaat 300 tccgcctctt tcagcacctt taagtgctat ggcgtgtccc caaccaagct gaatgacctg 360 tgcttcacaa acgtgtacgc cgactctttt gtgatccggg gcgatgaggt gagacagatc 420 gcaccaggac agaccggcaa gatcgcagac tacaattata agctgcctga cgacttcacc 480 ggctgcgtga tcgcctggaa ctctaacaat ctggatagca aagtgggcgg caactacaat 540 tatctgtacc ggctgttcag aaagtccaac ctgaagccat ttgagaggga catcagcacc 600 gagatctacc aggccggctc cacaccctgc aatggcgtgg agggcttcaa ctgttatttt 660 cccctgcaga gctacggctt tcagcctacc aatggcgtgg gctatcagcc ataccgcgtg 720 gtggtgctgt ccttcgagct gctgcacgca ccagcaaccg tgtgcggacc caagaagggc 780 agcggagcca caaacttttc cctgctgaag caggcaggcg acgtggagga gaatccagga 840 cctatggccg atagcaacgg caccatcaca gtggaggagc tgaagaagct gctggagcag 900 tggaacctgg tcatcggctt cctgtttctg acatggatct gtctgctgca gttcgcctat 960 gccaacagga atcgctttct gtacatcatc aagctgatct tcctgtggct gctgtggcca 1020 gtgaccctgg catgcttcgt gctggccgcc gtgtatcgga tcaactggat cacaggcggc 1080 atcgccatcg ccatggcctg tctggtgggc ctgatgtggc tgtcctactt tatcgcctct 1140 ttcagactgt ttgcccggac cagatccatg tggtctttca accccgagac aaatatcctg 1200 ctgaacgtgc ctctgcacgg caccatcctg acaaggccac tgctggagtc cgagctggtc 1260 atcggagccg tgatcctgag gggacacctg aggatcgcag gacaccacct gggccgctgt 1320 gacatcaagg atctgcctaa ggagatcacc gtggccacaa gccggaccct gtcctactat 1380 aagctgggag catctcagag agtggcaggc gattctggct tcgccgccta tagcaggtac 1440 cgcatcggca attacaagct gaacaccgac cacagctcct ctagcgataa catcgccctg 1500 ctggtgcagg gcagcggagc aaccaacttt agtctgctga aacaggccgg agacgtggaa 1560 gaaaaccccg gacccatggc aagcgacaat ggaccacaga atcagaggaa cgcaccaaga 1620 atcactttcg gcggcccaag cgactcaacc ggcagcaatc agaacggaga gcggagcgga 1680 gcaagatcca agcagagacg gccccagggc ctgccaaaca ataccgcatc ctggttcacc 1740 gccctgacac agcacggcaa ggaggacctg aagtttccaa ggggacaggg agtgcctatc 1800 aacaccaata gctcccctga cgatcagatc ggctactata ggagggcaac aaggagaatc 1860 aggggaggcg acggcaagat gaaggatctg agcccacgct ggtacttcta ctatctggga 1920 accggacctg aggcaggcct gccatatggc gccaataagg acggaatcat ctgggtggca 1980 accgagggcg ccctgaacac accaaaggat cacatcggca caagaaatcc cgccaacaat 2040 gcagcaatcg tgctgcagct gccacaggga accacactgc ccaagggctt ttacgcagag 2100 ggctctcggg gaggcagcca ggcatctagc agatcctcta gccggagcag aaactcctct 2160 aggaattcca ccccaggcag ctccaggggc acatcccctg cccgcatggc aggaaacgga 2220 ggcgacgccg ccctggccct gctgctgctg gatcgcctga atcagctgga gtccaagatg 2280 tctggcaagg gacagcagca gcagggacag accgtgacaa agaagtccgc cgccgaggcc 2340 tctaagaagc caaggcagaa gcgcaccgcc acaaaggcct acaacgtgac ccaggccttc 2400 ggcaggcgcg gaccagagca gacacagggc aattttggcg accaggagct gatcaggcag 2460 ggaaccgatt ataagcactg gcctcagatc gcccagttcg ccccatctgc cagcgccttc 2520 tttggcatga gccggatcgg aatggaggtg accccaagcg gcacatggct gacctacaca 2580 ggcgccatca agctggacga taaggaccct aacttcaagg atcaggtcat cctgctgaac 2640 aagcacatcg acgcctataa gacctttccc cctacagagc ccaagaagga caagaagaag 2700 aaggccgatg agacacaggc cctgcctcag aggcagaaga agcagcagac cgtgacactg 2760 ctgccagccg ccgatctgga cgatttctca aaacagctgc agcagtcaat gtcaagcgcc 2820 gattcaactc aggcataata atagtctaga 2850 <210> 16 <211> 1524 <212> DNA <213> Artificial Sequence <220> <223> SVF-4 codon optimized DNA sequence <220> <221> BamHI_restriction_site <222> (1)..(6) <220> <221> Kozak <222> (7)..(16) <220> <221> RBD <222> (13)..(777) <220> <221> P2A <222> (778)..(843) <220> <221> M <222> (844)..(1509) <220> <221> XbaI_restriction_site <222> (1519)..(1524) <400> 16 ggatccgcca ccatggctct gaagtataac gagaatggga ctattaccga tgctgtggac 60 tgtgctctgg accctctgag tgagactaaa tgtaccctga agtcctttac agtggagaag 120 ggcatctatc agacctctaa cttccgggtg cagcctacag agagcatcgt gcgcttccct 180 aacatcacca atctgtgccc attcggcgag gtgtttaacg ccacacggtt cgccagcgtg 240 tacgcctgga atcggaagag aatctccaac tgcgtggccg actattctgt gctgtacaat 300 tccgcctctt tcagcacctt taagtgctat ggcgtgtccc caaccaagct gaatgacctg 360 tgcttcacaa acgtgtacgc cgactctttt gtgatccggg gcgatgaggt gagacagatc 420 gcaccaggac agaccggcaa gatcgcagac tacaattata agctgcctga cgacttcacc 480 ggctgcgtga tcgcctggaa ctctaacaat ctggatagca aagtgggcgg caactacaat 540 tatctgtacc ggctgttcag aaagtccaac ctgaagccat ttgagaggga catcagcacc 600 gagatctacc aggccggctc cacaccctgc aatggcgtgg agggcttcaa ctgttatttt 660 cccctgcaga gctacggctt tcagcctacc aatggcgtgg gctatcagcc ataccgcgtg 720 gtggtgctgt ccttcgagct gctgcacgca ccagcaaccg tgtgcggacc caagaagggc 780 agcggagcca caaacttttc cctgctgaag caggcaggcg acgtggagga gaatccagga 840 cctatggccg atagcaacgg caccatcaca gtggaggagc tgaagaagct gctggagcag 900 tggaacctgg tcatcggctt cctgtttctg acatggatct gtctgctgca gttcgcctat 960 gccaacagga atcgctttct gtacatcatc aagctgatct tcctgtggct gctgtggcca 1020 gtgaccctgg catgcttcgt gctggccgcc gtgtatcgga tcaactggat cacaggcggc 1080 atcgccatcg ccatggcctg tctggtgggc ctgatgtggc tgtcctactt tatcgcctct 1140 ttcagactgt ttgcccggac cagatccatg tggtctttca accccgagac aaatatcctg 1200 ctgaacgtgc ctctgcacgg caccatcctg acaaggccac tgctggagtc cgagctggtc 1260 atcggagccg tgatcctgag gggacacctg aggatcgcag gacaccacct gggccgctgt 1320 gacatcaagg atctgcctaa ggagatcacc gtggccacaa gccggaccct gtcctactat 1380 aagctgggag catctcagag agtggcaggc gattctggct tcgccgccta tagcaggtac 1440 cgcatcggca attacaagct gaacaccgac cacagctcct ctagcgataa catcgccctg 1500 ctggtgcagt aataatagtc taga 1524 <210> 17 <211> 2049 <212> DNA <213> Artificial Sequence <220> <223> SVF-5 codon optimized DNA sequence <220> <221> BamHI_restriction_site <222> (1)..(6) <220> <221> Kozak <222> (7)..(16) <220> <221> RBD <222> (13)..(777) <220> <221> NP <222> (778)..(2037) <220> <221> XbaI_restriction_site <222> (2044)..(2049) <400> 17 ggatccgcca ccatggctct gaagtataac gagaatggga ctattaccga tgctgtggac 60 tgtgctctgg accctctgag tgagactaaa tgtaccctga agtcctttac agtggagaag 120 ggcatctatc agacctctaa cttccgggtg cagcctacag agagcatcgt gcgcttccct 180 aacatcacca atctgtgccc attcggcgag gtgtttaacg ccacacggtt cgccagcgtg 240 tacgcctgga atcggaagag aatctccaac tgcgtggccg actattctgt gctgtacaat 300 tccgcctctt tcagcacctt taagtgctat ggcgtgtccc caaccaagct gaatgacctg 360 tgcttcacaa acgtgtacgc cgactctttt gtgatccggg gcgatgaggt gagacagatc 420 gcaccaggac agaccggcaa gatcgcagac tacaattata agctgcctga cgacttcacc 480 ggctgcgtga tcgcctggaa ctctaacaat ctggatagca aagtgggcgg caactacaat 540 tatctgtacc ggctgttcag aaagtccaac ctgaagccat ttgagaggga catcagcacc 600 gagatctacc aggccggctc cacaccctgc aatggcgtgg agggcttcaa ctgttatttt 660 cccctgcaga gctacggctt tcagcctacc aatggcgtgg gctatcagcc ataccgcgtg 720 gtggtgctgt ccttcgagct gctgcacgca ccagcaaccg tgtgcggacc caagaaggca 780 agcgacaatg gaccacagaa tcagaggaac gcaccaagaa tcactttcgg cggcccaagc 840 gactcaaccg gcagcaatca gaacggagag cggagcggag caagatccaa gcagagacgg 900 ccccagggcc tgccaaacaa taccgcatcc tggttcaccg ccctgacaca gcacggcaag 960 gaggacctga agtttccaag gggacaggga gtgcctatca acaccaatag ctcccctgac 1020 gatcagatcg gctactatag gagggcaaca aggagaatca ggggaggcga cggcaagatg 1080 aaggatctga gcccacgctg gtacttctac tatctgggaa ccggacctga ggcaggcctg 1140 ccatatggcg ccaataagga cggaatcatc tgggtggcaa ccgagggcgc cctgaacaca 1200 ccaaaggatc acatcggcac aagaaatccc gccaacaatg cagcaatcgt gctgcagctg 1260 ccacagggaa ccacactgcc caagggcttt tacgcagagg gctctcgggg aggcagccag 1320 gcatctagca gatcctctag ccggagcaga aactcctcta ggaattccac cccaggcagc 1380 tccaggggca catcccctgc ccgcatggca ggaaacggag gcgacgccgc cctggccctg 1440 ctgctgctgg atcgcctgaa tcagctggag tccaagatgt ctggcaaggg acagcagcag 1500 cagggacaga ccgtgacaaa gaagtccgcc gccgaggcct ctaagaagcc aaggcagaag 1560 cgcaccgcca caaaggccta caacgtgacc caggccttcg gcaggcgcgg accagagcag 1620 acacagggca attttggcga ccaggagctg atcaggcagg gaaccgatta taagcactgg 1680 cctcagatcg cccagttcgc cccatctgcc agcgccttct ttggcatgag ccggatcgga 1740 atggaggtga ccccaagcgg cacatggctg acctacacag gcgccatcaa gctggacgat 1800 aaggacccta acttcaagga tcaggtcatc ctgctgaaca agcacatcga cgcctataag 1860 acctttcccc ctacagagcc caagaaggac aagaagaaga aggccgatga gacacaggcc 1920 ctgcctcaga ggcagaagaa gcagcagacc gtgacactgc tgccagccgc cgatctggac 1980 gatttctcaa aacagctgca gcagtcaatg tcaagcgccg attcaactca ggcataataa 2040 tagtctaga 2049 <210> 18 <211> 2712 <212> DNA <213> Artificial Sequence <220> <223> SVF-6 codon optimized DNA sequence <220> <221> BamHI_restriction_site <222> (1)..(6) <220> <221> Kozak <222> (7)..(16) <220> <221> RBD <222> (13)..(777) <220> <221> M <222> (778)..(1440) <220> <221> NP <222> (1441)..(2700) <220> <221> XbaI_restriction_site <222> (2707)..(2712) <400> 18 ggatccgcca ccatggctct gaagtataac gagaatggga ctattaccga tgctgtggac 60 tgtgctctgg accctctgag tgagactaaa tgtaccctga agtcctttac agtggagaag 120 ggcatctatc agacctctaa cttccgggtg cagcctacag agagcatcgt gcgcttccct 180 aacatcacca atctgtgccc attcggcgag gtgtttaacg ccacacggtt cgccagcgtg 240 tacgcctgga atcggaagag aatctccaac tgcgtggccg actattctgt gctgtacaat 300 tccgcctctt tcagcacctt taagtgctat ggcgtgtccc caaccaagct gaatgacctg 360 tgcttcacaa acgtgtacgc cgactctttt gtgatccggg gcgatgaggt gagacagatc 420 gcaccaggac agaccggcaa gatcgcagac tacaattata agctgcctga cgacttcacc 480 ggctgcgtga tcgcctggaa ctctaacaat ctggatagca aagtgggcgg caactacaat 540 tatctgtacc ggctgttcag aaagtccaac ctgaagccat ttgagaggga catcagcacc 600 gagatctacc aggccggctc cacaccctgc aatggcgtgg agggcttcaa ctgttatttt 660 cccctgcaga gctacggctt tcagcctacc aatggcgtgg gctatcagcc ataccgcgtg 720 gtggtgctgt ccttcgagct gctgcacgca ccagcaaccg tgtgcggacc caagaaggcc 780 gatagcaacg gcaccatcac agtggaggag ctgaagaagc tgctggagca gtggaacctg 840 gtcatcggct tcctgtttct gacatggatc tgtctgctgc agttcgccta tgccaacagg 900 aatcgctttc tgtacatcat caagctgatc ttcctgtggc tgctgtggcc agtgaccctg 960 gcatgcttcg tgctggccgc cgtgtatcgg atcaactgga tcacaggcgg catcgccatc 1020 gccatggcct gtctggtggg cctgatgtgg ctgtcctact ttatcgcctc tttcagactg 1080 tttgcccgga ccagatccat gtggtctttc aaccccgaga caaatatcct gctgaacgtg 1140 cctctgcacg gcaccatcct gacaaggcca ctgctggagt ccgagctggt catcggagcc 1200 gtgatcctga ggggacacct gaggatcgca ggacaccacc tgggccgctg tgacatcaag 1260 gatctgccta aggagatcac cgtggccaca agccggaccc tgtcctacta taagctggga 1320 gcatctcaga gagtggcagg cgattctggc ttcgccgcct atagcaggta ccgcatcggc 1380 aattacaagc tgaacaccga ccacagctcc tctagcgata acatcgccct gctggtgcag 1440 gcaagcgaca atggaccaca gaatcagagg aacgcaccaa gaatcacttt cggcggccca 1500 agcgactcaa ccggcagcaa tcagaacgga gagcggagcg gagcaagatc caagcagaga 1560 cggccccagg gcctgccaaa caataccgca tcctggttca ccgccctgac acagcacggc 1620 aaggaggacc tgaagtttcc aaggggacag ggagtgccta tcaacaccaa tagctcccct 1680 gacgatcaga tcggctacta taggagggca acaaggagaa tcaggggagg cgacggcaag 1740 atgaaggatc tgagcccacg ctggtacttc tactatctgg gaaccggacc tgaggcaggc 1800 ctgccatatg gcgccaataa ggacggaatc atctgggtgg caaccgaggg cgccctgaac 1860 acaccaaagg atcacatcgg cacaagaaat cccgccaaca atgcagcaat cgtgctgcag 1920 ctgccacagg gaaccacact gcccaagggc ttttacgcag agggctctcg gggaggcagc 1980 caggcatcta gcagatcctc tagccggagc agaaactcct ctaggaattc caccccaggc 2040 agctccaggg gcacatcccc tgcccgcatg gcaggaaacg gaggcgacgc cgccctggcc 2100 ctgctgctgc tggatcgcct gaatcagctg gagtccaaga tgtctggcaa gggacagcag 2160 cagcagggac agaccgtgac aaagaagtcc gccgccgagg cctctaagaa gccaaggcag 2220 aagcgcaccg ccacaaaggc ctacaacgtg acccaggcct tcggcaggcg cggaccagag 2280 cagacacagg gcaattttgg cgaccaggag ctgatcaggc agggaaccga ttataagcac 2340 tggcctcaga tcgcccagtt cgccccatct gccagcgcct tctttggcat gagccggatc 2400 ggaatggagg tgaccccaag cggcacatgg ctgacctaca caggcgccat caagctggac 2460 gataaggacc ctaacttcaa ggatcaggtc atcctgctga acaagcacat cgacgcctat 2520 aagacctttc cccctacaga gcccaagaag gacaagaaga agaaggccga tgagacacag 2580 gccctgcctc agaggcagaa gaagcagcag accgtgacac tgctgccagc cgccgatctg 2640 gacgatttct caaaacagct gcagcagtca atgtcaagcg ccgattcaac tcaggcataa 2700 taatagtcta ga 2712 <210> 19 <211> 1455 <212> DNA <213> Artificial Sequence <220> <223> SVF-7 codon optimized DNA sequence <220> <221> BamHI_restriction_site <222> (1)..(6) <220> <221> Kozak <222> (7)..(16) <220> <221> RBD <222> (13)..(777) <220> <221> M <222> (778)..(1440) <220> <221> XbaI_restriction_site <222> (1450)..(1455) <400> 19 ggatccgcca ccatggctct gaagtataac gagaatggga ctattaccga tgctgtggac 60 tgtgctctgg accctctgag tgagactaaa tgtaccctga agtcctttac agtggagaag 120 ggcatctatc agacctctaa cttccgggtg cagcctacag agagcatcgt gcgcttccct 180 aacatcacca atctgtgccc attcggcgag gtgtttaacg ccacacggtt cgccagcgtg 240 tacgcctgga atcggaagag aatctccaac tgcgtggccg actattctgt gctgtacaat 300 tccgcctctt tcagcacctt taagtgctat ggcgtgtccc caaccaagct gaatgacctg 360 tgcttcacaa acgtgtacgc cgactctttt gtgatccggg gcgatgaggt gagacagatc 420 gcaccaggac agaccggcaa gatcgcagac tacaattata agctgcctga cgacttcacc 480 ggctgcgtga tcgcctggaa ctctaacaat ctggatagca aagtgggcgg caactacaat 540 tatctgtacc ggctgttcag aaagtccaac ctgaagccat ttgagaggga catcagcacc 600 gagatctacc aggccggctc cacaccctgc aatggcgtgg agggcttcaa ctgttatttt 660 cccctgcaga gctacggctt tcagcctacc aatggcgtgg gctatcagcc ataccgcgtg 720 gtggtgctgt ccttcgagct gctgcacgca ccagcaaccg tgtgcggacc caagaaggcc 780 gatagcaacg gcaccatcac agtggaggag ctgaagaagc tgctggagca gtggaacctg 840 gtcatcggct tcctgtttct gacatggatc tgtctgctgc agttcgccta tgccaacagg 900 aatcgctttc tgtacatcat caagctgatc ttcctgtggc tgctgtggcc agtgaccctg 960 gcatgcttcg tgctggccgc cgtgtatcgg atcaactgga tcacaggcgg catcgccatc 1020 gccatggcct gtctggtggg cctgatgtgg ctgtcctact ttatcgcctc tttcagactg 1080 tttgcccgga ccagatccat gtggtctttc aaccccgaga caaatatcct gctgaacgtg 1140 cctctgcacg gcaccatcct gacaaggcca ctgctggagt ccgagctggt catcggagcc 1200 gtgatcctga ggggacacct gaggatcgca ggacaccacc tgggccgctg tgacatcaag 1260 gatctgccta aggagatcac cgtggccaca agccggaccc tgtcctacta taagctggga 1320 gcatctcaga gagtggcagg cgattctggc ttcgccgcct atagcaggta ccgcatcggc 1380 aattacaagc tgaacaccga ccacagctcc tctagcgata acatcgccct gctggtgcag 1440 taataatagt ctaga 1455 <210> 20 <211> 3348 <212> DNA <213> Artificial Sequence <220> <223> SVF-8 codon optimized DNA sequence <220> <221> BamHI_restriction_site <222> (1)..(6) <220> <221> Kozak <222> (7)..(16) <220> <221> RBD <222> (13)..(777) <220> <221> HDAg_genotype_1A <222> (778)..(1416) <220> <221> HDAg_genotype_1B <222> (1417)..(2055) <220> <221> HDAg_genotype_2A <222> (2056)..(2694) <220> <221> HDAg_genotype_2B <222> (2695)..(3333) <220> <221> XbaI_restriction_site <222> (3343)..(3348) <400> 20 ggatccgcca ccatggctct gaagtataac gagaatggga ctattaccga tgctgtggac 60 tgtgctctgg accctctgag tgagactaaa tgtaccctga agtcctttac agtggagaag 120 ggcatctatc agacctctaa cttccgggtg cagcctacag agagcatcgt gcgcttccct 180 aacatcacca atctgtgccc attcggcgag gtgtttaacg ccacacggtt cgccagcgtg 240 tacgcctgga atcggaagag aatctccaac tgcgtggccg actattctgt gctgtacaat 300 tccgcctctt tcagcacctt taagtgctat ggcgtgtccc caaccaagct gaatgacctg 360 tgcttcacaa acgtgtacgc cgactctttt gtgatccggg gcgatgaggt gagacagatc 420 gcaccaggac agaccggcaa gatcgcagac tacaattata agctgcctga cgacttcacc 480 ggctgcgtga tcgcctggaa ctctaacaat ctggatagca aagtgggcgg caactacaat 540 tatctgtacc ggctgttcag aaagtccaac ctgaagccat ttgagaggga catcagcacc 600 gagatctacc aggccggctc cacaccctgc aatggcgtgg agggcttcaa ctgttatttt 660 cccctgcaga gctacggctt tcagcctacc aatggcgtgg gctatcagcc ataccgcgtg 720 gtggtgctgt ccttcgagct gctgcacgca ccagcaaccg tgtgcggacc caagaagtcc 780 aggtctgaga gcaagaagaa taggggagga agggaggaga tcctggagca gtgggtggga 840 gcacgcaaga agctggagga gctggagcgg gacctgagaa agatcaagaa gaagatcaag 900 aagctggaag aggagaaccc ctggctgggc aatatcaagg gcatcctggg caagaaggat 960 agggagggcg agggagcacc acctgcaaag agggcaaggg cagaccagat ggaggtggat 1020 tccggaccta ggaagcggcc cttccgggga gagtttacag acaaggagcg gagagatcac 1080 aggcgccgga aggccctgga gaacaagcgg aagcagctga gctccggcgg caagtccctg 1140 tctaaggagg aggaggagga gctgagaaag ctgaccgagg aggacgagag aagggagagg 1200 agggtggcag gaccaagggt gggaggagtg aatcctctgg agggaggaac aaggggagca 1260 ccaggaggag gcttcgtgcc tagcatgcag ggcgtgcctg agtccccatt tgccaggacc 1320 ggagagggcc tggacgtgag aggaaaccag ggcttcccat gggacatcct gtttccagcc 1380 gatccaccct tcagcccaca gtcctgcagg cctcagagcc ggtccgagtc taagaagaat 1440 agaggcggaa gggaggaggt gctggagcag tgggtgaacg gcagaaagaa gctggaagaa 1500 ctggagaggg agctgagaag ggcccgcaag aagatcaaga agttagagga cgataatcct 1560 tggctgggca atgtgaaagg catcctgggc aagaaggaca aggatggaga gggagcacct 1620 ccagcaaaga gggcacgcac agaccagatg gagatcgata gcggaccaag gaagcggccc 1680 ctgagaggag gctttaccga cagggagagg caggatcacc gccggagaaa ggccctgaag 1740 aacaagaaga agcagctgtc cgccggaggc aagagcctgt ccaaagaaga ggaggaggag 1800 ctgaagcggc tgacaagaga ggacgaggag cggaagaagg aggagcacgg accaagccgg 1860 ctgggagtga atccaagcga gggaggacct agaggcgccc ctggcggagg cttcgtgcct 1920 tccatgcagg gcatcccaga gtctaggttt accaggacag gcgaaggcct ggacgtgcgg 1980 ggctccagag gctttcccca ggacatcctg ttcccttctg atcccccttt ttctccacag 2040 agctgtagac cacagtctca gagcgagaca aggaggggcc ggagaggaac cagggaggag 2100 acactggaga agtggatcac cgccagaaag aaggccgagg agctggagaa ggacctgagg 2160 aagacccgca agacaatcaa gaagctggaa gaagagaacc catggctggg caatatcgtg 2220 ggcatcatca gaaagggcaa ggacggcgag ggagcaccac cagcaaagcg gcccagaacc 2280 gatcagatgg aggtggatag cggccctggc aagaggccac acaagtccgg cttcaccgac 2340 aaggagaggg aggaccatag gcgccggaag gccctggaga acaagaagaa gcaattaagc 2400 gccggcggca agatcctgtc caaagaggaa gaggaggagc tgagaaggct gaccgacgag 2460 gatgaggaga ggaaaagaag ggtggcagga cctagggtgg gcgacgtgaa tccaagcagg 2520 ggaggaccaa ggggagcacc tgggggcggc ttcgtgcctc agatggcagg agtgccagag 2580 tccccttttt ctcggacagg cgagggcctg gatatcagag gaacccaggg attcccatgg 2640 gtgtccccat ctcctccaca gcagaggctg ccactgctgg agtgcacccc acagagccag 2700 agcgaaagca aaaaaaaccg ccgcggcggc cgcgaagata ttctggaaaa atggattacc 2760 acccgccgca aagcggaaga actggaaaaa gatctgcgca aagcgcgcaa aaccattaaa 2820 aaactggaag atgaaaaccc gtggctgggc aacattattg gcattattcg caaaggcaaa 2880 gatggcgaag gcgcgccgcc ggcgaaacgc ccgcgcaccg atcagatgga aattgatagc 2940 ggcaccggca aacgcccgca taaaagcggc tttaccgata aagaacgcga agatcatcgc 3000 cgccgcaaag cgctggaaaa caaaaaaaaa cagctgagca gcggcggcaa aaacctgagc 3060 cgcgaagaag aagaagaact gggccgcctg accgtggaag atgaagaacg ccgccgccgc 3120 gtggcgggcc cgcgcaccgg cgatgtgaac ctgagcggcg gcggcccgcg cggcgcgccg 3180 ggcggcggct ttgtgccgcg catggaaggc gtgccggaaa gcccgtttac ccgcaccggc 3240 gaaggcctgg atattcgcgg caaccagggc tttccgtggg tgcgcccgag cccgccgcag 3300 cagcgcctgc cgctgctgga atgcaccccg cagtaataat agtctaga 3348 <210> 21 <211> 3624 <212> DNA <213> Artificial Sequence <220> <223> SVF-9 codon optimized DNA sequence <220> <221> BamHI_restriction_site <222> (1)..(6) <220> <221> Kozak <222> (7)..(16) <220> <221> RBD <222> (13)..(777) <220> <221> P2A <222> (778)..(843) <220> <221> HDAg_genotype_1A <222> (844)..(1485) <220> <221> P2A <222> (1486)..(1551) <220> <221> HDAg_genotype_1B <222> (1552)..(2193) <220> <221> P2A <222> (2194)..(2259) <220> <221> HDAg_genotype_2A <222> (2260)..(2901) <220> <221> P2A <222> (2902)..(2967) <220> <221> HDAg_genotype_2B <222> (2968)..(3609) <220> <221> XbaI_restriction_site <222> (3619)..(3624) <400> 21 ggatccgcca ccatggctct gaagtataac gagaatggga ctattaccga tgctgtggac 60 tgtgctctgg accctctgag tgagactaaa tgtaccctga agtcctttac agtggagaag 120 ggcatctatc agacctctaa cttccgggtg cagcctacag agagcatcgt gcgcttccct 180 aacatcacca atctgtgccc attcggcgag gtgtttaacg ccacacggtt cgccagcgtg 240 tacgcctgga atcggaagag aatctccaac tgcgtggccg actattctgt gctgtacaat 300 tccgcctctt tcagcacctt taagtgctat ggcgtgtccc caaccaagct gaatgacctg 360 tgcttcacaa acgtgtacgc cgactctttt gtgatccggg gcgatgaggt gagacagatc 420 gcaccaggac agaccggcaa gatcgcagac tacaattata agctgcctga cgacttcacc 480 ggctgcgtga tcgcctggaa ctctaacaat ctggatagca aagtgggcgg caactacaat 540 tatctgtacc ggctgttcag aaagtccaac ctgaagccat ttgagaggga catcagcacc 600 gagatctacc aggccggctc cacaccctgc aatggcgtgg agggcttcaa ctgttatttt 660 cccctgcaga gctacggctt tcagcctacc aatggcgtgg gctatcagcc ataccgcgtg 720 gtggtgctgt ccttcgagct gctgcacgca ccagcaaccg tgtgcggacc caagaagggc 780 agcggagcca caaacttttc cctgctgaag caggcaggcg acgtggagga gaatccagga 840 cctatgtcca ggtctgagag caagaagaat aggggaggaa gggaggagat cctggagcag 900 tgggtgggag cacgcaagaa gctggaggag ctggagcggg acctgagaaa gatcaagaag 960 aagatcaaga agctggaaga ggagaacccc tggctgggca atatcaaggg catcctgggc 1020 aagaaggata gggagggcga gggagcacca cctgcaaaga gggcaagggc agaccagatg 1080 gaggtggatt ccggacctag gaagcggccc ttccggggag agtttacaga caaggagcgg 1140 agagatcaca ggcgccggaa ggccctggag aacaagcgga agcagctgag ctccggcggc 1200 aagtccctgt ctaaggagga ggaggaggag ctgagaaagc tgaccgagga ggacgagaga 1260 agggagagga gggtggcagg accaagggtg ggaggagtga atcctctgga gggaggaaca 1320 aggggagcac caggaggagg cttcgtgcct agcatgcagg gcgtgcctga gtccccattt 1380 gccaggaccg gagagggcct ggacgtgaga ggaaaccagg gcttcccatg ggacatcctg 1440 tttccagccg atccaccctt cagcccacag tcctgcaggc ctcagggctc cggcgccacc 1500 aatttctctc tgctgaagca ggccggcgat gtggaagaaa accctggacc aatgagccgg 1560 tccgagtcta agaagaatag aggcggaagg gaggaggtgc tggagcagtg ggtgaacggc 1620 agaaagaagc tggaagaact ggagagggag ctgagaaggg cccgcaagaa gatcaagaag 1680 ttagaggacg ataatccttg gctgggcaat gtgaaaggca tcctgggcaa gaaggacaag 1740 gatggagagg gagcacctcc agcaaagagg gcacgcacag accagatgga gatcgatagc 1800 ggaccaagga agcggcccct gagaggaggc tttaccgaca gggagaggca ggatcaccgc 1860 cggagaaagg ccctgaagaa caagaagaag cagctgtccg ccggaggcaa gagcctgtcc 1920 aaagaagagg aggaggagct gaagcggctg acaagagagg acgaggagcg gaagaaggag 1980 gagcacggac caagccggct gggagtgaat ccaagcgagg gaggacctag aggcgcccct 2040 ggcggaggct tcgtgccttc catgcagggc atcccagagt ctaggtttac caggacaggc 2100 gaaggcctgg acgtgcgggg ctccagaggc tttccccagg acatcctgtt cccttctgat 2160 cccccttttt ctccacagag ctgtagacca cagggcagcg gagcaaccaa cttctccctg 2220 ctgaagcaag ccggcgatgt ggaggagaat ccaggaccta tgtctcagag cgagacaagg 2280 aggggccgga gaggaaccag ggaggagaca ctggagaagt ggatcaccgc cagaaagaag 2340 gccgaggagc tggagaagga cctgaggaag acccgcaaga caatcaagaa gctggaagaa 2400 gagaacccat ggctgggcaa tatcgtgggc atcatcagaa agggcaagga cggcgaggga 2460 gcaccaccag caaagcggcc cagaaccgat cagatggagg tggatagcgg ccctggcaag 2520 aggccacaca agtccggctt caccgacaag gagagggagg accataggcg ccggaaggcc 2580 ctggagaaca agaagaagca attaagcgcc ggcggcaaga tcctgtccaa agaggaagag 2640 gaggagctga gaaggctgac cgacgaggat gaggagagga aaagaagggt ggcaggacct 2700 agggtgggcg acgtgaatcc aagcagggga ggaccaaggg gagcacctgg gggcggcttc 2760 gtgcctcaga tggcaggagt gccagagtcc cctttttctc ggacaggcga gggcctggat 2820 atcagaggaa cccagggatt cccatgggtg tccccatctc ctccacagca gaggctgcca 2880 ctgctggagt gcaccccaca gggctctgga gccacaaact ttagcctgct gaagcaggcc 2940 ggcgacgtgg aagaaaaccc aggacccatg agccagagcg aaagcaaaaa aaaccgccgc 3000 ggcggccgcg aagatattct ggaaaaatgg attaccaccc gccgcaaagc ggaagaactg 3060 gaaaaagatc tgcgcaaagc gcgcaaaacc attaaaaaac tggaagatga aaacccgtgg 3120 ctgggcaaca ttattggcat tattcgcaaa ggcaaagatg gcgaaggcgc gccgccggcg 3180 aaacgcccgc gcaccgatca gatggaaatt gatagcggca ccggcaaacg cccgcataaa 3240 agcggcttta ccgataaaga acgcgaagat catcgccgcc gcaaagcgct ggaaaacaaa 3300 aaaaaacagc tgagcagcgg cggcaaaaac ctgagccgcg aagaagaaga agaactgggc 3360 cgcctgaccg tggaagatga agaacgccgc cgccgcgtgg cgggcccgcg caccggcgat 3420 gtgaacctga gcggcggcgg cccgcgcggc gcgccgggcg gcggctttgt gccgcgcatg 3480 gaaggcgtgc cggaaagccc gtttacccgc accggcgaag gcctggatat tcgcggcaac 3540 cagggctttc cgtgggtgcg cccgagcccg ccgcagcagc gcctgccgct gctggaatgc 3600 accccgcagt aataatagtc taga 3624 <210> 22 <211> 792 <212> DNA <213> Artificial Sequence <220> <223> SVF-10 codon optimized sequence <220> <221> BamHI_restriction_site <222> (1)..(6) <220> <221> Kozak <222> (7)..(16) <220> <221> RBD <222> (13)..(777) <220> <221> XbaI_restriction_site <222> (787)..(792) <400> 22 ggatccgcca ccatggctct gaagtataac gagaatggga ctattaccga tgctgtggac 60 tgtgctctgg accctctgag tgagactaaa tgtaccctga agtcctttac agtggagaag 120 ggcatctatc agacctctaa cttccgggtg cagcctacag agagcatcgt gcgcttccct 180 aacatcacca atctgtgccc attcggcgag gtgtttaacg ccacacggtt cgccagcgtg 240 tacgcctgga atcggaagag aatctccaac tgcgtggccg actattctgt gctgtacaat 300 tccgcctctt tcagcacctt taagtgctat ggcgtgtccc caaccaagct gaatgacctg 360 tgcttcacaa acgtgtacgc cgactctttt gtgatccggg gcgatgaggt gagacagatc 420 gcaccaggac agaccggcaa gatcgcagac tacaattata agctgcctga cgacttcacc 480 ggctgcgtga tcgcctggaa ctctaacaat ctggatagca aagtgggcgg caactacaat 540 tatctgtacc ggctgttcag aaagtccaac ctgaagccat ttgagaggga catcagcacc 600 gagatctacc aggccggctc cacaccctgc aatggcgtgg agggcttcaa ctgttatttt 660 cccctgcaga gctacggctt tcagcctacc aatggcgtgg gctatcagcc ataccgcgtg 720 gtggtgctgt ccttcgagct gctgcacgca ccagcaaccg tgtgcggacc caagaagtaa 780 taatagtcta ga 792 <210> 23 <211> 693 <212> DNA <213> Artificial Sequence <220> <223> SVF-11 codon optimized DNA sequence <220> <221> BamHI_restriction_site <222> (1)..(6) <220> <221> Kozak <222> (7)..(16) <220> <221> M <222> (13)..(681) <220> <221> XbaI_restriction_site <222> (688)..(693) <400> 23 ggatccgcca ccatggccga tagcaacggc accatcacag tggaggagct gaagaagctg 60 ctggagcagt ggaacctggt catcggcttc ctgtttctga catggatctg tctgctgcag 120 ttcgcctatg ccaacaggaa tcgctttctg tacatcatca agctgatctt cctgtggctg 180 ctgtggccag tgaccctggc atgcttcgtg ctggccgccg tgtatcggat caactggatc 240 acaggcggca tcgccatcgc catggcctgt ctggtgggcc tgatgtggct gtcctacttt 300 atcgcctctt tcagactgtt tgcccggacc agatccatgt ggtctttcaa ccccgagaca 360 aatatcctgc tgaacgtgcc tctgcacggc accatcctga caaggccact gctggagtcc 420 gagctggtca tcggagccgt gatcctgagg ggacacctga ggatcgcagg acaccacctg 480 ggccgctgtg acatcaagga tctgcctaag gagatcaccg tggccacaag ccggaccctg 540 tcctactata agctgggagc atctcagaga gtggcaggcg attctggctt cgccgcctat 600 agcaggtacc gcatcggcaa ttacaagctg aacaccgacc acagctcctc tagcgataac 660 atcgccctgc tggtgcagta ataatagtct aga 693 <210> 24 <211> 1286 <212> DNA <213> Artificial Sequence <220> <223> SVF-12 codon optimized sequence <220> <221> BamHI_restriction_site <222> (1)..(6) <220> <221> Kozak <222> (7)..(15) <220> <221> NP <222> (12)..(1274) <220> <221> XbaI_restriction_site <222> (1281)..(1286) <400> 24 ggatccgcac catggcaagc gacaatggac cacagaatca gaggaacgca ccaagaatca 60 ctttcggcgg cccaagcgac tcaaccggca gcaatcagaa cggagagcgg agcggagcaa 120 gatccaagca gagacggccc cagggcctgc caaacaatac cgcatcctgg ttcaccgccc 180 tgacacagca cggcaaggag gacctgaagt ttccaagggg acagggagtg cctatcaaca 240 ccaatagctc ccctgacgat cagatcggct actataggag ggcaacaagg agaatcaggg 300 gaggcgacgg caagatgaag gatctgagcc cacgctggta cttctactat ctgggaaccg 360 gacctgaggc aggcctgcca tatggcgcca ataaggacgg aatcatctgg gtggcaaccg 420 agggcgccct gaacacacca aaggatcaca tcggcacaag aaatcccgcc aacaatgcag 480 caatcgtgct gcagctgcca cagggaacca cactgcccaa gggcttttac gcagagggct 540 ctcggggagg cagccaggca tctagcagat cctctagccg gagcagaaac tcctctagga 600 attccacccc aggcagctcc aggggcacat cccctgcccg catggcagga aacggaggcg 660 acgccgccct ggccctgctg ctgctggatc gcctgaatca gctggagtcc aagatgtctg 720 gcaagggaca gcagcagcag ggacagaccg tgacaaagaa gtccgccgcc gaggcctcta 780 agaagccaag gcagaagcgc accgccacaa aggcctacaa cgtgacccag gccttcggca 840 ggcgcggacc agagcagaca cagggcaatt ttggcgacca ggagctgatc aggcagggaa 900 ccgattataa gcactggcct cagatcgccc agttcgcccc atctgccagc gccttctttg 960 gcatgagccg gatcggaatg gaggtgaccc caagcggcac atggctgacc tacacaggcg 1020 ccatcaagct ggacgataag gaccctaact tcaaggatca ggtcatcctg ctgaacaagc 1080 acatcgacgc ctataagacc tttcccccta cagagcccaa gaaggacaag aagaagaagg 1140 ccgatgagac acaggccctg cctcagaggc agaagaagca gcagaccgtg acactgctgc 1200 cagccgccga tctggacgat ttctcaaaac agctgcagca gtcaatgtca agcgccgatt 1260 caactcaggc ataatgatga tctaga 1286 <210> 25 <211> 697 <212> PRT <213> Artificial Sequence <220> <223> SVF-1 polypeptide sequence <220> <221> RBD <222> (1)..(255) <220> <221> P2A <222> (256)..(277) <220> <221> NP <222> (278)..(697) <400> 25 Met Ala Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp 1 5 10 15 Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe 20 25 30 Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro 35 40 45 Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe 50 55 60 Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn 65 70 75 80 Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn 85 90 95 Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys 100 105 110 Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile 115 120 125 Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile 130 135 140 Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile 145 150 155 160 Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn 165 170 175 Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg 180 185 190 Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly 195 200 205 Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln 210 215 220 Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser 225 230 235 240 Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Gly 245 250 255 Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu 260 265 270 Glu Asn Pro Gly Pro Met Ala Ser Asp Asn Gly Pro Gln Asn Gln Arg 275 280 285 Asn Ala Pro Arg Ile Thr Phe Gly Gly Pro Ser Asp Ser Thr Gly Ser 290 295 300 Asn Gln Asn Gly Glu Arg Ser Gly Ala Arg Ser Lys Gln Arg Arg Pro 305 310 315 320 Gln Gly Leu Pro Asn Asn Thr Ala Ser Trp Phe Thr Ala Leu Thr Gln 325 330 335 His Gly Lys Glu Asp Leu Lys Phe Pro Arg Gly Gln Gly Val Pro Ile 340 345 350 Asn Thr Asn Ser Ser Pro Asp Asp Gln Ile Gly Tyr Tyr Arg Arg Ala 355 360 365 Thr Arg Arg Ile Arg Gly Gly Asp Gly Lys Met Lys Asp Leu Ser Pro 370 375 380 Arg Trp Tyr Phe Tyr Tyr Leu Gly Thr Gly Pro Glu Ala Gly Leu Pro 385 390 395 400 Tyr Gly Ala Asn Lys Asp Gly Ile Ile Trp Val Ala Thr Glu Gly Ala 405 410 415 Leu Asn Thr Pro Lys Asp His Ile Gly Thr Arg Asn Pro Ala Asn Asn 420 425 430 Ala Ala Ile Val Leu Gln Leu Pro Gln Gly Thr Thr Leu Pro Lys Gly 435 440 445 Phe Tyr Ala Glu Gly Ser Arg Gly Gly Ser Gln Ala Ser Ser Arg Ser 450 455 460 Ser Ser Arg Ser Arg Asn Ser Ser Arg Asn Ser Thr Pro Gly Ser Ser 465 470 475 480 Arg Gly Thr Ser Pro Ala Arg Met Ala Gly Asn Gly Gly Asp Ala Ala 485 490 495 Leu Ala Leu Leu Leu Leu Asp Arg Leu Asn Gln Leu Glu Ser Lys Met 500 505 510 Ser Gly Lys Gly Gln Gln Gln Gln Gly Gln Thr Val Thr Lys Lys Ser 515 520 525 Ala Ala Glu Ala Ser Lys Lys Pro Arg Gln Lys Arg Thr Ala Thr Lys 530 535 540 Ala Tyr Asn Val Thr Gln Ala Phe Gly Arg Arg Gly Pro Glu Gln Thr 545 550 555 560 Gln Gly Asn Phe Gly Asp Gln Glu Leu Ile Arg Gln Gly Thr Asp Tyr 565 570 575 Lys His Trp Pro Gln Ile Ala Gln Phe Ala Pro Ser Ala Ser Ala Phe 580 585 590 Phe Gly Met Ser Arg Ile Gly Met Glu Val Thr Pro Ser Gly Thr Trp 595 600 605 Leu Thr Tyr Thr Gly Ala Ile Lys Leu Asp Asp Lys Asp Pro Asn Phe 610 615 620 Lys Asp Gln Val Ile Leu Leu Asn Lys His Ile Asp Ala Tyr Lys Thr 625 630 635 640 Phe Pro Pro Thr Glu Pro Lys Lys Asp Lys Lys Lys Lys Ala Asp Glu 645 650 655 Thr Gln Ala Leu Pro Gln Arg Gln Lys Lys Gln Gln Thr Val Thr Leu 660 665 670 Leu Pro Ala Ala Asp Leu Asp Asp Phe Ser Lys Gln Leu Gln Gln Ser 675 680 685 Met Ser Ser Ala Asp Ser Thr Gln Ala 690 695 <210> 26 <211> 918 <212> PRT <213> Artificial Sequence <220> <223> SVF-2 polypeptide sequence <220> <221> RBD <222> (1)..(255) <220> <221> P2A <222> (256)..(277) <220> <221> M <222> (278)..(499) <220> <221> NP <222> (500)..(918) <400> 26 Met Ala Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp 1 5 10 15 Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe 20 25 30 Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro 35 40 45 Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe 50 55 60 Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn 65 70 75 80 Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn 85 90 95 Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys 100 105 110 Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile 115 120 125 Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile 130 135 140 Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile 145 150 155 160 Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn 165 170 175 Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg 180 185 190 Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly 195 200 205 Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln 210 215 220 Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser 225 230 235 240 Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Gly 245 250 255 Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu 260 265 270 Glu Asn Pro Gly Pro Met Ala Asp Ser Asn Gly Thr Ile Thr Val Glu 275 280 285 Glu Leu Lys Lys Leu Leu Glu Gln Trp Asn Leu Val Ile Gly Phe Leu 290 295 300 Phe Leu Thr Trp Ile Cys Leu Leu Gln Phe Ala Tyr Ala Asn Arg Asn 305 310 315 320 Arg Phe Leu Tyr Ile Ile Lys Leu Ile Phe Leu Trp Leu Leu Trp Pro 325 330 335 Val Thr Leu Ala Cys Phe Val Leu Ala Ala Val Tyr Arg Ile Asn Trp 340 345 350 Ile Thr Gly Gly Ile Ala Ile Ala Met Ala Cys Leu Val Gly Leu Met 355 360 365 Trp Leu Ser Tyr Phe Ile Ala Ser Phe Arg Leu Phe Ala Arg Thr Arg 370 375 380 Ser Met Trp Ser Phe Asn Pro Glu Thr Asn Ile Leu Leu Asn Val Pro 385 390 395 400 Leu His Gly Thr Ile Leu Thr Arg Pro Leu Leu Glu Ser Glu Leu Val 405 410 415 Ile Gly Ala Val Ile Leu Arg Gly His Leu Arg Ile Ala Gly His His 420 425 430 Leu Gly Arg Cys Asp Ile Lys Asp Leu Pro Lys Glu Ile Thr Val Ala 435 440 445 Thr Ser Arg Thr Leu Ser Tyr Tyr Lys Leu Gly Ala Ser Gln Arg Val 450 455 460 Ala Gly Asp Ser Gly Phe Ala Ala Tyr Ser Arg Tyr Arg Ile Gly Asn 465 470 475 480 Tyr Lys Leu Asn Thr Asp His Ser Ser Ser Ser Asp Asn Ile Ala Leu 485 490 495 Leu Val Gln Ala Ser Asp Asn Gly Pro Gln Asn Gln Arg Asn Ala Pro 500 505 510 Arg Ile Thr Phe Gly Gly Pro Ser Asp Ser Thr Gly Ser Asn Gln Asn 515 520 525 Gly Glu Arg Ser Gly Ala Arg Ser Lys Gln Arg Arg Pro Gln Gly Leu 530 535 540 Pro Asn Asn Thr Ala Ser Trp Phe Thr Ala Leu Thr Gln His Gly Lys 545 550 555 560 Glu Asp Leu Lys Phe Pro Arg Gly Gln Gly Val Pro Ile Asn Thr Asn 565 570 575 Ser Ser Pro Asp Asp Gln Ile Gly Tyr Tyr Arg Arg Ala Thr Arg Arg 580 585 590 Ile Arg Gly Gly Asp Gly Lys Met Lys Asp Leu Ser Pro Arg Trp Tyr 595 600 605 Phe Tyr Tyr Leu Gly Thr Gly Pro Glu Ala Gly Leu Pro Tyr Gly Ala 610 615 620 Asn Lys Asp Gly Ile Ile Trp Val Ala Thr Glu Gly Ala Leu Asn Thr 625 630 635 640 Pro Lys Asp His Ile Gly Thr Arg Asn Pro Ala Asn Asn Ala Ala Ile 645 650 655 Val Leu Gln Leu Pro Gln Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala 660 665 670 Glu Gly Ser Arg Gly Gly Ser Gln Ala Ser Ser Arg Ser Ser Ser Arg 675 680 685 Ser Arg Asn Ser Ser Arg Asn Ser Thr Pro Gly Ser Ser Arg Gly Thr 690 695 700 Ser Pro Ala Arg Met Ala Gly Asn Gly Gly Asp Ala Ala Leu Ala Leu 705 710 715 720 Leu Leu Leu Asp Arg Leu Asn Gln Leu Glu Ser Lys Met Ser Gly Lys 725 730 735 Gly Gln Gln Gln Gln Gly Gln Thr Val Thr Lys Lys Ser Ala Ala Glu 740 745 750 Ala Ser Lys Lys Pro Arg Gln Lys Arg Thr Ala Thr Lys Ala Tyr Asn 755 760 765 Val Thr Gln Ala Phe Gly Arg Arg Gly Pro Glu Gln Thr Gln Gly Asn 770 775 780 Phe Gly Asp Gln Glu Leu Ile Arg Gln Gly Thr Asp Tyr Lys His Trp 785 790 795 800 Pro Gln Ile Ala Gln Phe Ala Pro Ser Ala Ser Ala Phe Phe Gly Met 805 810 815 Ser Arg Ile Gly Met Glu Val Thr Pro Ser Gly Thr Trp Leu Thr Tyr 820 825 830 Thr Gly Ala Ile Lys Leu Asp Asp Lys Asp Pro Asn Phe Lys Asp Gln 835 840 845 Val Ile Leu Leu Asn Lys His Ile Asp Ala Tyr Lys Thr Phe Pro Pro 850 855 860 Thr Glu Pro Lys Lys Asp Lys Lys Lys Lys Ala Asp Glu Thr Gln Ala 865 870 875 880 Leu Pro Gln Arg Gln Lys Lys Gln Gln Thr Val Thr Leu Leu Pro Ala 885 890 895 Ala Asp Leu Asp Asp Phe Ser Lys Gln Leu Gln Gln Ser Met Ser Ser 900 905 910 Ala Asp Ser Thr Gln Ala 915 <210> 27 <211> 941 <212> PRT <213> Artificial Sequence <220> <223> SVF-3 polypeptide sequence <220> <221> RBD <222> (1)..(255) <220> <221> P2A <222> (256)..(277) <220> <221> M <222> (278)..(499) <220> <221> P2A <222> (500)..(521) <220> <221> NP <222> (522)..(941) <400> 27 Met Ala Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp 1 5 10 15 Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe 20 25 30 Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro 35 40 45 Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe 50 55 60 Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn 65 70 75 80 Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn 85 90 95 Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys 100 105 110 Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile 115 120 125 Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile 130 135 140 Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile 145 150 155 160 Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn 165 170 175 Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg 180 185 190 Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly 195 200 205 Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln 210 215 220 Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser 225 230 235 240 Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Gly 245 250 255 Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu 260 265 270 Glu Asn Pro Gly Pro Met Ala Asp Ser Asn Gly Thr Ile Thr Val Glu 275 280 285 Glu Leu Lys Lys Leu Leu Glu Gln Trp Asn Leu Val Ile Gly Phe Leu 290 295 300 Phe Leu Thr Trp Ile Cys Leu Leu Gln Phe Ala Tyr Ala Asn Arg Asn 305 310 315 320 Arg Phe Leu Tyr Ile Ile Lys Leu Ile Phe Leu Trp Leu Leu Trp Pro 325 330 335 Val Thr Leu Ala Cys Phe Val Leu Ala Ala Val Tyr Arg Ile Asn Trp 340 345 350 Ile Thr Gly Gly Ile Ala Ile Ala Met Ala Cys Leu Val Gly Leu Met 355 360 365 Trp Leu Ser Tyr Phe Ile Ala Ser Phe Arg Leu Phe Ala Arg Thr Arg 370 375 380 Ser Met Trp Ser Phe Asn Pro Glu Thr Asn Ile Leu Leu Asn Val Pro 385 390 395 400 Leu His Gly Thr Ile Leu Thr Arg Pro Leu Leu Glu Ser Glu Leu Val 405 410 415 Ile Gly Ala Val Ile Leu Arg Gly His Leu Arg Ile Ala Gly His His 420 425 430 Leu Gly Arg Cys Asp Ile Lys Asp Leu Pro Lys Glu Ile Thr Val Ala 435 440 445 Thr Ser Arg Thr Leu Ser Tyr Tyr Lys Leu Gly Ala Ser Gln Arg Val 450 455 460 Ala Gly Asp Ser Gly Phe Ala Ala Tyr Ser Arg Tyr Arg Ile Gly Asn 465 470 475 480 Tyr Lys Leu Asn Thr Asp His Ser Ser Ser Ser Asp Asn Ile Ala Leu 485 490 495 Leu Val Gln Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala 500 505 510 Gly Asp Val Glu Glu Asn Pro Gly Pro Met Ala Ser Asp Asn Gly Pro 515 520 525 Gln Asn Gln Arg Asn Ala Pro Arg Ile Thr Phe Gly Gly Pro Ser Asp 530 535 540 Ser Thr Gly Ser Asn Gln Asn Gly Glu Arg Ser Gly Ala Arg Ser Lys 545 550 555 560 Gln Arg Arg Pro Gln Gly Leu Pro Asn Asn Thr Ala Ser Trp Phe Thr 565 570 575 Ala Leu Thr Gln His Gly Lys Glu Asp Leu Lys Phe Pro Arg Gly Gln 580 585 590 Gly Val Pro Ile Asn Thr Asn Ser Ser Pro Asp Asp Gln Ile Gly Tyr 595 600 605 Tyr Arg Arg Ala Thr Arg Arg Ile Arg Gly Gly Asp Gly Lys Met Lys 610 615 620 Asp Leu Ser Pro Arg Trp Tyr Phe Tyr Tyr Leu Gly Thr Gly Pro Glu 625 630 635 640 Ala Gly Leu Pro Tyr Gly Ala Asn Lys Asp Gly Ile Ile Trp Val Ala 645 650 655 Thr Glu Gly Ala Leu Asn Thr Pro Lys Asp His Ile Gly Thr Arg Asn 660 665 670 Pro Ala Asn Asn Ala Ala Ile Val Leu Gln Leu Pro Gln Gly Thr Thr 675 680 685 Leu Pro Lys Gly Phe Tyr Ala Glu Gly Ser Arg Gly Gly Ser Gln Ala 690 695 700 Ser Ser Arg Ser Ser Ser Arg Ser Arg Asn Ser Ser Arg Asn Ser Thr 705 710 715 720 Pro Gly Ser Ser Arg Gly Thr Ser Pro Ala Arg Met Ala Gly Asn Gly 725 730 735 Gly Asp Ala Ala Leu Ala Leu Leu Leu Leu Asp Arg Leu Asn Gln Leu 740 745 750 Glu Ser Lys Met Ser Gly Lys Gly Gln Gln Gln Gln Gly Gln Thr Val 755 760 765 Thr Lys Lys Ser Ala Ala Glu Ala Ser Lys Lys Pro Arg Gln Lys Arg 770 775 780 Thr Ala Thr Lys Ala Tyr Asn Val Thr Gln Ala Phe Gly Arg Arg Gly 785 790 795 800 Pro Glu Gln Thr Gln Gly Asn Phe Gly Asp Gln Glu Leu Ile Arg Gln 805 810 815 Gly Thr Asp Tyr Lys His Trp Pro Gln Ile Ala Gln Phe Ala Pro Ser 820 825 830 Ala Ser Ala Phe Phe Gly Met Ser Arg Ile Gly Met Glu Val Thr Pro 835 840 845 Ser Gly Thr Trp Leu Thr Tyr Thr Gly Ala Ile Lys Leu Asp Asp Lys 850 855 860 Asp Pro Asn Phe Lys Asp Gln Val Ile Leu Leu Asn Lys His Ile Asp 865 870 875 880 Ala Tyr Lys Thr Phe Pro Pro Thr Glu Pro Lys Lys Asp Lys Lys Lys 885 890 895 Lys Ala Asp Glu Thr Gln Ala Leu Pro Gln Arg Gln Lys Lys Gln Gln 900 905 910 Thr Val Thr Leu Leu Pro Ala Ala Asp Leu Asp Asp Phe Ser Lys Gln 915 920 925 Leu Gln Gln Ser Met Ser Ser Ala Asp Ser Thr Gln Ala 930 935 940 <210> 28 <211> 499 <212> PRT <213> Artificial Sequence <220> <223> SVF-4 polypeptide sequence <220> <221> RBD <222> (1)..(255) <220> <221> P2A <222> (256)..(277) <220> <221> M <222> (278)..(499) <400> 28 Met Ala Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp 1 5 10 15 Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe 20 25 30 Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro 35 40 45 Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe 50 55 60 Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn 65 70 75 80 Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn 85 90 95 Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys 100 105 110 Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile 115 120 125 Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile 130 135 140 Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile 145 150 155 160 Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn 165 170 175 Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg 180 185 190 Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly 195 200 205 Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln 210 215 220 Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser 225 230 235 240 Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Gly 245 250 255 Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu 260 265 270 Glu Asn Pro Gly Pro Met Ala Asp Ser Asn Gly Thr Ile Thr Val Glu 275 280 285 Glu Leu Lys Lys Leu Leu Glu Gln Trp Asn Leu Val Ile Gly Phe Leu 290 295 300 Phe Leu Thr Trp Ile Cys Leu Leu Gln Phe Ala Tyr Ala Asn Arg Asn 305 310 315 320 Arg Phe Leu Tyr Ile Ile Lys Leu Ile Phe Leu Trp Leu Leu Trp Pro 325 330 335 Val Thr Leu Ala Cys Phe Val Leu Ala Ala Val Tyr Arg Ile Asn Trp 340 345 350 Ile Thr Gly Gly Ile Ala Ile Ala Met Ala Cys Leu Val Gly Leu Met 355 360 365 Trp Leu Ser Tyr Phe Ile Ala Ser Phe Arg Leu Phe Ala Arg Thr Arg 370 375 380 Ser Met Trp Ser Phe Asn Pro Glu Thr Asn Ile Leu Leu Asn Val Pro 385 390 395 400 Leu His Gly Thr Ile Leu Thr Arg Pro Leu Leu Glu Ser Glu Leu Val 405 410 415 Ile Gly Ala Val Ile Leu Arg Gly His Leu Arg Ile Ala Gly His His 420 425 430 Leu Gly Arg Cys Asp Ile Lys Asp Leu Pro Lys Glu Ile Thr Val Ala 435 440 445 Thr Ser Arg Thr Leu Ser Tyr Tyr Lys Leu Gly Ala Ser Gln Arg Val 450 455 460 Ala Gly Asp Ser Gly Phe Ala Ala Tyr Ser Arg Tyr Arg Ile Gly Asn 465 470 475 480 Tyr Lys Leu Asn Thr Asp His Ser Ser Ser Ser Asp Asn Ile Ala Leu 485 490 495 Leu Val Gln <210> 29 <211> 674 <212> PRT <213> Artificial Sequence <220> <223> SVF-5 polypeptide sequence <220> <221> RBD <222> (1)..(255) <220> <221> NP <222> (256)..(674) <400> 29 Met Ala Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp 1 5 10 15 Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe 20 25 30 Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro 35 40 45 Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe 50 55 60 Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn 65 70 75 80 Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn 85 90 95 Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys 100 105 110 Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile 115 120 125 Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile 130 135 140 Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile 145 150 155 160 Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn 165 170 175 Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg 180 185 190 Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly 195 200 205 Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln 210 215 220 Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser 225 230 235 240 Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ala 245 250 255 Ser Asp Asn Gly Pro Gln Asn Gln Arg Asn Ala Pro Arg Ile Thr Phe 260 265 270 Gly Gly Pro Ser Asp Ser Thr Gly Ser Asn Gln Asn Gly Glu Arg Ser 275 280 285 Gly Ala Arg Ser Lys Gln Arg Arg Pro Gln Gly Leu Pro Asn Asn Thr 290 295 300 Ala Ser Trp Phe Thr Ala Leu Thr Gln His Gly Lys Glu Asp Leu Lys 305 310 315 320 Phe Pro Arg Gly Gln Gly Val Pro Ile Asn Thr Asn Ser Ser Pro Asp 325 330 335 Asp Gln Ile Gly Tyr Tyr Arg Arg Ala Thr Arg Arg Ile Arg Gly Gly 340 345 350 Asp Gly Lys Met Lys Asp Leu Ser Pro Arg Trp Tyr Phe Tyr Tyr Leu 355 360 365 Gly Thr Gly Pro Glu Ala Gly Leu Pro Tyr Gly Ala Asn Lys Asp Gly 370 375 380 Ile Ile Trp Val Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys Asp His 385 390 395 400 Ile Gly Thr Arg Asn Pro Ala Asn Asn Ala Ala Ile Val Leu Gln Leu 405 410 415 Pro Gln Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala Glu Gly Ser Arg 420 425 430 Gly Gly Ser Gln Ala Ser Ser Arg Ser Ser Ser Arg Ser Arg Asn Ser 435 440 445 Ser Arg Asn Ser Thr Pro Gly Ser Ser Arg Gly Thr Ser Pro Ala Arg 450 455 460 Met Ala Gly Asn Gly Gly Asp Ala Ala Leu Ala Leu Leu Leu Leu Asp 465 470 475 480 Arg Leu Asn Gln Leu Glu Ser Lys Met Ser Gly Lys Gly Gln Gln Gln 485 490 495 Gln Gly Gln Thr Val Thr Lys Lys Ser Ala Ala Glu Ala Ser Lys Lys 500 505 510 Pro Arg Gln Lys Arg Thr Ala Thr Lys Ala Tyr Asn Val Thr Gln Ala 515 520 525 Phe Gly Arg Arg Gly Pro Glu Gln Thr Gln Gly Asn Phe Gly Asp Gln 530 535 540 Glu Leu Ile Arg Gln Gly Thr Asp Tyr Lys His Trp Pro Gln Ile Ala 545 550 555 560 Gln Phe Ala Pro Ser Ala Ser Ala Phe Phe Gly Met Ser Arg Ile Gly 565 570 575 Met Glu Val Thr Pro Ser Gly Thr Trp Leu Thr Tyr Thr Gly Ala Ile 580 585 590 Lys Leu Asp Asp Lys Asp Pro Asn Phe Lys Asp Gln Val Ile Leu Leu 595 600 605 Asn Lys His Ile Asp Ala Tyr Lys Thr Phe Pro Pro Thr Glu Pro Lys 610 615 620 Lys Asp Lys Lys Lys Lys Ala Asp Glu Thr Gln Ala Leu Pro Gln Arg 625 630 635 640 Gln Lys Lys Gln Gln Thr Val Thr Leu Leu Pro Ala Ala Asp Leu Asp 645 650 655 Asp Phe Ser Lys Gln Leu Gln Gln Ser Met Ser Ser Ala Asp Ser Thr 660 665 670 Gln Ala <210> 30 <211> 895 <212> PRT <213> Artificial Sequence <220> <223> SVF-6 polypeptide sequence <220> <221> RBD <222> (1)..(255) <220> <221> M <222> (256)..(476) <220> <221> NP <222> (477)..(895) <400> 30 Met Ala Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp 1 5 10 15 Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe 20 25 30 Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro 35 40 45 Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe 50 55 60 Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn 65 70 75 80 Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn 85 90 95 Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys 100 105 110 Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile 115 120 125 Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile 130 135 140 Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile 145 150 155 160 Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn 165 170 175 Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg 180 185 190 Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly 195 200 205 Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln 210 215 220 Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser 225 230 235 240 Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ala 245 250 255 Asp Ser Asn Gly Thr Ile Thr Val Glu Glu Leu Lys Lys Leu Leu Glu 260 265 270 Gln Trp Asn Leu Val Ile Gly Phe Leu Phe Leu Thr Trp Ile Cys Leu 275 280 285 Leu Gln Phe Ala Tyr Ala Asn Arg Asn Arg Phe Leu Tyr Ile Ile Lys 290 295 300 Leu Ile Phe Leu Trp Leu Leu Trp Pro Val Thr Leu Ala Cys Phe Val 305 310 315 320 Leu Ala Ala Val Tyr Arg Ile Asn Trp Ile Thr Gly Gly Ile Ala Ile 325 330 335 Ala Met Ala Cys Leu Val Gly Leu Met Trp Leu Ser Tyr Phe Ile Ala 340 345 350 Ser Phe Arg Leu Phe Ala Arg Thr Arg Ser Met Trp Ser Phe Asn Pro 355 360 365 Glu Thr Asn Ile Leu Leu Asn Val Pro Leu His Gly Thr Ile Leu Thr 370 375 380 Arg Pro Leu Leu Glu Ser Glu Leu Val Ile Gly Ala Val Ile Leu Arg 385 390 395 400 Gly His Leu Arg Ile Ala Gly His His Leu Gly Arg Cys Asp Ile Lys 405 410 415 Asp Leu Pro Lys Glu Ile Thr Val Ala Thr Ser Arg Thr Leu Ser Tyr 420 425 430 Tyr Lys Leu Gly Ala Ser Gln Arg Val Ala Gly Asp Ser Gly Phe Ala 435 440 445 Ala Tyr Ser Arg Tyr Arg Ile Gly Asn Tyr Lys Leu Asn Thr Asp His 450 455 460 Ser Ser Ser Ser Asp Asn Ile Ala Leu Leu Val Gln Ala Ser Asp Asn 465 470 475 480 Gly Pro Gln Asn Gln Arg Asn Ala Pro Arg Ile Thr Phe Gly Gly Pro 485 490 495 Ser Asp Ser Thr Gly Ser Asn Gln Asn Gly Glu Arg Ser Gly Ala Arg 500 505 510 Ser Lys Gln Arg Arg Pro Gln Gly Leu Pro Asn Asn Thr Ala Ser Trp 515 520 525 Phe Thr Ala Leu Thr Gln His Gly Lys Glu Asp Leu Lys Phe Pro Arg 530 535 540 Gly Gln Gly Val Pro Ile Asn Thr Asn Ser Ser Pro Asp Asp Gln Ile 545 550 555 560 Gly Tyr Tyr Arg Arg Ala Thr Arg Arg Ile Arg Gly Gly Asp Gly Lys 565 570 575 Met Lys Asp Leu Ser Pro Arg Trp Tyr Phe Tyr Tyr Leu Gly Thr Gly 580 585 590 Pro Glu Ala Gly Leu Pro Tyr Gly Ala Asn Lys Asp Gly Ile Ile Trp 595 600 605 Val Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys Asp His Ile Gly Thr 610 615 620 Arg Asn Pro Ala Asn Asn Ala Ala Ile Val Leu Gln Leu Pro Gln Gly 625 630 635 640 Thr Thr Leu Pro Lys Gly Phe Tyr Ala Glu Gly Ser Arg Gly Gly Ser 645 650 655 Gln Ala Ser Ser Arg Ser Ser Ser Arg Ser Arg Asn Ser Ser Arg Asn 660 665 670 Ser Thr Pro Gly Ser Ser Arg Gly Thr Ser Pro Ala Arg Met Ala Gly 675 680 685 Asn Gly Gly Asp Ala Ala Leu Ala Leu Leu Leu Leu Asp Arg Leu Asn 690 695 700 Gln Leu Glu Ser Lys Met Ser Gly Lys Gly Gln Gln Gln Gln Gly Gln 705 710 715 720 Thr Val Thr Lys Lys Ser Ala Ala Glu Ala Ser Lys Lys Pro Arg Gln 725 730 735 Lys Arg Thr Ala Thr Lys Ala Tyr Asn Val Thr Gln Ala Phe Gly Arg 740 745 750 Arg Gly Pro Glu Gln Thr Gln Gly Asn Phe Gly Asp Gln Glu Leu Ile 755 760 765 Arg Gln Gly Thr Asp Tyr Lys His Trp Pro Gln Ile Ala Gln Phe Ala 770 775 780 Pro Ser Ala Ser Ala Phe Phe Gly Met Ser Arg Ile Gly Met Glu Val 785 790 795 800 Thr Pro Ser Gly Thr Trp Leu Thr Tyr Thr Gly Ala Ile Lys Leu Asp 805 810 815 Asp Lys Asp Pro Asn Phe Lys Asp Gln Val Ile Leu Leu Asn Lys His 820 825 830 Ile Asp Ala Tyr Lys Thr Phe Pro Pro Thr Glu Pro Lys Lys Asp Lys 835 840 845 Lys Lys Lys Ala Asp Glu Thr Gln Ala Leu Pro Gln Arg Gln Lys Lys 850 855 860 Gln Gln Thr Val Thr Leu Leu Pro Ala Ala Asp Leu Asp Asp Phe Ser 865 870 875 880 Lys Gln Leu Gln Gln Ser Met Ser Ser Ala Asp Ser Thr Gln Ala 885 890 895 <210> 31 <211> 476 <212> PRT <213> Artificial Sequence <220> <223> SVF-7 polypeptide sequence <220> <221> RBD <222> (1)..(255) <220> <221> M <222> (256)..(476) <400> 31 Met Ala Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp 1 5 10 15 Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe 20 25 30 Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro 35 40 45 Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe 50 55 60 Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn 65 70 75 80 Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn 85 90 95 Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys 100 105 110 Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile 115 120 125 Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile 130 135 140 Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile 145 150 155 160 Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn 165 170 175 Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg 180 185 190 Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly 195 200 205 Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln 210 215 220 Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser 225 230 235 240 Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ala 245 250 255 Asp Ser Asn Gly Thr Ile Thr Val Glu Glu Leu Lys Lys Leu Leu Glu 260 265 270 Gln Trp Asn Leu Val Ile Gly Phe Leu Phe Leu Thr Trp Ile Cys Leu 275 280 285 Leu Gln Phe Ala Tyr Ala Asn Arg Asn Arg Phe Leu Tyr Ile Ile Lys 290 295 300 Leu Ile Phe Leu Trp Leu Leu Trp Pro Val Thr Leu Ala Cys Phe Val 305 310 315 320 Leu Ala Ala Val Tyr Arg Ile Asn Trp Ile Thr Gly Gly Ile Ala Ile 325 330 335 Ala Met Ala Cys Leu Val Gly Leu Met Trp Leu Ser Tyr Phe Ile Ala 340 345 350 Ser Phe Arg Leu Phe Ala Arg Thr Arg Ser Met Trp Ser Phe Asn Pro 355 360 365 Glu Thr Asn Ile Leu Leu Asn Val Pro Leu His Gly Thr Ile Leu Thr 370 375 380 Arg Pro Leu Leu Glu Ser Glu Leu Val Ile Gly Ala Val Ile Leu Arg 385 390 395 400 Gly His Leu Arg Ile Ala Gly His His Leu Gly Arg Cys Asp Ile Lys 405 410 415 Asp Leu Pro Lys Glu Ile Thr Val Ala Thr Ser Arg Thr Leu Ser Tyr 420 425 430 Tyr Lys Leu Gly Ala Ser Gln Arg Val Ala Gly Asp Ser Gly Phe Ala 435 440 445 Ala Tyr Ser Arg Tyr Arg Ile Gly Asn Tyr Lys Leu Asn Thr Asp His 450 455 460 Ser Ser Ser Ser Asp Asn Ile Ala Leu Leu Val Gln 465 470 475 <210> 32 <211> 1107 <212> PRT <213> Artificial Sequence <220> <223> SVF-8 polypeptide sequence <220> <221> RBD <222> (1)..(255) <220> <221> HDAg_genotype_1A <222> (256)..(468) <220> <221> HDAg_genotype_1B <222> (469)..(681) <220> <221> HDAg_genotype_2A <222> (682)..(894) <220> <221> HDAg_genotype_2B <222> (895)..(1107) <400> 32 Met Ala Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp 1 5 10 15 Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe 20 25 30 Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro 35 40 45 Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe 50 55 60 Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn 65 70 75 80 Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn 85 90 95 Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys 100 105 110 Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile 115 120 125 Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile 130 135 140 Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile 145 150 155 160 Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn 165 170 175 Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg 180 185 190 Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly 195 200 205 Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln 210 215 220 Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser 225 230 235 240 Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser 245 250 255 Arg Ser Glu Ser Lys Lys Asn Arg Gly Gly Arg Glu Glu Ile Leu Glu 260 265 270 Gln Trp Val Gly Ala Arg Lys Lys Leu Glu Glu Leu Glu Arg Asp Leu 275 280 285 Arg Lys Ile Lys Lys Lys Ile Lys Lys Leu Glu Glu Glu Asn Pro Trp 290 295 300 Leu Gly Asn Ile Lys Gly Ile Leu Gly Lys Lys Asp Arg Glu Gly Glu 305 310 315 320 Gly Ala Pro Pro Ala Lys Arg Ala Arg Ala Asp Gln Met Glu Val Asp 325 330 335 Ser Gly Pro Arg Lys Arg Pro Phe Arg Gly Glu Phe Thr Asp Lys Glu 340 345 350 Arg Arg Asp His Arg Arg Arg Lys Ala Leu Glu Asn Lys Arg Lys Gln 355 360 365 Leu Ser Ser Gly Gly Lys Ser Leu Ser Lys Glu Glu Glu Glu Glu Leu 370 375 380 Arg Lys Leu Thr Glu Glu Asp Glu Arg Arg Glu Arg Arg Val Ala Gly 385 390 395 400 Pro Arg Val Gly Gly Val Asn Pro Leu Glu Gly Gly Thr Arg Gly Ala 405 410 415 Pro Gly Gly Gly Phe Val Pro Ser Met Gln Gly Val Pro Glu Ser Pro 420 425 430 Phe Ala Arg Thr Gly Glu Gly Leu Asp Val Arg Gly Asn Gln Gly Phe 435 440 445 Pro Trp Asp Ile Leu Phe Pro Ala Asp Pro Pro Phe Ser Pro Gln Ser 450 455 460 Cys Arg Pro Gln Ser Arg Ser Glu Ser Lys Lys Asn Arg Gly Gly Arg 465 470 475 480 Glu Glu Val Leu Glu Gln Trp Val Asn Gly Arg Lys Lys Leu Glu Glu 485 490 495 Leu Glu Arg Glu Leu Arg Arg Ala Arg Lys Lys Ile Lys Lys Leu Glu 500 505 510 Asp Asp Asn Pro Trp Leu Gly Asn Val Lys Gly Ile Leu Gly Lys Lys 515 520 525 Asp Lys Asp Gly Glu Gly Ala Pro Pro Ala Lys Arg Ala Arg Thr Asp 530 535 540 Gln Met Glu Ile Asp Ser Gly Pro Arg Lys Arg Pro Leu Arg Gly Gly 545 550 555 560 Phe Thr Asp Arg Glu Arg Gln Asp His Arg Arg Arg Lys Ala Leu Lys 565 570 575 Asn Lys Lys Lys Gln Leu Ser Ala Gly Gly Lys Ser Leu Ser Lys Glu 580 585 590 Glu Glu Glu Glu Leu Lys Arg Leu Thr Arg Glu Asp Glu Glu Arg Lys 595 600 605 Lys Glu Glu His Gly Pro Ser Arg Leu Gly Val Asn Pro Ser Glu Gly 610 615 620 Gly Pro Arg Gly Ala Pro Gly Gly Gly Phe Val Pro Ser Met Gln Gly 625 630 635 640 Ile Pro Glu Ser Arg Phe Thr Arg Thr Gly Glu Gly Leu Asp Val Arg 645 650 655 Gly Ser Arg Gly Phe Pro Gln Asp Ile Leu Phe Pro Ser Asp Pro Pro 660 665 670 Phe Ser Pro Gln Ser Cys Arg Pro Gln Ser Gln Ser Glu Thr Arg Arg 675 680 685 Gly Arg Arg Gly Thr Arg Glu Glu Thr Leu Glu Lys Trp Ile Thr Ala 690 695 700 Arg Lys Lys Ala Glu Glu Leu Glu Lys Asp Leu Arg Lys Thr Arg Lys 705 710 715 720 Thr Ile Lys Lys Leu Glu Glu Glu Asn Pro Trp Leu Gly Asn Ile Val 725 730 735 Gly Ile Ile Arg Lys Gly Lys Asp Gly Glu Gly Ala Pro Pro Ala Lys 740 745 750 Arg Pro Arg Thr Asp Gln Met Glu Val Asp Ser Gly Pro Gly Lys Arg 755 760 765 Pro His Lys Ser Gly Phe Thr Asp Lys Glu Arg Glu Asp His Arg Arg 770 775 780 Arg Lys Ala Leu Glu Asn Lys Lys Lys Gln Leu Ser Ala Gly Gly Lys 785 790 795 800 Ile Leu Ser Lys Glu Glu Glu Glu Glu Leu Arg Arg Leu Thr Asp Glu 805 810 815 Asp Glu Glu Arg Lys Arg Arg Val Ala Gly Pro Arg Val Gly Asp Val 820 825 830 Asn Pro Ser Arg Gly Gly Pro Arg Gly Ala Pro Gly Gly Gly Phe Val 835 840 845 Pro Gln Met Ala Gly Val Pro Glu Ser Pro Phe Ser Arg Thr Gly Glu 850 855 860 Gly Leu Asp Ile Arg Gly Thr Gln Gly Phe Pro Trp Val Ser Pro Ser 865 870 875 880 Pro Pro Gln Gln Arg Leu Pro Leu Leu Glu Cys Thr Pro Gln Ser Gln 885 890 895 Ser Glu Ser Lys Lys Asn Arg Arg Gly Gly Arg Glu Asp Ile Leu Glu 900 905 910 Lys Trp Ile Thr Thr Arg Arg Lys Ala Glu Glu Leu Glu Lys Asp Leu 915 920 925 Arg Lys Ala Arg Lys Thr Ile Lys Lys Leu Glu Asp Glu Asn Pro Trp 930 935 940 Leu Gly Asn Ile Ile Gly Ile Ile Arg Lys Gly Lys Asp Gly Glu Gly 945 950 955 960 Ala Pro Pro Ala Lys Arg Pro Arg Thr Asp Gln Met Glu Ile Asp Ser 965 970 975 Gly Thr Gly Lys Arg Pro His Lys Ser Gly Phe Thr Asp Lys Glu Arg 980 985 990 Glu Asp His Arg Arg Arg Lys Ala Leu Glu Asn Lys Lys Lys Gln Leu 995 1000 1005 Ser Ser Gly Gly Lys Asn Leu Ser Arg Glu Glu Glu Glu Glu Leu 1010 1015 1020 Gly Arg Leu Thr Val Glu Asp Glu Glu Arg Arg Arg Arg Val Ala 1025 1030 1035 Gly Pro Arg Thr Gly Asp Val Asn Leu Ser Gly Gly Gly Pro Arg 1040 1045 1050 Gly Ala Pro Gly Gly Gly Phe Val Pro Arg Met Glu Gly Val Pro 1055 1060 1065 Glu Ser Pro Phe Thr Arg Thr Gly Glu Gly Leu Asp Ile Arg Gly 1070 1075 1080 Asn Gln Gly Phe Pro Trp Val Arg Pro Ser Pro Pro Gln Gln Arg 1085 1090 1095 Leu Pro Leu Leu Glu Cys Thr Pro Gln 1100 1105 <210> 33 <211> 1199 <212> PRT <213> Artificial Sequence <220> <223> SVF-9 polypeptide sequence <220> <221> RBD <222> (1)..(255) <220> <221> P2A <222> (256)..(277) <220> <221> HDAg_genotype_1A <222> (278)..(491) <220> <221> P2A <222> (492)..(513) <220> <221> HDAg_genotype_1B <222> (514)..(727) <220> <221> P2A <222> (728)..(749) <220> <221> HDAg_genotype_2A <222> (750)..(963) <220> <221> P2A <222> (964)..(985) <220> <221> HDAg_genotype_2B <222> (986)..(1199) <400> 33 Met Ala Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp 1 5 10 15 Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe 20 25 30 Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro 35 40 45 Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe 50 55 60 Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn 65 70 75 80 Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn 85 90 95 Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys 100 105 110 Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile 115 120 125 Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile 130 135 140 Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile 145 150 155 160 Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn 165 170 175 Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg 180 185 190 Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly 195 200 205 Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln 210 215 220 Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser 225 230 235 240 Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Gly 245 250 255 Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu 260 265 270 Glu Asn Pro Gly Pro Met Ser Arg Ser Glu Ser Lys Lys Asn Arg Gly 275 280 285 Gly Arg Glu Glu Ile Leu Glu Gln Trp Val Gly Ala Arg Lys Lys Leu 290 295 300 Glu Glu Leu Glu Arg Asp Leu Arg Lys Ile Lys Lys Lys Ile Lys Lys 305 310 315 320 Leu Glu Glu Glu Asn Pro Trp Leu Gly Asn Ile Lys Gly Ile Leu Gly 325 330 335 Lys Lys Asp Arg Glu Gly Glu Gly Ala Pro Pro Ala Lys Arg Ala Arg 340 345 350 Ala Asp Gln Met Glu Val Asp Ser Gly Pro Arg Lys Arg Pro Phe Arg 355 360 365 Gly Glu Phe Thr Asp Lys Glu Arg Arg Asp His Arg Arg Arg Lys Ala 370 375 380 Leu Glu Asn Lys Arg Lys Gln Leu Ser Ser Gly Gly Lys Ser Leu Ser 385 390 395 400 Lys Glu Glu Glu Glu Glu Leu Arg Lys Leu Thr Glu Glu Asp Glu Arg 405 410 415 Arg Glu Arg Arg Val Ala Gly Pro Arg Val Gly Gly Val Asn Pro Leu 420 425 430 Glu Gly Gly Thr Arg Gly Ala Pro Gly Gly Gly Phe Val Pro Ser Met 435 440 445 Gln Gly Val Pro Glu Ser Pro Phe Ala Arg Thr Gly Glu Gly Leu Asp 450 455 460 Val Arg Gly Asn Gln Gly Phe Pro Trp Asp Ile Leu Phe Pro Ala Asp 465 470 475 480 Pro Pro Phe Ser Pro Gln Ser Cys Arg Pro Gln Gly Ser Gly Ala Thr 485 490 495 Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly 500 505 510 Pro Met Ser Arg Ser Glu Ser Lys Lys Asn Arg Gly Gly Arg Glu Glu 515 520 525 Val Leu Glu Gln Trp Val Asn Gly Arg Lys Lys Leu Glu Glu Leu Glu 530 535 540 Arg Glu Leu Arg Arg Ala Arg Lys Lys Ile Lys Lys Leu Glu Asp Asp 545 550 555 560 Asn Pro Trp Leu Gly Asn Val Lys Gly Ile Leu Gly Lys Lys Asp Lys 565 570 575 Asp Gly Glu Gly Ala Pro Pro Ala Lys Arg Ala Arg Thr Asp Gln Met 580 585 590 Glu Ile Asp Ser Gly Pro Arg Lys Arg Pro Leu Arg Gly Gly Phe Thr 595 600 605 Asp Arg Glu Arg Gln Asp His Arg Arg Arg Lys Ala Leu Lys Asn Lys 610 615 620 Lys Lys Gln Leu Ser Ala Gly Gly Lys Ser Leu Ser Lys Glu Glu Glu 625 630 635 640 Glu Glu Leu Lys Arg Leu Thr Arg Glu Asp Glu Glu Arg Lys Lys Glu 645 650 655 Glu His Gly Pro Ser Arg Leu Gly Val Asn Pro Ser Glu Gly Gly Pro 660 665 670 Arg Gly Ala Pro Gly Gly Gly Phe Val Pro Ser Met Gln Gly Ile Pro 675 680 685 Glu Ser Arg Phe Thr Arg Thr Gly Glu Gly Leu Asp Val Arg Gly Ser 690 695 700 Arg Gly Phe Pro Gln Asp Ile Leu Phe Pro Ser Asp Pro Pro Phe Ser 705 710 715 720 Pro Gln Ser Cys Arg Pro Gln Gly Ser Gly Ala Thr Asn Phe Ser Leu 725 730 735 Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Met Ser Gln 740 745 750 Ser Glu Thr Arg Arg Gly Arg Arg Gly Thr Arg Glu Glu Thr Leu Glu 755 760 765 Lys Trp Ile Thr Ala Arg Lys Lys Ala Glu Glu Leu Glu Lys Asp Leu 770 775 780 Arg Lys Thr Arg Lys Thr Ile Lys Lys Leu Glu Glu Glu Asn Pro Trp 785 790 795 800 Leu Gly Asn Ile Val Gly Ile Ile Arg Lys Gly Lys Asp Gly Glu Gly 805 810 815 Ala Pro Pro Ala Lys Arg Pro Arg Thr Asp Gln Met Glu Val Asp Ser 820 825 830 Gly Pro Gly Lys Arg Pro His Lys Ser Gly Phe Thr Asp Lys Glu Arg 835 840 845 Glu Asp His Arg Arg Arg Lys Ala Leu Glu Asn Lys Lys Lys Gln Leu 850 855 860 Ser Ala Gly Gly Lys Ile Leu Ser Lys Glu Glu Glu Glu Glu Leu Arg 865 870 875 880 Arg Leu Thr Asp Glu Asp Glu Glu Arg Lys Arg Arg Val Ala Gly Pro 885 890 895 Arg Val Gly Asp Val Asn Pro Ser Arg Gly Gly Pro Arg Gly Ala Pro 900 905 910 Gly Gly Gly Phe Val Pro Gln Met Ala Gly Val Pro Glu Ser Pro Phe 915 920 925 Ser Arg Thr Gly Glu Gly Leu Asp Ile Arg Gly Thr Gln Gly Phe Pro 930 935 940 Trp Val Ser Pro Ser Pro Pro Gln Gln Arg Leu Pro Leu Leu Glu Cys 945 950 955 960 Thr Pro Gln Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala 965 970 975 Gly Asp Val Glu Glu Asn Pro Gly Pro Met Ser Gln Ser Glu Ser Lys 980 985 990 Lys Asn Arg Arg Gly Gly Arg Glu Asp Ile Leu Glu Lys Trp Ile Thr 995 1000 1005 Thr Arg Arg Lys Ala Glu Glu Leu Glu Lys Asp Leu Arg Lys Ala 1010 1015 1020 Arg Lys Thr Ile Lys Lys Leu Glu Asp Glu Asn Pro Trp Leu Gly 1025 1030 1035 Asn Ile Ile Gly Ile Ile Arg Lys Gly Lys Asp Gly Glu Gly Ala 1040 1045 1050 Pro Pro Ala Lys Arg Pro Arg Thr Asp Gln Met Glu Ile Asp Ser 1055 1060 1065 Gly Thr Gly Lys Arg Pro His Lys Ser Gly Phe Thr Asp Lys Glu 1070 1075 1080 Arg Glu Asp His Arg Arg Arg Lys Ala Leu Glu Asn Lys Lys Lys 1085 1090 1095 Gln Leu Ser Ser Gly Gly Lys Asn Leu Ser Arg Glu Glu Glu Glu 1100 1105 1110 Glu Leu Gly Arg Leu Thr Val Glu Asp Glu Glu Arg Arg Arg Arg 1115 1120 1125 Val Ala Gly Pro Arg Thr Gly Asp Val Asn Leu Ser Gly Gly Gly 1130 1135 1140 Pro Arg Gly Ala Pro Gly Gly Gly Phe Val Pro Arg Met Glu Gly 1145 1150 1155 Val Pro Glu Ser Pro Phe Thr Arg Thr Gly Glu Gly Leu Asp Ile 1160 1165 1170 Arg Gly Asn Gln Gly Phe Pro Trp Val Arg Pro Ser Pro Pro Gln 1175 1180 1185 Gln Arg Leu Pro Leu Leu Glu Cys Thr Pro Gln 1190 1195 <210> 34 <211> 255 <212> PRT <213> Artificial Sequence <220> <223> SVF-10 polypeptide sequence <220> <221> RBD <222> (1)..(255) <400> 34 Met Ala Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp 1 5 10 15 Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe 20 25 30 Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro 35 40 45 Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe 50 55 60 Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn 65 70 75 80 Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn 85 90 95 Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys 100 105 110 Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile 115 120 125 Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile 130 135 140 Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile 145 150 155 160 Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn 165 170 175 Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg 180 185 190 Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly 195 200 205 Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln 210 215 220 Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser 225 230 235 240 Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys 245 250 255 <210> 35 <211> 222 <212> PRT <213> Artificial Sequence <220> <223> SVF-11 polypeptide sequence <220> <221> M <222> (1)..(222) <400> 35 Met Ala Asp Ser Asn Gly Thr Ile Thr Val Glu Glu Leu Lys Lys Leu 1 5 10 15 Leu Glu Gln Trp Asn Leu Val Ile Gly Phe Leu Phe Leu Thr Trp Ile 20 25 30 Cys Leu Leu Gln Phe Ala Tyr Ala Asn Arg Asn Arg Phe Leu Tyr Ile 35 40 45 Ile Lys Leu Ile Phe Leu Trp Leu Leu Trp Pro Val Thr Leu Ala Cys 50 55 60 Phe Val Leu Ala Ala Val Tyr Arg Ile Asn Trp Ile Thr Gly Gly Ile 65 70 75 80 Ala Ile Ala Met Ala Cys Leu Val Gly Leu Met Trp Leu Ser Tyr Phe 85 90 95 Ile Ala Ser Phe Arg Leu Phe Ala Arg Thr Arg Ser Met Trp Ser Phe 100 105 110 Asn Pro Glu Thr Asn Ile Leu Leu Asn Val Pro Leu His Gly Thr Ile 115 120 125 Leu Thr Arg Pro Leu Leu Glu Ser Glu Leu Val Ile Gly Ala Val Ile 130 135 140 Leu Arg Gly His Leu Arg Ile Ala Gly His His Leu Gly Arg Cys Asp 145 150 155 160 Ile Lys Asp Leu Pro Lys Glu Ile Thr Val Ala Thr Ser Arg Thr Leu 165 170 175 Ser Tyr Tyr Lys Leu Gly Ala Ser Gln Arg Val Ala Gly Asp Ser Gly 180 185 190 Phe Ala Ala Tyr Ser Arg Tyr Arg Ile Gly Asn Tyr Lys Leu Asn Thr 195 200 205 Asp His Ser Ser Ser Ser Asp Asn Ile Ala Leu Leu Val Gln 210 215 220 <210> 36 <211> 420 <212> PRT <213> Artificial Sequence <220> <223> SVF-12 polypeptide sequence <220> <221> NP <222> (1)..(420) <400> 36 Met Ala Ser Asp Asn Gly Pro Gln Asn Gln Arg Asn Ala Pro Arg Ile 1 5 10 15 Thr Phe Gly Gly Pro Ser Asp Ser Thr Gly Ser Asn Gln Asn Gly Glu 20 25 30 Arg Ser Gly Ala Arg Ser Lys Gln Arg Arg Pro Gln Gly Leu Pro Asn 35 40 45 Asn Thr Ala Ser Trp Phe Thr Ala Leu Thr Gln His Gly Lys Glu Asp 50 55 60 Leu Lys Phe Pro Arg Gly Gln Gly Val Pro Ile Asn Thr Asn Ser Ser 65 70 75 80 Pro Asp Asp Gln Ile Gly Tyr Tyr Arg Arg Ala Thr Arg Arg Ile Arg 85 90 95 Gly Gly Asp Gly Lys Met Lys Asp Leu Ser Pro Arg Trp Tyr Phe Tyr 100 105 110 Tyr Leu Gly Thr Gly Pro Glu Ala Gly Leu Pro Tyr Gly Ala Asn Lys 115 120 125 Asp Gly Ile Ile Trp Val Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys 130 135 140 Asp His Ile Gly Thr Arg Asn Pro Ala Asn Asn Ala Ala Ile Val Leu 145 150 155 160 Gln Leu Pro Gln Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala Glu Gly 165 170 175 Ser Arg Gly Gly Ser Gln Ala Ser Ser Arg Ser Ser Ser Arg Ser Arg 180 185 190 Asn Ser Ser Arg Asn Ser Thr Pro Gly Ser Ser Arg Gly Thr Ser Pro 195 200 205 Ala Arg Met Ala Gly Asn Gly Gly Asp Ala Ala Leu Ala Leu Leu Leu 210 215 220 Leu Asp Arg Leu Asn Gln Leu Glu Ser Lys Met Ser Gly Lys Gly Gln 225 230 235 240 Gln Gln Gln Gly Gln Thr Val Thr Lys Lys Ser Ala Ala Glu Ala Ser 245 250 255 Lys Lys Pro Arg Gln Lys Arg Thr Ala Thr Lys Ala Tyr Asn Val Thr 260 265 270 Gln Ala Phe Gly Arg Arg Gly Pro Glu Gln Thr Gln Gly Asn Phe Gly 275 280 285 Asp Gln Glu Leu Ile Arg Gln Gly Thr Asp Tyr Lys His Trp Pro Gln 290 295 300 Ile Ala Gln Phe Ala Pro Ser Ala Ser Ala Phe Phe Gly Met Ser Arg 305 310 315 320 Ile Gly Met Glu Val Thr Pro Ser Gly Thr Trp Leu Thr Tyr Thr Gly 325 330 335 Ala Ile Lys Leu Asp Asp Lys Asp Pro Asn Phe Lys Asp Gln Val Ile 340 345 350 Leu Leu Asn Lys His Ile Asp Ala Tyr Lys Thr Phe Pro Pro Thr Glu 355 360 365 Pro Lys Lys Asp Lys Lys Lys Lys Ala Asp Glu Thr Gln Ala Leu Pro 370 375 380 Gln Arg Gln Lys Lys Gln Gln Thr Val Thr Leu Leu Pro Ala Ala Asp 385 390 395 400 Leu Asp Asp Phe Ser Lys Gln Leu Gln Gln Ser Met Ser Ser Ala Asp 405 410 415 Ser Thr Gln Ala 420 <210> 37 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> P2A autocatalytic peptide cleavage site DNA sequence <400> 37 ggaagcggag ctactaactt cagcctgctg aagcaggctg gagacgtgga ggagaaccct 60 ggacct 66 <210> 38 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> P2A autocatalytic peptide cleavage site polypeptide sequence <400> 38 Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val 1 5 10 15 Glu Glu Asn Pro Gly Pro 20 <210> 39 <211> 3335 <212> DNA <213> Artificial Sequence <220> <223> OC2.2 codon optimized DNA sequence <220> <221> BamH1_restriction_site <222> (1)..(6) <220> <221> Kozak <222> (7)..(15) <220> <221> RBDv2 <222> (12)..(1331) <220> <221> P2A <222> (1332)..(1397) <220> <221> M <222> (1398)..(2063) <220> <221> NP <222> (2064)..(3320) <220> <221> XbaI_restriction_site <222> (3330)..(3335) <400> 39 ggatccgcac catggcccga gtccagccta ctgagtctat tgtccgcttt cctaacatca 60 ctaatctgtg cccttttggc gaggtcttca acgctacacg gtttgcttcc gtgtacgcct 120 ggaatcggaa gagaatctct aactgcgtgg ccgactacag tgtgctgtat aacagcgcct 180 ccttctctac ctttaagtgc tacggcgtgt cccccaccaa actgaatgac ctgtgcttca 240 caaacgtgta tgccgactct tttgtgatcc ggggggatga ggtgagacag attgccccag 300 gacagactgg caagatcgct gactacaatt ataaactgcc cgacgatttc accggctgcg 360 tgatcgcctg gaacagcaac aatctggatt ccaaagtggg cgggaactac aattatctgt 420 accggctgtt cagaaagtcc aatctgaaac cctttgagag ggacatcagt actgaaatct 480 accaggccgg gtcaacccct tgcaatgggg tggagggatt caactgttac tttccactgc 540 agagttatgg atttcagccc accaacggag tgggctacca gccttatcgc gtggtggtgc 600 tgtctttcga actgctgcac gctccagcta cagtgtgcgg acccaagaaa tcaactaacc 660 tggtgaagaa caagcgggtg cagcctactg agagcatcgt gagatttcct aacattacca 720 atctgtgccc attcggcgaa gtgtttaatg ctacaagatt cgccagcgtg tacgcttgga 780 ataggaagcg catctcaaat tgcgtggctg actacagcgt gctgtataac agtgcttcat 840 tcagcacttt taagtgctac ggagtgagtc caactaaact gaatgacctg tgctttacca 900 acgtgtatgc tgactcattt gtgattaggg gcgatgaggt gcgccagatc gctcctggcc 960 agacagggaa gattgctgac tataattaca aactgccaga cgatttcact ggatgcgtga 1020 ttgcctggaa ctctaacaat ctggatagta aagtgggagg caactataat tacctgtata 1080 ggctgttccg caagtctaat ctgaaaccat ttgagcggga catcagcacc gagatctacc 1140 aggccggctc caccccctgc aatggagtgg agggcttcaa ctgctatttt ccactgcaga 1200 gctatgggtt tcagcccaca aacggggtgg gataccagcc ttatagagtg gtggtgctgt 1260 ccttcgaact gctgcatgcc cctgctacag tgtgcggccc aaagaaatct accaacctgg 1320 tcaagaacaa gggaagcgga gctactaact tcagcctgct gaagcaggct ggagacgtgg 1380 aggagaaccc tggacctatg gccgattcca acggaactat taccgtggag gaactgaaga 1440 aactgctgga gcagtggaac ctggtcatcg gcttcctgtt tctgacctgg atttgtctgc 1500 tgcagttcgc ctacgctaac cggaacagat ttctgtacat cattaagctg atcttcctgt 1560 ggctgctgtg gcccgtgact ctggcctgct tcgtgctggc cgccgtgtac aggatcaact 1620 ggattaccgg gggaatcgcc attgctatgg cctgtctggt gggcctgatg tggctgtcat 1680 acttcatcgc cagcttccgc ctgtttgcta ggacacgcag catgtggtcc ttcaaccctg 1740 agactaatat cctgctgaac gtgccactgc acggcaccat tctgacacgg cccctgctgg 1800 agtccgaact ggtcatcggg gccgtgattc tgaggggaca tctgcgcatc gctgggcacc 1860 atctgggaag atgcgacatc aaggatctgc ctaaagaaat tactgtggcc acctcaagga 1920 cactgagcta ctataagctg ggagctagcc agagggtggc tggggacagc ggatttgctg 1980 cttactcccg gtatagaatt ggcaattaca aactgaacac agaccacagc tcctctagtg 2040 ataatatcgc cctgctggtg caggctagcg acaacgggcc ccagaaccag cggaatgccc 2100 ctagaatcac cttcggcggg ccatccgatt ctacaggcag caaccagaat ggagagaggt 2160 ccggagctcg ctctaagcag agacggcccc agggcctgcc aaacaatacc gcctcctggt 2220 ttactgctct gacccagcat gggaaggaag atctgaaatt ccccagggga cagggcgtgc 2280 ctatcaacac caattcaagc ccagacgatc agattgggta ctataggagg gctacaagga 2340 gaatccgggg aggcgacgga aagatgaaag atctgagccc cagatggtac ttttactatc 2400 tgggaacagg accagaggct ggactgcctt atggcgctaa caaggacgga atcatttggg 2460 tggccactga aggcgctctg aataccccta aagatcacat tggaacccgc aacccagcca 2520 acaatgccgc tatcgtgctg cagctgccac agggcaccac actgcccaag ggcttctacg 2580 ctgaggggag taggggagga tcacaggctt cctctcgcag ttcaagcagg tcccgcaatt 2640 cctctcggaa ctctacacca gggagttcac ggggaactag cccagctaga atggctggaa 2700 atggagggga cgccgctctg gccctgctgc tgctggatag actgaaccag ctggagtcta 2760 agatgagtgg caaagggcag cagcagcagg gacagacagt gactaagaaa tccgccgctg 2820 aagcctctaa gaaaccccgg cagaagagaa ccgctacaaa agcctacaat gtgacccagg 2880 cttttggcag gcgcggacct gagcagacac agggaaactt cggcgaccag gaactgatta 2940 ggcagggcac cgattataag cactggcccc agatcgctca gttcgcccct agtgcttcag 3000 ccttctttgg aatgtctcgc attggcatgg aggtgacacc tagtggcact tggctgactt 3060 acaccggggc catcaagctg gacgataaag acccaaactt caaggatcag gtcatcctgc 3120 tgaacaagca tattgacgcc tataaaacct tcccccctac agagcccaag aaagacaaga 3180 aaaagaaagc cgatgaaacc caggctctgc cccagaggca gaagaaacag cagacagtga 3240 ctctgctgcc tgccgctgat ctggacgatt tcagtaaaca gctgcagcag agtatgagta 3300 gtgccgacag tacccaggct taataatagt ctaga 3335 <210> 40 <211> 3386 <212> DNA <213> Artificial Sequence <220> <223> OC2.3 codon optimized DNA sequence <220> <221> BamHI_restriction_site <222> (1)..(6) <220> <221> Kozak <222> (7)..(15) <220> <221> IgE-leader <222> (12)..(65) <220> <221> RBDv2 <222> (69)..(1382) <220> <221> P2A <222> (1383)..(1448) <220> <221> M <222> (1449)..(2114) <220> <221> NP <222> (2115)..(3371) <220> <221> XbaI_restriction_site <222> (3381)..(3386) <400> 40 ggatccgcac catggactgg acctggattc tgttcctggt ggccgccgcc acacgggtgc 60 acagcgcccg agtccagcct actgagtcta ttgtccgctt tcctaacatc actaatctgt 120 gcccttttgg cgaggtcttc aacgctacac ggtttgcttc cgtgtacgcc tggaatcgga 180 agagaatctc taactgcgtg gccgactaca gtgtgctgta taacagcgcc tccttctcta 240 cctttaagtg ctacggcgtg tcccccacca aactgaatga cctgtgcttc acaaacgtgt 300 atgccgactc ttttgtgatc cggggggatg aggtgagaca gattgcccca ggacagactg 360 gcaagatcgc tgactacaat tataaactgc ccgacgattt caccggctgc gtgatcgcct 420 ggaacagcaa caatctggat tccaaagtgg gcgggaacta caattatctg taccggctgt 480 tcagaaagtc caatctgaaa ccctttgaga gggacatcag tactgaaatc taccaggccg 540 ggtcaacccc ttgcaatggg gtggagggat tcaactgtta ctttccactg cagagttatg 600 gatttcagcc caccaacgga gtgggctacc agccttatcg cgtggtggtg ctgtctttcg 660 aactgctgca cgctccagct acagtgtgcg gacccaagaa atcaactaac ctggtgaaga 720 acaagcgggt gcagcctact gagagcatcg tgagatttcc taacattacc aatctgtgcc 780 cattcggcga agtgtttaat gctacaagat tcgccagcgt gtacgcttgg aataggaagc 840 gcatctcaaa ttgcgtggct gactacagcg tgctgtataa cagtgcttca ttcagcactt 900 ttaagtgcta cggagtgagt ccaactaaac tgaatgacct gtgctttacc aacgtgtatg 960 ctgactcatt tgtgattagg ggcgatgagg tgcgccagat cgctcctggc cagacaggga 1020 agattgctga ctataattac aaactgccag acgatttcac tggatgcgtg attgcctgga 1080 actctaacaa tctggatagt aaagtgggag gcaactataa ttacctgtat aggctgttcc 1140 gcaagtctaa tctgaaacca tttgagcggg acatcagcac cgagatctac caggccggct 1200 ccaccccctg caatggagtg gagggcttca actgctattt tccactgcag agctatgggt 1260 ttcagcccac aaacggggtg ggataccagc cttatagagt ggtggtgctg tccttcgaac 1320 tgctgcatgc ccctgctaca gtgtgcggcc caaagaaatc taccaacctg gtcaagaaca 1380 agggaagcgg agctactaac ttcagcctgc tgaagcaggc tggagacgtg gaggagaacc 1440 ctggacctat ggccgattcc aacggaacta ttaccgtgga ggaactgaag aaactgctgg 1500 agcagtggaa cctggtcatc ggcttcctgt ttctgacctg gatttgtctg ctgcagttcg 1560 cctacgctaa ccggaacaga tttctgtaca tcattaagct gatcttcctg tggctgctgt 1620 ggcccgtgac tctggcctgc ttcgtgctgg ccgccgtgta caggatcaac tggattaccg 1680 ggggaatcgc cattgctatg gcctgtctgg tgggcctgat gtggctgtca tacttcatcg 1740 ccagcttccg cctgtttgct aggacacgca gcatgtggtc cttcaaccct gagactaata 1800 tcctgctgaa cgtgccactg cacggcacca ttctgacacg gcccctgctg gagtccgaac 1860 tggtcatcgg ggccgtgatt ctgaggggac atctgcgcat cgctgggcac catctgggaa 1920 gatgcgacat caaggatctg cctaaagaaa ttactgtggc cacctcaagg acactgagct 1980 actataagct gggagctagc cagagggtgg ctggggacag cggatttgct gcttactccc 2040 ggtatagaat tggcaattac aaactgaaca cagaccacag ctcctctagt gataatatcg 2100 ccctgctggt gcaggctagc gacaacgggc cccagaacca gcggaatgcc cctagaatca 2160 ccttcggcgg gccatccgat tctacaggca gcaaccagaa tggagagagg tccggagctc 2220 gctctaagca gagacggccc cagggcctgc caaacaatac cgcctcctgg tttactgctc 2280 tgacccagca tgggaaggaa gatctgaaat tccccagggg acagggcgtg cctatcaaca 2340 ccaattcaag cccagacgat cagattgggt actataggag ggctacaagg agaatccggg 2400 gaggcgacgg aaagatgaaa gatctgagcc ccagatggta cttttactat ctgggaacag 2460 gaccagaggc tggactgcct tatggcgcta acaaggacgg aatcatttgg gtggccactg 2520 aaggcgctct gaatacccct aaagatcaca ttggaacccg caacccagcc aacaatgccg 2580 ctatcgtgct gcagctgcca cagggcacca cactgcccaa gggcttctac gctgagggga 2640 gtaggggagg atcacaggct tcctctcgca gttcaagcag gtcccgcaat tcctctcgga 2700 actctacacc agggagttca cggggaacta gcccagctag aatggctgga aatggagggg 2760 acgccgctct ggccctgctg ctgctggata gactgaacca gctggagtct aagatgagtg 2820 gcaaagggca gcagcagcag ggacagacag tgactaagaa atccgccgct gaagcctcta 2880 agaaaccccg gcagaagaga accgctacaa aagcctacaa tgtgacccag gcttttggca 2940 ggcgcggacc tgagcagaca cagggaaact tcggcgacca ggaactgatt aggcagggca 3000 ccgattataa gcactggccc cagatcgctc agttcgcccc tagtgcttca gccttctttg 3060 gaatgtctcg cattggcatg gaggtgacac ctagtggcac ttggctgact tacaccgggg 3120 ccatcaagct ggacgataaa gacccaaact tcaaggatca ggtcatcctg ctgaacaagc 3180 atattgacgc ctataaaacc ttccccccta cagagcccaa gaaagacaag aaaaagaaag 3240 ccgatgaaac ccaggctctg ccccagaggc agaagaaaca gcagacagtg actctgctgc 3300 ctgccgctga tctggacgat ttcagtaaac agctgcagca gagtatgagt agtgccgaca 3360 gtacccaggc ttaataatag tctaga 3386 <210> 41 <211> 1103 <212> PRT <213> Artificial Sequence <220> <223> OC2.2 polypeptide sequence <220> <221> RBDv2 <222> (1)..(440) <220> <221> P2A <222> (441)..(462) <220> <221> M <222> (463)..(684) <220> <221> NP <222> (685)..(1103) <400> 41 Met Ala Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile 1 5 10 15 Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala 20 25 30 Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp 35 40 45 Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr 50 55 60 Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr 65 70 75 80 Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro 85 90 95 Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp 100 105 110 Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys 115 120 125 Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn 130 135 140 Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly 145 150 155 160 Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu 165 170 175 Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr 180 185 190 Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val 195 200 205 Cys Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Arg Val Gln 210 215 220 Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro 225 230 235 240 Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp 245 250 255 Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr 260 265 270 Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr 275 280 285 Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val 290 295 300 Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys 305 310 315 320 Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val 325 330 335 Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr 340 345 350 Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu 355 360 365 Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn 370 375 380 Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe 385 390 395 400 Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu 405 410 415 Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys 420 425 430 Ser Thr Asn Leu Val Lys Asn Lys Gly Ser Gly Ala Thr Asn Phe Ser 435 440 445 Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Met Ala 450 455 460 Asp Ser Asn Gly Thr Ile Thr Val Glu Glu Leu Lys Lys Leu Leu Glu 465 470 475 480 Gln Trp Asn Leu Val Ile Gly Phe Leu Phe Leu Thr Trp Ile Cys Leu 485 490 495 Leu Gln Phe Ala Tyr Ala Asn Arg Asn Arg Phe Leu Tyr Ile Ile Lys 500 505 510 Leu Ile Phe Leu Trp Leu Leu Trp Pro Val Thr Leu Ala Cys Phe Val 515 520 525 Leu Ala Ala Val Tyr Arg Ile Asn Trp Ile Thr Gly Gly Ile Ala Ile 530 535 540 Ala Met Ala Cys Leu Val Gly Leu Met Trp Leu Ser Tyr Phe Ile Ala 545 550 555 560 Ser Phe Arg Leu Phe Ala Arg Thr Arg Ser Met Trp Ser Phe Asn Pro 565 570 575 Glu Thr Asn Ile Leu Leu Asn Val Pro Leu His Gly Thr Ile Leu Thr 580 585 590 Arg Pro Leu Leu Glu Ser Glu Leu Val Ile Gly Ala Val Ile Leu Arg 595 600 605 Gly His Leu Arg Ile Ala Gly His His Leu Gly Arg Cys Asp Ile Lys 610 615 620 Asp Leu Pro Lys Glu Ile Thr Val Ala Thr Ser Arg Thr Leu Ser Tyr 625 630 635 640 Tyr Lys Leu Gly Ala Ser Gln Arg Val Ala Gly Asp Ser Gly Phe Ala 645 650 655 Ala Tyr Ser Arg Tyr Arg Ile Gly Asn Tyr Lys Leu Asn Thr Asp His 660 665 670 Ser Ser Ser Ser Asp Asn Ile Ala Leu Leu Val Gln Ala Ser Asp Asn 675 680 685 Gly Pro Gln Asn Gln Arg Asn Ala Pro Arg Ile Thr Phe Gly Gly Pro 690 695 700 Ser Asp Ser Thr Gly Ser Asn Gln Asn Gly Glu Arg Ser Gly Ala Arg 705 710 715 720 Ser Lys Gln Arg Arg Pro Gln Gly Leu Pro Asn Asn Thr Ala Ser Trp 725 730 735 Phe Thr Ala Leu Thr Gln His Gly Lys Glu Asp Leu Lys Phe Pro Arg 740 745 750 Gly Gln Gly Val Pro Ile Asn Thr Asn Ser Ser Pro Asp Asp Gln Ile 755 760 765 Gly Tyr Tyr Arg Arg Ala Thr Arg Arg Ile Arg Gly Gly Asp Gly Lys 770 775 780 Met Lys Asp Leu Ser Pro Arg Trp Tyr Phe Tyr Tyr Leu Gly Thr Gly 785 790 795 800 Pro Glu Ala Gly Leu Pro Tyr Gly Ala Asn Lys Asp Gly Ile Ile Trp 805 810 815 Val Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys Asp His Ile Gly Thr 820 825 830 Arg Asn Pro Ala Asn Asn Ala Ala Ile Val Leu Gln Leu Pro Gln Gly 835 840 845 Thr Thr Leu Pro Lys Gly Phe Tyr Ala Glu Gly Ser Arg Gly Gly Ser 850 855 860 Gln Ala Ser Ser Arg Ser Ser Ser Arg Ser Arg Asn Ser Ser Arg Asn 865 870 875 880 Ser Thr Pro Gly Ser Ser Arg Gly Thr Ser Pro Ala Arg Met Ala Gly 885 890 895 Asn Gly Gly Asp Ala Ala Leu Ala Leu Leu Leu Leu Asp Arg Leu Asn 900 905 910 Gln Leu Glu Ser Lys Met Ser Gly Lys Gly Gln Gln Gln Gln Gly Gln 915 920 925 Thr Val Thr Lys Lys Ser Ala Ala Glu Ala Ser Lys Lys Pro Arg Gln 930 935 940 Lys Arg Thr Ala Thr Lys Ala Tyr Asn Val Thr Gln Ala Phe Gly Arg 945 950 955 960 Arg Gly Pro Glu Gln Thr Gln Gly Asn Phe Gly Asp Gln Glu Leu Ile 965 970 975 Arg Gln Gly Thr Asp Tyr Lys His Trp Pro Gln Ile Ala Gln Phe Ala 980 985 990 Pro Ser Ala Ser Ala Phe Phe Gly Met Ser Arg Ile Gly Met Glu Val 995 1000 1005 Thr Pro Ser Gly Thr Trp Leu Thr Tyr Thr Gly Ala Ile Lys Leu 1010 1015 1020 Asp Asp Lys Asp Pro Asn Phe Lys Asp Gln Val Ile Leu Leu Asn 1025 1030 1035 Lys His Ile Asp Ala Tyr Lys Thr Phe Pro Pro Thr Glu Pro Lys 1040 1045 1050 Lys Asp Lys Lys Lys Lys Ala Asp Glu Thr Gln Ala Leu Pro Gln 1055 1060 1065 Arg Gln Lys Lys Gln Gln Thr Val Thr Leu Leu Pro Ala Ala Asp 1070 1075 1080 Leu Asp Asp Phe Ser Lys Gln Leu Gln Gln Ser Met Ser Ser Ala 1085 1090 1095 Asp Ser Thr Gln Ala 1100 <210> 42 <211> 1120 <212> PRT <213> Artificial Sequence <220> <223> OC2.3 polypeptide sequence <220> <221> IgE-leader <222> (1)..(18) <220> <221> RBDv2 <222> (20)..(457) <220> <221> P2A <222> (458)..(479) <220> <221> M <222> (480)..(701) <220> <221> NP <222> (702)..(1120) <400> 42 Met Asp Trp Thr Trp Ile Leu Phe Leu Val Ala Ala Ala Thr Arg Val 1 5 10 15 His Ser Ala Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn 20 25 30 Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe 35 40 45 Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala 50 55 60 Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys 65 70 75 80 Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val 85 90 95 Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala 100 105 110 Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp 115 120 125 Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser 130 135 140 Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser 145 150 155 160 Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala 165 170 175 Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro 180 185 190 Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro 195 200 205 Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr 210 215 220 Val Cys Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Arg Val 225 230 235 240 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 245 250 255 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 260 265 270 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 275 280 285 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 290 295 300 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 305 310 315 320 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 325 330 335 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 340 345 350 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 355 360 365 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 370 375 380 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 385 390 395 400 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 405 410 415 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 420 425 430 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 435 440 445 Lys Ser Thr Asn Leu Val Lys Asn Lys Gly Ser Gly Ala Thr Asn Phe 450 455 460 Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Met 465 470 475 480 Ala Asp Ser Asn Gly Thr Ile Thr Val Glu Glu Leu Lys Lys Leu Leu 485 490 495 Glu Gln Trp Asn Leu Val Ile Gly Phe Leu Phe Leu Thr Trp Ile Cys 500 505 510 Leu Leu Gln Phe Ala Tyr Ala Asn Arg Asn Arg Phe Leu Tyr Ile Ile 515 520 525 Lys Leu Ile Phe Leu Trp Leu Leu Trp Pro Val Thr Leu Ala Cys Phe 530 535 540 Val Leu Ala Ala Val Tyr Arg Ile Asn Trp Ile Thr Gly Gly Ile Ala 545 550 555 560 Ile Ala Met Ala Cys Leu Val Gly Leu Met Trp Leu Ser Tyr Phe Ile 565 570 575 Ala Ser Phe Arg Leu Phe Ala Arg Thr Arg Ser Met Trp Ser Phe Asn 580 585 590 Pro Glu Thr Asn Ile Leu Leu Asn Val Pro Leu His Gly Thr Ile Leu 595 600 605 Thr Arg Pro Leu Leu Glu Ser Glu Leu Val Ile Gly Ala Val Ile Leu 610 615 620 Arg Gly His Leu Arg Ile Ala Gly His His Leu Gly Arg Cys Asp Ile 625 630 635 640 Lys Asp Leu Pro Lys Glu Ile Thr Val Ala Thr Ser Arg Thr Leu Ser 645 650 655 Tyr Tyr Lys Leu Gly Ala Ser Gln Arg Val Ala Gly Asp Ser Gly Phe 660 665 670 Ala Ala Tyr Ser Arg Tyr Arg Ile Gly Asn Tyr Lys Leu Asn Thr Asp 675 680 685 His Ser Ser Ser Ser Asp Asn Ile Ala Leu Leu Val Gln Ala Ser Asp 690 695 700 Asn Gly Pro Gln Asn Gln Arg Asn Ala Pro Arg Ile Thr Phe Gly Gly 705 710 715 720 Pro Ser Asp Ser Thr Gly Ser Asn Gln Asn Gly Glu Arg Ser Gly Ala 725 730 735 Arg Ser Lys Gln Arg Arg Pro Gln Gly Leu Pro Asn Asn Thr Ala Ser 740 745 750 Trp Phe Thr Ala Leu Thr Gln His Gly Lys Glu Asp Leu Lys Phe Pro 755 760 765 Arg Gly Gln Gly Val Pro Ile Asn Thr Asn Ser Ser Pro Asp Asp Gln 770 775 780 Ile Gly Tyr Tyr Arg Arg Ala Thr Arg Arg Ile Arg Gly Gly Asp Gly 785 790 795 800 Lys Met Lys Asp Leu Ser Pro Arg Trp Tyr Phe Tyr Tyr Leu Gly Thr 805 810 815 Gly Pro Glu Ala Gly Leu Pro Tyr Gly Ala Asn Lys Asp Gly Ile Ile 820 825 830 Trp Val Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys Asp His Ile Gly 835 840 845 Thr Arg Asn Pro Ala Asn Asn Ala Ala Ile Val Leu Gln Leu Pro Gln 850 855 860 Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala Glu Gly Ser Arg Gly Gly 865 870 875 880 Ser Gln Ala Ser Ser Arg Ser Ser Ser Arg Ser Arg Asn Ser Ser Arg 885 890 895 Asn Ser Thr Pro Gly Ser Ser Arg Gly Thr Ser Pro Ala Arg Met Ala 900 905 910 Gly Asn Gly Gly Asp Ala Ala Leu Ala Leu Leu Leu Leu Asp Arg Leu 915 920 925 Asn Gln Leu Glu Ser Lys Met Ser Gly Lys Gly Gln Gln Gln Gln Gly 930 935 940 Gln Thr Val Thr Lys Lys Ser Ala Ala Glu Ala Ser Lys Lys Pro Arg 945 950 955 960 Gln Lys Arg Thr Ala Thr Lys Ala Tyr Asn Val Thr Gln Ala Phe Gly 965 970 975 Arg Arg Gly Pro Glu Gln Thr Gln Gly Asn Phe Gly Asp Gln Glu Leu 980 985 990 Ile Arg Gln Gly Thr Asp Tyr Lys His Trp Pro Gln Ile Ala Gln Phe 995 1000 1005 Ala Pro Ser Ala Ser Ala Phe Phe Gly Met Ser Arg Ile Gly Met 1010 1015 1020 Glu Val Thr Pro Ser Gly Thr Trp Leu Thr Tyr Thr Gly Ala Ile 1025 1030 1035 Lys Leu Asp Asp Lys Asp Pro Asn Phe Lys Asp Gln Val Ile Leu 1040 1045 1050 Leu Asn Lys His Ile Asp Ala Tyr Lys Thr Phe Pro Pro Thr Glu 1055 1060 1065 Pro Lys Lys Asp Lys Lys Lys Lys Ala Asp Glu Thr Gln Ala Leu 1070 1075 1080 Pro Gln Arg Gln Lys Lys Gln Gln Thr Val Thr Leu Leu Pro Ala 1085 1090 1095 Ala Asp Leu Asp Asp Phe Ser Lys Gln Leu Gln Gln Ser Met Ser 1100 1105 1110 Ser Ala Asp Ser Thr Gln Ala 1115 1120 <210> 43 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> IgE leader sequence <400> 43 atggactgga cctggattct gttcctggtg gccgccgcca cacgggtgca cagc 54 <210> 44 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> IgE leader polypeptide sequence <400> 44 Met Asp Trp Thr Trp Ile Leu Phe Leu Val Ala Ala Ala Thr Arg Val 1 5 10 15 His Ser <210> 45 <211> 1314 <212> DNA <213> Artificial Sequence <220> <223> RBDv2 (tandem repeat single chain dimer) codon optimized DNA sequence <400> 45 cgagtccagc ctactgagtc tattgtccgc tttcctaaca tcactaatct gtgccctttt 60 ggcgaggtct tcaacgctac acggtttgct tccgtgtacg cctggaatcg gaagagaatc 120 tctaactgcg tggccgacta cagtgtgctg tataacagcg cctccttctc tacctttaag 180 tgctacggcg tgtcccccac caaactgaat gacctgtgct tcacaaacgt gtatgccgac 240 tcttttgtga tccgggggga tgaggtgaga cagattgccc caggacagac tggcaagatc 300 gctgactaca attataaact gcccgacgat ttcaccggct gcgtgatcgc ctggaacagc 360 aacaatctgg attccaaagt gggcgggaac tacaattatc tgtaccggct gttcagaaag 420 tccaatctga aaccctttga gagggacatc agtactgaaa tctaccaggc cgggtcaacc 480 ccttgcaatg gggtggaggg attcaactgt tactttccac tgcagagtta tggatttcag 540 cccaccaacg gagtgggcta ccagccttat cgcgtggtgg tgctgtcttt cgaactgctg 600 cacgctccag ctacagtgtg cggacccaag aaatcaacta acctggtgaa gaacaagcgg 660 gtgcagccta ctgagagcat cgtgagattt cctaacatta ccaatctgtg cccattcggc 720 gaagtgttta atgctacaag attcgccagc gtgtacgctt ggaataggaa gcgcatctca 780 aattgcgtgg ctgactacag cgtgctgtat aacagtgctt cattcagcac ttttaagtgc 840 tacggagtga gtccaactaa actgaatgac ctgtgcttta ccaacgtgta tgctgactca 900 tttgtgatta ggggcgatga ggtgcgccag atcgctcctg gccagacagg gaagattgct 960 gactataatt acaaactgcc agacgatttc actggatgcg tgattgcctg gaactctaac 1020 aatctggata gtaaagtggg aggcaactat aattacctgt ataggctgtt ccgcaagtct 1080 aatctgaaac catttgagcg ggacatcagc accgagatct accaggccgg ctccaccccc 1140 tgcaatggag tggagggctt caactgctat tttccactgc agagctatgg gtttcagccc 1200 acaaacgggg tgggatacca gccttataga gtggtggtgc tgtccttcga actgctgcat 1260 gcccctgcta cagtgtgcgg cccaaagaaa tctaccaacc tggtcaagaa caag 1314 <210> 46 <211> 438 <212> PRT <213> Artificial Sequence <220> <223> RBDv2 (tandem repeat single chain dimer) polypeptide sequence <400> 46 Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn 1 5 10 15 Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val 20 25 30 Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser 35 40 45 Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val 50 55 60 Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp 65 70 75 80 Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln 85 90 95 Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr 100 105 110 Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly 115 120 125 Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys 130 135 140 Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr 145 150 155 160 Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser 165 170 175 Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val 180 185 190 Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly 195 200 205 Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Arg Val Gln Pro Thr 210 215 220 Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly 225 230 235 240 Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg 245 250 255 Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser 260 265 270 Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu 275 280 285 Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg 290 295 300 Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala 305 310 315 320 Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala 325 330 335 Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr 340 345 350 Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp 355 360 365 Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val 370 375 380 Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro 385 390 395 400 Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe 405 410 415 Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr 420 425 430 Asn Leu Val Lys Asn Lys 435 <210> 47 <211> 1314 <212> DNA <213> Artificial Sequence <220> <223> RBDv2 (E501Y) codon optimized DNA sequence <400> 47 cgagtccagc ctactgagtc tattgtccgc tttcctaaca tcactaatct gtgccctttt 60 ggcgaggtct tcaacgctac acggtttgct tccgtgtacg cctggaatcg gaagagaatc 120 tctaactgcg tggccgacta cagtgtgctg tataacagcg cctccttctc tacctttaag 180 tgctacggcg tgtcccccac caaactgaat gacctgtgct tcacaaacgt gtatgccgac 240 tcttttgtga tccgggggga tgaggtgaga cagattgccc caggacagac tggcaagatc 300 gctgactaca attataaact gcccgacgat ttcaccggct gcgtgatcgc ctggaacagc 360 aacaatctgg attccaaagt gggcgggaac tacaattatc tgtaccggct gttcagaaag 420 tccaatctga aaccctttga gagggacatc agtactgaaa tctaccaggc cgggtcaacc 480 ccttgcaatg gggtggaggg attcaactgt tactttccac tgcagagtta tggatttcag 540 cccacctatg gagtgggcta ccagccttat cgcgtggtgg tgctgtcttt cgaactgctg 600 cacgctccag ctacagtgtg cggacccaag aaatcaacta acctggtgaa gaacaagcgg 660 gtgcagccta ctgagagcat cgtgagattt cctaacatta ccaatctgtg cccattcggc 720 gaagtgttta atgctacaag attcgccagc gtgtacgctt ggaataggaa gcgcatctca 780 aattgcgtgg ctgactacag cgtgctgtat aacagtgctt cattcagcac ttttaagtgc 840 tacggagtga gtccaactaa actgaatgac ctgtgcttta ccaacgtgta tgctgactca 900 tttgtgatta ggggcgatga ggtgcgccag atcgctcctg gccagacagg gaagattgct 960 gactataatt acaaactgcc agacgatttc actggatgcg tgattgcctg gaactctaac 1020 aatctggata gtaaagtggg aggcaactat aattacctgt ataggctgtt ccgcaagtct 1080 aatctgaaac catttgagcg ggacatcagc accgagatct accaggccgg ctccaccccc 1140 tgcaatggag tggagggctt caactgctat tttccactgc agagctatgg gtttcagccc 1200 acatatgggg tgggatacca gccttataga gtggtggtgc tgtccttcga actgctgcat 1260 gcccctgcta cagtgtgcgg cccaaagaaa tctaccaacc tggtcaagaa caag 1314 <210> 48 <211> 1314 <212> DNA <213> Artificial Sequence <220> <223> RBDv2 (N439K, N501Y) codon optimized DNA sequence <400> 48 cgagtccagc ctactgagtc tattgtccgc tttcctaaca tcactaatct gtgccctttt 60 ggcgaggtct tcaacgctac acggtttgct tccgtgtacg cctggaatcg gaagagaatc 120 tctaactgcg tggccgacta cagtgtgctg tataacagcg cctccttctc tacctttaag 180 tgctacggcg tgtcccccac caaactgaat gacctgtgct tcacaaacgt gtatgccgac 240 tcttttgtga tccgggggga tgaggtgaga cagattgccc caggacagac tggcaagatc 300 gctgactaca attataaact gcccgacgat ttcaccggct gcgtgatcgc ctggaacagc 360 aacaagctgg attccaaagt gggcgggaac tacaattatc tgtaccggct gttcagaaag 420 tccaatctga aaccctttga gagggacatc agtactgaaa tctaccaggc cgggtcaacc 480 ccttgcaatg gggtggaggg attcaactgt tactttccac tgcagagtta tggatttcag 540 cccacctatg gagtgggcta ccagccttat cgcgtggtgg tgctgtcttt cgaactgctg 600 cacgctccag ctacagtgtg cggacccaag aaatcaacta acctggtgaa gaacaagcgg 660 gtgcagccta ctgagagcat cgtgagattt cctaacatta ccaatctgtg cccattcggc 720 gaagtgttta atgctacaag attcgccagc gtgtacgctt ggaataggaa gcgcatctca 780 aattgcgtgg ctgactacag cgtgctgtat aacagtgctt cattcagcac ttttaagtgc 840 tacggagtga gtccaactaa actgaatgac ctgtgcttta ccaacgtgta tgctgactca 900 tttgtgatta ggggcgatga ggtgcgccag atcgctcctg gccagacagg gaagattgct 960 gactataatt acaaactgcc agacgatttc actggatgcg tgattgcctg gaactctaac 1020 aagctggata gtaaagtggg aggcaactat aattacctgt ataggctgtt ccgcaagtct 1080 aatctgaaac catttgagcg ggacatcagc accgagatct accaggccgg ctccaccccc 1140 tgcaatggag tggagggctt caactgctat tttccactgc agagctatgg gtttcagccc 1200 acatatgggg tgggatacca gccttataga gtggtggtgc tgtccttcga actgctgcat 1260 gcccctgcta cagtgtgcgg cccaaagaaa tctaccaacc tggtcaagaa caag 1314 <210> 49 <211> 1314 <212> DNA <213> Artificial Sequence <220> <223> RBDv2 (K417N, E484K, N501Y) codon optimized DNA sequence <400> 49 cgagtccagc ctactgagtc tattgtccgc tttcctaaca tcactaatct gtgccctttt 60 ggcgaggtct tcaacgctac acggtttgct tccgtgtacg cctggaatcg gaagagaatc 120 tctaactgcg tggccgacta cagtgtgctg tataacagcg cctccttctc tacctttaag 180 tgctacggcg tgtcccccac caaactgaat gacctgtgct tcacaaacgt gtatgccgac 240 tcttttgtga tccgggggga tgaggtgaga cagattgccc caggacagac tggcaacatc 300 gctgactaca attataaact gcccgacgat ttcaccggct gcgtgatcgc ctggaacagc 360 aacaacctgg attccaaagt gggcgggaac tacaattatc tgtaccggct gttcagaaag 420 tccaatctga aaccctttga gagggacatc agtactgaaa tctaccaggc cgggtcaacc 480 ccttgcaatg gggtgaaggg attcaactgt tactttccac tgcagagtta tggatttcag 540 cccacctatg gagtgggcta ccagccttat cgcgtggtgg tgctgtcttt cgaactgctg 600 cacgctccag ctacagtgtg cggacccaag aaatcaacta acctggtgaa gaacaagcgg 660 gtgcagccta ctgagagcat cgtgagattt cctaacatta ccaatctgtg cccattcggc 720 gaagtgttta atgctacaag attcgccagc gtgtacgctt ggaataggaa gcgcatctca 780 aattgcgtgg ctgactacag cgtgctgtat aacagtgctt cattcagcac ttttaagtgc 840 tacggagtga gtccaactaa actgaatgac ctgtgcttta ccaacgtgta tgctgactca 900 tttgtgatta ggggcgatga ggtgcgccag atcgctcctg gccagacagg gaacattgct 960 gactataatt acaaactgcc agacgatttc actggatgcg tgattgcctg gaactctaac 1020 aacctggata gtaaagtggg aggcaactat aattacctgt ataggctgtt ccgcaagtct 1080 aatctgaaac catttgagcg ggacatcagc accgagatct accaggccgg ctccaccccc 1140 tgcaatggag tgaagggctt caactgctat tttccactgc agagctatgg gtttcagccc 1200 acatatgggg tgggatacca gccttataga gtggtggtgc tgtccttcga actgctgcat 1260 gcccctgcta cagtgtgcgg cccaaagaaa tctaccaacc tggtcaagaa caag 1314 <210> 50 <211> 1314 <212> DNA <213> Artificial Sequence <220> <223> RBDv2 (K417N, N439K, E484K, N501Y codon optimized DNA sequence <400> 50 cgagtccagc ctactgagtc tattgtccgc tttcctaaca tcactaatct gtgccctttt 60 ggcgaggtct tcaacgctac acggtttgct tccgtgtacg cctggaatcg gaagagaatc 120 tctaactgcg tggccgacta cagtgtgctg tataacagcg cctccttctc tacctttaag 180 tgctacggcg tgtcccccac caaactgaat gacctgtgct tcacaaacgt gtatgccgac 240 tcttttgtga tccgggggga tgaggtgaga cagattgccc caggacagac tggcaacatc 300 gctgactaca attataaact gcccgacgat ttcaccggct gcgtgatcgc ctggaacagc 360 aacaagctgg attccaaagt gggcgggaac tacaattatc tgtaccggct gttcagaaag 420 tccaatctga aaccctttga gagggacatc agtactgaaa tctaccaggc cgggtcaacc 480 ccttgcaatg gggtgaaggg attcaactgt tactttccac tgcagagtta tggatttcag 540 cccacctatg gagtgggcta ccagccttat cgcgtggtgg tgctgtcttt cgaactgctg 600 cacgctccag ctacagtgtg cggacccaag aaatcaacta acctggtgaa gaacaagcgg 660 gtgcagccta ctgagagcat cgtgagattt cctaacatta ccaatctgtg cccattcggc 720 gaagtgttta atgctacaag attcgccagc gtgtacgctt ggaataggaa gcgcatctca 780 aattgcgtgg ctgactacag cgtgctgtat aacagtgctt cattcagcac ttttaagtgc 840 tacggagtga gtccaactaa actgaatgac ctgtgcttta ccaacgtgta tgctgactca 900 tttgtgatta ggggcgatga ggtgcgccag atcgctcctg gccagacagg gaacattgct 960 gactataatt acaaactgcc agacgatttc actggatgcg tgattgcctg gaactctaac 1020 aagctggata gtaaagtggg aggcaactat aattacctgt ataggctgtt ccgcaagtct 1080 aatctgaaac catttgagcg ggacatcagc accgagatct accaggccgg ctccaccccc 1140 tgcaatggag tgaagggctt caactgctat tttccactgc agagctatgg gtttcagccc 1200 acatatgggg tgggatacca gccttataga gtggtggtgc tgtccttcga actgctgcat 1260 gcccctgcta cagtgtgcgg cccaaagaaa tctaccaacc tggtcaagaa caag 1314 <210> 51 <211> 3816 <212> DNA <213> Artificial Sequence <220> <223> SARS-CoV-2 S protein (K986P, V987P) codon optimized DNA sequence <400> 51 ttcgtctttc tggtgctgct gcctctggtc agctcccagt gcgtgaacct gaccacaagg 60 acacagctgc cccctgccta tacaaattcc ttcactcggg gcgtgtacta tcctgacaaa 120 gtgtttagat ctagtgtgct gcactccaca caggatctgt ttctgccatt cttttctaac 180 gtgacttggt tccacgccat ccacgtgagc gggaccaatg gaacaaagag gttcgacaat 240 ccagtgctgc cctttaacga tggcgtgtac ttcgccagta ccgagaagtc aaacatcatt 300 cgcgggtgga tctttggaac taccctggac agcaaaaccc agtccctgct gatcgtgaac 360 aatgccacaa acgtggtcat caaggtgtgc gaattccagt tttgtaatga tcccttcctg 420 ggcgtgtact atcataagaa caacaagtct tggatggaga gtgaatttcg cgtgtattca 480 agcgccaaca attgcacatt tgagtacgtg agccagcctt tcctgatgga cctggaaggc 540 aagcagggga atttcaaaaa cctgcgggag ttcgtgttta agaatattga tggctacttc 600 aagatctact ctaaacacac ccccatcaac ctggtgcggg acctgcctca ggggttcagt 660 gccctggagc ctctggtgga tctgccaatc ggaattaaca tcacccggtt tcagacactg 720 ctggccctgc atagatccta cctgacacca ggcgactcct ctagtggctg gactgctggg 780 gccgctgcct actatgtggg gtatctgcag ccccggacct tcctgctgaa atacaacgag 840 aatggaacta ttaccgacgc tgtggattgc gccctggacc ccctgtccga aactaagtgt 900 accctgaaat cttttaccgt ggagaaggga atctatcaga caagcaattt cagggtgcag 960 ccaactgaat ccattgtgcg ctttccaaat atcaccaacc tgtgcccctt tggcgaggtg 1020 ttcaacgcta caagattcgc cagcgtgtac gcttggaata ggaagcgcat cagcaactgc 1080 gtggccgact attccgtgct gtacaactcc gcttctttca gtacctttaa gtgctatgga 1140 gtgtcaccca ccaaactgaa tgacctgtgc tttacaaacg tgtacgccga ttccttcgtg 1200 attaggggcg acgaggtgcg ccagatcgct cctggacaga ccggcaagat tgctgactac 1260 aattataaac tgccagacga tttcacaggc tgcgtgatcg cctggaactc taacaatctg 1320 gatagtaaag tgggcgggaa ctacaattat ctgtacaggc tgtttcgcaa gagcaatctg 1380 aaacccttcg agcgggacat tagtactgaa atctaccagg ccggctcaac cccttgcaat 1440 ggggtggagg gcttcaactg ttatttccca ctgcagtcct acgggttcca gcccacaaac 1500 ggagtgggct atcagcctta cagagtggtg gtgctgtctt ttgaactgct gcacgctcca 1560 gctacagtgt gcggacccaa gaaaagtact aatctggtga agaacaaatg cgtgaacttc 1620 aacttcaacg gactgacagg gactggagtg ctgaccgaga gcaacaagaa attcctgcca 1680 tttcagcagt tcggaaggga catcgccgat acaactgacg ctgtgcgcga cccccagacc 1740 ctggaaattc tggatatcac accttgctca ttcggaggcg tgagcgtgat tacccccggc 1800 accaatacat ccaaccaggt ggccgtgctg tatcaggacg tgaattgtac agaggtgcca 1860 gtggctatcc acgccgatca gctgactccc acctggcggg tgtacagcac tggctccaac 1920 gtgtttcaga ccagagccgg atgcctgatt ggcgctgagc atgtgaacaa tagttatgaa 1980 tgcgacattc caatcggcgc cgggatctgt gcttcatacc agacacagac taactctccc 2040 cggagagcca ggagtgtggc ttcacagagc atcattgcct ataccatgtc actgggggcc 2100 gaaaatagcg tggcttactc taacaatagt attgctatcc ccacaaactt cactatttct 2160 gtgaccacag agatcctgcc cgtgagcatg accaagacat ctgtggactg caccatgtat 2220 atttgtggcg attcaacaga atgcagcaac ctgctgctgc agtacggaag cttttgtaca 2280 cagctgaatc gcgccctgac tggcatcgct gtggagcagg acaaaaacac tcaggaagtg 2340 ttcgcccagg tgaagcagat ctacaaaacc ccacccatca aggactttgg gggcttcaac 2400 ttcagccaga ttctgcctga tccatcaaag cccagcaaaa ggtcctttat cgaggacctg 2460 ctgttcaaca aggtgaccct ggctgatgcc ggcttcatca aacagtatgg ggattgcctg 2520 ggagacattg ctgcccgcga cctgatctgt gcccagaagt ttaatgggct gaccgtgctg 2580 cctccactgc tgacagatga aatgattgcc cagtacacat ctgctctgct ggccgggact 2640 atcaccagtg gatggacttt cggagccggc gctgccctgc agattccttt tgccatgcag 2700 atggcttata ggttcaacgg gatcggagtg acccagaatg tgctgtacga gaaccagaag 2760 ctgatcgcca atcagtttaa cagcgccatt ggcaaaatcc aggactccct gtcaagcact 2820 gcttctgccc tggggaaact gcaggatgtg gtgaatcaga acgctcaggc cctgaatacc 2880 ctggtgaagc agctgtcctc taacttcggg gccattagtt cagtgctgaa tgatatcctg 2940 tccaggctgg acccccctga ggctgaagtg cagattgacc ggctgatcac aggaagactg 3000 cagagcctgc agacctacgt gacacagcag ctgattaggg ctgccgaaat ccgcgcttcc 3060 gccaatctgg ctgccaccaa gatgtctgag tgcgtgctgg ggcagagtaa gcgcgtggac 3120 ttttgtggca aagggtatca cctgatgtcc ttcccccagt ctgcccctca cggagtggtg 3180 tttctgcatg tgacctacgt gcctgctcag gagaagaact tcactaccgc tccagccatc 3240 tgccacgatg gcaaagccca ttttccccgg gaaggcgtgt tcgtgtccaa cgggacccat 3300 tggtttgtga cacagagaaa tttctacgag cctcagatca ttacaactga caataccttc 3360 gtgagcggaa actgtgacgt ggtcatcggc atcgtgaaca ataccgtgta cgatcctctg 3420 cagccagagc tggacagctt taaggaggaa ctggataagt acttcaaaaa tcacacctcc 3480 cccgacgtgg atctgggcga cattagtggg atcaatgcct cagtggtgaa cattcagaag 3540 gagatcgaca gactgaacga agtggctaaa aatctgaacg agagcctgat tgatctgcag 3600 gagctgggca agtatgaaca gtacatcaaa tggccttggt atatttggct gggattcatc 3660 gccggcctga ttgctatcgt gatggtgact atcatgctgt gctgtatgac ctcttgctgt 3720 agttgcctga agggctgctg ttcatgtggg agctgctgta aattcgacga ggacgattcc 3780 gaaccagtgc tgaagggcgt gaaactgcac tacact 3816 <210> 52 <211> 438 <212> PRT <213> Artificial Sequence <220> <223> RBDv2 (E501Y) polypeptide sequence <400> 52 Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn 1 5 10 15 Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val 20 25 30 Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser 35 40 45 Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val 50 55 60 Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp 65 70 75 80 Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln 85 90 95 Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr 100 105 110 Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly 115 120 125 Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys 130 135 140 Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr 145 150 155 160 Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser 165 170 175 Tyr Gly Phe Gln Pro Thr Tyr Gly Val Gly Tyr Gln Pro Tyr Arg Val 180 185 190 Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly 195 200 205 Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Arg Val Gln Pro Thr 210 215 220 Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly 225 230 235 240 Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg 245 250 255 Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser 260 265 270 Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu 275 280 285 Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg 290 295 300 Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala 305 310 315 320 Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala 325 330 335 Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr 340 345 350 Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp 355 360 365 Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val 370 375 380 Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro 385 390 395 400 Thr Tyr Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe 405 410 415 Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr 420 425 430 Asn Leu Val Lys Asn Lys 435 <210> 53 <211> 438 <212> PRT <213> Artificial Sequence <220> <223> RBDv2 (N439K, N501Y) polypeptide sequence <400> 53 Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn 1 5 10 15 Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val 20 25 30 Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser 35 40 45 Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val 50 55 60 Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp 65 70 75 80 Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln 85 90 95 Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr 100 105 110 Gly Cys Val Ile Ala Trp Asn Ser Asn Lys Leu Asp Ser Lys Val Gly 115 120 125 Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys 130 135 140 Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr 145 150 155 160 Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser 165 170 175 Tyr Gly Phe Gln Pro Thr Tyr Gly Val Gly Tyr Gln Pro Tyr Arg Val 180 185 190 Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly 195 200 205 Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Arg Val Gln Pro Thr 210 215 220 Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly 225 230 235 240 Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg 245 250 255 Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser 260 265 270 Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu 275 280 285 Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg 290 295 300 Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala 305 310 315 320 Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala 325 330 335 Trp Asn Ser Asn Lys Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr 340 345 350 Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp 355 360 365 Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val 370 375 380 Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro 385 390 395 400 Thr Tyr Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe 405 410 415 Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr 420 425 430 Asn Leu Val Lys Asn Lys 435 <210> 54 <211> 438 <212> PRT <213> Artificial Sequence <220> <223> RBDv2 (K417N, E484K, N501Y) polypeptide sequence <400> 54 Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn 1 5 10 15 Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val 20 25 30 Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser 35 40 45 Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val 50 55 60 Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp 65 70 75 80 Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln 85 90 95 Thr Gly Asn Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr 100 105 110 Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly 115 120 125 Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys 130 135 140 Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr 145 150 155 160 Pro Cys Asn Gly Val Lys Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser 165 170 175 Tyr Gly Phe Gln Pro Thr Tyr Gly Val Gly Tyr Gln Pro Tyr Arg Val 180 185 190 Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly 195 200 205 Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Arg Val Gln Pro Thr 210 215 220 Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly 225 230 235 240 Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg 245 250 255 Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser 260 265 270 Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu 275 280 285 Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg 290 295 300 Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Asn Ile Ala 305 310 315 320 Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala 325 330 335 Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr 340 345 350 Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp 355 360 365 Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val 370 375 380 Lys Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro 385 390 395 400 Thr Tyr Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe 405 410 415 Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr 420 425 430 Asn Leu Val Lys Asn Lys 435 <210> 55 <211> 438 <212> PRT <213> Artificial Sequence <220> <223> RBDv2 (K417N, N439K, E484K, N501Y polypeptide sequence <400> 55 Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn 1 5 10 15 Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val 20 25 30 Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser 35 40 45 Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val 50 55 60 Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp 65 70 75 80 Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln 85 90 95 Thr Gly Asn Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr 100 105 110 Gly Cys Val Ile Ala Trp Asn Ser Asn Lys Leu Asp Ser Lys Val Gly 115 120 125 Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys 130 135 140 Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr 145 150 155 160 Pro Cys Asn Gly Val Lys Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser 165 170 175 Tyr Gly Phe Gln Pro Thr Tyr Gly Val Gly Tyr Gln Pro Tyr Arg Val 180 185 190 Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly 195 200 205 Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Arg Val Gln Pro Thr 210 215 220 Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly 225 230 235 240 Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg 245 250 255 Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser 260 265 270 Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu 275 280 285 Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg 290 295 300 Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Asn Ile Ala 305 310 315 320 Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala 325 330 335 Trp Asn Ser Asn Lys Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr 340 345 350 Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp 355 360 365 Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val 370 375 380 Lys Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro 385 390 395 400 Thr Tyr Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe 405 410 415 Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr 420 425 430 Asn Leu Val Lys Asn Lys 435 <210> 56 <211> 1272 <212> PRT <213> Artificial Sequence <220> <223> SARS-CoV-2 S protein (K986P, V987P) polypeptide sequence <400> 56 Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val Asn 1 5 10 15 Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe Thr 20 25 30 Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu His 35 40 45 Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp Phe 50 55 60 His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp Asn 65 70 75 80 Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu Lys 85 90 95 Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser Lys 100 105 110 Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile Lys 115 120 125 Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr Tyr 130 135 140 His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr Ser 145 150 155 160 Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu Met 165 170 175 Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe Val 180 185 190 Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr Pro 195 200 205 Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu Pro 210 215 220 Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr Leu 225 230 235 240 Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly 245 250 255 Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg 260 265 270 Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val 275 280 285 Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser 290 295 300 Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln 305 310 315 320 Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro 325 330 335 Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp 340 345 350 Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr 355 360 365 Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr 370 375 380 Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val 385 390 395 400 Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys 405 410 415 Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val 420 425 430 Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr 435 440 445 Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu 450 455 460 Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn 465 470 475 480 Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe 485 490 495 Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu 500 505 510 Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys 515 520 525 Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly 530 535 540 Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro 545 550 555 560 Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val Arg 565 570 575 Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly 580 585 590 Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val Ala 595 600 605 Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile His 610 615 620 Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn 625 630 635 640 Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn 645 650 655 Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser 660 665 670 Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala Ser 675 680 685 Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val 690 695 700 Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser 705 710 715 720 Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp 725 730 735 Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu 740 745 750 Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly 755 760 765 Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val 770 775 780 Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn 785 790 795 800 Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe 805 810 815 Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe 820 825 830 Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu 835 840 845 Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu 850 855 860 Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr 865 870 875 880 Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro 885 890 895 Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln 900 905 910 Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser 915 920 925 Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu 930 935 940 Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr 945 950 955 960 Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu 965 970 975 Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln Ile 980 985 990 Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr 995 1000 1005 Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu 1010 1015 1020 Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg 1025 1030 1035 Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln 1040 1045 1050 Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro 1055 1060 1065 Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp 1070 1075 1080 Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly 1085 1090 1095 Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile 1100 1105 1110 Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val 1115 1120 1125 Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu 1130 1135 1140 Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His 1145 1150 1155 Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala 1160 1165 1170 Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val 1175 1180 1185 Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly 1190 1195 1200 Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly 1205 1210 1215 Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met Leu 1220 1225 1230 Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser 1235 1240 1245 Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val 1250 1255 1260 Leu Lys Gly Val Lys Leu His Tyr Thr 1265 1270 <210> 57 <211> 3386 <212> DNA <213> Artificial Sequence <220> <223> OC2.3 (N501Y) codon optimized DNA sequence <220> <221> BamHI_restriction_site <222> (1)..(6) <220> <221> Kozak <222> (7)..(15) <220> <221> IgE-leader <222> (12)..(65) <220> <221> RBDv2-N501Y <222> (69)..(1382) <220> <221> P2A <222> (1383)..(1448) <220> <221> M <222> (1449)..(2114) <220> <221> NP <222> (2115)..(3371) <220> <221> XbaI_restriction_site <222> (3381)..(3386) <400> 57 ggatccgcac catggactgg acctggattc tgttcctggt ggccgccgcc acacgggtgc 60 acagcgcccg agtccagcct actgagtcta ttgtccgctt tcctaacatc actaatctgt 120 gcccttttgg cgaggtcttc aacgctacac ggtttgcttc cgtgtacgcc tggaatcgga 180 agagaatctc taactgcgtg gccgactaca gtgtgctgta taacagcgcc tccttctcta 240 cctttaagtg ctacggcgtg tcccccacca aactgaatga cctgtgcttc acaaacgtgt 300 atgccgactc ttttgtgatc cggggggatg aggtgagaca gattgcccca ggacagactg 360 gcaagatcgc tgactacaat tataaactgc ccgacgattt caccggctgc gtgatcgcct 420 ggaacagcaa caatctggat tccaaagtgg gcgggaacta caattatctg taccggctgt 480 tcagaaagtc caatctgaaa ccctttgaga gggacatcag tactgaaatc taccaggccg 540 ggtcaacccc ttgcaatggg gtggagggat tcaactgtta ctttccactg cagagttatg 600 gatttcagcc cacctatgga gtgggctacc agccttatcg cgtggtggtg ctgtctttcg 660 aactgctgca cgctccagct acagtgtgcg gacccaagaa atcaactaac ctggtgaaga 720 acaagcgggt gcagcctact gagagcatcg tgagatttcc taacattacc aatctgtgcc 780 cattcggcga agtgtttaat gctacaagat tcgccagcgt gtacgcttgg aataggaagc 840 gcatctcaaa ttgcgtggct gactacagcg tgctgtataa cagtgcttca ttcagcactt 900 ttaagtgcta cggagtgagt ccaactaaac tgaatgacct gtgctttacc aacgtgtatg 960 ctgactcatt tgtgattagg ggcgatgagg tgcgccagat cgctcctggc cagacaggga 1020 agattgctga ctataattac aaactgccag acgatttcac tggatgcgtg attgcctgga 1080 actctaacaa tctggatagt aaagtgggag gcaactataa ttacctgtat aggctgttcc 1140 gcaagtctaa tctgaaacca tttgagcggg acatcagcac cgagatctac caggccggct 1200 ccaccccctg caatggagtg gagggcttca actgctattt tccactgcag agctatgggt 1260 ttcagcccac atatggggtg ggataccagc cttatagagt ggtggtgctg tccttcgaac 1320 tgctgcatgc ccctgctaca gtgtgcggcc caaagaaatc taccaacctg gtcaagaaca 1380 agggaagcgg agctactaac ttcagcctgc tgaagcaggc tggagacgtg gaggagaacc 1440 ctggacctat ggccgattcc aacggaacta ttaccgtgga ggaactgaag aaactgctgg 1500 agcagtggaa cctggtcatc ggcttcctgt ttctgacctg gatttgtctg ctgcagttcg 1560 cctacgctaa ccggaacaga tttctgtaca tcattaagct gatcttcctg tggctgctgt 1620 ggcccgtgac tctggcctgc ttcgtgctgg ccgccgtgta caggatcaac tggattaccg 1680 ggggaatcgc cattgctatg gcctgtctgg tgggcctgat gtggctgtca tacttcatcg 1740 ccagcttccg cctgtttgct aggacacgca gcatgtggtc cttcaaccct gagactaata 1800 tcctgctgaa cgtgccactg cacggcacca ttctgacacg gcccctgctg gagtccgaac 1860 tggtcatcgg ggccgtgatt ctgaggggac atctgcgcat cgctgggcac catctgggaa 1920 gatgcgacat caaggatctg cctaaagaaa ttactgtggc cacctcaagg acactgagct 1980 actataagct gggagctagc cagagggtgg ctggggacag cggatttgct gcttactccc 2040 ggtatagaat tggcaattac aaactgaaca cagaccacag ctcctctagt gataatatcg 2100 ccctgctggt gcaggctagc gacaacgggc cccagaacca gcggaatgcc cctagaatca 2160 ccttcggcgg gccatccgat tctacaggca gcaaccagaa tggagagagg tccggagctc 2220 gctctaagca gagacggccc cagggcctgc caaacaatac cgcctcctgg tttactgctc 2280 tgacccagca tgggaaggaa gatctgaaat tccccagggg acagggcgtg cctatcaaca 2340 ccaattcaag cccagacgat cagattgggt actataggag ggctacaagg agaatccggg 2400 gaggcgacgg aaagatgaaa gatctgagcc ccagatggta cttttactat ctgggaacag 2460 gaccagaggc tggactgcct tatggcgcta acaaggacgg aatcatttgg gtggccactg 2520 aaggcgctct gaatacccct aaagatcaca ttggaacccg caacccagcc aacaatgccg 2580 ctatcgtgct gcagctgcca cagggcacca cactgcccaa gggcttctac gctgagggga 2640 gtaggggagg atcacaggct tcctctcgca gttcaagcag gtcccgcaat tcctctcgga 2700 actctacacc agggagttca cggggaacta gcccagctag aatggctgga aatggagggg 2760 acgccgctct ggccctgctg ctgctggata gactgaacca gctggagtct aagatgagtg 2820 gcaaagggca gcagcagcag ggacagacag tgactaagaa atccgccgct gaagcctcta 2880 agaaaccccg gcagaagaga accgctacaa aagcctacaa tgtgacccag gcttttggca 2940 ggcgcggacc tgagcagaca cagggaaact tcggcgacca ggaactgatt aggcagggca 3000 ccgattataa gcactggccc cagatcgctc agttcgcccc tagtgcttca gccttctttg 3060 gaatgtctcg cattggcatg gaggtgacac ctagtggcac ttggctgact tacaccgggg 3120 ccatcaagct ggacgataaa gacccaaact tcaaggatca ggtcatcctg ctgaacaagc 3180 atattgacgc ctataaaacc ttccccccta cagagcccaa gaaagacaag aaaaagaaag 3240 ccgatgaaac ccaggctctg ccccagaggc agaagaaaca gcagacagtg actctgctgc 3300 ctgccgctga tctggacgat ttcagtaaac agctgcagca gagtatgagt agtgccgaca 3360 gtacccaggc ttaataatag tctaga 3386 <210> 58 <211> 3386 <212> DNA <213> Artificial Sequence <220> <223> OC2.3 (N439K, N501Y) codon optimized DNA sequence <220> <221> BamHI_restriction_site <222> (1)..(6) <220> <221> Kozak <222> (7)..(15) <220> <221> IgE-leader <222> (12)..(65) <220> <221> RBDv2-N439K,N501Y <222> (69)..(1382) <220> <221> P2A <222> (1383)..(1448) <220> <221> M <222> (1449)..(2114) <220> <221> NP <222> (2115)..(3371) <220> <221> XbaI_restriction_site <222> (3381)..(3386) <400> 58 ggatccgcac catggactgg acctggattc tgttcctggt ggccgccgcc acacgggtgc 60 acagcgcccg agtccagcct actgagtcta ttgtccgctt tcctaacatc actaatctgt 120 gcccttttgg cgaggtcttc aacgctacac ggtttgcttc cgtgtacgcc tggaatcgga 180 agagaatctc taactgcgtg gccgactaca gtgtgctgta taacagcgcc tccttctcta 240 cctttaagtg ctacggcgtg tcccccacca aactgaatga cctgtgcttc acaaacgtgt 300 atgccgactc ttttgtgatc cggggggatg aggtgagaca gattgcccca ggacagactg 360 gcaagatcgc tgactacaat tataaactgc ccgacgattt caccggctgc gtgatcgcct 420 ggaacagcaa caagctggat tccaaagtgg gcgggaacta caattatctg taccggctgt 480 tcagaaagtc caatctgaaa ccctttgaga gggacatcag tactgaaatc taccaggccg 540 ggtcaacccc ttgcaatggg gtggagggat tcaactgtta ctttccactg cagagttatg 600 gatttcagcc cacctatgga gtgggctacc agccttatcg cgtggtggtg ctgtctttcg 660 aactgctgca cgctccagct acagtgtgcg gacccaagaa atcaactaac ctggtgaaga 720 acaagcgggt gcagcctact gagagcatcg tgagatttcc taacattacc aatctgtgcc 780 cattcggcga agtgtttaat gctacaagat tcgccagcgt gtacgcttgg aataggaagc 840 gcatctcaaa ttgcgtggct gactacagcg tgctgtataa cagtgcttca ttcagcactt 900 ttaagtgcta cggagtgagt ccaactaaac tgaatgacct gtgctttacc aacgtgtatg 960 ctgactcatt tgtgattagg ggcgatgagg tgcgccagat cgctcctggc cagacaggga 1020 agattgctga ctataattac aaactgccag acgatttcac tggatgcgtg attgcctgga 1080 actctaacaa gctggatagt aaagtgggag gcaactataa ttacctgtat aggctgttcc 1140 gcaagtctaa tctgaaacca tttgagcggg acatcagcac cgagatctac caggccggct 1200 ccaccccctg caatggagtg gagggcttca actgctattt tccactgcag agctatgggt 1260 ttcagcccac atatggggtg ggataccagc cttatagagt ggtggtgctg tccttcgaac 1320 tgctgcatgc ccctgctaca gtgtgcggcc caaagaaatc taccaacctg gtcaagaaca 1380 agggaagcgg agctactaac ttcagcctgc tgaagcaggc tggagacgtg gaggagaacc 1440 ctggacctat ggccgattcc aacggaacta ttaccgtgga ggaactgaag aaactgctgg 1500 agcagtggaa cctggtcatc ggcttcctgt ttctgacctg gatttgtctg ctgcagttcg 1560 cctacgctaa ccggaacaga tttctgtaca tcattaagct gatcttcctg tggctgctgt 1620 ggcccgtgac tctggcctgc ttcgtgctgg ccgccgtgta caggatcaac tggattaccg 1680 ggggaatcgc cattgctatg gcctgtctgg tgggcctgat gtggctgtca tacttcatcg 1740 ccagcttccg cctgtttgct aggacacgca gcatgtggtc cttcaaccct gagactaata 1800 tcctgctgaa cgtgccactg cacggcacca ttctgacacg gcccctgctg gagtccgaac 1860 tggtcatcgg ggccgtgatt ctgaggggac atctgcgcat cgctgggcac catctgggaa 1920 gatgcgacat caaggatctg cctaaagaaa ttactgtggc cacctcaagg acactgagct 1980 actataagct gggagctagc cagagggtgg ctggggacag cggatttgct gcttactccc 2040 ggtatagaat tggcaattac aaactgaaca cagaccacag ctcctctagt gataatatcg 2100 ccctgctggt gcaggctagc gacaacgggc cccagaacca gcggaatgcc cctagaatca 2160 ccttcggcgg gccatccgat tctacaggca gcaaccagaa tggagagagg tccggagctc 2220 gctctaagca gagacggccc cagggcctgc caaacaatac cgcctcctgg tttactgctc 2280 tgacccagca tgggaaggaa gatctgaaat tccccagggg acagggcgtg cctatcaaca 2340 ccaattcaag cccagacgat cagattgggt actataggag ggctacaagg agaatccggg 2400 gaggcgacgg aaagatgaaa gatctgagcc ccagatggta cttttactat ctgggaacag 2460 gaccagaggc tggactgcct tatggcgcta acaaggacgg aatcatttgg gtggccactg 2520 aaggcgctct gaatacccct aaagatcaca ttggaacccg caacccagcc aacaatgccg 2580 ctatcgtgct gcagctgcca cagggcacca cactgcccaa gggcttctac gctgagggga 2640 gtaggggagg atcacaggct tcctctcgca gttcaagcag gtcccgcaat tcctctcgga 2700 actctacacc agggagttca cggggaacta gcccagctag aatggctgga aatggagggg 2760 acgccgctct ggccctgctg ctgctggata gactgaacca gctggagtct aagatgagtg 2820 gcaaagggca gcagcagcag ggacagacag tgactaagaa atccgccgct gaagcctcta 2880 agaaaccccg gcagaagaga accgctacaa aagcctacaa tgtgacccag gcttttggca 2940 ggcgcggacc tgagcagaca cagggaaact tcggcgacca ggaactgatt aggcagggca 3000 ccgattataa gcactggccc cagatcgctc agttcgcccc tagtgcttca gccttctttg 3060 gaatgtctcg cattggcatg gaggtgacac ctagtggcac ttggctgact tacaccgggg 3120 ccatcaagct ggacgataaa gacccaaact tcaaggatca ggtcatcctg ctgaacaagc 3180 atattgacgc ctataaaacc ttccccccta cagagcccaa gaaagacaag aaaaagaaag 3240 ccgatgaaac ccaggctctg ccccagaggc agaagaaaca gcagacagtg actctgctgc 3300 ctgccgctga tctggacgat ttcagtaaac agctgcagca gagtatgagt agtgccgaca 3360 gtacccaggc ttaataatag tctaga 3386 <210> 59 <211> 3386 <212> DNA <213> Artificial Sequence <220> <223> OC2.3 (K417N, E484K, N501Y) codon optimized DNA sequence <220> <221> BamHI_restriction_site <222> (1)..(6) <220> <221> Kozak <222> (7)..(15) <220> <221> IgE-leader <222> (12)..(65) <220> <221> RBDv2-K417N,E484K,N501Y <222> (69)..(1382) <220> <221> P2A <222> (1383)..(1448) <220> <221> M <222> (1449)..(2114) <220> <221> NP <222> (2115)..(3371) <220> <221> XbaI_restriction_site <222> (3381)..(3386) <400> 59 ggatccgcac catggactgg acctggattc tgttcctggt ggccgccgcc acacgggtgc 60 acagcgcccg agtccagcct actgagtcta ttgtccgctt tcctaacatc actaatctgt 120 gcccttttgg cgaggtcttc aacgctacac ggtttgcttc cgtgtacgcc tggaatcgga 180 agagaatctc taactgcgtg gccgactaca gtgtgctgta taacagcgcc tccttctcta 240 cctttaagtg ctacggcgtg tcccccacca aactgaatga cctgtgcttc acaaacgtgt 300 atgccgactc ttttgtgatc cggggggatg aggtgagaca gattgcccca ggacagactg 360 gcaacatcgc tgactacaat tataaactgc ccgacgattt caccggctgc gtgatcgcct 420 ggaacagcaa caacctggat tccaaagtgg gcgggaacta caattatctg taccggctgt 480 tcagaaagtc caatctgaaa ccctttgaga gggacatcag tactgaaatc taccaggccg 540 ggtcaacccc ttgcaatggg gtgaagggat tcaactgtta ctttccactg cagagttatg 600 gatttcagcc cacctatgga gtgggctacc agccttatcg cgtggtggtg ctgtctttcg 660 aactgctgca cgctccagct acagtgtgcg gacccaagaa atcaactaac ctggtgaaga 720 acaagcgggt gcagcctact gagagcatcg tgagatttcc taacattacc aatctgtgcc 780 cattcggcga agtgtttaat gctacaagat tcgccagcgt gtacgcttgg aataggaagc 840 gcatctcaaa ttgcgtggct gactacagcg tgctgtataa cagtgcttca ttcagcactt 900 ttaagtgcta cggagtgagt ccaactaaac tgaatgacct gtgctttacc aacgtgtatg 960 ctgactcatt tgtgattagg ggcgatgagg tgcgccagat cgctcctggc cagacaggga 1020 acattgctga ctataattac aaactgccag acgatttcac tggatgcgtg attgcctgga 1080 actctaacaa cctggatagt aaagtgggag gcaactataa ttacctgtat aggctgttcc 1140 gcaagtctaa tctgaaacca tttgagcggg acatcagcac cgagatctac caggccggct 1200 ccaccccctg caatggagtg aagggcttca actgctattt tccactgcag agctatgggt 1260 ttcagcccac atatggggtg ggataccagc cttatagagt ggtggtgctg tccttcgaac 1320 tgctgcatgc ccctgctaca gtgtgcggcc caaagaaatc taccaacctg gtcaagaaca 1380 agggaagcgg agctactaac ttcagcctgc tgaagcaggc tggagacgtg gaggagaacc 1440 ctggacctat ggccgattcc aacggaacta ttaccgtgga ggaactgaag aaactgctgg 1500 agcagtggaa cctggtcatc ggcttcctgt ttctgacctg gatttgtctg ctgcagttcg 1560 cctacgctaa ccggaacaga tttctgtaca tcattaagct gatcttcctg tggctgctgt 1620 ggcccgtgac tctggcctgc ttcgtgctgg ccgccgtgta caggatcaac tggattaccg 1680 ggggaatcgc cattgctatg gcctgtctgg tgggcctgat gtggctgtca tacttcatcg 1740 ccagcttccg cctgtttgct aggacacgca gcatgtggtc cttcaaccct gagactaata 1800 tcctgctgaa cgtgccactg cacggcacca ttctgacacg gcccctgctg gagtccgaac 1860 tggtcatcgg ggccgtgatt ctgaggggac atctgcgcat cgctgggcac catctgggaa 1920 gatgcgacat caaggatctg cctaaagaaa ttactgtggc cacctcaagg acactgagct 1980 actataagct gggagctagc cagagggtgg ctggggacag cggatttgct gcttactccc 2040 ggtatagaat tggcaattac aaactgaaca cagaccacag ctcctctagt gataatatcg 2100 ccctgctggt gcaggctagc gacaacgggc cccagaacca gcggaatgcc cctagaatca 2160 ccttcggcgg gccatccgat tctacaggca gcaaccagaa tggagagagg tccggagctc 2220 gctctaagca gagacggccc cagggcctgc caaacaatac cgcctcctgg tttactgctc 2280 tgacccagca tgggaaggaa gatctgaaat tccccagggg acagggcgtg cctatcaaca 2340 ccaattcaag cccagacgat cagattgggt actataggag ggctacaagg agaatccggg 2400 gaggcgacgg aaagatgaaa gatctgagcc ccagatggta cttttactat ctgggaacag 2460 gaccagaggc tggactgcct tatggcgcta acaaggacgg aatcatttgg gtggccactg 2520 aaggcgctct gaatacccct aaagatcaca ttggaacccg caacccagcc aacaatgccg 2580 ctatcgtgct gcagctgcca cagggcacca cactgcccaa gggcttctac gctgagggga 2640 gtaggggagg atcacaggct tcctctcgca gttcaagcag gtcccgcaat tcctctcgga 2700 actctacacc agggagttca cggggaacta gcccagctag aatggctgga aatggagggg 2760 acgccgctct ggccctgctg ctgctggata gactgaacca gctggagtct aagatgagtg 2820 gcaaagggca gcagcagcag ggacagacag tgactaagaa atccgccgct gaagcctcta 2880 agaaaccccg gcagaagaga accgctacaa aagcctacaa tgtgacccag gcttttggca 2940 ggcgcggacc tgagcagaca cagggaaact tcggcgacca ggaactgatt aggcagggca 3000 ccgattataa gcactggccc cagatcgctc agttcgcccc tagtgcttca gccttctttg 3060 gaatgtctcg cattggcatg gaggtgacac ctagtggcac ttggctgact tacaccgggg 3120 ccatcaagct ggacgataaa gacccaaact tcaaggatca ggtcatcctg ctgaacaagc 3180 atattgacgc ctataaaacc ttccccccta cagagcccaa gaaagacaag aaaaagaaag 3240 ccgatgaaac ccaggctctg ccccagaggc agaagaaaca gcagacagtg actctgctgc 3300 ctgccgctga tctggacgat ttcagtaaac agctgcagca gagtatgagt agtgccgaca 3360 gtacccaggc ttaataatag tctaga 3386 <210> 60 <211> 3386 <212> DNA <213> Artificial Sequence <220> <223> OC2.3 (K417N, N439K, E484K, N501Y) codon optimized DNA sequence <220> <221> BamHI_restriction_site <222> (1)..(6) <220> <221> Kozak <222> (7)..(15) <220> <221> IgE-leader <222> (12)..(65) <220> <221> RBDv2-K417N,N439K,E484K,N501Y <222> (69)..(1382) <220> <221> P2A <222> (1383)..(1448) <220> <221> M <222> (1449)..(2114) <220> <221> NP <222> (2115)..(3371) <220> <221> XbaI_restriction_site <222> (3381)..(3386) <400> 60 ggatccgcac catggactgg acctggattc tgttcctggt ggccgccgcc acacgggtgc 60 acagcgcccg agtccagcct actgagtcta ttgtccgctt tcctaacatc actaatctgt 120 gcccttttgg cgaggtcttc aacgctacac ggtttgcttc cgtgtacgcc tggaatcgga 180 agagaatctc taactgcgtg gccgactaca gtgtgctgta taacagcgcc tccttctcta 240 cctttaagtg ctacggcgtg tcccccacca aactgaatga cctgtgcttc acaaacgtgt 300 atgccgactc ttttgtgatc cggggggatg aggtgagaca gattgcccca ggacagactg 360 gcaacatcgc tgactacaat tataaactgc ccgacgattt caccggctgc gtgatcgcct 420 ggaacagcaa caagctggat tccaaagtgg gcgggaacta caattatctg taccggctgt 480 tcagaaagtc caatctgaaa ccctttgaga gggacatcag tactgaaatc taccaggccg 540 ggtcaacccc ttgcaatggg gtgaagggat tcaactgtta ctttccactg cagagttatg 600 gatttcagcc cacctatgga gtgggctacc agccttatcg cgtggtggtg ctgtctttcg 660 aactgctgca cgctccagct acagtgtgcg gacccaagaa atcaactaac ctggtgaaga 720 acaagcgggt gcagcctact gagagcatcg tgagatttcc taacattacc aatctgtgcc 780 cattcggcga agtgtttaat gctacaagat tcgccagcgt gtacgcttgg aataggaagc 840 gcatctcaaa ttgcgtggct gactacagcg tgctgtataa cagtgcttca ttcagcactt 900 ttaagtgcta cggagtgagt ccaactaaac tgaatgacct gtgctttacc aacgtgtatg 960 ctgactcatt tgtgattagg ggcgatgagg tgcgccagat cgctcctggc cagacaggga 1020 acattgctga ctataattac aaactgccag acgatttcac tggatgcgtg attgcctgga 1080 actctaacaa gctggatagt aaagtgggag gcaactataa ttacctgtat aggctgttcc 1140 gcaagtctaa tctgaaacca tttgagcggg acatcagcac cgagatctac caggccggct 1200 ccaccccctg caatggagtg aagggcttca actgctattt tccactgcag agctatgggt 1260 ttcagcccac atatggggtg ggataccagc cttatagagt ggtggtgctg tccttcgaac 1320 tgctgcatgc ccctgctaca gtgtgcggcc caaagaaatc taccaacctg gtcaagaaca 1380 agggaagcgg agctactaac ttcagcctgc tgaagcaggc tggagacgtg gaggagaacc 1440 ctggacctat ggccgattcc aacggaacta ttaccgtgga ggaactgaag aaactgctgg 1500 agcagtggaa cctggtcatc ggcttcctgt ttctgacctg gatttgtctg ctgcagttcg 1560 cctacgctaa ccggaacaga tttctgtaca tcattaagct gatcttcctg tggctgctgt 1620 ggcccgtgac tctggcctgc ttcgtgctgg ccgccgtgta caggatcaac tggattaccg 1680 ggggaatcgc cattgctatg gcctgtctgg tgggcctgat gtggctgtca tacttcatcg 1740 ccagcttccg cctgtttgct aggacacgca gcatgtggtc cttcaaccct gagactaata 1800 tcctgctgaa cgtgccactg cacggcacca ttctgacacg gcccctgctg gagtccgaac 1860 tggtcatcgg ggccgtgatt ctgaggggac atctgcgcat cgctgggcac catctgggaa 1920 gatgcgacat caaggatctg cctaaagaaa ttactgtggc cacctcaagg acactgagct 1980 actataagct gggagctagc cagagggtgg ctggggacag cggatttgct gcttactccc 2040 ggtatagaat tggcaattac aaactgaaca cagaccacag ctcctctagt gataatatcg 2100 ccctgctggt gcaggctagc gacaacgggc cccagaacca gcggaatgcc cctagaatca 2160 ccttcggcgg gccatccgat tctacaggca gcaaccagaa tggagagagg tccggagctc 2220 gctctaagca gagacggccc cagggcctgc caaacaatac cgcctcctgg tttactgctc 2280 tgacccagca tgggaaggaa gatctgaaat tccccagggg acagggcgtg cctatcaaca 2340 ccaattcaag cccagacgat cagattgggt actataggag ggctacaagg agaatccggg 2400 gaggcgacgg aaagatgaaa gatctgagcc ccagatggta cttttactat ctgggaacag 2460 gaccagaggc tggactgcct tatggcgcta acaaggacgg aatcatttgg gtggccactg 2520 aaggcgctct gaatacccct aaagatcaca ttggaacccg caacccagcc aacaatgccg 2580 ctatcgtgct gcagctgcca cagggcacca cactgcccaa gggcttctac gctgagggga 2640 gtaggggagg atcacaggct tcctctcgca gttcaagcag gtcccgcaat tcctctcgga 2700 actctacacc agggagttca cggggaacta gcccagctag aatggctgga aatggagggg 2760 acgccgctct ggccctgctg ctgctggata gactgaacca gctggagtct aagatgagtg 2820 gcaaagggca gcagcagcag ggacagacag tgactaagaa atccgccgct gaagcctcta 2880 agaaaccccg gcagaagaga accgctacaa aagcctacaa tgtgacccag gcttttggca 2940 ggcgcggacc tgagcagaca cagggaaact tcggcgacca ggaactgatt aggcagggca 3000 ccgattataa gcactggccc cagatcgctc agttcgcccc tagtgcttca gccttctttg 3060 gaatgtctcg cattggcatg gaggtgacac ctagtggcac ttggctgact tacaccgggg 3120 ccatcaagct ggacgataaa gacccaaact tcaaggatca ggtcatcctg ctgaacaagc 3180 atattgacgc ctataaaacc ttccccccta cagagcccaa gaaagacaag aaaaagaaag 3240 ccgatgaaac ccaggctctg ccccagaggc agaagaaaca gcagacagtg actctgctgc 3300 ctgccgctga tctggacgat ttcagtaaac agctgcagca gagtatgagt agtgccgaca 3360 gtacccaggc ttaataatag tctaga 3386 <210> 61 <211> 4040 <212> DNA <213> Artificial Sequence <220> <223> OC2.4 codon optimized DNA sequence <220> <221> BamHI_restriction_site <222> (1)..(6) <220> <221> Kozak <222> (7)..(15) <220> <221> IgE-leader <222> (12)..(65) <220> <221> RBD-WT <222> (69)..(725) <220> <221> RBD-N439K,N501Y <222> (726)..(1382) <220> <221> RBD-K417N,E484K,N501Y <222> (1383)..(2039) <220> <221> P2A <222> (2040)..(2105) <220> <221> M <222> (2106)..(2771) <220> <221> NP <222> (2772)..(4028) <220> <221> XbaI_restriction_site <222> (4035)..(4040) <400> 61 ggatccgcac catggactgg acttggattc tgttcctggt cgccgccgcc acccgagtgc 60 atagcgcccg cgtgcagccc accgagagca ttgtgaggtt tcccaacatc acaaatctgt 120 gccctttcgg cgaggtgttt aatgctacta ggttcgccag cgtgtacgct tggaatcgga 180 agagaatttc taactgcgtg gccgactata gtgtgctgta caacagcgcc tccttctcta 240 cctttaagtg ctatggggtg tctcccacca aactgaatga cctgtgcttc acaaacgtgt 300 acgccgacag ttttgtgatc cggggagatg aggtgagaca gattgcccca ggccagaccg 360 ggaagatcgc tgactacaat tataaactgc ccgacgattt cacaggctgc gtgatcgcct 420 ggaacagtaa caatctggat tcaaaagtgg gcgggaacta caattatctg tacaggctgt 480 tccgcaagag caacctgaaa ccatttgaga gggacatcag cactgaaatc taccaggccg 540 gctccacccc ctgcaatgga gtggagggct tcaactgtta ttttccactg cagagctacg 600 ggtttcagcc caccaacggg gtgggatatc agccttaccg cgtggtggtg ctgtccttcg 660 aactgctgca cgctccagct accgtgtgcg gacccaagaa aagtactaac ctggtgaaga 720 acaagagggt gcagccaact gagtcaatcg tgcgctttcc aaacattacc aatctgtgcc 780 ccttcgggga agtgtttaat gccacacgct tcgcttccgt gtacgcctgg aataggaagc 840 gcatctcaaa ttgcgtggct gactatagcg tgctgtacaa cagtgcttca ttcagcactt 900 ttaagtgcta tggcgtgtca cctactaaac tgaatgacct gtgctttacc aacgtgtacg 960 ctgacagctt tgtgattagg ggggatgagg tgcgccagat cgctcctgga cagactggaa 1020 agattgctga ctataactac aaactgccag acgatttcac cggatgcgtg attgcctgga 1080 acagcaataa gctggattcc aaagtgggag gcaactataa ttacctgtat cggctgttca 1140 gaaagtctaa cctgaaacct tttgagcggg acatctctac cgagatctac caggccggaa 1200 gtaccccatg caatggcgtg gaggggttca actgctactt tccactgcag tcttacggct 1260 ttcagcccac ctatggcgtg gggtatcagc cttacagagt ggtggtgctg agcttcgaac 1320 tgctgcatgc tcctgctacc gtgtgcggac caaagaaaag caccaacctg gtcaagaaca 1380 agcgggtgca gcctacagag tccatcgtga gatttcctaa cattactaat ctgtgcccat 1440 tcggcgaagt gtttaatgct acaagatttg ctagcgtgta cgcctggaat cggaagagaa 1500 tctccaattg cgtggcagac tattctgtgc tgtacaactc cgcttctttc agtaccttta 1560 agtgttacgg agtgtcccca acaaaactga atgacctgtg cttcacgaac gtgtacgccg 1620 actcttttgt gatccggggc gatgaggtga gacagatcgc ccccggacag acaggcaata 1680 tcgctgacta caactataag ctgcctgacg atttcactgg atgcgtgatt gcttggaatt 1740 ctaacaatct ggatagtaaa gtggggggaa attataacta tctgtatagg ctgttccgca 1800 agtctaacct gaaacccttt gagagggaca tctcaaccga gatctaccag gctgggagca 1860 ccccttgcaa tggggtgaag ggattcaact gttactttcc actgcagagc tatggatttc 1920 agcccacata cggagtgggc taccagccat atagagtggt ggtgctgagt ttcgagctgc 1980 tgcatgcccc agctacagtg tgcggaccta agaaaagcac aaacctggtc aaaaacaagg 2040 gaagcggagc tactaacttc agcctgctga agcaggctgg agacgtggag gagaaccctg 2100 gacctatggc cgatagcaac gggactatca ccgtggagga actgaagaaa ctgctggaac 2160 agtggaacct ggtcatcggc ttcctgtttc tgacctggat ctgtctgctg cagttcgcct 2220 atgctaacag gaatcgcttt ctgtacatca ttaagctgat tttcctgtgg ctgctgtggc 2280 ctgtgactct ggcctgcttc gtgctggccg ccgtgtacag gatcaactgg attaccggcg 2340 ggatcgccat tgctatggcc tgtctggtgg gcctgatgtg gctgtcatac tttatcgcca 2400 gcttccgcct gtttgctcgg accagaagta tgtggtcatt caaccctgag acaaatattc 2460 tgctgaacgt gccactgcac ggcaccatcc tgacacggcc cctgctggag agcgaactgg 2520 tcatcggcgc cgtgattctg agggggcatc tgcgcatcgc tggccaccat ctggggagat 2580 gcgacatcaa ggatctgccc aaagaaatta ctgtggccac ctctaggaca ctgagttact 2640 ataagctggg agcttcccag agggtggctg gcgacagcgg atttgctgct tattccaggt 2700 accgcatcgg gaattacaaa ctgaacacag accacagctc ctctagtgat aatattgccc 2760 tgctggtgca ggctagcgac aacggacccc agaaccagcg gaatgcccct agaatcacct 2820 tcggaggccc atcagatagc acaggctcca accagaatgg agagaggtca ggagctcgca 2880 gcaagcagag acggccccag ggactgccaa acaataccgc ctcttggttt actgctctga 2940 cccagcatgg caaggaagat ctgaaattcc cacggggcca gggggtgccc attaacacca 3000 attcaagccc cgacgatcag atcggctact ataggagggc tacaaggaga attcggggag 3060 gagacgggaa gatgaaagat ctgagcccta gatggtactt ctactatctg ggaacaggac 3120 cagaggctgg gctgccttac ggagctaaca aggacgggat catttgggtg gccactgaag 3180 gagctctgaa tacccctaaa gatcacatcg ggaccagaaa cccagccaac aatgccgcta 3240 ttgtgctgca gctgcctcag ggaaccacac tgccaaaggg attctacgct gagggctccc 3300 ggggaggcag ccaggcttcc agccggagct caagccggag tagaaattcc tctcggaact 3360 caacaccagg cagttcaagg gggacttccc cagctaggat ggctggaaat ggaggcgacg 3420 ccgctctggc cctgctgctg ctggatagac tgaaccagct ggagagcaag atgtccggga 3480 aaggacagca gcagcaggga cagacagtga ctaagaaatc cgccgctgaa gcctctaaga 3540 aacctcggca gaagagaacc gctacaaaag cctataatgt gactcaggct tttggaaggc 3600 gcggaccaga gcagacccag ggaaacttcg gcgaccagga actgatcagg cagggcaccg 3660 attacaagca ctggccccag attgctcagt tcgccccttc cgcttctgcc ttctttggga 3720 tgtcccgcat cggaatggag gtgacaccat ctggaacttg gctgacttat accggcgcca 3780 ttaagctgga cgataaagac cccaacttca aggatcaggt catcctgctg aacaagcata 3840 ttgacgccta caaaaccttc ccccctacag agcccaagaa agacaagaaa aagaaagccg 3900 atgaaaccca ggctctgccc cagagacaga agaaacagca gacagtgact ctgctgcctg 3960 ccgctgatct ggacgatttc tcaaaacagc tgcagcagag catgtcaagt gccgattcaa 4020 ctcaggctta atagtctaga 4040 <210> 62 <211> 2720 <212> DNA <213> Artificial Sequence <220> <223> SVF-14 codon optimized DNA sequence <220> <221> BamHI_restriction_site <222> (1)..(6) <220> <221> Kozak <222> (7)..(15) <220> <221> IgE-leader <222> (12)..(65) <220> <221> RBDv2 <222> (69)..(1382) <220> <221> P2A <222> (1383)..(1448) <220> <221> NP <222> (1449)..(2708) <220> <221> XbaI_restriction_site <222> (2715)..(2720) <400> 62 ggatccgcac catggattgg acttggattc tgtttctggt cgccgccgcc acacgagtgc 60 attccgcccg agtgcagcct accgagagta ttgtccgatt ccctaacatt actaatctgt 120 gcccattcgg cgaggtgttt aacgccacca ggtttgctag cgtgtacgcc tggaaccgga 180 agagaatcag caattgcgtg gccgactact ccgtgctgta taattccgct tctttcagta 240 cctttaagtg ctacggcgtg tcacccacta aactgaacga cctgtgcttc accaacgtgt 300 acgccgacag ctttgtgatc cggggggatg aagtgagaca gattgcccct ggccagacag 360 ggaagatcgc tgactacaac tataaactgc cagacgattt cactggctgc gtgatcgcct 420 ggaattctaa caatctggat agtaaagtgg gcgggaacta caattatctg tacaggctgt 480 tccgcaagag caacctgaaa ccatttgagc gggacatctc cacagaaatc taccaggccg 540 gatctactcc ctgcaacgga gtggagggct tcaattgtta ctttcctctg cagagctatg 600 gcttccagcc aaccaatggc gtggggtacc agccctatag agtggtggtg ctgagctttg 660 aactgctgca cgctccagct accgtgtgcg gacccaagaa atctacaaac ctggtgaaga 720 acaagcgggt gcagcccaca gagagtatcg tgagattccc caatatcact aatctgtgcc 780 ctttcggcga agtgtttaac gctacacgct ttgcctccgt gtacgcttgg aacaggaagc 840 gcatttctaa ctgcgtggct gactacagtg tgctgtataa ttcagctagc ttctccactt 900 ttaagtgcta cggagtgtcc cctaccaaac tgaacgacct gtgctttact aacgtgtacg 960 ctgactcttt tgtgattagg ggcgatgagg tgcgccagat cgctccagga cagaccggaa 1020 agattgctga ctataactac aaactgcctg acgatttcac aggatgcgtg attgcctgga 1080 attcaaacaa tctggatagc aaagtgggag gcaactataa ttacctgtat cggctgttca 1140 gaaagagcaa cctgaaacct tttgagaggg acatcagtac cgagatctac caggccgggt 1200 caactccatg caacggcgtg gaggggttca attgctattt cccactgcag agctatggat 1260 tccagccaac caacggagtg ggctaccagc cctatcgcgt ggtggtgctg agttttgaac 1320 tgctgcatgc tcctgctacc gtgtgcggac caaagaaatc taccaacctg gtcaaaaaca 1380 agggaagcgg agctactaac ttcagcctgc tgaagcaggc tggagacgtg gaggagaacc 1440 ctggacctat ggcttccgat aatggcccac agaaccagcg gaatgctccc agaatcactt 1500 ttgggggacc ttctgacagt accggctcta accagaatgg cgagaggagt ggagctcgct 1560 caaagcagag acggccccag gggctgccaa acaataccgc ctcctggttc acagctctga 1620 ctcagcacgg aaaggaagat ctgaaatttc cccggggcca gggggtgcct atcaacacta 1680 atagctcccc tgacgatcag attggatact ataggagggc taccaggaga atcaggggag 1740 gggacggcaa gatgaaagat ctgtctccac gctggtactt ctactatctg ggaaccggac 1800 cagaggctgg actgccttat ggagctaaca aggacggcat catttgggtg gccacagaag 1860 gggctctgaa cactcccaaa gatcatattg gcacaagaaa tcctgccaac aatgccgcta 1920 tcgtgctgca gctgccacag gggaccacac tgcccaaggg cttttacgct gaggggagca 1980 ggggaggctc ccaggcttct agtcgctcaa gctcccggtc aagaaactct agtaggaata 2040 gcacccctgg gtcaagccgg ggaacaagcc cagccagaat ggctggaaac ggaggagacg 2100 ccgctctggc cctgctgctg ctggatcgcc tgaatcagct ggagtccaag atgtctggga 2160 aaggacagca gcagcaggga cagactgtga ccaagaaatc cgccgctgaa gcctctaaga 2220 aaccaaggca gaagcgcaca gccactaaag cttacaacgt gacccaggct ttcggaaggc 2280 gcggaccaga gcagacacag gggaattttg gcgaccagga actgattcgg cagggcaccg 2340 attataagca ctggccacag atcgcccagt tcgctccctc agccagcgcc ttcttcggaa 2400 tgagcagaat tggcatggag gtgaccccct ccgggacatg gctgacctac acaggagcca 2460 tcaagctgga cgataaagac cctaacttca aagatcaggt catcctgctg aacaagcata 2520 ttgacgccta taaaactttt ccccctaccg agcccaagaa agacaagaaa aagaaagccg 2580 atgaaacaca ggctctgcca cagcggcaga agaaacagca gactgtgacc ctgctgcccg 2640 ccgctgatct ggacgatttc agtaaacagc tgcagcagtc aatgtcttcc gccgattcaa 2700 ctcaggcata atagtctaga 2720 <210> 63 <211> 5222 <212> DNA <213> Artificial Sequence <220> <223> SVF-15 codon optimized DNA sequence <220> <221> BamHI_restriction_site <222> (1)..(6) <220> <221> Kozak <222> (7)..(15) <220> <221> IgE-leader <222> (12)..(65) <220> <221> S-protein_K986P,V987P <222> (69)..(3884) <220> <221> P2A <222> (3885)..(3950) <220> <221> NP <222> (3951)..(5210) <220> <221> XbaI_restriction_site <222> (5217)..(5222) <400> 63 ggatccgcac catggactgg acatggattc tgtttctggt cgctgctgct acccgagtgc 60 attctgcctt cgtctttctg gtgctgctgc ctctggtcag ctcccagtgc gtgaacctga 120 ccacaaggac acagctgccc cctgcctata caaattcctt cactcggggc gtgtactatc 180 ctgacaaagt gtttagatct agtgtgctgc actccacaca ggatctgttt ctgccattct 240 tttctaacgt gacttggttc cacgccatcc acgtgagcgg gaccaatgga acaaagaggt 300 tcgacaatcc agtgctgccc tttaacgatg gcgtgtactt cgccagtacc gagaagtcaa 360 acatcattcg cgggtggatc tttggaacta ccctggacag caaaacccag tccctgctga 420 tcgtgaacaa tgccacaaac gtggtcatca aggtgtgcga attccagttt tgtaatgatc 480 ccttcctggg cgtgtactat cataagaaca acaagtcttg gatggagagt gaatttcgcg 540 tgtattcaag cgccaacaat tgcacatttg agtacgtgag ccagcctttc ctgatggacc 600 tggaaggcaa gcaggggaat ttcaaaaacc tgcgggagtt cgtgtttaag aatattgatg 660 gctacttcaa gatctactct aaacacaccc ccatcaacct ggtgcgggac ctgcctcagg 720 ggttcagtgc cctggagcct ctggtggatc tgccaatcgg aattaacatc acccggtttc 780 agacactgct ggccctgcat agatcctacc tgacaccagg cgactcctct agtggctgga 840 ctgctggggc cgctgcctac tatgtggggt atctgcagcc ccggaccttc ctgctgaaat 900 acaacgagaa tggaactatt accgacgctg tggattgcgc cctggacccc ctgtccgaaa 960 ctaagtgtac cctgaaatct tttaccgtgg agaagggaat ctatcagaca agcaatttca 1020 gggtgcagcc aactgaatcc attgtgcgct ttccaaatat caccaacctg tgcccctttg 1080 gcgaggtgtt caacgctaca agattcgcca gcgtgtacgc ttggaatagg aagcgcatca 1140 gcaactgcgt ggccgactat tccgtgctgt acaactccgc ttctttcagt acctttaagt 1200 gctatggagt gtcacccacc aaactgaatg acctgtgctt tacaaacgtg tacgccgatt 1260 ccttcgtgat taggggcgac gaggtgcgcc agatcgctcc tggacagacc ggcaagattg 1320 ctgactacaa ttataaactg ccagacgatt tcacaggctg cgtgatcgcc tggaactcta 1380 acaatctgga tagtaaagtg ggcgggaact acaattatct gtacaggctg tttcgcaaga 1440 gcaatctgaa acccttcgag cgggacatta gtactgaaat ctaccaggcc ggctcaaccc 1500 cttgcaatgg ggtggagggc ttcaactgtt atttcccact gcagtcctac gggttccagc 1560 ccacaaacgg agtgggctat cagccttaca gagtggtggt gctgtctttt gaactgctgc 1620 acgctccagc tacagtgtgc ggacccaaga aaagtactaa tctggtgaag aacaaatgcg 1680 tgaacttcaa cttcaacgga ctgacaggga ctggagtgct gaccgagagc aacaagaaat 1740 tcctgccatt tcagcagttc ggaagggaca tcgccgatac aactgacgct gtgcgcgacc 1800 cccagaccct ggaaattctg gatatcacac cttgctcatt cggaggcgtg agcgtgatta 1860 cccccggcac caatacatcc aaccaggtgg ccgtgctgta tcaggacgtg aattgtacag 1920 aggtgccagt ggctatccac gccgatcagc tgactcccac ctggcgggtg tacagcactg 1980 gctccaacgt gtttcagacc agagccggat gcctgattgg cgctgagcat gtgaacaata 2040 gttatgaatg cgacattcca atcggcgccg ggatctgtgc ttcataccag acacagacta 2100 actctccccg gagagccagg agtgtggctt cacagagcat cattgcctat accatgtcac 2160 tgggggccga aaatagcgtg gcttactcta acaatagtat tgctatcccc acaaacttca 2220 ctatttctgt gaccacagag atcctgcccg tgagcatgac caagacatct gtggactgca 2280 ccatgtatat ttgtggcgat tcaacagaat gcagcaacct gctgctgcag tacggaagct 2340 tttgtacaca gctgaatcgc gccctgactg gcatcgctgt ggagcaggac aaaaacactc 2400 aggaagtgtt cgcccaggtg aagcagatct acaaaacccc acccatcaag gactttgggg 2460 gcttcaactt cagccagatt ctgcctgatc catcaaagcc cagcaaaagg tcctttatcg 2520 aggacctgct gttcaacaag gtgaccctgg ctgatgccgg cttcatcaaa cagtatgggg 2580 attgcctggg agacattgct gcccgcgacc tgatctgtgc ccagaagttt aatgggctga 2640 ccgtgctgcc tccactgctg acagatgaaa tgattgccca gtacacatct gctctgctgg 2700 ccgggactat caccagtgga tggactttcg gagccggcgc tgccctgcag attccttttg 2760 ccatgcagat ggcttatagg ttcaacggga tcggagtgac ccagaatgtg ctgtacgaga 2820 accagaagct gatcgccaat cagtttaaca gcgccattgg caaaatccag gactccctgt 2880 caagcactgc ttctgccctg gggaaactgc aggatgtggt gaatcagaac gctcaggccc 2940 tgaataccct ggtgaagcag ctgtcctcta acttcggggc cattagttca gtgctgaatg 3000 atatcctgtc caggctggac ccccctgagg ctgaagtgca gattgaccgg ctgatcacag 3060 gaagactgca gagcctgcag acctacgtga cacagcagct gattagggct gccgaaatcc 3120 gcgcttccgc caatctggct gccaccaaga tgtctgagtg cgtgctgggg cagagtaagc 3180 gcgtggactt ttgtggcaaa gggtatcacc tgatgtcctt cccccagtct gcccctcacg 3240 gagtggtgtt tctgcatgtg acctacgtgc ctgctcagga gaagaacttc actaccgctc 3300 cagccatctg ccacgatggc aaagcccatt ttccccggga aggcgtgttc gtgtccaacg 3360 ggacccattg gtttgtgaca cagagaaatt tctacgagcc tcagatcatt acaactgaca 3420 ataccttcgt gagcggaaac tgtgacgtgg tcatcggcat cgtgaacaat accgtgtacg 3480 atcctctgca gccagagctg gacagcttta aggaggaact ggataagtac ttcaaaaatc 3540 acacctcccc cgacgtggat ctgggcgaca ttagtgggat caatgcctca gtggtgaaca 3600 ttcagaagga gatcgacaga ctgaacgaag tggctaaaaa tctgaacgag agcctgattg 3660 atctgcagga gctgggcaag tatgaacagt acatcaaatg gccttggtat atttggctgg 3720 gattcatcgc cggcctgatt gctatcgtga tggtgactat catgctgtgc tgtatgacct 3780 cttgctgtag ttgcctgaag ggctgctgtt catgtgggag ctgctgtaaa ttcgacgagg 3840 acgattccga accagtgctg aagggcgtga aactgcacta cactggaagc ggagctacta 3900 acttcagcct gctgaagcag gctggagacg tggaggagaa ccctggacct atggcctctg 3960 ataacggccc tcagaatcag aggaacgctc cacgcatcac tttcggcgga ccatccgact 4020 ctaccggcag caatcagaac ggggagcgga gtggagccag atcaaagcag aggcgcccac 4080 agggcctgcc caacaatacc gccagctggt tcactgctct gacccagcat gggaaggaag 4140 atctgaaatt tcctcggggg cagggagtgc caatcaatac taacagctcc ccagacgatc 4200 agattggata ctataggaga gctaccaggc gcatcagggg aggcgatggc aagatgaaag 4260 acctgtcccc ccgctggtat ttctactatc tgggaacagg accagaagct ggcctgcctt 4320 acggggctaa caaagacggc atcatttggg tggccacaga gggggctctg aacactccta 4380 aggatcacat tggaaccaga aatccagcca acaatgctgc tatcgtgctg cagctgccac 4440 agggaaccac actgcctaag ggattctacg ctgagggcag caggggaggc agccaggctt 4500 ctagtcgctc aagctcccgg tcaagaaatt ctagtcggaa cagcacacca ggatcaagcc 4560 ggggcactag cccagctaga atggctggaa atggagggga cgctgccctg gccctgctgc 4620 tgctggatag actgaaccag ctggaatcca agatgtctgg aaaaggccag cagcagcagg 4680 ggcagacagt gaccaagaag agcgccgctg aggcttccaa gaaacctagg cagaagagaa 4740 ccgctacaaa agcctataat gtgactcagg ccttcggccg gagaggacca gagcagaccc 4800 agggaaactt tggcgaccag gaactgatta ggcagggcac cgattacaag cactggcctc 4860 agatcgctca gttcgcccca agtgcttcag ccttctttgg gatgtcacgc attggaatgg 4920 aagtgactcc cagcgggacc tggctgactt ataccggagc catcaagctg gacgataaag 4980 atcctaactt caaggaccag gtcatcctgc tgaacaagca tatcgacgcc tacaaaacat 5040 ttccacccac tgaacccaag aaagataaga aaaagaaagc cgacgagaca caggctctgc 5100 cacagcggca gaagaaacag cagacagtga ctctgctgcc cgctgccgat ctggacgatt 5160 tctcaaaaca gctgcagcag tcaatgtctt ccgccgattc aactcaggca taatagtcta 5220 ga 5222 <210> 64 <211> 1120 <212> PRT <213> Artificial Sequence <220> <223> OC2.3 (N501Y) polypeptide sequence <220> <221> IgE-leader <222> (1)..(18) <220> <221> RBDv2-N501Y <222> (20)..(457) <220> <221> P2A <222> (458)..(479) <220> <221> M <222> (480)..(701) <220> <221> NP <222> (702)..(1120) <400> 64 Met Asp Trp Thr Trp Ile Leu Phe Leu Val Ala Ala Ala Thr Arg Val 1 5 10 15 His Ser Ala Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn 20 25 30 Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe 35 40 45 Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala 50 55 60 Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys 65 70 75 80 Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val 85 90 95 Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala 100 105 110 Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp 115 120 125 Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser 130 135 140 Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser 145 150 155 160 Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala 165 170 175 Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro 180 185 190 Leu Gln Ser Tyr Gly Phe Gln Pro Thr Tyr Gly Val Gly Tyr Gln Pro 195 200 205 Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr 210 215 220 Val Cys Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Arg Val 225 230 235 240 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 245 250 255 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 260 265 270 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 275 280 285 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 290 295 300 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 305 310 315 320 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 325 330 335 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 340 345 350 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 355 360 365 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 370 375 380 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 385 390 395 400 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 405 410 415 Phe Gln Pro Thr Tyr Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 420 425 430 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 435 440 445 Lys Ser Thr Asn Leu Val Lys Asn Lys Gly Ser Gly Ala Thr Asn Phe 450 455 460 Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Met 465 470 475 480 Ala Asp Ser Asn Gly Thr Ile Thr Val Glu Glu Leu Lys Lys Leu Leu 485 490 495 Glu Gln Trp Asn Leu Val Ile Gly Phe Leu Phe Leu Thr Trp Ile Cys 500 505 510 Leu Leu Gln Phe Ala Tyr Ala Asn Arg Asn Arg Phe Leu Tyr Ile Ile 515 520 525 Lys Leu Ile Phe Leu Trp Leu Leu Trp Pro Val Thr Leu Ala Cys Phe 530 535 540 Val Leu Ala Ala Val Tyr Arg Ile Asn Trp Ile Thr Gly Gly Ile Ala 545 550 555 560 Ile Ala Met Ala Cys Leu Val Gly Leu Met Trp Leu Ser Tyr Phe Ile 565 570 575 Ala Ser Phe Arg Leu Phe Ala Arg Thr Arg Ser Met Trp Ser Phe Asn 580 585 590 Pro Glu Thr Asn Ile Leu Leu Asn Val Pro Leu His Gly Thr Ile Leu 595 600 605 Thr Arg Pro Leu Leu Glu Ser Glu Leu Val Ile Gly Ala Val Ile Leu 610 615 620 Arg Gly His Leu Arg Ile Ala Gly His His Leu Gly Arg Cys Asp Ile 625 630 635 640 Lys Asp Leu Pro Lys Glu Ile Thr Val Ala Thr Ser Arg Thr Leu Ser 645 650 655 Tyr Tyr Lys Leu Gly Ala Ser Gln Arg Val Ala Gly Asp Ser Gly Phe 660 665 670 Ala Ala Tyr Ser Arg Tyr Arg Ile Gly Asn Tyr Lys Leu Asn Thr Asp 675 680 685 His Ser Ser Ser Ser Asp Asn Ile Ala Leu Leu Val Gln Ala Ser Asp 690 695 700 Asn Gly Pro Gln Asn Gln Arg Asn Ala Pro Arg Ile Thr Phe Gly Gly 705 710 715 720 Pro Ser Asp Ser Thr Gly Ser Asn Gln Asn Gly Glu Arg Ser Gly Ala 725 730 735 Arg Ser Lys Gln Arg Arg Pro Gln Gly Leu Pro Asn Asn Thr Ala Ser 740 745 750 Trp Phe Thr Ala Leu Thr Gln His Gly Lys Glu Asp Leu Lys Phe Pro 755 760 765 Arg Gly Gln Gly Val Pro Ile Asn Thr Asn Ser Ser Pro Asp Asp Gln 770 775 780 Ile Gly Tyr Tyr Arg Arg Ala Thr Arg Arg Ile Arg Gly Gly Asp Gly 785 790 795 800 Lys Met Lys Asp Leu Ser Pro Arg Trp Tyr Phe Tyr Tyr Leu Gly Thr 805 810 815 Gly Pro Glu Ala Gly Leu Pro Tyr Gly Ala Asn Lys Asp Gly Ile Ile 820 825 830 Trp Val Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys Asp His Ile Gly 835 840 845 Thr Arg Asn Pro Ala Asn Asn Ala Ala Ile Val Leu Gln Leu Pro Gln 850 855 860 Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala Glu Gly Ser Arg Gly Gly 865 870 875 880 Ser Gln Ala Ser Ser Arg Ser Ser Ser Arg Ser Arg Asn Ser Ser Arg 885 890 895 Asn Ser Thr Pro Gly Ser Ser Arg Gly Thr Ser Pro Ala Arg Met Ala 900 905 910 Gly Asn Gly Gly Asp Ala Ala Leu Ala Leu Leu Leu Leu Asp Arg Leu 915 920 925 Asn Gln Leu Glu Ser Lys Met Ser Gly Lys Gly Gln Gln Gln Gln Gly 930 935 940 Gln Thr Val Thr Lys Lys Ser Ala Ala Glu Ala Ser Lys Lys Pro Arg 945 950 955 960 Gln Lys Arg Thr Ala Thr Lys Ala Tyr Asn Val Thr Gln Ala Phe Gly 965 970 975 Arg Arg Gly Pro Glu Gln Thr Gln Gly Asn Phe Gly Asp Gln Glu Leu 980 985 990 Ile Arg Gln Gly Thr Asp Tyr Lys His Trp Pro Gln Ile Ala Gln Phe 995 1000 1005 Ala Pro Ser Ala Ser Ala Phe Phe Gly Met Ser Arg Ile Gly Met 1010 1015 1020 Glu Val Thr Pro Ser Gly Thr Trp Leu Thr Tyr Thr Gly Ala Ile 1025 1030 1035 Lys Leu Asp Asp Lys Asp Pro Asn Phe Lys Asp Gln Val Ile Leu 1040 1045 1050 Leu Asn Lys His Ile Asp Ala Tyr Lys Thr Phe Pro Pro Thr Glu 1055 1060 1065 Pro Lys Lys Asp Lys Lys Lys Lys Ala Asp Glu Thr Gln Ala Leu 1070 1075 1080 Pro Gln Arg Gln Lys Lys Gln Gln Thr Val Thr Leu Leu Pro Ala 1085 1090 1095 Ala Asp Leu Asp Asp Phe Ser Lys Gln Leu Gln Gln Ser Met Ser 1100 1105 1110 Ser Ala Asp Ser Thr Gln Ala 1115 1120 <210> 65 <211> 1120 <212> PRT <213> Artificial Sequence <220> <223> OC2.3 (N439K, N501Y) polypeptide sequence <220> <221> IgE-leader <222> (1)..(18) <220> <221> RBDv2-N439K,N501Y <222> (20)..(457) <220> <221> P2A <222> (458)..(479) <220> <221> M <222> (480)..(701) <220> <221> NP <222> (702)..(1120) <400> 65 Met Asp Trp Thr Trp Ile Leu Phe Leu Val Ala Ala Ala Thr Arg Val 1 5 10 15 His Ser Ala Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn 20 25 30 Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe 35 40 45 Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala 50 55 60 Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys 65 70 75 80 Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val 85 90 95 Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala 100 105 110 Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp 115 120 125 Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Lys Leu Asp Ser 130 135 140 Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser 145 150 155 160 Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala 165 170 175 Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro 180 185 190 Leu Gln Ser Tyr Gly Phe Gln Pro Thr Tyr Gly Val Gly Tyr Gln Pro 195 200 205 Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr 210 215 220 Val Cys Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Arg Val 225 230 235 240 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 245 250 255 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 260 265 270 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 275 280 285 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 290 295 300 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 305 310 315 320 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 325 330 335 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 340 345 350 Val Ile Ala Trp Asn Ser Asn Lys Leu Asp Ser Lys Val Gly Gly Asn 355 360 365 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 370 375 380 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 385 390 395 400 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 405 410 415 Phe Gln Pro Thr Tyr Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 420 425 430 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 435 440 445 Lys Ser Thr Asn Leu Val Lys Asn Lys Gly Ser Gly Ala Thr Asn Phe 450 455 460 Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Met 465 470 475 480 Ala Asp Ser Asn Gly Thr Ile Thr Val Glu Glu Leu Lys Lys Leu Leu 485 490 495 Glu Gln Trp Asn Leu Val Ile Gly Phe Leu Phe Leu Thr Trp Ile Cys 500 505 510 Leu Leu Gln Phe Ala Tyr Ala Asn Arg Asn Arg Phe Leu Tyr Ile Ile 515 520 525 Lys Leu Ile Phe Leu Trp Leu Leu Trp Pro Val Thr Leu Ala Cys Phe 530 535 540 Val Leu Ala Ala Val Tyr Arg Ile Asn Trp Ile Thr Gly Gly Ile Ala 545 550 555 560 Ile Ala Met Ala Cys Leu Val Gly Leu Met Trp Leu Ser Tyr Phe Ile 565 570 575 Ala Ser Phe Arg Leu Phe Ala Arg Thr Arg Ser Met Trp Ser Phe Asn 580 585 590 Pro Glu Thr Asn Ile Leu Leu Asn Val Pro Leu His Gly Thr Ile Leu 595 600 605 Thr Arg Pro Leu Leu Glu Ser Glu Leu Val Ile Gly Ala Val Ile Leu 610 615 620 Arg Gly His Leu Arg Ile Ala Gly His His Leu Gly Arg Cys Asp Ile 625 630 635 640 Lys Asp Leu Pro Lys Glu Ile Thr Val Ala Thr Ser Arg Thr Leu Ser 645 650 655 Tyr Tyr Lys Leu Gly Ala Ser Gln Arg Val Ala Gly Asp Ser Gly Phe 660 665 670 Ala Ala Tyr Ser Arg Tyr Arg Ile Gly Asn Tyr Lys Leu Asn Thr Asp 675 680 685 His Ser Ser Ser Ser Asp Asn Ile Ala Leu Leu Val Gln Ala Ser Asp 690 695 700 Asn Gly Pro Gln Asn Gln Arg Asn Ala Pro Arg Ile Thr Phe Gly Gly 705 710 715 720 Pro Ser Asp Ser Thr Gly Ser Asn Gln Asn Gly Glu Arg Ser Gly Ala 725 730 735 Arg Ser Lys Gln Arg Arg Pro Gln Gly Leu Pro Asn Asn Thr Ala Ser 740 745 750 Trp Phe Thr Ala Leu Thr Gln His Gly Lys Glu Asp Leu Lys Phe Pro 755 760 765 Arg Gly Gln Gly Val Pro Ile Asn Thr Asn Ser Ser Pro Asp Asp Gln 770 775 780 Ile Gly Tyr Tyr Arg Arg Ala Thr Arg Arg Ile Arg Gly Gly Asp Gly 785 790 795 800 Lys Met Lys Asp Leu Ser Pro Arg Trp Tyr Phe Tyr Tyr Leu Gly Thr 805 810 815 Gly Pro Glu Ala Gly Leu Pro Tyr Gly Ala Asn Lys Asp Gly Ile Ile 820 825 830 Trp Val Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys Asp His Ile Gly 835 840 845 Thr Arg Asn Pro Ala Asn Asn Ala Ala Ile Val Leu Gln Leu Pro Gln 850 855 860 Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala Glu Gly Ser Arg Gly Gly 865 870 875 880 Ser Gln Ala Ser Ser Arg Ser Ser Ser Arg Ser Arg Asn Ser Ser Arg 885 890 895 Asn Ser Thr Pro Gly Ser Ser Arg Gly Thr Ser Pro Ala Arg Met Ala 900 905 910 Gly Asn Gly Gly Asp Ala Ala Leu Ala Leu Leu Leu Leu Asp Arg Leu 915 920 925 Asn Gln Leu Glu Ser Lys Met Ser Gly Lys Gly Gln Gln Gln Gln Gly 930 935 940 Gln Thr Val Thr Lys Lys Ser Ala Ala Glu Ala Ser Lys Lys Pro Arg 945 950 955 960 Gln Lys Arg Thr Ala Thr Lys Ala Tyr Asn Val Thr Gln Ala Phe Gly 965 970 975 Arg Arg Gly Pro Glu Gln Thr Gln Gly Asn Phe Gly Asp Gln Glu Leu 980 985 990 Ile Arg Gln Gly Thr Asp Tyr Lys His Trp Pro Gln Ile Ala Gln Phe 995 1000 1005 Ala Pro Ser Ala Ser Ala Phe Phe Gly Met Ser Arg Ile Gly Met 1010 1015 1020 Glu Val Thr Pro Ser Gly Thr Trp Leu Thr Tyr Thr Gly Ala Ile 1025 1030 1035 Lys Leu Asp Asp Lys Asp Pro Asn Phe Lys Asp Gln Val Ile Leu 1040 1045 1050 Leu Asn Lys His Ile Asp Ala Tyr Lys Thr Phe Pro Pro Thr Glu 1055 1060 1065 Pro Lys Lys Asp Lys Lys Lys Lys Ala Asp Glu Thr Gln Ala Leu 1070 1075 1080 Pro Gln Arg Gln Lys Lys Gln Gln Thr Val Thr Leu Leu Pro Ala 1085 1090 1095 Ala Asp Leu Asp Asp Phe Ser Lys Gln Leu Gln Gln Ser Met Ser 1100 1105 1110 Ser Ala Asp Ser Thr Gln Ala 1115 1120 <210> 66 <211> 1120 <212> PRT <213> Artificial Sequence <220> <223> OC2.3 (K417N, E484K, N501Y) polypeptide sequence <220> <221> IgE-leader <222> (1)..(18) <220> <221> RBDv2-K417N,E484K,N501Y <222> (20)..(457) <220> <221> P2A <222> (458)..(479) <220> <221> M <222> (480)..(701) <220> <221> NP <222> (702)..(1120) <400> 66 Met Asp Trp Thr Trp Ile Leu Phe Leu Val Ala Ala Ala Thr Arg Val 1 5 10 15 His Ser Ala Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn 20 25 30 Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe 35 40 45 Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala 50 55 60 Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys 65 70 75 80 Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val 85 90 95 Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala 100 105 110 Pro Gly Gln Thr Gly Asn Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp 115 120 125 Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser 130 135 140 Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser 145 150 155 160 Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala 165 170 175 Gly Ser Thr Pro Cys Asn Gly Val Lys Gly Phe Asn Cys Tyr Phe Pro 180 185 190 Leu Gln Ser Tyr Gly Phe Gln Pro Thr Tyr Gly Val Gly Tyr Gln Pro 195 200 205 Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr 210 215 220 Val Cys Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Arg Val 225 230 235 240 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 245 250 255 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 260 265 270 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 275 280 285 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 290 295 300 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 305 310 315 320 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 325 330 335 Asn Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 340 345 350 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 355 360 365 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 370 375 380 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 385 390 395 400 Asn Gly Val Lys Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 405 410 415 Phe Gln Pro Thr Tyr Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 420 425 430 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 435 440 445 Lys Ser Thr Asn Leu Val Lys Asn Lys Gly Ser Gly Ala Thr Asn Phe 450 455 460 Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Met 465 470 475 480 Ala Asp Ser Asn Gly Thr Ile Thr Val Glu Glu Leu Lys Lys Leu Leu 485 490 495 Glu Gln Trp Asn Leu Val Ile Gly Phe Leu Phe Leu Thr Trp Ile Cys 500 505 510 Leu Leu Gln Phe Ala Tyr Ala Asn Arg Asn Arg Phe Leu Tyr Ile Ile 515 520 525 Lys Leu Ile Phe Leu Trp Leu Leu Trp Pro Val Thr Leu Ala Cys Phe 530 535 540 Val Leu Ala Ala Val Tyr Arg Ile Asn Trp Ile Thr Gly Gly Ile Ala 545 550 555 560 Ile Ala Met Ala Cys Leu Val Gly Leu Met Trp Leu Ser Tyr Phe Ile 565 570 575 Ala Ser Phe Arg Leu Phe Ala Arg Thr Arg Ser Met Trp Ser Phe Asn 580 585 590 Pro Glu Thr Asn Ile Leu Leu Asn Val Pro Leu His Gly Thr Ile Leu 595 600 605 Thr Arg Pro Leu Leu Glu Ser Glu Leu Val Ile Gly Ala Val Ile Leu 610 615 620 Arg Gly His Leu Arg Ile Ala Gly His His Leu Gly Arg Cys Asp Ile 625 630 635 640 Lys Asp Leu Pro Lys Glu Ile Thr Val Ala Thr Ser Arg Thr Leu Ser 645 650 655 Tyr Tyr Lys Leu Gly Ala Ser Gln Arg Val Ala Gly Asp Ser Gly Phe 660 665 670 Ala Ala Tyr Ser Arg Tyr Arg Ile Gly Asn Tyr Lys Leu Asn Thr Asp 675 680 685 His Ser Ser Ser Ser Asp Asn Ile Ala Leu Leu Val Gln Ala Ser Asp 690 695 700 Asn Gly Pro Gln Asn Gln Arg Asn Ala Pro Arg Ile Thr Phe Gly Gly 705 710 715 720 Pro Ser Asp Ser Thr Gly Ser Asn Gln Asn Gly Glu Arg Ser Gly Ala 725 730 735 Arg Ser Lys Gln Arg Arg Pro Gln Gly Leu Pro Asn Asn Thr Ala Ser 740 745 750 Trp Phe Thr Ala Leu Thr Gln His Gly Lys Glu Asp Leu Lys Phe Pro 755 760 765 Arg Gly Gln Gly Val Pro Ile Asn Thr Asn Ser Ser Pro Asp Asp Gln 770 775 780 Ile Gly Tyr Tyr Arg Arg Ala Thr Arg Arg Ile Arg Gly Gly Asp Gly 785 790 795 800 Lys Met Lys Asp Leu Ser Pro Arg Trp Tyr Phe Tyr Tyr Leu Gly Thr 805 810 815 Gly Pro Glu Ala Gly Leu Pro Tyr Gly Ala Asn Lys Asp Gly Ile Ile 820 825 830 Trp Val Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys Asp His Ile Gly 835 840 845 Thr Arg Asn Pro Ala Asn Asn Ala Ala Ile Val Leu Gln Leu Pro Gln 850 855 860 Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala Glu Gly Ser Arg Gly Gly 865 870 875 880 Ser Gln Ala Ser Ser Arg Ser Ser Ser Arg Ser Arg Asn Ser Ser Arg 885 890 895 Asn Ser Thr Pro Gly Ser Ser Arg Gly Thr Ser Pro Ala Arg Met Ala 900 905 910 Gly Asn Gly Gly Asp Ala Ala Leu Ala Leu Leu Leu Leu Asp Arg Leu 915 920 925 Asn Gln Leu Glu Ser Lys Met Ser Gly Lys Gly Gln Gln Gln Gln Gly 930 935 940 Gln Thr Val Thr Lys Lys Ser Ala Ala Glu Ala Ser Lys Lys Pro Arg 945 950 955 960 Gln Lys Arg Thr Ala Thr Lys Ala Tyr Asn Val Thr Gln Ala Phe Gly 965 970 975 Arg Arg Gly Pro Glu Gln Thr Gln Gly Asn Phe Gly Asp Gln Glu Leu 980 985 990 Ile Arg Gln Gly Thr Asp Tyr Lys His Trp Pro Gln Ile Ala Gln Phe 995 1000 1005 Ala Pro Ser Ala Ser Ala Phe Phe Gly Met Ser Arg Ile Gly Met 1010 1015 1020 Glu Val Thr Pro Ser Gly Thr Trp Leu Thr Tyr Thr Gly Ala Ile 1025 1030 1035 Lys Leu Asp Asp Lys Asp Pro Asn Phe Lys Asp Gln Val Ile Leu 1040 1045 1050 Leu Asn Lys His Ile Asp Ala Tyr Lys Thr Phe Pro Pro Thr Glu 1055 1060 1065 Pro Lys Lys Asp Lys Lys Lys Lys Ala Asp Glu Thr Gln Ala Leu 1070 1075 1080 Pro Gln Arg Gln Lys Lys Gln Gln Thr Val Thr Leu Leu Pro Ala 1085 1090 1095 Ala Asp Leu Asp Asp Phe Ser Lys Gln Leu Gln Gln Ser Met Ser 1100 1105 1110 Ser Ala Asp Ser Thr Gln Ala 1115 1120 <210> 67 <211> 1120 <212> PRT <213> Artificial Sequence <220> <223> OC2.3 (K417N, N439K, E484K, N501Y) polypeptide sequence <220> <221> IgE-leader <222> (1)..(18) <220> <221> RBDv2-K417N,N439K,E484K,N501Y <222> (20)..(457) <220> <221> P2A <222> (458)..(479) <220> <221> M <222> (480)..(701) <220> <221> NP <222> (702)..(1120) <400> 67 Met Asp Trp Thr Trp Ile Leu Phe Leu Val Ala Ala Ala Thr Arg Val 1 5 10 15 His Ser Ala Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn 20 25 30 Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe 35 40 45 Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala 50 55 60 Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys 65 70 75 80 Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val 85 90 95 Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala 100 105 110 Pro Gly Gln Thr Gly Asn Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp 115 120 125 Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Lys Leu Asp Ser 130 135 140 Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser 145 150 155 160 Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala 165 170 175 Gly Ser Thr Pro Cys Asn Gly Val Lys Gly Phe Asn Cys Tyr Phe Pro 180 185 190 Leu Gln Ser Tyr Gly Phe Gln Pro Thr Tyr Gly Val Gly Tyr Gln Pro 195 200 205 Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr 210 215 220 Val Cys Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Arg Val 225 230 235 240 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 245 250 255 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 260 265 270 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 275 280 285 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 290 295 300 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 305 310 315 320 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 325 330 335 Asn Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 340 345 350 Val Ile Ala Trp Asn Ser Asn Lys Leu Asp Ser Lys Val Gly Gly Asn 355 360 365 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 370 375 380 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 385 390 395 400 Asn Gly Val Lys Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 405 410 415 Phe Gln Pro Thr Tyr Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 420 425 430 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 435 440 445 Lys Ser Thr Asn Leu Val Lys Asn Lys Gly Ser Gly Ala Thr Asn Phe 450 455 460 Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Met 465 470 475 480 Ala Asp Ser Asn Gly Thr Ile Thr Val Glu Glu Leu Lys Lys Leu Leu 485 490 495 Glu Gln Trp Asn Leu Val Ile Gly Phe Leu Phe Leu Thr Trp Ile Cys 500 505 510 Leu Leu Gln Phe Ala Tyr Ala Asn Arg Asn Arg Phe Leu Tyr Ile Ile 515 520 525 Lys Leu Ile Phe Leu Trp Leu Leu Trp Pro Val Thr Leu Ala Cys Phe 530 535 540 Val Leu Ala Ala Val Tyr Arg Ile Asn Trp Ile Thr Gly Gly Ile Ala 545 550 555 560 Ile Ala Met Ala Cys Leu Val Gly Leu Met Trp Leu Ser Tyr Phe Ile 565 570 575 Ala Ser Phe Arg Leu Phe Ala Arg Thr Arg Ser Met Trp Ser Phe Asn 580 585 590 Pro Glu Thr Asn Ile Leu Leu Asn Val Pro Leu His Gly Thr Ile Leu 595 600 605 Thr Arg Pro Leu Leu Glu Ser Glu Leu Val Ile Gly Ala Val Ile Leu 610 615 620 Arg Gly His Leu Arg Ile Ala Gly His His Leu Gly Arg Cys Asp Ile 625 630 635 640 Lys Asp Leu Pro Lys Glu Ile Thr Val Ala Thr Ser Arg Thr Leu Ser 645 650 655 Tyr Tyr Lys Leu Gly Ala Ser Gln Arg Val Ala Gly Asp Ser Gly Phe 660 665 670 Ala Ala Tyr Ser Arg Tyr Arg Ile Gly Asn Tyr Lys Leu Asn Thr Asp 675 680 685 His Ser Ser Ser Ser Asp Asn Ile Ala Leu Leu Val Gln Ala Ser Asp 690 695 700 Asn Gly Pro Gln Asn Gln Arg Asn Ala Pro Arg Ile Thr Phe Gly Gly 705 710 715 720 Pro Ser Asp Ser Thr Gly Ser Asn Gln Asn Gly Glu Arg Ser Gly Ala 725 730 735 Arg Ser Lys Gln Arg Arg Pro Gln Gly Leu Pro Asn Asn Thr Ala Ser 740 745 750 Trp Phe Thr Ala Leu Thr Gln His Gly Lys Glu Asp Leu Lys Phe Pro 755 760 765 Arg Gly Gln Gly Val Pro Ile Asn Thr Asn Ser Ser Pro Asp Asp Gln 770 775 780 Ile Gly Tyr Tyr Arg Arg Ala Thr Arg Arg Ile Arg Gly Gly Asp Gly 785 790 795 800 Lys Met Lys Asp Leu Ser Pro Arg Trp Tyr Phe Tyr Tyr Leu Gly Thr 805 810 815 Gly Pro Glu Ala Gly Leu Pro Tyr Gly Ala Asn Lys Asp Gly Ile Ile 820 825 830 Trp Val Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys Asp His Ile Gly 835 840 845 Thr Arg Asn Pro Ala Asn Asn Ala Ala Ile Val Leu Gln Leu Pro Gln 850 855 860 Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala Glu Gly Ser Arg Gly Gly 865 870 875 880 Ser Gln Ala Ser Ser Arg Ser Ser Ser Arg Ser Arg Asn Ser Ser Arg 885 890 895 Asn Ser Thr Pro Gly Ser Ser Arg Gly Thr Ser Pro Ala Arg Met Ala 900 905 910 Gly Asn Gly Gly Asp Ala Ala Leu Ala Leu Leu Leu Leu Asp Arg Leu 915 920 925 Asn Gln Leu Glu Ser Lys Met Ser Gly Lys Gly Gln Gln Gln Gln Gly 930 935 940 Gln Thr Val Thr Lys Lys Ser Ala Ala Glu Ala Ser Lys Lys Pro Arg 945 950 955 960 Gln Lys Arg Thr Ala Thr Lys Ala Tyr Asn Val Thr Gln Ala Phe Gly 965 970 975 Arg Arg Gly Pro Glu Gln Thr Gln Gly Asn Phe Gly Asp Gln Glu Leu 980 985 990 Ile Arg Gln Gly Thr Asp Tyr Lys His Trp Pro Gln Ile Ala Gln Phe 995 1000 1005 Ala Pro Ser Ala Ser Ala Phe Phe Gly Met Ser Arg Ile Gly Met 1010 1015 1020 Glu Val Thr Pro Ser Gly Thr Trp Leu Thr Tyr Thr Gly Ala Ile 1025 1030 1035 Lys Leu Asp Asp Lys Asp Pro Asn Phe Lys Asp Gln Val Ile Leu 1040 1045 1050 Leu Asn Lys His Ile Asp Ala Tyr Lys Thr Phe Pro Pro Thr Glu 1055 1060 1065 Pro Lys Lys Asp Lys Lys Lys Lys Ala Asp Glu Thr Gln Ala Leu 1070 1075 1080 Pro Gln Arg Gln Lys Lys Gln Gln Thr Val Thr Leu Leu Pro Ala 1085 1090 1095 Ala Asp Leu Asp Asp Phe Ser Lys Gln Leu Gln Gln Ser Met Ser 1100 1105 1110 Ser Ala Asp Ser Thr Gln Ala 1115 1120 <210> 68 <211> 1339 <212> PRT <213> Artificial Sequence <220> <223> OC2.4 polypeptide sequence <220> <221> IgE-leader <222> (1)..(18) <220> <221> RBD-WT <222> (20)..(238) <220> <221> RBD-N439K,N501Y <222> (239)..(457) <220> <221> RBD-K417N,E484K,N501Y <222> (458)..(676) <220> <221> P2A <222> (677)..(698) <220> <221> M <222> (699)..(920) <220> <221> NP <222> (921)..(1339) <400> 68 Met Asp Trp Thr Trp Ile Leu Phe Leu Val Ala Ala Ala Thr Arg Val 1 5 10 15 His Ser Ala Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn 20 25 30 Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe 35 40 45 Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala 50 55 60 Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys 65 70 75 80 Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val 85 90 95 Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala 100 105 110 Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp 115 120 125 Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser 130 135 140 Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser 145 150 155 160 Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala 165 170 175 Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro 180 185 190 Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro 195 200 205 Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr 210 215 220 Val Cys Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Arg Val 225 230 235 240 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 245 250 255 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 260 265 270 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 275 280 285 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 290 295 300 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 305 310 315 320 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 325 330 335 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 340 345 350 Val Ile Ala Trp Asn Ser Asn Lys Leu Asp Ser Lys Val Gly Gly Asn 355 360 365 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 370 375 380 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 385 390 395 400 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 405 410 415 Phe Gln Pro Thr Tyr Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 420 425 430 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 435 440 445 Lys Ser Thr Asn Leu Val Lys Asn Lys Arg Val Gln Pro Thr Glu Ser 450 455 460 Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val 465 470 475 480 Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg 485 490 495 Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser 500 505 510 Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp 515 520 525 Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp 530 535 540 Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Asn Ile Ala Asp Tyr 545 550 555 560 Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn 565 570 575 Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr 580 585 590 Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser 595 600 605 Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Lys Gly 610 615 620 Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Tyr 625 630 635 640 Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu 645 650 655 Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Asn Leu 660 665 670 Val Lys Asn Lys Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln 675 680 685 Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Met Ala Asp Ser Asn Gly 690 695 700 Thr Ile Thr Val Glu Glu Leu Lys Lys Leu Leu Glu Gln Trp Asn Leu 705 710 715 720 Val Ile Gly Phe Leu Phe Leu Thr Trp Ile Cys Leu Leu Gln Phe Ala 725 730 735 Tyr Ala Asn Arg Asn Arg Phe Leu Tyr Ile Ile Lys Leu Ile Phe Leu 740 745 750 Trp Leu Leu Trp Pro Val Thr Leu Ala Cys Phe Val Leu Ala Ala Val 755 760 765 Tyr Arg Ile Asn Trp Ile Thr Gly Gly Ile Ala Ile Ala Met Ala Cys 770 775 780 Leu Val Gly Leu Met Trp Leu Ser Tyr Phe Ile Ala Ser Phe Arg Leu 785 790 795 800 Phe Ala Arg Thr Arg Ser Met Trp Ser Phe Asn Pro Glu Thr Asn Ile 805 810 815 Leu Leu Asn Val Pro Leu His Gly Thr Ile Leu Thr Arg Pro Leu Leu 820 825 830 Glu Ser Glu Leu Val Ile Gly Ala Val Ile Leu Arg Gly His Leu Arg 835 840 845 Ile Ala Gly His His Leu Gly Arg Cys Asp Ile Lys Asp Leu Pro Lys 850 855 860 Glu Ile Thr Val Ala Thr Ser Arg Thr Leu Ser Tyr Tyr Lys Leu Gly 865 870 875 880 Ala Ser Gln Arg Val Ala Gly Asp Ser Gly Phe Ala Ala Tyr Ser Arg 885 890 895 Tyr Arg Ile Gly Asn Tyr Lys Leu Asn Thr Asp His Ser Ser Ser Ser 900 905 910 Asp Asn Ile Ala Leu Leu Val Gln Ala Ser Asp Asn Gly Pro Gln Asn 915 920 925 Gln Arg Asn Ala Pro Arg Ile Thr Phe Gly Gly Pro Ser Asp Ser Thr 930 935 940 Gly Ser Asn Gln Asn Gly Glu Arg Ser Gly Ala Arg Ser Lys Gln Arg 945 950 955 960 Arg Pro Gln Gly Leu Pro Asn Asn Thr Ala Ser Trp Phe Thr Ala Leu 965 970 975 Thr Gln His Gly Lys Glu Asp Leu Lys Phe Pro Arg Gly Gln Gly Val 980 985 990 Pro Ile Asn Thr Asn Ser Ser Pro Asp Asp Gln Ile Gly Tyr Tyr Arg 995 1000 1005 Arg Ala Thr Arg Arg Ile Arg Gly Gly Asp Gly Lys Met Lys Asp 1010 1015 1020 Leu Ser Pro Arg Trp Tyr Phe Tyr Tyr Leu Gly Thr Gly Pro Glu 1025 1030 1035 Ala Gly Leu Pro Tyr Gly Ala Asn Lys Asp Gly Ile Ile Trp Val 1040 1045 1050 Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys Asp His Ile Gly Thr 1055 1060 1065 Arg Asn Pro Ala Asn Asn Ala Ala Ile Val Leu Gln Leu Pro Gln 1070 1075 1080 Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala Glu Gly Ser Arg Gly 1085 1090 1095 Gly Ser Gln Ala Ser Ser Arg Ser Ser Ser Arg Ser Arg Asn Ser 1100 1105 1110 Ser Arg Asn Ser Thr Pro Gly Ser Ser Arg Gly Thr Ser Pro Ala 1115 1120 1125 Arg Met Ala Gly Asn Gly Gly Asp Ala Ala Leu Ala Leu Leu Leu 1130 1135 1140 Leu Asp Arg Leu Asn Gln Leu Glu Ser Lys Met Ser Gly Lys Gly 1145 1150 1155 Gln Gln Gln Gln Gly Gln Thr Val Thr Lys Lys Ser Ala Ala Glu 1160 1165 1170 Ala Ser Lys Lys Pro Arg Gln Lys Arg Thr Ala Thr Lys Ala Tyr 1175 1180 1185 Asn Val Thr Gln Ala Phe Gly Arg Arg Gly Pro Glu Gln Thr Gln 1190 1195 1200 Gly Asn Phe Gly Asp Gln Glu Leu Ile Arg Gln Gly Thr Asp Tyr 1205 1210 1215 Lys His Trp Pro Gln Ile Ala Gln Phe Ala Pro Ser Ala Ser Ala 1220 1225 1230 Phe Phe Gly Met Ser Arg Ile Gly Met Glu Val Thr Pro Ser Gly 1235 1240 1245 Thr Trp Leu Thr Tyr Thr Gly Ala Ile Lys Leu Asp Asp Lys Asp 1250 1255 1260 Pro Asn Phe Lys Asp Gln Val Ile Leu Leu Asn Lys His Ile Asp 1265 1270 1275 Ala Tyr Lys Thr Phe Pro Pro Thr Glu Pro Lys Lys Asp Lys Lys 1280 1285 1290 Lys Lys Ala Asp Glu Thr Gln Ala Leu Pro Gln Arg Gln Lys Lys 1295 1300 1305 Gln Gln Thr Val Thr Leu Leu Pro Ala Ala Asp Leu Asp Asp Phe 1310 1315 1320 Ser Lys Gln Leu Gln Gln Ser Met Ser Ser Ala Asp Ser Thr Gln 1325 1330 1335 Ala <210> 69 <211> 899 <212> PRT <213> Artificial Sequence <220> <223> SVF-14 polypeptide sequence <220> <221> IgE-leader <222> (1)..(18) <220> <221> RBDv2-WT <222> (20)..(457) <220> <221> P2A <222> (458)..(479) <220> <221> NP <222> (480)..(899) <400> 69 Met Asp Trp Thr Trp Ile Leu Phe Leu Val Ala Ala Ala Thr Arg Val 1 5 10 15 His Ser Ala Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn 20 25 30 Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe 35 40 45 Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala 50 55 60 Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys 65 70 75 80 Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val 85 90 95 Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala 100 105 110 Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp 115 120 125 Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser 130 135 140 Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser 145 150 155 160 Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala 165 170 175 Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro 180 185 190 Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro 195 200 205 Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr 210 215 220 Val Cys Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Arg Val 225 230 235 240 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 245 250 255 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 260 265 270 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 275 280 285 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 290 295 300 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 305 310 315 320 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 325 330 335 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 340 345 350 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 355 360 365 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 370 375 380 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 385 390 395 400 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 405 410 415 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 420 425 430 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 435 440 445 Lys Ser Thr Asn Leu Val Lys Asn Lys Gly Ser Gly Ala Thr Asn Phe 450 455 460 Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Met 465 470 475 480 Ala Ser Asp Asn Gly Pro Gln Asn Gln Arg Asn Ala Pro Arg Ile Thr 485 490 495 Phe Gly Gly Pro Ser Asp Ser Thr Gly Ser Asn Gln Asn Gly Glu Arg 500 505 510 Ser Gly Ala Arg Ser Lys Gln Arg Arg Pro Gln Gly Leu Pro Asn Asn 515 520 525 Thr Ala Ser Trp Phe Thr Ala Leu Thr Gln His Gly Lys Glu Asp Leu 530 535 540 Lys Phe Pro Arg Gly Gln Gly Val Pro Ile Asn Thr Asn Ser Ser Pro 545 550 555 560 Asp Asp Gln Ile Gly Tyr Tyr Arg Arg Ala Thr Arg Arg Ile Arg Gly 565 570 575 Gly Asp Gly Lys Met Lys Asp Leu Ser Pro Arg Trp Tyr Phe Tyr Tyr 580 585 590 Leu Gly Thr Gly Pro Glu Ala Gly Leu Pro Tyr Gly Ala Asn Lys Asp 595 600 605 Gly Ile Ile Trp Val Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys Asp 610 615 620 His Ile Gly Thr Arg Asn Pro Ala Asn Asn Ala Ala Ile Val Leu Gln 625 630 635 640 Leu Pro Gln Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala Glu Gly Ser 645 650 655 Arg Gly Gly Ser Gln Ala Ser Ser Arg Ser Ser Ser Arg Ser Arg Asn 660 665 670 Ser Ser Arg Asn Ser Thr Pro Gly Ser Ser Arg Gly Thr Ser Pro Ala 675 680 685 Arg Met Ala Gly Asn Gly Gly Asp Ala Ala Leu Ala Leu Leu Leu Leu 690 695 700 Asp Arg Leu Asn Gln Leu Glu Ser Lys Met Ser Gly Lys Gly Gln Gln 705 710 715 720 Gln Gln Gly Gln Thr Val Thr Lys Lys Ser Ala Ala Glu Ala Ser Lys 725 730 735 Lys Pro Arg Gln Lys Arg Thr Ala Thr Lys Ala Tyr Asn Val Thr Gln 740 745 750 Ala Phe Gly Arg Arg Gly Pro Glu Gln Thr Gln Gly Asn Phe Gly Asp 755 760 765 Gln Glu Leu Ile Arg Gln Gly Thr Asp Tyr Lys His Trp Pro Gln Ile 770 775 780 Ala Gln Phe Ala Pro Ser Ala Ser Ala Phe Phe Gly Met Ser Arg Ile 785 790 795 800 Gly Met Glu Val Thr Pro Ser Gly Thr Trp Leu Thr Tyr Thr Gly Ala 805 810 815 Ile Lys Leu Asp Asp Lys Asp Pro Asn Phe Lys Asp Gln Val Ile Leu 820 825 830 Leu Asn Lys His Ile Asp Ala Tyr Lys Thr Phe Pro Pro Thr Glu Pro 835 840 845 Lys Lys Asp Lys Lys Lys Lys Ala Asp Glu Thr Gln Ala Leu Pro Gln 850 855 860 Arg Gln Lys Lys Gln Gln Thr Val Thr Leu Leu Pro Ala Ala Asp Leu 865 870 875 880 Asp Asp Phe Ser Lys Gln Leu Gln Gln Ser Met Ser Ser Ala Asp Ser 885 890 895 Thr Gln Ala <210> 70 <211> 1733 <212> PRT <213> Artificial Sequence <220> <223> SVF-15 polypeptide sequence <220> <221> IgE-leader <222> (1)..(18) <220> <221> S-protein_K986P,V987P <222> (20)..(1291) <220> <221> P2A <222> (1292)..(1313) <220> <221> NP <222> (1314)..(1733) <400> 70 Met Asp Trp Thr Trp Ile Leu Phe Leu Val Ala Ala Ala Thr Arg Val 1 5 10 15 His Ser Ala Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln 20 25 30 Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn 35 40 45 Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser 50 55 60 Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val 65 70 75 80 Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg 85 90 95 Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser 100 105 110 Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu 115 120 125 Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val 130 135 140 Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly 145 150 155 160 Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg 165 170 175 Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro 180 185 190 Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg 195 200 205 Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys 210 215 220 His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala 225 230 235 240 Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe 245 250 255 Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser 260 265 270 Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu 275 280 285 Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr 290 295 300 Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr 305 310 315 320 Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe 325 330 335 Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn 340 345 350 Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val 355 360 365 Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser 370 375 380 Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val 385 390 395 400 Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp 405 410 415 Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln 420 425 430 Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr 435 440 445 Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly 450 455 460 Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys 465 470 475 480 Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr 485 490 495 Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser 500 505 510 Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val 515 520 525 Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly 530 535 540 Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn 545 550 555 560 Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys 565 570 575 Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp 580 585 590 Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys 595 600 605 Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn 610 615 620 Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val 625 630 635 640 Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr 645 650 655 Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu 660 665 670 His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile 675 680 685 Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser 690 695 700 Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu 705 710 715 720 Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe 725 730 735 Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr 740 745 750 Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser 755 760 765 Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala 770 775 780 Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe 785 790 795 800 Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly 805 810 815 Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys 820 825 830 Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp 835 840 845 Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala 850 855 860 Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro 865 870 875 880 Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu 885 890 895 Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu 900 905 910 Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly 915 920 925 Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln 930 935 940 Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala 945 950 955 960 Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala 965 970 975 Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser 980 985 990 Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu 995 1000 1005 Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln 1010 1015 1020 Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala 1025 1030 1035 Ser Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly 1040 1045 1050 Gln Ser Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met 1055 1060 1065 Ser Phe Pro Gln Ser Ala Pro His Gly Val Val Phe Leu His Val 1070 1075 1080 Thr Tyr Val Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala 1085 1090 1095 Ile Cys His Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe 1100 1105 1110 Val Ser Asn Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr 1115 1120 1125 Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn 1130 1135 1140 Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro 1145 1150 1155 Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr 1160 1165 1170 Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser 1175 1180 1185 Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg 1190 1195 1200 Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu 1205 1210 1215 Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr 1220 1225 1230 Ile Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val 1235 1240 1245 Thr Ile Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys 1250 1255 1260 Gly Cys Cys Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp 1265 1270 1275 Ser Glu Pro Val Leu Lys Gly Val Lys Leu His Tyr Thr Gly Ser 1280 1285 1290 Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu 1295 1300 1305 Glu Asn Pro Gly Pro Met Ala Ser Asp Asn Gly Pro Gln Asn Gln 1310 1315 1320 Arg Asn Ala Pro Arg Ile Thr Phe Gly Gly Pro Ser Asp Ser Thr 1325 1330 1335 Gly Ser Asn Gln Asn Gly Glu Arg Ser Gly Ala Arg Ser Lys Gln 1340 1345 1350 Arg Arg Pro Gln Gly Leu Pro Asn Asn Thr Ala Ser Trp Phe Thr 1355 1360 1365 Ala Leu Thr Gln His Gly Lys Glu Asp Leu Lys Phe Pro Arg Gly 1370 1375 1380 Gln Gly Val Pro Ile Asn Thr Asn Ser Ser Pro Asp Asp Gln Ile 1385 1390 1395 Gly Tyr Tyr Arg Arg Ala Thr Arg Arg Ile Arg Gly Gly Asp Gly 1400 1405 1410 Lys Met Lys Asp Leu Ser Pro Arg Trp Tyr Phe Tyr Tyr Leu Gly 1415 1420 1425 Thr Gly Pro Glu Ala Gly Leu Pro Tyr Gly Ala Asn Lys Asp Gly 1430 1435 1440 Ile Ile Trp Val Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys Asp 1445 1450 1455 His Ile Gly Thr Arg Asn Pro Ala Asn Asn Ala Ala Ile Val Leu 1460 1465 1470 Gln Leu Pro Gln Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala Glu 1475 1480 1485 Gly Ser Arg Gly Gly Ser Gln Ala Ser Ser Arg Ser Ser Ser Arg 1490 1495 1500 Ser Arg Asn Ser Ser Arg Asn Ser Thr Pro Gly Ser Ser Arg Gly 1505 1510 1515 Thr Ser Pro Ala Arg Met Ala Gly Asn Gly Gly Asp Ala Ala Leu 1520 1525 1530 Ala Leu Leu Leu Leu Asp Arg Leu Asn Gln Leu Glu Ser Lys Met 1535 1540 1545 Ser Gly Lys Gly Gln Gln Gln Gln Gly Gln Thr Val Thr Lys Lys 1550 1555 1560 Ser Ala Ala Glu Ala Ser Lys Lys Pro Arg Gln Lys Arg Thr Ala 1565 1570 1575 Thr Lys Ala Tyr Asn Val Thr Gln Ala Phe Gly Arg Arg Gly Pro 1580 1585 1590 Glu Gln Thr Gln Gly Asn Phe Gly Asp Gln Glu Leu Ile Arg Gln 1595 1600 1605 Gly Thr Asp Tyr Lys His Trp Pro Gln Ile Ala Gln Phe Ala Pro 1610 1615 1620 Ser Ala Ser Ala Phe Phe Gly Met Ser Arg Ile Gly Met Glu Val 1625 1630 1635 Thr Pro Ser Gly Thr Trp Leu Thr Tyr Thr Gly Ala Ile Lys Leu 1640 1645 1650 Asp Asp Lys Asp Pro Asn Phe Lys Asp Gln Val Ile Leu Leu Asn 1655 1660 1665 Lys His Ile Asp Ala Tyr Lys Thr Phe Pro Pro Thr Glu Pro Lys 1670 1675 1680 Lys Asp Lys Lys Lys Lys Ala Asp Glu Thr Gln Ala Leu Pro Gln 1685 1690 1695 Arg Gln Lys Lys Gln Gln Thr Val Thr Leu Leu Pro Ala Ala Asp 1700 1705 1710 Leu Asp Asp Phe Ser Lys Gln Leu Gln Gln Ser Met Ser Ser Ala 1715 1720 1725 Asp Ser Thr Gln Ala 1730 <210> 71 <211> 3842 <212> DNA <213> Artificial Sequence <220> <223> SVF-13 (OC-13) codon optimized DNA sequence (S protein) <400> 71 ggatccgcac catgtttgtc tttctggtcc tgctgcccct ggtctcatca cagtgcgtca 60 acctgactac acgaacccag ctgccacctg cttatacaaa ttccttcacc cggggcgtgt 120 actatcctga caaggtgttt agaagctccg tgctgcactc tacacaggat ctgtttctgc 180 cattctttag caacgtgacc tggttccacg ccatccacgt gagcggcacc aatggcacaa 240 agcggttcga caatcccgtg ctgcctttta acgatggcgt gtacttcgcc tctaccgaga 300 agagcaacat catcagaggc tggatctttg gcaccacact ggactccaag acacagtctc 360 tgctgatcgt gaacaatgcc accaacgtgg tcatcaaggt gtgcgagttc cagttttgta 420 atgatccctt cctgggcgtg tactatcaca agaacaataa gagctggatg gagtccgagt 480 ttagagtgta ttctagcgcc aacaattgca catttgagta cgtgtcccag cctttcctga 540 tggacctgga gggcaagcag ggcaatttca agaacctgag ggagttcgtg tttaagaata 600 tcgatggcta cttcaagatc tactctaagc acacccccat caacctggtg cgcgacctgc 660 ctcagggctt cagcgccctg gagccactgg tggatctgcc tatcggcatc aacatcaccc 720 ggtttcagac actgctggcc ctgcacagaa gctacctgac acccggcgac tcctctagcg 780 gatggaccgc aggagcagca gcctactatg tgggctatct gcagcctagg accttcctgc 840 tgaagtacaa cgagaatggc accatcacag acgcagtgga ttgcgccctg gaccccctga 900 gcgagacaaa gtgtacactg aagtccttta ccgtggagaa gggcatctat cagacatcca 960 atttcagggt gcagccaacc gagtctatcg tgcgctttcc taatatcaca aacctgtgcc 1020 catttggcga ggtgttcaac gcaaccaggt tcgcaagcgt gtacgcatgg aataggaagc 1080 gcatctctaa ctgcgtggcc gactatagcg tgctgtacaa ctccgcctct ttcagcacct 1140 ttaagtgcta tggcgtgtcc cccacaaagc tgaatgacct gtgctttacc aacgtgtacg 1200 ccgattcttt cgtgatcagg ggcgacgagg tgcgccagat cgcacctgga cagacaggca 1260 agatcgccga ctacaattat aagctgccag acgatttcac cggctgcgtg atcgcctgga 1320 acagcaacaa tctggattcc aaagtgggcg gcaactacaa ttatctgtac cggctgttta 1380 gaaagagcaa tctgaagccc ttcgagaggg acatctctac agagatctac caggccggca 1440 gcaccccttg caatggcgtg gagggcttta actgttattt cccactgcag tcctacggct 1500 tccagcccac aaacggcgtg ggctatcagc cttaccgcgt ggtggtgctg agctttgagc 1560 tgctgcacgc accagcaaca gtgtgcggac ccaagaagtc caccaatctg gtgaagaaca 1620 agtgcgtgaa cttcaacttc aacggcctga ccggaacagg cgtgctgacc gagtccaaca 1680 agaagttcct gccatttcag cagttcggca gggacatcgc agataccaca gacgccgtgc 1740 gcgacccaca gaccctggag atcctggata tcacaccctg ctctttcggc ggcgtgagcg 1800 tgatcacacc aggaaccaat acaagcaacc aggtggccgt gctgtatcag gacgtgaatt 1860 gtaccgaggt gcctgtggcc atccacgccg atcagctgac cccaacatgg cgggtgtaca 1920 gcaccggctc caacgtgttc cagacaagag caggatgcct gatcggagca gagcacgtga 1980 acaattccta tgagtgcgac atcccaatcg gcgccggcat ctgtgcctct taccagaccc 2040 agacaaactc tccaaggaga gcacggagcg tggcatccca gtctatcatc gcctatacca 2100 tgtccctggg cgccgagaat tctgtggcct actctaacaa tagcatcgcc atcccaacca 2160 acttcacaat ctctgtgacc acagagatcc tgcccgtgtc catgaccaag acatctgtgg 2220 actgcacaat gtatatctgt ggcgattcta ccgagtgcag caacctgctg ctgcagtacg 2280 gcagcttttg tacccagctg aatagagccc tgacaggcat cgccgtggag caggataaga 2340 acacacagga ggtgttcgcc caggtgaagc agatctacaa gaccccccct atcaaggact 2400 ttggcggctt caatttttcc cagatcctgc ctgatccatc caagccttct aagcggagct 2460 ttatcgagga cctgctgttc aacaaggtga ccctggccga tgccggcttc atcaagcagt 2520 atggcgattg cctgggcgac atcgcagcac gggacctgat ctgtgcccag aagtttaatg 2580 gcctgaccgt gctgccaccc ctgctgacag atgagatgat cgcacagtac acaagcgccc 2640 tgctggcagg aaccatcaca tccggatgga ccttcggcgc aggagccgcc ctgcagatcc 2700 cctttgccat gcagatggcc tataggttca acggcatcgg cgtgacccag aatgtgctgt 2760 acgagaacca gaagctgatc gccaatcagt ttaactccgc catcggcaag atccaggaca 2820 gcctgtcctc tacagcctcc gccctgggca agctgcagga tgtggtgaat cagaacgccc 2880 aggccctgaa taccctggtg aagcagctga gctccaactt cggcgccatc tctagcgtgc 2940 tgaatgatat cctgagccgg ctggacaagg tggaggcaga ggtgcagatc gaccggctga 3000 tcacaggcag actgcagtct ctgcagacct atgtgacaca gcagctgatc agggcagcag 3060 agatcagggc aagcgccaat ctggcagcaa ccaagatgtc cgagtgcgtg ctgggccagt 3120 ctaagagagt ggacttttgt ggcaagggct atcacctgat gtccttccct cagtctgccc 3180 cacacggcgt ggtgtttctg cacgtgacct acgtgcccgc ccaggagaag aacttcacca 3240 cagcccctgc catctgccac gatggcaagg cccactttcc aagggagggc gtgttcgtgt 3300 ccaacggcac ccactggttt gtgacacagc gcaatttcta cgagccccag atcatcacca 3360 cagacaatac cttcgtgagc ggcaactgtg acgtggtcat cggcatcgtg aacaataccg 3420 tgtatgatcc actgcagccc gagctggaca gctttaagga ggagctggat aagtacttca 3480 agaatcacac ctcccctgac gtggatctgg gcgacatcag cggcatcaat gcctccgtgg 3540 tgaacatcca gaaggagatc gaccgcctga acgaggtggc caagaatctg aacgagagcc 3600 tgatcgatct gcaggagctg ggcaagtatg agcagtacat caagtggcca tggtacatct 3660 ggctgggctt catcgccggc ctgatcgcca tcgtgatggt gaccatcatg ctgtgctgta 3720 tgacatcctg ctgttcttgc ctgaagggct gctgtagctg tggctcctgc tgtaagtttg 3780 atgaggacga ttctgagccc gtgctgaagg gagtgaagct gcattacacc taatagtcta 3840 ga 3842 <210> 72 <211> 1273 <212> PRT <213> Artificial Sequence <220> <223> SVF-13 (OC-13) polypeptide sequence (S protein) <400> 72 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile 885 890 895 Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 1010 1015 1020 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys 1025 1030 1035 Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1040 1045 1050 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val 1055 1060 1065 Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His 1070 1075 1080 Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn 1085 1090 1095 Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln 1100 1105 1110 Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val 1115 1120 1125 Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro 1130 1135 1140 Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn 1145 1150 1155 His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn 1160 1165 1170 Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu 1175 1180 1185 Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu 1190 1195 1200 Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu 1205 1210 1215 Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met 1220 1225 1230 Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys 1235 1240 1245 Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro 1250 1255 1260 Val Leu Lys Gly Val Lys Leu His Tyr Thr 1265 1270 <210> 73 <211> 1346 <212> DNA <213> Artificial Sequence <220> <223> SVF-10.2 (OC-10.2) codon optimized DNA sequence <220> <221> BamH1_restriction_site <222> (1)..(6) <220> <221> Kozak <222> (7)..(15) <220> <221> RBDv2 <222> (12)..(1331) <220> <221> XbaI_restriction_site <222> (1341)..(1346) <400> 73 ggatccgcac catggcccga gtccagccta ctgagtctat tgtccgcttt cctaacatca 60 ctaatctgtg cccttttggc gaggtcttca acgctacacg gtttgcttcc gtgtacgcct 120 ggaatcggaa gagaatctct aactgcgtgg ccgactacag tgtgctgtat aacagcgcct 180 ccttctctac ctttaagtgc tacggcgtgt cccccaccaa actgaatgac ctgtgcttca 240 caaacgtgta tgccgactct tttgtgatcc ggggggatga ggtgagacag attgccccag 300 gacagactgg caagatcgct gactacaatt ataaactgcc cgacgatttc accggctgcg 360 tgatcgcctg gaacagcaac aatctggatt ccaaagtggg cgggaactac aattatctgt 420 accggctgtt cagaaagtcc aatctgaaac cctttgagag ggacatcagt actgaaatct 480 accaggccgg gtcaacccct tgcaatgggg tggagggatt caactgttac tttccactgc 540 agagttatgg atttcagccc accaacggag tgggctacca gccttatcgc gtggtggtgc 600 tgtctttcga actgctgcac gctccagcta cagtgtgcgg acccaagaaa tcaactaacc 660 tggtgaagaa caagcgggtg cagcctactg agagcatcgt gagatttcct aacattacca 720 atctgtgccc attcggcgaa gtgtttaatg ctacaagatt cgccagcgtg tacgcttgga 780 ataggaagcg catctcaaat tgcgtggctg actacagcgt gctgtataac agtgcttcat 840 tcagcacttt taagtgctac ggagtgagtc caactaaact gaatgacctg tgctttacca 900 acgtgtatgc tgactcattt gtgattaggg gcgatgaggt gcgccagatc gctcctggcc 960 agacagggaa gattgctgac tataattaca aactgccaga cgatttcact ggatgcgtga 1020 ttgcctggaa ctctaacaat ctggatagta aagtgggagg caactataat tacctgtata 1080 ggctgttccg caagtctaat ctgaaaccat ttgagcggga catcagcacc gagatctacc 1140 aggccggctc caccccctgc aatggagtgg agggcttcaa ctgctatttt ccactgcaga 1200 gctatgggtt tcagcccaca aacggggtgg gataccagcc ttatagagtg gtggtgctgt 1260 ccttcgaact gctgcatgcc cctgctacag tgtgcggccc aaagaaatct accaacctgg 1320 tcaagaacaa gtaataatag tctaga 1346 <210> 74 <211> 440 <212> PRT <213> Artificial Sequence <220> <223> SVF-10.2 (OC-10.2) polypeptide sequence <220> <221> RBDv2 <222> (1)..(440) <400> 74 Met Ala Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile 1 5 10 15 Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala 20 25 30 Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp 35 40 45 Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr 50 55 60 Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr 65 70 75 80 Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro 85 90 95 Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp 100 105 110 Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys 115 120 125 Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn 130 135 140 Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly 145 150 155 160 Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu 165 170 175 Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr 180 185 190 Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val 195 200 205 Cys Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Arg Val Gln 210 215 220 Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro 225 230 235 240 Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp 245 250 255 Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr 260 265 270 Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr 275 280 285 Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val 290 295 300 Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys 305 310 315 320 Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val 325 330 335 Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr 340 345 350 Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu 355 360 365 Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn 370 375 380 Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe 385 390 395 400 Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu 405 410 415 Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys 420 425 430 Ser Thr Asn Leu Val Lys Asn Lys 435 440 <210> 75 <211> 1397 <212> DNA <213> Artificial Sequence <220> <223> SVF-10.3 (OC-10.3) codon optimized DNA sequence <220> <221> BamHI_restriction_site <222> (1)..(6) <220> <221> Kozak <222> (7)..(15) <220> <221> IgE-leader <222> (12)..(65) <220> <221> RBDv2 <222> (69)..(1382) <220> <221> XbaI_restriction_site <222> (1392)..(1397) <400> 75 ggatccgcac catggactgg acctggattc tgttcctggt ggccgccgcc acacgggtgc 60 acagcgcccg agtccagcct actgagtcta ttgtccgctt tcctaacatc actaatctgt 120 gcccttttgg cgaggtcttc aacgctacac ggtttgcttc cgtgtacgcc tggaatcgga 180 agagaatctc taactgcgtg gccgactaca gtgtgctgta taacagcgcc tccttctcta 240 cctttaagtg ctacggcgtg tcccccacca aactgaatga cctgtgcttc acaaacgtgt 300 atgccgactc ttttgtgatc cggggggatg aggtgagaca gattgcccca ggacagactg 360 gcaagatcgc tgactacaat tataaactgc ccgacgattt caccggctgc gtgatcgcct 420 ggaacagcaa caatctggat tccaaagtgg gcgggaacta caattatctg taccggctgt 480 tcagaaagtc caatctgaaa ccctttgaga gggacatcag tactgaaatc taccaggccg 540 ggtcaacccc ttgcaatggg gtggagggat tcaactgtta ctttccactg cagagttatg 600 gatttcagcc caccaacgga gtgggctacc agccttatcg cgtggtggtg ctgtctttcg 660 aactgctgca cgctccagct acagtgtgcg gacccaagaa atcaactaac ctggtgaaga 720 acaagcgggt gcagcctact gagagcatcg tgagatttcc taacattacc aatctgtgcc 780 cattcggcga agtgtttaat gctacaagat tcgccagcgt gtacgcttgg aataggaagc 840 gcatctcaaa ttgcgtggct gactacagcg tgctgtataa cagtgcttca ttcagcactt 900 ttaagtgcta cggagtgagt ccaactaaac tgaatgacct gtgctttacc aacgtgtatg 960 ctgactcatt tgtgattagg ggcgatgagg tgcgccagat cgctcctggc cagacaggga 1020 agattgctga ctataattac aaactgccag acgatttcac tggatgcgtg attgcctgga 1080 actctaacaa tctggatagt aaagtgggag gcaactataa ttacctgtat aggctgttcc 1140 gcaagtctaa tctgaaacca tttgagcggg acatcagcac cgagatctac caggccggct 1200 ccaccccctg caatggagtg gagggcttca actgctattt tccactgcag agctatgggt 1260 ttcagcccac aaacggggtg ggataccagc cttatagagt ggtggtgctg tccttcgaac 1320 tgctgcatgc ccctgctaca gtgtgcggcc caaagaaatc taccaacctg gtcaagaaca 1380 agtaataata gtctaga 1397 <210> 76 <211> 457 <212> PRT <213> Artificial Sequence <220> <223> SVF-10.3 (OC-10.3) polypeptide sequence <220> <221> IgE-leader <222> (1)..(18) <220> <221> RBDv2 <222> (20)..(457) <400> 76 Met Asp Trp Thr Trp Ile Leu Phe Leu Val Ala Ala Ala Thr Arg Val 1 5 10 15 His Ser Ala Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn 20 25 30 Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe 35 40 45 Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala 50 55 60 Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys 65 70 75 80 Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val 85 90 95 Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala 100 105 110 Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp 115 120 125 Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser 130 135 140 Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser 145 150 155 160 Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala 165 170 175 Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro 180 185 190 Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro 195 200 205 Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr 210 215 220 Val Cys Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Arg Val 225 230 235 240 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 245 250 255 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 260 265 270 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 275 280 285 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 290 295 300 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 305 310 315 320 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 325 330 335 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 340 345 350 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 355 360 365 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 370 375 380 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 385 390 395 400 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 405 410 415 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 420 425 430 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 435 440 445 Lys Ser Thr Asn Leu Val Lys Asn Lys 450 455

Claims (105)

  1. SARS-CoV-2 폴리펩티드를 코딩하는 적어도 하나의 핵산 서열 및 P2A 자가촉매 폴리펩티드 절단 부위를 코딩하는 적어도 하나의 핵산 서열을 포함하는 핵산.
  2. 제1항에 있어서, SARS-CoV-2 폴리펩티드를 코딩하는 적어도 하나의 핵산 서열이 RBD 폴리펩티드를 코딩하는 핵산 서열 및 NP 폴리펩티드를 코딩하는 핵산 서열을 포함하는 것인 핵산.
  3. 제1항 또는 제2항에 있어서, 핵산이 서열식별번호( SEQ ID NO:) 1 또는 13과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 핵산.
  4. 제1항에 있어서, SARS-CoV-2 폴리펩티드를 코딩하는 적어도 하나의 핵산 서열이 RBD 폴리펩티드를 코딩하는 핵산 서열, M 폴리펩티드를 코딩하는 핵산 서열, 및 NP 폴리펩티드를 코딩하는 핵산 서열을 포함하는 것인 핵산.
  5. 제1항, 제2항 및 제4항 중 어느 한 항에 있어서, 핵산이 서열식별번호 2-3, 14, 또는 15 중 어느 하나와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 핵산.
  6. 제4항에 있어서, RBD 폴리펩티드가 RBD 탠덤 반복 단일 쇄 이량체 폴리펩티드인 핵산.
  7. 제6항에 있어서, RBD 탠덤 반복 단일 쇄 이량체 폴리펩티드가 전체 S 단백질 (예컨대, NCBI 수탁 번호 YP_009724390에 제시된 바와 같음) 기준으로 K417N, N439K, E484K, 또는 N501Y 돌연변이, 또는 그의 임의의 조합을 포함하는 것인 핵산.
  8. 제6항 또는 제7항에 있어서, RBD 탠덤 반복 단일 쇄 이량체 폴리펩티드를 코딩하는 핵산 서열이 서열식별번호 45, 또는 47-50 중 어느 하나와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 핵산.
  9. 제6항 내지 제8항 중 어느 한 항에 있어서, 핵산이 서열식별번호 39와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 핵산.
  10. 제1항, 제2항 및 제4항 중 어느 한 항에 있어서, 5' IgE 리더 핵산 서열을 추가로 포함하는 핵산.
  11. 제10항에 있어서, 5' IgE 리더 핵산 서열이 서열식별번호 43과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 핵산.
  12. 제10항 또는 제11항에 있어서, RBD 폴리펩티드가 RBD 탠덤 반복 단일 쇄 이량체 폴리펩티드인 핵산.
  13. 제12항에 있어서, RBD 탠덤 반복 단일 쇄 이량체 폴리펩티드가 전체 S 단백질 (예컨대, NCBI 수탁 번호 YP_009724390에 제시된 바와 같음) 기준으로 K417N, N439K, E484K, 또는 N501Y 돌연변이, 또는 그의 임의의 조합을 포함하는 것인 핵산.
  14. 제12항 또는 제13항에 있어서, RBD 탠덤 반복 단일 쇄 이량체 폴리펩티드를 코딩하는 핵산 서열이 서열식별번호 45, 또는 47-50 중 어느 하나와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 핵산.
  15. 제10항 내지 제14항 중 어느 한 항에 있어서, 핵산이 서열식별번호 40, 57-60, 또는 62 중 어느 하나와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 핵산.
  16. 제10항 또는 제11항에 있어서, RBD 폴리펩티드가 RBD의 3개의 탠덤 카피를 포함하는 것인 핵산.
  17. 제16항에 있어서, RBD의 3개의 탠덤 카피가 각각 전체 S 단백질 (예컨대, NCBI 수탁 번호 YP_009724390에 제시된 바와 같음) 기준으로 K417N, N439K, E484K, 또는 N501Y 돌연변이, 또는 그의 임의의 조합을 포함하거나, 또는 상기 돌연변이 중 어느 것도 포함하지 않는 것인 핵산.
  18. 제16항 또는 제17항에 있어서, 핵산이 서열식별번호 61과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 핵산.
  19. 제1항에 있어서, SARS-CoV-2 폴리펩티드를 코딩하는 적어도 하나의 핵산 서열이 RBD 폴리펩티드를 코딩하는 핵산 서열 및 M 폴리펩티드를 코딩하는 핵산 서열을 포함하는 것인 핵산.
  20. 제1항 또는 제9항에 있어서, 핵산이 서열식별번호 4 또는 16과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 핵산.
  21. 제1항에 있어서, SARS-CoV-2 폴리펩티드를 코딩하는 적어도 하나의 핵산 서열이 스파이크 (S) 폴리펩티드를 코딩하는 핵산 서열, 막 (M) 폴리펩티드를 코딩하는 핵산 서열, 또는 핵단백질 (NP) 폴리펩티드를 코딩하는 핵산 서열, 또는 그의 임의의 조합을 포함하는 것인 핵산.
  22. 제21항에 있어서, S 폴리펩티드가 발현, 가용성, 및/또는 면역원성을 개선시키는 하나 이상의 돌연변이를 포함하는 것인 핵산.
  23. 제21항 또는 제22항에 있어서, S 폴리펩티드가 전체 S 단백질 (예컨대, NCBI 수탁 번호 YP_009724390에 제시된 바와 같음) 기준으로 K968P 또는 V987P 돌연변이, 또는 그 둘 모두를 포함하는 것인 핵산.
  24. 제21항 내지 제23항 중 어느 한 항에 있어서, S 폴리펩티드를 코딩하는 핵산 서열이 서열식별번호 51과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 핵산.
  25. 제21항 내지 제24항 중 어느 한 항에 있어서, 5' IgE 리더 핵산 서열을 추가로 포함하는 핵산.
  26. 제25항에 있어서, 5' IgE 리더 핵산 서열이 서열식별번호 43과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 핵산.
  27. 제21항 내지 제26항 중 어느 한 항에 있어서, 핵산이 서열식별번호 63과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 핵산.
  28. 서열식별번호 5-7, 17-19, 22-24, 73, 또는 75 중 어느 하나와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 SARS-CoV-2 폴리펩티드를 코딩하는 적어도 하나의 핵산 서열을 포함하는 핵산.
  29. SARS-CoV-2 폴리펩티드를 코딩하는 적어도 하나의 핵산 서열 및 D형 간염 항원 (HDAg)을 코딩하는 적어도 하나의 핵산 서열을 포함하는 핵산.
  30. 제29항에 있어서, 핵산이 서열식별번호 8 또는 20과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 핵산.
  31. 제29항에 있어서, P2A 자가촉매 폴리펩티드 절단 부위를 코딩하는 적어도 하나의 핵산 서열을 추가로 포함하는 핵산.
  32. 제29항 또는 제31항에 있어서, 핵산이 서열식별번호 9 또는 21과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 핵산.
  33. 적어도 하나의 SARS-CoV-2 폴리펩티드 서열 및 적어도 하나의 P2A 자가촉매 폴리펩티드 절단 부위를 포함하는 폴리펩티드.
  34. 제33항에 있어서, 적어도 하나의 SARS-CoV-2 폴리펩티드 서열이 RBD 폴리펩티드 서열 및 NP 폴리펩티드 서열을 포함하는 것인 폴리펩티드.
  35. 제33항 또는 제34항에 있어서, 폴리펩티드가 서열식별번호 25와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 폴리펩티드.
  36. 제33항에 있어서, 적어도 하나의 SARS-CoV-2 폴리펩티드 서열이 RBD 폴리펩티드 서열, M 폴리펩티드 서열, 및 NP 폴리펩티드 서열을 포함하는 것인 폴리펩티드.
  37. 제33항, 제34항 및 제36항 중 어느 한 항에 있어서, 폴리펩티드가 서열식별번호 26 또는 27과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 폴리펩티드.
  38. 제36항에 있어서, RBD 폴리펩티드가 RBD 탠덤 반복 단일 쇄 이량체 폴리펩티드인 폴리펩티드.
  39. 제38항에 있어서, RBD 탠덤 반복 단일 쇄 이량체 폴리펩티드가 전체 S 단백질 (예컨대, NCBI 수탁 번호 YP_009724390에 제시된 바와 같음) 기준으로 K417N, N439K, E484K, 또는 N501Y 돌연변이, 또는 그의 임의의 조합을 포함하는 것인 폴리펩티드.
  40. 제38항 또는 제39항에 있어서, RBD 탠덤 반복 단일 쇄 이량체 폴리펩티드가 서열식별번호 46, 또는 52-55 중 어느 하나와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 폴리펩티드.
  41. 제38항 내지 제40항 중 어느 한 항에 있어서, 폴리펩티드가 서열식별번호 41과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 폴리펩티드.
  42. 제33항, 제34항 및 제36항 중 어느 한 항에 있어서, N-말단 IgE 리더 폴리펩티드 서열을 추가로 포함하는 폴리펩티드.
  43. 제42항에 있어서, N-말단 IgE 리더 폴리펩티드 서열이 서열식별번호 44와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 폴리펩티드.
  44. 제42항 또는 제43항에 있어서, RBD 폴리펩티드가 RBD 탠덤 반복 단일 쇄 이량체 폴리펩티드인 폴리펩티드.
  45. 제44항에 있어서, RBD 탠덤 반복 단일 쇄 이량체 폴리펩티드가 전체 S 단백질 (예컨대, NCBI 수탁 번호 YP_009724390에 제시된 바와 같음) 기준으로 K417N, N439K, E484K, 또는 N501Y 돌연변이, 또는 그의 임의의 조합을 포함하는 것인 폴리펩티드.
  46. 제44항 또는 제45항에 있어서, RBD 탠덤 반복 단일 쇄 이량체 폴리펩티드가 서열식별번호 46, 또는 52-55 중 어느 하나와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 폴리펩티드.
  47. 제42항 내지 제46항 중 어느 한 항에 있어서, 폴리펩티드가 서열식별번호 42, 64-67, 또는 69 중 어느 하나와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 폴리펩티드.
  48. 제42항 또는 제43항에 있어서, RBD 폴리펩티드가 RBD의 3개의 탠덤 카피를 포함하는 것인 폴리펩티드.
  49. 제48항에 있어서, RBD의 3개의 탠덤 카피가 각각 전체 S 단백질 (예컨대, NCBI 수탁 번호 YP_009724390에 제시된 바와 같음) 기준으로 K417N, N439K, E484K, 또는 N501Y 돌연변이, 또는 그의 임의의 조합을 포함하거나, 또는 상기 돌연변이 중 어느 것도 포함하지 않는 것인 폴리펩티드.
  50. 제48항 또는 제49항에 있어서, 폴리펩티드가 서열식별번호 68과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 폴리펩티드.
  51. 제33항에 있어서, 적어도 하나의 SARS-CoV-2 폴리펩티드 서열이 RBD 폴리펩티드 서열 및 M 폴리펩티드 서열을 포함하는 것인 폴리펩티드.
  52. 제33항 또는 제51항에 있어서, 폴리펩티드가 서열식별번호 28과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 폴리펩티드.
  53. 제33항에 있어서, 적어도 하나의 SARS-CoV-2 폴리펩티드 서열이 스파이크 (S) 폴리펩티드 및 NP 폴리펩티드를 포함하는 것인 폴리펩티드.
  54. 제52항에 있어서, S 폴리펩티드가 발현, 가용성, 및/또는 면역원성을 개선시키는 하나 이상의 돌연변이를 포함하는 것인 폴리펩티드.
  55. 제53항 또는 제54항에 있어서, S 폴리펩티드가 전체 S 단백질 (예컨대, NCBI 수탁 번호 YP_009724390에 제시된 바와 같음) 기준으로 K968P 또는 V987P 돌연변이, 또는 그 둘 모두를 포함하는 것인 폴리펩티드.
  56. 제53항 내지 제55항 중 어느 한 항에 있어서, S 폴리펩티드가 서열식별번호 56과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 폴리펩티드.
  57. 제53항 내지 제56항 중 어느 한 항에 있어서, N-말단 IgE 리더 폴리펩티드 서열을 추가로 포함하는 폴리펩티드.
  58. 제57항에 있어서, N-말단 IgE 리더 폴리펩티드 서열이 서열식별번호 44와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 폴리펩티드.
  59. 제53항 내지 제58항 중 어느 한 항에 있어서, 폴리펩티드가 서열식별번호 70과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 폴리펩티드.
  60. 서열식별번호 29-31, 34-36, 74, 또는 76 중 어느 하나와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 적어도 하나의 SARS-CoV-2 폴리펩티드를 포함하는 폴리펩티드.
  61. 적어도 하나의 SARS-CoV-2 폴리펩티드 및 적어도 하나의 HDAg 폴리펩티드를 포함하는 폴리펩티드.
  62. 제61항에 있어서, 폴리펩티드가 서열식별번호 32와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 폴리펩티드.
  63. 제62항에 있어서, 적어도 하나의 P2A 자가촉매 폴리펩티드 절단 부위를 추가로 포함하는 폴리펩티드.
  64. 제61항 또는 제63항에 있어서, 폴리펩티드가 서열식별번호 33과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인 폴리펩티드.
  65. 제1항 내지 제32항 중 어느 한 항에 있어서, 대상체, 바람직하게는 인간에서의 SARS-CoV-2 예방, 치료, 또는 억제를 위한 것과 같은 의약에서 사용하기 위한 핵산.
  66. 제33항 내지 제64항 중 어느 한 항에 있어서, 대상체, 바람직하게는 인간에서의 SARS-CoV-2 예방, 치료, 또는 억제를 위한 것과 같은 의약에서 사용하기 위한 폴리펩티드.
  67. 제33항 내지 제64항 및 제66항 중 어느 한 항에 있어서, 폴리펩티드가 재조합적으로 발현되는 것인 폴리펩티드.
  68. 제67항에 있어서, 폴리펩티드가 포유동물, 박테리아, 효모, 곤충, 또는 무세포 시스템에서 재조합적으로 발현되는 것인 폴리펩티드.
  69. (a) SARS-CoV-2 폴리펩티드를 코딩하는 적어도 하나의 핵산 서열을 포함하는 핵산; 또는
    (b) 적어도 하나의 SARS-CoV-2 폴리펩티드를 포함하는 폴리펩티드, 또는 그 둘 모두를 포함하는, 면역원성 조성물 또는 생성물 조합물.
  70. 제69항에 있어서, SARS-CoV-2 폴리펩티드를 코딩하는 적어도 하나의 핵산 서열이
    i) RBD 폴리펩티드를 코딩하는 핵산 서열;
    ii) NP 폴리펩티드를 코딩하는 핵산 서열;
    iii) M 폴리펩티드를 코딩하는 핵산 서열;
    iv) HDAg 폴리펩티드를 코딩하는 핵산 서열;
    v) P2A 자가촉매 폴리펩티드 절단 부위를 코딩하는 핵산 서열;
    vi) IgE 리더 폴리펩티드를 코딩하는 핵산 서열; 또는
    vii) S 폴리펩티드를 코딩하는 핵산 서열;
    또는 그의 임의의 조합을 포함하는 것인 면역원성 조성물 또는 생성물 조합물.
  71. 제69항 또는 제70항에 있어서, 핵산이 제1항 내지 제32항 중 어느 한 항의 핵산인 면역원성 조성물 또는 생성물 조합물.
  72. 제69항 내지 제71항 중 어느 한 항에 있어서, 핵산이 서열식별번호 1-12 중 어느 하나와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하며, 임의적으로 대상체, 예컨대 포유동물, 바람직하게는 인간에서의 SARS-CoV-2 예방, 치료, 또는 억제를 위한 것과 같은 의약에서 사용되는 면역원성 조성물 또는 생성물 조합물.
  73. 제69항 내지 제71항 중 어느 한 항에 있어서, 핵산이 인간에서의 발현을 위해 코돈 최적화된 것인 면역원성 조성물 또는 생성물 조합물.
  74. 제73항에 있어서, 핵산이 서열식별번호 13-24, 39-40, 57-63, 71, 73, 또는 75 중 어느 하나와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하며, 임의적으로 대상체, 예컨대 포유동물, 바람직하게는 인간에서의 SARS-CoV-2 예방, 치료, 또는 억제를 위한 것과 같은 의약에서 사용되는 면역원성 조성물 또는 생성물 조합물.
  75. 제69항 내지 제74항 중 어느 한 항에 있어서, 적어도 하나의 SARS-CoV-2 폴리펩티드가
    i) RBD 폴리펩티드 서열;
    ii) NP 폴리펩티드 서열;
    iii) M 폴리펩티드 서열;
    iv) HDAg 폴리펩티드 서열;
    v) P2A 자가촉매 폴리펩티드 절단 부위 서열;
    vi) IgE 리더 폴리펩티드 서열; 또는
    vii) S 폴리펩티드 서열;
    또는 그의 임의의 조합을 포함하는 것인 면역원성 조성물 또는 생성물 조합물.
  76. 제69항 내지 제75항 중 어느 한 항에 있어서, 폴리펩티드가 제33항 내지 제64항 중 어느 한 항의 폴리펩티드인 면역원성 조성물 또는 생성물 조합물.
  77. 제69항 내지 제76항 중 어느 한 항에 있어서, 폴리펩티드가 서열식별번호 25-36, 41-42, 64-70, 72, 74, 또는 76 중 어느 하나와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하며, 임의적으로 대상체, 예컨대 포유동물, 바람직하게는 인간에서의 SARS-CoV-2 예방, 치료, 또는 억제를 위한 것과 같은 의약에서 사용되는 면역원성 조성물 또는 생성물 조합물.
  78. 제69항 내지 제77항 중 어느 한 항에 있어서, 폴리펩티드가 재조합적으로 발현되는 것인 면역원성 조성물 또는 생성물 조합물.
  79. 제78항에 있어서, 폴리펩티드가 포유동물, 박테리아, 효모, 곤충, 또는 무세포 시스템에서 재조합적으로 발현되는 것인 면역원성 조성물 또는 생성물 조합물.
  80. 제69항 내지 제79항 중 어느 한 항에 있어서, 애주번트를 추가로 포함하는 면역원성 조성물 또는 생성물 조합물.
  81. 제80항에 있어서, 애주번트가 알룸 및/또는 QS21인 면역원성 조성물 또는 생성물 조합물.
  82. 제69항 내지 제81항 중 어느 한 항에 있어서, 핵산이 재조합 벡터에 제공되는 것인 면역원성 조성물 또는 생성물 조합물.
  83. a) 대상체에게 핵산을 포함하는 적어도 하나의 프라임 용량을 투여하는 단계;
    b) 대상체에게 폴리펩티드를 포함하는 적어도 하나의 부스트 용량을 투여하는 단계를 포함하는,
    제69항 내지 제82항 중 어느 한 항에 기재된 면역원성 조성물 또는 생성물 조합물을 사용하여 대상체에서 면역 반응을 생성하고/거나, 중화 항체를 생성하는 방법.
  84. 제83항에 있어서, 적어도 하나의 부스트 용량이 애주번트를 추가로 포함하는 것인 방법.
  85. 제84항에 있어서, 애주번트가 알룸 및/또는 QS21인 방법.
  86. 제83항 내지 제85항 중 어느 한 항에 있어서, 적어도 하나의 부스트 용량이 적어도 하나의 프라임 용량 투여 후 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 24, 36, 또는 48일 또는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 24, 36, 또는 48주, 또는 상기 언급된 시점 중 임의의 두 시점으로 정의된 시간 범위 이내에, 예컨대 1-48일 또는 1-48주 이내에 투여되는 것인 방법.
  87. 제83항 내지 제86항 중 어느 한 항에 있어서, 투여가 장내로, 경구로, 비내로, 비경구로, 피하로, 근육내로, 진피내로, 또는 정맥내로 또는 그의 임의의 조합으로, 및 임의적으로 생체내 전기천공과 함께 제공되는 것인 방법.
  88. 제83항 내지 제87항 중 어느 한 항에 있어서, 투여가 항바이러스 요법과 함께 수행되는 것인 방법.
  89. 제88항에 있어서, 항바이러스 요법이 덱사메타손, 파비피라비르, 파필라비르, 렘데시비르, 토실리주맙, 갈리데시비르, 사릴루맙, 로피나비르, 리토나비르, 다루나비르, 리바비린, 인터페론-α, PEG화된 인터페론-α, 인터페론 알파-2b, 회복기 혈청, 또는 그의 임의의 조합의 투여를 포함하는 것인 방법.
  90. (a) SARS-CoV-2 폴리펩티드를 코딩하는 적어도 하나의 핵산 서열을 포함하는 핵산; 또는
    (b) 적어도 하나의 SARS-CoV-2 폴리펩티드를 포함하는 폴리펩티드, 또는 그 둘 모두를 포함하는, SARS-CoV-2의 치료 또는 억제에서 사용하기 위한 면역원성 조성물 또는 생성물 조합물.
  91. 제90항에 있어서, SARS-CoV-2 폴리펩티드를 코딩하는 적어도 하나의 핵산 서열이
    i) RBD 폴리펩티드를 코딩하는 핵산 서열;
    ii) NP 폴리펩티드를 코딩하는 핵산 서열;
    iii) M 폴리펩티드를 코딩하는 핵산 서열;
    iv) HDAg 폴리펩티드를 코딩하는 핵산 서열;
    v) P2A 자가촉매 폴리펩티드 절단 부위를 코딩하는 핵산 서열;
    vi) IgE 리더 폴리펩티드를 코딩하는 핵산 서열; 또는
    vii) S 폴리펩티드를 코딩하는 핵산 서열;
    또는 그의 임의의 조합을 포함하는 것인, SARS-CoV-2의 치료 또는 억제에서 사용하기 위한 면역원성 조성물 또는 생성물 조합물.
  92. 제91항에 있어서, 핵산이 제1항 내지 제32항 중 어느 한 항의 핵산인, SARS-CoV-2의 치료 또는 억제에서 사용하기 위한 면역원성 조성물 또는 생성물 조합물.
  93. 제90항 내지 제92항 중 어느 한 항에 있어서, 핵산이 서열식별번호 1-12 중 어느 하나와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인, SARS-CoV-2의 치료 또는 억제에서 사용하기 위한 면역원성 조성물 또는 생성물 조합물.
  94. 제90항 내지 제92항 중 어느 한 항에 있어서, 핵산이 인간에서의 발현을 위해 코돈 최적화된 것인, SARS-CoV-2의 치료 또는 억제에서 사용하기 위한 면역원성 조성물 또는 생성물 조합물.
  95. 제94항에 있어서, 핵산이 서열식별번호 13-24, 39-40, 57-63, 71, 73, 또는 75 중 어느 하나와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인, SARS-CoV-2의 치료 또는 억제에서 사용하기 위한 면역원성 조성물 또는 생성물 조합물.
  96. 제90항 내지 제95항 중 어느 한 항에 있어서, 적어도 하나의 SARS-CoV-2 폴리펩티드가
    i) RBD 폴리펩티드 서열;
    ii) NP 폴리펩티드 서열;
    iii) M 폴리펩티드 서열;
    iv) HDAg 폴리펩티드 서열;
    v) P2A 자가촉매 폴리펩티드 절단 부위 서열;
    vi) IgE 리더 폴리펩티드 서열; 또는
    vii) S 폴리펩티드 서열;
    또는 그의 임의의 조합을 포함하는 것인, SARS-CoV-2의 치료 또는 억제에서 사용하기 위한 면역원성 조성물 또는 생성물 조합물.
  97. 제90항 내지 제96항 중 어느 한 항에 있어서, 폴리펩티드가 제33항 내지 제64항 중 어느 한 항의 폴리펩티드인, SARS-CoV-2의 치료 또는 억제에서 사용하기 위한 면역원성 조성물 또는 생성물 조합물.
  98. 제90항 내지 제97항 중 어느 한 항에 있어서, 폴리펩티드가 서열식별번호 25-36, 41-42, 64-70, 72, 74, 또는 76 중 어느 하나와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성 또는 서열 동일성을 공유하거나 또는 포함하는 것인, SARS-CoV-2의 치료 또는 억제에서 사용하기 위한 면역원성 조성물 또는 생성물 조합물.
  99. 제90항 내지 제98항 중 어느 한 항에 있어서, 폴리펩티드가 재조합적으로 발현된 것인, SARS-CoV-2의 치료 또는 억제에서 사용하기 위한 면역원성 조성물 또는 생성물 조합물.
  100. 제99항에 있어서, 폴리펩티드가 포유동물, 박테리아, 효모, 곤충, 또는 무세포 시스템에서 재조합적으로 발현된 것인, SARS-CoV-2의 치료 또는 억제에서 사용하기 위한 면역원성 조성물 또는 생성물 조합물.
  101. 제90항 내지 제100항 중 어느 한 항에 있어서, 애주번트를 추가로 포함하는, SARS-CoV-2의 치료 또는 억제에서 사용하기 위한 면역원성 조성물 또는 생성물 조합물.
  102. 제101항에 있어서, 애주번트가 알룸 및/또는 QS21인, SARS-CoV-2의 치료 또는 억제에서 사용하기 위한 면역원성 조성물 또는 생성물 조합물.
  103. 제90항 내지 제102항 중 어느 한 항에 있어서, 핵산이 재조합 벡터에 제공되는 것인, SARS-CoV-2의 치료 또는 억제에서 사용하기 위한 면역원성 조성물 또는 생성물 조합물.
  104. IgE 리더 서열을 코딩하는 핵산, 바람직하게는 아미노산 서열 MDWTWILFLVAAATRVHS (서열식별번호 44)를 코딩하는 핵산, 또는 서열식별번호 43과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상동성을 갖는 IgE 리더 핵산 서열에 연결된 적어도 하나의 SARS-CoV-2 핵산 성분을 포함하거나, 본질적으로 그로 이루어지거나, 또는 그로 이루어진 핵산.
  105. SARS-CoV-2 감염을 치료 또는 억제하는 의약을 포함한 의약으로서의, 제104항의 핵산, 또는 그에 의해 코딩된 단백질의 용도.
KR1020227036898A 2020-03-27 2021-03-24 코로나바이러스의 치료 및 예방을 위한 조성물 및 방법 KR20220160042A (ko)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US202063000978P 2020-03-27 2020-03-27
US63/000,978 2020-03-27
US202063088228P 2020-10-06 2020-10-06
US63/088,228 2020-10-06
US202163141875P 2021-01-26 2021-01-26
US63/141,875 2021-01-26
US202163156660P 2021-03-04 2021-03-04
US63/156,660 2021-03-04
PCT/US2021/023991 WO2021195286A1 (en) 2020-03-27 2021-03-24 Compositions and methods for treating and preventing coronaviruses

Publications (1)

Publication Number Publication Date
KR20220160042A true KR20220160042A (ko) 2022-12-05

Family

ID=75498091

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227036898A KR20220160042A (ko) 2020-03-27 2021-03-24 코로나바이러스의 치료 및 예방을 위한 조성물 및 방법

Country Status (9)

Country Link
US (1) US20230330211A1 (ko)
EP (1) EP4126028A1 (ko)
JP (1) JP2023520370A (ko)
KR (1) KR20220160042A (ko)
CN (1) CN115666634A (ko)
AU (1) AU2021244684A1 (ko)
CA (1) CA3176902A1 (ko)
TW (1) TW202202623A (ko)
WO (1) WO2021195286A1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW202330575A (zh) * 2021-09-29 2023-08-01 瑞典商斯文斯卡疫苗生產股份有限公司 用於治療及預防冠狀病毒之組成物及方法
WO2023079528A1 (en) * 2021-11-05 2023-05-11 King Abdullah University Of Science And Technology Compositions suitable for use in a method for eliciting cross-protective immunity against coronaviruses

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6132419A (en) 1992-05-22 2000-10-17 Genetronics, Inc. Electroporetic gene and drug therapy
US6379966B2 (en) 1999-02-26 2002-04-30 Mirus Corporation Intravascular delivery of non-viral nucleic acid
US6261281B1 (en) 1997-04-03 2001-07-17 Electrofect As Method for genetic immunization and introduction of molecules into skeletal muscle and immune cells
US7015040B2 (en) 1999-02-26 2006-03-21 Mirus Bio Corporation Intravascular delivery of nucleic acid
US6897068B2 (en) 1999-02-26 2005-05-24 Mirus Bio Corporation Polynucleotide complex delivery
US7214369B2 (en) 2003-05-05 2007-05-08 Mirus Bio Corporation Devices and processes for distribution of genetic material to mammalian limb
US7589059B2 (en) 2002-07-26 2009-09-15 Roche Madison Inc. Delivery of molecules and complexes to mammalian cells in vivo
GB0417494D0 (en) 2004-08-05 2004-09-08 Glaxosmithkline Biolog Sa Vaccine
BRPI0518146A (pt) 2004-10-14 2008-10-28 Crucell Holland Bv kit de partes, uso de um adenovìrus recombinante defectivo na replicação, e, método de vacinação de um mamìfero para a infecção por malária
WO2008094188A2 (en) 2006-07-17 2008-08-07 Anza Therapeutics, Inc. Methods and compositions using listeria for enhancing immunogenicity by prime boost
US20130012865A1 (en) 2009-12-16 2013-01-10 Chrontech Pharma Ab Codon-optimzed hepatitis b virus core antigen (hbcag)
WO2014064534A2 (en) 2012-10-05 2014-05-01 Chrontech Pharma Ab Injection needle, device, immunogenic compositions and method of use
WO2017132332A1 (en) 2016-01-28 2017-08-03 Svenska Vaccinfabriken Produktion Ab Chimeric hepatitis d virus antigen and hepatitis b virus pre s1 genes for use alone or in vaccines contaning hepatitis b virus genes
PL3554536T3 (pl) * 2016-12-14 2023-03-06 Boehringer Ingelheim Animal Health USA Inc. Rekombinowane wektory hvt wyrażające wiele antygenów patogenów ptasich oraz szczepionki je zawierające
RU2733832C1 (ru) * 2020-07-28 2020-10-07 Федеральное бюджетное учреждение науки "Государственный научный центр вирусологии и биотехнологии "Вектор" Федеральной службы по надзору в сфере защиты прав потребителей и благополучия человека (ФБУН ГНЦ ВБ "Вектор" Роспотребнадзора) Искусственный ген Stbl_RBD_TrM_SC2, кодирующий бицистронную структуру, образованную последовательностями рецепторсвязывающего домена гликопротеина S коронавируса SARS-CoV-2, трансмембранного региона, P2A-пептида и гликопротеина G VSV, рекомбинантная плазмида pStem-rVSV-Stbl_RBD_TrM_SC2, обеспечивающая экспрессию искусственного гена, и рекомбинантный штамм вируса везикулярного стоматита rVSV-Stbl_RBD_TrM_SC2, используемый для создания вакцины против коронавируса SARS-CoV-2

Also Published As

Publication number Publication date
CA3176902A1 (en) 2021-09-30
JP2023520370A (ja) 2023-05-17
TW202202623A (zh) 2022-01-16
AU2021244684A1 (en) 2022-11-17
CN115666634A (zh) 2023-01-31
WO2021195286A1 (en) 2021-09-30
EP4126028A1 (en) 2023-02-08
US20230330211A1 (en) 2023-10-19

Similar Documents

Publication Publication Date Title
US11969467B2 (en) Nucleic acid vaccine against the SARS-CoV-2 coronavirus
JP7443608B2 (ja) SARS-COV-2 mRNAドメインワクチン
WO2023283642A2 (en) Pan-human coronavirus concatemeric vaccines
KR20220160042A (ko) 코로나바이러스의 치료 및 예방을 위한 조성물 및 방법
CN114480442A (zh) 一种mRNA及包含其的新型冠状病毒mRNA疫苗
CN116583296A (zh) 使用核苷修饰mrna的通用流感疫苗
WO2022197624A1 (en) Therapeutic use of sars-cov-2 mrna domain vaccines
US20230053555A1 (en) Mumps and measles virus immunogens and their use
KR100768051B1 (ko) 간염 바이러스 orf2의 n-말단 영역으로부터 유래한프로세싱 성분 및 항원성 폴리펩티드를 암호화하는 핵산구성물
US20230295244A1 (en) Compositions and methods for treating and preventing coronaviruses
RU2812764C1 (ru) Композиции и способы для лечения и предотвращения гепатита в и d
TW202217000A (zh) Sars—cov—2 mrna結構域疫苗
KR20220113641A (ko) 신규 핵산 분자
KR20220149519A (ko) B형 및 d형 간염의 치료 및 예방을 위한 조성물 및 방법
AU2001243941B2 (en) A nucleic acid construct encoding a processing component derived from the n-terminal region of the hepatitis virus ORF2, and an antigenic polypeptide
KR20230132816A (ko) 복제-능력 있는 아데노바이러스 타입 4 sars-cov-2백신 및 이의 용도
WO2023073672A1 (en) Therapeutic and vaccine candidates against sars-cov-2
JPWO2005090576A1 (ja) 百日咳感染症予防用dna構築物
AU2001243941A1 (en) A nucleic acid construct encoding a processing component derived from the n-terminal region of the hepatitis virus ORF2, and an antigenic polypeptide