KR20220141332A - 홍역-벡터화된 covid-19 면역원성 조성물 및 백신 - Google Patents

홍역-벡터화된 covid-19 면역원성 조성물 및 백신 Download PDF

Info

Publication number
KR20220141332A
KR20220141332A KR1020227031638A KR20227031638A KR20220141332A KR 20220141332 A KR20220141332 A KR 20220141332A KR 1020227031638 A KR1020227031638 A KR 1020227031638A KR 20227031638 A KR20227031638 A KR 20227031638A KR 20220141332 A KR20220141332 A KR 20220141332A
Authority
KR
South Korea
Prior art keywords
seq
polypeptide
construct
cov
sars
Prior art date
Application number
KR1020227031638A
Other languages
English (en)
Inventor
니꼴라 로베르 쟈비에 에스크리우
프레데릭 땅긔
크리스띠앙 께르케
Original Assignee
앵스티띠 파스퇴르
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from EP20305141.2A external-priority patent/EP3865180A1/en
Application filed by 앵스티띠 파스퇴르 filed Critical 앵스티띠 파스퇴르
Publication of KR20220141332A publication Critical patent/KR20220141332A/ko

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • A61K39/215Coronaviridae, e.g. avian infectious bronchitis virus
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • A61K39/155Paramyxoviridae, e.g. parainfluenza virus
    • A61K39/165Mumps or measles virus
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/14Antivirals for RNA viruses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/569Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
    • G01N33/56983Viruses
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6854Immunoglobulins
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • A61K2039/525Virus
    • A61K2039/5254Virus avirulent or attenuated
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • A61K2039/525Virus
    • A61K2039/5256Virus expressing foreign proteins
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • A61K2039/53DNA (RNA) vaccination
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/57Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2
    • A61K2039/572Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2 cytotoxic response
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/57Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2
    • A61K2039/575Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2 humoral response
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/8509Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
    • C12N2015/8518Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic expressing industrially exogenous proteins, e.g. for pharmaceutical use, human insulin, blood factors, immunoglobulins, pseudoparticles
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2760/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
    • C12N2760/00011Details
    • C12N2760/18011Paramyxoviridae
    • C12N2760/18411Morbillivirus, e.g. Measles virus, canine distemper
    • C12N2760/18441Use of virus, viral particle or viral elements as a vector
    • C12N2760/18443Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20022New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20034Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Virology (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Communicable Diseases (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Mycology (AREA)
  • Epidemiology (AREA)
  • Pulmonology (AREA)
  • Plant Pathology (AREA)
  • Oncology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Food Science & Technology (AREA)
  • Cell Biology (AREA)
  • Analytical Chemistry (AREA)

Abstract

본 발명은 코로나바이러스에 대한 면역의 분야에 관한 것이다. 본 발명은 코로나바이러스에 대한 면역 반응을 유발하는 코로나바이러스로부터 유래된 벡터화된 항원을 제공한다. 따라서, 본 발명은 코로나바이러스 항원을 발현하는 생 약독화 재조합 홍역 바이러스인 유효 성분, 및 면역, 특히 SARS-CoV-2 균주에 대한 보호 면역 및 유리하게는 다양한 코로나바이러스 균주에 대한 광범위한 보호 면역을 유도하기 위한 그의 용도에 관한 것이다.

Description

홍역-벡터화된 COVID-19 면역원성 조성물 및 백신
본 발명은 코로나바이러스에 대한 면역의 분야에 관한 것이다.
코로나바이러스는 큰 게놈(26 내지 32kb)을 가진 외피가 있는 포지티브 센스 단일 가닥 RNA 바이러스이다. 4개의 속(알파, 베타, 감마 및 델타)이 기술되어 왔으며 이 중 베타코로나바이러스는 4개의 계통(A, B, C 및 D)으로 세분화되었다. 코로나바이러스에 대해 확인된 숙주 중에서 인간을 포함한 조류 및 포유동물은 특히 매년 순환하는 균주 또는 대유행 발병을 일으킬 수 있는 균주에 의해 감염된 것으로 확인되어 왔다. 인간 코로나바이러스에는 연간 균주(annual strain)인 HCoV-OC43, HCoV-229E, HCoV-HKU1, HCoV-NL63 및 2003년에 분리된 SARS-CoV(중증 급성 호흡기 증후군 코로나바이러스) 또는 2012년에 분리되고 여전히 순환하고 있는 MERS-CoV(중동 호흡기 증후군 코로나바이러스)와 같은 유행성 균주가 포함된다. SARS-CoV 및 MERS-CoV는 각각 베타 코로나바이러스 계통 B와 계통 C에 속한다. 이 코로나바이러스는 공기를 통해 전염되며 사람에서 사람으로 전염되는 것으로 확인되었다.
이러한 알려진 균주 외에도, 2019-nCoV로 지정된 새로운 코로나바이러스 변종(또는 보다 최근에는 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2)로 지정됨)은 2019년에 현재 중국에서 사람들을 감염시키고 있으며 전 세계적으로 퍼져서 많은 수의 감염된 인간 숙주가 중병에 걸리거나 사망한 것으로 확인되었다. 이러한 고병원성 균주는 동물 저장소에서 인간 집단으로 출현했으며 이미 코로나바이러스 대유행에 대한 큰 우려를 야기하는 인간 대 인간 전염에 의한 것을 포함하여 높은 치사율의 원인이 되는 것으로 입증되었다. 2020년 1월 30일에, 이 발병은 세계보건기구(WHO)에 의해 국제적 공중보건 비상사태로 선언된 후 2020년 3월 11일에 팬데믹으로 특징지어졌다. WHO는 또한 이 새로운 코로나바이러스 질병의 이름을 COVID -19로 발표했다.
현재까지 전 세계적으로 거의 1억 명이 SARS-CoV-2 대유행의 영향을 받았고 200만 명 이상이 COVID-19로 사망했다. 팬데믹으로 인해, 전 세계적으로 3조 3천억 달러의 "낙관적 손실(optimistic loss)" 및 82조 달러의 최악의 시나리오 손실(worst-case scenario loss)이 예상되는 전례 없는 전 세계적인 사회 및 경제적 혼란이 발생했다(GDP Risk; 2020). 이 바이러스는 현재 유럽과 북반구에서 2차 유행으로 폭발적으로 확장되고 있지만, 그 질병을 예방하거나 치료하는 특정 치료법은 확인되지 않았다. 공중 보건 조치의 시행과 함께, COVID-19 이전의 정상 상태로 돌아가려면 효과적인 백신이 필요하다. 따라서, SARS-CoV-2에 대한 면역 반응을 유도하고 잠재적으로 SARS-CoV-2 또는 가능하면 더 넓은 범위의 코로나바이러스 균주(예: 전염병 또는 대유행 균주)에 대한 보호를 제공하기 위한 백신 후보를 제안할 필요가 있다.
본 발명은 이러한 요구 및 기타 요구를 충족한다.
본 발명은 코로나바이러스에 대한 면역 반응을 유발하는 코로나바이러스로부터 유래된 벡터화된 항원(vectorized antigen)을 제공한다. 따라서, 본 발명은 코로나바이러스 항원(들)을 발현하는 생 약독화 재조합 홍역 바이러스인 유효 성분 및 면역, 특히 2019-nCoV(SARS-CoV-2) 균주에 대한 보호 면역 및 유리하게는 다양한 코로나바이러스 균주에 대한 광범위한 보호 면역을 유도하기 위한 그의 용도에 관한 것이다. 또한, 본 발명은 SARS-CoV-2의 천연 항원으로부터 유래된 폴리펩티드에 관한 것으로, 여기서 폴리펩티드는 효율적인 면역원을 설계, 특히 코로나바이러스 감염에 대한 백신 후보를 설계하는데 유용한 특성을 갖는다. 또한, 본 발명은 SARS-CoV-2의 천연 항원을 암호화하는 폴리뉴클레오티드 또는 SARS-CoV-2의 천연 항원으로부터 유래된 폴리펩티드를 암호화하는 폴리뉴클레오티드, 특히 재조합 홍역 바이러스에 의한 발현 또는 생산 세포로부터의 개선된 회수를 위해 적합한 폴리뉴클레오티드에 관한 것이다.
또한, 본 발명은 SARS-CoV-2의 항원으로부터 수득된 폴리펩티드를 발현하는 재조합 홍역 바이러스의 제조 수단 및 이에 따라 수득된 재조합 홍역 바이러스에 관한 것이다.
또한, 본 발명은 SARS-CoV-2의 항원으로부터 수득된 폴리펩티드를 발현하는 재조합 홍역 바이러스를 포함하는 면역원성 조성물에 관한 것이다. 또한, 본 발명은 SARS-CoV-2 및 선택적으로 다른 코로나바이러스 또는 감염으로 인한 질병에 대하여 동물 숙주, 특히 포유동물 숙주, 특히 인간 숙주에서 보호 면역 반응을 유도하기 위한 이러한 면역원성 조성물의 용도에 관한 것이다. 또한, 본 발명은 SARS-CoV-2에 의한 감염 및 선택적으로 다른 코로나바이러스 또는 감염에 의해 야기되는 질병에 대한 특히 예방적 치료를 필요로 하는 숙주의 치료 방법에 관한 것이다.
특히, 본 발명의 제1 양태는 핵산 작제물을 제공하며, 이는: 홍역 바이러스(MV)의 약독화된 균주의 전장, 안티게놈(+) RNA 가닥을 암호화하는 cDNA 분자; 및 제1 이종 폴리뉴클레오티드;를 포함하고, 상기 제1 이종 폴리뉴클레오티드는: (a) 서열번호 3의 SARS-CoV-2의 스파이크(S) 단백질, 또는 (b) 서열번호 11의 S1 폴리펩티드, 서열번호 13의 S2 폴리펩티드, 서열번호 7의 Secto 폴리펩티드, 및 서열번호 16의 tri-Secto 폴리펩티드로 이루어진 군으로부터 선택된 (a)의 전장 S 단백질의 면역원성 단편, 또는 (c) 1 내지 10개의 아미노산이 삽입, 치환 또는 결실에 의해 변형되어 있는 (a) 또는 (b)의 변이체를 암호화한다. 일부 구현예에서, 상기 (c)의 변이체는: (i) 발현된 전장 S 단백질을 이의 융합전 형태로 유지하는 돌연변이, 및/또는 (ii) S 단백질의 푸린 절단 부위를 불활성화시키는 돌연변이, 및/또는 (iii) 소포체 검색 신호(EERS)를 불활성화하는 돌연변이, 및/또는 (iv) S 단백질의 S1 도메인에 국한된 수용체-결합 도메인(RBD)을 폐쇄 형태로 유지하는 돌연변이를 포함하는 폴리펩티드를 암호화하며, 상기 제1 이종 폴리뉴클레오티드는 MV(ATU2)의 P 유전자와 M 유전자 사이에 위치한 추가 전사 단위(ATU)에 위치하거나 또는 MV(ATU3)의 H 유전자의 하류에 위치한 ATU에 위치한다. 일부 구현예에서, 발현된 전장 S 단백질을 이의 융합전 형태로 유지하는 돌연변이는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 986 및 987(K986P 및 V987P)에 있는 2개의 프롤린 잔기의 치환에 의한 돌연변이, 또는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 817, 892, 899, 942, 986 및 987(F817P, A892P, A899P, A942P, K986P 및 V987P)에서 6개의 프롤린 잔기의 치환에 의한 돌연변이이고, 및/또는 S 단백질의 푸린 절단 부위를 불활성화시키는 돌연변이는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 682, 683 및 685(R682G, R683S 및 R685G)에서의 S1/S2 푸린 절단 부위에서 발생하는 3개의 아미노산 잔기의 치환에 의한 돌연변이, 또는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 위치 675와 아미노산 위치 685 사이의 아미노산 사이에 S1/S2 푸린 절단 부위를 포함하고 서열번호 50의 아미노산 서열 QTQTNSPRRAR로 이루어진 루프의 결실에 의한 돌연변이이고, 및/또는 EERS를 불활성화시키는 돌연변이는 서열번호 3의 아미노산 서열의 위치 1269 및 1271에서의 2개의 알라닌 잔기의 치환에 의한 돌연변이이고, 및/또는 S 단백질의 S1 도메인에 국한된 RBD를 폐쇄 형태로 유지하는 돌연변이는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 383 및 985(S383C 및 D985C)에서 2개의 시스테인 잔기의 치환에 의한 돌연변이, 또는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 413 및 987(G413C 및 P987C)에서 2개의 시스테인 잔기의 치환에 의한 돌연변이이고, 및/또는 (c)의 변이체는, 서열번호 3의 아미노산 서열의 위치 69 및 70의 아미노산 잔기의 결실, 서열번호 3의 아미노산 서열의 위치 144 및 145의 아미노산 잔기의 결실로 이루어진 군에서 선택되는 돌연변이, 서열번호 3의 아미노산 서열의 위치 501의 티로신 잔기의 치환에 의한 돌연변이(N501Y), 서열번호 3의 아미노산 서열의 위치 570의 아스파라긴산 잔기의 치환에 의한 돌연변이(A570D), 서열번호 3의 아미노산 서열의 위치 681의 히스티딘 잔기의 치환에 의한 돌연변이(P681H), 서열번호 3의 아미노산 서열의 위치 716의 이소류신 잔기의 치환에 의한 돌연변이(T716I), 서열번호 3의 아미노산 서열의 위치 982의 알라닌 잔기의 치환에 의한 돌연변이(S982A), 서열번호 3의 아미노산 서열의 위치 1118의 히스티딘 잔기의 치환에 의한 돌연변이(D1118H), 서열번호 3의 아미노산 서열의 위치 484의 라이신 잔기의 치환에 의한 돌연변이(E484K), 서열번호 3의 아미노산 서열의 위치 417의 아스파라긴 잔기의 치환에 의한 돌연변이(K417N), 서열번호 3의 아미노산 서열의 위치 417의 트레오닌 잔기의 치환에 의한 돌연변이(K417T), 및 서열번호 3의 아미노산 서열의 위치 614의 글리신 잔기의 치환에 의한 변이(D614G)를 포함하는 폴리펩티드를 암호화한다.
제1 측면의 몇몇 구현예에서, 핵산 작제물은 뉴클레오캡시드(N) 폴리펩티드 또는 N 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체, 기질(matrix) (M) 폴리펩티드 또는 M 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체, E 폴리펩티드 또는 E 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체, 8a 폴리펩티드 또는 8a 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체, 7a 폴리펩티드 또는 7a 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체, 3A 폴리펩티드 또는 3a 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체, 및 이의 면역원성 단편으로 이루어진 군으로부터 선택된 SARS-CoV-2의 적어도 하나의 폴리펩티드를 암호화하는 제2 이종 폴리뉴클레오티드를 추가로 포함하고, 제2 이종 폴리뉴클레오티드는 제1 이종 폴리뉴클레오티드의 ATU와 상이한 위치에서 추가의 전사 단위(ATU) 내에 위치한다.
제1 측면의 몇몇 구현예에서, 제1 이종 폴리뉴클레오티드는 서열번호 5, 7, 9, 15, 17, 19, 43, 45, 47, 49, 52, 54, 56, 58, 60, 62 및 65로 이루어진 군으로부터 선택된 아미노산 서열을 갖는 폴리펩티드를 암호화한다.
제1 측면의 몇몇 구현예에서, 제2 이종 폴리뉴클레오티드는 서열번호 22의 N 폴리펩티드, 서열번호 24의 M 폴리펩티드 또는 이의 엔도도메인(endodomain), 서열번호 23의 E 폴리펩티드, 서열번호 25의 ORF8 폴리펩티드, 서열번호 27의 ORF7a 폴리펩티드, 및 서열번호 26의 ORF3a 폴리펩티드 중 적어도 하나를 암호화한다.
제1 측면의 몇몇 구현예에서, 제1 이종 폴리뉴클레오티드는 하기로 이루어진 군으로부터 선택된 오픈 리딩 프레임을 갖는다:
i. S 폴리펩티드를 암호화하는 서열번호 1 또는 2 또는 36,
ii. S1 폴리펩티드를 암호화하는 서열번호 10,
iii. S2 폴리펩티드를 암호화하는 서열번호 12,
iv. stab-S 폴리펩티드(S2P)를 암호화하는 서열번호 4,
v. Secto 폴리펩티드를 암호화하는 서열번호 6,
vi. stab-Secto 폴리펩티드를 암호화하는 서열번호 8,
vii. stab-S2 폴리펩티드를 암호화하는 서열번호 14,
ⅷ. tri-Secto 폴리펩티드를 암호화하는 서열번호 16,
ix. tristab-Secto 폴리펩티드를 암호화하는 서열번호 18,
x. S3F 폴리펩티를 암호화하는 서열번호 42,
xi. S2P3F 폴리펩티드를 암호화하는 서열번호 44,
xii. S2PΔF 폴리펩티드를 암호화하는 서열번호 46,
xiii. S2PΔF2A 폴리펩티드를 암호화하는 서열번호 48,
xiv. T4-S2P3F 폴리펩티드(tristab-Secto-3F)를 암호화하는 서열번호 51,
xv. S6P 폴리펩티드를 암호화하는 서열번호 53,
xvi. S6P3F 폴리펩티드를 암호화하는 서열번호 55,
xvii. S6PΔF 폴리펩티드를 암호화하는 서열번호 57,
xviii. SCCPP 폴리펩티드를 암호화하는 서열번호 59,
xix. SCC6P 폴리펩티드를 암호화하는 서열번호 61,
xx. SMVopt2P 폴리펩티드를 암호화하는 서열번호 63,
xxi. SMVoptΔF 폴리펩티드를 암호화하는 서열번호 64, 및
xxii. SMVopt2PΔF 폴리펩티드를 암호화하는 서열번호 66.
제1 측면의 몇몇 구현예에서, 핵산 작제물은 5'에서 3' 말단 방향으로 오픈 리딩 프레임을 암호화하는 하기 폴리뉴클레오티드를 포함하는 cDNA 작제물이다:
(a) MV의 N 단백질을 암호화하는 폴리뉴클레오티드;
(b) MV의 P 단백질을 암호화하는 폴리뉴클레오티드;
(c) 제1항 내지 제3항, 제4항 및 제6항 중 어느 한 항에 정의된 바와 같은 제1 이종 폴리뉴클레오티드;
(d) MV의 M 단백질을 암호화하는 폴리뉴클레오티드;
(e) MV의 F 단백질을 암호화하는 폴리뉴클레오티드;
(f) MV의 H 단백질을 암호화하는 폴리뉴클레오티드;
(g) MV의 L 단백질을 암호화하는 폴리뉴클레오티드;
여기서, 폴리뉴클레오티드는 핵산 작제물 내에서 작동 가능하게 연결되고 MV 리더 및 트레일러(trailer) 서열과 같은 전사 조절 요소 및 바이러스 복제의 제어 하에 있으며 T7 프로모터 및 T7 터미네이터에 의해 구성되고(framed) 재조합 MV-CoV 발현 카세트를 제공하도록 벡터에서의 클로닝에 적합한 제한 부위로 구성된다.
제1 측면의 몇몇 구현예에서, 핵산 작제물은 (a) 약독화된 MV 백신 균주, 특히 Schwarz 균주 또는 Moraten 균주의 전장 안티게놈 (+)RNA 가닥을 암호화하는 뉴클레오티드 서열의 첫 번째 뉴클레오티드에 인접한 것으로, 핵산 작제물의 5'-말단에서 해머헤드 리보자임 서열이 뒤따르는 GGG 모티프, 및 (b) 전장 안티게놈 (+)RNA 가닥을 암호화하는 뉴클레오티드 서열의 마지막 뉴클레오티드에 인접한 것으로, 재조합 MV-CoV 핵산 분자의 3'-말단에 있는 리보자임의 뉴클레오티드 서열, 특히 델타 간염 바이러스 리보자임(δ)의 서열을 추가로 포함한다.
제2 이종 폴리뉴클레오티드를 갖는 제1 측면의 몇몇 구현예에서, 제2 이종 폴리뉴클레오티드는 SARS-CoV-2의 N 폴리펩티드를 암호화하고, 제2 이종 폴리뉴클레오티드는 제1 이종 폴리뉴클레오티드에서 클로닝에 사용된 ATU와 다른 위치의 ATU에서 클로닝된다.
제1 측면의 몇몇 구현예에서, (i) 제1 이종 폴리뉴클레오티드는 서열번호 36, 서열번호 63, 서열번호 64 및 서열번호 66으로 이루어진 군으로부터 선택되는 서열을 포함하고, ATU2 내에 위치되며, 또는 (ii) 제1 이종 폴리뉴클레오티드는 서열번호 2, 서열번호 4, 서열번호 44, 서열번호 46, 서열번호 48, 서열번호 51, 서열번호 53, 서열번호 55, 서열번호 57, 서열번호 59 및 서열번호 61으로 이루어진 군으로부터 선택되는 서열을 포함하고, ATU3 내에 위치된다.
제1 측면의 몇몇 구현예에서, (i) 제1 이종 폴리뉴클레오티드는 ATU3 내에 위치하고, 제2 이종 폴리뉴클레오티드는 ATU2 내에 위치되며, 또는 (ii) 제1 이종 폴리뉴클레오티드는 ATU2 내에 위치하고, 제2 이종 폴리뉴클레오티드는 ATU3 내에 위치된다.
제1 측면의 몇몇 구현예에서, 홍역 바이러스는 Schwarz 균주, Zagreb 균주, AIK-C 균주, Moraten 균주, Philips 균주, Beckenham 4A 균주, Beckenham 16 균주, CAM-70 균주, TD 97 균주, Leningrad-16 균주, Shanghai 191 균주 및 Belgrade 균주로 이루어진 군으로부터 선택되는 약독화 바이러스 균주이다.
제2 측면에서, 본 발명은 (1) 홍역 바이러스(MV)의 약독화 균주의 전장 안티게놈(+) RNA 가닥을 암호화하는 cDNA 분자; 및 (2) 서열번호 3의 아미노산 서열의 위치 1263 내지 1273과 정렬된 S 단백질의 11개 아미노산 잔기 서열에서 삽입, 치환 또는 결실을 포함하는 SARS-CoV-2의 S 단백질 또는 이의 면역원성 단편을 암호화하는 제1 이종 폴리뉴클레오티드를 포함하는 핵산 작제물을 제공하고, 여기서 삽입, 치환 또는 결실은 S 단백질 또는 이의 면역원성 단편의 세포 표면 발현을 증가시키고, 제1 이종 폴리뉴클레오티드는 MV(ATU2)의 P 유전자와 M 유전자 사이에 위치한 추가 전사 단위(ATU)에 위치하거나 또는 MV(ATU3)의 H 유전자의 3'에 위치한 ATU에 위치한다. 몇몇 구현예에서, 상기 S 단백질 또는 이의 면역원성 단편은 서열번호 3의 아미노산 서열의 위치 1263 내지 1273과 정렬된 S 단백질의 11개 아미노산 잔기 서열에서 치환을 포함한다. 몇몇 구현예에서, 상기 S 단백질 또는 이의 면역원성 단편은 서열번호 3의 아미노산 서열의 위치 1263 내지 1273과 정렬된 S 단백질의 11개 아미노산 잔기 서열에서 전체 또는 부분의 결실을 포함한다. 몇몇 구현예에서, 암호화된 S 단백질 또는 이의 면역원성 단편은 발현된 S 단백질을 그의 융합전 형태(prefusion conformation)로 유지하는 하나 이상의 추가 치환을 추가로 포함한다. 몇몇 구현예에서, 암호화된 S 단백질 또는 이의 면역원성 단편은 서열번호 3의 아미노산 서열의 위치 K986 및 V987에 상응하는 아미노산 위치에서 아미노산 치환 K986P 및 V987P를 추가로 포함한다. 몇몇 구현예에서, 암호화된 S 단백질 또는 이의 면역원성 단편은 이중 도메인 S 단백질이다. 몇몇 구현예에서, 제1 이종 폴리뉴클레오티드는 ATU2에 위치한다. 몇몇 구현예에서, 제1 이종 폴리뉴클레오티드는: (a) 서열번호 76의 융합전-안정화된 SF-2P-dER 폴리펩티드, 또는 서열번호 76과 90% 이상의 동일성을 가지고 위치 986 및 987에서 변화한 이의 변이체; 또는 (b) 서열번호 82의 융합전-안정화된 SF-2P-2a 폴리펩티드, 또는 서열번호 82와 90% 이상의 동일성을 가지고 위치 986, 987, 1269, 및 1271에서 변화한 이의 변이체;를 암호화한다. 몇몇 구현예에서, 제1 이종 폴리뉴클레오티드는: (a) 서열번호 76의 융합전-안정화된 SF-2P-dER 폴리펩티드; 또는 (b) 서열번호 82의 융합전-안정화된 SF-2P-2a 폴리펩티드;를 암호화한다. 몇몇 구현예에서, 제1 이종 폴리뉴클레오티드는, SF-2P-dER 폴리펩티드를 암호화하는 서열번호 75, 또는 SF-2P-2a 폴리펩티드를 암호화하는 서열번호 81을 포함한다. 몇몇 구현예에서, 제1 이종 폴리뉴클레오티드는, SF-2P-dER 폴리펩티드를 암호화하는 서열번호 75를 포함한다.
제2 측면의 몇몇 구현예에서, 핵산 작제물은, 뉴클레오캡시드(N) 폴리펩티드 또는 N 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체; 기질(matrix) (M) 폴리펩티드 또는 M 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체; E 폴리펩티드 또는 E 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체; 8a 폴리펩티드 또는 8a 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체; 7a 폴리펩티드 또는 7a 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체; 3A 폴리펩티드 또는 3a 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체; 및 이의 면역원성 단편으로 이루어진 군으로부터 선택된 SARS-CoV-2의 적어도 하나의 폴리펩티드를 암호화하는 제2 이종 폴리뉴클레오티드를 추가로 포함하며, 상기 제2 이종 폴리뉴클레오티드는 제1 이종 폴리뉴클레오티드의 ATU와 상이한 위치에서 추가의 전사 단위(ATU) 내에 위치된다.
제2 측면의 몇몇 구현예에서, 핵산 작제물은 뉴클레오캡시드(N) 폴리펩티드; 기질 (M) 폴리펩티드; E 폴리펩티드; 8a 폴리펩티드; 7a 폴리펩티드; 3A 폴리펩티드; 및 이의 면역원성 단편으로 이루어진 군에서 선택된 SARS-CoV-2의 적어도 하나의 폴리펩티드를 암호화하는 제2 이종 폴리뉴클레오티드를 추가로 포함하고, 상기 제2 이종 폴리뉴클레오티드는 제1 이종 폴리뉴클레오티드의 ATU와 상이한 위치에서 추가 전사 단위(ATU) 내에 위치한다. 제2 측면의 몇몇 구현예에서, 제2 이종 폴리뉴클레오티드는 N 폴리펩티드를 암호화하고, 상기 제2 이종 폴리뉴클레오티드는 제1 이종 폴리뉴클레오티드의 ATU와 상이한 위치에서 추가의 전사 단위(ATU) 내에 위치된다.
제2 측면의 몇몇 구현예에서, 제2 이종 폴리뉴클레오티드는 서열번호 22의 N 폴리펩티드, 서열번호 24의 M 폴리펩티드 또는 이의 엔도도메인(endodomain), 서열번호 23의 E 폴리펩티드, 서열번호 25의 ORF8 폴리펩티드, 서열번호 27의 ORF7a 폴리펩티드, 및/또는 서열번호 26의 ORF3a 폴리펩티드 중 적어도 하나를 암호화하며, 상기 제2 이종 폴리뉴클레오티드는 제1 이종 폴리뉴클레오티드의 ATU와 상이한 위치에서 추가의 전사 단위(ATU) 내에 위치된다.
제2 측면의 몇몇 구현예에서, 제2 이종 단백질은 MV의 N 유전자의 업스트림인 ATU(ATU1) 내부, MV의 P 및 M 유전자 사이의 ATU(ATU2), 또는 H 및 L 유전자 사이의 ATU(ATU3)에 위치한다.
제2 측면의 몇몇 구현예에서, 핵산 작제물은 5'에서 3' 방향으로 오픈 리딩 프레임을 암호화하는 하기 폴리뉴클레오티드를 추가로 포함한다:
(a) MV의 N 단백질을 암호화하는 폴리뉴클레오티드;
(b) MV의 P 단백질을 암호화하는 폴리뉴클레오티드;
(c) 제1 이종 폴리뉴클레오티드;
(d) MV의 M 단백질을 암호화하는 폴리뉴클레오티드;
(e) MV의 F 단백질을 암호화하는 폴리뉴클레오티드;
(f) MV의 H 단백질을 암호화하는 폴리뉴클레오티드;
(g) MV의 L 단백질을 암호화하는 폴리뉴클레오티드;
여기서, 폴리뉴클레오티드는 핵산 작제물 내에서 작동 가능하게 연결되고, MV 리더 및 트레일러(trailer) 서열의 제어 하에 있으며 T7 프로모터 및 T7 터미네이터에 의해 구성되고(framed), 재조합 MV-CoV 발현 카세트를 제공하도록 벡터에서의 클로닝에 적합한 제한 부위로 구성된다.
제2 측면의 몇몇 구현예에서, 핵산 작제물은:
(a) 약독화된 MV 균주의 전장 안티게놈 (+)RNA 가닥을 암호화하는 뉴클레오티드 서열의 첫 번째 뉴클레오티드에 인접한 것으로, 핵산 작제물의 5'-말단에서 해머헤드 리보자임 서열이 뒤따르는 GGG 모티프, 및
(b) 약독화된 MV 균주의 전장 안티게놈 (+)RNA 가닥을 암호화하는 뉴클레오티드 서열의 마지막 뉴클레오티드에 인접한 것으로, 핵산 작제물의 3'-말단에 있는 델타 간염 바이러스 리보자임(δ)의 뉴클레오티드 서열을 추가로 포함한다.
제2 측면의 몇몇 구현예에서, 홍역 바이러스는 Schwarz 균주, Zagreb 균주, AIK-C 균주, Moraten 균주, Philips 균주, Beckenham 4A 균주, Beckenham 16 균주, CAM-70 균주, TD 97 균주, Leningrad-16 균주, Shanghai 191 균주 및 Belgrade 균주로 이루어진 군으로부터 선택되는 약독화 바이러스 균주이다. 몇몇 구현예에서, 핵산 작제물은 Schwarz 균주인 홍역 바이러스를 추가로 포함한다.
본 발명의 제1 및 제2 측면의 핵산 작제물은 본 발명의 추가 측면에 포함될 수 있다
제3 측면에서, 본 발명은 본 발명의 핵산 작제물을 포함하는, 재조합 홍역 바이러스(MV)의 구출(rescue)를 위한 전달 벡터를 제공한다. 몇몇 구현예에서, 전달 벡터는 하기로 이루어진 군으로부터 선택된 SARS-CoV-2의 폴리펩티드를 암호화하는 서열을 포함한다:
i. 서열번호 1 또는 2 또는 36 (작제물 S);
ii. 서열번호 4 (작제물 stab-S);
iii. 서열번호 6 (작제물 Secto);
iv. 서열번호 8 (작제물 stab-Secto);
v. 서열번호 10 (작제물 S1),
vi. 서열번호 12 (작제물 S2),
vii. 서열번호 14 (작제물 stab-S2),
viii. 서열번호 16(작제물 tri-Secto),
ix. 서열번호 18 (작제물 tristab-Secto),
x. 서열번호 42 (작제물 S3F),
xi. 서열번호 44 (작제물 S2P3F),
xii. 서열번호 46 (작제물 S2PΔF),
xiii. 서열번호 48 (작제물 S2PΔF2A),
xiv. 서열번호 21 또는 37 (작제물 N),
xv. 서열번호 51 (작제물 T4-S2P3F(tristab-Secto-3F)),
xvi. 서열번호 53 (작제물 S6P),
xvii. 서열번호 55 (작제물 S6P3F),
xviii. 서열번호 57 (작제물 S6PΔF),
xix. 서열번호 59 (작제물 SCCPP),
xx. 서열번호 61 (작제물 SCC6P),
xxi. 서열번호 63 (작제물 SMVopt2P),
xxii. 서열번호 64 (작제물 SMVoptΔF), 및
xxiii. 서열번호 66 (작제물 SMVopt2PΔF).
제4 측면에서, 본 발명은 본 발명의 핵산 작제물을 포함하는 플라스미드 벡터를 제공하며, 여기서 플라스미드 벡터는 서열번호 29(pTM2-MVSchw-gfp, 또한 pTM-MVSchw2-GFPbis 또는 pTM-MVSchwarz-ATU2로도 명명됨) 또는 서열번호 38(pTM3-MVSchw-gfp, 또한 pTM-MVSchw2-GFP 또는 pTM-MVSchwarz-ATU3로도 명명됨)이다.
제5 측면에서, 본 발명은 본 발명의 핵산 작제물을 포함하는 재조합 홍역 바이러스를 제공한다. 몇몇 구현예에서, 재조합 홍역 바이러스는 Schwarz 균주의 것이다. 몇몇 구현예에서, 재조합 홍역 바이러스는 이의 게놈에서 이에 작동가능하게 연결된 발현 카세트를 포함하고, 발현 카세트는 본 발명에 따른 핵산 작제물을 포함한다. 몇몇 구현예에서, 재조합 홍역 바이러스는 SARS-CoV-2 균주의 N, M, E, ORF7a, ORF8 및 ORF3a, 또는 이의 면역원성 단편으로부터 선택된 적어도 하나의 폴리펩티드를 추가로 발현한다.
제6 측면에서, 본 발명은 본 발명의 재조합 홍역 바이러스를 포함하는 면역원성 조성물 및 백신을 제공한다. 몇몇 구현예에서, 면역원성 조성물 또는 백신은 대상체에서 SARS-CoV-2 바이러스에 대한 면역 반응을 유도하는데 사용하기 위한 것이다. 몇몇 구현예에서, 면역원성 조성물 및 백신은 (i) 유효 용량의 본 발명의 재조합 홍역 바이러스, 및 (ii)약학적으로 허용되는 비히클을 포함하고, 여기서 조성물 또는 백신은 단일 면역화 후 동물 숙주에서 SARS-CoV-2의 폴리펩티드(들)에 대한 중화 체액 반응 및/또는 세포 반응을 유도한다. 몇몇 구현예에서, 면역원성 조성물 또는 백신은 이를 필요로 하는 숙주에서 SARS-CoV-2에 대한 보호 체액성 면역 반응 및/또는 세포성 면역 반응을 유도하는데 사용하기 위한 것이다.
제7 측면에서, 본 발명은 본 발명의 재조합 홍역 바이러스를 구출(rescuing)하는 방법을 제공한다. 이 방법은,
(a) T7 RNA 폴리머라제 및 홍역 바이러스 N 및 P 단백질을 안정적으로 발현하는 헬퍼 세포를 (i) 본 발명에 따른 핵산 작제물 또는 본 발명에 따른 핵산 작제물을 포함하는 플라스미드 벡터, 및 (ii) MV L 폴리머라제를 암호화하는 벡터로 공동-형질감염하고;
(b) 재조합 홍역 바이러스의 생산에 적합한 조건에서 형질감염된 헬퍼 세포를 유지하고;
(c) (b)의 형질감염된 헬퍼 세포와 공동 배양하여 재조합 홍역 바이러스의 증식을 가능하게 하는 세포를 감염시키고;
(d) 재조합 홍역 바이러스를 수확하는 것을 포함한다.
제8 측면에서, 본 발명은 하기로 이루어진 군으로부터 선택된 폴리뉴클레오티드를 포함하는 핵산 분자를 제공한다:
i. 서열번호 1 또는 2 또는 36(작제물 S);
ii. 서열번호 4 (작제물 stab-S);
iii. 서열번호 6 (작제물 Secto);
iv. 서열번호 8 (작제물 stab-Secto);
v. 서열번호 10 (작제물 S1),
vi. 서열번호 12 (작제물 S2),
vii. 서열번호 14 (작제물 stab-S2),
viii. 서열번호 16 (작제물 tri-Secto),
ix. 서열번호 18 (작제물 tristab-Secto),
x. 서열번호 42 (작제물 S3F),
xi. 서열번호 44 (작제물 S2P3F),
xii. 서열번호 46 (작제물 S2PΔF),
xiii. 서열번호 48 (작제물 S2PΔF2A),
xiv. 서열번호 21 또는 37 (작제물 N),
xv. 서열번호 51 (작제물 T4-S2P3F(tristab-Secto-3F)),
xvi. 서열번호 53 (작제물 S6P),
xvii. 서열번호 55 (작제물 S6P3F),
xviii. 서열번호 57 (작제물 S6PΔF),
xix. 서열번호 59 (작제물 SCCPP),
xx. 서열번호 61 (작제물 SCC6P),
xxi. 서열번호 63 (작제물 SMVopt2P),
xxii. 서열번호 64 (작제물 SMVoptΔF),
xxiii. 서열번호 66 (작제물 SMVopt2PΔF),
xxiv. 서열번호 75 (작제물 SF-2P-dER), 및
xxv. 서열번호 81 (작제물 SF-2P-2a).
제9 측면에서, 본 발명은 하기로 이루어진 군으로부터 선택된 아미노산 서열을 포함하는 폴리펩티드를 제공한다:
i. 서열번호 3 (작제물 S);
ii. 서열번호 5 (작제물 stab-S);
iii. 서열번호 7 (작제물 Secto);
iv. 서열번호 9 (작제물 stab-Secto);
v. 서열번호 11 (작제물 S1),
vi. 서열번호 13 (작제물 S2),
vii. 서열번호 15 (작제물 stab-S2),
viii. 서열번호 17 (작제물 tri-Secto),
ix. 서열번호 19 (작제물 tristab-Secto),
x. 서열번호 43 (작제물 S3F),
xi. 서열번호 45 (작제물 S2P3F),
xii. 서열번호 47 (작제물 S2PΔF),
xiii. 서열번호 49 (작제물 S2PΔF2A),
xiv. 서열번호 22 (작제물 N),
xv. 서열번호 52 (작제물 T4-S2P3F (tristab-Secto-3F)),
xvi. 서열번호 54 (작제물 S6P),
xvii. 서열번호 56 (작제물 S6P3F),
xviii. 서열번호 58 (작제물 S6PΔF),
xix. 서열번호 60 (작제물 SCCPP),
xx. 서열번호 62 (작제물 SCC6P),
xxi. 서열번호 65 (작제물 SMVoptΔF),
xxii. 서열번호 76 (작제물 SF-2P-dER), 및
xxiii. 서열번호 82 (작제물 SF-2P-2a).
제10 측면에서, 본 발명은 본 발명의 전달 벡터에 의해 발현되는 재조합 단백질을 제공한다. 재조합 단백질은 시험관내 또는 생체내에서 발현될 수 있다. 몇몇 구현예에서, 재조합 단백질은 정제를 위한 아미노산 태그를 추가로 포함한다.
제11 측면에서, 본 발명은 SARS-CoV-2 감염이 의심되는 개체로부터 이전에 얻은 생물학적 샘플에서 항원에 대한 항체의 존재를 검출하기 위한 서열번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 22, 23, 24, 25, 26, 27, 43, 45, 47, 49, 52, 54, 56, 58, 60, 62, 65, 76 및 82 중 어느 하나의 서열을 갖는 항원의 시험관내 용도를 제공하고, 여기서 폴리펩티드는 항원에 대한 항체의 존재를 결정하기 위해 생물학적 샘플과 접촉된다.
제12 측면에서, 본 발명은 생물학적 샘플을 서열번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 22, 23, 24, 25, 26, 27, 43, 45, 47, 49, 52, 54, 56, 58, 60, 62, 65, 76, 및 82중 어느 하나의 아미노산 서열을 포함하는 폴리펩티드 또는 이의 면역원성 단편과 접촉시키고 생물학적 샘플에 존재하는 항체와 폴리펩티드 사이의 항체-항원 복합체의 형성을 검출하는 것을 포함하는 방법을 제공한다. 몇몇 구현예에서, 생물학적 샘플은 SARS-CoV-2에 감염된 것으로 의심되는 개체로부터 수득된다.
제13 측면에서, 본 발명은 본 발명에 따른 면역원성 조성물 또는 백신을 대상체에게 투여하는 것을 포함하는, 대상체(예를 들어, 인간 숙주)에서 SARS-CoV-2에 의한 감염을 치료 또는 예방하는 방법을 제공한다. 또한, 본 발명에 따른 면역원성 조성물 또는 백신을 대상체에게 투여하는 것을 포함하는, 대상체(예를 들어, 인간 숙주)에서 SARS-CoV-2에 대한 보호 면역 반응을 유도하는 방법이 제공된다. 감염을 치료 또는 예방하거나 면역 반응을 유도하는 방법의 몇몇 구현예에서, 방법은 면역원성 조성물 또는 백신의 1차 투여 및 면역원성 조성물 또는 백신의 2차 투여를 포함한다. 몇몇 구현예에서, 2차 투여는 1차 투여 후 1 내지 2개월에 수행된다.
도 1: 플라스미드 pKP-MVSchw(17858bp)의 제한 지도.
도 2: SARS-CoV-2 스파이크 단백질의 기본 구조 및 돌연변이 위치의 개략도. 스파이크 단백질은 푸린 절단 부위에 의해 분리된 2개의 하위 도메인인 S1 및 S2로 구성된다. S2 도메인에는, heptad 반복부 1(HR1), 중심 나선(CH), 연결 도메인(CD), heptad 반복부 2(HR2), 막횡단 도메인(TM) 및 세포질 꼬리(CT)가 도시되어 있다. 설명된 돌연변이의 위치는 화살표를 사용하여 표시된다. 전장 단백질을 안정화시키기 위한 푸린 절단 부위의 돌연변이(3F:R682G+R683S+R685G) 또는 결실(DetaF: 6756QTQTNSPRRAR-685). 돌연변이(2P: K986P+V987P)는 융합전 형태의 단백질을 잠근다. 잠재적으로 세포 표면 발현을 향상시키기 위한 소포체 회수(retrieval) 신호의 돌연변이(K1269A+H1271A).
도 3a 내지 도 3c: 재조합 MV 벡터의 SARS-CoV-2 스파이크 작제물의 개략도. 도 3a. S 단백질 및 변형 위치의 단순화된 개략도. 도 3b/3c. SARS-CoV-2 스파이크의 합성 서열은 MV 벡터의 ATU3(3B) 또는 ATU2(3C) 위치에 클로닝되었다. ATU3의 모든 작제물(construct)은 전장의 막 결합 S 단백질(서열번호 2)의 완전한 인간 코돈 최적화 서열을 기반으로 한다. ATU2의 모든 작제물은 홍역-최적화된 서열(MVopt, 서열번호 36)을 기반으로 한다. 서로 다른 작제물에서 S 단백질의 변형이 표시되고 해당하는 구출된(rescued) 바이러스의 이름이 표시된다. MV 단백질은 하기와 같이 표시된다: N(핵단백질), P(인단백질), M(기질), F(융합 단백질), H(혈구응집소), L(대형 단백질), T7 RNA 폴리머라제 프로모터(T7), T7 RNA 폴리머라제터미네이터(T7t), 해머 헤드 리보자임(hh), 델타 간염 바이러스 리보자임(hδh).
도 4a 내지 도 4b: 세포 용해물에서 웨스턴 블롯에 의한 SARS-CoV-2 S 검출. Vero 세포는 0.05의 MOI에서 A) MV-ATU3-S, 또는 B) MV-AUT3-S2P, MV-ATU3-S2P3F, MV-ATU3-S2PΔF 또는 MV-ATU3-S2PΔF2A, 또는 모체 MV Schwarz 균주(MVSchw)로 감염되었더나 감염되지 않았다(NI). 감염 후 39시간에 총 세포 추출물을 제조하고 NuPAGE 4-12% Bis-Tris 겔에서 전기영동으로 분리하고 PVDF 멤브레인으로 옮기고 항-SARS-CoV-1 스파이크 다클론 토끼 항체로 검출했다(Escriou 등, Virology, 2014), AlexaFluor 680 결합 항토끼 항체 및 NearIR 이미지. 로딩 대조군으로 항-MV 핵단백질 다클론 토끼 항체(Covalab)를 사용하여 홍역의 N 단백질을 검출하였다. SARS-CoV-2 스파이크 단백질, S1 및 S2 하위 도메인, 홍역 N 단백질 및 분자량 마커(kDa 단위)의 위치가 도시되어 있다.
도 5a 및 도 5b: 다양한 재조합 MV의 비교 융합성 특성. Vero 세포는 0.05의 MOI에서 A) MV-ATU3-S, 또는 B) MV-AUT3-S2P, MV-ATU3-S2P3F, MV-ATU3-S2PΔF 또는 MV-ATU3-S2PΔF2A, 또는 모체 MV Schwarz 균주(MVSchw)로 감염되었다. 감염 후 39시간에, 세포 단층이 관찰되었고 융합된 세포 영역이 표시되었다.
도 6a 및 도 6b: SARS-CoV-2 스파이크를 발현하는 재조합 MV로 프라임 및 부스트 면역화 후 IFNAR-KO 마우스에서 홍역(A) 및 SARS-CoV-2 S(B)에 대한 항체 반응. 마우스를 모체 MV Schwarz 균주(Schw), MV-ATU3-S (S), MV-AUT3-S2P (S2P), MV-ATU3-S2P3F (S2P3F), MV-ATU3-S2PΔF (S2PΔF) or MV-ATU3-S2PΔF2A (S2PΔF2A)로 면역화시켰다. 항체 반응은 프라임(그래프의 왼쪽 부분) 또는 부스트(그래프의 오른쪽 부분) 후에 수집된 혈청에서 홍역 특이적 ELISA(A) 및 SARS-CoV-2 스파이크 특이적 ELISA(B)에 의해 측정되었다. 막대는 중앙값을 표시한다. 항-MV ELISA에서 검출 한계(점선)는 50 ELISA 유닛이었다. 항-S ELISA에 대한 검출 한계는 부스트 후에 수집된 혈청의 경우 200 ELISA 단위였으며 다른 모든 분석에서는 50 ELISA 단위였다. 두 개 이상의 독립적인 실험의 대표적인 결과가 도시되어 있다.
도 7a 및 도 7b: SARS-CoV-2 스파이크를 발현하는 재조합 MV로 프라임 및 부스트 면역화 후 IFNAR-KO 마우스에서 SARS-CoV-2 미세중화 역가. A. 마우스를 모체 MV Schwarz 균주(Schw), MV-ATU3-S (S), MV-AUT3-S2P (S2P), MV-ATU3-S2P3F (S2P3F), MV-ATU3-S2PΔF (S2PΔF) or MV-ATU3-S2PΔF2A (S2PΔF2A)로 면역화시켰다. 중화 역가는 프라임(그래프의 왼쪽 부분) 또는 프라임/부스트(그래프의 오른쪽 부분) 면역화 후 미세중화 분석에 의해 측정되었으며, 세포변성 효과에 의해 득점된 50% SARS-CoV-2 감염성의 중화를 초래하는 혈청 희석의 역수로 표현되었다. 막대는 중앙값을 표시한다. 검출 한계는 역가 20이었다. 중화 활성을 검출할 수 없는 샘플에는 검출 한계의 절반과 동일한 10의 값이 할당되었다. 두 개 이상의 독립적인 실험의 대표적인 결과가 도시되어 있다. B. 미량중화 분석에서 연구 시약 20/118(4개의 회복기 인간 혈청인 20/120,122,124,126 및 대조군 인간 혈청인 128으로 구성된 패널) 및 NIBSC(National Institute of Biological Standards and Controls)에 의해 제공된 20/130의 평가는 다른 분석과 결과를 비교할 수 있었다. 연구 시약은 MV-ATU3-S2PΔF를 이용한 2차 면역 후에 얻은 혈청 풀(S2PF-IS2 pool)과 함께 중화 분석에서 서로 다른 날짜에서 4번 측정되었다. 동일한 SARS-CoV-2 균주의 두 가지 다른 스톡(C2 및 C3.4)이 사용되었다. 분석에 사용된 역적정 SARS-CoV-2 TCID50이 도시된다. NIBSC에서 제공한 결과는 비교를 위해 나열되며, 세포변성 효과(CPE) 또는 플라크 분석(PRNT50)에 의해 점수가 매겨진 바이러스 감염성을 50% 억제한 혈청 희석액의 역수로 표시된다.
도 8: 부스트 면역화 후 면역화된 마우스에서 MV 및 S-특이적 IFN-γ T 세포. 마우스를 MV-ATU3-S2PΔF2A(S2PΔF2A) 또는 모체 MV Schwarz(MVSchw)로 3주 간격으로 2회 면역화시켰다. S 단백질(S1, S2)에 걸쳐 있는 펩티드 풀 또는 2개의 특정 홍역 펩티드 풀로 자극된 비장세포에서 IFN-γ ELISpot 반응(스팟 형성 단위, SPU)의 합계가 도시된다. 막대는 중앙값을 표시한다.
도 9a 내지 도 9c: SARS-CoV-2 스파이크를 발현하는 재조합 MV로 면역화된 마우스에서의 MV 및 S-특이적 CD4+ 및 CD8+ T 세포 반응. 마우스를 MV-ATU3-S (S), MV-AUT3-S2P (S2P), MV-ATU3-S2P3F (S2P3F), MV-ATU3-S2PΔF (S2PΔF), MV-ATU3-S2PΔF2A (S2PΔF2A) 또는 모체 MV Schwarz(Schw)로 면역화시켰다. 비장 CD4+ T 세포(A) 또는 CD8+ T 세포(B)가 S1에 걸친 펩티드 풀에 반응하여 Th1 특징적인 사이토카인 IFN-γ 및 TNF-α 또는 Th2 특징적인 사이토카인 IL-5 및 IL-13을 생성하는 빈도 또는 SARS-CoV-2 스파이크 단백질의 S2 도메인은 누적되어 도시되어 있다(S1 및 S2 풀에 대한 합산된 반응). MV에 대한 INF-γ/TNF-α 또는 IL-5/IL-13 CD8+ T 세포 반응(2개의 H-2b 클래스 I - 제한된 홍역 펩티드의 풀)은 패널 C에 도시되어 있다.
도 10a 내지 도 10d: MV-ATU3-S2PΔF2A로 면역화된 마우스에서 MV 및 S-특이적 이중 및 단일 사이토카인-양성 CD4+ 및 CD8+ T 세포 반응. 마우스를 MV-ATU3-S2PΔF2A(S2PΔF2A) 또는 모체 MV Schwarz(MVSchw)로 면역화시켰다. SARS-CoV-2 스파이크 단백질의 S1 또는 S2 도메인에 걸쳐 있는 펩티드 풀에 반응하여 비장 CD4+ T 세포(A) 또는 CD8+ T 세포(C)에서 Th1 특징적인 사이토카인 IFN-γ 및 TNF-α 또는 Th2 특징적인 사이토카인 IL-5 및 IL-13(각각 이중 양성 세포)을 생산하는 빈도는 누적되어 도시되어 있다(S1 및 S2 풀에 대한 반응 합계). 또한, MV 백본에 대한 T 세포 반응을 평가하기 위해 2개의 H-2b 클래스 I - 제한된 홍역 펩티드 풀을 사용했다. S 펩티드 풀에 반응하여 CD4+ T 세포(B) 또는 CD8+ T 세포(D)를 생성하는 단일 사이토카인의 빈도는 TNF-α 생산 CD4+ T 세포를 제외하고, MV-ATU3-S2PΔF2A 또는 MVSchw 대조군으로 면역화된 마우스에서 유의하게 다르지 않았다(ns). 통계적 분석은 Mann-Whitney test를 이용하여 수행하였다(** p≤0.005, * p≤0.05).
도 11a 내지 도 11d: SARS-CoV-2를 발현하는 재조합 MV로 프라임 및 부스트 면역화 후 IFNAR-KO 마우스에서 IgG1 및 IgG2a 반응. 마우스를 모체 MV Schwarz 균주(Schw), MV-ATU3-S (S), MV-AUT3-S2P (S2P), MV-ATU3-S2P3F (S2P3F), MV-ATU3-S2PΔF (S2PΔF) or MV-ATU3-S2PΔF2A (S2PΔF2A)로 면역화시켰다. A. ELISA로 측정한 SARS-CoV-2 스파이크에 대한 동형 특이적(IgG1 및 IgG2a) 항체 반응. 막대는 중앙값을 표시한다. 검출 한계는 50 ELISA 단위였다. B/D. 각 작제물/면역원에 대해 계산된 IgG2a 대 IgG1의 비율. C. 대조 실험은 HEK293 세포(T4S2P3F-8H)에서 발현된 명반-아주반트가 첨가된 삼량체화된 스파이크 엑토도메인으로 wt 129/Sv 마우스를 면역화시켜 수행하였다.
도 12a 및 도 12b: 프라임 및 부스트(A) 또는 단일(B) 면역화 후 SARS-CoV-2에 의한 챌린지에 대한 마우스의 보호. A. 마우스는 모체 MV Schwarz 균주(Schw), MV-ATU3-S(S), MV-AUT3-S2P(S2P), MV-ATU3-S2PΔF(S2PΔF) 또는 MV-ATU3-S2PΔF2A(S2PΔF2A)로 4주 간격으로 2회 면역화되었다. 혈액 샘플은 2차 면역화 20일 후에 채취하고 각각의 중화 역가(μNT)를 측정했다. 마우스에 추가 면역화 25일 후에 Ad5:hACE2를 주입하고 4일 후에 SARS-CoV-2로 챌린지(challenge)했다. B. 마우스를 모체 MV Schwarz 균주(Schw) 또는 MV-ATU3-S2PΔF2A(S2PΔF2A)로 1회 면역화시켰다. 면역화 후 165일에 혈액 샘플을 채취하고 μNT 역가를 측정하였다. 173일째에 마우스에 Ad5:hACE2 25를 주입하고 4일 후에 챌린지했다. 두 실험 모두에서, 챌린지 4일 후에 폐를 채취했다. 폐 바이러스 부하은 게놈 등가물(GEQ)의 RNA 수준 또는 폐당 플라크 형성 단위(PFU)의 감염 역가에 대하여 측정하였다. 미세중화 역가, GEQ 및 감염성 바이러스의 차이의 통계적 유의성은 Dunn의 수정되지 않은 사후 분석(A) 또는 Mann-Whitney 테스트(B)와 함께 비모수 Kruskal-Wallis 테스트를 사용하여 평가되었다. * p<0.05, ** p<0.005, *** p<0.0005, **** p<0.0001. GraphPad Prism 8을 사용하여 분석을 수행했다.
도 13a 내지 도 13b: ATU2 및 ATU3 작제물에서 세포 용해물에서 웨스턴 블롯에 의한 SARS-CoV-2 S의 검출. Vero 세포는 MOI=1에서 (A) 모체 MV Schwarz 균주(Schw), MV-ATU3-S (S)의 4개의 상이한 클론(1 내지 4), 또는 MV-ATU2-SMVopt(SMVopt)의 6개의 상이한 클론(1 내지 6), 및 (B) 모체 MV Schwarz 균주(Schw), MV-ATU2-SMVopt(SMVopt)의 하나의 대표적인 클론, MV-ATU3-S2P(S2P), MV-ATU3-S2P3F(S2P3F), MV-ATU3-S2PΔF(S2PΔF), 또는 MV-ATU2-SMVopt2P(SMVopt2P), MV-ATU2-SMVoptΔF(SMVoptΔF), MV-ATU2-SMVopt2PΔF(SMVopt2PΔF)의 2개의 상이한 클론으로 감염시켰다. 단백질 세포 추출물은 감염 후 24시간에 제조하고, NuPAGE 4-12% Bis-Tris 겔에서 전기영동으로 분리하고, PVDF 막으로 옮기고, 항-SARS-CoV-2 스파이크 다클론 토끼 항체인 AlexaFluor 680-접합된 항-토끼 항체 및 NearIR 이미징으로 검출했다. 로딩 대조군으로 항-MV 핵단백질 다클론 토끼 항체(Covalab)를 사용하여 홍역의 N 단백질을 검출하였다. SARS-CoV-2 스파이크 단백질, S1 및 S2 하위 도메인, 홍역 N 단백질 및 분자량 마커(kDa 단위)의 위치가 도시되어 있다.
도 14a 내지 도 14c: ATU2 또는 ATU3에서 SARS-CoV-2 스파이크를 발현하는 재조합 MV로 면역화한 후 IFNAR-KO 마우스에서 홍역(A) 및 SARS-CoV-2 S(B) 및 미세중화 역가(C)에 대한 항체 반응. 마우스를 모체 MV Schwarz 균주(Schw), MV-ATU3-S(S), 또는 MV-ATU2-SMVopt(SMVopt)로 면역화시켰다. 프라임 또는 부스트 후에 수집된 혈청의 항체 반응은 홍역 특이적 ELISA(A) 및 SARS-CoV-2 스파이크 특이적 ELISA(B)로 측정되었으며, 중화 항체는 미세중화 분석(C)으로 측정되었다. 막대는 중앙값을 표시한다. 정량화의 하한은 점선으로 표시된다.
도 15: 6P-안정화된 SARS-CoV-2 스파이크를 발현하는 재조합 MV Schwarz의 시험관내 및 생체내 평가.
Vero 세포는 MV-ATU3-S, MV-ATU3-S2P, MV-ATU3-S2PΔF 또는 MV-AUT3-S6P(2개의 바이러스 클론) 또는 모체 MV Schwarz 균주(MVSchw)로 MOI 1로 감염시키거나 감염시키지 않았다(NI). 감염 후 24시간에 총 세포 추출물을 제조하고, NuPAGE 4-12% Bis-Tris 겔에서 전기영동으로 분리하고, PVDF 막으로 옮기고 항-SARS-CoV-2 스파이크 다클론 토끼 항체 AlexaFluor 680-접합 항-토끼 항체 및 NearIR 이미징(A, 상단 패널)으로 검출했다. 로딩 대조군으로서, 항-MV 핵단백질 폴리클로날 토끼 항체(Covalab)(A, 하부 패널)를 사용하여 MV N 단백질을 검출하였다. SARS-CoV-2 스파이크 단백질, S1 및 S2 하위 도메인, 홍역 N 단백질 및 분자량 마커(kDa 단위)의 위치가 도시되어 있다.
IFNAR-KO 마우스는 모체 MV Schwarz 균주(Schw), MV-ATU3-S2P(S2P), MV-AUT3-S2PF(S2PΔF) 또는 MV-ATU3-S6P(S6P)로 4주 간격으로 두 번 면역화시켰다. 홍역 특이적 ELISA(B), SARS-CoV-2 스파이크 특이적 ELISA(C) 및 SARS-CoV-2 미세중화 분석(μNT, D)에 의해 프라임 또는 부스트 후 3주에 수집된 혈청에서 항체 반응을 측정했다. 챌린지 후 4일째에 폐를 채취하였다. 폐 바이러스 부하은 폐(E)당 RNA 수준(GEQ)으로 결정되었다. 막대는 중앙값을 표시한다. 정량화의 하한은 점선으로 표시된다. GEQ 역가 차이의 통계적 유의성은 Dunn의 수정되지 않은 사후 분석과 함께 Kruskal-Wallis 테스트를 사용하여 평가되었다. ** p<0.005, *** p<0.0005. GraphPad Prism 8을 사용하여 분석을 수행했다.
도 16: 재조합 MV에 의해 암호화되는 S 및 다양한 돌연변이된 S 단백질의 융합 특성의 비교 분석. HEK-293T-GFP10 세포를 플라스미드로 형질감염시켜 S(wt-S), S2P(S-2P), S3F(S-3F), S2P3F(S-2PΔ3F) 또는 S2PF(S-2PΔF)의 일시적 발현을 가능하게 하고, hACE2 발현 플라스미드로 형질감염된 HEK-293T-GFP11 세포와 공동 배양하여, 문헌[Buchrieser 등 (2020)]에서 S에 대해 설명된 분석법에 따라 두 세포 하위 집단 간에 융합이 발생하는 경우 GFP 활성을 재구성할 수 있도록 하였다. 음성(neg, mock-transfected) 및 양성(pos, 높은 수준에서 S를 발현하는 플라스미드로 형질전환됨) 대조군이 포함되었다. 세포 시트의 이미지를 형질감염 후 18시간에 기록하였다. 융합 비율은 세포 면적당 GFP 면적으로 점수를 매기고 이미지 아래에 그래프에 표시했다.
도 17: 프라임만 면역화한 후 SARS-CoV-2에 의한 챌린지에 대한 마우스의 보호. 마우스를 모체 MV Schwarz 균주(Schw), MV-ATU3-S2P(S2P) 또는 MV-ATU3-S2PΔF2A(S2PΔF2A)로 1회 면역화시켰다. 면역화 후 3주에 혈액 샘플을 채취하고 홍역 특이적 ELISA(A), SARS-CoV-2 스파이크 특이적 ELISA(B) 및 SARS-CoV-2 미세중화 분석(μNT, C)에 의해 항체 반응을 측정했다. 면역화 후 24주에 마우스에 Ad5:hACE를 주입하고 4일 후에 챌린지하였다. 챌린지 후 4일째에 폐를 채취하였다. 폐 바이러스 부하은 폐당 RNA 수준(GEQ) 또는 감염 역가(PFU)로 결정하였다. 막대는 중앙값을 표시한다. 정량화의 하한은 점선으로 표시된다. 미세중화 역가, GEQ 및 감염성 바이러스의 차이의 통계적 중요성은 Dunn의 수정되지 않은 사후 분석과 함께 Kruskal-Wallis 테스트를 사용하여 평가되었다. * p<0.05, ** p<0.005, *** p<0.0005. GraphPad Prism 8을 사용하여 분석을 수행했다.
도 18: 동종삼량체로의 효율적인 분비 및 조립을 위한 SARS-CoV-2 스파이크 엑토도메인 작제물의 최적화. (A). Ser-Gly-Gly 연결 링커 DLGN Twin-strep-tag (Strep Tag)를 통해 C-말단에서 foldon(T4 또는 GCN4)에 융합된 S의 전장 엑토도메인에 해당하는 스파이크(tri-Secto)의 분비되고 삼량체화된 형태의 개략도. 신호 펩티드, 서브도메인 S1 및 S2, 푸린 절단 부위, 융합 펩티드, 헵타드(heptad) 반복부(HR) 1 및 2 및 커넥터 도메인(CD)의 위치가 표시되어 있다. 텍스트에 설명된 돌연변이의 위치는 개략도 아래에 화살표를 사용하여 표시되어 있다. 작제물은 돌연변이 및 폴돈의 조합에 따라 명명되었다. 예를 들어, T4-S2P3F는 2P 및 3F 돌연변이 및 T4 피브리틴 폴돈을 겸비했다. 전장 단백질을 안정화하기 위한 푸린 절단 부위의 돌연변이(3F:R682G+R683S+R685G) 또는 결실(DetaF: 6756QTQTNSPRRAR-685); 돌연변이(2P: K986P+V987P)는 융합전 형태의 단백질을 잠근다. 삼량체화 폴돈: T4 또는 GCN4(B). HEK 293T 세포는 표시된 pCI-Spike_ectomain 플라스미드 DNA로 일시적으로 형질감염되거나(패널의 오른쪽 부분, 분비된 엑토도메인에 대한 foldon T4 또는 GCN4가 표시됨) 대조군으로서, 스파이크의 전체 길이 변이체(패널의 왼쪽 부분, 전체 길이 막 고정(mb) 스파이크)를 암호화하는 pCI-S2P, pCI-S2PF 및 pCI-S3F 플라스미드 DNA 로 형질감염되었다. 상청액을 형질감염 후 48시간에 수집하고, NuPAGE 4-12% Bis-Tris 겔에서 전기영동으로 분리하고, PVDF 막으로 옮기고, 항-SARS-CoV-2 스파이크 다클론 토끼 항체, AlexaFluor 680-접합 항-토끼 항체 및 근적외선 이미징으로 검출했다. 분자량 마커의 위치(kDa)가 도시되어 있다. (C). T4-S2P3F, GCN4-S2P3F 및 T4-S2P 폴리펩티드는 Superdex200 컬럼에서 크기 배제 크로마토그래피에 의해 분리되었다. 용리 프로파일은 280nm(mAU)에서의 흡광도에 의해 기록되었다.
도 19: MV-ATU3-T4-S2P3F 감염된 세포의 상청액에서 SARS-CoV-2 스파이크 엑토도메인의 검출. Vero 세포는 0.05의 MOI에서 MV-ATU3-S2P3F, MV-ATU3-Secto, MV-ATU3-T4-S2P3F(4개 바이러스 클론) 또는 모체 MV Schwarz 균주(MVSchw)로 감염시키거나 감염시키지 않았다(NI). 상층액(상단 패널)을 수집하고, 감염 후 39시간에 총 세포 추출물(중간 패널)을 제조하고, NuPAGE 4-12% Bis-Tris 겔에서 전기영동으로 분리하고, PVDF 멤브레인으로 옮기고 항-SARS-CoV-2 스파이크 다클론 토끼 항체, AlexaFluor 680-결합 항토끼 항체 및 근적외선 이미징으로 검출했다. 총 세포 추출물에 대한 로딩 대조군으로서, 항-MV 핵단백질 폴리클로날 토끼 항체(Covalab)(하단 패널)를 사용하여 MV N 단백질을 검출하였다. SARS-CoV-2 스파이크 단백질/엑토도메인, S1 및 S2 하위 도메인, 홍역 N 단백질 및 분자량 마커(kDa 단위)의 위치가 되시되어 있다.
도 20: ATU2-N 및 ATU2-NMVopt 바이러스에 감염된 세포의 용해물에서 SARS-CoV-2 N의 발현 수준. Vero 세포는 MV-ATU2-N(4개 바이러스 클론), MV-ATU2-NMVopt(4개 바이러스 클론) 또는 모체 MV Schwarz 균주(MVSchw)로 MOI 1로 감염시키거나 감염시키지 않았다(NI). 감염 후 24시간에 총 세포 추출물을 제조하고, NuPAGE 4-12% Bis-Tris 겔에서 전기영동으로 분리하고, PVDF 막으로 옮기고, 항-SARS-CoV-2 핵단백질 다클론 토끼 항체, AlexaFluor 680-접합된 항-토끼 항체 및 근적외선 이미징(상단 패널)으로 검출했다. 로딩 대조군으로서, 항-MV 핵단백질 폴리클로날 토끼 항체(Covalab)를 사용하여 MV N 단백질을 검출하였다(하부 패널). SARS-CoV-2 핵단백질, 홍역 N 단백질 및 분자량 마커(kDa 단위)의 위치가 도시되어 있다.
도 21 . SARS-CoV-2의 고유 S 단백질 개략도. 천연 S 단백질의 길이는 1273개 아미노산(aa)이다. 단백질은 푸린 절단 부위(F)에서 절단에 의해 생성된 2개의 서브유닛인 S1 및 S2를 포함한다. S1은 신호 펩티드(SP), N-말단 도메인(NTD) 및 수용체 결합 도메인(RBD)을 포함한다. S2는 융합 펩티드(FP), 헵타드 반복 1(HR1) 및 2(HR2), 막횡단 도메인(TM) 및 세포질 꼬리(CT)를 포함한다. 2P는 두 개의 돌연변이된 프롤린인 K986P와 V987P를 나타낸다. 문자 KLHYT는 CT에서 서열번호 149의 소포체 검색 신호(ERRS) 모티프 KxHxx를 나타낸다. dER은 CT에서 11개의 C-말단 아미노산이 결실된 작제물을 나타낸다.
도 22a 내지 도 22d . S 유전자 작제물의 개략도 및 S-발현 rMV의 특성 규명. a 주목할만한 도메인이 있는 SARS-CoV-2의 고유 S 유전자는 MV 벡터에 클로닝된 S 유전자 구조와 관련하여 도시되어 있다. 2P 및 dER 변형도 도시되어 있다. 모든 S 작제물은 MV 벡터 플라스미드인 pTM-MVSchwarz(MV Schwarz)의 두 번째(ATU2) 또는 세 번째(ATU3) 추가 전사 단위에 클로닝되었다. MV 게놈은 핵단백질(N), 인단백질(P), V 및 C 부속 단백질, 기질(M), 융합체(F), 혈구응집소(H) 및 폴리머라제(L) 유전자를 포함한다. 플라스미드 요소에는 T7 RNA 폴리머라제 프로모터(T7), 해머헤드 리보자임(hh), 델타 간염 바이러스 리보자임(δ) 및 T7 RNA 폴리머라제 터미네이터(T7t)가 포함된다. b 0.1의 MOI에서 Vero 세포를 감염시키는데 사용되는 rMV 작제물의 성장 동역학. 세포 관련 바이러스 역가는 TCID50/ml로 표시된다. c 2P 돌연변이가 있거나 없는 ATU2 또는 ATU3의 Sf-dER 또는 S2-dER을 발현하는 rMV로 감염된 Vero 세포의 세포 용해물에서 SARS-CoV-2 S 단백질의 웨스턴 블롯 분석. d 감염 24시간 후 표시된 rMV로 감염된 Vero 세포의 면역형광 염색. 투과되거나 투과되지 않은 세포는 S, MV N 및 핵에 대해 염색되었다.
도 23a 내지 23f . 프라임-부스트 백신접종에 의한 체액성 반응의 유도. a IFNAR -/- 마우스(빈 MV 대조군의 경우 n=6 또는 n=4)의 상동 프라임-부스트는 0일과 28일에 표시된 rMV의 1x105 TCID50으로 복강내 면역화하였다. 면역화 28일 및 42일 후에 혈청을 수집하고 b MV 항원 또는 c S-SARS-CoV-2 S에 대한 특이적 항체 반응을 평가했다. 데이터는 개별 동물을 나타내는 각 데이터 포인트와 함께 상호 종말점 희석 역가(reciprocal endpoint dilution titer)를 보여준다. d 50% 플라크 감소 중화 시험(PRNT50) 역가로 표현되는 SARS-CoV-2 바이러스에 대한 중화 항체 반응. e 1차 면역화 후 4주째에 마우스에서 S-특이적 항체 반응의 IgG 서브클래스. f IgG2a/IgG1 또는 Th1/Th2 반응의 비율. 데이터는 기하학적 SD를 나타내는 선과 오차 막대와 함께 기하학적 평균으로 표시된다. 통계적 유의성은 다중 비교를 위해 조정된 양방향 ANOVA에 의해 결정되었다. 별표(*)는 Mann-Whitney U-검정에 의해 결정된 유의미한 평균 차이(** p<0.01 및 **** p<0.001)를 나타낸다.
도 24a 내지 도 24d. rMV 백신접종에 의한 S-특이적 세포 반응의 유도. a 표시된 rMV의 1x105 TCID50으로 복강내 면역화된 IFNAR -/- 마우스의 면역화(빈 MV 대조군의 경우 n=12 또는 n=3). 면역화 7일 후, 새로 추출된 비장세포에서 IFN-γ에 대한 ELISPOT을 수행했다. 데이터는 CD8+ 또는 CD4+ T 세포에 특이적인 b MV Schwarz 또는 c SARS-CoV-2 S 펩티드 풀로 자극한 후 검출된 1x106 비장세포당 IFN-γ 분비 세포 또는 반점 형성 세포(SFC)로 표시된다. d MV Schwarz에 의해 자극된 세포에 대한 CD4+ 또는 CD8+ 펩티드에 의해 자극된 IFNγ-분비 세포의 비율. 각 데이터 포인트는 개별 마우스를 나타낸다. 별표(*)는 Mann-Whitney U-검정에 의해 결정된 유의미한 평균 차이(* p<0.05; ** p<0.01 및 **** p<0.001)를 나타낸다.
도 25a 및 도 25b . T 세포의 사이토카인 발현 프로필. 표시된 rMV의 1x105 TCID50으로 복강내(i.p.) 면역화된 IFNAR -/- 마우스(빈 MV 대조군의 경우 n=12 또는 n=3) 및 비장세포를 S-특이적 펩티드 풀로 자극하였다. S-특이적 a CD8+ 및 b CD4+ T-세포를 세포내 IFN-γ, TNFα 및 IL-5에 대해 염색하였다. 별표(*)는 Mann-Whitney U-검정에 의해 결정된 유의미한 평균 차이(* p<0.05; ** p<0.01 및 **** p<0.001)를 나타낸다.
도 26a 내지 도 26f. 중화 항체 및 면역 보호의 지속성. a IFNAR -/- 마우스(n=6)에 대한 면역화 및 챌린지 일정. 동물을 0일 및 28일에 상동 프라임-부스트에 의해 복강내 면역화시켰다. 혈청을 52일, 72일 및 110일에 수집하였다. 동물은 110일째에 1.5 x 105 PFU에서 마우스 적응 SARS-CoV-2 바이러스(MACo3)의 비강내 접종에 의해 챌린지하였다. 혈청은 b MV 및 c SARS-CoV-2 S에 대한 특정 항체의 수준에 대해 평가하였다. d SARS-CoV-2 바이러스에 대한 중화 항체 반응은 50% 플라크 감소 중화 시험(PRNT50) 역가로 표현하였다. e SARS-CoV-2 바이러스 RNA 카피는 감염된 동물의 균질화된 폐에서 RT-qPCR에 의해 검출하였으며, 카피/폐로 계산하였다. f PFU/폐로 표현되는 면역화된 동물의 균질화된 폐로부터 회수된 감염성 바이러스 입자의 역가. 데이터는 기하학적 SD를 나타내는 선과 오차 막대와 함께 기하학적 평균으로 표시되어 있다. 통계적 유의성은 다중 비교를 위해 조정된 양방향 ANOVA에 의해 결정되었다. 별표(*)는 유의미한 평균 차이를 나타낸다(* p<0.05; ** p<0.01 및 **** p<0.001).
도 27a 내지 도 27g . 단일 예방 접종 후 면역 반응 및 보호. a IFNAR-/- 마우스(n=6)에 대한 면역화 및 챌린지 일정. 동물은 0일에 복강내 면역화하였다. 혈청은 24일 및 48일에 수집하였다. 동물은 48일에 1.5 x 105 PFU에서 마우스 적응 SARS-CoV-2 바이러스(MACo3)의 비강내 접종에 의해 챌린지하였다. 혈청은 b MV 및 c S-SARS-CoV-2 단백질에 대한 특이적 항체의 수준에 대해 평가되었다. d 50% 플라크 감소 중화 시험(PRNT50) 역가로 표현되는 SARS-CoV-2 바이러스에 대한 중화 항체 반응. e SARS-CoV-2 바이러스 RNA 카피는 감염된 동물의 균질화된 폐에서 RT-qPCR에 의해 검출되었으며, 카피/폐로 계산되었다. f PFU/폐로 표현되는 면역화된 동물의 균질화된 폐로부터 회수된 감염성 바이러스 입자의 역가. 데이터는 기하학적 SD를 나타내는 선과 오차 막대와 함께 기하학적 평균으로 표시되어 있다. 항체 반응에 대한 통계적 유의성(상단 패널)은 다중 비교를 위해 조정된 양방향 ANOVA에 의해 결정되었다. 나머지 데이터(하단 패널)는 Mann-Whitney U-test로 분석되었다. 별표(*)는 유의미한 평균 차이를 나타낸다(* p<0.05; ** p<0.01 및 **** p<0.001).
도 28 . 형질감염된 HEK293T 세포의 표면에서 SARS-CoV-2 S 항원의 발현. 전장 S 또는 S2 소단위 항원을 암호화하는 pcDNA 발현 벡터로 형질감염된 세포를 항-S 항체에 이어 Alexa Fluor 488-접합된 염소 항-토끼 IgG로 간접 면역형광을 위해 염색하였다. 요오드화 프로피듐은 게이팅에 의해 죽은 세포를 배제하는데 사용되었다(상단 점 도표). 히스토그램은 전장 S(왼쪽 히스토그램) 또는 S2 소단위 단백질(오른쪽 히스토그램)의 표면 발현을 보여준다. 천연 형태 S 항원(밝은 회색), 사전 융합 안정화된 S(진한 회색), 모의(mock) 형질감염된 대조군 세포(검정 히스토그램) 및 해당 평균 형광 강도(MFI)가 도시되어 있다.
도 29 . 형질감염된 Vero 세포에서 S 단백질 매개 신시튬(syncytium) 형성. SARS-CoV-2 S 단백질을 암호화하는 pcDNA 발현 벡터로 형질감염된 Vero 세포의 이미지를 형질감염 24시간 후에 획득했다. 상단 이미지는 천연 형태 S 항원을 암호화하는 플라스미드로 형질감염된 Vero 세포를 보여주는 반면, 하단 이미지는 융합전 안정화 S 항원으로 형질감염된 세포 및 형질감염되지 않은 대조 Vero 세포를 보여준다. 회색 선은 syncytia의 경계를 나타낸다. 천연(native) SF는 손상되지 않은 CT가 있는 천연 형태의 전장 S 단백질을 나타낸다.
도 30 . 재조합 MV 백신으로 감염된 Vero 세포에서 세포내 S 단백질 발현의 면역형광 분석. Vero 세포는 SARS-CoV-2 S 단백질 또는 빈 MV Schwarz를 발현하는 rMV로 감염시켰다. 감염 24시간 후, 토끼 항-S 항체에 이어 Cy3-결합 염소 항-토끼 IgG를 사용하여 사포닌 투과성 세포에서 S 단백질을 검출하였다. MV N 단백질은 마우스 모노클로날 항-N 항체에 이어 Alexa Fluor 488-접합 염소 항-마우스 IgG를 사용하여 시각화되었다. 핵은 DAPI로 염색되었다. 형광 현미경을 사용하여 이미지를 획득했다.
도 31 . 재조합 MV 백신으로 감염된 Vero 세포에서 S 단백질 표면 발현의 면역형광 분석. Vero 세포는 SARS-CoV-2 S 단백질 또는 빈 MV Schwarz를 발현하는 rMV로 감염시켰다. 감염 24시간 후, 토끼 항-S 항체에 이어 Cy3 결합 염소 항토끼 IgG를 사용하여 비투과성 세포 표면에서 S 단백질을 검출하였다. MV N 단백질은 마우스 모노클로날 항-N 항체에 이어 Alexa Fluor 488-접합 염소 항-마우스 IgG를 사용하여 시각화하였다. 핵은 DAPI로 염색되었다. 형광 현미경을 사용하여 이미지를 획득했다.
도 32 . 연속 계대 유래의 재조합 MV 백신으로 감염된 Vero 세포에서 S 단백질 발현의 웨스턴 블롯 분석. SF-dER 또는 SF-2P-dER 항원을 발현하는 MV ATU2 백신은 P1에서 P10까지 Vero 세포에서 연속적으로 계대되었고 S 단백질 발현은 P1, P5 및 P10 세포 용해물의 면역블롯팅에 의해 측정되었다. 빈 MV로 감염된 Vero 세포를 병렬로 검사하고 음성 대조군으로 사용했다.
도 33A 내지 도 33C . 1x10 5 TCID 50 의 MV-ATU2-SF-2P-dER 또는 빈 MV로 복강내(i.p.) 면역화된 IFNAR -/- 마우스(대조군 빈 MV 그룹의 경우 n=5 또는 n=3)에서 평가된 T 세포의 사이토카인 발현 프로파일. S-특이적 CD4 또는 CD8 펩티드로 비장세포를 자극하였다(표 6A 및 표 6B). S-특이적 a CD8+ 및 b CD4+ T-세포를 세포내 IFN-γ, TNFα, IL-5 및 IL13에 대해 염색하였다. c S-특이적 CD4+ 메모리 T 세포를 세포내 IL-5 및 IL13에 대해 염색하였다. 별표(*)는 다중 비교 테스트를 통해 Kruskal-Wallis ANOVA에 의해 결정된 유의한 평균 차이(* p<0.05)를 나타낸다.
도 34A 내지 도 34C . 용량 의존적 상동 프라임-부스트 면역. IFNAR -/- 마우스(빈 MV 대조군의 경우 n=6 또는 n=4)를 0일 및 28일에 1x105 TCID50 또는 1x104 TCID50에서 표시된 rmV 백신 후보로 복강내 면역화시켰다. 면역화 후 28일 및 50일 에 혈청을 수집하고, a MV 항원 또는 b SARS-CoV-2 S 단백질에 대한 특이적 항체 반응을 평가했다. 데이터는 각 데이터 포인트가 개별 동물을 나타내는 상호 종말점 희석 역가를 보여준다. c 50% 플라크 감소 중화 시험(PRNT50) 역가로 표현되는 SARS-CoV-2 바이러스에 대한 중화 항체 반응. 데이터는 기하학적 SD를 나타내는 선과 오차 막대와 함께 기하학적 평균으로 표시되어 있다. 통계적 유의성은 다중 비교를 위해 조정된 양방향 ANOVA에 의해 결정되었다. 별표(*)는 유의미한 평균 차이를 나타낸다(*p<0.05, **p<0.01 및 ****p<0.001).
도 35. SARS-CoV-2의 S 단백질을 발현하는 pCDNA로 형질감염된 HEK293T 세포의 FACS 분석. 전장 S 또는 S2 소단위 항원을 암호화하는 pcDNA 발현 벡터로 형질감염된 세포를 항-S 항체에 이어 Alexa Fluor 488-접합 염소 항-토끼 IgG로 간접 면역형광을 위해 염색하였다. 요오드화 프로피듐은 게이팅에 의해 죽은 세포를 배제하는데 사용되었다(상단 점 도표). 히스토그램은 전장 S(왼쪽 히스토그램) 또는 S2 소단위 단백질(오른쪽 히스토그램)의 표면 발현을 보여준다. 천연 형태 S 항원(밝은 회색), 사전 융합 안정화된 S(진한 회색), 모의 형질감염된 대조군 세포(검정 히스토그램) 및 해당 평균 형광 강도(MFI)가 도시되어 있다.
정의
본원에서 사용되는 관사 "a" 및 "an"은 관사의 문법적 대상의 하나 또는 하나 초과(즉, 적어도 하나)를 지칭한다. 예를 들어, "요소(element)"는 하나의 요소 또는 하나 이상의 요소를 의미한다. 또한, "포함하는" 및 "포함하는", "포함하는" 및 "포함된"과 같은 다른 형태의 사용은 제한적이지 않다.
본원에서 사용되는 정량적 용어에서 용어 "약"은 이것이 수식하는 값의 플러스 또는 마이너스 10%를 의미한다(값이 분자 또는 뉴클레오티드의 수와 같이 세분할 수 없는 경우 가장 가까운 정수로 반올림됨).
본원에 개시된 모든 범위는 인용된 종점을 포함하고 독립적으로 조합 가능하다(예를 들어, "50 mg 내지 500 mg"의 범위는 종점인 50 mg 및 500 mg, 및 모든 중간 값을 포함한다).
본원에서 사용되는 "포함하는"이라는 용어는 "~로 구성된" 및 "본질적으로 구성되는" 구현예를 포함할 수 있다. 본원에서 사용되는 용어 "포함하다comprise(s)", "포함하다include(s)", "갖다", "갖다", "포함하다contain(s)" 및 이들의 변형은 개방형 전환 구, 용어, 또는 명명된 성분/단계의 존재를 요구하고 다른 성분/단계의 존재를 허용하는 단어인 것으로 의도된다. 그러나, 그러한 설명은 그 범위 내에서, 임의의 허용가능한 담체 또는 유체와 함께 명명된 구성요소 또는 화합물의 존재를 허용하고 다른 구성 요소 또는 화합물은 제외하는 열거된 구성요소로 "구성되는" 및 "본질적으로 구성되는" 것으로서 조성물 또는 공정을 포괄하는 것으로 해석되어야 한다.
용어 "상류" 및 "하류"는 더 긴 핵산 서열의 RNA 전사 방향(5'에서 3')에 상대적인 더 긴 핵산 서열 내의 핵산 서열의 상대 위치를 지칭하기 위해 본원에서 사용된다. "상류"라는 용어는 더 긴 핵산 서열의 5' 말단(RNA 전사의 초기 단계)에 더 가까운 핵산 서열을 의미한다. "하류"라는 용어는 더 긴 핵산 서열의 3' 말단(RNA 전사의 나중 단계)에 더 가까운 핵산 서열을 의미한다.
본원에서 사용되는 용어 "항원성 폴리펩티드"는 폴리펩티드가 유래되는 바이러스에 대한 면역 반응을 유도할 수 있는 폴리펩티드를 의미한다.
본원에 사용되는 폴리펩티드의 "면역원성 단편"이라는 용어는 폴리펩티드가 유래되는 바이러스에 대한 면역 반응을 유도할 수 있는 폴리펩티드 단편을 의미한다. 면역원성 단편의 비제한적 예로는 SARS-CoV-2의 Secto 폴리펩티드, SARS-CoV-2의 stab-Secto 폴리펩티드, SARS-CoV-2의 S1 폴리펩티드, SARS-CoV-2의 S2 폴리펩티드, SARS-CoV-2의 tri-Secto 폴리펩티드, SARS-CoV-2의 tristab-Secto 폴리펩티드, 및 소포체 보유에 관여하는 도메인에서 돌연변이된 S가 있다.
본 발명의 목적을 위해, 바이러스 균주 SARS-CoV-2는 Genbank에 MN908947 서열로 개시되어 있고 2020년 1월 20일부터 NBCBI로부터 공개적으로 입수가능하고 그 날짜 이후 MN908947.3로 업데이트된 그의 뉴클레오티드 서열(야생형 서열)을 참조하여 특히 기술될 것이다.
텍스트, 도면 및 서열 목록 전체에서 "코로나바이러스 2019-nCoV", "2019-nCoV", "nCoV" 또는 "SARS-CoV-2"라는 표현은 상호교환적으로 사용할 수 있다.
"폴리펩티드" 또는 "코로나바이러스, 특히 SARS-CoV-2의 폴리펩티드"라는 표현은 아미노산 잔기의 연결로 인한 분자를 정의한다.
본원에서 사용되는 것으로, 세포질 꼬리에서 삽입, 치환 또는 결실에 의한 돌연변이를 갖는 S-단백질 또는 이중 도메인 S-단백질의 "증가된 세포 표면 발현"은 인간 배아 신장 세포(HEK) 293T(ATCC CRL-3216)를 발현 작제물로 형질감염시켜서 돌연변이 단백질을 동시에 발현하여 상응하는 비돌연변이 단백질로 형질감염된 HEK 293T 세포를 제어하고 면역 분석법을 사용하여 세포 표면 발현을 측정함으로써 측정된다. 세포 표면 발현은 삽입, 치환 또는 결실에 의한 추가 돌연변이, 예를 들어 2P 돌연변이와 같은 융합전 형태로 S 단백질을 유지하는 추가 돌연변이에 의해 추가로 증가될 수 있다. 예시적인 분석법은 실시예에 설명되어 있고 분석의 특정 결과는 도 28 및 도 35에 제시되어 있다.
본원에서 정의되는 "dER"이라는 표현은 S 단백질, 특히 서열번호 3의 SARS-CoV-2의 S 단백질의 세포질 꼬리로부터 11개의 C-말단 아미노산 잔기(aa 1263-1273)의 결실에 의한 돌연변이를 의미한다. 세포질 꼬리로부터 그 도메인의 결실은 이 폴리펩티드 단편을 발현하는 재조합 MV로 감염된 세포에서 S의 폴리펩티드 단편의 표면 발현을 증가시킨다.
본원에서 정의되는 용어 "2P"는 2개의 아미노산 잔기의 돌연변이, 즉 사전융합 형태로 S 단백질을 유지하는 서열번호 3의 SARS-CoV의 S 단백질의 아미노산 서열의 위치 986 및 987(K986P + V987P)에서 2개의 프롤린 잔기의 치환에 의한 돌연변이를 의미한다. 그 돌연변이는 S2 도메인, 예를 들어, heptad 반복부 1(HR1)과 중심 나선(CH)의 사이에서 발생한다.
본원에서 정의되는 용어 "2A" 또는 "2a"는 잠재적으로 세포 표면 발현을 증가시키기 위한 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열에서 소포체 회수(retrieval) 신호의 2개의 아미노산 잔기(K1269A + H1271A)의 돌연변이를 의미한다.
본원에서 사용되는 문구 "이중 도메인 S 단백질"은 S1 및 S2 도메인을 모두 포함하는 코로나바이러스 스파이크(S) 단백질을 의미한다. 이중 도메인 S 단백질은 돌연변이(치환, 결실 및/또는 추가)를 포함할 수 있지만 전체 S1 또는 S2 도메인이 누락하지는 않는다.
본원에서 사용되는 "암호화"라는 표현은 핵산 분자가 전사되고 적절한 경우 선택된 세포 또는 세포주로의 생성물 발현을 위해 번역되는 능력을 정의한다. 따라서, 핵산 작제물은 코딩 서열의 전사를 제어하는 조절 요소, 특히 전사에 대한 프로모터 및 종결 서열 및 가능하게는 인핸서 및 기타 시스-작용 요소를 포함할 수 있다. 이들 조절 요소는 CoV, 특히 SARS-CoV-2 폴리뉴클레오티드 서열에 대하여 이종성일 수 있다.
"작동가능하게 연결된"이라는 표현은 본 발명의 핵산 작제물의 상이한 폴리뉴클레오티드 사이에 존재하는 기능적 연결을 의미한다. 이러한 기능적 연결에 의하여, 상이한 폴리뉴클레오티드 및 핵산 작제물은 특히 세포 또는 세포주, 특히 본 발명의 재조합 감염성 MV 입자의 생성 또는 증폭을 위한 구출 시스템의 일부로서 사용되는 세포 또는 세포주 또는 숙주 세포, 특히 포유동물 또는 인간 세포에서 효율적으로 전사되고 적절한 경우 번역된다.
본원에서 사용되는 용어 "레플리콘"은 DNA 또는 RNA 복제(즉, 자가 복제)의 자율 단위로서 기능하는 임의의 유전 요소(예: 플라스미드, 염색체, 바이러스 RNA)를 의미한다. 레플리콘은 바이러스 게놈에서 유래할 수 있으며, 야생형 바이러스 게놈과 비교하여 결실 또는 외래 유전자로 대체된 하나 이상의 구조 단백질을 갖는 바이러스 게놈 복제를 위한 바이러스 비구조 유전자를 함유할 수 있다.
본원에서 사용되는 용어 "재조합"은 예를 들어 벡터의 형태로 세포 내로 하나 이상의 폴리뉴클레오티드를 도입하는 것을 의미하며, 폴리뉴클레오티드는 세포 게놈(예를 들어, 상기 정의됨)에 통합(전체 또는 부분적으로)되거나 통합되지 않는다.
본원에서 사용되는 용어 "이동"은 재조합 세포를 상이한 유형의 세포, 특히 상이한 유형의 세포의 단층 상에 플레이팅하는 것을 의미한다. 이들 후자의 세포는 감염성 MV-CoV 입자의 복제 및 생산, 즉 각각 세포 내부에서 감염성 바이러스의 형성 및 세포 외부에서 이러한 감염성 바이러스의 방출을 유지하는 능력이 있다. 이러한 전달은 이전 문장에 정의된 적격 세포와 본 발명의 재조합 세포의 공동 배양을 초래한다. 상기 전달은 재조합 세포가 충분히 효율적인 바이러스 생산 배양물이 아닌 경우, 즉 감염성 MV-CoV 입자가 이들 재조합 세포로부터 효율적으로 회수될 수 없는 경우에 추가적인, 즉 선택적인 단계일 수 있다.
본원에서 사용되는 것으로, 본원에서 개시된 백신 조성물의 용량 또는 양과 관련하여 "유효 용량"이라는 어구는 항체 및/또는 세포성 면역 반응을 유도하는데 필요한 용량을 지칭하며, 이는 후속 챌린지 동안 감염성 물질, 예를 들어 코로나바이러스의 감염의 가능성 또는 중증도를 상당히 감소시키는 용량이다. 몇몇 구현예에서, 유효 용량은 백신 조성물에 대한 패키지 삽입물에 나열된 용량이다.
본원에서 사용되는 것으로, 백신과 같은 예방적 조성물을 언급할 때 사용되는 용어 "부스터"는 본 개시의 면역원성 조성물, 또는 다른 예방적 또는 치료적 화합물의 추가 투여를 의미한다.
본원에서 사용되는 용어 "바이러스-유사 입자"(VLP)는 본 개시의 핵산 작제물에 의해 암호화되지만 핵산 작제물을 포함하지 않는 것으로, 홍역 바이러스 구조 단백질 및 적어도 하나의 SARS-CoV-2 S 폴리펩티드 또는 이의 면역원성 단편을 포함하는 구조를 의미한다. 본 발명의 VLP는 비-감염성 및 비-복제성이다.
본원에서 사용되는 용어 "연관된" 또는 "연관"은 둘 이상의 열거된 요소, 예를 들어 재조합 감염성 복제 MV-CoV 입자 및 VLP를 함유하는 CoV 단백질 및/또는 CoV의 독특한 조성물의 존재를 의미한다. 연관된 요소는 물리적으로 별도의 엔터티일 수 있다.
당업계에 알려진 용어 "동일성"은 서열을 비교함으로써 결정되는 2개 이상의 폴리펩티드 또는 폴리뉴클레오티드의 서열 사이의 관계를 의미한다. 당업계에서, 동일성은 또한 2개 이상의 아미노산 잔기 또는 핵산 잔기의 스트링(string) 간의 매치의 수에 의해 결정되는 것으로 2개 서열 간의 서열 관련성의 정도를 의미한다. 동일성은 특정 수학적 모델 또는 컴퓨터 프로그램(예: "알고리즘")에 의해 처리되는 간격 정렬(있는 경우)이 있는 둘 이상의 서열 중 더 작은 것 간의 동일한 일치의 비율을 측정한다. 관련 펩티드의 동일성은 공지된 방법으로 쉽게 계산할 수 있다. 폴리펩티드 또는 폴리뉴클레오티드 서열에 적용되는 용어 "% 동일성"은, 필요한 경우 최대 퍼센트 동일성을 달성하기 위해 서열을 정렬하고 갭을 도입한 후 제2 서열의 아미노산 서열 또는 핵산 서열과 동일한 후보 아미노산 또는 핵산 서열의 잔기(아미노산 잔기 또는 핵산 잔기)의 백분율로 정의된다. 정렬을 위한 방법 및 컴퓨터 프로그램은 당업계에 잘 알려져 있다. 동일성은 퍼센트 동일성의 계산에 의존하지만 계산에 도입된 갭 및 패널티로 인해 값이 다를 수 있다. 일반적으로, 특정 폴리뉴클레오티드 또는 폴리펩티드의 변이체는 본원에 기술되고 당업자에게 공지된 서열 정렬 프로그램 및 매개변수에 의해 결정된 것으로 특정 참조 폴리뉴클레오티드 또는 폴리펩티드에 대해 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 100% 미만의 서열 동일성을 갖는다. 이러한 정렬 도구에는 BLAST 제품군의 도구가 포함된다(Stephen F. Altschul 등 (1997)." Gapped BLAST and PSI-BLAST: a new generation of protein database search programs," Nucleic Acids Res. 25:3389-3402). 또 다른 대중적인 국소 정렬 기법은 스미스-워터만 알고리즘(Smith, T.F. & Waterman, M.S. (1981) "Identification of common molecule subsequences." J. Mol. Biol. 147:195-197)을 기반으로 한다. 동적 프로그래밍을 기반으로 하는 일반적인 전역(global) 정렬 기법은 Needleman-Wunsch 알고리즘(Needleman, S.B. & Wunsch, C.D. (1970) "A general methodapply the search for similarities of amino acid sequence of two protein." J. Mol. Biol. 48:443-453)을 기반으로 한다. 보다 최근에는, Needleman-Wunsch 알고리즘을 포함한 다른 최적의 전역 정렬 방법보다 빠르게 뉴클레오티드 및 단백질 서열의 전역 정렬을 생성한다고 알려진 FOGSAA(Fast Optimal Global Sequence Alignment Algorithm)가 개발되었습니다. 다른 본원에 설명되어 있으며 특히 아래의 "ID" 정의에서 설명되어 있다.
본원에서 사용되는 용어 "상동성"은 중합체 분자 사이, 예를 들어, 핵산 분자(예: DNA 분자) 및/또는 폴리펩티드 분자 사이의 전반적인 관련성을 의미한다. 일치하는 잔기의 정렬에 의해 결정되는 역치 수준의 유사성 또는 동일성을 공유하는 중합체 분자(예: 핵산 분자(예: DNA 분자) 및/또는 폴리펩티드 분자)를 상동성이라고 한다. 상동성은 분자 간의 관계를 설명하는 정성적 용어이며 정량적 유사성 또는 동일성을 기반으로 할 수 있다. 유사성 또는 동일성은 두 비교된 서열 간의 서열 일치의 정도를 정의하는 정량적 용어이다. 몇몇 구현예에서, 중합체 분자는 서열이 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 이상 동일하거나 유사한 경우 서로 "상동성"이다. "상동성"이라는 용어는 반드시 적어도 2개의 서열(폴리뉴클레오티드 또는 폴리펩티드 서열) 간의 비교를 의미한다. 2개의 폴리뉴클레오티드 서열은 이들이 암호화하는 폴리펩티드가 적어도 20개 아미노산의 적어도 하나의 스트레치에 대해 적어도 50%, 60%, 70%, 80%, 90%, 95%, 또는 심지어 99%인 경우 상동인 것으로 간주된다. 몇몇 구현예에서, 상동성 폴리뉴클레오티드 서열은 적어도 4 내지 5개의 고유하게 특정된 아미노산의 스트레치를 암호화하는 능력을 특징으로 한다. 길이가 60개 미만의 뉴클레오티드인 폴리뉴클레오티드 서열의 경우, 상동성은 적어도 4 내지 5개의 고유하게 지정된 아미노산의 스트레치를 암호화하는 능력에 의해 결정된다. 20개 이상의 아미노산으로 구성된 1개 이상의 스트레치에 대해 단백질이 50%, 60%, 70%, 80%, 또는 90% 이상 동일한 경우 2개의 단백질 서열은 상동성으로 간주된다.
상동성은 비교된 서열이 공통 기원에서 진화적으로 분기되었음을 의미한다. 용어 "상동체"는 공통 조상 서열로부터의 후손에 의한 제2 아미노산 서열 또는 핵산 서열과 관련된 제1 아미노산 서열 또는 핵산 서열(예를 들어, 유전자(DNA 또는 RNA) 또는 단백질 서열)을 의미한다. "상동체"라는 용어는 종분화의 사건에 의해 분리된 유전자 및/또는 단백질 간의 관계 또는 유전적 복제의 사건에 의해 분리된 유전자 및/또는 단백질 간의 관계에 적용될 수 있다. "이종상동체(Ortholog)"는 종분화에 의해 공통 조상 유전자(또는 단백질)에서 진화한 다른 종의 유전자(또는 단백질)이다. 일반적으로.이종상동체는 진화 동안에 동일한 기능을 유지한다. "동종상동체(Paralog)"는 게놈 내 복제에 의해 관련된 유전자(또는 단백질)이다. 이종상동체는 진화하는 동안 동일한 기능을 유지하는 반면 동종상동체는 새로운 기능이 원래 기능과 관련이 있더라도 새로운 기능을 발전시킨다.
본원에서 사용되는 용어 "변이체"는 천연 서열 또는 참조 서열과 비교하여 그의 아미노산 서열 또는 핵산 서열이 상이한 분자이다. 서열 변이체는 천연 서열 또는 참조 서열과 비교하여 서열 내의 특정 위치에서 치환, 결실, 삽입 또는 전술한 것 중 임의의 2개 또는 3개의 조합을 가질 수 있다. 일반적으로, 변이체는 천연 서열 또는 참조 서열에 대해 적어도 50% 동일성을 갖는다. 몇몇 구현예에서, 변이체는 천연 서열 또는 참조 서열과 적어도 80% 동일성 또는 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는다.
본원에서 정의되는 용어 "6P"는 6개의 아미노산 잔기의 돌연변이, 즉 S2 도메인에서 발생하는 융합전 형태로 S 단백질을 유지하는, 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 817, 892, 899, 942, 986 및 987(F817P + A892P + A899P + A942P + K986P + V987P)에서 6개의 프롤린 잔기의 치환에 의한 돌연변이를 의미하고, 상기 돌연변이는 S2 도메인에서 발생한다(Hsieh 등, 2020). K986P 및 V987P 돌연변이는 heptad 반복부 1(HR1)과 중심나선(CH) 사이에서 발생하고, F817P, A892P 및 A899P는 융합펩티드(FP)와 HR1 사이의 연결부위에서 발생하고, A942P 돌연변이는 HR1에서 발생한다.
본원에서 정의되는 용어 "CC"는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 383번 및 985번 위치(S383C 및 D985C)에 있는 2개의 시스테인 잔기의 치환에 의한 돌연변이 또는 폐쇄 형태로 수용체 결합 도메인(RBD)을 유지하는 서열번호 3의 SARS-CoV-2의 S 단백질 아미노산 서열의 위치 413 및 987(G413C 및 P987C) 에 있는 2개의 시스테인 잔기의 치환에 의한 돌연변이를 의미한다(McCallum 등, 2020).
본원에서 정의되는 용어 "폴돈(foldon)"은 인공 삼량체화 도메인, 특히 S 단백질의 엑토도메인의 삼량체화를 촉진하고 가용성 삼량체 형태, 즉 S 단백질의 가용성 삼량체 형태에서 그의 발현을 허용하는 T4 폴돈(즉, 박테리오파지 T4의 피브리틴의 삼량체화 도메인)을 의미한다. 예를 들어, T4 폴돈은 서열번호 16, 서열번호 17, 서열번호 18, 서열번호 19, 서열번호 51 및 서열번호 52의 서열에서 사용되었다. 폴돈의 또 다른 예는 GCN4 폴돈이며, 이는 효모 GCN4 전사활성화제의 삼량체화 도메인에서 유래한 것이다.
본원에서 정의되는 용어 "3F"는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 682, 683 및 685에서 S1/S2 푸린 절단 부위에서 발생하는 3개의 아미노산 잔기의 치환에 의한 돌연변이를 의미한다: R682G + R683S + R685G.
본원에서 정의되는 용어 "ΔF"는 서열번호 3의 위치 675의 SARS-CoV-2의 S 단백질의 아미노산과 위치 685의 아미노산 사이의 S1/S2 푸린 절단 부위를 포함하는 루프의 결실, 즉 서열번호 50의 아미노산 서열 QTQTNSPRRAR의 결실을 의미한다.
본원에서 정의되는 "SARS-CoV-2의 S3F 폴리펩티드"는 안정화된 S 단백질을 포함하는 폴리펩티드를 의미하며, 여기서 S1/S2 푸린 절단 부위는 예를 들어 서열번호 3의 SARS-CoV-2의 S 단백질 아미노산 서열의 682번, 683번 및 685번 위치에 있는 3개의 아미노산 잔기의 돌연변이에 의해 불활성화되었다.
본원에서 정의되는 "SARS-CoV-2의 S2P3F 폴리펩티드"는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 986 및 987에서 2P 돌연변이를 갖고, 예를 들어 서열번호 3의 SARS-CoV-2의 S 단백질 아미노산 서열의 위치 682, 683 및 685(R682G + R683S + R685G)에 있는 3개의 아미노산 잔기의 돌연변이에 의한 S1/S2 푸린 절단 부위의 불활성화를 갖는 안정화된 S 단백질을 포함하는 폴리펩티드를 의미한다.
본원에서 정의되는 "SARS-CoV-2의 S2PΔF 폴리펩티드"는 서열번호 3의 SARS-CoV-의 S 단백질의 아미노산 서열의 위치 986 및 987(K986P + V987P)에서 2P 돌연변이를 갖고, S1/S2 푸린 절단 부위를 포함하는 루프의 결실, 즉 서열번호 3의 S 단백질의 아미노산 서열의 위치 675와 685 사이에 서열번호 50의 아미노산 서열 QTQTNSPRRAR의 결실을 갖는 안정화된 S 단백질을 포함하는 폴리펩티드에 관한 것이다. SARS-CoV-2의 S2PΔF 폴리펩티드에서, 2P 돌연변이는 서열번호 47의 위치 975 및 976(K975P + V976P)에서 발생한다.
본원에서 정의되는 "SARS-CoV-2의 S2PΔF2A 폴리펩티드"는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 986 및 987(K986P + V987P)에서 2P 돌연변이를 갖고, S1/S2 푸린 절단 부위를 포함하는 루프의 결실, 즉, 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 675와 685 사이에서 서열번호 50의 아미노산 결실 QTQTNSPRRAR을 갖고, 예를 들어 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 1269 및 1271(K1269A + H1271A)의 2개의 아미노산 잔기의 변이에 의한 ERR 신호의 불활성화를 갖는 안정화된 S 단백질을 포함하는 폴리펩티드에 관한 것이다. SARS-CoV-2의 S2PΔF2A 폴리펩티드에서, 2P 돌연변이는 서열번호 49의 위치 975 및 976(K975P + V976P)에서 발생하고 ERR 신호의 불활성화가 예를 들어 서열번호 49의 아미노산 서열의 위치 1258 및 1260(K1258A + H1260A)에서 2개의 아미노산 잔기의 돌연변이에 의해 발생한다.
본원에서 정의되는 "SARS-CoV-2의 T4-S2P3F 폴리펩티드"(tristab-Secto-3F라고도 함)는 2P 및 3F 돌연변이가 있는 S 단백질의 가용성 삼량체화된 형태를 포함하는 폴리펩티드, 특히 T4 폴돈 삼량체화 도메인, 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 986 및 987(K986P + V987P)에서 2P 돌연변이를 갖고 예를 들어 서열번호 3의 SARS-CoV-2의 S 단백질 아미노산 서열의 위치 682, 683 및 685(R682G + R683S + R685G)에 있는 3개의 아미노산 잔기의 돌연변이에 의한 S1/S2 푸린 절단 부위의 불활성화를 갖는 안정화된 S 단백질인 T4 폴돈 삼량체화 도메인을 포함하는 폴리펩티드를 의미한다.
본원에서 정의되는 SARS-CoV-2의 "S6P 폴리펩티드" 또는 SARS-CoV-2의 "SMVopt6P 폴리펩티드"는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 817, 892, 899, 942, 986 및 987(F817P + A892P + A899P + A942P + K986P + V987P)에서 6P 돌연변이를 갖는 안정화된 S 단백질을 포함하는 폴리펩티드를 의미한다.
본원에서 정의되는 SARS-CoV-2의 "S6P3F 폴리펩티드" 또는 SARS-CoV-2의 "SMVopt6P3F 폴리펩티드"는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 817, 892, 899, 942, 986 및 987(F817P + A892P + A899P + A942P + K986P + V987P)에서 6P 돌연변이를 갖고 예를 들어. 서열번호 3의 SARS-CoV-2의 S 단백질 아미노산 서열의 위치 682, 683 및 685(R682G + R683S + R685G)에 있는 3개의 아미노산 잔기의 돌연변이에 의한 S1/S2 푸린 절단 부위의 불활성화를 갖는 안정화된 S 단백질을 포함하는 폴리펩티드를 의미한다.
본원에서 정의되는 SARS-CoV-2의 "S6PΔF 폴리펩티드" 또는 SARS-CoV-2의 "SMVopt6PΔF 폴리펩티드"는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 817, 892, 899, 942, 986 및 987(F817P + A892P + A899P + A942P + K986P + V987P)에서 6P 돌연변이를 갖고, S1/S2 푸린 절단 부위를 포함하는 루프의 결실, 즉 서열번호 3의 SARS-CoV-2의 S 단백질 아미노산 서열의 위치 675 및 685 사이에서 서열번호 50의 아미노산 서열 QTQTNSPRRAR의 결실을 갖는 안정화된 S 단백질을 포함하는 폴리펩티드를 의미한다. SARS-CoV-2의 S6PΔF 폴리펩티드에서 6P 돌연변이는 서열번호 58의 806, 881, 888, 931, 975, 976 위치에서 발생한다.
본원에서 정의되는 SARS-CoV-2의 "SCCPP 폴리펩티드"는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 986 및 987(K986P + V987P)에서 2P 돌연변이를 갖고 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 383 및 985(S383C 및 D985C)에서 CC 돌연변이를 갖는 안정화된 S 단백질을 포함하는 폴리펩티드를 의미한다.
본원에서 정의되는 SARS-CoV-2의 "SCC6P 폴리펩티드"는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 817, 892, 899, 942, 986 및 987(F817P + A892P + A899P + A942P + K986P + V987P)에서 6P 돌연변이를 갖고 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 383 및 985(S383C 및 D985C)에서 CC 돌연변이를 갖는 안정화된 S 단백질을 포함하는 폴리펩티드를 의미한다.
본원에서 사용되는 "전장 S 단백질"이라는 문구는 S1 및 S2 도메인을 모두 포함하는 코로나바이러스 스파이크(S) 단백질을 의미한다. 전장 S 단백질은 돌연변이(치환, 결실 및/또는 추가)를 포함할 수 있지만 전체 S1 또는 S2 도메인이 누락되지는 않는다. 전장 S 단백질은 푸린 절단 부위, 또는 S1 및 S2 도메인 사이에 돌연변이된 푸린 절단 부위를 포함할 수 있다.
코로나바이러스의 생물학
SARS-CoV-2는 코로나바이러스과(Coronavidae family) 및 β-코로나바이러스(β-coronavirus) 속에 속하는 외피가 있는 단일 가닥 포지티브 센스 RNA 바이러스이다(Zhou, 2020). SARS-CoV-2의 전체 게놈 시퀀싱은 SARS-CoV-1과 79.6%의 염기서열 유사성을 나타냈다(Wu, 2020). SARS-CoV-2의 게놈은 스파이크 단백질(S), 외피 단백질(E), 막 단백질(M) 및 뉴클레오캡시드(N)의 4가지 구조 단백질을 암호화한다. 비리온의 표면에 국한된 삼량체 클래스 I 융합 단백질인 S 단백질은 바이러스 부착 및 숙주 세포로의 진입에서 핵심 역할을 한다. 숙주 프로테아제에 의한 S 단백질의 S1 및 S2 서브유닛으로의 절단(Jaimes, 2020)은 바이러스 감염에 필수적이다. S1 서브유닛에는 수용체 결합 도메인(RBD)이 포함되어 있어 바이러스가 이의 진입 수용체인 안지오텐신 전환 효소 2(ACE2)에 결합할 수 있다(Zhou, 2020; Hoffmann, 2020). 수용체와 도킹한 후, S1 서브유닛이 방출되고 S2 서브유닛이 막 융합 및 바이러스 진입을 매개하는 융합 펩티드를 드러낸다(Du, 2020).
코로나바이러스는 숙주 세포의 세포질에서 복제한다. RNA 게놈의 5' 말단에는 캐핑된 구조가 있고 3' 말단에는 polyA 꼬리가 있다. 바이러스의 외피는 이의 표면에서 스피큘(또는 스파이크 단백질)이라고 하는 peplomeric 구조를 포함한다.
게놈은 5' 말단에서 3' 말단 방향으로 다음과 같은 오픈 리딩 프레임 또는 ORF를 포함한다: 전사-복제 복합체의 단백질에 해당하는 ORF1a 및 ORF1b, 그리고 구조 단백질 S, E, M 및 N에 해당하는 ORF-S, ORF-E, ORF-M 및 ORF-N. 또한 이는 ORF-S와 ORF-E 사이에 위치하고 후자와 중첩되는 영역에 의해 암호화된 미지 기능의 단백질에 해당하는 ORF를 포함하고, 그 영역은 ORF-M과 ORF-N 사이에 위치하며 ORF-N에 포함된다.
S 단백질은 바이러스 외피의 표면에서 나오는 가시(spicule) 또는 스파이크의 형태로 존재하는 막 당단백질(200-220 kDa)이다. 이는 숙주 세포의 수용체에 바이러스를 부착하고 바이러스 외피와 세포막의 융합을 유도하는 역할을 한다. S 단백질은 기능적으로 2개의 하위 영역 S1 및 S2로 나눌 수 있으며, 여기서 S1은 숙주 세포의 바이러스 수용체에 대한 결합에 관여하는 S 단백질의 머리를 형성하고 S2는 줄기 구조를 형성한다. S 단백질은 중화 항체가 표적으로 하는 주요 에피토프를 포함하고 있어 인간 코로나바이러스에 대한 백신 개발을 위한 주요 항원으로 간주된다(Du, 2020; Escriou, 2014; Liniger, 2008; Bodmer, 2018; Zhu, 2020). RBD를 표적으로 하는 항체는 숙주 세포의 수용체에의 바이러스 결합을 차단하고 진입을 방지함으로써 바이러스를 중화할 수 있다. 또한, SARS-CoV의 S2 소단위체의 두 번째 헵타드 영역(HR2)을 표적으로 하는 항체 및 모방 합성 펩티드는 막 융합에 필요한 구조적 변화를 방지함으로써 강력한 중화 활성을 갖는 것으로 관찰되었다(Bosh, 2004; Keng, 2005; Lip, 2006; Zhang, 2004; Zhong , 2005). 따라서, SARS-CoV-2 백신을 개발하려는 노력은 S 단백질에 대한 반응을 유도하는 초점을 두었다.
sM(작은 막)이라고도 하는 작은 외피 단백질(E)은 약 10kDa의 글리코실화되지 않은 막관통 단백질이며, 비리온에 가장 적은 양으로 존재하는 단백질이다. 이는 소포체(ER) 및 골지체의 중간 구획의 수준에서 발생하는 코로나바이러스 발아(budding) 과정에 관여한다.
M 단백질 또는 기질 단백질(25-30 kDa)은 M/E 상호작용에 의해 바이러스 입자에 통합되는 보다 풍부한 막 당단백질인 반면, 입자에의 S의 통합은 S/M 상호작용에 의해 지시된다. 이는 코로나바이러스의 바이러스 성숙 및 바이러스 입자가 조립되는 위치를 결정하는데 중요한 것으로 보인다.
코로나바이러스 구조 단백질 중 가장 잘 보존된 N 단백질 또는 뉴클레오캡시드 단백질(45-50kDa)은 게놈 RNA를 캡슐화한 다음 비리온으로의 통합을 지시하는데 필요하다. 이 단백질은 아마도 RNA 복제에도 관여할 것이다.
숙주 세포가 감염되면, 바이러스 게놈의 5' 영역에 위치한 리딩 프레임(reading frame, ORF)은 바이러스 프로테아제에 의해 절단되는 다단백질(polyprotein)로 번역된 다음, RNA 의존성 RNA 폴리머라제(Rep) 및 ATPase 헬리카제(Hel)와 같은 여러 비구조적 단백질을 방출한다. 이 두 단백질은 바이러스 게놈의 복제 및 바이러스 단백질 합성에 사용되는 전사체 생성에 관여한다. 이러한 서브게놈 mRNA가 생성되는 메커니즘은 완전히 이해되지 않았다. 그러나, 최근의 사실은 각 유전자의 5' 말단에서 전사 조절을 위한 서열이 서브게놈 mRNA의 불연속 전사를 조절하는 신호를 나타낸다는 것을 나타낸다는 것이다.
바이러스 막의 단백질(S, E 및 M 단백질)은 중간 구획에 삽입되는 반면, 복제된 RNA(+ 가닥)는 N(뉴클레오캡시드) 단백질과 조립된다. 이 단백질-RNA 복합체는 소포체의 막에 포함된 M 단백질과 결합하고 뉴클레오캡시드 복합체가 소포체로 발아하면 바이러스 입자가 형성된다. 그런 다음 바이러스는 골지체 복합체를 가로질러 이동하고 결국 세포외유출(exocytosis)에 의해 세포를 떠난다. 바이러스가 숙주 세포에 부착되는 부위는 S 단백질의 수준이다.
재조합 홍역 바이러스
기존 또는 신흥, 아마도 대유행성 코로나바이러스에 대한 백신, 특히 어린이(특히 어린 아이 또는 영유아) 또는 성인 집단 또는 둘 모두에서 사용할 수 있는 백신을 개발하기 위해, 본 발명자들은 홍역 바이러스 벡터에 의한 선택된 항원(또는 이의 적합한 부분(들))에서 유래된 폴리펩티드의 발현을 기반으로 하는 전략을 설계했는데, 여기서 특히 홍역 바이러스(MV 또는 MeV)는 백신 홍역 바이러스와 같은 약독화된 생 홍역 바이러스로부터 선택된다. 특정 구현예에서, 생 약독화 홍역 바이러스는 Schwarz 균주이다.
본 발명은 스파이크 유래 항원을 포함하는 코로나바이러스 항원 또는 이로부터 유래된 폴리펩티드를 숙주의 면역계에 제공하기 위한 새로운 접근법을 제안하고, 특히 포유동물 숙주, 특히 인간 숙주에서 면역 반응을 유도하여 코로나바이러스, 특히 SARS-CoV-2 균주에 의해 야기되는 질병에 대한 보호, 특히 예방적 보호를 부여하기 위한 이러한 폴리펩티드 또는 항원을 발현하기 위한 홍역 바이러스 벡터의 용도를 제공한다. 또한, 홍역 바이러스를 코로나바이러스의 면역원성 폴리펩티드의 벡터로 사용하는 이 접근법은 벡터 특성, 특히 벡터의 면역 특성으로부터 이점을 취하여 숙주에서 면역 반응의 품질을 개선한다. 따라서 본 발명자들은 포유동물, 특히 인간 개체에서 코로나바이러스 감염, 특히 SARS-CoV-2 감염으로 인한 질병에 대해 효과적이고 오래 지속되는 면역 반응을 유도할 수 있는 재조합 감염성 생 약독화 홍역 바이러스, 예를 들어 Schwarz 균주를 사용하여 얻은 재조합 홍역 바이러스를 제공한다.
따라서 본 발명은 코로나바이러스 면역원 또는 코로나바이러스 항원의 에피토프를 발현하기 위한 벡터로서의 홍역 바이러스의 용도에 관한 것이다. 몇몇 구현예에서, 상기 면역원 또는 에피토프는 코로나바이러스의 S, E, N, ORF3a, ORF8, ORF7a 및 M 단백질과 같은 위에서 일반적으로 기재한 바와 같거나 SARS-CoV-2 균주에 대해 구체적으로 설명되고 본 설명에 예시되어 있는 SARS-CoV-2의 야생형 항원에서 유래된 폴리펩티드를 포함한다.
재조합 홍역 바이러스 입자는 포유동물 숙주에서 면역 반응을 유도하기에 충분한 에피토프를 포함하는 야생형 SARS-CoV-2 항원, 이의 단편, 또는 돌연변이되거나 절단된 항원을 발현할 수 있고, 여기서의 천연 항원의 아미노산 잔기 또는 영역의 결실로 인한 돌연변이 또는 절단 또는 단편은 항원의 면역원성 특성을 보존하고 이들의 생산 또는 면역원성 조성물에서의 이들의 사용을 가능하게 한다. 따라서, 돌연변이된 항원 또는 항원의 단편은 세포에서 개선된 안정성을 가질 수 있고/있거나 항원의 가용화된 형태 및/또는 항원의 다량체 형태, 특히 이의 삼량체(예를 들어, 스파이크 유래 항원의 경우)의 회수를 가능하게 할 수 있다. 본원에 개시된 폴리펩티드는 특히 CoV, 특히 SARS-CoV-2로부터 유래하고, 천연 단백질과 동일할 수 있거나 대안적으로 돌연변이, 특히 치환(특히 보존적 아미노산 잔기에 의한), 또는 아미노산 잔기의 추가 또는 번역 후 2차 변형(글리코실화 포함)에 의해 또는 천연 단백질(들)의 일부를 결실시켜 천연 단백질보다 짧은 크기를 갖는 단편을 얻는 것을 비롯한 표적화된 점 돌연변이에 의해 유래될 수 있는 구조적 단백질이다. 단편은 숙주, 특히 포유동물 숙주, 특히 인간 숙주에서 면역 반응, 바람직하게는 CoV, 특히 SARS-CoV-2에 대한 보호를 가능하게 하는 반응을 유도하기에 적합한 천연 단백질의 에피토프를 보유하는 정도로 본 발명에 포함된다. 에피토프는 특히 단백질이 투여된 숙주 또는 본 발명의 감염성 복제 입자 투여 후 발현되는 숙주에서 항체 생성의 활성화를 통해 체액성 면역 반응을 유도하는데 관여하는 B 세포 에피토프 유형이다. 에피토프는 대안적으로 세포 매개 면역 반응(CMI 반응)의 유도에 관여하는 유형의 T 세포 에피토프일 수 있다. 단편은 CoV, 특히 SARS-CoV-2의 천연 단백질의 아미노산 서열 크기의 50% 초과, 바람직하게는 적어도 90% 또는 95%를 나타내는 크기를 가질 수 있다. 대안적으로, 단편은 천연 단백질의 에피토프(들)를 보유하는 10개 이상의 아미노산 잔기를 갖는 짧은 폴리펩티드일 수 있다. 이와 관련하여 단편은 또한 본원에 정의된 폴리에피토프를 포함한다. 특정 구현예에서, 폴리펩티드는 항원의 가용성 부분을 함유하거나 항원의 가용성 부분으로 구성되고/되거나 점 돌연변이된(예를 들어, 천연 항원의 아미노산 잔기의 1, 2 또는 5% 미만의 치환에 의한) 천연 항원의 단편이다. 돌연변이는 세포에서 안정성을 향상시키도록 설계될 수 있다. 폴리펩티드(예: S 폴리펩티드)는 특히 코로나바이러스 천연 또는 변형 항원의 삼량체 형태 또는 삼량체화 형태로 발현될 수 있다. "폴리펩티드" 및 "항원"이라는 단어는 본원에 제공된 정의에 따라 본 발명에 따른 "코로나바이러스, 특히 SARS-CoV-2의 폴리펩티드"를 정의하기 위해 상호교환적으로 사용된다. 따라서 폴리펩티드의 아미노산 서열은 CoV의 천연 성숙 또는 전구체 단백질인 폴리펩티드를 포함하여 CoV 균주, 특히 SARS-CoV-2의 항원에 있는 대응물과 동일하거나, 이의 면역원성 단편 또는 이의 변이체를 정의하기 위한 삽입, 치환 또는 결실에 의해 변형된다.
특히, 천연 발생 CoV 폴리펩티드와 적어도 50%, 적어도 80%, 적어도 90% 또는 적어도 95% 아미노산 서열 동일성을 갖는 단편 또는 변이체. 아미노산 서열 동일성은 본원에 정의된 바와 같이 결정될 수 있다. 본 발명의 CoV 단백질의 단편 또는 돌연변이체는 본원에 예시된 특정 아미노산 서열과 관련하여 정의될 수 있다.
본 발명의 제1 측면에서, 재조합 홍역 바이러스에 의한 발현을 위한 이종 폴리펩티드는 코로나바이러스, 특히 SARS-CoV-2의 당단백질 S로부터 유래되고: 이들은 글리코실화 또는 비-글리코실화된 형태의 S 폴리펩티드일 수 있거나, 이들은 기능적 도메인(들), 특히 바이러스의 수명 주기에 영향을 미치는 도메인(들)이 결핍되거나 변형되어 있는 전장 S 폴리펩티드의 더 짧은 단편을 비롯한, 면역원성 단편 S1 및/또는 S2와 같은 이의 단편 또는 이의 더 짧은 단편일 수 있다. 본 발명에 따르면, 코로나바이러스, 특히 SARS-CoV-2의 S 폴리펩티드의 단편은 재조합 바이러스 입자의 맥락에서 면역 반응을 유도하기에 적합한 에피토프를 포함한다. 본 발명에 따른 S의 특정 단편 또는 S의 돌연변이된 단편 또는 S의 돌연변이된 항원은 하기에 열거된 폴리펩티드이며, 이러한 폴리펩티드는 특히 하기에 기재되는 뉴클레오티드 서열에 의해 암호화되거나 본원에 기재된 아미노산 서열을 갖는다: SARS-CoV-2의 S 폴리펩티드, SARS-CoV-2의 stab-S 폴리펩티드(SARS-CoV-2의 S2P 폴리펩티드라고도 함), SARS-CoV-2의 Secto 폴리펩티드, SARS-CoV-의 stab-Secto 폴리펩티드 2, SARS-CoV-2의 S1 폴리펩티드, SARS-CoV-2의 S2 폴리펩티드, SARS-CoV-2의 tri-Secto 폴리펩티드, SARS-CoV-2의 tristab-Secto 폴리펩티드, SARS-CoV-2의 S3F 폴리펩티드, SARS-CoV-2의 S2P3F 폴리펩티드, SARS-CoV-2의 S2P_F 폴리펩티드, S2PΔF2A SARS-CoV-2의 폴리펩티드, SARS-CoV-2의 T4-S2P3F(tristab-Secto-3F) 폴리펩티드, SARS-CoV-2의 S6P 폴리펩티드, SARS-CoV-2의 S6P3F 폴리펩티드, SARS-CoV-2의 S6PΔF 폴리펩티드, SARS-CoV-2의 SCCPP 폴리펩티드, SARS-CoV-2의 SCC6P 폴리펩티드, SARS-CoV-2의 SMVopt2P 폴리펩티드, SARS-CoV-2의 SMVoptΔF 폴리펩티드, SARS-CoV-2의 SMVopt2PΔF 폴리펩티드. 이는 바람직하게는 SARS-CoV-2의 S, stab-S(S2P라고도 함), S3F, S2P3F, S2PΔF 및 S2PΔF2A 폴리펩티드로 이루어진 군에서 선택된다. 단편은 야생형 서열로부터 수득될 수 있거나 야생형 서열에 대해 돌연변이 및/또는 결실될 수 있다. 본 발명에 따른 S의 바람직한 단편 또는 S의 돌연변이된 단편은 하기로 이루어진 군으로부터 선택된다: SARS-CoV-2의 S 폴리펩티드, SARS-CoV-2의 stab-S 폴리펩티드(SARS-CoV-2의 S2P 폴리펩티드라고도 함), SARS-CoV-2의 S3F 폴리펩티드, SARS-CoV-2의 S2P3F 폴리펩티드, SARS-CoV-2의 S2PΔF 폴리펩티드, SARS-CoV-2의 S2PΔF2A 폴리펩티드, SARS-CoV-2의 T4-S2P3F(tristab-Secto-3F) 폴리펩티드, SARS-CoV-2의 S6P 폴리펩티드, SARS-CoV-2의 S6P3F 폴리펩티드, SARS-CoV-2의 S6PΔF 폴리펩티드, SARS-CoV-2의 SCCPP 폴리펩티드, SARS-CoV-2의 SCC6P 폴리펩티드, SARS-CoV-2의 SMVopt2P 폴리펩티드, SARS-CoV-2의 SMVoptΔF 폴리펩티드 및 SARS-CoV-2의 SMVopt2PΔF 폴리펩티드. 본 발명에 따른 S의 보다 바람직한 단편 또는 S의 돌연변이된 단편 또는 S의 돌연변이된 항원은 SARS-CoV-2의 S2P3F 폴리펩티드, SARS-CoV-2의 S2PΔF 폴리펩티드, SARS-CoV-2의 S2PΔF2A 폴리펩티드로 이루어진 군으로부터 선택되고, 바람직하게는 SARS-CoV-2의 S2PΔF 폴리펩티드, 더욱 바람직하게는 SARS-CoV-2의 S2PΔF2A 폴리펩티드이다.
바람직하게는, 1, 2, 3개 이상의 아미노산 돌연변이(들), 즉 아미노산 치환(들), 삽입(들) 및/또는 결실(들)이 하기에 기재된 것을 위해 CoV, 특히 코로나바이러스 SARS-CoV-2의 S 단백질의 아미노산 서열 내로 도입된다:
- 발현된 단백질을 융합전 상태(2P 돌연변이)로 유지하기 위해, 및/또는
- S1/S2 절단(3F 돌연변이 또는 포함하는 루프의 F 결실을 통한 푸린 절단 부위 불활성화)을 방지하기 위해, 및/또는
- 소포체 검색 신호(ERRS)(아래에 정의된 바와 같은 2A 돌연변이)를 불활성화하기 위해, 및/또는
- 닫힌 형태(즉, 하향 위치 또는 닫힌 하향 상태)에서 S 단백질의 S1 도메인에 국한된 수용체 결합 도메인(RBD)을 유지하기 위해.
본 발명의 또 다른 측면에서, 재조합 홍역 바이러스에 의한 발현을 위한 이종 폴리펩티드는 코로나바이러스, 특히 SARS-CoV-2, E, N, ORF3a, ORF8, ORF7a 또는 M 단백질, 특히 N 단백질의 하기 항원 중 하나로부터 유래된다.
따라서, 본 발명은 다음을 포함하는 핵산 작제물에 관한 것이다:
(1) 홍역 바이러스(MV)의 전장, 감염성 안티게놈(+) RNA 가닥을 암호화하는 cDNA 분자; 및
(2) 특히 상기 개시된 것들을 포함하여 1, 2, 3 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 가지는 코로나바이러스(CoV), 특히 SARS-CoV-2의 적어도 하나의 폴리펩티드를 암호화하는 제1 이종 폴리뉴클레오티드, 특히 코로나바이러스(CoV), 특히 코로나바이러스 SARS-CoV-2의 적어도 스파이크(S) 폴리펩티드를 암호화하는 상기 제1 폴리뉴클레오티드, 또는 이의 면역원성 단편, 또는 S 폴리펩티드의 변이체 또는 이의 단편.
여기서의 제1 이종 폴리뉴클레오티드는 재조합 MV-CoV, 특히 MV-CoVS 핵산 분자를 제공하기 위해 안티게놈(+) RNA의 cDNA 내에 삽입된 추가 전사 단위(ATU) 내에 위치한다(작동적으로 클로닝된다).
본 발명의 바람직한 구현예에서, 핵산 작제물은 다음을 포함한다:
(1) 홍역 바이러스(MV)의 전장, 감염성 안티게놈(+) RNA 가닥을 암호화하는 cDNA 분자; 및
(2) 하기를 암호화하는 제1 이종 폴리뉴클레오티드:
(a) 서열번호 3의 SARS-CoV-2의 전장 스파이크(S) 단백질, 또는
(b) 서열번호 11의 S1 폴리펩티드, 서열번호 13의 S2 폴리펩티드, 서열번호 7의 Secto 폴리펩티드 및 서열번호 16의 tri-Secto 폴리펩티드로 이루어진 군에서 선택된 (a)의 전장 S 단백질의 면역원성 단편, 또는
(c) 1, 2, 3개 이상의 아미노산 잔기 치환(들), 삽입(들) 및/또는 결실(들), 특히 10개 미만, 또는 5개 미만의 아미노산 잔기 치환, 삽입 및/또는 결실을 갖는 (a) 또는 (b)의 변이체,
바람직하게는 돌연변이 항원은 하기를 포함한다:
(i) 발현된 전장 S 단백질을 이의 융합전 형태로 유지하는 돌연변이, 특히 S2 도메인에서 발생하는 아미노산 잔기(들)의 치환에 의한 돌연변이, 바람직하게는 S2 도메인에서 발생하는 적어도 2개의 프롤린 잔기의 치환에 의한 돌연변이, 및/또는
(ii) S 단백질의 푸린 절단 부위를 불활성화시키는 돌연변이, 특히 S1/S2 푸린 절단 부위에서 발생하는 아미노산 잔기(들)의 삽입, 치환 또는 결실에 의한 돌연변이, 및/또는
(iii) 소포체 검색 신호(EERS)를 불활성화하는 돌연변이, 및/또는
(iv) S 단백질의 S1 도메인에 국한된 수용체-결합 도메인(RBD)을 폐쇄 형태로 유지하는 돌연변이. 여기서의 제1 이종 폴리뉴클레오티드는 MV(ATU2)의 P 유전자와 M 유전자 사이에 위치한 추가 전사 단위(ATU)에 위치하거나 또는 MV(ATU3)의 H 유전자의 하류에 위치한 ATU에 위치한다.
본 발명의 특정 구현예에서, 핵산 작제물에서:
(i) 발현된 전장 S 단백질을 이의 융합전 형태로 유지하는 돌연변이는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 986 및 987(K986P 및 V987P)에 있는 2개의 프롤린 잔기의 치환에 의한 돌연변이, 또는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 817, 892, 899, 942, 986 및 987(F817P, A892P, A899P, A942P, K986P 및 V987P)에서 6개의 프롤린 잔기의 치환에 의한 돌연변이이고/이거나
(ii) S 단백질의 푸린 절단 부위를 불활성화시키는 돌연변이는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 682, 683 및 685(R682G, R683S 및 R685G)에서의 S1/S2 푸린 절단 부위에서 발생하는 3개의 아미노산 잔기의 치환에 의한 돌연변이, 또는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 위치 675와 아미노산 위치 685 사이의 아미노산 사이에 S1/S2 푸린 절단 부위를 포함하고 서열번호 50의 아미노산 서열QTQTNSPRRAR로 이루어진 루프의 결실에 의한 돌연변이이고/이거나
(iii) EERS를 불활성화시키는 돌연변이는 서열번호 3의 아미노산 서열의 위치 1269 및 1271에서의 2개의 알라닌 잔기의 치환에 의한 돌연변이이고/이거나,
(iv) S 단백질의 S1 도메인에 국한된 RBD를 폐쇄 형태로 유지하는 돌연변이는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 383 및 985(S383C 및 D985C)에서 2개의 시스테인 잔기의 치환에 의한 돌연변이, 또는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 413 및 987(G413C 및 P987C)에서 2개의 시스테인 잔기의 치환에 의한 돌연변이이고/이거나
(v) (c)의 변이체는 서열번호 3의 아미노산 서열의 위치 69 및 70의 아미노산 잔기의 결실로 이루어진 군에서 선택되는 돌연변이, 서열번호 3의 아미노산 서열의 위치 144 및 145의 아미노산 잔기의 결실, 서열번호 3의 아미노산 서열의 위치 501의 티로신 잔기의 치환에 의한 돌연변이(N501Y), 서열번호 3의 아미노산 서열(A570D)의 위치 570의 아스파라긴산 잔기의 치환에 의한 돌연변이, 서열번호 3의 아미노산 서열의 위치 681의 히스티딘 잔기의 치환에 의한 돌연변이(P681H), 서열번호 3의 아미노산 서열의 위치 716의 이소류신 잔기의 치환에 의한 돌연변이(T716I), 서열번호 3의 아미노산 서열의 위치 982의 알라닌 잔기의 치환에 의한 돌연변이(S982A), 서열번호 3의 아미노산 서열의 위치 1118의 히스티딘 잔기의 치환에 의한 돌연변이(D1118H), 서열번호 3의 아미노산 서열의 위치 484의 라이신 잔기의 치환에 의한 돌연변이(E484K), 서열번호 3의 아미노산 서열의 위치 417의 아스파라긴 잔기의 치환에 의한 돌연변이(K417N), 서열번호 3의 아미노산 서열의 위치 417의 트레오닌 잔기의 치환에 의한 돌연변이(K417T), 및 서열번호 3의 아미노산 서열의 위치 614의 글리신 잔기의 치환에 의한 변이(D614G)를 포함하는 폴리펩티드로서, 특히 서열번호 3의 아미노산 서열의 위치 501의 티로신 잔기의 치환에 의한 돌연변이(N501Y), 서열번호 3의 아미노산 서열의 위치 484의 라이신 잔기의 치환에 의한 돌연변이(E484K), 서열번호 3의 아미노산 서열의 위치 417의 아스파라긴 잔기의 치환에 의한 변이(K417N), 및 서열번호 3의 아미노산 서열의 위치 417의 트레오닌 잔기의 치환에 의한 돌연변이(K417T)로 이루어진 군에서 선택된 돌연변이를 포함하는 폴리펩티드를 암호화한다.
몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드는 서열번호 3의 SARS-CoV-2의 전장 S 단백질이다.
몇몇 구현예에서, 전장 S 단백질의 면역원성 단편 또는 항원성 단편은 서열번호 11의 S1 폴리펩티드, 서열번호 13의 S2 폴리펩티드, 서열번호 7의 Secto 폴리펩티드, 및 서열번호 16의 tri-Secto 폴리펩티드로 이루어진 군으로부터 선택된다.
몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 전장 S 단백질은 발현된 전장 S 단백질을 이의 융합전 형태로 유지하는 하나 이상의 추가 치환을 추가로 포함한다. 몇몇 구현예에서, 전장 S 단백질은 서열번호 3의 아미노산 돌연변이 K986P 및 V987P, 또는 서열번호 3의 아미노산 돌연변이 F817P, A892P, A899P, A942P, K986P 및 V987P를 추가로 포함한다.
몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 전장 S 단백질은 S 단백질의 푸린 절단 부위를 불활성화시키는 하나 이상의 추가 치환을 추가로 포함한다. 몇몇 구현예에서, 전장 S 단백질은 서열번호 3의 아미노산 돌연변이 R682G, R683S 및 R685G, 또는 서열번호 3의 SARS-CoV-2의 S 단백질의 위치 675의 아미노산과 위치 685의 아미노산 사이에 S1/S2 푸린 절단 부위를 포함하고 서열번호 50의 아미노산 서열 QTQTNSPRRAR으로 이루어지는 루프의 결실을 추가로 포함한다.
몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 전장 S 단백질은 EERS를 불활성화시키는 하나 이상의 추가 치환을 추가로 포함한다. 몇몇 구현예에서, 전장 S 단백질은 서열번호 3의 아미노산 서열의 위치 1269 및 1271에서 2개의 알라닌 잔기의 치환을 추가로 포함한다.
몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 전장 S 단백질은 S 단백질의 S1 도메인에 국한된 RBD를 폐쇄 형태로 유지하는 하나 이상의 추가 치환을 추가로 포함한다. 몇몇 구현예에서, 전장 S 단백질은 서열번호 3의 아미노산 돌연변이 S383C 및 D985C를 추가로 포함한다. 몇몇 구현예에서, 전장 S 단백질은 서열번호 3의 아미노산 돌연변이 G413C 및 P987C를 추가로 포함한다.
몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 전장 S 단백질은 서열번호 3의 아미노산 서열의 위치 69 및 70에서 아미노산 잔기의 결실을 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 전장 S 단백질은 서열번호 3의 아미노산 서열의 위치 144 및 145에서 아미노산 잔기의 결실을 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 전장 S 단백질은 서열번호 3의 아미노산 돌연변이 N501Y를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 전장 S 단백질은 서열번호 3의 아미노산 돌연변이 A570D를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 전장 S 단백질은 서열번호 3의 아미노산 돌연변이 P681H를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 전장 S 단백질은 서열번호 3의 아미노산 돌연변이 T716I를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 전장 S 단백질은 서열 3의 아미노산 돌연변이 S982A를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 전장 S 단백질은 서열 3의 아미노산 돌연변이 D1118H를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 전장 S 단백질은 서열번호 3의 아미노산 돌연변이 E484K를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 전장 S 단백질은 서열 3의 아미노산 돌연변이 K417N을 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 전장 S 단백질은 서열번호 3의 아미노산 돌연변이 K417T를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 전장 S 단백질은 서열번호 3의 아미노산 돌연변이 D614G를 추가로 포함한다.
몇몇 구현예에서, 전장 S 단백질 또는 면역원성 단편 또는 항원성 단편의 돌연변이 항원은, (a) 서열번호 52의 TA-S2P3F 폴리펩티드, 또는 서열번호 52와 90% 이상의 동일성을 가지는 이의 변이체로서 위치 682, 683, 685, 986 및 987에서 변화하지 않은 변이체; 또는 (b) 서열번호 54의 S6P 폴리펩티드, 또는 서열번호 54와 90% 이상의 동일성을 가지는 이의 변이체로서 위치 817, 892, 899, 942, 986 및 987에서 변화하지 않은 변이체; 또는 (c) 서열번호 56의 S6P3F 폴리펩티드, 또는 서열번호 56과 90% 이상의 동일성을 가지는 이의 변이체로서 위치 682, 683, 685, 817, 892, 899, 942, 986 및 987에서 변화하지 않은 변이체; 또는 (d) 서열번호 58의 S6PΔF 폴리펩티드, 또는 서열번호 58과 90% 이상의 동일성을 가지는 이의 변이체로서 위치 806, 881, 888, 931, 975 및 976에서 변화하지 않은 변이체; 또는 (e) 서열번호 60의 SCCPP 폴리펩티드, 또는 서열번호 60과 90% 이상의 동일성을 가지는 이의 변이체로서 위치 383, 985, 986 및 987에서 변화하지 않은 변이체; 또는 (f) 서열번호 62의 SCC6P 폴리펩티드, 또는 서열번호 62과 90% 이상의 동일성을 가지는 이의 변이체로서 위치 383, 817, 892, 899, 942, 985, 986 및 987에서 변화하지 않은 변이체; 또는 (g) 서열번호 5의 SMVopt2P 폴리펩티드, 또는 서열번호 5과 90% 이상의 동일성을 가지는 이의 변이체로서 위치 986 및 987에서 변화하지 않은 변이체; 또는 (h) 서열번호 65의 SMVoptΔF 폴리펩티드, 또는 서열번호 65과 90% 이상의 동일성을 가지는 이의 변이체; 또는 (i) 서열번호 47의 SMVopt2PΔF 폴리펩티드, 또는 서열번호 47과 90% 이상의 동일성을 가지는 이의 변이체로서 위치 975 및 976에서 변화하지 않은 변이체; 또는 (j) SMVopt6P 폴리펩티드, 또는 MVopt6P 폴리펩티드와 90% 이상의 동일성을 가지는 이의 변이체로서 위치 817, 892, 899, 942, 986 및 987에서 변화하지 않은 변이체; 또는 (k) SMVopt6PΔF 폴리펩티드, 또는 MVopt6PΔF 폴리펩티드와 90% 이상의 동일성을 가지는 이의 변이체로서 위치 806, 881, 888, 931, 975 및 976에서 변화하지 않은 변이체; 또는 (l) SMVopt6P3F 폴리펩티드, 또는 SMVopt6P3F 폴리펩티드와 90% 이상의 동일성을 가지는 이의 변이체로서 위치 682, 683, 685, 817, 892, 899, 942, 986 및 987에서 변화하지 않은 변이체;이다. 몇몇 구현예에서, 돌연변이 항원은, (a) 서열번호 52의 TA-S2P3F 폴리펩티드, 또는 (b) 서열번호 54의 S6P 폴리펩티드, 또는 (c) 서열번호 56의 S6P3F 폴리펩티드, 또는 (d) 서열번호 58의 S6PΔF 폴리펩티드, 또는 (e) 서열번호 60의 SCCPP 폴리펩티드, 또는 (f) 서열번호 62의 SCC6P 폴리펩티드, 또는 (g) 서열번호 5의 SMVopt2P 폴리펩티드, 또는 (h) 서열번호 65의 SMVoptΔF 폴리펩티드, 또는 (i) 서열번호 47의 SMVopt2PΔF 폴리펩티드이다.
몇몇 구현예에서, 핵산 작제물은 서열번호 2의 완전히 최적화된 유전자 S 대신 서열번호 36의 홍역 최적화된 유전자 SMVopt를 사용하여 설계될 수 있다.
특정 구현예에서, 제1 이종 폴리뉴클레오티드는 MV의 P 유전자와 M 유전자 사이에 위치한 ATU2 또는 MV의 H 유전자의 하류에 위치한 ATU3에 위치한다. 바람직하게는, 제1 이종 폴리뉴클레오티드는 MV의 H 유전자의 하류에 위치한 ATU3에 위치한다.
본 발명에 따른 핵산 작제물은 특히, 서로 작동가능하게 연결된 상이한 기원의 다양한 폴리뉴클레오티드의 재조합에 의해 수득되거나 수득가능한 정제된 DNA 분자이다. 이것은 또한 홍역 바이러스(MV)의 전장, 감염성 안티게놈(+) RNA 가닥을 암호화하는 분자의 cDNA로 지정된 결과로 cDNA로 상호 교환 가능한 것으로 지정된다.
"작동가능하게 연결된"이라는 표현은 본 발명의 핵산 작제물의 상이한 폴리뉴클레오티드 사이에 존재하는 기능적 연결을 의미한다. 이러한 기능적 연결에 의하여, 상이한 폴리뉴클레오티드 및 핵산 작제물은 특히 세포 또는 세포주, 특히 본 발명의 재조합 감염성 MV 입자의 생성 또는 증폭을 위한 구출 시스템의 일부로서 사용되는 세포 또는 세포주 또는 숙주 세포, 특히 포유동물 또는 인간 세포에서 효율적으로 전사되고 적절한 경우 번역된다.
본 발명의 또 다른 측면에서, 재조합 홍역 바이러스에 의한 발현을 위한 추가의 이종 폴리펩티드는 코로나바이러스, 특히 SARS-CoV-2의 당단백질 S로부터 유래되고: 이들은 글리코실화 또는 비-글리코실화된 형태의 S 폴리펩티드일 수 있거나, 이들은 기능적 도메인(들), 특히 바이러스의 수명 주기에 영향을 미치는 도메인(들)이 결핍되거나 변형되어 있는 전장 S 폴리펩티드의 더 짧은 단편을 비롯한, 면역원성 단편 S1 및/또는 S2와 같은 이의 단편 또는 이의 더 짧은 단편일 수 있다. 본 발명에 따르면, 코로나바이러스, 특히 SARS-CoV-2의 S 폴리펩티드의 단편은 재조합 바이러스 입자의 맥락에서 면역 반응을 유도하기에 적합한 에피토프를 포함한다. 본 발명에 따른 S의 특정 단편 또는 S의 돌연변이된 단편 또는 S의 돌연변이된 항원은 하기에 열거된 폴리펩티드이며, 이러한 폴리펩티드는 특히 하기에 기재되는 뉴클레오티드 서열에 의해 암호화되거나 본원에 기재된 아미노산 서열을 갖는다: SARS-CoV-2의 S 폴리펩티드(서열번호 3), SARS-CoV-2의 stab-S 폴리펩티드(SARS-CoV-2의 S2P 폴리펩티드라고도 함)(서열번호 5), SARS-CoV-2의 Secto 폴리펩티드(서열번호 7), SARS-CoV-의 stab-Secto 폴리펩티드 2(서열번호 9), SARS-CoV-2의 S1 폴리펩티드(서열번호 11), SARS-CoV-2의 S2 폴리펩티드(서열번호 13), SARS-CoV-2의 tri-Secto 폴리펩티드(서열번호 17), SARS-CoV-2의 tristab-Secto 폴리펩티드(서열번호 19), 또는 소포체 보유에 관여하는 도메인에서 돌연변이된 S. 몇몇 구현예에서, 소포체 보유에 관여하는 도메인에서 돌연변이된 S는 바람직하게는 SARS-CoV-2의 S(서열번호 3) 또는 stab-S(S2P로도 명명됨)(서열번호 5) 폴리펩티드이거나 그로부터 유래된다. 단편은 야생형 서열로부터 수득될 수 있거나 야생형 서열에 대해 돌연변이 및/또는 결실될 수 있다.
본 발명에 따른 S의 바람직한 단편 또는 S의 돌연변이된 단편은 SARS-CoV-2의 S 폴리펩티드(서열번호 3), SARS-CoV-2의 stab-S 폴리펩티드(S2P로도 명명됨)(서열번호 5)로 이루어진 군으로부터 선택된다.
바람직하게는, 1, 2, 3개 이상의 아미노산 돌연변이(들), 즉 아미노산 치환(들), 삽입(들) 및/또는 결실(들)이 하기에 기재된 것을 위해 CoV, 특히 SARS-CoV-2의 S 단백질의 아미노산 서열 내로 도입된다:
- 발현된 단백질을 융합전 상태(2P 돌연변이)로 유지하기 위해, 및/또는
- 소포체 검색 신호(ERRS)를 불활성화하기 위해(서열번호 149의 KXHXX 모티프의 2A 돌연변이 또는 결실), 및/또는
- 세포내 체류의 활성, 특히 골지체와 소포체(ER) 구획 사이의 순환을 포함하는 체류의 활성을 방지하기 위해.
특정 구현예에서, S 단백질의 세포질 꼬리에서의 삽입, 치환 또는 결실에 의한 돌연변이는 적어도 ER에서 폴리펩티드의 회수(retrieval)를 손상시키고, 여기서의 삽입, 치환 또는 결실에 의한 돌연변이는 서열번호 3의 아미노산 서열의 위치 1263 내지 1273과 정렬된 S 단백질의 11개 아미노산 잔기 서열에서 수행되고, 서열번호 149의 KXHXX 모티프를 포함하는 ERRS 신호의 아미노산 잔기의 전부 또는 일부의 삽입, 치환 또는 결실에 의한 돌연변이를 포함한다. 이러한 특정 도메인의 돌연변이는 생성된 폴리펩티드를 세포의 원형질막으로 수송할 수 있게 한다.
특정 구현예에서, S 단백질의 세포질 꼬리에서의 삽입, 치환 또는 결실에 의한 돌연변이는 이중 도메인 S 단백질의 세포 표면 발현을 적어도 증가시키고, 여기서의 삽입, 치환 또는 결실에 의한 돌연변이는 서열번호 3의 아미노산 서열의 위치 1263 내지 1273과 정렬될 수 있는 S 단백질의 11개 아미노산 잔기 서열에서 수행되고, 서열번호 149의 KXHXX 모티프를 포함하는 ERRS 신호의 아미노산 잔기의 전부 또는 일부의 삽입, 치환 또는 결실에 의한 돌연변이를 포함한다. 이러한 특정 도메인의 돌연변이는 생성된 폴리펩티드를 세포의 원형질막으로 수송할 수 있게 한다. 특정 구현예에서, 세포질 꼬리에서 삽입, 치환 또는 결실에 의한 돌연변이를 갖는 이중 도메인 S 단백질의 세포 표면 발현은, 야생형 전장 S 단백질의 세포 표면 발현과 비교하여 적어도 약 5%, 약 10%, 약 15%, 약 20%, 약 25%, 약 30%, 약 35%, 약 40%, 약 45%, 약 50%, 약 55%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 95%, 또는 약 100% 증가된다. 특정 구현예에서, 세포질 꼬리에서 삽입, 치환 또는 결실에 의한 돌연변이를 갖는 이중 도메인 S 단백질의 세포 표면 발현은, 야생형 전장 S 단백질의 세포 표면 발현과 비교하여 적어도 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 100% 증가된다. 특정 구현예에서, 세포질 꼬리에서 삽입, 치환 또는 결실에 의한 돌연변이를 갖는 이중 도메인 S 단백질의 세포 표면 발현은 약 1% 내지 약 100%, 약 5% 내지 약 100%, 약 10% 내지 약 100%, 약 15% 내지 약 100%, 약 20% 내지 약 100%, 약 25% 내지 약 100%, 약 30% 내지 약 100%, 약 35% 내지 약 100%, 약 40% 내지 약 100%, 약 45% 내지 약 100%, 약 50% 내지 약 100%, 약 55% 내지 약 100%, 약 60% 내지 약 100%, 약 65% 내지 약 100%, 약 70% 내지 약 100%, 약 75% 내지 약 100%, 약 80% 내지 약 100%, 약 85% 내지 약 100%, 약 90% 내지 약 100%, 또는 약 95% 내지 약 100% 증가된다. 특정 구현예에서, 세포질 꼬리에서 삽입, 치환 또는 결실에 의한 돌연변이를 갖는 이중 도메인 S 단백질의 세포 표면 발현은 1% 내지 100%, 5% 내지 100%, 10% 내지 100%, 15% 내지 100%, 20% 내지 100%, 25% 내지 100%, 30% 내지 100%, 35% 내지 100%, 40% 내지 100%, 45% 내지 100%, 50% 내지 100%, 55% 내지 100%, 60% 내지 100%, 65% 내지 100%, 70% 내지 100%, 75% 내지 100%, 80% 내지 100%, 85% 내지 100%, 90% 내지 100%, 또는 95% 내지 100% 증가된다.
본 발명의 또 다른 측면에서, 재조합 홍역 바이러스는 코로나바이러스, 특히 SARS-CoV-2의 하기 항원 중 하나로부터 유래된 항원성 폴리펩티드인 제2 이종 폴리펩티드를 발현할 수 있다: E(서열번호 23), N(서열번호 22), ORF3a(서열번호 26), ORF8(서열번호 25), ORF7a(서열번호 27) 또는 M(서열번호 24) 단백질, 특히 N(서열번호 22) 단백질.
따라서, 본 발명은 다음을 포함하는 핵산 작제물에 관한 것이다:
(1) 약독화된 홍역 바이러스(MV) 균주의 전장 안티게놈(+) RNA 가닥을 암호화하는 cDNA 분자; 및
(2) 코로나바이러스(CoV), 특히 코로나바이러스 SARS-CoV-2의 적어도 하나의 폴리펩티드를 암호화하는 제1 폴리뉴클레오티드, 특히 코로나바이러스(CoV), 특히 코로나바이러스 SARS-CoV-2의 적어도 스파이크(S) 폴리펩티드를 암호화하는 상기 제1 폴리뉴클레오티드, 또는 특히 상기 개시된 것들을 비롯하여, 1, 2, 3 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 그의 면역원성 단편.
여기서의 제1 이종 폴리뉴클레오티드는 재조합 MV-CoV, 특히 MV-CoVS 핵산 분자를 제공하기 위해 안티게놈(+) RNA의 cDNA 내에 삽입된 추가 전사 단위(ATU) 내에 위치한다.
본 발명의 바람직한 구현예에서, 핵산 작제물은 다음을 포함한다:
(1) 약독화된 홍역 바이러스(MV) 균주의 전장 안티게놈(+) RNA 가닥을 암호화하는 cDNA 분자; 및
(2) 하기 (a) 또는 (b)를 암호화하는 제1 이종 폴리뉴클레오티드:
(a) 다음을 포함하는 SARS-CoV-2의 이중 도메인 S 단백질 폴리펩티드:
- 이중 도메인 S 단백질의 세포질 꼬리에서 삽입, 치환 또는 결실에 의한 돌연변이. 여기서의 삽입, 치환 또는 결실에 의한 돌연변이는 서열번호 3의 아미노산 서열의 위치 1263 내지 1273에 정렬된 S 단백질의 11개 아미노산 잔기 서열에서 이루어지고, 서열번호 149의 KXHXX 모티프를 포함하는 ERRS 신호의 아미노산 잔기의 전부 또는 일부의 삽입, 치환 또는 결실에 의한 돌연변이를 포함하고, 여기서의 상기 삽입, 치환 또는 결실에 의한 돌연변이는 소포체(ER)내의 폴리펩티드의 검색을 적어도 손상시킨다. 특히 서열번호 3의 아미노산 서열의 위치 1263부터 1273까지의 아미노산 잔기의 전부 또는 일부의 삽입, 치환 또는 결실에 의한 돌연변이를 포함하는 SARS-CoV-2의 이중 도메인 S 단백질, 단, 서열번호 3의 아미노산 서열의 위치 1269부터 위치 1273까지의 서열번호 150의 KLHYT 모티프의 적어도 2개의 아미노산 잔기가 치환에 의해 돌연변이되거나 또는 서열번호 3의 아미노산 서열의 위치 1269부터 1273까지 서열번호 150의 KLHYT 모티프가 결실되어 있다.
- 선택적으로, 발현된 이중 도메인 S 단백질을 융합전 형태로 유지하는 치환에 의한 추가 돌연변이.
(b) (a)의 이중 도메인 S 단백질의 면역원성 단편 또는 1, 2, 3개 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 돌연변이된 항원.
여기서의 제1 이종 폴리뉴클레오티드는 MV의 P 유전자와 M 유전자 사이에 위치한 추가 전사 단위(ATU2)에 위치하거나, 또는 MV(ATU3)의 H 유전자의 하류에 위치한 추가 전사 단위, 바람직하게는 ATU2에 위치한다.
본 발명의 특정 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 하기로 이루어진 군으로부터 선택된 돌연변이를 추가로 포함한다: 서열번호 3의 아미노산 서열의위치 69 및 70의 아미노산 잔기의 결실, 서열번호 3의 아미노산 서열의 위치 144 및 145의 아미노산 잔기의 결실, 서열번호 3의 아미노산 서열의 위치 501의 티로신 잔기의 치환에 의한 돌연변이(N501Y), 서열번호 3의 아미노산 서열의 위치 570의 아스파라긴산 잔기의 치환에 의한 돌연변이(A570D), 서열번호 3의 아미노산 서열의 위치 681의 히스티딘 잔기의 치환에 의한 돌연변이(P681H), 서열번호 3의 아미노산 서열의 위치 716의 이소류신 잔기의 치환에 의한 돌연변이(T716I), 서열번호 3의 아미노산 서열의 위치 982의 알라닌 잔기의 치환에 의한 돌연변이(S982A), 서열번호 3의 아미노산 서열의 위치 1118의 히스티딘 잔기의 치환에 의한 돌연변이(D1118H), 서열번호 3의 아미노산 서열의 위치 484의 라이신 잔기의 치환에 의한 돌연변이(E484K), 서열번호 3의 아미노산 서열의 위치 417의 아스파라긴 잔기의 치환에 의한 돌연변이(K417N), 서열번호 3의 아미노산 서열의 위치 417의 트레오닌 잔기의 치환에 의한 돌연변이(K417T), 및 서열번호 3의 아미노산 서열의 위치 614의 글리신 잔기의 치환에 의한 변이(D614G). 특히, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 하기로 이루어진 군으로부터 선택된 돌연변이를 추가로 포함한다: 서열번호 3의 아미노산 서열의 위치 501의 티로신 잔기의 치환에 의한 돌연변이(N501Y), 서열번호 3의 아미노산 서열의 위치 484의 라이신 잔기의 치환에 의한 돌연변이(E484K), 서열번호 3의 아미노산 서열의 위치 417의 아스파라긴 잔기의 치환에 의한 돌연변이(K417N), 및 서열번호 3의 아미노산 서열의 위치 417의 트레오닌 잔기의 치환에 의한 돌연변이(K417T).
몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 서열의 위치 69 및 70의 아미노산 잔기의 결실을 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 서열의 위치 144 및 145의 아미노산 잔기의 결실을 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 돌연변이 N501Y을 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 돌연변이 A570D를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 돌연변이 P681H를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 돌연변이 T716I를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 돌연변이 S982A를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 돌연변이 D1118H를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 돌연변이 E484K를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 돌연변이 K417N을 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 돌연변이 K417T를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 돌연변이 D614G를 추가로 포함한다.
S 단백질의 세포질 꼬리에서의 삽입, 치환 또는 결실에 의한 돌연변이의 특정 구현예에서, 서열번호 149의 KXHXX 모티프를 포함하는 ERRS 신호의 모든 아미노산 잔기가 치환되거나 결실된다.
S 단백질의 세포질 꼬리에서의 삽입, 치환 또는 결실에 의한 돌연변이의 또 다른 특정 구현예에서, 서열번호 149의 KXHXX 모티프를 포함하는 ERRS 신호의 아미노산 잔기의 일부가 치환되거나 결실된다.
본 발명의 특정 구현예에서, S 단백질의 세포질 꼬리에서의 삽입, 치환 또는 결실에 의한 돌연변이는 서열번호 149의 KXHXX 모티프를 포함하는 ERRS 신호의 아미노산 잔기의 전부 또는 일부의 삽입, 치환 또는 결실에 의한 돌연변이, 및 1, 2, 3, 4, 5 또는 6개의 아미노산 잔기(들)의 삽입, 치환 또는 결실에 의한 돌연변이를 포함하고, 상기 돌연변이는 서열번호 3의 아미노산 서열의 위치 1263 내지 1273과 정렬될 수 있는 S 단백질의 11개 아미노산 잔기 서열에서 발생한다.
바람직하게는, 제1 이종 폴리뉴클레오티드는 서열번호 3의 아미노산 서열의 위치 1269 및 1271에서 2개의 알라닌 잔기의 치환에 의한 돌연변이, 또는 서열번호 3의 아미노산 서열의 위치 1269 내지 1273의 아미노산 잔기의 결실, 또는 서열번호 3의 아미노산 서열의 위치 1263 내지 1273의 아미노산 잔기의 결실포함하는 SARS-CoV-2의 이중 도메인 S 단백질을 암호화한다.
더 바람직하게는, 제1 이종 폴리뉴클레오티드는 (a) 서열번호 3의 아미노산 서열의 위치 986 및 987에서 2개의 프롤린 잔기의 치환에 의한 돌연변이 및 서열번호 3의 아미노산 서열의 위치 1263 내지 1273의 11개의 C-말단 아미노산 잔기의 결실을 포함하는 SARS-CoV-2의 융합전-안정화된(prefusion-stabilized) SF-2P-dER 폴리펩티드, 또는 (b) 서열번호 3의 아미노산 서열의 위치 986 및 987의 2개의 프롤린 잔기의 치환에 의한 돌연변이 및 서열번호 3의 아미노산 서열의 위치 1269 및 1271의 2개의 알라닌 잔기의 치환에 의한 돌연변이를 포함하는 SARS-CoV-2의 융합전-안정화 SF-2P-2a 폴리펩티드를 암호화한다. 특정 구현예에서, 제1 이종 폴리뉴클레오티드는 MV의 P 유전자와 M 유전자 사이에 위치한 ATU2 또는 MV의 H 유전자의 하류에 위치한 ATU3에 위치한다. 바람직하게는, 제1 이종 폴리뉴클레오티드는 MV의 P 유전자와 M 유전자 사이에 위치한 ATU2에 위치한다. 본 발명에 따른 핵산 작제물은 서로 작동가능하게 연결된 상이한 기원의 다양한 폴리뉴클레오티드의 재조합에 의해 얻거나 얻을 수 있는 정제된 DNA 분자이다. 핵산 작제물은 홍역 바이러스(MV)의 전장 안티게놈(+) RNA 가닥을 암호화하는 cDNA 분자를 포함할 수 있다.
본 발명의 특정 구현예에서, 핵산 작제물은 코로나바이러스, 특히 코로나바이러스 SARS-CoV-2의 적어도 하나의 폴리펩티드, 이의 면역원성 단편 (야생형 또는 돌연변이된 단편 포함), 또는 1, 2, 3개 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 돌연변이된 항원을 암호화하는 제2 이종 폴리뉴클레오티드를 추가로 포함하고, 여기서의 폴리펩티드는 제1 이종 폴리뉴클레오티드에 의해 암호화된 적어도 하나의 폴리펩티드 또는 제1 이종 폴리뉴클레오티드에 의해 암호화된 폴리펩티드와 상이하고, 특히 뉴클레오캡시드(N) 폴리펩티드, 매트릭스(M), E 폴리펩티드, ORF8 폴리펩티드, ORF7a 폴리펩티드 및 ORF3a 폴리펩티드, 또는 이의 면역원성 단편 또는 이의 돌연변이 단편, 또는 1, 2, 3 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 돌연변이 항원으로 이루어진 군에서 선택되고, 제2 이종 폴리뉴클레오티드는 ATU 내에서 제1 이종 폴리뉴클레오티드의 위치와 별개의 위치에 위치한다.
본 발명의 특정 구현예에서, 핵산 작제물은 코로나바이러스, 특히 SARS-CoV-2의 적어도 하나의 폴리펩티드, 이의 면역원성 단편 또는 이의 항원성 단편(야생형 또는 돌연변이된 단편 포함), 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 돌연변이 항원을 암호화하는 제2 이종 폴리뉴클레오티드를 추가로 포함하고, 여기서의 폴리펩티드는 제1 이종 폴리뉴클레오티드에 의해 암호화된 적어도 하나의 폴리펩티드와 상이하고, 특히 뉴클레오캡시드(N) 폴리펩티드, 매트릭스(M), E 폴리펩티드, ORF8 폴리펩티드, ORF7a 폴리펩티드 및 ORF3a 폴리펩티드, 또는 이의 면역원성 단편 또는 이의 돌연변이된 단편, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 돌연변이 항원으로 이루어진 군에서 선택되고, 제2 이종 폴리뉴클레오티드는 제1 이종 폴리뉴클레오티드의 ATU와 별개의 위치에서 추가 전사 단위(ATU) 내부, 특히 MV(ATU1)의 N 유전자 상류의 추가 전사 단위 내부, 또는 특히 ATU2 내부 또는 특히 ATU3 내부에 위치한다.
제2 이종 폴리뉴클레오티드의 클로닝을 위한 ATU는 제1 이종 폴리뉴클레오티드의 클로닝에 사용된 ATU와 상이한 위치에 위치하고, 특히 ATU1에서 MV의 N 유전자의 상류에 위치하거나, 특히 ATU2에서 MV의 P 유전자와 M 유전자 사이의 위치에서 ATU 내에 위치하거나 특히 ATU3에서 MV의 H 유전자의 하류의 위치에서 ATU내에 위치합니다.
추가의 측면에서, 본 발명은 하기를 포함하는 핵산 작제물에 관한 것이다:
(1) 홍역 바이러스(MV)의 전장, 감염성 안티게놈(+) RNA 가닥을 암호화하는 cDNA 분자; 및
(2) 뉴클레오캡시드(N) 폴리펩티드, 매트릭스(M), E 폴리펩티드, ORF8 폴리펩티드, ORF7a 폴리펩티드 및 ORF3a 폴리펩티드, 또는 이의 면역원성 또는 항원성 단편 또는 이의 돌연변이된 단편, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 돌연변이 항원으로 이루어진 군에서 선택된, 코로나바이러스(CoV), 특히 SARS-CoV-2의 적어도 하나의 폴리펩티드를 암호화하고 ATU 내에 위치하는 이종 폴리뉴클레오티드.
추가의 전사 단위(ATU) 서열, 특히 본 발명에서 사용되는 ATU1, ATU2, ATU3은 이종 폴리뉴클레오티드를 MV의 cDNA로 클로닝하는데 사용되는 MV의 cDNA에 있는 서열이다. ATU 서열은 선행 유전자의 프로모터와 같은 도입유전자(transgene)의 MV-의존성 발현에 필요한 시스 작용 서열을 포함하고, 삽입체는 폴리뉴클레오티드, 예를 들어, 제1 또는 제2 폴리뉴클레오티드로 표시되고, 제1 또는 제2 폴리뉴클레오티드는 코로나바이러스의 적어도 하나의 폴리펩티드, 특히 코로나바이러스(CoV), 특히 SARS-CoV-2의 스파이크(S) 폴리펩티드, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편을 암호화하거나, 특히 뉴클레오캡시드(N) 폴리펩티드, 매트릭스(M), E 폴리펩티드, ORF8 폴리펩티드, ORF7a 폴리펩티드 또는 ORF3a 폴리펩티드, 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편 또는 이의 돌연변이 단편 또는 이의 돌연변이 항원을 암호화한다. 또한, 상기 폴리뉴클레오티드의 삽입을 위한 다중 클로닝 부위 카세트을 포함한다. 유전자의 유전자간 서열(전사를 촉진하는 유전자 시작부(GS) 및 삽입물(이종 폴리뉴클레오티드)의 전사를 종결시키는 MV의 P 유전자의 유전자 말단부(GE) 포함) 외에도, ATU는 이종 폴리뉴클레오티드의 삽입을 위한 폴리링커 서열을 포함한다. ATU 서열은 본 발명의 작제물에 예시되어 있다.
본 발명을 수행하기 위해 사용될 때, ATU는 유리하게는 MV의 안티게놈의 전장 (+)RNA 가닥을 암호화하는 cDNA 분자의 N-말단 서열 내에 위치하고, 특히 N 유전자(ATU1)의 상류측에 위치하거나 또는 이 바이러스의 P와 M 유전자 사이(ATU2) 또는 H와 L 유전자 사이(ATU3)에 위치한다. MV의 바이러스 RNA의 전사는 5'에서 3' 말단으로의 구배를 따르는 것으로 관찰되었다. 따라서, cDNA의 코딩 서열의 5' 말단에 삽입된 ATU는 cDNA의 코딩 서열의 3' 말단에 더 가깝게 삽입된 ATU보다 ATU 내에서 이종 DNA 서열의 더 큰 발현을 가능하게 할 것이다. 예시적인 ATU는 코로나바이러스(CoV), 특히 SARS-CoV-2의 스파이크(S) 폴리펩티드와 같은 적어도 하나의 폴리펩티드, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편을 암호화하는 폴리뉴클레오티드를 포함할 수 있다.
따라서, 코로나바이러스(CoV), 특히 SARS-CoV-2의 스파이크(S) 폴리펩티드, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편을 적어도 암호화하는 폴리뉴클레오티드는 특히 ATU에서 MV의 cDNA 분자의 임의의 유전자간 영역에 삽입될 수 있다. 본 발명의 특정 작제물은 실시예에 예시된 것들이다.
본 발명의 특정 구현예에서, 코로나바이러스(CoV), 특히 SARS-CoV-2의 스파이크(S) 폴리펩티드, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편을 적어도 암호화하는 폴리뉴클레오티드는 MV cDNA 분자(ATU2)의 P 및 M 유전자 사이, 또는 MV cDNA 분자(ATU3)의 H 및 L 유전자 사이의 분자간 영역, 바람직하게는 ATU3에 삽입된다.
본 발명의 특정 구현예에서, 작제물은 코로나바이러스(CoV), 특히 SARS-CoV-2의 적어도 하나의 폴리펩티트, 특히 스파이크 (S) E, N, ORF3a, ORF8, ORF7a 또는 M 폴리펩티드(예를 들어, Genbank MN908947.3에 개시된 서열을 갖는 S 폴리펩티드 또는 천연 S 항원에서 유래하고 본원에 예시된 임의의 폴리펩티드, 특히 S 단편 또는 S의 변형 단편), 또는 본 명세서에 개시된 바와 같은 이의 면역원성 단편(돌연변이된 단편 포함) 또는 1, 2, 3개 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 돌연변이 항원을 암호화하는 폴리뉴클레오티드를, MV의 전장, 안티게놈(+) RNA 가닥을 암호화하는 cDNA에 클로닝함으로써 제조된다.
대안적으로, 본 발명의 핵산 작제물은 핵산 단편의 합성 단계 또는 PCR에 의한 것을 포함하는 주형으로부터의 중합 단계를 사용하여 제조될 수 있다.
본 발명의 핵산 작제물 및 본 발명의 MV-CoV는 코로나바이러스, 또는 특히 SARS-CoV-2 균주의 S, E, N, ORF3a, ORF8, ORF7a 또는 M 단백질로 이루어진 군으로부터 선택되는 적어도 하나의 폴리펩티드, 특히 특히 코로나바이러스(CoV), 특히 SARS-CoV-2의 스파이크(S) 폴리펩티드, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 또는 결실(들)을 갖는 이의 면역원성 단편을 암호화하거나 발현한다.
바람직한 구현예에 따르면, 본 발명은 또한, 코로나바이러스, 특히 SARS-CoV-2 균주의 S, E, N, ORF3a, ORF8, ORF7a 또는 M 단백질로 이루어진 군에서 선택된 적어도 하나의 폴리펩티드, 특히 코로나바이러스(CoV), 특히 SARS-CoV-2의 스파이크(S) 폴리펩티드, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편이 숙주, 특히 인간 숙주에서 MV-CoV의 키메라 감염 입자의 표면에서 효율적으로 발현되는 것을 가능하게 하는 폴리뉴클레오티드의 변형 및 최적화에 관한 것이다.
이러한 구현예에 따르면, 폴리뉴클레오티드 서열의 최적화는 다음을 포함하는 핵산 분자의 시스-활성 도메인을 피하여 작동될 수 있다: 내부 TATA-박스, 카이(chi) 부위 및 리보솜 진입 부위; AT-풍부 또는 GC-풍부 시퀀스 스트레치; AU-풍부 서열 요소(ARE), 억제 서열 요소(INS) 및 시스 작용 억제자(CRS) 서열 요소; 반복 서열 및 RNA 2차 구조; 크립틱(cryptic) 스플라이스 공여 및 수용 부위, 및 분기점(branch point).
최적화된 폴리뉴클레오티드는 또한 특정 세포 유형에서의 발현을 위해 코돈 최적화될 수 있다. 이 최적화를 통해 발현된 단백질(들)에 영향을 주지 않고 세포에서 키메라 감염 입자 생산의 효율성을 높일 수 있다.
본 발명의 특정 구현예에서, 코로나바이러스(CoV), 특히 SARS-CoV-2의 스파이크(S) 폴리펩티드, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)를 갖는 이의 면역원성 단편을 암호화하는 폴리뉴클레오티드는 인간에서 사용하기 위해 코돈 최적화된 것이다.
코로나바이러스(CoV), 특히 SARS-CoV-2의 적어도 하나의 스파이크(S) 폴리펩티드, 또는 이의 면역원성 단편, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 S 폴리펩티드 또는 이의 단편의 변이체를 암호화하는 폴리뉴클레오티드의 최적화는 원래의 것에 대한 코돈으로부터 번역된 아미노산 잔기의 동일성에 영향을 미치지 않으면서 코돈에서 워블 위치(wobble position)의 변형에 의해 수행될 수 있다.
전사 편집을 초래할 수 있는 홍역 바이러스로부터 특정 서열을 제거하기 위해 최적화도 수행된다. 홍역 바이러스 전사체의 편집은 특히 홍역 바이러스의 P 유전자에 의해 암호화된 전사체에서 발생한다. P 전사체 내의 특정 부위에의 여분의 G 잔기를 삽입에 의한 이러한 편집은 P 단백질에 비해 잘린 새로운 단백질을 생성한다. 단일 G 잔기만 추가하면 고유한 카르복실 말단을 포함하는 V 단백질이 발현된다(Cattaneo R 등, Cell. 1989 Mar 10;56(5):759-64).
본 발명의 특정 구현예에서, 홍역 전사체 편집 서열은 코로나바이러스(CoV), 특히 SARS-CoV-2의 스파이크(S) 폴리펩티드, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편을 암호화하는 폴리뉴클레오티드로부터 변경된 것이다. 하기의 다음 홍역 전사 편집 서열이 돌연변이될 수 있다: AAAGGG, AAAAGG, GGGAAA, GGGGAA, TTAAA, AAAA 및 이들의 상보적 서열: TTCCCC, TTTCCC, CCTTTT, CCCCTT, TTTAA, TTTT. 예를 들어, AAAGGC는 AAAGGC에서 돌연변이될 수 있고, AAAAGG는 AGAAGG 또는 TAAAGG 또는 GAAAGG에서 돌연변이될 수 있고, GGGAAA는 GCGAAA에서 돌연변이될 수 있다.
본 발명의 특정 구현예에서, 특정 펩티드/단백질/항원을 암호화하는 폴리뉴클레오티드의 천연 및 코돈 최적화된 뉴클레오티드 서열 뿐만 아니라 본 발명의 이러한 펩티드/단백질/항원의 아미노산 서열은 서열번호 1 내지 49, 51 내지 66 및 73 내지 82하기 개시된 서열로부터 선택된다. 이러한 많은 서열에 대한 추가 정보는 하기 표 1 및 3을 참조한다.
코돈 최적화 유전자는 잘 전사/번역되지 않은 유전자의 높은 수준의 발현을 촉진하고 높고 안정적인 항원 발현으로 홍역 기반 백신 후보를 회수하는데 모두 유용하다. 그러나, 이들은 이들의 디자인과 최종 코돈(최종 숙주 게놈에서 가장 많이 사용되는 코돈) 및 뉴클레오티드(높은 GC/AT 비율) 조성과 본질적으로 관련이 있는 주요 단점을 가지고 있다. 따라서, 코돈 최적화된 유전자는 가장 자주, 높은 수준의 번역을 촉진하여 높은 수준으로 전사되면 번역 및 번역 후 세포 기계의 포화를 초래하고 발현된 단백질의 품질과 세포 자체(ER 및 Golgi 스트레스)에 대한 관련 결과를 초래한다. 자연적으로 높은 GC/조성(보통 55-60% 이상)은 MV 게놈의 GC 조성이 훨씬 낮기 때문에(47.4%) 안정적인 재조합 MV 벡터의 조작에 확실히 최적이 아니다. 따라서 본 발명자들은 코로나바이러스, 특히 SARS-CoV-2의 폴리펩티드(들)를 암호화하는 폴리뉴클레오티드에서 하기의 특징을 갖는 MV 플랫폼용으로 최적화된 유전자를 조작하기로 결정했다:
- 양 가닥에서 MV 편집(AnGn, n≥3) 및 코어 유전자 말단(A4CKT) 유사 서열의 부재,
- 적용가능한 경우, 내부 TATA 박스, 카이 사이트 및 리보솜 진입 사이트의 제거(번역 효율성을 위해),
- 적용 가능한 경우, AT-풍부 또는 GC-풍부 서열 스트레치, RNA 불안정성 모티프, 반복 서열 및 RNA 2차 구조의 제거(전사 효율, mRNA 안정성 및 번역 효율을 위해), 및/또는
- 균형 잡힌 코돈 조성, 적용 가능한 경우 희귀 코돈 및 가장 빈번한 코돈의 높은 사용을 회피(번역 기계의 포화 없이 번역의 효율성, 정확성 및 속도를 위해),
- 44 내지 50%의 타겟 GC 조성(MV 게놈의 조성에 맞게 조정).
또한, 고등 진핵생물에서 잠복 스플라이스 공여 및 수용 부위를 제거하기 위한 기준이 추가되었으며, 이는 MV 플랫폼에는 중요하지 않지만 포유동물 세포에서 일시적 형질감염에 의한 합성 유전자 발현을 모니터링하는 것을 가능하게 한다.
BsiWI 및 BssHII 제한 부위는 각각 설계된 뉴클레오티드 서열의 5' 및 3' 말단에 추가되었고, 생성된 cDNA가 뉴클레오티드 수를 규정하는 "6법칙"을 준수하도록 적절한 스페이서 서열이 삽입되었다. MV 게놈의 뉴클레오티드의 수는 6의 배수여야 한다.
얻어지는 cDNA는 S_MV 최적화된 합성 유전자로 명명되었고 N_MV 최적화된 합성 유전자는 본원에서 각각 서열번호 36 및 서열번호 37로 개시되어 있다.
본 발명의 특정 구현예에서, 전달 벡터 플라스미드는 아래 표 1에 언급한 바와 같이, 서열번호 34(pKM-ATU2-S_2019-nCoV(즉, SARS-CoV-2)) 또는 서열번호 35(pKM-ATU3- S_2019-nCoV(즉, SARS-CoV-2))를 갖는다.
본 발명의 특정 구현예에서, 전달 벡터 플라스미드는, 서열번호 144 (pTM2-SF-dER_SARS-CoV-2), 서열번호 145 (pTM2-S2-dER_SARS-CoV-2), 서열번호 146 (pTM2-SF-2P-dER_SARS-CoV-2), 서열번호 147 (pTM2-S2-2P-dER_SARS-CoV-2) 및 서열번호 148 (pTM2-SF-2P-2a_SARS-CoV-2)로 구성된 군으로부터 선택된 최적화된 서열, 바람직하게는 서열번호 146 (pTM2-SF-2P-dER_SARS-CoV-2) 또는 서열번호 148 (pTM2-SF-2P-2a_SARS-CoV-2)의 서열, 더 바람직하게는 서열번호 146 (pTM2-SF-2P-dER_SARS-CoV-2)의 서열을 가진다.
본 발명의 특정 구현예에서, 전달 벡터 플라스미드 내에 본원에 정의된 바와 같은 핵산 작제물의 삽입은 돌연변이, 특히 침묵 돌연변이(들)를 유발할 수 있다.
본 발명의 특정 구현예에서, 제1 이종 폴리뉴클레오티드는 S 폴리펩티드의 서열번호 11의 S1 도메인 또는 서열번호 13의 S2 도메인, 바람직하게는 서열번호 3의 야생형 S 폴리펩티드, 또는 1, 2, 3 또는 그 이상의 아미노산 잔기 치환(들) 또는 삽입(들) 및/또는 결실(들), 특히 10개 미만, 또는 5개 미만의 아미노산 잔기 치환을 갖는 돌연변이된 항원을 포함할 수 있다. 치환은 안정성을 향상시키도록 설계될 수 있다.
본 발명의 특정 구현예에서, 제1 이종 폴리뉴클레오티드는 서열번호 3의 야생형 S 폴리펩티드, 또는 이의 면역원성 단편을 암호화한다. 면역원성 단편은 S 폴리펩티드의 서열번호 11의 S1 도메인 또는 서열번호 13의 S2 도메인, 바람직하게는 서열번호 3의 야생형 S 폴리펩티드, 또는 1, 2, 3 또는 그 이상의 아미노산 잔기 치환(들) 또는 삽입(들) 및/또는 결실(들), 특히 10개 미만, 또는 5개 미만의 아미노산 잔기 치환을 갖는 돌연변이된 항원, 특히 1, 2, 3개 또는 그 이상의 아미노산 잔기 치환, 특히 10개 미만, 또는 5개 미만의 아미노산 잔기 치환을 갖고 본원에 개시된 바와 같이 세포질 꼬리에 최대 11개의 아미노산 잔기 결실을 갖는 돌연변이된 항원을 포함할 수 있다. 치환은 특히 안정성을 개선하도록 설계될 수 있다. 결실은 세포에서 폴리펩티드의 표면 발현을 개선하도록 설계될 수 있다. 특정 구현예에 따르면, 제1 이종 폴리뉴클레오티드는 서열번호 5, 7, 9, 15, 17 및 19로 이루어진 군으로부터 선택된 아미노산 서열의 폴리펩티드, 특히 서열번호 5의아미노산 서열의 폴리펩티드를 암호화한다. 바람직한 구현예에 따르면, 제1 이종 폴리뉴클레오티드는 서열번호 76의 SF-2P-dER 폴리펩티드, 또는 서열번호 82의 SF-2P-2a 폴리펩티드, 바람직하게는 서열번호 76의 SF-2P-dER 폴리펩티드, 또는 1, 2, 3 또는 그 이상의 아미노산 잔기 치환(들) 또는 삽입(들) 및/또는 결실(들), 특히 10개 미만, 또는 5개 미만의 아미노산 잔기 치환 또는 부가 및/또는 결실을 갖는 돌연변이된 항원을 암호화한다.
특정 구현예에 따르면, 제1 이종 폴리뉴클레오티드는 서열번호 5, 7, 9, 15, 17, 19, 43, 45, 47, 49, 52, 54, 56, 58, 60, 62 및 65, 특히 서열번호 5, 43, 45, 47 및 49, 바람직하게는 서열번호 43, 45, 47 및 49, 더욱 바람직하게는 서열번호 45, 47 및 49로 이루어진 군으로부터 선택된 아미노산 서열, 더욱 더 바람직하게는 서열번호 47 또는 서열번호 49, 더욱 더 바람직하게는 서열번호 49의 아미노산 서열을 갖는 돌연변이 항원을 암호화한다.
본 발명의 특정 구현예에서, 코로나바이러스, 특히 SARS-CoV-2의 단일 폴리펩티드는 핵산 작제물에 의해 암호화되고 폴리펩티드는 본원에 기재된 바와 같은 S 폴리펩티드 또는 이의 일부분 또는 단편이다.
본 발명의 핵산 작제물의 특정 구현예에서, 제2 이종 폴리뉴클레오티드는 (i) 서열번호 22의 N 폴리펩티드, 이의 면역원성 단편, 또는 1, 2, 3개 또는 그 이상의 아미노산 잔기 치환(들) 또는 삽입(들) 및/또는 결실(들), 특히 10개 미만, 또는 5개 미만의 아미노산 잔기 치환 또는 부가 또는 결실을 갖는 N 폴리펩티드의 돌연변이 항원, 및/또는 (ii) 서열번호 24의 M 폴리펩티드 또는 이의 엔도도메인, (iii) 서열번호 23의 E 폴리펩티드, (iv) 서열번호 25의 ORF8 폴리펩티드, (v) 서열번호 27의 ORF7a 폴리펩티드 및/또는 (vi) 코로나바이러스, 특히 SARS-CoV-2의 서열번호 26의 ORF3a 폴리펩티드, 이의 면역원성 단편 또는 이의 항원성 단편, 또는 1, 2, 3개 또는 그 이상의 아미노산 잔기 치환(들) 또는 삽입(들) 및/또는 결실(들), 특히 10개 미만, 또는 5개 미만의 아미노산 잔기 치환 또는 부가 및/또는 결실을 갖는 돌연변이 항원을 암호화한다. 본 발명의 바람직한 구현예에서, N 폴리펩티드를 암호화하는 이종 폴리뉴클레오티드는 서열번호 20, 21 또는 37의 서열, 바람직하게는 서열번호 21 또는 서열번호 37의 서열을 갖는다.
본 발명의 바람직한 구현예에서, S 폴리펩티드, S1 폴리펩티드 또는 S2 폴리펩티드, 또는 1, 2, 3 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실을 갖는 이의 면역원성 단편을 암호화하는 이종 폴리뉴클레오티드는 야생형 유전자의 오픈 리딩 프레임을 포함하거나 그로 구성하거나 포유동물 세포 및/또는 초파리 세포에서의 발현을 위한 코돈 최적화된 오픈 리딩 프레임(들)(coORF)을 가지며, 특히 이종 폴리뉴클레오티드는 다음 서열:
- S 폴리펩티드를 암호화하는 서열번호 1 또는 2 또는 36, 바람직하게는 서열번호 2, 또는
- S1 폴리펩티드를 암호화하는 서열번호 10, 또는
- S2 폴리펩티드를 암호화하는 서열번호 12, 또는
- stab-S 폴리펩티드(S2P)를 암호화하는 서열번호 4(S2P 폴리펩티드라고도 함), 또는
- Secto 폴리펩티드를 암호화하는 서열번호 6, 또는
- stab-Secto 폴리펩티드를 암호화하는 서열번호 8, 또는
- stab-S2 폴리펩티드를 암호화하는 서열번호 14, 또는
- tri-Secto 폴리펩티드를 암호화하는 서열번호 16, 또는
- tristab-Secto 폴리펩티드를 암호화하는 서열번호 18, 또는
- S3F 폴리펩티를 암호화하는 서열번호 42, 또는
- S2P3F 폴리펩티드를 암호화하는 서열번호 44, 또는
- S2PΔF 폴리펩티드를 암호화하는 서열번호 46, 또는
- S2PΔF2A 폴리펩티드를 암호화하는 서열번호 48, 또는
- T4-S2P3F 폴리펩티드(tristab-Secto-3F)를 암호화하는 서열번호 51, 또는
- S6P 폴리펩티드를 암호화하는 서열번호 53, 또는
- S6P3F 폴리펩티드를 암호화하는 서열번호 55, 또는
- S6PΔF 폴리펩티드를 암호화하는 서열번호 57, 또는
- SCCPP 폴리펩티드를 암호화하는 서열번호 59, 또는
- SCC6P 폴리펩티드를 암호화하는 서열번호 61, 또는
- SMVopt2P 폴리펩티드를 암호화하는 서열번호 63, 또는
- SMVoptΔF 폴리펩티드를 암호화하는 서열번호 64, 또는
- SMVopt2PΔF 폴리펩티드를 암호화하는 서열번호 66 중 하나를 포함하며,
바람직하게는 이종 폴리뉴클레오티드는 서열번호 2, 서열번호 4, 서열번호 42, 서열번호 44, 서열번호 46, 및 서열번호 48로 이루어진 군으로부터 선택되는 서열을 포함하며, 더 바람직하게는 이종 폴리뉴클레오티드는 S2PΔF2A 폴리펩티드를 암호화하는 서열번호 48의 서열을 포함한다.
본 발명의 특정 구현예에서, 핵산 작제물은 ORFs를 암호화하는 하기 폴리뉴클레오티드를 5'에서 3' 말단 방향으로 포함하는 cDNA 작제물이다:
(a) MV의 N 단백질을 암호화하는 폴리뉴클레오티드;
(b) MV의 P 단백질을 암호화하는 폴리뉴클레오티드;
(c) 코로나바이러스, 특히 SARS-CoV-2의 S 폴리펩티드, 특히 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편을 암호화하는 제1 이종 폴리뉴클레오티드로서, 여기서 제1 이종 폴리뉴클레오티드는 안티게놈(+) RNA의 cDNA 내에 삽입된 추가 전사 단위(ATU), 특히 ATU2 또는 ATU3, 바람직하게는 ATU3 내에 내에 위치함;
(d) MV의 M 단백질을 암호화하는 폴리뉴클레오티드;
(e) MV의 F 단백질을 암호화하는 폴리뉴클레오티드;
(f) MV의 H 단백질을 암호화하는 폴리뉴클레오티드;
(g) MV의 L 단백질을 암호화하는 폴리뉴클레오티드; 및
여기서, 폴리뉴클레오티드는 핵산 작제물 내에서 작동 가능하게 연결되고, MV 리더 및 트레일러(trailer) 서열과 같은 전사 조절 요소 및 바이러스 복제의 제어 하에 있으며, T7 프로모터 및 T7 터미네이터에 의해 구성되고, 추가적으로 재조합 MV-CoV 발현 카세트를 제공하도록 벡터에서의 클로닝에 적합한 제한 부위로 구성된다.
본 발명의 바람직한 구현예에서, 핵산 작제물은 오픈 리딩 프레임을 암호화하는 하기 폴리뉴클레오티드를 5'에서 3' 말단 방향으로 포함하는 cDNA 작제물이다:
(a) MV의 N 단백질을 암호화하는 폴리뉴클레오티드;
(b) MV의 P 단백질을 암호화하는 폴리뉴클레오티드;
(c) 상기 정의된 바와 같은 제1 이종 폴리뉴클레오티드;
(d) MV의 M 단백질을 암호화하는 폴리뉴클레오티드;
(e) MV의 F 단백질을 암호화하는 폴리뉴클레오티드;
(f) MV의 H 단백질을 암호화하는 폴리뉴클레오티드;
(g) MV의 L 단백질을 암호화하는 폴리뉴클레오티드; 및
여기서, 폴리뉴클레오티드는 핵산 작제물 내에서 작동 가능하게 연결되고, MV 리더 및 트레일러(trailer) 서열과 같은 전사 조절 요소 및 바이러스 복제의 제어 하에 있으며, T7 프로모터 및 T7 터미네이터에 의해 구성되고, 재조합 MV-CoV 발현 카세트를 제공하도록 벡터에서의 클로닝에 적합한 제한 부위로 구성된다. 본 발명의 핵산 작제물의 보다 바람직한 구현예에서, (i) 제1 이종 폴리뉴클레오티드는 홍역 바이러스-최적화된 뉴클레오티드 서열, 특히 서열번호 36, 서열번호 63, 서열번호 64 및 서열번호 66으로 이루어진 군에서 선택된 서열을 포함하고, ATU2 내에 위치하거나, 또는 (ii) 제1 이종 폴리뉴클레오티드는 코돈 최적화된 뉴클레오티드 서열, 특히 서열번호 2, 서열번호 4, 서열번호 44, 서열번호 46, 서열번호 48, 서열번호 51, 서열번호 53, 서열번호 55, 서열번호 57, 서열번호 59 및 서열번호 61로 이루어진 군에서 선택된 서열을 포함하고, ATU3 내에 위치한다.
본 발명의 바람직한 구현예에서, 핵산 작제물은 (i) 제1 이종 폴리뉴클레오티드는 ATU3 내에 위치하고, 제2 이종 폴리뉴클레오티드, 특히 N 폴리펩티드를 암호화하는 제2 이종 폴리뉴클레오티드는 ATU2 내에 위치되며, 또는 (ii) 제1 이종 폴리뉴클레오티드는 ATU2 내에 위치하고, 제2 이종 폴리뉴클레오티드, 특히 N 폴리펩티드를 암호화하는 제2 이종 폴리뉴클레오티드는 ATU3 내에 위치된다.
또 다른 구현예에서, 제1 이종 폴리뉴클레오티드는 제2 이종 폴리뉴클레오티드로 대체된다.
본 발명의 또 다른 측면에서, 핵산 작제물은 ATU2 또는 ATU3 내에 위치하는, 본원에 정의된 바와 같은 이른바 제2 이종 폴리뉴클레오티드와 같은 단 하나의 이종 폴리뉴클레오티드를 포함한다. 몇몇 구현예에서, 이러한 제2 이종 폴리뉴클레오티드는 N 폴리펩티드를 암호화한다. 몇몇 구현예에서, N 폴리펩티드를 암호화하는 이러한 제2 이종 폴리뉴클레오티드는 서열번호 20, 21 또는 37의 서열, 바람직하게는 서열번호 21 또는 서열번호 37의 서열을 갖는다. 이 핵산 작제물은 또 다른 이종 폴리뉴클레오티드, 예를 들어 본원에 정의된 바와 같은 이른바 제1 이종 폴리뉴클레오티드를 추가로 포함할 수 있다. 본 명세서에 개시된 모든 정의 및 구현예는 본 발명의 이러한 다른 측면에 적용되며 모든 단락은 서로 결합될 수 있다.
본 발명의 바람직한 구현예에서, S 폴리펩티드, S1 폴리펩티드 또는 S2 폴리펩티드, 1, 2, 3 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편를 암호화하는 이종 폴리뉴클레오티드는 야생형 유전자의 오픈 리딩 프레임을 포함하거나 이로 구성되거나, 포유동물 세포 및/또는 초파리 세포에서의 발현을 위한 코돈-최적화된 오픈 리딩 프레임(들)(coORF)을 가지며, 특히 이종 폴리뉴클레오티드는 다음 서열:
- S 폴리펩티드를 암호화하는 서열번호 1 또는 2 또는 36, 바람직하게는 서열번호 2, 또는
- S1 폴리펩티드를 암호화하는 서열번호 10, 또는
- S2 폴리펩티드를 암호화하는 서열번호 12, 또는
- stab-S 폴리펩티드(S2P)를 암호화하는 서열번호 4(S2P 폴리펩티드라고도 함), 또는
- Secto 폴리펩티드를 암호화하는 서열번호 6, 또는
- stab-Secto 폴리펩티드를 암호화하는 서열번호 8, 또는
- stab-S2 폴리펩티드를 암호화하는 서열번호 14, 또는
- tri-Secto 폴리펩티드를 암호화하는 서열번호 16, 또는
- tristab-Secto 폴리펩티드를 암호화하는 서열번호 18, 중 하나를 포함하며,
바람직하게는 이종 폴리뉴클레오티드는 서열번호 2 또는 서열번호 4의 서열을 포함한다.
본 발명의 더 바람직한 구현예에서, SF-2P-dER 폴리펩티드 또는 SF-2P-2a 폴리펩티드, 1, 2, 3 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편을 암호화하는 이종 폴리뉴클레오티드는 포유동물 세포 및/또는 초파리 세포에서의 발현을 위한 코돈-최적화된 오픈 리딩 프레임(들)(coORF)의 오픈 리딩 프레임을 가지며, 특히, 이종 폴리뉴클레오티드는 하기 서열 중 하나를 포함한다:
i. SF-2P-dER 폴리펩티드를 암호화하는 서열번호 75, 또는
ii. SF-2P-2a 폴리펩티드를 암호화하는 서열번호 81.
바람직하게는, 이종 폴리뉴클레오티드는 SF-2P-dER 폴리펩티드를 암호화하는 서열번호 75의 서열을 포함한다.
본 발명의 특정 구현예에서, 핵산 작제물은 ORFs를 암호화하는 하기 폴리뉴클레오티드를 5'에서 3' 말단 방향으로 포함하는 cDNA 작제물이다:
(a) MV의 N 단백질을 암호화하는 폴리뉴클레오티드;
(b) MV의 P 단백질을 암호화하는 폴리뉴클레오티드;
(c) 적어도 S 폴리펩티드를 암호화하는 제1 이종 폴리뉴클레오티드, 코로나바이러스, 특히 SARS-CoV-2의, 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편을 암호화하는 제1 이종 폴리뉴클레오티드로서, 여기서 제1 이종 폴리뉴클레오티드는 안티게놈(+) RNA의 cDNA 내에 삽입된 추가 전사 단위(ATU), 특히 ATU2 또는 ATU3, 바람직하게는 ATU3 내에 내에 위치함;
(d) MV의 M 단백질을 암호화하는 폴리뉴클레오티드;
(e) MV의 F 단백질을 암호화하는 폴리뉴클레오티드;
(f) MV의 H 단백질을 암호화하는 폴리뉴클레오티드;
(g) MV의 L 단백질을 암호화하는 폴리뉴클레오티드; 및
여기서, 폴리뉴클레오티드는 핵산 작제물 내에서 작동 가능하게 연결되고, MV 리더 및 트레일러(trailer) 서열과 같은 전사 조절 요소 및 바이러스 복제의 제어 하에 있으며, T7 프로모터 및 T7 터미네이터에 의해 구성되고, 추가적으로 재조합 MV-CoV 발현 카세트를 제공하도록 벡터에서의 클로닝에 적합한 제한 부위로 구성된다.
본 발명의 바람직한 구현예에서, 핵산 작제물은 오픈 리딩 프레임을 암호화하는 하기 폴리뉴클레오티드를 5'-에서 3'-말단 방향으로 포함하는 cDNA 작제물이다:
(a) MV의 N 단백질을 암호화하는 폴리뉴클레오티드;
(b) MV의 P 단백질을 암호화하는 폴리뉴클레오티드;
(c) 본 발명에 따른 제1 이종 폴리뉴클레오티드, 특히 SARS-CoV-2의 SF-2P-dER 또는 SF-2P-2a 폴리펩티드, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편을 암호화하는 제1 이종 폴리뉴클레오티드로서, 여기서 제1 이종 폴리뉴클레오티드는 ATU2 또는 ATU3, 바람직하게는 ATU2 내에 위치함;
(d) MV의 M 단백질을 암호화하는 폴리뉴클레오티드;
(e) MV의 F 단백질을 암호화하는 폴리뉴클레오티드;
(f) MV의 H 단백질을 암호화하는 폴리뉴클레오티드;
(g) MV의 L 단백질을 암호화하는 폴리뉴클레오티드; 및
여기서, 폴리뉴클레오티드는 핵산 작제물 내에서 작동 가능하게 연결되고, MV 리더 및 트레일러(trailer) 서열과 같은 전사 조절 요소 및 바이러스 복제의 제어 하에 있으며, T7 프로모터 및 T7 터미네이터에 의해 구성되고, 추가적으로 재조합 MV-CoV 발현 카세트를 제공하도록 벡터에서의 클로닝에 적합한 제한 부위로 구성된다.
또 다른 구현예에서, 제1 핵산 작제물은 제2 핵산 작제물로 대체된다.
"N 단백질", "P 단백질", "M 단백질", "F 단백질", "H 단백질" 및 "L 단백질"이라는 표현은 각각 MV의 핵단백질(N), 인단백질(P), 기질 단백질( M), 융합 단백질(F), 헤마글루티닌 단백질(H) 및 RNA 폴리머라제 대형 단백질(L)을 의미한다(Fields, Virology(Knipe & Howley, 2001)).
본 발명의 작제물에서, 재조합 게놈의 레플리콘에 잔류할 추가된 폴리뉴클레오티드 서열과 함께 취해진 MV 서열과 관련하여 본원에 개시된 폴리뉴클레오티드 서열은 MV 게놈이 효율적인 구출을 가능하게 하기 위해 정확하게 발생하기 위한 역유전학(reverse genetics )을 위한 6개의 뉴클레오티드 길이의 정확한 배수인 요건을 특징지우는 "6의 법칙(rule of six)"을 따른다.
본 발명의 특정 구현예에서, MV 안티게놈을 암호화하는 cDNA의 첫 번째 뉴클레오티드와 MV 안티게놈을 암호화하는 cDNA의 마지막 뉴클레오티드 사이의 재조합 MV-CoV 핵산 분자의 서열은 6개 뉴클레오티드의 배수이다.
따라서 "6의 법칙"은 코로나바이러스 항원(들)을 암호화하는 서열을 포함하는 본 발명에 따라 제조된 작제물에도 적용된다.
"6의 법칙"은 MV(+) 가닥 RNA 게놈을 나타내는 핵산 또는 이를 포함하는 핵산 작제물에 존재하는 뉴클레오티드의 총 수가 6의 배수라는 사실로 표현된다. "6의 법칙"은 MV 게놈 RNA의 효율적이거나 최적화된 복제를 가능하게 하는 MV 게놈의 총 뉴클레오티드 수에 관한 요구 사항으로 최신 기술에서 인정되었다. 6의 규칙을 충족하는 핵산 작제물을 정의하는 본 발명의 구현예에서, 개별적으로 또는 집합적으로 취해질 때 전장 MV(+) 가닥 RNA 게놈 및 모든 삽입된 서열을 암호화하는 cDNA를 지정하는 핵산 작제물에 그 규칙이 적용된다.
특히, 본 발명의 핵산 작제물은, 6의 배수인 다수의 뉴클레오티드로 구성되는 MV의 전장 감염성 안티게놈(+) RNA 가닥을 암호화하는 cDNA 분자와 함께 취해진 경우, 코로나바이러스(CoV), 특히 SARS-CoV-2의 적어도 스파이크(S) 폴리펩티드, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편을 암호화하는 폴리뉴클레오티드와 조합된 경우, MV 게놈의 6의 법칙을 따른다. 특정 구현예에서, 6의 법칙은 MV의 전장 감염성 안티게놈 (+) RNA 가닥을 암호화하는 적용되고, cDNA에 클로닝되고 CoV, 특히 SARS-CoV-2의 적어도 스파이크 (S) 폴리펩티드, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편을 암호화하는 폴리뉴클레오티드에 적용된다. 대안적으로, 6의 법칙의 준수는 재조합 홍역 바이러스의 구출을 위해 사용된 세포에서 전체 작제물 또는 작제물로부터 수득된 전사체를 고려하여 결정될 수 있다.
MV의 게놈의 구성 및 이들의 복제 및 전사 과정은 선행 기술에서 충분히 확인되었으며 특히 문헌[Horikami S.M. and Moyer S.A. (Curr. Top. Microbiol. Immunol. (1995) 191, 35-50)] 또는 Schwarz 백신 접종 균주 또는 광범위하게 고려된 네거티브 센스 RNA 바이러스의 경우 문헌[Combredet C. 등 (Journal of Virology, Nov 2003, p11546-11554)] 및 문헌[Neumann G. 등 (Journal of General Virology (2002) 83, 2635-2662)]에 개시되어 있다.
본 발명의 바람직한 구현예에서, 홍역 바이러스는 약독화된 바이러스 균주이다.
홍역 바이러스의 "약독화 균주"는 숙주에 투여될 때 면역원성 및 가능하게는 면역증강성을 유지하면서, 즉 T 세포 공동자극 단백질 또는 사이토카인 IL-12의 유도와 같은 면역우세 T 및 B 세포 에피토프 및 가능하게는 보존하면서, 동일한 숙주에서 모 균주보다 독성이 없거나 덜 독성인 균주로 정의된다.
따라서, MV의 약독화된 균주는 선택된 세포에서 연속적으로 계대되고 아마도 다른 세포에 적응되어 병원성으로의 복귀 또는 숙주 염색체의 통합을 허용하지 않는 안정한 게놈을 보유하는 백신 균주의 제조에 적합한 종자 균주를 생산하도록 적응된 균주를 의미한다. 특정 "약독화 균주"로서, 백신에 대해 승인된 균주는 FDA(미국 식품의약국)에서 정의한 기준, 즉 실험실 및 임상 데이터에 대한 엄격한 검토 후(www.fda.gov/cber/vaccine/vacappr.htm) 안전성, 효능, 품질 및 재현성 기준을 충족하는 경우 본 발명에 적합한 약독화된 균주이다.
본 발명을 구현하고 특히 핵산 작제물의 MV cDNA를 유도하기 위해 사용될 수 있는 특정한 약독화된 균주는 Schwarz 균주, Zagreb 균주, AIK-C 균주 및 Moraten 균주, 보다 바람직하게는 Schwarz 균주이다. 이들 균주 모두는 선행 기술에 기재되어 있고 이들에 대한 접근은 특히 상업적 백신으로서 제공된다. 본 발명의 특정 구현예에서, MV-CoV 분자의 재조합 DNA 또는 cDNA는 이종 발현 조절 서열의 제어하에 놓이게 된다. DNA/cDNA의 발현을 위한 이러한 대조군의 삽입은, 이 DNA/cDNA의 발현이 본래의 제어 서열을 갖는 DNA/cDNA의 완전한 전사를 가능하게 하지 않는 세포 유형에서 추구될 때 유리하다.
본 발명의 특정 구현예에서, 이종 발현 조절 서열은 T7 프로모터 및 T7 터미네이터 서열을 포함한다. 이들 서열은 각각 MV의 전장 안티게놈 (+)RNA 가닥에 대한 코딩 서열의 5' 및 3'에 위치하며 이 코딩 서열 주위의 인접 서열로부터 위치한다. 따라서, 특정 구현예에서, 본 발명의 핵산 작제물은 이러한 추가 제어 서열을 포함한다.
본 발명의 특정 구현예에서, 본원에 정의된 이종 폴리뉴클레오티드와 재조합된 홍역 바이러스의 안티게놈 RNA를 암호화하는 재조합 핵산 분자 또는 핵산 잣제물은 추가로 변형된다. 즉 추가의 뉴클레오티드 서열 또는 모티프를 포함한다.
바람직한 구현예에서, 본 발명에 따른 이종 폴리뉴클레오티드와 재조합된 홍역 바이러스의 안티게놈 RNA를 암호화하는 핵산 작제물 또는 재조합 핵산 분자는 하기 (a) 및 (b)를 추가로 포함한다. (a) 약독화된 MV 백신 균주, 특히 Schwarz 균주 또는 Moraten 균주의 전장 안티게놈 (+)RNA 가닥을 암호화하는 뉴클레오티드 서열의 첫 번째 뉴클레오티드에 인접한 것으로, 핵산 작제물의 5'-말단에서 해머헤드 리보자임 서열이 뒤따르는 GGG 모티프, 및 (b) 전장 안티게놈 (+)RNA 가닥을 암호화하는 뉴클레오티드 서열의 마지막 뉴클레오티드에 인접한 것으로, 재조합 MV-CoV 핵산 분자의 3'-말단에 있는 리보자임의 뉴클레오티드 서열, 특히 델타 간염 바이러스 리보자임의 서열, 따라서, 델타 간염 바이러스 리보자임(δ)은 전장 항-게놈(+)RNA 가닥을 암호화하는 뉴클레오티드 서열의 마지막 뉴클레오티드에 인접하여 3'-말단에 제공되는 것이 유리하다.
상기 코딩 서열의 첫 번째 뉴클레오티드에 인접한 5' 말단에 위치한 GGG 모티프는 cDNA 코딩 서열의 전사 효율을 향상시킨다. 홍역 바이러스 입자의 적절한 조립을 위해서는 본 발명의 핵산 작제물의 안티게놈 (+)RNA를 암호화하는 cDNA가 6의 법칙을 준수해야 하므로, GGG 모티프가 추가될 때 리보자임도 cDNA의 코딩 서열의 5' 말단, GGG 모티브로부터 3'에 추가됨으로써, MV의 전장 안티게놈 (+)RNA 가닥의 첫 번째 코딩 뉴클레오티드에서 전사체의 절단을 가능하게 한다.
본 발명의 특정 구현예에서, 본 발명의 핵산 작제물을 제조하기 위해, 선행 기술에 개시된 MV의 전장 안티게놈(+) RNA를 암호화하는 cDNA 분자의 제조는 공지된 방법에 의해 달성된다. cDNA는 플라스미드와 같은 벡터에 삽입될 때 특히 게놈 벡터를 제공한다.
본 발명의 핵산 작제물의 제조에 적합한 특정 cDNA 분자는 MV의 Schwarz 균주를 사용하여 얻은 것이다. 따라서, 본 발명에서 사용되는 홍역 바이러스의 안티게놈을 암호화하는 cDNA는 WO2004/000876호에 개시된 바와 같이 얻어질 수 있거나, 또는 Collection Nationale de Culture de Microorganismes(CNCM)(주소: 프랑스 75724 Paris Cedex 15, 28 rue du Dr Roux)에 파스퇴르 연구소(Institut Pasteur)에 의해 2002년 6월 12일에 기탁번호 I-2889로 기탁된 플라스미드 pTM-MVSchw로부터 얻어질 수 있다. 플라스미드 pTM-MVSchw의 서열은 본원에 참고로 포함되는 WO2004/000876호에 개시되어 있다. 플라스미드 pTM-MVSchw는 Bluescript 플라스미드로부터 얻었고, T7 RNA 폴리머라제의 프로모터의 제어 하에 배치된 Schwarz 균주의 전장 홍역 바이러스(+) RNA 가닥을 암호화하는 폴리뉴클레오티드를 포함한다. 플라스미드 pTM-MVSchw는 18967개의 뉴클레오티드 및 서열번호 28의 서열을 가지고 있다. 다른 MV 균주 유래의 cDNA 분자(편의를 위해 홍역 바이러스의 cDNA 또는 MV cDNA로도 나타냄)는 본원에 기재된 바와 같늠 약독화 MV의 바이러스 입자로부터 정제된 핵산으로부터 출발하여 유사하게 수득될 수 있다.
본 발명에서 사용되는 홍역 바이러스의 안티게놈을 암호화하는 cDNA는 Collection Nationale de Culture de Microorganismes(CNCM)(주소: 프랑스 75724 Paris Cedex 15, 28 rue du Dr Roux)에 파스퇴르 연구소에 의해 2002년 6월 12일에 기탁번호 I-2890로 기탁된 플라스미드 pTM2-MVSchw-gfp로부터 얻어질 수도 있다. 이는 19795개의 뉴클레오티드 및 서열번호 29로 표시되는 서열을 갖는다. 이 플라스미드는 결실될 수 있는 eGFP 마커를 암호화하는 서열을 포함한다.
또한, 상기 인용된 pTM-MVSchw 플라스미드는, 코로나바이러스, 특히 SARS-CoV-2 균주의 항원으로부터 유래된 폴리펩티드를 암호화하는 이종 폴리뉴클레오티드(특히 본원에 개시된 바와 같은 S 항원으로부터 유래된 폴리펩티드)를, ATU1 또는 ATU2 또는 ATU3, 바람직하게는 ATU3의 삽입을 위한 것으로 알려진 위치에 삽입된 하나 이상의 ATU를 이용하여 홍역 바이러스의 안티게놈을 암호화하는 cDNA에 클로닝함으로써 본 발명의 핵산 작제물의 제조에 사용될 수 있다.
특정 구현예에서, 본 발명의 핵산 작제물은 서열번호 34 또는 서열번호 35의 서열에서 위치 1 내지 위치 20152에 위치한 재조합 MV-CoV 핵산 분자를 포함하거나 이로 그로 이루어진다. 이 작제물은 홍역 바이러스 안티게놈을 암호화하는 cDNA에 삽입된 ATU2 또는 ATU3에 각각 위치한 SARS-CoV-2의 S 폴리펩티드를 암호화한다.
특정 구현예에서, 본 발명은 S 단백질을 암호화하는 서열을 하기의 폴리뉴클레오티드로 대체함으로써 상기로부터 유래된 핵산 작제물에 관한 것이다: 코로나바이러스, 특히 SARS-CoV-2의 또 다른 폴리펩티드를 암호화하는 폴리뉴클레오티드, 예를 들어, 본원에 개시된 S 항원 단편의 서열, 특히 stab-S(S2P라고도 함), Secto, stab-Secto, S1, S2, stab-S2, tri-Secto, tristab-Secto, S3F, S2P3F, S2PΔF, S2PΔF2A 폴리펩티드 중 하나를 암호화하는 뉴클레오티드 서열, 특히 각각 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 42, 44, 46 또는 48, 바람직하게는 서열번호 4, 42, 44, 46 또는 48로 개시된 서열의 폴리뉴클레오티드, 보다 바람직하게는 서열번호 44, 46 또는 48, 더욱 더 바람직하게는 서열번호 46 또는 서열번호 48, 훨씬 더 바람직하게는 서열번호 48, 또는 각각 서열번호 5, 7, 9, 11, 13, 15, 17, 19, 43, 45, 47 또는 49, 바람직하게는 서열번호 5, 43, 45, 47 또는 49, 더 바람직하게는 서열번호 45, 47 또는 49, 훨씬 더 바람직하게는 서열번호 47 또는 SEQ ID NO: 49, 훨씬 더 바람직하게는 서열번호 49의 아미노산 서열을 암호화하는 폴리뉴클레오티드. 이러한 구현예에서, 서열번호 34의 서열에서 대체될 폴리뉴클레오티드 영역은 위치 3538 내지 위치 7362이고, 서열번호 35의 서열에서 대체될 폴리뉴클레오티드 영역은 위치 9340 내지 위치 13164이다.
특정 구현예에서, 본 발명은 S 단백질을 암호화하는 서열을 하기의 폴리뉴클레오티드로 대체함으로써 상기로부터 유래된 핵산 작제물에 관한 것이다: 코로나바이러스, 특히 SARS-CoV-2의 또 다른 폴리펩티드를 암호화하는 폴리뉴클레오티드, 예를 들어, 본원에 개시된 S 항원 단편의 서열, 특히 stab-S(S2P라고도 함), Secto, stab-Secto, S1, S2, stab-S2, tri-Secto, tristab-Secto, SF-2P-dER 또는 SF-2P-2a 폴리펩티드 중 하나를 암호화하는 뉴클레오티드 서열, 특히 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 75 또는 81, 바람직하게는 서열번호 4, 75 또는 81, 보다 바람직하게는 서열번호 75 또는 81, 훨씬 더 바람직하게는 서열번호 75로서 개시된 서열의 폴리뉴클레오티드, 또는 각각 서열번호 5, 7, 9, 11, 13, 15, 17, 19, 76 또는 82, 바람직하게는 서열번호 5, 76 또는 82, 보다 바람직하게는 서열번호 76 또는 82, 훨씬 더 바람직하게는 서열번호 76의 아미노산 서열을 암호화하는 폴리뉴클레오티드. 이러한 구현예에서, 서열번호 34의 서열에서 대체될 폴리뉴클레오티드 영역은 위치 3538 내지 위치 7362이고, 서열번호 35의 서열에서 대체될 폴리뉴클레오티드 영역은 위치 9340 내지 위치 13164이다.
다른 구현예에서, 본 발명은 S 단백질을 암호화하는 서열을 하기의 폴리뉴클레오티드로 대체함으로써 상기로부터 유래된 핵산 작제물에 관한 것이다: 코로나바이러스, 특히 SARS-CoV-2의 또 다른 폴리펩티드를 암호화하는 폴리뉴클레오티드, 예를 들어 코로나바이러스, 특히 SARS-CoV-2의 N, E, M, ORF3a, ORF7a, ORF8 폴리펩티드를 암호화하는 서열, 또는 Genbank MN908947.3에 개시된 서열을 사용하여 수득될 수 있거나 본원에 개시된 뉴클레오티드 서열을 가질 수 있는 이의 항원성 또는 면역원성 단편.
본 발명의 바람직한 구현예에서, 핵산 작제물은 코로나바이러스, 특히 SARS-CoV-2의 N 폴리펩티드, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편을 암호화하는 제2 이종 폴리뉴클레오티드를 포함하는 재조합 MV-CoV 핵산 분자를 포함하거나 그로 구성되고, 제2 이종 폴리뉴클레오티드는 제1 이종 폴리뉴클레오티드를 클로닝하는데 사용되는 ATU와 다른 위치의 ATU에서 클로닝된다,
특정 구현예에서, 이러한 핵산 작제물은 삽입되고, 특히 발현 벡터 또는 전달 벡터, 예를 들어 플라스미드에 클로닝된다. 적합한 플라스미드의 예는 Combredet 등 (2003) 또는 WO 04/00876호에 공지된 pTM 플라스미드, 또는 본원에 개시된 pKM 플라스미드이다.
본원에 기술된 임의의 핵산 작제물은 재조합 감염성 복제 홍역 - 코로나바이러스 바이러스(MV-CoV)의 제조에 적합하고 그 제조에 의도된 것이다. 따라서, 핵산 작제물은 (i) MV-CoV의 생성 및 코로나바이러스(CoV), 특히 SARS-CoV-2의 적어도 하나의 폴리펩티드, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편, 특히 본원에 개시된 바와 같은 스파이크(S) 폴리펩티드 또는 이의 면역원성 단편의 산출을 위해, 결과적으로 홍역 바이러스, 특히 Schwarz 균주의 cDNA 분자를 포함하는 전달 게놈 벡터에 삽입하기 위해 사용되거나, 또는 (ii) 이러한 전달 벡터, 특히 플라스미드 벡터이다.
핵산 작제물은 또한 바이러스-유사 입자(VLP), 특히 CoV VLP의 생산을 위해 사용될 수 있다.
예로서, pTM-MVSchw 플라스미드 또는 pTM2-MVSchw 플라스미드는, 코로나바이러스(CoV), 특히 SARS-CoV-2의 적어도 하나의 스파이크(S) 폴리펩티드 또는 N, M, E, ORF7a, ORF3a 또는 ORF8과 같은 또 다른 항원, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편의 발현을 위해 필요한 CoV 폴리뉴클레오티드(들)의 삽입을 통해 전달 벡터를 제조하기에 적합하다. 대안적으로, 그러한 전달 벡터는 pKP-MVSchw-ATU1(eGFP), pKP-MVSchw-ATU2(eGFP), pKP-MVSchw-ATU3(eGFP)를 포함하는, 실시예에 상세히 기재된 pKM 벡터일 수 있고, 여기서 eGFP의 뉴클레오티드 서열은 코로나바이러스(CoV), 특히 SARS-CoV-2의 적어도 하나의 스파이크(S) 폴리펩티드 또는 N, M, E, ORF7a, ORF3a 또는 ORF8과 같은 또 다른 항원, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편으로 대체된다. 본원에 개시된 서열은 당업자가 특히 실시예의 개시내용을 사용하여 삽입체 치환을 설계 및 제조하기 위해 플라스미드에 함유된 삽입체의 위치에 접근할 수 있게 한다.
CNCM에서의 기탁과 관련하여 본원에 인용된 모든 플라스미드는 Collection Nationale de Cultures de Microorganismes(주소: 프랑스 75724 Paris Cedex 15, 25 rue du Docteur Roux)에 기탁되었다.
핵산 작제물의 특정 측면에 따르면, 본 발명은 하기를 포함하는 재조합 홍역 바이러스(MV)의 구출(rescue)에 적합한 전달 벡터, 특히 플라스미드 벡터에 관한 것이다: 본 발명에 따른 핵산 작제물, 특히 서열번호 28의 플라스미드(pTM-MVSchwarz), 서열번호 29의 플라스미드(pTM2-MVSchw-gfp, 또한 pTM-MVSchw2-GFPbis 또는 pTM-MVSchwarz-ATU2-CNCM I-3034로 명명됨, 2003년 5월 26일에 기탁됨, GFPbis 코딩 서열의 삽입), 서열번호 38의 플라스미드(pTM3-MVSchw-gfp, 또한 pTM-MVSchw3-GFP 또는 pTM-MVSchwarz-ATU3-CNCM I-3037로 명명됨, 2003년 5월 26일에 기탁됨, GFP 코딩 서열의 삽입), 서열번호 30의 플라스미드(pKP-MVSchwarz), 서열번호 31의 플라스미드(pKP-MVSchwarz-ATU1), 서열번호 32의 플라스미드(pKP-MVSchwarz-ATU2) 및 서열번호 33의 플라스미드(pKP-MVSchwarz-ATU3)로 이루어진 군에서 선택된 전달 벡터. 여기서의 전달 벡터는 (i) 안티게놈(+) RNA의 cDNA 내에 삽입된 추가 전사 단위(ATU) 내에 위치한 것으로, 코로나바이러스, 특히 SARS-CoV-2의 스파이크 폴리펩티드, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편을 암호화하는 제1 이종 DNA 폴리뉴클레오티드와 재조합되거나, (ii) 코로나바이러스, 특히 SARS-CoV-2의 또 다른 폴리펩티드, 예를 들어, 코로나바이러스, 특히 SARS-CoV-2의 N, E, M, ORF3a, ORF7a, ORF8 폴리펩티드의 서열, 예를 들어, Genbank MN908947.3에 개시된 서열로부터 유래되거나 또는 본원에 개시된 서열에 상응하는 서열을 암호화하는 제2 이종 폴리뉴클레오티드와 재조합된다.
핵산 작제물의 바람직한 측면에 따르면, 본 발명은 본 발명에 따른 핵산 작제물, 특히 서열번호 32의 플라스미드(pKP-MVSchwarz-ATU2) 및 서열번호 33 의 플라스미드(pKP-MVSchwarz-ATU3)로 이루어진 군으로부터 선택된 전달 벡터를 포함하는 재조합 홍역 바이러스(MV)의 구출에 적합한 전달 벡터, 특히 플라스미드 벡터에 관한 것이고, 여기서의 전달 벡터는 ATU2 또는 ATU3 내에 위치한 제1항, 제2항, 제4항 및 제6항 중 어느 한 항에 정의된 바와 같은 SARS-CoV-2의 폴리펩티드를 암호화하는 제1 이종 DNA 폴리뉴클레오티드와 재조합된다.
특정 구현예에서, 전달 벡터는 플라스미드, 특히 재조합 DNA MV-CoV 서열과 재조합된 상기 플라스미드 중 하나이며, 여기서 SARS-CoV-2의 폴리펩티드를 암호화하는 서열은 하기로 이루어진 군으로부터 선택된다:
- 서열번호 1 또는 2 또는 36(작제물 S);
- 서열번호 4 (작제물 stab-S, 작제물 S2P로도 명명됨);
- 서열번호 6 (작제물 Secto);
- 서열번호 8 (작제물 stab-Secto);
- 서열번호 10 (작제물 S1),
- 서열번호 12 (작제물 S2),
- 서열번호 14 (작제물 stab-S2),
- 서열번호 16 (작제물 tri-Secto),
- 서열번호 18 (작제물 tristab-Secto),
- 서열번호 42 (작제물 S3F),
- 서열번호 44 (작제물 S2P3F),
- 서열번호 46 (작제물 S2PΔF),
- 서열번호 48 (작제물 S2PΔF2A),
- 서열번호 21 또는 37 (작제물 N),
- 서열번호 51 (작제물 T4-S2P3F(tristab-Secto-3F)),
- 서열번호 53 (작제물 S6P),
- 서열번호 55 (작제물 S6P3F),
- 서열번호 57 (작제물 S6PΔF),
- 서열번호 59 (작제물 SCCPP),
- 서열번호 61 (작제물 SCC6P),
- 서열번호 63 (작제물 SMVopt2P),
- 서열번호 64 (작제물 SMVoptΔF), 및
- 서열번호 66 (작제물 SMVopt2PΔF).
바람직한 구현예에서, 전달 벡터는 플라스미드, 특히 재조합 DNA MV-CoV 서열과 재조합된 상기 플라스미드 중 하나이며, 여기서 SARS-CoV-2의 폴리펩티드를 암호화하는 서열은 하기로 이루어진 군으로부터 선택된다:
- 서열번호 2 (작제물 S);
- 서열번호 4 (작제물 stab-S, 작제물 S2P라고도 함);
- 서열번호 42 (작제물 S3F),
- 서열번호 44 (작제물 S2P3F),
- 서열번호 46 (작제물 S2PΔF), 및
- 서열번호 48 (작제물 S2PΔF2A).
더 바람직한 구현예에서, 전달 벡터는 플라스미드, 특히 재조합 DNA MV-CoV 서열과 재조합된 상기 플라스미드 중 하나이며, 여기서 SARS-CoV-2의 폴리펩티드를 암호화하는 서열은 서열번호 48(작제물 S2PΔF2A)이다. eGFP를 암호화하는 서열이 플라스미드에 존재하는 경우, 이는 ATU에 삽입된 상기 정의된 군에서 선택된 서열로 유리하게 치환된다.
특정 구현예에서, 전달 벡터는 하기 중에서 선택된 플라스미드로부터 유래된것이다:
- 2020년 2월 12일에 기탁번호 CNCM I-5493로 기탁된 pKP-MVSchwarz(또는 pKM-Schwarz),
- 2020년 2월 12일에 기탁번호 CNCM I-5494로 기탁된 pKM-ATU2(eGFP),
- 2020년 2월 12일에 기탁번호 CNCM I-5495로 기탁된 pKM-ATU3(eGFP). 특히, 플라스미드는 서열번호 1, 2 또는 36, 바람직하게는 서열번호 2, 또는 특히 eGFP 코딩 서열을 대체하기 위해 ATU, 바람직하게는 ATU3에 삽입된 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 42, 44, 46, 48, 21 또는 37, 특히 서열번호 4, 42, 44, 46, 48, 바람직하게는 서열번호 44, 46 또는 48, 바람직하게는 서열번호 46 또는 서열번호 48, 훨씬 더 바람직하게는 서열번호 48의 서열을 갖는 폴리뉴클레오티드 중에서 선택된 폴리뉴클레오티드를 포함하는 플라스미드 중 하나이다.
또는, 하기로 이루어진 군으로부터 선택된 플라스미드로 중 하나이고:
- 2020년 2월 12일에 기탁번호 CNCM I-5496로 기탁된 pKM-ATU2-S_2019-nCoV (즉, SARS-CoV-2),
- 2020년 2월 12일에 기탁번호 CNCM I-5497로 기탁된 pKM-ATU3-S_2019-nCoV (즉, SARS-CoV-2),
- 2020년 7월 1일에 기탁번호 CNCM I-5532로 기탁된 pKM-ATU3-S2PΔF_2019-nCoV(즉, SARS-CoV-2),
- 2020년 7월 1일에 기탁번호 CNCM I-5534로 기탁된 pKM-ATU3-S2PΔF2A_2019-nCoV(즉, SARS-CoV-2),
- 2020년 7월 1일에 기탁번호 CNCM I-5534로 기탁된 pKM-ATU3-S2P3F_2019-nCoV(즉, SARS-CoV-2),
- 2020년 7월 1일에 기탁번호 CNCM I-5535로 기탁된 pKM-ATU3-S3F_2019-nCoV(즉, SARS-CoV-2), 및
- 2020년 7월 1일에 기탁번호 CNCM I-5536로 기탁된 pKM-ATU3-stab-S_2019-nCoV(즉, SARS-CoV-2)(pKM-ATU3-S2P_2019-nCoV(즉, SARS-CoV-2)라고도 함),
바람직하게는 pKM-ATU3-S2P3F_2019-nCoV(즉, SARS-CoV-2), pKM-ATU3-S2PΔF_2019-nCoV(즉, SARS-CoV-2) 및 pKM-ATU3-S2PΔF2A_2019-nCoV(즉, SARS-CoV-2)로 이루어진 군으로부터 선택되는 플라스미드이며, 더 바람직하게는 2020년 7월 1일에 기탁번호 CNCM I-5533으로 기탁된 플라스미드 pKM-ATU3-S2PΔF2A_2019-nCoV(즉, SARS-CoV-2)이다.
핵산 작제물의 바람직한 측면에 따르면, 본 발명은 본 발명에 따른 핵산 작제물, 특히 서열번호 29의 플라스미드(pTM2-MVSchw-gfp, pTM-MVSchw2-GFPbis 또는 pTM-MVSchwarz-ATU2로도 명명됨) 또는 서열번호 38의 플라스미드(pTM3-MVSchw-gfp, *?*F_2019-nCoV (pTM-MVSchw3-GFP로도 명명됨) 또는 pTM-MVSchwarz-ATU3)로 이루어진 전달 벡터를 포함하는 재조합 홍역 바이러스(MV)의 구출에 적합한 전달 벡터, 특히 플라스미드 벡터에 관한 것이고, 여기서의 전달 벡터는 SARS-CoV-2의 SF-2P-dER 폴리펩티드 또는 SF-2P-2a 폴리펩티드를 암호화하거나, ATU2 또는 ATU3, 바람직하게는 ATU2 내에 위치한 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역 단편으로 구성되는 제1 이종 DNA 폴리뉴클레오티드와 재조합된다.
특정 구현예에서, 전달 벡터는 플라스미드, 특히 재조합 DNA MV-CoV 서열과 재조합된 상기 플라스미드 중 하나이며, 여기서 SARS-CoV-2의 폴리펩티드를 암호화하는 서열은 하기로 이루어진 군으로부터 선택된다:
- 서열번호 1 또는 2 또는 36 (작제물 S);
- 서열번호 4 (작제물 stab-S, 작제물 S2P로도 명명됨);
- 서열번호 6 (작제물 Secto);
- 서열번호 8 (작제물 stab-Secto);
- 서열번호 10 (작제물 S1),
- 서열번호 12 (작제물 S2),
- 서열번호 14 (작제물 stab-S2),
- 서열번호 16 (작제물 tri-Secto),
- 서열번호 18 (작제물 tristab-Secto), 및
- 서열번호 21 또는 37 (작제물 N).
바람직한 구현예에서, 전달 벡터는 플라스미드, 특히 재조합 DNA MV-CoV 서열과 재조합된 상기 플라스미드 중 하나이며, 여기서 SARS-CoV-2의 폴리펩티드를 암호화하는 서열은 하기로 이루어진 군으로부터 선택된다:
- 서열번호 2 (작제물 S); 및
- 서열번호 4 (작제물 stab-S, 작제물 S2P로도 명명됨).
더 바람직한 구현예에서, 전달 벡터는 MV-CoV의 재조합 DNA와 재조합된 플라스미드이며, 여기서 SF-2P-dER 폴리펩티드를 암호화하는 서열은 서열번호 75이고 SF-2P-2a 폴리펩티드를 암호화하는 서열은 서열번호 81이며, 바람직하게는 SARS-CoV-2의 SF-2P-dER 폴리펩티드를 암호화하는 서열은 서열번호 75이다. eGFP를 암호화하는 서열이 플라스미드에 존재하는 경우, 이는 유리하게는 ATU에 삽입된 상기 정의된 군에서 선택된 서열로 치환된다.
특정 구현예에서, 전달 벡터는 하기 중에서 선택된 플라스미드로부터 유래된것이다:
- 2020년 2월 12일에 기탁번호 CNCM I-5493로 기탁된 pKP-MVSchwarz(또는 pKM-Schwarz),
- 2020년 2월 12일에 기탁번호 CNCM I-5494로 기탁된 pKM-ATU2(eGFP),
- 2020년 2월 12일에 기탁번호 CNCM I-5495로 기탁된 pKM-ATU3(eGFP), 특히 플라스미드는 서열번호 1, 2 또는 36, 바람직하게는 서열번호 2, 또는 특히 eGFP 코딩 서열을 대체하기 위해 ATU, 바람직하게는 ATU3에 삽입된 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 21 또는 37, 특히 서열번호 4의 서열을 갖는 폴리뉴클레오티드 중에서 선택된 폴리뉴클레오티드를 포함하는 플라스미드 중 하나이다.
또는, 하기로 이루어진 군으로부터 선택된 플라스미드로 중 하나이다:
- 2020년 2월 12일에 기탁번호 CNCM I-5496로 기탁된 pKM-ATU2-S_2019-nCoV (즉, SARS-CoV-2),
- 2020년 2월 12일에 기탁번호 CNCM I-5497로 기탁된 pKM-ATU3-S_2019-nCoV (즉, SARS-CoV-2), 및
- 2020년 7월 1일에 기탁번호 CNCM I-5536로 기탁된 pKM-ATU3-stab-S_2019-nCoV(즉, SARS-CoV-2)(pKM-ATU3-S2P_2019-nCoV(즉, SARS-CoV-2)라고도 함).
다른 특정 구현예에서, 전달 벡터는 서열번호 144의 pTM2-SF-dER_SARS-CoV-2, 서열번호 145의 pTM2-S2-dER_SARS-CoV-2, 서열번호 146의 pTM2-SF-2P-dER_SARS-CoV-2, 서열번호 147의 pTM2-S2-2P-dER_SARS-CoV-2 및 서열번호 148의 pTM2-SF-2P-2a_SARS-CoV-2로 이루어진 군으로부터 선택되는 플라스미드 중 하나이고, 바람직하게는 서열번호 146의 pTM2-SF-2P-dER_SARS-CoV-2 또는 서열번호 148의 pTM2-SF-2P-2a_SARS-CoV-2, 더 바람직하게는 서열번호 146의 pTM2-SF-2P-dER_SARS-CoV-2 인 플라스미드 중 하나이다.
본 발명은 또한 바이러스 MV-CoV 입자의 구출에 적합한 세포를 형질전환, 특히 플라스미드 또는 본 발명의 핵산 작제물을 보유하는 바이러스 벡터로 이러한 세포를 각각 형질감염시키거나 형질도입하기 위한 상기 전달 벡터의 용도에 관한 것이고, 상기 세포는 재조합 감염 복제 MV-CoV 입자에서 본 발명의 핵산 작제물에 상응하는 바이러스의 재조합 게놈의 적절한 복제, 전사 및 캡슐화에 필요한 MV 단백질을 발현하는 그의 능력에 대해 선택된다.
바람직한 구현예에서, 본 발명은 본 발명에 따른 핵산 작제물 또는 본 발명에 따른 전달 플라스미드 벡터로 형질감염되거나, 본 발명에 따른 재조합 홍역 바이러스로 감염된 헬퍼 세포, 증폭 세포 또는 생산 세포, 특히 포유동물 세포, VERO NK 세포, CEF 세포, 인간 배아 신장 세포주 293 또는 이로부터 유래된 세포주(CNCM(프랑스 파리)에 2006년 6월 14일에 기탁번호 I-3618로 기탁된 293T 또는 293T-T7 세포) 또는 MRC5 세포인 세포에 관한 것이다.
따라서, 폴리뉴클레오티드가 세포에 존재하는데, 이는 재조합 바이러스 MV-CoV 입자의 전사 및 복제에서 기능하는 적어도 N 및 P 단백질에 대한 안정적으로 발현된 단백질 또는 일시적으로 발현된 단백질로서, 특히 MV의 N, P 및 L 단백질(즉, 레플리콘으로서 리보핵단백질(RNP) 복합체를 형성할 수 있는 천연 MV 단백질 또는 이의 기능적 변이체)를 포함하는 단백질을 암호화한다, N 및 P 단백질은 코딩 서열을 포함하는 플라스미드로부터 세포에서 발현될 수 있거나 세포의 게놈에 삽입된 DNA 분자로부터 발현될 수 있다. L 단백질은 다른 플라스미드에서 발현될 수 있다. 이는 일시적으로 표현될 수 있다. 헬퍼 세포는 또한 가능하게는 안정적으로 발현된 RNA 폴리머라제로서, 본 발명의 핵산 작제물로부터 유래된 재조합 RNA의 합성을 가능하게 하는데 적합한 RNA 폴리머라제를 발현할 수 있다. RNA 폴리머라제는 T7 파지 폴리머라제 또는 이의 핵 형태(nlsT7)일 수 있다.
본 발명의 한 구현예에서, MV의 cDNA 클론은 N 단백질 및/또는 P 단백질 및/또는 L 단백질과 동일한 MV 균주로부터 유래한다. 본 발명의 또 다른 구현예에서, MV의 cDNA 클론은 N 단백질 및/또는 P 단백질 및/또는 L 단백질과 상이한 바이러스 균주로부터 유래한다.
본 발명은 또한 하기를 포함하는 재조합 감염성 홍역 바이러스(MV) 입자의 제조 방법에 관한 것이다:
1) 바이러스 입자 조립을 가능하게 하는 조건에서 그의 cDNA로부터 MV의 안티게놈 (+)RNA 서열의 전사, 복제 및 캡슐화에 필요한 단백질을 또한 발현하는 헬퍼 세포주에 본 발명의 핵산 작제물 또는 이러한 핵산 작제물을 함유하는 전달 벡터를 전달, 특히 형질감염시키는 단계; 및
2) 코로나바이러스(CoV), 특히 SARS-CoV-2의 스파이크(S) 폴리펩티드로 구성되거나 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편으로 구성되는 적어도 하나의 폴리펩티드를 발현하는 재조합 감염성 MV-CoV 입자를 회수하는 단계.
본 발명의 특정 구현예에서, 이 방법은 다음을 포함한다:
1) RNA 폴리머라제를 발현하고 MV 바이러스의 N, P, L 단백질을 발현하기 위한 헬퍼 기능을 발현할 수 있는 헬퍼 세포를 본 발명에 따른 핵산 작제물 및 전달 벡터로 감염시키는 단계;
2) 단계 1)의 형질감염된 헬퍼 세포를 cDNA가 유래하는 MV 약독화된 균주의 계대에 적합한 계대된 세포와 공동 배양하는 단계;
3) 코로나바이러스(CoV), 특히 SARS-CoV-2의 스파이크(S) 폴리펩티드로 이루어지거나 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편으로 이루어진 적어도 하나의 폴리펩티드를 발현하는 재조합 감염성 MV-CoV 입자를 회수하는 단계.
본 발명의 또 다른 특정 구현예에서, 재조합 감염성 MV-CoV 입자의 생산 방법은 다음을 포함한다:
1) RNA 폴리머라제, MV의 N 단백질 및 MV의 P 단백질을 안정적으로 생산하는 세포 또는 세포 배양물을 본 발명의 핵산 작제물 및 MV의 L 단백질을 암호화하는 핵산을 포함하는 벡터와 재조합하는 단계, 및
2) 재조합 세포 또는 재조합 세포의 배양물로부터 재조합 감염성 MV-CoV 입자를 회수하는 단계.
방법의 특정 구현예에서, 코로나바이러스(CoV), 특히 SARS-CoV-2의 스파이크(S) 폴리펩티드로 구성되거나 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편으로 구성되는 적어도 하나의 폴리펩티드를 발현하는 재조합 MV, 특히 동일한 CoV 단백질(들)을 발현하는 CoV VLP가 생성된다.
따라서 본 발명은 구출(rescue) 헬퍼 세포 또는 생산 세포에서 회수될 수 있는 재조합 감염 복제 MV-CoV 입자에 관한 것이다. 선택적으로, 본 발명에 따라 개시된 CoV 항원을 발현하는 VLP는 추가로 회수될 수 있다.
특정 구현예에서, 코로나바이러스(CoV), 특히 SARS-CoV-2의 스파이크(S) 폴리펩티드로 구성되거나 본원에 개시된 다양한 구현예에 따른 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 그의 면역원성 단편으로 구성되는 적어도 하나의 폴리펩티드를 발현하는 재조합 MV가 생성된다.
특정 구현예에서, 재조합 MV 입자는 코로나바이러스(CoV), 특히 SARS-CoV-2의 N, E, M, ORF7a, ORF3a, ORF8 폴리펩티드로 구성되거나 본원에 개시된 다양한 구현예에 따른 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 그의 면역원성 단편으로 구성되는 적어도 하나의 폴리펩티드를 발현한다.
특정 구현예에서, 재조합 MV 입자는 코로나바이러스(CoV), 특히 SARS-CoV-2의 스파이크(S) 폴리펩티드로 구성되거나 본원에 개시된 다양한 구현예에 따른 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 그의 면역원성 단편으로 구성되는 적어도 하나의 폴리펩티드를 발현하고, 코로나바이러스(CoV), 특히 SARS-CoV-2의 N, E, M, ORF7a, ORF3a, ORF8 폴리펩티드로 구성되거나 본원에 개시된 다양한 구현예에 따른 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 그의 면역원성 단편으로 구성되는 적어도 하나의 폴리펩티드를 추가로 발현한다.
본 발명의 특정 구현예에서, 입자는 여기에 개시된 모든 구현예에 따른 Schwarz 균주, Zagreb 균주, AIK-C 균주, Moraten 균주, Philips 균주, Beckenham 4A 균주, Beckenham 16 균주, CAM-70 균주, TD 97 균주, Leningrad-16 균주, Shanghai 191 균주 및 Belgrade로 이루어진 군으로부터 선택되는 약독화 바이러스 균주, 특히 Schwarz 균주인 홍역 바이러스로부터 얻어진다.
특정 구현예에서, 재조합 홍역 바이러스, 특히 Schwarz 균주의 재조합 홍역 바이러스는 이의 게놈에서, 코로나바이러스, 특히 SARS-CoV-2의 스파이크 폴리펩티드, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편로 구성된 적어도 하나의 폴리펩티드, 또는 코로나바이러스(CoV), 특히 SARS-CoV-2의 N, E, M, ORF7a, ORF3a, ORF8 폴리펩티드로 구성되거나 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편으로 구성된 하나의 폴리펩티드를 암호화하는 핵산 작제물을 포함하고, 특히 이의 게놈에서, 본 발명의 뉴클레오티드 작제물의 전사체, 특히 본 발명의 전달 벡터의 레플리콘인 상기 정의된 바와 같은 핵산 작제물을 포함하고, 상기 핵산 작제물은 발현 카세트에서 게놈과 작동 가능하게 연결된다. 바람직한 구현예에서, 재조합 홍역 바이러스, 특히 Schwarz 균주의 재조합 홍역 바이러스는 이의 게놈에서, 본 발명에 따른 핵산 작제물, SF-2P-dER 폴리펩티드 또는 SARS-CoV-2의 SF-2P-2a 폴리펩티드, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편, 특히 서열번호 75 또는 서열번호 81, 바람직하게는 서열번호 75의 뉴클레오티드 서열에 의해 암호화된 폴리펩티드를 암호화하는 핵산 작제물, 특히 본 발명의 전달 벡터의 레플리콘인 핵산 작제물을 포함하고, 상기 핵산 작제물은 발현 카세트에서 게놈과 작동 가능하게 연결된다. 보다 바람직한 구현예에서, 재조합 홍역 바이러스, 특히 Schwarz 균주의 재조합 홍역 바이러스는 SARS-CoV-2 균주의 SF-2P-dER 폴리펩티드 또는 SF-2P-2a 폴리펩티드, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편을 발현하고, SARS-CoV-2 균주의 N 폴리펩티드, M 폴리펩티드, E 폴리펩티드, ORF7a, ORF8 또는 ORF3a 폴리펩티드 중 적어도 하나, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편을 선택적으로 추가로 발현한다.
보다 바람직한 구현예에서, 재조합 홍역 바이러스는 SARS-CoV-2 균주의 N 폴리펩티드, M 폴리펩티드, E 폴리펩티드, ORF7a, ORF8 또는 ORF3a 폴리펩티드 중 적어도 하나를 추가로 발현하고, 특히 서열번호 22의 N 폴리펩티드, 또는 1, 2 또는 10개 미만의 아미노산 잔기(들), 특히 5개 미만의 아미노산 잔기의 치환에 의한 N 폴리펩티드의 면역원성 단편 또는 이의 항원성 단편, 또는 돌연변이된 항원, 및/또는 서열번호 24의 M 폴리펩티드 또는 이의 엔도도메인, 서열번호 23의 E 폴리펩티드, 서열번호 25의 ORF8 폴리펩티드, 서열번 27의 ORF7a 폴리펩티드, 및/또는 SARS-CoV-2의 서열번호 26의 ORF3a 폴리펩티드, 또는 1, 2, 3 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편을 추가로 발현한다.
특정 구현예에서, 코로나바이러스, 특히 SARS-CoV-2의 폴리펩티드를 암호화하는 핵산 분자의 뉴클레오티드 서열은 서열번호 1, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 21, 36, 37, 42, 44, 46 및 48으로 이루어진 군으로부터 선택된다.
본 발명의 특정 구현예에서, 코로나바이러스, 특히 SARS-CoV-2의 폴리펩티드를 암호화하는 핵산 분자의 뉴클레오티드 서열은 서열번호 1, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 21, 36 및 37로 이루어진 군으로부터 선택된다.
본 발명의 바람직한 구현예에서, 핵산 분자는 서열번호 75(작제물 SF-2P-dER) 또는 서열번호 81(작제물 SF-2P-2a)의 폴리뉴클레오티드, 바람직하게는 서열번호 75의 폴리뉴클레오티드(작제물 SF-2P-dER)를 포함한다.
바람직한 구현예에서, 코로나바이러스, 특히 SARS-CoV-2의 폴리펩티드를 암호화하는 핵산 분자의 뉴클레오티드 서열은 서열번호 2, 4, 42, 44, 46 및 48으로 이루어진 군으로부터 선택되며, 바람직하게는 서열번호 2, 4, 42로 이루어진 군, 또는 서열번호 44, 46 및 48으로 이루어진 군으로부터 선택되며, 더 바람직하게는 서열번호 44, 46 및 48으로 이루어진 군으로부터 선택된다.
바람직한 구현예에서, 코로나바이러스, 특히 SARS-CoV-2의 폴리펩티드를 암호화하는 핵산 분자의 뉴클레오티드 서열은 서열번호 2 또는 4이다.
더 바람직한 구현예에서, 코로나바이러스, 특히 SARS-CoV-2의 폴리펩티드를 암호화하는 핵산 분자의 뉴클레오티드 서열은 서열번호 46 또는 서열번호 48이며, 바람직하게는 서열번호 48이다.
본 발명은 또한 (i) 코로나바이러스(CoV), 특히 SARS-CoV-2의 ORF7a, ORF3a, ORF8 폴리펩티드로 구성되거나 본원에 기재된 다양한 구현예에 따른 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편으로 구성되는 적어도 하나의 폴리펩티드, 또는 (ii) 코로나바이러스, 특히 SARS-CoV-2의 스파이크(S) 폴리펩티드로 구성되거나 본원에 기재된 다양한 구현예에 따른 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 그의 면역원성 단편으로 구성되는 폴리펩티드를 발현하는 재조합 홍역 바이러스를 구출하는 방법으로서,
(a) T7 RNA 폴리머라제 및 홍역 바이러스 N 및 P 단백질을 안정적으로 발현하는 세포, 특히 헬퍼 세포, 특히 HEK293 헬퍼 세포를 (i) 본 발명에 따른 핵산 작제물 또는 적어도 하나의 폴리펩티드를 암호화하는 본 발명에 따른 전달 플라스미드 벡터 및 (ii) MV L 폴리머라제를 암호화하는 벡터, 특히 플라스미드로 공동-형질감염시키는 단계;
(b) 재조합 홍역 바이러스의 생산에 적합한 조건에서 상기 형질감염된 세포를 유지하는 단계;
(c) 단계 (b)의 형질감염된 세포, 특히 VERO 세포와 공동 배양함으로써 재조합 홍역 바이러스의 증식을 가능하게 하는 세포를 감염시키는 단계;
(d) 코로나바이러스, 특히 SARS-CoV-2의 폴리펩티드, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편을 적어도 발현하는 재조합 홍역 바이러스를 회수하는 단계를 포함하는 방법에 관한 것이다.
본 발명의 바람직한 구현예에 따르면, 상기 정의된 SARS-CoV-2의 제1 이종 폴리뉴클레오티드에 의해 암호화된 SARS-CoV-2의 폴리펩티드를 발현하는 재조합 홍역 바이러스를 구출하는 방법은 다음을 포함한다:
(a) T7 RNA 폴리머라제 및 홍역 바이러스 N 및 P 단백질을 안정적으로 발현하는 세포, 특히 헬퍼 세포, 특히 HEK293 헬퍼 세포를 (i) 본 발명의 핵산 작제물 또는 본 발명의 전달 플라스미드 벡터 및 (ii) MV L 폴리머라제를 암호화하는 벡터, 특히 플라스미드로 공동-형질감염시키는 단계;
(b) 재조합 홍역 바이러스의 생산에 적합한 조건에서 상기 형질감염된 세포를 유지하는 단계;
(c) 단계 (b)의 형질감염된 세포, 특히 VERO 세포와 공동 배양함으로써 재조합 홍역 바이러스의 증식을 가능하게 하는 세포를 감염시키는 단계;
(d) 상기 정의된 바와 같은 SARS-CoV-2의 제1 이종 폴리뉴클레오티드에 의해 암호화되는 SARS-CoV-2의 폴리펩티드 및 선택적으로 N, M 또는 3A 폴리펩티드 중 적어도 하나, 또는 SARS-CoV-2의 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편 또는 이의 돌연변이된 항원을 발현하는 재조합 홍역 바이러스를 회수하는 단계.
이 방법의 바람직한 구현예에 따르면, 재조합 홍역 바이러스는 상기 정의된 바와 같은 돌연변이된 폴리펩티드를 발현하고, 여기서 돌연변이는 소포체(ER)에서 폴리펩티드의 검색을 적어도 손상시키고, 선택적으로 발현된 단백질, 특히 서열번호 76의 SF-2P-dER 폴리펩티드, 또는 특히 서열번호 82의 SF-2P-2a 폴리펩티드를 이의 융합전 상태로 유지한다.
방법의 특정 구현예에 따르면, 전달 벡터 플라스미드는 서열번호 34, 서열번호 35의 서열을 갖거나, CNCM에 기탁되고 본원에서 번호 I-5496, I-5497 및 I-5536으로 개시된 벡터 중 하나이다.
방법의 특정 구현예에 따르면, 전달 벡터 플라스미드는 서열번호 34, 서열번호 35의 서열을 갖거나, CNCM에 기탁되고 본원에서 번호 I-5496, I-5497, I-5532, I-5533, I-5534, I-5535 및 I-5536으로 개시된 벡터 중 하나이다.
상기 방법의 또 다른 특정 구현예에 따르면, 전달 벡터 플라스미드는 서열번호 146 또는 서열번호 148, 바람직하게는 서열번호 146의 서열을 갖는다.
특정 구현예에 따르면, 재조합은 본 발명의 핵산 작제물인 제1 폴리뉴클레오티드를 사용하여 얻어질 수 있다. 재조합은 또한 또는 대안적으로 MV의 RNA 폴리머라제 대형 단백질(L)을 암호화하는 벡터인 폴리뉴클레오티드의 도입을 포함할 수 있으며, 그의 정의, 발현의 성질 및 안정성은 본원에 기술되어 있다.
본 발명에 따르면, RNA 폴리머라제, 홍역 바이러스의 핵단백질(N) 및 홍역 바이러스의 폴리머라제 보조인자 인단백질(P)을 안정적으로 생산하는 세포 또는 세포주 또는 세포의 배양물은 본 명세서에서 정의된 세포 또는 세포주 또는 본 명세서에서 정의된 세포의 배양물이다. 즉, 상기 정의된 바와 같은 하나 이상의 폴리뉴클레오티드의 도입에 의해 변형된 정도로 재조합 세포이다. 본 발명의 특정 구현예에서, RNA 폴리머라제, N 및 P 단백질을 안정적으로 생산하는 세포 또는 세포주 또는 세포의 배양물은 홍역 바이러스의 L 단백질을 생산하지 않거나, 예를 들어, 그의 일시적인 발현 또는 생산을 가능하게 하는 홍역 바이러스의 L 단백질을 안정적으로 생산하지 않는다.
본 발명의 재조합 감염성 복제 MV-CoV 입자의 생산은 본원에 기재된 바와 같이 형질전환된 세포의 전달을 수반할 수 있다. 이 단계는 본 발명의 재조합 세포와 본 발명의 핵산 작제물, 및 선택적으로 홍역 바이러스의 RNA 폴리머라제 대형 단백질(L)을 암호화하는 핵산을 포함하는 벡터를 추가로 재조합한 후에 도입된다.
본 발명의 특정 구현예에서, 쉽게 재조합되는 능력을 위해 일반적으로 선택된 재조합 세포가 재조합 감염성 MV-CoV 입자의 유지 및 생산에 충분히 효율적이지 않기 때문에 전달 단계가 필요하다. 구현예에서, 상기 정의된 방법의 단계 1)의 세포 또는 세포주 또는 세포의 배양물은 본 발명에 따른 재조합 세포 또는 세포주 또는 재조합 세포의 배양물이다.
본 발명의 재조합 세포의 제조에 적합한 세포는 원핵 또는 진핵 세포, 특히 동물 또는 식물 세포, 보다 특히 포유동물 세포, 예컨대 인간 세포 또는 비인간 포유동물 세포 또는 조류 세포 또는 효모 세포이다. 특정 구현예에서, 세포는 이의 게놈의 재조합 전에 1차 배양물 또는 세포주로부터 분리된다. 본 발명의 세포는 분열 세포 또는 비분열 세포일 수 있다.
바람직한 구현예에 따르면, 헬퍼 세포는 인간 배아 신장 세포주 293으로부터 유래되며, 이 세포주 293은 기탁번호 CRL-1573으로 ATCC에 기탁되어 있다. 특정 세포주 293은 국제 출원 WO2008/078198에 개시된 세포주(즉, 2006년 6월 14일에 CNCM(프랑스 파리)에 기탁번호 번호 I-3618로 기탁된 HEK-293-T7-NP 또는 HEK-293T-NP MV 세포주)이고 및 다음 실시예에서 언급되어 있다.
이 방법의 또 다른 측면에 따르면, 계대에 적합한 세포는 CEF 세포이다. CEF 세포는 EARL Morizeau사(주소: 프랑스 28190 Dangers, 8 rue Moulin) 또는 임의의 다른 수정 달걀 생산자로부터 얻은 수정 달걀으로부터 준비할 수 있다.
본 발명에 따라 개시된 방법은 면역원성 조성물에 사용될 수 있는 감염성 복제 MV-CoV 입자의 생산에 유리하게 사용된다. 선택적으로, CoV 항원을 발현하는 VLP는 또한 발현되고 면역화 조성물에 사용하기에 적절할 수 있다. 따라서, 본 발명은 동물 숙주, 특히 포유동물 숙주, 특히 인간에서 체액성, 특히 보호성, 특히 중화 체액성 반응 및/또는 세포성 반응을 유도하는데 사용하기 위한 본 발명의 재조합 MV-CoV 입자에 관한 것이다. 재조합 MV-CoV 입자는 특히 코로나바이러스, 특히 SARS-CoV-2에 의한 감염에 대한 예방적 반응을 유도하는데 사용하기 위한 것이다.
따라서 본 발명은 면역원성 조성물, 유리하게는 (i) 본 발명에 따른 재조합 홍역 바이러스 및/또는 본 발명에 따른 재조합 VLP의 유효량 및 (ii) 약학적으로 허용되는 비히클을 포함하는 백신 조성물에 관한 것이고, 여기서의 조성물 또는 백신은 그것이 발현되는 코로나바이러스, 특히 SARS-CoV-2의 폴리펩티드(들) 또는 이의 단편에 대하여 특히 단일 면역화 후 동물 숙주, 특히 인간에서 체액성, 특히 보호성, 특히 중화 체액성 반응 및/또는 세포성 반응을 유도한다.
본 발명의 특정 구현예에서, 조성물은 이를 필요로 하는 숙주, 특히 인간 숙주, 특히 어린이에서 코로나바이러스 단백질(들) 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 항원 단편(들) 또는 이의 돌연변이된 항원(들)을 인식하는 항체의 유도, 및/또는 코로나바이러스에 대한 세포 및/또는 체액 및 세포 반응의 유도에 의하여 SARS-CoV-2 또는 SARS-CoV-2 및 추가로 구별되는 코로나바이러스(들)에 대한 보호적이고 우선적으로 예방적인 면역 반응을 유도하는데 사용된다. 바람직하게는, 조성물은 첨가된 보조제가 없다.
또한, 본 발명은 이를 필요로 하는 숙주, 특히 인간 숙주, 특히 어린이에서 CoV, 특히 SARS-CoV-2에 의한 감염의 예방 또는 치료 또는 CoV에 의한 감염의 임상 결과의 예방에 사용하기 위한 것으로, (i) 본 발명에 따른 재조합 홍역 바이러스 및/또는 본 발명에 따른 재조합 VLP의 유효 용량 및 (ii) 약학적으로 허용되는 비히클을 포함하는 면역원성 또는 백신 조성물에 관한 것이다. 특정 구현예에서, 조성물은 어린이, 청소년 또는 여행자에게 투여하기 위한 것이다.
치료 방법
본원에서는 코로나바이러스 감염, 특히 인간 및/또는 다른 포유동물에서 SARS-CoV-2 바이러스 감염의 예방 및/또는 치료를 위한 조성물(예를 들어, 약학 조성물), 방법, 키트 및 시약을 제공한다. 본 개시의 홍역 바이러스는 면역 반응을 유도하기 위해 또는 백신을 비롯한 치료제 또는 예방제로서 사용될 수 있다. 이들은 감염성 질병을 예방 및/또는 치료하기 위해 의학에서 사용될 수 있다. 예시적인 측면에서, 본 개시의 재조합 홍역 바이러스 백신은 코로나바이러스, 특히 SARS-CoV-2 바이러스로부터 예방적 보호를 제공하기 위해 사용된다. SARS-CoV-2 바이러스로부터의 예방적 보호는 본 개시의 재조합 홍역 바이러스 및/또는 면역원성 조성물의 투여 후에 달성될 수 있다. 백신은 1회, 2회, 3회, 4회 또는 그 이상 투여할 수 있다. 덜 바람직하지만 치료 반응을 달성하기 위해 감염된 개체에게 백신을 투여하는 것이 가능하다. 투여량은 특정 구현예에서 그에 따라 조정될 수 있다.
몇몇 구현예에서, 본 개시의 재조합 홍역 바이러스 및 면역원성 조성물은 대상체에서 코로나바이러스 감염, 특히 SARS-CoV-2 감염을 예방하는 방법으로서 사용될 수 있고, 방법은 대상체에게 본원에 제공된 적어도 하나의 재조합 홍역 바이러스 또는 면역원성 조성물을 투여하는 것을 포함한다. 몇몇 구현예에서, 본 개시의 재조합 홍역 바이러스 또는 면역원성 조성물은 대상체에서 코로나바이러스 감염, 특히 SARS-CoV-2 감염을 치료하는 방법으로서 사용될 수 있고, 방법은 본원에 제공된 바와 같은 적어도 하나의 재조합 홍역 바이러스 또는 면역원성 조성물을 대상체에게 투여하는 것을 포함한다. 몇몇 구현예에서, 본 개시의 재조합 홍역 바이러스 또는 면역원성 조성물은 대상체에서 코로나바이러스 감염, 특히 SARS-CoV-2 감염의 발병률을 감소시키는 방법으로서 사용될 수 있고, 방법은 본원에 제공된 바와 같은 적어도 하나의 재조합 홍역 바이러스 또는 면역원성 조성물을 대상체에게 투여하는 것을 포함한다. 몇몇 구현예에서, 본 개시의 재조합 홍역 바이러스 또는 면역원성 조성물은 코로나바이러스에 감염된 제1 대상체로부터 코로나바이러스, 특히 SARS-CoV-2에 감염되지 않은 제2 대상체로의 코로나바이러스, 특히 SARS-CoV-2의 확산을 억제하는 방법으로 사용될 수 있고, 방법은 본원에 제공된 바와 같은 적어도 하나의 재조합 홍역 바이러스 또는 면역원성 조성물을 제1 대상체 및 상기 제2 대상체 중 적어도 하나에게 투여하는 것을 포함한다.
코로나바이러스, 특히 SARS-CoV-2에 대한 대상체에서 면역 반응을 유도하는 방법이 본 발명의 측면에서 제공된다. 방법은 대상체에게 본원에 기재된 재조합 홍역 바이러스 또는 면역원성 조성물을 투여함으로써 대상체에서 코로나바이러스 항원성 폴리펩티드 또는 이의 면역원성 단편, 특히 전장 SARS-CoV-2 항원성 폴리펩티드에 대한 특이적인 면역 반응을 유도하는 것을 포함한다.
몇몇 구현예에서, 전장 S 단백질 또는 면역원성 단편 또는 항원성 단편의 돌연변이 항원은, (a) 서열번호 52의 TA-S2P3F 폴리펩티드, 또는 서열번호 52와 90% 이상의 동일성을 가지는 이의 변이체로서 위치 682, 683, 685, 986 및 987에서 변화하지 않은 변이체; 또는 (b) 서열번호 54의 S6P 폴리펩티드, 또는 서열번호 54와 90% 이상의 동일성을 가지는 이의 변이체로서 위치 817, 892, 899, 942, 986 및 987에서 변화하지 않은 변이체; 또는 (c) 서열번호 56의 S6P3F 폴리펩티드, 또는 서열번호 56과 90% 이상의 동일성을 가지는 이의 변이체로서 위치 682, 683, 685, 817, 892, 899, 942, 986 및 987에서 변화하지 않은 변이체; 또는 (d) 서열번호 58의 S6PΔF 폴리펩티드, 또는 서열번호 58과 90% 이상의 동일성을 가지는 이의 변이체로서 위치 806, 881, 888, 931, 975 및 976에서 변화하지 않은 변이체; 또는 (e) 서열번호 60의 SCCPP 폴리펩티드, 또는 서열번호 60과 90% 이상의 동일성을 가지는 이의 변이체로서 위치 383, 985, 986 및 987에서 변화하지 않은 변이체; 또는 (f) 서열번호 62의 SCC6P 폴리펩티드, 또는 서열번호 62과 90% 이상의 동일성을 가지는 이의 변이체로서 위치 383, 817, 892, 899, 942, 985, 986 및 987에서 변화하지 않은 변이체; 또는 (g) 서열번호 5의 SMVopt2P 폴리펩티드, 또는 서열번호 5과 90% 이상의 동일성을 가지는 이의 변이체로서 위치 986 및 987에서 변화하지 않은 변이체; 또는 (h) 서열번호 65의 SMVoptΔF 폴리펩티드, 또는 서열번호 65과 90% 이상의 동일성을 가지는 이의 변이체; 또는 (i) 서열번호 47의 SMVopt2PΔF 폴리펩티드, 또는 서열번호 47과 90% 이상의 동일성을 가지는 이의 변이체로서 위치 975 및 976에서 변화하지 않은 변이체; 또는 (j) SMVopt6P 폴리펩티드, 또는 MVopt6P 폴리펩티드와 90% 이상의 동일성을 가지는 이의 변이체로서 위치 817, 892, 899, 942, 986 및 987에서 변화하지 않은 변이체; 또는 (k) SMVopt6PΔF 폴리펩티드, 또는 MVopt6PΔF 폴리펩티드와 90% 이상의 동일성을 가지는 이의 변이체로서 위치 806, 881, 888, 931, 975 및 976에서 변화하지 않은 변이체; 또는 (l) SMVopt6P3F 폴리펩티드, 또는 SMVopt6P3F 폴리펩티드와 90% 이상의 동일성을 가지는 이의 변이체로서 위치 682, 683, 685, 817, 892, 899, 942, 986 및 987에서 변화하지 않은 변이체;이다. 몇몇 구현예에서, 돌연변이 항원은, (a) 서열번호 52의 TA-S2P3F 폴리펩티드, 또는 (b) 서열번호 54의 S6P 폴리펩티드, 또는 (c) 서열번호 56의 S6P3F 폴리펩티드, 또는 (d) 서열번호 58의 S6PΔF 폴리펩티드, 또는 (e) 서열번호 60의 SCCPP 폴리펩티드, 또는 (f) 서열번호 62의 SCC6P 폴리펩티드, 또는 (g) 서열번호 5의 SMVopt2P 폴리펩티드, 또는 (h) 서열번호 65의 SMVoptΔF 폴리펩티드, 또는 (i) 서열번호 47의 SMVopt2PΔF 폴리펩티드이다.
몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드는 SARS-CoV-2의 이중 도메인 S 단백질이다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 서열의 위치 1263 내지 1273과 정렬된 S 단백질의 11개 아미노산 잔기 서열에서 삽입, 치환 또는 결실을 포함하고, 여기서의 삽입, 치환 또는 결실은 이중 도메인 S 단백질의 세포 표면 발현을 증가시킨다. 몇몇 구현예에서, 이중 도메인 S 단백질은 발현된 이중 도메인 S 단백질을 이의 융합전 형태로 유지하는 하나 이상의 추가 치환을 추가로 포함한다. 몇몇 구현예에서, 이중 도메인 S 단백질은 서열번호 3의 아미노산 돌연변이 K986P 및 V987P를 추가로 포함한다. 몇몇 구현예에서, 이중 도메인 단백질은: (a) 서열번호 76의 융합전-안정화된 SF-2P-dER 폴리펩티드, 또는 서열번호 76과 90% 이상의 동일성을 가지고 위치 986 및 987에서 변화한 이의 변이체; 또는 (b) 서열번호 82의 융합전-안정화된 SF-2P-2a 폴리펩티드, 또는 서열번호 82와 90% 이상의 동일성을 가지고 위치 986, 987, 1269, 및 1271에서 변화한 이의 변이체;를 암호화한다. 몇몇 구현예에서, 이중 도메인 S 단백질: (a) 서열번호 76의 융합전-안정화된 SF-2P-dER 폴리펩티드; 또는 (b) 서열번호 82의 융합전-안정화된 SF-2P-2a 폴리펩티드;를 암호화한다.
몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 서열의 위치 69 및 70의 아미노산 잔기의 결실을 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 서열의 위치 144 및 145의 아미노산 잔기의 결실을 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 돌연변이 N501Y을 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 돌연변이 A570D를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 돌연변이 P681H를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 돌연변이 T716I를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 돌연변이 S982A를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 돌연변이 D1118H를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 돌연변이 E484K를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 돌연변이 K417N을 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 돌연변이 K417T를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 돌연변이 D614G를 추가로 포함한다.
상기한 방법의 몇몇 구현예에서, 코로나바이러스 항원성 폴리펩티드 또는 이의 면역원성 단편은, 뉴클레오캡시드(N) 폴리펩티드 또는 N 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체; 기질(matrix) (M) 폴리펩티드 또는 M 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체; E 폴리펩티드 또는 E 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체; 8a 폴리펩티드 또는 8a 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체; 7a 폴리펩티드 또는 7a 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체; 3A 폴리펩티드 또는 3 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체로 이루어진 군으로부터 선택된 SARS-CoV-2의 적어도 하나의 폴리펩티드를 포함하거나 이로 이루어진다.
예방 및 치료 조성물
예방적 유효 용량은 임상적으로 허용되는 수준에서 바이러스 감염을 예방하는 치료적 유효량이다. 몇몇 구현예에서, 치료적 유효 용량은 백신에 대한 패키지 삽입물에 나열된 용량이다.
예를 들어, 인간 및 기타 포유동물에서 코로나바이러스 감염, 특히 SARS-CoV-2 감염의 예방, 치료 또는 진단을 위한 조성물(예를 들어, 약학적 조성물), 방법, 키트 및 시약이 본원에서 제공된다. 코로나바이러스 조성물은 예방제 또는 치료제로서 사용될 수 있다. 이들은 감염성 질병을 예방 및/또는 치료하기 위해 의학에서 사용될 수 있다. 몇몇 구현예에서, 본 개시의 조성물은 예를 들어 생체외에서 말초혈 단핵 세포(PBMC)를 활성화하기 위해 면역 이펙터 세포의 프라이밍에 사용되며, 이 세포는 이어서 대상체로 주입(재주입)된다. 몇몇 구현예에서, 본 개시에 따른 조성물은 코로나바이러스 감염, 특히 SARS-CoV-2의 치료에 사용될 수 있다.
면역원성 조성물은 건강한 개체에 대한 능동 면역화 계획의 일부로서 예방학적으로 또는 치료학적으로 투여될 수 있거나, 잠복기 동안 또는 증상 개시 후 활성 감염 동안 감염 초기에 투여될 수 있다. 몇몇 구현예에서, 세포, 조직 또는 대상체에 제공되는 본 개시의 면역원성 조성물의 양은 면역 예방에 효과적인 양일 수 있다.
본 개시의 면역원성 조성물은 다른 예방적 또는 치료적 화합물과 함께 투여될 수 있다. 비제한적 예로서, 예방적 또는 치료적 화합물은 애주번트 또는 부스터일 수 있다. 부스터(또는 부스터 백신)는 예방적 조성물의 조기 투여 후에 제공될 수 있다. 예방 조성물의 초기 투여와 부스터 사이의 투여 시간은 1분, 2분, 3 분, 4 분, 5 분, 6 분, 7 분, 8 분, 9 분, 10 분, 15 분, 20 분, 35 분, 40 분, 45 분, 50 분, 55 분, 1 시간, 2 시간, 3 시간, 4 시간, 5 시간, 6 시간, 7 시간, 8 시간, 9 시간, 10 시간, 11 시간, 12 시간, 13 시간, 14 시간, 15 시간, 16 시간, 17 시간, 18 시간, 19 시간, 20 시간, 21 시간, 22 시간, 23 시간, 1 일, 36 시간, 2 일, 3 일, 4 일, 5 일, 6 일, 1 주, 10 일, 2 주, 3 주, 1 개월, 2 개월, 3 개월, 4 개월, 5 개월, 6 개월, 7 개월, 8 개월, 9 개월, 10 개월, 11 개월, 1 년, 18 개월, 2 년, 3 년, 4 년, 5 년, 6 년, 7 년, 8 년, 9 년, 10 년, 11 년, 12 년, 13 년, 14 년, 15 년, 16 년, 17 년, 18 년, 19 년, 20 년, 25 년, 30 년, 35 년, 40 년, 45 년, 50 년, 55 년, 60 년, 65 년, 70 년, 75 년, 80 년, 85 년, 90 년, 95 년, 또는 99 년 이상일 수 있으나, 이에 제한되지 않는다. 몇몇 구현예에서, 예방 조성물의 초기 투여와 부스터 사이의 투여 시간은 1 주, 2 주, 3 주, 1 개월, 2 개월, 3 개월, 6 개월, 또는 1 년일 수 있으나, 이에 제한되지 않는다.
몇몇 구현예에서, 본 개시의 면역원성 조성물은 근육내 또는 피내 투여될 수 있다. 몇몇 구현예에서, 면역원성 조성물은 근육내 투여된다.
본 개시의 면역원성 조성물은 감염의 유병률 또는 충족되지 않은 의학적 요구의 정도 또는 수준에 따라 다양한 설정(setting)에서 이용될 수 있다. 백신은 훨씬 더 큰 항체 역가 및/또는 세포 면역 반응을 생성하고 상업적으로 이용 가능한 항바이러스제/조성물보다 더 빨리 반응을 생성한다는 점에서 우수한 특성을 가지고 있다.
본 개시의 재조합 홍역 바이러스 및/또는 본 개시의 재조합 VLP를 선택적으로 하나 이상의 약학적으로 허용되는 부형제와 조합하여 포함하는 약학적 조성물이 본원에서 제공된다. 면역원성 조성물은 투여에 적합한 비히클을 포함할 수 있다. 예를 들어, 숙주, 특히 인간 숙주에 대한 약학적으로 허용되는 비히클은 숙주에서 면역 반응을 향상시키기 위한 애주번트를 추가로 포함할 수 있지만 반드시 그런 것은 아니다. 본 발명의 조성물에 유용한 약제학적으로 허용되는 비히클은 물, 식염수, 덱스트로스, 글리세롤, 에탄올, 완충액 등, 및 이들의 조합과 같은, 사용되는 투여량 및 농도에서 환자에게 비독성인 임의의 상용성 제제를 포함한다. 비히클은 또한 안정화제, 가용화제, NaCl, MgCl2 또는 CaCl2 등과 같은 등장성 개질제, 계면활성제, 및 이들의 혼합물과 같은 추가 성분을 함유할 수 있다. 본 발명자들은 실제로 본 발명의 활성 성분의 투여가 외부 애주번트의 필요 없이 면역 반응을 유도할 수 있음을 확인하였다. 몇몇 구현예에서, 본원에 개시된 면역원성 조성물은 애주번트를 포함하지 않는다(애주번트가 없음).
이러한 백신 조성물은 벡터로부터 구출된(rescued) 재조합 감염성 복제 MV-CoV 입자를 포함하는 유리하게 유효 성분(활성 성분) 및 동일한 CoV 단백질을 포함하는 VLP와 선택적으로 회합된 본원에 정의된 바와 같은 작제물을 포함한다.
투여 계획 및 투여 요법은 위에서 언급한 CoV 단백질과 관련하여, 특히 동일한 CoV 단백질을 발현하는 CoV-VLP와 관련하여 본 발명에 따른 재조합 감염성 복제 MV-CoV 입자의 선택된 용량의 고유한 투여를 요구할 수 있다.
대안적으로 여러 번 투여해야 할 수도 있다.
특정 구현예에서 투여는 프라임-부스트 요법에 따라 수행된다. 프라이밍 및 부스팅은 상기 언급된 CoV 단백질, 특히 동일한 CoV 단백질을 발현하는 CoV-VLP와 관련된 재조합 감염 복제 MV-CoV 입자로 구성된 동일한 활성 성분으로 달성될 수 있다.
대안적으로 프라이밍 및 부스팅 투여는 적어도 하나의 투여 단계에서 상기 언급된 CoV 단백질, 특히 동일한 CoV 단백질을 발현하는 CoV-VLP, 및 다른 투여 단계에서, 동일한 CoV 단백질을 발현하는 상기 언급된 CoV 폴리펩티드 또는 CoV-VLP와 같은 CoV의 기타 활성 면역원과 함께 재조합 감염성 복제 MV-CoV 입자를 포함하는 상이한 활성 성분으로 달성될 수 있다.
동일한 CoV 단백질을 발현하는 CoV-VLP와 함께 본 발명에 따른 재조합 감염 복제 MV-CoV 입자의 투여는 면역 반응을 유도하고 다양한 CoV 균주에 대해 교차 반응성인 항체를 유도할 수 있다. 따라서, 본 발명에 따른 유효 성분의 투여는 CoV의 특정 균주의 코딩 서열로 제조될 때 CoV의 균주 그룹에 대한 면역 반응을 유도할 수 있다.
인간 MV 백신에 대한 현재 알려진 용량이 103 내지 105 TCID50 범위임을 고려하면, 투여될 재조합 MV-CoV의 적절한 용량은 0.1 내지 10ng, 특히 0.2 내지 6ng의 범위일 수 있고, 몇몇 구현예에서는 0.2 내지 2ng만큼 낮을 수 있다.
본 발명의 특정 구현예에 따르면, 본원에 정의된 면역원성 또는 백신 조성물은 또한 홍역 바이러스에 의한 감염에 대한 보호를 위해 사용될 수 있다.
본 발명은 또한 코로나바이러스 바이러스 관련 질병, 특히 SARS-CoV-2, 즉 COVID-19에 의한 감염과 관련된 질병을 예방하는 방법에 관한 것이고, 이 방법은 본 발명에 따른 재조합 홍역 바이러스의 주사, 특히 피하 주사에 의해 포유동물, 특히 인간, 특히 어린이를 면역화하는 것을 포함한다.
본 발명은 또한 코로나바이러스 바이러스 관련 질병, 특히 SARS-CoV-2, 즉 COVID-19에 의한 감염과 관련된 질병을 치료하는 방법에 관한 것이고, 이 방법은 본 발명에 따른 재조합 홍역 바이러스의 주사, 특히 피하 주사에 의해 포유동물, 특히 인간, 특히 어린이를 면역화하는 것을 포함한다.
백신 투여 방식
면역원성 조성물은 치료적으로 효과적인 결과를 초래하는 임의의 경로에 의해 투여될 수 있다. 여기에는 피내, 근육내, 비강내 및/또는 피하 투여가 포함되지만 이에 제한되지는 않는다. 본 개시는 면역원성 조성물을 이를 필요로 하는 대상체에게 투여하는 것을 포함하는 방법을 제공한다. 요구되는 정확한 양은 대상체의 종, 연령 및 일반적인 상태, 질병의 중증도, 특정 조성, 투여 방식, 활성 모드 등에 따라 대상체마다 다를 것이다. 면역원성 조성물은 투여의 용이성과 투여량의 균일성을 위해 일반적으로 투여 단위 형태로 제형화된다. 그러나, 백신 조성물의 총 일일 사용량은 건전한 의학적 판단의 범위 내에서 주치의 판단에 의해 결정될 수 있음을 이해할 것이다. 특정 환자에 대한 특정 치료 효과, 예방 효과 또는 적절한 이미징 용상 수준은 치료 중인 장애 및 장애의 중증도; 사용된 특정 화합물의 활성; 사용된 특정 조성; 환자의 연령, 체중, 일반적인 건강, 성별 및 식이; 사용된 특정 화합물의 투여 시간, 투여 경로 및 배설 속도; 치료 기간; 사용된 특정 화합물과 함께 또는 동시에 사용되는 약물; 및 의학 분야에서 잘 알려진 유사한 요인을 포함한 다양한 요인에 따라 달라진다.
본원에 기재된 면역원성 조성물은 본원에 기재된 투여 형태, 예를 들어 비강내, 기관내, 또는 주사가능한(예를 들어, 정맥내, 안내, 유리체내, 근육내, 피내, 심장내, 복강내, 비강내 및 피하) 투여 형태로 제형화될 수 있다.
면역원성 제형 및 사용 방법
본 개시의 몇몇 측면은 면역원성 조성물의 제형를 제공하고, 여기서 백신은 대상체에서 항원 특이적 면역 반응(예를 들어, 코로나바이러스 항원성 폴리펩티드에 특이적인 항체의 생산)을 생성하기 위한 유효량으로 제형화된다. "유효량"은 항원-특이적 면역 반응을 생성하는데 효과적인 면역원성 조성물의 용량이다. 또한 대상체에서 항원-특이적 면역 반응을 유도하는 방법이 본원에서 제공된다.
몇몇 구현예에서, 항원-특이적 면역 반응은 본원에 제공된 바와 같은 면역원성 조성물이 투여된 대상체에서 생성된 항-항원 폴리펩티드 항체 역가를 측정하는 것을 특징으로 한다. 항체 역가는 대상체 내의 항체, 예를 들어 특정 항원(예를 들어, 돌연변이된 전장 S 단백질 또는 돌연변이된 이중 도메인 S 단백질) 또는 항원의 에피토프에 특이적인 항체의 양을 측정한 것이다. 항체 역가는 일반적으로 양성 결과를 제공하는 최대 희석의 역수로 표시된다. 효소 결합 면역흡착 분석법(ELISA)은 예를 들어 항체 역가를 결정하기 위한 일반적인 분석법이다.
몇몇 구현예에서, 항체 역가는 대상체가 감염되었는지 여부를 평가하거나 면역화가 필요한지 여부를 결정하는데 사용됩니다. 몇몇 구현예에서, 항체 역가는 자가면역 반응의 강도를 결정하고, 추가 면역화가 필요한지 여부를 결정하고, 이전 백신이 효과적인지 여부를 결정하고, 임의의 최근 또는 이전 감염을 확인하는데 사용된다. 본 개시에 따르면, 항체 역가는 면역원성 조성물에 의해 대상체에서 유도된 면역 반응의 강도를 측정하기 위해 사용될 수 있다.
또한, 본 발명은 SARS-CoV-2의 폴리펩티드를 암호화하고 천연 서열과 비고하여 변형된 핵산 분자에 관한 것이다. 특히, 본 발명은 하기 표 1에 개시된 바와 같은 서열의 폴리뉴클레오티드를 포함하거나 이로 구성되는 핵산 분자에 관한 것이다.
SARS-CoV-2의 스파이크 폴리펩티드
작제물 서열번호
nCoV의 S 폴리펩티드(즉, SARS-CoV-2) 서열번호 1 또는 서열번호 2
nCoV의 stab-S 폴리펩티드(즉, SARS-CoV-2)(nCoV의 S2P 폴리펩티드라고도 함(즉, SARS-CoV-2)) 서열번호 4
nCoV의 Secto 폴리펩티드(즉, SARS-CoV-2)) 서열번호 6
nCoV의 stab-Secto 폴리펩티드(즉, SARS-CoV-2) 서열번호 8
nCoV의 S1 폴리펩티드(즉, SARS-CoV-2) 서열번호 10
nCoV의 S2 폴리펩티드(즉, SARS-CoV-2) 서열번호 12
nCoV의 stab-S2 폴리펩티드(즉, SARS-CoV-2) 서열번호 14
nCoV의 tri-Secto 폴리펩티드(즉, SARS-CoV-2) 서열번호 16
nCoV의 nCoV의 tristab-Secto 폴리펩티드(즉, SARS-CoV-2) 서열번호 18
nCoV의 S3F 폴리펩티드(즉, SARS-CoV-2) 서열번호 42
nCoV의 S2P3F 폴리펩티드(즉, SARS-CoV-2) 서열번호 44
nCoV의 S2PΔF 폴리펩티드(즉, SARS-CoV-2) 서열번호 46
nCoV의 S2PΔF2A 폴리펩티드(즉, SARS-CoV-2) 서열번호 48
SARS-CoV-2의 T4-S2P3F 폴리펩티드(tristab-Secto-3F라고도 함) 서열번호 51
SARS-CoV-2의 S6P 폴리펩티드 서열번호 53
SARS-CoV-2의 S6P3F 폴리펩티드 서열번호 55
SARS-CoV-2의 S6PΔF 폴리펩티드 서열번호 57
SARS-CoV-2의 SCCPP 폴리펩티드 서열번호 59
SARS-CoV-2의 SCC6P 폴리펩티드 서열번호 61
SARS-CoV-2의 S MVopt 2P 폴리펩티드 서열번호 63
SARS-CoV-2의 S MVopt ΔF 폴리펩티드 서열번호 64
SARS-CoV-2의 S MVopt 2PΔF 폴리펩티드 서열번호 66
nCoV의 SF-dER(즉, SARS-CoV-2) 서열번호 73
nCoV의 SF-2P-dER(즉, SARS-CoV-2) 서열번호 75
nCoV의 S2-dER(즉, SARS-CoV-2) 서열번호 77
nCoV의 S2-2P-dER(즉, SARS-CoV-2) 서열번호 79
nCoV의 SF-2P-2a(즉, SARS-CoV-2) 서열번호 81
또한, 본 발명은 하기 표 2에 개시된 플라스미드에 관한 것이다.
SARS-CoV-2 스파이크 단백질을 암호화하는 홍역 바이러스 플라스미드
플라스미드 서열번호
pKP-MVSchw 서열번호 30
pKP-MVSchw-ATU1(eGFP) 서열번호 31
pKP-MVSchw-ATU2(eGFP) 서열번호 32
pKP-MVSchw-ATU3(eGFP) 서열번호 33
pKM-ATU2-S_2019-nCoV(즉, SARS-CoV-2)(최적화된 서열) 서열번호 34
pKM-ATU3-S_2019-nCoV(즉, SARS-CoV-2)(최적화된 서열) 서열번호 35
pTM2-SF-dER_SARS-CoV-2(최적화된 서열) 서열번호 144
pTM2-S2-dER_SARS-CoV-2(최적화된 서열) 서열번호 145
pTM2-SF-2P-dER_SARS-CoV-2(최적화된 서열) 서열번호 146
pTM2-S2-2P-dER_SARS-CoV-2(최적화된 서열) 서열번호 147
pTM2-SF-2P-2a_SARS-CoV-2(최적화된 서열) 서열번호 148
특정 측면에서, 본 발명은 2020년 2월 12일에 기탁번호 CNCM I-5493로 기탁된 플라스미드 pKP-MVSchwarz 또는 서열번호 30의 서열을 갖는 플라스미드 pKP-MVSchw에 관한 것이다. 이 플라스미드는 임의의 폴리뉴클레오티드를 클로닝하기 위한 플라스미드로 사용될 수 있다.
또 다른 특정 측면에서, 본 발명은 2002년 6월 12일자로 기탁번호 CNCM I-2889로 기탁된 플라스미드 pTM-MVSchw(또는 서열번호 28의 서열을 가짐), 또는 2002년 6월 12일에 기탁번호 CNCM I-2890로 기탁된 플라스미드 pTM2-MVSchw-gfp(또는 서열번호 29의 서열을 가짐), 또는 서열번호 38의 서열을 갖는 플라스미드 pTM3-MVSchw-gfp, 바람직하게는 2002년 6월 12일에 기탁번호 CNCM I-2890로 기탁된 플라스미드 pTM2-MVSchw-gfp(또는 서열번호 29의 서열을 가짐)에 관한 것이다. 이 플라스미드는 임의의 폴리뉴클레오티드를 클로닝하기 위한 플라스미드로 사용될 수 있다.
특정 펩티드/단백질을 암호화하는 폴리뉴클레오티드의 고유 및 코돈/MV-최적화된 뉴클레오티드 서열 뿐만 아니라 본 발명에 사용된 펩티드/단백질의 아미노산 서열
화합물의 이름, 즉 펩티드/단백질/항원(약어) 화합물을 암호화하는 폴리뉴클레오티드의 천연 뉴클레오티드 서열의 서열번호 화합물을 암호화하는 폴리뉴클레오티드의 코돈 최적화된 뉴클레오티드 서열의 서열번호 화합물을 암호화하는 폴리뉴클레오티드의 MV-최적화된 뉴클레오티드 서열의 서열번호 화합물의 아미노산 서열의 서열번호
nCoV의 S 폴리펩티드(즉, SARS-CoV-2) 1 2 36 3
nCoV의 stab-S 폴리펩티드(즉, SARS-CoV-2)(nCoV의 S2P 폴리펩티드라고도 함(즉, SARS-CoV-2)) 4 5
nCoV의 Secto 폴리펩티드(즉, SARS-CoV-2) 6 7
nCoV의 stab-Secto 폴리펩티드(즉, SARS-CoV-2) 8 9
nCoV의 S1 폴리펩티드(즉, SARS-CoV-2) 10 11
nCoV의 S2 폴리펩티드(즉, SARS-CoV-2) 12 13
nCoV의 stab-S2 폴리펩티드(즉, SARS-CoV-2) 14 15
nCoV의 tri-Secto 폴리펩티드(즉, SARS-CoV-2) 16 17
nCoV의 tristab-Secto 폴리펩티드(즉, SARS-CoV-2) 18 19
nCoV의 N 폴리펩티드(즉, SARS-CoV-2) 20 21 37 22
nCoV의 E 폴리펩티드(즉, SARS-CoV-2) 23
nCoV의 M 폴리펩티드(즉, SARS-CoV-2) 24
nCoV의 ORF8 폴리펩티드(즉, SARS-CoV-2) 25
nCoV의 ORF3a 폴리펩티드(즉, SARS-CoV-2) 26
nCoV의 ORF7a 폴리펩티드(즉, SARS-CoV-2) 27
nCoV의 S3F 폴리펩티드(즉, SARS-CoV-2) 42 43
nCoV의 S2P3F 폴리펩티드(즉, SARS-CoV-2) 44 45
nCoV의 S2PΔF 폴리펩티드(즉, SARS-CoV-2) 46 47
nCoV의 S2PΔF2A 폴리펩티드(즉, SARS-CoV-2) 48 49
SARS-CoV-2의 T4-S2P3F 폴리펩티드(SARS-CoV-2의 tristab-Secto-3F 폴리펩티드라고도 함) 51 52
SARS-CoV-2의 S6P 폴리펩티드 53 54
SARS-CoV-2의 S6P3F 폴리펩티드 55 56
SARS-CoV-2의 S6PΔF 폴리펩티드 57 58
SARS-CoV-2의 SCCPP 폴리펩티드 59 60
SARS-CoV-2의 SCC6P 폴리펩티드 61 62
SARS-CoV-2의 S MVopt 2P 폴리펩티드 63 5
SARS-CoV-2의 S MVopt ΔF 폴리펩티드 64 65
SARS-CoV-2의 S MVopt 2PΔF 폴리펩티드 66 47
nCoV의 SF-dER(즉, SARS-CoV-2) 73 74
nCoV의 SF-2P-dER(즉, SARS-CoV-2) 75 76
nCoV의 S2-dER(즉, SARS-CoV-2) 77 78
nCoV의 S2-2P-dER(즉, SARS-CoV-2) 79 80
nCoV의 SF-2P-2a(즉, SARS-CoV-2) 81 82
전달 벡터 플라스미드 및 요소
전달 벡터 플라스미드 및 요소의 이름 서열번호
pTM-MVSchw 28
pTM2-MVSchw-gfp 29
pKP-MVSchw 30
pKP-MVSchw-ATU1(eGFP) 31
pKP-MVSchw-ATU2(eGFP) 32
pKP-MVSchw-ATU3(eGFP) 33
pKM-ATU2-S_2019-nCoV (즉, SARS-CoV-2)(최적화된 서열) 34
pKM-ATU3-S_2019-nCoV(즉, SARS-CoV-2)(최적화된 서열) 35
pTM3-MVSchw-gfp 38
ATU1(eGFP) 39
ATU2(eGFP) 40
ATU3(eGFP) 41
개시된 서열은 뉴클레오티드 또는 아미노산 잔기에 관한 다음의 주석에 의하여 추가로 특성화된다:
nCoV의 스파이크 (S) 폴리펩티드의 천연 뉴클레오티드 서열 (서열번호 1)
특징 위치/검증자
Site join(13..18,13^14)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
CDS 25..3846
/cds_type="ORF"
/product="spike protein (S)"
/label="2019-nCoV_S ORF"
Site join(3853..3858,3853^3854)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
nCoV의 스파이크 (S) 폴리펩티드의 코돈 최적화된 뉴클레오티드 서열(서열번호 2)
특징(FEATURES) 위치/검증자(Location/Qualifiers)
Site join(13..18,13^14)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
sig_peptide 25..69
/note="predicted from Phobius"
/note="predicted from SignalP-5.0"
/label="Signal_peptide"
CDS 25..3849
/product="spike protein (S)"
/label="2019-nCoV_Sopt ORF"
Site 2068..2079
/site_type="cleavage site"
/note="polybasic furin-like cleavage site"
/label="predicted S1/S2 cleavage site"
Region 3664..3732
/site_type="transmembrane-region"
/note="predicted from TMHMM2.0"
/note="predicted from PHOBIUS"
/label="TM domain"
Site join(3853..3858,3853^3854)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
nCoV의 스파이크 (stab-S) 폴리펩티드의 안정화된 형태의 코돈 최적화된 뉴클레오티드 서열(서열번호 4)
특징 위치/검증자
Site join(13..18,13^14)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
sig_peptide 25..69
/note="predicted from Phobius"
/note="predicted from SignalP-5.0"
/label="Signal_peptide"
CDS 25..3849
/product="stabilized spike protein (S)"
/label="2019-nCoV_stab-Sopt ORF"
Site 2068..2079
/site_type="cleavage site"
/note="polybasic furin-like cleavage site"
/label="predicted S1/S2 cleavage site"
Site 2980..2985
/site_type="mutagenized site"
/function="stabilizing double mutation"
/label="K986P + V987P mutations"
Region 3664..3732
/site_type="transmembrane-region"
/note="predicted from TMHMM2.0"
/note="predicted from PHOBIUS"
/label="TM domain"
Site join(3853..3858,3853^3854)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
nCoV의 스파이크 (stab-S) 폴리펩티드의 안정화된 형태(서열번호 5)
특징 위치/검증자
Site 986..987
/site_type="mutagenized site"
/label="K986P + V987P mutations"
nCoV의 스파이크 (Secto) 엑토도메인 폴리펩티드의 가용성 및 단량체 형태의 코돈 최적화된 뉴클레오티드 서열(서열번호 6)
특징 위치/검증자
Site join(17..22,17^18)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
sig_peptide 29..73
/note="predicted from Phobius"
/note="predicted from SignalP-5.0"
/label="Signal_peptide"
CDS 29..3667
/product="soluble S ectodomain"
/label="2019-NCoV_Secto-opt ORF"
Site 2072..2083
/site_type="cleavage site"
/note="polybasic furin-like cleavage site"
/label="predicted S1/S2 cleavage site"
Site join(3671..3676,3671^3672)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
nCoV의 스파이크 (stab-Secto) 엑토도메인 폴리펩티드의 안정화된 형태의 코돈 최적화된 뉴클레오티드 서열(서열번호 8)
특징 위치/검증자
Site join(17..22,17^18)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
sig_peptide 29..73
/note="predicted from Phobius"
/note="predicted from SignalP-5.0"
/label="Signal_peptide"
CDS 29..3667
/product="stabilized soluble S ectodomain"
/label="2019-NCoV_stab-Secto-opt ORF"
Site 2072..2083
/site_type="cleavage site"
/note="polybasic furin-like cleavage site"
/label="predicted S1/S2 cleavage site"
Site 2984..2989
/site_type="mutagenized site"
/function="stabilizing double mutation"
/label="K986P + V987P mutations"
Site join(3671..3676,3671^3672)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
nCoV의 스파이크 (stab-Secto) 엑토도메인 폴리펩티드의 안정화된 형태(서열번호 9)
특징 위치/검증자
Site 986..987
/site_type="mutagenized site"
/label="K986P + V987P mutations"
nCoV의 S1 폴리펩티드의 코돈 최적화된 뉴클레오티드 서열(서열번호 10)
특징 위치/검증자
Site join(17..22,17^18)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
sig_peptide 29..73
/note="predicted from Phobius"
/note="predicted from SignalP-5.0"
/label="Signal_peptide"
CDS 29..2077
/product="soluble S1 subdomain"
/label="2019-NCoV_S1opt ORF"
Site join(2081..2086,2081^2082)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
nCoV의 S2 폴리펩티드의 코돈 최적화된 뉴클레오티드 서열(서열번호 12)
특징 위치/검증자
Site join(13..18,13^14)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
CDS 25..1842
/product="S2 domain linked to TM and cytoplasmic domain
and fused to signal peptide"
/label="S2-TM-cyto_2019-NCoV-opt"
sig_peptide 25..69
/note="predicted from Phobius"
/note="predicted from SignalP-5.0"
Site join(67..72,67^68)
/site_type="restriction site"
/note="Name: NgoMIV"
/note="Pattern: gccggc"
/label="NgoMIV"
Region 67..72
/region_type="Connecting peptide"
/label="Ala-Gly linker"
Region 73..1656
/region_type="Domain"
/label="S2 domain"
Region 1657..1725
/site_type="transmembrane-region"
/note="predicted from TMHMM2.0"
/note="predicted from PHOBIUS"
/label="TM domain"
Region 1726..1836
/region_type="Cytoplasmic"
/label="cytoplasmic domain"
Site join(1843..1848,1843^1844)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
nCoV의 S2 폴리펩티드 (서열번호 13)
특징 위치/검증자
sig_peptide 1..15
/label="signal_peptide"
Region 15..16
/region_type="Connecting peptide"
/label="AG linker"
Region 17..544
/region_type="Extracellular"
/label="S2_domain"
Region 545..567
/site_type="transmembrane-region"
/label="TM_domain"
Region 568..604
/region_type="Cytoplasmic"
/label="cytoplasmic_domain"
nCoV의 S2 (stab-S2) 폴리펩티드의 안정화된 형태의 코돈 최적화된 뉴클레오티드 서열 (서열번호 14)
특징 위치/검증자
Site join(13..18,13^14)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
CDS 25..1842
/product="stabilized S2 domain linked to TM and
cytoplasmic domain and fused to signal peptide"
/label="stab-S2-TM-cyto_2019-NCoV-opt"
sig_peptide 25..69
/note="predicted from Phobius"
/note="predicted from SignalP-5.0"
Site join(67..72,67^68)
/site_type="restriction site"
/note="Name: NgoMIV"
/note="Pattern: gccggc"
/label="NgoMIV"
Region 67..72
/region_type="Connecting peptide"
/label="Ala-Gly linker"
Region 73..1656
/region_type="Domain"
/label="S2 domain (stabilized)"
Site 973..978
/site_type="mutagenized site"
/note="stabilizing double mutation"
/label="K986P + V987P mutations"
Region 1657..1725
/site_type="transmembrane-region"
/note="predicted from TMHMM2.0"
/note="predicted from PHOBIUS"
/label="TM domain"
Region 1726..1836
/region_type="Cytoplasmic"
/label="cytoplasmic domain"
Site join(1843..1848,1843^1844)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
nCoV의 S2 (stab-S2) 폴리펩티드의 안정화된 형태 (서열번호 15)
특징 위치/검증자
sig_peptide 1..15
/label="signal_peptide"
Region 15..16
/region_type="Connecting peptide"
/label="AG linker"
Region 17..544
/region_type="Extracellular"
/label="S2_domain"
Site 317..318
/site_type="mutagenized site"
/label="K986P + V987P mutations"
Region 545..567
/site_type="transmembrane-region"
/label="TM_domain"
Region 568..604
/region_type="Cytoplasmic"
/label="cytoplasmic_domain"
nCoV의 스파이크 (tri-Secto) 폴리펩티드의 가용성 및 단량체 형태의 코돈 최적화된 뉴클레오티드 서열 (서열번호 16)
특징 위치/검증자
Site join(17..22,17^18)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
CDS 29..3754
/product="trimerized soluble S ectodomain"
/label="2019-NCoV_tri-Secto-opt ORF"
sig_peptide 29..73
/note="predicted from Phobius"
/note="predicted from SignalP-5.0"
/label="Signal_peptide"
Region 74..3661
/region_type="Domain"
/label="S ectodomain"
Site 2072..2083
/site_type="cleavage site"
/note="polybasic furin-like cleavage site"
/label="predicted S1/S2 cleavage site"
Region 3662..3670
/region_type="Connecting peptide"
/label="SGG linker"
Region 3668..3748
/region_type="Coiled coil"
/function="trimerization foldon"
/label="T4 fibritin foldon"
Site join(3755..3760,3755^3756)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
nCoV의 스파이크 (tri-Secto) 폴리펩티드의 가용성 및 단량체 형태 (서열번호 17)
특징 위치/검증자
sig_peptide 1..15
/label="signal_peptide"
Region 16..1211
/region_type="Extracellular"
/label="S_ectodomain"
Region 1212..1214
/region_type="Connecting peptide"
/label="SGG_linker"
Region 1214..1240
/region_type="Coiled coil"
/label="T4_fibritin_foldon"
nCoV의 스파이크 엑토도메인 (tristab-Secto) 폴리펩티드의 안정화된 및 삼량체화된 형태의 코돈 최적화된 뉴클레오티드 서열 (서열번호 18)
특징 위치/검증자
Site join(17..22,17^18)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
CDS 29..3754
/product="stabilized and trimerized soluble S ectodomain"
/label="2019-NCoV_tristab-Secto-opt ORF"
sig_peptide 29..73
/note="predicted from Phobius"
/note="predicted from SignalP-5.0"
/label="Signal_peptide"
Region 74..3661
/region_type="Domain"
/label="S ectodomain (stabilized)"
Site 2072..2083
/site_type="cleavage site"
/note="polybasic furin-like cleavage site"
/label="predicted S1/S2 cleavage site"
Site 2984..2989
/site_type="mutagenized site"
/function="stabilizing double mutation"
/label="K986P + V987P mutations"
Region 3662..3670
/region_type="Connecting peptide"
/label="SGG linker"
Region 3668..3748
/region_type="Coiled coil"
/function="trimerization foldon"
/label="T4 fibritin foldon"
Site join(3755..3760,3755^3756)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
nCoV의 스파이크 엑토도메인 (tristab-Secto) 폴리펩티드의 안정화된 및 삼량체화된 형태 (서열번호 19)
특징 위치/검증자
sig_peptide 1..15
/label="signal_peptide"
Region 16..1211
/region_type="Extracellular"
/label="S_ectodomain"
Site 986..987
/site_type="mutagenized site"
/label="K986P + V987P mutations"
Region 1212..1214
/region_type="Connecting peptide"
/label="SGG_linker"
Region 1214..1240
/region_type="Coiled coil"
/label="T4_fibritin_foldon"
nCoV의 N 폴리펩티드의 천연 뉴클레오티드 서열 (서열번호 20)
특징 위치/검증자
Site join(13..18,13^14)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
CDS 25..1284
/cds_type="ORF"
/product="nucleoprotein (N)"
/label="2019-nCoV_N ORF"
Site join(1291..1296,1291^1292)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
nCoV의 N 폴리펩티드의 코돈 최적화된 뉴클레오티드 서열 (서열번호 21)
특징 위치/검증자
Site join(13..18,13^14)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
CDS 25..1287
/product="nucleoprotein (N)"
/label="2019-nCoV_Nopt ORF"
Site join(1291..1296,1291^1292)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
pKP-MVSchw (서열번호 30)
LOCUS pKP-MVSchw 17858 bp DNA circular UNA
DEFINITION Abbreviated names : pKP-MSchwarz, pKM
COMMENT
특징 위치/검증자
Site join(1..8,5^6)
/site_type="restriction site"
/note="Name: AsiSI"
/note="Pattern: gcgatcgc"
/label="AsiSI"
promoter 9..28
/label="T7 promoter"
Site 29..97
/site_type="cleavage site"
/function="self-cleaves after position 54 to generate an
antigenome with an exact 5' end"
/label="hammerhead ribozyme"
misc_RNA 83..15976
/label="MVSchwarz_antigenome"
misc_signal 83..134
/standard_name="leader"
misc_feature 135..137
/function="nontranscribed intergenic trinucleotide"
/standard_name="Gene Junction"
/label="leader-N GJ"
promoter 138..148
/function="start of transcription"
/label="N gene start"
CDS 190..1767
/codon_start=1
/product="nucleocapsid protein"
/label="N ORF"
terminator 1816..1826
/function="polyadenylation signal"
/label="N gene end"
misc_feature 1827..1829
/function="nontranscribed intergenic trinucleotide"
/standard_name="gene junction"
/label="N-P GJ"
promoter 1830..1840
/function="restart of transcription"
/label="P/V/C gene start"
CDS join(1889..2580,2580..2787)
/note="addition of an additional G at 2499 to generate V
mRNA"
/label="V ORF"
CDS 1889..3412
/codon_start=1
/product="phosphoprotein"
/label="P ORF"
CDS 1911..2471
/codon_start=1
/product="nonstructural C protein"
/label="C ORF"
misc_signal 2570..2586
/function="co-transcriptional editing of mRNA"
/note="addition of an additional G at 2499 to generate V
mRNA"
/label="editing motif"
Site join(3446..3451,3446^3447)
/site_type="restriction site"
/note="Name: SalI"
/note="Pattern: gtcgac"
/label="SalI"
Site join(3455..3460,3455^3456)
/site_type="restriction site"
/note="Name: SpeI"
/note="Pattern: actagt"
/label="SpeI"
terminator 3474..3484
/function="polyadenylation signal"
/label="P/V/C gene end"
misc_feature 3485..3487
/function="nontranscribed intergenic trinucleotide"
/label="P-M GJ"
promoter 3488..3498
/function="restart of transcription"
/label="M gene start"
CDS 3520..4527
/codon_start=1
/product="matrix protein"
/label="M ORF"
terminator 4943..4953
/function="polyadenylation signal"
/label="M gene end"
misc_feature 4954..4956
/function="non transcribed intergenic trinucleotide"
/standard_name="Gene Junction"
/label="M-F GJ"
promoter 4957..4967
/function="restart of transcription"
/label="F gene start"
CDS 5531..7192
/codon_start=1
/product="fusion protein (alternate product)"
/label="F ORF (alt.)"
CDS 5540..7192
/codon_start=1
/product="fusion protein (main product)"
/label="F ORF"
Site join(6353..6358,6353^6354)
/site_type="restriction site"
/note="Name: SalI"
/note="Pattern: gtcgac"
/label="SalI"
terminator 7319..7329
/function="polyadenylation signal"
/label="F gene end"
misc_feature 7330..7332
/function="nontranscribed intergenic trinucleotide"
/standard_name="Gene Junction"
/label="F-H GJ"
promoter 7333..7343
/function="restart of transcription"
/label="H gene start"
CDS 7353..9206
/codon_start=1
/product="hemagglutinin protein"
/label="H ORF"
Site join(9257..9262,9257^9258)
/site_type="restriction site"
/note="Name: SpeI"
/note="Pattern: actagt"
/label="SpeI"
terminator 9280..9290
/function="polyadenylation signal"
/label="H gene end"
misc_feature 9291..9293
/function="nontranscribed intergenic trinucleotide"
/standard_name="Gene Junction"
/label="H-L GJ"
promoter 9294..9304
/function="restart of transcription"
/label="L gene start"
CDS 9316..15867
/codon_start=1
/product="large polymerase"
/label="L ORF"
terminator 15926..15936
/function="polyadenylation signal"
/label="L gene end"
misc_feature 15937..15939
/function="non transcribed intergenic trinucleotide"
/standard_name="Gene Junction"
/label="L-trailer GJ"
misc_signal 15940..15976
/standard_name="trailer"
Site 15977..16060
/site_type="cleavage site"
/function="self-cleaves before position a to generate an
antigenome with an exact 3' end"
/label="genomic HDV ribozyme"
Region 16074..16196
/note="nt 24107..24229 from bact. T7 DNA"
/label="full terminator region from bacteriophage T7"
terminator 16131..16177
/label="T7 terminator"
Site join(16203..16210,16204^16205)
/site_type="restriction site"
/note="Name: NotI"
/note="Pattern: gcggccgc"
/label="NotI"
misc_feature 16211..17858
/label="plasmid_backbone"
CDS 16261..17070
/function="kanamycin resistance"
/label="kanaR"
rep_origin 17134..17807
/label="pUC origin"
pKP-MVSchw-ATU1(eGFP) (서열번호 31)
LOCUS pKP-MVSchw-ATU1(eGFP) 18734 bp DNA circular UNA
DEFINITION Abbreviated names : pKM-ATU1(eGFP) ; pKM1-eGFP
COMMENT
특징 위치/검증자
Site join(1..8,5^6)
/site_type="restriction site"
/note="Name: AsiSI"
/note="Pattern: gcgatcgc"
/label="AsiSI"
promoter 9..28
/label="T7 promoter"
Site 29..97
/site_type="cleavage site"
/function="self-cleaves after position 54 to generate an
antigenome with an exact 5' end"
/label="hammerhead ribozyme"
misc_RNA 83..16852
/label="MVSchw-ATU1-eGFP_antigenome"
misc_feature 135..137
/function="nontranscribed intergenic trinucleotide"
/standard_name="Gene Junction"
/note="identical to leader-N GJ"
/label="leader-ATU1 GJ"
misc_feature 135..1010
/feature_type="Insertion"
/function="additional transcription unit"
/label="ATU1"
promoter 138..148
/function="start of transcription"
/note="identical to N gene start"
/label="ATU1 gene start"
Site join(190..195,190^191)
/site_type="restriction site"
/note="Name: MluI"
/note="Pattern: acgcgt"
/label="MluI"
Site join(193..198,193^194)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
CDS 199..918
/product="enhanced Green Fluorescent Protein"
/label="eGFP ORF"
Site join(919..924,919^920)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
Site join(925..930,927^928)
/site_type="restriction site"
/note="Name: AfeI"
/note="Pattern: agcgct"
/label="AfeI"
Site join(933..938,937^938)
/site_type="restriction site"
/note="Name: AatII"
/note="Pattern: gacgtc"
/label="AatII"
terminator 1000..1010
/function="polyadenylation signal"
/note="corresponds to N gene end sequence"
/label="engineered ATU1 gene end"
misc_feature 1011..1013
/function="nontranscribed intergenic trinucleotide"
/standard_name="Gene Junction"
/note="original leader-N GJ"
/label="ATU1-N GJ"
promoter 1014..1024
/function="start of transcription"
/note="original N gene start"
/label="N gene start"
Site 16853..16936
/site_type="cleavage site"
/function="self-cleaves before position a to generate an
antigenome with an exact 3' end"
/label="genomic HDV ribozyme"
terminator 17007..17053
/label="T7 terminator"
Site join(17079..17086,17080^17081)
/site_type="restriction site"
/note="Name: NotI"
/note="Pattern: gcggccgc"
/label="NotI"
misc_feature 17087..18734
/label="plasmid_backbone"
CDS 17137..17946
/function="kanamycin resistance"
/label="kanaR"
rep_origin 18010..18683
/label="pUC origin"
pKP-MVSchw-ATU2(eGFP) (서열번호 32)
특징 위치/검증자
Site join(1..8,5^6)
/site_type="restriction site"
/note="Name: AsiSI"
/note="Pattern: gcgatcgc"
/label="AsiSI"
promoter 9..28
/label="T7 promoter"
Site 29..97
/site_type="cleavage site"
/function="self-cleaves after position 54 to generate an
antigenome with an exact 5' end"
/label="hammerhead ribozyme"
misc_RNA 83..16804
/label="MVSchw-ATU2-eGFP_antigenome"
misc_feature 3460..4287
/feature_type="Insertion"
/function="additional transcription unit"
/label="ATU2"
terminator 3476..3486
/function="polyadenylation signal"
/note="corresponds to N gene end sequence"
/label="engineered P/V/C gene end"
misc_feature 3487..3489
/function="nontranscribed intergenic trinucleotide"
/standard_name="gene junction"
/label="P-ATU2 GJ"
promoter 3490..3500
/function="restart of transcription"
/note="corresponds to P/V/C gene start sequence"
/label="ATU2 gene start"
Site join(3523..3528,3523^3524)
/site_type="restriction site"
/note="Name: MluI"
/note="Pattern: acgcgt"
/label="MluI"
Site join(3526..3531,3526^3527)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
CDS 3532..4251
/cds_type="ORF"
/product="enhanced Green Fluorescent Protein"
/label="eGFP ORF"
Site join(4252..4257,4252^4253)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
Site join(4258..4263,4260^4261)
/site_type="restriction site"
/note="Name: AfeI"
/note="Pattern: agcgct"
/label="AfeI"
Site join(4266..4271,4270^4271)
/site_type="restriction site"
/note="Name: AatII"
/note="Pattern: gacgtc"
/label="AatII"
terminator 4302..4312
/function="polyadenylation signal"
/label="P/V/C gene end"
misc_feature 4313..4315
/function="nontranscribed intergenic trinucleotide"
/label="P-M GJ"
promoter 4316..4326
/function="restart of transcription"
/label="M gene start"
terminator 5771..5781
/function="polyadenylation signal"
/label="M gene end"
misc_feature 5782..5784
/function="non transcribed intergenic trinucleotide"
/standard_name="Gene Junction"
/label="M-F GJ"
promoter 5785..5795
/function="restart of transcription"
/label="F gene start"
Site 16805..16888
/site_type="cleavage site"
/function="self-cleaves before position a to generate an
antigenome with an exact 3' end"
/label="genomic HDV ribozyme"
terminator 16959..17005
/label="T7 terminator"
Site join(17031..17038,17032^17033)
/site_type="restriction site"
/note="Name: NotI"
/note="Pattern: gcggccgc"
/label="NotI"
misc_feature 17039..18686
/label="plasmid_backbone"
CDS 17089..17898
/function="kanamycin resistance"
/label="kanaR"
rep_origin 17962..18635
/label="pUC origin"
pKP-MVSchw-ATU3(eGFP) (서열번호 33)
LOCUS pKP-MVSchw-ATU3(eGFP) 18686 bp DNA circular UNA
DEFINITION Abbreviated names : pKM-ATU3(eGFP) ; pKM3-eGFP
COMMENT
특징 위치/검증자
Site join(1..8,5^6)
/site_type="restriction site"
/note="Name: AsiSI"
/note="Pattern: gcgatcgc"
/label="AsiSI"
promoter 9..28
/label="T7 promoter"
Site 29..97
/site_type="cleavage site"
/function="self-cleaves after position 54 to generate an
antigenome with an exact 5' end"
/label="hammerhead ribozyme"
misc_RNA 83..16804
/label="MVSchw-ATU3-eGFP_antigenome"
misc_feature 9258..10085
/feature_type="Insertion"
/function="additional transcription unit"
/label="ATU3"
terminator 9278..9288
/function="polyadenylation signal"
/note="corresponds to N gene end sequence"
/label="engineered P/V/C gene end"
misc_feature 9289..9291
/function="nontranscribed intergenic trinucleotide"
/standard_name="gene junction"
/label="P-ATU2 GJ"
promoter 9292..9302
/function="restart of transcription"
/note="corresponds to P/V/C gene start sequence"
/label="ATU2 gene start"
Site join(9325..9330,9325^9326)
/site_type="restriction site"
/note="Name: MluI"
/note="Pattern: acgcgt"
/label="MluI"
Site join(9328..9333,9328^9329)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
CDS 9334..10053
/cds_type="ORF"
/product="enhanced Green Fluorescent Protein"
/label="eGFP ORF"
Site join(10054..10059,10054^10055)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
Site join(10060..10065,10062^10063)
/site_type="restriction site"
/note="Name: AfeI"
/note="Pattern: agcgct"
/label="AfeI"
Site join(10068..10073,10072^10073)
/site_type="restriction site"
/note="Name: AatII"
/note="Pattern: gacgtc"
/label="AatII"
terminator 10108..10118
/function="polyadenylation signal"
/label="H gene end"
misc_feature 10119..10121
/function="nontranscribed intergenic trinucleotide"
/standard_name="Gene Junction"
/label="H-L GJ"
promoter 10122..10132
/function="restart of transcription"
/label="L gene start"
Site 16805..16888
/site_type="cleavage site"
/function="self-cleaves before position a to generate an
antigenome with an exact 3' end"
/label="genomic HDV ribozyme"
terminator 16959..17005
/label="T7 terminator"
Site join(17031..17038,17032^17033)
/site_type="restriction site"
/note="Name: NotI"
/note="Pattern: gcggccgc"
/label="NotI"
misc_feature 17039..18686
/label="plasmid_backbone"
CDS 17089..17898
/function="kanamycin resistance"
/label="kanaR"
rep_origin 17962..18635
/label="pUC origin"
pKM-ATU2-S_2019-nCoV (최적화된 서열) (서열번호 34)
LOCUS pKM-ATU2-S_2019-nCoV 21800 bp DNA circular UNA
DEFINITION Abbreviated names : pKM2-S_nCoV
COMMENT
특징 위치/검증자
Site join(1..8,5^6)
/site_type="restriction site"
/note="Name: AsiSI"
/note="Pattern: gcgatcgc"
/label="AsiSI"
promoter 9..28
/label="T7 promoter"
Site 29..97
/site_type="cleavage site"
/function="self-cleaves after position 54 to generate an
antigenome with an exact 5' end"
/label="hammerhead ribozyme"
misc_RNA 83..19918
/label="MVSchw-ATU2-S_2019-nCoV"
misc_feature 3460..7401
/feature_type="Insertion"
/function="additional transcription unit"
/label="ATU2"
terminator 3476..3486
/function="polyadenylation signal"
/note="corresponds to N gene end sequence"
/label="engineered P/V/C gene end"
misc_feature 3487..3489
/function="nontranscribed intergenic trinucleotide"
/standard_name="gene junction"
/label="P-ATU2 GJ"
promoter 3490..3500
/function="restart of transcription"
/note="corresponds to P/V/C gene start sequence"
/label="ATU2 gene start"
Site join(3523..3528,3523^3524)
/site_type="restriction site"
/note="Name: MluI"
/note="Pattern: acgcgt"
/label="MluI"
Site join(3526..3531,3526^3527)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
CDS 3538..7362
/product="spike protein (S)"
/label="2019-nCoV_Sopt ORF"
sig_peptide 3538..3582
/note="predicted from Phobius"
/note="predicted from SignalP-5.0"
/label="Signal_peptide"
Site 5581..5592
/site_type="cleavage site"
/note="polybasic furin-like cleavage site"
/label="predicted S1/S2 cleavage site"
Region 7177..7245
/site_type="transmembrane-region"
/note="predicted from TMHMM2.0"
/note="predicted from PHOBIUS"
/label="TM domain"
Site join(7366..7371,7366^7367)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
Site join(7372..7377,7374^7375)
/site_type="restriction site"
/note="Name: AfeI"
/note="Pattern: agcgct"
/label="AfeI"
Site join(7380..7385,7384^7385)
/site_type="restriction site"
/note="Name: AatII"
/note="Pattern: gacgtc"
/label="AatII"
terminator 7416..7426
/function="polyadenylation signal"
/label="P/V/C gene end"
misc_feature 7427..7429
/function="nontranscribed intergenic trinucleotide"
/label="P-M GJ"
promoter 7430..7440
/function="restart of transcription"
/label="M gene start"
terminator 8885..8895
/function="polyadenylation signal"
/label="M gene end"
misc_feature 8896..8898
/function="non transcribed intergenic trinucleotide"
/standard_name="Gene Junction"
/label="M-F GJ"
promoter 8899..8909
/function="restart of transcription"
/label="F gene start"
Site 19919..20002
/site_type="cleavage site"
/function="self-cleaves before position a to generate an
antigenome with an exact 3' end"
/label="genomic HDV ribozyme"
terminator 20073..20119
/label="T7 terminator"
Site join(20145..20152,20146^20147)
/site_type="restriction site"
/note="Name: NotI"
/note="Pattern: gcggccgc"
/label="NotI"
misc_feature 20153..21800
/label="plasmid_backbone"
CDS 20203..21012
/function="kanamycin resistance"
/label="kanaR"
rep_origin 21076..21749
/label="pUC origin"
pKM-ATU3-S_2019-nCoV (최적화된 서열) (서열번호 35)
LOCUS pKM-ATU3-S_2019-nCoV 21800 bp DNA circular UNA
DEFINITION Abbreviated names : pKM3-S_nCoV
COMMENT
특징 위치/검증자
Site join(1..8,5^6)
/site_type="restriction site"
/note="Name: AsiSI"
/note="Pattern: gcgatcgc"
/label="AsiSI"
promoter 9..28
/label="T7 promoter"
Site 29..97
/site_type="cleavage site"
/function="self-cleaves after position 54 to generate an
antigenome with an exact 5' end"
/label="hammerhead ribozyme"
misc_RNA 83..19918
/label="MVSchw-ATU3-eGFP_antigenome"
misc_feature 9258..13199
/feature_type="Insertion"
/function="additional transcription unit"
/label="ATU3"
terminator 9278..9288
/function="polyadenylation signal"
/note="corresponds to N gene end sequence"
/label="engineered P/V/C gene end"
misc_feature 9289..9291
/function="nontranscribed intergenic trinucleotide"
/standard_name="gene junction"
/label="P-ATU2 GJ"
promoter 9292..9302
/function="restart of transcription"
/note="corresponds to P/V/C gene start sequence"
/label="ATU2 gene start"
Site join(9325..9330,9325^9326)
/site_type="restriction site"
/note="Name: MluI"
/note="Pattern: acgcgt"
/label="MluI"
Site join(9328..9333,9328^9329)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
CDS 9340..13164
/product="spike protein (S)"
/label="2019-nCoV_Sopt ORF"
sig_peptide 9340..9384
/note="predicted from Phobius"
/note="predicted from SignalP-5.0"
/label="Signal_peptide"
Site 11383..11394
/site_type="cleavage site"
/note="polybasic furin-like cleavage site"
/label="predicted S1/S2 cleavage site"
Region 12979..13047
/site_type="transmembrane-region"
/note="predicted from TMHMM2.0"
/note="predicted from PHOBIUS"
/label="TM domain"
Site join(13168..13173,13168^13169)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
Site join(13174..13179,13176^13177)
/site_type="restriction site"
/note="Name: AfeI"
/note="Pattern: agcgct"
/label="AfeI"
Site join(13182..13187,13186^13187)
/site_type="restriction site"
/note="Name: AatII"
/note="Pattern: gacgtc"
/label="AatII"
terminator 13222..13232
/function="polyadenylation signal"
/label="H gene end"
misc_feature 13233..13235
/function="nontranscribed intergenic trinucleotide"
/standard_name="Gene Junction"
/label="H-L GJ"
promoter 13236..13246
/function="restart of transcription"
/label="L gene start"
Site 19919..20002
/site_type="cleavage site"
/function="self-cleaves before position a to generate an
antigenome with an exact 3' end"
/label="genomic HDV ribozyme"
terminator 20073..20119
/label="T7 terminator"
Site join(20145..20152,20146^20147)
/site_type="restriction site"
/note="Name: NotI"
/note="Pattern: gcggccgc"
/label="NotI"
misc_feature 20153..21800
/label="plasmid_backbone"
CDS 20203..21012
/function="kanamycin resistance"
/label="kanaR"
rep_origin 21076..21749
/label="pUC origin"
nCoV의 스파이크 (S) 폴리펩티드의 MV-최적화된 뉴클레오티드 서열 (서열번호 36)
특징 위치/검증자
Site join(13..18,13^14)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
CDS 25..3849
/product="spike protein (S)"
/label="2019-nCoV_Smvopt ORF"
Site join(3853..3858,3853^3854)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
nCoV의 N 폴리펩티드의 MV-최적화된 뉴클레오티드 서열 (서열번호 37)
특징 위치/검증자
Site join(13..18,13^14)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
CDS 25..1287
/product="nucleoprotein (N)"
/label="2019-nCoV_Nmvopt ORF"
Site join(1291..1296,1291^1292)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
ATU1(eGFP) (SEQ ID NO : 39)
특징 위치/검증자
misc_feature 1..876
/feature_type="Insertion"
/function="additional transcription unit"
/label="ATU1"
misc_feature 1..3
/function="nontranscribed intergenic trinucleotide"
/standard_name="Gene Junction"
/note="identical to leader-N GJ"
/label="leader-ATU1 GJ"
promoter 4..14
/function="start of transcription"
/note="identical to N gene start"
/label="ATU1 gene start"
Site join(56..61,56^57)
/site_type="restriction site"
/note="Name: MluI"
/note="Pattern: acgcgt"
/label="MluI"
Site join(59..64,59^60)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
CDS 65..784
/product="enhanced Green Fluorescent Protein"
/label="eGFP ORF"
Site join(785..790,785^786)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
Site join(791..796,793^794)
/site_type="restriction site"
/note="Name: AfeI"
/note="Pattern: agcgct"
/label="AfeI"
Site join(799..804,803^804)
/site_type="restriction site"
/note="Name: AatII"
/note="Pattern: gacgtc"
/label="AatII"
terminator 866..876
/function="polyadenylation signal"
/note="corresponds to N gene end sequence"
/label="engineered ATU1 gene end"
ATU2(eGFP) (서열번호 40)
특징 위치/검증자
misc_feature 1..828
/feature_type="Insertion"
/function="additional transcription unit"
/label="ATU2"
terminator 17..27
/function="polyadenylation signal"
/note="corresponds to N gene end sequence"
/label="engineered P/V/C gene end"
misc_feature 28..30
/function="nontranscribed intergenic trinucleotide"
/standard_name="gene junction"
/label="P-ATU2 GJ"
promoter 31..41
/function="restart of transcription"
/note="corresponds to P/V/C gene start sequence"
/label="ATU2 gene start"
Site join(64..69,64^65)
/site_type="restriction site"
/note="Name: MluI"
/note="Pattern: acgcgt"
/label="MluI"
Site join(67..72,67^68)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
CDS 73..792
/cds_type="ORF"
/product="enhanced Green Fluorescent Protein"
/label="eGFP ORF"
Site join(793..798,793^794)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
Site join(799..804,801^802)
/site_type="restriction site"
/note="Name: AfeI"
/note="Pattern: agcgct"
/label="AfeI"
Site join(807..812,811^812)
/site_type="restriction site"
/note="Name: AatII"
/note="Pattern: gacgtc"
/label="AatII"
ATU3(eGFP) (서열번호 41)
특징 위치/검증자
misc_feature 1..828
/feature_type="Insertion"
/function="additional transcription unit"
/label="ATU3"
terminator 21..31
/function="polyadenylation signal"
/note="corresponds to N gene end sequence"
/label="engineered P/V/C gene end"
misc_feature 32..34
/function="nontranscribed intergenic trinucleotide"
/standard_name="gene junction"
/label="P-ATU2 GJ"
promoter 35..45
/function="restart of transcription"
/note="corresponds to P/V/C gene start sequence"
/label="ATU2 gene start"
Site join(68..73,68^69)
/site_type="restriction site"
/note="Name: MluI"
/note="Pattern: acgcgt"
/label="MluI"
Site join(71..76,71^72)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
CDS 77..796
/cds_type="ORF"
/product="enhanced Green Fluorescent Protein"
/label="eGFP ORF"
Site join(797..802,797^798)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
Site join(803..808,805^806)
/site_type="restriction site"
/note="Name: AfeI"
/note="Pattern: agcgct"
/label="AfeI"
Site join(811..816,815^816)
/site_type="restriction site"
/note="Name: AatII"
/note="Pattern: gacgtc"
/label="AatII"
nCoV의 S3F 폴리펩티드의 코돈 최적화된 뉴클레오티드 서열 (서열번호 42)
특징 위치/검증자
Site join(13..18,13^14)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
sig_peptide 25..69
/note="predicted from Phobius"
/note="predicted from SignalP-5.0"
/label="Signal_peptide"
CDS 25..3849
/product="stabilized spike (S) protein (inactivation of
furin S1/S2 cleavage site)"
/label="2019-nCoV_3Fstab-Sopt ORF"
Site 2068..2079
/site_type="cleavage site"
/note="RRAR -> GSAG substitution"
/label="inactivated S1/S2 cleavage site"
Region 3664..3732
/site_type="transmembrane-region"
/note="predicted from TMHMM2.0"
/note="predicted from PHOBIUS"
/label="TM domain"
Site join(3853..3858,3853^3854)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
nCoV의 S2P3F 폴리펩티드의 코돈 최적화된 뉴클레오티드 서열 (서열번호 44)
특징 위치/검증자
Site join(13..18,13^14)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
sig_peptide 25..69
/note="predicted from Phobius"
/note="predicted from SignalP-5.0"
CDS 25..3849
/product="stabilized spike (S) protein (2P mutation &
inactivation of furin S1/S2 cleavage site)"
/label="2019-nCoV_2P+3Fstab-Sopt ORF"
Site 2068..2079
/site_type="cleavage site"
/note="RRAR -> GSAG substitution"
/label="inactivated S1/S2 cleavage site"
Site 2980..2985
/site_type="mutagenized site"
/function="stabilizing double mutation"
/label="K986P + V987P mutations"
Region 3664..3732
/site_type="transmembrane-region"
/note="TMHMM2.0 TMHELIX"
/note="PHOBIUS TRANSMEM"
/label="TM domain"
Site join(3853..3858,3853^3854)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
nCoV의 S2PΔF 폴리펩티드의 코돈 최적화된 뉴클레오티드 서열 (서열번호 46)
특징 위치/검증자
Site join(13..18,13^14)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
sig_peptide 25..69
/note="predicted from Phobius"
/note="predicted from SignalP-5.0"
/label="Signal_peptide"
CDS 25..3816
/product="stabilized spike (S) protein (2P mutation &
deletion of loop encompassing the S1/S2 furin cleavage
site)"
/label="2019-nCoV_2P+ΔFstab-Sopt ORF"
misc_feature 2044..2049
/feature_type="Deletion"
/note="deletion of QTQTNSPRRAR (loop encompassing S1/S2
cleavage site)"
/label="11-aa-deletion"
Site 2947..2952
/site_type="mutagenized site"
/function="stabilizing double mutation"
/label="K986P + V987P mutations"
Region 3631..3699
/site_type="transmembrane-region"
/note="predicted from TMHMM2.0"
/note="predicted from PHOBIUS"
Site join(3817..3822,3817^3818)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
nCoV의 S2PΔF2A 폴리펩티드의 코돈 최적화된 뉴클레오티드 서열 (서열번호 48)
특징 위치/검증자
Site join(13..18,13^14)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
sig_peptide 25..69
/note="predicted from Phobius"
/note="predicted from SignalP-5.0"
/label="Signal_peptide"
CDS 25..3816
/product="stabilized spike (S) protein (2P mutation &
deletion of loop encompassing the S1/S2 furin cleavage
site) with inactivation of the ERR signal"
/label="2019-nCoV_2P+Fstab+2Amut-Sopt ORF"
misc_feature 2044..2049
/feature_type="Deletion"
/note="deletion of QTQTNSPRRAR (loop encompassing S1/S2
cleavage site)"
/label="11-aa-deletion"
Site 2947..2952
/site_type="mutagenized site"
/function="stabilizing double mutation"
/label="K986P + V987P mutations"
Region 3631..3699
/site_type="transmembrane-region"
/note="predicted from TMHMM2.0"
/note="predicted from PHOBIUS"
/label="TM domain"
Site 3796..3804
/site_type="mutagenized site"
/function="inactivation of ERR signal"
/note="2A mutation"
/label="K1258A + H1260A mutations"
Site join(3817..3822,3817^3818)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
nCoV의 S3F 폴리펩티드 (서열번호 43)
특징 위치/검증자
Site 682..685
/site_type="cleavage site"
/note="RRAR -> GSAG substitution"
/label="inactivated S1/S2 cleavage site"
nCoV의 S2P3F 폴리펩티드 (서열번호 45)
특징 위치/검증자
Site 682..685
/site_type="cleavage site"
/note="RRAR -> GSAG substitution"
/label="inactivated S1/S2 cleavage site"
Site 986..987
/site_type="mutagenized site"
/function="stabilizing double mutation"
/label="K986P + V987P mutations"
nCoV의 S2PΔF 폴리펩티드 (서열번호 47)
특징 위치/검증자
misc_feature 674..675
/feature_type="Deletion"
/note="deletion of QTQTNSPRRAR (loop encompassing S1/S2
cleavage site)"
/label="11-aa-deletion"
Site 975..976
/site_type="mutagenized site"
/function="stabilizing double mutation"
/label="K986P + V987P mutations"
nCoV의 S2PΔF2A 폴리펩티드 (서열번호 49)
특징 위치/검증자
misc_feature 674..675
/feature_type="Deletion"
/note="deletion of QTQTNSPRRAR (loop encompassing S1/S2
cleavage site)"
/label="11-aa-deletion"
Site 975..976
/site_type="mutagenized site"
/function="stabilizing double mutation"
/label="K986P + V987P mutations"
Site 1258..1260
/site_type="mutagenized site"
/function="inactivation of ERR signal"
/label="K1258A + H1260A mutations"
/label="TM domain"
SARS-CoV-2의 T4-S2P3F(tristab-Secto-3F 또는 S2P3F의 가용성 삼량체화된 형태라고도 함) 폴리펩티드의 코돈 최적화된 뉴클레오티드 서열 (서열번호 51)
특징 위치/검증자
CDS 13..3738
/product="stabilized (2P mutation + inactivated furin
S1/S2 cleavage site) and trimerized (T4 foldon) soluble S
ectodomain"
/label="2019-NCoV_T4-S2P3F-opt ORF"
sig_peptide 13..57
/note="predicted from Phobius"
/note="predicted from SignalP-5.0"
Region 58..3645
/region_type="Domain"
/label="S ectodomain (2P+3F stabilized)"
Site 2056..2067
/site_type="cleavage site"
/note="RRAR -> GSAG substitution"
/label="inactivated S1/S2 cleavage site"
Site 2968..2973
/site_type="mutagenized site"
/function="stabilizing double mutation"
/label="K986P + V987P mutations"
Region 3646..3654
/region_type="Connecting peptide"
/label="SGG linker"
Region 3652..3732
/region_type="Coiled coil"
/function="trimerization foldon"
/label="T4 fibritin foldon"
SARS-CoV-2의 S6P 폴리펩티드의 코돈 최적화된 뉴클레오티드 서열 (서열번호 53)
특징 위치/검증자
Site join(13..18,13^14)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
sig_peptide 25..69
/label="Signal_peptide"
CDS 25..3849
/product="stabilized spike (S) protein (6P mutation)"
/note
/note
/label="2019-nCoV_6Pstab-Sopt ORF"
Site 2068..2079
/site_type="cleavage site"
/note="polybasic furin-like cleavage site"
/label="predicted S1/S2 cleavage site"
Site 2473..2475
/site_type="mutagenized site"
/function="stabilizing mutation"
/label="F817P"
Site 2698..2700
/site_type="mutagenized site"
/function="stabilizing mutation"
/label="A892P"
Site 2719..2721
/site_type="mutagenized site"
/function="stabilizing mutation"
/label="A899P"
Site 2848..2850
/site_type="mutagenized site"
/function="stabilizing mutation"
/label="A942P"
Site 2980..2985
/site_type="mutagenized site"
/function="stabilizing double mutation"
/label="K986P + V987P mutations 2P"
Region 3664..3732
/site_type="transmembrane-region"
/label="TM domain"
Site join(3853..3858,3853^3854)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
SARS-CoV-2의 S6P3F 폴리펩티드의 코돈 최적화된 뉴클레오티드 서열 (서열번호 55)
특징 위치/검증자
Site join(13..18,13^14)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
sig_peptide 25..69
/label="Signal_peptide"
CDS 25..3849
/product="stabilized spike (S) protein (6P mutation &
inactivation of furin S1/S2 cleavage site)"
/label="2019-nCoV_6P+3Fstab-Sopt ORF"
Site 2068..2079
/site_type="cleavage site"
/note="RRAR -> GSAG substitution"
/label="inactivated S1/S2 cleavage site"
Site 2473..2475
/site_type="mutagenized site"
/function="stabilizing mutation"
/label="F817P"
Site 2698..2700
/site_type="mutagenized site"
/function="stabilizing mutation"
/label="A892P"
Site 2719..2721
/site_type="mutagenized site"
/function="stabilizing mutation"
/label="A899P"
Site 2848..2850
/site_type="mutagenized site"
/function="stabilizing mutation"
/label="A942P"
Site 2980..2985
/site_type="mutagenized site"
/function="stabilizing double mutation"
/label="K986P + V987P mutations 2P"
Region 3664..3732
/site_type="transmembrane-region"
/label="TM domain"
Site join(3853..3858,3853^3854)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
SARS-CoV-2의 S6PΔF 폴리펩티드의 코돈 최적화된 뉴클레오티드 서열 (서열번호 57)
특징 위치/검증자
Site join(13..18,13^14)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
sig_peptide 25..69
/label="Signal_peptide"
CDS 25..3816
/function="stabilized spike (S) protein (6P mutation &
deletion of loop encompassing the S1/S2 furin cleavage
site)"
/label="2019-nCoV_6P+ΔFstab-Sopt ORF"
misc_feature 2044..2049
/feature_type="Deletion"
/note="deletion of QTQTNSPRRAR (loop encompassing S1/S2
cleavage site)"
/label="11-aa-deletion"
Site 2440..2442
/site_type="mutagenized site"
/function="stabilizing mutation"
/label="F817P"
Site 2665..2667
/site_type="mutagenized site"
/function="stabilizing mutation"
/label="A892P"
Site 2686..2688
/site_type="mutagenized site"
/function="stabilizing mutation"
/label="A899P"
Site 2815..2817
/site_type="mutagenized site"
/function="stabilizing mutation"
/label="A942P"
Site 2947..2952
/site_type="mutagenized site"
/function="stabilizing double mutation"
/label="K986P + V987P mutations 2P"
Region 3631..3699
/site_type="transmembrane-region"
/label="TM domain"
Site join(3817..3822,3817^3818)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
SARS-CoV-2의 SCCPP 폴리펩티드의 코돈 최적화된 뉴클레오티드 서열 (서열번호 59)
특징 위치/검증자
Site join(13..18,13^14)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
sig_peptide 25..69
/label="Signal_peptide"
CDS 25..3849
/product="stabilized spike (S) protein (CC+2P mutations)"
/label="2019-nCoV_CC+PPstab-Sopt ORF"
Site 1171..1173
/site_type="mutagenized site"
/function="stabilizing mutation : disulfide bond
formation with D985C"
/label="S383C"
Site 2068..2079
/site_type="cleavage site"
/note="polybasic furin-like cleavage site"
/label="predicted S1/S2 cleavage site"
Site 2977..2979
/site_type="mutagenized site"
/function="stabilizing mutation : disulfide bond
formation with S383C"
/label="D985C"
Site 2980..2985
/site_type="mutagenized site"
/function="stabilizing double mutation"
/label="K986P + V987P mutations"
Region 3664..3732
/site_type="transmembrane-region"
/label="TM domain"
Site join(3853..3858,3853^3854)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
SARS-CoV-2의 SCC6P 폴리펩티드의 코돈 최적화된 뉴클레오티드 서열 (서열번호 61)
특징 위치/검증자
Site join(13..18,13^14)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
sig_peptide 25..69
/label="Signal_peptide"
CDS 25..3849
/product="stabilized spike (S) protein (CC+6P mutations)"
/label="2019-nCoV_CC+6Pstab-Sopt ORF"
Site 1171..1173
/site_type="mutagenized site"
/function="stabilizing mutation : disulfide bond
formation with D985C"
/label="S383C"
Site 2068..2079
/site_type="cleavage site"
/note="polybasic furin-like cleavage site"
/label="predicted S1/S2 cleavage site"
Site 2473..2475
/site_type="mutagenized site"
/function="stabilizing mutation"
/label="F817P"
Site 2698..2700
/site_type="mutagenized site"
/function="stabilizing mutation"
/label="A892P"
Site 2719..2721
/site_type="mutagenized site"
/function="stabilizing mutation"
/label="A899P"
Site 2848..2850
/site_type="mutagenized site"
/function="stabilizing mutation"
/label="A942P"
Site 2977..2979
/site_type="mutagenized site"
/function="stabilizing mutation : disulfide bond
formation with S383C"
/label="D985C"
Site 2980..2985
/site_type="mutagenized site"
/function="stabilizing double mutation"
/label="K986P + V987P mutations 2P"
Region 3664..3732
/site_type="transmembrane-region"
/label="TM domain"
Site join(3853..3858,3853^3854)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
SARS-CoV-2의 S2P 폴리펩티드(S MVopt 2P)의 MV-최적화된 뉴클레오티드 서열 (서열번호 63)
특징 위치/검증자
Site join(13..18,13^14)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
sig_peptide 25..69
/label="Signal_peptide"
CDS 25..3849
/cds_type="ORF"
/function="stabilized spike (S) protein (2P mutation &
deletion of loop encompassing the S1/S2 furin cleavage
site)"
/label="2019-nCoV_2Pstab-Smvopt ORF"
Site 2068..2079
/site_type="cleavage site"
/note="polybasic furin-like cleavage site"
/label="predicted S1/S2 cleavage site"
Site 2980..2985
/site_type="mutagenized site"
/function="stabilizing double mutation"
/label="K986P + V987P mutations"
Region 3664..3732
/site_type="transmembrane-region"
/note="predicted from TMHMM2.0"
/note="predicted from PHOBIUS"
/label="TM domain"
Site join(3853..3858,3853^3854)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
SARS-CoV-2의 S2PΔF 폴리펩티드(S MVopt 2PΔF)의 MV-최적화된 뉴클레오티드 서열 (서열번호 64)
특징 위치/검증자
Site join(13..18,13^14)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
sig_peptide 25..69
/label="Signal_peptide"
CDS 25..3816
/cds_type="ORF"
/function="stabilized spike (S) protein (deletion of loop
encompassing the S1/S2 furin cleavage site)"
/label="2019-nCoV_Fstab-Smvopt ORF"
misc_feature 2044..2049
/feature_type="Deletion"
/note="deletion of QTQTNSPRRAR (loop encompassing S1/S2
cleavage site)"
/label="11-aa-deletion"
Region 3631..3699
/site_type="transmembrane-region"
/note="predicted from TMHMM2.0"
/note="predicted from PHOBIUS"
/label="TM domain"
Site join(3817..3822,3817^3818)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
SARS-CoV-2의 S2PΔF 폴리펩티드(S MVopt 2PΔF)의 MV-최적화된 뉴클레오티드 서열 (서열번호 66)
특징 위치/검증자
Site join(13..18,13^14)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
sig_peptide 25..69
/label="Signal_peptide"
CDS 25..3816
/cds_type="ORF"
/function="stabilized spike (S) protein (2P mutation &
deletion of loop encompassing the S1/S2 furin cleavage
site)"
/label="2019-nCoV_2P+Fstab-Smvopt ORF"
misc_feature 2044..2049
/feature_type="Deletion"
/note="deletion of QTQTNSPRRAR (loop encompassing S1/S2
cleavage site)"
/label="11-aa-deletion"
Site 2947..2952
/site_type="mutagenized site"
/function="stabilizing double mutation"
/label="K986P + V987P mutations"
Region 3631..3699
/site_type="transmembrane-region"
/note="predicted from TMHMM2.0"
/note="predicted from PHOBIUS"
/label="TM domain"
Site join(3817..3822,3817^3818)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
또한, 본 발명은 S 폴리펩티드 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 또는 결실(들)을 갖는 이의 면역원성 단편을 포함하는 재조합 바이러스 유사 입자(VLP)에 관한 것이고, 여기서의 S 폴리펩티드 또는 면역원성 단편은 본 발명에 따른 핵산 작제물, 또는 본 발명에 따른 전달 플라스미드 벡터, 또는 본 발명에 따른 재조합 홍역 바이러스의 제1 및 선택적으로 제2 이종 폴리뉴클레오티드(들)에 의해 암호화되거나 본 발명에 따른 숙주 세포 내에서 생산되는 것이다.
본 발명에 따르면, VLP는 다량으로 생산될 수 있고 재조합 감염성 MV-CoV 입자와 함께 발현된다. VLP는 CoV의 VLP이다.
본 발명의 바람직한 구현예에 따르면, 재조합 MV 벡터는 이러한 방식으로 설계되고 생산 방법은, 백신 접종에 적합한 MV 균주로부터 유래된 벡터로 형질감염되거나 형질전환된 헬퍼 세포에서 생산된 바이러스 입자가 재조합 감염 복제 MV의 생산 및 면역원성 조성물, 바람직하게는 보호 또는 백신 조성물에 사용하기 위한 CoV-VLP의 생산을 가능하게 하도록 세포를 포함한다.
유리하게는, 본 발명의 재조합 감염성 MV-CoV 입자의 게놈은 복제 가능하다. "복제 가능"은 MV의 N, P 및 L 단백질을 발현하는 헬퍼 세포주로 형질도입될 때 새로운 바이러스 입자를 생성하기 위해 전사 및 발현될 수 있는 핵산을 의미한다.
또한, MV-CoV의 재조합 게놈의 제조를 위해 MV cDNA를 사용하여 수득된 본 발명의 재조합 바이러스의 복제는 숙주, 특히 재조합 MV-CoV가 투여되는 인간 숙주에서 생체내에서 달성될 수도 있다.
또한, 본 발명은 본 발명에 따른 핵산 분자에 의해 코딩되는 코로나바이러스(CoV), 특히 SARS-CoV-2의 폴리펩티드에 관한 것이다.
본 발명의 특정 구현예에서, 폴리펩티드는 하기로 이루어진 군으로부터 선택된 아미노산 서열을 포함한다:
i. 서열번호 3 (작제물 S);
ii. 서열번호 5 (작제물 stab-S);
iii. 서열번호 7 (작제물 Secto);
iv. 서열번호 9 (작제물 stab-Secto);
v. 서열번호 11 (작제물 S1),
vi. 서열번호 13 (작제물 S2),
vii. 서열번호 15 (작제물 stab-S2),
viii. 서열번호 17 (작제물 tri-Secto),
ix. 서열번호 19 (작제물 tristab-Secto),
x. 서열번호 43 (작제물 S3F),
xi. 서열번호 45 (작제물 S2P3F),
xii. 서열번호 47 (작제물 S2PΔF),
xiii. 서열번호 49 (작제물 S2PΔF2A),
xiv. 서열번호 22 (작제물 N),
xv. 서열번호 52 (작제물 T4-S2P3F (tristab-Secto-3F)),
xvi. 서열번호 54 (작제물 S6P),
xvii. 서열번호 56 (작제물 S6P3F),
xviii. 서열번호 58 (작제물 S6PΔF),
xix. 서열번호 60 (작제물 SCCPP), 및
xx. 서열번호 62 (작제물 SCC6P).
바람직하게는, 폴리펩티드는 S서열번호 5, 서열번호 43, 서열번호 45, 서열번호 47 및 서열번호 49로 이루어진 군으로부터 선택된 아미노산 서열을 가지며, 더 바람직하게는 서열번호 45, 서열번호 47 및 서열번호 49로 이루어진 군으로부터 선택된 아미노산 서열을 가지며, 더 바람직하게는 서열번호 47 또는 서열번호 49의 폴리펩티드이다.
본 발명의 바람직한 구현예에서, 폴리펩티드는 서열번호 76(작제물 SF-2P-dER) 또는 서열번호 82(작제물 SF-2P-2a)의 아미노산 서열, 바람직하게는 서열번호 76(작제물 SF-2P-dER)의 아미노산 서열을 갖는다.
또한, 본 발명은 본 발명에 따른 전달 벡터에 의해 발현되는 재조합 단백질에 관한 것이다.
본 발명의 특정 구현예에서, 재조합 단백질은 정제를 위한 아미노산 태그를 추가로 포함한다.
또한, 본 발명은 본 발명에 따른 전달 벡터에 의해 시험관내 또는 생체내에서 발현되는 재조합 단백질에 관한 것이다.
또한, 본 발명은 코로나바이러스, 특히 SARS-CoV-2에 감염된 것으로 의심되는 개체로부터 이전에 얻은 생물학적 시료, 특히 혈액 또는 혈청 시료에서의 검출을 위한, 스파이크 항원 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 또는 결실(들)을 갖는 이의 면역원성 단편, 특히 서열번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 22, 23, 24, 25, 26, 27, 43, 45, 47 또는 49, 바람직하게는 서열번호 3, 5, 43, 45, 47 또는 49, 보다 바람직하게는 서열번호 45, 47 또는 49, 훨씬 더 바람직하게는 서열번호 47 또는 49, 훨씬 더 바람직하게는 서열번호 49의 서열을 갖는 항원인 SARS-CoV-2의 항원의 시험관내 용도에 관한 것이고, 여기서의 항원은 항원에 대한 항체의 존재를 결정하기 위해 생물학적 샘플과 접촉된다.
바람직하게는, SARS-CoV-2의 항원의 시험관내 용도에서의 항원은 코로나바이러스, 특히 SARS-CoV-2에 감염된 것으로 의심되는 개체로부터 이전에 얻은 생물학적 시료, 특히 혈액 또는 혈청 시료에서의 검출을 위한, 전술한 바와 같은 스파이크 항원 또는 이의 면역원성 단편 또는 이의 돌연변이 항원, 특히 서열번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 22, 23, 24, 25, 26, 27, 43, 45, 47 또는 49, 바람직하게는 서열번호 3, 5, 43, 45, 47 또는 49, 보다 바람직하게는 서열번호 45, 47 또는 49, 훨씬 더 바람직하게는 서열번호 47 또는 49, 훨씬 더 바람직하게는 서열번호 49의 서열을 갖는 항원이고, 여기서의 항원은 항원에 대한 항체의 존재를 결정하기 위해 생물학적 샘플과 접촉된다.
또한, 본 발명은 코로나바이러스, 특히 SARS-CoV-2에 감염된 것으로 의심되는 개체로부터 이전에 얻은 생물학적 시료, 특히 혈액 또는 혈청 시료에서의 검출을 위한, 스파이크 항원 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 또는 결실(들)을 갖는 이의 면역원성 단편, 특히 서열번호 서열번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 22, 23, 24, 25, 26 또는 27, 바람직하게는 서열번호 3 또는 5의 서열을 갖는 항원인 SARS-CoV-2의 항원의 시험관내 용도에 관한 것이고, 여기서의 항원은 항원에 대한 항체의 존재를 결정하기 위해 생물학적 샘플과 접촉된다.
바람직하게는, SARS-CoV-2의 항원의 시험관내 용도에서의 항원은 SARS-CoV-2에 감염된 것으로 의심되는 개체로부터 이전에 얻은 생물학적 시료, 특히 혈액 또는 혈청 시료에서의 검출을 위한, SF-2P-dER 항원 또는 SF-2P-2a 항원 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 또는 결실(들)을 갖는 이의 면역원성 단편, 특히 서열번호 76 또는 서열번호 82, 바람직하게는 서열번호 76의 서열을 갖는 항원이고, 여기서의 항원은 항원에 대한 항체의 존재를 결정하기 위해 생물학적 샘플과 접촉된다.
또한, 본 발명은 진단 또는 백신 목적으로 또는 융합전 구성(pre-fusion configuration)으로서, 스파이크 항원 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 또는 결실(들)을 갖는 이의 면역원성 단편, 특히 서열번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 22, 23, 24, 25, 26, 27, 43, 45, 47 또는 49, 바람직하게는 서열번호 3, 5, 43, 45, 47 또는 49, 보다 바람직하게는 서열번호 45, 47 또는 49, 훨씬 더 바람직하게는 서열번호 47 또는 49, 훨씬 더 바람직하게는 서열번호 49의 서열을 갖는 항원인 SARS-CoV-2의 항원의 시험관내 용도에 관한 것이다.
코로나바이러스, 특히 코로나바이러스 SARS-CoV-2를 시험관내 진단하는 방법은 스파이크 항원 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 또는 결실(들)을 갖는 이의 면역원성 단편, 특히 서열번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 22, 23, 24, 25, 26, 27, 43, 45, 47 또는 49, 바람직하게는 서열번호 3, 5, 43, 45, 47 또는 49, 보다 바람직하게는 서열번호 45, 47 또는 49, 훨씬 더 바람직하게는 서열번호 47 또는 49, 훨씬 더 바람직하게는 서열번호 49의 서열을 갖는 항원인 SARS-CoV-2의 항원을 사용하는 것을 포함한다.
또한, 본 발명은 코로나바이러스, 특히 SARS-CoV-2에 감염된 것으로 의심되는 개체로부터 이전에 얻은 생물학적 시료, 특히 혈액 또는 혈청 시료에서의 검출을 위한, 스파이크 항원 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 또는 결실(들)을 갖는 이의 면역원성 단편, 특히 서열번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 22, 23, 24, 25, 26 또는 27, 바람직하게는 서열번호 3 또는 5의 서열을 갖는 항원인 SARS-CoV-2의 항원의 시험관내 용도에 관한 것이고, 여기서의 항원은 항원에 대한 항체의 존재를 결정하기 위해 생물학적 샘플과 접촉된다.
바람직하게는, SARS-CoV-2의 항원의 시험관내 용도에서의 항원은 SARS-CoV-2에 감염된 것으로 의심되는 개체로부터 이전에 얻은 생물학적 시료, 특히 혈액 또는 혈청 시료에서의 검출을 위한, SF-2P-dER 항원 또는 SF-2P-2a 항원 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 또는 결실(들)을 갖는 이의 면역원성 단편, 특히 서열번호 76 또는 82, 바람직하게는 서열번호 76의 서열을 갖는 항원이고, 여기서의 항원은 항원에 대한 항체의 존재를 결정하기 위해 생물학적 샘플과 접촉된다.
본 발명의 특정 구현예에서, 항원은 코로나바이러스, 특히 SARS-CoV-2에 감염된 것으로 의심되는 개체로부터 이전에 수득된 생물학적 샘플, 특히 혈액 또는 혈청 샘플과 접촉되도록 배치되고, 항원에 대한 항체의 존재가 결정된다.
또한, 본 발명은 본 발명에 따른 면역원성 또는 백신 조성물을 숙주에 투여하는 것을 포함하는, 숙주, 특히 인간 숙주에서 SARS-CoV-2에 의한 감염을 치료 또는 예방하는 방법에 관한 것이다.
또한, 본 발명은 본 발명에 따른 면역원성 또는 백신 조성물을 숙주에 투여하는 것을 포함하는, 숙주, 특히 인간 숙주에서 SARS-CoV-2에 대한 보호 면역 반응을 유도하는 방법에 관한 것이다.
방법의 특정 구현예에서, 투여는 적어도 2개의 연속 투여 단계를 포함한다. 바람직하게는, 2차 투여는 1차 투여 후 2주 내지 6개월, 특히 1차 투여 후 1개월 또는 2개월 후에 수행된다.
항원/항원성 폴리펩티드
몇몇 구현예에서, 항원성 폴리펩티드는 유전자 산물, 천연 발생 폴리펩티드, 합성 폴리펩티드, 상동체, 이종상동체, 동종상동체, 단편 및 전술한 것의 다른 등가물, 변이체 및 유사체를 포함한다. 폴리펩티드는 단일 분자일 수 있거나 이량체, 삼량체 또는 사량체와 같은 다분자 복합체일 수 있다. 또한, 폴리펩티드는 단일 사슬 폴리펩티드 또는 다중사슬 폴리펩티드를 포함할 수 있고, 서로 회합되거나 연결될 수 있다. 가장 일반적으로, 이황화 결합은 다중 사슬 폴리펩티드에서 발견된다. 또한, "폴리펩티드"라는 용어는 하나 이상의 아미노산 잔기가 상응하는 자연 발생 아미노산의 인공 화학적 유사체인 아미노산 중합체에 적용될 수 있다.
당업자에 의해 인식되는 바와 같이, 단백질 단편, 기능적 단백질 도메인 및 상동 단백질도 관심 폴리펩티드의 범위 내에 있는 것으로 간주된다. 예를 들어, 본원에서는 10, 20, 30, 40, 50, 60, 70, 80, 90, 100 또는 100개 초과의 아미노산 길이를 갖는 참조 단백질의 임의의 단백질 단편(참조 폴리펩티드 서열보다 적어도 하나의 아미노산 잔기 만큼 짧지만 다른 점은 동일한 폴리펩티드 서열을 의미함)을 제공한다. 또 다른 예에서, 본원에 기재된 임의의 서열과 40%, 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 20, 30, 40, 50, 또는 100개(연속적) 아미노산의 스트레치를 포함하는 임의의 단백질이 본 개시에 따라 이용될 수 있다. 몇몇 구현예에서, 폴리펩티드는 본원에 제공되거나 본원에 언급된 임의의 서열에 나타낸 바와 같은 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 돌연변이를 포함한다. 또 다른 예에서, 본원에 기재된 임의의 서열과 80% 초과, 90% 초과, 95% 초과 또는 100% 동일한 20, 30, 40, 50, 또는 100개 아미노산의 스트레치를 포함하는 임의의 단백질은 본원에 기재된 임의의 서열과 80%, 75%, 70%, 65% 내지 60% 미만인 5, 10, 15, 20, 25, 또는 30개 아미노산의 스트레치를 갖고 본 개시에 따라 이용될 수 있다.
본 개시의 폴리펩티드 또는 폴리뉴클레오티드 분자는 참조 분자(예를 들어, 참조 폴리펩티드 또는 참조 폴리뉴클레오티드), 예를 들어, 당업계에 기술된 분자(예를 들어, 조작되거나 설계된 분자 또는 야생형 분자)와 특정 정도의 서열 유사성 또는 동일성을 가질 수 있다.
본 발명의 다른 특징 및 이점은 이하의 실시예로부터 명백할 것이고 또한 도면에 예시될 것이며, 이들 중 어느 것도 제한적인 것으로 의도되지 않는다.
실시예
A. 실시예 1
1. 물질 및 방법
SARS-CoV-2의 특정 항원 서열의 설계
SARS-CoV-2 유래의 천연 스파이크 및 핵단백질 항원을 암호화하는 cDNA는 2020년 1월 20일 NBCBI로부터 공개적으로 이용가능한 Genbank MN908947 서열을 기반으로 설계하였다. 그런 다음, 이러한 서열을 GeneArt(ThermoFisher)의 프로젝트 관리자 플랫폼을 통해 처리하여 포유류 및 초파리 세포에서 높은 발현을 위한 코돈-최적화 뉴클레오티드 서열을 얻었다. GC 함량이 매우 높거나(>80%) 낮은(<30%) 영역은 가능한 한 피하고, 내부 TATA 박스, 카이 사이트, 리보솜 진입 부위, ARE, INS 및 CRS 서열과 같은 시스 작용 서열 모티프뿐만 아니라 반복적인 서열, RNA 2차 구조, 스플라이스 공여체 및 수용체 부위는 피했다. 두 서열은 두 가닥 모두에서 MV 편집(AnGn, n≥3) 및 핵심 유전자 말단(A4CKT) 유사 서열을 제거하기 위해 추가로 편집하였다. 그런 다음, BsiWI 및 BssHII 제한 부위를 뉴클레오티드 서열의 5' 및 3' 말단에 각각 추가하였다. 생성된 cDNA는 "6의 법칙"을 따르고, 이 법칙은 MV 게놈의 뉴클레오티드 수가 6의 배수여야 한다는 것이고, 그 cDNA는 서열 20AAP6IP-S-2019-nCoV(즉, SARS-CoV-2)-opt(2x)(서열번호 2) 및 20AASUIP-N-2019-nCoV(즉, SARS-CoV-2)-opt(2X)(서열번호 21)를 각각 갖는다(아래 참조).
천연 스파이크 및 핵단백질 서열도 GeneArt(ThermoFisher)의 프로젝트 관리자 플랫폼을 통해 처리되어 홍역 백신 플랫폼을 위한 최적화된 유전자를 생성했다. 코딩 서열은 44-50%의 표적 GC 조성과 균형 잡힌 코돈 조성을 갖는 서열을 생성하기 위해 변형되었으며, 적용 가능한 경우 희귀 코돈과 가장 빈번한 코돈의 높은 사용을 피했다. 위에서 설명한 완전히 코돈-최적화된 서열의 생성과 관련하여, 매우 높거나(>80%) 또는 낮은(<30%) GC 함량 영역은 가능한 한 피하고, 내부 TATA 박스, chi 부위, 리보솜 진입 부위, ARE, INS 및 CRS 서열 요소와 같은 cis-작용 서열 모티프뿐만 아니라 반복 서열, RNA 2차 구조 및 스플라이스 공여자 및 수용체 부위는 피했다. 두 서열은 또한 두 가닥에서 MV 편집(AnGn, n≥3) 및 핵심 유전자 말단(A4CKT) 유사 서열을 제거하기 위해 추가로 편집하였다. 그런 다음, BsiWI 및 BssHII 제한 부위를 뉴클레오티드 서열의 5' 및 3' 말단에 각각 추가하였다. 얻어지는 cDNA는 MV 게놈의 뉴클레오티드 수가 6의 배수여야 한다는 "6의 법칙"을 준수하고, 각각 서열 20AAS76C_S-2019-nCoV_mod(서열번호 36) 및 20AAS77C_N-2019-nCoV-HS_mod(서열번호 37)를 갖는다(아래 참조).
얻어지는 4개의 cDNA를 Geneart(ThermoFisher) 시설에서 합성했다.
플라스미드 벡터 구성 및 백신 후보 구출(rescue)
MVSchw 재조합 플라스미드 구조는 새로운 pKP-MVSchw-ATU1(eGFP), -ATU2 및 -ATU3 플라스미드 벡터(약칭: pKM1, pKM2, pKM3)에서 유래되었다. 이러한 벡터는 각각 원래의 pTM-MVSchw-ATU1, -ATU2 및 -ATU3 플라스미드 벡터로부터 제작되었다(WO04/000876호 및 Combredet 등, J Virol, 2003). pKM 및 pTM 플라스미드 벡터 시리즈는 P와 M 유전자 사이(ATU2) 및 H와 L 유전자 사이(ATU3)에서, Schwarz MV 백신 균주의 안티게놈에 해당하는 동일한 감염성 cDNA 및 N 유전자(ATU1)의 상류측에 외래 오픈 리딩 프레임을 삽입하기 위한 고유한 BsiWI 및 BssHII 제한 부위를 포함하는 추가 전사 단위를 보유한다.
우선, 원래의 pTM2-eGFP 플라스미드(두 Not1 부위 사이에 위치한 17038 bp)의 전체 T7 구조 카세트를 상업적 pENTR2 최소 플라스미드(ThermoFisher사)의 의도적으로 변형된 버전으로 옮겨서 pKM2-eGFP를 얻었다. 다음으로, pKM2-eGFP로부터 pKM, pKM3-eGFP 및 pKM1-eGFP를 순차적으로 유도하였다. 새로운 pKM, pKM1-, pKM2- 및 pKM3-eGFP 벡터는 pTM 플라스미드 벡터 시리즈에서 관찰된 것과 유사한 효율성으로 해당 홍역 바이러스 및 벡터를 구출하는 능력에 대하여 검증하였다. 새로운 pKM1, pKM2 및 pKM3 플라스미드 벡터로부터 구출된 바이러스는 각각 원래의 pTM1, pTM2 및 pTM3 벡터로부터 구출된 바이러스와 동일한 게놈 서열을 갖는다는 점을 강조하는 것이 중요하다.
pKM 플라스미드 시리즈는 단일, 이중 및 삼중 재조합 벡터에 다양한 바이러스 항원을 삽입하는데 사용하기에 적합하며 원래의 pTM 플라스미드 시리즈보다 훨씬 높은 클로닝 효율, 안정성 및 DNA 수율을 제공하므로 홍역 백신 플렛폼에 가장 유용한 구출 도구이다.
위에서 설명한 SARS-CoV-2 핵단백질 및 스파이크 항원을 암호화하는 cDNA를 BsiWI/BssHII-절단된 pKM2 및 pKM3 벡터에 삽입하였으며, 얻어지는 pKM-nCoV 플라스미드는 이전에 설명한 대로 헬퍼 세포 기반 시스템을 사용하여 단일 재조합 MV-nCoV 백신 후보를 구출하는데 사용된다(Combredet 등, J Virol, 2003).
플라스미드 pKM2-nCoV_NP 및 임의의 pKM3-nCoV_Spike 작제물(전장-S, stab-S, Secto, S1, tri-Secto, tristab-Secto)은 SalI 제한 효소로 절단되고 라이게이션되어 일련의 이중 재조합 pKM-nCoV-N&S 플라스미드를 생성한다.
대안적으로, 이중 재조합 플라스미드는 N 및 S ATU 카세트를 P 및 M 유전자 사이(MV 게놈의 위치 3) 또는 H 및 L 유전자 사이(MV 게놈의 위치 6)에 나란히 삽입하여 얻을 수 있다. 얻어지는 pKM-nCoV-N&S 플라스미드는 위에서 설명한 바와 같이 이중 재조합 MV-nCoV-N&S 백신 후보를 구출하는데 사용될 것이다.
백신 후보의 세포내 특성규명
단일 및 이중 재조합 백신 후보는 WO 04/000876호에 개시된 바와 같이 Vero-NK 세포에서 증폭된다. 모든 바이러스 스톡은 0.1의 MOI에서 감염 후 생산되고, -80℃에서 보관되고, Vero-NK 세포 단층에 대한 종말점 제한 희석 분석에 의해 적정된다. 감염 역가는 Reed and Munsch 방법(Reed 등, Am. J. Hyg., 1938)에 따라 50% 조직 배양 감염 용량(TCID50)으로 결정된다.
백신 후보는 본질적으로 MV-SARS 백신 후보에 대해 설명된 대로 특성규명된다(Escriou 등, Virology, 2014):
- 백신 후보 및 모 MVSchw의 성장 곡선은 MOI 0.1에서 감염된 Vero-NK 세포에 대해 결정되고,
- SARS-CoV-2 항원의 발현 수준은 VeroNK에 감염된 세포에 대해 수행된 간접 면역형광 분석(IFA) 및 감염된 세포로부터 제조된 용해물에 대한 웨스턴 블롯에 의해, 사용 가능한 항-SARS 교차 반응성 마우스 및 토끼 항체 및 항-SARS-CoV-2 항체를 사용하여 평가되고,
- 백신 후보의 게놈 안정성은 VeroNK 세포의 연속 계대와 구출 및 계대된 바이러스 스톡의 전체 게놈 NGS 시퀀싱에 의해 평가된다.
SARS-CoV-2 S 단백질을 발현하는 재조합 MV Schwarz 바이러스의 생성
감염성 MV cDNA가 있는 플라스미드에 SARS-CoV-2 S 단백질의 클로닝
플라스미드 pKM-MVSchw는 Schwarz MV 백신 균주의 안티게놈에 해당하는 감염성 MV cDNA를 포함한다. 이는 이전에 설명된 pTM-MVSchw(Combredet 등, J Virol, 2003)에서 유래되었다. 두 플라스미드 모두 Schwarz MV 백신 균주의 구출을 허용한다. 2020년 초에 순환하는 바이러스의 전장, 막 결합, 고유 SARS-CoV2 스파이크 당단백질(공개적으로 사용 가능)을 암호화하는 최적화된 cDNA가 화학적으로 합성되었다(GeneArt/ThermoFisher사, 독일). 완전한 서열은 MV 게놈에 추가되는 뉴클레오티드의 수가 6의 배수여야 한다고 규정하는 "6의 법칙"을 준수하며, 양쪽 말단에서 BsiWI 및 BssHII 제한 부위를 포함한다. 스파이크 뉴클레오티드 서열은 MV 벡터로부터의 전사(특히 크립틱 신호의 제거 및 RNA 1차 서열의 최적화에 국한되지 않음) 및 인간 세포에서의 번역(특히 코돈 최적화 및 RNA 2차 구조에 국한되지 않음) 모두에 대해 최적화하였다. 이 cDNA는 Schwarz MV 게놈의 혈구응집소와 폴리머라제 유전자 사이에서 추가 전사 단위를 포함하는 BsiWI/BssHII-절단된 pKM-MVSchw-ATU3에 삽입하였다. 얻어지는 플라스미드는 pKM-ATU3-S_2019-nCOV(즉, SARS-CoV-2)로 명명하였다.
이 플라스미드로부터 출발하여, 스파이크 아미노산 서열에 여러 돌연변이를 도입하였다(도 2). 발현된 단백질을 융합 전 상태(2P 돌연변이)에서 잠그고, S1/S2 절단(3F 돌연변이 또는 포함하는 루프의 F 결실을 통한 퓨린 절단 부위 불활성화)을 방지하고, 소포체 검색 신호를 불활성화(2A 돌연변이)시키도록 아미노산 서열을 순차적으로 변형시켰다. 얻어지는 플라스미드는 다음과 같이 명명하였다: pKM-ATU3-S_2019-nCOV(즉, SARS-CoV-2), pKM-ATU3-stab S_2019-nCOV(즉, SARS-CoV-2)(2P 돌연변이), pKM-ATU3-S2P3F_2019-nCOV(즉. SARS-CoV-2), pKM-ATU3-S2PΔF_2019-nCOV(즉, SARS-CoV-2), pKM-ATU3-S2PΔF2A_2019-nCOV(즉, SARS-CoV-2). 도 3에 도시된 작제물에 더하여, 2P 돌연변이가 결여된 pKM-ATU3-S3F_2019-nCOV가 생성되었다.
다른 작제물은 ATU2 부위에서 유사한 코딩 서열을 생성하도록 설계되었다. 우선, Schwarz MV 게놈의 인단백질과 기질 유전자 사이에 추가적인 전사 단위를 포함하는 BsiWI/BssHII-digested pKM-MVSchw-ATU2에 최적화된 SARS-CoV2 스파이크 cDNA를 삽입하여 서열번호 34의 pKM-ATU2-S_2019-nCOV(즉, SARS-CoV-2)를 생성하였다.
또한, pKM-ATU2-SMVopt는 뉴클레오티드 조성 및 트랜스진의 발현 수준을 미세 조정하고 재조합 홍역 바이러스의 향상된 적합성 및 안정성을 촉진하기 위한 노력의 일환으로 홍역-최적화 서열(서열번호 36)을 사용하여 생성하였다. 이 플라스미드로부터 출발하여, 2P 돌연변이, 푸린 절단 부위의 결실(ΔF), 및 두 돌연변이/결실의 조합(2PΔF)을 ATU3에서와 유사한 삽입을 생성하기 위해 스파이크 아미노산 코딩 서열(도 3c)에 도입하였다. 얻어지는 플라스미드는 다음과 같이 명명하였다: pKM-ATU2-SMVopt, pKM-ATU2-S2PMVopt, pKM-ATU2-SΔFMVopt, 및 pKM-ATU2-S2PFMVopt.
HEK 293-T7-NP 세포의 시딩
헬퍼 세포주 HEK 293-T7-NP(US8,586,364 특허)를 신선하게 해동하여 증식시켰다. 90% 컨플루언시(confluency)에 도달하면, 세포를 수확하고 10% FBS를 함유하는 DMEM에 재현탁시켰다. 6-웰 플레이트에 웰당 2mL 세포 현탁액을 시딩하고 37℃ 및 5% CO2에서 밤새 인큐베이션하였다.
서열번호 35의 플라스미드 pKM-ATU3-S_2019-nCOV(즉, SARS-CoV-2), 서열번호 34의 pKM-ATU2-S_2019-nCOV(즉, SARS-CoV-2), pKM-ATU2-S MVopt 또는 유도체를 이용한 형질감염 및 열 충격
50-70% 컨플루언시에서, 배지를 새로운 2mL DMEM + 10% FCS로 교환하고 플레이트를 37℃ 및 5% CO2에서 4시간 동안 인큐베이션했다. pKM 플라스미드와 홍역 Schwarz 폴리머라제를 암호화하는 pEMC-La 플라스미드의 공동 형질감염은 이전에 설명한 대로 인산칼슘으로 수행하였다(Combredet 등, J Virol, 2003). 형질감염 혼합물을 배지에 적가하였다. 플레이트를 부드럽게 흔들어 형질감염 혼합물을 균일하게 분배하고 37℃ 및 5% CO2에서 밤새 인큐베이션하였다.
형질감염 배지를 2mL 신선한 DMEM + 10% FCS로 조심스럽게 교체했다. 형질감염된 세포를 37℃에서 3시간 동안 인큐베이션한 후 43.5℃ 및 5% CO2에서 3시간 열 충격을 가하였다.
이후 세포층이 합류할 때까지 37℃에서 2일 동안 인큐베이션을 계속하였다.
HEK와 VERO 세포의 공동 배양
공동 배양 하루 전에, 48웰 플라크(plaque)에 DMEM + 5% FCS 중 2 x 104개 세포/0.25mL 농도의 Vero 세포를 접종했다. 형질감염 후 3일째에, 즉 공동 배양 0일째에, 형질감염된 HEK 세포를 2mL의 배지(플레이트의 각 웰에 함유됨)에 부드럽게 재현탁시키고, 24mL까지 희석하고, Vero 세포에 0.25mL/웰에 첨가하였다(공동 배양). 공동 배양 플레이트를 부드럽게 흔들어 혼합하고 37℃ 및 5% CO2에서 인큐베이션하였다. 공동 배양 3일째부터, 세포를 CPE 및 합포체(syncytium) 형성에 대해 매일 관찰하였다.
합포체의 수확(구출된 바이러스)
CPE 또는 합포체의 단일 초점을 나타내는 공동 배양 플레이트의 웰을 PBS로 헹구고 트립신(트립신/EDTA 200μl)으로 수확했다. 48웰 플라크에서의 공동 배양과 함께, 구출된 바이러스의 클론성을 보장했다. 37℃에서 2 내지 5분 인큐베이션한 후, 세포를 2.5 mL의 DMEM + 5% FCS의 최종 부피로 6-웰 플레이트의 단일 웰에 옮겼다. 상이한 플라스미드로 형질감염된 세포로부터 단일 융합체를 함유하는 다중 웰을 수확하고 새로운 6-웰 플레이트로 옮겼다. 6웰 플레이트를 37℃ 및 5% CO2에서 인큐베이션하고 CPE 또는 합포체 형성을 매일 관찰했다.
구출된 바이러스는 다음과 같이 명명했다:
Figure pct00001
구출된 바이러스의 증식(expansion)
합포체/CPE가 세포 단층의 30 내지 50%에 도달하면, 구출된 바이러스 클론을 추가로 증식시켰다. 이들 웰의 세포 단층을 트립신처리에 의해 수확하고, 합류까지 성장한 T75 플라스크에서 유래한 트립신처리된 Vero 세포 2~3x106개와 함께 75 cm2 플라스크로 옮기고 37℃ 및 5% CO2에서 인큐베이션하였다.
증식된 구조된 바이러스의 수확
바이러스 증식 1 내지 2일 후, 합포체/CPE는 구출된 바이러스 클론 각각으로 감염된 Vero 세포 단층의 70 내지 90%에 도달했다. 세포 단층을 1.5mL의 상청액에 동결/해동하여 용해시키고 정화를 위해 4℃에서 2000g에서 5분 동안 원심분리하였다. 얻어지는 상층액을 계대 0(P0)으로 지정하고 분취하여 -80℃에서 보관하였다.
삽입물의 항원 발현 및 서열은 각각의 구출된 클론(도 4 및 도 13) 및 Sanger 시퀀싱의 P0에 대한 웨스턴 블롯에 의해 확인하였다. 우수한 항원 발현 및 검증된 삽입 서열을 갖는 클론을 추가 증식을 위해 선택하였다.
세포 배양에서 바이러스 클론 증식
구출된 재조합 MV 클론의 P0 종자를 해동시켰다. 바이러스 증식은 T150 플라스크에서 DMEM + 5% FCS에서 배양된 Vero 세포에서 수행하였으며, 0.05의 다중도(M.O.I)로 감염시키고 37℃ + 5% CO2에서 인큐베이션하였다. 감염 후 2 내지 3일에, 합포체/CPE가 Vero 세포 단층의 80 내지 95%에 도달했을 때, 2.5mL의 상청액에서 긁어낸 세포 단층의 동결/해동 주기에 의해 바이러스를 수확했다. 세포 파편을 4℃에서 2000g에서 5분간 원심분리하여 제거하였다(계대 1, P1). 각긱의 선택된 클론의 P1에 대해 삽입물의 항원 발현 및 서열을 확인하였다. 구출된 바이러스의 유전적 안정성에 대한 추가 계대 및 평가를 위해, 이러한 단계를 반복하였다.
MV 및 SARS-CoV-2 S에 특이적인 ELISA 분석
면역화된 마우스에서 MV 및 SARS-CoV-2 특이적 항체의 유도는 이전에 설명한 대로 간접 ELISA에 의해 평가하였다(Escriou 등, 2014). 마이크로타이터 플레이트를 정제된 홍역 항원(Jena Bioscience) 또는 HEK 293T 세포에서 각각 발현된 재조합 삼량체화 SARS-CoV-2 스파이크 엑토도메인으로 코팅하고 마우스 혈청의 연속 희석액과 함께 인큐베이션했다. 결합된 항체는 양고추냉이 퍼옥시다제(Southern Biotech) 및 TMB(KPL)에 결합된 마우스 특이적 항-IgG(감마 사슬 특이적) 이차 항체로 밝혀졌다. ELISA IgG 역가는 0.5의 흡광도를 제공하는 개별 혈청의 최고 희석도의 역수로 계산되었다.
SARS-CoV-2 미세중화 분석
DMEM + 1% BSA + 10mMTricine에서 열 불활성화된 마우스 혈청 샘플의 2배 또는 3배 연속 희석액을 SARS-CoV-2의 20 TCID50과 함께 37℃에서 2시간 동안 인큐베이션하고, 96웰 마이크로타이터 플레이트의 DMEM + 5% FCS에 플레이트된 FRhK-4 세포의 서브컨플루언트 단층에 첨가했다. 각각의 혈청 희석액은 4중으로 테스트하였으며 세포변성 효과(CPE) 종말점은 37℃ + 5% CO2에서 접종 후 5일까지 판독하였다. 중화 항체 역가는 4개의 웰 중 적어도 2개에서 CPE를 방지한 혈청의 최고 희석도의 역수로 Reed and Muench 방법(Reed and Muench, 1938)에 따라 결정하였다.
MV 및 SARS-CoV-2 ELISPOT 분석
면역화된 또는 대조군 마우스로부터 비장세포를 수확하고, 단일 세포 현탁액을 제조하고, MV 및 SARS-CoV-2-특이적 IFN-γ-생산 T 세포의 빈도를 표준 ELISPOT 분석에서 정량화하였다. 간단히 말해서, 96웰 멀티스크린 PVDF 플레이트(Millipore)를 PBS 중 5㎍/ml 래트 항-마우스 IFN-γ 항체(AN18, Becton-Dickinson사)로 코팅했다. 플레이트를 세척하고 완전한 RPMI 배지(10% FCS, 10mM Hepes, 5x10-5M β-메르캅토에탄올, 비필수 아미노산, 소듐 피루베이트, 100U/ml 페니실린 및 100㎍/ml 스티렙토마이신이 보충된 RPMI 1640)로 2 시간동안 블로킹했습다. 면역화된 마우스 및 대조군 마우스 유래의 다양한 수의 비장세포(일반적으로 4x105, 2x105 및 1x105)를 적절한 펩티드(1-10μM) 및 IL2(10U/ml)의 존재 또는 부재하에 3중으로 플레이팅하였다. 세포를 37℃에서 20시간 동안 인큐베이션한 후, 광범위한 세척 후, 비오틴화된 래트 항-마우스 IFNγ 항체(R46A2, Becton-Dickinson사), 알칼리성 포스파타제-접합 스트렙타비딘(Becton-Dickinson사) 및 기질로서 5-브로모-4-클로로-3-인돌릴포스페이트/니트로블루 테트라졸륨(NBT/BCIP, Sigma)과의 연속적 배양을 통해 스팟을 확인했다. 자동 ImmunoSpot® 분석기 및 관련 Biospot 7.0 소프트웨어(CTL)를 사용하여 스팟을 계수했다. 각각의 마우스에 대해, 펩티드-특이적 IFNγ-생산 세포의 수는 음성 대조 펩티드의 존재 및 특정 펩티드의 존재하에서 생성된 스팟 수 사이의 차이를 계산함으로써 결정하였다. 결과는 106개의 비장세포당 스팟 형성 세포(SFC)의 수로 표현되었다.
SARS-CoV-2 스파이크 단백질에 대한 반응을 결정하기 위해, T 세포는 10개의 아미노산 중복(Mimotopes)이 있는 15-mer 펩티드를 포함하는 S1 및 S2 도메인에 걸쳐 있는 펩티드 풀로 총 농도 10μM에서 자극하였다. 이들 풀에는 각각 135개와 118개의 펩티드가 포함되었다.
홍역 H22-30(서열번호 67의 RIVINREHL) 및 H446-454(서열번호 68의 SNHNNVYWL) 펩티드 및 NP366(SCOT) 펩티드(서열번호 69의 ASNENMDTM)는 Eurogentec에 의해 합성되어 각각 1μM의 농도에서 양성 및 음성 대조 펩티드로서 각각 사용되었다.
세포내 사이토카인 염색
백신 접종 마우스 또는 대조군 마우스로부터의 비장세포를 수확하고 단일 세포 현탁액을 제조하였다. 100만 개의 비장세포를 Glutamax(ThermoFisher사), 10% FBS, 1% 페니실린-스트렙토마이신, 10IU/ml IL-2(Miltenyi Biotec사), 100ng/ml IL-7(Miltenyi Biotec사)과 함께 IMDM에서 배양했다. 세포는 펩티드 당 2 ㎍/ml의 최종 농도(5% DMSO에서 재구성됨)의 펩티드 풀로 37℃에서 6시간 동안 자극하였다. BD GolgiPlug 및 BD GolgiStop(BD Biosciences사)을 마지막 4시간 동안 첨가했다. 양성 대조군의 경우, 세포를 50ng/ml PMA(Sigma Aldrich) 및 1 ㎍/ml 이오노마이신(Sigma Aldrich사)으로 자극하고, 음성 대조군의 경우, DMSO가 포함된 배지를 사용했다. 세포를 마우스 Fc 수용체 블록(항-마우스 2.4G2) 및 고정 가능한(Fixable) 생존성 염료 eFluor506(eBioscience)과 함께 인큐베이션하여 죽은 세포를 배제했다. 세포를 α-CD45 BUV395(BD Pharmingen # 564279), α-CD19 AF700(eBioscience # 56-0193-80), α-CD11b AF700(eBioscience # 56-0112-82), α-CD19 AF700(eBioscience # 56-0112-82), 56-0114-82), α-CD3e BV650(BD Pharmingen # 564378), α-CD4 eFluor 450(eBioscience # 48-0041-80), α-CD8a PerCp Cy5.5(BD Pharmingen # 564378), α-CD8a PerCp Cy5.5(BD Pharmingen # 54511 BV786(BD Pharmingen # 563736), α-CD62L APC-Cy7(BioLegend # 104427)로 염색했다. 고정 및 투과화(BD Cytofix/Cytoperm, BD Biosciences) 후, 세포를 α-TNFα FITC(eBioscience #11-7321-81), α-IFNγ PE-Cy7(BD Pharmingen # 55764), α-IL-5 PE(eBioscience # 12-7052-82), α-IL-13 eFluor 660(eBioscience # 50-7133-82)로 세포 내 염색했다. Fortessa(BD Biosciences사)를 사용하여 유세포 분석에 의해 세포를 획득하고 FlowJo v10.7 소프트웨어로 데이터를 분석했다.
SARS-CoV-2를 사용한 IFNAR-KO 마우스의 챌린지
홍역 백신을 허용하는 129/Sv 백그라운드에서 6 내지 9주 된 IFNα/ßR-/- 마우스 그룹(IFNAR-KO)에 재조합 MVSchw/SARS-CoV-2-S 또는 모체 MVSchw의 105 TCID50을 복강 내(i.p.) 주사했다. 부스터 주사액은 4주 후에 투여하였다. 표시된 시점에서 혈청 샘플을 수집했다.
인간 ACE2 수용체의 발현을 유도하기 위해, 면역화된 마우스를 케타민/자일라진 용액(각각 50mg/kg 및 10mg/kg)으로 가볍게 마취하고 30μL PBS 중 6.0x108 ICU의 Ad5-hACE2(SARS-CoV-2의 인간 ACE2 수용체를 발현하는 아데노바이러스 5, Ku 등, 2021)를 비강내 투여하였다. 4일 후, 마우스를 위에서 설명한 대로 마취하고 PBS 30μL 중 France/IDF0372/2020 SARS-CoV2 균주의 2x104 TCID50(Tissue Culture Infectious Dose 50%)을 비강내 접종했다.
감염된 마우스는 SARS-CoV-2 챌린지 후 4일째 경추 탈구에 의해 안락사시켰다. 각 폐엽의 절반을 무균적으로 제거하고 PBS로 광범위하게 헹구고, 2개의 균질화 주기 사이에 얼음 위에서 인큐베이션하면서 20초 동안 4m/s로 두 번의 연속 펄스에 의해 FastPrep®-24 균질화기와 6.35mm 직경의 산화지르코늄 세라믹 분쇄 구체(MP Biomedical)를 함유하는 Lysing Matrix M 튜브를 이용하여 750μL의 얼음-냉각 PBS에서 분쇄시까지 얼음위에서 유지했다. 균질물을 4℃에서 2000g에서 10분 동안 원심분리하여 정화하고 일회용 분취량으로 -80℃에서 보관했다.
폐의 SARS-CoV-2 게놈 RNA 부하은 제조사의 절차에 따라 QIAamp Viral RNA Mini Kit(Qiagen)를 사용하여 70μL의 폐 균질액으로부터 바이러스 RNA를 추출하여 결정하였다. 폐 균질액에서 추정적인 비미립자 바이러스 RNA를 제거하기 위해, QIAamp Viral RNA Mini Kit의 AVL 완충액으로 불활성화하기 전에 70μL 샘플을 37℃에서 30분 동안 100U RNaseI(Ambion)로 처리했다. 바이러스 부하(게놈 등가물(GEQ)/폐로 표현됨)는, 하기 표 7에 나타낸 바와 같이 SuperScriptTM III Platinum One-Step Quantitative RT-PCR System(Invitrogen사)과 SARS-CoV-2 봉투(E) 유전자를 표적으로 하는 프라이머 및 프로브(Eurofins사)를 사용하여, 본질적으로 Corman 등(Euro Surveill. 2020)에 의해 설명된 바와 같이 역전사 및 실시간 TaqMan® PCR에 따라 결정하였다. 플라스미드 pCI/SARS-CoV E에서 유래된 시험관 내 전사된 RNA는 T7 RiboMAX Express Large Scale RNA 생산 시스템(Promega)을 사용하여 합성한 다음, 페놀/클로로포름 추출 및 에탄올을 사용한 두 번의 연속 침전을 통해 정제했다. RNA 농도를 광학 밀도 측정을 통해 결정한 다음, 100μg/mL tRNA 운반체가 포함된 RNAse가 없는 물에 RNA를 109 게놈 당량/μL로 희석하고 -80℃에서 일회용 분취액에 보관했다. Agilent 2100 bioanalyzer_Eukaryote Total RNA Nano Series II에서 RNA 품질을 제어했다. 이 시험관 내 전사된 RNA의 연속 희석액을 10μg/mL tRNA 운반체를 함유하는 RNAse가 없는 물에서 제조하고 각 분석에서 표준 곡선을 설정하는데 사용했다. 열 사이클링 조건은 다음과 같았다: (i) 55℃에서 10분 동안 역전사, (ii) 95℃에서 3분 동안 효소 불활성화, (iii) 95℃에서 15초, 58℃에서 30초 동안 45 사이클의 변성/증폭. 생성물은 ABI 7500 Fast real-time PCR 시스템(Applied Biosystems사)에서 분석하였다.
SARS-CoV-2 부하 측정을 위한 프라이머 및 프로브 서열
프라이머/프로브 명칭 DNA 서열 서열번호
E_Sarbeco_F1 5'- ACAGGTACGTTAATAGTTAATAGCGT -3' 70
E_Sarbeco_R2 5'- ATATTGCAGCAGTACGCACACA -3' 71
E_Sarbeco_P1 5'- FAM-ACACTAGCCATCCTTACTGCGCTTCG-BHQ-1 -3' 72
폐 균질액 내의 감염성 SARS-CoV-2 역가는 12웰 플레이트에 접종된 Vero-E6 세포에서 측정하였다. 이중 웰 내의 세포를 10mM 트리신 및 1mg/mL BSA를 함유하는 DMEM 배지에서 폐 균질액의 각 5배 연속 희석액으로 감염시켰다. 37℃, 5% CO2 분위기에서 1시간 인큐베이션한 후, 바이러스 접종물을 회수하고 세포를 1μg/mL 트립신 및 1.2% Avicel RC581(FMC Biopolymer사)을 포함하는 배지에 넣은 다음, 37℃에서 72시간 동안 추가로 인큐베이션했다. 그런 다음, 세포 시트를 포름알데히드로 고정하고 0.1% 크리스탈 바이올렛으로 염색하고 플라크를 계수했다. 감염성 바이러스 역가는 플라크 형성 단위(PFU)/폐로 표현하였다.
2. 결과 및 고찰
세포 배양에서 재조합 MV의 구출 및 특성규명
성장 특성
ATU3로부터 SARS-CoV-2 S를 발현하는 재조합 MV가 성공적으로 구출되었다. MV-ATU3-S는 Vero NK 세포에서 증식되었고 107 조직 배양 감염 용량 50(TCID50) 이상의 높은 역가로 성장했다. 유전적 안정성은 ATU의 Sanger 시퀀싱 및 형질감염 후 검색된 독립적인 바이러스 클론의 전장 게놈의 NGS 시퀀싱에 의해 확인하였다. 대표적인 클론에 대해 도 4a에 나타낸 바와 같이 MV-ATU3-S의 각 클론으로 감염된 세포에서 효율적인 S 발현이 입증되었다. 시간 경과 실험에서, MV-ATU3-S 바이러스는 48시간 후에 피크 역가에 도달한 다음, 48시간에서 72시간 사이에 안정적인 바이러스 역가를 보인 MV-Schw와 대조적으로 약 1 log 역가만큼 감소했다. 세포의 감염 시, 홍역 바이러스는 일반적으로 바이러스 융합(F) 및 부착(H) 당단백질과 숙주 세포 원형질막 사이의 상호작용의 결과로 다핵 세포(합포체, 도 5)의 형성을 유도한다. 궁극적으로, 첫 번째 합포체는 점진적으로 서로 융합되어 넓은 영역 또는 융합된 세포를 생성한다. MV-ATU3-S로 감염된 세포에서 이러한 큰 합포체의 증가된 수가 감염 후 늦은 시간에 관찰되었다(도 5). MV-ATU3-S의 이 융합형 표현형은 감염 후 초기부터 관찰되었으며(도시되지 않음) 융합 영역의 더 큰 확장은 감염 후 48시간에 바이러스 역가의 피크와 일치했다. 이 시점에서, 큰 합포체는 붕괴되고 감염된 세포 단층은 광범위한 세포병원성 효과(CPE)를 나타내어 MV-Schw에 비해 MV-ATU3-S의 바이러스 복제에 영향을 미쳤다. 융합형 표현형은 MV-ATU3-S에 감염된 세포에서 세포 표면에 발현된 천연 스파이크가 이웃 세포의 ACE2 수용체와 상호작용하고 세포 융합을 촉진할 수 있다는 의미에서 기능적임을 시사했다. 백신 후보를 생성하기 위해, MV-ATU3-S에서 관찰된 것과 같은 강화된 융합 유전자 표현형은 홍역 벡터 바이러스의 친화성을 변경할 수 있으므로 잠재적인 안전 위험으로 간주되었다.
따라서, 융합 생성 특성이 감소 또는 폐지된 스파이크 단백질 변이체는, "2P" 돌연변이(K986P + V987P)를 통해 융합전 상태의 스파이크를 안정화하거나 다염기 절단 부위의 "3F" 돌연변이(R682G+R683S+R685G) 또는 포함되는 Q675-R685 루프의 "F" 결실을 통해 S1/S2 접합부에서의 절단을 방지하는 것을 기반으로, 두 가지 보완적 접근 방식을 통해 설계되었다(도 2). 전술한 변형 및 이들의 조합을 갖는 변이체 스파이크 단백질을 발현하는 변형된 스파이크 유전자를 생성하고, 먼저 split-GFP 시스템을 보유하는 세포에 기초한 분석에서 hACE2 발현의 존재 하에 일시적 형질감염 후 세포 융합을 촉진하는 그의 능력에 대해 평가하였다(Buchrieser 등, 2020). 데이터는 "2P" 돌연변이 단독, 다염기성 S1/S2 푸린 절단 부위 단독의 "3F" 돌연변이, 또는 "2P"와 "3F"의 조합, 또는 "2P" 및 푸린 절단 부위 "ΔF"(도 2)는 천연 스파이크와 대조적으로 hACE2-발현 HEK 293T 세포의 융합을 유도하지 않았다는 것을 나타냈다(도 16).
이러한 결과에 의해 암시된 바와 같이, "2P" 돌연변이를 도입하여 사전 융합 상태에서 S 단백질을 잠그면(도 2) 이러한 안정화된 스파이크 변이체를 발현하는 재조합 홍역 벡터 바이러스의 강화된 융합성 표현형이 폐지되었다. 재조합 MV-ATU3-S2P, MV-ATU3-S2P3F, MV-ATU3-S2PΔF 및 MV-ATU3-S2PΔF2A는 실제로 성공적으로 구출되었고 모두 107 TCID50 이상의 높은 역가로 성장했다. Vero NK 세포를 MV-AUT3-S2P, MV-ATU3-S2P3F, MV-ATU3-S2PΔF 및 MV-ATU3-S2PΔF2A로 감염하면, 모체 MV Schwarz 감염과 유사한 합포체 형성이 나타났으며(도 5), 따라서 천연 S를 발현하는 MV-ATU3-S와 비교하여 향상된 융합 활성의 부재가 확인되었다. 2P 안정화 돌연변이를 보유하는 모든 4개 작제물의 유전적 안정성은 ATU의 Sanger 시퀀싱 및 전장 바이러스 게놈의 NGS 시퀀싱에 의해 세포 배양에서 5회 계대 후 확인되었다.
ATU2의 천연 SARS-CoV-2 S를 발현하는 재조합 MV 클론은 모체 홍역 Schwarz보다 훨씬 더 낮은 역가로 성장했거나 구출 직후(P0) 또는 고역가 성장을 회복한 후속 계대 1(P1) 직후 스파이크 이식유전자에서 말도 안되는 보상 돌연변이가 발생했다. 이것은 완전히 코돈-최적화된 S 유전자가 ATU2 위치에 삽입될 때 불안정한 MV 벡터를 생성함을 나타낸다. 이에 대한 가능한 설명은 MV 복제에 의해 생성된 유전자 발현의 구배와 관련하여 하류측 ATU3 위치보다 상류측 ATU2 위치에서 유도된 증가된 S 발현 수준과 관련이 있을 수 있다(Plumet, 2005). 따라서, ATU2 위치에 삽입된 홍역-최적화 뉴클레오티드 서열에서 천연 및 변이 스파이크 단백질을 발현하는 홍역 벡터 작제물이 생성되었다(도 3c). 이들 작제물인 MV-ATU2-SMVopt, MV-ATU2-SMVopt2P, MV-ATU2-SMVoptΔF, MV-ATU2-SMVopt2PΔF는 107 TCID50 초과의 역가로 성장했다. 삽입체의 정확한 서열은 ATU의 Sanger 시퀀싱을 통해 확인되었으며, 이는 홍역-최적화된 S 유전자가 ATU2 위치에 삽입되었을 때 안정적인 MV 벡터를 현저하게 생성함을 나타낸다.
항원 발현
재조합 MV-감염 Vero 세포에서의 스파이크 발현은 SARS-CoV-1(Escriou 등, Virology, 2014) 또는 SARS-CoV-2의 재조합 S 단백질에 대해 생성된 다클론 토끼 항혈청을 사용한 웨스턴 블롯 분석에 의해 확인하였다. 도 4에 도시된 바와 같이, 전장 S 단백질의 발현을 나타내는 180kDa의 예상 겉보기 분자량을 갖는 모든 샘플이 경우 주요 밴드가 검출되었다. MV-ATU3-S 및 MV-ATU3-S2P로 감염된 세포로부터 제조된 용해물의 경우 각각 겉보기 분자량이 100 및 80 kDa인 작은 밴드가 검출되었으며, 이는 S가 S1 및 S2 도메인으로 부분적으로 절단되었음을 입증한다. 돌연변이(MV-ATU3-S2P3F) 또는 작은 포괄 루프의 결실(MV-ATU3-S2PΔF, MV-ATU3-S2PΔF2A)에 의한 푸린 절단 부위의 불활성화는 예상대로 절단을 폐지했다(도 4b). 또한, 스파이크 폴리펩티드의 발현은 비투과성 합포체의 간접 면역형광(IFA)에 의해 쉽게 검출되었으며, 이는 천연 및 돌연변이된 S가 표면으로 효율적으로 수송되었음을 나타낸다(도 5b).
ATU2에 홍역-최적화된 뉴클레오티드 서열(서열번호 36)을 삽입하면 ATU3에 완전히 코돈-최적화된 뉴클레오티드 서열이 삽입된 것과 유사한 발현 수준이 나타났다(도 13a). ATU3에서 완전히 코돈-최적화된 뉴클레오티드 서열로부터 발현된 스파이크 단백질과 동등하게, ATU2에서 발현된 SMVopt2P 단백질은 부분적으로 S1 및 S2로 절단된 반면, MV-ATU2-SMVoptΔF 및 MV-ATU2-SMVopt2PΔF에 의해 발현된 푸린 부위 결실이 있는 스파이크 단백질은 절단되지 않았다(도 13b).
면역원성
코로나19 백신의 면역원성은 홍역-벡터 백신의 평가에 적합한 소형 동물 모델인 129sv 1형 인터페론 수용체(인터페론-α/β 수용체, IFNAR)-결핍 마우스에서 평가했다. 모든 실험은 파리의 파스퇴르 연구소의 실험 동물 관리실 지침에 따라 승인 및 수행되었다. IFNAR KO 마우스는 파스퇴르 연구소 동물 시설에서 특정 병원균이 없는 조건 하에 수용하였다. 6 내지 10주령 IFNAR KO 마우스 6마리 그룹을 백신 후보의 1x105 TCID50으로 3 내지 4주 간격으로 2회 복강내 주사로 면역화하거나 1회만 면역화시켰다. 대조군으로서, 빈 MV 벡터 MV-Schwarz(1x105 TCID50)가 주입된 마우스 그룹이 각 연구에 포함되었다. 마우스 혈청은 1차 및 2차 주사 후 18 내지 21일에 수집하였다.
체액성 반응
체액성 반응을 평가하기 위해, SARS-CoV-2 및 MV-특이적 항체 반응을 간접 ELISA로 각 개별 마우스에 대해 평가했다. SARS-CoV-2 스파이크를 발현하는 상이한 재조합 홍역 바이러스로 면역화된 마우스는 홍역-특이적 ELISA에 의해 결정된 바와 같이 프라임 면역화 후 홍역 바이러스로 혈청변환되었다(도 6a). 항-홍역 반응은 시험된 모든 MV 작제물 및 모체 MV-Schwarz의 경우에 유사했으며, 이는 재조합 바이러스에 의한 이종 S 단백질의 발현이 생체내 복제를 변경하지 않고 홍역-특이적 면역원성을 변형시키지 않았음을 시사한다. 몇몇의 마우스는 1차 면역화에 반응하지 않거나 제대로 반응하지 않았지만 부스트 면역화 후에는 반응했다. 부스트 후, 항-MV 항체 수준은 마우스에 대한 이전 연구에서 예상한 대로 약 10배 증가했다.
또한, 항-홍역 항체로 반응한 MV-ATU3-S, MV-ATU3-S2P, MV-ATU3-S2P3F, MV-ATU3-S2PΔF, MV-ATU3-S2PΔF2A로 면역화된 모든 마우스는 SARS-CoV-2 스파이크 단백질의 엑토도메인에 대해 특이적인 ELISA에 의해 측정된 것으로, 프라임 후 104 범위에서 높은 역가의 스파이크-특이적 항체와 반응했다(도 6b). 부스트 후, 항-MV 항체에서 볼 수 있는 바와 같이 항-S 항체 수준이 약 10배 증가하였다. 대조적으로, 빈 MV-Schwarz로 면역화된 대조군 마우스는 모두 음성으로 테스트되었다. 통계적으로 유의하지는 않지만, MV-AUT3-S 및 MV-ATU3-S2P에 의해 유도된 것과 비교하여, 퓨린 절단 부위가 비활성화된 작제물(MV-ATU3-S2P3F, MV-ATU3-S2PΔF 및 MV-ATU3-S2PΔF2A)에 의해 유도된 항-S 항체 수준이 더 높은 경향이 약간 있었다.
항-SARS-CoV-2 중화 항체는 미세중화 분석을 사용하여 검출되었다. SARS-CoV-2 S를 발현하는 모든 재조합 MV는 1회의 면역화 후에 중화 항체를 유도했다(도 7).
도 7에 나타내고 추가 실험(데이터는 나타내지 않음)에서 반복된 바와 같이, 하기 작제물로 면역화된 마우스에서 프라임 후 중화 역가가 증가하는 경향이 있었다: MV-ATU3-S < MV-ATU3-S2P < MV-ATU3- S2P3F < MV-ATU3-S2PΔF/MV-ATU3-S2PΔF2A. 부스트 후, 중화 역가는 10배 이상 증가했다. 푸린 절단 부위가 비활성화된 SARS-CoV-2 S를 발현하는 모든 재조합 MV는 부스트 후 유사한 중화 항체 수준을 유도하고 MV-ATU3-S 및 MV-ATU3-S2P보다 더 높은 수준을 유도한다. MV-ATU3-S2P 및 MV-ATU3-S2P3F의 부스트 후 중화 역가 간의 차이는 통계적으로 유의하다(p=0.0216 Mann-Whitney 테스트). 이것은 플라크 감소 중화 테스트 90(PRNT90)에 의해 확인되었다.
2020년 3월 18일 ICMRA(International Coalition of Medicinal Regulatory Agencies)의 권고에 따르면, SARS-CoV-1 백신 후보를 가진 동물 모델에서 관찰된 잠재적인 질병 증진의 위험을 완화하기 위해 Th1 반응의 유도를 확보하는 것이 중요하다. IgG 이소타입 분석을 통해 진행 중인 CD4+ 헬퍼 T 세포 반응이 1형(Th1) 또는 2형(Th2) 반응으로 편향되는 첫 번째 징후를 얻을 수 있으므로, IgG2a 대 IgG1 항체 역가의 비율은 이소타입 특이적 항-S ELISA로 측정하였다. 도 11a 및 11b에 도시된 바와 같이, 이 분석은 MV-ATU3-S, MV-ATU3-S2P, MV-ATU3-S2P3F, MV-ATU3-S2PΔF 및 MV-ATU3-S2PΔF2A가 모두 Th1 반응을 나타내는 IgG1 수준보다 더 높은 IgG2a를 유도함을 나타내었다. 대조 실험은 wt 129/Sv 마우스를 명반-보조된 삼량체화된 스파이크 엑토도메인으로 면역화하여 수행했다. 프라임 및 부스트 후 이들 마우스는 IgG2a 항체 역가보다 훨씬 더 높은 IgG1을 가졌고(도 11c 및 도 11d), 이는 유도된 면역 반응은 명반-보조 SARS-CoV-1 스파이크 엑토도메인으로 면역화한 후 이전에 관찰된 바와 같이 주로 Th2 유형임을 나타낸다(Escriou, 2014).
항-MV ELISA, 항-S ELISA 및 SARS-CoV-2 미세중화에 의해 평가된 MV-ATU3-S 및 MV-ATU2-SMVopt의 면역원성을 비교한 결과 1차 및 2차 면역화 후 두 홍역 벡터 바이러스에 의해 유도된 항체 반응에 차이가 없었다(도 14).
T 세포 반응
비장 T 세포 반응을 분석하여 T 헬퍼 세포 반응의 유형과 세포독성 T 세포 반응을 직접 평가했다. S 단백질-특이적 T 세포 반응은 부스트 면역화 후 19 내지 25일에 비장세포에서 측정하였다. T 세포는 각각 10개의 아미노산 중첩을 갖는 15-mer 펩티드를 함유하는 스파이크 단백질의 S1 및 S2 도메인의 전체 길이에 걸쳐 있는 펩티드 풀로 자극하였다. 대조군으로서, CD8+ T 세포에 특이적인 2개의 홍역 펩티드의 풀을 사용하여 홍역 특이적 반응을 평가하였다(Reuter 등, PLoS ONE, 2012, 7(3), e33989, 1-8).
IFN-γ 생성 T 세포는 MV-ATU3-S2PΔF2A로 면역화된 마우스에서 ELISpot에 의해 열거되었으며 S 단백질에 걸쳐 있는 펩티드에 대한 세포 반응을 입증했다(도 8). 홍역 벡터 골격에 대한 세포 반응도 확인하였다(도 8).
CD4+ T 세포 및 CD8+ T 세포에 의한 사이토카인 생산은 유세포 분석에 의해 분석된 세포내 사이토카인 염색을 특징으로 하였다. 마우스를 MV-ATU3-S, MV-AUT3-S2P, MV-AUT3-S2P3F, MV-ATU3-S2PΔF, MV-ATU3-S2PΔF2A 또는 모체 MV Schwarz 균주로 면역화시켰다. SARS-CoV-2 스파이크 단백질을 발현하는 재조합 MV로 면역화된 모든 마우스에서 비장세포의 세포내 사이토카인 염색은 전체 S 단백질에 걸쳐 있는 S1 및 S2 펩티드 풀에 대한 반응으로 IFN-γ 및 TNF-α 이중 양성 CD8+ 및 CD4+ T 세포를 검출했다. 이것은 이들 T 세포의 기능적 상태를 나타내고 S-특이적 Th1-유형 반응이 백신 후보에 의해 유도되었음을 확인하였다(도 9, 패널 A 및 B). 또한, 홍역 벡터 백본에 대한 CD8+ T 세포 반응은 재조합 후보 및 모체 MVSchw를 투여 받은 마우스에서 IFN-γ 및 TNF-α 이중 양성 CD8+ T 세포를 입증함으로써 확인되었다(도 9, 패널 A 및 C). 대조적으로, Th2 반응의 특징인 IL-5 및 IL-13을 발현하는 S-특이적 T 세포의 극미한 부분만이 재조합 후보 중 하나를 투여 받은 마우스에서 검출되었다(도 9, 패널 A 및 B).
T 세포 반응을 더 자세히 특성규명하기 위해, S 펩티드 풀(도 10, 패널 B 및 D)에 반응하여 단일 사이토카인을 생성하는 T 세포를 이중 사이토카인 양성 T 세포외에도 MV-ATU3-S2PΔF2A 및 모체 MV Schwarz로 면역화된 마우스에서 평가했다(도 10, 패널 A 및 C, 동일한 결과가 도 9에도 포함되어 있다). TNF-α 생성 CD4+ T 세포만이 MVSchw 대조군으로 면역화된 마우스보다 MV-ATU3-S2PΔF2A로 면역화된 마우스에서 더 높은 빈도로 존재하였다(도 10, 패널 B). 다른 모든 CD4+ 및 CD8+ 단일 사이토카인 생성 T 세포는 MV-ATU3-S2PΔF2A 및 MWSchw 면역 마우스에서 유사한 빈도로 발견되었으며(도 9, 패널 B 및 D), 이는 이러한 반응이 스파이크 단백질에 특이적이지 않다는 것을 나타낸다.
종합하면, 이러한 결과는, S 단백질의 에피토프를 표적으로 하는 기능적 Th1형 T 세포 반응은 MV-ATU3-S, MV-AUT3-S2P, MV-AUT3-S2P, MV-AUT3-S2P3F, MV-ATU3-S2PΔF 및 MV-ATU3-S2PΔF2A를 비롯한, SARS-CoV-2 스파이크 단백질을 발현하는 재조합 MV로서의 면역화 후에 유도된다는 것을 나타냈다. 이 반응은 IFN-γ 및 TNF-α 생성 CD8+ T 세포와 IFN-γ 및 TNF-α 생성 CD4+ T 세포의 우세한 유도를 특징으로 한다.
SARS-CoV-2 챌린지에 대한 보호
SARS-CoV-2에 의한 실험적 챌린지에 대한 보호를 유도하기 위한 홍역 벡터 작제물의 가능성을 평가하기 위해, 본 발명자들은 SARS-CoV-2에 의한 후속 감염을 가능하게 하기 위해 IFNAR-KO 마우스의 폐에서 인간 ACE2 수용체의 일시적 발현 모델을 사용하였다(Ku 등, 2021).
프라임 및 부스트 면역화 후 보호를 평가하기 위해, 마우스를 MV-ATU3-S, MV-ATU3-S2P, MV-ATU3-S2PΔF, MV-ATU3-S2PΔF2A, 또는 대조군으로서 모체 MV Schwarz 균주로 면역화시켰다.
2차 면역접종 25일 후 마우스에 AD5:hACE2를 주입하고 4일 후 SARS-CoV-2 2x104 pfu를 비강에 접종했다. 폐에서 SARS-CoV-2 바이러스의 존재는 게놈 등가물(GEQ) RNA 수준을 측정하는 RT-qPCR과 Vero 세포에서 감염성 바이러스의 정량화에 의해 평가하였다. 도 12의 패널 A에 나타낸 바와 같이, 모든 홍역 벡터 작제물은 MVSchw 모체 바이러스와 비교하여 폐의 바이러스 부하을 유의하게 감소시켰다. GEQ는 MV-ATU3-S, MV-ATU3-S2P에 의해 약 1.5 로그, MV-ATU3-S2PΔF 및 MV-ATU3-S2PΔF2A에 의해 2.5 로그 만큼 감소했다. 또한, MV-ATU3-S와 MV-ATU3-S2P를 면역화된 군에서 각각 1마리씩, 특히 면역반응이 좋지 않고 중화항체역가가 매우 낮은 마우스에서만 감염성 바이러스가 낮은 잔류역가로 검출되었다. 그리고 MV-ATU3-S2PΔF 및 MV-ATU3-S2PΔF2A로 면역화된 마우스에서는 그렇지 않았다. 이러한 결과는 모두 재조합 MV를 사용한 백신 접종이 동물의 폐에서 바이러스 부하을 유의하게 감소시켰고 특히 감염성 바이러스의 존재가 예방되었음을 보여주었다. 주목할만한 것은, 보호 효율이 중화 항체 수준의 유도에 대해 관찰된 계층 구조를 따랐다는 것인데, MV-ATU3-S2PΔF 및 MV-ATU3-S2PΔF는 MV-ATU3-S 및 MV-ATU3-S2P보다 더 나은 보호를 제공한다.
현저하게, GEQ(p=0.0149) 및 PFU(p=0.0253)의 수준에 의해 평가된 바와 같이, 챌린지 9일 전에 채취한 혈액 샘플에서 중화 항체 역가의 수준은 개별 마우스(어떤 면역원이든)의 보호 효율과 반비례했다. 이는 혈액 내 중화 항체 수치가 감염 후 SARS-CoV-2 복제 감소에 직간접적으로 기여함을 시사한다.
프라임 및 부스트 면역화 후의 유망한 결과에 기초하여, 프라임 후의 보호는 MV-ATU3-S2PΔF2A로 면역화된 마우스에서 평가하였다. 또한, 이 실험은 1차 면역화 후 최대 165일까지 항체 반응의 수명을 조사하도록 설계되었다. 프라임 후 약 6개월에 측정된 미세중화 역가(도 12, 패널 B, μNT)는 103 범위로 높았지만 이 벡터로 추가 면역화한 후 도달한 수준보다 약 10배 낮았다(도 12, 패널 A, μNT). 챌린지 및 바이러스 부하 분석을 위에서 설명한 대로 수행했다. 2 로그만큼 GEQ/폐의 유의한 감소가 관찰되었다(도 12, 패널 B). 전염성 SARS-CoV-2 바이러스는 MV-ATU3-S2PΔF2A로 면역화된 마우스 6마리 중 1마리의 폐에서 매우 낮은 역가로만 회수되었으며, 이는 MV-ATU3-S2PF2A로만 1차 면역시킨 후의 강력한 보호를 입증한다.
또한, 프라임후 만의 보호는 MV-ATU3-S2P로 면역화된 마우스 및 대조군으로서 빈 벡터 MV-Schwarz로 면역화된 마우스와 비교하여 MV-ATU3-S2PΔF2A로 면역화된 마우스에서 평가하였다. 이 실험은 프라임 면역화 4주 후에 단기 보호를 조사하도록 설계되었다. 도 6b에 도시된 실험에서 이미 확인된 바와 같이, MV-ATU3-S2P 및 MV-ATU3-S2PF2A로 면역화된 모든 마우스는 ELISA에 의해 측정된 바와 같이 104 범위로 높은 역가의 홍역 특이적 및 스파이크 특이적 항체와 반응했다(도 17, 패널 A). 유의하게 더 높은 중화 항체 수준(p=0.0087 Mann-Whitney)은 2P-안정화된 S [2.1±0.2 log10(NT 역가)]를 갖는 MV-ATU3-S2P에 의해 유도된 것과 비교하여 불활성화된 푸린 절단 부위[ 2.6±0.1 log10(NT 역가)]를 갖는 MV-ATU3-S2PΔF2A 작제물에 의해 유도되었다.
SARS-CoV-2에 의한 챌린지로부터의 보호는 위에서 설명한 대로 평가하였다. 도 17의 패널 B에 나타낸 바와 같이, 홍역 벡터 작제물 둘 다를 사용한 면역화는 MVSchw 모체 바이러스와 비교하여 폐의 바이러스 부하를 유의하게 감소시켰다. GEQ RNA 수준은 MV-ATU3-S2P에 의해 약 0.8 log 만큼, MV-ATU3-S2PΔF2A에 의해 1.3 log 만큼 감소되었다. 또한, 감염성 바이러스는 MV-ATU3-S2P로 면역된 6마리 마우스의 절반, 특히 가장 낮은 중화 항체 역가를 갖는 마우스에서만 낮은 잔류 역가로 검출되었다. MV-ATU3-S2PΔF2A로 면역화된 마우스에서는 감염성 바이러스가 검출되지 않았다.
종합하면, 이 실험은 재조합 MV를 사용한 백신접종이 프라임 면역화 후 빠르면 4주에 동물의 폐에서 바이러스 부하를 유의하게 감소시킴을 보여주었다. 또한 보호 효율성이 중화 항체 수준의 유도에 대해 관찰된 계층 구조를 따른다는 것을 확인하였다. 즉, MV-ATU3-S2PΔF2A는 MV-ATU3-S2P보다 프라임 후에 더 나은 보호를 제공한다.
SARS-CoV-2 S6P, 6P3F 및 6PΔF 단백질을 발현하는 재조합 MV Schwarz 바이러스의 향상된 면역원성 및 보호 가능성
스파이크 단백질을 더욱 안정화하기 위한 노력의 일환으로, 스파이크 단백질 변이체는 "6P" 돌연변이(F817P, A892P, A899P, A942P, K986P, V987P)를 위에서 설명한 "3F" 돌연변이(R682G+R683S+R685G) 또는 "ΔF" 결실(서열번호 50의 Q675-R685 루프)과 조합함으로써 설계되었다(도 2). 전술한 변형 및 이들의 조합을 갖는 변이체 스파이크 단백질을 암호화하는 변형된 스파이크 유전자를 생성하고 pKM-MVSchw-ATU3 벡터에 삽입하였다. 얻어지는 pKM3-S6P 플라스미드를 사용하여 상기한 바와 같이 헬퍼 세포 기반 시스템을 사용하여 단일 재조합 MV-ATU3-S6P 백신 후보를 성공적으로 구출하였다. MV-ATU3-S6P 바이러스 클론은 Vero NK 세포에서 증식되었고 107 TCID50/mL 이상의 높은 역가로 성장했으며, ATU의 Sanger 시퀀싱에 의해 유전적으로 안정적인 것으로 확인되었다. Vero NK 세포를 MV-ATU3-S6P로 감염시키면 모체 MV Schwarz(도시하지 않음) 감염과 유사한 합포체 형성이 발생했으며, 이는 천연 S를 발현하는 MV-ATU3-S에서 관찰된 향상된 융합 활성의 부재를 나타내며, 따라서 융합전 상태에서 S6P의 효율적인 잠금이 확인된다. S 발현은 MV-ATU3-S6P의 각 클론으로 감염된 세포에서 입증되었으며 S1 및 S2 도메인으로의 부분적 절단을 보여주었다(도 15A). 주목할만한 것은 MV-ATU3-S, MV-ATU3-2P 및 MV-ATU3-S6P로 감염된 세포에서 유사한 발현 수준이 관찰되었다는 것이다. 이것은 HEK293T 세포에서 일시적인 발현 시 S2P의 발현 수준과 비교한 S6P의 분비 및 절단되지 않은 엑토도메인에 대해 Hsieh 등(Science, 2020)에 의해 관찰된 실질적으로 더 높은 발현 수준과 대조된다. MV-ATU3-S6P 발현 수준이 2P의 범위에 있다는 사실은 S2P와 S6P의 고유 면역원성 특성의 비교 평가를 가능하게 할 것이다. MV-ATU3-S6P3F 및 MV-ATU3-S6PF는 감염된 Vero NK 세포에서 S6P 항원의 절단되지 않은 및 전장 형태(S6P3F, S6PΔF)의 발현을 입증하기 위해 본질적으로 상기 기재된 바와 같이 구출되고 특성규명될 것이다.
MV-ATU3-S6P로 면역화된 대부분의 마우스는 ELISA에 의해 측정된 바와 같이 104 범위의 높은 역가의 홍역 특이적 및 스파이크 특이적 항체로 프라이밍 후에 반응했다(도 15, 패널 B 및 C). SARS-CoV-2 중화 역가는 102 범위에 있었다(도 15, 패널 D). 프라임 후 홍역 반응 마우스 중에서, 하기의 작제물로 면역화된 마우스에서 SARS-CoV-2-특이적 ELISA의 증가 및 역가 중화의 경향이 있었다: MV-ATU3-S2P [3.8±0.1 log10(ELISA 역가); 1.5±0.2 log10(NT 역가)] < MV-ATU3-S6P [4.1±0.1 log10(ELISA 역가); 2.1±0.2 log10(NT 역가)] < MV-ATU3-S2PF [4.6±0.3 log10(ELISA 역가); 2.5±0.3 log10(NT 역가)]. MV-ATU3-S2P 및 MV-ATU3-S6P 프라임 후 중화 역가 간의 차이는 통계적으로 유의하다(p=0.0079 Mann-Whitney 테스트).
부스트 후, 항-MV 항체에 대해 관찰된 바와 같이 그리고 홍역 플랫폼에 의해 벡터화된 대부분의 스파이크 변이체에 대해 이미 언급된 바와 같이, 항-S 항체 수준이 약 10배 증가했다. 통계학적으로 유의하지는 않지만, MV-ATU3-S6P[3.9±0.1 log10(NT titers)]는 MV-ATU3-S2P[3.5±0.3 log10(NT titers)]보다 부스트 후 약간 더 높은 중화 항체 수준을 유도하고 MV-ATU3-S2PΔF(4.1±0.2 log10(NT 역가)보다 낮은 수준을 유도했다.
챌린지 및 폐 바이러스 부하의 분석을 상기 기재된 바와 같이 부스트 면역화 4주 후에 수행하였다. 도 15의 패널 E에 나타낸 바와 같이, 모든 홍역 벡터 작제물은 MVSchw 모체 바이러스에 비해 폐의 바이러스 부하를 유의하게 감소시켰다. GEQ RNA 수준은 MV-ATU3-S2P에 의해 약 1.7 log 만큼, MV-ATU3-S6P 및 MV-ATU3-S2PΔF2A에 의해 2.2 log 만큼 감소했다. 주목할만한 것은, 보호 효율이 중화 항체 수준의 유도에 대해 관찰된 경향을 따랐다는 것이다. MV-ATU3-S2PΔF는 MV-ATU3-S2P 및 MV-ATU3-S6P보다 약간 더 나은 보호를 제공한다.
이러한 실험으로부터, 우리는 S6P가 S2P 항원보다 중화 항체의 유도 측면에서 더 나은 성능을 발휘한다는 결론을 내렸습니다. 두 항원이 홍역 벡터로부터 유사한 수준으로 발현된다는 사실을 감안할 때, 이는 S6P가 S2P보다 융합전 상태에서 더 효율적으로 고정되고/되거나 더 높은 안정성을 갖는다는 것을 시사한다. "3F" 돌연변이 및 "F" 결실이 중화 항체 유도를 위해 "2P" 돌연변이와 상승 작용한다는 사실을 감안할 때, 우리는 이것이 "6P" 돌연변이의 경우일 수 있고 MV-ATU3- S6P3F 및 MV-ATU3-S6PF는 각각 MV-ATU3-S6P 및 MV-ATU3-S2P3F 및 MV-ATU3-S2PΔF보다 보호 중화 항체 유도에 더 나은 성능을 보인다는 것을 확인했다.
폐쇄 형태로 안정화된 SARS-CoV-2 스파이크 변이체를 발현하는 재조합 MV Schwarz의 면역원성 및 보호 가능성
SARS-CoV-2에 대한 보호 항체 반응을 유도하기 위한 대안적 접근법으로서, 본 발명자들은 단일/이중 프롤린 치환에 의해 융합전 상태에 잠겨 있고 추가로 이황화 결합에 의해 폐쇄 구조에서 공유적으로 안정화된 전장 SARS-CoV-2 스파이크 변이체를 설계했다. 여기에는 위에서 설명한 "2P" 또는 "6P" 돌연변이와 이중 S383C/D985C "CC" 돌연변이(SCCPP 및 SCC6P)의 조합이 포함되지만 이에 제한되지는 않는다. 이 "CC" 돌연변이는 McCallum 등, Henderson 등, Xiong 등(2020)에 의해 독립적으로 보고되었으며 다운 형태의 RBD와 닫힌 형태의 스파이크 엑토도메인을 효율적으로 안정화시키는 것으로 확인되었다. 대안적으로, 본 발명자들은 이중 G413C/P987C "CC2" 돌연변이와 임의의 융합전 안정화 돌연변이를 조합할 수 있으며, 이는 또한 Xiong 등에 의해 폐쇄 형태로 스파이크를 안정화시키는 것으로 확인되었다. 또한, 본 발명자들은 이황화 결합의 단독 첨가에 의해 공유적으로 안정화된 SARS-CoV-2 스파이크 변이체에 의존할 수 있고 이러한 이중 시스테인 돌연변이자체가 폐쇄된 융합전 형태로 스파이크를 안정화할 수 있다는 가설을 세울 수 있다.
주목할만한 것은, 푸린 절단 부위가 상기 기재된 SCCPP 및 SCC6P 작제물에서 불활성화되지 않고, 본 발명자들은 RBD 폐쇄 상태가 이들 작제물에서 절단 부위의 접근을 제한할 수 있어 푸린-매개 단백질분해에 내성이 있게 할 것으로 예상한다는 점이다. 대안적으로, 스파이크 단백질을 추가로 안정화시키기 위한 노력으로, 스파이크 단백질 변이체는 "SCCPP" 또는 "SCC6P" 돌연변이를 상기 특성규명된 "3F" 돌연변이 또는 "F" 결실과 조합함으로써 설계될 수 있다.
전술한 변형 및 이들의 조합을 갖는 변이체 스파이크 단백질을 암호화하는 변형된 스파이크 유전자가 생성되어 pKM-MVSchw-ATU3 벡터에 삽입된다. 상응하는 백신 후보는 본질적으로 상기 기재된 바와 같이 구출되고 특성규명될 수 있다. 이러한 MV 작제물은 다운 형태의 RBD와 폐쇄 형태의 절단되지 않은 전체 길이 스파이크를 발현할 수 있고 대부분 폐색될 수 있다. 발현된 닫힌 스파이크는 SARS-CoV-2의 ACE-2 수용체에 대해 훨씬 감소된 결합 친화도를 가질 수 있으며, 이는 본 발명자들이 MV-ATU3-S에 대해 관찰되고 잠재적인 안전 위험으로 간주한 향상된 융합성 표현형을 방지하기 때문에 홍역 플랫폼에 의한 벡터화에 대한 주요 이점이다.
IFNAR-KO 마우스에서 이러한 백신 후보의 면역원성과 보호 가능성을 평가할 수 있다. "닫힌" 스파이크를 발현하는 MV 작제물은 ACE-2 결합을 방지하는 중화 RBD 특이적 항체의 수준이 더 낮고 하향 위치에서 RBD에 결합하는 항체의 수준이 더 높으면서 천연 단백질(예: S2P)에 대해 발생하는 것과 다른 면역 반응을 유도할 수 있다.
분비된 형태의 SARS-CoV-2 스파이크를 발현하는 재조합 MV Schwarz의 면역원성 및 보호 가능성
SARS-CoV-2에 대한 보호 반응을 유도하고 전장 스파이크를 발현하는 MV 후보에 대해 본 발명자들이 관찰한 강화된 융합형성 표현형을 피하기 위한 대안적 접근으로서, 본 발명자들은 S의 가용성 및 분비 형태로서 스파이크 엑토도메인을 발현하는 MV 후보를 평가하였다.
완전히 코돈-최적화된 스파이크 유전자로부터 여러 작제물을 조작했으며 그 중 몇몇은 일시적인 발현 분석을 위해 먼저 C-말단 Twin-Strep-Tag를 사용하여 pCI 플라스미드(Promega)에 클로닝했다. 이러한 작제물은 도 18A에 도식화되어 있으며 다음을 포함한다.
- 전장 엑토도메인(Secto: M1-K1211)에 해당하는 가용성이고 가장 가능성 있는 단량체 형태의 스파이크. 이의 디자인은 MV 플랫폼으로 성공적으로 발현된 SARS Sol 보호 면역원과 유사하다(Escriou 등, 2014).
- 시작 메티오닌으로부터 예측된 RRAR 푸린 절단 부위 바로 앞에 있는 프롤린 681까지의 S 엑토도메인의 가용성 및 단량체성 S1 영역(M1-P681).
- Ser-Gly-Gly 연결 링커를 통해 GCN4 또는 T4 피브리틴 폴돈에 융합된 전장 엑토도메인에 해당하는 스파이크(tri-Secto)의 가용성 및 삼량체 형태.
- 이중 K986P 및 V987P "2P" 돌연변이(tristab-Secto), "3F" 돌연변이(R682G+R683S+R685G) 및/또는 "ΔF" 결실(서열번호 50의 Q675-R685 루프)을 포함하는 tri-Secto의 안정화된 변이체.
HEK 293T 세포를 pCI-Spike_ectomain 플라스미드 DNA 세트로 일시적으로 형질감염시키거나, 대조군으로서 스파이크의 전장 변이체를 암호화하는 pCI-S2P, pCI-S2PF 및 pCI-S3F 플라스미드 DNA로 형질감염시켰다. 상청액을 형질감염 후 48시간에 수집하고 스파이크 엑토도메인 분비를 항-StrepTag 모노클로날 항체를 사용한 웨스턴 블롯 분석에 의해 비교하였다. (삼량체화된) 엑토도메인의 가용성 형태만이 상청액에서 검출되었으며, 이는 막횡단 및 C-말단 세포질 도메인이 절단될 때 효율적인 분비를 나타낸다(도 18B). S1/S2 절단 부위가 "3F" 돌연변이 또는 "F" 결실로 불활성화되었을 때와 T4 폴돈 대신 GCN4 폴돈이 사용되었을 때 상청액에서 더 높은 수준의 스파이크가 검출되었다. 전체 세포 추출물의 발현 수준이 모든 작제물에 대해 동일한 범위에 있었기 때문에(도시되지 않음), 이는 비절단 및 GCN4-삼량체화된 엑토도메인의 배양 배지에서의 보다 효율적인 분비 또는 증가된 안정성을 시사한다.
T4-S2P3F, GCN4-S2P3F 및 T4-S2P 폴리펩티드를 일시적으로 형질감염된 Expi293F 세포의 상청액으로부터 StrepTactin 컬럼에서 친화성 크로마토그래피로 정제하고 Superdex200 컬럼에서 크기 배제 크로마토그래피로 분리했다(도 18C). 용리 프로파일은 280nm(mAU)에서의 흡광도에 의해 기록되었으며 T4-S2P3F는 단독 삼량체로만 구성된 반면 GCN4-S2P3F 및 T4-S2P는 상당한 비율의 이량체 및 이량체/단량체를 각각 포함한다는 것을 나타냈다.
종합하면, 이러한 결과는 T4 폴돈이 "2P" 돌연변이 및 S1/S2 절단 부위의 불활성화와 조합될 때 가장 효율적인 분비 및 동종삼량체 폴딩이 얻어짐을 나타낸다.
개념 증명으로서, 천연 스파이크 엑토도메인(Secto)을 암호화딩하는 완전히 코돈-최적화된 cDNA와 삼량체화된 엑토도메인 변이체의 최고 성능 T4-S2P3F 작제물(위에 설명된 일시적 발현 시스템에서 분석됨)을 BsiWI/BssHII-절단된 pKM-MVSchw-ATU3에 삽입했다. 해당 MV-ATU3-Secto 및 MV-ATU3-T4-S2P3F 백신 후보는 위에서 설명한 대로 헬퍼 세포 기반 시스템을 사용하여 효율적으로 구출되었다. 독립적인 바이러스 클론은 Vero NK 세포에서 증식되었고 107 TCID50/mL 이상의 높은 역가로 성장했다. 삽입체의 정확한 서열은 ATU의 Sanger 시퀀싱에 의해 확인하였으며, 이는 S의 분비된 형태를 암호화하는 cDNA를 홍역 벡터에 삽입하면 유전적으로 안정적인 MV 재조합체가 얻어진다는 것을 나타낸다. MV-ATU3-Secto 및 MV-ATU3-T4-S2P3F를 사용한 Vero NK 세포의 감염은 모체 MV Schwarz(표시되지 않음) 감염과 유사한 합포체 형성을 초래였는데, 이는 양호한 적합성과 예상대로 이들 바이러스의 강화된 융합 활성의 부재를 나타낸다.
재조합 MV로 감염된 Vero 세포에서 스파이크 엑토도메인 발현 및 분비는 SARS-CoV-2의 재조합 S 단백질에 대해 생성된 다클론 토끼 항혈청을 사용한 웨스턴 블롯 분석에 의해 확인하였다(미공개). 예상대로, 전장 S2P3F 단백질은 세포 용해물에서만 검출되었다(도 19의 중간 패널). 대조적으로, Secto 및 T4-S2P3F는 감염 후 39시간에 감염된 Vero 세포의 용해물 및 상청액 모두에서 명확하게 검출되어, 효율적인 분비가 확인되었다(도 19의 상단 및 중간 패널). 일관되게, 세포 배양 배지에서 분비된 Secto 및 T4-S2P3F 단백질은, 분비 전에 ER에서 Golgi로 이동할 때 성숙을 겪는 당단백질과 일치하게, 세포 용해물 내에서 관찰된 상대 분자보다 더 높은 겉보기 분자량으로 이동했다. 주목할만한 것은, T4-S2P3F가 Secto보다 감염된 세포의 용해물 및 상청액에서 현저히 더 높은 수준으로 존재했으며, 이는 T4 폴돈-매개 삼량체화가 "2P" 돌연변이 및 S1/S2 절단 부위의 불활성화와 조합될 때 S 엑토도메인의 더 정확한 접힘 및/또는 증가된 안정성을 확인시켜준다.
MV-ATU3-T4-S2P3F의 면역원성은 CD4+ 및 CD8+ T 세포 반응뿐만 아니라 중화 항체 반응의 유도와 관련하여 전장 작제물에 대해 설명된 바와 같이 IFNAR-KO 마우스에서 조사할 수 있다. Th1 편향 반응의 유도 및 분비된 T4-S2P3F 대 막 고정 S2P3F에 의해 유도된 반응의 미세 조정의 평가를 확인할 수 있다. 보호의 효율성은 Ad5:Ace2로 비강 내 형질도입 및 SARS-CoV-2로 챌린지한 후 폐 바이러스 부하를 정량화하여 평가할 수 있다.
단독으로 또는 SARS-CoV-2 스파이크와 조합하여 SARS-CoV-2 핵단백질을 발현하는 재조합 MV Schwarz의 면역원성 및 보호 가능성
pKM2-nCoV_NP 또는 pKM-ATU2-N으로 약칭되는 플라스미드 pKM-ATU2-N_2019-nCoV(2019-nCoV=SARS-CoV-2)는 "플라스미드 벡터 작제물 및 백신 후보 구출"이라는 제목의 섹션에 설명되어 있으며, MV Schwarz 게놈의 인단백질과 기질 유전자 사이에 추가 전사 단위를 포함하는 BsiWI/BssHII-절단된 pKM-MVSchw-ATU2에 완전히 코돈-최적화된 SARS-CoV2 핵단백질(N) cDNA(서열번호 21)를 삽입하여 생성하였다. pKM-ATU2-NMVopt는 뉴클레오티드 조성 및 트랜스진의 발현 수준을 미세 조정하고 재조합 홍역 바이러스의 향상된 적합성 및 안정성을 촉진하기 위한 노력의 일환으로 홍역 최적화 서열(서열번호 37)을 사용하여 유사하게 생성하였다.
pKM-ATU2-N 및 pKM-ATU2-NMVopt 플라스미드는 위에서 설명한 대로 헬퍼 세포 기반 시스템을 사용하여 단일 재조합 MV-ATU2-N 및 MV-ATU2-NMVopt 백신 후보를 성공적으로 구출하는데 사용되었다. 독립적인 바이러스 클론은 Vero NK 세포에서 증식되었고 107 TCID50/mL 이상의 높은 역가로 성장하였다. 삽입체의 정확한 서열은 ATU의 Sanger 시퀀싱으로 확인하였으며, 이는 ATU2 위치에 삽입된 완전히 코돈-최적화된 SARS-CoV-2 N 유전자와 홍역-최적화된 SARS-CoV-2 N 유전자 모두 안정적인 MV 벡터의 생산을 현저하게 가능하게 함을 나타낸다. MV-ATU2-N 및 MV-ATU2-NMVopt를 사용한 Vero NK 세포의 감염은 모체 MV Schwarz(도시되지 않음) 감염과 유사한 합포체 형성을 초래하여, 이러한 바이러스의 양호한 적합성이 확인되었다.
재조합 MV에 감염된 Vero 세포에서 SARS-CoV-2 핵단백질 발현은 SARS-CoV-2 N 단백질(미공개)에 대해 생성된 다클론 토끼 항혈청을 사용한 웨스턴 블롯 분석에 의해 확인하였다. 도 20에 도시된 바와 같이, 포화 검출 수준에 가까운 매우 높은 강도의 주요 밴드가 45 kDa의 예상 겉보기 분자량을 갖는 모든 샘플에 대해 검출되어서, 전장 N 단백질의 발현을 확인하였다. 주요 밴드의 강도는 MV-ATU2-N보다 MV-ATU2-NMVopt가 더 강했다. 저분자량의 다른 밴드도 MV-ATU2-NMVopt에 대해 관찰되었는데 이는 아마도 사소한 분해 단편에 해당할 것이다. 종합하면, SARS-CoV-2 핵단백질이 홍역 벡터의 ATU2에 삽입된 완전히 코돈-최적화된 유전자 및 홍역-최적화된 유전자로부터 효율적으로 발현되었고 완전히 코돈-최적화된 유전자가 핵단백질의 더 높은 발현을 유도했을 가능성이 가장 높은 것으로 확인되었다.
MV-ATU3-N 및 MV-ATU3-NMVopt의 면역원성은 CD4+ 및 CD8+ T 세포 반응의 유도를 모니터링함으로써 MV-S 작제물에 대해 설명된 바와 같이 IFNAR-KO 마우스에서 조사할 수 있다. IFN-γ 생성 T 세포는 N 단백질에 걸쳐 있는 펩티드 풀에 의한 자극 후 ELISpot에 의해 열거될 수 있다. CD4+ T 세포 및 CD8+ T 세포에 의한 사이토카인 생산은 유세포 분석에 의해 분석된 세포내 사이토카인 염색을 특징으로 할 수 있으므로, 본 발명자들은 Th1 편향 반응의 유도를 확인할 수 있다. 보호의 효율성은 Ad5:Ace2의 비강 내 형질도입 및 SARS-CoV-2의 챌린지 후 폐 바이러스 부하를 정량화하여 평가할 수 있다.
플라스미드 pKM-ATU2-N 및 임의의 pKM3-Spike 작제물, 특히 S6P 및 유래된 변이체(S6P3F, S6PF 및 SCC6P)는 SalI 제한 효소로 절단되고 라이게이션되어, 완전히 코돈 최적화된 SARS-CoV N 및 S 유전자를 포함하는 일련의 이중 재조합 pKM-N&S 플라스미드를 생성할 수 있다. 유사한 pKM-NMVopt&SMVopt 플라스미드는 홍역-최적화된 SARS-CoV N 및 S 유전자를 이용하여 제작할 수 있다. 이들 플라스미드는 이중 재조합 MV-N&S 백신 후보를 구출하는데 사용될 수 있으며, 이는 위에서 설명한 바와 같이 시험관 내에서 비교적 특성규명될 수 있다. 면역원성은 N 및 S 펩티드 풀을 표적으로 하는 CD4+ 및 CD8+ T 세포 반응의 유도 및 중화 항체의 유도와 관련하여 단일 재조합 구조에 대해 설명된 바와 같이 IFNAR-KO 마우스에서 조사할 수 있다. 임상 연구 결과는 SARS-CoV-2 감염 회복에 있어 체액성 면역과 세포 매개 면역 모두에 대한 보호 역할을 제안하였기 때문에(Del Valle, 2020), 이중 재조합 MV-N&S 백신 후보가 이의 단일 재조합 모체 후보보다 SARS-CoV-2의 비강 내 챌린지에 대해 더 나은 보호를 제공하는지 여부를 조사할 수 있다.
B. 실시예 2
1. 물질 및 방법
세포 및 바이러스
인간 배아 신장 세포(HEK) 293T(ATCC CRL-3216), HEK293T7-NP 헬퍼 세포(MV-N 및 MV-P 유전자를 안정적으로 발현), 아프리카 녹색 원숭이 신장 세포(Vero) 및 Vero C1008 클론 E6(ATCC CRL-1586)은 5%(Vero 세포의 경우) 또는 10%(HEK293T 세포의 경우) 열불활성화 소태아혈청(FBS)(Corning사), 100unit/ml의 페니실린-스트렙토마이신 및 100ug/ml의 스트렙토마이신이 보충된 Dulbecco의 변형된 Eagle 배지(DMEM)(Thermo Fisher사)에서 37℃, 5% CO2에서 유지하였다. SARS-CoV-2 BetaCoV/France/IDF0372/2020 균주는 파스퇴르 연구소(프랑스 파리) 산하 National Reference Centre for Respiratory Viruses에 의해 제공되었다. BetaCoV/France/IDF0372/2020 균주가 분리된 인간 샘플은 프랑스 파리 비샤 병원의 X. Lescure 박사와 Pr. Y. Yazdanpanah에 의해 제공되었다. 마우스 적응 SARS-CoV-2(MACo-3)는 다른 곳에서 기재되었다.
변형된 SARS-CoV-2 S 단백질 작제물을 발현하는 pTM-MVSchwarz의 제작
Zhou 등(Zhou, 2020)이 발표한 서열에 기반한 SARS-CoV-2 스파이크(S) 유전자는 포유동물 세포에서의 발현을 위해 코돈 최적화하였다. 제한 부위 BsiWI 및 BssHII를 S 5' 및 3' 말단에 각각 도입하는 프라이머를 사용하여 뉴클레오티드 1-3799를 증폭하여 pCDNA 5.1로 클로닝을 위한 11개의 C-말단 아미노산(SF-dER)이 결실된 전장 S(SF))을 생성하였다(도 21). S2 작제물을 생성하기 위해, 프라이머는 BsmBI 제한 부위를 이용한 역 PCR을 위해 설계되었는데, 천연 S 신호 펩티드의 C-말단에 4-뉴클레오티드 겹침이 있고 푸린 절단 부위에 바로 인접하여 S2가 있었다(표 5A 내지 표 5C). S2 영역, pCDNA 백본 및 S 신호 펩티드를 포함하는 증폭 산물을 BsmBI(NEB)로 절단하고 자가 결찰하여 S2-dER을 생성했다. 융합전 상태에서 S의 형태를 유지하기 위해, HR1, K986P 및 V987P(2P 돌연변이)의 힌지에 2개의 돌연변이를 도입하였다(도 21). 돌연변이를 도입하는 프라이머는 돌연변이된 중첩 뉴클레오티드 및 BsmBI 부위를 가지도록 설계되었다(표 5A 내지 표 5C). SF-dER 및 S2-dER 작제물을 증폭, 절단 및 자가 결찰하여 융합전-안정화된 SF-2P-dER 및 S2-2P-dER 작제물을 생성했다. pCDNA 배경의 S 작제물은 FugeneHD를 사용하여 Vero 세포로 형질감염시켰다. 형질감염된 세포를 융합형 표현형에 대해 형질감염 후 24시간 및 48시간에 관찰하였다.
이후에, 모든 S 유전자는 MV Schwarz 백신 균주의 안티게놈에 해당하는 감염성 MV cDNA를 암호화하는 pTM-MVSchwarz에 클로닝하였다. 삽입된 모든 유전자는 뉴클레오티드의 총 수가 6의 배수가 되도록 정지 코돈에서 변형하였다(Calain, 1993).
바이러스 구출, 증식 및 적정
재조합 MV 바이러스의 구출은 이전에 설명한 대로(Combredet, 2003) 헬퍼 세포 기반 시스템을 사용하여 수행하였다. 간략히 말해서, 헬퍼 HEK293T7-NP 세포를 5㎍의 pTM-MVSchwarz 기반 SARS-CoV-2 S 플라스미드 및 0.02㎍의 MV 폴리머라제(L) 유전자 발현 pEMC-La 플라스미드로 개별적으로 형질감염시켰다(Duprex, 2002). 37℃에서 밤새 인큐베이션한 후, 형질감염 배지를 새로운 DMEM 배지로 교체하였다. 형질감염된 세포를 37℃ 인큐베이터로 되돌리기 전에 42℃에서 3시간 동안 열 충격을 가하였다. 2일 후, 형질감염된 세포를 Vero 세포의 단층이 접종된 100-mm 접시에 옮겼다. 2 내지 3일의 공동 배양 후에 나타난 합포체를 단독으로 선택하고 6-웰 플레이트에 접종된 Vero 세포로 옮겼다. 감염된 세포를 트립신 처리하고 5% FBS가 포함된 DMEM에서 75-cm2 및 이어서 150-cm2 플라스크에서 증식시켰다. 합포체가 80% 내지 90% 범위에 도달했을 때(또는 최대 세포변성 효과(CPE)가 관찰되었을 때, 일반적으로 감염 후 36 내지 48시간 이내), 세포를 소량의 OptiMEM(Thermo Fisher사)으로 긁어냈다. 세포를 단일 동결-해동 주기에 의해 용해하고 세포 용해물은 저속 원심분리에 의해 정화하였다. 감염성 상청액을 채취하여 -80℃에서 보관하였다.
rMV의 역가는, 96웰 플레이트에 7500개 세포/웰로 시딩되고 5% FBS가 포함된 DMEM에서 바이러스의 연속 10배 희석액으로 감염된 Vero 세포에서 측정하였다. 7일 동안 배양한 후 세포를 크리스탈 바이올렛으로 염색하고 Karber 방법(Karber, 1931)을 사용하여 TCID50 값을 계산했다. SARS-CoV-2 및 MACo3의 역가는 유사한 플라크 분석에서 Vero-E6에 대해 평가하였다. 감염 후 3일에 플라크의 수를 판독하였다.
rMV의 바이러스 성장 동역학은 6웰 플레이트에서 Vero 세포의 단층에서 연구하였다. 세포를 0.1 MOI에서 rMV로 감염시켰다. rMV 작제물당 하나의 플레이트를 사용하였다. 감염 후 다양한 시점에서, 감염된 세포를 1 ml OptiMEM으로 긁어내고, 동결-해동에 의해 용해시키고, 원심분리에 의해 정화하고, 상기 기재된 바와 같이 적정하였다.
S 발현의 안정성을 평가하기 위해, 동결-해동 주기에 의해 생성된 세포 용해물을 사용하여 10회 계대 동안 반복적으로 Vero 세포를 감염시켰다. 계대 1(P1), P5 및 P10 바이러스를 사용하여 6개의 웰 플레이트에서 Vero를 이중으로 감염시키고 RT-PCR 및 웨스턴 블롯팅을 사용하여 각각 S mRNA 및 단백질 수준을 평가했다.
RT-PCR
rMV 작제물에서 S 발현을 확인하기 위해, RNeasy Mini Kit(Qiagen사)를 사용하여 감염된 Vero 세포에서 전체 RNA를 추출했다. cDNA 합성 및 PCR 단계는 제조사의 지침에 따라 ATU2 및 ATU3을 표적으로 하는 프라이머(표 5A 및 표 5B)가 있는 RNA LA PCR 키트(Takara Bio)를 사용하여 수행되었다. RT-PCR 생성물은 표 5C에 나타낸 프라이머를 사용하여 Sanger 시퀀싱(Eurofins Genomics)에 의해 검증되었다.
웨스턴 블롯 분석
6웰 플레이트의 Vero 세포를 MOI 0.1에서 다양한 rMV로 감염시켰다. 감염 후 36 내지 48시간(80% 합포체)에서, 감염된 세포를 RIPA 용해 완충액(Thermo Fisher사)에서 용해시켰다. 샘플을 간단히 원심분리하고 NuPAGE-MOP 러닝(running) 완충액(Invitrogen사)과 함께 NuPAGE-pre-cast 4-12% 구배 겔을 사용하여 SDS-PAGE를 수행하였다. 니트로셀룰로오스 멤브레인(GE Healthcare사)으로 옮기고 0.1% Tween, 5% 밀크가 포함된 TBS(Tris-buffered saline) 완충액으로 블로킹한 후, 보존된 1124개 아미노산 내지 1140개 아미노산 에피토프를 인식하는 토끼 다클론성 항-SARS-CoV S 항체(ABIN199984, Antibody Online, 1:2000 희석) 및 이어서 양고추냉이 퍼옥시다제(HRP)-접합된 돼지 항-토끼 IgG 항체로 멤브레인을 후속적으로 프로빙했다(P0399, Dako, 1:3000 희석). 밴드는 SuperSignal West pico Plus 화학발광 HRP 기질(Thermo Fisher사)을 사용하여 시각화하였다. 로딩 제어를 위해, 멤브레인을 5분 동안 5% NaOH로 스트라이프한 다음 블로킹했다. 그런 다음, 멤브레인을 마우스 모노클로날 항-MV-N 항체(ab9397, Abcam, 1:20000 희석) 및 이어서 HRP-접합 항-마우스 IgG(NA931V, GE Healthcare, 1:10000 희석)로 다시 프로빙했다.
면역형광 분석
Vero 세포를 0.1의 MOI에서 다양한 rMV로 감염시켰다. 감염 후 24 내지 36시간에서, 세포를 4% 파라포름알데히드로 고정하고 2% 염소 혈청으로 밤새 블로킹한 다음 0.1% 사포닌 A(Sigma사)로 처리하거나 처리하지 않았다. 그런 다음, 고정된 세포를 1차 항체로서 마우스 단일클론 항-SARS-CoV S 항체(ab273433, Abcam, 1:300 희석)로 검출했다. Alexa Fluor 488-접합 염소 항-토끼 IgG(A-11008, Thermo Fisher사)를 2차 항체로 사용하였다. 항-MV-N으로 염색한 후 Cy3-접합 염소 항-토끼 항체(A10520, Jackson ImmunoResearch, 1:1000 희석) 를 사용하여 동일한 감염된 세포에서 MV를 검출했다. 핵은 DAPI로 염색되었다. 20x 대물렌즈가 장착된 도립 Leica DM IRB 형광 현미경을 사용하여 이미지를 수집했다.
유세포 분석
융합전 안정화 또는 천연 형태 전장 S 및 S2 서브유닛 항원을 암호화하는 pcDNA5.1 발현 벡터를 사용하여 제조사의 지침에 따라 JetPrime 형질감염 키트(PolyPlus)를 사용하여 HEK293T 세포를 형질감염시켰다. 형질감염 48시간 후, S2를 표적으로 하는 10㎍/ml의 토끼 다클론성 항-S 항체(ABIN199984)에 이어서 Alexa Fluor 488-접합 염소 항-토끼 IgG(A-11008)를 사용하여 간접 면역형광을 위해 세포를 염색하였다. 요오드화 프로피듐은 게이팅에 의해 죽은 세포를 배제하는데 사용되었다. Attune NxT 유세포 분석기(Invitrogen)에서 염색된 세포를 수집하고 FlowJo v10.7 소프트웨어(FlowJo LLC)를 사용하여 데이터를 분석했다.
마우스 면역화 및 챌린지
모든 실험은 파스퇴르 연구소의 동물 실험실의 승인을 받았으며 지침에 따라 수행되었다. I형 IFN 수용체가 결핍된(IFNAR-/-) 6 내지 8주령 마우스 그룹에 105 TCID50 rMV, 즉 ATU2 또는 ATU3에서 SF-2P-dER 또는 S2-2P-dER, 또는 대조군인 빈 MV Schwarz을 복강내 주사했다. 체액성 반응을 연구하기 위해, 4주 간격으로 2회 면역화를 실시했다. 혈청은 1차 면역화 전(-1일), 이어서 2차 면역화 전(28일) 및 후(42일)에 수집하였다. 모든 혈청 샘플은 56℃에서 30분 동안 열-불활성화시켰다. 보호를 평가하기 위해, 1회 또는 2회 예방접종을 받은 마우스에 1.5 x 105 PFU 마우스-적응 SARS-CoV-2 바이러스(MACo3)를 비강내 접종으로 챌린지했다. 챌린지 3일 후, 마우스를 희생시키고 폐 샘플을 수집하였다. 제조사의 프로토콜(E3006)에 따라 Luna Universal Pr―be One-Step RT-qPCR 키트를 사용하여 바이러스 성장, 감염성 바이러스 입자의 PFU 및 vRNA를 측정하여 폐에서 MACo3 바이러스의 존재를 검출하였다. 사용된 프라이머 및 프로브는 WHO 웹사이트에 설명된 바와 같이 nCoV_IP4 패널(표 5A 내지 표 5C)에 해당한다(Protocol, Institut Pasteur, 2020).
Figure pct00002
Figure pct00003
Figure pct00004
ELISA
Edmonston 균주 유래 MV 항원(Jena Bioscience사) 또는 R683A 및 R685A 돌연변이가 있는 아미노산 잔기 16~1213을 포함하는 재조합 S 단백질(ABIN6952426, Antibodies Online사)을 1x 인산완충식염수(PBS) 중 1μg/ml로 NUNC MAXISORP 96-웰 면역 플레이트(Thermo Fisher사)에 코팅했다. 코팅된 플레이트를 4℃에서 밤새 인큐베이션하고, 세척 완충액(PBS, 0.05% Tween)으로 3회 세척하고, 블로킹 완충액(PBS, 0.05% Tween, 5% 밀크)으로 37℃에서 1 시간 동안 추가로 블로킹하였다. 면역화된 마우스의 혈청 샘플을 결합 완충액(PBS, 0.05% Tween, 2.5% 밀크)에 연속적으로 희석하고 37℃에서 1시간 동안 플레이트에서 인큐베이션했다. 세척 단계 후, HRP-접합된 염소 항-마우스 IgG(H+L) 항체(Jackson ImmunoResearch, 115-035-146, 1:5000 희석)를 37℃에서 1시간 동안 첨가하였다. TMB 기질(Eurobio사)을 첨가하여 항체 결합을 검출하고 100㎕의 30% H2SO4로 반응을 멈추었다. EnSpire 2300 Multilabel Plate Reader(Perkin Elmer사)를 사용하여 450 및 620 nm 파장에서 광학 밀도를 기록했다. 각 개별 혈청 샘플에 대한 종말점 역가는 음성 대조군 혈청의 흡광도의 2배를 제공하는 마지막 희석의 역수로 계산되었다. 항체 반응의 이소형 결정은 HRP-접합 이소형 특이적(IgG1 또는 IgG2a) 염소 항-마우스 항체를 사용하여 수행되었다(AB97240 및 AB97245, Abcam, 1:5000).
플라크 감소 중화 시험
열-불활성화된 혈청 샘플의 2배 연속 희석액을 FBS가 없는 DMEM 배지에서 50PFU의 SARS-CoV-2 바이러스와 함께 37℃에서 1시간 동안 인큐베이션하고 24웰 플레이트에 접종된 Vero E6 세포의 단층에 첨가했다. 바이러스를 37℃에서 2시간 동안 흡착시켰다. 상청액을 제거하고 세포를 1 ml의 플라크 분석 오버레이 배지(5% FBS 및 1.5% 카르복시메틸셀룰로스가 첨가된 보충된 DMEM)로 덮었다. 플레이트를 3일 동안 5% CO2 및 37℃에서 인큐베이션하였다. 바이러스를 불활성화시키고, 세포를 고정하고 20% 에탄올 및 10% 포름알데히드(모두 Sigma사)를 함유하는 30% 크리스탈 바이올렛 용액으로 염색하였다. 혈청 중화 역가는 SARS-CoV-2 플라크를 50% 감소시킨 희석액(PRNT50)으로 카운트되었다.
ELISPOT
면역화된 마우스의 비장세포를 분리하고 Hybri-Max Red Blood Cell Lysing Buffer(Sigma)를 사용하여 적혈구를 용해했다. 비장세포는 특정 자극 시 IFN-γ를 분비하는 능력에 대해 테스트하였다. 멀티스크린-HA 96-웰 플레이트(Millipore사)를 PBS 중 10㎍/ml의 항-마우스 IFN-γ(551216, BD Biosciences사)로 웰당 100㎕로 4℃에서 밤새 코팅한 후, 200 μl 완전 MEM-α (10% FBS, 1x 비필수 아미노산, 1mM 피루브산 나트륨, 2mM L-글루타민, 10mM HEPES, 1% 페니실린-스트렙토마이신 및 50μM β-메르캅토에탄올이 보충된 MEM-α(Thermo Fisher사))를 이용하여 37℃에서 2시간동안 세척 및 블로킹하였다. 배지는 10U/ml의 마우스 IL-2(Roche사)가 보충된 완전한 MEM-α에서 각 웰에 1x105 비장세포를 포함하는 100μl의 세포 현탁액 및 100μl의 자극제로 교체하였다. 사용된 자극제는 양성 대조군의 경우 2.5μg/ml 콘카나발린 A(Sigma Aldrich사), 음성 대조군의 경우 완전한 MEM-α, MOI 1의 MV Schwarz 바이러스, 또는 펩티드당 2μg/ml의 SARS-CoV-2 S 펩티드 풀(표 6A 내지 표 6B)이었다. 37℃, 5% CO2에서 40시간 동안 인큐베이션한 후, 플레이트를 PBS로 1회 세척한 다음 세척 완충액(PBS, 0.05% Tween)으로 3회 세척하였다. 세척 완충액중 1㎍/ml의 비오틴화된 항-마우스 IFN-γ 항체(554410, BD Biosciences사)를 첨가하고 플레이트를 실온에서 120분 동안 인큐베이션하였다. 광범위한 세척 후, 100 μl의 스트렙타비딘-알칼리성 포스파타제 접합체(Roche사)를 1:1000의 희석액으로 첨가하고 플레이트를 실온에서 1식간 동안 추가로 인큐베이션하였다. 웰을 세척 완충액으로 두 번 세척한 다음 Tween이 없는 PBS 완충액으로 세척했습니다. 스팟은 BCIP/NBT(Sigma사)로 전개되었으며 CTL ImmunoSpot® ELISPOT 판독기에서 계수되었다.
Figure pct00005
Figure pct00006
세포내 사이토카인 염색
백신 접종된 마우스의 비장세포를 이전에 기재된 바와 같이 추출하였다. 웰당 마우스당 2백만 개의 비장세포를 200μL의 완전한 MEM-α 배지(Thermo Fisher사)에서 인큐베이션했다. 제조사의 지시에 따라 BD Golgi Stop(554724, BD Biosciences사)을 배지에 첨가하였다. 비장세포는 펩티드당 2㎍/ml의 최종 농도에서 SARS-CoV-2 S 단백질(표 6A 및 표 6B)의 예측된 CD4 및 CD8 T-세포 에피토프를 커버하는 펩티드 풀로 자극하였다. PMA/Ionomycin Cell Stimulation Cocktail(eBioscience사)를 양성 대조군에 대한 자극으로 사용하였고, 배지 단독은 음성 대조군에 사용하였다. 비장세포를 37℃에서 4시간 동안 자극하였다. 자극된 세포를 Mouse BD Fc Block(553141, BD Biosciences사)과 함께 인큐베이션하고 Live/Dead Fixable Aqua Viability Dye(ThermoFisher)로 염색하여 게이팅에 의해 죽은 세포를 배제했다. 이어서, 세포를 CD3e PE(클론 145-2C11, 12-0031-83, eBioscience사) 및 Invitrogen사의 CD4 PerCP-eFluor710(클론 RM4-5, 46-0042-82) 및 CD8 Alexa Fluor 488(클론 53-6.7, 53-0081-82) 항체로 염색하였다. 세포를 고정하고 BD 고정/투과 키트(BD Biosciences)로 투과화하고 IFN-γ APC/Fire750(클론 XMG1.2, 505860, BioLegend사), TNF-α BV421(클론 MP6-XT22, 563387, BD Horizon사) 및 IL-5 APC(클론 TRFK5, 505860, BD Biosciences사) 항체로 염색했다. Attune NxT 유세포 분석기(Invitrogen사)를 사용하여 샘플을 수집하고 FlowJo v10.7 소프트웨어(FlowJo LLC)를 사용하여 데이터를 분석했다.
통계 정보
통계 분석은 GraphPad Prism v.8.0.2를 사용하여 수행되었다. 결과는 p < 0.05인 경우 유의미한 것으로 간주되었다. 모든 그래프의 선은 기하학적 평균을 나타내고 오차 막대는 기하학적 SD를 나타낸다. 항체 반응, ELISA 및 PRNT50의 통계적 분석은 다중 비교를 위해 조정된 양방향 ANOVA를 사용하여 수행되었다. 양측 비모수 Mann-Whitney의 U 검정을 적용하여 두 그룹 간의 차이를 비교했다.
2. 결과
SARS-CoV-2 S 항원의 설계
SARS-CoV-1 S를 발현하는 MV에 대한 본 발명자들의 예전의 연구(Escriou, 2014)에 기반하여 그리고 SARS-CoV 및 SARS-CoV-2 S 단백질이 높은 수준의 유사성을 공유하기 때문에(Chan, 2020), 전장 SARS-CoV-2의 S 단백질이 MV 벡터에 의해 발현될 주요 항원으로 선택되었다. 본 발명자들은 그의 발현 및 면역원성을 개선하기 위해 천연 S 서열에 다수의 변형을 도입하였다(도 21). 첫째, 인간 세포에서 그의 발현을 증가시키기 위해 RNA 서열을 코돈-최적화하였다. 두 번째로, 본 발명자들은 융합전 형태로 S 단백질을 안정화시켜서 S 단백질의 발현 및 면역원성을 증가시키는 입증된 전략에 따라, S2 영역에서 2개의 아미노산을 프롤린(K986P 및 V987P)로 치환하여 2P 작제물의 서브세트를 생성하였다(Kirchdoerfer, 2018; Pallesen, 2017; Wrapp, 2020). 셋째, MV-감염된 세포에서 S 단백질의 표면 발현을 증가시키기 위해, 본 발명자들은 S 세포질 꼬리로부터 11개의 C-말단 아미노산(aa 1263-1273)을 결실시켜 dER 작제물을 생성하였다. 코로나바이러스 S 단백질의 세포질 꼬리는 서열번호 149의 KxHxx 또는 KKxx 모티프를 포함하는 소포체 검색 신호(ERRS) 및 티로신 의존성 국소화 신호 Yxxζ라는 하나 또는 두 개의 고유한 유지 신호를 포함한다(Ujiker, 2016). ERRS가 있는 S 단백질은 코토머(coatomer) 복합체 I(COPI)로 모집되고 역행으로 골지체에서 ER로 재순환된다. 따라서, ER과 골지체 사이의 S 단백질의 반복적인 순환은 S 단백질 세포내 체류를 유도하는 반면, ERRS가 결여된 돌연변이 S 단백질은 원형질막으로 수송된다(McBride, 2007; Ujike, 2015). 유사하게, Yxxζ 모티프가 있는 알파 코로나바이러스의 S 단백질은 세포 표면으로 이동하는 S 단백질이 거의 또는 전혀 없이 ER에 유지된다(Schwegmann-Wessels, 2004). 따라서, 본 발명자들은 세포질 꼬리로부터 가능한 모든 유지 신호가 결실된 SARS-CoV-2 S 항원을 설계하였다.
SARS-CoV-1 및 SARS-CoV-2 임상 분리주를 모두 표적으로 하는 광범위한 백신을 생성할 가능성을 조사하기 위해, 본 발명자들은 S2 서브유닛 항원도 설계했다(도 22a). SARS-CoV-2의 S2 소단위는 SARS-유사 CoV 중에서 고도로 보존되어 있으며 박쥐 SARS 유사 CoV(SL-CoV ZXC21 및 ZC45) 및 인간 SARS-CoV-1와 99% 동일성을 갖는다(Chan, 2020). 따라서, 본 발명자들은 항원을 세포 표면으로 표적화하기 위해 N-말단에 삽입된 S 단백질의 신호 펩티드를 갖는 천연 삼량체 및 융합전-안정화된 형태 둘 모두의 S2 서브유닛 항원을 설계하였다.
종합하면, 본 발명자들은 하기의 4개의 상이한 SARS-CoV-2 S 작제물을 설계하였다(도 22a): 1) 천연 형태 전장 S 삼량체(SF-dER); 2) 융합전-안정화된 전장 S(SF-2P-dER); 3) 천연 형태 삼량체 S2 서브유닛(S2-dER); 및 4) 융합전-안정화된 S2 서브유닛(S2-2P-dER).
SARS-CoV-2 S 항원의 발현 프로필
전장 S 및 S2 서열을 우선 pCDNA에 클로닝하고 HEK293T 세포에 형질감염시켜서 발현을 확인하고 표면 염색 후 유세포 분석에 의해 표면 단백질 국소화를 평가했다. 융합전-안정화된 S 작제물은 형질감염된 세포의 표면에 더 강하게 국소화되는 것으로 관찰되었다(도 28). ACE-2를 발현하는 Vero 세포에서 동일한 pCDNA 벡터를 형질감염시켜 S 단백질의 기능을 분석하였다. 일단 S 단백질이 ACE-2 수용체에 결합하면, 융합 단백질의 활성화는 세포 사이에 큰 융합체의 형성을 통해 관찰될 수 있다. 천연 S 단백질을 발현하는 Vero 세포(온전한 CT가 있는 전장 S)는 유의한 합포체 형성을 나타내므로(도 29), 기능적 S 단백질이 세포 표면에서 발현되었음을 알 수 있다. 특히, SdER 돌연변이체는 천연 SF에 비해 증가된 융합을 유도하므로, ERRS가 결실된 경우의 S 단백질의 예상되는 증가된 표면 발현이 확인되었다. 흥미롭게도, S2 소단위 단독의 발현은 Vero 세포에서 과융합 표현형을 초래했다. 이는 프로테아제가 S2' 부위를 절단하고 융합 펩티드를 유리시킴으로써 비수용체 매개 막 융합을 유발한다는 것을 시사한다. 반대로, 2P-안정화된 SF-2P-dER과 S2-2P-dER은 모두 합포체 형성을 유도하지 않았고, 따라서 2P 돌연변이에 의해 그의 융합 활성이 소멸되었음을 알 수 있다.
SARS-CoV-2 S 및 S2 단백질을 발현하는 rMV의 생성
4개의 항원 작제물은 추가 전사 단위(ATU)에서 pTM-MVSchwarz 플라스미드에 개별적으로 클로닝되었는데, ATU2는 MV 게놈의 P 및 M 유전자 사이에, ATU3은 H 및 L 유전자 사이에 위치하였다(Combredet, 2003)(도 22a). MV 유전자의 발현 구배 감소로 인해, ATU2에 클로닝하면 항원의 높은 수준의 발현이 가능한 반면 ATU3에 클로닝하면 낮은 수준의 발현을 초래된다(Plumet, 2005). ATU3로부터의 더 낮은 발현은 독성이 있거나 발현하기 어려운 항원을 암호화하는 rMV의 구출을 용이하게 하기 위한 절충안이다.
S 단백질을 발현하는 모든 rMV는 역유전학에 의해 성공적으로 구출되었고 Vero 세포에서 증식되었다. rMV가 약간 지연된 성장 동역학을 나타내긴 했지만, 최종 바이러스 수율은 높았고 모체 MV Schwarz(약 107 TCID50/ml)의 수율과 동일했다(도 22b). S 항원의 발현은 웨스턴 블롯팅(WB) 및 면역형광 염색(IF)에 의해 감염된 Vero 세포에서 검출되었다(도 22c, 도 22d 및 도 30 및 도 31). 예상대로, ATU3에 비해 ATU2 벡터에서 훨씬 더 높은 항원 발현이 관찰되었다(도 22c).
재조합 바이러스 벡터를 백신으로 사용할 때, 작제물의 유전적 안정성은 여러 제조 단계 후에 백신의 유효성을 보장하기 때문에 주요 관심사이다. Vero 세포에서 연속 계대 후의 rMV의 이러한 분석 결과, ATU2로부터 천연 S를 발현하는 MV-ATU2-SF-dER이 계대 5에 의해 S 발현의 손실과 함께 불안정한 것으로 밝혀졌다(도 32).
대조적으로, 그의 2P 대응물은 계대 10까지 안정적이고 효율적으로 발현되었다. 따라서, 본 발명자들은 천연 S를 발현하는 백신 후보를 버리고 추가 면역원성 연구를 위해 융합전-안정화된 SF-2P 및 S2-2P 작제물을 발현하는 것들을 선택하였다.
마우스에서 SARS-CoV-2 중화 항체의 유도
본 발명자들은 MV 감염에 민감한 IFNAR -/- 마우스에서, 선택된 rMV 백신 후보의 면역원성을 조사하였다(Mura, 2018). 동물은 0일 및 30일에 1x105 TCID50에서 rMV 후보를 1회 또는 2회 복강내 투여하여 면역화시켰다(도 23a). 빈 MV Schwarz를 대조군 백신 접종에 사용했다. 마우스 혈청은 프라임 후 4주 및 부스트 후 12일에 수집하였다. S- 및 MV-특이적 IgG 항체의 존재는 SARS-CoV-2 S 재조합 단백질 및 천연 MV 항원을 각각 사용하여 간접 ELISA에 의해 평가하였다.
모든 동물은 모든 그룹에서 비슷한 역가(약 104-105 IgG 역가)에서 프라임 후 높은 MV-특이적 IgG 항체를 발생시켰으므로, 모든 동물에서 효과적인 백신 섭취가 확인되었다(도 23b). 부스트 면역화는 모든 그룹에서 MV-특이 항체 역가를 증가시켰고, 이는 모든 동물이 성공적인 프라임-부스트 백신 접종을 받았음을 나타낸다. SARS-CoV-2 S에 대한 특정 IgG 항체는 면역된 마우스의 100%에서 검출되었다. 흥미롭게도, ATU2로부터 SF-2P-dER 또는 S2-2P-dER 항원을 발현하는 rMV는 특히 부스팅 후에 ATU3 벡터보다 더 높은 수준의 항-S 항체를 유도했다(도 23c). 빈 MV를 투여 받은 대조군 동물의 면역전 혈청 및 혈청은 항-S 항체에 대해 음성으로 남아 있었다(데이터는 도시되지 않음).
다음으로, 본 발명자들은 Vero E6 단층의 SARS-CoV-2 바이러스 감염을 통한 플라크 감소 중화 시험(PRNT)을 사용하여 SARS-CoV-2 중화 항체(NAb)의 존재를 평가하였다. 프라임 후, SARS-CoV-2 NAb는 ATU2로부터 발현된 SF-2P-dER로 면역화된 모든 마우스에서 발견되었지만 ATU3 작제물로 면역화된 마우스는 단 한 마리였다(도 23d). 2차 면역화 후, NAb 역가는 두 그룹 모두에서 증가했으며, ATU2 그룹은 ATU3 그룹에 비해 10배 더 높은 NAb 역가를 나타냈다. 높은 수준의 항-S 항체에도 불구하고 S2 후보로 면역화된 동물에서는 NAb가 검출되지 않았다(도 23c).
IgG 이소타입 전환이 Th1 및 Th2 반응의 간접적인 지표로 작용할 수 있기 때문에(Finkelman, 1990), 본 발명자들은 면역화된 마우스의 혈청에서 S-특이적 IgG1 및 IgG2a 아이소타입 역가를 측정했다(도 23f, 도 23g). 본 발명자들의 이전 결과(Escriou, 2014)와 유사하게, rMV 후보는 IgG1보다 훨씬 더 높은 IgG2a 항체 역가를 유도했는데, 이는 우세한 Th1-유형 면역 반응을 반영한다(도 23f, 도 23g). 활성화된 T 세포는 Th1 및 Th2 사이토카인 생성에 중요한 역할을 하기 때문에, 본 발명자들은 MV-면역화된 마우스에서 S-특이적 T-세포 반응을 더 자세히 분석하였다.
S-특이적 T-세포 반응의 유도
면역화에 의해 유도된 세포 매개 면역 반응은 IFN-γ ELISPOT 분석을 사용하여 먼저 조사하였다. IFNAR-/- 마우스 그룹을 1차 면역화 1주일 후에 희생시켰다(도 24a). S-특이적 반응을 평가하기 위해, 비장세포는 129sv IFNAR-/- 마우스의 MHC-I H-2Kb/H-2Db 및 MHC-II I-Ab 일배체형과 일치하는 SARS-CoV-2 S 단백질의 예측된 CD8+ 및 CD4+ T-세포 에피토프를 커버하는 합성 펩티드 풀로 생체 외 자극하였다(표 6A 및 표 6B). 또한, 비장세포는 MV 벡터-특이적 T-세포 반응을 검출하기 위해 빈 MV 바이러스로 자극하였다.
SARS-CoV-2 S 및 MV에 대한 높은 수준의 T 세포 반응은 1차 백신 접종 후 초기에 유도되었다(도 24). MV-ATU2-SF-2P-dER로 백신 접종한 마우스의 비장세포는 MHC 클래스 I-제한 S 펩티드 풀로 자극한 후 현저하게 높은 IFN-γ 분비 수준을 나타내어 106개 비장세포당 약 2,500개의 스팟 형성 세포(SFC)를 생성했다. 더 낮은 IFN-γ 반응은 대략 400개의 SFC/106 비장세포에서 MHC 클래스 II-제한 S 펩티드로 자극시에 관찰되었다(도 24b, 도 24c). 또한, 이들 마우스의 비장세포는 비교적 낮은 벡터 특이적 IFN-γ 반응(~990 SFC/106 비장세포)을 나타내었으므로, 균형 잡힌 S-대-MV 벡터 반응 비율을 나타내었다(도 24d). 동일한 백신의 ATU3 대응물은 더 많은 벡터 특이적 IFN-γ 분비 세포(약 1,320 SFC/106 비장세포)를 생성하는 경향이 있는 반면, MHC 클래스 II-제한 S 펩티드(약 130 SFC/106 비장세포)로 자극한 후 S-특이적 IFN-γ 분비 세포를 생성하는데는 덜 효율적이었다. MHC 클래스 I-제한 S 펩티드로 자극한 후의 IFN-γ 반응은 ATU2 대응물(약 1,980 SFC/106 비장세포)의 반응과 크게 다르지 않았지만, S-대-MV 벡터 반응 비율은 MV-ATU2-SF-2P-dER의 경우에 상당히 더 높았다(도 24b).
대조적으로, S2-단독 작제물에 의해 유발된 S-특이적 IFN-γ 반응은 S 펩티드 풀 중 하나를 사용한 자극 후에 낮았다(도 24c, 도 24d). S-대-MV 벡터 반응 비율은 또한 이들 동물에서 매우 낮게 유지되었으며, 이는 S2 단백질 서브유닛 단독으로 면역화가 강력한 보호 세포 면역 반응을 유도하기에 충분하지 않을 수 있음을 시사한다(도 24e, 도 24f). MV-ATU3-S2-2P-dER 및 빈 MV는 S-특이적 IFN-γ 반응을 유도할 수 없었다.
다음으로, 본 발명자들은 세포내 사이토카인 염색(ICS) 후 유세포 분석에 의해 S-특이적 CD4+ 및 CD8+ T 세포를 연구하였다. S-특이적 IFN-γ+ 및 TNF-α+ 반응은 CD8+ T 세포에서 관찰된 반면, CD4+ T 세포는 S 펩티드 풀 자극에 잘 반응하지 않았다(도 25a, 도 25b). ELISPOT 결과와 유사하게, ATU2 또는 ATU3로부터 발현된 SF-2P-dER은 상당히 높고 필적할만한 비율의 S-특이적 IFN-γ+ 및 TNF-α+ CD8+ T 세포를 유도한 반면, ATU2로부터 발현된 S2 단백질은 면역원성이 10배 작았다. MV-ATU3-S2-2P-dER 및 빈 MV는 S-특이적 IFN-γ- 또는 TNF-α-생산 T-세포를 유도할 수 없었다. IL-5-분비 세포(Th2 편향된 반응을 나타냄)는 면역화 그룹에서 검출되지 않았다. MV-ATU2-SF-2P-dER로 면역된 마우스에서 T 세포 반응에 대한 추가적인 상세한 분석 결과, 높은 수준의 S-특이적 IFN-γ+ 및 TNF-α+ 생성 CD8+ T 세포뿐만 아니라 이중 양성 IFN-γ+/TNF-α+ 생산 CD8+ T 세포의 CD8 구획의 강한 자극이 확인되었다. IL-5 또는 IL-13은 CD4+ 또는 CD8+ T 세포뿐만 아니라 CD4+/CD44+/CD62L-기억 T 세포에서 검출되지 않았으며, 이는 S-특이적 기억 T 세포도 Th1-지향성(oriented)임을 확인시켜준다(도 33).
종합하면, 이러한 결과는 MV-ATU2-SF-2P-dER이 MV-ATU3-SF-2P-dER보다 상당히 높은 수준에서 SARS-CoV-2 S 항원에 대한 강력한 Th1-구동 T 세포 면역 반응을 유도한다는 것을 입증한다. S2 후보는 이전에 NAb 수준에서 관찰된 바와 같이 훨씬 더 낮은 세포 반응을 유도했으며, 이는 S2 단독으로는 이러한 마우스에서 효율적인 면역 반응을 유도하기에 충분하지 않음을 나타낸다. 따라서, 본 발명자들은 추가 분석에서 S2 후보를 제외시켰다.
중화항체의 지속성 및 비강내 챌린지로부터의 보호
본 발명자들은 MV-ATU2-SF-2P-dER 또는 MV-ATU3-SF-2P-dER로 2회 면역화된 마우스에서 항-S 항체의 지속성을 모니터링하였다(도 26a). MV 반응에 대해 일반적으로 관찰되는 바와 같이(도 26b), S-특이적 IgG 역가는 부스팅 후 최대 3개월 동안 ATU2 및 ATU3 후보 모두에 대해 높은 수준(105-106 제한 희석 역가)으로 지속되고 안정화되었다(도 26c). 그러나, ATU2 작제물을 사용한 면역화는 실험 기간에 걸쳐 유의하게 더 높은 수준의 S-특이적 IgG 및 NAb 역가(103-104 제한 희석 역가)를 초래하였다(도 26d).
이러한 반응이 SARS-CoV-2 감염으로부터 보호를 제공하는지 여부를 확인하기 위해, 면역화된 마우스에 마우스-적응 SARS-CoV-2 바이러스인 MACo3의 1.5 x 105 PFU를 비강 내로 챌린지했다. 챌린지 3일 후, 마우스를 희생시키고 폐 균질액에서 바이러스의 존재를 조사하였다. SARS-CoV-2 RNA는 RdRP 유전자-특이적 프라이머를 사용하여 RT-qPCR에 의해 측정하였고(Protocol, Institut Pasteur, 2020)(표 5A 내지 표 5C), 감염성 바이러스 수준은 Vero E6 세포에서 적정하였다. SARS-CoV-2 바이러스 RNA는 챌린지 후 모든 면역화된 마우스의 폐에서 검출되었으며, ATU2 그룹은 빈 MV 대조군과 비교하여 평균 2log10 감소를 나타내고 ATU3 그룹은 1log10 감소를 나타냈다(도 26e). 그러나, ATU2 그룹의 폐 및 ATU3 그룹의 하나를 제외한 모든 폐에서 감염성 바이러스가 검출되지 않았다(도 26f). 이러한 결과는 비록 바이러스 복제가 낮은 수준에서 발생했지만 접종된 바이러스와 자손 바이러스의 감염성이 효율적으로 중화되었음을 나타낸다.
1회 접종 후 비강내 챌린지로부터 부분적 보호
다음으로, 본 발명자들은 단일 면역화가 MACo3 바이러스 챌린지로부터 IFNAR-/- 마우스를 보호할 수 있는지 여부를 확인하였다(도 27a). 면역화된 동물을 챌린지 전에 면역화 후 28일 및 48일에 면역 반응에 대해 검사하였다. 모든 동물은 MV- 및 S-특이적 항체를 나타냈다(도 27b, 도 27c). S 항원뿐만 아니라 SARS-CoV-2 NAb에 대한 Th1-관련 IgG 반응은 2회 면역화 후보다 낮은 수준이었지만 챌린지 전에 존재하였다(도 27d, 도 27e). 그 다음, 마우스를 비강내로 챌린지하고 챌린지 3일 후에 폐 샘플을 수집하였다. 시험군과 대조군 사이의 바이러스 RNA 수준의 차이가 관찰되지 않았지만(도 27f), MV-ATU2-SF-2P-dER로 면역화된 동물의 절반은 폐의 감염성 바이러스에 대해 음성이었고(도 27g), 따라서 단일 투여 후에도 부분적 보호를 나타냈다. 대조적으로, MV-ATU3-SF-2P-dER로 면역화된 동물은 단일 투여 후에 보호되지 않았다. 그러나, 프라임/부스트 후, 두 작제물 모두 보호적인 것으로 확인되었다(도 26).
3. 고찰
여기에서 본 발명자들은 SARS-CoV-2 S 단백질을 표적으로 하는 MV 기반 COVID-19 백신 후보의 개발 및 테스트를 보고했다. 다른 백신 플랫폼과 유사하게, 전장 융합전-안정화 S는 가장 면역원성이 있어 가장 강력한 체액 및 세포 반응을 유도했다. 그들의 주요 후보인 MV-ATU2-SF-2P-dER은 SARS-CoV-2에 대한 중화 항체의 높은 수준과 강력한 Th1 지향 T 세포 반응을 유도했다. 프라임-부스트 면역화는 마우스-적응된 SARS-CoV-2 바이러스에 의한 비강내 챌린지로부터 보호를 제공했다. 또한, NAb 역가는 면역화 후에도 몇 달 동안 지속되었다. 이러한 오래 지속되는 면역은 복제 벡터 백신의 특징이다(Amanna, 2007). 바이러스 부하 및 바이러스 증식을 제어하고 감소시키는데 필수적인 T 세포 반응(Rydyznski, 2020)은 단일 면역화 후 7일 이내에 유도되었다. 특히, Th1 반응의 우세는 SARS-CoV-1 및 MERS-CoV 백신 연구에 대하여 이전에 보고된 바와 같이 이러한 백신 후보가 백신-유도 질병 강화로 인해 면역 병리학을 유도할 가능성이 적음을 시사했다(Roberts, 2010; Luo, 2018; Qin, 2006; Niu, 2018; Zhang, 2016). 또한, 1회 접종 후, 주요 후보인 MV-ATU2-SF-2P-dER도 최소 50%의 COVID-19 백신 1차 효능에 대한 WHO 권고(Considerations for evaluation of COVID19, WHO, 2020)에 따른 충분한 면역 보호를 제공했다. 이는 그들의 주요 백신 후보가 SARS-CoV-2 감염 및 질병 모두로부터 보호할 수 있음을 시사한다.
광범위한 백신을 생성하는 가능성을 탐색하기 위해, 본 발명자들은 SARS-CoV-1 및 SARS-CoV-2 바이러스 중에서 고도로 보존된 S2 서브유닛만을 발현하는 백신 후보도 시험하였다. S2 서브유닛은 면역우성 및 중화 에피토프를 보유하는 것으로 확인되었다(Zhang, 2004; He, 2004; Wang, 2020). 이 보고서에서, MV 맥락에서 S2는 높은 S-특이적 항체 역가를 유도했지만, 이러한 항체는 SARS-CoV-2 바이러스를 중화할 수 없었다. 세포 반응의 관점에서, S2는 S-특이적 CD4+, CD8+ 또는 IL-5+ T-세포 반응을 유도하지 않았다. 이러한 관찰은 S2 소단위만으로는 면역 보호를 유도하기에 충분하지 않음을 시사했다. 비-중화 항체의 높은 역가를 감안할 때, SARS-CoV-2 감염에 대한 면역 반응에서 항체의 역할을 특성규명하고 면역병리학에 기여할 수 있는지 여부를 조사하는 것은 흥미로울 것이다.
또한, 본 발명자들의 결과는 ATU2 대 ATU3으로부터 표적 항원을 발현하는 rMV 백신의 면역원성에서 흥미로운 차이를 나타내었다. S 항원은 ATU2에서 더 높은 수준으로 발현되었으며, 이는 더 높은 체액성 반응 및 세포 반응과 상관관계가 있었다. ATU2 후보의 면역화 용량을 1x104 TCID50으로 감소시키는 것은 여전히 1x105 TCID50에서의 ATU3 백신보다 더 높은 NAb 역가를 유도하였다(도 34). 추가적으로, MV 벡터에 대한 T-세포 반응은 또한 ATU2 작제물에서 더 낮았다. 이러한 관찰 결과는 더 높은 항원 발현이 생체내 바이러스 복제를 감소시킬 수 있고, 결과적으로 벡터 자체에 대한 더 낮은 세포 반응을 초래할 수 있음을 시사했다. MV 백신이 벡터에 대한 기존의 면역에도 불구하고 효과적인 것으로 확인되었지만, 항원 및 벡터의 면역원성의 보다 바람직한 균형은 ATU2 작제물의 더 큰 백신 효능에 기여할 가능성이 있다. 그럼에도 불구하고, 미래의 백신을 위한 rMV 비히클로서 ATU3 개념은 불안정하거나 독성이 있거나 발현하기 어려운 항원을 발현하는데 여전히 유용하다.
[참고문헌]
Combredet, C., V. Labrousse, L. Mollet, C. Lorin, F. Delebecque, B. Hurtrel, H. McClure, M. B. Feinberg, M. Brahic and F. Tangy (2003). "A molecularly cloned Schwarz strain of measles virus vaccine induces strong immune responses in macaques and transgenic mice." J Virol 77(21): 11546-54.
Escriou, N., B. Callendret, V. Lorin, C. Combredet, P. Marianneau, M. Fevrier and F. Tangy (2014). "Protection from SARS coronavirus conferred by live measles vaccine expressing the spike glycoprotein." Virology 452-453: 32-41.
Reed, L. J. and H. Muench (1938). "A simple method of estimating fifty percent endpoints." Am. J. Hyg. 27: 493-497.
Reuter 등, PLoS ONE, 2012, 7(3), e33989, 1-8.
Ku 등. (2021) Cell Host & Microbe - for challenge model with Ad5:hACE2.
Hsieh 등. (2020) Science 369, 1501-1505.
MCCallum 등. (2020) Nat. Struct. Mol. Biol., 27, 942-949.
Buchrieser 등. (2020) EMBO Journal, 39:e106267.
Plumet (2005) J. Virol (2005) 79(11):6900-8.
Del Valle (2020), Nat Med., Chen, J. Clin. Invest., 2020.
Xiong 등 (2020), Nature Structural & Molecular Biology.
Combredet, C., V. Labrousse, L. Mollet, C. Lorin, F. Delebecque, B. Hurtrel, H. McClure, M. B. Feinberg, M. Brahic and F. Tangy (2003). "A molecularly cloned Schwarz strain of measles virus vaccine induces strong immune responses in macaques and transgenic mice." J Virol 77(21): 11546-54.
Escriou, N., B. Callendret, V. Lorin, C. Combredet, P. Marianneau, M. Fevrier and F. Tangy (2014). "Protection from SARS coronavirus conferred by live measles vaccine expressing the spike glycoprotein." Virology 452-453: 32-41.
Reed, L. J. and H. Muench (1938). "A simple method of estimating fifty percent endpoints." Am. J. Hyg. 27: 493-497.
The GDP@Risk over five years from COVID-19 could range from $3.3 trillion to $82 trillion, says the Centre for Risk Studies www.jbs.cam.ac.uk/insight/2020/economic-impact/. In: Brain food / Economic impact) (2020).
Callaway E, Cyranoski D. China coronavirus: Six questions scientists are asking. Nature 577, 605-607 (2020).
Graham BS. Rapid COVID-19 vaccine development. Science (New York, NY) 368, 945-946 (2020).
Zhou P, 등. A pneumonia outbreak associated with a new coronavirus of probable bat origin. Nature 579, 270-273 (2020).
Wu F, 등. A new coronavirus associated with human respiratory disease in China. Nature 579, 265-269 (2020).
Jaimes J, Millet J, Whittaker G. Proteolytic Cleavage of the SARS-CoV-2 Spike Protein and the Role of the Novel S1/S2 Site. Ssrn, 3581359 (2020).
Hoffmann M, 등. SARS-CoV-2 Cell Entry Depends on ACE2 and TMPRSS2 and Is Blocked by a Clinically Proven Protease Inhibitor. Cell 181, 271-280.e278 (2020).
Du L, He Y, Zhou Y, Liu S, Zheng BJ, Jiang S. The spike protein of SARS-CoV--a target for vaccine and therapeutic development. Nature reviews Microbiology 7, 226-236 (2009).
Escriou N, 등. Protection from SARS coronavirus conferred by live measles vaccine expressing the spike glycoprotein. Virology 452-453, 32-41 (2014).
Liniger M, 등. Induction of neutralising antibodies and cellular immune responses against SARS coronavirus by recombinant measles viruses. Vaccine 26, 2164-2174 (2008).
Bodmer BS, Fiedler AH, Hanauer JRH, Pr
Figure pct00007
fer S, M
Figure pct00008
hlebach MD. Live-attenuated bivalent measles virus-derived vaccines targeting Middle East respiratory syndrome coronavirus induce robust and multifunctional T cell responses against both viruses in an appropriate mouse model. Virology 521, 99-107 (2018).
Zhu FC, 등. Safety, tolerability, and immunogenicity of a recombinant adenovirus type-5 vectored COVID-19 vaccine: a dose-escalation, open-label, non-randomised, first-in-human trial. Lancet (London, England) 395, 1845-1854 (2020).
Bosch BJ, 등. Severe acute respiratory syndrome coronavirus (SARS-CoV) infection inhibition using spike protein heptad repeat-derived peptides. Proceedings of the National Academy of Sciences of the United States of America 101, 8455-8460 (2004).
Keng CT, 등. Amino acids 1055 to 1192 in the S2 region of severe acute respiratory syndrome coronavirus S protein induce neutralizing antibodies: implications for the development of vaccines and antiviral agents. Journal of virology 79, 3289-3296 (2005).
Lip KM, 등. Monoclonal antibodies targeting the HR2 domain and the region immediately upstream of the HR2 of the S protein neutralize in vitro infection of severe acute respiratory syndrome coronavirus. Journal of virology 80, 941-950 (2006).
Zhang H, 등. Identification of an antigenic determinant on the S2 domain of the severe acute respiratory syndrome coronavirus spike glycoprotein capable of inducing neutralizing antibodies. Journal of virology 78, 6938-6945 (2004).
Zhong X, 등. B-cell responses in patients who have recovered from severe acute respiratory syndrome target a dominant site in the S2 domain of the surface spike glycoprotein. Journal of virology 79, 3401-3408 (2005).
Frantz PN, Teeravechyan S, Tangy F. Measles-derived vaccines to prevent emerging viral diseases. Microbes Infect 20, 493-500 (2018).
Ramsauer K, 등. Immunogenicity, safety, and tolerability of a recombinant measles-virus-based chikungunya vaccine: a randomised, double-blind, placebo-controlled, active-comparator, first-in-man trial. The Lancet Infectious diseases 15, 519-527 (2015).
Reisinger EC, 등. Immunogenicity, safety, and tolerability of the measles-vectored chikungunya virus vaccine MV-CHIK: a double-blind, randomised, placebo-controlled and active-controlled phase 2 trial. Lancet (London, England) 392, 2718-2727 (2019).
Mateo M, 등. Vaccines inducing immunity to Lassa virus glycoprotein and nucleoprotein protect macaques after a single shot. Science translational medicine 11, (2019).
N
Figure pct00009
rnberger C, Bodmer BS, Fiedler AH, Gabriel G, M
Figure pct00010
hlebach MD. A Measles Virus-Based Vaccine Candidate Mediates Protection against Zika Virus in an Allogeneic Mouse Pregnancy Model. Journal of virology 93, (2019).
Malczyk AH, 등. A Highly Immunogenic and Protective Middle East Respiratory Syndrome Coronavirus Vaccine Based on a Recombinant Measles Virus Vaccine Platform. Journal of virology 89, 11654-11667 (2015).
Chan JF, 등. Genomic characterization of the 2019 novel human-pathogenic coronavirus isolated from a patient with atypical pneumonia after visiting Wuhan. Emerging microbes & infections 9, 221-236 (2020).
Kirchdoerfer RN, 등. Stabilized coronavirus spikes are resistant to conformational changes induced by receptor recognition or proteolysis. Scientific reports 8, 15701 (2018).
Pallesen J, 등. Immunogenicity and structures of a rationally designed prefusion MERS-CoV spike antigen. Proceedings of the National Academy of Sciences of the United States of America 114, E7348-e7357 (2017).
Wrapp D, 등. Cryo-EM structure of the 2019-nCoV spike in the prefusion conformation. Science (New York, NY) 367, 1260-1263 (2020).
Ujike M, Huang C, Shirato K, Makino S, Taguchi F. The contribution of the cytoplasmic retrieval signal of severe acute respiratory syndrome coronavirus to intracellular accumulation of S proteins and incorporation of S protein into virus-like particles. The Journal of general virology 97, 1853-1864 (2016).
McBride CE, Li J, Machamer CE. The cytoplasmic tail of the severe acute respiratory syndrome coronavirus spike protein contains a novel endoplasmic reticulum retrieval signal that binds COPI and promotes interaction with membrane protein. Journal of virology 81, 2418-2428 (2007).
Ujike M, Taguchi F. Incorporation of spike and membrane glycoproteins into coronavirus virions. Viruses 7, 1700-1725 (2015).
Schwegmann-Wessels C, 등. A novel sorting signal for intracellular localization is present in the S protein of a porcine coronavirus but absent from severe acute respiratory syndrome-associated coronavirus. The Journal of biological chemistry 279, 43661-43666 (2004).
Combredet C, 등. A molecularly cloned Schwarz strain of measles virus vaccine induces strong immune responses in macaques and transgenic mice. Journal of virology 77, 11546-11554 (2003).
Plumet S, Duprex WP, Gerlier D. Dynamics of viral RNA synthesis during measles virus infection. Journal of virology 79, 6900-6908 (2005).
Mura M, Ruffie C, Billon-Denis E, Combredet C, Tournier JN, Tangy F. hCD46 receptor is not required for measles vaccine Schwarz strain replication in vivo: Type-I IFN is the species barrier in mice. Virology 524, 151-159 (2018).
Finkelman FD, 등. Lymphokine control of in vivo immunoglobulin isotype selection. Annual review of immunology 8, 303-333 (1990).
Protocol: Real-time RT-PCR assays for the detection of SARS-CoV-2 Institut Pasteur, Paris.). Protocol: Real-time RT-PCR assays for the detection of SARS-CoV-2 Institut Pasteur, Paris (2020).
Amanna IJ, Carlson NE, Slifka MK. Duration of humoral immunity to common viral and vaccine antigens. The New England journal of medicine 357, 1903-1915 (2007).
Rydyznski Moderbacher C, 등. Antigen-Specific Adaptive Immunity to SARS-CoV-2 in Acute COVID-19 and Associations with Age and Disease Severity. Cell, (2020).
Roberts A, 등. Immunogenicity and protective efficacy in mice and hamsters of a beta-propiolactone inactivated whole virus SARS-CoV vaccine. Viral Immunol 23, 509-519 (2010).
Luo F, Liao FL, Wang H, Tang HB, Yang ZQ, Hou W. Evaluation of Antibody-Dependent Enhancement of SARS-CoV Infection in Rhesus Macaques Immunized with an Inactivated SARS-CoV Vaccine. Virol Sin 33, 201-204 (2018).
Qin E, 등. Immunogenicity and protective efficacy in monkeys of purified inactivated Vero-cell SARS vaccine. Vaccine 24, 1028-1034 (2006).
Niu P, 등. A novel human mAb (MERS-GD27) provides prophylactic and postexposure efficacy in MERS-CoV susceptible mice. Sci China Life Sci 61, 1280-1282 (2018).
Zhang N, 등. Identification of an ideal adjuvant for receptor-binding domain-based subunit vaccines against Middle East respiratory syndrome coronavirus. Cell Mol Immunol 13, 180-190 (2016).
CONSIDERATIONS FOR EVALUATION OF COVID19 VACCINESFORWHO EUL v24092020. (ed Vaccine and Immunization Devices Assessment Team (VAX) PUP, Regulation and Prequalification Department (RPQ), Access to Medicineand Health Products(MHP), World Health Organization, Geneva,Switzerland) (2020).
He Y, 등. Identification of immunodominant sites on the spike protein of severe acute respiratory syndrome (SARS) coronavirus: implication for developing SARS diagnostics and vaccines. J Immunol 173, 4050-4057 (2004).
Wang Q, Qiu Y, Li JY, Zhou ZJ, Liao CH, Ge XY. A Unique Protease Cleavage Site Predicted in the Spike Protein of the Novel Pneumonia Coronavirus (2019-nCoV) Potentially Related to Viral Transmissibility. Virol Sin 35, 337-339 (2020).
Print RDB. Draft landscape of COVID-19 candidate vaccines.). World Health Organization (2020).
Ahi YS, Bangari DS, Mittal SK. Adenoviral vector immunity: its implications and circumvention strategies. Curr Gene Ther 11, 307-320 (2011).
Folegatti PM, 등. Safety and immunogenicity of the ChAdOx1 nCoV-19 vaccine against SARS-CoV-2: a preliminary report of a phase 1/2, single-blind, randomised controlled trial. Lancet (London, England) 396, 467-478 (2020).
Zuniga A, 등. Attenuated measles virus as a vaccine vector. Vaccine 25, 2974-2983 (2007).
Domingo C, 등. Long-term immunity against yellow fever in children vaccinated during infancy: a longitudinal cohort study. The Lancet Infectious diseases 19, 1363-1370 (2019).
Pebody RG, 등. Immunogenicity of second dose measles-mumps-rubella (MMR) vaccine and implications for serosurveillance. Vaccine 20, 1134-1140 (2002).
Mura M, Combredet C, Najburg V, Sanchez David RY, Tangy F, Komarova AV. Nonencapsidated 5' Copy-Back Defective Interfering Genomes Produced by Recombinant Measles Viruses Are Recognized by RIG-I and LGP2 but Not MDA5. Journal of virology 91, (2017).
Sankoh O, 등. The non-specific effects of vaccines and other childhood interventions: the contribution of INDEPTH Health and Demographic Surveillance Systems. Int J Epidemiol 43, 645-653 (2014).
Benn CS, Fisker AB, Whittle HC, Aaby P. Revaccination with Live Attenuated Vaccines Confer Additional Beneficial Nonspecific Effects on Overall Survival: A Review. EBioMedicine 10, 312-317 (2016).
Aaby P, 등. Non-specific effects of standard measles vaccine at 4.5 and 9 months of age on childhood mortality: randomised controlled trial. BMJ 341, c6495 (2010).
Buitrago-Garcia D, 등. Occurrence and transmission potential of asymptomatic and presymptomatic SARS-CoV-2 infections: A living systematic review and meta-analysis. PLoS Med 17, e1003346 (2020).
Calain P, Roux L. The rule of six, a basic feature for efficient replication of Sendai virus defective interfering RNA. Journal of virology 67, 4822-4830 (1993).
Duprex WP, Collins FM, Rima BK. Modulating the function of the measles virus RNA-dependent RNA polymerase by insertion of green fluorescent protein into the open reading frame. Journal of virology 76, 7322-7328 (2002).
K
Figure pct00011
rber G. Beitrag zur kollektiven Behandlung pharmakologischer Reihenversuche. Archiv f experiment Pathol u Pharmakol 162, 480-483 (1931)
SEQUENCE LISTING <110> INSTITUT PASTEUR <120> MEASLES-VECTORED COVID-19 IMMUNOGENIC COMPOSITIONS AND VACCINES <130> IP20224174FR <140> PCTxxxx <141> 2021-02-12 <150> EP20305141.2 <151> 2020-02-13 <150> US62/976,083 <151> 2020-02-13 <150> EP20305790.6 <151> 2020-07-08 <160> 150 <170> PatentIn version 3.5 <210> 1 <211> 3870 <212> DNA <213> Artificial sequence <220> <223> Native nucleotide sequence of the spike (S) polypeptide of nCoV <400> 1 gctagcggat cccgtacggc caccatgttt gtttttcttg ttttattgcc actagtctct 60 agtcagtgtg ttaatcttac aaccagaact caattacccc ctgcatacac taattctttc 120 acacgtggtg tttattaccc tgacaaagtt ttcagatcct cagttttaca ttcaactcag 180 gacttgttct tacctttctt ttccaatgtt acttggttcc atgctataca tgtctctggg 240 accaatggta ctaagaggtt tgataaccct gtcctaccat ttaatgatgg tgtttatttt 300 gcttccactg agaagtctaa cataataaga ggctggattt ttggtactac tttagattcg 360 aagacccagt ccctacttat tgttaataac gctactaatg ttgttattaa agtctgtgaa 420 tttcaatttt gtaatgatcc atttttgggt gtttattacc acaaaaacaa caaaagttgg 480 atggaaagtg agttcagagt ttattctagt gcgaataatt gcacttttga atatgtctct 540 cagccttttc ttatggacct tgaaggaaaa cagggtaatt tcaaaaatct tagggaattt 600 gtgtttaaga atattgatgg ttattttaaa atatattcta agcacacgcc tattaattta 660 gtgcgtgatc tccctcaggg tttttcggct ttagaaccat tggtagattt gccaataggt 720 attaacatca ctaggtttca aactttactt gctttacata gaagttattt gactcctggt 780 gattcttctt caggttggac agctggtgct gcagcttatt atgtgggtta tcttcaacct 840 aggacttttc tattaaaata taatgaaaat ggaaccatta cagatgctgt agactgtgca 900 cttgaccctc tctcagaaac aaagtgtacg ttgaaatcct tcactgtaga aaaaggaatc 960 tatcaaactt ctaactttag agtccaacca acagaatcta ttgttagatt tcctaatatt 1020 acaaacttgt gcccttttgg tgaagttttt aacgccacca gatttgcatc tgtttatgct 1080 tggaacagga agagaatcag caactgtgtt gctgattatt ctgtcctata taattccgca 1140 tcattttcca cttttaagtg ttatggagtg tctcctacta aattaaatga tctctgcttt 1200 actaatgtct atgcagattc atttgtaatt agaggtgatg aagtcagaca aatcgctcca 1260 gggcaaactg gaaagattgc tgattataat tataaattac cagatgattt tacaggctgc 1320 gttatagctt ggaattctaa caatcttgat tctaaggttg gtggtaatta taattacctg 1380 tatagattgt ttaggaagtc taatctcaaa ccttttgaga gagatatttc aactgaaatc 1440 tatcaggccg gtagcacacc ttgtaatggt gttgaaggtt ttaattgtta ctttccttta 1500 caatcatatg gtttccaacc cactaatggt gttggttacc aaccatacag agtagtagta 1560 ctttcttttg aacttctaca tgcaccagca actgtttgtg gacctaaaaa gtctactaat 1620 ttggttaaaa acaaatgtgt caatttcaac ttcaatggtt taacaggcac aggtgttctt 1680 actgagtcta acaaaaagtt tctgcctttc caacaatttg gcagagacat tgctgacact 1740 actgatgctg tccgtgatcc acagacactt gagattcttg acattacacc atgttctttt 1800 ggtggtgtca gtgttataac accaggaaca aatacttcta accaggttgc tgttctttat 1860 caggatgtta actgcacaga agtccctgtt gctattcatg cagatcaact tactcctact 1920 tggcgtgttt attctacagg ttctaatgtt tttcaaacac gtgcaggctg tttaataggg 1980 gctgaacatg tcaacaactc atatgagtgt gacataccca ttggtgcagg tatatgcgct 2040 agttatcaga ctcagactaa ttctcctcgg cgggcacgta gtgtagctag tcaatccatc 2100 attgcctaca ctatgtcact tggtgcagaa aattcagttg cttactctaa taactctatt 2160 gccataccca caaattttac tattagtgtt accacagaaa ttctaccagt gtctatgacc 2220 aagacatcag tagattgtac aatgtacatt tgtggtgatt caactgaatg cagcaatctt 2280 ttgttgcaat atggcagttt ttgtacacaa ttaaaccgtg ctttaactgg aatagctgtt 2340 gaacaagaca aaaacaccca agaagttttt gcacaagtca aacaaattta caaaacacca 2400 ccaattaaag attttggtgg ttttaatttt tcacaaatat taccagatcc atcaaaacca 2460 agcaagaggt catttattga agatctactt ttcaacaaag tgacacttgc agatgctggc 2520 ttcatcaaac aatatggtga ttgccttggt gatattgctg ctagagacct catttgtgca 2580 caaaagttta acggccttac tgttttgcca cctttgctca cagatgaaat gattgctcaa 2640 tacacttctg cactgttagc gggtacaatc acttctggtt ggacctttgg tgcaggtgct 2700 gcattacaaa taccatttgc tatgcaaatg gcttataggt ttaatggtat tggagttaca 2760 cagaatgttc tctatgagaa ccaaaaattg attgccaacc aatttaatag tgctattggc 2820 aaaattcaag actcactttc ttccacagca agtgcacttg gaaaacttca agatgtggtc 2880 aaccaaaatg cacaagcttt aaacacgctt gttaaacaac ttagctccaa ttttggtgca 2940 atttcaagtg ttttaaatga tatcctttca cgtcttgaca aagttgaggc tgaagtgcaa 3000 attgataggt tgatcacagg cagacttcaa agtttgcaga catatgtgac tcaacaatta 3060 attagagctg cagaaatcag agcttctgct aatcttgctg ctactaaaat gtcagagtgt 3120 gtacttggac aatcaaaaag agttgatttt tgtggaaagg gctatcatct tatgtccttc 3180 cctcagtcag cacctcatgg tgtagtcttc ttgcatgtga cttatgtccc tgcacaagaa 3240 aagaacttca caactgctcc tgccatttgt catgatggaa aagcacactt tcctcgtgaa 3300 ggtgtctttg tttcaaatgg cacacactgg tttgtaacac aaaggaattt ttatgaacca 3360 caaatcatta ctacagacaa cacatttgtg tctggtaact gtgatgttgt aataggaatt 3420 gtcaacaaca cagtttatga tcctttgcaa cctgaattag actcattcaa ggaggagtta 3480 gataaatatt ttaagaatca tacatcacca gatgttgatt taggtgacat ctctggcatt 3540 aatgcttcag ttgtaaacat tcaaaaagaa attgaccgcc tcaatgaggt tgccaagaat 3600 ttaaatgaat ctctcatcga tctccaagaa cttggaaagt atgagcagta tataaaatgg 3660 ccatggtaca tttggctagg ttttatagct ggcttgattg ccatagtaat ggtgacaatt 3720 atgctttgct gtatgaccag ttgctgtagt tgtctcaagg gctgttgttc ttgtggatcc 3780 tgctgcaaat ttgatgaaga cgactctgag ccagtgctca aaggagtcaa attacattac 3840 acatgataac gagcgcgcct cgaggaattc 3870 <210> 2 <211> 3870 <212> DNA <213> Artificial sequence <220> <223> Codon-optimized nucleotide sequence of the spike (S) polypeptide of nCoV <400> 2 gctagcggat cccgtacggc caccatgttc gtgtttctgg tgctgctgcc actggtgtcc 60 agtcagtgcg tgaacctgac cacacgaaca cagctgccac cagcctacac caatagcttc 120 acccgcggag tgtactaccc cgacaaggtg ttccgcagca gcgtgctgca tagcacccag 180 gatctgtttc tgcccttctt cagcaacgtg acctggttcc acgccatcca cgtgtccggc 240 accaatggca ccaagcgctt cgataatccc gtgctgccct tcaacgatgg cgtgtacttt 300 gccagcaccg agaagtccaa tatcatccgc ggctggatct tcggcaccac actggatagc 360 aagacccaga gcctgctgat cgtgaacaac gccaccaacg tggtcatcaa agtgtgcgag 420 ttccagttct gcaacgaccc cttcctgggc gtctactacc acaagaacaa caagagctgg 480 atggaaagcg agttccgcgt gtacagcagc gccaacaact gcaccttcga gtacgtgtcc 540 cagccattcc tgatggacct ggaaggcaag cagggcaact tcaagaacct gcgcgagttc 600 gtgttcaaga acatcgacgg ctacttcaaa atctacagca agcacacccc aatcaacctc 660 gtgcgcgatc tgccacaggg attcagtgct ctggaacccc tggtggatct gcccatcggc 720 atcaacatta cccgctttca gacactgctg gccctgcacc gcagttactt gacaccaggc 780 gatagcagca gtggatggac agctggtgcc gccgcttact acgttggata tctgcagcca 840 cgcacctttc tgctgaagta caacgagaac ggcaccatca ccgacgccgt ggattgtgct 900 ctcgatcccc tgagcgagac aaagtgcacc ctgaagtcct tcaccgtcga gaagggcatc 960 taccagacca gcaatttccg cgtgcagccc accgagagca tcgtgcgctt ccccaatatc 1020 accaatctgt gccccttcgg cgaggtgttc aatgccacac gctttgcctc cgtgtacgcc 1080 tggaatcgca agcgcattag caactgcgtg gccgactact ccgtgctgta caatagcgcc 1140 agcttcagca ccttcaagtg ctacggcgtg tcacccacca agctgaacga cctgtgcttc 1200 accaatgtgt acgccgacag cttcgtgatc cgcggagatg aagtgcgaca gattgcccca 1260 ggccagaccg gcaagatcgc cgactacaat tacaagctgc ccgacgactt caccggctgc 1320 gtgatcgcct ggaacagcaa caacctggat tccaaagtcg gcggcaacta caactacctg 1380 taccgcctgt tccgcaagag caatctgaag cccttcgagc gcgacatcag caccgaaatc 1440 taccaggccg gaagcacccc atgcaacggc gtggaaggct tcaactgcta cttcccactg 1500 cagtcctacg gatttcagcc cacaaatggc gtgggctacc agccatatcg agtggtggtg 1560 ctgagcttcg aactgctgca tgctccagct accgtgtgcg gccccaagaa gagtaccaac 1620 ctggtcaaga acaaatgcgt gaacttcaac ttcaacggcc tgaccggaac cggcgtgctg 1680 accgagagta acaagaagtt cctgccattc cagcagtttg gccgcgacat tgccgataca 1740 accgatgccg ttcgcgatcc ccagaccttg gagatcctgg atattacccc atgctccttc 1800 ggcggcgtgt ccgtgattac accaggcacc aataccagca accaggtggc cgttctgtac 1860 caggatgtga attgcacaga ggtgcccgtg gccattcacg ccgatcaatt gacaccaaca 1920 tggcgcgtgt actccaccgg cagcaatgtg tttcaaaccc gcgctggatg cctgattgga 1980 gccgagcacg tgaacaatag ctacgagtgc gatatcccca tcggagccgg aatctgcgcc 2040 tcctatcaga cccagaccaa tagtccacga cgagcccgaa gtgtggccag ccagagcatc 2100 attgcctata ccatgagcct gggcgccgag aatagcgtgg cctactccaa caacagcatt 2160 gctatcccca ccaacttcac catcagcgtg accaccgaga tcctgccagt gtccatgacc 2220 aagaccagcg tggactgcac catgtacatc tgcggagata gcaccgagtg cagcaacctg 2280 ctgctgcagt acggaagttt ctgcacccag ctgaatcgcg ccctgacagg cattgccgtg 2340 gaacaggata agaacaccca agaggtgttc gcccaagtga agcaaatcta caagacccca 2400 ccaatcaagg atttcggcgg cttcaatttc agccagattc tgcccgatcc aagcaagccc 2460 agcaagcgca gcttcatcga ggacctgctg ttcaacaaag tgacactggc cgacgccgga 2520 ttcatcaagc agtatggcga ttgcctgggc gatattgccg cacgcgatct gatttgcgcc 2580 cagaagttta acggactgac cgtcctgcca ccactgctga cagatgagat gatcgcccag 2640 tacacaagtg ccctgctggc cggaaccatt accagcggat ggacatttgg agccggtgcc 2700 gctctgcaga ttcccttcgc tatgcagatg gcctaccgct tcaatggcat tggcgtgacc 2760 cagaatgtgc tgtacgagaa ccagaagctg atcgccaacc agttcaacag cgccatcggc 2820 aagattcagg acagcctgag tagtaccgcc agcgctctgg gaaagctgca ggatgtggtc 2880 aaccagaacg ctcaggccct gaacaccctg gttaagcagc tgagcagcaa cttcggcgcc 2940 atcagtagcg tgctgaacga tatcctgagc cgcctggata aggtggaagc cgaggtgcag 3000 atcgatcgcc tgattaccgg acgcctgcag tccctgcaga cctatgtgac acagcagctg 3060 atccgagccg ccgagattcg agctagtgct aatctggccg ccaccaagat gagcgaatgt 3120 gtgctgggac agagcaagcg cgtggacttt tgcggcaagg gataccacct gatgagcttc 3180 ccacagagtg ctccacacgg cgtggtgttt ctgcatgtga cctacgtgcc cgctcaagag 3240 aagaatttca ccaccgctcc agccatctgc cacgacggaa aggcccattt tccacgcgag 3300 ggcgtgttcg ttagcaacgg cactcattgg ttcgtcaccc agcgcaactt ctacgagccc 3360 cagatcatca ccaccgacaa caccttcgtc agcggcaact gcgacgtcgt gatcggcatt 3420 gtgaacaaca ccgtgtacga tccactgcag cccgagctgg acagcttcaa agaggaactg 3480 gacaagtact ttaagaacca cacaagcccc gacgtggacc tgggagacat tagcggaatc 3540 aacgccagcg tggtcaacat ccagaaagag attgaccgcc tgaacgaggt ggccaagaat 3600 ctgaacgaga gcctgatcga cctgcaagaa ctgggcaaat acgagcagta cattaagtgg 3660 ccctggtaca tctggctggg cttcattgcc ggactgattg ccatcgtgat ggtcaccatt 3720 atgctgtgct gcatgaccag ttgctgcagc tgcctgaagg gatgctgcag ttgcggaagc 3780 tgctgcaagt tcgacgagga tgatagcgag ccagtgctga agggcgtcaa gctgcactac 3840 acctgataac gagcgcgcct cgaggaattc 3870 <210> 3 <211> 1273 <212> PRT <213> Artificial sequence <220> <223> Spike (S) polypeptide of nCoV <400> 3 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile 885 890 895 Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 1010 1015 1020 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys 1025 1030 1035 Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1040 1045 1050 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val 1055 1060 1065 Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His 1070 1075 1080 Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn 1085 1090 1095 Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln 1100 1105 1110 Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val 1115 1120 1125 Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro 1130 1135 1140 Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn 1145 1150 1155 His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn 1160 1165 1170 Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu 1175 1180 1185 Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu 1190 1195 1200 Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu 1205 1210 1215 Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met 1220 1225 1230 Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys 1235 1240 1245 Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro 1250 1255 1260 Val Leu Lys Gly Val Lys Leu His Tyr Thr 1265 1270 <210> 4 <211> 3870 <212> DNA <213> Artificial sequence <220> <223> Codon-optimized nucleotide sequence of a stabilized form of the spike (stab-S) polypeptide of nCoV <400> 4 gctagcagat ctcgtacggc caccatgttc gtgtttctgg tgctgctgcc actggtgtcc 60 agtcagtgcg tgaacctgac cacacgaaca cagctgccac cagcctacac caatagcttc 120 acccgcggag tgtactaccc cgacaaggtg ttccgcagca gcgtgctgca tagcacccag 180 gatctgtttc tgcccttctt cagcaacgtg acctggttcc acgccatcca cgtgtccggc 240 accaatggca ccaagcgctt cgataatccc gtgctgccct tcaacgatgg cgtgtacttt 300 gccagcaccg agaagtccaa tatcatccgc ggctggatct tcggcaccac actggatagc 360 aagacccaga gcctgctgat cgtgaacaac gccaccaacg tggtcatcaa agtgtgcgag 420 ttccagttct gcaacgaccc cttcctgggc gtctactacc acaagaacaa caagagctgg 480 atggaaagcg agttccgcgt gtacagcagc gccaacaact gcaccttcga gtacgtgtcc 540 cagccattcc tgatggacct ggaaggcaag cagggcaact tcaagaacct gcgcgagttc 600 gtgttcaaga acatcgacgg ctacttcaaa atctacagca agcacacccc aatcaacctc 660 gtgcgcgatc tgccacaggg attcagtgct ctggaacccc tggtggatct gcccatcggc 720 atcaacatta cccgctttca gacactgctg gccctgcacc gcagttactt gacaccaggc 780 gatagcagca gtggatggac agctggtgcc gccgcttact acgttggata tctgcagcca 840 cgcacctttc tgctgaagta caacgagaac ggcaccatca ccgacgccgt ggattgtgct 900 ctcgatcccc tgagcgagac aaagtgcacc ctgaagtcct tcaccgtcga gaagggcatc 960 taccagacca gcaatttccg cgtgcagccc accgagagca tcgtgcgctt ccccaatatc 1020 accaatctgt gccccttcgg cgaggtgttc aatgccacac gctttgcctc cgtgtacgcc 1080 tggaatcgca agcgcattag caactgcgtg gccgactact ccgtgctgta caatagcgcc 1140 agcttcagca ccttcaagtg ctacggcgtg tcacccacca agctgaacga cctgtgcttc 1200 accaatgtgt acgccgacag cttcgtgatc cgcggagatg aagtgcgaca gattgcccca 1260 ggccagaccg gcaagatcgc cgactacaat tacaagctgc ccgacgactt caccggctgc 1320 gtgatcgcct ggaacagcaa caacctggat tccaaagtcg gcggcaacta caactacctg 1380 taccgcctgt tccgcaagag caatctgaag cccttcgagc gcgacatcag caccgaaatc 1440 taccaggccg gaagcacccc atgcaacggc gtggaaggct tcaactgcta cttcccactg 1500 cagtcctacg gatttcagcc cacaaatggc gtgggctacc agccatatcg agtggtggtg 1560 ctgagcttcg aactgctgca tgctccagct accgtgtgcg gccccaagaa gagtaccaac 1620 ctggtcaaga acaaatgcgt gaacttcaac ttcaacggcc tgaccggaac cggcgtgctg 1680 accgagagta acaagaagtt cctgccattc cagcagtttg gccgcgacat tgccgataca 1740 accgatgccg ttcgcgatcc ccagaccttg gagatcctgg atattacccc atgctccttc 1800 ggcggcgtgt ccgtgattac accaggcacc aataccagca accaggtggc cgttctgtac 1860 caggatgtga attgcacaga ggtgcccgtg gccattcacg ccgatcaatt gacaccaaca 1920 tggcgcgtgt actccaccgg cagcaatgtg tttcaaaccc gcgctggatg cctgattgga 1980 gccgagcacg tgaacaatag ctacgagtgc gatatcccca tcggagccgg aatctgcgcc 2040 tcctatcaga cccagaccaa tagtccacga cgagcccgaa gtgtggccag ccagagcatc 2100 attgcctata ccatgagcct gggcgccgag aatagcgtgg cctactccaa caacagcatt 2160 gctatcccca ccaacttcac catcagcgtg accaccgaga tcctgccagt gtccatgacc 2220 aagaccagcg tggactgcac catgtacatc tgcggagata gcaccgagtg cagcaacctg 2280 ctgctgcagt acggaagttt ctgcacccag ctgaatcgcg ccctgacagg cattgccgtg 2340 gaacaggata agaacaccca agaggtgttc gcccaagtga agcaaatcta caagacccca 2400 ccaatcaagg atttcggcgg cttcaatttc agccagattc tgcccgatcc aagcaagccc 2460 agcaagcgca gcttcatcga ggacctgctg ttcaacaaag tgacactggc cgacgccgga 2520 ttcatcaagc agtatggcga ttgcctgggc gatattgccg cacgcgatct gatttgcgcc 2580 cagaagttta acggactgac cgtcctgcca ccactgctga cagatgagat gatcgcccag 2640 tacacaagtg ccctgctggc cggaaccatt accagcggat ggacatttgg agccggtgcc 2700 gctctgcaga ttcccttcgc tatgcagatg gcctaccgct tcaatggcat tggcgtgacc 2760 cagaatgtgc tgtacgagaa ccagaagctg atcgccaacc agttcaacag cgccatcggc 2820 aagattcagg acagcctgag tagtaccgcc agcgctctgg gaaagctgca ggatgtggtc 2880 aaccagaacg ctcaggccct gaacaccctg gttaagcagc tgagcagcaa cttcggcgcc 2940 atcagtagcg tgctgaacga tatcctgagc cgcctggatc caccagaagc cgaggtgcag 3000 atcgatcgcc tgattaccgg acgcctgcag tccctgcaga cctatgtgac acagcagctg 3060 atccgagccg ccgagattcg agctagtgct aatctggccg ccaccaagat gagcgaatgt 3120 gtgctgggac agagcaagcg cgtggacttt tgcggcaagg gataccacct gatgagcttc 3180 ccacagagtg ctccacacgg cgtggtgttt ctgcatgtga cctacgtgcc cgctcaagag 3240 aagaatttca ccaccgctcc agccatctgc cacgacggaa aggcccattt tccacgcgag 3300 ggcgtgttcg ttagcaacgg cactcattgg ttcgtcaccc agcgcaactt ctacgagccc 3360 cagatcatca ccaccgacaa caccttcgtc agcggcaact gcgacgtcgt gatcggcatt 3420 gtgaacaaca ccgtgtacga tccactgcag cccgagctgg acagcttcaa agaggaactg 3480 gacaagtact ttaagaacca cacaagcccc gacgtggacc tgggagacat tagcggaatc 3540 aacgccagcg tggtcaacat ccagaaagag attgaccgcc tgaacgaggt ggccaagaat 3600 ctgaacgaga gcctgatcga cctgcaagaa ctgggcaaat acgagcagta cattaagtgg 3660 ccctggtaca tctggctggg cttcattgcc ggactgattg ccatcgtgat ggtcaccatt 3720 atgctgtgct gcatgaccag ttgctgcagc tgcctgaagg gatgctgcag ttgcggaagc 3780 tgctgcaagt tcgacgagga tgatagcgag ccagtgctga agggcgtcaa gctgcactac 3840 acctgataac gagcgcgcct cgaggaattc 3870 <210> 5 <211> 1273 <212> PRT <213> Artificial sequence <220> <223> Stabilized form of the spike (stab-S) polypeptide of nCoV <400> 5 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile 885 890 895 Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 1010 1015 1020 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys 1025 1030 1035 Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1040 1045 1050 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val 1055 1060 1065 Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His 1070 1075 1080 Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn 1085 1090 1095 Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln 1100 1105 1110 Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val 1115 1120 1125 Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro 1130 1135 1140 Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn 1145 1150 1155 His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn 1160 1165 1170 Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu 1175 1180 1185 Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu 1190 1195 1200 Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu 1205 1210 1215 Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met 1220 1225 1230 Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys 1235 1240 1245 Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro 1250 1255 1260 Val Leu Lys Gly Val Lys Leu His Tyr Thr 1265 1270 <210> 6 <211> 3680 <212> DNA <213> Artificial sequence <220> <223> Codon-optimized nucleotide sequence of the soluble and monomeric form of the spike (Secto) ectodomain polypeptide of nCoV <400> 6 actagctagc ggatcccgta cggccaccat gttcgtgttt ctggtgctgc tgccactggt 60 gtccagtcag tgcgtgaacc tgaccacacg aacacagctg ccaccagcct acaccaatag 120 cttcacccgc ggagtgtact accccgacaa ggtgttccgc agcagcgtgc tgcatagcac 180 ccaggatctg tttctgccct tcttcagcaa cgtgacctgg ttccacgcca tccacgtgtc 240 cggcaccaat ggcaccaagc gcttcgataa tcccgtgctg cccttcaacg atggcgtgta 300 ctttgccagc accgagaagt ccaatatcat ccgcggctgg atcttcggca ccacactgga 360 tagcaagacc cagagcctgc tgatcgtgaa caacgccacc aacgtggtca tcaaagtgtg 420 cgagttccag ttctgcaacg accccttcct gggcgtctac taccacaaga acaacaagag 480 ctggatggaa agcgagttcc gcgtgtacag cagcgccaac aactgcacct tcgagtacgt 540 gtcccagcca ttcctgatgg acctggaagg caagcagggc aacttcaaga acctgcgcga 600 gttcgtgttc aagaacatcg acggctactt caaaatctac agcaagcaca ccccaatcaa 660 cctcgtgcgc gatctgccac agggattcag tgctctggaa cccctggtgg atctgcccat 720 cggcatcaac attacccgct ttcagacact gctggccctg caccgcagtt acttgacacc 780 aggcgatagc agcagtggat ggacagctgg tgccgccgct tactacgttg gatatctgca 840 gccacgcacc tttctgctga agtacaacga gaacggcacc atcaccgacg ccgtggattg 900 tgctctcgat cccctgagcg agacaaagtg caccctgaag tccttcaccg tcgagaaggg 960 catctaccag accagcaatt tccgcgtgca gcccaccgag agcatcgtgc gcttccccaa 1020 tatcaccaat ctgtgcccct tcggcgaggt gttcaatgcc acacgctttg cctccgtgta 1080 cgcctggaat cgcaagcgca ttagcaactg cgtggccgac tactccgtgc tgtacaatag 1140 cgccagcttc agcaccttca agtgctacgg cgtgtcaccc accaagctga acgacctgtg 1200 cttcaccaat gtgtacgccg acagcttcgt gatccgcgga gatgaagtgc gacagattgc 1260 cccaggccag accggcaaga tcgccgacta caattacaag ctgcccgacg acttcaccgg 1320 ctgcgtgatc gcctggaaca gcaacaacct ggattccaaa gtcggcggca actacaacta 1380 cctgtaccgc ctgttccgca agagcaatct gaagcccttc gagcgcgaca tcagcaccga 1440 aatctaccag gccggaagca ccccatgcaa cggcgtggaa ggcttcaact gctacttccc 1500 actgcagtcc tacggatttc agcccacaaa tggcgtgggc taccagccat atcgagtggt 1560 ggtgctgagc ttcgaactgc tgcatgctcc agctaccgtg tgcggcccca agaagagtac 1620 caacctggtc aagaacaaat gcgtgaactt caacttcaac ggcctgaccg gaaccggcgt 1680 gctgaccgag agtaacaaga agttcctgcc attccagcag tttggccgcg acattgccga 1740 tacaaccgat gccgttcgcg atccccagac cttggagatc ctggatatta ccccatgctc 1800 cttcggcggc gtgtccgtga ttacaccagg caccaatacc agcaaccagg tggccgttct 1860 gtaccaggat gtgaattgca cagaggtgcc cgtggccatt cacgccgatc aattgacacc 1920 aacatggcgc gtgtactcca ccggcagcaa tgtgtttcaa acccgcgctg gatgcctgat 1980 tggagccgag cacgtgaaca atagctacga gtgcgatatc cccatcggag ccggaatctg 2040 cgcctcctat cagacccaga ccaatagtcc acgacgagcc cgaagtgtgg ccagccagag 2100 catcattgcc tataccatga gcctgggcgc cgagaatagc gtggcctact ccaacaacag 2160 cattgctatc cccaccaact tcaccatcag cgtgaccacc gagatcctgc cagtgtccat 2220 gaccaagacc agcgtggact gcaccatgta catctgcgga gatagcaccg agtgcagcaa 2280 cctgctgctg cagtacggaa gtttctgcac ccagctgaat cgcgccctga caggcattgc 2340 cgtggaacag gataagaaca cccaagaggt gttcgcccaa gtgaagcaaa tctacaagac 2400 cccaccaatc aaggatttcg gcggcttcaa tttcagccag attctgcccg atccaagcaa 2460 gcccagcaag cgcagcttca tcgaggacct gctgttcaac aaagtgacac tggccgacgc 2520 cggattcatc aagcagtatg gcgattgcct gggcgatatt gccgcacgcg atctgatttg 2580 cgcccagaag tttaacggac tgaccgtcct gccaccactg ctgacagatg agatgatcgc 2640 ccagtacaca agtgccctgc tggccggaac cattaccagc ggatggacat ttggagccgg 2700 tgccgctctg cagattccct tcgctatgca gatggcctac cgcttcaatg gcattggcgt 2760 gacccagaat gtgctgtacg agaaccagaa gctgatcgcc aaccagttca acagcgccat 2820 cggcaagatt caggacagcc tgagtagtac cgccagcgct ctgggaaagc tgcaggatgt 2880 ggtcaaccag aacgctcagg ccctgaacac cctggttaag cagctgagca gcaacttcgg 2940 cgccatcagt agcgtgctga acgatatcct gagccgcctg gataaggtgg aagccgaggt 3000 gcagatcgat cgcctgatta ccggacgcct gcagtccctg cagacctatg tgacacagca 3060 gctgatccga gccgccgaga ttcgagctag tgctaatctg gccgccacca agatgagcga 3120 atgtgtgctg ggacagagca agcgcgtgga cttttgcggc aagggatacc acctgatgag 3180 cttcccacag agtgctccac acggcgtggt gtttctgcat gtgacctacg tgcccgctca 3240 agagaagaat ttcaccaccg ctccagccat ctgccacgac ggaaaggccc attttccacg 3300 cgagggcgtg ttcgttagca acggcactca ttggttcgtc acccagcgca acttctacga 3360 gccccagatc atcaccaccg acaacacctt cgtcagcggc aactgcgacg tcgtgatcgg 3420 cattgtgaac aacaccgtgt acgatccact gcagcccgag ctggacagct tcaaagagga 3480 actggacaag tactttaaga accacacaag ccccgacgtg gacctgggag acattagcgg 3540 aatcaacgcc agcgtggtca acatccagaa agagattgac cgcctgaacg aggtggccaa 3600 gaatctgaac gagagcctga tcgacctgca agaactgggc aaatacgagc agtacattaa 3660 gtgataacga gcgcgctact 3680 <210> 7 <211> 1211 <212> PRT <213> Artificial sequence <220> <223> Soluble and monomeric form of the spike (Secto) ectodomain polypeptide of nCoV <400> 7 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile 885 890 895 Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 1010 1015 1020 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys 1025 1030 1035 Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1040 1045 1050 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val 1055 1060 1065 Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His 1070 1075 1080 Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn 1085 1090 1095 Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln 1100 1105 1110 Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val 1115 1120 1125 Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro 1130 1135 1140 Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn 1145 1150 1155 His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn 1160 1165 1170 Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu 1175 1180 1185 Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu 1190 1195 1200 Gly Lys Tyr Glu Gln Tyr Ile Lys 1205 1210 <210> 8 <211> 3680 <212> DNA <213> Artificial sequence <220> <223> Codon-optimized nucleotide sequence of the stabilized form of the spike (stab-Secto) ectodomain polypeptide of nCoV <400> 8 actagctagc agatctcgta cggccaccat gttcgtgttt ctggtgctgc tgccactggt 60 gtccagtcag tgcgtgaacc tgaccacacg aacacagctg ccaccagcct acaccaatag 120 cttcacccgc ggagtgtact accccgacaa ggtgttccgc agcagcgtgc tgcatagcac 180 ccaggatctg tttctgccct tcttcagcaa cgtgacctgg ttccacgcca tccacgtgtc 240 cggcaccaat ggcaccaagc gcttcgataa tcccgtgctg cccttcaacg atggcgtgta 300 ctttgccagc accgagaagt ccaatatcat ccgcggctgg atcttcggca ccacactgga 360 tagcaagacc cagagcctgc tgatcgtgaa caacgccacc aacgtggtca tcaaagtgtg 420 cgagttccag ttctgcaacg accccttcct gggcgtctac taccacaaga acaacaagag 480 ctggatggaa agcgagttcc gcgtgtacag cagcgccaac aactgcacct tcgagtacgt 540 gtcccagcca ttcctgatgg acctggaagg caagcagggc aacttcaaga acctgcgcga 600 gttcgtgttc aagaacatcg acggctactt caaaatctac agcaagcaca ccccaatcaa 660 cctcgtgcgc gatctgccac agggattcag tgctctggaa cccctggtgg atctgcccat 720 cggcatcaac attacccgct ttcagacact gctggccctg caccgcagtt acttgacacc 780 aggcgatagc agcagtggat ggacagctgg tgccgccgct tactacgttg gatatctgca 840 gccacgcacc tttctgctga agtacaacga gaacggcacc atcaccgacg ccgtggattg 900 tgctctcgat cccctgagcg agacaaagtg caccctgaag tccttcaccg tcgagaaggg 960 catctaccag accagcaatt tccgcgtgca gcccaccgag agcatcgtgc gcttccccaa 1020 tatcaccaat ctgtgcccct tcggcgaggt gttcaatgcc acacgctttg cctccgtgta 1080 cgcctggaat cgcaagcgca ttagcaactg cgtggccgac tactccgtgc tgtacaatag 1140 cgccagcttc agcaccttca agtgctacgg cgtgtcaccc accaagctga acgacctgtg 1200 cttcaccaat gtgtacgccg acagcttcgt gatccgcgga gatgaagtgc gacagattgc 1260 cccaggccag accggcaaga tcgccgacta caattacaag ctgcccgacg acttcaccgg 1320 ctgcgtgatc gcctggaaca gcaacaacct ggattccaaa gtcggcggca actacaacta 1380 cctgtaccgc ctgttccgca agagcaatct gaagcccttc gagcgcgaca tcagcaccga 1440 aatctaccag gccggaagca ccccatgcaa cggcgtggaa ggcttcaact gctacttccc 1500 actgcagtcc tacggatttc agcccacaaa tggcgtgggc taccagccat atcgagtggt 1560 ggtgctgagc ttcgaactgc tgcatgctcc agctaccgtg tgcggcccca agaagagtac 1620 caacctggtc aagaacaaat gcgtgaactt caacttcaac ggcctgaccg gaaccggcgt 1680 gctgaccgag agtaacaaga agttcctgcc attccagcag tttggccgcg acattgccga 1740 tacaaccgat gccgttcgcg atccccagac cttggagatc ctggatatta ccccatgctc 1800 cttcggcggc gtgtccgtga ttacaccagg caccaatacc agcaaccagg tggccgttct 1860 gtaccaggat gtgaattgca cagaggtgcc cgtggccatt cacgccgatc aattgacacc 1920 aacatggcgc gtgtactcca ccggcagcaa tgtgtttcaa acccgcgctg gatgcctgat 1980 tggagccgag cacgtgaaca atagctacga gtgcgatatc cccatcggag ccggaatctg 2040 cgcctcctat cagacccaga ccaatagtcc acgacgagcc cgaagtgtgg ccagccagag 2100 catcattgcc tataccatga gcctgggcgc cgagaatagc gtggcctact ccaacaacag 2160 cattgctatc cccaccaact tcaccatcag cgtgaccacc gagatcctgc cagtgtccat 2220 gaccaagacc agcgtggact gcaccatgta catctgcgga gatagcaccg agtgcagcaa 2280 cctgctgctg cagtacggaa gtttctgcac ccagctgaat cgcgccctga caggcattgc 2340 cgtggaacag gataagaaca cccaagaggt gttcgcccaa gtgaagcaaa tctacaagac 2400 cccaccaatc aaggatttcg gcggcttcaa tttcagccag attctgcccg atccaagcaa 2460 gcccagcaag cgcagcttca tcgaggacct gctgttcaac aaagtgacac tggccgacgc 2520 cggattcatc aagcagtatg gcgattgcct gggcgatatt gccgcacgcg atctgatttg 2580 cgcccagaag tttaacggac tgaccgtcct gccaccactg ctgacagatg agatgatcgc 2640 ccagtacaca agtgccctgc tggccggaac cattaccagc ggatggacat ttggagccgg 2700 tgccgctctg cagattccct tcgctatgca gatggcctac cgcttcaatg gcattggcgt 2760 gacccagaat gtgctgtacg agaaccagaa gctgatcgcc aaccagttca acagcgccat 2820 cggcaagatt caggacagcc tgagtagtac cgccagcgct ctgggaaagc tgcaggatgt 2880 ggtcaaccag aacgctcagg ccctgaacac cctggttaag cagctgagca gcaacttcgg 2940 cgccatcagt agcgtgctga acgatatcct gagccgcctg gatccaccag aagccgaggt 3000 gcagatcgat cgcctgatta ccggacgcct gcagtccctg cagacctatg tgacacagca 3060 gctgatccga gccgccgaga ttcgagctag tgctaatctg gccgccacca agatgagcga 3120 atgtgtgctg ggacagagca agcgcgtgga cttttgcggc aagggatacc acctgatgag 3180 cttcccacag agtgctccac acggcgtggt gtttctgcat gtgacctacg tgcccgctca 3240 agagaagaat ttcaccaccg ctccagccat ctgccacgac ggaaaggccc attttccacg 3300 cgagggcgtg ttcgttagca acggcactca ttggttcgtc acccagcgca acttctacga 3360 gccccagatc atcaccaccg acaacacctt cgtcagcggc aactgcgacg tcgtgatcgg 3420 cattgtgaac aacaccgtgt acgatccact gcagcccgag ctggacagct tcaaagagga 3480 actggacaag tactttaaga accacacaag ccccgacgtg gacctgggag acattagcgg 3540 aatcaacgcc agcgtggtca acatccagaa agagattgac cgcctgaacg aggtggccaa 3600 gaatctgaac gagagcctga tcgacctgca agaactgggc aaatacgagc agtacattaa 3660 gtgataacga gcgcgctact 3680 <210> 9 <211> 1211 <212> PRT <213> Artificial sequence <220> <223> Stabilized form of the spike (stab-Secto) ectodomain polypeptide of nCoV <400> 9 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile 885 890 895 Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 1010 1015 1020 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys 1025 1030 1035 Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1040 1045 1050 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val 1055 1060 1065 Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His 1070 1075 1080 Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn 1085 1090 1095 Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln 1100 1105 1110 Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val 1115 1120 1125 Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro 1130 1135 1140 Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn 1145 1150 1155 His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn 1160 1165 1170 Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu 1175 1180 1185 Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu 1190 1195 1200 Gly Lys Tyr Glu Gln Tyr Ile Lys 1205 1210 <210> 10 <211> 2090 <212> DNA <213> Artificial sequence <220> <223> Codon-optimized nucleotide sequence of the S1 polypeptide of nCoV <400> 10 actagctagc ggatcccgta cggccaccat gttcgtgttt ctggtgctgc tgccactggt 60 gtccagtcag tgcgtgaacc tgaccacacg aacacagctg ccaccagcct acaccaatag 120 cttcacccgc ggagtgtact accccgacaa ggtgttccgc agcagcgtgc tgcatagcac 180 ccaggatctg tttctgccct tcttcagcaa cgtgacctgg ttccacgcca tccacgtgtc 240 cggcaccaat ggcaccaagc gcttcgataa tcccgtgctg cccttcaacg atggcgtgta 300 ctttgccagc accgagaagt ccaatatcat ccgcggctgg atcttcggca ccacactgga 360 tagcaagacc cagagcctgc tgatcgtgaa caacgccacc aacgtggtca tcaaagtgtg 420 cgagttccag ttctgcaacg accccttcct gggcgtctac taccacaaga acaacaagag 480 ctggatggaa agcgagttcc gcgtgtacag cagcgccaac aactgcacct tcgagtacgt 540 gtcccagcca ttcctgatgg acctggaagg caagcagggc aacttcaaga acctgcgcga 600 gttcgtgttc aagaacatcg acggctactt caaaatctac agcaagcaca ccccaatcaa 660 cctcgtgcgc gatctgccac agggattcag tgctctggaa cccctggtgg atctgcccat 720 cggcatcaac attacccgct ttcagacact gctggccctg caccgcagtt acttgacacc 780 aggcgatagc agcagtggat ggacagctgg tgccgccgct tactacgttg gatatctgca 840 gccacgcacc tttctgctga agtacaacga gaacggcacc atcaccgacg ccgtggattg 900 tgctctcgat cccctgagcg agacaaagtg caccctgaag tccttcaccg tcgagaaggg 960 catctaccag accagcaatt tccgcgtgca gcccaccgag agcatcgtgc gcttccccaa 1020 tatcaccaat ctgtgcccct tcggcgaggt gttcaatgcc acacgctttg cctccgtgta 1080 cgcctggaat cgcaagcgca ttagcaactg cgtggccgac tactccgtgc tgtacaatag 1140 cgccagcttc agcaccttca agtgctacgg cgtgtcaccc accaagctga acgacctgtg 1200 cttcaccaat gtgtacgccg acagcttcgt gatccgcgga gatgaagtgc gacagattgc 1260 cccaggccag accggcaaga tcgccgacta caattacaag ctgcccgacg acttcaccgg 1320 ctgcgtgatc gcctggaaca gcaacaacct ggattccaaa gtcggcggca actacaacta 1380 cctgtaccgc ctgttccgca agagcaatct gaagcccttc gagcgcgaca tcagcaccga 1440 aatctaccag gccggaagca ccccatgcaa cggcgtggaa ggcttcaact gctacttccc 1500 actgcagtcc tacggatttc agcccacaaa tggcgtgggc taccagccat atcgagtggt 1560 ggtgctgagc ttcgaactgc tgcatgctcc agctaccgtg tgcggcccca agaagagtac 1620 caacctggtc aagaacaaat gcgtgaactt caacttcaac ggcctgaccg gaaccggcgt 1680 gctgaccgag agtaacaaga agttcctgcc attccagcag tttggccgcg acattgccga 1740 tacaaccgat gccgttcgcg atccccagac cttggagatc ctggatatta ccccatgctc 1800 cttcggcggc gtgtccgtga ttacaccagg caccaatacc agcaaccagg tggccgttct 1860 gtaccaggat gtgaattgca cagaggtgcc cgtggccatt cacgccgatc aattgacacc 1920 aacatggcgc gtgtactcca ccggcagcaa tgtgtttcaa acccgcgctg gatgcctgat 1980 tggagccgag cacgtgaaca atagctacga gtgcgatatc cccatcggag ccggaatctg 2040 cgcctcctat cagacccaga ccaatagtcc atgataacga gcgcgctact 2090 <210> 11 <211> 681 <212> PRT <213> Artificial sequence <220> <223> S1 polypeptide of nCoV <400> 11 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro 675 680 <210> 12 <211> 1860 <212> DNA <213> Artificial sequence <220> <223> Codon-optimized nucleotide sequence of the S2 polypeptide of nCoV <400> 12 gctagcggat cccgtacggc caccatgttc gtgtttctgg tgctgctgcc actggtgtcc 60 agtcaggccg gcagtgtggc cagccagagc atcattgcct ataccatgag cctgggcgcc 120 gagaatagcg tggcctactc caacaacagc attgctatcc ccaccaactt caccatcagc 180 gtgaccaccg agatcctgcc agtgtccatg accaagacca gcgtggactg caccatgtac 240 atctgcggag atagcaccga gtgcagcaac ctgctgctgc agtacggaag tttctgcacc 300 cagctgaatc gcgccctgac aggcattgcc gtggaacagg ataagaacac ccaagaggtg 360 ttcgcccaag tgaagcaaat ctacaagacc ccaccaatca aggatttcgg cggcttcaat 420 ttcagccaga ttctgcccga tccaagcaag cccagcaagc gcagcttcat cgaggacctg 480 ctgttcaaca aagtgacact ggccgacgcc ggattcatca agcagtatgg cgattgcctg 540 ggcgatattg ccgcacgcga tctgatttgc gcccagaagt ttaacggact gaccgtcctg 600 ccaccactgc tgacagatga gatgatcgcc cagtacacaa gtgccctgct ggccggaacc 660 attaccagcg gatggacatt tggagccggt gccgctctgc agattccctt cgctatgcag 720 atggcctacc gcttcaatgg cattggcgtg acccagaatg tgctgtacga gaaccagaag 780 ctgatcgcca accagttcaa cagcgccatc ggcaagattc aggacagcct gagtagtacc 840 gccagcgctc tgggaaagct gcaggatgtg gtcaaccaga acgctcaggc cctgaacacc 900 ctggttaagc agctgagcag caacttcggc gccatcagta gcgtgctgaa cgatatcctg 960 agccgcctgg ataaggtgga agccgaggtg cagatcgatc gcctgattac cggacgcctg 1020 cagtccctgc agacctatgt gacacagcag ctgatccgag ccgccgagat tcgagctagt 1080 gctaatctgg ccgccaccaa gatgagcgaa tgtgtgctgg gacagagcaa gcgcgtggac 1140 ttttgcggca agggatacca cctgatgagc ttcccacaga gtgctccaca cggcgtggtg 1200 tttctgcatg tgacctacgt gcccgctcaa gagaagaatt tcaccaccgc tccagccatc 1260 tgccacgacg gaaaggccca ttttccacgc gagggcgtgt tcgttagcaa cggcactcat 1320 tggttcgtca cccagcgcaa cttctacgag ccccagatca tcaccaccga caacaccttc 1380 gtcagcggca actgcgacgt cgtgatcggc attgtgaaca acaccgtgta cgatccactg 1440 cagcccgagc tggacagctt caaagaggaa ctggacaagt actttaagaa ccacacaagc 1500 cccgacgtgg acctgggaga cattagcgga atcaacgcca gcgtggtcaa catccagaaa 1560 gagattgacc gcctgaacga ggtggccaag aatctgaacg agagcctgat cgacctgcaa 1620 gaactgggca aatacgagca gtacattaag tggccctggt acatctggct gggcttcatt 1680 gccggactga ttgccatcgt gatggtcacc attatgctgt gctgcatgac cagttgctgc 1740 agctgcctga agggatgctg cagttgcgga agctgctgca agttcgacga ggatgatagc 1800 gagccagtgc tgaagggcgt caagctgcac tacacctgat aagcgcgcct cgaggaattc 1860 <210> 13 <211> 604 <212> PRT <213> Artificial sequence <220> <223> S2 polypeptide of nCoV <400> 13 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Ala Gly 1 5 10 15 Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala 20 25 30 Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn 35 40 45 Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys 50 55 60 Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys 65 70 75 80 Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg 85 90 95 Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val 100 105 110 Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe 115 120 125 Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser 130 135 140 Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala 145 150 155 160 Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala 165 170 175 Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu 180 185 190 Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu 195 200 205 Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala 210 215 220 Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile 225 230 235 240 Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn 245 250 255 Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr 260 265 270 Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln 275 280 285 Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile 290 295 300 Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala 305 310 315 320 Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln 325 330 335 Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser 340 345 350 Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser 355 360 365 Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 370 375 380 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro 385 390 395 400 Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly 405 410 415 Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His 420 425 430 Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr 435 440 445 Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val 450 455 460 Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys 465 470 475 480 Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp 485 490 495 Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys 500 505 510 Glu Ile Asp Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu 515 520 525 Ile Asp Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro 530 535 540 Trp Tyr Ile Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met 545 550 555 560 Val Thr Ile Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys 565 570 575 Gly Cys Cys Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser 580 585 590 Glu Pro Val Leu Lys Gly Val Lys Leu His Tyr Thr 595 600 <210> 14 <211> 1860 <212> DNA <213> Artificial sequence <220> <223> Codon-optimized nucleotide sequence of the stabilized form of the S2 (stab-S2) polypeptide of nCoV <400> 14 gctagcagat ctcgtacggc caccatgttc gtgtttctgg tgctgctgcc actggtgtcc 60 agtcaggccg gcagtgtggc cagccagagc atcattgcct ataccatgag cctgggcgcc 120 gagaatagcg tggcctactc caacaacagc attgctatcc ccaccaactt caccatcagc 180 gtgaccaccg agatcctgcc agtgtccatg accaagacca gcgtggactg caccatgtac 240 atctgcggag atagcaccga gtgcagcaac ctgctgctgc agtacggaag tttctgcacc 300 cagctgaatc gcgccctgac aggcattgcc gtggaacagg ataagaacac ccaagaggtg 360 ttcgcccaag tgaagcaaat ctacaagacc ccaccaatca aggatttcgg cggcttcaat 420 ttcagccaga ttctgcccga tccaagcaag cccagcaagc gcagcttcat cgaggacctg 480 ctgttcaaca aagtgacact ggccgacgcc ggattcatca agcagtatgg cgattgcctg 540 ggcgatattg ccgcacgcga tctgatttgc gcccagaagt ttaacggact gaccgtcctg 600 ccaccactgc tgacagatga gatgatcgcc cagtacacaa gtgccctgct ggccggaacc 660 attaccagcg gatggacatt tggagccggt gccgctctgc agattccctt cgctatgcag 720 atggcctacc gcttcaatgg cattggcgtg acccagaatg tgctgtacga gaaccagaag 780 ctgatcgcca accagttcaa cagcgccatc ggcaagattc aggacagcct gagtagtacc 840 gccagcgctc tgggaaagct gcaggatgtg gtcaaccaga acgctcaggc cctgaacacc 900 ctggttaagc agctgagcag caacttcggc gccatcagta gcgtgctgaa cgatatcctg 960 agccgcctgg atccaccaga agccgaggtg cagatcgatc gcctgattac cggacgcctg 1020 cagtccctgc agacctatgt gacacagcag ctgatccgag ccgccgagat tcgagctagt 1080 gctaatctgg ccgccaccaa gatgagcgaa tgtgtgctgg gacagagcaa gcgcgtggac 1140 ttttgcggca agggatacca cctgatgagc ttcccacaga gtgctccaca cggcgtggtg 1200 tttctgcatg tgacctacgt gcccgctcaa gagaagaatt tcaccaccgc tccagccatc 1260 tgccacgacg gaaaggccca ttttccacgc gagggcgtgt tcgttagcaa cggcactcat 1320 tggttcgtca cccagcgcaa cttctacgag ccccagatca tcaccaccga caacaccttc 1380 gtcagcggca actgcgacgt cgtgatcggc attgtgaaca acaccgtgta cgatccactg 1440 cagcccgagc tggacagctt caaagaggaa ctggacaagt actttaagaa ccacacaagc 1500 cccgacgtgg acctgggaga cattagcgga atcaacgcca gcgtggtcaa catccagaaa 1560 gagattgacc gcctgaacga ggtggccaag aatctgaacg agagcctgat cgacctgcaa 1620 gaactgggca aatacgagca gtacattaag tggccctggt acatctggct gggcttcatt 1680 gccggactga ttgccatcgt gatggtcacc attatgctgt gctgcatgac cagttgctgc 1740 agctgcctga agggatgctg cagttgcgga agctgctgca agttcgacga ggatgatagc 1800 gagccagtgc tgaagggcgt caagctgcac tacacctgat aagcgcgcct cgaggaattc 1860 <210> 15 <211> 604 <212> PRT <213> Artificial sequence <220> <223> Stabilized form of the S2 polypeptide (stab-S2) of nCoV <400> 15 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Ala Gly 1 5 10 15 Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala 20 25 30 Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn 35 40 45 Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys 50 55 60 Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys 65 70 75 80 Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg 85 90 95 Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val 100 105 110 Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe 115 120 125 Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser 130 135 140 Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala 145 150 155 160 Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala 165 170 175 Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu 180 185 190 Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu 195 200 205 Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala 210 215 220 Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile 225 230 235 240 Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn 245 250 255 Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr 260 265 270 Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln 275 280 285 Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile 290 295 300 Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala 305 310 315 320 Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln 325 330 335 Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser 340 345 350 Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser 355 360 365 Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 370 375 380 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro 385 390 395 400 Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly 405 410 415 Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His 420 425 430 Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr 435 440 445 Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val 450 455 460 Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys 465 470 475 480 Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp 485 490 495 Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys 500 505 510 Glu Ile Asp Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu 515 520 525 Ile Asp Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro 530 535 540 Trp Tyr Ile Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met 545 550 555 560 Val Thr Ile Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys 565 570 575 Gly Cys Cys Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser 580 585 590 Glu Pro Val Leu Lys Gly Val Lys Leu His Tyr Thr 595 600 <210> 16 <211> 3772 <212> DNA <213> Artificial sequence <220> <223> Codon-optimized nucleotide sequence of the soluble and trimerized form of the spike (tri-Secto) polypeptide of nCoV <400> 16 actagctagc ggatcccgta cggccaccat gttcgtgttt ctggtgctgc tgccactggt 60 gtccagtcag tgcgtgaacc tgaccacacg aacacagctg ccaccagcct acaccaatag 120 cttcacccgc ggagtgtact accccgacaa ggtgttccgc agcagcgtgc tgcatagcac 180 ccaggatctg tttctgccct tcttcagcaa cgtgacctgg ttccacgcca tccacgtgtc 240 cggcaccaat ggcaccaagc gcttcgataa tcccgtgctg cccttcaacg atggcgtgta 300 ctttgccagc accgagaagt ccaatatcat ccgcggctgg atcttcggca ccacactgga 360 tagcaagacc cagagcctgc tgatcgtgaa caacgccacc aacgtggtca tcaaagtgtg 420 cgagttccag ttctgcaacg accccttcct gggcgtctac taccacaaga acaacaagag 480 ctggatggaa agcgagttcc gcgtgtacag cagcgccaac aactgcacct tcgagtacgt 540 gtcccagcca ttcctgatgg acctggaagg caagcagggc aacttcaaga acctgcgcga 600 gttcgtgttc aagaacatcg acggctactt caaaatctac agcaagcaca ccccaatcaa 660 cctcgtgcgc gatctgccac agggattcag tgctctggaa cccctggtgg atctgcccat 720 cggcatcaac attacccgct ttcagacact gctggccctg caccgcagtt acttgacacc 780 aggcgatagc agcagtggat ggacagctgg tgccgccgct tactacgttg gatatctgca 840 gccacgcacc tttctgctga agtacaacga gaacggcacc atcaccgacg ccgtggattg 900 tgctctcgat cccctgagcg agacaaagtg caccctgaag tccttcaccg tcgagaaggg 960 catctaccag accagcaatt tccgcgtgca gcccaccgag agcatcgtgc gcttccccaa 1020 tatcaccaat ctgtgcccct tcggcgaggt gttcaatgcc acacgctttg cctccgtgta 1080 cgcctggaat cgcaagcgca ttagcaactg cgtggccgac tactccgtgc tgtacaatag 1140 cgccagcttc agcaccttca agtgctacgg cgtgtcaccc accaagctga acgacctgtg 1200 cttcaccaat gtgtacgccg acagcttcgt gatccgcgga gatgaagtgc gacagattgc 1260 cccaggccag accggcaaga tcgccgacta caattacaag ctgcccgacg acttcaccgg 1320 ctgcgtgatc gcctggaaca gcaacaacct ggattccaaa gtcggcggca actacaacta 1380 cctgtaccgc ctgttccgca agagcaatct gaagcccttc gagcgcgaca tcagcaccga 1440 aatctaccag gccggaagca ccccatgcaa cggcgtggaa ggcttcaact gctacttccc 1500 actgcagtcc tacggatttc agcccacaaa tggcgtgggc taccagccat atcgagtggt 1560 ggtgctgagc ttcgaactgc tgcatgctcc agctaccgtg tgcggcccca agaagagtac 1620 caacctggtc aagaacaaat gcgtgaactt caacttcaac ggcctgaccg gaaccggcgt 1680 gctgaccgag agtaacaaga agttcctgcc attccagcag tttggccgcg acattgccga 1740 tacaaccgat gccgttcgcg atccccagac cttggagatc ctggatatta ccccatgctc 1800 cttcggcggc gtgtccgtga ttacaccagg caccaatacc agcaaccagg tggccgttct 1860 gtaccaggat gtgaattgca cagaggtgcc cgtggccatt cacgccgatc aattgacacc 1920 aacatggcgc gtgtactcca ccggcagcaa tgtgtttcaa acccgcgctg gatgcctgat 1980 tggagccgag cacgtgaaca atagctacga gtgcgatatc cccatcggag ccggaatctg 2040 cgcctcctat cagacccaga ccaatagtcc acgacgagcc cgaagtgtgg ccagccagag 2100 catcattgcc tataccatga gcctgggcgc cgagaatagc gtggcctact ccaacaacag 2160 cattgctatc cccaccaact tcaccatcag cgtgaccacc gagatcctgc cagtgtccat 2220 gaccaagacc agcgtggact gcaccatgta catctgcgga gatagcaccg agtgcagcaa 2280 cctgctgctg cagtacggaa gtttctgcac ccagctgaat cgcgccctga caggcattgc 2340 cgtggaacag gataagaaca cccaagaggt gttcgcccaa gtgaagcaaa tctacaagac 2400 cccaccaatc aaggatttcg gcggcttcaa tttcagccag attctgcccg atccaagcaa 2460 gcccagcaag cgcagcttca tcgaggacct gctgttcaac aaagtgacac tggccgacgc 2520 cggattcatc aagcagtatg gcgattgcct gggcgatatt gccgcacgcg atctgatttg 2580 cgcccagaag tttaacggac tgaccgtcct gccaccactg ctgacagatg agatgatcgc 2640 ccagtacaca agtgccctgc tggccggaac cattaccagc ggatggacat ttggagccgg 2700 tgccgctctg cagattccct tcgctatgca gatggcctac cgcttcaatg gcattggcgt 2760 gacccagaat gtgctgtacg agaaccagaa gctgatcgcc aaccagttca acagcgccat 2820 cggcaagatt caggacagcc tgagtagtac cgccagcgct ctgggaaagc tgcaggatgt 2880 ggtcaaccag aacgctcagg ccctgaacac cctggttaag cagctgagca gcaacttcgg 2940 cgccatcagt agcgtgctga acgatatcct gagccgcctg gataaggtgg aagccgaggt 3000 gcagatcgat cgcctgatta ccggacgcct gcagtccctg cagacctatg tgacacagca 3060 gctgatccga gccgccgaga ttcgagctag tgctaatctg gccgccacca agatgagcga 3120 atgtgtgctg ggacagagca agcgcgtgga cttttgcggc aagggatacc acctgatgag 3180 cttcccacag agtgctccac acggcgtggt gtttctgcat gtgacctacg tgcccgctca 3240 agagaagaat ttcaccaccg ctccagccat ctgccacgac ggaaaggccc attttccacg 3300 cgagggcgtg ttcgttagca acggcactca ttggttcgtc acccagcgca acttctacga 3360 gccccagatc atcaccaccg acaacacctt cgtcagcggc aactgcgacg tcgtgatcgg 3420 cattgtgaac aacaccgtgt acgatccact gcagcccgag ctggacagct tcaaagagga 3480 actggacaag tactttaaga accacacaag ccccgacgtg gacctgggag acattagcgg 3540 aatcaacgcc agcgtggtca acatccagaa agagattgac cgcctgaacg aggtggccaa 3600 gaatctgaac gagagcctga tcgacctgca agaactgggc aaatacgagc agtacattaa 3660 gtccggaggc tacatccccg aggccccacg cgatggccag gcctacgtgc gcaaggacgg 3720 cgagtgggtg ctgctgtcca ccttcctgtg ataagcgcgc ctcgaggaat tc 3772 <210> 17 <211> 1240 <212> PRT <213> Artificial sequence <220> <223> Soluble and trimerized form of the spike (tri-Secto) polypeptide of nCoV <400> 17 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile 885 890 895 Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 1010 1015 1020 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys 1025 1030 1035 Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1040 1045 1050 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val 1055 1060 1065 Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His 1070 1075 1080 Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn 1085 1090 1095 Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln 1100 1105 1110 Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val 1115 1120 1125 Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro 1130 1135 1140 Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn 1145 1150 1155 His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn 1160 1165 1170 Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu 1175 1180 1185 Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu 1190 1195 1200 Gly Lys Tyr Glu Gln Tyr Ile Lys Ser Gly Gly Tyr Ile Pro Glu 1205 1210 1215 Ala Pro Arg Asp Gly Gln Ala Tyr Val Arg Lys Asp Gly Glu Trp 1220 1225 1230 Val Leu Leu Ser Thr Phe Leu 1235 1240 <210> 18 <211> 3772 <212> DNA <213> Artificial sequence <220> <223> Codon-optimized nucleotide sequence of the stabilized and trimerized form of the spike ectodomain (tristab-Secto) polypeptide of nCoV <400> 18 actagctagc agatctcgta cggccaccat gttcgtgttt ctggtgctgc tgccactggt 60 gtccagtcag tgcgtgaacc tgaccacacg aacacagctg ccaccagcct acaccaatag 120 cttcacccgc ggagtgtact accccgacaa ggtgttccgc agcagcgtgc tgcatagcac 180 ccaggatctg tttctgccct tcttcagcaa cgtgacctgg ttccacgcca tccacgtgtc 240 cggcaccaat ggcaccaagc gcttcgataa tcccgtgctg cccttcaacg atggcgtgta 300 ctttgccagc accgagaagt ccaatatcat ccgcggctgg atcttcggca ccacactgga 360 tagcaagacc cagagcctgc tgatcgtgaa caacgccacc aacgtggtca tcaaagtgtg 420 cgagttccag ttctgcaacg accccttcct gggcgtctac taccacaaga acaacaagag 480 ctggatggaa agcgagttcc gcgtgtacag cagcgccaac aactgcacct tcgagtacgt 540 gtcccagcca ttcctgatgg acctggaagg caagcagggc aacttcaaga acctgcgcga 600 gttcgtgttc aagaacatcg acggctactt caaaatctac agcaagcaca ccccaatcaa 660 cctcgtgcgc gatctgccac agggattcag tgctctggaa cccctggtgg atctgcccat 720 cggcatcaac attacccgct ttcagacact gctggccctg caccgcagtt acttgacacc 780 aggcgatagc agcagtggat ggacagctgg tgccgccgct tactacgttg gatatctgca 840 gccacgcacc tttctgctga agtacaacga gaacggcacc atcaccgacg ccgtggattg 900 tgctctcgat cccctgagcg agacaaagtg caccctgaag tccttcaccg tcgagaaggg 960 catctaccag accagcaatt tccgcgtgca gcccaccgag agcatcgtgc gcttccccaa 1020 tatcaccaat ctgtgcccct tcggcgaggt gttcaatgcc acacgctttg cctccgtgta 1080 cgcctggaat cgcaagcgca ttagcaactg cgtggccgac tactccgtgc tgtacaatag 1140 cgccagcttc agcaccttca agtgctacgg cgtgtcaccc accaagctga acgacctgtg 1200 cttcaccaat gtgtacgccg acagcttcgt gatccgcgga gatgaagtgc gacagattgc 1260 cccaggccag accggcaaga tcgccgacta caattacaag ctgcccgacg acttcaccgg 1320 ctgcgtgatc gcctggaaca gcaacaacct ggattccaaa gtcggcggca actacaacta 1380 cctgtaccgc ctgttccgca agagcaatct gaagcccttc gagcgcgaca tcagcaccga 1440 aatctaccag gccggaagca ccccatgcaa cggcgtggaa ggcttcaact gctacttccc 1500 actgcagtcc tacggatttc agcccacaaa tggcgtgggc taccagccat atcgagtggt 1560 ggtgctgagc ttcgaactgc tgcatgctcc agctaccgtg tgcggcccca agaagagtac 1620 caacctggtc aagaacaaat gcgtgaactt caacttcaac ggcctgaccg gaaccggcgt 1680 gctgaccgag agtaacaaga agttcctgcc attccagcag tttggccgcg acattgccga 1740 tacaaccgat gccgttcgcg atccccagac cttggagatc ctggatatta ccccatgctc 1800 cttcggcggc gtgtccgtga ttacaccagg caccaatacc agcaaccagg tggccgttct 1860 gtaccaggat gtgaattgca cagaggtgcc cgtggccatt cacgccgatc aattgacacc 1920 aacatggcgc gtgtactcca ccggcagcaa tgtgtttcaa acccgcgctg gatgcctgat 1980 tggagccgag cacgtgaaca atagctacga gtgcgatatc cccatcggag ccggaatctg 2040 cgcctcctat cagacccaga ccaatagtcc acgacgagcc cgaagtgtgg ccagccagag 2100 catcattgcc tataccatga gcctgggcgc cgagaatagc gtggcctact ccaacaacag 2160 cattgctatc cccaccaact tcaccatcag cgtgaccacc gagatcctgc cagtgtccat 2220 gaccaagacc agcgtggact gcaccatgta catctgcgga gatagcaccg agtgcagcaa 2280 cctgctgctg cagtacggaa gtttctgcac ccagctgaat cgcgccctga caggcattgc 2340 cgtggaacag gataagaaca cccaagaggt gttcgcccaa gtgaagcaaa tctacaagac 2400 cccaccaatc aaggatttcg gcggcttcaa tttcagccag attctgcccg atccaagcaa 2460 gcccagcaag cgcagcttca tcgaggacct gctgttcaac aaagtgacac tggccgacgc 2520 cggattcatc aagcagtatg gcgattgcct gggcgatatt gccgcacgcg atctgatttg 2580 cgcccagaag tttaacggac tgaccgtcct gccaccactg ctgacagatg agatgatcgc 2640 ccagtacaca agtgccctgc tggccggaac cattaccagc ggatggacat ttggagccgg 2700 tgccgctctg cagattccct tcgctatgca gatggcctac cgcttcaatg gcattggcgt 2760 gacccagaat gtgctgtacg agaaccagaa gctgatcgcc aaccagttca acagcgccat 2820 cggcaagatt caggacagcc tgagtagtac cgccagcgct ctgggaaagc tgcaggatgt 2880 ggtcaaccag aacgctcagg ccctgaacac cctggttaag cagctgagca gcaacttcgg 2940 cgccatcagt agcgtgctga acgatatcct gagccgcctg gatccaccag aagccgaggt 3000 gcagatcgat cgcctgatta ccggacgcct gcagtccctg cagacctatg tgacacagca 3060 gctgatccga gccgccgaga ttcgagctag tgctaatctg gccgccacca agatgagcga 3120 atgtgtgctg ggacagagca agcgcgtgga cttttgcggc aagggatacc acctgatgag 3180 cttcccacag agtgctccac acggcgtggt gtttctgcat gtgacctacg tgcccgctca 3240 agagaagaat ttcaccaccg ctccagccat ctgccacgac ggaaaggccc attttccacg 3300 cgagggcgtg ttcgttagca acggcactca ttggttcgtc acccagcgca acttctacga 3360 gccccagatc atcaccaccg acaacacctt cgtcagcggc aactgcgacg tcgtgatcgg 3420 cattgtgaac aacaccgtgt acgatccact gcagcccgag ctggacagct tcaaagagga 3480 actggacaag tactttaaga accacacaag ccccgacgtg gacctgggag acattagcgg 3540 aatcaacgcc agcgtggtca acatccagaa agagattgac cgcctgaacg aggtggccaa 3600 gaatctgaac gagagcctga tcgacctgca agaactgggc aaatacgagc agtacattaa 3660 gtccggaggc tacatccccg aggccccacg cgatggccag gcctacgtgc gcaaggacgg 3720 cgagtgggtg ctgctgtcca ccttcctgtg ataagcgcgc ctcgaggaat tc 3772 <210> 19 <211> 1240 <212> PRT <213> Artificial sequence <220> <223> Stabilized and trimerized form of the spike ectodomain (tristab-Secto) polypeptide of nCoV <400> 19 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile 885 890 895 Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 1010 1015 1020 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys 1025 1030 1035 Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1040 1045 1050 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val 1055 1060 1065 Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His 1070 1075 1080 Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn 1085 1090 1095 Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln 1100 1105 1110 Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val 1115 1120 1125 Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro 1130 1135 1140 Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn 1145 1150 1155 His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn 1160 1165 1170 Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu 1175 1180 1185 Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu 1190 1195 1200 Gly Lys Tyr Glu Gln Tyr Ile Lys Ser Gly Gly Tyr Ile Pro Glu 1205 1210 1215 Ala Pro Arg Asp Gly Gln Ala Tyr Val Arg Lys Asp Gly Glu Trp 1220 1225 1230 Val Leu Leu Ser Thr Phe Leu 1235 1240 <210> 20 <211> 1308 <212> DNA <213> Artificial sequence <220> <223> Native nucleotide sequence of the N polypeptide of CoV <400> 20 gctagcggat cccgtacggc caccatgtct gataatggac cccaaaatca gcgaaatgca 60 ccccgcatta cgtttggtgg accctcagat tcaactggca gtaaccagaa tggagaacgc 120 agtggggcgc gatcaaaaca acgtcggccc caaggtttac ccaataatac tgcgtcttgg 180 ttcaccgctc tcactcaaca tggcaaggaa gaccttaaat tccctcgagg acaaggcgtt 240 ccaattaaca ccaatagcag tccagatgac caaattggct actaccgaag agctaccaga 300 cgaattcgtg gtggtgacgg taaaatgaaa gatctcagtc caagatggta tttctactac 360 ctaggaactg ggccagaagc tggacttccc tatggtgcta acaaagacgg catcatatgg 420 gttgcaactg agggagcctt gaatacacca aaagatcaca ttggcacccg caatcctgct 480 aacaatgctg caatcgtgct acaacttcct caaggaacaa cattgccaaa aggcttctac 540 gcagaaggga gcagaggcgg cagtcaagcc tcttctcgtt cctcatcacg tagtcgcaac 600 agttcaagaa attcaactcc aggcagcagt aggggaactt ctcctgctag aatggctggc 660 aatggcggtg atgctgctct tgctttgctg ctgcttgaca gattgaacca gcttgagagc 720 aaaatgtctg gtaaaggcca acaacaacaa ggccaaactg tcactaagaa atctgctgct 780 gaggcttcta agaagcctcg gcaaaaacgt actgccacta aagcatacaa tgtaacacaa 840 gctttcggca gacgtggtcc agaacaaacc caaggaaatt ttggggacca ggaactaatc 900 agacaaggaa ctgattacaa acattggccg caaattgcac aatttgcccc cagcgcttca 960 gcgttcttcg gaatgtcgcg cattggcatg gaagtcacac cttcgggaac gtggttgacc 1020 tacacaggtg ccatcaaatt ggatgacaaa gatccaaatt tcaaagatca agtcattttg 1080 ctgaataagc atattgacgc atacaaaaca ttcccaccaa cagagcctaa aaaggacaaa 1140 aagaagaagg ctgatgaaac tcaagcctta ccgcagagac agaagaaaca gcaaactgtg 1200 actcttcttc ctgctgcaga tttggatgat ttctccaaac aattgcaaca atccatgagc 1260 agtgctgact caactcaggc ctgataacga gcgcgcctcg aggaattc 1308 <210> 21 <211> 1308 <212> DNA <213> Artificial sequence <220> <223> Codon-optimized nucleotide sequence of the N polypeptide of CoV <400> 21 gctagcggat cccgtacggc caccatgagc gataatggac cccagaatca gcgcaacgcc 60 ccacgcatta ccttcggagg accaagcgat agcaccggca gcaatcagaa tggcgaacga 120 agcggagccc gaagcaaaca gcgacgacca cagggactgc caaacaacac cgccagttgg 180 tttaccgctc tgacccagca cggcaaagag gacctgaagt ttccacgagg acagggcgtg 240 cccatcaaca ccaatagcag cccagacgac cagatcggct actatcgacg agccacacga 300 cgcattcgag gcggcgacgg aaagatgaag gatctgagcc cacgctggta cttctactac 360 ctcggaacag gaccagaggc cggactgcca tatggtgcca acaaggatgg catcatctgg 420 gttgccaccg aaggcgccct gaacacccca aaggatcaca ttggaacccg caatccagcc 480 aacaacgccg ccattgtgct gcagttgcca cagggaacaa cactgcccaa gggattctac 540 gctgagggaa gtcgcggagg aagccaggcc agtagtcgca gtagtagccg cagccgcaat 600 agctcccgaa atagcacacc cggaagcagc cgaggaacca gtccagctcg aatggctgga 660 aatggcggag atgctgctct ggctctgctg ctgctggatc gcctgaatca gctggaaagc 720 aagatgagcg gcaagggcca gcagcaacag ggacagaccg tgacaaagaa gagtgccgcc 780 gaagccagca agaagccacg acagaagcga accgccacca aggcctataa tgtgacccag 840 gcctttggac gacgcggacc agaacagacc cagggcaatt tcggcgatca agagctgatt 900 cgccagggca ccgattacaa gcactggcca cagattgccc agtttgcccc aagcgccagc 960 gccttctttg gaatgagccg catcggaatg gaagtgaccc caagtggaac ctggctgacc 1020 tacacaggcg ccatcaagct ggatgacaag gaccccaact tcaaggacca agtgatcctg 1080 ctgaacaagc acatcgacgc ctacaagacc tttccaccaa ctgagcccaa gaaggacaag 1140 aagaagaagg ccgacgagac acaggctctg ccacagcgcc aaaagaagca gcagaccgtt 1200 acactgctgc cagccgccga cctggatgat ttttccaaac agctgcagca gtccatgagc 1260 agcgccgata gcacacaggc ctgataacga gcgcgcctcg aggaattc 1308 <210> 22 <211> 419 <212> PRT <213> Artificial sequence <220> <223> N polypeptide of CoV <400> 22 Met Ser Asp Asn Gly Pro Gln Asn Gln Arg Asn Ala Pro Arg Ile Thr 1 5 10 15 Phe Gly Gly Pro Ser Asp Ser Thr Gly Ser Asn Gln Asn Gly Glu Arg 20 25 30 Ser Gly Ala Arg Ser Lys Gln Arg Arg Pro Gln Gly Leu Pro Asn Asn 35 40 45 Thr Ala Ser Trp Phe Thr Ala Leu Thr Gln His Gly Lys Glu Asp Leu 50 55 60 Lys Phe Pro Arg Gly Gln Gly Val Pro Ile Asn Thr Asn Ser Ser Pro 65 70 75 80 Asp Asp Gln Ile Gly Tyr Tyr Arg Arg Ala Thr Arg Arg Ile Arg Gly 85 90 95 Gly Asp Gly Lys Met Lys Asp Leu Ser Pro Arg Trp Tyr Phe Tyr Tyr 100 105 110 Leu Gly Thr Gly Pro Glu Ala Gly Leu Pro Tyr Gly Ala Asn Lys Asp 115 120 125 Gly Ile Ile Trp Val Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys Asp 130 135 140 His Ile Gly Thr Arg Asn Pro Ala Asn Asn Ala Ala Ile Val Leu Gln 145 150 155 160 Leu Pro Gln Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala Glu Gly Ser 165 170 175 Arg Gly Gly Ser Gln Ala Ser Ser Arg Ser Ser Ser Arg Ser Arg Asn 180 185 190 Ser Ser Arg Asn Ser Thr Pro Gly Ser Ser Arg Gly Thr Ser Pro Ala 195 200 205 Arg Met Ala Gly Asn Gly Gly Asp Ala Ala Leu Ala Leu Leu Leu Leu 210 215 220 Asp Arg Leu Asn Gln Leu Glu Ser Lys Met Ser Gly Lys Gly Gln Gln 225 230 235 240 Gln Gln Gly Gln Thr Val Thr Lys Lys Ser Ala Ala Glu Ala Ser Lys 245 250 255 Lys Pro Arg Gln Lys Arg Thr Ala Thr Lys Ala Tyr Asn Val Thr Gln 260 265 270 Ala Phe Gly Arg Arg Gly Pro Glu Gln Thr Gln Gly Asn Phe Gly Asp 275 280 285 Gln Glu Leu Ile Arg Gln Gly Thr Asp Tyr Lys His Trp Pro Gln Ile 290 295 300 Ala Gln Phe Ala Pro Ser Ala Ser Ala Phe Phe Gly Met Ser Arg Ile 305 310 315 320 Gly Met Glu Val Thr Pro Ser Gly Thr Trp Leu Thr Tyr Thr Gly Ala 325 330 335 Ile Lys Leu Asp Asp Lys Asp Pro Asn Phe Lys Asp Gln Val Ile Leu 340 345 350 Leu Asn Lys His Ile Asp Ala Tyr Lys Thr Phe Pro Pro Thr Glu Pro 355 360 365 Lys Lys Asp Lys Lys Lys Lys Ala Asp Glu Thr Gln Ala Leu Pro Gln 370 375 380 Arg Gln Lys Lys Gln Gln Thr Val Thr Leu Leu Pro Ala Ala Asp Leu 385 390 395 400 Asp Asp Phe Ser Lys Gln Leu Gln Gln Ser Met Ser Ser Ala Asp Ser 405 410 415 Thr Gln Ala <210> 23 <211> 75 <212> PRT <213> Artificial sequence <220> <223> E polypeptide of CoV <400> 23 Met Tyr Ser Phe Val Ser Glu Glu Thr Gly Thr Leu Ile Val Asn Ser 1 5 10 15 Val Leu Leu Phe Leu Ala Phe Val Val Phe Leu Leu Val Thr Leu Ala 20 25 30 Ile Leu Thr Ala Leu Arg Leu Cys Ala Tyr Cys Cys Asn Ile Val Asn 35 40 45 Val Ser Leu Val Lys Pro Ser Phe Tyr Val Tyr Ser Arg Val Lys Asn 50 55 60 Leu Asn Ser Ser Arg Val Pro Asp Leu Leu Val 65 70 75 <210> 24 <211> 222 <212> PRT <213> Artificial sequence <220> <223> M polypeptide of CoV <400> 24 Met Ala Asp Ser Asn Gly Thr Ile Thr Val Glu Glu Leu Lys Lys Leu 1 5 10 15 Leu Glu Gln Trp Asn Leu Val Ile Gly Phe Leu Phe Leu Thr Trp Ile 20 25 30 Cys Leu Leu Gln Phe Ala Tyr Ala Asn Arg Asn Arg Phe Leu Tyr Ile 35 40 45 Ile Lys Leu Ile Phe Leu Trp Leu Leu Trp Pro Val Thr Leu Ala Cys 50 55 60 Phe Val Leu Ala Ala Val Tyr Arg Ile Asn Trp Ile Thr Gly Gly Ile 65 70 75 80 Ala Ile Ala Met Ala Cys Leu Val Gly Leu Met Trp Leu Ser Tyr Phe 85 90 95 Ile Ala Ser Phe Arg Leu Phe Ala Arg Thr Arg Ser Met Trp Ser Phe 100 105 110 Asn Pro Glu Thr Asn Ile Leu Leu Asn Val Pro Leu His Gly Thr Ile 115 120 125 Leu Thr Arg Pro Leu Leu Glu Ser Glu Leu Val Ile Gly Ala Val Ile 130 135 140 Leu Arg Gly His Leu Arg Ile Ala Gly His His Leu Gly Arg Cys Asp 145 150 155 160 Ile Lys Asp Leu Pro Lys Glu Ile Thr Val Ala Thr Ser Arg Thr Leu 165 170 175 Ser Tyr Tyr Lys Leu Gly Ala Ser Gln Arg Val Ala Gly Asp Ser Gly 180 185 190 Phe Ala Ala Tyr Ser Arg Tyr Arg Ile Gly Asn Tyr Lys Leu Asn Thr 195 200 205 Asp His Ser Ser Ser Ser Asp Asn Ile Ala Leu Leu Val Gln 210 215 220 <210> 25 <211> 121 <212> PRT <213> Artificial sequence <220> <223> ORF8 polypeptide of CoV <400> 25 Met Lys Phe Leu Val Phe Leu Gly Ile Ile Thr Thr Val Ala Ala Phe 1 5 10 15 His Gln Glu Cys Ser Leu Gln Ser Cys Thr Gln His Gln Pro Tyr Val 20 25 30 Val Asp Asp Pro Cys Pro Ile His Phe Tyr Ser Lys Trp Tyr Ile Arg 35 40 45 Val Gly Ala Arg Lys Ser Ala Pro Leu Ile Glu Leu Cys Val Asp Glu 50 55 60 Ala Gly Ser Lys Ser Pro Ile Gln Tyr Ile Asp Ile Gly Asn Tyr Thr 65 70 75 80 Val Ser Cys Leu Pro Phe Thr Ile Asn Cys Gln Glu Pro Lys Leu Gly 85 90 95 Ser Leu Val Val Arg Cys Ser Phe Tyr Glu Asp Phe Leu Glu Tyr His 100 105 110 Asp Val Arg Val Val Leu Asp Phe Ile 115 120 <210> 26 <211> 275 <212> PRT <213> Artificial sequence <220> <223> ORF3a polypeptide of CoV <400> 26 Met Asp Leu Phe Met Arg Ile Phe Thr Ile Gly Thr Val Thr Leu Lys 1 5 10 15 Gln Gly Glu Ile Lys Asp Ala Thr Pro Ser Asp Phe Val Arg Ala Thr 20 25 30 Ala Thr Ile Pro Ile Gln Ala Ser Leu Pro Phe Gly Trp Leu Ile Val 35 40 45 Gly Val Ala Leu Leu Ala Val Phe Gln Ser Ala Ser Lys Ile Ile Thr 50 55 60 Leu Lys Lys Arg Trp Gln Leu Ala Leu Ser Lys Gly Val His Phe Val 65 70 75 80 Cys Asn Leu Leu Leu Leu Phe Val Thr Val Tyr Ser His Leu Leu Leu 85 90 95 Val Ala Ala Gly Leu Glu Ala Pro Phe Leu Tyr Leu Tyr Ala Leu Val 100 105 110 Tyr Phe Leu Gln Ser Ile Asn Phe Val Arg Ile Ile Met Arg Leu Trp 115 120 125 Leu Cys Trp Lys Cys Arg Ser Lys Asn Pro Leu Leu Tyr Asp Ala Asn 130 135 140 Tyr Phe Leu Cys Trp His Thr Asn Cys Tyr Asp Tyr Cys Ile Pro Tyr 145 150 155 160 Asn Ser Val Thr Ser Ser Ile Val Ile Thr Ser Gly Asp Gly Thr Thr 165 170 175 Ser Pro Ile Ser Glu His Asp Tyr Gln Ile Gly Gly Tyr Thr Glu Lys 180 185 190 Trp Glu Ser Gly Val Lys Asp Cys Val Val Leu His Ser Tyr Phe Thr 195 200 205 Ser Asp Tyr Tyr Gln Leu Tyr Ser Thr Gln Leu Ser Thr Asp Thr Gly 210 215 220 Val Glu His Val Thr Phe Phe Ile Tyr Asn Lys Ile Val Asp Glu Pro 225 230 235 240 Glu Glu His Val Gln Ile His Thr Ile Asp Gly Ser Ser Gly Val Val 245 250 255 Asn Pro Val Met Glu Pro Ile Tyr Asp Glu Pro Thr Thr Thr Thr Ser 260 265 270 Val Pro Leu 275 <210> 27 <211> 121 <212> PRT <213> Artificial sequence <220> <223> ORF7a polypeptide of CoV <400> 27 Met Lys Ile Ile Leu Phe Leu Ala Leu Ile Thr Leu Ala Thr Cys Glu 1 5 10 15 Leu Tyr His Tyr Gln Glu Cys Val Arg Gly Thr Thr Val Leu Leu Lys 20 25 30 Glu Pro Cys Ser Ser Gly Thr Tyr Glu Gly Asn Ser Pro Phe His Pro 35 40 45 Leu Ala Asp Asn Lys Phe Ala Leu Thr Cys Phe Ser Thr Gln Phe Ala 50 55 60 Phe Ala Cys Pro Asp Gly Val Lys His Val Tyr Gln Leu Arg Ala Arg 65 70 75 80 Ser Val Ser Pro Lys Leu Phe Ile Arg Gln Glu Glu Val Gln Glu Leu 85 90 95 Tyr Ser Pro Ile Phe Leu Ile Val Ala Ala Ile Val Phe Ile Thr Leu 100 105 110 Cys Phe Thr Leu Lys Arg Lys Thr Glu 115 120 <210> 28 <211> 18967 <212> DNA <213> Artificial sequence <220> <223> pTM-MVSchw <400> 28 gcggccgcta atacgactca ctatagggcc aactttgttt ggtctgatga gtccgtgagg 60 acgaaacccg gagtcccggg tcaccaaaca aagttgggta aggatagttc aatcaatgat 120 catcttctag tgcacttagg attcaagatc ctattatcag ggacaagagc aggattaggg 180 atatccgaga tggccacact tttaaggagc ttagcattgt tcaaaagaaa caaggacaaa 240 ccacccatta catcaggatc cggtggagcc atcagaggaa tcaaacacat tattatagta 300 ccaatccctg gagattcctc aattaccact cgatccagac ttctggaccg gttggtgagg 360 ttaattggaa acccggatgt gagcgggccc aaactaacag gggcactaat aggtatatta 420 tccttatttg tggagtctcc aggtcaattg attcagagga tcaccgatga ccctgacgtt 480 agcataaggc tgttagaggt tgtccagagt gaccagtcac aatctggcct taccttcgca 540 tcaagaggta ccaacatgga ggatgaggcg gaccaatact tttcacatga tgatccaatt 600 agtagtgatc aatccaggtt cggatggttc gggaacaagg aaatctcaga tattgaagtg 660 caagaccctg agggattcaa catgattctg ggtaccatcc tagcccaaat ttgggtcttg 720 ctcgcaaagg cggttacggc cccagacacg gcagctgatt cggagctaag aaggtggata 780 aagtacaccc aacaaagaag ggtagttggt gaatttagat tggagagaaa atggttggat 840 gtggtgagga acaggattgc cgaggacctc tccttacgcc gattcatggt cgctctaatc 900 ctggatatca agagaacacc cggaaacaaa cccaggattg ctgaaatgat atgtgacatt 960 gatacatata tcgtagaggc aggattagcc agttttatcc tgactattaa gtttgggata 1020 gaaactatgt atcctgctct tggactgcat gaatttgctg gtgagttatc cacacttgag 1080 tccttgatga acctttacca gcaaatgggg gaaactgcac cctacatggt aatcctggag 1140 aactcaattc agaacaagtt cagtgcagga tcataccctc tgctctggag ctatgccatg 1200 ggagtaggag tggaacttga aaactccatg ggaggtttga actttggccg atcttacttt 1260 gatccagcat attttagatt agggcaagag atggtaagga ggtcagctgg aaaggtcagt 1320 tccacattgg catctgaact cggtatcact gccgaggatg caaggcttgt ttcagagatt 1380 gcaatgcata ctactgagga caagatcagt agagcggttg gacccagaca agcccaagta 1440 tcatttctac acggtgatca aagtgagaat gagctaccga gattgggggg caaggaagat 1500 aggagggtca aacagagtcg aggagaagcc agggagagct acagagaaac cgggcccagc 1560 agagcaagtg atgcgagagc tgcccatctt ccaaccggca cacccctaga cattgacact 1620 gcaacggagt ccagccaaga tccgcaggac agtcgaaggt cagctgacgc cctgcttagg 1680 ctgcaagcca tggcaggaat ctcggaagaa caaggctcag acacggacac ccctatagtg 1740 tacaatgaca gaaatcttct agactaggtg cgagaggccg agggccagaa caacatccgc 1800 ctaccatcca tcattgttat aaaaaactta ggaaccaggt ccacacagcc gccagcccat 1860 caaccatcca ctcccacgat tggagccaat ggcagaagag caggcacgcc atgtcaaaaa 1920 cggactggaa tgcatccggg ctctcaaggc cgagcccatc ggctcactgg ccatcgagga 1980 agctatggca gcatggtcag aaatatcaga caacccagga caggagcgag ccacctgcag 2040 ggaagagaag gcaggcagtt cgggtctcag caaaccatgc ctctcagcaa ttggatcaac 2100 tgaaggcggt gcacctcgca tccgcggtca gggacctgga gagagcgatg acgacgctga 2160 aactttggga atccccccaa gaaatctcca ggcatcaagc actgggttac agtgttatta 2220 cgtttatgat cacagcggtg aagcggttaa gggaatccaa gatgctgact ctatcatggt 2280 tcaatcaggc cttgatggtg atagcaccct ctcaggagga gacaatgaat ctgaaaacag 2340 cgatgtggat attggcgaac ctgataccga gggatatgct atcactgacc ggggatctgc 2400 tcccatctct atggggttca gggcttctga tgttgaaact gcagaaggag gggagatcca 2460 cgagctcctg agactccaat ccagaggcaa caactttccg aagcttggga aaactctcaa 2520 tgttcctccg cccccggacc ccggtagggc cagcacttcc gggacaccca ttaaaaaggg 2580 cacagacgcg agattagcct catttggaac ggagatcgcg tctttattga caggtggtgc 2640 aacccaatgt gctcgaaagt caccctcgga accatcaggg ccaggtgcac ctgcggggaa 2700 tgtccccgag tgtgtgagca atgccgcact gatacaggag tggacacccg aatctggtac 2760 cacaatctcc ccgagatccc agaataatga agaaggggga gactattatg atgatgagct 2820 gttctctgat gtccaagata ttaaaacagc cttggccaaa atacacgagg ataatcagaa 2880 gataatctcc aagctagaat cactgctgtt attgaaggga gaagttgagt caattaagaa 2940 gcagatcaac aggcaaaata tcagcatatc caccctggaa ggacacctct caagcatcat 3000 gatcgccatt cctggacttg ggaaggatcc caacgacccc actgcagatg tcgaaatcaa 3060 tcccgacttg aaacccatca taggcagaga ttcaggccga gcactggccg aagttctcaa 3120 gaaacccgtt gccagccgac aactccaagg aatgacaaat ggacggacca gttccagagg 3180 acagctgctg aaggaatttc agctaaagcc gatcgggaaa aagatgagct cagccgtcgg 3240 gtttgttcct gacaccggcc ctgcatcacg cagtgtaatc cgctccatta taaaatccag 3300 ccggctagag gaggatcgga agcgttacct gatgactctc cttgatgata tcaaaggagc 3360 caatgatctt gccaagttcc accagatgct gatgaagata ataatgaagt agctacagct 3420 caacttacct gccaacccca tgccagtcga cccaactagt acaacctaaa tccattataa 3480 aaaacttagg agcaaagtga ttgcctccca aggtccacaa tgacagagac ctacgacttc 3540 gacaagtcgg catgggacat caaagggtcg atcgctccga tacaacccac cacctacagt 3600 gatggcaggc tggtgcccca ggtcagagtc atagatcctg gtctaggcga caggaaggat 3660 gaatgcttta tgtacatgtt tctgctgggg gttgttgagg acagcgattc cctagggcct 3720 ccaatcgggc gagcatttgg gttcctgccc ttaggtgttg gcagatccac agcaaagccc 3780 gaaaaactcc tcaaagaggc cactgagctt gacatagttg ttagacgtac agcagggctc 3840 aatgaaaaac tggtgttcta caacaacacc ccactaactc tcctcacacc ttggagaaag 3900 gtcctaacaa cagggagtgt cttcaacgca aaccaagtgt gcaatgcggt taatctgata 3960 ccgctcgata ccccgcagag gttccgtgtt gtttatatga gcatcacccg tctttcggat 4020 aacgggtatt acaccgttcc tagaagaatg ctggaattca gatcggtcaa tgcagtggcc 4080 ttcaacctgc tggtgaccct taggattgac aaggcgatag gccctgggaa gatcatcgac 4140 aatacagagc aacttcctga ggcaacattt atggtccaca tcgggaactt caggagaaag 4200 aagagtgaag tctactctgc cgattattgc aaaatgaaaa tcgaaaagat gggcctggtt 4260 tttgcacttg gtgggatagg gggcaccagt cttcacatta gaagcacagg caaaatgagc 4320 aagactctcc atgcacaact cgggttcaag aagaccttat gttacccgct gatggatatc 4380 aatgaagacc ttaatcgatt actctggagg agcagatgca agatagtaag aatccaggca 4440 gttttgcagc catcagttcc tcaagaattc cgcatttacg acgacgtgat cataaatgat 4500 gaccaaggac tattcaaagt tctgtagacc gtagtgccca gcaatgcccg aaaacgaccc 4560 ccctcacaat gacagccaga aggcccggac aaaaaagccc cctccgaaag actccacgga 4620 ccaagcgaga ggccagccag cagccgacgg caagcgcgaa caccaggcgg ccccagcaca 4680 gaacagccct gacacaaggc caccaccagc caccccaatc tgcatcctcc tcgtgggacc 4740 cccgaggacc aacccccaag gctgcccccg atccaaacca ccaaccgcat ccccaccacc 4800 cccgggaaag aaacccccag caattggaag gcccctcccc ctcttcctca acacaagaac 4860 tccacaaccg aaccgcacaa gcgaccgagg tgacccaacc gcaggcatcc gactccctag 4920 acagatcctc tctccccggc aaactaaaca aaacttaggg ccaaggaaca tacacaccca 4980 acagaaccca gaccccggcc cacggcgccg cgcccccaac ccccgacaac cagagggagc 5040 ccccaaccaa tcccgccggc tcccccggtg cccacaggca gggacaccaa cccccgaaca 5100 gacccagcac ccaaccatcg acaatccaag acgggggggc ccccccaaaa aaaggccccc 5160 aggggccgac agccagcacc gcgaggaagc ccacccaccc cacacacgac cacggcaacc 5220 aaaccagaac ccagaccacc ctgggccacc agctcccaga ctcggccatc accccgcaga 5280 aaggaaaggc cacaacccgc gcaccccagc cccgatccgg cggggagcca cccaacccga 5340 accagcaccc aagagcgatc cccgaaggac ccccgaaccg caaaggacat cagtatccca 5400 cagcctctcc aagtcccccg gtctcctcct cttctcgaag ggaccaaaag atcaatccac 5460 cacacccgac gacactcaac tccccacccc taaaggagac accgggaatc ccagaatcaa 5520 gactcatcca atgtccatca tgggtctcaa ggtgaacgtc tctgccatat tcatggcagt 5580 actgttaact ctccaaacac ccaccggtca aatccattgg ggcaatctct ctaagatagg 5640 ggtggtagga ataggaagtg caagctacaa agttatgact cgttccagcc atcaatcatt 5700 agtcataaaa ttaatgccca atataactct cctcaataac tgcacgaggg tagagattgc 5760 agaatacagg agactactga gaacagtttt ggaaccaatt agagatgcac ttaatgcaat 5820 gacccagaat ataagaccgg ttcagagtgt agcttcaagt aggagacaca agagatttgc 5880 gggagtagtc ctggcaggtg cggccctagg cgttgccaca gctgctcaga taacagccgg 5940 cattgcactt caccagtcca tgctgaactc tcaagccatc gacaatctga gagcgagcct 6000 ggaaactact aatcaggcaa ttgagacaat cagacaagca gggcaggaga tgatattggc 6060 tgttcagggt gtccaagact acatcaataa tgagctgata ccgtctatga accaactatc 6120 ttgtgattta atcggccaga agctcgggct caaattgctc agatactata cagaaatcct 6180 gtcattattt ggccccagtt tacgggaccc catatctgcg gagatatcta tccaggcttt 6240 gagctatgcg cttggaggag acatcaataa ggtgttagaa aagctcggat acagtggagg 6300 tgatttactg ggcatcttag agagcggagg aataaaggcc cggataactc acgtcgacac 6360 agagtcctac ttcattgtcc tcagtatagc ctatccgacg ctgtccgaga ttaagggggt 6420 gattgtccac cggctagagg gggtctcgta caacataggc tctcaagagt ggtataccac 6480 tgtgcccaag tatgttgcaa cccaagggta ccttatctcg aattttgatg agtcatcgtg 6540 tactttcatg ccagagggga ctgtgtgcag ccaaaatgcc ttgtacccga tgagtcctct 6600 gctccaagaa tgcctccggg ggtacaccaa gtcctgtgct cgtacactcg tatccgggtc 6660 ttttgggaac cggttcattt tatcacaagg gaacctaata gccaattgtg catcaatcct 6720 ttgcaagtgt tacacaacag gaacgatcat taatcaagac cctgacaaga tcctaacata 6780 cattgctgcc gatcactgcc cggtagtcga ggtgaacggc gtgaccatcc aagtcgggag 6840 caggaggtat ccagacgctg tgtacttgca cagaattgac ctcggtcctc ccatatcatt 6900 ggagaggttg gacgtaggga caaatctggg gaatgcaatt gctaagttgg aggatgccaa 6960 ggaattgttg gagtcatcgg accagatatt gaggagtatg aaaggtttat cgagcactag 7020 catagtctac atcctgattg cagtgtgtct tggagggttg atagggatcc ccgctttaat 7080 atgttgctgc agggggcgtt gtaacaaaaa gggagaacaa gttggtatgt caagaccagg 7140 cctaaagcct gatcttacgg gaacatcaaa atcctatgta aggtcgctct gatcctctac 7200 aactcttgaa acacaaatgt cccacaagtc tcctcttcgt catcaagcaa ccaccgcacc 7260 cagcatcaag cccacctgaa attatctccg gcttccctct ggccgaacaa tatcggtagt 7320 taatcaaaac ttagggtgca agatcatcca caatgtcacc acaacgagac cggataaatg 7380 ccttctacaa agataacccc catcccaagg gaagtaggat agtcattaac agagaacatc 7440 ttatgattga tagaccttat gttttgctgg ctgttctgtt tgtcatgttt ctgagcttga 7500 tcgggttgct agccattgca ggcattagac ttcatcgggc agccatctac accgcagaga 7560 tccataaaag cctcagcacc aatctagatg taactaactc aatcgagcat caggtcaagg 7620 acgtgctgac accactcttc aaaatcatcg gtgatgaagt gggcctgagg acacctcaga 7680 gattcactga cctagtgaaa ttaatctctg acaagattaa attccttaat ccggataggg 7740 agtacgactt cagagatctc acttggtgta tcaacccgcc agagagaatc aaattggatt 7800 atgatcaata ctgtgcagat gtggctgctg aagagctcat gaatgcattg gtgaactcaa 7860 ctctactgga gaccagaaca accaatcagt tcctagctgt ctcaaaggga aactgctcag 7920 ggcccactac aatcagaggt caattctcaa acatgtcgct gtccctgtta gacttgtatt 7980 taggtcgagg ttacaatgtg tcatctatag tcactatgac atcccaggga atgtatgggg 8040 gaacttacct agtggaaaag cctaatctga gcagcaaaag gtcagagttg tcacaactga 8100 gcatgtaccg agtgtttgaa gtaggtgtta tcagaaatcc gggtttgggg gctccggtgt 8160 tccatatgac aaactatctt gagcaaccag tcagtaatga tctcagcaac tgtatggtgg 8220 ctttggggga gctcaaactc gcagcccttt gtcacgggga agattctatc acaattccct 8280 atcagggatc agggaaaggt gtcagcttcc agctcgtcaa gctaggtgtc tggaaatccc 8340 caaccgacat gcaatcctgg gtccccttat caacggatga tccagtgata gacaggcttt 8400 acctctcatc tcacagaggt gttatcgctg acaatcaagc aaaatgggct gtcccgacaa 8460 cacgaacaga tgacaagttg cgaatggaga catgcttcca acaggcgtgt aagggtaaaa 8520 tccaagcact ctgcgagaat cccgagtggg caccattgaa ggataacagg attccttcat 8580 acggggtctt gtctgttgat ctgagtctga cagttgagct taaaatcaaa attgcttcgg 8640 gattcgggcc attgatcaca cacggttcag ggatggacct atacaaatcc aaccacaaca 8700 atgtgtattg gctgactatc ccgccaatga agaacctagc cttaggtgta atcaacacat 8760 tggagtggat accgagattc aaggttagtc cctacctctt cactgtccca attaaggaag 8820 caggcgaaga ctgccatgcc ccaacatacc tacctgcgga ggtggatggt gatgtcaaac 8880 tcagttccaa tctggtgatt ctacctggtc aagatctcca atatgttttg gcaacctacg 8940 atacttccag ggttgaacat gctgtggttt attacgttta cagcccaagc cgctcatttt 9000 cttactttta tccttttagg ttgcctataa agggggtccc catcgaatta caagtggaat 9060 gcttcacatg ggaccaaaaa ctctggtgcc gtcacttctg tgtgcttgcg gactcagaat 9120 ctggtggaca tatcactcac tctgggatgg tgggcatggg agtcagctgc acagtcaccc 9180 gggaagatgg aaccaatcgc agatagggct gctagtgaac caatcacatg atgtcaccca 9240 gacatcaggc atacccacta gtgtgaaata gacatcagaa ttaagaaaaa cgtagggtcc 9300 aagtggttcc ccgttatgga ctcgctatct gtcaaccaga tcttataccc tgaagttcac 9360 ctagatagcc cgatagttac caataagata gtagccatcc tggagtatgc tcgagtccct 9420 cacgcttaca gcctggagga ccctacactg tgtcagaaca tcaagcaccg cctaaaaaac 9480 ggattttcca accaaatgat tataaacaat gtggaagttg ggaatgtcat caagtccaag 9540 cttaggagtt atccggccca ctctcatatt ccatatccaa attgtaatca ggatttattt 9600 aacatagaag acaaagagtc aacgaggaag atccgtgaac tcctcaaaaa ggggaattcg 9660 ctgtactcca aagtcagtga taaggttttc caatgcttaa gggacactaa ctcacggctt 9720 ggcctaggct ccgaattgag ggaggacatc aaggagaaag ttattaactt gggagtttac 9780 atgcacagct cccagtggtt tgagcccttt ctgttttggt ttacagtcaa gactgagatg 9840 aggtcagtga ttaaatcaca aacccatact tgccatagga ggagacacac acctgtattc 9900 ttcactggta gttcagttga gttgctaatc tctcgtgacc ttgttgctat aatcagtaaa 9960 gagtctcaac atgtatatta cctgacattt gaactggttt tgatgtattg tgatgtcata 10020 gaggggaggt taatgacaga gaccgctatg actattgatg ctaggtatac agagcttcta 10080 ggaagagtca gatacatgtg gaaactgata gatggtttct tccctgcact cgggaatcca 10140 acttatcaaa ttgtagccat gctggagcct ctttcacttg cttacctgca gctgagggat 10200 ataacagtag aactcagagg tgctttcctt aaccactgct ttactgaaat acatgatgtt 10260 cttgaccaaa acgggttttc tgatgaaggt acttatcatg agttaactga agctctagat 10320 tacattttca taactgatga catacatctg acaggggaga ttttctcatt tttcagaagt 10380 ttcggccacc ccagacttga agcagtaacg gctgctgaaa atgttaggaa atacatgaat 10440 cagcctaaag tcattgtgta tgagactctg atgaaaggtc atgccatatt ttgtggaatc 10500 ataatcaacg gctatcgtga caggcacgga ggcagttggc caccgctgac cctccccctg 10560 catgctgcag acacaatccg gaatgctcaa gcttcaggtg aagggttaac acatgagcag 10620 tgcgttgata actggaaatc ttttgctgga gtgaaatttg gctgctttat gcctcttagc 10680 ctggatagtg atctgacaat gtacctaaag gacaaggcac ttgctgctct ccaaagggaa 10740 tgggattcag tttacccgaa agagttcctg cgttacgacc ctcccaaggg aaccgggtca 10800 cggaggcttg tagatgtttt ccttaatgat tcgagctttg acccatatga tgtgataatg 10860 tatgttgtaa gtggagctta cctccatgac cctgagttca acctgtctta cagcctgaaa 10920 gaaaaggaga tcaaggaaac aggtagactt tttgctaaaa tgacttacaa aatgagggca 10980 tgccaagtga ttgctgaaaa tctaatctca aacgggattg gcaaatattt taaggacaat 11040 gggatggcca aggatgagca cgatttgact aaggcactcc acactctagc tgtctcagga 11100 gtccccaaag atctcaaaga aagtcacagg ggggggccag tcttaaaaac ctactcccga 11160 agcccagtcc acacaagtac caggaacgtg agagcagcaa aagggtttat agggttccct 11220 caagtaattc ggcaggacca agacactgat catccggaga atatggaagc ttacgagaca 11280 gtcagtgcat ttatcacgac tgatctcaag aagtactgcc ttaattggag atatgagacc 11340 atcagcttgt ttgcacagag gctaaatgag atttacggat tgccctcatt tttccagtgg 11400 ctgcataaga ggcttgagac ctctgtcctg tatgtaagtg accctcattg cccccccgac 11460 cttgacgccc atatcccgtt atataaagtc cccaatgatc aaatcttcat taagtaccct 11520 atgggaggta tagaagggta ttgtcagaag ctgtggacca tcagcaccat tccctatcta 11580 tacctggctg cttatgagag cggagtaagg attgcttcgt tagtgcaagg ggacaatcag 11640 accatagccg taacaaaaag ggtacccagc acatggccct acaaccttaa gaaacgggaa 11700 gctgctagag taactagaga ttactttgta attcttaggc aaaggctaca tgatattggc 11760 catcacctca aggcaaatga gacaattgtt tcatcacatt tttttgtcta ttcaaaagga 11820 atatattatg atgggctact tgtgtcccaa tcactcaaga gcatcgcaag atgtgtattc 11880 tggtcagaga ctatagttga tgaaacaagg gcagcatgca gtaatattgc tacaacaatg 11940 gctaaaagca tcgagagagg ttatgaccgt taccttgcat attccctgaa cgtcctaaaa 12000 gtgatacagc aaattctgat ctctcttggc ttcacaatca attcaaccat gacccgggat 12060 gtagtcatac ccctcctcac aaacaacgac ctcttaataa ggatggcact gttgcccgct 12120 cctattgggg ggatgaatta tctgaatatg agcaggctgt ttgtcagaaa catcggtgat 12180 ccagtaacat catcaattgc tgatctcaag agaatgattc tcgcctcact aatgcctgaa 12240 gagaccctcc atcaagtaat gacacaacaa ccgggggact cttcattcct agactgggct 12300 agcgaccctt actcagcaaa tcttgtatgt gtccagagca tcactagact cctcaagaac 12360 ataactgcaa ggtttgtcct gatccatagt ccaaacccaa tgttaaaagg attattccat 12420 gatgacagta aagaagagga cgagggactg gcggcattcc tcatggacag gcatattata 12480 gtacctaggg cagctcatga aatcctggat catagtgtca caggggcaag agagtctatt 12540 gcaggcatgc tggataccac aaaaggcttg attcgagcca gcatgaggaa gggggggtta 12600 acctctcgag tgataaccag attgtccaat tatgactatg aacaattcag agcagggatg 12660 gtgctattga caggaagaaa gagaaatgtc ctcattgaca aagagtcatg ttcagtgcag 12720 ctggcgagag ctctaagaag ccatatgtgg gcgaggctag ctcgaggacg gcctatttac 12780 ggccttgagg tccctgatgt actagaatct atgcgaggcc accttattcg gcgtcatgag 12840 acatgtgtca tctgcgagtg tggatcagtc aactacggat ggttttttgt cccctcgggt 12900 tgccaactgg atgatattga caaggaaaca tcatccttga gagtcccata tattggttct 12960 accactgatg agagaacaga catgaagctt gccttcgtaa gagccccaag tcgatccttg 13020 cgatctgctg ttagaatagc aacagtgtac tcatgggctt acggtgatga tgatagctct 13080 tggaacgaag cctggttgtt ggctaggcaa agggccaatg tgagcctgga ggagctaagg 13140 gtgatcactc ccatctcaac ttcgactaat ttagcgcata ggttgaggga tcgtagcact 13200 caagtgaaat actcaggtac atcccttgtc cgagtggcga ggtataccac aatctccaac 13260 gacaatctct catttgtcat atcagataag aaggttgata ctaactttat ataccaacaa 13320 ggaatgcttc tagggttggg tgttttagaa acattgtttc gactcgagaa agataccgga 13380 tcatctaaca cggtattaca tcttcacgtc gaaacagatt gttgcgtgat cccgatgata 13440 gatcatccca ggatacccag ctcccgcaag ctagagctga gggcagagct atgtaccaac 13500 ccattgatat atgataatgc acctttaatt gacagagatg caacaaggct atacacccag 13560 agccatagga ggcaccttgt ggaatttgtt acatggtcca caccccaact atatcacatt 13620 ttagctaagt ccacagcact atctatgatt gacctggtaa caaaatttga gaaggaccat 13680 atgaatgaaa tttcagctct cataggggat gacgatatca atagtttcat aactgagttt 13740 ctgctcatag agccaagatt attcactatc tacttgggcc agtgtgcggc catcaattgg 13800 gcatttgatg tacattatca tagaccatca gggaaatatc agatgggtga gctgttgtca 13860 tcgttccttt ctagaatgag caaaggagtg tttaaggtgc ttgtcaatgc tctaagccac 13920 ccaaagatct acaagaaatt ctggcattgt ggtattatag agcctatcca tggtccttca 13980 cttgatgctc aaaacttgca cacaactgtg tgcaacatgg tttacacatg ctatatgacc 14040 tacctcgacc tgttgttgaa tgaagagtta gaagagttca catttctctt gtgtgaaagc 14100 gacgaggatg tagtaccgga cagattcgac aacatccagg caaaacactt atgtgttctg 14160 gcagatttgt actgtcaacc agggacctgc ccaccaattc gaggtctaag accggtagag 14220 aaatgtgcag ttctaaccga ccatatcaag gcagaggcta tgttatctcc agcaggatct 14280 tcgtggaaca taaatccaat tattgtagac cattactcat gctctctgac ttatctccgg 14340 cgaggatcga tcaaacagat aagattgaga gttgatccag gattcatttt cgacgccctc 14400 gctgaggtaa atgtcagtca gccaaagatc ggcagcaaca acatctcaaa tatgagcatc 14460 aaggctttca gacccccaca cgatgatgtt gcaaaattgc tcaaagatat caacacaagc 14520 aagcacaatc ttcccatttc agggggcaat ctcgccaatt atgaaatcca tgctttccgc 14580 agaatcgggt tgaactcatc tgcttgctac aaagctgttg agatatcaac attaattagg 14640 agatgccttg agccagggga ggacggcttg ttcttgggtg agggatcggg ttctatgttg 14700 atcacttata aagagatact taaactaaac aagtgcttct ataatagtgg ggtttccgcc 14760 aattctagat ctggtcaaag ggaattagca ccctatccct ccgaagttgg ccttgtcgaa 14820 cacagaatgg gagtaggtaa tattgtcaaa gtgctcttta acgggaggcc cgaagtcacg 14880 tgggtaggca gtgtagattg cttcaatttc atagttagta atatccctac ctctagtgtg 14940 gggtttatcc attcagatat agagaccttg cctgacaaag atactataga gaagctagag 15000 gaattggcag ccatcttatc gatggctctg ctcctgggca aaataggatc aatactggtg 15060 attaagctta tgcctttcag cggggatttt gttcagggat ttataagtta tgtagggtct 15120 cattatagag aagtgaacct tgtataccct agatacagca acttcatctc tactgaatct 15180 tatttggtta tgacagatct caaggctaac cggctaatga atcctgaaaa gattaagcag 15240 cagataattg aatcatctgt gaggacttca cctggactta taggtcacat cctatccatt 15300 aagcaactaa gctgcataca agcaattgtg ggagacgcag ttagtagagg tgatatcaat 15360 cctactctga aaaaacttac acctatagag caggtgctga tcaattgcgg gttggcaatt 15420 aacggaccta agctgtgcaa agaattgatc caccatgatg ttgcctcagg gcaagatgga 15480 ttgcttaatt ctatactcat cctctacagg gagttggcaa gattcaaaga caaccaaaga 15540 agtcaacaag ggatgttcca cgcttacccc gtattggtaa gtagcaggca acgagaactt 15600 atatctagga tcacccgcaa attctggggg cacattcttc tttactccgg gaacaaaaag 15660 ttgataaata agtttatcca gaatctcaag tccggctatc tgatactaga cttacaccag 15720 aatatcttcg ttaagaatct atccaagtca gagaaacaga ttattatgac ggggggtttg 15780 aaacgtgagt gggtttttaa ggtaacagtc aaggagacca aagaatggta taagttagtc 15840 ggatacagtg ccctgattaa ggactaattg gttgaactcc ggaaccctaa tcctgcccta 15900 ggtggttagg cattatttgc aatatattaa agaaaacttt gaaaatacga agtttctatt 15960 cccagctttg tctggtggcc ggcatggtcc cagcctcctc gctggcgccg gctgggcaac 16020 attccgaggg gaccgtcccc tcggtaatgg cgaatgggac gcggccgatc cggctgctaa 16080 caaagcccga aaggaagctg agttggctgc tgccaccgct gagcaataac tagcataacc 16140 ccttggggcc tctaaacggg tcttgagggg ttttttgctg aaaggaggaa ctatatccgg 16200 atgcggccgc gggccctatg gtacccagct tttgttccct ttagtgaggg ttaattccga 16260 gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc 16320 cacacaacat aggagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgaggt 16380 aactcacatt aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc 16440 agctgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt 16500 ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 16560 ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 16620 tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 16680 tccataggct cggcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 16740 gaaacccgac aggactataa agataccagg cgttcccccc tggaagctcc ctcgtgcgct 16800 ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 16860 tggcgctttc tcaatgctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 16920 agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 16980 atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 17040 acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 17100 actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct 17160 tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 17220 tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 17280 tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 17340 tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat 17400 caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg 17460 cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactg cccgtcgtgt 17520 agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag 17580 acccacgctc accggctcca gatttatcag caataaacca gccagccgga agggccgagc 17640 gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag 17700 ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca 17760 tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa 17820 ggcgagttac atgatccccc atgttgtgaa aaaaagcggt tagctccttc ggtcctccga 17880 tcgttgtcag aagtaagttg gccgcagtgt tatcactcat gcttatggca gcactgcata 17940 attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca 18000 agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg 18060 ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg 18120 ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg 18180 cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag 18240 gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac 18300 tcttcctttt tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca 18360 tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag 18420 tgccacctga aattgtaaac gttaatattt tgttaaaatt cgcgttaaat ttttgttaaa 18480 tcagctcatt ttttaaccaa taggccgaaa tcggcaaaat cccttataaa tcaaaagaat 18540 agaccgagat agggttgagt gttgttccag tttggaacaa gagtccacta ttaaagaacg 18600 tggactccaa cgtcaaaggg cgaaaaaccg tctatcaggg cgatggccca ctacgtgaac 18660 catcacccta atcaagtttt ttggggtcga ggtgccgtaa agcactaaat cggaacccta 18720 aagggagccc ccgatttaga gcttgacggg gaaagccggc gaacgtggcg agaaaggaag 18780 ggaagaaagc gaaaggagcg ggcgctaggg cgctggcaag tgtagcggtc acgctgcgcg 18840 taaccaccac acccgccgcg cttaatgcgc cgctacaggg cgcgtcccat tcgccattca 18900 ggctgcgcaa ctgttgggaa gggcgatcgg tgcgggcctc ttcgctatta cgccagccac 18960 cgcggtg 18967 <210> 29 <211> 19795 <212> DNA <213> Artificial sequence <220> <223> pTM2-MVSchw-gfp <400> 29 gcggccgcta atacgactca ctatagggcc aactttgttt ggtctgatga gtccgtgagg 60 acgaaacccg gagtcccggg tcaccaaaca aagttgggta aggatagttc aatcaatgat 120 catcttctag tgcacttagg attcaagatc ctattatcag ggacaagagc aggattaggg 180 atatccgaga tggccacact tttaaggagc ttagcattgt tcaaaagaaa caaggacaaa 240 ccacccatta catcaggatc cggtggagcc atcagaggaa tcaaacacat tattatagta 300 ccaatccctg gagattcctc aattaccact cgatccagac ttctggaccg gttggtgagg 360 ttaattggaa acccggatgt gagcgggccc aaactaacag gggcactaat aggtatatta 420 tccttatttg tggagtctcc aggtcaattg attcagagga tcaccgatga ccctgacgtt 480 agcataaggc tgttagaggt tgtccagagt gaccagtcac aatctggcct taccttcgca 540 tcaagaggta ccaacatgga ggatgaggcg gaccaatact tttcacatga tgatccaatt 600 agtagtgatc aatccaggtt cggatggttc gggaacaagg aaatctcaga tattgaagtg 660 caagaccctg agggattcaa catgattctg ggtaccatcc tagcccaaat ttgggtcttg 720 ctcgcaaagg cggttacggc cccagacacg gcagctgatt cggagctaag aaggtggata 780 aagtacaccc aacaaagaag ggtagttggt gaatttagat tggagagaaa atggttggat 840 gtggtgagga acaggattgc cgaggacctc tccttacgcc gattcatggt cgctctaatc 900 ctggatatca agagaacacc cggaaacaaa cccaggattg ctgaaatgat atgtgacatt 960 gatacatata tcgtagaggc aggattagcc agttttatcc tgactattaa gtttgggata 1020 gaaactatgt atcctgctct tggactgcat gaatttgctg gtgagttatc cacacttgag 1080 tccttgatga acctttacca gcaaatgggg gaaactgcac cctacatggt aatcctggag 1140 aactcaattc agaacaagtt cagtgcagga tcataccctc tgctctggag ctatgccatg 1200 ggagtaggag tggaacttga aaactccatg ggaggtttga actttggccg atcttacttt 1260 gatccagcat attttagatt agggcaagag atggtaagga ggtcagctgg aaaggtcagt 1320 tccacattgg catctgaact cggtatcact gccgaggatg caaggcttgt ttcagagatt 1380 gcaatgcata ctactgagga caagatcagt agagcggttg gacccagaca agcccaagta 1440 tcatttctac acggtgatca aagtgagaat gagctaccga gattgggggg caaggaagat 1500 aggagggtca aacagagtcg aggagaagcc agggagagct acagagaaac cgggcccagc 1560 agagcaagtg atgcgagagc tgcccatctt ccaaccggca cacccctaga cattgacact 1620 gcaacggagt ccagccaaga tccgcaggac agtcgaaggt cagctgacgc cctgcttagg 1680 ctgcaagcca tggcaggaat ctcggaagaa caaggctcag acacggacac ccctatagtg 1740 tacaatgaca gaaatcttct agactaggtg cgagaggccg agggccagaa caacatccgc 1800 ctaccatcca tcattgttat aaaaaactta ggaaccaggt ccacacagcc gccagcccat 1860 caaccatcca ctcccacgat tggagccaat ggcagaagag caggcacgcc atgtcaaaaa 1920 cggactggaa tgcatccggg ctctcaaggc cgagcccatc ggctcactgg ccatcgagga 1980 agctatggca gcatggtcag aaatatcaga caacccagga caggagcgag ccacctgcag 2040 ggaagagaag gcaggcagtt cgggtctcag caaaccatgc ctctcagcaa ttggatcaac 2100 tgaaggcggt gcacctcgca tccgcggtca gggacctgga gagagcgatg acgacgctga 2160 aactttggga atccccccaa gaaatctcca ggcatcaagc actgggttac agtgttatta 2220 cgtttatgat cacagcggtg aagcggttaa gggaatccaa gatgctgact ctatcatggt 2280 tcaatcaggc cttgatggtg atagcaccct ctcaggagga gacaatgaat ctgaaaacag 2340 cgatgtggat attggcgaac ctgataccga gggatatgct atcactgacc ggggatctgc 2400 tcccatctct atggggttca gggcttctga tgttgaaact gcagaaggag gggagatcca 2460 cgagctcctg agactccaat ccagaggcaa caactttccg aagcttggga aaactctcaa 2520 tgttcctccg cccccggacc ccggtagggc cagcacttcc gggacaccca ttaaaaaggg 2580 cacagacgcg agattagcct catttggaac ggagatcgcg tctttattga caggtggtgc 2640 aacccaatgt gctcgaaagt caccctcgga accatcaggg ccaggtgcac ctgcggggaa 2700 tgtccccgag tgtgtgagca atgccgcact gatacaggag tggacacccg aatctggtac 2760 cacaatctcc ccgagatccc agaataatga agaaggggga gactattatg atgatgagct 2820 gttctctgat gtccaagata ttaaaacagc cttggccaaa atacacgagg ataatcagaa 2880 gataatctcc aagctagaat cactgctgtt attgaaggga gaagttgagt caattaagaa 2940 gcagatcaac aggcaaaata tcagcatatc caccctggaa ggacacctct caagcatcat 3000 gatcgccatt cctggacttg ggaaggatcc caacgacccc actgcagatg tcgaaatcaa 3060 tcccgacttg aaacccatca taggcagaga ttcaggccga gcactggccg aagttctcaa 3120 gaaacccgtt gccagccgac aactccaagg aatgacaaat ggacggacca gttccagagg 3180 acagctgctg aaggaatttc agctaaagcc gatcgggaaa aagatgagct cagccgtcgg 3240 gtttgttcct gacaccggcc ctgcatcacg cagtgtaatc cgctccatta taaaatccag 3300 ccggctagag gaggatcgga agcgttacct gatgactctc cttgatgata tcaaaggagc 3360 caatgatctt gccaagttcc accagatgct gatgaagata ataatgaagt agctacagct 3420 caacttacct gccaacccca tgccagtcga cccaactagc ctaccctcca tcattgttat 3480 aaaaaactta ggaaccaggt ccacacagcc gccagcccat caacgcgtac gatggtgagc 3540 aagggcgagg agctgttcac cggggtggtg cccatcctgg tcgagctgga cggcgacgta 3600 aacggccaca agttcagcgt gtccggcgag ggcgagggcg atgccaccta cggcaagctg 3660 accctgaagt tcatctgcac caccggcaag ctgcccgtgc cctggcccac cctcgtgacc 3720 accctgacct acggcgtgca gtgcttcagc cgctaccccg accacatgaa gcagcacgac 3780 ttcttcaagt ccgccatgcc cgaaggctac gtccaggagc gcaccatctt cttcaaggac 3840 gacggcaact acaagacccg cgccgaggtg aagttcgagg gcgacaccct ggtgaaccgc 3900 atcgagctga agggcatcga cttcaaggag gacggcaaca tcctggggca caagctggag 3960 tacaactaca acagccacaa cgtctatatc atggccgaca agcagaagaa cggcatcaag 4020 gtgaacttca agatccgcca caacatcgag gacggcagcg tgcagctcgc cgaccactac 4080 cagcagaaca cccccatcgg cgacggcccc gtgctgctgc ccgacaacca ctacctgagc 4140 acccagtccg ccctgagcaa agaccccaac gagaagcgcg atcacatggt cctgctggag 4200 ttcgtgaccg ccgccgggat cactctcggc atggacgagc tgtacaagta ggcgcgcagc 4260 gcttagacgt ctcgcgatcg atactagtac aacctaaatc cattataaaa aacttaggag 4320 caaagtgatt gcctcccaag gtccacaatg acagagacct acgacttcga caagtcggca 4380 tgggacatca aagggtcgat cgctccgata caacccacca cctacagtga tggcaggctg 4440 gtgccccagg tcagagtcat agatcctggt ctaggcgaca ggaaggatga atgctttatg 4500 tacatgtttc tgctgggggt tgttgaggac agcgattccc tagggcctcc aatcgggcga 4560 gcatttgggt tcctgccctt aggtgttggc agatccacag caaagcccga aaaactcctc 4620 aaagaggcca ctgagcttga catagttgtt agacgtacag cagggctcaa tgaaaaactg 4680 gtgttctaca acaacacccc actaactctc ctcacacctt ggagaaaggt cctaacaaca 4740 gggagtgtct tcaacgcaaa ccaagtgtgc aatgcggtta atctgatacc gctcgatacc 4800 ccgcagaggt tccgtgttgt ttatatgagc atcacccgtc tttcggataa cgggtattac 4860 accgttccta gaagaatgct ggaattcaga tcggtcaatg cagtggcctt caacctgctg 4920 gtgaccctta ggattgacaa ggcgataggc cctgggaaga tcatcgacaa tacagagcaa 4980 cttcctgagg caacatttat ggtccacatc gggaacttca ggagaaagaa gagtgaagtc 5040 tactctgccg attattgcaa aatgaaaatc gaaaagatgg gcctggtttt tgcacttggt 5100 gggatagggg gcaccagtct tcacattaga agcacaggca aaatgagcaa gactctccat 5160 gcacaactcg ggttcaagaa gaccttatgt tacccgctga tggatatcaa tgaagacctt 5220 aatcgattac tctggaggag cagatgcaag atagtaagaa tccaggcagt tttgcagcca 5280 tcagttcctc aagaattccg catttacgac gacgtgatca taaatgatga ccaaggacta 5340 ttcaaagttc tgtagaccgt agtgcccagc aatgcccgaa aacgaccccc ctcacaatga 5400 cagccagaag gcccggacaa aaaagccccc tccgaaagac tccacggacc aagcgagagg 5460 ccagccagca gccgacggca agcgcgaaca ccaggcggcc ccagcacaga acagccctga 5520 cacaaggcca ccaccagcca ccccaatctg catcctcctc gtgggacccc cgaggaccaa 5580 cccccaaggc tgcccccgat ccaaaccacc aaccgcatcc ccaccacccc cgggaaagaa 5640 acccccagca attggaaggc ccctccccct cttcctcaac acaagaactc cacaaccgaa 5700 ccgcacaagc gaccgaggtg acccaaccgc aggcatccga ctccctagac agatcctctc 5760 tccccggcaa actaaacaaa acttagggcc aaggaacata cacacccaac agaacccaga 5820 ccccggccca cggcgccgcg cccccaaccc ccgacaacca gagggagccc ccaaccaatc 5880 ccgccggctc ccccggtgcc cacaggcagg gacaccaacc cccgaacaga cccagcaccc 5940 aaccatcgac aatccaagac gggggggccc ccccaaaaaa aggcccccag gggccgacag 6000 ccagcaccgc gaggaagccc acccacccca cacacgacca cggcaaccaa accagaaccc 6060 agaccaccct gggccaccag ctcccagact cggccatcac cccgcagaaa ggaaaggcca 6120 caacccgcgc accccagccc cgatccggcg gggagccacc caacccgaac cagcacccaa 6180 gagcgatccc cgaaggaccc ccgaaccgca aaggacatca gtatcccaca gcctctccaa 6240 gtcccccggt ctcctcctct tctcgaaggg accaaaagat caatccacca cacccgacga 6300 cactcaactc cccaccccta aaggagacac cgggaatccc agaatcaaga ctcatccaat 6360 gtccatcatg ggtctcaagg tgaacgtctc tgccatattc atggcagtac tgttaactct 6420 ccaaacaccc accggtcaaa tccattgggg caatctctct aagatagggg tggtaggaat 6480 aggaagtgca agctacaaag ttatgactcg ttccagccat caatcattag tcataaaatt 6540 aatgcccaat ataactctcc tcaataactg cacgagggta gagattgcag aatacaggag 6600 actactgaga acagttttgg aaccaattag agatgcactt aatgcaatga cccagaatat 6660 aagaccggtt cagagtgtag cttcaagtag gagacacaag agatttgcgg gagtagtcct 6720 ggcaggtgcg gccctaggcg ttgccacagc tgctcagata acagccggca ttgcacttca 6780 ccagtccatg ctgaactctc aagccatcga caatctgaga gcgagcctgg aaactactaa 6840 tcaggcaatt gagacaatca gacaagcagg gcaggagatg atattggctg ttcagggtgt 6900 ccaagactac atcaataatg agctgatacc gtctatgaac caactatctt gtgatttaat 6960 cggccagaag ctcgggctca aattgctcag atactataca gaaatcctgt cattatttgg 7020 ccccagttta cgggacccca tatctgcgga gatatctatc caggctttga gctatgcgct 7080 tggaggagac atcaataagg tgttagaaaa gctcggatac agtggaggtg atttactggg 7140 catcttagag agcggaggaa taaaggcccg gataactcac gtcgacacag agtcctactt 7200 cattgtcctc agtatagcct atccgacgct gtccgagatt aagggggtga ttgtccaccg 7260 gctagagggg gtctcgtaca acataggctc tcaagagtgg tataccactg tgcccaagta 7320 tgttgcaacc caagggtacc ttatctcgaa ttttgatgag tcatcgtgta ctttcatgcc 7380 agaggggact gtgtgcagcc aaaatgcctt gtacccgatg agtcctctgc tccaagaatg 7440 cctccggggg tacaccaagt cctgtgctcg tacactcgta tccgggtctt ttgggaaccg 7500 gttcatttta tcacaaggga acctaatagc caattgtgca tcaatccttt gcaagtgtta 7560 cacaacagga acgatcatta atcaagaccc tgacaagatc ctaacataca ttgctgccga 7620 tcactgcccg gtagtcgagg tgaacggcgt gaccatccaa gtcgggagca ggaggtatcc 7680 agacgctgtg tacttgcaca gaattgacct cggtcctccc atatcattgg agaggttgga 7740 cgtagggaca aatctgggga atgcaattgc taagttggag gatgccaagg aattgttgga 7800 gtcatcggac cagatattga ggagtatgaa aggtttatcg agcactagca tagtctacat 7860 cctgattgca gtgtgtcttg gagggttgat agggatcccc gctttaatat gttgctgcag 7920 ggggcgttgt aacaaaaagg gagaacaagt tggtatgtca agaccaggcc taaagcctga 7980 tcttacggga acatcaaaat cctatgtaag gtcgctctga tcctctacaa ctcttgaaac 8040 acaaatgtcc cacaagtctc ctcttcgtca tcaagcaacc accgcaccca gcatcaagcc 8100 cacctgaaat tatctccggc ttccctctgg ccgaacaata tcggtagtta atcaaaactt 8160 agggtgcaag atcatccaca atgtcaccac aacgagaccg gataaatgcc ttctacaaag 8220 ataaccccca tcccaaggga agtaggatag tcattaacag agaacatctt atgattgata 8280 gaccttatgt tttgctggct gttctgtttg tcatgtttct gagcttgatc gggttgctag 8340 ccattgcagg cattagactt catcgggcag ccatctacac cgcagagatc cataaaagcc 8400 tcagcaccaa tctagatgta actaactcaa tcgagcatca ggtcaaggac gtgctgacac 8460 cactcttcaa aatcatcggt gatgaagtgg gcctgaggac acctcagaga ttcactgacc 8520 tagtgaaatt aatctctgac aagattaaat tccttaatcc ggatagggag tacgacttca 8580 gagatctcac ttggtgtatc aacccgccag agagaatcaa attggattat gatcaatact 8640 gtgcagatgt ggctgctgaa gagctcatga atgcattggt gaactcaact ctactggaga 8700 ccagaacaac caatcagttc ctagctgtct caaagggaaa ctgctcaggg cccactacaa 8760 tcagaggtca attctcaaac atgtcgctgt ccctgttaga cttgtattta ggtcgaggtt 8820 acaatgtgtc atctatagtc actatgacat cccagggaat gtatggggga acttacctag 8880 tggaaaagcc taatctgagc agcaaaaggt cagagttgtc acaactgagc atgtaccgag 8940 tgtttgaagt aggtgttatc agaaatccgg gtttgggggc tccggtgttc catatgacaa 9000 actatcttga gcaaccagtc agtaatgatc tcagcaactg tatggtggct ttgggggagc 9060 tcaaactcgc agccctttgt cacggggaag attctatcac aattccctat cagggatcag 9120 ggaaaggtgt cagcttccag ctcgtcaagc taggtgtctg gaaatcccca accgacatgc 9180 aatcctgggt ccccttatca acggatgatc cagtgataga caggctttac ctctcatctc 9240 acagaggtgt tatcgctgac aatcaagcaa aatgggctgt cccgacaaca cgaacagatg 9300 acaagttgcg aatggagaca tgcttccaac aggcgtgtaa gggtaaaatc caagcactct 9360 gcgagaatcc cgagtgggca ccattgaagg ataacaggat tccttcatac ggggtcttgt 9420 ctgttgatct gagtctgaca gttgagctta aaatcaaaat tgcttcggga ttcgggccat 9480 tgatcacaca cggttcaggg atggacctat acaaatccaa ccacaacaat gtgtattggc 9540 tgactatccc gccaatgaag aacctagcct taggtgtaat caacacattg gagtggatac 9600 cgagattcaa ggttagtccc tacctcttca ctgtcccaat taaggaagca ggcgaagact 9660 gccatgcccc aacataccta cctgcggagg tggatggtga tgtcaaactc agttccaatc 9720 tggtgattct acctggtcaa gatctccaat atgttttggc aacctacgat acttccaggg 9780 ttgaacatgc tgtggtttat tacgtttaca gcccaagccg ctcattttct tacttttatc 9840 cttttaggtt gcctataaag ggggtcccca tcgaattaca agtggaatgc ttcacatggg 9900 accaaaaact ctggtgccgt cacttctgtg tgcttgcgga ctcagaatct ggtggacata 9960 tcactcactc tgggatggtg ggcatgggag tcagctgcac agtcacccgg gaagatggaa 10020 ccaatcgcag atagggctgc tagtgaacca atcacatgat gtcacccaga catcaggcat 10080 acccactagt gtgaaataga catcagaatt aagaaaaacg tagggtccaa gtggttcccc 10140 gttatggact cgctatctgt caaccagatc ttataccctg aagttcacct agatagcccg 10200 atagttacca ataagatagt agccatcctg gagtatgctc gagtccctca cgcttacagc 10260 ctggaggacc ctacactgtg tcagaacatc aagcaccgcc taaaaaacgg attttccaac 10320 caaatgatta taaacaatgt ggaagttggg aatgtcatca agtccaagct taggagttat 10380 ccggcccact ctcatattcc atatccaaat tgtaatcagg atttatttaa catagaagac 10440 aaagagtcaa cgaggaagat ccgtgaactc ctcaaaaagg ggaattcgct gtactccaaa 10500 gtcagtgata aggttttcca atgcttaagg gacactaact cacggcttgg cctaggctcc 10560 gaattgaggg aggacatcaa ggagaaagtt attaacttgg gagtttacat gcacagctcc 10620 cagtggtttg agccctttct gttttggttt acagtcaaga ctgagatgag gtcagtgatt 10680 aaatcacaaa cccatacttg ccataggagg agacacacac ctgtattctt cactggtagt 10740 tcagttgagt tgctaatctc tcgtgacctt gttgctataa tcagtaaaga gtctcaacat 10800 gtatattacc tgacatttga actggttttg atgtattgtg atgtcataga ggggaggtta 10860 atgacagaga ccgctatgac tattgatgct aggtatacag agcttctagg aagagtcaga 10920 tacatgtgga aactgataga tggtttcttc cctgcactcg ggaatccaac ttatcaaatt 10980 gtagccatgc tggagcctct ttcacttgct tacctgcagc tgagggatat aacagtagaa 11040 ctcagaggtg ctttccttaa ccactgcttt actgaaatac atgatgttct tgaccaaaac 11100 gggttttctg atgaaggtac ttatcatgag ttaactgaag ctctagatta cattttcata 11160 actgatgaca tacatctgac aggggagatt ttctcatttt tcagaagttt cggccacccc 11220 agacttgaag cagtaacggc tgctgaaaat gttaggaaat acatgaatca gcctaaagtc 11280 attgtgtatg agactctgat gaaaggtcat gccatatttt gtggaatcat aatcaacggc 11340 tatcgtgaca ggcacggagg cagttggcca ccgctgaccc tccccctgca tgctgcagac 11400 acaatccgga atgctcaagc ttcaggtgaa gggttaacac atgagcagtg cgttgataac 11460 tggaaatctt ttgctggagt gaaatttggc tgctttatgc ctcttagcct ggatagtgat 11520 ctgacaatgt acctaaagga caaggcactt gctgctctcc aaagggaatg ggattcagtt 11580 tacccgaaag agttcctgcg ttacgaccct cccaagggaa ccgggtcacg gaggcttgta 11640 gatgttttcc ttaatgattc gagctttgac ccatatgatg tgataatgta tgttgtaagt 11700 ggagcttacc tccatgaccc tgagttcaac ctgtcttaca gcctgaaaga aaaggagatc 11760 aaggaaacag gtagactttt tgctaaaatg acttacaaaa tgagggcatg ccaagtgatt 11820 gctgaaaatc taatctcaaa cgggattggc aaatatttta aggacaatgg gatggccaag 11880 gatgagcacg atttgactaa ggcactccac actctagctg tctcaggagt ccccaaagat 11940 ctcaaagaaa gtcacagggg ggggccagtc ttaaaaacct actcccgaag cccagtccac 12000 acaagtacca ggaacgtgag agcagcaaaa gggtttatag ggttccctca agtaattcgg 12060 caggaccaag acactgatca tccggagaat atggaagctt acgagacagt cagtgcattt 12120 atcacgactg atctcaagaa gtactgcctt aattggagat atgagaccat cagcttgttt 12180 gcacagaggc taaatgagat ttacggattg ccctcatttt tccagtggct gcataagagg 12240 cttgagacct ctgtcctgta tgtaagtgac cctcattgcc cccccgacct tgacgcccat 12300 atcccgttat ataaagtccc caatgatcaa atcttcatta agtaccctat gggaggtata 12360 gaagggtatt gtcagaagct gtggaccatc agcaccattc cctatctata cctggctgct 12420 tatgagagcg gagtaaggat tgcttcgtta gtgcaagggg acaatcagac catagccgta 12480 acaaaaaggg tacccagcac atggccctac aaccttaaga aacgggaagc tgctagagta 12540 actagagatt actttgtaat tcttaggcaa aggctacatg atattggcca tcacctcaag 12600 gcaaatgaga caattgtttc atcacatttt tttgtctatt caaaaggaat atattatgat 12660 gggctacttg tgtcccaatc actcaagagc atcgcaagat gtgtattctg gtcagagact 12720 atagttgatg aaacaagggc agcatgcagt aatattgcta caacaatggc taaaagcatc 12780 gagagaggtt atgaccgtta ccttgcatat tccctgaacg tcctaaaagt gatacagcaa 12840 attctgatct ctcttggctt cacaatcaat tcaaccatga cccgggatgt agtcataccc 12900 ctcctcacaa acaacgacct cttaataagg atggcactgt tgcccgctcc tattgggggg 12960 atgaattatc tgaatatgag caggctgttt gtcagaaaca tcggtgatcc agtaacatca 13020 tcaattgctg atctcaagag aatgattctc gcctcactaa tgcctgaaga gaccctccat 13080 caagtaatga cacaacaacc gggggactct tcattcctag actgggctag cgacccttac 13140 tcagcaaatc ttgtatgtgt ccagagcatc actagactcc tcaagaacat aactgcaagg 13200 tttgtcctga tccatagtcc aaacccaatg ttaaaaggat tattccatga tgacagtaaa 13260 gaagaggacg agggactggc ggcattcctc atggacaggc atattatagt acctagggca 13320 gctcatgaaa tcctggatca tagtgtcaca ggggcaagag agtctattgc aggcatgctg 13380 gataccacaa aaggcttgat tcgagccagc atgaggaagg gggggttaac ctctcgagtg 13440 ataaccagat tgtccaatta tgactatgaa caattcagag cagggatggt gctattgaca 13500 ggaagaaaga gaaatgtcct cattgacaaa gagtcatgtt cagtgcagct ggcgagagct 13560 ctaagaagcc atatgtgggc gaggctagct cgaggacggc ctatttacgg ccttgaggtc 13620 cctgatgtac tagaatctat gcgaggccac cttattcggc gtcatgagac atgtgtcatc 13680 tgcgagtgtg gatcagtcaa ctacggatgg ttttttgtcc cctcgggttg ccaactggat 13740 gatattgaca aggaaacatc atccttgaga gtcccatata ttggttctac cactgatgag 13800 agaacagaca tgaagcttgc cttcgtaaga gccccaagtc gatccttgcg atctgctgtt 13860 agaatagcaa cagtgtactc atgggcttac ggtgatgatg atagctcttg gaacgaagcc 13920 tggttgttgg ctaggcaaag ggccaatgtg agcctggagg agctaagggt gatcactccc 13980 atctcaactt cgactaattt agcgcatagg ttgagggatc gtagcactca agtgaaatac 14040 tcaggtacat cccttgtccg agtggcgagg tataccacaa tctccaacga caatctctca 14100 tttgtcatat cagataagaa ggttgatact aactttatat accaacaagg aatgcttcta 14160 gggttgggtg ttttagaaac attgtttcga ctcgagaaag ataccggatc atctaacacg 14220 gtattacatc ttcacgtcga aacagattgt tgcgtgatcc cgatgataga tcatcccagg 14280 atacccagct cccgcaagct agagctgagg gcagagctat gtaccaaccc attgatatat 14340 gataatgcac ctttaattga cagagatgca acaaggctat acacccagag ccataggagg 14400 caccttgtgg aatttgttac atggtccaca ccccaactat atcacatttt agctaagtcc 14460 acagcactat ctatgattga cctggtaaca aaatttgaga aggaccatat gaatgaaatt 14520 tcagctctca taggggatga cgatatcaat agtttcataa ctgagtttct gctcatagag 14580 ccaagattat tcactatcta cttgggccag tgtgcggcca tcaattgggc atttgatgta 14640 cattatcata gaccatcagg gaaatatcag atgggtgagc tgttgtcatc gttcctttct 14700 agaatgagca aaggagtgtt taaggtgctt gtcaatgctc taagccaccc aaagatctac 14760 aagaaattct ggcattgtgg tattatagag cctatccatg gtccttcact tgatgctcaa 14820 aacttgcaca caactgtgtg caacatggtt tacacatgct atatgaccta cctcgacctg 14880 ttgttgaatg aagagttaga agagttcaca tttctcttgt gtgaaagcga cgaggatgta 14940 gtaccggaca gattcgacaa catccaggca aaacacttat gtgttctggc agatttgtac 15000 tgtcaaccag ggacctgccc accaattcga ggtctaagac cggtagagaa atgtgcagtt 15060 ctaaccgacc atatcaaggc agaggctatg ttatctccag caggatcttc gtggaacata 15120 aatccaatta ttgtagacca ttactcatgc tctctgactt atctccggcg aggatcgatc 15180 aaacagataa gattgagagt tgatccagga ttcattttcg acgccctcgc tgaggtaaat 15240 gtcagtcagc caaagatcgg cagcaacaac atctcaaata tgagcatcaa ggctttcaga 15300 cccccacacg atgatgttgc aaaattgctc aaagatatca acacaagcaa gcacaatctt 15360 cccatttcag ggggcaatct cgccaattat gaaatccatg ctttccgcag aatcgggttg 15420 aactcatctg cttgctacaa agctgttgag atatcaacat taattaggag atgccttgag 15480 ccaggggagg acggcttgtt cttgggtgag ggatcgggtt ctatgttgat cacttataaa 15540 gagatactta aactaaacaa gtgcttctat aatagtgggg tttccgccaa ttctagatct 15600 ggtcaaaggg aattagcacc ctatccctcc gaagttggcc ttgtcgaaca cagaatggga 15660 gtaggtaata ttgtcaaagt gctctttaac gggaggcccg aagtcacgtg ggtaggcagt 15720 gtagattgct tcaatttcat agttagtaat atccctacct ctagtgtggg gtttatccat 15780 tcagatatag agaccttgcc tgacaaagat actatagaga agctagagga attggcagcc 15840 atcttatcga tggctctgct cctgggcaaa ataggatcaa tactggtgat taagcttatg 15900 cctttcagcg gggattttgt tcagggattt ataagttatg tagggtctca ttatagagaa 15960 gtgaaccttg tataccctag atacagcaac ttcatctcta ctgaatctta tttggttatg 16020 acagatctca aggctaaccg gctaatgaat cctgaaaaga ttaagcagca gataattgaa 16080 tcatctgtga ggacttcacc tggacttata ggtcacatcc tatccattaa gcaactaagc 16140 tgcatacaag caattgtggg agacgcagtt agtagaggtg atatcaatcc tactctgaaa 16200 aaacttacac ctatagagca ggtgctgatc aattgcgggt tggcaattaa cggacctaag 16260 ctgtgcaaag aattgatcca ccatgatgtt gcctcagggc aagatggatt gcttaattct 16320 atactcatcc tctacaggga gttggcaaga ttcaaagaca accaaagaag tcaacaaggg 16380 atgttccacg cttaccccgt attggtaagt agcaggcaac gagaacttat atctaggatc 16440 acccgcaaat tctgggggca cattcttctt tactccggga acaaaaagtt gataaataag 16500 tttatccaga atctcaagtc cggctatctg atactagact tacaccagaa tatcttcgtt 16560 aagaatctat ccaagtcaga gaaacagatt attatgacgg ggggtttgaa acgtgagtgg 16620 gtttttaagg taacagtcaa ggagaccaaa gaatggtata agttagtcgg atacagtgcc 16680 ctgattaagg actaattggt tgaactccgg aaccctaatc ctgccctagg tggttaggca 16740 ttatttgcaa tatattaaag aaaactttga aaatacgaag tttctattcc cagctttgtc 16800 tggtggccgg catggtccca gcctcctcgc tggcgccggc tgggcaacat tccgagggga 16860 ccgtcccctc ggtaatggcg aatgggacgc ggccgatccg gctgctaaca aagcccgaaa 16920 ggaagctgag ttggctgctg ccaccgctga gcaataacta gcataacccc ttggggcctc 16980 taaacgggtc ttgaggggtt ttttgctgaa aggaggaact atatccggat gcggccgcgg 17040 gccctatggt acccagcttt tgttcccttt agtgagggtt aattccgagc ttggcgtaat 17100 catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca cacaacatag 17160 gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgaggtaa ctcacattaa 17220 ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag ctgcattaat 17280 gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc 17340 tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg 17400 cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag 17460 gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcg 17520 gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag 17580 gactataaag ataccaggcg ttcccccctg gaagctccct cgtgcgctct cctgttccga 17640 ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc 17700 aatgctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg 17760 tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt 17820 ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca 17880 gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca 17940 ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag 18000 ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca 18060 agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg 18120 ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg agattatcaa 18180 aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca atctaaagta 18240 tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca cctatctcag 18300 cgatctgtct atttcgttca tccatagttg cctgactgcc cgtcgtgtag ataactacga 18360 tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac ccacgctcac 18420 cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc agaagtggtc 18480 ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct agagtaagta 18540 gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac 18600 gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg cgagttacat 18660 gatcccccat gttgtgaaaa aaagcggtta gctccttcgg tcctccgatc gttgtcagaa 18720 gtaagttggc cgcagtgtta tcactcatgc ttatggcagc actgcataat tctcttactg 18780 tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag tcattctgag 18840 aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat aataccgcgc 18900 cacatagcag aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct 18960 caaggatctt accgctgttg agatccagtt cgatgtaacc cactcgtgca cccaactgat 19020 cttcagcatc ttttactttc accagcgttt ctgggtgagc aaaaacagga aggcaaaatg 19080 ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat actcatactc ttcctttttc 19140 aatattattg aagcatttat cagggttatt gtctcatgag cggatacata tttgaatgta 19200 tttagaaaaa taaacaaata ggggttccgc gcacatttcc ccgaaaagtg ccacctgaaa 19260 ttgtaaacgt taatattttg ttaaaattcg cgttaaattt ttgttaaatc agctcatttt 19320 ttaaccaata ggccgaaatc ggcaaaatcc cttataaatc aaaagaatag accgagatag 19380 ggttgagtgt tgttccagtt tggaacaaga gtccactatt aaagaacgtg gactccaacg 19440 tcaaagggcg aaaaaccgtc tatcagggcg atggcccact acgtgaacca tcaccctaat 19500 caagtttttt ggggtcgagg tgccgtaaag cactaaatcg gaaccctaaa gggagccccc 19560 gatttagagc ttgacgggga aagccggcga acgtggcgag aaaggaaggg aagaaagcga 19620 aaggagcggg cgctagggcg ctggcaagtg tagcggtcac gctgcgcgta accaccacac 19680 ccgccgcgct taatgcgccg ctacagggcg cgtcccattc gccattcagg ctgcgcaact 19740 gttgggaagg gcgatcggtg cgggcctctt cgctattacg ccagccaccg cggtg 19795 <210> 30 <211> 17858 <212> DNA <213> Artificial sequence <220> <223> pKP-MVSchw <400> 30 gcgatcgcta atacgactca ctatagggcc aactttgttt ggtctgatga gtccgtgagg 60 acgaaacccg gagtcccggg tcaccaaaca aagttgggta aggatagttc aatcaatgat 120 catcttctag tgcacttagg attcaagatc ctattatcag ggacaagagc aggattaggg 180 atatccgaga tggccacact tttaaggagc ttagcattgt tcaaaagaaa caaggacaaa 240 ccacccatta catcaggatc cggtggagcc atcagaggaa tcaaacacat tattatagta 300 ccaatccctg gagattcctc aattaccact cgatccagac ttctggaccg gttggtgagg 360 ttaattggaa acccggatgt gagcgggccc aaactaacag gggcactaat aggtatatta 420 tccttatttg tggagtctcc aggtcaattg attcagagga tcaccgatga ccctgacgtt 480 agcataaggc tgttagaggt tgtccagagt gaccagtcac aatctggcct taccttcgca 540 tcaagaggta ccaacatgga ggatgaggcg gaccaatact tttcacatga tgatccaatt 600 agtagtgatc aatccaggtt cggatggttc gggaacaagg aaatctcaga tattgaagtg 660 caagaccctg agggattcaa catgattctg ggtaccatcc tagcccaaat ttgggtcttg 720 ctcgcaaagg cggttacggc cccagacacg gcagctgatt cggagctaag aaggtggata 780 aagtacaccc aacaaagaag ggtagttggt gaatttagat tggagagaaa atggttggat 840 gtggtgagga acaggattgc cgaggacctc tccttacgcc gattcatggt cgctctaatc 900 ctggatatca agagaacacc cggaaacaaa cccaggattg ctgaaatgat atgtgacatt 960 gatacatata tcgtagaggc aggattagcc agttttatcc tgactattaa gtttgggata 1020 gaaactatgt atcctgctct tggactgcat gaatttgctg gtgagttatc cacacttgag 1080 tccttgatga acctttacca gcaaatgggg gaaactgcac cctacatggt aatcctggag 1140 aactcaattc agaacaagtt cagtgcagga tcataccctc tgctctggag ctatgccatg 1200 ggagtaggag tggaacttga aaactccatg ggaggtttga actttggccg atcttacttt 1260 gatccagcat attttagatt agggcaagag atggtaagga ggtcagctgg aaaggtcagt 1320 tccacattgg catctgaact cggtatcact gccgaggatg caaggcttgt ttcagagatt 1380 gcaatgcata ctactgagga caagatcagt agagcggttg gacccagaca agcccaagta 1440 tcatttctac acggtgatca aagtgagaat gagctaccga gattgggggg caaggaagat 1500 aggagggtca aacagagtcg aggagaagcc agggagagct acagagaaac cgggcccagc 1560 agagcaagtg atgcgagagc tgcccatctt ccaaccggca cacccctaga cattgacact 1620 gcaacggagt ccagccaaga tccgcaggac agtcgaaggt cagctgacgc cctgcttagg 1680 ctgcaagcca tggcaggaat ctcggaagaa caaggctcag acacggacac ccctatagtg 1740 tacaatgaca gaaatcttct agactaggtg cgagaggccg agggccagaa caacatccgc 1800 ctaccatcca tcattgttat aaaaaactta ggaaccaggt ccacacagcc gccagcccat 1860 caaccatcca ctcccacgat tggagccaat ggcagaagag caggcacgcc atgtcaaaaa 1920 cggactggaa tgcatccggg ctctcaaggc cgagcccatc ggctcactgg ccatcgagga 1980 agctatggca gcatggtcag aaatatcaga caacccagga caggagcgag ccacctgcag 2040 ggaagagaag gcaggcagtt cgggtctcag caaaccatgc ctctcagcaa ttggatcaac 2100 tgaaggcggt gcacctcgca tccgcggtca gggacctgga gagagcgatg acgacgctga 2160 aactttggga atccccccaa gaaatctcca ggcatcaagc actgggttac agtgttatta 2220 cgtttatgat cacagcggtg aagcggttaa gggaatccaa gatgctgact ctatcatggt 2280 tcaatcaggc cttgatggtg atagcaccct ctcaggagga gacaatgaat ctgaaaacag 2340 cgatgtggat attggcgaac ctgataccga gggatatgct atcactgacc ggggatctgc 2400 tcccatctct atggggttca gggcttctga tgttgaaact gcagaaggag gggagatcca 2460 cgagctcctg agactccaat ccagaggcaa caactttccg aagcttggga aaactctcaa 2520 tgttcctccg cccccggacc ccggtagggc cagcacttcc gggacaccca ttaaaaaggg 2580 cacagacgcg agattagcct catttggaac ggagatcgcg tctttattga caggtggtgc 2640 aacccaatgt gctcgaaagt caccctcgga accatcaggg ccaggtgcac ctgcggggaa 2700 tgtccccgag tgtgtgagca atgccgcact gatacaggag tggacacccg aatctggtac 2760 cacaatctcc ccgagatccc agaataatga agaaggggga gactattatg atgatgagct 2820 gttctctgat gtccaagata ttaaaacagc cttggccaaa atacacgagg ataatcagaa 2880 gataatctcc aagctagaat cactgctgtt attgaaggga gaagttgagt caattaagaa 2940 gcagatcaac aggcaaaata tcagcatatc caccctggaa ggacacctct caagcatcat 3000 gatcgccatt cctggacttg ggaaggatcc caacgacccc actgcagatg tcgaaatcaa 3060 tcccgacttg aaacccatca taggcagaga ttcaggccga gcactggccg aagttctcaa 3120 gaaacccgtt gccagccgac aactccaagg aatgacaaat ggacggacca gttccagagg 3180 acagctgctg aaggaatttc agctaaagcc gatcgggaaa aagatgagct cagccgtcgg 3240 gtttgttcct gacaccggcc ctgcatcacg cagtgtaatc cgctccatta taaaatccag 3300 ccggctagag gaggatcgga agcgttacct gatgactctc cttgatgata tcaaaggagc 3360 caatgatctt gccaagttcc accagatgct gatgaagata ataatgaagt agctacagct 3420 caacttacct gccaacccca tgccagtcga cccaactagt acaacctaaa tccattataa 3480 aaaacttagg agcaaagtga ttgcctccca aggtccacaa tgacagagac ctacgacttc 3540 gacaagtcgg catgggacat caaagggtcg atcgctccga tacaacccac cacctacagt 3600 gatggcaggc tggtgcccca ggtcagagtc atagatcctg gtctaggcga caggaaggat 3660 gaatgcttta tgtacatgtt tctgctgggg gttgttgagg acagcgattc cctagggcct 3720 ccaatcgggc gagcatttgg gttcctgccc ttaggtgttg gcagatccac agcaaagccc 3780 gaaaaactcc tcaaagaggc cactgagctt gacatagttg ttagacgtac agcagggctc 3840 aatgaaaaac tggtgttcta caacaacacc ccactaactc tcctcacacc ttggagaaag 3900 gtcctaacaa cagggagtgt cttcaacgca aaccaagtgt gcaatgcggt taatctgata 3960 ccgctcgata ccccgcagag gttccgtgtt gtttatatga gcatcacccg tctttcggat 4020 aacgggtatt acaccgttcc tagaagaatg ctggaattca gatcggtcaa tgcagtggcc 4080 ttcaacctgc tggtgaccct taggattgac aaggcgatag gccctgggaa gatcatcgac 4140 aatacagagc aacttcctga ggcaacattt atggtccaca tcgggaactt caggagaaag 4200 aagagtgaag tctactctgc cgattattgc aaaatgaaaa tcgaaaagat gggcctggtt 4260 tttgcacttg gtgggatagg gggcaccagt cttcacatta gaagcacagg caaaatgagc 4320 aagactctcc atgcacaact cgggttcaag aagaccttat gttacccgct gatggatatc 4380 aatgaagacc ttaatcgatt actctggagg agcagatgca agatagtaag aatccaggca 4440 gttttgcagc catcagttcc tcaagaattc cgcatttacg acgacgtgat cataaatgat 4500 gaccaaggac tattcaaagt tctgtagacc gtagtgccca gcaatgcccg aaaacgaccc 4560 ccctcacaat gacagccaga aggcccggac aaaaaagccc cctccgaaag actccacgga 4620 ccaagcgaga ggccagccag cagccgacgg caagcgcgaa caccaggcgg ccccagcaca 4680 gaacagccct gacacaaggc caccaccagc caccccaatc tgcatcctcc tcgtgggacc 4740 cccgaggacc aacccccaag gctgcccccg atccaaacca ccaaccgcat ccccaccacc 4800 cccgggaaag aaacccccag caattggaag gcccctcccc ctcttcctca acacaagaac 4860 tccacaaccg aaccgcacaa gcgaccgagg tgacccaacc gcaggcatcc gactccctag 4920 acagatcctc tctccccggc aaactaaaca aaacttaggg ccaaggaaca tacacaccca 4980 acagaaccca gaccccggcc cacggcgccg cgcccccaac ccccgacaac cagagggagc 5040 ccccaaccaa tcccgccggc tcccccggtg cccacaggca gggacaccaa cccccgaaca 5100 gacccagcac ccaaccatcg acaatccaag acgggggggc ccccccaaaa aaaggccccc 5160 aggggccgac agccagcacc gcgaggaagc ccacccaccc cacacacgac cacggcaacc 5220 aaaccagaac ccagaccacc ctgggccacc agctcccaga ctcggccatc accccgcaga 5280 aaggaaaggc cacaacccgc gcaccccagc cccgatccgg cggggagcca cccaacccga 5340 accagcaccc aagagcgatc cccgaaggac ccccgaaccg caaaggacat cagtatccca 5400 cagcctctcc aagtcccccg gtctcctcct cttctcgaag ggaccaaaag atcaatccac 5460 cacacccgac gacactcaac tccccacccc taaaggagac accgggaatc ccagaatcaa 5520 gactcatcca atgtccatca tgggtctcaa ggtgaacgtc tctgccatat tcatggcagt 5580 actgttaact ctccaaacac ccaccggtca aatccattgg ggcaatctct ctaagatagg 5640 ggtggtagga ataggaagtg caagctacaa agttatgact cgttccagcc atcaatcatt 5700 agtcataaaa ttaatgccca atataactct cctcaataac tgcacgaggg tagagattgc 5760 agaatacagg agactactga gaacagtttt ggaaccaatt agagatgcac ttaatgcaat 5820 gacccagaat ataagaccgg ttcagagtgt agcttcaagt aggagacaca agagatttgc 5880 gggagtagtc ctggcaggtg cggccctagg cgttgccaca gctgctcaga taacagccgg 5940 cattgcactt caccagtcca tgctgaactc tcaagccatc gacaatctga gagcgagcct 6000 ggaaactact aatcaggcaa ttgagacaat cagacaagca gggcaggaga tgatattggc 6060 tgttcagggt gtccaagact acatcaataa tgagctgata ccgtctatga accaactatc 6120 ttgtgattta atcggccaga agctcgggct caaattgctc agatactata cagaaatcct 6180 gtcattattt ggccccagtt tacgggaccc catatctgcg gagatatcta tccaggcttt 6240 gagctatgcg cttggaggag acatcaataa ggtgttagaa aagctcggat acagtggagg 6300 tgatttactg ggcatcttag agagcggagg aataaaggcc cggataactc acgtcgacac 6360 agagtcctac ttcattgtcc tcagtatagc ctatccgacg ctgtccgaga ttaagggggt 6420 gattgtccac cggctagagg gggtctcgta caacataggc tctcaagagt ggtataccac 6480 tgtgcccaag tatgttgcaa cccaagggta ccttatctcg aattttgatg agtcatcgtg 6540 tactttcatg ccagagggga ctgtgtgcag ccaaaatgcc ttgtacccga tgagtcctct 6600 gctccaagaa tgcctccggg ggtacaccaa gtcctgtgct cgtacactcg tatccgggtc 6660 ttttgggaac cggttcattt tatcacaagg gaacctaata gccaattgtg catcaatcct 6720 ttgcaagtgt tacacaacag gaacgatcat taatcaagac cctgacaaga tcctaacata 6780 cattgctgcc gatcactgcc cggtagtcga ggtgaacggc gtgaccatcc aagtcgggag 6840 caggaggtat ccagacgctg tgtacttgca cagaattgac ctcggtcctc ccatatcatt 6900 ggagaggttg gacgtaggga caaatctggg gaatgcaatt gctaagttgg aggatgccaa 6960 ggaattgttg gagtcatcgg accagatatt gaggagtatg aaaggtttat cgagcactag 7020 catagtctac atcctgattg cagtgtgtct tggagggttg atagggatcc ccgctttaat 7080 atgttgctgc agggggcgtt gtaacaaaaa gggagaacaa gttggtatgt caagaccagg 7140 cctaaagcct gatcttacgg gaacatcaaa atcctatgta aggtcgctct gatcctctac 7200 aactcttgaa acacaaatgt cccacaagtc tcctcttcgt catcaagcaa ccaccgcacc 7260 cagcatcaag cccacctgaa attatctccg gcttccctct ggccgaacaa tatcggtagt 7320 taatcaaaac ttagggtgca agatcatcca caatgtcacc acaacgagac cggataaatg 7380 ccttctacaa agataacccc catcccaagg gaagtaggat agtcattaac agagaacatc 7440 ttatgattga tagaccttat gttttgctgg ctgttctgtt tgtcatgttt ctgagcttga 7500 tcgggttgct agccattgca ggcattagac ttcatcgggc agccatctac accgcagaga 7560 tccataaaag cctcagcacc aatctagatg taactaactc aatcgagcat caggtcaagg 7620 acgtgctgac accactcttc aaaatcatcg gtgatgaagt gggcctgagg acacctcaga 7680 gattcactga cctagtgaaa ttaatctctg acaagattaa attccttaat ccggataggg 7740 agtacgactt cagagatctc acttggtgta tcaacccgcc agagagaatc aaattggatt 7800 atgatcaata ctgtgcagat gtggctgctg aagagctcat gaatgcattg gtgaactcaa 7860 ctctactgga gaccagaaca accaatcagt tcctagctgt ctcaaaggga aactgctcag 7920 ggcccactac aatcagaggt caattctcaa acatgtcgct gtccctgtta gacttgtatt 7980 taggtcgagg ttacaatgtg tcatctatag tcactatgac atcccaggga atgtatgggg 8040 gaacttacct agtggaaaag cctaatctga gcagcaaaag gtcagagttg tcacaactga 8100 gcatgtaccg agtgtttgaa gtaggtgtta tcagaaatcc gggtttgggg gctccggtgt 8160 tccatatgac aaactatctt gagcaaccag tcagtaatga tctcagcaac tgtatggtgg 8220 ctttggggga gctcaaactc gcagcccttt gtcacgggga agattctatc acaattccct 8280 atcagggatc agggaaaggt gtcagcttcc agctcgtcaa gctaggtgtc tggaaatccc 8340 caaccgacat gcaatcctgg gtccccttat caacggatga tccagtgata gacaggcttt 8400 acctctcatc tcacagaggt gttatcgctg acaatcaagc aaaatgggct gtcccgacaa 8460 cacgaacaga tgacaagttg cgaatggaga catgcttcca acaggcgtgt aagggtaaaa 8520 tccaagcact ctgcgagaat cccgagtggg caccattgaa ggataacagg attccttcat 8580 acggggtctt gtctgttgat ctgagtctga cagttgagct taaaatcaaa attgcttcgg 8640 gattcgggcc attgatcaca cacggttcag ggatggacct atacaaatcc aaccacaaca 8700 atgtgtattg gctgactatc ccgccaatga agaacctagc cttaggtgta atcaacacat 8760 tggagtggat accgagattc aaggttagtc cctacctctt cactgtccca attaaggaag 8820 caggcgaaga ctgccatgcc ccaacatacc tacctgcgga ggtggatggt gatgtcaaac 8880 tcagttccaa tctggtgatt ctacctggtc aagatctcca atatgttttg gcaacctacg 8940 atacttccag ggttgaacat gctgtggttt attacgttta cagcccaagc cgctcatttt 9000 cttactttta tccttttagg ttgcctataa agggggtccc catcgaatta caagtggaat 9060 gcttcacatg ggaccaaaaa ctctggtgcc gtcacttctg tgtgcttgcg gactcagaat 9120 ctggtggaca tatcactcac tctgggatgg tgggcatggg agtcagctgc acagtcaccc 9180 gggaagatgg aaccaatcgc agatagggct gctagtgaac caatcacatg atgtcaccca 9240 gacatcaggc atacccacta gtgtgaaata gacatcagaa ttaagaaaaa cgtagggtcc 9300 aagtggttcc ccgttatgga ctcgctatct gtcaaccaga tcttataccc tgaagttcac 9360 ctagatagcc cgatagttac caataagata gtagccatcc tggagtatgc tcgagtccct 9420 cacgcttaca gcctggagga ccctacactg tgtcagaaca tcaagcaccg cctaaaaaac 9480 ggattttcca accaaatgat tataaacaat gtggaagttg ggaatgtcat caagtccaag 9540 cttaggagtt atccggccca ctctcatatt ccatatccaa attgtaatca ggatttattt 9600 aacatagaag acaaagagtc aacgaggaag atccgtgaac tcctcaaaaa ggggaattcg 9660 ctgtactcca aagtcagtga taaggttttc caatgcttaa gggacactaa ctcacggctt 9720 ggcctaggct ccgaattgag ggaggacatc aaggagaaag ttattaactt gggagtttac 9780 atgcacagct cccagtggtt tgagcccttt ctgttttggt ttacagtcaa gactgagatg 9840 aggtcagtga ttaaatcaca aacccatact tgccatagga ggagacacac acctgtattc 9900 ttcactggta gttcagttga gttgctaatc tctcgtgacc ttgttgctat aatcagtaaa 9960 gagtctcaac atgtatatta cctgacattt gaactggttt tgatgtattg tgatgtcata 10020 gaggggaggt taatgacaga gaccgctatg actattgatg ctaggtatac agagcttcta 10080 ggaagagtca gatacatgtg gaaactgata gatggtttct tccctgcact cgggaatcca 10140 acttatcaaa ttgtagccat gctggagcct ctttcacttg cttacctgca gctgagggat 10200 ataacagtag aactcagagg tgctttcctt aaccactgct ttactgaaat acatgatgtt 10260 cttgaccaaa acgggttttc tgatgaaggt acttatcatg agttaactga agctctagat 10320 tacattttca taactgatga catacatctg acaggggaga ttttctcatt tttcagaagt 10380 ttcggccacc ccagacttga agcagtaacg gctgctgaaa atgttaggaa atacatgaat 10440 cagcctaaag tcattgtgta tgagactctg atgaaaggtc atgccatatt ttgtggaatc 10500 ataatcaacg gctatcgtga caggcacgga ggcagttggc caccgctgac cctccccctg 10560 catgctgcag acacaatccg gaatgctcaa gcttcaggtg aagggttaac acatgagcag 10620 tgcgttgata actggaaatc ttttgctgga gtgaaatttg gctgctttat gcctcttagc 10680 ctggatagtg atctgacaat gtacctaaag gacaaggcac ttgctgctct ccaaagggaa 10740 tgggattcag tttacccgaa agagttcctg cgttacgacc ctcccaaggg aaccgggtca 10800 cggaggcttg tagatgtttt ccttaatgat tcgagctttg acccatatga tgtgataatg 10860 tatgttgtaa gtggagctta cctccatgac cctgagttca acctgtctta cagcctgaaa 10920 gaaaaggaga tcaaggaaac aggtagactt tttgctaaaa tgacttacaa aatgagggca 10980 tgccaagtga ttgctgaaaa tctaatctca aacgggattg gcaaatattt taaggacaat 11040 gggatggcca aggatgagca cgatttgact aaggcactcc acactctagc tgtctcagga 11100 gtccccaaag atctcaaaga aagtcacagg ggggggccag tcttaaaaac ctactcccga 11160 agcccagtcc acacaagtac caggaacgtg agagcagcaa aagggtttat agggttccct 11220 caagtaattc ggcaggacca agacactgat catccggaga atatggaagc ttacgagaca 11280 gtcagtgcat ttatcacgac tgatctcaag aagtactgcc ttaattggag atatgagacc 11340 atcagcttgt ttgcacagag gctaaatgag atttacggat tgccctcatt tttccagtgg 11400 ctgcataaga ggcttgagac ctctgtcctg tatgtaagtg accctcattg cccccccgac 11460 cttgacgccc atatcccgtt atataaagtc cccaatgatc aaatcttcat taagtaccct 11520 atgggaggta tagaagggta ttgtcagaag ctgtggacca tcagcaccat tccctatcta 11580 tacctggctg cttatgagag cggagtaagg attgcttcgt tagtgcaagg ggacaatcag 11640 accatagccg taacaaaaag ggtacccagc acatggccct acaaccttaa gaaacgggaa 11700 gctgctagag taactagaga ttactttgta attcttaggc aaaggctaca tgatattggc 11760 catcacctca aggcaaatga gacaattgtt tcatcacatt tttttgtcta ttcaaaagga 11820 atatattatg atgggctact tgtgtcccaa tcactcaaga gcatcgcaag atgtgtattc 11880 tggtcagaga ctatagttga tgaaacaagg gcagcatgca gtaatattgc tacaacaatg 11940 gctaaaagca tcgagagagg ttatgaccgt taccttgcat attccctgaa cgtcctaaaa 12000 gtgatacagc aaattctgat ctctcttggc ttcacaatca attcaaccat gacccgggat 12060 gtagtcatac ccctcctcac aaacaacgac ctcttaataa ggatggcact gttgcccgct 12120 cctattgggg ggatgaatta tctgaatatg agcaggctgt ttgtcagaaa catcggtgat 12180 ccagtaacat catcaattgc tgatctcaag agaatgattc tcgcctcact aatgcctgaa 12240 gagaccctcc atcaagtaat gacacaacaa ccgggggact cttcattcct agactgggct 12300 agcgaccctt actcagcaaa tcttgtatgt gtccagagca tcactagact cctcaagaac 12360 ataactgcaa ggtttgtcct gatccatagt ccaaacccaa tgttaaaagg attattccat 12420 gatgacagta aagaagagga cgagggactg gcggcattcc tcatggacag gcatattata 12480 gtacctaggg cagctcatga aatcctggat catagtgtca caggggcaag agagtctatt 12540 gcaggcatgc tggataccac aaaaggcttg attcgagcca gcatgaggaa gggggggtta 12600 acctctcgag tgataaccag attgtccaat tatgactatg aacaattcag agcagggatg 12660 gtgctattga caggaagaaa gagaaatgtc ctcattgaca aagagtcatg ttcagtgcag 12720 ctggcgagag ctctaagaag ccatatgtgg gcgaggctag ctcgaggacg gcctatttac 12780 ggccttgagg tccctgatgt actagaatct atgcgaggcc accttattcg gcgtcatgag 12840 acatgtgtca tctgcgagtg tggatcagtc aactacggat ggttttttgt cccctcgggt 12900 tgccaactgg atgatattga caaggaaaca tcatccttga gagtcccata tattggttct 12960 accactgatg agagaacaga catgaagctt gccttcgtaa gagccccaag tcgatccttg 13020 cgatctgctg ttagaatagc aacagtgtac tcatgggctt acggtgatga tgatagctct 13080 tggaacgaag cctggttgtt ggctaggcaa agggccaatg tgagcctgga ggagctaagg 13140 gtgatcactc ccatctcaac ttcgactaat ttagcgcata ggttgaggga tcgtagcact 13200 caagtgaaat actcaggtac atcccttgtc cgagtggcga ggtataccac aatctccaac 13260 gacaatctct catttgtcat atcagataag aaggttgata ctaactttat ataccaacaa 13320 ggaatgcttc tagggttggg tgttttagaa acattgtttc gactcgagaa agataccgga 13380 tcatctaaca cggtattaca tcttcacgtc gaaacagatt gttgcgtgat cccgatgata 13440 gatcatccca ggatacccag ctcccgcaag ctagagctga gggcagagct atgtaccaac 13500 ccattgatat atgataatgc acctttaatt gacagagatg caacaaggct atacacccag 13560 agccatagga ggcaccttgt ggaatttgtt acatggtcca caccccaact atatcacatt 13620 ttagctaagt ccacagcact atctatgatt gacctggtaa caaaatttga gaaggaccat 13680 atgaatgaaa tttcagctct cataggggat gacgatatca atagtttcat aactgagttt 13740 ctgctcatag agccaagatt attcactatc tacttgggcc agtgtgcggc catcaattgg 13800 gcatttgatg tacattatca tagaccatca gggaaatatc agatgggtga gctgttgtca 13860 tcgttccttt ctagaatgag caaaggagtg tttaaggtgc ttgtcaatgc tctaagccac 13920 ccaaagatct acaagaaatt ctggcattgt ggtattatag agcctatcca tggtccttca 13980 cttgatgctc aaaacttgca cacaactgtg tgcaacatgg tttacacatg ctatatgacc 14040 tacctcgacc tgttgttgaa tgaagagtta gaagagttca catttctctt gtgtgaaagc 14100 gacgaggatg tagtaccgga cagattcgac aacatccagg caaaacactt atgtgttctg 14160 gcagatttgt actgtcaacc agggacctgc ccaccaattc gaggtctaag accggtagag 14220 aaatgtgcag ttctaaccga ccatatcaag gcagaggcta tgttatctcc agcaggatct 14280 tcgtggaaca taaatccaat tattgtagac cattactcat gctctctgac ttatctccgg 14340 cgaggatcga tcaaacagat aagattgaga gttgatccag gattcatttt cgacgccctc 14400 gctgaggtaa atgtcagtca gccaaagatc ggcagcaaca acatctcaaa tatgagcatc 14460 aaggctttca gacccccaca cgatgatgtt gcaaaattgc tcaaagatat caacacaagc 14520 aagcacaatc ttcccatttc agggggcaat ctcgccaatt atgaaatcca tgctttccgc 14580 agaatcgggt tgaactcatc tgcttgctac aaagctgttg agatatcaac attaattagg 14640 agatgccttg agccagggga ggacggcttg ttcttgggtg agggatcggg ttctatgttg 14700 atcacttata aagagatact taaactaaac aagtgcttct ataatagtgg ggtttccgcc 14760 aattctagat ctggtcaaag ggaattagca ccctatccct ccgaagttgg ccttgtcgaa 14820 cacagaatgg gagtaggtaa tattgtcaaa gtgctcttta acgggaggcc cgaagtcacg 14880 tgggtaggca gtgtagattg cttcaatttc atagttagta atatccctac ctctagtgtg 14940 gggtttatcc attcagatat agagaccttg cctgacaaag atactataga gaagctagag 15000 gaattggcag ccatcttatc gatggctctg ctcctgggca aaataggatc aatactggtg 15060 attaagctta tgcctttcag cggggatttt gttcagggat ttataagtta tgtagggtct 15120 cattatagag aagtgaacct tgtataccct agatacagca acttcatctc tactgaatct 15180 tatttggtta tgacagatct caaggctaac cggctaatga atcctgaaaa gattaagcag 15240 cagataattg aatcatctgt gaggacttca cctggactta taggtcacat cctatccatt 15300 aagcaactaa gctgcataca agcaattgtg ggagacgcag ttagtagagg tgatatcaat 15360 cctactctga aaaaacttac acctatagag caggtgctga tcaattgcgg gttggcaatt 15420 aacggaccta agctgtgcaa agaattgatc caccatgatg ttgcctcagg gcaagatgga 15480 ttgcttaatt ctatactcat cctctacagg gagttggcaa gattcaaaga caaccaaaga 15540 agtcaacaag ggatgttcca cgcttacccc gtattggtaa gtagcaggca acgagaactt 15600 atatctagga tcacccgcaa attctggggg cacattcttc tttactccgg gaacaaaaag 15660 ttgataaata agtttatcca gaatctcaag tccggctatc tgatactaga cttacaccag 15720 aatatcttcg ttaagaatct atccaagtca gagaaacaga ttattatgac ggggggtttg 15780 aaacgtgagt gggtttttaa ggtaacagtc aaggagacca aagaatggta taagttagtc 15840 ggatacagtg ccctgattaa ggactaattg gttgaactcc ggaaccctaa tcctgcccta 15900 ggtggttagg cattatttgc aatatattaa agaaaacttt gaaaatacga agtttctatt 15960 cccagctttg tctggtggcc ggcatggtcc cagcctcctc gctggcgccg gctgggcaac 16020 attccgaggg gaccgtcccc tcggtaatgg cgaatgggac gcggccgatc cggctgctaa 16080 caaagcccga aaggaagctg agttggctgc tgccaccgct gagcaataac tagcataacc 16140 ccttggggcc tctaaacggg tcttgagggg ttttttgctg aaaggaggaa ctatatccgg 16200 atgcggccgc catgaacaat aaaactgtct gcttacataa acagtaatac aaggggtgtt 16260 atgagccata ttcaacggga aacgtcgagg ccgcgattaa attccaacat ggatgctgat 16320 ttatatgggt ataaatgggc tcgcgataat gtcgggcaat caggtgcgac aatctatcgc 16380 ttgtatggga agcccgatgc gccagagttg tttctgaaac atggcaaagg tagcgttgcc 16440 aatgatgtta cagatgagat ggtcagacta aactggctga cggaatttat gcctcttccg 16500 accatcaagc attttatccg tactcctgat gatgcatggt tactcaccac tgcgatcccc 16560 ggaaaaacag cattccaggt attagaagaa tatcctgatt caggtgaaaa tattgttgat 16620 gcgctggcag tgttcctgcg ccggttgcat tcgattcctg tttgtaattg tccttttaac 16680 agcgatcgtg tatttcgtct cgctcaggcg caatcacgaa tgaataacgg tttggttgat 16740 gcgagtgatt ttgatgacga gcgtaatggc tggcctgttg aacaagtctg gaaagaaatg 16800 cataaacttt tgccattctc accggattca gtcgtcactc atggtgattt ctcacttgat 16860 aaccttattt ttgacgaggg gaaattaata ggttgtattg atgttggacg agtcggaatc 16920 gcagaccgat accaggatct tgccatccta tggaactgcc tcggtgagtt ttctccttca 16980 ttacagaaac ggctttttca aaaatatggt attgataatc ctgatatgaa taaattgcag 17040 tttcatttga tgctcgatga gtttttctaa tcagaattgg ttaattggtt gtaacattat 17100 tcagattggg ccccgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct 17160 tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca 17220 gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc 17280 agcagagcgc agataccaaa tactgttctt ctagtgtagc cgtagttagg ccaccacttc 17340 aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct 17400 gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag 17460 gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc 17520 tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg 17580 agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag 17640 cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt 17700 gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac 17760 gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg 17820 ttatcccctg attctgtgga taaccgtatt accgctag 17858 <210> 31 <211> 18734 <212> DNA <213> Artificial sequence <220> <223> pKP-MVSchw-ATU1(eGFP) <400> 31 gcgatcgcta atacgactca ctatagggcc aactttgttt ggtctgatga gtccgtgagg 60 acgaaacccg gagtcccggg tcaccaaaca aagttgggta aggatagttc aatcaatgat 120 catcttctag tgcacttagg attcaagatc ctattatcag ggacaagagc aggattaggg 180 atatccgaga cgcgtacgat ggtgagcaag ggcgaggagc tgttcaccgg ggtggtgccc 240 atcctggtcg agctggacgg cgacgtaaac ggccacaagt tcagcgtgtc cggcgagggc 300 gagggcgatg ccacctacgg caagctgacc ctgaagttca tctgcaccac cggcaagctg 360 cccgtgccct ggcccaccct cgtgaccacc ctgacctacg gcgtgcagtg cttcagccgc 420 taccccgacc acatgaagca gcacgacttc ttcaagtccg ccatgcccga aggctacgtc 480 caggagcgca ccatcttctt caaggacgac ggcaactaca agacccgcgc cgaggtgaag 540 ttcgagggcg acaccctggt gaaccgcatc gagctgaagg gcatcgactt caaggaggac 600 ggcaacatcc tggggcacaa gctggagtac aactacaaca gccacaacgt ctatatcatg 660 gccgacaagc agaagaacgg catcaaggtg aacttcaaga tccgccacaa catcgaggac 720 ggcagcgtgc agctcgccga ccactaccag cagaacaccc ccatcggcga cggccccgtg 780 ctgctgcccg acaaccacta cctgagcacc cagtccgccc tgagcaaaga ccccaacgag 840 aagcgcgatc acatggtcct gctggagttc gtgaccgccg ccgggatcac tctcggcatg 900 gacgagctgt acaagtaggc gcgcagcgct tagacgtctc gcgatcgatt agtgcgagag 960 gccgagggcc agaacaacat ccgcctacca tccatcattg ttataaaaaa cttaggattc 1020 aagatcctat tatcagggac aagagcagga ttagggatat ccgagatggc cacactttta 1080 aggagcttag cattgttcaa aagaaacaag gacaaaccac ccattacatc aggatccggt 1140 ggagccatca gaggaatcaa acacattatt atagtaccaa tccctggaga ttcctcaatt 1200 accactcgat ccagacttct ggaccggttg gtgaggttaa ttggaaaccc ggatgtgagc 1260 gggcccaaac taacaggggc actaataggt atattatcct tatttgtgga gtctccaggt 1320 caattgattc agaggatcac cgatgaccct gacgttagca taaggctgtt agaggttgtc 1380 cagagtgacc agtcacaatc tggccttacc ttcgcatcaa gaggtaccaa catggaggat 1440 gaggcggacc aatacttttc acatgatgat ccaattagta gtgatcaatc caggttcgga 1500 tggttcggga acaaggaaat ctcagatatt gaagtgcaag accctgaggg attcaacatg 1560 attctgggta ccatcctagc ccaaatttgg gtcttgctcg caaaggcggt tacggcccca 1620 gacacggcag ctgattcgga gctaagaagg tggataaagt acacccaaca aagaagggta 1680 gttggtgaat ttagattgga gagaaaatgg ttggatgtgg tgaggaacag gattgccgag 1740 gacctctcct tacgccgatt catggtcgct ctaatcctgg atatcaagag aacacccgga 1800 aacaaaccca ggattgctga aatgatatgt gacattgata catatatcgt agaggcagga 1860 ttagccagtt ttatcctgac tattaagttt gggatagaaa ctatgtatcc tgctcttgga 1920 ctgcatgaat ttgctggtga gttatccaca cttgagtcct tgatgaacct ttaccagcaa 1980 atgggggaaa ctgcacccta catggtaatc ctggagaact caattcagaa caagttcagt 2040 gcaggatcat accctctgct ctggagctat gccatgggag taggagtgga acttgaaaac 2100 tccatgggag gtttgaactt tggccgatct tactttgatc cagcatattt tagattaggg 2160 caagagatgg taaggaggtc agctggaaag gtcagttcca cattggcatc tgaactcggt 2220 atcactgccg aggatgcaag gcttgtttca gagattgcaa tgcatactac tgaggacaag 2280 atcagtagag cggttggacc cagacaagcc caagtatcat ttctacacgg tgatcaaagt 2340 gagaatgagc taccgagatt ggggggcaag gaagatagga gggtcaaaca gagtcgagga 2400 gaagccaggg agagctacag agaaaccggg cccagcagag caagtgatgc gagagctgcc 2460 catcttccaa ccggcacacc cctagacatt gacactgcaa cggagtccag ccaagatccg 2520 caggacagtc gaaggtcagc tgacgccctg cttaggctgc aagccatggc aggaatctcg 2580 gaagaacaag gctcagacac ggacacccct atagtgtaca atgacagaaa tcttctagac 2640 taggtgcgag aggccgaggg ccagaacaac atccgcctac catccatcat tgttataaaa 2700 aacttaggaa ccaggtccac acagccgcca gcccatcaac catccactcc cacgattgga 2760 gccaatggca gaagagcagg cacgccatgt caaaaacgga ctggaatgca tccgggctct 2820 caaggccgag cccatcggct cactggccat cgaggaagct atggcagcat ggtcagaaat 2880 atcagacaac ccaggacagg agcgagccac ctgcagggaa gagaaggcag gcagttcggg 2940 tctcagcaaa ccatgcctct cagcaattgg atcaactgaa ggcggtgcac ctcgcatccg 3000 cggtcaggga cctggagaga gcgatgacga cgctgaaact ttgggaatcc ccccaagaaa 3060 tctccaggca tcaagcactg ggttacagtg ttattacgtt tatgatcaca gcggtgaagc 3120 ggttaaggga atccaagatg ctgactctat catggttcaa tcaggccttg atggtgatag 3180 caccctctca ggaggagaca atgaatctga aaacagcgat gtggatattg gcgaacctga 3240 taccgaggga tatgctatca ctgaccgggg atctgctccc atctctatgg ggttcagggc 3300 ttctgatgtt gaaactgcag aaggagggga gatccacgag ctcctgagac tccaatccag 3360 aggcaacaac tttccgaagc ttgggaaaac tctcaatgtt cctccgcccc cggaccccgg 3420 tagggccagc acttccggga cacccattaa aaagggcaca gacgcgagat tagcctcatt 3480 tggaacggag atcgcgtctt tattgacagg tggtgcaacc caatgtgctc gaaagtcacc 3540 ctcggaacca tcagggccag gtgcacctgc ggggaatgtc cccgagtgtg tgagcaatgc 3600 cgcactgata caggagtgga cacccgaatc tggtaccaca atctccccga gatcccagaa 3660 taatgaagaa gggggagact attatgatga tgagctgttc tctgatgtcc aagatattaa 3720 aacagccttg gccaaaatac acgaggataa tcagaagata atctccaagc tagaatcact 3780 gctgttattg aagggagaag ttgagtcaat taagaagcag atcaacaggc aaaatatcag 3840 catatccacc ctggaaggac acctctcaag catcatgatc gccattcctg gacttgggaa 3900 ggatcccaac gaccccactg cagatgtcga aatcaatccc gacttgaaac ccatcatagg 3960 cagagattca ggccgagcac tggccgaagt tctcaagaaa cccgttgcca gccgacaact 4020 ccaaggaatg acaaatggac ggaccagttc cagaggacag ctgctgaagg aatttcagct 4080 aaagccgatc gggaaaaaga tgagctcagc cgtcgggttt gttcctgaca ccggccctgc 4140 atcacgcagt gtaatccgct ccattataaa atccagccgg ctagaggagg atcggaagcg 4200 ttacctgatg actctccttg atgatatcaa aggagccaat gatcttgcca agttccacca 4260 gatgctgatg aagataataa tgaagtagct acagctcaac ttacctgcca accccatgcc 4320 agtcgaccca actagtacaa cctaaatcca ttataaaaaa cttaggagca aagtgattgc 4380 ctcccaaggt ccacaatgac agagacctac gacttcgaca agtcggcatg ggacatcaaa 4440 gggtcgatcg ctccgataca acccaccacc tacagtgatg gcaggctggt gccccaggtc 4500 agagtcatag atcctggtct aggcgacagg aaggatgaat gctttatgta catgtttctg 4560 ctgggggttg ttgaggacag cgattcccta gggcctccaa tcgggcgagc atttgggttc 4620 ctgcccttag gtgttggcag atccacagca aagcccgaaa aactcctcaa agaggccact 4680 gagcttgaca tagttgttag acgtacagca gggctcaatg aaaaactggt gttctacaac 4740 aacaccccac taactctcct cacaccttgg agaaaggtcc taacaacagg gagtgtcttc 4800 aacgcaaacc aagtgtgcaa tgcggttaat ctgataccgc tcgatacccc gcagaggttc 4860 cgtgttgttt atatgagcat cacccgtctt tcggataacg ggtattacac cgttcctaga 4920 agaatgctgg aattcagatc ggtcaatgca gtggccttca acctgctggt gacccttagg 4980 attgacaagg cgataggccc tgggaagatc atcgacaata cagagcaact tcctgaggca 5040 acatttatgg tccacatcgg gaacttcagg agaaagaaga gtgaagtcta ctctgccgat 5100 tattgcaaaa tgaaaatcga aaagatgggc ctggtttttg cacttggtgg gatagggggc 5160 accagtcttc acattagaag cacaggcaaa atgagcaaga ctctccatgc acaactcggg 5220 ttcaagaaga ccttatgtta cccgctgatg gatatcaatg aagaccttaa tcgattactc 5280 tggaggagca gatgcaagat agtaagaatc caggcagttt tgcagccatc agttcctcaa 5340 gaattccgca tttacgacga cgtgatcata aatgatgacc aaggactatt caaagttctg 5400 tagaccgtag tgcccagcaa tgcccgaaaa cgacccccct cacaatgaca gccagaaggc 5460 ccggacaaaa aagccccctc cgaaagactc cacggaccaa gcgagaggcc agccagcagc 5520 cgacggcaag cgcgaacacc aggcggcccc agcacagaac agccctgaca caaggccacc 5580 accagccacc ccaatctgca tcctcctcgt gggacccccg aggaccaacc cccaaggctg 5640 cccccgatcc aaaccaccaa ccgcatcccc accacccccg ggaaagaaac ccccagcaat 5700 tggaaggccc ctccccctct tcctcaacac aagaactcca caaccgaacc gcacaagcga 5760 ccgaggtgac ccaaccgcag gcatccgact ccctagacag atcctctctc cccggcaaac 5820 taaacaaaac ttagggccaa ggaacataca cacccaacag aacccagacc ccggcccacg 5880 gcgccgcgcc cccaaccccc gacaaccaga gggagccccc aaccaatccc gccggctccc 5940 ccggtgccca caggcaggga caccaacccc cgaacagacc cagcacccaa ccatcgacaa 6000 tccaagacgg gggggccccc ccaaaaaaag gcccccaggg gccgacagcc agcaccgcga 6060 ggaagcccac ccaccccaca cacgaccacg gcaaccaaac cagaacccag accaccctgg 6120 gccaccagct cccagactcg gccatcaccc cgcagaaagg aaaggccaca acccgcgcac 6180 cccagccccg atccggcggg gagccaccca acccgaacca gcacccaaga gcgatccccg 6240 aaggaccccc gaaccgcaaa ggacatcagt atcccacagc ctctccaagt cccccggtct 6300 cctcctcttc tcgaagggac caaaagatca atccaccaca cccgacgaca ctcaactccc 6360 cacccctaaa ggagacaccg ggaatcccag aatcaagact catccaatgt ccatcatggg 6420 tctcaaggtg aacgtctctg ccatattcat ggcagtactg ttaactctcc aaacacccac 6480 cggtcaaatc cattggggca atctctctaa gataggggtg gtaggaatag gaagtgcaag 6540 ctacaaagtt atgactcgtt ccagccatca atcattagtc ataaaattaa tgcccaatat 6600 aactctcctc aataactgca cgagggtaga gattgcagaa tacaggagac tactgagaac 6660 agttttggaa ccaattagag atgcacttaa tgcaatgacc cagaatataa gaccggttca 6720 gagtgtagct tcaagtagga gacacaagag atttgcggga gtagtcctgg caggtgcggc 6780 cctaggcgtt gccacagctg ctcagataac agccggcatt gcacttcacc agtccatgct 6840 gaactctcaa gccatcgaca atctgagagc gagcctggaa actactaatc aggcaattga 6900 gacaatcaga caagcagggc aggagatgat attggctgtt cagggtgtcc aagactacat 6960 caataatgag ctgataccgt ctatgaacca actatcttgt gatttaatcg gccagaagct 7020 cgggctcaaa ttgctcagat actatacaga aatcctgtca ttatttggcc ccagtttacg 7080 ggaccccata tctgcggaga tatctatcca ggctttgagc tatgcgcttg gaggagacat 7140 caataaggtg ttagaaaagc tcggatacag tggaggtgat ttactgggca tcttagagag 7200 cggaggaata aaggcccgga taactcacgt cgacacagag tcctacttca ttgtcctcag 7260 tatagcctat ccgacgctgt ccgagattaa gggggtgatt gtccaccggc tagagggggt 7320 ctcgtacaac ataggctctc aagagtggta taccactgtg cccaagtatg ttgcaaccca 7380 agggtacctt atctcgaatt ttgatgagtc atcgtgtact ttcatgccag aggggactgt 7440 gtgcagccaa aatgccttgt acccgatgag tcctctgctc caagaatgcc tccgggggta 7500 caccaagtcc tgtgctcgta cactcgtatc cgggtctttt gggaaccggt tcattttatc 7560 acaagggaac ctaatagcca attgtgcatc aatcctttgc aagtgttaca caacaggaac 7620 gatcattaat caagaccctg acaagatcct aacatacatt gctgccgatc actgcccggt 7680 agtcgaggtg aacggcgtga ccatccaagt cgggagcagg aggtatccag acgctgtgta 7740 cttgcacaga attgacctcg gtcctcccat atcattggag aggttggacg tagggacaaa 7800 tctggggaat gcaattgcta agttggagga tgccaaggaa ttgttggagt catcggacca 7860 gatattgagg agtatgaaag gtttatcgag cactagcata gtctacatcc tgattgcagt 7920 gtgtcttgga gggttgatag ggatccccgc tttaatatgt tgctgcaggg ggcgttgtaa 7980 caaaaaggga gaacaagttg gtatgtcaag accaggccta aagcctgatc ttacgggaac 8040 atcaaaatcc tatgtaaggt cgctctgatc ctctacaact cttgaaacac aaatgtccca 8100 caagtctcct cttcgtcatc aagcaaccac cgcacccagc atcaagccca cctgaaatta 8160 tctccggctt ccctctggcc gaacaatatc ggtagttaat caaaacttag ggtgcaagat 8220 catccacaat gtcaccacaa cgagaccgga taaatgcctt ctacaaagat aacccccatc 8280 ccaagggaag taggatagtc attaacagag aacatcttat gattgataga ccttatgttt 8340 tgctggctgt tctgtttgtc atgtttctga gcttgatcgg gttgctagcc attgcaggca 8400 ttagacttca tcgggcagcc atctacaccg cagagatcca taaaagcctc agcaccaatc 8460 tagatgtaac taactcaatc gagcatcagg tcaaggacgt gctgacacca ctcttcaaaa 8520 tcatcggtga tgaagtgggc ctgaggacac ctcagagatt cactgaccta gtgaaattaa 8580 tctctgacaa gattaaattc cttaatccgg atagggagta cgacttcaga gatctcactt 8640 ggtgtatcaa cccgccagag agaatcaaat tggattatga tcaatactgt gcagatgtgg 8700 ctgctgaaga gctcatgaat gcattggtga actcaactct actggagacc agaacaacca 8760 atcagttcct agctgtctca aagggaaact gctcagggcc cactacaatc agaggtcaat 8820 tctcaaacat gtcgctgtcc ctgttagact tgtatttagg tcgaggttac aatgtgtcat 8880 ctatagtcac tatgacatcc cagggaatgt atgggggaac ttacctagtg gaaaagccta 8940 atctgagcag caaaaggtca gagttgtcac aactgagcat gtaccgagtg tttgaagtag 9000 gtgttatcag aaatccgggt ttgggggctc cggtgttcca tatgacaaac tatcttgagc 9060 aaccagtcag taatgatctc agcaactgta tggtggcttt gggggagctc aaactcgcag 9120 ccctttgtca cggggaagat tctatcacaa ttccctatca gggatcaggg aaaggtgtca 9180 gcttccagct cgtcaagcta ggtgtctgga aatccccaac cgacatgcaa tcctgggtcc 9240 ccttatcaac ggatgatcca gtgatagaca ggctttacct ctcatctcac agaggtgtta 9300 tcgctgacaa tcaagcaaaa tgggctgtcc cgacaacacg aacagatgac aagttgcgaa 9360 tggagacatg cttccaacag gcgtgtaagg gtaaaatcca agcactctgc gagaatcccg 9420 agtgggcacc attgaaggat aacaggattc cttcatacgg ggtcttgtct gttgatctga 9480 gtctgacagt tgagcttaaa atcaaaattg cttcgggatt cgggccattg atcacacacg 9540 gttcagggat ggacctatac aaatccaacc acaacaatgt gtattggctg actatcccgc 9600 caatgaagaa cctagcctta ggtgtaatca acacattgga gtggataccg agattcaagg 9660 ttagtcccta cctcttcact gtcccaatta aggaagcagg cgaagactgc catgccccaa 9720 catacctacc tgcggaggtg gatggtgatg tcaaactcag ttccaatctg gtgattctac 9780 ctggtcaaga tctccaatat gttttggcaa cctacgatac ttccagggtt gaacatgctg 9840 tggtttatta cgtttacagc ccaagccgct cattttctta cttttatcct tttaggttgc 9900 ctataaaggg ggtccccatc gaattacaag tggaatgctt cacatgggac caaaaactct 9960 ggtgccgtca cttctgtgtg cttgcggact cagaatctgg tggacatatc actcactctg 10020 ggatggtggg catgggagtc agctgcacag tcacccggga agatggaacc aatcgcagat 10080 agggctgcta gtgaaccaat cacatgatgt cacccagaca tcaggcatac ccactagtgt 10140 gaaatagaca tcagaattaa gaaaaacgta gggtccaagt ggttccccgt tatggactcg 10200 ctatctgtca accagatctt ataccctgaa gttcacctag atagcccgat agttaccaat 10260 aagatagtag ccatcctgga gtatgctcga gtccctcacg cttacagcct ggaggaccct 10320 acactgtgtc agaacatcaa gcaccgccta aaaaacggat tttccaacca aatgattata 10380 aacaatgtgg aagttgggaa tgtcatcaag tccaagctta ggagttatcc ggcccactct 10440 catattccat atccaaattg taatcaggat ttatttaaca tagaagacaa agagtcaacg 10500 aggaagatcc gtgaactcct caaaaagggg aattcgctgt actccaaagt cagtgataag 10560 gttttccaat gcttaaggga cactaactca cggcttggcc taggctccga attgagggag 10620 gacatcaagg agaaagttat taacttggga gtttacatgc acagctccca gtggtttgag 10680 ccctttctgt tttggtttac agtcaagact gagatgaggt cagtgattaa atcacaaacc 10740 catacttgcc ataggaggag acacacacct gtattcttca ctggtagttc agttgagttg 10800 ctaatctctc gtgaccttgt tgctataatc agtaaagagt ctcaacatgt atattacctg 10860 acatttgaac tggttttgat gtattgtgat gtcatagagg ggaggttaat gacagagacc 10920 gctatgacta ttgatgctag gtatacagag cttctaggaa gagtcagata catgtggaaa 10980 ctgatagatg gtttcttccc tgcactcggg aatccaactt atcaaattgt agccatgctg 11040 gagcctcttt cacttgctta cctgcagctg agggatataa cagtagaact cagaggtgct 11100 ttccttaacc actgctttac tgaaatacat gatgttcttg accaaaacgg gttttctgat 11160 gaaggtactt atcatgagtt aactgaagct ctagattaca ttttcataac tgatgacata 11220 catctgacag gggagatttt ctcatttttc agaagtttcg gccaccccag acttgaagca 11280 gtaacggctg ctgaaaatgt taggaaatac atgaatcagc ctaaagtcat tgtgtatgag 11340 actctgatga aaggtcatgc catattttgt ggaatcataa tcaacggcta tcgtgacagg 11400 cacggaggca gttggccacc gctgaccctc cccctgcatg ctgcagacac aatccggaat 11460 gctcaagctt caggtgaagg gttaacacat gagcagtgcg ttgataactg gaaatctttt 11520 gctggagtga aatttggctg ctttatgcct cttagcctgg atagtgatct gacaatgtac 11580 ctaaaggaca aggcacttgc tgctctccaa agggaatggg attcagttta cccgaaagag 11640 ttcctgcgtt acgaccctcc caagggaacc gggtcacgga ggcttgtaga tgttttcctt 11700 aatgattcga gctttgaccc atatgatgtg ataatgtatg ttgtaagtgg agcttacctc 11760 catgaccctg agttcaacct gtcttacagc ctgaaagaaa aggagatcaa ggaaacaggt 11820 agactttttg ctaaaatgac ttacaaaatg agggcatgcc aagtgattgc tgaaaatcta 11880 atctcaaacg ggattggcaa atattttaag gacaatggga tggccaagga tgagcacgat 11940 ttgactaagg cactccacac tctagctgtc tcaggagtcc ccaaagatct caaagaaagt 12000 cacagggggg ggccagtctt aaaaacctac tcccgaagcc cagtccacac aagtaccagg 12060 aacgtgagag cagcaaaagg gtttataggg ttccctcaag taattcggca ggaccaagac 12120 actgatcatc cggagaatat ggaagcttac gagacagtca gtgcatttat cacgactgat 12180 ctcaagaagt actgccttaa ttggagatat gagaccatca gcttgtttgc acagaggcta 12240 aatgagattt acggattgcc ctcatttttc cagtggctgc ataagaggct tgagacctct 12300 gtcctgtatg taagtgaccc tcattgcccc cccgaccttg acgcccatat cccgttatat 12360 aaagtcccca atgatcaaat cttcattaag taccctatgg gaggtataga agggtattgt 12420 cagaagctgt ggaccatcag caccattccc tatctatacc tggctgctta tgagagcgga 12480 gtaaggattg cttcgttagt gcaaggggac aatcagacca tagccgtaac aaaaagggta 12540 cccagcacat ggccctacaa ccttaagaaa cgggaagctg ctagagtaac tagagattac 12600 tttgtaattc ttaggcaaag gctacatgat attggccatc acctcaaggc aaatgagaca 12660 attgtttcat cacatttttt tgtctattca aaaggaatat attatgatgg gctacttgtg 12720 tcccaatcac tcaagagcat cgcaagatgt gtattctggt cagagactat agttgatgaa 12780 acaagggcag catgcagtaa tattgctaca acaatggcta aaagcatcga gagaggttat 12840 gaccgttacc ttgcatattc cctgaacgtc ctaaaagtga tacagcaaat tctgatctct 12900 cttggcttca caatcaattc aaccatgacc cgggatgtag tcatacccct cctcacaaac 12960 aacgacctct taataaggat ggcactgttg cccgctccta ttggggggat gaattatctg 13020 aatatgagca ggctgtttgt cagaaacatc ggtgatccag taacatcatc aattgctgat 13080 ctcaagagaa tgattctcgc ctcactaatg cctgaagaga ccctccatca agtaatgaca 13140 caacaaccgg gggactcttc attcctagac tgggctagcg acccttactc agcaaatctt 13200 gtatgtgtcc agagcatcac tagactcctc aagaacataa ctgcaaggtt tgtcctgatc 13260 catagtccaa acccaatgtt aaaaggatta ttccatgatg acagtaaaga agaggacgag 13320 ggactggcgg cattcctcat ggacaggcat attatagtac ctagggcagc tcatgaaatc 13380 ctggatcata gtgtcacagg ggcaagagag tctattgcag gcatgctgga taccacaaaa 13440 ggcttgattc gagccagcat gaggaagggg gggttaacct ctcgagtgat aaccagattg 13500 tccaattatg actatgaaca attcagagca gggatggtgc tattgacagg aagaaagaga 13560 aatgtcctca ttgacaaaga gtcatgttca gtgcagctgg cgagagctct aagaagccat 13620 atgtgggcga ggctagctcg aggacggcct atttacggcc ttgaggtccc tgatgtacta 13680 gaatctatgc gaggccacct tattcggcgt catgagacat gtgtcatctg cgagtgtgga 13740 tcagtcaact acggatggtt ttttgtcccc tcgggttgcc aactggatga tattgacaag 13800 gaaacatcat ccttgagagt cccatatatt ggttctacca ctgatgagag aacagacatg 13860 aagcttgcct tcgtaagagc cccaagtcga tccttgcgat ctgctgttag aatagcaaca 13920 gtgtactcat gggcttacgg tgatgatgat agctcttgga acgaagcctg gttgttggct 13980 aggcaaaggg ccaatgtgag cctggaggag ctaagggtga tcactcccat ctcaacttcg 14040 actaatttag cgcataggtt gagggatcgt agcactcaag tgaaatactc aggtacatcc 14100 cttgtccgag tggcgaggta taccacaatc tccaacgaca atctctcatt tgtcatatca 14160 gataagaagg ttgatactaa ctttatatac caacaaggaa tgcttctagg gttgggtgtt 14220 ttagaaacat tgtttcgact cgagaaagat accggatcat ctaacacggt attacatctt 14280 cacgtcgaaa cagattgttg cgtgatcccg atgatagatc atcccaggat acccagctcc 14340 cgcaagctag agctgagggc agagctatgt accaacccat tgatatatga taatgcacct 14400 ttaattgaca gagatgcaac aaggctatac acccagagcc ataggaggca ccttgtggaa 14460 tttgttacat ggtccacacc ccaactatat cacattttag ctaagtccac agcactatct 14520 atgattgacc tggtaacaaa atttgagaag gaccatatga atgaaatttc agctctcata 14580 ggggatgacg atatcaatag tttcataact gagtttctgc tcatagagcc aagattattc 14640 actatctact tgggccagtg tgcggccatc aattgggcat ttgatgtaca ttatcataga 14700 ccatcaggga aatatcagat gggtgagctg ttgtcatcgt tcctttctag aatgagcaaa 14760 ggagtgttta aggtgcttgt caatgctcta agccacccaa agatctacaa gaaattctgg 14820 cattgtggta ttatagagcc tatccatggt ccttcacttg atgctcaaaa cttgcacaca 14880 actgtgtgca acatggttta cacatgctat atgacctacc tcgacctgtt gttgaatgaa 14940 gagttagaag agttcacatt tctcttgtgt gaaagcgacg aggatgtagt accggacaga 15000 ttcgacaaca tccaggcaaa acacttatgt gttctggcag atttgtactg tcaaccaggg 15060 acctgcccac caattcgagg tctaagaccg gtagagaaat gtgcagttct aaccgaccat 15120 atcaaggcag aggctatgtt atctccagca ggatcttcgt ggaacataaa tccaattatt 15180 gtagaccatt actcatgctc tctgacttat ctccggcgag gatcgatcaa acagataaga 15240 ttgagagttg atccaggatt cattttcgac gccctcgctg aggtaaatgt cagtcagcca 15300 aagatcggca gcaacaacat ctcaaatatg agcatcaagg ctttcagacc cccacacgat 15360 gatgttgcaa aattgctcaa agatatcaac acaagcaagc acaatcttcc catttcaggg 15420 ggcaatctcg ccaattatga aatccatgct ttccgcagaa tcgggttgaa ctcatctgct 15480 tgctacaaag ctgttgagat atcaacatta attaggagat gccttgagcc aggggaggac 15540 ggcttgttct tgggtgaggg atcgggttct atgttgatca cttataaaga gatacttaaa 15600 ctaaacaagt gcttctataa tagtggggtt tccgccaatt ctagatctgg tcaaagggaa 15660 ttagcaccct atccctccga agttggcctt gtcgaacaca gaatgggagt aggtaatatt 15720 gtcaaagtgc tctttaacgg gaggcccgaa gtcacgtggg taggcagtgt agattgcttc 15780 aatttcatag ttagtaatat ccctacctct agtgtggggt ttatccattc agatatagag 15840 accttgcctg acaaagatac tatagagaag ctagaggaat tggcagccat cttatcgatg 15900 gctctgctcc tgggcaaaat aggatcaata ctggtgatta agcttatgcc tttcagcggg 15960 gattttgttc agggatttat aagttatgta gggtctcatt atagagaagt gaaccttgta 16020 taccctagat acagcaactt catctctact gaatcttatt tggttatgac agatctcaag 16080 gctaaccggc taatgaatcc tgaaaagatt aagcagcaga taattgaatc atctgtgagg 16140 acttcacctg gacttatagg tcacatccta tccattaagc aactaagctg catacaagca 16200 attgtgggag acgcagttag tagaggtgat atcaatccta ctctgaaaaa acttacacct 16260 atagagcagg tgctgatcaa ttgcgggttg gcaattaacg gacctaagct gtgcaaagaa 16320 ttgatccacc atgatgttgc ctcagggcaa gatggattgc ttaattctat actcatcctc 16380 tacagggagt tggcaagatt caaagacaac caaagaagtc aacaagggat gttccacgct 16440 taccccgtat tggtaagtag caggcaacga gaacttatat ctaggatcac ccgcaaattc 16500 tgggggcaca ttcttcttta ctccgggaac aaaaagttga taaataagtt tatccagaat 16560 ctcaagtccg gctatctgat actagactta caccagaata tcttcgttaa gaatctatcc 16620 aagtcagaga aacagattat tatgacgggg ggtttgaaac gtgagtgggt ttttaaggta 16680 acagtcaagg agaccaaaga atggtataag ttagtcggat acagtgccct gattaaggac 16740 taattggttg aactccggaa ccctaatcct gccctaggtg gttaggcatt atttgcaata 16800 tattaaagaa aactttgaaa atacgaagtt tctattccca gctttgtctg gtggccggca 16860 tggtcccagc ctcctcgctg gcgccggctg ggcaacattc cgaggggacc gtcccctcgg 16920 taatggcgaa tgggacgcgg ccgatccggc tgctaacaaa gcccgaaagg aagctgagtt 16980 ggctgctgcc accgctgagc aataactagc ataacccctt ggggcctcta aacgggtctt 17040 gaggggtttt ttgctgaaag gaggaactat atccggatgc ggccgccatg aacaataaaa 17100 ctgtctgctt acataaacag taatacaagg ggtgttatga gccatattca acgggaaacg 17160 tcgaggccgc gattaaattc caacatggat gctgatttat atgggtataa atgggctcgc 17220 gataatgtcg ggcaatcagg tgcgacaatc tatcgcttgt atgggaagcc cgatgcgcca 17280 gagttgtttc tgaaacatgg caaaggtagc gttgccaatg atgttacaga tgagatggtc 17340 agactaaact ggctgacgga atttatgcct cttccgacca tcaagcattt tatccgtact 17400 cctgatgatg catggttact caccactgcg atccccggaa aaacagcatt ccaggtatta 17460 gaagaatatc ctgattcagg tgaaaatatt gttgatgcgc tggcagtgtt cctgcgccgg 17520 ttgcattcga ttcctgtttg taattgtcct tttaacagcg atcgtgtatt tcgtctcgct 17580 caggcgcaat cacgaatgaa taacggtttg gttgatgcga gtgattttga tgacgagcgt 17640 aatggctggc ctgttgaaca agtctggaaa gaaatgcata aacttttgcc attctcaccg 17700 gattcagtcg tcactcatgg tgatttctca cttgataacc ttatttttga cgaggggaaa 17760 ttaataggtt gtattgatgt tggacgagtc ggaatcgcag accgatacca ggatcttgcc 17820 atcctatgga actgcctcgg tgagttttct ccttcattac agaaacggct ttttcaaaaa 17880 tatggtattg ataatcctga tatgaataaa ttgcagtttc atttgatgct cgatgagttt 17940 ttctaatcag aattggttaa ttggttgtaa cattattcag attgggcccc gttccactga 18000 gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 18060 atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 18120 gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 18180 gttcttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 18240 tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 18300 accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 18360 ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 18420 cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 18480 agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 18540 ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 18600 tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 18660 ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac 18720 cgtattaccg ctag 18734 <210> 32 <211> 18686 <212> DNA <213> Artificial sequence <220> <223> pKP-MVSchw-ATU2(eGFP) <400> 32 gcgatcgcta atacgactca ctatagggcc aactttgttt ggtctgatga gtccgtgagg 60 acgaaacccg gagtcccggg tcaccaaaca aagttgggta aggatagttc aatcaatgat 120 catcttctag tgcacttagg attcaagatc ctattatcag ggacaagagc aggattaggg 180 atatccgaga tggccacact tttaaggagc ttagcattgt tcaaaagaaa caaggacaaa 240 ccacccatta catcaggatc cggtggagcc atcagaggaa tcaaacacat tattatagta 300 ccaatccctg gagattcctc aattaccact cgatccagac ttctggaccg gttggtgagg 360 ttaattggaa acccggatgt gagcgggccc aaactaacag gggcactaat aggtatatta 420 tccttatttg tggagtctcc aggtcaattg attcagagga tcaccgatga ccctgacgtt 480 agcataaggc tgttagaggt tgtccagagt gaccagtcac aatctggcct taccttcgca 540 tcaagaggta ccaacatgga ggatgaggcg gaccaatact tttcacatga tgatccaatt 600 agtagtgatc aatccaggtt cggatggttc gggaacaagg aaatctcaga tattgaagtg 660 caagaccctg agggattcaa catgattctg ggtaccatcc tagcccaaat ttgggtcttg 720 ctcgcaaagg cggttacggc cccagacacg gcagctgatt cggagctaag aaggtggata 780 aagtacaccc aacaaagaag ggtagttggt gaatttagat tggagagaaa atggttggat 840 gtggtgagga acaggattgc cgaggacctc tccttacgcc gattcatggt cgctctaatc 900 ctggatatca agagaacacc cggaaacaaa cccaggattg ctgaaatgat atgtgacatt 960 gatacatata tcgtagaggc aggattagcc agttttatcc tgactattaa gtttgggata 1020 gaaactatgt atcctgctct tggactgcat gaatttgctg gtgagttatc cacacttgag 1080 tccttgatga acctttacca gcaaatgggg gaaactgcac cctacatggt aatcctggag 1140 aactcaattc agaacaagtt cagtgcagga tcataccctc tgctctggag ctatgccatg 1200 ggagtaggag tggaacttga aaactccatg ggaggtttga actttggccg atcttacttt 1260 gatccagcat attttagatt agggcaagag atggtaagga ggtcagctgg aaaggtcagt 1320 tccacattgg catctgaact cggtatcact gccgaggatg caaggcttgt ttcagagatt 1380 gcaatgcata ctactgagga caagatcagt agagcggttg gacccagaca agcccaagta 1440 tcatttctac acggtgatca aagtgagaat gagctaccga gattgggggg caaggaagat 1500 aggagggtca aacagagtcg aggagaagcc agggagagct acagagaaac cgggcccagc 1560 agagcaagtg atgcgagagc tgcccatctt ccaaccggca cacccctaga cattgacact 1620 gcaacggagt ccagccaaga tccgcaggac agtcgaaggt cagctgacgc cctgcttagg 1680 ctgcaagcca tggcaggaat ctcggaagaa caaggctcag acacggacac ccctatagtg 1740 tacaatgaca gaaatcttct agactaggtg cgagaggccg agggccagaa caacatccgc 1800 ctaccatcca tcattgttat aaaaaactta ggaaccaggt ccacacagcc gccagcccat 1860 caaccatcca ctcccacgat tggagccaat ggcagaagag caggcacgcc atgtcaaaaa 1920 cggactggaa tgcatccggg ctctcaaggc cgagcccatc ggctcactgg ccatcgagga 1980 agctatggca gcatggtcag aaatatcaga caacccagga caggagcgag ccacctgcag 2040 ggaagagaag gcaggcagtt cgggtctcag caaaccatgc ctctcagcaa ttggatcaac 2100 tgaaggcggt gcacctcgca tccgcggtca gggacctgga gagagcgatg acgacgctga 2160 aactttggga atccccccaa gaaatctcca ggcatcaagc actgggttac agtgttatta 2220 cgtttatgat cacagcggtg aagcggttaa gggaatccaa gatgctgact ctatcatggt 2280 tcaatcaggc cttgatggtg atagcaccct ctcaggagga gacaatgaat ctgaaaacag 2340 cgatgtggat attggcgaac ctgataccga gggatatgct atcactgacc ggggatctgc 2400 tcccatctct atggggttca gggcttctga tgttgaaact gcagaaggag gggagatcca 2460 cgagctcctg agactccaat ccagaggcaa caactttccg aagcttggga aaactctcaa 2520 tgttcctccg cccccggacc ccggtagggc cagcacttcc gggacaccca ttaaaaaggg 2580 cacagacgcg agattagcct catttggaac ggagatcgcg tctttattga caggtggtgc 2640 aacccaatgt gctcgaaagt caccctcgga accatcaggg ccaggtgcac ctgcggggaa 2700 tgtccccgag tgtgtgagca atgccgcact gatacaggag tggacacccg aatctggtac 2760 cacaatctcc ccgagatccc agaataatga agaaggggga gactattatg atgatgagct 2820 gttctctgat gtccaagata ttaaaacagc cttggccaaa atacacgagg ataatcagaa 2880 gataatctcc aagctagaat cactgctgtt attgaaggga gaagttgagt caattaagaa 2940 gcagatcaac aggcaaaata tcagcatatc caccctggaa ggacacctct caagcatcat 3000 gatcgccatt cctggacttg ggaaggatcc caacgacccc actgcagatg tcgaaatcaa 3060 tcccgacttg aaacccatca taggcagaga ttcaggccga gcactggccg aagttctcaa 3120 gaaacccgtt gccagccgac aactccaagg aatgacaaat ggacggacca gttccagagg 3180 acagctgctg aaggaatttc agctaaagcc gatcgggaaa aagatgagct cagccgtcgg 3240 gtttgttcct gacaccggcc ctgcatcacg cagtgtaatc cgctccatta taaaatccag 3300 ccggctagag gaggatcgga agcgttacct gatgactctc cttgatgata tcaaaggagc 3360 caatgatctt gccaagttcc accagatgct gatgaagata ataatgaagt agctacagct 3420 caacttacct gccaacccca tgccagtcga cccaactagc ctaccctcca tcattgttat 3480 aaaaaactta ggaaccaggt ccacacagcc gccagcccat caacgcgtac gatggtgagc 3540 aagggcgagg agctgttcac cggggtggtg cccatcctgg tcgagctgga cggcgacgta 3600 aacggccaca agttcagcgt gtccggcgag ggcgagggcg atgccaccta cggcaagctg 3660 accctgaagt tcatctgcac caccggcaag ctgcccgtgc cctggcccac cctcgtgacc 3720 accctgacct acggcgtgca gtgcttcagc cgctaccccg accacatgaa gcagcacgac 3780 ttcttcaagt ccgccatgcc cgaaggctac gtccaggagc gcaccatctt cttcaaggac 3840 gacggcaact acaagacccg cgccgaggtg aagttcgagg gcgacaccct ggtgaaccgc 3900 atcgagctga agggcatcga cttcaaggag gacggcaaca tcctggggca caagctggag 3960 tacaactaca acagccacaa cgtctatatc atggccgaca agcagaagaa cggcatcaag 4020 gtgaacttca agatccgcca caacatcgag gacggcagcg tgcagctcgc cgaccactac 4080 cagcagaaca cccccatcgg cgacggcccc gtgctgctgc ccgacaacca ctacctgagc 4140 acccagtccg ccctgagcaa agaccccaac gagaagcgcg atcacatggt cctgctggag 4200 ttcgtgaccg ccgccgggat cactctcggc atggacgagc tgtacaagta ggcgcgcagc 4260 gcttagacgt ctcgcgatcg atactagtac aacctaaatc cattataaaa aacttaggag 4320 caaagtgatt gcctcccaag gtccacaatg acagagacct acgacttcga caagtcggca 4380 tgggacatca aagggtcgat cgctccgata caacccacca cctacagtga tggcaggctg 4440 gtgccccagg tcagagtcat agatcctggt ctaggcgaca ggaaggatga atgctttatg 4500 tacatgtttc tgctgggggt tgttgaggac agcgattccc tagggcctcc aatcgggcga 4560 gcatttgggt tcctgccctt aggtgttggc agatccacag caaagcccga aaaactcctc 4620 aaagaggcca ctgagcttga catagttgtt agacgtacag cagggctcaa tgaaaaactg 4680 gtgttctaca acaacacccc actaactctc ctcacacctt ggagaaaggt cctaacaaca 4740 gggagtgtct tcaacgcaaa ccaagtgtgc aatgcggtta atctgatacc gctcgatacc 4800 ccgcagaggt tccgtgttgt ttatatgagc atcacccgtc tttcggataa cgggtattac 4860 accgttccta gaagaatgct ggaattcaga tcggtcaatg cagtggcctt caacctgctg 4920 gtgaccctta ggattgacaa ggcgataggc cctgggaaga tcatcgacaa tacagagcaa 4980 cttcctgagg caacatttat ggtccacatc gggaacttca ggagaaagaa gagtgaagtc 5040 tactctgccg attattgcaa aatgaaaatc gaaaagatgg gcctggtttt tgcacttggt 5100 gggatagggg gcaccagtct tcacattaga agcacaggca aaatgagcaa gactctccat 5160 gcacaactcg ggttcaagaa gaccttatgt tacccgctga tggatatcaa tgaagacctt 5220 aatcgattac tctggaggag cagatgcaag atagtaagaa tccaggcagt tttgcagcca 5280 tcagttcctc aagaattccg catttacgac gacgtgatca taaatgatga ccaaggacta 5340 ttcaaagttc tgtagaccgt agtgcccagc aatgcccgaa aacgaccccc ctcacaatga 5400 cagccagaag gcccggacaa aaaagccccc tccgaaagac tccacggacc aagcgagagg 5460 ccagccagca gccgacggca agcgcgaaca ccaggcggcc ccagcacaga acagccctga 5520 cacaaggcca ccaccagcca ccccaatctg catcctcctc gtgggacccc cgaggaccaa 5580 cccccaaggc tgcccccgat ccaaaccacc aaccgcatcc ccaccacccc cgggaaagaa 5640 acccccagca attggaaggc ccctccccct cttcctcaac acaagaactc cacaaccgaa 5700 ccgcacaagc gaccgaggtg acccaaccgc aggcatccga ctccctagac agatcctctc 5760 tccccggcaa actaaacaaa acttagggcc aaggaacata cacacccaac agaacccaga 5820 ccccggccca cggcgccgcg cccccaaccc ccgacaacca gagggagccc ccaaccaatc 5880 ccgccggctc ccccggtgcc cacaggcagg gacaccaacc cccgaacaga cccagcaccc 5940 aaccatcgac aatccaagac gggggggccc ccccaaaaaa aggcccccag gggccgacag 6000 ccagcaccgc gaggaagccc acccacccca cacacgacca cggcaaccaa accagaaccc 6060 agaccaccct gggccaccag ctcccagact cggccatcac cccgcagaaa ggaaaggcca 6120 caacccgcgc accccagccc cgatccggcg gggagccacc caacccgaac cagcacccaa 6180 gagcgatccc cgaaggaccc ccgaaccgca aaggacatca gtatcccaca gcctctccaa 6240 gtcccccggt ctcctcctct tctcgaaggg accaaaagat caatccacca cacccgacga 6300 cactcaactc cccaccccta aaggagacac cgggaatccc agaatcaaga ctcatccaat 6360 gtccatcatg ggtctcaagg tgaacgtctc tgccatattc atggcagtac tgttaactct 6420 ccaaacaccc accggtcaaa tccattgggg caatctctct aagatagggg tggtaggaat 6480 aggaagtgca agctacaaag ttatgactcg ttccagccat caatcattag tcataaaatt 6540 aatgcccaat ataactctcc tcaataactg cacgagggta gagattgcag aatacaggag 6600 actactgaga acagttttgg aaccaattag agatgcactt aatgcaatga cccagaatat 6660 aagaccggtt cagagtgtag cttcaagtag gagacacaag agatttgcgg gagtagtcct 6720 ggcaggtgcg gccctaggcg ttgccacagc tgctcagata acagccggca ttgcacttca 6780 ccagtccatg ctgaactctc aagccatcga caatctgaga gcgagcctgg aaactactaa 6840 tcaggcaatt gagacaatca gacaagcagg gcaggagatg atattggctg ttcagggtgt 6900 ccaagactac atcaataatg agctgatacc gtctatgaac caactatctt gtgatttaat 6960 cggccagaag ctcgggctca aattgctcag atactataca gaaatcctgt cattatttgg 7020 ccccagttta cgggacccca tatctgcgga gatatctatc caggctttga gctatgcgct 7080 tggaggagac atcaataagg tgttagaaaa gctcggatac agtggaggtg atttactggg 7140 catcttagag agcggaggaa taaaggcccg gataactcac gtcgacacag agtcctactt 7200 cattgtcctc agtatagcct atccgacgct gtccgagatt aagggggtga ttgtccaccg 7260 gctagagggg gtctcgtaca acataggctc tcaagagtgg tataccactg tgcccaagta 7320 tgttgcaacc caagggtacc ttatctcgaa ttttgatgag tcatcgtgta ctttcatgcc 7380 agaggggact gtgtgcagcc aaaatgcctt gtacccgatg agtcctctgc tccaagaatg 7440 cctccggggg tacaccaagt cctgtgctcg tacactcgta tccgggtctt ttgggaaccg 7500 gttcatttta tcacaaggga acctaatagc caattgtgca tcaatccttt gcaagtgtta 7560 cacaacagga acgatcatta atcaagaccc tgacaagatc ctaacataca ttgctgccga 7620 tcactgcccg gtagtcgagg tgaacggcgt gaccatccaa gtcgggagca ggaggtatcc 7680 agacgctgtg tacttgcaca gaattgacct cggtcctccc atatcattgg agaggttgga 7740 cgtagggaca aatctgggga atgcaattgc taagttggag gatgccaagg aattgttgga 7800 gtcatcggac cagatattga ggagtatgaa aggtttatcg agcactagca tagtctacat 7860 cctgattgca gtgtgtcttg gagggttgat agggatcccc gctttaatat gttgctgcag 7920 ggggcgttgt aacaaaaagg gagaacaagt tggtatgtca agaccaggcc taaagcctga 7980 tcttacggga acatcaaaat cctatgtaag gtcgctctga tcctctacaa ctcttgaaac 8040 acaaatgtcc cacaagtctc ctcttcgtca tcaagcaacc accgcaccca gcatcaagcc 8100 cacctgaaat tatctccggc ttccctctgg ccgaacaata tcggtagtta atcaaaactt 8160 agggtgcaag atcatccaca atgtcaccac aacgagaccg gataaatgcc ttctacaaag 8220 ataaccccca tcccaaggga agtaggatag tcattaacag agaacatctt atgattgata 8280 gaccttatgt tttgctggct gttctgtttg tcatgtttct gagcttgatc gggttgctag 8340 ccattgcagg cattagactt catcgggcag ccatctacac cgcagagatc cataaaagcc 8400 tcagcaccaa tctagatgta actaactcaa tcgagcatca ggtcaaggac gtgctgacac 8460 cactcttcaa aatcatcggt gatgaagtgg gcctgaggac acctcagaga ttcactgacc 8520 tagtgaaatt aatctctgac aagattaaat tccttaatcc ggatagggag tacgacttca 8580 gagatctcac ttggtgtatc aacccgccag agagaatcaa attggattat gatcaatact 8640 gtgcagatgt ggctgctgaa gagctcatga atgcattggt gaactcaact ctactggaga 8700 ccagaacaac caatcagttc ctagctgtct caaagggaaa ctgctcaggg cccactacaa 8760 tcagaggtca attctcaaac atgtcgctgt ccctgttaga cttgtattta ggtcgaggtt 8820 acaatgtgtc atctatagtc actatgacat cccagggaat gtatggggga acttacctag 8880 tggaaaagcc taatctgagc agcaaaaggt cagagttgtc acaactgagc atgtaccgag 8940 tgtttgaagt aggtgttatc agaaatccgg gtttgggggc tccggtgttc catatgacaa 9000 actatcttga gcaaccagtc agtaatgatc tcagcaactg tatggtggct ttgggggagc 9060 tcaaactcgc agccctttgt cacggggaag attctatcac aattccctat cagggatcag 9120 ggaaaggtgt cagcttccag ctcgtcaagc taggtgtctg gaaatcccca accgacatgc 9180 aatcctgggt ccccttatca acggatgatc cagtgataga caggctttac ctctcatctc 9240 acagaggtgt tatcgctgac aatcaagcaa aatgggctgt cccgacaaca cgaacagatg 9300 acaagttgcg aatggagaca tgcttccaac aggcgtgtaa gggtaaaatc caagcactct 9360 gcgagaatcc cgagtgggca ccattgaagg ataacaggat tccttcatac ggggtcttgt 9420 ctgttgatct gagtctgaca gttgagctta aaatcaaaat tgcttcggga ttcgggccat 9480 tgatcacaca cggttcaggg atggacctat acaaatccaa ccacaacaat gtgtattggc 9540 tgactatccc gccaatgaag aacctagcct taggtgtaat caacacattg gagtggatac 9600 cgagattcaa ggttagtccc tacctcttca ctgtcccaat taaggaagca ggcgaagact 9660 gccatgcccc aacataccta cctgcggagg tggatggtga tgtcaaactc agttccaatc 9720 tggtgattct acctggtcaa gatctccaat atgttttggc aacctacgat acttccaggg 9780 ttgaacatgc tgtggtttat tacgtttaca gcccaagccg ctcattttct tacttttatc 9840 cttttaggtt gcctataaag ggggtcccca tcgaattaca agtggaatgc ttcacatggg 9900 accaaaaact ctggtgccgt cacttctgtg tgcttgcgga ctcagaatct ggtggacata 9960 tcactcactc tgggatggtg ggcatgggag tcagctgcac agtcacccgg gaagatggaa 10020 ccaatcgcag atagggctgc tagtgaacca atcacatgat gtcacccaga catcaggcat 10080 acccactagt gtgaaataga catcagaatt aagaaaaacg tagggtccaa gtggttcccc 10140 gttatggact cgctatctgt caaccagatc ttataccctg aagttcacct agatagcccg 10200 atagttacca ataagatagt agccatcctg gagtatgctc gagtccctca cgcttacagc 10260 ctggaggacc ctacactgtg tcagaacatc aagcaccgcc taaaaaacgg attttccaac 10320 caaatgatta taaacaatgt ggaagttggg aatgtcatca agtccaagct taggagttat 10380 ccggcccact ctcatattcc atatccaaat tgtaatcagg atttatttaa catagaagac 10440 aaagagtcaa cgaggaagat ccgtgaactc ctcaaaaagg ggaattcgct gtactccaaa 10500 gtcagtgata aggttttcca atgcttaagg gacactaact cacggcttgg cctaggctcc 10560 gaattgaggg aggacatcaa ggagaaagtt attaacttgg gagtttacat gcacagctcc 10620 cagtggtttg agccctttct gttttggttt acagtcaaga ctgagatgag gtcagtgatt 10680 aaatcacaaa cccatacttg ccataggagg agacacacac ctgtattctt cactggtagt 10740 tcagttgagt tgctaatctc tcgtgacctt gttgctataa tcagtaaaga gtctcaacat 10800 gtatattacc tgacatttga actggttttg atgtattgtg atgtcataga ggggaggtta 10860 atgacagaga ccgctatgac tattgatgct aggtatacag agcttctagg aagagtcaga 10920 tacatgtgga aactgataga tggtttcttc cctgcactcg ggaatccaac ttatcaaatt 10980 gtagccatgc tggagcctct ttcacttgct tacctgcagc tgagggatat aacagtagaa 11040 ctcagaggtg ctttccttaa ccactgcttt actgaaatac atgatgttct tgaccaaaac 11100 gggttttctg atgaaggtac ttatcatgag ttaactgaag ctctagatta cattttcata 11160 actgatgaca tacatctgac aggggagatt ttctcatttt tcagaagttt cggccacccc 11220 agacttgaag cagtaacggc tgctgaaaat gttaggaaat acatgaatca gcctaaagtc 11280 attgtgtatg agactctgat gaaaggtcat gccatatttt gtggaatcat aatcaacggc 11340 tatcgtgaca ggcacggagg cagttggcca ccgctgaccc tccccctgca tgctgcagac 11400 acaatccgga atgctcaagc ttcaggtgaa gggttaacac atgagcagtg cgttgataac 11460 tggaaatctt ttgctggagt gaaatttggc tgctttatgc ctcttagcct ggatagtgat 11520 ctgacaatgt acctaaagga caaggcactt gctgctctcc aaagggaatg ggattcagtt 11580 tacccgaaag agttcctgcg ttacgaccct cccaagggaa ccgggtcacg gaggcttgta 11640 gatgttttcc ttaatgattc gagctttgac ccatatgatg tgataatgta tgttgtaagt 11700 ggagcttacc tccatgaccc tgagttcaac ctgtcttaca gcctgaaaga aaaggagatc 11760 aaggaaacag gtagactttt tgctaaaatg acttacaaaa tgagggcatg ccaagtgatt 11820 gctgaaaatc taatctcaaa cgggattggc aaatatttta aggacaatgg gatggccaag 11880 gatgagcacg atttgactaa ggcactccac actctagctg tctcaggagt ccccaaagat 11940 ctcaaagaaa gtcacagggg ggggccagtc ttaaaaacct actcccgaag cccagtccac 12000 acaagtacca ggaacgtgag agcagcaaaa gggtttatag ggttccctca agtaattcgg 12060 caggaccaag acactgatca tccggagaat atggaagctt acgagacagt cagtgcattt 12120 atcacgactg atctcaagaa gtactgcctt aattggagat atgagaccat cagcttgttt 12180 gcacagaggc taaatgagat ttacggattg ccctcatttt tccagtggct gcataagagg 12240 cttgagacct ctgtcctgta tgtaagtgac cctcattgcc cccccgacct tgacgcccat 12300 atcccgttat ataaagtccc caatgatcaa atcttcatta agtaccctat gggaggtata 12360 gaagggtatt gtcagaagct gtggaccatc agcaccattc cctatctata cctggctgct 12420 tatgagagcg gagtaaggat tgcttcgtta gtgcaagggg acaatcagac catagccgta 12480 acaaaaaggg tacccagcac atggccctac aaccttaaga aacgggaagc tgctagagta 12540 actagagatt actttgtaat tcttaggcaa aggctacatg atattggcca tcacctcaag 12600 gcaaatgaga caattgtttc atcacatttt tttgtctatt caaaaggaat atattatgat 12660 gggctacttg tgtcccaatc actcaagagc atcgcaagat gtgtattctg gtcagagact 12720 atagttgatg aaacaagggc agcatgcagt aatattgcta caacaatggc taaaagcatc 12780 gagagaggtt atgaccgtta ccttgcatat tccctgaacg tcctaaaagt gatacagcaa 12840 attctgatct ctcttggctt cacaatcaat tcaaccatga cccgggatgt agtcataccc 12900 ctcctcacaa acaacgacct cttaataagg atggcactgt tgcccgctcc tattgggggg 12960 atgaattatc tgaatatgag caggctgttt gtcagaaaca tcggtgatcc agtaacatca 13020 tcaattgctg atctcaagag aatgattctc gcctcactaa tgcctgaaga gaccctccat 13080 caagtaatga cacaacaacc gggggactct tcattcctag actgggctag cgacccttac 13140 tcagcaaatc ttgtatgtgt ccagagcatc actagactcc tcaagaacat aactgcaagg 13200 tttgtcctga tccatagtcc aaacccaatg ttaaaaggat tattccatga tgacagtaaa 13260 gaagaggacg agggactggc ggcattcctc atggacaggc atattatagt acctagggca 13320 gctcatgaaa tcctggatca tagtgtcaca ggggcaagag agtctattgc aggcatgctg 13380 gataccacaa aaggcttgat tcgagccagc atgaggaagg gggggttaac ctctcgagtg 13440 ataaccagat tgtccaatta tgactatgaa caattcagag cagggatggt gctattgaca 13500 ggaagaaaga gaaatgtcct cattgacaaa gagtcatgtt cagtgcagct ggcgagagct 13560 ctaagaagcc atatgtgggc gaggctagct cgaggacggc ctatttacgg ccttgaggtc 13620 cctgatgtac tagaatctat gcgaggccac cttattcggc gtcatgagac atgtgtcatc 13680 tgcgagtgtg gatcagtcaa ctacggatgg ttttttgtcc cctcgggttg ccaactggat 13740 gatattgaca aggaaacatc atccttgaga gtcccatata ttggttctac cactgatgag 13800 agaacagaca tgaagcttgc cttcgtaaga gccccaagtc gatccttgcg atctgctgtt 13860 agaatagcaa cagtgtactc atgggcttac ggtgatgatg atagctcttg gaacgaagcc 13920 tggttgttgg ctaggcaaag ggccaatgtg agcctggagg agctaagggt gatcactccc 13980 atctcaactt cgactaattt agcgcatagg ttgagggatc gtagcactca agtgaaatac 14040 tcaggtacat cccttgtccg agtggcgagg tataccacaa tctccaacga caatctctca 14100 tttgtcatat cagataagaa ggttgatact aactttatat accaacaagg aatgcttcta 14160 gggttgggtg ttttagaaac attgtttcga ctcgagaaag ataccggatc atctaacacg 14220 gtattacatc ttcacgtcga aacagattgt tgcgtgatcc cgatgataga tcatcccagg 14280 atacccagct cccgcaagct agagctgagg gcagagctat gtaccaaccc attgatatat 14340 gataatgcac ctttaattga cagagatgca acaaggctat acacccagag ccataggagg 14400 caccttgtgg aatttgttac atggtccaca ccccaactat atcacatttt agctaagtcc 14460 acagcactat ctatgattga cctggtaaca aaatttgaga aggaccatat gaatgaaatt 14520 tcagctctca taggggatga cgatatcaat agtttcataa ctgagtttct gctcatagag 14580 ccaagattat tcactatcta cttgggccag tgtgcggcca tcaattgggc atttgatgta 14640 cattatcata gaccatcagg gaaatatcag atgggtgagc tgttgtcatc gttcctttct 14700 agaatgagca aaggagtgtt taaggtgctt gtcaatgctc taagccaccc aaagatctac 14760 aagaaattct ggcattgtgg tattatagag cctatccatg gtccttcact tgatgctcaa 14820 aacttgcaca caactgtgtg caacatggtt tacacatgct atatgaccta cctcgacctg 14880 ttgttgaatg aagagttaga agagttcaca tttctcttgt gtgaaagcga cgaggatgta 14940 gtaccggaca gattcgacaa catccaggca aaacacttat gtgttctggc agatttgtac 15000 tgtcaaccag ggacctgccc accaattcga ggtctaagac cggtagagaa atgtgcagtt 15060 ctaaccgacc atatcaaggc agaggctatg ttatctccag caggatcttc gtggaacata 15120 aatccaatta ttgtagacca ttactcatgc tctctgactt atctccggcg aggatcgatc 15180 aaacagataa gattgagagt tgatccagga ttcattttcg acgccctcgc tgaggtaaat 15240 gtcagtcagc caaagatcgg cagcaacaac atctcaaata tgagcatcaa ggctttcaga 15300 cccccacacg atgatgttgc aaaattgctc aaagatatca acacaagcaa gcacaatctt 15360 cccatttcag ggggcaatct cgccaattat gaaatccatg ctttccgcag aatcgggttg 15420 aactcatctg cttgctacaa agctgttgag atatcaacat taattaggag atgccttgag 15480 ccaggggagg acggcttgtt cttgggtgag ggatcgggtt ctatgttgat cacttataaa 15540 gagatactta aactaaacaa gtgcttctat aatagtgggg tttccgccaa ttctagatct 15600 ggtcaaaggg aattagcacc ctatccctcc gaagttggcc ttgtcgaaca cagaatggga 15660 gtaggtaata ttgtcaaagt gctctttaac gggaggcccg aagtcacgtg ggtaggcagt 15720 gtagattgct tcaatttcat agttagtaat atccctacct ctagtgtggg gtttatccat 15780 tcagatatag agaccttgcc tgacaaagat actatagaga agctagagga attggcagcc 15840 atcttatcga tggctctgct cctgggcaaa ataggatcaa tactggtgat taagcttatg 15900 cctttcagcg gggattttgt tcagggattt ataagttatg tagggtctca ttatagagaa 15960 gtgaaccttg tataccctag atacagcaac ttcatctcta ctgaatctta tttggttatg 16020 acagatctca aggctaaccg gctaatgaat cctgaaaaga ttaagcagca gataattgaa 16080 tcatctgtga ggacttcacc tggacttata ggtcacatcc tatccattaa gcaactaagc 16140 tgcatacaag caattgtggg agacgcagtt agtagaggtg atatcaatcc tactctgaaa 16200 aaacttacac ctatagagca ggtgctgatc aattgcgggt tggcaattaa cggacctaag 16260 ctgtgcaaag aattgatcca ccatgatgtt gcctcagggc aagatggatt gcttaattct 16320 atactcatcc tctacaggga gttggcaaga ttcaaagaca accaaagaag tcaacaaggg 16380 atgttccacg cttaccccgt attggtaagt agcaggcaac gagaacttat atctaggatc 16440 acccgcaaat tctgggggca cattcttctt tactccggga acaaaaagtt gataaataag 16500 tttatccaga atctcaagtc cggctatctg atactagact tacaccagaa tatcttcgtt 16560 aagaatctat ccaagtcaga gaaacagatt attatgacgg ggggtttgaa acgtgagtgg 16620 gtttttaagg taacagtcaa ggagaccaaa gaatggtata agttagtcgg atacagtgcc 16680 ctgattaagg actaattggt tgaactccgg aaccctaatc ctgccctagg tggttaggca 16740 ttatttgcaa tatattaaag aaaactttga aaatacgaag tttctattcc cagctttgtc 16800 tggtggccgg catggtccca gcctcctcgc tggcgccggc tgggcaacat tccgagggga 16860 ccgtcccctc ggtaatggcg aatgggacgc ggccgatccg gctgctaaca aagcccgaaa 16920 ggaagctgag ttggctgctg ccaccgctga gcaataacta gcataacccc ttggggcctc 16980 taaacgggtc ttgaggggtt ttttgctgaa aggaggaact atatccggat gcggccgcca 17040 tgaacaataa aactgtctgc ttacataaac agtaatacaa ggggtgttat gagccatatt 17100 caacgggaaa cgtcgaggcc gcgattaaat tccaacatgg atgctgattt atatgggtat 17160 aaatgggctc gcgataatgt cgggcaatca ggtgcgacaa tctatcgctt gtatgggaag 17220 cccgatgcgc cagagttgtt tctgaaacat ggcaaaggta gcgttgccaa tgatgttaca 17280 gatgagatgg tcagactaaa ctggctgacg gaatttatgc ctcttccgac catcaagcat 17340 tttatccgta ctcctgatga tgcatggtta ctcaccactg cgatccccgg aaaaacagca 17400 ttccaggtat tagaagaata tcctgattca ggtgaaaata ttgttgatgc gctggcagtg 17460 ttcctgcgcc ggttgcattc gattcctgtt tgtaattgtc cttttaacag cgatcgtgta 17520 tttcgtctcg ctcaggcgca atcacgaatg aataacggtt tggttgatgc gagtgatttt 17580 gatgacgagc gtaatggctg gcctgttgaa caagtctgga aagaaatgca taaacttttg 17640 ccattctcac cggattcagt cgtcactcat ggtgatttct cacttgataa ccttattttt 17700 gacgagggga aattaatagg ttgtattgat gttggacgag tcggaatcgc agaccgatac 17760 caggatcttg ccatcctatg gaactgcctc ggtgagtttt ctccttcatt acagaaacgg 17820 ctttttcaaa aatatggtat tgataatcct gatatgaata aattgcagtt tcatttgatg 17880 ctcgatgagt ttttctaatc agaattggtt aattggttgt aacattattc agattgggcc 17940 ccgttccact gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg agatcctttt 18000 tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt 18060 ttgccggatc aagagctacc aactcttttt ccgaaggtaa ctggcttcag cagagcgcag 18120 ataccaaata ctgttcttct agtgtagccg tagttaggcc accacttcaa gaactctgta 18180 gcaccgccta catacctcgc tctgctaatc ctgttaccag tggctgctgc cagtggcgat 18240 aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac cggataaggc gcagcggtcg 18300 ggctgaacgg ggggttcgtg cacacagccc agcttggagc gaacgaccta caccgaactg 18360 agatacctac agcgtgagct atgagaaagc gccacgcttc ccgaagggag aaaggcggac 18420 aggtatccgg taagcggcag ggtcggaaca ggagagcgca cgagggagct tccaggggga 18480 aacgcctggt atctttatag tcctgtcggg tttcgccacc tctgacttga gcgtcgattt 18540 ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc ggccttttta 18600 cggttcctgg ccttttgctg gccttttgct cacatgttct ttcctgcgtt atcccctgat 18660 tctgtggata accgtattac cgctag 18686 <210> 33 <211> 18686 <212> DNA <213> Artificial sequence <220> <223> pKP-MVSchw-ATU3(eGFP) <400> 33 gcgatcgcta atacgactca ctatagggcc aactttgttt ggtctgatga gtccgtgagg 60 acgaaacccg gagtcccggg tcaccaaaca aagttgggta aggatagttc aatcaatgat 120 catcttctag tgcacttagg attcaagatc ctattatcag ggacaagagc aggattaggg 180 atatccgaga tggccacact tttaaggagc ttagcattgt tcaaaagaaa caaggacaaa 240 ccacccatta catcaggatc cggtggagcc atcagaggaa tcaaacacat tattatagta 300 ccaatccctg gagattcctc aattaccact cgatccagac ttctggaccg gttggtgagg 360 ttaattggaa acccggatgt gagcgggccc aaactaacag gggcactaat aggtatatta 420 tccttatttg tggagtctcc aggtcaattg attcagagga tcaccgatga ccctgacgtt 480 agcataaggc tgttagaggt tgtccagagt gaccagtcac aatctggcct taccttcgca 540 tcaagaggta ccaacatgga ggatgaggcg gaccaatact tttcacatga tgatccaatt 600 agtagtgatc aatccaggtt cggatggttc gggaacaagg aaatctcaga tattgaagtg 660 caagaccctg agggattcaa catgattctg ggtaccatcc tagcccaaat ttgggtcttg 720 ctcgcaaagg cggttacggc cccagacacg gcagctgatt cggagctaag aaggtggata 780 aagtacaccc aacaaagaag ggtagttggt gaatttagat tggagagaaa atggttggat 840 gtggtgagga acaggattgc cgaggacctc tccttacgcc gattcatggt cgctctaatc 900 ctggatatca agagaacacc cggaaacaaa cccaggattg ctgaaatgat atgtgacatt 960 gatacatata tcgtagaggc aggattagcc agttttatcc tgactattaa gtttgggata 1020 gaaactatgt atcctgctct tggactgcat gaatttgctg gtgagttatc cacacttgag 1080 tccttgatga acctttacca gcaaatgggg gaaactgcac cctacatggt aatcctggag 1140 aactcaattc agaacaagtt cagtgcagga tcataccctc tgctctggag ctatgccatg 1200 ggagtaggag tggaacttga aaactccatg ggaggtttga actttggccg atcttacttt 1260 gatccagcat attttagatt agggcaagag atggtaagga ggtcagctgg aaaggtcagt 1320 tccacattgg catctgaact cggtatcact gccgaggatg caaggcttgt ttcagagatt 1380 gcaatgcata ctactgagga caagatcagt agagcggttg gacccagaca agcccaagta 1440 tcatttctac acggtgatca aagtgagaat gagctaccga gattgggggg caaggaagat 1500 aggagggtca aacagagtcg aggagaagcc agggagagct acagagaaac cgggcccagc 1560 agagcaagtg atgcgagagc tgcccatctt ccaaccggca cacccctaga cattgacact 1620 gcaacggagt ccagccaaga tccgcaggac agtcgaaggt cagctgacgc cctgcttagg 1680 ctgcaagcca tggcaggaat ctcggaagaa caaggctcag acacggacac ccctatagtg 1740 tacaatgaca gaaatcttct agactaggtg cgagaggccg agggccagaa caacatccgc 1800 ctaccatcca tcattgttat aaaaaactta ggaaccaggt ccacacagcc gccagcccat 1860 caaccatcca ctcccacgat tggagccaat ggcagaagag caggcacgcc atgtcaaaaa 1920 cggactggaa tgcatccggg ctctcaaggc cgagcccatc ggctcactgg ccatcgagga 1980 agctatggca gcatggtcag aaatatcaga caacccagga caggagcgag ccacctgcag 2040 ggaagagaag gcaggcagtt cgggtctcag caaaccatgc ctctcagcaa ttggatcaac 2100 tgaaggcggt gcacctcgca tccgcggtca gggacctgga gagagcgatg acgacgctga 2160 aactttggga atccccccaa gaaatctcca ggcatcaagc actgggttac agtgttatta 2220 cgtttatgat cacagcggtg aagcggttaa gggaatccaa gatgctgact ctatcatggt 2280 tcaatcaggc cttgatggtg atagcaccct ctcaggagga gacaatgaat ctgaaaacag 2340 cgatgtggat attggcgaac ctgataccga gggatatgct atcactgacc ggggatctgc 2400 tcccatctct atggggttca gggcttctga tgttgaaact gcagaaggag gggagatcca 2460 cgagctcctg agactccaat ccagaggcaa caactttccg aagcttggga aaactctcaa 2520 tgttcctccg cccccggacc ccggtagggc cagcacttcc gggacaccca ttaaaaaggg 2580 cacagacgcg agattagcct catttggaac ggagatcgcg tctttattga caggtggtgc 2640 aacccaatgt gctcgaaagt caccctcgga accatcaggg ccaggtgcac ctgcggggaa 2700 tgtccccgag tgtgtgagca atgccgcact gatacaggag tggacacccg aatctggtac 2760 cacaatctcc ccgagatccc agaataatga agaaggggga gactattatg atgatgagct 2820 gttctctgat gtccaagata ttaaaacagc cttggccaaa atacacgagg ataatcagaa 2880 gataatctcc aagctagaat cactgctgtt attgaaggga gaagttgagt caattaagaa 2940 gcagatcaac aggcaaaata tcagcatatc caccctggaa ggacacctct caagcatcat 3000 gatcgccatt cctggacttg ggaaggatcc caacgacccc actgcagatg tcgaaatcaa 3060 tcccgacttg aaacccatca taggcagaga ttcaggccga gcactggccg aagttctcaa 3120 gaaacccgtt gccagccgac aactccaagg aatgacaaat ggacggacca gttccagagg 3180 acagctgctg aaggaatttc agctaaagcc gatcgggaaa aagatgagct cagccgtcgg 3240 gtttgttcct gacaccggcc ctgcatcacg cagtgtaatc cgctccatta taaaatccag 3300 ccggctagag gaggatcgga agcgttacct gatgactctc cttgatgata tcaaaggagc 3360 caatgatctt gccaagttcc accagatgct gatgaagata ataatgaagt agctacagct 3420 caacttacct gccaacccca tgccagtcga cccaactagt acaacctaaa tccattataa 3480 aaaacttagg agcaaagtga ttgcctccca aggtccacaa tgacagagac ctacgacttc 3540 gacaagtcgg catgggacat caaagggtcg atcgctccga tacaacccac cacctacagt 3600 gatggcaggc tggtgcccca ggtcagagtc atagatcctg gtctaggcga caggaaggat 3660 gaatgcttta tgtacatgtt tctgctgggg gttgttgagg acagcgattc cctagggcct 3720 ccaatcgggc gagcatttgg gttcctgccc ttaggtgttg gcagatccac agcaaagccc 3780 gaaaaactcc tcaaagaggc cactgagctt gacatagttg ttagacgtac agcagggctc 3840 aatgaaaaac tggtgttcta caacaacacc ccactaactc tcctcacacc ttggagaaag 3900 gtcctaacaa cagggagtgt cttcaacgca aaccaagtgt gcaatgcggt taatctgata 3960 ccgctcgata ccccgcagag gttccgtgtt gtttatatga gcatcacccg tctttcggat 4020 aacgggtatt acaccgttcc tagaagaatg ctggaattca gatcggtcaa tgcagtggcc 4080 ttcaacctgc tggtgaccct taggattgac aaggcgatag gccctgggaa gatcatcgac 4140 aatacagagc aacttcctga ggcaacattt atggtccaca tcgggaactt caggagaaag 4200 aagagtgaag tctactctgc cgattattgc aaaatgaaaa tcgaaaagat gggcctggtt 4260 tttgcacttg gtgggatagg gggcaccagt cttcacatta gaagcacagg caaaatgagc 4320 aagactctcc atgcacaact cgggttcaag aagaccttat gttacccgct gatggatatc 4380 aatgaagacc ttaatcgatt actctggagg agcagatgca agatagtaag aatccaggca 4440 gttttgcagc catcagttcc tcaagaattc cgcatttacg acgacgtgat cataaatgat 4500 gaccaaggac tattcaaagt tctgtagacc gtagtgccca gcaatgcccg aaaacgaccc 4560 ccctcacaat gacagccaga aggcccggac aaaaaagccc cctccgaaag actccacgga 4620 ccaagcgaga ggccagccag cagccgacgg caagcgcgaa caccaggcgg ccccagcaca 4680 gaacagccct gacacaaggc caccaccagc caccccaatc tgcatcctcc tcgtgggacc 4740 cccgaggacc aacccccaag gctgcccccg atccaaacca ccaaccgcat ccccaccacc 4800 cccgggaaag aaacccccag caattggaag gcccctcccc ctcttcctca acacaagaac 4860 tccacaaccg aaccgcacaa gcgaccgagg tgacccaacc gcaggcatcc gactccctag 4920 acagatcctc tctccccggc aaactaaaca aaacttaggg ccaaggaaca tacacaccca 4980 acagaaccca gaccccggcc cacggcgccg cgcccccaac ccccgacaac cagagggagc 5040 ccccaaccaa tcccgccggc tcccccggtg cccacaggca gggacaccaa cccccgaaca 5100 gacccagcac ccaaccatcg acaatccaag acgggggggc ccccccaaaa aaaggccccc 5160 aggggccgac agccagcacc gcgaggaagc ccacccaccc cacacacgac cacggcaacc 5220 aaaccagaac ccagaccacc ctgggccacc agctcccaga ctcggccatc accccgcaga 5280 aaggaaaggc cacaacccgc gcaccccagc cccgatccgg cggggagcca cccaacccga 5340 accagcaccc aagagcgatc cccgaaggac ccccgaaccg caaaggacat cagtatccca 5400 cagcctctcc aagtcccccg gtctcctcct cttctcgaag ggaccaaaag atcaatccac 5460 cacacccgac gacactcaac tccccacccc taaaggagac accgggaatc ccagaatcaa 5520 gactcatcca atgtccatca tgggtctcaa ggtgaacgtc tctgccatat tcatggcagt 5580 actgttaact ctccaaacac ccaccggtca aatccattgg ggcaatctct ctaagatagg 5640 ggtggtagga ataggaagtg caagctacaa agttatgact cgttccagcc atcaatcatt 5700 agtcataaaa ttaatgccca atataactct cctcaataac tgcacgaggg tagagattgc 5760 agaatacagg agactactga gaacagtttt ggaaccaatt agagatgcac ttaatgcaat 5820 gacccagaat ataagaccgg ttcagagtgt agcttcaagt aggagacaca agagatttgc 5880 gggagtagtc ctggcaggtg cggccctagg cgttgccaca gctgctcaga taacagccgg 5940 cattgcactt caccagtcca tgctgaactc tcaagccatc gacaatctga gagcgagcct 6000 ggaaactact aatcaggcaa ttgagacaat cagacaagca gggcaggaga tgatattggc 6060 tgttcagggt gtccaagact acatcaataa tgagctgata ccgtctatga accaactatc 6120 ttgtgattta atcggccaga agctcgggct caaattgctc agatactata cagaaatcct 6180 gtcattattt ggccccagtt tacgggaccc catatctgcg gagatatcta tccaggcttt 6240 gagctatgcg cttggaggag acatcaataa ggtgttagaa aagctcggat acagtggagg 6300 tgatttactg ggcatcttag agagcggagg aataaaggcc cggataactc acgtcgacac 6360 agagtcctac ttcattgtcc tcagtatagc ctatccgacg ctgtccgaga ttaagggggt 6420 gattgtccac cggctagagg gggtctcgta caacataggc tctcaagagt ggtataccac 6480 tgtgcccaag tatgttgcaa cccaagggta ccttatctcg aattttgatg agtcatcgtg 6540 tactttcatg ccagagggga ctgtgtgcag ccaaaatgcc ttgtacccga tgagtcctct 6600 gctccaagaa tgcctccggg ggtacaccaa gtcctgtgct cgtacactcg tatccgggtc 6660 ttttgggaac cggttcattt tatcacaagg gaacctaata gccaattgtg catcaatcct 6720 ttgcaagtgt tacacaacag gaacgatcat taatcaagac cctgacaaga tcctaacata 6780 cattgctgcc gatcactgcc cggtagtcga ggtgaacggc gtgaccatcc aagtcgggag 6840 caggaggtat ccagacgctg tgtacttgca cagaattgac ctcggtcctc ccatatcatt 6900 ggagaggttg gacgtaggga caaatctggg gaatgcaatt gctaagttgg aggatgccaa 6960 ggaattgttg gagtcatcgg accagatatt gaggagtatg aaaggtttat cgagcactag 7020 catagtctac atcctgattg cagtgtgtct tggagggttg atagggatcc ccgctttaat 7080 atgttgctgc agggggcgtt gtaacaaaaa gggagaacaa gttggtatgt caagaccagg 7140 cctaaagcct gatcttacgg gaacatcaaa atcctatgta aggtcgctct gatcctctac 7200 aactcttgaa acacaaatgt cccacaagtc tcctcttcgt catcaagcaa ccaccgcacc 7260 cagcatcaag cccacctgaa attatctccg gcttccctct ggccgaacaa tatcggtagt 7320 taatcaaaac ttagggtgca agatcatcca caatgtcacc acaacgagac cggataaatg 7380 ccttctacaa agataacccc catcccaagg gaagtaggat agtcattaac agagaacatc 7440 ttatgattga tagaccttat gttttgctgg ctgttctgtt tgtcatgttt ctgagcttga 7500 tcgggttgct agccattgca ggcattagac ttcatcgggc agccatctac accgcagaga 7560 tccataaaag cctcagcacc aatctagatg taactaactc aatcgagcat caggtcaagg 7620 acgtgctgac accactcttc aaaatcatcg gtgatgaagt gggcctgagg acacctcaga 7680 gattcactga cctagtgaaa ttaatctctg acaagattaa attccttaat ccggataggg 7740 agtacgactt cagagatctc acttggtgta tcaacccgcc agagagaatc aaattggatt 7800 atgatcaata ctgtgcagat gtggctgctg aagagctcat gaatgcattg gtgaactcaa 7860 ctctactgga gaccagaaca accaatcagt tcctagctgt ctcaaaggga aactgctcag 7920 ggcccactac aatcagaggt caattctcaa acatgtcgct gtccctgtta gacttgtatt 7980 taggtcgagg ttacaatgtg tcatctatag tcactatgac atcccaggga atgtatgggg 8040 gaacttacct agtggaaaag cctaatctga gcagcaaaag gtcagagttg tcacaactga 8100 gcatgtaccg agtgtttgaa gtaggtgtta tcagaaatcc gggtttgggg gctccggtgt 8160 tccatatgac aaactatctt gagcaaccag tcagtaatga tctcagcaac tgtatggtgg 8220 ctttggggga gctcaaactc gcagcccttt gtcacgggga agattctatc acaattccct 8280 atcagggatc agggaaaggt gtcagcttcc agctcgtcaa gctaggtgtc tggaaatccc 8340 caaccgacat gcaatcctgg gtccccttat caacggatga tccagtgata gacaggcttt 8400 acctctcatc tcacagaggt gttatcgctg acaatcaagc aaaatgggct gtcccgacaa 8460 cacgaacaga tgacaagttg cgaatggaga catgcttcca acaggcgtgt aagggtaaaa 8520 tccaagcact ctgcgagaat cccgagtggg caccattgaa ggataacagg attccttcat 8580 acggggtctt gtctgttgat ctgagtctga cagttgagct taaaatcaaa attgcttcgg 8640 gattcgggcc attgatcaca cacggttcag ggatggacct atacaaatcc aaccacaaca 8700 atgtgtattg gctgactatc ccgccaatga agaacctagc cttaggtgta atcaacacat 8760 tggagtggat accgagattc aaggttagtc cctacctctt cactgtccca attaaggaag 8820 caggcgaaga ctgccatgcc ccaacatacc tacctgcgga ggtggatggt gatgtcaaac 8880 tcagttccaa tctggtgatt ctacctggtc aagatctcca atatgttttg gcaacctacg 8940 atacttccag ggttgaacat gctgtggttt attacgttta cagcccaagc cgctcatttt 9000 cttactttta tccttttagg ttgcctataa agggggtccc catcgaatta caagtggaat 9060 gcttcacatg ggaccaaaaa ctctggtgcc gtcacttctg tgtgcttgcg gactcagaat 9120 ctggtggaca tatcactcac tctgggatgg tgggcatggg agtcagctgc acagtcaccc 9180 gggaagatgg aaccaatcgc agatagggct gctagtgaac caatcacatg atgtcaccca 9240 gacatcaggc atacccacta gtctaccctc catcattgtt ataaaaaact taggaaccag 9300 gtccacacag ccgccagccc atcaacgcgt acgatggtga gcaagggcga ggagctgttc 9360 accggggtgg tgcccatcct ggtcgagctg gacggcgacg taaacggcca caagttcagc 9420 gtgtccggcg agggcgaggg cgatgccacc tacggcaagc tgaccctgaa gttcatctgc 9480 accaccggca agctgcccgt gccctggccc accctcgtga ccaccctgac ctacggcgtg 9540 cagtgcttca gccgctaccc cgaccacatg aagcagcacg acttcttcaa gtccgccatg 9600 cccgaaggct acgtccagga gcgcaccatc ttcttcaagg acgacggcaa ctacaagacc 9660 cgcgccgagg tgaagttcga gggcgacacc ctggtgaacc gcatcgagct gaagggcatc 9720 gacttcaagg aggacggcaa catcctgggg cacaagctgg agtacaacta caacagccac 9780 aacgtctata tcatggccga caagcagaag aacggcatca aggtgaactt caagatccgc 9840 cacaacatcg aggacggcag cgtgcagctc gccgaccact accagcagaa cacccccatc 9900 ggcgacggcc ccgtgctgct gcccgacaac cactacctga gcacccagtc cgccctgagc 9960 aaagacccca acgagaagcg cgatcacatg gtcctgctgg agttcgtgac cgccgccggg 10020 atcactctcg gcatggacga gctgtacaag taggcgcgca gcgcttagac gtctcgcgat 10080 cgatgctagt gtgaaataga catcagaatt aagaaaaacg tagggtccaa gtggttcccc 10140 gttatggact cgctatctgt caaccagatc ttataccctg aagttcacct agatagcccg 10200 atagttacca ataagatagt agccatcctg gagtatgctc gagtccctca cgcttacagc 10260 ctggaggacc ctacactgtg tcagaacatc aagcaccgcc taaaaaacgg attttccaac 10320 caaatgatta taaacaatgt ggaagttggg aatgtcatca agtccaagct taggagttat 10380 ccggcccact ctcatattcc atatccaaat tgtaatcagg atttatttaa catagaagac 10440 aaagagtcaa cgaggaagat ccgtgaactc ctcaaaaagg ggaattcgct gtactccaaa 10500 gtcagtgata aggttttcca atgcttaagg gacactaact cacggcttgg cctaggctcc 10560 gaattgaggg aggacatcaa ggagaaagtt attaacttgg gagtttacat gcacagctcc 10620 cagtggtttg agccctttct gttttggttt acagtcaaga ctgagatgag gtcagtgatt 10680 aaatcacaaa cccatacttg ccataggagg agacacacac ctgtattctt cactggtagt 10740 tcagttgagt tgctaatctc tcgtgacctt gttgctataa tcagtaaaga gtctcaacat 10800 gtatattacc tgacatttga actggttttg atgtattgtg atgtcataga ggggaggtta 10860 atgacagaga ccgctatgac tattgatgct aggtatacag agcttctagg aagagtcaga 10920 tacatgtgga aactgataga tggtttcttc cctgcactcg ggaatccaac ttatcaaatt 10980 gtagccatgc tggagcctct ttcacttgct tacctgcagc tgagggatat aacagtagaa 11040 ctcagaggtg ctttccttaa ccactgcttt actgaaatac atgatgttct tgaccaaaac 11100 gggttttctg atgaaggtac ttatcatgag ttaactgaag ctctagatta cattttcata 11160 actgatgaca tacatctgac aggggagatt ttctcatttt tcagaagttt cggccacccc 11220 agacttgaag cagtaacggc tgctgaaaat gttaggaaat acatgaatca gcctaaagtc 11280 attgtgtatg agactctgat gaaaggtcat gccatatttt gtggaatcat aatcaacggc 11340 tatcgtgaca ggcacggagg cagttggcca ccgctgaccc tccccctgca tgctgcagac 11400 acaatccgga atgctcaagc ttcaggtgaa gggttaacac atgagcagtg cgttgataac 11460 tggaaatctt ttgctggagt gaaatttggc tgctttatgc ctcttagcct ggatagtgat 11520 ctgacaatgt acctaaagga caaggcactt gctgctctcc aaagggaatg ggattcagtt 11580 tacccgaaag agttcctgcg ttacgaccct cccaagggaa ccgggtcacg gaggcttgta 11640 gatgttttcc ttaatgattc gagctttgac ccatatgatg tgataatgta tgttgtaagt 11700 ggagcttacc tccatgaccc tgagttcaac ctgtcttaca gcctgaaaga aaaggagatc 11760 aaggaaacag gtagactttt tgctaaaatg acttacaaaa tgagggcatg ccaagtgatt 11820 gctgaaaatc taatctcaaa cgggattggc aaatatttta aggacaatgg gatggccaag 11880 gatgagcacg atttgactaa ggcactccac actctagctg tctcaggagt ccccaaagat 11940 ctcaaagaaa gtcacagggg ggggccagtc ttaaaaacct actcccgaag cccagtccac 12000 acaagtacca ggaacgtgag agcagcaaaa gggtttatag ggttccctca agtaattcgg 12060 caggaccaag acactgatca tccggagaat atggaagctt acgagacagt cagtgcattt 12120 atcacgactg atctcaagaa gtactgcctt aattggagat atgagaccat cagcttgttt 12180 gcacagaggc taaatgagat ttacggattg ccctcatttt tccagtggct gcataagagg 12240 cttgagacct ctgtcctgta tgtaagtgac cctcattgcc cccccgacct tgacgcccat 12300 atcccgttat ataaagtccc caatgatcaa atcttcatta agtaccctat gggaggtata 12360 gaagggtatt gtcagaagct gtggaccatc agcaccattc cctatctata cctggctgct 12420 tatgagagcg gagtaaggat tgcttcgtta gtgcaagggg acaatcagac catagccgta 12480 acaaaaaggg tacccagcac atggccctac aaccttaaga aacgggaagc tgctagagta 12540 actagagatt actttgtaat tcttaggcaa aggctacatg atattggcca tcacctcaag 12600 gcaaatgaga caattgtttc atcacatttt tttgtctatt caaaaggaat atattatgat 12660 gggctacttg tgtcccaatc actcaagagc atcgcaagat gtgtattctg gtcagagact 12720 atagttgatg aaacaagggc agcatgcagt aatattgcta caacaatggc taaaagcatc 12780 gagagaggtt atgaccgtta ccttgcatat tccctgaacg tcctaaaagt gatacagcaa 12840 attctgatct ctcttggctt cacaatcaat tcaaccatga cccgggatgt agtcataccc 12900 ctcctcacaa acaacgacct cttaataagg atggcactgt tgcccgctcc tattgggggg 12960 atgaattatc tgaatatgag caggctgttt gtcagaaaca tcggtgatcc agtaacatca 13020 tcaattgctg atctcaagag aatgattctc gcctcactaa tgcctgaaga gaccctccat 13080 caagtaatga cacaacaacc gggggactct tcattcctag actgggctag cgacccttac 13140 tcagcaaatc ttgtatgtgt ccagagcatc actagactcc tcaagaacat aactgcaagg 13200 tttgtcctga tccatagtcc aaacccaatg ttaaaaggat tattccatga tgacagtaaa 13260 gaagaggacg agggactggc ggcattcctc atggacaggc atattatagt acctagggca 13320 gctcatgaaa tcctggatca tagtgtcaca ggggcaagag agtctattgc aggcatgctg 13380 gataccacaa aaggcttgat tcgagccagc atgaggaagg gggggttaac ctctcgagtg 13440 ataaccagat tgtccaatta tgactatgaa caattcagag cagggatggt gctattgaca 13500 ggaagaaaga gaaatgtcct cattgacaaa gagtcatgtt cagtgcagct ggcgagagct 13560 ctaagaagcc atatgtgggc gaggctagct cgaggacggc ctatttacgg ccttgaggtc 13620 cctgatgtac tagaatctat gcgaggccac cttattcggc gtcatgagac atgtgtcatc 13680 tgcgagtgtg gatcagtcaa ctacggatgg ttttttgtcc cctcgggttg ccaactggat 13740 gatattgaca aggaaacatc atccttgaga gtcccatata ttggttctac cactgatgag 13800 agaacagaca tgaagcttgc cttcgtaaga gccccaagtc gatccttgcg atctgctgtt 13860 agaatagcaa cagtgtactc atgggcttac ggtgatgatg atagctcttg gaacgaagcc 13920 tggttgttgg ctaggcaaag ggccaatgtg agcctggagg agctaagggt gatcactccc 13980 atctcaactt cgactaattt agcgcatagg ttgagggatc gtagcactca agtgaaatac 14040 tcaggtacat cccttgtccg agtggcgagg tataccacaa tctccaacga caatctctca 14100 tttgtcatat cagataagaa ggttgatact aactttatat accaacaagg aatgcttcta 14160 gggttgggtg ttttagaaac attgtttcga ctcgagaaag ataccggatc atctaacacg 14220 gtattacatc ttcacgtcga aacagattgt tgcgtgatcc cgatgataga tcatcccagg 14280 atacccagct cccgcaagct agagctgagg gcagagctat gtaccaaccc attgatatat 14340 gataatgcac ctttaattga cagagatgca acaaggctat acacccagag ccataggagg 14400 caccttgtgg aatttgttac atggtccaca ccccaactat atcacatttt agctaagtcc 14460 acagcactat ctatgattga cctggtaaca aaatttgaga aggaccatat gaatgaaatt 14520 tcagctctca taggggatga cgatatcaat agtttcataa ctgagtttct gctcatagag 14580 ccaagattat tcactatcta cttgggccag tgtgcggcca tcaattgggc atttgatgta 14640 cattatcata gaccatcagg gaaatatcag atgggtgagc tgttgtcatc gttcctttct 14700 agaatgagca aaggagtgtt taaggtgctt gtcaatgctc taagccaccc aaagatctac 14760 aagaaattct ggcattgtgg tattatagag cctatccatg gtccttcact tgatgctcaa 14820 aacttgcaca caactgtgtg caacatggtt tacacatgct atatgaccta cctcgacctg 14880 ttgttgaatg aagagttaga agagttcaca tttctcttgt gtgaaagcga cgaggatgta 14940 gtaccggaca gattcgacaa catccaggca aaacacttat gtgttctggc agatttgtac 15000 tgtcaaccag ggacctgccc accaattcga ggtctaagac cggtagagaa atgtgcagtt 15060 ctaaccgacc atatcaaggc agaggctatg ttatctccag caggatcttc gtggaacata 15120 aatccaatta ttgtagacca ttactcatgc tctctgactt atctccggcg aggatcgatc 15180 aaacagataa gattgagagt tgatccagga ttcattttcg acgccctcgc tgaggtaaat 15240 gtcagtcagc caaagatcgg cagcaacaac atctcaaata tgagcatcaa ggctttcaga 15300 cccccacacg atgatgttgc aaaattgctc aaagatatca acacaagcaa gcacaatctt 15360 cccatttcag ggggcaatct cgccaattat gaaatccatg ctttccgcag aatcgggttg 15420 aactcatctg cttgctacaa agctgttgag atatcaacat taattaggag atgccttgag 15480 ccaggggagg acggcttgtt cttgggtgag ggatcgggtt ctatgttgat cacttataaa 15540 gagatactta aactaaacaa gtgcttctat aatagtgggg tttccgccaa ttctagatct 15600 ggtcaaaggg aattagcacc ctatccctcc gaagttggcc ttgtcgaaca cagaatggga 15660 gtaggtaata ttgtcaaagt gctctttaac gggaggcccg aagtcacgtg ggtaggcagt 15720 gtagattgct tcaatttcat agttagtaat atccctacct ctagtgtggg gtttatccat 15780 tcagatatag agaccttgcc tgacaaagat actatagaga agctagagga attggcagcc 15840 atcttatcga tggctctgct cctgggcaaa ataggatcaa tactggtgat taagcttatg 15900 cctttcagcg gggattttgt tcagggattt ataagttatg tagggtctca ttatagagaa 15960 gtgaaccttg tataccctag atacagcaac ttcatctcta ctgaatctta tttggttatg 16020 acagatctca aggctaaccg gctaatgaat cctgaaaaga ttaagcagca gataattgaa 16080 tcatctgtga ggacttcacc tggacttata ggtcacatcc tatccattaa gcaactaagc 16140 tgcatacaag caattgtggg agacgcagtt agtagaggtg atatcaatcc tactctgaaa 16200 aaacttacac ctatagagca ggtgctgatc aattgcgggt tggcaattaa cggacctaag 16260 ctgtgcaaag aattgatcca ccatgatgtt gcctcagggc aagatggatt gcttaattct 16320 atactcatcc tctacaggga gttggcaaga ttcaaagaca accaaagaag tcaacaaggg 16380 atgttccacg cttaccccgt attggtaagt agcaggcaac gagaacttat atctaggatc 16440 acccgcaaat tctgggggca cattcttctt tactccggga acaaaaagtt gataaataag 16500 tttatccaga atctcaagtc cggctatctg atactagact tacaccagaa tatcttcgtt 16560 aagaatctat ccaagtcaga gaaacagatt attatgacgg ggggtttgaa acgtgagtgg 16620 gtttttaagg taacagtcaa ggagaccaaa gaatggtata agttagtcgg atacagtgcc 16680 ctgattaagg actaattggt tgaactccgg aaccctaatc ctgccctagg tggttaggca 16740 ttatttgcaa tatattaaag aaaactttga aaatacgaag tttctattcc cagctttgtc 16800 tggtggccgg catggtccca gcctcctcgc tggcgccggc tgggcaacat tccgagggga 16860 ccgtcccctc ggtaatggcg aatgggacgc ggccgatccg gctgctaaca aagcccgaaa 16920 ggaagctgag ttggctgctg ccaccgctga gcaataacta gcataacccc ttggggcctc 16980 taaacgggtc ttgaggggtt ttttgctgaa aggaggaact atatccggat gcggccgcca 17040 tgaacaataa aactgtctgc ttacataaac agtaatacaa ggggtgttat gagccatatt 17100 caacgggaaa cgtcgaggcc gcgattaaat tccaacatgg atgctgattt atatgggtat 17160 aaatgggctc gcgataatgt cgggcaatca ggtgcgacaa tctatcgctt gtatgggaag 17220 cccgatgcgc cagagttgtt tctgaaacat ggcaaaggta gcgttgccaa tgatgttaca 17280 gatgagatgg tcagactaaa ctggctgacg gaatttatgc ctcttccgac catcaagcat 17340 tttatccgta ctcctgatga tgcatggtta ctcaccactg cgatccccgg aaaaacagca 17400 ttccaggtat tagaagaata tcctgattca ggtgaaaata ttgttgatgc gctggcagtg 17460 ttcctgcgcc ggttgcattc gattcctgtt tgtaattgtc cttttaacag cgatcgtgta 17520 tttcgtctcg ctcaggcgca atcacgaatg aataacggtt tggttgatgc gagtgatttt 17580 gatgacgagc gtaatggctg gcctgttgaa caagtctgga aagaaatgca taaacttttg 17640 ccattctcac cggattcagt cgtcactcat ggtgatttct cacttgataa ccttattttt 17700 gacgagggga aattaatagg ttgtattgat gttggacgag tcggaatcgc agaccgatac 17760 caggatcttg ccatcctatg gaactgcctc ggtgagtttt ctccttcatt acagaaacgg 17820 ctttttcaaa aatatggtat tgataatcct gatatgaata aattgcagtt tcatttgatg 17880 ctcgatgagt ttttctaatc agaattggtt aattggttgt aacattattc agattgggcc 17940 ccgttccact gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg agatcctttt 18000 tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt 18060 ttgccggatc aagagctacc aactcttttt ccgaaggtaa ctggcttcag cagagcgcag 18120 ataccaaata ctgttcttct agtgtagccg tagttaggcc accacttcaa gaactctgta 18180 gcaccgccta catacctcgc tctgctaatc ctgttaccag tggctgctgc cagtggcgat 18240 aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac cggataaggc gcagcggtcg 18300 ggctgaacgg ggggttcgtg cacacagccc agcttggagc gaacgaccta caccgaactg 18360 agatacctac agcgtgagct atgagaaagc gccacgcttc ccgaagggag aaaggcggac 18420 aggtatccgg taagcggcag ggtcggaaca ggagagcgca cgagggagct tccaggggga 18480 aacgcctggt atctttatag tcctgtcggg tttcgccacc tctgacttga gcgtcgattt 18540 ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc ggccttttta 18600 cggttcctgg ccttttgctg gccttttgct cacatgttct ttcctgcgtt atcccctgat 18660 tctgtggata accgtattac cgctag 18686 <210> 34 <211> 21800 <212> DNA <213> Artificial sequence <220> <223> pKM-ATU2-S_2019-nCoV (optimized sequence) <400> 34 gcgatcgcta atacgactca ctatagggcc aactttgttt ggtctgatga gtccgtgagg 60 acgaaacccg gagtcccggg tcaccaaaca aagttgggta aggatagttc aatcaatgat 120 catcttctag tgcacttagg attcaagatc ctattatcag ggacaagagc aggattaggg 180 atatccgaga tggccacact tttaaggagc ttagcattgt tcaaaagaaa caaggacaaa 240 ccacccatta catcaggatc cggtggagcc atcagaggaa tcaaacacat tattatagta 300 ccaatccctg gagattcctc aattaccact cgatccagac ttctggaccg gttggtgagg 360 ttaattggaa acccggatgt gagcgggccc aaactaacag gggcactaat aggtatatta 420 tccttatttg tggagtctcc aggtcaattg attcagagga tcaccgatga ccctgacgtt 480 agcataaggc tgttagaggt tgtccagagt gaccagtcac aatctggcct taccttcgca 540 tcaagaggta ccaacatgga ggatgaggcg gaccaatact tttcacatga tgatccaatt 600 agtagtgatc aatccaggtt cggatggttc gggaacaagg aaatctcaga tattgaagtg 660 caagaccctg agggattcaa catgattctg ggtaccatcc tagcccaaat ttgggtcttg 720 ctcgcaaagg cggttacggc cccagacacg gcagctgatt cggagctaag aaggtggata 780 aagtacaccc aacaaagaag ggtagttggt gaatttagat tggagagaaa atggttggat 840 gtggtgagga acaggattgc cgaggacctc tccttacgcc gattcatggt cgctctaatc 900 ctggatatca agagaacacc cggaaacaaa cccaggattg ctgaaatgat atgtgacatt 960 gatacatata tcgtagaggc aggattagcc agttttatcc tgactattaa gtttgggata 1020 gaaactatgt atcctgctct tggactgcat gaatttgctg gtgagttatc cacacttgag 1080 tccttgatga acctttacca gcaaatgggg gaaactgcac cctacatggt aatcctggag 1140 aactcaattc agaacaagtt cagtgcagga tcataccctc tgctctggag ctatgccatg 1200 ggagtaggag tggaacttga aaactccatg ggaggtttga actttggccg atcttacttt 1260 gatccagcat attttagatt agggcaagag atggtaagga ggtcagctgg aaaggtcagt 1320 tccacattgg catctgaact cggtatcact gccgaggatg caaggcttgt ttcagagatt 1380 gcaatgcata ctactgagga caagatcagt agagcggttg gacccagaca agcccaagta 1440 tcatttctac acggtgatca aagtgagaat gagctaccga gattgggggg caaggaagat 1500 aggagggtca aacagagtcg aggagaagcc agggagagct acagagaaac cgggcccagc 1560 agagcaagtg atgcgagagc tgcccatctt ccaaccggca cacccctaga cattgacact 1620 gcaacggagt ccagccaaga tccgcaggac agtcgaaggt cagctgacgc cctgcttagg 1680 ctgcaagcca tggcaggaat ctcggaagaa caaggctcag acacggacac ccctatagtg 1740 tacaatgaca gaaatcttct agactaggtg cgagaggccg agggccagaa caacatccgc 1800 ctaccatcca tcattgttat aaaaaactta ggaaccaggt ccacacagcc gccagcccat 1860 caaccatcca ctcccacgat tggagccaat ggcagaagag caggcacgcc atgtcaaaaa 1920 cggactggaa tgcatccggg ctctcaaggc cgagcccatc ggctcactgg ccatcgagga 1980 agctatggca gcatggtcag aaatatcaga caacccagga caggagcgag ccacctgcag 2040 ggaagagaag gcaggcagtt cgggtctcag caaaccatgc ctctcagcaa ttggatcaac 2100 tgaaggcggt gcacctcgca tccgcggtca gggacctgga gagagcgatg acgacgctga 2160 aactttggga atccccccaa gaaatctcca ggcatcaagc actgggttac agtgttatta 2220 cgtttatgat cacagcggtg aagcggttaa gggaatccaa gatgctgact ctatcatggt 2280 tcaatcaggc cttgatggtg atagcaccct ctcaggagga gacaatgaat ctgaaaacag 2340 cgatgtggat attggcgaac ctgataccga gggatatgct atcactgacc ggggatctgc 2400 tcccatctct atggggttca gggcttctga tgttgaaact gcagaaggag gggagatcca 2460 cgagctcctg agactccaat ccagaggcaa caactttccg aagcttggga aaactctcaa 2520 tgttcctccg cccccggacc ccggtagggc cagcacttcc gggacaccca ttaaaaaggg 2580 cacagacgcg agattagcct catttggaac ggagatcgcg tctttattga caggtggtgc 2640 aacccaatgt gctcgaaagt caccctcgga accatcaggg ccaggtgcac ctgcggggaa 2700 tgtccccgag tgtgtgagca atgccgcact gatacaggag tggacacccg aatctggtac 2760 cacaatctcc ccgagatccc agaataatga agaaggggga gactattatg atgatgagct 2820 gttctctgat gtccaagata ttaaaacagc cttggccaaa atacacgagg ataatcagaa 2880 gataatctcc aagctagaat cactgctgtt attgaaggga gaagttgagt caattaagaa 2940 gcagatcaac aggcaaaata tcagcatatc caccctggaa ggacacctct caagcatcat 3000 gatcgccatt cctggacttg ggaaggatcc caacgacccc actgcagatg tcgaaatcaa 3060 tcccgacttg aaacccatca taggcagaga ttcaggccga gcactggccg aagttctcaa 3120 gaaacccgtt gccagccgac aactccaagg aatgacaaat ggacggacca gttccagagg 3180 acagctgctg aaggaatttc agctaaagcc gatcgggaaa aagatgagct cagccgtcgg 3240 gtttgttcct gacaccggcc ctgcatcacg cagtgtaatc cgctccatta taaaatccag 3300 ccggctagag gaggatcgga agcgttacct gatgactctc cttgatgata tcaaaggagc 3360 caatgatctt gccaagttcc accagatgct gatgaagata ataatgaagt agctacagct 3420 caacttacct gccaacccca tgccagtcga cccaactagc ctaccctcca tcattgttat 3480 aaaaaactta ggaaccaggt ccacacagcc gccagcccat caacgcgtac ggccaccatg 3540 ttcgtgtttc tggtgctgct gccactggtg tccagtcagt gcgtgaacct gaccacacga 3600 acacagctgc caccagccta caccaatagc ttcacccgcg gagtgtacta ccccgacaag 3660 gtgttccgca gcagcgtgct gcatagcacc caggatctgt ttctgccctt cttcagcaac 3720 gtgacctggt tccacgccat ccacgtgtcc ggcaccaatg gcaccaagcg cttcgataat 3780 cccgtgctgc ccttcaacga tggcgtgtac tttgccagca ccgagaagtc caatatcatc 3840 cgcggctgga tcttcggcac cacactggat agcaagaccc agagcctgct gatcgtgaac 3900 aacgccacca acgtggtcat caaagtgtgc gagttccagt tctgcaacga ccccttcctg 3960 ggcgtctact accacaagaa caacaagagc tggatggaaa gcgagttccg cgtgtacagc 4020 agcgccaaca actgcacctt cgagtacgtg tcccagccat tcctgatgga cctggaaggc 4080 aagcagggca acttcaagaa cctgcgcgag ttcgtgttca agaacatcga cggctacttc 4140 aaaatctaca gcaagcacac cccaatcaac ctcgtgcgcg atctgccaca gggattcagt 4200 gctctggaac ccctggtgga tctgcccatc ggcatcaaca ttacccgctt tcagacactg 4260 ctggccctgc accgcagtta cttgacacca ggcgatagca gcagtggatg gacagctggt 4320 gccgccgctt actacgttgg atatctgcag ccacgcacct ttctgctgaa gtacaacgag 4380 aacggcacca tcaccgacgc cgtggattgt gctctcgatc ccctgagcga gacaaagtgc 4440 accctgaagt ccttcaccgt cgagaagggc atctaccaga ccagcaattt ccgcgtgcag 4500 cccaccgaga gcatcgtgcg cttccccaat atcaccaatc tgtgcccctt cggcgaggtg 4560 ttcaatgcca cacgctttgc ctccgtgtac gcctggaatc gcaagcgcat tagcaactgc 4620 gtggccgact actccgtgct gtacaatagc gccagcttca gcaccttcaa gtgctacggc 4680 gtgtcaccca ccaagctgaa cgacctgtgc ttcaccaatg tgtacgccga cagcttcgtg 4740 atccgcggag atgaagtgcg acagattgcc ccaggccaga ccggcaagat cgccgactac 4800 aattacaagc tgcccgacga cttcaccggc tgcgtgatcg cctggaacag caacaacctg 4860 gattccaaag tcggcggcaa ctacaactac ctgtaccgcc tgttccgcaa gagcaatctg 4920 aagcccttcg agcgcgacat cagcaccgaa atctaccagg ccggaagcac cccatgcaac 4980 ggcgtggaag gcttcaactg ctacttccca ctgcagtcct acggatttca gcccacaaat 5040 ggcgtgggct accagccata tcgagtggtg gtgctgagct tcgaactgct gcatgctcca 5100 gctaccgtgt gcggccccaa gaagagtacc aacctggtca agaacaaatg cgtgaacttc 5160 aacttcaacg gcctgaccgg aaccggcgtg ctgaccgaga gtaacaagaa gttcctgcca 5220 ttccagcagt ttggccgcga cattgccgat acaaccgatg ccgttcgcga tccccagacc 5280 ttggagatcc tggatattac cccatgctcc ttcggcggcg tgtccgtgat tacaccaggc 5340 accaatacca gcaaccaggt ggccgttctg taccaggatg tgaattgcac agaggtgccc 5400 gtggccattc acgccgatca attgacacca acatggcgcg tgtactccac cggcagcaat 5460 gtgtttcaaa cccgcgctgg atgcctgatt ggagccgagc acgtgaacaa tagctacgag 5520 tgcgatatcc ccatcggagc cggaatctgc gcctcctatc agacccagac caatagtcca 5580 cgacgagccc gaagtgtggc cagccagagc atcattgcct ataccatgag cctgggcgcc 5640 gagaatagcg tggcctactc caacaacagc attgctatcc ccaccaactt caccatcagc 5700 gtgaccaccg agatcctgcc agtgtccatg accaagacca gcgtggactg caccatgtac 5760 atctgcggag atagcaccga gtgcagcaac ctgctgctgc agtacggaag tttctgcacc 5820 cagctgaatc gcgccctgac aggcattgcc gtggaacagg ataagaacac ccaagaggtg 5880 ttcgcccaag tgaagcaaat ctacaagacc ccaccaatca aggatttcgg cggcttcaat 5940 ttcagccaga ttctgcccga tccaagcaag cccagcaagc gcagcttcat cgaggacctg 6000 ctgttcaaca aagtgacact ggccgacgcc ggattcatca agcagtatgg cgattgcctg 6060 ggcgatattg ccgcacgcga tctgatttgc gcccagaagt ttaacggact gaccgtcctg 6120 ccaccactgc tgacagatga gatgatcgcc cagtacacaa gtgccctgct ggccggaacc 6180 attaccagcg gatggacatt tggagccggt gccgctctgc agattccctt cgctatgcag 6240 atggcctacc gcttcaatgg cattggcgtg acccagaatg tgctgtacga gaaccagaag 6300 ctgatcgcca accagttcaa cagcgccatc ggcaagattc aggacagcct gagtagtacc 6360 gccagcgctc tgggaaagct gcaggatgtg gtcaaccaga acgctcaggc cctgaacacc 6420 ctggttaagc agctgagcag caacttcggc gccatcagta gcgtgctgaa cgatatcctg 6480 agccgcctgg ataaggtgga agccgaggtg cagatcgatc gcctgattac cggacgcctg 6540 cagtccctgc agacctatgt gacacagcag ctgatccgag ccgccgagat tcgagctagt 6600 gctaatctgg ccgccaccaa gatgagcgaa tgtgtgctgg gacagagcaa gcgcgtggac 6660 ttttgcggca agggatacca cctgatgagc ttcccacaga gtgctccaca cggcgtggtg 6720 tttctgcatg tgacctacgt gcccgctcaa gagaagaatt tcaccaccgc tccagccatc 6780 tgccacgacg gaaaggccca ttttccacgc gagggcgtgt tcgttagcaa cggcactcat 6840 tggttcgtca cccagcgcaa cttctacgag ccccagatca tcaccaccga caacaccttc 6900 gtcagcggca actgcgacgt cgtgatcggc attgtgaaca acaccgtgta cgatccactg 6960 cagcccgagc tggacagctt caaagaggaa ctggacaagt actttaagaa ccacacaagc 7020 cccgacgtgg acctgggaga cattagcgga atcaacgcca gcgtggtcaa catccagaaa 7080 gagattgacc gcctgaacga ggtggccaag aatctgaacg agagcctgat cgacctgcaa 7140 gaactgggca aatacgagca gtacattaag tggccctggt acatctggct gggcttcatt 7200 gccggactga ttgccatcgt gatggtcacc attatgctgt gctgcatgac cagttgctgc 7260 agctgcctga agggatgctg cagttgcgga agctgctgca agttcgacga ggatgatagc 7320 gagccagtgc tgaagggcgt caagctgcac tacacctgat aacgagcgcg cagcgcttag 7380 acgtctcgcg atcgatacta gtacaaccta aatccattat aaaaaactta ggagcaaagt 7440 gattgcctcc caaggtccac aatgacagag acctacgact tcgacaagtc ggcatgggac 7500 atcaaagggt cgatcgctcc gatacaaccc accacctaca gtgatggcag gctggtgccc 7560 caggtcagag tcatagatcc tggtctaggc gacaggaagg atgaatgctt tatgtacatg 7620 tttctgctgg gggttgttga ggacagcgat tccctagggc ctccaatcgg gcgagcattt 7680 gggttcctgc ccttaggtgt tggcagatcc acagcaaagc ccgaaaaact cctcaaagag 7740 gccactgagc ttgacatagt tgttagacgt acagcagggc tcaatgaaaa actggtgttc 7800 tacaacaaca ccccactaac tctcctcaca ccttggagaa aggtcctaac aacagggagt 7860 gtcttcaacg caaaccaagt gtgcaatgcg gttaatctga taccgctcga taccccgcag 7920 aggttccgtg ttgtttatat gagcatcacc cgtctttcgg ataacgggta ttacaccgtt 7980 cctagaagaa tgctggaatt cagatcggtc aatgcagtgg ccttcaacct gctggtgacc 8040 cttaggattg acaaggcgat aggccctggg aagatcatcg acaatacaga gcaacttcct 8100 gaggcaacat ttatggtcca catcgggaac ttcaggagaa agaagagtga agtctactct 8160 gccgattatt gcaaaatgaa aatcgaaaag atgggcctgg tttttgcact tggtgggata 8220 gggggcacca gtcttcacat tagaagcaca ggcaaaatga gcaagactct ccatgcacaa 8280 ctcgggttca agaagacctt atgttacccg ctgatggata tcaatgaaga ccttaatcga 8340 ttactctgga ggagcagatg caagatagta agaatccagg cagttttgca gccatcagtt 8400 cctcaagaat tccgcattta cgacgacgtg atcataaatg atgaccaagg actattcaaa 8460 gttctgtaga ccgtagtgcc cagcaatgcc cgaaaacgac ccccctcaca atgacagcca 8520 gaaggcccgg acaaaaaagc cccctccgaa agactccacg gaccaagcga gaggccagcc 8580 agcagccgac ggcaagcgcg aacaccaggc ggccccagca cagaacagcc ctgacacaag 8640 gccaccacca gccaccccaa tctgcatcct cctcgtggga cccccgagga ccaaccccca 8700 aggctgcccc cgatccaaac caccaaccgc atccccacca cccccgggaa agaaaccccc 8760 agcaattgga aggcccctcc ccctcttcct caacacaaga actccacaac cgaaccgcac 8820 aagcgaccga ggtgacccaa ccgcaggcat ccgactccct agacagatcc tctctccccg 8880 gcaaactaaa caaaacttag ggccaaggaa catacacacc caacagaacc cagaccccgg 8940 cccacggcgc cgcgccccca acccccgaca accagaggga gcccccaacc aatcccgccg 9000 gctcccccgg tgcccacagg cagggacacc aacccccgaa cagacccagc acccaaccat 9060 cgacaatcca agacgggggg gcccccccaa aaaaaggccc ccaggggccg acagccagca 9120 ccgcgaggaa gcccacccac cccacacacg accacggcaa ccaaaccaga acccagacca 9180 ccctgggcca ccagctccca gactcggcca tcaccccgca gaaaggaaag gccacaaccc 9240 gcgcacccca gccccgatcc ggcggggagc cacccaaccc gaaccagcac ccaagagcga 9300 tccccgaagg acccccgaac cgcaaaggac atcagtatcc cacagcctct ccaagtcccc 9360 cggtctcctc ctcttctcga agggaccaaa agatcaatcc accacacccg acgacactca 9420 actccccacc cctaaaggag acaccgggaa tcccagaatc aagactcatc caatgtccat 9480 catgggtctc aaggtgaacg tctctgccat attcatggca gtactgttaa ctctccaaac 9540 acccaccggt caaatccatt ggggcaatct ctctaagata ggggtggtag gaataggaag 9600 tgcaagctac aaagttatga ctcgttccag ccatcaatca ttagtcataa aattaatgcc 9660 caatataact ctcctcaata actgcacgag ggtagagatt gcagaataca ggagactact 9720 gagaacagtt ttggaaccaa ttagagatgc acttaatgca atgacccaga atataagacc 9780 ggttcagagt gtagcttcaa gtaggagaca caagagattt gcgggagtag tcctggcagg 9840 tgcggcccta ggcgttgcca cagctgctca gataacagcc ggcattgcac ttcaccagtc 9900 catgctgaac tctcaagcca tcgacaatct gagagcgagc ctggaaacta ctaatcaggc 9960 aattgagaca atcagacaag cagggcagga gatgatattg gctgttcagg gtgtccaaga 10020 ctacatcaat aatgagctga taccgtctat gaaccaacta tcttgtgatt taatcggcca 10080 gaagctcggg ctcaaattgc tcagatacta tacagaaatc ctgtcattat ttggccccag 10140 tttacgggac cccatatctg cggagatatc tatccaggct ttgagctatg cgcttggagg 10200 agacatcaat aaggtgttag aaaagctcgg atacagtgga ggtgatttac tgggcatctt 10260 agagagcgga ggaataaagg cccggataac tcacgtcgac acagagtcct acttcattgt 10320 cctcagtata gcctatccga cgctgtccga gattaagggg gtgattgtcc accggctaga 10380 gggggtctcg tacaacatag gctctcaaga gtggtatacc actgtgccca agtatgttgc 10440 aacccaaggg taccttatct cgaattttga tgagtcatcg tgtactttca tgccagaggg 10500 gactgtgtgc agccaaaatg ccttgtaccc gatgagtcct ctgctccaag aatgcctccg 10560 ggggtacacc aagtcctgtg ctcgtacact cgtatccggg tcttttggga accggttcat 10620 tttatcacaa gggaacctaa tagccaattg tgcatcaatc ctttgcaagt gttacacaac 10680 aggaacgatc attaatcaag accctgacaa gatcctaaca tacattgctg ccgatcactg 10740 cccggtagtc gaggtgaacg gcgtgaccat ccaagtcggg agcaggaggt atccagacgc 10800 tgtgtacttg cacagaattg acctcggtcc tcccatatca ttggagaggt tggacgtagg 10860 gacaaatctg gggaatgcaa ttgctaagtt ggaggatgcc aaggaattgt tggagtcatc 10920 ggaccagata ttgaggagta tgaaaggttt atcgagcact agcatagtct acatcctgat 10980 tgcagtgtgt cttggagggt tgatagggat ccccgcttta atatgttgct gcagggggcg 11040 ttgtaacaaa aagggagaac aagttggtat gtcaagacca ggcctaaagc ctgatcttac 11100 gggaacatca aaatcctatg taaggtcgct ctgatcctct acaactcttg aaacacaaat 11160 gtcccacaag tctcctcttc gtcatcaagc aaccaccgca cccagcatca agcccacctg 11220 aaattatctc cggcttccct ctggccgaac aatatcggta gttaatcaaa acttagggtg 11280 caagatcatc cacaatgtca ccacaacgag accggataaa tgccttctac aaagataacc 11340 cccatcccaa gggaagtagg atagtcatta acagagaaca tcttatgatt gatagacctt 11400 atgttttgct ggctgttctg tttgtcatgt ttctgagctt gatcgggttg ctagccattg 11460 caggcattag acttcatcgg gcagccatct acaccgcaga gatccataaa agcctcagca 11520 ccaatctaga tgtaactaac tcaatcgagc atcaggtcaa ggacgtgctg acaccactct 11580 tcaaaatcat cggtgatgaa gtgggcctga ggacacctca gagattcact gacctagtga 11640 aattaatctc tgacaagatt aaattcctta atccggatag ggagtacgac ttcagagatc 11700 tcacttggtg tatcaacccg ccagagagaa tcaaattgga ttatgatcaa tactgtgcag 11760 atgtggctgc tgaagagctc atgaatgcat tggtgaactc aactctactg gagaccagaa 11820 caaccaatca gttcctagct gtctcaaagg gaaactgctc agggcccact acaatcagag 11880 gtcaattctc aaacatgtcg ctgtccctgt tagacttgta tttaggtcga ggttacaatg 11940 tgtcatctat agtcactatg acatcccagg gaatgtatgg gggaacttac ctagtggaaa 12000 agcctaatct gagcagcaaa aggtcagagt tgtcacaact gagcatgtac cgagtgtttg 12060 aagtaggtgt tatcagaaat ccgggtttgg gggctccggt gttccatatg acaaactatc 12120 ttgagcaacc agtcagtaat gatctcagca actgtatggt ggctttgggg gagctcaaac 12180 tcgcagccct ttgtcacggg gaagattcta tcacaattcc ctatcaggga tcagggaaag 12240 gtgtcagctt ccagctcgtc aagctaggtg tctggaaatc cccaaccgac atgcaatcct 12300 gggtcccctt atcaacggat gatccagtga tagacaggct ttacctctca tctcacagag 12360 gtgttatcgc tgacaatcaa gcaaaatggg ctgtcccgac aacacgaaca gatgacaagt 12420 tgcgaatgga gacatgcttc caacaggcgt gtaagggtaa aatccaagca ctctgcgaga 12480 atcccgagtg ggcaccattg aaggataaca ggattccttc atacggggtc ttgtctgttg 12540 atctgagtct gacagttgag cttaaaatca aaattgcttc gggattcggg ccattgatca 12600 cacacggttc agggatggac ctatacaaat ccaaccacaa caatgtgtat tggctgacta 12660 tcccgccaat gaagaaccta gccttaggtg taatcaacac attggagtgg ataccgagat 12720 tcaaggttag tccctacctc ttcactgtcc caattaagga agcaggcgaa gactgccatg 12780 ccccaacata cctacctgcg gaggtggatg gtgatgtcaa actcagttcc aatctggtga 12840 ttctacctgg tcaagatctc caatatgttt tggcaaccta cgatacttcc agggttgaac 12900 atgctgtggt ttattacgtt tacagcccaa gccgctcatt ttcttacttt tatcctttta 12960 ggttgcctat aaagggggtc cccatcgaat tacaagtgga atgcttcaca tgggaccaaa 13020 aactctggtg ccgtcacttc tgtgtgcttg cggactcaga atctggtgga catatcactc 13080 actctgggat ggtgggcatg ggagtcagct gcacagtcac ccgggaagat ggaaccaatc 13140 gcagataggg ctgctagtga accaatcaca tgatgtcacc cagacatcag gcatacccac 13200 tagtgtgaaa tagacatcag aattaagaaa aacgtagggt ccaagtggtt ccccgttatg 13260 gactcgctat ctgtcaacca gatcttatac cctgaagttc acctagatag cccgatagtt 13320 accaataaga tagtagccat cctggagtat gctcgagtcc ctcacgctta cagcctggag 13380 gaccctacac tgtgtcagaa catcaagcac cgcctaaaaa acggattttc caaccaaatg 13440 attataaaca atgtggaagt tgggaatgtc atcaagtcca agcttaggag ttatccggcc 13500 cactctcata ttccatatcc aaattgtaat caggatttat ttaacataga agacaaagag 13560 tcaacgagga agatccgtga actcctcaaa aaggggaatt cgctgtactc caaagtcagt 13620 gataaggttt tccaatgctt aagggacact aactcacggc ttggcctagg ctccgaattg 13680 agggaggaca tcaaggagaa agttattaac ttgggagttt acatgcacag ctcccagtgg 13740 tttgagccct ttctgttttg gtttacagtc aagactgaga tgaggtcagt gattaaatca 13800 caaacccata cttgccatag gaggagacac acacctgtat tcttcactgg tagttcagtt 13860 gagttgctaa tctctcgtga ccttgttgct ataatcagta aagagtctca acatgtatat 13920 tacctgacat ttgaactggt tttgatgtat tgtgatgtca tagaggggag gttaatgaca 13980 gagaccgcta tgactattga tgctaggtat acagagcttc taggaagagt cagatacatg 14040 tggaaactga tagatggttt cttccctgca ctcgggaatc caacttatca aattgtagcc 14100 atgctggagc ctctttcact tgcttacctg cagctgaggg atataacagt agaactcaga 14160 ggtgctttcc ttaaccactg ctttactgaa atacatgatg ttcttgacca aaacgggttt 14220 tctgatgaag gtacttatca tgagttaact gaagctctag attacatttt cataactgat 14280 gacatacatc tgacagggga gattttctca tttttcagaa gtttcggcca ccccagactt 14340 gaagcagtaa cggctgctga aaatgttagg aaatacatga atcagcctaa agtcattgtg 14400 tatgagactc tgatgaaagg tcatgccata ttttgtggaa tcataatcaa cggctatcgt 14460 gacaggcacg gaggcagttg gccaccgctg accctccccc tgcatgctgc agacacaatc 14520 cggaatgctc aagcttcagg tgaagggtta acacatgagc agtgcgttga taactggaaa 14580 tcttttgctg gagtgaaatt tggctgcttt atgcctctta gcctggatag tgatctgaca 14640 atgtacctaa aggacaaggc acttgctgct ctccaaaggg aatgggattc agtttacccg 14700 aaagagttcc tgcgttacga ccctcccaag ggaaccgggt cacggaggct tgtagatgtt 14760 ttccttaatg attcgagctt tgacccatat gatgtgataa tgtatgttgt aagtggagct 14820 tacctccatg accctgagtt caacctgtct tacagcctga aagaaaagga gatcaaggaa 14880 acaggtagac tttttgctaa aatgacttac aaaatgaggg catgccaagt gattgctgaa 14940 aatctaatct caaacgggat tggcaaatat tttaaggaca atgggatggc caaggatgag 15000 cacgatttga ctaaggcact ccacactcta gctgtctcag gagtccccaa agatctcaaa 15060 gaaagtcaca ggggggggcc agtcttaaaa acctactccc gaagcccagt ccacacaagt 15120 accaggaacg tgagagcagc aaaagggttt atagggttcc ctcaagtaat tcggcaggac 15180 caagacactg atcatccgga gaatatggaa gcttacgaga cagtcagtgc atttatcacg 15240 actgatctca agaagtactg ccttaattgg agatatgaga ccatcagctt gtttgcacag 15300 aggctaaatg agatttacgg attgccctca tttttccagt ggctgcataa gaggcttgag 15360 acctctgtcc tgtatgtaag tgaccctcat tgcccccccg accttgacgc ccatatcccg 15420 ttatataaag tccccaatga tcaaatcttc attaagtacc ctatgggagg tatagaaggg 15480 tattgtcaga agctgtggac catcagcacc attccctatc tatacctggc tgcttatgag 15540 agcggagtaa ggattgcttc gttagtgcaa ggggacaatc agaccatagc cgtaacaaaa 15600 agggtaccca gcacatggcc ctacaacctt aagaaacggg aagctgctag agtaactaga 15660 gattactttg taattcttag gcaaaggcta catgatattg gccatcacct caaggcaaat 15720 gagacaattg tttcatcaca tttttttgtc tattcaaaag gaatatatta tgatgggcta 15780 cttgtgtccc aatcactcaa gagcatcgca agatgtgtat tctggtcaga gactatagtt 15840 gatgaaacaa gggcagcatg cagtaatatt gctacaacaa tggctaaaag catcgagaga 15900 ggttatgacc gttaccttgc atattccctg aacgtcctaa aagtgataca gcaaattctg 15960 atctctcttg gcttcacaat caattcaacc atgacccggg atgtagtcat acccctcctc 16020 acaaacaacg acctcttaat aaggatggca ctgttgcccg ctcctattgg ggggatgaat 16080 tatctgaata tgagcaggct gtttgtcaga aacatcggtg atccagtaac atcatcaatt 16140 gctgatctca agagaatgat tctcgcctca ctaatgcctg aagagaccct ccatcaagta 16200 atgacacaac aaccggggga ctcttcattc ctagactggg ctagcgaccc ttactcagca 16260 aatcttgtat gtgtccagag catcactaga ctcctcaaga acataactgc aaggtttgtc 16320 ctgatccata gtccaaaccc aatgttaaaa ggattattcc atgatgacag taaagaagag 16380 gacgagggac tggcggcatt cctcatggac aggcatatta tagtacctag ggcagctcat 16440 gaaatcctgg atcatagtgt cacaggggca agagagtcta ttgcaggcat gctggatacc 16500 acaaaaggct tgattcgagc cagcatgagg aagggggggt taacctctcg agtgataacc 16560 agattgtcca attatgacta tgaacaattc agagcaggga tggtgctatt gacaggaaga 16620 aagagaaatg tcctcattga caaagagtca tgttcagtgc agctggcgag agctctaaga 16680 agccatatgt gggcgaggct agctcgagga cggcctattt acggccttga ggtccctgat 16740 gtactagaat ctatgcgagg ccaccttatt cggcgtcatg agacatgtgt catctgcgag 16800 tgtggatcag tcaactacgg atggtttttt gtcccctcgg gttgccaact ggatgatatt 16860 gacaaggaaa catcatcctt gagagtccca tatattggtt ctaccactga tgagagaaca 16920 gacatgaagc ttgccttcgt aagagcccca agtcgatcct tgcgatctgc tgttagaata 16980 gcaacagtgt actcatgggc ttacggtgat gatgatagct cttggaacga agcctggttg 17040 ttggctaggc aaagggccaa tgtgagcctg gaggagctaa gggtgatcac tcccatctca 17100 acttcgacta atttagcgca taggttgagg gatcgtagca ctcaagtgaa atactcaggt 17160 acatcccttg tccgagtggc gaggtatacc acaatctcca acgacaatct ctcatttgtc 17220 atatcagata agaaggttga tactaacttt atataccaac aaggaatgct tctagggttg 17280 ggtgttttag aaacattgtt tcgactcgag aaagataccg gatcatctaa cacggtatta 17340 catcttcacg tcgaaacaga ttgttgcgtg atcccgatga tagatcatcc caggataccc 17400 agctcccgca agctagagct gagggcagag ctatgtacca acccattgat atatgataat 17460 gcacctttaa ttgacagaga tgcaacaagg ctatacaccc agagccatag gaggcacctt 17520 gtggaatttg ttacatggtc cacaccccaa ctatatcaca ttttagctaa gtccacagca 17580 ctatctatga ttgacctggt aacaaaattt gagaaggacc atatgaatga aatttcagct 17640 ctcatagggg atgacgatat caatagtttc ataactgagt ttctgctcat agagccaaga 17700 ttattcacta tctacttggg ccagtgtgcg gccatcaatt gggcatttga tgtacattat 17760 catagaccat cagggaaata tcagatgggt gagctgttgt catcgttcct ttctagaatg 17820 agcaaaggag tgtttaaggt gcttgtcaat gctctaagcc acccaaagat ctacaagaaa 17880 ttctggcatt gtggtattat agagcctatc catggtcctt cacttgatgc tcaaaacttg 17940 cacacaactg tgtgcaacat ggtttacaca tgctatatga cctacctcga cctgttgttg 18000 aatgaagagt tagaagagtt cacatttctc ttgtgtgaaa gcgacgagga tgtagtaccg 18060 gacagattcg acaacatcca ggcaaaacac ttatgtgttc tggcagattt gtactgtcaa 18120 ccagggacct gcccaccaat tcgaggtcta agaccggtag agaaatgtgc agttctaacc 18180 gaccatatca aggcagaggc tatgttatct ccagcaggat cttcgtggaa cataaatcca 18240 attattgtag accattactc atgctctctg acttatctcc ggcgaggatc gatcaaacag 18300 ataagattga gagttgatcc aggattcatt ttcgacgccc tcgctgaggt aaatgtcagt 18360 cagccaaaga tcggcagcaa caacatctca aatatgagca tcaaggcttt cagaccccca 18420 cacgatgatg ttgcaaaatt gctcaaagat atcaacacaa gcaagcacaa tcttcccatt 18480 tcagggggca atctcgccaa ttatgaaatc catgctttcc gcagaatcgg gttgaactca 18540 tctgcttgct acaaagctgt tgagatatca acattaatta ggagatgcct tgagccaggg 18600 gaggacggct tgttcttggg tgagggatcg ggttctatgt tgatcactta taaagagata 18660 cttaaactaa acaagtgctt ctataatagt ggggtttccg ccaattctag atctggtcaa 18720 agggaattag caccctatcc ctccgaagtt ggccttgtcg aacacagaat gggagtaggt 18780 aatattgtca aagtgctctt taacgggagg cccgaagtca cgtgggtagg cagtgtagat 18840 tgcttcaatt tcatagttag taatatccct acctctagtg tggggtttat ccattcagat 18900 atagagacct tgcctgacaa agatactata gagaagctag aggaattggc agccatctta 18960 tcgatggctc tgctcctggg caaaatagga tcaatactgg tgattaagct tatgcctttc 19020 agcggggatt ttgttcaggg atttataagt tatgtagggt ctcattatag agaagtgaac 19080 cttgtatacc ctagatacag caacttcatc tctactgaat cttatttggt tatgacagat 19140 ctcaaggcta accggctaat gaatcctgaa aagattaagc agcagataat tgaatcatct 19200 gtgaggactt cacctggact tataggtcac atcctatcca ttaagcaact aagctgcata 19260 caagcaattg tgggagacgc agttagtaga ggtgatatca atcctactct gaaaaaactt 19320 acacctatag agcaggtgct gatcaattgc gggttggcaa ttaacggacc taagctgtgc 19380 aaagaattga tccaccatga tgttgcctca gggcaagatg gattgcttaa ttctatactc 19440 atcctctaca gggagttggc aagattcaaa gacaaccaaa gaagtcaaca agggatgttc 19500 cacgcttacc ccgtattggt aagtagcagg caacgagaac ttatatctag gatcacccgc 19560 aaattctggg ggcacattct tctttactcc gggaacaaaa agttgataaa taagtttatc 19620 cagaatctca agtccggcta tctgatacta gacttacacc agaatatctt cgttaagaat 19680 ctatccaagt cagagaaaca gattattatg acggggggtt tgaaacgtga gtgggttttt 19740 aaggtaacag tcaaggagac caaagaatgg tataagttag tcggatacag tgccctgatt 19800 aaggactaat tggttgaact ccggaaccct aatcctgccc taggtggtta ggcattattt 19860 gcaatatatt aaagaaaact ttgaaaatac gaagtttcta ttcccagctt tgtctggtgg 19920 ccggcatggt cccagcctcc tcgctggcgc cggctgggca acattccgag gggaccgtcc 19980 cctcggtaat ggcgaatggg acgcggccga tccggctgct aacaaagccc gaaaggaagc 20040 tgagttggct gctgccaccg ctgagcaata actagcataa ccccttgggg cctctaaacg 20100 ggtcttgagg ggttttttgc tgaaaggagg aactatatcc ggatgcggcc gccatgaaca 20160 ataaaactgt ctgcttacat aaacagtaat acaaggggtg ttatgagcca tattcaacgg 20220 gaaacgtcga ggccgcgatt aaattccaac atggatgctg atttatatgg gtataaatgg 20280 gctcgcgata atgtcgggca atcaggtgcg acaatctatc gcttgtatgg gaagcccgat 20340 gcgccagagt tgtttctgaa acatggcaaa ggtagcgttg ccaatgatgt tacagatgag 20400 atggtcagac taaactggct gacggaattt atgcctcttc cgaccatcaa gcattttatc 20460 cgtactcctg atgatgcatg gttactcacc actgcgatcc ccggaaaaac agcattccag 20520 gtattagaag aatatcctga ttcaggtgaa aatattgttg atgcgctggc agtgttcctg 20580 cgccggttgc attcgattcc tgtttgtaat tgtcctttta acagcgatcg tgtatttcgt 20640 ctcgctcagg cgcaatcacg aatgaataac ggtttggttg atgcgagtga ttttgatgac 20700 gagcgtaatg gctggcctgt tgaacaagtc tggaaagaaa tgcataaact tttgccattc 20760 tcaccggatt cagtcgtcac tcatggtgat ttctcacttg ataaccttat ttttgacgag 20820 gggaaattaa taggttgtat tgatgttgga cgagtcggaa tcgcagaccg ataccaggat 20880 cttgccatcc tatggaactg cctcggtgag ttttctcctt cattacagaa acggcttttt 20940 caaaaatatg gtattgataa tcctgatatg aataaattgc agtttcattt gatgctcgat 21000 gagtttttct aatcagaatt ggttaattgg ttgtaacatt attcagattg ggccccgttc 21060 cactgagcgt cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg 21120 cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg 21180 gatcaagagc taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca 21240 aatactgttc ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg 21300 cctacatacc tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg 21360 tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga 21420 acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac 21480 ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat 21540 ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc 21600 tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga 21660 tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc 21720 ctggcctttt gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg 21780 gataaccgta ttaccgctag 21800 <210> 35 <211> 21800 <212> DNA <213> Artificial sequence <220> <223> pKM-ATU3-S_2019-nCoV (optimized sequence) <400> 35 gcgatcgcta atacgactca ctatagggcc aactttgttt ggtctgatga gtccgtgagg 60 acgaaacccg gagtcccggg tcaccaaaca aagttgggta aggatagttc aatcaatgat 120 catcttctag tgcacttagg attcaagatc ctattatcag ggacaagagc aggattaggg 180 atatccgaga tggccacact tttaaggagc ttagcattgt tcaaaagaaa caaggacaaa 240 ccacccatta catcaggatc cggtggagcc atcagaggaa tcaaacacat tattatagta 300 ccaatccctg gagattcctc aattaccact cgatccagac ttctggaccg gttggtgagg 360 ttaattggaa acccggatgt gagcgggccc aaactaacag gggcactaat aggtatatta 420 tccttatttg tggagtctcc aggtcaattg attcagagga tcaccgatga ccctgacgtt 480 agcataaggc tgttagaggt tgtccagagt gaccagtcac aatctggcct taccttcgca 540 tcaagaggta ccaacatgga ggatgaggcg gaccaatact tttcacatga tgatccaatt 600 agtagtgatc aatccaggtt cggatggttc gggaacaagg aaatctcaga tattgaagtg 660 caagaccctg agggattcaa catgattctg ggtaccatcc tagcccaaat ttgggtcttg 720 ctcgcaaagg cggttacggc cccagacacg gcagctgatt cggagctaag aaggtggata 780 aagtacaccc aacaaagaag ggtagttggt gaatttagat tggagagaaa atggttggat 840 gtggtgagga acaggattgc cgaggacctc tccttacgcc gattcatggt cgctctaatc 900 ctggatatca agagaacacc cggaaacaaa cccaggattg ctgaaatgat atgtgacatt 960 gatacatata tcgtagaggc aggattagcc agttttatcc tgactattaa gtttgggata 1020 gaaactatgt atcctgctct tggactgcat gaatttgctg gtgagttatc cacacttgag 1080 tccttgatga acctttacca gcaaatgggg gaaactgcac cctacatggt aatcctggag 1140 aactcaattc agaacaagtt cagtgcagga tcataccctc tgctctggag ctatgccatg 1200 ggagtaggag tggaacttga aaactccatg ggaggtttga actttggccg atcttacttt 1260 gatccagcat attttagatt agggcaagag atggtaagga ggtcagctgg aaaggtcagt 1320 tccacattgg catctgaact cggtatcact gccgaggatg caaggcttgt ttcagagatt 1380 gcaatgcata ctactgagga caagatcagt agagcggttg gacccagaca agcccaagta 1440 tcatttctac acggtgatca aagtgagaat gagctaccga gattgggggg caaggaagat 1500 aggagggtca aacagagtcg aggagaagcc agggagagct acagagaaac cgggcccagc 1560 agagcaagtg atgcgagagc tgcccatctt ccaaccggca cacccctaga cattgacact 1620 gcaacggagt ccagccaaga tccgcaggac agtcgaaggt cagctgacgc cctgcttagg 1680 ctgcaagcca tggcaggaat ctcggaagaa caaggctcag acacggacac ccctatagtg 1740 tacaatgaca gaaatcttct agactaggtg cgagaggccg agggccagaa caacatccgc 1800 ctaccatcca tcattgttat aaaaaactta ggaaccaggt ccacacagcc gccagcccat 1860 caaccatcca ctcccacgat tggagccaat ggcagaagag caggcacgcc atgtcaaaaa 1920 cggactggaa tgcatccggg ctctcaaggc cgagcccatc ggctcactgg ccatcgagga 1980 agctatggca gcatggtcag aaatatcaga caacccagga caggagcgag ccacctgcag 2040 ggaagagaag gcaggcagtt cgggtctcag caaaccatgc ctctcagcaa ttggatcaac 2100 tgaaggcggt gcacctcgca tccgcggtca gggacctgga gagagcgatg acgacgctga 2160 aactttggga atccccccaa gaaatctcca ggcatcaagc actgggttac agtgttatta 2220 cgtttatgat cacagcggtg aagcggttaa gggaatccaa gatgctgact ctatcatggt 2280 tcaatcaggc cttgatggtg atagcaccct ctcaggagga gacaatgaat ctgaaaacag 2340 cgatgtggat attggcgaac ctgataccga gggatatgct atcactgacc ggggatctgc 2400 tcccatctct atggggttca gggcttctga tgttgaaact gcagaaggag gggagatcca 2460 cgagctcctg agactccaat ccagaggcaa caactttccg aagcttggga aaactctcaa 2520 tgttcctccg cccccggacc ccggtagggc cagcacttcc gggacaccca ttaaaaaggg 2580 cacagacgcg agattagcct catttggaac ggagatcgcg tctttattga caggtggtgc 2640 aacccaatgt gctcgaaagt caccctcgga accatcaggg ccaggtgcac ctgcggggaa 2700 tgtccccgag tgtgtgagca atgccgcact gatacaggag tggacacccg aatctggtac 2760 cacaatctcc ccgagatccc agaataatga agaaggggga gactattatg atgatgagct 2820 gttctctgat gtccaagata ttaaaacagc cttggccaaa atacacgagg ataatcagaa 2880 gataatctcc aagctagaat cactgctgtt attgaaggga gaagttgagt caattaagaa 2940 gcagatcaac aggcaaaata tcagcatatc caccctggaa ggacacctct caagcatcat 3000 gatcgccatt cctggacttg ggaaggatcc caacgacccc actgcagatg tcgaaatcaa 3060 tcccgacttg aaacccatca taggcagaga ttcaggccga gcactggccg aagttctcaa 3120 gaaacccgtt gccagccgac aactccaagg aatgacaaat ggacggacca gttccagagg 3180 acagctgctg aaggaatttc agctaaagcc gatcgggaaa aagatgagct cagccgtcgg 3240 gtttgttcct gacaccggcc ctgcatcacg cagtgtaatc cgctccatta taaaatccag 3300 ccggctagag gaggatcgga agcgttacct gatgactctc cttgatgata tcaaaggagc 3360 caatgatctt gccaagttcc accagatgct gatgaagata ataatgaagt agctacagct 3420 caacttacct gccaacccca tgccagtcga cccaactagt acaacctaaa tccattataa 3480 aaaacttagg agcaaagtga ttgcctccca aggtccacaa tgacagagac ctacgacttc 3540 gacaagtcgg catgggacat caaagggtcg atcgctccga tacaacccac cacctacagt 3600 gatggcaggc tggtgcccca ggtcagagtc atagatcctg gtctaggcga caggaaggat 3660 gaatgcttta tgtacatgtt tctgctgggg gttgttgagg acagcgattc cctagggcct 3720 ccaatcgggc gagcatttgg gttcctgccc ttaggtgttg gcagatccac agcaaagccc 3780 gaaaaactcc tcaaagaggc cactgagctt gacatagttg ttagacgtac agcagggctc 3840 aatgaaaaac tggtgttcta caacaacacc ccactaactc tcctcacacc ttggagaaag 3900 gtcctaacaa cagggagtgt cttcaacgca aaccaagtgt gcaatgcggt taatctgata 3960 ccgctcgata ccccgcagag gttccgtgtt gtttatatga gcatcacccg tctttcggat 4020 aacgggtatt acaccgttcc tagaagaatg ctggaattca gatcggtcaa tgcagtggcc 4080 ttcaacctgc tggtgaccct taggattgac aaggcgatag gccctgggaa gatcatcgac 4140 aatacagagc aacttcctga ggcaacattt atggtccaca tcgggaactt caggagaaag 4200 aagagtgaag tctactctgc cgattattgc aaaatgaaaa tcgaaaagat gggcctggtt 4260 tttgcacttg gtgggatagg gggcaccagt cttcacatta gaagcacagg caaaatgagc 4320 aagactctcc atgcacaact cgggttcaag aagaccttat gttacccgct gatggatatc 4380 aatgaagacc ttaatcgatt actctggagg agcagatgca agatagtaag aatccaggca 4440 gttttgcagc catcagttcc tcaagaattc cgcatttacg acgacgtgat cataaatgat 4500 gaccaaggac tattcaaagt tctgtagacc gtagtgccca gcaatgcccg aaaacgaccc 4560 ccctcacaat gacagccaga aggcccggac aaaaaagccc cctccgaaag actccacgga 4620 ccaagcgaga ggccagccag cagccgacgg caagcgcgaa caccaggcgg ccccagcaca 4680 gaacagccct gacacaaggc caccaccagc caccccaatc tgcatcctcc tcgtgggacc 4740 cccgaggacc aacccccaag gctgcccccg atccaaacca ccaaccgcat ccccaccacc 4800 cccgggaaag aaacccccag caattggaag gcccctcccc ctcttcctca acacaagaac 4860 tccacaaccg aaccgcacaa gcgaccgagg tgacccaacc gcaggcatcc gactccctag 4920 acagatcctc tctccccggc aaactaaaca aaacttaggg ccaaggaaca tacacaccca 4980 acagaaccca gaccccggcc cacggcgccg cgcccccaac ccccgacaac cagagggagc 5040 ccccaaccaa tcccgccggc tcccccggtg cccacaggca gggacaccaa cccccgaaca 5100 gacccagcac ccaaccatcg acaatccaag acgggggggc ccccccaaaa aaaggccccc 5160 aggggccgac agccagcacc gcgaggaagc ccacccaccc cacacacgac cacggcaacc 5220 aaaccagaac ccagaccacc ctgggccacc agctcccaga ctcggccatc accccgcaga 5280 aaggaaaggc cacaacccgc gcaccccagc cccgatccgg cggggagcca cccaacccga 5340 accagcaccc aagagcgatc cccgaaggac ccccgaaccg caaaggacat cagtatccca 5400 cagcctctcc aagtcccccg gtctcctcct cttctcgaag ggaccaaaag atcaatccac 5460 cacacccgac gacactcaac tccccacccc taaaggagac accgggaatc ccagaatcaa 5520 gactcatcca atgtccatca tgggtctcaa ggtgaacgtc tctgccatat tcatggcagt 5580 actgttaact ctccaaacac ccaccggtca aatccattgg ggcaatctct ctaagatagg 5640 ggtggtagga ataggaagtg caagctacaa agttatgact cgttccagcc atcaatcatt 5700 agtcataaaa ttaatgccca atataactct cctcaataac tgcacgaggg tagagattgc 5760 agaatacagg agactactga gaacagtttt ggaaccaatt agagatgcac ttaatgcaat 5820 gacccagaat ataagaccgg ttcagagtgt agcttcaagt aggagacaca agagatttgc 5880 gggagtagtc ctggcaggtg cggccctagg cgttgccaca gctgctcaga taacagccgg 5940 cattgcactt caccagtcca tgctgaactc tcaagccatc gacaatctga gagcgagcct 6000 ggaaactact aatcaggcaa ttgagacaat cagacaagca gggcaggaga tgatattggc 6060 tgttcagggt gtccaagact acatcaataa tgagctgata ccgtctatga accaactatc 6120 ttgtgattta atcggccaga agctcgggct caaattgctc agatactata cagaaatcct 6180 gtcattattt ggccccagtt tacgggaccc catatctgcg gagatatcta tccaggcttt 6240 gagctatgcg cttggaggag acatcaataa ggtgttagaa aagctcggat acagtggagg 6300 tgatttactg ggcatcttag agagcggagg aataaaggcc cggataactc acgtcgacac 6360 agagtcctac ttcattgtcc tcagtatagc ctatccgacg ctgtccgaga ttaagggggt 6420 gattgtccac cggctagagg gggtctcgta caacataggc tctcaagagt ggtataccac 6480 tgtgcccaag tatgttgcaa cccaagggta ccttatctcg aattttgatg agtcatcgtg 6540 tactttcatg ccagagggga ctgtgtgcag ccaaaatgcc ttgtacccga tgagtcctct 6600 gctccaagaa tgcctccggg ggtacaccaa gtcctgtgct cgtacactcg tatccgggtc 6660 ttttgggaac cggttcattt tatcacaagg gaacctaata gccaattgtg catcaatcct 6720 ttgcaagtgt tacacaacag gaacgatcat taatcaagac cctgacaaga tcctaacata 6780 cattgctgcc gatcactgcc cggtagtcga ggtgaacggc gtgaccatcc aagtcgggag 6840 caggaggtat ccagacgctg tgtacttgca cagaattgac ctcggtcctc ccatatcatt 6900 ggagaggttg gacgtaggga caaatctggg gaatgcaatt gctaagttgg aggatgccaa 6960 ggaattgttg gagtcatcgg accagatatt gaggagtatg aaaggtttat cgagcactag 7020 catagtctac atcctgattg cagtgtgtct tggagggttg atagggatcc ccgctttaat 7080 atgttgctgc agggggcgtt gtaacaaaaa gggagaacaa gttggtatgt caagaccagg 7140 cctaaagcct gatcttacgg gaacatcaaa atcctatgta aggtcgctct gatcctctac 7200 aactcttgaa acacaaatgt cccacaagtc tcctcttcgt catcaagcaa ccaccgcacc 7260 cagcatcaag cccacctgaa attatctccg gcttccctct ggccgaacaa tatcggtagt 7320 taatcaaaac ttagggtgca agatcatcca caatgtcacc acaacgagac cggataaatg 7380 ccttctacaa agataacccc catcccaagg gaagtaggat agtcattaac agagaacatc 7440 ttatgattga tagaccttat gttttgctgg ctgttctgtt tgtcatgttt ctgagcttga 7500 tcgggttgct agccattgca ggcattagac ttcatcgggc agccatctac accgcagaga 7560 tccataaaag cctcagcacc aatctagatg taactaactc aatcgagcat caggtcaagg 7620 acgtgctgac accactcttc aaaatcatcg gtgatgaagt gggcctgagg acacctcaga 7680 gattcactga cctagtgaaa ttaatctctg acaagattaa attccttaat ccggataggg 7740 agtacgactt cagagatctc acttggtgta tcaacccgcc agagagaatc aaattggatt 7800 atgatcaata ctgtgcagat gtggctgctg aagagctcat gaatgcattg gtgaactcaa 7860 ctctactgga gaccagaaca accaatcagt tcctagctgt ctcaaaggga aactgctcag 7920 ggcccactac aatcagaggt caattctcaa acatgtcgct gtccctgtta gacttgtatt 7980 taggtcgagg ttacaatgtg tcatctatag tcactatgac atcccaggga atgtatgggg 8040 gaacttacct agtggaaaag cctaatctga gcagcaaaag gtcagagttg tcacaactga 8100 gcatgtaccg agtgtttgaa gtaggtgtta tcagaaatcc gggtttgggg gctccggtgt 8160 tccatatgac aaactatctt gagcaaccag tcagtaatga tctcagcaac tgtatggtgg 8220 ctttggggga gctcaaactc gcagcccttt gtcacgggga agattctatc acaattccct 8280 atcagggatc agggaaaggt gtcagcttcc agctcgtcaa gctaggtgtc tggaaatccc 8340 caaccgacat gcaatcctgg gtccccttat caacggatga tccagtgata gacaggcttt 8400 acctctcatc tcacagaggt gttatcgctg acaatcaagc aaaatgggct gtcccgacaa 8460 cacgaacaga tgacaagttg cgaatggaga catgcttcca acaggcgtgt aagggtaaaa 8520 tccaagcact ctgcgagaat cccgagtggg caccattgaa ggataacagg attccttcat 8580 acggggtctt gtctgttgat ctgagtctga cagttgagct taaaatcaaa attgcttcgg 8640 gattcgggcc attgatcaca cacggttcag ggatggacct atacaaatcc aaccacaaca 8700 atgtgtattg gctgactatc ccgccaatga agaacctagc cttaggtgta atcaacacat 8760 tggagtggat accgagattc aaggttagtc cctacctctt cactgtccca attaaggaag 8820 caggcgaaga ctgccatgcc ccaacatacc tacctgcgga ggtggatggt gatgtcaaac 8880 tcagttccaa tctggtgatt ctacctggtc aagatctcca atatgttttg gcaacctacg 8940 atacttccag ggttgaacat gctgtggttt attacgttta cagcccaagc cgctcatttt 9000 cttactttta tccttttagg ttgcctataa agggggtccc catcgaatta caagtggaat 9060 gcttcacatg ggaccaaaaa ctctggtgcc gtcacttctg tgtgcttgcg gactcagaat 9120 ctggtggaca tatcactcac tctgggatgg tgggcatggg agtcagctgc acagtcaccc 9180 gggaagatgg aaccaatcgc agatagggct gctagtgaac caatcacatg atgtcaccca 9240 gacatcaggc atacccacta gtctaccctc catcattgtt ataaaaaact taggaaccag 9300 gtccacacag ccgccagccc atcaacgcgt acggccacca tgttcgtgtt tctggtgctg 9360 ctgccactgg tgtccagtca gtgcgtgaac ctgaccacac gaacacagct gccaccagcc 9420 tacaccaata gcttcacccg cggagtgtac taccccgaca aggtgttccg cagcagcgtg 9480 ctgcatagca cccaggatct gtttctgccc ttcttcagca acgtgacctg gttccacgcc 9540 atccacgtgt ccggcaccaa tggcaccaag cgcttcgata atcccgtgct gcccttcaac 9600 gatggcgtgt actttgccag caccgagaag tccaatatca tccgcggctg gatcttcggc 9660 accacactgg atagcaagac ccagagcctg ctgatcgtga acaacgccac caacgtggtc 9720 atcaaagtgt gcgagttcca gttctgcaac gaccccttcc tgggcgtcta ctaccacaag 9780 aacaacaaga gctggatgga aagcgagttc cgcgtgtaca gcagcgccaa caactgcacc 9840 ttcgagtacg tgtcccagcc attcctgatg gacctggaag gcaagcaggg caacttcaag 9900 aacctgcgcg agttcgtgtt caagaacatc gacggctact tcaaaatcta cagcaagcac 9960 accccaatca acctcgtgcg cgatctgcca cagggattca gtgctctgga acccctggtg 10020 gatctgccca tcggcatcaa cattacccgc tttcagacac tgctggccct gcaccgcagt 10080 tacttgacac caggcgatag cagcagtgga tggacagctg gtgccgccgc ttactacgtt 10140 ggatatctgc agccacgcac ctttctgctg aagtacaacg agaacggcac catcaccgac 10200 gccgtggatt gtgctctcga tcccctgagc gagacaaagt gcaccctgaa gtccttcacc 10260 gtcgagaagg gcatctacca gaccagcaat ttccgcgtgc agcccaccga gagcatcgtg 10320 cgcttcccca atatcaccaa tctgtgcccc ttcggcgagg tgttcaatgc cacacgcttt 10380 gcctccgtgt acgcctggaa tcgcaagcgc attagcaact gcgtggccga ctactccgtg 10440 ctgtacaata gcgccagctt cagcaccttc aagtgctacg gcgtgtcacc caccaagctg 10500 aacgacctgt gcttcaccaa tgtgtacgcc gacagcttcg tgatccgcgg agatgaagtg 10560 cgacagattg ccccaggcca gaccggcaag atcgccgact acaattacaa gctgcccgac 10620 gacttcaccg gctgcgtgat cgcctggaac agcaacaacc tggattccaa agtcggcggc 10680 aactacaact acctgtaccg cctgttccgc aagagcaatc tgaagccctt cgagcgcgac 10740 atcagcaccg aaatctacca ggccggaagc accccatgca acggcgtgga aggcttcaac 10800 tgctacttcc cactgcagtc ctacggattt cagcccacaa atggcgtggg ctaccagcca 10860 tatcgagtgg tggtgctgag cttcgaactg ctgcatgctc cagctaccgt gtgcggcccc 10920 aagaagagta ccaacctggt caagaacaaa tgcgtgaact tcaacttcaa cggcctgacc 10980 ggaaccggcg tgctgaccga gagtaacaag aagttcctgc cattccagca gtttggccgc 11040 gacattgccg atacaaccga tgccgttcgc gatccccaga ccttggagat cctggatatt 11100 accccatgct ccttcggcgg cgtgtccgtg attacaccag gcaccaatac cagcaaccag 11160 gtggccgttc tgtaccagga tgtgaattgc acagaggtgc ccgtggccat tcacgccgat 11220 caattgacac caacatggcg cgtgtactcc accggcagca atgtgtttca aacccgcgct 11280 ggatgcctga ttggagccga gcacgtgaac aatagctacg agtgcgatat ccccatcgga 11340 gccggaatct gcgcctccta tcagacccag accaatagtc cacgacgagc ccgaagtgtg 11400 gccagccaga gcatcattgc ctataccatg agcctgggcg ccgagaatag cgtggcctac 11460 tccaacaaca gcattgctat ccccaccaac ttcaccatca gcgtgaccac cgagatcctg 11520 ccagtgtcca tgaccaagac cagcgtggac tgcaccatgt acatctgcgg agatagcacc 11580 gagtgcagca acctgctgct gcagtacgga agtttctgca cccagctgaa tcgcgccctg 11640 acaggcattg ccgtggaaca ggataagaac acccaagagg tgttcgccca agtgaagcaa 11700 atctacaaga ccccaccaat caaggatttc ggcggcttca atttcagcca gattctgccc 11760 gatccaagca agcccagcaa gcgcagcttc atcgaggacc tgctgttcaa caaagtgaca 11820 ctggccgacg ccggattcat caagcagtat ggcgattgcc tgggcgatat tgccgcacgc 11880 gatctgattt gcgcccagaa gtttaacgga ctgaccgtcc tgccaccact gctgacagat 11940 gagatgatcg cccagtacac aagtgccctg ctggccggaa ccattaccag cggatggaca 12000 tttggagccg gtgccgctct gcagattccc ttcgctatgc agatggccta ccgcttcaat 12060 ggcattggcg tgacccagaa tgtgctgtac gagaaccaga agctgatcgc caaccagttc 12120 aacagcgcca tcggcaagat tcaggacagc ctgagtagta ccgccagcgc tctgggaaag 12180 ctgcaggatg tggtcaacca gaacgctcag gccctgaaca ccctggttaa gcagctgagc 12240 agcaacttcg gcgccatcag tagcgtgctg aacgatatcc tgagccgcct ggataaggtg 12300 gaagccgagg tgcagatcga tcgcctgatt accggacgcc tgcagtccct gcagacctat 12360 gtgacacagc agctgatccg agccgccgag attcgagcta gtgctaatct ggccgccacc 12420 aagatgagcg aatgtgtgct gggacagagc aagcgcgtgg acttttgcgg caagggatac 12480 cacctgatga gcttcccaca gagtgctcca cacggcgtgg tgtttctgca tgtgacctac 12540 gtgcccgctc aagagaagaa tttcaccacc gctccagcca tctgccacga cggaaaggcc 12600 cattttccac gcgagggcgt gttcgttagc aacggcactc attggttcgt cacccagcgc 12660 aacttctacg agccccagat catcaccacc gacaacacct tcgtcagcgg caactgcgac 12720 gtcgtgatcg gcattgtgaa caacaccgtg tacgatccac tgcagcccga gctggacagc 12780 ttcaaagagg aactggacaa gtactttaag aaccacacaa gccccgacgt ggacctggga 12840 gacattagcg gaatcaacgc cagcgtggtc aacatccaga aagagattga ccgcctgaac 12900 gaggtggcca agaatctgaa cgagagcctg atcgacctgc aagaactggg caaatacgag 12960 cagtacatta agtggccctg gtacatctgg ctgggcttca ttgccggact gattgccatc 13020 gtgatggtca ccattatgct gtgctgcatg accagttgct gcagctgcct gaagggatgc 13080 tgcagttgcg gaagctgctg caagttcgac gaggatgata gcgagccagt gctgaagggc 13140 gtcaagctgc actacacctg ataacgagcg cgcagcgctt agacgtctcg cgatcgatgc 13200 tagtgtgaaa tagacatcag aattaagaaa aacgtagggt ccaagtggtt ccccgttatg 13260 gactcgctat ctgtcaacca gatcttatac cctgaagttc acctagatag cccgatagtt 13320 accaataaga tagtagccat cctggagtat gctcgagtcc ctcacgctta cagcctggag 13380 gaccctacac tgtgtcagaa catcaagcac cgcctaaaaa acggattttc caaccaaatg 13440 attataaaca atgtggaagt tgggaatgtc atcaagtcca agcttaggag ttatccggcc 13500 cactctcata ttccatatcc aaattgtaat caggatttat ttaacataga agacaaagag 13560 tcaacgagga agatccgtga actcctcaaa aaggggaatt cgctgtactc caaagtcagt 13620 gataaggttt tccaatgctt aagggacact aactcacggc ttggcctagg ctccgaattg 13680 agggaggaca tcaaggagaa agttattaac ttgggagttt acatgcacag ctcccagtgg 13740 tttgagccct ttctgttttg gtttacagtc aagactgaga tgaggtcagt gattaaatca 13800 caaacccata cttgccatag gaggagacac acacctgtat tcttcactgg tagttcagtt 13860 gagttgctaa tctctcgtga ccttgttgct ataatcagta aagagtctca acatgtatat 13920 tacctgacat ttgaactggt tttgatgtat tgtgatgtca tagaggggag gttaatgaca 13980 gagaccgcta tgactattga tgctaggtat acagagcttc taggaagagt cagatacatg 14040 tggaaactga tagatggttt cttccctgca ctcgggaatc caacttatca aattgtagcc 14100 atgctggagc ctctttcact tgcttacctg cagctgaggg atataacagt agaactcaga 14160 ggtgctttcc ttaaccactg ctttactgaa atacatgatg ttcttgacca aaacgggttt 14220 tctgatgaag gtacttatca tgagttaact gaagctctag attacatttt cataactgat 14280 gacatacatc tgacagggga gattttctca tttttcagaa gtttcggcca ccccagactt 14340 gaagcagtaa cggctgctga aaatgttagg aaatacatga atcagcctaa agtcattgtg 14400 tatgagactc tgatgaaagg tcatgccata ttttgtggaa tcataatcaa cggctatcgt 14460 gacaggcacg gaggcagttg gccaccgctg accctccccc tgcatgctgc agacacaatc 14520 cggaatgctc aagcttcagg tgaagggtta acacatgagc agtgcgttga taactggaaa 14580 tcttttgctg gagtgaaatt tggctgcttt atgcctctta gcctggatag tgatctgaca 14640 atgtacctaa aggacaaggc acttgctgct ctccaaaggg aatgggattc agtttacccg 14700 aaagagttcc tgcgttacga ccctcccaag ggaaccgggt cacggaggct tgtagatgtt 14760 ttccttaatg attcgagctt tgacccatat gatgtgataa tgtatgttgt aagtggagct 14820 tacctccatg accctgagtt caacctgtct tacagcctga aagaaaagga gatcaaggaa 14880 acaggtagac tttttgctaa aatgacttac aaaatgaggg catgccaagt gattgctgaa 14940 aatctaatct caaacgggat tggcaaatat tttaaggaca atgggatggc caaggatgag 15000 cacgatttga ctaaggcact ccacactcta gctgtctcag gagtccccaa agatctcaaa 15060 gaaagtcaca ggggggggcc agtcttaaaa acctactccc gaagcccagt ccacacaagt 15120 accaggaacg tgagagcagc aaaagggttt atagggttcc ctcaagtaat tcggcaggac 15180 caagacactg atcatccgga gaatatggaa gcttacgaga cagtcagtgc atttatcacg 15240 actgatctca agaagtactg ccttaattgg agatatgaga ccatcagctt gtttgcacag 15300 aggctaaatg agatttacgg attgccctca tttttccagt ggctgcataa gaggcttgag 15360 acctctgtcc tgtatgtaag tgaccctcat tgcccccccg accttgacgc ccatatcccg 15420 ttatataaag tccccaatga tcaaatcttc attaagtacc ctatgggagg tatagaaggg 15480 tattgtcaga agctgtggac catcagcacc attccctatc tatacctggc tgcttatgag 15540 agcggagtaa ggattgcttc gttagtgcaa ggggacaatc agaccatagc cgtaacaaaa 15600 agggtaccca gcacatggcc ctacaacctt aagaaacggg aagctgctag agtaactaga 15660 gattactttg taattcttag gcaaaggcta catgatattg gccatcacct caaggcaaat 15720 gagacaattg tttcatcaca tttttttgtc tattcaaaag gaatatatta tgatgggcta 15780 cttgtgtccc aatcactcaa gagcatcgca agatgtgtat tctggtcaga gactatagtt 15840 gatgaaacaa gggcagcatg cagtaatatt gctacaacaa tggctaaaag catcgagaga 15900 ggttatgacc gttaccttgc atattccctg aacgtcctaa aagtgataca gcaaattctg 15960 atctctcttg gcttcacaat caattcaacc atgacccggg atgtagtcat acccctcctc 16020 acaaacaacg acctcttaat aaggatggca ctgttgcccg ctcctattgg ggggatgaat 16080 tatctgaata tgagcaggct gtttgtcaga aacatcggtg atccagtaac atcatcaatt 16140 gctgatctca agagaatgat tctcgcctca ctaatgcctg aagagaccct ccatcaagta 16200 atgacacaac aaccggggga ctcttcattc ctagactggg ctagcgaccc ttactcagca 16260 aatcttgtat gtgtccagag catcactaga ctcctcaaga acataactgc aaggtttgtc 16320 ctgatccata gtccaaaccc aatgttaaaa ggattattcc atgatgacag taaagaagag 16380 gacgagggac tggcggcatt cctcatggac aggcatatta tagtacctag ggcagctcat 16440 gaaatcctgg atcatagtgt cacaggggca agagagtcta ttgcaggcat gctggatacc 16500 acaaaaggct tgattcgagc cagcatgagg aagggggggt taacctctcg agtgataacc 16560 agattgtcca attatgacta tgaacaattc agagcaggga tggtgctatt gacaggaaga 16620 aagagaaatg tcctcattga caaagagtca tgttcagtgc agctggcgag agctctaaga 16680 agccatatgt gggcgaggct agctcgagga cggcctattt acggccttga ggtccctgat 16740 gtactagaat ctatgcgagg ccaccttatt cggcgtcatg agacatgtgt catctgcgag 16800 tgtggatcag tcaactacgg atggtttttt gtcccctcgg gttgccaact ggatgatatt 16860 gacaaggaaa catcatcctt gagagtccca tatattggtt ctaccactga tgagagaaca 16920 gacatgaagc ttgccttcgt aagagcccca agtcgatcct tgcgatctgc tgttagaata 16980 gcaacagtgt actcatgggc ttacggtgat gatgatagct cttggaacga agcctggttg 17040 ttggctaggc aaagggccaa tgtgagcctg gaggagctaa gggtgatcac tcccatctca 17100 acttcgacta atttagcgca taggttgagg gatcgtagca ctcaagtgaa atactcaggt 17160 acatcccttg tccgagtggc gaggtatacc acaatctcca acgacaatct ctcatttgtc 17220 atatcagata agaaggttga tactaacttt atataccaac aaggaatgct tctagggttg 17280 ggtgttttag aaacattgtt tcgactcgag aaagataccg gatcatctaa cacggtatta 17340 catcttcacg tcgaaacaga ttgttgcgtg atcccgatga tagatcatcc caggataccc 17400 agctcccgca agctagagct gagggcagag ctatgtacca acccattgat atatgataat 17460 gcacctttaa ttgacagaga tgcaacaagg ctatacaccc agagccatag gaggcacctt 17520 gtggaatttg ttacatggtc cacaccccaa ctatatcaca ttttagctaa gtccacagca 17580 ctatctatga ttgacctggt aacaaaattt gagaaggacc atatgaatga aatttcagct 17640 ctcatagggg atgacgatat caatagtttc ataactgagt ttctgctcat agagccaaga 17700 ttattcacta tctacttggg ccagtgtgcg gccatcaatt gggcatttga tgtacattat 17760 catagaccat cagggaaata tcagatgggt gagctgttgt catcgttcct ttctagaatg 17820 agcaaaggag tgtttaaggt gcttgtcaat gctctaagcc acccaaagat ctacaagaaa 17880 ttctggcatt gtggtattat agagcctatc catggtcctt cacttgatgc tcaaaacttg 17940 cacacaactg tgtgcaacat ggtttacaca tgctatatga cctacctcga cctgttgttg 18000 aatgaagagt tagaagagtt cacatttctc ttgtgtgaaa gcgacgagga tgtagtaccg 18060 gacagattcg acaacatcca ggcaaaacac ttatgtgttc tggcagattt gtactgtcaa 18120 ccagggacct gcccaccaat tcgaggtcta agaccggtag agaaatgtgc agttctaacc 18180 gaccatatca aggcagaggc tatgttatct ccagcaggat cttcgtggaa cataaatcca 18240 attattgtag accattactc atgctctctg acttatctcc ggcgaggatc gatcaaacag 18300 ataagattga gagttgatcc aggattcatt ttcgacgccc tcgctgaggt aaatgtcagt 18360 cagccaaaga tcggcagcaa caacatctca aatatgagca tcaaggcttt cagaccccca 18420 cacgatgatg ttgcaaaatt gctcaaagat atcaacacaa gcaagcacaa tcttcccatt 18480 tcagggggca atctcgccaa ttatgaaatc catgctttcc gcagaatcgg gttgaactca 18540 tctgcttgct acaaagctgt tgagatatca acattaatta ggagatgcct tgagccaggg 18600 gaggacggct tgttcttggg tgagggatcg ggttctatgt tgatcactta taaagagata 18660 cttaaactaa acaagtgctt ctataatagt ggggtttccg ccaattctag atctggtcaa 18720 agggaattag caccctatcc ctccgaagtt ggccttgtcg aacacagaat gggagtaggt 18780 aatattgtca aagtgctctt taacgggagg cccgaagtca cgtgggtagg cagtgtagat 18840 tgcttcaatt tcatagttag taatatccct acctctagtg tggggtttat ccattcagat 18900 atagagacct tgcctgacaa agatactata gagaagctag aggaattggc agccatctta 18960 tcgatggctc tgctcctggg caaaatagga tcaatactgg tgattaagct tatgcctttc 19020 agcggggatt ttgttcaggg atttataagt tatgtagggt ctcattatag agaagtgaac 19080 cttgtatacc ctagatacag caacttcatc tctactgaat cttatttggt tatgacagat 19140 ctcaaggcta accggctaat gaatcctgaa aagattaagc agcagataat tgaatcatct 19200 gtgaggactt cacctggact tataggtcac atcctatcca ttaagcaact aagctgcata 19260 caagcaattg tgggagacgc agttagtaga ggtgatatca atcctactct gaaaaaactt 19320 acacctatag agcaggtgct gatcaattgc gggttggcaa ttaacggacc taagctgtgc 19380 aaagaattga tccaccatga tgttgcctca gggcaagatg gattgcttaa ttctatactc 19440 atcctctaca gggagttggc aagattcaaa gacaaccaaa gaagtcaaca agggatgttc 19500 cacgcttacc ccgtattggt aagtagcagg caacgagaac ttatatctag gatcacccgc 19560 aaattctggg ggcacattct tctttactcc gggaacaaaa agttgataaa taagtttatc 19620 cagaatctca agtccggcta tctgatacta gacttacacc agaatatctt cgttaagaat 19680 ctatccaagt cagagaaaca gattattatg acggggggtt tgaaacgtga gtgggttttt 19740 aaggtaacag tcaaggagac caaagaatgg tataagttag tcggatacag tgccctgatt 19800 aaggactaat tggttgaact ccggaaccct aatcctgccc taggtggtta ggcattattt 19860 gcaatatatt aaagaaaact ttgaaaatac gaagtttcta ttcccagctt tgtctggtgg 19920 ccggcatggt cccagcctcc tcgctggcgc cggctgggca acattccgag gggaccgtcc 19980 cctcggtaat ggcgaatggg acgcggccga tccggctgct aacaaagccc gaaaggaagc 20040 tgagttggct gctgccaccg ctgagcaata actagcataa ccccttgggg cctctaaacg 20100 ggtcttgagg ggttttttgc tgaaaggagg aactatatcc ggatgcggcc gccatgaaca 20160 ataaaactgt ctgcttacat aaacagtaat acaaggggtg ttatgagcca tattcaacgg 20220 gaaacgtcga ggccgcgatt aaattccaac atggatgctg atttatatgg gtataaatgg 20280 gctcgcgata atgtcgggca atcaggtgcg acaatctatc gcttgtatgg gaagcccgat 20340 gcgccagagt tgtttctgaa acatggcaaa ggtagcgttg ccaatgatgt tacagatgag 20400 atggtcagac taaactggct gacggaattt atgcctcttc cgaccatcaa gcattttatc 20460 cgtactcctg atgatgcatg gttactcacc actgcgatcc ccggaaaaac agcattccag 20520 gtattagaag aatatcctga ttcaggtgaa aatattgttg atgcgctggc agtgttcctg 20580 cgccggttgc attcgattcc tgtttgtaat tgtcctttta acagcgatcg tgtatttcgt 20640 ctcgctcagg cgcaatcacg aatgaataac ggtttggttg atgcgagtga ttttgatgac 20700 gagcgtaatg gctggcctgt tgaacaagtc tggaaagaaa tgcataaact tttgccattc 20760 tcaccggatt cagtcgtcac tcatggtgat ttctcacttg ataaccttat ttttgacgag 20820 gggaaattaa taggttgtat tgatgttgga cgagtcggaa tcgcagaccg ataccaggat 20880 cttgccatcc tatggaactg cctcggtgag ttttctcctt cattacagaa acggcttttt 20940 caaaaatatg gtattgataa tcctgatatg aataaattgc agtttcattt gatgctcgat 21000 gagtttttct aatcagaatt ggttaattgg ttgtaacatt attcagattg ggccccgttc 21060 cactgagcgt cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg 21120 cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg 21180 gatcaagagc taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca 21240 aatactgttc ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg 21300 cctacatacc tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg 21360 tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga 21420 acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac 21480 ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat 21540 ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc 21600 tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga 21660 tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc 21720 ctggcctttt gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg 21780 gataaccgta ttaccgctag 21800 <210> 36 <211> 3870 <212> DNA <213> Artificial sequence <220> <223> MV-optimized nucleotide sequence of the spike (S) polypeptide of nCoV <400> 36 gctagcggat cccgtacggc caccatgttt gtgtttttgg ttttgttgcc actggtgtcc 60 agtcagtgtg ttaatttgac aacaagaaca cagctgccac cagcctacac aaatagtttt 120 acaaggggag tgtactaccc agataaggtg ttcagaagta gtgttctgca tagcacacag 180 gatctgtttc tgccattctt tagcaatgtg acctggttcc atgctattca tgtttccggt 240 acaaatggca ccaagcgctt tgataatcca gtgttgccat tcaatgatgg cgtgtacttt 300 gccagtaccg agaagagtaa tatcattcgc ggatggattt tcggaaccac actggatagt 360 aaaacccaga gtctgctgat tgtgaacaat gccaccaatg tggttatcaa agtgtgcgag 420 tttcagttct gcaatgatcc atttctgggc gtctactacc ataagaacaa caagagttgg 480 atggaaagcg agtttagagt gtacagtagt gccaacaatt gcacctttga atacgttagc 540 cagccattct tgatggattt ggagggaaag cagggcaatt tcaagaatct gcgcgagttc 600 gtgttcaaga atatcgacgg atacttcaaa atctacagca agcacacacc aatcaatctt 660 gttagagatt tgccacaggg attcagtgct ttggaaccat tggttgatct gccaatcgga 720 atcaatatta ccagatttca aacactgctg gccctgcata gaagttattt gacaccaggc 780 gattcaagta gtggatggac agctggtgct gctgcttatt atgttggata tctgcaacca 840 cgaacctttc tgctgaagta caatgagaat ggaacaatca cagatgctgt ggattgtgct 900 cttgatccac tgagtgaaac aaagtgcacc ctgaagagtt ttaccgttga gaagggaatc 960 taccagacca gtaattttcg agtgcagcca acagaaagta tcgtgcgctt cccaaatatt 1020 acaaatctgt gcccattcgg cgaagtgttt aatgctacaa gatttgctag tgtgtacgcc 1080 tggaatcgca agagaattag taattgcgtg gccgattaca gcgtgctgta taatagtgcc 1140 agctttagca cctttaagtg ctatggtgtt agtcccacaa agctgaatga tctgtgcttt 1200 accaatgtgt atgccgatag ttttgtgatc aggggagatg aagttcgaca aattgctcca 1260 ggacagactg gaaagattgc cgattataac tacaagctgc cagatgattt caccggatgt 1320 gtgattgcct ggaacagtaa caatctggat agcaaagttg gcggcaacta caattatctg 1380 tatcgcctgt ttcgcaagag caatctgaaa ccatttgagc gcgatatcag caccgaaatc 1440 tatcaagctg gaagtactcc atgcaatggc gtggaaggtt ttaattgcta ctttccactg 1500 cagtcctacg gatttcaacc tactaatggt gttggatacc agccatatag agtggtggtt 1560 ctgagttttg aattgctgca tgctccagct acagtgtgtg gaccaaagaa aagtaccaac 1620 ctggttaaga acaaatgcgt gaacttcaac ttcaatggac tgactggtac aggcgttctg 1680 actgagagta acaagaaatt cctgccattt cagcagtttg gacgagatat tgctgataca 1740 acagatgcag ttagagatcc ccaaacactg gaaattctgg atattacccc atgcagtttt 1800 ggcggagtta gtgttattac acccggcaca aataccagta atcaagttgc tgtgctgtac 1860 caggatgtga attgcacaga agttccagtt gcaattcatg cagatcagtt gacaccaaca 1920 tggcgagtgt atagtaccgg aagtaatgtt tttcagacac gagctggatg tctgattgga 1980 gccgaacatg ttaacaatag ctacgagtgc gatattccaa ttggtgctgg aatttgcgct 2040 agttatcaga cccaaacaaa tagtccaaga cgagcaagaa gtgtggccag tcagagtatt 2100 attgcctata caatgagtct gggagccgag aatagtgtgg cctatagtaa caattccatt 2160 gctatcccca ccaactttac cattagtgtg acaacagaga ttctgccagt gtccatgaca 2220 aagacaagtg tggattgcac catgtacatt tgcggagata gtacagaatg cagtaatctg 2280 ctgctgcagt atggaagttt ctgtacacaa ctgaatagag ccctgactgg aattgctgtg 2340 gaacaggata agaatactca agaggtgttc gcccaagtga agcaaatcta taagacccca 2400 cctattaagg atttcggcgg attcaatttc agtcagattt tgccagatcc aagcaagcca 2460 tccaaacgca gttttattga ggacctgctg ttcaacaaag tgacattggc tgatgctggc 2520 tttattaagc aatatggcga ttgtctggga gatatagctg ccagagattt gatttgcgcc 2580 caaaagttta atggattgac agttttgcca ccactgctga cagatgagat gattgctcag 2640 tatacaagtg ctctgctggc cggaacaatt acatcaggat ggacatttgg agctggtgca 2700 gcattgcaaa taccatttgc tatgcagatg gcctaccgct ttaatggtat tggagttacc 2760 cagaacgtgc tgtacgaaaa tcagaagctg atcgccaatc agttcaatag cgccattgga 2820 aaaattcagg atagcctgag tagtactgct agtgctcttg gaaaactgca ggatgtggtt 2880 aatcagaatg ctcaggctct gaatactctg gttaagcagt tgagttccaa tttcggagct 2940 attagcagtg tgctgaacga tattctgagt cgtttggata aggttgaggc cgaagttcag 3000 attgatagac tgattacagg acgactgcag agcttgcaga catatgttac acaacaactg 3060 attcgagccg ctgaaattag agctagtgct aatttggctg ccacaaagat gagtgaatgt 3120 gtgcttggac agagcaaaag agtggatttt tgcggcaaag gataccatct gatgagcttt 3180 ccacaaagtg ctccacatgg tgttgtgttt ctgcatgtta cttatgtgcc cgctcaagag 3240 aagaatttca caacagctcc agccatttgc catgatggaa aagctcattt tccacgagaa 3300 ggcgtgttcg ttagtaatgg tactcattgg ttcgtgaccc agcgcaattt ttacgagcca 3360 cagattatta ccaccgacaa tactttcgtg tccggcaatt gtgatgttgt gattggaatc 3420 gtgaacaaca cagtgtacga tccattgcag ccagagctgg atagttttaa agaggaactg 3480 gacaagtact tcaagaacca tacaagtcca gatgtggatc tgggcgatat tagtggaatc 3540 aatgcctccg tggtcaacat ccagaaagaa attgatcgac tgaacgaagt ggccaagaat 3600 ttgaatgaga gcctgattga tctgcaagag ctgggcaaat acgagcagta tattaagtgg 3660 ccttggtaca tttggctggg attcattgct ggactgattg ccattgtgat ggttaccatt 3720 atgctgtgtt gcatgacaag ttgttgcagt tgcctgaaag gatgctgtag ttgcggtagt 3780 tgctgcaagt ttgatgagga tgatagtgaa ccagtgctga aaggcgtgaa gctgcattat 3840 acttgataac gagcgcgcct cgaggaattc 3870 <210> 37 <211> 1308 <212> DNA <213> Artificial sequence <220> <223> MV-optimized nucleotide sequence of the N polypeptide of CoV <400> 37 gctagcggat cccgtacggc caccatgagt gataatggac cacaaaatca acgcaatgcc 60 ccaagaatta catttggagg accaagtgat agcaccggaa gtaatcaaaa tggcgaaaga 120 agtggtgcta gaagtaaaca aagacgacca caaggactgc caaacaatac tgctagttgg 180 tttacagctc tgacccagca tggaaaagag gatttgaaat ttccaagagg acagggcgtg 240 ccaatcaata ccaatagtag tccagatgat cagattggct attatagacg agctacaaga 300 agaatacgag gcggagatgg aaaaatgaag gatttgagtc cacgctggta cttctattat 360 cttggaacag gaccagaggc tggattgcca tatggtgcta acaaagatgg aattatttgg 420 gttgcaacag aaggtgccct gaatacccca aaagatcata ttggaacacg caatcctgcc 480 aacaatgctg caattgtgtt gcaattgcca cagggaacaa cactgcctaa aggattctat 540 gctgagggaa gtagaggtgg aagtcaagct agttcaagaa gtagtagtcg cagtagaaat 600 agcagtcgaa atagtacacc tggaagtagt agaggaacaa gtccagctag aatggctgga 660 aatggtggtg atgctgcttt ggctttgttg ctgttggata gactgaatca gctggaaagc 720 aaaatgagtg gcaaaggaca acaacagcag ggacagacag ttacaaagaa aagtgctgct 780 gaagcaagca agaaaccacg tcaaaaacga acagccacaa aggcctataa tgtgacacaa 840 gcttttggac gaagaggacc agaacagaca cagggaaatt ttggagatca agaactgatt 900 cgccagggaa cagattacaa acattggcca caaattgccc agtttgctcc aagtgctagt 960 gctttctttg gaatgagtcg aattggaatg gaagtgacac caagtggaac atggttgaca 1020 tatacaggtg ccatcaagct ggatgataag gacccaaatt tcaaggatca agtgatcctg 1080 ctgaacaaac acatcgacgc ctataagaca tttccaccaa cagaacccaa gaaggataag 1140 aagaagaaag ctgacgaaac acaagctctg ccacagagac aaaagaaaca gcaaacagtt 1200 actctgctgc cagctgctga tctggatgat ttcagtaaac aactgcagca gagcatgagt 1260 agtgctgata gtacacaagc ctgataacga gcgcgcctcg aggaattc 1308 <210> 38 <211> 19795 <212> DNA <213> Artificial sequence <220> <223> pTM3-MVSchw-gfp <400> 38 accaaacaaa gttgggtaag gatagttcaa tcaatgatca tcttctagtg cacttaggat 60 tcaagatcct attatcaggg acaagagcag gattagggat atccgagatg gccacacttt 120 taaggagctt agcattgttc aaaagaaaca aggacaaacc acccattaca tcaggatccg 180 gtggagccat cagaggaatc aaacacatta ttatagtacc aatccctgga gattcctcaa 240 ttaccactcg atccagactt ctggaccggt tggtgaggtt aattggaaac ccggatgtga 300 gcgggcccaa actaacaggg gcactaatag gtatattatc cttatttgtg gagtctccag 360 gtcaattgat tcagaggatc accgatgacc ctgacgttag cataaggctg ttagaggttg 420 tccagagtga ccagtcacaa tctggcctta ccttcgcatc aagaggtacc aacatggagg 480 atgaggcgga ccaatacttt tcacatgatg atccaattag tagtgatcaa tccaggttcg 540 gatggttcgg gaacaaggaa atctcagata ttgaagtgca agaccctgag ggattcaaca 600 tgattctggg taccatccta gcccaaattt gggtcttgct cgcaaaggcg gttacggccc 660 cagacacggc agctgattcg gagctaagaa ggtggataaa gtacacccaa caaagaaggg 720 tagttggtga atttagattg gagagaaaat ggttggatgt ggtgaggaac aggattgccg 780 aggacctctc cttacgccga ttcatggtcg ctctaatcct ggatatcaag agaacacccg 840 gaaacaaacc caggattgct gaaatgatat gtgacattga tacatatatc gtagaggcag 900 gattagccag ttttatcctg actattaagt ttgggataga aactatgtat cctgctcttg 960 gactgcatga atttgctggt gagttatcca cacttgagtc cttgatgaac ctttaccagc 1020 aaatggggga aactgcaccc tacatggtaa tcctggagaa ctcaattcag aacaagttca 1080 gtgcaggatc ataccctctg ctctggagct atgccatggg agtaggagtg gaacttgaaa 1140 actccatggg aggtttgaac tttggccgat cttactttga tccagcatat tttagattag 1200 ggcaagagat ggtaaggagg tcagctggaa aggtcagttc cacattggca tctgaactcg 1260 gtatcactgc cgaggatgca aggcttgttt cagagattgc aatgcatact actgaggaca 1320 agatcagtag agcggttgga cccagacaag cccaagtatc atttctacac ggtgatcaaa 1380 gtgagaatga gctaccgaga ttggggggca aggaagatag gagggtcaaa cagagtcgag 1440 gagaagccag ggagagctac agagaaaccg ggcccagcag agcaagtgat gcgagagctg 1500 cccatcttcc aaccggcaca cccctagaca ttgacactgc aacggagtcc agccaagatc 1560 cgcaggacag tcgaaggtca gctgacgccc tgcttaggct gcaagccatg gcaggaatct 1620 cggaagaaca aggctcagac acggacaccc ctatagtgta caatgacaga aatcttctag 1680 actaggtgcg agaggccgag ggccagaaca acatccgcct accatccatc attgttataa 1740 aaaacttagg aaccaggtcc acacagccgc cagcccatca accatccact cccacgattg 1800 gagccaatgg cagaagagca ggcacgccat gtcaaaaacg gactggaatg catccgggct 1860 ctcaaggccg agcccatcgg ctcactggcc atcgaggaag ctatggcagc atggtcagaa 1920 atatcagaca acccaggaca ggagcgagcc acctgcaggg aagagaaggc aggcagttcg 1980 ggtctcagca aaccatgcct ctcagcaatt ggatcaactg aaggcggtgc acctcgcatc 2040 cgcggtcagg gacctggaga gagcgatgac gacgctgaaa ctttgggaat ccccccaaga 2100 aatctccagg catcaagcac tgggttacag tgttattacg tttatgatca cagcggtgaa 2160 gcggttaagg gaatccaaga tgctgactct atcatggttc aatcaggcct tgatggtgat 2220 agcaccctct caggaggaga caatgaatct gaaaacagcg atgtggatat tggcgaacct 2280 gataccgagg gatatgctat cactgaccgg ggatctgctc ccatctctat ggggttcagg 2340 gcttctgatg ttgaaactgc agaaggaggg gagatccacg agctcctgag actccaatcc 2400 agaggcaaca actttccgaa gcttgggaaa actctcaatg ttcctccgcc cccggacccc 2460 ggtagggcca gcacttccgg gacacccatt aaaaagggca cagacgcgag attagcctca 2520 tttggaacgg agatcgcgtc tttattgaca ggtggtgcaa cccaatgtgc tcgaaagtca 2580 ccctcggaac catcagggcc aggtgcacct gcggggaatg tccccgagtg tgtgagcaat 2640 gccgcactga tacaggagtg gacacccgaa tctggtacca caatctcccc gagatcccag 2700 aataatgaag aagggggaga ctattatgat gatgagctgt tctctgatgt ccaagatatt 2760 aaaacagcct tggccaaaat acacgaggat aatcagaaga taatctccaa gctagaatca 2820 ctgctgttat tgaagggaga agttgagtca attaagaagc agatcaacag gcaaaatatc 2880 agcatatcca ccctggaagg acacctctca agcatcatga tcgccattcc tggacttggg 2940 aaggatccca acgaccccac tgcagatgtc gaaatcaatc ccgacttgaa acccatcata 3000 ggcagagatt caggccgagc actggccgaa gttctcaaga aacccgttgc cagccgacaa 3060 ctccaaggaa tgacaaatgg acggaccagt tccagaggac agctgctgaa ggaatttcag 3120 ctaaagccga tcgggaaaaa gatgagctca gccgtcgggt ttgttcctga caccggccct 3180 gcatcacgca gtgtaatccg ctccattata aaatccagcc ggctagagga ggatcggaag 3240 cgttacctga tgactctcct tgatgatatc aaaggagcca atgatcttgc caagttccac 3300 cagatgctga tgaagataat aatgaagtag ctacagctca acttacctgc caaccccatg 3360 ccagtcgacc caactagtac aacctaaatc cattataaaa aacttaggag caaagtgatt 3420 gcctcccaag gtccacaatg acagagacct acgacttcga caagtcggca tgggacatca 3480 aagggtcgat cgctccgata caacccacca cctacagtga tggcaggctg gtgccccagg 3540 tcagagtcat agatcctggt ctaggcgaca ggaaggatga atgctttatg tacatgtttc 3600 tgctgggggt tgttgaggac agcgattccc tagggcctcc aatcgggcga gcatttgggt 3660 tcctgccctt aggtgttggc agatccacag caaagcccga aaaactcctc aaagaggcca 3720 ctgagcttga catagttgtt agacgtacag cagggctcaa tgaaaaactg gtgttctaca 3780 acaacacccc actaactctc ctcacacctt ggagaaaggt cctaacaaca gggagtgtct 3840 tcaacgcaaa ccaagtgtgc aatgcggtta atctgatacc gctcgatacc ccgcagaggt 3900 tccgtgttgt ttatatgagc atcacccgtc tttcggataa cgggtattac accgttccta 3960 gaagaatgct ggaattcaga tcggtcaatg cagtggcctt caacctgctg gtgaccctta 4020 ggattgacaa ggcgataggc cctgggaaga tcatcgacaa tacagagcaa cttcctgagg 4080 caacatttat ggtccacatc gggaacttca ggagaaagaa gagtgaagtc tactctgccg 4140 attattgcaa aatgaaaatc gaaaagatgg gcctggtttt tgcacttggt gggatagggg 4200 gcaccagtct tcacattaga agcacaggca aaatgagcaa gactctccat gcacaactcg 4260 ggttcaagaa gaccttatgt tacccgctga tggatatcaa tgaagacctt aatcgattac 4320 tctggaggag cagatgcaag atagtaagaa tccaggcagt tttgcagcca tcagttcctc 4380 aagaattccg catttacgac gacgtgatca taaatgatga ccaaggacta ttcaaagttc 4440 tgtagaccgt agtgcccagc aatgcccgaa aacgaccccc ctcacaatga cagccagaag 4500 gcccggacaa aaaagccccc tccgaaagac tccacggacc aagcgagagg ccagccagca 4560 gccgacggca agcgcgaaca ccaggcggcc ccagcacaga acagccctga cacaaggcca 4620 ccaccagcca ccccaatctg catcctcctc gtgggacccc cgaggaccaa cccccaaggc 4680 tgcccccgat ccaaaccacc aaccgcatcc ccaccacccc cgggaaagaa acccccagca 4740 attggaaggc ccctccccct cttcctcaac acaagaactc cacaaccgaa ccgcacaagc 4800 gaccgaggtg acccaaccgc aggcatccga ctccctagac agatcctctc tccccggcaa 4860 actaaacaaa acttagggcc aaggaacata cacacccaac agaacccaga ccccggccca 4920 cggcgccgcg cccccaaccc ccgacaacca gagggagccc ccaaccaatc ccgccggctc 4980 ccccggtgcc cacaggcagg gacaccaacc cccgaacaga cccagcaccc aaccatcgac 5040 aatccaagac gggggggccc ccccaaaaaa aggcccccag gggccgacag ccagcaccgc 5100 gaggaagccc acccacccca cacacgacca cggcaaccaa accagaaccc agaccaccct 5160 gggccaccag ctcccagact cggccatcac cccgcagaaa ggaaaggcca caacccgcgc 5220 accccagccc cgatccggcg gggagccacc caacccgaac cagcacccaa gagcgatccc 5280 cgaaggaccc ccgaaccgca aaggacatca gtatcccaca gcctctccaa gtcccccggt 5340 ctcctcctct tctcgaaggg accaaaagat caatccacca cacccgacga cactcaactc 5400 cccaccccta aaggagacac cgggaatccc agaatcaaga ctcatccaat gtccatcatg 5460 ggtctcaagg tgaacgtctc tgccatattc atggcagtac tgttaactct ccaaacaccc 5520 accggtcaaa tccattgggg caatctctct aagatagggg tggtaggaat aggaagtgca 5580 agctacaaag ttatgactcg ttccagccat caatcattag tcataaaatt aatgcccaat 5640 ataactctcc tcaataactg cacgagggta gagattgcag aatacaggag actactgaga 5700 acagttttgg aaccaattag agatgcactt aatgcaatga cccagaatat aagaccggtt 5760 cagagtgtag cttcaagtag gagacacaag agatttgcgg gagtagtcct ggcaggtgcg 5820 gccctaggcg ttgccacagc tgctcagata acagccggca ttgcacttca ccagtccatg 5880 ctgaactctc aagccatcga caatctgaga gcgagcctgg aaactactaa tcaggcaatt 5940 gagacaatca gacaagcagg gcaggagatg atattggctg ttcagggtgt ccaagactac 6000 atcaataatg agctgatacc gtctatgaac caactatctt gtgatttaat cggccagaag 6060 ctcgggctca aattgctcag atactataca gaaatcctgt cattatttgg ccccagttta 6120 cgggacccca tatctgcgga gatatctatc caggctttga gctatgcgct tggaggagac 6180 atcaataagg tgttagaaaa gctcggatac agtggaggtg atttactggg catcttagag 6240 agcggaggaa taaaggcccg gataactcac gtcgacacag agtcctactt cattgtcctc 6300 agtatagcct atccgacgct gtccgagatt aagggggtga ttgtccaccg gctagagggg 6360 gtctcgtaca acataggctc tcaagagtgg tataccactg tgcccaagta tgttgcaacc 6420 caagggtacc ttatctcgaa ttttgatgag tcatcgtgta ctttcatgcc agaggggact 6480 gtgtgcagcc aaaatgcctt gtacccgatg agtcctctgc tccaagaatg cctccggggg 6540 tacaccaagt cctgtgctcg tacactcgta tccgggtctt ttgggaaccg gttcatttta 6600 tcacaaggga acctaatagc caattgtgca tcaatccttt gcaagtgtta cacaacagga 6660 acgatcatta atcaagaccc tgacaagatc ctaacataca ttgctgccga tcactgcccg 6720 gtagtcgagg tgaacggcgt gaccatccaa gtcgggagca ggaggtatcc agacgctgtg 6780 tacttgcaca gaattgacct cggtcctccc atatcattgg agaggttgga cgtagggaca 6840 aatctgggga atgcaattgc taagttggag gatgccaagg aattgttgga gtcatcggac 6900 cagatattga ggagtatgaa aggtttatcg agcactagca tagtctacat cctgattgca 6960 gtgtgtcttg gagggttgat agggatcccc gctttaatat gttgctgcag ggggcgttgt 7020 aacaaaaagg gagaacaagt tggtatgtca agaccaggcc taaagcctga tcttacggga 7080 acatcaaaat cctatgtaag gtcgctctga tcctctacaa ctcttgaaac acaaatgtcc 7140 cacaagtctc ctcttcgtca tcaagcaacc accgcaccca gcatcaagcc cacctgaaat 7200 tatctccggc ttccctctgg ccgaacaata tcggtagtta atcaaaactt agggtgcaag 7260 atcatccaca atgtcaccac aacgagaccg gataaatgcc ttctacaaag ataaccccca 7320 tcccaaggga agtaggatag tcattaacag agaacatctt atgattgata gaccttatgt 7380 tttgctggct gttctgtttg tcatgtttct gagcttgatc gggttgctag ccattgcagg 7440 cattagactt catcgggcag ccatctacac cgcagagatc cataaaagcc tcagcaccaa 7500 tctagatgta actaactcaa tcgagcatca ggtcaaggac gtgctgacac cactcttcaa 7560 aatcatcggt gatgaagtgg gcctgaggac acctcagaga ttcactgacc tagtgaaatt 7620 aatctctgac aagattaaat tccttaatcc ggatagggag tacgacttca gagatctcac 7680 ttggtgtatc aacccgccag agagaatcaa attggattat gatcaatact gtgcagatgt 7740 ggctgctgaa gagctcatga atgcattggt gaactcaact ctactggaga ccagaacaac 7800 caatcagttc ctagctgtct caaagggaaa ctgctcaggg cccactacaa tcagaggtca 7860 attctcaaac atgtcgctgt ccctgttaga cttgtattta ggtcgaggtt acaatgtgtc 7920 atctatagtc actatgacat cccagggaat gtatggggga acttacctag tggaaaagcc 7980 taatctgagc agcaaaaggt cagagttgtc acaactgagc atgtaccgag tgtttgaagt 8040 aggtgttatc agaaatccgg gtttgggggc tccggtgttc catatgacaa actatcttga 8100 gcaaccagtc agtaatgatc tcagcaactg tatggtggct ttgggggagc tcaaactcgc 8160 agccctttgt cacggggaag attctatcac aattccctat cagggatcag ggaaaggtgt 8220 cagcttccag ctcgtcaagc taggtgtctg gaaatcccca accgacatgc aatcctgggt 8280 ccccttatca acggatgatc cagtgataga caggctttac ctctcatctc acagaggtgt 8340 tatcgctgac aatcaagcaa aatgggctgt cccgacaaca cgaacagatg acaagttgcg 8400 aatggagaca tgcttccaac aggcgtgtaa gggtaaaatc caagcactct gcgagaatcc 8460 cgagtgggca ccattgaagg ataacaggat tccttcatac ggggtcttgt ctgttgatct 8520 gagtctgaca gttgagctta aaatcaaaat tgcttcggga ttcgggccat tgatcacaca 8580 cggttcaggg atggacctat acaaatccaa ccacaacaat gtgtattggc tgactatccc 8640 gccaatgaag aacctagcct taggtgtaat caacacattg gagtggatac cgagattcaa 8700 ggttagtccc tacctcttca ctgtcccaat taaggaagca ggcgaagact gccatgcccc 8760 aacataccta cctgcggagg tggatggtga tgtcaaactc agttccaatc tggtgattct 8820 acctggtcaa gatctccaat atgttttggc aacctacgat acttccaggg ttgaacatgc 8880 tgtggtttat tacgtttaca gcccaagccg ctcattttct tacttttatc cttttaggtt 8940 gcctataaag ggggtcccca tcgaattaca agtggaatgc ttcacatggg accaaaaact 9000 ctggtgccgt cacttctgtg tgcttgcgga ctcagaatct ggtggacata tcactcactc 9060 tgggatggtg ggcatgggag tcagctgcac agtcacccgg gaagatggaa ccaatcgcag 9120 atagggctgc tagtgaacca atcacatgat gtcacccaga catcaggcat acccactagt 9180 ctaccctcca tcattgttat aaaaaactta ggaaccaggt ccacacagcc gccagcccat 9240 caacgcgtac gatggtgagc aagggcgagg agctgttcac cggggtggtg cccatcctgg 9300 tcgagctgga cggcgacgta aacggccaca agttcagcgt gtccggcgag ggcgagggcg 9360 atgccaccta cggcaagctg accctgaagt tcatctgcac caccggcaag ctgcccgtgc 9420 cctggcccac cctcgtgacc accctgacct acggcgtgca gtgcttcagc cgctaccccg 9480 accacatgaa gcagcacgac ttcttcaagt ccgccatgcc cgaaggctac gtccaggagc 9540 gcaccatctt cttcaaggac gacggcaact acaagacccg cgccgaggtg aagttcgagg 9600 gcgacaccct ggtgaaccgc atcgagctga agggcatcga cttcaaggag gacggcaaca 9660 tcctggggca caagctggag tacaactaca acagccacaa cgtctatatc atggccgaca 9720 agcagaagaa cggcatcaag gtgaacttca agatccgcca caacatcgag gacggcagcg 9780 tgcagctcgc cgaccactac cagcagaaca cccccatcgg cgacggcccc gtgctgctgc 9840 ccgacaacca ctacctgagc acccagtccg ccctgagcaa agaccccaac gagaagcgcg 9900 atcacatggt cctgctggag ttcgtgaccg ccgccgggat cactctcggc atggacgagc 9960 tgtacaagta ggcgcgcagc gcttagacgt ctcgcgatcg atgctagtgt gaaatagaca 10020 tcagaattaa gaaaaacgta gggtccaagt ggttccccgt tatggactcg ctatctgtca 10080 accagatctt ataccctgaa gttcacctag atagcccgat agttaccaat aagatagtag 10140 ccatcctgga gtatgctcga gtccctcacg cttacagcct ggaggaccct acactgtgtc 10200 agaacatcaa gcaccgccta aaaaacggat tttccaacca aatgattata aacaatgtgg 10260 aagttgggaa tgtcatcaag tccaagctta ggagttatcc ggcccactct catattccat 10320 atccaaattg taatcaggat ttatttaaca tagaagacaa agagtcaacg aggaagatcc 10380 gtgaactcct caaaaagggg aattcgctgt actccaaagt cagtgataag gttttccaat 10440 gcttaaggga cactaactca cggcttggcc taggctccga attgagggag gacatcaagg 10500 agaaagttat taacttggga gtttacatgc acagctccca gtggtttgag ccctttctgt 10560 tttggtttac agtcaagact gagatgaggt cagtgattaa atcacaaacc catacttgcc 10620 ataggaggag acacacacct gtattcttca ctggtagttc agttgagttg ctaatctctc 10680 gtgaccttgt tgctataatc agtaaagagt ctcaacatgt atattacctg acatttgaac 10740 tggttttgat gtattgtgat gtcatagagg ggaggttaat gacagagacc gctatgacta 10800 ttgatgctag gtatacagag cttctaggaa gagtcagata catgtggaaa ctgatagatg 10860 gtttcttccc tgcactcggg aatccaactt atcaaattgt agccatgctg gagcctcttt 10920 cacttgctta cctgcagctg agggatataa cagtagaact cagaggtgct ttccttaacc 10980 actgctttac tgaaatacat gatgttcttg accaaaacgg gttttctgat gaaggtactt 11040 atcatgagtt aactgaagct ctagattaca ttttcataac tgatgacata catctgacag 11100 gggagatttt ctcatttttc agaagtttcg gccaccccag acttgaagca gtaacggctg 11160 ctgaaaatgt taggaaatac atgaatcagc ctaaagtcat tgtgtatgag actctgatga 11220 aaggtcatgc catattttgt ggaatcataa tcaacggcta tcgtgacagg cacggaggca 11280 gttggccacc gctgaccctc cccctgcatg ctgcagacac aatccggaat gctcaagctt 11340 caggtgaagg gttaacacat gagcagtgcg ttgataactg gaaatctttt gctggagtga 11400 aatttggctg ctttatgcct cttagcctgg atagtgatct gacaatgtac ctaaaggaca 11460 aggcacttgc tgctctccaa agggaatggg attcagttta cccgaaagag ttcctgcgtt 11520 acgaccctcc caagggaacc gggtcacgga ggcttgtaga tgttttcctt aatgattcga 11580 gctttgaccc atatgatgtg ataatgtatg ttgtaagtgg agcttacctc catgaccctg 11640 agttcaacct gtcttacagc ctgaaagaaa aggagatcaa ggaaacaggt agactttttg 11700 ctaaaatgac ttacaaaatg agggcatgcc aagtgattgc tgaaaatcta atctcaaacg 11760 ggattggcaa atattttaag gacaatggga tggccaagga tgagcacgat ttgactaagg 11820 cactccacac tctagctgtc tcaggagtcc ccaaagatct caaagaaagt cacagggggg 11880 ggccagtctt aaaaacctac tcccgaagcc cagtccacac aagtaccagg aacgtgagag 11940 cagcaaaagg gtttataggg ttccctcaag taattcggca ggaccaagac actgatcatc 12000 cggagaatat ggaagcttac gagacagtca gtgcatttat cacgactgat ctcaagaagt 12060 actgccttaa ttggagatat gagaccatca gcttgtttgc acagaggcta aatgagattt 12120 acggattgcc ctcatttttc cagtggctgc ataagaggct tgagacctct gtcctgtatg 12180 taagtgaccc tcattgcccc cccgaccttg acgcccatat cccgttatat aaagtcccca 12240 atgatcaaat cttcattaag taccctatgg gaggtataga agggtattgt cagaagctgt 12300 ggaccatcag caccattccc tatctatacc tggctgctta tgagagcgga gtaaggattg 12360 cttcgttagt gcaaggggac aatcagacca tagccgtaac aaaaagggta cccagcacat 12420 ggccctacaa ccttaagaaa cgggaagctg ctagagtaac tagagattac tttgtaattc 12480 ttaggcaaag gctacatgat attggccatc acctcaaggc aaatgagaca attgtttcat 12540 cacatttttt tgtctattca aaaggaatat attatgatgg gctacttgtg tcccaatcac 12600 tcaagagcat cgcaagatgt gtattctggt cagagactat agttgatgaa acaagggcag 12660 catgcagtaa tattgctaca acaatggcta aaagcatcga gagaggttat gaccgttacc 12720 ttgcatattc cctgaacgtc ctaaaagtga tacagcaaat tctgatctct cttggcttca 12780 caatcaattc aaccatgacc cgggatgtag tcatacccct cctcacaaac aacgacctct 12840 taataaggat ggcactgttg cccgctccta ttggggggat gaattatctg aatatgagca 12900 ggctgtttgt cagaaacatc ggtgatccag taacatcatc aattgctgat ctcaagagaa 12960 tgattctcgc ctcactaatg cctgaagaga ccctccatca agtaatgaca caacaaccgg 13020 gggactcttc attcctagac tgggctagcg acccttactc agcaaatctt gtatgtgtcc 13080 agagcatcac tagactcctc aagaacataa ctgcaaggtt tgtcctgatc catagtccaa 13140 acccaatgtt aaaaggatta ttccatgatg acagtaaaga agaggacgag ggactggcgg 13200 cattcctcat ggacaggcat attatagtac ctagggcagc tcatgaaatc ctggatcata 13260 gtgtcacagg ggcaagagag tctattgcag gcatgctgga taccacaaaa ggcttgattc 13320 gagccagcat gaggaagggg gggttaacct ctcgagtgat aaccagattg tccaattatg 13380 actatgaaca attcagagca gggatggtgc tattgacagg aagaaagaga aatgtcctca 13440 ttgacaaaga gtcatgttca gtgcagctgg cgagagctct aagaagccat atgtgggcga 13500 ggctagctcg aggacggcct atttacggcc ttgaggtccc tgatgtacta gaatctatgc 13560 gaggccacct tattcggcgt catgagacat gtgtcatctg cgagtgtgga tcagtcaact 13620 acggatggtt ttttgtcccc tcgggttgcc aactggatga tattgacaag gaaacatcat 13680 ccttgagagt cccatatatt ggttctacca ctgatgagag aacagacatg aagcttgcct 13740 tcgtaagagc cccaagtcga tccttgcgat ctgctgttag aatagcaaca gtgtactcat 13800 gggcttacgg tgatgatgat agctcttgga acgaagcctg gttgttggct aggcaaaggg 13860 ccaatgtgag cctggaggag ctaagggtga tcactcccat ctcaacttcg actaatttag 13920 cgcataggtt gagggatcgt agcactcaag tgaaatactc aggtacatcc cttgtccgag 13980 tggcgaggta taccacaatc tccaacgaca atctctcatt tgtcatatca gataagaagg 14040 ttgatactaa ctttatatac caacaaggaa tgcttctagg gttgggtgtt ttagaaacat 14100 tgtttcgact cgagaaagat accggatcat ctaacacggt attacatctt cacgtcgaaa 14160 cagattgttg cgtgatcccg atgatagatc atcccaggat acccagctcc cgcaagctag 14220 agctgagggc agagctatgt accaacccat tgatatatga taatgcacct ttaattgaca 14280 gagatgcaac aaggctatac acccagagcc ataggaggca ccttgtggaa tttgttacat 14340 ggtccacacc ccaactatat cacattttag ctaagtccac agcactatct atgattgacc 14400 tggtaacaaa atttgagaag gaccatatga atgaaatttc agctctcata ggggatgacg 14460 atatcaatag tttcataact gagtttctgc tcatagagcc aagattattc actatctact 14520 tgggccagtg tgcggccatc aattgggcat ttgatgtaca ttatcataga ccatcaggga 14580 aatatcagat gggtgagctg ttgtcatcgt tcctttctag aatgagcaaa ggagtgttta 14640 aggtgcttgt caatgctcta agccacccaa agatctacaa gaaattctgg cattgtggta 14700 ttatagagcc tatccatggt ccttcacttg atgctcaaaa cttgcacaca actgtgtgca 14760 acatggttta cacatgctat atgacctacc tcgacctgtt gttgaatgaa gagttagaag 14820 agttcacatt tctcttgtgt gaaagcgacg aggatgtagt accggacaga ttcgacaaca 14880 tccaggcaaa acacttatgt gttctggcag atttgtactg tcaaccaggg acctgcccac 14940 caattcgagg tctaagaccg gtagagaaat gtgcagttct aaccgaccat atcaaggcag 15000 aggctatgtt atctccagca ggatcttcgt ggaacataaa tccaattatt gtagaccatt 15060 actcatgctc tctgacttat ctccggcgag gatcgatcaa acagataaga ttgagagttg 15120 atccaggatt cattttcgac gccctcgctg aggtaaatgt cagtcagcca aagatcggca 15180 gcaacaacat ctcaaatatg agcatcaagg ctttcagacc cccacacgat gatgttgcaa 15240 aattgctcaa agatatcaac acaagcaagc acaatcttcc catttcaggg ggcaatctcg 15300 ccaattatga aatccatgct ttccgcagaa tcgggttgaa ctcatctgct tgctacaaag 15360 ctgttgagat atcaacatta attaggagat gccttgagcc aggggaggac ggcttgttct 15420 tgggtgaggg atcgggttct atgttgatca cttataaaga gatacttaaa ctaaacaagt 15480 gcttctataa tagtggggtt tccgccaatt ctagatctgg tcaaagggaa ttagcaccct 15540 atccctccga agttggcctt gtcgaacaca gaatgggagt aggtaatatt gtcaaagtgc 15600 tctttaacgg gaggcccgaa gtcacgtggg taggcagtgt agattgcttc aatttcatag 15660 ttagtaatat ccctacctct agtgtggggt ttatccattc agatatagag accttgcctg 15720 acaaagatac tatagagaag ctagaggaat tggcagccat cttatcgatg gctctgctcc 15780 tgggcaaaat aggatcaata ctggtgatta agcttatgcc tttcagcggg gattttgttc 15840 agggatttat aagttatgta gggtctcatt atagagaagt gaaccttgta taccctagat 15900 acagcaactt catctctact gaatcttatt tggttatgac agatctcaag gctaaccggc 15960 taatgaatcc tgaaaagatt aagcagcaga taattgaatc atctgtgagg acttcacctg 16020 gacttatagg tcacatccta tccattaagc aactaagctg catacaagca attgtgggag 16080 acgcagttag tagaggtgat atcaatccta ctctgaaaaa acttacacct atagagcagg 16140 tgctgatcaa ttgcgggttg gcaattaacg gacctaagct gtgcaaagaa ttgatccacc 16200 atgatgttgc ctcagggcaa gatggattgc ttaattctat actcatcctc tacagggagt 16260 tggcaagatt caaagacaac caaagaagtc aacaagggat gttccacgct taccccgtat 16320 tggtaagtag caggcaacga gaacttatat ctaggatcac ccgcaaattc tgggggcaca 16380 ttcttcttta ctccgggaac aaaaagttga taaataagtt tatccagaat ctcaagtccg 16440 gctatctgat actagactta caccagaata tcttcgttaa gaatctatcc aagtcagaga 16500 aacagattat tatgacgggg ggtttgaaac gtgagtgggt ttttaaggta acagtcaagg 16560 agaccaaaga atggtataag ttagtcggat acagtgccct gattaaggac taattggttg 16620 aactccggaa ccctaatcct gccctaggtg gttaggcatt atttgcaata tattaaagaa 16680 aactttgaaa atacgaagtt tctattccca gctttgtctg gtggccggca tggtcccagc 16740 ctcctcgctg gcgccggctg ggcaacattc cgaggggacc gtcccctcgg taatggcgaa 16800 tgggacgcgg ccgatccggc tgctaacaaa gcccgaaagg aagctgagtt ggctgctgcc 16860 accgctgagc aataactagc ataacccctt ggggcctcta aacgggtctt gaggggtttt 16920 ttgctgaaag gaggaactat atccggatgc ggccgcgggc cctatggtac ccagcttttg 16980 ttccctttag tgagggttaa ttccgagctt ggcgtaatca tggtcatagc tgtttcctgt 17040 gtgaaattgt tatccgctca caattccaca caacatagga gccggaagca taaagtgtaa 17100 agcctggggt gcctaatgag tgaggtaact cacattaatt gcgttgcgct cactgcccgc 17160 tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac gcgcggggag 17220 aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt 17280 cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga 17340 atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg 17400 taaaaaggcc gcgttgctgg cgtttttcca taggctcggc ccccctgacg agcatcacaa 17460 aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt 17520 cccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct 17580 gtccgccttt ctcccttcgg gaagcgtggc gctttctcaa tgctcacgct gtaggtatct 17640 cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc 17700 cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt 17760 atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc 17820 tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag tatttggtat 17880 ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa 17940 acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa 18000 aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga 18060 aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct 18120 tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga 18180 cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc 18240 catagttgcc tgactgcccg tcgtgtagat aactacgata cgggagggct taccatctgg 18300 ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt tatcagcaat 18360 aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat 18420 ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg 18480 caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc 18540 attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgaaaaaa 18600 agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc 18660 actcatgctt atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt 18720 ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag 18780 ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa ctttaaaagt 18840 gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag 18900 atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac 18960 cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc 19020 gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa gcatttatca 19080 gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg 19140 ggttccgcgc acatttcccc gaaaagtgcc acctgaaatt gtaaacgtta atattttgtt 19200 aaaattcgcg ttaaattttt gttaaatcag ctcatttttt aaccaatagg ccgaaatcgg 19260 caaaatccct tataaatcaa aagaatagac cgagataggg ttgagtgttg ttccagtttg 19320 gaacaagagt ccactattaa agaacgtgga ctccaacgtc aaagggcgaa aaaccgtcta 19380 tcagggcgat ggcccactac gtgaaccatc accctaatca agttttttgg ggtcgaggtg 19440 ccgtaaagca ctaaatcgga accctaaagg gagcccccga tttagagctt gacggggaaa 19500 gccggcgaac gtggcgagaa aggaagggaa gaaagcgaaa ggagcgggcg ctagggcgct 19560 ggcaagtgta gcggtcacgc tgcgcgtaac caccacaccc gccgcgctta atgcgccgct 19620 acagggcgcg tcccattcgc cattcaggct gcgcaactgt tgggaagggc gatcggtgcg 19680 ggcctcttcg ctattacgcc agccaccgcg gtggcggccg ctaatacgac tcactatagg 19740 gccaactttg tttggtctga tgagtccgtg aggacgaaac ccggagtccc gggtc 19795 <210> 39 <211> 876 <212> DNA <213> Artificial sequence <220> <223> ATU1(eGFP) <400> 39 cttaggattc aagatcctat tatcagggac aagagcagga ttagggatat ccgagacgcg 60 tacgatggtg agcaagggcg aggagctgtt caccggggtg gtgcccatcc tggtcgagct 120 ggacggcgac gtaaacggcc acaagttcag cgtgtccggc gagggcgagg gcgatgccac 180 ctacggcaag ctgaccctga agttcatctg caccaccggc aagctgcccg tgccctggcc 240 caccctcgtg accaccctga cctacggcgt gcagtgcttc agccgctacc ccgaccacat 300 gaagcagcac gacttcttca agtccgccat gcccgaaggc tacgtccagg agcgcaccat 360 cttcttcaag gacgacggca actacaagac ccgcgccgag gtgaagttcg agggcgacac 420 cctggtgaac cgcatcgagc tgaagggcat cgacttcaag gaggacggca acatcctggg 480 gcacaagctg gagtacaact acaacagcca caacgtctat atcatggccg acaagcagaa 540 gaacggcatc aaggtgaact tcaagatccg ccacaacatc gaggacggca gcgtgcagct 600 cgccgaccac taccagcaga acacccccat cggcgacggc cccgtgctgc tgcccgacaa 660 ccactacctg agcacccagt ccgccctgag caaagacccc aacgagaagc gcgatcacat 720 ggtcctgctg gagttcgtga ccgccgccgg gatcactctc ggcatggacg agctgtacaa 780 gtaggcgcgc agcgcttaga cgtctcgcga tcgattagtg cgagaggccg agggccagaa 840 caacatccgc ctaccatcca tcattgttat aaaaaa 876 <210> 40 <211> 828 <212> DNA <213> Artificial sequence <220> <223> ATU2(eGFP) <400> 40 cctaccctcc atcattgtta taaaaaactt aggaaccagg tccacacagc cgccagccca 60 tcaacgcgta cgatggtgag caagggcgag gagctgttca ccggggtggt gcccatcctg 120 gtcgagctgg acggcgacgt aaacggccac aagttcagcg tgtccggcga gggcgagggc 180 gatgccacct acggcaagct gaccctgaag ttcatctgca ccaccggcaa gctgcccgtg 240 ccctggccca ccctcgtgac caccctgacc tacggcgtgc agtgcttcag ccgctacccc 300 gaccacatga agcagcacga cttcttcaag tccgccatgc ccgaaggcta cgtccaggag 360 cgcaccatct tcttcaagga cgacggcaac tacaagaccc gcgccgaggt gaagttcgag 420 ggcgacaccc tggtgaaccg catcgagctg aagggcatcg acttcaagga ggacggcaac 480 atcctggggc acaagctgga gtacaactac aacagccaca acgtctatat catggccgac 540 aagcagaaga acggcatcaa ggtgaacttc aagatccgcc acaacatcga ggacggcagc 600 gtgcagctcg ccgaccacta ccagcagaac acccccatcg gcgacggccc cgtgctgctg 660 cccgacaacc actacctgag cacccagtcc gccctgagca aagaccccaa cgagaagcgc 720 gatcacatgg tcctgctgga gttcgtgacc gccgccggga tcactctcgg catggacgag 780 ctgtacaagt aggcgcgcag cgcttagacg tctcgcgatc gatactag 828 <210> 41 <211> 828 <212> DNA <213> Artificial sequence <220> <223> ATU3(eGFP) <400> 41 ctagtctacc ctccatcatt gttataaaaa acttaggaac caggtccaca cagccgccag 60 cccatcaacg cgtacgatgg tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat 120 cctggtcgag ctggacggcg acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga 180 gggcgatgcc acctacggca agctgaccct gaagttcatc tgcaccaccg gcaagctgcc 240 cgtgccctgg cccaccctcg tgaccaccct gacctacggc gtgcagtgct tcagccgcta 300 ccccgaccac atgaagcagc acgacttctt caagtccgcc atgcccgaag gctacgtcca 360 ggagcgcacc atcttcttca aggacgacgg caactacaag acccgcgccg aggtgaagtt 420 cgagggcgac accctggtga accgcatcga gctgaagggc atcgacttca aggaggacgg 480 caacatcctg gggcacaagc tggagtacaa ctacaacagc cacaacgtct atatcatggc 540 cgacaagcag aagaacggca tcaaggtgaa cttcaagatc cgccacaaca tcgaggacgg 600 cagcgtgcag ctcgccgacc actaccagca gaacaccccc atcggcgacg gccccgtgct 660 gctgcccgac aaccactacc tgagcaccca gtccgccctg agcaaagacc ccaacgagaa 720 gcgcgatcac atggtcctgc tggagttcgt gaccgccgcc gggatcactc tcggcatgga 780 cgagctgtac aagtaggcgc gcagcgctta gacgtctcgc gatcgatg 828 <210> 42 <211> 3870 <212> DNA <213> Artificial sequence <220> <223> Codon-optimized nucleotide sequence of the S3F polypeptide of nCoV <400> 42 gctagcagat ctcgtacggc caccatgttc gtgtttctgg tgctgctgcc actggtgtcc 60 agtcagtgcg tgaacctgac cacacgaaca cagctgccac cagcctacac caatagcttc 120 acccgcggag tgtactaccc cgacaaggtg ttccgcagca gcgtgctgca tagcacccag 180 gatctgtttc tgcccttctt cagcaacgtg acctggttcc acgccatcca cgtgtccggc 240 accaatggca ccaagcgctt cgataatccc gtgctgccct tcaacgatgg cgtgtacttt 300 gccagcaccg agaagtccaa tatcatccgc ggctggatct tcggcaccac actggatagc 360 aagacccaga gcctgctgat cgtgaacaac gccaccaacg tggtcatcaa agtgtgcgag 420 ttccagttct gcaacgaccc cttcctgggc gtctactacc acaagaacaa caagagctgg 480 atggaaagcg agttccgcgt gtacagcagc gccaacaact gcaccttcga gtacgtgtcc 540 cagccattcc tgatggacct ggaaggcaag cagggcaact tcaagaacct gcgcgagttc 600 gtgttcaaga acatcgacgg ctacttcaaa atctacagca agcacacccc aatcaacctc 660 gtgcgcgatc tgccacaggg attcagtgct ctggaacccc tggtggatct gcccatcggc 720 atcaacatta cccgctttca gacactgctg gccctgcacc gcagttactt gacaccaggc 780 gatagcagca gtggatggac agctggtgcc gccgcttact acgttggata tctgcagcca 840 cgcacctttc tgctgaagta caacgagaac ggcaccatca ccgacgccgt ggattgtgct 900 ctcgatcccc tgagcgagac aaagtgcacc ctgaagtcct tcaccgtcga gaagggcatc 960 taccagacca gcaatttccg cgtgcagccc accgagagca tcgtgcgctt ccccaatatc 1020 accaatctgt gccccttcgg cgaggtgttc aatgccacac gctttgcctc cgtgtacgcc 1080 tggaatcgca agcgcattag caactgcgtg gccgactact ccgtgctgta caatagcgcc 1140 agcttcagca ccttcaagtg ctacggcgtg tcacccacca agctgaacga cctgtgcttc 1200 accaatgtgt acgccgacag cttcgtgatc cgcggagatg aagtgcgaca gattgcccca 1260 ggccagaccg gcaagatcgc cgactacaat tacaagctgc ccgacgactt caccggctgc 1320 gtgatcgcct ggaacagcaa caacctggat tccaaagtcg gcggcaacta caactacctg 1380 taccgcctgt tccgcaagag caatctgaag cccttcgagc gcgacatcag caccgaaatc 1440 taccaggccg gaagcacccc atgcaacggc gtggaaggct tcaactgcta cttcccactg 1500 cagtcctacg gatttcagcc cacaaatggc gtgggctacc agccatatcg agtggtggtg 1560 ctgagcttcg aactgctgca tgctccagct accgtgtgcg gccccaagaa gagtaccaac 1620 ctggtcaaga acaaatgcgt gaacttcaac ttcaacggcc tgaccggaac cggcgtgctg 1680 accgagagta acaagaagtt cctgccattc cagcagtttg gccgcgacat tgccgataca 1740 accgatgccg ttcgcgatcc ccagaccttg gagatcctgg atattacccc atgctccttc 1800 ggcggcgtgt ccgtgattac accaggcacc aataccagca accaggtggc cgttctgtac 1860 caggatgtga attgcacaga ggtgcccgtg gccattcacg ccgatcaatt gacaccaaca 1920 tggcgcgtgt actccaccgg cagcaatgtg tttcaaaccc gcgctggatg cctgattgga 1980 gccgagcacg tgaacaatag ctacgagtgc gatatcccca tcggagccgg aatctgcgcc 2040 tcctatcaga cccagaccaa tagtccagga tccgccggaa gtgtggccag ccagagcatc 2100 attgcctata ccatgagcct gggcgccgag aatagcgtgg cctactccaa caacagcatt 2160 gctatcccca ccaacttcac catcagcgtg accaccgaga tcctgccagt gtccatgacc 2220 aagaccagcg tggactgcac catgtacatc tgcggagata gcaccgagtg cagcaacctg 2280 ctgctgcagt acggaagttt ctgcacccag ctgaatcgcg ccctgacagg cattgccgtg 2340 gaacaggata agaacaccca agaggtgttc gcccaagtga agcaaatcta caagacccca 2400 ccaatcaagg atttcggcgg cttcaatttc agccagattc tgcccgatcc aagcaagccc 2460 agcaagcgca gcttcatcga ggacctgctg ttcaacaaag tgacactggc cgacgccgga 2520 ttcatcaagc agtatggcga ttgcctgggc gatattgccg cacgcgatct gatttgcgcc 2580 cagaagttta acggactgac cgtcctgcca ccactgctga cagatgagat gatcgcccag 2640 tacacaagtg ccctgctggc cggaaccatt accagcggat ggacatttgg agccggtgcc 2700 gctctgcaga ttcccttcgc tatgcagatg gcctaccgct tcaatggcat tggcgtgacc 2760 cagaatgtgc tgtacgagaa ccagaagctg atcgccaacc agttcaacag cgccatcggc 2820 aagattcagg acagcctgag tagtaccgcc agcgctctgg gaaagctgca ggatgtggtc 2880 aaccagaacg ctcaggccct gaacaccctg gttaagcagc tgagcagcaa cttcggcgcc 2940 atcagtagcg tgctgaacga tatcctgagc cgcctggata aggtggaagc cgaggtgcag 3000 atcgatcgcc tgattaccgg acgcctgcag tccctgcaga cctatgtgac acagcagctg 3060 atccgagccg ccgagattcg agctagtgct aatctggccg ccaccaagat gagcgaatgt 3120 gtgctgggac agagcaagcg cgtggacttt tgcggcaagg gataccacct gatgagcttc 3180 ccacagagtg ctccacacgg cgtggtgttt ctgcatgtga cctacgtgcc cgctcaagag 3240 aagaatttca ccaccgctcc agccatctgc cacgacggaa aggcccattt tccacgcgag 3300 ggcgtgttcg ttagcaacgg cactcattgg ttcgtcaccc agcgcaactt ctacgagccc 3360 cagatcatca ccaccgacaa caccttcgtc agcggcaact gcgacgtcgt gatcggcatt 3420 gtgaacaaca ccgtgtacga tccactgcag cccgagctgg acagcttcaa agaggaactg 3480 gacaagtact ttaagaacca cacaagcccc gacgtggacc tgggagacat tagcggaatc 3540 aacgccagcg tggtcaacat ccagaaagag attgaccgcc tgaacgaggt ggccaagaat 3600 ctgaacgaga gcctgatcga cctgcaagaa ctgggcaaat acgagcagta cattaagtgg 3660 ccctggtaca tctggctggg cttcattgcc ggactgattg ccatcgtgat ggtcaccatt 3720 atgctgtgct gcatgaccag ttgctgcagc tgcctgaagg gatgctgcag ttgcggaagc 3780 tgctgcaagt tcgacgagga tgatagcgag ccagtgctga agggcgtcaa gctgcactac 3840 acctgataac gagcgcgcct cgaggaattc 3870 <210> 43 <211> 1273 <212> PRT <213> Artificial sequence <220> <223> S3F polypeptide of nCoV <400> 43 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Gly Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile 885 890 895 Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 1010 1015 1020 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys 1025 1030 1035 Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1040 1045 1050 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val 1055 1060 1065 Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His 1070 1075 1080 Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn 1085 1090 1095 Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln 1100 1105 1110 Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val 1115 1120 1125 Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro 1130 1135 1140 Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn 1145 1150 1155 His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn 1160 1165 1170 Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu 1175 1180 1185 Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu 1190 1195 1200 Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu 1205 1210 1215 Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met 1220 1225 1230 Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys 1235 1240 1245 Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro 1250 1255 1260 Val Leu Lys Gly Val Lys Leu His Tyr Thr 1265 1270 <210> 44 <211> 3870 <212> DNA <213> Artificial sequence <220> <223> Codon-optimized nucleotide sequence of the S2P3F polypeptide of nCoV <400> 44 gctagcagat ctcgtacggc caccatgttc gtgtttctgg tgctgctgcc actggtgtcc 60 agtcagtgcg tgaacctgac cacacgaaca cagctgccac cagcctacac caatagcttc 120 acccgcggag tgtactaccc cgacaaggtg ttccgcagca gcgtgctgca tagcacccag 180 gatctgtttc tgcccttctt cagcaacgtg acctggttcc acgccatcca cgtgtccggc 240 accaatggca ccaagcgctt cgataatccc gtgctgccct tcaacgatgg cgtgtacttt 300 gccagcaccg agaagtccaa tatcatccgc ggctggatct tcggcaccac actggatagc 360 aagacccaga gcctgctgat cgtgaacaac gccaccaacg tggtcatcaa agtgtgcgag 420 ttccagttct gcaacgaccc cttcctgggc gtctactacc acaagaacaa caagagctgg 480 atggaaagcg agttccgcgt gtacagcagc gccaacaact gcaccttcga gtacgtgtcc 540 cagccattcc tgatggacct ggaaggcaag cagggcaact tcaagaacct gcgcgagttc 600 gtgttcaaga acatcgacgg ctacttcaaa atctacagca agcacacccc aatcaacctc 660 gtgcgcgatc tgccacaggg attcagtgct ctggaacccc tggtggatct gcccatcggc 720 atcaacatta cccgctttca gacactgctg gccctgcacc gcagttactt gacaccaggc 780 gatagcagca gtggatggac agctggtgcc gccgcttact acgttggata tctgcagcca 840 cgcacctttc tgctgaagta caacgagaac ggcaccatca ccgacgccgt ggattgtgct 900 ctcgatcccc tgagcgagac aaagtgcacc ctgaagtcct tcaccgtcga gaagggcatc 960 taccagacca gcaatttccg cgtgcagccc accgagagca tcgtgcgctt ccccaatatc 1020 accaatctgt gccccttcgg cgaggtgttc aatgccacac gctttgcctc cgtgtacgcc 1080 tggaatcgca agcgcattag caactgcgtg gccgactact ccgtgctgta caatagcgcc 1140 agcttcagca ccttcaagtg ctacggcgtg tcacccacca agctgaacga cctgtgcttc 1200 accaatgtgt acgccgacag cttcgtgatc cgcggagatg aagtgcgaca gattgcccca 1260 ggccagaccg gcaagatcgc cgactacaat tacaagctgc ccgacgactt caccggctgc 1320 gtgatcgcct ggaacagcaa caacctggat tccaaagtcg gcggcaacta caactacctg 1380 taccgcctgt tccgcaagag caatctgaag cccttcgagc gcgacatcag caccgaaatc 1440 taccaggccg gaagcacccc atgcaacggc gtggaaggct tcaactgcta cttcccactg 1500 cagtcctacg gatttcagcc cacaaatggc gtgggctacc agccatatcg agtggtggtg 1560 ctgagcttcg aactgctgca tgctccagct accgtgtgcg gccccaagaa gagtaccaac 1620 ctggtcaaga acaaatgcgt gaacttcaac ttcaacggcc tgaccggaac cggcgtgctg 1680 accgagagta acaagaagtt cctgccattc cagcagtttg gccgcgacat tgccgataca 1740 accgatgccg ttcgcgatcc ccagaccttg gagatcctgg atattacccc atgctccttc 1800 ggcggcgtgt ccgtgattac accaggcacc aataccagca accaggtggc cgttctgtac 1860 caggatgtga attgcacaga ggtgcccgtg gccattcacg ccgatcaatt gacaccaaca 1920 tggcgcgtgt actccaccgg cagcaatgtg tttcaaaccc gcgctggatg cctgattgga 1980 gccgagcacg tgaacaatag ctacgagtgc gatatcccca tcggagccgg aatctgcgcc 2040 tcctatcaga cccagaccaa tagtccagga tccgccggaa gtgtggccag ccagagcatc 2100 attgcctata ccatgagcct gggcgccgag aatagcgtgg cctactccaa caacagcatt 2160 gctatcccca ccaacttcac catcagcgtg accaccgaga tcctgccagt gtccatgacc 2220 aagaccagcg tggactgcac catgtacatc tgcggagata gcaccgagtg cagcaacctg 2280 ctgctgcagt acggaagttt ctgcacccag ctgaatcgcg ccctgacagg cattgccgtg 2340 gaacaggata agaacaccca agaggtgttc gcccaagtga agcaaatcta caagacccca 2400 ccaatcaagg atttcggcgg cttcaatttc agccagattc tgcccgatcc aagcaagccc 2460 agcaagcgca gcttcatcga ggacctgctg ttcaacaaag tgacactggc cgacgccgga 2520 ttcatcaagc agtatggcga ttgcctgggc gatattgccg cacgcgatct gatttgcgcc 2580 cagaagttta acggactgac cgtcctgcca ccactgctga cagatgagat gatcgcccag 2640 tacacaagtg ccctgctggc cggaaccatt accagcggat ggacatttgg agccggtgcc 2700 gctctgcaga ttcccttcgc tatgcagatg gcctaccgct tcaatggcat tggcgtgacc 2760 cagaatgtgc tgtacgagaa ccagaagctg atcgccaacc agttcaacag cgccatcggc 2820 aagattcagg acagcctgag tagtaccgcc agcgctctgg gaaagctgca ggatgtggtc 2880 aaccagaacg ctcaggccct gaacaccctg gttaagcagc tgagcagcaa cttcggcgcc 2940 atcagtagcg tgctgaacga tatcctgagc cgcctggatc caccagaagc cgaggtgcag 3000 atcgatcgcc tgattaccgg acgcctgcag tccctgcaga cctatgtgac acagcagctg 3060 atccgagccg ccgagattcg agctagtgct aatctggccg ccaccaagat gagcgaatgt 3120 gtgctgggac agagcaagcg cgtggacttt tgcggcaagg gataccacct gatgagcttc 3180 ccacagagtg ctccacacgg cgtggtgttt ctgcatgtga cctacgtgcc cgctcaagag 3240 aagaatttca ccaccgctcc agccatctgc cacgacggaa aggcccattt tccacgcgag 3300 ggcgtgttcg ttagcaacgg cactcattgg ttcgtcaccc agcgcaactt ctacgagccc 3360 cagatcatca ccaccgacaa caccttcgtc agcggcaact gcgacgtcgt gatcggcatt 3420 gtgaacaaca ccgtgtacga tccactgcag cccgagctgg acagcttcaa agaggaactg 3480 gacaagtact ttaagaacca cacaagcccc gacgtggacc tgggagacat tagcggaatc 3540 aacgccagcg tggtcaacat ccagaaagag attgaccgcc tgaacgaggt ggccaagaat 3600 ctgaacgaga gcctgatcga cctgcaagaa ctgggcaaat acgagcagta cattaagtgg 3660 ccctggtaca tctggctggg cttcattgcc ggactgattg ccatcgtgat ggtcaccatt 3720 atgctgtgct gcatgaccag ttgctgcagc tgcctgaagg gatgctgcag ttgcggaagc 3780 tgctgcaagt tcgacgagga tgatagcgag ccagtgctga agggcgtcaa gctgcactac 3840 acctgataac gagcgcgcct cgaggaattc 3870 <210> 45 <211> 1273 <212> PRT <213> Artificial sequence <220> <223> S2P3F polypeptide of nCoV <400> 45 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Gly Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile 885 890 895 Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 1010 1015 1020 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys 1025 1030 1035 Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1040 1045 1050 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val 1055 1060 1065 Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His 1070 1075 1080 Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn 1085 1090 1095 Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln 1100 1105 1110 Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val 1115 1120 1125 Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro 1130 1135 1140 Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn 1145 1150 1155 His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn 1160 1165 1170 Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu 1175 1180 1185 Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu 1190 1195 1200 Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu 1205 1210 1215 Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met 1220 1225 1230 Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys 1235 1240 1245 Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro 1250 1255 1260 Val Leu Lys Gly Val Lys Leu His Tyr Thr 1265 1270 <210> 46 <211> 3834 <212> DNA <213> Artificial sequence <220> <223> Codon-optimized nucleotide sequence of the S2PdeltaF polypeptide of nCoV <400> 46 gctagcagat ctcgtacggc caccatgttc gtgtttctgg tgctgctgcc actggtgtcc 60 agtcagtgcg tgaacctgac cacacgaaca cagctgccac cagcctacac caatagcttc 120 acccgcggag tgtactaccc cgacaaggtg ttccgcagca gcgtgctgca tagcacccag 180 gatctgtttc tgcccttctt cagcaacgtg acctggttcc acgccatcca cgtgtccggc 240 accaatggca ccaagcgctt cgataatccc gtgctgccct tcaacgatgg cgtgtacttt 300 gccagcaccg agaagtccaa tatcatccgc ggctggatct tcggcaccac actggatagc 360 aagacccaga gcctgctgat cgtgaacaac gccaccaacg tggtcatcaa agtgtgcgag 420 ttccagttct gcaacgaccc cttcctgggc gtctactacc acaagaacaa caagagctgg 480 atggaaagcg agttccgcgt gtacagcagc gccaacaact gcaccttcga gtacgtgtcc 540 cagccattcc tgatggacct ggaaggcaag cagggcaact tcaagaacct gcgcgagttc 600 gtgttcaaga acatcgacgg ctacttcaaa atctacagca agcacacccc aatcaacctc 660 gtgcgcgatc tgccacaggg attcagtgct ctggaacccc tggtggatct gcccatcggc 720 atcaacatta cccgctttca gacactgctg gccctgcacc gcagttactt gacaccaggc 780 gatagcagca gtggatggac agctggtgcc gccgcttact acgttggata tctgcagcca 840 cgcacctttc tgctgaagta caacgagaac ggcaccatca ccgacgccgt ggattgtgct 900 ctcgatcccc tgagcgagac aaagtgcacc ctgaagtcct tcaccgtcga gaagggcatc 960 taccagacca gcaatttccg cgtgcagccc accgagagca tcgtgcgctt ccccaatatc 1020 accaatctgt gccccttcgg cgaggtgttc aatgccacac gctttgcctc cgtgtacgcc 1080 tggaatcgca agcgcattag caactgcgtg gccgactact ccgtgctgta caatagcgcc 1140 agcttcagca ccttcaagtg ctacggcgtg tcacccacca agctgaacga cctgtgcttc 1200 accaatgtgt acgccgacag cttcgtgatc cgcggagatg aagtgcgaca gattgcccca 1260 ggccagaccg gcaagatcgc cgactacaat tacaagctgc ccgacgactt caccggctgc 1320 gtgatcgcct ggaacagcaa caacctggat tccaaagtcg gcggcaacta caactacctg 1380 taccgcctgt tccgcaagag caatctgaag cccttcgagc gcgacatcag caccgaaatc 1440 taccaggccg gaagcacccc atgcaacggc gtggaaggct tcaactgcta cttcccactg 1500 cagtcctacg gatttcagcc cacaaatggc gtgggctacc agccatatcg agtggtggtg 1560 ctgagcttcg aactgctgca tgctccagct accgtgtgcg gccccaagaa gagtaccaac 1620 ctggtcaaga acaaatgcgt gaacttcaac ttcaacggcc tgaccggaac cggcgtgctg 1680 accgagagta acaagaagtt cctgccattc cagcagtttg gccgcgacat tgccgataca 1740 accgatgccg ttcgcgatcc ccagaccttg gagatcctgg atattacccc atgctccttc 1800 ggcggcgtgt ccgtgattac accaggcacc aataccagca accaggtggc cgttctgtac 1860 caggatgtga attgcacaga ggtgcccgtg gccattcacg ccgatcaatt gacaccaaca 1920 tggcgcgtgt actccaccgg cagcaatgtg tttcaaaccc gcgctggatg cctgattgga 1980 gccgagcacg tgaacaatag ctacgagtgc gatatcccca tcggagccgg aatctgcgca 2040 tcctatagtg tggccagcca gagcatcatt gcctatacca tgagcctggg cgccgagaat 2100 agcgtggcct actccaacaa cagcattgct atccccacca acttcaccat cagcgtgacc 2160 accgagatcc tgccagtgtc catgaccaag accagcgtgg actgcaccat gtacatctgc 2220 ggagatagca ccgagtgcag caacctgctg ctgcagtacg gaagtttctg cacccagctg 2280 aatcgcgccc tgacaggcat tgccgtggaa caggataaga acacccaaga ggtgttcgcc 2340 caagtgaagc aaatctacaa gaccccacca atcaaggatt tcggcggctt caatttcagc 2400 cagattctgc ccgatccaag caagcccagc aagcgcagct tcatcgagga cctgctgttc 2460 aacaaagtga cactggccga cgccggattc atcaagcagt atggcgattg cctgggcgat 2520 attgccgcac gcgatctgat ttgcgcccag aagtttaacg gactgaccgt cctgccacca 2580 ctgctgacag atgagatgat cgcccagtac acaagtgccc tgctggccgg aaccattacc 2640 agcggatgga catttggagc cggtgccgct ctgcagattc ccttcgctat gcagatggcc 2700 taccgcttca atggcattgg cgtgacccag aatgtgctgt acgagaacca gaagctgatc 2760 gccaaccagt tcaacagcgc catcggcaag attcaggaca gcctgagtag taccgccagc 2820 gctctgggaa agctgcagga tgtggtcaac cagaacgctc aggccctgaa caccctggtt 2880 aagcagctga gcagcaactt cggcgccatc agtagcgtgc tgaacgatat cctgagccgc 2940 ctggatccac cagaagccga ggtgcagatc gatcgcctga ttaccggacg cctgcagtcc 3000 ctgcagacct atgtgacaca gcagctgatc cgagccgccg agattcgagc tagtgctaat 3060 ctggccgcca ccaagatgag cgaatgtgtg ctgggacaga gcaagcgcgt ggacttttgc 3120 ggcaagggat accacctgat gagcttccca cagagtgctc cacacggcgt ggtgtttctg 3180 catgtgacct acgtgcccgc tcaagagaag aatttcacca ccgctccagc catctgccac 3240 gacggaaagg cccattttcc acgcgagggc gtgttcgtta gcaacggcac tcattggttc 3300 gtcacccagc gcaacttcta cgagccccag atcatcacca ccgacaacac cttcgtcagc 3360 ggcaactgcg acgtcgtgat cggcattgtg aacaacaccg tgtacgatcc actgcagccc 3420 gagctggaca gcttcaaaga ggaactggac aagtacttta agaaccacac aagccccgac 3480 gtggacctgg gagacattag cggaatcaac gccagcgtgg tcaacatcca gaaagagatt 3540 gaccgcctga acgaggtggc caagaatctg aacgagagcc tgatcgacct gcaagaactg 3600 ggcaaatacg agcagtacat taagtggccc tggtacatct ggctgggctt cattgccgga 3660 ctgattgcca tcgtgatggt caccattatg ctgtgctgca tgaccagttg ctgcagctgc 3720 ctgaagggat gctgcagttg cggaagctgc tgcaagttcg acgaggatga tagcgagcca 3780 gtgctgaagg gcgtcaagct gcactacacc tgataagcgc gcctcgagga attc 3834 <210> 47 <211> 1262 <212> PRT <213> Artificial sequence <220> <223> S2PdeltaF polypeptide of nCoV <400> 47 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu 675 680 685 Gly Ala Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro 690 695 700 Thr Asn Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met 705 710 715 720 Thr Lys Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr 725 730 735 Glu Cys Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu 740 745 750 Asn Arg Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln 755 760 765 Glu Val Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys 770 775 780 Asp Phe Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys 785 790 795 800 Pro Ser Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr 805 810 815 Leu Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp 820 825 830 Ile Ala Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr 835 840 845 Val Leu Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser 850 855 860 Ala Leu Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly 865 870 875 880 Ala Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn 885 890 895 Gly Ile Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile 900 905 910 Ala Asn Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser 915 920 925 Ser Thr Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn 930 935 940 Ala Gln Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly 945 950 955 960 Ala Ile Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro 965 970 975 Glu Ala Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser 980 985 990 Leu Gln Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg 995 1000 1005 Ala Ser Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu 1010 1015 1020 Gly Gln Ser Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu 1025 1030 1035 Met Ser Phe Pro Gln Ser Ala Pro His Gly Val Val Phe Leu His 1040 1045 1050 Val Thr Tyr Val Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro 1055 1060 1065 Ala Ile Cys His Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val 1070 1075 1080 Phe Val Ser Asn Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe 1085 1090 1095 Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly 1100 1105 1110 Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp 1115 1120 1125 Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys 1130 1135 1140 Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile 1145 1150 1155 Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp 1160 1165 1170 Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp 1175 1180 1185 Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp 1190 1195 1200 Tyr Ile Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met 1205 1210 1215 Val Thr Ile Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu 1220 1225 1230 Lys Gly Cys Cys Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp 1235 1240 1245 Asp Ser Glu Pro Val Leu Lys Gly Val Lys Leu His Tyr Thr 1250 1255 1260 <210> 48 <211> 3834 <212> DNA <213> Artificial sequence <220> <223> Codon-optimized nucleotide sequence of the S2PdeltaF2A polypeptide of nCoV <400> 48 gctagcagat ctcgtacggc caccatgttc gtgtttctgg tgctgctgcc actggtgtcc 60 agtcagtgcg tgaacctgac cacacgaaca cagctgccac cagcctacac caatagcttc 120 acccgcggag tgtactaccc cgacaaggtg ttccgcagca gcgtgctgca tagcacccag 180 gatctgtttc tgcccttctt cagcaacgtg acctggttcc acgccatcca cgtgtccggc 240 accaatggca ccaagcgctt cgataatccc gtgctgccct tcaacgatgg cgtgtacttt 300 gccagcaccg agaagtccaa tatcatccgc ggctggatct tcggcaccac actggatagc 360 aagacccaga gcctgctgat cgtgaacaac gccaccaacg tggtcatcaa agtgtgcgag 420 ttccagttct gcaacgaccc cttcctgggc gtctactacc acaagaacaa caagagctgg 480 atggaaagcg agttccgcgt gtacagcagc gccaacaact gcaccttcga gtacgtgtcc 540 cagccattcc tgatggacct ggaaggcaag cagggcaact tcaagaacct gcgcgagttc 600 gtgttcaaga acatcgacgg ctacttcaaa atctacagca agcacacccc aatcaacctc 660 gtgcgcgatc tgccacaggg attcagtgct ctggaacccc tggtggatct gcccatcggc 720 atcaacatta cccgctttca gacactgctg gccctgcacc gcagttactt gacaccaggc 780 gatagcagca gtggatggac agctggtgcc gccgcttact acgttggata tctgcagcca 840 cgcacctttc tgctgaagta caacgagaac ggcaccatca ccgacgccgt ggattgtgct 900 ctcgatcccc tgagcgagac aaagtgcacc ctgaagtcct tcaccgtcga gaagggcatc 960 taccagacca gcaatttccg cgtgcagccc accgagagca tcgtgcgctt ccccaatatc 1020 accaatctgt gccccttcgg cgaggtgttc aatgccacac gctttgcctc cgtgtacgcc 1080 tggaatcgca agcgcattag caactgcgtg gccgactact ccgtgctgta caatagcgcc 1140 agcttcagca ccttcaagtg ctacggcgtg tcacccacca agctgaacga cctgtgcttc 1200 accaatgtgt acgccgacag cttcgtgatc cgcggagatg aagtgcgaca gattgcccca 1260 ggccagaccg gcaagatcgc cgactacaat tacaagctgc ccgacgactt caccggctgc 1320 gtgatcgcct ggaacagcaa caacctggat tccaaagtcg gcggcaacta caactacctg 1380 taccgcctgt tccgcaagag caatctgaag cccttcgagc gcgacatcag caccgaaatc 1440 taccaggccg gaagcacccc atgcaacggc gtggaaggct tcaactgcta cttcccactg 1500 cagtcctacg gatttcagcc cacaaatggc gtgggctacc agccatatcg agtggtggtg 1560 ctgagcttcg aactgctgca tgctccagct accgtgtgcg gccccaagaa gagtaccaac 1620 ctggtcaaga acaaatgcgt gaacttcaac ttcaacggcc tgaccggaac cggcgtgctg 1680 accgagagta acaagaagtt cctgccattc cagcagtttg gccgcgacat tgccgataca 1740 accgatgccg ttcgcgatcc ccagaccttg gagatcctgg atattacccc atgctccttc 1800 ggcggcgtgt ccgtgattac accaggcacc aataccagca accaggtggc cgttctgtac 1860 caggatgtga attgcacaga ggtgcccgtg gccattcacg ccgatcaatt gacaccaaca 1920 tggcgcgtgt actccaccgg cagcaatgtg tttcaaaccc gcgctggatg cctgattgga 1980 gccgagcacg tgaacaatag ctacgagtgc gatatcccca tcggagccgg aatctgcgca 2040 tcctatagtg tggccagcca gagcatcatt gcctatacca tgagcctggg cgccgagaat 2100 agcgtggcct actccaacaa cagcattgct atccccacca acttcaccat cagcgtgacc 2160 accgagatcc tgccagtgtc catgaccaag accagcgtgg actgcaccat gtacatctgc 2220 ggagatagca ccgagtgcag caacctgctg ctgcagtacg gaagtttctg cacccagctg 2280 aatcgcgccc tgacaggcat tgccgtggaa caggataaga acacccaaga ggtgttcgcc 2340 caagtgaagc aaatctacaa gaccccacca atcaaggatt tcggcggctt caatttcagc 2400 cagattctgc ccgatccaag caagcccagc aagcgcagct tcatcgagga cctgctgttc 2460 aacaaagtga cactggccga cgccggattc atcaagcagt atggcgattg cctgggcgat 2520 attgccgcac gcgatctgat ttgcgcccag aagtttaacg gactgaccgt cctgccacca 2580 ctgctgacag atgagatgat cgcccagtac acaagtgccc tgctggccgg aaccattacc 2640 agcggatgga catttggagc cggtgccgct ctgcagattc ccttcgctat gcagatggcc 2700 taccgcttca atggcattgg cgtgacccag aatgtgctgt acgagaacca gaagctgatc 2760 gccaaccagt tcaacagcgc catcggcaag attcaggaca gcctgagtag taccgccagc 2820 gctctgggaa agctgcagga tgtggtcaac cagaacgctc aggccctgaa caccctggtt 2880 aagcagctga gcagcaactt cggcgccatc agtagcgtgc tgaacgatat cctgagccgc 2940 ctggatccac cagaagccga ggtgcagatc gatcgcctga ttaccggacg cctgcagtcc 3000 ctgcagacct atgtgacaca gcagctgatc cgagccgccg agattcgagc tagtgctaat 3060 ctggccgcca ccaagatgag cgaatgtgtg ctgggacaga gcaagcgcgt ggacttttgc 3120 ggcaagggat accacctgat gagcttccca cagagtgctc cacacggcgt ggtgtttctg 3180 catgtgacct acgtgcccgc tcaagagaag aatttcacca ccgctccagc catctgccac 3240 gacggaaagg cccattttcc acgcgagggc gtgttcgtta gcaacggcac tcattggttc 3300 gtcacccagc gcaacttcta cgagccccag atcatcacca ccgacaacac cttcgtcagc 3360 ggcaactgcg acgtcgtgat cggcattgtg aacaacaccg tgtacgatcc actgcagccc 3420 gagctggaca gcttcaaaga ggaactggac aagtacttta agaaccacac aagccccgac 3480 gtggacctgg gagacattag cggaatcaac gccagcgtgg tcaacatcca gaaagagatt 3540 gaccgcctga acgaggtggc caagaatctg aacgagagcc tgatcgacct gcaagaactg 3600 ggcaaatacg agcagtacat taagtggccc tggtacatct ggctgggctt cattgccgga 3660 ctgattgcca tcgtgatggt caccattatg ctgtgctgca tgaccagttg ctgcagctgc 3720 ctgaagggat gctgcagttg cggaagctgc tgcaagttcg acgaggatga tagcgagcca 3780 gtgctgaagg gcgtcgccct ggcctacacc tgataagcgc gcctcgagga attc 3834 <210> 49 <211> 1262 <212> PRT <213> Artificial sequence <220> <223> S2PdeltaF2A polypeptide of nCoV <400> 49 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu 675 680 685 Gly Ala Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro 690 695 700 Thr Asn Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met 705 710 715 720 Thr Lys Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr 725 730 735 Glu Cys Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu 740 745 750 Asn Arg Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln 755 760 765 Glu Val Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys 770 775 780 Asp Phe Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys 785 790 795 800 Pro Ser Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr 805 810 815 Leu Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp 820 825 830 Ile Ala Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr 835 840 845 Val Leu Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser 850 855 860 Ala Leu Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly 865 870 875 880 Ala Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn 885 890 895 Gly Ile Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile 900 905 910 Ala Asn Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser 915 920 925 Ser Thr Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn 930 935 940 Ala Gln Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly 945 950 955 960 Ala Ile Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro 965 970 975 Glu Ala Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser 980 985 990 Leu Gln Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg 995 1000 1005 Ala Ser Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu 1010 1015 1020 Gly Gln Ser Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu 1025 1030 1035 Met Ser Phe Pro Gln Ser Ala Pro His Gly Val Val Phe Leu His 1040 1045 1050 Val Thr Tyr Val Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro 1055 1060 1065 Ala Ile Cys His Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val 1070 1075 1080 Phe Val Ser Asn Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe 1085 1090 1095 Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly 1100 1105 1110 Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp 1115 1120 1125 Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys 1130 1135 1140 Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile 1145 1150 1155 Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp 1160 1165 1170 Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp 1175 1180 1185 Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp 1190 1195 1200 Tyr Ile Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met 1205 1210 1215 Val Thr Ile Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu 1220 1225 1230 Lys Gly Cys Cys Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp 1235 1240 1245 Asp Ser Glu Pro Val Leu Lys Gly Val Ala Leu Ala Tyr Thr 1250 1255 1260 <210> 50 <211> 11 <212> PRT <213> Artificial sequence <220> <223> S1/S2 furin cleavage site of the spike (S) polypeptide of nCoV <400> 50 Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg 1 5 10 <210> 51 <211> 3744 <212> DNA <213> Artificial sequence <220> <223> Codon-optimized nucleotide sequence of the T4-S2P3F polypeptide of SARS-CoV-2 <400> 51 cgtacggcca ccatgttcgt gtttctggtg ctgctgccac tggtgtccag tcagtgcgtg 60 aacctgacca cacgaacaca gctgccacca gcctacacca atagcttcac ccgcggagtg 120 tactaccccg acaaggtgtt ccgcagcagc gtgctgcata gcacccagga tctgtttctg 180 cccttcttca gcaacgtgac ctggttccac gccatccacg tgtccggcac caatggcacc 240 aagcgcttcg ataatcccgt gctgcccttc aacgatggcg tgtactttgc cagcaccgag 300 aagtccaata tcatccgcgg ctggatcttc ggcaccacac tggatagcaa gacccagagc 360 ctgctgatcg tgaacaacgc caccaacgtg gtcatcaaag tgtgcgagtt ccagttctgc 420 aacgacccct tcctgggcgt ctactaccac aagaacaaca agagctggat ggaaagcgag 480 ttccgcgtgt acagcagcgc caacaactgc accttcgagt acgtgtccca gccattcctg 540 atggacctgg aaggcaagca gggcaacttc aagaacctgc gcgagttcgt gttcaagaac 600 atcgacggct acttcaaaat ctacagcaag cacaccccaa tcaacctcgt gcgcgatctg 660 ccacagggat tcagtgctct ggaacccctg gtggatctgc ccatcggcat caacattacc 720 cgctttcaga cactgctggc cctgcaccgc agttacttga caccaggcga tagcagcagt 780 ggatggacag ctggtgccgc cgcttactac gttggatatc tgcagccacg cacctttctg 840 ctgaagtaca acgagaacgg caccatcacc gacgccgtgg attgtgctct cgatcccctg 900 agcgagacaa agtgcaccct gaagtccttc accgtcgaga agggcatcta ccagaccagc 960 aatttccgcg tgcagcccac cgagagcatc gtgcgcttcc ccaatatcac caatctgtgc 1020 cccttcggcg aggtgttcaa tgccacacgc tttgcctccg tgtacgcctg gaatcgcaag 1080 cgcattagca actgcgtggc cgactactcc gtgctgtaca atagcgccag cttcagcacc 1140 ttcaagtgct acggcgtgtc acccaccaag ctgaacgacc tgtgcttcac caatgtgtac 1200 gccgacagct tcgtgatccg cggagatgaa gtgcgacaga ttgccccagg ccagaccggc 1260 aagatcgccg actacaatta caagctgccc gacgacttca ccggctgcgt gatcgcctgg 1320 aacagcaaca acctggattc caaagtcggc ggcaactaca actacctgta ccgcctgttc 1380 cgcaagagca atctgaagcc cttcgagcgc gacatcagca ccgaaatcta ccaggccgga 1440 agcaccccat gcaacggcgt ggaaggcttc aactgctact tcccactgca gtcctacgga 1500 tttcagccca caaatggcgt gggctaccag ccatatcgag tggtggtgct gagcttcgaa 1560 ctgctgcatg ctccagctac cgtgtgcggc cccaagaaga gtaccaacct ggtcaagaac 1620 aaatgcgtga acttcaactt caacggcctg accggaaccg gcgtgctgac cgagagtaac 1680 aagaagttcc tgccattcca gcagtttggc cgcgacattg ccgatacaac cgatgccgtt 1740 cgcgatcccc agaccttgga gatcctggat attaccccat gctccttcgg cggcgtgtcc 1800 gtgattacac caggcaccaa taccagcaac caggtggccg ttctgtacca ggatgtgaat 1860 tgcacagagg tgcccgtggc cattcacgcc gatcaattga caccaacatg gcgcgtgtac 1920 tccaccggca gcaatgtgtt tcaaacccgc gctggatgcc tgattggagc cgagcacgtg 1980 aacaatagct acgagtgcga tatccccatc ggagccggaa tctgcgcctc ctatcagacc 2040 cagaccaata gtccaggatc cgccggaagt gtggccagcc agagcatcat tgcctatacc 2100 atgagcctgg gcgccgagaa tagcgtggcc tactccaaca acagcattgc tatccccacc 2160 aacttcacca tcagcgtgac caccgagatc ctgccagtgt ccatgaccaa gaccagcgtg 2220 gactgcacca tgtacatctg cggagatagc accgagtgca gcaacctgct gctgcagtac 2280 ggaagtttct gcacccagct gaatcgcgcc ctgacaggca ttgccgtgga acaggataag 2340 aacacccaag aggtgttcgc ccaagtgaag caaatctaca agaccccacc aatcaaggat 2400 ttcggcggct tcaatttcag ccagattctg cccgatccaa gcaagcccag caagcgcagc 2460 ttcatcgagg acctgctgtt caacaaagtg acactggccg acgccggatt catcaagcag 2520 tatggcgatt gcctgggcga tattgccgca cgcgatctga tttgcgccca gaagtttaac 2580 ggactgaccg tcctgccacc actgctgaca gatgagatga tcgcccagta cacaagtgcc 2640 ctgctggccg gaaccattac cagcggatgg acatttggag ccggtgccgc tctgcagatt 2700 cccttcgcta tgcagatggc ctaccgcttc aatggcattg gcgtgaccca gaatgtgctg 2760 tacgagaacc agaagctgat cgccaaccag ttcaacagcg ccatcggcaa gattcaggac 2820 agcctgagta gtaccgccag cgctctggga aagctgcagg atgtggtcaa ccagaacgct 2880 caggccctga acaccctggt taagcagctg agcagcaact tcggcgccat cagtagcgtg 2940 ctgaacgata tcctgagccg cctggatcca ccagaagccg aggtgcagat cgatcgcctg 3000 attaccggac gcctgcagtc cctgcagacc tatgtgacac agcagctgat ccgagccgcc 3060 gagattcgag ctagtgctaa tctggccgcc accaagatga gcgaatgtgt gctgggacag 3120 agcaagcgcg tggacttttg cggcaaggga taccacctga tgagcttccc acagagtgct 3180 ccacacggcg tggtgtttct gcatgtgacc tacgtgcccg ctcaagagaa gaatttcacc 3240 accgctccag ccatctgcca cgacggaaag gcccattttc cacgcgaggg cgtgttcgtt 3300 agcaacggca ctcattggtt cgtcacccag cgcaacttct acgagcccca gatcatcacc 3360 accgacaaca ccttcgtcag cggcaactgc gacgtcgtga tcggcattgt gaacaacacc 3420 gtgtacgatc cactgcagcc cgagctggac agcttcaaag aggaactgga caagtacttt 3480 aagaaccaca caagccccga cgtggacctg ggagacatta gcggaatcaa cgccagcgtg 3540 gtcaacatcc agaaagagat tgaccgcctg aacgaggtgg ccaagaatct gaacgagagc 3600 ctgatcgacc tgcaagaact gggcaaatac gagcagtaca ttaagtccgg aggctacatc 3660 cccgaggccc cacgcgatgg ccaggcctac gtgcgcaagg acggcgagtg ggtgctgctg 3720 tccaccttcc tgtgataagc gcgc 3744 <210> 52 <211> 1240 <212> PRT <213> Artificial sequence <220> <223> T4-S2P3F polypeptide of SARS-CoV-2 <400> 52 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Gly Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile 885 890 895 Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 1010 1015 1020 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys 1025 1030 1035 Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1040 1045 1050 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val 1055 1060 1065 Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His 1070 1075 1080 Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn 1085 1090 1095 Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln 1100 1105 1110 Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val 1115 1120 1125 Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro 1130 1135 1140 Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn 1145 1150 1155 His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn 1160 1165 1170 Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu 1175 1180 1185 Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu 1190 1195 1200 Gly Lys Tyr Glu Gln Tyr Ile Lys Ser Gly Gly Tyr Ile Pro Glu 1205 1210 1215 Ala Pro Arg Asp Gly Gln Ala Tyr Val Arg Lys Asp Gly Glu Trp 1220 1225 1230 Val Leu Leu Ser Thr Phe Leu 1235 1240 <210> 53 <211> 3870 <212> DNA <213> Artificial sequence <220> <223> Codon-optimized nucleotide sequence of the S6P polypeptide of SARS-CoV-2 <400> 53 gctagcagat ctcgtacggc caccatgttc gtgtttctgg tgctgctgcc actggtgtcc 60 agtcagtgcg tgaacctgac cacacgaaca cagctgccac cagcctacac caatagcttc 120 acccgcggag tgtactaccc cgacaaggtg ttccgcagca gcgtgctgca tagcacccag 180 gatctgtttc tgcccttctt cagcaacgtg acctggttcc acgccatcca cgtgtccggc 240 accaatggca ccaagcgctt cgataatccc gtgctgccct tcaacgatgg cgtgtacttt 300 gccagcaccg agaagtccaa tatcatccgc ggctggatct tcggcaccac actggatagc 360 aagacccaga gcctgctgat cgtgaacaac gccaccaacg tggtcatcaa agtgtgcgag 420 ttccagttct gcaacgaccc cttcctgggc gtctactacc acaagaacaa caagagctgg 480 atggaaagcg agttccgcgt gtacagcagc gccaacaact gcaccttcga gtacgtgtcc 540 cagccattcc tgatggacct ggaaggcaag cagggcaact tcaagaacct gcgcgagttc 600 gtgttcaaga acatcgacgg ctacttcaaa atctacagca agcacacccc aatcaacctc 660 gtgcgcgatc tgccacaggg attcagtgct ctggaacccc tggtggatct gcccatcggc 720 atcaacatta cccgctttca gacactgctg gccctgcacc gcagttactt gacaccaggc 780 gatagcagca gtggatggac agctggtgcc gccgcttact acgttggata tctgcagcca 840 cgcacctttc tgctgaagta caacgagaac ggcaccatca ccgacgccgt ggattgtgct 900 ctcgatcccc tgagcgagac aaagtgcacc ctgaagtcct tcaccgtcga gaagggcatc 960 taccagacca gcaatttccg cgtgcagccc accgagagca tcgtgcgctt ccccaatatc 1020 accaatctgt gccccttcgg cgaggtgttc aatgccacac gctttgcctc cgtgtacgcc 1080 tggaatcgca agcgcattag caactgcgtg gccgactact ccgtgctgta caatagcgcc 1140 agcttcagca ccttcaagtg ctacggcgtg tcacccacca agctgaacga cctgtgcttc 1200 accaatgtgt acgccgacag cttcgtgatc cgcggagatg aagtgcgaca gattgcccca 1260 ggccagaccg gcaagatcgc cgactacaat tacaagctgc ccgacgactt caccggctgc 1320 gtgatcgcct ggaacagcaa caacctggat tccaaagtcg gcggcaacta caactacctg 1380 taccgcctgt tccgcaagag caatctgaag cccttcgagc gcgacatcag caccgaaatc 1440 taccaggccg gaagcacccc atgcaacggc gtggaaggct tcaactgcta cttcccactg 1500 cagtcctacg gatttcagcc cacaaatggc gtgggctacc agccatatcg agtggtggtg 1560 ctgagcttcg aactgctgca tgctccagct accgtgtgcg gccccaagaa gagtaccaac 1620 ctggtcaaga acaaatgcgt gaacttcaac ttcaacggcc tgaccggaac cggcgtgctg 1680 accgagagta acaagaagtt cctgccattc cagcagtttg gccgcgacat tgccgataca 1740 accgatgccg ttcgcgatcc ccagaccttg gagatcctgg atattacccc atgctccttc 1800 ggcggcgtgt ccgtgattac accaggcacc aataccagca accaggtggc cgttctgtac 1860 caggatgtga attgcacaga ggtgcccgtg gccattcacg ccgatcaatt gacaccaaca 1920 tggcgcgtgt actccaccgg cagcaatgtg tttcaaaccc gcgctggatg cctgattgga 1980 gccgagcacg tgaacaatag ctacgagtgc gatatcccca tcggagccgg aatctgcgcc 2040 tcctatcaga cccagaccaa tagtccacga cgagcccgaa gtgtggccag ccagagcatc 2100 attgcctata ccatgagcct gggcgccgag aatagcgtgg cctactccaa caacagcatt 2160 gctatcccca ccaacttcac catcagcgtg accaccgaga tcctgccagt gtccatgacc 2220 aagaccagcg tggactgcac catgtacatc tgcggagata gcaccgagtg cagcaacctg 2280 ctgctgcagt acggaagttt ctgcacccag ctgaatcgcg ccctgacagg cattgccgtg 2340 gaacaggata agaacaccca agaggtgttc gcccaagtga agcaaatcta caagacccca 2400 ccaatcaagg atttcggcgg cttcaatttc agccagattc tgcccgatcc aagcaagccc 2460 agcaagcgca gcccaatcga ggacctgctg ttcaacaaag tgacactggc cgacgccgga 2520 ttcatcaagc agtatggcga ttgcctgggc gatattgccg cacgcgatct gatttgcgcc 2580 cagaagttta acggactgac cgtcctgcca ccactgctga cagatgagat gatcgcccag 2640 tacacaagtg ccctgctggc cggaaccatt accagcggat ggacatttgg agccggtcca 2700 gctctgcaga ttcccttccc aatgcagatg gcctaccgct tcaatggcat tggcgtgacc 2760 cagaatgtgc tgtacgagaa ccagaagctg atcgccaacc agttcaacag cgccatcggc 2820 aagattcagg acagcctgag tagtacccca agcgctctgg gaaagctgca ggatgtggtc 2880 aaccagaacg ctcaggccct gaacaccctg gttaagcagc tgagcagcaa cttcggcgcc 2940 atcagtagcg tgctgaacga tatcctgagc cgcctggatc caccagaagc cgaggtgcag 3000 atcgatcgcc tgattaccgg acgcctgcag tccctgcaga cctatgtgac acagcagctg 3060 atccgagccg ccgagattcg agctagtgct aatctggccg ccaccaagat gagcgaatgt 3120 gtgctgggac agagcaagcg cgtggacttt tgcggcaagg gataccacct gatgagcttc 3180 ccacagagtg ctccacacgg cgtggtgttt ctgcatgtga cctacgtgcc cgctcaagag 3240 aagaatttca ccaccgctcc agccatctgc cacgacggaa aggcccattt tccacgcgag 3300 ggcgtgttcg ttagcaacgg cactcattgg ttcgtcaccc agcgcaactt ctacgagccc 3360 cagatcatca ccaccgacaa caccttcgtc agcggcaact gcgacgtcgt gatcggcatt 3420 gtgaacaaca ccgtgtacga tccactgcag cccgagctgg acagcttcaa agaggaactg 3480 gacaagtact ttaagaacca cacaagcccc gacgtggacc tgggagacat tagcggaatc 3540 aacgccagcg tggtcaacat ccagaaagag attgaccgcc tgaacgaggt ggccaagaat 3600 ctgaacgaga gcctgatcga cctgcaagaa ctgggcaaat acgagcagta cattaagtgg 3660 ccctggtaca tctggctggg cttcattgcc ggactgattg ccatcgtgat ggtcaccatt 3720 atgctgtgct gcatgaccag ttgctgcagc tgcctgaagg gatgctgcag ttgcggaagc 3780 tgctgcaagt tcgacgagga tgatagcgag ccagtgctga agggcgtcaa gctgcactac 3840 acctgataac gagcgcgcct cgaggaattc 3870 <210> 54 <211> 1273 <212> PRT <213> Artificial sequence <220> <223> S6P polypeptide of SARS-CoV-2 <400> 54 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile 885 890 895 Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 1010 1015 1020 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys 1025 1030 1035 Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1040 1045 1050 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val 1055 1060 1065 Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His 1070 1075 1080 Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn 1085 1090 1095 Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln 1100 1105 1110 Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val 1115 1120 1125 Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro 1130 1135 1140 Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn 1145 1150 1155 His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn 1160 1165 1170 Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu 1175 1180 1185 Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu 1190 1195 1200 Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu 1205 1210 1215 Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met 1220 1225 1230 Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys 1235 1240 1245 Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro 1250 1255 1260 Val Leu Lys Gly Val Lys Leu His Tyr Thr 1265 1270 <210> 55 <211> 3870 <212> DNA <213> Artificial sequence <220> <223> Codon-optimized nucleotide sequence of the S6P3F polypeptide of SARS-CoV-2 <400> 55 gctagcagat ctcgtacggc caccatgttc gtgtttctgg tgctgctgcc actggtgtcc 60 agtcagtgcg tgaacctgac cacacgaaca cagctgccac cagcctacac caatagcttc 120 acccgcggag tgtactaccc cgacaaggtg ttccgcagca gcgtgctgca tagcacccag 180 gatctgtttc tgcccttctt cagcaacgtg acctggttcc acgccatcca cgtgtccggc 240 accaatggca ccaagcgctt cgataatccc gtgctgccct tcaacgatgg cgtgtacttt 300 gccagcaccg agaagtccaa tatcatccgc ggctggatct tcggcaccac actggatagc 360 aagacccaga gcctgctgat cgtgaacaac gccaccaacg tggtcatcaa agtgtgcgag 420 ttccagttct gcaacgaccc cttcctgggc gtctactacc acaagaacaa caagagctgg 480 atggaaagcg agttccgcgt gtacagcagc gccaacaact gcaccttcga gtacgtgtcc 540 cagccattcc tgatggacct ggaaggcaag cagggcaact tcaagaacct gcgcgagttc 600 gtgttcaaga acatcgacgg ctacttcaaa atctacagca agcacacccc aatcaacctc 660 gtgcgcgatc tgccacaggg attcagtgct ctggaacccc tggtggatct gcccatcggc 720 atcaacatta cccgctttca gacactgctg gccctgcacc gcagttactt gacaccaggc 780 gatagcagca gtggatggac agctggtgcc gccgcttact acgttggata tctgcagcca 840 cgcacctttc tgctgaagta caacgagaac ggcaccatca ccgacgccgt ggattgtgct 900 ctcgatcccc tgagcgagac aaagtgcacc ctgaagtcct tcaccgtcga gaagggcatc 960 taccagacca gcaatttccg cgtgcagccc accgagagca tcgtgcgctt ccccaatatc 1020 accaatctgt gccccttcgg cgaggtgttc aatgccacac gctttgcctc cgtgtacgcc 1080 tggaatcgca agcgcattag caactgcgtg gccgactact ccgtgctgta caatagcgcc 1140 agcttcagca ccttcaagtg ctacggcgtg tcacccacca agctgaacga cctgtgcttc 1200 accaatgtgt acgccgacag cttcgtgatc cgcggagatg aagtgcgaca gattgcccca 1260 ggccagaccg gcaagatcgc cgactacaat tacaagctgc ccgacgactt caccggctgc 1320 gtgatcgcct ggaacagcaa caacctggat tccaaagtcg gcggcaacta caactacctg 1380 taccgcctgt tccgcaagag caatctgaag cccttcgagc gcgacatcag caccgaaatc 1440 taccaggccg gaagcacccc atgcaacggc gtggaaggct tcaactgcta cttcccactg 1500 cagtcctacg gatttcagcc cacaaatggc gtgggctacc agccatatcg agtggtggtg 1560 ctgagcttcg aactgctgca tgctccagct accgtgtgcg gccccaagaa gagtaccaac 1620 ctggtcaaga acaaatgcgt gaacttcaac ttcaacggcc tgaccggaac cggcgtgctg 1680 accgagagta acaagaagtt cctgccattc cagcagtttg gccgcgacat tgccgataca 1740 accgatgccg ttcgcgatcc ccagaccttg gagatcctgg atattacccc atgctccttc 1800 ggcggcgtgt ccgtgattac accaggcacc aataccagca accaggtggc cgttctgtac 1860 caggatgtga attgcacaga ggtgcccgtg gccattcacg ccgatcaatt gacaccaaca 1920 tggcgcgtgt actccaccgg cagcaatgtg tttcaaaccc gcgctggatg cctgattgga 1980 gccgagcacg tgaacaatag ctacgagtgc gatatcccca tcggagccgg aatctgcgcc 2040 tcctatcaga cccagaccaa tagtccagga tccgccggaa gtgtggccag ccagagcatc 2100 attgcctata ccatgagcct gggcgccgag aatagcgtgg cctactccaa caacagcatt 2160 gctatcccca ccaacttcac catcagcgtg accaccgaga tcctgccagt gtccatgacc 2220 aagaccagcg tggactgcac catgtacatc tgcggagata gcaccgagtg cagcaacctg 2280 ctgctgcagt acggaagttt ctgcacccag ctgaatcgcg ccctgacagg cattgccgtg 2340 gaacaggata agaacaccca agaggtgttc gcccaagtga agcaaatcta caagacccca 2400 ccaatcaagg atttcggcgg cttcaatttc agccagattc tgcccgatcc aagcaagccc 2460 agcaagcgca gcccaatcga ggacctgctg ttcaacaaag tgacactggc cgacgccgga 2520 ttcatcaagc agtatggcga ttgcctgggc gatattgccg cacgcgatct gatttgcgcc 2580 cagaagttta acggactgac cgtcctgcca ccactgctga cagatgagat gatcgcccag 2640 tacacaagtg ccctgctggc cggaaccatt accagcggat ggacatttgg agccggtcca 2700 gctctgcaga ttcccttccc aatgcagatg gcctaccgct tcaatggcat tggcgtgacc 2760 cagaatgtgc tgtacgagaa ccagaagctg atcgccaacc agttcaacag cgccatcggc 2820 aagattcagg acagcctgag tagtacccca agcgctctgg gaaagctgca ggatgtggtc 2880 aaccagaacg ctcaggccct gaacaccctg gttaagcagc tgagcagcaa cttcggcgcc 2940 atcagtagcg tgctgaacga tatcctgagc cgcctggatc caccagaagc cgaggtgcag 3000 atcgatcgcc tgattaccgg acgcctgcag tccctgcaga cctatgtgac acagcagctg 3060 atccgagccg ccgagattcg agctagtgct aatctggccg ccaccaagat gagcgaatgt 3120 gtgctgggac agagcaagcg cgtggacttt tgcggcaagg gataccacct gatgagcttc 3180 ccacagagtg ctccacacgg cgtggtgttt ctgcatgtga cctacgtgcc cgctcaagag 3240 aagaatttca ccaccgctcc agccatctgc cacgacggaa aggcccattt tccacgcgag 3300 ggcgtgttcg ttagcaacgg cactcattgg ttcgtcaccc agcgcaactt ctacgagccc 3360 cagatcatca ccaccgacaa caccttcgtc agcggcaact gcgacgtcgt gatcggcatt 3420 gtgaacaaca ccgtgtacga tccactgcag cccgagctgg acagcttcaa agaggaactg 3480 gacaagtact ttaagaacca cacaagcccc gacgtggacc tgggagacat tagcggaatc 3540 aacgccagcg tggtcaacat ccagaaagag attgaccgcc tgaacgaggt ggccaagaat 3600 ctgaacgaga gcctgatcga cctgcaagaa ctgggcaaat acgagcagta cattaagtgg 3660 ccctggtaca tctggctggg cttcattgcc ggactgattg ccatcgtgat ggtcaccatt 3720 atgctgtgct gcatgaccag ttgctgcagc tgcctgaagg gatgctgcag ttgcggaagc 3780 tgctgcaagt tcgacgagga tgatagcgag ccagtgctga agggcgtcaa gctgcactac 3840 acctgataac gagcgcgcct cgaggaattc 3870 <210> 56 <211> 1273 <212> PRT <213> Artificial sequence <220> <223> S6P3F polypeptide of SARS-CoV-2 <400> 56 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Gly Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile 885 890 895 Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 1010 1015 1020 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys 1025 1030 1035 Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1040 1045 1050 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val 1055 1060 1065 Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His 1070 1075 1080 Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn 1085 1090 1095 Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln 1100 1105 1110 Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val 1115 1120 1125 Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro 1130 1135 1140 Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn 1145 1150 1155 His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn 1160 1165 1170 Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu 1175 1180 1185 Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu 1190 1195 1200 Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu 1205 1210 1215 Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met 1220 1225 1230 Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys 1235 1240 1245 Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro 1250 1255 1260 Val Leu Lys Gly Val Lys Leu His Tyr Thr 1265 1270 <210> 57 <211> 3834 <212> DNA <213> Artificial sequence <220> <223> Codon-optimized nucleotide sequence of the S6PdeltaF polypeptide of SARS-CoV-2 <400> 57 gctagcagat ctcgtacggc caccatgttc gtgtttctgg tgctgctgcc actggtgtcc 60 agtcagtgcg tgaacctgac cacacgaaca cagctgccac cagcctacac caatagcttc 120 acccgcggag tgtactaccc cgacaaggtg ttccgcagca gcgtgctgca tagcacccag 180 gatctgtttc tgcccttctt cagcaacgtg acctggttcc acgccatcca cgtgtccggc 240 accaatggca ccaagcgctt cgataatccc gtgctgccct tcaacgatgg cgtgtacttt 300 gccagcaccg agaagtccaa tatcatccgc ggctggatct tcggcaccac actggatagc 360 aagacccaga gcctgctgat cgtgaacaac gccaccaacg tggtcatcaa agtgtgcgag 420 ttccagttct gcaacgaccc cttcctgggc gtctactacc acaagaacaa caagagctgg 480 atggaaagcg agttccgcgt gtacagcagc gccaacaact gcaccttcga gtacgtgtcc 540 cagccattcc tgatggacct ggaaggcaag cagggcaact tcaagaacct gcgcgagttc 600 gtgttcaaga acatcgacgg ctacttcaaa atctacagca agcacacccc aatcaacctc 660 gtgcgcgatc tgccacaggg attcagtgct ctggaacccc tggtggatct gcccatcggc 720 atcaacatta cccgctttca gacactgctg gccctgcacc gcagttactt gacaccaggc 780 gatagcagca gtggatggac agctggtgcc gccgcttact acgttggata tctgcagcca 840 cgcacctttc tgctgaagta caacgagaac ggcaccatca ccgacgccgt ggattgtgct 900 ctcgatcccc tgagcgagac aaagtgcacc ctgaagtcct tcaccgtcga gaagggcatc 960 taccagacca gcaatttccg cgtgcagccc accgagagca tcgtgcgctt ccccaatatc 1020 accaatctgt gccccttcgg cgaggtgttc aatgccacac gctttgcctc cgtgtacgcc 1080 tggaatcgca agcgcattag caactgcgtg gccgactact ccgtgctgta caatagcgcc 1140 agcttcagca ccttcaagtg ctacggcgtg tcacccacca agctgaacga cctgtgcttc 1200 accaatgtgt acgccgacag cttcgtgatc cgcggagatg aagtgcgaca gattgcccca 1260 ggccagaccg gcaagatcgc cgactacaat tacaagctgc ccgacgactt caccggctgc 1320 gtgatcgcct ggaacagcaa caacctggat tccaaagtcg gcggcaacta caactacctg 1380 taccgcctgt tccgcaagag caatctgaag cccttcgagc gcgacatcag caccgaaatc 1440 taccaggccg gaagcacccc atgcaacggc gtggaaggct tcaactgcta cttcccactg 1500 cagtcctacg gatttcagcc cacaaatggc gtgggctacc agccatatcg agtggtggtg 1560 ctgagcttcg aactgctgca tgctccagct accgtgtgcg gccccaagaa gagtaccaac 1620 ctggtcaaga acaaatgcgt gaacttcaac ttcaacggcc tgaccggaac cggcgtgctg 1680 accgagagta acaagaagtt cctgccattc cagcagtttg gccgcgacat tgccgataca 1740 accgatgccg ttcgcgatcc ccagaccttg gagatcctgg atattacccc atgctccttc 1800 ggcggcgtgt ccgtgattac accaggcacc aataccagca accaggtggc cgttctgtac 1860 caggatgtga attgcacaga ggtgcccgtg gccattcacg ccgatcaatt gacaccaaca 1920 tggcgcgtgt actccaccgg cagcaatgtg tttcaaaccc gcgctggatg cctgattgga 1980 gccgagcacg tgaacaatag ctacgagtgc gatatcccca tcggagccgg aatctgcgca 2040 tcctatagtg tggccagcca gagcatcatt gcctatacca tgagcctggg cgccgagaat 2100 agcgtggcct actccaacaa cagcattgct atccccacca acttcaccat cagcgtgacc 2160 accgagatcc tgccagtgtc catgaccaag accagcgtgg actgcaccat gtacatctgc 2220 ggagatagca ccgagtgcag caacctgctg ctgcagtacg gaagtttctg cacccagctg 2280 aatcgcgccc tgacaggcat tgccgtggaa caggataaga acacccaaga ggtgttcgcc 2340 caagtgaagc aaatctacaa gaccccacca atcaaggatt tcggcggctt caatttcagc 2400 cagattctgc ccgatccaag caagcccagc aagcgcagcc caatcgagga cctgctgttc 2460 aacaaagtga cactggccga cgccggattc atcaagcagt atggcgattg cctgggcgat 2520 attgccgcac gcgatctgat ttgcgcccag aagtttaacg gactgaccgt cctgccacca 2580 ctgctgacag atgagatgat cgcccagtac acaagtgccc tgctggccgg aaccattacc 2640 agcggatgga catttggagc cggtccagct ctgcagattc ccttcccaat gcagatggcc 2700 taccgcttca atggcattgg cgtgacccag aatgtgctgt acgagaacca gaagctgatc 2760 gccaaccagt tcaacagcgc catcggcaag attcaggaca gcctgagtag taccccaagc 2820 gctctgggaa agctgcagga tgtggtcaac cagaacgctc aggccctgaa caccctggtt 2880 aagcagctga gcagcaactt cggcgccatc agtagcgtgc tgaacgatat cctgagccgc 2940 ctggatccac cagaagccga ggtgcagatc gatcgcctga ttaccggacg cctgcagtcc 3000 ctgcagacct atgtgacaca gcagctgatc cgagccgccg agattcgagc tagtgctaat 3060 ctggccgcca ccaagatgag cgaatgtgtg ctgggacaga gcaagcgcgt ggacttttgc 3120 ggcaagggat accacctgat gagcttccca cagagtgctc cacacggcgt ggtgtttctg 3180 catgtgacct acgtgcccgc tcaagagaag aatttcacca ccgctccagc catctgccac 3240 gacggaaagg cccattttcc acgcgagggc gtgttcgtta gcaacggcac tcattggttc 3300 gtcacccagc gcaacttcta cgagccccag atcatcacca ccgacaacac cttcgtcagc 3360 ggcaactgcg acgtcgtgat cggcattgtg aacaacaccg tgtacgatcc actgcagccc 3420 gagctggaca gcttcaaaga ggaactggac aagtacttta agaaccacac aagccccgac 3480 gtggacctgg gagacattag cggaatcaac gccagcgtgg tcaacatcca gaaagagatt 3540 gaccgcctga acgaggtggc caagaatctg aacgagagcc tgatcgacct gcaagaactg 3600 ggcaaatacg agcagtacat taagtggccc tggtacatct ggctgggctt cattgccgga 3660 ctgattgcca tcgtgatggt caccattatg ctgtgctgca tgaccagttg ctgcagctgc 3720 ctgaagggat gctgcagttg cggaagctgc tgcaagttcg acgaggatga tagcgagcca 3780 gtgctgaagg gcgtcaagct gcactacacc tgataagcgc gcctcgagga attc 3834 <210> 58 <211> 1262 <212> PRT <213> Artificial sequence <220> <223> S6PdeltaF polypeptide of SARS-CoV-2 <400> 58 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu 675 680 685 Gly Ala Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro 690 695 700 Thr Asn Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met 705 710 715 720 Thr Lys Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr 725 730 735 Glu Cys Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu 740 745 750 Asn Arg Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln 755 760 765 Glu Val Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys 770 775 780 Asp Phe Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys 785 790 795 800 Pro Ser Lys Arg Ser Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr 805 810 815 Leu Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp 820 825 830 Ile Ala Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr 835 840 845 Val Leu Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser 850 855 860 Ala Leu Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly 865 870 875 880 Pro Ala Leu Gln Ile Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn 885 890 895 Gly Ile Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile 900 905 910 Ala Asn Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser 915 920 925 Ser Thr Pro Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn 930 935 940 Ala Gln Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly 945 950 955 960 Ala Ile Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro 965 970 975 Glu Ala Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser 980 985 990 Leu Gln Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg 995 1000 1005 Ala Ser Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu 1010 1015 1020 Gly Gln Ser Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu 1025 1030 1035 Met Ser Phe Pro Gln Ser Ala Pro His Gly Val Val Phe Leu His 1040 1045 1050 Val Thr Tyr Val Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro 1055 1060 1065 Ala Ile Cys His Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val 1070 1075 1080 Phe Val Ser Asn Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe 1085 1090 1095 Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly 1100 1105 1110 Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp 1115 1120 1125 Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys 1130 1135 1140 Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile 1145 1150 1155 Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp 1160 1165 1170 Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp 1175 1180 1185 Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp 1190 1195 1200 Tyr Ile Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met 1205 1210 1215 Val Thr Ile Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu 1220 1225 1230 Lys Gly Cys Cys Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp 1235 1240 1245 Asp Ser Glu Pro Val Leu Lys Gly Val Lys Leu His Tyr Thr 1250 1255 1260 <210> 59 <211> 3870 <212> DNA <213> Artificial sequence <220> <223> Codon-optimized nucleotide sequence of the SCCPP polypeptide of SARS-CoV-2 <400> 59 gctagcagat ctcgtacggc caccatgttc gtgtttctgg tgctgctgcc actggtgtcc 60 agtcagtgcg tgaacctgac cacacgaaca cagctgccac cagcctacac caatagcttc 120 acccgcggag tgtactaccc cgacaaggtg ttccgcagca gcgtgctgca tagcacccag 180 gatctgtttc tgcccttctt cagcaacgtg acctggttcc acgccatcca cgtgtccggc 240 accaatggca ccaagcgctt cgataatccc gtgctgccct tcaacgatgg cgtgtacttt 300 gccagcaccg agaagtccaa tatcatccgc ggctggatct tcggcaccac actggatagc 360 aagacccaga gcctgctgat cgtgaacaac gccaccaacg tggtcatcaa agtgtgcgag 420 ttccagttct gcaacgaccc cttcctgggc gtctactacc acaagaacaa caagagctgg 480 atggaaagcg agttccgcgt gtacagcagc gccaacaact gcaccttcga gtacgtgtcc 540 cagccattcc tgatggacct ggaaggcaag cagggcaact tcaagaacct gcgcgagttc 600 gtgttcaaga acatcgacgg ctacttcaaa atctacagca agcacacccc aatcaacctc 660 gtgcgcgatc tgccacaggg attcagtgct ctggaacccc tggtggatct gcccatcggc 720 atcaacatta cccgctttca gacactgctg gccctgcacc gcagttactt gacaccaggc 780 gatagcagca gtggatggac agctggtgcc gccgcttact acgttggata tctgcagcca 840 cgcacctttc tgctgaagta caacgagaac ggcaccatca ccgacgccgt ggattgtgct 900 ctcgatcccc tgagcgagac aaagtgcacc ctgaagtcct tcaccgtcga gaagggcatc 960 taccagacca gcaatttccg cgtgcagccc accgagagca tcgtgcgctt ccccaatatc 1020 accaatctgt gccccttcgg cgaggtgttc aatgccacac gctttgcctc cgtgtacgcc 1080 tggaatcgca agcgcattag caactgcgtg gccgactact ccgtgctgta caatagcgcc 1140 agcttcagca ccttcaagtg ctacggcgtg tgtcccacca agctgaacga cctgtgcttc 1200 accaatgtgt acgccgacag cttcgtgatc cgcggagatg aagtgcgaca gattgcccca 1260 ggccagaccg gcaagatcgc cgactacaat tacaagctgc ccgacgactt caccggctgc 1320 gtgatcgcct ggaacagcaa caacctggat tccaaagtcg gcggcaacta caactacctg 1380 taccgcctgt tccgcaagag caatctgaag cccttcgagc gcgacatcag caccgaaatc 1440 taccaggccg gaagcacccc atgcaacggc gtggaaggct tcaactgcta cttcccactg 1500 cagtcctacg gatttcagcc cacaaatggc gtgggctacc agccatatcg agtggtggtg 1560 ctgagcttcg aactgctgca tgctccagct accgtgtgcg gccccaagaa gagtaccaac 1620 ctggtcaaga acaaatgcgt gaacttcaac ttcaacggcc tgaccggaac cggcgtgctg 1680 accgagagta acaagaagtt cctgccattc cagcagtttg gccgcgacat tgccgataca 1740 accgatgccg ttcgcgatcc ccagaccttg gagatcctgg atattacccc atgctccttc 1800 ggcggcgtgt ccgtgattac accaggcacc aataccagca accaggtggc cgttctgtac 1860 caggatgtga attgcacaga ggtgcccgtg gccattcacg ccgatcaatt gacaccaaca 1920 tggcgcgtgt actccaccgg cagcaatgtg tttcaaaccc gcgctggatg cctgattgga 1980 gccgagcacg tgaacaatag ctacgagtgc gatatcccca tcggagccgg aatctgcgcc 2040 tcctatcaga cccagaccaa tagtccacga cgagcccgaa gtgtggccag ccagagcatc 2100 attgcctata ccatgagcct gggcgccgag aatagcgtgg cctactccaa caacagcatt 2160 gctatcccca ccaacttcac catcagcgtg accaccgaga tcctgccagt gtccatgacc 2220 aagaccagcg tggactgcac catgtacatc tgcggagata gcaccgagtg cagcaacctg 2280 ctgctgcagt acggaagttt ctgcacccag ctgaatcgcg ccctgacagg cattgccgtg 2340 gaacaggata agaacaccca agaggtgttc gcccaagtga agcaaatcta caagacccca 2400 ccaatcaagg atttcggcgg cttcaatttc agccagattc tgcccgatcc aagcaagccc 2460 agcaagcgca gcttcatcga ggacctgctg ttcaacaaag tgacactggc cgacgccgga 2520 ttcatcaagc agtatggcga ttgcctgggc gatattgccg cacgcgatct gatttgcgcc 2580 cagaagttta acggactgac cgtcctgcca ccactgctga cagatgagat gatcgcccag 2640 tacacaagtg ccctgctggc cggaaccatt accagcggat ggacatttgg agccggtgcc 2700 gctctgcaga ttcccttcgc tatgcagatg gcctaccgct tcaatggcat tggcgtgacc 2760 cagaatgtgc tgtacgagaa ccagaagctg atcgccaacc agttcaacag cgccatcggc 2820 aagattcagg acagcctgag tagtaccgcc agcgctctgg gaaagctgca ggatgtggtc 2880 aaccagaacg ctcaggccct gaacaccctg gttaagcagc tgagcagcaa cttcggcgcc 2940 atcagtagcg tgctgaacga tatcctgagc cgcctgtgtc caccagaagc cgaggtgcag 3000 atcgatcgcc tgattaccgg acgcctgcag tccctgcaga cctatgtgac acagcagctg 3060 atccgagccg ccgagattcg agctagtgct aatctggccg ccaccaagat gagcgaatgt 3120 gtgctgggac agagcaagcg cgtggacttt tgcggcaagg gataccacct gatgagcttc 3180 ccacagagtg ctccacacgg cgtggtgttt ctgcatgtga cctacgtgcc cgctcaagag 3240 aagaatttca ccaccgctcc agccatctgc cacgacggaa aggcccattt tccacgcgag 3300 ggcgtgttcg ttagcaacgg cactcattgg ttcgtcaccc agcgcaactt ctacgagccc 3360 cagatcatca ccaccgacaa caccttcgtc agcggcaact gcgacgtcgt gatcggcatt 3420 gtgaacaaca ccgtgtacga tccactgcag cccgagctgg acagcttcaa agaggaactg 3480 gacaagtact ttaagaacca cacaagcccc gacgtggacc tgggagacat tagcggaatc 3540 aacgccagcg tggtcaacat ccagaaagag attgaccgcc tgaacgaggt ggccaagaat 3600 ctgaacgaga gcctgatcga cctgcaagaa ctgggcaaat acgagcagta cattaagtgg 3660 ccctggtaca tctggctggg cttcattgcc ggactgattg ccatcgtgat ggtcaccatt 3720 atgctgtgct gcatgaccag ttgctgcagc tgcctgaagg gatgctgcag ttgcggaagc 3780 tgctgcaagt tcgacgagga tgatagcgag ccagtgctga agggcgtcaa gctgcactac 3840 acctgataac gagcgcgcct cgaggaattc 3870 <210> 60 <211> 1273 <212> PRT <213> Artificial sequence <220> <223> SCCPP polypeptide of SARS-CoV-2 <400> 60 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Cys Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile 885 890 895 Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Cys Pro Pro Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 1010 1015 1020 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys 1025 1030 1035 Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1040 1045 1050 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val 1055 1060 1065 Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His 1070 1075 1080 Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn 1085 1090 1095 Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln 1100 1105 1110 Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val 1115 1120 1125 Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro 1130 1135 1140 Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn 1145 1150 1155 His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn 1160 1165 1170 Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu 1175 1180 1185 Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu 1190 1195 1200 Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu 1205 1210 1215 Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met 1220 1225 1230 Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys 1235 1240 1245 Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro 1250 1255 1260 Val Leu Lys Gly Val Lys Leu His Tyr Thr 1265 1270 <210> 61 <211> 3870 <212> DNA <213> Artificial sequence <220> <223> Codon-optimized nucleotide sequence of the SCC6P polypeptide of SARS-CoV-2 <400> 61 gctagcagat ctcgtacggc caccatgttc gtgtttctgg tgctgctgcc actggtgtcc 60 agtcagtgcg tgaacctgac cacacgaaca cagctgccac cagcctacac caatagcttc 120 acccgcggag tgtactaccc cgacaaggtg ttccgcagca gcgtgctgca tagcacccag 180 gatctgtttc tgcccttctt cagcaacgtg acctggttcc acgccatcca cgtgtccggc 240 accaatggca ccaagcgctt cgataatccc gtgctgccct tcaacgatgg cgtgtacttt 300 gccagcaccg agaagtccaa tatcatccgc ggctggatct tcggcaccac actggatagc 360 aagacccaga gcctgctgat cgtgaacaac gccaccaacg tggtcatcaa agtgtgcgag 420 ttccagttct gcaacgaccc cttcctgggc gtctactacc acaagaacaa caagagctgg 480 atggaaagcg agttccgcgt gtacagcagc gccaacaact gcaccttcga gtacgtgtcc 540 cagccattcc tgatggacct ggaaggcaag cagggcaact tcaagaacct gcgcgagttc 600 gtgttcaaga acatcgacgg ctacttcaaa atctacagca agcacacccc aatcaacctc 660 gtgcgcgatc tgccacaggg attcagtgct ctggaacccc tggtggatct gcccatcggc 720 atcaacatta cccgctttca gacactgctg gccctgcacc gcagttactt gacaccaggc 780 gatagcagca gtggatggac agctggtgcc gccgcttact acgttggata tctgcagcca 840 cgcacctttc tgctgaagta caacgagaac ggcaccatca ccgacgccgt ggattgtgct 900 ctcgatcccc tgagcgagac aaagtgcacc ctgaagtcct tcaccgtcga gaagggcatc 960 taccagacca gcaatttccg cgtgcagccc accgagagca tcgtgcgctt ccccaatatc 1020 accaatctgt gccccttcgg cgaggtgttc aatgccacac gctttgcctc cgtgtacgcc 1080 tggaatcgca agcgcattag caactgcgtg gccgactact ccgtgctgta caatagcgcc 1140 agcttcagca ccttcaagtg ctacggcgtg tgtcccacca agctgaacga cctgtgcttc 1200 accaatgtgt acgccgacag cttcgtgatc cgcggagatg aagtgcgaca gattgcccca 1260 ggccagaccg gcaagatcgc cgactacaat tacaagctgc ccgacgactt caccggctgc 1320 gtgatcgcct ggaacagcaa caacctggat tccaaagtcg gcggcaacta caactacctg 1380 taccgcctgt tccgcaagag caatctgaag cccttcgagc gcgacatcag caccgaaatc 1440 taccaggccg gaagcacccc atgcaacggc gtggaaggct tcaactgcta cttcccactg 1500 cagtcctacg gatttcagcc cacaaatggc gtgggctacc agccatatcg agtggtggtg 1560 ctgagcttcg aactgctgca tgctccagct accgtgtgcg gccccaagaa gagtaccaac 1620 ctggtcaaga acaaatgcgt gaacttcaac ttcaacggcc tgaccggaac cggcgtgctg 1680 accgagagta acaagaagtt cctgccattc cagcagtttg gccgcgacat tgccgataca 1740 accgatgccg ttcgcgatcc ccagaccttg gagatcctgg atattacccc atgctccttc 1800 ggcggcgtgt ccgtgattac accaggcacc aataccagca accaggtggc cgttctgtac 1860 caggatgtga attgcacaga ggtgcccgtg gccattcacg ccgatcaatt gacaccaaca 1920 tggcgcgtgt actccaccgg cagcaatgtg tttcaaaccc gcgctggatg cctgattgga 1980 gccgagcacg tgaacaatag ctacgagtgc gatatcccca tcggagccgg aatctgcgcc 2040 tcctatcaga cccagaccaa tagtccacga cgagcccgaa gtgtggccag ccagagcatc 2100 attgcctata ccatgagcct gggcgccgag aatagcgtgg cctactccaa caacagcatt 2160 gctatcccca ccaacttcac catcagcgtg accaccgaga tcctgccagt gtccatgacc 2220 aagaccagcg tggactgcac catgtacatc tgcggagata gcaccgagtg cagcaacctg 2280 ctgctgcagt acggaagttt ctgcacccag ctgaatcgcg ccctgacagg cattgccgtg 2340 gaacaggata agaacaccca agaggtgttc gcccaagtga agcaaatcta caagacccca 2400 ccaatcaagg atttcggcgg cttcaatttc agccagattc tgcccgatcc aagcaagccc 2460 agcaagcgca gcccaatcga ggacctgctg ttcaacaaag tgacactggc cgacgccgga 2520 ttcatcaagc agtatggcga ttgcctgggc gatattgccg cacgcgatct gatttgcgcc 2580 cagaagttta acggactgac cgtcctgcca ccactgctga cagatgagat gatcgcccag 2640 tacacaagtg ccctgctggc cggaaccatt accagcggat ggacatttgg agccggtcca 2700 gctctgcaga ttcccttccc aatgcagatg gcctaccgct tcaatggcat tggcgtgacc 2760 cagaatgtgc tgtacgagaa ccagaagctg atcgccaacc agttcaacag cgccatcggc 2820 aagattcagg acagcctgag tagtacccca agcgctctgg gaaagctgca ggatgtggtc 2880 aaccagaacg ctcaggccct gaacaccctg gttaagcagc tgagcagcaa cttcggcgcc 2940 atcagtagcg tgctgaacga tatcctgagc cgcctgtgtc caccagaagc cgaggtgcag 3000 atcgatcgcc tgattaccgg acgcctgcag tccctgcaga cctatgtgac acagcagctg 3060 atccgagccg ccgagattcg agctagtgct aatctggccg ccaccaagat gagcgaatgt 3120 gtgctgggac agagcaagcg cgtggacttt tgcggcaagg gataccacct gatgagcttc 3180 ccacagagtg ctccacacgg cgtggtgttt ctgcatgtga cctacgtgcc cgctcaagag 3240 aagaatttca ccaccgctcc agccatctgc cacgacggaa aggcccattt tccacgcgag 3300 ggcgtgttcg ttagcaacgg cactcattgg ttcgtcaccc agcgcaactt ctacgagccc 3360 cagatcatca ccaccgacaa caccttcgtc agcggcaact gcgacgtcgt gatcggcatt 3420 gtgaacaaca ccgtgtacga tccactgcag cccgagctgg acagcttcaa agaggaactg 3480 gacaagtact ttaagaacca cacaagcccc gacgtggacc tgggagacat tagcggaatc 3540 aacgccagcg tggtcaacat ccagaaagag attgaccgcc tgaacgaggt ggccaagaat 3600 ctgaacgaga gcctgatcga cctgcaagaa ctgggcaaat acgagcagta cattaagtgg 3660 ccctggtaca tctggctggg cttcattgcc ggactgattg ccatcgtgat ggtcaccatt 3720 atgctgtgct gcatgaccag ttgctgcagc tgcctgaagg gatgctgcag ttgcggaagc 3780 tgctgcaagt tcgacgagga tgatagcgag ccagtgctga agggcgtcaa gctgcactac 3840 acctgataac gagcgcgcct cgaggaattc 3870 <210> 62 <211> 1273 <212> PRT <213> Artificial sequence <220> <223> SCC6P polypeptide of SARS-CoV-2 <400> 62 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Cys Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile 885 890 895 Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Cys Pro Pro Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 1010 1015 1020 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys 1025 1030 1035 Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1040 1045 1050 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val 1055 1060 1065 Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His 1070 1075 1080 Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn 1085 1090 1095 Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln 1100 1105 1110 Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val 1115 1120 1125 Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro 1130 1135 1140 Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn 1145 1150 1155 His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn 1160 1165 1170 Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu 1175 1180 1185 Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu 1190 1195 1200 Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu 1205 1210 1215 Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met 1220 1225 1230 Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys 1235 1240 1245 Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro 1250 1255 1260 Val Leu Lys Gly Val Lys Leu His Tyr Thr 1265 1270 <210> 63 <211> 3870 <212> DNA <213> Artificial sequence <220> <223> MV-optimized nucleotide sequence of the S2P polypeptide (SMVopt2P) of SARS-CoV-2 <400> 63 gctagcagat ctcgtacggc caccatgttt gtgtttttgg ttttgttgcc actggtgtcc 60 agtcagtgtg ttaatttgac aacaagaaca cagctgccac cagcctacac aaatagtttt 120 acaaggggag tgtactaccc agataaggtg ttcagaagta gtgttctgca tagcacacag 180 gatctgtttc tgccattctt tagcaatgtg acctggttcc atgctattca tgtttccggt 240 acaaatggca ccaagcgctt tgataatcca gtgttgccat tcaatgatgg cgtgtacttt 300 gccagtaccg agaagagtaa tatcattcgc ggatggattt tcggaaccac actggatagt 360 aaaacccaga gtctgctgat tgtgaacaat gccaccaatg tggttatcaa agtgtgcgag 420 tttcagttct gcaatgatcc atttctgggc gtctactacc ataagaacaa caagagttgg 480 atggaaagcg agtttagagt gtacagtagt gccaacaatt gcacctttga atacgttagc 540 cagccattct tgatggattt ggagggaaag cagggcaatt tcaagaatct gcgcgagttc 600 gtgttcaaga atatcgacgg atacttcaaa atctacagca agcacacacc aatcaatctt 660 gttagagatt tgccacaggg attcagtgct ttggaaccat tggttgatct gccaatcgga 720 atcaatatta ccagatttca aacactgctg gccctgcata gaagttattt gacaccaggc 780 gattcaagta gtggatggac agctggtgct gctgcttatt atgttggata tctgcaacca 840 cgaacctttc tgctgaagta caatgagaat ggaacaatca cagatgctgt ggattgtgct 900 cttgatccac tgagtgaaac aaagtgcacc ctgaagagtt ttaccgttga gaagggaatc 960 taccagacca gtaattttcg agtgcagcca acagaaagta tcgtgcgctt cccaaatatt 1020 acaaatctgt gcccattcgg cgaagtgttt aatgctacaa gatttgctag tgtgtacgcc 1080 tggaatcgca agagaattag taattgcgtg gccgattaca gcgtgctgta taatagtgcc 1140 agctttagca cctttaagtg ctatggtgtt agtcccacaa agctgaatga tctgtgcttt 1200 accaatgtgt atgccgatag ttttgtgatc aggggagatg aagttcgaca aattgctcca 1260 ggacagactg gaaagattgc cgattataac tacaagctgc cagatgattt caccggatgt 1320 gtgattgcct ggaacagtaa caatctggat agcaaagttg gcggcaacta caattatctg 1380 tatcgcctgt ttcgcaagag caatctgaaa ccatttgagc gcgatatcag caccgaaatc 1440 tatcaagctg gaagtactcc atgcaatggc gtggaaggtt ttaattgcta ctttccactg 1500 cagtcctacg gatttcaacc tactaatggt gttggatacc agccatatag agtggtggtt 1560 ctgagttttg aattgctgca tgctccagct acagtgtgtg gaccaaagaa aagtaccaac 1620 ctggttaaga acaaatgcgt gaacttcaac ttcaatggac tgactggtac aggcgttctg 1680 actgagagta acaagaaatt cctgccattt cagcagtttg gacgagatat tgctgataca 1740 acagatgcag ttagagatcc ccaaacactg gaaattctgg atattacccc atgcagtttt 1800 ggcggagtta gtgttattac acccggcaca aataccagta atcaagttgc tgtgctgtac 1860 caggatgtga attgcacaga agttccagtt gcaattcatg cagatcagtt gacaccaaca 1920 tggcgagtgt atagtaccgg aagtaatgtt tttcagacac gagctggatg tctgattgga 1980 gccgaacatg ttaacaatag ctacgagtgc gatattccaa ttggtgctgg aatttgcgct 2040 agttatcaga cccaaacaaa tagtccaaga cgagcaagaa gtgtggccag tcagagtatt 2100 attgcctata caatgagtct gggagccgag aatagtgtgg cctatagtaa caattccatt 2160 gctatcccca ccaactttac cattagtgtg acaacagaga ttctgccagt gtccatgaca 2220 aagacaagtg tggattgcac catgtacatt tgcggagata gtacagaatg cagtaatctg 2280 ctgctgcagt atggaagttt ctgtacacaa ctgaatagag ccctgactgg aattgctgtg 2340 gaacaggata agaatactca agaggtgttc gcccaagtga agcaaatcta taagacccca 2400 cctattaagg atttcggcgg attcaatttc agtcagattt tgccagatcc aagcaagcca 2460 tccaaacgca gttttattga ggacctgctg ttcaacaaag tgacattggc tgatgctggc 2520 tttattaagc aatatggcga ttgtctggga gatatagctg ccagagattt gatttgcgcc 2580 caaaagttta atggattgac agttttgcca ccactgctga cagatgagat gattgctcag 2640 tatacaagtg ctctgctggc cggaacaatt acatcaggat ggacatttgg agctggtgca 2700 gcattgcaaa taccatttgc tatgcagatg gcctaccgct ttaatggtat tggagttacc 2760 cagaacgtgc tgtacgaaaa tcagaagctg atcgccaatc agttcaatag cgccattgga 2820 aaaattcagg atagcctgag tagtactgct agtgctcttg gaaaactgca ggatgtggtt 2880 aatcagaatg ctcaggctct gaatactctg gttaagcagt tgagttccaa tttcggagct 2940 attagcagtg tgctgaacga tattctgagt cgtttggatc caccagaggc cgaagttcag 3000 attgatagac tgattacagg acgactgcag agcttgcaga catatgttac acaacaactg 3060 attcgagccg ctgaaattag agctagtgct aatttggctg ccacaaagat gagtgaatgt 3120 gtgcttggac agagcaaaag agtggatttt tgcggcaaag gataccatct gatgagcttt 3180 ccacaaagtg ctccacatgg tgttgtgttt ctgcatgtta cttatgtgcc cgctcaagag 3240 aagaatttca caacagctcc agccatttgc catgatggaa aagctcattt tccacgagaa 3300 ggcgtgttcg ttagtaatgg tactcattgg ttcgtgaccc agcgcaattt ttacgagcca 3360 cagattatta ccaccgacaa tactttcgtg tccggcaatt gtgatgttgt gattggaatc 3420 gtgaacaaca cagtgtacga tccattgcag ccagagctgg atagttttaa agaggaactg 3480 gacaagtact tcaagaacca tacaagtcca gatgtggatc tgggcgatat tagtggaatc 3540 aatgcctccg tggtcaacat ccagaaagaa attgatcgac tgaacgaagt ggccaagaat 3600 ttgaatgaga gcctgattga tctgcaagag ctgggcaaat acgagcagta tattaagtgg 3660 ccttggtaca tttggctggg attcattgct ggactgattg ccattgtgat ggttaccatt 3720 atgctgtgtt gcatgacaag ttgttgcagt tgcctgaaag gatgctgtag ttgcggtagt 3780 tgctgcaagt ttgatgagga tgatagtgaa ccagtgctga aaggcgtgaa gctgcattat 3840 acttgataac gagcgcgcct cgaggaattc 3870 <210> 64 <211> 3834 <212> DNA <213> Artificial sequence <220> <223> MV-optimized nucleotide sequence of the SdeltaF polypeptide (SMVoptdeltaF) of SARS-CoV-2 <400> 64 gctagcagat ctcgtacggc caccatgttt gtgtttttgg ttttgttgcc actggtgtcc 60 agtcagtgtg ttaatttgac aacaagaaca cagctgccac cagcctacac aaatagtttt 120 acaaggggag tgtactaccc agataaggtg ttcagaagta gtgttctgca tagcacacag 180 gatctgtttc tgccattctt tagcaatgtg acctggttcc atgctattca tgtttccggt 240 acaaatggca ccaagcgctt tgataatcca gtgttgccat tcaatgatgg cgtgtacttt 300 gccagtaccg agaagagtaa tatcattcgc ggatggattt tcggaaccac actggatagt 360 aaaacccaga gtctgctgat tgtgaacaat gccaccaatg tggttatcaa agtgtgcgag 420 tttcagttct gcaatgatcc atttctgggc gtctactacc ataagaacaa caagagttgg 480 atggaaagcg agtttagagt gtacagtagt gccaacaatt gcacctttga atacgttagc 540 cagccattct tgatggattt ggagggaaag cagggcaatt tcaagaatct gcgcgagttc 600 gtgttcaaga atatcgacgg atacttcaaa atctacagca agcacacacc aatcaatctt 660 gttagagatt tgccacaggg attcagtgct ttggaaccat tggttgatct gccaatcgga 720 atcaatatta ccagatttca aacactgctg gccctgcata gaagttattt gacaccaggc 780 gattcaagta gtggatggac agctggtgct gctgcttatt atgttggata tctgcaacca 840 cgaacctttc tgctgaagta caatgagaat ggaacaatca cagatgctgt ggattgtgct 900 cttgatccac tgagtgaaac aaagtgcacc ctgaagagtt ttaccgttga gaagggaatc 960 taccagacca gtaattttcg agtgcagcca acagaaagta tcgtgcgctt cccaaatatt 1020 acaaatctgt gcccattcgg cgaagtgttt aatgctacaa gatttgctag tgtgtacgcc 1080 tggaatcgca agagaattag taattgcgtg gccgattaca gcgtgctgta taatagtgcc 1140 agctttagca cctttaagtg ctatggtgtt agtcccacaa agctgaatga tctgtgcttt 1200 accaatgtgt atgccgatag ttttgtgatc aggggagatg aagttcgaca aattgctcca 1260 ggacagactg gaaagattgc cgattataac tacaagctgc cagatgattt caccggatgt 1320 gtgattgcct ggaacagtaa caatctggat agcaaagttg gcggcaacta caattatctg 1380 tatcgcctgt ttcgcaagag caatctgaaa ccatttgagc gcgatatcag caccgaaatc 1440 tatcaagctg gaagtactcc atgcaatggc gtggaaggtt ttaattgcta ctttccactg 1500 cagtcctacg gatttcaacc tactaatggt gttggatacc agccatatag agtggtggtt 1560 ctgagttttg aattgctgca tgctccagct acagtgtgtg gaccaaagaa aagtaccaac 1620 ctggttaaga acaaatgcgt gaacttcaac ttcaatggac tgactggtac aggcgttctg 1680 actgagagta acaagaaatt cctgccattt cagcagtttg gacgagatat tgctgataca 1740 acagatgcag ttagagatcc ccaaacactg gaaattctgg atattacccc atgcagtttt 1800 ggcggagtta gtgttattac acccggcaca aataccagta atcaagttgc tgtgctgtac 1860 caggatgtga attgcacaga agttccagtt gcaattcatg cagatcagtt gacaccaaca 1920 tggcgagtgt atagtaccgg aagtaatgtt tttcagacac gagctggatg tctgattgga 1980 gccgaacatg ttaacaatag ctacgagtgc gatattccaa ttggtgctgg aatttgcgct 2040 agttatagtg tggccagtca gagtattatt gcctatacaa tgagtctggg agccgagaat 2100 agtgtggcct atagtaacaa ttccattgct atccccacca actttaccat tagtgtgaca 2160 acagagattc tgccagtgtc catgacaaag acaagtgtgg attgcaccat gtacatttgc 2220 ggagatagta cagaatgcag taatctgctg ctgcagtatg gaagtttctg tacacaactg 2280 aatagagccc tgactggaat tgctgtggaa caggataaga atactcaaga ggtgttcgcc 2340 caagtgaagc aaatctataa gaccccacct attaaggatt tcggcggatt caatttcagt 2400 cagattttgc cagatccaag caagccatcc aaacgcagtt ttattgagga cctgctgttc 2460 aacaaagtga cattggctga tgctggcttt attaagcaat atggcgattg tctgggagat 2520 atagctgcca gagatttgat ttgcgcccaa aagtttaatg gattgacagt tttgccacca 2580 ctgctgacag atgagatgat tgctcagtat acaagtgctc tgctggccgg aacaattaca 2640 tcaggatgga catttggagc tggtgcagca ttgcaaatac catttgctat gcagatggcc 2700 taccgcttta atggtattgg agttacccag aacgtgctgt acgaaaatca gaagctgatc 2760 gccaatcagt tcaatagcgc cattggaaaa attcaggata gcctgagtag tactgctagt 2820 gctcttggaa aactgcagga tgtggttaat cagaatgctc aggctctgaa tactctggtt 2880 aagcagttga gttccaattt cggagctatt agcagtgtgc tgaacgatat tctgagtcgt 2940 ttggataagg ttgaggccga agttcagatt gatagactga ttacaggacg actgcagagc 3000 ttgcagacat atgttacaca acaactgatt cgagccgctg aaattagagc tagtgctaat 3060 ttggctgcca caaagatgag tgaatgtgtg cttggacaga gcaaaagagt ggatttttgc 3120 ggcaaaggat accatctgat gagctttcca caaagtgctc cacatggtgt tgtgtttctg 3180 catgttactt atgtgcccgc tcaagagaag aatttcacaa cagctccagc catttgccat 3240 gatggaaaag ctcattttcc acgagaaggc gtgttcgtta gtaatggtac tcattggttc 3300 gtgacccagc gcaattttta cgagccacag attattacca ccgacaatac tttcgtgtcc 3360 ggcaattgtg atgttgtgat tggaatcgtg aacaacacag tgtacgatcc attgcagcca 3420 gagctggata gttttaaaga ggaactggac aagtacttca agaaccatac aagtccagat 3480 gtggatctgg gcgatattag tggaatcaat gcctccgtgg tcaacatcca gaaagaaatt 3540 gatcgactga acgaagtggc caagaatttg aatgagagcc tgattgatct gcaagagctg 3600 ggcaaatacg agcagtatat taagtggcct tggtacattt ggctgggatt cattgctgga 3660 ctgattgcca ttgtgatggt taccattatg ctgtgttgca tgacaagttg ttgcagttgc 3720 ctgaaaggat gctgtagttg cggtagttgc tgcaagtttg atgaggatga tagtgaacca 3780 gtgctgaaag gcgtgaagct gcattatact tgataagcgc gcctcgagga attc 3834 <210> 65 <211> 1262 <212> PRT <213> Artificial sequence <220> <223> SdeltaF polypeptide of SARS-CoV-2 <400> 65 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu 675 680 685 Gly Ala Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro 690 695 700 Thr Asn Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met 705 710 715 720 Thr Lys Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr 725 730 735 Glu Cys Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu 740 745 750 Asn Arg Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln 755 760 765 Glu Val Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys 770 775 780 Asp Phe Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys 785 790 795 800 Pro Ser Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr 805 810 815 Leu Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp 820 825 830 Ile Ala Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr 835 840 845 Val Leu Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser 850 855 860 Ala Leu Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly 865 870 875 880 Ala Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn 885 890 895 Gly Ile Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile 900 905 910 Ala Asn Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser 915 920 925 Ser Thr Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn 930 935 940 Ala Gln Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly 945 950 955 960 Ala Ile Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val 965 970 975 Glu Ala Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser 980 985 990 Leu Gln Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg 995 1000 1005 Ala Ser Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu 1010 1015 1020 Gly Gln Ser Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu 1025 1030 1035 Met Ser Phe Pro Gln Ser Ala Pro His Gly Val Val Phe Leu His 1040 1045 1050 Val Thr Tyr Val Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro 1055 1060 1065 Ala Ile Cys His Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val 1070 1075 1080 Phe Val Ser Asn Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe 1085 1090 1095 Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly 1100 1105 1110 Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp 1115 1120 1125 Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys 1130 1135 1140 Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile 1145 1150 1155 Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp 1160 1165 1170 Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp 1175 1180 1185 Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp 1190 1195 1200 Tyr Ile Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met 1205 1210 1215 Val Thr Ile Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu 1220 1225 1230 Lys Gly Cys Cys Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp 1235 1240 1245 Asp Ser Glu Pro Val Leu Lys Gly Val Lys Leu His Tyr Thr 1250 1255 1260 <210> 66 <211> 3834 <212> DNA <213> Artificial sequence <220> <223> MV-optimized nucleotide sequence of the S2PdeltaF polypeptide (SMVopt2PdeltaF) of SARS-CoV-2 <400> 66 gctagcagat ctcgtacggc caccatgttt gtgtttttgg ttttgttgcc actggtgtcc 60 agtcagtgtg ttaatttgac aacaagaaca cagctgccac cagcctacac aaatagtttt 120 acaaggggag tgtactaccc agataaggtg ttcagaagta gtgttctgca tagcacacag 180 gatctgtttc tgccattctt tagcaatgtg acctggttcc atgctattca tgtttccggt 240 acaaatggca ccaagcgctt tgataatcca gtgttgccat tcaatgatgg cgtgtacttt 300 gccagtaccg agaagagtaa tatcattcgc ggatggattt tcggaaccac actggatagt 360 aaaacccaga gtctgctgat tgtgaacaat gccaccaatg tggttatcaa agtgtgcgag 420 tttcagttct gcaatgatcc atttctgggc gtctactacc ataagaacaa caagagttgg 480 atggaaagcg agtttagagt gtacagtagt gccaacaatt gcacctttga atacgttagc 540 cagccattct tgatggattt ggagggaaag cagggcaatt tcaagaatct gcgcgagttc 600 gtgttcaaga atatcgacgg atacttcaaa atctacagca agcacacacc aatcaatctt 660 gttagagatt tgccacaggg attcagtgct ttggaaccat tggttgatct gccaatcgga 720 atcaatatta ccagatttca aacactgctg gccctgcata gaagttattt gacaccaggc 780 gattcaagta gtggatggac agctggtgct gctgcttatt atgttggata tctgcaacca 840 cgaacctttc tgctgaagta caatgagaat ggaacaatca cagatgctgt ggattgtgct 900 cttgatccac tgagtgaaac aaagtgcacc ctgaagagtt ttaccgttga gaagggaatc 960 taccagacca gtaattttcg agtgcagcca acagaaagta tcgtgcgctt cccaaatatt 1020 acaaatctgt gcccattcgg cgaagtgttt aatgctacaa gatttgctag tgtgtacgcc 1080 tggaatcgca agagaattag taattgcgtg gccgattaca gcgtgctgta taatagtgcc 1140 agctttagca cctttaagtg ctatggtgtt agtcccacaa agctgaatga tctgtgcttt 1200 accaatgtgt atgccgatag ttttgtgatc aggggagatg aagttcgaca aattgctcca 1260 ggacagactg gaaagattgc cgattataac tacaagctgc cagatgattt caccggatgt 1320 gtgattgcct ggaacagtaa caatctggat agcaaagttg gcggcaacta caattatctg 1380 tatcgcctgt ttcgcaagag caatctgaaa ccatttgagc gcgatatcag caccgaaatc 1440 tatcaagctg gaagtactcc atgcaatggc gtggaaggtt ttaattgcta ctttccactg 1500 cagtcctacg gatttcaacc tactaatggt gttggatacc agccatatag agtggtggtt 1560 ctgagttttg aattgctgca tgctccagct acagtgtgtg gaccaaagaa aagtaccaac 1620 ctggttaaga acaaatgcgt gaacttcaac ttcaatggac tgactggtac aggcgttctg 1680 actgagagta acaagaaatt cctgccattt cagcagtttg gacgagatat tgctgataca 1740 acagatgcag ttagagatcc ccaaacactg gaaattctgg atattacccc atgcagtttt 1800 ggcggagtta gtgttattac acccggcaca aataccagta atcaagttgc tgtgctgtac 1860 caggatgtga attgcacaga agttccagtt gcaattcatg cagatcagtt gacaccaaca 1920 tggcgagtgt atagtaccgg aagtaatgtt tttcagacac gagctggatg tctgattgga 1980 gccgaacatg ttaacaatag ctacgagtgc gatattccaa ttggtgctgg aatttgcgct 2040 agttatagtg tggccagtca gagtattatt gcctatacaa tgagtctggg agccgagaat 2100 agtgtggcct atagtaacaa ttccattgct atccccacca actttaccat tagtgtgaca 2160 acagagattc tgccagtgtc catgacaaag acaagtgtgg attgcaccat gtacatttgc 2220 ggagatagta cagaatgcag taatctgctg ctgcagtatg gaagtttctg tacacaactg 2280 aatagagccc tgactggaat tgctgtggaa caggataaga atactcaaga ggtgttcgcc 2340 caagtgaagc aaatctataa gaccccacct attaaggatt tcggcggatt caatttcagt 2400 cagattttgc cagatccaag caagccatcc aaacgcagtt ttattgagga cctgctgttc 2460 aacaaagtga cattggctga tgctggcttt attaagcaat atggcgattg tctgggagat 2520 atagctgcca gagatttgat ttgcgcccaa aagtttaatg gattgacagt tttgccacca 2580 ctgctgacag atgagatgat tgctcagtat acaagtgctc tgctggccgg aacaattaca 2640 tcaggatgga catttggagc tggtgcagca ttgcaaatac catttgctat gcagatggcc 2700 taccgcttta atggtattgg agttacccag aacgtgctgt acgaaaatca gaagctgatc 2760 gccaatcagt tcaatagcgc cattggaaaa attcaggata gcctgagtag tactgctagt 2820 gctcttggaa aactgcagga tgtggttaat cagaatgctc aggctctgaa tactctggtt 2880 aagcagttga gttccaattt cggagctatt agcagtgtgc tgaacgatat tctgagtcgt 2940 ttggatccac cagaggccga agttcagatt gatagactga ttacaggacg actgcagagc 3000 ttgcagacat atgttacaca acaactgatt cgagccgctg aaattagagc tagtgctaat 3060 ttggctgcca caaagatgag tgaatgtgtg cttggacaga gcaaaagagt ggatttttgc 3120 ggcaaaggat accatctgat gagctttcca caaagtgctc cacatggtgt tgtgtttctg 3180 catgttactt atgtgcccgc tcaagagaag aatttcacaa cagctccagc catttgccat 3240 gatggaaaag ctcattttcc acgagaaggc gtgttcgtta gtaatggtac tcattggttc 3300 gtgacccagc gcaattttta cgagccacag attattacca ccgacaatac tttcgtgtcc 3360 ggcaattgtg atgttgtgat tggaatcgtg aacaacacag tgtacgatcc attgcagcca 3420 gagctggata gttttaaaga ggaactggac aagtacttca agaaccatac aagtccagat 3480 gtggatctgg gcgatattag tggaatcaat gcctccgtgg tcaacatcca gaaagaaatt 3540 gatcgactga acgaagtggc caagaatttg aatgagagcc tgattgatct gcaagagctg 3600 ggcaaatacg agcagtatat taagtggcct tggtacattt ggctgggatt cattgctgga 3660 ctgattgcca ttgtgatggt taccattatg ctgtgttgca tgacaagttg ttgcagttgc 3720 ctgaaaggat gctgtagttg cggtagttgc tgcaagtttg atgaggatga tagtgaacca 3780 gtgctgaaag gcgtgaagct gcattatact tgataagcgc gcctcgagga attc 3834 <210> 67 <211> 9 <212> PRT <213> Artificial sequence <220> <223> measles H22-30 peptide <400> 67 Arg Ile Val Ile Asn Arg Glu His Leu 1 5 <210> 68 <211> 9 <212> PRT <213> Artificial sequence <220> <223> measles H446-454 peptide <400> 68 Ser Asn His Asn Asn Val Tyr Trp Leu 1 5 <210> 69 <211> 9 <212> PRT <213> Artificial sequence <220> <223> NP366 (SCOT) peptide <400> 69 Ala Ser Asn Glu Asn Met Asp Thr Met 1 5 <210> 70 <211> 26 <212> DNA <213> Artificial sequence <220> <223> E_Sarbeco_F1 primer <400> 70 acaggtacgt taatagttaa tagcgt 26 <210> 71 <211> 22 <212> DNA <213> Artificial sequence <220> <223> E_Sarbeco_R2 primer <400> 71 atattgcagc agtacgcaca ca 22 <210> 72 <211> 26 <212> DNA <213> Artificial sequence <220> <223> E_Sarbeco_P1 primer (FAM in 5' and BHQ-1 in 3') <400> 72 acactagcca tccttactgc gcttcg 26 <210> 73 <211> 3810 <212> DNA <213> Artificial sequence <220> <223> Codon-optimized nucleotide sequence of the SF-dER polypeptide of SARS-CoV-2 <400> 73 cgtacggcca ccatgttcgt ctttctggta ttgcttcctc tggtgagttc ccagtgcgtg 60 aacctgacga ctcggacaca gctgccgcct gcatacacaa acagcttcac acgaggtgtt 120 tactatccgg acaaggtgtt ccggtcctct gtcttgcaca gtactcagga cctttttctg 180 ccattcttta gtaacgtaac atggttccac gctatccatg taagtggaac caatggcacc 240 aagcgcttcg acaatccagt cctgcctttc aacgatggcg tctacttcgc ctctaccgag 300 aaatcaaata ttattagagg gtggatcttc gggaccaccc ttgatagcaa gactcagagt 360 cttctgatcg tgaacaatgc tactaacgtc gtcataaaag tatgtgaatt tcagttctgc 420 aatgacccct tcctgggcgt gtactatcac aaaaataaca agtcctggat ggaatccgag 480 tttcgggtat acagcagcgc taataactgt accttcgaat atgtgagcca gccattcctg 540 atggacctgg aggggaagca gggcaacttc aaaaacctga gggaattcgt gttcaagaac 600 attgacggat acttcaaaat ctacagcaag cacactccaa ttaatcttgt tagggacctt 660 cctcaggggt tctccgcgct ggaacccttg gtggatctgc caattggtat taacatcacg 720 aggtttcaaa ccctgctcgc cctccaccgg tcatacctga ccccaggtga tagtagtagt 780 ggctggacag caggggccgc agcatactac gtcggctacc tccagccccg cacattcctg 840 ctgaagtata atgaaaacgg tactattaca gatgctgtgg actgcgcact tgatccattg 900 tccgagacta aatgcacctt gaagtctttt accgttgaga agggaatcta tcagaccagt 960 aatttcagag tgcaacccac cgagagcatc gtgcgatttc ctaatattac aaacctgtgc 1020 ccttttggcg aggtgtttaa cgccactcgc ttcgcgagcg tgtatgcatg gaaccggaaa 1080 aggattagca actgcgtggc tgattattca gtcctttata atagtgcctc tttcagtacg 1140 ttcaaatgct atggagtgtc cccaactaag cttaacgatc tgtgttttac caacgtgtat 1200 gccgactctt tcgtcatcag gggcgacgag gttagacaaa ttgcgcccgg acagacaggc 1260 aaaattgctg actacaatta taaactgcca gatgacttta caggatgcgt gattgcctgg 1320 aacagcaaca accttgattc taaggtgggc ggaaactaca actatctgta caggctgttc 1380 cgcaaatcaa acctgaagcc attcgaaagg gacatttcaa ctgagatcta ccaggccgga 1440 tctacacctt gcaacggggt ggaaggattc aactgctact tcccgctcca gtcatatggc 1500 tttcaaccta ccaatggagt gggctaccaa ccttatcgag tagttgttct ctctttcgag 1560 ttgttgcatg ccccagccac tgtctgcgga ccaaagaaat ccaccaatct ggtgaaaaac 1620 aagtgcgtca acttcaactt caatggactc accggtacag gggttcttac cgagtcaaac 1680 aagaaattcc ttccgtttca gcagtttgga cgcgatatcg ccgacactac ggatgcagta 1740 cgcgatcctc agacacttga gatcctggac atcactccat gctcttttgg aggggtgtct 1800 gtcatcactc ccgggacgaa taccagtaat caggtcgccg tgctctatca agatgtcaac 1860 tgcacagagg tgccagtcgc cattcacgcc gatcagctta cccctacttg gcgagtatat 1920 agcacagggt ccaacgtgtt tcagacaagg gcgggttgtc tgatcggcgc tgagcacgtc 1980 aataatagct acgaatgtga catccctatt ggagccggga tttgcgctag ctatcagact 2040 cagactaact caccccggcg agctaggtct gtagcaagtc agagtatcat agcctatact 2100 atgagcctgg gggcagaaaa ttctgtcgct tatagtaata acagtattgc aattcctact 2160 aacttcacta ttagcgtgac tacagaaatt ctgccagtga gcatgaccaa gacctccgtc 2220 gactgtacca tgtatatctg cggagacagc acagaatgca gcaacctgct tctgcagtac 2280 ggtagctttt gtacccagct gaacagggca ctgaccggca tcgctgtgga acaggacaaa 2340 aatacgcagg aggtgttcgc tcaggtcaag cagatttata agacaccccc aataaaagac 2400 ttcggcggct ttaacttctc ccagatcctg cccgatccgt caaaaccttc caagagaagt 2460 tttatcgagg atctgctgtt taacaaagta acattggctg atgctggctt tattaaacag 2520 tacggcgatt gtctgggaga tatcgccgct agagatctga tctgcgctca aaaatttaat 2580 ggcctcactg tattgccccc cctgctgacg gatgaaatga ttgcccaata cacatcagcc 2640 ctgctggctg ggacaatcac ttccggctgg acgttcggtg ctggagctgc tcttcaaatt 2700 ccatttgcca tgcaaatggc ttatagattc aacggaattg gcgtgaccca aaacgtgctg 2760 tacgaaaatc aaaagctgat tgctaatcag tttaactccg ctatcggtaa gatacaggac 2820 agcctgtcta gtactgccag cgccctcgga aagctccagg atgtggtgaa ccagaatgcg 2880 caggcgctga acacactcgt caaacagctt agcagcaatt tcggcgcaat tagcagtgta 2940 ctgaacgaca tcttgtctcg gctcgacaag gtcgaggccg aagtgcagat tgatcgcctg 3000 atcactggcc ggctccagtc tctgcagacc tacgtaaccc agcaactcat acgcgctgcc 3060 gaaattcggg cttcagctaa cctggccgca acaaagatgt ctgaatgtgt tcttgggcag 3120 tccaagaggg tggacttctg cgggaaagga tatcacctga tgtccttccc tcagagcgcc 3180 cctcatggag tggtgtttct tcatgttacc tatgttccgg cccaggaaaa gaattttacc 3240 actgccccag ccatttgcca tgatggtaaa gcacacttcc caagagaggg cgtgtttgtt 3300 agtaacggca cccactggtt cgttacccag cgcaattttt acgaacctca aatcattacc 3360 actgacaata catttgtatc aggcaattgc gacgtggtga tcggaatcgt aaataataca 3420 gtctacgatc ccctgcagcc agagcttgac agctttaaag aggaactgga caaatacttc 3480 aaaaatcata caagccccga cgtcgacctg ggagatattt ctggcatcaa tgcctccgtc 3540 gtgaatatcc aaaaagagat cgaccgcctt aatgaggttg ccaaaaacct caacgagtcc 3600 ctgattgatc tgcaggagct ggggaagtac gagcagtata tcaaatggcc ctggtacatc 3660 tggctgggct tcattgccgg gctcatagcc atcgtgatgg tgacgatcat gctgtgttgc 3720 atgacctctt gctgttcttg tctgaagggg tgctgctctt gtgggagttg ttgtaaattc 3780 gatgaggatg attccgaata ataggcgcgc 3810 <210> 74 <211> 1262 <212> PRT <213> Artificial sequence <220> <223> SF-dER polypeptide of SARS-CoV-2 <400> 74 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile 885 890 895 Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 1010 1015 1020 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys 1025 1030 1035 Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1040 1045 1050 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val 1055 1060 1065 Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His 1070 1075 1080 Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn 1085 1090 1095 Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln 1100 1105 1110 Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val 1115 1120 1125 Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro 1130 1135 1140 Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn 1145 1150 1155 His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn 1160 1165 1170 Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu 1175 1180 1185 Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu 1190 1195 1200 Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu 1205 1210 1215 Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met 1220 1225 1230 Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys 1235 1240 1245 Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu 1250 1255 1260 <210> 75 <211> 3810 <212> DNA <213> Artificial sequence <220> <223> Codon-optimized nucleotide sequence of the SF-2P-dER polypeptide of SARS-CoV-2 <400> 75 cgtacggcca ccatgttcgt ctttctggta ttgcttcctc tggtgagttc ccagtgcgtg 60 aacctgacga ctcggacaca gctgccgcct gcatacacaa acagcttcac acgaggtgtt 120 tactatccgg acaaggtgtt ccggtcctct gtcttgcaca gtactcagga cctttttctg 180 ccattcttta gtaacgtaac atggttccac gctatccatg taagtggaac caatggcacc 240 aagcgcttcg acaatccagt cctgcctttc aacgatggcg tctacttcgc ctctaccgag 300 aaatcaaata ttattagagg gtggatcttc gggaccaccc ttgatagcaa gactcagagt 360 cttctgatcg tgaacaatgc tactaacgtc gtcataaaag tatgtgaatt tcagttctgc 420 aatgacccct tcctgggcgt gtactatcac aaaaataaca agtcctggat ggaatccgag 480 tttcgggtat acagcagcgc taataactgt accttcgaat atgtgagcca gccattcctg 540 atggacctgg aggggaagca gggcaacttc aaaaacctga gggaattcgt gttcaagaac 600 attgacggat acttcaaaat ctacagcaag cacactccaa ttaatcttgt tagggacctt 660 cctcaggggt tctccgcgct ggaacccttg gtggatctgc caattggtat taacatcacg 720 aggtttcaaa ccctgctcgc cctccaccgg tcatacctga ccccaggtga tagtagtagt 780 ggctggacag caggggccgc agcatactac gtcggctacc tccagccccg cacattcctg 840 ctgaagtata atgaaaacgg tactattaca gatgctgtgg actgcgcact tgatccattg 900 tccgagacta aatgcacctt gaagtctttt accgttgaga agggaatcta tcagaccagt 960 aatttcagag tgcaacccac cgagagcatc gtgcgatttc ctaatattac aaacctgtgc 1020 ccttttggcg aggtgtttaa cgccactcgc ttcgcgagcg tgtatgcatg gaaccggaaa 1080 aggattagca actgcgtggc tgattattca gtcctttata atagtgcctc tttcagtacg 1140 ttcaaatgct atggagtgtc cccaactaag cttaacgatc tgtgttttac caacgtgtat 1200 gccgactctt tcgtcatcag gggcgacgag gttagacaaa ttgcgcccgg acagacaggc 1260 aaaattgctg actacaatta taaactgcca gatgacttta caggatgcgt gattgcctgg 1320 aacagcaaca accttgattc taaggtgggc ggaaactaca actatctgta caggctgttc 1380 cgcaaatcaa acctgaagcc attcgaaagg gacatttcaa ctgagatcta ccaggccgga 1440 tctacacctt gcaacggggt ggaaggattc aactgctact tcccgctcca gtcatatggc 1500 tttcaaccta ccaatggagt gggctaccaa ccttatcgag tagttgttct ctctttcgag 1560 ttgttgcatg ccccagccac tgtctgcgga ccaaagaaat ccaccaatct ggtgaaaaac 1620 aagtgcgtca acttcaactt caatggactc accggtacag gggttcttac cgagtcaaac 1680 aagaaattcc ttccgtttca gcagtttgga cgcgatatcg ccgacactac ggatgcagta 1740 cgcgatcctc agacacttga gatcctggac atcactccat gctcttttgg aggggtgtct 1800 gtcatcactc ccgggacgaa taccagtaat caggtcgccg tgctctatca agatgtcaac 1860 tgcacagagg tgccagtcgc cattcacgcc gatcagctta cccctacttg gcgagtatat 1920 agcacagggt ccaacgtgtt tcagacaagg gcgggttgtc tgatcggcgc tgagcacgtc 1980 aataatagct acgaatgtga catccctatt ggagccggga tttgcgctag ctatcagact 2040 cagactaact caccccggcg agctaggtct gtagcaagtc agagtatcat agcctatact 2100 atgagcctgg gggcagaaaa ttctgtcgct tatagtaata acagtattgc aattcctact 2160 aacttcacta ttagcgtgac tacagaaatt ctgccagtga gcatgaccaa gacctccgtc 2220 gactgtacca tgtatatctg cggagacagc acagaatgca gcaacctgct tctgcagtac 2280 ggtagctttt gtacccagct gaacagggca ctgaccggca tcgctgtgga acaggacaaa 2340 aatacgcagg aggtgttcgc tcaggtcaag cagatttata agacaccccc aataaaagac 2400 ttcggcggct ttaacttctc ccagatcctg cccgatccgt caaaaccttc caagagaagt 2460 tttatcgagg atctgctgtt taacaaagta acattggctg atgctggctt tattaaacag 2520 tacggcgatt gtctgggaga tatcgccgct agagatctga tctgcgctca aaaatttaat 2580 ggcctcactg tattgccccc cctgctgacg gatgaaatga ttgcccaata cacatcagcc 2640 ctgctggctg ggacaatcac ttccggctgg acgttcggtg ctggagctgc tcttcaaatt 2700 ccatttgcca tgcaaatggc ttatagattc aacggaattg gcgtgaccca aaacgtgctg 2760 tacgaaaatc aaaagctgat tgctaatcag tttaactccg ctatcggtaa gatacaggac 2820 agcctgtcta gtactgccag cgccctcgga aagctccagg atgtggtgaa ccagaatgcg 2880 caggcgctga acacactcgt caaacagctt agcagcaatt tcggcgcaat tagcagtgta 2940 ctgaacgaca tcttgtctcg gctcgaccca ccagaggccg aagtgcagat tgatcgcctg 3000 atcactggcc ggctccagtc tctgcagacc tacgtaaccc agcaactcat acgcgctgcc 3060 gaaattcggg cttcagctaa cctggccgca acaaagatgt ctgaatgtgt tcttgggcag 3120 tccaagaggg tggacttctg cgggaaagga tatcacctga tgtccttccc tcagagcgcc 3180 cctcatggag tggtgtttct tcatgttacc tatgttccgg cccaggaaaa gaattttacc 3240 actgccccag ccatttgcca tgatggtaaa gcacacttcc caagagaggg cgtgtttgtt 3300 agtaacggca cccactggtt cgttacccag cgcaattttt acgaacctca aatcattacc 3360 actgacaata catttgtatc aggcaattgc gacgtggtga tcggaatcgt aaataataca 3420 gtctacgatc ccctgcagcc agagcttgac agctttaaag aggaactgga caaatacttc 3480 aaaaatcata caagccccga cgtcgacctg ggagatattt ctggcatcaa tgcctccgtc 3540 gtgaatatcc aaaaagagat cgaccgcctt aatgaggttg ccaaaaacct caacgagtcc 3600 ctgattgatc tgcaggagct ggggaagtac gagcagtata tcaaatggcc ctggtacatc 3660 tggctgggct tcattgccgg gctcatagcc atcgtgatgg tgacgatcat gctgtgttgc 3720 atgacctctt gctgttcttg tctgaagggg tgctgctctt gtgggagttg ttgtaaattc 3780 gatgaggatg attccgaata ataggcgcgc 3810 <210> 76 <211> 1262 <212> PRT <213> Artificial sequence <220> <223> SF-2P-dER polypeptide of SARS-CoV-2 <400> 76 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile 885 890 895 Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 1010 1015 1020 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys 1025 1030 1035 Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1040 1045 1050 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val 1055 1060 1065 Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His 1070 1075 1080 Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn 1085 1090 1095 Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln 1100 1105 1110 Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val 1115 1120 1125 Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro 1130 1135 1140 Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn 1145 1150 1155 His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn 1160 1165 1170 Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu 1175 1180 1185 Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu 1190 1195 1200 Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu 1205 1210 1215 Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met 1220 1225 1230 Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys 1235 1240 1245 Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu 1250 1255 1260 <210> 77 <211> 1794 <212> DNA <213> Artificial sequence <220> <223> Codon-optimized nucleotide sequence of the S2-dER polypeptide of SARS-CoV-2 <400> 77 cgtacggcca ccatgttcgt ctttctggta ttgcttcctc tggtgagttc ccagtgcgta 60 gcaagtcaga gtatcatagc ctatactatg agcctggggg cagaaaattc tgtcgcttat 120 agtaataaca gtattgcaat tcctactaac ttcactatta gcgtgactac agaaattctg 180 ccagtgagca tgaccaagac ctccgtcgac tgtaccatgt atatctgcgg agacagcaca 240 gaatgcagca acctgcttct gcagtacggt agcttttgta cccagctgaa cagggcactg 300 accggcatcg ctgtggaaca ggacaaaaat acgcaggagg tgttcgctca ggtcaagcag 360 atttataaga cacccccaat aaaagacttc ggcggcttta acttctccca gatcctgccc 420 gatccgtcaa aaccttccaa gagaagtttt atcgaggatc tgctgtttaa caaagtaaca 480 ttggctgatg ctggctttat taaacagtac ggcgattgtc tgggagatat cgccgctaga 540 gatctgatct gcgctcaaaa atttaatggc ctcactgtat tgccccccct gctgacggat 600 gaaatgattg cccaatacac atcagccctg ctggctggga caatcacttc cggctggacg 660 ttcggtgctg gagctgctct tcaaattcca tttgccatgc aaatggctta tagattcaac 720 ggaattggcg tgacccaaaa cgtgctgtac gaaaatcaaa agctgattgc taatcagttt 780 aactccgcta tcggtaagat acaggacagc ctgtctagta ctgccagcgc cctcggaaag 840 ctccaggatg tggtgaacca gaatgcgcag gcgctgaaca cactcgtcaa acagcttagc 900 agcaatttcg gcgcaattag cagtgtactg aacgacatct tgtctcggct cgacaaggtc 960 gaggccgaag tgcagattga tcgcctgatc actggccggc tccagtctct gcagacctac 1020 gtaacccagc aactcatacg cgctgccgaa attcgggctt cagctaacct ggccgcaaca 1080 aagatgtctg aatgtgttct tgggcagtcc aagagggtgg acttctgcgg gaaaggatat 1140 cacctgatgt ccttccctca gagcgcccct catggagtgg tgtttcttca tgttacctat 1200 gttccggccc aggaaaagaa ttttaccact gccccagcca tttgccatga tggtaaagca 1260 cacttcccaa gagagggcgt gtttgttagt aacggcaccc actggttcgt tacccagcgc 1320 aatttttacg aacctcaaat cattaccact gacaatacat ttgtatcagg caattgcgac 1380 gtggtgatcg gaatcgtaaa taatacagtc tacgatcccc tgcagccaga gcttgacagc 1440 tttaaagagg aactggacaa atacttcaaa aatcatacaa gccccgacgt cgacctggga 1500 gatatttctg gcatcaatgc ctccgtcgtg aatatccaaa aagagatcga ccgccttaat 1560 gaggttgcca aaaacctcaa cgagtccctg attgatctgc aggagctggg gaagtacgag 1620 cagtatatca aatggccctg gtacatctgg ctgggcttca ttgccgggct catagccatc 1680 gtgatggtga cgatcatgct gtgttgcatg acctcttgct gttcttgtct gaaggggtgc 1740 tgctcttgtg ggagttgttg taaattcgat gaggatgatt ccgaataagc gcgc 1794 <210> 78 <211> 591 <212> PRT <213> Artificial sequence <220> <223> S2-dER polypeptide of SARS-CoV-2 <400> 78 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn 20 25 30 Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr 35 40 45 Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser 50 55 60 Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn 65 70 75 80 Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu 85 90 95 Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala 100 105 110 Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly 115 120 125 Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg 130 135 140 Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala 145 150 155 160 Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg 165 170 175 Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro 180 185 190 Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala 195 200 205 Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln 210 215 220 Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val 225 230 235 240 Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe 245 250 255 Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser 260 265 270 Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu 275 280 285 Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser 290 295 300 Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val 305 310 315 320 Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr 325 330 335 Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 340 345 350 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg 355 360 365 Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser 370 375 380 Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln 385 390 395 400 Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala 405 410 415 His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe 420 425 430 Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn 435 440 445 Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn 450 455 460 Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu 465 470 475 480 Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly 485 490 495 Asp Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile 500 505 510 Asp Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp 515 520 525 Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr 530 535 540 Ile Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr 545 550 555 560 Ile Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys 565 570 575 Cys Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu 580 585 590 <210> 79 <211> 1794 <212> DNA <213> Artificial sequence <220> <223> Codon-optimized nucleotide sequence of the S2-2P-dER polypeptide of SARS-CoV-2 <400> 79 cgtacggcca ccatgttcgt ctttctggta ttgcttcctc tggtgagttc ccagtgcgta 60 gcaagtcaga gtatcatagc ctatactatg agcctggggg cagaaaattc tgtcgcttat 120 agtaataaca gtattgcaat tcctactaac ttcactatta gcgtgactac agaaattctg 180 ccagtgagca tgaccaagac ctccgtcgac tgtaccatgt atatctgcgg agacagcaca 240 gaatgcagca acctgcttct gcagtacggt agcttttgta cccagctgaa cagggcactg 300 accggcatcg ctgtggaaca ggacaaaaat acgcaggagg tgttcgctca ggtcaagcag 360 atttataaga cacccccaat aaaagacttc ggcggcttta acttctccca gatcctgccc 420 gatccgtcaa aaccttccaa gagaagtttt atcgaggatc tgctgtttaa caaagtaaca 480 ttggctgatg ctggctttat taaacagtac ggcgattgtc tgggagatat cgccgctaga 540 gatctgatct gcgctcaaaa atttaatggc ctcactgtat tgccccccct gctgacggat 600 gaaatgattg cccaatacac atcagccctg ctggctggga caatcacttc cggctggacg 660 ttcggtgctg gagctgctct tcaaattcca tttgccatgc aaatggctta tagattcaac 720 ggaattggcg tgacccaaaa cgtgctgtac gaaaatcaaa agctgattgc taatcagttt 780 aactccgcta tcggtaagat acaggacagc ctgtctagta ctgccagcgc cctcggaaag 840 ctccaggatg tggtgaacca gaatgcgcag gcgctgaaca cactcgtcaa acagcttagc 900 agcaatttcg gcgcaattag cagtgtactg aacgacatct tgtctcggct cgacccacca 960 gaggccgaag tgcagattga tcgcctgatc actggccggc tccagtctct gcagacctac 1020 gtaacccagc aactcatacg cgctgccgaa attcgggctt cagctaacct ggccgcaaca 1080 aagatgtctg aatgtgttct tgggcagtcc aagagggtgg acttctgcgg gaaaggatat 1140 cacctgatgt ccttccctca gagcgcccct catggagtgg tgtttcttca tgttacctat 1200 gttccggccc aggaaaagaa ttttaccact gccccagcca tttgccatga tggtaaagca 1260 cacttcccaa gagagggcgt gtttgttagt aacggcaccc actggttcgt tacccagcgc 1320 aatttttacg aacctcaaat cattaccact gacaatacat ttgtatcagg caattgcgac 1380 gtggtgatcg gaatcgtaaa taatacagtc tacgatcccc tgcagccaga gcttgacagc 1440 tttaaagagg aactggacaa atacttcaaa aatcatacaa gccccgacgt cgacctggga 1500 gatatttctg gcatcaatgc ctccgtcgtg aatatccaaa aagagatcga ccgccttaat 1560 gaggttgcca aaaacctcaa cgagtccctg attgatctgc aggagctggg gaagtacgag 1620 cagtatatca aatggccctg gtacatctgg ctgggcttca ttgccgggct catagccatc 1680 gtgatggtga cgatcatgct gtgttgcatg acctcttgct gttcttgtct gaaggggtgc 1740 tgctcttgtg ggagttgttg taaattcgat gaggatgatt ccgaataagc gcgc 1794 <210> 80 <211> 591 <212> PRT <213> Artificial sequence <220> <223> S2-2P-dER polypeptide of SARS-CoV-2 <400> 80 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn 20 25 30 Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr 35 40 45 Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser 50 55 60 Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn 65 70 75 80 Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu 85 90 95 Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala 100 105 110 Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly 115 120 125 Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg 130 135 140 Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala 145 150 155 160 Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg 165 170 175 Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro 180 185 190 Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala 195 200 205 Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln 210 215 220 Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val 225 230 235 240 Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe 245 250 255 Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser 260 265 270 Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu 275 280 285 Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser 290 295 300 Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val 305 310 315 320 Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr 325 330 335 Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 340 345 350 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg 355 360 365 Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser 370 375 380 Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln 385 390 395 400 Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala 405 410 415 His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe 420 425 430 Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn 435 440 445 Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn 450 455 460 Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu 465 470 475 480 Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly 485 490 495 Asp Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile 500 505 510 Asp Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp 515 520 525 Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr 530 535 540 Ile Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr 545 550 555 560 Ile Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys 565 570 575 Cys Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu 580 585 590 <210> 81 <211> 3840 <212> DNA <213> Artificial sequence <220> <223> Codon-optimized nucleotide sequence of the SF-2P-2a polypeptide of SARS-CoV-2 <400> 81 cgtacggcca ccatgttcgt ctttctggta ttgcttcctc tggtgagttc ccagtgcgtg 60 aacctgacga ctcggacaca gctgccgcct gcatacacaa acagcttcac acgaggtgtt 120 tactatccgg acaaggtgtt ccggtcctct gtcttgcaca gtactcagga cctttttctg 180 ccattcttta gtaacgtaac atggttccac gctatccatg taagtggaac caatggcacc 240 aagcgcttcg acaatccagt cctgcctttc aacgatggcg tctacttcgc ctctaccgag 300 aaatcaaata ttattagagg gtggatcttc gggaccaccc ttgatagcaa gactcagagt 360 cttctgatcg tgaacaatgc tactaacgtc gtcataaaag tatgtgaatt tcagttctgc 420 aatgacccct tcctgggcgt gtactatcac aaaaataaca agtcctggat ggaatccgag 480 tttcgggtat acagcagcgc taataactgt accttcgaat atgtgagcca gccattcctg 540 atggacctgg aggggaagca gggcaacttc aaaaacctga gggaattcgt gttcaagaac 600 attgacggat acttcaaaat ctacagcaag cacactccaa ttaatcttgt tagggacctt 660 cctcaggggt tctccgcgct ggaacccttg gtggatctgc caattggtat taacatcacg 720 aggtttcaaa ccctgctcgc cctccaccgg tcatacctga ccccaggtga tagtagtagt 780 ggctggacag caggggccgc agcatactac gtcggctacc tccagccccg cacattcctg 840 ctgaagtata atgaaaacgg tactattaca gatgctgtgg actgcgcact tgatccattg 900 tccgagacta aatgcacctt gaagtctttt accgttgaga agggaatcta tcagaccagt 960 aatttcagag tgcaacccac cgagagcatc gtgcgatttc ctaatattac aaacctgtgc 1020 ccttttggcg aggtgtttaa cgccactcgc ttcgcgagcg tgtatgcatg gaaccggaaa 1080 aggattagca actgcgtggc tgattattca gtcctttata atagtgcctc tttcagtacg 1140 ttcaaatgct atggagtgtc cccaactaag cttaacgatc tgtgttttac caacgtgtat 1200 gccgactctt tcgtcatcag gggcgacgag gttagacaaa ttgcgcccgg acagacaggc 1260 aaaattgctg actacaatta taaactgcca gatgacttta caggatgcgt gattgcctgg 1320 aacagcaaca accttgattc taaggtgggc ggaaactaca actatctgta caggctgttc 1380 cgcaaatcaa acctgaagcc attcgaaagg gacatttcaa ctgagatcta ccaggccgga 1440 tctacacctt gcaacggggt ggaaggattc aactgctact tcccgctcca gtcatatggc 1500 tttcaaccta ccaatggagt gggctaccaa ccttatcgag tagttgttct ctctttcgag 1560 ttgttgcatg ccccagccac tgtctgcgga ccaaagaaat ccaccaatct ggtgaaaaac 1620 aagtgcgtca acttcaactt caatggactc accggtacag gggttcttac cgagtcaaac 1680 aagaaattcc ttccgtttca gcagtttgga cgcgatatcg ccgacactac ggatgcagta 1740 cgcgatcctc agacacttga gatcctggac atcactccat gctcttttgg aggggtgtct 1800 gtcatcactc ccgggacgaa taccagtaat caggtcgccg tgctctatca agatgtcaac 1860 tgcacagagg tgccagtcgc cattcacgcc gatcagctta cccctacttg gcgagtatat 1920 agcacagggt ccaacgtgtt tcagacaagg gcgggttgtc tgatcggcgc tgagcacgtc 1980 aataatagct acgaatgtga catccctatt ggagccggga tttgcgctag ctatcagact 2040 cagactaact caccccggcg agctaggtct gtagcaagtc agagtatcat agcctatact 2100 atgagcctgg gggcagaaaa ttctgtcgct tatagtaata acagtattgc aattcctact 2160 aacttcacta ttagcgtgac tacagaaatt ctgccagtga gcatgaccaa gacctccgtc 2220 gactgtacca tgtatatctg cggagacagc acagaatgca gcaacctgct tctgcagtac 2280 ggtagctttt gtacccagct gaacagggca ctgaccggca tcgctgtgga acaggacaaa 2340 aatacgcagg aggtgttcgc tcaggtcaag cagatttata agacaccccc aataaaagac 2400 ttcggcggct ttaacttctc ccagatcctg cccgatccgt caaaaccttc caagagaagt 2460 tttatcgagg atctgctgtt taacaaagta acattggctg atgctggctt tattaaacag 2520 tacggcgatt gtctgggaga tatcgccgct agagatctga tctgcgctca aaaatttaat 2580 ggcctcactg tattgccccc cctgctgacg gatgaaatga ttgcccaata cacatcagcc 2640 ctgctggctg ggacaatcac ttccggctgg acgttcggtg ctggagctgc tcttcaaatt 2700 ccatttgcca tgcaaatggc ttatagattc aacggaattg gcgtgaccca aaacgtgctg 2760 tacgaaaatc aaaagctgat tgctaatcag tttaactccg ctatcggtaa gatacaggac 2820 agcctgtcta gtactgccag cgccctcgga aagctccagg atgtggtgaa ccagaatgcg 2880 caggcgctga acacactcgt caaacagctt agcagcaatt tcggcgcaat tagcagtgta 2940 ctgaacgaca tcttgtctcg gctcgaccca ccagaggccg aagtgcagat tgatcgcctg 3000 atcactggcc ggctccagtc tctgcagacc tacgtaaccc agcaactcat acgcgctgcc 3060 gaaattcggg cttcagctaa cctggccgca acaaagatgt ctgaatgtgt tcttgggcag 3120 tccaagaggg tggacttctg cgggaaagga tatcacctga tgtccttccc tcagagcgcc 3180 cctcatggag tggtgtttct tcatgttacc tatgttccgg cccaggaaaa gaattttacc 3240 actgccccag ccatttgcca tgatggtaaa gcacacttcc caagagaggg cgtgtttgtt 3300 agtaacggca cccactggtt cgttacccag cgcaattttt acgaacctca aatcattacc 3360 actgacaata catttgtatc aggcaattgc gacgtggtga tcggaatcgt aaataataca 3420 gtctacgatc ccctgcagcc agagcttgac agctttaaag aggaactgga caaatacttc 3480 aaaaatcata caagccccga cgtcgacctg ggagatattt ctggcatcaa tgcctccgtc 3540 gtgaatatcc aaaaagagat cgaccgcctt aatgaggttg ccaaaaacct caacgagtcc 3600 ctgattgatc tgcaggagct ggggaagtac gagcagtata tcaaatggcc ctggtacatc 3660 tggctgggct tcattgccgg gctcatagcc atcgtgatgg tgacgatcat gctgtgttgc 3720 atgacctctt gctgttcttg tctgaagggg tgctgctctt gtgggagttg ttgtaaattc 3780 gatgaggatg attccgaacc tgtgctgaag ggagtcgcgc tcgcctatac gtaagcgcgc 3840 <210> 82 <211> 1273 <212> PRT <213> Artificial sequence <220> <223> SF-2P-2a polypeptide of SARS-CoV-2 <400> 82 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile 885 890 895 Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 1010 1015 1020 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys 1025 1030 1035 Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1040 1045 1050 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val 1055 1060 1065 Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His 1070 1075 1080 Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn 1085 1090 1095 Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln 1100 1105 1110 Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val 1115 1120 1125 Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro 1130 1135 1140 Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn 1145 1150 1155 His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn 1160 1165 1170 Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu 1175 1180 1185 Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu 1190 1195 1200 Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu 1205 1210 1215 Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met 1220 1225 1230 Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys 1235 1240 1245 Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro 1250 1255 1260 Val Leu Lys Gly Val Ala Leu Ala Tyr Thr 1265 1270 <210> 83 <211> 15 <212> PRT <213> Artificial sequence <220> <223> CD4 peptide (52-66) <400> 83 Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp Phe His 1 5 10 15 <210> 84 <211> 15 <212> PRT <213> Artificial sequence <220> <223> CD4 peptide (469-483) <400> 84 Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val 1 5 10 15 <210> 85 <211> 15 <212> PRT <213> Artificial sequence <220> <223> CD4 peptide (512-526) <400> 85 Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly 1 5 10 15 <210> 86 <211> 15 <212> PRT <213> Artificial sequence <220> <223> CD4 peptide (702-716) <400> 86 Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr 1 5 10 15 <210> 87 <211> 15 <212> PRT <213> Artificial sequence <220> <223> CD4 peptide (882-896) <400> 87 Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile 1 5 10 15 <210> 88 <211> 15 <212> PRT <213> Artificial sequence <220> <223> CD4 peptide (901-915) <400> 88 Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val 1 5 10 15 <210> 89 <211> 15 <212> PRT <213> Artificial sequence <220> <223> CD4 peptide (932-946) <400> 89 Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly 1 5 10 15 <210> 90 <211> 15 <212> PRT <213> Artificial sequence <220> <223> CD4 peptide (1013-1027) <400> 90 Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala Thr 1 5 10 15 <210> 91 <211> 15 <212> PRT <213> Artificial sequence <220> <223> CD4 peptide (1046-1060) <400> 91 Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala Pro His Gly Val 1 5 10 15 <210> 92 <211> 15 <212> PRT <213> Artificial sequence <220> <223> CD4 peptide (1069-1083) <400> 92 Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His 1 5 10 15 <210> 93 <211> 9 <212> PRT <213> Artificial sequence <220> <223> CD8 peptide (2-10) <400> 93 Phe Val Phe Leu Val Leu Leu Pro Leu 1 5 <210> 94 <211> 9 <212> PRT <213> Artificial sequence <220> <223> CD8 peptide (16-24) <400> 94 Val Asn Leu Thr Thr Arg Thr Gln Leu 1 5 <210> 95 <211> 9 <212> PRT <213> Artificial sequence <220> <223> CD8 peptide (54-62) <400> 95 Leu Phe Leu Pro Phe Phe Ser Asn Val 1 5 <210> 96 <211> 9 <212> PRT <213> Artificial sequence <220> <223> CD8 peptide (60-68) <400> 96 Ser Asn Val Thr Trp Phe His Ala Ile 1 5 <210> 97 <211> 9 <212> PRT <213> Artificial sequence <220> <223> CD8 peptide (62-70) <400> 97 Val Thr Trp Phe His Ala Ile His Val 1 5 <210> 98 <211> 9 <212> PRT <213> Artificial sequence <220> <223> CD8 peptide (102-110) <400> 98 Arg Gly Trp Ile Phe Gly Thr Thr Leu 1 5 <210> 99 <211> 9 <212> PRT <213> Artificial sequence <220> <223> CD8 peptide (133-141) <400> 99 Phe Gln Phe Cys Asn Asp Pro Phe Leu 1 5 <210> 100 <211> 9 <212> PRT <213> Artificial sequence <220> <223> CD8 peptide (160-168) <400> 100 Tyr Ser Ser Ala Asn Asn Cys Thr Phe 1 5 <210> 101 <211> 9 <212> PRT <213> Artificial sequence <220> <223> CD8 peptide (171-179) <400> 101 Val Ser Gln Pro Phe Leu Met Asp Leu 1 5 <210> 102 <211> 9 <212> PRT <213> Artificial sequence <220> <223> CD8 peptide (202-210) <400> 102 Lys Ile Tyr Ser Lys His Thr Pro Ile 1 5 <210> 103 <211> 9 <212> PRT <213> Artificial sequence <220> <223> CD8 peptide (233-241) <400> 103 Ile Asn Ile Thr Arg Phe Gln Thr Leu 1 5 <210> 104 <211> 9 <212> PRT <213> Artificial sequence <220> <223> CD8 peptide (262-270) <400> 104 Ala Ala Ala Tyr Tyr Val Gly Tyr Leu 1 5 <210> 105 <211> 9 <212> PRT <213> Artificial sequence <220> <223> CD8 peptide (327-335) <400> 105 Val Arg Phe Pro Asn Ile Thr Asn Leu 1 5 <210> 106 <211> 9 <212> PRT <213> Artificial sequence <220> <223> CD8 peptide (342-350) <400> 106 Phe Asn Ala Thr Arg Phe Ala Ser Val 1 5 <210> 107 <211> 9 <212> PRT <213> Artificial sequence <220> <223> CD8 peptide (447-455) <400> 107 Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu 1 5 <210> 108 <211> 9 <212> PRT <213> Artificial sequence <220> <223> CD8 peptide (503-511) <400> 108 Val Gly Tyr Gln Pro Tyr Arg Val Val 1 5 <210> 109 <211> 9 <212> PRT <213> Artificial sequence <220> <223> CD8 peptide (510-518) <400> 109 Val Val Val Leu Ser Phe Glu Leu Leu 1 5 <210> 110 <211> 9 <212> PRT <213> Artificial sequence <220> <223> CD8 peptide (539-547) <400> 110 Val Asn Phe Asn Phe Asn Gly Leu Thr 1 5 <210> 111 <211> 9 <212> PRT <213> Artificial sequence <220> <223> CD8 peptide (612-620) <400> 111 Tyr Gln Asp Val Asn Cys Thr Glu Val 1 5 <210> 112 <211> 9 <212> PRT <213> Artificial sequence <220> <223> CD8 peptide (691-699) <400> 112 Ser Ile Ile Ala Tyr Thr Met Ser Leu 1 5 <210> 113 <211> 9 <212> PRT <213> Artificial sequence <220> <223> CD8 peptide (705-713) <400> 113 Val Ala Tyr Ser Asn Asn Ser Ile Ala 1 5 <210> 114 <211> 9 <212> PRT <213> Artificial sequence <220> <223> CD8 peptide (797-805) <400> 114 Phe Gly Gly Phe Asn Phe Ser Gln Ile 1 5 <210> 115 <211> 9 <212> PRT <213> Artificial sequence <220> <223> CD8 peptide (892-900) <400> 115 Ala Ala Leu Gln Ile Pro Phe Ala Met 1 5 <210> 116 <211> 9 <212> PRT <213> Artificial sequence <220> <223> CD8 peptide (951-959) <400> 116 Val Val Asn Gln Asn Ala Gln Ala Leu 1 5 <210> 117 <211> 9 <212> PRT <213> Artificial sequence <220> <223> CD8 peptide (1060-1068) <400> 117 Val Val Phe Leu His Val Thr Tyr Val 1 5 <210> 118 <211> 9 <212> PRT <213> Artificial sequence <220> <223> CD8 peptide (1169-1177) <400> 118 Ile Ser Gly Ile Asn Ala Ser Val Val 1 5 <210> 119 <211> 9 <212> PRT <213> Artificial sequence <220> <223> CD8 peptide (1216-1224) <400> 119 Ile Trp Leu Gly Phe Ile Ala Gly Leu 1 5 <210> 120 <211> 9 <212> PRT <213> Artificial sequence <220> <223> CD8 peptide (1225-1233) <400> 120 Ile Ala Ile Val Met Val Thr Ile Met 1 5 <210> 121 <211> 36 <212> DNA <213> Artificial sequence <220> <223> Construction primer BsiWI-Signal <400> 121 taacgtacgg ccaccatgtt cgtctttctg gtattg 36 <210> 122 <211> 35 <212> DNA <213> Artificial sequence <220> <223> Construction primer BssHII-SF <400> 122 taagcgcgcc tattattcgg aatcatcctc atcga 35 <210> 123 <211> 34 <212> DNA <213> Artificial sequence <220> <223> Construction primer BsmBI-signal <400> 123 taacgtctcc gcactgggaa ctcaccagag gaag 34 <210> 124 <211> 36 <212> DNA <213> Artificial sequence <220> <223> Construction primer BsmBI-S2 <400> 124 taacgtctca gtgcgtagca agtcagagta tcatag 36 <210> 125 <211> 38 <212> DNA <213> Artificial sequence <220> <223> Construction primer BssHII-S2 <400> 125 taagcgcgct tattcggaat catcctcatc gaatttac 38 <210> 126 <211> 42 <212> DNA <213> Artificial sequence <220> <223> Construction primer BsmBI-2P-fwd <400> 126 aatcgtctca caccagaggc cgaagtgcag attgatcgcc tg 42 <210> 127 <211> 40 <212> DNA <213> Artificial sequence <220> <223> Construction primer BsmBI-2P-rev <400> 127 atacgtctca ggtgggtcga gccgagacaa gatgtcgttc 40 <210> 128 <211> 22 <212> DNA <213> Artificial sequence <220> <223> Sequencing primer Signal-fwd1 <400> 128 tctggtattg cttcctctgg tg 22 <210> 129 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Sequencing primer SF-fwd2 <400> 129 tgcgcacttg atccattgtc 20 <210> 130 <211> 21 <212> DNA <213> Artificial sequence <220> <223> Sequencing primer S2-fwd3 <400> 130 gtaaagcaca cttcccaaga g 21 <210> 131 <211> 22 <212> DNA <213> Artificial sequence <220> <223> Sequencing primer SF-fwd4 <400> 131 gatcctggac atcactccat gc 22 <210> 132 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Sequencing primer SF-rev1 <400> 132 ttccacttac atggatagcg tgg 23 <210> 133 <211> 24 <212> DNA <213> Artificial sequence <220> <223> Sequencing primer S2-rev1 <400> 133 tactgttatt actataagcg acag 24 <210> 134 <211> 21 <212> DNA <213> Artificial sequence <220> <223> Sequencing primer S2-rev3 <400> 134 gatctctagc ggcgatatct c 21 <210> 135 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Sequencing primer 3433 <400> 135 gaccttggga ggcaatcact 20 <210> 136 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Sequencing primer oligo8a <400> 136 ggaatcgctg tcctcaacaa 20 <210> 137 <211> 24 <212> DNA <213> Artificial sequence <220> <223> Sequencing primer 9119 <400> 137 agatagggct gctagtgaac caat 24 <210> 138 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Sequencing primer 9218 <400> 138 tggaccctac gtttttctta attct 25 <210> 139 <211> 19 <212> DNA <213> Artificial sequence <220> <223> qRT-PCR primer nCoV_IP4-14059Fw <400> 139 ggtaactggt atgatttcg 19 <210> 140 <211> 20 <212> DNA <213> Artificial sequence <220> <223> qRT-PCR primer nCoV_IP4-14146Rv <400> 140 ctggtcaagg ttaatatagg 20 <210> 141 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> qRT-PCR primer nCoV_IP4-14084Probe(+) - [5']Hex [3']BHQ-1 19 <400> 141 tcatacaaac cacgccagg 19 <210> 142 <211> 29 <212> PRT <213> Artificial sequence <220> <223> Cytoplasmic tail from positions 1245 to 1273 of the native S protein of SARS-CoV-2 <400> 142 Lys Gly Cys Cys Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp 1 5 10 15 Ser Glu Pro Val Leu Lys Gly Val Lys Leu His Tyr Thr 20 25 <210> 143 <211> 18 <212> PRT <213> Artificial sequence <220> <223> dER polypeptide <400> 143 Lys Gly Cys Cys Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp 1 5 10 15 Ser Glu <210> 144 <211> 22796 <212> DNA <213> Artificial sequence <220> <223> pTM2-SF-dER_SARS-CoV-2 (optimized sequence) <400> 144 tgtccgctaa tacgactcac tatagggcca actttgtttg gtctgatgag tccgtgagga 60 cgaaacccgg agtcccgggt caccaaacaa agttgggtaa ggatagttca atcaatgatc 120 atcttctagt gcacttagga ttcaagatcc tattatcagg gacaagagca ggattaggga 180 tatccgagat ggccacactt ttaaggagct tagcattgtt caaaagaaac aaggacaaac 240 cacccattac atcaggatcc ggtggagcca tcagaggaat caaacacatt attatagtac 300 caatccctgg agattcctca attaccactc gatccagact tctggaccgg ttggtgaggt 360 taattggaaa cccggatgtg agcgggccca aactaacagg ggcactaata ggtatattat 420 ccttatttgt ggagtctcca ggtcaattga ttcagaggat caccgatgac cctgacgtta 480 gcataaggct gttagaggtt gtccagagtg accagtcaca atctggcctt accttcgcat 540 caagaggtac caacatggag gatgaggcgg accaatactt ttcacatgat gatccaatta 600 gtagtgatca atccaggttc ggatggttcg ggaacaagga aatctcagat attgaagtgc 660 aagaccctga gggattcaac atgattctgg gtaccatcct agcccaaatt tgggtcttgc 720 tcgcaaaggc ggttacggcc ccagacacgg cagctgattc ggagctaaga aggtggataa 780 agtacaccca acaaagaagg gtagttggtg aatttagatt ggagagaaaa tggttggatg 840 tggtgaggaa caggattgcc gaggacctct ccttacgccg attcatggtc gctctaatcc 900 tggatatcaa gagaacaccc ggaaacaaac ccaggattgc tgaaatgata tgtgacattg 960 atacatatat cgtagaggca ggattagcca gttttatcct gactattaag tttgggatag 1020 aaactatgta tcctgctctt ggactgcatg aatttgctgg tgagttatcc acacttgagt 1080 ccttgatgaa cctttaccag caaatggggg aaactgcacc ctacatggta atcctggaga 1140 actcaattca gaacaagttc agtgcaggat cataccctct gctctggagc tatgccatgg 1200 gagtaggagt ggaacttgaa aactccatgg gaggtttgaa ctttggccga tcttactttg 1260 atccagcata ttttagatta gggcaagaga tggtaaggag gtcagctgga aaggtcagtt 1320 ccacattggc atctgaactc ggtatcactg ccgaggatgc aaggcttgtt tcagagattg 1380 caatgcatac tactgaggac aagatcagta gagcggttgg acccagacaa gcccaagtat 1440 catttctaca cggtgatcaa agtgagaatg agctaccgag attggggggc aaggaagata 1500 ggagggtcaa acagagtcga ggagaagcca gggagagcta cagagaaacc gggcccagca 1560 gagcaagtga tgcgagagct gcccatcttc caaccggcac acccctagac attgacactg 1620 caacggagtc cagccaagat ccgcaggaca gtcgaaggtc agctgacgcc ctgcttaggc 1680 tgcaagccat ggcaggaatc tcggaagaac aaggctcaga cacggacacc cctatagtgt 1740 acaatgacag aaatcttcta gactaggtgc gagaggccga gggccagaac aacatccgcc 1800 taccatccat cattgttata aaaaacttag gaaccaggtc cacacagccg ccagcccatc 1860 aaccatccac tcccacgatt ggagccaatg gcagaagagc aggcacgcca tgtcaaaaac 1920 ggactggaat gcatccgggc tctcaaggcc gagcccatcg gctcactggc catcgaggaa 1980 gctatggcag catggtcaga aatatcagac aacccaggac aggagcgagc cacctgcagg 2040 gaagagaagg caggcagttc gggtctcagc aaaccatgcc tctcagcaat tggatcaact 2100 gaaggcggtg cacctcgcat ccgcggtcag ggacctggag agagcgatga cgacgctgaa 2160 actttgggaa tccccccaag aaatctccag gcatcaagca ctgggttaca gtgttattac 2220 gtttatgatc acagcggtga agcggttaag ggaatccaag atgctgactc tatcatggtt 2280 caatcaggcc ttgatggtga tagcaccctc tcaggaggag acaatgaatc tgaaaacagc 2340 gatgtggata ttggcgaacc tgataccgag ggatatgcta tcactgaccg gggatctgct 2400 cccatctcta tggggttcag ggcttctgat gttgaaactg cagaaggagg ggagatccac 2460 gagctcctga gactccaatc cagaggcaac aactttccga agcttgggaa aactctcaat 2520 gttcctccgc ccccggaccc cggtagggcc agcacttccg ggacacccat taaaaagggc 2580 acagacgcga gattagcctc atttggaacg gagatcgcgt ctttattgac aggtggtgca 2640 acccaatgtg ctcgaaagtc accctcggaa ccatcagggc caggtgcacc tgcggggaat 2700 gtccccgagt gtgtgagcaa tgccgcactg atacaggagt ggacacccga atctggtacc 2760 acaatctccc cgagatccca gaataatgaa gaagggggag actattatga tgatgagctg 2820 ttctctgatg tccaagatat taaaacagcc ttggccaaaa tacacgagga taatcagaag 2880 ataatctcca agctagaatc actgctgtta ttgaagggag aagttgagtc aattaagaag 2940 cagatcaaca ggcaaaatat cagcatatcc accctggaag gacacctctc aagcatcatg 3000 atcgccattc ctggacttgg gaaggatccc aacgacccca ctgcagatgt cgaaatcaat 3060 cccgacttga aacccatcat aggcagagat tcaggccgag cactggccga agttctcaag 3120 aaacccgttg ccagccgaca actccaagga atgacaaatg gacggaccag ttccagagga 3180 cagctgctga aggaatttca gctaaagccg atcgggaaaa agatgagctc agccgtcggg 3240 tttgttcctg acaccggccc tgcatcacgc agtgtaatcc gctccattat aaaatccagc 3300 cggctagagg aggatcggaa gcgttacctg atgactctcc ttgatgatat caaaggagcc 3360 aatgatcttg ccaagttcca ccagatgctg atgaagataa taatgaagta gctacagctc 3420 aacttacctg ccaaccccat gccagtcgac ccaactagcc taccctccat cattgttata 3480 aaaaacttag gaaccaggtc cacacagccg ccagcccatc aacgcgtacg gccaccatgt 3540 tcgtctttct ggtattgctt cctctggtga gttcccagtg cgtgaacctg acgactcgga 3600 cacagctgcc gcctgcatac acaaacagct tcacacgagg tgtttactat ccggacaagg 3660 tgttccggtc ctctgtcttg cacagtactc aggacctttt tctgccattc tttagtaacg 3720 taacatggtt ccacgctatc catgtaagtg gaaccaatgg caccaagcgc ttcgacaatc 3780 cagtcctgcc tttcaacgat ggcgtctact tcgcctctac cgagaaatca aatattatta 3840 gagggtggat cttcgggacc acccttgata gcaagactca gagtcttctg atcgtgaaca 3900 atgctactaa cgtcgtcata aaagtatgtg aatttcagtt ctgcaatgac cccttcctgg 3960 gcgtgtacta tcacaaaaat aacaagtcct ggatggaatc cgagtttcgg gtatacagca 4020 gcgctaataa ctgtaccttc gaatatgtga gccagccatt cctgatggac ctggagggga 4080 agcagggcaa cttcaaaaac ctgagggaat tcgtgttcaa gaacattgac ggatacttca 4140 aaatctacag caagcacact ccaattaatc ttgttaggga ccttcctcag gggttctccg 4200 cgctggaacc cttggtggat ctgccaattg gtattaacat cacgaggttt caaaccctgc 4260 tcgccctcca ccggtcatac ctgaccccag gtgatagtag tagtggctgg acagcagggg 4320 ccgcagcata ctacgtcggc tacctccagc cccgcacatt cctgctgaag tataatgaaa 4380 acggtactat tacagatgct gtggactgcg cacttgatcc attgtccgag actaaatgca 4440 ccttgaagtc ttttaccgtt gagaagggaa tctatcagac cagtaatttc agagtgcaac 4500 ccaccgagag catcgtgcga tttcctaata ttacaaacct gtgccctttt ggcgaggtgt 4560 ttaacgccac tcgcttcgcg agcgtgtatg catggaaccg gaaaaggatt agcaactgcg 4620 tggctgatta ttcagtcctt tataatagtg cctctttcag tacgttcaaa tgctatggag 4680 tgtccccaac taagcttaac gatctgtgtt ttaccaacgt gtatgccgac tctttcgtca 4740 tcaggggcga cgaggttaga caaattgcgc ccggacagac aggcaaaatt gctgactaca 4800 attataaact gccagatgac tttacaggat gcgtgattgc ctggaacagc aacaaccttg 4860 attctaaggt gggcggaaac tacaactatc tgtacaggct gttccgcaaa tcaaacctga 4920 agccattcga aagggacatt tcaactgaga tctaccaggc cggatctaca ccttgcaacg 4980 gggtggaagg attcaactgc tacttcccgc tccagtcata tggctttcaa cctaccaatg 5040 gagtgggcta ccaaccttat cgagtagttg ttctctcttt cgagttgttg catgccccag 5100 ccactgtctg cggaccaaag aaatccacca atctggtgaa aaacaagtgc gtcaacttca 5160 acttcaatgg actcaccggt acaggggttc ttaccgagtc aaacaagaaa ttccttccgt 5220 ttcagcagtt tggacgcgat atcgccgaca ctacggatgc agtacgcgat cctcagacac 5280 ttgagatcct ggacatcact ccatgctctt ttggaggggt gtctgtcatc actcccggga 5340 cgaataccag taatcaggtc gccgtgctct atcaagatgt caactgcaca gaggtgccag 5400 tcgccattca cgccgatcag cttaccccta cttggcgagt atatagcaca gggtccaacg 5460 tgtttcagac aagggcgggt tgtctgatcg gcgctgagca cgtcaataat agctacgaat 5520 gtgacatccc tattggagcc gggatttgcg ctagctatca gactcagact aactcacccc 5580 ggcgagctag gtctgtagca agtcagagta tcatagccta tactatgagc ctgggggcag 5640 aaaattctgt cgcttatagt aataacagta ttgcaattcc tactaacttc actattagcg 5700 tgactacaga aattctgcca gtgagcatga ccaagacctc cgtcgactgt accatgtata 5760 tctgcggaga cagcacagaa tgcagcaacc tgcttctgca gtacggtagc ttttgtaccc 5820 agctgaacag ggcactgacc ggcatcgctg tggaacagga caaaaatacg caggaggtgt 5880 tcgctcaggt caagcagatt tataagacac ccccaataaa agacttcggc ggctttaact 5940 tctcccagat cctgcccgat ccgtcaaaac cttccaagag aagttttatc gaggatctgc 6000 tgtttaacaa agtaacattg gctgatgctg gctttattaa acagtacggc gattgtctgg 6060 gagatatcgc cgctagagat ctgatctgcg ctcaaaaatt taatggcctc actgtattgc 6120 cccccctgct gacggatgaa atgattgccc aatacacatc agccctgctg gctgggacaa 6180 tcacttccgg ctggacgttc ggtgctggag ctgctcttca aattccattt gccatgcaaa 6240 tggcttatag attcaacgga attggcgtga cccaaaacgt gctgtacgaa aatcaaaagc 6300 tgattgctaa tcagtttaac tccgctatcg gtaagataca ggacagcctg tctagtactg 6360 ccagcgccct cggaaagctc caggatgtgg tgaaccagaa tgcgcaggcg ctgaacacac 6420 tcgtcaaaca gcttagcagc aatttcggcg caattagcag tgtactgaac gacatcttgt 6480 ctcggctcga caaggtcgag gccgaagtgc agattgatcg cctgatcact ggccggctcc 6540 agtctctgca gacctacgta acccagcaac tcatacgcgc tgccgaaatt cgggcttcag 6600 ctaacctggc cgcaacaaag atgtctgaat gtgttcttgg gcagtccaag agggtggact 6660 tctgcgggaa aggatatcac ctgatgtcct tccctcagag cgcccctcat ggagtggtgt 6720 ttcttcatgt tacctatgtt ccggcccagg aaaagaattt taccactgcc ccagccattt 6780 gccatgatgg taaagcacac ttcccaagag agggcgtgtt tgttagtaac ggcacccact 6840 ggttcgttac ccagcgcaat ttttacgaac ctcaaatcat taccactgac aatacatttg 6900 tatcaggcaa ttgcgacgtg gtgatcggaa tcgtaaataa tacagtctac gatcccctgc 6960 agccagagct tgacagcttt aaagaggaac tggacaaata cttcaaaaat catacaagcc 7020 ccgacgtcga cctgggagat atttctggca tcaatgcctc cgtcgtgaat atccaaaaag 7080 agatcgaccg ccttaatgag gttgccaaaa acctcaacga gtccctgatt gatctgcagg 7140 agctggggaa gtacgagcag tatatcaaat ggccctggta catctggctg ggcttcattg 7200 ccgggctcat agccatcgtg atggtgacga tcatgctgtg ttgcatgacc tcttgctgtt 7260 cttgtctgaa ggggtgctgc tcttgtggga gttgttgtaa attcgatgag gatgattccg 7320 aataataggc gcgcagcgct tagacgtctc gcgatcgata ctagtacaac ctaaatccat 7380 tataaaaaac ttaggagcaa agtgattgcc tcccaaggtc cacaatgaca gagacctacg 7440 acttcgacaa gtcggcatgg gacatcaaag ggtcgatcgc tccgatacaa cccaccacct 7500 acagtgatgg caggctggtg ccccaggtca gagtcataga tcctggtcta ggcgacagga 7560 aggatgaatg ctttatgtac atgtttctgc tgggggttgt tgaggacagc gattccctag 7620 ggcctccaat cgggcgagca tttgggttcc tgcccttagg tgttggcaga tccacagcaa 7680 agcccgaaaa actcctcaaa gaggccactg agcttgacat agttgttaga cgtacagcag 7740 ggctcaatga aaaactggtg ttctacaaca acaccccact aactctcctc acaccttgga 7800 gaaaggtcct aacaacaggg agtgtcttca acgcaaacca agtgtgcaat gcggttaatc 7860 tgataccgct cgataccccg cagaggttcc gtgttgttta tatgagcatc acccgtcttt 7920 cggataacgg gtattacacc gttcctagaa gaatgctgga attcagatcg gtcaatgcag 7980 tggccttcaa cctgctggtg acccttagga ttgacaaggc gataggccct gggaagatca 8040 tcgacaatac agagcaactt cctgaggcaa catttatggt ccacatcggg aacttcagga 8100 gaaagaagag tgaagtctac tctgccgatt attgcaaaat gaaaatcgaa aagatgggcc 8160 tggtttttgc acttggtggg atagggggca ccagtcttca cattagaagc acaggcaaaa 8220 tgagcaagac tctccatgca caactcgggt tcaagaagac cttatgttac ccgctgatgg 8280 atatcaatga agaccttaat cgattactct ggaggagcag atgcaagata gtaagaatcc 8340 aggcagtttt gcagccatca gttcctcaag aattccgcat ttacgacgac gtgatcataa 8400 atgatgacca aggactattc aaagttctgt agaccgtagt gcccagcaat gcccgaaaac 8460 gacccccctc acaatgacag ccagaaggcc cggacaaaaa agccccctcc gaaagactcc 8520 acggaccaag cgagaggcca gccagcagcc gacggcaagc gcgaacacca ggcggcccca 8580 gcacagaaca gccctgacac aaggccacca ccagccaccc caatctgcat cctcctcgtg 8640 ggacccccga ggaccaaccc ccaaggctgc ccccgatcca aaccaccaac cgcatcccca 8700 ccacccccgg gaaagaaacc cccagcaatt ggaaggcccc tccccctctt cctcaacaca 8760 agaactccac aaccgaaccg cacaagcgac cgaggtgacc caaccgcagg catccgactc 8820 cctagacaga tcctctctcc ccggcaaact aaacaaaact tagggccaag gaacatacac 8880 acccaacaga acccagaccc cggcccacgg cgccgcgccc ccaacccccg acaaccagag 8940 ggagccccca accaatcccg ccggctcccc cggtgcccac aggcagggac accaaccccc 9000 gaacagaccc agcacccaac catcgacaat ccaagacggg ggggcccccc caaaaaaagg 9060 cccccagggg ccgacagcca gcaccgcgag gaagcccacc caccccacac acgaccacgg 9120 caaccaaacc agaacccaga ccaccctggg ccaccagctc ccagactcgg ccatcacccc 9180 gcagaaagga aaggccacaa cccgcgcacc ccagccccga tccggcgggg agccacccaa 9240 cccgaaccag cacccaagag cgatccccga aggacccccg aaccgcaaag gacatcagta 9300 tcccacagcc tctccaagtc ccccggtctc ctcctcttct cgaagggacc aaaagatcaa 9360 tccaccacac ccgacgacac tcaactcccc acccctaaag gagacaccgg gaatcccaga 9420 atcaagactc atccaatgtc catcatgggt ctcaaggtga acgtctctgc catattcatg 9480 gcagtactgt taactctcca aacacccacc ggtcaaatcc attggggcaa tctctctaag 9540 ataggggtgg taggaatagg aagtgcaagc tacaaagtta tgactcgttc cagccatcaa 9600 tcattagtca taaaattaat gcccaatata actctcctca ataactgcac gagggtagag 9660 attgcagaat acaggagact actgagaaca gttttggaac caattagaga tgcacttaat 9720 gcaatgaccc agaatataag accggttcag agtgtagctt caagtaggag acacaagaga 9780 tttgcgggag tagtcctggc aggtgcggcc ctaggcgttg ccacagctgc tcagataaca 9840 gccggcattg cacttcacca gtccatgctg aactctcaag ccatcgacaa tctgagagcg 9900 agcctggaaa ctactaatca ggcaattgag acaatcagac aagcagggca ggagatgata 9960 ttggctgttc agggtgtcca agactacatc aataatgagc tgataccgtc tatgaaccaa 10020 ctatcttgtg atttaatcgg ccagaagctc gggctcaaat tgctcagata ctatacagaa 10080 atcctgtcat tatttggccc cagtttacgg gaccccatat ctgcggagat atctatccag 10140 gctttgagct atgcgcttgg aggagacatc aataaggtgt tagaaaagct cggatacagt 10200 ggaggtgatt tactgggcat cttagagagc ggaggaataa aggcccggat aactcacgtc 10260 gacacagagt cctacttcat tgtcctcagt atagcctatc cgacgctgtc cgagattaag 10320 ggggtgattg tccaccggct agagggggtc tcgtacaaca taggctctca agagtggtat 10380 accactgtgc ccaagtatgt tgcaacccaa gggtacctta tctcgaattt tgatgagtca 10440 tcgtgtactt tcatgccaga ggggactgtg tgcagccaaa atgccttgta cccgatgagt 10500 cctctgctcc aagaatgcct ccgggggtac accaagtcct gtgctcgtac actcgtatcc 10560 gggtcttttg ggaaccggtt cattttatca caagggaacc taatagccaa ttgtgcatca 10620 atcctttgca agtgttacac aacaggaacg atcattaatc aagaccctga caagatccta 10680 acatacattg ctgccgatca ctgcccggta gtcgaggtga acggcgtgac catccaagtc 10740 gggagcagga ggtatccaga cgctgtgtac ttgcacagaa ttgacctcgg tcctcccata 10800 tcattggaga ggttggacgt agggacaaat ctggggaatg caattgctaa gttggaggat 10860 gccaaggaat tgttggagtc atcggaccag atattgagga gtatgaaagg tttatcgagc 10920 actagcatag tctacatcct gattgcagtg tgtcttggag ggttgatagg gatccccgct 10980 ttaatatgtt gctgcagggg gcgttgtaac aaaaagggag aacaagttgg tatgtcaaga 11040 ccaggcctaa agcctgatct tacgggaaca tcaaaatcct atgtaaggtc gctctgatcc 11100 tctacaactc ttgaaacaca aatgtcccac aagtctcctc ttcgtcatca agcaaccacc 11160 gcacccagca tcaagcccac ctgaaattat ctccggcttc cctctggccg aacaatatcg 11220 gtagttaatc aaaacttagg gtgcaagatc atccacaatg tcaccacaac gagaccggat 11280 aaatgccttc tacaaagata acccccatcc caagggaagt aggatagtca ttaacagaga 11340 acatcttatg attgatagac cttatgtttt gctggctgtt ctgtttgtca tgtttctgag 11400 cttgatcggg ttgctagcca ttgcaggcat tagacttcat cgggcagcca tctacaccgc 11460 agagatccat aaaagcctca gcaccaatct agatgtaact aactcaatcg agcatcaggt 11520 caaggacgtg ctgacaccac tcttcaaaat catcggtgat gaagtgggcc tgaggacacc 11580 tcagagattc actgacctag tgaaattaat ctctgacaag attaaattcc ttaatccgga 11640 tagggagtac gacttcagag atctcacttg gtgtatcaac ccgccagaga gaatcaaatt 11700 ggattatgat caatactgtg cagatgtggc tgctgaagag ctcatgaatg cattggtgaa 11760 ctcaactcta ctggagacca gaacaaccaa tcagttccta gctgtctcaa agggaaactg 11820 ctcagggccc actacaatca gaggtcaatt ctcaaacatg tcgctgtccc tgttagactt 11880 gtatttaggt cgaggttaca atgtgtcatc tatagtcact atgacatccc agggaatgta 11940 tgggggaact tacctagtgg aaaagcctaa tctgagcagc aaaaggtcag agttgtcaca 12000 actgagcatg taccgagtgt ttgaagtagg tgttatcaga aatccgggtt tgggggctcc 12060 ggtgttccat atgacaaact atcttgagca accagtcagt aatgatctca gcaactgtat 12120 ggtggctttg ggggagctca aactcgcagc cctttgtcac ggggaagatt ctatcacaat 12180 tccctatcag ggatcaggga aaggtgtcag cttccagctc gtcaagctag gtgtctggaa 12240 atccccaacc gacatgcaat cctgggtccc cttatcaacg gatgatccag tgatagacag 12300 gctttacctc tcatctcaca gaggtgttat cgctgacaat caagcaaaat gggctgtccc 12360 gacaacacga acagatgaca agttgcgaat ggagacatgc ttccaacagg cgtgtaaggg 12420 taaaatccaa gcactctgcg agaatcccga gtgggcacca ttgaaggata acaggattcc 12480 ttcatacggg gtcttgtctg ttgatctgag tctgacagtt gagcttaaaa tcaaaattgc 12540 ttcgggattc gggccattga tcacacacgg ttcagggatg gacctataca aatccaacca 12600 caacaatgtg tattggctga ctatcccgcc aatgaagaac ctagccttag gtgtaatcaa 12660 cacattggag tggataccga gattcaaggt tagtccctac ctcttcactg tcccaattaa 12720 ggaagcaggc gaagactgcc atgccccaac atacctacct gcggaggtgg atggtgatgt 12780 caaactcagt tccaatctgg tgattctacc tggtcaagat ctccaatatg ttttggcaac 12840 ctacgatact tccagggttg aacatgctgt ggtttattac gtttacagcc caagccgctc 12900 attttcttac ttttatcctt ttaggttgcc tataaagggg gtccccatcg aattacaagt 12960 ggaatgcttc acatgggacc aaaaactctg gtgccgtcac ttctgtgtgc ttgcggactc 13020 agaatctggt ggacatatca ctcactctgg gatggtgggc atgggagtca gctgcacagt 13080 cacccgggaa gatggaacca atcgcagata gggctgctag tgaaccaatc acatgatgtc 13140 acccagacat caggcatacc cactagtgtg aaatagacat cagaattaag aaaaacgtag 13200 ggtccaagtg gttccccgtt atggactcgc tatctgtcaa ccagatctta taccctgaag 13260 ttcacctaga tagcccgata gttaccaata agatagtagc catcctggag tatgctcgag 13320 tccctcacgc ttacagcctg gaggacccta cactgtgtca gaacatcaag caccgcctaa 13380 aaaacggatt ttccaaccaa atgattataa acaatgtgga agttgggaat gtcatcaagt 13440 ccaagcttag gagttatccg gcccactctc atattccata tccaaattgt aatcaggatt 13500 tatttaacat agaagacaaa gagtcaacga ggaagatccg tgaactcctc aaaaagggga 13560 attcgctgta ctccaaagtc agtgataagg ttttccaatg cttaagggac actaactcac 13620 ggcttggcct aggctccgaa ttgagggagg acatcaagga gaaagttatt aacttgggag 13680 tttacatgca cagctcccag tggtttgagc cctttctgtt ttggtttaca gtcaagactg 13740 agatgaggtc agtgattaaa tcacaaaccc atacttgcca taggaggaga cacacacctg 13800 tattcttcac tggtagttca gttgagttgc taatctctcg tgaccttgtt gctataatca 13860 gtaaagagtc tcaacatgta tattacctga catttgaact ggttttgatg tattgtgatg 13920 tcatagaggg gaggttaatg acagagaccg ctatgactat tgatgctagg tatacagagc 13980 ttctaggaag agtcagatac atgtggaaac tgatagatgg tttcttccct gcactcggga 14040 atccaactta tcaaattgta gccatgctgg agcctctttc acttgcttac ctgcagctga 14100 gggatataac agtagaactc agaggtgctt tccttaacca ctgctttact gaaatacatg 14160 atgttcttga ccaaaacggg ttttctgatg aaggtactta tcatgagtta actgaagctc 14220 tagattacat tttcataact gatgacatac atctgacagg ggagattttc tcatttttca 14280 gaagtttcgg ccaccccaga cttgaagcag taacggctgc tgaaaatgtt aggaaataca 14340 tgaatcagcc taaagtcatt gtgtatgaga ctctgatgaa aggtcatgcc atattttgtg 14400 gaatcataat caacggctat cgtgacaggc acggaggcag ttggccaccg ctgaccctcc 14460 ccctgcatgc tgcagacaca atccggaatg ctcaagcttc aggtgaaggg ttaacacatg 14520 agcagtgcgt tgataactgg aaatcttttg ctggagtgaa atttggctgc tttatgcctc 14580 ttagcctgga tagtgatctg acaatgtacc taaaggacaa ggcacttgct gctctccaaa 14640 gggaatggga ttcagtttac ccgaaagagt tcctgcgtta cgaccctccc aagggaaccg 14700 ggtcacggag gcttgtagat gttttcctta atgattcgag ctttgaccca tatgatgtga 14760 taatgtatgt tgtaagtgga gcttacctcc atgaccctga gttcaacctg tcttacagcc 14820 tgaaagaaaa ggagatcaag gaaacaggta gactttttgc taaaatgact tacaaaatga 14880 gggcatgcca agtgattgct gaaaatctaa tctcaaacgg gattggcaaa tattttaagg 14940 acaatgggat ggccaaggat gagcacgatt tgactaaggc actccacact ctagctgtct 15000 caggagtccc caaagatctc aaagaaagtc acaggggggg gccagtctta aaaacctact 15060 cccgaagccc agtccacaca agtaccagga acgtgagagc agcaaaaggg tttatagggt 15120 tccctcaagt aattcggcag gaccaagaca ctgatcatcc ggagaatatg gaagcttacg 15180 agacagtcag tgcatttatc acgactgatc tcaagaagta ctgccttaat tggagatatg 15240 agaccatcag cttgtttgca cagaggctaa atgagattta cggattgccc tcatttttcc 15300 agtggctgca taagaggctt gagacctctg tcctgtatgt aagtgaccct cattgccccc 15360 ccgaccttga cgcccatatc ccgttatata aagtccccaa tgatcaaatc ttcattaagt 15420 accctatggg aggtatagaa gggtattgtc agaagctgtg gaccatcagc accattccct 15480 atctatacct ggctgcttat gagagcggag taaggattgc ttcgttagtg caaggggaca 15540 atcagaccat agccgtaaca aaaagggtac ccagcacatg gccctacaac cttaagaaac 15600 gggaagctgc tagagtaact agagattact ttgtaattct taggcaaagg ctacatgata 15660 ttggccatca cctcaaggca aatgagacaa ttgtttcatc acattttttt gtctattcaa 15720 aaggaatata ttatgatggg ctacttgtgt cccaatcact caagagcatc gcaagatgtg 15780 tattctggtc agagactata gttgatgaaa caagggcagc atgcagtaat attgctacaa 15840 caatggctaa aagcatcgag agaggttatg accgttacct tgcatattcc ctgaacgtcc 15900 taaaagtgat acagcaaatt ctgatctctc ttggcttcac aatcaattca accatgaccc 15960 gggatgtagt catacccctc ctcacaaaca acgacctctt aataaggatg gcactgttgc 16020 ccgctcctat tggggggatg aattatctga atatgagcag gctgtttgtc agaaacatcg 16080 gtgatccagt aacatcatca attgctgatc tcaagagaat gattctcgcc tcactaatgc 16140 ctgaagagac cctccatcaa gtaatgacac aacaaccggg ggactcttca ttcctagact 16200 gggctagcga cccttactca gcaaatcttg tatgtgtcca gagcatcact agactcctca 16260 agaacataac tgcaaggttt gtcctgatcc atagtccaaa cccaatgtta aaaggattat 16320 tccatgatga cagtaaagaa gaggacgagg gactggcggc attcctcatg gacaggcata 16380 ttatagtacc tagggcagct catgaaatcc tggatcatag tgtcacaggg gcaagagagt 16440 ctattgcagg catgctggat accacaaaag gcttgattcg agccagcatg aggaaggggg 16500 ggttaacctc tcgagtgata accagattgt ccaattatga ctatgaacaa ttcagagcag 16560 ggatggtgct attgacagga agaaagagaa atgtcctcat tgacaaagag tcatgttcag 16620 tgcagctggc gagagctcta agaagccata tgtgggcgag gctagctcga ggacggccta 16680 tttacggcct tgaggtccct gatgtactag aatctatgcg aggccacctt attcggcgtc 16740 atgagacatg tgtcatctgc gagtgtggat cagtcaacta cggatggttt tttgtcccct 16800 cgggttgcca actggatgat attgacaagg aaacatcatc cttgagagtc ccatatattg 16860 gttctaccac tgatgagaga acagacatga agcttgcctt cgtaagagcc ccaagtcgat 16920 ccttgcgatc tgctgttaga atagcaacag tgtactcatg ggcttacggt gatgatgata 16980 gctcttggaa cgaagcctgg ttgttggcta ggcaaagggc caatgtgagc ctggaggagc 17040 taagggtgat cactcccatc tcaacttcga ctaatttagc gcataggttg agggatcgta 17100 gcactcaagt gaaatactca ggtacatccc ttgtccgagt ggcgaggtat accacaatct 17160 ccaacgacaa tctctcattt gtcatatcag ataagaaggt tgatactaac tttatatacc 17220 aacaaggaat gcttctaggg ttgggtgttt tagaaacatt gtttcgactc gagaaagata 17280 ccggatcatc taacacggta ttacatcttc acgtcgaaac agattgttgc gtgatcccga 17340 tgatagatca tcccaggata cccagctccc gcaagctaga gctgagggca gagctatgta 17400 ccaacccatt gatatatgat aatgcacctt taattgacag agatgcaaca aggctataca 17460 cccagagcca taggaggcac cttgtggaat ttgttacatg gtccacaccc caactatatc 17520 acattttagc taagtccaca gcactatcta tgattgacct ggtaacaaaa tttgagaagg 17580 accatatgaa tgaaatttca gctctcatag gggatgacga tatcaatagt ttcataactg 17640 agtttctgct catagagcca agattattca ctatctactt gggccagtgt gcggccatca 17700 attgggcatt tgatgtacat tatcatagac catcagggaa atatcagatg ggtgagctgt 17760 tgtcatcgtt cctttctaga atgagcaaag gagtgtttaa ggtgcttgtc aatgctctaa 17820 gccacccaaa gatctacaag aaattctggc attgtggtat tatagagcct atccatggtc 17880 cttcacttga tgctcaaaac ttgcacacaa ctgtgtgcaa catggtttac acatgctata 17940 tgacctacct cgacctgttg ttgaatgaag agttagaaga gttcacattt ctcttgtgtg 18000 aaagcgacga ggatgtagta ccggacagat tcgacaacat ccaggcaaaa cacttatgtg 18060 ttctggcaga tttgtactgt caaccaggga cctgcccacc aattcgaggt ctaagaccgg 18120 tagagaaatg tgcagttcta accgaccata tcaaggcaga ggctatgtta tctccagcag 18180 gatcttcgtg gaacataaat ccaattattg tagaccatta ctcatgctct ctgacttatc 18240 tccggcgagg atcgatcaaa cagataagat tgagagttga tccaggattc attttcgacg 18300 ccctcgctga ggtaaatgtc agtcagccaa agatcggcag caacaacatc tcaaatatga 18360 gcatcaaggc tttcagaccc ccacacgatg atgttgcaaa attgctcaaa gatatcaaca 18420 caagcaagca caatcttccc atttcagggg gcaatctcgc caattatgaa atccatgctt 18480 tccgcagaat cgggttgaac tcatctgctt gctacaaagc tgttgagata tcaacattaa 18540 ttaggagatg ccttgagcca ggggaggacg gcttgttctt gggtgaggga tcgggttcta 18600 tgttgatcac ttataaagag atacttaaac taaacaagtg cttctataat agtggggttt 18660 ccgccaattc tagatctggt caaagggaat tagcacccta tccctccgaa gttggccttg 18720 tcgaacacag aatgggagta ggtaatattg tcaaagtgct ctttaacggg aggcccgaag 18780 tcacgtgggt aggcagtgta gattgcttca atttcatagt tagtaatatc cctacctcta 18840 gtgtggggtt tatccattca gatatagaga ccttgcctga caaagatact atagagaagc 18900 tagaggaatt ggcagccatc ttatcgatgg ctctgctcct gggcaaaata ggatcaatac 18960 tggtgattaa gcttatgcct ttcagcgggg attttgttca gggatttata agttatgtag 19020 ggtctcatta tagagaagtg aaccttgtat accctagata cagcaacttc atctctactg 19080 aatcttattt ggttatgaca gatctcaagg ctaaccggct aatgaatcct gaaaagatta 19140 agcagcagat aattgaatca tctgtgagga cttcacctgg acttataggt cacatcctat 19200 ccattaagca actaagctgc atacaagcaa ttgtgggaga cgcagttagt agaggtgata 19260 tcaatcctac tctgaaaaaa cttacaccta tagagcaggt gctgatcaat tgcgggttgg 19320 caattaacgg acctaagctg tgcaaagaat tgatccacca tgatgttgcc tcagggcaag 19380 atggattgct taattctata ctcatcctct acagggagtt ggcaagattc aaagacaacc 19440 aaagaagtca acaagggatg ttccacgctt accccgtatt ggtaagtagc aggcaacgag 19500 aacttatatc taggatcacc cgcaaattct gggggcacat tcttctttac tccgggaaca 19560 aaaagttgat aaataagttt atccagaatc tcaagtccgg ctatctgata ctagacttac 19620 accagaatat cttcgttaag aatctatcca agtcagagaa acagattatt atgacggggg 19680 gtttgaaacg tgagtgggtt tttaaggtaa cagtcaagga gaccaaagaa tggtataagt 19740 tagtcggata cagtgccctg attaaggact aattggttga actccggaac cctaatcctg 19800 ccctaggtgg ttaggcatta tttgcaatat attaaagaaa actttgaaaa tacgaagttt 19860 ctattcccag ctttgtctgg tggccggcat ggtcccagcc tcctcgctgg cgccggctgg 19920 gcaacattcc gaggggaccg tcccctcggt aatggcgaat gggacgcggc cgatccggct 19980 gctaacaaag cccgaaagga agctgagttg gctgctgcca ccgctgagca ataactagca 20040 taaccccttg gggcctctaa acgggtcttg aggggttttt tgctgaaagg aggaactata 20100 tccggatgcg gccgcgggcc ctatggtacc cagcttttgt tccctttagt gagggttaat 20160 tccgagcttg gcgtaatcat ggtcatagct gtttcctgtg tgaaattgtt atccgctcac 20220 aattccacac aacataggag ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt 20280 gaggtaactc acattaattg cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc 20340 gtgccagctg cattaatgaa tcggccaacg cgcggggaga ggcggtttgc gtattgggcg 20400 ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt 20460 atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa 20520 gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc 20580 gtttttccat aggctcggcc cccctgacga gcatcacaaa aatcgacgct caagtcagag 20640 gtggcgaaac ccgacaggac tataaagata ccaggcgttc ccccctggaa gctccctcgt 20700 gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg 20760 aagcgtggcg ctttctcaat gctcacgctg taggtatctc agttcggtgt aggtcgttcg 20820 ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg 20880 taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac 20940 tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg 21000 gcctaactac ggctacacta gaaggacagt atttggtatc tgcgctctgc tgaagccagt 21060 taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg 21120 tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc 21180 tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt 21240 ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt 21300 taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag 21360 tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct gactgcccgt 21420 cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg caatgatacc 21480 gcgagaccca cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc 21540 cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg 21600 ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccattgctac 21660 aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg 21720 atcaaggcga gttacatgat cccccatgtt gtgaaaaaaa gcggttagct ccttcggtcc 21780 tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatgctta tggcagcact 21840 gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc 21900 aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat 21960 acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc 22020 ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac 22080 tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa 22140 aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact 22200 catactcttc ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg 22260 atacatattt gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg 22320 aaaagtgcca cctgaaattg taaacgttaa tattttgtta aaattcgcgt taaatttttg 22380 ttaaatcagc tcatttttta accaataggc cgaaatcggc aaaatccctt ataaatcaaa 22440 agaatagacc gagatagggt tgagtgttgt tccagtttgg aacaagagtc cactattaaa 22500 gaacgtggac tccaacgtca aagggcgaaa aaccgtctat cagggcgatg gcccactacg 22560 tgaaccatca ccctaatcaa gttttttggg gtcgaggtgc cgtaaagcac taaatcggaa 22620 ccctaaaggg agcccccgat ttagagcttg acggggaaag ccggcgaacg tggcgagaaa 22680 ggaagggaag aaagcgaaag gagcgggcgc tagggcgctg gcaagtgtag cggtcacgct 22740 gcgcgtaacc accacacccg ccgcgcttaa tgcgccgcta cagggcgcgt cccatt 22796 <210> 145 <211> 20780 <212> DNA <213> Artificial sequence <220> <223> pTM2-S2-dER_SARS-CoV-2 (optimized sequence) <400> 145 tgtccgctaa tacgactcac tatagggcca actttgtttg gtctgatgag tccgtgagga 60 cgaaacccgg agtcccgggt caccaaacaa agttgggtaa ggatagttca atcaatgatc 120 atcttctagt gcacttagga ttcaagatcc tattatcagg gacaagagca ggattaggga 180 tatccgagat ggccacactt ttaaggagct tagcattgtt caaaagaaac aaggacaaac 240 cacccattac atcaggatcc ggtggagcca tcagaggaat caaacacatt attatagtac 300 caatccctgg agattcctca attaccactc gatccagact tctggaccgg ttggtgaggt 360 taattggaaa cccggatgtg agcgggccca aactaacagg ggcactaata ggtatattat 420 ccttatttgt ggagtctcca ggtcaattga ttcagaggat caccgatgac cctgacgtta 480 gcataaggct gttagaggtt gtccagagtg accagtcaca atctggcctt accttcgcat 540 caagaggtac caacatggag gatgaggcgg accaatactt ttcacatgat gatccaatta 600 gtagtgatca atccaggttc ggatggttcg ggaacaagga aatctcagat attgaagtgc 660 aagaccctga gggattcaac atgattctgg gtaccatcct agcccaaatt tgggtcttgc 720 tcgcaaaggc ggttacggcc ccagacacgg cagctgattc ggagctaaga aggtggataa 780 agtacaccca acaaagaagg gtagttggtg aatttagatt ggagagaaaa tggttggatg 840 tggtgaggaa caggattgcc gaggacctct ccttacgccg attcatggtc gctctaatcc 900 tggatatcaa gagaacaccc ggaaacaaac ccaggattgc tgaaatgata tgtgacattg 960 atacatatat cgtagaggca ggattagcca gttttatcct gactattaag tttgggatag 1020 aaactatgta tcctgctctt ggactgcatg aatttgctgg tgagttatcc acacttgagt 1080 ccttgatgaa cctttaccag caaatggggg aaactgcacc ctacatggta atcctggaga 1140 actcaattca gaacaagttc agtgcaggat cataccctct gctctggagc tatgccatgg 1200 gagtaggagt ggaacttgaa aactccatgg gaggtttgaa ctttggccga tcttactttg 1260 atccagcata ttttagatta gggcaagaga tggtaaggag gtcagctgga aaggtcagtt 1320 ccacattggc atctgaactc ggtatcactg ccgaggatgc aaggcttgtt tcagagattg 1380 caatgcatac tactgaggac aagatcagta gagcggttgg acccagacaa gcccaagtat 1440 catttctaca cggtgatcaa agtgagaatg agctaccgag attggggggc aaggaagata 1500 ggagggtcaa acagagtcga ggagaagcca gggagagcta cagagaaacc gggcccagca 1560 gagcaagtga tgcgagagct gcccatcttc caaccggcac acccctagac attgacactg 1620 caacggagtc cagccaagat ccgcaggaca gtcgaaggtc agctgacgcc ctgcttaggc 1680 tgcaagccat ggcaggaatc tcggaagaac aaggctcaga cacggacacc cctatagtgt 1740 acaatgacag aaatcttcta gactaggtgc gagaggccga gggccagaac aacatccgcc 1800 taccatccat cattgttata aaaaacttag gaaccaggtc cacacagccg ccagcccatc 1860 aaccatccac tcccacgatt ggagccaatg gcagaagagc aggcacgcca tgtcaaaaac 1920 ggactggaat gcatccgggc tctcaaggcc gagcccatcg gctcactggc catcgaggaa 1980 gctatggcag catggtcaga aatatcagac aacccaggac aggagcgagc cacctgcagg 2040 gaagagaagg caggcagttc gggtctcagc aaaccatgcc tctcagcaat tggatcaact 2100 gaaggcggtg cacctcgcat ccgcggtcag ggacctggag agagcgatga cgacgctgaa 2160 actttgggaa tccccccaag aaatctccag gcatcaagca ctgggttaca gtgttattac 2220 gtttatgatc acagcggtga agcggttaag ggaatccaag atgctgactc tatcatggtt 2280 caatcaggcc ttgatggtga tagcaccctc tcaggaggag acaatgaatc tgaaaacagc 2340 gatgtggata ttggcgaacc tgataccgag ggatatgcta tcactgaccg gggatctgct 2400 cccatctcta tggggttcag ggcttctgat gttgaaactg cagaaggagg ggagatccac 2460 gagctcctga gactccaatc cagaggcaac aactttccga agcttgggaa aactctcaat 2520 gttcctccgc ccccggaccc cggtagggcc agcacttccg ggacacccat taaaaagggc 2580 acagacgcga gattagcctc atttggaacg gagatcgcgt ctttattgac aggtggtgca 2640 acccaatgtg ctcgaaagtc accctcggaa ccatcagggc caggtgcacc tgcggggaat 2700 gtccccgagt gtgtgagcaa tgccgcactg atacaggagt ggacacccga atctggtacc 2760 acaatctccc cgagatccca gaataatgaa gaagggggag actattatga tgatgagctg 2820 ttctctgatg tccaagatat taaaacagcc ttggccaaaa tacacgagga taatcagaag 2880 ataatctcca agctagaatc actgctgtta ttgaagggag aagttgagtc aattaagaag 2940 cagatcaaca ggcaaaatat cagcatatcc accctggaag gacacctctc aagcatcatg 3000 atcgccattc ctggacttgg gaaggatccc aacgacccca ctgcagatgt cgaaatcaat 3060 cccgacttga aacccatcat aggcagagat tcaggccgag cactggccga agttctcaag 3120 aaacccgttg ccagccgaca actccaagga atgacaaatg gacggaccag ttccagagga 3180 cagctgctga aggaatttca gctaaagccg atcgggaaaa agatgagctc agccgtcggg 3240 tttgttcctg acaccggccc tgcatcacgc agtgtaatcc gctccattat aaaatccagc 3300 cggctagagg aggatcggaa gcgttacctg atgactctcc ttgatgatat caaaggagcc 3360 aatgatcttg ccaagttcca ccagatgctg atgaagataa taatgaagta gctacagctc 3420 aacttacctg ccaaccccat gccagtcgac ccaactagcc taccctccat cattgttata 3480 aaaaacttag gaaccaggtc cacacagccg ccagcccatc aacgcgtacg gccaccatgt 3540 tcgtctttct ggtattgctt cctctggtga gttcccagtg cgtagcaagt cagagtatca 3600 tagcctatac tatgagcctg ggggcagaaa attctgtcgc ttatagtaat aacagtattg 3660 caattcctac taacttcact attagcgtga ctacagaaat tctgccagtg agcatgacca 3720 agacctccgt cgactgtacc atgtatatct gcggagacag cacagaatgc agcaacctgc 3780 ttctgcagta cggtagcttt tgtacccagc tgaacagggc actgaccggc atcgctgtgg 3840 aacaggacaa aaatacgcag gaggtgttcg ctcaggtcaa gcagatttat aagacacccc 3900 caataaaaga cttcggcggc tttaacttct cccagatcct gcccgatccg tcaaaacctt 3960 ccaagagaag ttttatcgag gatctgctgt ttaacaaagt aacattggct gatgctggct 4020 ttattaaaca gtacggcgat tgtctgggag atatcgccgc tagagatctg atctgcgctc 4080 aaaaatttaa tggcctcact gtattgcccc ccctgctgac ggatgaaatg attgcccaat 4140 acacatcagc cctgctggct gggacaatca cttccggctg gacgttcggt gctggagctg 4200 ctcttcaaat tccatttgcc atgcaaatgg cttatagatt caacggaatt ggcgtgaccc 4260 aaaacgtgct gtacgaaaat caaaagctga ttgctaatca gtttaactcc gctatcggta 4320 agatacagga cagcctgtct agtactgcca gcgccctcgg aaagctccag gatgtggtga 4380 accagaatgc gcaggcgctg aacacactcg tcaaacagct tagcagcaat ttcggcgcaa 4440 ttagcagtgt actgaacgac atcttgtctc ggctcgacaa ggtcgaggcc gaagtgcaga 4500 ttgatcgcct gatcactggc cggctccagt ctctgcagac ctacgtaacc cagcaactca 4560 tacgcgctgc cgaaattcgg gcttcagcta acctggccgc aacaaagatg tctgaatgtg 4620 ttcttgggca gtccaagagg gtggacttct gcgggaaagg atatcacctg atgtccttcc 4680 ctcagagcgc ccctcatgga gtggtgtttc ttcatgttac ctatgttccg gcccaggaaa 4740 agaattttac cactgcccca gccatttgcc atgatggtaa agcacacttc ccaagagagg 4800 gcgtgtttgt tagtaacggc acccactggt tcgttaccca gcgcaatttt tacgaacctc 4860 aaatcattac cactgacaat acatttgtat caggcaattg cgacgtggtg atcggaatcg 4920 taaataatac agtctacgat cccctgcagc cagagcttga cagctttaaa gaggaactgg 4980 acaaatactt caaaaatcat acaagccccg acgtcgacct gggagatatt tctggcatca 5040 atgcctccgt cgtgaatatc caaaaagaga tcgaccgcct taatgaggtt gccaaaaacc 5100 tcaacgagtc cctgattgat ctgcaggagc tggggaagta cgagcagtat atcaaatggc 5160 cctggtacat ctggctgggc ttcattgccg ggctcatagc catcgtgatg gtgacgatca 5220 tgctgtgttg catgacctct tgctgttctt gtctgaaggg gtgctgctct tgtgggagtt 5280 gttgtaaatt cgatgaggat gattccgaat aagcgcgcag cgcttagacg tctcgcgatc 5340 gatactagta caacctaaat ccattataaa aaacttagga gcaaagtgat tgcctcccaa 5400 ggtccacaat gacagagacc tacgacttcg acaagtcggc atgggacatc aaagggtcga 5460 tcgctccgat acaacccacc acctacagtg atggcaggct ggtgccccag gtcagagtca 5520 tagatcctgg tctaggcgac aggaaggatg aatgctttat gtacatgttt ctgctggggg 5580 ttgttgagga cagcgattcc ctagggcctc caatcgggcg agcatttggg ttcctgccct 5640 taggtgttgg cagatccaca gcaaagcccg aaaaactcct caaagaggcc actgagcttg 5700 acatagttgt tagacgtaca gcagggctca atgaaaaact ggtgttctac aacaacaccc 5760 cactaactct cctcacacct tggagaaagg tcctaacaac agggagtgtc ttcaacgcaa 5820 accaagtgtg caatgcggtt aatctgatac cgctcgatac cccgcagagg ttccgtgttg 5880 tttatatgag catcacccgt ctttcggata acgggtatta caccgttcct agaagaatgc 5940 tggaattcag atcggtcaat gcagtggcct tcaacctgct ggtgaccctt aggattgaca 6000 aggcgatagg ccctgggaag atcatcgaca atacagagca acttcctgag gcaacattta 6060 tggtccacat cgggaacttc aggagaaaga agagtgaagt ctactctgcc gattattgca 6120 aaatgaaaat cgaaaagatg ggcctggttt ttgcacttgg tgggataggg ggcaccagtc 6180 ttcacattag aagcacaggc aaaatgagca agactctcca tgcacaactc gggttcaaga 6240 agaccttatg ttacccgctg atggatatca atgaagacct taatcgatta ctctggagga 6300 gcagatgcaa gatagtaaga atccaggcag ttttgcagcc atcagttcct caagaattcc 6360 gcatttacga cgacgtgatc ataaatgatg accaaggact attcaaagtt ctgtagaccg 6420 tagtgcccag caatgcccga aaacgacccc cctcacaatg acagccagaa ggcccggaca 6480 aaaaagcccc ctccgaaaga ctccacggac caagcgagag gccagccagc agccgacggc 6540 aagcgcgaac accaggcggc cccagcacag aacagccctg acacaaggcc accaccagcc 6600 accccaatct gcatcctcct cgtgggaccc ccgaggacca acccccaagg ctgcccccga 6660 tccaaaccac caaccgcatc cccaccaccc ccgggaaaga aacccccagc aattggaagg 6720 cccctccccc tcttcctcaa cacaagaact ccacaaccga accgcacaag cgaccgaggt 6780 gacccaaccg caggcatccg actccctaga cagatcctct ctccccggca aactaaacaa 6840 aacttagggc caaggaacat acacacccaa cagaacccag accccggccc acggcgccgc 6900 gcccccaacc cccgacaacc agagggagcc cccaaccaat cccgccggct cccccggtgc 6960 ccacaggcag ggacaccaac ccccgaacag acccagcacc caaccatcga caatccaaga 7020 cgggggggcc cccccaaaaa aaggccccca ggggccgaca gccagcaccg cgaggaagcc 7080 cacccacccc acacacgacc acggcaacca aaccagaacc cagaccaccc tgggccacca 7140 gctcccagac tcggccatca ccccgcagaa aggaaaggcc acaacccgcg caccccagcc 7200 ccgatccggc ggggagccac ccaacccgaa ccagcaccca agagcgatcc ccgaaggacc 7260 cccgaaccgc aaaggacatc agtatcccac agcctctcca agtcccccgg tctcctcctc 7320 ttctcgaagg gaccaaaaga tcaatccacc acacccgacg acactcaact ccccacccct 7380 aaaggagaca ccgggaatcc cagaatcaag actcatccaa tgtccatcat gggtctcaag 7440 gtgaacgtct ctgccatatt catggcagta ctgttaactc tccaaacacc caccggtcaa 7500 atccattggg gcaatctctc taagataggg gtggtaggaa taggaagtgc aagctacaaa 7560 gttatgactc gttccagcca tcaatcatta gtcataaaat taatgcccaa tataactctc 7620 ctcaataact gcacgagggt agagattgca gaatacagga gactactgag aacagttttg 7680 gaaccaatta gagatgcact taatgcaatg acccagaata taagaccggt tcagagtgta 7740 gcttcaagta ggagacacaa gagatttgcg ggagtagtcc tggcaggtgc ggccctaggc 7800 gttgccacag ctgctcagat aacagccggc attgcacttc accagtccat gctgaactct 7860 caagccatcg acaatctgag agcgagcctg gaaactacta atcaggcaat tgagacaatc 7920 agacaagcag ggcaggagat gatattggct gttcagggtg tccaagacta catcaataat 7980 gagctgatac cgtctatgaa ccaactatct tgtgatttaa tcggccagaa gctcgggctc 8040 aaattgctca gatactatac agaaatcctg tcattatttg gccccagttt acgggacccc 8100 atatctgcgg agatatctat ccaggctttg agctatgcgc ttggaggaga catcaataag 8160 gtgttagaaa agctcggata cagtggaggt gatttactgg gcatcttaga gagcggagga 8220 ataaaggccc ggataactca cgtcgacaca gagtcctact tcattgtcct cagtatagcc 8280 tatccgacgc tgtccgagat taagggggtg attgtccacc ggctagaggg ggtctcgtac 8340 aacataggct ctcaagagtg gtataccact gtgcccaagt atgttgcaac ccaagggtac 8400 cttatctcga attttgatga gtcatcgtgt actttcatgc cagaggggac tgtgtgcagc 8460 caaaatgcct tgtacccgat gagtcctctg ctccaagaat gcctccgggg gtacaccaag 8520 tcctgtgctc gtacactcgt atccgggtct tttgggaacc ggttcatttt atcacaaggg 8580 aacctaatag ccaattgtgc atcaatcctt tgcaagtgtt acacaacagg aacgatcatt 8640 aatcaagacc ctgacaagat cctaacatac attgctgccg atcactgccc ggtagtcgag 8700 gtgaacggcg tgaccatcca agtcgggagc aggaggtatc cagacgctgt gtacttgcac 8760 agaattgacc tcggtcctcc catatcattg gagaggttgg acgtagggac aaatctgggg 8820 aatgcaattg ctaagttgga ggatgccaag gaattgttgg agtcatcgga ccagatattg 8880 aggagtatga aaggtttatc gagcactagc atagtctaca tcctgattgc agtgtgtctt 8940 ggagggttga tagggatccc cgctttaata tgttgctgca gggggcgttg taacaaaaag 9000 ggagaacaag ttggtatgtc aagaccaggc ctaaagcctg atcttacggg aacatcaaaa 9060 tcctatgtaa ggtcgctctg atcctctaca actcttgaaa cacaaatgtc ccacaagtct 9120 cctcttcgtc atcaagcaac caccgcaccc agcatcaagc ccacctgaaa ttatctccgg 9180 cttccctctg gccgaacaat atcggtagtt aatcaaaact tagggtgcaa gatcatccac 9240 aatgtcacca caacgagacc ggataaatgc cttctacaaa gataaccccc atcccaaggg 9300 aagtaggata gtcattaaca gagaacatct tatgattgat agaccttatg ttttgctggc 9360 tgttctgttt gtcatgtttc tgagcttgat cgggttgcta gccattgcag gcattagact 9420 tcatcgggca gccatctaca ccgcagagat ccataaaagc ctcagcacca atctagatgt 9480 aactaactca atcgagcatc aggtcaagga cgtgctgaca ccactcttca aaatcatcgg 9540 tgatgaagtg ggcctgagga cacctcagag attcactgac ctagtgaaat taatctctga 9600 caagattaaa ttccttaatc cggataggga gtacgacttc agagatctca cttggtgtat 9660 caacccgcca gagagaatca aattggatta tgatcaatac tgtgcagatg tggctgctga 9720 agagctcatg aatgcattgg tgaactcaac tctactggag accagaacaa ccaatcagtt 9780 cctagctgtc tcaaagggaa actgctcagg gcccactaca atcagaggtc aattctcaaa 9840 catgtcgctg tccctgttag acttgtattt aggtcgaggt tacaatgtgt catctatagt 9900 cactatgaca tcccagggaa tgtatggggg aacttaccta gtggaaaagc ctaatctgag 9960 cagcaaaagg tcagagttgt cacaactgag catgtaccga gtgtttgaag taggtgttat 10020 cagaaatccg ggtttggggg ctccggtgtt ccatatgaca aactatcttg agcaaccagt 10080 cagtaatgat ctcagcaact gtatggtggc tttgggggag ctcaaactcg cagccctttg 10140 tcacggggaa gattctatca caattcccta tcagggatca gggaaaggtg tcagcttcca 10200 gctcgtcaag ctaggtgtct ggaaatcccc aaccgacatg caatcctggg tccccttatc 10260 aacggatgat ccagtgatag acaggcttta cctctcatct cacagaggtg ttatcgctga 10320 caatcaagca aaatgggctg tcccgacaac acgaacagat gacaagttgc gaatggagac 10380 atgcttccaa caggcgtgta agggtaaaat ccaagcactc tgcgagaatc ccgagtgggc 10440 accattgaag gataacagga ttccttcata cggggtcttg tctgttgatc tgagtctgac 10500 agttgagctt aaaatcaaaa ttgcttcggg attcgggcca ttgatcacac acggttcagg 10560 gatggaccta tacaaatcca accacaacaa tgtgtattgg ctgactatcc cgccaatgaa 10620 gaacctagcc ttaggtgtaa tcaacacatt ggagtggata ccgagattca aggttagtcc 10680 ctacctcttc actgtcccaa ttaaggaagc aggcgaagac tgccatgccc caacatacct 10740 acctgcggag gtggatggtg atgtcaaact cagttccaat ctggtgattc tacctggtca 10800 agatctccaa tatgttttgg caacctacga tacttccagg gttgaacatg ctgtggttta 10860 ttacgtttac agcccaagcc gctcattttc ttacttttat ccttttaggt tgcctataaa 10920 gggggtcccc atcgaattac aagtggaatg cttcacatgg gaccaaaaac tctggtgccg 10980 tcacttctgt gtgcttgcgg actcagaatc tggtggacat atcactcact ctgggatggt 11040 gggcatggga gtcagctgca cagtcacccg ggaagatgga accaatcgca gatagggctg 11100 ctagtgaacc aatcacatga tgtcacccag acatcaggca tacccactag tgtgaaatag 11160 acatcagaat taagaaaaac gtagggtcca agtggttccc cgttatggac tcgctatctg 11220 tcaaccagat cttataccct gaagttcacc tagatagccc gatagttacc aataagatag 11280 tagccatcct ggagtatgct cgagtccctc acgcttacag cctggaggac cctacactgt 11340 gtcagaacat caagcaccgc ctaaaaaacg gattttccaa ccaaatgatt ataaacaatg 11400 tggaagttgg gaatgtcatc aagtccaagc ttaggagtta tccggcccac tctcatattc 11460 catatccaaa ttgtaatcag gatttattta acatagaaga caaagagtca acgaggaaga 11520 tccgtgaact cctcaaaaag gggaattcgc tgtactccaa agtcagtgat aaggttttcc 11580 aatgcttaag ggacactaac tcacggcttg gcctaggctc cgaattgagg gaggacatca 11640 aggagaaagt tattaacttg ggagtttaca tgcacagctc ccagtggttt gagccctttc 11700 tgttttggtt tacagtcaag actgagatga ggtcagtgat taaatcacaa acccatactt 11760 gccataggag gagacacaca cctgtattct tcactggtag ttcagttgag ttgctaatct 11820 ctcgtgacct tgttgctata atcagtaaag agtctcaaca tgtatattac ctgacatttg 11880 aactggtttt gatgtattgt gatgtcatag aggggaggtt aatgacagag accgctatga 11940 ctattgatgc taggtataca gagcttctag gaagagtcag atacatgtgg aaactgatag 12000 atggtttctt ccctgcactc gggaatccaa cttatcaaat tgtagccatg ctggagcctc 12060 tttcacttgc ttacctgcag ctgagggata taacagtaga actcagaggt gctttcctta 12120 accactgctt tactgaaata catgatgttc ttgaccaaaa cgggttttct gatgaaggta 12180 cttatcatga gttaactgaa gctctagatt acattttcat aactgatgac atacatctga 12240 caggggagat tttctcattt ttcagaagtt tcggccaccc cagacttgaa gcagtaacgg 12300 ctgctgaaaa tgttaggaaa tacatgaatc agcctaaagt cattgtgtat gagactctga 12360 tgaaaggtca tgccatattt tgtggaatca taatcaacgg ctatcgtgac aggcacggag 12420 gcagttggcc accgctgacc ctccccctgc atgctgcaga cacaatccgg aatgctcaag 12480 cttcaggtga agggttaaca catgagcagt gcgttgataa ctggaaatct tttgctggag 12540 tgaaatttgg ctgctttatg cctcttagcc tggatagtga tctgacaatg tacctaaagg 12600 acaaggcact tgctgctctc caaagggaat gggattcagt ttacccgaaa gagttcctgc 12660 gttacgaccc tcccaaggga accgggtcac ggaggcttgt agatgttttc cttaatgatt 12720 cgagctttga cccatatgat gtgataatgt atgttgtaag tggagcttac ctccatgacc 12780 ctgagttcaa cctgtcttac agcctgaaag aaaaggagat caaggaaaca ggtagacttt 12840 ttgctaaaat gacttacaaa atgagggcat gccaagtgat tgctgaaaat ctaatctcaa 12900 acgggattgg caaatatttt aaggacaatg ggatggccaa ggatgagcac gatttgacta 12960 aggcactcca cactctagct gtctcaggag tccccaaaga tctcaaagaa agtcacaggg 13020 gggggccagt cttaaaaacc tactcccgaa gcccagtcca cacaagtacc aggaacgtga 13080 gagcagcaaa agggtttata gggttccctc aagtaattcg gcaggaccaa gacactgatc 13140 atccggagaa tatggaagct tacgagacag tcagtgcatt tatcacgact gatctcaaga 13200 agtactgcct taattggaga tatgagacca tcagcttgtt tgcacagagg ctaaatgaga 13260 tttacggatt gccctcattt ttccagtggc tgcataagag gcttgagacc tctgtcctgt 13320 atgtaagtga ccctcattgc ccccccgacc ttgacgccca tatcccgtta tataaagtcc 13380 ccaatgatca aatcttcatt aagtacccta tgggaggtat agaagggtat tgtcagaagc 13440 tgtggaccat cagcaccatt ccctatctat acctggctgc ttatgagagc ggagtaagga 13500 ttgcttcgtt agtgcaaggg gacaatcaga ccatagccgt aacaaaaagg gtacccagca 13560 catggcccta caaccttaag aaacgggaag ctgctagagt aactagagat tactttgtaa 13620 ttcttaggca aaggctacat gatattggcc atcacctcaa ggcaaatgag acaattgttt 13680 catcacattt ttttgtctat tcaaaaggaa tatattatga tgggctactt gtgtcccaat 13740 cactcaagag catcgcaaga tgtgtattct ggtcagagac tatagttgat gaaacaaggg 13800 cagcatgcag taatattgct acaacaatgg ctaaaagcat cgagagaggt tatgaccgtt 13860 accttgcata ttccctgaac gtcctaaaag tgatacagca aattctgatc tctcttggct 13920 tcacaatcaa ttcaaccatg acccgggatg tagtcatacc cctcctcaca aacaacgacc 13980 tcttaataag gatggcactg ttgcccgctc ctattggggg gatgaattat ctgaatatga 14040 gcaggctgtt tgtcagaaac atcggtgatc cagtaacatc atcaattgct gatctcaaga 14100 gaatgattct cgcctcacta atgcctgaag agaccctcca tcaagtaatg acacaacaac 14160 cgggggactc ttcattccta gactgggcta gcgaccctta ctcagcaaat cttgtatgtg 14220 tccagagcat cactagactc ctcaagaaca taactgcaag gtttgtcctg atccatagtc 14280 caaacccaat gttaaaagga ttattccatg atgacagtaa agaagaggac gagggactgg 14340 cggcattcct catggacagg catattatag tacctagggc agctcatgaa atcctggatc 14400 atagtgtcac aggggcaaga gagtctattg caggcatgct ggataccaca aaaggcttga 14460 ttcgagccag catgaggaag ggggggttaa cctctcgagt gataaccaga ttgtccaatt 14520 atgactatga acaattcaga gcagggatgg tgctattgac aggaagaaag agaaatgtcc 14580 tcattgacaa agagtcatgt tcagtgcagc tggcgagagc tctaagaagc catatgtggg 14640 cgaggctagc tcgaggacgg cctatttacg gccttgaggt ccctgatgta ctagaatcta 14700 tgcgaggcca ccttattcgg cgtcatgaga catgtgtcat ctgcgagtgt ggatcagtca 14760 actacggatg gttttttgtc ccctcgggtt gccaactgga tgatattgac aaggaaacat 14820 catccttgag agtcccatat attggttcta ccactgatga gagaacagac atgaagcttg 14880 ccttcgtaag agccccaagt cgatccttgc gatctgctgt tagaatagca acagtgtact 14940 catgggctta cggtgatgat gatagctctt ggaacgaagc ctggttgttg gctaggcaaa 15000 gggccaatgt gagcctggag gagctaaggg tgatcactcc catctcaact tcgactaatt 15060 tagcgcatag gttgagggat cgtagcactc aagtgaaata ctcaggtaca tcccttgtcc 15120 gagtggcgag gtataccaca atctccaacg acaatctctc atttgtcata tcagataaga 15180 aggttgatac taactttata taccaacaag gaatgcttct agggttgggt gttttagaaa 15240 cattgtttcg actcgagaaa gataccggat catctaacac ggtattacat cttcacgtcg 15300 aaacagattg ttgcgtgatc ccgatgatag atcatcccag gatacccagc tcccgcaagc 15360 tagagctgag ggcagagcta tgtaccaacc cattgatata tgataatgca cctttaattg 15420 acagagatgc aacaaggcta tacacccaga gccataggag gcaccttgtg gaatttgtta 15480 catggtccac accccaacta tatcacattt tagctaagtc cacagcacta tctatgattg 15540 acctggtaac aaaatttgag aaggaccata tgaatgaaat ttcagctctc ataggggatg 15600 acgatatcaa tagtttcata actgagtttc tgctcataga gccaagatta ttcactatct 15660 acttgggcca gtgtgcggcc atcaattggg catttgatgt acattatcat agaccatcag 15720 ggaaatatca gatgggtgag ctgttgtcat cgttcctttc tagaatgagc aaaggagtgt 15780 ttaaggtgct tgtcaatgct ctaagccacc caaagatcta caagaaattc tggcattgtg 15840 gtattataga gcctatccat ggtccttcac ttgatgctca aaacttgcac acaactgtgt 15900 gcaacatggt ttacacatgc tatatgacct acctcgacct gttgttgaat gaagagttag 15960 aagagttcac atttctcttg tgtgaaagcg acgaggatgt agtaccggac agattcgaca 16020 acatccaggc aaaacactta tgtgttctgg cagatttgta ctgtcaacca gggacctgcc 16080 caccaattcg aggtctaaga ccggtagaga aatgtgcagt tctaaccgac catatcaagg 16140 cagaggctat gttatctcca gcaggatctt cgtggaacat aaatccaatt attgtagacc 16200 attactcatg ctctctgact tatctccggc gaggatcgat caaacagata agattgagag 16260 ttgatccagg attcattttc gacgccctcg ctgaggtaaa tgtcagtcag ccaaagatcg 16320 gcagcaacaa catctcaaat atgagcatca aggctttcag acccccacac gatgatgttg 16380 caaaattgct caaagatatc aacacaagca agcacaatct tcccatttca gggggcaatc 16440 tcgccaatta tgaaatccat gctttccgca gaatcgggtt gaactcatct gcttgctaca 16500 aagctgttga gatatcaaca ttaattagga gatgccttga gccaggggag gacggcttgt 16560 tcttgggtga gggatcgggt tctatgttga tcacttataa agagatactt aaactaaaca 16620 agtgcttcta taatagtggg gtttccgcca attctagatc tggtcaaagg gaattagcac 16680 cctatccctc cgaagttggc cttgtcgaac acagaatggg agtaggtaat attgtcaaag 16740 tgctctttaa cgggaggccc gaagtcacgt gggtaggcag tgtagattgc ttcaatttca 16800 tagttagtaa tatccctacc tctagtgtgg ggtttatcca ttcagatata gagaccttgc 16860 ctgacaaaga tactatagag aagctagagg aattggcagc catcttatcg atggctctgc 16920 tcctgggcaa aataggatca atactggtga ttaagcttat gcctttcagc ggggattttg 16980 ttcagggatt tataagttat gtagggtctc attatagaga agtgaacctt gtatacccta 17040 gatacagcaa cttcatctct actgaatctt atttggttat gacagatctc aaggctaacc 17100 ggctaatgaa tcctgaaaag attaagcagc agataattga atcatctgtg aggacttcac 17160 ctggacttat aggtcacatc ctatccatta agcaactaag ctgcatacaa gcaattgtgg 17220 gagacgcagt tagtagaggt gatatcaatc ctactctgaa aaaacttaca cctatagagc 17280 aggtgctgat caattgcggg ttggcaatta acggacctaa gctgtgcaaa gaattgatcc 17340 accatgatgt tgcctcaggg caagatggat tgcttaattc tatactcatc ctctacaggg 17400 agttggcaag attcaaagac aaccaaagaa gtcaacaagg gatgttccac gcttaccccg 17460 tattggtaag tagcaggcaa cgagaactta tatctaggat cacccgcaaa ttctgggggc 17520 acattcttct ttactccggg aacaaaaagt tgataaataa gtttatccag aatctcaagt 17580 ccggctatct gatactagac ttacaccaga atatcttcgt taagaatcta tccaagtcag 17640 agaaacagat tattatgacg gggggtttga aacgtgagtg ggtttttaag gtaacagtca 17700 aggagaccaa agaatggtat aagttagtcg gatacagtgc cctgattaag gactaattgg 17760 ttgaactccg gaaccctaat cctgccctag gtggttaggc attatttgca atatattaaa 17820 gaaaactttg aaaatacgaa gtttctattc ccagctttgt ctggtggccg gcatggtccc 17880 agcctcctcg ctggcgccgg ctgggcaaca ttccgagggg accgtcccct cggtaatggc 17940 gaatgggacg cggccgatcc ggctgctaac aaagcccgaa aggaagctga gttggctgct 18000 gccaccgctg agcaataact agcataaccc cttggggcct ctaaacgggt cttgaggggt 18060 tttttgctga aaggaggaac tatatccgga tgcggccgcg ggccctatgg tacccagctt 18120 ttgttccctt tagtgagggt taattccgag cttggcgtaa tcatggtcat agctgtttcc 18180 tgtgtgaaat tgttatccgc tcacaattcc acacaacata ggagccggaa gcataaagtg 18240 taaagcctgg ggtgcctaat gagtgaggta actcacatta attgcgttgc gctcactgcc 18300 cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg 18360 gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc 18420 ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac 18480 agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa 18540 ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc ggcccccctg acgagcatca 18600 caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc 18660 gttcccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata 18720 cctgtccgcc tttctccctt cgggaagcgt ggcgctttct caatgctcac gctgtaggta 18780 tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca 18840 gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga 18900 cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg 18960 tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagga cagtatttgg 19020 tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg 19080 caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag 19140 aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa 19200 cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat 19260 ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt aaacttggtc 19320 tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc 19380 atccatagtt gcctgactgc ccgtcgtgta gataactacg atacgggagg gcttaccatc 19440 tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag atttatcagc 19500 aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc 19560 catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt 19620 gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc 19680 ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca tgttgtgaaa 19740 aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt 19800 atcactcatg cttatggcag cactgcataa ttctcttact gtcatgccat ccgtaagatg 19860 cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta tgcggcgacc 19920 gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca gaactttaaa 19980 agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct taccgctgtt 20040 gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat cttttacttt 20100 caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa agggaataag 20160 ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt gaagcattta 20220 tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa ataaacaaat 20280 aggggttccg cgcacatttc cccgaaaagt gccacctgaa attgtaaacg ttaatatttt 20340 gttaaaattc gcgttaaatt tttgttaaat cagctcattt tttaaccaat aggccgaaat 20400 cggcaaaatc ccttataaat caaaagaata gaccgagata gggttgagtg ttgttccagt 20460 ttggaacaag agtccactat taaagaacgt ggactccaac gtcaaagggc gaaaaaccgt 20520 ctatcagggc gatggcccac tacgtgaacc atcaccctaa tcaagttttt tggggtcgag 20580 gtgccgtaaa gcactaaatc ggaaccctaa agggagcccc cgatttagag cttgacgggg 20640 aaagccggcg aacgtggcga gaaaggaagg gaagaaagcg aaaggagcgg gcgctagggc 20700 gctggcaagt gtagcggtca cgctgcgcgt aaccaccaca cccgccgcgc ttaatgcgcc 20760 gctacagggc gcgtcccatt 20780 <210> 146 <211> 22796 <212> DNA <213> Artificial sequence <220> <223> pTM2-SF-2P-dER_SARS-CoV-2 (optimized sequence) <400> 146 tgtccgctaa tacgactcac tatagggcca actttgtttg gtctgatgag tccgtgagga 60 cgaaacccgg agtcccgggt caccaaacaa agttgggtaa ggatagttca atcaatgatc 120 atcttctagt gcacttagga ttcaagatcc tattatcagg gacaagagca ggattaggga 180 tatccgagat ggccacactt ttaaggagct tagcattgtt caaaagaaac aaggacaaac 240 cacccattac atcaggatcc ggtggagcca tcagaggaat caaacacatt attatagtac 300 caatccctgg agattcctca attaccactc gatccagact tctggaccgg ttggtgaggt 360 taattggaaa cccggatgtg agcgggccca aactaacagg ggcactaata ggtatattat 420 ccttatttgt ggagtctcca ggtcaattga ttcagaggat caccgatgac cctgacgtta 480 gcataaggct gttagaggtt gtccagagtg accagtcaca atctggcctt accttcgcat 540 caagaggtac caacatggag gatgaggcgg accaatactt ttcacatgat gatccaatta 600 gtagtgatca atccaggttc ggatggttcg ggaacaagga aatctcagat attgaagtgc 660 aagaccctga gggattcaac atgattctgg gtaccatcct agcccaaatt tgggtcttgc 720 tcgcaaaggc ggttacggcc ccagacacgg cagctgattc ggagctaaga aggtggataa 780 agtacaccca acaaagaagg gtagttggtg aatttagatt ggagagaaaa tggttggatg 840 tggtgaggaa caggattgcc gaggacctct ccttacgccg attcatggtc gctctaatcc 900 tggatatcaa gagaacaccc ggaaacaaac ccaggattgc tgaaatgata tgtgacattg 960 atacatatat cgtagaggca ggattagcca gttttatcct gactattaag tttgggatag 1020 aaactatgta tcctgctctt ggactgcatg aatttgctgg tgagttatcc acacttgagt 1080 ccttgatgaa cctttaccag caaatggggg aaactgcacc ctacatggta atcctggaga 1140 actcaattca gaacaagttc agtgcaggat cataccctct gctctggagc tatgccatgg 1200 gagtaggagt ggaacttgaa aactccatgg gaggtttgaa ctttggccga tcttactttg 1260 atccagcata ttttagatta gggcaagaga tggtaaggag gtcagctgga aaggtcagtt 1320 ccacattggc atctgaactc ggtatcactg ccgaggatgc aaggcttgtt tcagagattg 1380 caatgcatac tactgaggac aagatcagta gagcggttgg acccagacaa gcccaagtat 1440 catttctaca cggtgatcaa agtgagaatg agctaccgag attggggggc aaggaagata 1500 ggagggtcaa acagagtcga ggagaagcca gggagagcta cagagaaacc gggcccagca 1560 gagcaagtga tgcgagagct gcccatcttc caaccggcac acccctagac attgacactg 1620 caacggagtc cagccaagat ccgcaggaca gtcgaaggtc agctgacgcc ctgcttaggc 1680 tgcaagccat ggcaggaatc tcggaagaac aaggctcaga cacggacacc cctatagtgt 1740 acaatgacag aaatcttcta gactaggtgc gagaggccga gggccagaac aacatccgcc 1800 taccatccat cattgttata aaaaacttag gaaccaggtc cacacagccg ccagcccatc 1860 aaccatccac tcccacgatt ggagccaatg gcagaagagc aggcacgcca tgtcaaaaac 1920 ggactggaat gcatccgggc tctcaaggcc gagcccatcg gctcactggc catcgaggaa 1980 gctatggcag catggtcaga aatatcagac aacccaggac aggagcgagc cacctgcagg 2040 gaagagaagg caggcagttc gggtctcagc aaaccatgcc tctcagcaat tggatcaact 2100 gaaggcggtg cacctcgcat ccgcggtcag ggacctggag agagcgatga cgacgctgaa 2160 actttgggaa tccccccaag aaatctccag gcatcaagca ctgggttaca gtgttattac 2220 gtttatgatc acagcggtga agcggttaag ggaatccaag atgctgactc tatcatggtt 2280 caatcaggcc ttgatggtga tagcaccctc tcaggaggag acaatgaatc tgaaaacagc 2340 gatgtggata ttggcgaacc tgataccgag ggatatgcta tcactgaccg gggatctgct 2400 cccatctcta tggggttcag ggcttctgat gttgaaactg cagaaggagg ggagatccac 2460 gagctcctga gactccaatc cagaggcaac aactttccga agcttgggaa aactctcaat 2520 gttcctccgc ccccggaccc cggtagggcc agcacttccg ggacacccat taaaaagggc 2580 acagacgcga gattagcctc atttggaacg gagatcgcgt ctttattgac aggtggtgca 2640 acccaatgtg ctcgaaagtc accctcggaa ccatcagggc caggtgcacc tgcggggaat 2700 gtccccgagt gtgtgagcaa tgccgcactg atacaggagt ggacacccga atctggtacc 2760 acaatctccc cgagatccca gaataatgaa gaagggggag actattatga tgatgagctg 2820 ttctctgatg tccaagatat taaaacagcc ttggccaaaa tacacgagga taatcagaag 2880 ataatctcca agctagaatc actgctgtta ttgaagggag aagttgagtc aattaagaag 2940 cagatcaaca ggcaaaatat cagcatatcc accctggaag gacacctctc aagcatcatg 3000 atcgccattc ctggacttgg gaaggatccc aacgacccca ctgcagatgt cgaaatcaat 3060 cccgacttga aacccatcat aggcagagat tcaggccgag cactggccga agttctcaag 3120 aaacccgttg ccagccgaca actccaagga atgacaaatg gacggaccag ttccagagga 3180 cagctgctga aggaatttca gctaaagccg atcgggaaaa agatgagctc agccgtcggg 3240 tttgttcctg acaccggccc tgcatcacgc agtgtaatcc gctccattat aaaatccagc 3300 cggctagagg aggatcggaa gcgttacctg atgactctcc ttgatgatat caaaggagcc 3360 aatgatcttg ccaagttcca ccagatgctg atgaagataa taatgaagta gctacagctc 3420 aacttacctg ccaaccccat gccagtcgac ccaactagcc taccctccat cattgttata 3480 aaaaacttag gaaccaggtc cacacagccg ccagcccatc aacgcgtacg gccaccatgt 3540 tcgtctttct ggtattgctt cctctggtga gttcccagtg cgtgaacctg acgactcgga 3600 cacagctgcc gcctgcatac acaaacagct tcacacgagg tgtttactat ccggacaagg 3660 tgttccggtc ctctgtcttg cacagtactc aggacctttt tctgccattc tttagtaacg 3720 taacatggtt ccacgctatc catgtaagtg gaaccaatgg caccaagcgc ttcgacaatc 3780 cagtcctgcc tttcaacgat ggcgtctact tcgcctctac cgagaaatca aatattatta 3840 gagggtggat cttcgggacc acccttgata gcaagactca gagtcttctg atcgtgaaca 3900 atgctactaa cgtcgtcata aaagtatgtg aatttcagtt ctgcaatgac cccttcctgg 3960 gcgtgtacta tcacaaaaat aacaagtcct ggatggaatc cgagtttcgg gtatacagca 4020 gcgctaataa ctgtaccttc gaatatgtga gccagccatt cctgatggac ctggagggga 4080 agcagggcaa cttcaaaaac ctgagggaat tcgtgttcaa gaacattgac ggatacttca 4140 aaatctacag caagcacact ccaattaatc ttgttaggga ccttcctcag gggttctccg 4200 cgctggaacc cttggtggat ctgccaattg gtattaacat cacgaggttt caaaccctgc 4260 tcgccctcca ccggtcatac ctgaccccag gtgatagtag tagtggctgg acagcagggg 4320 ccgcagcata ctacgtcggc tacctccagc cccgcacatt cctgctgaag tataatgaaa 4380 acggtactat tacagatgct gtggactgcg cacttgatcc attgtccgag actaaatgca 4440 ccttgaagtc ttttaccgtt gagaagggaa tctatcagac cagtaatttc agagtgcaac 4500 ccaccgagag catcgtgcga tttcctaata ttacaaacct gtgccctttt ggcgaggtgt 4560 ttaacgccac tcgcttcgcg agcgtgtatg catggaaccg gaaaaggatt agcaactgcg 4620 tggctgatta ttcagtcctt tataatagtg cctctttcag tacgttcaaa tgctatggag 4680 tgtccccaac taagcttaac gatctgtgtt ttaccaacgt gtatgccgac tctttcgtca 4740 tcaggggcga cgaggttaga caaattgcgc ccggacagac aggcaaaatt gctgactaca 4800 attataaact gccagatgac tttacaggat gcgtgattgc ctggaacagc aacaaccttg 4860 attctaaggt gggcggaaac tacaactatc tgtacaggct gttccgcaaa tcaaacctga 4920 agccattcga aagggacatt tcaactgaga tctaccaggc cggatctaca ccttgcaacg 4980 gggtggaagg attcaactgc tacttcccgc tccagtcata tggctttcaa cctaccaatg 5040 gagtgggcta ccaaccttat cgagtagttg ttctctcttt cgagttgttg catgccccag 5100 ccactgtctg cggaccaaag aaatccacca atctggtgaa aaacaagtgc gtcaacttca 5160 acttcaatgg actcaccggt acaggggttc ttaccgagtc aaacaagaaa ttccttccgt 5220 ttcagcagtt tggacgcgat atcgccgaca ctacggatgc agtacgcgat cctcagacac 5280 ttgagatcct ggacatcact ccatgctctt ttggaggggt gtctgtcatc actcccggga 5340 cgaataccag taatcaggtc gccgtgctct atcaagatgt caactgcaca gaggtgccag 5400 tcgccattca cgccgatcag cttaccccta cttggcgagt atatagcaca gggtccaacg 5460 tgtttcagac aagggcgggt tgtctgatcg gcgctgagca cgtcaataat agctacgaat 5520 gtgacatccc tattggagcc gggatttgcg ctagctatca gactcagact aactcacccc 5580 ggcgagctag gtctgtagca agtcagagta tcatagccta tactatgagc ctgggggcag 5640 aaaattctgt cgcttatagt aataacagta ttgcaattcc tactaacttc actattagcg 5700 tgactacaga aattctgcca gtgagcatga ccaagacctc cgtcgactgt accatgtata 5760 tctgcggaga cagcacagaa tgcagcaacc tgcttctgca gtacggtagc ttttgtaccc 5820 agctgaacag ggcactgacc ggcatcgctg tggaacagga caaaaatacg caggaggtgt 5880 tcgctcaggt caagcagatt tataagacac ccccaataaa agacttcggc ggctttaact 5940 tctcccagat cctgcccgat ccgtcaaaac cttccaagag aagttttatc gaggatctgc 6000 tgtttaacaa agtaacattg gctgatgctg gctttattaa acagtacggc gattgtctgg 6060 gagatatcgc cgctagagat ctgatctgcg ctcaaaaatt taatggcctc actgtattgc 6120 cccccctgct gacggatgaa atgattgccc aatacacatc agccctgctg gctgggacaa 6180 tcacttccgg ctggacgttc ggtgctggag ctgctcttca aattccattt gccatgcaaa 6240 tggcttatag attcaacgga attggcgtga cccaaaacgt gctgtacgaa aatcaaaagc 6300 tgattgctaa tcagtttaac tccgctatcg gtaagataca ggacagcctg tctagtactg 6360 ccagcgccct cggaaagctc caggatgtgg tgaaccagaa tgcgcaggcg ctgaacacac 6420 tcgtcaaaca gcttagcagc aatttcggcg caattagcag tgtactgaac gacatcttgt 6480 ctcggctcga cccaccagag gccgaagtgc agattgatcg cctgatcact ggccggctcc 6540 agtctctgca gacctacgta acccagcaac tcatacgcgc tgccgaaatt cgggcttcag 6600 ctaacctggc cgcaacaaag atgtctgaat gtgttcttgg gcagtccaag agggtggact 6660 tctgcgggaa aggatatcac ctgatgtcct tccctcagag cgcccctcat ggagtggtgt 6720 ttcttcatgt tacctatgtt ccggcccagg aaaagaattt taccactgcc ccagccattt 6780 gccatgatgg taaagcacac ttcccaagag agggcgtgtt tgttagtaac ggcacccact 6840 ggttcgttac ccagcgcaat ttttacgaac ctcaaatcat taccactgac aatacatttg 6900 tatcaggcaa ttgcgacgtg gtgatcggaa tcgtaaataa tacagtctac gatcccctgc 6960 agccagagct tgacagcttt aaagaggaac tggacaaata cttcaaaaat catacaagcc 7020 ccgacgtcga cctgggagat atttctggca tcaatgcctc cgtcgtgaat atccaaaaag 7080 agatcgaccg ccttaatgag gttgccaaaa acctcaacga gtccctgatt gatctgcagg 7140 agctggggaa gtacgagcag tatatcaaat ggccctggta catctggctg ggcttcattg 7200 ccgggctcat agccatcgtg atggtgacga tcatgctgtg ttgcatgacc tcttgctgtt 7260 cttgtctgaa ggggtgctgc tcttgtggga gttgttgtaa attcgatgag gatgattccg 7320 aataataggc gcgcagcgct tagacgtctc gcgatcgata ctagtacaac ctaaatccat 7380 tataaaaaac ttaggagcaa agtgattgcc tcccaaggtc cacaatgaca gagacctacg 7440 acttcgacaa gtcggcatgg gacatcaaag ggtcgatcgc tccgatacaa cccaccacct 7500 acagtgatgg caggctggtg ccccaggtca gagtcataga tcctggtcta ggcgacagga 7560 aggatgaatg ctttatgtac atgtttctgc tgggggttgt tgaggacagc gattccctag 7620 ggcctccaat cgggcgagca tttgggttcc tgcccttagg tgttggcaga tccacagcaa 7680 agcccgaaaa actcctcaaa gaggccactg agcttgacat agttgttaga cgtacagcag 7740 ggctcaatga aaaactggtg ttctacaaca acaccccact aactctcctc acaccttgga 7800 gaaaggtcct aacaacaggg agtgtcttca acgcaaacca agtgtgcaat gcggttaatc 7860 tgataccgct cgataccccg cagaggttcc gtgttgttta tatgagcatc acccgtcttt 7920 cggataacgg gtattacacc gttcctagaa gaatgctgga attcagatcg gtcaatgcag 7980 tggccttcaa cctgctggtg acccttagga ttgacaaggc gataggccct gggaagatca 8040 tcgacaatac agagcaactt cctgaggcaa catttatggt ccacatcggg aacttcagga 8100 gaaagaagag tgaagtctac tctgccgatt attgcaaaat gaaaatcgaa aagatgggcc 8160 tggtttttgc acttggtggg atagggggca ccagtcttca cattagaagc acaggcaaaa 8220 tgagcaagac tctccatgca caactcgggt tcaagaagac cttatgttac ccgctgatgg 8280 atatcaatga agaccttaat cgattactct ggaggagcag atgcaagata gtaagaatcc 8340 aggcagtttt gcagccatca gttcctcaag aattccgcat ttacgacgac gtgatcataa 8400 atgatgacca aggactattc aaagttctgt agaccgtagt gcccagcaat gcccgaaaac 8460 gacccccctc acaatgacag ccagaaggcc cggacaaaaa agccccctcc gaaagactcc 8520 acggaccaag cgagaggcca gccagcagcc gacggcaagc gcgaacacca ggcggcccca 8580 gcacagaaca gccctgacac aaggccacca ccagccaccc caatctgcat cctcctcgtg 8640 ggacccccga ggaccaaccc ccaaggctgc ccccgatcca aaccaccaac cgcatcccca 8700 ccacccccgg gaaagaaacc cccagcaatt ggaaggcccc tccccctctt cctcaacaca 8760 agaactccac aaccgaaccg cacaagcgac cgaggtgacc caaccgcagg catccgactc 8820 cctagacaga tcctctctcc ccggcaaact aaacaaaact tagggccaag gaacatacac 8880 acccaacaga acccagaccc cggcccacgg cgccgcgccc ccaacccccg acaaccagag 8940 ggagccccca accaatcccg ccggctcccc cggtgcccac aggcagggac accaaccccc 9000 gaacagaccc agcacccaac catcgacaat ccaagacggg ggggcccccc caaaaaaagg 9060 cccccagggg ccgacagcca gcaccgcgag gaagcccacc caccccacac acgaccacgg 9120 caaccaaacc agaacccaga ccaccctggg ccaccagctc ccagactcgg ccatcacccc 9180 gcagaaagga aaggccacaa cccgcgcacc ccagccccga tccggcgggg agccacccaa 9240 cccgaaccag cacccaagag cgatccccga aggacccccg aaccgcaaag gacatcagta 9300 tcccacagcc tctccaagtc ccccggtctc ctcctcttct cgaagggacc aaaagatcaa 9360 tccaccacac ccgacgacac tcaactcccc acccctaaag gagacaccgg gaatcccaga 9420 atcaagactc atccaatgtc catcatgggt ctcaaggtga acgtctctgc catattcatg 9480 gcagtactgt taactctcca aacacccacc ggtcaaatcc attggggcaa tctctctaag 9540 ataggggtgg taggaatagg aagtgcaagc tacaaagtta tgactcgttc cagccatcaa 9600 tcattagtca taaaattaat gcccaatata actctcctca ataactgcac gagggtagag 9660 attgcagaat acaggagact actgagaaca gttttggaac caattagaga tgcacttaat 9720 gcaatgaccc agaatataag accggttcag agtgtagctt caagtaggag acacaagaga 9780 tttgcgggag tagtcctggc aggtgcggcc ctaggcgttg ccacagctgc tcagataaca 9840 gccggcattg cacttcacca gtccatgctg aactctcaag ccatcgacaa tctgagagcg 9900 agcctggaaa ctactaatca ggcaattgag acaatcagac aagcagggca ggagatgata 9960 ttggctgttc agggtgtcca agactacatc aataatgagc tgataccgtc tatgaaccaa 10020 ctatcttgtg atttaatcgg ccagaagctc gggctcaaat tgctcagata ctatacagaa 10080 atcctgtcat tatttggccc cagtttacgg gaccccatat ctgcggagat atctatccag 10140 gctttgagct atgcgcttgg aggagacatc aataaggtgt tagaaaagct cggatacagt 10200 ggaggtgatt tactgggcat cttagagagc ggaggaataa aggcccggat aactcacgtc 10260 gacacagagt cctacttcat tgtcctcagt atagcctatc cgacgctgtc cgagattaag 10320 ggggtgattg tccaccggct agagggggtc tcgtacaaca taggctctca agagtggtat 10380 accactgtgc ccaagtatgt tgcaacccaa gggtacctta tctcgaattt tgatgagtca 10440 tcgtgtactt tcatgccaga ggggactgtg tgcagccaaa atgccttgta cccgatgagt 10500 cctctgctcc aagaatgcct ccgggggtac accaagtcct gtgctcgtac actcgtatcc 10560 gggtcttttg ggaaccggtt cattttatca caagggaacc taatagccaa ttgtgcatca 10620 atcctttgca agtgttacac aacaggaacg atcattaatc aagaccctga caagatccta 10680 acatacattg ctgccgatca ctgcccggta gtcgaggtga acggcgtgac catccaagtc 10740 gggagcagga ggtatccaga cgctgtgtac ttgcacagaa ttgacctcgg tcctcccata 10800 tcattggaga ggttggacgt agggacaaat ctggggaatg caattgctaa gttggaggat 10860 gccaaggaat tgttggagtc atcggaccag atattgagga gtatgaaagg tttatcgagc 10920 actagcatag tctacatcct gattgcagtg tgtcttggag ggttgatagg gatccccgct 10980 ttaatatgtt gctgcagggg gcgttgtaac aaaaagggag aacaagttgg tatgtcaaga 11040 ccaggcctaa agcctgatct tacgggaaca tcaaaatcct atgtaaggtc gctctgatcc 11100 tctacaactc ttgaaacaca aatgtcccac aagtctcctc ttcgtcatca agcaaccacc 11160 gcacccagca tcaagcccac ctgaaattat ctccggcttc cctctggccg aacaatatcg 11220 gtagttaatc aaaacttagg gtgcaagatc atccacaatg tcaccacaac gagaccggat 11280 aaatgccttc tacaaagata acccccatcc caagggaagt aggatagtca ttaacagaga 11340 acatcttatg attgatagac cttatgtttt gctggctgtt ctgtttgtca tgtttctgag 11400 cttgatcggg ttgctagcca ttgcaggcat tagacttcat cgggcagcca tctacaccgc 11460 agagatccat aaaagcctca gcaccaatct agatgtaact aactcaatcg agcatcaggt 11520 caaggacgtg ctgacaccac tcttcaaaat catcggtgat gaagtgggcc tgaggacacc 11580 tcagagattc actgacctag tgaaattaat ctctgacaag attaaattcc ttaatccgga 11640 tagggagtac gacttcagag atctcacttg gtgtatcaac ccgccagaga gaatcaaatt 11700 ggattatgat caatactgtg cagatgtggc tgctgaagag ctcatgaatg cattggtgaa 11760 ctcaactcta ctggagacca gaacaaccaa tcagttccta gctgtctcaa agggaaactg 11820 ctcagggccc actacaatca gaggtcaatt ctcaaacatg tcgctgtccc tgttagactt 11880 gtatttaggt cgaggttaca atgtgtcatc tatagtcact atgacatccc agggaatgta 11940 tgggggaact tacctagtgg aaaagcctaa tctgagcagc aaaaggtcag agttgtcaca 12000 actgagcatg taccgagtgt ttgaagtagg tgttatcaga aatccgggtt tgggggctcc 12060 ggtgttccat atgacaaact atcttgagca accagtcagt aatgatctca gcaactgtat 12120 ggtggctttg ggggagctca aactcgcagc cctttgtcac ggggaagatt ctatcacaat 12180 tccctatcag ggatcaggga aaggtgtcag cttccagctc gtcaagctag gtgtctggaa 12240 atccccaacc gacatgcaat cctgggtccc cttatcaacg gatgatccag tgatagacag 12300 gctttacctc tcatctcaca gaggtgttat cgctgacaat caagcaaaat gggctgtccc 12360 gacaacacga acagatgaca agttgcgaat ggagacatgc ttccaacagg cgtgtaaggg 12420 taaaatccaa gcactctgcg agaatcccga gtgggcacca ttgaaggata acaggattcc 12480 ttcatacggg gtcttgtctg ttgatctgag tctgacagtt gagcttaaaa tcaaaattgc 12540 ttcgggattc gggccattga tcacacacgg ttcagggatg gacctataca aatccaacca 12600 caacaatgtg tattggctga ctatcccgcc aatgaagaac ctagccttag gtgtaatcaa 12660 cacattggag tggataccga gattcaaggt tagtccctac ctcttcactg tcccaattaa 12720 ggaagcaggc gaagactgcc atgccccaac atacctacct gcggaggtgg atggtgatgt 12780 caaactcagt tccaatctgg tgattctacc tggtcaagat ctccaatatg ttttggcaac 12840 ctacgatact tccagggttg aacatgctgt ggtttattac gtttacagcc caagccgctc 12900 attttcttac ttttatcctt ttaggttgcc tataaagggg gtccccatcg aattacaagt 12960 ggaatgcttc acatgggacc aaaaactctg gtgccgtcac ttctgtgtgc ttgcggactc 13020 agaatctggt ggacatatca ctcactctgg gatggtgggc atgggagtca gctgcacagt 13080 cacccgggaa gatggaacca atcgcagata gggctgctag tgaaccaatc acatgatgtc 13140 acccagacat caggcatacc cactagtgtg aaatagacat cagaattaag aaaaacgtag 13200 ggtccaagtg gttccccgtt atggactcgc tatctgtcaa ccagatctta taccctgaag 13260 ttcacctaga tagcccgata gttaccaata agatagtagc catcctggag tatgctcgag 13320 tccctcacgc ttacagcctg gaggacccta cactgtgtca gaacatcaag caccgcctaa 13380 aaaacggatt ttccaaccaa atgattataa acaatgtgga agttgggaat gtcatcaagt 13440 ccaagcttag gagttatccg gcccactctc atattccata tccaaattgt aatcaggatt 13500 tatttaacat agaagacaaa gagtcaacga ggaagatccg tgaactcctc aaaaagggga 13560 attcgctgta ctccaaagtc agtgataagg ttttccaatg cttaagggac actaactcac 13620 ggcttggcct aggctccgaa ttgagggagg acatcaagga gaaagttatt aacttgggag 13680 tttacatgca cagctcccag tggtttgagc cctttctgtt ttggtttaca gtcaagactg 13740 agatgaggtc agtgattaaa tcacaaaccc atacttgcca taggaggaga cacacacctg 13800 tattcttcac tggtagttca gttgagttgc taatctctcg tgaccttgtt gctataatca 13860 gtaaagagtc tcaacatgta tattacctga catttgaact ggttttgatg tattgtgatg 13920 tcatagaggg gaggttaatg acagagaccg ctatgactat tgatgctagg tatacagagc 13980 ttctaggaag agtcagatac atgtggaaac tgatagatgg tttcttccct gcactcggga 14040 atccaactta tcaaattgta gccatgctgg agcctctttc acttgcttac ctgcagctga 14100 gggatataac agtagaactc agaggtgctt tccttaacca ctgctttact gaaatacatg 14160 atgttcttga ccaaaacggg ttttctgatg aaggtactta tcatgagtta actgaagctc 14220 tagattacat tttcataact gatgacatac atctgacagg ggagattttc tcatttttca 14280 gaagtttcgg ccaccccaga cttgaagcag taacggctgc tgaaaatgtt aggaaataca 14340 tgaatcagcc taaagtcatt gtgtatgaga ctctgatgaa aggtcatgcc atattttgtg 14400 gaatcataat caacggctat cgtgacaggc acggaggcag ttggccaccg ctgaccctcc 14460 ccctgcatgc tgcagacaca atccggaatg ctcaagcttc aggtgaaggg ttaacacatg 14520 agcagtgcgt tgataactgg aaatcttttg ctggagtgaa atttggctgc tttatgcctc 14580 ttagcctgga tagtgatctg acaatgtacc taaaggacaa ggcacttgct gctctccaaa 14640 gggaatggga ttcagtttac ccgaaagagt tcctgcgtta cgaccctccc aagggaaccg 14700 ggtcacggag gcttgtagat gttttcctta atgattcgag ctttgaccca tatgatgtga 14760 taatgtatgt tgtaagtgga gcttacctcc atgaccctga gttcaacctg tcttacagcc 14820 tgaaagaaaa ggagatcaag gaaacaggta gactttttgc taaaatgact tacaaaatga 14880 gggcatgcca agtgattgct gaaaatctaa tctcaaacgg gattggcaaa tattttaagg 14940 acaatgggat ggccaaggat gagcacgatt tgactaaggc actccacact ctagctgtct 15000 caggagtccc caaagatctc aaagaaagtc acaggggggg gccagtctta aaaacctact 15060 cccgaagccc agtccacaca agtaccagga acgtgagagc agcaaaaggg tttatagggt 15120 tccctcaagt aattcggcag gaccaagaca ctgatcatcc ggagaatatg gaagcttacg 15180 agacagtcag tgcatttatc acgactgatc tcaagaagta ctgccttaat tggagatatg 15240 agaccatcag cttgtttgca cagaggctaa atgagattta cggattgccc tcatttttcc 15300 agtggctgca taagaggctt gagacctctg tcctgtatgt aagtgaccct cattgccccc 15360 ccgaccttga cgcccatatc ccgttatata aagtccccaa tgatcaaatc ttcattaagt 15420 accctatggg aggtatagaa gggtattgtc agaagctgtg gaccatcagc accattccct 15480 atctatacct ggctgcttat gagagcggag taaggattgc ttcgttagtg caaggggaca 15540 atcagaccat agccgtaaca aaaagggtac ccagcacatg gccctacaac cttaagaaac 15600 gggaagctgc tagagtaact agagattact ttgtaattct taggcaaagg ctacatgata 15660 ttggccatca cctcaaggca aatgagacaa ttgtttcatc acattttttt gtctattcaa 15720 aaggaatata ttatgatggg ctacttgtgt cccaatcact caagagcatc gcaagatgtg 15780 tattctggtc agagactata gttgatgaaa caagggcagc atgcagtaat attgctacaa 15840 caatggctaa aagcatcgag agaggttatg accgttacct tgcatattcc ctgaacgtcc 15900 taaaagtgat acagcaaatt ctgatctctc ttggcttcac aatcaattca accatgaccc 15960 gggatgtagt catacccctc ctcacaaaca acgacctctt aataaggatg gcactgttgc 16020 ccgctcctat tggggggatg aattatctga atatgagcag gctgtttgtc agaaacatcg 16080 gtgatccagt aacatcatca attgctgatc tcaagagaat gattctcgcc tcactaatgc 16140 ctgaagagac cctccatcaa gtaatgacac aacaaccggg ggactcttca ttcctagact 16200 gggctagcga cccttactca gcaaatcttg tatgtgtcca gagcatcact agactcctca 16260 agaacataac tgcaaggttt gtcctgatcc atagtccaaa cccaatgtta aaaggattat 16320 tccatgatga cagtaaagaa gaggacgagg gactggcggc attcctcatg gacaggcata 16380 ttatagtacc tagggcagct catgaaatcc tggatcatag tgtcacaggg gcaagagagt 16440 ctattgcagg catgctggat accacaaaag gcttgattcg agccagcatg aggaaggggg 16500 ggttaacctc tcgagtgata accagattgt ccaattatga ctatgaacaa ttcagagcag 16560 ggatggtgct attgacagga agaaagagaa atgtcctcat tgacaaagag tcatgttcag 16620 tgcagctggc gagagctcta agaagccata tgtgggcgag gctagctcga ggacggccta 16680 tttacggcct tgaggtccct gatgtactag aatctatgcg aggccacctt attcggcgtc 16740 atgagacatg tgtcatctgc gagtgtggat cagtcaacta cggatggttt tttgtcccct 16800 cgggttgcca actggatgat attgacaagg aaacatcatc cttgagagtc ccatatattg 16860 gttctaccac tgatgagaga acagacatga agcttgcctt cgtaagagcc ccaagtcgat 16920 ccttgcgatc tgctgttaga atagcaacag tgtactcatg ggcttacggt gatgatgata 16980 gctcttggaa cgaagcctgg ttgttggcta ggcaaagggc caatgtgagc ctggaggagc 17040 taagggtgat cactcccatc tcaacttcga ctaatttagc gcataggttg agggatcgta 17100 gcactcaagt gaaatactca ggtacatccc ttgtccgagt ggcgaggtat accacaatct 17160 ccaacgacaa tctctcattt gtcatatcag ataagaaggt tgatactaac tttatatacc 17220 aacaaggaat gcttctaggg ttgggtgttt tagaaacatt gtttcgactc gagaaagata 17280 ccggatcatc taacacggta ttacatcttc acgtcgaaac agattgttgc gtgatcccga 17340 tgatagatca tcccaggata cccagctccc gcaagctaga gctgagggca gagctatgta 17400 ccaacccatt gatatatgat aatgcacctt taattgacag agatgcaaca aggctataca 17460 cccagagcca taggaggcac cttgtggaat ttgttacatg gtccacaccc caactatatc 17520 acattttagc taagtccaca gcactatcta tgattgacct ggtaacaaaa tttgagaagg 17580 accatatgaa tgaaatttca gctctcatag gggatgacga tatcaatagt ttcataactg 17640 agtttctgct catagagcca agattattca ctatctactt gggccagtgt gcggccatca 17700 attgggcatt tgatgtacat tatcatagac catcagggaa atatcagatg ggtgagctgt 17760 tgtcatcgtt cctttctaga atgagcaaag gagtgtttaa ggtgcttgtc aatgctctaa 17820 gccacccaaa gatctacaag aaattctggc attgtggtat tatagagcct atccatggtc 17880 cttcacttga tgctcaaaac ttgcacacaa ctgtgtgcaa catggtttac acatgctata 17940 tgacctacct cgacctgttg ttgaatgaag agttagaaga gttcacattt ctcttgtgtg 18000 aaagcgacga ggatgtagta ccggacagat tcgacaacat ccaggcaaaa cacttatgtg 18060 ttctggcaga tttgtactgt caaccaggga cctgcccacc aattcgaggt ctaagaccgg 18120 tagagaaatg tgcagttcta accgaccata tcaaggcaga ggctatgtta tctccagcag 18180 gatcttcgtg gaacataaat ccaattattg tagaccatta ctcatgctct ctgacttatc 18240 tccggcgagg atcgatcaaa cagataagat tgagagttga tccaggattc attttcgacg 18300 ccctcgctga ggtaaatgtc agtcagccaa agatcggcag caacaacatc tcaaatatga 18360 gcatcaaggc tttcagaccc ccacacgatg atgttgcaaa attgctcaaa gatatcaaca 18420 caagcaagca caatcttccc atttcagggg gcaatctcgc caattatgaa atccatgctt 18480 tccgcagaat cgggttgaac tcatctgctt gctacaaagc tgttgagata tcaacattaa 18540 ttaggagatg ccttgagcca ggggaggacg gcttgttctt gggtgaggga tcgggttcta 18600 tgttgatcac ttataaagag atacttaaac taaacaagtg cttctataat agtggggttt 18660 ccgccaattc tagatctggt caaagggaat tagcacccta tccctccgaa gttggccttg 18720 tcgaacacag aatgggagta ggtaatattg tcaaagtgct ctttaacggg aggcccgaag 18780 tcacgtgggt aggcagtgta gattgcttca atttcatagt tagtaatatc cctacctcta 18840 gtgtggggtt tatccattca gatatagaga ccttgcctga caaagatact atagagaagc 18900 tagaggaatt ggcagccatc ttatcgatgg ctctgctcct gggcaaaata ggatcaatac 18960 tggtgattaa gcttatgcct ttcagcgggg attttgttca gggatttata agttatgtag 19020 ggtctcatta tagagaagtg aaccttgtat accctagata cagcaacttc atctctactg 19080 aatcttattt ggttatgaca gatctcaagg ctaaccggct aatgaatcct gaaaagatta 19140 agcagcagat aattgaatca tctgtgagga cttcacctgg acttataggt cacatcctat 19200 ccattaagca actaagctgc atacaagcaa ttgtgggaga cgcagttagt agaggtgata 19260 tcaatcctac tctgaaaaaa cttacaccta tagagcaggt gctgatcaat tgcgggttgg 19320 caattaacgg acctaagctg tgcaaagaat tgatccacca tgatgttgcc tcagggcaag 19380 atggattgct taattctata ctcatcctct acagggagtt ggcaagattc aaagacaacc 19440 aaagaagtca acaagggatg ttccacgctt accccgtatt ggtaagtagc aggcaacgag 19500 aacttatatc taggatcacc cgcaaattct gggggcacat tcttctttac tccgggaaca 19560 aaaagttgat aaataagttt atccagaatc tcaagtccgg ctatctgata ctagacttac 19620 accagaatat cttcgttaag aatctatcca agtcagagaa acagattatt atgacggggg 19680 gtttgaaacg tgagtgggtt tttaaggtaa cagtcaagga gaccaaagaa tggtataagt 19740 tagtcggata cagtgccctg attaaggact aattggttga actccggaac cctaatcctg 19800 ccctaggtgg ttaggcatta tttgcaatat attaaagaaa actttgaaaa tacgaagttt 19860 ctattcccag ctttgtctgg tggccggcat ggtcccagcc tcctcgctgg cgccggctgg 19920 gcaacattcc gaggggaccg tcccctcggt aatggcgaat gggacgcggc cgatccggct 19980 gctaacaaag cccgaaagga agctgagttg gctgctgcca ccgctgagca ataactagca 20040 taaccccttg gggcctctaa acgggtcttg aggggttttt tgctgaaagg aggaactata 20100 tccggatgcg gccgcgggcc ctatggtacc cagcttttgt tccctttagt gagggttaat 20160 tccgagcttg gcgtaatcat ggtcatagct gtttcctgtg tgaaattgtt atccgctcac 20220 aattccacac aacataggag ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt 20280 gaggtaactc acattaattg cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc 20340 gtgccagctg cattaatgaa tcggccaacg cgcggggaga ggcggtttgc gtattgggcg 20400 ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt 20460 atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa 20520 gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc 20580 gtttttccat aggctcggcc cccctgacga gcatcacaaa aatcgacgct caagtcagag 20640 gtggcgaaac ccgacaggac tataaagata ccaggcgttc ccccctggaa gctccctcgt 20700 gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg 20760 aagcgtggcg ctttctcaat gctcacgctg taggtatctc agttcggtgt aggtcgttcg 20820 ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg 20880 taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac 20940 tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg 21000 gcctaactac ggctacacta gaaggacagt atttggtatc tgcgctctgc tgaagccagt 21060 taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg 21120 tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc 21180 tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt 21240 ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt 21300 taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag 21360 tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct gactgcccgt 21420 cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg caatgatacc 21480 gcgagaccca cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc 21540 cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg 21600 ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccattgctac 21660 aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg 21720 atcaaggcga gttacatgat cccccatgtt gtgaaaaaaa gcggttagct ccttcggtcc 21780 tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatgctta tggcagcact 21840 gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc 21900 aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat 21960 acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc 22020 ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac 22080 tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa 22140 aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact 22200 catactcttc ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg 22260 atacatattt gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg 22320 aaaagtgcca cctgaaattg taaacgttaa tattttgtta aaattcgcgt taaatttttg 22380 ttaaatcagc tcatttttta accaataggc cgaaatcggc aaaatccctt ataaatcaaa 22440 agaatagacc gagatagggt tgagtgttgt tccagtttgg aacaagagtc cactattaaa 22500 gaacgtggac tccaacgtca aagggcgaaa aaccgtctat cagggcgatg gcccactacg 22560 tgaaccatca ccctaatcaa gttttttggg gtcgaggtgc cgtaaagcac taaatcggaa 22620 ccctaaaggg agcccccgat ttagagcttg acggggaaag ccggcgaacg tggcgagaaa 22680 ggaagggaag aaagcgaaag gagcgggcgc tagggcgctg gcaagtgtag cggtcacgct 22740 gcgcgtaacc accacacccg ccgcgcttaa tgcgccgcta cagggcgcgt cccatt 22796 <210> 147 <211> 20780 <212> DNA <213> Artificial sequence <220> <223> pTM2-S2-2P-dER_SARS-CoV-2 (optimized sequence) <400> 147 tgtccgctaa tacgactcac tatagggcca actttgtttg gtctgatgag tccgtgagga 60 cgaaacccgg agtcccgggt caccaaacaa agttgggtaa ggatagttca atcaatgatc 120 atcttctagt gcacttagga ttcaagatcc tattatcagg gacaagagca ggattaggga 180 tatccgagat ggccacactt ttaaggagct tagcattgtt caaaagaaac aaggacaaac 240 cacccattac atcaggatcc ggtggagcca tcagaggaat caaacacatt attatagtac 300 caatccctgg agattcctca attaccactc gatccagact tctggaccgg ttggtgaggt 360 taattggaaa cccggatgtg agcgggccca aactaacagg ggcactaata ggtatattat 420 ccttatttgt ggagtctcca ggtcaattga ttcagaggat caccgatgac cctgacgtta 480 gcataaggct gttagaggtt gtccagagtg accagtcaca atctggcctt accttcgcat 540 caagaggtac caacatggag gatgaggcgg accaatactt ttcacatgat gatccaatta 600 gtagtgatca atccaggttc ggatggttcg ggaacaagga aatctcagat attgaagtgc 660 aagaccctga gggattcaac atgattctgg gtaccatcct agcccaaatt tgggtcttgc 720 tcgcaaaggc ggttacggcc ccagacacgg cagctgattc ggagctaaga aggtggataa 780 agtacaccca acaaagaagg gtagttggtg aatttagatt ggagagaaaa tggttggatg 840 tggtgaggaa caggattgcc gaggacctct ccttacgccg attcatggtc gctctaatcc 900 tggatatcaa gagaacaccc ggaaacaaac ccaggattgc tgaaatgata tgtgacattg 960 atacatatat cgtagaggca ggattagcca gttttatcct gactattaag tttgggatag 1020 aaactatgta tcctgctctt ggactgcatg aatttgctgg tgagttatcc acacttgagt 1080 ccttgatgaa cctttaccag caaatggggg aaactgcacc ctacatggta atcctggaga 1140 actcaattca gaacaagttc agtgcaggat cataccctct gctctggagc tatgccatgg 1200 gagtaggagt ggaacttgaa aactccatgg gaggtttgaa ctttggccga tcttactttg 1260 atccagcata ttttagatta gggcaagaga tggtaaggag gtcagctgga aaggtcagtt 1320 ccacattggc atctgaactc ggtatcactg ccgaggatgc aaggcttgtt tcagagattg 1380 caatgcatac tactgaggac aagatcagta gagcggttgg acccagacaa gcccaagtat 1440 catttctaca cggtgatcaa agtgagaatg agctaccgag attggggggc aaggaagata 1500 ggagggtcaa acagagtcga ggagaagcca gggagagcta cagagaaacc gggcccagca 1560 gagcaagtga tgcgagagct gcccatcttc caaccggcac acccctagac attgacactg 1620 caacggagtc cagccaagat ccgcaggaca gtcgaaggtc agctgacgcc ctgcttaggc 1680 tgcaagccat ggcaggaatc tcggaagaac aaggctcaga cacggacacc cctatagtgt 1740 acaatgacag aaatcttcta gactaggtgc gagaggccga gggccagaac aacatccgcc 1800 taccatccat cattgttata aaaaacttag gaaccaggtc cacacagccg ccagcccatc 1860 aaccatccac tcccacgatt ggagccaatg gcagaagagc aggcacgcca tgtcaaaaac 1920 ggactggaat gcatccgggc tctcaaggcc gagcccatcg gctcactggc catcgaggaa 1980 gctatggcag catggtcaga aatatcagac aacccaggac aggagcgagc cacctgcagg 2040 gaagagaagg caggcagttc gggtctcagc aaaccatgcc tctcagcaat tggatcaact 2100 gaaggcggtg cacctcgcat ccgcggtcag ggacctggag agagcgatga cgacgctgaa 2160 actttgggaa tccccccaag aaatctccag gcatcaagca ctgggttaca gtgttattac 2220 gtttatgatc acagcggtga agcggttaag ggaatccaag atgctgactc tatcatggtt 2280 caatcaggcc ttgatggtga tagcaccctc tcaggaggag acaatgaatc tgaaaacagc 2340 gatgtggata ttggcgaacc tgataccgag ggatatgcta tcactgaccg gggatctgct 2400 cccatctcta tggggttcag ggcttctgat gttgaaactg cagaaggagg ggagatccac 2460 gagctcctga gactccaatc cagaggcaac aactttccga agcttgggaa aactctcaat 2520 gttcctccgc ccccggaccc cggtagggcc agcacttccg ggacacccat taaaaagggc 2580 acagacgcga gattagcctc atttggaacg gagatcgcgt ctttattgac aggtggtgca 2640 acccaatgtg ctcgaaagtc accctcggaa ccatcagggc caggtgcacc tgcggggaat 2700 gtccccgagt gtgtgagcaa tgccgcactg atacaggagt ggacacccga atctggtacc 2760 acaatctccc cgagatccca gaataatgaa gaagggggag actattatga tgatgagctg 2820 ttctctgatg tccaagatat taaaacagcc ttggccaaaa tacacgagga taatcagaag 2880 ataatctcca agctagaatc actgctgtta ttgaagggag aagttgagtc aattaagaag 2940 cagatcaaca ggcaaaatat cagcatatcc accctggaag gacacctctc aagcatcatg 3000 atcgccattc ctggacttgg gaaggatccc aacgacccca ctgcagatgt cgaaatcaat 3060 cccgacttga aacccatcat aggcagagat tcaggccgag cactggccga agttctcaag 3120 aaacccgttg ccagccgaca actccaagga atgacaaatg gacggaccag ttccagagga 3180 cagctgctga aggaatttca gctaaagccg atcgggaaaa agatgagctc agccgtcggg 3240 tttgttcctg acaccggccc tgcatcacgc agtgtaatcc gctccattat aaaatccagc 3300 cggctagagg aggatcggaa gcgttacctg atgactctcc ttgatgatat caaaggagcc 3360 aatgatcttg ccaagttcca ccagatgctg atgaagataa taatgaagta gctacagctc 3420 aacttacctg ccaaccccat gccagtcgac ccaactagcc taccctccat cattgttata 3480 aaaaacttag gaaccaggtc cacacagccg ccagcccatc aacgcgtacg gccaccatgt 3540 tcgtctttct ggtattgctt cctctggtga gttcccagtg cgtagcaagt cagagtatca 3600 tagcctatac tatgagcctg ggggcagaaa attctgtcgc ttatagtaat aacagtattg 3660 caattcctac taacttcact attagcgtga ctacagaaat tctgccagtg agcatgacca 3720 agacctccgt cgactgtacc atgtatatct gcggagacag cacagaatgc agcaacctgc 3780 ttctgcagta cggtagcttt tgtacccagc tgaacagggc actgaccggc atcgctgtgg 3840 aacaggacaa aaatacgcag gaggtgttcg ctcaggtcaa gcagatttat aagacacccc 3900 caataaaaga cttcggcggc tttaacttct cccagatcct gcccgatccg tcaaaacctt 3960 ccaagagaag ttttatcgag gatctgctgt ttaacaaagt aacattggct gatgctggct 4020 ttattaaaca gtacggcgat tgtctgggag atatcgccgc tagagatctg atctgcgctc 4080 aaaaatttaa tggcctcact gtattgcccc ccctgctgac ggatgaaatg attgcccaat 4140 acacatcagc cctgctggct gggacaatca cttccggctg gacgttcggt gctggagctg 4200 ctcttcaaat tccatttgcc atgcaaatgg cttatagatt caacggaatt ggcgtgaccc 4260 aaaacgtgct gtacgaaaat caaaagctga ttgctaatca gtttaactcc gctatcggta 4320 agatacagga cagcctgtct agtactgcca gcgccctcgg aaagctccag gatgtggtga 4380 accagaatgc gcaggcgctg aacacactcg tcaaacagct tagcagcaat ttcggcgcaa 4440 ttagcagtgt actgaacgac atcttgtctc ggctcgaccc accagaggcc gaagtgcaga 4500 ttgatcgcct gatcactggc cggctccagt ctctgcagac ctacgtaacc cagcaactca 4560 tacgcgctgc cgaaattcgg gcttcagcta acctggccgc aacaaagatg tctgaatgtg 4620 ttcttgggca gtccaagagg gtggacttct gcgggaaagg atatcacctg atgtccttcc 4680 ctcagagcgc ccctcatgga gtggtgtttc ttcatgttac ctatgttccg gcccaggaaa 4740 agaattttac cactgcccca gccatttgcc atgatggtaa agcacacttc ccaagagagg 4800 gcgtgtttgt tagtaacggc acccactggt tcgttaccca gcgcaatttt tacgaacctc 4860 aaatcattac cactgacaat acatttgtat caggcaattg cgacgtggtg atcggaatcg 4920 taaataatac agtctacgat cccctgcagc cagagcttga cagctttaaa gaggaactgg 4980 acaaatactt caaaaatcat acaagccccg acgtcgacct gggagatatt tctggcatca 5040 atgcctccgt cgtgaatatc caaaaagaga tcgaccgcct taatgaggtt gccaaaaacc 5100 tcaacgagtc cctgattgat ctgcaggagc tggggaagta cgagcagtat atcaaatggc 5160 cctggtacat ctggctgggc ttcattgccg ggctcatagc catcgtgatg gtgacgatca 5220 tgctgtgttg catgacctct tgctgttctt gtctgaaggg gtgctgctct tgtgggagtt 5280 gttgtaaatt cgatgaggat gattccgaat aagcgcgcag cgcttagacg tctcgcgatc 5340 gatactagta caacctaaat ccattataaa aaacttagga gcaaagtgat tgcctcccaa 5400 ggtccacaat gacagagacc tacgacttcg acaagtcggc atgggacatc aaagggtcga 5460 tcgctccgat acaacccacc acctacagtg atggcaggct ggtgccccag gtcagagtca 5520 tagatcctgg tctaggcgac aggaaggatg aatgctttat gtacatgttt ctgctggggg 5580 ttgttgagga cagcgattcc ctagggcctc caatcgggcg agcatttggg ttcctgccct 5640 taggtgttgg cagatccaca gcaaagcccg aaaaactcct caaagaggcc actgagcttg 5700 acatagttgt tagacgtaca gcagggctca atgaaaaact ggtgttctac aacaacaccc 5760 cactaactct cctcacacct tggagaaagg tcctaacaac agggagtgtc ttcaacgcaa 5820 accaagtgtg caatgcggtt aatctgatac cgctcgatac cccgcagagg ttccgtgttg 5880 tttatatgag catcacccgt ctttcggata acgggtatta caccgttcct agaagaatgc 5940 tggaattcag atcggtcaat gcagtggcct tcaacctgct ggtgaccctt aggattgaca 6000 aggcgatagg ccctgggaag atcatcgaca atacagagca acttcctgag gcaacattta 6060 tggtccacat cgggaacttc aggagaaaga agagtgaagt ctactctgcc gattattgca 6120 aaatgaaaat cgaaaagatg ggcctggttt ttgcacttgg tgggataggg ggcaccagtc 6180 ttcacattag aagcacaggc aaaatgagca agactctcca tgcacaactc gggttcaaga 6240 agaccttatg ttacccgctg atggatatca atgaagacct taatcgatta ctctggagga 6300 gcagatgcaa gatagtaaga atccaggcag ttttgcagcc atcagttcct caagaattcc 6360 gcatttacga cgacgtgatc ataaatgatg accaaggact attcaaagtt ctgtagaccg 6420 tagtgcccag caatgcccga aaacgacccc cctcacaatg acagccagaa ggcccggaca 6480 aaaaagcccc ctccgaaaga ctccacggac caagcgagag gccagccagc agccgacggc 6540 aagcgcgaac accaggcggc cccagcacag aacagccctg acacaaggcc accaccagcc 6600 accccaatct gcatcctcct cgtgggaccc ccgaggacca acccccaagg ctgcccccga 6660 tccaaaccac caaccgcatc cccaccaccc ccgggaaaga aacccccagc aattggaagg 6720 cccctccccc tcttcctcaa cacaagaact ccacaaccga accgcacaag cgaccgaggt 6780 gacccaaccg caggcatccg actccctaga cagatcctct ctccccggca aactaaacaa 6840 aacttagggc caaggaacat acacacccaa cagaacccag accccggccc acggcgccgc 6900 gcccccaacc cccgacaacc agagggagcc cccaaccaat cccgccggct cccccggtgc 6960 ccacaggcag ggacaccaac ccccgaacag acccagcacc caaccatcga caatccaaga 7020 cgggggggcc cccccaaaaa aaggccccca ggggccgaca gccagcaccg cgaggaagcc 7080 cacccacccc acacacgacc acggcaacca aaccagaacc cagaccaccc tgggccacca 7140 gctcccagac tcggccatca ccccgcagaa aggaaaggcc acaacccgcg caccccagcc 7200 ccgatccggc ggggagccac ccaacccgaa ccagcaccca agagcgatcc ccgaaggacc 7260 cccgaaccgc aaaggacatc agtatcccac agcctctcca agtcccccgg tctcctcctc 7320 ttctcgaagg gaccaaaaga tcaatccacc acacccgacg acactcaact ccccacccct 7380 aaaggagaca ccgggaatcc cagaatcaag actcatccaa tgtccatcat gggtctcaag 7440 gtgaacgtct ctgccatatt catggcagta ctgttaactc tccaaacacc caccggtcaa 7500 atccattggg gcaatctctc taagataggg gtggtaggaa taggaagtgc aagctacaaa 7560 gttatgactc gttccagcca tcaatcatta gtcataaaat taatgcccaa tataactctc 7620 ctcaataact gcacgagggt agagattgca gaatacagga gactactgag aacagttttg 7680 gaaccaatta gagatgcact taatgcaatg acccagaata taagaccggt tcagagtgta 7740 gcttcaagta ggagacacaa gagatttgcg ggagtagtcc tggcaggtgc ggccctaggc 7800 gttgccacag ctgctcagat aacagccggc attgcacttc accagtccat gctgaactct 7860 caagccatcg acaatctgag agcgagcctg gaaactacta atcaggcaat tgagacaatc 7920 agacaagcag ggcaggagat gatattggct gttcagggtg tccaagacta catcaataat 7980 gagctgatac cgtctatgaa ccaactatct tgtgatttaa tcggccagaa gctcgggctc 8040 aaattgctca gatactatac agaaatcctg tcattatttg gccccagttt acgggacccc 8100 atatctgcgg agatatctat ccaggctttg agctatgcgc ttggaggaga catcaataag 8160 gtgttagaaa agctcggata cagtggaggt gatttactgg gcatcttaga gagcggagga 8220 ataaaggccc ggataactca cgtcgacaca gagtcctact tcattgtcct cagtatagcc 8280 tatccgacgc tgtccgagat taagggggtg attgtccacc ggctagaggg ggtctcgtac 8340 aacataggct ctcaagagtg gtataccact gtgcccaagt atgttgcaac ccaagggtac 8400 cttatctcga attttgatga gtcatcgtgt actttcatgc cagaggggac tgtgtgcagc 8460 caaaatgcct tgtacccgat gagtcctctg ctccaagaat gcctccgggg gtacaccaag 8520 tcctgtgctc gtacactcgt atccgggtct tttgggaacc ggttcatttt atcacaaggg 8580 aacctaatag ccaattgtgc atcaatcctt tgcaagtgtt acacaacagg aacgatcatt 8640 aatcaagacc ctgacaagat cctaacatac attgctgccg atcactgccc ggtagtcgag 8700 gtgaacggcg tgaccatcca agtcgggagc aggaggtatc cagacgctgt gtacttgcac 8760 agaattgacc tcggtcctcc catatcattg gagaggttgg acgtagggac aaatctgggg 8820 aatgcaattg ctaagttgga ggatgccaag gaattgttgg agtcatcgga ccagatattg 8880 aggagtatga aaggtttatc gagcactagc atagtctaca tcctgattgc agtgtgtctt 8940 ggagggttga tagggatccc cgctttaata tgttgctgca gggggcgttg taacaaaaag 9000 ggagaacaag ttggtatgtc aagaccaggc ctaaagcctg atcttacggg aacatcaaaa 9060 tcctatgtaa ggtcgctctg atcctctaca actcttgaaa cacaaatgtc ccacaagtct 9120 cctcttcgtc atcaagcaac caccgcaccc agcatcaagc ccacctgaaa ttatctccgg 9180 cttccctctg gccgaacaat atcggtagtt aatcaaaact tagggtgcaa gatcatccac 9240 aatgtcacca caacgagacc ggataaatgc cttctacaaa gataaccccc atcccaaggg 9300 aagtaggata gtcattaaca gagaacatct tatgattgat agaccttatg ttttgctggc 9360 tgttctgttt gtcatgtttc tgagcttgat cgggttgcta gccattgcag gcattagact 9420 tcatcgggca gccatctaca ccgcagagat ccataaaagc ctcagcacca atctagatgt 9480 aactaactca atcgagcatc aggtcaagga cgtgctgaca ccactcttca aaatcatcgg 9540 tgatgaagtg ggcctgagga cacctcagag attcactgac ctagtgaaat taatctctga 9600 caagattaaa ttccttaatc cggataggga gtacgacttc agagatctca cttggtgtat 9660 caacccgcca gagagaatca aattggatta tgatcaatac tgtgcagatg tggctgctga 9720 agagctcatg aatgcattgg tgaactcaac tctactggag accagaacaa ccaatcagtt 9780 cctagctgtc tcaaagggaa actgctcagg gcccactaca atcagaggtc aattctcaaa 9840 catgtcgctg tccctgttag acttgtattt aggtcgaggt tacaatgtgt catctatagt 9900 cactatgaca tcccagggaa tgtatggggg aacttaccta gtggaaaagc ctaatctgag 9960 cagcaaaagg tcagagttgt cacaactgag catgtaccga gtgtttgaag taggtgttat 10020 cagaaatccg ggtttggggg ctccggtgtt ccatatgaca aactatcttg agcaaccagt 10080 cagtaatgat ctcagcaact gtatggtggc tttgggggag ctcaaactcg cagccctttg 10140 tcacggggaa gattctatca caattcccta tcagggatca gggaaaggtg tcagcttcca 10200 gctcgtcaag ctaggtgtct ggaaatcccc aaccgacatg caatcctggg tccccttatc 10260 aacggatgat ccagtgatag acaggcttta cctctcatct cacagaggtg ttatcgctga 10320 caatcaagca aaatgggctg tcccgacaac acgaacagat gacaagttgc gaatggagac 10380 atgcttccaa caggcgtgta agggtaaaat ccaagcactc tgcgagaatc ccgagtgggc 10440 accattgaag gataacagga ttccttcata cggggtcttg tctgttgatc tgagtctgac 10500 agttgagctt aaaatcaaaa ttgcttcggg attcgggcca ttgatcacac acggttcagg 10560 gatggaccta tacaaatcca accacaacaa tgtgtattgg ctgactatcc cgccaatgaa 10620 gaacctagcc ttaggtgtaa tcaacacatt ggagtggata ccgagattca aggttagtcc 10680 ctacctcttc actgtcccaa ttaaggaagc aggcgaagac tgccatgccc caacatacct 10740 acctgcggag gtggatggtg atgtcaaact cagttccaat ctggtgattc tacctggtca 10800 agatctccaa tatgttttgg caacctacga tacttccagg gttgaacatg ctgtggttta 10860 ttacgtttac agcccaagcc gctcattttc ttacttttat ccttttaggt tgcctataaa 10920 gggggtcccc atcgaattac aagtggaatg cttcacatgg gaccaaaaac tctggtgccg 10980 tcacttctgt gtgcttgcgg actcagaatc tggtggacat atcactcact ctgggatggt 11040 gggcatggga gtcagctgca cagtcacccg ggaagatgga accaatcgca gatagggctg 11100 ctagtgaacc aatcacatga tgtcacccag acatcaggca tacccactag tgtgaaatag 11160 acatcagaat taagaaaaac gtagggtcca agtggttccc cgttatggac tcgctatctg 11220 tcaaccagat cttataccct gaagttcacc tagatagccc gatagttacc aataagatag 11280 tagccatcct ggagtatgct cgagtccctc acgcttacag cctggaggac cctacactgt 11340 gtcagaacat caagcaccgc ctaaaaaacg gattttccaa ccaaatgatt ataaacaatg 11400 tggaagttgg gaatgtcatc aagtccaagc ttaggagtta tccggcccac tctcatattc 11460 catatccaaa ttgtaatcag gatttattta acatagaaga caaagagtca acgaggaaga 11520 tccgtgaact cctcaaaaag gggaattcgc tgtactccaa agtcagtgat aaggttttcc 11580 aatgcttaag ggacactaac tcacggcttg gcctaggctc cgaattgagg gaggacatca 11640 aggagaaagt tattaacttg ggagtttaca tgcacagctc ccagtggttt gagccctttc 11700 tgttttggtt tacagtcaag actgagatga ggtcagtgat taaatcacaa acccatactt 11760 gccataggag gagacacaca cctgtattct tcactggtag ttcagttgag ttgctaatct 11820 ctcgtgacct tgttgctata atcagtaaag agtctcaaca tgtatattac ctgacatttg 11880 aactggtttt gatgtattgt gatgtcatag aggggaggtt aatgacagag accgctatga 11940 ctattgatgc taggtataca gagcttctag gaagagtcag atacatgtgg aaactgatag 12000 atggtttctt ccctgcactc gggaatccaa cttatcaaat tgtagccatg ctggagcctc 12060 tttcacttgc ttacctgcag ctgagggata taacagtaga actcagaggt gctttcctta 12120 accactgctt tactgaaata catgatgttc ttgaccaaaa cgggttttct gatgaaggta 12180 cttatcatga gttaactgaa gctctagatt acattttcat aactgatgac atacatctga 12240 caggggagat tttctcattt ttcagaagtt tcggccaccc cagacttgaa gcagtaacgg 12300 ctgctgaaaa tgttaggaaa tacatgaatc agcctaaagt cattgtgtat gagactctga 12360 tgaaaggtca tgccatattt tgtggaatca taatcaacgg ctatcgtgac aggcacggag 12420 gcagttggcc accgctgacc ctccccctgc atgctgcaga cacaatccgg aatgctcaag 12480 cttcaggtga agggttaaca catgagcagt gcgttgataa ctggaaatct tttgctggag 12540 tgaaatttgg ctgctttatg cctcttagcc tggatagtga tctgacaatg tacctaaagg 12600 acaaggcact tgctgctctc caaagggaat gggattcagt ttacccgaaa gagttcctgc 12660 gttacgaccc tcccaaggga accgggtcac ggaggcttgt agatgttttc cttaatgatt 12720 cgagctttga cccatatgat gtgataatgt atgttgtaag tggagcttac ctccatgacc 12780 ctgagttcaa cctgtcttac agcctgaaag aaaaggagat caaggaaaca ggtagacttt 12840 ttgctaaaat gacttacaaa atgagggcat gccaagtgat tgctgaaaat ctaatctcaa 12900 acgggattgg caaatatttt aaggacaatg ggatggccaa ggatgagcac gatttgacta 12960 aggcactcca cactctagct gtctcaggag tccccaaaga tctcaaagaa agtcacaggg 13020 gggggccagt cttaaaaacc tactcccgaa gcccagtcca cacaagtacc aggaacgtga 13080 gagcagcaaa agggtttata gggttccctc aagtaattcg gcaggaccaa gacactgatc 13140 atccggagaa tatggaagct tacgagacag tcagtgcatt tatcacgact gatctcaaga 13200 agtactgcct taattggaga tatgagacca tcagcttgtt tgcacagagg ctaaatgaga 13260 tttacggatt gccctcattt ttccagtggc tgcataagag gcttgagacc tctgtcctgt 13320 atgtaagtga ccctcattgc ccccccgacc ttgacgccca tatcccgtta tataaagtcc 13380 ccaatgatca aatcttcatt aagtacccta tgggaggtat agaagggtat tgtcagaagc 13440 tgtggaccat cagcaccatt ccctatctat acctggctgc ttatgagagc ggagtaagga 13500 ttgcttcgtt agtgcaaggg gacaatcaga ccatagccgt aacaaaaagg gtacccagca 13560 catggcccta caaccttaag aaacgggaag ctgctagagt aactagagat tactttgtaa 13620 ttcttaggca aaggctacat gatattggcc atcacctcaa ggcaaatgag acaattgttt 13680 catcacattt ttttgtctat tcaaaaggaa tatattatga tgggctactt gtgtcccaat 13740 cactcaagag catcgcaaga tgtgtattct ggtcagagac tatagttgat gaaacaaggg 13800 cagcatgcag taatattgct acaacaatgg ctaaaagcat cgagagaggt tatgaccgtt 13860 accttgcata ttccctgaac gtcctaaaag tgatacagca aattctgatc tctcttggct 13920 tcacaatcaa ttcaaccatg acccgggatg tagtcatacc cctcctcaca aacaacgacc 13980 tcttaataag gatggcactg ttgcccgctc ctattggggg gatgaattat ctgaatatga 14040 gcaggctgtt tgtcagaaac atcggtgatc cagtaacatc atcaattgct gatctcaaga 14100 gaatgattct cgcctcacta atgcctgaag agaccctcca tcaagtaatg acacaacaac 14160 cgggggactc ttcattccta gactgggcta gcgaccctta ctcagcaaat cttgtatgtg 14220 tccagagcat cactagactc ctcaagaaca taactgcaag gtttgtcctg atccatagtc 14280 caaacccaat gttaaaagga ttattccatg atgacagtaa agaagaggac gagggactgg 14340 cggcattcct catggacagg catattatag tacctagggc agctcatgaa atcctggatc 14400 atagtgtcac aggggcaaga gagtctattg caggcatgct ggataccaca aaaggcttga 14460 ttcgagccag catgaggaag ggggggttaa cctctcgagt gataaccaga ttgtccaatt 14520 atgactatga acaattcaga gcagggatgg tgctattgac aggaagaaag agaaatgtcc 14580 tcattgacaa agagtcatgt tcagtgcagc tggcgagagc tctaagaagc catatgtggg 14640 cgaggctagc tcgaggacgg cctatttacg gccttgaggt ccctgatgta ctagaatcta 14700 tgcgaggcca ccttattcgg cgtcatgaga catgtgtcat ctgcgagtgt ggatcagtca 14760 actacggatg gttttttgtc ccctcgggtt gccaactgga tgatattgac aaggaaacat 14820 catccttgag agtcccatat attggttcta ccactgatga gagaacagac atgaagcttg 14880 ccttcgtaag agccccaagt cgatccttgc gatctgctgt tagaatagca acagtgtact 14940 catgggctta cggtgatgat gatagctctt ggaacgaagc ctggttgttg gctaggcaaa 15000 gggccaatgt gagcctggag gagctaaggg tgatcactcc catctcaact tcgactaatt 15060 tagcgcatag gttgagggat cgtagcactc aagtgaaata ctcaggtaca tcccttgtcc 15120 gagtggcgag gtataccaca atctccaacg acaatctctc atttgtcata tcagataaga 15180 aggttgatac taactttata taccaacaag gaatgcttct agggttgggt gttttagaaa 15240 cattgtttcg actcgagaaa gataccggat catctaacac ggtattacat cttcacgtcg 15300 aaacagattg ttgcgtgatc ccgatgatag atcatcccag gatacccagc tcccgcaagc 15360 tagagctgag ggcagagcta tgtaccaacc cattgatata tgataatgca cctttaattg 15420 acagagatgc aacaaggcta tacacccaga gccataggag gcaccttgtg gaatttgtta 15480 catggtccac accccaacta tatcacattt tagctaagtc cacagcacta tctatgattg 15540 acctggtaac aaaatttgag aaggaccata tgaatgaaat ttcagctctc ataggggatg 15600 acgatatcaa tagtttcata actgagtttc tgctcataga gccaagatta ttcactatct 15660 acttgggcca gtgtgcggcc atcaattggg catttgatgt acattatcat agaccatcag 15720 ggaaatatca gatgggtgag ctgttgtcat cgttcctttc tagaatgagc aaaggagtgt 15780 ttaaggtgct tgtcaatgct ctaagccacc caaagatcta caagaaattc tggcattgtg 15840 gtattataga gcctatccat ggtccttcac ttgatgctca aaacttgcac acaactgtgt 15900 gcaacatggt ttacacatgc tatatgacct acctcgacct gttgttgaat gaagagttag 15960 aagagttcac atttctcttg tgtgaaagcg acgaggatgt agtaccggac agattcgaca 16020 acatccaggc aaaacactta tgtgttctgg cagatttgta ctgtcaacca gggacctgcc 16080 caccaattcg aggtctaaga ccggtagaga aatgtgcagt tctaaccgac catatcaagg 16140 cagaggctat gttatctcca gcaggatctt cgtggaacat aaatccaatt attgtagacc 16200 attactcatg ctctctgact tatctccggc gaggatcgat caaacagata agattgagag 16260 ttgatccagg attcattttc gacgccctcg ctgaggtaaa tgtcagtcag ccaaagatcg 16320 gcagcaacaa catctcaaat atgagcatca aggctttcag acccccacac gatgatgttg 16380 caaaattgct caaagatatc aacacaagca agcacaatct tcccatttca gggggcaatc 16440 tcgccaatta tgaaatccat gctttccgca gaatcgggtt gaactcatct gcttgctaca 16500 aagctgttga gatatcaaca ttaattagga gatgccttga gccaggggag gacggcttgt 16560 tcttgggtga gggatcgggt tctatgttga tcacttataa agagatactt aaactaaaca 16620 agtgcttcta taatagtggg gtttccgcca attctagatc tggtcaaagg gaattagcac 16680 cctatccctc cgaagttggc cttgtcgaac acagaatggg agtaggtaat attgtcaaag 16740 tgctctttaa cgggaggccc gaagtcacgt gggtaggcag tgtagattgc ttcaatttca 16800 tagttagtaa tatccctacc tctagtgtgg ggtttatcca ttcagatata gagaccttgc 16860 ctgacaaaga tactatagag aagctagagg aattggcagc catcttatcg atggctctgc 16920 tcctgggcaa aataggatca atactggtga ttaagcttat gcctttcagc ggggattttg 16980 ttcagggatt tataagttat gtagggtctc attatagaga agtgaacctt gtatacccta 17040 gatacagcaa cttcatctct actgaatctt atttggttat gacagatctc aaggctaacc 17100 ggctaatgaa tcctgaaaag attaagcagc agataattga atcatctgtg aggacttcac 17160 ctggacttat aggtcacatc ctatccatta agcaactaag ctgcatacaa gcaattgtgg 17220 gagacgcagt tagtagaggt gatatcaatc ctactctgaa aaaacttaca cctatagagc 17280 aggtgctgat caattgcggg ttggcaatta acggacctaa gctgtgcaaa gaattgatcc 17340 accatgatgt tgcctcaggg caagatggat tgcttaattc tatactcatc ctctacaggg 17400 agttggcaag attcaaagac aaccaaagaa gtcaacaagg gatgttccac gcttaccccg 17460 tattggtaag tagcaggcaa cgagaactta tatctaggat cacccgcaaa ttctgggggc 17520 acattcttct ttactccggg aacaaaaagt tgataaataa gtttatccag aatctcaagt 17580 ccggctatct gatactagac ttacaccaga atatcttcgt taagaatcta tccaagtcag 17640 agaaacagat tattatgacg gggggtttga aacgtgagtg ggtttttaag gtaacagtca 17700 aggagaccaa agaatggtat aagttagtcg gatacagtgc cctgattaag gactaattgg 17760 ttgaactccg gaaccctaat cctgccctag gtggttaggc attatttgca atatattaaa 17820 gaaaactttg aaaatacgaa gtttctattc ccagctttgt ctggtggccg gcatggtccc 17880 agcctcctcg ctggcgccgg ctgggcaaca ttccgagggg accgtcccct cggtaatggc 17940 gaatgggacg cggccgatcc ggctgctaac aaagcccgaa aggaagctga gttggctgct 18000 gccaccgctg agcaataact agcataaccc cttggggcct ctaaacgggt cttgaggggt 18060 tttttgctga aaggaggaac tatatccgga tgcggccgcg ggccctatgg tacccagctt 18120 ttgttccctt tagtgagggt taattccgag cttggcgtaa tcatggtcat agctgtttcc 18180 tgtgtgaaat tgttatccgc tcacaattcc acacaacata ggagccggaa gcataaagtg 18240 taaagcctgg ggtgcctaat gagtgaggta actcacatta attgcgttgc gctcactgcc 18300 cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg 18360 gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc 18420 ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac 18480 agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa 18540 ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc ggcccccctg acgagcatca 18600 caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc 18660 gttcccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata 18720 cctgtccgcc tttctccctt cgggaagcgt ggcgctttct caatgctcac gctgtaggta 18780 tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca 18840 gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga 18900 cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg 18960 tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagga cagtatttgg 19020 tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg 19080 caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag 19140 aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa 19200 cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat 19260 ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt aaacttggtc 19320 tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc 19380 atccatagtt gcctgactgc ccgtcgtgta gataactacg atacgggagg gcttaccatc 19440 tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag atttatcagc 19500 aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc 19560 catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt 19620 gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc 19680 ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca tgttgtgaaa 19740 aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt 19800 atcactcatg cttatggcag cactgcataa ttctcttact gtcatgccat ccgtaagatg 19860 cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta tgcggcgacc 19920 gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca gaactttaaa 19980 agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct taccgctgtt 20040 gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat cttttacttt 20100 caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa agggaataag 20160 ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt gaagcattta 20220 tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa ataaacaaat 20280 aggggttccg cgcacatttc cccgaaaagt gccacctgaa attgtaaacg ttaatatttt 20340 gttaaaattc gcgttaaatt tttgttaaat cagctcattt tttaaccaat aggccgaaat 20400 cggcaaaatc ccttataaat caaaagaata gaccgagata gggttgagtg ttgttccagt 20460 ttggaacaag agtccactat taaagaacgt ggactccaac gtcaaagggc gaaaaaccgt 20520 ctatcagggc gatggcccac tacgtgaacc atcaccctaa tcaagttttt tggggtcgag 20580 gtgccgtaaa gcactaaatc ggaaccctaa agggagcccc cgatttagag cttgacgggg 20640 aaagccggcg aacgtggcga gaaaggaagg gaagaaagcg aaaggagcgg gcgctagggc 20700 gctggcaagt gtagcggtca cgctgcgcgt aaccaccaca cccgccgcgc ttaatgcgcc 20760 gctacagggc gcgtcccatt 20780 <210> 148 <211> 22826 <212> DNA <213> Artificial sequence <220> <223> pTM2-SF-2P-2a_SARS-CoV-2 (optimized sequence) <400> 148 tgtccgctaa tacgactcac tatagggcca actttgtttg gtctgatgag tccgtgagga 60 cgaaacccgg agtcccgggt caccaaacaa agttgggtaa ggatagttca atcaatgatc 120 atcttctagt gcacttagga ttcaagatcc tattatcagg gacaagagca ggattaggga 180 tatccgagat ggccacactt ttaaggagct tagcattgtt caaaagaaac aaggacaaac 240 cacccattac atcaggatcc ggtggagcca tcagaggaat caaacacatt attatagtac 300 caatccctgg agattcctca attaccactc gatccagact tctggaccgg ttggtgaggt 360 taattggaaa cccggatgtg agcgggccca aactaacagg ggcactaata ggtatattat 420 ccttatttgt ggagtctcca ggtcaattga ttcagaggat caccgatgac cctgacgtta 480 gcataaggct gttagaggtt gtccagagtg accagtcaca atctggcctt accttcgcat 540 caagaggtac caacatggag gatgaggcgg accaatactt ttcacatgat gatccaatta 600 gtagtgatca atccaggttc ggatggttcg ggaacaagga aatctcagat attgaagtgc 660 aagaccctga gggattcaac atgattctgg gtaccatcct agcccaaatt tgggtcttgc 720 tcgcaaaggc ggttacggcc ccagacacgg cagctgattc ggagctaaga aggtggataa 780 agtacaccca acaaagaagg gtagttggtg aatttagatt ggagagaaaa tggttggatg 840 tggtgaggaa caggattgcc gaggacctct ccttacgccg attcatggtc gctctaatcc 900 tggatatcaa gagaacaccc ggaaacaaac ccaggattgc tgaaatgata tgtgacattg 960 atacatatat cgtagaggca ggattagcca gttttatcct gactattaag tttgggatag 1020 aaactatgta tcctgctctt ggactgcatg aatttgctgg tgagttatcc acacttgagt 1080 ccttgatgaa cctttaccag caaatggggg aaactgcacc ctacatggta atcctggaga 1140 actcaattca gaacaagttc agtgcaggat cataccctct gctctggagc tatgccatgg 1200 gagtaggagt ggaacttgaa aactccatgg gaggtttgaa ctttggccga tcttactttg 1260 atccagcata ttttagatta gggcaagaga tggtaaggag gtcagctgga aaggtcagtt 1320 ccacattggc atctgaactc ggtatcactg ccgaggatgc aaggcttgtt tcagagattg 1380 caatgcatac tactgaggac aagatcagta gagcggttgg acccagacaa gcccaagtat 1440 catttctaca cggtgatcaa agtgagaatg agctaccgag attggggggc aaggaagata 1500 ggagggtcaa acagagtcga ggagaagcca gggagagcta cagagaaacc gggcccagca 1560 gagcaagtga tgcgagagct gcccatcttc caaccggcac acccctagac attgacactg 1620 caacggagtc cagccaagat ccgcaggaca gtcgaaggtc agctgacgcc ctgcttaggc 1680 tgcaagccat ggcaggaatc tcggaagaac aaggctcaga cacggacacc cctatagtgt 1740 acaatgacag aaatcttcta gactaggtgc gagaggccga gggccagaac aacatccgcc 1800 taccatccat cattgttata aaaaacttag gaaccaggtc cacacagccg ccagcccatc 1860 aaccatccac tcccacgatt ggagccaatg gcagaagagc aggcacgcca tgtcaaaaac 1920 ggactggaat gcatccgggc tctcaaggcc gagcccatcg gctcactggc catcgaggaa 1980 gctatggcag catggtcaga aatatcagac aacccaggac aggagcgagc cacctgcagg 2040 gaagagaagg caggcagttc gggtctcagc aaaccatgcc tctcagcaat tggatcaact 2100 gaaggcggtg cacctcgcat ccgcggtcag ggacctggag agagcgatga cgacgctgaa 2160 actttgggaa tccccccaag aaatctccag gcatcaagca ctgggttaca gtgttattac 2220 gtttatgatc acagcggtga agcggttaag ggaatccaag atgctgactc tatcatggtt 2280 caatcaggcc ttgatggtga tagcaccctc tcaggaggag acaatgaatc tgaaaacagc 2340 gatgtggata ttggcgaacc tgataccgag ggatatgcta tcactgaccg gggatctgct 2400 cccatctcta tggggttcag ggcttctgat gttgaaactg cagaaggagg ggagatccac 2460 gagctcctga gactccaatc cagaggcaac aactttccga agcttgggaa aactctcaat 2520 gttcctccgc ccccggaccc cggtagggcc agcacttccg ggacacccat taaaaagggc 2580 acagacgcga gattagcctc atttggaacg gagatcgcgt ctttattgac aggtggtgca 2640 acccaatgtg ctcgaaagtc accctcggaa ccatcagggc caggtgcacc tgcggggaat 2700 gtccccgagt gtgtgagcaa tgccgcactg atacaggagt ggacacccga atctggtacc 2760 acaatctccc cgagatccca gaataatgaa gaagggggag actattatga tgatgagctg 2820 ttctctgatg tccaagatat taaaacagcc ttggccaaaa tacacgagga taatcagaag 2880 ataatctcca agctagaatc actgctgtta ttgaagggag aagttgagtc aattaagaag 2940 cagatcaaca ggcaaaatat cagcatatcc accctggaag gacacctctc aagcatcatg 3000 atcgccattc ctggacttgg gaaggatccc aacgacccca ctgcagatgt cgaaatcaat 3060 cccgacttga aacccatcat aggcagagat tcaggccgag cactggccga agttctcaag 3120 aaacccgttg ccagccgaca actccaagga atgacaaatg gacggaccag ttccagagga 3180 cagctgctga aggaatttca gctaaagccg atcgggaaaa agatgagctc agccgtcggg 3240 tttgttcctg acaccggccc tgcatcacgc agtgtaatcc gctccattat aaaatccagc 3300 cggctagagg aggatcggaa gcgttacctg atgactctcc ttgatgatat caaaggagcc 3360 aatgatcttg ccaagttcca ccagatgctg atgaagataa taatgaagta gctacagctc 3420 aacttacctg ccaaccccat gccagtcgac ccaactagcc taccctccat cattgttata 3480 aaaaacttag gaaccaggtc cacacagccg ccagcccatc aacgcgtacg gccaccatgt 3540 tcgtctttct ggtattgctt cctctggtga gttcccagtg cgtgaacctg acgactcgga 3600 cacagctgcc gcctgcatac acaaacagct tcacacgagg tgtttactat ccggacaagg 3660 tgttccggtc ctctgtcttg cacagtactc aggacctttt tctgccattc tttagtaacg 3720 taacatggtt ccacgctatc catgtaagtg gaaccaatgg caccaagcgc ttcgacaatc 3780 cagtcctgcc tttcaacgat ggcgtctact tcgcctctac cgagaaatca aatattatta 3840 gagggtggat cttcgggacc acccttgata gcaagactca gagtcttctg atcgtgaaca 3900 atgctactaa cgtcgtcata aaagtatgtg aatttcagtt ctgcaatgac cccttcctgg 3960 gcgtgtacta tcacaaaaat aacaagtcct ggatggaatc cgagtttcgg gtatacagca 4020 gcgctaataa ctgtaccttc gaatatgtga gccagccatt cctgatggac ctggagggga 4080 agcagggcaa cttcaaaaac ctgagggaat tcgtgttcaa gaacattgac ggatacttca 4140 aaatctacag caagcacact ccaattaatc ttgttaggga ccttcctcag gggttctccg 4200 cgctggaacc cttggtggat ctgccaattg gtattaacat cacgaggttt caaaccctgc 4260 tcgccctcca ccggtcatac ctgaccccag gtgatagtag tagtggctgg acagcagggg 4320 ccgcagcata ctacgtcggc tacctccagc cccgcacatt cctgctgaag tataatgaaa 4380 acggtactat tacagatgct gtggactgcg cacttgatcc attgtccgag actaaatgca 4440 ccttgaagtc ttttaccgtt gagaagggaa tctatcagac cagtaatttc agagtgcaac 4500 ccaccgagag catcgtgcga tttcctaata ttacaaacct gtgccctttt ggcgaggtgt 4560 ttaacgccac tcgcttcgcg agcgtgtatg catggaaccg gaaaaggatt agcaactgcg 4620 tggctgatta ttcagtcctt tataatagtg cctctttcag tacgttcaaa tgctatggag 4680 tgtccccaac taagcttaac gatctgtgtt ttaccaacgt gtatgccgac tctttcgtca 4740 tcaggggcga cgaggttaga caaattgcgc ccggacagac aggcaaaatt gctgactaca 4800 attataaact gccagatgac tttacaggat gcgtgattgc ctggaacagc aacaaccttg 4860 attctaaggt gggcggaaac tacaactatc tgtacaggct gttccgcaaa tcaaacctga 4920 agccattcga aagggacatt tcaactgaga tctaccaggc cggatctaca ccttgcaacg 4980 gggtggaagg attcaactgc tacttcccgc tccagtcata tggctttcaa cctaccaatg 5040 gagtgggcta ccaaccttat cgagtagttg ttctctcttt cgagttgttg catgccccag 5100 ccactgtctg cggaccaaag aaatccacca atctggtgaa aaacaagtgc gtcaacttca 5160 acttcaatgg actcaccggt acaggggttc ttaccgagtc aaacaagaaa ttccttccgt 5220 ttcagcagtt tggacgcgat atcgccgaca ctacggatgc agtacgcgat cctcagacac 5280 ttgagatcct ggacatcact ccatgctctt ttggaggggt gtctgtcatc actcccggga 5340 cgaataccag taatcaggtc gccgtgctct atcaagatgt caactgcaca gaggtgccag 5400 tcgccattca cgccgatcag cttaccccta cttggcgagt atatagcaca gggtccaacg 5460 tgtttcagac aagggcgggt tgtctgatcg gcgctgagca cgtcaataat agctacgaat 5520 gtgacatccc tattggagcc gggatttgcg ctagctatca gactcagact aactcacccc 5580 ggcgagctag gtctgtagca agtcagagta tcatagccta tactatgagc ctgggggcag 5640 aaaattctgt cgcttatagt aataacagta ttgcaattcc tactaacttc actattagcg 5700 tgactacaga aattctgcca gtgagcatga ccaagacctc cgtcgactgt accatgtata 5760 tctgcggaga cagcacagaa tgcagcaacc tgcttctgca gtacggtagc ttttgtaccc 5820 agctgaacag ggcactgacc ggcatcgctg tggaacagga caaaaatacg caggaggtgt 5880 tcgctcaggt caagcagatt tataagacac ccccaataaa agacttcggc ggctttaact 5940 tctcccagat cctgcccgat ccgtcaaaac cttccaagag aagttttatc gaggatctgc 6000 tgtttaacaa agtaacattg gctgatgctg gctttattaa acagtacggc gattgtctgg 6060 gagatatcgc cgctagagat ctgatctgcg ctcaaaaatt taatggcctc actgtattgc 6120 cccccctgct gacggatgaa atgattgccc aatacacatc agccctgctg gctgggacaa 6180 tcacttccgg ctggacgttc ggtgctggag ctgctcttca aattccattt gccatgcaaa 6240 tggcttatag attcaacgga attggcgtga cccaaaacgt gctgtacgaa aatcaaaagc 6300 tgattgctaa tcagtttaac tccgctatcg gtaagataca ggacagcctg tctagtactg 6360 ccagcgccct cggaaagctc caggatgtgg tgaaccagaa tgcgcaggcg ctgaacacac 6420 tcgtcaaaca gcttagcagc aatttcggcg caattagcag tgtactgaac gacatcttgt 6480 ctcggctcga cccaccagag gccgaagtgc agattgatcg cctgatcact ggccggctcc 6540 agtctctgca gacctacgta acccagcaac tcatacgcgc tgccgaaatt cgggcttcag 6600 ctaacctggc cgcaacaaag atgtctgaat gtgttcttgg gcagtccaag agggtggact 6660 tctgcgggaa aggatatcac ctgatgtcct tccctcagag cgcccctcat ggagtggtgt 6720 ttcttcatgt tacctatgtt ccggcccagg aaaagaattt taccactgcc ccagccattt 6780 gccatgatgg taaagcacac ttcccaagag agggcgtgtt tgttagtaac ggcacccact 6840 ggttcgttac ccagcgcaat ttttacgaac ctcaaatcat taccactgac aatacatttg 6900 tatcaggcaa ttgcgacgtg gtgatcggaa tcgtaaataa tacagtctac gatcccctgc 6960 agccagagct tgacagcttt aaagaggaac tggacaaata cttcaaaaat catacaagcc 7020 ccgacgtcga cctgggagat atttctggca tcaatgcctc cgtcgtgaat atccaaaaag 7080 agatcgaccg ccttaatgag gttgccaaaa acctcaacga gtccctgatt gatctgcagg 7140 agctggggaa gtacgagcag tatatcaaat ggccctggta catctggctg ggcttcattg 7200 ccgggctcat agccatcgtg atggtgacga tcatgctgtg ttgcatgacc tcttgctgtt 7260 cttgtctgaa ggggtgctgc tcttgtggga gttgttgtaa attcgatgag gatgattccg 7320 aacctgtgct gaagggagtc gcgctcgcct atacgtaagc gcgcagcgct tagacgtctc 7380 gcgatcgata ctagtacaac ctaaatccat tataaaaaac ttaggagcaa agtgattgcc 7440 tcccaaggtc cacaatgaca gagacctacg acttcgacaa gtcggcatgg gacatcaaag 7500 ggtcgatcgc tccgatacaa cccaccacct acagtgatgg caggctggtg ccccaggtca 7560 gagtcataga tcctggtcta ggcgacagga aggatgaatg ctttatgtac atgtttctgc 7620 tgggggttgt tgaggacagc gattccctag ggcctccaat cgggcgagca tttgggttcc 7680 tgcccttagg tgttggcaga tccacagcaa agcccgaaaa actcctcaaa gaggccactg 7740 agcttgacat agttgttaga cgtacagcag ggctcaatga aaaactggtg ttctacaaca 7800 acaccccact aactctcctc acaccttgga gaaaggtcct aacaacaggg agtgtcttca 7860 acgcaaacca agtgtgcaat gcggttaatc tgataccgct cgataccccg cagaggttcc 7920 gtgttgttta tatgagcatc acccgtcttt cggataacgg gtattacacc gttcctagaa 7980 gaatgctgga attcagatcg gtcaatgcag tggccttcaa cctgctggtg acccttagga 8040 ttgacaaggc gataggccct gggaagatca tcgacaatac agagcaactt cctgaggcaa 8100 catttatggt ccacatcggg aacttcagga gaaagaagag tgaagtctac tctgccgatt 8160 attgcaaaat gaaaatcgaa aagatgggcc tggtttttgc acttggtggg atagggggca 8220 ccagtcttca cattagaagc acaggcaaaa tgagcaagac tctccatgca caactcgggt 8280 tcaagaagac cttatgttac ccgctgatgg atatcaatga agaccttaat cgattactct 8340 ggaggagcag atgcaagata gtaagaatcc aggcagtttt gcagccatca gttcctcaag 8400 aattccgcat ttacgacgac gtgatcataa atgatgacca aggactattc aaagttctgt 8460 agaccgtagt gcccagcaat gcccgaaaac gacccccctc acaatgacag ccagaaggcc 8520 cggacaaaaa agccccctcc gaaagactcc acggaccaag cgagaggcca gccagcagcc 8580 gacggcaagc gcgaacacca ggcggcccca gcacagaaca gccctgacac aaggccacca 8640 ccagccaccc caatctgcat cctcctcgtg ggacccccga ggaccaaccc ccaaggctgc 8700 ccccgatcca aaccaccaac cgcatcccca ccacccccgg gaaagaaacc cccagcaatt 8760 ggaaggcccc tccccctctt cctcaacaca agaactccac aaccgaaccg cacaagcgac 8820 cgaggtgacc caaccgcagg catccgactc cctagacaga tcctctctcc ccggcaaact 8880 aaacaaaact tagggccaag gaacatacac acccaacaga acccagaccc cggcccacgg 8940 cgccgcgccc ccaacccccg acaaccagag ggagccccca accaatcccg ccggctcccc 9000 cggtgcccac aggcagggac accaaccccc gaacagaccc agcacccaac catcgacaat 9060 ccaagacggg ggggcccccc caaaaaaagg cccccagggg ccgacagcca gcaccgcgag 9120 gaagcccacc caccccacac acgaccacgg caaccaaacc agaacccaga ccaccctggg 9180 ccaccagctc ccagactcgg ccatcacccc gcagaaagga aaggccacaa cccgcgcacc 9240 ccagccccga tccggcgggg agccacccaa cccgaaccag cacccaagag cgatccccga 9300 aggacccccg aaccgcaaag gacatcagta tcccacagcc tctccaagtc ccccggtctc 9360 ctcctcttct cgaagggacc aaaagatcaa tccaccacac ccgacgacac tcaactcccc 9420 acccctaaag gagacaccgg gaatcccaga atcaagactc atccaatgtc catcatgggt 9480 ctcaaggtga acgtctctgc catattcatg gcagtactgt taactctcca aacacccacc 9540 ggtcaaatcc attggggcaa tctctctaag ataggggtgg taggaatagg aagtgcaagc 9600 tacaaagtta tgactcgttc cagccatcaa tcattagtca taaaattaat gcccaatata 9660 actctcctca ataactgcac gagggtagag attgcagaat acaggagact actgagaaca 9720 gttttggaac caattagaga tgcacttaat gcaatgaccc agaatataag accggttcag 9780 agtgtagctt caagtaggag acacaagaga tttgcgggag tagtcctggc aggtgcggcc 9840 ctaggcgttg ccacagctgc tcagataaca gccggcattg cacttcacca gtccatgctg 9900 aactctcaag ccatcgacaa tctgagagcg agcctggaaa ctactaatca ggcaattgag 9960 acaatcagac aagcagggca ggagatgata ttggctgttc agggtgtcca agactacatc 10020 aataatgagc tgataccgtc tatgaaccaa ctatcttgtg atttaatcgg ccagaagctc 10080 gggctcaaat tgctcagata ctatacagaa atcctgtcat tatttggccc cagtttacgg 10140 gaccccatat ctgcggagat atctatccag gctttgagct atgcgcttgg aggagacatc 10200 aataaggtgt tagaaaagct cggatacagt ggaggtgatt tactgggcat cttagagagc 10260 ggaggaataa aggcccggat aactcacgtc gacacagagt cctacttcat tgtcctcagt 10320 atagcctatc cgacgctgtc cgagattaag ggggtgattg tccaccggct agagggggtc 10380 tcgtacaaca taggctctca agagtggtat accactgtgc ccaagtatgt tgcaacccaa 10440 gggtacctta tctcgaattt tgatgagtca tcgtgtactt tcatgccaga ggggactgtg 10500 tgcagccaaa atgccttgta cccgatgagt cctctgctcc aagaatgcct ccgggggtac 10560 accaagtcct gtgctcgtac actcgtatcc gggtcttttg ggaaccggtt cattttatca 10620 caagggaacc taatagccaa ttgtgcatca atcctttgca agtgttacac aacaggaacg 10680 atcattaatc aagaccctga caagatccta acatacattg ctgccgatca ctgcccggta 10740 gtcgaggtga acggcgtgac catccaagtc gggagcagga ggtatccaga cgctgtgtac 10800 ttgcacagaa ttgacctcgg tcctcccata tcattggaga ggttggacgt agggacaaat 10860 ctggggaatg caattgctaa gttggaggat gccaaggaat tgttggagtc atcggaccag 10920 atattgagga gtatgaaagg tttatcgagc actagcatag tctacatcct gattgcagtg 10980 tgtcttggag ggttgatagg gatccccgct ttaatatgtt gctgcagggg gcgttgtaac 11040 aaaaagggag aacaagttgg tatgtcaaga ccaggcctaa agcctgatct tacgggaaca 11100 tcaaaatcct atgtaaggtc gctctgatcc tctacaactc ttgaaacaca aatgtcccac 11160 aagtctcctc ttcgtcatca agcaaccacc gcacccagca tcaagcccac ctgaaattat 11220 ctccggcttc cctctggccg aacaatatcg gtagttaatc aaaacttagg gtgcaagatc 11280 atccacaatg tcaccacaac gagaccggat aaatgccttc tacaaagata acccccatcc 11340 caagggaagt aggatagtca ttaacagaga acatcttatg attgatagac cttatgtttt 11400 gctggctgtt ctgtttgtca tgtttctgag cttgatcggg ttgctagcca ttgcaggcat 11460 tagacttcat cgggcagcca tctacaccgc agagatccat aaaagcctca gcaccaatct 11520 agatgtaact aactcaatcg agcatcaggt caaggacgtg ctgacaccac tcttcaaaat 11580 catcggtgat gaagtgggcc tgaggacacc tcagagattc actgacctag tgaaattaat 11640 ctctgacaag attaaattcc ttaatccgga tagggagtac gacttcagag atctcacttg 11700 gtgtatcaac ccgccagaga gaatcaaatt ggattatgat caatactgtg cagatgtggc 11760 tgctgaagag ctcatgaatg cattggtgaa ctcaactcta ctggagacca gaacaaccaa 11820 tcagttccta gctgtctcaa agggaaactg ctcagggccc actacaatca gaggtcaatt 11880 ctcaaacatg tcgctgtccc tgttagactt gtatttaggt cgaggttaca atgtgtcatc 11940 tatagtcact atgacatccc agggaatgta tgggggaact tacctagtgg aaaagcctaa 12000 tctgagcagc aaaaggtcag agttgtcaca actgagcatg taccgagtgt ttgaagtagg 12060 tgttatcaga aatccgggtt tgggggctcc ggtgttccat atgacaaact atcttgagca 12120 accagtcagt aatgatctca gcaactgtat ggtggctttg ggggagctca aactcgcagc 12180 cctttgtcac ggggaagatt ctatcacaat tccctatcag ggatcaggga aaggtgtcag 12240 cttccagctc gtcaagctag gtgtctggaa atccccaacc gacatgcaat cctgggtccc 12300 cttatcaacg gatgatccag tgatagacag gctttacctc tcatctcaca gaggtgttat 12360 cgctgacaat caagcaaaat gggctgtccc gacaacacga acagatgaca agttgcgaat 12420 ggagacatgc ttccaacagg cgtgtaaggg taaaatccaa gcactctgcg agaatcccga 12480 gtgggcacca ttgaaggata acaggattcc ttcatacggg gtcttgtctg ttgatctgag 12540 tctgacagtt gagcttaaaa tcaaaattgc ttcgggattc gggccattga tcacacacgg 12600 ttcagggatg gacctataca aatccaacca caacaatgtg tattggctga ctatcccgcc 12660 aatgaagaac ctagccttag gtgtaatcaa cacattggag tggataccga gattcaaggt 12720 tagtccctac ctcttcactg tcccaattaa ggaagcaggc gaagactgcc atgccccaac 12780 atacctacct gcggaggtgg atggtgatgt caaactcagt tccaatctgg tgattctacc 12840 tggtcaagat ctccaatatg ttttggcaac ctacgatact tccagggttg aacatgctgt 12900 ggtttattac gtttacagcc caagccgctc attttcttac ttttatcctt ttaggttgcc 12960 tataaagggg gtccccatcg aattacaagt ggaatgcttc acatgggacc aaaaactctg 13020 gtgccgtcac ttctgtgtgc ttgcggactc agaatctggt ggacatatca ctcactctgg 13080 gatggtgggc atgggagtca gctgcacagt cacccgggaa gatggaacca atcgcagata 13140 gggctgctag tgaaccaatc acatgatgtc acccagacat caggcatacc cactagtgtg 13200 aaatagacat cagaattaag aaaaacgtag ggtccaagtg gttccccgtt atggactcgc 13260 tatctgtcaa ccagatctta taccctgaag ttcacctaga tagcccgata gttaccaata 13320 agatagtagc catcctggag tatgctcgag tccctcacgc ttacagcctg gaggacccta 13380 cactgtgtca gaacatcaag caccgcctaa aaaacggatt ttccaaccaa atgattataa 13440 acaatgtgga agttgggaat gtcatcaagt ccaagcttag gagttatccg gcccactctc 13500 atattccata tccaaattgt aatcaggatt tatttaacat agaagacaaa gagtcaacga 13560 ggaagatccg tgaactcctc aaaaagggga attcgctgta ctccaaagtc agtgataagg 13620 ttttccaatg cttaagggac actaactcac ggcttggcct aggctccgaa ttgagggagg 13680 acatcaagga gaaagttatt aacttgggag tttacatgca cagctcccag tggtttgagc 13740 cctttctgtt ttggtttaca gtcaagactg agatgaggtc agtgattaaa tcacaaaccc 13800 atacttgcca taggaggaga cacacacctg tattcttcac tggtagttca gttgagttgc 13860 taatctctcg tgaccttgtt gctataatca gtaaagagtc tcaacatgta tattacctga 13920 catttgaact ggttttgatg tattgtgatg tcatagaggg gaggttaatg acagagaccg 13980 ctatgactat tgatgctagg tatacagagc ttctaggaag agtcagatac atgtggaaac 14040 tgatagatgg tttcttccct gcactcggga atccaactta tcaaattgta gccatgctgg 14100 agcctctttc acttgcttac ctgcagctga gggatataac agtagaactc agaggtgctt 14160 tccttaacca ctgctttact gaaatacatg atgttcttga ccaaaacggg ttttctgatg 14220 aaggtactta tcatgagtta actgaagctc tagattacat tttcataact gatgacatac 14280 atctgacagg ggagattttc tcatttttca gaagtttcgg ccaccccaga cttgaagcag 14340 taacggctgc tgaaaatgtt aggaaataca tgaatcagcc taaagtcatt gtgtatgaga 14400 ctctgatgaa aggtcatgcc atattttgtg gaatcataat caacggctat cgtgacaggc 14460 acggaggcag ttggccaccg ctgaccctcc ccctgcatgc tgcagacaca atccggaatg 14520 ctcaagcttc aggtgaaggg ttaacacatg agcagtgcgt tgataactgg aaatcttttg 14580 ctggagtgaa atttggctgc tttatgcctc ttagcctgga tagtgatctg acaatgtacc 14640 taaaggacaa ggcacttgct gctctccaaa gggaatggga ttcagtttac ccgaaagagt 14700 tcctgcgtta cgaccctccc aagggaaccg ggtcacggag gcttgtagat gttttcctta 14760 atgattcgag ctttgaccca tatgatgtga taatgtatgt tgtaagtgga gcttacctcc 14820 atgaccctga gttcaacctg tcttacagcc tgaaagaaaa ggagatcaag gaaacaggta 14880 gactttttgc taaaatgact tacaaaatga gggcatgcca agtgattgct gaaaatctaa 14940 tctcaaacgg gattggcaaa tattttaagg acaatgggat ggccaaggat gagcacgatt 15000 tgactaaggc actccacact ctagctgtct caggagtccc caaagatctc aaagaaagtc 15060 acaggggggg gccagtctta aaaacctact cccgaagccc agtccacaca agtaccagga 15120 acgtgagagc agcaaaaggg tttatagggt tccctcaagt aattcggcag gaccaagaca 15180 ctgatcatcc ggagaatatg gaagcttacg agacagtcag tgcatttatc acgactgatc 15240 tcaagaagta ctgccttaat tggagatatg agaccatcag cttgtttgca cagaggctaa 15300 atgagattta cggattgccc tcatttttcc agtggctgca taagaggctt gagacctctg 15360 tcctgtatgt aagtgaccct cattgccccc ccgaccttga cgcccatatc ccgttatata 15420 aagtccccaa tgatcaaatc ttcattaagt accctatggg aggtatagaa gggtattgtc 15480 agaagctgtg gaccatcagc accattccct atctatacct ggctgcttat gagagcggag 15540 taaggattgc ttcgttagtg caaggggaca atcagaccat agccgtaaca aaaagggtac 15600 ccagcacatg gccctacaac cttaagaaac gggaagctgc tagagtaact agagattact 15660 ttgtaattct taggcaaagg ctacatgata ttggccatca cctcaaggca aatgagacaa 15720 ttgtttcatc acattttttt gtctattcaa aaggaatata ttatgatggg ctacttgtgt 15780 cccaatcact caagagcatc gcaagatgtg tattctggtc agagactata gttgatgaaa 15840 caagggcagc atgcagtaat attgctacaa caatggctaa aagcatcgag agaggttatg 15900 accgttacct tgcatattcc ctgaacgtcc taaaagtgat acagcaaatt ctgatctctc 15960 ttggcttcac aatcaattca accatgaccc gggatgtagt catacccctc ctcacaaaca 16020 acgacctctt aataaggatg gcactgttgc ccgctcctat tggggggatg aattatctga 16080 atatgagcag gctgtttgtc agaaacatcg gtgatccagt aacatcatca attgctgatc 16140 tcaagagaat gattctcgcc tcactaatgc ctgaagagac cctccatcaa gtaatgacac 16200 aacaaccggg ggactcttca ttcctagact gggctagcga cccttactca gcaaatcttg 16260 tatgtgtcca gagcatcact agactcctca agaacataac tgcaaggttt gtcctgatcc 16320 atagtccaaa cccaatgtta aaaggattat tccatgatga cagtaaagaa gaggacgagg 16380 gactggcggc attcctcatg gacaggcata ttatagtacc tagggcagct catgaaatcc 16440 tggatcatag tgtcacaggg gcaagagagt ctattgcagg catgctggat accacaaaag 16500 gcttgattcg agccagcatg aggaaggggg ggttaacctc tcgagtgata accagattgt 16560 ccaattatga ctatgaacaa ttcagagcag ggatggtgct attgacagga agaaagagaa 16620 atgtcctcat tgacaaagag tcatgttcag tgcagctggc gagagctcta agaagccata 16680 tgtgggcgag gctagctcga ggacggccta tttacggcct tgaggtccct gatgtactag 16740 aatctatgcg aggccacctt attcggcgtc atgagacatg tgtcatctgc gagtgtggat 16800 cagtcaacta cggatggttt tttgtcccct cgggttgcca actggatgat attgacaagg 16860 aaacatcatc cttgagagtc ccatatattg gttctaccac tgatgagaga acagacatga 16920 agcttgcctt cgtaagagcc ccaagtcgat ccttgcgatc tgctgttaga atagcaacag 16980 tgtactcatg ggcttacggt gatgatgata gctcttggaa cgaagcctgg ttgttggcta 17040 ggcaaagggc caatgtgagc ctggaggagc taagggtgat cactcccatc tcaacttcga 17100 ctaatttagc gcataggttg agggatcgta gcactcaagt gaaatactca ggtacatccc 17160 ttgtccgagt ggcgaggtat accacaatct ccaacgacaa tctctcattt gtcatatcag 17220 ataagaaggt tgatactaac tttatatacc aacaaggaat gcttctaggg ttgggtgttt 17280 tagaaacatt gtttcgactc gagaaagata ccggatcatc taacacggta ttacatcttc 17340 acgtcgaaac agattgttgc gtgatcccga tgatagatca tcccaggata cccagctccc 17400 gcaagctaga gctgagggca gagctatgta ccaacccatt gatatatgat aatgcacctt 17460 taattgacag agatgcaaca aggctataca cccagagcca taggaggcac cttgtggaat 17520 ttgttacatg gtccacaccc caactatatc acattttagc taagtccaca gcactatcta 17580 tgattgacct ggtaacaaaa tttgagaagg accatatgaa tgaaatttca gctctcatag 17640 gggatgacga tatcaatagt ttcataactg agtttctgct catagagcca agattattca 17700 ctatctactt gggccagtgt gcggccatca attgggcatt tgatgtacat tatcatagac 17760 catcagggaa atatcagatg ggtgagctgt tgtcatcgtt cctttctaga atgagcaaag 17820 gagtgtttaa ggtgcttgtc aatgctctaa gccacccaaa gatctacaag aaattctggc 17880 attgtggtat tatagagcct atccatggtc cttcacttga tgctcaaaac ttgcacacaa 17940 ctgtgtgcaa catggtttac acatgctata tgacctacct cgacctgttg ttgaatgaag 18000 agttagaaga gttcacattt ctcttgtgtg aaagcgacga ggatgtagta ccggacagat 18060 tcgacaacat ccaggcaaaa cacttatgtg ttctggcaga tttgtactgt caaccaggga 18120 cctgcccacc aattcgaggt ctaagaccgg tagagaaatg tgcagttcta accgaccata 18180 tcaaggcaga ggctatgtta tctccagcag gatcttcgtg gaacataaat ccaattattg 18240 tagaccatta ctcatgctct ctgacttatc tccggcgagg atcgatcaaa cagataagat 18300 tgagagttga tccaggattc attttcgacg ccctcgctga ggtaaatgtc agtcagccaa 18360 agatcggcag caacaacatc tcaaatatga gcatcaaggc tttcagaccc ccacacgatg 18420 atgttgcaaa attgctcaaa gatatcaaca caagcaagca caatcttccc atttcagggg 18480 gcaatctcgc caattatgaa atccatgctt tccgcagaat cgggttgaac tcatctgctt 18540 gctacaaagc tgttgagata tcaacattaa ttaggagatg ccttgagcca ggggaggacg 18600 gcttgttctt gggtgaggga tcgggttcta tgttgatcac ttataaagag atacttaaac 18660 taaacaagtg cttctataat agtggggttt ccgccaattc tagatctggt caaagggaat 18720 tagcacccta tccctccgaa gttggccttg tcgaacacag aatgggagta ggtaatattg 18780 tcaaagtgct ctttaacggg aggcccgaag tcacgtgggt aggcagtgta gattgcttca 18840 atttcatagt tagtaatatc cctacctcta gtgtggggtt tatccattca gatatagaga 18900 ccttgcctga caaagatact atagagaagc tagaggaatt ggcagccatc ttatcgatgg 18960 ctctgctcct gggcaaaata ggatcaatac tggtgattaa gcttatgcct ttcagcgggg 19020 attttgttca gggatttata agttatgtag ggtctcatta tagagaagtg aaccttgtat 19080 accctagata cagcaacttc atctctactg aatcttattt ggttatgaca gatctcaagg 19140 ctaaccggct aatgaatcct gaaaagatta agcagcagat aattgaatca tctgtgagga 19200 cttcacctgg acttataggt cacatcctat ccattaagca actaagctgc atacaagcaa 19260 ttgtgggaga cgcagttagt agaggtgata tcaatcctac tctgaaaaaa cttacaccta 19320 tagagcaggt gctgatcaat tgcgggttgg caattaacgg acctaagctg tgcaaagaat 19380 tgatccacca tgatgttgcc tcagggcaag atggattgct taattctata ctcatcctct 19440 acagggagtt ggcaagattc aaagacaacc aaagaagtca acaagggatg ttccacgctt 19500 accccgtatt ggtaagtagc aggcaacgag aacttatatc taggatcacc cgcaaattct 19560 gggggcacat tcttctttac tccgggaaca aaaagttgat aaataagttt atccagaatc 19620 tcaagtccgg ctatctgata ctagacttac accagaatat cttcgttaag aatctatcca 19680 agtcagagaa acagattatt atgacggggg gtttgaaacg tgagtgggtt tttaaggtaa 19740 cagtcaagga gaccaaagaa tggtataagt tagtcggata cagtgccctg attaaggact 19800 aattggttga actccggaac cctaatcctg ccctaggtgg ttaggcatta tttgcaatat 19860 attaaagaaa actttgaaaa tacgaagttt ctattcccag ctttgtctgg tggccggcat 19920 ggtcccagcc tcctcgctgg cgccggctgg gcaacattcc gaggggaccg tcccctcggt 19980 aatggcgaat gggacgcggc cgatccggct gctaacaaag cccgaaagga agctgagttg 20040 gctgctgcca ccgctgagca ataactagca taaccccttg gggcctctaa acgggtcttg 20100 aggggttttt tgctgaaagg aggaactata tccggatgcg gccgcgggcc ctatggtacc 20160 cagcttttgt tccctttagt gagggttaat tccgagcttg gcgtaatcat ggtcatagct 20220 gtttcctgtg tgaaattgtt atccgctcac aattccacac aacataggag ccggaagcat 20280 aaagtgtaaa gcctggggtg cctaatgagt gaggtaactc acattaattg cgttgcgctc 20340 actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg 20400 cgcggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca ctgactcgct 20460 gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt 20520 atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc 20580 caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctcggcc cccctgacga 20640 gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata 20700 ccaggcgttc ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac 20760 cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcaat gctcacgctg 20820 taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc 20880 cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag 20940 acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt 21000 aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt 21060 atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg 21120 atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac 21180 gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca 21240 gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac 21300 ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac 21360 ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt 21420 tcgttcatcc atagttgcct gactgcccgt cgtgtagata actacgatac gggagggctt 21480 accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg ctccagattt 21540 atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc 21600 cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa 21660 tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg 21720 tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt 21780 gtgaaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta agttggccgc 21840 agtgttatca ctcatgctta tggcagcact gcataattct cttactgtca tgccatccgt 21900 aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat agtgtatgcg 21960 gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac atagcagaac 22020 tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa ggatcttacc 22080 gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt cagcatcttt 22140 tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg 22200 aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat attattgaag 22260 catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa 22320 acaaataggg gttccgcgca catttccccg aaaagtgcca cctgaaattg taaacgttaa 22380 tattttgtta aaattcgcgt taaatttttg ttaaatcagc tcatttttta accaataggc 22440 cgaaatcggc aaaatccctt ataaatcaaa agaatagacc gagatagggt tgagtgttgt 22500 tccagtttgg aacaagagtc cactattaaa gaacgtggac tccaacgtca aagggcgaaa 22560 aaccgtctat cagggcgatg gcccactacg tgaaccatca ccctaatcaa gttttttggg 22620 gtcgaggtgc cgtaaagcac taaatcggaa ccctaaaggg agcccccgat ttagagcttg 22680 acggggaaag ccggcgaacg tggcgagaaa ggaagggaag aaagcgaaag gagcgggcgc 22740 tagggcgctg gcaagtgtag cggtcacgct gcgcgtaacc accacacccg ccgcgcttaa 22800 tgcgccgcta cagggcgcgt cccatt 22826 <210> 149 <211> 5 <212> PRT <213> Artificial sequence <220> <223> Endoplasmic reticulum retrieval signal (ERRS) motif <220> <221> misc_feature <222> (2)..(2) <223> Xaa can be any naturally occuring amino acid <220> <221> misc_feature <222> (4)..(4) <223> Xaa can be any naturally occuring amino acid <220> <221> misc_feature <222> (5)..(5) <223> Xaa can be any naturally occuring amino acid <400> 149 Lys Xaa His Xaa Xaa 1 5 <210> 150 <211> 5 <212> PRT <213> Artificial sequence <220> <223> KLHYT motif <400> 150 Lys Leu His Tyr Thr 1 5

Claims (63)

  1. 핵산 작제물로서:
    (1) 홍역 바이러스(MV)의 약독화된 균주의 전장, 안티게놈(+) RNA 가닥을 암호화하는 cDNA 분자; 및
    (2) 제1 이종 폴리뉴클레오티드로서,
    (a) 서열번호 3의 SARS-CoV-2의 스파이크(S) 단백질, 또는
    (b) 서열번호 11의 S1 폴리펩티드, 서열번호 13의 S2 폴리펩티드, 서열번호 7의 Secto 폴리펩티드, 및 서열번호 16의 tri-Secto 폴리펩티드로 이루어진 군으로부터 선택된 (a)의 전장 S 단백질의 면역원성 단편, 또는
    (c) 1 내지 10개의 아미노산이 삽입, 치환 또는 결실에 의해 변형되어 있는 (a) 또는 (b)의 변이체,
    를 암호화하는 제1 이종 폴리뉴클레오티드;
    를 포함하는, 핵산 작제물.
  2. 제1항에 있어서,
    상기 (c)의 변이체는:
    (i) 발현된 전장 S 단백질을 이의 융합전 형태로 유지하는 돌연변이, 및/또는
    (ii) S 단백질의 푸린 절단 부위를 불활성화시키는 돌연변이, 및/또는
    (iii) 소포체 검색 신호(EERS)를 불활성화하는 돌연변이, 및/또는
    (iv) S 단백질의 S1 도메인에 국한된 수용체-결합 도메인(RBD)을 폐쇄 형태로 유지하는 돌연변이,를 포함하는 폴리펩티드를 암호화하며,
    상기 제1 이종 폴리뉴클레오티드는 MV(ATU2)의 P 유전자와 M 유전자 사이에 위치한 추가 전사 단위(ATU)에 위치하거나 또는 MV(ATU3)의 H 유전자의 하류에 위치한 ATU에 위치하는, 핵산 작제물.
  3. 제2항에 있어서,
    (i) 발현된 전장 S 단백질을 이의 융합전 형태로 유지하는 돌연변이는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 986 및 987(K986P 및 V987P)에 있는 2개의 프롤린 잔기의 치환에 의한 돌연변이, 또는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 817, 892, 899, 942, 986 및 987(F817P, A892P, A899P, A942P, K986P 및 V987P)에서 6개의 프롤린 잔기의 치환에 의한 돌연변이이고, 및/또는
    (ii) S 단백질의 푸린 절단 부위를 불활성화시키는 돌연변이는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 682, 683 및 685(R682G, R683S 및 R685G)에서의 S1/S2 푸린 절단 부위에서 발생하는 3개의 아미노산 잔기의 치환에 의한 돌연변이, 또는 서열번호 3의 SARS-CoV-2의 S 단백질의 위치 675에서의 아미노산과 위치 685 에서의 아미노산 사이의 아미노산 사이에 S1/S2 푸린 절단 부위를 포함하고 서열번호 50의 아미노산 서열 QTQTNSPRRAR로 이루어진 루프의 결실에 의한 돌연변이이고, 및/또는
    (iii) EERS를 불활성화시키는 돌연변이는 서열번호 3의 아미노산 서열의 위치 1269 및 1271에서의 2개의 알라닌 잔기의 치환에 의한 돌연변이이고, 및/또는
    (iv) S 단백질의 S1 도메인에 국한된 RBD를 폐쇄 형태로 유지하는 돌연변이는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 383 및 985(S383C 및 D985C)에서 2개의 시스테인 잔기의 치환에 의한 돌연변이, 또는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 413 및 987(G413C 및 P987C)에서 2개의 시스테인 잔기의 치환에 의한 돌연변이이고, 및/또는
    (v) (c)의 변이체는, 서열번호 3의 아미노산 서열의 위치 69 및 70의 아미노산 잔기의 결실, 서열번호 3의 아미노산 서열의 위치 144 및 145의 아미노산 잔기의 결실로 이루어진 군에서 선택되는 돌연변이, 서열번호 3의 아미노산 서열의 위치 501의 티로신 잔기의 치환에 의한 돌연변이(N501Y), 서열번호 3의 아미노산 서열의 위치 570의 아스파라긴산 잔기의 치환에 의한 돌연변이(A570D), 서열번호 3의 아미노산 서열의 위치 681의 히스티딘 잔기의 치환에 의한 돌연변이(P681H), 서열번호 3의 아미노산 서열의 위치 716의 이소류신 잔기의 치환에 의한 돌연변이(T716I), 서열번호 3의 아미노산 서열의 위치 982의 알라닌 잔기의 치환에 의한 돌연변이(S982A), 서열번호 3의 아미노산 서열의 위치 1118의 히스티딘 잔기의 치환에 의한 돌연변이(D1118H), 서열번호 3의 아미노산 서열의 위치 484의 라이신 잔기의 치환에 의한 돌연변이(E484K), 서열번호 3의 아미노산 서열의 위치 417의 아스파라긴 잔기의 치환에 의한 돌연변이(K417N), 서열번호 3의 아미노산 서열의 위치 417의 트레오닌 잔기의 치환에 의한 돌연변이(K417T), 및 서열번호 3의 아미노산 서열의 위치 614의 글리신 잔기의 치환에 의한 변이(D614G)를 포함하는 폴리펩티드를 암호화하는, 핵산 작제물.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서,
    뉴클레오캡시드(N) 폴리펩티드 또는 N 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체, 기질(matrix) (M) 폴리펩티드 또는 M 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체, E 폴리펩티드 또는 E 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체, 8a 폴리펩티드 또는 8a 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체, 7a 폴리펩티드 또는 7a 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체, 3A 폴리펩티드 또는 3a 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체, 및 이의 면역원성 단편으로 이루어진 군으로부터 선택된 SARS-CoV-2의 적어도 하나의 폴리펩티드를 암호화하는 제2 이종 폴리뉴클레오티드를 추가로 포함하고, 상기 제2 이종 폴리뉴클레오티드는 제1 이종 폴리뉴클레오티드의 ATU와 상이한 위치에서 추가의 전사 단위(ATU) 내에 위치되는, 핵산 작제물.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 제1 이종 폴리뉴클레오티드는 서열번호 5, 7, 9, 15, 17, 19, 43, 45, 47, 49, 52, 54, 56, 58, 60, 62 및 65로 이루어진 군으로부터 선택된 아미노산 서열을 갖는 폴리펩티드를 암호화하는, 핵산 작제물.
  6. 제4항에 있어서,
    상기 제2 이종 폴리뉴클레오티드는 서열번호 22의 N 폴리펩티드, 서열번호 24의 M 폴리펩티드 또는 이의 엔도도메인(endodomain), 서열번호 23의 E 폴리펩티드, 서열번호 25의 ORF8 폴리펩티드, 서열번호 27의 ORF7a 폴리펩티드, 및 서열번호 26의 ORF3a 폴리펩티드 중 적어도 하나를 암호화하는, 핵산 작제물.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서,
    상기 제1 이종 폴리뉴클레오티드가 하기로 이루어진 군으로부터 선택된 오픈 리딩 프레임을 갖는, 핵산 작제물:
    i. S 폴리펩티드를 암호화하는 서열번호 1 또는 2 또는 36,
    ii. S1 폴리펩티드를 암호화하는 서열번호 10,
    iii. S2 폴리펩티드를 암호화하는 서열번호 12,
    iv. stab-S 폴리펩티드(S2P)를 암호화하는 서열번호 4,
    v. Secto 폴리펩티드를 암호화하는 서열번호 6,
    vi. stab-Secto 폴리펩티드를 암호화하는 서열번호 8,
    vii. stab-S2 폴리펩티드를 암호화하는 서열번호 14,
    ⅷ. tri-Secto 폴리펩티드를 암호화하는 서열번호 16,
    ix. tristab-Secto 폴리펩티드를 암호화하는 서열번호 18,
    x. S3F 폴리펩티를 암호화하는 서열번호 42,
    xi. S2P3F 폴리펩티드를 암호화하는 서열번호 44,
    xii. S2PΔF 폴리펩티드를 암호화하는 서열번호 46,
    xiii. S2PΔF2A 폴리펩티드를 암호화하는 서열번호 48,
    xiv. T4-S2P3F 폴리펩티드(tristab-Secto-3F)를 암호화하는 서열번호 51,
    xv. S6P 폴리펩티드를 암호화하는 서열번호 53,
    xvi. S6P3F 폴리펩티드를 암호화하는 서열번호 55,
    xvii. S6PΔF 폴리펩티드를 암호화하는 서열번호 57,
    xviii. SCCPP 폴리펩티드를 암호화하는 서열번호 59,
    xix. SCC6P 폴리펩티드를 암호화하는 서열번호 61,
    xx. SMVopt2P 폴리펩티드를 암호화하는 서열번호 63,
    xxi. SMVoptΔF 폴리펩티드를 암호화하는 서열번호 64, 및
    xxii. SMVopt2PΔF 폴리펩티드를 암호화하는 서열번호 66.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서,
    5'에서 3' 말단 방향으로 오픈 리딩 프레임을 암호화하는 다음의 폴리뉴클레오티드를 포함하는 cDNA 작제물인, 핵산 작제물:
    (a) MV의 N 단백질을 암호화하는 폴리뉴클레오티드;
    (b) MV의 P 단백질을 암호화하는 폴리뉴클레오티드;
    (c) 제1항 내지 제3항, 제4항 및 제6항 중 어느 한 항에 정의된 바와 같은 제1 이종 폴리뉴클레오티드;
    (d) MV의 M 단백질을 암호화하는 폴리뉴클레오티드;
    (e) MV의 F 단백질을 암호화하는 폴리뉴클레오티드;
    (f) MV의 H 단백질을 암호화하는 폴리뉴클레오티드;
    (g) MV의 L 단백질을 암호화하는 폴리뉴클레오티드;
    여기서, 폴리뉴클레오티드는 핵산 작제물 내에서 작동 가능하게 연결되고, MV 리더 및 트레일러(trailer) 서열과 같은 전사 조절 요소 및 바이러스 복제의 제어 하에 있으며, T7 프로모터 및 T7 터미네이터에 의해 구성(framed)되고, 재조합 MV-CoV 발현 카세트를 제공하도록 벡터에서의 클로닝에 적합한 제한 부위에 의해 구성됨(framed).
  9. 제1항 내지 제8항 중 어느 한 항에 있어서,
    (a) 약독화된 MV 백신 균주, 특히 Schwarz 균주 또는 Moraten 균주의 전장 안티게놈 (+)RNA 가닥을 암호화하는 뉴클레오티드 서열의 첫 번째 뉴클레오티드에 인접한 것으로, 핵산 작제물의 5'-말단에서 해머헤드 리보자임 서열이 뒤따르는 GGG 모티프, 및
    (b) 전장 안티게놈 (+)RNA 가닥을 암호화하는 뉴클레오티드 서열의 마지막 뉴클레오티드에 인접한 것으로, 재조합 MV-CoV 핵산 분자의 3'-말단에 있는 리보자임의 뉴클레오티드 서열, 특히 델타 간염 바이러스 리보자임(δ)의 서열,
    을 추가로 포함하는, 핵산 작제물.
  10. 제4항 내지 제9항 중 어느 한 항에 있어서,
    상기 제2 이종 폴리뉴클레오티드는 SARS-CoV-2의 N 폴리펩티드를 암호화하고, 상기 제2 이종 폴리뉴클레오티드는 제1 이종 폴리뉴클레오티드를 클로닝하는데 사용된 ATU와 다른 위치의 ATU에서 클로닝되는, 핵산 작제물.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서,
    (i) 제1 이종 폴리뉴클레오티드는 서열번호 36, 서열번호 63, 서열번호 64 및 서열번호 66으로 이루어진 군으로부터 선택되는 서열을 포함하고, ATU2 내에 위치되거나, 또는
    (ii) 제1 이종 폴리뉴클레오티드는 서열번호 2, 서열번호 4, 서열번호 44, 서열번호 46, 서열번호 48, 서열번호 51, 서열번호 53, 서열번호 55, 서열번호 57, 서열번호 59 및 서열번호 61로 이루어진 군으로부터 선택되는 서열을 포함하고, ATU3 내에 위치되는, 핵산 작제물.
  12. 제4항 내지 제10항 중 어느 한 항에 있어서,
    (i) 제1 이종 폴리뉴클레오티드는 ATU3 내에 위치되고, 제2 이종 폴리뉴클레오티드는 ATU2 내에 위치되거나, 또는
    (ii) 제1 이종 폴리뉴클레오티드는 ATU2 내에 위치되고, 제2 이종 폴리뉴클레오티드는 ATU3 내에 위치되는, 핵산 작제물.
  13. 제1항 내지 제12항 중 어느 한 항에 있어서,
    홍역 바이러스는 Schwarz 균주, Zagreb 균주, AIK-C 균주, Moraten 균주, Philips 균주, Beckenham 4A 균주, Beckenham 16 균주, CAM-70 균주, TD 97 균주, Leningrad-16 균주, Shanghai 191 균주 및 Belgrade 균주로 이루어진 군으로부터 선택되는 약독화 바이러스 균주인, 핵산 작제물.
  14. 제1항 내지 제13항 중 어느 한 항에 따른 핵산 작제물을 포함하는, 재조합 홍역 바이러스(MV)의 구출(rescue)를 위한 전달 벡터.
  15. 하기로 이루어진 군으로부터 선택된 SARS-CoV-2의 폴리펩티드를 암호화하는 서열을 포함하는, 전달 벡터:
    i. 서열번호 1 또는 2 또는 36 (작제물 S);
    ii. 서열번호 4 (작제물 stab-S);
    iii. 서열번호 6 (작제물 Secto);
    iv. 서열번호 8 (작제물 stab-Secto);
    v. 서열번호 10 (작제물 S1),
    vi. 서열번호 12 (작제물 S2),
    vii. 서열번호 14 (작제물 stab-S2),
    viii. 서열번호 16 (작제물 tri-Secto),
    ix. 서열번호 18 (작제물 tristab-Secto),
    x. 서열번호 42 (작제물 S3F),
    xi. 서열번호 44 (작제물 S2P3F),
    xii. 서열번호 46 (작제물 S2PΔF),
    xiii. 서열번호 48 (작제물 S2PΔF2A),
    xiv. 서열번호 21 또는 37 (작제물 N),
    xv. 서열번호 51 (작제물 T4-S2P3F(tristab-Secto-3F)),
    xvi. 서열번호 53 (작제물 S6P),
    xvii. 서열번호 55 (작제물 S6P3F),
    xviii. 서열번호 57 (작제물 S6PΔF),
    xix. 서열번호 59 (작제물 SCCPP),
    xx. 서열번호 61 (작제물 SCC6P),
    xxi. 서열번호 63 (작제물 SMVopt2P),
    xxii. 서열번호 64 (작제물 SMVoptΔF), 및
    xxiii. 서열번호 66 (작제물 SMVopt2PΔF).
  16. Schwarz 균주의 재조합 홍역 바이러스로서, 이의 게놈에 이에 작동가능하게 연결된 발현 카세트를 포함하고, 상기 발현 카세트는 제1항 내지 제13항 중 어느 한 항에 따른 핵산 작제물을 포함하는, 재조합 홍역 바이러스.
  17. 제16항에 있어서,
    SARS-CoV-2 균주의 N, M, E, ORF7a, ORF8 및 ORF3a, 및 이의 면역원성 단편으로부터 선택되는 적어도 하나의 폴리펩티드를 추가로 발현하는, 재조합 홍역 바이러스.
  18. 면역원성 조성물 또는 백신으로서,
    (i) 유효 용량의 제16항 또는 제17항에 따른 재조합 홍역 바이러스, 및 (ii) 약학적으로 허용되는 비히클을 포함하고,
    상기 조성물 또는 백신은 단일 면역화 후 동물 숙주에서 SARS-CoV-2의 폴리펩티드(들)에 대한 중화 체액 반응 및/또는 세포 반응을 유도하는, 면역원성 조성물 또는 백신.
  19. 제18항에 있어서,
    이를 필요로 하는 숙주에서 SARS-CoV-2에 대한 보호 체액성 면역 반응 및/또는 세포성 면역 반응을 유도하는데 사용되는, 면역원성 조성물 또는 백신.
  20. 제1항 내지 제3항, 제4항 및 제6항 중 어느 한 항에 정의된 바와 같은 SARS-CoV-2의 제1 이종 폴리뉴클레오티드에 의해 암호화되는 SARS-CoV-2의 폴리펩티드를 발현하는 재조합 홍역 바이러스를 구출(rescuing)하는 방법으로서,
    (a) T7 RNA 폴리머라제 및 홍역 바이러스 N 및 P 단백질을 안정적으로 발현하는 헬퍼 세포를 (i) 제1항 내지 제13항 중 어느 한 항에 따른 핵산 작제물 또는 제13항 또는 제14항에 따른 플라스미드 벡터, 및 (ii) MV L 폴리머라제를 암호화하는 벡터로 공동-형질감염하는 단계;
    (b) 재조합 홍역 바이러스의 생산에 적합한 조건에서 형질감염된 세포를 유지하는 단계;
    (c) 단계 (b)의 형질감염된 세포와 공동 배양하여 재조합 홍역 바이러스의 증식을 가능하게 하는 세포를 감염시키는 단계;
    (d) 재조합 홍역 바이러스를 수확하는 단계;를 포함하는, 방법.
  21. 하기로 이루어진 군으로부터 선택된 폴리뉴클레오티드를 포함하는 핵산 분자:
    i. 서열번호 1 또는 2 또는 36 (작제물 S);
    ii. 서열번호 4 (작제물 stab-S);
    iii. 서열번호 6 (작제물 Secto);
    iv. 서열번호 8 (작제물 stab-Secto);
    v. 서열번호 10 (작제물 S1),
    vi. 서열번호 12 (작제물 S2),
    vii. 서열번호 14 (작제물 stab-S2),
    viii. 서열번호 16 (작제물 tri-Secto),
    ix. 서열번호 18 (작제물 tristab-Secto),
    x. 서열번호 42 (작제물 S3F),
    xi. 서열번호 44 (작제물 S2P3F),
    xii. 서열번호 46 (작제물 S2PΔF),
    xiii. 서열번호 48 (작제물 S2PΔF2A),
    xiv. 서열번호 21 또는 37 (작제물 N),
    xv. 서열번호 51 (작제물 T4-S2P3F(tristab-Secto-3F)),
    xvi. 서열번호 53 (작제물 S6P),
    xvii. 서열번호 55 (작제물 S6P3F),
    xviii. 서열번호 57 (작제물 S6PΔF),
    xix. 서열번호 59 (작제물 SCCPP),
    xx. 서열번호 61 (작제물 SCC6P),
    xxi. 서열번호 63 (작제물 SMVopt2P),
    xxii. 서열번호 64 (작제물 SMVoptΔF), 및
    xxiii. 서열번호 66 (작제물 SMVopt2PΔF).
  22. 하기로 이루어진 군으로부터 선택된 아미노산 서열을 포함하는 폴리펩티드:
    i. 서열번호 3 (작제물 S);
    ii. 서열번호 5 (작제물 stab-S);
    iii. 서열번호 7 (작제물 Secto);
    iv. 서열번호 9 (작제물 stab-Secto);
    v. 서열번호 11 (작제물 S1),
    vi. 서열번호 13 (작제물 S2),
    vii. 서열번호 15 (작제물 stab-S2),
    viii. 서열번호 17 (작제물 tri-Secto),
    ix. 서열번호 19 (작제물 tristab-Secto),
    x. 서열번호 43 (작제물 S3F),
    xi. 서열번호 45 (작제물 S2P3F),
    xii. 서열번호 47 (작제물 S2PΔF),
    xiii. 서열번호 49 (작제물 S2PΔF2A),
    xiv. 서열번호 22 (작제물 N),
    xv. 서열번호 52 (작제물 T4-S2P3F (tristab-Secto-3F)),
    xvi. 서열번호 54 (작제물 S6P),
    xvii. 서열번호 56 (작제물 S6P3F),
    xviii. 서열번호 58 (작제물 S6PΔF),
    xix. 서열번호 60 (작제물 SCCPP),
    xx. 서열번호 62 (작제물 SCC6P), 및
    xxi. 서열번호 65 (작제물 SMVoptΔF).
  23. 제14항 또는 제15항에 따른 전달 벡터에 의해 발현되는 재조합 단백질로서, 정제를 위한 아미노산 태그를 추가로 포함하는, 재조합 단백질.
  24. 제14항 또는 제15항에 따른 전달 벡터에 의해 시험관내 또는 생체내에서 발현되는, 재조합 단백질.
  25. SARS-CoV-2 감염이 의심되는 개체로부터 이전에 얻은 생물학적 샘플에서 항원에 대한 항체의 존재를 검출하기 위한 서열번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 22, 23, 24, 25, 26, 27, 43, 45, 47, 49, 52, 54, 56, 58, 60, 62 및 65 중 어느 하나의 서열을 갖는 항원의 시험관내 용도로서, 폴리펩티드가 항원에 대한 항체의 존재를 결정하기 위해 생물학적 샘플과 접촉되는, 용도.
  26. 인간 숙주에서 SARS-CoV-2에 의한 감염을 치료 또는 예방하는 방법으로서, 제18항에 따른 면역원성 조성물 또는 백신을 숙주에 투여하는 것을 포함하는, 방법.
  27. 숙주에서 SARS-CoV-2에 대한 보호 면역 반응을 유도하는 방법으로서, 제18항에 따른 면역원성 조성물 또는 백신을 숙주에 투여하는 것을 포함하는, 방법.
  28. 제26항 또는 제27항에 있어서,
    면역원성 조성물의 1차 투여 및 면역원성 조성물의 2차 투여를 포함하는, 방법.
  29. 제28항에 있어서,
    상기 2차 투여는 1차 투여 후 1 개월 내지 2개월 후에 수행되는, 방법.
  30. 핵산 작제물로서,
    (1) 홍역 바이러스(MV)의 약독화 균주의 전장 안티게놈(+) RNA 가닥을 암호화하는 cDNA 분자; 및
    (2) 서열번호 3의 아미노산 서열의 위치 1263 내지 1273과 정렬된 S 단백질의 11개 아미노산 잔기 서열에서 삽입, 치환 또는 결실을 포함하는 SARS-CoV-2의 S 단백질 또는 이의 면역원성 단편을 암호화하는 제1 이종 폴리뉴클레오티드로서, 삽입, 치환 또는 결실은 S 단백질 또는 이의 면역원성 단편의 세포 표면 발현을 증가시키는, 제1 이종 폴리뉴클레오티드;를 포함하며,
    제1 이종 폴리뉴클레오티드는 MV(ATU2)의 P 유전자와 M 유전자 사이에 위치한 추가 전사 단위(ATU)에 위치하거나 또는 MV(ATU3)의 H 유전자의 3'에 위치한 ATU에 위치하는, 핵산 작제물.
  31. 제30항에 있어서,
    상기 S 단백질 또는 이의 면역원성 단편은 서열번호 3의 아미노산 서열의 위치 1263 내지 1273과 정렬된 S 단백질의 11개 아미노산 잔기 서열에서 치환을 포함하는, 핵산 작제물.
  32. 제30항에 있어서,
    상기 S 단백질 또는 이의 면역원성 단편은 서열번호 3의 아미노산 서열의 위치 1263 내지 1273과 정렬된 S 단백질의 11개 아미노산 잔기 서열에서 전체 또는 부분의 결실을 포함하는, 핵산 작제물.
  33. 제30항 내지 제32항 중 어느 한 항에 있어서,
    암호화된 S 단백질 또는 이의 면역원성 단편은 발현된 S 단백질을 그의 융합전 형태로 유지하는 하나 이상의 추가 치환을 추가로 포함하는, 핵산 작제물.
  34. 제33항에 있어서,
    암호화된 S 단백질 또는 이의 면역원성 단편은 서열번호 3의 아미노산 서열의 위치 K986 및 V987에 상응하는 아미노산 위치에서 아미노산 치환 K986P 및 V987P를 추가로 포함하는, 핵산 작제물.
  35. 제30항 내지 제34항 중 어느 한 항에 있어서,
    암호화된 S 단백질 또는 이의 면역원성 단편은 이중 도메인 S 단백질인, 핵산 작제물.
  36. 제30항 내지 제35항 중 어느 한 항에 있어서,
    제1 이종 폴리뉴클레오티드는 ATU2에 위치되는, 핵산 작제물.
  37. 제30항 내지 제36항 중 어느 한 항에 있어서,
    제1 이종 폴리뉴클레오티드는:
    (a) 서열번호 76의 융합전-안정화된 SF-2P-dER 폴리펩티드, 또는 서열번호 76과 90% 이상의 동일성을 가지고 위치 986 및 987에서 변화한 이의 변이체; 또는
    (b) 서열번호 82의 융합전-안정화된 SF-2P-2a 폴리펩티드, 또는 서열번호 82와 90% 이상의 동일성을 가지고 위치 986, 987, 1269, 및 1271에서 변화한 이의 변이체;를 암호화하는, 핵산 작제물.
  38. 제37항에 있어서,
    제1 이종 폴리뉴클레오티드는,
    (a) 서열번호 76의 융합전-안정화된 SF-2P-dER 폴리펩티드; 또는
    (b) 서열번호 82의 융합전-안정화된 SF-2P-2a 폴리펩티드;를 암호화하는, 핵산 작제물.
  39. 제38항에 있어서,
    제1 이종 폴리뉴클레오티드는, SF-2P-dER 폴리펩티드를 암호화하는 서열번호 75, 또는 SF-2P-2a 폴리펩티드를 암호화하는 서열번호 81을 포함하는, 핵산 작제물.
  40. 제39항에 있어서,
    제1 이종 폴리뉴클레오티드는, SF-2P-dER 폴리펩티드를 암호화하는 서열번호 75를 포함하는, 핵산 작제물.
  41. 제30항 내지 제40항 중 어느 한 항에 있어서,
    뉴클레오캡시드(N) 폴리펩티드 또는 N 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체; 기질(matrix) (M) 폴리펩티드 또는 M 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체; E 폴리펩티드 또는 E 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체; 8a 폴리펩티드 또는 8a 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체; 7a 폴리펩티드 또는 7a 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체; 3a 폴리펩티드 또는 3a 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체; 및 이의 면역원성 단편으로 이루어진 군으로부터 선택된 SARS-CoV-2의 적어도 하나의 폴리펩티드를 암호화하는 제2 이종 폴리뉴클레오티드를 추가로 포함하고, 상기 제2 이종 폴리뉴클레오티드는 제1 이종 폴리뉴클레오티드의 ATU와 상이한 위치에서 추가의 전사 단위(ATU) 내에 위치되는, 핵산 작제물.
  42. 제30항 내지 제40항 중 어느 한 항에 있어서,
    뉴클레오캡시드(N) 폴리펩티드; 기질 (M) 폴리펩티드; E 폴리펩티드; 8a 폴리펩티드; 7a 폴리펩티드; 3A 폴리펩티드; 및 이의 면역원성 단편으로 이루어진 군에서 선택된 SARS-CoV-2의 적어도 하나의 폴리펩티드를 암호화하는 제2 이종 폴리뉴클레오티드를 추가로 포함하고, 상기 제2 이종 폴리뉴클레오티드는 제1 이종 폴리뉴클레오티드의 ATU와 상이한 위치에서 추가 전사 단위(ATU) 내에 위치되는, 핵산 작제물.
  43. 제42항에 있어서,
    제2 이종 폴리뉴클레오티드는 N 폴리펩티드를 암호화하고, 제2 이종 폴리뉴클레오티드는 제1 이종 폴리뉴클레오티드의 ATU와 상이한 위치에서 추가 전사 단위(ATU) 내에 위치되는, 핵산 작제물.
  44. 제30항 내지 제40항 중 어느 한 항에 있어서,
    제2 이종 폴리뉴클레오티드는 서열번호 22의 N 폴리펩티드, 서열번호 24의 M 폴리펩티드 또는 이의 엔도도메인, 서열번호 23의 E 폴리펩티드, 서열번호 25의 ORF8 폴리펩티드, 서열번호 27의 ORF7a 폴리펩티드, 및/또는 서열번호 26의 ORF3a 폴리펩티드 중 적어도 하나를 암호화하며, 상기 제2 이종 폴리뉴클레오티드는 제1 이종 폴리뉴클레오티드의 ATU와 상이한 위치에서 추가의 전사 단위(ATU) 내에 위치되는, 핵산 작제물.
  45. 제41항 내지 제44항 중 어느 한 항에 있어서,
    제2 이종 단백질은 MV의 N 유전자의 업스트림인 ATU(ATU1) 내부, MV의 P 및 M 유전자 사이의 ATU(ATU2), 또는 H 및 L 유전자 사이의 ATU(ATU3)에 위치되는, 핵산 작제물.
  46. 제30항 내지 제45항 중 어느 한 항에 있어서,
    5'에서 3' 방향으로 오픈 리딩 프레임을 암호화하는 다음의 폴리뉴클레오티드를 포함하는 핵산 작제물:
    (a) MV의 N 단백질을 암호화하는 폴리뉴클레오티드;
    (b) MV의 P 단백질을 암호화하는 폴리뉴클레오티드;
    (c) 제1 이종 폴리뉴클레오티드;
    (d) MV의 M 단백질을 암호화하는 폴리뉴클레오티드;
    (e) MV의 F 단백질을 암호화하는 폴리뉴클레오티드;
    (f) MV의 H 단백질을 암호화하는 폴리뉴클레오티드;
    (g) MV의 L 단백질을 암호화하는 폴리뉴클레오티드;
    여기서, 폴리뉴클레오티드는 핵산 작제물 내에서 작동 가능하게 연결되고, MV 리더 및 트레일러(trailer) 서열의 제어 하에 있으며, T7 프로모터 및 T7 터미네이터에 의해 구성되고, 재조합 MV-CoV 발현 카세트를 제공하도록 벡터에서의 클로닝에 적합한 제한 부위에 의해 구성됨.
  47. 제30항 내지 제45항 중 어느 한 항에 있어서,
    (a) 약독화된 MV 백신 균주의 전장 안티게놈 (+)RNA 가닥을 암호화하는 뉴클레오티드 서열의 첫 번째 뉴클레오티드에 인접한 것으로, 핵산 작제물의 5'-말단에서 해머헤드 리보자임 서열이 뒤따르는 GGG 모티프, 및
    (b) 약독화된 MV 백신 균주의 전장 안티게놈 (+)RNA 가닥을 암호화하는 뉴클레오티드 서열의 마지막 뉴클레오티드에 인접한 것으로, 핵산 작제물의 3'-말단에서 델타 간염 바이러스 리보자임(δ)의 뉴클레오티드 서열,
    을 추가로 포함하는, 핵산 작제물.
  48. 제30항 내지 제47항 중 어느 한 항에 있어서,
    홍역 바이러스는 Schwarz 균주, Zagreb 균주, AIK-C 균주, Moraten 균주, Philips 균주, Beckenham 4A 균주, Beckenham 16 균주, CAM-70 균주, TD 97 균주, Leningrad-16 균주, Shanghai 191 균주 및 Belgrade 균주로 이루어진 군으로부터 선택되는 약독화 바이러스 균주인, 핵산 작제물.
  49. 제48항에 있어서,
    홍역 바이러스는 Schwarz 균주인, 핵산 작제물.
  50. 제30항 내지 제49항 중 어느 한 항에 따른 핵산 작제물을 포함하는 플라스미드 벡터로서, 상기 플라스미드 벡터는 서열번호 29 또는 서열번호 38인, 플라스미드 벡터.
  51. 제30항 내지 제49항 중 어느 한 항에 따른 핵산 작제물을 게놈에 포함하는 재조합 홍역 바이러스.
  52. 제51항에 따른 재조합 홍역 바이러스와 약학적으로 허용되는 비히클을 포함하는 면역원성 조성물.
  53. 대상체에서 SARS-CoV-2 바이러스에 대한 면역 반응을 유도하는데 사용하기 위한, 제51항에 따른 재조합 홍역 바이러스 또는 제52항에 따른 면역원성 조성물.
  54. 대상체에서 SARS-CoV-2에 의한 감염을 치료 또는 예방하는 방법으로서, 제52항에 따른 면역원성 조성물을 대상체에게 투여하는 것을 포함하는, 방법.
  55. 대상체에서 SARS-CoV-2 바이러스에 대한 면역 반응을 유도하는 방법으로서, 제52항에 따른 면역원성 조성물을 대상체에게 투여하는 것을 포함하는, 방법.
  56. 제54항 또는 제55항에 있어서,
    면역원성 조성물의 1차 투여 및 면역원성 조성물의 2차 투여를 포함하는, 방법.
  57. 제56항에 있어서,
    2차 투여는 1차 투여 후 1 내지 2개월 후에 수행되는, 방법.
  58. 제51항에 따른 재조합 홍역 바이러스를 구출(rescuing)하는 공정으로서:
    (a) T7 RNA 폴리머라제 및 홍역 바이러스 N 및 P 단백질을 안정적으로 발현하는 헬퍼 세포를, (i) 제30항 내지 제49항 중 어느 한 항에 따른 핵산 작제물 또는 제50항에 따른 핵산 작제물을 포함하는 플라스미드 벡터, 및 (ii) MV L 폴리머라제를 암호화하는 벡터로 공동-형질감염하는 단계;
    (b) 재조합 홍역 바이러스의 생산에 적합한 조건에서 형질감염된 헬퍼 세포를 유지하는 단계;
    (c) 단계 (b)의 형질감염된 헬퍼 세포와 공동 배양하여 재조합 홍역 바이러스의 증식을 가능하게 하는 세포를 감염시키는 단계; 및
    (d) 재조합 홍역 바이러스를 수확하는 단계;를 포함하는, 공정.
  59. 서열번호 75 (작제물 SF-2P-dER) 또는 서열번호 81 (작제물 SF-2P-2a)의 폴리뉴클레오티드를 포함하는, 핵산 분자.
  60. 서열번호 76 (작제물 SF-2P-dER) 또는 서열번호 82 (작제물 SF-2P-2a)의 아미노산 서열을 갖는, 폴리펩티드.
  61. SARS-CoV-2에 의해 감염된 것으로 의심되는 개체로부터 이전에 얻은 생물학적 샘플에서 항원에 대한 항체의 존재를 검출하기 위한 제60항에 따른 폴리펩티드의 항원의 시험관내 용도로서, 상기 폴리펩티드는 항원에 대한 항체의 존재를 결정하기 위해 생물학적 샘플과 접촉되는, 용도.
  62. 생물학적 샘플을 제60항에 따른 폴리펩티드와 접촉시키고, 생물학적 샘플에 존재하는 항체와 폴리펩티드 사이의 항체-항원 복합체의 형성을 검출하는 것을 포함하는 방법.
  63. 제62항에 있어서,
    생물학적 샘플은 SARS-CoV-2에 의해 감염된 것으로 의심되는 개체로부터 수득되는, 방법.
KR1020227031638A 2020-02-13 2021-02-12 홍역-벡터화된 covid-19 면역원성 조성물 및 백신 KR20220141332A (ko)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US202062976083P 2020-02-13 2020-02-13
EP20305141.2 2020-02-13
EP20305141.2A EP3865180A1 (en) 2020-02-13 2020-02-13 Live recombinant measles virus expressing coronavirus antigens - its use in eliciting immunity against coronaviruses
US62/976,083 2020-02-13
EP20305790.6 2020-07-08
EP20305790 2020-07-08
PCT/EP2021/053540 WO2021160850A1 (en) 2020-02-13 2021-02-12 Measles-vectored covid-19 immunogenic compositions and vaccines

Publications (1)

Publication Number Publication Date
KR20220141332A true KR20220141332A (ko) 2022-10-19

Family

ID=77292795

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227031638A KR20220141332A (ko) 2020-02-13 2021-02-12 홍역-벡터화된 covid-19 면역원성 조성물 및 백신

Country Status (11)

Country Link
US (1) US20230021583A1 (ko)
EP (1) EP4103282A1 (ko)
JP (1) JP2023513913A (ko)
KR (1) KR20220141332A (ko)
CN (1) CN116472279A (ko)
AU (1) AU2021218985A1 (ko)
BR (1) BR112022015764A2 (ko)
CA (1) CA3166811A1 (ko)
MX (1) MX2022009989A (ko)
TW (1) TW202146044A (ko)
WO (1) WO2021160850A1 (ko)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11241493B2 (en) 2020-02-04 2022-02-08 Curevac Ag Coronavirus vaccine
US11576966B2 (en) 2020-02-04 2023-02-14 CureVac SE Coronavirus vaccine
GB202307565D0 (en) 2020-04-22 2023-07-05 BioNTech SE Coronavirus vaccine
WO2022092921A1 (ko) * 2020-10-29 2022-05-05 에스케이바이오사이언스 주식회사 사스-코로나바이러스-2 항원을 포함하는 바이럴 벡터 및 이의 이용
MX2023007574A (es) 2020-12-22 2023-09-29 CureVac SE "vacuna de arn contra variantes de sars-cov-2.
EP4366765A1 (en) * 2021-07-09 2024-05-15 Atossa Therapeutics, Inc. Compositions and methods to increase coronavirus immune response
CN113470745B (zh) * 2021-08-25 2023-09-08 南京立顶医疗科技有限公司 SARS-CoV-2潜在突变位点的筛选方法及其应用
WO2023025287A1 (zh) * 2021-08-26 2023-03-02 江苏瑞科生物技术股份有限公司 新型冠状病毒免疫原性物质、其制备方法和应用
WO2023047348A1 (en) * 2021-09-24 2023-03-30 Janssen Pharmaceuticals, Inc. Stabilized corona virus spike protein fusion proteins
WO2023047349A1 (en) * 2021-09-24 2023-03-30 Janssen Pharmaceuticals, Inc. Stabilized coronavirus spike protein fusion proteins
WO2023122257A2 (en) * 2021-12-22 2023-06-29 La Jolla Institute For Immunology Coronavirus spike glycoprotein with improved expression and stability
CN116925195B (zh) * 2022-04-22 2024-06-21 仁景(苏州)生物科技有限公司 一种基于新型冠状病毒的mRNA疫苗
WO2023244044A1 (ko) * 2022-06-16 2023-12-21 연세대학교 산학협력단 변형된 코로나바이러스 스파이크 항원 단백질 및 이의 용도
US11878055B1 (en) 2022-06-26 2024-01-23 BioNTech SE Coronavirus vaccine
WO2024086575A1 (en) 2022-10-17 2024-04-25 BioNTech SE Combination vaccines against coronavirus infection, influenza infection, and/or rsv infection
CN115850399A (zh) * 2022-12-13 2023-03-28 中山大学附属第七医院(深圳) 一种热稳定刺突蛋白以及一种新型冠状病毒抗体检测试纸条
CN116785422B (zh) * 2023-06-25 2024-05-28 中国医学科学院病原生物学研究所 含有新型冠状病毒联合抗原的麻疹减毒疫苗及其拯救方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2110382A1 (en) * 2002-06-20 2009-10-21 Institut Pasteur Infectious cDNA of an improved vaccine strain of measles virus, use for immunogenic compositions
ES2423518T3 (es) 2006-12-22 2013-09-20 Institut Pasteur Células y metodología para generar virus de ARN de cadena de sentido negativo no segmentada

Also Published As

Publication number Publication date
AU2021218985A1 (en) 2022-08-25
US20230021583A1 (en) 2023-01-26
TW202146044A (zh) 2021-12-16
WO2021160850A1 (en) 2021-08-19
BR112022015764A2 (pt) 2022-10-11
CA3166811A1 (en) 2021-08-19
EP4103282A1 (en) 2022-12-21
MX2022009989A (es) 2022-11-08
CN116472279A (zh) 2023-07-21
JP2023513913A (ja) 2023-04-04

Similar Documents

Publication Publication Date Title
KR20220141332A (ko) 홍역-벡터화된 covid-19 면역원성 조성물 및 백신
AU2019203955B2 (en) Multipartite signaling proteins and uses thereof
AU2018229561B2 (en) Recombinant adenoviruses and use thereof
US20040013648A1 (en) Vector system
CA2462455C (en) Development of a preventive vaccine for filovirus infection in primates
DK2718440T3 (en) NUCLEASE ACTIVITY PROTEIN, FUSION PROTEINS AND APPLICATIONS THEREOF
KR100950104B1 (ko) 코어 글리코실화된 hcv 엔빌로프 단백질
KR102494564B1 (ko) 말라리아 백신
US20030119104A1 (en) Chromosome-based platforms
AU2022200903B2 (en) Engineered Cascade components and Cascade complexes
DK2623594T3 (da) Antistof mod human prostaglandin-E2-receptor EP4
KR20140099224A (ko) 케토-아이소발레레이트 데카르복실라제 효소 및 이의 이용 방법
KR20210080375A (ko) 암 면역요법을 위한 재조합 폭스바이러스
KR20160029124A (ko) Pd-1 항원 또는 pd-1 리간드 항원을 포함하는 바이러스 유사 입자
KR20180020202A (ko) T 세포 수용체 특이적 항체
KR20210105382A (ko) 단백질을 코딩하는 rna
KR20220007155A (ko) 코로나바이러스 스파이크 단백질의 변형된 s1 서브유닛
CN111094569A (zh) 光控性病毒蛋白质、其基因及包含该基因的病毒载体
CN115927299A (zh) 增加双链rna产生的方法和组合物
TW202308669A (zh) 嵌合共刺激性受體、趨化激素受體及彼等於細胞免疫治療之用途
KR20220078607A (ko) 융합 단백질들을 이용한 tcr 재프로그래밍을 위한 조성물 및 방법들
AU2017252409A1 (en) Compositions and methods for nucleic acid expression and protein secretion in bacteroides
CN117222415A (zh) 多顺反子rna疫苗及其用途
KR20230031929A (ko) 고릴라 아데노바이러스 핵산 서열 및 아미노산 서열, 이들을 함유하는 벡터, 및 이의 용도
US11814412B2 (en) Artificial proteins and compositions and methods thereof